Amazon integruje technológiu Nvidia do svojich čipov s umelou inteligenciou a spustí nové servery Trainium

  • Spoločnosť AWS začlení technológiu NVLink Fusion od spoločnosti Nvidia do svojho pripravovaného čipu Trainium4 pre umelú inteligenciu s cieľom zlepšiť vysokovýkonné prepojenie.
  • Spoločnosť uvádza na trh nové servery s platformou Trainium3, ktoré majú viac ako štvornásobný výpočtový výkon a o 40 % nižšiu spotrebu energie.
  • Spoločnosť Amazon posilňuje svoj záväzok voči umelej inteligencii prostredníctvom AI Factorys, čo sú nasaditeľné infraštruktúry v dátových centrách firiem a vládnych inštitúcií.
  • Cieľom stratégie je znížiť závislosť od externých dodávateľov a priamo konkurovať spoločnostiam Nvidia, Google a Microsoft v oblasti čipov a infraštruktúry umelej inteligencie.

Infraštruktúra umelej inteligencie v cloude

Spoločnosť Amazon Web Services poskytla svoj stratégia umelej inteligencie Spoločnosť na svojej významnej výročnej konferencii o cloudových výpočtoch v Las Vegas predstavila sériu oznámení, ktoré posilňujú jej vlastné portfólio čipov aj technologickú alianciu so spoločnosťou Nvidia. Na svojej významnej výročnej konferencii o cloudových výpočtoch v Las Vegas podrobne popísala, ako integruje technológiu Nvidia do svojich pripravovaných procesorov s umelou inteligenciou a predstavila nové servery určené na trénovanie a nasadzovanie rozsiahlych modelov umelej inteligencie.

Tento krok stavia AWS ešte výraznejšie do popredia v pretekoch o umelú inteligenciu, oblasť, kde priamo konkuruje gigantom ako Microsoft, Google a Meta. Amazon sa nielenže zameriava na ďalší predaj grafických procesorov tretích strán, ale vsádza na kombináciu vlastných čipov, špecializovaných prepojení a dohôd so spoločnosťou Nvidia. ponúknuť európskym a globálnym spoločnostiam viac možností výkonu a nákladov.

Trainium4: Ďalší čip od Amazonu bude hovoriť jazykom Nvidie

Jedným z najvýznamnejších oznámení bolo potvrdenie, že budúci čip spoločnosti pre tréning umelej inteligencie, známy ako Vlak 4, bude zahŕňať technológiu prepojenia Nvidia NVLink FusionToto riešenie umožňuje ultrarýchlu komunikáciu medzi procesormi, čo je kľúčové, keď tisíce strojov musia koordinovane pracovať na trénovaní rozsiahlych jazykových modelov.

NVLink sa považuje za jeden z najväčších prínosov spoločnosti Nvidia v oblasti vysokovýkonných dátových centier a doteraz sa spájal predovšetkým s konfiguráciami založenými výlučne na vlastných grafických procesoroch spoločnosti. Rozhodnutie spoločnosti Amazon integrovať túto technológiu do Trainium4 znamená, že jej budúce klastre umelej inteligencie budú schopné kombinovať čipy AWS a grafické procesory Nvidia v jednej infraštruktúre, čo uľahčí... hybridné architektúry.

Hoci spoločnosť AWS neuviedla konkrétne dátumy príchodu Trainium4 na trh, jasne uviedla cieľ: ponúknuť platformu, ktorá zákazníkom umožní naďalej využívať softvérový ekosystém Nvidia, najmä CUDA, a zároveň migrovať časť svojich pracovných záťaží na hardvér navrhnutý spoločnosťou Amazon v snahe o lepšiu dostupnosť a cenu.

Táto kompatibilita je obzvlášť dôležitá pre organizácie v Európe a Španielsku, ktoré už štandardizovali grafické procesory Nvidia a optimalizovali knižnice, ale stretávajú sa s... obmedzenia kapacity alebo rastúce náklady pri škálovaní svojich generatívnych projektov umelej inteligencie.

Servery a čipy s umelou inteligenciou

Nové servery s Trainium3: viac výkonu a menej energie

Zatiaľ čo vývoj Trainium4 pokračuje v pozadí, AWS už jeden uviedol do produkcie. nová generácia serverov Založené na čipe Trainium3. Tieto zariadenia, dostupné priamo na konferencii v Las Vegas, sú zamerané na trénovanie rozsiahlych modelov a vysokoobjemovú inferenciu v cloudových službách umelej inteligencie.

Každý server sa integruje 144 žetónov Trainium3 A podľa spoločnosti ponúka viac ako štvornásobný výpočtový výkon oproti predchádzajúcej generácii hardvéru umelej inteligencie od spoločnosti AWS. Navyše to dosahuje s približne o 40 % nižšou spotrebou energie, čo je kľúčový faktor v kontexte, keď náklady na elektrinu a sieťové obmedzenia začínajú ovplyvňovať rozširovanie dátových centier.

Dave Brown, viceprezident pre výpočtovú techniku ​​a služby strojového učenia v spoločnosti AWS, zdôraznil, že cieľom nie je len chváliť sa surovou silou, ale ukázať zákazníkom, že existuje. konkurencieschopná alternatíva z hľadiska pomeru cena/výkon v porovnaní s tradičnými grafickými procesormi. Spoločnosť sa vyhýba uvádzaniu absolútnych čísel, ale trvá na tom, že skok v porovnaní s predchádzajúcou generáciou je pozoruhodný.

Toto zlepšenie efektívnosti je obzvlášť zaujímavé pre európskych prevádzkovateľov, kde regulačný a sociálny tlak na spotrebu energie digitálnej infraštruktúry neustále rastie. Menej elektriny pri rovnakom objeme školení znamená udržateľnejšie dátové centrá a potenciálne aj stručnejšie faktúry pre firemných zákazníkov.

V rámci plánu Amazonu sa Trainium3 nielen snaží získať pozíciu oproti Nvidii, ale aj znížiť závislosť od externých dodávateľov a posilniť... proprietárny rad čipov s umelou inteligenciou ktoré sa môžu vyvíjať s cyklami, ktoré spoločnosť viac kontroluje.

Továrne s umelou inteligenciou: špecializovaná infraštruktúra v našich vlastných dátových centrách

Ďalším oznámením, ktoré vyvolalo veľkú pozornosť, je spustenie tzv. Továrne umelej inteligencie od spoločnosti AWS, produktu určeného pre veľké spoločnosti a verejnú správu, ktoré chcú na svojich sieťach prevádzkovať pokročilé systémy umelej inteligencie vlastné dátové centrá, bez toho, aby sa vzdali integrácie s cloudom Amazon.

Model je na papieri jednoduchý: klient poskytuje fyzický priestor a energiu a AWS sa stará o inštaláciu, správu a údržbu systému umelej inteligencie a prepája ho so zvyškom služieb platformy. Európske spoločnosti s prísnymi regulačnými požiadavkami alebo vlády, ktoré sa obávajú o suverenitu údajov, si tak môžu udržiavať úplná kontrola nad citlivými informáciami bez toho, aby bol vystavený vonkajšej infraštruktúre.

Termín AI Factories nie je náhodný. Nvidia používa rovnaký koncept na označenie vlastných hardvérových systémov optimalizovaných pre umelú inteligenciu a v tomto prípade je riešenie AWS budované práve v spolupráci s výrobcom GPU. AI Factories od Amazonu budú kombinovať Blackwellove čipy od spoločnosti Nvidia a nového Trainium3, spoliehajúceho sa na cloudové siete, úložiská a zabezpečenie AWS.

Okrem hardvéru je možné tieto zariadenia integrovať aj so spravovanými službami, ako napríklad Amazonská skala —zosúladiť a nasadiť základné modely umelej inteligencie — a AWS SageMaker, zamerané na vývoj a školenie proprietárnych modelov. Pre spoločnosti to znamená vysoko výkonné prostredie umelej inteligencie, ale nasadené v rámci hybridnej cloudovej schémy, ktorá sa lepšie prispôsobuje miestnym predpisom o údajoch.

Medzitým sa ďalší významní poskytovatelia, ako napríklad Microsoft, uberajú rovnakým smerom s lokálnymi dátovými centrami a riešeniami navrhnutými pre dátovú suverenitu. Záväzok spoločnosti Amazon k jej AI Factories odráža rozsah, v akom je umelá inteligencia tlačí cloudových gigantov smerom k hybridnejším modelomodklon od čisto centralizovaného modelu spred desiatich rokov.

Dátové centrum so servermi pre umelú inteligenciu

Modely Nova a Sonic a posilnenie ponuky umelej inteligencie od AWS

Popri hardvérových inováciách využil Amazon svoju konferenciu na posilnenie svojej softvérovej stránky novými verziami svojich modelov umelej inteligencie zoskupených pod značkou NovaSpoločnosť predstavila Nova 2, čo je evolúcia, ktorá sľubuje vyššiu rýchlosť a odozvu v porovnaní s predchádzajúcou generáciou.

Jeden z variantov Novy je schopný interagovať s používateľmi nielen prostredníctvom textu, ale aj prostredníctvom obrázky, hlas a videoToto rozširuje potenciálne prípady použitia v sektoroch, ako sú zákaznícky servis, online vzdelávanie a tvorba obsahu. Táto multimodálna schopnosť ho stavia na rovnakú úroveň ako iné popredné návrhy na trhu s generatívnou umelou inteligenciou.

Okrem toho spoločnosť AWS predstavila model s názvom akustický, zameraný na hlasové interakcie. Podľa Matta Garmana, generálneho riaditeľa spoločnosti Amazon Web Services, tento systém dokáže reagovať na hovorené povely hlasovým výstupom v kvalite „podobnej ľudskej“, čím otvára dvere k prirodzenejší konverzační asistenti pre verejné a súkromné ​​služby.

Hoci spoločnosť pripúšťa, že jej modely stále čelia výzve získať podiel na trhu oproti konkurencii, ako je napr. ChatGPT (OpenAI), Claude (Antropický) o Blíženci (Google)Obchodné čísla spoločnosti AWS za posledný štvrťrok poukazujú na solídny rast. Tržby divízie sa zvýšili približne o 20 %, čo bolo spôsobené najmä dopytom po výpočtoch a infraštruktúre umelej inteligencie.

Pre európske podniky tento rozšírený katalóg znamená viac možností pri výbere platformy umelej inteligencie, a to ako z hľadiska modelov pripravených na použitie, tak aj z hľadiska... infraštruktúra, na ktorej sa dajú trénovať proprietárne riešenia prispôsobené každému sektoru a miestnym predpisom.

Tvrdá konkurencia v pretekoch medzi čipmi a infraštruktúrou umelej inteligencie

Všetky tieto vydania sa vyskytujú v kontexte intenzívna konkurencia na trhu čipy s umelou inteligenciouNvidia si udržiava dominantné postavenie vďaka svojim grafickým procesorom a sile ekosystému CUDA, ale spoločnosti ako Amazon, Google, Microsoft a dokonca aj tradiční výrobcovia procesorov investujú milióny, aby sa vyhli zaostávaniu.

V prípade AWS je investícia do Trainium3 a budúceho Trainium4 súčasťou dvojitej stratégie. Na jednej strane sa snaží znížiť závislosť od externých dodávateľov a lepšie kontrolovať náklady a dostupnosť svojej infraštruktúry. Na druhej strane chce zákazníkom ponúknuť hardvérové ​​alternatívy, ktoré im umožnia optimalizovať výdavky bez toho, aby obetovali výkon alebo kompatibilitu s nástrojmi Nvidia.

Z hľadiska trhu kombinácia vlastných čipov, dohôd o spolupráci so spoločnosťou Nvidia a produktov ako AI Factories stavia Amazon do pozície hráča schopného konkurovať nielen v cloudových službách, ale aj v... samotný základ hardvéru čo poháňa novú vlnu aplikácií umelej inteligencie.

Pre spoločnosti a verejnú správu v Španielsku a Európe sa tento scenár premieta do širšej škály možných infraštruktúr – od verejného cloudu až po lokálne alebo hybridné dátové centrá – s možnosťou výberu medzi rôznymi konfiguráciami ceny, výkonu a dátovej suverenity. V sektore, kde technologické rozhodnutia... priamy vplyv na nákladySúlad s predpismi a inovačné schopnosti, príchod Trainium3, budúce integrácie s NVLink Fusion a AI Factories pridávajú do balíčka nové karty, ktoré predvídateľne ešte viac urýchlia prijímanie rozsiahlych riešení umelej inteligencie.

Čo je RISC-V RVA23?
Súvisiaci článok:
RISC-V RVA23: Všetko o profile, ktorý mení procesory