NVIDIA Blackwell Ultra definiuje nową erę AI. Imponujący skok efektywności i 50-krotnie więcej tokenów na wat

Technologie
597V
NVIDIA Blackwell
Maciej Zabłocki | Dzisiaj, 13:45

Wyścig zbrojeń w dziedzinie infrastruktury dla sztucznej inteligencji wchodzi w nową fazę. NVIDIA, niekwestionowany lider rynku, zaprezentowała możliwości swojej najnowszej platformy Blackwell Ultra (GB300 NVL72). Wyniki są jednoznaczne: "Zieloni" nie tylko utrzymują przewagę, ale wręcz deklasują poprzednie generacje, oferując rozwiązanie skrojone pod rosnący rynek autonomicznych agentów AI i gigantycznych modeli językowych.

Branża sztucznej inteligencji ewoluuje w błyskawicznym tempie. O ile rok 2022 stał pod znakiem prostych chatbotów, o tyle rok 2026 należy do tzw. "Agentic AI" - systemów zdolnych do wieloetapowego rozumowania i autonomicznego działania. Zmiana ta wymusza na dostawcach infrastruktury, takich jak NVIDIA, radykalne zwiększenie przepustowości pamięci i redukcję opóźnień. Odpowiedzią na te wyzwania jest architektura Blackwell Ultra.

Dalsza część tekstu pod wideo

W najnowszym wpisie na swoim blogu NVIDIA, powołując się na dane z analizy SemiAnalysis InferenceMAX, chwali się parametrem, który dla hiperskalerów budujących gigantyczne centra danych jest kluczowy: stosunkiem tokenów do wata energii. System GB300 NVL72 notuje w tym aspekcie aż 50-krotny wzrost przepustowości na megawat w porównaniu do układów z rodziny Hopper.

NVIDIA Blackwell Ultra
resize icon

Tak gigantyczny skok nie jest dziełem przypadku. Inżynierowie NVIDIA połączyli 72 procesory graficzne w jeden, spójny superkomputer, wykorzystując technologię NVLink o przepustowości 130 TB/s. W przeciwieństwie do ograniczonej domeny 8 układów w architekturze Hopper, Blackwell Ultra tworzy jednolitą strukturę obliczeniową. Kluczową rolę odgrywa tu również nowy format precyzji obliczeń NVFP4, który drastycznie przyspiesza przetwarzanie danych przy zachowaniu odpowiedniej dokładności.

Dla laboratoriów badawczych i firm wdrażających AI, liczby przekładają się bezpośrednio na finanse. NVIDIA deklaruje, że nowa architektura pozwala na 35-krotną redukcję kosztów wygenerowania miliona tokenów. Jest to szczególnie istotne w przypadku "Agentic AI", gdzie modele muszą przetwarzać ogromne ilości informacji kontekstowych (np. całe bazy kodu programistycznego), aby zachować ciągłość rozumowania.

Porównując Blackwell Ultra (GB300) z modelem GB200 w zadaniach wymagających długiego kontekstu, nowsza platforma oferuje:

  • 1,5-krotnie niższy koszt na token
  • 2-krotnie szybsze kojarzenie faktów w obszernych danych 

Wygląda na to, że prawo Huanga (mówiące o postępie w wydajności układów AI przewyższającym prawo Moore'a) wciąż obowiązuje. A na horyzoncie majaczy już kolejna generacja – architektura Vera Rubin, która ma przynieść jeszcze większe usprawnienia, umacniając dominację NVIDIA w wyścigu o technologiczną supremację.

Źródło: WCCFTech

Komentarze (7)

SORTUJ OD: Najnowszych / Najstarszych / Popularnych

cropper