GPT-5 miało być rewolucją, ale eksperci mówią wprost. To jedynie sztuczka marketingowa

Technologie

2950V

Łukasz Musialik | 26.08.2025, 13:15

Eksperci AI alarmują, że wyniki testów GPT-5 to iluzja. Nowy model OpenAI budzi kontrowersje i powszechną krytykę.

OpenAI chwali się rekordowymi wynikami GPT-5 w testach, ale naukowcy i etycy ostrzegają, że wysokie oceny osiągane w benchmarkach nie przekładają się na realną pomoc w codziennych zastosowaniach. Coraz więcej ekspertów domaga się zmiany sposobu oceny sztucznej inteligencji.

Dalsza część tekstu pod wideo

Wybrane okazje dla Ciebie

Reklama

Etui TECH-PROTECT Silicone MagSafe do Apple iPhone 17 Pro Liliowy

0 zł

~~62.4 zł~~ - najniższa cena

Kup teraz 62.4 zł

Etui TORRAS Pstand do Apple iPhone 16 Pro Czarny

0 zł

~~63.12 zł~~ - najniższa cena

Kup teraz 63.12 zł

Smartfon ULEFONE Armor 21 8/256GB 6.58" 120Hz Czarny UF-A21 NC/BK

0 zł

~~1153.31 zł~~ - najniższa cena

Kup teraz 1153.31 zł

Kabel USB - Lightning BASEUS Crystal Shine 1.2 m Fioletowy

0 zł

~~16.22 zł~~ - najniższa cena

Kup teraz 16.22 zł

GPT-5 uzyskał imponujące 94,6% na AIME 2025 i 74,9% w benchmarkach programistycznych, lecz w praktycznych zadaniach wypada słabo – na MCP Universe zdobył jedynie 43,7%. Eksperci podkreślają, że testy nie oddają rzeczywistych możliwości AI.

Problem pogłębia manipulacja wynikami. Firmy, jak Meta, dostosowują modele pod konkretne testy, a OpenAI miało dostęp do części danych testowych przed oficjalną oceną. To zjawisko nazywane jest “gamingiem” benchmarków.

W odpowiedzi pojawiają się nowe metody oceny, jak MedHELM od Stanforda, które uwzględniają szerszy zakres zadań i realne środowisko pracy AI. Coraz częściej stosuje się też testy w terenie i “red-teaming”.

Eksperci apelują o stworzenie kompleksowego systemu oceny AI, który uwzględni praktyczne zastosowanie danego modelu, a nie tylko wyniki testów. Tylko wtedy sztuczna inteligencja będzie bezpieczna i użyteczna dla wszystkich.

Źródło: miragenews.com

GPT-5 miało być rewolucją, ale eksperci mówią wprost. To jedynie sztuczka marketingowa

Przeczytaj również

Komentarze (16)

Odpowiedź na komentarz