GPT-5 miało być rewolucją, ale eksperci mówią wprost. To jedynie sztuczka marketingowa

Technologie
332V
GPT-5 / AI
Łukasz Musialik | Dzisiaj, 13:15

Eksperci AI alarmują, że wyniki testów GPT-5 to iluzja. Nowy model OpenAI budzi kontrowersje i powszechną krytykę.

OpenAI chwali się rekordowymi wynikami GPT-5 w testach, ale naukowcy i etycy ostrzegają, że wysokie oceny osiągane w benchmarkach nie przekładają się na realną pomoc w codziennych zastosowaniach. Coraz więcej ekspertów domaga się zmiany sposobu oceny sztucznej inteligencji.

Dalsza część tekstu pod wideo


GPT-5 uzyskał imponujące 94,6% na AIME 2025 i 74,9% w benchmarkach programistycznych, lecz w praktycznych zadaniach wypada słabo – na MCP Universe zdobył jedynie 43,7%. Eksperci podkreślają, że testy nie oddają rzeczywistych możliwości AI.

Problem pogłębia manipulacja wynikami. Firmy, jak Meta, dostosowują modele pod konkretne testy, a OpenAI miało dostęp do części danych testowych przed oficjalną oceną. To zjawisko nazywane jest “gamingiem” benchmarków.

W odpowiedzi pojawiają się nowe metody oceny, jak MedHELM od Stanforda, które uwzględniają szerszy zakres zadań i realne środowisko pracy AI. Coraz częściej stosuje się też testy w terenie i “red-teaming”.

Eksperci apelują o stworzenie kompleksowego systemu oceny AI, który uwzględni praktyczne zastosowanie danego modelu, a nie tylko wyniki testów. Tylko wtedy sztuczna inteligencja będzie bezpieczna i użyteczna dla wszystkich.

Źródło: miragenews.com

Komentarze (9)

SORTUJ OD: Najnowszych / Najstarszych / Popularnych

cropper