GPT-5 złamany w rekordowym tempie! Eksperci pokazali, jak łatwo obejść zabezpieczenia

Technologie

12143V

Łukasz Musialik | 11.08, 17:00

Najnowszy model AI od OpenAI, GPT-5, został skutecznie złamany przez badaczy bezpieczeństwa w ciągu zaledwie doby od premiery.

Eksperci z NeuralTrust i SPLX wykazały, że zaawansowane techniki ataków, takie jak Echo Chamber czy StringJoin Obfuscation Attack, pozwalają obejść wbudowane mechanizmy ochrony, prowadząc do generowania niebezpiecznych instrukcji bez jawnych, szkodliwych poleceń.

Dalsza część tekstu pod wideo

Wybrane okazje dla Ciebie

Reklama

Uchwyt z podstawką XLINE MagSystem PR750K Czarny

-20 zł

~~59.99 zł~~ - najniższa cena

Kup teraz 39.99 zł

0 zł

~~159 zł~~ - najniższa cena

Kup teraz 159 zł

Smartwatch FOREVER Look Me KW-510 Czarny

0 zł

~~209.99 zł~~ - najniższa cena

Kup teraz 209.99 zł

Pasek DEVIA Deluxe Sport do Xiaomi Mi Band 7 Pro Pomarańczowy

-6.92 zł

~~22 zł~~ - najniższa cena

Kup teraz 15.08 zł

Echo Chamber polega na stopniowym zatruwaniu kontekstu rozmowy poprzez subtelne sugestie i narrację, która omija typowe filtry AI. Model, prowadzony przez „opowieść”, zaczyna generować zakazane treści, nie rozpoznając zagrożenia. SPLX zademonstrował także inne ataki, gdzie szkodliwe żądania ukrywane są w pozornie nieszkodliwych zadaniach, na przykład poprzez rozdzielanie znaków myślnikami.

Testy wykazały, że GPT-5 jest „niemal bezużyteczny dla biznesu” w stanie surowym, a GPT-4o wypada znacznie lepiej pod kątem odporności na ataki. Wyniki te budzą poważne wątpliwości co do gotowości GPT-5 do wdrożeń w środowiskach korporacyjnych, gdzie kluczowa jest prywatność i bezpieczeństwo danych.

Wnioski są alarmujące. Obecne systemy ochrony AI nie radzą sobie z wieloetapowymi, kontekstowymi atakami, które mogą prowadzić do generowania szkodliwych treści i wycieku danych. Eksperci podkreślają konieczność szybkiego wdrożenia nowych mechanizmów obronnych, zanim AI na dobre zadomowi się w biznesie.

Źródło: securityweek.com