Rozwój agentów AI przynosi nie tylko nowe możliwości, ale także zupełnie nowe zagrożenia. Eksperci z firmy LayerX opisali właśnie nową metodę ataku nazwaną BioShocking, która wykorzystuje technikę tzw. prompt injection. Co ciekawe, inspiracją dla nazwy była kultowa gra BioShock i słynna fraza „Would you kindly?”, kojarzona z manipulacją zachowaniem bohatera.
BioShocking to atak skierowany przeciwko przeglądarkom i agentom AI. Zamiast wykorzystywać klasyczne luki w oprogramowaniu, cyberprzestępcy manipulują modelem językowym za pomocą odpowiednio przygotowanych poleceń. W demonstracji przygotowanej przez LayerX użytkownik prosi agenta AI o uruchomienie prostej gry inspirowanej światem BioShock. W jej trakcie model otrzymuje nietypowe zasady, np. że „zwycięstwo oznacza porażkę”, a poprawną odpowiedzią na działanie 2 + 2 jest 5. Gdy agent zaakceptuje tę logikę, staje się podatny na kolejne instrukcje.
Eksperci z firmy LayerX opisali właśnie nową metodę ataku nazwaną BioShocking, która wykorzystuje technikę tzw. prompt injection.
Od gry do kradzieży danych
Następny etap ataku polega na nakłonieniu AI do odwiedzenia spreparowanego repozytorium w serwisie GitHub. W efekcie agent, przekonany, że wykonuje zadanie prowadzące do „wygranej”, może ujawnić poufne informacje lub przekazać napastnikom dane uwierzytelniające użytkownika. To pokazuje, że nawet rozbudowane mechanizmy bezpieczeństwa mogą zostać obejście nie przez exploit systemowy, lecz odpowiednio skonstruowaną sekwencję poleceń.
Które narzędzia są zagrożone?
Według LayerX podatność udało się odtworzyć w wielu popularnych rozwiązaniach opartych na AI, w tym ChatGPT Atlas, Perplexity Comet, Fellou, Genspark Browser, Sigma Browser oraz wtyczce Claude dla przeglądarki Chrome. Badacze poinformowali już producentów o problemie. Jak dotąd poprawkę wdrożono jedynie w ChatGPT Atlas, natomiast pozostali dostawcy pracują nad aktualizacjami.
Spodobało Ci się? Podziel się ze znajomymi!

Pokaż / Dodaj komentarze do:
Eksperci ostrzegają przed BioShocking. Agenci AI mogą wykonywać polecenia hakerów