OpenAI zaprezentowało najnowszy krok w rozwoju sztucznej inteligencji – funkcję o nazwie "agent", która umożliwia ChatGPT samodzielne wykonywanie zadań na zlecenie użytkownika.
Premiera odbyła się po tygodniach spekulacji i przecieków dotyczących rzekomej przeglądarki internetowej, której pojawienia się spodziewano się w pierwszej kolejności. Zamiast tego otrzymaliśmy coś bardziej złożonego – narzędzie działające niemal jak wirtualny pracownik, który obsługuje aplikacje, przegląda kalendarze, analizuje dane i finalizuje transakcje. Wszystko to odbywa się w ramach jednego interfejsu, z poziomu czatu ChatGPT.
Agent z uprawnieniami użytkownika?
Agent korzysta z zewnętrznych usług – takich jak GrubHub, GitHub, SharePoint czy Dysk Google – dzięki specjalnym integracjom, które OpenAI określa jako „łączniki”. Dzięki nim system może sięgać po dane użytkownika i prowadzić interakcje z platformami, z których korzystają miliony ludzi na co dzień. W trakcie jednej sesji może zaplanować posiłek, zamówić produkty spożywcze, zarezerwować spotkanie, a następnie stworzyć prezentację w PowerPoint albo zestawienie w Excelu i przesłać je jako gotowy plik.
Dostęp do agenta możliwy jest wyłącznie dla użytkowników subskrybujących wersję Plus, kosztującą 20 dolarów miesięcznie. OpenAI przyznaje, że technologia nie osiągnęła jeszcze pełnej dojrzałości, ale już teraz potrafi wiele. Firma podkreśla również, że działania agenta odbywają się pod kontrolą użytkownika – każde bardziej wrażliwe zadanie wymaga zatwierdzenia, a sesję można zatrzymać lub przejąć w dowolnym momencie.
Czy to w ogóle bezpieczne?
Bezpieczeństwo wzbudza emocje, szczególnie gdy w grę wchodzi przekazywanie agentowi danych logowania. OpenAI zapewnia, że system jest zaprojektowany tak, by użytkownik mógł panować nad każdą interakcją. OpenAI zapewnia, że agent „prosi o pozwolenie przed podjęciem jakichkolwiek działań, a Ty możesz z łatwością przerwać działanie, przejąć kontrolę nad przeglądarką lub zatrzymać zadania w dowolnym momencie”. Mimo to prawdopodobnie rozsądniej będzie nie podawać swoich najbardziej poufnych danych.
Funkcje agenta są wynikiem połączenia trzech istniejących technologii OpenAI – Operatora, narzędzia Deep Research i mechanizmów czatu ChatGPT – w jeden system agentowy. Oznacza to, że użytkownik może zlecić wykonanie złożonych zadań wymagających zarówno pozyskania danych, jak i ich interpretacji oraz działania. Całość odbywa się bez konieczności przełączania się między aplikacjami czy kopiowania danych. Wystarczy rozmowa z botem.
Funkcja budzi zainteresowanie także ze względu na możliwy wpływ na ekosystem Microsoft 365. Agent potrafi przygotowywać dokumenty w pakiecie Office, ale nie obsługuje odpowiedników Google – Arkuszy czy Prezentacji. Microsoft, będący głównym inwestorem OpenAI, najprawdopodobniej odegrał rolę w kierunku, w jakim rozwijana jest ta technologia. Jednocześnie pojawiają się opinie, że narzędzie może w dłuższej perspektywie konkurować z rozwiązaniami samego Microsoftu. Kierunek ten może z czasem wywołać napięcia między partnerami.

Pokaż / Dodaj komentarze do: ChatGPT może samodzielnie logować się do maila, banku i innych kont. Co z prywatnością?