Nowa era kodowania. Claude Sonnet 4.5 miażdży GPT-5 i Gemini

Aktualności Oprogramowanie

Paweł Czajkowski
30 września 2025

Nowa era kodowania. Claude Sonnet 4.5 miażdży GPT-5 i Gemini

Anthropic zaprezentowało Claude Sonnet 4.5 – model AI, który według firmy wyznacza nowe standardy w zadaniach kodowania. Producent podkreśla, że system umożliwia nie tylko tworzenie prototypów, lecz także pełnoprawnych aplikacji gotowych do wdrożenia produkcyjnego. Wydajność nowego modelu oceniono jako znaczący krok naprzód względem wcześniejszych generacji.

Claude Sonnet 4.5 udostępniono w chatbotach Anthropic oraz poprzez API. Koszt pozostał identyczny jak w przypadku Claude Sonnet 4 – trzy dolary za milion tokenów wejściowych i piętnaście dolarów za milion tokenów wyjściowych.

Testy i osiągi

W benchmarku SWE-bench Verified nowy model uzyskał wynik 82 procent, a w OSWorld – 61,4 procent, co stanowi duży skok w porównaniu z poprzednikiem. W Terminal-Bench Claude Sonnet 4.5 osiągnął 50 procent, przewyższając zarówno GPT-5 OpenAI, jak i Gemini 2.5 Pro Google. Choć w testach ogólnych, takich jak GPQA Diamond czy MMMLU, model wypada słabiej, jego wyniki potwierdzają skupienie na kodowaniu i zadaniach inżynieryjnych.

Relacje z rynku

Według Davida Hersheya z zespołu badawczego Anthropic model był w stanie działać jako autonomiczny agent przez ponad 30 godzin u klientów korporacyjnych, obsługując procesy obejmujące konfigurację usług bazodanowych, zakup domen i audyt bezpieczeństwa. Szefowie firm Cursor i Windsurf określili Claude Sonnet 4.5 jako narzędzie wyznaczające nową generację modeli kodujących, szczególnie w projektach wymagających długotrwałej pracy.

Nowe narzędzia dla deweloperów

Równolegle z premierą Anthropic zaprezentowało Claude Agent SDK, czyli infrastrukturę, która ma pozwolić programistom tworzyć własnych agentów AI. Udostępniono również funkcję „Imagine with Claude” w wersji zapoznawczej dla subskrybentów Max. Nowe rozwiązanie pozwala generować oprogramowanie w czasie rzeczywistym, reagując bezpośrednio na polecenia użytkownika.

Współpraca z partnerami

Claude Sonnet 4.5 trafił także do GitHub Copilot, gdzie został udostępniony w planach Pro, Pro+, Business i Enterprise. Użytkownicy Copilot Free oraz Pro mogą zintegrować model, korzystając z własnego klucza w Visual Studio Code. Anthropic udostępnia również swój najnowszy system za pośrednictwem Amazon Bedrock, co daje deweloperom możliwość integracji z w pełni zarządzoną usługą w chmurze.

Konkurencja na rynku AI

Premiera odbyła się zaledwie dwa miesiące po debiucie modelu Claude Opus 4.1. Szybkie cykle wydawnicze wskazują na rosnącą presję w branży AI, w której dominacja może być chwilowa. GPT-5 OpenAI i Gemini 2.5 Pro Google pozostają liderami w testach ogólnych, ale Anthropic konsekwentnie wzmacnia swoją pozycję w niszy związanej z kodowaniem.

Oprogramowanie Sztuczna Inteligencja

Paweł Czajkowski Newsman / Zastępca kierownika działu News

Zgłoś autorowi błąd na stronie

Nowa era kodowania. Claude Sonnet 4.5 miażdży GPT-5 i Gemini

Testy i osiągi

Relacje z rynku

Nowe narzędzia dla deweloperów

Współpraca z partnerami

Konkurencja na rynku AI

Nowa era kodowania. Claude Sonnet 4.5 miażdży GPT-5 i Gemini

Komputery

Mobile

Gaming

Rankingi