Anthropic zaprezentowało Claude Sonnet 4.5 – model AI, który według firmy wyznacza nowe standardy w zadaniach kodowania. Producent podkreśla, że system umożliwia nie tylko tworzenie prototypów, lecz także pełnoprawnych aplikacji gotowych do wdrożenia produkcyjnego. Wydajność nowego modelu oceniono jako znaczący krok naprzód względem wcześniejszych generacji.
Claude Sonnet 4.5 udostępniono w chatbotach Anthropic oraz poprzez API. Koszt pozostał identyczny jak w przypadku Claude Sonnet 4 – trzy dolary za milion tokenów wejściowych i piętnaście dolarów za milion tokenów wyjściowych.
Testy i osiągi
W benchmarku SWE-bench Verified nowy model uzyskał wynik 82 procent, a w OSWorld – 61,4 procent, co stanowi duży skok w porównaniu z poprzednikiem. W Terminal-Bench Claude Sonnet 4.5 osiągnął 50 procent, przewyższając zarówno GPT-5 OpenAI, jak i Gemini 2.5 Pro Google. Choć w testach ogólnych, takich jak GPQA Diamond czy MMMLU, model wypada słabiej, jego wyniki potwierdzają skupienie na kodowaniu i zadaniach inżynieryjnych.
Relacje z rynku
Według Davida Hersheya z zespołu badawczego Anthropic model był w stanie działać jako autonomiczny agent przez ponad 30 godzin u klientów korporacyjnych, obsługując procesy obejmujące konfigurację usług bazodanowych, zakup domen i audyt bezpieczeństwa. Szefowie firm Cursor i Windsurf określili Claude Sonnet 4.5 jako narzędzie wyznaczające nową generację modeli kodujących, szczególnie w projektach wymagających długotrwałej pracy.
Nowe narzędzia dla deweloperów
Równolegle z premierą Anthropic zaprezentowało Claude Agent SDK, czyli infrastrukturę, która ma pozwolić programistom tworzyć własnych agentów AI. Udostępniono również funkcję „Imagine with Claude” w wersji zapoznawczej dla subskrybentów Max. Nowe rozwiązanie pozwala generować oprogramowanie w czasie rzeczywistym, reagując bezpośrednio na polecenia użytkownika.
Współpraca z partnerami
Claude Sonnet 4.5 trafił także do GitHub Copilot, gdzie został udostępniony w planach Pro, Pro+, Business i Enterprise. Użytkownicy Copilot Free oraz Pro mogą zintegrować model, korzystając z własnego klucza w Visual Studio Code. Anthropic udostępnia również swój najnowszy system za pośrednictwem Amazon Bedrock, co daje deweloperom możliwość integracji z w pełni zarządzoną usługą w chmurze.
Konkurencja na rynku AI
Premiera odbyła się zaledwie dwa miesiące po debiucie modelu Claude Opus 4.1. Szybkie cykle wydawnicze wskazują na rosnącą presję w branży AI, w której dominacja może być chwilowa. GPT-5 OpenAI i Gemini 2.5 Pro Google pozostają liderami w testach ogólnych, ale Anthropic konsekwentnie wzmacnia swoją pozycję w niszy związanej z kodowaniem.
Spodobało Ci się? Podziel się ze znajomymi!
Pokaż / Dodaj komentarze do:
Nowa era kodowania. Claude Sonnet 4.5 miażdży GPT-5 i Gemini