Anthropic-ის ტემპი ბოლო პერიოდში საგრძნობლად დაჩქარდა. Opus 4.7-ის გამოსვლიდან სულ რაღაც 41 დღეში კომპანიამ Claude Opus 4.8 წარადგინა. ეს სისწრაფე ნათლად აჩვენებს, თუ რამხელა წნეხია ხელოვნური ინტელექტის ბაზარზე, სადაც წამყვანი ლაბორატორიები პირველობისთვის იბრძვიან.
ახალი ვერსიის მთავარი მიზანი სანდოობაა. პირველადი შეფასებები აჩვენებს, რომ მოდელი ბევრად უკეთესად აღიარებს, როცა რაღაც არ იცის და თავს არიდებს ფაქტების გამოგონებას (ჰალუცინაციებს).
პროგრამისტების თქმით, კოდის წერისას მოდელი ხშირად სვამს დამაზუსტებელ კითხვებს და შეცდომებს იქამდე ასწორებს, სანამ არასწორ კოდს გაუშვებს. Anthropic ამტკიცებს, რომ წინა ვერსიასთან შედარებით 4-ჯერ შემცირდა იმის შანსი, რომ მოდელს შეცდომა (Bug) შეუმჩნეველი დარჩეს.
ახალი ფუნქცია: Dynamic Workflows
მოდელის განახლებასთან ერთად, Claude Code-ში გამოჩნდა ახალი სატესტო ფუნქცია – Dynamic Workflows. ის სისტემას საშუალებას აძლევს, მასშტაბური დავალებების შესასრულებლად ერთდროულად ასობით მცირე ქვე-აგენტი (sub-agent) გაუშვას. ნაბიჯ-ნაბიჯ მუშაობის ნაცვლად, მას შეუძლია პროექტის დაგეგმვა, კოდის პარალელურ ასისტენტებზე გადანაწილება და საბოლოო შედეგის ტესტირება.
„ზოგიერთი პრობლემა ზედმეტად დიდია ერთი აგენტის მიერ ერთ ჯერზე გადასაჭრელად, განსაკუთრებით რთულ, ძველ კოდებში: შეცდომების ძიება მთლიან სერვისში, მიგრაცია, რომელიც ასობით ფაილს ეხება, ან გეგმა, რომლის სრულყოფილად დატესტვაც გსურთ მის დამტკიცებამდე. დინამიკურ სამუშაო პროცესებს ყველა ამ ამოცანის თავიდან ბოლომდე შესრულება შეუძლია“.
ფასები და ახალი რეჟიმები
-
სტანდარტული რეჟიმი: API ფასები უცვლელია — $5 ყოველ 1 მილიონ შემომავალ ტოკენზე და $25 ყოველ 1 მილიონ გამომავალ ტოკენზე.
-
სწრაფი რეჟიმი (Fast Mode): პრემიუმ ფუნქცია ახლა მნიშვნელოვნად სუბსიდირებულია. ის სტანდარტულ რეჟიმზე 2.5-ჯერ სწრაფად მუშაობს, ფასი კი სამჯერ შემცირდა ($10 შემომავალ და $50 გამომავალ 1 მილიონ ტოკენზე).
ჩატის ინტერფეისს ასევე დაემატა ძალისხმევის კონტროლის ღილაკიც (effort control toggle), რითაც მომხმარებელს შეუძლია არჩევანი გააკეთოს ღრმა ფიქრისა და სწრაფი პასუხების რეჟიმებს შორის.
საზოგადოების რეაქცია და გადადებული Claude Mythos
მიუხედავად სიახლეებისა, მომხმარებელთა ნაწილი სიფრთხილით ეკიდება ამ ამბავს. 4.7 ვერსიის შერეული შეფასებების შემდეგ, ფორუმებზე მომხმარებლები ითხოვენ ბენჩმარკების უფრო მკაფიო მონაცემებს და წუხან, რომ ძველ (მაგალითად, 4.6) ვერსიებზე წვდომა არ დაკარგონ.
რაც შეეხება დიდი ხნის ნანატრ მოდელს – Claude Mythos, მისი რელიზი კვლავ თაროზეა შემოდებული. უსაფრთხოების რისკების გამო კომპანიამ პროცესი შეაჩერა, თუმცა აცხადებენ, რომ დამცავი მექანიზმების დანერგვა საკმარისად სწრაფად მიმდინარეობს საიმისოდ, რომ მოდელი მალე ვიხილოთ.
ამჟამად Opus 4.8 უკვე ხელმისაწვდომია ვებპლატფორმაზე, სტანდარტული API-ითა და ისეთი პარტნიორი ეკოსისტემების გავლით, როგორიცაა Microsoft Foundry.

