ხუთ, 11 ივნ, 2026
ხელოვნური ინტელექტი და მანქანური სწავლება

Gemini 3.5 Live Translate: Google-ის ახალი სიტყვა სინქრონულ თარგმანში

Google-მა, რომელმაც 20 წლის წინ თარგმნის სერვისი მანქანური დასწავლის ექსპერიმენტის სახით დაიწყო და დღეს უკვე თვეში ტრილიონზე მეტ სიტყვას თარგმნის, სრულიად ახალი...

Google-მა, რომელმაც 20 წლის წინ თარგმნის სერვისი მანქანური დასწავლის ექსპერიმენტის სახით დაიწყო და დღეს უკვე თვეში ტრილიონზე მეტ სიტყვას თარგმნის, სრულიად ახალი აუდიომოდელი – Gemini 3.5 Live Translate წარადგინა. ეს არის ინოვაციური სისტემა, რომელიც პირდაპირ ეთერში, ხმიდან ხმაში (Speech-to-speech) სინქრონული თარგმნისთვის შეიქმნა.

ახალ მოდელს 70-ზე მეტი ენის ავტომატურად ამოცნობა შეუძლია. მისი მთავარი უპირატესობა ისაა, რომ თარგმნისას ინარჩუნებს მოსაუბრის ინტონაციას, ტემპსა და ხმის სიმაღლეს, რაც შედეგს ბევრად ბუნებრივს ხდის.

ძველი სისტემებისგან განსხვავებით, რომლებიც თარგმნის დასაწყებად მოსაუბრის წინადადების დასრულებას ელოდებოდნენ, Gemini 3.5 მეტყველებას უწყვეტად, ნაკადის (stream) რეჟიმში ამუშავებს. ის იდეალურად აბალანსებს კონტექსტის გასაგებად საჭირო დროსა და სინქრონულობის შენარჩუნებას, რის გამოც მოსაუბრეს მხოლოდ რამდენიმე წამით ჩამორჩება და თავიდან ირიდებს უხერხულ პაუზებს.

გარდა ამისა, მოდელი გამძლეა ხმაურის მიმართ და შეუძლია არაპროგნოზირებად, ხმაურიან გარემოშიც შეუფერხებლად იმუშაოს. ენების ხელით კონფიგურაცია საჭირო აღარ არის, რადგან სისტემა მრავალენოვან საუბარს დამოუკიდებლად უმკლავდება. ეს მახასიათებლები მოდელს იდეალურ ინსტრუმენტად აქცევს ზარების, შეხვედრების, გაკვეთილებისა და პირდაპირი ტრანსლაციების სინქრონული თარგმნისთვის.

მოდელის დანერგვა სხვადასხვა მიმართულებით უკვე დაიწყო:

  • დეველოპერებისთვის: ხელმისაწვდომია საჯარო ტესტირების (Public preview) რეჟიმში Gemini Live API-ისა და Google AI Studio-ს გავლით.

  • კორპორაციული მომხმარებლებისთვის: მიმდინარე თვიდან დაემატება Google Meet-ს დახურული ტესტირების (Private preview) ფორმატით.

  • ფართო აუდიტორიისთვის: სისტემა უკვე ინტეგრირებულია Google Translate-ის აპლიკაციაში, როგორც Android, ისე iOS მომხმარებლებისთვის.

წყარო: Google