Google chce zlikwidować bariery językowe! Nowa funkcja tłumaczy niemal natychmiast każdą rozmowę
Google oficjalnie zaprezentowało Gemini 3.5 Live Translate, nowy model sztucznej inteligencji zaprojektowany z myślą o tłumaczeniach głosowych w czasie rzeczywistym.
Firma twierdzi, że rozwiązanie ma sprawić, iż rozmowy między osobami mówiącymi różnymi językami będą przebiegać niemal tak naturalnie, jak zwykła konwersacja.
Największą nowością jest sposób działania systemu. W przeciwieństwie do wielu obecnych translatorów użytkownik nie musi czekać, aż rozmówca skończy mówić. Gemini analizuje wypowiedź na bieżąco i niemal natychmiast generuje przetłumaczoną odpowiedź.
Według Google opóźnienia zostały ograniczone do minimum, dzięki czemu rozmowa nie jest przerywana długimi pauzami charakterystycznymi dla starszych rozwiązań. Nowy model obsługuje automatyczne wykrywanie ponad 70 języków. Co istotne, użytkownik nie musi ręcznie wybierać języka w ustawieniach. System sam rozpoznaje mowę i odpowiednio dostosowuje tłumaczenie.
Google podkreśla również, że Gemini 3.5 Live Translate nie tłumaczy wyłącznie słów. Algorytmy starają się zachować ton głosu, rytm wypowiedzi oraz intonację rozmówcy. Dzięki temu tłumaczenie ma brzmieć bardziej naturalnie i lepiej oddawać emocje zawarte w oryginalnej wypowiedzi. Dodatkowo użytkownicy mogą korzystać z funkcji transkrypcji. Oznacza to, że tłumaczenie jest nie tylko odczytywane głosowo, ale również wyświetlane na ekranie w formie tekstowej.
Google twierdzi, że Gemini 3.5 Live Translate zostało zaprojektowane z myślą o wielu różnych zastosowaniach. Technologia ma sprawdzać się podczas spotkań biznesowych, lekcji, rozmów telefonicznych, wideokonferencji oraz codziennych rozmów między osobami z różnych krajów.
Duży nacisk położono również na działanie w trudnych warunkach. Model został zoptymalizowany pod kątem hałaśliwego otoczenia, dzięki czemu powinien radzić sobie lepiej podczas rozmów prowadzonych poza biurem czy domem. Nowa funkcja jest już stopniowo udostępniana użytkownikom Androida i iOS. Trafi również do Google Meet, a deweloperzy otrzymają dostęp do niej poprzez Gemini Live API oraz Google AI Studio.