Technology
„Microsoft“ pristato dirbtiniu intelektu paremtą kalbų vertimą „Teams“ – įskaitant balso klonavimą
„Microsoft“ „Interpreter“ programėlėje „Teams“ žada revoliucines vertimų galimybes realiuoju laiku, tačiau taip pat kelia naujų saugumo klausimų.
„Microsoft“ per kūrėjų konferenciją „Ignite 2024“ pristatė naują funkciją „Microsoft Teams“: „Interpreter“, įrankį, kuris leidžia realiu laiku atlikti „speech-to-speech“ vertimus ir simuliuoja kalbėtojo balsą iki devynių kalbų. Nuo 2025 metų pradžios vartotojai galės rengti susitikimus anglų, prancūzų, vokiečių, italų, japonų, korėjiečių, portugalų, mandarinų ir ispanų kalbomis, o jų balsas bus tiksliai atkartotas.
„Įsivaizduokite, jei galėtumėte skambėti kaip jūs pats kita kalba“, – parašė Jared Spataro, „Microsoft“ vyriausiasis rinkodaros vadovas, tinklaraščio įraše. „„Teams“ vertėjo agentas siūlo vertimus realiuoju laiku, kurie atrodo asmeniškesni ir autentiškesni, simuliuodami jūsų balsą.“
Funkcija bus prieinama tik „Microsoft 365“ prenumeratoriams ir reikalaus vartotojų sutikimo. Pasak „Microsoft“, biometriniai duomenys nebus saugomi, o įrankį galima išjungti „Teams“ nustatymuose. „Interpreter yra sukurtas siekiant kuo tiksliau atkartoti kalbėtojo žinutę, nepridedant jokių papildomų prielaidų ar informacijos“, – sakė įmonės atstovas.
Vis dėlto ši technologija kelia potencialių rizikų. Deepfake technologijos, manipuliuojančios balsais ir veidais, dabar yra plačiai paplitusios ir jau buvo naudojamos sukčiavimui. Žinomu šių metų atveju kibernetiniai nusikaltėliai sugebėjo imituoti klaidinančiai tikrą „Teams“ susitikimą ir apgaule išvilioti 25 milijonus dolerių. Tokia rizika taip pat atkreipia dėmesį į naują „Microsoft“ funkciją, nepaisant ribotų Interpreter naudojimo galimybių.
„Microsoft“ prisijungia prie įmonių, kurios investuoja į dirbtinio intelekto palaikomas kalbų technologijas, su „Interpreter“. Pavyzdžiui, „Meta“ išbando vertimo įrankį „Instagram Reels“, o startuoliai kaip „ElevenLabs“ kuria daugiakalbės kalbos sintezės platformas. Pasak „Markets and Markets“, natūralios kalbos apdorojimo technologijų, įskaitant vertimo paslaugas, rinka iki 2026 m. gali pasiekti 35,1 mlrd. JAV dolerių apimtį.
Vis dėlto KI vertimų naudojimas išlieka prieštaringas. Žmonių vertėjai vis dar lenkia algoritmus kalbant apie niuansus, kultūrinį kontekstą ir idiomatinį tikslumą. Tačiau daugeliui įmonių kainos pranašumas nusveria trūkumus.
Nors vertėjas galėtų pagerinti pasaulinį bendradarbiavimą įmonėse, funkcija kelia klausimų apie saugumą ir piktnaudžiavimą. Nepakankamas reglamentavimas galėtų suteikti galimybę piktavališkiems veikėjams naudoti suklastotus įrašus vertimams manipuliuoti.
„Microsoft“ kol kas nepateikė komentarų dėl saugumo mechanizmų, tačiau artimiausi mėnesiai turėtų atskleisti daugiau detalių. Pramonės stebėtojai atidžiai stebės, kaip „Microsoft“ užkerta kelią naujosios technologijos piktnaudžiavimui.