Trendy

Samsung umožní uživatelům odpovídat na hovory pomocí klonovaného hlasu

Novinka je prozatím dostupná pouze v korejštině na vybraných telefonech, včetně Galaxy S23, S23+ a S23 Ultra, a to jako součást funkce Bixby Text Call, která umožňuje tiché přijímání hlasových hovorů pomocí převodu textu na řeč.

Klonované hlasy vyvinuté umělou inteligencí jsou již nasazovány v podcastech a videohrách a zdá se, že brzy budou využívány širokou veřejností. Společnost Samsung nabízí funkci, která uživatelům umožňuje klonovat svůj hlas pro přijímání telefonních hovorů. Jak to funguje? Pokud vám někdo volá, ale vy nemůžete odpovědět nahlas, můžete napsat odpověď a ta bude přečtena simulakrem vašeho hlasu.

Tato funkce je v současné době k dispozici pouze v korejštině jako aplikace Bixby Custom Voice Creator pro malý počet telefonů Samsung (nové Galaxy S23, S23+ a S23 Ultra). Velkým problémem by mohla být nízká kvalita hlasu a dlouhá doba odezvy. Klonování hlasů pro přijímání hovorů je však díky současným technologiím zcela reálné – nástroje umělé inteligence dokáží vytvořit realistické kopie hlasů z pouhých několika minut zvuku.

Novinkou není ani přijímání zvukových hovorů prostřednictvím textového rozhraní. V zařízeních Samsung je tato funkce známá jako Bixby Text Call a byla představena se skinem Android One UI 5 této společnosti. Dříve byla k dispozici pouze v korejštině, nyní je k dispozici v angličtině pomocí obecného umělého hlasu (a pouze s verzí 5.1 One UI). Společnost Google nabízí podobnou službu nazvanou Call Screen, která umožňuje odpovídat na všechny nevyžádané hovory pomocí automatického hlasu. Služba Google však umožňuje pouze výběr ze seznamu obecných odpovědí, nikoli psaní vlastních odpovědí.

Není těžké si představit, že tyto funkce budou v blízké budoucnosti komplexnější a automatizovanější. Koneckonců byste mohli snadno propojit svůj klon převedený na hlas s chatbotem, jako je ChatGPT nebo Bing od Microsoftu. Samotný Samsung slibuje, že hlasy generované uživateli budou v budoucnu „kompatibilní s dalšími aplikacemi Samsungu mimo telefonní hovory“, i když není jasné, co to znamená.

Google samozřejmě slíbil podobnou funkci pro své hlasové hovory Duplex AI. Ty byly představeny v roce 2018 jako způsob automatické rezervace restaurací pomocí hlasu AI. Reakce na tuto technologii však byly smíšené, mnozí ji kritizovali jako neetickou a poukazovali na to, že přidává práci lidem na straně příjemce hovorů. Současné ambice společnosti Google v souvislosti s touto technologií jsou nejasné, neboť společnost na konci roku 2022 ukončila provoz webové verze Duplexu. Objevují se také případy zneužití hlasových klonů s umělou inteligencí (nenávistné projevy a obtěžování, podvody).

Klonování hlasu pomocí umělé inteligence má své výhody i nevýhody. Na jedné straně může být užitečné pro lidi, kteří nejsou schopni hlasově odpovídat na hovory nahlas, ale chtějí si zachovat osobní hlasovou identitu. Na druhou stranu by tato technologie mohla být zneužívána. Je důležité, aby společnosti, které tuto technologii používají, přijaly opatření k minimalizaci rizik a zajistily, že tato technologie bude používána eticky a zodpovědně.

Zdroj: TheVerge.com