Trendy

Microsoft spustí multimodální AI využívající GPT-4

V posledních měsících se ChatGPT nedalo vyhnout a vypadá to, že Microsoft se chystá tento nástroj vylepšit aktualizací, díky které v centru pozornosti ještě zůstane. Společnost se totiž chystá spustit GPT-4, který potenciálně umožní vytvářet videa generovaná umělou inteligencí z jednoduchých textových pokynů.

Novinku prozradil Andreas Braun, technologický ředitel společnosti Microsoft Germany, na nedávné akci s názvem AI in Focus – Digital Kickoff. Podle Brauna „příští týden představíme GPT-4… budeme mít multimodální modely, které nabídnou zcela jiné možnosti – například videa“.

GPT-4 je základní technologie velkého jazykového modelu, která pohání aplikace jako ChatGPT. V tuto chvíli může ChatGPT odpovídat pouze v textové podobě, ale zdá se, že blížící se aktualizace vše změní. ChatGPT nebude prvním nástrojem, jehož výstupem budou videa vytvořená umělou inteligencí. V roce 2022 spustil majitel Facebooku Meta aplikaci Make-A-Video, která vytváří realistická videa na základě krátkých textových pokynů. A zdá se, že něco podobného by mohla umět i příští verze ChatGPT.

Videa s umělou inteligencí, hudba a další

Na akci věnované AI Microsoft vysvětlil, že GPT-4 bude „multimodální“. Holger Kenn, ředitel pro obchodní strategii v německé pobočce Microsoftu, vysvětlil, že to umožní AI společnosti převádět text uživatele na obrázky, hudbu a video.

Společnost Microsoft uvedla příklad, kdy by call centrum mohlo pomocí GPT-4 automaticky převádět telefonické rozhovory mezi zaměstnanci a zákazníky do textové podoby, což by ušetřilo obrovské množství času a úsilí, které by dříve bylo vynaloženo na sumarizaci těchto hovorů po jejich skončení.

Bez ohledu na to, že GPT-4 bude zřejmě spuštěn v následujících dnech, nemusíme čekat dlouho, než uvidíme, čeho je další verze ChatGPT schopna – a zda se Microsoftu podaří odstranit některé z přetrvávajících problémů, které se svým asistentem s umělou inteligencí má.

Zdroj: digitaltrends.com