Nové technologie umožňují gadgetům porozumět vašim konverzacím

Obsah:

Nové technologie umožňují gadgetům porozumět vašim konverzacím
Nové technologie umožňují gadgetům porozumět vašim konverzacím
Anonim

Klíčové poznatky

  • Nové technologie by mohly vést k počítačům, které lépe rozumějí lidské řeči.
  • Microsoft a NVIDIA nedávno oznámily novou metodu interpretace jazyka řízenou umělou inteligencí.
  • Kvantové výpočty mohou být dalším způsobem, jak pokročit v oblasti zpracování jazyků.
Image
Image

V dnešní době existuje spousta chytrých gadgetů, kterým lze dávat příkazy, ale k počítačům, které rozumí konverzační řeči, jsme stále ještě daleko.

Microsoft a NVIDIA nedávno oznámily novou metodu interpretace řeči řízenou umělou inteligencí, která by mohla změnit to, jak chatujeme s naší elektronikou. Je součástí rostoucího hnutí, které mění způsob, jakým počítače rozumí řeči, nazývané také zpracování přirozeného jazyka (NLP).

"Modely využívající NLP jsou stále větší a pokročilejší a přibližují se lidskému chápání," řekl Lifewire v e-mailovém rozhovoru odborník na umělou inteligenci Hamish Ogilvy.

„Jedním z velkých pokroků je, že NLP jde nad rámec jednoduchých klíčových slov. Možná jste dnes zvyklí na to, že výsledky vyhledávání získáte zadáním nebo vyslovením jednoho nebo dvou klíčových slov, ale novější modely zpracování přirozeného jazyka využívají kontext k poskytování bohatších výsledků."

Chatovací roboti

NVIDIA a Microsoft se spojily, aby vytvořily model Megatron-Turing Natural Language Generation (MTNLG), o kterém dvojice tvrdí, že je to „nejvýkonnější monolitický transformační jazykový model, který byl doposud vyškolen“. Model umělé inteligence běží na superpočítačích.

Vědci ale zjistili, že model MTNLG zachytil lidské předsudky, když procházel horami vzorků lidské řeči.

„Zatímco obří jazykové modely posouvají pokrok v oblasti generování jazyků, trpí také problémy, jako je zaujatost a toxicita,“napsali vědci v blogovém příspěvku. "Naše pozorování s MT-NLG jsou taková, že model získává stereotypy a zkreslení z dat, na kterých je trénován."

Počítače, které lépe rozumějí řeči, nevylepší jen chytré reproduktory, jako je Alexa, tvrdí Ogilvy. Weby založené na textovém vyhledávání, jako je Amazon, také lépe porozumí zadávaným dotazům.

„Google zde měl zjevné prvenství, ale technologie NLP bude všude,“řekl Ogilvy. „U textového a hlasového vyhledávání mohou být uživatelé popisnější, protože NLP rozumí více než jen textu; chápe kontext toho, co hledáte, aby bylo dosaženo lepších výsledků."

Kvantové chaty?

Kvantové výpočty mohou být jedním ze způsobů, jak pokročit v oblasti NLP. Ve středu společnost Cambridge Quantum oznámila lambeq, o kterém tvrdí, že je to první kvantová sada nástrojů pro NLP.

…NLP rozumí více než jen textu; rozumí kontextu toho, co hledáte, aby se dosáhlo lepších výsledků.

Společnost říká, že tento nástroj umožňuje překlad vět v přirozených jazycích pomocí kvantových obvodů běžících na kvantových počítačích. Kvantové počítání je typ výpočtu, který k provádění výpočtů využívá neobvyklé vlastnosti kvantových stavů, jako je superpozice, interference a zapletení.

"Způsob, jakým kvantové počítače zvládají NLP, se velmi liší od klasických strojů. Ve skutečnosti je NLP 'kvantově nativní'," řekl Bob Coecke, hlavní vědec z Cambridge Quantum, Lifewire v e-mailovém rozhovoru. "Je to kvůli objevu, který jsme učinili před několika lety, že gramatika řídící věty a význam má velmi podobnou strukturu jako matematika používaná k programování kvantových počítačů."

Coecke řekl, že kvantové NLP by mohlo vést k lepším hlasovým asistentům a překladatelským nástrojům.

Další slibný přístup ke zlepšení rozpoznávání řeči, nazvaný Zac Liu, datový vědec ze společnosti Hypergiant, řekl Lifewire v e-mailovém rozhovoru. "Stručně řečeno, když datoví vědci vylepší data NLP, téměř zaručí, že budou mít lepší model NLP a lepší schopnosti NLP."

Image
Image

Dalším krokem je integrace modelů počítačového vidění s NLP, jako je trénování modelu umělé inteligence ke sledování videí a vytváření textového shrnutí tohoto videa, řekl Liu.

"Použití tohoto pokroku by mohlo být neomezené, od zdravotní péče, čtení radiologických filmů a poskytování předběžné diagnózy až po navrhování domů, oblečení, šperků nebo podobných předmětů," dodal. „Zákazník mohl požadavky vysvětlit slovně nebo písemně a tento popis lze pro lepší vizualizaci automaticky převést na obrázky nebo videa."

Doporučuje: