Jak mohou halucinace pomoci AI vám lépe porozumět

Obsah:

Jak mohou halucinace pomoci AI vám lépe porozumět
Jak mohou halucinace pomoci AI vám lépe porozumět
Anonim

Klíčové poznatky

  • Nový model strojového učení halucinuje obrázek vzhledu věty v jazyce, aby pomohl překladu.
  • Systém umělé inteligence zvaný VALHALLA byl navržen tak, aby napodoboval způsob, jakým lidé vnímají jazyk.
  • Nový systém je součástí rostoucího hnutí za používání umělé inteligence k porozumění jazyku.
Image
Image

Lidská metoda vizualizace obrázků při překladu slov by mohla pomoci umělé inteligenci (AI) vám lépe porozumět.

Nový model strojového učení halucinuje představu, jak věta vypadá v jazyce. Podle nedávného výzkumného článku pak tato technika používá vizualizaci a další vodítka, která napomáhají překladu. Je součástí rostoucího hnutí za používání umělé inteligence k porozumění jazyku.

„To, jak lidé mluví a píší, je jedinečné, protože každý máme trochu jiné tóny a styly,“řekla Lifewire v e-mailovém rozhovoru Beth Cudney, profesorka datové analýzy na Maryville University, která se na výzkumu nepodílela.. "Porozumět kontextu je obtížné, protože je to jako pracovat s nestrukturovanými daty. Zde je užitečné zpracování přirozeného jazyka (NLP). NLP je odvětví umělé inteligence, které řeší rozdíly v tom, jak komunikujeme pomocí strojového čtení s porozuměním. Klíčový rozdíl v NLP, jako odvětví umělé inteligence, se nezaměřuje pouze na doslovný význam slov, která mluvíme nebo píšeme. Dívá se na význam."

Zeptejte se Alice

Nový systém umělé inteligence, nazvaný VALHALLA, vytvořený výzkumníky z MIT, IBM a Kalifornské univerzity v San Diegu, byl navržen tak, aby napodoboval způsob, jakým lidé vnímají jazyk. Podle vědců používání smyslových informací, jako jsou multimédia, ve spojení s novými a neznámými slovy, jako jsou kartičky s obrázky, zlepšuje osvojování a udržení jazyka.

Tyto systémy zvyšují výkon chatbotů, kteří jsou v současné době pouze vyškoleni a schopni konkrétní konverzace…

Tým tvrdí, že jejich metoda zlepšuje přesnost strojového překladu oproti překladu pouze textu. Vědci použili architekturu kodéru a dekodéru se dvěma transformátory, typ modelu neuronové sítě vhodný pro data závislá na sekvenci, jako je jazyk, který může věnovat pozornost klíčovým slovům a sémantice věty. Jeden transformátor generuje vizuální halucinaci a druhý provádí multimodální překlad pomocí výstupů z prvního transformátoru.

"Ve scénářích ze skutečného světa možná nebudete mít obrázek s ohledem na zdrojovou větu," uvedl v tiskové zprávě Rameswar Panda, jeden z členů výzkumného týmu. „Naší motivací tedy v zásadě bylo: Místo používání externího obrazu během vyvozování jako vstupu můžeme použít vizuální halucinace – schopnost představit si vizuální scény – ke zlepšení systémů strojového překladu?“

Porozumění AI

Značný výzkum se zaměřuje na rozvoj NLP, zdůraznil Cudney. Elon Musk například spoluzaložil Open AI, která pracuje na GPT-3, modelu, který dokáže konverzovat s člověkem a je dostatečně důvtipný, aby generoval softwarový kód v Pythonu a Javě.

Google a Meta také pracují na vývoji konverzační umělé inteligence se svým systémem nazvaným LAMDA. "Tyto systémy zvyšují výkon chatbotů, kteří jsou v současné době pouze vyškoleni a schopni konkrétních konverzací, což pravděpodobně změní tvář zákaznické podpory a helpdesků," řekl Cudney.

Aaron Sloman, spoluzakladatel CLIPr, technologická společnost AI, v e-mailu uvedl, že velké jazykové modely, jako je GPT-3, se mohou naučit z velmi malého počtu příkladů školení a zlepšit tak shrnutí textu na základě lidské zpětné vazby. Řekl například, že velkému jazykovému modelu můžete zadat matematický problém a požádat AI, aby přemýšlela krok za krokem.

„Můžeme očekávat, že z velkých jazykových modelů budeme získávat větší postřehy a úvahy, jak se dozvídáme více o jejich schopnostech a omezeních,“dodal Sloman. "Očekávám také, že tyto jazykové modely vytvoří více lidských procesů, protože modeláři vyvinou lepší způsoby, jak doladit modely pro konkrétní úkoly, které nás zajímají."

Georgia Tech computing profesor Diyi Yang v e-mailovém rozhovoru předpověděl, že v našem každodenním životě uvidíme více využití systémů zpracování přirozeného jazyka (NLP), počínaje personalizovanými asistenty založenými na NLP až po pomoc s e-maily a telefonními hovory, k informovaným dialogovým systémům pro vyhledávání informací při cestování nebo zdravotní péči."Stejně jako spravedlivé systémy umělé inteligence, které dokážou plnit úkoly a pomáhat lidem odpovědným a nezaujatým způsobem," dodal Yang.

Obrovské modely umělé inteligence využívající biliony parametrů, jako jsou GPT-3 a DeepText, budou nadále pracovat na jediném modelu pro všechny jazykové aplikace, předpověděl v e-mailovém rozhovoru Stephen Hage, inženýr strojového učení ve společnosti Dialexa. Řekl, že budou také nové typy modelů vytvořené pro konkrétní použití, jako je hlasové online nakupování.

"Příkladem může být nakupující, který říká 'Ukaž mi tento oční stín v půlnoční modré s více halo,' aby ukázal dotyčnému odstín na očích s určitou kontrolou nad tím, jak je aplikován," dodal Hage.

Doporučuje: