Jak plynulé rozpoznávání hlasu zůstává rychlé, přesné a soukromé

Obsah:

Jak plynulé rozpoznávání hlasu zůstává rychlé, přesné a soukromé
Jak plynulé rozpoznávání hlasu zůstává rychlé, přesné a soukromé
Anonim

Klíčové poznatky

  • Fluent je superrychlý nástroj pro rozpoznávání hlasu respektující soukromí, který nepotřebuje připojení k internetu.
  • Lze jej vložit do téměř jakéhokoli zařízení.
  • Funguje v jakémkoli jazyce.
Image
Image

Fluent.ai je virtuální nástroj pro rozpoznávání hlasu, který neodesílá vaše příkazy na internet, funguje téměř okamžitě, může pracovat v jakémkoli jazyce a je tak malý, že jej lze zabudovat i do levného a nízkého -napájení zařízení, jako jsou například fitness hodinky.

Na rozdíl od Siri a Alexy je Fluent samostatným asistentem, který vám okamžitě rozumí a učí se od vás, takže čím více jej používáte, tím se zlepšuje. Nemá hloubku běžných virtuálních asistentů, ale není to určeno. Místo toho je rychlejší, přesnější a soukromější než snahy společností Apple, Amazon a Google.

„Řeč na text využívá zpracování přirozeného jazyka a poté odvozuje záměr,“řekl generální ředitel Fluent Probal Lala Lifewire během rozhovoru pro Zoom. "Vyžaduje hodně dat a velký výpočetní výkon. Fluent jde přímo od řeči k záměru, vezme váš hlas a převede ho přímo do akce."

Sečteno podtrženo

Fluent je software pro hlasové ovládání. Funguje to tak, že posloucháte váš příkaz a odstraníte všechna slova, která nepotřebuje, a ponecháte pouze základní podstatná jména a slovesa. "Turn out the lights," prostě zhasne a rozsvítí se. Podstatné prvky jsou zbaveny chaotické lidské věty a přeměněny na kroky. Je to skoro jako naprogramovat počítač, přeměnit složitou myšlenku na nejjednodušší sadu instrukcí.

Na co se dá použít?

Fluent lze použít na cokoli. Klíčové je, že je natrénováno na konkrétní situaci. S chytrými hodinkami může být například trénováno v příkazech pro fitness nebo pro domácí automatizaci, vytváření kalendáře a časovače a tak dále. Omezením databáze se vše lépe soustředí a urychluje se.

"Pravda je taková, že s nositelnými zařízeními nechcete konverzovat," řekla Lala, "možná chci, aby moje oblíbené cvičení začalo, a chci to velmi rychle."

Rychlost a přesnost jsou základem. Zapínání a vypínání světel trvá milisekundy, místo toho, abyste museli čekat, až Siri odešle váš hlas do cloudu, počkejte na jeho zpracování a po několika sekundách zhasnou světla.

Toto úzké školení také snižuje velikost aplikace. Minulý rok Google poskytl ke stažení offline verzi svého asistenta. Bylo to, říká Lala, 85 megabajtů, fungovalo to pouze v angličtině a trvalo šest měsíců, než se to naučilo.

„Máme jeden model, který pracuje s 13 000 příkazy a pracuje v 500 kilobajtech,“řekl.

Sečteno podtrženo

Další výhodou offline nástroje pro rozpoznávání hlasu je soukromí. Například v dětských chytrých hodinkách „nechcete, aby se dětský hlas dostal do cloudu,“říká Lala. Ve skutečnosti může Fluent pracovat uvnitř zařízení, která se nikdy nepřipojují k internetu. To je dobré nejen pro soukromí, ale také pro bezpečnost. Ve výzkumných laboratořích, vojenských zařízeních a dalších místech, která zakazují používání mobilních telefonů a fotoaparátů, byste mohli použít nástroj pro rozpoznávání hlasu offline.

Limity

Tento model má samozřejmě své nevýhody. Jedním z nich je, že příkazy nelze přidat později. Jakmile je úvodní školení dokončeno, je to. Ani váš asistent pracující na Fluentu nemůže na internetu vyhledat vaše sportovní výsledky, herce, kterého v tom filmu znáte, ale neumíte ho zařadit a tak dále.

Image
Image

Namísto toho je systém dostatečně chytrý na to, aby rozpoznal, kdy nemůže pomoci, a předá žádost někomu, kdo může. Pokud se svých hodinek zeptáte na předpověď počasí, Fluent si uvědomí, že nerozumí. "Pak zavolá službu, která je předprogramována v hodinkách, ať už je to Amazon Alexa nebo Google, a poté zavolá do cloudu," předá váš nezpracovaný hlasový příkaz, abyste získali odpověď.

Tento hybridní přístup zachovává rychlost místního offline asistenta se silou Alexa nebo Google Assistant jako zálohou.

Můžete si koupit nějaké plynulé zařízení?

Zatím ne. Společnost licencuje své technologie a provádí školení pro jiné společnosti. Díky COVIDu byly dva hlavní starty posunuty zpět na příští rok. Můžete však očekávat, že se objeví v hodinkách a dalších fitness zařízeních, reproduktorech, centrech domácí automatizace a tak dále.

Bylo by skvělé, kdyby to bylo začleněno také přímo do chytrých telefonů, jako je iPhone, což by zrychlilo každodenní úkoly a uchýlilo se k Siri pouze v případě potřeby. To by byla ta pravá zabijácká aplikace.

Aktualizace: 22. října, 10:12. Provedeny změny, aby se Fluent označoval jako nástroj pro rozpoznávání hlasu spíše než jako hlasový asistent.

Doporučuje: