Jak funguje funkce Hum to Search od Googlu

Obsah:

Jak funguje funkce Hum to Search od Googlu
Jak funguje funkce Hum to Search od Googlu
Anonim

Klíčové poznatky

  • Google spustil nový nástroj, který uživatelům umožňuje vyhledávat skladby bzučením, zpěvem nebo pískáním.
  • Nový nástroj využívá strojové učení k tomu, aby přiřazoval hučenou stopu k databázi více než půl milionu skladeb, která se neustále aktualizuje.
  • Uživatelé Googlu se každý měsíc ptají, která skladba se hraje téměř 100krát.
Image
Image

Google spustil novou funkci nazvanou „Hum to Search“, aby vyřešil frustrující problém: když vám písnička uvízla v hlavě a nejste schopni přijít na to, jak se jmenuje.

Myšlenka zabručení při hledání skladby se zdá neuvěřitelně jednoduchá, tak proč Google spouští tuto funkci až v roce 2020? No, ukázalo se, že identifikace písní tímto způsobem je ve skutečnosti docela komplikovaná, zčásti proto, že naše pobrukované verze mají tendenci být dost odlišné od původní skladby. V nedávném příspěvku na svém blogu o umělé inteligenci Google vysvětluje, jak tento problém vyřešil pomocí strojového učení a nakonec pomohl lidem najít skladbu tím, že si melodii brouká, píská nebo zpívá, i když je její interpretace méně než přesná.

„Naším cílem pro Hum to Search je pomáhat lidem identifikovat a najít hudbu, která jim uvízla v hlavě,“řekl mluvčí Googlu Lifewire v e-mailu.

Začněte bzučet

Uživatelé Googlu se každý měsíc ptají, která skladba se hraje téměř 100 milionůkrát, Aparna Chennapragada, viceprezidentka a generální ředitelka nakupování spotřebitelů společnosti Google, uvedla video představující několik nových funkcí vyhledávání. Nyní existuje způsob, jak to zjistit.

Funkce „Hum to Search“je integrována do mobilní aplikace Google, widgetu Vyhledávání Google a Asistenta Google. Chcete-li k němu přistupovat prostřednictvím aplikace, klepněte na ikonu mikrofonu a řekněte „Co je to za skladbu?“Funguje také výběr tlačítka „Vyhledat skladbu“.

Aby tato funkce fungovala správně, vyžaduje si hučení po dobu alespoň 10–15 sekund. Uživatelé Androidu mohou broukat a najít skladby ve více než 20 jazycích, zatímco na iPhonech fungují pouze anglické skladby. Nástroj není vždy schopen identifikovat skladbu okamžitě, ale jakmile se to podaří, výsledky jsou docela dobré.

"Více než polovina skladeb širokého souboru proměnných (tón, výška, hlasitost atd.) je rozpoznána našimi algoritmy, ale přesnost samozřejmě závisí na kvalitě hučení, typu píseň a další,“řekl mluvčí Google Lifewire v e-mailu. "Ale jakmile je rozpoznán, zhruba čtyři z pěti odpovědí jsou správné."

Není to však poprvé, co bylo v aplikaci pro identifikaci hudby použito bzučení. SoundHound nabízí podobnou funkci, jak uvádí CNN Business, a je k dispozici také pro Android a iOS. Podle mluvčího Google nová funkce nevyvolává žádné obavy o ochranu soukromí ani „nemění způsob, jakým Google zpracovává zvukové interakce,“řekli Lifewire v e-mailu.

Strojové učení

Navzdory jednoduchosti konceptu je pobrukování melodie při hledání studiové nahrávky technicky dost obtížné. Existuje pro to několik důvodů, vysvětluje Christian Frank z Google Research v blogovém příspěvku z 12. listopadu. Zaprvé, pobrukovaná verze písně se může značně lišit od skutečné nahrávky, takže je obtížné tyto dvě srovnat. Takže zatímco Shazam a řada dalších aplikací již existují k identifikaci skladby, kterou slyšíte v restauraci nebo na jiném veřejném místě, použití bzučelé melodie jako základu pro toto vyhledávání může být složitější.

"S texty, doprovodnými vokály a nástroji se zvuk hudební nebo studiové nahrávky může zcela lišit od pobrukované melodie," píše Frank."Omylem nebo záměrem, když si někdo pobrukuje svou interpretaci písně, často se výška, tónina, tempo nebo rytmus mohou mírně nebo dokonce výrazně lišit."

Image
Image

Vzhledem k tomu, že verze písní s pobrukováním se mohou od originálů tak lišit, Frank poznamenává, že mnoho dřívějších metod vyžadovalo sladění bzučení člověka s verzí písně, která má pouze melodii, nebo skladbou, která obsahuje pobrukování. Díky tomu jsou případy použití v reálném světě náročné, protože databáze s těmito skladbami mohou být omezené a je třeba je ručně aktualizovat.

Google vysvětluje, že pro funkci Hum to Search používá modely strojového učení k přeměně zvuku na „číslovou sekvenci“, která představuje melodii skladby – to, co říká, lze považovat za „otisk prstu"

Uživatelsky přívětivější

Použití strojového učení ve funkci Hum to Search společnosti Google v konečném důsledku značně usnadňuje používání tohoto nástroje v reálném světě. Vzhledem k tomu, že Hum to Search odpovídá zabručené melodii hledajícího se skutečnou skladbou, je nástroj schopen pracovat s novými skladbami, jakmile jsou vydány, namísto databáze, kterou je třeba neustále aktualizovat o zabručené verze každé skladby. Navíc k jeho použití nepotřebujete perfektní výšku tónu.

„Současný systém dosahuje vysoké úrovně přesnosti v databázi skladeb, která obsahuje více než půl milionu skladeb, které neustále aktualizujeme,“uvedl Google ve svém oznámení Hum to Search. "Tento písňový korpus má stále prostor se rozrůst, aby zahrnoval další z mnoha světových melodií."

Doporučuje: