Hackeři se snaží vylepšovat AI

Obsah:

Hackeři se snaží vylepšovat AI
Hackeři se snaží vylepšovat AI
Anonim

Klíčové poznatky

  • Nový tým vývojářů vytváří modely umělé inteligence s otevřeným zdrojovým kódem.
  • Skupina používá masivní modely jazykového vzdělávání, které bude vydávat pod otevřenými licencemi.
  • Umělá inteligence s otevřeným zdrojovým kódem by mohla přispět k tomu, aby potenciál nové technologie, která mění hru, byla méně náchylná k předsudkům a chybám.
Image
Image

V oblasti umělé inteligence probíhá mnoho výzkumů velkých společností (AI), ale jedna online skupina chce tento proces demokratizovat.

EleutherAI je nedávno vytvořený kolektiv dobrovolných výzkumníků, inženýrů a vývojářů zaměřených na open-source výzkum umělé inteligence. Organizace používá kódové základny GPT-Neo a GPT-NeoX k trénování masivních jazykových modelů, které plánuje vydat pod otevřenými licencemi.

„Otevřená data jsou přínosem pro výzkumníky, protože vědci mají více volných zdrojů, které mohou použít k trénování modelů a dokončení výzkumu,“řekl Edward Cui, generální ředitel společnosti Graviti pro umělou inteligenci, Lifewire v e-mailovém rozhovoru. Jeho společnost není zapojena do EueutherAI. „Víme, že mnoho projektů umělé inteligence bylo zdrženo obecným nedostatkem vysoce kvalitních dat ze skutečných případů použití, takže je nezbytné vytvořit pokyny, které zajistí kvalitu dat, s pomocí zúčastněné komunity.“

This Is The Way

Začátky EleutherAI byly skromné. Minulý rok zveřejnil nezávislý výzkumník umělé inteligence jménem Connor Leahy na serveru Discord následující zprávu: „Hej, pánové, dovolte [SIC], aby OpenAI zajela za své peníze jako za starých dobrých časů.“

A tak vznikla skupina. Nyní má stovky přispěvatelů, kteří zveřejňují svůj kód na online softwarovém úložišti GitHub.

Opensourcing AI není nic nového. Platforma pro řízení pracovních toků Airflow společnosti Airbnb a motor pro zjišťování dat od společnosti Lyft jsou ve skutečnosti výsledkem používání nástrojů s otevřeným zdrojovým kódem, které umožňují datovým týmům lépe pracovat s daty, poukázal Ali Rehman, projektový manažer softwarové společnosti CloudiTwins v e-mailovém rozhovoru pro Lifewire..

„Stejně jako revoluce open source vedla k transformaci vývoje softwaru, tak také vedla k rozvoji a demokratizaci datové vědy a umělé inteligence,“řekl Rehman. „Open source se stal zásadním aktivátorem řešení podnikových datových věd, přičemž většina datových vědců používá nástroje s otevřeným zdrojovým kódem.“

Otevírání dveří

Vývoj umělé inteligence s otevřeným zdrojovým kódem by mohl přispět k tomu, aby potenciál nové technologie, která mění hru, byla méně náchylná ke zkreslení a chybám, tvrdí někteří pozorovatelé.

Výzkum AI nyní probíhá primárně otevřeně, přičemž téměř všechny společnosti, výzkumné laboratoře a univerzity prezentují své výsledky okamžitě v odborných publikacích, řekl Kush Varshney, výzkumník AI z IBM, Lifewire v e-mailovém rozhovoru.

„Tato otevřená komunita je nezbytná, protože poskytuje zvýšenou úroveň kontrol a protiváh, aby bylo zajištěno, že AI je zkoumána, vytvářena, nasazována a aplikována zodpovědně,“dodal Varshney. "To je obzvláště důležité v situacích, kdy tyto systémy mohou ovlivnit životy našich nejzranitelnějších členů společnosti. Tato otevřenost se vztahuje nejen na obecné strojové učení a algoritmy hlubokého učení, ale také na prvky důvěryhodné umělé inteligence."

Rehman řekl, že jedním z kritických rozdílů mezi proprietárním a open-source softwarem je flexibilita a přizpůsobení. Proprietární výzkum umělé inteligence bude mít problémy se zabezpečením, aktualizacemi a optimalizacemi.

Image
Image

„Je to proto, že přístup založený na komunitě s otevřeným zdrojovým kódem získává cenné informace od tisíců odborníků z oboru, kteří identifikují potenciální bezpečnostní zranitelnosti, které jsou pak rychleji odstraněny,“dodal Rehman."Konsensus komunity znamená, že kvalita je zaručena a nové příležitosti jsou snadněji identifikovány."

Dalším problémem je, že proprietární výzkum umělé inteligence nebude interoperabilní, což znamená, že nemůže pracovat s různými datovými formáty a pravděpodobně bude mít přístup k dodavateli, což společnostem brání v testování a zkoušení softwaru před tím, než se zaváže k řešení, Rehman řekl.

Ale ne každý aspekt výzkumu umělé inteligence musí být open source, řekl Chris Kent, generální ředitel společnosti Reveal Surgical pro lékařskou umělou inteligenci, Lifewire v e-mailovém rozhovoru. „Je důležité chránit ekonomické pobídky, které řídí komerční vývoj klíčových aplikací umělé inteligence,“řekl.

Výzkum AI však potřebuje robustní open-source komponentu, řekl Kent. Dodal, že open source pracuje na budování důvěry a používání datových sad, které nejsou nebo by neměly být kontrolovány jednotlivými institucemi nebo společnostmi.

„Přístup s otevřeným zdrojovým kódem je nejlepší způsob, jak identifikovat a kompenzovat základní zaujatost, která může existovat v tréninkových sadách, a povede k holističtějším, kreativnějším a spolehlivějším aplikacím AI,“řekl Kent.

Doporučuje: