Co je dobré vědět
- V prohlížeči Google Books Ngram Viewer zadejte frázi, vyberte časové období a korpus, nastavte úroveň vyhlazování a klikněte na Prohledat spoustu knih.
- Můžete proniknout do dat. Chcete-li například vyhledat slovesný tvar ryba, místo podstatného jména ryba použijte značku: hledejte fish_VERB.
- Ngram Viewer zobrazuje graf znázorňující použití fráze v průběhu času. U více frází je každá reprezentována barevně odlišeným řádkem.
Tento článek vysvětluje, jak používat nástroj Ngram Viewer v Knihách Google k provádění výzkumu a vyhledávání.
Jak funguje prohlížeč Ngram
Ngram, také nazývaný N-gram, je statistická analýza obsahu textu nebo řeči s cílem najít n (číslo) nějakého druhu položky v textu.
Položkou vyhledávání mohou být nejrůznější věci, včetně fonémů, předpon, frází a písmen. Ačkoli je Ngram mimo výzkumnou komunitu neznámý, používá se v různých oblastech a má mnoho důsledků pro vývojáře, kteří kódují počítačové programy, které rozumí přirozené mluvené řeči a reagují na ni.
V případě prohlížeče Google Books Ngram Viewer pochází text, který má být analyzován, z velkého množství knih ve veřejné doméně, které společnost Google naskenovala, aby naplnila svůj vyhledávač knih Google. Pro prohlížeč Google Books Ngram Viewer označuje Google tělo textu, který budete prohledávat, jako korpus. Ngram Viewer agreguje podle jazyka, ačkoli britskou a americkou angličtinu můžete analyzovat samostatně nebo je spojit dohromady.
- Přejděte do prohlížeče Ngram Knih Google na adrese books.google.com/ngrams.
-
Zadejte jakoukoli frázi nebo fráze, které chcete analyzovat. Jednotlivé fráze oddělte čárkou. Google vám pro začátek navrhuje „Albert Einstein, Sherlock Holmes, Frankenstein“.
Ve vyhledávání NGram Viewer se u položek na rozdíl od vyhledávání Google na webu rozlišují velká a malá písmena.
- Vyberte časové období. Výchozí hodnota je 1800 až 2000.
- Vyberte korpus. Můžete vyhledávat v cizojazyčných textech nebo anglických textech a kromě standardních voleb si můžete všimnout položek jako „Angličtina (2009)“nebo „Americká angličtina (2009)“v dolní části seznamu. Jedná se o starší korpusy, které Google mezitím aktualizoval, ale možná budete mít nějaký důvod k porovnání se starými soubory dat. Většina uživatelů je může ignorovat a soustředit se na nejnovější korpusy.
-
Nastavte úroveň vyhlazování. Vyhlazování označuje, jak hladký je graf na konci. Nejpřesnější zobrazení odráží úroveň vyhlazení 0, ale toto nastavení může být obtížné přečíst. Výchozí hodnota je 3. Ve většině případů ji nemusíte upravovat.
- Stiskněte Prohledejte spoustu knih.
Pomocí prohlížeče Ngram Viewer společnosti Google můžete data ponořit. Pokud byste místo podstatného jména ryba chtěli hledat sloveso ryba, můžete tak učinit pomocí značek. V tomto případě byste hledali fish_VERB.
Google na svých webových stránkách poskytuje kompletní seznam příkazů a další pokročilou dokumentaci pro použití s Ngram Viewer.
Sečteno podtrženo
Google Books Ngram Viewer vygeneruje graf, který představuje použití konkrétní fráze v knihách v průběhu času. Pokud jste zadali více než jedno slovo nebo frázi, každé z nich je reprezentováno barevně odlišenou čarou, která kontrastuje s ostatními hledanými výrazy. Je to podobné jako v Trendech Google, pouze vyhledávání pokrývá delší období.
Případová studie
Zvažte případovou studii octových koláčů. Jsou zmíněni v seriálu Malý dům Laury Ingalls Wilderové v prérii. Když se pomocí webového vyhledávání Google dozvíte více o octových koláčích, zjistíte, že jsou považovány za součást americké jižanské kuchyně a skutečně se připravují z octa. Vracejí se do dob, kdy ne každý měl přístup k čerstvým produktům v každém ročním období, ale je to celý příběh?
Vyhledejte v prohlížeči Google Ngram Viewer octový koláč a setkáte se s některými zmínkami o koláči na počátku i na konci 19. století, se spoustou zmínek ve 40. letech 20. století a se vzrůstajícím počtem zmínek v nedávné době. S úrovní vyhlazení 3 však uvidíte plošinu nad zmínkami v 19. století. Vzhledem k tomu, že za tu dobu nevyšlo mnoho knih a protože data jsou nastavena jako hladká, je obraz zkreslený. Pravděpodobně pouze jedna kniha zmiňovala octový koláč a byla zprůměrována, aby se zabránilo špičce. Nastavením vyhlazování na 0 můžete vidět, že je to přesně ten případ. Vrchol se soustředí na rok 1869 a další vrchol je v letech 1897 a 1900.
Je nepravděpodobné, že o octových koláčích po zbytek času nikdo nemluvil: Pravděpodobně se všude vznášely recepty, ale lidé o nich nepsali v knihách, a to je důležité omezení vyhledávání Ngram.