Sådan bruger du Ngram Viewer-værktøjet i Google Bøger

Indholdsfortegnelse:

Sådan bruger du Ngram Viewer-værktøjet i Google Bøger
Sådan bruger du Ngram Viewer-værktøjet i Google Bøger
Anonim

Hvad du skal vide

  • I Google Books Ngram Viewer skal du skrive en sætning, vælge et datointerval og korpus, indstille udjævningsniveauet og klikke på Søg i mange bøger.
  • Du kan bore ned i dataene. Hvis du f.eks. vil søge efter verbumsformen for fisk, skal du bruge et tag i stedet for navneordet fisk: søg efter fish_VERB.
  • Ngram Viewer udsender en graf, der repræsenterer sætningens brug gennem tiden. For flere sætninger er hver repræsenteret af en farvekodet linje.

Denne artikel forklarer, hvordan du bruger Ngram Viewer-værktøjet i Google Bøger til at udføre research og omfattende søgninger.

Image
Image

Sådan fungerer Ngram Viewer

Et Ngram, også kaldet et N-gram, er en statistisk analyse af tekst- eller taleindhold for at finde n (et tal) af en slags element i teksten.

Søgeemnet kan være alle mulige ting, inklusive fonemer, præfikser, sætninger og bogstaver. Selvom et Ngram er uklart uden for forskersamfundet, bruges det på en række forskellige områder og har mange implikationer for udviklere, der koder computerprogrammer, der forstår og reagerer på naturligt talesprog.

I tilfældet med Google Books Ngram Viewer kommer teksten, der skal analyseres, fra det store antal bøger i det offentlige domæne, som Google scannede for at udfylde sin Google Books-søgemaskine. For Google Books Ngram Viewer refererer Google til den tekst, du vil søge efter, som korpus. Ngram Viewer samles efter sprog, selvom du kan analysere britisk og amerikansk engelsk separat eller klumpe dem sammen.

  1. Gå til Google Books Ngram Viewer på books.google.com/ngrams.
  2. Skriv enhver sætning eller sætninger, du vil analysere. Adskil hver sætning med et komma. Google foreslår "Albert Einstein, Sherlock Holmes, Frankenstein" for at komme i gang.

    I NGram Viewer-søgninger skelnes der mellem store og små bogstaver i elementer i modsætning til Google-websøgninger.

  3. Vælg et datointerval. Standard er 1800 til 2000.
  4. Vælg et korpus. Du kan søge i fremmedsprogede tekster eller engelske tekster, og ud over standardvalgene kan du muligvis bemærke indgange som "English (2009)" eller "American English (2009)" nederst på listen. Disse er ældre korpus, som Google siden har opdateret, men du kan have en eller anden grund til at foretage dine sammenligninger med gamle datasæt. De fleste brugere kan ignorere dem og fokusere på de seneste korpus.
  5. Indstil udjævningsniveauet. Udjævning henviser til, hvor glat grafen er i slutningen. Den mest nøjagtige repræsentation afspejler et udjævningsniveau på 0, men denne indstilling kan være svær at læse. Standarden er sat til 3. I de fleste tilfælde behøver du ikke at justere den.

  6. Tryk Søg i mange bøger.

Ved at bruge Googles Ngram Viewer kan du gå i dybden med dataene. Hvis du gerne vil søge efter verbet fisk i stedet for navneordet fisk, kan du gøre det ved at bruge tags. I dette tilfælde skal du søge efter fish_VERB.

Google leverer en komplet liste over kommandoer anden avanceret dokumentation til brug med Ngram Viewer på sin hjemmeside.

Bundlinje

Google Books Ngram Viewer udsender en graf, der repræsenterer brugen af en bestemt sætning i bøger gennem tiden. Hvis du har indtastet mere end ét ord eller en sætning, er hver af dem repræsenteret af en farvekodet linje for at kontrastere med de andre søgetermer. Dette ligner Google Trends, kun søgningen dækker en længere periode.

Case Study

Overvej casestudiet af eddiketærter. De er nævnt i Laura Ingalls Wilders Little House on the Prairie-serien. Udforskning med Googles websøgning for at lære mere om eddiketærter afslører, at de betragtes som en del af det amerikanske sydlige køkken og faktisk er lavet med eddike. De lytter tilbage til tider, hvor ikke alle havde adgang til friske råvarer på alle tider af året, men er det hele historien?

Søg i Google Ngram Viewer efter eddiketærte, og du vil støde på nogle omtaler af tærten i både begyndelsen og slutningen af 1800-tallet, mange omtaler i 1940'erne og et stigende antal omtaler i nyere tid. Men med et udjævningsniveau på 3 ser man et plateau over omtalen i 1800-tallet. Fordi der ikke blev udgivet mange bøger i løbet af den tid, og fordi dataene er indstillet til at glatte, er billedet forvrænget. Sandsynligvis kun én bog nævnte eddike tærte, og det var gennemsnittet for at undgå en spids. Ved at sætte udjævningen til 0 kan man se, at det netop er tilfældet. Piggen er centreret om 1869, og der er endnu en spids i 1897 og 1900.

Det er usandsynligt, at ingen t alte om eddiketærter resten af tiden: Der var sikkert opskrifter, der flød over alt, men folk skrev ikke om dem i bøger, og det er en vigtig begrænsning af Ngram-søgninger.

Anbefalede: