Hoe om die Ngram-kykernutsding in Google Books te gebruik

INHOUDSOPGAWE:

Hoe om die Ngram-kykernutsding in Google Books te gebruik
Hoe om die Ngram-kykernutsding in Google Books te gebruik
Anonim

Wat om te weet

  • In die Google Books Ngram Viewer, tik 'n frase, kies 'n datumreeks en korpus, stel die gladmaakvlak in en klik Search baie boeke.
  • Jy kan in die data deurboor. Byvoorbeeld, om na die werkwoordvorm van vis te soek, in plaas van die selfstandige naamwoord vis, gebruik 'n merker: soek vir fish_VERB.
  • Ngram Viewer voer 'n grafiek uit wat die frase se gebruik deur die tyd verteenwoordig. Vir veelvuldige frases word elkeen deur 'n kleurgekodeerde lyn voorgestel.

Hierdie artikel verduidelik hoe om die Ngram Viewer-nutsding in Google Books te gebruik om navorsing en groot soektogte uit te voer.

Image
Image

Hoe die Ngram-kyker werk

'n Ngram, ook genoem 'n N-gram, is 'n statistiese ontleding van teks- of spraakinhoud om n ('n getal) van 'n soort item in die teks te vind.

Die soekitem kan allerhande dinge wees, insluitend foneme, voorvoegsels, frases en letters. Alhoewel 'n Ngram buite die navorsingsgemeenskap obskuur is, word dit in 'n verskeidenheid velde gebruik en het dit baie implikasies vir ontwikkelaars wat rekenaarprogramme kodeer wat natuurlike gesproke taal verstaan en daarop reageer.

In die geval van die Google Books Ngram Viewer, kom die teks wat ontleed moet word van die groot aantal boeke in die publieke domein wat Google geskandeer het om sy Google Books-soekenjin te vul. Vir Google Books Ngram Viewer verwys Google na die liggaam van teks wat jy gaan soek as die korpus. Die Ngram Viewer versamel volgens taal, alhoewel jy Britse en Amerikaanse Engels afsonderlik kan ontleed of saamvoeg.

  1. Gaan na Google Books Ngram Viewer by books.google.com/ngrams.
  2. Tik enige frase of frases wat jy wil ontleed. Skei elke frase met 'n komma. Google stel voor, "Albert Einstein, Sherlock Holmes, Frankenstein" om jou aan die gang te kry.

    In NGram Viewer-soektogte is items hooflettergevoelig, anders as in Google-websoektogte.

  3. Kies 'n datumreeks. Die verstek is 1800 tot 2000.
  4. Kies 'n korpus. Jy kan vreemde ta altekste of Engelse tekste deursoek, en benewens die standaardkeuses, sal jy dalk inskrywings soos "Engels (2009)" of "American English (2009)" onderaan die lys sien. Dit is ouer korpusse wat Google sedertdien opgedateer het, maar jy het dalk rede om jou vergelykings met ou datastelle te tref. Die meeste gebruikers kan hulle ignoreer en fokus op die mees onlangse korpus.
  5. Stel die gladmaakvlak. Gladmaking verwys na hoe glad die grafiek aan die einde is. Die mees akkurate voorstelling weerspieël 'n gladvlak van 0, maar daardie instelling kan moeilik wees om te lees. Die verstek is op 3 gestel. In die meeste gevalle hoef jy dit nie aan te pas nie.

  6. Druk Soek baie boeke.

Deur Google se Ngram Viewer te gebruik, kan jy in die data deurboor. As jy die werkwoord vis in plaas van die selfstandige naamwoord vis wil soek, kan jy dit doen deur etikette te gebruik. In hierdie geval sal jy vir fish_VERB soek.

Google verskaf 'n volledige lys van opdragte ander gevorderde dokumentasie vir gebruik met Ngram Viewer op sy webwerf.

Onderste reël

Google Books Ngram-kyker voer 'n grafiek uit wat die gebruik van 'n spesifieke frase in boeke deur die tyd verteenwoordig. As jy meer as een woord of frase ingevoer het, word elkeen deur 'n kleurgekodeerde lyn voorgestel om met die ander soekterme te kontrasteer. Dit is soortgelyk aan Google Trends, net die soektog dek 'n langer tydperk.

Gevallestudie

Oorweeg die gevallestudie van asynpasteie. Hulle word genoem in Laura Ingalls Wilder se Little House on the Prairie-reeks. Deur met Google se websoektog te verken om meer oor asynpasteie te wete te kom, blyk dit dat dit as deel van die Amerikaanse suidelike kookkuns beskou word en inderdaad met asyn gemaak word. Hulle luister terug na tye toe nie almal te alle tye van die jaar toegang tot vars produkte gehad het nie, maar is dit die hele storie?

Soek Google Ngram Viewer vir asynpastei, en jy sal 'n paar meldings van die pastei teëkom in beide die vroeë en laat 1800's, baie meldings in die 1940's, en 'n toenemende aantal meldings in onlangse tye. Met 'n gladde vlak van 3 sien jy egter 'n plato oor die vermeldings in die 1800's. Omdat daar nie baie boeke gedurende daardie tyd gepubliseer is nie en omdat die data glad gestel is, is die prentjie verwronge. Seker net een boek het asynpastei genoem, en dit was gemiddeld om 'n piek te vermy. Deur die gladmaak op 0 te stel, kan jy sien dat dit presies die geval is. Die punt sentreer op 1869, en daar is nog 'n styging in 1897 en 1900.

Dit is onwaarskynlik dat niemand die res van die tyd oor asynpasteie gepraat het nie: Daar was seker resepte wat oral rondgedryf het, maar mense het nie daaroor in boeke geskryf nie, en dit is 'n belangrike beperking van Ngram-soektogte.

Aanbeveel: