Kuidas Google Booksis kasutada Ngram Vieweri tööriista

Ngram, mida sageli nimetatakse ka N-grammiks, on teksti või kõnesisalduse statistiline analüüs, et leida tekstis mingi kirje n (arv). See võib olla igasuguseid asju, nagu fonemid, eesliited, fraasid või tähti. Kuigi N-gramm on mõnevõrra ebaselge teadlasest väljaspool, kasutatakse seda tegelikult paljudes valdkondades ja see mõjutab palju inimesi, kes teevad arvutiprogramme, mis mõistavad ja vastavad loodusliku rääkiva keelega. Lühidalt öeldes oleks Google huvi selle idee vastu.

Google Books Ngram Vieweri puhul analüüsitav tekst pärineb tohutul hulgal raamatutest, mida Google on avalikest raamatukogudest skanninud oma Google Booksi otsingumootori sisestamiseks. Google Books Ngram Vieweri jaoks viitavad nad tekstile, mida otsite "korpusena". Ngr Vieweri korporaal on jagatud keele järgi, ehkki saate eraldi analüüsida Briti ja Ameerika inglise keelt või koondada need kokku. Lõppkokkuvõttes on väga huvitav, et lülitaksid ingliskeelsete terminite kasutamisest Ameerika Ühendriikides ja vaata graafikuid.

Kuidas Ngram toimib

  1. Ava Google Books Ngram Viewer aadressil books.google.com/ngrams.
  2. Üksused on tõstutundlikud, erinevalt Google'i veebiotsingutest, nii et kindlasti kasutaksite ära õiged nimisõnad.
  3. Sisestage kõik fraasid või fraasid, mida soovite analüüsida. Kindlasti eraldage iga fraas komaga. Google soovitab Albert Einsteini, Sherlock Holmesi, Frankensteini alustada.
  4. Edasi sisestage kuupäevavahemik. Vaikimisi on 1800-2000, kuid on ka hiljutisi raamatuid (2011. aasta oli kõige uuem Google'i dokumentatsioon, mis võib olla muutunud.)
  5. Vali korpus. Võite otsida võõrkeelseid tekste või ingliskeelset teksti ning lisaks tavapärastele valikutele võite märgata ka allservas asju nagu "Inglise keel (2009)" või "Ameerika inglise keel (2009)". Need on vanemad ettevõtted, mida Google on ajakohastatuna uuendanud, kuid teil võib olla põhjust teha võrdlusi vanade andmekogumitega. Enamik kasutajaid saab neid ignoreerida ja keskenduda kõige värskematele korporatsioonidele.
  6. Määrake oma silumismäära. Smoothing tähendab, kui graafik on lõpuks sile. Kõige täpsem esitus oleks tasaseks 0, kuid seda võib olla raske lugeda. Vaikimisi on seatud 3. Enamikul juhtudel ei pea te seda korrigeerima.
  1. Vajutage nuppu Otsi palju raamatuid . (Samuti võite lihtsalt vajutada kirjele sisenemist otsinguaknas.)

Mis näitab Ngram?

Google Books Ngram Viewer väljastab graafiku, mis tähistab teatud fraasi kasutamist raamatutes aja jooksul. Kui olete sisestanud rohkem kui ühe sõna või fraasi, näete erinevatest otsinguterminitest erinevat värvi kodeeritud ridu. See on päris sarnane Google Trendidiga , ainult otsing hõlmab pikemat aega.

Siin on reaalne näide. Hiljuti olime uudishimulised äädika porgandid. Neid mainitakse Laura Ingallsi Wilderi väikeses majas Prairie seerias, kuid me pole kunagi sellist asja kuulnud. Kasutati esmakordselt Google'i veebiotsingut, et saada rohkem teavet äädika pirukate kohta. Ilmselt peetakse neid Ameerika lõunatööstuse osaks ja on tegelikult valmistatud äädikatest. Nad kuulevad seda korda, mil igaühel pole igal aastal värskeid tooteid. Kas see on kogu lugu?

Me otsisime Google Ngram Vieweri ja mõnedel mainetest on see pirukas nii 1800-ndate alguses kui ka hilisõhtul, palju mainisid 1940-ndatel aastatel ja viimastel aegadel on üha rohkem mainitud (võib-olla mõni nostalgia). Noh, on mõned probleem on andmete tasasel tasemel 3. Seal on platoo üle mainimist 1800. Kindlasti ei olnud viie aasta tagant võrdne arv ühe konkreetse pirukaid iga aasta kohta? Mis toimub, on sellepärast, et sel ajal ei ole palju raamatuid avaldatud ja kuna meie andmed on sujuvaks, moonutab see pilti. Tõenäoliselt oli üks raamat, mis mainis äädikas, ja selle keskmine oli ainult aurude vältimiseks. Seades silumiseks väärtuseks 0, näeme, et see on täpselt nii. Spike keskused on 1869, ja seal on veel üks auk, 1897 ja 1900.

Kas keegi ei räägi äädika porgud ülejäänud ajast? Nad ilmselt rääkisid neist pirukadest. Kogu kohale ujuvad retseptid . Nad lihtsalt ei kirjutanud neid raamatusse ja see on Ngrami otsingute piirang.

Advanced Ngram otsingud

Pea meeles, kuidas me ütlesime, et Ngrams võib koosneda igasugustest erinevatest tekstiotsingutest? Google lubab teil Ngram Vieweriga ka natuke puurida. Kui soovite kalade otsimiseks kasutada kalade asemel sõna, saate seda silte kasutades. Sel juhul otsisite "fish_VERB"

Google pakub täieliku nimekirja käskudest, mida saate oma veebisaidil kasutada, ja teistele täpsematele dokumentidele.