Google Books-та Ngram Viewer құралын пайдалану жолы

Мазмұны:

Google Books-та Ngram Viewer құралын пайдалану жолы
Google Books-та Ngram Viewer құралын пайдалану жолы
Anonim

Не білу керек

  • Google Books Ngram Viewer қолданбасында сөз тіркесін теріңіз, күндер ауқымы мен корпусты таңдаңыз, тегістеу деңгейін орнатыңыз және Көп кітаптарды іздеу түймесін басыңыз.
  • Деректерді тереңдете аласыз. Мысалы, балық есімдігінің орнына балық етістік түрін іздеу үшін тегті пайдаланыңыз: fish_VERB. деп іздеңіз.
  • Ngram Viewer фразаның уақыт бойынша қолданылуын көрсететін графикті шығарады. Бірнеше фразалар үшін әрқайсысы түспен кодталған сызықпен көрсетіледі.

Бұл мақалада Google Books қызметіндегі Ngram Viewer құралын зерттеу және қуатты іздеу үшін қалай пайдалану керектігі түсіндіріледі.

Image
Image

Ngram Viewer қалай жұмыс істейді

Ngram, N-gram деп те аталады, мәтіндегі қандай да бір элементтің n (санын) табу үшін мәтін немесе сөйлеу мазмұнын статистикалық талдау болып табылады.

Іздеу элементі фонемалар, префикстер, фразалар және әріптерді қоса алғанда, барлық нәрселер болуы мүмкін. Ngram зерттеу қауымдастығынан тыс түсініксіз болғанымен, ол әртүрлі салаларда қолданылады және табиғи сөйлеу тілін түсінетін және оған жауап беретін компьютерлік бағдарламаларды кодтаушы әзірлеушілерге көп әсер етеді.

Google Books Ngram Viewer жағдайында талданатын мәтін Google өзінің Google Books іздеу жүйесін толтыру үшін Google сканерлеген қоғамдық домендегі кітаптардың үлкен санынан алынады. Google Books Ngram Viewer үшін Google корпус ретінде іздейтін мәтіннің негізгі бөлігін білдіреді. Ngram Viewer тілі бойынша біріктіреді, бірақ сіз британдық және американдық ағылшын тілін бөлек талдай аласыз немесе оларды біріктіре аласыз.

  1. books.google.com/ngrams сайтындағы Google Books Ngram Viewer қолданбасына өтіңіз.
  2. Талдағыңыз келетін кез келген сөз тіркесін немесе сөз тіркесін теріңіз. Әрбір сөз тіркесін үтірмен бөліңіз. Google сізге бастау үшін "Альберт Эйнштейн, Шерлок Холмс, Франкенштейн" деп ұсынады.

    NGram Viewer іздеулерінде, Google веб-іздеулерінен айырмашылығы, элементтер регистрді ескереді.

  3. Күндер ауқымын таңдаңыз. Әдепкі 1800-2000.
  4. Корпусты таңдаңыз. Сіз шет тіліндегі мәтіндерді немесе ағылшын тіліндегі мәтіндерді іздей аласыз және стандартты таңдауларға қосымша тізімнің төменгі жағында «Ағылшын тілі (2009)» немесе «Американдық ағылшын тілі (2009)» сияқты жазбаларды байқауыңыз мүмкін. Бұл Google кейін жаңартылған ескі корпустар, бірақ сізде ескі деректер жиынымен салыстыру үшін қандай да бір себептер болуы мүмкін. Көптеген пайдаланушылар оларды елемей, ең соңғы корпусқа назар аудара алады.
  5. Тегістеу деңгейін орнатыңыз. Тегістеу графиктің соңында қаншалықты тегіс екенін білдіреді. Ең дәл көрсету 0 тегістеу деңгейін көрсетеді, бірақ бұл параметрді оқу қиын болуы мүмкін. Әдепкі 3 мәніне орнатылған. Көп жағдайда оны реттеу қажет емес.

  6. Бас Көп кітаптар іздеу.

Google-дың Ngram Viewer қолданбасын пайдаланып, деректерге тереңірек үңілуге болады. Егер сіз fish зат есімінің орнына fish етістігін іздегіңіз келсе, оны тегтерді пайдалану арқылы жасауға болады. Бұл жағдайда сіз fish_VERB деп іздейсіз.

Google өз веб-сайтында Ngram Viewer қолданбасымен пайдалануға арналған басқа кеңейтілген құжаттамалардың толық тізімін ұсынады.

Төменгі жол

Google Books Ngram Viewer уақыт бойынша кітаптардағы белгілі бір фразаны пайдалануды көрсететін графикті шығарады. Бірнеше сөз немесе сөз тіркесін енгізсеңіз, олардың әрқайсысы басқа іздеу шарттарына қарама-қайшы болу үшін түспен кодталған сызықпен көрсетіледі. Бұл Google Trends-ке ұқсас, тек іздеу ұзағырақ кезеңді қамтиды.

Жағдайлық зерттеу

Сірке суы бар пирогтардың жағдайын қарастырайық. Олар Лаура Ингаллс Уайлдердің «Прейридегі кішкентай үй» сериясында айтылған. Сірке суы бар пирогтар туралы көбірек білу үшін Google веб-іздестіру арқылы зерттеу олардың американдық оңтүстік тағамдарының бөлігі болып саналатынын және шынымен сірке суымен жасалғанын көрсетеді. Олар жылдың кез келген уақытында жаңа өнімге әркімнің қолы жете бермейтін кездерді тыңдайды, бірақ бұл оқиғаның бәрі осы ма?

Google Ngram Viewer қолданбасында сірке суы бар пирогты іздеңіз, сонда сіз пирог туралы 1800-ші жылдардың басында да, соңында да, 1940-шы жылдары көп айтылғандарды және соңғы уақытта айтылғандардың көбейгенін кездестіресіз. Дегенмен, тегістеу деңгейі 3 болғанда, сіз 1800-ші жылдардағы айтылғандардың үстінен үстіртті көресіз. Сол уақыт ішінде көп кітап жарық көрмегендіктен және деректер тегіс етіп орнатылғандықтан, сурет бұрмаланған. Мүмкін, тек бір кітапта сірке суы бар пирог туралы айтылған және оның өсуін болдырмау үшін орташа алынған. Тегістеуді 0-ге орнату арқылы сіз дәл солай екенін көре аласыз. Төбенің ортасы 1869 жылы, ал тағы бір өсу 1897 және 1900 жылдары болды.

Қалған уақытта сірке суы бар пирогтар туралы ешкім айтпауы екіталай: Барлық жерде қалқып тұрған рецепттер болған шығар, бірақ адамдар олар туралы кітаптарда жазбаған және бұл Ngram іздеулерінің маңызды шектеуі.

Ұсынылған: