Google पुस्तकें में Ngram व्यूअर टूल का उपयोग कैसे करें

विषयसूची:

Google पुस्तकें में Ngram व्यूअर टूल का उपयोग कैसे करें
Google पुस्तकें में Ngram व्यूअर टूल का उपयोग कैसे करें
Anonim

क्या पता

  • गूगल बुक्स एनग्राम व्यूअर में, एक वाक्यांश टाइप करें, एक तिथि सीमा और कॉर्पस चुनें, चौरसाई स्तर सेट करें, और बहुत सारी किताबें खोजें। पर क्लिक करें।
  • आप डेटा में ड्रिल डाउन कर सकते हैं। उदाहरण के लिए, मछली के क्रिया रूप को खोजने के लिए, संज्ञा मछली के बजाय, एक टैग का उपयोग करें: fish_VERB. खोजें।
  • एनग्राम व्यूअर समय के साथ वाक्यांश के उपयोग का प्रतिनिधित्व करने वाला एक ग्राफ आउटपुट करता है। अनेक वाक्यांशों के लिए, प्रत्येक को एक रंग-कोडित रेखा द्वारा दर्शाया जाता है।

यह लेख बताता है कि अनुसंधान और शक्ति खोज करने के लिए Google पुस्तकें में Ngram व्यूअर टूल का उपयोग कैसे करें।

Image
Image

एनग्राम व्यूअर कैसे काम करता है

एनग्राम, जिसे एन-ग्राम भी कहा जाता है, पाठ में किसी प्रकार की वस्तु के n (एक संख्या) को खोजने के लिए पाठ या भाषण सामग्री का एक सांख्यिकीय विश्लेषण है।

खोज वस्तु सभी प्रकार की हो सकती है, जिसमें स्वर, उपसर्ग, वाक्यांश और अक्षर शामिल हैं। हालांकि एक एनग्राम अनुसंधान समुदाय के बाहर अस्पष्ट है, इसका उपयोग विभिन्न क्षेत्रों में किया जाता है और डेवलपर्स के लिए इसके बहुत सारे निहितार्थ हैं जो कंप्यूटर प्रोग्राम को कोड कर रहे हैं जो प्राकृतिक बोली जाने वाली भाषा को समझते हैं और प्रतिक्रिया करते हैं।

Google Books Ngram Viewer के मामले में, विश्लेषण किया जाने वाला पाठ सार्वजनिक डोमेन में बड़ी संख्या में पुस्तकों से आता है जिसे Google ने अपने Google पुस्तकें खोज इंजन को पॉप्युलेट करने के लिए स्कैन किया था। Google Books Ngram Viewer के लिए, Google उस पाठ के मुख्य भाग को संदर्भित करता है जिसे आप कॉर्पस के रूप में खोजने जा रहे हैं। Ngram व्यूअर भाषा के आधार पर एकत्रित होता है, हालांकि आप ब्रिटिश और अमेरिकी अंग्रेजी का अलग-अलग विश्लेषण कर सकते हैं या उन्हें एक साथ जोड़ सकते हैं।

  1. books.google.com/ngrams पर Google Books Ngram Viewer पर जाएं।
  2. कोई भी वाक्यांश या वाक्यांश टाइप करें जिसका आप विश्लेषण करना चाहते हैं। प्रत्येक वाक्यांश को अल्पविराम से अलग करें। Google आपको आरंभ करने के लिए "अल्बर्ट आइंस्टीन, शर्लक होम्स, फ्रेंकस्टीन" का सुझाव देता है।

    एनजीराम व्यूअर खोजों में, आइटम केस-संवेदी होते हैं, Google वेब खोजों के विपरीत।

  3. एक तिथि सीमा चुनें। डिफ़ॉल्ट 1800 से 2000 है।
  4. एक कोष चुनें। आप विदेशी भाषा के पाठ या अंग्रेजी पाठ खोज सकते हैं, और मानक विकल्पों के अलावा, आप सूची के निचले भाग में "अंग्रेजी (2009)" या "अमेरिकी अंग्रेजी (2009)" जैसी प्रविष्टियां देख सकते हैं। ये पुराने कॉरपोरा हैं जिन्हें Google ने अपडेट किया है, लेकिन आपके पास पुराने डेटा सेट के साथ तुलना करने का कोई कारण हो सकता है। अधिकांश उपयोगकर्ता उन्हें अनदेखा कर सकते हैं और नवीनतम निगम पर ध्यान केंद्रित कर सकते हैं।
  5. स्मूदिंग लेवल सेट करें। स्मूथिंग से तात्पर्य है कि ग्राफ़ अंत में कितना चिकना है। सबसे सटीक प्रतिनिधित्व 0 के एक चौरसाई स्तर को दर्शाता है, लेकिन उस सेटिंग को पढ़ना मुश्किल हो सकता है। डिफ़ॉल्ट 3 पर सेट है। ज्यादातर मामलों में, आपको इसे समायोजित करने की आवश्यकता नहीं है।

  6. प्रेस ढेर सारी किताबें खोजें।

गूगल के एनग्राम व्यूअर का उपयोग करके, आप डेटा में ड्रिल-डाउन कर सकते हैं। यदि आप संज्ञा मछली के बजाय क्रिया मछली की खोज करना चाहते हैं, तो आप टैग का उपयोग करके ऐसा कर सकते हैं। इस मामले में, आप fish_VERB की खोज करेंगे।

Google अपनी वेबसाइट पर Ngram व्यूअर के साथ उपयोग के लिए अन्य उन्नत दस्तावेज़ीकरण आदेशों की पूरी सूची प्रदान करता है।

नीचे की रेखा

Google Books Ngram Viewer एक ग्राफ़ आउटपुट करता है जो समय के साथ किताबों में किसी विशेष वाक्यांश के उपयोग को दर्शाता है। यदि आपने एक से अधिक शब्द या वाक्यांश दर्ज किए हैं, तो प्रत्येक को अन्य खोज शब्दों के विपरीत रंग-कोडित रेखा द्वारा दर्शाया जाता है।यह Google Trends के समान है, केवल खोज लंबी अवधि को कवर करती है।

केस स्टडी

विनेगर पाई के केस स्टडी पर विचार करें। प्रेयरी श्रृंखला पर लौरा इंगल्स वाइल्डर के लिटिल हाउस में उनका उल्लेख किया गया है। सिरका पाई के बारे में अधिक जानने के लिए Google की वेब खोज के साथ खोज करने से पता चलता है कि उन्हें अमेरिकी दक्षिणी व्यंजनों का हिस्सा माना जाता है और वास्तव में सिरका के साथ बनाया जाता है। उन्होंने उस समय की बात सुनी जब साल के हर समय हर किसी के पास ताजा उपज तक पहुंच नहीं थी, लेकिन क्या यह पूरी कहानी है?

विनेगर पाई के लिए Google Ngram Viewer खोजें, और आप 1800 के दशक के प्रारंभ और अंत में पाई के कुछ उल्लेखों का सामना करेंगे, 1940 के दशक में बहुत सारे उल्लेख और हाल के दिनों में उल्लेखों की बढ़ती संख्या। हालाँकि, 3 के स्मूथिंग स्तर के साथ, आप 1800 के दशक में उल्लेखों पर एक पठार देखते हैं। क्योंकि उस दौरान बहुत सारी किताबें प्रकाशित नहीं हुई थीं और क्योंकि डेटा सुचारू रूप से सेट है, चित्र विकृत है। संभवतः केवल एक पुस्तक में सिरका पाई का उल्लेख है, और इसे स्पाइक से बचने के लिए औसत किया गया था।स्मूथिंग को 0 पर सेट करके, आप देख सकते हैं कि ठीक यही स्थिति है। 1869 में स्पाइक केंद्र, और 1897 और 1900 में एक और स्पाइक है।

यह संभावना नहीं है कि बाकी समय किसी ने सिरका पाई के बारे में बात नहीं की: शायद सभी जगह व्यंजन तैर रहे थे, लेकिन लोगों ने उनके बारे में किताबों में नहीं लिखा था, और यह एनग्राम खोजों की एक महत्वपूर्ण सीमा है।

सिफारिश की: