Google का हम टू सर्च फीचर कैसे काम करता है

विषयसूची:

Google का हम टू सर्च फीचर कैसे काम करता है
Google का हम टू सर्च फीचर कैसे काम करता है
Anonim

मुख्य तथ्य

  • Google ने एक नया टूल लॉन्च किया है जो उपयोगकर्ताओं को गुनगुना, गायन या सीटी बजाकर गाने खोजने की अनुमति देता है।
  • नया टूल लगातार अपडेट किए जाने वाले आधे मिलियन से अधिक गानों के डेटाबेस के साथ हम्ड ट्रैक का मिलान करने के लिए मशीन लर्निंग का उपयोग करता है।
  • Google उपयोगकर्ता पूछते हैं कि कौन सा गाना हर महीने लगभग 100 बार बज रहा है।
Image
Image

Google ने एक निराशाजनक समस्या को हल करने के लिए "हम टू सर्च" नामक एक नई सुविधा शुरू की है: एक गाना आपके दिमाग में अटका हुआ है और यह पता लगाने में सक्षम नहीं है कि इसे क्या कहा जाता है।

गीत खोजने के लिए गुनगुनाने का विचार अविश्वसनीय रूप से सरल लगता है, तो Google केवल 2020 में ही इस सुविधा को क्यों लॉन्च कर रहा है? खैर, यह पता चला है कि इस तरह से गानों की पहचान करना वास्तव में बहुत जटिल है, क्योंकि हमारे गुनगुने संस्करण मूल ट्रैक से काफी अलग होते हैं। अपने AI ब्लॉग पर हाल ही में एक पोस्ट में, Google बताता है कि कैसे उसने इस समस्या को ठीक करने के लिए मशीन लर्निंग का उपयोग किया, और अंततः लोगों को गुनगुना, सीटी बजाकर, या राग गाकर एक गीत खोजने में मदद की, भले ही उनका गायन सटीक से कम हो।

"हम टू सर्च के लिए हमारा ध्यान लोगों को उनके दिमाग में फंसे संगीत को पहचानने और खोजने में मदद करने पर है," एक Google प्रवक्ता ने लाइफवायर को एक ईमेल में बताया।

बस गुनगुनाना शुरू करें

Google उपयोगकर्ता पूछते हैं कि कौन सा गाना हर महीने लगभग 100 मिलियन बार बज रहा है, Google के उपाध्यक्ष और उपभोक्ता खरीदारी के महाप्रबंधक अपर्णा चेन्नाप्रगदा ने कई नई खोज सुविधाओं को पेश करते हुए एक वीडियो कहा। अब इसका पता लगाने का एक तरीका है।

"हम टू सर्च" फीचर को गूगल के मोबाइल ऐप, गूगल सर्च विजेट और गूगल असिस्टेंट में बनाया गया है। ऐप के माध्यम से इसे एक्सेस करने के लिए, माइक्रोफ़ोन आइकन टैप करें और कहें "यह गाना क्या है?" "एक गीत खोजें" बटन का चयन करना भी काम करता है।

सही ढंग से काम करने के लिए, सुविधा के लिए आपको कम से कम 10-15 सेकंड के लिए गुनगुना करना होगा। Android उपयोगकर्ता 20 से अधिक भाषाओं में गाने खोजने के लिए गुनगुना सकते हैं, जबकि केवल अंग्रेजी गाने iPhone पर काम करते हैं। टूल हमेशा किसी गीत को तुरंत पहचानने में सक्षम नहीं होता है, लेकिन एक बार ऐसा हो जाने पर, परिणाम बहुत अच्छे होते हैं।

"वेरिएबल के विस्तृत सेट (टोन, पिच, वॉल्यूम, आदि) के आधे से अधिक गाने हमारे एल्गोरिदम द्वारा पहचाने जाते हैं, लेकिन निश्चित रूप से, सटीकता गुनगुनाने की गुणवत्ता पर निर्भर करती है, के प्रकार गीत, और बहुत कुछ, " Google के प्रवक्ता ने एक ईमेल में लाइफवायर को बताया। "लेकिन एक बार इसकी पहचान हो जाने के बाद, पाँच में से लगभग चार उत्तर सही होते हैं।"

यह पहली बार नहीं है जब किसी संगीत पहचान ऐप में गुनगुनाहट का इस्तेमाल किया गया है।साउंडहाउंड एक समान सुविधा प्रदान करता है, जैसा कि सीएनएन बिजनेस द्वारा नोट किया गया है, और यह एंड्रॉइड और आईओएस पर भी उपलब्ध है। Google के प्रवक्ता के अनुसार, नई सुविधा किसी भी गोपनीयता संबंधी चिंताओं को नहीं उठाती है, न ही यह "Google के ऑडियो-आधारित इंटरैक्शन को संभालने के तरीके को बदल देती है," उन्होंने एक ईमेल में Lifewire को बताया।

मशीन लर्निंग

अवधारणा की सादगी के बावजूद, स्टूडियो रिकॉर्डिंग को खोजने के लिए एक धुन गुनगुनाना तकनीकी रूप से काफी कठिन है। इसके कई कारण हैं, 12 नवंबर के ब्लॉग पोस्ट में Google रिसर्च के क्रिश्चियन फ्रैंक बताते हैं। सबसे पहले, गीत का एक गुनगुना संस्करण वास्तविक रिकॉर्डिंग से बहुत भिन्न हो सकता है, जिससे दोनों का मिलान करना मुश्किल हो जाता है। इसलिए, जबकि शाज़म और कई अन्य ऐप्स पहले से ही उस गीत की पहचान करने के लिए मौजूद हैं जिसे आप किसी रेस्तरां या अन्य सार्वजनिक स्थान पर सुनते हैं, उस खोज के आधार के रूप में एक गुनगुना संगीत का उपयोग करना मुश्किल हो सकता है।

"गीत, पार्श्व स्वर और वाद्ययंत्रों के साथ, एक संगीत या स्टूडियो रिकॉर्डिंग का ऑडियो एक गुनगुनाती धुन से काफी अलग हो सकता है," फ्रैंक लिखते हैं।"गलती या डिजाइन से, जब कोई किसी गीत की व्याख्या गुनगुनाता है, तो अक्सर पिच, की, टेम्पो या लय में थोड़ा या यहां तक कि काफी अंतर हो सकता है।"

Image
Image

चूंकि गानों के गुनगुने संस्करण मूल से इतने अलग हो सकते हैं, फ्रैंक नोट करते हैं कि कई पिछली विधियों के लिए किसी व्यक्ति के गुनगुनाते हुए गाने के एक संस्करण के साथ मिलान करने की आवश्यकता होती है जिसमें केवल एक राग होता है, या एक ट्रैक जिसमें गुनगुना होता है। इसने वास्तविक दुनिया के उपयोग के मामलों को चुनौतीपूर्ण बना दिया है, क्योंकि उन गानों के डेटाबेस सीमित हो सकते हैं और उन्हें मैन्युअल रूप से अपडेट करने की आवश्यकता होती है।

Google बताता है कि हम टू सर्च फीचर के लिए, यह ऑडियो को "नंबर-आधारित अनुक्रम" में बदलने के लिए मशीन लर्निंग मॉडल का उपयोग करता है जो गीत के माधुर्य का प्रतिनिधित्व करता है-जो कहता है उसे "फिंगरप्रिंट" के रूप में सोचा जा सकता है ।"

अधिक उपयोगकर्ता के अनुकूल

Google के हम टू सर्च फीचर में मशीन लर्निंग का उपयोग अंततः टूल को वास्तविक दुनिया में उपयोग करना बहुत आसान बना देता है।क्योंकि हम टू सर्च वास्तविक गीत के साथ खोजकर्ता की गुनगुनी धुन से मेल खाता है, यह टूल नए गानों के साथ काम करने में सक्षम है क्योंकि वे एक डेटाबेस के बजाय रिलीज़ होते हैं जिसे लगातार प्रत्येक ट्रैक के गुनगुने संस्करणों के साथ अपडेट करने की आवश्यकता होती है। साथ ही, आपको इसका उपयोग करने के लिए सही पिच की आवश्यकता नहीं है।

"मौजूदा सिस्टम एक गीत डेटाबेस पर उच्च स्तर की सटीकता तक पहुंचता है जिसमें आधा मिलियन से अधिक गाने होते हैं जिन्हें हम लगातार अपडेट कर रहे हैं," Google ने अपने हम टू सर्च घोषणा में कहा। "इस गीत कॉर्पस में अभी भी दुनिया की कई धुनों को शामिल करने के लिए बढ़ने की गुंजाइश है।"

सिफारिश की: