धाराप्रवाह आवाज की पहचान कैसे तेज, सटीक और निजी रहती है

विषयसूची:

धाराप्रवाह आवाज की पहचान कैसे तेज, सटीक और निजी रहती है
धाराप्रवाह आवाज की पहचान कैसे तेज, सटीक और निजी रहती है
Anonim

मुख्य तथ्य

  • धाराप्रवाह एक गोपनीयता का सम्मान करने वाला, सुपर-फास्ट वॉयस रिकग्निशन इंजन है जिसे इंटरनेट कनेक्शन की आवश्यकता नहीं है।
  • इसे लगभग किसी भी डिवाइस में एम्बेड किया जा सकता है।
  • यह किसी भी भाषा में काम करता है।
Image
Image

Fluent.ai एक वर्चुअल वॉयस रिकग्निशन इंजन है जो आपके कमांड को इंटरनेट पर नहीं भेजता है, लगभग तुरंत काम करता है, किसी भी भाषा में काम कर सकता है, और इतना छोटा है कि इसे सस्ते, कम में भी बनाया जा सकता है उदाहरण के लिए, फिटनेस घड़ी जैसे पावर डिवाइस।

सिरी और एलेक्सा के विपरीत, फ्लुएंट एक आत्मनिर्भर सहायक है जो आपको तुरंत समझता है और आपसे सीखता है इसलिए जितना अधिक आप इसका उपयोग करते हैं उतना बेहतर होता जाता है। इसमें नियमित आभासी सहायकों की गहराई नहीं है, लेकिन इसका मतलब यह नहीं है। इसके बजाय, यह Apple, Amazon और Google के प्रयासों की तुलना में तेज़, अधिक सटीक और अधिक निजी है।

"स्पीच टू टेक्स्ट प्राकृतिक भाषा प्रसंस्करण का उपयोग करता है, और फिर आशय प्राप्त करता है," फ़्लुएंट सीईओ प्रोबल लाला ने जूम साक्षात्कार के दौरान लाइफवायर को बताया। "इसके लिए बहुत सारे डेटा, और बहुत सारी प्रोसेसिंग पावर की आवश्यकता होती है। धाराप्रवाह सीधे भाषण से इरादे तक जाता है, आपकी आवाज लेता है और इसे सीधे एक क्रिया में परिवर्तित करता है।"

नीचे की रेखा

धाराप्रवाह आवाज नियंत्रण सॉफ्टवेयर है। यह आपके आदेश को सुनकर काम करता है और केवल आवश्यक संज्ञाओं और क्रियाओं को छोड़कर उन सभी शब्दों को हटा देता है जिनकी इसकी आवश्यकता नहीं है। "रोशनी बुझा दो," बस बाहर हो जाता है और रोशनी हो जाती है। आवश्यक तत्वों को एक गन्दा मानवीय वाक्य से हटा दिया जाता है और चरणों में बदल दिया जाता है।यह लगभग एक कंप्यूटर प्रोग्रामिंग की तरह है, एक जटिल विचार को निर्देशों के सबसे सरल सेट में बदल देता है।

इसका उपयोग किस लिए किया जा सकता है?

धाराप्रवाह किसी भी चीज के लिए इस्तेमाल किया जा सकता है। कुंजी यह है कि इसे एक विशिष्ट स्थिति के लिए प्रशिक्षित किया जाता है। एक स्मार्ट घड़ी के साथ, उदाहरण के लिए, इसे फिटनेस, या होम ऑटोमेशन, कैलेंडर और टाइमर निर्माण आदि के लिए कमांड में प्रशिक्षित किया जा सकता है। डेटाबेस को सीमित करने से सब कुछ अधिक केंद्रित हो जाता है और यह तेज़ रहता है।

"मामले की सच्चाई यह है कि वियरेबल्स के साथ, आप बातचीत करना नहीं चाह रहे हैं," लाला ने कहा, "मैं चाहता हूं कि शायद मेरी पसंदीदा व्यायाम दिनचर्या शुरू हो, और मैं इसे बहुत जल्दी चाहता हूं।"

गति और सटीकता ही संपूर्ण बिंदु हैं। लाइट को चालू और बंद करने में मिलीसेकंड का समय लगता है, इसके बजाय सिरी को क्लाउड पर आपकी आवाज भेजने के लिए प्रतीक्षा करने के लिए, इसके संसाधित होने की प्रतीक्षा करें, फिर-सेकंड बाद में-लाइट बंद होने पर।

यह संकीर्ण प्रशिक्षण ऐप के आकार को भी कम रखता है। पिछले साल, Google ने अपने सहायक का एक डाउनलोड करने योग्य, ऑफ़लाइन संस्करण प्रदान किया था। 85 मेगाबाइट के लाला कहते हैं, यह केवल अंग्रेजी में काम करता था, और इसे प्रशिक्षित करने में छह महीने का समय लगा।

"हमारे पास 13,000 कमांड के साथ काम करने वाला एक मॉडल है और यह 500 किलोबाइट में काम करता है," उन्होंने कहा।

नीचे की रेखा

ऑफ़लाइन वॉयस रिकग्निशन इंजन का दूसरा फायदा गोपनीयता है। एक बच्चे की स्मार्ट घड़ी में, उदाहरण के लिए, "आप नहीं चाहते कि बच्चे की आवाज़ बादल पर जाए," लाला कहते हैं। वास्तव में, Fluent उन उपकरणों के अंदर काम कर सकता है जो कभी भी इंटरनेट से कनेक्ट नहीं होते हैं। यह न केवल गोपनीयता के लिए अच्छा है, बल्कि सुरक्षा के लिए भी अच्छा है। आप अनुसंधान प्रयोगशालाओं, सैन्य प्रतिष्ठानों, और सेल फोन और कैमरों पर प्रतिबंध लगाने वाले अन्य स्थानों के अंदर एक ऑफ़लाइन आवाज पहचान इंजन का उपयोग कर सकते हैं।

सीमा

बेशक, इस मॉडल में कुछ कमियां हैं। एक यह है कि कमांड को बाद में नहीं जोड़ा जा सकता है। एक बार प्रारंभिक प्रशिक्षण पूरा हो जाने के बाद, बस। न ही आपका फ़्लुएंट-आधारित सहायक आपके लिए इंटरनेट पर चीजों को देख सकता है-खेल स्कोर, उस अभिनेता को जिसे आप उस फिल्म में पहचानते हैं, लेकिन बस जगह नहीं दे सकते, और इसी तरह।

Image
Image

इसके बजाय, सिस्टम यह पहचानने के लिए पर्याप्त स्मार्ट है कि यह कब मदद नहीं कर सकता है और यह अनुरोध को किसी ऐसी चीज़ को सौंप देगा जो कर सकती है। यदि आप अपनी घड़ी से मौसम के पूर्वानुमान के लिए पूछते हैं, तो धाराप्रवाह को पता चल जाएगा कि यह समझ में नहीं आता है। "फिर यह एक ऐसी सेवा को कॉल करेगा जो घड़ी में पहले से प्रोग्राम की गई है, चाहे वह अमेज़ॅन की एलेक्सा हो या Google, और फिर क्लाउड पर कॉल करें," उत्तर पाने के लिए आपके कच्चे वॉयस कमांड को पास करते हुए।

यह हाइब्रिड दृष्टिकोण एक स्थानीय, ऑफ़लाइन सहायक की गति को बैकअप के रूप में एलेक्सा या Google सहायक की शक्ति के साथ रखता है।

क्या आप कोई धाराप्रवाह उपकरण खरीद सकते हैं?

अभी नहीं। कंपनी अपनी तकनीक का लाइसेंस दे रही है, और अन्य कंपनियों के लिए प्रशिक्षण कर रही है। COVID के लिए धन्यवाद, दो प्रमुख लॉन्च को अगले वर्ष के लिए पीछे धकेल दिया गया है। लेकिन आप इसे घड़ियों और अन्य फ़िटनेस डिवाइस, स्पीकर, होम ऑटोमेशन हब आदि में दिखने की उम्मीद कर सकते हैं।

यह बहुत अच्छा होगा यदि इसे सीधे iPhone जैसे स्मार्टफ़ोन में भी शामिल किया जाए, जिससे दिन-प्रतिदिन के कार्य तेज़ी से हो, और केवल आवश्यक होने पर सिरी का सहारा लिया जाए। वही असली किलर ऐप होगा।

अपडेट: 22 अक्टूबर, सुबह 10:12 बजे। फ़्लुएंट को वॉइस असिस्टेंट के बजाय वॉइस रिकग्निशन इंजन के रूप में संदर्भित करने के लिए बदलाव किए।

सिफारिश की: