मुख्य तथ्य
- सिरी दो नई यूएस-अंग्रेज़ी आवाज़ें जोड़ता है।
- आईफोन अब महिला सिरी वॉयस के लिए डिफॉल्ट नहीं होगा।
- वॉयस इंटरेक्शन कभी भी उतना अच्छा नहीं हो सकता जितना कि फिल्मों में होता है।
सिरी ने अभी अमेरिका में दो नई आवाजें जोड़ी हैं और अब एक महिला नौकर के लिए डिफ़ॉल्ट नहीं होंगी, लेकिन क्या आवाज सहायक वास्तव में भविष्य हैं?
साइंस फिक्शन में इंसानों ने हमेशा रोबोट और कंप्यूटर से बात की है। इसका एक हिस्सा निश्चित रूप से फिल्म और टीवी की नाटकीय आवश्यकताओं के लिए नीचे है: बोलना हमेशा टाइपिंग से ज्यादा दिलचस्प होता है।
जैसे-जैसे वॉयस असिस्टेंट अधिक सक्षम होते जाते हैं, यह विश्वास करना आसान हो जाता है कि कंप्यूटिंग का भविष्य सभी वॉयस है। लेकिन क्या यह संभव है? और क्या यह वांछनीय भी है?
"अभी, वॉयस असिस्टेंट अविश्वसनीय रूप से लोकप्रिय हैं," रिमोट वर्क कंपनी ब्रोसिक्स के सीईओ स्टीफन चेकानोव ने ईमेल के माध्यम से लाइफवायर को बताया। "हालांकि, सहायक के पास जाने वाले सभी आदेश काफी सरल और सीधे हैं।"
"जब अधिक सूक्ष्म इनपुट की बात आती है, तो आवाज प्रौद्योगिकी में गलतियाँ करने की अधिक संभावना होगी, इसलिए मुझे विश्वास नहीं है कि यह प्रभावी हो जाएगा। ऐसे कार्यों के लिए जिनमें बहुत अधिक सटीकता की आवश्यकता होती है, जैसे कोडिंग या डिजाइनिंग, इस प्रकार की बातचीत बहुत मदद नहीं करती है।"
बहुत इंसान
फिल्मों में कंप्यूटर लोगों की तरह ही स्मार्ट होते हैं। C3PO किसी भी इंसान की तरह बुद्धिमान-और विक्षिप्त-जैसा है। आयरन मैन का J. A. R. V. I. S एक नियमित वॉयस असिस्टेंट की तरह है, जिसमें यह एक क्लाउड में रहता है, रोबोट बॉडी में नहीं, बल्कि यह बिना किसी गलती के टोनी स्टार्क के सभी निर्देशों की व्याख्या कर सकता है।
उसकी तुलना सिरी से करें, जिसे सबसे बुनियादी कार्यों में भी परेशानी होती है। स्वयं सहायक को दोष देना आसान है, लेकिन सबसे बड़ी समस्याओं में से एक हमारी अपेक्षाएं हैं।
मूवी कंप्यूटरों के इतिहास और Apple, Google, Amazon और अन्य आभासी सहायक विक्रेताओं के वादों के बीच, हम बहुत अधिक उम्मीद करते हैं। अगर कोई कंप्यूटर इंसान की तरह लगता है, तो हम उससे एक जैसा व्यवहार करने की उम्मीद करते हैं।
यह वह जगह है जहां हमारे लिंग पूर्वाग्रह आते हैं। अमेरिका में, सिरी एक महिला-विशिष्ट आवाज के लिए डिफ़ॉल्ट है, हालांकि हर जगह ऐसा नहीं है। अगर हमें कंप्यूटर से उम्मीदें हैं क्योंकि यह मानवीय लगता है, तो इसका मतलब यह है कि वे अपेक्षाएं हमारे मौजूदा सामाजिक पूर्वाग्रहों की नकल करेंगी।
ऑनलाइन तलाक विशेषज्ञ एंड्री बोगडानोव ने ईमेल के माध्यम से लाइफवायर को बताया, "महिलाओं के बारे में गहराई से निहित रूढ़िवादिता के कारण, अधिकांश आवाज सहायक महिलाएं हैं।"
"महिलाओं की आवाज़ का उपयोग उपयोगकर्ता को यह आभास देने के लिए किया जाता है कि रोबोट मददगार, दयालु और भरोसेमंद है, ये सभी विशेषताएँ आमतौर पर महिलाओं से जुड़ी होती हैं।"
Q एक जेंडरलेस कंप्यूटर वॉयस है जिसे वर्चुअल असिस्टेंट में इस्तेमाल करने के लिए डिज़ाइन किया गया है। यह उन मनुष्यों की रिकॉर्डिंग से उत्पन्न होता है जो नर या मादा के रूप में पहचान नहीं करते हैं और फिर इसे एक ऐसी पिच रेंज में लाने के लिए आगे संसाधित किया जाता है जो न तो गहरी है और न ही ऊंची है।
iOS 14.5 में नए यूजर्स को Siri के लिए आवाज चुननी होगी। वर्तमान बीटा में, उन आवाज़ों को नर या मादा के रूप में पहचाने जाने के बजाय संख्याओं के साथ लेबल किया जाता है। यह एक तरह से प्रशंसनीय है, लेकिन कष्टप्रद भी है।
जब अधिक सूक्ष्म इनपुट की बात आती है, तो आवाज प्रौद्योगिकी में गलतियाँ करने की अधिक संभावना होगी, इसलिए मुझे विश्वास नहीं है कि यह प्रभावी हो जाएगा।
विकल्पों को गिनने से आप अपना नजरिया या पसंद नहीं बदलेंगे, लेकिन अपनी मनचाही आवाज चुनना मुश्किल बना देगा। यह लोगों को सर्च इंजन चुनने के लिए मजबूर करने जैसा है। हम में से अधिकांश लोग केवल सबसे परिचित-Google के साथ जाएंगे।
बेहतर, शायद, आवाज को गैर-बाइनरी विकल्प में डिफ़ॉल्ट करने के लिए और लोगों को इसे बदलने के लिए सेटिंग्स में खोदने के लिए मजबूर करें।
जटिल और सरल कार्य
आवाज नियंत्रित कंप्यूटरों को हर चीज के लिए उपयोग किए जाने से पहले बहुत बेहतर होने की जरूरत है। टाइमर सेट करना, कैलेंडर ईवेंट जोड़ना, और यहां तक कि आने वाले टेक्स्ट संदेशों का जवाब देना सभी मौजूदा सहायकों के साथ बहुत सहज हैं।
फिर भी, अधिक जटिल किसी भी चीज़ के लिए, आप किसी अन्य इनपुट पद्धति पर स्विच करना चाह सकते हैं।
कंप्यूटर सुरक्षा विश्लेषक एरिक फ्लोरेंस ने ईमेल के माध्यम से लाइफवायर को बताया, "जब सिरी या Google सहायक को नेटफ्लिक्स कॉमेडी विशेष खोजने में कोई परेशानी नहीं होती है, तो अधिक जटिल इनपुट उपयोगकर्ता को उनके लिए आसान बनाने से ज्यादा असुविधा पहुंचा सकते हैं।"
"जिस व्यक्ति ने पहले कोड की हजारों लाइनों के साथ काम किया है, आप केवल इतना विशिष्ट प्राप्त कर सकते हैं इससे पहले कि कुछ कमांड अन्य कमांड को प्रतिस्पर्धा या ओवरराइड करना शुरू कर दें, जिससे सिस्टम में जाम हो जाता है जो केवल उपयोगकर्ता को निराश कर सकता है।"
क्लाउडएचक्यू के संस्थापक और सीएमओ नाओमी असराफ ने ईमेल के माध्यम से लाइफवायर को बताया, इस बात की शून्य प्रतिशत संभावना है कि मानव/कंप्यूटर संपर्क मुख्य रूप से एक वॉयस इंटरफेस बन जाएगा।
"इसका कारण यह है कि हम अपने कंप्यूटर, फोन और अन्य उपकरणों का उपयोग विभिन्न प्रकार की जगहों पर करते हैं जहां कंप्यूटर के साथ आगे-पीछे बोलना व्यावहारिक नहीं है।"
ड्राइविंग करते समय, बर्तन धोते समय या दुकान में काम करते समय आवाज नियंत्रण सुविधाजनक होता है। लेकिन विज्ञान-कथा के पास हमें इस बारे में भी सिखाने के लिए कुछ है: "यहां तक कि स्टार ट्रेक पर उनके स्टेशनों पर लोगों के पास प्रसिद्ध 'कंप्यूटर' के अलावा स्पर्श इंटरफेस भी थे" असराफ कहते हैं।
आवाज सहायकों में सुधार जारी रहेगा, और शायद एक दिन वे वास्तव में अपने ऑन-स्क्रीन समकक्षों की तरह अच्छे होंगे। लेकिन इन उपकरणों के साथ हमारे संबंधों को भी बदलने की जरूरत है। सिरी खुद परवाह नहीं करती अगर आप इसका अपमान लिंग वाली गालियों से करते हैं, लेकिन यह अपमान करने वाले व्यक्ति के बारे में बहुत कुछ कहता है।