मुख्य तथ्य
- एनवीडिया ने हाल ही में एक ऐसी तकनीक का प्रदर्शन किया है जो 2डी तस्वीरों को मात्र सेकेंडों में 3डी दृश्यों में बदल देती है।
- यह विधि कंप्यूटर की शक्ति का उपयोग यह अनुमान लगाने के लिए करती है कि वास्तविक दुनिया में प्रकाश कैसे व्यवहार करता है।
- मेटावर्स एक ऐसा क्षेत्र है जहां 3डी दृश्य सहायक होते हैं क्योंकि उन्हें किसी भी कैमरे के नजरिए से देखा जा सकता है।
एनवीडिया की नई आर्टिफिशियल इंटेलिजेंस (एआई) तकनीक जल्द ही 2डी तस्वीरों को कुछ ही सेकंड में 3डी दृश्यों में बदल सकती है, जिससे मेटावर्स जैसे इमर्सिव वर्चुअल स्पेस का निर्माण वर्ड प्रोसेसिंग के रूप में तुच्छ हो जाएगा।
एनवीडिया ने हाल ही में इंस्टेंट एनईआरएफ नामक फोटो विधि का प्रदर्शन किया, जो वास्तविक दुनिया में प्रकाश के व्यवहार का अनुमान लगाने के लिए कंप्यूटिंग शक्ति का उपयोग करता है। यह आपकी पुरानी तस्वीरों को वीडियो गेम के दृश्य में बदल सकता है, या इसका उपयोग रोबोट और सेल्फ-ड्राइविंग कारों को वास्तविक दुनिया की वस्तुओं के आकार और आकार को समझने के लिए प्रशिक्षित करने के लिए किया जा सकता है।
"3डी इमेजिंग परिवर्तन की एक नई दुनिया लाती है," एनवीडिया प्लेटफॉर्म पर अपने 3डी एल्गोरिदम चलाने वाली कंप्यूटर विज़न कंपनी, विज़नरी.एआई के सीईओ ओरेन डेबी ने एक ईमेल साक्षात्कार में लाइफवायर को बताया। "3D का उपयोग करके, आप दृश्य में वास्तविक दुनिया की गहराई की नकल करते हैं और छवि को अधिक जीवंत और यथार्थवादी बनाते हैं। AR/VR और औद्योगिक कैमरों के अलावा, जहां 3D बहुत आम है, अब हम इसे लगभग हर स्मार्टफोन पर उपयोग किए बिना देख रहे हैं। उपयोगकर्ता जानते हुए भी।"
आयाम जोड़ना
पहली झटपट तस्वीर, 75 साल पहले एक Polaroid कैमरे से ली गई थी, जिसका उद्देश्य 3D दुनिया को 2D छवि में तेज़ी से कैप्चर करना था। अब, AI शोधकर्ता इसके विपरीत काम कर रहे हैं: स्थिर छवियों के संग्रह को सेकंडों में एक डिजिटल 3D दृश्य में बदलना।
उलटा प्रतिपादन के रूप में जाना जाता है, प्रक्रिया एआई का उपयोग यह अनुमान लगाने के लिए करती है कि वास्तविक दुनिया में प्रकाश कैसे व्यवहार करता है, जिससे शोधकर्ताओं को विभिन्न कोणों पर ली गई मुट्ठी भर 2 डी छवियों से एक 3 डी दृश्य का पुनर्निर्माण करने में सक्षम बनाता है। एनवीडिया का दावा है कि उसने एक ऐसा दृष्टिकोण विकसित किया है जो इस कार्य को लगभग तुरंत पूरा करता है।
एनवीडिया ने इस दृष्टिकोण का उपयोग एक नई तकनीक के साथ किया जिसे न्यूरल रेडियंस फील्ड या एनईआरएफ कहा जाता है। कंपनी का कहना है कि परिणाम, जिसे इंस्टेंट एनईआरएफ कहा जाता है, अब तक की सबसे तेज एनईआरएफ तकनीक है। मॉडल को कुछ दर्जन स्थिर फ़ोटो पर प्रशिक्षित करने के लिए केवल कुछ सेकंड की आवश्यकता होती है और फिर परिणामी 3D दृश्य को दसियों मिलीसेकंड के भीतर प्रस्तुत कर सकता है।
"यदि पॉलीगोनल मेश जैसे पारंपरिक 3डी प्रतिनिधित्व वेक्टर छवियों के समान हैं, तो एनईआरएफ बिटमैप छवियों की तरह हैं: वे किसी वस्तु से या दृश्य के भीतर प्रकाश के विकिरण के तरीके को सघन रूप से कैप्चर करते हैं," डेविड ल्यूबके, उपाध्यक्ष, ग्राफिक्स अनुसंधान एनवीडिया ने एक समाचार विज्ञप्ति में कहा, "इस अर्थ में, तत्काल एनईआरएफ 3 डी के लिए उतना ही महत्वपूर्ण हो सकता है जितना कि डिजिटल कैमरे और जेपीईजी संपीड़न 2 डी फोटोग्राफी के लिए रहे हैं- 3 डी कैप्चर और साझा करने की गति, आसानी और पहुंच में काफी वृद्धि हुई है।"
एक एनईआरएफ को फीड करने के लिए डेटा एकत्र करने के लिए तंत्रिका नेटवर्क को दृश्य के चारों ओर कई स्थितियों से ली गई कुछ दर्जन छवियों को कैप्चर करने की आवश्यकता होती है, साथ ही उन शॉट्स में से प्रत्येक की कैमरा स्थिति भी।
एनईआरएफ 3डी अंतरिक्ष में किसी भी बिंदु से किसी भी दिशा में प्रकाश के विकिरण के रंग की भविष्यवाणी करके दृश्य के पुनर्निर्माण के लिए एक छोटे तंत्रिका नेटवर्क को प्रशिक्षित करता है।
3डी की अपील
मेटावर्स एक ऐसा क्षेत्र है जहां 3डी दृश्य उपयोगी होते हैं क्योंकि उन्हें किसी भी कैमरे के नजरिए से देखा जा सकता है, परसेप्टस प्लेटफॉर्म फॉर ऑगमेंटेड रियलिटी (एआर) के संस्थापक ब्रैड क्विंटन ने एक ईमेल साक्षात्कार में लाइफवायर को बताया। जिस तरह हम वास्तविक जीवन में एक कमरे में घूम सकते हैं और उसकी सामग्री को कई अलग-अलग कोणों से देख सकते हैं, एक पुनर्निर्मित 3D दृश्य के साथ, हम वस्तुतः एक अंतरिक्ष में घूम सकते हैं और इसे किसी भी दृष्टिकोण से देख सकते हैं।
"यह आभासी वास्तविकता में उपयोग के लिए वातावरण बनाने के लिए विशेष रूप से उपयोगी हो सकता है," क्विंटन ने कहा।
एप्पल के ऑब्जेक्ट कैप्चर जैसे प्रोग्राम 2डी छवियों की एक श्रृंखला से वर्चुअल 3डी ऑब्जेक्ट बनाने के लिए फोटोग्रामेट्री नामक तकनीक का उपयोग करते हैं। क्विंटन ने भविष्यवाणी की थी कि आभासी वास्तविकता और एआर अनुप्रयोगों में 3 डी मॉडल का व्यापक रूप से उपयोग किया जाएगा। उदाहरण के लिए, कुछ एआई, जैसे कि परसेप्टस एआर प्लेटफॉर्म में से एक, वास्तविक दुनिया की समझ बनाने के लिए 3डी मॉडल का उपयोग करते हैं, जो वास्तविक समय के एआर अनुप्रयोगों की अनुमति देता है।
3D छवियों का उपयोग एक दृश्य में वास्तविक दुनिया की गहराई की भी नकल करता है और छवि को अधिक जीवंत और यथार्थवादी बनाता है, देबी ने कहा। बोकेह इफेक्ट (उर्फ पोर्ट्रेट मोड या सिनेमैटिक मोड) बनाने के लिए 3डी डेप्थ मैपिंग जरूरी है। तकनीक का इस्तेमाल लगभग हर स्मार्टफोन में किया जाता है।
"फिल्मों को फिल्माने वाले पेशेवर वीडियोग्राफरों के लिए यह पहले से ही मानक है, और यह हर उपभोक्ता के लिए मानक बनता जा रहा है," देबी ने कहा।