नेभिगेशन
विश्व

एआई भिडियोको दौडमा चिनियाँ ल्याब निकै अगाडि

बाइटडान्स र कुवाइसोका मोडलहरू यथार्थपरकता र स्केलमा पश्चिमा समूहहरू भन्दा उत्कृष्ट

बेइजिङ, (एजेन्सी)  । चिनियाँ आर्टिफिसियल इन्टेलिजेन्स (एआई) समूहहरू भिडियो उत्पादनको दौडमा अमेरिकी प्रतिस्पर्धीहरू भन्दा अगाडि बढेका छन् । विज्ञापन, ई–कमर्स र मनोरञ्जन क्षेत्रमा द्रूत रूपमा प्रयोग भइरहेको एआई प्रविधिमा यो प्रतिस्पर्धा एउटा मुख्य रणमैदान बनेको छ । चिनियाँ कम्पनीहरू बाइटडान्स र कुवाइसो जस्ता कम्पनीहरूले ठूलो संख्यामा छोटा भिडियोहरू प्रयोग गरेर आफ्ना प्रणालीहरूलाई तालिम दिइरहेका छन् । यसले गर्दा उनीहरूलाई अमेरिकी प्रतिस्पर्धीहरू भन्दा बढी फाइदा पुगेको छ ।
यो परिवर्तनले एआईको दौडमा एउटा नयाँ मोड ल्याएको छ । ओपनएआई, गुगल र एन्थ्रोपिक जस्ता कम्पनीहरू अझै पनि ठूला भाषा मोडल (एलएलएम) र कोडिङ जस्ता क्षेत्रमा हाबी भए तापनि, विकासकर्ताहरू र विभिन्न मूल्यांकन बोर्डहरूका अनुसार भिडियो उत्पादनको गुणस्तर र उपयोगितामा अमेरिकीहरू चिनियाँ कम्पनीहरू भन्दा पछि परेका छन् ।
भिडियो मोडलहरू तयार पार्नका लागि उच्च गुणस्तरका भिडियोहरूको ठूलो भण्डार आवश्यक पर्छ । टिकटकजस्ता छोटा भिडियो एपहरूका मालिक भएका कारण चिनियाँ कम्पनीहरू यस मामिलामा निकै अगाडि छन्, किनकि उनीहरूसँग प्रयोगकर्ताहरूले बनाएका अथाह भिडियो र डेटाहरू उपलब्ध छन् । केही विज्ञहरूका अनुसार चिनियाँ समूहहरू प्रतिलिपि अधिकार (कपिराइट) भएका सामाग्रीहरू प्रयोग गर्न पनि अमेरिकी कम्पनीहरू भन्दा बढी आक्रामक देखिएका छन् ।
कार्टुन र छोटा ड्रामाहरूजस्ता एआई–सम्बन्धित सामग्री उत्पादन गर्ने एउटा स्टार्टअप कम्पनी ’डाइरेक्टर एआई’का संस्थापक बेन चियाङ भन्छन्, ’हामीले प्रयोग गरेका अधिकांश अमेरिकी मोडलहरू भिडियो उत्पादनमा त्यति राम्रा छैनन् ।’ उनका अनुसार अमेरिकी कम्पनीहरूमाथि कडा प्रतिबन्ध र नियमहरू भएका कारण उनीहरूका प्रविधिहरू बाँधिएका छन् र तिनले कम यथार्थपरक भिडियोहरू बनाउने गर्छन् ।
डाइरेक्टर एआईले मुख्य रूपमा कुवाइसोद्वारा विकसित ’क्लिङ’ मोडल प्रयोग गर्छ । साथै, आवश्यकता र लागत हेरेर यसले बाइटडान्सको ’सीडान्स २.०’ र मिनीम्याक्स नामको स्टार्टअपको ’हाइलुओ’ मोडल पनि चलाउने गर्छ । चियाङ भन्छन्, ’सबै कुरा गुणस्तर र मोडलले कत्तिको राम्रोसँग निर्देशन (प्रम्प्ट) पालना गर्छ भन्ने कुरामा भर पर्छ ।’ पछिल्ला सुधारहरूले गर्दा यी प्रविधिहरू चलाउन थप सहज भएको र विशेषगरी आवाज मिलाउन तथा स्थिर बनाउन सजिलो भएको उनले थपे ।
भिडियो निर्माताहरूका लागि यी सुधारहरूले उत्पादन प्रक्रिया नै बदलिरहेका छन् । जर्जियाको तिब्लिसीमा बस्ने स्वतन्त्र एआई चलचित्र निर्माता र सम्पादक जोर्ज वन भन्छन्, ‘मेरो सिर्जनात्मक स्वतन्त्रताका लागि सीडान्स २.० गेम–चेन्जर साबित भएको छ ।’
उनले थपे, ‘यसले पात्रको अनुहार वा प्रकाशको चमक नबिगारीकन तीव्र क्यामेरा एङ्गल र गतिलाई सजिलै सम्हाल्छ । अधिकांश अमेरिकी मोडलहरूमा दृश्यहरू तीव्र गतिमा चल्दा अनुहार बिग्रिने वा हल्लिने समस्या आउँछ ।’ क्लिङ, सीडान्स २.० र ह्याप्पीहर्स १.० जस्ता मोडलहरूले एउटा स्वतन्त्र प्लेटफर्ममा प्रयोगकर्ताहरूको भोटका आधारमा तयार पारिएको एरिनाको उत्कृष्ट भिडियो मोडलहरूको ¥यांङिमा उच्च स्थान पाएका छन् ।
यस्ता मूल्यांकनहरूलाई परम्परागत बेन्चमार्क प्रणालीहरू भन्दा बढी भरपर्दो मानिन्छ । किनभने एआई ल्याबहरूले प्रायः आफ्ना मोडलहरूलाई ती बेन्चमार्क टेस्टहरू पास गर्न सक्ने गरी मात्र तयार पार्छन्, जसले गर्दा वास्तविक संसारमा तिनको कार्यक्षमता सधैं सही रूपमा देखिँदैन ।
गुगलको ‘भीओ ३’ मोडल पनि निकै प्रतिस्पर्धी छ । युट्युबका भिडियोहरूमा पहुँच भएका कारण यसले केही फाइदा पाएको विज्ञहरू बताउँछन् । तर डेभलपरहरूका लागि भने यसमा कडा सुरक्षा नियम र धेरै सीमाहरू तोकिएका छन् ।
यस क्षेत्रको प्रगति मुख्य रूपमा स्वामित्वमा रहेका विशाल भिडियो डाटाहरूको उपलब्धतामा टिकेको छ । बाइटडान्स र कुवाइसोले विश्वकै सबभन्दा ठूला छोटा भिडियो प्लेटफर्महरू सञ्चालन गर्छन् । यसले उनीहरूलाई एउटा यस्तो तालिमको फाइदा दिन्छ जुन प्रतिस्पर्धीहरूका लागि कपी गर्न निकै गाह्रो छ । टेक्स्ट (अक्षर) जस्तो नभई भिडियो सामाग्रीहरू इन्टरनेटबाट सजिलै निकाल्न (स्क्र्याप गर्न) सकिँदैन ।
गत हप्ता कुवाइसोले आफ्नो तीव्र गतिमा बढिरहेको एआई व्यवसायबाट फाइदा लिनका लागि क्लिङलाई छुट्टै कम्पनी बनाएर सेयर बजारमा सूचीकृत गर्ने विकल्पहरू खोजिरहेको घोषणा गरेको थियो ।
यस्ता सामग्रीहरूको प्रयोगले कानुनी विवाद पनि निम्त्याएको छ । बाइटडान्सले प्रतिलिपि अधिकार उल्लंघन गरेको आरोपमा कानुनी चुनौतीहरूको सामना गर्नु परिरहेको छ । यी प्लेटफर्महरूले प्रयोगकर्ताहरूलाई उचित अनुमति बिना नै मार्भलका चलचित्रहरू र ’साउथ पार्क’ टेलिभिजन शृङ्खलाका पात्रहरू प्रयोग गरेर भिडियो बनाउन दिएका छन् । चिनियाँ इन्टरनेट समूहले भने सुरक्षा व्यवस्थाहरू बढाउने प्रतिबद्धता जनाएको छ ।
धेरै डेभलपर र क्रिएटरहरूका अनुसार सामग्रीमा कम प्रतिबन्ध भएका कारण चिनियाँ मोडलहरू व्यवहारमा प्रयोग गर्न सजिला छन् । चियाङ भन्छन्, अमेरिकी प्रविधिहरू चलाउँदा प्रयोगका सर्तहरू उल्लंघन भएको भन्दै विना कुनै स्पष्टीकरण बारम्बार ’एरर’ आउने र अनुरोधहरू अस्वीकृत हुने गर्छन् ।
व्यक्तिगत रूपमा काम गर्ने क्रिएटरहरूका लागि चिनियाँ प्लेटफर्महरू पश्चिमा मोडलहरू भन्दा सस्ता र बढी लचिला छन् । उनीहरूले सब्सक्रिप्सन वा चलाए अनुसार पैसा तिर्ने (पे–एज–यु–गो) प्रणालीहरू अघि सारेका छन्, जसले गर्दा नयाँ प्रयोगहरू गर्न सजिलो हुन्छ । फेब्रुअरीदेखि सीडान्स २.० को माग निकै बढेको छ, जसका कारण केही प्रयोगकर्ताहरूले लामो समय कुर्नुपर्ने अवस्था पनि आएको छ ।
कर्पोरेट ग्राहकहरूका लागि भने बाइटडान्सले फरक रणनीति अपनाएको छ । अमेरिकामा आधारित केही ग्राहकहरूका लागि यसले सुरुमै ठूलो रकम माग गर्ने गरेको छ । यस मामिलाको जानकारी भएका व्यक्तिहरूका अनुसार पहुँच र क्रेडिट पाउनका लागि ग्राहकहरूले करिब २० लाख डलर अग्रिम बुझाउनु पर्ने सर्त राखिएको छ । बाइटडान्सले यसबारे टिप्पणी गर्न अस्वीकार गरेको छ ।
केही प्रयोगकर्ताहरूले तेस्रो पक्षीय (थर्ड–पार्टी) प्लेटफर्महरू मार्फत यी मोडलहरू चलाएर यस्ता अवरोधहरू पार गरिरहेका छन् । बीहुक्ड जस्ता प्लेटफर्महरूले यी मोडलहरूलाई फरक मूल्य र प्याकेजमा उपलब्ध गराउने गर्छन् ।
भिडियो उत्पादन गर्नका लागि अक्षर वा अडियोको तुलनामा निकै बढी डाटाहरू (टोकन) आवश्यक पर्छ, जसले गर्दा यसलाई ठूलो स्तरमा फैलाउन निकै खर्चिलो हुन्छ । मार्च महिनामा ओपनएआईले उच्च कम्प्युटिङ लागतकै कारण आफ्नो ‘सोरा’ भिडियो मोडलको सार्वजनिक विस्तारलाई रोकेको थियो ।
यो प्रविधिलाई प्रयोग गरेर व्यवसाय बढाउन चाहने कम्पनीहरूका लागि पछिल्लो गुणस्तरीय फड्कोले नयाँ व्यावसायिक अवसरहरू खोलेको छ । ई–कमर्स वेबसाइटहरूका लागि भिडियो पूर्वाधार उपलब्ध गराउने कम्पनी ‘फायरवर्क’का प्रमुख कार्यकारी भिन्सेन्ट याङ भन्छन्, ‘पहिलेका भिडियोहरू अलि अस्वभाविक र रोबोटिक हुन्थे, जसले ब्रान्डको मापदण्ड पूरा गर्न सक्दैनथे । तर अहिले हामी यस्तो मोडमा आइपुगेका छौं जहाँ यो भिडियो एआईले बनाएको हो कि मान्छेले भनेर छुट्ट्याउनै गाह्रो पर्छ ।’
याङका अनुसार यो प्रविधिले ब्रान्डहरूलाई पहिले असम्भव लाग्ने स्केलमा भिडियोहरू बनाउन सक्षम बनाएर विज्ञापन क्षेत्रको रूपान्तरण गरिरहेको छ । उनी भन्छन्, ‘एकजना खुद्रा व्यापारीले हामीलाई आफ्ना उत्पादनहरूका लागि एक लाख वटा भिडियोहरू बनाउन आग्रह गरे । एआई बिना यो काम असाध्यै महँगो र असम्भव जस्तै हुन्थ्यो । तर अहिले, हरेक उत्पादनको आफ्नै भिडियो हुन सक्छ र फरक–फरक ग्राहकहरूका लागि एउटै उत्पादनको पनि धेरै किसिमका भिडियोहरू तयार पार्न सकिन्छ ।’

प्रकाशित मिति:
प्रतिक्रिया दिनुहोस्