बीजिंग:
चीनी एआई कंपनी शेंगशू टेक्नोलॉजी और त्सिंगुआ विश्वविद्यालय द्वारा विकसित एक बड़ा वीडियो जेनरेशन मॉडल, विदु, जो टेक्स्ट-टू-वीडियो और इमेज-टू-वीडियो जेनरेशन की सुविधा देता है, हाल ही में वैश्विक उपयोग के लिए उपलब्ध हो गया है।
विदु 30 सेकंड में 4 सेकंड की क्लिप बनाने में सक्षम है और एक बार में 32 सेकंड तक का वीडियो तैयार कर सकता है।
सिंघुआ इंस्टीट्यूट फॉर आर्टिफिशियल इंटेलिजेंस के उप निदेशक झू जून ने कहा, “विदु वास्तविक भौतिक दुनिया का अनुकरण कर सकता है, और भौतिक नियमों का पालन करने वाले विस्तृत दृश्य बना सकता है, जैसे प्राकृतिक प्रकाश और छाया प्रभाव, साथ ही जटिल चेहरे के भाव। इसके अतिरिक्त, यह गहराई और जटिलता के साथ अतियथार्थवादी सामग्री उत्पन्न कर सकता है।”
झू ने कहा कि विज्ञान-फाई, रोमांस और एनीमेशन जैसी विभिन्न शैलियों के लिए, विदु ऐसे दृश्य तैयार कर सकता है जो प्रत्येक शैली का सार पकड़ते हैं, और यह धुआं और लेंस फ्लेयर्स जैसे उच्च गुणवत्ता वाले सिनेमाई प्रभाव भी बना सकता है।
एआई मॉडल विभिन्न प्रकार के शॉट्स को प्रबंधित कर सकता है, जिसमें लंबे शॉट, क्लोज-अप और मध्यम शॉट शामिल हैं, और यह आसानी से लंबे शॉट, फोकस पुल और सहज दृश्य संक्रमण जैसे प्रभाव उत्पन्न कर सकता है।
उपयोगकर्ता पोर्ट्रेट या कस्टमाइज़्ड कैरेक्टर इमेज अपलोड कर सकते हैं और टेक्स्ट विवरण का उपयोग करके कैरेक्टर को किसी भी सीन में कोई भी एक्शन करने के लिए निर्देशित कर सकते हैं। यह सुविधा वीडियो निर्माण प्रक्रिया को सरल बनाती है और रचनात्मक स्वतंत्रता को बढ़ाती है।
कंपनी ने कहा कि विदु की मुख्य वास्तुकला 2022 की शुरुआत में प्रस्तावित की गई थी