Openai ने ऑपरेटर के लॉन्च की घोषणा की है, जो एक नया AI एजेंट है जो स्वायत्त रूप से ऑनलाइन कार्य कर सकता है।
यह लॉन्च एआई एजेंटों को आगे बढ़ाने के लिए कंपनी के प्रयासों में एक महत्वपूर्ण कदम है, एक ऐसी तकनीक है जिसे ओपनईएआई के सीईओ सैम अल्टमैन, को 2025 के लिए निर्णायक के रूप में वर्णित किया गया है।
ऑपरेटर एक सामान्य-उद्देश्य एआई टूल है जिसे विभिन्न वेब-आधारित कार्यों को करने के लिए डिज़ाइन किया गया है, जिसमें यात्रा बुकिंग करना, रेस्तरां टेबल जलाने और ऑनलाइन खरीदारी करना शामिल है।
शुरू में $ 200 प्रो सब्सक्रिप्शन प्लान के साथ यूएस उपयोगकर्ताओं के लिए उपलब्ध, ऑपरेटर का अनुसंधान पूर्वावलोकन भविष्य में प्लस, टीम और एंटरप्राइज टियर में उपयोगकर्ताओं के लिए विस्तार करने के लिए तैयार है।
Openai भी अधिक क्षेत्रों में सुविधा को रोल करने की योजना बना रहा है, हालांकि यूरोप को थोड़ा इंतजार करना होगा। यह उपकरण समर्पित साइट, ऑपरेटर.चैटगेट.कॉम के माध्यम से सभी चैट क्लाइंट में भविष्य के एकीकरण की योजना के साथ सुलभ है।
ऑपरेटर एक समर्पित वेब ब्राउज़र पर नियंत्रण करके काम करता है जो स्वतंत्र रूप से कार्यों को अंजाम दे सकता है।
उपयोगकर्ता इस प्रक्रिया की निगरानी करने में सक्षम हैं, जिसमें मेनू को नेविगेट करना, बटन पर क्लिक करना और फॉर्म भरना जैसी क्रियाएं शामिल हैं, जैसे कि एक मानव एक वेबसाइट के साथ बातचीत करेगा।
फोटो: Openai
एजेंट Openai के कंप्यूटर-उपयोग करने वाले एजेंट (CUA) मॉडल का उपयोग करता है, जो उन्नत तर्क के साथ GPT-4 की दृष्टि क्षमताओं का संयोजन करता है। मॉडल डेवलपर-फेसिंग एपीआई पर भरोसा किए बिना विभिन्न प्रकार के ऑनलाइन कार्यों को संभाल सकता है।
टूल की क्षमताओं में खरीदारी, वितरण, भोजन और यात्रा शामिल है, और ओपनईएआई ने डोरडैश, ईबे, इंस्टाकार्ट, प्रिसलाइन, स्टुबहब और उबेर जैसे व्यवसायों के साथ भागीदारी की है ताकि यह सुनिश्चित हो सके कि एजेंट इन कंपनियों की सेवा की शर्तों का पालन करता है।
CUA को बाहरी प्रभावों के साथ किसी भी कार्य को अंतिम रूप देने से पहले उपयोगकर्ता की पुष्टि के लिए पूछने के लिए प्रोग्राम किया जाता है, जैसे कि खरीदारी करना या ईमेल भेजना, उपयोगकर्ताओं को पूरा होने से पहले कार्यों की समीक्षा करने की अनुमति मिलती है।
अपनी उन्नत क्षमताओं के बावजूद, Openai स्वीकार करता है कि CUA सही नहीं है। वर्तमान में, ऑपरेटर जटिल या विशेष कार्यों के साथ संघर्ष करता है, जैसे कि विस्तृत स्लाइडशो बनाना या जटिल कैलेंडर सिस्टम का प्रबंधन करना।
अत्यधिक अनुकूलित या गैर-मानक वेब इंटरफेस के साथ बातचीत की आवश्यकता वाले कार्य भी समस्याग्रस्त होते हैं। इसके अतिरिक्त, कुछ कार्यों, जैसे बैंकिंग लेनदेन, सटीकता सुनिश्चित करने के लिए उपयोगकर्ता पर्यवेक्षण की आवश्यकता होती है।
यद्यपि ऑपरेटर कई कार्यों को स्वायत्त रूप से पूरा करने में सक्षम है, OpenAI ने दुरुपयोग को रोकने के लिए कुछ सुरक्षा उपायों को लागू किया है।
उदाहरण के लिए, उपयोगकर्ताओं को क्रेडिट कार्ड नंबर जैसी संवेदनशील जानकारी को मैन्युअल रूप से इनपुट करना चाहिए, और विशेष रूप से संवेदनशील साइटों पर ईमेल, सक्रिय पर्यवेक्षण की आवश्यकता होती है ताकि किसी भी त्रुटियों को किसी का ध्यान नहीं जाने से रोका जा सके।
ऑपरेटर कितने कार्य कर सकते हैं, इस पर कुछ सीमाएं भी हैं। OpenAI ने उन कार्यों की संख्या पर गतिशील दर सीमा निर्धारित की है जो एक ही बार में किए जा सकते हैं, समग्र दैनिक उपयोग सीमा के साथ।
इसके अलावा, कुछ कार्यों को सुरक्षा कारणों से प्रतिबंधित किया जाता है, जिसमें ईमेल भेजना और कैलेंडर इवेंट को हटाना शामिल है। इन प्रतिबंधों को भविष्य में हटा दिया जा सकता है।
जबकि ऑपरेटर ओपनआईए के सबसे उन्नत एआई एजेंट का प्रतिनिधित्व करता है, यह खरगोश, Google और एन्थ्रोपिक जैसे प्रतियोगियों की तुलना में धीमी शुरुआत के बाद आता है। इस तरह के उपकरणों का विकास महत्वपूर्ण सुरक्षा चिंताओं को बढ़ाता है, विशेष रूप से दुर्भावनापूर्ण उपयोग की क्षमता को देखते हुए।
Openai ने ऐसे जोखिमों को कम करने के लिए ऑपरेटर में सुरक्षा उपायों का निर्माण किया है, जिसमें निगरानी प्रणाली भी शामिल है जो कि संदिग्ध गतिविधि का पता लगाने और इसके सुरक्षा प्रोटोकॉल के लिए निरंतर अपडेट होने पर निष्पादन को रोकती है।
ऑपरेटर की रिहाई एआई एजेंटों के विकास में एक प्रमुख मील का पत्थर है, जिसे एआई में अगले प्रमुख विकास के रूप में देखा गया है। सिरी या एलेक्सा जैसे पारंपरिक आभासी सहायकों के विपरीत, एआई एजेंट कार्रवाई कर सकते हैं और कार्यों को स्वायत्त रूप से कर सकते हैं, इस बात के लिए नई क्षमता प्रदान करते हैं कि उपयोगकर्ता वेब और डिजिटल सेवाओं के साथ कैसे बातचीत करते हैं।