लेखक: बोक्सु ली मैकरॉन पर
परिचय:
Microsoft के नवीनतम अपडेट में Windows Copilot ने चुपचाप लेकिन महत्वपूर्ण तरीके से AI की पहुंच को बढ़ाया है। अक्टूबर 2025 के रोलआउट में, Copilot ने Google सेवाओं – Gmail, Google Drive, Google Calendar, और Contacts – के साथ Microsoft के अपने Outlook ईमेल, OneDrive, और अधिक के साथ जुड़ने की क्षमता हासिल की[1]। यह कदम Microsoft और Google पारिस्थितिक तंत्र के बीच लंबे समय से चली आ रही बाधाओं को तोड़ता है। एक सरल विकल्प के साथ, Windows उपयोगकर्ता अब Copilot का उपयोग करके खातों और ऐप्स में व्यक्तिगत जानकारी खोज और संकलित कर सकते हैं, वह भी एक ही AI सहायक इंटरफेस के माध्यम से[2][3]। यह एक अभूतपूर्व स्तर का क्रॉस-प्लेटफ़ॉर्म सहयोग है: Microsoft का AI सक्रिय रूप से Google के क्षेत्र में जाकर उपयोगकर्ताओं की मदद करता है।
इस गहन विश्लेषण में, हम इन नए कनेक्टर्स के कार्य और उनके कार्य करने के तरीके को Copilot के अंदर विश्लेषण करेंगे, और Microsoft के दृष्टिकोण की तुलना Google के Duet AI/Gemini, Notion AI, और Perplexity के Comet जैसे प्रतिद्वंद्वियों से करेंगे। हम उन उच्च-मूल्य उपयोग मामलों का अन्वेषण करेंगे जो एकीकृत खोज और ईमेल सारांशण से लेकर बैठक की तैयारी और दस्तावेज़ निर्माण तक को सक्षम बनाते हैं – और इस प्रवृत्ति का एजेंटिक कंप्यूटिंग, बहुआयामी इंटरेक्शन, और सहायक-चालित उपयोगकर्ता अनुभवों के भविष्य के लिए क्या अर्थ है, इस पर विचार करेंगे। यहाँ की भाषा व्यावहारिक और रणनीतिक है, जो मार्केटिंग की चकाचौंध को छांटकर उत्पाद नेताओं को यह स्पष्ट दृष्टिकोण देती है कि व्यक्तिगत AI सहायक कहाँ जा रहे हैं।
Copilot के Gmail, Drive, और Calendar कनेक्टर्स – वे कैसे काम करते हैं

मूल रूप से, Microsoft का कनेक्टर अपडेट Copilot on Windows को आपकी व्यक्तिगत सामग्री के लिए सार्वजनिक खोज बार और सहायक के रूप में काम करने की अनुमति देता है, चाहे वह सामग्री Microsoft ऐप में हो या Google सेवा में। एक बार जब आप कनेक्टर्स को सक्षम कर देते हैं (Copilot की सेटिंग्स में एक टॉगल के माध्यम से), तो AI को आपकी स्पष्ट सहमति के साथ - Gmail, Google Drive, Calendar, Contacts, Outlook, और OneDrive में आपके डेटा तक पहुंच प्राप्त हो जाती है।[3].
इस एक्सेस के साथ Copilot क्या कर सकता है? इस प्रारंभिक रिलीज़ में, ध्यान प्राकृतिक भाषा खोज और पुनःप्राप्ति पर है। आप Copilot से सवाल या आदेश पूछ सकते हैं जैसे “सारा का ईमेल पता क्या है?” या “पिछले हफ्ते के मेरे स्कूल नोट्स ढूंढो”, और Copilot जिस भी जुड़े खाते में यह जानकारी हो, वहां से संबंधित जानकारी प्राप्त करेगा। उदाहरण के लिए, अगर सारा का ईमेल आपके Google संपर्कों या Outlook एड्रेस बुक में संग्रहीत है, तो Copilot उसे पेश करेगा। अगर आपके “स्कूल नोट्स” Google Drive में Google Docs (या OneDrive में Word फाइलें) हैं, तो Copilot उन फाइलों को ढूंढ सकता है और प्रस्तुत कर सकता है। सहायक अनिवार्य रूप से आपके भिन्न भंडारण और संचार साइलो को एक एकीकृत ज्ञान आधार के रूप में मानता है।
Microsoft के अपने डेमो ने दिखाया कि कैसे एक ही क्वेरी कई स्रोतों से जानकारी खींच सकती है। एक उपयोगकर्ता किसी विशेष ग्राहक से सभी इनवॉइस मांग सकता है, और Copilot Outlook और Gmail दोनों इनबॉक्सों की जाँच करके मैचेस को संकलित कर सकता है। या आप याद कर सकते हैं कि आपने क्लाउड में एक PDF सहेजा था लेकिन यह याद नहीं कि कहाँ – Copilot OneDrive और Google Drive दोनों को एक साथ खोज सकता है। यह सब Windows पर Copilot चैट इंटरफेस के माध्यम से होता है, जिसका मतलब है कि उपयोगकर्ता को मैन्युअल रूप से ब्राउज़र खोलने, ऐप्स लॉन्च करने, या Gmail और Explorer में अलग-अलग खोजें चलाने की आवश्यकता नहीं है। सेट अप होने के बाद यह एक बिना रुकावट का अनुभव है।
महत्वपूर्ण बात यह है कि ये कनेक्शन ऑप्ट-इन और विस्तृत हैं। डिफ़ॉल्ट रूप से, Copilot आपके Gmail या Google डेटा को तब तक नहीं छूता जब तक आप उन खातों को सेटिंग्स में लिंक नहीं करते[6]। आप कुछ सेवाओं को जोड़ने का विकल्प चुन सकते हैं और अन्य को नहीं (जैसे, हो सकता है कि Gmail को लिंक करें लेकिन Google Drive को नहीं, या इसके विपरीत), ताकि उपयोगकर्ता नियंत्रण बनाए रखें। Microsoft वर्तमान में पढ़ने/खोजने की क्षमताओं को सीमित करता है – एक सुरक्षा उपाय के रूप में, Copilot इन कनेक्टर्स के माध्यम से स्वचालित रूप से ईमेल नहीं भेज रहा है या कैलेंडर ईवेंट नहीं जोड़ रहा है इस पहले संस्करण में (यह आपके डेटा से पढ़ रहा है, इसमें लिख नहीं रहा है, सिवाय इसके कि जब आप इसे स्पष्ट रूप से सामग्री उत्पन्न करने के लिए कहें)। यह सावधानीपूर्वक दृष्टिकोण संभवतः उपयोगकर्ता विश्वास बनाने के लिए जानबूझकर है, व्यक्तिगत ईमेल और फाइलों की संवेदनशीलता को देखते हुए।
यह ध्यान देने योग्य है कि Microsoft ने कनेक्टर लॉन्च के साथ एक और नई सुविधा जोड़ी है: Copilot के माध्यम से दस्तावेज़ निर्माण और निर्यात। अब आप Copilot को एक संकेत से वर्ड दस्तावेज़, एक्सेल स्प्रेडशीट, पावरपॉइंट डेक या PDF बनाने और यहां तक कि सीधे उन प्रारूपों में सामग्री निर्यात करने के लिए निर्देशित कर सकते हैं[7]। उदाहरण के लिए, आप कह सकते हैं "प्रोजेक्ट स्थिति अपडेट का मसौदा तैयार करें और वर्ड में निर्यात करें," और Copilot इसका पालन करेगा। यह कनेक्टर्स का पूरक है: सहायक न केवल खातों के बीच जानकारी ढूंढता है बल्कि उस जानकारी के साथ नए आर्टिफैक्ट्स (ईमेल, दस्तावेज़ आदि) उत्पन्न करने में भी आपकी मदद कर सकता है। दीर्घकालिक दृष्टि एक ऐसा AI है जो आपके क्रॉस-ऐप उत्पादकता साथी के रूप में सामग्री को निर्बाध रूप से एकत्र करता और उत्पन्न करता है।
कोपायलट अनुभव के अंदर: एकीकृत खोज और संदर्भीय उत्तर
तो जब आप इन कनेक्टर्स के साथ कोपायलट का उपयोग करते हैं, तो उपयोगकर्ता अनुभव कैसा होता है? व्यावहारिक रूप से, कोपायलट Windows 11 पर एक साइडबार/चैट के रूप में स्थिर रहता है (एक क्लिक या शॉर्टकट से बुलाया जाता है)। अंतर इस बात में है कि यह आपकी क्वेरी को कैसे समझता है और उत्तर कैसे तैयार करता है। जब आप कुछ ऐसा पूछते हैं जो व्यक्तिगत डेटा से संबंधित होता है, तो कोपायलट का AI आपके जुड़े सेवाओं के इंडेक्स को सुरक्षित रूप से क्वेरी करेगा। आंतरिक रूप से, Microsoft संभवतः Google और Microsoft Graph के API कॉल्स का उपयोग करके प्रासंगिक परिणामों को प्राप्त करता है, जिन्हें AI मॉडल तब संक्षेपित करता है या सीधे प्रस्तुत करता है।
कोपायलट के इंटरफ़ेस में, आपके व्यक्तिगत डेटा से आने वाले उत्तर आमतौर पर संदर्भ के साथ प्रस्तुत किए जाएंगे। उदाहरण के लिए, यदि आप किसी संपर्क का ईमेल पता पूछते हैं, तो कोपायलट बस ईमेल दिखा सकता है (जैसे "सारा का ईमेल sarah@example.com है"). यदि आप फाइलें या नोट्स पूछते हैं, तो कोपायलट कुछ फाइल नाम या अंश सूचीबद्ध कर सकता है, यह संकेत देते हुए कि वे किस सेवा से आए हैं (जैसे "Marketing Plan.docx OneDrive में पाया गया, अंतिम बार 5 सितंबर को संशोधित" या "Q3 OKRs Google Drive में पाया गया, पिछले सप्ताह संशोधित"). माइक्रोसॉफ्ट के कोपायलट डिज़ाइन में पारदर्शिता पर जोर दिया गया है, ताकि उपयोगकर्ता स्रोत को जान सकें - जैसे बिंग चैट अपने वेब स्रोतों का हवाला देता है। शुरुआती पूर्वावलोकनों ने परिणामों के बगल में "Gmail" या "OneDrive" जैसे स्रोत टैग दिखाए, जो यह विश्वास पैदा करने में मदद करते हैं कि कोपायलट कल्पना नहीं कर रहा है बल्कि वास्तव में आपके खाते में किसी आइटम को पाया है।
इस एकीकृत दृष्टिकोण का मूल्य पहली बार उपयोग करते ही स्पष्ट हो जाता है: अब आपको यह याद करने की ज़रूरत नहीं है कि "वो बातचीत Gmail में थी या Outlook में? मैंने वह PDF कहां सेव किया था?" आप बस Copilot से पूछते हैं, और वह आपके लिए स्थान का पता लगा लेता है। यह मूल रूप से AI के आपके प्रश्न की समझ के साथ एक OS-स्तरीय स्मार्ट खोज है। Windows में लंबे समय से खोज अनुक्रमण कार्यक्षमता रही है, लेकिन Copilot इसे अगले स्तर पर ले जाता है, प्राकृतिक भाषा का उपयोग करके और स्थानीय मशीन से परे कई क्लाउड खातों को शामिल करके।
बेशक सीमाएँ होती हैं। प्रारंभ में, कोपायलट कनेक्टर्स खोज और सरल पुनः प्राप्ति को संभालते हैं; वे अब तक जटिल बहु-चरण अनुरोधों का समर्थन नहीं कर सकते हैं (जैसे, "मेरे बॉस से प्रोजेक्ट ज़ीउस के बारे में सभी ईमेल ढूंढें और मुख्य बिंदुओं का सारांश तैयार करें"). फिलहाल आपको इसे चरणों में विभाजित करना पड़ सकता है: कोपायलट से ईमेल ढूंढने के लिए कहें, फिर उनसे सारांश बनाने के लिए कहें। समय के साथ, हम उम्मीद कर सकते हैं कि एआई ऐसे बहु-चरणीय एजेंटिव प्रश्नों को अधिक सहजता से संभालेगा जैसे-जैसे एकीकरण गहरा होगा। माइक्रोसॉफ्ट संभवतः इस विंडोज़ इनसाइडर रिलीज़ से प्रतिक्रिया एकत्र कर रहा है[8][9] इससे पहले कि क्षमताओं का अधिक विस्तार किया जाए।
माइक्रोसॉफ्ट बनाम गूगल बनाम बाकी: एआई असिस्टेंट के लिए भिन्न रणनीतियाँ
माइक्रोसॉफ्ट की क्रॉस-प्लेटफ़ॉर्म असिस्टेंट रणनीति उसके समकक्षों से अलग है। गूगल के डोमेन में कॉपिलॉट को खोलकर, माइक्रोसॉफ्ट यह संकेत दे रहा है कि उपयोगकर्ता की सुविधा पारिस्थितिकी तंत्र लॉक-इन से अधिक महत्वपूर्ण है – यह एक साहसी कदम है जो उन विंडोज़ उपयोगकर्ताओं की सेवा करता है जो गूगल सेवाओं पर निर्भर हैं। यह कैसे तुलना करता है गूगल के अपने एआई असिस्टेंट इन वर्कस्पेस से, या नोटियन और पर्पलेक्सिटी की रणनीतियों से? चलिए क्षमताओं, उपयोगकर्ता अनुभव, और प्लेटफ़ॉर्म रणनीति में प्रमुख अंतर की जांच करते हैं:
गूगल डुएट एआई (जेमिनी) – गहरी एकीकरण, वही पारिस्थितिकी तंत्र
Google का Copilot के लिए उत्तर है Google Workspace के लिए Duet AI, जो अब Gemini मॉडल की शक्ति के साथ विकसित हो रहा है। Duet एक AI सहयोगी है जो Gmail, Docs, Drive, Slides, Meet, और अधिक में एम्बेडेड है[10][11]। इसकी क्षमताओं में ईमेल और दस्तावेज़ों का मसौदा तैयार करने से लेकर Slides में छवियाँ बनाने तक, या लंबी चैट या बैठक प्रतिलेखों का सारांश बनाने तक शामिल हैं। उदाहरण के लिए, Gmail में आप "Help me write" विकल्प पर क्लिक करके Duet को उत्तर का मसौदा तैयार करने के लिए कह सकते हैं, या Docs में इसे दस्तावेज़ का सारांश बनाने के लिए कह सकते हैं। Slides में, Duet एक संकेत से दृश्य बना सकता है या प्रस्तुति रूपरेखा तैयार कर सकता है[12]। मूल रूप से, Google ने प्रत्येक ऐप के UI में AI सुविधाएँ बुन दी हैं: एक साइड पैनल या मेनू जहां Duet को वर्तमान संदर्भ में सहायता के लिए बुलाया जा सकता है।
जब ऐप्स के बीच खोजने की बात आती है, तो गूगल ने अपने ही इकोसिस्टम के भीतर कुछ क्रॉस-ऐप इंटेलिजेंस सक्षम करना शुरू कर दिया है। गूगल ने डुएट एआई के लिए योजनाओं की घोषणा की है, जो "आपके संदेशों और फाइलों को जीमेल और ड्राइव में खोजकर जटिल प्रश्नों का उत्तर देगा" और चैट स्पेस में दस्तावेजों को सारांशित करेगा[13]। व्यवहार में, यह एक उन्नत गूगल चैट अनुभव के रूप में उभर रहा है - आप चैट में एआई से प्रश्न पूछ सकते हैं और यह आपके जीमेल और ड्राइव से जानकारी खींच सकता है। उदाहरण के लिए, आप चैट में पूछ सकते हैं, "जॉन ने जो बजट प्रस्ताव दस्तावेज़ मेरे साथ साझा किया है और संबंधित ईमेल का सारांश बताएं," और डुएट ड्राइव से दस्तावेज़ और संबंधित जीमेल थ्रेड्स को पुनः प्राप्त कर सकता है, एक समेकित उत्तर प्रदान करते हुए। यह कॉन्सेप्ट में कोपिलॉट की यूनिफाइड सर्च के समान है, लेकिन गूगल की दुनिया तक ही सीमित है। डुएट आपके आउटलुक इनबॉक्स या वनड्राइव में नहीं जाएगा, क्योंकि गूगल की प्राथमिकता (समझने योग्य रूप से) आपको वर्कस्पेस के भीतर रखने की है।
एक यूएक्स परिप्रेक्ष्य से, गूगल का दृष्टिकोण यह है कि एआई प्रत्येक ऐप के भीतर संदर्भ-सचेत है। डुएट जैसे जीमेल और गूगल डॉक्स में एक साइड पैनल के रूप में दिखाई देता है (आइकन द्वारा दर्शाया गया, अक्सर एक छोटा चमक या डुएट लोगो)। आप एक ईमेल पढ़ रहे होंगे और विकल्पों के लिए डुएट पर क्लिक कर सकते हैं जैसे “इस धागे का सारांश दें” या “प्रतिक्रिया का मसौदा तैयार करें।” या गूगल ड्राइव में, आप डुएट से “प्रोजेक्ट एटलस के बारे में फाइलें खोजें” कह सकते हैं जो प्रभावी रूप से ड्राइव को खोजता है। डिज़ाइन ऐसा है कि एआई प्रत्येक विशिष्ट कार्य के लिए एक अंतर्निर्मित सहायक की तरह महसूस होता है, बजाय इसके कि एक सर्वव्यापी चैटबॉक्स हो। लाभ एक उपयुक्त अनुभव है - डुएट जानता है कि आप किस ऐप में हैं और प्रासंगिक मदद प्रदान करता है (जैसे शीट्स में फॉर्मेटिंग मदद, स्लाइड्स में स्लाइड डिज़ाइन आदि)। कमी विखंडन है: उपयोगकर्ता डुएट के साथ टुकड़ों में बातचीत करता है, बजाय इसके कि एआई के साथ किसी एकल स्थान में किसी भी चीज़ के बारे में बातचीत करें।
रणनीतिक रूप से, Google Duet (और इसके पीछे आने वाले Gemini मॉडल) का उपयोग कर रहा है ताकि Workspace के मूल्य प्रस्ताव को मजबूत किया जा सके। यह एक प्रीमियम ऐड-ऑन है (उपक्रमों के लिए प्रति उपयोगकर्ता लगभग $30) जो सीधे Microsoft 365 Copilot की कीमत से प्रतिस्पर्धा करता है[14]। Google की मंच रणनीति इकोसिस्टम को बनाए रखने की है – AI एक कारण है कि Google के ऐप्स का अधिक उपयोग किया जाए, और कोई संकेत नहीं है कि Google अपने सहायक को Microsoft सेवाओं को स्वाभाविक रूप से छूने देगा जैसे Microsoft Google की सेवाओं को अपना रहा है। संक्षेप में, Google कह रहा है: "अपने डेटा को Workspace में रखें, और हमारा AI आपका विशेषज्ञ सहायक होगा।" यह उन कंपनियों के लिए प्रतिध्वनित होता है जो पहले से ही Google-देशी हैं, लेकिन इसका मतलब है कि मिश्रित वातावरण में उपयोगकर्ताओं को (कुछ चीजों के लिए Google, दूसरों के लिए Microsoft) अंतर को पाटने में ज्यादा मदद नहीं मिलती – यही अंतर Microsoft Copilot के साथ Windows पर भरने का लक्ष्य रखता है।
यह भी ध्यान देने योग्य है कि Google का जोर एआई मॉडल की ताकत और मोडलिटी पर है। Gemini, Google का उन्नत जनरेटिव एआई, मल्टीमॉडल क्षमताओं (विजन, टेक्स्ट आदि) और बेहतर तर्कशक्ति लाने की बात कही जा रही है। हम जल्द ही देख सकते हैं कि Duet छवियों या चार्ट्स को अधिक बुद्धिमानी से संभालता है, या Google की खोज क्षमता के साथ एकीकृत हो जाता है ताकि वास्तविक समय की जानकारी प्रदान की जा सके। अपने प्लेटफॉर्म पर एक शक्तिशाली मॉडल को एम्बेड करके, Google एक ऐसा अनुभव प्रदान कर सकता है जहां एआई ऐसा महसूस करता है जैसे कि वह आपका जानकार सहकर्मी है जिसने आपके सभी दस्तावेज़ और ईमेल पढ़े हैं और वेब को भी जानता है। लेकिन फिर से, यह Google की सीमा पर रुक जाता है – तृतीय-पक्ष ऐप्स तक फैले व्यापक एजेंटिक व्यवहार के लिए, Google की अब तक की रणनीति लोकप्रिय तृतीय-पक्ष को Google के ऐप्स में एकीकृत करने की है (जैसे कि Asana या Trello जैसे ऐप्स के लिए स्मार्ट कैनवास चिप्स Docs/Chat में), बजाय इसके कि एआई को बाहर घूमने दिया जाए।
Notion AI – एकीकृत कार्यक्षेत्र सहायक
Notion, ऑल-इन-वन वर्कस्पेस ऐप, ने भी एक अनोखे दृष्टिकोण के साथ AI क्षेत्र में कदम रखा है। Notion AI को आपके सहायक के रूप में Notion के भीतर बनाया गया है, लेकिन खास बात यह है कि Notion ने AI कनेक्टर्स पेश किए हैं जो बाहरी डेटा को इसकी AI की नजर में लाते हैं[16][17]। दूसरे शब्दों में, Notion “एक ही जगह पर वह जानकारी प्राप्त करना चाहता है जिसकी आपको आवश्यकता है — भले ही वह आपके वर्कस्पेस के बाहर हो”[16] चाहता है। Notion AI के लिए कनेक्टर्स (वर्तमान में बिज़नेस/एंटरप्राइज़ उपयोगकर्ताओं के लिए बीटा में) जैसे टूल्स को लिंक करने की अनुमति देते हैं जैसे कि Slack, Google Drive, Jira, Github, और यहां तक कि Gmail को Notion की AI से जोड़ते हैं[18][19]। एक बार लिंक हो जाने पर, आप Notion की AI से प्राकृतिक भाषा में प्रश्न पूछ सकते हैं और यह उन जुड़े स्रोतों से प्रासंगिक जानकारी उद्धरण के साथ प्रस्तुत करेगा[17]। उदाहरण के लिए, आप Notion में पूछ सकते हैं, “मेरी टीम की कल की Slack चर्चा से एक्शन आइटम क्या थे?” और AI Slack चैनल से संदेशों को पुनः प्राप्त कर सकता है और उनका संक्षेपण कर सकता है, विशिष्ट संदेशों का हवाला देते हुए। या “क्या हमारे पास Q4 रोडमैप को रेखांकित करने वाला Google Doc है?” और यह उस Drive फ़ाइल से एक अंश खींच सकता है।
Notion के AI कनेक्टर्स की क्षमताएँ मुख्य रूप से खोज और सारांश पर केंद्रित हैं - Microsoft के Copilot कनेक्टर्स की तरह - लेकिन ज्ञान कार्य पर ध्यान केंद्रित करती हैं। Notion स्पष्ट रूप से नोट करता है कि कनेक्टर्स "सूचना खोजने और सारांश बनाने" के लिए सबसे अच्छे हैं, और भारी डेटा विश्लेषण या जटिल परिवर्तन निष्पादित करने के लिए नहीं[20]। सहायक कई स्रोतों से एक उत्तर में जानकारी एकत्र कर सकता है (कुछ सीमाओं के साथ कि वह एक बार में कितना संभाल सकता है)। यह मूल रूप से RAG (Retrieval-Augmented Generation) दृष्टिकोण अपना रहा है: Slack, Google Drive, आदि से प्रासंगिक सामग्री ढूंढें, और एक LLM का उपयोग करके एक उत्तर तैयार करें, जिसमें संदर्भ भी शामिल हों। यह उद्यम ज्ञान प्रबंधन के लिए अत्यंत उपयोगी है - कर्मचारी Notion AI चैट को क्वेरी कर सकते हैं और अपने दस्तावेज़ और संचार साइलो से प्राप्त उत्तर प्राप्त कर सकते हैं।
यूएक्स दृष्टिकोण से, Notion AI Notion एप्लिकेशन के अंदर एक चैट पॉपअप या एक साइडबार विजेट के रूप में रहता है (कोने में "लहराती भौहों के साथ दोस्ताना चेहरा" आइकन)[21]। यह आपके Notion कार्यक्षेत्र में जहां भी आप हैं, वहां उपलब्ध है। एक प्रमुख अंतर यह है कि Notion का सहायक आपके Notion पृष्ठों के संदर्भ के प्रति जागरूक है और Notion के भीतर भी कार्य कर सकता है (जैसे सामग्री संपादित करना या वर्तमान पृष्ठ का सारांश बनाना)। Notion ने हाल ही में Notion 3.0 में "एआई एजेंट" अवधारणा की घोषणा की है जो छोटे कार्यकर्ता मधुमक्खी की तरह कार्यों को स्वचालित भी कर सकता है (उदाहरण के लिए, एक एजेंट जो आपके कार्यक्षेत्र में कार्यों की एक श्रृंखला करने के लिए 20 मिनट तक बिना निगरानी के चल सकता है)[22]। यह एक अधिक स्वायत्त एजेंट दृष्टि की ओर संकेत करता है, हालांकि नियंत्रित परिदृश्यों में।
Notion की प्लेटफ़ॉर्म रणनीति जोड़ने वालों को जोड़कर अपने कार्य के केंद्र के रूप में अपनी गुरुत्वाकर्षण को बढ़ाना है। यदि आपकी सारी जानकारी - यहां तक कि अन्य ऐप्स से भी - Notion AI के माध्यम से एक्सेस की जा सकती है, तो यह Notion में रहने और इसे एक मिशन नियंत्रण के रूप में मानने के मामले को मजबूत करता है। Microsoft और Google के विपरीत, Notion न तो एक OS है और न ही एक ईमेल प्रदाता या स्टोरेज सेवा (उपयोगकर्ताओं द्वारा इसमें डाली जाने वाली सामग्री को छोड़कर), इसलिए यह अन्य लोगों के डेटा को खींचकर चालाकी से इसकी भरपाई कर रहा है। एक सीमा: Notion के कनेक्टर्स में कुछ विलंबता और दायरे की सीमाएँ हैं - उदाहरण के लिए, बाहरी सामग्री को शामिल करने में समय लग सकता है (वे उल्लेख करते हैं कि बड़ी मात्रा में डेटा को इंडेक्स करने में घंटे लग सकते हैं)[23], और सामान्यत: केवल पिछले वर्ष की सामग्री ही एक्सेस की जा सकती है[24]। इसके अलावा, Notion को अधिकांश कनेक्टर्स का उपयोग करने के लिए उच्च-स्तरीय योजना की आवश्यकता होती है, जिसका अर्थ है कि यह गंभीर व्यावसायिक उपयोग मामलों के लिए लक्षित है। टूलिंग पर निर्णय लेने वाले एक उत्पाद लीड के लिए, Notion का प्रस्ताव एक एकीकृत ज्ञान आधार है जिसमें एक AI दिमाग होता है जो आपकी कंपनी की जानकारी जानता है। समझौता यह है कि AI ज्यादातर Notion में प्रश्नों का उत्तर देने या सामग्री उत्पन्न करने तक ही सीमित है; इसे सामान्य सहायक के रूप में, जैसे ईमेल भेजने या Notion के बाहर मीटिंग शेड्यूल करने के लिए डिज़ाइन नहीं किया गया है।
पर्प्लेक्सिटी का कॉमेट – वेब और ऐप सुपरपॉवर्स वाला एक स्वतंत्र AI एजेंट
सहायक तकनीक की अग्रणी पर है पर्प्लेक्सिटी AI का “कॉमेट”, जो एजेंटिक कंप्यूटिंग दृष्टिकोण अपनाता है। पर्प्लेक्सिटी एक AI संचालित उत्तर इंजन (जैसे AI सर्च इंजन) के रूप में शुरू हुआ था, लेकिन कॉमेट (मध्य-2025 में लॉन्च) के साथ यह वेब ब्राउज़र को एक AI सहायक के रूप में पुनः परिभाषित करता है जिससे आप कहीं भी बातचीत कर सकते हैं। कॉमेट मूल रूप से एक ब्राउज़र है जिसमें एक अंतर्निहित AI सहपायलट है जो वेब पृष्ठों की सामग्री देख सकता है, ब्राउज़र को नियंत्रित कर सकता है, और उपयोगकर्ता खातों के साथ एकीकृत होकर कार्य कर सकता है[25][26].
Perplexity का कनेक्टर्स के प्रति दृष्टिकोण उल्लेखनीय रूप से महत्वाकांक्षी है: यह Gmail और Google Calendar कनेक्टर के साथ-साथ Notion, GitHub और अन्य उपकरणों के लिए कनेक्टर्स प्रदान करता है। जैसे ही आप, कहें, Gmail/Calendar कनेक्टर को सक्षम करते हैं, AI आपके ईमेल और इवेंट्स की जांच कर सकता है और उन पर कार्रवाई भी कर सकता है। उदाहरण के लिए, आप पूछ सकते हैं, "कल मुझे प्राप्त हुए ईमेल का सारांश दें और उन पर प्रकाश डालें जो मेरे ध्यान देने योग्य हैं," और सहायक आपके इनबॉक्स को पढ़कर एक डाइजेस्ट तैयार करेगा। आप आगे पूछ सकते हैं, "उस ग्राहक को एक विनम्र अनुस्मारक ईमेल भेजें जिसने अभी तक जवाब नहीं दिया है," और यदि आप Comet की पूर्ण क्षमताओं का उपयोग कर रहे हैं, तो यह वास्तव में आपके behalf पर वह ईमेल ड्राफ्ट और भेज सकता है। इसी तरह, यह आपके कैलेंडर की जांच कर सकता है और आपकी आने वाली बैठकों की सूची बना सकता है, और यहां तक कि प्राकृतिक भाषा कमांड्स के माध्यम से इवेंट्स शेड्यूल भी कर सकता है (उदाहरण के लिए "अगले बुधवार को सुबह 9 बजे प्रोजेक्ट प्लानिंग के लिए 1 घंटे की बैठक बनाएं" – और यह उस इवेंट को Google Calendar में जोड़ देगा)।
Comet के साथ उपयोगकर्ता अनुभव Copilot या Duet से काफी अलग है। Comet का AI ब्राउज़र के साइडबार में रहता है और इसे किसी भी वेबपेज पर बुलाया जा सकता है। क्योंकि यह एक ब्राउज़र है, इसका व्यापक दृष्टिकोण होता है - यह वेब खोज को व्यक्तिगत डेटा के साथ जोड़ सकता है। उदाहरण के लिए, यह उत्तर दे सकता है, “मैं कल किससे मिलने वाला हूँ?” आपके कैलेंडर इवेंट से नाम निकालकर और फिर उस व्यक्ति के लिए वेब या LinkedIn पर खोज कर एक त्वरित जीवनी प्रदान कर सकता है। यह मूल रूप से एक AI एजेंट की तरह काम करता है जो वेब सेवाओं और आपकी अपनी सेवाओं को एक साथ संचालित कर सकता है। सहायक की ब्राउज़र को नियंत्रित करने की क्षमता एक विशिष्ट विशेषता है: अगर कोई API कॉल विफल हो जाता है (मान लीजिए, यह आधिकारिक API के माध्यम से आपके ईमेल प्राप्त नहीं कर सकता), तो यह आपके खुले Gmail टैब को सचमुच नेविगेट करेगा और पृष्ठ सामग्री को एक इंसान की तरह पढ़ेगा, फिर आवश्यक चीजें निकाल लेगा। यह “अगर सब कुछ विफल हो जाता है, तो उपयोगकर्ता की नकल करें” दृष्टिकोण, जबकि कम कुशल है, यह दिखाता है कि एजेंट कार्य को पूरा करने के लिए कितनी दूर तक जाएगा।
Perplexity की प्लेटफ़ॉर्म रणनीति सबके ऊपर एक स्वतंत्र परत होने के बारे में है। Microsoft या Google के विपरीत, Perplexity किसी OS या प्रोडक्टिविटी सूट से जुड़ा नहीं है - इसका उद्देश्य यह है कि आप इसे किसी भी प्लेटफॉर्म पर इस्तेमाल करें। यह कई कनेक्टर्स (जैसे Google और Microsoft खाते) का समर्थन करता है और अपने स्वयं के ब्राउज़र के माध्यम से Mac या Windows पर काम करता है। इस तटस्थता के बदले, यह एक प्रीमियम पर आता है (उनकी "Perplexity Max" योजना) और फिलहाल यह एक पावर-यूज़र टूल है - एक उन्नत तकनीकी उपभोक्ता का AI साथी। एंटरप्राइज नेताओं के लिए, Perplexity यह दिखाता है कि जब आप AI को स्वतंत्र छोड़ते हैं तो क्या संभव है: वास्तविक क्रॉस-ऐप ऑटोमेशन। लेकिन यह जोखिमों को भी उजागर करता है - एक तृतीय-पक्ष AI को व्यापक अनुमतियाँ देने के लिए विश्वास की आवश्यकता होती है। यहाँ तक कि सुरक्षा अध्ययन हुए हैं (जैसे "CometJacking" पर) जो यह बताते हैं कि कैसे एक वेबपेज पर एक दुर्भावनापूर्ण प्रॉम्प्ट सहायक को अनपेक्षित कार्यों में धोखा दे सकता है अगर सुरक्षा उपाय असफल होते हैं[37][38]। यह दर्शाता है कि Microsoft और Google एंटरप्राइज सेटिंग्स में एक अधिक चरण-दर-चरण दृष्टिकोण अपना रहे हैं।
सारांश में, माइक्रोसॉफ्ट के Copilot कनेक्टर्स, गूगल के Duet AI, Notion का AI, और Perplexity का Comet सभी हमारे डिजिटल जीवन को अधिक जुड़ा हुआ और हमारे कार्यों को अधिक स्वचालित बनाने का लक्ष्य रखते हैं, लेकिन वे इसे अलग-अलग तरीके से पूरा करते हैं:
- माइक्रोसॉफ्ट कोपिलॉट: ओएस-स्तरीय एकीकरण, माइक्रोसॉफ्ट और गूगल की दुनिया को जोड़ते हुए, अब विंडोज अनुभव के भीतर एकीकृत खोज और सामग्री निर्माण पर ध्यान केंद्रित। रणनीति: अन्य इकोसिस्टम को समायोजित करके विंडोज को केंद्रीय बनाए रखना, व्यापक स्वीकृति का लक्ष्य।
- गूगल डुएट (जेमिनी): गूगल के इकोसिस्टम में गहराई से एम्बेडेड ऐप-विशिष्ट एआई, प्रत्येक वर्कस्पेस ऐप में संदर्भ-जानकारी सहायता प्रदान करता है। रणनीति: गूगल वर्कस्पेस के मूल्य (और लॉक-इन) को बढ़ाना, सबसे उत्तम एआई क्षमता सुनिश्चित करने के लिए अत्याधुनिक मॉडल के साथ उन सीमाओं के भीतर।
- नॉशन एआई: बाहरी डेटा को खींचता हुआ वर्कस्पेस ज्ञान सहायक, नॉशन में ज्ञान पुनः प्राप्ति और लेखन के चारों ओर उन्मुख। रणनीति: एआई का उपयोग करके उपकरणों के बीच संबंध जोड़कर नॉशन को काम के लिए केंद्र बनाना - लेकिन नॉशन की भूमिका को बढ़ाने पर ध्यान केंद्रित करना बजाय किसी भी बाहरी क्रियाओं को करने के।
- पर्प्लेक्सिटी कोमेट: एक स्वतंत्र एआई एजेंट व्यापक शक्तियों के साथ - वेब खोज + व्यक्तिगत ऐप एकीकरण + एक इंटरफ़ेस में कार्य करने की क्षमता (ईमेल भेजना, घटनाओं का शेड्यूल करना)। रणनीति: उन उपयोगकर्ताओं को आकर्षित करना जो एक एआई “बटलर” चाहते हैं जो सब कुछ के पार काम करता है, एजेंटिक कंप्यूटिंग के भविष्य को दिखाते हुए हालांकि अत्याधुनिक जोखिमों और लागतों के साथ।
क्रॉस-ऐप एआई सहायता द्वारा सक्षम उच्च-मूल्य उपयोग के मामले
ये कनेक्टर्स और इंटीग्रेशन क्यों महत्वपूर्ण हैं? वास्तविक दुनिया के उपयोग के मामले दिखाते हैं कि एआई सहायक समय कैसे बचा सकते हैं, रुकावट को कम कर सकते हैं, और यहां तक कि हमारे ऐप्स में बड़ी तस्वीर देखने के माध्यम से नई अंतर्दृष्टियाँ उजागर कर सकते हैं। यहां कुछ उच्च-मूल्य परिदृश्य हैं जो उद्यम और व्यक्तिगत उपयोगकर्ताओं दोनों के लिए हैं:
- एकीकृत खोज और जानकारी प्राप्त करना: शायद सबसे स्पष्ट लाभ साइलो खोजों को समाप्त करना है। जीमेल, फिर गूगल ड्राइव, फिर आउटलुक को अलग-अलग क्वेरी करने के बजाय, आप एक सवाल पूछ सकते हैं और एक समेकित उत्तर प्राप्त कर सकते हैं। उदाहरण के लिए, एक कार्यकारी पूछ सकता है, “मेरे खातों में Q3 बजट से संबंधित सभी दस्तावेज़ और ईमेल खोजें,” और कॉपिलॉट या Notion AI वनड्राइव/ड्राइव से फाइलों की सूची और जीमेल/आउटलुक से मेल खींच सकता है जो मेल खाते हैं। यह न केवल समय बचाता है बल्कि उन चीजों को भी उजागर कर सकता है जिन्हें आप भूल गए हों। यह आपके कार्यक्षेत्र के लिए एक व्यक्तिगत गूगल की तरह है। उद्यमों में, कर्मचारी जानकारी खोजने में अनगिनत घंटे बर्बाद करते हैं; एक AI जो एक एंटरप्राइज सर्च कंसीयज के रूप में कार्य करता है, अत्यधिक मूल्यवान है।
- ईमेल और दस्तावेज़ों का सारांश: इनमें से कई सहायक लंबे कंटेंट को पढ़ सकते हैं और आपको एक सारांश दे सकते हैं। कॉपिलॉट या डुएट सेकंडों में एक बहु-अनुच्छेद ईमेल श्रृंखला का सारांश बना सकते हैं – एक ईमेल श्रृंखला का सार प्राप्त करने के लिए उपयोगी है। गूगल का डुएट जीमेल में लंबे ईमेल एक्सचेंजों के लिए “इस थ्रेड का सारांश” देता है, और चैट में यह छूटी हुई वार्तालापों का स्वत: सारांश बनाता है। Perplexity का सहायक एक लंबे ईमेल या एक ही विषय पर कई ईमेल का सारांश बना सकता है। यह व्यस्त पेशेवरों के लिए महत्वपूर्ण है: कल्पना करें कि आप अपना दिन शुरू कर रहे हैं और पूछ रहे हैं, “कॉपिलॉट, पिछली रात के सभी अपठित ईमेल का सारांश बनाएं,” और एक संक्षिप्त ब्रीफिंग प्राप्त कर रहे हैं। इसी तरह, दस्तावेज़ों का सारांश बनाना – Notion AI एक जुड़े पीडीएफ या एक स्लैक थ्रेड का सारांश बना सकता है, गूगल का डुएट एक डॉक फ़ाइल या एक प्रतिलेख का सारांश बना सकता है। सारांश जानकारी को तेजी से पचाने में मदद करते हैं, और जब खोज के साथ जोड़ा जाता है, तो आप यहां तक कि “प्रोजेक्ट X के बारे में सभी फाइलों का सारांश बनाएं” जैसे काम भी कर सकते हैं ताकि सामूहिक ज्ञान जल्दी से प्राप्त हो सके।
- मीटिंग की तैयारी और फॉलो-अप: कैलेंडर और ईमेल डेटा का उपयोग करके AI सहायक शक्तिशाली मीटिंग सहायक बन सकते हैं। कनेक्टर्स के साथ, कोई पूछ सकता है, “मुझे कल Acme Corp के साथ अपनी मीटिंग के लिए क्या जानना चाहिए?” एक सक्षम सहायक (खासकर पर्प्लेक्सिटी जैसे या भविष्य में कॉपिलॉट के रूप में) आपके कैलेंडर की जांच कर सकता है, फिर उस क्लाइंट के साथ नवीनतम ईमेल, हाल के दस्तावेज़ या प्रस्ताव और शायद उपस्थित लोगों की लिंक्डइन प्रोफ़ाइल खींच सकता है – सब कुछ एक प्रेप ब्रीफ में संक्षेपित कर सकता है। वास्तव में, पर्प्लेक्सिटी के उदाहरण प्रश्नों में शामिल हैं “मैं इस सप्ताह किसके साथ मिल रहा हूँ? बायोस लिखो।”, जो AI को कैलेंडर से नाम एकत्रित करते हुए और प्रासंगिक जानकारी लाते हुए दिखाता है। मीटिंग के बाद, AI एक फॉलो-अप ईमेल का मसौदा तैयार करने में मदद कर सकता है या यहां तक कि एक प्रतिलेख दिया गया तो मीटिंग नोट्स को स्वत: उत्पन्न कर सकता है (गूगल का डुएट गूगल मीट में पहले से ही मीटिंग्स के लिए “ऑटो नोट्स और एक्शन आइटम्स” का वादा करता है)। उद्यम उपयोगकर्ताओं के लिए, ये क्षमताएं मीटिंग के आसपास कम मैनुअल लेगवर्क का मतलब है – AI एक जूनियर चीफ-ऑफ-स्टाफ के रूप में कार्य कर सकता है, यह सुनिश्चित करते हुए कि आप अंदर जाते समय सूचित हैं और परिणाम दस्तावेज़ किए जाते हैं।
- क्रॉस-एप्लिकेशन टास्क ऑटोमेशन: जैसे-जैसे AI सहायक परिपक्व होते जाते हैं, वे ऐप्स में फैले मल्टी-स्टेप कार्यों को पूरा करने लगे हैं। हम पर्प्लेक्सिटी कॉमेट में इसके शुरुआती संकेत देखते हैं – जैसे, यह एक विशेष ईमेल ढूंढ सकता है और फिर एक प्रतिक्रिया का मसौदा तैयार कर सकता है और उसे भेज सकता है, सब कुछ एक ही इंटरैक्शन के माध्यम से। ग्राहक समर्थन अनुरोध को संसाधित करने के कार्यप्रवाह पर विचार करें: एक AI ग्राहक से एक ईमेल की पहचान कर सकता है, एक डेटाबेस से संबंधित आदेशों को खींच सकता है (कनेक्टर्स या प्लगइन्स के माध्यम से), और एक व्यक्तिगत प्रतिक्रिया का मसौदा तैयार कर सकता है, शायद एक प्रोजेक्ट प्रबंधन उपकरण में एक फॉलो-अप कार्य भी बना सकता है। माइक्रोसॉफ्ट और गूगल के वर्तमान एकीकरण अधिक सहायक कदमों के बारे में हैं (यह जानकारी प्राप्त करें, उस सामग्री का मसौदा तैयार करें), लेकिन प्रक्षेपवक्र स्पष्ट रूप से ऑटोमेशन की ओर है: कॉपिलॉट कमांड पर दस्तावेज़ बना रहा है, या डुएट ईमेल से संक्षेपित डेटा के आधार पर एक स्प्रेडशीट को अपडेट कर रहा है। Notion के AI एजेंट्स के दृष्टिकोण से कार्यस्थान के अंदर नियमित कार्यों को स्वचालित करने के बारे में संकेत मिलते हैं (जैसे प्रोजेक्ट की स्थिति को अपडेट करना या AI क्रियाओं के साथ बग रिपोर्ट का ट्रायज करना)। यहाँ उच्चतम-मूल्य परिदृश्य मनुष्यों को “स्विवल-चेयर” कार्य से मुक्त करना है – ऐप्स के बीच जानकारी को स्थानांतरित करने या मामूली कार्यों को निष्पादित करने के लिए बार-बार टॉगल करना। इसके बजाय, आप सहायक को डेलीगेट कर सकते हैं।
- प्राथमिकता और निर्णय समर्थन: जानकारी के अधिभार के साथ, केवल खोज या सारांश बनाना पर्याप्त नहीं है – हमें अक्सर यह तय करने में मदद की आवश्यकता होती है कि क्या महत्वपूर्ण है। AI सहायक कनेक्टर्स का उपयोग करके अंतर्दृष्टि और प्राथमिकता प्रदान कर सकते हैं। उदाहरण के लिए, पर्प्लेक्सिटी का सहायक “इस सप्ताह के महत्वपूर्ण ईमेल” की पहचान कर सकता है, न कि केवल सभी ईमेल का सारांश। यह निर्धारित कर सकता है कि कौन से संदेश सबसे पहले आपके ध्यान की आवश्यकता हो सकती है (शायद कुछ कीवर्ड, प्रेषक महत्व, या उल्लिखित समय सीमा को देखकर)। कॉपिलॉट जल्द ही जवाब देने में सक्षम हो सकता है, “कौन से उच्च प्राथमिकता वाले कार्य मैंने ईमेल में किए हैं?”, जो आपके संचार को वादों या समय सीमाओं के लिए स्कैन करना शामिल होगा। इस तरह के उच्च-क्रम के उत्तर व्यक्तिगत उत्पादकता के लिए और बहुत सारे इनपुट का प्रबंधन करने वाले प्रबंधकों के लिए बेहद मूल्यवान हैं। कैलेंडर, ईमेल, और टास्क टूल्स के साथ एकीकृत करके, AI यहां तक कि सक्रिय रूप से सुझाव भी दे सकता है, “आज आपकी बैक-टू-बैक मीटिंग्स हैं, और 5 ईमेल महत्वपूर्ण रूप से चिह्नित हैं – क्या आप प्रत्येक का सारांश और दोपहर तक एक मसौदा प्रतिक्रिया चाहते हैं?” यह सहायक को प्रतिक्रियाशील क्वेरी उत्तरदाता से प्रोएक्टिव पार्टनर में बदल देता है, जो अंतिम लक्ष्य है।
- सामग्री निर्माण और मल्टी-मोडल आउटपुट: अंत में, कनेक्टर्स द्वारा संवर्धित एक उपयोग का मामला समृद्ध सामग्री निर्माण है। माइक्रोसॉफ्ट कॉपिलॉट की एक प्रॉम्प्ट से ऑफिस दस्तावेज़ बनाने की क्षमता का मतलब है कि आप प्रभावी रूप से कह सकते हैं, “इस स्प्रेडशीट में डेटा का उपयोग करें और उस ईमेल से नोट्स लें, एक पावरपॉइंट प्रस्तुति बनाएं,” और एक पहला मसौदा देखें। गूगल का डुएट पहले से ही आपको चीजें करने देता है, “इस डॉक्स आउटलाइन को लें और इसे एक स्लाइड डेक बनाएं”, स्वचालित रूप से स्लाइड्स को आबाद करना। यह AI के माध्यम से हो रही क्रॉस-एप्लिकेशन मैजिक है। कनेक्टर्स AI को विभिन्न स्रोतों से सामग्री खिलाने के लिए फीड कर सकते हैं ताकि उन्हें मर्ज किया जा सके या बदला जा सके। यहां तक कि मल्टी-मोडल पहलू भी आते हैं: डुएट स्लाइड को स्पष्ट करने के लिए छवियां उत्पन्न कर सकता है; विंडोज में कॉपिलॉट विजन फीचर्स के साथ प्रयोग कर रहा है (जैसे आपकी स्क्रीन पर जो है उसका विश्लेषण करना या आपकी दी गई छवियों का)। हम एक परिदृश्य की परिकल्पना कर सकते हैं जहां आप कॉपिलॉट से कहते हैं, “एक्सेल फ़ाइल X से चार्ट के साथ वर्ड में एक रिपोर्ट बनाएं और मेरे गूगल ड्राइव में PDF Y से प्रासंगिक अंश शामिल करें,” और एक संश्लेषित दस्तावेज़ प्राप्त करें। यह सामग्री के विभिन्न प्रारूपों और ऐप्स में समन्वयन का प्रकार जटिल है लेकिन काम को तेज़ करने के लिए अत्यधिक मूल्यवान है।
इन सभी उपयोग के मामलों में, सामान्य धागा है सुविधा और संज्ञानात्मक वृद्धि। एआई कनेक्टर आपको खोजने, विशाल पाठ पढ़ने और दोहराए जाने वाले कार्यों से बचाते हैं। वे आपको उच्च-स्तरीय निर्णय लेने पर ध्यान केंद्रित करने की अनुमति देते हैं जबकि सहायक जानकारी एकत्र करने और तैयार करने का कठिन काम संभालता है। उत्पाद नेताओं और तकनीकी उपयोगकर्ताओं के लिए, ये केवल दिखावटी चीजें नहीं हैं - वे यह बदलते हैं कि कोई समय कैसे आवंटित करता है। दिन के पहले घंटे को खोजने और छांटने में बिताने के बजाय, आप इसे उन अंतर्दृष्टियों पर कार्य करने में खर्च कर सकते हैं जिन्हें एआई ने पहले ही आपके लिए पचा लिया है।
व्यापक निहितार्थ: एजेंटिक, मल्टीमॉडल, सहायक-आधारित कंप्यूटिंग की ओर
Microsoft का Copilot में Gmail, Drive और Calendar को एकीकृत करने का कदम agentic computing के भविष्य की ओर एक और कदम है - जहाँ सॉफ़्टवेयर एजेंट उपयोगकर्ताओं की मदद करने के लिए पहल करते हैं, बजाय इसके कि वे स्पष्ट, निम्न-स्तरीय आदेशों की प्रतीक्षा करें। यह उपयोगकर्ता अनुभव डिज़ाइन में एक बदलाव को भी रेखांकित करता है: ऐप-केंद्रित से सहायक-केंद्रित इंटरैक्शन की ओर। आइए विचार करें कि ये प्रवृत्तियाँ आगे क्या अर्थ ले सकती हैं:
- एजेंटिक कंप्यूटिंग: यह शब्द उन एआई सिस्टम्स को संदर्भित करता है जो हमारी ओर से एजेंट के रूप में कार्य कर सकते हैं, स्वायत्त निर्णय ले सकते हैं या न्यूनतम मार्गदर्शन के साथ कार्य कर सकते हैं। आज के कनेक्टर्स ज्यादातर सीधे संकेतों का जवाब देते हैं (“यह खोजें,” “वह संक्षेप करें”)। लेकिन एआई को हमारे सभी डेटा और टूल्स में जोड़कर, हम बहुत अधिक प्रोएक्टिव एजेंट्स के लिए आधार तैयार कर रहे हैं। यदि आप एआई को अपने कैलेंडर, ईमेल, फाइल्स, कार्य, आदि तक पहुंच देते हैं, तो आप इसे अंततः आपके सप्ताह को प्राथमिकताओं के आधार पर स्वतः शेड्यूल करने या छोटे ईमेल जवाब देने जैसी चीजें करते हुए देख सकते हैं (आपकी कभी-कभी निगरानी के साथ)। Notion ने एआई एजेंट्स का परिचय दिया है जो एक अवधि के लिए रूटीन टास्क को संभाल सकते हैं, इसका एक प्रारंभिक उदाहरण है[22]। माइक्रोसॉफ्ट और गूगल पूरी तरह से स्वायत्त नहीं हुए हैं (संभवतः विश्वसनीयता और विश्वास के कारण), लेकिन यहां तक कि Copilot में अब स्क्रीन संदर्भ के आधार पर कार्य सुझाव देने जैसी विशेषताएं हैं, और यह बैकग्राउंड में आपके लिए जानकारी को चुपचाप व्यवस्थित करने के लिए विकसित हो सकता है। कनेक्टर्स एजेंसी के लिए आवश्यक हिस्सा हैं – एक एजेंट बहुत कुछ नहीं कर सकता यदि यह आपके आधे जीवन से अंधा हो। अब जब Copilot विभिन्न सिस्टम्स को “देख” सकता है, अगला कदम इसे तय करने देना है कि सीमित तरीकों से कैसे सहायता करें बिना हर बार पूछे।
- मल्टी-मोडल इंटरैक्शन: सहायक अब इनपुट और आउटपुट दोनों में अधिकाधिक मल्टी-मोडल होते जा रहे हैं। यहां “मल्टीमोडल” का मतलब है टेक्स्ट, आवाज़, छवियों, शायद वीडियो या अन्य प्रारूपों को संभालना। उदाहरण के लिए, माइक्रोसॉफ्ट ने Copilot Vision के बारे में बात की है, जहां एआई आपकी स्क्रीन या साझा की गई छवियों को “देख” सकता है और उन्हें समझ सकता है[48]। स्क्रीनशॉट लेकर और Copilot से पूछना, “यह त्रुटि संदेश किस बारे में है?” या “इस पृष्ठ पर चार्ट को संक्षेप करें,” बातचीत में एक दृश्य मोडालिटी जोड़ता है। गूगल का Gemini मॉडल अत्यधिक मल्टीमोडल होने की उम्मीद है, संभवतः Duet को छवियों का विश्लेषण करने या भविष्य में वीडियो उत्पन्न करने की अनुमति देगा। आवाज़ एक और मोडालिटी है: हम पहले से ही Siri/Alexa से बात करते हैं, और हम जल्द ही अपने पीसी पर Copilot या अपने फोन पर Duet से जटिल अनुरोधों को आवाज़ दे सकते हैं (Perplexity के मोबाइल ऐप में पहले से ही इसकी एआई के लिए वॉयस क्वेरीज़ का समर्थन है)। उत्पाद डिज़ाइन के लिए, इसका मतलब है कि सहायक केवल एक चैट बॉक्स के रूप में नहीं, बल्कि एक मीटिंग के दौरान आपके कानों में एक आवाज़ के रूप में प्रकट हो सकता है (“आपका एआई कानाफूसी करता है: आपने पिछले महीने इसी मुद्दे पर चर्चा की थी, क्या आप उन नोट्स को देखना चाहते हैं?”) या जानकारी को उजागर करने वाले संवर्धित वास्तविकता ओवरले के रूप में। कनेक्टर्स मल्टीमॉडलिटी को बढ़ाते हैं अधिक प्रकार की सामग्री (छवियां, कैलेंडर टाइमलाइन्स, आदि) प्रदान करके जिस पर एआई विचार कर सकता है और प्रस्तुत कर सकता है।
- सहायक-आधारित यूएक्स पैरेडाइम: हम एक पैरेडाइम शिफ्ट की कगार पर हैं जहां प्राथमिक इंटरफ़ेस ऐप्स और मेनू का संग्रह नहीं, बल्कि एक बुद्धिमान सहायक के साथ बातचीत है। इसका मतलब यह नहीं है कि ऐप्स गायब हो जाते हैं, लेकिन हम उन्हें कैसे नेविगेट करते हैं, यह मौलिक रूप से बदल सकता है। माइक्रोसॉफ्ट का दृष्टिकोण इसका संकेत देता है: Windows Copilot सब कुछ पर बैठता है, इसलिए फोल्डर्स या मेनू के माध्यम से क्लिक करने के बजाय, आप बढ़ते हुए Copilot से इसे करने के लिए कह सकते हैं। गूगल अभी भी अपने ऐप्स के भीतर एआई को प्रदर्शित करता है, लेकिन यहां तक कि गूगल भी सामने की ओर सहायक (उदाहरण के लिए, Bard और Gemini को सेवाओं के प्रवेश बिंदु के रूप में) के साथ प्रयोग कर रहा है। जैसे-जैसे ये सहायक अधिक सक्षम होते जाते हैं, उपयोगकर्ता यह अपेक्षा करने लगेंगे कि कोई भी कार्य एक सरल अनुरोध से शुरू हो सकता है: “इसे ड्राफ्ट करें, उसे लाएं, वे दिखाएं, इसे अपडेट करें।” डेवलपर्स के लिए यूएक्स चुनौती यह है कि उनके उत्पादों को इस सहायक स्तर के साथ एकीकृत करें – संभवतः एपीआई या कनेक्टर्स के माध्यम से – ताकि उनकी कार्यक्षमता प्राकृतिक भाषा के माध्यम से पहुंच योग्य हो न कि केवल बटन क्लिक के माध्यम से।
उत्पाद नेताओं के लिए, इसका अर्थ स्पष्ट है: AI सहायक एक नए OS बन रहे हैं एक अर्थ में – एक मेटा-लेयर जो ऐप्स को समन्वित करती है। कंपनियों को यह सोचना चाहिए कि उनके उपकरण कैसे Copilot, Duet, या अन्य में प्लग कर सकते हैं, क्योंकि अगर आपके ऐप का डेटा या क्रियाएँ AI के लिए सुलभ नहीं हैं, तो उपयोगकर्ता जो सहायक पर बातचीत के लिए अधिक से अधिक निर्भर हो रहे हैं, आपके ऐप को नजरअंदाज कर सकते हैं। Microsoft और Notion के कनेक्टर्स, या OpenAI का प्लगइन इकोसिस्टम, एकीकरण के मार्ग प्रदान करते हैं। यह मानकों और खुलापन के सवाल भी उठाता है। क्या हम कई स्वामित्व वाले कनेक्टर्स की दुनिया देखेंगे (Microsoft के लिए एक, Google के लिए एक, Notion के लिए एक, आदि), या कोई सामान्य प्रोटोकॉल होगा ताकि कोई भी सहायक किसी भी ऐप से सुरक्षित तरीके से बात कर सके? फिलहाल, यह खंडित है, लेकिन बाजार का दबाव अधिक खुली अंतर-संचालनीयता को मजबूर कर सकता है – खासकर अगर उद्यम इसे मांगें।
एक और निहितार्थ है गोपनीयता और विश्वास। बड़ी शक्ति (आपके सभी ईमेल/फाइल्स को पढ़ने की) के साथ बड़ी जिम्मेदारी आती है। प्रत्येक खिलाड़ी इसे संबोधित कर रहा है: माइक्रोसॉफ्ट जोर देता है कि यह ऑप्ट-इन और उपयोगकर्ता-नियंत्रित है; गूगल कोशिश करता है कि डेटा को सुरक्षित रखा जाए और मॉडल को प्रशिक्षित करने के लिए इस्तेमाल न किया जाए (Duet उत्तर आपके डेटा होने चाहिए, न कि सामान्य ज्ञान); Notion स्पष्ट रूप से कहता है कि वे मॉडल को प्रशिक्षित करने के लिए ग्राहक डेटा का उपयोग नहीं करते और अनुमतियों का सम्मान करते हैं[49]; Perplexity एंटरप्राइज़-ग्रेड एन्क्रिप्शन और एडमिन नियंत्रण की बात करता है[50]। फिर भी, उपयोगकर्ताओं और संगठनों को एक छलांग लेना पड़ता है कि वे AI को संवेदनशील जानकारी में घूमने दें। सहायक-आधारित UX तभी सफल होगा जब ये सिस्टम विश्वसनीय और सुरक्षित साबित होंगे। एक आकस्मिक संदर्भ में एक भ्रम एक बात है; एक AI का कानूनी दस्तावेज को गलत तरीके से संक्षेपित करना या ईमेल गलत जगह भेजना एक गंभीर मुद्दा हो सकता है[51]। एजेंटिक कंप्यूटिंग के रास्ते में न केवल स्मार्ट मॉडल की आवश्यकता होगी, बल्कि मजबूत सुरक्षा, AI कार्यों की ऑडिटिंग, और संभवतः नए उपयोगकर्ता प्रशिक्षण की भी आवश्यकता होगी ("AI साक्षरता") ताकि लोग अपने सहायकों की प्रभावी ढंग से निगरानी कर सकें।
नेतृत्व और रणनीति के संदर्भ में, जो लोग उत्पाद या टूलिंग के निर्णय ले रहे हैं, उन्हें इन AI सहायकों को चमकदार डेमो के रूप में नहीं, बल्कि उत्पादकता उपकरण के रूप में देखना चाहिए, जो या तो संगठन को सुपरचार्ज कर सकते हैं या, अगर अनदेखा किया गया, तो इसे पीछे छोड़ सकते हैं। हम तुच्छ AI चैटबॉट्स के चरण से आगे बढ़ चुके हैं - यह काम के लिए एक बुनियादी ढांचा बनता जा रहा है। दूरदर्शी टीमें पहले से ही आंतरिक ज्ञान प्रबंधन को संभालने के लिए कोपायलट या डुएट का परीक्षण कर रही हैं, यह देख रही हैं कि समर्थन, कोडिंग, दस्तावेज़ीकरण आदि में कितना समय बचाया जा सकता है। इन उपकरणों का विचारशील उपयोग (गोपनीयता और AI आउटपुट के सत्यापन को संभालने के लिए नीतियों के साथ) का प्रतिस्पर्धी लाभ काफी हो सकता है। इसी प्रकार, सॉफ्टवेयर बनाने वाले व्यवसायों को सहायक-चालित UX दुनिया में प्रासंगिक बने रहने के लिए AI सहायता को एकीकृत करने पर विचार करना चाहिए।
निष्कर्ष: आगे के रास्ते के लिए अंतर्दृष्टि
Microsoft द्वारा Copilot में Gmail/Google Drive/Calendar connectors का परिचय केवल एक सुविधा नहीं है - यह व्यक्तिगत कंप्यूटिंग के विकास में एक रणनीतिक संकेतक है। प्लेटफार्मों के बीच की रेखाएं AI स्तर पर धुंधली हो रही हैं: उत्पादकता सहायक हमारे डिजिटल जीवन को संगठित कर रहे हैं ताकि हमें अधिक स्मार्ट तरीके से काम करने में मदद मिल सके। Microsoft, तृतीय-पक्ष एकीकरण को अपनाकर, Copilot (और विस्तार से Windows) को उपयोगकर्ता की उत्पादकता के केंद्रीय केंद्र के रूप में स्थापित कर रहा है, चाहे स्रोत कोई भी हो। यह प्रतिस्पर्धियों के लिए मानक बढ़ाता है: Google को यह सुनिश्चित करना होगा कि Duet AI Workspace के भीतर और शायद अंततः उससे परे भी, समान रूप से शक्तिशाली क्रॉस-कंटेक्स्ट सहायता प्रदान करता है ताकि उपयोगकर्ता इसके प्लेटफॉर्म से जुड़े रहें। Notion और Perplexity जैसे छोटे खिलाड़ी दिखा रहे हैं कि नवाचार जीवित और अच्छी तरह से है - उन्होंने ऐसी विशेषताओं का नेतृत्व किया है (जैसे स्वायत्त कार्य एजेंट और पूर्ण वेब एकीकरण) जिन्हें अब यहां तक कि तकनीकी दिग्गज भी अपना रहे हैं।
उत्पाद नेताओं और उन्नत टेक उपयोगकर्ताओं के लिए, मुख्य निष्कर्ष यह है कि उत्साह से अधिक अंतर्दृष्टि और व्यावहारिक प्रासंगिकता को प्राथमिकता दें। हाँ, "एजेंटिक कंप्यूटिंग" जैसे शब्द आकर्षक लग सकते हैं, लेकिन व्यावहारिक लाभ – एकीकृत खोज, स्वचालित रूप से उत्पन्न ब्रीफ, कम छूटे हुए ईमेल, तेज़ सामग्री निर्माण – आज बहुत वास्तविक और प्राप्त करने योग्य हैं। इन क्षमताओं को स्पष्ट सफलता मानदंडों के साथ पायलट करना बुद्धिमानी है: उदाहरण के लिए, क्या कोपायलट कनेक्टर्स के उपयोग से परियोजना अनुसंधान समय X% तक कम हो जाता है? क्या डुएट AI नियमित ईमेल का मसौदा तैयार करने में समय कम करता है? क्या नोटियन AI नए टीम सदस्यों को सहकर्मियों को परेशान किए बिना जानकारी खोजने में मदद करता है? अपनाने का मार्गदर्शन करने के लिए उन अंतर्दृष्टियों का उपयोग करें। इसके अलावा, उपयोगकर्ता अनुभव पर नजर रखें: कार्यप्रवाहों में AI सहायक को शामिल करना परिवर्तन प्रबंधन की मांग करता है। कुछ उपयोगकर्ताओं को सहायक पर विश्वास करने और उसे प्रभावी ढंग से उपयोग करने के लिए प्रशिक्षण की आवश्यकता होगी; अन्य इसे अति विश्वास कर सकते हैं, इसलिए सत्यापन पर दिशानिर्देश महत्वपूर्ण हैं।
बड़ी तस्वीर में, हम शायद एक ऐसी दुनिया की ओर बढ़ रहे हैं जहाँ आपका मुख्य डिजिटल सहायक आपके साथ उपकरणों और अनुप्रयोगों में यात्रा करता है, आपके इरादों को संगठित करता है। चाहे इसका नाम कोपायलट, डुएट, सिरी, एलेक्सा हो या कुछ और, अवधारणा समान होगी - एक सदा मौजूद संवादात्मक परत जो प्रौद्योगिकी के साथ आपके संपर्क का मध्यस्थता करती है। माइक्रोसॉफ्ट कोपायलट में नए जीमेल/ड्राइव कनेक्टर भविष्य की ओर संकेत करते हैं जहाँ ऐसा सहायक वास्तव में निष्पक्ष होगा, इस बात की परवाह किए बिना कि ऐप किसने बनाया है, यह अधिक ध्यान देगा कि यह आपके लिए काम कैसे पूरा कर सकता है। यह उन लोगों के लिए एक रोमांचक संभावना है जो इसे अपनाने को तैयार हैं, और यह हमें लंबे समय से कल्पित कंप्यूटिंग आदर्श के मोर्चे पर रखता है: प्रौद्योगिकी जो हमारे लिए एक सक्रिय, व्यक्तिगत और बुद्धिमान तरीके से काम करती है, बजाय इसके कि सिर्फ निर्देशों की प्रतीक्षा करती रहे।
यात्रा अभी शुरू हुई है, लेकिन दिशाएँ पहले से कहीं अधिक स्पष्ट हैं। नेताओं को इन विकासों को ध्यान से देखना चाहिए, साहसपूर्वक लेकिन सोच-समझकर प्रयोग करना चाहिए, और हमेशा इसे मुख्य प्रश्न से जोड़ना चाहिए: क्या यह लोगों और संगठनों को उनकी मूल्यों को अधिक प्रभावी ढंग से प्राप्त करने में मदद करता है? यदि उत्तर हाँ है – जैसा कि यह बढ़ता जा रहा है – तो कोपायलट (और इसके कनेक्टर्स) जैसे AI सहायकों का एकीकरण सिर्फ एक तकनीकी उन्नयन नहीं है, बल्कि आधुनिक कार्यस्थल के लिए एक रणनीतिक अनिवार्यता है। आखिरकार, प्रतिस्पर्धात्मक बढ़त उन्हीं के पास होगी जो मानव-AI सहयोग को रोज़मर्रा के कार्य का एक स्वाभाविक, उत्पादक हिस्सा बनाने का तरीका खोज लेते हैं।
[1] [3] [4] [7] [9] Windows पर Copilot: कनेक्टर्स और दस्तावेज़ निर्माण Windows इनसाइडर्स के लिए रोल आउट होना शुरू हो गया है | Windows इनसाइडर ब्लॉग
[2] [6] [8] Microsoft Copilot अब आपके Google खाते में सही सीट पर उड़ान भर सकता है
https://www.vice.com/en/article/microsoft-copilot-google-integration/
[5] [43] विंडोज़ पर कॉपायलट अब ऑफिस दस्तावेज़ बना सकता है और जीमेल से कनेक्ट हो सकता है | द वर्ज
[10] [11] [12] [14] [51] [52] गूगल का डुएट एआई अब डॉक्स, जीमेल और अन्य वर्कस्पेस ऐप्स में उपलब्ध है | द वर्ज
https://www.theverge.com/2023/8/29/23849457/google-duet-ai-docs-slides-gmail
[13] [15] [39] एक उन्नत Google चैट के लॉन्च की घोषणा | Google Workspace ब्लॉग
https://workspace.google.com/blog/product-announcements/welcome-new-google-chat
[16] [17] [18] [19] [20] [23] [24] [49] Notion एआई कनेक्टर्स – Notion सहायता केंद्र
https://www.notion.com/help/notion-ai-connectors
[21] [44] हमने Make with Notion पर जो कुछ भी लॉन्च किया
https://www.notion.com/blog/conference-product-releases
[22] Notion 3.0 कार्य स्वचालन के लिए AI एजेंट्स पेश करता है - Reworked
[25] [26] [35] [36] [40] Comet ब्राउज़र: व्यावहारिक उदाहरणों के साथ एक गाइड | DataCamp
https://www.datacamp.com/tutorial/comet-perplexity
[27] [28] [29] [30] [31] [32] [33] [34] [41] [50] Perplexity को Gmail और Google Calendar से जोड़ना | Perplexity सहायता केंद्र
[37] एजेंटिक ब्राउज़र सुरक्षा: परिप्रेक्ष्य कोमेट में अप्रत्यक्ष प्रॉम्प्ट इंजेक्शन
https://brave.com/blog/comet-prompt-injection/
[38] कॉमेटजैकिंग: एक क्लिक कैसे परिप्रेक्ष्य के कोमेट एआई को आपके विरुद्ध बदल सकता है...
[42] Google Workspace के लिए Duet AI अब सामान्य रूप से उपलब्ध है
https://workspace.google.com/blog/product-announcements/duet-ai-in-workspace-now-available
[46] शब्दों से परे: AI मल्टीमॉडल हो रहा है ताकि वह आपसे आपके स्थान पर मिल सके
[47] माइक्रोसॉफ्ट कोपायलट अब आपकी स्क्रीन पढ़ सकता है, गहराई से सोच सकता है, और जोर से बोल सकता है ...
[48] कॉपायलट विज़न: विंडोज के लिए मल्टीमॉडल AI असिस्टेंट जो आपकी स्क्रीन देखता है ...










