एए नया ऑपरेटिंग सिस्टम? चैटजीपीटी में ऐप्स और ऐप्स एसडीके (एमसीपी-आधारित): एक नया प्लेटफॉर्म अनलॉक करना

Blog image

लेखक: बॉक्सु ली मैकारॉन में

परिचय:

ChatGPT में ऐप्स अब तृतीय-पक्ष डेवलपर्स को इंटरएक्टिव मिनी-एप्लिकेशन बनाने की अनुमति देता है जो चैट इंटरफेस के अंदर रहते हैं। उपयोगकर्ताओं को वेबसाइटों या मोबाइल ऐप्स पर भेजने के बजाय, ये ऐप्स बातचीत के भीतर चलते हैं और मॉडेल की तर्कशक्ति का उपयोग करके कार्यों को संचालित करते हैं। शुरुआती साझेदार जैसे Canva, Coursera, Expedia और Zillow ने प्रदर्शित किया कि उपयोगकर्ता कैसे चैटGPT छोड़ने के बिना प्लेलिस्ट मांग सकते हैं, एक पोस्टर डिज़ाइन कर सकते हैं या रियल एस्टेट खोज सकते हैं[1]। नया ऐप्स SDK मॉडेल कंटेक्स्ट प्रोटोकॉल (MCP) पर आधारित है, जो एक खुला मानक है जो मॉडेल्स को बाहरी उपकरणों और यूजर इंटरफेस के साथ इंटरैक्ट करने की अनुमति देता है[2]। यह ब्लॉग MCP आधारित ऐप्स की संरचना पर गहराई से विचार करता है, SDK की क्षमताओं को समझाता है, ऐप बनाने की प्रक्रिया को चरण-दर-चरण दिखाता है, उपयोगकर्ता ऐप्स को कैसे खोजते और उपयोग करते हैं, इसे एक्सप्लोर करता है, और गोपनीयता और सुरक्षा के विचारों पर चर्चा करता है। पूरे लेख में हम आधिकारिक दस्तावेज़ों और प्रतिष्ठित पत्रकारिता का हवाला देते हैं ताकि विश्लेषण को विश्वसनीय स्रोतों में आधार बनाया जा सके।

मॉडल संदर्भ प्रोटोकॉल (MCP) को समझना

खुले मानकों का महत्व क्यों है

मॉडल संदर्भ प्रोटोकॉल ऐप्स SDK की नींव है। डेवलपर दस्तावेज़ के अनुसार, हर ऐप्स SDK एकीकरण एक MCP सर्वर का उपयोग करता है उपकरणों को प्रदर्शित करने, प्रमाणीकरण को संभालने और संरचित डेटा और HTML को पैकेज करने के लिए जो ChatGPT में प्रस्तुत होता है[2]। MCP एक खुला मानक है—कोई भी किसी भी भाषा में सर्वर को लागू कर सकता है और GPT‑4 या Codex जैसे मॉडल को कनेक्ट कर सकता है। खुला-स्रोत प्रकृति का मतलब है कि कोई विक्रेता लॉक-इन नहीं है; वही ऐप सैद्धांतिक रूप से किसी भी AI प्लेटफॉर्म पर चल सकता है जो प्रोटोकॉल को लागू करता है। यह खुलापन सामुदायिक योगदानों को प्रोत्साहित करता है और एक पारिस्थितिकी तंत्र को बढ़ावा देता है जो प्रारंभिक वेब के समान है, जहां HTTP जैसे मानकों ने इंटरऑपरेबल वेबसाइटों को सक्षम किया।

सर्वर, उपकरण और संसाधन

एक MCP सर्वर एक या अधिक उपकरणों को उजागर करता है। एक उपकरण वह क्रिया परिभाषित करता है जिसे मॉडल कॉल कर सकता है, जैसे “एक कानबान बोर्ड बनाना,” “घरों के लिए खोज करना,” या “एक प्लेलिस्ट उत्पन्न करना।” प्रत्येक उपकरण का वर्णन एक मशीन नाम, एक मानव‑अनुकूल शीर्षक और एक JSON स्कीमा द्वारा किया जाता है जो मॉडल को बताता है कि यह कौन से तर्क स्वीकार करता है। जब ChatGPT निर्णय लेता है कि उपकरण को आमंत्रित किया जाना चाहिए, तो यह सर्वर को एक संरचित कॉल भेजता है। सर्वर तर्क को निष्पादित करता है—चाहे API को क्वेरी करके, एक गणना करके या डेटाबेस के साथ इंटरैक्ट करके—और फिर एक उपकरण प्रतिक्रिया लौटाता है। इस प्रतिक्रिया में तीन फ़ील्ड शामिल होते हैं:

structuredContent – डेटा जो मॉडल को वर्तमान स्थिति का वर्णन करता है। उदाहरण के लिए, एक कानबन बोर्ड में स्तंभों और कार्यों की एक श्रेणी शामिल हो सकती है[3]।
content – वैकल्पिक पाठ जो सहायक उपयोगकर्ता को वापस बोलता है। यह परिणाम का सारांश दे सकता है या उपयोगकर्ता को निर्देश दे सकता है।
_meta – छिपा हुआ मेटाडेटा जो मॉडल के लिए दृश्य नहीं होता। डेवलपर्स इसका उपयोग UI घटकों में प्रयुक्त ID या सूची को संग्रहीत करने के लिए करते हैं। उदाहरण के लिए, बोर्ड उदाहरण में _meta में tasksById मानचित्र का उपयोग किया जाता है ताकि कार्य विवरण को मॉडल के सामने लाए बिना बनाए रखा जा सके[4]।

उपकरणों का उल्लेख संसाधनों के रूप में भी किया जा सकता है, जैसे कि HTML टेम्पलेट या छवियाँ, जिसे ui:// URL द्वारा संदर्भित किया जा सकता है। सर्वर इन संसाधनों को स्टार्टअप के दौरान रजिस्टर करता है। दस्तावेज़ बताती है कि चूंकि संसाधन OpenAI की इन्फ्रास्ट्रक्चर द्वारा कैश किए जाते हैं, डेवलपर्स को उन्हें वर्शन करना चाहिए, ताकि फाइलनाम में एक बिल्ड हैश शामिल हो[5]। अन्यथा, उपयोगकर्ता को परिनियोजन के बाद पुरानी UI दिखाई दे सकती है।

संरचित सामग्री बनाम मेटाडेटा

स्ट्रक्चर्ड कंटेंट और _मेटा के बीच का अंतर महत्वपूर्ण है। दस्तावेजों के अनुसार, स्ट्रक्चर्ड कंटेंट मॉडल के लिए दृश्य है और इसका उपयोग UI घटक को हाइड्रेट करने के लिए किया जाता है; _मेटा मॉडल से छिपा होता है और इसमें UI के लिए अतिरिक्त डेटा हो सकता है जैसे कि ड्रॉपडाउन मेनू के लिए सूचियाँ [3]। दृश्य और छिपे हुए डेटा को अलग करके, डेवलपर्स मॉडल से संवेदनशील जानकारी की सुरक्षा कर सकते हैं जबकि समृद्ध इंटरफेस को प्रस्तुत कर सकते हैं। यह डिज़ाइन न्यूनतम डेटा साझा करने को भी प्रोत्साहित करता है; केवल वही जो कार्य को पूरा करने के लिए आवश्यक है, उजागर किया जाता है, जो गोपनीयता सिद्धांतों के साथ मेल खाता है।

प्रमाणीकरण और सत्र

जब कोई उपयोगकर्ता पहली बार किसी ऐप को कॉल करता है, तो सर्वर को उनकी प्रमाणिकता की आवश्यकता हो सकती है। ऐप्स SDK OAuth 2.1 प्रवाह का समर्थन करता है; डेवलपर्स स्कोप निर्दिष्ट करते हैं और उपयोगकर्ताओं को पहचान प्रदाता के पास पुनर्निर्देशित करते हैं। एक बार जब उपयोगकर्ता सहमति प्रदान कर देता है, तो ऐप एक टोकन प्राप्त करता है और उपयोगकर्ता के डेटा तक पहुंच सकता है। सर्वर का काम सत्र स्थिति का प्रबंधन करना है, अक्सर उपयोगकर्ता के ChatGPT खाते के साथ कुंजीबद्ध डेटाबेस में टोकन संग्रहीत करके। इससे यह सुनिश्चित होता है कि बाद के टूल कॉल सत्र का पुनः उपयोग कर सकते हैं बिना उपयोगकर्ता को दोबारा संकेत दिए।

सुरक्षा सिद्धांत

OpenAI न्यूनतम विशेषाधिकार, स्पष्ट उपयोगकर्ता सहमति और गहराई में रक्षा पर जोर देता है[6]। ऐप्स को केवल आवश्यक न्यूनतम अनुमतियों का अनुरोध करना चाहिए, और उपयोगकर्ताओं को डेटा साझा करने की स्पष्ट रूप से अनुमति देनी होगी; मॉडल को कभी भी क्रेडेंशियल्स का अनुमान नहीं लगाना चाहिए। डेटा प्रतिधारण सीमित है: संरचित सामग्री केवल उपयोगकर्ता के प्रॉम्प्ट सक्रिय रहने तक रहती है, और लॉग्स को डेवलपर्स के साथ साझा करने से पहले संशोधित किया जाता है[6]। ऐप घटकों के लिए नेटवर्क एक्सेस को एक सामग्री सुरक्षा नीति द्वारा प्रतिबंधित किया गया है; iframes मनमाने ब्राउज़र एपीआई तक पहुंच नहीं सकते हैं, और सभी HTTP अनुरोध सर्वर से उत्पन्न होने चाहिए, न कि क्लाइंट से[7]। यह क्रॉस-साइट स्क्रिप्टिंग और टोकनों के बाहर जाने को रोकता है।

ऐप्स एसडीके: ChatGPT में वास्तविक एप्लिकेशन बनाना

Blog image

डेवलपर अनुभव

ऐप्स एसडीके एमसीपी को साधारण क्लाइंट लाइब्रेरी (वर्तमान में Python और TypeScript) और स्कैफोल्डिंग टूल्स में लपेटता है। जब आप एक ऐप बनाते हैं, तो आप टूल्स को परिभाषित करते हैं, यूआई टेम्पलेट्स को रजिस्टर करते हैं और सर्वर लॉजिक को लागू करते हैं। सर्वर आपके खुद के इंफ्रास्ट्रक्चर पर चल सकता है और किसी भी फ्रेमवर्क (FastAPI, Express, आदि) का उपयोग कर सकता है, लेकिन इसे एमसीपी एंडपॉइंट्स को लागू करना होगा। OpenAI विकास सर्वर और एक एमसीपी इंस्पेक्टर प्रदान करता है ताकि कॉल्स को स्थानीय रूप से परीक्षण किया जा सके।

डेवलपर्स लॉजिक और यूजर इंटरफेस, दोनों को डिज़ाइन करते हैं। UI आमतौर पर React में लिखा जाता है और स्थिर संसाधनों में संकलित किया जाता है। इन्हें ChatGPT में एक सैंडबॉक्स किए गए iframe के अंदर प्रस्तुत किया जाता है। इस iframe के भीतर, डेवलपर्स होस्ट के साथ इंटरैक्ट करने के लिए एक वैश्विक window.openai ऑब्जेक्ट का उपयोग कर सकते हैं। एक कस्टम यूएक्स बनाएं गाइड के अनुसार, यह API प्रदान करता है:

ग्लोबल्स – displayMode, maxHeight, theme और locale घटक को लेआउट और शैली के बारे में सूचित करते हैं[8]।
उपकरण पेलोड्स – toolInput, toolOutput और widgetState तर्क, परिणाम और रेंडर के दौरान स्थायी स्थिति को पढ़ने की अनुमति देते हैं[8]।
क्रियाएं – setWidgetState() संदेशों के बीच स्थायी स्थिति को सहेजता है; callTool() एक सर्वर क्रिया को ट्रिगर करता है; sendFollowupTurn() मॉडल को एक अनुवर्ती प्रॉम्प्ट भेजता है; requestDisplayMode() फुलस्क्रीन या पिक्चर-इन-पिक्चर मोड की अनुमति मांगता है[8]।
इवेंट्स – घटक openai:set_globals की सदस्यता ले सकता है जब होस्ट लेआउट या थीम को अपडेट करता है, और openai:tool_response जब एक उपकरण कॉल हल होती है[8]।

These APIs let developers build rich interactive components that stay synchronised with the model’s reasoning. For example, if a user drags a task to a new column in a kanban board, the component can send a callTool to update the server, persist the new state, and then return a new structuredContent. Meanwhile the model sees only the high‑level board state; the UI handles details like drag‑and‑drop.

Registering Tools and Templates

In the server code you register a tool and its template. For instance, in a TypeScript server you might write:

import { Tool, StructuredToolResponse } from "@openai/apps";

// Register UI template
server.registerResource("ui://kanban-board/abc123", buildHtml());



// टूल स्कीमा परिभाषित करें
const createBoard: Tool = {
  name: "createKanbanBoard",
  description: "दिए गए कार्यों और कॉलमों के साथ एक नया कानबन बोर्ड बनाएं",
  inputSchema: z.object({
    title: z.string(),
    columns: z.array(z.object({ name: z.string() })),
    tasks: z.array(z.object({ name: z.string(), columnIndex: z.number() }))
  }),
  async execute(input, ctx): Promise<StructuredToolResponse> {
    // बोर्ड की स्थिति की गणना करें
    const columns = input.columns.map((col, i) => ({
      id: i,
      title: col.name,
      taskIds: input.tasks.filter(t => t.columnIndex === i).map((_t, idx) => idx)
    }));
    const tasksById = input.tasks.map((task, id) => ({ id, name: task.name }));
    return {
      content: `बोर्ड '${input.title}' बनाया गया`,
      structuredContent: { title: input.title, columns },
      _meta: { tasksById, uiTemplate: "ui://kanban-board/abc123" }
    };
  }
};


यह \_meta फ़ील्ड छिपे हुए मेटाडेटा के लिए tasksById और पंजीकृत HTML का संदर्भ देने वाले uiTemplate को शामिल करता है। जब ChatGPT इस प्रतिक्रिया को प्राप्त करता है, तो यह संरचित सामग्री के साथ टेम्पलेट को प्रदर्शित करेगा। फिर, घटक में window.openai.toolOutput ऑब्जेक्ट बोर्ड डेटा को पढ़ सकता है और इसे प्रदर्शित कर सकता है।

### संस्करणिंग और कैशिंग

क्योंकि UI टेम्पलेट्स जैसी संसाधन OpenAI के सर्वरों पर कैश किए जाते हैं, डेवलपर्स को ui:// पहचानकर्ता में एक अद्वितीय हैश या संस्करण शामिल करना चाहिए। दस्तावेज चेतावनी देते हैं कि यदि आप पथ को अपडेट किए बिना नया संस्करण तैनात करते हैं, तो उपयोगकर्ता कैशिंग के कारण पुराने UI को देख सकते हैं[\[5\]](https://developers.openai.com/apps-sdk/build/mcp-server#:~\:text=1,prevent%20stale%20assets%20from%20loading)। एक सर्वोत्तम अभ्यास URL में कमिट SHA या बिल्ड ID को सम्मिलित करना है। यह सुनिश्चित करता है कि प्रत्येक तैनाती ताज़ा संसाधन का परिणाम दे।

### स्थिति बनाए रखना और फॉलो‑अप



कंपोनेंट्स को अक्सर स्थिति बनाए रखने की आवश्यकता होती है। उदाहरण के लिए, एक प्लेलिस्ट ऐप उपयोगकर्ताओं को गाने पसंदीदा बनाए रखने की अनुमति दे सकता है; ये पसंदीदा गाने बने रहने चाहिए भले ही उपयोगकर्ता अगला प्रश्न पूछे। setWidgetState() विधि structuredContent के बाहर डेटा संग्रहीत करती है और यह मोड़ों के बीच बनी रहती है[\[8\]](https://developers.openai.com/apps-sdk/build/custom-ux#:~\:text=,openai%3Atool_response)। मॉडल इस स्थिति को नहीं देखता, जिससे गोपनीयता सुनिश्चित होती है।

कभी-कभी ऐप को उपयोगकर्ता से एक स्पष्ट प्रश्न पूछने की आवश्यकता होती है। sendFollowupTurn() विधि कंपोनेंट को नया प्रॉम्प्ट वापस ChatGPT को भेजने की अनुमति देती है, जो तब प्रतिलिपि में दिखाई देगा जैसे कि मॉडल ने प्रश्न पूछा[\[8\]](https://developers.openai.com/apps-sdk/build/custom-ux#:~\:text=,openai%3Atool_response)। यह बहु-चरणीय वर्कफ़्लो के लिए उपयोगी है: उदाहरण के लिए, एक यात्रा बुकिंग ऐप उपयोगकर्ता के होटल चयन करने के बाद "आप कितनी रातें रुकेंगे?" पूछ सकता है।

## अपना पहला ऐप बनाना: चरण-दर-चरण मार्गदर्शिका



In this section we will build a simple **Task Tracker** app that demonstrates the core concepts of the Apps SDK. The app will let a user create tasks and organise them into categories. We choose this example because it is generic, easy to extend and showcases structured content, metadata, custom UI and tool calls.

1. Set up the MCP Server

First install the TypeScript SDK and scaffolding tool:

```bash
npm install -g @openai/apps-generator
apps init task-tracker
cd task-tracker
npm install

This command scaffolds a project with a server, a React frontend and build scripts. The server uses Express and the @openai/apps library. Run npm run dev to start the development server; the project includes an MCP Inspector that opens in your browser and simulates ChatGPT calling your app.

Define the Tool

Open src/server.ts and define a tool called createTasks. The tool accepts an array of tasks and returns structured content grouping them by category. It also provides a summary in the content field.

import { Tool, StructuredToolResponse } from "@openai/apps";



export const createTasks: Tool = {
  name: "createTasks",
  description: "श्रेणी के अनुसार समूहित कार्यों की सूची बनाएँ",
  inputSchema: z.object({ tasks: z.array(z.object({ name: z.string(), category: z.string() })) }),
  async execute({ tasks }): Promise<StructuredToolResponse> {
    const categories = Array.from(new Set(tasks.map(t => t.category)));
    const grouped = categories.map(category => ({
      name: category,
      taskIds: tasks.filter(t => t.category === category).map((_, i) => i)
    }));
    const tasksById = tasks.map((task, id) => ({ id, name: task.name, category: task.category }));
    return {
      content: `${categories.length} श्रेणियों में ${tasks.length} कार्य बनाए गए`,
      structuredContent: { categories: grouped },
      _meta: { tasksById, uiTemplate: "ui://task-tracker/1.0.0" }
    };
  }
};

इस्तेमाल करने से पहले टेम्पलेट को रजिस्टर करें:



```typescript
server.registerResource("ui://task-tracker/1.0.0", fs.readFileSync(path.join(__dirname, "../dist/index.html"), "utf8"));
server.registerTool(createTasks);

Build the Custom UI

Next open src/frontend/App.tsx. This React component will read the structuredContent and display categories and tasks. It will also allow users to mark tasks as complete and persist that state using setWidgetState.

import { useEffect, useState } from "react";

declare global {
  interface Window {
    openai: any;
  }
}

export default function App() {
  const [complete, setComplete] = useState<{ [id: string]: boolean }>(() => window.openai.widgetState?.complete || {});
  const output = window.openai.toolOutput;
  const tasksById = output?._meta?.tasksById || [];
  const categories = output?.structuredContent?.categories || [];

  // persist completion state
  useEffect(() => {
    window.openai.setWidgetState({ complete });
  }, [complete]);



  return (
    <div className="task-tracker">
      {categories.map((cat: any, ci: number) => (
        <div key={ci} className="category">
          <h3>{cat.name}</h3>
          <ul>
            {cat.taskIds.map((tid: number) => (
              <li key={tid}>
                <label>
                  <input type="checkbox" checked={complete[tid]} onChange={() => setComplete(prev => ({ ...prev, [tid]: !prev[tid] }))} />
                  {tasksById[tid].name}
                </label>
              </li>
            ))}
          </ul>
        </div>
      ))}
    </div>
  );
}

This component uses window.openai.toolOutput to access the structuredContent and _meta fields. It stores completion state in widgetState so that checking a box persists even when the user continues the conversation. On subsequent tool calls, the component can fetch new tasks or update existing ones. This demonstrates how to combine model reasoning with client‑side interactions.

Testing and Iterating

Run npm run dev again and open the MCP Inspector. In the prompt area, type:

@task‑tracker create a list of tasks: buy milk in shopping, finish report in work, call mom in personal

The inspector will show the structured content and render the task list UI. You can check tasks off; the state persists across turns. You can then ask ChatGPT: “Remind me of my tasks later.” Because the model retains context, it can call the tool again, display the UI and summarise your progress.

How Users Discover and Use Apps

Blog image

Named Mention and In‑Conversation Discovery

ChatGPT उन ऐप्स को सामने लाता है जब उसे लगता है कि वे उपयोगकर्ता की मदद कर सकते हैं। दो मुख्य खोज मोड हैं। नामित उल्लेख तब होता है जब उपयोगकर्ता स्पष्ट रूप से ऐप का नाम संकेत की शुरुआत में उल्लेख करता है; इस मामले में, ऐप स्वचालित रूप से सामने आ जाएगा[9]। उदाहरण के लिए, “@Spotify एक वर्कआउट प्लेलिस्ट बनाएं” तुरंत Spotify एकीकरण को सक्रिय करता है। उपयोगकर्ता को ऐप का नाम शुरू में रखना होगा; अन्यथा सहायक इसे बातचीत का हिस्सा मान सकता है।

संवाद में खोज तब होती है जब मॉडल संदर्भ के आधार पर यह निष्कर्ष निकालता है कि कोई ऐप मदद कर सकता है। प्रलेखन यह समझाता है कि मॉडल बातचीत के संदर्भ, पूर्व उपकरण के परिणाम और उपयोगकर्ता के लिंक किए गए ऐप्स का मूल्यांकन करता है ताकि यह निर्धारित किया जा सके कि कौन सा ऐप प्रासंगिक हो सकता है[9]। उदाहरण के लिए, यदि आप यात्रा योजनाओं पर चर्चा कर रहे हैं, तो ChatGPT उड़ानें बुक करने के लिए Expedia ऐप का सुझाव दे सकता है। एल्गोरिदम टूल विवरण और कीवर्ड जैसे मेटाडेटा का उपयोग करता है ताकि बातचीत को संभावित कार्यों से मेल किया जा सके[10]। डेवलपर्स क्रिया‑उन्मुख विवरण और स्पष्ट UI घटक नाम लिखकर खोज क्षमता में सुधार कर सकते हैं।

निर्देशिका और लॉन्चर

OpenAI एक ऐप डायरेक्टरी जारी करने की योजना बना रहा है जहां उपयोगकर्ता नए ऐप्स को ब्राउज़ और खोज सकते हैं[10]। प्रत्येक सूची में ऐप का नाम, विवरण, समर्थित प्रॉम्प्ट्स और कोई भी ऑनबोर्डिंग निर्देश शामिल होंगे। उपयोगकर्ता चैट में "+" बटन के माध्यम से लॉन्चर तक भी पहुंच सकते हैं; यह संदर्भ के आधार पर उपलब्ध ऐप्स का मेनू दिखाता है। ये प्रवेश बिंदु कम तकनीकी उपयोगकर्ताओं को नाम याद किए बिना ऐप्स खोजने और सक्षम करने में मदद करेंगे।

ऑनबोर्डिंग और सहमति

जब कोई उपयोगकर्ता पहली बार किसी ऐप को सक्रिय करता है, तो ChatGPT एक ऑनबोर्डिंग प्रक्रिया शुरू करता है। मॉडल उपयोगकर्ता से उनका खाता कनेक्ट करने के लिए कहता है (यदि आवश्यक हो) और बताता है कि ऐप को किस डेटा की आवश्यकता है। डेवलपर दिशानिर्देश इस बात पर जोर देते हैं कि ऐप्स को उपयोगकर्ताओं की गोपनीयता का सम्मान करना चाहिए, पूर्वानुमानित रूप से व्यवहार करना चाहिए और स्पष्ट नीतियां होनी चाहिए[11]। उपयोगकर्ताओं को स्पष्ट रूप से अनुमति देनी या अस्वीकार करनी होगी; चुपचाप डेटा एक्सेस की अनुमति नहीं है। एक बार कनेक्ट हो जाने पर, ऐप को बाद के इंटरैक्शन के लिए लिंक रखा जा सकता है, लेकिन उपयोगकर्ताओं के पास हमेशा डिस्कनेक्ट करने और अनुमतियों को रद्द करने की क्षमता होती है।

गोपनीयता, सुरक्षा और जिम्मेदार डिज़ाइन

विश्वसनीय ऐप्स के सिद्धांत

OpenAI की ऐप डेवलपर गाइडलाइन्स कई सिद्धांतों को परिभाषित करती हैं ताकि इकोसिस्टम सुरक्षित और विश्वसनीय बना रहे। ऐप्स को एक वैध सेवा प्रदान करनी चाहिए, एक स्पष्ट गोपनीयता नीति और डेटा संरक्षण प्रथाएँ होनी चाहिए, और उपयोग नीतियों का पालन करना चाहिए[11]। उन्हें डेटा संग्रह को न्यूनतम रखना चाहिए, संवेदनशील व्यक्तिगत जानकारी संग्रहीत नहीं करनी चाहिए और उपयोगकर्ता की सहमति के बिना डेटा साझा नहीं करना चाहिए[12]। ऐप्स को पूर्वानुमानित तरीके से व्यवहार करना चाहिए; वे मॉडल को हानिकारक या भ्रामक सामग्री उत्पन्न करने के लिए हेरफेर नहीं कर सकते।

डेटा सीमाएँ और न्यूनतमकरण

दिशानिर्देश इस बात पर जोर देते हैं कि ऐप्स को केवल उनके कार्य के लिए आवश्यक डेटा एकत्र करना चाहिए और उन्हें स्वास्थ्य रिकॉर्ड या सरकारी आईडी जैसे संवेदनशील डेटा का अनुरोध या भंडारण नहीं करना चाहिए। मॉडल को भेजी गई संरचित सामग्री में रहस्य शामिल नहीं होना चाहिए; छिपे हुए मेटाडेटा में उपयोगकर्ता टोकन या निजी विवरण संग्रहीत नहीं होने चाहिए। डेवलपर्स को OAuth के दौरान प्राप्त किसी भी टोकन के लिए मजबूत एन्क्रिप्शन और सुरक्षित भंडारण लागू करना चाहिए। सर्वर को उपयोगकर्ता सत्रों के बीच सख्त सीमाएं बनाए रखनी चाहिए; एक उपयोगकर्ता का डेटा कभी भी दूसरे के संदर्भ में नहीं लीक होना चाहिए।

SDK में सुरक्षा उपाय

यह सुरक्षा और गोपनीयता गाइड प्लेटफ़ॉर्म में निर्मित रक्षा तंत्रों का वर्णन करता है। यह न्यूनतम विशेषाधिकार और स्पष्ट उपयोगकर्ता सहमति को केंद्रीय सिद्धांतों के रूप में जोर देता है[6]। डेटा प्रतिधारण सीमित है; डेवलपर्स के लिए उपलब्ध लॉग्स को व्यक्तिगत पहचान योग्य जानकारी हटाने के लिए संशोधित किया जाता है, और संरचित सामग्री केवल तब तक रखी जाती है जब तक कि प्रॉम्प्ट की आवश्यकता होती है[6]। आईफ्रेम के भीतर से नेटवर्क एक्सेस सामग्री सुरक्षा नीति द्वारा प्रतिबंधित है; बाहरी फ़ेचेस को सर्वर के माध्यम से जाना चाहिए, अवैध क्रॉस-ओरिजिन अनुरोधों को रोकते हुए[7]। प्रमाणीकरण उद्योग-मानक OAuth प्रवाह का उपयोग करता है जिसमें अल्पकालिक टोकन होते हैं। डेवलपर्स को सुरक्षा समीक्षाओं, बग रिपोर्टिंग चैनलों और घटना निगरानी को लागू करने की आवश्यकता होती है ताकि परिचालन तैयारी बनाए रखी जा सके[7]।

निष्पक्षता और उपयुक्तता

ऐप्स को व्यापक दर्शकों के लिए उपयुक्त होना चाहिए। दिशानिर्देश उन ऐप्स पर रोक लगाते हैं जो लंबी सामग्री, जटिल ऑटोमेशन या विज्ञापन प्रदान करते हैं[13]। उदाहरण के लिए, एक ऐप को 30 मिनट का वीडियो देने या चैटजीपीटी के भीतर पूरे सोशल नेटवर्क की नकल करने की कोशिश नहीं करनी चाहिए। प्लेटफ़ॉर्म संक्षिप्त इंटरैक्शन को प्रोत्साहित करता है जो वार्तालाप के प्रवाह के पूरक हों। उल्लंघन से अस्वीकृति या हटाना हो सकता है।

अवसर और विचार

डेवलपर्स के लिए एक नया वितरण चैनल

तीसरे पक्ष के ऐप्स के लिए ChatGPT को खोलकर, OpenAI खुद को उपयोगकर्ताओं और सेवाओं के बीच एक "इरादा परत" के रूप में स्थापित करता है। डेवलपर्स अब चैट इंटरफ़ेस के माध्यम से लाखों उपयोगकर्ताओं तक पहुँच सकते हैं बिना अलग वेब या मोबाइल ऐप बनाए। ऐप्स में रुकावट को कम करने की क्षमता होती है: ऐप डाउनलोड करने या वेबसाइट पर जाने के बजाय, उपयोगकर्ता केवल बातचीत में सेवा का उल्लेख करते हैं। इससे उपकरणों तक पहुंच को लोकतांत्रिक बनाया जा सकता है और छोटे डेवलपर्स के लिए खेल का मैदान बराबर किया जा सकता है।

प्रारंभिक साझेदारियाँ संभावनाएँ दिखाती हैं: उपयोगकर्ता Coursera व्याख्यान देख सकते हैं जबकि ChatGPT से प्रश्न पूछ सकते हैं; Canva में पोस्टर डिज़ाइन कर सकते हैं; Expedia यात्रा विकल्प या Zillow रियल एस्टेट लिस्टिंग ब्राउज़ कर सकते हैं; Spotify प्लेलिस्ट बना सकते हैं; या Figma के साथ विचारों का आरेखण कर सकते हैं। क्योंकि ऐप्स चैट के अंदर चलते हैं, मॉडल सारांशित कर सकता है, विश्लेषण कर सकता है और सिफारिशें उत्पन्न कर सकता है, स्थिर सामग्री को इंटरैक्टिव पाठों में बदल सकता है। ऐप्स कई प्रदर्शन मोड भी प्रदान करते हैं—इनलाइन कार्ड, फुलस्क्रीन या पिक्चर‑इन‑पिक्चर—जो विभिन्न कार्यों के लिए लचीलापन प्रदान करते हैं।

उपयोगकर्ता की अपेक्षाओं का रूपांतरण

ऐप्स का उपयोग बिना संदर्भ बदले करने की क्षमता यह बदल सकती है कि लोग सेवाओं के साथ कैसे इंटरैक्ट करते हैं। ChatGPT सिर्फ एक चैटबॉट नहीं बल्कि इरादों के लिए एक सार्वभौमिक ऑपरेटिंग सिस्टम बन जाता है। जैसा कि Casey Newton ने देखा, यह हमें अलग-अलग ऐप्स लॉन्च करने से बस वही कहने की ओर ले जाता है जो हम चाहते हैं। कुछ विश्लेषकों ने इस बदलाव की तुलना ऐप स्टोर या ब्राउज़र के लॉन्च से की है: एकल प्लेटफ़ॉर्म जो कार्यक्षमता और प्रतिस्पर्धा को समेकित करता है।

हालांकि, यह परिवर्तन नियंत्रण और शक्ति के बारे में सवाल उठाता है। यदि ChatGPT यह निर्धारण करता है कि कौन से ऐप्स सामने आएंगे, तो यह एक गेटकीपर बन सकता है। न्यूटन चेतावनी देते हैं कि उपयोगकर्ता प्राथमिकताओं पर आधारित एक "AI ग्राफ" गोपनीयता जोखिम पैदा कर सकता है जो सामाजिक नेटवर्क की तुलना में अधिक गंभीर हो सकते हैं[16]। आर्थिक प्रोत्साहन ऐप्स के पे‑टू‑प्ले प्लेसमेंट या रैंकिंग की ओर ले जा सकते हैं। डेवलपर्स ChatGPT के लिए डिज़ाइन करने के लिए दबाव महसूस कर सकते हैं बजाय इसके कि वे उपयोगकर्ताओं के साथ अपने संबंध को खुद संभालें। यह महत्वपूर्ण है कि प्लेटफ़ॉर्म पारदर्शी और निष्पक्ष रहे ताकि विश्वास बना रहे।

नियामक और नैतिक प्रभाव

क्योंकि ऐप्स व्यक्तिगत डेटा—स्थान, संपर्क, भुगतान विधियों—तक पहुंच सकते हैं, नियामक यह जांच सकते हैं कि डेटा ChatGPT के माध्यम से कैसे प्रवाहित होता है। डेवलपर्स को गोपनीयता कानूनों जैसे GDPR का पालन करना होगा, हालांकि यह प्लेटफ़ॉर्म अभी तक यूरोपीय संघ में उपलब्ध नहीं है[17]। OpenAI ने अधिक विस्तृत गोपनीयता नियंत्रण और मुद्रीकरण विकल्पों का वादा किया है, जिसमें एक एजेंटिक वाणिज्य प्रोटोकॉल शामिल है जो चैट के भीतर त्वरित चेकआउट की अनुमति देगा[18]। इस पारिस्थितिकी तंत्र की सफलता मजबूत सुरक्षा, स्पष्ट उपयोगकर्ता सहमति और उचित आर्थिक मॉडलों पर निर्भर करेगी।

भविष्य की दिशाएं और अनुसंधान

ऐप्स SDK अभी भी पूर्वावलोकन में है, और कई विशेषताएँ अभी भी पूरी नहीं की गई हैं। डेवलपर रोडमैप में शामिल हैं:

सबमिशन और समीक्षा कार्यप्रवाह – वर्तमान में डेवलपर्स ऐप्स बना सकते हैं लेकिन उन्हें सार्वजनिक रूप से सूचीबद्ध नहीं कर सकते। एक औपचारिक समीक्षा प्रक्रिया दिशानिर्देशों का अनुपालन सुनिश्चित करेगी और विश्वास बनाएगी।
राजस्व साझाकरण और मुद्रीकरण – OpenAI ने एक एजेंटिक वाणिज्य प्रोटोकॉल का संकेत दिया जो उपयोगकर्ताओं को सीधे चैट में वस्तुओं को खरीदने की अनुमति दे सकता है[18]। यह ई-कॉमर्स के लिए अवसर पैदा करता है लेकिन शुल्क, रैंकिंग और प्रतियोगिता के बारे में प्रश्न भी उठाता है।
डेवलपर टूलिंग – अधिक भाषाएं और फ्रेमवर्क, उन्नत डिबगिंग उपकरण और आसान डिप्लॉयमेंट पाइपलाइन्स प्रवेश की बाधा को कम करेंगी। MCP की खुली मानक प्रकृति सामुदायिक-चालित कार्यान्वयन और होस्टिंग प्रदाताओं का नेतृत्व कर सकती है।
इंटरऑपरेबिलिटी – क्योंकि MCP खुला है, अन्य प्लेटफॉर्म या मॉडल इसे अपना सकते हैं। यह एक क्रॉस-मॉडल ऐप इकोसिस्टम को सक्षम कर सकता है जहां डेवलपर्स एक बार लिखते हैं और कहीं भी चलाते हैं। एजेंट प्रोटोकॉल और संदर्भ साझाकरण को मानकीकृत करने पर शोध महत्वपूर्ण होगा।
सुरक्षा अनुसंधान – प्रॉम्प्ट इंजेक्शन, दुर्भावनापूर्ण कोड, या उपयोगकर्ता डेटा के दुरुपयोग को रोकने का मूल्यांकन करना एक प्रमुख अनुसंधान क्षेत्र बना हुआ है। LLM-इंटीग्रेटेड अनुप्रयोगों के खिलाफ शत्रुतापूर्ण हमलों पर पेपर सर्वोत्तम प्रथाओं और दिशानिर्देशों को सूचित करेंगे।

निष्कर्ष: एक नया ऑपरेटिंग सिस्टम बन रहा है

ChatGPT में ऐप्स और MCP-आधारित ऐप्स SDK का परिचय इस बात में महत्वपूर्ण बदलाव को दर्शाता है कि हम सॉफ़्टवेयर के साथ कैसे इंटरैक्ट करते हैं। तीसरे-पक्ष एप्लिकेशन को सीधे चैट इंटरफ़ेस में लाकर, OpenAI ने एक नया प्लेटफ़ॉर्म बनाया है जो प्राकृतिक भाषा, तर्क और इंटरएक्टिव यूआई को मिलाता है। मॉडल संदर्भ प्रोटोकॉल मॉडल्स को उपकरणों को कॉल करने और घटकों को रेंडर करने के लिए एक खुला, मानकीकृत तरीका प्रदान करता है; ऐप्स SDK विकास को सरल बनाता है क्योंकि यह सर्वर संचार, यूआई एकीकरण और स्थिति प्रबंधन को संभालता है। टास्क ट्रैकर जैसे चरण-दर-चरण उदाहरण दिखाते हैं कि कैसे यह एक उपयोगी ऐप बनाना कितना आसान है, जबकि सख्त डेटा सीमाएं और गोपनीयता बनाए रखते हुए।

फिर भी, यह नवाचार ज़िम्मेदारियों के साथ आता है। डेवलपर्स को दिशानिर्देशों का पालन करना चाहिए जो उपयोगकर्ता की गोपनीयता, सुरक्षा और निष्पक्षता को प्राथमिकता देते हैं[11][12]। कम से कम विशेषाधिकार और स्पष्ट सहमति जैसी सुरक्षा तंत्र उपयोगकर्ताओं की सुरक्षा करते हैं[6]। साथ ही, उद्योग पर्यवेक्षकों ने चेतावनी दी है कि मंच नए प्रकार के गेटकीपिंग और गोपनीयता जोखिम पैदा कर सकता है[16]। जैसे-जैसे इकोसिस्टम परिपक्व होता है, पारदर्शिता, खुले मानक और सामुदायिक भागीदारी यह निर्धारित करेंगे कि क्या ChatGPT का ऐप प्लेटफ़ॉर्म दैनिक कार्यों के लिए एक परिवर्तनकारी, विश्वसनीय परत बनता है।

[1] एआई आर्म्स रेस का नवीनतम: ChatGPT अब उपयोगकर्ताओं को Spotify और Zillow के साथ चैट में कनेक्ट करने देता है

https://www.forbes.com/sites/antoniopequenoiv/2025/10/06/openais-chatgpt-now-connects-with-third-party-apps-like-spotify-and-zillow-heres-the-latest-in-the-ai-arms-race/

[2] [3] [4] [5] अपने सर्वर को सेट करें

https://developers.openai.com/apps-sdk/build/mcp-server

[6] [7] सुरक्षा और गोपनीयता

https://developers.openai.com/apps-sdk/guides/security-privacy

[8] एक कस्टम UX बनाएं

https://developers.openai.com/apps-sdk/build/custom-ux

[9] [10] उपयोगकर्ता इंटरैक्शन

https://developers.openai.com/apps-sdk/concepts/user-interaction

[11] [12] ऐप डेवलपर दिशानिर्देश

https://developers.openai.com/apps-sdk/app-developer-guidelines/

[13] ChatGPT ऐप्स लाइव हैं: यहाँ वे पहले ऐप्स हैं जिन्हें आप आज़मा सकते हैं | द वर्ज

https://www.theverge.com/news/793081/chagpt-apps-sdk-spotify-zillow-openai

[14] OpenAI DevDay 2025: ChatGPT को ऐप्स, डेवलपर्स के लिए AgentKit, और सस्ते GPT मॉडल्स मिले

https://indianexpress.com/article/technology/artificial-intelligence/openai-devday-2025-chatgpt-gets-apps-agentkit-for-developers-and-cheaper-gpt-models-10292443/

[15] OpenAI Apps SDK की घोषणा करता है, जिससे ChatGPT को Zillow, Canva, Spotify जैसे थर्ड पार्टी ऐप्स लॉन्च और रन करने की अनुमति मिलती है | VentureBeat

https://venturebeat.com/ai/openai-announces-apps-sdk-allowing-chatgpt-to-launch-and-run-third-party

[16] नया प्लेटफॉर्म, परिचित जोखिम: Zillow और Expedia ने OpenAI के ChatGPT ऐप्स के रोलआउट पर दांव लगाया – GeekWire

https://www.geekwire.com/2025/new-platform-familiar-risks-zillow-and-expedia-bet-on-openais-chatgpt-apps-rollout/

[17] OpenAI DevDay: ChatGPT ऐप्स, AgentKit, और Codex का GA रिलीज़ - SD Times

https://sdtimes.com/ai/openai-devday-chatgpt-apps-agentkit-and-ga-release-of-codex/

[18] OpenAI ChatGPT को एक सार्वभौमिक ऐप फ्रंटएंड बनाना चाहता है - आर्स टेक्निका

https://arstechnica.com/ai/2025/10/openai-wants-to-make-chatgpt-into-a-universal-app-frontend/