作者:Boxu Li在 Macaron
介紹:
微軟最新更新的 Windows Copilot 已經悄然但顯著地擴展了 AI 的影響範圍。在 2025 年 10 月的推送中,Copilot 獲得了連接 Google 服務 – Gmail、Google Drive、Google Calendar 和 Contacts 的能力,這些服務與微軟自家的 Outlook 郵件、OneDrive 等相輔相成[1]。此舉打破了微軟與 Google 生態系統之間長期存在的壁壘。透過簡單的選擇加入,Windows 用戶現在可以利用 Copilot 搜索並綜合來自各個帳戶和應用程式的個人資訊,這一切都通過單一的 AI 助理介面完成[2][3]。這是前所未有的跨平台合作:微軟的 AI 積極進入 Google 的領域,幫助用戶完成工作。
在本次深入分析中,我們將探討這些新連接器的功能及其在 Copilot 中的運作方式,並將微軟的做法與競爭對手如Google 的 Duet AI/Gemini、Notion AI 和 Perplexity 的 Comet 進行對比。我們將探索所解鎖的最高價值用例——從統一搜索和電子郵件摘要到會議準備和文件創建——並反思這一趨勢對代理計算、多模態交互和助手驅動的用戶體驗未來的意義。這裡的語調是實用且具有戰略性的,直擊產品領導者的痛點,幫助他們清晰地了解個人 AI 助手的發展方向。
Copilot 的 Gmail、Drive 和 Calendar 連接器——運作方式

Microsoft 的連接器更新核心功能是讓 Windows 上的 Copilot 成為跨個人內容的通用搜尋欄和助手,無論該內容位於 Microsoft 應用程式中還是 Google 服務中。啟用連接器(通過 Copilot 設定中的切換開關)後,AI 在您明確同意後獲取訪問 Gmail、Google Drive、日曆、聯絡人、Outlook 和 OneDrive 中數據的權限[3]。
Copilot 可以利用這個權限做什麼呢?在這個初始版本中,重點在於自然語言搜尋和檢索。你可以向 Copilot 提問或下達指令,例如「Sarah 的電子郵件地址是什麼?」或「找出我上週的學校筆記」,Copilot 將從任何連接的帳戶中檢索相關信息。例如,如果 Sarah 的電子郵件存儲在你的 Google 通訊錄或 Outlook 地址簿中,Copilot 會顯示出來。如果你的「學校筆記」是存放在 Google Drive 的 Google Docs(或 OneDrive 的 Word 文件)中,Copilot 能找到這些文件並呈現出來。這位助手基本上將你不同的儲存和通信孤島視為一個統一的知識庫。
微軟自己的演示中強調了一個查詢如何能從多個來源中提取資料。使用者可以要求從某個客戶取得所有發票,Copilot 可能會檢查 Outlook 和 Gmail 收件匣來彙整結果[5]。或者您可能記得將 PDF 儲存到了雲端,但不記得具體位置 – Copilot 可以同時搜尋 OneDrive 和 Google Drive 來找到它。這一切都通過 Windows 上的 Copilot 聊天介面完成,也就是說,使用者不必手動開啟瀏覽器、啟動應用程式,或者在 Gmail 和 Explorer 中分別進行搜尋。設定好後,一切都變得暢通無阻。
重要的是,這些連接是選擇性和細緻的。預設情況下,Copilot 不會觸碰你的 Gmail 或 Google 資料,除非你在設定中連結這些帳戶[6]。你可以選擇連接某些服務而不連接其他服務(例如,可能連結 Gmail 但不連結 Google Drive,或反之亦然),因此用戶保有控制權。Microsoft 目前也限制了讀取/搜尋的功能作為保護措施,Copilot 在此初始版本中不會自動透過這些連接器發送電子郵件或新增行事曆事件(它是從你的資料中讀取,而非寫入,除非你明確要求它生成內容)。這種謹慎的方法可能是為了建立用戶信任,考量到個人電子郵件和檔案的敏感性。
值得注意的是,微軟將連接器的推出與另一項新功能結合:通過 Copilot 創建和匯出文件。現在,你可以指示 Copilot 從提示中生成 Word 文檔、Excel 表格、PowerPoint 簡報或 PDF,甚至直接將內容匯出到這些格式[7]。例如,你可以要求「撰寫項目狀態更新並匯出到 Word」,Copilot 會照辦。這與連接器相輔相成:助手不僅能在各個賬戶中查找信息,還能幫助你使用這些信息生成新作品(電子郵件、文件等)。長期願景是一個能無縫收集和生成內容的 AI,成為你的跨應用生產力夥伴。
Copilot 體驗內幕:統一搜尋與情境化回答
那麼,使用這些連接器與 Copilot 的用戶體驗是什麼樣的?實際上,Copilot 在 Windows 11 上作為側邊欄/聊天固定存在(可以通過點擊或快捷鍵喚出)。不同之處在於它如何理解您的查詢並組織回答。當您詢問涉及個人數據的問題時,Copilot 的 AI 將安全地查詢您連接服務的索引。在幕後,微軟可能使用 API 調用 Google 和 Microsoft Graph 以獲取相關結果,然後 AI 模型將其摘要或直接呈現。
在 Copilot 的介面中,來自您的個人數據的答案通常會附帶上下文呈現。例如,如果您詢問某個聯絡人的電子郵件地址,Copilot 可能只會顯示電子郵件(例如「Sarah 的電子郵件是 sarah@example.com」)。如果您詢問文件或筆記,Copilot 可能會列出幾個文件名或片段,並標示它們來自哪個服務(例如「在OneDrive中找到Marketing Plan.docx,最後修改於 9 月 5 日」或「在Google Drive中找到Q3 OKRs,上週修改」)。微軟為 Copilot 設計強調透明性,讓用戶知道來源——類似於 Bing Chat 引用其網頁來源。早期預覽顯示,結果旁邊有「Gmail」或「OneDrive」等來源標籤,這有助於建立信任,讓用戶相信 Copilot 並不是在胡說,而是真正找到了您帳戶中的項目。
這種統一方法的價值在您第一次使用時就會變得明顯:不再需要在腦中索引「那次對話是在 Gmail 還是 Outlook?我把那個 PDF 存在哪裡了?」您只需詢問 Copilot,它就能幫您找出位置。這本質上是一種操作系統層級的智能搜索,由 AI 理解您的查詢來驅動。Windows 長期以來都有搜索索引功能,但 Copilot 通過自然語言和跨越多個雲端帳戶的搜索將其提升到了新的層次。
當然,這有其限制。最初,Copilot 連接器處理搜索和簡單檢索;它們可能尚不支持複雜的多步驟請求(例如「找到我老闆關於 Project Zeus 的所有電子郵件並草擬要點總結」)。目前,您可能需要將其分解成多個步驟:先讓 Copilot 找到電子郵件,然後讓它總結。隨著整合的深化,我們可以期待 AI 更流暢地處理此類多步驟代理查詢。微軟可能正在從這個 Windows Insider 版本[8][9]中收集反饋,然後進一步擴展功能。
微軟 vs 谷歌 vs 其他:AI 助理的不同策略
微軟的跨平台助理策略與同行的做法形成鮮明對比。通過將 Copilot 開放到谷歌的領域,微軟表明用戶便利性優於生態系統鎖定——這是一個大膽的舉動,服務於依賴谷歌服務的 Windows 用戶。這與谷歌在 Workspace 中的 AI 助理或Notion 和 Perplexity 的方法相比如何?讓我們來看看在功能、用戶體驗和平台策略上的主要差異:
Google Duet AI (Gemini) – 深度整合,同一生態系統
Google 對 Copilot 的回應是 Google Workspace 的 Duet AI,現在隨著 Gemini 模型的力量不斷發展。Duet 是一個 AI 合作者,嵌入在 Gmail、Docs、Drive、Slides、Meet 等多個應用中[10][11]。其功能範圍從幫助您撰寫電子郵件和文件,到在 Slides 中生成圖像,或總結長對話或會議記錄。例如,在 Gmail 中,您可以點擊「幫我寫」選項,讓 Duet 起草回覆;在 Docs 中,您可以請它總結文件。在 Slides 中,Duet 可以根據提示創建視覺效果或建立演示文稿大綱[12]。實質上,Google 已將 AI 功能編織到每個應用的 UI 中:一個側欄或菜單,您可以在其中調用 Duet 來幫助處理當前上下文。
在跨應用程式搜尋方面,Google 已開始在其自身生態系統內啟用一些跨應用程式的智慧功能。Google 宣布了 Duet AI 的計畫,將*「通過搜尋 Gmail 和 Drive 中的訊息和檔案來回答複雜的查詢」*,並在聊天空間中總結文件[13]。實際上,這呈現為一種增強的 Google Chat 體驗——你可以在 Chat 中查詢 AI,然後它可以從你的 Gmail 和 Drive 中提取資訊來回答。舉例來說,你可能會在 Chat 中詢問:「總結一下 John 分享給我的預算提案文件和任何相關的電子郵件」,而 Duet 可以從 Drive 檢索文件和相關的 Gmail 線程,提供一個整合的答案。這在概念上類似於 Copilot 的統一搜尋,但僅限於 Google 的世界。Duet 不會進入,例如,你的 Outlook 收件箱或 OneDrive,因為 Google 的重點(可以理解)是讓你留在 Workspace 內。
從 用戶體驗的角度來看,Google 的方法意味著 AI 在每個應用程式中都是情境感知的。Duet 以 側邊欄的形式出現在 Gmail 和 Google Docs 等應用程式中(由一個圖標表示,通常是一個小火花或 Duet 標誌)。你可能正在閱讀電子郵件,然後點擊 Duet 獲取選項,例如「總結此對話」或「撰寫回覆」。或者在 Google Drive 中,你可以要求 Duet「查找有關 Project Atlas 的文件」,這實際上是對 Drive 的搜尋。這種設計讓 AI 感覺像是一個為每個特定任務提供的內建助手,而不是一個無所不在的聊天盒。好處是一個量身定制的體驗——Duet 知道你在哪個應用程式中,並提供相關的幫助(例如,在 Sheets 中提供格式化幫助,在 Slides 中提供幻燈片設計等)。缺點是碎片化:用戶與 Duet 的互動是分片式的,而不是在一個地方與 AI 進行任何主題的對話。
從策略上來看,Google 正在利用 Duet(以及背後即將推出的 Gemini 模型)來加強 Workspace 的價值主張。這是一個高級附加功能(企業用戶每位大約 30 美元),直接與 Microsoft 365 Copilot 的定價競爭[14]。 Google 的平台策略仍然是生態系統封閉,這項 AI 是讓使用者更多使用 Google 應用程式的理由,且沒有跡象顯示 Google 會讓其助理像 Microsoft 擁抱 Google 的方式那樣自然地接觸 Microsoft 服務。簡而言之,Google 的意思是:「將您的資料保存在 Workspace,我們的 AI 會是您的專家助理。」這對已經是 Google 原生的公司來說很有吸引力,但對於同時使用 Google 和 Microsoft 服務的用戶來說,卻沒有太多幫助來彌合差距——這正是 Microsoft 希望透過 Windows 的 Copilot 來填補的空缺。
值得注意的是,Google 強調 AI 模型的強度和多樣性。Gemini 是 Google 的先進生成 AI,被認為具備多模態能力(如視覺、文字等)和更強的推理能力。我們可能很快就會看到 Duet 更智能地處理圖像或圖表,或整合 Google 的搜索能力以提供實時信息。透過在其平台上嵌入強大的模型,Google 可以提供一種體驗,讓 AI 感覺 像是一位了解你所有文檔和電子郵件的知識豐富的同事,同時也熟悉網絡。不過,這仍然止於 Google 的邊界—對於跨第三方應用的更廣泛自主行為,Google 到目前為止的策略是將流行的第三方 整合到 Google 的應用中(例如在 Docs/Chat 中為 Asana 或 Trello 等應用提供智能畫布元素[15]),而不是讓 AI 自由運行於外部。
Notion AI – 統一的工作空間助手
Notion,這個全方位工作空間應用程式,也以獨特的角度進入了 AI 領域。Notion AI 被設計成為你在 Notion 中的助手,值得注意的是,Notion 引入了 AI 連接器,可以將外部數據引入 AI 的視野[16][17]。換句話說,Notion 想要成為**「一個尋找所需資訊的單一平台——即使這些資訊存在於工作空間之外」[16]。Notion AI 的連接器(目前針對商業/企業用戶的測試版)允許將像 Slack、Google Drive、Jira、Github,甚至 Gmail 等工具連接到 Notion 的 AI[18][19]。一旦連接,你可以用自然語言向 Notion 的 AI 提問,它會從那些連接的來源中找出相關資訊並附上引用**[17]。例如,你可以在 Notion 中詢問:「我團隊昨天 Slack 討論的行動項目是什麼?」AI 可能會從 Slack 頻道中檢索並總結信息,並引用具體的訊息。或者「我們有沒有 Google 文件列出 Q4 的路線圖?」它可以從 Drive 文件中提取片段。
Notion 的 AI 連接器功能強調了搜索和摘要,類似於微軟的 Copilot 連接器,但專注於知識工作。Notion 明確指出,連接器最適合「尋找和摘要信息」,而不適合繁重的數據分析或執行複雜的轉換[20]。助理可以從多個來源聚合信息到一個答案中(有一些處理量的限制)。其基本上採用的是 RAG(檢索增強生成) 方法:從 Slack、Google Drive 等找到相關內容,並使用 LLM 來制定答案,包含完整的參考資料。這對於企業知識管理極其有用——員工可以查詢 Notion AI 聊天,從他們的文檔和溝通孤島中獲得答案。
從 UX 觀點來看,Notion AI 以聊天彈出視窗或側邊欄小工具的形式存在於 Notion 應用程式中(角落的「帶有波浪眉毛的友好面孔」圖示)[21]。無論你在 Notion 工作區的哪裡,它都可以使用。關鍵的不同在於,Notion 的助手能夠感知 Notion 頁面的上下文,並且也可以在 Notion 內執行動作(例如編輯內容或創建當前頁面的摘要)。Notion 最近在 Notion 3.0 中宣布了一個 「AI Agent」 概念,這個概念甚至可以像小工蜂一樣自動化任務(例如,一個 Agent 可以在無人監督的情況下運行 20 分鐘,以在工作區中執行一系列動作)[22]。這暗示了一個更 自主代理 的願景,儘管是在控制情境下。
Notion 的平台策略是通過增加連接器來增強其作為工作中心的吸引力。如果所有資訊——即使來自其他應用程式——都可以通過 Notion AI 訪問,這增強了在 Notion 中生活並將其視為任務控制中心的理由。與 Microsoft 和 Google 不同,Notion 不是作業系統、電子郵件提供者或存儲服務(除了用戶存入的內容),因此它巧妙地通過引入其他數據來進行補償。唯一的限制是:Notion 的連接器有一些延遲和範圍限制——例如,可能需要時間來攝取外部內容(他們提到可能需要數小時來索引大量數據)[23],而通常只有去年的內容可以訪問[24]。此外,Notion 需要更高級別的計劃才能使用大多數連接器,這意味著它針對的是嚴肅的商業用例。對於決定工具的產品負責人來說,Notion 的主張是一個具有 AI 大腦的整合知識庫,了解您公司的信息。權衡之下,AI 大多局限於回答問題或在 Notion 中生成內容;它並不是設計為一般助理,例如在 Notion 之外發送電子郵件或安排會議。
Perplexity 的彗星 – 具有網頁和應用超能力的獨立 AI 助手
在助理技術的最前沿是 Perplexity AI 的「彗星」,它採用一種更具代理性的計算方法。Perplexity 起初是一個 AI 驅動的回答引擎(類似 AI 搜尋引擎),但隨著彗星(於 2025 年中期推出)的出現,它重新構想了網頁瀏覽器,變成了一個隨時隨地都可以對話的 AI 助手。彗星本質上是一個內建 AI 副駕駛的瀏覽器,能夠查看網頁內容、控制瀏覽器,並與使用者帳戶整合來執行任務[25][26]。
Perplexity在連接器上的方法相當有野心:它提供Gmail和Google日曆連接器,以及Notion、GitHub等工具的連接器[27][28]。一旦你啟用,例如Gmail/日曆連接器,AI可以查詢你的電子郵件和事件,甚至對其進行操作[29][30]。例如,你可以詢問,「總結我昨天收到的電子郵件並突出需要我注意的部分」,助手將會閱讀你的收件箱並生成摘要[31]。你可以接著說,「給還沒有回覆的客戶發一封有禮貌的跟進郵件」,如果使用Comet的全部功能,它實際上可以代表你草擬並發送該郵件[32]。同樣,它可以檢查你的日曆並列出即將到來的會議,甚至可以通過自然語言命令安排事件[33][34](例如,「創建一個下週三上午9點的1小時會議以進行項目規劃」——它將把該事件添加到Google日曆中)。
Comet 的用戶體驗與 Copilot 或 Duet 大不相同。Comet 的 AI 住在瀏覽器的側邊欄,可以在任何網頁上召喚。由於它是瀏覽器,可以廣泛查看——將網路搜尋與個人數據結合。例如,它可以回答「我明天要見的人是誰?」通過調取你的日曆事件(找到名字),然後搜尋網路或 LinkedIn,為你提供快速簡介。它本質上像是一個能同時操作網路服務和你自己的服務的 AI 代理。助手控制瀏覽器的能力是一大亮點:如果 API 調用失敗(比如無法通過官方 API 獲取你的電子郵件),它會像人一樣瀏覽你打開的 Gmail 分頁並閱讀頁面內容,然後提取所需資訊[35][36]。這種「如果一切都失敗,就模仿用戶」的方法,雖然效率較低,但顯示了代理為完成任務會做到什麼程度。
Perplexity的平臺策略是成為一個獨立層,不依賴於任何其他系統。與微軟或谷歌不同,Perplexity不依賴於操作系統或生產力套件——它的目標是成為您在任何平臺上使用的助手。它支持多種連接器(例如谷歌和微軟帳戶),並可通過其自有瀏覽器在Mac或Windows上運行。作為這種中立性的交換,這個服務是需要付費的(他們的「Perplexity Max」計劃),目前是為進階技術消費者設計的AI助手。對於企業領袖而言,Perplexity展示了當你放開AI的限制時,真正的跨應用自動化是可能的。但它也突顯了風險——讓第三方AI擁有廣泛的權限需要信任。甚至有安全研究(例如關於「CometJacking」)指出,如果安全保護失效,網頁上的惡意提示可能會誘使助手執行非預期的操作[37][38]。這也解釋了為什麼微軟和谷歌在企業環境中採取更循序漸進的方法。
總結來說,Microsoft 的 Copilot 連接器、Google 的 Duet AI、Notion 的 AI 以及 Perplexity 的 Comet 都有著讓我們的數位生活更為連結並讓任務更加自動化的目標,但他們的實現方式各有不同:
- Microsoft Copilot:作業系統層級的整合,連結 Microsoft 和 Google 的世界,現在專注於統一搜索和內容生成在 Windows 體驗中的。策略:透過容納其他生態系統,保持 Windows 的核心地位,旨在廣泛採用。
- Google Duet (Gemini):應用程式專用的 AI 深入嵌入 Google 的生態系統中,在每個 Workspace 應用中提供上下文感知的幫助。策略:增強 Google Workspace 的價值(和鎖定),使用最先進的模型確保一流的 AI 能力在那些範圍內。
- Notion AI:工作空間的知識助理,提取外部數據,以知識檢索和在 Notion 中的寫作為導向。策略:透過利用 AI 來連接跨工具的點,使 Notion 成為工作的中心——但專注於提升 Notion 的角色,而不是執行任意的外部操作。
- Perplexity Comet:一個獨立的 AI 代理,具有廣泛的功能——網頁搜索 + 個人應用整合 + 能在一個介面中執行(發送電子郵件、安排事件)。策略:吸引想要一個 AI「管家」來跨越一切工作的用戶,展示代理計算的未來,儘管伴隨著尖端風險和成本。
跨應用 AI 協助啟用的高價值使用案例
為什麼這些連接器和整合很重要?現實世界的應用案例展示了 AI 助手如何通過全局視角來節省時間、減少摩擦,甚至發掘新的見解。以下是針對企業和個人用戶的一些高價值場景:
- 統一搜尋與資訊檢索: 也許最明顯的好處就是擺脫孤立的搜尋。你不需要分別查詢 Gmail、Google Drive 或 Outlook,而是可以提出一個問題,得到綜合的答案。例如,一位主管可以詢問,「找出我所有帳戶中與第三季度預算相關的文件和電子郵件,」 Copilot 或 Notion AI 可以從 OneDrive/Drive 中提取文件列表,從 Gmail/Outlook 中提取符合的電子郵件[5]。這不僅節省時間,還能發現你可能會漏掉的東西,就像擁有一個個人 Google,索引你的工作世界。在企業中,員工浪費無數時間尋找資訊;一個作為企業搜尋禮賓的 AI 是非常有價值的。
- 電子郵件與文件摘要: 許多這類助手可以讀取冗長的內容並給出摘要。Copilot 或 Duet 可以在幾秒鐘內總結多段落的電子郵件線索-對於不想逐一閱讀每則訊息的人來說非常有用。Google 的 Duet 在 Gmail 中用「總結此線索」來處理長電子郵件交流,並在 Chat 中自動總結錯過的對話[39]。Perplexity 的助手可以總結一封長電子郵件,甚至是同一主題的多封電子郵件[40]。這對於忙碌的專業人士至關重要:想像你一早醒來,詢問,「Copilot,總結昨晚所有未讀郵件,」 然後獲得一個簡明的簡報。同樣地,文件摘要-Notion AI 可以總結連接的 PDF 或 Slack 線索,Google 的 Duet 可以總結 Docs 檔案或轉錄。摘要有助於更快地消化信息,當與搜尋結合時,你甚至可以做像「總結所有關於專案 X 的檔案」這樣的事情,以快速獲取集體知識。
- 會議準備與跟進: 使用日曆和電子郵件數據,AI 助手可以成為強大的會議助手。透過連接器,一個人可以詢問,「我明天與 Acme Corp 的會議需要知道什麼?」 一個有能力的助手(尤其是像 Perplexity 或未來可能的 Copilot)可以檢查你的日曆中的會議詳細資訊,然後提取與該客戶的最新電子郵件、最近的文件或提案,甚至是參加者的 LinkedIn 個人檔案-所有這些都被蒸餾為準備簡報。事實上,Perplexity 的示例查詢包括 「這週我會見誰?寫簡介。」[41],這表明 AI 從日曆中收集名字並提取相關信息。會後,AI 可以協助撰寫跟進郵件,甚至如果有會議紀錄的話,自動生成會議筆記(Google 的 Duet 在 Google Meet 中已經承諾為會議提供「自動筆記和行動項目」[42])。對於企業用戶,這些功能意味著減少圍繞會議的手動工作-AI 可以成為初級幕僚長,確保你在進入會議時掌握資訊,並在會後記錄結果。
- 跨應用任務自動化: 隨著 AI 助手的成熟,它們開始執行跨應用的多步驟任務。我們在 Perplexity Comet 中看到這方面的早期跡象-例如,它可以找到特定電子郵件,然後撰寫回覆並發送,所有這些都通過一次互動[30][32]。考慮處理客戶支持請求的工作流程:AI 可以識別來自客戶的電子郵件,從數據庫中調出相關訂單(通過連接器或插件),並撰寫個性化回覆,甚至在專案管理工具中創建跟進任務。微軟和 Google 當前的整合更多的是關於輔助步驟(找到這個信息,撰寫那個內容),但明顯的趨勢是朝向自動化:Copilot 根據命令創建文件[43],或 Duet 根據它從電子郵件中總結的數據更新電子表格。Notion 的 AI Agents 願景暗示在工作空間內自動化常規任務(如更新專案狀態或通過 AI 操作分流錯誤報告)[44][45]。這裡的最高價值場景是將人類從「旋轉椅」工作中解放出來-在應用之間反復切換以移動信息或執行瑣碎操作。相反,你可以委派給助手。
- 優先排序與決策支持: 在信息過載的情況下,僅僅是搜尋或總結是不夠的-我們經常需要幫助決定什麼才是重要的。AI 助手可以利用連接器提供洞察與優先排序。例如,Perplexity 的助手可以識別*「本週的緊急電子郵件」[31],而不僅僅是總結所有電子郵件。它可以判定哪些訊息可能需要你優先處理(也許是通過尋找某些關鍵字、發送者的重要性或提到的截止日期)。Copilot 可能很快就能回答,「我在電子郵件中承諾的最高優先任務是什麼?」*,這需要掃描你的通訊以查找承諾或截止日期。這些更高層次的答案對於個人生產力和處理大量輸入的管理者來說非常有價值。通過與日曆、電子郵件和任務工具的整合,AI 甚至可以主動建議,「你今天有連續的會議,還有 5 封標記為重要的電子郵件-你要每封郵件的摘要和一個草稿回覆在中午前準備好嗎?」這將助手從被動查詢應答者轉變為主動合作夥伴,這是最終的目標。
- 內容創建與多模式輸出: 最後,由連接器增強的用例是更豐富的內容創建。微軟 Copilot 從提示生成 Office 文件的能力[7]意味著你可以有效地說,「使用這個電子表格中的數據和那封電子郵件中的筆記,創建一個 PowerPoint 簡報,」然後看到一個初稿成形。Google 的 Duet 已經可以讓你做類似的事情,比如,「將這個 Docs 大綱做成 Slides 投影片」,自動填充幻燈片[12]。這是通過 AI 發生的跨應用魔術。連接器可以將來自不同來源的內容提供給 AI 進行合併或轉換。甚至多模式方面也加入進來:Duet 可以生成圖像來說明幻燈片;Windows 中的 Copilot 一直在實驗視覺功能(比如分析你提供的畫面或圖像)[46][47]。我們可以預見一個情景,告訴 Copilot,「在 Word 中創建一份含有 Excel 檔案 X 圖表的報告,並包括來自我的 Google Drive 中 PDF Y 的相關摘錄,」然後獲得一份合成文件。這種跨格式和應用的內容編排是複雜的,但對加速工作有極高的價值。
在所有這些用例中,便利性和認知提升是一個共同的主題。AI 連接器幫助你省去搜尋、閱讀大量文本和進行重複操作的麻煩。它們讓你能專注於更高層次的決策,而助理則負責收集和準備信息的繁瑣工作。對於產品主管和技術精通的用戶來說,這些不僅僅是噱頭——它們改變了時間的分配方式。與其花費一天的第一小時在搜尋和分類上,你可以利用 AI 已經為你預先消化的見解來行動。
更廣泛的影響:邁向以代理人、多模態和助理為基礎的計算
微軟將 Gmail、Drive 和 Calendar 整合到 Copilot 中,是邁向代理人計算未來的另一個步伐——在這種未來中,軟體代理會主動幫助用戶,而不是等待明確、低層次的指令。這也強調了用戶體驗設計的轉變:從以應用為中心到以助理為中心的互動。讓我們思考這些趨勢未來可能意味著什麼:
- 代理計算:此術語指的是可以代表我們行事的 AI 系統,能夠自主決策或在最少指導下執行任務。如今的大多數連接器仍主要回應直接的提示(“找這個”,“總結那個”)。但是,通過將 AI 連接到我們所有的數據和工具上,我們正在為更主動的代理奠定基礎。如果您允許 AI 訪問您的日曆、電子郵件、檔案、任務等,您可以想像它最終會根據推斷的優先級來自動安排您的週計劃,或是自行處理小型電子郵件回覆(在您偶爾監督下)。Notion 引入的 AI Agent 可以在一段時間內處理例行任務,這是一個早期的例子[22]。微軟和谷歌尚未完全自主(可能是出於可靠性和信任的原因),但即使是 Copilot 現在也具有根據屏幕上下文建議操作的功能,並且可能會發展為在背景中悄悄地為您組織信息。連接器對於代理至關重要——如果代理對您生活的一半視而不見,它就無法做太多事情。現在 Copilot 可以“看見”跨系統的內容,下一步就是讓它在有界限的方式中自行決定如何提供幫助,而不必每次都被要求。
- 多模態互動:助手在輸入和輸出方面越來越多模態。“多模態”在此指的是處理文本、語音、圖像,可能還有視頻或其他格式。比如,微軟已經談到過 Copilot Vision,該 AI 可以“看見”您的屏幕或您分享的圖像並理解它們[48]。能夠截圖並詢問 Copilot,“這個錯誤信息是什麼?”或“總結這頁面的圖表”,為互動添加了一個視覺模態。谷歌的 Gemini 模型預計將是高度多模態的,可能允許 Duet 未來分析圖像甚至生成視頻。語音是另一種模態:我們已經在與 Siri/Alexa 對話,我們可能很快就會在電腦上的 Copilot 或手機上的 Duet 上發出複雜的語音請求(Perplexity 的移動應用已經支持對其 AI 的語音查詢)。對於產品設計,這意味著助理可能不僅僅是聊天框,而是會在會議中通過耳機出現的聲音(“您的 AI 低聲說:您上個月討論過類似問題,要我調出那些筆記嗎?”)或是一個增強現實覆蓋,突顯信息。連接器通過提供更多類型的內容(圖像、日曆時間線等)來放大多模態性,供 AI 推理和呈現。
- 基於助手的使用者體驗範式:我們正處於範式轉移的邊緣,主要界面不再是一組應用程式和菜單,而是與智能助手的對話。這並不意味著應用程式會消失,但我們瀏覽它們的方式可能會發生根本改變。微軟的做法暗示了這一點:Windows Copilot 坐在所有東西之上,因此與其點擊文件夾或菜單,您可能越來越多地只需要求 Copilot 來完成。谷歌仍然將其 AI 集成在應用程式中,但即便是谷歌也在嘗試助理作為前端(例如,Bard 和 Gemini 作為服務的入口點)。隨著這些助手變得更強大,使用者將期望任何任務都可以從簡單的請求開始:“起草這個,抓取那個,給我看那些,更新這個。” 對於開發者來說,使用者體驗的挑戰是將他們的產品與這個助手層集成——可能通過 API 或連接器——以便其功能能夠通過自然語言訪問,而不僅僅是按鈕點擊。
對於產品領導者而言,啟示相當明確:AI 助手正成為新的作業系統,在某種意義上,是協調應用程式的元層。公司應考慮如何讓他們的工具接入 Copilot、Duet 或其他平台,因為如果你的應用程式的數據或行動無法被 AI 訪問,可能會被日益依賴助手進行互動的用戶忽略。Microsoft 和 Notion 的連接器,或 OpenAI 的插件生態系統,提供了整合的途徑。這也引發了標準和開放性的問題。我們會看到一個有許多專有連接器的世界(Microsoft 一個,Google 一個,Notion 一個等),還是會有通用協議,讓任何助手都能安全地與任何應用對話?目前情況是支離破碎的,但市場壓力可能會迫使更開放的互操作性,尤其是在企業要求的情況下。
另一個影響是隱私和信任。擁有強大能力(如讀取所有電子郵件/文件)帶來了巨大的責任。每個公司都在應對這一點:微軟強調這是用戶自願選擇和控制的;谷歌試圖保持數據不被用於訓練模型(Duet 的答案應該是你的數據,而不是一般知識);Notion 明確表示他們不使用客戶數據訓練模型並尊重權限[49];Perplexity 吹捧企業級加密和管理控制[50]。然而,讓 AI 在敏感信息中自由行走,使用者和組織仍需有一種信任的跳躍。只有當這些系統證明可靠和安全時,助理式用戶體驗才能成功。在休閒情境中的幻覺是一回事;但 AI 錯誤地總結法律文件或誤發電子郵件可能是個嚴重問題[51]。通往代理計算的道路不僅需要更智能的模型,還需要堅實的防護措施、對 AI 行為的審計,以及可能的新用戶培訓(「AI 素養」),以便人們知道如何有效監督他們的助理。
在領導力和策略方面,那些做出產品或工具決策的人應該將這些 AI 助手視為生產力工具,而不是花俏的展示品,因為它們可以加速組織發展,或是被忽視而落後。我們已經過了簡單 AI 聊天機器人的階段——這正在成為工作的基礎設施。具前瞻性思維的團隊已經開始試用 Copilot 或 Duet 來處理內部知識管理,看看在支援、編程、文件等方面能節省多少時間。明智地使用這些工具所帶來的競爭優勢(並設有處理保密性和 AI 輸出驗證的政策)可能是可觀的。同樣地,開發軟體的企業應考慮整合 AI 助手,以在助理驅動的用戶體驗世界中保持相關性。
結論:前路洞見
微軟在 Copilot 中引入 Gmail/Google Drive/Calendar 連接器,不僅僅是一項便利功能,還是個人計算演變中的「戰略標誌」。在 AI 層面,平台之間的界限正在模糊:生產力助理正在整合我們的數字生活,以幫助我們更智能地工作。微軟通過擁抱第三方整合,將 Copilot(進而 Windows)定位為用戶生產力的中心樞紐,無論來源如何。這對競爭者提出了更高的要求:Google 需要確保 Duet AI 在 Workspace 內提供同樣強大的跨情境支持(也許最終超越 Workspace),以吸引用戶留在其平台上。較小的公司如 Notion 和 Perplexity 表明創新仍然充滿活力——它們已經開創了連科技巨頭也在追隨的功能(如自主任務代理和完整的網頁整合)。
對於產品領導者和高階技術使用者來說,關鍵是要優先考慮洞察力和實用性,而非炒作。是的,像「代理計算」這樣的詞聽起來很吸引人,但其實際好處——統一搜索、自動生成簡報、減少漏掉的電子郵件、更快的內容創作——今天都可以實現。明智的做法是以明確的成功標準來試點這些功能:例如,使用 Copilot 連接器是否能將項目研究時間減少 X%?Duet AI 是否能縮短撰寫常規電子郵件的時間?Notion AI 是否能幫助新團隊成員在不打擾同事的情況下找到資訊?利用這些洞察來指導採用。此外,還需注意用戶體驗:將 AI 助手引入工作流程需要變更管理。有些用戶會需要培訓以信任並有效使用助手;而有些人可能過度信任它,因此制定驗證指引很重要。
從宏觀來看,我們可能正在走向一個世界,您的主要數位助理將伴隨您跨越設備和應用程式,協調您的意圖。無論它被命名為 Copilot、Duet、Siri、Alexa,還是其他名稱,概念都將相似——一個隨時存在的對話層,調節您與科技的互動。Microsoft Copilot 中的新 Gmail/Drive 連接器暗示著未來這樣的助理將會真正中立,不在乎應用程式的製作者,而更關注如何為您完成工作。這對於願意接受它的人來說是一個令人興奮的前景,也讓我們處於長期夢想的計算理想的前沿:技術以主動、個性化和智能的方式為我們服務,而不只是被動地等待指令。
旅程才剛剛開始,但方向比以往任何時候都更清晰。領導者應密切關注這些發展,大膽但謹慎地進行實驗,並始終將其與核心問題聯繫起來:這是否有助於人們和組織更有效地實現他們所重視的目標?如果答案是肯定的——而這種情況將會越來越多——那麼像 Copilot 這樣的 AI 助手(及其連接器)的整合不僅僅是技術升級,而是現代工作場所的戰略必要。畢竟,競爭優勢將屬於那些能夠將人類與 AI 的協作自然且高效地融入日常工作的人。
[1] [3] [4] [7] [9] Windows 的 Copilot:連接器和文件創建開始向 Windows Insiders 推出 | Windows Insider Blog
[2] [6] [8] Microsoft Copilot 現在可以在你的 Google 帳戶中協作
https://www.vice.com/en/article/microsoft-copilot-google-integration/
[5] [43] Copilot 在 Windows 上現在可以創建 Office 文件並連接到 Gmail | The Verge
[10] [11] [12] [14] [51] [52] Google 的 Duet AI 現在可用於 Docs、Gmail 和其他 Workspace 應用程式 | The Verge
https://www.theverge.com/2023/8/29/23849457/google-duet-ai-docs-slides-gmail
[13] [15] [39] 宣佈推出全新升級的 Google Chat | Google Workspace 部落格
https://workspace.google.com/blog/product-announcements/welcome-new-google-chat
[16] [17] [18] [19] [20] [23] [24] [49] Notion AI Connectors – Notion 幫助中心
https://www.notion.com/help/notion-ai-connectors
[21] [44] [45] 我們在 Make with Notion 推出的所有功能
https://www.notion.com/blog/conference-product-releases
[22] Notion 3.0 推出 AI 代理以進行任務自動化 - Reworked
[25] [26] [35] [36] [40] Comet 瀏覽器:實用範例指南 | DataCamp
https://www.datacamp.com/tutorial/comet-perplexity
[27] [28] [29] [30] [31] [32] [33] [34] [41] [50] 連接 Perplexity 與 Gmail 和 Google Calendar | Perplexity 說明中心
[37] Agentic Browser Security: Indirect Prompt Injection in Perplexity Comet
https://brave.com/blog/comet-prompt-injection/
[38] CometJacking: How One Click Can Turn Perplexity's Comet AI ...
[42] Duet AI for Google Workspace now generally available
https://workspace.google.com/blog/product-announcements/duet-ai-in-workspace-now-available
[46] 超越文字:AI 進入多模態以適應你的需求
[47] Microsoft Copilot 現在可以閱讀你的螢幕、深入思考並朗讀給你聽 ...
[48] Copilot Vision:多模態 AI 助理為 Windows 提供視覺支援 ...










