作者: Boxu Li 在 Macaron

介绍:

微软最新的 Windows Copilot 更新悄然但显著地扩展了 AI 的应用范围。在 2025 年 10 月的发布中,Copilot 获得了与 Google 服务——Gmail、Google Drive、Google Calendar 和联系人 连接的能力,同时也支持微软自己的 Outlook 邮件、OneDrive 等。[1]。此举打破了微软与谷歌生态系统之间长期存在的壁垒。通过简单的选择加入,Windows 用户现在可以利用 Copilot 跨账户和应用程序搜索和综合个人信息,所有这一切都通过单一的 AI 助手界面。[2][3]。这是前所未有的跨平台合作:微软的 AI 积极进入谷歌的领域,以帮助用户完成任务。

在这次深入探讨中,我们将分析这些新连接器在 Copilot 中的作用及其运行方式,并将微软的方法与Google 的 Duet AI/GeminiNotion AIPerplexity 的 Comet 等竞争对手进行对比。我们将探索从统一搜索和电子邮件摘要到会议准备和文档创建等最高价值的使用案例,并思考这一趋势对代理计算、多模态交互和助手驱动的用户体验未来的意义。这里的语气是实用和战略性的,直击要点,为产品领导者提供关于个人 AI 助理发展方向的清晰视角。

Copilot 的 Gmail、Drive 和 Calendar 连接器——它们如何工作

Blog image

本质上,微软的连接器更新使Windows上的Copilot能够作为跨个人内容的通用搜索栏和助手,无论该内容位于微软应用还是谷歌服务中。一旦您在Copilot的设置中启用连接器(通过切换按钮),AI便获得您的明确同意,能够访问您在Gmail、Google Drive、日历、联系人、Outlook和OneDrive中的数据[3]

Copilot 能用这个访问权限做什么?在这个初始版本中,重点是自然语言搜索和检索。你可以向 Copilot 提出问题或命令,比如“Sarah 的电子邮件地址是什么?”或“找出我上周的学校笔记”,Copilot 会从任何连接的账户中检索相关信息[4]。例如,如果 Sarah 的电子邮件存储在你的 Google 联系人或 Outlook 地址簿中,Copilot 会显示出来。如果你的“学校笔记”是存储在 Google Drive 的 Google 文档(或 OneDrive 上的 Word 文件),Copilot 可以找到这些文件并呈现给你。这个助手基本上将你的不同存储和通信孤岛视为一个统一的知识库。

微软自己的演示展示了一个查询如何可以从多个来源提取信息。用户可以请求来自某个客户的所有发票,而Copilot可能会检查Outlook和Gmail收件箱以汇总匹配项[5]。或者你可能记得将PDF保存到云端,但不记得保存在哪里——Copilot可以同时搜索OneDrive和Google Drive来定位它。所有这些都通过Windows上的Copilot聊天界面完成,这意味着用户不必手动打开浏览器、启动应用程序或在Gmail和资源管理器中进行单独搜索。一旦设置完成,这是一种无缝的体验。

重要的是,这些连接是选择加入和精细化的。默认情况下,Copilot 不会接触你的 Gmail 或 Google 数据,除非你在设置中关联这些账户[6]。你可以选择连接某些服务而非其他服务(例如,也许链接 Gmail 但不连接 Google Drive,或反之),因此用户可以保持控制。微软目前也限制了读取/搜索的能力——作为一种防护措施,Copilot 在这个初版中不会自动发送电子邮件或通过这些连接器添加日历事件(它是在读取你的数据,而不是写入,除非你明确要求它生成内容)。这种谨慎的做法可能是为了建立用户信任,考虑到个人邮件和文件的敏感性。

值得注意的是,微软将连接器的发布与另一项新功能结合在一起:通过 Copilot 创建和导出文档。现在,你可以指示 Copilot 根据提示生成 Word 文档、Excel 电子表格、PowerPoint 幻灯片或 PDF,甚至可以直接将内容导出到这些格式中。例如,你可以要求“起草项目状态更新并导出到 Word”,Copilot 就会执行。这与连接器形成互补:助手不仅可以查找各个账户的信息,还可以帮助你使用这些信息生成新的文档(如邮件、文档等)。长远愿景是成为一个既能收集又能生成内容的 AI,成为你跨应用的生产力伙伴。

Copilot 体验内部:统一搜索和上下文回答

那么,使用这些连接器与 Copilot 的用户体验是什么样的呢?实际上,Copilot 会作为侧边栏/聊天窗口固定在 Windows 11 上(通过点击或快捷键召唤)。区别在于它如何理解你的查询并撰写答案。当你询问涉及个人数据的问题时,Copilot 的 AI 会安全地查询你已连接服务的索引。在后台,微软可能使用 Google 和 Microsoft Graph 的 API 调用来获取相关结果,然后由 AI 模型进行总结或直接呈现。

在 Copilot 的界面中,来自个人数据的答案通常会附带上下文地呈现。例如,如果你询问联系人的电子邮件地址,Copilot 可能会直接显示电子邮件(例如,“Sarah 的电子邮件是 sarah@example.com”)。如果你询问文件或笔记,Copilot 可能会列出几个文件名或片段,并标明它们来自哪个服务(例如,“在OneDrive中找到了Marketing Plan.docx,最后修改日期为 9 月 5 日”或“在Google Drive中找到了Q3 OKRs,上周修改”)。微软对 Copilot 的设计强调透明性,因此用户可以知道来源——类似于 Bing Chat 引用其网络来源。早期预览显示结果旁边有“Gmail”或“OneDrive”等来源标签,这有助于建立信任,确保 Copilot 找到的确实是你账户中的项目,而不是凭空捏造的。

这种统一方法的价值在您首次使用时就会变得清晰:不再需要心里盘算“那次对话是在 Gmail 还是 Outlook?我把那个 PDF 保存在哪里了?”您只需询问 Copilot,它就会为您找出位置。这本质上是由 AI 理解您的查询而驱动的操作系统级智能搜索。Windows 早已具备搜索索引功能,但 Copilot 通过自然语言处理和超越本地机器的多云账户搜索,将其提升到了一个新的水平。

当然,这也有局限性。最初,Copilot 连接器处理搜索和简单检索;它们可能尚不支持复杂的多步骤请求(例如:“查找所有关于 Project Zeus 的老板邮件并起草关键点概要”)。目前,您可能需要将其分解为几个步骤:先让 Copilot 找到邮件,然后再让它总结。随着集成的深入,我们可以期待 AI 更流畅地处理这种多步骤代理查询。微软可能正在从这个 Windows Insider 版本中收集反馈[8][9],然后再进一步扩展功能。

微软 vs 谷歌 vs 其他:AI 助手的不同策略

微软的跨平台助手策略与其同行形成鲜明对比。通过将 Copilot 开放给谷歌的领域,微软表明用户便利性优先于生态系统锁定——这是一种大胆的举措,服务于依赖谷歌服务的 Windows 用户。这与谷歌在 Workspace 中的 AI 助手,或与Notion 和 Perplexity 的方法相比如何?让我们来看看在能力、用户体验和平台策略上的关键差异:

谷歌 Duet AI(Gemini)——深度集成,同一生态系统

谷歌对Copilot的回应是Google Workspace的Duet AI,现已与Gemini模型的强大功能相结合。Duet是一个AI协作工具,嵌入在Gmail、Docs、Drive、Slides、Meet等应用中[10][11]。其功能包括帮助你撰写电子邮件和文档、在Slides中生成图像,以及总结长聊天记录或会议记录。例如,在Gmail中,你可以点击“帮助我写作”选项,让Duet撰写回复;在Docs中,要求它总结文档。在Slides中,Duet可以根据提示创建视觉效果或构建演示文稿大纲[12]。基本上,谷歌已经将AI功能编织到每个应用的用户界面中:一个侧面板或菜单,可以在当前上下文中调用Duet以提供帮助。

跨应用搜索方面,谷歌已经开始在其生态系统内启用一些跨应用智能。谷歌宣布了 Duet AI 的计划,“通过在 Gmail 和 Drive 中搜索消息和文件来回答复杂查询”,并在聊天空间中总结文档[13]。实际上,这体现在增强的Google Chat体验中——你可以在 Chat 中查询 AI,它可以从你的 Gmail 和 Drive 中提取信息来回答。例如,你可以在 Chat 中询问,“总结 John 分享给我的预算提案文档及任何相关邮件”,Duet 可以从 Drive 中检索文档和相关的 Gmail 线程,提供综合答案。这在概念上类似于 Copilot 的统一搜索,但仅限于谷歌的世界。Duet 不会访问你的 Outlook 收件箱或 OneDrive,因为谷歌的首要任务(可以理解)是让你留在 Workspace 中。

用户体验的角度来看,谷歌的方法意味着AI能够在每个应用中识别上下文。Duet作为侧边面板出现在像Gmail和Google Docs这样的应用中(用一个图标表示,通常是一个小火花或Duet标志)。你可能在阅读电子邮件时点击Duet,选择“总结这个线程”或“起草回复”等选项。在Google Drive中,你可以让Duet“查找关于Project Atlas的文件”,这实际上是在搜索Drive。设计的目的在于让AI感觉像是每个特定任务的内置助手,而不是一个无处不在的聊天框。其好处是量身定制的体验——Duet了解你所在的应用,并提供相关帮助(例如在Sheets中提供格式帮助,在Slides中提供幻灯片设计等)。其缺点是碎片化:用户以片段形式与Duet互动,而不是在一个地方就所有事情与AI对话。

从战略上讲,谷歌正在利用 Duet(以及其背后的即将推出的 Gemini 模型)来强化其 Workspace 的价值主张。这是一个高级附加功能(企业用户每人大约 $30),直接与 Microsoft 365 Copilot 的定价竞争。谷歌的平台战略仍然是生态系统封闭——AI 是使用谷歌应用的理由,并且没有迹象表明谷歌会让其助手像微软那样本地化地接触微软服务。简而言之,谷歌在说:“将您的数据保存在 Workspace 中,我们的 AI 将成为您的专家助手。” 这对已经习惯使用谷歌的公司来说很有吸引力,但对于在混合环境中工作的用户(部分使用谷歌,部分使用微软)来说,帮助有限——微软正是希望通过 Windows 上的 Copilot 来填补这一空缺。

值得注意的是,谷歌对AI模型实力和模态的重视。Gemini,谷歌的先进生成式AI,被誉为将带来多模态能力(视觉、文本等)和更强的推理能力。我们可能很快会看到Duet更智能地处理图像或图表,或者与谷歌的搜索功能集成以提供实时信息。通过在其平台上嵌入一个强大的模型,谷歌可以提供一种体验,让AI感觉像是一个博学的同事,阅读了你的所有文档和电子邮件,并且也了解网络。不过,它仍然停留在谷歌的边界内——对于跨第三方应用的更广泛代理行为,谷歌目前的策略是将受欢迎的第三方集成到谷歌的应用中(例如在Docs/Chat中为Asana或Trello等应用提供智能画布芯片),而不是让AI在外部漫游。

Notion AI – 统一工作空间助手

Notion,这款多合一工作空间应用,也以独特的视角进入了AI领域。Notion AI 被设计为Notion内部的助手,但值得注意的是,Notion 推出了 AI 连接器,将外部数据引入其 AI 的视野[16][17]。换句话说,Notion 希望成为**「一个查找所需信息的唯一地点——即使它存储在工作空间之外」[16]。Notion AI 的连接器(目前为商业/企业用户提供测试版)允许将 Slack、Google Drive、Jira、Github,甚至 Gmail 等工具连接到 Notion 的 AI[18][19]。一旦连接,您可以用自然语言向 Notion 的 AI 提问,它会从这些连接的来源中获取相关信息并附上引用**[17]。例如,您可以在 Notion 中询问:“昨天我们团队在 Slack 讨论中的行动项是什么?”AI 可能会检索并总结 Slack 频道中的消息,并引用具体的消息。或者“我们是否有关于第四季度路线图的 Google 文档?”它可以从该 Drive 文件中提取片段。

Notion 的 AI 连接器的功能强调搜索和总结,类似于微软的 Copilot 连接器,但专注于知识工作。Notion 明确指出,这些连接器最适合「查找和总结信息」,而不是用于进行大量数据分析或执行复杂转换。助手可以在一个答案中汇总来自多个来源的信息(有一些一次性处理量的限制)。这基本上是采用**RAG(检索增强生成)**的方法:从 Slack、Google Drive 等中找到相关内容,并使用 LLM 生成带有参考的答案。这对于企业知识管理非常有用——员工可以查询 Notion AI 聊天并获得从其文档和通信孤岛中提取的答案。

用户体验角度来看,Notion AI 以聊天弹窗或侧边栏小部件的形式存在于 Notion 应用中(角落里的「友好面孔带波浪眉毛」图标)[21]。无论你在 Notion 工作空间的哪个位置,它都可以使用。一个关键的区别是,Notion 的助手能够感知你 Notion 页面中的上下文,并且可以在 Notion 内执行操作(如编辑内容或创建当前页面的摘要)。Notion 最近在 Notion 3.0 中宣布了一个**「AI Agent」概念,它甚至可以像小蜜蜂一样自动化任务(例如,一个可以在无人监督的情况下运行 20 分钟,以执行工作空间中一系列操作的 Agent)[22]。这暗示了一个更自主代理**的愿景,尽管是在可控的场景下。

Notion 的平台战略是通过添加连接器来增强其作为工作中心的吸引力。如果所有的信息——即使是来自其他应用的信息——都可以通过 Notion AI 访问,那么它就更有理由让你在 Notion 中工作,并将其视为任务控制中心。与微软和谷歌不同,Notion 不是操作系统,也不是电子邮件提供商或存储服务(除了用户放入的内容),因此它巧妙地通过整合其他数据来补偿这一点。一个限制是:Notion 的连接器存在一些延迟和范围限制——例如,可能需要时间来摄取外部内容(他们提到可能需要数小时来索引大量数据)[23],通常只有去年的内容可以访问[24]。此外,Notion 需要更高的计划才能使用大多数连接器,这意味着它针对的是严肃的商业用例。对于决定工具的产品负责人来说,Notion 的主张是一个集成知识库,加上一个了解公司事务的 AI 大脑。权衡之下,这个 AI 主要限于在 Notion 中回答问题或生成内容;它并不是为在 Notion 之外发送电子邮件或安排会议等一般助理任务而设计的。

Perplexity 的彗星 – 拥有网页和应用超级能力的独立 AI 代理

在助手技术的前沿是 Perplexity AI 的「彗星」,它采用了一种更具代理性计算的方法。Perplexity 起初是一个 AI 驱动的答案引擎(类似 AI 搜索引擎),但随着彗星(于 2025 年中期推出)的推出,它将 网页浏览器 重新想象为一个可以随时对话的 AI 助手。彗星本质上是一个内置 AI 副驾驶的浏览器,可以查看网页内容、控制浏览器,并与用户账户集成以执行任务[25][26]

Perplexity 对连接器的处理非常具有雄心:它提供了 Gmail 和 Google Calendar 连接器,以及 Notion、GitHub 等工具的连接器[27][28]。一旦你启用了 Gmail/Calendar 连接器,AI 可以查询你的电子邮件和事件,甚至对它们进行操作[29][30]。例如,你可以问:“总结我昨天收到的邮件,并标出需要我注意的邮件”,助理会浏览你的收件箱并生成摘要[31]。你可以接着说:“给尚未回复的客户发一封礼貌的跟进邮件”,如果使用 Comet 的全部功能,它实际上可以代你起草并发送那封邮件[32]。同样,它可以检查你的日历,列出即将到来的会议,甚至通过自然语言命令安排事件[33][34](例如,“下周三上午 9 点创建一个 1 小时的项目规划会议”,它会将该事件添加到 Google Calendar 中)。

与 Copilot 或 Duet 相比,Comet 的用户体验截然不同。Comet 的 AI 位于浏览器的侧边栏,可以在任何网页上召唤。由于它是一个浏览器,视野广阔——可以将网络搜索与个人数据结合起来。例如,它可以通过调用你的日历事件(找到名字),然后在网络或 LinkedIn 上搜索该人,快速给你一个简历,以回答“我明天要见的人是谁?”它本质上就像一个可以同时操作网络服务和你自己的服务的 AI 代理。助手控制浏览器的能力是一个亮点:如果 API 调用失败(比如无法通过官方 API 获取你的邮件),它会像人一样导航到你打开的 Gmail 标签,读取页面内容,然后提取所需信息[35][36]。这种“如果一切都失败了,就模拟用户”的方法虽然效率较低,但展示了代理为了完成任务会走多远。

Perplexity 的平台策略旨在成为所有事物之上的独立层。与微软或谷歌不同,Perplexity 不依赖于操作系统或生产力套件——它的目标是成为您无论在哪个平台上都能使用的助手。它支持多种连接器(例如 Google 和 Microsoft 帐户),并通过其自有浏览器在 Mac 或 Windows 上运行。为了这种中立性,它以高端价位(他们的「Perplexity Max」计划)推出,目前是一个面向高级技术消费者的工具——先进技术用户的 AI 助手。对于企业领导者来说,Perplexity 展示了当您让 AI 自由发挥时的可能性:真正的跨应用自动化。但它也突出了风险——给第三方 AI 广泛权限需要信任。甚至有安全研究(例如关于「CometJacking」的研究)指出,如果安全措施失效,网页上的恶意提示可能会诱骗助手执行非预期操作[37][38]。这表明微软和谷歌在企业环境中采取更循序渐进的方法的原因。

总之,微软的 Copilot 连接器、谷歌的 Duet AI、Notion 的 AI 和 Perplexity 的 Comet 都有一个共同的目标:让我们的数字生活更加互联,让我们的任务更加自动化,但它们的执行方式不同:

  • 微软 Copilot:操作系统级别的集成,连接微软和谷歌的世界,现在专注于在 Windows 体验中实现统一搜索和内容生成。策略:通过兼容其他生态系统使 Windows 保持核心地位,目标是广泛采用。
  • 谷歌 Duet (Gemini):深度嵌入谷歌生态系统的应用程序专用 AI,在每个 Workspace 应用中提供上下文感知的帮助。策略:通过尖端模型提升谷歌 Workspace 的价值(和用户锁定),确保在这些范围内提供一流的 AI 功能。
  • Notion AI:工作空间知识助手,获取外部数据,围绕知识检索和在 Notion 中进行写作。策略:通过利用 AI 在工具之间连接信息,使 Notion 成为工作的中心——但专注于增强 Notion 的角色,而不是执行任意的外部操作。
  • Perplexity Comet:一个独立的 AI 代理,具有广泛的功能——网络搜索+个人应用集成+在一个界面中执行操作(发送邮件,安排活动)的能力。策略:吸引希望拥有一个跨领域工作的 AI “管家”的用户,展示代理计算的未来,尽管存在尖端风险和成本。

跨应用 AI 辅助实现的高价值用例

为什么这些连接器和集成如此重要?现实世界的用例展示了 AI 助手如何通过纵观我们应用程序的全局视角来节省时间、减少摩擦,甚至发现新的见解。以下是对企业和个人用户来说价值最高的一些场景:

  • 统一搜索和信息检索: 也许最显而易见的优势是消除了孤立的搜索。你无需分别查询 Gmail、Google Drive 和 Outlook,而是可以提出一个问题并获得综合答案。例如,一位高管可以问,“在我的账户中查找所有与第三季度预算相关的文档和电子邮件,” Copilot 或 Notion AI 可以从 OneDrive/Drive 提取文件列表,以及来自 Gmail/Outlook 的相关电子邮件。这不仅节省时间,还可以发现那些如果忘记搜索某个特定存储库可能会错过的内容。这就像拥有一个为你的工作世界建立索引的个人 Google。在企业中,员工浪费无数时间寻找信息;一个作为企业搜索管家的 AI 是非常有价值的。
  • 电子邮件和文档总结: 许多此类助手可以阅读冗长的内容并为你提供总结。Copilot 或 Duet 可以在几秒钟内总结多段电子邮件线程——这对于快速了解电子邮件链的要点而无需阅读每条消息非常有用。Google 的 Duet 在 Gmail 中通过“总结此线程”功能处理长时间的电子邮件交流,并在 Chat 中自动总结错过的对话。Perplexity 的助手可以总结一封长电子邮件或甚至多个相同主题的电子邮件。这对于忙碌的专业人士来说至关重要:想象一下开始一天的工作时,你可以问,“Copilot,汇总昨晚所有未读邮件,” 然后获得简明的简报。同样,文档总结——Notion AI 可以总结一个连接的 PDF 或 Slack 线程,Google 的 Duet 可以总结 Docs 文件或转录。总结有助于更快地消化信息,并与搜索相结合,你甚至可以做诸如“总结所有关于项目 X 的文件”这样的事情,以快速获取集体知识。
  • 会议准备和跟进: 利用日历和电子邮件数据,AI 助手可以成为强大的会议助手。通过连接器,你可以问,“我明天与 Acme Corp 的会议需要知道什么?” 一个有能力的助手(特别是像 Perplexity 或未来可能的 Copilot)可以查看你的日历了解会议详情,然后提取与该客户的最新电子邮件、最近的文件或提案,甚至可能是与会者的 LinkedIn 资料——所有这些都被提炼成准备简报。事实上,Perplexity 的示例查询包括 “我本周与谁开会?写生物。”,这显示了 AI 从日历中收集姓名并获取相关信息。会议结束后,AI 可以帮助起草后续电子邮件,甚至在提供转录的情况下自动生成会议记录(Google 的 Duet 在 Google Meet 中已经承诺为会议提供“自动记录和行动项目”)。对于企业用户而言,这些能力意味着减少围绕会议的手动工作——AI 可以成为初级幕僚长,确保你在进入会议时已掌握信息,并且在会议结束后记录结果。
  • 跨应用任务自动化: 随着 AI 助手的成熟,它们开始执行跨应用的多步骤任务。我们在 Perplexity Comet 中看到这种早期的迹象——例如,它可以找到特定电子邮件,然后撰写回复并发送,通过一次交互完成所有这些任务。考虑处理客户支持请求的工作流程:AI 可以识别来自客户的电子邮件,从数据库中提取相关订单(通过连接器或插件),撰写个性化回复,甚至可能在项目管理工具中创建后续任务。微软和谷歌目前的集成更多是关于辅助步骤(找到这些信息,撰写那个内容),但趋势显然是朝着自动化发展:Copilot 按命令创建文档,或 Duet 根据从电子邮件中总结的数据更新电子表格。Notion 对 AI 代理的愿景暗示了在工作空间内自动化常规任务(如通过 AI 操作更新项目状态或分类错误报告)。这里的最高价值场景是将人类从“旋转椅”工作中解放出来——那些在应用之间来回切换以移动信息或执行琐碎操作的重复性工作。相反,你可以将这些任务委托给助手。
  • 优先级排序和决策支持: 面对信息过载,仅仅找到或总结是不够的——我们经常需要帮助决定什么是重要的。AI 助手可以利用连接器提供见解和优先级排序。例如,Perplexity 的助手可以识别*“本周的紧急邮件”,而不仅仅是总结所有邮件。它可以确定哪些消息可能最需要你的关注(也许通过寻找某些关键词、发件人的重要性或提到的截止日期)。Copilot 可能很快能够回答,“我在电子邮件中承诺的最高优先级任务是什么?”*,这将涉及扫描你的通信以查找承诺或截止日期。这种类型的高级答案对于个人生产力和管理大量输入的经理来说非常有价值。通过与日历、电子邮件和任务工具集成,AI 甚至可以主动建议,“你今天有连续的会议,还有 5 封标记为重要的邮件——你想要每封邮件的摘要和中午前准备好的草稿回复吗?” 这将助手从被动的查询响应者转变为主动的合作伙伴,这才是最终目标。
  • 内容创建和多模式输出: 最后,通过连接器增强的用例是更丰富的内容创建。微软 Copilot 的能力可以从一个提示生成 Office 文档,这意味着你可以有效地说,“使用电子表格中的数据和封邮件中的笔记,创建一个 PowerPoint 演示文稿,”并观看第一个草稿的形成。Google 的 Duet 已经允许你做类似“将这个 Docs 大纲制作成 Slides 幻灯片”的事情,自动填充幻灯片。那是通过 AI 实现的跨应用魔术。连接器可以为 AI 提供来自不同来源的内容,以便合并或转换。甚至多模式方面也会涉及:Duet 可以生成图像以说明幻灯片;Windows 上的 Copilot 一直在试验视觉功能(如分析屏幕上显示的内容或你提供的图像)。我们可以预见一种情景,你可能会告诉 Copilot,“在 Word 中创建一份包含 Excel 文件 X 中图表和 Google Drive 中 PDF Y 的相关摘录的报告,”并获得一份综合的文档。这种跨格式和应用内容的编排是复杂的,但对于加速工作来说价值极高。

在所有这些用例中,便利性和认知提升是共同的主题。AI 连接器让您免于搜索、阅读冗长文本和进行重复操作。它们使您能够专注于更高层次的决策,而助手则负责收集和准备信息的繁重工作。对于产品负责人和技术精通的用户来说,这些不仅仅是噱头——它们改变了时间分配的方式。与其在一天的第一个小时里搜索和分类,不如利用 AI 已经为您预处理的见解进行行动。

更广泛的影响:迈向自主、多模态、基于助手的计算

微软将 Gmail、Drive 和 Calendar 整合到 Copilot 中,这是迈向自主计算未来的一步——软件代理主动帮助用户,而不是等待明确的、低级的指令。这也突显了用户体验设计的转变:从以应用为中心到以助手为中心的互动。让我们思考这些趋势未来可能意味着什么:

  • 代理计算:这个术语指的是可以代表我们行动的 AI 系统,可以自主决策或在最少指导下执行任务。今天的连接器仍然主要响应直接提示(“找到这个”,“总结那个”)。但通过将 AI 接入我们的所有数据和工具,我们正在为更加主动的代理奠定基础。如果你允许 AI 访问你的日历、邮件、文件、任务等,你可以设想它最终会根据推断的优先级自动安排你的周,或者自行处理小型邮件回复(有时需要你的监督)。Notion 引入的可以运行一段时间以处理常规任务的 AI 代理就是一个早期的例子[22]。微软和谷歌尚未完全实现自动化(可能出于可靠性和信任的原因),但即便是 Copilot,现在也有基于屏幕上下文建议操作的功能,并可能发展为默默地在后台为你整理信息。连接器是实现代理所必需的一部分——如果一个代理对你生活的半数视而不见,几乎无所作为。现在 Copilot 能“看到”系统间的情况,下一步就是在有限的方式下让它决定如何在无需每次请求的情况下协助。
  • 多模态交互:助手在输入和输出方面越来越多模态化。“多模态”在这里意味着处理文本、语音、图像,或许还有视频或其他形式。微软,例如,谈到了Copilot Vision,其中 AI 可以“看到”你的屏幕或你分享的图像并理解它们[48]。能够截屏并询问 Copilot,“这个错误信息是什么意思?”或“总结这页上的图表”,为交互增加了视觉模式。谷歌的 Gemini 模型预计会高度多模态化,可能允许 Duet 分析图像甚至未来生成视频。语音是另一种模式:我们已经与 Siri/Alexa 交谈,可能很快就能在 PC 上对 Copilot 或在手机上对 Duet 发出复杂请求(Perplexity 的移动应用已经支持语音查询其 AI)。对于产品设计,这意味着助手不仅可能以聊天框的形式出现,还可能在会议期间通过耳机传来的语音出现(“你的 AI 低声说:上个月讨论过类似的问题,要我调出那些笔记吗?”)或作为增强现实覆盖突出显示信息。连接器通过提供更多类型的内容(图片、日历时间线等)来增强多模态性,以便 AI 推理和呈现。
  • 基于助手的用户体验范式:我们正处于一个范式转变的边缘,主要界面不再是应用程序和菜单的集合,而是与智能助手的对话。这并不意味着应用程序会消失,但我们导航它们的方式可能会发生根本变化。微软的方法暗示了这一点:Windows Copilot 覆盖在所有内容之上,因此你可能越来越多地只需要求 Copilot 去做,而不是点击文件夹或菜单。谷歌仍在应用程序中展现其 AI,但即便是谷歌也在试验助手作为前端(例如,Bard 和 Gemini 作为服务的入口点)。随着这些助手变得更为强大,用户会期望任何任务都可以从一个简单的请求开始:“起草这个,获取那个,给我看看那些,更新这个。”对于开发人员而言,UX 挑战在于将他们的产品与这个助手层集成——可能通过 API 或连接器——以便其功能可以通过自然语言而不仅仅是按钮点击来访问。

对于产品领导者来说,意义很明确:AI助手正在成为新的操作系统,在某种意义上,它是一个协调应用程序的元层。公司应该考虑如何让他们的工具接入Copilot、Duet或其他助手,因为如果你的应用的数据或操作对AI不可访问,用户可能会忽略你的应用,因为他们越来越依赖助手进行交互。微软和Notion的连接器,或OpenAI的插件生态系统,提供了集成的途径。这也提出了标准和开放性的问题。我们会看到一个由许多专有连接器组成的世界(一个用于微软,一个用于谷歌,一个用于Notion等),还是会有通用协议,让任何助手都可以安全地与任何应用对话?目前,这个领域是分散的,但市场压力可能会迫使更开放的互操作性,尤其是在企业有需求的情况下。

另一个影响是隐私和信任。拥有读取您所有电子邮件/文件的强大能力意味着需要承担巨大的责任。每个公司都在应对这一问题:微软强调这是用户自愿选择和控制的;谷歌则努力保持数据的本地化,并不用于训练模型(Duet 的答案应该是您的数据,而不是一般知识);Notion 明确表示他们不会使用客户数据来训练模型,并尊重权限[49];Perplexity 则宣称具有企业级加密和管理员控制[50]。然而,用户和组织必须有勇气让 AI 在敏感信息中自由行动。只有当这些系统被证明是可靠和安全的,基于助手的用户体验才能成功。在随意的环境中出现幻觉是一回事;但 AI 错误地总结法律文件或误发送电子邮件可能会成为严重问题[51]。通向代理计算的道路不仅需要更智能的模型,还需要强大的防护措施、对 AI 行为的审计,以及可能的新用户培训(“AI 素养”),以便人们知道如何有效监督他们的助手。

领导力和战略方面,做产品或工具决策的人应该将这些 AI 助手视为生产力工具,而不是炫酷的演示工具,它们可以大幅提升组织效率,或者如果被忽视,可能导致落后。我们已经超越了琐碎的 AI 聊天机器人阶段——这正在成为工作的基础设施。有前瞻性思维的团队已经在试验使用 Copilot 或 Duet 来处理内部知识管理,观察在支持、编码、文档等方面能节省多少时间。明智地使用这些工具(并制定处理保密性和验证 AI 输出的政策)可能带来巨大的竞争优势。同样,开发软件的企业应考虑整合 AI 助手,以保持在助手驱动的用户体验世界中的相关性。

结论:未来的洞察

微软在 Copilot 中引入 Gmail/Google Drive/Calendar 连接器,不仅仅是一个便利功能——这是个人计算演变中的一个战略标志。平台之间的界限在 AI 层面上变得模糊:生产力助手正在整合我们的数字生活,以帮助我们更聪明地工作。通过接纳第三方集成,微软正将 Copilot(以及扩展到 Windows)定位为用户生产力的核心,无论来源如何。这对竞争对手提出了更高的要求:谷歌需要确保 Duet AI 在 Workspace 内提供同样强大的跨环境支持(或许最终超越它),以保持用户对其平台的忠诚。较小的企业如 Notion 和 Perplexity 展示了创新依然活跃——它们率先推出了功能(如自主任务代理和完整的网络集成),连科技巨头们也在效仿。

对于产品领导者和高级技术用户,关键要点是优先考虑洞察力和实际相关性,而不是炒作。是的,像“代理计算”这样的术语听起来很有吸引力,但实际的好处——统一搜索、自动生成简报、减少漏掉的邮件、更快的内容创作——今天都非常真实且可实现。明智的做法是以明确的成功标准来试点这些功能:例如,使用 Copilot 连接器是否能减少项目研究时间 X%?Duet AI 是否能减少撰写常规邮件的时间?Notion AI 是否能帮助新团队成员在不打扰同事的情况下找到信息?利用这些洞察来指导采用。此外,关注用户体验:将 AI 助手引入工作流程需要变更管理。一些用户需要培训以信任并有效使用助手;而另一些用户可能过度信任它,因此关于验证的指导方针非常重要。

从更大的图景来看,我们可能正走向一个世界,在这个世界中,你的主要数字助手会随你在不同设备和应用程序间穿梭,调配你的意图。无论它被命名为 Copilot、Duet、Siri、Alexa,还是其他什么名字,概念都是相似的——一个无处不在的对话层,调节你与技术的互动。微软 Copilot 中的新 Gmail/Drive 连接器暗示着这样一个助手的未来,它真正不受品牌限制,不在意是谁开发了应用,而是更关注如何为你完成任务。这对那些愿意接受它的人来说是一个令人兴奋的前景,它将我们置于一个长期设想的计算理想的前沿:技术以一种积极主动、个性化和智能的方式我们工作,而不仅仅是被动地等待指令。

旅程才刚刚开始,但方向比以往任何时候都更清晰。领导者应密切关注这些发展,大胆而谨慎地进行实验,并始终将其与核心问题联系起来:这是否有助于人们和组织更有效地实现他们所重视的目标? 如果答案是肯定的——而且这种情况会越来越多——那么整合像 Copilot(及其连接器)这样的 AI 助手不仅仅是技术升级,而是现代工作场所的战略要务。毕竟,竞争优势将属于那些能将人机协作自然、有效地融入日常工作的人。

[1] [3] [4] [7] [9] Windows上的Copilot:连接器和文档创建开始向Windows预览体验成员推出 | Windows预览体验博客

https://blogs.windows.com/windows-insider/2025/10/09/copilot-on-windows-connectors-and-document-creation/

[2] [6] [8] Microsoft Copilot 现已能够在您的 Google 账户中担任副驾驶

https://www.vice.com/en/article/microsoft-copilot-google-integration/

[5] [43] Windows 上的 Copilot 现在可以创建 Office 文档并连接到 Gmail | The Verge

https://www.theverge.com/news/798098/microsoft-copilot-windows-create-documents-outlook-gmail-connection

[10] [11] [12] [14] [51] [52] Google 的 Duet AI 现已在 Docs、Gmail 和其他 Workspace 应用中可用 | The Verge

https://www.theverge.com/2023/8/29/23849457/google-duet-ai-docs-slides-gmail

[13] [15] [39] 宣布推出增强版 Google Chat | Google Workspace 博客

https://workspace.google.com/blog/product-announcements/welcome-new-google-chat

[16] [17] [18] [19] [20] [23] [24] [49] Notion AI 连接器 – Notion 帮助中心

https://www.notion.com/help/notion-ai-connectors

[21] [44] 我们在Make with Notion发布的所有内容

https://www.notion.com/blog/conference-product-releases

[22] Notion 3.0推出任务自动化AI代理 - Reworked

https://www.reworked.co/collaboration-productivity/notion-30-introduces-ai-agents-for-task-automation/

[25] [26] [35] [36] [40] Comet 浏览器:实用指南与实例 | DataCamp

https://www.datacamp.com/tutorial/comet-perplexity

[27] [28] [29] [30] [31] [32] [33] [34] [41] [50] 将 Perplexity 与 Gmail 和 Google 日历连接 | Perplexity 帮助中心

https://www.perplexity.ai/help-center/en/articles/12168040-connecting-perplexity-with-gmail-and-google-calendar

[37] Agentic Browser Security: Indirect Prompt Injection in Perplexity Comet

https://brave.com/blog/comet-prompt-injection/

[38] CometJacking: How One Click Can Turn Perplexity's Comet AI ...

https://layerxsecurity.com/blog/cometjacking-how-one-click-can-turn-perplexitys-comet-ai-browser-against-you/

[42] Duet AI for Google Workspace now generally available

https://workspace.google.com/blog/product-announcements/duet-ai-in-workspace-now-available

[46] 超越文字:AI 通过多模态技术与你相遇

https://news.microsoft.com/source/features/ai/beyond-words-ai-goes-multimodal-to-meet-you-where-you-are/

[47] Microsoft Copilot 现在可以读取你的屏幕,深入思考,并朗读给你听...

https://techcrunch.com/2024/10/01/microsoft-copilot-can-now-read-your-screen-think-deeper-and-speak-aloud-to-you/

[48] Copilot Vision:可在 Windows 上通过语音帮助你的多模态 AI 助手...

https://windowsforum.com/threads/copilot-vision-ai-that-sees-your-screen-and-helps-you-by-voice-on-windows.382126/?amp=1

毕业于埃默里大学,获得学士学位,并在美国生活和工作了十年。他曾先后就职于美国的私募股权和风险投资机构,后加入奇迹真基金的早期投资团队,从事AIGC和代理方向的长期研究。2025年,Macaron AI将与创始团队一同推出,致力于通过技术提升日常生活体验。

申请成为 Macaron 的首批朋友