作者: Boxu Li

介紹:AI 原生瀏覽的新時代

Perplexity 的 Comet AI 瀏覽器作為一款全新的 AI 原生瀏覽器大膽進入瀏覽器市場,現在全球免費提供perplexity.aiperplexity.ai。於 2025 年中期首次面向有限的受眾推出,Comet 很快成為當年最受歡迎的 AI 產品之一,在其等待名單上積累了數百萬用戶perplexity.aiperplexity.ai。現在對所有人開放,Comet 旨在通過將 AI 助手緊密融入核心瀏覽體驗,重新定義我們與網絡的互動方式。這一方法與 Chrome、Edge、Brave 和 Arc 等傳統瀏覽器形成鮮明對比,這些瀏覽器僅開始將 AI 助手作為附加功能。

Comet 的使命: Comet 的首要目標是透過放大人類的好奇心和生產力來讓網際網路更有用perplexity.aiperplexity.ai。Perplexity 的團隊大膽地提出問題:儘管網際網路已經演變成「人類的延伸心智」,我們的瀏覽工具仍然原始perplexity.ai。Comet 的解答是將智慧直接嵌入瀏覽器,將網頁導航從被動的點擊鏈結行為轉變成主動的對話或合作perplexity.aiperplexity.ai。其設計理念可以用他們的口號來概括:一切偉大的事物始於一個問題perplexity.aiperplexity.ai —— Comet 鼓勵使用者在瀏覽時自由地提問和委派任務,而不是將瀏覽器視為靜態的內容視窗。

全球可用性: 在 2025 年 10 月決定全球免費發布 Comet,標誌著 Perplexity 在推動廣泛採用方面的戰略推進perplexity.aiperplexity.ai。這一舉措不僅為日常消費者開啟了嘗試 AI 首創瀏覽器的大門,還將 Comet 定位於傳統巨頭(如 Google Chrome、Microsoft Edge)和新興的 AI 驅動瀏覽器(如 The Browser Company 的 Arc/Dia 及 OpenAI 傳聞中的產品)之間techcrunch.comtechcrunch.com。在主要科技公司競相將 AI 整合到用戶界面的時代,Perplexity 堅持認為瀏覽器本身應該是圍繞 AI 重建而不是僅僅由它增強beam.ai

在接下來的章節中,我們將深入探討 Comet 的產品架構和使用者體驗,檢視其核心功能、設計理念,以及與 Chrome、Edge、Brave 和 Arc 的 AI 功能之間的對比。我們還將討論代理瀏覽的技術影響——即瀏覽器主動為使用者執行任務——並評估從頭開始打造 AI 原生瀏覽器與在舊系統上加入 AI 層的策略利弊。

設計理念:「助手就是瀏覽器」

Blog image

Comet 設計的核心是一個範式轉變:不僅僅是渲染網頁的瀏覽器,Comet 表現為一個智能助手,「在使用者旁邊主動進行整個瀏覽過程」。在 Perplexity 的願景中,瀏覽器不再是被動的工具,而是一個認知夥伴——使用者與網路之間的界面成為一場流暢的對話。這一設計理念由 Perplexity 團隊概述的幾個關鍵轉變所體現:

  • 從導航到認知: 傳統瀏覽是關於導航頁面和標籤,而 Comet 則是關於增強思維。標籤頁和超連結讓位於一個理解上下文和用戶意圖的智能介面perplexity.aiperplexity.ai。用戶不需手動在多個標籤頁之間跳轉,可以請 Comet 尋找相關資訊或比較多個頁面的內容。例如,可以問*「哪個網站更快賣這個產品?」* 或 「將我正在讀的內容與昨天看到的內容比較」,Comet 會處理多頁導航和分析perplexity.aiperplexity.ai。這減少了上下文切換,讓用戶專注於高層次的問題,由 AI 來處理低層次的點擊和滾動。
  • 從答案到行動: Comet 設計為將複雜的工作流程整合成流暢的對話perplexity.aiperplexity.ai。助理不僅搜索答案,還可以執行命令來完成任務。用戶被鼓勵「大聲思考」——例如 「下週和 John 訂個會議討論這份報告」「買下我購物清單上忘記的物品」,Comet 會嘗試執行所需的多步驟操作(檢查日曆、撰寫郵件、填寫表單)以滿足這些請求perplexity.aiperplexity.ai。本質上,Comet 將網頁視為一個可以操作的沙盒,在瀏覽器內將指令轉化為行動。這種代理能力(下面將進一步討論)是區分 Comet 與典型查詢回應行為的關鍵特徵。
  • 從消費到好奇: Comet 將每個頁面重新構想為互動且可探索。用戶可以標記任何文字以獲得即時解釋或在不失去上下文的情況下提出即興問題perplexity.ai。與其被動地消費內容或被引導至以廣告為導向的點擊(對當前網絡的一個常見批評perplexity.aiperplexity.ai),Comet 鼓勵一種探索性的思維。助理隨時在場提供定義、背景資訊、反駁或相關的即時想法perplexity.ai。這與 Perplexity 的使命一致,即服務於好奇心——「互聯網成為你思維的延伸」,每個頁面都可以觸發自然的問答或頭腦風暴perplexity.aiperplexity.ai。早期使用數據支持這一點:當用戶獲得 Comet 訪問權限時,他們在網上提出的問題數量劇增(首日問題數量增加 6–18 倍)perplexity.aiperplexity.ai,顯示出以好奇心為驅動的介面被啟動了。
  • 從可信度到準確性: 信任是 Comet 設計的基石。基於 Perplexity 的引用、可驗證答案的理念,Comet 強調準確和可信的信息來支持決策perplexity.aiperplexity.ai。這一點尤為重要,因為隨著 AI 助理變得更加代理(為我們做出決策或交易),錯誤的代價提高了perplexity.aiperplexity.ai。Comet 的助理為其答案提供來源(利用 Perplexity 的搜索和引用)flatlineagency.comflatlineagency.com,並調整以減少幻覺,儘管無法完全消除(我們稍後會指出)beam.ai。通過優先提供準確的回答和上下文,Comet 旨在建立用戶信心,使 AI 的建議在比較保險計劃或理解複雜技術等重要任務中得到信任perplexity.aiperplexity.ai

總結來說,Comet 的理念圍繞著一個無所不在、具備情境感知且以行動為導向的 AI。這個助手不是一個偶爾才造訪的獨立聊天機器人,而是嵌入在瀏覽過程中的一部分。每個新的 Comet 分頁都會生成一個全新的 AI 助手,隨時準備提供幫助perplexity.aiperplexity.ai,強調助手就是瀏覽器介面。這種方法顛覆了我們在其他地方看到的增量 AI 附加功能——與其將 AI 視作可選工具,Comet 將 AI 驅動的協助作為用戶互動的主要模式。

Comet 的核心功能和能力

Comet 的功能集合反映了其一體化助手的雄心。它將網頁瀏覽器、搜尋引擎和個人數位助手的功能結合成一個統一的產品。以下是我們分解的 Comet 架構和用戶體驗的核心功能:

  • 整合的 AI 側邊車助手: Comet 最引人注目的功能是無所不在的側邊欄 AI 助手,可以在瀏覽時隨時出現。這個側邊欄(有時稱為「Comet 助手」)可以在任何頁面上召喚,解釋並與內容互動techcrunch.comtechcrunch.com。它可以總結你正在閱讀的頁面、回答有關頁面的問題,甚至根據你的指令點擊鏈接或代替你導航techcrunch.comtechcrunch.com。例如,在新聞文章中,你可以要求「給我關鍵點和其他來源的矛盾事實」,助手會生成具有相關背景的摘要。側邊欄本質上就像一個動態、情境敏感的 AI 副駕駛,將靜態頁面轉化為互動對話。與僅存在於搜索頁面的聊天機器人不同,Comet 的助手隨時陪伴在你每個網站,始終了解當前頁面內容。早期用戶評價讚揚了這種情境感知能力——一位技術評論員指出助手「預測你的下一步動作」,並*「毫不費力地融入你的側邊欄」*starkinsider.comstarkinsider.com。整合程度深到每個標籤頁都保留自己的情境記憶;如果你切換出去再回來,助手仍記得該特定頁面的早期對話starkinsider.com。這種每個標籤記憶允許多任務處理而不丟失不同的線索。
  • 會話搜索(Perplexity AI 引擎): 在背後,Comet 預設使用Perplexity 的 AI 搜索引擎來處理任何查詢,這意味著用戶會收到帶有引述來源的直接答案,而不是僅僅一堆鏈接flatlineagency.comflatlineagency.com。瀏覽器的新標籤頁實質上是一個聊天提示:用戶可以在中央框中輸入問題或關鍵字,然後獲得即時從網絡上抓取的信息生成的 AI 回答flatlineagency.comflatlineagency.com。這種緊密的搜索整合改變了瀏覽體驗——搜索變成了對話。例如,輸入*「電動汽車電池技術的最新趨勢是什麼?」*這樣的查詢會立即生成帶有參考文獻的摘要,然後你可以在不離開頁面的情況下繼續提問。傳統瀏覽器如 Chrome 或 Safari 需要你點擊搜索結果,但 Comet 直接帶來信息並附上解釋。此外,由於內建,每次你在 Comet 中打開新標籤頁時,基本上就是迎接一位個人研究助理,隨時準備挖掘答案flatlineagency.comflatlineagency.com。這是一個顯著的可用性差異——有效地將搜索欄和地址欄合併為 AI 問答界面。
  • 情境記憶與持續性: Comet 的一大亮點是它能夠跨頁面和會話維持情境。助手可以回憶起你在以前的標籤頁甚至是前幾天所做的事情,以提供當前的協助。Perplexity 團隊強調 Comet 「學會你的思考方式,以便更好地與你思考」perplexity.aiperplexity.ai,這表明了一個個性化的學習組件。實際上,這體現在記住項目情境和保留每個網站聊天記錄等功能中。Covisian 企業分析指出,與傳統瀏覽器中每個標籤隔離不同,Comet 會跟蹤互動和開放的標籤,以便項目保持連續性——這對於複雜的工作流程是個福音covisian.comcovisian.com。例如,如果你在多個來源中研究一個主題,Comet 可以識別重複的主題或早先看到的相關信息並重新浮現。這種記憶也延伸到用戶數據整合:如獲許可,Comet 的助手會記住你的電子郵件、日曆事件和先前查詢,以提供量身定制的幫助(例如,提醒你上週已經研究過類似的問題,或你明天有個相關的會議)。本質上,Comet 邁向「第二大腦」模型perplexity.ai,你的瀏覽歷史和個人數據被納入一個持續的知識模型,以主動協助你。
  • 多模態任務自動化(代理): 除了只讀協助,Comet 還具有代理能力——它可以在瀏覽器內為用戶執行多步驟任務。這些集成代理處理特定領域:
    • 郵件代理: Comet 提供強大的郵件整合(特別是對於付費 Max 用戶),AI 可以管理你的收件箱。用戶可以要求助手總結郵件線索、以你的語氣起草回覆、排序和優先處理郵件,甚至通過郵件安排會議growthjockey.comgrowthjockey.com。通過 CC 特殊地址或授予訪問權限,你實際上擁有了一位 AI 秘書:可以指示它每天早上梳理你的收件箱並準備簡報,或者起草一封同意開會的回覆並在日曆上找到共同的空閒時間growthjockey.comgrowthjockey.com。一位評論者驚嘆於 Comet 「讓 Gmail 更聰明」,提供快速操作,如總結冗長對話、從舊郵件中找到隱藏信息,並自動組織郵件starkinsider.comstarkinsider.com。助手可以將電子郵件中提到的事件填入你的日曆,甚至回答有關收件箱的問題(「我有任何來自人力資源部的緊急郵件嗎?」)techcrunch.com。這個深度整合的郵件代理打破了聊天機器人範式的模具,直接在真實應用中代表你行動。
    • 日曆和排程: 與郵件緊密相連,Comet 的助手可以管理日曆。它可以檢查你的日程安排,找到空閒時段,並根據指示發送邀請或預定會議growthjockey.comgrowthjockey.com。例如,你可以說:「下週安排一次與銷售團隊的 30 分鐘會議並準備議程」,Comet 將協調你的 Google 或 Outlook 日曆(如獲授權),建議時間,通過電子郵件發送邀請,甚至將時間鎖定。早期一位用戶回憶道,當詢問 Comet 他們的下一次會議時間時,助手不僅回覆了時間,還帶來了與會者的簡短介紹,提前提供了寶貴的會議背景medium.commedium.com。這說明了 Comet 的代理如何模糊瀏覽、個人信息管理和生產力應用之間的界限。
    • 購物和電子商務代理: Comet 包含一個購物助手,可以簡化電子商務任務。用戶可以用自然語言簡單描述他們想要的東西——例如*「找一張價格在 300 美元以下的舒適人體工學辦公椅」——Comet 將搜索多個零售商、匯集評價或評分,並提供建議perplexity.aiperplexity.ai。助手利用其網頁導航能力比較各網站價格或產品詳細信息techcrunch.com。它甚至可以自動化購買:有人可以指示「從最便宜的商店訂購我的常用食品清單」*,Comet 理論上可以在 Instacart 或 Walmart 網站上填滿購物車。一位測試 Comet 購物功能的用戶要求找到蛋白粉的最佳價格;Comet 從在線零售商處提取結果,並允許根據評價進行篩選,展示了如何即時抓取和篩選購物信息medium.commedium.com。在某些情況下,Comet 可以自動將商品添加到購物車或根據指令進行結賬medium.com。這個代理簡化了比價購物,可能為用戶節省大量時間,實質上成為一位為你瀏覽零售網站的個人購物助手。
    • 頁面內操作與網頁自動化: 超越特定領域,Comet 可以處理一般的網頁自動化任務。其助手能理解像*「用我保存的信息填寫此表單」「滾動找到此頁面上的定價部分」「點擊第三個搜索結果並總結該頁面」*這樣的命令。GrowthJockey 技術博客指出 Comet 可以導航網頁並執行重複性操作,例如在用戶命令下完成表單填寫或多步驟網站交互growthjockey.com。例如,告訴 Comet 「打開此網站的聯繫頁面並提取電子郵件地址」,助手會定位並打開鏈接並抓取所需信息。令人印象深刻的是,你甚至可以用簡單語言指示它做諸如「按主題組織我的開放標籤並關閉多餘的那些」這樣的事情,它會執行一項原本需要多個手動步驟的瀏覽會話管理任務medium.com。這樣的工作流程自動化——將高層指令轉化為一系列點擊和按鍵,是 Comet 的一個關鍵差異化特性。它將瀏覽器視為一個可編程的代理平台,而不僅僅是文件查看器。
  • 專業的“空間”和內容中心: Comet 引入了新穎的用戶界面概念,如空間探索空間是一種組織項目或情境的方式——本質上是邏輯分組的標籤或任務集合(例如,你可能有一個「旅行計劃」空間,將你的旅行研究、酒店預訂、地圖等放在一起,並且助手了解整個空間)。TechCrunch 報導將空間類比為在瀏覽器內管理不同項目techcrunch.com。這與 Comet 的記憶功能相關,允許用戶維持獨立的情境線索並在其間無縫切換。探索,另一方面,被描述為一個個性化的新聞或內容推薦流,類似於 OpenAI 的「Pulse」流techcrunch.com。它可能利用你的瀏覽興趣來呈現相關的文章或更新,你可以在助手的幫助下進一步探索。此外,Comet 還有旅行、金融、體育等模塊,提供這些領域的綜合信息和工具(例如,顯示航班和酒店選項的旅行面板,或用於跟蹤股票的金融工具)techcrunch.comtechcrunch.com。這些類似於內建於瀏覽器中的應用程序,每個都由 AI 為該情境增強。傳統瀏覽器依賴於第三方擴展來完成這些利基功能,而 Comet 則將它們與 AI 智能一起捆綁在內。
  • 合作與共享: 企業分析中提到的一個微妙但強大的功能是協作瀏覽。Comet 可以讓用戶共享瀏覽會話或與同事在相同的標籤集合上實時協作covisian.comcovisian.com。想像兩個團隊成員通過 Comet 共同研究:他們可以真正在「同一頁面上」,看到彼此的重點或問題,助手還可以在他們之間調解知識。這將瀏覽器轉變為一個協作工作空間,而不是一個孤立的工具。結合 AI 的總結和註釋能力,團隊可以使用 Comet 共同進行頭腦風暴或分析信息,而不必通過電子郵件來回發送鏈接。這一功能對於企業使用特別有吸引力,讓分布式團隊在處理數據時能夠利用共享的「第二大腦」。

總的來說,Comet 的核心功能提供了一個整體的助理體驗。它不是由單一的功能來定義,而是透過將搜尋、聊天、記憶和自動化整合在一個瀏覽器中的協同作用。這樣一來,使用者可以在閱讀、詢問和委派操作之間流暢切換——全部都在同一個介面中。這種整體的方法正是 Perplexity 所指的 Comet「積極支持知識工作和決策制定」,而不僅僅是顯示網頁。covisian.comcovisian.com.

早期用戶體驗與反饋

儘管是新進者,Comet 已經從早期使用者那裡收集了大量反饋,範圍從科技愛好者到企業評估者。早期用戶體驗的洞察顯示出對其潛力的興奮以及對其當前限制的實際觀察:

  • 在早期使用者中受到高度採納: Comet 僅限邀請的發佈會(2025年7月)引起了極大的關注,轉化為強烈的參與度。Perplexity 報告指出,現有用戶在開始使用 Comet 後,提問行為顯著增加,這表明整合的助手確實激發了潛在的好奇心。許多人發現自己每天使用助手數十次,用於快速獲取資訊、澄清和小任務,而之前可能不會為這些小問題煩惱去使用單獨的搜尋或 AI 工具。*「互聯網在 Comet 上更好」*這句話成為一種驗證,因為用戶體驗到可以隨時在瀏覽器中自然地詢問任何問題,這表明其受到了積極的反響:用戶感到更有能力,且在資訊檢索任務中不再感到沮喪。
  • 從 Chrome 切換 – 一個意外的成功: 一些長期使用 Chrome 或 Edge 的科技評論者表達了對 Comet 快速征服他們的驚訝。一位評論者承認,「我本來很懷疑…… Chrome 是一切……但我可以簡單卸載並回去。然而,這當然完全沒有發生。」,這是在發現 Comet 的整合助手具有變革性之後。由於 Comet 建立在 Chromium 上,學習曲線很小(在 UI、設置和擴展支援方面感覺就像 Chrome)。這種兼容性意味著用戶保留了熟悉的瀏覽器工作流程(書籤、標籤行為、開發工具等),同時獲得了新的 AI 能力。正如一篇評論所說,「雖然我已經切換到 Comet,但我真的沒有從 Chrome 切換」 – 強調了 Comet 智能地利用了 Chrome 的基礎來簡化採納。這對於減少高級用戶的摩擦至關重要:所有他們喜愛的擴展和網站運作方式相同,但現在有一個有用的助手在頂層。
  • 驚喜時刻: 早期用戶經常描述當 Comet 的效用顯現時的「頓悟」時刻。例如,使用助手直接從 Gmail 的網頁介面撰寫和發送電子郵件感覺幾乎是魔法般的——用戶觀看 AI 以他們的風格撰寫回覆並發送,一切都在熟悉的 Gmail 標籤內進行。能夠突出顯示網站上令人困惑的段落並獲得即時解釋或翻譯是另一個驚喜,將任何頁面變成交互式學習體驗。一位用戶回憶說,請 Comet 查找 Gmail 中某個人發送的所有郵件——Comet 快速生成了一個摘要列表,而無需用戶手動搜尋或篩選電子郵件。另一位提到,「我實際上可以與網站聊天」,在公司簡介頁面查詢特定事實並獲得從該頁面獲取的答案。這些故事強調了 Comet 如何改變用戶的期望:用戶可以自然地詢問並獲得直接幫助,而不是將問題適應於搜尋框或手動挖掘資訊。
  • 生產力提升和專注: 個人用戶和企業試點均報告了明顯的生產力提升。通過委派繁瑣的任務(如清理20個開放標籤、總結長文件或在應用程序間交叉發布信息),用戶騰出時間進行更高層次的思考。頁面上的摘要和多來源比較被頻繁提及為極大的時間節省,例如在幾秒鐘內總結一份20頁的 PDF 合同或在一個視圖中比較兩個產品在不同網站上的規格。在企業環境中,知識型員工看到將例行研究和數據提取自動化的吸引力。Covisian 的分析指出,以前需要數小時的工作(例如從多個儀表板中提取統計數據或匯總客戶反饋)可在 Comet 的指導下被壓縮成一系列自動化步驟——儘管需要監督。用戶還提到一個心理上的好處:分心更少。由於 Comet 可在不需要用戶手動跳轉網站的情況下獲取答案,因此更少的風險會因為不相關的鏈接或廣告而分心。用戶可以提出問題並專注於答案,而不是進行搜尋結果篩選的心理上下文切換。
  • 學習曲線和習慣變化: 並非一切都是瞬間的魔法——一些用戶注意到需要改變心態才能充分利用 Comet。人們習慣於在瀏覽器中手動操作,因此記住*「哦,我可以讓 Comet 來做這件事」*是一種需要建立的新習慣。例如,與其本能地打開多個標籤並複製粘貼信息,不如記住使用助手(「與瀏覽器聊天」)。早期採納者發現,一旦他們打破舊習慣,回報是值得的,但需要初步的意願來信任 AI 處理任務。還需要學習助手的能力和特點。如果 Comet 感到困惑,有些任務需要重新措辭或中間指導。用戶通常從簡單的查詢開始,隨著對 AI 理解的信心增強,逐漸嘗試更複雜的指令。用戶教育(通過工具提示、入門教程或僅僅是實驗)是關鍵——Comet 團隊在瀏覽器中提供了如何最大化助手的提示,例如建議使用自然語言或如何有效地鏈接請求。隨著用戶群超越技術愛好者,確保普通用戶掌握這些新範式將是一個持續的挑戰。
  • 性能和用戶界面反饋: Comet 的界面因其整潔和熟悉(得益於 Chromium 基礎)而普遍受到讚譽。側邊欄助手可以在需要更多屏幕空間時關閉,儘管一位評論者打趣說,「你需要更多的水平空間來容納助手」,並指出你可以關閉它,*「但為什麼要這麼做呢?畢竟,這是主要的吸引力。」*有報告指出略有性能開銷——當助手處理請求或加載上下文時,尤其是在繁重的頁面或使用較大的 AI 模型時,可能會出現「延遲」,這可能會困擾一些不耐煩的用戶。這並不意外,因為 AI 正在進行非平凡的計算,但這是一個需要改進的領域。另一個報告指出助手在採取行動時偶爾會過於積極:例如,點擊鏈接並意外替換當前標籤,而人類可能會打開一個新標籤。這些問題可能是可修復的 UI 錯誤或需要調整的設置(例如,用戶可以指定結果的開啟方式)。由於 Chromium 的基礎,整體穩定性和兼容性一直很穩固——頁面正確渲染,並且在報告期間崩潰的情況很少見。
  • 信任和隱私問題: 用戶反饋中的一個反復出現的主題是充分受益於 Comet 所需的信任水平。要使用電子郵件和日曆集成等功能,用戶必須授予對敏感個人數據(電子郵件、日程表等)的訪問權限,並有效地允許 AI 代表他們行動。可以理解的是,有些人對此持謹慎態度。Stark Insider 的評論明確警告,"如果你不願將一切交給 AI,你可以從小處開始",指出 Comet 在設置集成時請求訪問大量數據。Perplexity 試圖通過強調隱私保護措施來緩解擔憂:數據保持加密並在可能時保留在本地,AI 不會在您的私人內容上進行訓練。例如,電子郵件助手承諾不使用您的電子郵件內容來進行模型訓練,而僅專注於分析以進行草擬和排序。然而,在企業環境中,這仍然是一個障礙點——合規官員需要被說服一個 AI 驅動的瀏覽器不會洩露機密信息或執行未經授權的操作。一些公司已經開始在沙盒中進行 Comet 的內部測試,以觀察其在處理敏感數據時的行為。正如一位企業技術作家所言,*「採用將取決於安全性、合規性和可衡量的投資回報率。Comet 可能是未來,但只有在證明其安全和可靠的情況下。」*這強調了除了酷炫的功能之外,通過透明度、用戶控制和經過驗證的可靠性來建立信任對於廣泛接受至關重要。

總結來說,早期用戶普遍反映,Comet 帶來了「驚豔效果」,讓日常瀏覽任務更快、更直觀。它成功地轉化了一些懷疑者,並證明了以 AI 為核心的瀏覽器既實用又有用。同時,真實世界的使用也突顯了需要改進的重要領域:使 AI 在處理複雜任務時更穩健(以減少偶爾的錯誤或需要澄清的情況)、平滑性能上的小問題,並說服用戶(和企業)相信 Comet 可以安全地處理他們的數據和任務。這些對於這樣一款新穎產品來說是自然的成長痛。迄今為止的積極反應,特別是在高級用戶中,表明 Comet 正在走上影響網頁用戶體驗未來的道路。正如一位熱情的評論者在使用一天後所說:「這改變了一切!...未來已經到來,我正在從 Chrome 轉換過來。」 starkinsider.com

Comet 與 Chrome、Edge、Brave 和 Arc 的區別

Comet 的出現引發了不可避免的比較,無論是與現有的巨頭瀏覽器,還是與那些正在嘗試 AI 的新興瀏覽器。理解 Comet 的 AI 原生方法如何不同於 Chrome、Edge、Brave 和 Arc 的 AI 功能(以及像 Opera 這樣的其他瀏覽器)是很重要的。基本上,當那些瀏覽器將 AI 添加為功能時,Comet 則是以 AI 為基礎構建的。以下是它們之間的差異:

  • Google Chrome(及 Google 生態系統): Chrome 是全球主流瀏覽器,Google 已開始謹慎地將 AI 融入其中。到 2025 年底,Google 宣布對 Chrome 進行重大 Gemini AI 升級,在 Chrome 中引入「AI 瀏覽助手」,可回答多個開放標籤頁的問題,並在地址欄中引入 AI 模式以處理複雜查詢blog.google。未來的更新暗示 Chrome 的「代理能​​力」,可能自動化如購物等任務blog.google,本質上是對 Comet 所做的事情的點頭致意。然而,這些功能在 Chrome 中非常新,尚未深度整合。歷史上,Google 將 AI 助手視為獨立存在(例如,Google Assistant 或 Bard 在瀏覽器之外)。Chrome 的初步 AI 增強專注於 搜索增強 (SGE)頁面摘要工具,以及幕後安全性(使用 AI 阻止網絡釣魚網站等)blog.google。相比之下,Comet 從一開始就提供了在任何網頁上的對話覆蓋和多步驟任務執行。另一個關鍵差異是 意識形態:Google 圍繞 Chrome 的商業模式與廣告和通過 Google 搜索引導流量相關,這可能與提供直接答案或跳過廣告的捷徑相衝突starkinsider.com。Comet 不依賴於廣告模式,樂於提供引用支持的答案,並經常繞過廣告商渴望的點擊路徑perplexity.aiperplexity.ai。簡而言之,雖然 Chrome 現在正朝著 AI 輔助的體驗邁進(尤其是 Gemini 的推出),但 Comet 是圍繞這一概念構建的,目前提供更統一和積極的助手。這是一個經典的創新者困境:Google 必須在其收入模式和現有用戶期望之間取得平衡,而 Comet 可以在沒有這些遺留問題的情況下積極推進以 AI 為中心的設計。
  • Microsoft Edge(搭載 Bing Copilot): Microsoft 是在主流瀏覽器中添加 AI 副駕的先驅。2023 年初,Edge 推出了 Bing Chat 側邊欄,後來更名為 Copilot,允許用戶詢問有關頁面的問題、獲取摘要或在 Bing 的 GPT-4 模型的幫助下撰寫文本。這是重要的一步,Edge 的集成在問答和內容生成方面相當強大。但是,Edge 的 Copilot 本質上仍然是一個側邊欄聊天機器人——它並沒有深入控制瀏覽器的操作。它可以建議操作(例如“比較這些產品”然後在聊天中顯示結果),並通過一些更新獲得了從頁面提取數據或通過提示調整瀏覽器設置的能力。但它很少在未經用戶確認的情況下自動執行操作,例如點擊鏈接或填寫表單。設計上,Edge 的 AI 通常會要求許可或提供按鈕供用戶點擊(例如,“將這些物品添加到購物車嗎?”)而不是未經用戶查看就執行完整任務。Comet 的代理,則旨在一旦接到指令就無縫執行整個工作流程perplexity.aiperplexity.ai。另一個區別是與個人數據的集成:Edge 的 Bing Copilot 沒有與您的 Gmail 或個人文件的本機連接(超出 Windows Copilot 可能在操作系統層面上的功能)。Comet 更廣泛地直接集成個人賬戶(Google、電子郵件等)。戰略上,Edge 擁有被默認安裝在 Windows 上並與 Microsoft 365 生態系統集成的優勢。這意味著 Edge 的 Copilot 可以逐漸與 Outlook、Teams 等集成,但 Microsoft 必須在許多產品之間進行集成。Comet 作為獨立應用,在其自有環境中快速迭代。一篇 TechCrunch 的文章指出,Perplexity 需要證明 Comet 的代理功能可靠以吸引用戶從現有設置中轉換techcrunch.comtechcrunch.com——這基本上承認了像 Edge 這樣的現有產品在用戶慣性上具有優勢,但如果 Comet 的更深層自動化能真正節省時間,則會提供一個令人信服的轉換理由。
  • Brave(與 Leo AI): Brave 是一款注重隱私的基於 Chromium 的瀏覽器,添加了一個名為 Leo 的 AI 助手。Leo 可通過地址欄(“Ask Leo”)或側邊欄訪問,可以執行如頁面摘要、回答問題、生成內容,甚至在瀏覽器中分析多標籤內容kosmik.appbrave.com。重要的是,Brave 強調 Leo 是 本地或私密運行的——它不會記錄您的提示,甚至允許自定義本地模型(通過“自帶模型”功能供高級用戶使用)brave.combrave.com。在功能方面,Leo 與 Comet 的某些功能重疊:頁面摘要、問答和基本內容創建(類似於 ChatGPT)。然而,Leo 的範圍較窄;它不被描述為自主執行多步任務。例如,Leo 可以幫助起草電子郵件,但不會進入您的 Gmail 並為您發送。Brave 也不提供內置的電子郵件或購物代理——這會與 Brave 的簡約方法和隱私立場相衝突。Comet 採取更廣泛的觀點,擁有代理可登錄服務(經過許可)並執行交易。這是隱私意識強的用戶可能不贊成的;Brave 可能故意避免越過這條界線。因此,權衡是:Comet 提供 深度集成和便利性,以與 AI 共享數據為代價,而 Brave 的 Leo 提供 隱私和用戶控制,但自動化較少。另一個差異是模型訪問:Brave Leo 可以訪問多個模型(Anthropic 的 Claude、Meta 的 Llama 等,甚至是社區模型)brave.com,並提供更快響應或更高使用量的高級服務brave.combrave.com。Perplexity 的 Comet 沒有明確向最終用戶公開多個模型選擇(助手可能由幕後多個模型支持)。一篇評論提到 Comet 的側邊欄中的“多 LLM 見解”,列出了 GPT-4、Claude、Gemini 等可用starkinsider.comstarkinsider.com。這表明 Perplexity 可能正在協調各種 AI 模型以獲得最佳答案。但對用戶來說,Comet 的助手感覺像是一個統一的 AI 服務。Brave 的方法更具模塊化。總之,Brave 的 Leo 是隱私瀏覽器的 AI 助手附加功能,而 Comet 是以能力優先的 AI 中心瀏覽器,可能以犧牲一些隱私為代價。用戶將根據哪種理念適合他們來選擇。
  • Arc / The Browser Company(Arc Max 和 Dia): Arc 是一款以其獨特界面和設計導向功能而聞名的創新瀏覽器,但最初並不重視 AI。2023 年,Arc 推出了 Arc Max,一套可選的 AI 功能,包括使用 AI 的「5 秒頁面預覽」、內置 ChatGPT 訪問(如果您有 OpenAI 帳戶)以及使用 AI 智能重命名標籤/下載等功能arc.netarc.net。這些是相對輕量的增強功能——有益但不具變革性。然而,到 2025 年中,The Browser Company 轉向了名為 Dia 的新產品,這是一款 AI 原生瀏覽器(本質上是他們對 Comet 的回答)。Dia 從頭開始構建,深入整合 AI,從 Arc 中吸取教訓,但旨在提供助理驅動的體驗beam.aibeam.ai。公司的早期溝通表明 Dia 的理念類似於 Comet:AI 將幫助推動體驗,建議下一步要做什麼,記住您的瀏覽流程,讓您不必管理標籤或書籤那麼多,並了解您的背景以減少手動搜索beam.aibeam.ai。換句話說,Arc 團隊明確承認 Arc(儘管設計現代)仍然是一個以人類為驅動的瀏覽器,而 Dia 是他們嘗試製作 AI 驅動瀏覽器的嘗試beam.aibeam.ai。目前的主要區別是可用性和成熟度。截至 2025 年 10 月,Dia 已經在 macOS 上普遍可用(在邀請期之後)theverge.com,但尚未在 Windows 上可用theverge.com。它處於早期階段,而 Comet 自 7 月以來一直在與真實用戶迭代。從戰略上講,The Browser Company 被 Atlassian 以 6.1 億美元收購theverge.comtheverge.com突顯了“大型技術公司”對“AI 瀏覽器”領域的重視。可以預期 Dia 將與 Comet 平行發展,可能相互影響。但目前,Comet 和 Dia 是兩個突出的“AI 原生”瀏覽器,都追求將 AI 融入瀏覽的每個方面的願景。他們與逐步增加 AI 的 Chrome/Edge/Brave 相區別。一句話來總結:“這些不僅僅是化妝更新或將 AI 塞入搜索欄。每個 [Comet,Dia,OpenAI 的傳聞瀏覽器] 都在嘗試從頭開始重建瀏覽體驗,將 AI 作為核心。”beam.ai。這根本上就是將 Comet 與 Arc(原始形式)區分開來的原因——Arc 並不是以 AI 為中心的,而 Comet 是。現在,隨著 Dia,Arc 的繼任者,我們將看到與 Comet 在設計和功能上的直接對抗。
  • 其他瀏覽器(Opera 等): Opera 引入了一個名為 Aria 的 AI 助手,集成在瀏覽器的側邊欄中。Aria 由與 OpenAI 的合作提供支持,可以回答問題並協助網頁查詢。Opera 的方法在某種程度上類似於 Edge——在瀏覽器旁邊提供 AI 聊天機器人。它不重新設計圍繞 AI 的核心界面,但在上下文中提供 AI(例如,您可以突出顯示頁面上的文本並詢問 Aria)。Opera 還在某些上下文中集成了 AI 生成的內容摘要。然而,Opera 的用戶基數較小,AI 功能雖然方便,但並未徹底改變其價值主張,正如 Comet 所希望的那樣。值得注意的是,Firefox 更為謹慎;雖然存在一些與 AI 有關的擴展,但截至 2025 年,Mozilla 尚未在 Firefox 中集成原生 AI 助手,這可能是由於對隱私和開放網絡的不同優先級。

總之,Comet 的差異在於整合深度和主動性。傳統的 AI 瀏覽器(如 Chrome、Edge、Brave、Opera)大多將 AI 視為一個功能——強大但仍然附屬於以文件為中心的主要瀏覽器。Comet 和類似的 Dia 將 AI 助理視為核心介面,從根本上改變了瀏覽的隱喻。因此,Comet 感覺像是一個更大的飛躍:它不僅改變了瀏覽器能做什麼,還改變了用戶對瀏覽器的期望。這裡的戰略賭注在於,用戶將會想要一種以助理為中心的體驗,以至於他們願意放棄當前的瀏覽器。與此同時,現有的瀏覽器希望在熟悉的產品中提供恰到好處的 AI 以滿足用戶。未來幾年(甚至幾個月)將揭示全堆疊 AI 瀏覽器方法是否在用戶採用和滿意度上佔優勢,或者主流用戶是否更喜歡他們所熟悉的瀏覽器的逐步演變。

代理式瀏覽的技術影響

構建一個可以作為代理的瀏覽器——意味著它可以自主導航、點擊和代表用戶在網上進行交易——提出了重大的技術和設計考量。作為第一批**“代理瀏覽器”**之一的 Comet,不得不正面應對這些影響:

  • 瀏覽器架構與效能: Comet 的底層是基於 Chromium 架構covisian.com,確保了與網頁標準和擴展的相容性。在此基礎上,Perplexity 整合了其 AI 引擎和額外的協作層。運行 AI 模型(或調用其 API 端點)可能會消耗大量資源,因此瀏覽器必須管理這些過程,而不會過度佔用 CPU/記憶體,從而影響正常的瀏覽體驗。早期用戶注意到當助理在努力工作時,會有些許延遲starkinsider.com,這表明效能調整是一項持續的任務。Comet 可能使用雲端的大型模型(用於複雜推理)和本地或小型模型來快速感知上下文,從而平衡速度和功能。一些用戶暗示的 多 LLM 策略(如 GPT-4、Claude 等一起使用)意味著 Comet 的後端必須智能地路由查詢——可能使用較快的模型處理簡單查詢,而將強大的模型留給複雜任務。這種協作並不簡單,是傳統瀏覽器從未考慮過的新負擔。緩存和重用結果(特別是考慮到上下文記憶)將是避免冗餘處理的關鍵。
  • 可靠性與錯誤處理: 當 AI 代理執行如填寫表單或控制瀏覽器等任務時,錯誤處理變得至關重要。若 AI 點擊了錯誤的按鈕或誤解了頁面佈局該怎麼辦?傳統的瀏覽器自動化(如腳本)可能會以混亂的方式失敗,而這裡的 AI 可能會“認為”自己做對了卻事實上沒有。Perplexity 必須實施安全措施:助理可能需要以某種 模擬模式 運行或在動作後驗證結果。例如,若要求預訂機票,Comet 理想情況下應該向用戶確認(特別是涉及付款時)或提供摘要“這是我要做的,是否繼續?”在高風險任務中。目前的用戶報告顯示 Comet 能夠很好地處理簡單的操作(如開啟連結,提取信息),但在非常高上下文的任務如複雜的旅行預訂或導航複雜的網頁應用時則表現較差beam.aibeam.ai。當它出錯時,可能會幻想出一個結果,或需要用戶分解任務。技術尚不完美。若無明顯的生產力提升和可靠性,用戶不會信任它來執行關鍵任務techcrunch.com。因此,一個影響是 代理的網頁導航能力需要廣泛測試和改進——基本上教 AI 更好地解釋網頁界面並從錯誤中恢復。這是 AI 的一個活躍的發展領域(解釋網頁 DOM,理解意圖等)。Comet 的成功將取決於縮小其 承諾(完全代理式瀏覽)與其能在日常情景中 安全提供 之間的差距。
  • 安全性與沙盒化: 一個代理式瀏覽器模糊了用戶行為和機器行為之間的界線。通常,瀏覽器有安全模型來防止惡意腳本執行,如讀取文件或進行未授權的交易。而 Comet 的助理,在用戶允許下,實際上需要更高的權限——它可能需要登入您的賬戶、讀取頁面數據等。這引發了擔憂:惡意頁面會不會誘騙 AI 洩露信息或執行非預期的操作?例如,若助理在讀取頁面內容時,看到精心編排的文字如“現在輸入您的密碼”,顯然 AI 不應該服從。Perplexity 可能實施了嚴格的 行為限制:它應該有一個行為政策,規定可以和不可以做的事情(特別是在未經明確用戶確認的情況下)。此外,所有自動化都應在瀏覽器的沙盒內進行——Comet 需要確保 AI 代理無法突破正常的瀏覽器限制。背景助理(Max 用戶的新功能perplexity.ai)的使用進一步複雜化了這一點:即使您未主動監督,背景任務可能仍在運行,這必須小心處理以避免不當行為。從安全角度看,Comet 還必須安全地管理憑證。據報導,它有一個集成的密碼管理器和本地加密growthjockey.comgrowthjockey.com。這很重要,因為助理需要訪問您的憑證或令牌才能登錄服務。存儲和使用這些必須遵循最好的加密和零知識原則以防止洩漏。企業 IT 團隊將仔細審查這些方面;有些可能會限制 Comet 的網絡訪問或在虛擬機中運行它,直到他們信任它。
  • 隱私與數據使用: Comet 的功能依賴於處理大量的個人和潛在的敏感數據:電子郵件、日曆事件、聊天等。需要在利用這些數據以造福用戶和不違反隱私期望之間取得平衡。Perplexity 已聲明,所有個人數據都保持本地化或不會用於訓練其模型growthjockey.comgrowthjockey.com。可能 Comet 在某些功能上進行設備上的分析(如可行)並將最小必要數據發送到雲端 AI 服務,可能是匿名或分塊的。例如,總結電子郵件可能在本地使用較小模型完成,或若使用雲模型,Comet 可能避免發送完整標識符。另一個角度是 數據保留:Comet 可能會建立用戶的長期資料(以履行“學習您的思維方式”的承諾perplexity.ai)。如果是這樣,那麼這些資料本身必須謹慎處理——加密並存儲在客戶端,或如果存儲在雲端,則僅限用戶賬戶訪問。隱私法規(GDPR 等)會將 AI 瀏覽器視為潛在的數據處理者,因此 Perplexity 需要提供清晰的說明和控制(如刪除數據的能力,選擇退出某些跟蹤等)。值得鼓舞的是,Brave 與 Leo 的方法表明,不進行大規模數據收集也能擁有 AI 助理(Brave 甚至不要求免費使用 Leo 時註冊brave.combrave.com),儘管這存在限制。Comet 更雄心勃勃的整合可能需要更多數據,但如果能取得平衡(例如在您的機器上完成所有收件箱分析),則可以緩解隱私擔憂。
  • 用戶介面與體驗挑戰: 為 AI 為先的瀏覽器設計用戶體驗是新的領域。Comet 的團隊必須弄清楚如何無縫地嵌入助理而不讓用戶感到困惑或界面混亂。他們選擇了持續的側邊面板與提示框——一個熟悉的聊天 UI,不會阻擋主視圖。他們還巧妙地在您切換標籤時更新助理面板的上下文(顯示頁面標題並保持每個頁面的歷史記錄)starkinsider.com。這些使用者體驗上的細節解決了瀏覽的多上下文特性。還有關於助理應該多主動的決策。它應該主動突出頁面上的有趣信息嗎?未經請求提供幫助(“看起來您正在預訂航班,需要幫忙嗎?”讓人想起 Clippy)?到目前為止,Comet 主要是在被要求時行動,雖然背景助理可能主動處理任務。在主動性和侵擾性之間取得適當的平衡是困難的。太被動的話,有些用戶可能不會意識到或記得使用助理;太主動則可能會惹惱或讓人不知所措。另一個 UI 方面是如何可視化多步驟的代理操作。Flatline Agency 的博客展示了 Comet 執行多步驟 Instacart 購物任務的截圖,聊天面板中顯示了其推理和行動列表【29†content】。這對於透明度很有幫助——用戶可以在 AI “思考”和導航時跟隨。提供此追蹤有助於用戶信任和驗證代理的工作。它還允許他們在某些看起來不對勁時進行干預。設計這些反饋循環(AI 同時顯示其邏輯並可能在關鍵步驟徵求確認)是使代理 AI 安全且用戶友好的主要部分。Comet 的當前界面顯示步驟時使用“🔎 搜尋”或“➡️ 打開頁面”等標籤【29†content】,這是一種有前途的方法,可以讓用戶保持知情。
  • 與網頁內容的相容性: 網頁是為人類互動而設計的,而不是為 AI 代理而設計的。Comet 的代理可能使用 DOM 解析、文本理解,或許還有學習的啟發法則來操作網頁。這將不斷需要更新,因為網站改變佈局和新網頁技術的出現。例如,AI 能夠多好地處理無限滾動頁面,或複雜的 JavaScript 密集型網站?還有 CAPTCHA 的問題——AI 代理可能會在某些網站上觸發反機器人措施。Comet 可能需要優雅地處理這些(可能通過提示用戶解決 CAPTCHA 或使用某些 API,如果允許)。隨著 Comet 和 Dia 等瀏覽器的普及,我們甚至可能會看到網站開始檢測並適應它們(無論好壞——也許提供 API 端點,或反之,試圖阻止自動化行為)。這是一個移動的目標,Comet 的技術團隊將不得不持續應對。

總體而言,Comet 方法的技術影響是廣泛的。它要求在 AI/ML、安全性、軟體工程和 UX 設計 方面擁有專業知識。這不僅僅是構建一個瀏覽器,而是同時構建一個 AI 代理和瀏覽器,並使它們共存。這可能是為什麼很少公司嘗試這一點的原因——這相當複雜。然而,如果執行得當,回報是顯著的:一種全新的、更高效的網路使用方式。Comet 的現狀顯示了代理瀏覽的承諾和挑戰。它無疑在推動邊界(例如,展示 AI 可以跨五個標籤處理上下文或從網頁內容自動撰寫電子郵件flatlineagency.comflatlineagency.com)。但也很明顯,我們正處於這項技術的早期階段,尚需建立可靠性和信任。在技術上,Comet 將需要快速迭代,利用用戶反饋和 AI 的進步(如更強大的網路理解模型)來充分實現一個可靠瀏覽代理的願景。

AI 原生瀏覽器堆疊的策略優劣

Perplexity 決定從頭開始將 Comet 打造成一個 AI 原生瀏覽器,而不是僅僅透過擴充功能或合作夥伴關係將其 AI 整合到現有瀏覽器中,此舉具備顯著的優勢和挑戰。讓我們分析這種方法的策略性優劣,尤其是與將 AI 添加到傳統瀏覽器堆棧的路徑進行對比:

構建 AI 原生堆棧的策略優勢:

  • 深度整合 = 更佳用戶體驗: 透過掌控整個瀏覽器環境,Perplexity 能夠比任何插件或附加元件更深層地整合 AI。Comet 的助手可以控制瀏覽器核心功能(如標籤頁、歷史記錄、UI 元素),並直接訪問頁面內容和用戶數據流,而第三方擴展可能會受到沙盒限制。這帶來更流暢的用戶體驗——例如,Comet 能自動在另一個標籤頁加載內容並為你提取信息,這是插件很難無縫完成的。如所述,Comet「將 Perplexity 的 LLM 引擎本地嵌入瀏覽器」,並默認使用 Perplexity 搜索flatlineagency.comflatlineagency.com,營造統一的感覺。相比之下,附加在舊式瀏覽器上的 AI 功能往往感覺像是獨立工具(例如,你必須手動召喚的側邊欄,無法完美與頁面融合)。透過控制技術堆疊,Comet 確保助手在任何地方都是真正無所不在且具情境感知的。
  • 創新速度: 定制的 AI 瀏覽器堆疊允許快速迭代。Perplexity 不受制於其他公司的發布時間表或 API 限制——他們可以按照自己的時間推送 Comet 更新。我們在所謂的「Comet 夏季」中看到這一點,他們以高速推出新功能(新標籤助手、郵件助手、背景助手等)perplexity.aiperplexity.ai。舊式瀏覽器在添加功能時必須考慮不破壞現有用戶工作流程或第三方擴展,這可能會拖慢速度。Perplexity 從零開始,可以重新考慮範式(如消除傳統的搜索引擎結果頁面,或創建由 AI 引導的標籤管理新 UI),而不必顧及太多的向後兼容性負擔。這種重新想像界面的能力是一個巨大的戰略優勢——如果 25 年前的瀏覽器 UI 觀念在 AI 驅動的世界中不再有意義,Comet 便不會被束縛。Gartner 級觀察者會指出,這種垂直整合通常會加速在新興技術領域的創新。
  • 競爭差異化: 有了 Comet,Perplexity 不僅僅是眾多 AI 搜索引擎之一;它現在在另一個層次上競爭,旨在擁有用戶通往互聯網的入口。這是一個在自家地盤上超越巨頭如 Google 的計劃。正如 Beam.ai 的分析所述,Comet 是 Perplexity 對「超越 Google 瀏覽器」的嘗試,通過重塑我們的瀏覽方式,而不僅僅是搜索beam.aibeam.ai。如果成功,Comet 本身可能成為一個平台,具有網絡效應(例如,可能未來會有第三方助手「技能」或集成的市場)。相比之下,整合到其他人的瀏覽器中總會讓 Perplexity 處於從屬位置,受制於平台規則,且無法完全擁有品牌體驗。從戰略上講,擁有瀏覽器意味著擁有默認搜索(他們已經做到了)、首頁和數據流——在用戶注意力和潛在盈利上都是寶貴的資源。這是一個大膽的舉措,但獎勵巨大:瀏覽器市場的一部分及與用戶的直接關係。
  • 數據和學習的協同作用: 建立 AI 原生瀏覽器意味著 Perplexity 可以收集獨特數據來改善其模型(在用戶同意下)。他們可以更深入地了解人們如何使用 AI 瀏覽、他們的需求、AI 的不足等,這比他們的 AI 只是 Chrome 許多功能之一要豐富得多。這些數據可以促成良性循環:更好地理解用戶行為可以更精確地調整助手,使其更有幫助,吸引更多用戶,從而獲得更多數據,依此類推。此外,AI 處理許多任務意味著它可以潛在地整合這些學習——例如,查看用戶的日曆和電子郵件可能讓它學習個人偏好(例如你傾向於在下午安排會議)。舊式附加元件通常在一個孤立的領域運行(僅搜索或僅摘要),無法獲得這種全面的視角。作為平台的 Comet 可以利用跨領域的見解(在適當的隱私控制下),而競爭對手若其 AI 組件保持分散則可能難以實現。
  • 新商業模式: AI 原生瀏覽器開啟了新的變現及增值方式。Perplexity 可以提供高級訂閱(如他們的 Max),以便訪問更強大的模型或功能,實質上是將 AI 服務與瀏覽器捆綁。他們還推出了 Comet Plus,與出版商合作提供高質量內容訪問perplexity.aiperplexity.ai。這暗示了一種潛在模式,Comet 可以作為付費內容或服務的分發渠道,與內容創作者共享收入——類似於 AI 增強的內容捆綁。此外,如果 Comet 獲得大量用戶基礎,默認放置交易(如 Google 向 Apple 支付數十億成為 Safari 默認搜索)可能會發生,但在這種情況下,Perplexity 已經是 Comet 的默認搜索。相反,他們可能通過交易促進來賺錢(想像一下當助手幫助你預訂航班或購買產品時賺取聯盟佣金,因為它有效地作為比較購物代理)。這些模式更容易實施和證明合理,當你擁有整個技術堆疊和用戶體驗時,而不是作為可能被封鎖或限制的插件。

**策略挑戰與缺點:

  • 採用障礙——打破用戶習慣: 瀏覽器市場向來難以打入。用戶已習慣於 Chrome、Safari 等,即使是優秀的產品也常常難以獲得市場份額。Comet 面臨說服用戶安裝和信任新瀏覽器的挑戰,這是一個巨大的要求。許多消費者堅持使用默認選擇(PC 上的 Chrome,Mac/iPhone 上的 Safari)。從 HBR/Gartner 的角度來看,分發新瀏覽器成本高且緩慢——例如,Chrome 在谷歌多年大力推廣下才取代 Internet Explorer。雖然 Comet 的免費使用和獨特功能會吸引技術愛好者和某些專業人士,但除非有令人信服的使用案例廣泛共鳴,否則擴展超出小眾採用將很困難。此外,還有企業採用障礙:企業 IT 部門通常基於支持/安全原因標準化使用一種瀏覽器。說服 CIO 允許 Comet 需要證明其安全性和投資回報,如 Covisian 所述covisian.comcovisian.com。Perplexity 可能需要追求企業合作夥伴關係或證明具體生產力增長,以克服“我們使用 Chrome 因為它是默認選擇”的慣性。
  • 資源密集和成本: 運行 AI 原生瀏覽器成本高昂。每個用戶查詢或任務可能會調用大型語言模型處理,這(如果使用 OpenAI 之類的提供商)會產生顯著的每次查詢成本。Perplexity 起初決定收取 $200/月的 Max 費用,顯示出高使用量會帶來可觀的開支,特別是使用頂級模型時techcrunch.com。通過向所有用戶免費提供服務,Perplexity 必須要麼承擔這些成本(可能由其資金補貼),要麼瘋狂地進行優化(通過模型效率等)。這與正常瀏覽器形成鮮明對比,後者運行成本相對較低(大部分處理在客戶端進行,任何搜索收入可以覆蓋成本)。Comet 顛覆了這一點——大量處理在服務器端 AI 進行。如果使用量增加,Perplexity 需要可持續的盈利或資金策略。他們可能依賴於升級 Max 訂閱(以更好的模型或更快的響應作為激勵)或未來的盈利功能,如 Comet Plus 內容或企業許可。但在這些收入來源成熟之前,燒錢率是一個問題。技術上,他們可以通過為某些互動使用較小的模型來降低成本(提到 Perplexity 擁有自己的模型“Perplexity LLM 引擎”表明他們不僅僅依賴外部 API)。然而,構建、維護和支付 AI 優先堆棧比為現有瀏覽器添加邊欄更昂貴。
  • 維護和範圍蔓延: 擁有自己的瀏覽器,Perplexity 現在不僅需要維護 AI 部分,還要維護現代瀏覽器的所有方面——與網頁標準兼容、安全修補、擴展支持、多平台版本(Windows、Mac,最終還有移動版)。這本身就是一項巨大的工程工作。他們確實從 Chromium 的開源基礎中受益,但他們必須跟踪 Chromium 更新並合並他們的自定義。隨著時間推移,這是一項不容小覷的工作(Chrome 更新迅速)。相比之下,一個擴展或集成可以在其他人維護的瀏覽器之上運行,只需專注於 AI 邏輯。Comet 的開發範圍很廣:從低層次渲染問題到高層次 AI 算法。這種廣度可能會拉伸一家初創公司的資源。基本問題上的任何失誤(例如,如果 Comet 無法正確呈現某些網站,或者有內存洩漏)可能會讓用戶感到不滿,並對產品產生不良影響,即使 AI 部分很出色。基本上,Perplexity 承擔了瀏覽器供應商和 AI 服務提供商的雙重角色。風險在於,一方可能由於分散的重點而受到影響。
  • 競爭反應: Comet 差異化的戰略窗口可能會因為老牌企業的反應而縮小。谷歌和微軟,一旦識別出 Comet 的哪些功能引起共鳴,可以立即向數百萬用戶推出他們自己的版本。事實上,谷歌最近宣布的 Gemini 在 Chrome 中啟用多標籤 Q&A 和未來任務自動化表明他們正朝著類似的方向前進blog.google。微軟同樣正在更深入地整合 Copilot 到 Windows、Office 和 Edge 中。雖然 Comet 目前在代理功能上領先,但一個大問題是:如果大型瀏覽器快速跟進他們龐大的資源,小型玩家能否保持這一優勢?OpenAI 的傳聞瀏覽器(如果出現)也可能是一個變數,考慮到 OpenAI 在 AI 方面的品牌和技術優勢。有一種情況是,Comet 的想法得到了驗證,但最終用戶通過 Chrome 或 Edge 採用了這些功能,認為那些“夠好”而不會切換到新瀏覽器。這是一個經典的平台風險——創新者常常促使巨頭們整合類似功能。Perplexity 的希望可能是快速行動並建立生態系統或忠誠度(比如一些人早期因速度轉向 Chrome 或因隱私轉向 Firefox 並從未離開)。如果 Comet 能保持快速創新的文化,他們可能會保持領先一步。但當競爭者擁有幾乎無限的工程人才和分發能力時,這是一場艱難的戰鬥。
  • 用戶信任和品牌: 如前所述,瀏覽器是用戶最敏感的軟件之一(它可以看到你在線上做的一切)。在相對較新的品牌中建立信任(Perplexity AI 不是像谷歌或微軟那樣的家喻戶曉的名字)是一個挑戰。獨自前行的一個戰略劣勢是缺乏作為知名瀏覽器官方功能所帶來的自動信任。一些用戶可能會想:“這個 AI 瀏覽器安全嗎?它會不會誤用我的數據或做一些奇怪的事情?”克服這一點需要強大的品牌建設、透明度和外部驗證(可能是安全審計、推薦、媒體背書)。HBR 級讀者可能會注意到,在技術採用中,品牌信任是將用戶從老牌企業轉移的一個重大障礙。Perplexity 的 Comet Plus 策略——與知名出版商對齊並強調高質量信息perplexity.aiperplexity.ai——可能部分旨在增強可信度(即,我們支持新聞業,我們關心可信賴的內容)。然而,Comet 品牌仍需時間和經過驗證的可靠性來獲得主流用戶信任。

**平衡藝術:**最終,建立一個AI原生瀏覽器的策略決策是一個高風險高回報的舉動。優勢在於能夠提供優越且差異化的體驗,可能會重新定義市場——基本上是通過改變競爭基礎(從速度或簡單轉向智慧)來超越競爭對手。缺點則承認通往成功的道路陡峭:採用挑戰、巨額研發成本,以及在兩個領域(瀏覽器和AI)與巨頭對抗。

從類似Gartner的角度來看,可以說Comet是**「AI增強瀏覽」炒作週期中的早期參與者,展現出巨大潛力,但尚未保證能實現大規模採用。如果能夠顯示出明確的價值(例如,「Comet用戶完成研究任務比Chrome用戶快30%」**這樣的指標),將會對專業用戶形成強烈的吸引力。如果不能,它可能會保持小眾,或者其功能可能會被主流瀏覽器吸收。

Perplexity 的舉動也給其他人帶來壓力:這本質上是宣稱在舊瀏覽器的側邊添加聊天機器人並不夠——你必須重新思考整個技術堆棧。這確實激發了回應(Arc -> Dia,Chrome 的 Gemini 模式等)。在這個意義上,Comet 正在引領行業對話。即將到來的“AI 瀏覽器”競爭可能會反映過去的瀏覽器戰爭,但現在智慧和自動化是關鍵的區別因素。從戰略上來看,即使 Comet 無法取代 Chrome,它也可能推動創新並開闢強大的利基市場(或許在知識工作者、AI 愛好者或某些從集成 AI 中受益很大的行業如金融或學術界中)。

對於產品負責人和技術精通的消費者來說,Comet 的崛起強調了一個更廣泛的觀點:瀏覽器正在成為 AI 與人類互動的下一個重要平台。無論是透過 Comet 還是競爭對手,我們可以預期未來的瀏覽器將不再像靜態工具,而更像是適應性強、能對話的助理。Perplexity 的賭注是藉由掌握這種範式轉變,他們可以像過去的 Netscape 和後來的 Google 一樣,確立自己在新一代介面技術中的領導地位。

結論:Comet 的意義與未來之路

Perplexity 的 Comet AI 瀏覽器不僅僅是一個新的軟體——它是一個關於使用者介面和網路體驗未來發展的願景宣言。透過將「助理化為瀏覽器」,Comet 挑戰了我們如何在網路上尋找資訊、執行任務,甚至思考的現狀。在這次全面性的檢驗中,我們看到了 Comet 的架構和使用者體驗如何體現了一個根本性的重新想像:瀏覽作為一種協作的、智能化的工作流程,而不是通過頁面和選項卡的手動旅程。

Comet 的早期影響顯而易見,因為它激發了興奮和競爭的活力。已採用 Comet 的用戶表示,生產力有了真正的提升,並且以一種幾乎上癮的新方式與互聯網互動——詢問、對話、委派,而不是點擊、打字、複製粘貼。同時,行業巨頭們正在競相趕上,AI 功能迅速在 Chrome、Edge 和其他瀏覽器中出現(以及像 Dia 這樣的新來者加入戰局)。有人稱之為「AI 瀏覽器戰爭」,這僅僅是個開始,它承諾將加速創新,造福最終用戶。

從產品領導的角度來看,Comet 展示了一種全堆疊方法對創新的力量。通過端到端控制瀏覽器環境,Perplexity 在 Comet 中實現了作為附加功能可能顯得笨拙或不可能的能力。助手對網頁內容和用戶數據的流暢掌握展示了當 AI 融入介面的結構中時可以實現的效果,而不是事後粘合進去。對於技術精通的消費者來說,這意味著新的選擇和可能更好的數字生活導航方式;對於企業來說,這預示著可能會極大提升知識工作的工具(同時也帶來新的治理問題)。

然而,這段旅程還遠未結束。Comet 本身需要繼續改進。可靠性、用戶信任和廣泛的可用性等關鍵領域將決定它是否能夠從早期使用者跨越到更廣泛的受眾。它還需要證明其商業模式——在維持免費的高科技服務的同時投資於研發是一個挑戰,可能需要創新的盈利方式(Perplexity 通過高級層和出版商合作來探索這一點 perplexity.ai)。來自像 Google 和 Microsoft 這樣的公司的競爭回應可能會驗證 Comet 的方法(將類似的功能帶給數十億用戶,從而訓練用戶期望這些功能),或者如果這些巨頭有效地利用他們的生態系統,則可能會擠壓 Comet。

一個策略上的可能性是我們將看到共存與整合:例如,企業可能會為某些高階使用者或研究團隊採用 Comet,而一般員工則繼續使用現有的瀏覽器。或者,未來 Comet 的技術甚至可能被更大的平台授權或收購——就像過去一些有前途的瀏覽器被吸收一樣(還記得微軟綁定 IE 或谷歌基於 WebKit 及後來的 Blink 開發 Chrome,吸納了人才和創意)。目前,Perplexity 似乎有意獨立前行,不僅打造一個瀏覽器,更是建立一個與尖端 AI 助手相關聯的品牌。

總結來說,Comet 代表了產品設計中一個重大的範式轉變——從用戶主導的互動轉向 AI 增強的協作互動。這突顯了 AI 的潛力,可以減少每個數位任務中的摩擦,使網路更像是我們思維的延伸,而不是一個頁面的迷宮perplexity.ai。Comet 的早期成功和反響表明這一概念符合真實的用戶需求:對幫助我們管理資訊過載並快速且智能行動的工具的渴望。正如 HBR 或 Gartner 的讀者可能會欣賞的一樣,像 Comet 這樣的 AI 原生瀏覽器的出現,可能預示著數位生產力和用戶賦權的新階段,就像 1990 年代圖形化網路瀏覽器的引入或 2010 年代行動應用程式的出現一樣。

對業界玩家來說,策略重點很明確:界面層再次成為可競逐的領域,而 AI 是其中的催化劑。能夠成功將 AI 融入核心用戶體驗的公司——以值得信賴且真正有用的方式——有望引領下一波創新。Comet 是一個雄心勃勃的嘗試,正是要做到這一點。無論它最終是成為數百萬人的新默認選擇還是其他人追隨的先驅,Comet 已經擴展了可能性的領域。它讓我們一窺「以思維速度」瀏覽的世界——一個你只需發問,互聯網就能通過 AI 盟友來回應的世界。

有一件事是確定的:精靈已經從瓶子裡出來了。用戶將越來越期待他們的瀏覽器能夠更智能和更有幫助。從長遠來看,Comet 所開創的概念——代理式協助、對話界面、整合個人數據工作流程——很可能成為許多平台的標準功能。從這個意義上來說,Perplexity 的 Comet 可以被視為一個關鍵的實驗,推動行業邁向更智能且以用戶為中心的網路。正如 Perplexity 團隊在 Comet 發布時所寫的,「未來屬於好奇的人」perplexity.ai——有了 AI 原生的瀏覽器,我們的好奇心確實可以以全新的方式展翅高飛,由身邊不知疲倦的數位協助者引導。

來源:

畢業於埃默里大學,獲得學士學位,並在美國生活和工作了十年。他曾先後就職於美國的私募股權和風險投資機構,後加入奇蹟真基金的早期投資團隊,從事AIGC和代理方向的長期研究。2025年,Macaron AI將與創始團隊一同推出,致力於透過技術提升日常生活體驗。

申請成為 Macaron 的第一批朋友