華人 95 后“叫板”谷歌搜索,聯(lián)合創(chuàng)辦 AI 搜索公司融資 6 億多元!2021 年,美國哈佛大學(xué)華人校友 Jeffrey Wang 和室友威爾·布萊克(Will Bryk)創(chuàng)辦了一家名為 Exa 的 AI 搜索公司。經(jīng)過幾年的發(fā)展,其于當(dāng)?shù)貢r(shí)間 2025 年 9 月 3 日宣布已籌集到 8500 萬美元的 B 輪融資(約等于 6.16 億人民幣),公司估值達(dá)到 7 億美元。本輪融資由 Benchmark 領(lǐng)投,Lightspeed、英偉達(dá)和 YCombinator 參投。與此同時(shí),Benchmark 的合伙人彼得·芬頓(Peter Fenton)也將加入 Exa 公司董事會(huì)。目前,該公司表示其已經(jīng)為數(shù)千家公司提供網(wǎng)頁搜索服務(wù),用戶涵蓋私募股權(quán)公司、咨詢公司以及 Cursor、Databricks、Notion 等科技公司。

圖 | Jeffrey Wang(來源:資料圖)
如前所述,該公司成立于 2021 年,可以說是在“AI 需要搜索引擎”、即在 ChatGPT 面世之前就已經(jīng)成立。對(duì)此,該公司在官方新聞稿中寫道:“我們相信,世界需要一個(gè)比谷歌更好的搜索引擎,而我們能夠做到。”其形容自己的產(chǎn)品定位是:“谷歌搜索之于人類,正如我們之于 AI。”

圖 | Jeffrey Wang 的學(xué)習(xí)經(jīng)歷和工作經(jīng)歷(來源:資料圖)
公司成立之后,Jeffrey Wang 等人先是購買了一個(gè) GPU 集群,借此構(gòu)建出一個(gè)大規(guī)模的索引系統(tǒng),并嘗試了多個(gè)新型網(wǎng)絡(luò)搜索技術(shù)。旨在開發(fā)一個(gè)讓用戶能以“谷歌無法做到的方式”來控制網(wǎng)絡(luò)的搜索引擎。比如,用戶可以提出這樣一個(gè)搜索請(qǐng)求:“給我找出所有擁有博客的在紐約的機(jī)器學(xué)習(xí)工程師,并按照經(jīng)驗(yàn)?zāi)晗夼判颉?rdquo;
2022 年 11 月,該公司推出了第一款搜索引擎產(chǎn)品。兩周之后,ChatGPT 橫空出世。很快,該公司就收到訪問器搜索引擎 API 的請(qǐng)求。之所以會(huì)受到這些請(qǐng)求是因?yàn)椋?dāng)時(shí)很多公司都開始研發(fā) AI 應(yīng)用,而這需要先從網(wǎng)絡(luò)上獲取信息。這時(shí),Jeffrey Wang 等人意識(shí)到 AI 也需要網(wǎng)絡(luò)搜索。其還意識(shí)到,AI 的網(wǎng)絡(luò)搜索需求頻率很快就會(huì)高出人類。
那么,什么是 AI 搜索引擎?和人類一樣的是,AI 的“大腦”中也不可能存儲(chǔ)世界上所有的信息。無論是了解新聞、代碼、論文還是公司數(shù)據(jù),它都需要通過網(wǎng)絡(luò)搜索來獲取最新、最全面的信息。但是,AI 畢竟和人類有著本質(zhì)區(qū)別,因此 AI 需要一種新型的搜索引擎。“搜索引擎”這個(gè)詞語大家并不陌生,人類使用的搜索引擎早在幾十年前就已誕生。但是,該公司表示其和公司名字同名的產(chǎn)品 Exa 是一款專門為 AI 設(shè)計(jì)的搜索引擎。
它具有六個(gè)專有特點(diǎn)。
第一個(gè)特點(diǎn)是能幫助 AI 獲取高質(zhì)量的知識(shí)。AI 要搜索的是最高質(zhì)量的知識(shí),而不是 SEO 內(nèi)容或廣告內(nèi)容,否則 AI 就會(huì)變得“輸入的是垃圾,輸出的也是垃圾”。為此,Exa 的排名算法能對(duì)高質(zhì)量知識(shí)進(jìn)行優(yōu)化。由于這款搜索引擎不會(huì)接受外部廣告投放,因此不會(huì)采取任何不正當(dāng)?shù)募?lì)措施,故能為 AI 盡可能提供高質(zhì)量的搜索。
第二個(gè)特點(diǎn)是其能讓 AI 獲得所有需要的內(nèi)容。AI 所需要的不僅是一篇文章的鏈接和標(biāo)題,而是需要盡可能地獲得每個(gè)結(jié)果的信息。而 Exa 能為每個(gè)信息都提供完整的頁面內(nèi)容,以便 AI 處理所有必要的信息。
第三個(gè)特點(diǎn)是更快速。相比人類,AI 需要更快的搜索速度。與此同時(shí),AI 語音助手等 AI 產(chǎn)品對(duì)于延遲非常敏感,甚至說每一毫秒都至關(guān)重要。AI 在工作時(shí)通常會(huì)在單個(gè)請(qǐng)求中調(diào)用多個(gè)工具,而搜索引擎只是其調(diào)用的工具之一。那么,在調(diào)用多個(gè)工具的時(shí)候就會(huì)積累延遲。Jeffrey Wang 等人認(rèn)為,要想構(gòu)建全球最快的搜索 API,就不能成為包裝器,即不能在搜索 API 的底層封裝谷歌,因?yàn)檫@意味著服務(wù)器集群中的瀏覽器會(huì)接受用戶查詢,并通過在谷歌搜索中進(jìn)行處理來提供結(jié)果。而這需要超過 700 毫秒的中位數(shù)延遲(P50,The 50th Percentile Latency),因此其指出任何封裝谷歌的搜索 API 的 P50 時(shí)間至少為 700 毫秒。AI Agent 會(huì)進(jìn)行大量的搜索調(diào)用,如果一個(gè) Deep Research 代理進(jìn)行 50 次搜索調(diào)用,每當(dāng)每次調(diào)用的速度快 200 毫秒,那么就能為真人用戶節(jié)省 10 秒時(shí)間。為了構(gòu)建“全球最快的搜索 API”,Jeffrey Wang 等人爬取了網(wǎng)絡(luò)數(shù)據(jù),并訓(xùn)練模型進(jìn)行搜索,以及開發(fā)了自己的矢量數(shù)據(jù)庫。通過掌控整個(gè)技術(shù)棧的每個(gè)部分,從而能夠緩解延遲。通過此,其構(gòu)建了一款名為 Exa Fast 的搜索 API,Jeffrey Wang 等人表示其速度低于 450 毫秒。在一項(xiàng)實(shí)驗(yàn)中,他們針對(duì)美國北加州數(shù)據(jù)中心的數(shù)千次隨機(jī)查詢進(jìn)行了基準(zhǔn)測試,結(jié)果發(fā)現(xiàn)其網(wǎng)絡(luò)延遲約為 50 毫秒。

(來源:資料圖)
第四個(gè)特點(diǎn)是高計(jì)算。對(duì)于 AI 來說它并不關(guān)心延遲,而是只想進(jìn)行最全面的搜索,對(duì)于那些異步應(yīng)用程序來說更是如此,為此 Jeffrey Wang 等人打造了一款名為 Websets 的高計(jì)算搜索產(chǎn)品,并稱其是“迄今為止全球最全面的搜索引擎”,能讓 AI 獲取海量的人員信息、公司信息或其他信息。
第五個(gè)特點(diǎn)是可定制。由于每個(gè) AI 應(yīng)用都有特定的用例,因此如能針對(duì)特定應(yīng)用程序進(jìn)行搜索定制,效果無疑會(huì)更好。而 Exa 這一 AI 搜索引擎基于定制化的理念,可以做到通過排除數(shù)千個(gè)域名來獲取數(shù)百個(gè)結(jié)果,同時(shí)也能創(chuàng)建自定義分類器以便在每次搜索時(shí)運(yùn)行。
第六個(gè)特點(diǎn)是零數(shù)據(jù)保留。來自企業(yè)的查詢數(shù)據(jù)往往非常敏感,因此企業(yè)更傾向于擁有具備零數(shù)據(jù)保留特點(diǎn)的搜索 API,這意味著 AI 的查詢內(nèi)容永遠(yuǎn)不會(huì)被存儲(chǔ)在任何地方。對(duì)于實(shí)現(xiàn)完全的數(shù)據(jù)隱私保護(hù)的企業(yè)來說,零數(shù)據(jù)處理是一個(gè)黃金標(biāo)準(zhǔn)。對(duì)于搜索服務(wù)商來說,要想提供零數(shù)據(jù)處理,無論在主服務(wù)器還是子處理器中,都絕對(duì)不能存儲(chǔ)用戶的查詢數(shù)據(jù)。Jeffrey Wang 等人在一篇博文中指出,大多數(shù)搜索提供商實(shí)際上無法提供零數(shù)據(jù)處理,并指出這也是搜索領(lǐng)域中一個(gè)鮮為人知的秘密。之所以會(huì)出現(xiàn)這種情況,是因?yàn)榻^大多數(shù)搜索服務(wù)商都會(huì)在后臺(tái)抓取谷歌數(shù)據(jù)。當(dāng)查詢達(dá)到搜索服務(wù)商時(shí),查詢會(huì)被路由到全球某個(gè)在瀏覽器中運(yùn)行谷歌搜索的匿名服務(wù)器,然后谷歌搜索結(jié)果會(huì)被發(fā)回給搜索服務(wù)提供商。由于谷歌搜索是一個(gè)基于用戶查詢進(jìn)行訓(xùn)練的消費(fèi)級(jí)搜索引擎,所以它并沒有零數(shù)據(jù)處理。因此,任何以子處理器身份在后臺(tái)抓取谷歌搜索數(shù)據(jù)的搜索服務(wù)提供商都無法擁有零數(shù)據(jù)處理能力。而由于 Exa 是從頭開始構(gòu)建的搜索引擎,因此該公司表示它可以為所有產(chǎn)品端點(diǎn)提供零數(shù)據(jù)保留。為了煉就這一能力,其通過爬取網(wǎng)絡(luò)數(shù)據(jù),訓(xùn)練了專門的 AI 搜索引擎,并通過設(shè)計(jì)海量數(shù)據(jù)庫來為模型提供服務(wù)。這讓其不僅能為客戶提供準(zhǔn)確的搜索結(jié)果,還能確保每個(gè)查詢都保留在零數(shù)據(jù)處理系統(tǒng)中,當(dāng)搜索結(jié)束之后查詢數(shù)據(jù)就會(huì)被刪除。

(來源:資料圖)
而在未來,Exa 還有著更加遼闊的野望,它希望通過擴(kuò)大索引能力和處理能力,以便能夠收集全球范圍內(nèi)的絕大多數(shù)信息。同時(shí),它還計(jì)劃建設(shè)一個(gè)比當(dāng)前大出 5 倍的 GPU 集群,以便開發(fā)出來能將全球信息組織起來的新技術(shù),最終它的目標(biāo)是超越谷歌搜索。

(來源:資料圖)
資料顯示,作為 Exa 公司聯(lián)合創(chuàng)始人的 Jeffrey Wang 會(huì)說中文,如前所述其本科畢業(yè)于美國哈佛大學(xué)。畢業(yè)之后他曾在美國金融科技公司 Plaid 工作了三年,在那里他主要負(fù)責(zé)構(gòu)建數(shù)據(jù)和網(wǎng)絡(luò)基礎(chǔ)設(shè)施。后來,他和大學(xué)室友威爾·布萊克(Will Bryk)聯(lián)合創(chuàng)辦了 Exa 公司,并由布萊克擔(dān)任 CEO。

(來源:資料圖)
與此同時(shí),Exa 還有多位華人技術(shù)人員。比如,畢業(yè)于哈佛大學(xué)的 Benjamin Chen、畢業(yè)于清華大學(xué)姚班的 Hubert Yuan、畢業(yè)于美國卡內(nèi)基梅隆大學(xué)的 Zixi An、畢業(yè)于美國加州大學(xué)伯克利分校的 Felicia M. Tang、博士畢業(yè)于美國康奈爾大學(xué)的 Benjamin Y Chan 等。

圖 | 該公司部分員工(來源:資料圖)
未來,Exa 能否實(shí)現(xiàn)超越谷歌的夢想?還需讓時(shí)間來證明一切。