前幾天,“百度已不是中國(guó)第一大桌面搜索引擎”話題被頂上微博熱搜。根據(jù)美國(guó)研究機(jī)構(gòu)Statcounter的最新統(tǒng)計(jì)數(shù)據(jù),今年4月微軟必應(yīng)搜索國(guó)內(nèi)搜索市場(chǎng)份額創(chuàng)歷史新高,而百度搜索市場(chǎng)份額降至27.01%,排名跌到第二。
這一話題引起輿論熱議。5月25日,百度集團(tuán)副總裁、搜索平臺(tái)負(fù)責(zé)人肖陽(yáng)在接受鳳凰網(wǎng)科技等媒體采訪時(shí)回應(yīng)稱,這是一個(gè)很離譜的數(shù)據(jù),過(guò)去一段時(shí)間百度搜索在桌面端市場(chǎng)份額的市場(chǎng)份額是保持穩(wěn)定領(lǐng)先的。百度有自信在中文的搜索引擎市場(chǎng)保持市場(chǎng)份額第一。
盡管這則消息有所失真,但AI技術(shù)變革對(duì)搜索引擎帶來(lái)的挑戰(zhàn)不容忽視
過(guò)去20年,搜索引擎根據(jù)關(guān)鍵詞為用戶提供可供選擇的海量結(jié)果。ChatGPT推出后,用戶可以獲得更快、更準(zhǔn)確、更為個(gè)性化的結(jié)果。這也意味著,曾經(jīng)的廣告排名、站點(diǎn)優(yōu)化、推薦機(jī)制等一系列搜索引擎生態(tài)都可能面臨機(jī)遇和挑戰(zhàn)。
百度搜索如何在AIGC時(shí)代保持競(jìng)爭(zhēng)力?百度的商業(yè)模式會(huì)發(fā)生怎樣的改變?圍繞這些問(wèn)題,我們采訪了百度副總裁、搜索平臺(tái)負(fù)責(zé)人肖陽(yáng)。
美國(guó)網(wǎng)站稱必應(yīng)桌面搜索份額超越百度,對(duì)此百度怎么看?百度搜索如何穩(wěn)住國(guó)內(nèi)搜索第一地位?
肖陽(yáng):這是一個(gè)很離譜的數(shù)據(jù)。
過(guò)去一段時(shí)間百度搜索在桌面端市場(chǎng)份額是保持穩(wěn)定領(lǐng)先的。百度有自信在中文的搜索引擎市場(chǎng)保持市場(chǎng)份額第一。我們歡迎有實(shí)力的廠商加入到競(jìng)爭(zhēng)中,如果說(shuō)有一個(gè)搜索引擎的市場(chǎng)份額漲得很快,我們第一反應(yīng)是評(píng)測(cè)其優(yōu)勢(shì)在哪兒,而不是說(shuō)害怕它。搜索引擎的競(jìng)爭(zhēng)實(shí)際上是一個(gè)長(zhǎng)期的競(jìng)爭(zhēng),技術(shù)實(shí)力、對(duì)用戶的理解、創(chuàng)新能力和用戶體驗(yàn)是持續(xù)的進(jìn)步,我們其實(shí)希望市場(chǎng)更加活躍。
之前也說(shuō)過(guò),百度無(wú)比渴望一個(gè)新的搜索形態(tài)能夠變革,或者說(shuō)替代現(xiàn)有的搜索形態(tài)。這意味著搜索引擎是一個(gè)高速發(fā)展的賽道。很長(zhǎng)一段時(shí)間,大家都質(zhì)疑搜索是不是形態(tài)已經(jīng)固定了,搜索的需求還能不能被激發(fā)出來(lái)。如果搜索賽道發(fā)生了較大的變化,一定會(huì)激發(fā)出來(lái)很多以往沒(méi)有的需求,以往沒(méi)有的表達(dá)形態(tài)。
搜索的市場(chǎng)格局是否會(huì)發(fā)生重要變化,完全取決于百度的技術(shù)能力,我們對(duì)用戶體驗(yàn)的敏感性,能不能把好的產(chǎn)品做出來(lái),用戶肯定是用腳投票。用戶留在百度搜索,也是因?yàn)槲覀兡芙鉀Q他的問(wèn)題,用戶走也是覺(jué)得你解決不了他的問(wèn)題。
對(duì)于百度搜索來(lái)說(shuō),今年是代際變革的一年。所謂代際變革,就是希望從百度搜索的角度,最先探索出來(lái)能讓大語(yǔ)言模型在搜索里發(fā)揮最大的作用,讓用戶體驗(yàn)到跟以前完全不一樣的搜索,使得百度在搜索的份額越來(lái)越大,使得整個(gè)搜索需求的市場(chǎng)越來(lái)越大。
AIGC時(shí)代,搜索代際變革的難點(diǎn)在哪里?
肖陽(yáng):我們認(rèn)為代際變革最核心的一點(diǎn)是機(jī)器可以用自然語(yǔ)言來(lái)聽(tīng)和表達(dá)。從這個(gè)角度來(lái)說(shuō),它(大語(yǔ)言模型)有記憶、推理、理解、組織等能力,這些能力是以往的判別式模型比較難做到的,這是一個(gè)機(jī)遇。
?。ù笳Z(yǔ)言模型)能組織理解內(nèi)容,就可以通過(guò)對(duì)內(nèi)容的理解,給用戶更豐富、全面的答案,而不是限于我們給它幾條結(jié)果。代際變革的瓶頸,還是在于技術(shù)上能不能做到這一點(diǎn)。
現(xiàn)在看起來(lái)還是有很多難的問(wèn)題,大模型還不能完全正確解答。大家用過(guò)ChatGPT或者是用過(guò)文心一言,還是可以看到有很多的答案是不正確的,有很多的答案是有缺失的,這都是我們搜索需要解決的問(wèn)題。所謂的極致滿足,不是說(shuō)給一個(gè)答案就行了,而是說(shuō)用戶確實(shí)在(搜索結(jié)果)中得到了滿足,這是我們的一個(gè)難點(diǎn),技術(shù)上還是有很長(zhǎng)的路要走。
文心一言大融合百度搜索后,商業(yè)方面有哪些探索?
肖陽(yáng):大語(yǔ)言模型融入搜索,實(shí)際上比大家想象的更深入。大家可能會(huì)覺(jué)得AI伙伴純對(duì)話的容器里有大語(yǔ)言模型,實(shí)際在搜索結(jié)果、自然結(jié)果相關(guān)性的判斷上也用了大語(yǔ)言模型,這是對(duì)能理解、和表達(dá)和組織內(nèi)容的一個(gè)全面升級(jí)。有的升級(jí)并不改變?cè)瓉?lái)的商業(yè)模式,比如說(shuō)(搜索)首位回答的更準(zhǔn)確了,能更理解用戶,給到更加個(gè)性化、精準(zhǔn)豐富的答案,讓用戶更多來(lái)搜,這個(gè)規(guī)模本身就能帶來(lái)收入和商業(yè)價(jià)值的增長(zhǎng)。
另外,在商業(yè)營(yíng)銷領(lǐng)域,AIGC的滲透率也挺大了。(我們)有相當(dāng)?shù)氖杖胧歉鶤IGC產(chǎn)生的營(yíng)銷內(nèi)容相關(guān)的,這些內(nèi)容有些非常優(yōu)質(zhì)。(這樣)的商業(yè)化模式,其實(shí)全球的對(duì)話搜索都在嘗試。從我們的角度,一方面有龐大的客戶資源,另一方面我們很早就已經(jīng)轉(zhuǎn)型成為用商一體,讓客戶去貢獻(xiàn)優(yōu)質(zhì)的內(nèi)容模式。用戶貢獻(xiàn)了優(yōu)質(zhì)的內(nèi)容,同時(shí)也獲得了商業(yè)收益,我們能實(shí)現(xiàn)用商一體的優(yōu)勝劣汰。從這個(gè)角度來(lái)說(shuō),我們希望能跟客戶一起探索出更很好的商業(yè)模式。
今天你現(xiàn)場(chǎng)演示的功能,什么時(shí)候普通用戶可以使用?開放使用后,百度搜索在PC端和移動(dòng)端有何不同?
肖陽(yáng):現(xiàn)在百度AI伙伴、AI BOT等功能還在內(nèi)測(cè)中。
內(nèi)核上應(yīng)該是大家一起來(lái)進(jìn)步,產(chǎn)品呈現(xiàn)上肯定有不同。對(duì)話式的搜索,PC端用戶更喜歡,ChatGPT有一半的用戶是PC端的。這其實(shí)給我們一個(gè)啟示,在新搜索(時(shí)代),PC端重要性比以前要更高了,因?yàn)樗拿娣e更大,輸入更方便,所以我們也會(huì)做一些嘗試,做一些交互上的動(dòng)作。
百度搜索的權(quán)威答案,如何保證它的權(quán)威性?
肖陽(yáng):百度在過(guò)去這20年做搜索,一個(gè)最大的追求就是搜索結(jié)果能夠正確、相關(guān)、權(quán)威,這是我們一直以來(lái)的技術(shù)積累,也是我們的評(píng)估標(biāo)準(zhǔn)。盡管我們沒(méi)法做到100%的權(quán)威,但我們可以很有底氣的說(shuō),百度搜索應(yīng)該是在中文搜索引擎領(lǐng)域正確率最高、來(lái)源最權(quán)威、結(jié)果最相關(guān)的搜索引擎。
怎么樣把語(yǔ)義匹配的技術(shù)、語(yǔ)義索引的技術(shù)跟大語(yǔ)言模型技術(shù)結(jié)合起來(lái)?這是今天在萬(wàn)象大會(huì)主論壇講的,這次代際變革讓第一條(搜索回答)能滿足用戶問(wèn)題,成功率已經(jīng)達(dá)到70%,新技術(shù)在原來(lái)權(quán)威答案的基礎(chǔ)上進(jìn)行內(nèi)容組織、豐富,將以往的內(nèi)容進(jìn)行閱讀理解后呈現(xiàn)給用戶。
在內(nèi)容校驗(yàn)、來(lái)源權(quán)威上,我們已經(jīng)做了很多的工作。簡(jiǎn)單地來(lái)說(shuō),百度搜索在大模型的加持下,可以真正做到語(yǔ)義層面對(duì)全網(wǎng)信息之間證偽和證明,這個(gè)過(guò)程可以理解為經(jīng)過(guò)更多信源的驗(yàn)證,來(lái)證明它是否權(quán)威。