C114訊 11月14日消息(艾斯)阿瑪拉定律說,人們總是高估技術短期變化,卻低估長期的變革。
無疑,這一觀點放置于眼下如日中天的人工智能(AI)浪潮背景中也是恰如其分的。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏作為AI的堅定支持者之一,顯然并不迷信于由這一波生成式AI推動的“超級應用”會如眾人期待那般短期內就從天而降,而是更愿意將這一由智能化開啟的新時代比作“新工業(yè)革命”的到來。
但同時,這也意味著更長遠的發(fā)展周期與更深刻的顛覆性。
為什么是“應用來了”
本周,百度世界2024于上海世博中心舉辦,今年的大會主題是“應用來了”。
過去一兩年,大模型成為全球各行業(yè)談及AI時的核心聚焦點,同時也成為一部分加入這一賽道的創(chuàng)業(yè)企業(yè)的焦慮點。利用不斷迭代的大模型,究竟可以做些什么?機會在哪里?
“模型本身不產(chǎn)生直接價值,只有在模型之上開發(fā)各種應用,在各種場景找到所謂的PMF,才能真正產(chǎn)生價值。如果說2023年大家還在卷模型,讓模型能力逐步達到可用的話,那未來所謂的‘可用’,就是真的有東西用,應用的‘用’。”李彥宏在期間接受媒體采訪時強調,只有把大模型真正化作能夠產(chǎn)生價值的實用應用,才能讓更多從業(yè)者找到發(fā)展的路徑和方向。
因此,無代碼秒噠和文生圖檢索增強(iRAG)的發(fā)布,成為了此次百度世界的重點。
需要了解的一個背景是,去年10月,百度發(fā)布了智能體機制,并研制了系統(tǒng)2。其核心是思考模型,包括理解、規(guī)劃、反思和進化,能夠做到可靠執(zhí)行,自我進化,并在一定程度上將思考過程白盒化,從而讓機器像人一樣思考和行動,自主完成復雜任務,同時在環(huán)境中持續(xù)學習、自主進化。
無代碼秒噠和文生圖檢索增強(iRAG)則是激發(fā)智能體爆發(fā)的關鍵。
百度表示,無代碼秒噠能夠讓任何人,用自然語言開發(fā)應用,實現(xiàn)想法。其中,零代碼工具就是多智能體協(xié)作的應用,采用了智能體的中心化模式,其中的代碼智能體通過場景知識的增強,顯著提升復雜代碼生成的質量與穩(wěn)定性,高效實現(xiàn)用戶需要的功能,讓人人都可以成為程序員。
關于文生圖檢索增強(iRAG),百度研發(fā)了「理解-檢索-生成」協(xié)同優(yōu)化的檢索增強技術,提升了大模型技術及應用效果;面向不同應用場景的生圖需求,進一步研發(fā)了檢索增強的文生圖技術,既可以生成精確的圖片,也可以進行泛化生圖。
所有這些都建立在百度文心一言快速成長的基礎之上。自去年3月16日發(fā)布文心一言以來,“文心一言用戶規(guī)模達到4.3億,”百度首席技術官王海峰在會上宣布了這一數(shù)據(jù)。同時,文心大模型日均調用量已超過15億。
超級應用一定會有,只是時機未到
正如從4G跨越到5G時代,移動通信行業(yè)在苦等一個顛覆性Killer APP一樣,AI行業(yè)經(jīng)過過去兩年生成式AI浪潮的轟炸式席卷,也在翹首期盼一個讓大家為之興奮的“超級應用”。
對此,李彥宏表示,百度的愿景并不是要推出一個“超級應用”,而是希望不斷地幫助更多人、更多企業(yè)打造出數(shù)以百萬“超級有用”的應用。
從商業(yè)邏輯上講,這對于百度這樣一家擁有如此體量和歷史積累的企業(yè)來說是合理的。做平臺型的企業(yè),賦能更多開發(fā)者基于其平臺底座打造更多的應用,而不是成為一家實力雄厚的應用開發(fā)商,這意味著更廣闊的生態(tài)和更響亮的話語權以及更多元的收入機會。
但也如開篇所說,從李彥宏所述的產(chǎn)業(yè)發(fā)展邏輯來講,這樣的做法是將眼光放置到了更長遠的發(fā)展周期。
“大家很容易把這波生成式AI和上一波移動互聯(lián)網(wǎng)或者上上一波PC互聯(lián)網(wǎng)相比,那之后的確出現(xiàn)了超級應用。但人工智能很像是一次新的工業(yè)革命,這意味著它不是三五年就結束,不是一兩年就出現(xiàn)超級應用的過程,它更像是三五十年對于整個社會的方方面面一個非常徹底的重構!袄顝┖暾f,AI的超級應用會有,只是現(xiàn)在時機未到。
另外,他在本次峰會上提出的另一個觀點亦引發(fā)了極大關注與反響——過去24個月,這個行業(yè)最大的變化是大模型基本消除了幻覺,回答問題的準確性大幅提升。
實際上,正是得益于文生圖檢索增強(iRAG)這類技術的逐漸成熟,才使得AI工具在落地使用時能夠減少幻覺,提升準確性與可控性。
務實的AI理想主義者
這里面還繞不開的一部分則包括百度自身在大模型等底層技術與框架的不斷增強升級。
C114了解到,在文生圖檢索增強(iRAG)的實現(xiàn)中,首先,基于大模型對用戶的需求進行分析理解,自動規(guī)劃精確或泛化方案,比如對哪些實體進行增強;接著在增強階段,對需要增強的實體,檢索并選擇相應的參考圖。最后在生成階段,百度自研了多?煽厣鷪D大模型,一方面,通過局部注意力計算,在保持實體特征不變的情況下,實現(xiàn)了圖像的高泛化生成,比如根據(jù)牛頓的肖像,生成繪本風格的牛頓;另一方面,通過整體注意力計算,進行高精確的圖像生成,比如生成圖中的汽車跟原圖片保持完全一致。
不過,這并非李彥宏在大會上的演講重點。比起追逐大模型不斷迭代衍生的超級能力,他更愿意討論應用的場景和真正的市場需求,而且這些應用是被千千萬萬普羅大眾用戶所使用。
說回上面提到的“無代碼秒噠”。利用AI來進行輔助代碼生成已非什么新鮮事,而百度這一有望于明年第一季度上線試用的新產(chǎn)品,則是希望將這樣的先進生產(chǎn)力能力下沉到規(guī)模更大的、可能毫不具備相關基礎知識的用戶群。簡單來說,通過無代碼編程,由大模型直接生成代碼,不需要人寫一行代碼,這意味著門檻低,人人可上手。按李彥宏的話來說,這將開啟一個“只靠想法就能賺錢的時代”。
身處AI這樣一個瞬息萬變的前沿行業(yè),他認為面向未來做出判斷時并不是在做猜謎游戲。而是先擁有一個愿景,然后再去實現(xiàn)這個愿景。在C114看來,李彥宏所描述的愿景中,既有手可摘星辰的浪漫主義,也有堅持普惠大眾的務實精神。
李彥宏表示,“今天,隨著基礎模型和智能體的能力逐步提升,我們把這些能力綜合在一起,就可以讓普通人,一行代碼都看不懂的人,具備程序員的能力。當幾億、十幾億人都具備這種能力的時候,它對于創(chuàng)造力的爆發(fā),是輔助代碼生成工具沒法比的。輔助代碼工具還是讓金字塔塔尖的人更加powerful。而我們希望金字塔中間層和底層的人,擁有金字塔塔尖這些人的能力,這個意義更大”。李彥宏在采訪中說到。