5月21日,在2025騰訊云AI產(chǎn)業(yè)應(yīng)用峰會(huì)上,騰訊云副總裁、騰訊云智能負(fù)責(zé)人、騰訊優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲發(fā)表主題演講。吳運(yùn)聲認(rèn)為,當(dāng)前AI應(yīng)用領(lǐng)域呈現(xiàn)出交互體驗(yàn)更豐富、模型使用更高效、應(yīng)用構(gòu)建更快捷等趨勢(shì)。圍繞新的客戶需求,騰訊云在多模態(tài)語(yǔ)音交互、模型訓(xùn)推、智能體開發(fā)等層面不斷迭代更新產(chǎn)品能力,幫助用戶把技術(shù)創(chuàng)新更快地轉(zhuǎn)化為實(shí)際生產(chǎn)力。
騰訊云副總裁、騰訊云智能負(fù)責(zé)人、騰訊優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人 吳運(yùn)聲
吳運(yùn)聲提到,為提升用戶與AI應(yīng)用之間的交互體驗(yàn),騰訊云正式發(fā)布“騰訊云語(yǔ)音PaaS解決方案”。該方案通過將領(lǐng)先的ASR大模型、TTS大模型與TRTC的實(shí)時(shí)通信能力深度融合,構(gòu)建起 “語(yǔ)音輸入→智能處理→自然輸出→實(shí)時(shí)交互” 的全鏈路閉環(huán),為企業(yè)提供低成本、可快速搭建的語(yǔ)音交互解決方案,幫助企業(yè)優(yōu)化用戶交互體驗(yàn)。
在模型訓(xùn)推層面,騰訊云TI平臺(tái)也實(shí)現(xiàn)了全面升級(jí)。首先,騰訊云TI平臺(tái)升級(jí)了精調(diào)工具鏈提供蒸餾精調(diào)、強(qiáng)化學(xué)習(xí)等更多訓(xùn)練方式,并面向自動(dòng)駕駛領(lǐng)域的廣泛需求推出自駕模型訓(xùn)練能力。同時(shí),TI平臺(tái)在資源調(diào)度方面也全面升級(jí),支持訓(xùn)推一體、潮汐調(diào)度。成本是決定大模型是否能落地的關(guān)鍵因素之一,TI平臺(tái)持續(xù)升級(jí)內(nèi)置的Angel加速套件,以業(yè)界領(lǐng)先的推理加速能力,幫助企業(yè)降本。
從大模型到智能體,AI應(yīng)用步入“平權(quán)時(shí)代”。對(duì)此吳運(yùn)聲指出:“智能體的廣泛應(yīng)用將成為企業(yè)創(chuàng)新提效的利器!睘榇,騰訊云將大模型知識(shí)引擎全面升級(jí)為騰訊云智能體開發(fā)平臺(tái),通過行業(yè)領(lǐng)先的RAG技術(shù)、全面的Agent能力、以及實(shí)戰(zhàn)打磨出來的匹配用戶需求的功能,幫助用戶在大模型時(shí)代快速構(gòu)建智能體。
他表示,經(jīng)過多個(gè)真實(shí)業(yè)務(wù)場(chǎng)景的打磨,騰訊云智能體開發(fā)平臺(tái)沉淀出了多項(xiàng)核心能力,不只是“能用”,而是真正能夠貼合企業(yè)復(fù)雜業(yè)務(wù)、可落地、可運(yùn)營(yíng),滿足企業(yè)的全鏈路需求。例如,QQ瀏覽器基于騰訊云智能體開發(fā)平臺(tái),推出了智能體Qbot,通過各種AI助手來幫助用戶執(zhí)行下載、應(yīng)用更新等任務(wù)。
以下為演講全文:
各位領(lǐng)導(dǎo)、嘉賓、媒體朋友們,
大家上午好!
我是騰訊的吳運(yùn)聲,很高興在這里跟大家分享騰訊云在大模型工具和智能體開發(fā)層面的進(jìn)展和思考。
前面混元的同事也有提到,今年以來,模型的進(jìn)展非常快,很多AI原生的應(yīng)用在涌現(xiàn)。我們看到了幾個(gè)明確的趨勢(shì):
首先,大語(yǔ)言模型和多模態(tài)模型進(jìn)一步融合,用戶和AI應(yīng)用之間的交互,已經(jīng)從文字進(jìn)一步演化到語(yǔ)音、視頻等形式。多樣的交互體驗(yàn)進(jìn)一步提升了AI應(yīng)用的滲透率。
其次,訓(xùn)練和推理的效率持續(xù)提升。通過算力管理調(diào)度、推理加速優(yōu)化等手段,算力的利用率不斷提升,模型的使用成本降低,這也進(jìn)一步推動(dòng)了模型在更多場(chǎng)景落地。
第三,智能體加速落地。今年以來,智能體這個(gè)話題特別熱,智能體能夠?qū)崿F(xiàn)自主規(guī)劃執(zhí)行路徑、靈活調(diào)用工具,極大地降低了企業(yè)構(gòu)建AI應(yīng)用的門檻。通過智能體開發(fā)平臺(tái)類的工具,企業(yè)可以快速落地智能體。
圍繞著這三個(gè)趨勢(shì)和客戶需求,我們也在多模態(tài)語(yǔ)音交互、模型訓(xùn)推、智能體開發(fā)等層面不斷迭代更新產(chǎn)品能力,幫助用戶把技術(shù)創(chuàng)新更快地轉(zhuǎn)化為實(shí)際生產(chǎn)力。
在交互體驗(yàn)上,我們?cè)谡Z(yǔ)音識(shí)別、輸出、實(shí)時(shí)傳輸?shù)葘用娌粩鄡?yōu)化,力爭(zhēng)為用戶帶來更智能、更擬人的語(yǔ)音交互體驗(yàn)。
語(yǔ)音識(shí)別是語(yǔ)音交互的前置重要模塊,ASR準(zhǔn)確率的提升,可以明顯提升全鏈路的智能度。相比較傳統(tǒng)的ASR技術(shù),我們的ASR大模型擁有更強(qiáng)的識(shí)別能力,在遠(yuǎn)場(chǎng)、噪音等復(fù)雜場(chǎng)景下,字錯(cuò)率明顯下降。同時(shí)支持方言識(shí)別,還可以動(dòng)態(tài)適應(yīng)不同口音、不同語(yǔ)速,真正讓AI“聽得懂”。
在輸出層面,我們的TTS大模型在擬人度、韻律自然度上明顯提升,發(fā)音接近真人自然對(duì)話感。TTS大模型可以快速理解本文內(nèi)容,用貼合文本情緒的聲音進(jìn)行演繹,顯著降低了傳統(tǒng)TTS輸出的人機(jī)感。
同時(shí),在實(shí)時(shí)人工智能交互場(chǎng)景中,LLM及時(shí)接收和處理用戶的音視頻數(shù)據(jù)至關(guān)重要。TRTC的超低延遲通信確保了全球范圍內(nèi)音視頻傳輸?shù)亩说蕉搜舆t低于300ms,同時(shí)將對(duì)話延遲保持在1000ms以下,近似人類自然對(duì)話的響應(yīng)時(shí)間,讓用戶享受到流暢自然的互動(dòng)。
今天,我們也正式發(fā)布“騰訊云語(yǔ)音PaaS解決方案“。
我們將前面提到的 ASR大模型、TTS 大模型與TRTC 的實(shí)時(shí)通信能力的深度融合,構(gòu)建起 “語(yǔ)音輸入→智能處理→自然輸出→實(shí)時(shí)交互” 的全鏈路閉環(huán),為企業(yè)提供低成本、可快速搭建的語(yǔ)音交互解決方案,幫助企業(yè)優(yōu)化用戶交互體驗(yàn)。
在底層,企業(yè)也可以靈活接入混元、DeepSeek 等大語(yǔ)言模型服務(wù),實(shí)現(xiàn) AI 與用戶之間的實(shí)時(shí)互動(dòng),打造符合業(yè)務(wù)場(chǎng)景的 AI 實(shí)時(shí)對(duì)話能力。
面向企業(yè)大模型構(gòu)建的需求,我們的機(jī)器學(xué)習(xí)平臺(tái)TI平臺(tái)持續(xù)升級(jí)。
首先是全面升級(jí)模型訓(xùn)練能力。我們及時(shí)跟進(jìn)騰訊混元以及開源社區(qū)進(jìn)展,更新或上架了騰訊混元系列、Deepseek系列,LLama4系列等模型。我們也升級(jí)了精調(diào)工具鏈,支持更多訓(xùn)練方式,主要是蒸餾精調(diào)和強(qiáng)化學(xué)習(xí)等。其中,基于DeepSeek R1/V3 蒸餾其他模型,是非常實(shí)用的訓(xùn)練模式,可使用較小模型來提供接近 R1的推理能力,我們提供了詳細(xì)的最佳實(shí)踐以及配套的數(shù)據(jù)萃取工具,幫助用戶更高效完成蒸餾。
同時(shí),面向自動(dòng)駕駛領(lǐng)域的廣泛需求,我們內(nèi)置了相應(yīng)的訓(xùn)練鏡像,可以快速啟動(dòng)BEVFormer、FastBEV等多個(gè)主流自駕模型訓(xùn)練,降低企業(yè)研發(fā)啟動(dòng)成本。
在工具鏈之外,TI 平臺(tái)在資源調(diào)度方面也全面升級(jí),支持訓(xùn)推一體、潮汐調(diào)度;谶@個(gè)能力,TI 平臺(tái)能在夜間,將在線推理業(yè)務(wù)的閑時(shí)算力,自動(dòng)調(diào)度給離線訓(xùn)練任務(wù)和離線數(shù)據(jù)處理任務(wù),從而大幅提升資源利用率。與此同時(shí),我們也提供了靈活可配置的排隊(duì)策略,滿足不同場(chǎng)景下的排隊(duì)、調(diào)度需求。
某頭部消費(fèi)電子企業(yè),基于 TI 平臺(tái)統(tǒng)一管理集團(tuán)算力,支撐了大模型和傳統(tǒng)CV小模型的研發(fā),應(yīng)用在電視產(chǎn)品文案生成、視頻分析等場(chǎng)景。基于 TI平臺(tái)提供的精調(diào)工具鏈和資源管理能力,AI研發(fā)整體提效50%以上,GPU資源利用率也提升了80%以上。
成本是決定大模型是否能落地的關(guān)鍵因素之一,TI平臺(tái)持續(xù)升級(jí)內(nèi)置的Angel加速套件,以業(yè)界領(lǐng)先的推理加速能力,幫助企業(yè)降本。
在技術(shù)升級(jí)方面,我們通過深挖內(nèi)核和架構(gòu)延展,在精度幾乎無(wú)損的前提下,實(shí)現(xiàn)服務(wù)時(shí)延的大幅降低,以及吞吐能力的大幅提升。相關(guān)加速能力支持社區(qū)主流的SGLang和VLLM兩個(gè)引擎。
近期,我們對(duì)SGLang推理框架的優(yōu)化也獲得了SGLang核心作者的認(rèn)可,感謝我們對(duì)FlashMLA后端進(jìn)行了深度優(yōu)化,相關(guān)技術(shù)方案已經(jīng)貢獻(xiàn)至開源社區(qū)。當(dāng)然,我們面向商業(yè)化客戶會(huì)提供經(jīng)過更加嚴(yán)謹(jǐn)測(cè)試的、性能更優(yōu)異的版本。
基于以上技術(shù)優(yōu)化,我們實(shí)現(xiàn)了行業(yè)領(lǐng)先的加速性能。我們?cè)诳刂剖譼oken延時(shí)、并保障吐字速率的同時(shí),大幅提升了QPM。比如在3.5K輸入、1K輸出的典型場(chǎng)景下, 保障首Token延時(shí)不高于2秒,吐字速率不低于每秒20 Tokens的同時(shí),2機(jī)16卡的QPM可以超過100。當(dāng)前這些性能都是行業(yè)領(lǐng)先的。
上述加速能力,我們也已經(jīng)在行業(yè)內(nèi)進(jìn)行交付和應(yīng)用。某頭部新能源汽車制造商基于TI平臺(tái)統(tǒng)一納管算力部署DeepSeek專屬模型,支撐知識(shí)問答、營(yíng)銷、座艙語(yǔ)音助手等多個(gè)業(yè)務(wù)場(chǎng)景。在使用TI平臺(tái)提供的Angel加速能力后,DeepSeek的模型綜合性能顯著提升,資源成本顯著降低。
從模型到智能體,AI應(yīng)用落地的門檻正在逐步降低。智能體的廣泛應(yīng)用或?qū)⒊蔀槠髽I(yè)創(chuàng)新提效的利器。知識(shí)庫(kù)、插件工具、Multi-Agent框架等正在驅(qū)動(dòng)著智能體不斷升級(jí),成為懂企業(yè)知識(shí)、能調(diào)用工具、自主執(zhí)行復(fù)雜任務(wù)的得力助手。
今天,我們將大模型知識(shí)引擎全面升級(jí)為騰訊云智能體開發(fā)平臺(tái),通過行業(yè)領(lǐng)先的RAG技術(shù)、全面的Agent能力、以及實(shí)戰(zhàn)打磨出來的匹配用戶需求的功能,幫助用戶在大模型時(shí)代快速構(gòu)建智能體。
我們始終相信,企業(yè)的智能化能力,必須建立在對(duì)企業(yè)私域知識(shí)的深度激活和挖掘之上。只有懂企業(yè)知識(shí),智能體才能發(fā)揮最大價(jià)值。
我們的RAG能力行業(yè)領(lǐng)先,能夠?qū)崿F(xiàn):
從復(fù)雜 Excel 表中精準(zhǔn)提取答案,支持對(duì)接數(shù)據(jù)庫(kù),通過Text2SQL,用戶用自然語(yǔ)言即可精準(zhǔn)查詢、秒級(jí)返回。
支持從文檔自動(dòng)生成問答對(duì),并對(duì)完整的問答進(jìn)行校對(duì)和管理,全流程可控,顯著降低運(yùn)營(yíng)人力投入的時(shí)間成本。
同時(shí),支持文檔間比對(duì),輔助高效決策,支持版本對(duì)照,高亮增刪改的內(nèi)容,配套 “保留兩者 / 刪除舊版 / 合并更新” 等處理方案一鍵執(zhí)行,支持僅對(duì)變更片段生成問答對(duì),顯著降低token消耗。
借助這三項(xiàng)能力,企業(yè)可以用最小的投入快速完成知識(shí)更新與決策閉環(huán),為智能體持續(xù)進(jìn)化奠定堅(jiān)實(shí)基礎(chǔ)。
在RAG基礎(chǔ)上,我們提供了全面的 Agent 能力支持。這些能力源自大量企業(yè)場(chǎng)景的實(shí)戰(zhàn)打磨,既保障了落地所需的穩(wěn)定性和確定性,又保留了對(duì)話智能的靈活性,真正實(shí)現(xiàn)了易用上手與復(fù)雜場(chǎng)景適配的雙重兼顧。
比如,我們?cè)诠ぷ髁髦惺讋?chuàng)具備全局視野的Agent,支持參數(shù)回退和全局意圖洞察,對(duì)話表現(xiàn)靈活自然;
同時(shí),我們首創(chuàng)零代碼配置多Agent協(xié)同轉(zhuǎn)交,簡(jiǎn)單易上手的轉(zhuǎn)交關(guān)系配置,讓用戶能輕松實(shí)現(xiàn)模型驅(qū)動(dòng)的自動(dòng)協(xié)作,構(gòu)建“多專家”體系,有效分擔(dān)單體 Agent 的任務(wù)壓力;
在插件生態(tài)上,我們?nèi)嬷С諱CP協(xié)議,平臺(tái)預(yù)置了豐富的騰訊內(nèi)、外部插件,開箱即用;同時(shí)支持自定義插件快速接入,極大提升系統(tǒng)擴(kuò)展性與可組合性;
依托穩(wěn)定的工作流編排、多智能體協(xié)同機(jī)制和完善的 MCP 插件生態(tài),企業(yè)可以快速搭建高可用、可演進(jìn)的專屬智能體系統(tǒng)。
經(jīng)過多個(gè)真實(shí)業(yè)務(wù)場(chǎng)景的打磨,我們的智能體平臺(tái)沉淀出了多項(xiàng)核心能力,不只是“能用”,而是真正能夠貼合企業(yè)復(fù)雜業(yè)務(wù)、可落地、可運(yùn)營(yíng),滿足企業(yè)的全鏈路需求。
首先,我們提供完善的權(quán)限體系配置體系。
支持平臺(tái)級(jí)、應(yīng)用級(jí)、知識(shí)庫(kù)級(jí)的多層權(quán)限體系配置,不管是按組織架構(gòu)、崗位角色,還是黑白名單控制,都可以靈活支持。比如,騰訊學(xué)堂是服務(wù)于騰訊內(nèi)部的培訓(xùn)平臺(tái),知識(shí)規(guī)模龐大,權(quán)限體系復(fù)雜。基于我們的平臺(tái),結(jié)合外部權(quán)限控制的方式,騰訊學(xué)堂可以靈活配置權(quán)限,快速落地問答助手。
其次,我們支持意圖達(dá)成方式的配置。
在實(shí)際業(yè)務(wù)中,不同場(chǎng)景對(duì)意圖響應(yīng)的優(yōu)先級(jí)存在差異。在我們的平臺(tái)上,用戶可以按業(yè)務(wù)需求靈活設(shè)定響應(yīng)路徑,確保優(yōu)先走最合適的方式。如果存在多個(gè)易混淆意圖,模型同時(shí)給出多個(gè)意圖候選,引導(dǎo)用戶選擇。
第三,我們的平臺(tái)提供真正面向上線運(yùn)營(yíng)的全鏈路支持。
從智能體發(fā)布上線,到后續(xù)的運(yùn)營(yíng)監(jiān)控、配置管理,我們都有完善的 OP 系統(tǒng)支持。無(wú)論是企業(yè)級(jí) TPM/QPM 配置,還是體驗(yàn)應(yīng)用的配置管理,都能實(shí)現(xiàn)精細(xì)化運(yùn)維,并支持私有化部署,真正讓企業(yè)用得放心、運(yùn)維省心。
依托這些在實(shí)戰(zhàn)中打磨出的能力,我們的平臺(tái)已經(jīng)服務(wù)了內(nèi)、外部的眾多客戶,在很多場(chǎng)景中成功落地,真正解決了企業(yè)在智能化應(yīng)用中遇到的核心問題,把AI變成生產(chǎn)力。
比如,QQ瀏覽器基于騰訊云智能體開發(fā)平臺(tái),推出了智能體Qbot,通過各種AI助手來幫助用戶執(zhí)行下載、應(yīng)用更新等任務(wù)。接下來,我們來通過一個(gè)視頻看下如何通過智能體開發(fā)平臺(tái)搭建一個(gè)下載助手Agent。
在實(shí)際的使用場(chǎng)景中,我們通常需要多個(gè)agent協(xié)同去完成復(fù)雜任務(wù),F(xiàn)在借助我們的語(yǔ)音交互能力,我們可以直接口頭指揮agent去完成任務(wù),接下來我們也可以來看下多個(gè)agent是怎么協(xié)同完成寄快速任務(wù)的。
可以看到,通過多Agent的協(xié)作,智能體已經(jīng)能夠非常靈活地處理用戶的各項(xiàng)需求。剛剛這個(gè)演示中涉及的產(chǎn)品能力,我們也正在持續(xù)打磨中。在內(nèi)部環(huán)境驗(yàn)證中,部分環(huán)節(jié)處理的時(shí)間會(huì)稍微長(zhǎng)一點(diǎn)。所以在這個(gè)視頻里面,我們做了一些加速處理。
我們相信,隨著大模型的持續(xù)進(jìn)化和各項(xiàng)工具、框架的升級(jí),產(chǎn)品的體驗(yàn)會(huì)進(jìn)一步得到優(yōu)化,智能體一定能夠成為企業(yè)和用戶的得力助手。也歡迎大家掃碼試用我們的騰訊云智能體開發(fā)平臺(tái)。
未來,騰訊也將圍繞客戶需求,持續(xù)打磨產(chǎn)品,為各行各業(yè)用好大模型、用好智能體提供助力!