C114通信網(wǎng)  |  通信人家園

市場
2023/12/26 16:05

行業(yè)AI知識庫助運(yùn)營商向AI化運(yùn)營轉(zhuǎn)變

賽立信通信研究部  謝劍超

一、背景介紹

基于大規(guī)模預(yù)訓(xùn)練語言模型的AI知識庫,是指企業(yè)選擇使用自己的數(shù)據(jù)來定制和訓(xùn)練專有的大語言模型,從而創(chuàng)建一個專門針對自身需求的知識庫。AI知識庫有效結(jié)合大規(guī)模預(yù)訓(xùn)練語言模型與定制化數(shù)據(jù),為企業(yè)提供特定的知識服務(wù)。

電信運(yùn)營商的政企業(yè)務(wù)涉及眾多行業(yè),每個行業(yè)都有其特定的術(shù)語、業(yè)務(wù)流程和需求。通用語言模型難以精準(zhǔn)地滿足電信運(yùn)營商多元化的服務(wù)和支持要求,同時傳統(tǒng)知識庫難以滿足電信運(yùn)營商智能化需求。因此,通過定制AI知識庫,電信運(yùn)營商可以針對不同行業(yè)的信息化需求進(jìn)行精細(xì)化的處理,提供更加智能化和定制化的服務(wù)。這有助于提高客戶滿意度,降低運(yùn)營成本,并推動電信在行業(yè)信息化方面拓展取得更大的競爭優(yōu)勢。并有助于電信運(yùn)營商由數(shù)字化運(yùn)營向AI化運(yùn)營轉(zhuǎn)變。

二、AI知識庫作用

針對各行業(yè)的定制AI知識庫主要作用在全程支撐電信運(yùn)營商在行業(yè)拓展中的整個生產(chǎn)流程。目前運(yùn)營商需要龐大的支撐團(tuán)隊(duì)為各個項(xiàng)目的售前、售中、售后服務(wù)等,AI知識庫利用知識圖譜等構(gòu)建豐富的語義理解模型,具備對復(fù)雜問題的推理能力,能有效解決運(yùn)營商在生產(chǎn)過程中的各種問題。

市場決策:支撐市場決策,制定市場競爭策略。引入實(shí)時推理引擎,使AI知識庫能夠在業(yè)務(wù)運(yùn)營中提供更即時的決策支持。

售前支撐:挖掘市場機(jī)會點(diǎn),找到商機(jī);售前問題咨詢,支撐標(biāo)書制作,制定競標(biāo)價格,爭取項(xiàng)目;

售中服務(wù):利用知識圖譜構(gòu)建豐富的語義理解模型,輔助制定制定行業(yè)信息化解決方案,通過輸入具體項(xiàng)目情況,快速制定適應(yīng)項(xiàng)目的需求的信息化方案。

售后服務(wù):支撐電信運(yùn)營商售后人員的售后咨詢,同時支撐客戶的售后咨詢服務(wù)。

三、模型的選擇

在選擇模型時,電信運(yùn)營商必須明確定義其需求和目標(biāo)。除了語言處理能力外,模型還應(yīng)該能夠適應(yīng)電信行業(yè)的領(lǐng)域知識,例如網(wǎng)絡(luò)架構(gòu)、通信協(xié)議、客戶服務(wù)等。確保所選模型具有足夠的靈活性,能夠適應(yīng)未來可能出現(xiàn)的新業(yè)務(wù)需求和技術(shù)變革。選擇的模型還應(yīng)該具備良好的遷移學(xué)習(xí)能力,以便在微調(diào)過程中更好地適應(yīng)電信運(yùn)營商自有數(shù)據(jù)的特殊性。通過綜合考慮這些因素,電信運(yùn)營商可以確保選擇的預(yù)訓(xùn)練語言模型能夠最大程度地滿足其獨(dú)特的業(yè)務(wù)需求和目標(biāo)。

目前電信運(yùn)營商已相繼推出自有的大模型,例如中國電信的“星辰”、中國聯(lián)通的“鴻湖”、中國移動的“九天”。電信運(yùn)營商可以選擇自有的大模型,或者選擇第三方的模型來搭建。

四、數(shù)據(jù)的準(zhǔn)備與清洗

定制AI知識庫,除了大模型,更重要的是數(shù)據(jù)的質(zhì)量,數(shù)據(jù)喂養(yǎng)的質(zhì)量決定AI知識庫定制化的能力。

1、數(shù)據(jù)獲。

政策環(huán)境:通過爬蟲或人工監(jiān)測等方式,及時跟蹤有關(guān)各行業(yè)信息化的國家及地方政策,發(fā)掘各行業(yè)信息化政策的機(jī)會。

市場洞察:洞察分析各個行業(yè)信息化的市場空間、走勢等,把握各行業(yè)信息化市場發(fā)展機(jī)會。可以分為統(tǒng)計(jì)數(shù)據(jù)、第三方研究數(shù)據(jù)、大數(shù)據(jù)。在統(tǒng)計(jì)數(shù)據(jù)方面,通過統(tǒng)計(jì)部門或政府機(jī)構(gòu)獲取有關(guān)行業(yè)的統(tǒng)計(jì)數(shù)據(jù)或報(bào)告,該類數(shù)據(jù)較為宏觀,缺乏對微觀的分析;在第三方研究數(shù)據(jù)方面,通過行業(yè)協(xié)會和組織、研究機(jī)構(gòu)和咨詢公司、行業(yè)展會和活動、專業(yè)期刊和出版物獲取有關(guān)行業(yè)信息的研究數(shù)據(jù)、報(bào)告或期刊等,該類數(shù)據(jù)質(zhì)量與客觀性取決于分析機(jī)構(gòu)能力,但數(shù)據(jù)更加直觀不需要額外加工。在大數(shù)據(jù)方面,可以通過爬蟲等方式獲取各行業(yè)信息化招投標(biāo)數(shù)據(jù)、專項(xiàng)債發(fā)行數(shù)據(jù)、企業(yè)年報(bào)數(shù)據(jù)等,這類數(shù)據(jù)量大,質(zhì)量參差不齊,需要數(shù)據(jù)清洗并通過大數(shù)據(jù)挖掘,才能進(jìn)一步才能分析洞察市場需求與走勢,這類數(shù)據(jù)相比其他數(shù)據(jù)更貼近市場的實(shí)際情況,滿足對微觀市場的洞察。

競爭分析:競爭對手在各行業(yè)發(fā)展情況的數(shù)據(jù),這有助于了解競爭對手的競爭實(shí)力,實(shí)現(xiàn)知己知彼,支撐策略的制定?梢酝ㄟ^第三方獲取競爭對手的數(shù)據(jù),也可以通過大數(shù)據(jù)挖掘招投標(biāo)數(shù)據(jù)了解競爭對手真實(shí)情況。

自有數(shù)據(jù):電信運(yùn)營商長期積累的歷史數(shù)據(jù)包括原有的知識庫、客戶服務(wù)資料、歷史方案等。沉積的歷史數(shù)據(jù)在AI的加持下可以重新煥發(fā)生機(jī)。

無論AI能力有多強(qiáng),都離開不了高質(zhì)量的數(shù)據(jù),電信運(yùn)營商可以通過第三方或自有能力獲取相關(guān)數(shù)據(jù)。

2、數(shù)據(jù)的清洗

清理和標(biāo)準(zhǔn)化是數(shù)據(jù)準(zhǔn)備過程中至關(guān)重要的一步。電信運(yùn)營商需要對收集到的各行業(yè)數(shù)據(jù)進(jìn)行清理,去除不相關(guān)或冗余的信息,并處理可能存在的錯誤或噪聲。標(biāo)準(zhǔn)化的數(shù)據(jù)格式和結(jié)構(gòu)有助于確保模型在訓(xùn)練和推理過程中能夠一致地理解和處理不同行業(yè)的數(shù)據(jù)。

在這一階段,特別要注意處理特定行業(yè)術(shù)語和語境的差異,以確保模型在后續(xù)的應(yīng)用中能夠準(zhǔn)確地理解和生成相關(guān)內(nèi)容。數(shù)據(jù)的高質(zhì)量清理和標(biāo)準(zhǔn)化可以提高模型的泛化能力,使其更好地適應(yīng)各種行業(yè)的信息化需求,從而為知識庫的構(gòu)建打下堅(jiān)實(shí)的基礎(chǔ)。

五、模型定制與訓(xùn)練

1、使用電信運(yùn)營商自有的數(shù)據(jù)對預(yù)訓(xùn)練語言模型進(jìn)行微調(diào)

數(shù)據(jù)標(biāo)注與準(zhǔn)備:對電信運(yùn)營商自有的數(shù)據(jù)進(jìn)行標(biāo)注,確保模型能夠理解特定領(lǐng)域的上下文和語境。建立標(biāo)注標(biāo)準(zhǔn),包括術(shù)語定義、實(shí)體關(guān)系等,以便在微調(diào)中注重特定信息。

微調(diào)過程:利用電信運(yùn)營商內(nèi)部數(shù)據(jù)集對預(yù)訓(xùn)練模型進(jìn)行微調(diào),提高模型對電信行業(yè)數(shù)據(jù)的適應(yīng)能力?紤]使用遷移學(xué)習(xí)技術(shù),使模型能夠保留在通用數(shù)據(jù)上學(xué)到的知識,并更快速地適應(yīng)特定行業(yè)的數(shù)據(jù)。

模型性能評估:在微調(diào)過程中,定期評估模型性能,確保模型在電信領(lǐng)域數(shù)據(jù)上表現(xiàn)良好。使用領(lǐng)域?qū)<业姆答佭M(jìn)行調(diào)整,以進(jìn)一步優(yōu)化模型對電信數(shù)據(jù)的理解。

2、調(diào)整模型以適應(yīng)特定行業(yè)的術(shù)語和上下文

術(shù)語嵌入和領(lǐng)域適應(yīng):將特定行業(yè)術(shù)語嵌入到模型中,以確保模型能夠正確理解和使用特定行業(yè)的專業(yè)術(shù)語。調(diào)整模型參數(shù),使其更加靈活,能夠適應(yīng)不同行業(yè)的上下文要求。

上下文感知性調(diào)整:分析特定行業(yè)的上下文特點(diǎn),調(diào)整模型的上下文感知性,以更好地捕捉特定行業(yè)問題的背景信息?紤]引入領(lǐng)域自適應(yīng)方法,使模型更好地理解和推理特定行業(yè)場景下的信息。

多領(lǐng)域信息整合融合各個行業(yè)的知識,使模型能夠處理跨行業(yè)的信息互通,提高其在復(fù)雜場景下的應(yīng)用能力?紤]引入多任務(wù)學(xué)習(xí),使模型能夠同時處理多個行業(yè)領(lǐng)域的任務(wù),增強(qiáng)其泛化能力。

通過以上步驟,電信運(yùn)營商可以確保模型在面對特定行業(yè)數(shù)據(jù)時能夠更準(zhǔn)確、更智能地進(jìn)行理解和應(yīng)用,提高AI知識庫的個性化和定制化水平,使其更好地服務(wù)于電信行業(yè)的信息化需求。

六、集成到業(yè)務(wù)應(yīng)用

將定制的AI知識庫集成到電信運(yùn)營商的業(yè)務(wù)應(yīng)用中,確保定制的AI知識庫提供對業(yè)務(wù)決策的智能支持和增值服務(wù)。提升業(yè)務(wù)運(yùn)營效率,優(yōu)化決策流程,從而更好地滿足行業(yè)拓展需求。

API開發(fā)與集成:設(shè)計(jì)和開發(fā)API,以便將AI知識庫集成到電信運(yùn)營商的現(xiàn)有業(yè)務(wù)應(yīng)用中。確保API與常用的業(yè)務(wù)系統(tǒng)和應(yīng)用相兼容,使集成過程更加順暢。

業(yè)務(wù)流程整合:將AI知識庫無縫整合到電信運(yùn)營商的業(yè)務(wù)流程中,以提高工作效率和決策質(zhì)量。在關(guān)鍵業(yè)務(wù)環(huán)節(jié)嵌入知識庫,使其能夠?yàn)閱T工提供實(shí)時的支持和指導(dǎo)。

七、未來展望

持續(xù)模型優(yōu)化,利用自監(jiān)督學(xué)習(xí)等技術(shù),使AI知識庫能夠通過自我學(xué)習(xí)不斷優(yōu)化模型,適應(yīng)更復(fù)雜、多變的電信行業(yè)環(huán)境。電信運(yùn)營商需要由數(shù)字化運(yùn)營向AI化運(yùn)營轉(zhuǎn)變,能夠更好地應(yīng)對未來電信行業(yè)的挑戰(zhàn),提高AI知識庫的智能水平和適應(yīng)性,從而更好地服務(wù)于業(yè)務(wù)和用戶需求。

給作者點(diǎn)贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個人觀點(diǎn),與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報(bào)電話:021-54451141