正文

對話機器人（對話機器人的實現(xiàn)原理）

發(fā)布時間：2023-03-13 11:26:42 稿源：創(chuàng)意嶺閱讀： 80 問大家

大家好！今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于對話機器人的問題，以下是小編對此問題的歸納整理，讓我們一起來看看吧。

ChatGPT國內(nèi)免費在線使用，能給你生成想要的原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等

你只需要給出你的關(guān)鍵詞，它就能返回你想要的內(nèi)容，越精準(zhǔn)，寫出的就越詳細(xì)，有微信小程序端、在線網(wǎng)頁版、PC客戶端，官網(wǎng)：https://ai.de1919.com

本文目錄:

1、騰訊算法高級研究員陳松堅：智能問答技術(shù)及其應(yīng)用
2、萬豪擁抱AI 酒店體驗竟能如此智能
3、手機上的對話機器人怎么變聲音?oppo
4、送幼兒園小朋友什么禮物比較好

對話機器人（對話機器人的實現(xiàn)原理）

一、騰訊算法高級研究員陳松堅：智能問答技術(shù)及其應(yīng)用

隨著人工智能的飛速發(fā)展以及廣泛落地應(yīng)用，越來越多的設(shè)備將會被植入智能問答技術(shù)，人機交互場景隨處可見，智能問答在未來將會成為一個非常重要的入口。

騰訊小知憑借著業(yè)界領(lǐng)先的智能AI引擎算法和海量大數(shù)據(jù)倉庫，已將智能問答技術(shù)落地實施，并且經(jīng)過大量的業(yè)務(wù)考驗和優(yōu)化，知識點匹配度和準(zhǔn)確率都已達到90%以上，在2018 年 GITC 全球互聯(lián)網(wǎng)技術(shù)大會上，騰訊小知榮獲年度互聯(lián)網(wǎng)最具價值產(chǎn)品獎。

騰訊小知算法負(fù)責(zé)人陳松堅也在會場發(fā)表了關(guān)于智能問答技術(shù)原理及其在To B場景下的應(yīng)用的專題演講，從自己的角度為我們展現(xiàn)智能問答技術(shù)的最新成果。

他首先從智能問答是什么，為什么和怎么做的三個問題出發(fā)，闡明了他對當(dāng)前智能問答技術(shù)的定位和價值，首先，現(xiàn)階段的智能問答是信息檢索技術(shù)的升級，是量變而未達到質(zhì)變。但是無論在To B還是To C的場景下，當(dāng)前的技術(shù)都能夠切實解決一些用戶的痛點，提升用戶體驗，是亟待推進和充滿想象的方向。

在回答怎么做這個問題時，他詳細(xì)介紹了幾種不同的問答機器人的實現(xiàn)路徑，包括單輪問答機器人，多輪問答機器人及閱讀理解機器人。其中重點闡述了單輪問答機器人的實現(xiàn)原理，包括字面匹配，詞向量匹配，深度語義匹配，遷移學(xué)習(xí)等技術(shù)。

此后他還分享了小知團隊將上述技術(shù)產(chǎn)品化的經(jīng)驗，包括智能客服機器人和電話機器人兩大塊，主要分享了當(dāng)前產(chǎn)品的形態(tài)，亮點和實際項目中取得的一些成果。

最后，他簡單總結(jié)了小知目前完成的工作以及就智能問答的發(fā)展提出了自己的幾點看法。

--------------------------------------------------------------

以下是演講稿全文：

各位下午好，很高興今天能在這里給大家做分享報告。先介紹一下，我們騰訊小知是致力于為政府和各行業(yè)提供一攬子智能問答解決方案的團隊，目前已經(jīng)落地的包括基于文本的智能客服機器人和基于語音的電話機器人等。

在大多數(shù)人的認(rèn)知里，智能問答很可能是以上的3個印象，2011年打敗了人類取得問答競賽冠軍的waston;2017年被沙特授予公民身份的機器人sofia;更為大家熟知的鋼鐵俠中的機器人管家jarvis。在大家心目中，智能就意味著能夠像真人一樣交流。然而作為從業(yè)者，很遺憾地告訴大家，目前的技術(shù)還遠沒有達到這個目標(biāo)，我認(rèn)為本質(zhì)上目前的智能問答技術(shù)是對信息檢索技術(shù)的一次升級，是量變而未到質(zhì)變。這個皇冠上的明珠還等待我們?nèi)フ　?/p>

既然問答技術(shù)還不成熟，那為什么還要投身到這個領(lǐng)域呢。我想從To B和To C兩個角度去回答。對企業(yè)來講，當(dāng)前的問答技術(shù)雖然無法解答復(fù)雜的咨詢，但是大部分的簡單的頭部問題是可以比較好的解答的。從本輪AI大潮NLP賽道的幾名種子選手都從智能客服這個方向切入就可以看出企業(yè)是確實存在對智能問答的剛性需求。而對普通用戶來講，一方面siri等語音助手每天都在為用戶提供便捷的交互界面，另一方面像amazon echo這一類的智能家居產(chǎn)品也逐步進入千家萬戶，成為物聯(lián)網(wǎng)生態(tài)的中心入口之一，這便是智能問答的價值所在。

那如何實現(xiàn)智能問答機器人呢?我們先來看最基本的單輪問答機器人的實現(xiàn)原理。

熟悉搜索引擎的朋友會發(fā)現(xiàn)這個架構(gòu)跟搜索引擎的很類似。單輪問答一般來說就是FAQ問答，是基于業(yè)務(wù)問答對組成的問答庫進行檢索匹配。其中FAQ問題集包含多個相似問法供用戶問題去匹配。預(yù)處理階段一般會進行文本糾錯，標(biāo)準(zhǔn)化和底層NLP特征提取;召回階段會在倒排索引中召回若干個候選問題(粗排)，而最后的匹配階段會基于各種模型進行匹配打分并返回得分最高的結(jié)果(精排)。匹配階段還會引入其他模塊，如知識圖譜和拒識模型，目的是輔助提升匹配的最終準(zhǔn)確率。

retrieval中的匹配可以看做是naive solution，詞袋+VSM, 篩選候選夠用了，但是精排需要更精致的策略，第一，要利用監(jiān)督信息做擬合，我們構(gòu)建基于問題對的訓(xùn)練語料，擬合是否匹配這個二分類目標(biāo)。第二，特征上拋棄稀疏的詞袋模型，而是構(gòu)造各種相似度來做base scorer，然后利用非線性的抗噪能力強的xgboost來做融合，比如我們用到詞bigram, 字bigram, 核心詞，名詞等特征集合的相似度。這種方法的優(yōu)缺點是一體的，由于模型只學(xué)習(xí)字面相似的特征，因此不受領(lǐng)域影響，通用性強，適合用在冷啟動階段;但也因為只考慮字面相似，無法處理更深層的語義匹配。

那如何度量語義的相似呢。詞向量技術(shù)的興起是語義匹配的前提，所謂詞向量，是將孤立的傳統(tǒng)的token表示映射到相互關(guān)聯(lián)的向量空間中，這種關(guān)聯(lián)性，或者說是相似性，是通過詞語的上下文的來描述的。也就是說，上下文越相似的詞語，他們的語義就越相似，詞向量的歐式距離就越近。這是很容易理解的，更妙的是，通過對向量進行簡單加減運算，能夠呈現(xiàn)出概念的關(guān)系，比如king-man+woman的結(jié)果非常接近于queen, 因此說明詞向量能夠一定程度刻畫語義。那對句子如何做向量表示呢?一個簡單的想法是直接求和平均，WMD是另一個比較有意思且有效的做法，他將計算句子到句子的相似度建模成一個運輸?shù)膯栴}，把句子p的各個詞，運輸?shù)絨的各個詞上，也可以說是變換;運輸成本是詞向量的cosine相似度，而要運輸?shù)氖歉鱾€詞在句子中的權(quán)重，用線性規(guī)劃求解一個最優(yōu)解，即為p到q的距離。另外還有個有效的方法是SIF，思路是做詞向量加權(quán)求和，但是突顯出句子中非通用的部分，即權(quán)重用詞頻倒數(shù)來計算權(quán)重，實驗效果也很不錯。

上面的方法有一個問題就是沒有利用有監(jiān)督信息，所以效果有明顯的天花板。下面介紹這個工作是基于深層網(wǎng)絡(luò)做有監(jiān)督學(xué)習(xí)的匹配的，做法也比較簡單，首先把句子文本用one-hot編碼，假如詞典大小是500K，那編碼完長度就是500K維，其實等于是詞袋模型，然后輸入到一個多層的神經(jīng)網(wǎng)絡(luò)去學(xué)習(xí)，最終得到一個128維的向量作為句子的語義表示，然后用cosine計算兩個句子與文檔的相似度作為模型輸出。這個方法其實是將高維稀疏的token特征映射到低維語義空間，跟詞向量的思路很類似，只不過訓(xùn)練目標(biāo)不同，并且這里使用了深層網(wǎng)絡(luò)結(jié)構(gòu)。

但是CNN對上下文的處理能力依賴于窗口大小，遠距離就沒辦法處理了，因此要考慮另一種網(wǎng)絡(luò)單元RNN，這種單元是專門為時序模型量身打造的，簡單來說，每一時刻t上的隱藏狀態(tài)，或者說第t個詞上的語義編碼，都由兩個輸入共同決定，即上一時刻的隱藏狀態(tài)和當(dāng)前時刻的原始輸入，而為了解決遠距離傳遞導(dǎo)致的梯度消失和梯度爆炸等問題，RNN有一些變種結(jié)構(gòu)來應(yīng)對，比如 LSTM和GRU等。

CNN和RNN都是對原始輸入進行語義編碼的基本單元，編碼后的向量就可以接入多層感知機進行相似度計算，如果是直接計算cosine相似度，那就是dssm的升級版，而更常見的做法是把兩個句子的編碼向量拼接在一起，再經(jīng)過一個多層感知機計算相似度，而這種方法統(tǒng)稱為表達式建模;

另一種方案考慮到兩個句子之間的交互信息對學(xué)習(xí)他們是否匹配顯然更為重要，這一類方案被稱為交互式建模，右邊是一個典型的例子，他最大的不同是首先對兩個句子的所有窗口組合進行拼接和卷積，得到交互信息。然后再進行多次卷積和池化得到表示。其他的交互方式還包括編碼之后，進行交互操作，如作差，點乘等，還有計算attention表示，也是常見的交互方式。

下面介紹我們的方案，跟上面介紹的模型相比，我們的方案主要做了兩處改動，一個是使用了稠密連接的網(wǎng)絡(luò)結(jié)構(gòu)，讓rnn層的輸入和輸出拼接在一起做為下一層的輸入，第二個是混合注意力機制，即在計算attention向量進行交互式建模的基礎(chǔ)上，增加self-attention向量計算，然后把兩個attention向量經(jīng)過門機制進行融合，這樣做一方面引入了問句間的交互信息，同時又增強了對自身的表達建模。

上面的模型是比較復(fù)雜的模型，參數(shù)量有5.8M。在實際中應(yīng)用中訓(xùn)練語料會嚴(yán)重不足，為了解決這個問題，我們引入了遷移學(xué)習(xí)的策略。首先第一種是多任務(wù)聯(lián)合學(xué)習(xí)，比如在擬合兩個問句是否匹配的同時，也對問句進行分類預(yù)測;另外還可以同時對匹配的問題對做seq2seq的翻譯模型訓(xùn)練。這兩個策略都證明能有效提升準(zhǔn)確率。

而另一個思路更加直觀，即引入其他領(lǐng)域的語料，所謂多語料遷移。Fine-tune即參數(shù)微調(diào)是其中一種做法，即先用通用語料訓(xùn)練網(wǎng)絡(luò)，固定底層表達層的參數(shù)，然后再使用領(lǐng)域語料調(diào)整上層參數(shù);另一種思路參考了對抗學(xué)習(xí)的思想，即引入一個新的任務(wù)“混淆分類器”去判別當(dāng)前樣本是來自源語料還是目標(biāo)語料，通過在損失函數(shù)中增加反向的混淆分類損失項，讓混淆分類器盡可能地?zé)o法區(qū)分樣本的來源，從而保證共享了參數(shù)的表達網(wǎng)絡(luò)能夠?qū)W習(xí)到兩部分語料中共性的部分。

以上的介紹都是為了完成一個基本的單輪對話機器人，而實際應(yīng)用中，往往存在需要需要交互的場景，比如查詢社保余額，就需要用戶提供指定信息，如姓名，身份證號，手機號等。這種是所謂任務(wù)導(dǎo)向型機器人，而另一種，基于知識圖譜的機器人也往往會涉及到多輪交互。這里簡單介紹一下多輪對話機器人的架構(gòu)，整體上是一個對話管理系統(tǒng)，總的來說是管理會話狀態(tài)，包含4個模塊，分別是輸入部分：自然語言理解模塊NLU，負(fù)責(zé)意圖識別和抽取槽位實體，比如這里匹配到了意圖是查詢社保余額，抽取到了社保號1234。得到的意圖和槽位值會送入到對話狀態(tài)追蹤模塊，DST，他負(fù)責(zé)會話狀態(tài)的更新，形式化來說是一個函數(shù)，輸入是當(dāng)前狀態(tài)s和當(dāng)前的query經(jīng)過NLU處理過得到的意圖和槽位值q, 輸出新的狀態(tài)s‘，下一步是把s’送入DPL，對話策略模塊，這個模塊是根據(jù)新的狀態(tài)s‘輸出行動a，通常這個決策選擇會依賴于一個外部數(shù)據(jù)庫或知識圖譜，最后，由輸出部分，自然語言生成模塊NLG負(fù)責(zé)將行動轉(zhuǎn)換為自然語言文本，返回給用戶。

前面提到的單輪FAQ機器人，有一個問題是問答準(zhǔn)確率依賴于問答庫的質(zhì)量，而問答庫的構(gòu)建耗時費力，所以針對數(shù)據(jù)較大的非結(jié)構(gòu)化文檔，如果可以直接從中抽取答案，是非常理想的做法。比如斯坦佛大學(xué)開源的drQA，就是基于wikipedia的語料做的一個開放域上的問答機器人，我們來看看這種閱讀理解機器人的架構(gòu)示意，他也是基于檢索重排的思路，首先把可能的文段從語料庫中摘取出來，然后送入閱讀理解模型進行答案定位，打分，排序和選擇得分最高的答案。閱讀理解模型與匹配模型是類似的，需要先對問題和候選文段進行編碼表示，不同之處在于最終預(yù)測的目標(biāo)是答案的起始和結(jié)束位置。我所在的團隊在去年，在閱讀理解的權(quán)威公開測評Squad v1中取得過第一的成績，同時參加這個測評的包括了google, facebook, 微軟，阿里idst, 科大訊飛等國內(nèi)外同行。說明業(yè)界對這種技術(shù)還是非?？粗氐?。

下面分享小知在把以上技術(shù)落地產(chǎn)品化的經(jīng)驗。首先我們來看看小知的整體架構(gòu)圖，核心引擎有兩部分，一塊是上面重點闡述的深度語義匹配模型，另一塊是本次分享沒有展開的知識圖譜引擎，在此之上，我們構(gòu)建了FAQ機器人，多輪會話機器人(任務(wù)機器人)，閑聊機器人等。以下是我們單輪和多輪機器人的示例。

在我們實際的落地項目中，得益于深度遷移模型的語義匹配能力和行業(yè)知識圖譜的的精準(zhǔn)匹配和輔助追問，小知機器人能夠做到95%左右的問答準(zhǔn)確率，并且節(jié)省了50%以上的服務(wù)人力，切實為政府和企業(yè)提升效率和降低成本。

在智能客服的基礎(chǔ)上，我們又打造了基于語音的電話機器人，力主融合智能客服，人工在線客服，工單系統(tǒng)和電話機器人，為客戶打造從售前售中售后的整體解決方案。

以下是電話機器人的整體架構(gòu)圖，核心是自然語言理解NLU模塊，負(fù)責(zé)識別用戶提問意圖

提取相關(guān)實體。根據(jù)NLU輸出的結(jié)果，內(nèi)置的對話管理引擎會進行流程狀態(tài)流轉(zhuǎn)和跟蹤。

另外，ASR語音識別和TTS語音合成是不可或缺的重要服務(wù)，這三個模塊相互協(xié)作，共同完成與用戶的交互。

最后對智能問答的未來發(fā)展提幾點我的看法。目前學(xué)術(shù)界比較公認(rèn)的一個方向是，需要更有機地結(jié)合模型和規(guī)則，而在問答領(lǐng)域，規(guī)則的一大組成部分就是知識圖譜，包括開放領(lǐng)域的知識圖譜和專業(yè)領(lǐng)域知識圖譜。而更進一步地，我們需要研究帶有推理性質(zhì)的事理型知識圖譜去描述領(lǐng)域內(nèi)的規(guī)則和知識，讓機器人能夠處理帶有復(fù)雜條件的問題，提供更智能的回復(fù)。在我看來，智能問答的一個突破口就在于解決以上三個問題。以上就是今天分享的內(nèi)容，謝謝大家。

主講人介紹：

陳松堅，騰訊數(shù)據(jù)平臺部算法高級研究員，有著8 年的 NLP 研發(fā)經(jīng)驗，2017 年加入騰訊 TEG 數(shù)據(jù)平臺部，負(fù)責(zé)智能客服產(chǎn)品騰訊小知的算法規(guī)劃和落地。負(fù)責(zé)過多個智能客服項目，對封閉領(lǐng)域的智能問答有豐富的實戰(zhàn)經(jīng)驗。

二、萬豪擁抱AI 酒店體驗竟能如此智能

全球連鎖酒店巨頭萬豪酒店（Marriot Hotel）早在2017年就擁抱了人工智能，推出了對話機器人 Chatbotlr，通過短信平臺、Facebook Messenger、Slack、微信及谷歌語音助手等多渠道，提供更貼心的酒店用戶體驗。

在酒店智能化轉(zhuǎn)型的大潮下，領(lǐng)頭羊萬豪酒店的對話機器熱 Chatbotlr 將用戶體驗做到了極致。它不僅僅停留在用戶預(yù)訂或售前的問題解答，而是打造了一個完整的互動生態(tài)閉環(huán)，讓客戶在住酒店前、中、后多環(huán)節(jié)都能享受智能化對話服務(wù)。

萬豪表示，2/3的酒店客戶都與 Chatbotlr 進行了互動。

另外，無論最終是否選擇了萬豪，對話機器人都會通過萬豪會員項目，在你到訪紐約的時間里，為你推送紐約地區(qū)熱門餐廳、景點、當(dāng)?shù)伢w驗等項目。推薦內(nèi)容部分來源于萬豪自出的雜志媒體“萬豪旅行家”（Marriott Traveller）。此外，萬豪在 AI 對話機器人上打通了多個渠道，以滿足不同的使用場景，不僅局限在社交媒體。對于商務(wù)旅行的企業(yè)用戶，可以通過企業(yè)協(xié)同效率軟件 slack 篩選酒店，并請同行人員用 Emoji 表情進行投票。

在擁抱機器智能體驗的同時，萬豪也非常注重人工的參與。萬豪國際數(shù)字市場總監(jiān) Amanda Moore 表示：“人機結(jié)合所帶來的才是最佳的體驗。當(dāng)機器回答不足以滿足客戶需求時，我們會為用戶提供與人工對話的選擇。”

在客人退房后，傳統(tǒng)酒店往往缺乏與客人溝通的渠道，很難打破問卷短信太生硬、郵件沒人看的魔咒。而對話機器人則是與客人保持后續(xù)溝通的比較自然的方式，通過對話的形式可以獲取問卷調(diào)查信息，并附送一些優(yōu)惠券、會員專享服務(wù)等獎勵。同時，對話機器人能幫助酒店建立一個精準(zhǔn)的客戶檔案，以為用戶發(fā)送個性化房間、服務(wù)及優(yōu)惠推薦，這對于建立品牌忠誠度以及刺激用戶二次預(yù)定起到了顯著的效果。

為了 AI 賦能傳統(tǒng)酒店行業(yè)，解決酒店行業(yè)依賴在線旅游平臺（OTA）、技術(shù)能力有限、人力成本高等問題，奇點機智推出了行業(yè)通用的對話系統(tǒng)，讓傳統(tǒng)酒店也能夠像萬豪一樣為客戶打造個性化住宿體驗：

提升客戶體驗是酒店的終極目標(biāo)，體驗升級離不開技術(shù)賦能。對于傳統(tǒng)酒店來說，萬豪酒店作為智能體驗的先鋒，具有一定的借鑒意義。而如何利用 AI 打通客人住宿全流程的雙向溝通渠道，擺脫對 OTA 的依賴，成為了酒店增長需要思考的關(guān)鍵。

三、手機上的對話機器人怎么變聲音?oppo

1、打開手機設(shè)置，點擊進入Breeno。

2、進入Breeno語音。找到方言與聲音。

3、點擊進入。選擇您喜歡的聲音和方言即可。

四、送幼兒園小朋友什么禮物比較好

送幼兒園小朋友比較好的禮物有：

1、兒童AI智能對話機器人

幼兒園階段的孩子正是好奇心和求知欲最強烈的時候，對所見所聞都備感興趣。而家長每天上班忙碌疏于對孩子的陪伴，那就添置一臺兒童AI智能對話機器人來陪伴小朋友。不同于普通的毛絨玩具，這個機器人不僅能夠智能語音與孩子對話，還是個能夠幫助孩子學(xué)習(xí)的機器人，在它的陪伴下孩子的知識和思維都會得到提升。

2、兒童畫板

孩子的興趣在幼兒園階段就會慢慢展現(xiàn)出來，有些孩子喜歡到處在家里的墻上涂涂畫畫，這個時候千萬不要忙著批評她，送她一個兒童畫板當(dāng)作禮物，引導(dǎo)她找到正確畫畫的地方，可能正是你這個小舉動，發(fā)掘了她繪畫的天賦。畫板高度適合幼兒園小朋友使用，保護孩子眼睛。無毒無氣味，家長們更放心。

3、兒童科學(xué)實驗玩具

如果你家的寶貝在幼兒園階段就展現(xiàn)出對濃濃科學(xué)的喜愛，滿滿的求知欲那家長可以為孩子選購科學(xué)實驗類的玩具，以此更能激發(fā)他們的興趣，發(fā)現(xiàn)孩子不一樣的一面。兒童高倍顯微鏡讓孩子發(fā)現(xiàn)圍觀世界的奇妙，了解更多生物知識。高清天文望遠鏡滿足孩子探索月球、星空的愿望，了解更多天文知識。

以上就是關(guān)于對話機器人相關(guān)問題的回答。希望能幫到你，如有更多相關(guān)問題，您也可以聯(lián)系我們的客服進行咨詢，客服也會為您講解更多精彩的知識和內(nèi)容。