TWI601129B

TWI601129B - 一種口語語義解析系統及方法

Info

Publication number: TWI601129B
Application number: TW105120420A
Authority: TW
Inventors: 陳見聳
Original assignee: 芋頭科技(杭州)有限公司
Priority date: 2015-06-30
Filing date: 2016-06-29
Publication date: 2017-10-01
Also published as: CN106326303B; WO2017000777A1; CN106326303A; EP3318978A1; EP3318978A4; HK1231591A1; JP6596517B2; US20180190270A1; JP2018524725A; TW201701269A

Description

一種口語語義解析系統及方法

本發明涉及口語自然語言理解領域，尤其涉及一種高魯棒性（英語：Robustness）口語語義解析系統及方法。

口語語音識別涉及語音學、語言學、數學信號處理、模式識別等多學科領域。隨著智能設備的普及，人與智能設備之間如何更直接友好的交互成為重要問題。由於口語自然語言對於用戶天然的友好性和便捷性，基於口語自然語言的人機交互成為趨勢，受到工業界越來越多的重視。口語自然語言交互的關鍵技術在於口語語義理解，即對用戶的口語句子進行解析，得到用戶想要表達的意圖及相應的關鍵詞。一般地，實現口語語義理解的方法是人工搜集或撰寫相應的語義句式，然後將待解析的句子與句式匹配從而得到解析結果。在現有的口語語義解析方法中，大都是基於某種文法的匹配，比如正則文法、上下文無關文法，這要求待解析口語句子要與語義句式完全一致，才能解析成功；這使得語義理解系統的構造人員需要耗費大量的時間搜集語義句式；由於前端語音識別等模組存在識別不準確的現象，從而造成語義理解的解析失敗；並且由於待解析句式需要與大量的語義句式進行匹配，會造成解析時間長、效率低的問題。

針對現有的口語語義解析方法存在的上述問題，現提供一種旨在實現可在大規模語義句式庫中能夠快速準確的查找到與待解析口語句子相似句子，並給出準確的結果的口語語義解析系統及方法。

具體技術方案如下：

一種口語語義解析系統，用於對預設領域的口語語義進行解析，包括：

一存儲單元，用於存儲所述預設領域的語義句式，每個所述語義句式對應一地址，所述語義句式包括字和關鍵詞，每個所述關鍵詞對應一標簽，所述存儲單元中預設有一詞表，用以存儲每個所述字所在的所述語義句式的地址和/或每個所述標簽所在的所述語義句式的地址；

一獲取單元，用於獲取待解析口語句子；

一索引單元，分別連接所述存儲單元和所述獲取單元，用於根據所述待解析口語句子對所述存儲單元中的所述語義句式進行檢索，獲取與所述待解析口語句子相符的候選語義句式，及相應的候選順序；

一解析單元，連接所述索引單元，用於根據排序後的所述候選語義句式採用模糊匹配算法對所述待解析口語句子進行解析，獲取解析結果。

優選的，所述索引單元包括：

一提取模組，用於提取所述待解析口語句子中與所述存儲單元中相同的所述關鍵詞，並獲取所述關鍵詞對應的標簽；

一替換模組，連接所述提取模組，用於將所述待解析口語句子中的所述關鍵詞採用與所述關鍵詞對應的標簽替換，形成替換式口語句子；

一索引模組，連接所述替換模組，用於根據所述替換式口語句子中的字和所述標簽，在所述存儲單元中的所述詞表中進行檢索，獲取與所述字匹配的所述語義句式的地址，和/或所述標簽匹配的所述語義句式的地址；

一排序模組，連接所述索引模組，用於採用與所述替換式口語句子的相似度比較的方式對與所述替換式口語句子中的所述字匹配的所述語義句式和/或所述標簽匹配的所述語義句式進行排序，獲取經排序後的所述候選語義句式。

優選的，所述排序模組採用得分公式獲取所述候選語義句式與所述替換式口語句子的相似度的分數；

所述得分公式為：

S=(S1+S2)/2，

其中，S表示所述候選語義句式與所述替換式口語句子的相似度的分數，S1表示所述候選語義句式中的所述字和/或所述標簽占所述替換式口語句子的比例；S2表示所述候選語義句式中的所述字和/或所述標簽占所述候選語義句式的比例。

優選的，所述解析單元根據排序後的所述候選語義句式採用模糊匹配算法對所述待解析口語句子進行解析的具體過程爲：

對每個所述候選語義句式建立有限狀態自動機網路，根據所述有限狀態自動機網路對所述待解析口語句子進行打分，比較所述待解析口語句子的分數，將最高分數的所述待解析口語句子作為所述待解析口語句子的解析結果。

優選的，所述詞表採用哈希表（Hash table）表示。

一種口語語義解析方法，應用於所述口語語義解析系統，包括下述步驟：

S1. 獲取待解析口語句子；

S2. 根據所述待解析口語句子對所述存儲單元中的所述語義句式進行檢索，獲取與所述待解析口語句子相符的候選語義句式，及相應的候選順序；

S3. 根據排序後的所述候選語義句式採用模糊匹配算法對所述待解析口語句子進行解析，獲取解析結果。

優選的，所述步驟S2的具體過程為：

S21. 提取所述待解析口語句子中與所述存儲單元中相同的所述關鍵詞，並獲取所述關鍵詞對應的標簽；

S22. 將所述待解析口語句子中的所述關鍵詞採用與所述關鍵詞對應的標簽替換，形成替換式口語句子；

S23. 根據所述替換式口語句子中的字和所述標簽，在所述存儲單元中的所述詞表中進行檢索，獲取與所述字匹配的所述語義句式的地址，和/或所述標簽匹配的所述語義句式的地址；

S24. 採用與所述替換式口語句子的相似度比較的方式對與所述替換式口語句子中的所述字匹配的所述語義句式和/或所述標簽匹配的所述語義句式進行排序，獲取經排序後的所述候選語義句式。

優選的，所述步驟S24採用得分公式獲取所述候選語義句式與所述替換式口語句子的相似度的分數；

所述得分公式為：

S=(S1+S2)/2，

優選的，所述步驟S3的具體過程為：

S31. 對每個所述候選語義句式建立有限狀態自動機網路；

S32. 根據所述有限狀態自動機網路對所述待解析口語句子進行打分；

S33. 比較所述待解析口語句子的分數，將最高分數的所述待解析口語句子作為所述待解析口語句子的解析結果。

優選的，所述詞表採用哈希表（Hash table）表示。

上述技術方案的有益效果：

在本技術方案中，在口語語義解析系統中通過索引單元可快速檢索出與待解析口語句子相關的句式，以提高匹配的效率；採用的模糊匹配算法可在對待解析口語句子進行解析時，允許待解析口語句子和候選語義句式之間可存在不一致的部分，具有一定的容錯性，從而提高了系統的魯棒性（英語：Robustness）。在口語語義解析方法中可快速檢索出與待解析口語句子相關的句式，以提高匹配的效率，以使在大規模語義句式庫中能夠快速準確的查找到與待解析口語句子相似的句式，並輸出準確的結果。

下面將結合本發明實施例中的附圖，對本發明實施例中的技術方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本發明一部分實施例，而不是全部的實施例。基於本發明中的實施例，本領域普通技術人員在沒有作出創造性勞動的前提下所獲得的所有其他實施例，都屬本發明保護的範圍。

需要說明的是，在不衝突的情況下，本發明中的實施例及實施例中的特徵可以相互組合。

下面結合附圖和具體實施例對本發明作進一步說明，但不作為本發明的限定。

如圖1所示，一種口語語義解析系統，用於對預設領域的口語語義進行解析，包括：

一存儲單元1，用於存儲預設領域的語義句式，每個語義句式對應一地址，語義句式包括字和關鍵詞，每個關鍵詞對應一標簽，存儲單元1中預設有一詞表，用以存儲每個字所在的語義句式的地址和/或每個標簽所在的語義句式的地址；

一獲取單元2，用於獲取待解析口語句子；

一索引單元3，分別連接存儲單元1和獲取單元2，用於根據待解析口語句子對存儲單元1中的語義句式進行檢索，獲取與待解析口語句子相符的候選語義句式，及相應的候選順序；

一解析單元4，連接索引單元3，用於根據排序後的候選語義句式採用模糊匹配算法對待解析口語句子進行解析，獲取解析結果。

在本實施例中，通過索引單元3可快速檢索出與待解析口語句子相關的句式，以提高匹配的效率；採用的模糊匹配算法可在對待解析口語句子進行解析時，允許待解析口語句子和候選語義句式之間可存在不一致的部分，且可使得口語語義解析系統的構建人員不需要撰寫大量的差異很小的句式；同時對語音識別前端的錯誤具有一定的容錯性，從而提高了系統的魯棒性。

在優選的實施例中，索引單元3包括：

一提取模組31，用於提取待解析口語句子中與存儲單元1中相同的關鍵詞，並獲取關鍵詞對應的標簽；

一替換模組32，連接提取模組31，用於將待解析口語句子中的關鍵詞採用與關鍵詞對應的標簽替換，形成替換式口語句子；

一索引模組34，連接替換模組32，用於根據替換式口語句子中的字和標簽，在存儲單元1中的詞表中進行檢索，獲取與字匹配的語義句式的地址，和/或標簽匹配的語義句式的地址；

一排序模組33，連接索引模組34，用於採用與替換式口語句子的相似度比較的方式對與替換式口語句子中的字匹配的語義句式和/或標簽匹配的語義句式進行排序，獲取經排序後的候選語義句式。

在本實施例中，索引單元3用於在給定待解析口語句子時，根據索引快速檢索到與待解析口語句子相近的候選語義句式。

具體地，獲取待解析口語句子後，提取待解析口語句子中關鍵詞；通過詞表進行檢測：遍歷待解析口語句子中所有可能的詞，查找詞表中是否存在該詞或字，若存在則記下該詞在待解析口語句子中的位置；通過統計模型進行檢測，可以選擇條件隨機場（Conditional Radom Fields，CRF）訓練統計模型，並進行檢測；將待解析口語句子中的關鍵詞替換為相應的標簽。將待解析口語句子中的標簽以及未做替換的字在索引中檢索。在本實施例中，將每個字或標簽在詞表中檢索，都可得到其所出現的語義句式的地址（ID）。可記錄每個語義句式與待檢索句式中匹配了多少個字或標簽。對檢索結果根據相似度得分進行排序，取得分高的句式作為候選語義句式。

在優選的實施例中，排序模組33採用得分公式獲取候選語義句式與替換式口語句子的相似度的分數；

得分公式為：

S=(S1+S2)/2，

其中，S表示候選語義句式與替換式口語句子的相似度的分數，S1表示候選語義句式中的字和/或標簽占替換式口語句子的比例；S2表示候選語義句式中的字和/或標簽占候選語義句式的比例。

在優選的實施例中，解析單元4根據排序後的候選語義句式採用模糊匹配算法對待解析口語句子進行解析的具體過程為：

對每個候選語義句式建立有限狀態自動機網路，根據有限狀態自動機網路對待解析口語句子進行打分，比較待解析口語句子的分數，將最高分數的待解析口語句子作為待解析口語句子的解析結果。

在本實施例中，解析單元4可對每個候選語義句式建立有限狀態自動機網路。每個字或標簽作為有限狀態自動機上的一個弧。如圖6所示表示一個句式所對應的有限狀態自動機網路示意圖；根據有限狀態機網路對待解析口語句子進行解析和打分，具體地，根據關鍵詞檢測的結果將待解析口語句子中的關鍵詞用相應標簽替換。假設待解析口語句子中有n個關鍵詞檢測結果，則存在2n個標簽的可能組合。在這些可能組合中去掉標簽的位置衝突的組合，即可得到候選的待檢測標簽替換句子；將替換式口語句子與每個句式生成的有限狀態機網路進行模糊匹配，進行匹配的方法有更多，如《Error-tolerant Finite-state Recognition with Applications to Morphological Analysis and Spelling Correction》中的方法，由於該匹配方法為現有技術故此處不再贅述，該匹配方法通過動態規劃算法可以快速計算兩個句子之間的匹配程度；根據打分獲取最優的句式及其相應的解析結果。

進一步地，解析和打分過程允許待解析口語句子和口語語義句式之間存在插入和/或刪除和/或替換的操作；並且插入和/或刪除和/或替換的操作的個數受預設閾值的限制，當個數小於預設閾值時，則待解析句子符合相應的語義句式，反之則不符合。

在優選的實施例中，詞表採用哈希表表示。

如圖2所示，一種口語語義解析方法，應用於口語語義解析系統，包括下述步驟：

S1. 獲取待解析口語句子；

S2. 根據待解析口語句子對存儲單元1中的語義句式進行檢索，獲取與待解析口語句子相符的候選語義句式，及相應的候選順序；

S3. 根據排序後的候選語義句式採用模糊匹配算法對待解析口語句子進行解析，獲取解析結果。

在本實施例中，在口語語義解析方法中可快速檢索出與待解析口語句子相關的句式，以提高匹配的效率，以使在大規模語義句式庫中能夠快速準確的查找到與待解析口語句子相似的句式，並輸出準確的結果。

如圖3所示，在優選的實施例中，步驟S2的具體過程為：

S21. 提取待解析口語句子中與存儲單元1中相同的關鍵詞，並獲取關鍵詞對應的標簽；

S22. 將待解析口語句子中的關鍵詞採用與關鍵詞對應的標簽替換，形成替換式口語句子；

S23. 根據替換式口語句子中的字和標簽，在存儲單元1中的詞表中進行檢索，獲取與字匹配的語義句式的地址，和/或標簽匹配的語義句式的地址；

S24. 採用與替換式口語句子的相似度比較的方式對與替換式口語句子中的字匹配的語義句式和/或標簽匹配的語義句式進行排序，獲取經排序後的候選語義句式。

在本實施例中，口語語義解析方法可包括離線階段和在線階段兩部分，其中離線階段包括：根據定義的領域需求，收集和整理相應領域的語義句式。其中的語義句式，包括：符合口語規範，並且該語義句式需要解析的關鍵詞用標簽表示。例如打電話領域的一條可能的句子為“打電話給張三”，由於“張三”是要解析的名稱關鍵詞，將需要解析的關鍵詞用標簽替代，如：“張三”替換為“$name”，那麼通過該查詢句子改寫後的句式為“打電話給$name”。對每個領域的語義句式建立索引：對語義句式中的字和標簽共同建立索引，其中標簽作為一個字進行索引。本實施例採用哈希倒排索引，其示意圖如圖5所示。哈希表中存放的是所有語義句式中出現過的字和標簽，每個字或標簽後跟一個列表，列表中的每個元素存放該字或標簽所在句式的地址（ID號）。

在線階段包括：在給定待解析口語句子時，根據索引快速檢索到與待解析句子相近的候選語義句式。其具體步驟如下：

獲取待解析口語句子後，提取待解析口語句子中關鍵詞；通過詞表進行檢測：對詞表中的每個詞建立哈希索引，給定待解析口語句子，遍歷待解析口語句子中所有可能的詞，查找哈希表中是否存在該詞，若存在則記下該詞在待解析句子中的位置；通過統計模型進行檢測，可以選擇條件隨機場訓練統計模型，進行檢測；將待解析口語句子中的關鍵詞替換為相應的標簽。該替換與離綫階段的替換一致；將待解析口語句子中的標簽以及未做替換的字在索引中檢索。在本實施例中，將每個字或標簽在哈希倒排索引中檢索，都可得到其所出現的語義句式的地址（ID）。記錄每個語義句式與待檢索句式中匹配了多少個字或標簽。將檢索結果根據相似度的得分進行排序，取得分高的句式作為候選語義句式。

在優選的實施例中，步驟S24採用得分公式獲取候選語義句式與替換式口語句子的相似度的分數；

得分公式為：

S=(S1+S2)/2，

如圖4所示，在優選的實施例中，步驟S3的具體過程為：

S31. 對每個候選語義句式建立有限狀態自動機網路；

S32. 根據有限狀態自動機網路對待解析口語句子進行打分；

S33. 比較待解析口語句子的分數，將最高分數的待解析口語句子作為待解析口語句子的解析結果。

在本實施例中，可對每個候選語義句式建立有限狀態自動機網路。每個字或標簽作為有限狀態自動機上的一個弧。如圖6所示表示一個句式所對應的有限狀態自動機網路示意圖；根據有限狀態機網路對待解析口語句子進行解析和打分，具體地，根據關鍵詞檢測的結果將待解析口語句子中的關鍵詞用相應標簽替換。假設待解析口語句子中有n個關鍵詞檢測結果，則存在2n個標簽的可能組合。在這些可能組合中去掉標簽的位置衝突的組合，即可得到候選的待檢測標簽替換句子；將替換式口語句子與每個句式生成的有限狀態機網路進行模糊匹配，進行匹配的方法有更多，如《Error-tolerant Finite-state Recognition with Applications to Morphological Analysis and Spelling Correction》中的方法，由於該匹配方法為現有技術故此處不再贅述，該匹配方法通過動態規劃算法可以快速計算兩個句子之間的匹配程度；根據打分獲取最優的句式及其相應的解析結果。

以上所述僅為本發明較佳的實施例，並非因此限制本發明的實施方式及保護範圍，對於本領域技術人員而言，應當能夠意識到凡運用本發明說明書及圖示內容所作出的等同替換和顯而易見的變化所得到的方案，均應當包含在本發明的保護範圍內。

1‧‧‧存儲單元
2‧‧‧獲取單元
3‧‧‧索引單元
31‧‧‧提取模組
32‧‧‧替換模組
33‧‧‧排序模組
34‧‧‧索引模組
4‧‧‧解析單元
S1-S3‧‧‧步驟
S21-S24‧‧‧步驟
S31-S33‧‧‧步驟

圖1為本發明所述口語語義解析系統的一種實施例的模組圖；圖2為本發明所述口語語義解析方法的一種實施例的方法流程圖；圖3為本發明對所述存儲單元中的所述語義句式進行檢索的方法流程圖；圖4為本發明對所述待解析口語句子進行解析的方法流程圖；圖5為本發明句式倒排索引示意圖；圖6為本發明句式對應的有限狀態自動機示意圖。

1‧‧‧存儲單元

2‧‧‧獲取單元

3‧‧‧索引單元

31‧‧‧提取模組

32‧‧‧替換模組

33‧‧‧排序模組

34‧‧‧索引模組

4‧‧‧解析單元

Claims

一種口語語義解析系統，用於對預設領域的口語語義進行解析，包括：一存儲單元，用於存儲所述預設領域的語義句式，每個所述語義句式對應一位址，所述語義句式包括字和關鍵字，每個所述關鍵字對應一標籤，所述存儲單元中預設有一詞表，用以存儲每個所述字所在的所述語義句式的位址和/或每個所述標籤所在的所述語義句式的地址；一獲取單元，用於獲取待解析口語句子；一索引單元，分別連接所述存儲單元和所述獲取單元，用於根據所述待解析口語句子對所述存儲單元中的所述語義句式進行檢索，獲取與所述待解析口語句子相符的候選語義句式，及相應的候選順序；所述索引單元包括：一提取模組，用於提取所述待解析口語句子中與所述存儲單元中相同的所述關鍵字，並獲取所述關鍵字對應的標籤；一替換模組，連接所述提取模組，用於將所述待解析口語句子中的所述關鍵字採用與所述關鍵字對應的標籤替換，形成替換式口語句子；一索引模組，連接所述替換模組，用於根據所述替換式口語句子中的字和所述標籤，在所述存儲單元中的所述詞表中進行檢索，獲取與所述字匹配的所述語義句式的地址，和/或所述標籤匹配的所述語義句式的地址；一排序模組，連接所述索引模組，用於採用與所述替換式口語句子的相似度比較的方式對與所述替換式口語句子中的所述字匹配的所述語義句式和/或所述標籤匹配的所述語義句式進行排序，獲取經排序後的所述候選語義句式；所述排序模組採用得分公式獲取所述候選語義句式與所述替換式口語句子的相似度的分數；所述得分公式為：S=(S1+S2)/2，其中，S表示所述候選語義句式與所述替換式口語句子的相似度的分數，S1表示所述候選語義句式中的所述字和/或所述標籤占所述替換式口語句子的比例；S2表示所述候選語義句式中的所述字和/或所述標籤占所述候選語義句式的比例；一解析單元，連接所述索引單元，用於根據排序後的所述候選語義句式採用模糊匹配演算法對所述待解析口語句子進行解析，獲取解析結果。
如專利申請範圍第1項所述口語語義解析系統，所述解析單元根據排序後的所述候選語義句式採用模糊匹配演算法對所述待解析口語句子進行解析的具體過程為：對每個所述候選語義句式建立有限狀態自動機網路，根據所述有限狀態自動機網路對所述待解析口語句子進行打分，比較所述待解析口語句子的分數，將最高分數的所述待解析口語句子作為所述待解析口語句子的解析結果。
如專利申請範圍第1項所述口語語義解析系統，所述詞表採用雜湊表表示。
一種口語語義解析方法，應用於如專利申請範圍第1項所述口語語義解析系統，包括下述步驟：S1.獲取待解析口語句子； S2.根據所述待解析口語句子對所述存儲單元中的所述語義句式進行檢索，獲取與所述待解析口語句子相符的候選語義句式，及相應的候選順序；所述步驟S2的具體過程為：S21.提取所述待解析口語句子中與所述存儲單元中相同的所述關鍵字，並獲取所述關鍵字對應的標籤；S22.將所述待解析口語句子中的所述關鍵字採用與所述關鍵字對應的標籤替換，形成替換式口語句子；S23.根據所述替換式口語句子中的字和所述標籤，在所述存儲單元中的所述詞表中進行檢索，獲取與所述字匹配的所述語義句式的地址，和/或所述標籤匹配的所述語義句式的地址；S24.採用與所述替換式口語句子的相似度比較的方式對與所述替換式口語句子中的所述字匹配的所述語義句式和/或所述標籤匹配的所述語義句式進行排序，獲取經排序後的所述候選語義句式；所述步驟S24採用得分公式獲取所述候選語義句式與所述替換式口語句子的相似度的分數；所述得分公式為：S=(S1+S2)/2，其中，S表示所述候選語義句式與所述替換式口語句子的相似度的分數，S1表示所述候選語義句式中的所述字和/或所述標籤占所述替換式口語句子的比例；S2表示所述候選語義句式中的所述字和/或所述標籤占所述候選語義句式的比例；S3.根據排序後的所述候選語義句式採用模糊匹配演算法對所述待解析口語句子進行解析，獲取解析結果。
如專利申請範圍第4項所述口語語義解析方法，所述步驟S3的具體過程為：S31.對每個所述候選語義句式建立有限狀態自動機網路；S32.根據所述有限狀態自動機網路對所述待解析口語句子進行打分；S33.比較所述待解析口語句子的分數，將最高分數的所述待解析口語句子作為所述待解析口語句子的解析結果。
如專利申請範圍第4項所述口語語義解析方法，其特徵在於，所述詞表採用雜湊表表示。