TW201935273A

TW201935273A - 語句的使用者意圖識別方法和裝置

Info

Publication number: TW201935273A
Application number: TW107128740A
Authority: TW
Inventors: 胡于響
Original assignee: 香港商阿里巴巴集團服務有限公司
Priority date: 2017-10-20
Filing date: 2018-08-17
Publication date: 2019-09-01
Also published as: JP2020537777A; US20200250378A1; CN109697282A; CN109697282B; WO2019076286A1; US11551007B2

Abstract

本發明實施例揭示了一種語句的用戶意圖識別方法，該方法包括當需要確定待分析語句的用戶意圖時，可以從該待分析語句所在人機互動會話中確定出該待分析語句的至少一條歷史語句，由於人機互動一般具有一定的連續性，故人機互動會話中歷史語句的內容可能與待分析語句的內容相關，結合待分析語句的句向量和至少一條歷史語句的句向量所確定出的歷史向量中可以包括歷史語句中相關內容，這些內容可以與待分析語句的內容有一定關聯，若結合該歷史向量來確定待分析語句的用戶意圖，該歷史向量包括的與該待分析語句相關的內容可以作為額外的確定依據，進而可以提高確定待分析語句用戶意圖的準確性。本發明實施例還揭示了一種語句的使用者意圖識別裝置。

Description

語句的使用者意圖識別方法和裝置

本發明係有關資料處理領域，特別是有關一種語句的使用者意圖識別方法和裝置。

隨著人工智慧技術的發展，機器透過對人類語言的分析，可以識別語句的含義，實現與使用者的語言互動。　　問答場景屬於一種典型的互動場景，機器可以對用戶的提問進行針對性的答覆。在答覆前，機器需要能夠識別出提問的用戶意圖，以及該提問的具體含義才能夠準確地給出該問題的答案。　　傳統方式中，針對使用者的提問，機器主要將該提問中包括的文字作為識別該提問使用者意圖的依據，但是有些情況下識別出的使用者意圖並不準確，導致給出的答案可能並不符合用戶意圖，降低了用戶體驗。

為了解決上述技術問題，本發明提供了一種語句的用戶意圖識別方法，解決了傳統的識別方法中準確率較低的問題，提高了用戶體驗。　　本發明實施例揭示了如下技術方案：　　第一態樣，本發明實施例揭示了一種語句的用戶意圖識別方法，應用於人機互動會話中，人機互動會話中包括多條語句，該方法包括：　　從多條語句中獲取待分析語句，以及待分析語句對應的至少一條歷史語句，至少一條歷史語句為在人機互動會話中先於待分析語句出現的語句；　　根據待分析語句的句向量和至少一條歷史語句的句向量來確定出待分析語句的歷史向量，歷史向量中包括至少一條歷史語句中與待分析語句相關的資訊；　　根據歷史向量來確定待分析語句的用戶意圖。　　可選地，待分析語句包括多條，多條待分析語句為多條語句中在互動順序下的最後多條語句。　　可選地，至少一條歷史語句與待分析語句間的語句間隔少於預設閾值。　　可選地，當至少一條歷史語句包括多條時，多條歷史語句包括第一歷史語句和第二歷史語句，根據待分析語句的句向量和至少一條歷史語句的句向量來確定出待分析語句的歷史向量包括：　　根據待分析語句的句向量、第一歷史語句的句向量和第二歷史語句的句向量來確定出第一歷史語句相對於待分析語句的語義相似度，以及第二歷史語句相對於待分析語句的語義相似度；　　確定出第一歷史語句和第二歷史語句在人機互動會話中與待分析語句的出現位置關係；　　根據第一歷史語句的語義相似度、第二歷史語句的語義相似度、第一歷史語句的出現位置關係和第二歷史語句的出現位置關係來確定出待分析語句的歷史向量。　　可選地，根據歷史向量來確定待分析語句的用戶意圖包括：　　根據歷史向量和待分析語句的句向量來確定出待分析語句的融合向量；　　根據融合向量來確定出待分析語句的用戶意圖。　　可選地，根據歷史向量和待分析語句的句向量來確定出待分析語句的融合向量包括：　　對歷史向量和待分析語句的句向量進行加權求和，得到待分析語句的融合向量。　　可選地，根據融合向量來確定出待分析語句的用戶意圖包括：　　將融合向量映射到預設的多個用戶意圖上；　　根據在多個使用者意圖上的映射結果，從多個用戶意圖中確定出待分析語句的用戶意圖。　　可選地，待分析語句包括至少一個分詞，在根據待分析語句的句向量和多條歷史語句的句向量來確定出待分析語句的歷史向量之後，該方法還包括：　　確定第一分詞的詞向量，第一分詞為至少一個分詞中的一個；　　根據歷史向量和第一分詞的詞向量來確定出第一分詞的融合詞向量；　　根據第一分詞的融合詞向量來確定出第一分詞的實體類型。　　可選地，當待分析語句包括多個分詞時，根據第一分詞的融合詞向量來確定出第一分詞的實體類型，包括：　　根據第一分詞的融合詞向量、第二分詞的融合詞向量和預先學習的實體類型依賴關係來確定出第一分詞的實體類型，第二分詞為多個分詞中的一個。　　第二態樣，本發明實施例揭示了一種語句的使用者意圖識別裝置，應用於人機互動會話中，人機互動會話中包括多條語句，該裝置包括獲取單元、第一確定單元和第二確定單元，其中：　　獲取單元，用以從多條語句中獲取待分析語句，以及待分析語句對應的至少一條歷史語句，至少一條歷史語句為在人機互動會話中先於待分析語句出現的語句；　　第一確定單元，用以根據待分析語句的句向量和至少一條歷史語句的句向量來確定出待分析語句的歷史向量，歷史向量中包括至少一條歷史語句中與待分析語句相關的資訊；　　第二確定單元，用以根據歷史向量來確定待分析語句的用戶意圖。　　可選地，待分析語句包括多條，多條待分析語句為多條語句中在互動順序下的最後多條語句。　　可選地，至少一條歷史語句與待分析語句間的語句間隔少於預設閾值。　　可選地，第一確定單元包括語義相似度確定子單元、位置關係確定子單元和歷史向量確定子單元，其中：　　語義相似度確定子單元，用以當至少一條歷史語句包括多條時，多條歷史語句包括第一歷史語句和第二歷史語句，根據待分析語句的句向量、第一歷史語句的句向量和第二歷史語句的句向量來確定出第一歷史語句相對於待分析語句的語義相似度，以及第二歷史語句相對於待分析語句的語義相似度；　　位置關係確定子單元，用以確定出第一歷史語句和第二歷史語句在人機互動會話中與待分析語句的出現位置關係；　　歷史向量確定子單元，用以根據第一歷史語句的語義相似度、第二歷史語句的語義相似度、第一歷史語句的出現位置關係和第二歷史語句的出現位置關係來確定出待分析語句的歷史向量。　　可選地，第二確定單元包括融合向量確定子單元和使用者意圖確定子單元，其中：　　融合向量確定子單元，用以根據歷史向量和待分析語句的句向量來確定出待分析語句的融合向量；　　使用者意圖確定子單元，用以根據融合向量來確定出待分析語句的用戶意圖。　　可選地，融合向量確定子單元具體用以：　　對歷史向量和待分析語句的句向量進行加權求和，得到待分析語句的融合向量。　　可選地，使用者意圖確定子單元包括映射子單元和確定子單元，其中：　　映射子單元，用以將融合向量映射到預設的多個用戶意圖上；　　確定子單元，用以根據在多個使用者意圖上的映射結果，從多個用戶意圖中確定出待分析語句的用戶意圖。　　可選地，該裝置還包括第三確定單元、第四確定單元和第五確定單元，其中：　　第三確定單元，用以確定第一分詞的詞向量，第一分詞為至少一個分詞中的一個；　　第四確定單元，用以根據歷史向量和第一分詞的詞向量來確定出第一分詞的融合詞向量；　　第五確定單元，用以根據第一分詞的融合詞向量來確定出第一分詞的實體類型。　　可選地，第五確定單元具體用以：當待分析語句包括多個分詞時，根據第一分詞的融合詞向量、第二分詞的詞向量和預先學習的實體類型依賴關係來確定出第一分詞的實體類型，第二分詞為多個分詞中的一個。　　在協力廠商方，本發明實施例揭示了一種用以識別語句的使用者意圖的設備，應用於人機互動會話中，人機互動會話中包括多條語句，該設備包括處理器和記憶體，其中：　　記憶體，用以儲存程式碼，並將程式碼傳輸給處理器；　　處理器，用以根據程式碼中的指令來執行以下方法：　　從多條語句中獲取待分析語句，以及待分析語句對應的至少一條歷史語句，至少一條歷史語句為在人機互動會話中先於待分析語句出現的語句；　　根據待分析語句的句向量和至少一條歷史語句的句向量來確定出待分析語句的歷史向量，歷史向量中包括至少一條歷史語句中與待分析語句相關的資訊；　　根據歷史向量來確定待分析語句的用戶意圖。　　可選地，待分析語句包括多條，多條待分析語句為多條語句中在互動順序下的最後多條語句。　　可選地，至少一條歷史語句與待分析語句間的語句間隔少於預設閾值。　　可選地，處理器用以根據程式碼中的指令來執行以下方法：　　根據待分析語句的句向量、第一歷史語句的句向量和第二歷史語句的句向量來確定出第一歷史語句相對於待分析語句的語義相似度，以及第二歷史語句相對於待分析語句的語義相似度；　　確定出第一歷史語句和第二歷史語句在人機互動會話中與待分析語句的出現位置關係；　　根據第一歷史語句的語義相似度、第二歷史語句的語義相似度、第一歷史語句的出現位置關係和第二歷史語句的出現位置關係來確定出待分析語句的歷史向量。　　可選地，處理器用以根據程式碼中的指令來執行以下方法：　　根據歷史向量和待分析語句的句向量來確定出待分析語句的融合向量；　　根據融合向量來確定出待分析語句的用戶意圖。　　可選地，處理器用以根據程式碼中的指令來執行以下方法：　　對歷史向量和待分析語句的句向量進行加權求和，得到待分析語句的融合向量。　　可選地，處理器用以根據程式碼中的指令來執行以下方法：　　將融合向量映射到預設的多個用戶意圖上；　　根據在多個使用者意圖上的映射結果，從多個用戶意圖中確定出待分析語句的用戶意圖。　　可選地，處理器還用以根據程式碼中的指令來執行以下方法：　　確定第一分詞的詞向量，第一分詞為至少一個分詞中的一個；　　根據歷史向量和第一分詞的詞向量來確定出第一分詞的融合詞向量；　　根據第一分詞的融合詞向量來確定出第一分詞的實體類型。　　可選地，處理器還用以根據程式碼中的指令來執行以下方法：　　根據第一分詞的融合詞向量、第二分詞的融合詞向量和預先學習的實體類型依賴關係來確定出第一分詞的實體類型，第二分詞為多個分詞中的一個。　　第四態樣，本發明實施例揭示了一種儲存媒體，該儲存媒體用以儲存程式碼，程式碼用以執行本發明實施例第一態樣提供的語句的用戶意圖方法。　　第五態樣，本發明實施例揭示了一種包括指令的電腦程式產品，當其在電腦上運行時，使得電腦執行本發明實施例的第一態樣提供的語句的用戶意圖識別方法。　　由上述技術方案可以看出，當需要確定待分析語句的用戶意圖時，可以從該待分析語句所在人機互動會話中確定出該待分析語句的至少一條歷史語句，並且由於人機互動一般具有一定的連續性，故人機互動會話中歷史語句的內容可能與待分析語句的內容相關，那麼結合待分析語句的句向量和至少一條歷史語句的句向量所確定出的歷史向量中可以包括歷史語句中相關內容，這些內容可以與待分析語句的內容有一定關聯，若結合該歷史向量來確定待分析語句的用戶意圖，該歷史向量包括的與該待分析語句相關的內容可以作為額外的確定依據，較多的確定依據可以提高確定待分析語句用戶意圖的準確性。

下面結合附圖，對本發明的實施例進行描述。　　目前，人工智慧技術正在如火如荼地發展，已經越來越多地應用到日常生活。例如，用戶透過與蘋果手機的siri、微軟的聊天機器人小冰等進行會話，可以實現天氣查詢、位置導航、音樂播放、問題諮詢等。除了應用到日常生活，將人工智慧技術應用到工作中，也是一大發展趨勢。使用機器人代替傳統人力，例如，物流領域使用機器人實現包裹分揀，可以有效減少人力成本，而且方便企業管理。人工智慧將會像工業時代的蒸汽機、資訊時代的電腦一樣，給社會帶來深刻的變革，給人類生活帶來嶄新的變化。　　人工智慧的一個核心，即是人機互動技術。人區別於機器的最重要的一點就是人可以獨立的思考，而機器是機械的，那麼人工智慧的目的即在於讓機器可以像人一樣思考。基於機器可以思考的前提，機器可以理解人的意圖，並對人的意圖做出回應，即實現了人和機器的互動，簡稱人機互動。因此，人機互動的發展依賴於對用戶意圖識別的準確性的提高。　　傳統的用戶意圖識別是透過對用戶目前的語句結合固定的句式，進行分析實現的。由於人類語言的靈活和多變，採用這種方法得到的用戶意圖，往往與用戶的實際意圖不符，例如，如下場景(其中，Q表示用戶提問，A表示機器回答)：　　Q1、請問明天烏魯木齊的天氣如何? 　　A1、xxx 　　Q2、那後天呢? 　　A2、xxx 　　Q3、那上海呢? 　　A3、xxx 　　在該輪對話中，機器需要識別每一個Q的意圖，也就是使用者希望透過Q中的內容表達什麼，目的是什麼。顯然第二個及第三個Q的意圖，根據傳統的方法，是難以獲得準確的結果的，需要結合歷史資訊才能準確判斷意圖。以Q3為例說明，在傳統方式中，若要獲取待分析語句“那上海呢”的意圖，一般可以根據該待分析語句的內容來進行分析，然而根據該待分析語句並不足以準確地確定出該待分析語句的意圖是什麼，有可能得到的意圖是上海的天氣如何，也可以是上海有哪些景點，顯然與該待分析語句的實際意圖“上海後天的天氣如何”有或多或少的區別。如果機器根據採用傳統方式確定的意圖來進行回覆，回覆的內容顯然與使用者想要瞭解的內容不符，造成了不好的用戶體驗。　　因此，本發明實施例提供了一種語句的使用者意圖識別方法和裝置，當需要確定待分析語句的用戶意圖時，可以從該待分析語句所在人機互動會話中確定出該待分析語句的至少一條歷史語句，並由於人機互動一般具有一定的連續性，故人機互動會話中歷史語句的內容可能與待分析語句的內容相關，那麼結合待分析語句的句向量和至少一條歷史語句的句向量所確定出的歷史向量中可以包括歷史語句中相關內容，這些內容可以與待分析語句的內容有一定關聯，若結合該歷史向量來確定待分析語句的用戶意圖，該歷史向量包括的與該待分析語句相關的內容可以作為額外的確定依據，較多的確定依據可以提高確定待分析語句用戶意圖的準確性。　　本發明的實施例主要應用於迴圈神經網路(Recurrent Neural Networks, RNN)中，透過RNN可以確定出語句的句向量。其中，本發明實施例中提到的語句可以包括一個或多個字元，根據不同的語言形式或語種，可以有多種不同的字元形式及字元組合方式。而一條語句的句向量為透過向量化的形式得到的攜帶了這條語句中所有詞的資訊的向量。舉例說明，假設輸入一條分好詞的語句，該語句有n個分詞，在經過RNN後，有n個輸出向量r₁ ……r_n-1 、r_n 分別對應所述的n個分詞，所述輸出向量可以作為該分詞的詞向量。由於RNN的記憶性，第i個分詞的輸出向量r_i 包含了該分詞之前所有分詞即r₁ 、……r_i-1 的資訊，那麼，最後一個分詞的輸出向量應當包含了該語句中所有分詞的資訊，因而，最後一個分詞的輸出向量r_n 可以作為該句子的句向量。　　在確定一條語句也就是待分析語句的用戶意圖時，本發明實施例採用了結合至少一條歷史語句的句向量的方式來確定待分析語句的用戶意圖，這裡的歷史語句是相對於待分析用戶意圖的待分析語句而確定出的。其中，待分析語句是機器需要確定出使用者意圖的語句，一般情況下，待分析語句為人機互動會話中由用戶最新輸入的語句，是需要機器回覆、回應的語句，在機器回覆較慢的情況下，待分析語句也可以是用戶輸入語句中未被機器回覆的一條語句。待分析語句可以為一條，也可以為多條。當待分析語句為多條時，多條待分析語句可以為多條語句中在互動順序下的最後多條語句。需要注意的是，在本發明實施例中出現的機器並不限定為傳統意義上的一台機器，還可以是能夠實現互動功能的軟體，或者部署了該軟體的終端、伺服器等。　　待分析語句和該待分析語句對應的歷史語句均出現在同一個人機互動會話中，在這個人機互動會話中，人機互動是一個持續的過程，而歷史語句屬於先於待分析語句出現在該人機互動會話中的語句，且歷史語句和待分析語句均屬於用戶輸入的語句。例如上述的Q1→A1、Q2→A2、Q3→A3的例子中，若機器需要分析Q2的使用者意圖，那麼Q1可以作為Q2的歷史語句，若機器需要分析Q3的使用者意圖，那麼Q1和Q2可以作為Q3的歷史語句。實施例一　　接下來結合附圖詳細說明本發明實施例提供的語句的用戶意圖識別方法。圖1為本發明實施例提供的一種語句的用戶意圖識別方法的方法流程圖，所述方法包括：　　S101：從所述多條語句中獲取待分析語句，以及所述待分析語句對應的至少一條歷史語句，所述至少一條歷史語句為在所述人機互動會話中先於所述待分析語句出現的語句。　　以上多條語句處於同一個人機互動會話中，均是由用戶輸入的。本發明實施例並不限定輸入的方式，例如可以是使用者透過鍵盤等輸入裝置手動錄入的，也可以是使用者透過語音輸入後由機器所識別出的，如語音助手siri中，需首先對語音的含義進行解析，將語音轉換為文字，進而識別使用者意圖。鑒於語音解析並非本發明所要解決的技術問題，本發明實施例均以文字形式的語句為例，來說明本發明中用戶意圖識別的技術方案。　　在上述查詢天氣的應用場景中，假如使用傳統方式來確定待分析語句，一般可以結合待分析語句本身的語法結構或者語義等來確定該待分析語句的用戶意圖。若待分析語句為Q3“那上海呢”，機器可以根據Q3本身的語法結構和語義分析Q3的用戶意圖，顯然Q3中包含的內容難以讓機器準確地確定出Q3的用戶意圖。因此，在本發明實施例中，可以結合待分析語句及其對應的歷史語句來確定待分析語句的用戶意圖。透過結合至少一條歷史語句來確定待分析語句的用戶意圖，可以減少多輪對話中，由於使用者輸入資訊的不完整和省略，導致待分析語句的用戶意圖識別不準確的情況出現。　　但是，在不同的應用場景中，往往對於歷史語句條數的需求有所不同。例如，在購物網站如淘寶或京東商城中，往往會設置有客服機器人，以便於在人工客服繁忙的時候，替代人工客服回答一些詢問頻率較高的問題，如“如何退貨?”、“是否包郵”等，由於這種類型的問題往往獨立性比較高，一般2~3輪以內會話可以結束目前討論的話題，因而在這種應用場景中，可以設定待分析語句前2條用戶輸入的語句為該待分析語句對應的歷史語句。當然，在其他的應用場景中，如果人機互動會話中用戶輸入的語句較多，若需要確定待分析語句的歷史語句，可以指定向前回溯語句的數量，比如5句，則該待分析語句之前的5句用戶輸入的語句可以作為該待分析語句的歷史語句，而更前的語句可以忽略。指定回溯語句的數量可以縮減歷史語句的數量，有效降低後續歷史語句關聯計算的複雜程度，提升計算效率，從而更快、更準確地識別戶用戶意圖，並對用戶意圖做出快速且準確的回應，帶來更好的用戶體驗。　　歷史語句的數量可以根據具體的應用場景而自行定義，當然歷史語句數量的設定也對識別的結果產生一定影響，因此在不同的應用場景中，歷史語句的數量可以是固定的，也可以是變化的，例如隨著語境的變化而變化。歷史語句的數量可以是預先設定的，也可以透過不斷地進行訓練，得到最佳化的歷史語句數量，使得在該應用場景中，識別準確度進一步提高。　　可以理解到，不同位置的歷史語句也會對待分析語句的用戶意圖識別產生一定的影響。在語義相同或相近的情況下，距離較近的歷史語句對分析語句的用戶意圖識別影響較大，距離較遠的歷史語句對分析語句的用戶意圖識別影響較小。當歷史語句的位置遠到一定程度，該歷史語句對待分析語句的用戶意圖識別的影響可以忽略不計。該位置的歷史語句與待分析語句間的語句間隔可以被設定為預設閾值。在本發明實施例一種可能的實施方式中，為了提高使用者意圖識別準確率，可以設定至少一條歷史語句與待分析語句間的語句間隔少於預設閾值。其中，預設閾值可以根據經驗來進行設定。　　S102：根據所述待分析語句的句向量和所述至少一條歷史語句的句向量來確定出所述待分析語句的歷史向量。　　所述歷史向量是根據待分析語句的句向量和至少一條歷史語句的句向量所計算得到的一個向量，可以視為對應於待分析語句和歷史語句的句向量，歷史向量包含的資訊不僅可以體現出至少一條歷史語句與待分析語句相關的資訊，也還可以一定程度上體現出待分析語句的資訊。　　本發明對於歷史向量的計算過程並未做限定，歷史向量的計算可以是將待分析語句的句向量和歷史語句的句向量相加，也可以是其他計算方式。例如待分析語句的句向量是m_n ，歷史語句的句向量分別是m₁ -m_n-1 ，則歷史向量可以是二者相加，結果為m₁ +…m_n-1 +m_n 。　　S103：根據所述歷史向量來確定所述待分析語句的用戶意圖。　　由於歷史向量中攜帶的資訊可以體現待分析語句的資訊，也可以體現出至少一條歷史語句與該待分析語句相關的資訊，故若機器透過該歷史向量來確定該待分析語句的用戶意圖，可以有更多的且有效的可參考資訊，使得對待分析語句的用戶意圖識別更為準確。在多輪對話中，基於使用者意圖更準確的基礎，機器可對用戶輸入的待分析語句做出更精準的回應，給用戶帶來更好的體驗。　　在本發明的實施例中，如何根據所述歷史向量來確定所述分析語句的用戶意圖不做限定。一般情況下，使用者意圖的種類是有限的，也是可以預先總結得到的。那麼在根據歷史向量來確定待分析語句的用戶意圖時，可以透過一定規則將歷史向量映射到預先獲取的多種用戶意圖上，若某一種用戶意圖在映射中得分或分類最高，那麼可以將這種用戶意圖作為該待分析語句的用戶意圖。　　針對S103，由於歷史向量中並不能完全體現出待分析語句的資訊，故為了能夠更準確地確定出待分析語句的用戶意圖，本發明實施例還提供了一種可選的實施方式。在本實施方式中，可以先根據歷史向量和待分析語句的句向量來確定出待分析語句的融合向量，再根據該融合向量來確定待分析語句的用戶意圖。例如歷史向量為h，目前待分析語句的句向量為u，可對歷史向量h和待分析語句的句向量u進行融合，得到融合向量o，融合的方式可以是簡單地將兩個向量相加，或者根據對意圖識別的影響而分別賦予一個權重來進行加權求和，也可以是其他的融合方式。在本發明的實施例中，為了便於理解，以將兩個向量相加的方式來進行說明，即o=h+u。得到融合向量後，可以透過一定規則將融合向量映射到預先獲取的多種用戶意圖上，若某一種用戶意圖在映射中得分或分類最高，那麼可以將這種用戶意圖作為該待分析語句的用戶意圖。　　下面結合圖2，對透過融合向量映射而得到用戶意圖進行介紹。　　在圖2中融合向量有兩個，分別為o₁ 和o₂ 。其中，針對待分析語句1計算出的融合向量為o₁ ，針對待分析語句2計算出的融合向量為o₂ ，預先獲取的可能的用戶意圖有n種，分別以x₁ 、x₂ ……x_n 表示，機器將o₁ 和o₂ 分別映射到這n種用戶意圖上，得到各種使用者意圖的分數，o₁ 和o₂ 對應各種使用者意圖的分數分別為b₁₁ 、b₁₂ ……b_1n 和b₂₁ 、b₂₂ ……b_2n ，其中，分數值最高的意圖即為待分析語句的用戶意圖。需要說明的是，融合向量向預先獲取的不同用戶意圖映射可以有不同的權值，該權值可以透過對機器進行訓練而得到。　　意圖獲取模組中有多個意圖類別，分別用x₁ 、x₂ ……x_n 進行表示。映射模組將o₁ 和o₂ 分別映射到x₁ 、x₂ ……x_n 上，並得到x₁ 、x₂ ……x_n 的分數，意圖獲取模組選取其中分數最大的即為目前語句的意圖，例如針對o₁ 的映射，x2的分數最大時，x2即為待分析語句1的用戶意圖。　　上述實施例透過對待分析語句和至少一條歷史語句的句向量進行計算，確定待分析語句的歷史向量，根據待分析語句的歷史向量來確定用戶意圖。相較於現有技術，該方法充分考慮了歷史語句攜帶的與待分析語句相關的資訊，使得使用者意圖的識別更為準確。　　需要說明的是，在S102中，需要根據所述待分析語句的句向量和至少一條歷史語句的句向量來確定所述待分析語句的歷史向量。在計算時，需要考慮到不同歷史語句與待分析語句的相關程度。其中，不僅需要考慮到歷史語句與待分析語句間的語義相似度，也需要考慮到歷史語句在人機互動會話中與待分析語句間的距離。　　一般來說，在人機互動過程中，互動的內容可以包括針對一個話題的持續過程，由於在討論同一個話題，使用者輸入的語句都可以與該話題相關，且先後輸入的語句之間也可以具有一定的相關性，故討論同一個話題的語句之間的語義相似度一般會較高。而且，由於正常互動一般具有連貫性，但連貫性並不會持續很長，故一般與待分析語句較近的歷史語句和該待分析語句更為相關，更有可能是在討論同一件事情或同一個話題，而與待分析語句較遠的歷史語句有可能與該待分析語句的相關性很低，很可能該歷史語句是在討論不同的事情或不同的話題。　　所以在人機互動會話中離待分析語句更近的歷史語句在意圖識別上會有更大的影響。當然，也不能完全只考慮歷史語句與待分析語句的位置關係，需要在確定待分析語句的用戶意圖時綜合歷史語句與待分析語句間的語義相似度一起考量，可以獲得更準確的意圖識別。由此可以避免在確定待分析語句時，將與該待分析語句相距較遠、但語義相似性很高的歷史語句作為確定該待分析語句用戶意圖的主要參考，因為畢竟這種距離待分析語句較遠的歷史語句有可能與該待分析語句在討論不同的事情或不同的話題，如果將該歷史語句作為確定該待分析語句用戶意圖的主要參考的話，確定出的用戶意圖有可能與該待分析語句的實際用戶意圖不符。下面結合具體場景，舉例說明：　　Q1：請問明天烏魯木齊天氣如何? 　　A1：xxx。　　Q2：那後天呢? 　　A2：xxx。　　Q3：杭州有哪些景點? 　　A3：xxx。　　Q4：那上海呢? 　　A4：xxx。　　假設待分析語句為Q4“那上海呢”，Q1-Q3為Q4的歷史語句。由於這三個歷史語句中可以確定出2個用戶意圖，一個是查詢景點，一個是查詢天氣，可能都與Q4有關聯，如果不考慮位置關係，即查詢景點的歷史文句出現的與待分析語句更近，很有可能錯誤地將查詢天氣識別為Q4的意圖。　　考慮到歷史語句的位置關係對用戶意圖識別的影響，針對S102，本發明實施例提供了一種根據待分析語句的句向量和歷史語句的句向量來確定待分析語句的歷史向量的方式。　　下面結合圖3，對本發明實施例根據待分析語句的句向量和歷史語句的句向量來確定歷史向量的方法進行介紹。歷史語句的數量可以為一條，也可以為多條，根據待分析語句的句向量和一條歷史語句的句向量來確定歷史向量的方式與根據待分析語句的句向量和多條歷史語句的句向量來確定歷史向量的方式類似。下面主要對根據待分析語句的句向量和多條歷史語句的句向量來確定歷史向量的方式進行介紹，歷史語句的數量為一條時，可以參照歷史語句數量為多條時的方法，這裡不再贅述。　　所述多條歷史語句包括第一歷史語句和第二歷史語句，在該實施例中以第一歷史語句和第二歷史語句來舉例說明，但不限於第一歷史語句和第二歷史語句，該方法包括：　　S301：根據所述待分析語句的句向量、所述第一歷史語句的句向量和所述第二歷史語句的句向量來確定出所述第一歷史語句相對於所述待分析語句的語義相似度，以及所述第二歷史語句相對於所述待分析語句的相似度。　　所述語義相似度是一個從語義角度表徵兩條語句間關聯程度的概念。例如，第一歷史語句相對於所述待分析語句的語義相似度的高低，即表示從語義角度上，第一歷史語句與待分析語句的關聯程度上的高低，該語義相似度可以透過所述第一歷史語句的句向量和所述待分析語句的句向量來加以確定。　　本發明實施例對所述第一歷史語句、第二歷史語句相對於所述待分析語句的語義相似度的確定方式並未限定，一個可行的實施方式是找出多條歷史語句關於待分析語句的關聯程度的分佈。　　例如，所述待分析語句的句向量為u，歷史語句的句向量為m_i ，具體到本發明實施例，第一歷史語句、第二歷史語句的句向量可以分別為m₁ 、m₂ ，歷史語句相對於待分析語句的語義相似度為p_i ，可得到一個歷史語句相對於待分析語句語義相似度的分佈，即pi=softmax(m_i u^T )，m_i u^T 表示歷史語句的句向量與目前待分析語句的句向量的內積。其中，T在這裡表示轉置的意思，表示句向量轉置後的向量，即將原來的行向量形式轉化為列向量的形式。softmax函數的作用是歸一化，使得，其中，歸一化的作用是為了更直觀地顯示語義相似度的結果，在本發明的其他實施例中，也可以不進行歸一化，亦即，語義相似度的另一個分佈為p_i =m_i u^T ，是否進行歸一化，並不影響本發明實施例的實現。　　計算語義相似度的一個較佳實施方案是選擇python的numpy包或者Java的Jama包進行m_i u^T 的矩陣計算，其中，python和Java均是一種程式語言，numpy包和Jama包為對應的程式語言下的進行向量或矩陣運算的類的集合。然後可以調用softmax函數進行歸一化處理，p_i 值越大，表示歷史語句i與待分析語句的關聯程度越高，歷史語句i與待分析語句在語義上越相似，反之，p_i 值越小，表示歷史語句i與待分析語句的關聯程度越低，歷史語句i與待分析語句越不相似。　　透過歷史語句的句向量與待分析語句的句向量的內積計算語義相似度，一方面充分考慮了歷史資訊，對各個歷史語句的句向量可以同步計算，另一方面內積的矩陣計算可以直接調用函數實現，實現過程比較簡單，提升了計算效率，可以快速得到語義相似的結果。　　S302：根據所述第一歷史語句的相似度、第二歷史語句的相似度、第一歷史語句出現的位置關係和第二歷史語句出現的位置關係來確定出所述待分析語句的歷史向量。　　所述位置關係可以用來表徵歷史語句與待分析語句在人機互動會話中的距離遠近，從位置關係角度考慮，與待分析語句越近的歷史語句，對用戶意圖識別的影響越大。結合位置關係來計算歷史向量，可以使用戶意圖識別的結果更為準確，如果忽略歷史語句的位置關係，當歷史語句中有兩個以上語義相似度相當的歷史語句時，可能會導致用戶意圖識別的準確性降低。　　位置關係可以透過多種方式來體現，可以是目前的歷史語句與待分析語句的行數的差值，也可以是其他的表現形式，位置關係的體現方式並不影響本發明實施例的實現。　　一種可行的體現位置關係的實施方式是，以pos_i 表示第i個歷史語句在人機互動會話中相對於待分析語句的位置，q_i 表示位置關係，q_i =softmax(pos_i )。當然，也可以不進行歸一化，歸一化進行與否並不影響本發明實施例的實現。舉例說明，在查詢烏魯木齊天氣的場景中，“請問/明天/烏魯/木齊/天氣/如何”為第一個歷史問句，pos₁ =0，依此類推，第二個、第三個歷史語句中，pos₂ =1，pos₃ =2，依據q_i =softmax(pos_i )進行計算，可得到q₁ =0.09，q₂ =0.24，q₃ =0.67。從這個例子可以看出，歷史語句距離待分析語句越近，位置關係的權重越高。本發明實施例中並不限定如何設定pos_i 的數值，只要能夠體現歷史語句與待分析語句間的位置關係即可。　　根據所述第一歷史語句的相似度、第二歷史語句的相似度、第一歷史語句出現的位置關係和第二歷史語句出現的位置關係來確定出所述待分析語句的歷史向量。本發明對所述確定歷史向量過程不做限定，可以是所述語句的語義相似度與所述的位置關係相加，也可以是所述語句的語義相似度與所述的位置關係相乘，或者是其他的計算方式。　　一種可行的計算歷史向量的實施方式是，對歷史語句相對於待分析語句的相似度和該歷史語句對應位置關係取平均值，作為所述歷史語句句向量的係數。為了方便表述及後續引用，該係數用ɑ_i 來表示，歷史語句m_i 對於待分析語句u的語義相似度為p_i ，位置關係為q_i ，則歷史語句的句向量m_i 的係數ɑ_i =(p_i +q_i )/2，然後將對該歷史向量m_i 及其係數ɑ_i 的乘積進行求和，得到歷史向量，以h來表示所述歷史向量，可得到歷史向量計算公式如下：　　 h=歷史語句的句向量的係數需結合語義相似度和位置關係來進行計算，僅僅考慮語義相似度或僅僅考慮位置關係，都會導致使用者意圖識別不準確的情況出現。忽略位置關係，當所述會話中有至少2個語義相似度相當的歷史語句時，如果將距離待分析語句較遠的歷史語句作為主要參考依據的話，確定出的用戶意圖很可能與用戶實際意圖不符。忽略語義相似度，僅考慮位置關係，將距離待分析語句更近的歷史語句作為主要參考依據，若該距離更近的歷史語句與待分析語句在語義上相似度較低，很可能導致確定的用戶意圖與用戶實際意圖不符。因此，在計算歷史向量時應充分考慮歷史語句相對於待分析語句的語義相似度和位置關係，亦即，應當根據歷史語句相對於待分析語句的語義相似度和位置關係來確定歷史語句的句向量的係數。應當明確的是，歷史向量h實際是對各個歷史語句的句向量所包含的有用資訊的濃縮，權重越大，即ɑ_i 越大的歷史語句的句向量對整個歷史向量的影響越大，而歷史向量直接影響著用戶意圖識別的結果，因此係數ɑ_i 的精確計算顯得尤為重要。　　在本發明的其他實施方式中，也可以不採用均值計算，可以對語義相似度和位置關係分別賦予一個權重並進行求和，也可以是相乘，或者是其他的計算方式，歷史語句的句向量的係數的計算方式並不影響本發明實施例的實現。取平均值是為了便於計算，具體到實際的應用場景中，可以根據場景的特點，建立相適應的數學模型，並定義不同的參數。該參數也可以是預先設定的，也可以是經過反復的訓練和最佳化而得到的。透過訓練和最佳化得到的參數，可以使歷史向量計算得更為準確，進而提高用戶意圖識別的準確度，從而給用戶帶來更好的體驗。　　上述實施例透過結合歷史語句相對於待分析語句的語義相似度和位置關係來計算歷史向量，並根據所述歷史向量來確定所述用戶意圖，降低了僅考慮語義相似度或位置關係而導致得到的用戶意圖與用戶實際意圖不符的風險，使得用戶意圖識別更為準確，機器可以根據更準確的意圖，做出精準的回應，給用戶帶來更好的體驗。實施例二　　在本實施例中，將主要針對如何對語句中的分詞進行實體標注來進行說明。本實施例中的方案可以基於實施例一的基礎上實施，也可以在確定出待分析語句的歷史向量之後實施。　　在本發明的實施例中，為了做出準確的應答，除了要識別用戶的意圖，還要對使用者提問中的實體進行識別並標注，具體到上述查詢天氣的應用場景，實體標注如下表：表一　　表中第一行為對語句進行分詞，第二行為標注，BIO體系中，B標識實體開始，I標識實體中部，O無意義。對上述實體進行標注後，可做出類似如下的回應：　　Q1、請問明天烏魯木齊的天氣如何? 　　A1、明天烏魯木齊多雲轉晴，氣溫12到20度。　　Q2、那後天呢? 　　A2、後天烏魯木齊陰天，氣溫12到18度。　　Q3、那上海呢? 　　A3、後天上海小雨，氣溫15度到17度。　　顯然上述實體標注，也需要結合歷史語句的語義，否則無法準確回答Q2和Q3。　　除了需要考慮歷史語句語義，還要考慮其位置關係，不同位置的歷史語句可能產生不同的結果。考慮如下場景：　　Q、趙薇演過什麼電影? 　　A、…… 　　Q、那周杰倫呢? 　　Q、許嵩唱過什麼歌? 　　A、…… 　　Q、那周杰倫呢? 　　這兩輪多輪對話中，均有“那周杰倫呢?”，如果不考慮歷史資訊，將完全不知道該怎麼標注“周杰倫”這個詞，但如果考慮了歷史資訊，同時結合歷史資訊的位置，模型則能很清楚地把第一個周杰倫標注為B-Actor，第二個標注為B-Singer。如果不考慮位置，則有可能將第二輪對話中的周杰倫錯誤地標注為B-Actor。　　基於與用戶意圖識別相同的理由，未結合歷史語句語義以及歷史語句的位置資訊，導致傳統方式的實體標注準確率也相對較低。除此之外，由於意圖識別和實體標注是分開進行，無法共用資源，也無法同步進行意圖識別和實體標注，使得機器需要花費雙倍的時間分別進行意圖識別和實體標注，導致資源浪費、效率低下。　　考慮到實體標注在多輪會話中回應用戶意圖的作用，本發明的另外一個實施例提供了一種根據待分析語句的句向量和所述多條歷史語句的句向量來確定待分析語句的歷史向量之後，確定待分析語句中分詞的實體類型的方法。　　下面結合圖4，對本發明實施例確定待分析語句的分詞的實體類型進行介紹，所述確定待分析語句的分詞的實體類型，所述待分析語句包括至少一個分詞，為方便後續引用以及對方案進行介紹，以第一分詞的實體類型確定來進行說明，第一分詞為所述至少一個分詞中的一個，與其他分詞之間不存在順序關係，其他分詞的實體類型確定過程與第一分詞相同，不再贅述。在透過S102確定出待分析語句的歷史向量之後，該方法包括：　　S401：確定第一分詞的詞向量。　　因此，標注語句中包含分詞的實體類型前，首先需要將語句分解得到至少一個分詞。所述分詞可以是有含義的實體，也可以是無含義的輔助詞。而分詞是一個相對抽象的概念，機器理解相對比較困難，故將分詞轉化為一個機器可以理解的概念是非常有必要的。所述機器可以理解的概念可以是詞向量，一個分詞的詞向量是以向量的形式對該分詞進行轉換得到的，它包含了該分詞的所有資訊，或者，當該分詞所在語句中，在該分詞前還有其他分詞，那麼該分詞的詞向量除了包含該分詞的所有資訊外，還可以包含該其他分詞的所有資訊。　　在本發明實施例中，詞向量可以是分詞透過RNN編碼而得到的，由於RNN的記憶性，語句的最後一個分詞包含了前面所有分詞的資訊，最後一個分詞的詞向量可以作為該語句的句向量。具體而言，若目前待分析語句中有n個分詞，n為大於等於1的正整數，經過RNN編碼可得到詞向量c₁ 、c₂ ……c_n 。　　在對分詞進行RNN編碼之前，可以先將分詞進行編碼，將分詞映射到固定維度的空間，在該空間內，相近含義的分詞距離較近，可以更佳地表達語義。在本發明實施例中，採用的是Word2vec編碼方式，也可以採用其他編碼方式如one-hot編碼，編碼方式並不影響本發明實施例的實施。　　S402：根據所述歷史向量和所述第一分詞的詞向量來確定出所述第一分詞的融合詞向量。　　所述歷史向量即S102和/或S202的向量中所述的歷史向量，所述歷史向量的獲取方式與第一實施例和第二實施例相同，這裡不再贅述；所述第一分詞的詞向量即S401中的詞向量；所述融合詞向量即對目前詞向量所攜帶的資訊與歷史向量所攜帶的資訊進行整合而得到的一個新的向量，其中，對歷史向量攜帶資訊和目前詞向量攜帶資訊進行整合可以理解為聚合有效的可參考資訊，剔除無關資訊。　　所述融合是一個將歷史向量與目前詞向量的資訊進行整合的過程，融合的方式是多樣的，本發明對此不做限定，可以是將向量相加進行融合，也可以透過向量的內積或者矩陣的方式來進行融合，也可以是其他對資訊進行整合的方式，融合的方式並不影響本發明實施例的實現。　　確定融合向量的作用在於整合歷史向量和目前詞向量所攜帶的資訊，以便於結合歷史資訊對目前分詞，即第一分詞進行分類，或者說確定實體類型，避免現有技術中只考慮本句，不結合上下文對分詞進行標注產生的準確率較低的問題。另一方面，融合詞向量是根據歷史向量來計算的，而歷史向量在用戶意圖的識別過程中已經計算過，在確定實體類型時可以直接使用，實現了資源分享。此外，使用者意圖識別和實體類型標注的過程互不干擾，可以同步進行，提升了計算效率，縮短了回應用戶的時間，使得用戶體驗效果更佳。　　舉例說明，目前待分析語句共有3個分詞，所述分詞的詞向量分別為c₁ 、c₂ 、c₃ ，歷史向量為h，所述3個分詞對應的融合向量可以是c₁ +h、c₂ +h、c₃ +h。融合詞向量的過程可以與用戶意圖識別過程中融合向量的過程同步進行，從而提升計算效率。當然，例子中的融合詞向量是為了方便講述，進行簡單的相加而得到的一個融合詞向量。具體到實際應用中，可根據不同應用場景，建立不同的融合模型，以便得到更為準確的融合詞向量，進而更準確地確定分詞實體類型。　　S403：根據所述第一分詞的融合詞向量來確定出所述第一分詞的實體類型。　　根據所述第一分詞的融合詞向量來確定出所述第一分詞的實體類型可以視為在多個實體類型中，結合融合詞向量攜帶的資訊，確定與所述第一分詞關聯程度最高的實體類型。所述關聯程度可以是結合了詞義和位置關係得到的關聯程度。　　透過所述融合詞向量來確定所述第一分詞的實體類型的作用在於結合融合詞向量中的歷史資訊，可以更準確地確定分詞的實體類型，以克服現有技術中，未結合上下文導致的對實體類型錯誤地標注的缺點。　　具體到本發明實施例，可以將融合詞向量透過映射模組，映射到不同的實體類型模組上，並得到各個實體類型模組的分數，其中，分數最高的模組的實體類型即為所述第一分詞的實體類型。確定所述第一分詞的實體類型的方式並不局限於映射，也可以採用其他方式來確定實體類型，確定方式並不影響本發明實施例的實現。　　舉例說明，一個分詞的融合詞向量為o₁ =c₁ +h，預先獲取的可能的實體類型有n種，分別以x₁ 、x₂ ……x_n 來表示，例如可以包括B-day，B-place，B-singer等。機器將融合詞向量o₁ 映射到這n種實體類型上，得到各種實體類型的分數，o₁ 對應各種實體類型的分數分別為b₁₁ 、b₁₂ ……b_1n ，對各種實體類型的分數分別進行求和，其中，分數值最高的實體類型即為該分詞的實體類型。　　S403中從多個實體類型中確定一個實體類型的工作量相對較大，在具有多個分詞的語句中，這裡以包括第一分詞和第二分詞的語句為例，若所述第一分詞在第二分詞之後，所述第二分詞的類型為O，表示無含義的意思，那麼根據“O後面肯定是O或者B，不可能是I”這樣的依賴關係，排除了第一分詞類型為I的狀況，如果仍然按照步驟S303則浪費了不必要的時間，還有可能得出錯誤的結果，降低了效率。　　為了克服具有多個分詞的語句中因忽略了分詞之間的實體類型的依賴關係而導致實體類型識別準確率以及效率較低的問題，可以對S403做出如下改進：　　根據所述第一分詞的融合詞向量、第二分詞的融合詞向量和預先學習的實體類型依賴關係來確定出第一分詞的實體類型。　　根據融合詞向量來確定實體類型實質上是一個結合融合詞向量從多個實體類型中選擇與所述分詞關聯程度最高的實體類型的過程。那麼，根據預先學習的實體類型依賴關係，則可以先降低選擇的範圍，減少了計算量，降低了模型的複雜程度，提升了效率，進而可以進一步縮短回應時間，帶來更好的用戶體驗。3秒鐘和10分鐘的回應時間給用戶帶來的體驗顯然存在有巨大的差異，因此增加實體類型依賴關係，對確定實體類型有很大的提升。　　本領域普通技術人員可以理解：實現上述方法實施例的全部或部分步驟可以透過程式指令相關的硬體來完成，前述程式包括與所述方法步驟相對應的功能模組，該程式在執行時，執行包括上述方法實施例的步驟。　　所述程式可以包括如圖5所示的詞編碼模組501、歷史記憶元件502、目前語句處理元件503、關聯計算元件504、意圖識別元件505，為了進行實體標注，還可以增加實體標注元件。當然，在本發明其他的實施方式中也可採用其他的功能模組執行上述方法實施例的步驟，本發明對此不做限定。　　所述詞編碼模組主要對語句的分詞進行編碼，以便於歷史記憶元件和目前語句處理元件對編碼後的分詞進行RNN編碼，分別得到歷史語句的句向量和待分析語句的句向量。其中，歷史記憶元件還可以指定向前回溯語句的數量，在待分析語句所在的會話中，用戶輸入語句較多時，指定回溯數量，例如指定回溯數量為5句，那麼待分析語句之前的5句作為待分析語句的歷史語句，5句以前的語句將被忽略，不進行RNN編碼，歷史語句數量的減少可有效降低歷史向量計算的複雜程度，從而提升計算效率。關鍵計算元件，一方面，根據歷史記憶元件中的歷史語句的句向量和目前語句處理元件的待分析語句的句向量而得到歷史語句與待分析語句的語義相似度，另一方面對各歷史語句的位置進行編碼，得到位置權重，將所述語義相似度和所述位置權重進行融合而得到歷史向量。為了更直觀地顯示歷史向量，還可以對歷史向量進行歸一化。所述關聯計算元件實際上在執行步驟S102或步驟S201+S202。所述意圖識別元件根據關聯計算元件中的歷史向量和目前語句處理中的待分析語句的句向量，從多個意圖中識別出目前待分析語句的用戶意圖，即執行所述步驟S103。　　為了實現實體標注功能，該程式還可以在上述基礎上增加實體標注元件。如圖6所示，實體標注元件606分別與關聯計算元件504和目前語句處理元件503相連，關聯計算元件504輸出的歷史向量以及目前語句處理元件503輸出的詞向量可以作為實體標注元件606的輸入。　　下面結合圖7對歷史記憶元件進行描述，歷史記憶元件結構如下：　　歷史記憶元件主要分為3個模組，包括：歷史語句輸入模組、編碼器模組、句向量輸出模組。將待分析語句的歷史語句輸入到歷史語句輸入模組，編碼器對歷史問句進行RNN編碼，句向量輸出模組將編碼器編碼後得到的句向量輸出。　　下面以查詢天氣的應用場景為例，對歷史記憶元件進行說明：　　首先，輸入歷史語句：　　s1：請問明天烏魯木齊天氣如何? 　　s2：那後天呢? 　　s3：杭州有哪些景點? 　　其次，編碼器RNN Memory Encoder對輸入的歷史問句進行編碼，得到各歷史問句的輸出向量m1，m2，m3；　　最後，句向量輸出模組輸出歷史語句的句向量m1，m2，m3。　　下面結合圖8對目前語句處理元件進行描述，目前語句處理元件結構如下：　　目前語句處理元件主要分為3個模組，包括：目前語句輸入模組、編碼器模組、詞向量輸出模組。將已經分詞的待分析語句輸入到目前語句輸入模組，編碼器模組對目前語句，即待分析語句進行迴圈神經網路編碼，得到各分詞對應的詞向量，其中，最後一個詞向量即為目前語句的句向量。　　下面以查詢天氣中的語句“那上海呢”為例，對目前語句處理模組進行說明：　　首先，輸入已經分好詞的目前語句：　　那/上海/呢? 　　其次，編碼器對輸入模組中的分詞進行迴圈神經網路編碼，得到各分詞對應的詞向量，即c1，c2，c3；　　最後，輸出模組將目前語句中各分詞對應的詞向量進行輸出，需要說明的是，c3也是該語句的句向量。　　下面對意圖識別元件進行描述：　　意圖識別元件主要分為3個模組，包括輸入模組、映射模組、意圖獲取模組。輸入模組中輸入攜帶有目前語句歷史資訊的融合向量，融合向量經過投射模組後，映射到意圖獲取模組中的各個類別上，意圖獲取模組根據各個類別的分數來進行判斷，並確認用戶意圖。其中，映射模組為意圖識別元件的核心模組，下面結合圖2對映射模組進行介紹。　　舉例說明，圖2中有兩個融合向量，分別為o₁ 和o₂ 。意圖獲取模組中有多個類別，分別用x1、x2……xn進行表示。映射模組將o₁ 、o₂ 分別映射到x1、x2……xn上，並得到x1、x2……xn的分數，意圖獲取模組選取其中分數最大的即為目前語句的意圖，例如針對融合向量o₁ ，x2的分數最大時，x2即為該待分析語句的用戶意圖。　　所述實體標注元件實際上在執行步驟S302和S303，步驟S301是由目前語句處理元件執行的。所述實體標注元件根據目前語句處理元件中的詞向量與關聯計算元件中的歷史向量，得到融合詞向量，進而根據融合詞向量來確定分詞的實體類型。　　下面結合圖9對實體標注元件進行描述，實體標注元件結構如下：　　實體標注元件主要分為，包括目前語句輸入模組、編碼器模組、詞向量輸出模組、融合詞向量模組、全連接模組、CRF模組、實體標注模組。目前語句輸入模組輸入的是已經分好詞的目前語句，目前語句輸入模組、編碼器模組、詞向量輸出模組與目前語句處理元件可共用，融合詞向量模組將詞向量和歷史向量進行融合，得到融合詞向量。全連接模組對融合詞向量的特徵進行組合，組合後的特徵進入CRF模組，學習全域特徵與標注結果之間的網路影響，即實體之間的依賴關係，例如“O後面肯定是O或者B，不可能是I”，並輸出各個詞最終的一個標注得分，系統選擇一個最高得分的標注作為目前詞的最終標注。　　基於上述實施例提供的語句的用戶意圖識別方法，本發明實施例還提供了一種語句的使用者意圖識別裝置，應用於人機互動會話中，人機互動會話中包括多條語句，該裝置包括獲取單元1001、第一確定單元1002和第二確定單元1003，其中：　　獲取單元1001，用以從多條語句中獲取待分析語句，以及待分析語句對應的至少一條歷史語句，至少一條歷史語句為在人機互動會話中先於待分析語句出現的語句；　　第一確定單元1002，用以根據待分析語句的句向量和至少一條歷史語句的句向量來確定出待分析語句的歷史向量，歷史向量中包括至少一條歷史語句中與待分析語句相關的資訊；　　第二確定單元1003，用以根據歷史向量來確定待分析語句的用戶意圖。　　可選地，待分析語句包括多條，多條待分析語句為多條語句中在互動順序下的最後多條語句。　　可選地，至少一條歷史語句與待分析語句間的語句間隔少於預設閾值。　　可選地，第一確定單元1002包括語義相似度確定子單元、位置關係確定子單元和歷史向量確定子單元，其中：　　語義相似度確定子單元，用以當至少一條歷史語句包括多條時，多條歷史語句包括第一歷史語句和第二歷史語句，根據待分析語句的句向量、第一歷史語句的句向量和第二歷史語句的句向量來確定出第一歷史語句相對於待分析語句的語義相似度，以及第二歷史語句相對於待分析語句的語義相似度；　　位置關係確定子單元，用以確定出第一歷史語句和第二歷史語句在人機互動會話中與待分析語句的出現位置關係；　　歷史向量確定子單元，用以根據第一歷史語句的語義相似度、第二歷史語句的語義相似度、第一歷史語句的出現位置關係和第二歷史語句的出現位置關係來確定出待分析語句的歷史向量。　　可選地，第二確定單元1003包括融合向量確定子單元和使用者意圖確定子單元，其中：　　融合向量確定子單元，用以根據歷史向量和待分析語句的句向量來確定出待分析語句的融合向量；　　使用者意圖確定子單元，用以根據融合向量來確定出待分析語句的用戶意圖。　　可選地，融合向量確定子單元具體用以：　　對歷史向量和待分析語句的句向量進行加權求和，得到待分析語句的融合向量。　　可選地，使用者意圖確定子單元包括映射子單元和確定子單元，其中：　　映射子單元，用以將融合向量映射到預設的多個用戶意圖上；　　確定子單元，用以根據在多個使用者意圖上的映射結果，從多個用戶意圖中確定出待分析語句的用戶意圖。　　可選地，該裝置還包括第三確定單元、第四確定單元和第五確定單元，其中：　　第三確定單元，用以確定第一分詞的詞向量，第一分詞為至少一個分詞中的一個；　　第四確定單元，用以根據歷史向量和第一分詞的詞向量來確定出第一分詞的融合詞向量；　　第五確定單元，用以根據第一分詞的融合詞向量來確定出第一分詞的實體類型。　　可選地，第五確定單元具體用以：當待分析語句包括多個分詞時，根據第一分詞的融合詞向量、第二分詞的詞向量和預先學習的實體類型依賴關係來確定出第一分詞的實體類型，第二分詞為多個分詞中的一個。　　上面從模組化功能實體的角度對本發明實施例中的語句的使用者意圖識別裝置進行了描述，本發明實施例還提供了一種用以識別語句的使用者意圖的設備，下面從硬體處理的角度對本發明實施例中的用以識別語句的使用者意圖的設備進行描述。　　圖11所示為本發明實施例提供的一種用以識別語句的使用者意圖的設備，應用於人機互動會話中，人機互動會話中包括多條語句。請參照圖11，該設備1100包括處理器1102和記憶體1101，其中：　　記憶體1101，用以儲存程式碼，並將程式碼傳輸給處理器；　　處理器1102，用以根據程式碼中的指令來執行以下方法：　　從多條語句中獲取待分析語句，以及待分析語句對應的至少一條歷史語句，至少一條歷史語句為在人機互動會話中先於待分析語句出現的語句；　　根據待分析語句的句向量和至少一條歷史語句的句向量來確定出待分析語句的歷史向量，歷史向量中包括至少一條歷史語句中與待分析語句相關的資訊；　　根據歷史向量來確定待分析語句的用戶意圖。　　可選地，待分析語句包括多條，多條待分析語句為多條語句中在互動順序下的最後多條語句。　　可選地，至少一條歷史語句與待分析語句間的語句間隔少於預設閾值。　　可選地，處理器1102用以根據程式碼中的指令來執行以下方法：　　根據待分析語句的句向量、第一歷史語句的句向量和第二歷史語句的句向量來確定出第一歷史語句相對於待分析語句的語義相似度，以及第二歷史語句相對於待分析語句的語義相似度；　　確定出第一歷史語句和第二歷史語句在人機互動會話中與待分析語句的出現位置關係；　　根據第一歷史語句的語義相似度、第二歷史語句的語義相似度、第一歷史語句的出現位置關係和第二歷史語句的出現位置關係來確定出待分析語句的歷史向量。　　可選地，處理器1102用以根據程式碼中的指令來執行以下方法：　　根據歷史向量和待分析語句的句向量來確定出待分析語句的融合向量；　　根據融合向量來確定出待分析語句的用戶意圖。　　可選地，處理器1102用以根據程式碼中的指令來執行以下方法：　　對歷史向量和待分析語句的句向量進行加權求和，得到待分析語句的融合向量。　　可選地，處理器1102用以根據程式碼中的指令來執行以下方法：　　將融合向量映射到預設的多個用戶意圖上；　　根據在多個使用者意圖上的映射結果，從多個用戶意圖中確定出待分析語句的用戶意圖。　　可選地，處理器1102還用以根據程式碼中的指令來執行以下方法：　　確定第一分詞的詞向量，第一分詞為至少一個分詞中的一個；　　根據歷史向量和第一分詞的詞向量來確定出第一分詞的融合詞向量；　　根據第一分詞的融合詞向量來確定出第一分詞的實體類型。　　可選地，處理器1102還用以根據程式碼中的指令來執行以下方法：　　根據第一分詞的融合詞向量、第二分詞的融合詞向量和預先學習的實體類型依賴關係來確定出第一分詞的實體類型，第二分詞為多個分詞中的一個。　　在上述實施例中，可以全部或部分地透過軟體、硬體、韌體或者其任意組合來實現。當使用軟體來實現時，可以全部或部分地以電腦程式產品的形式來實現。　　所述電腦程式產品包括一個或多個電腦指令。在電腦上載入和執行所述電腦程式指令時，全部或部分地產生按照本發明實施例所述的流程或功能。所述電腦可以是通用電腦、專用電腦、電腦網路、或者其他可程式設計裝置。所述電腦指令可以被儲存在電腦可讀儲存媒體中，或者從一個電腦可讀儲存媒體向另一電腦可讀儲存媒體傳輸，例如，所述電腦指令可以從一個網站站點、電腦、伺服器或資料中心透過有線(例如，同軸電纜、光纖、數位用戶線路(DSL))或無線(例如，紅外線、無線、微波等)方式向另一個網站站點、電腦、伺服器或資料中心進行傳輸。所述電腦可讀儲存媒體可以是電腦能夠儲存的任何可用媒體或者是包含一個或多個可用媒體整合的伺服器、資料中心等資料儲存裝置。所述可用媒體可以是磁性媒體，(例如，軟碟、硬碟、磁帶)、光媒體(例如，DVD)、或者半導體媒體(例如，固態硬碟Solid State Disk(SSD))等。　　需要說明的是，本說明書中的各個實施例均採用漸進的方式來描述，各個實施例之間相同相似的部分互相參見即可，每個實施例重點說明的都是與其他實施例的不同之處。尤其，對於設備及系統實施例而言，由於其基本相似於方法實施例，所以描述得比較簡單，相關之處參見方法實施例的部分說明即可。以上所描述的設備及系統實施例僅僅是示意性的，其中，作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以係位於一個地方，或者也可以被分佈到多個網路單元上。可以根據實際的需要而選擇其中的部分或者全部模組來實現本實施例方案的目的。本領域普通技術人員在不付出創造性勞動的情況下，即可以理解並實施。　　以上所述，僅為本發明的一種具體實施方式，但本發明的保護範圍並不局限於此，任何熟悉本技術領域的技術人員在本發明揭露的技術範圍內，可輕易想到的變化或替換，都應涵蓋在本發明的保護範圍之內。因此，本發明的保護範圍應該以申請專利範圍的保護範圍為準。

501‧‧‧詞編碼模組

502‧‧‧歷史記憶元件

503‧‧‧目前語句處理元件

504‧‧‧關聯計算元件

505‧‧‧意圖識別元件

606‧‧‧實體標注元件

1001‧‧‧獲取單元

1002‧‧‧第一確定單元

1003‧‧‧第二確定單元

1100‧‧‧用以識別語句的使用者意圖的設備

1101‧‧‧記憶體

1102‧‧‧處理器

為了更清楚地說明本發明實施例或現有技術中的技術方案，下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發明的一些實施例，對於本領域普通技術人員來講，在不付出創造性勞動性的前提下，還可以根據這些附圖而獲得其他的附圖。　　圖1為本發明實施例提供的一種語句的用戶意圖識別方法的流程圖；　　圖2為本發明實施例提供的一種根據融合向量確定使用者意圖的示意圖；　　圖3為本發明實施例提供的一種語句的用戶意圖識別方法的方法流程圖；　　圖4為本發明實施例提供的一種待分析語句的分詞類型標注方法的流程圖；　　圖5為本發明實施例提供的一種實現語句的用戶意圖識別的程式模組圖；　　圖6為本發明實施例提供的一種實現語句的使用者識別以及實體標注的程式模組圖；　　圖7為本發明實施例提供的一種歷史記憶元件的結構示意圖；　　圖8為本發明實施例提供的一種目前語句處理元件的結構示意圖；　　圖9為本發明實施例提供的一種實體標注元件的結構示意圖；　　圖10為本發明實施例提供的一種語句的使用者意圖識別裝置的結構圖；　　圖11為本發明實施例提供的一種用以識別語句的使用者意圖的設備的結構圖。

Claims

一種語句的用戶意圖識別方法，其特徵在於，應用於人機互動會話中，該人機互動會話中包括多條語句，該方法包括：　　從該多條語句中獲取待分析語句，以及該待分析語句對應的至少一條歷史語句，該至少一條歷史語句為在該人機互動會話中先於該待分析語句出現的語句；　　根據該待分析語句的句向量和該至少一條歷史語句的句向量來確定出該待分析語句的歷史向量，該歷史向量中包括該至少一條歷史語句中與該待分析語句相關的資訊；以及　　根據該歷史向量來確定該待分析語句的用戶意圖。
根據請求項1所述的方法，其中，該待分析語句包括多條，該多條待分析語句為該多條語句中在互動順序下的最後多條語句。
根據請求項1所述的方法，其中，該至少一條歷史語句與該待分析語句間的語句間隔少於預設閾值。
根據請求項1所述的方法，其中，當該至少一條歷史語句包括多條時，該多條歷史語句包括第一歷史語句和第二歷史語句，該根據該待分析語句的句向量和該至少一條歷史語句的句向量來確定出該待分析語句的歷史向量包括：　　根據該待分析語句的句向量、該第一歷史語句的句向量和該第二歷史語句的句向量來確定出該第一歷史語句相對於該待分析語句的語義相似度，以及該第二歷史語句相對於該待分析語句的語義相似度；　　確定出該第一歷史語句和第二歷史語句在該人機互動會話中與該待分析語句的出現位置關係；以及　　根據該第一歷史語句的語義相似度、第二歷史語句的語義相似度、第一歷史語句的出現位置關係和第二歷史語句的出現位置關係來確定出該待分析語句的歷史向量。
根據請求項1至4中任意一項所述的方法，其中，該根據該歷史向量來確定該待分析語句的用戶意圖包括：　　根據該歷史向量和該待分析語句的句向量來確定出該待分析語句的融合向量；以及　　根據該融合向量來確定出該待分析語句的用戶意圖。
根據請求項5所述的方法，其中，該根據該歷史向量和該待分析語句的句向量來確定出該待分析語句的融合向量包括：　　對該歷史向量和該待分析語句的句向量進行加權求和，得到該待分析語句的融合向量。
根據請求項5所述的方法，其中，該根據該融合向量來確定出該待分析語句的用戶意圖包括：　　將該融合向量映射到預設的多個用戶意圖上；以及　　根據在該多個使用者意圖上的映射結果，從該多個用戶意圖中確定出該待分析語句的用戶意圖。
根據請求項1所述的方法，其中，該待分析語句包括至少一個分詞，在根據該待分析語句的句向量和該多條歷史語句的句向量來確定出該待分析語句的歷史向量之後，該方法還包括：　　確定第一分詞的詞向量，該第一分詞為該至少一個分詞中的一個；　　根據該歷史向量和該第一分詞的詞向量來確定出該第一分詞的融合詞向量；以及　　根據該第一分詞的融合詞向量來確定出該第一分詞的實體類型。
根據請求項8所述的方法，其中，當該待分析語句包括多個分詞時，該根據該第一分詞的融合詞向量來確定出該第一分詞的實體類型包括：　　根據該第一分詞的融合詞向量、第二分詞的融合詞向量和預先學習的實體類型依賴關係來確定出該第一分詞的實體類型，該第二分詞為該多個分詞中的一個。
一種語句的使用者意圖識別裝置，其特徵在於，應用於人機互動會話中，該人機互動會話中包括多條語句，該裝置包括獲取單元、第一確定單元和第二確定單元，其中：　　該獲取單元，用以從該多條語句中獲取待分析語句，以及該待分析語句對應的至少一條歷史語句，該至少一條歷史語句為在該人機互動會話中先於該待分析語句出現的語句；　　該第一確定單元，用以根據該待分析語句的句向量和該至少一條歷史語句的句向量來確定出該待分析語句的歷史向量，該歷史向量中包括該至少一條歷史語句中與該待分析語句相關的資訊；以及　　該第二確定單元，用以根據該歷史向量來確定該待分析語句的用戶意圖。
一種用以識別語句的使用者意圖的設備，其特徵在於，應用於人機互動會話中，該人機互動會話中包括多條語句，該設備包括處理器和記憶體，其中：　　該記憶體，用以儲存程式碼，並將該程式碼傳輸給該處理器；　　該處理器，用以根據該程式碼中的指令來執行以下方法：　　從該多條語句中獲取待分析語句，以及該待分析語句對應的至少一條歷史語句，該至少一條歷史語句為在該人機互動會話中先於該待分析語句出現的語句；　　根據該待分析語句的句向量和該至少一條歷史語句的句向量來確定出該待分析語句的歷史向量，該歷史向量中包括該至少一條歷史語句中與該待分析語句相關的資訊；以及　　根據該歷史向量來確定該待分析語句的用戶意圖。
一種儲存媒體，其特徵在於，該儲存媒體用以儲存程式碼，該程式碼用以執行請求項1至9中任意一項所述的語句的用戶意圖方法。
一種包括指令的電腦程式產品，當其在電腦上運行時，使得該電腦執行請求項1至9中任意一項所述的語句的用戶意圖識別方法。