TWI730536B - 用於問題推薦之系統及方法 - Google Patents

用於問題推薦之系統及方法 Download PDF

Info

Publication number
TWI730536B
TWI730536B TW108145114A TW108145114A TWI730536B TW I730536 B TWI730536 B TW I730536B TW 108145114 A TW108145114 A TW 108145114A TW 108145114 A TW108145114 A TW 108145114A TW I730536 B TWI730536 B TW I730536B
Authority
TW
Taiwan
Prior art keywords
question
customer
item
value
recommendation
Prior art date
Application number
TW108145114A
Other languages
English (en)
Other versions
TW202123164A (zh
Inventor
詹亞燕
童欣仁
Original Assignee
中華電信股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中華電信股份有限公司 filed Critical 中華電信股份有限公司
Priority to TW108145114A priority Critical patent/TWI730536B/zh
Application granted granted Critical
Publication of TWI730536B publication Critical patent/TWI730536B/zh
Publication of TW202123164A publication Critical patent/TW202123164A/zh

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本發明係提供一種用於問題推薦之系統,係先判定客戶的屬性識別碼以預先得知客戶欲諮詢之領域類別,比對客戶文字輸入與問題庫編訂之問題項目的相似度數值,以及分析客戶過去諮詢問題項目的模式及軌跡判定客戶可能諮詢的各問題項目之熱門度及關聯度數值,進而找出最適合的問題項目以協助客戶輸入文字客服機器人可辨識的問題推薦語句。因此,本發明可解決客戶諮詢文字客服機器人而得不到回覆的問題、提升文字客服機器人的自助服務率、且能改善客戶使用文字客服機器人的使用者經驗及效能與效率。本發明復提供一種用於問題推薦之方法。

Description

用於問題推薦之系統及方法
本發明係關於客服系統,尤其是關於一種應用於文字客服機器人之用於問題推薦之系統及方法。
隨著科技演進,客服系統亦可應用文字客服機器人,以自動化辨識客戶輸入之問題,進而與客戶交流並提供對應之服務。
然而,現有的文字客服機器人仍存在無法完整識別客戶輸入之文字語意的缺陷,造成文字客服機器人無法辨識客戶諮詢內容而無法回覆客戶問題的情形。在此情況下,客服系統仍需要真人介入以處理客戶之諮詢內容,造成文字克服機器人之自助服務率無法提高。
因此,如何有效分析客戶諮詢文字客服機器人之無法識別之問題,以協助客戶輸入可由文字客服機器人辨識之問題推薦語句,係為本領域之重要課題之一。
為解決上述之問題,本發明提供一種用於問題推薦之系統,包括:客戶屬性識別模組,係用於依據客戶之基本資訊辨識屬性識別碼;語意分析模組,係用於對該客戶之文字輸入進行語意分析,以獲得該文字輸入相較於該屬性識別碼指示之領域類別中各問題項目的相似度分析值;問題軌跡分析模組,係用於分析該客戶過去諮詢該領域類別中各該問題項目之軌跡模式,以獲得與該文字輸入關聯的各該問題項目的熱門度及關聯度數值;以及推薦預測模組,係用於根據該相似度分析值、該熱門度及該關聯度數值提供問題推薦語句。
於上述之系統中,各該問題項目係儲存於問題庫中,並且以領域類別碼區分。
於上述之系統中,該客戶屬性識別模組係進一步根據該基本資訊擷取該客戶之屬性資料,以將該屬性資料及對應之客戶屬性利用隨機森林演算法計算出該屬性識別碼,其中,該基本資訊為該客戶之電信號碼,且該屬性資料為該客戶之年齡、職業、已申辦之業務及帳單繳費紀錄。
於上述之系統中,該語意分析模組係進一步將該文字輸入依據斷詞辭典分為切詞集合,以依據贅詞辭典將該切詞集合中之贅詞去除以獲得關鍵詞集合,俾於將該關鍵詞集合轉換為詞向量集合後,將該詞向量集合利用深度學習演算法計算以獲得該文字輸入與該屬性識別碼指示之領域類別中各該問題項目的該相似度分析值。
於上述之系統中,復包括文字交談紀錄資料庫,係用於儲存該客戶過去諮詢問題使用的語句,以提供該語意分析模組將各該語句與對應之各該問題項目標註後做為該深度學習演算法的訓練資料。
於上述之系統中,復包括問題諮詢紀錄資料庫,係用於儲存該客戶過去諮詢之問題項目及次數。
於上述之系統中,該問題軌跡分析模組係進一步用以統計該問題諮詢紀錄資料庫中該屬性識別碼指示之該領域類別的各問題項目被該客戶諮詢的次數,以將各該問題項目被該客戶諮詢的次數以百分率計算而轉換為與該文字輸入關聯之該熱門度。
於上述之系統中,該問題軌跡分析模組係進一步於該問題諮詢紀錄資料庫中該屬性識別碼指示之該領域類別的各問題項目中,以共現矩陣統計前一個問題項目被諮詢後各該問題項目被該客戶諮詢之次數,再將該共現矩陣紀錄之數值以百分率計算而轉換為各該問題項目與該前一個問題項目關聯之關聯度,以及根據該客戶於該文字輸入前諮詢之問題項目,比對該共現矩陣以獲得該文字輸入與各該問題項目關聯之該關聯度數值。
於上述之系統中,該推薦預測模組係進一步用以將各該問題項目對應之該相似度分析值、該熱門度及該關連度數值以權重計算得出各該問題項目之權重數值,再將各該問題項目以該權重數值排序,俾將該權重數值高於推薦門檻數值的問題項目轉換為該問題推薦語句以作為該客戶之問題推薦。
本發明復提供一種用於問題推薦之方法,包括:根據客戶之基本資訊識別屬性識別碼;將該客戶之文字輸入進行語意分析,以獲得該文字輸入與該屬性識別碼指示之領域類別內各問題項目的相似度數值;分析該客戶諮詢該領域類別中各該問題項目之軌跡模式,以獲得與該文字輸入關聯的各該問題項目的熱門度及關聯度數值;以及根據該相似度分析值、該熱門度及該關聯度數值提供問題推薦語句。
於上述之方法中,該將該客戶之文字輸入進行語意分析之步驟係包括下列子步驟:將該文字輸入依據斷詞辭典分為切詞集合;依據贅詞辭典將該切詞集合中之贅詞去除以獲得關鍵詞集合;將該關鍵詞集合轉換為詞向量集合;以及將該詞向量集合利用深度學習演算法計算,以獲得該文字輸入相較於該屬性識別碼指示之領域類別中各該問題項目的該相似度分析值。
於上述之方法中,該分析該客戶過去諮詢該領域類別中各該問題項目之軌跡模式之步驟係包括下列子步驟:統計該屬性識別碼指示之該領域類別中各該問題項目被該客戶諮詢的次數;以及將各該問題項目被該客戶諮詢的次數以百分率計算轉換為與該文字輸入關聯之該熱門度。
於上述之方法中,該分析該客戶過去諮詢該領域類別中各該問題項目之軌跡模式之步驟係包括下列子步驟:於該屬性識別碼指示之該領域類別的各該問題項目中,以共現矩陣統計前一個問題項目被諮詢後各該問題項目被該客戶諮詢之次數;將該共現矩陣紀錄之數值以百分率計算轉換為各該問題項目與該前一個問題項目關聯之關聯度;以及根據該客戶於該文字輸入前諮詢之問題項目,比對該共現矩陣以獲得該文字輸入與各該問題項目關聯之該關聯度數值。
於上述之方法中,該根據該相似度分析值、該熱門度及該關聯度數值提供問題推薦語句之步驟係包括下列子步驟:將各該問題項目對應之該相似度分析值、該熱門度及該關聯度數值以權重計算得出各該問題項目之權重數值;將各該問題項目以該權重數值排序;以及將該權重數值高於推薦門檻數值的問題項目轉換為該問題推薦語句以作為該客戶之問題推薦。
於上述之方法中,復包括在該客戶完成諮詢後,紀錄該客戶諮詢問題使用之語句以作為該語意分析之深度學習演算法的訓練資料來源,以及紀錄該客戶諮詢之問題項目以作為該軌跡模式之統計資料來源。
綜上所述,本發明之用於問題推薦之系統及方法係於客戶向文字客服機器人諮詢時,可先判定客戶的屬性識別碼以預先得知客戶欲諮詢之領域類別,進而提升問題推薦的精準度及運算效率,且有助於後續系統之擴充的彈性。並且可藉由深度學習技術比對客戶之文字輸入與問題庫編訂之問題項目的相似度數值,進而提升文字輸入之預測的精準度。並且可藉由分析客戶過去諮詢問題項目的模式及軌跡判定客戶可能諮詢的各問題項目之熱門度及關聯度數值,使問題推薦更符合客戶的諮詢意圖,進而找出最適合的問題項目以協助客戶輸入文字客服機器人可辨識的問題推薦語句。因此本發明可解決客戶諮詢文字客服機器人而得不到回覆的問題、提升文字客服機器人的自助服務率、且改善客戶使用文字客服機器人的使用者經驗及效能與效率。
1‧‧‧客戶屬性識別模組
2‧‧‧語意分析模組
21‧‧‧文字斷詞元件
22‧‧‧文字去贅詞元件
23‧‧‧詞向量轉換元件
24‧‧‧問題預測模型元件
25‧‧‧斷詞辭典
26‧‧‧贅詞辭典
3‧‧‧問題軌跡分析模組
31‧‧‧統計元件
32‧‧‧熱門度計算元件
33‧‧‧關聯度計算元件
4‧‧‧推薦預測模組
41‧‧‧權重計算元件
42‧‧‧決策及推薦元件
43‧‧‧回饋計算元件
5‧‧‧客戶屬性資料庫
6‧‧‧文字交談紀錄資料庫
7‧‧‧問題諮詢紀錄資料庫
8‧‧‧問題庫
S101~S111‧‧‧步驟
第1圖係揭示本發明之用於問題推薦之系統之示意架構圖;
第2圖係揭示本發明之用於問題推薦之系統之局部架構圖;
第3圖係揭示本發明之用於問題推薦之系統之局部架構圖;
第4圖係揭示本發明之用於問題推薦之系統之局部架構圖;
第5圖係揭示本發明之用於問題推薦之系統之局部架構圖;以及
第6圖係揭示本發明之用於問題推薦之方法之步驟流程圖。
以下藉由特定的實施例說明本案之實施方式,熟習此項技藝之人士可由本文所揭示之內容輕易地瞭解本案之其他優點及功效。本說明書所附圖式所繪示之結構、比例、大小等均僅用於配合說明書所揭示之內容,以供熟悉此技藝之人士之瞭解與閱讀,非用於限定本案可實施之限定條件,故任何修飾、改變或調整,在不影響本案所能產生之功效及所能達成之目的下,均應仍落在本案所揭示之技術內容得能涵蓋之範圍內。
如第1圖所示,本發明之用於問題推薦之系統主要包含四大模組,包括:客戶屬性識別模組1、語意分析模組2、問題軌跡分析模組3以及推薦預測模組4等。其中,客戶屬性識別模組1係依據客服系統中的客戶屬性資料進行客戶屬性識別;語意分析模組2係用於對客戶之文字輸入進行語意分析;問題軌跡分析模組3係用於分析客戶諮詢問題之軌跡模式;以及,推薦預測模組4係用於根據語意分析模組2及問題軌跡分析模組3之分析結果提供問題推薦語句的選項並且,本發明之系統還包括問題庫8,係用於儲存預先編訂之領域類別及問題項目;文字交談紀錄資 料庫6,係用於儲存客戶過去向文字客服機器人諮詢使用的語句;以及問題諮詢紀錄資料庫7,係用於記錄客戶向文字客服機器人諮詢的問題項目與諮詢順序。上述之各元件之功能及相互關係係如以下第2至5圖之局部系統架構圖所進一步詳細描述者。
現請參考第2圖,客戶屬性識別模組1首先用於識別客戶的屬性識別碼。其係包含利用隨機森林(Random Forest)演算法建制之客戶屬性識別模型,其係藉由訓練客戶之年齡、職業、已申辦的業務、及帳單繳費記錄等屬性資料以及屬性資料對應之客戶屬性以分析出一屬性識別碼CA,屬性識別碼CA係作為稍後預測客戶可能諮詢之領域類別的基準之一。
在一實施例中,藉由上述之客戶屬性識別模組1的配置方式,客戶可在進行諮詢前於文字客服機器人輸入基本資訊(例如,客戶之電話(信)號碼),客戶屬性識別模組1即根據基本資訊擷取客服系統中關於客戶的屬性資料,並藉由訓練客戶屬性識別模組以得到客戶的屬性識別碼(本文中係以“CA”表示),此屬性識別碼CA例如可表示客戶欲諮詢之問題項目可能包含與「行動服務」之領域類別相關的內容。客戶屬性識別模組1係將屬性識別碼CA提供給語意分析模組2及問題軌跡分析模組3。
客戶屬性識別模組1另與客戶屬性資料庫5連接,係用以儲存上述客戶屬性識別模型取用之屬性資料、對應之客戶屬性及訓練之結果(即,屬性識別碼)以供未來客戶屬性識別模型再訓練的訓練資料來源。
請接續參考第3圖,語意分析模組2係用於分析客戶之文字輸入(例如,客戶輸入文字客服機器人的諮詢問題語句)以計算文字輸入與問題庫8編訂之問題項目的相似度分析數值。
由於在語言學定義中,詞是人類表達語意的最小單位,所以當語意分析模組2接收文字輸入後,係先交由文字斷詞元件21進行切詞。在本實施例中,文字斷詞元件21係將文字輸入之語句與斷詞辭典25進行比對,從語句中擷取出與斷詞辭典25相符之複數個不同字元長度的切詞組合。
舉例來說,假設客戶之文字輸入的語句為「我想要查未出帳的帳單」,經過文字斷詞元件21與斷詞辭典25之比對結果係輸出「我想要」、「查」、「未出帳」及「帳單」等切詞組合。
接著,文字去贅詞元件22係將文字斷詞元件21輸出之切詞組合與贅詞辭典26進行比對以將符合贅詞辭典26之贅詞從上述切詞組合中去除。舉例來說,經比對後文字斷詞元件21輸出之「我想要」、「查」、「未出帳」及「帳單」等切詞組合中,「我想要」為贅詞辭典26定義之贅詞,故文字去贅詞元件22將之去除並輸出「查」、「未出帳」及「帳單」之關鍵詞集合。
接著,詞向量轉換元件23係用於將文字去贅詞元件22輸出之關鍵詞轉換為具有語意邏輯之詞向量。詞向量係以在向量空間中的距離表示,其中,語意相近的詞的詞向量在向量空間的距離較近,而語意較無相關的詞的詞向量則相距較遠。經轉換後,關鍵詞的詞向量係輸入至問題預測模型元件24進行客戶問題預測。
問題預測模型元件24係建置有問題預測模型。其中,問題預測模型元件24在進行客戶問題預測前,係採用深度學習演算法,先蒐集文字交談紀錄資料庫6中紀錄的客戶過去諮詢問題使用的語句,再根據問題庫8編訂之問題項目及領域類別(其以領域類別碼MA區分)進行分類及標註以作為問題預測模型之訓練資料,並且根據問題庫8編訂之不同領域類別建置不同的問題預測模型。
當問題預測模型元件24接收到詞向量轉換元件23輸入之關鍵詞的詞向量後,係先依據客戶屬性識別模組1辨識之屬性識別碼CA以及問題庫8編訂之領域類別碼MA決定使用何種領域類別的問題預測模型。接著,問題預測模型元件24將關鍵詞之詞向量輸入至問題預測模型中進行訓練,並輸出文字輸入與問題庫8中對應之領域類別的每個問題項目的相似度分析值的集合。問題預測模型元件24係接續將此相似度分析值的集合送至推薦預測模組4進行問題推薦。
舉例來說,經問題預測模型元件24比對已知屬性識別碼CA與領域類別碼MA係教示客戶諮詢之問題項目可能包含與「行動服務」之領域類別相關的內容,且已知文字去贅詞元件22及詞向量轉換元件23分別計算之文字輸入之「查」、「未出帳」及「帳單」之關鍵詞集合及對應之詞向量。故問題預測模型元件24進一步將詞向量以「行動服務」領域之問題預測模型進行訓練,並得出文字輸入與問題庫8編訂之領域類別碼MA(此時代表「行動服務」之領域類別)範圍下各問題項目的相似度分析值為集合X={查購機方案:0.17;查漫遊資訊:0.26;查帳單:0.57}。
本發明之用於問題推薦之系統還包括與語意分析模組2平行運作的問題軌跡分析模組3。如第4圖所示,當客戶屬性識別模組1辨識出屬性識別碼CA後,統計元件31係先蒐集問題諮詢紀錄資料庫7中紀錄之客戶過去諮詢的問題項目,並依據屬性識別碼CA及問題庫8編訂之領域類別碼MA決定欲統計之領域類別的問題項目,進而統計出問題諮詢紀錄資料庫7中客戶諮詢之問題項目中,問題庫8之領域類別碼MA對應之領域類別下各問題項目的諮詢次數,即為問題項目諮詢次數統計的集合。統計元件31係將此問題項目諮詢次數統計的集合送至熱門度計算元件32。
舉例來說,當客戶之屬性識別碼CA與領域類別碼MA之比對結果表示客戶欲諮詢關於「行動服務」之領域類別的問題項目時,統計元件31係根據問題庫8編訂之問題項目統計問題諮詢紀錄資料庫7中客戶過去諮詢的問題項目,得到在「行動服務」領域類別下,客戶諮詢之問題項目之次數統計的集合Y={查購機方案:89次;查漫遊資訊:25次;查帳單:36次}。統計元件31係將此問題項目諮詢次數統計的集合(即,集合Y)送至熱門度計算元件32。
統計元件31除了統計客戶過去於某領域類別下各問題項目之總諮詢次數外,還可以共現矩陣(Co-occurrence Matrix)統計各問題項目之諮詢的關聯性。例如,統計元件31可依據問題諮詢紀錄資料庫7紀錄之客戶諮詢的問題項目依諮詢順序紀錄於共現矩陣中,如以下表一所示。其中,表一之第一列之數字係表示此客戶在諮詢「查購機方案」之問題項目(即,左方縱軸之問題項目)後諮詢「查漫遊資訊」之問題項目的次數為98次,而諮詢「查帳單」之問題項目的次數為52次,並且第二列及第三 列係以相同方式分別表達此客戶在諮詢「查漫遊資訊」及「查帳單」等問題項目後的諮詢動作。此共現矩陣係用於後續步驟提供關聯度計算單元33計算各問題項目的關聯度。
Figure 108145114-A0101-12-0011-1
熱門度計算元件32接收到統計元件31之問題項目諮詢次數統計的集合(例如,上述之集合Y)後,係將集合Y內的問題項目之次數統計轉換為諮詢次數百分率,即為各問題項目的熱門度的集合。並且其中,百分率越高即代表對應之問題項目的熱門度越高。熱門度計算元件32計算的各問題項目的熱門度的集合係於後續步驟送至推薦預測模組4進行問題推薦。
舉例來說,已知統計元件31輸入熱門度計算元件32之問題項目諮詢次數統計的集合Y={查購機方案:89次;查漫遊資訊:25次;查帳單:36次},經百分率轉換後係得到各問題項目之熱門度的集合Y’={查購機方案:0.59;查漫遊資訊:0.17;查帳單:0.24}。熱門度計算元件32係於後續步驟將此集合Y’送至推薦預測模組4進行問題推薦。
關聯度計算元件33係將統計元件31統計之各問題項目之諮詢的關聯性的共現矩陣(例如,上述之表一的共現矩陣)轉換為以百分率 呈現的關聯度數值矩陣。透過此關聯度數值矩陣,關聯度計算元件33即可根據客戶過往諮詢問題項目的順序規則,參考客戶諮詢之前一個問題項目以預測目前客戶之文字輸入可能對應之每個問題項目的機率,即為所有可能的問題項目之關聯度數值的集合。關聯度計算元件33係可將此關聯度數值的集合送至推薦預測模組4進行問題推薦。
舉例來說,關聯度計算元件33可將上述統計元件31統計之表一內容轉換為百分率形式,即客戶諮詢「行動服務」領域類別之各問題項目的關聯度數值矩陣,如以下表二所示。其中,表二第一列之數字係表示此客戶在諮詢「查購機方案」之問題項目(即,表二左方縱軸之問題項目)後諮詢「查漫遊資訊」之問題項目的機率為0.65,而諮詢「查帳單」之問題項目的機率為0.35,並且第二列及第三列係以相同方式分別表達此客戶在諮詢「查漫遊資訊」及「查帳單」等問題項目後諮詢其他問題項目的機率。
Figure 108145114-A0101-12-0012-2
此時,假設客戶先前諮詢之問題項目為「查購機方案」,關聯度計算元件33則自表二之關聯度數值矩陣中動態地找出所有可能接續於「查購機方案」後之各問題項目的關聯度數值的集合Z’={查購機方案: 0.59;查漫遊資訊:0.17;查帳單:0.24}。關聯度計算元件33係接續將此集合Z’送至推薦預測模組4進行問題推薦。
現請參考第5圖,當推薦預測模組4接收到來自語意分析模組2的相似度分析值的集合(例如,上述語意分析模組2計算之集合X)以及問題軌跡分析模組3的熱門度的集合(例如,上述問題軌跡分析模組3計算之集合Y’)及關聯度數值的集合(例如,上述問題軌跡分析模組3計算之集合Z’)後,係交由權重計算元件41進行權重計算。其中,權重計算的公式可例如為:W={問題項目1:X1‧(Y'1+1)‧(Z'1+1),問題項目2:X2‧(Y'2+1)‧(Z'2+1),問題項目3:X3‧(Y'3+1)‧(Z'3+1),…,問題項目N:XN‧(1+Y'N)‧(1+Z'N)}。其中,XN、Y’N及Z’N係分別代表集合X、集合Y’及集合Z’中對應問題項目N的相似度分析值、熱門度及關聯度數值。完成權重計算後,權重計算元件41係將各問題項目的權重數值的集合W傳送至決策及推薦元件42進行問題項目排序。
舉例來說,已知推薦預測模組4接收到來自語意分析模組2的相似度分析值的集合為X={查購機方案:0.17;查漫遊資訊:0.26;查帳單:0.57};而來自問題軌跡分析模組3的熱門度的集合為Y’={查購機方案:0.59;查漫遊資訊:0.17;查帳單:0.24};並且來自問題軌跡分析模組3的關聯度數值的集合為Z’={查購機方案:0.59;查漫遊資訊:0.17;查帳單:0.24}。而經權重計算元件41帶入權重計算公式計算後(即,W={查購機方案:0.17‧1+0.59‧1+0,查漫遊資訊:0.26‧1+0.17‧1+0.65,查帳單:0.57‧1+0.24‧1+0.35})的各問題項目的權重數值的集合則為W={查購機方案:0.2703,查漫遊資訊:0.50193,查帳單:0.95418}。權重計算元 件41係接續將各問題項目的權重數值的集合W傳送至決策及推薦元件42進行問題項目排序。
決策及推薦元件42係用於將問題項目(例如,上述之集合W內的各問題項目)依權重計算元件41計算的權重數值排序,並設定推薦門檻數值選擇欲推薦給客戶的問題項目,接著,將選擇之問題項目對應問題庫8之編定內容將之轉換為文字客服機器人可辨識之問題推薦語句並作為問題推薦的內容顯示(例如,顯示於文字克服機器人的顯示螢幕上),以供客戶選擇。
舉例來說,決策及推薦元件42可先將權重計算元件41計算之集合W內的問題項目依權重數值由高至低進行排序,接著依設定之推薦門檻數值(此時假設為0.9)選擇「查帳單」之問題項目(其權重數值為0.95418)作為欲推薦給客戶的問題項目。接著,決策及推薦元件42係依據問題庫8的編訂內容,將問題項目「查帳單」轉換為文字客服機器人可辨識之問題推薦語句「我想要查詢帳單」並顯示於文字客服機器人的顯示螢幕上以供客戶選擇。
回饋計算元件43係用於在客戶完成向文字客服機器人的諮詢後,將完整的交談內容回饋(記錄)至文字交談紀錄資料庫6及問題諮詢紀錄資料庫7中。例如,由文字交談紀錄資料庫6記錄客戶向文字客服機器人諮詢使用的語句,並由問題諮詢紀錄資料庫7記錄客戶向文字客服機器人諮詢的問題項目與諮詢順序。藉由回饋計算元件43的回饋,可精進語意分析模組2及問題軌跡分析模組3在下一輪客戶進行諮詢時對客戶之文字輸入做出更精準的分析及預測,使問題推薦更符合客戶的需求。
第6圖係揭示使用本發明之用於問題推薦之系統的步驟流程圖。首先客戶屬性識別模組1係於步驟S101處依據客戶的基本資訊訓練客戶屬性識別模型以獲得一屬性識別碼CA,並依據此屬性識別碼CA決定語意分析模組2及問題軌跡分析模組3將分析之領域類別。
語意分析模組2係於步驟S102至S105分析客戶輸入至文字客服機器人的文字輸入。首先於步驟S102以文字斷詞元件21將文字輸入與斷詞辭典25比較以擷取相符之切詞的組合,接著於步驟S103以文字去贅詞元件22將切詞的組合與贅詞辭典26比較以去除相符之贅詞,進而得到文字輸入之關鍵詞的集合,接著於步驟S104以詞向量轉換元件23將關鍵詞轉換為詞向量,最後於步驟S105以問題預測模型元件24將關鍵詞的詞向量與問題庫8編訂之問題項目比較,以得出屬性識別碼CA及領域類別碼MA指示之領域類別內各問題項目與文字輸入比較的相似度分析值。
問題軌跡分析模組3係於步驟S106至S108分析客戶諮詢問題的軌跡模式,首先於步驟S106以統計元件31統計屬性識別碼CA及領域類別碼MA指示之領域類別內各問題項目被諮詢的次數,並以共現矩陣統計客戶諮詢問題項目的順序關係,接著於步驟S107以熱門度計算元件32依每個問題項目被諮詢的次數計算各問題項目被諮詢的熱門度,最後於步驟S108以關聯度計算元件33依客戶諮詢問題項目的順序關係及客戶前一次諮詢的問題項目計算此次客戶可能諮詢的各問題項目的關聯度數值。
最後,推薦預測模組4係將步驟S105計算之相似度分析值、步驟S107計算之熱門度及步驟S108計算之關連度數值,於步驟S109進行各問題項目之權重數值計算,並於步驟S110將各問題項目依權重數值排序並以推薦門檻數值篩選以顯示問題項目對應之問題推薦語句給客戶選擇,最後於步驟S111將客戶向文字客服機器人諮詢的完整交談紀錄回饋至文字交談紀錄資料庫6及問題諮詢紀錄資料庫7。
綜上所述,本發明之用於問題推薦之系統及方法係於客戶向文字客服機器人諮詢時,可先判定客戶的屬性識別碼以預先得知客戶欲諮詢之領域類別,進而提升問題推薦的精準度及運算效率,且有助於後續系統之擴充的彈性。並且可藉由深度學習技術比對文字輸入與問題庫編訂之問題項目的相似度數值,進而提升文字輸入之預測的精準度。並且可藉由分析客戶過去諮詢問題項目的模式及軌跡判定客戶可能諮詢的各問題項目之熱門度及關聯度數值,使問題推薦更符合客戶的諮詢意圖,進而找出最適合的問題項目以協助客戶輸入文字客服機器人可辨識的問題推薦語句。因此本發明可解決客戶諮詢文字客服機器人而得不到回覆的問題、提升文字客服機器人的自助服務率、且改善客戶使用文字客服機器人的使用者經驗及效能與效率。
上述實施例僅例示性說明本案之功效,而非用於限制本案,任何熟習此項技藝之人士均可在不違背本案之精神及範疇下對上述該些實施態樣進行修飾與改變。因此本案之權利保護範圍,應如後述之申請專利範圍所列。
1‧‧‧客戶屬性識別模組
2‧‧‧語意分析模組
3‧‧‧問題軌跡分析模組
4‧‧‧推薦預測模組
5‧‧‧客戶屬性資料庫
6‧‧‧文字交談紀錄資料庫
7‧‧‧問題諮詢紀錄資料庫
8‧‧‧問題庫

Claims (12)

  1. 一種用於問題推薦之系統,包括:客戶屬性識別模組,係用於依據客戶之基本資訊辨識屬性識別碼;語意分析模組,係用於對該客戶之文字輸入進行語意分析,以獲得該文字輸入相較於該屬性識別碼指示之領域類別中各問題項目的相似度分析值;問題軌跡分析模組,係用於分析該客戶過去諮詢該領域類別中各該問題項目之軌跡模式,以獲得與該文字輸入關聯的各該問題項目的熱門度及關聯度數值;推薦預測模組,係用於根據該相似度分析值、該熱門度及該關聯度數值提供問題推薦語句;以及問題諮詢紀錄資料庫,係用於儲存該客戶過去諮詢各該問題項目之紀錄及次數,其中,該問題軌跡分析模組係進一步於該問題諮詢紀錄資料庫中該屬性識別碼指示之該領域類別的各該問題項目中,以共現矩陣統計前一個問題項目被諮詢後各該問題項目被該客戶諮詢之次數,再將該共現矩陣紀錄之數值以百分率計算而轉換為各該問題項目與該前一個問題項目關聯之關聯度,以及根據該客戶於該文字輸入前諮詢之問題項目,比對該共現矩陣以獲得該文字輸入與各該問題項目關聯之該關聯度數值。
  2. 如申請專利範圍第1項所述之系統,其中,各該問題項目係儲存於問題庫中,並且以領域類別碼區分。
  3. 如申請專利範圍第1項所述之系統,其中,該客戶屬性識別模組係進一步根據該基本資訊擷取該客戶之屬性資料,以將該屬性資料及對應之客戶屬性利用隨機森林演算法計算出該屬性識別碼,其中,該基本資訊為該客戶之電信號碼,且該屬性資料為該客戶之年齡、職業、已申辦之業務及帳單繳費紀錄。
  4. 如申請專利範圍第1項所述之系統,其中,該語意分析模組係進一步將該文字輸入依據斷詞辭典分為切詞集合,以依據贅詞辭典將該切詞集合中之贅詞去除以獲得關鍵詞集合,俾於將該關鍵詞集合轉換為詞向量集合後,將該詞向量集合利用深度學習演算法計算以獲得該文字輸入與該屬性識別碼指示之領域類別中各該問題項目的該相似度分析值。
  5. 如申請專利範圍第4項所述之系統,復包括文字交談紀錄資料庫,係用於儲存該客戶過去諮詢問題使用的語句,以提供該語意分析模組將各該語句與對應之各該問題項目標註後做為該深度學習演算法的訓練資料。
  6. 如申請專利範圍第1項所述之系統,其中,該問題軌跡分析模組係進一步用以統計該問題諮詢紀錄資料庫中該屬性識別碼指示之該領域類別的各問題項目被該客戶諮詢的次數,以將各該問題項目被該客戶諮詢的次數以百分率計算而轉換為與該文字輸入關聯之該熱門度。
  7. 如申請專利範圍第1項所述之系統,其中,該推薦預測模組係進一步用以將各該問題項目對應之該相似度分析值、該熱門度及該關連度數值以權重計算得出各該問題項目之權重數值,再將各該問題項目以該 權重數值排序,俾將該權重數值高於推薦門檻數值的問題項目轉換為該問題推薦語句以作為該客戶之問題推薦。
  8. 一種用於問題推薦之方法,包括:根據客戶之基本資訊識別屬性識別碼;將該客戶之文字輸入進行語意分析,以獲得該文字輸入相較於該屬性識別碼指示之領域類別內各問題項目的相似度數值;分析該客戶過去諮詢該領域類別中各該問題項目之軌跡模式,以獲得與該文字輸入關聯的各該問題項目的熱門度及關聯度數值;以及根據該相似度分析值、該熱門度及該關聯度數值提供問題推薦語句,其中,該分析該客戶過去諮詢該領域類別中各該問題項目之軌跡模式之步驟係包括下列子步驟:於該屬性識別碼指示之該領域類別的各該問題項目中,以共現矩陣統計前一個問題項目被諮詢後各該問題項目被該客戶諮詢之次數;將該共現矩陣紀錄之數值以百分率計算轉換為各該問題項目與該前一個問題項目關聯之關聯度;以及根據該客戶於該文字輸入前諮詢之問題項目,比對該共現矩陣以獲得該文字輸入與各該問題項目關聯之該關聯度數值。
  9. 如申請專利範圍第8項所述之方法,其中,該將該客戶之文字輸入進行語意分析之步驟係包括下列子步驟:將該文字輸入依據斷詞辭典分為切詞集合; 依據贅詞辭典將該切詞集合中之贅詞去除以獲得關鍵詞集合;將該關鍵詞集合轉換為詞向量集合;以及將該詞向量集合利用深度學習演算法計算,以獲得該文字輸入相較於該屬性識別碼指示之領域類別中各該問題項目的該相似度分析值。
  10. 如申請專利範圍第8項所述之方法,其中,該分析該客戶過去諮詢該領域類別中各該問題項目之軌跡模式之步驟係包括下列子步驟:統計該屬性識別碼指示之該領域類別中各該問題項目被該客戶諮詢的次數;以及將各該問題項目被該客戶諮詢的次數以百分率計算轉換為與該文字輸入關聯之該熱門度。
  11. 如申請專利範圍第8項所述之方法,其中,該根據該相似度分析值、該熱門度及該關聯度數值提供問題推薦語句之步驟係包括下列子步驟:將各該問題項目對應之該相似度分析值、該熱門度及該關聯度數值以權重計算得出各該問題項目之權重數值;將各該問題項目以該權重數值排序;以及將該權重數值高於推薦門檻數值的問題項目轉換為該問題推薦語句以作為該客戶之問題推薦。
  12. 如申請專利範圍第8項所述之方法,復包括在該客戶完成諮詢後,紀錄該客戶諮詢問題使用之語句以作為該語意分析之深度學習演算 法的訓練資料來源,以及紀錄該客戶諮詢之問題項目以作為該軌跡模式之統計資料來源。
TW108145114A 2019-12-10 2019-12-10 用於問題推薦之系統及方法 TWI730536B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW108145114A TWI730536B (zh) 2019-12-10 2019-12-10 用於問題推薦之系統及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW108145114A TWI730536B (zh) 2019-12-10 2019-12-10 用於問題推薦之系統及方法

Publications (2)

Publication Number Publication Date
TWI730536B true TWI730536B (zh) 2021-06-11
TW202123164A TW202123164A (zh) 2021-06-16

Family

ID=77516859

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108145114A TWI730536B (zh) 2019-12-10 2019-12-10 用於問題推薦之系統及方法

Country Status (1)

Country Link
TW (1) TWI730536B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102333084A (zh) * 2011-08-31 2012-01-25 深圳市彩讯科技有限公司 基于用户属性的信息推送方法及系统
CN105389341A (zh) * 2015-10-22 2016-03-09 国网山东省电力公司电力科学研究院 一种客服电话重复来电工单的文本聚类与分析方法
CN105608171A (zh) * 2015-12-22 2016-05-25 青岛海贝易通信息技术有限公司 用户画像构建方法
CN105630938A (zh) * 2015-12-23 2016-06-01 深圳市智客网络科技有限公司 一种智能问答系统
CN107203602A (zh) * 2017-05-15 2017-09-26 竹间智能科技(上海)有限公司 基于聊天记忆的用户模型信任值更新方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102333084A (zh) * 2011-08-31 2012-01-25 深圳市彩讯科技有限公司 基于用户属性的信息推送方法及系统
CN105389341A (zh) * 2015-10-22 2016-03-09 国网山东省电力公司电力科学研究院 一种客服电话重复来电工单的文本聚类与分析方法
CN105608171A (zh) * 2015-12-22 2016-05-25 青岛海贝易通信息技术有限公司 用户画像构建方法
CN105630938A (zh) * 2015-12-23 2016-06-01 深圳市智客网络科技有限公司 一种智能问答系统
CN107203602A (zh) * 2017-05-15 2017-09-26 竹间智能科技(上海)有限公司 基于聊天记忆的用户模型信任值更新方法及装置

Also Published As

Publication number Publication date
TW202123164A (zh) 2021-06-16

Similar Documents

Publication Publication Date Title
US20220050879A1 (en) Hybrid approach to approximate string matching using machine learning
CN112487140B (zh) 问答对话评测方法、装置、设备及存储介质
CN107861951A (zh) 智能客服中的会话主题识别方法
US7389306B2 (en) System and method for processing semi-structured business data using selected template designs
CN108073568A (zh) 关键词提取方法和装置
US20080097937A1 (en) Distributed method for integrating data mining and text categorization techniques
CN112632228A (zh) 一种基于文本挖掘的辅助评标方法及系统
CN104077407B (zh) 一种智能数据搜索系统及方法
CN107833059B (zh) 客服的服务质量评价方法与系统
CN113312474A (zh) 一种基于深度学习的法律文书的相似案件智能检索系统
CN112541077A (zh) 一种用于电网用户服务评价的处理方法及系统
CN110955767A (zh) 一种机器人对话系统中生成意图候选集列表集合的算法及装置
CN111191051A (zh) 一种基于中文分词技术的应急知识图谱的构建方法及系统
CN113570380A (zh) 基于语义分析的业务投诉处理方法、装置、设备及计算机可读存储介质
CN117668205A (zh) 智慧物流客服处理方法、系统、设备及存储介质
KR20210033294A (ko) 자동보고서생성장치 및 그 동작 방법
CN113946657A (zh) 一种基于知识推理的电力业务意图自动识别方法
CN115577080A (zh) 一种问题回复匹配方法、系统、服务器及存储介质
CN111382265B (zh) 搜索方法、装置、设备和介质
CN117237038A (zh) 一种基于流量引擎的商品精准曝光处理系统
TWI730536B (zh) 用於問題推薦之系統及方法
CN116629258A (zh) 基于复杂信息项数据的司法文书的结构化分析方法及系统
CN117112794A (zh) 一种基于知识增强的多粒度政务服务事项推荐方法
CN115994531A (zh) 一种多维度文本综合辨识方法
KR102265947B1 (ko) 기계 학습 기반 정보 제공 방법 및 장치