TWI747246B - 基於神經網路運算模組與格變文法的文字語意理解方法 - Google Patents
基於神經網路運算模組與格變文法的文字語意理解方法 Download PDFInfo
- Publication number
- TWI747246B TWI747246B TW109113841A TW109113841A TWI747246B TW I747246 B TWI747246 B TW I747246B TW 109113841 A TW109113841 A TW 109113841A TW 109113841 A TW109113841 A TW 109113841A TW I747246 B TWI747246 B TW I747246B
- Authority
- TW
- Taiwan
- Prior art keywords
- sentence
- vocabulary
- grammar
- case
- semantic network
- Prior art date
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
本發明提供一種由一電子終端裝置來執行此基於神經網路運算模組與格變文法的文字語意理解方法,主要包含有S1、提供一使用者操作界面;S2、輸入至少一題目句子與至少一求解句子;S3、將該等題目句子與該等求解句子進行斷詞與詞性化;S4、圖像化該等題目句子與該等求解句子;S5、對該等句子二維詞性編碼圖進行詞彙格變文法標籤設定;S6、轉換為一命題語意網路;S7、轉換為一句子語意網路;S8、轉換為一問題語意網路;S9、進行求解,使該問題語意網路進行蔓延運算,並產生對應該求解句子之答案,讓使用者利用一神經網路運算模組與對應之資料庫來進行語意分析與推論,節省人力與時間成本。
Description
本發明有關於一種文字語意理解方法,尤指基於神經網路運算模組與格變文法的文字語意理解方法。
近年來由於人工智慧的蓬勃發展,對於自然語言處理也有極大的進展,例如:語音辨識、機器翻譯及對話機器人等。然而對於中文語意的理解部份,目前仍侷限於規則推論及統計分析等技術為主,因此,傳統中文語意的理解就需要透過建立包含文法詞性的詞庫,及大量預設好的規則來對輸入的句子進行斷詞與詞性分析,進而才能獲得此句子最有可能的意義。
然而,上述規則的建立往往需要投入大量的人力與時間來對句子進行統計分析,特別是中文文字之語意理解與其對應的資料庫建立,不僅容易造成大量人力成本與時間成本的增加,同時已建立好的規則資料庫若要修改,往往是動一髮而牽全身,進而以往正確判讀的句子可能因此產生誤判。是以,如何應用人工智慧的自我學習能力,讓人工智慧透過學習大量句中各種詞彙所代表的意義與關聯,以及認知科學格變文法的語意標籤,進而讓人工智慧可以學習到中文詞彙語意,建立適切的語意網路,並以蔓延激發理論建立之規則進行推論,得到正確答案,此為一有效的新開發技術。
本發明之目的,在於解決先前技術無法有效理解中文文字及所形成之句子的語意之問題。
為達上述目的,本發明提供一種基於神經網路運算模組與格變文法的文字語意理解方法,主要包含有:S1、提供一使用者操作界面:該使用者操作界面連接儲存有複數詞彙之一詞彙資料庫與一神經網路運算模組;S2、輸入至少一題目句子與至少一求解句子:使用者將該等題目句子輸入至該使用者操作界面之一題目文字輸入欄,並將該等求解句子輸入至該使用者操作界面之一求解文字輸入欄;S3、將該等題目句子與該等求解句子進行斷詞與詞性化:該使用者操作界面將該等題目句子與該詞彙資料庫進行比對,並依該詞彙資料庫之該等詞彙而分解出每一該題目句子中所包含之該等詞彙,並將每一該題目句子所包含之該等詞彙給予對應之一詞性,該使用者操作界面並將該等求解句子與該詞彙資料庫進行比對,並依該詞彙資料庫之該等詞彙而分解出該等求解句子中所包含之該等詞彙來進行斷詞,並將每一該求解句子所包含之該等詞彙給予對應之該詞性而詞性化;S4、圖像化該等題目句子與該等求解句子:該使用者操作界面將每一該題目句子中每一該詞彙與每一該求解句子中每一該詞彙,分別依每一該題目句子中每一該詞彙其對應於該題目句子中的詞彙位置與所對應的該詞性而轉換為一句子二維詞性編碼圖,該句子二維詞性編碼圖之縱軸為詞性,橫軸為詞彙位置;S5、對該等句子二維詞性編碼圖進行詞彙格變文法標籤設定:該使用者操作界面透過所連接之該神經網路運算模組而將每一該句子二維詞性編碼圖進行詞彙格變文法標籤設定,使該句子二維詞性編碼圖之每一該詞彙經運算而轉換為一詞彙格變文法標籤,其中,每一該詞彙所對應之該詞彙格變文法標籤是依格變文法之規則所定義,且該使用者操作界面將該題目句子所包含之該等詞彙與對應之該等詞彙格變文法標籤再轉換為對應該題目句子之一詞彙格變文法標籤表;S6、轉換為一命題語意網路:使用者操作界面依每一該題目句子所對應之該詞彙格變文法標籤表進行分析與辨識,使每一該詞彙格變文法標籤表轉換為對應每一該題目句子之該命題語意網路;S7、轉換為一句子語意網路:該使用者操作界面連接一句子語意網路建立規則資料庫,該句子語意網路建立規則資料庫包含複數條利用該等命題語意網路來構成句子語意網路之規則,該使用者操作界面將每一該命題語意網路之該等詞彙格變文法標籤依該句子語意網路建立規則資料庫而重新組合且轉換為對應之該句子語意網路;S8、轉換為一問題語意網路:該使用者操作界面連接一問題語意網路建立規則資料庫,該問題語意網路建立規則資料庫包含複數條將該等句子語意網路整合成為該問題語意網路之規則;S9、進行求解:該使用者操作界面連接一語意網路蔓延激發規則資料庫,並將該求解句子之該等詞彙對應至該問題語意網路,使該問題語意網路所對應之該等詞彙再依該語意網路蔓延激發規則資料庫進行蔓延運算,並產生對應該求解句子之答案。
進一步地,該神經網路運算模組係為卷積神經網路(Convolutional Neural Network, CNN)。
進一步地,該神經網路運算模組針對該等詞彙會依每一該詞彙其位於該題目句子中之位置與所對應的該詞性,而判斷與分類每一該詞彙所對應之該詞彙格變文法標籤。
進一步地,基於該神經網路運算模組與格變文法的文字語意理解方法,卷積神經網路學習與設定該題目句子或該求解句子中每一該詞彙所對應之該詞彙格變文法標籤。
進一步地,該使用者操作界面將該等句子語意網路中使用相同之該詞彙者先產生連結關係,進而成為該問題語意網路。
進一步地,該問題語意網路建立規則資料庫之規則是包含:將該等句子語意網路所含之相同該等詞彙中,該等詞彙所對應之該詞彙格變文法標籤之屬性為人者先進行結合,其次再依該等詞彙所對應之該詞彙格變文法標籤之屬性為物品者來結合。
進一步地,該問題語意網路中之該等詞彙與該求解句子中之該等詞彙相同者,則該使用者操作界面會依該語意網路蔓延激發規則資料庫中之複數蔓延激發規則而自該問題語意網路之該等詞彙進行蔓延激發運算。
根據本發明,可提供一種基於神經網路運算模組與格變文法的文字語意理解方法之電子終端裝置,用以執行基於神經網路運算模組與格變文法的文字語意理解方法與顯示運算結果。
根據本發明,提供上述基於神經網路運算模組的文字語意理解方法之電子終端裝置之該使用者操作界面,更包含有該使用者操作界面,更包含有一說明欄、一斷詞按鍵、一句子語意網路按鍵、一問題語意網路按鍵、一說明解題過程按鍵及一答案按鍵。
根據本發明,提供上述基於神經網路運算模組的文字語意理解方法之電子終端裝置,可選自個人電腦、筆記型電腦、個人數位助理(PDA)或行動電話。
本發明之一種基於神經網路運算模組與格變文法的文字語意理解方法,其主要是利用卷積神經網路(CNN)之架構為主,並結合格變文法之規則與蔓延激發理論之規則,而使本案具有下述優點:
1、不需建立大量中文語意規則資料庫。
2、該神經網路運算模組以卷積神經網路(CNN)來學習圖像化的該等題目句子與求解句子中,其句子二維詞性編碼圖的該等詞彙所對應之該等詞彙格變文法標籤,並透過命題語意網路、句子語意網路與問題語意網路等各種語意網路之架構,來對輸入文字其語言的理解,節省大量人力與維護時間。
3、以蔓延激發理論進行問題語意網路之推論,更具效率。
茲就本申請案的技術特徵暨操作方式舉數個較佳實施態樣,並配合圖示說明謹述於后,俾提供審查參閱。再者,本發明中之圖式,為便於說明其比例未必按實際比例繪製,圖式中之比例並不用以限制本發明所欲請求保護之範圍。
關於本發明之技術,請參照第1圖至第8圖所示,本發明提供一種基於神經網路運算模組與格變文法的文字語意理解方法100,並由一電子終端裝置10來執行此基於神經網路運模組與格變文法的文字語意理解方法100與顯示運算結果,該電子終端裝置10可選自個人電腦、筆記型電腦、個人數位助理(PDA)或行動電話,該電子終端裝置10並連接有一詞彙資料庫20、一神經網路運算模組30、一句子語意網路建立規則資料庫40、一問題語意網路建立規則資料庫50及一語意網路蔓延激發規則資料庫51,而此基於神經網路運算模組與格變文法的文字語意理解方法100,主要包含有:
S1、提供一使用者操作界面11:該電子終端裝置10透過提供一使用者操作界面11來提供使用者來操作與執行該基於神經網路運算模組與格變文法的文字語意理解方法100,其中,該使用者操作界面11並連接儲存有複數詞彙V之該詞彙資料庫20、該神經網路運算模組30、該句子語意網路建立規則資料庫40、該問題語意網路建立規則資料庫50與該語意網路蔓延激發規則資料庫51,而該使用者操作界面11並包含有一題目文字輸入欄111、一求解文字輸入欄112、一說明欄113、一斷詞按鍵114、一句子語意網路按鍵115、一問題語意網路按鍵116、一說明解題過程按鍵117及一答案按鍵118,但不以此為限,而該說明欄113係會依使用者所選擇之按鍵來顯示對應之結果;
S2、輸入至少一題目句子與至少一求解句子:使用者將該等題目句子輸入至該使用者操作界面11之一題目文字輸入欄111,與將該求解句子輸入至該使用者操作界面11之一求解文字輸入欄112,本發明第一實施例之該題目文字輸入欄111使用者係輸入「小明有10顆糖果,爸爸又給小明5顆糖果」,該求解文字輸入欄112係輸入「請問:小明共有多少顆糖果」,因此,該使用者操作界面11會該等題目句子依標點符號而將其分類為一題目第一句子Q1「小明有10顆糖果」與一題目第二句子Q2「爸爸又給小明5顆糖果」,而該求解文字輸入欄112之該求解句子則分類為一求解第一句子A1「小明共有多少顆糖果」;
S3、將該等題目句子與該等求解句子進行斷詞與詞性化:該使用者操作界面將該等題目句子與該詞彙資料庫20進行比對,並依該詞彙資料庫20所含之該等詞彙V而分解出每一該題目句子中所包含之該等詞彙V來進行斷詞,也就是會將該題目句子之該題目第一句子Q1分解為由該等詞彙V所組成之句子及將該題目第二句子Q2分解為由該等詞彙V所組成之句子,請參閱下表一所示,並將該等題目句子之該題目第一句子Q1、該題目第二句子Q2與該求解句子之該求解第一句子A1中所對應到每一該詞彙V分別給予對應之一詞性P而詞性化,也就是該使用者操作界面11將該等求解句子與該詞彙資料庫20進行比對,並依該詞彙資料庫20之該等詞彙V而分解出該等求解句子中所包含之該等詞彙V來進行斷詞,並將每一該求解句子所包含之該等詞彙V給予對應之該詞性P而詞性化,如本發明第一實施例之該等求解句子係為該求解第一句子A1,其中,而該詞性P係用以表示所對應之該詞彙V之屬性,該詞性P包含有:人物、正向動詞、負向動詞、一般動詞、助詞、形容詞、副詞、物品、地點、數量、單位、贅詞等12種詞性,但不以此為限,且該使用者可選擇該斷詞按鍵114而將斷詞與詞性化結果顯示於該說明欄113;
表一 | ||
詞彙 V | 詞性P | |
題目第一句子 Q1 | 小明 | 人物 |
有 | 一般動詞 | |
10 | 數值 | |
顆 | 單位 | |
糖果 | 物品 | |
題目第二句子Q2 | 爸爸 | 人物 |
又 | 贅詞 | |
給 | 負向動詞 | |
小明 | 人物 | |
5 | 數值 | |
顆 | 單位 | |
糖果 | 物品 | |
求解第一句子 A1 | 小明 | 人物 |
共有 | 正向動詞 | |
多少 | 數值 | |
顆 | 單位 | |
糖果 | 物品 |
S4、圖像化該等題目句子與該等求解句子:該使用者操作界面11將每一該題目句子之該題目第一句子Q1與該題目第二句子Q2的該等詞彙V,及每一該求解句子之該求解第一句子A1之該等詞彙V,請參閱第3圖所示與表一所示,分別依每一該題目第一句子Q1與該題目第二句子Q2的該等詞彙V其對應於所構成的該題目句子中的一詞彙位置與所對應的該詞性P而轉換為一句子二維詞性編碼圖60,而每一該求解句子之該求解第一句子A1的該等詞彙V其對應於該求解句子中的位置與所對應的該詞性P而轉換為所對應之另一該句子二維詞性編碼圖60,請再參閱第3圖所示,本發明第一實施例係將該題目第二句子Q2轉換為對應之該句子二維詞性編碼圖60,其X座標(橫軸)係依該題目第二句子Q2之每一該詞彙V位置為主,而Y座標(縱軸)係依該題目第二句子Q2之每一該詞彙V之該詞性P為主;
S5、對該等句子二維詞性編碼圖進行詞彙格變文法標籤設定:請參閱第4-1圖所示,該使用者操作界面11透過所連接之該神經網路運算模組30而將該題目句子之該題目第一句子Q1、該題目第二句子Q2及該求解句子之該求解第一句子A1的每一該句子二維詞性編碼圖60輸入,每一該句子二維詞性編碼圖60經該神經網路運算模組30運算而進行詞彙格變文法標籤設定,使該句子二維詞性編碼圖60之每一該詞彙V經運算而轉換為一詞彙格變文法標籤M,其中,本發明第一實施例之該神經網路運算模組30是利用卷積神經網路(CNN)來進行詞彙格變文法標籤設定,而所述之詞彙格變文法標籤設定係將該句子二維詞性編碼圖60之每一該詞彙V利用卷積神經網路(CNN)運算而產生對應該詞彙格變文法標籤M的一維矩陣之一輸出向量OV,而每一該輸出向量OV並對應一該詞彙格變文法標籤M,因為本發明第一實施例的該題目第二句子Q2的該句子二維詞性編碼圖60為NX10的矩陣,所以產生對應的10組卷積神經網路編號分別為CNN1至CNN10之一維矩陣之該輸出向量OV,及對應的該等詞彙格變文法標籤M,請參閱第4-2圖所示,該使用者操作界面30並將該題目第二句子Q2之該句子二維詞性編碼圖60的每一該詞彙V與對應之該卷積神經網路編號CNN1至CNN10、該輸出向量OV及該詞彙格變文法標籤M轉換為對應該題目第二句子Q2的一詞彙格變文法標籤表T1,其中,該等詞彙格變文法標籤M是該神經網路運算模組30利用卷積神經網路(CNN)進行訓練與學習每一該詞彙V所產生對應之該詞彙格變文法標籤M的輸出結果,也就是該神經網路運算模組30會依每一該詞彙V其位於對應之該題目句子中或該求解句子中的位置與所對應的該詞性P,經該神經網路運算模組30運算出該輸出向量OV,並判斷與分類每一該詞彙V所對應之該詞彙格變文法標籤M,進而將該題目第二句子Q2所含每一該詞彙V及對應之該詞彙格變文法標籤M、該卷積神經網路編號CNN1至CNN10,該輸出向量OV等資料組成該詞彙格變文法標籤表T1,其中,本發明第一實施例之該神經網路運算模組30為卷積神經網路(CNN),但不以此為限,而本發明第一實施例中該題目句子分別為該題目第一句子Q1「小明有10顆糖果」與該題目第二句子Q2「爸爸又給小明5顆糖果」,並分別針對該題目第一句子Q1、該題目第二句子Q2中的該等詞彙V與對應的該詞彙格變文法標籤M進行學習,並請參閱下表二所示之該題目第一句子Q1、該題目第二句子Q2依格變文法之規則學習該等詞彙V與其對應設定之該等詞彙格變文法標籤M的關係:
進一步而言,該神經網路運算模組30將每一該句子二維詞性編碼圖60經運算而轉換為該詞彙V與所對應的該詞彙格變文法標籤M,每一該神經網路運算模組30對該題目句子中的每一該詞彙V給予一該卷積神經網路(CNN)來進行詞彙格變文法標籤設定,並提供對應之卷積神經網路編號CNN1至CNN10其中之一者來做為區別,如本發明第一實施例之該題目第二句子Q2中的每一詞彙V「爸爸」、「又」、「給」、「小明」、「5」、「顆」及「糖果」等分別給予對應之卷積神經網路編號CNN1~CNN7來做為區別,並對其進行詞彙格變文法標籤設定,且初步假設每一問題句子或題目句子中最多可分為10個該詞彙V,亦可為11個該詞彙V、12個該詞彙V等,但不以此為限,所以,本發明第一實施例中每一該題目句子或該求解句子最多各有10個卷積神經網路編號CNN1至CNN10進行詞彙格變文法標籤設定,其中,假設該詞彙格變文法標籤M有12個,所以每一該詞彙V進行詞彙格變文法標籤設定時,會設定對應此12個該詞彙格變文法標籤M之1X12的一維矩陣,也就是每一卷積神經網路(CNN)的該輸出向量OV為 1X12之一維矩陣,請再參閱第4-1圖與第4-2圖所示,其中,每一該句子二維詞性編碼圖60經該神經網路運算模組30其卷積神經網路(CNN)之運算後,會將每一該句子二維詞性編碼圖60之該等詞彙V組成為該詞彙格變文法標籤表T1,而該詞彙格變文法標籤表T1所顯示之每一該詞彙V及對應的該詞彙格變文法標籤M是由該輸出向量OV其顯示為“ 1 ”者的位置所對應之,而上述的該等詞彙格變文法標籤M也是該神經網路運算模組30依格變文法之規則所欲學習的目標,也就是該神經網路運算模組30中卷積神經網路(CNN)針對該等詞彙V位於該等題目句子中之位置與該詞性P來進行學習,並判斷該題目句子或該求解句子中每一該詞彙V所對應之該詞彙格變文法標籤M為那一個,同時,該詞彙格變文法標籤M的種類是係依格變文法之規則的需求來進行擴增與修改,所以不以表二所示為限,可依使用者之需要進行增加;
表二 | ||
詞彙 V | 詞彙格變文法標籤M | |
題目第一句子 Q1 | 小明 | 主事者 |
有 | = | |
10 | 數量 | |
顆 | 單位 | |
糖果 | 物品 | |
題目第二句子 Q2 | 爸爸 | 主事者 |
又 | 贅詞 | |
給 | - | |
小明 | 接受者 | |
5 | 數量 | |
顆 | 單位 | |
糖果 | 物品 | |
求解第一句子A1 | 小明 | 主事者 |
共有 | 總和 | |
多少 | 數量 | |
顆 | 單位 | |
糖果 | 物品 |
S6、轉換為一命題語意網路70:使用者操作界面11依每一該題目句子所對應之該詞彙格變文法標籤表T1中之該詞彙V與該詞彙格變文法標籤M建立命題語意網路70,請參閱第5圖所示,使每一該詞彙格變文法標籤表T1轉換為對應之該命題語意網路70,因此,該神經網路運算模組30判斷該等問題句子中每一該詞彙V對應之該詞彙格變文法標籤M後,將該等詞彙格變文法標籤M轉換為該命題語意網路70,例如:本發明第一實施例之該命題語意網路70係將該題目句子中該題目第一句子Q1與該題目第二句子Q2之每一該詞彙V經該神經網路運算模組30中的卷積神經網路(CNN)進行辨識後,依該詞彙格變文法標籤表T1中的該輸出向量OV中“1“的位置來表示該詞彙V依格變文法之規則之分類後設定所對應之該詞彙格變文法標籤M,如第4-2圖中,該詞彙V「爸爸」的該輸出向量OV為(1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0),而依格變文法之規則的規定該輸出向量OV的第一位置代表的該詞彙格變文法標籤M為「主事者」,所以,該詞彙V之「爸爸」對應之該詞彙格變文法標籤M為「主事者」;同理,該詞彙V之「小明」的該輸出向量OV為(0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0),該輸出向量OV的第二位置代表的該詞彙格變文法標籤M為「接受者」,所以,該詞彙V之「小明」對應之該詞彙格變文法標籤M為「接受者」,每一該題目句子所組成之該等詞彙V都貼上對應之該詞彙格變文法標籤M後,每一該問題句子之該題目第一句子Q1與該題目第二句子Q2則形成該命題語意網路70;
S7、轉換為一句子語意網路80:該使用者操作界面11連接一句子語意網路建立規則資料庫40,該句子語意網路建立規則資料庫40包含複數條利用該等詞彙格變文法標籤M其對應之該等詞彙V來構成句子語意網路80之規則,請參閱第6圖所示,使該使用者操作界面11將每一該命題語意網路70之該等詞彙格變文法標籤M依該句子語意網路建立規則資料庫40而重新組合且轉換為對應之該句子語意網路80,本發明第一實施例其係依建立之該句子語意網路建立規則資料庫40,而將每一該命題語意網路70之該等詞彙V重新組合轉換為該句子語意網路80,請再參閱第6圖所示,其中,該句子語意網路建立規則資料庫40之規則包含有:1、刪除該詞彙格變文法標籤M為贅詞者之該等詞彙V;2、將同一該命題語意網路70之該等詞彙V按詞彙格變文法標籤M為主事者、關係、物品、數量、單位等之次序,重新排列與連結出為對應之該句子語意網路80。而該句子構成資料之規則係可依需求再增加於該句子語意網路建立規則資料庫40,並不以此為限,且該使用者可選擇該句子語意網路按鍵115而將S7、轉換為該句子語意網路80之結果顯示於該說明欄113;
S8、轉換為一問題語意網路90:該使用者操作界面11連接該問題語意網路建立規則資料庫50,該問題語意網路建立規則資料庫50包含複數條將該等句子語意網路80整合成為該問題語意網路90之規則,請再參閱第6圖至第7圖所示,將該等句子語意網路80中符合規則之該等詞彙V產生連結,也就是將該等句子語意網路80中使用相同之該詞彙V者先產生連結,再使其轉換為該問題語意網路90,其中,該等句子語意網路80是依該句子語意網路建立規則資料庫40中之該等詞彙V中,將該詞彙格變文法標籤M之屬性為人者先進行結合,例如:該詞彙格變文法標籤M為主事者與接受者,則先進行結合,若無相同之屬性為人者,再依該等詞彙格變文法標籤M的屬性為物品者來結合,因此本發明第一實施例將該等句子語意網路80之該詞彙V為「小明」者產生連結,進而將該句子語意網路80轉換成為該問題語意網路90,且該使用者可選擇該問題語意網路按鍵116而將S8、轉換為該問題語意網路90之結果顯示於該說明欄113;
S9、進行求解:該使用者操作界面11連接該語意網路蔓延激發規則資料庫51,並將該求解句子中的該等詞彙V對應至該問題語意網路90,使該問題語意網路90所對應之該等詞彙V依該語意網路蔓延激發規則資料庫51進行蔓延運算,並產生對應該求解句子之答案,因此本發明第一實施例之該使用者操作界面11將該問題語意網路90依該語意網路蔓延激發規則資料庫51進行運算,也就是自該問題語意網路90中之該等詞彙V與該求解句子中的該等詞彙中找到相同者,再依該語意網路蔓延激發規則資料庫51而自該問題語意網路90之該等詞彙V進行蔓延激發運算,請參閱第8圖所示,本發明第一實施例是由求解句子「小明共有多少顆糖果」中的該人與物品之該詞彙V為「小明」及「糖果」輸入問題語意網路90中進行蔓延激發,並找到「小明」與「糖果」兩者有關連者為「=」及「+」,再由「糖果」往下蔓延激發到「10」及「5」,而由數量「10」及「5」再往下蔓延激發到「10」及「5」的單位是「顆」及「顆」,也就是二者的該等詞彙格變文法標籤M為「單位」者之該等詞彙均為「顆」,二者的單位一致,因此,依該求解句子的語意進行該求解運算,所以本發明第一實施例進行總和計算,由「=」的數量「10」顆開始作加減運算,而獲得對應該求解句子之答案為:10顆+5顆=15顆,而產生對應該求解句子之答案為15顆,且該使用者可選擇該說明解題過程按鍵117而將該問題語意網路90進行蔓延激發運算之過程顯示於該說明欄113,或選擇該答案按鍵118將該求解句子之答案顯示於該說明欄113。
再者,請參閱第9圖至第11圖所示,其係為本發明之第二實施例,其主要架構與第一實施例大致相同,其主要差異是增加其人物與物品關係複雜化,則輸入該題目文字輸入欄111所入文字為「小明有10顆蘋果,爸爸又給小明5顆蘋果,媽媽又給小明2顆芭樂,小明給爺爺3顆蘋果」,因此,該等題目句子分別為「小明有10顆蘋果」、「爸爸又給小明5顆蘋果」、「媽媽又給小明2顆芭樂」與「小明給爺爺3顆蘋果」,而輸入該求解文字輸入欄112之所輸入文字為「請問:小明剩幾顆蘋果?」,因此,該求解句子為「小明剩幾顆蘋果」,該使者操作界面11就會將該題目文字輸入欄111之該題目句子與該詞彙資料庫20中進行比對,並依該詞彙資料庫20所含之該等詞彙V而分解出每一該題目句子所包含之該等詞彙V來進行斷詞,並將每一該求解句子所包含之該等詞彙V給予對應之該詞性P,經卷積神經網路(CNN)運算後,產生每一該詞彙V對應的該詞彙格變文法標籤M,則可產生對應第二實施例之該命題語意網路70後,再轉換為如第9圖所示之該句子語意網路80,再結合該等句子語意網路80成為該問題語意網路90,請參閱第10圖所示,隨後再將該求解句子的該詞彙V對應至該問題語意網路90,使該問題語意網路90所對應之該等詞彙V後,再依該語意網路蔓延激發規則資料庫51進行蔓延運算,請參閱第11圖所示,本發明第二實施例是由該人與物品之該等詞彙V為「小明」及「蘋果」者來進行蔓延激發,並找到「小明」與「蘋果」兩者有關連者的該等詞彙格變文法標籤M為「=」、「+」及「-」,再由「蘋果」往下蔓延激發到「10」、「5」及「3」,而由該等詞彙格變文法標籤M為數量者的「10」、「5」及「3」再往下蔓延激發到「10」、「5」及「3」其該等詞彙格變文法標籤M為「單位」而對應之該等詞彙V是「顆」、「顆」及「顆」結束,而此三者的該等詞彙格變文法標籤M的「單位」一致,因此,停止蔓延激發並依該求解句子的語意進行求解運算,所以本發明第二實施例進行總和計算,由該詞彙格變文法標籤M為「=」的數量「10」顆開始作加減運算:10顆+5顆-3顆=12顆,而獲得對應該求解句子之答案為12顆,其中,物品「芭樂」並非在求解句子中所要的物品,而本發明第二實施例之求解句子所要的物品為「蘋果」,所以蔓延激發至「芭樂」節點後,因為物品種類不相同,所以不再往下搜尋,也不列入總合計算;
另,請參閱第12圖至第14圖所示,其係為本發明之第三實施例,其主要架構與第一實施例大致相同,其主要差異是增加其人物與物品關係複雜化,則輸入該題目文字語意輸入欄111之文字為「你身上有100元,父親再給你20元,母親再給你60元,你借給妹妹50元,你剩上的錢正好可以買一輛腳踏車。」,因此,該等題目句子分別為「你身上有100元」、「父親再給你20元」、「母親再給你60元」、「你借給妹妹50元」及「你身上的錢正好可以買一輛腳踏車」,而輸入該求解文字語意輸入欄112之文字為「請問:一輛腳踏車多少錢?」,因此該求解句子為「一輛腳踏車多少錢」;其中,在該句子語意網路80中句子「錢正好可以」依格變文法之規則而給予對應之該詞彙格變文法標籤M為「+」、「0」及「元」,如此使該問題語意網路90更具有彈性,因此,該使用者操作界面11就會將該題目文字輸入欄111之該題目句子與該詞彙資料庫20中進行比對,並依該詞彙資料庫20所含之該等詞彙V而分解出每一該題目句子所包含之該等詞彙V來進行斷詞,並將每一該求解句子所包含之該等詞彙V給予對應之該詞性P,經卷積神經網路(CNN)運算後,產生每一該詞彙V與所對應之該詞彙格變文法標籤M,則可產生對應第三實施例之該命題語意網路70後,再轉換為如第12圖所示之該句子語意網路80,再結合該等句子語意網路80成為該問題語意網路90,請參閱第13圖所示,隨後再將該求解句子中該詞彙V對應至該問題語意網路90,使該問題語意網路90所對應之該等詞彙V再依該語意網路蔓延激發規則資料庫51對該詞彙格變文法標籤M進行蔓延運算,請參閱第14圖所示,本發明第三實施例是由該詞彙V「腳踏車」進行蔓延激發,並找到「你」與「1」兩者有關連之該詞彙格變文法標籤M為「買」及「數量」,再由「你」與「1」往下蔓延激發,使得「1」找到該關聯是單位及其對應之該詞彙V為「輛」者,並符合該求解句子之該詞彙V;而由「你」往下蔓延激發,則找到該詞彙格變文法標籤M為「+」、「=」、「+」、「+」、「-」,再由該詞彙格變文法標籤M為「+」、「=」、「+」、「+」、「-」者往下激發蔓延找到該詞彙V是「元」,5個該詞彙V之該詞彙格變文法標籤M是一致表示為「單位」;因此,依該求解句子的語意進行求解運算,所以本第三實施例進行總和計算,由該詞彙格變文法標籤M為「=」開始作加減運算:100元+60元+0元+20元-50元=130元,而獲得對應該求解句子之答案為一輛腳踏車為130元。
又,請參閱第15圖至第17圖所示,其係為本發明第四實施例之句子語意網路80之架構示意圖,而第四實施例其主要是將第三實施例之該題目句子中,其第5句所述之「你身上的錢正好可以買一輛腳踏車」修改為「你差200元正好買一輛腳踏車」,因此,第四實施例關於此修改部份,該句子語意網路80會如第15圖所示的修改,而該問題語意網路90會如第16圖所示的修改,其中,本發明第四實施例也會由「腳踏車」進行蔓延激發,並找到「你」與「1」兩者有關連之該詞彙格變文法標籤M為「買」及「數量」,再由「你」與「1」往下蔓延激發,使得「1」找到該詞彙V的單位為「輛」者,並符合該求解句子之該等詞彙V;而由「你」往下蔓延激發,則找到該詞彙格變文法標籤M為「+」、「=」、「+」、「+」、「-」者,再由該詞彙格變文法標籤M「+」、「=」、「+」、「+」、「-」往下激發蔓延找到該等詞彙格變文法標籤M是單位而對應的該等詞彙V為「元」,其5個該等詞彙V的該等詞彙格變文法標籤M之單位一致;因此,依該求解句子的語意進行求解運算,所以本發明第四實施例進行總和計算,由該詞彙格變文法標籤M為「=」開始作加減運算:100元+60元+200元+20元-50元=330元,而獲得對應該求解句子之答案為一輛腳踏330元。
綜上所述,本發明藉由該電子終端裝置10來執行該基於神經網路運算模組與格變文法的文字語意理解方法100,首先使用者利用該電子終端裝置10之該使用者操作界面11來輸入該題目句子與該求解句子,透過將該等題目句子與該等求解句子進行斷詞與詞性化後,會形成對應之該等句子二維詞性編碼圖60,該句子二維詞性編碼圖60再經該神經網路運算模組30的卷積神經網路(CNN)學習將該句子二維詞性編碼圖60的該等詞彙V進行詞彙格變文法標籤設定,而將該等句子二維詞性編碼圖60中的每一該詞彙V可以正確設定至對應的該詞彙格變文法標籤M,再將每一該詞彙V與該詞彙格變文法標籤M組成為該詞彙格變文法標籤表T1,並將該題目句子中每一詞彙V與每一該詞彙格變文法標籤M再轉換為該命題語意網路70,隨後,轉換為該句子語意網路80與問題語意網路90,再將該求解句子之該等詞彙V對應至該問題語意網路90中,透過該語意網路蔓延激發規則資料庫51來對該問題語意網路90之該等詞彙V進行蔓延激發運算並獲得該求解句子所需要的答案,而每一步驟所連接到的該句子語意網路建立規則資料庫40、該問題語意網路建立規則資料庫50、該語意網路蔓延激發規則資料庫51等所建立之規則係可依需求進行增刪,而該神經網路運算模組30會依更新的該等詞彙V與該等詞彙格變文法標籤M進行學習與判斷,如此,可以增加對中文語意理解的判斷能力。
以上已詳細說明本發明之內容,惟以上所述者,僅為本發明之較佳實施例而已,當不能以此限定本發明實施之範圍,即凡依本發明申請專利範圍所作之均等變化與修飾,皆應仍屬本發明之專利涵蓋範圍內。
100:基於神經網路運算模組與格變文法的文字語意理解方法
10:電子終端裝置
11:使用者操作界面
111: 題目文字輸入欄
112: 求解文字輸入欄
113: 說明欄
114:斷詞按鍵
115: 句子語意網路按鍵
116: 問題語意網路按鍵
117: 說明解題過程按鍵
118: 答案按鍵
20: 詞彙資料庫
30: 神經網路運算模組
40:句子語意網路建立規則資料庫
50:問題語意網路建立規則資料庫
51:語意網路蔓延激發規則資料庫
60: 句子二維詞性編碼圖
70: 命題語意網路
80:句子語意網路
90: 問題語意網路
T1:詞彙格變文法標籤表
V:詞彙
P:詞性
M:詞彙格變文法標籤
OV:輸出向量
Q1:題目第一句子
Q2:題目第二句子
A1:求解第一句子
CNN1~7:卷積神經網路編號1~7
S1: 提供一使用者操作界面
S2: 輸入至少一題目句子與至少一求解句子
S3:將該等題目句子與該等求解句子進行斷詞與詞性化
S4:圖像化該等題目句子與該等求解句子
S5: 對該等句子二維詞性編碼圖進行詞彙格變文法標籤設定
S6: 轉換為一命題語意網路
S7: 轉換為一句子語意網路
S8: 轉換為一問題語意網路
S9: 進行求解
第1圖:為本發明之流程示意圖。
第2圖:為本發明之電子終端裝置之使用者操作界面與連結方塊示意圖。
第3圖:為本發明之句子二維詞性編碼圖之示意圖。
第4-1圖:為本發明之題目第二句子之句子二維詞性編碼圖透過卷積神經網路(CNN)進行詞彙格變文法標籤設定之架構示意圖。
第4-2圖:為本發明之題目第二句子之句子二維詞性編碼圖經卷積神經網路(CNN)辨識後轉為詞彙格變文法標籤表之示意圖。
第5圖:為本發明第一實施例之命題語意網路之架構示意圖。
第6圖:為本發明第一實施例之句子語意網路之架構示意圖。
第7圖:為本發明第一實施例之問題語意網路之架構示意圖。
第8圖:為本發明第一實施例之問題語意網路依語意網路蔓延激發規則資料庫之規則進行求解之架構示意圖。
第9圖:為本發明第二實施例之句子語意網路之架構示意圖。
第10圖:為本發明第二實施例之問題語意網路之架構示意圖。
第11圖:為本發明第二實施例之問題語意網路依語意網路蔓延激發規則資料庫之複數蔓延激發規則進行求解之架構示意圖。
第12圖:為本發明第三實施例之句子語意網路之架構示意圖。
第13圖:為本發明第三實施例之問題語意網路之架構示意圖。
第14圖:為本發明第三實施例之問題語意網路依語意網路蔓延激發規則資料庫之複數蔓延激發規則進行求解之架構示意圖。
第15圖:為本發明第四實施例之句子語意網路之架構示意圖。
第16圖:為本發明第四實施例之問題語意網路之架構示意圖。
第17圖:為本發明第四實施之問題語意網路依語意網路蔓延激發規則資料庫之複數蔓延激發規則進行求解之架構示意圖。
100: 基於神經網路運算模組與格變文法的文字語意理解方法
S1: 提供一使用者操作界面
S2: 輸入至少一題目句子與至少一求解句子
S3:將該等題目句子與該等求解句子進行斷詞與詞性化
S4:圖像化該等題目句子與該等求解句子
S5: 對該等句子二維詞性編碼圖進行詞彙格變文法標籤設定
S6: 轉換為一命題語意網路
S7: 轉換為一句子語意網路
S8: 轉換為一問題語意網路
S9: 進行求解
Claims (10)
- 一種基於神經網路運算模組與格變文法的文字語意理解方法,主要包含有: S1、提供一使用者操作界面:該使用者操作界面連接儲存有複數詞彙之一詞彙資料庫與一神經網路運算模組; S2、輸入至少一題目句子與至少一求解句子:使用者將該等題目句子輸入至該使用者操作界面之一題目文字輸入欄,並將該等求解句子輸入至該使用者操作界面之一求解文字輸入欄; S3、將該等題目句子與該等求解句子進行斷詞與詞性化:該使用者操作界面將該等題目句子與該詞彙資料庫進行比對,並依該詞彙資料庫之該等詞彙而分解出每一該題目句子中所包含之該等詞彙,並將每一該題目句子所包含之該等詞彙給予對應之一詞性,該使用者操作界面並將該等求解句子與該詞彙資料庫進行比對,並依該詞彙資料庫之該等詞彙而分解出該等求解句子中所包含之該等詞彙來進行斷詞,並將每一該求解句子所包含之該等詞彙給予對應之該詞性而詞性化; S4、圖像化該等題目句子與該等求解句子:該使用者操作界面將每一該題目句子之該等詞彙與每一該求解句子之該等詞彙,分別依每一該題目句子的該等詞彙其對應於該題目句子中的位置與所對應的該詞性而轉換為一句子二維詞性編碼圖,與每一該求解句子的該等詞彙其對應於該求解句子中的位置與所對應的詞性而轉換為所對應之另一該句子二維詞性編碼圖; S5、對該等句子二維詞性編碼圖進行詞彙格變文法標籤設定:該使用者操作界面透過所連接之該神經網路運算模組而將每一該句子二維詞性編碼圖進行詞彙格變文法標籤設定,使該句子二維詞性編碼圖之每一該詞彙經運算而轉換為一詞彙格變文法標籤,其中,每一該詞彙所對應之該詞彙格變文法標籤是依格變文法之規則所定義,且該使用者操作界面將該題目句子所包含之該等詞彙與對應之該等詞彙格變文法標籤再轉換為一對應該題目句子之詞彙格變文法標籤表; S6、轉換為一命題語意網路:使用者操作界面依每一該題目句子所對應之該詞彙格變文法標籤表進行分析與辨識,使每一題目句子之該詞彙格變文法標籤表轉換為對應每一該題目句子之該命題語意網路; S7、轉換為一句子語意網路:該使用者操作界面連接一句子語意網路建立規則資料庫,該句子語意網路建立規則資料庫包含複數條利用該等詞彙格變文法標籤其對應之該等詞彙來構成句子語意網路之規則,該使用者操作界面將每一該命題語意網路之該等詞彙格變文法標籤依該句子語意網路建立規則資料庫而重新組合且轉換為對應之該句子語意網路; S8、轉換為一問題語意網路:該使用者操作界面連接一問題語意網路建立規則資料庫,該問題語意網路建立規則資料庫包含複數條將該等句子語意網路整合成為該問題語意網路之規則; S9、進行求解:該使用者操作界面連接一語意網路蔓延激發規則資料庫,並將該求解句子之該等詞彙對應至該問題語意網路,使該問題語意網路所對應之該等詞彙再依該蔓延激發理論規則資料庫進行蔓延運算,並產生對應該求解句子之答案。
- 如請求項1所述之基於神經網路運算模組與格變文法的文字語意理解方法,其中,該神經網路運算模組係為卷積神經網路(Convolutional Neural Network, CNN)。
- 如請求項1所述之基於神經網路運算模組與格變文法的文字語意理解方法,進一步地,該神經網路運算模組針對該等詞彙會依每一該詞彙其位於該題目句子中之位置與所對應的該詞性,而判斷與分類每一該詞彙所對應之該詞彙格變文法標籤。
- 如請求項2所述之基於神經網路運算模組與格變文法的文字語意理解方法,進一步地,卷積神經網路學習與設定該題目句子或該求解句子中,每一該詞彙所對應之該詞彙格變文法標籤。
- 如請求項1所述之基於神經網路運算模組與格變文法的文字語意理解方法,進一步地,該使用者操作界面將該等句子語意網路中使用相同之該詞彙者先產生連結關係,進而成為該問題語意網路。
- 如請求項5所述之基於神經網路運算模組與格變文法的文字語意理解方法,其中,該問題語意網路建立規則資料庫之規則是包含:將該等句子語意網路所含之相同該等詞彙中,該等詞彙所對應之該詞彙格變文法標籤之屬性為人者先進行結合,其次再依該等詞彙所對應之該詞彙格變文法標籤之屬性為物品者來結合。
- 如請求項1所述之基於神經網路運算模組與格變文法的文字語意理解方法,其中,該問題語意網路中之該等詞彙與該求解句子中之該等詞彙相同者,則該使用者操作界面會依該語意網路蔓延激發規則資料庫中之複數蔓延激發規則而自該問題語意網路之該等詞彙進行蔓延激發運算。
- 一種具有根據申請專利範圍第1項之基於神經網路運算模組與格變文法的文字語意理解方法之電子終端裝置,用以執行基於神經網路運算模組與格變文法的文字語意理解方法與顯示運算結果。
- 如請求項8所述之電子終端裝置,其中,該使用者操作界面更包含有一說明欄、一斷詞按鍵、一句子語意網路按鍵、一問題語意網路按鍵、一說明解題過程按鍵及一答案按鍵。
- 如請求項8所述之電子終端裝置,可選自個人電腦、筆記型電腦、個人數位助理(PDA)或行動電話。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109113841A TWI747246B (zh) | 2020-04-24 | 2020-04-24 | 基於神經網路運算模組與格變文法的文字語意理解方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109113841A TWI747246B (zh) | 2020-04-24 | 2020-04-24 | 基於神經網路運算模組與格變文法的文字語意理解方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202141362A TW202141362A (zh) | 2021-11-01 |
TWI747246B true TWI747246B (zh) | 2021-11-21 |
Family
ID=79907513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109113841A TWI747246B (zh) | 2020-04-24 | 2020-04-24 | 基於神經網路運算模組與格變文法的文字語意理解方法 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI747246B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170199928A1 (en) * | 2014-09-29 | 2017-07-13 | Huawei Technologies Co.,Ltd. | Method and device for parsing question in knowledge base |
CN107315737A (zh) * | 2017-07-04 | 2017-11-03 | 北京奇艺世纪科技有限公司 | 一种语义逻辑处理方法及系统 |
CN107967254A (zh) * | 2017-10-31 | 2018-04-27 | 科大讯飞股份有限公司 | 知识点预测方法及装置、存储介质、电子设备 |
US20190213498A1 (en) * | 2014-04-02 | 2019-07-11 | Brighterion, Inc. | Artificial intelligence for context classifier |
TW202009746A (zh) * | 2018-08-21 | 2020-03-01 | 良知股份有限公司 | 以讀者為中心進行文章分析的語意特徵分析系統 |
-
2020
- 2020-04-24 TW TW109113841A patent/TWI747246B/zh active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190213498A1 (en) * | 2014-04-02 | 2019-07-11 | Brighterion, Inc. | Artificial intelligence for context classifier |
US20170199928A1 (en) * | 2014-09-29 | 2017-07-13 | Huawei Technologies Co.,Ltd. | Method and device for parsing question in knowledge base |
CN107315737A (zh) * | 2017-07-04 | 2017-11-03 | 北京奇艺世纪科技有限公司 | 一种语义逻辑处理方法及系统 |
CN107967254A (zh) * | 2017-10-31 | 2018-04-27 | 科大讯飞股份有限公司 | 知识点预测方法及装置、存储介质、电子设备 |
TW202009746A (zh) * | 2018-08-21 | 2020-03-01 | 良知股份有限公司 | 以讀者為中心進行文章分析的語意特徵分析系統 |
Also Published As
Publication number | Publication date |
---|---|
TW202141362A (zh) | 2021-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112131366A (zh) | 训练文本分类模型及文本分类的方法、装置及存储介质 | |
CN107798140B (zh) | 一种对话系统构建方法、语义受控应答方法及装置 | |
CN111344779A (zh) | 训练和/或使用编码器模型确定自然语言输入的响应动作 | |
CN111708873A (zh) | 智能问答方法、装置、计算机设备和存储介质 | |
CN111898374B (zh) | 文本识别方法、装置、存储介质和电子设备 | |
CN113724882B (zh) | 基于问诊会话构建用户画像的方法、装置、设备和介质 | |
CN108363743A (zh) | 一种智能问题生成方法、装置和计算机可读存储介质 | |
CN114092707A (zh) | 一种图像文本视觉问答方法、系统及存储介质 | |
CN108153864A (zh) | 基于神经网络生成文本摘要的方法 | |
CN113987179A (zh) | 基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质 | |
CN109344242B (zh) | 一种对话问答方法、装置、设备及存储介质 | |
Guo et al. | Working memory-driven neural networks with a novel knowledge enhancement paradigm for implicit discourse relation recognition | |
CN111460132A (zh) | 一种基于图卷积神经网络的生成式会议摘要方法 | |
CN111695354A (zh) | 基于命名实体的文本问答方法、装置及可读存储介质 | |
CN113065344A (zh) | 一种基于迁移学习和注意力机制的跨语料库情感识别方法 | |
CN112101042A (zh) | 文本情绪识别方法、装置、终端设备和存储介质 | |
CN112364132A (zh) | 基于依存句法的相似度计算模型和系统及搭建系统的方法 | |
CN110795549A (zh) | 短文本对话方法、装置、设备及存储介质 | |
CN116385937B (zh) | 一种基于多粒度的跨模态交互框架解决视频问答的方法及系统 | |
CN116821373A (zh) | 基于图谱的prompt推荐方法、装置、设备及介质 | |
CN116186216A (zh) | 基于知识增强和双图交互的问题生成方法及系统 | |
CN110297894B (zh) | 一种基于辅助网络的智能对话生成方法 | |
CN116821294A (zh) | 一种基于隐式知识反刍的问答推理方法和装置 | |
CN114969459A (zh) | 一种基于认知双通道的认知推理的视觉问答方法 | |
CN108875024B (zh) | 文本分类方法、系统、可读存储介质及电子设备 |