TWM650497U

TWM650497U - 使用簡化標籤序列提昇自然語言理解的語意分析系統

Info

Publication number: TWM650497U
Application number: TW112209563U
Authority: TW
Inventors: 陳威廷
Original assignee: 賽微科技股份有限公司
Priority date: 2023-09-05
Filing date: 2023-09-05
Publication date: 2024-01-11

Abstract

本創作提供一種語意分析系統，包括一語音辨識模組，用以對一語音文句進行辨識；一標籤字典模組，與該語音辨識模組耦接，用以將該語音文句轉換為一標籤序列；以及一語意分析模組，與該標籤字典模組耦接，用以將該標籤序列處理成一語意序列。藉此以精簡過後的輸入輸出對語意分析模組進行訓練，進而減少本創作語意分析系統的複雜度並提昇訓練效率與精準度。

Description

使用簡化標籤序列提昇自然語言理解的語意分析系統

本創作係關於一種語意分析系統，特別是關於一種語意分析系統，特別是指一種使用簡化標籤序列提昇自然語言理解、訓練效率以及準確率的語意分析系統。

過去，語意分析技術多採用純文字作為輸入與輸出，需要使用較複雜的模型才能達到相對理想的辨識率。而這些模型通常使用循環神經網路(Recurrent Neutral Network，RNN)架構，由於其時間序列特性，平行運算較難實現，因此訓練效率較低。

另外，也有採用規則式的做法，但這通常需要專家知識，且對於不在規則範圍內的語句容易出現辨識錯誤，因此效果不佳。多數做法需要將不同領域分開訓練，若需部署多個領域，則需要進行多次耗時的訓練。

本創作者鑑於前述的問題，進而用心研究開發，因此本創作主要目的係在提供一種語意分析系統，透過使用者定義的標籤字典替換文句中的字詞，並且將其轉換為標籤序列(Tagged Sequence)做為語意分析(Semantic Parser)模組的輸入，並將輸出的格式轉換為語意序列(Semantic Sequence)；以此精簡過後的輸入輸出對語意分析(Semantic Parser)模組進行訓練，進而減少本創作語意分析系統的複雜度並提昇訓練效率與精準度。

為達上述的目的，本創作提供一種語意分析系統，包括一語音辨識模組，用以對一語音文句進行辨識；一標籤字典模組，與該語音辨識模組耦接，用以將該語音文句轉換為一標籤序列；以及一語意分析模組，與該標籤字典模組耦接，用以將該標籤序列處理成一語意序列。

在一些實施例中，該語音文句包括多個字詞。

在一些實施例中，該標籤字典模組將該多個字詞轉換成相對應的一標籤，並將各該標籤標上對應的一編號。

在一些實施例中，該多個字詞具有多個相同的標籤，該等標籤係依序標上該編號。

在一些實施例中，該等字詞中的其中之一具有多個標籤，該等標籤係依據英文字母順序拼接在一起。

在一些實施例中，該等字詞中的其中之一或多個沒有標籤，係設定為一未知標籤或將該字詞設定為一標籤。

在一些實施例中，該語音辨識模組係為一語音辨識系統神經網路模型。

在一些實施例中，該語意分析模組係為一跨領域序列到序列模型。

在一些實施例中，該語意分析模組係透過一跨領域批次推論而將該標籤序列處理成該語意序列。

100:語意分析系統

110:語音辨識模組

120:標籤字典模組

121:標籤字典

130:語意分析模組

140:語音文句

150:標籤序列

160:語意序列

圖1為本創作語意分析系統的結構方塊示意圖。

關於本創作藉以達到上述目的之技術手段，茲以下列實施型態配合圖示於下文作詳細說明，俾令鈞上深入瞭解並認同之。

圖1為本創作語意分析系統的結構方塊示意圖。請參考圖1，本創作的語意分析系統100係包括一語音辨識模組110、一標籤字典模組120以及一語意分析模組130。

語音辨識模組110用以對一語音文句140進行辨識。在一些實施例中，語音辨識模組110係為一語音辨識系統(Automatic Speech Recognition，ASR)神經網路模型。所述的語音文句140係可為一般人的說話語音的句子內容。在一些實施例中，語音文句140包括多個字詞。

標籤字典模組120係與語音辨識模組110耦接，用以將語音文句140轉換為一標籤序列。意即，語音辨識模組110對語音文句140進行辨識之後取得多個語音辨識的結果後，透過在標籤字典模組120內的使用者所定義的標籤字典(Tag Lexicon)121以將欲進行辨識的語音文句140轉換為一標籤序列 (Tagged Sequence)150，將語音文句140的所有字詞轉換成相對應的一標籤，接著對各標籤標上相對應的一編號。若有多個相同的標籤的字詞，則會依照先後順序標上編號。若某個字詞包含多個標籤，則會依照標籤的字母順序拼接在一起。如果遇到沒有標籤的字詞，則可以根據使用者設定轉為一未知(unknow，Unk)標籤，或者將字詞本身當成標籤。

以「AC DOWN BY FIVE」為例，根據標籤字典模組120的標籤字典轉換後的結果如下。

以「AIR CON FACE AND FLOOR」為例，其中「FACE」與「FLOOR」皆具有「<Mode>」標籤，則依序對其編上編號，其表示如下。

以「BACK」為例，同時擁有返回、後面、後座的意思，因此產生三個標籤「Back」、「Position」、「Seat」，轉換成標籤序列其表示如下。

以「LISTEN TO LADY GAGA POKER FACE」為例，假設「POKER FACE」是一首新歌而不在標籤字典模組120的標籤字典裡面，則會被標為Unk(即未知標籤)如下。

語意分析(Semantic Parser)模組130係與標籤字典模組120耦接，用以將標籤序列150處理成一語意序列(Semantic Sequence)160。意即，將標籤序列150輸入到語意分析模組130內進行跨領域批次推論(Cross-Domain Batch Inference)以得到語意序列160的輸出。在一些實施例中，語意分析模組係為一跨領域序列到序列模型(Cross-Domain Sequence-To-Sequence Model)。語意分析模組130為序列對序列(Sequence-To-Sequence)的架構，並且不依賴於任何特定語言的預訓練模型，能根據機器與資料規模調整模型大小。

語意序列160是一種簡化過後的語意理解結構，將階層式的語意結構簡化為平展序列，此序列可透過訓練資料歸納得出。而在訓練階段時，會將資料集整理成標籤序列150與語意序列160的對應規則。這兩個序列經過精密的設計，能大幅減少標籤字典模組120中標籤字典的數量，降低本創作的輸入輸出空間大小，因此使得本創作擁有較低的複雜度。

綜上所述，本創作的語意分析系統100係透過使用者定義的標籤字典121替換文句中的字詞，並且將其轉換為標籤序列150做為語意分析模組130的輸入，並將輸出的格式轉換為語意序列160；以此精簡過後的輸入輸出對語意分析模組130進行訓練，進而減少本創作語意分析系統100的複雜度並提昇訓練效率與精準度。