JPWO2007138875A1 - 音声認識用単語辞書・言語モデル作成システム、方法、プログラムおよび音声認識システム - Google Patents

音声認識用単語辞書・言語モデル作成システム、方法、プログラムおよび音声認識システム Download PDF

Info

Publication number
JPWO2007138875A1
JPWO2007138875A1 JP2008517834A JP2008517834A JPWO2007138875A1 JP WO2007138875 A1 JPWO2007138875 A1 JP WO2007138875A1 JP 2008517834 A JP2008517834 A JP 2008517834A JP 2008517834 A JP2008517834 A JP 2008517834A JP WO2007138875 A1 JPWO2007138875 A1 JP WO2007138875A1
Authority
JP
Japan
Prior art keywords
word
class
speech recognition
language model
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008517834A
Other languages
English (en)
Inventor
三木 清一
清一 三木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2007138875A1 publication Critical patent/JPWO2007138875A1/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

学習テキストに出現しなかった単語を追加する際に、追加する単語に応じて単語クラス別単語生起モデル学習方法を選択して学習テキストに出現しなかった単語を認識できる単語辞書および言語モデルを作成できる音声認識用単語辞書・言語モデル作成システムを提供する。音声認識用単語辞書・言語モデル作成システム100は、学習テキスト101に出現しない単語である追加単語の単語クラス毎に単語クラス別学習方法知識記憶部109から推定方法情報を選択し、選択した推定方法情報に従い追加単語の単語生起モデルである追加単語生起モデルをクラス毎に作成する言語モデル推定手段111と、追加単語を単語辞書105に、追加単語生起モデルを単語クラス別単語生起モデルデータベース107にそれぞれ追加するデータベース混合手段112とを備えている。

Description

本発明は音声認識用単語辞書・言語モデル作成システム、音声認識用単語辞書・言語モデル作成方法および音声認識用単語辞書・言語モデル作成用プログラムに関し、特に統計的言語モデルを用いる音声認識装置において、言語モデル学習テキストに出現しなかった単語を精度よく単語辞書及び言語モデルに追加することができる音声認識用単語辞書・言語モデル作成システム、音声認識用単語辞書・言語モデル作成方法および音声認識用単語辞書・言語モデル作成用プログラムに関する。
関連する言語モデル学習方法の一例が、特許文献1に記載されている。図9に示すように、この関連する言語モデル学習装置500は、言語モデルを作成する部分に注目すると、単語辞書512と、クラス連鎖モデルメモリ513と、クラス内単語生起モデルメモリ514と、クラス化テキスト変換手段521と、クラス連鎖モデル推定手段522と、クラス化適用規則抽出手段523と、クラス別単語生起モデル推定手段524と、クラス連鎖モデル学習用テキストデータ530と、クラス内単語生起モデル学習用テキストデータ531と、クラス定義記述532と、クラス別学習方法知識533とから構成されている。
このような構成を有する前記言語モデル学習装置500はつぎのように動作する。
すなわち、この関連する装置では、言語モデルはクラス連鎖モデルとクラス内単語生起モデルから構成され、それぞれ、言語モデル学習用テキストデータをもとに、別々に学習される。クラス連鎖モデルは単語を抽象化したクラスがどのように連鎖するかを示すモデルとなっている。クラス内単語生起モデルは、前記クラスからどのように単語が生起するかを示すモデルとなっている。
クラス連鎖モデルを得る際、クラス連鎖モデル学習用テキストデータ530に対し、クラス化テキスト変換手段521がクラス定義記述532を参照してクラス列に変換する。クラス連鎖モデル推定手段522は前記クラス列を用いてクラス連鎖モデルを推定し、クラス連鎖モデルメモリ513に格納する。
一方、クラス内単語生起モデルについて、クラス内単語生起モデル学習用テキストデータ531に対してクラス化規則抽出手段523がクラス定義記述532を参照してクラスと単語の対応付けを行う。クラス別単語生起モデル推定手段524は、クラス別学習方法知識533を参照して各クラス毎に学習方法を決定し、必要に応じてクラスと単語の対応付けを参照してクラス内単語生起モデルを推定し、クラス内単語生起モデルメモリ514に格納する。
クラスに応じてクラス別学習方法知識533に事前に用意した学習方法を使い分けることで、高精度な言語モデルを得ることができる。
特開2003−263187号公報
第1の問題点は、関連する言語モデル学習方法では、学習テキストに出現しなかった単語を適切に単語辞書および言語モデルに反映できないということである。
その理由は、関連する言語モデル学習方法では学習テキストに出現しなかった単語を単語辞書や言語モデルに適切に反映できる手段を持たないためである。
第2の問題点は、関連する言語モデル学習方法では必ずしもクラス毎に最適なクラス別学習方法を用いることができないということである。
その理由は、関連する言語モデル学習方法ではクラス別学習方法を事前に決定しておく必要があり、実際にそれぞれのクラスについて観測されたデータに応じて学習方法を変更できないためである。
本発明の目的は、音声認識用単語辞書および言語モデルを作成する際に、学習テキストに出現しなかった単語を追加する際に、追加する単語に応じて単語クラス別単語生起モデル学習方法を選択して学習テキストに出現しなかった単語を認識できる単語辞書および言語モデルを作成できる音声認識用単語辞書・言語モデル作成システムを提供することにある。
本発明の他の目的は、各クラスに属する単語の学習テキストでの分布に応じて適切な単語クラス別単語生起モデル学習方法を自動的に選択して言語モデルを作成できる音声認識用単語辞書・言語モデル作成システムを提供することにある。
本発明の第1の音声認識用単語辞書・言語モデル作成システムは、学習テキストに出現しない単語である追加単語の単語クラス毎に単語クラス別学習方法知識記憶部から推定方法情報を選択し、選択した推定方法情報に従い追加単語の単語生起モデルである追加単語生起モデルをクラス毎に作成する言語モデル推定手段と、追加単語を単語辞書に、追加単語生起モデルを単語クラス別単語生起モデルデータベースにそれぞれ追加するデータベース混合手段とを備えている。
上記音声認識用単語辞書・言語モデル作成システムによれば、言語モデル推定手段は、追加単語の単語クラス毎に適切な言語モデル推定方法を単語クラス別学習方法記憶部から選択し、それに基づいて追加単語の言語モデルを作成する。データベース混合手段は、追加単語と追加単語の言語モデルを単語辞書と単語クラス別単語生起モデルデータベースにそれぞれ追加する。
そのため、学習テキストに出現しない追加単語をその単語のクラスに応じた適切な学習方法により単語辞書と言語モデルに追加することができる。
本発明の第2の音声認識用単語辞書・言語モデル作成システムは、学習方法知識データベースに含まれる分布形情報の中から学習テキストに含まれる単語のクラスごとの分布形に最も合致する分布形情報を選択し、選択した分布形情報に従って、学習テキストに出現しない単語である追加単語の生起モデルである追加単語生起モデルをクラス毎に作成する言語モデル推定手段と、追加単語を単語辞書に、追加単語生起モデルを単語クラス別単語生起モデルデータベースにそれぞれ追加するデータベース混合手段とを備えている。
上記第2の音声認識用単語辞書・言語モデル作成システムによれば、言語モデル推定手段は、学習テキストにおける単語の分布に基づいて、追加単語の言語モデルを推定するための分布形を選択する。
そのため、各クラスに属する単語の学習テキストでの分布に応じて適切な分布形を自動的に選択して言語モデルを作成することができる。
本発明の、音声認識用単語辞書・言語モデル作成方法は、単語生起モデルの推定方法を記述する推定方法情報を単語クラス毎に予め記憶した単語クラス別学習方法知識記憶部から、学習テキストに出現しない単語である追加単語の単語クラス毎に推定方法情報を選択し、選択した推定方法情報に従い追加単語の単語生起モデルである追加単語生起モデルをクラス毎に作成し、追加単語を単語辞書に、追加単語生起モデルを単語クラス別単語生起モデルデータベースにそれぞれ追加することにより音声認識用単語辞書と言語モデルを作成する。
上記音声認識用単語辞書・言語モデル作成方法によれば、追加単語の単語クラス毎に適切な言語モデル推定方法を単語クラス別学習方法記憶部から選択し、それに基づいて追加単語の言語モデルを作成し、追加単語と追加単語の言語モデルを単語辞書と単語クラス別単語生起モデルデータベースにそれぞれ追加する。
そのため、学習テキストに出現しない追加単語をその単語のクラスに応じた適切な学習方法により単語辞書と言語モデルに追加することができる。
本発明の第2の音声認識用単語辞書・言語モデル作成方法は、単語の生起確率の分布形を示す分布形情報を予め複数格納した学習方法知識データベースから、学習テキストに含まれる単語のクラスごとの分布形に最も合致する分布形情報を選択し、選択した分布形情報に従って、学習テキストに出現しない単語である追加単語の生起モデルである追加単語生起モデルをクラス毎に作成し、追加単語を単語辞書に、追加単語生起モデルを単語クラス別単語生起モデルデータベースにそれぞれ追加することにより音声認識用単語辞書と言語モデルを作成する。
上記第2の音声認識用単語辞書・言語モデル作成方法によれば、言語モデル推定手段は、学習テキストにおける単語の分布に基づいて、追加単語の言語モデルを推定するための分布形を選択する。
そのため、各クラスに属する単語の学習テキストでの分布に応じて適切な分布形を自動的に選択して言語モデルを作成することができる。
本発明の音声認識システムは、上記第1または第2の音声認識用単語辞書・言語モデル作成方法により作成された音声認識用単語辞書と単語クラス別単語生起モデルデータベース用いて音声認識を行う。
上記音声認識システムによれば、単語辞書と単語クラス別単語生起モデルデータベースには、クラスに応じた適切な学習方法により学習された追加単語とその生起モデルが含まれている。
そのため、学習テキストだけから生成した単語辞書と言語モデルを使用する場合に比べ、音声認識の精度を高めることができる。
本発明の、音声認識用単語辞書・言語モデル作成プログラムは、コンピュータに、単語生起モデルの推定方法を記述する推定方法情報を単語クラス毎に予め記憶した単語クラス別学習方法知識記憶部から、学習テキストに出現しない単語である追加単語の単語クラス毎に推定方法情報を選択する処理と、選択した推定方法情報に従い追加単語の単語生起モデルである追加単語生起モデルをクラス毎に作成する処理と、追加単語を単語辞書に、追加単語生起モデルを単語クラス別単語生起モデルデータベースにそれぞれ追加する処理とを実行させる。
上記音声認識用単語辞書・言語モデル作成プログラムによれば、追加単語の単語クラス毎に適切な言語モデル推定方法を単語クラス別学習方法記憶部から選択し、それに基づいて追加単語の言語モデルを作成し、追加単語と追加単語の言語モデルを単語辞書と単語クラス別単語生起モデルデータベースにそれぞれ追加する。
そのため、学習テキストに出現しない追加単語をその単語のクラスに応じた適切な学習方法により単語辞書と言語モデルに追加することができる。
本発明の第2の音声認識用単語辞書・言語モデル作成プログラムは、コンピュータに、 単語の生起確率の分布形を示す分布形情報を予め複数格納した学習方法知識データベースから、学習テキストに含まれる単語のクラスごとの分布形に最も合致する分布形情報を選択する処理と、選択した分布形情報に従って、学習テキストに出現しない単語である追加単語の生起モデルである追加単語生起モデルをクラス毎に作成する処理と、追加単語を単語辞書に、追加単語生起モデルを単語クラス別単語生起モデルデータベースにそれぞれ追加する処理とを実行させる。
上記第2の音声認識用単語辞書・言語モデル作成プログラムによれば、言語モデル推定手段は、学習テキストにおける単語の分布に基づいて、追加単語の言語モデルを推定するための分布形を選択する。
そのため、各クラスに属する単語の学習テキストでの分布に応じて適切な分布形を自動的に選択して言語モデルを作成することができる。
本発明によれば、追加単語の単語クラス毎に適切な言語モデル推定方法を単語クラス別学習方法記憶部から選択し、それに基づいて追加単語の言語モデルを作成し、追加単語と追加単語の言語モデルを単語辞書と単語クラス別単語生起モデルデータベースにそれぞれ追加する。
そのため、学習テキストに出現しない追加単語をその単語のクラスに応じた適切な学習方法により単語辞書と言語モデルに追加することができる。
以下、図を参照しながら本発明の一実施形態である言語モデル作成システム100の構成と動作について説明する。
図1を参照すると、言語モデル作成システム100(音声認識用辞書・言語モデル作成システムの一例)は、例えばパーソナルコンピュータから成り、単語クラス連鎖モデル推定手段102と、単語クラス別単語生起モデル推定手段103と、追加単語クラス別単語生起モデル推定手段111(言語モデル推定手段の一例)と、追加単語クラス別単語生起モデルデータベース混合手段112(データベース混合手段の一例)を備えている。
言語モデル作成システム100は、例えばハードディスク装置等の記憶装置を備え、この記憶装置には、学習テキスト101と、単語クラス定義記述104と、単語クラス連鎖モデルデータベース106と、単語クラス別単語生起モデルデータベース107と、単語辞書105と、追加単語リスト108と、単語クラス別学習方法知識109(単語クラス別学習方法知識記憶部の一例)と、追加単語クラス定義記述110とが記憶されている。単語クラス連鎖モデルデータベース106と単語クラス別単語生起モデルデータベース107とにより、言語モデル113が構成されている。
これらの手段はそれぞれ概略つぎのように動作する。
学習テキスト101は、事前に用意されるテキストデータである。
追加単語リスト108は、事前に用意される単語リストである。
単語辞書105は、学習テキスト101及び追加単語リスト108から得られる、音声認識対象となる単語のリストである。
単語クラス定義記述104は、事前に用意されるデータで、テキストに現れる単語についてその単語が属する単語クラスが記述される。例えば名詞や固有名詞、間投詞といった辞書(国語辞典等の一般的用途のもの)に記載されるような品詞を単語クラスとして用いることもできるし、形態素解析ツールを用いてテキストに自動的に付与された品詞を単語クラスとして用いることもできるし、単語の出現確率に基づくエントロピーを最小にする等の基準に基づく自動クラスタリング等の統計的手法を用いてデータから自動的に得られた単語クラスを用いてもよい。
追加単語クラス定義記述110は事前に用意されるデータで、追加単語クラス定義記述110には、追加単語リスト108に現れる単語についてその単語が属する単語クラスが記述される。前記単語クラスとしては、単語クラス定義記述104と同様に品詞や統計的手法に基づく単語クラスを用いることができる。
単語クラス連鎖モデル推定手段102は、学習テキスト101を単語クラス定義記述104に従いクラス列に変換し、単語クラスの連鎖確率を推定する。単語クラス連鎖モデルとしては例えばN−gramモデルを用いることができる。確率の推定方法としては例えば最尤推定を用いてもよい。その場合、次の数式1のように推定される(N−gramのN=2の場合)。
Figure 2007138875
ここで、cは単語クラス、Countは括弧内の事象が観測された回数を示す。
単語クラス連鎖モデルデータベース106は、単語クラス連鎖モデル推定手段102により得られた具体的な単語クラス連鎖モデルのデータベースを格納する。
単語クラス別単語生起モデル推定手段103は、学習テキストを単語クラスと、前記単語クラスに属する単語とに変換し、単語クラス別学習方法知識109に従って各クラスに応じた推定方法で単語クラス別単語生起モデルデータベースを推定する。例えば学習テキストを元に最尤推定する場合は、次の数式2を用いることができる。
Figure 2007138875
追加単語クラス別単語生起モデル推定手段111は、追加単語リスト108に含まれる単語それぞれについて、追加単語クラス定義記述110に従い単語クラスを決定し、単語クラス別学習方法知識109に従って各クラスに応じた推定方法で追加単語の単語クラス別単語生起モデルデータベース(追加単語生起モデルの一例)を推定する。例えば追加単語リストに含まれる単語の分布が一様分布であれば、前記推定方法には、次の数式3を用いることができる。
Figure 2007138875
追加単語クラス別単語生起モデルデータベース混合手段112は学習テキストに出現した単語に関する単語クラス別単語生起モデルデータベースと追加単語に関する単語クラス別単語生起モデルデータベースを混合して新たな単語クラス別単語生起モデルデータベースを生成し、単語クラス別単語生起モデルデータベース107に格納する。混合の仕方としては、例えば追加単語に一様分布1/Nを与え、学習テキストに出現した単語と混合する場合は、次の数式4を用いることで混合することができる。
Figure 2007138875
ここで、右辺のP(w|c)は追加単語wが学習テキストにも出現した場合の、学習テキストに出現した単語に関する単語クラス別単語生起モデルデータベースから得られる確率である。
追加単語に事前分布Cwが与えられている場合には、例えば次の数式5を用いることで混合できる。
Figure 2007138875
上記の各手段は、言語モデル作成システムのCPU(Central Processing Unit)がコンピュータプルグラムを実行し、言語モデル作成システム100のハードウェアを制御することにより実現される。
次に、図2ないし図5のフローチャートを参照して言語モデル作成システム100の全体の動作について詳細に説明する。
まず、学習テキスト101に基づく単語辞書105および言語モデル113の作成方法を図2ないし図4で説明する。
図2は、単語クラス連鎖モデルデータベース106の作成方法を説明するフローチャートである。
単語クラス連鎖モデル推定手段102は、まず、学習テキスト105を単語列に変換する(図2のステップA1)。次に、単語列を単語クラス定義記述104に従いクラス列に変換する(ステップA2)。さらに、クラス列から例えばN−gramの頻度を元に最尤推定を用いる等して学習辞書に含まれる単語について単語クラス連鎖モデルデータベースを推定する(ステップA3)。
図3は、単語辞書105の作成方法を説明するフローチャートである。
まず、学習テキスト101を単語列に変換する(図3のステップB1)。次に、単語列から異なり単語を抽出(同じ単語を抜き出さない)する(図3のステップB2)。さらに、異なり単語を列挙することで単語辞書105を構成する(図3のステップB3)。
図4は、学習テキスト101に出現する単語について単語クラス別単語生起モデルデータベースを作成する方法を説明するフローチャートである。
単語クラス別単語生起モデル推定手段103は、まず、学習テキスト101を単語列に変換する(図4のステップC1)。次に、単語列を単語クラス定義記述110に従いクラス列に変換する(図4のステップC2)。さらに、学習テキスト101に出現したクラスについてそれぞれ、単語クラス別学習方法知識109から単語クラス別単語生起モデル推定方法を選択する(図4のステップC3)。さらに、各単語について、選択された単語クラス別単語生起モデル推定方法に基づき単語クラス別単語生起モデルデータベースを推定する(図4のステップC4)。
次に、追加単語リストに基づく単語辞書105および言語モデル113の作成方法及び学習テキスト101に基づく言語モデルとの混合について図5、6で説明する。
図5は、追加単語を含む単語辞書105の作成方法を示すフローチャートである。
追加単語クラス別単語生起モデル推定手段111は、追加単語リスト106に含まれる追加単語のうち、学習テキスト101から得られた単語辞書105に含まれない単語を抽出する(図5のステップD1)。抽出された単語を単語辞書105に追加登録する(図5のステップD2)。
図6は、追加単語に関する言語モデルの作成方法を示すフローチャートである。
追加単語クラス別単語生起モデル推定手段111は、まず、追加単語リストを追加単語クラス定義記述110に従いクラスリストに変換する(図6のステップE1)。次に、単語クラス別学習方法知識109から各クラスに適した単語クラス別単語生起モデル推定方法を選択する(図6のステップE2)。さらに、各単語について、選択された単語クラス別単語生起モデル推定方法に基づき追加単語に関する単語クラス別単語生起モデルデータベース(追加単語生起モデル)を推定する(図6のステップE3)。
追加単語クラス別単語生起モデルデータベース混合手段112は、各単語について、学習テキストに出現した単語に関する単語クラス別単語生起モデルデータベースと追加単語に関する単語クラス別単語生起モデルを混合する(図6のステップE4)。
ここまで、追加単語リスト108が一つの場合について説明してきたが、追加単語リスト108が複数ある場合も同様である。ただし、追加単語リストが複数の場合、逐次的に追加する場合と一括して追加する場合の2種類の場合およびその組み合わせが考えられる。前者は例えば単語の追加が時間順で、一方は古く、他方は新しい場合等に生じると考えられる。後者は例えば複数の分野から単語を追加する場合等に生じると考えられる。これらは、既存の単語辞書および言語モデルとして一部の追加単語を含むとする(逐次的な追加)か含まないとする(一括して追加)かどちらかというだけの違いである。どちらの場合も本実施の形態で扱える。
前者の場合、以前の追加単語を含む言語モデルと、新たに追加された単語に関する言語モデルが混合されることとなる。この場合、新たな追加単語のうち、以前の追加単語にも含まれていた単語については他の追加単語に比べて強調されて追加されることとなり、同じ単語を繰り返し追加することによる強調の効果がある。しかしながら、逆にクラス毎の分布そのものの反映は弱められる。
後者の場合、学習テキストのみから学習された言語モデルに対し、以前の追加単語も含めて全ての追加単語が追加されることとなる。この場合は逐次的な追加と逆に、これまで追加された履歴を削除することにより、クラスの持つ性質をダイレクトに追加単語に反映できる。しかしながら単語追加の履歴が失われる。
次に、言語モデル作成システム100の効果について説明する。
本実施の形態では、追加単語リスト108を持ち、それらについてクラス毎に適切な単語クラス別単語生起モデル推定方法を選択して単語クラス別単語生起モデルデータベースを推定し、学習テキスト101に出現した単語に関する単語クラス別単語生起モデルと混合し、また追加単語リスト108を単語辞書105に追加するというように構成されているため、学習テキスト101に出現しなかった単語について適切な言語モデル113を作成でき、追加単語を含む単語辞書105を作成することができる。
次に、本発明の第2の実施形態である言語モデル作成システム200について図面を参照して詳細に説明する。言語モデル作成システム200は、図1の言語モデル作成システム100と多くの部分を共通とするので、共通する部分には図面に図1と同一の符号を付して説明を省略する。
図7を参照すると、図1の言語モデル作成システム100と比べ単語クラス別学習方法知識109がなくなり、単語クラス別単語生起分布計算手段201と、単語クラス別学習方法知識選択手段202と、学習方法知識データベース203が追加されている。
これらの手段はそれぞれ概略つぎのように動作する。
単語クラス別単語生起分布計算手段201は、学習テキストをクラスと、それに属する単語に変換されたものから、所定の方法に従って単語クラス別単語生起分布を計算する。例えば、テキスト中の頻度に基づいて最尤推定で単語クラス別単語生起分布を計算する。
学習方法知識データベース203には、所定の分布形が格納されている。分布形としては例えば一様分布や指数分布、所定の事前分布などがある。
単語クラス別学習方法知識選択手段202は、学習テキストから得られた各クラスの単語クラス別単語生起分布と、学習方法知識データベース203に記憶された所定の分布形を比較し、各クラス毎に適切な分布形を選択する。例えば固有名詞のように一様分布に近い分布形が学習テキストから得られる場合には固有名詞クラスに対して自動的に一様分布が選ばれる。
第1の実施の形態と異なり、単語クラス別単語生起モデル推定手段103と追加単語クラス別単語生起モデル推定手段111は単語クラス別学習方法知識選択手段202が決定した分布形を単語クラス別単語生起モデル推定方法として用いる。
次に、言語モデル作成システム200の効果について説明する。
言語モデル作成システム200では、学習テキスト101から計算された各クラスの単語クラス別単語生起分布に基づいて、学習方法知識データベース203に記憶された所定の分布形の中から各クラスの単語クラス別単語生起モデル推定方法を選択し、また追加単語リスト108を単語辞書に追加するというように構成されているため、学習テキスト101中の出現に応じた適切な単語クラス別単語生起モデル推定方法を選択でき、それを追加単語にも適用した言語モデルを113作成でき、また追加単語を含む単語辞書105を作成することができる。
次に、本発明の第3の実施形態である、音声認識システム300について説明する。
図8は、音声認識システム300の機能ブロック図である。
音声認識システム300は、例えばマイクロフォンから成り利用者が発生した音声を入力する入力部301と、入力部301から入力された音声を認識し文字列等の認識結果に変換する音声認識部302と、例えばディスプレイ装置からなり認識結果を出力する出力部303を備えている。
音声認識部302は、単語クラス別連鎖モデルデータベース106および単語クラス別単語生起モデルデータベース107から成る言語モデル113と単語辞書105を参照して音声認識を行う。
言語モデル113と単語辞書105は、図1の言語モデル作成システム100または図7の言語モデル作成システム200により作成されたものである。
次に、本発明の他の実施形態について逐次説明する。
上述した音声認識用単語辞書・言語モデル作成システムにおいて、推定方法は、単語の生起確率の分布を一様分布とした推定方法を含むようにしてもよい。
このようにすれば、地名や人名のように一様分布となることが知られている単語クラスに対して一様分布による推定方法を適用して精度のよい生起モデルを生成することができる。
上述した音声認識用単語辞書・言語モデル作成システムにおいて、推定方法は、単語の生起確率の分布を所定の事前分布とした推定方法を含むようにしてもよい。
上述した音声認識用単語辞書・言語モデル作成システムにおいて、分布形情報は、一様分布を含むようにしてもよい。
このようにすれば、地名や人名のように一様分布となることが知られている単語クラスに対して一様分布による推定方法を適用して精度のよい生起モデルを生成することができる。
上述した音声認識用単語辞書・言語モデル作成システムにおいて、分布形情報は、所定の事前分布を含むようにしてもよい。
上述した音声認識用単語辞書・言語モデル作成システムにおいて、単語クラスとして品詞を用いるようにしてもよい。
このようにすれば、単語を地名や人名といった内容情報、動詞や形容詞といった文法情報でクラス分けすることとなり、これらはそれぞれに固有の分布を持つと期待できる。また、一般の国語辞書等の既存リソースを用いてクラス分けを低コストに行うことができる。
上述した音声認識用単語辞書・言語モデル作成システムにおいて、単語クラスとして単語を形態素解析して得られる品詞を用いるようにしてもよい。
上述した音声認識用単語辞書・言語モデル作成システムにおいて、単語クラスとして単語の自動クラスタリングにより得られるクラスを用いるようにしてもよい。
このようにすれば、品詞を用いる場合に比べて、実際のテキストでの出現状況に内在する単語の特徴をよく反映することができる。
上述した音声認識用単語辞書・言語モデル作成方法において、推定方法は、単語の生起確率の分布を一様分布とした推定方法を含むようにしてもよい。
このようにすれば、地名や人名のように一様分布となることが知られている単語クラスに対して一様分布による推定方法を適用して精度のよい生起モデルを生成することができる。
上述した音声認識用単語辞書・言語モデル作成方法において、推定方法は、単語の生起確率の分布を所定の事前分布とした推定方法を含むようにしてもよい。
上述した音声認識用単語辞書・言語モデル作成方法において、分布形情報は、一様分布を含むようにしてもよい。
このようにすれば、地名や人名のように一様分布となることが知られている単語クラスに対して一様分布による推定方法を適用して精度のよい生起モデルを生成することができる。
上述した音声認識用単語辞書・言語モデル作成方法において、分布形情報は、所定の事前分布を含むようにしてもよい。
上述した音声認識用単語辞書・言語モデル作成方法において、単語クラスとして品詞を用いるようにしてもよい。
このようにすれば、単語を地名や人名といった内容情報、動詞や形容詞といった文法情報でクラス分けすることとなり、これらはそれぞれに固有の分布を持つと期待できる。また、一般の国語辞書等の既存リソースを用いてクラス分けを低コストに行うことができる。
上述した音声認識用単語辞書・言語モデル作成方法において、単語クラスとして単語を形態素解析して得られる品詞を用いるようにしてもよい。
上述した音声認識用単語辞書・言語モデル作成方法において、単語クラスとして単語の自動クラスタリングにより得られるクラスを用いるようにしてもよい。
このようにすれば、品詞を用いる場合に比べて、実際のテキストでの出現状況に内在する単語の特徴をよく反映することができる。
上述した音声認識用単語辞書・言語モデル作成プログラムにおいて、推定方法は、単語の生起確率の分布を一様分布とした推定方法を含むようにしてもよい。
このようにすれば、地名や人名のように一様分布となることが知られている単語クラスに対して一様分布による推定方法を適用して精度のよい生起モデルを生成することができる。
上述した音声認識用単語辞書・言語モデル作成プログラムにおいて、推定方法は、単語の生起確率の分布を所定の事前分布とした推定方法を含むようにしてもよい。
上述した音声認識用単語辞書・言語モデル作成プログラムにおいて、分布形情報は、一様分布を含むようにしてもよい。
このようにすれば、地名や人名のように一様分布となることが知られている単語クラスに対して一様分布による推定方法を適用して精度のよい生起モデルを生成することができる。
上述した音声認識用単語辞書・言語モデル作成プログラムにおいて、分布形情報は、所定の事前分布を含むようにしてもよい。
上述した音声認識用単語辞書・言語モデル作成プログラムにおいて、単語クラスとして品詞を用いるようにしてもよい。
このようにすれば、単語を地名や人名といった内容情報、動詞や形容詞といった文法情報でクラス分けすることとなり、これらはそれぞれに固有の分布を持つと期待できる。また、一般の国語辞書等の既存リソースを用いてクラス分けを低コストに行うことができる。
上述した音声認識用単語辞書・言語モデル作成プログラムにおいて、単語クラスとして単語を形態素解析して得られる品詞を用いるようにしてもよい。
上述した音声認識用単語辞書・言語モデル作成プログラムにおいて、単語クラスとして単語の自動クラスタリングにより得られるクラスを用いるようにしてもよい。
このようにすれば、品詞を用いる場合に比べて、実際のテキストでの出現状況に内在する単語の特徴をよく反映することができる。
本発明を実施形態に基づいて説明したが、本発明は上述した実施形態に限られるものではない。請求の範囲に記載された内容の趣旨に沿うものであれば、種々変更することはできるものである。
本発明の第1の実施形態である言語モデル作成システムのブロック図である。 言語モデル作成システムの単語クラス連鎖モデルデータベースの作成動作を示すフローチャートである。 言語モデル作成システムの単語辞書の作成動作を示すフローチャートである。 言語モデル作成システムの単語クラス別単語生起モデルデータベースの作成動作を示すフローチャートである。 言語モデル作成システムの追加単語を含む単語辞書の作成動作を示すフローチャートである。 言語モデル作成システムの追加単語に関する言語モデルの作成動作を示すフローチャートである。 本発明の第2の実施形態である言語モデル作成システムのブロック図である。 本発明の第3の実施形態である音声認識システムのブロック図である。 関連する言語モデル作成方法を説明する図である。
符号の説明
100 言語モデル作成システム
101 学習テキスト
102 単語クラス連鎖モデル推定手段
103 単語クラス別単語生起モデル推定手段
104 単語クラス定義記述
105 単語辞書
106 単語クラス連鎖モデルデータベース
107 単語クラス別単語生起モデルデータベース
108 追加単語リスト
109 単語クラス別学習方法知識
110 追加単語クラス定義記述
111 追加単語クラス別単語生起モデル推定手段
112 追加単語クラス別単語生起モデルデータベース混合手段
200 言語モデル作成システム
201 単語クラス別単語生起分布計算手段
202 単語クラス別学習方法知識選択手段
203 学習方法知識データベース
300 音声認識システム

Claims (28)

  1. 音声認識用の単語辞書と単語クラス別単語生起モデルデータベースと単語生起モデルの推定方法を記述する推定方法情報を単語クラス毎に予め記憶した単語クラス別学習方法知識記憶部とを備えた音声認識用単語辞書・言語モデル作成システムであって、
    学習テキストに出現しない単語である追加単語の前記単語クラス毎に前記単語クラス別学習方法知識記憶部から前記推定方法情報を選択し、選択した推定方法情報に従い前記追加単語の単語生起モデルである追加単語生起モデルを前記クラス毎に作成する言語モデル推定手段と、
    前記追加単語を前記単語辞書に、前記追加単語生起モデルを単語クラス別単語生起モデルデータベースにそれぞれ追加するデータベース混合手段とを備えたことを特徴とする音声認識用単語辞書・言語モデル作成システム。
  2. 前記推定方法は、単語の生起確率の分布を一様分布とした推定方法を含むことを特徴とする請求項1に記載の音声認識用単語辞書・言語モデル作成システム。
  3. 前記推定方法は、単語の生起確率の分布を所定の事前分布とした推定方法を含むことを特徴とする請求項1または請求項2に記載の音声認識用単語辞書・言語モデル作成システム。
  4. 音声認識用の単語辞書と単語クラス別単語生起モデルデータベースと単語の生起確率の分布形を示す分布形情報を予め複数格納した学習方法知識データベースとを備えた音声認識用単語辞書・言語モデル作成システムであって、
    前記学習方法知識データベースに含まれる前記分布形情報の中から学習テキストに含まれる単語の前記クラスごとの分布形に最も合致する前記分布形情報を選択し、選択した分布形情報に従って、学習テキストに出現しない単語である追加単語の生起モデルである追加単語生起モデルを前記クラス毎に作成する言語モデル推定手段と、
    前記追加単語を前記単語辞書に、前記追加単語生起モデルを単語クラス別単語生起モデルデータベースにそれぞれ追加するデータベース混合手段とを備えたことを特徴とする音声認識用単語辞書・言語モデル作成システム。
  5. 前記分布形情報は、一様分布を含むことを特徴とする請求項4に記載の音声認識用単語辞書・言語モデル作成システム。
  6. 前記分布形情報は、所定の事前分布を含むことを特徴とする請求項4または請求項5に記載の音声認識用単語辞書・言語モデル作成システム。
  7. 前記単語クラスとして品詞を用いることを特徴とする請求項1または請求項4に記載の音声認識用単語辞書・言語モデル作成システム。
  8. 前記単語クラスとして単語を形態素解析して得られる品詞を用いることを特徴とする請求項1または請求項4に記載の音声認識用単語辞書・言語モデル作成システム。
  9. 前記単語クラスとして単語の自動クラスタリングにより得られるクラスを用いることを特徴とする請求項1または請求項4に記載の音声認識用単語辞書・言語モデル作成システム。
  10. 単語生起モデルの推定方法を記述する推定方法情報を単語クラス毎に予め記憶した単語クラス別学習方法知識記憶部から、学習テキストに出現しない単語である追加単語の前記単語クラス毎に前記推定方法情報を選択し、
    選択した推定方法情報に従い前記追加単語の単語生起モデルである追加単語生起モデルを前記クラス毎に作成し、
    前記追加単語を前記単語辞書に、前記追加単語生起モデルを単語クラス別単語生起モデルデータベースにそれぞれ追加することを特徴とする音声認識用単語辞書・言語モデル作成方法。
  11. 前記推定方法は、単語の生起確率の分布を一様分布とした推定方法を含むことを特徴とする請求項10に記載の音声認識用単語辞書・言語モデル作成方法。
  12. 前記推定方法は、単語の生起確率の分布を所定の事前分布とした推定方法を含むことを特徴とする請求項10または請求項11に記載の音声認識用単語辞書・言語モデル作成方法。
  13. 単語の生起確率の分布形を示す分布形情報を予め複数格納した学習方法知識データベースから、学習テキストに含まれる単語の前記クラスごとの分布形に最も合致する前記分布形情報を選択し、
    選択した分布形情報に従って、学習テキストに出現しない単語である追加単語の生起モデルである追加単語生起モデルを前記クラス毎に作成し、
    前記追加単語を前記単語辞書に、前記追加単語生起モデルを単語クラス別単語生起モデルデータベースにそれぞれ追加することを特徴とする音声認識用単語辞書・言語モデル作成方法。
  14. 前記分布形情報は、一様分布を含むことを特徴とする請求項13に記載の音声認識用単語辞書・言語モデル作成方法。
  15. 前記分布形情報は、所定の事前分布を含むことを特徴とする請求項13または請求項14に記載の音声認識用単語辞書・言語モデル作成方法。
  16. 前記単語クラスとして品詞を用いることを特徴とする請求項10または請求項13に記載の音声認識用単語辞書・言語モデル作成方法。
  17. 前記単語クラスとして単語を形態素解析して得られる品詞を用いることを特徴とする請求項10または請求項13に記載の音声認識用単語辞書・言語モデル作成方法。
  18. 前記単語クラスとして単語の自動クラスタリングにより得られるクラスを用いることを特徴とする請求項10または請求項13に記載の音声認識用単語辞書・言語モデル作成方法。
  19. 前記請求項10ないし前記請求項18のいずれかひとつに記載の方法により作成された音声認識用単語辞書と単語クラス別単語生起モデルデータベース用いる音声認識システム。
  20. コンピュータに、
    単語生起モデルの推定方法を記述する推定方法情報を単語クラス毎に予め記憶した単語クラス別学習方法知識記憶部から、学習テキストに出現しない単語である追加単語の前記単語クラス毎に前記推定方法情報を選択する処理と、
    選択した推定方法情報に従い前記追加単語の単語生起モデルである追加単語生起モデルを前記クラス毎に作成する処理と、
    前記追加単語を前記単語辞書に、前記追加単語生起モデルを単語クラス別単語生起モデルデータベースにそれぞれ追加する処理とを実行させることを特徴とする音声認識用単語辞書・言語モデル作成プログラム。
  21. 前記推定方法は、単語の生起確率の分布を一様分布とした推定方法を含むことを特徴とする請求項20に記載の音声認識用単語辞書・言語モデル作成プログラム。
  22. 前記推定方法は、単語の生起確率の分布を所定の事前分布とした推定方法を含むことを特徴とする請求項20または請求項21に記載の音声認識用単語辞書・言語モデル作成プログラム。
  23. コンピュータに、
    単語の生起確率の分布形を示す分布形情報を予め複数格納した学習方法知識データベースから、学習テキストに含まれる単語の前記クラスごとの分布形に最も合致する前記分布形情報を選択する処理と、
    選択した分布形情報に従って、学習テキストに出現しない単語である追加単語の生起モデルである追加単語生起モデルを前記クラス毎に作成する処理と、
    前記追加単語を前記単語辞書に、前記追加単語生起モデルを単語クラス別単語生起モデルデータベースにそれぞれ追加する処理とを実行させることを特徴とする音声認識用単語辞書・言語モデル作成プログラム。
  24. 前記分布形情報は、一様分布を含むことを特徴とする請求項23に記載の音声認識用単語辞書・言語モデル作成プログラム。
  25. 前記分布形情報は、所定の事前分布を含むことを特徴とする請求項23または請求項24に記載の音声認識用単語辞書・言語モデル作成プログラム。
  26. 前記単語クラスとして品詞を用いることを特徴とする請求項20または請求項23に記載の音声認識用単語辞書・言語モデル作成プログラム。
  27. 前記単語クラスとして単語を形態素解析して得られる品詞を用いることを特徴とする請求項20または請求項23に記載の音声認識用単語辞書・言語モデル作成プログラム。
  28. 前記単語クラスとして単語の自動クラスタリングにより得られるクラスを用いることを特徴とする請求項20または請求項23に記載の音声認識用単語辞書・言語モデル作成プログラム。
JP2008517834A 2006-05-31 2007-05-17 音声認識用単語辞書・言語モデル作成システム、方法、プログラムおよび音声認識システム Withdrawn JPWO2007138875A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006150961 2006-05-31
JP2006150961 2006-05-31
PCT/JP2007/060136 WO2007138875A1 (ja) 2006-05-31 2007-05-17 音声認識用単語辞書・言語モデル作成システム、方法、プログラムおよび音声認識システム

Publications (1)

Publication Number Publication Date
JPWO2007138875A1 true JPWO2007138875A1 (ja) 2009-10-01

Family

ID=38778394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008517834A Withdrawn JPWO2007138875A1 (ja) 2006-05-31 2007-05-17 音声認識用単語辞書・言語モデル作成システム、方法、プログラムおよび音声認識システム

Country Status (4)

Country Link
US (1) US20090106023A1 (ja)
JP (1) JPWO2007138875A1 (ja)
CN (1) CN101454826A (ja)
WO (1) WO2007138875A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4897737B2 (ja) * 2008-05-12 2012-03-14 日本電信電話株式会社 単語追加装置、単語追加方法、そのプログラム
JP2010224194A (ja) * 2009-03-23 2010-10-07 Sony Corp 音声認識装置及び音声認識方法、言語モデル生成装置及び言語モデル生成方法、並びにコンピューター・プログラム
US8719023B2 (en) * 2010-05-21 2014-05-06 Sony Computer Entertainment Inc. Robustness to environmental changes of a context dependent speech recognizer
JP5824829B2 (ja) * 2011-03-15 2015-12-02 富士通株式会社 音声認識装置、音声認識方法及び音声認識プログラム
JP5480844B2 (ja) * 2011-05-16 2014-04-23 日本電信電話株式会社 単語追加装置、単語追加方法及びそのプログラム
US8938391B2 (en) 2011-06-12 2015-01-20 Microsoft Corporation Dynamically adding personalization features to language models for voice search
JP5942559B2 (ja) * 2012-04-16 2016-06-29 株式会社デンソー 音声認識装置
CN102789779A (zh) * 2012-07-12 2012-11-21 广东外语外贸大学 一种语音识别系统及其识别方法
CN103971677B (zh) * 2013-02-01 2015-08-12 腾讯科技(深圳)有限公司 一种声学语言模型训练方法和装置
CN103578464B (zh) * 2013-10-18 2017-01-11 威盛电子股份有限公司 语言模型的建立方法、语音辨识方法及电子装置
US9437189B2 (en) 2014-05-29 2016-09-06 Google Inc. Generating language models
JP6485941B2 (ja) * 2014-07-18 2019-03-20 日本放送協会 言語モデル生成装置、およびそのプログラム、ならびに音声認識装置
JP6930179B2 (ja) * 2017-03-30 2021-09-01 富士通株式会社 学習装置、学習方法及び学習プログラム
WO2021024613A1 (ja) * 2019-08-06 2021-02-11 株式会社Nttドコモ 単語重み計算システム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62235990A (ja) * 1986-04-05 1987-10-16 シャープ株式会社 音声認識方式
JP2964507B2 (ja) * 1989-12-12 1999-10-18 松下電器産業株式会社 Hmm装置
IT1279171B1 (it) * 1995-03-17 1997-12-04 Ist Trentino Di Cultura Sistema di riconoscimento di parlato continuo
US5835888A (en) * 1996-06-10 1998-11-10 International Business Machines Corporation Statistical language model for inflected languages
JP3264626B2 (ja) * 1996-08-21 2002-03-11 松下電器産業株式会社 ベクトル量子化装置
US6092038A (en) * 1998-02-05 2000-07-18 International Business Machines Corporation System and method for providing lossless compression of n-gram language models in a real-time decoder
JP3004254B2 (ja) * 1998-06-12 2000-01-31 株式会社エイ・ティ・アール音声翻訳通信研究所 統計的シーケンスモデル生成装置、統計的言語モデル生成装置及び音声認識装置
US7120582B1 (en) * 1999-09-07 2006-10-10 Dragon Systems, Inc. Expanding an effective vocabulary of a speech recognition system
JP3907880B2 (ja) * 1999-09-22 2007-04-18 日本放送協会 連続音声認識装置および記録媒体
JP3415585B2 (ja) * 1999-12-17 2003-06-09 株式会社国際電気通信基礎技術研究所 統計的言語モデル生成装置、音声認識装置及び情報検索処理装置
JP2002207495A (ja) * 2001-01-11 2002-07-26 Nippon Hoso Kyokai <Nhk> 遠隔単語追加登録システムおよび方法
JP2002358095A (ja) * 2001-03-30 2002-12-13 Sony Corp 音声処理装置および音声処理方法、並びにプログラムおよび記録媒体
JP2003186494A (ja) * 2001-12-17 2003-07-04 Sony Corp 音声認識装置および方法、記録媒体、並びにプログラム
JP2003263187A (ja) * 2002-03-07 2003-09-19 Mitsubishi Electric Corp 言語モデル学習方法、その装置、そのプログラムおよびそのプログラムの記録媒体ならびに言語モデル学習を用いた音声認識方法、その装置、そのプログラムおよびそのプログラムの記録媒体
US20050256715A1 (en) * 2002-10-08 2005-11-17 Yoshiyuki Okimoto Language model generation and accumulation device, speech recognition device, language model creation method, and speech recognition method
AU2003277587A1 (en) * 2002-11-11 2004-06-03 Matsushita Electric Industrial Co., Ltd. Speech recognition dictionary creation device and speech recognition device
US7603267B2 (en) * 2003-05-01 2009-10-13 Microsoft Corporation Rules-based grammar for slots and statistical model for preterminals in natural language understanding system
US7478038B2 (en) * 2004-03-31 2009-01-13 Microsoft Corporation Language model adaptation using semantic supervision
JP4705023B2 (ja) * 2004-06-10 2011-06-22 パナソニック株式会社 音声認識装置、音声認識方法、及びプログラム
US20080091427A1 (en) * 2006-10-11 2008-04-17 Nokia Corporation Hierarchical word indexes used for efficient N-gram storage
JP4446313B2 (ja) * 2006-12-15 2010-04-07 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声処理用の辞書に登録するべき新規語句を検索する技術

Also Published As

Publication number Publication date
CN101454826A (zh) 2009-06-10
US20090106023A1 (en) 2009-04-23
WO2007138875A1 (ja) 2007-12-06

Similar Documents

Publication Publication Date Title
JPWO2007138875A1 (ja) 音声認識用単語辞書・言語モデル作成システム、方法、プログラムおよび音声認識システム
JP6972265B2 (ja) ポインタセンチネル混合アーキテクチャ
US11568855B2 (en) System and method for defining dialog intents and building zero-shot intent recognition models
US11948058B2 (en) Utilizing recurrent neural networks to recognize and extract open intent from text inputs
JP5901001B1 (ja) 音響言語モデルトレーニングのための方法およびデバイス
US10262062B2 (en) Natural language system question classifier, semantic representations, and logical form templates
JP2005084681A (ja) 意味的言語モデル化および信頼性測定のための方法およびシステム
US11113335B2 (en) Dialogue system and computer program therefor
CN111145718A (zh) 一种基于自注意力机制的中文普通话字音转换方法
JP6291443B2 (ja) 接続関係推定装置、方法、及びプログラム
US11636272B2 (en) Hybrid natural language understanding
WO2022048194A1 (zh) 事件主体识别模型优化方法、装置、设备及可读存储介质
US11526512B1 (en) Rewriting queries
US9135326B2 (en) Text mining method, text mining device and text mining program
Kim et al. Sequential labeling for tracking dynamic dialog states
JP2019139574A (ja) 情報提供装置、情報提供方法、およびプログラム
CN112579733A (zh) 规则匹配方法、规则匹配装置、存储介质及电子设备
KR101677859B1 (ko) 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치
JPWO2014073206A1 (ja) 情報処理装置、及び、情報処理方法
JP2004198597A5 (ja)
JP7058574B2 (ja) 情報処理装置、情報処理方法、およびプログラム
WO2022022049A1 (zh) 文本长难句的压缩方法、装置、计算机设备及存储介质
KR102358485B1 (ko) 도메인 자동 분류 대화 시스템
KR101255468B1 (ko) 대화 의도를 분류하는 방법
CN112632956A (zh) 文本匹配方法、装置、终端和存储介质

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20100803