JP6070809B1 - 自然言語処理装置及び自然言語処理方法 - Google Patents
自然言語処理装置及び自然言語処理方法 Download PDFInfo
- Publication number
- JP6070809B1 JP6070809B1 JP2015236446A JP2015236446A JP6070809B1 JP 6070809 B1 JP6070809 B1 JP 6070809B1 JP 2015236446 A JP2015236446 A JP 2015236446A JP 2015236446 A JP2015236446 A JP 2015236446A JP 6070809 B1 JP6070809 B1 JP 6070809B1
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- unit
- natural language
- sentence
- analysis processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 105
- 238000003058 natural language processing Methods 0.000 title claims abstract description 48
- 238000004458 analytical method Methods 0.000 claims abstract description 450
- 230000004044 response Effects 0.000 claims abstract description 12
- 238000012882 sequential analysis Methods 0.000 claims abstract description 9
- 230000008569 process Effects 0.000 claims description 91
- 230000006870 function Effects 0.000 claims description 13
- 230000002452 interceptive effect Effects 0.000 claims description 7
- 230000000877 morphologic effect Effects 0.000 claims description 7
- 230000003993 interaction Effects 0.000 claims 1
- 230000000717 retained effect Effects 0.000 claims 1
- 241000282414 Homo sapiens Species 0.000 abstract description 14
- 241000282412 Homo Species 0.000 description 15
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 230000009471 action Effects 0.000 description 5
- 238000012950 reanalysis Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 241000277269 Oncorhynchus masou Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000012482 interaction analysis Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
Description
しかしながら、問題解決行為の内容が確定した時点で回答文を生成するということ自体は、問題解決行為の内容が確定するまで回答文が生成されないことを意味しており、コンピュータと会話している人間にとっては、極めて不自然な会話になってしまう。つまり、通常の人間同士での会話と同じような感覚での会話にはほど遠いものとなる。
現状のコンピュータによる質問応答処理では、基本的に一問一答型で文脈を考慮せず直前の問いに対して回答を行うものであり、上述したような様々なやり取りがあった場合、質問をした人から見て、非常に不自然な回答しか得られないことになる。また、実際の会話文は、必ずしも日本語の文法規則に従った整った文であるとは限らないため、コンピュータが会話文の意味を正しく理解できないことが多々ある。その結果、人間同士で対話するような感覚での自動対話が実現できていないという問題がある。
そして、自然言語文の要素ごとに異なる解析する複数の解析処理部が用意され、解析可能な単位の自然言語文の一部が入力するごとに、各入力の単位に対して複数の解析処理部の各解析処理部で逐次的かつ並列的に解析を行う対話解析・生成部と、対話解析・生成部における各解析処理部の解析結果に基づいて、対話応答文を得る文生成部とを備える。
さらに、対話解析・生成部に用意された各解析処理部は、自らの解析処理部での直前又はそれ以前の解析結果と、他の解析処理部での直前又はそれ以前の解析結果とを取得し、この取得した解析結果を参照して、単一又は制限された数の解析結果を得るようにし、対話解析・生成部の各解析処理部での単一又は制限された数の解析結果に基づいて、解析処理部の中の1つの解析処理部である文生成部で、入力した自然言語文に対応した対話応答文を生成して、出力部に出力するようにした。
そして、自然言語文の要素ごとに異なる解析を行う複数の解析処理を行う機能(以下、「解析処理機能」という)を有する各解析処理部が用意され、解析可能な単位の自然言語文の一部が入力するごとに、各入力の単位に対して複数の解析処理部の各解析処理部において逐次的かつ並列的に解析を行う逐次解析ステップと、各解析処理部における逐次解析ステップの各解析結果に基づいて、各解析処理部の中の1つの解析処理部である文生成部において、入力した自然言語文に対応する対話応答文を得る文生成ステップと、文生成部で生成した対話応答文を、出力部に出力する出力ステップとを含む。
さらに、解析処理部は、自らの解析処理部での直前又はそれ以前の解析結果と、他の解析処理部での直前又はそれ以前の解析結果とを取得し、この取得した解析結果を参照して、単一又は制限された数の解析結果を得るようにした。
なお、自然言語文であっても、特に音声の場合は文の区切りは明確ではない。以下では説明をわかりやすくするために、おおむね文と言われる程度の単位を想定して自然言語文という。
したがって、本発明によると、人間同士が会話する場合と同様に、コンピュータとの会話が自然にできるようになる。
さらに、このように自然な会話ができるように作られたシステム内の各解析部は、従来のツールに比べ人間に近い言語の扱いができるので、より高い性能を発揮する。
[1.システム全体の構成例]
図1は、本例の自然言語処理装置の全体構成例を示す。
本例の自然言語処理装置は、対話解析・生成部10を備え、音声入力部1から入力された音声データ、またはテキスト入力部2から入力されたテキストデータが、対話解析・生成部10に供給される。
対話解析・生成部10は、データ処理を実行するコンピュータで構成され、入力した音声データを音声認識処理によりテキスト化すると共に、テキスト化したデータの解析処理を実行する。テキスト入力部2から入力されたテキストデータを処理する場合、対話解析・生成部10は、音声認識処理を省略して、入力されたテキストデータを直接解析処理する。
具体的には、例えば図1に示すように、最初の単位の自然言語文の一部が入力することで、解析部で最初の解析が行われて結果Aが得られ、以後、1単位の自然言語文が入力するごとに、結果B、結果C、・・・と順次(逐次的に)解析結果を得る解析部が形成され、この形成された解析部によって解析が実行される。この単位は解析部によって異なってもよい。
逐次的に形成される解析部は、それぞれ個別の解析機能を備えた複数の解析処理部を備え、その複数の解析処理部で並列的に解析が実行される。なお、対話解析・生成部10が備える複数の解析処理部の詳細については後述する(図2)。
対話解析・生成部10が解析処理を行う際に参照するデータベース5は、単なる項目の列挙ではなく異なる解析部の状態間の組み合わせのエントリが、それぞれに確信度を持った形で格納される。確信度は、各エントリがそのときの解析結果の確からしさを示す値である。データベース5の内容と確信度は、学習によって構築する。学習を行う過程では、過去の学習の過程で見たことがあるパターンほど、高い確信度を割り振る処理が行われる。確信度の詳細については後述する。
図2は、対話解析・生成部10が備える複数の解析処理部の構成例を示す。
対話解析・生成部10は、音声認識部11、相槌・割込判定部12、非言語情報部13、形態素解析部14、品詞解析部15、構文解析部16、述語項・格解析部17、照応関係解析部18、対話戦略部19、文生成部20、及び音声合成部21を備える。
以下、これら音声認識部11から音声合成部21までの個々の処理部を総称して「解析処理部」と呼ぶことにする。
上述の各解析処理部11〜21は、図2に示すように、文の一部を単位として解析を行うそれぞれの解析部に設けられるものである。
そして、各解析処理部11〜21は、相互に解析結果のやり取りを行いながら解析処理を進めて行く。
音声認識部11は、音声入力部1に入力された音声の音声波形データが供給され、その音声波形データから音素の認識処理を行う。音声認識部11で認識される音素は、母音と子音などで構成される。音素の認識には、音声波形以外の解析部の推測結果を用いてもよい。このようにほかのすべての解析部の推測結果を総合して用いうることは、以下のほかの判定部でも同様である。
相槌・割込判定部12は、認識した文の終わりや、一時的な音声の途切れなどから、対話用の文で相槌を入れるタイミングや、対話用の文を割り込ませるタイミングを判定する処理を行う。
非言語情報部13は、言語に表すことができない音の情報の処理を行う。言語に表すことができない音の情報とは、例えばイントネーション,アクセント,語尾上げ,語調などの情報や、短音,長音などの情報が含まれる。さらには、ジェスチャーや表情など音声以外の情報が入ってもよい。この非言語情報部13によって解析処理された情報を使うことで、例えば語尾上げと判定したとき、認識した文が疑問文であることが分かるようになる。
品詞解析部15は、形態素解析部14で判定された単語の品詞を解析する処理を行う。品詞解析部15での解析により、動詞,名詞,助詞,接続詞などの品詞が判別される。
構文解析部16は、品詞解析部15で解析された品詞の係り受け構造を解析する。
述語項・格解析部17は、係り受け構造の解析結果から各単語の主語・述語の関係などの、各単語の間の意味的な役割を解析する。
照応関係解析部18は、代名詞の関係を解析する。
そして、各解析処理部11〜21は、並列的に解析処理を実行する際に、自らの解析処理部及び他の解析処理部で行われた前段の解析結果を利用する。このとき、各解析処理部11〜21は、算出した確信度についても取得する。
この例では、確信度の値は“0”から“1”までの間の値であり、確信度が最も高いのが“1”で、確信度が最も低いのが“0”となっている。
なお、ここでは各解析処理部11〜21は、単一の解析結果を得るようにした。本例の自然言語処理装置では、このように解析結果を単一のものに制限することが最も好ましいが、上位2つの解析結果などの限られた数の解析結果を得るようにしてもよい。
次に、図2〜図4を参照して、各解析処理部11〜21が解析処理を逐次的かつ並列的に行う例について説明する。なお、以下に説明する各段の解析結果A,Bとして示す例は、認識処理を分かりやすく説明するためのものであり、実際の音声や文の解析処理では、より細かく行われることがある。また、ここでは音声入力時の例を説明するが、入力がテキストである場合には、音声認識処理は実行されない。さらに、出力が音声ではなくテキストである場合には、音声合成処理も実行されない。
図2では、1段目に生成される解析結果Aで、音声認識部11が[watashi]の音素を認識し、2段目に生成される解析結果Bで、音声認識部11が[ga]の音素を認識する例を示す。
非言語情報部13は[短音]と判断し、形態素解析部14は[私]と判断し、品詞解析部15は[代名詞]と判断する。
このように、1段目の各解析処理部11〜21で、図2に示すように1つの解析結果Aが得られる。
2段目の結果Bとして、音声認識部11が[ga]の音素を認識したときには、相槌・割込判定部12は[ga]が相槌・割り込みに関して発話の区切りと認識し、相槌や割込ができる状態である[相槌・割込可]と判断する。
さらに、対話戦略部19は対話戦略として[反論]を行うと判断する。文生成部20と音声合成部21は、前段の解析結果Aの判断を継続する。すなわち、文生成部20は反論を行う対話文として[いや]を生成し、音声合成部21が[iya]という発音の音声データを得る。なお、解析結果A,Bでの対話戦略や、その対話戦略に基づいた対話文は一つの例である。
なお、入力された音素に続く音素を予測する先読みが可能である場合には、各解析処理部11〜21は、その先読みで予測した結果を利用して解析処理を行う。
例えば、1段目の対話戦略部19を例に挙げて説明すると、音声認識部11で認識した入力音素[watashi:私]だけから、対話戦略部19が対話戦略を実行することが難しい場合であっても、形態素解析部14における[私]の後に続く単語を予想する先読みから、対話戦略部19が[反論]という解析結果を導き出すことが可能である。但し、先読みの予測状況によって解析結果が全く違ってしまうため、データベースの学習時に出現した頻度の低いパターンの場合は解析結果の確からしさを示す確信度が低い値になることがある。
図4は、各解析処理部11〜21での解析処理が並列的に実行される状態の例を示す。図4では、一番下側の自然言語文「家族で夏に旅行行きたいんだけど?・・・」との音声入力があり、解析結果に基づいて、一番上側の自然言語文「北海道よかったですね 東北はどうでしょう・・・」との対話文が出力される例を示す。
なお、ここまでに示した解析処理部の構成は、日本語を念頭にわかりやすく説明するためのもので、どのような解析部を用意するかは異なっていてもよい。たとえば熟語や慣例句の処理などが考えられる。また、日本語に限らず任意の自然言語に適用することもできる。
図5は、各解析処理部11〜21で解析処理を行う手順の例を示すフローチャートである。
まず、各解析処理部11〜21には、前段の解析部の全ての解析処理部11〜21から解析結果と確信度が入力される(ステップS11)。例えば2段目の解析処理部11〜21で解析を行う際には、前段の解析結果Aと確信度が入力される。
そして、各解析処理部11〜21は、確信度付きの処理結果を総合して参照しながら、入力データに対する解析処理を実行する(ステップS12)。
各解析処理部11〜21は、ステップS13で先読みを選択した後、現在の入力データと先読みしたデータと前段の解析結果とを使って、新たな1つの解析結果を得る。また、このとき、解析結果の確からしさを示す確信度を算出する(ステップS14)。
そして、各解析処理部11〜21は、ステップS15で得た解析結果と確信度を、次の段の解析部の全ての解析処理部11〜21に伝える(ステップS15)。
各解析処理部11〜21は、次の単位の音素データの入力で、ステップS11の処理に戻り、次の段の解析処理を行う。
なお、図5のフローチャートでは、各解析処理部11〜21は、直前(1段前)の解析処理部11〜21から解析結果と確信度を得るようにしたが、それより前の解析部が存在する場合には、2段前や3段前などの過去の各解析処理部11〜21からも解析結果と確信度を得るようにしてもよい。また、解析状況によっては、直前の解析処理部11〜21の解析結果や確信度は参照せず、それより前の段の解析処理部11〜21の解析結果だけを参照してもよい。
すなわち、本例のようにリアルタイムで逐次処理を行う場合、つまり人間が頭の中で対話応答文を思い描くような自然な処理を目指す場合には、先読み処理を行うことが重要になる。実際に人間が行う言語の処理では、先読みをしなければ不可能なタイミングでの応答を行っている。すなわち、常に先読みを行いながら、状態を推測し確定させていくことが必要である。
なぜなら、先読みを行った時点、言い換えると現在までの入力の状態は確定している。このため、先読みした予測が外れた場合は、次に説明するように、まずは現在の状態をリセットして、リセットする前の状態からやり直す必要がある。つまり、予測が外れる前の状態から始めて、それ以後の入力に合わせて次の段階の状態を計算することになる。このような動作もまた、人間が言語を処理する場合と同様であり、人間に近い自然な処理を目指すには必要な要素の一つである。
なお、先読みのステップ数は一つを想定して説明してきたが、二つ以上でもよい。
図6は、再解析を行う場合の判定処理例を示すフローチャートである。
再解析の判定は、対話解析・生成部10の解析動作全体を制御する制御部(不図示)によって行われる。
対話解析・生成部10の制御部は、それぞれの段階の各解析処理部11〜21が算出した確信度の値を取得して、判定処理を行う(ステップS21)。そして制御部は、各解析処理部11〜21の確信度の値が、予め設定された失敗判断用の条件を満たすか否かを判断する(ステップS22)。
ここでの確信度の値が、予め設定された条件を満たすか否かの判断の1つの例としては、例えば確信度の値の平均値が閾値以下か否かを判断する処理がある。但し、平均値を求める際には、それぞれの解析処理ごとに、重要度などに応じて重みづけを行うのが好ましい。平均値を使用するのは1つの例であり、それぞれの解析処理ごとに決められた条件で、確信度の値が適切か否かを判断する。
そして、ステップS22の判断で失敗判断用の条件を満たしていない場合には、制御部は、そのまま各解析処理部11〜21に解析処理を実行させる(ステップS23)。
例えば、図2に示す2段目の解析部での解析が終了して、その2段目の解析部で得た確信度の値が予め決められた条件を満たすような低い値である場合には、対話解析・生成部10は、1段目の解析部での解析が終了した時点に戻し、2段目の解析部での解析を再度行う。
ステップS23,S24の処理を行った後、対話解析・生成部10の制御部は、ステップS21の判定に戻り、次の段階での確信度の判定処理を行う。
図7は、対話解析・生成部10での解析処理の実行途中の状況を示す説明図である。
この例では、音声入力部1又はテキスト入力部2に「The man ran fast・・・」と、英語の音声入力又はテキスト入力があった場合を示す。
例えば、最初の段階の解析で「The」が冠詞と判定され、次の段階の解析で「man」が名詞と解析され、「The man」が文の中の名詞句と判定される。図6では、ここまでが解析済みの構文であるとする。
図8,図9は、対話解析・生成部10での認識結果に基づいて、図1の音声出力部3が音声を出力する例1,例2を示す。
まず図8に示す例1は、音声入力部1に「昨日のあの話だけど やめようと思う」と日本語の文章の入力があった場合の例である。
このとき、音声認識部11での音素の認識では、音素として「キノウノアノハナシダケドヤメヨウトオモウ」が得られる。また、形態素解析部14や品詞解析部15などでの文章の解析では、「昨日」、「の」、「あの」、「話」、「だけど」、「やめ」「よう」、「と」「思う」のそれぞれの単語や言葉が認識される。
このとき、音声認識部11での音素の認識では、音素として「ハママツマデノキップハアリマスカ」が得られる。また、形態素解析部14や品詞解析部15などでの文章の解析では、「浜松」、「まで」、「の」、「きっぷ」、「は」、「あり」「ます」「か」のそれぞれの単語や言葉が認識される。
これまでの自然言語処理の研究では、それぞれの研究者から多種多様な理論が提唱され、たとえば構文規則ひとつをとっても互換性のない理論が様々に提唱されてきた。
しかしながら、そもそも人間が個々人で互換性のない理論、たとえば非互換の構文規則を使っているということは、非互換であるが故に、その非互換の部分において意思疎通ができないことを意味する。従来の研究ではそのような非互換性からして、人間の処理とは異なっており、人間のような自然な会話の実現を阻んできたと考えられる。
これに対して本発明の実施の形態例では、様々な解析部のレベルを同時に考慮した制約を加えることにより、人間が共有する単一の規則を、さまざまな解析部のレベルで同時に定めることができ、解析処理能力の向上とともにより人間らしい自然な会話の実現に寄与することができる。
本例の自然言語処理装置では、そのような人間が思考しながら対話する状況と同様の処理が行われて、適切な対話文が出力され、人間と良好に対話できるようになる。
仮に、各解析処理部11〜21で先読み予想が外れた場合には、現段階よりも前の段階に戻って迅速に解析処理をやり直すため、最終的に適切な解析結果が得られるようになる。
したがって、本例の自然言語処理装置によると、人間同士が会話する場合と同様に、コンピュータとの自然な会話ができるようになる。
Claims (16)
- 入力した自然言語文を解析して、その入力した自然言語文と対話するための出力文を生成する自然言語処理装置において、
自然言語文の要素ごとに異なる解析を行う複数の解析処理部が用意され、解析可能な単位の自然言語文を入力するごとに、各入力の単位に対して前記複数の解析処理部の各解析処理部で逐次的かつ並列的に解析を行う対話解析・生成部と、
前記対話解析・生成部における前記各解析処理部の解析結果に基づいて、出力を得る出力部と、を備え、
前記対話解析・生成部に用意された前記各解析処理部は、自らの解析処理部での直前又はそれ以前の解析結果と、他の解析処理部での直前又はそれ以前の解析結果とを取得し、この取得した解析結果を参照して、単一又は制限された数の解析結果を得るようにし、
前記対話解析・生成部の各解析処理部での前記単一又は制限された数の解析結果に基づいて、前記解析処理部の中の1つの解析処理部である文生成部で、入力した前記自然言語文に対応した対話応答文を生成して、前記出力部に出力する、
ことを特徴とする自然言語処理装置。 - 前記出力部は、前記対話応答文を音声又はテキストとして出力する、
請求項1に記載の自然言語処理装置。 - 前記各解析処理部は、解析を行うのに必要な限られた情報を保持し、その限られた情報を利用して解析を行う、
請求項1又は2に記載の自然言語処理装置。 - 解析済みの情報については、同じタイプの情報を複数保持しないように、制約を加えることで限られた情報を保持するようにした、
請求項3に記載の自然言語処理装置。 - 各解析処理部の内の少なくとも1つの解析処理部が解析結果を得る際には、前記各解析処理部において、次の入力データを予測するためにデータベースに蓄積されたデータを用いて推測を行い、この推測した結果を利用して、次に直接つながる単語又は言葉を予測し、入力した自然言語文と予測した単語又は言葉とを使って、単一又は制限された数の解析結果を得るようにした、
請求項1〜4のいずれか1項に記載の自然言語処理装置。 - 前記対話解析・生成部の各解析処理部は、解析結果の確かさを示す確信度を算出し、各解析処理部が算出した確信度を、他の全ての解析処理部に伝えるようにした、
請求項1〜5のいずれか1項に記載の自然言語処理装置。 - 前記対話解析・生成部の各解析処理部は、算出した前記確信度が所定条件を満たす閾値以下の低い値であるとき、前記各解析処理部の処理を少なくとも1段階前の処理の終了時点の解析処理に戻るようにした、
請求項6に記載の自然言語処理装置。 - 前記対話解析・生成部は、その構成要素である前記各解析処理部として、形態素解析部と、品詞解析部と、構文解析部と、述語項及び格解析部と、照応関係解析部とを含む
請求項1〜7のいずれか1項に記載の自然言語処理装置。 - 前記対話解析・生成部は、その構成要素である前記各解析処理部として、更に、相槌及び割込判定部と、非言語情報部とを含む
請求項8に記載の自然言語処理装置。 - 入力した自然言語文を解析して、その入力した自然言語文と対話するための出力文を生成する自然言語処理装置における自然言語処理方法であって、
自然言語文の要素ごとに異なる解析を行う複数の解析処理を行う機能(以下、「解析処理機能」という)を有する各解析処理部が用意され、解析可能な単位の自然言語文が入力するごとに、各入力の単位に対して前記複数の解析処理部の各解析処理部において逐次的かつ並列的に解析を行う逐次解析ステップと、
前記各解析処理部における前記逐次解析ステップの各解析結果に基づいて、前記各解析処理部の中の1つの解析処理部である文生成部において、入力した自然言語文に対応する対話応答文を得る文生成ステップと、
前記文生成部で生成した対話応答文を、出力部に出力する出力ステップと、を含み、
前記各解析処理部は、自らの解析処理部での直前又はそれ以前の解析結果と、他の解析処理部での直前又はそれ以前の解析結果とを取得し、この取得した解析結果を参照して、単一又は制限された数の解析結果を得るようにした、
自然言語処理方法。 - 前記出力部から出力される前記対話応答文は、音声又はテキストとして出力される、
請求項10に記載の自然言語処理方法。 - 前記各解析処理部における解析処理においては、解析を行うのに必要な限られた情報を保持し、その限られた情報を使用して解析を行うようにした、
請求項10又は11に記載の自然言語処理方法。 - 解析済みの情報については、同じタイプの情報を複数保持しないように、制約を加えることで限られた情報を保持するようにした、
請求項12に記載の自然言語処理方法。 - 前記各解析処理部における解析処理においては、前記各解析処理部のそれぞれの解析処理機能の内の少なくとも1つの解析処理機能が解析結果を得る際には、前記各解析処理部において、次の入力データを予測するためにデータベースに蓄積されたデータを用いて推測を行い、この推測した結果を利用して、次に直接繋がる単語又は言葉を予測し、入力した自然言語文と予測した単語又は言葉を使って、単一又は制限された数の解析結果を得るようにした、
請求項10〜13のいずれか1項に記載の自然言語処理方法。 - 前記各解析処理部における各解析処理機能は、解析結果の確かさを示す確信度を算出し、各解析処理部が算出した確信度を他の解析処理部の解析処理機能に伝えるようにした、
請求項10〜14のいずれか1項に記載の自然言語処理方法。 - 前記各解析処理部における各解析処理機能は、算出した確信度が所定の条件を満たす閾値以下の低い値であるとき、前記各解析処理部の処理を少なくとも1段階前の処理の終了時点の解析処理機能に戻るようにした、
請求項15に記載の自然言語処理方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015236446A JP6070809B1 (ja) | 2015-12-03 | 2015-12-03 | 自然言語処理装置及び自然言語処理方法 |
US15/780,272 US10248649B2 (en) | 2015-12-03 | 2016-12-05 | Natural language processing apparatus and a natural language processing method |
PCT/JP2016/086042 WO2017094913A1 (ja) | 2015-12-03 | 2016-12-05 | 自然言語処理装置及び自然言語処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015236446A JP6070809B1 (ja) | 2015-12-03 | 2015-12-03 | 自然言語処理装置及び自然言語処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6070809B1 true JP6070809B1 (ja) | 2017-02-01 |
JP2017102771A JP2017102771A (ja) | 2017-06-08 |
Family
ID=57937571
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015236446A Active JP6070809B1 (ja) | 2015-12-03 | 2015-12-03 | 自然言語処理装置及び自然言語処理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10248649B2 (ja) |
JP (1) | JP6070809B1 (ja) |
WO (1) | WO2017094913A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018165805A (ja) * | 2017-03-28 | 2018-10-25 | 日本電信電話株式会社 | 対話装置、対話装置の制御方法およびプログラム |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6584452B2 (ja) * | 2017-05-24 | 2019-10-02 | 株式会社大一商会 | 遊技機 |
US11625630B2 (en) * | 2018-01-26 | 2023-04-11 | International Business Machines Corporation | Identifying intent in dialog data through variant assessment |
CA3163943A1 (en) * | 2020-01-07 | 2021-07-15 | Raymond Li | Recommendation method and system |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60215282A (ja) * | 1984-04-11 | 1985-10-28 | Hitachi Ltd | 自然言語解析構文方式及び装置 |
JPS63313275A (ja) * | 1987-06-16 | 1988-12-21 | Mitsubishi Electric Corp | 文章解析方式 |
JPH04180169A (ja) * | 1990-11-15 | 1992-06-26 | Nec Corp | 形態素解析装置 |
JPH052603A (ja) * | 1991-06-20 | 1993-01-08 | Toshiba Corp | 並列機械翻訳装置 |
JPH0668128A (ja) * | 1992-08-19 | 1994-03-11 | Meidensha Corp | 形態素解析処理方法 |
JPH07141469A (ja) * | 1993-11-15 | 1995-06-02 | Sharp Corp | 手書き文字入力機能を持つ文書処理装置とその文字訂正挿入方法 |
JP2004334264A (ja) * | 2003-04-30 | 2004-11-25 | Csk Corp | 自然言語解析装置、自然言語解析方法および自然言語解析プログラム |
JP2005182208A (ja) * | 2003-12-16 | 2005-07-07 | Canon Inc | 情報処理装置およびデータ入力方法 |
JP2008003517A (ja) * | 2006-06-26 | 2008-01-10 | Nec System Technologies Ltd | 音声対話装置、音声対話方法、およびプログラム |
JP2010211470A (ja) * | 2009-03-10 | 2010-09-24 | Ricoh Co Ltd | 文書データ生成装置と文書データ生成方法 |
JP2011107603A (ja) * | 2009-11-20 | 2011-06-02 | Sony Corp | 音声認識装置、および音声認識方法、並びにプログラム |
JP2013186656A (ja) * | 2012-03-07 | 2013-09-19 | Nippon Telegr & Teleph Corp <Ntt> | 自然言語解析処理装置、方法、及びプログラム |
JP2014149786A (ja) * | 2013-02-04 | 2014-08-21 | Nippon Telegr & Teleph Corp <Ntt> | 自然言語解析処理装置、方法、及びプログラム |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6231467A (ja) * | 1985-08-01 | 1987-02-10 | Toshiba Corp | 文章作成装置 |
US5225981A (en) * | 1986-10-03 | 1993-07-06 | Ricoh Company, Ltd. | Language analyzer for morphemically and syntactically analyzing natural languages by using block analysis and composite morphemes |
US4864502A (en) * | 1987-10-07 | 1989-09-05 | Houghton Mifflin Company | Sentence analyzer |
JPH02297188A (ja) * | 1989-03-14 | 1990-12-07 | Sharp Corp | 文書作成支援装置 |
JP3266246B2 (ja) * | 1990-06-15 | 2002-03-18 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 |
JPH04235672A (ja) * | 1991-01-10 | 1992-08-24 | Sharp Corp | 翻訳装置 |
US5442780A (en) * | 1991-07-11 | 1995-08-15 | Mitsubishi Denki Kabushiki Kaisha | Natural language database retrieval system using virtual tables to convert parsed input phrases into retrieval keys |
JPH05120324A (ja) * | 1991-10-30 | 1993-05-18 | Sharp Corp | 言語処理方式 |
US5500796A (en) * | 1993-07-22 | 1996-03-19 | General Electric Company | Method for extracting open-issue data from textual specifications using natural language text processing |
JPH0869470A (ja) * | 1994-06-21 | 1996-03-12 | Canon Inc | 自然言語処理装置及びその方法 |
JP3350293B2 (ja) * | 1994-08-09 | 2002-11-25 | 株式会社東芝 | 対話処理装置及び対話処理方法 |
GB2295470A (en) * | 1994-11-28 | 1996-05-29 | Sharp Kk | Machine translation system |
JPH08161175A (ja) | 1994-12-09 | 1996-06-21 | Nippon Telegr & Teleph Corp <Ntt> | 言語生成装置及び言語生成方法 |
US5794177A (en) * | 1995-07-19 | 1998-08-11 | Inso Corporation | Method and apparatus for morphological analysis and generation of natural language text |
US5873076A (en) * | 1995-09-15 | 1999-02-16 | Infonautics Corporation | Architecture for processing search queries, retrieving documents identified thereby, and method for using same |
US5836771A (en) * | 1996-12-02 | 1998-11-17 | Ho; Chi Fai | Learning method and system based on questioning |
JP3992348B2 (ja) * | 1997-03-21 | 2007-10-17 | 幹雄 山本 | 形態素解析方法および装置、並びに日本語形態素解析方法および装置 |
US6442524B1 (en) * | 1999-01-29 | 2002-08-27 | Sony Corporation | Analyzing inflectional morphology in a spoken language translation system |
US6243669B1 (en) * | 1999-01-29 | 2001-06-05 | Sony Corporation | Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation |
US6223150B1 (en) * | 1999-01-29 | 2001-04-24 | Sony Corporation | Method and apparatus for parsing in a spoken language translation system |
US6282507B1 (en) * | 1999-01-29 | 2001-08-28 | Sony Corporation | Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection |
US20010029455A1 (en) * | 2000-03-31 | 2001-10-11 | Chin Jeffrey J. | Method and apparatus for providing multilingual translation over a network |
US8463594B2 (en) * | 2008-03-21 | 2013-06-11 | Sauriel Llc | System and method for analyzing text using emotional intelligence factors |
KR102019757B1 (ko) * | 2015-12-15 | 2019-09-10 | 한국전자통신연구원 | 언어 분석 오류 보정 장치 및 방법 |
-
2015
- 2015-12-03 JP JP2015236446A patent/JP6070809B1/ja active Active
-
2016
- 2016-12-05 WO PCT/JP2016/086042 patent/WO2017094913A1/ja active Application Filing
- 2016-12-05 US US15/780,272 patent/US10248649B2/en not_active Expired - Fee Related
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60215282A (ja) * | 1984-04-11 | 1985-10-28 | Hitachi Ltd | 自然言語解析構文方式及び装置 |
JPS63313275A (ja) * | 1987-06-16 | 1988-12-21 | Mitsubishi Electric Corp | 文章解析方式 |
JPH04180169A (ja) * | 1990-11-15 | 1992-06-26 | Nec Corp | 形態素解析装置 |
JPH052603A (ja) * | 1991-06-20 | 1993-01-08 | Toshiba Corp | 並列機械翻訳装置 |
JPH0668128A (ja) * | 1992-08-19 | 1994-03-11 | Meidensha Corp | 形態素解析処理方法 |
JPH07141469A (ja) * | 1993-11-15 | 1995-06-02 | Sharp Corp | 手書き文字入力機能を持つ文書処理装置とその文字訂正挿入方法 |
JP2004334264A (ja) * | 2003-04-30 | 2004-11-25 | Csk Corp | 自然言語解析装置、自然言語解析方法および自然言語解析プログラム |
JP2005182208A (ja) * | 2003-12-16 | 2005-07-07 | Canon Inc | 情報処理装置およびデータ入力方法 |
JP2008003517A (ja) * | 2006-06-26 | 2008-01-10 | Nec System Technologies Ltd | 音声対話装置、音声対話方法、およびプログラム |
JP2010211470A (ja) * | 2009-03-10 | 2010-09-24 | Ricoh Co Ltd | 文書データ生成装置と文書データ生成方法 |
JP2011107603A (ja) * | 2009-11-20 | 2011-06-02 | Sony Corp | 音声認識装置、および音声認識方法、並びにプログラム |
JP2013186656A (ja) * | 2012-03-07 | 2013-09-19 | Nippon Telegr & Teleph Corp <Ntt> | 自然言語解析処理装置、方法、及びプログラム |
JP2014149786A (ja) * | 2013-02-04 | 2014-08-21 | Nippon Telegr & Teleph Corp <Ntt> | 自然言語解析処理装置、方法、及びプログラム |
Non-Patent Citations (2)
Title |
---|
JPN6016033130; 小林 優佳 外2名: '高齢者対話インタフェース -発話間の共起性を利用した傾聴対話の基礎検討-' FIT2011 第10回情報科学技術フォーラム 講演論文集 第2分冊 査読付き論文・一般論文 データ , 20110822, p.253-256, 一般社団法人情報処理学会 社団法人電子情報通信学会 * |
JPN6016033131; 鈴木 潤 外2名: '拡張ラグランジュ緩和を用いた同時自然言語解析法' 言語処理学会第18回年次大会発表論文集 チュートリアル 本会議 [CD-ROM] , 20120331, p.1284-1287, 言語処理学会 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018165805A (ja) * | 2017-03-28 | 2018-10-25 | 日本電信電話株式会社 | 対話装置、対話装置の制御方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2017102771A (ja) | 2017-06-08 |
US20180365224A1 (en) | 2018-12-20 |
US10248649B2 (en) | 2019-04-02 |
WO2017094913A1 (ja) | 2017-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102161579B1 (ko) | 응답문 생성 장치, 방법 및 프로그램, 그리고 음성 대화 시스템 | |
JP4846336B2 (ja) | 会話制御装置 | |
US8818801B2 (en) | Dialogue speech recognition system, dialogue speech recognition method, and recording medium for storing dialogue speech recognition program | |
JP4849663B2 (ja) | 会話制御装置 | |
US10460034B2 (en) | Intention inference system and intention inference method | |
JP4849662B2 (ja) | 会話制御装置 | |
JP5195405B2 (ja) | 応答生成装置及びプログラム | |
WO2016067418A1 (ja) | 対話制御装置および対話制御方法 | |
JPWO2015151157A1 (ja) | 意図理解装置および方法 | |
JP6070809B1 (ja) | 自然言語処理装置及び自然言語処理方法 | |
EP2988298B1 (en) | Response generation method, response generation apparatus, and response generation program | |
JP6712754B2 (ja) | 談話機能推定装置及びそのためのコンピュータプログラム | |
Chang et al. | Turn-taking prediction for natural conversational speech | |
JP2006189730A (ja) | 音声対話方法および音声対話装置 | |
JP6295869B2 (ja) | 応答生成装置、応答生成方法及びプログラム | |
US12001260B1 (en) | Preventing inadvertent wake in a speech-controlled device | |
JP2006172110A (ja) | 応答データ出力装置、応答データ出力方法およびプログラム | |
JP2011027971A (ja) | 音声認識装置、音声認識方法及びそのプログラム | |
JP2009198871A (ja) | 音声対話装置 | |
JP6287754B2 (ja) | 応答生成装置、応答生成方法及び応答生成プログラム | |
Hartanto et al. | Lattice-based Data Augmentation for Code-switching Speech Recognition | |
JP2010224152A (ja) | 音声対話装置及びプログラム | |
Hartanto et al. | Lattice-Based Data Augmentation for Code-Switching Speech | |
JP2005122549A (ja) | 会話制御装置及び会話制御方法 | |
JP2018160248A (ja) | 応答生成方法、応答生成装置及び応答生成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6070809 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |