JP6252204B2 - 情報処理装置、意図解析方法、およびプログラム - Google Patents

情報処理装置、意図解析方法、およびプログラム Download PDF

Info

Publication number
JP6252204B2
JP6252204B2 JP2014013002A JP2014013002A JP6252204B2 JP 6252204 B2 JP6252204 B2 JP 6252204B2 JP 2014013002 A JP2014013002 A JP 2014013002A JP 2014013002 A JP2014013002 A JP 2014013002A JP 6252204 B2 JP6252204 B2 JP 6252204B2
Authority
JP
Japan
Prior art keywords
sentence
character string
intention
character
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014013002A
Other languages
English (en)
Other versions
JP2015141488A (ja
Inventor
片江 伸之
伸之 片江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014013002A priority Critical patent/JP6252204B2/ja
Publication of JP2015141488A publication Critical patent/JP2015141488A/ja
Application granted granted Critical
Publication of JP6252204B2 publication Critical patent/JP6252204B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、意図解析方法、およびプログラムに関する。
昨今、車載情報端末(例えば、カーナビゲーション装置)、多機能携帯電話等での音声対話技術が普及し始めている。このような音声対話技術においては、音声対話システムが、予め決められたユーザの発話(例えば、コマンド)のみを受け付けるのではなく、自然かつ自由な表現でのユーザの発話を理解することが求められている。これにより、音声を介してユーザが端末を操作したり、端末から適切な応答を得たりすることができる機能の実現が期待されている。このような機能のためには、発話の意図を正確に認識することが重要となる。よって、音声認識技術に加え、音声を解析して得られる様々な表現の文の意図を正確に読み取ることが必要とされる。
例えば、検索対象文を形態素解析して得られた表記および意味カテゴリと、テキストベース蓄積手段で蓄積された表記、意味カテゴリ、および重みを基に算出される入力文との類似度に基づき順位付けされた検索対象文を表示する技術が知られている。また、類似度算出に用いる部分文字列を選別することにより、文書検索の高速化を行う技術も知られている。(例えば、特許文献1〜2参照)。
特開平4−54564号公報 特開2002−297660号公報
しかしながら、上記のような従来の技術では、入力の意図と関係しない文字列が入力文と検索対象文とで多く一致しているために、算出される類似度が大きくなり、間違った意図が出力される場合がある。このような場合には、入力の意図と異なる指示が行われたり、求める応答が得られなかったりするという問題が生ずる。
ひとつの側面によれば、本発明の目的は、入力された情報の意図を正確に解釈することを可能にすることである。
ひとつの態様である情報処理装置は、文例意図記憶部、関連重み記憶部、意図解析部、および出力部を有している。文例意図記憶部は、第1の文と第1の文に対応する意図とを対応付けて記憶している。関連重み記憶部は、第1の文字列と第2の文字列との関連を示す関連重みを記憶している。関連重みは、第1の文字情報に含まれる第1の文字列と第1の文字情報において第1の文字列より前に出現する第2の文字列との出現頻度に基づき算出される。意図解析部は、第1の文字列が第1の文と第2の文字情報に含まれる第2の文とに共通して含まれ、第2の文字列が第2の文字情報において第2の文より前に出現する場合、関連重みと第1の文に対応する意図とに基づき、第2の文の意図を解析する。出力部は、第2の文の意図を出力する。
実施形態の情報処理装置、意図解析方法およびプログラムによれば、入力された情報の意図を正確に解釈することが可能になる。
第1の実施の形態による情報処理装置の機能的な構成を示す図である。 第1の実施の形態による意図カテゴリテーブルの一例を示す図である。 第1の実施の形態による関連重みテーブルの一例を示す図である。 第1の実施の形態による第2の文字情報の一例を示す図である。 第1の実施の形態による情報処理を説明するフローチャートである。 第2の実施の形態による情報処理装置の機能的な構成の一例を示す図である。 第2の実施の形態による対話履歴の一例を示す図である。 第2の実施の形態による情報処理の一例を示すフローチャートである。 第2の実施の形態による意図解析処理の一例を示すフローチャートである。 第2の実施の形態による関連重みテーブルの更新処理の一例を示すフローチャートである。 第2の実施の形態の変形例による関連確率重みテーブルの一例を示す図である。 第2の実施の形態の変形例による関連確率重みテーブルの更新処理の一例を示すフローチャートである。 第2の実施の形態の変形例による関連確率重みテーブルの更新処理の一例を示すフローチャートである。 第3の実施の形態による情報処理装置の機能的な構成の一例を示す図である。 第3の実施の形態による関連単語重みテーブルの一例を示す図である。 第3の実施の形態による関連単語重みテーブル更新処理の一例を示すフローチャートである。 第4の実施の形態による情報処理装置の機能的な構成の一例を示す図である。 第4の実施の形態による単独重みテーブルの一例を示す図である。 第4の実施の形態による情報処理装置による意図解析処理の一例を示すフローチャートである。 第5の実施の形態による情報処理装置の機能的な構成の一例を示す図である。 標準的なコンピュータのハードウエア構成の一例を示すブロック図である。
(第1の実施の形態)
以下、第1の実施の形態について、図1を参照しながら説明する。図1は、第1の実施の形態による情報処理装置1の機能的な構成を示す図である。情報処理装置1は、解析対象の文字情報が入力されると、文例・意図記憶部7、関連重み記憶部9に記憶された情報に基づき、解析対象の文字情報の意図を解析する装置である。図1に示すように、情報処理装置1は、入力部3、意図解析部5、文例・意図記憶部7、関連重み記憶部9、および出力部11を有している。
入力部3は、解析対象の文字情報の入力を受付ける。意図解析部5は、文例・意図記憶部7、関連重み記憶部9に記憶された情報に基づき、入力部3で入力された文字情報の意図を解析する。意図解析の詳細は後述する。文例・意図記憶部7は、少なくとも一つの文と、その文の意図とが関連付けられた、後述する意図カテゴリテーブル30が記憶された記憶装置である。意図カテゴリテーブル30の詳細は後述する。
関連重み記憶部9は、第1の文字列と第2の文字列との関連を示す重み(以下、関連重みという)が記憶された記憶装置である。関連重み記憶部9は、例えば、関連重みテーブル50を記憶する。関連重みテーブル50は、第1の文字列と第2の文字列とを関連重みと対応付けた情報である。
第1の文字列と第2の文字列とは、例えば、一つの対話文に含まれる文字列である。このとき、第2の文字列は、第1の文字列が含まれる対話文において第1の文字列より先に出現する文字列である。第1の文字列と第2の文字列との関連を示す関連重みは、第1の文字情報における第1の文字列と第2の文字列との出現頻度に基づき算出される。第1の文字情報は、例えば、対話文を少なくとも一つ含む情報である。出力部11は、意図解析部5で解析された、入力されたテキストの意図を出力する。
なお、対話とは、例えば、ユーザとシステム、質問者と回答者等、2者間による言語を介した発話および応答のことをいう。対話文とは、対話を文字で表したものである。本明細書において、対話文とは、少なくとも一つの第1の発話文、または少なくとも一つの第1の発話文と第1の発話文に対する第1の応答文とを含み、後述する終了検出が行われるまでの文のまとまりをいう。
以下、一つの発話文を示す文字情報、または一つの発話文とその発話文に対する応答文を示す文字情報を「ターン」という。また、対話文を「タスク」ともいう。つまり。「タスク」は、後述する終了検出がされるまでの少なくとも一つの「ターン」を含む文字情報である。第1の文字情報は、少なくとも一つのタスクを含む。
図2は、意図カテゴリテーブル30の一例を示す図である。意図カテゴリテーブル30は、第1の文32と意図カテゴリ34との関連を示す情報である。第1の文32は、例えば、発話の例文である。意図カテゴリ34は、第1の文32の意図を示す。例えば、第1の文36、第1の文38は、それぞれ第1の文の一例である。例えば、第1の文36の意図は、「交通情報:ルート:電車」である。
図3は、関連重みテーブル50の一例を示す図である。関連重みテーブル50は、2つの文字列の関連を示す情報である。関連重みテーブル50は、第1の文字情報に含まれるタスク毎に算出された関連重みを全タスクで加算して生成される。図3の例では、当該ターン51に含まれる第1の文字列52のそれぞれと、既出ターン54に含まれる第2の文字列55のそれぞれとの関連を示す情報となっている。当該ターン51とは、今注目しているターンをいう。既出ターン54とは、当該ターン51を含むタスクの当該ターン51より前に出現するターンをいう。関連重みとは、一個のタスクで当該ターン51までに入力された第2の文字列55に対応する、当該ターン51での特定の第1の文字列52の出現しやすさを示す数値である。
第1の文字列52は、当該ターン51に含まれる、一文字以上の連続する文字列である。図3の例では、第1の文字列52は、特定文字数k(kは、1以上の整数)の連続した文字列である。関連重みテーブル50においては、k=2を例として示している。第2の文字列55は、当該タスクの全ての既出ターン54における連続した文字列である。なお、第1の文字列、第2の文字列は、例えば互いに異なる文字数の文字列であってもよい。
図3において、関連重み56は、当該ターン51の第1の文字列52=「値段」と、既出ターン54の第2の文字列55=「電車」との関連を示す情報である。具体的には、当該ターン51に「値段」という文字列が含まれている場合に、当該ターン51が含まれるタスクの、当該ターン51より先のいずれかの既出ターン54において「電車」が出現する出現頻度に基づいて算出される。関連重み56は、1タスク中の全ターンをそれぞれ当該ターン51とし、夫々の当該ターン51について、上記出現頻度を加算した出現頻度である。
例えば、関連重み56は、「電車」が既出のときの「値段」の関連重みであり、全タスクで同様の出現頻度を加算して得られる。この関連重み56=W(値段|電車)として、下記式1で表すことができる。
W(値段|電車)=ΣΣN(値段|電車)・・・(式1)
ここで、N(値段|電車)は、「電車」が既出のときの、「値段」の出現頻度である。例えば、既出ターンに「電車」があり、当該ターンに「値段」が1つ出現していると、N(値段|電車)=1となる。また、式1において、2つのΣのうちの1つめは、全タスクについて出現頻度を加算することを示し、2つ目のΣは、全ターンについて出現頻度を加算することを示している。関連重みテーブル50では、関連重みとして、例えば、W(値段|行き)、W(ルー|電車)、W(ルー|行き)、W(ルー|値段)などが算出されている。
図4は、第2の文字情報の一例を示す図である。図4に示すように、第2の文字情報41は、現在進行中のタスクの一例である。第2の文字情報41は、入力部3から入力されている最新のタスクとすることができ、ユーザとシステムとの対話となっている。第2の文字情報41は、ターン42、ターン44を含んでいる。図4の例では、第2の文45が解析対象の文となる。
第2の文字情報41において、第2の文45=「値段を知りたい」は、最新の発話文であり、最新に入力された入力文である。第3の文字列46=「値段」は、第1の文38と第2の文45とに共通する文字列である。第4の文字列48=「電車」は、関連重みテーブル50において、第3の文字列46に関して関連重みが算出されており、ターン44の既出ターンとなるターン42に含まれる文字列である。なお、区別のために第3の文字列46、第4の文字列48という名称を用いているが、第3の文字列は、第1の文字列に対応し、第4の文字列は、第2の文字列に対応している。
ここで、第2の文字情報41を用いて、意図解析部5の処理を説明する。図5は、第1の実施の形態による情報処理を説明するフローチャートである。図5に示すように、入力部3は、第2の文字情報の入力を受付ける(S61)。意図解析部5は、文例・意図記憶部7、関連重み記憶部9を参照しながら、意図解析を行う(S62)。例えば、第2の文字情報41の最新のターンがターン44であり、第2の文45が解析対象である場合について説明する。
意図解析部5は、第2の文45と意図カテゴリテーブル30に記憶された各第1の文32との一致を参照する。例えば、意図解析部5は、第1の文36=「電車のルートを知りたい」を選択する。意図解析部5は、第2の文45と、第1の文36との共通する文字列を検索する。この共通する文字列を、第3の文字列という。この例では、共通する文字列は「を知りたい」となる。意図解析部5は、関連重みテーブル50の当該ターン51を参照する。関連重みテーブル50において、当該ターン51の「を知りたい」に含まれるk(=2)文字の文字列「を知」、「知り」、「りた」、「たい」が第3の文字列となる。これらの第3の文字列に対して関連重みが参照される。意図解析部5は、いずれの文字列に関する関連重みも算出されていないことを判別する。よって、第2の文45と第1の文36に関する関連重みは「0」である。
さらに意図解析部5は、意図カテゴリテーブル30において、例えば、第1の文38=「値段はいくら」を選択する。意図解析部5は、第2の文45と、第1の文38との共通する文字列を検索する。この例では、共通の文字列である「値段」は2文字の文字列であるため、第3の文字列となる。
意図解析部5は、ターン44の既出ターンとなるターン42に含まれるk(=2)文字の文字列を、関連重みテーブル50の既出ターン54において検索する。これらの文字列を、第4の文字列という。第4の文字列は、ターン42では、例えば、「電車」、「車の」、「のル」、・・・などである。また、意図解析部5は、関連重みテーブル50の当該ターン51を参照する。関連重みテーブル50において、当該ターン51の第3の文字列=「値段」に対して関連重みが算出されているのは、既出ターン54の「電車」、「行き」、「値段」である。意図解析部5は、第4の文字列の中で、「電車」が既出ターン54に出現する文字列であると判別し、ターン44の第2の文45に関連する関連重みとして、W(値段|電車)=関連重み56=16を抽出する。なお、第3の文字列、第4の文字列が複数ある場合については、意図解析部5は、夫々に算出される関連重みを例えば加算する。
例えば、第3の文字列と第4の文字列とに基づく関連重みW(第3の文字列|第4の文字列)を、W(第3の文字列|第4の文字列)=Wiと表すと、一つの第1の文32と第2の文45とに関する関連重みWrは、以下のように算出される。
関連重みWr=ΣΣWi・・・(式2)
ここで、一つ目のΣは、全ての第3の文字列について関連重みWiを加算することを示し、2つ目のΣは、全ての第4の文字列について関連重みWiを加算することを示す。
意図解析部5は、例えば意図カテゴリテーブル30の全ての第1の文32について、上記のような処理を行う。意図解析部5は、最も大きな関連重みが算出された第1の文32に関連付けられた意図カテゴリ34を、第2の文45の意図として出力する。上記の第1の文36と第1の文38の例で説明すると、第1の文36に関する関連重み0、第1の文38に関する関連重み16であるので、これらの2つの文で考えると、意図が近い第1の文32は、第1の文38となる。最も大きな関連重みが算出された第1の文=第1の文38である場合、出力される意図は、「交通情報:料金」となる。出力部11は、意図解析部5が解析した意図を出力する(S63)。
以上説明したように、第1の実施の形態による情報処理装置1によれば、文例・意図記憶部7と関連重み記憶部9とに基づき、入力された文字情報の意図を解析することができる。このとき、文例・意図記憶部7には、第1の文とその意図とが関連付けられて記憶されている。関連重み記憶部9に記憶される関連重みは、同一タスクにおける出現順を考慮した2つの文字列の出現頻度に基づき算出されている。意図解析部5は、解析対象の第2の文字情報における第2の文と、文例・意図記憶部7における第1の文とに共通する第3の文字列と、第2の文字情報における既出ターンの第4の文字列とに関連する関連重みを、関連重み記憶部9を参照して積算する。意図解析部5は、上記のように算出され、加算された関連重みが最も大きい第1の文に対応する意図を、第2の文の意図と解析する。
以上のように、第1の実施の形態においては、対話形式の文字情報の既出ターンと当該ターンに出現する文字列の組合せは、類似したタスクでは類似していることを利用して、文字情報の意図解析が行われる。このため、意図解析部5は、文字列の出現順を考慮した出現頻度に基づく関連重みを算出している。例えば、既出ターンに第4の文字列があるとき、当該ターンの第2の文において、第4の文字列と関連する関連重みの大きい第3の文字列は、意図解析に重要な文字列であるという解釈となる。この解釈に基づき、情報処理装置1は、第1の文と第2の文とに共通する第3の文字列の関連重みが大きい第1の文に関連する意図を、第2の文の意図と解析することができる。このとき、入力する文字情報は、予め決められた文型などに従う必要はなく、様々な表現の文字情報の意図を解析することができる。
なお、意図カテゴリテーブル30の第1の文32は、図2の例では発話文のみを示しているが、例えば応答文を含むようにしてもよい。第2の文としては、発話文が考えられるが、発話文以外の文に利用することも可能である。
(第2の実施の形態)
以下、第2の実施の形態による情報処理装置100について説明する。第2の実施の形態において、第1の実施の形態による情報処理装置1と同様の構成および動作については、同一番号を付し、詳細説明を省略する。情報処理装置100は、関連重み記憶部9の関連重みテーブル50を生成する機能を含んでいる。また、情報処理装置100は、第1の文字情報と第2の文字情報との類似度を算出する機能を含んでいる。
図6は、第2の実施の形態による情報処理装置100の機能的な構成の一例を示す図である。図6に示すように、情報処理装置100は、情報処理装置1と同様に、入力部3、意図解析部5、文例・意図記憶部7、関連重み記憶部9、出力部11を有している。情報処理装置100はさらに、終了判定部13、類似度算出部15、関連重み算出部17、履歴管理部19、履歴記憶部21、一時格納部23を有している。
終了判定部13は、タスクの終了を判定する。タスクの終了は、例えば、情報処理装置100の挙動、タイムアウト、または、ユーザからの入力内容等に基づき判定される。例えば、情報処理装置100の挙動とは、電話などを介したサービスであれば、回線の切断、Graphical User Interface(GUI)等に用意された終了ボタンの押下である。タイムアウトとは、ユーザからの入力が所定時間ないことである。入力内容とは、「ありがとう」、「終了」等、タスクの終了を示す所定の文字情報の入力である。
類似度算出部15は、例えば第1の文と第2の文とに共通して含まれる文字列の文字数に基づき、類似度を算出する。関連重み算出部17は、対話文を少なくとも一つ含む第1の情報から、関連重みテーブル50を生成する。
履歴管理部19は、一時格納部23に一時的に記憶されている第2の文字情報を履歴記憶部21に記憶させる。履歴記憶部21は、少なくとも一つのタスクを含む情報を記憶した記憶装置である。履歴記憶部21は、例えば対話履歴90を記憶する。一時格納部23は、入力部3で入力された第2の文字情報を一時的に記憶する。
図7は、対話履歴90の一例を示す図である。図7に示すように、対話履歴90は、例えばタスク91−1、91−2、91−3等(まとめて、あるいは代表してタスク91ともいう)を含んでいる。タスク91−1は、例えばターン92、ターン94などを含んでいる。各タスク91は、終了判定部13により終了判定が行われるまでの対話を含んでいる。各タスク91は、入力部3を介して入力された第2の文字情報が、一時格納部23に一時的に格納され、終了判定部13でタスクの終了が判定されると、履歴管理部19により履歴記憶部21に記憶される。対話履歴90は、第1の文字情報の一例となる。
次に、図8を参照しながら、情報処理装置100の動作について説明する。図8は、第2の実施の形態による情報処理の一例を示すフローチャートである。図8に示すように、情報処理装置100は、例えばユーザからの電源オンなど所定動作を検出すると、起動する(S71)。処理終了の入力があると(S72:YES)、情報処理装置100は、所定の終了処理を実行し(S82)、処理を終了する。
処理終了の入力がない場合には(S72:NO)、終了判定部13は、当該タスクの終了の入力があるか否かを判別する(S73)。タスクの終了が検出されない場合には(S73:NO)、入力部3は、第2の文字情報の入力を受け付ける(S74)。意図解析部5は、受付けた第2の文字情報に基づき、意図解析を行う(S75)。意図解析の詳細については、後述する。
入力部3における入力が、当該タスク終了と判定されない場合には(S76:NO)、出力部11は、出力情報を生成し(S77)、出力する(S78)。タスクの終了と判定される場合には(S76:YES)、S80に処理が進められる。
なお、ここで、出力情報として、S75で解析された意図に応じたシステム側からの応答文を生成するようにしてもよい。例えば、図4の第2の文字情報41のターン42において、第2の文45の意図を解析し、「交通情報:料金」と解析された場合に、「1260円です。」等という応答文を出力情報として生成するようにしてもよい。履歴管理部19は、例えば、第2の文45と出力情報とを一時格納部23に格納し(S79)、処理をS73に戻す。
S73で、終了判定部13がタスク終了を検知した場合(S73:YES)、または、意図解析部5がタスクの終了と判定した場合には(S76:YES)、履歴管理部19は、一時格納部23の内容を、履歴記憶部21に格納する(S80)。すなわち、例えば対話履歴90において、タスク91がひとつ増えることになる。さらに、履歴記憶部19に新たに格納されたタスク91に基づき関連重みテーブル50の更新を行う(S81)。関連重みテーブル50の更新については後述する。
図9は、意図解析処理の一例を示すフローチャートである。図9に示すように、意図解析部5は、意図カテゴリテーブル30に、意図解析に関して未処理の第1の文がない場合には(S86:NO)、処理をS89に進める。未処理の第1の文がある場合には(S86:YES)、類似度算出部15は、意図カテゴリテーブル30の未処理の第1の文32と、現在進行中のタスクの第2の文との類似度を算出する(S87)。類似度は、例えば第1の文と第2の文との共通する文字列の文字数に基づき算出される。
今、第1の文の文字数を文字数L1、第2の文の文字数を文字数L2、第1の文と第2の文との共通する文字列の文字数を文字数Lnとする。このとき、第1の文と第2の文との類似度S1は、例えば、式3で算出される。
Figure 0006252204
例えば、当該第1の文が、図2の第1の文36であり、第2の文が、図4の第2の文45である場合、L1=11、L2=7である。上述のように、一致する文字列は「を知りたい」であるので、Ln=5である。よって、このときの類似度は、式4のように算出される。
S1=2×5/(11+7)=0.56・・・(式4)
さらに、意図解析部5は、類似度S1に、文字列に基づく関連重みWrを加算する。すなわち、第1の実施の形態において説明したように、第1の文と第2の文とに関して、関連重みテーブル50および式2に基づき関連重みWrを算出し、類似度S1に加算することで、評価値G1を算出する(S88)。例えば、評価値G1は、下記式5により算出する。
Figure 0006252204
例えば、第1の文36と第2の文45との評価値G1は、Wr=0であることから、評価値G1は、下記の式6により算出される。
G1=S1=0.56・・・(式6)
別の例として、例えば、第1の文38と第2の文45との関連重みは、Wr=16である。また、共通する文字列は「値段」、「い」であり、Ln=3となる。よって、第1の文38と第2の文45との評価値G1は、下記の式7で算出される。
G1=(2×Ln+Wr)/(L1+L2)=(2×3+16)/(7+7)=1.57
・・・(式7)
意図解析部5は、上記のように、各第1の文32について、評価値G1を算出する。
続いて、意図解析部5は、処理をS86に戻す。S86において、意図解析に関して未処理の第1の文がない場合には(S86:NO)、意図解析部5は、評価値G1が最大の第1の文32に関連付けられた意図カテゴリ34を、第2の文の意図として出力し(S89)、処理を図8の処理に戻す。
図10は、第2の実施の形態による関連重みテーブル50の更新処理の一例を示すフローチャートである。情報処理装置100において、履歴管理部19は、入力部3で入力される例えば第2の文字情報41等の第2の文字情報に基づき、履歴記憶部21の対話履歴90を生成する。関連重み算出部17は、対話履歴90に基づき、関連重みテーブル50を更新する。図10の処理は、図8のS80で、対話履歴90に、新たなタスク91が追加された後の処理である。なお、図10における当該タスクとは、この新たなタスク91であるとする。また、図10において、関連重みを算出する対象の文字列は、k文字の文字列であるとして説明する。このとき、関連重み算出部17は、各ターンにおける各文に対し、文の先頭からk文字ずつ第1の文字列を抽出するものとする。
図10に示すように、関連重み算出部17は、当該タスクにおいて、更新処理が未処理の次のターンがある場合には(S101:YES)、次のターンを当該ターンとし、当該ターンの更新処理に関して未処理のk文字の文字列(第1の文字列)があるか否か判別する(S102)。未処理のk文字の文字列がない場合には、関連重み算出部17は、S101に戻って処理を繰り返す(S102:NO)。
未処理のk文字の第1の文字列がある場合には(S102:YES)、関連重み算出部17は、当該ターンの更新処理に関して未処理の既出ターンがあるか否かを判別する(S103)。未処理の既出ターンがない場合には(S103:NO)、S102から処理が繰り返される。
未処理の既出ターンがある場合には(S103:YES)、関連重み算出部17は、当該既出ターンに、他のk文字の文字列(第2の文字列)があるか否かを判別する(S104)。他のk文字の第2の文字列がない場合には(S104:NO)、S103に戻って処理が繰り返される。
他の第2の文字列がある場合には(S104:YES)、関連重み算出部17は、関連重みテーブル50において、対応する関連重みに「1」を加算し(S105)、処理をS104に戻す。S101において、次のターンがない場合には(S101:NO)、関連重み算出部17は、図8の処理に処理を戻す。
上記のように、新しいタスクが対話履歴90に追加される毎に、全てのターンをそれぞれ当該ターンとして、同様の処理を繰り返すことにより、関連重みが更新され、履歴記憶部21に記憶された対話履歴90に基づく関連重みテーブル50となる。
以上のようにして、関連重みテーブル50が更新される。本実施の形態においては、入力部3に入力されるタスク毎に関連重みテーブル50が更新され、更新された関連重みテーブル50に基づき、第2の文の意図が出力される。
以上詳細に説明したように、第2の実施の形態による情報処理装置100によれば、履歴管理部19は、第2の文字情報に基づき、履歴記憶部21における対話履歴90を更新する。関連重み算出部17は、新たに追加されたタスク91に基づき、関連重みテーブル50を更新する。意図解析部5は、類似度算出部15が算出した類似度と、更新された関連重みテーブル50に基づく関連重みに基づき、意図を解析する。類似度は、第1の文と第2の文とで一致する文字列の文字数に基づき算出される。
以上のように、第2の実施の形態による情報処理装置100によれば、第1の実施の形態による情報処理装置1による効果に加え、さらに精度の高い意図検出が行われることが期待される。
なお、式3、式5は一例であり、上記に限定されない。例えば、類似度については、式3の類似度S1に代えて、下記式8のように類似度S2でもよい。
Figure 0006252204
ここで、nは、第1の文と第2の文とで連続して一致した文字列の文字数である。Σは、全ての連続して一致した文字列について加算することを示している。例えば、連続して一致した文字列が、2文字の文字列一つであれば、n=2となり、n(n+1)/2=3となる。2文字の文字列が二つ一致していれば、Σ(n(n+1)/2)=3+3=6となる。
また、式5の評価値G1に代えて、下記式9のように、評価値G2でもよい。
Figure 0006252204
さらに、式3、式5、式8、式9では、第1の文と第2の文との文字数の和(L1+L2)を分母に用いたが、分子のみを評価値に用いるなど、変形は可能である。
また、式3および式8において、類似度を第1の文と第2の文との共通する文字列の文字数に基づき算出したが、第1の文と第2の文の形態素解析を行い、第1の文と第2の文とで共通する単語の単語数に基づき算出するなどの、変形も可能である。その場合には、式3および式8におけるL1は第1の文の単語数、L2は第2の文の単語数となり、式3におけるLnは第1の文と第2の文との共通する単語数、また、式8におけるnは第1の文と第2の文とで、連続して一致する単語の単語数である。
(第2の実施の形態の変形例)
以下、第2の実施の形態の変形例について説明する。本変形例において、第2の実施の形態による情報処理装置100と同様の構成および動作については、同一番号を付し、詳細説明を省略する。装置の構成については、情報処理装置100と同様である。
本変形例は、第2の実施の形態による関連重みテーブル50に代えて、関連確率重みテーブル110を用いる変形例である。図11は、関連確率重みテーブル110の一例を示す図である。関連確率重みテーブル110では、出現数113が導入されている。出現数113は、当該ターン112における各第3の文字列の出現数である。出現数113は、第3の文字列の、全タスクの全ターンにおける出現数の和である。また、重み確率は。出現頻度の和の関連重み116を、出現数で序した重み確率118で表される。なお、関連確率重みテーブル110においても、所定の文字数kの文字列を例にしている。
図12、図13は、関連確率重みテーブル110の更新処理の一例を示すフローチャートである。図8における関連重みテーブルの更新(S81)が、ここでは関連確率重みテーブル更新処理に相当する。図12に示すように、図12の処理は、図8のS80で、対話履歴90に、新たなタスク91が追加された後の処理である。図12における当該タスクとは、この新たなタスク91である。また、図12において、関連重みを算出する対象の文字列は、k文字の文字列であるとして説明する。
図12に示すように、関連重み算出部17は、当該タスクにおいて、次のターンがある場合には(S131:YES)、次のターンを当該ターンとし、当該ターンの関連重み算出に関する未処理のk文字の文字列(第3の文字列)があるか否か判別する(S132)。未処理のk文字の文字列がない場合には、関連重み算出部17は、S131に戻って処理を繰り返す(S132:NO)。
未処理のk文字の第3の文字列がある場合には(S132:YES)、関連重み算出部17は、当該第3の文字列の出現数113に「1」を加算する(S133)。関連重み算出部17は、当該ターンの関連重み算出に関して、未処理の既出ターンがあるか否かを判別する(S134)。未処理の既出ターンがない場合には(S134:NO)、S132から処理が繰り返される。
未処理の既出ターンがある場合には(S134:YES)、関連重み算出部17は、当該既出ターンに、他のk文字の文字列(第4の文字列)があるか否かを判別する(S135)。他のk文字の第4の文字列がない場合には(S135:NO)、S134に戻って処理が繰り返される。
他の第4の文字列が出現している場合には(S135:YES)、関連重み算出部17は、関連確率重みテーブル110において、対応する関連重みに「1」を加算し(S136)、処理をS135に戻す。S131において、次のターンがない場合には(S131:NO)、関連重み算出部17は、図13の処理に処理を進める。
図13に示すように、関連重み算出部17は、関連確率重みテーブル110において、例えば、更新された関連重み116に対して、重み確率118を算出する。すなわち、関連重み算出部17は、当該ターン112において、重み確率の算出に関して未処理の文字列がある場合には(S141:YES)、既出ターン114において、当該ターンの当該文字列に関して未処理の文字列があるか否か判別する(S142)。既出ターン114に、未処理の文字列がない場合には(S142:NO)、S141からの処理が繰り返される。
既出ターン114に、当該ターンの当該文字列に関して未処理の文字列がある場合には(S142:YES)、関連重み算出部17は、例えば、関連重み116を出現数113で除することにより、重み確率118を算出し(S143)、S142に処理を戻す。S141で、未処理の当該ターン112がない場合には(S141:NO)、図8の処理に処理が戻される。
以上説明したように、第2の実施の形態の変形例においては、第2の実施の形態における関連重みテーブル50に代えて関連確率重みテーブル110を用いた意図解析を行う。上記のような第2の実施の形態の変形例1によっても、第2の実施の形態と同様の効果を得るとともに、第3の文字列の出現頻度を考慮した関連確率重みを用いるので、関連重みが第3の文字列の出現頻度に依存しない値となる。よって、より適切に意図解析を行うことができる。
(第3の実施の形態)
以下、第3の実施の形態による情報処理装置201について説明する。本実施の形態において、第1の実施の形態による情報処理装置1、または第2の実施の形態による情報処理装置100と同様の構成および動作については、同一番号を付し、詳細説明を省略する。情報処理装置201は、関連重みテーブル50を生成する際に、第1の文および第2の文の形態素解析を行った結果を用いる。
図14は、第3の実施の形態による情報処理装置201の機能的な構成の一例を示す図である。図14に示すように、情報処理装置201は、情報処理装置1、および情報処理装置100と同様に、入力部3、意図解析部5、文例・意図記憶部7、関連重み記憶部9、出力部11を有している。また、情報処理装置201は、情報処理装置100と同様に、終了判定部13、類似度算出部15、関連重み算出部17、履歴管理部19、履歴記憶部21、一時格納部23を有している。さらに情報処理装置201は、形態素解析部25を有している。
形態素解析部25は、意図カテゴリテーブル30の第1の文32、対話履歴90のタスク91または入力部3で入力される第2の文字情報41における第2の文を形態素解析する。本実施の形態においては、関連重み算出部17は、k文字の文字列でなく、形態素解析を行った結果に基づき、単語についての関連重みを算出する。例えば形態素解析結果の名詞だけに注目して、名詞のみの関連重みを算出してもよい。
図15は、第3の実施の形態による関連単語重みテーブル210の一例を示す図である。図15に示すように、関連単語重みテーブル210では、当該ターン212に含まれる単語と、既出ターン214に含まれる単語との関連を示す関連重みが算出されている。単語は、形態素解析結果に基づき抽出される。このため、関連単語重みテーブル210では、文字列216=「ルート」や、文字列218=「行き先」のように、3文字の文字列が抽出されており、他の「値段」や「電車」等、2文字の文字列とは文字数が異なる単語も抽出されている。関連単語重みテーブル210における、関連重みの算出、更新に関する他の処理は、第2の実施の形態による関連重みテーブル50と同様である。
すなわち、情報処理装置201において、形態素解析部25は、例えば、第1の文32と第2の文45とを夫々形態素解析する。意図解析部5は、形態素解析された形態素から、夫々の文に共通して含まれる単語を第3の文字列とする。意図解析部5は、関連単語重みテーブル210で、既出ターンに含まれる第4の文字列を検索し、関連重みWiを算出する。意図解析部5は、すべての既出ターンについて、全ての第3の文字列、第4の文字列に関する関連重みWiを算出して加算することにより、関連重みWrを算出する。
意図の解析については、第1の実施の形態による情報処理装置1のように、関連重みWrを用いてもよいし、第2の実施の形態において説明したように、評価値G1、または評価値G2を用いてもよい。
図16は、第3の実施の形態による関連単語重みテーブル更新処理の一例を示すフローチャートである。図8における関連重みテーブルの更新(S81)が、ここでは関連単語重みテーブル更新処理に相当する。図16に示すように、関連重み算出部17は、対話履歴90における当該タスクの全ターンの形態素解析を行う(S231)。関連重み算出部17は、当該タスクに関連重み算出に関し未処理のターンがある場合には(S232:YES)、当該ターンの形態素解析結果により抽出された単語の中で、関連重み算出に関して未処理の単語があるか否か判別する(S233)。未処理のターンがない場合には(S232:NO)、例えば、図8の処理に戻って処理が行われる。
S233において未処理の単語がない場合には(S233:NO)、S232から処理が繰り返される。未処理の単語がある場合には(S233:YES)、関連重み算出部17は、当該ターンの当該単語の関連重み算出に関して未処理の既出ターンがあるか否か判別する(S234)。未処理の既出ターンがない場合には(S234:NO)、S233から処理が繰り返される。
未処理の既出ターンがある場合には(S234:YES)、当該既出ターンに、当該ターンの関連重み算出に関して未処理の他の単語があるか否かを判別する(S235)。他の単語がない場合には(S235:NO)、S234から処理が繰り返される。
他の単語がある場合には(S235:YES)、関連重み算出部17は、関連単語重みテーブル210における、当該他の単語に関する頻度に「1」を加算し(S236)、S235に処理を戻す。本実施の形態においては、上記のように関連単語重みテーブル210が更新される。情報処理装置201は、関連単語重みテーブル210を用いて評価値を算出し、意図を出力する。評価値の算出方法は、第1の実施の形態または第2の実施の形態のいずれの方法でもよい。
以上説明したように、第3の実施の形態による情報処理装置201によれば、形態素解析の結果得られる単語を文字列として算出された関連単語重みテーブル210に基づき関連重みを算出するので、関連重みをより適切に算出することが可能となる。また、意味を成さない文字列に関する関連重みの算出が行われることがないので、より効率よく関連重みが算出される。よって、より適切により効率よく入力された文の意図を解析することが可能になる。
(第4の実施の形態)
以下、第4の実施の形態による情報処理装置251について説明する。本実施の形態において、第1の実施の形態による情報処理装置1、第2の実施の形態による情報処理装置100、第3の実施の形態による情報処理装置201と同様の構成および動作については、同一番号を付し、詳細説明を省略する。情報処理装置251では、意図解析部5が意図を解析する際に、関連重みテーブル50、関連確率重みテーブル110、または関連単語重みテーブル210に加え、単独重みテーブル260を用いる。
図17は、第4の実施の形態による情報処理装置251の機能的な構成の一例を示す図である。図17に示すように、情報処理装置251は、情報処理装置1、情報処理装置100、および情報処理装置201と同様に、入力部3、意図解析部5、文例・意図記憶部7、関連重み記憶部9、出力部11を有している。また、情報処理装置251は、情報処理装置100と同様に、終了判定部13、類似度算出部15、関連重み算出部17、履歴管理部19、履歴記憶部21、一時格納部23を有している。さらに情報処理装置251は、単独重み記憶部27を有している。
単独重み記憶部27は、単独重みテーブル260を記憶している。単独重みテーブル260は、第1の文32に出現する各文字列を、その重み(以下、単独重みという)と関連付けた情報であり、意図カテゴリテーブル30に基づき算出される。ある文字列Cの単独重みを単独重みWs(c)とすると、単独重みWs(c)は、下記の式10で表される。
Figure 0006252204
ここで、頻度Nch(c)とは、意図カテゴリテーブル30において同一のカテゴリに分類されている第1の文32の中での、文字列Cの出現数である。max(Nch(c))は、文字列Cを最も多く含むカテゴリにおける、文字列Cの出現頻度である。総数Mは、意図カテゴリテーブル30における意図カテゴリ34の種類の総数である。カテゴリ数Nctg(c)とは、文字列Cを含む意図カテゴリ34の合計数である。
図18は、単独重みテーブル260の一例を示す図である。図18に示すように、単独重みテーブル260では、文字列C=「値段」に対して単独重みWs(c)=5と算出されている。同様に、文字列C=「ルート」に対して、単独重みWs(c)=2と算出されている。
図19は、第4の実施の形態による情報処理装置251による意図解析処理の一例を示すフローチャートである。図19に示すように、意図解析部5は、意図カテゴリテーブル30に、意図解析に関して未処理の第1の文32がない場合には(S281:NO)、処理をS285に進める。未処理の第1の文32がある場合には(S281:YES)、類似度算出部15は、意図カテゴリテーブル30の未処理の第1の文32と、現在進行中のタスクの第2の文との類似度を算出する(S282)。類似度は、例えば第1の文と第2の文との共通する文字列の文字数に基づき、例えば式3、式8などを用いて算出される。
意図解析部5は、例えば、式5、式9等を用いて、各第1の文32について、関連重みを類似度に加算することにより、評価値G1または評価値G2等を算出する(S283)。さらに、意図解析部5は、当該第1の文32に関する第3の文字列の単独重みWs(c)を、評価値G1または評価値G2に加算する(S284)。
続いて、意図解析部5は、処理をS281に戻す。S281において、意図解析に関して未処理の第1の文がない場合には(S281:NO)、意図解析部5は、単独重みWs(c)を考慮した評価値が最大の第1の文32に関連付けられた意図カテゴリ34を、第2の文の意図として出力する(S285)。さらに意図解析部5は、処理を、例えば図8の処理に戻す。
以上詳細に説明したように、第4の実施の形態による情報処理装置251によれば、第1の文と第2の文とに共通する第3の文字列の単独重みWs(c)を考慮して、意図解析を行う。よって、さらに、信頼度の高い意図解析を行うことが可能となる。
(第5の実施の形態)
以下、第5の実施の形態による情報処理装置290について説明する。本実施の形態において、他の実施の形態による情報処理装置1、100、201、251と同様の構成および動作については、同一番号を付し、詳細説明を省略する。
図20は、第5の実施の形態による情報処理装置290の機能的な構成の一例を示す図である。図20に示すように、情報処理装置290は、音声処理部292と情報処理装置1とを有している。音声処理部292は、音声を受付け、所定の処理を行って文字情報に変換する処理を行う。音声処理部292は、音声から文字への変換処理を行った文字情報を、第2の文字情報として入力部3に出力する。他の動作は、第1の実施の形態による情報処理装置1と同様である。
以上説明したように、第5の実施の形態による情報処理装置290によれば、音声を入力すると、入力された音声の意図が解釈される。このとき、関連重みテーブル50を用いて文字列の関連重みを考慮した意図解析を行うので、精度の高い意図解析を行うことができる。
なお、情報処理装置290では、情報処理装置1に代えて情報処理装置100、情報処理装置201、情報処理装置251を用いるようにしてもよい。この場合、夫々の効果に加え、さらに入力を音声で行うことができる。また、出力部11の後段に、文字情報を音声に変換して出力する出力装置を設けることにより、応答を音声で出力するような変形も可能である。
ここで、上記第1から第5の実施の形態、および第2の実施の形態の変形例による意図解析方法の動作をコンピュータに行わせるために共通に適用されるコンピュータの例について説明する。図21は、標準的なコンピュータのハードウエア構成の一例を示すブロック図である。図21に示すように、コンピュータ300は、Central Processing Unit(CPU)302、メモリ304、入力装置306、出力装置308、外部記憶装置312、媒体駆動装置314、ネットワーク接続装置318等がバス310を介して接続されている。
CPU302は、コンピュータ300全体の動作を制御する演算処理装置である。メモリ304は、コンピュータ300の動作を制御するプログラムを予め記憶したり、プログラムを実行する際に必要に応じて作業領域として使用したりするための記憶部である。メモリ304は、例えばRandom Access Memory(RAM)、Read Only Memory(ROM)等である。入力装置306は、コンピュータの使用者により操作されると、その操作内容に対応付けられている使用者からの各種情報の入力を取得し、取得した入力情報をCPU302に送付する装置であり、例えばキーボード装置、マウス装置などである。出力装置308は、コンピュータ300による処理結果を出力する装置であり、表示装置などが含まれる。例えば表示装置は、CPU302により送付される表示データに応じてテキストや画像を表示する。
外部記憶装置312は、例えば、ハードディスクなどの記憶装置であり、CPU302により実行される各種制御プログラムや、取得したデータ等を記憶しておく装置である。媒体駆動装置314は、可搬記録媒体316に書き込みおよび読み出しを行うための装置である。CPU302は、可搬記録媒体316に記録されている所定の制御プログラムを、媒体駆動装置314を介して読み出して実行することによって、各種の制御処理を行うようにすることもできる。可搬記録媒体316は、例えばCompact Disc(CD)−ROM、Digital Versatile Disc(DVD)、Universal Serial Bus(USB)メモリ等である。ネットワーク接続装置318は、有線または無線により外部との間で行われる各種データの授受の管理を行うインタフェース装置である。バス310は、上記各装置等を互いに接続し、データのやり取りを行う通信経路である。
上記第1から第5の実施の形態、および第2の実施の形態の変形例による意図解析方法をコンピュータに実行させるプログラムは、例えば外部記憶装置312に記憶させる。CPU302は、外部記憶装置312からプログラムを読み出し、コンピュータ300に情報処理の動作を行なわせる。このとき、まず、情報処理の処理をCPU302に行わせるための制御プログラムを作成して外部記憶装置312に記憶させておく。そして、入力装置306から所定の指示をCPU302に与えて、この制御プログラムを外部記憶装置312から読み出させて実行させるようにする。また、このプログラムは、可搬記録媒体316に記憶するようにしてもよい。
なお、本発明は、以上に述べた実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内で種々の構成または実施形態を採ることができる。例えば、上記各実施の形態における各構成は、論理的に可能な限り、組み合わせて変形例とすることができる。関連重みの算出などは、上記式に限定されず、変形が可能である。タスク終了の判定については、特定のキーを押す動作や、特定の音声の入力を検知することにより行われるようにしてもよい。また、上記第1から第5の実施の形態および第2の実施の形態の変形例では、対話文を例にして説明したが、上記意図解析方法は、対話文以外の文にも適用が可能である。
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
第1の文と前記第1の文に対応する意図とを対応付けて記憶した文例意図記憶部と、
第1の文字情報に含まれる第1の文字列と前記第1の文字情報において前記第1の文字列より前に出現する第2の文字列との出現頻度に基づき算出された、前記第1の文字列と前記第2の文字列との関連を示す関連重みを記憶した関連重み記憶部と、
前記第1の文字列が前記第1の文と第2の文字情報に含まれる第2の文とに共通して含まれ、前記第2の文字列が前記第2の文字情報において前記第2の文より前に出現する場合、前記関連重みと前記第1の文に対応する前記意図とに基づき、前記第2の文の意図を解析する意図解析部と、
前記第2の文の意図を出力する出力部と、
を有することを特徴とする情報処理装置。
(付記2)
前記第1の文字情報および前記第2の文字情報は、第1の発話文から予め決められた方法で終了と判定されるまでの発話文と応答文とを含む文字情報であることを特徴とする付記1に記載の情報処理装置。
(付記3)
前記第2の文字情報の入力を受付ける入力部と、
予め決められた方法により前記第2の文字情報の入力の終了を判定する終了判定部と、
前記関連重みを算出する関連重み算出部と、
前記第2の文字情報の履歴を管理する履歴管理部と、
前記履歴を記憶する履歴記憶部と、
をさらに有し、
前記履歴管理部は、前記終了判定部が前記終了を判定すると、前記入力部で受付けた前記第2の文字情報を前記履歴記憶部に記憶させ、
前記関連重み算出部は、前記履歴記憶部に記憶された第2の文字情報に基づき前記関連重みを算出する
ことを特徴とする付記1または2に記載の情報処理装置。
(付記4)
前記第1の文と前記第2の文とに共通して含まれる文字の文字数に基づき類似度を算出する類似度算出部、
をさらに有し、
前記意図解析部は、さらに前記類似度に基づき前記第2の文の意図を解析する
ことを特徴とする付記1から付記3のいずれかに記載の情報処理装置。
(付記5)
前記第1の文字列および前記第2の文字列は、連続する所定文字数の文字列であることを特徴とする付記1から付記4のいずれかに記載の情報処理装置。
(付記6)
前記第2の文字情報を形態素解析する形態素解析部
をさらに有し、
前記第1の文字列および前記第2の文字列は、形態素解析によって求められた単語の文文字列であることを特徴とする付記1から付記4のいずれかに記載の情報処理装置。
(付記7)
予め意図がそれぞれ対応付けられた複数の第1の文と、対応付けられた前記意図とに基づき算出される、前記複数の第1の文に含まれる一つの文字列に応じた単独重みを前記単語と関連付けて記憶した単独重み記憶部、
をさらに有し、
前記意図解析部は、さらに前記単独重みに基づき前記第2の文の意図を解析する
ことを特徴とする付記1から付記6のいずれかに記載の情報処理装置。
(付記8)
情報処理装置によって実行される意図解析方法であって、
第1の文字情報に含まれる第1の文字列が第1の文と第2の文字情報に含まれる第2の文とに共通して含まれ、前記第1の文字情報において前記第1の文字列より前に出現する第2の文字列が前記第2の文字情報において前記第2の文より前に出現する場合、前記第1の文字列と前記第2の文字列との前記第1の文字情報における出現頻度に基づき算出された、前記第1の文字列と前記第2の文字列との関連を示す関連重みと、前記第1の文に対応する意図とに基づき、前記第2の文の意図を解析し
前記第2の文の意図を出力する、
ことを特徴とする意図解析方法。
(付記9)
前記第1の文字情報および前記第2の文字情報は、前記第1の発話文から予め決められた方法で終了と判定されるまでの発話文と応答文とを含む文字情報であることを特徴とする付記8に記載の意図解析方法。
(付記10)
前記第2の文字情報の入力を受付け、
予め決められた方法で前記第2の文字情報の入力の終了が判定されると、受付けた前記第2の文字情報を履歴記憶部に記憶させ、
前記履歴記憶部に記憶された第2の文字情報に基づき前記関連重みを算出し
算出された前記関連重みに基づき前記意図を解析する
ことを特徴とする付記8または付記9に記載の意図解析方法。
(付記11)
さらに、
前記第1の文と前記第2の文とに共通して含まれる文字の文字数に基づき類似度を算出し、
前記類似度に基づき前記第2の文の意図を解析する
ことを特徴とする付記8から付記10のいずれかに記載の意図解析方法。
(付記12)
前記第1の文字列および前記第2の文字列は、連続する所定文字数の文字列であることを特徴とする付記8から付記11のいずれかに記載の意図解析方法。
(付記13)
前記第2の文字情報を形態素解析し
前記第1の文字列および前記第2の文字列は、形態素解析によって求められた単語の文文字列であることを特徴とする付記8から付記11のいずれかに記載の意図解析方法。
(付記14)
予め意図がそれぞれ対応付けられた複数の第1の文と、対応付けられた前記意図とに基づき算出される、前記複数の第1の文に含まれる一つの文字列に応じた単独重みにさらに基づき前記第2の文の意図を解析する
ことを特徴とする付記8から付記13のいずれかに記載の意図解析方法。
(付記15)
第1の文字情報に含まれる第1の文字列が第1の文と第2の文字情報に含まれる第2の文とに共通して含まれ、前記第1の文字情報において前記第1の文字列より前に出現する第2の文字列が前記第2の文字情報において前記第2の文より前に出現する場合、前記第1の文字列と前記第2の文字列との前記第1の文字情報における出現頻度に基づき算出された、前記第1の文字列と前記第2の文字列との関連を示す関連重みと、前記第1の文に対応する意図とに基づき、前記第2の文の意図を解析し
前記第2の文の意図を出力する、
処理をコンピュータに実行させるプログラム。
(付記16)
前記第1の文字情報および前記第2の文字情報は、前記第1の発話文から予め決められ方法で終了と判定されるまでの発話文と応答文とを含む文字情報であることを特徴とする付記13に記載のプログラム。
(付記17)
さらに、
前記第2の文字情報の入力を受付け、
予め決められた方法で前記第2の文字情報の入力の終了が判定されると、受付けた前記第2の文字情報を履歴記憶部に記憶させ、
前記履歴記憶部に記憶された第2の文字情報に基づき前記関連重みを算出し
算出された前記関連重みに基づき前記意図を解析する
ことを特徴とする付記15または付記16に記載のプログラム。
1 情報処理装置
3 入力部
5 意図解析部
7 文例・意図記憶部
9 関連重み記憶部
11 出力部
13 終了判定部
15 類似度算出部
17 関連重み算出部
19 履歴管理部
21 履歴記憶部
23 一時格納部
25 形態素解析部
27 単独重み記憶部
30 意図カテゴリテーブル
32 第1の文
34 意図カテゴリ
41 第2の文字情報
42 ターン
44 ターン
45 第2の文
46 第3の文字列
48 第4の文字列
50 関連重みテーブル
51 当該ターン
52 第1の文字列
54 既出ターン
55 第2の文字列
56 重み

Claims (9)

  1. 第1の文と前記第1の文に対応する意図とを対応付けて記憶した文例意図記憶部と、
    第1の文字情報に含まれる第1の文字列と前記第1の文字情報において前記第1の文字列より前に出現する第2の文字列との出現頻度に基づき算出された、前記第1の文字列と前記第2の文字列との関連を示す関連重みを記憶した関連重み記憶部と、
    前記第1の文字列が前記第1の文と第2の文字情報に含まれる第2の文とに共通して含まれ、前記第2の文字列が前記第2の文字情報において前記第2の文より前に出現する場合、前記関連重みと前記第1の文に対応する前記意図とに基づき、前記第2の文の意図を解析する意図解析部と、
    前記第2の文の意図を出力する出力部と、
    を有することを特徴とする情報処理装置。
  2. 前記第1の文字情報および前記第2の文字情報は、第1の発話文から予め決められた方法で終了と判定されるまでの発話文と応答文とを含む文字情報であることを特徴とする請求項1に記載の情報処理装置。
  3. 前記第2の文字情報の入力を受付ける入力部と、
    予め決められた方法により前記第2の文字情報の入力の終了を判定する終了判定部と、
    前記関連重みを算出する関連重み算出部と、
    前記第2の文字情報の履歴を管理する履歴管理部と、
    前記履歴を記憶する履歴記憶部と、
    をさらに有し、
    前記履歴管理部は、前記終了判定部が前記終了を判定すると、前記入力部で受付けた前記第2の文字情報を前記履歴記憶部に記憶させ、
    前記関連重み算出部は、前記履歴記憶部に記憶された第2の文字情報に基づき前記関連重みを算出する
    ことを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記第1の文と前記第2の文とに共通して含まれる文字の文字数に基づき類似度を算出する類似度算出部、
    をさらに有し、
    前記意図解析部は、さらに前記類似度に基づき前記第2の文の意図を解析する
    ことを特徴とする請求項1から請求項3のいずれかに記載の情報処理装置。
  5. 前記第1の文字列および前記第2の文字列は、連続する所定文字数の文字列であることを特徴とする請求項1から請求項4のいずれかに記載の情報処理装置。
  6. 前記第2の文字情報を形態素解析する形態素解析部と、
    をさらに有し、
    前記第1の文字列および前記第2の文字列は、形態素解析によって求められた単語の文文字列であることを特徴とする請求項1から請求項4のいずれかに記載の情報処理装置。
  7. 予め意図がそれぞれ対応付けられた複数の第1の文と、対応付けられた前記意図とに基づき算出される、前記複数の第1の文に含まれる一つの文字列に応じた単独重みを前記単語と関連付けて記憶した単独重み記憶部、
    をさらに有し、
    前記意図解析部は、さらに前記単独重みに基づき前記第2の文の意図を解析する
    ことを特徴とする請求項6に記載の情報処理装置。
  8. 情報処理装置によって実行される意図解析方法であって、
    第1の文字情報に含まれる第1の文字列が第1の文と第2の文字情報に含まれる第2の文とに共通して含まれ、前記第1の文字情報において前記第1の文字列より前に出現する第2の文字列が前記第2の文字情報において前記第2の文より前に出現する場合、前記第1の文字列と前記第2の文字列との前記第1の文字情報における出現頻度に基づき算出された、前記第1の文字列と前記第2の文字列との関連を示す関連重みと、前記第1の文に対応する意図とに基づき、前記第2の文の意図を解析し
    前記第2の文の意図を出力する、
    ことを特徴とする意図解析方法。
  9. 第1の文字情報に含まれる第1の文字列が第1の文と第2の文字情報に含まれる第2の文とに共通して含まれ、前記第1の文字情報において前記第1の文字列より前に出現する第2の文字列が前記第2の文字情報において前記第2の文より前に出現する場合、前記第1の文字列と前記第2の文字列との前記第1の文字情報における出現頻度に基づき算出された、前記第1の文字列と前記第2の文字列との関連を示す関連重みと、前記第1の文に対応する意図とに基づき、前記第2の文の意図を解析し
    前記第2の文の意図を出力する、
    処理をコンピュータに実行させるプログラム。
JP2014013002A 2014-01-28 2014-01-28 情報処理装置、意図解析方法、およびプログラム Expired - Fee Related JP6252204B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014013002A JP6252204B2 (ja) 2014-01-28 2014-01-28 情報処理装置、意図解析方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014013002A JP6252204B2 (ja) 2014-01-28 2014-01-28 情報処理装置、意図解析方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2015141488A JP2015141488A (ja) 2015-08-03
JP6252204B2 true JP6252204B2 (ja) 2017-12-27

Family

ID=53771816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014013002A Expired - Fee Related JP6252204B2 (ja) 2014-01-28 2014-01-28 情報処理装置、意図解析方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP6252204B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998013771A1 (fr) * 1996-09-26 1998-04-02 Mitsubishi Denki Kabushiki Kaisha Processeur interactif
JP4401269B2 (ja) * 2003-12-15 2010-01-20 株式会社ロゼッタ 対訳判断装置及びプログラム
JP4892023B2 (ja) * 2009-03-11 2012-03-07 株式会社東芝 文書分類装置及びプログラム

Also Published As

Publication number Publication date
JP2015141488A (ja) 2015-08-03

Similar Documents

Publication Publication Date Title
EP3648099B1 (en) Voice recognition method, device, apparatus, and storage medium
RU2571608C2 (ru) Создание заметок с использованием голосового потока
JP6556575B2 (ja) 音声処理装置、音声処理方法及び音声処理プログラム
TW202020691A (zh) 特徵詞的確定方法、裝置和伺服器
JP2007122719A (ja) 複数の言語を連動する自動完成推薦語提供システムおよび方法
US20220148576A1 (en) Electronic device and control method
US10586528B2 (en) Domain-specific speech recognizers in a digital medium environment
CN105931644A (zh) 一种语音识别方法及移动终端
US20150039318A1 (en) Apparatus and method for selecting control object through voice recognition
JP4930379B2 (ja) 類似文検索方法、類似文検索システム及び類似文検索用プログラム
JP6123143B1 (ja) 特許要件適否予測装置および特許要件適否予測プログラム
KR20090130028A (ko) 분산 음성 검색을 위한 방법 및 장치
US10860588B2 (en) Method and computer device for determining an intent associated with a query for generating an intent-specific response
EP3550454A1 (en) Electronic device and control method
JP2005321730A (ja) 対話システム、対話システム実行方法、及びコンピュータプログラム
JP2006323517A (ja) テキスト分類装置およびプログラム
JP4962416B2 (ja) 音声認識システム
JP6252204B2 (ja) 情報処理装置、意図解析方法、およびプログラム
JP6756211B2 (ja) 通信端末、音声変換方法、及びプログラム
KR100832859B1 (ko) 모바일 웹 콘텐츠 서비스 시스템 및 그 방법
JPWO2018229937A1 (ja) 意図推定装置及び意図推定方法
JP6805927B2 (ja) インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法
JP6838471B2 (ja) インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法
JP2014115908A (ja) 単語検索装置及び単語検索方法
JP4574186B2 (ja) 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161004

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170929

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171031

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171113

R150 Certificate of patent or registration of utility model

Ref document number: 6252204

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees