JP2006079462A - Interactive information providing method for information retrieval and interactive information providing apparatus - Google Patents
Interactive information providing method for information retrieval and interactive information providing apparatus Download PDFInfo
- Publication number
- JP2006079462A JP2006079462A JP2004264576A JP2004264576A JP2006079462A JP 2006079462 A JP2006079462 A JP 2006079462A JP 2004264576 A JP2004264576 A JP 2004264576A JP 2004264576 A JP2004264576 A JP 2004264576A JP 2006079462 A JP2006079462 A JP 2006079462A
- Authority
- JP
- Japan
- Prior art keywords
- unknown word
- word
- user
- information
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims description 39
- 238000012545 processing Methods 0.000 claims abstract description 30
- 238000004458 analytical method Methods 0.000 claims abstract description 29
- 238000012790 confirmation Methods 0.000 claims description 27
- 239000000284 extract Substances 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 9
- 230000004044 response Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000013589 supplement Substances 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、情報検索における未知語処理方法に関る。特に、人とキーボードや音声を通して対話型やりとりする際に未知語処理を行う鉄道情報案内、スケジュール管理、気象情報案内及びカーナビゲーションなどの動作を行う対話型情報提供装置に関する。 The present invention relates to an unknown word processing method in information retrieval. In particular, the present invention relates to an interactive information providing apparatus that performs operations such as railway information guidance, schedule management, weather information guidance, and car navigation that perform unknown word processing when interactively communicating with people through a keyboard and voice.
従来から、利用者との対話型やりとりを通じて所定の動作を成し遂げる装置(以下、適宜、対話型情報提供装置と呼ぶ)が知られている(特許文献1、非特許文献1参照)。図5は従来の対話型情報提供装置を示す図である。このような対話型情報提供装置は、図5に示すように対話制御401の機能の下に行われる対話型やりとりを通じて得られる利用者の要求内容に応じた情報提供を行う。この情報提供を行うために、対話型情報提供装置は情報提供用データベース402を持っている。たとえば、鉄道情報案内システムであれば、各駅の時刻表、各駅間での各鉄道の所用時間、各駅間の運賃や特急料金などの情報が相互に関連付けられた情報提供用データベース402を持つことになる。
従来の対話型情報提供装置(図5参照)においては、利用者からの入力が、情報提供用データベース402に含まれていないような語(以下適宜、未知語と呼ぶ)を含んでいる場合は関連する有用な情報があっても情報を提供することができないという問題があった。さらに、このような情報提供用データベース402は、複雑に構造化されているため、対話型情報提供装置の設計者が新しい語を追加するためには多大な労力が必要であるという問題があった(非特許文献1参照)。
In a conventional interactive information providing apparatus (see FIG. 5), when an input from a user includes a word that is not included in the information providing database 402 (hereinafter referred to as an unknown word as appropriate) There is a problem that information cannot be provided even if there is relevant useful information. Furthermore, since the
本発明では未知語を含むような利用者からの入力に対して適切に情報提供が可能であるような未知語処理、及びこれに基づく対話型情報提供装置を実現する。 The present invention realizes an unknown word processing that can appropriately provide information in response to an input from a user including an unknown word, and an interactive information providing apparatus based on the unknown word processing.
本発明(請求項1)では、利用者とのキーボードまたは音声を通した自然言語による対話型やりとりを通じて情報を提供する対話型情報提供方法であって、未知語解決侯補選出部が利用者からの入力に含まれる未知語に対して未知語解決侯補を求め、未知語関連付け確認部が利用者に対する確認を通じて未知語とデータベース内の情報を関連付け、情報提供部が関連付けられた情報に基いて情報案内をする。 According to the present invention (claim 1), there is provided an interactive information providing method for providing information through interactive exchange in a natural language through a keyboard or voice with a user, wherein an unknown word solution supplement selection unit is provided by the user. An unknown word solution supplement is obtained for an unknown word included in the input, and the unknown word association confirmation unit associates the unknown word with information in the database through confirmation to the user, and the information providing unit is based on the associated information. Provide information.
この方法によれば、未知語とデータベース内の情報を関連付けて、未知語を含む検索に対しても情報提供が可能になる。 According to this method, it is possible to provide information for a search including an unknown word by associating the unknown word with information in the database.
また、本発明(請求項2)は、入力手段、出力手段及び演算手段を含んで構成されるコンピュータが、利用者との対話型やりとりを通じて前記利用者に所定の情報を提供する対話型情報提供方法であって、前記演算手段は、前記入力手段を介して前記利用者の入力を受け付ける手順、入力解析部において、前記利用者の入力を解析して単語を抽出する手順、未知語種判定部において、辞書データベースを参照して前記抽出した単語が未知語であるか否かを判定する手順、未知語解決候補選出部において、辞書データベースを参照して前記未知語と所定の関係を有する候補を選出する手順、未知語関連付け確認部において、前記出力手段を介して前記候補を前記利用者に提示し、前記入力手段を介して前記利用者の確認結果を入力する手順、情報提供部において、前記出力手段を介して前記抽出した情報を前記利用者に提供する手順、を実行する。 The present invention (Claim 2) provides interactive information provision in which a computer including input means, output means, and arithmetic means provides predetermined information to the user through interactive interaction with the user. In the method, the calculation means receives the user input via the input means, the input analysis section analyzes the user input and extracts a word, the unknown word type determination section A procedure for determining whether or not the extracted word is an unknown word by referring to a dictionary database, and an unknown word solution candidate selection unit that selects a candidate having a predetermined relationship with the unknown word by referring to the dictionary database In the unknown word association confirmation unit, the candidate is presented to the user via the output means, and the confirmation result of the user is input via the input means. In providing unit, the procedure for providing the extracted information via said output means to the user, to run.
この方法によれば、未知語を含む検索においても、利用者の望む情報提供が可能になる。 According to this method, information desired by the user can be provided even in a search including an unknown word.
また、本発明(請求項3)は、前記未知語種判定部が、一般文書ファイルから予め抽出された単語の出現パターンを示す重みの数値及び関連する単語のリストを記憶する装置を参照して未知語を判定する。 In the present invention (Claim 3), the unknown word type determination unit refers to an apparatus that stores a weight value indicating an appearance pattern of a word extracted in advance from a general document file and a list of related words. Determine the word.
この方法によれば、より迅速に未知語を含む検索に対して情報提供ができる。 According to this method, information can be provided for a search including an unknown word more quickly.
本発明(請求項4)は、入力手段、出力手段、演算手段を含んで構成されるコンピュータを用いて、利用者との対話型やりとりを通じて前記利用者に所定の情報を提供する対話型情報提供装置であって、前記演算手段は、前記入力手段を介して前記利用者の入力を受け付ける入力受け付け部、前記利用者の入力を解析して単語を抽出する入力解析部、辞書データベースを参照して前記抽出した単語が未知語であるか否かを判定する未知語種判定部、前記辞書データベースを参照して前記未知語と所定の関係を有する候補を選出する未知語解決候補選出部、前記出力手段を介して前記候補を前記利用者に提示し、前記入力手段を介して前記利用者の確認結果を入力する未知語関連付け確認部、話題分野提供データベースを参照して前記確認結果により確認された候補に関連する情報を抽出する対話処理部、出力手段を介して前記抽出した情報を前記利用者に提供する情報提供部、を備える。 The present invention (Claim 4) provides interactive information provision for providing predetermined information to the user through interactive interaction with the user using a computer including input means, output means, and arithmetic means. The calculation means refers to an input receiving unit that receives the user's input via the input unit, an input analysis unit that analyzes the user's input and extracts a word, and a dictionary database An unknown word type determination unit that determines whether or not the extracted word is an unknown word, an unknown word solution candidate selection unit that selects a candidate having a predetermined relationship with the unknown word by referring to the dictionary database, and the output unit The unknown word association confirmation unit that presents the candidate to the user via the input and inputs the confirmation result of the user via the input means, the confirmation result with reference to the topic field provision database Comprising more interactive processing unit that extracts information related to the confirmed candidate, the information providing unit, for providing to the user the extracted information through an output unit.
この装置によれば、未知語を含む検索においても、利用者の望む情報提供が可能になる。 According to this apparatus, information desired by the user can be provided even in a search including an unknown word.
また、本発明(請求項5)は、前記未知語種判定部が、一般文書ファイルから予め抽出された単語の出現パターンを示す重みの数値及び関連する単語のリストを記憶する装置をさらに備える。 In the present invention (Claim 5), the unknown word type determination unit further includes an apparatus for storing a numerical value of a weight indicating an appearance pattern of a word extracted in advance from a general document file and a list of related words.
この装置によれば、より迅速に未知語を含む検索に対して情報提供ができる。 According to this apparatus, information can be provided for a search including an unknown word more quickly.
本発明によれば、従来は対応できなかった検索対象の情報提供用データベースには含まれていない未知語を含んだ検索に対しても、利用者にとって有益な情報の提供が迅速に可能になる。 According to the present invention, it is possible to quickly provide useful information for a user even for a search including an unknown word that is not included in the database for providing information to be searched that could not be handled conventionally. .
図を参照して、情報検索における対話型情報提供方法(未知語処理方法)及び対話型情報提供装置の実施形態を説明する。図1は本実施形態の対話型情報提供装置のブロック図を示している。図1のように本実施形態の対話型情報提供装置1は、入力解析部2、対話処理部3(3A,3B)、話題分野データベース4、情報提供部5、情報提供部5と連係動作する情報提供用データベース51に加えて、未知語種判定部6、未知語解決候補選出部7、質問応答システム71及び未知語関連付け確認部8を備える。また、未知語種判定部6は、たとえば新聞のテキスト情報のような一般文書ファイルから予め抽出された単語の出現パターンを示す重みの数値及び関連する単語の多重集合を記憶する装置である未知語判定用情報記憶部61を備える構成を採用することもできる。しかし、このような構成をとらずに、ユーザから与えられた方法により前記一般文書ファイルから抽出された単語の出現パターンを示す重みの数値及び関連する単語の多重集合をその場で求めることもできる。
An embodiment of an interactive information providing method (unknown word processing method) and an interactive information providing apparatus in information search will be described with reference to the drawings. FIG. 1 shows a block diagram of the interactive information providing apparatus of this embodiment. As shown in FIG. 1, the interactive information providing apparatus 1 according to the present embodiment operates in conjunction with the
[入力解析部]
入力解析部2では、利用者の入力を対話装置によって処理できるような属性とキーの対に変換する。入力の形式が、事前に属性を利用者に示した表の場合はそのまま入力解析部2の出力とすることができる。入力として、キーボードからの自然文を用いる場合は、一般に知られている構文解析の技術を使うことができる。音声を用いる場合は、前記の技術に加え、一般に知られている音声認識技術を用いることができる。出力の値のうち、後記する話題分野データベース4に記載がないものは、未知語であるので、未知語である印をつけて出力する。
[Input analysis section]
The
[対話処理部]
対話処理部3では、入力解析部2の入力解析結果を逐次監視し、情報提供のための充分な情報がまだ利用者からのキー情報入力中に含まれていない場合は、利用者に対して入力を促す対話出力を行うなどして、解析結果を更新し、更新された解析結果を出力する。その他、履歴の参照や、同音異義語の曖昧性の解消など、一般の対話型情報提供装置の対話処理部が通常備える機能をもつ。
[Dialogue processing section]
The
[話題分野データベース]
話題分野データベース4は、入力の解析の際に用いる属性名それぞれに対応する辞書の役割を果たす。すなわち、その属性で情報提供用データベース51が情報提供のために受け付け可能な単語の一覧を保持する。この単語の一覧に含まれない単語は未知語となる。
[Topic database]
The
[未知語種判定部]
未知語種判定部6では、入力中の未知語の種類が装置のもつ話題分野データベース4中のエントリと同種のものであるかを判定する。たとえば、属性「出発地」として受け付け可能な語彙として、後記する表3の「話題分野データベースの例」中の「出発地」あるいは「目的地」のように駅名が列挙されている場合であれば、入力された未知語が駅名と同種の単語であるのか駅名とは異種の単語であるのかを判定する。
[Unknown word type determination unit]
The unknown word type determination unit 6 determines whether the type of the unknown word being input is the same type as the entry in the
このような判定を行うことにより、関連付けによっては本質的に情報提供が不能な未知語に対しては、対話型情報提供装置が速やかに利用者に情報提供を行えない旨を伝え、対話を終了することを実現する。たとえば、首都圏の情報しか持っていない鉄道情報案内システムに対して駅名と同種の単語である「京都駅」という未知語が入力された場合、京都駅に関するさまざまな情報(時刻表や乗り入れている列車など)がない限り、対話型情報提供装置1が適切に情報提供することは不可能である。このような場合、関連付けを試みるのではなく、速やかに対話を終了することが望ましい。それに対して、異種の単語であった場合は、駅名の単語を関連付けることに成功すれば、有益な情報を提供できる可能性が残っている。 By making such a determination, for an unknown word that is essentially impossible to provide information depending on the association, the interactive information providing device informs the user that information cannot be provided promptly and terminates the dialogue. Realize that. For example, if an unknown word “Kyoto Station”, which is the same type of word as a station name, is input to a railway information guidance system that only has information on the Tokyo metropolitan area, various information related to Kyoto Station (such as timetables and trains) Unless there is a train or the like), the interactive information providing apparatus 1 cannot appropriately provide information. In such a case, it is desirable to end the dialog promptly rather than trying to associate. On the other hand, in the case of different words, there is a possibility that useful information can be provided if the word of the station name is successfully associated.
情報提供用データベース51などの一般のデータベース中のエントリは、前記の例のような「駅名」といった特定の概念によって構成されているわけではない。そのため、既存の辞書などによる手法は直接利用することも可能ではあるが、適切ではない。本実施形態では、対象となっている情報提供用データベースを検索するための辞書の役割を果たす話題分野デー夕べ−スに列挙されている各単語と、判定対象の単語が、一般の文章(たとえば新聞など)において一緒に出現する単語のパターンが類似した出現方法であるのかどうかを用いて判定する。判定の方法は、後記する対話型情報提供装置1の動作についての記述で述べる。
Entries in a general database such as the
[未知語解決候補選出部]
未知語解決侯補選出部7では、入力解析部2の結果を入力として受け取り、解析結果中の未知語に対し、一般に知られている質問応答システム71(たとえば、特許文献1を参照。)を利用して関連付けの候補を出力する。
[Unknown word solution candidate selection section]
The unknown word solution selection complement selection unit 7 receives the result of the
[質問応答システム]
本実施形態では、質問応答システム71として、公知の質問応答システムを流用する。本実施例で取り上げている例は、鉄道情報案内の例であるので、少なくとも駅に関する情報を含む一般文書の集合に対して質問文が与えられると、質問に対する回答文とその根拠とした文書の例を列挙するシステムなどが該当する。このとき、根拠とした文書が複数あれば、複数の回答及びその根拠とした文書を列挙する。ただし、本実施形態では、回答の出力だけを利用して、根拠とした文書の情報は利用しない。
[Question answering system]
In this embodiment, a known question answering system is used as the
[未知語関連付け確認部]
未知語関連付け確認部8では、関連付け対象の未知語と、未知語解決候補選出部7によって出力された候補を入力とし、利用者に対して確認済み関連付け候補を出力する。
[Unknown word association confirmation section]
The unknown word association confirmation unit 8 receives the unknown word to be associated and the candidate output by the unknown word solution candidate selection unit 7 and outputs the confirmed association candidate to the user.
[情報提供部]
情報提供部5では、対話処理部3(3B)より得られた解析結果に基づいて情報提供用データベース51に検索を行い、情報提供を行う。本実施形態においては、情報提供部5が受け取る解析結果は未知語を含んでいないので、従来の、未知語に対応していない、対話型情報提供装置同様の情報提供部をそのまま用いることができる。
[Information provision department]
The
[情報提供用データベース]
情報提供用データベース51は、対話型情報提供装置1として利用者に提供する情報を蓄えてあるデータベースである。本実施形態では、各駅の時刻表、各駅間での各鉄道の所用時間、各駅間の運賃や特急料金などの情報が相互に関連付けられたエントリを持ち、情報提供部5により参照される。
[Information providing database]
The
[対話型情報提供装置の動作]
ここでは、対話型情報提供装置1が鉄道情報案内を行う場合を例として説明する。鉄道情報案内では、利用者が希望出発地と希望日的地を入力することにより、対話型情報提供装置1が出発地から目的地までの列車での乗り換え経路を案内する。
[Operation of interactive information provider]
Here, the case where the interactive information providing apparatus 1 performs railway information guidance will be described as an example. In the railway information guidance, when the user inputs a desired departure place and a desired date place, the interactive information providing apparatus 1 guides a transfer route by train from the departure place to the destination.
図1は対話型情報提供装置1の動作全体を示す。それぞれの段階の動作については、分割してそれぞれの部分に対応して説明する。図1に示すように、利用者からの入力を受け取った対話型情報提供装置1は、この入力を入力解析部2に引渡し、ここで、対話装置によって処理できるような属性とキーの対(表1参照)に変換する。
FIG. 1 shows the overall operation of the interactive information providing apparatus 1. The operation at each stage will be described separately for each part. As shown in FIG. 1, the interactive information providing apparatus 1 that has received an input from the user passes the input to the
このとき、対話処理部3は、入力解析部2とやり取りして、検索に必要な情報のうち与えられていない属性を決定し、その未入力の情報を利用者が入力するように促すメッセージを出力する。この過程で、検索に必要な全ての属性の値が決定されたら、これにより話題分野データベース4を検索する。ここで、話題分野データベース4を参照して、その検索において話題分野データベース4には含まれていない未知語を決定する。このとき、未知語がなかった場合には、情報提供部5に検索の質問内容を送って、情報提供部5で情報提供用データベース51に対する検索結果を出力し対話処理を終了する。一方、未知語が判明した場合は、未知語種判定部6で未知語処理を続行する。
At this time, the
未知語種判定部6では、後記する未知語種を判定する方法によって、その未知語が話題分野データベース4のエントリと同種か異種かを判定し、異種の場合は、未知語解決候補選出部7の処理を続行する。判定結果が同種だった場合は、情報提供部5に処理を移して、該当する情報がないことを利用者に示し、対話処理を終了する。
The unknown word type determination unit 6 determines whether the unknown word is the same type or different from the entry in the
未知語解決候補選定部7では、入力解析部2で解析された未知語を含む入力を受け取り、質問応答システム71を呼び出して未知語に対する解決の候補となる語を選定する。この候補が複数の場合は、複数の候補を未知語関連付け確認部8へ出力し、これらの候補が質問応答システム71での評価に従って優先順位つきで出力された場合は、その順位に従った候補を出力する。このとき、候補が1つも出力されない場合は、情報提供部5に処理を移して、該当する情報がないことを利用者に示して対話処理を終了する。
The unknown word solution candidate selection unit 7 receives an input including the unknown word analyzed by the
そして、未知語関連付け確認部8では、未知語解決候補選定部7が出力してきた優先順位つきの候補を優先順位の高いものから順に未知語とともに利用者に示す。この候補に対して、利用者が選択を行った解決候補の単語を用いて、話題分野データベース4に対して通常の検索を行い、その検索結果を情報提供部5に出力する。この検索で利用したキーと同じキーを用いて、情報提供部5は情報提供用データベース51に検索を行って結果を表示する。以下、それぞれの部分での動作を順に説明する。
And the unknown word correlation confirmation part 8 shows a candidate with a priority which the unknown word solution candidate selection part 7 output to a user with an unknown word in an order from a high priority. A normal search is performed on the
[入力解析部の動作]
図1の入力解析部2では、利用者からの入力を解析する。鉄道情報案内の例では、利用者から与えられた音声や自然言語の文などの入力を解析して、検索に必要な出発地、目的地、日にち及び到着希望時刻の各属性に対応するキーを決定する。
The
[対話処理部の動作]
図1における対話処理部3Aでの動作は、話題データベース4に対しての検索を行うために必要な属性に対するキーを利用者に入力させる対話を行う動作である。
The operation in the
[話題分野データベースの動作]
話題分野データベース4は、検索に必要な属性に対するキーを全て与えられると、これに対応して検索結果を返答する動作をする。
When the
[未知語種判定部の動作]
未知語種判定部6は、一般文献の文章で出現する単語の情報を用いて、与えられた未知語と話題分野データベース4の中のエントリが同種か異種かを判定する機能を持つ。図2は、未知語判定部6の動作を示す図である。図2に示すようにその単語が出現するときに近隣に出現する単語の類似性を判定するための値Auを算出して(S101)、Auが一閾値を超えているかどうか比較し(S102)、Yesの場合には同種(S103)、Noの場合には異種(S104)という出力を行って未知語判定部6の動作を終了する。図3を参照して、この判定方法をより具体的に説明する。
[Operation of unknown word type determination unit]
The unknown word type determination unit 6 has a function of determining whether the given unknown word and the entry in the
本実施形態では、現在の話題データベース4に列挙されている各単語と、判定対象の語とを以下の5段階のステップを通じて判定する。
In the present embodiment, each word listed in the
[判定ステップ1]
相当量の一般の文章(たとえば新聞など)を対象に、特定の幅(この説明では5語とし、この幅をウィンドウと呼ぶこととする。)に含まれる単語を重複も含めて集めた単語の集まりを列挙する(S201)。ここでは、集合と異なり、重複も含めて要素を集めたものを多重集合と呼ぶこととし、前記した特定の幅に含まれる単語を要素とする多重集合をウィンドウ多重集合と呼ぶことにする。このウィンドウ多重集合から作った集合をN(S202)、ウィンドウ多重集合から作った多重集合をMとする。このNとMを比較すると、Nでは、重複した要素の出現は許されないので、同じウィンドウ多重集合が重複する場合はそのウィンドウ多重集合のうち1つだけが出現する点がMとは異なる。
[Judgment step 1]
For a large amount of general sentences (such as newspapers), the words collected in a specific width (5 words in this description, this width is called a window) The collection is enumerated (S201). Here, unlike a set, a collection of elements including duplicates is referred to as a multiple set, and a multiple set including words included in a specific width as described above is referred to as a window multiple set. A set made from the window multiple set is N (S202), and a multiple set made from the window multiple set is M. When this N and M are compared, since the occurrence of duplicate elements is not allowed in N, when the same window multiplex set overlaps, only one of the window multiplex sets appears.
たとえば、「今日、光台駅で客から余分に現金を受け取ったミスが、数多く発生。」という文は、「(今日)(光台駅)(で)(客)(から)(余分)(に)(現金)(を)(受け取った)(ミス)(が)(数多く)(発生)」という単語に分けられ、ウィンドウを5とすると、以下のような10個のウィンドウ多重集合が列挙される。 For example, the sentence “Today, there are many mistakes in receiving extra cash from customers at Hikaridai Station.” Is “(Today) (Kohdai Station) (in) (customer) (from) (extra) ( ) (Cash) () (received) (miss) (ga) (many) (occurrence) ”and if the window is 5, the following 10 window multiple sets are listed. The
b1={(から),(で),(今日),(光台駅),(客)}
b2={(から),(で),(余分),(光台駅),(客)}
b3={(から),(で),(に),(余分),(客)}
b4={(から),(に),(余分),(客),(現金)}
b5={(から),(に),(を),(余分),(現金)}
b6={(に),(を),(余分),(現金),(受け取った)}
b7={(に),(を),(ミス),(現金),(受け取った)}
b8={(が),(を),(ミス),(現金),(受け取った)}
b9={(が),(を),(ミス),(受け取った),(数多く)}
b10={(が),(ミス),(受け取った),(数多く),(発生)}
b1 = {(from), (de), (today), (Hikaridai Station), (customer)}
b2 = {(from), (de), (extra), (Hikaridai Station), (customer)}
b3 = {(from), (de), (ni), (extra), (customer)}
b4 = {(from), (to), (extra), (customer), (cash)}
b5 = {(from), (to), (to), (extra), (cash)}
b6 = {(to), (to), (extra), (cash), (received)}
b7 = {(to), (to), (miss), (cash), (received)}
b8 = {(G), (O), (Miss), (Cash), (Received)}
b9 = {(), (), (miss), (received), (many)}
b10 = {(g), (miss), (received), (many), (occurrence)}
また、この場合、10個のウィンドウ多重集合は重複がないので、
N=M={b1,b2,b3,b4,b5,b6,b7,b8,b9,b10}
となる。
In this case, since the 10 window multiple sets do not overlap,
N = M = {b1, b2, b3, b4, b5, b6, b7, b8, b9, b10}
It becomes.
[判定ステップ2]
判定ステップ1で集めた各ウィンドウ多重集合から、既存の話題分野データベースに含まれている単語を含むようなウィンドウ多重集合を列挙する。たとえば、話題分野データベース4に含まれている単語は、「光台駅」のみであったとすると、この場合に選ばれるウィンドウ多重集合はb1とb2となる(S203)。
[Judgment step 2]
From each window multiplex set collected in the determination step 1, window multiplex sets including words included in the existing topic field database are listed. For example, if the only word contained in the
[判定ステップ3]
判定ステップ2で集めたウィンドウ多重集合に含まれる単語それぞれについて、その単語を含むような多重集合の集合Bを作成した上で(S204)、数1の式に従って、各単語に対する重みwtを計算する(S205)。
[Judgment step 3]
For each word included in the window multiplex set collected in the
数3の式のように計算する。
[判定ステップ4]
集合Nの中から未知語種の判定対象となっている単語uを含むようなウィンドウ多重集合を選び出す(S206)。こうして選び出した全てのウィンドウ多重集合の全て要素(単語)を含む集合Su及び同様の単語の多重集合Tuを作成し(S207)、数4の式に従って、判定値Auを算出する(S208)。ただし、単語tが装置の既存の話題分野データベースに含まれている単語を含むウィンドウ多重集合に出現しない場合(つまり、tに対する重みが定義されていない場合)、重みを0として算出する。
[Determination Step 4]
From the set N, a window multiplex set that includes the word u that is the determination target of the unknown word type is selected (S206). A set S u including all elements (words) of all window multiplex sets selected in this way and a multiplex set T u of similar words are created (S207), and a determination value A u is calculated according to the equation (4) (S208). ). However, when the word t does not appear in the window multiplex set including the word included in the existing topic field database of the device (that is, when the weight for t is not defined), the weight is calculated as 0.
たとえば、単語「客」が未知語種判定の対象である場合は、判定対象となっている単語uを含むようなウィンドウ多重集合に含まれる単語の集合Su及び同様の単語の多重集合Tuを作成すると後記のようになる。 For example, when the word “customer” is a target of unknown word type determination, a set of words S u and a similar set of similar words T u included in a window multiplex set including the word u to be determined Once created, it will be as described below.
Su={(から),(で),(に),(今日),(余分),(光台駅),(客),(現金)}
Tu={(から),(から),(から),(から),(で),(で),(で),(に),(に),(今日),(余分),(余分),(余分),(光台駅),(光台駅),(客),(客),(客),(客),(現金)}
S u = {(From), (De), (To), (Today), (Extra), (Hikaridai Station), (Customer), (Cash)}
Tu = {(From), (From), (From), (From), (In), (In), (In), (To), (To), (Today), (Extra), (Extra ), (Extra), (Kodai Station), (Kodai Station), (customer), (customer), (customer), (customer), (cash)}
このSu,Tuを用いて、「客」という単語に対して判定値を計算すると、数5の式に示すような結果になる。
[判定ステップ5]
判定ステップ4での未知語uに対するAuの値をある閾値と比較する(S209)。閾値を越えた場合は、判定対象の語はS203で用いた話題分野データベース中の単語と同種であると判定する(S210)。そうでなければ、異種であると判定する(S211)。たとえば、閾値を10として、判定ステップ4で「客」という単語に対して数5のように判定値8.35が得られたとすると、これは異種であると判定して、未知語解決候補選出部7で対話処理を続行する。同種の場合には、情報提供部5に制御を移して情報がないことを利用者に通知し、対話処理を終了する。
[Determination Step 5]
It is compared with a certain threshold value of A u for unknown word u at decision step 4 (S209). When the threshold value is exceeded, the determination target word is determined to be the same type as the word in the topic field database used in S203 (S210). Otherwise, it is determined that they are different (S211). For example, assuming that the threshold value is 10 and the determination value 8.35 is obtained as shown in
[未知語解決候補選出部の動作]
未知語解決候補選出部7は、未知語種判定部6で話題データベースのエントリとは異種と判断した未知語を入力として、一般的な質問応答システム(たとえば特許文献1)に対して質問を行う。本実施形態の場合、質問応答システム71は鉄道情報案内の機能を搭載した質問応答システムということになる。たとえば、目的地という属性の未知語の「シーエス公園」に対しては、「シーエス公園の最寄駅はどこですか?」といった質問をこの質問応答システムに要求したとすると、一般に、質問応答システム71は複数の回答侯補を出力する。これら複数の回答候補を未知語解決侯補選出部の出力とする。もし、質問応答システム71が優先順位付きで回答候補を出力した場合は、それに従って未知語解決候補選出部7も順序つきで前記回答候補を出力する。
[Operation of unknown word solution candidate selection section]
The unknown word solution candidate selection unit 7 makes an inquiry to a general question answering system (for example, Patent Document 1) using the unknown word determined by the unknown word type determination unit 6 as being different from the topic database entry. In the case of this embodiment, the
[未知語関連付け確認部の動作]
図4は、未知語関連付け確認部8の動作を説明する図である。まず、出力があれば、未知語解決候補選出部7の出力から最上位の解決候補を取り出す(S301)。次に、取り出した解決候補と未知語を用いて、関連付けが正しいかどうかの確認のための質問を、利用者に対して行う(S302)。もし利用者からの応答が肯定的であった場合は、解決侯補と未知語の組を未知語関連付け確認部8の出力として終了する(S303)。利用者の応答(S304)が肯定的ではなかった場合には、未知語解決候補選出部7から次の解決侯補を取り出す。次の候補があるかどうかを調べて(S305)、あるときは、その解決候補で関連付けの確認(S302)から同じ手順を繰り返す。もし、未知語解決侯補選出部7が出力したすべての解決侯補に対して確認を行い、次の解決侯補がない場合は、未知語関連付け確認部8は何も出力せずに終了する(S306)。
[Operation of Unknown Word Association Confirmation Unit]
FIG. 4 is a diagram for explaining the operation of the unknown word association confirmation unit 8. First, if there is an output, the highest-order solution candidate is extracted from the output of the unknown word solution candidate selection unit 7 (S301). Next, using the extracted solution candidate and the unknown word, a question for confirming whether the association is correct is made to the user (S302). If the response from the user is affirmative, the solution compensation and unknown word pair is terminated as an output of the unknown word association confirmation unit 8 (S303). If the user's response (S304) is not positive, the next solution candidate is taken out from the unknown word solution candidate selection unit 7. It is checked whether or not there is a next candidate (S305). If there is, the same procedure is repeated from the confirmation of the association with the solution candidate (S302). If the unknown word solution complement selection unit 7 confirms all the solution candidates, and there is no next solution candidate, the unknown word association confirmation unit 8 ends without outputting anything. (S306).
たとえば、「シーエス公園」という未知語に対して、関連付けする解決候補が{「愛甲石田駅」,「祝園駅」}である場合を考える。この場合は、まず、1番目の解決侯補である「愛甲石田駅」を取り出す。次に、未知語である「シーエス公園」と解決侯補である「愛甲石田駅」を用いて、利用者に対して以下のような確認のための質問を行う。 For example, let us consider a case where the solution candidate to be associated with the unknown word “CS Park” is {“Aiko Ishida Station”, “Hakuen Station”}. In this case, first, “Aiko Ishida Station” which is the first solution compensation is taken out. Next, the following confirmation question is made to the user using the unknown word “CS Park” and the solution supplement “Aiko Ishida Station”.
「当装置はシーエス公園については詳しくありませんが、愛甲石田駅についてご案内すればよろしいでしょうか」 “This device is not familiar with CES Park, but should I tell you about Aiko Ishida Station?”
もし、利用者から「はい」「よろしい」といった肯定の返事が得られた場合は、「シーエス公園」と「愛甲石田駅」の組を関連付の解決候補として出力して終了する。そうではなくもし利用者から、肯定的な返事が得られなかった場合(たとえば、「分かりません」「知りません」など)には、次の解決候補である「祝園駅」を取り出し同様の質問を行う。もし、「愛甲石田駅」と「祝園駅」のどちらについても肯定の返事が得られなかった場合は何も出力せずに終了する。 If an affirmative reply such as “Yes” or “Yes” is obtained from the user, the pair of “CS Park” and “Aiko Ishida Station” is output as an associated solution candidate and the process ends. Otherwise, if the user does not get a positive response (for example, “I don't know” or “I don't know”), I will take out the next solution candidate “Hakuen Station” and do the same Ask a question. If no positive response is obtained for either “Aiko Ishida Station” or “Housen Station”, the process ends without outputting anything.
[対話処理部の動作]
対話処理部3Bでは、最初に入力解析部2から検索に使う語を受け取った後、いくつかの処理が終わった後に、再び未知語を解消した後に話題分野データベース4に対して検索を行う。このとき、未知語がないという結果が得られれば、検索に使うキーを情報提供部5に送る。
[Operation of Dialogue Processing Unit]
In the
[情報提供部の動作]
情報提供部5は、対話処理部3A又は未知語種類判定部6又は対話処理部3Bからの出力を受け取る。対話処理部3A又は対話処理部3Bからの出力を受け取った場合は、対話処理部で用いたキーによって情報提供用データベース51に検索を行った結果を利用者に対して表示したり、あるいはシステム音声で発話したりする。たとえば、表4のような解析結果の場合以下のような発話を行い、対話処理を終了する。
[Operation of information provider]
The
未知語種類判定部6からの出力を受け取った場合は、未知語の解決に成功していない場合であるので、利用者に情報提供ができないことを知らせて、対話処理を終了する。 When the output from the unknown word type determination unit 6 is received, it is a case where the unknown word has not been resolved successfully, so the user is informed that information cannot be provided, and the dialog processing is terminated.
以上のように説明してきたように、本実施形態においては、一般の文書における単語の使い方の情報に基づいて、利用者の入力が未知語を含んでいる場合でも、情報提供を行うことができる。さらに、未知語の関連付けのための行為が無駄であることを察知し、利用者に対して情報提供ができないことを速やかに知らせることができる。これにより、対話型情報提供装置1が未知語を取り扱うことが可能になる。さらに、情報提供装置の設計者によって語彙の追加をしなくても、未知語を取り扱うことができるので、語彙を増やすための対話型情報提供装置1の設計者による労力を減らすことが可能になる。また、利用者にとってより有用な情報提供装置を構築することができ、音声認識や自然言語の文の理解を伴う情報システムの利便性を向上させることができる。なお、これらの未知語処理及び対話型情報提供方法は、演算手段により実現されている。 As described above, in the present embodiment, information can be provided based on information on how to use words in a general document even when the user's input includes an unknown word. . Furthermore, it is possible to detect that the action for associating an unknown word is useless and promptly inform the user that information cannot be provided. Thereby, the interactive information providing apparatus 1 can handle unknown words. Furthermore, since it is possible to handle unknown words without adding vocabulary by the designer of the information providing apparatus, it is possible to reduce the effort by the designer of the interactive information providing apparatus 1 for increasing the vocabulary. . In addition, it is possible to construct an information providing apparatus that is more useful to the user, and it is possible to improve the convenience of the information system that involves voice recognition and understanding of natural language sentences. Note that these unknown word processing and interactive information providing method are realized by computing means.
1 対話型情報提供装置
2 入力解析部
3 対話処理部
4 話題分野データベース
5 情報提供部
6 未知語種判定部
7 未知語解決候補選出部
8 未知語関連付け確認部
51 情報提供用データベース
61 未知語判定用情報記憶部
71 質問応答システム
DESCRIPTION OF SYMBOLS 1 Interactive
Claims (5)
未知語解決侯補選出部が利用者からの入力に含まれる未知語に対して未知語解決侯補を求め、
未知語関連付け確認部が利用者に対する確認を通じて未知語とデータベース内の情報を関連付け、
情報提供部が関連付けられた情報に基いて情報案内をすること、
を特徴とする対話型情報提供方法。 An interactive information providing method for providing information through interactive exchange in natural language through a keyboard or voice with a user,
The unknown word solution compensation selection part asks for unknown word solution compensation for unknown words included in the input from the user,
The unknown word association confirmation unit associates the unknown word with the information in the database through confirmation to the user,
Information guidance based on information associated with the information provider,
An interactive information provision method characterized by
前記演算手段は、
前記入力手段を介して前記利用者の入力を受け付ける手順、
入力解析部において、前記利用者の入力を解析して単語を抽出する手順、
未知語種判定部において、辞書データベースを参照して前記抽出した単語が未知語であるか否かを判定する手順、
未知語解決候補選出部において、辞書データベースを参照して前記未知語と所定の関係を有する候補を選出する手順、
未知語関連付け確認部において、前記出力手段を介して前記候補を前記利用者に提示し、前記入力手段を介して前記利用者の確認結果を入力する手順、
情報提供部において、前記出力手段を介して前記抽出した情報を前記利用者に提供する手順、
を実行すること、
を特徴とする対話型情報提供方法。 A computer comprising an input means, an output means, and an arithmetic means provides an interactive information providing method for providing predetermined information to the user through interactive exchange with the user,
The computing means is
A procedure for accepting the user's input via the input means;
In the input analysis unit, a procedure for extracting a word by analyzing the user input,
In the unknown word type determination unit, a procedure for determining whether or not the extracted word is an unknown word with reference to a dictionary database,
In the unknown word solution candidate selection unit, a procedure for selecting a candidate having a predetermined relationship with the unknown word with reference to a dictionary database;
In an unknown word association confirmation unit, the candidate is presented to the user via the output means, and the confirmation result of the user is input via the input means,
In the information providing unit, a procedure for providing the extracted information to the user via the output means;
Performing the
An interactive information provision method characterized by
を特徴とする請求項2に記載の対話型情報提供方法。 The unknown word type determination unit determines an unknown word with reference to a device that stores a numerical value of a weight indicating an appearance pattern of a word extracted in advance from a general document file and a list of related words;
The interactive information providing method according to claim 2.
前記演算手段は、
前記入力手段を介して前記利用者の入力を受け付ける入力受け付け部、
前記利用者の入力を解析して単語を抽出する入力解析部、
辞書データベースを参照して前記抽出した単語が未知語であるか否かを判定する未知語種判定部、
前記辞書データベースを参照して前記未知語と所定の関係を有する候補を選出する未知語解決候補選出部、
前記出力手段を介して前記候補を前記利用者に提示し、前記入力手段を介して前記利用者の確認結果を入力する未知語関連付け確認部、
話題分野提供データベースを参照して前記確認結果により確認された候補に関連する情報を抽出する対話処理部、
出力手段を介して前記抽出した情報を前記利用者に提供する情報提供部、
を備えたこと、
を特徴とする対話型情報提供装置。 An interactive information providing apparatus that provides predetermined information to the user through interactive exchange with a user using a computer including an input unit, an output unit, and a calculation unit,
The computing means is
An input receiving unit that receives the user's input via the input means;
An input analysis unit that analyzes the user's input and extracts words;
An unknown word type determination unit that determines whether the extracted word is an unknown word with reference to a dictionary database;
An unknown word solution candidate selection unit that selects candidates having a predetermined relationship with the unknown word with reference to the dictionary database;
An unknown word association confirmation unit that presents the candidate to the user via the output means and inputs the confirmation result of the user via the input means,
A dialogue processing unit that extracts information related to the candidate confirmed by the confirmation result with reference to the topic field providing database;
An information providing unit for providing the extracted information to the user via an output unit;
Having
An interactive information providing device characterized by the above.
を特徴とする請求項4に記載の対話型情報提供装置。 The unknown word type determination unit further includes a device for storing a numerical value of a weight indicating an appearance pattern of a word extracted in advance from a general document file and a list of related words,
The interactive information providing apparatus according to claim 4.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004264576A JP2006079462A (en) | 2004-09-10 | 2004-09-10 | Interactive information providing method for information retrieval and interactive information providing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004264576A JP2006079462A (en) | 2004-09-10 | 2004-09-10 | Interactive information providing method for information retrieval and interactive information providing apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006079462A true JP2006079462A (en) | 2006-03-23 |
Family
ID=36158843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004264576A Pending JP2006079462A (en) | 2004-09-10 | 2004-09-10 | Interactive information providing method for information retrieval and interactive information providing apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006079462A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015069102A (en) * | 2013-09-30 | 2015-04-13 | Necパーソナルコンピュータ株式会社 | Information processing device, control method, and program |
JP2015069099A (en) * | 2013-09-30 | 2015-04-13 | Necパーソナルコンピュータ株式会社 | Information processing device, control method, and program |
JPWO2016067418A1 (en) * | 2014-10-30 | 2017-04-27 | 三菱電機株式会社 | Dialog control apparatus and dialog control method |
JP2020077159A (en) * | 2018-11-07 | 2020-05-21 | 株式会社東芝 | Interactive system, interactive device, interactive method, and program |
-
2004
- 2004-09-10 JP JP2004264576A patent/JP2006079462A/en active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015069102A (en) * | 2013-09-30 | 2015-04-13 | Necパーソナルコンピュータ株式会社 | Information processing device, control method, and program |
JP2015069099A (en) * | 2013-09-30 | 2015-04-13 | Necパーソナルコンピュータ株式会社 | Information processing device, control method, and program |
JPWO2016067418A1 (en) * | 2014-10-30 | 2017-04-27 | 三菱電機株式会社 | Dialog control apparatus and dialog control method |
CN107077843A (en) * | 2014-10-30 | 2017-08-18 | 三菱电机株式会社 | Session control and dialog control method |
JP2020077159A (en) * | 2018-11-07 | 2020-05-21 | 株式会社東芝 | Interactive system, interactive device, interactive method, and program |
US11270683B2 (en) | 2018-11-07 | 2022-03-08 | Kabushiki Kaisha Toshiba | Interactive system, apparatus, and method |
JP7132090B2 (en) | 2018-11-07 | 2022-09-06 | 株式会社東芝 | Dialogue system, dialogue device, dialogue method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5831951B2 (en) | Dialog system, redundant message elimination method, and redundant message elimination program | |
US6442522B1 (en) | Bi-directional natural language system for interfacing with multiple back-end applications | |
JP3962767B2 (en) | Dialogue support device | |
US9484034B2 (en) | Voice conversation support apparatus, voice conversation support method, and computer readable medium | |
US20090210411A1 (en) | Information Retrieving System | |
JP6675788B2 (en) | Search result display device, search result display method, and program | |
CN105027198A (en) | Speech recognition system and speech recognition device | |
JP6622165B2 (en) | Dialog log analysis apparatus, dialog log analysis method and program | |
JP6251562B2 (en) | Program, apparatus and method for creating similar sentence with same intention | |
JP4724051B2 (en) | Keyword generation method, document search method, topic range estimation method, topic boundary estimation method, apparatus and program thereof, and recording medium thereof | |
JP4687089B2 (en) | Duplicate record detection system and duplicate record detection program | |
JP2006079462A (en) | Interactive information providing method for information retrieval and interactive information providing apparatus | |
US8666987B2 (en) | Apparatus and method for processing documents to extract expressions and descriptions | |
JP2001100787A (en) | Speech interactive system | |
JP2001101000A (en) | Device and method for natural language conversation | |
JP5132995B2 (en) | Information processing apparatus, program, and information processing method | |
JP4486413B2 (en) | Voice dialogue method, voice dialogue apparatus, voice dialogue program, and recording medium recording the same | |
JP2014137636A (en) | Information retrieval apparatus and information retrieval method | |
JP3983794B2 (en) | Dialogue support device | |
JP2002014751A (en) | On-line help system | |
JP4177195B2 (en) | Recognition grammar creation system | |
JP2009070299A (en) | Document processor, program, and document processing method | |
JP4300056B2 (en) | CONCEPT EXPRESSION GENERATION METHOD, PROGRAM, STORAGE MEDIUM, AND CONCEPT EXPRESSION GENERATION DEVICE | |
JP2002316645A (en) | Method and system for displaying station name input selection in route retrieving | |
JP2010009329A (en) | Information processor for converting character string, character string converting method, program and information processing system |