JP2006079462A - Interactive information providing method for information retrieval and interactive information providing apparatus - Google Patents

Interactive information providing method for information retrieval and interactive information providing apparatus Download PDF

Info

Publication number
JP2006079462A
JP2006079462A JP2004264576A JP2004264576A JP2006079462A JP 2006079462 A JP2006079462 A JP 2006079462A JP 2004264576 A JP2004264576 A JP 2004264576A JP 2004264576 A JP2004264576 A JP 2004264576A JP 2006079462 A JP2006079462 A JP 2006079462A
Authority
JP
Japan
Prior art keywords
unknown word
word
user
information
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004264576A
Other languages
Japanese (ja)
Inventor
Yoshihito Yasuda
宜仁 安田
Kouji Dousaka
浩二 堂坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004264576A priority Critical patent/JP2006079462A/en
Publication of JP2006079462A publication Critical patent/JP2006079462A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide information even if an input from a user includes a word (unknown word) which is not included in a database. <P>SOLUTION: An input analysis part 2 analyses an input, an interactive processing part 3 retrieves a topic field database 4 while interacting with the user, and when a word is an unknown word which is not included in the database, an unknown word sort determination part 6 decides whether the unknown word is the same sort as an entry of the topic field database 4 or not, an unknown word solution candidate selection part 7 selects a candidate word for solving the unknown word, and an unknown word relationship checking part 8 allows the user to select a candidate word suitable for solving the unknown word and provides a retrieval result obtained by using the candidate word. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、情報検索における未知語処理方法に関る。特に、人とキーボードや音声を通して対話型やりとりする際に未知語処理を行う鉄道情報案内、スケジュール管理、気象情報案内及びカーナビゲーションなどの動作を行う対話型情報提供装置に関する。   The present invention relates to an unknown word processing method in information retrieval. In particular, the present invention relates to an interactive information providing apparatus that performs operations such as railway information guidance, schedule management, weather information guidance, and car navigation that perform unknown word processing when interactively communicating with people through a keyboard and voice.

従来から、利用者との対話型やりとりを通じて所定の動作を成し遂げる装置(以下、適宜、対話型情報提供装置と呼ぶ)が知られている(特許文献1、非特許文献1参照)。図5は従来の対話型情報提供装置を示す図である。このような対話型情報提供装置は、図5に示すように対話制御401の機能の下に行われる対話型やりとりを通じて得られる利用者の要求内容に応じた情報提供を行う。この情報提供を行うために、対話型情報提供装置は情報提供用データベース402を持っている。たとえば、鉄道情報案内システムであれば、各駅の時刻表、各駅間での各鉄道の所用時間、各駅間の運賃や特急料金などの情報が相互に関連付けられた情報提供用データベース402を持つことになる。
特開2002−132811号公報(段落0005〜0007、図1) 自然言語処理、Vol.9、No.1、pp. 43-63(2002)
2. Description of the Related Art Conventionally, an apparatus that achieves a predetermined operation through interactive interaction with a user (hereinafter referred to as an interactive information providing apparatus as appropriate) is known (see Patent Document 1 and Non-Patent Document 1). FIG. 5 shows a conventional interactive information providing apparatus. Such an interactive information providing apparatus provides information according to the user's request content obtained through interactive exchange performed under the function of the interactive control 401 as shown in FIG. In order to provide this information, the interactive information providing apparatus has an information providing database 402. For example, in the case of a railway information guidance system, the information providing database 402 is associated with information such as timetables of stations, time required for each railway between stations, and fares and express charges between stations. Become.
JP 2002-132811 (paragraphs 0005 to 0007, FIG. 1) Natural language processing, Vol.9, No.1, pp. 43-63 (2002)

従来の対話型情報提供装置(図5参照)においては、利用者からの入力が、情報提供用データベース402に含まれていないような語(以下適宜、未知語と呼ぶ)を含んでいる場合は関連する有用な情報があっても情報を提供することができないという問題があった。さらに、このような情報提供用データベース402は、複雑に構造化されているため、対話型情報提供装置の設計者が新しい語を追加するためには多大な労力が必要であるという問題があった(非特許文献1参照)。   In a conventional interactive information providing apparatus (see FIG. 5), when an input from a user includes a word that is not included in the information providing database 402 (hereinafter referred to as an unknown word as appropriate) There is a problem that information cannot be provided even if there is relevant useful information. Furthermore, since the information providing database 402 is structured in a complicated manner, there has been a problem that a designer of the interactive information providing apparatus needs a lot of labor to add a new word. (Refer nonpatent literature 1).

本発明では未知語を含むような利用者からの入力に対して適切に情報提供が可能であるような未知語処理、及びこれに基づく対話型情報提供装置を実現する。   The present invention realizes an unknown word processing that can appropriately provide information in response to an input from a user including an unknown word, and an interactive information providing apparatus based on the unknown word processing.

本発明(請求項1)では、利用者とのキーボードまたは音声を通した自然言語による対話型やりとりを通じて情報を提供する対話型情報提供方法であって、未知語解決侯補選出部が利用者からの入力に含まれる未知語に対して未知語解決侯補を求め、未知語関連付け確認部が利用者に対する確認を通じて未知語とデータベース内の情報を関連付け、情報提供部が関連付けられた情報に基いて情報案内をする。   According to the present invention (claim 1), there is provided an interactive information providing method for providing information through interactive exchange in a natural language through a keyboard or voice with a user, wherein an unknown word solution supplement selection unit is provided by the user. An unknown word solution supplement is obtained for an unknown word included in the input, and the unknown word association confirmation unit associates the unknown word with information in the database through confirmation to the user, and the information providing unit is based on the associated information. Provide information.

この方法によれば、未知語とデータベース内の情報を関連付けて、未知語を含む検索に対しても情報提供が可能になる。   According to this method, it is possible to provide information for a search including an unknown word by associating the unknown word with information in the database.

また、本発明(請求項2)は、入力手段、出力手段及び演算手段を含んで構成されるコンピュータが、利用者との対話型やりとりを通じて前記利用者に所定の情報を提供する対話型情報提供方法であって、前記演算手段は、前記入力手段を介して前記利用者の入力を受け付ける手順、入力解析部において、前記利用者の入力を解析して単語を抽出する手順、未知語種判定部において、辞書データベースを参照して前記抽出した単語が未知語であるか否かを判定する手順、未知語解決候補選出部において、辞書データベースを参照して前記未知語と所定の関係を有する候補を選出する手順、未知語関連付け確認部において、前記出力手段を介して前記候補を前記利用者に提示し、前記入力手段を介して前記利用者の確認結果を入力する手順、情報提供部において、前記出力手段を介して前記抽出した情報を前記利用者に提供する手順、を実行する。   The present invention (Claim 2) provides interactive information provision in which a computer including input means, output means, and arithmetic means provides predetermined information to the user through interactive interaction with the user. In the method, the calculation means receives the user input via the input means, the input analysis section analyzes the user input and extracts a word, the unknown word type determination section A procedure for determining whether or not the extracted word is an unknown word by referring to a dictionary database, and an unknown word solution candidate selection unit that selects a candidate having a predetermined relationship with the unknown word by referring to the dictionary database In the unknown word association confirmation unit, the candidate is presented to the user via the output means, and the confirmation result of the user is input via the input means. In providing unit, the procedure for providing the extracted information via said output means to the user, to run.

この方法によれば、未知語を含む検索においても、利用者の望む情報提供が可能になる。   According to this method, information desired by the user can be provided even in a search including an unknown word.

また、本発明(請求項3)は、前記未知語種判定部が、一般文書ファイルから予め抽出された単語の出現パターンを示す重みの数値及び関連する単語のリストを記憶する装置を参照して未知語を判定する。   In the present invention (Claim 3), the unknown word type determination unit refers to an apparatus that stores a weight value indicating an appearance pattern of a word extracted in advance from a general document file and a list of related words. Determine the word.

この方法によれば、より迅速に未知語を含む検索に対して情報提供ができる。   According to this method, information can be provided for a search including an unknown word more quickly.

本発明(請求項4)は、入力手段、出力手段、演算手段を含んで構成されるコンピュータを用いて、利用者との対話型やりとりを通じて前記利用者に所定の情報を提供する対話型情報提供装置であって、前記演算手段は、前記入力手段を介して前記利用者の入力を受け付ける入力受け付け部、前記利用者の入力を解析して単語を抽出する入力解析部、辞書データベースを参照して前記抽出した単語が未知語であるか否かを判定する未知語種判定部、前記辞書データベースを参照して前記未知語と所定の関係を有する候補を選出する未知語解決候補選出部、前記出力手段を介して前記候補を前記利用者に提示し、前記入力手段を介して前記利用者の確認結果を入力する未知語関連付け確認部、話題分野提供データベースを参照して前記確認結果により確認された候補に関連する情報を抽出する対話処理部、出力手段を介して前記抽出した情報を前記利用者に提供する情報提供部、を備える。   The present invention (Claim 4) provides interactive information provision for providing predetermined information to the user through interactive interaction with the user using a computer including input means, output means, and arithmetic means. The calculation means refers to an input receiving unit that receives the user's input via the input unit, an input analysis unit that analyzes the user's input and extracts a word, and a dictionary database An unknown word type determination unit that determines whether or not the extracted word is an unknown word, an unknown word solution candidate selection unit that selects a candidate having a predetermined relationship with the unknown word by referring to the dictionary database, and the output unit The unknown word association confirmation unit that presents the candidate to the user via the input and inputs the confirmation result of the user via the input means, the confirmation result with reference to the topic field provision database Comprising more interactive processing unit that extracts information related to the confirmed candidate, the information providing unit, for providing to the user the extracted information through an output unit.

この装置によれば、未知語を含む検索においても、利用者の望む情報提供が可能になる。   According to this apparatus, information desired by the user can be provided even in a search including an unknown word.

また、本発明(請求項5)は、前記未知語種判定部が、一般文書ファイルから予め抽出された単語の出現パターンを示す重みの数値及び関連する単語のリストを記憶する装置をさらに備える。 In the present invention (Claim 5), the unknown word type determination unit further includes an apparatus for storing a numerical value of a weight indicating an appearance pattern of a word extracted in advance from a general document file and a list of related words.

この装置によれば、より迅速に未知語を含む検索に対して情報提供ができる。   According to this apparatus, information can be provided for a search including an unknown word more quickly.

本発明によれば、従来は対応できなかった検索対象の情報提供用データベースには含まれていない未知語を含んだ検索に対しても、利用者にとって有益な情報の提供が迅速に可能になる。   According to the present invention, it is possible to quickly provide useful information for a user even for a search including an unknown word that is not included in the database for providing information to be searched that could not be handled conventionally. .

図を参照して、情報検索における対話型情報提供方法(未知語処理方法)及び対話型情報提供装置の実施形態を説明する。図1は本実施形態の対話型情報提供装置のブロック図を示している。図1のように本実施形態の対話型情報提供装置1は、入力解析部2、対話処理部3(3A,3B)、話題分野データベース4、情報提供部5、情報提供部5と連係動作する情報提供用データベース51に加えて、未知語種判定部6、未知語解決候補選出部7、質問応答システム71及び未知語関連付け確認部8を備える。また、未知語種判定部6は、たとえば新聞のテキスト情報のような一般文書ファイルから予め抽出された単語の出現パターンを示す重みの数値及び関連する単語の多重集合を記憶する装置である未知語判定用情報記憶部61を備える構成を採用することもできる。しかし、このような構成をとらずに、ユーザから与えられた方法により前記一般文書ファイルから抽出された単語の出現パターンを示す重みの数値及び関連する単語の多重集合をその場で求めることもできる。   An embodiment of an interactive information providing method (unknown word processing method) and an interactive information providing apparatus in information search will be described with reference to the drawings. FIG. 1 shows a block diagram of the interactive information providing apparatus of this embodiment. As shown in FIG. 1, the interactive information providing apparatus 1 according to the present embodiment operates in conjunction with the input analysis unit 2, the dialogue processing unit 3 (3A, 3B), the topic field database 4, the information providing unit 5, and the information providing unit 5. In addition to the information providing database 51, an unknown word type determination unit 6, an unknown word solution candidate selection unit 7, a question answering system 71, and an unknown word association confirmation unit 8 are provided. The unknown word type determination unit 6 is an unknown word determination device that stores a numerical value of a weight indicating an appearance pattern of a word extracted in advance from a general document file such as newspaper text information and a multiple set of related words. A configuration including the information storage unit 61 may be employed. However, without adopting such a configuration, it is also possible to obtain on the spot a numerical value of the weight indicating the appearance pattern of the word extracted from the general document file by a method given by the user and a multiple set of related words .

[入力解析部]
入力解析部2では、利用者の入力を対話装置によって処理できるような属性とキーの対に変換する。入力の形式が、事前に属性を利用者に示した表の場合はそのまま入力解析部2の出力とすることができる。入力として、キーボードからの自然文を用いる場合は、一般に知られている構文解析の技術を使うことができる。音声を用いる場合は、前記の技術に加え、一般に知られている音声認識技術を用いることができる。出力の値のうち、後記する話題分野データベース4に記載がないものは、未知語であるので、未知語である印をつけて出力する。
[Input analysis section]
The input analysis unit 2 converts the user input into an attribute / key pair that can be processed by the dialogue apparatus. If the input format is a table in which attributes are shown to the user in advance, the input can be output as it is. When using a natural sentence from the keyboard as an input, a generally known parsing technique can be used. When using speech, generally known speech recognition technology can be used in addition to the above-described technology. Among the output values, those not described in the topic field database 4 to be described later are unknown words, and are therefore output with the unknown word.

[対話処理部]
対話処理部3では、入力解析部2の入力解析結果を逐次監視し、情報提供のための充分な情報がまだ利用者からのキー情報入力中に含まれていない場合は、利用者に対して入力を促す対話出力を行うなどして、解析結果を更新し、更新された解析結果を出力する。その他、履歴の参照や、同音異義語の曖昧性の解消など、一般の対話型情報提供装置の対話処理部が通常備える機能をもつ。
[Dialogue processing section]
The dialog processing unit 3 sequentially monitors the input analysis result of the input analysis unit 2, and if sufficient information for providing information is not yet included in the key information input from the user, The analysis result is updated by performing interactive output for prompting input, and the updated analysis result is output. In addition, it has functions normally provided in a dialog processing unit of a general interactive information providing apparatus, such as history reference and resolution of ambiguity of homonyms.

[話題分野データベース]
話題分野データベース4は、入力の解析の際に用いる属性名それぞれに対応する辞書の役割を果たす。すなわち、その属性で情報提供用データベース51が情報提供のために受け付け可能な単語の一覧を保持する。この単語の一覧に含まれない単語は未知語となる。
[Topic database]
The topic field database 4 serves as a dictionary corresponding to each attribute name used for input analysis. That is, the information providing database 51 holds a list of words that can be accepted for providing information with the attribute. Words not included in this word list are unknown words.

[未知語種判定部]
未知語種判定部6では、入力中の未知語の種類が装置のもつ話題分野データベース4中のエントリと同種のものであるかを判定する。たとえば、属性「出発地」として受け付け可能な語彙として、後記する表3の「話題分野データベースの例」中の「出発地」あるいは「目的地」のように駅名が列挙されている場合であれば、入力された未知語が駅名と同種の単語であるのか駅名とは異種の単語であるのかを判定する。
[Unknown word type determination unit]
The unknown word type determination unit 6 determines whether the type of the unknown word being input is the same type as the entry in the topic field database 4 of the device. For example, if a station name is listed as a vocabulary that can be accepted as an attribute “departure location”, such as “departure location” or “destination” in “example of topic field database” in Table 3 to be described later It is determined whether the input unknown word is a word of the same kind as the station name or a different word from the station name.

このような判定を行うことにより、関連付けによっては本質的に情報提供が不能な未知語に対しては、対話型情報提供装置が速やかに利用者に情報提供を行えない旨を伝え、対話を終了することを実現する。たとえば、首都圏の情報しか持っていない鉄道情報案内システムに対して駅名と同種の単語である「京都駅」という未知語が入力された場合、京都駅に関するさまざまな情報(時刻表や乗り入れている列車など)がない限り、対話型情報提供装置1が適切に情報提供することは不可能である。このような場合、関連付けを試みるのではなく、速やかに対話を終了することが望ましい。それに対して、異種の単語であった場合は、駅名の単語を関連付けることに成功すれば、有益な情報を提供できる可能性が残っている。   By making such a determination, for an unknown word that is essentially impossible to provide information depending on the association, the interactive information providing device informs the user that information cannot be provided promptly and terminates the dialogue. Realize that. For example, if an unknown word “Kyoto Station”, which is the same type of word as a station name, is input to a railway information guidance system that only has information on the Tokyo metropolitan area, various information related to Kyoto Station (such as timetables and trains) Unless there is a train or the like), the interactive information providing apparatus 1 cannot appropriately provide information. In such a case, it is desirable to end the dialog promptly rather than trying to associate. On the other hand, in the case of different words, there is a possibility that useful information can be provided if the word of the station name is successfully associated.

情報提供用データベース51などの一般のデータベース中のエントリは、前記の例のような「駅名」といった特定の概念によって構成されているわけではない。そのため、既存の辞書などによる手法は直接利用することも可能ではあるが、適切ではない。本実施形態では、対象となっている情報提供用データベースを検索するための辞書の役割を果たす話題分野デー夕べ−スに列挙されている各単語と、判定対象の単語が、一般の文章(たとえば新聞など)において一緒に出現する単語のパターンが類似した出現方法であるのかどうかを用いて判定する。判定の方法は、後記する対話型情報提供装置1の動作についての記述で述べる。   Entries in a general database such as the information providing database 51 are not configured by a specific concept such as “station name” as in the above example. Therefore, an existing dictionary method can be used directly, but is not appropriate. In the present embodiment, each word listed in the topic field database serving as a dictionary for searching the target information providing database and the word to be determined are general sentences (for example, Judgment is made using whether the pattern of words appearing together in a newspaper or the like is a similar appearance method. The determination method will be described in the description of the operation of the interactive information providing apparatus 1 described later.

[未知語解決候補選出部]
未知語解決侯補選出部7では、入力解析部2の結果を入力として受け取り、解析結果中の未知語に対し、一般に知られている質問応答システム71(たとえば、特許文献1を参照。)を利用して関連付けの候補を出力する。
[Unknown word solution candidate selection section]
The unknown word solution selection complement selection unit 7 receives the result of the input analysis unit 2 as an input, and receives a generally known question answering system 71 (see, for example, Patent Document 1) for the unknown word in the analysis result. Used to output association candidates.

[質問応答システム]
本実施形態では、質問応答システム71として、公知の質問応答システムを流用する。本実施例で取り上げている例は、鉄道情報案内の例であるので、少なくとも駅に関する情報を含む一般文書の集合に対して質問文が与えられると、質問に対する回答文とその根拠とした文書の例を列挙するシステムなどが該当する。このとき、根拠とした文書が複数あれば、複数の回答及びその根拠とした文書を列挙する。ただし、本実施形態では、回答の出力だけを利用して、根拠とした文書の情報は利用しない。
[Question answering system]
In this embodiment, a known question answering system is used as the question answering system 71. Since the example taken up in this embodiment is an example of railway information guidance, when a question sentence is given to a set of general documents including at least information on the station, the answer sentence to the question and the document on which it is based This includes systems that list examples. At this time, if there are a plurality of documents as the basis, a plurality of answers and the documents as the basis are listed. However, in the present embodiment, only the output of the answer is used, and the document information as the basis is not used.

[未知語関連付け確認部]
未知語関連付け確認部8では、関連付け対象の未知語と、未知語解決候補選出部7によって出力された候補を入力とし、利用者に対して確認済み関連付け候補を出力する。
[Unknown word association confirmation section]
The unknown word association confirmation unit 8 receives the unknown word to be associated and the candidate output by the unknown word solution candidate selection unit 7 and outputs the confirmed association candidate to the user.

[情報提供部]
情報提供部5では、対話処理部3(3B)より得られた解析結果に基づいて情報提供用データベース51に検索を行い、情報提供を行う。本実施形態においては、情報提供部5が受け取る解析結果は未知語を含んでいないので、従来の、未知語に対応していない、対話型情報提供装置同様の情報提供部をそのまま用いることができる。
[Information provision department]
The information providing unit 5 searches the information providing database 51 based on the analysis result obtained from the dialogue processing unit 3 (3B) to provide information. In the present embodiment, since the analysis result received by the information providing unit 5 does not include an unknown word, a conventional information providing unit that does not correspond to the unknown word and is similar to the interactive information providing apparatus can be used as it is. .

[情報提供用データベース]
情報提供用データベース51は、対話型情報提供装置1として利用者に提供する情報を蓄えてあるデータベースである。本実施形態では、各駅の時刻表、各駅間での各鉄道の所用時間、各駅間の運賃や特急料金などの情報が相互に関連付けられたエントリを持ち、情報提供部5により参照される。
[Information providing database]
The information providing database 51 is a database that stores information to be provided to the user as the interactive information providing apparatus 1. In this embodiment, information such as the timetable of each station, the time required for each railroad between the stations, the fare and the express charge between the stations, and the like are associated with each other and referred to by the information providing unit 5.

[対話型情報提供装置の動作]
ここでは、対話型情報提供装置1が鉄道情報案内を行う場合を例として説明する。鉄道情報案内では、利用者が希望出発地と希望日的地を入力することにより、対話型情報提供装置1が出発地から目的地までの列車での乗り換え経路を案内する。
[Operation of interactive information provider]
Here, the case where the interactive information providing apparatus 1 performs railway information guidance will be described as an example. In the railway information guidance, when the user inputs a desired departure place and a desired date place, the interactive information providing apparatus 1 guides a transfer route by train from the departure place to the destination.

図1は対話型情報提供装置1の動作全体を示す。それぞれの段階の動作については、分割してそれぞれの部分に対応して説明する。図1に示すように、利用者からの入力を受け取った対話型情報提供装置1は、この入力を入力解析部2に引渡し、ここで、対話装置によって処理できるような属性とキーの対(表1参照)に変換する。   FIG. 1 shows the overall operation of the interactive information providing apparatus 1. The operation at each stage will be described separately for each part. As shown in FIG. 1, the interactive information providing apparatus 1 that has received an input from the user passes the input to the input analysis unit 2, where an attribute and key pair (table) that can be processed by the interactive apparatus. 1).

このとき、対話処理部3は、入力解析部2とやり取りして、検索に必要な情報のうち与えられていない属性を決定し、その未入力の情報を利用者が入力するように促すメッセージを出力する。この過程で、検索に必要な全ての属性の値が決定されたら、これにより話題分野データベース4を検索する。ここで、話題分野データベース4を参照して、その検索において話題分野データベース4には含まれていない未知語を決定する。このとき、未知語がなかった場合には、情報提供部5に検索の質問内容を送って、情報提供部5で情報提供用データベース51に対する検索結果を出力し対話処理を終了する。一方、未知語が判明した場合は、未知語種判定部6で未知語処理を続行する。   At this time, the dialogue processing unit 3 communicates with the input analysis unit 2 to determine an attribute that is not given among information necessary for the search, and a message that prompts the user to input the uninput information. Output. In this process, when all the attribute values necessary for the search are determined, the topic field database 4 is searched. Here, with reference to the topic field database 4, unknown words that are not included in the topic field database 4 in the search are determined. At this time, if there is no unknown word, the contents of the search question are sent to the information providing unit 5, the information providing unit 5 outputs the search result for the information providing database 51, and the interactive processing is terminated. On the other hand, if the unknown word is found, the unknown word type determination unit 6 continues the unknown word processing.

未知語種判定部6では、後記する未知語種を判定する方法によって、その未知語が話題分野データベース4のエントリと同種か異種かを判定し、異種の場合は、未知語解決候補選出部7の処理を続行する。判定結果が同種だった場合は、情報提供部5に処理を移して、該当する情報がないことを利用者に示し、対話処理を終了する。   The unknown word type determination unit 6 determines whether the unknown word is the same type or different from the entry in the topic field database 4 by a method for determining the unknown word type described later. If the unknown word type is different, the processing of the unknown word solution candidate selection unit 7 To continue. If the determination results are the same type, the process is transferred to the information providing unit 5 to indicate to the user that there is no corresponding information, and the dialogue process is terminated.

未知語解決候補選定部7では、入力解析部2で解析された未知語を含む入力を受け取り、質問応答システム71を呼び出して未知語に対する解決の候補となる語を選定する。この候補が複数の場合は、複数の候補を未知語関連付け確認部8へ出力し、これらの候補が質問応答システム71での評価に従って優先順位つきで出力された場合は、その順位に従った候補を出力する。このとき、候補が1つも出力されない場合は、情報提供部5に処理を移して、該当する情報がないことを利用者に示して対話処理を終了する。   The unknown word solution candidate selection unit 7 receives an input including the unknown word analyzed by the input analysis unit 2, calls the question answering system 71, and selects a word that is a candidate for solving the unknown word. When there are a plurality of candidates, the plurality of candidates are output to the unknown word association confirmation unit 8, and when these candidates are output with priority according to the evaluation in the question answering system 71, the candidates according to the ranking are output. Is output. At this time, if no candidate is output, the process proceeds to the information providing unit 5 to indicate to the user that there is no corresponding information, and the dialogue process is terminated.

そして、未知語関連付け確認部8では、未知語解決候補選定部7が出力してきた優先順位つきの候補を優先順位の高いものから順に未知語とともに利用者に示す。この候補に対して、利用者が選択を行った解決候補の単語を用いて、話題分野データベース4に対して通常の検索を行い、その検索結果を情報提供部5に出力する。この検索で利用したキーと同じキーを用いて、情報提供部5は情報提供用データベース51に検索を行って結果を表示する。以下、それぞれの部分での動作を順に説明する。   And the unknown word correlation confirmation part 8 shows a candidate with a priority which the unknown word solution candidate selection part 7 output to a user with an unknown word in an order from a high priority. A normal search is performed on the topic field database 4 using the solution candidate word selected by the user, and the search result is output to the information providing unit 5. Using the same key used in this search, the information providing unit 5 searches the information providing database 51 and displays the result. Hereinafter, the operation in each part will be described in order.

[入力解析部の動作]
図1の入力解析部2では、利用者からの入力を解析する。鉄道情報案内の例では、利用者から与えられた音声や自然言語の文などの入力を解析して、検索に必要な出発地、目的地、日にち及び到着希望時刻の各属性に対応するキーを決定する。

Figure 2006079462
表1は、鉄道情報案内を行う対話型情報提供装置における入力解析部の出力例である。目的地を属性とするキーは「東京タワー」になっており、話題データベースにおける目的地を属性とするエントリのなかに「東京タワー」がないために、この語が未知語と判断されている。 [Operation of input analysis unit]
The input analysis unit 2 in FIG. 1 analyzes input from the user. In the example of railway information guidance, input such as voice and natural language sentences given by the user is analyzed, and keys corresponding to the attributes of the departure place, destination, date and desired arrival time necessary for the search are obtained. decide.
Figure 2006079462
Table 1 shows an output example of the input analysis unit in the interactive information providing apparatus that provides railway information guidance. The key attributed to the destination is “Tokyo Tower”, and since there is no “Tokyo Tower” among the entries attributed to the destination in the topic database, this word is determined to be an unknown word.

[対話処理部の動作]
図1における対話処理部3Aでの動作は、話題データベース4に対しての検索を行うために必要な属性に対するキーを利用者に入力させる対話を行う動作である。

Figure 2006079462
たとえば、入力解析部2による解析結果が表2のような場合、「目的地」に相当する値がないと情報提供を行えないので、対話処理部3Aでは「目的地を指定してください」といった出力を利用者に対して行う。これによって、話題データベース4への検索が可能になるために必要な値(単語)が全て揃うように検索のキーを更新する。 [Operation of Dialogue Processing Unit]
The operation in the dialog processing unit 3A in FIG. 1 is an operation for performing a dialog in which the user inputs a key for an attribute necessary for performing a search on the topic database 4.
Figure 2006079462
For example, if the analysis result by the input analysis unit 2 is as shown in Table 2, the information cannot be provided unless there is a value corresponding to the “destination”, so the dialog processing unit 3A may “specify the destination”. Output to the user. As a result, the search key is updated so that all values (words) necessary for searching the topic database 4 can be obtained.

[話題分野データベースの動作]
話題分野データベース4は、検索に必要な属性に対するキーを全て与えられると、これに対応して検索結果を返答する動作をする。

Figure 2006079462
表3は鉄道情報案内システムにおける話題分野データベースの一例である。この例に対して、出発地を「京都駅」、目的地を「東京駅」、日にちを「4月12日」、到着希望時刻を「17時30分」として与えると、話題分野データベース4の該当するエントリを検索し、該当するエントリがあることを出力する。しかし、該当するエントリがない場合には、どの属性のキーが未知語であったかを出力する。 [Topic database operation]
When the topic field database 4 is given all the keys for the attributes necessary for the search, the topic field database 4 responds to the search result.
Figure 2006079462
Table 3 is an example of the topic field database 4 in the railway information guidance system. For this example, if the departure place is “Kyoto Station”, the destination is “Tokyo Station”, the date is “April 12”, and the desired arrival time is “17:30”, the topic field database 4 Search for the corresponding entry and output that there is a corresponding entry. However, if there is no corresponding entry, it outputs which attribute key was an unknown word.

[未知語種判定部の動作]
未知語種判定部6は、一般文献の文章で出現する単語の情報を用いて、与えられた未知語と話題分野データベース4の中のエントリが同種か異種かを判定する機能を持つ。図2は、未知語判定部6の動作を示す図である。図2に示すようにその単語が出現するときに近隣に出現する単語の類似性を判定するための値Auを算出して(S101)、Auが一閾値を超えているかどうか比較し(S102)、Yesの場合には同種(S103)、Noの場合には異種(S104)という出力を行って未知語判定部6の動作を終了する。図3を参照して、この判定方法をより具体的に説明する。
[Operation of unknown word type determination unit]
The unknown word type determination unit 6 has a function of determining whether the given unknown word and the entry in the topic field database 4 are of the same type or different types using information on words appearing in the text of general literature. FIG. 2 is a diagram illustrating the operation of the unknown word determination unit 6. As shown in FIG. 2, when the word appears, a value A u for determining the similarity of words appearing in the vicinity is calculated (S101), and a comparison is made as to whether A u exceeds a threshold ( In the case of S102), Yes, the same type (S103) is output, and in the case of No, the output of different type (S104) is performed, and the operation of the unknown word determination unit 6 is terminated. This determination method will be described more specifically with reference to FIG.

本実施形態では、現在の話題データベース4に列挙されている各単語と、判定対象の語とを以下の5段階のステップを通じて判定する。   In the present embodiment, each word listed in the current topic database 4 and the word to be determined are determined through the following five steps.

[判定ステップ1]
相当量の一般の文章(たとえば新聞など)を対象に、特定の幅(この説明では5語とし、この幅をウィンドウと呼ぶこととする。)に含まれる単語を重複も含めて集めた単語の集まりを列挙する(S201)。ここでは、集合と異なり、重複も含めて要素を集めたものを多重集合と呼ぶこととし、前記した特定の幅に含まれる単語を要素とする多重集合をウィンドウ多重集合と呼ぶことにする。このウィンドウ多重集合から作った集合をN(S202)、ウィンドウ多重集合から作った多重集合をMとする。このNとMを比較すると、Nでは、重複した要素の出現は許されないので、同じウィンドウ多重集合が重複する場合はそのウィンドウ多重集合のうち1つだけが出現する点がMとは異なる。
[Judgment step 1]
For a large amount of general sentences (such as newspapers), the words collected in a specific width (5 words in this description, this width is called a window) The collection is enumerated (S201). Here, unlike a set, a collection of elements including duplicates is referred to as a multiple set, and a multiple set including words included in a specific width as described above is referred to as a window multiple set. A set made from the window multiple set is N (S202), and a multiple set made from the window multiple set is M. When this N and M are compared, since the occurrence of duplicate elements is not allowed in N, when the same window multiplex set overlaps, only one of the window multiplex sets appears.

たとえば、「今日、光台駅で客から余分に現金を受け取ったミスが、数多く発生。」という文は、「(今日)(光台駅)(で)(客)(から)(余分)(に)(現金)(を)(受け取った)(ミス)(が)(数多く)(発生)」という単語に分けられ、ウィンドウを5とすると、以下のような10個のウィンドウ多重集合が列挙される。   For example, the sentence “Today, there are many mistakes in receiving extra cash from customers at Hikaridai Station.” Is “(Today) (Kohdai Station) (in) (customer) (from) (extra) ( ) (Cash) () (received) (miss) (ga) (many) (occurrence) ”and if the window is 5, the following 10 window multiple sets are listed. The

b1={(から),(で),(今日),(光台駅),(客)}
b2={(から),(で),(余分),(光台駅),(客)}
b3={(から),(で),(に),(余分),(客)}
b4={(から),(に),(余分),(客),(現金)}
b5={(から),(に),(を),(余分),(現金)}
b6={(に),(を),(余分),(現金),(受け取った)}
b7={(に),(を),(ミス),(現金),(受け取った)}
b8={(が),(を),(ミス),(現金),(受け取った)}
b9={(が),(を),(ミス),(受け取った),(数多く)}
b10={(が),(ミス),(受け取った),(数多く),(発生)}
b1 = {(from), (de), (today), (Hikaridai Station), (customer)}
b2 = {(from), (de), (extra), (Hikaridai Station), (customer)}
b3 = {(from), (de), (ni), (extra), (customer)}
b4 = {(from), (to), (extra), (customer), (cash)}
b5 = {(from), (to), (to), (extra), (cash)}
b6 = {(to), (to), (extra), (cash), (received)}
b7 = {(to), (to), (miss), (cash), (received)}
b8 = {(G), (O), (Miss), (Cash), (Received)}
b9 = {(), (), (miss), (received), (many)}
b10 = {(g), (miss), (received), (many), (occurrence)}

また、この場合、10個のウィンドウ多重集合は重複がないので、
N=M={b1,b2,b3,b4,b5,b6,b7,b8,b9,b10}
となる。
In this case, since the 10 window multiple sets do not overlap,
N = M = {b1, b2, b3, b4, b5, b6, b7, b8, b9, b10}
It becomes.

[判定ステップ2]
判定ステップ1で集めた各ウィンドウ多重集合から、既存の話題分野データベースに含まれている単語を含むようなウィンドウ多重集合を列挙する。たとえば、話題分野データベース4に含まれている単語は、「光台駅」のみであったとすると、この場合に選ばれるウィンドウ多重集合はb1とb2となる(S203)。
[Judgment step 2]
From each window multiplex set collected in the determination step 1, window multiplex sets including words included in the existing topic field database are listed. For example, if the only word contained in the topic field database 4 is “Hikaridai Station”, the window multiple sets selected in this case are b1 and b2 (S203).

[判定ステップ3]
判定ステップ2で集めたウィンドウ多重集合に含まれる単語それぞれについて、その単語を含むような多重集合の集合Bを作成した上で(S204)、数1の式に従って、各単語に対する重みwtを計算する(S205)。
[Judgment step 3]
For each word included in the window multiplex set collected in the decision step 2, a set B of multiplex sets including the word is created (S204), and the weight w t for each word is calculated according to the equation (1). (S205).

Figure 2006079462
ただし、ft,bは、単語tがウィンドウ多重集合bに出現した回数であり、ntは、単語tが含まれるようなウィンドウ多重集合が多重集合M中に出現した回数である。この式に具体的な値を代入すれば、それぞれの単語について、重みwtを計算する。
Figure 2006079462
Figure 2006079462
たとえば、単語「光台駅」に対しては、数2の式のように、単語「今日」に対しては
数3の式のように計算する。
Figure 2006079462
Here, f t, b is the number of times that the word t appears in the window multiplex set b, and n t is the number of times that the window multiplex set including the word t appears in the multiplex set M. If a specific value is substituted into this equation, the weight w t is calculated for each word.
Figure 2006079462
Figure 2006079462
For example, for the word “Hikaridai Station”, the calculation is performed as shown in Expression 2 and for the word “Today” as shown in Expression 3.

[判定ステップ4]
集合Nの中から未知語種の判定対象となっている単語uを含むようなウィンドウ多重集合を選び出す(S206)。こうして選び出した全てのウィンドウ多重集合の全て要素(単語)を含む集合Su及び同様の単語の多重集合Tuを作成し(S207)、数4の式に従って、判定値Auを算出する(S208)。ただし、単語tが装置の既存の話題分野データベースに含まれている単語を含むウィンドウ多重集合に出現しない場合(つまり、tに対する重みが定義されていない場合)、重みを0として算出する。
[Determination Step 4]
From the set N, a window multiplex set that includes the word u that is the determination target of the unknown word type is selected (S206). A set S u including all elements (words) of all window multiplex sets selected in this way and a multiplex set T u of similar words are created (S207), and a determination value A u is calculated according to the equation (4) (S208). ). However, when the word t does not appear in the window multiplex set including the word included in the existing topic field database of the device (that is, when the weight for t is not defined), the weight is calculated as 0.

Figure 2006079462
ただし、ftは単語tが多重集合Tuに出現した回数であり、wtは判定ステップ3で算出した重みである。Tuはuを含む全てのウィンドウ多重集合bの要素からなる多重集合であり、SuはTuから重複した要素を取り除いた集合である。
Figure 2006079462
However, f t is the number of times that the term t appeared to multiset T u, the weight calculated in w t the determination step 3. T u is a multiple set including elements of all window multiple sets b including u, and S u is a set obtained by removing duplicate elements from T u .

たとえば、単語「客」が未知語種判定の対象である場合は、判定対象となっている単語uを含むようなウィンドウ多重集合に含まれる単語の集合Su及び同様の単語の多重集合Tuを作成すると後記のようになる。 For example, when the word “customer” is a target of unknown word type determination, a set of words S u and a similar set of similar words T u included in a window multiplex set including the word u to be determined Once created, it will be as described below.

u={(から),(で),(に),(今日),(余分),(光台駅),(客),(現金)}
u={(から),(から),(から),(から),(で),(で),(で),(に),(に),(今日),(余分),(余分),(余分),(光台駅),(光台駅),(客),(客),(客),(客),(現金)}
S u = {(From), (De), (To), (Today), (Extra), (Hikaridai Station), (Customer), (Cash)}
Tu = {(From), (From), (From), (From), (In), (In), (In), (To), (To), (Today), (Extra), (Extra ), (Extra), (Kodai Station), (Kodai Station), (customer), (customer), (customer), (customer), (cash)}

このSu,Tuを用いて、「客」という単語に対して判定値を計算すると、数5の式に示すような結果になる。

Figure 2006079462
この例に示すように、「客」という単語に対してAuを計算するためには、単語の集合Suの要素を対象としたftとwtを必要とする。 When the judgment value is calculated for the word “customer” using S u and T u , the result shown in the formula 5 is obtained.
Figure 2006079462
As shown in this example, in order to calculate the A u against the word "customer" requires targeting the elements of the set S u word f t and w t.

[判定ステップ5]
判定ステップ4での未知語uに対するAuの値をある閾値と比較する(S209)。閾値を越えた場合は、判定対象の語はS203で用いた話題分野データベース中の単語と同種であると判定する(S210)。そうでなければ、異種であると判定する(S211)。たとえば、閾値を10として、判定ステップ4で「客」という単語に対して数5のように判定値8.35が得られたとすると、これは異種であると判定して、未知語解決候補選出部7で対話処理を続行する。同種の場合には、情報提供部5に制御を移して情報がないことを利用者に通知し、対話処理を終了する。
[Determination Step 5]
It is compared with a certain threshold value of A u for unknown word u at decision step 4 (S209). When the threshold value is exceeded, the determination target word is determined to be the same type as the word in the topic field database used in S203 (S210). Otherwise, it is determined that they are different (S211). For example, assuming that the threshold value is 10 and the determination value 8.35 is obtained as shown in Equation 5 for the word “customer” in determination step 4, it is determined that this is a different type, and an unknown word solution candidate is selected. Part 7 continues the dialogue process. In the case of the same type, control is transferred to the information providing unit 5 to notify the user that there is no information, and the dialogue processing is terminated.

[未知語解決候補選出部の動作]
未知語解決候補選出部7は、未知語種判定部6で話題データベースのエントリとは異種と判断した未知語を入力として、一般的な質問応答システム(たとえば特許文献1)に対して質問を行う。本実施形態の場合、質問応答システム71は鉄道情報案内の機能を搭載した質問応答システムということになる。たとえば、目的地という属性の未知語の「シーエス公園」に対しては、「シーエス公園の最寄駅はどこですか?」といった質問をこの質問応答システムに要求したとすると、一般に、質問応答システム71は複数の回答侯補を出力する。これら複数の回答候補を未知語解決侯補選出部の出力とする。もし、質問応答システム71が優先順位付きで回答候補を出力した場合は、それに従って未知語解決候補選出部7も順序つきで前記回答候補を出力する。
[Operation of unknown word solution candidate selection section]
The unknown word solution candidate selection unit 7 makes an inquiry to a general question answering system (for example, Patent Document 1) using the unknown word determined by the unknown word type determination unit 6 as being different from the topic database entry. In the case of this embodiment, the question answering system 71 is a question answering system equipped with a railway information guidance function. For example, for an unknown word “CS Park” having an attribute of destination, if a question such as “Where is the nearest station of CS Park” is requested to this question answering system, generally the question answering system 71 Will output multiple response candidates. These multiple answer candidates are used as the output of the unknown word solution / supplement selection section. If the question answering system 71 outputs answer candidates with priorities, the unknown word solution candidate selection unit 7 outputs the answer candidates in order according to the answer candidates.

[未知語関連付け確認部の動作]
図4は、未知語関連付け確認部8の動作を説明する図である。まず、出力があれば、未知語解決候補選出部7の出力から最上位の解決候補を取り出す(S301)。次に、取り出した解決候補と未知語を用いて、関連付けが正しいかどうかの確認のための質問を、利用者に対して行う(S302)。もし利用者からの応答が肯定的であった場合は、解決侯補と未知語の組を未知語関連付け確認部8の出力として終了する(S303)。利用者の応答(S304)が肯定的ではなかった場合には、未知語解決候補選出部7から次の解決侯補を取り出す。次の候補があるかどうかを調べて(S305)、あるときは、その解決候補で関連付けの確認(S302)から同じ手順を繰り返す。もし、未知語解決侯補選出部7が出力したすべての解決侯補に対して確認を行い、次の解決侯補がない場合は、未知語関連付け確認部8は何も出力せずに終了する(S306)。
[Operation of Unknown Word Association Confirmation Unit]
FIG. 4 is a diagram for explaining the operation of the unknown word association confirmation unit 8. First, if there is an output, the highest-order solution candidate is extracted from the output of the unknown word solution candidate selection unit 7 (S301). Next, using the extracted solution candidate and the unknown word, a question for confirming whether the association is correct is made to the user (S302). If the response from the user is affirmative, the solution compensation and unknown word pair is terminated as an output of the unknown word association confirmation unit 8 (S303). If the user's response (S304) is not positive, the next solution candidate is taken out from the unknown word solution candidate selection unit 7. It is checked whether or not there is a next candidate (S305). If there is, the same procedure is repeated from the confirmation of the association with the solution candidate (S302). If the unknown word solution complement selection unit 7 confirms all the solution candidates, and there is no next solution candidate, the unknown word association confirmation unit 8 ends without outputting anything. (S306).

たとえば、「シーエス公園」という未知語に対して、関連付けする解決候補が{「愛甲石田駅」,「祝園駅」}である場合を考える。この場合は、まず、1番目の解決侯補である「愛甲石田駅」を取り出す。次に、未知語である「シーエス公園」と解決侯補である「愛甲石田駅」を用いて、利用者に対して以下のような確認のための質問を行う。   For example, let us consider a case where the solution candidate to be associated with the unknown word “CS Park” is {“Aiko Ishida Station”, “Hakuen Station”}. In this case, first, “Aiko Ishida Station” which is the first solution compensation is taken out. Next, the following confirmation question is made to the user using the unknown word “CS Park” and the solution supplement “Aiko Ishida Station”.

「当装置はシーエス公園については詳しくありませんが、愛甲石田駅についてご案内すればよろしいでしょうか」   “This device is not familiar with CES Park, but should I tell you about Aiko Ishida Station?”

もし、利用者から「はい」「よろしい」といった肯定の返事が得られた場合は、「シーエス公園」と「愛甲石田駅」の組を関連付の解決候補として出力して終了する。そうではなくもし利用者から、肯定的な返事が得られなかった場合(たとえば、「分かりません」「知りません」など)には、次の解決候補である「祝園駅」を取り出し同様の質問を行う。もし、「愛甲石田駅」と「祝園駅」のどちらについても肯定の返事が得られなかった場合は何も出力せずに終了する。   If an affirmative reply such as “Yes” or “Yes” is obtained from the user, the pair of “CS Park” and “Aiko Ishida Station” is output as an associated solution candidate and the process ends. Otherwise, if the user does not get a positive response (for example, “I don't know” or “I don't know”), I will take out the next solution candidate “Hakuen Station” and do the same Ask a question. If no positive response is obtained for either “Aiko Ishida Station” or “Housen Station”, the process ends without outputting anything.

[対話処理部の動作]
対話処理部3Bでは、最初に入力解析部2から検索に使う語を受け取った後、いくつかの処理が終わった後に、再び未知語を解消した後に話題分野データベース4に対して検索を行う。このとき、未知語がないという結果が得られれば、検索に使うキーを情報提供部5に送る。
[Operation of Dialogue Processing Unit]
In the dialog processing unit 3B, after receiving the word used for the search from the input analysis unit 2 first, after some processes are completed, the unknown word is resolved again and then the topic field database 4 is searched. At this time, if a result that there is no unknown word is obtained, a key used for the search is sent to the information providing unit 5.

[情報提供部の動作]
情報提供部5は、対話処理部3A又は未知語種類判定部6又は対話処理部3Bからの出力を受け取る。対話処理部3A又は対話処理部3Bからの出力を受け取った場合は、対話処理部で用いたキーによって情報提供用データベース51に検索を行った結果を利用者に対して表示したり、あるいはシステム音声で発話したりする。たとえば、表4のような解析結果の場合以下のような発話を行い、対話処理を終了する。
[Operation of information provider]
The information providing unit 5 receives an output from the dialogue processing unit 3A, the unknown word type determination unit 6 or the dialogue processing unit 3B. When the output from the dialogue processing unit 3A or the dialogue processing unit 3B is received, the search result is displayed on the information providing database 51 by the key used in the dialogue processing unit to the user, or the system voice is displayed. Speak at For example, in the case of the analysis result as shown in Table 4, the following utterance is made and the dialogue processing is terminated.

Figure 2006079462
「京都駅から東京駅まで4月12日17時30分に到着するためには、京都駅を16時に出発する新幹線にご乗車ください。」
Figure 2006079462
"To get from Kyoto Station to Tokyo Station on April 12 at 17:30, please take the Shinkansen departing from Kyoto Station at 16:00."

未知語種類判定部6からの出力を受け取った場合は、未知語の解決に成功していない場合であるので、利用者に情報提供ができないことを知らせて、対話処理を終了する。   When the output from the unknown word type determination unit 6 is received, it is a case where the unknown word has not been resolved successfully, so the user is informed that information cannot be provided, and the dialog processing is terminated.

以上のように説明してきたように、本実施形態においては、一般の文書における単語の使い方の情報に基づいて、利用者の入力が未知語を含んでいる場合でも、情報提供を行うことができる。さらに、未知語の関連付けのための行為が無駄であることを察知し、利用者に対して情報提供ができないことを速やかに知らせることができる。これにより、対話型情報提供装置1が未知語を取り扱うことが可能になる。さらに、情報提供装置の設計者によって語彙の追加をしなくても、未知語を取り扱うことができるので、語彙を増やすための対話型情報提供装置1の設計者による労力を減らすことが可能になる。また、利用者にとってより有用な情報提供装置を構築することができ、音声認識や自然言語の文の理解を伴う情報システムの利便性を向上させることができる。なお、これらの未知語処理及び対話型情報提供方法は、演算手段により実現されている。   As described above, in the present embodiment, information can be provided based on information on how to use words in a general document even when the user's input includes an unknown word. . Furthermore, it is possible to detect that the action for associating an unknown word is useless and promptly inform the user that information cannot be provided. Thereby, the interactive information providing apparatus 1 can handle unknown words. Furthermore, since it is possible to handle unknown words without adding vocabulary by the designer of the information providing apparatus, it is possible to reduce the effort by the designer of the interactive information providing apparatus 1 for increasing the vocabulary. . In addition, it is possible to construct an information providing apparatus that is more useful to the user, and it is possible to improve the convenience of the information system that involves voice recognition and understanding of natural language sentences. Note that these unknown word processing and interactive information providing method are realized by computing means.

対話型情報提供装置における未知語処理方法の流れについて説明する図。The figure explaining the flow of the unknown word processing method in an interactive information provision apparatus. 未知語種判定の方法の概略について説明する図。The figure explaining the outline of the method of unknown word kind determination. 未知語種判定の方法の詳細について説明する図。The figure explaining the detail of the method of unknown word kind determination. 未知語関連付け確認部の動作を説明する図。The figure explaining operation | movement of an unknown word correlation confirmation part. 従来の対話型情報提供装置の構成図。The block diagram of the conventional interactive information provision apparatus.

符号の説明Explanation of symbols

1 対話型情報提供装置
2 入力解析部
3 対話処理部
4 話題分野データベース
5 情報提供部
6 未知語種判定部
7 未知語解決候補選出部
8 未知語関連付け確認部
51 情報提供用データベース
61 未知語判定用情報記憶部
71 質問応答システム
DESCRIPTION OF SYMBOLS 1 Interactive information provision apparatus 2 Input analysis part 3 Dialog processing part 4 Topic field database 5 Information provision part 6 Unknown word kind determination part 7 Unknown word solution candidate selection part 8 Unknown word association confirmation part 51 Information provision database 61 For unknown word determination Information storage unit 71 Question answering system

Claims (5)

利用者とのキーボードまたは音声を通した自然言語による対話型やりとりを通じて情報を提供する対話型情報提供方法であって、
未知語解決侯補選出部が利用者からの入力に含まれる未知語に対して未知語解決侯補を求め、
未知語関連付け確認部が利用者に対する確認を通じて未知語とデータベース内の情報を関連付け、
情報提供部が関連付けられた情報に基いて情報案内をすること、
を特徴とする対話型情報提供方法。
An interactive information providing method for providing information through interactive exchange in natural language through a keyboard or voice with a user,
The unknown word solution compensation selection part asks for unknown word solution compensation for unknown words included in the input from the user,
The unknown word association confirmation unit associates the unknown word with the information in the database through confirmation to the user,
Information guidance based on information associated with the information provider,
An interactive information provision method characterized by
入力手段、出力手段及び演算手段を含んで構成されるコンピュータが、利用者との対話型やりとりを通じて前記利用者に所定の情報を提供する対話型情報提供方法であって、
前記演算手段は、
前記入力手段を介して前記利用者の入力を受け付ける手順、
入力解析部において、前記利用者の入力を解析して単語を抽出する手順、
未知語種判定部において、辞書データベースを参照して前記抽出した単語が未知語であるか否かを判定する手順、
未知語解決候補選出部において、辞書データベースを参照して前記未知語と所定の関係を有する候補を選出する手順、
未知語関連付け確認部において、前記出力手段を介して前記候補を前記利用者に提示し、前記入力手段を介して前記利用者の確認結果を入力する手順、
情報提供部において、前記出力手段を介して前記抽出した情報を前記利用者に提供する手順、
を実行すること、
を特徴とする対話型情報提供方法。
A computer comprising an input means, an output means, and an arithmetic means provides an interactive information providing method for providing predetermined information to the user through interactive exchange with the user,
The computing means is
A procedure for accepting the user's input via the input means;
In the input analysis unit, a procedure for extracting a word by analyzing the user input,
In the unknown word type determination unit, a procedure for determining whether or not the extracted word is an unknown word with reference to a dictionary database,
In the unknown word solution candidate selection unit, a procedure for selecting a candidate having a predetermined relationship with the unknown word with reference to a dictionary database;
In an unknown word association confirmation unit, the candidate is presented to the user via the output means, and the confirmation result of the user is input via the input means,
In the information providing unit, a procedure for providing the extracted information to the user via the output means;
Performing the
An interactive information provision method characterized by
前記未知語種判定部は、一般文書ファイルから予め抽出された単語の出現パターンを示す重みの数値及び関連する単語のリストを記憶する装置を参照して未知語を判定すること、
を特徴とする請求項2に記載の対話型情報提供方法。
The unknown word type determination unit determines an unknown word with reference to a device that stores a numerical value of a weight indicating an appearance pattern of a word extracted in advance from a general document file and a list of related words;
The interactive information providing method according to claim 2.
入力手段、出力手段、演算手段を含んで構成されるコンピュータを用いて、利用者との対話型やりとりを通じて前記利用者に所定の情報を提供する対話型情報提供装置であって、
前記演算手段は、
前記入力手段を介して前記利用者の入力を受け付ける入力受け付け部、
前記利用者の入力を解析して単語を抽出する入力解析部、
辞書データベースを参照して前記抽出した単語が未知語であるか否かを判定する未知語種判定部、
前記辞書データベースを参照して前記未知語と所定の関係を有する候補を選出する未知語解決候補選出部、
前記出力手段を介して前記候補を前記利用者に提示し、前記入力手段を介して前記利用者の確認結果を入力する未知語関連付け確認部、
話題分野提供データベースを参照して前記確認結果により確認された候補に関連する情報を抽出する対話処理部、
出力手段を介して前記抽出した情報を前記利用者に提供する情報提供部、
を備えたこと、
を特徴とする対話型情報提供装置。
An interactive information providing apparatus that provides predetermined information to the user through interactive exchange with a user using a computer including an input unit, an output unit, and a calculation unit,
The computing means is
An input receiving unit that receives the user's input via the input means;
An input analysis unit that analyzes the user's input and extracts words;
An unknown word type determination unit that determines whether the extracted word is an unknown word with reference to a dictionary database;
An unknown word solution candidate selection unit that selects candidates having a predetermined relationship with the unknown word with reference to the dictionary database;
An unknown word association confirmation unit that presents the candidate to the user via the output means and inputs the confirmation result of the user via the input means,
A dialogue processing unit that extracts information related to the candidate confirmed by the confirmation result with reference to the topic field providing database;
An information providing unit for providing the extracted information to the user via an output unit;
Having
An interactive information providing device characterized by the above.
前記未知語種判定部は、一般文書ファイルから予め抽出された単語の出現パターンを示す重みの数値及び関連する単語のリストを記憶する装置をさらに備えたこと、
を特徴とする請求項4に記載の対話型情報提供装置。
The unknown word type determination unit further includes a device for storing a numerical value of a weight indicating an appearance pattern of a word extracted in advance from a general document file and a list of related words,
The interactive information providing apparatus according to claim 4.
JP2004264576A 2004-09-10 2004-09-10 Interactive information providing method for information retrieval and interactive information providing apparatus Pending JP2006079462A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004264576A JP2006079462A (en) 2004-09-10 2004-09-10 Interactive information providing method for information retrieval and interactive information providing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004264576A JP2006079462A (en) 2004-09-10 2004-09-10 Interactive information providing method for information retrieval and interactive information providing apparatus

Publications (1)

Publication Number Publication Date
JP2006079462A true JP2006079462A (en) 2006-03-23

Family

ID=36158843

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004264576A Pending JP2006079462A (en) 2004-09-10 2004-09-10 Interactive information providing method for information retrieval and interactive information providing apparatus

Country Status (1)

Country Link
JP (1) JP2006079462A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015069102A (en) * 2013-09-30 2015-04-13 Necパーソナルコンピュータ株式会社 Information processing device, control method, and program
JP2015069099A (en) * 2013-09-30 2015-04-13 Necパーソナルコンピュータ株式会社 Information processing device, control method, and program
JPWO2016067418A1 (en) * 2014-10-30 2017-04-27 三菱電機株式会社 Dialog control apparatus and dialog control method
JP2020077159A (en) * 2018-11-07 2020-05-21 株式会社東芝 Interactive system, interactive device, interactive method, and program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015069102A (en) * 2013-09-30 2015-04-13 Necパーソナルコンピュータ株式会社 Information processing device, control method, and program
JP2015069099A (en) * 2013-09-30 2015-04-13 Necパーソナルコンピュータ株式会社 Information processing device, control method, and program
JPWO2016067418A1 (en) * 2014-10-30 2017-04-27 三菱電機株式会社 Dialog control apparatus and dialog control method
CN107077843A (en) * 2014-10-30 2017-08-18 三菱电机株式会社 Session control and dialog control method
JP2020077159A (en) * 2018-11-07 2020-05-21 株式会社東芝 Interactive system, interactive device, interactive method, and program
US11270683B2 (en) 2018-11-07 2022-03-08 Kabushiki Kaisha Toshiba Interactive system, apparatus, and method
JP7132090B2 (en) 2018-11-07 2022-09-06 株式会社東芝 Dialogue system, dialogue device, dialogue method, and program

Similar Documents

Publication Publication Date Title
JP5831951B2 (en) Dialog system, redundant message elimination method, and redundant message elimination program
US6442522B1 (en) Bi-directional natural language system for interfacing with multiple back-end applications
JP3962767B2 (en) Dialogue support device
US9484034B2 (en) Voice conversation support apparatus, voice conversation support method, and computer readable medium
US20090210411A1 (en) Information Retrieving System
JP6675788B2 (en) Search result display device, search result display method, and program
CN105027198A (en) Speech recognition system and speech recognition device
JP6622165B2 (en) Dialog log analysis apparatus, dialog log analysis method and program
JP6251562B2 (en) Program, apparatus and method for creating similar sentence with same intention
JP4724051B2 (en) Keyword generation method, document search method, topic range estimation method, topic boundary estimation method, apparatus and program thereof, and recording medium thereof
JP4687089B2 (en) Duplicate record detection system and duplicate record detection program
JP2006079462A (en) Interactive information providing method for information retrieval and interactive information providing apparatus
US8666987B2 (en) Apparatus and method for processing documents to extract expressions and descriptions
JP2001100787A (en) Speech interactive system
JP2001101000A (en) Device and method for natural language conversation
JP5132995B2 (en) Information processing apparatus, program, and information processing method
JP4486413B2 (en) Voice dialogue method, voice dialogue apparatus, voice dialogue program, and recording medium recording the same
JP2014137636A (en) Information retrieval apparatus and information retrieval method
JP3983794B2 (en) Dialogue support device
JP2002014751A (en) On-line help system
JP4177195B2 (en) Recognition grammar creation system
JP2009070299A (en) Document processor, program, and document processing method
JP4300056B2 (en) CONCEPT EXPRESSION GENERATION METHOD, PROGRAM, STORAGE MEDIUM, AND CONCEPT EXPRESSION GENERATION DEVICE
JP2002316645A (en) Method and system for displaying station name input selection in route retrieving
JP2010009329A (en) Information processor for converting character string, character string converting method, program and information processing system