JP2001034289A - Interactive system using natural language - Google Patents

Interactive system using natural language

Info

Publication number
JP2001034289A
JP2001034289A JP11202538A JP20253899A JP2001034289A JP 2001034289 A JP2001034289 A JP 2001034289A JP 11202538 A JP11202538 A JP 11202538A JP 20253899 A JP20253899 A JP 20253899A JP 2001034289 A JP2001034289 A JP 2001034289A
Authority
JP
Japan
Prior art keywords
means
task
natural language
command
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11202538A
Other languages
Japanese (ja)
Other versions
JP3662780B2 (en
Inventor
Shinichi Doi
Seiya Osada
伸一 土井
誠也 長田
Original Assignee
Nec Corp
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nec Corp, 日本電気株式会社 filed Critical Nec Corp
Priority to JP20253899A priority Critical patent/JP3662780B2/en
Publication of JP2001034289A publication Critical patent/JP2001034289A/en
Application granted granted Critical
Publication of JP3662780B2 publication Critical patent/JP3662780B2/en
Application status is Expired - Fee Related legal-status Critical
Anticipated expiration legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To provide an interactive system capable of reducing the load of a user by allowing the system to interpret the vague speaking of the user and changing the response of the system while using the degree of assurance of the interpreted result.
SOLUTION: This system is provided with a natural language analyzing means 21 which receives a character string from an input device 1 and converts it into plural task commands by referring to a dictionary storage part 31, an ambiguity dissolving means 22 which narrows down the plural task commands to one by referring to an ambiguity dissolving information storage part 32 and also obtains the degree of assurance from the method of the narrowing down of the commands and a response sentence generating means 23 which generates a response sentence in accordance with the degree of assurance by referring to the narrowed down task command and the obtained degree of assurance and the dictionary storage part 31 and outputs it to an output device 4.
COPYRIGHT: (C)2001,JPO

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【発明の属する技術分野】本発明は、自然言語を用いた対話システムに関し、特に、ユーザの曖昧な発話を解釈しユーザへの応答を行なうシステム及び装置に関する。 The present invention relates to relates to a dialogue system using a natural language, in particular, to a system and device a response to interpret ambiguous utterances of the user user.

【0002】 [0002]

【従来の技術】タスクに対するユーザの発話は一般的には曖昧なものであり、曖昧な発話を解釈する従来のシステムとして以下のようなものがあげられる。 User's speech for the Related Art task is generally are those ambiguous, include those described below as a conventional system for interpreting ambiguous speech.

【0003】第1のシステムは、曖昧な発話に対してシステムが確認の応答を行い、それに対してユーザに肯定か否定かを答えさせることでユーザの発話を解釈するものである。 [0003] The first system, performs a response system is checked against the ambiguous speech, it is to interpret the speech of the user by giving answer whether positive or negative to the user for it. 例えば特開平9-171394号公報には、システムがユーザの曖昧な発話から生成できるタスクを列挙し、 For example, Japanese Patent Laid-Open No. 9-171394, to enumerate tasks that the system can be generated from ambiguous speech of the user,
列挙したタスクの中から1つずつユーザの意図に合うかどうか質問し、ユーザが肯定を意味する語を入力すると、システムはそのタスクが正しい解釈であると決定する。 It fits the user's intention by one of the listed tasks if asked, the user inputs a word that means affirmative, the system determines that the task is a correct interpretation.

【0004】第2のシステムは、ユーザの曖昧な発話をシステムはさまざまな手がかりを用いて一意に解釈して、確認なしにタスクを実行するものである。 [0004] The second system is ambiguous utterance of the user system is uniquely interpreted using various clues, it is to perform a task without confirmation.

【0005】 [0005]

【発明が解決しようとする課題】しかしながら、上記した従来のシステムは下記記載の問題点を有している。 [SUMMARY OF THE INVENTION However, the conventional system described above has the following problems described.

【0006】上記第1のシステムの問題点は、ユーザが曖昧な発話するたびにシステムが確認の応答文を出力することから、ユーザはそのたびに応答文に答えなくてはならず、煩雑であり、負担がかかる、ということである。 [0006] The problems of the first system, from the user system outputs a response statement of confirmation each time you ambiguous speech, the user should not not answer in response sentence each time, complicated There, the burden is applied, is that.

【0007】一方、上記第2のシステムの問題点は、ユーザの曖昧性のある発話を一意に解釈して必ず実行してしまうと、システムの解釈が間違っていた時にユーザはシステムが行ってしまったタスクに対して修正を行わなくてはならず、結果としてユーザに負担がかかる、ということである。 [0007] On the other hand, problems of the second system, and the utterance of the ambiguity of the user would run sure to uniquely interpreted, the user is gone the system when the interpretation of the system was wrong and should not without modifications to the task, the result burden on users such as is that.

【0008】したがって、本発明は、上記問題点に鑑みてなされたものであって、その目的は、ユーザが発話した後、ユーザにできるだけ負荷のかけることなく、タスクの実行と応答文の出力を行なうシステム及び装置を提供することにある。 [0008] Accordingly, the present invention was made in view of the above problems, and an object, after the user has uttered, without imposing a possible load on the user, the output of the response sentence and the execution of the task to provide a system and apparatus do. これ以外の本発明の目的、特徴、利点等は以下の説明から、当業者には直ちに明らかとされるであろう。 Other objects, features, the advantages such as the following description, to those skilled in the art would be readily apparent.

【0009】 [0009]

【課題を解決するための手段】前記目的を達成する本発明は、入力手段から入力された自然言語を受け取り、語彙辞書を参照して1又は複数のタスクコマンドに変換する自然言語解析手段と、曖昧性解消情報を参照して、複数のタスクコマンドを1つに絞り込むとともに、絞り込みの仕方から、確信度を求める曖昧性解消手段と、絞り込んだタスクコマンドと求められた確信度と語彙辞書を参照して確信度に応じた応答文を生成し、出力手段に出力する応答文生成手段とを備える。 SUMMARY OF THE INVENTION The present invention to achieve the object, receives a natural language input from the input means, and natural language analysis means for converting the one or more tasks command with reference to the lexical dictionary, Referring to disambiguation information, in conjunction with the Filter multiple tasks commands into one, the manner of narrowing, and disambiguation means for determining a confidence factor, the confidence and lexicon obtained a narrowed task command and generating an answering sentence according to confidence in, and a response sentence generation means for outputting to the output unit. より詳細には、本発明は、入力された自然言語を解釈するために必要な語彙と、該自然言語の解釈結果から応答文を生成するために必要な語彙を予め記憶する辞書記憶部と、前記辞書記憶部を参照して、入力された自然言語の解釈を行う自然言語解析手段と、前記自然言語解析手段で求められた解釈結果が複数存在した時に、1つの解釈結果に絞り込むための手がかりとして用いられる情報を記憶する曖昧性解消情報記憶部と、前記自然言語解析手段で求められた解釈結果が複数存在した時に、前記曖昧性解消情報記憶部を参照して、前記複数の解釈結果を1つに絞り込むとともに、前記1つに絞り込んだ解釈結果に対する確信度を求める曖昧性解消手段と、前記曖昧性解消手段で絞り込んだ解釈結果を応答文として出力し、その際、前記曖 More particularly, the present invention includes a vocabulary needed to interpret the input natural language, a dictionary storage unit for previously storing a vocabulary required to produce a response sentence from the interpretation result of the natural language, with reference to the dictionary storage section, and the natural language analysis means interprets the input natural language, when the natural language analysis interpretation result obtained by the means there exist a plurality clues to narrow down to one interpretation result a disambiguation information storage unit for storing information to be used as, when the interpretation result obtained by the natural language analysis means there are a plurality, with reference to the disambiguation information storage unit, a plurality of interpretation results with narrowed down to one, and outputs the disambiguation means for determining the confidence for narrowing down the interpretation result to the one, the narrowed interpretation result in the disambiguation means in response sentence, this time, the 曖 性解消手段で求められた前記確信度に応じて応答文を変化させる応答文生成手段と、を備える。 And a response sentence generation means for changing the response sentence according to the confidence obtained by the sexual eliminating means.

【0010】本発明は、前記曖昧性解消手段で求められた解釈を受けて、該解釈をタスクコマンドに変換し、前記タスクコマンドからタスクを実行するタスク実行手段をさらに備える。 [0010] The present invention receives the interpretation obtained by the disambiguation means, converts the interpretation task command, further comprising a task execution means for executing a task from the task command.

【0011】本発明においては、前記応答文生成手段が、前記曖昧性解消手段で求められた確信度に応じて、 [0011] In the present invention, the response sentence generation unit, depending on the confidence determined by the disambiguation means,
前記タスク実行手段でタスクを実行した後にタスクの実行を報告する応答文を生成するか、もしくは、前記タスク実行手段でタスクを実行する前にタスクを実行してとよいか否かを確認するための応答文を生成するか、を決定する。 The task execution means or generates a response sentence for reporting the execution of the task after performing the task, or to confirm whether a good and performing a task before executing the task by the task performing device to of generating a response sentence or, to determine.

【0012】本発明においては、実行を行ったタスクコマンドに対する逆操作のタスクコマンドを記憶するキャンセルコマンド記憶部と、キャンセルの意味を表す入力があったときに、前記タスク実行手段でキャンセルコマンドを実行するとともに、前記応答文生成手段において、キャンセルコマンドを実行したことを報告する応答文を生成する。 In the present invention, executes a cancel command storage unit that stores the inverse operation of the task commands to the task command was executed, when there is an input representing the meaning of the cancellation, the cancel command in the task execution means as well as, in the response sentence generation unit generates a response sentence for reporting that you have performed the cancel command.

【0013】本発明においては、システムがタスクコマンドを実行してようかどうかの確認をとる応答文を出力した後、時間の経過を測定する時間管理手段を備え、前記時間管理手段で計時を開始後、あらかじめ定められた所定の時間が経過しても、ユーザからの応答がない時には、肯定を表す入力が前記入力装置に入力されたものと解釈する。 In the present invention, after the system outputs a response sentence to take to confirm whether no matter running task command, includes a time management means for measuring the passage of time, starts clocking by the time management unit after, even after a predetermined time determined in advance, when there is no response from the user is interpreted as input representing the affirmative is input to the input device.

【0014】 [0014]

【発明の実施の形態】本発明の好ましい実施の形態について以下に説明する。 The preferred embodiment of the embodiment of the present invention will be described below. 本発明の自然言語を用いた対話システムは、入力された自然言語を解釈する自然言語解析手段(図1の21)と、解釈結果が複数存在する時に解釈を1つに絞り込むとともに、その絞り込み方を用いて、確信度を求める曖昧性解消手段(図1の22)と、 Dialogue system using the natural language of the present invention includes a natural language analysis means for interpreting the input natural language (21 in FIG. 1), together with the interpretation result is narrowed down to one interpretation when there exist a plurality of the narrowing lateral and using a disambiguation means for determining a confidence (22 in FIG. 1),
1つに絞り込まれたタスクコマンドから確信度に応じた応答文を生成する応答文生成手段(図1の23)と、を有する。 Has a response sentence generation means for generating an answering sentence corresponding to the confidence from the task command narrowed down to one (23 in FIG. 1), the.

【0015】本発明においては、ユーザの曖昧な発話を確信度というパラメータに変換し、確信度に応じた応答文を生成することにより、自然な対話を行うことができる。 In the present invention, converts the ambiguous utterances of the user in the parameter of confidence, by generating an answering sentence corresponding to confidence, it is possible to perform a natural conversation.

【0016】本発明はその好ましい第1の実施の形態において、図1を参照すると、入力手段(1)から入力された自然言語に対して辞書記憶部(31)を参照して解釈を行う自然言語解析手段(21)と、自然言語解析手段(21)で求められた解釈結果が複数存在した時に、 The present invention in its preferred first embodiment, referring to FIG. 1, the natural performed by referring to interpretation dictionary storage unit (31) relative to the natural language input from the input means (1) a language analysis means (21), when the interpretation result obtained there exist a plurality of natural language analysis means (21),
自然言語解析手段(21)で求められた解釈結果が複数存在した時に、解釈結果に絞り込むための手がかりとして用いられる情報を記憶する曖昧性解消情報記憶部(3 When interpreting obtained by natural language analysis means (21) results there are a plurality, disambiguation information storage unit for storing information to be used as a cue to narrow down the interpretation result (3
2)の情報を参照して、前記複数の解釈結果を1つに絞り込むとともに、前記1つに絞り込んだ解釈結果に対する確信度を求める曖昧性解消手段(22)と、曖昧性解消手段(22)で絞り込んだ解釈結果を応答文として出力手段(4)から出力し、その際、前記曖昧性解消手段で求められた前記確信度に応じて応答文を変化させる応答文生成手段(23)と、を備える。 Using the information from 2), the plurality of interpretations results with narrowed down to one, the a disambiguation means for determining the confidence for narrowing down interpretation result to one (22), disambiguation means (22) and outputs, where the response sentence generation means for changing the response sentence according to the confidence determined by the disambiguation means (23) from the output means narrowed interpretation result in a response sentence (4), equipped with a.

【0017】自然言語解析手段(21)で求められた複数の解釈として複数の処理要求(タスクコマンド)がある場合、曖昧性解消手段(22)は、曖昧性解消情報記憶部(32)に記憶された情報(例えば処理対象の物理的な条件、入力された自然言語の文脈、ユーザの操作履歴等)に基づき、複数の処理要求のうち妥当な処理要求を一つ選択するとともに確信度を設定する。 [0017] If there are multiple processing request (task commands) as multiple interpretation obtained by the natural language analysis means (21), disambiguation means (22) is stored in the ambiguity resolution information storage unit (32) information set the reliability level with (e.g. physical condition of the processing target, the context of the input natural language, the operation history of the user) based on, you select one appropriate processing requests among a plurality of processing requests to. その際、自然言語解析手段(21)で求められた解釈が一つの場合、曖昧性がないため、確信度最大とする。 At that time, the interpretation obtained by the natural language analysis means (21) in one case, since there is no ambiguity, the confidence up.

【0018】本発明は、その好ましい第2の実施の形態において、図3を参照すると、曖昧性解消手段(22) [0018] The present invention, in its preferred second embodiment, referring to FIG. 3, disambiguation means (22)
で求められた解釈を受けて、該解釈をタスクコマンドに変換し、前記タスクコマンドからタスクを実行するタスク実行手段(24)をさらに備える。 In response the interpretation obtained by, converts the interpretation task command, further comprising a task execution means (24) to perform a task from the task command.

【0019】応答文生成手段(23)は、前記曖昧性解消手段(22)で求められた確信度に応じて、前記タスク実行手段(24)でタスクを実行した後にタスクの実行を報告する応答文を生成するか、もしくは、タスク実行手段(24)でタスクを実行する前にタスクを実行してよいか否かを確認するための応答文を生成するかを決定する。 The response sentence generation means (23), in response to said obtained confidence determined by the disambiguation means (22), reports the execution of the task after performing the task in the task execution means (24) responsive or generating a sentence, or to determine whether to generate a response sentence for confirming whether may perform tasks before running the task in the task execution means (24).

【0020】すなわち、自然言語解析手段(21)では、入力された自然言語を解釈し、該入力された自然言語から解釈可能な処理要求(タスクコマンド)が複数ある場合、前記曖昧性解消手段(22)で複数のタスクコマンドを一つに絞り込み、該一つの絞り込まれた確信度が小の場合、タスクコマンドを直ちに実行せずに、未実行タスクコマンド記憶部(33)に一旦記憶しておき、 [0020] That is, the natural language analysis means (21) interprets the input natural language, if the input of interpretable processing request from the natural language (task commands) there are multiple said disambiguation means ( 22) Filter by a plurality of tasks commands into one, if confidence narrowed with said one of small, without immediately executing the task command, leave temporarily stored in the non-execution task command storage unit (33) ,
タスクを実行する前にタスクを実行してよいか否かを確認するための応答文を出力する。 Outputting a response sentence for confirming whether may perform tasks before executing the task. 該応答文に対してユーザが肯定を意味する入力を行なった場合、未実行タスクコマンド記憶部(33)からタスクコマンドを取り出して、タスク実行手段でタスクコマンドを実行し、タスク実行完了の応答文を出力し、一方否定入力の場合、未実行タスク取り消しの応答文を作成して出力する。 If the user performs an input to mean positive with respect to the response sentence is taken out tasks command from unexecuted task command storage unit (33), perform the tasks command in task performing device, the response sentence of task execution completion outputs, whereas when a negative input, and outputs to create a response sentence unexecuted task cancellation.

【0021】応答文生成手段(23)が、曖昧性解消手段(22)で求められた確信度に応じて、応答文を生成するかしないかを決定するようにしてもよい。 The response sentence generation means (23), depending on the confidence determined by the disambiguation means (22), may be determined whether or not to generate a response sentence.

【0022】応答文生成手段(23)は、曖昧性解消手段(22)で求められた確信度に応じて、曖昧性解消手段(22)が解釈した結果を、報告、確認、質問のうちのいずれかを表す応答文に変更する。 The response sentence generation means (23), depending on the confidence determined by the disambiguation means (22), the results of disambiguation means (22) is interpreted, reported, confirm, among the questions to change the response sentence that represents either.

【0023】本発明は、その好ましい第3の実施の形態において、図5を参照すると、タスク実行手段で実行を行ったタスクコマンドに対する逆操作のタスクコマンドを記憶するキャンセルコマンド記憶部(34)を備え、 The invention, in its preferred third embodiment, referring to FIG. 5, the cancel command storage unit that stores the task commands the reverse operation to the task command was executed by the task execution means (34) provided,
ユーザからキャンセルの意味を表す入力があったときに、タスク実行手段でキャンセルコマンドを実行するとともに、応答文生成手段(22)では、キャンセルコマンドを実行したことを報告する応答文を生成する。 When there is an input representing the meaning of the cancellation from the user, and executes the cancel command in the task execution unit, in response sentence generation means (22) generates a response sentence to report that it has executed a cancel command.

【0024】本発明は、その好ましい第4の実施の形態において、図7を参照すると、絞り込まれたタスクコマンドの確信度が低いときに、応答文生成手段(22)では、タスクコマンドを実行していいかどうかの確認をとる応答文を出力し、該応答文を出力した後、時間の経過を測定するタイマ等の時間管理手段(35)を備え、計時を開始後、あらかじめ定められた所定の時間が経過しても、ユーザからの応答がない時には、肯定を表す入力が入力手段(1)に入力されたものと解釈する。 The invention, in its preferred fourth embodiment, referring to FIG. 7, when the confidence of the narrowed task command is low, the response sentence generation unit (22), perform the tasks command I whether to output the response sentence taking check, after outputting the response sentence includes time management means (35) such as a timer for measuring the elapsed time after the start timing, predetermined a predetermined even after the elapse of time, when there is no response from the user is interpreted as input representing the affirmative is input to the input means (1).

【0025】時間管理手段(35)によって前記所定の時間が経過した後に、肯定を表す入力が入力手段(1) [0025] After a lapse of a predetermined time by the time management means (35), input representing a positive input means (1)
に入力されたか否かを、曖昧性解消手段(22)で求めた確信度に応じて決定するようにしてもよい。 Whether or not the input to, may be determined according to confidence obtained in disambiguation means (22).

【0026】本発明の実施の形態において、自然言語解析手段、曖昧性解消手段、応答文生成手段、及びタスク実行手段はコンピュータ等データ処理装置上で実行されるプログラムにより各々の処理・機能が実現される。 [0026] In an embodiment of the present invention, the natural language analyzing means, disambiguation means, answering sentence generating means, and task execution means each processing and functions realized by a program executed on a computer such as a data processing device It is. この場合、該プログラムを記録した記録媒体又は通信媒体より該プログラムをデータ処理装置に読み出して実行することにより本発明を実施することができる。 In this case, it is possible to implement the present invention by reading and executing the program in the data processing device from the recording medium or communication medium recording the program.

【0027】 [0027]

【実施例】本発明の実施例について図面を参照して以下に説明する。 For the embodiment of EXAMPLES The invention will be described below with reference to the accompanying drawings.

【0028】本発明の第1の実施例について説明する。 The described first embodiment of the present invention.
図1は、本発明の第1の実施例の構成を示す図である。 Figure 1 is a diagram showing a configuration of a first embodiment of the present invention.
図1を参照すると、本発明の第1の実施例は、キーボードや音声認識装置等の入力装置1と、プログラム制御により動作するデータ処理装置2と、情報を記憶する記憶装置3と、ディスプレイ装置や音声合成装置等の出力装置4とを含む。 Referring to FIG. 1, a first embodiment of the present invention includes an input device 1 such as a keyboard or a voice recognition device, a data processing device 2 that operates under program control, a storage device 3 for storing information, a display device and and an output device 4 such as a speech synthesizer.

【0029】記憶装置3は、辞書記憶部31と、曖昧性解消情報記憶部32とを備えている。 The storage device 3 includes a dictionary storage unit 31, and a disambiguation information storage unit 32. 辞書記憶部31には、タスクを実行するためにユーザが使う語彙、及び、 The dictionary storage unit 31, and a vocabulary, the user uses to perform the tasks,
ユーザへの応答文を生成するために使う語彙があらかじめ記憶されている。 Vocabulary used to generate a response sentence to the user are stored in advance.

【0030】曖昧性解消情報記憶部32には、タスクがどのような構成になっているのか、タスク先の現在の状態、ユーザが発話した文脈等、ユーザの発話の曖昧性を解消するために必要な情報が記憶されている。 [0030] disambiguation information storage unit 32, whether the task is in any configuration, the current state of the task destination context like uttered by a user, in order to eliminate the ambiguity of the user's utterance the necessary information is stored.

【0031】データ処理装置2は、自然言語解析手段2 [0031] The data processing device 2, natural language analysis means 2
1と、曖昧性解消手段22と、応答文生成手段23と、 1, a disambiguation means 22, the response sentence generation unit 23,
を備えている。 It is equipped with a.

【0032】自然言語解析手段21は、入力装置1で得た入力文字列を辞書記憶部31に記憶された語彙を用いて解釈する。 The natural language analysis unit 21 interprets using vocabulary stored input character string obtained by the input device 1 in the dictionary storage unit 31.

【0033】曖昧性解消手段22は、自然言語解析手段21で複数の解釈結果が得られた時に、曖昧性解消情報記憶部32の情報を参照して、解釈を1つに絞る。 The disambiguation means 22, when a plurality of interpretation results were obtained in a natural language analysis unit 21, by referring to the information of the ambiguity resolution information storage unit 32, squeezing the interpretation into one.

【0034】また、解釈の絞り方に応じてシステムが曖昧性を解消した結果の確信度も求める。 Further, also obtained confidence results the system to eliminate the ambiguity in accordance with the wringing interpretation.

【0035】確信度は、どの手段を用いて曖昧性が解消されたか、また曖昧性解消情報記憶部に記憶されているどの情報を用いて曖昧性が解消されたかを用いて、求められる。 The confidence factor is what means ambiguity using is resolved, also with or ambiguity is resolved using any information stored in the ambiguity resolution information storage unit, is determined.

【0036】以下、タスクとして、家庭内の機器操作を例に挙げて、確信度の定義の一例について説明する。 [0036] Hereinafter, as a task, a device operation in the home as an example, an example of confidence of definition.

【0037】(1). [0037] (1). 自然言語解析手段21で解釈が1 1 is interpreted in a natural language analysis means 21
つに絞られていた時は確信度最大とする。 One time, which has been narrowed down to is the confidence maximum.

【0038】(2). [0038] (2). タスクを実行の可否によって解釈を1つに絞った時、例えば「つけて」という入力に対して、 ・「テレビをつける」というタスクと、 ・「ビデオをつける」というタスクと、 ・「明かりをつける」というタスクと、 の3つ解釈が自然言語解析手段21で行われたときに、 When targeted interpreted by the possibility of executing the task to one, for example with respect to the input of "put in", and the task of, "put a TV", and the task of, "put a video", the - "lights when the task of putting ", three interpretation of was done in a natural language analysis means 21,
例えば、曖昧性解消情報記憶部32の情報から、テレビと明かりの電源はすでについており(電源オンとされており)、ビデオの電源はついていない場合、「ビデオをつける」という解釈に、曖昧性解消手段22で解釈を1 For example, from the information in the disambiguation information storage unit 32, (which is the power-on) TV and the power of the lights are already attached, if the power of the video is not attached, the interpretation of "put a video", ambiguous the interpretation in sex eliminating means 22 1
つに絞った時には、確信度大とする。 One in to when squeezed, and confidence large.

【0039】(3). [0039] (3). 文脈によって解釈を1つに絞った時、例えば「1チャンネルにして」という入力に対して、自然言語解析手段21で、 ・「テレビのチャンネルを1にする」というタスクと、 ・「ビデオのチャンネルを1にする」というタスクと、 の二つの解釈ができたときに、前回の入力が「テレビをつけて」であったため、「テレビ」が話題になっているものと判断して、「テレビのチャンネルを1にする」と曖昧性解消手段22で1に絞った時には「確信度中」とする。 When focused interpreted together by the context, for example, for the input of "in the 1 channel", in a natural language analysis unit 21, and the task of - "to 1 TV channels", - "Video Channel when it is a task that to be "1, of two interpretations, since the previous input is" with the TV ", it is determined that the" TV "has become a hot topic," TV the a channel when squeezed in 1 to "1 in disambiguation means 22 to" in confidence ".

【0040】(4). [0040] (4). ユーザの操作の頻度によって解釈を1つに絞った時、例えば「つけて」という入力に対して、自然言語解析手段21で、 ・「テレビをつける」というタスク、 ・「ビデオをつける」というタスク、 ・「明かりをつける」というタスク の三つに解釈できた時に、今までの過去の履歴を見ると、「明かりをつける」ことが多いので、「明かりをつける」という解釈に、曖昧性解消手段22で1つに絞った時には、「確信度小」とする。 When targeted interpreted by the frequency of the user's operation to one task, for example with respect to the input of "put in", in a natural language analysis means 21, the task of, "put a TV", that, "put a video." , when it can be three to the interpretation of the task of - "put the lights", looking at the past history up to now, because the "put the lights" in many cases, the interpretation of "put the lights", disambiguation when I focused on one in means 22, and "confidence small".

【0041】(5). [0041] (5). 曖昧性を解消する手がかりが何もないため、自然言語解析手段21で見つけた順番を用いて曖昧性解消手段22で解釈を1つに絞った時には、 Since there is no clue to eliminate ambiguity, when focused on one interpreted disambiguation means 22 with the order found in the natural language analyzing unit 21,
「確信度最小」とする。 And "confidence minimum".

【0042】応答文生成手段23は、曖昧性解消手段2 The response sentence generating means 23, disambiguation means 2
2で1つに絞った解釈と、その確信度、さらに辞書記憶部3を使って、ユーザにできるだけ負担にならないような応答文を生成する。 2 focused on one interpretation, its confidence, further using the dictionary storage unit 3, it generates a response sentence that does not cause as much as possible the burden on the user.

【0043】例えば、確信度が高い時には、タスクを実行してしまい、実行した結果を伝える応答文を生成する。 [0043] For example, when the high confidence may, will run the task, and generates a response sentence to convey the result of the execution.

【0044】一方、確信度が低い時には、タスクを実行せずに、実行していいかどうかの応答文を生成する。 [0044] On the other hand, when there is low confidence does not perform the task, to generate a response statement of whether you want to do this.

【0045】図2は、本発明の一実施例の処理手順を示す流れ図である。 [0045] Figure 2 is a flowchart illustrating a processing procedure of an embodiment of the present invention. 図1及び図2を参照して、本発明の一実施例の動作について詳細に説明する。 Referring to FIGS. 1 and 2, detailed description will be given of the operation of one embodiment of the present invention.

【0046】入力装置1で得た入力文字列は、自然言語解析手段21に供給される(図2のステップ101)。 The input character string obtained by the input device 1 is supplied to the natural language analysis unit 21 (step 101 in FIG. 2).

【0047】自然言語解析手段21は、辞書記憶部31 The natural language analysis unit 21, a dictionary storage unit 31
に記憶されている語彙を参照して、この入力文字列を解釈する(図2のステップ102)。 Referring vocabulary stored in and interprets the input string (step 102 of FIG. 2).

【0048】曖昧性解消手段22は、曖昧性解消情報記憶部32に記憶されている情報を参照して、解釈が複数存在している時に解釈を1つに絞り込む(図2のステップ103)。 The disambiguation means 22 refers to the information stored in the ambiguity resolution information storage unit 32, interpretation narrowed down to one interpretation when there are a plurality (Step 103 in FIG. 2).

【0049】また、どのように解釈を1つに絞ったかを用いてシステムが曖昧性を解消した結果の確信度を求める(図2のステップ104)。 [0049] Furthermore, how the system using either focused on one interpretation seek confidence of the result of disambiguation (step 104 in FIG. 2).

【0050】応答文生成手段23は、辞書記憶部31に記憶されている語彙を参照して、確信度の大きさに応じて異なった応答文を生成し、出力装置4に出力する(図2のステップ105)。 The response sentence generation unit 23 refers to the vocabulary stored in the dictionary storage unit 31, it generates a different response sentence according to the size of the confidence, outputs to the output device 4 (FIG. 2 step 105).

【0051】本発明の第1の実施例について具体例に即して以下に説明する。 [0051] will be described below with reference to the specific example of the first embodiment of the present invention.

【0052】入力装置1として、マイクを備え、該マイクから入力された信号をディジタル信号に変換して音声認識を行ない認識結果をテキストコードとして出力する音声認識システムからなるものとする。 [0052] As an input device 1, a microphone, and made of the speech recognition system outputs as text code recognition results performs speech recognition to convert a signal input from the microphone into a digital signal. データ処理装置2はパーソナル・コンピュータよりなり、磁気ディスク記憶装置等よりなる記憶装置3を備える。 The data processing device 2 is made of a personal computer, a storage device 3 made of a magnetic disk storage device. また出力装置4は、スピーカを備えた音声合成システムよりなり、応答文生成手段23から出力されたテキスト情報を音声合成して音声出力する。 The output device 4 is made of the speech synthesis system with a speaker and an audio output by voice synthesizing text information output from the response sentence generation unit 23.

【0053】データ処理装置2(パーソナル・コンピュータ)は、自然言語解析手段21、曖昧性解消手段2 [0053] The data processing apparatus 2 (personal computer), a natural language analysis unit 21, disambiguation means 2
2、応答文生成手段23を備え、これらの各手段は、C 2, includes a response sentence generation unit 23, each of these means, C
PU(中央演算装置)で実行されるプログラムによりその処理・機能が実現される。 The processing and functions are realized by a program executed by the PU (central processing unit). すなわち、該プログラムを記録した記録媒体、もしくは通信媒体から該プログラムを読み出してデータ処理装置2で実行することにより、 That is, by executing the data processing device 2 recording medium storing the program, or from the communications medium reads the program,
本発明を実施することができる。 Capable of implementing the present invention. 記憶装置3には、辞書31及び曖昧性解消情報記憶部32を備える。 The storage unit 3 comprises a dictionary 31 and disambiguation information storage unit 32.

【0054】以下は本発明を適用したシステムとして、 [0054] As following the application of the present invention system,
テレビとビデオの電源等の制御を行なう構成を例に説明する。 The configuration for controlling the power supply or the like of the TV and video will be described as an example. なお、記憶装置1の曖昧性解消情報記憶部32には、テレビ及びビデオの各機器の電源のオン・オフ状態が記憶管理されるものとする。 Incidentally, the ambiguity resolution information storage unit 32 of the storage device 1 is assumed to on-off state of the power supply of each device of the television and video are stored and managed.

【0055】ユーザが、テレビとビデオがある家の中で、テレビを操作するために、「電源つけて」と、入力装置1のマイクに向かって話したとする。 [0055] When the user, in the house where there is a TV and video, in order to operate the TV, and "put power", and spoke into the microphone of the input device 1.

【0056】入力装置1をなす音声認識システムは、 The speech recognition system which forms the input device 1,
「電源つけて」と音声認識して、テキスト文字に変換する。 And voice recognition as "put the power supply", converted to text characters.

【0057】このテキスト文字と、辞書記憶部31を参照して自然言語解析手段31は、「テレビの電源をつける」と「ビデオの電源をつける」という複数の解釈結果を出力する。 [0057] and this text character, dictionary storage unit 31 natural language analysis means 31 with reference to the outputs a plurality of interpretation result of "give the power to the TV" and "put the power of video."

【0058】曖昧性解消手段32は、曖昧性解消情報として、テレビ及びビデオの各機器の現在状態を見ると、 [0058] disambiguation means 32, as disambiguation information, looking at the current state of each device of television and video,
「テレビの電源はオフ」、「ビデオの電源はオン」であることから、「テレビの電源をつける」という解釈(タスク)に絞り込む。 "TV power is off", narrowed down that the "power of video on" is, in the interpretation of "put the power to the TV" (task).

【0059】また機器の現在状態から、曖昧性を解消することができたことから、確信度での最大〜最小の5段階評価のうち「確信度大」であるとする。 [0059] Also from the current state of the device, and from the fact that it was possible to eliminate the ambiguity, is a "confidence large" of the maximum-minimum out of 5 evaluation in confidence.

【0060】応答文生成手段23では、確信度大と「テレビの電源をつける」という解釈結果と辞書記憶部31 [0060] In response sentence generating means 23, interpretation and confidence large that "put the power to the TV" result and the dictionary storage unit 31
を参照して、「テレビの電源をつけます」という応答文を生成し、出力装置4をなす音声合成システムでスピーカに出力する。 See, it generates a response sentence "give the power to the TV", and outputs it to the speaker in the speech synthesis system, which forms the output device 4.

【0061】次に本発明の第2の実施例について図面を参照して詳細に説明する。 [0061] Next, a second embodiment of the present invention with reference to the accompanying drawings.

【0062】図3は、本発明の第2の実施例の構成を示す図である。 [0062] Figure 3 is a diagram showing a configuration of a second embodiment of the present invention. 図3において、図1と同等の要素には同一の参照符号が付されている。 3 are denoted by the same reference numerals, equivalent elements as in FIG. 1. 図3を参照すると、本発明の第2の実施例は、図1を参照して説明した前記第1の実施例に対して、タスク実行手段24がデータ処理装置2に追加されており、未実行タスクコマンド記憶部33 Referring to FIG. 3, a second embodiment of the present invention, with respect to the first embodiment described with reference to FIG. 1, and task execution means 24 is added to the data processing device 2, Not execution task command storage unit 33
が記憶装置3にさらに付加されて構成されている。 There has to be constituted by further adding to the storage device 3.

【0063】タスク実行手段24は、曖昧性解消手段2 [0063] The task execution means 24, disambiguation means 2
2で生成された解釈を、応答文生成手段23で実行すべきタスクであるか否かを判断し、実行すべきタスクであると判断された時に、タスクを実行する。 The generated resolved in 2, when it is determined whether the task should be executed in response sentence generation unit 23, it is determined that the task should be executed, to execute the task.

【0064】未実行タスクコマンド記憶部33は、応答文生成手段23で応答文を生成した中で、確信度が低く、応答文が質問型「〜しますか」などになったときに、そのタスクコマンドを記憶している。 [0064] unexecuted task command storage unit 33, in that generated the response sentence in response sentence generating means 23, confidence is low, when the response sentence has become such as question type "Do you want to ~", the It stores the task command.

【0065】図4は、本発明の第2の実施例の動作を説明するための流れ図である。 [0065] Figure 4 is a flow chart for explaining the operation of the second embodiment of the present invention. 図3及び図4を参照して、 Referring to FIGS. 3 and 4,
本発明の第2の実施例の動作について説明する。 A description will be given of the operation of the second embodiment of the present invention. 入力装置1で得た入力文字列は自然言語解析手段21に供給され(図4のステップ201)、自然言語解析手段21 Input character string obtained by the input device 1 is supplied to the natural language analysis unit 21 (step 201 in FIG. 4), the natural language analyzing means 21
は、辞書記憶部31に記憶されている語彙を参照して、 Refers to the vocabulary stored in the dictionary storage unit 31,
この入力文字列を解釈し、解釈可能な複数のタスクコマンドに変換し(図4のステップ202)、曖昧性解消手段22は、曖昧性解消情報記憶部32に記憶されている情報を参照して、タスクコマンドが複数存在している時に1つに絞り込み(図4のステップ203)、また、どのようにタスクコマンドを1つに絞ったかを用いてシステムが曖昧性を解消した結果の確信度を求める(図4のステップ204)。 Interprets the input string into a plurality of tasks commands that can be interpreted (step 202 in FIG. 4), disambiguation means 22 refers to the information stored in the ambiguity resolution information storage unit 32 , narrowing to one when the task commands there are a plurality (step 203 in FIG. 4), and how the confidence of the results systems using either focused task commands to one has disambiguation determining (step 204 in FIG. 4).

【0066】前記第1の実施例では、確信度の大きさにかかわらず、応答文生成手段23で応答文を生成し、出力装置4で出力していた。 [0066] In the first embodiment, regardless of the size of the confidence, it generates a response sentence in response sentence generation unit 23, and has output by the output device 4.

【0067】本発明の第2の実施例では、曖昧性解析手段22で求められた確信度に応じて、システムがタスクコマンドを実行してよいかどうか判断する(図4のステップ205)。 [0067] In a second embodiment of the present invention, depending on the confidence determined by the ambiguity analysis unit 22, the system determines whether or may perform the task command (step 205 of FIG. 4).

【0068】ステップ205で、確信度が低く、タスクコマンドを実行してはいけないと判断したときには、未実行タスクコマンド記憶部33に、タスクコマンドが記憶される(図4のステップ208)。 [0068] In step 205, confidence is low, when it is determined that do not perform the task command, the unexecuted task command storage unit 33, the task command is stored (step 208 in FIG. 4).

【0069】そして、タスクコマンドを実行してよいかどうかを表す「〜していいですか?」というような応答文を応答文生成手段23で生成する(図4のステップ2 [0069] and, to generate a response sentence such as "Are you sure you want to -?" Indicating whether or not may perform the task command in response sentence generating means 23 (step of FIG. 4 2
09)。 09).

【0070】該応答文に対する、ユーザからの返答入力を入力装置1を介してを得ると(ステップ201)、自然言語解析手段21は、入力の自然言語と未実行タスクコマンド記憶部33で記憶されている未実行タスクコマンドを参照して、解釈可能な複数のタスクコマンドに変換する(図4のステップ202)。 [0070] for the response sentence, upon obtaining via the input device 1 a response input from the user (step 201), the natural language analysis unit 21 is stored in a natural language input unexecuted task command storage unit 33 and with reference to the unexecuted task commands are, into a plurality of tasks commands that can be interpreted (step 202 in FIG. 4).

【0071】図4のステップ203では、複数のタスクコマンドの絞り込みを行ない、ステップ204では、絞り込まれたタスクコマンドの確信度を求め、確信度によりタスクコマンドを実行してよいかどうかを判断する。 [0071] At step 203 of FIG. 4, performs narrowing of a plurality of tasks command, step 204 determines the confidence of narrowed-down task command, determines whether may perform tasks command by confidence.

【0072】「〜していいですか?」のような応答に対して、図4のステップ204で求めた確信度が高いときには、入力が「はい」のような肯定を意味する入力か、 [0072] for the response, such as "Are you sure you want to ~?", When there is high confidence that was obtained in step 204 of FIG. 4, whether the input, which means a positive, such as the input is "Yes",
「いいえ」のような否定を意味する入力かどうかを判断する(図4のステップ206)。 To determine whether the input means a negative such as "No" (step 206 of FIG. 4).

【0073】ユーザから入力が、肯定を意味するものである時には、応答文生成手段23はタスク実行手段24 [0073] inputted from the user, when it is intended to mean a positive, response sentence generation unit 23 task executing unit 24
にタスクコマンドを送り、タスク実行手段24でタスクを実行する。 It sends a task command, to perform tasks in the task executing unit 24.

【0074】また応答文生成手段23は、タスクの実行完了を表す「〜しました。」のような応答文を生成する(図4のステップ207)。 [0074] The response sentence generation unit 23 generates the response sentence as a representative of the completion of execution of task "was ~." (Step 207 in FIG. 4).

【0075】また、否定を意味する入力の時には、タスクコマンドを破棄し、未実行タスクの取り消しを表す「〜を取り消します」のような応答文を生成する(図4 [0075] In addition, at the time of input, which means a negative, discard the task command, and generates a response sentence such as "Cancel the ~" representing the cancellation of unexecuted task (Fig. 4
のステップ210)。 Step 210) of.

【0076】本発明の第2の実施例について具体例に即して説明する。 [0076] will now be explained with reference to the specific example of the second embodiment of the present invention. 以下の例でも、前記第1の実施例と同様にテレビとビデオがある家の中での状況を想定して説明する。 In the following example will be described assuming the situation in the first embodiment similarly to house with a TV and video.

【0077】今、ユーザがテレビの電源をつけるために、「テレビ」とマイクに向かって話したとする。 [0077] Now, for the user to put the power of television, and spoke into the microphone and "TV".

【0078】入力装置1をなす音声認識システムは、 [0078] Voice recognition system constituting the input device 1,
「テレビ」と音声認識し、テキスト文字に変換する。 Voice recognition as "TV", converted to text characters.

【0079】このテキスト文字と辞書記憶部31とを参照して、自然言語解析手段21は、 ・「テレビの電源をつける」、 ・「テレビのチャンネルを1にする」、 ・「テレビのチャンネルを2にする」、… といった複数のタスクコマンドに変換する。 [0079] With reference to this text and the dictionary storage unit 31, natural language analysis means 21, "give the power to the TV" -, "the TV channel to 1" -, - "TV of the channel to 2 ", to convert ... such as the multiple tasks command.

【0080】曖昧性解消手段22は、曖昧性解消情報記憶部32からテレビの現在状況を見て、入力された「テレビ」に対するタスクとしては、「テレビの電源はオフ」から、「テレビの電源をつける」くらいの操作で大丈夫だろうと判断し、絞り込む。 [0080] Disambiguation unit 22 watches the current status of the television from the disambiguation information storage unit 32, as the tasks for the inputted "television", a "TV power off", "TV Power it is determined that it would be okay with the wear "much of the operation, refine. また確信度は前記確信度での最大〜最小の5段階評価で「確信度最小」と求めたとする。 Also confidence and was determined as "confidence Min" in out of the maximum-minimum in the confidence.

【0081】応答文生成手段23は、確信度最小と「テレビの電源をつける」というタスクコマンドと辞書記憶部31を参照して、「テレビをつけますか?」という応答文を生成し、出力装置4をなす音声合成システムのスピーカーに出力する。 [0081] The response sentence generating means 23 refers to the task command and the dictionary storage unit 31 that the confidence minimum "put the power to the TV", generates a response sentence "Do you turned on the TV?", Output and outputs to the speaker of the speech synthesis system forms a unit 4.

【0082】また「テレビの電源をつける」というタスクコマンドを未実行タスクコマンド記憶部33に記憶する。 [0082] Also stored in the unexecuted task command storage unit 33 the task command "give the power of television."

【0083】このシステムからの応答後に、ユーザが「はい」と入力すると、自然言語解析手段31は、辞書記憶部31を参照して、この発話が肯定を意味する語だと認識し、また未実行タスクコマンド記憶部33に、 [0083] After the response from this system, the user enters "Yes", natural language analysis means 31 refers to the dictionary storage unit 31, this speech is to recognize that it is a word which means a positive, also not yet the execution task command storage unit 33,
「テレビの電源をつける」というコマンドが記憶されているため、「テレビの電源をつける」というタスクコマンドを生成する。 Since the command "give the power to the TV" is stored, to generate a task command "give the power of television."

【0084】曖昧性解消手段22では、すでにタスクコマンドが一意に決まっているため、確信度を最大〜最小の5段階評価で、「確信度最大」とする。 [0084] In disambiguation means 22, already because the task commands are uniquely determined, with out of the maximum-minimum confidence, and "confidence up."

【0085】応答文生成手段23では、確信度最大と「テレビの電源をつける」というタスクコマンドと辞書記憶部31を参照して、「テレビの電源をつけました」 [0085] In response sentence generating means 23, with reference to the confidence maximum and "put the power of television," that the task command and the dictionary storage unit 31, "I put the power of television."
という応答文を生成し、音声合成システムでスピーカに出力する。 It generates a response sentence, and outputs to the speaker in the speech synthesis system.

【0086】次に本発明の第3の実施例について図面を参照して詳細に説明する。 [0086] Next, a third embodiment of the present invention with reference to the accompanying drawings.

【0087】図5は、本発明の第3の実施例の構成を示す図である。 [0087] Figure 5 is a diagram showing the configuration of a third embodiment of the present invention. 図5において、図3に示した要素と同等の要素には同一の参照符号が付されている。 5 are denoted by the same reference numerals, elements analogous to those shown in FIG.

【0088】図5を参照すると、本発明の第3の実施例は、データ処理装置2は、図3に示した前記第2の実施例と同様に、自然言語解析手段21、曖昧製解消手段2 [0088] Referring to FIG 5, a third embodiment of the present invention, the data processing unit 2, similarly to the second embodiment shown in FIG. 3, the natural language analyzing unit 21, fuzzy made eliminating means 2
2、応答文生成手段23、タスク実行手段24を備えている。 2, the response sentence generation unit 23, and a task execution unit 24. 記憶装置3は、辞書記憶部31、曖昧性解消情報記憶部32、キャンセルコマンド記憶部34を備えている。 Storage device 3, a dictionary storage unit 31, disambiguation information storage unit 32, and a cancel command storage unit 34.

【0089】キャンセルコマンド記憶部34には、ユーザの意図に反したタスクを実行してしまったときに、元に復旧するためのタスクコマンドが予め記憶されている。 [0089] The cancel command storage unit 34, when accidentally perform the tasks against the user's intention, the task command to restore the original are stored in advance.

【0090】図6は、本発明の第3の実施例の動作を説明するための流れ図である。 [0090] Figure 6 is a flow chart for explaining the operation of the third embodiment of the present invention. 図5及び図6を参照して、 Referring to FIGS. 5 and 6,
本発明の第3の実施例の動作について詳細に説明する。 Detailed description will be given of the operation of the third embodiment of the present invention.
なお、図6のステップ301〜304は、図2に示したステップ201〜204と同様とされる。 Note that steps 301 to 304 in FIG. 6 is the same as step 201 to 204 shown in FIG.

【0091】前記第1の実施例では、曖昧性解消手段2 [0091] In the first embodiment, disambiguation means 2
2で確信度が高く求められてしまうと、ユーザの意図に反したものでも、応答文生成部23で実行完了の応答文を生成して出力装置4に出力してしまう。 When confidence in 2 will sought high, and which was contrary to the intention of the user, thereby generates and outputs a response sentence execution completion in response sentence generation unit 23 to the output device 4.

【0092】本発明の第3の実施例においては、システムがタスク実行完了の応答文を応答文生成手段23で生成し、出力装置4に出力した時に、キャンセルや取り消しを意味する入力を受け付けると、図6のステップ30 [0092] In a third embodiment of the present invention, the system generates a response sentence task execution completion in response sentence generation unit 23, when the output device 4, when receiving an input denoting the cancel or revoke , step 30 in FIG. 6
1−304の一連の処理において、図4のステップ20 In a series of processes of 1-304, the steps of FIG. 4 20
1−204の前記第2の実施例の処理と同様に、タスクコマンドを1つに絞り込む。 Like the process of the second embodiment of 1-204, Filter task commands together. その際、キャンセルや取り消しを意味する入力を受け付けた時には、キャンセルコマンドが絞り込まれる。 At that time, when the input has been received, which means the cancellation or revocation, cancellation command are narrowed down.

【0093】絞り込まれたタスクコマンドがキャンセルコマンドであるか否か判定する(図6のステップ30 [0093] narrowed task command determines whether a cancel command (step 30 in FIG. 6
5)。 5).

【0094】キャンセルコマンドでなければ、前記第1 [0094] If it is not cancel command, said first
の実施例と同様に、確信度に応じて応答文生成部23で応答文を生成し、出力装置4に出力する(図6のステップ306)。 Of in the same manner as in Example, it generates a response sentence in response sentence generation unit 23 in accordance with the confidence, outputs to the output device 4 (step 306 in FIG. 6).

【0095】キャンセルコマンドである場合、キャンセルコマンド記憶部34を参照して応答文生成部23で応答文を生成し、出力装置4に出力する(図6のステップ307)。 [0095] When a cancel command, with reference to the cancel command storage unit 34 generates a response sentence in response sentence generation unit 23, and outputs to the output device 4 (step 307 in FIG. 6).

【0096】例えば、システムが「テレビをつけました」という応答文を返した時に、ユーザが、キャンセルや取り消しを意味する入力として、「違う」と答えた時に、システムは、「テレビを消しました」という応答文を生成する。 [0096] For example, when the system returns a response sentence "I put the TV", when the user, as an input, which means the cancellation or revocation, answered "No", the system, turn off the "TV to generate a response sentence that was ".

【0097】本発明の第3の実施例について具体例に即して説明する。 It will now be explained with reference to the specific example of the third embodiment of the [0097] present invention. 以下でも、前記第1の実施例と同様にテレビとビデオがある家の中での状況を想定する。 Even below similarly assume the situation in the house there is a TV and video in the first embodiment.

【0098】今、ユーザがテレビの電源をつけるために、「テレビをつけて」とマイクに向かって話したとする。 [0098] Now, the user in order to put the power of television, and spoke into the microphone and "with a TV."

【0099】入力装置1をなす音声認識システムは、あやまって「ビデオをつけて」と誤認識し、テキスト文字に変換する。 [0099] speech recognition system which forms the input device 1, apologized to erroneously recognized as "with a video", converted to text characters. このテキスト文字と辞書記憶部31を参照して自然言語解析手段21は、「ビデオの電源をつける」というタスクコマンドに変換する。 The text and the dictionary storage section 31 the natural language analyzing unit 21 with reference to convert that to the task command "put the power of the video."

【0100】曖昧性解消手段22では、すでにタスクコマンドが一意に決まっているので、「確信度最大」とする。 [0100] In disambiguation means 22, already since the task command is uniquely determined, and "confidence maximum".

【0101】応答文生成手段23は、「確信度最大」 [0101] response sentence generating means 23, "confidence maximum"
と、「ビデオの電源をつける」というタスクコマンドと辞書記憶部31を参照して、「ビデオの電源をつけました」という応答文を生成し、出力装置4をなす音声合成システムでスピーカに出力する。 If, by referring to the task commands and dictionary storage unit 31 as "put the power of video", generates a response sentence "I put the power of video", output to the speaker in the speech synthesis system which forms the output device 4 to.

【0102】また、キャンセルコマンド記憶部34に、 [0102] In addition, to cancel the command storage unit 34,
「ビデオの電源をつける」という操作の逆操作である「ビデオの電源を消す」というコマンドが記憶される。 Command that is the inverse operation of the operation called "put the power of video", "turn off the power of the video" is stored.

【0103】システムはユーザの意図とは異なる応答をしたために、マイクからユーザは「違う」と入力した場合、自然言語解析手段31は辞書記憶部31を参照してこの発話がキャンセルを意味する語だと認識し、またキャンセルコマンド記憶部34に「ビデオの電源を消す」 [0103] In order system is that a different response is the intention of the user, word user from the microphone, which means canceled this speech case, natural language analysis means 31 refers to the dictionary storage unit 31 you enter "different" It recognizes that it, also "turn off the power of video" to cancel the command storage unit 34
というタスクコマンドが記憶されていることを認識して、「ビデオの電源を消す」というタスクコマンドを生成する。 It recognizes that the task commands are stored that generates a task command "turn off the power of the video."

【0104】曖昧性解消手段22では、すでにタスクコマンドが一意に決まっているので、確信度最大とする。 [0104] In disambiguation means 22, already because the task command is uniquely determined, and confidence up.

【0105】応答文生成手段23では、「確信度最大」 [0105] In response sentence generating means 23, "confidence maximum"
と「ビデオの電源を消す」というタスクコマンドと辞書記憶部31を参照して、「ビデオの電源を消しました」 And by referring to the task command and the dictionary storage unit 31 that "turn off the power of video", "I turn off the power of video."
という応答文を生成し、該応答文を出力装置4をなす音声合成システムよりスピーカに出力する。 It generates a response sentence is output to the speaker from the speech synthesis system which forms the output device 4 to the response sentence.

【0106】次に本発明の第4の実施例について説明する。 [0106] Next explained is the fourth embodiment of the present invention. 図7は、本発明の第4の実施例の構成を示す図である。 Figure 7 is a diagram showing a configuration of a fourth embodiment of the present invention. 図7を参照すると、本発明の第4の実施例は、図3 Referring to FIG 7, a fourth embodiment of the present invention, FIG. 3
に示した前記第2の実施例に、時間管理部35を記憶装置3に備えたものである。 The second embodiment shown in, those having a time management unit 35 in the storage device 3.

【0107】図8は、本発明の第4の実施例の動作を説明するための流れ図である。 [0107] Figure 8 is a flow chart for explaining the operation of the fourth embodiment of the present invention. 図7及び図8を参照して、 Referring to FIGS. 7 and 8,
本発明の第4の実施例の動作について説明する。 A description will be given of the operation of the fourth embodiment of the present invention.

【0108】図8のステップ402−405、ステップ408−409は、その流れ図を図4に示した前記第2 [0108] Step 402-405 in FIG. 8, step 408-409, the second showing the flow chart in FIG. 4
の実施例における202−205、ステップ208−2 202-205 in the embodiment, the step 208-2
09と同一とされ、また、図8のステップ406、40 Is 09 and the same, also, the steps of FIG. 8 406,40
7、410は、前記第2の実施例におけるステップ20 7,410, the step 20 in the second embodiment
6、207、210と同一の処理とされている。 It is the same processing and 6,207,210. 前記第2の実施例と同様な手順で、図8のステップ409まで処理が終わったとする。 In the second embodiment a similar procedure, the process is finished up to the step 409 in FIG. 8. 前記第2の実施例では、図4に示すように、ステップ209で応答文を生成して、入力装置1でユーザからの返答入力を待ち、返答が入力されたときにステップ201からの処理を行っている。 In the second embodiment, as shown in FIG. 4, and generates a response sentence in step 209, waits for a reply input from the user input device 1, the processing from step 201 when the response is input Is going.

【0109】本発明の第4の実施例では、システムがユーザの入力を待つような応答をしたときに、時間管理部35に現在時刻を設定し、入力装置1では、不図示のタイマ(計時手段)により予め定められた一定時間だけ待つことにする(図8のステップ401)。 [0109] In a fourth embodiment of the present invention, when the system response, such as waiting for user input, and sets the current time to the time management unit 35, the input device 1, not shown timer (time measurement to wait for a certain time determined in advance by means) (step 401 in FIG. 8).

【0110】一定時間内に、すなわち、タイマでのタイムアウト発生前に、応答文に対するユーザからの入力があれば、以下の処理を前記第2の実施例と同様に行う(図8のステップ402以降)。 [0110] within a certain time period, i.e., before the timeout occurs in the timer, if there is an input from the user to the response sentence, the following process is performed as in the second embodiment (step 402 onward in FIG 8 ).

【0111】一定時間の間にユーザからの入力がなければ、すんわち、タイマでのタイムアウトが発生した際には、ユーザは、応答の内を了解したものとして、入力装置1にユーザが肯定を意味する入力を行なったものとみなす。 [0111] If there is no input from the user for a certain time, Sunwachi, when the timeout timer has occurred, the user, as has been accepted among the response, the user is positive in the input device 1 It shall be deemed to have made a means input.

【0112】ステップ409で生成された「〜していいですか?」のような応答に対して、図8のステップ40 [0112] On the other responses, such as generated in step 409, "Are you sure you want to ~?", Step 40 of FIG. 8
4で求めた確信度が高いときには、入力が「はい」のような肯定を意味する入力か、「いいえ」のような否定を意味する入力かどうかを判断する(図8のステップ40 In the case high confidence obtained is 4, if the input, which means a positive, such as the input is "yes", it is determined whether the input means negative like "No" (step 40 in FIG. 8
6)。 6).

【0113】ユーザから入力が、肯定を意味するものである時には、応答文生成手段23はタスク実行手段24 [0113] inputted from the user, when it is intended to mean a positive, response sentence generation unit 23 task executing unit 24
にタスクコマンドを送り、タスク実行手段24でタスクを実行する。 It sends a task command, to perform tasks in the task executing unit 24.

【0114】また応答文生成手段23は、タスクの実行完了を表す「〜しました。」のような応答文を生成する(図8のステップ407)。 [0114] The response sentence generation unit 23 generates the response sentence as a representative of the completion of execution of task "was ~." (Step 407 in FIG. 8).

【0115】また、否定を意味する入力の時には、タスクコマンドを破棄し、未実行タスクの取り消しを表す「〜を取り消します」のような応答文を生成する(図8 [0115] In addition, at the time of input, which means a negative, discard the task command, and generates a response sentence such as "Cancel the ~" representing the cancellation of unexecuted task (Figure 8
のステップ410)。 Step 410).

【0116】本発明の第4の実施例について具体例に即して以下に説明する。 [0116] will be described below with reference to the specific example of the fourth embodiment of the present invention. 以下でも、前記第2の実施例と同様にテレビとビデオがある家の中での状況を想定して説明する。 Even below similarly described by assuming the situation in the house there is a TV and video and the second embodiment.

【0117】今、ユーザがテレビの電源をつけた後に、 [0117] Now, after the user has put the power of the TV,
テレビのチャンネルを1にするために「1チャンネルにして」とマイクに向かって話したものとする。 The channel of the TV in order to 1 "in the one-channel" and that talk into the microphone. 音声認識システムは「1チャンネルにして」と認識し、テキスト文字に変換する。 Voice recognition system recognizes that "in the one-channel", converted to text characters.

【0118】このテキスト文字と辞書を参照して自然言語解析手段31は、「テレビのチャンネルを1にする」、「ビデオのチャンネルを1にする」という複数のタスクコマンドに変換する。 [0118] natural language analysis means 31 by referring to the text characters and the dictionary, "to the channel of the TV to 1", is converted into a plurality of tasks command of "the channel of the video to 1".

【0119】曖昧性解消手段22では、文脈を用いて「テレビの電源をつける」を実行した後であることから、「テレビのチャンネルを1にする」であるものと判断する。 [0119] In disambiguation means 22, since using a context is after performing the "add a source of television", determines that it is "to 1 TV channels." また、文脈を用いて曖昧性を解消したので、確信度を中とする。 Further, since the disambiguation using context to a middle of confidence.

【0120】応答文生成手段23では確信度中と「テレビのチャンネルを1にする」というタスクコマンドと辞書記憶部31を参照して、「テレビのチャンネルを1にしますね」という応答文を生成し、出力装置4をなす音声合成システムでスピーカに出力する。 [0120] Referring to the response sentence generating means confidence in the 23 and the task command and the dictionary storage unit 31 that "channels to 1 of television", generates a response sentence "I will the channel of the TV to 1" , and outputs to the speaker in the speech synthesis system which forms the output device 4.

【0121】また、未実行タスクコマンド記憶部33に「テレビのチャンネルを1にする」というタスクコマンドを記憶する。 [0121] In addition, the unexecuted task command storage unit 33 that "to 1 the channel of the television" to store the task command.

【0122】またスピーカで応答文を出力するのと同時に、時間管理部35に、現在時刻を記憶させる。 [0122] At the same time as outputting the response sentence by a speaker, the time management unit 35, and stores the current time.

【0123】出力装置4をなすスピーカからの応答文を出力した後、ユーザから一定時間入力がないときには、 [0123] After outputting the response sentence from the speaker that forms the output unit 4, when there is no input for a period from the user,
入力装置1から肯定を表す語が入力されたものとして、 As the word representing the positive from the input device 1 it has been input,
前記第2の実施例と同様な処理を行い、応答文生成手段23において、「テレビのチャンネル1を1にしました」という応答文を生成し、該応答文を、出力装置4をなす音声合成システムよりスピーカに出力する。 The second embodiment and performs the same processing, the response sentence generation unit 23, generates a response sentence "has the channel 1 of the TV 1", the speech synthesis of the response sentence forms the output device 4 and outputs it to the speaker from the system.

【0124】 [0124]

【発明の効果】以上説明したように、本発明によれば下記記載の効果を奏する。 As described above, according to the present invention, the following effects described according to the present invention.

【0125】本発明の第1の効果は、にユーザはその応答に必ずしも返答する必要がなくなるので、ユーザにかかる負荷を削減する、ということである。 [0125] The first effect of the present invention, since the user needs to always respond to the response is eliminated, reducing the load on the user, is that.

【0126】その理由は次の通りである。 [0126] The reason is as follows. 本発明においては、システムが求めた確信度を用いて応答文を変化させることで、システムは必ずしも確認を求める応答文を出力するわけではない。 In the present invention, by changing the response sentence by using the confidence the system has determined, the system does not necessarily output a response sentence asking for confirmation. このため、ユーザはシステムからの応答に必ずしも返答する必要がないためである。 Therefore, the user is not required to be necessarily respond to the response from the system.

【0127】本発明の第2の効果は、システムが操作を行う前に、ユーザとシステムとの対話により曖昧性を解消することを可能とし、システムがユーザの本来の意図とは異なった解釈をする可能性を低減し、その結果、ユーザは修正取り消し作業を行う可能性を特段に低減している、ということである。 [0127] The second effect of the present invention, before the system performs an operation, it possible to eliminate the ambiguity by user interaction with the system, the interpretation system is different from the original intent of the user the possibility of reducing, as a result, the user is to reduce the possibility of performing a correction cancellation work otherwise, is that.

【0128】その理由は、本発明においては、システムが求めた確信度が低いときには、システムは、システムで解釈したタスクを実行してよいかどうかをユーザに質問する構成とされているためである。 [0128] The reason for this is that in the present invention, when low confidence the system has determined the system is in because it is configured to query whether may perform the task of interpreting the system to the user .

【0129】本発明の第3の効果は、システムがユーザの意図と異なった解釈をしてしまう場合でも、修正取り消し可能とし、ユーザにかかる負荷を削減する、ということである。 [0129] A third effect of the present invention, even if the system ends up different interpretations intended users, and modifiable cancellation, to reduce the load on the user, is that.

【0130】本発明の第4の効果は、システムがユーザに質問をしたときに、ユーザから一定時間応答がないとシステムに肯定を表す語が入力されたときと同様な処理がおこなわれ、このため、ユーザはシステムの確認を表す応答に必ずしも答える必要がないので、ユーザの負荷を削減する、ということである。 [0130] The fourth effect of the present invention, when the system a question to the user, the same processing as when a word representing a positive system that there is no fixed time response from the user inputs is performed, this Therefore, since the user need not necessarily respond to the response indicating the confirmation of the system, reducing the load on the user, is that.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】本発明の第1の実施例の構成を示す図である。 1 is a diagram showing a configuration of a first embodiment of the present invention.

【図2】本発明の第1の実施例の動作を説明するための流れ図である。 Figure 2 is a flow chart for explaining the operation of the first embodiment of the present invention.

【図3】本発明の第2の実施例の構成を示すブロック図である。 3 is a block diagram showing a configuration of a second embodiment of the present invention.

【図4】本発明の第2の実施例の動作を説明するための流れ図である。 4 is a flow chart for explaining the operation of the second embodiment of the present invention.

【図5】本発明の第3の実施例の構成を示す図である。 5 is a diagram showing the configuration of a third embodiment of the present invention.

【図6】本発明の第3の実施例の動作を説明するための流れ図である。 6 is a flow chart for explaining the operation of the third embodiment of the present invention.

【図7】本発明の第4の実施例の構成を示す図である。 7 is a diagram showing a configuration of a fourth embodiment of the present invention.

【図8】本発明の第4の実施例の動作を説明するための流れ図である。 8 is a flow chart for explaining the operation of the fourth embodiment of the present invention.

【符号の説明】 DESCRIPTION OF SYMBOLS

1 入力装置 2 データ処理装置 3 記憶装置 4 出力装置 21 自然言語解析手段 22 曖昧性解消手段 23 応答文生成手段 24 タスク実行手段 31 辞書記憶部 32 曖昧性解消情報記憶部 33 未実行タスクコマンド記憶部 34 キャンセルコマンド記憶部 35 時間管理部 1 input device 2 data processing device 3 storage 4 output device 21 natural language analysis unit 22 disambiguation means 23 answering sentence generating means 24 task executing unit 31 dictionary storage unit 32 disambiguation information storage unit 33 unexecuted task command storage unit 34 Cancel command storage unit 35 hours management unit

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl. 7識別記号 FI テーマコート゛(参考) G10L 3/00 537Z 561C Fターム(参考) 5B091 AA15 CA12 CA14 CB12 CD03 DA09 5D015 AA05 HH23 KK02 KK04 LL04 LL05 5D045 AB01 ────────────────────────────────────────────────── ─── of the front page continued (51) Int.Cl. 7 identification mark FI theme Court Bu (reference) G10L 3/00 537Z 561C F-term (reference) 5B091 AA15 CA12 CA14 CB12 CD03 DA09 5D015 AA05 HH23 KK02 KK04 LL04 LL05 5D045 AB01

Claims (19)

    【特許請求の範囲】 [The claims]
  1. 【請求項1】入力された自然言語を解釈するために必要な語彙と、該自然言語の解釈結果から応答文を生成するために必要な語彙とを予め記憶する辞書記憶部と、 前記辞書記憶部を参照して、入力手段から入力された自然言語の解釈を行う自然言語解析手段と、 前記自然言語解析手段で求められた解釈結果が複数存在した場合、1つの解釈結果に絞り込むための手がかりとして用いられる情報を記憶する曖昧性解消情報記憶部と、 前記自然言語解析手段で求められた解釈結果が複数存在した場合に、前記曖昧性解消情報記憶部を参照して、前記複数の解釈結果を1つに絞り込むとともに、前記1つに絞り込んだ解釈結果に対する確信度を求める曖昧性解消手段と、 前記曖昧性解消手段で絞り込んだ解釈結果を応答文として出力し、その際、 [Claim 1] and vocabulary needed to interpret the input natural language, a dictionary storage unit for previously storing a vocabulary required to produce a response sentence from the interpretation result of the natural language, the dictionary storage part see, if the natural language analysis means for performing the interpretation of natural language input from the input means, the interpretation obtained by the natural language analysis unit results there are a plurality, clues to narrow down to one interpretation result a disambiguation information storage unit for storing information to be used as, in the case where the natural language analysis interpretation result obtained by the means there are a plurality, with reference to the disambiguation information storage unit, the plurality of interpretation results with Filter into one, and outputs the disambiguation means for determining the confidence for narrowing down the interpretation result to the one, the interpretation results narrowed down by the disambiguation means in response sentence, in which, 前記曖昧性解消手段で求められた前記確信度に応じて応答文を変更させる応答文生成手段と、 を備えたことを特徴とする自然言語を用いた対話システム。 Dialogue system using a natural language, characterized by comprising: a response sentence generation means for changing the response sentence according to the confidence determined by the disambiguation means.
  2. 【請求項2】前記曖昧性解消手段で求められた解釈を受けて、該解釈に対応するタスクコマンドを実行するタスク実行手段をさらに備えたことを特徴とする請求項1に記載の自然言語を用いた対話システム。 Wherein receiving the interpretation obtained by the disambiguation means, natural language according to claim 1, further comprising a task execution means for executing a task command corresponding to the interpretation interactive system using.
  3. 【請求項3】前記応答文生成手段が、前記曖昧性解消手段で求められた確信度に応じて、前記タスク実行手段でタスクを実行した後にタスクの実行を報告する応答文を生成するか、もしくは、前記タスク実行手段でタスクを実行する前にタスクを実行してとよいか否かを確認するための応答文を生成するか、を決定する、ことを特徴とする請求項2に記載の自然言語を用いた対話システム。 Wherein said answering sentence generating means, in response to said confidence obtained by the disambiguation means, or generates a response sentence for reporting the execution of the task after performing the task in the task execution means, or, according to claim 2, wherein the task before executing the task execution means or generates a response sentence for confirming whether or not good and performing a task, to determine, that interactive system using a natural language.
  4. 【請求項4】前記応答文生成手段が、前記曖昧性解消手段で求められた確信度に応じて、応答文を生成するかしないかを決定する、ことを特徴とする請求項2又は3に記載の自然言語を用いた対話システム。 Wherein said answering sentence generating means, in response to said obtained confidence determined by the disambiguation means, for determining whether or not to generate a response sentence, it in claim 2 or 3, characterized in interactive system using a natural language description.
  5. 【請求項5】前記応答文生成手段が、前記曖昧性解消手段で求められた確信度に応じて、前記曖昧性解消手段が解釈した結果を、報告、確認、及び質問のうちのいずれかを表す応答文に変更する、ことを特徴とする請求項2、3、4のいずれか一に記載の自然言語を用いた対話システム。 Wherein said answering sentence generating means, in response to said confidence obtained by the disambiguation means, a result of the ambiguity eliminating means is interpreted, reported, confirmed, and any of the question dialogue system using natural language according to any one of claims 2, 3, 4 to change the response sentence, it is characterized to represent.
  6. 【請求項6】実行を行ったタスクコマンドに対する逆操作のタスクコマンドを記憶するキャンセルコマンド記憶部と、 キャンセルの意味を表す入力がなされたときに、前記タスク実行手段でキャンセルコマンドを実行するとともに、前記応答文生成手段において、キャンセルコマンドを実行したことを報告する応答文を生成する、ことを特徴とする請求項2、3、4、5のいずれか一に記載の自然言語を用いた対話システム。 And cancellation command storage unit that stores the task commands the reverse operation to 6. The task command was executed, when the input is made to represent the meaning of cancellation, and executes a cancel command in the task execution means, in the response sentence generation unit, conversation system using a natural language according to any one of claims 2, 3, 4, 5 for generating an answering sentence reports that executes a cancel command, it is characterized by .
  7. 【請求項7】システムがタスクコマンドを実行してようかどうかの確認をとる応答文を出力した後、時間の経過を測定する時間管理手段を備え、 前記時間管理手段で計時を開始後、あらかじめ定められた所定の時間が経過しても、ユーザからの応答がない場合には、肯定を表す入力が前記入力手段から入力されたものと解釈する、ことを特徴とする請求項2乃至6のいずれか一に記載の自然言語を用いた対話システム。 7. After the system outputs a response sentence to take to confirm whether no matter running task command, includes a time management means for measuring the elapsed time after the start of counting by said time management means, in advance even after a predetermined time determined, if there is no response from the user is interpreted as input representing the affirmative is inputted from said input means, according to claim 2 to 6, characterized in that interactive system using the natural language of according to any one.
  8. 【請求項8】前記時間管理手段で計時を開始後、前記所定の時間が経過した後に、肯定を表す入力が前記入力手段から入力されたか否かを、前記曖昧性解消手段で求めた確信度に応じて決定する、ことを特徴とする請求項7 8. After starting the counting by said time management means after the predetermined time has elapsed, whether the input representing the positive is inputted from said input means, confidence obtained by the disambiguation means determined according to, characterized in that claim 7
    に記載の自然言語を用いた対話システム。 Interactive system using a natural language according to.
  9. 【請求項9】入力手段から入力された自然言語を受け取り、語彙辞書を参照して1又は複数のタスクコマンドに変換する自然言語解析手段と、 曖昧性解消情報を参照して、複数のタスクコマンドを1 9. receive natural language input from the input means, and natural language analysis means for converting the one or more tasks command with reference to the lexical dictionary, with reference to the disambiguation information, a plurality of tasks Command 1
    つに絞り込むとともに、絞り込みの仕方から、確信度を求める曖昧性解消手段と、 絞り込んだタスクコマンドと求められた確信度と語彙辞書とを参照して、前記確信度に応じた応答文を生成し、 One with narrowed down, the way of narrowing, with reference and disambiguation means for determining a confidence factor, the confidence factor and the lexicon obtained a narrowed task command, it generates a response sentence according to the certainty factor ,
    出力手段に出力する応答文生成手段と、を備えたことを特徴とする自然言語対話処理装置。 Natural language dialog processing system being characterized in that and a response sentence generation means for outputting to the output unit.
  10. 【請求項10】入力手段から入力された自然言語を語彙辞書を参照して解釈し、解釈結果として該自然言語に対応した1又は複数のタスクコマンドを候補として出力する自然言語解析手段と、 前記自然言語解析手段で求められたタスクコマンドが複数存在した場合、該解釈された自然言語の文脈情報、タスクの履歴情報、該タスク候補の処理対象物の状況情報のいずれかの情報を含む、曖昧性を解消するための所定の情報に基づき、1つのタスクコマンドに絞り込むとともに、前記1つに絞り込んだタスクコマンドに対する確信度を求める曖昧性解消手段と、 前記曖昧性解消手段で求められたタスクコマンド及び前記確信度に応じて応答文を自動作成して出力手段から出力する応答文生成手段と、 前記タスクコマンドを実行するタスク実行 10. interpreted with reference to the vocabulary dictionary natural language input from the input means, and natural language analysis means for outputting one or more tasks command corresponding to the natural language as a candidate as a result of interpretation, the If the task command obtained by the natural language analysis means there exist a plurality, including contextual information of the interpreting natural language, the history information of the task, any information of status information of the processing object of the task candidates, ambiguous based on predetermined information for eliminating the sex, along with narrow down to a single task commands, and disambiguation means for determining the confidence for narrowing down task command to the one task command obtained by the disambiguation means and the response sentence generation means for outputting from the output means automatically creates a response sentence according to the confidence factor, perform the task of executing the task command 段とを備えたことを特徴とする自然言語対話処理装置。 Natural language dialog processing apparatus characterized by comprising a stage.
  11. 【請求項11】前記一つの絞り込まれたタスクコマンドの確信度が小の場合、該タスクコマンドを直ちに実行せずに一旦未実行コマンド記憶手段に記憶しておき、前記応答文生成手段が、前記タスクコマンドを実行してよいか否かを確認するための応答文を生成して前記出力手段に出力し、 該応答文に対してユーザが肯定を意味する入力を前記入力手段から行なった場合、前記未実行コマンド記憶手段からタスクコマンドを取り出して前記タスク実行手段で前記タスクコマンドを実行し、前記応答文生成手段ではタスク実行完了の応答文を出力し、一方、否定を意味する入力が前記入力手段から行われた場合、前記応答文生成手段では未実行タスク取り消しの応答文を作成して出力する、ことを特徴とする請求項10記載の自然言語対話処理 11. If confidence of the one of focused task command is small, is stored immediately once unexecuted command storage means without performing the task command, said response sentence generation unit, wherein generates a response sentence for confirming whether or executing a task command output to the output means, if the user performs from said input means inputs to mean positive with respect to the response sentence, wherein executing the task command from unexecuted command storage means by said task execution means retrieves a task command, wherein in the response sentence generation means outputs a response sentence task execution completion, whereas, the input is input to mean negative If done from the means, the outputs creates a response sentence unexecuted task cancellation in response sentence generation unit, the natural language dialog processing according to claim 10, wherein the 装置。 apparatus.
  12. 【請求項12】前記タスク実行手段で実行したたタスクコマンドの操作をキャンセルするキャンセルコマンドを記憶するキャンセルコマンド記憶手段をさらに備え、 タスクコマンド実行後該タスクのキャンセルの意味を表す入力が前記入力手段から行われたときに、前記キャンセルコマンド記憶手段から前記キャンセルコマンドを読み出して前記タスク実行手段で前記キャンセルコマンドを実行するとともに、前記応答文生成手段において、前記キャンセルコマンドを実行したことを報告する応答文を生成出力する、ことを特徴とする請求項10又は11 12. The method of claim 11, wherein the task execution means further includes a cancel command storage means for storing a cancel command to cancel the operation of the executed task command, input said input means for representing the meaning of cancellation of a task command after executing the task when made from, and executes the cancel command in the task executing unit reads the cancel command from the cancel command storing means, in the response sentence generation unit, reports that it has performed the cancel command response claim to generate outputs a sentence, it is characterized by 10 or 11
    記載の自然言語対話処理装置。 Natural language dialog processing system described.
  13. 【請求項13】前記応答文生成手段が、前記タスクコマンドを実行してよいか否かを確認するための応答文を生成して出力した後、時間の経過を測定する時間管理手段を備え、 前記時間管理手段で計時を開始後、あらかじめ定められた所定の時間が経過しても、ユーザからの応答がない場合には、肯定を表す入力が前記入力手段に入力されたものと解釈する、ことを特徴とする請求項11記載の自然言語対話処理装置。 Wherein said answering sentence generating means, after generating and outputting a response sentence for confirming whether may perform the task command, it includes a time management means for measuring the passage of time, after starting the counting by said time management means, even after a predetermined time determined in advance, if there is no response from the user is interpreted as input representing the affirmative is inputted to the input means, natural language dialog processing system according to claim 11, wherein a.
  14. 【請求項14】前記入力手段が入力された音声を認識してテキストに変換出力する音声認識手段よりなり、前記出力手段が、前記応答文生成手段で作成された前記応答文のテキスト情報を入力し音声合成して音声出力手段から出力する音声合成手段よりなる、ことを特徴とする請求項10乃至13のいずれか一に記載の自然言語対話処理装置。 14. consisted speech recognition means for converting the output to recognize the speech input means is input to the text, said output unit, inputting text information of the response sentence created by the response sentence generation unit natural language dialog processing apparatus according to any one of claims 10 to 13 consisting of the speech synthesis means for outputting the audio output means by speech synthesis, characterized in that to.
  15. 【請求項15】請求項14記載の自然言語対話処理装置において、 一又は複数の機器の所定の操作を、前記所定の操作を指示するユーザからの音声入力により行なうことを特徴とする自然言語対話処理装置。 15. A natural language dialog processing system according to claim 14, wherein one or more predetermined operations of the apparatus, natural language dialogue and performing a voice input from a user to instruct the predetermined operation processing apparatus.
  16. 【請求項16】(a)入力手段から入力された自然言語について語彙辞書記憶部を参照して解釈を行う自然言語解析処理と、 (b)前記自然言語解析処理で求められた解釈結果が複数存在した時に、複数の解釈結果を1つの解釈結果に絞り込むための手がかりとして用いられる情報を記憶する曖昧性解消情報記憶部を参照して、前記複数の解釈結果を1つに絞り込むとともに、前記1つに絞り込んだ解釈結果に対する確信度を求める曖昧性解消処理と、 (c)前記曖昧性解消処理で絞り込んだ解釈結果を語彙辞書記憶部を参照して応答文として自動生成し出力手段から出力し、その際、前記曖昧性解消手段で求められた前記確信度に応じて応答文を変化させる応答文生成処理と、 の前記(a)乃至(c)の処理をコンピュータで実行させる 16. A (a) natural language performed with reference to interpret vocabulary dictionary storing unit for input natural language from the input means analysis, interpretation results obtained by (b) the natural language analysis processing multiple when present the, with reference to disambiguation information storage unit for storing information to be used as a cue for narrowing down a plurality of interpretation results in one interpretation result, narrow down the plurality of interpretation results into one, the 1 a disambiguation process of obtaining the confidence for interpretation results narrowed down to One, output from the (c) the automatic generation was narrowed down in disambiguation process interpretation results as a reference to the response sentence vocabulary dictionary storing unit output means , where the executing and the response sentence generation processing of changing a response sentence according to the confidence obtained, the processing of (a) to (c) in computer disambiguation means めのプログラムを記録した記録媒体。 Recording medium recording the eye of the program.
  17. 【請求項17】請求項16記載の記録媒体において、 (d)前記曖昧性解消処理(b)で求められた解釈を受けて、該解釈に対応するタスクコマンドを実行する処理、 を前記コンピュータで実行させるためのプログラムを記録した記録媒体。 17. The recording medium of claim 16, wherein, in response to the interpretation obtained by; (d) disambiguation process (b), the process for executing the task command corresponding to the interpretation in the computer a recording medium recording a program for executing.
  18. 【請求項18】請求項17記載の記録媒体において、 前記応答文生成処理(c)が、前記曖昧性解消処理(b)で求められた確信度に応じて、タスクを実行した後にタスクの実行を報告する応答文を生成するか、もしくは、タスクを実行する前にタスクを実行してとよいか否かを確認するための応答文を生成するかを決定する処理を含み、前記処理を前記コンピュータで実行させるためのプログラムを記録した記録媒体。 18. The recording medium of claim 17, wherein the response sentence generation process (c) is, in response to said confidence obtained by the disambiguation process (b), execution of the task after performing the task or generates a response sentence to report, or comprises a process of determining whether to generate a response sentence for confirming whether or not good and performing a task before executing the task, the said process a recording medium recording a program for executing on a computer.
  19. 【請求項19】請求項17記載の記録媒体において、 実行を行ったタスクコマンドに対する逆操作のタスクコマンドを記憶するキャンセルコマンド記憶部を備え、 (f)キャンセルの意味を表す入力が前記入力手段から行われたときに、キャンセルコマンドを実行するとともに、前記応答文生成処理(c)において、キャンセルコマンドを実行したことを報告する応答文を生成する処理を、前記コンピュータで実行させるためのプログラムを記録した記録媒体。 19. The recording medium of claim 17, a cancel command storage unit that stores the inverse operation of the task commands to the task command was executed, the input is the input means for representing the meaning of (f) cancel when made, and executes the cancel command, the recording in the response sentence generation process (c), a process for generating an answering sentence reports that executes the cancel command, a program for executing in the computer the recording medium.
JP20253899A 1999-07-16 1999-07-16 Interactive system using the natural language Expired - Fee Related JP3662780B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20253899A JP3662780B2 (en) 1999-07-16 1999-07-16 Interactive system using the natural language

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20253899A JP3662780B2 (en) 1999-07-16 1999-07-16 Interactive system using the natural language

Publications (2)

Publication Number Publication Date
JP2001034289A true JP2001034289A (en) 2001-02-09
JP3662780B2 JP3662780B2 (en) 2005-06-22

Family

ID=16459171

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20253899A Expired - Fee Related JP3662780B2 (en) 1999-07-16 1999-07-16 Interactive system using the natural language

Country Status (1)

Country Link
JP (1) JP3662780B2 (en)

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0520982A (en) * 1991-07-16 1993-01-29 Aichi Denki Seisakusho:Kk Vacuum selector circuit breaker
JP2002304192A (en) * 2001-04-05 2002-10-18 Denso Corp Voice recognition device
JP2005300989A (en) * 2004-04-13 2005-10-27 Mitsubishi Electric Corp Speech recognition system
JP2006146182A (en) * 2004-11-16 2006-06-08 Microsoft Corp Centralized method and system for clarifying voice command
JP2009036999A (en) * 2007-08-01 2009-02-19 Gengo Rikai Kenkyusho:Kk Interactive method using computer, interactive system, computer program and computer-readable storage medium
US7516077B2 (en) 2002-07-25 2009-04-07 Denso Corporation Voice control system
WO2013190956A1 (en) * 2012-06-19 2013-12-27 株式会社エヌ・ティ・ティ・ドコモ Function execution instruction system, function execution instruction method, and function execution instruction program
JP2015018265A (en) * 2011-09-28 2015-01-29 アップル インコーポレイテッド Speech recognition repair using contextual information
US9548050B2 (en) 2010-01-18 2017-01-17 Apple Inc. Intelligent automated assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US9620104B2 (en) 2013-06-07 2017-04-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9626955B2 (en) 2008-04-05 2017-04-18 Apple Inc. Intelligent text-to-speech conversion
US9632650B2 (en) 2006-03-10 2017-04-25 Microsoft Technology Licensing, Llc Command searching enhancements
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US9646614B2 (en) 2000-03-16 2017-05-09 Apple Inc. Fast, language-independent method for user authentication by voice
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
WO2017145373A1 (en) * 2016-02-26 2017-08-31 三菱電機株式会社 Speech recognition device
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US9966068B2 (en) 2013-06-08 2018-05-08 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10102359B2 (en) 2011-03-21 2018-10-16 Apple Inc. Device access using voice authentication
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US10185542B2 (en) 2013-06-09 2019-01-22 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10269345B2 (en) 2016-09-19 2019-04-23 Apple Inc. Intelligent task discovery

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0520982A (en) * 1991-07-16 1993-01-29 Aichi Denki Seisakusho:Kk Vacuum selector circuit breaker
US9646614B2 (en) 2000-03-16 2017-05-09 Apple Inc. Fast, language-independent method for user authentication by voice
JP4724943B2 (en) * 2001-04-05 2011-07-13 株式会社デンソー Voice recognition device
JP2002304192A (en) * 2001-04-05 2002-10-18 Denso Corp Voice recognition device
US7516077B2 (en) 2002-07-25 2009-04-07 Denso Corporation Voice control system
JP2005300989A (en) * 2004-04-13 2005-10-27 Mitsubishi Electric Corp Speech recognition system
US9972317B2 (en) 2004-11-16 2018-05-15 Microsoft Technology Licensing, Llc Centralized method and system for clarifying voice commands
US8942985B2 (en) 2004-11-16 2015-01-27 Microsoft Corporation Centralized method and system for clarifying voice commands
JP2006146182A (en) * 2004-11-16 2006-06-08 Microsoft Corp Centralized method and system for clarifying voice command
US9632650B2 (en) 2006-03-10 2017-04-25 Microsoft Technology Licensing, Llc Command searching enhancements
JP2009036999A (en) * 2007-08-01 2009-02-19 Gengo Rikai Kenkyusho:Kk Interactive method using computer, interactive system, computer program and computer-readable storage medium
US9626955B2 (en) 2008-04-05 2017-04-18 Apple Inc. Intelligent text-to-speech conversion
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US9548050B2 (en) 2010-01-18 2017-01-17 Apple Inc. Intelligent automated assistant
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US10102359B2 (en) 2011-03-21 2018-10-16 Apple Inc. Device access using voice authentication
JP2015018265A (en) * 2011-09-28 2015-01-29 アップル インコーポレイテッド Speech recognition repair using contextual information
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
JPWO2013190956A1 (en) * 2012-06-19 2016-05-26 株式会社Nttドコモ Function execution instruction system function execution instruction method and function execution instruction program
WO2013190956A1 (en) * 2012-06-19 2013-12-27 株式会社エヌ・ティ・ティ・ドコモ Function execution instruction system, function execution instruction method, and function execution instruction program
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9620104B2 (en) 2013-06-07 2017-04-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US9966068B2 (en) 2013-06-08 2018-05-08 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10185542B2 (en) 2013-06-09 2019-01-22 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
WO2017145373A1 (en) * 2016-02-26 2017-08-31 三菱電機株式会社 Speech recognition device
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10269345B2 (en) 2016-09-19 2019-04-23 Apple Inc. Intelligent task discovery
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant

Also Published As

Publication number Publication date
JP3662780B2 (en) 2005-06-22

Similar Documents

Publication Publication Date Title
EP1366490B1 (en) Hierarchichal language models
US9263039B2 (en) Systems and methods for responding to natural language speech utterance
US7249025B2 (en) Portable device for enhanced security and accessibility
US7620549B2 (en) System and method of supporting adaptive misrecognition in conversational speech
JP4446312B2 (en) Method and system for displaying a variable number of alternative words in a speech recognition
US6246981B1 (en) Natural language task-oriented dialog manager and method
US7546382B2 (en) Methods and systems for authoring of mixed-initiative multi-modal interactions and related browsing mechanisms
KR100726692B1 (en) Merging of speech interfaces for concurrent use of devices and applications
JP4267081B2 (en) Pattern recognition registration in a distributed system
US8036893B2 (en) Method and system for identifying and correcting accent-induced speech recognition difficulties
US7734461B2 (en) Apparatus for providing voice dialogue service and method of operating the same
JP3967952B2 (en) Grammar update system and method
US5583965A (en) Methods and apparatus for training and operating voice recognition systems
US5852801A (en) Method and apparatus for automatically invoking a new word module for unrecognized user input
US5946658A (en) Cartridge-based, interactive speech recognition method with a response creation capability
CN102298928B (en) Interactive conversational dialogue for cognitively overloaded device users
JP4987623B2 (en) Apparatus and method for interacting with a user and voice
JP4854259B2 (en) Centralized method and system for clarity a voice command
CN1145141C (en) Method and apparatus for improving accuracy of speech recognition
EP0607615B1 (en) Speech recognition interface system suitable for window systems and speech mail systems
CN101238508B (en) Redictation of misrecognized words using a list of alternatives
EP0773532B1 (en) Continuous speech recognition
KR101300839B1 (en) Voice query extension method and system
US6360237B1 (en) Method and system for performing text edits during audio recording playback
US7228275B1 (en) Speech recognition system having multiple speech recognizers

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030603

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050324

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080401

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090401

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100401

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110401

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120401

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120401

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130401

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130401

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140401

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees