JPH09114493A - Interaction controller - Google Patents

Interaction controller

Info

Publication number
JPH09114493A
JPH09114493A JP27106595A JP27106595A JPH09114493A JP H09114493 A JPH09114493 A JP H09114493A JP 27106595 A JP27106595 A JP 27106595A JP 27106595 A JP27106595 A JP 27106595A JP H09114493 A JPH09114493 A JP H09114493A
Authority
JP
Japan
Prior art keywords
word
recognition
words
similar
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP27106595A
Other languages
Japanese (ja)
Inventor
Otoya Shirotsuka
音也 城塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP27106595A priority Critical patent/JPH09114493A/en
Publication of JPH09114493A publication Critical patent/JPH09114493A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To reduce the number of utterings by a user at an erroneous recognition and to make the conversation smooth, in an interaction controller which has an user uttering content recognition means. SOLUTION: The controller has a recognition word estimating section 12. The section 12 is provided with a similar word table 122 which stores separating information to judge the similarity and the non-similarity of the words stored in a recognition word dictionary 121, word narrowing-down table 123 which stores the information to express the presence or the absence of erroneous recognition histories of each word in the dictionary 121, a similar word retrieving section 124 which retrieves similar words and a narrowing-down word retrieving section 125 which performs word narrowing-down retrieval. At the time of an erroneous recognition, the controller does not ask the user to re-input his voice, but asks the user the correctness or the incorrectness of the similar word that is retrieved by referring to the table 122 as the next estimating word. If more than two words having no erroneous recognition history are narrowed down, they are successively used as recognized words and the user is asked to make an appropriate selection. The user answers the question with only 'yes' or 'no'.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、音声認識及び音声
合成技術を駆使してユーザと対話を行い、その対話内容
にしたがって所定の音声サービスを実現する音声サービ
スシステムに係り、特に、ユーザとシステムとの間の対
話を制御する対話制御装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice service system which utilizes voice recognition and voice synthesis techniques to interact with a user and realizes a predetermined voice service in accordance with the content of the conversation, and more particularly to the user and the system. The present invention relates to a dialogue control device that controls a dialogue between a user and a user.

【0002】[0002]

【従来の技術】ユーザとの間で音声で対話しながら所定
の音声サービスを実現する音声サービスシステムが知ら
れている。図13は、この音声サービスシステムの一般
的なブロック構成図であり、ユーザが発話した音声は、
音声インタフェース3の音声認識部31に入力され、こ
の音声認識部31で認識されて対話制御装置4に送られ
る。対話制御装置4は、話題決定後、あるいはユーザか
らの音声入力を契機に、次の対話を行うための音声出力
文(文字コード)を生成し、これを音声合成部32に送
る。対話制御装置4は、また、ユーザとの対話から必要
十分な情報を取得したときは、この取得情報をアプリケ
ーション処理部2に送り、ユーザの希望するサービスを
実行させる。
2. Description of the Related Art A voice service system is known which realizes a predetermined voice service while talking with a user by voice. FIG. 13 is a general block configuration diagram of this voice service system. The voice uttered by the user is
It is input to the voice recognition unit 31 of the voice interface 3, recognized by the voice recognition unit 31, and sent to the dialogue control device 4. The dialogue control device 4 generates a voice output sentence (character code) for carrying out the next dialogue after the topic is decided or when the user inputs a voice, and sends it to the voice synthesizer 32. When the dialog control device 4 acquires necessary and sufficient information from the dialog with the user, the dialog control device 4 sends the acquired information to the application processing unit 2 to execute the service desired by the user.

【0003】音声サービスシステムとユーザとの対話
は、システム側が話題毎に指示や質問等の音声メッセー
ジを出力し、利用者がそれに応えるということ(対話
対)の繰り返しにより行われる。この対話対の制御を司
るのが対話制御装置4である。従来の対話制御装置4の
概略構成は図14に示すとおりであり、話題を決定する
話題決定部41と、話題毎に複数の認識単語が格納され
た認識単語辞書422と単語検索部421とを用いて認
識単語を推定する認識単語推定部42と、推定結果から
音声合成の対象となる音声出力文を生成して音声合成部
32に送出する音声出力文生成部43と、音声認識部3
1及びアプリケーション処理部2とのインタフェースと
なる認識処理部44と、音声認識部31から送られた認
識結果に基づいて上記推定された認識単語の正誤を判定
する正誤判定部45とを備えている。
The dialogue between the voice service system and the user is carried out by repeating that the system side outputs voice messages such as instructions and questions for each topic and the user responds to them (interaction pair). The dialogue control device 4 controls the dialogue pair. A schematic configuration of a conventional dialogue control device 4 is as shown in FIG. 14, and includes a topic determination unit 41 that determines a topic, a recognition word dictionary 422 that stores a plurality of recognition words for each topic, and a word search unit 421. A recognition word estimation unit 42 that estimates a recognition word using the speech recognition unit 3, a speech output sentence generation unit 43 that generates a speech output sentence that is a target of speech synthesis from the estimation result and sends the speech output sentence to the speech synthesis unit 32, and a speech recognition unit 3.
1 and the application processing unit 2, and a recognition processing unit 44, and a correctness determination unit 45 that determines whether the estimated recognition word is correct based on the recognition result sent from the voice recognition unit 31. .

【0004】この対話制御装置4の動作を、会議室の予
約というサービスを例に挙げて説明する。会議室の予約
では、予約者名、日づけ、使用開始時間、使用終了時
間、予約対象となる会議室名の5つの話題が必要とな
る。対話制御装置4は、これらの話題の各々についてア
プリケーション処理部2とユーザとの間で行う対話対を
制御する。
The operation of the dialogue control device 4 will be described by taking a service of reservation of a conference room as an example. When making a reservation for a conference room, five topics are required: the name of the person who made the reservation, the date, the use start time, the use end time, and the name of the conference room to be reserved. The dialogue control device 4 controls a dialogue pair performed between the application processing unit 2 and the user for each of these topics.

【0005】図15は、会議室名の話題について対話制
御装置4が行う制御フローの説明図であり、図12は、
この場合の音声サービスシステム全体とユーザとの間で
実際になされる対話の様子を示す図である。図15及び
図12を参照すると、まず、話題決定部41が今回の話
題である「会議室名」を決定する(S301)。これに
より音声出力文生成部43は、アプリケーション処理部
2がどのような情報を音声入力して欲しいかをユーザに
知らせるために必要な所期音声出力文(「会議室名をど
うぞ」)を生成する(S302)。この所期音声出力文
に対応する合成音声を聞いたユーザが「コーナーAで
す」と音声入力し、これが音声認識部31で認識された
場合(S303:Yes)、認識単語推定部42は、「会
議室名」に関する認識単語を格納している認識単語辞書
422を参照して認識単語を推定する(S304)。認
識単語「コーナーB」が推定されたと仮定すると、音声
出力文生成部43は、その推定結果が正しいかをユーザ
に尋ねるための音声出力文(「コーナーBですか?」)
を生成する(S305)。これに対応する合成音声を聞
いたユーザは、認識結果が正しくないので「いいえ」と
答える。
FIG. 15 is an explanatory diagram of a control flow performed by the dialogue control device 4 regarding the topic of the conference room name, and FIG.
It is a figure which shows the mode of the dialog actually performed between the whole voice service system and a user in this case. Referring to FIGS. 15 and 12, first, the topic determination unit 41 determines the “meeting room name” that is the topic of this time (S301). As a result, the voice output sentence generation unit 43 generates a desired voice output sentence (“Please give the name of the conference room”) necessary to inform the user what information the application processing unit 2 wants to input by voice. Yes (S302). When the user who hears the synthesized voice corresponding to this intended voice output sentence inputs the voice as "Corner A" and this is recognized by the voice recognition unit 31 (S303: Yes), the recognized word estimation unit 42 displays " The recognized word is estimated by referring to the recognized word dictionary 422 that stores the recognized word related to "meeting room name" (S304). Assuming that the recognition word “corner B” has been estimated, the voice output sentence generator 43 asks the user if the estimation result is correct (“is it corner B?”).
Is generated (S305). The user who hears the synthesized voice corresponding to this answers "No" because the recognition result is incorrect.

【0006】この「いいえ」の音声が認識された場合
(S306:Yes)、正誤判定部45は、上記認識単語
が誤りであると判定する(S307)。これを受けて音
声出力文生成部は、再度ユーザに情報の音声入力を促す
ための音声出力文(「もう一度おっしゃって下さい」)
を生成する(S308)。このS303〜S308の手
順を繰り返し、ユーザが「はい」と答えた場合(S30
7:Yes)は、認識単語が正しかったとみなして次の話
題について対話を継続させる(S309)。次の話題が
ない場合は対話制御を終える。なお、ユーザが答える
「はい」、「いいえ」については、ほぼ100%に近い
精度で認識できることが知られている。
When this "no" voice is recognized (S306: Yes), the correctness determination section 45 determines that the recognized word is incorrect (S307). In response to this, the voice output sentence generation unit prompts the user to input voice information again (“Tell me again”)
Is generated (S308). When the user answers "Yes" by repeating the procedure of S303 to S308 (S30
7: Yes) regards the recognized word as correct and continues the dialogue on the next topic (S309). If there is no next topic, the dialogue control ends. It is known that "yes" and "no" answered by the user can be recognized with accuracy close to 100%.

【0007】[0007]

【発明が解決しようとする課題】上述のように、従来の
対話制御装置4では、ユーザの発話内容から認識単語を
推定してその正誤をユーザに尋ね、誤認識であることが
判明した場合には再度ユーザに対して音声入力(「もう
一度おっしゃって下さい)」を要求している。そのた
め、誤認識の回数が増えるにつれてユーザの負担が増え
るという問題があった。特に、同一の情報について誤認
識が繰り返されると、ユーザがシステム利用に抵抗を感
じる懸念があった。
As described above, in the conventional dialogue control device 4, when the recognition word is estimated from the content of the user's utterance, the correctness is asked to the user, and it is determined that the recognition is incorrect. Requests the user again for voice input ("Please say again"). Therefore, there has been a problem that the burden on the user increases as the number of erroneous recognitions increases. In particular, if erroneous recognition of the same information is repeated, there is a concern that the user may feel uncomfortable with the system.

【0008】このような問題を解消するための手段とし
て、誤認識時にユーザに対して再度の音声入力を促さ
ず、複数の認識単語候補を予め認識処理等によって求め
ておき、最も確からしい認識単語候補から順番にユーザ
に「はい」、「いいえ」によって確認させることが考え
られる。しかし、複数の認識単語候補から最も確からし
いものを絞り込むには、かなりの計算量と大きなメモリ
空間が必要となるばかりでなく、真に正しい認識単語候
補が下位順位にある場合はそれに到達するまでユーザへ
の確認回数が多くなるという問題が生じる。
As a means for solving such a problem, a plurality of recognition word candidates are previously obtained by a recognition process or the like without prompting the user to input a voice again at the time of erroneous recognition, and the most probable recognition word is obtained. It is conceivable to prompt the user to confirm "yes" and "no" in order from the candidate. However, in order to narrow down the most probable one from a plurality of recognized word candidates, not only a considerable amount of calculation and a large memory space are required, but when a truly correct recognized word candidate is in the lower rank, it is necessary to reach it. There is a problem that the number of confirmations to the user increases.

【0009】そこで本発明の課題は、ユーザの発話内容
の認識手段を有する対話制御装置において、認識単語の
特定の迅速化を図るとともに、誤認識時のユーザの発声
回数を減少させるとともに、発話内容を短縮させてユー
ザとの間の対話を円滑化させることにある。
Therefore, an object of the present invention is to speed up the identification of a recognition word in a dialogue control device having a means for recognizing the utterance content of a user, reduce the number of times the user utters at the time of erroneous recognition, and utter the content To facilitate the dialogue with the user.

【0010】[0010]

【課題を解決するための手段】上記課題を解決するた
め、本発明は、複数の認識単語を格納した認識単語辞書
と、この認識単語辞書を参照して入力音声に対応する認
識単語を推定する認識単語推定部と、推定された認識単
語の正誤を問うための音声出力文を生成する音声出力文
生成部と、推定された認識単語の正誤を入力音声に基づ
いて判定する正誤判定部とを有する対話制御装置におい
て、前記認識単語推定部を、前記認識単語辞書に格納さ
れている認識単語間の類似または非類似の区別情報を各
認識単語の識別領域に格納した類似単語テーブルと、前
記推定した認識単語が誤っているときに前記類似単語テ
ーブルを参照して当該認識単語に類似する他の認識単語
の識別領域を特定する第1の単語検索部と、を備えた構
成とし、この特定された識別領域に対応する認識単語を
次候補の認識単語として推定することを特徴とする。
In order to solve the above problems, the present invention estimates a recognition word dictionary storing a plurality of recognition words and a recognition word corresponding to an input voice by referring to the recognition word dictionary. A recognition word estimation unit, a voice output sentence generation unit that generates a voice output sentence for inquiring whether the estimated recognition word is correct, and a correctness determination unit that determines whether the estimated recognition word is correct or incorrect based on the input voice. In the dialogue control device having, the recognition word estimating unit includes a similar word table in which identification information of the recognition words stored in the recognition word dictionary, which is similar or dissimilar between the recognition words, is stored in the identification area of each recognition word, and the estimation. And a first word search unit for identifying an identification area of another recognition word similar to the recognition word when the recognized word is wrong, And the recognized word corresponding to the identification areas and estimating a recognized word for the next candidate.

【0011】類似または非類似の別は、例えば、予め認
識単語の認識モデル同士の類似性を計算して記録してお
くか、あるいは実際の使用履歴から間違いやすい認識単
語のペアを統計的に求めて記録しておくことで対応す
る。
For similarity or dissimilarity, for example, the similarity between the recognition models of the recognition words is calculated and recorded in advance, or a pair of recognition words which is apt to be mistaken is statistically obtained from the actual use history. We will respond by recording it.

【0012】前記類似単語テーブルを作成する場合は、
例えば、当該認識単語辞書に含まれる認識単語の識別領
域をマトリクス状に配列するとともに、一方を類似、他
方を非類似と規定した二値情報を各々前記マトリクスの
対応領域に格納する。あるいは、各認識単語間の類似度
を表す三値以上の多値情報を前記マトリクスの対応領域
に格納する。後者の場合、前記第1の単語検索部は、前
記多値情報が所定の閾値を超える認識単語同士を類似と
判定するように構成する。
When creating the similar word table,
For example, the identification areas of the recognition words included in the recognition word dictionary are arranged in a matrix, and binary information defining one as similar and the other as dissimilar is stored in corresponding areas of the matrix. Alternatively, multi-valued information of three or more values indicating the similarity between each recognized word is stored in the corresponding area of the matrix. In the latter case, the first word search unit is configured to determine that recognized words whose multi-valued information exceeds a predetermined threshold are similar to each other.

【0013】対話制御装置をこのように構成すると、一
の認識単語の推定が誤った場合、類似単語テーブルの対
応領域を参照することでその認識単語に類似する他の認
識単語の識別領域を直ちに特定することができる。した
がって、この識別領域を認識単語辞書内の認識辞書の識
別情報と1:1に対応させておけば、次の推定候補とな
る認識単語の特定及び索出が迅速になる。また、次の認
識単語が直ちに特定できることから、その認識単語の正
誤をユーザに尋ねて「はい」または「いいえ」のいずれ
かのみを答えさせるようにすることができ、再度の音声
入力を促す場合に比べて対話の円滑化を図ることもでき
る。
According to this construction of the dialogue control device, when the estimation of one recognized word is incorrect, the corresponding area of the similar word table is referred to immediately identify the identified areas of other recognized words similar to the recognized word. Can be specified. Therefore, if this identification area is made to correspond to the identification information of the recognition dictionary in the recognition word dictionary in a one-to-one correspondence, the identification and search of the next recognition candidate recognition word will be speeded up. In addition, since the next recognized word can be immediately identified, it is possible to ask the user whether the recognized word is correct or not and to answer only “Yes” or “No”. You can also facilitate the dialogue compared to.

【0014】また、上記課題を解決する本発明の他の構
成は、複数の認識単語を格納した認識単語辞書と、この
認識単語辞書を参照して入力音声に対応する認識単語を
推定する認識単語推定部と、推定された認識単語の正誤
を問うための音声出力文を生成する音声出力文生成部
と、推定された認識単語の正誤を入力音声に基づいて判
定する正誤判定部とを有する対話制御装置において、前
記認識単語推定部を、前記認識単語辞書に格納されてい
る全ての認識単語の識別領域に当該認識単語の誤認識歴
の有無を表す情報が格納された単語絞込テーブルと、こ
の単語絞込テーブルを参照して誤認識履歴のない認識単
語の識別領域を検出する第2の単語検索部と、を備えて
構成し、検出された識別領域に対応する認識単語のいず
れかを次候補の認識単語して推定することを特徴とす
る。
Another structure of the present invention for solving the above-mentioned problems is a recognition word dictionary storing a plurality of recognition words and a recognition word for estimating a recognition word corresponding to an input voice by referring to this recognition word dictionary. Dialog having an estimation unit, a voice output sentence generation unit that generates a voice output sentence for inquiring whether the estimated recognition word is correct, and a correctness determination unit that determines whether the estimated recognition word is correct or incorrect based on the input voice. In the control device, the recognition word estimation unit, a word narrowing table in which information indicating the presence or absence of misrecognition history of the recognition word is stored in the identification areas of all the recognition words stored in the recognition word dictionary, A second word search unit for detecting an identification area of a recognition word having no erroneous recognition history by referring to this word narrowing-down table, and selecting one of the recognition words corresponding to the detected identification area. Recognizing the next candidate Characterized in that it estimated word.

【0015】これにより、一度誤認識があった認識単語
はその履歴を単語絞込テーブルに格納しておくことで、
同一の認識単語による誤認識の繰り返しが回避され、対
話の円滑化を図ることができる。
By this, by storing the history of the recognition word which has been erroneously recognized once in the word narrowing table,
Repeated erroneous recognition due to the same recognition word can be avoided, and the dialogue can be facilitated.

【0016】なお、第2の検索部が検出した識別領域が
2つの場合、すなわち誤認識歴の無い認識単語が2つの
場合は、いずれか一方の認識単語が正解となる。この場
合は、認識単語推定部は、いずれか一方の識別領域に対
応する単語を認識単語として推定する。そして音声出力
文生成部がこの認識単語の正誤を問うための音声出力文
を生成する。これにより、ユーザに「はい」または「い
いえ」のみの音声入力を促すだけで正しい認識単語を認
識することができ、対話の円滑化を図ることができる。
When there are two identification areas detected by the second search unit, that is, when there are two recognition words having no recognition error history, either one of the recognition words is the correct answer. In this case, the recognition word estimation unit estimates a word corresponding to one of the identification areas as a recognition word. Then, the voice output sentence generation unit generates a voice output sentence for asking whether the recognized word is correct or incorrect. As a result, the correct recognition word can be recognized simply by urging the user to input only “Yes” or “No”, and the dialogue can be facilitated.

【0017】[0017]

【発明の実施の形態】以下、図面を参照して本発明の実
施形態を詳細に説明する。図1は、本発明の対話制御装
置を音声サービスシステムに適用した場合のブロック構
成図であり、基本的には図10に示した従来システムと
同一構成となる。なお、全く同一の構成要素については
図1においても同一符号を付してある。
Embodiments of the present invention will be described below in detail with reference to the drawings. FIG. 1 is a block configuration diagram when the dialogue control device of the present invention is applied to a voice service system, and basically has the same configuration as the conventional system shown in FIG. It should be noted that, in FIG. 1, the same components are denoted by the same reference numerals.

【0018】ユーザが発話した音声は、音声認識部31
に入力され、この音声認識部31で認識されて本発明の
対話制御装置1に送られる。対話制御装置1は、話題決
定を契機に次の対話を行うための音声出力文を生成し、
これを音声合成部32に送る。対話制御装置1は、ま
た、ユーザとの対話から必要十分な情報を取得したとき
は、この取得情報をアプリケーション処理部2に送り、
ユーザの希望するサービスを実行させる。
The voice uttered by the user is the voice recognition unit 31.
To the dialogue control device 1 of the present invention. The dialogue control device 1 generates a voice output sentence for carrying out the next dialogue when the topic is decided,
This is sent to the voice synthesizer 32. When the dialogue control device 1 obtains necessary and sufficient information from the dialogue with the user, the dialogue control device 1 sends the obtained information to the application processing unit 2,
Execute the service desired by the user.

【0019】図2は、本発明の対話制御装置1の概略構
成図である。この対話制御装置1は、認識単語辞書12
1,類似単語テーブル122,及び単語絞込テーブル1
23が接続された認識単語推定部12と、図14に示し
た従来装置と同一機能の話題決定部11,音声出力文生
成部13,及び正誤判定部15を有する。認識単語推定
部12は、さらに、類似単語テーブル122を参照して
認識単語辞書121内の類似単語を索出する類似単語検
索部124と、単語絞込テーブル123を参照して認識
単語辞書121内の認識単語の誤認識の有無を調べ、誤
認識歴の無いものを索出する絞込単語検索部125とを
備えて構成される。両検索部124,125は、各々独
立に用いてもよく、併用させてもよい。
FIG. 2 is a schematic configuration diagram of the dialogue control device 1 of the present invention. This dialogue control device 1 includes a recognition word dictionary 12
1, similar word table 122, and word narrowing down table 1
The recognition word estimation unit 12 to which 23 is connected, the topic determination unit 11 having the same function as the conventional device shown in FIG. 14, the voice output sentence generation unit 13, and the correctness determination unit 15 are included. The recognized word estimation unit 12 further refers to the similar word table 122 to search for similar words in the recognized word dictionary 121, and the recognized word dictionary 121 by referring to the word narrowing table 123. And a narrowed-down word search unit 125 that searches the recognition words for erroneous recognition and searches for those having no erroneous recognition history. Both search units 124 and 125 may be used independently or in combination.

【0020】図3は、この実施形態で用いる認識単語辞
書121の構造説明図であり、どの話題用の辞書かを判
別するための認識辞書番号と、認識候補となる単語名
と、検索処理の便宜のために各単語に振られた単語番号
とが所定フォーマットで格納されている。図示の例で
は、話題「会議室名」が認識辞書番号「3」と対応して
おり、この「会議室名」に対して「コーナーA」・・・
等の5つの単語、及びその単語番号(1)〜(5)が格
納されている。
FIG. 3 is an explanatory diagram of the structure of the recognition word dictionary 121 used in this embodiment. The recognition dictionary number for determining which topic dictionary, the word name as a recognition candidate, and the search process. For convenience, a word number assigned to each word is stored in a predetermined format. In the illustrated example, the topic “meeting room name” corresponds to the recognition dictionary number “3”, and “corner A” ...
And the like, and their word numbers (1) to (5) are stored.

【0021】図4は、類似単語テーブル122の一例で
あり、図3に示した認識単語辞書(認識辞書番号
「3」)内の単語間の類似または非類似の別を表す
“○”,“×”の二値情報を、各単語番号に対応する領
域、すなわち識別領域にマトリクス状に格納したもので
ある。図示の例では、「コーナーA」と「コーナーB」
とが相互に類似であり、その他の単語間は非類似である
ことを表している。
FIG. 4 is an example of the similar word table 122, and "○", "" that indicate whether the words in the recognized word dictionary (recognition dictionary number "3") shown in FIG. 3 are similar or dissimilar. Binary information of “×” is stored in a matrix form in an area corresponding to each word number, that is, an identification area. In the example shown, "Corner A" and "Corner B"
And are similar to each other, and other words are dissimilar.

【0022】なお、単語間の類似関係は、必ずしも二値
情報に限定されず多値情報で表しても良い。図5は、単
語間の類似度を、低い順に連続する多値(離散値、アナ
ログ値のいずれであっても良い)L1〜L5で表したも
のである。この場合は、所定の閾値を設定して各類似度
との比較を行い、閾値よりも類似度が高ければ類似、低
ければ非類似とする。類似関係を二値情報で表すことの
利点は類似単語検索部121の構成が簡略になることで
あり、多値情報で表すことの利点は、類似度が段階的に
表現されるので認識単語辞書16内の単語間の類似関係
をより細かく規定できることにある。多値情報で表した
場合に複数の認識単語が閾値を超えた場合は、類似度の
高い順に認識単語候補を特定すればよい。
The similarity relation between words is not necessarily limited to binary information and may be represented by multivalued information. FIG. 5 shows the degree of similarity between words as continuous low-valued multivalues (either discrete values or analog values) L1 to L5. In this case, a predetermined threshold is set and compared with each similarity, and if the similarity is higher than the threshold, the similarity is determined, and if the similarity is lower than the threshold, the similarity is determined. The advantage of expressing the similarity relation with binary information is that the configuration of the similar word search unit 121 is simplified, and the advantage of expressing it with multivalued information is that the degree of similarity is expressed step by step, so that the recognition word dictionary It is to be able to define the similarity between the words in 16 more finely. When a plurality of recognized words exceed the threshold value when represented by multivalued information, the recognized word candidates may be specified in descending order of similarity.

【0023】図6は、単語絞込テーブル123の一例で
あり、図3に示した認識単語辞書121に格納されてい
る全ての単語の単語番号と対応する領域、すなわち識別
領域に、当該認識単語の誤認識歴の有無を表す二値情報
(誤認識歴有:○、誤認識歴無:×)を格納したもので
ある。初期値は全ての領域に“○”が格納され、誤認識
の度に“×”に更新されて次回の認識単語候補からはず
される。なお、この単語絞込テーブル123は、使用す
る認識単語辞書121が変わる度に、新しい認識単語辞
書内の単語数と同数の識別領域を有するものが作成され
る。
FIG. 6 shows an example of the word narrowing table 123. The recognition word is stored in an area corresponding to the word numbers of all the words stored in the recognition word dictionary 121 shown in FIG. Binary information indicating the presence / absence of the misrecognition history of (No misrecognition history: ○, No misrecognition history: ×) is stored. As the initial value, “◯” is stored in all areas, and is updated to “×” at each misrecognition to be removed from the next recognition word candidate. It should be noted that this word narrowing-down table 123 is created each time the recognition word dictionary 121 to be used is changed, and has the same number of identification areas as the number of words in the new recognition word dictionary.

【0024】次に、本実施形態の音声サービスシステム
及び対話制御装置1の動作を図7〜図11を参照して説
明する。ここでは、便宜上、従来例と同様、会議室の予
約という話題の例を挙げる。
Next, the operation of the voice service system and the dialogue control apparatus 1 of this embodiment will be described with reference to FIGS. Here, for the sake of convenience, an example of the topic of reservation of a conference room will be described as in the conventional example.

【0025】図7は類似単語検索部124及び絞込単語
検索部125を併用する場合の対話制御装置1の制御フ
ローの説明図であり、図9は、この場合の音声サービス
システム全体とユーザとの間で実際になされる対話の様
子を示す図である。前提として、単語絞込テーブル12
3の識別領域の値は全て所期状態(全て“○”)である
ものとする。
FIG. 7 is an explanatory view of a control flow of the dialogue control device 1 when the similar word search unit 124 and the narrowed word search unit 125 are used together, and FIG. 9 shows the entire voice service system and the user in this case. It is a figure which shows the mode of the dialog actually performed between. As a premise, the word narrowing table 12
It is assumed that all the values in the identification area 3 are in the desired state (all are “◯”).

【0026】この例では、まず、話題決定部11が「会
議室名」を決定する(S101)。これにより音声出力
文生成部13は、所期音声出力文(「会議室名をどう
ぞ」)を生成する(S102)。この所期音声出力文に
対応する合成音声を聞いたユーザが「コーナーAです」
と音声入力し、これが音声認識部11で認識された場合
(S103:Yes)、認識単語推定部12は、「会議室
名」に対応する認識辞書番号「3」の認識単語辞書12
1を参照して認識単語を推定する(S104)。認識単
語「コーナーB」が推定されたと仮定すると、音声出力
文生成部13は、その推定結果が正しいかをユーザに尋
ねるための音声出力文(「コーナーBですか?」)を生
成する(S105)。これに対応する合成音声を聞いた
ユーザは、認識結果が正しくないので「いいえ」と答え
る。
In this example, first, the topic determining section 11 determines the "meeting room name" (S101). As a result, the voice output sentence generation unit 13 generates a desired voice output sentence (“Please call the meeting room name”) (S102). The user who heard the synthesized voice corresponding to this expected voice output sentence is "Corner A".
When the voice recognition unit 11 recognizes this (S103: Yes), the recognition word estimation unit 12 recognizes the recognition word dictionary 12 with the recognition dictionary number “3” corresponding to the “meeting room name”.
The recognized word is estimated by referring to 1 (S104). Assuming that the recognition word "corner B" has been estimated, the voice output sentence generation unit 13 generates a voice output sentence ("Corner B?") For asking the user if the estimation result is correct (S105). ). The user who hears the synthesized voice corresponding to this answers "No" because the recognition result is incorrect.

【0027】この「いいえ」の音声が認識された場合
(S106:Yes)、正誤判定部15は上記認識単語が
誤りであると判定する(S107:No)。これを受けて
認識単語推定部12は、誤認識された単語の単語番号を
認識単語辞書121から特定して単語絞込テーブル12
3上の該当識別領域を“×”に更新する(S108)。
認識単語推定部12は、また、候補単語数、すなわち単
語絞込テーブル123で“○”が格納されている識別領
域数の数を調べ(S109)、3以上のときは(S10
9:Yes)、類似単語の検索処理を行う(S110)。
具体的には、まず類似単語テーブル122を参照して、
誤認識された単語(コーナーB:単語番号(2))に対
して類似する単語の単語番号を特定する。図4または図
5の例では単語番号(1)の「コーナーA」が特定され
る。次に、この単語番号(1)に対応する単語を認識単
語辞書16から索出する。そして索出された単語(「コ
ーナーA」)を次の認識単語として推定し(S11
1)、S105の処理に戻る。
When this "no" voice is recognized (S106: Yes), the correctness determination unit 15 determines that the recognized word is incorrect (S107: No). In response to this, the recognized word estimation unit 12 specifies the word number of the erroneously recognized word from the recognized word dictionary 121 and determines the word narrowing table 12
The relevant identification area on 3 is updated to "x" (S108).
The recognized word estimation unit 12 also checks the number of candidate words, that is, the number of identification areas in which “◯” is stored in the word narrowing table 123 (S109), and when 3 or more (S10).
9: Yes), a similar word search process is performed (S110).
Specifically, first, referring to the similar word table 122,
The word number of a word similar to the misrecognized word (corner B: word number (2)) is specified. In the example of FIG. 4 or 5, “corner A” of word number (1) is specified. Next, the word corresponding to this word number (1) is searched from the recognition word dictionary 16. Then, the searched word (“corner A”) is estimated as the next recognized word (S11).
1), the process returns to S105.

【0028】また、S109において候補単語数が2以
下であって(S109:No)且つ候補単語が存在するこ
とが確認された場合は(S112:Yes)、類似単語テ
ーブル122を参照することなく、単語番号の若い順か
ら認識単語辞書121内の該当単語を索出してこれを認
識単語として順次推定し(S113)、S105の処理
に戻る。
If the number of candidate words is 2 or less in S109 (S109: No) and it is confirmed that there are candidate words (S112: Yes), the similar word table 122 is not referred to. The corresponding word in the recognized word dictionary 121 is searched from the ascending order of word numbers, and this is sequentially estimated as a recognized word (S113), and the process returns to S105.

【0029】S107で認識結果が正解と判定された場
合(S107:Yes)、すなわちユーザが「はい」と答
えた場合、あるいはS112で候補単語が存在しないこ
とが確認された場合(S112:No)は、次の話題の有
無が判定され(S114)、話題がある場合はS101
の処理に戻り、話題が無い場合は対話制御を終える。
If the recognition result is determined to be correct in S107 (S107: Yes), that is, if the user answers "yes", or if it is confirmed in S112 that no candidate word exists (S112: No). Determines whether there is a next topic (S114), and if there is a topic, S101
Return to the process of (3), and if there is no topic, the dialogue control ends.

【0030】図8は、図7の制御フローにおいて、所期
音声出力文の生成に代えて、話題決定後、直ちに単語絞
込を行う場合の例を示すものである。この場合は、話題
が決定され、それに対応する認識単語辞書121が特定
されると(S201)、認識単語推定部12が絞込テー
ブル123を参照して候補単語数を調べる(S202,
S203)。そして候補単語数が3以上であれば認識単
語辞書121から任意の単語(「コーナーB」)を索出
し、これを認識単語として推定する(S204)。以後
の処理S205〜S214は、図7のS105〜S11
4と同様である。
FIG. 8 shows an example in the control flow of FIG. 7, in which word narrowing is performed immediately after the topic is decided instead of generating the desired voice output sentence. In this case, when the topic is determined and the recognized word dictionary 121 corresponding thereto is specified (S201), the recognized word estimation unit 12 refers to the narrowing-down table 123 to check the number of candidate words (S202,
S203). Then, if the number of candidate words is 3 or more, an arbitrary word (“corner B”) is searched from the recognized word dictionary 121, and this is estimated as a recognized word (S204). Subsequent processes S205 to S214 are the same as S105 to S11 in FIG.
Same as 4.

【0031】一方、S203において候補単語数が2以
下の場合(S203:No)は、S212の処理にジャン
プする。すなわち2つの候補単語数があれば単語番号の
若い順から1つずつ、候補単語が1つであればその単語
を認識単語として推定してS205の処理に戻り(S2
13)、候補単語が存在しない場合は次の話題に移る。
図10は、候補単語が2つの場合、図11は候補単語が
1つの場合の音声サービスシステム全体とユーザとの間
で実際になされる対話の様子を示す図である。
On the other hand, if the number of candidate words is 2 or less in S203 (S203: No), the process jumps to S212. In other words, if there are two candidate word numbers, one is selected from the ascending order of word numbers, and if there is one candidate word, the word is estimated as a recognized word and the process returns to S205 (S2
13) If there is no candidate word, move on to the next topic.
FIG. 10 is a diagram showing a state of dialogue actually performed between the entire voice service system and the user when there are two candidate words and when there is one candidate word.

【0032】このように、類似単語テーブル122を用
いることにより、誤認識時の次の認識単語候補の特定が
迅速になり、また、同一話題に対する従来の対話例を示
した図12との比較から明らかなように、ユーザが希望
会議室名を発した後にシステム側へ音声で答える回数が
減少し、しかもその音声は、認識率の高い「はい」また
は「いいえ」のみとなるので、対話が円滑化される。
As described above, by using the similar word table 122, the next recognition word candidate at the time of erroneous recognition can be quickly identified, and comparison with FIG. 12 showing an example of a conventional dialogue on the same topic is made. Obviously, the number of times the user answers the system by voice after uttering the desired conference room name is reduced, and the voice is only "Yes" or "No" with a high recognition rate, so the dialogue is smooth. Be converted.

【0033】また、一度誤認識された単語については単
語絞込テーブル123にその履歴を格納し、次の認識単
語の候補から外されるようにしたので、誤認識の繰り返
しが防止される。さらに、この単語絞込テーブル123
を用いた単語絞込処理をユーザへの音声入力に先だって
行うことにより、例えば、「コーナーAですか」、「コ
ーナーBですね」のように、ユーザが最初から「はい」
「いいえ」で答えるだけで正しい単語を認識することが
でき、ユーザの発声回数が更に減少する。これによりユ
ーザの負担軽減と対話の円滑化を同時に達成することが
できる。
Further, since the history of the once erroneously recognized words is stored in the word narrowing table 123 so as to be excluded from the candidates of the next recognized word, repetition of erroneous recognition is prevented. Furthermore, this word narrowing table 123
By performing the word narrowing process using the word prior to the voice input to the user, the user can select "Yes" from the beginning, such as "Corner A?" Or "Corner B?"
The correct word can be recognized simply by answering "no", and the number of times the user speaks is further reduced. As a result, it is possible to simultaneously reduce the burden on the user and facilitate the dialogue.

【0034】なお、本実施形態では、図4に示した類似
単語テーブル122及び図6に示した単語絞込テーブル
123に格納される二値情報として“○”と“×”とを
用いているが、二値のいずれか一方を区別できる情報で
あれば、例えば論理1と論理0のように、他の種類の情
報であって良いのは勿論である。
In this embodiment, ".smallcircle." And "x" are used as the binary information stored in the similar word table 122 shown in FIG. 4 and the word narrowing table 123 shown in FIG. However, of course, if it is information that can discriminate either one of the two values, it may be another type of information such as logic 1 and logic 0.

【0035】[0035]

【発明の効果】以上の説明から明らかなように、本発明
によれば、誤認識時に類似単語テーブルを用いて認識単
語辞書内の単語間の類似関係を参照するようにしたの
で、次候補の単語を特定する時間が類否計算による場合
に比べて格段に短縮される効果がある。また、次候補の
単語が迅速に特定できることから、その単語を推定した
ことの正誤を問うための合成音声を直ちにユーザに発す
ることが容易となり、ユーザからは「はい」、「いい
え」のみの音声入力のみとすることができる。
As is apparent from the above description, according to the present invention, the similar relation between words in the recognized word dictionary is referred to by using the similar word table at the time of erroneous recognition. This has the effect of significantly shortening the time required to specify a word, as compared with the case of calculating similarity. In addition, since the next candidate word can be quickly identified, it becomes easy to immediately give the user a synthetic voice asking whether the word is estimated to be correct or incorrect, and the user can only give a "Yes" or "No" voice. It can be input only.

【0036】また、誤認識があった単語については、単
語絞込テーブル内の識別領域に誤認識歴が格納されるの
で、再度の誤認識が回避される効果がある。さらに誤認
識歴のない単語が2つ以下まで絞り込まれた場合は、い
ずれか一方の単語を認識単語と推定してその正誤をユー
ザに問い合わせるようにすることで、ユーザの音声入力
の負担を軽減させることができる。
Further, regarding a word for which misrecognition has occurred, the misrecognition history is stored in the identification area in the word narrowing-down table, so that there is an effect of avoiding misrecognition again. Further, when the number of words having no misrecognition history is narrowed down to two or less, one of the words is estimated to be a recognized word and the user is inquired of whether the word is correct, thereby reducing the user's voice input load. Can be made.

【0037】このようにして、ユーザの発声回数を極力
減少させ、しかも各発声内容を「はい」または「いい
え」のような短い音声とすることで、対話の円滑化を図
ることができる対話制御装置が実現される。
In this way, the dialogue control can facilitate the dialogue by reducing the number of times the user utters as much as possible and by making each utterance content a short voice such as "Yes" or "No". The device is realized.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の対話制御装置が適用される音声サービ
スシステムのブロック構成図。
FIG. 1 is a block configuration diagram of a voice service system to which a dialogue control device of the present invention is applied.

【図2】本発明の対話制御装置の一実施形態のブロック
構成図。
FIG. 2 is a block configuration diagram of an embodiment of a dialogue control device according to the present invention.

【図3】認識単語辞書の内容例を示す説明図。FIG. 3 is an explanatory diagram showing an example of contents of a recognized word dictionary.

【図4】類似単語テーブルに二値情報を格納した場合の
一例を示す説明図。
FIG. 4 is an explanatory diagram showing an example of a case where binary information is stored in a similar word table.

【図5】類似単語テーブルに多値情報を格納した場合の
一例を示す説明図。
FIG. 5 is an explanatory diagram showing an example of a case where multi-valued information is stored in a similar word table.

【図6】単語絞込テーブルの一例を示す説明図。FIG. 6 is an explanatory diagram showing an example of a word narrowing table.

【図7】本実施形態による対話制御装置の制御フローを
示す図。
FIG. 7 is a diagram showing a control flow of the dialogue control device according to the present embodiment.

【図8】本実施形態による対話制御装置の他の制御フロ
ーを示す図。
FIG. 8 is a diagram showing another control flow of the dialogue control device according to the present embodiment.

【図9】図7の制御フローによる、音声サービスシステ
ム全体とユーザとの間で実際になされる対話の様子を示
す図。
9 is a diagram showing a state of actual dialogue between the entire voice service system and a user according to the control flow of FIG. 7. FIG.

【図10】図8の制御フローによる、音声サービスシス
テム全体とユーザとの間で実際になされる対話の様子を
示す図。
FIG. 10 is a diagram showing a state of dialogue actually performed between the entire voice service system and a user according to the control flow of FIG. 8;

【図11】図8の制御フローにおいて、候補単語が1つ
の場合の対話の様子を示す図。
FIG. 11 is a diagram showing a state of dialogue when there is one candidate word in the control flow of FIG. 8.

【図12】従来の対話制御装置による、音声サービスシ
ステム全体とユーザとの間で実際になされる対話の様子
を示す図。
FIG. 12 is a diagram showing a state of dialogue actually performed between the entire voice service system and a user by a conventional dialogue control device.

【図13】従来の対話制御装置が適用される音声サービ
スシステムのブロック構成図。
FIG. 13 is a block configuration diagram of a voice service system to which a conventional dialogue control device is applied.

【図14】従来の対話制御装置のブロック構成図。FIG. 14 is a block configuration diagram of a conventional dialogue control device.

【図15】従来の対話制御装置の制御フローを示す図。FIG. 15 is a diagram showing a control flow of a conventional dialogue control device.

【符号の説明】[Explanation of symbols]

1 対話制御装置 11 話題決定部 12 認識単語推定部 121 認識単語辞書 122 類似単語テーブル 123 単語絞込テーブル 124 類似単語検索部(第1の単語検索部) 125 絞込単語検索部(第2の単語検索部) 13 音声出力文生成部 14 認識制御部 15 正誤判定部 2 アプリケーション処理部 3 音声インタフェース 31 音声認識部 32 音声合成部 1 Dialogue Control Device 11 Topic Determining Unit 12 Recognized Word Estimation Unit 121 Recognized Word Dictionary 122 Similar Word Table 123 Word Narrowing Table 124 Similar Word Searching Unit (First Word Searching Unit) 125 Narrowing Word Searching Unit (Second Word) Search unit) 13 voice output sentence generation unit 14 recognition control unit 15 correctness determination unit 2 application processing unit 3 voice interface 31 voice recognition unit 32 voice synthesis unit

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 複数の単語を格納した認識単語辞書を参
照して入力音声に対応する認識単語を推定する認識単語
推定部と、推定された認識単語の正誤を問うための音声
出力文を生成する音声出力文生成部と、推定された認識
単語の正誤を入力音声に基づいて判定する正誤判定部と
を有する対話制御装置において、 前記認識単語推定部は、 前記認識単語辞書に格納されている単語間の類似または
非類似の区別情報を各単語の識別領域に格納した類似単
語テーブルと、 前記推定した認識単語が誤っているときに前記類似単語
テーブルを参照して当該認識単語に類似する他の単語の
識別領域を特定する第1の単語検索部と、 を備え、この特定された識別領域に対応する単語を次候
補の認識単語として推定することを特徴とする対話制御
装置。
1. A recognition word estimating unit for estimating a recognition word corresponding to an input voice by referring to a recognition word dictionary storing a plurality of words, and a voice output sentence for asking whether the estimated recognition word is correct or incorrect. In the dialogue control device having a voice output sentence generation unit that performs, and a correctness determination unit that determines the correctness of the estimated recognition word based on the input voice, the recognition word estimation unit is stored in the recognition word dictionary. A similar word table storing similar or dissimilarity information between words in the identification area of each word, and referring to the similar word table when the estimated recognized word is incorrect, and similar to the recognized word And a first word search unit for identifying the identification region of the word, and estimating the word corresponding to the identified identification region as the next candidate recognition word.
【請求項2】 前記類似単語テーブルは、当該認識単語
辞書に含まれる単語の識別領域をマトリクス状に配列す
るとともに、一方を類似、他方を非類似と規定した二値
情報を各々前記マトリクスの対応領域に格納して成るこ
とを特徴とする請求項1記載の対話制御装置。
2. The similar word table arranges the identification regions of the words included in the recognized word dictionary in a matrix form, and associates the matrix with binary information that defines one as similar and the other as dissimilar. The dialogue control device according to claim 1, wherein the dialogue control device is stored in an area.
【請求項3】 前記類似単語テーブルは、当該認識単語
辞書に含まれる単語の識別領域をマトリクス状に配列す
るとともに、各単語間の類似度を表す三値以上の多値情
報を前記マトリクスの対応領域に格納して成り、 前記第1の単語検索部は、前記多値情報が所定の閾値を
超える単語同士を類似と判定するように構成されている
ことを特徴とする請求項1記載の対話制御装置。
3. The similar word table arranges the identification regions of words included in the recognized word dictionary in a matrix form, and associates the matrix with multivalued information of three or more values representing the similarity between the words. The dialogue according to claim 1, wherein the dialogue is stored in an area, and the first word search unit is configured to determine that words whose multi-valued information exceeds a predetermined threshold value are similar to each other. Control device.
【請求項4】 複数の単語を格納した認識単語辞書を参
照して入力音声に対応する認識単語を推定する認識単語
推定部と、推定された認識単語の正誤を問うための音声
出力文を生成する音声出力文生成部と、推定された認識
単語の正誤を入力音声に基づいて判定する正誤判定部と
を有する対話制御装置において、 前記認識単語推定部は、 前記認識単語辞書に格納されている各単語の識別領域に
当該単語の誤認識歴の有無を表す情報が格納された単語
絞込テーブルと、 この単語絞込テーブルを参照して誤認識履歴のない単語
の識別領域を検出する第2の単語検索部と、 を備え、検出された識別領域に対応する単語のいずれか
を次候補の認識単語として推定することを特徴とする対
話制御装置。
4. A recognition word estimating unit for estimating a recognition word corresponding to an input voice by referring to a recognition word dictionary storing a plurality of words, and a voice output sentence for asking whether the estimated recognition word is correct or incorrect. In the dialogue control device having a voice output sentence generation unit that performs, and a correctness determination unit that determines the correctness of the estimated recognition word based on the input voice, the recognition word estimation unit is stored in the recognition word dictionary. A word narrowing-down table in which information indicating the presence or absence of a misrecognition history of the word is stored in the identification area of each word, and a word identification area having no misrecognition history is detected by referring to the word narrowing-down table. And a word search unit, and estimates any one of the words corresponding to the detected identification region as the next candidate recognition word.
【請求項5】 前記認識単語推定部は、前記第2の単語
検索部が検出した識別領域が2つのときにいずれか一方
の識別領域に対応する単語を認識単語として推定するこ
とを特徴とする請求項4記載の対話制御装置。
5. The recognition word estimating unit estimates a word corresponding to one of the identification regions as a recognition word when the number of identification regions detected by the second word searching unit is two. The dialogue control device according to claim 4.
JP27106595A 1995-10-19 1995-10-19 Interaction controller Pending JPH09114493A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27106595A JPH09114493A (en) 1995-10-19 1995-10-19 Interaction controller

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27106595A JPH09114493A (en) 1995-10-19 1995-10-19 Interaction controller

Publications (1)

Publication Number Publication Date
JPH09114493A true JPH09114493A (en) 1997-05-02

Family

ID=17494910

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27106595A Pending JPH09114493A (en) 1995-10-19 1995-10-19 Interaction controller

Country Status (1)

Country Link
JP (1) JPH09114493A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000090511A (en) * 1998-09-11 2000-03-31 Victor Co Of Japan Ltd Reservation method for av apparatus
WO2000054180A1 (en) * 1999-03-05 2000-09-14 Cai Co., Ltd. System and method for creating formatted document on the basis of conversational speech recognition
JP2001013978A (en) * 1999-06-29 2001-01-19 Sharp Corp Information selection apparatus, information selection method and recording medium
US6324513B1 (en) 1999-06-18 2001-11-27 Mitsubishi Denki Kabushiki Kaisha Spoken dialog system capable of performing natural interactive access
JP2002073080A (en) * 2000-09-01 2002-03-12 Fujitsu Ten Ltd Voice interactive system
JP2017167270A (en) * 2016-03-15 2017-09-21 本田技研工業株式会社 Sound processing device and sound processing method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000090511A (en) * 1998-09-11 2000-03-31 Victor Co Of Japan Ltd Reservation method for av apparatus
WO2000054180A1 (en) * 1999-03-05 2000-09-14 Cai Co., Ltd. System and method for creating formatted document on the basis of conversational speech recognition
US6324513B1 (en) 1999-06-18 2001-11-27 Mitsubishi Denki Kabushiki Kaisha Spoken dialog system capable of performing natural interactive access
JP2001013978A (en) * 1999-06-29 2001-01-19 Sharp Corp Information selection apparatus, information selection method and recording medium
JP2002073080A (en) * 2000-09-01 2002-03-12 Fujitsu Ten Ltd Voice interactive system
JP2017167270A (en) * 2016-03-15 2017-09-21 本田技研工業株式会社 Sound processing device and sound processing method

Similar Documents

Publication Publication Date Title
JP3454897B2 (en) Spoken dialogue system
US5797116A (en) Method and apparatus for recognizing previously unrecognized speech by requesting a predicted-category-related domain-dictionary-linking word
US5566272A (en) Automatic speech recognition (ASR) processing using confidence measures
JP6540414B2 (en) Speech processing apparatus and speech processing method
JP2001005488A (en) Voice interactive system
US20110131042A1 (en) Dialogue speech recognition system, dialogue speech recognition method, and recording medium for storing dialogue speech recognition program
JPH096389A (en) Voice recognition interactive processing method and voice recognition interactive device
US20060020471A1 (en) Method and apparatus for robustly locating user barge-ins in voice-activated command systems
JP4729902B2 (en) Spoken dialogue system
JP5045486B2 (en) Dialogue device and program
KR19990082252A (en) Database Access Methods and Devices
JP2002123279A (en) Institution retrieval device and its method
JP4634156B2 (en) Voice dialogue method and voice dialogue apparatus
JPS6326700A (en) Voice recognition system
US6721702B2 (en) Speech recognition method and device
US20010056345A1 (en) Method and system for speech recognition of the alphabet
JPH09114493A (en) Interaction controller
JP2004045900A (en) Voice interaction device and program
JP4661239B2 (en) Voice dialogue apparatus and voice dialogue method
JP2003163951A (en) Sound signal recognition system, conversation control system using the sound signal recognition method, and conversation control method
JPH06208388A (en) Interactive speech recognition device
JP4220151B2 (en) Spoken dialogue device
JP2001100787A (en) Speech interactive system
JP6746886B2 (en) Learning support device and program for the learning support device
JPH11143488A (en) Speech recognizing device