JP3513232B2 - 情報処理装置及びその制御方法 - Google Patents
情報処理装置及びその制御方法Info
- Publication number
- JP3513232B2 JP3513232B2 JP28325894A JP28325894A JP3513232B2 JP 3513232 B2 JP3513232 B2 JP 3513232B2 JP 28325894 A JP28325894 A JP 28325894A JP 28325894 A JP28325894 A JP 28325894A JP 3513232 B2 JP3513232 B2 JP 3513232B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- output
- sentence
- word
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
御方法、詳しくは音声入力された問い合わせに対して応
答する情報処理装置及びその制御方法に関する。
なってきた。
内応を説明する。
(1)のように発生したとする。マイクに入力された音
声は、A/D変換処理を行い、アナログ信号からディジ
タル信号に変換され、そのディジタル信号は所定の辞書
を用いて認識され、日本語文に変換される。次に、この
日本語文の解釈処理を行い、例えばそれに対応する図3
(2)のような応答文が作成される。この応答文は、単
語に分割され、読みとアクセントが付加され、音韻パラ
メータと韻律パラメータとのディジタル信号に変換され
る。こうして得られた信号をD/A変換処理を行い、ア
ナログ信号に変換し、スピーカ等から音声として出力す
る。
返しにより、ユーザとシステムとの会話が行われてい
た。
は、話し手が説明しているとき、聞き手は、その説明に
関する単語を用いて問い返すことが多い。しかし、上述
した従来の音声対話方式では、システムが音声合成出力
した単語を含む文をユーザが発生しても、システムがそ
の単語を音声認識できず、対話が不自然になるという問
題点があった。
り、音声入力による対話をスムースに、しかも自然に行
うことを可能にする情報処理装置及びその制御方法を提
供しようとするものである。
情報処理装置は以下の構成を備える。すなわち、合成文
に基づいて合成音声を出力する出力手段と、 音声を入力
する音声入力手段と、 前記出力手段による合成音声の出
力中に前記音声入力手段により音声の入力があった場
合、前記合成音声の出力を中断し、該入力された音声を
認識する認識手段と、 前記認識手段による認識結果の単
語が前記合成文に含まれる場合、該認識結果の単語を含
む文節位置から合成音声の出力を継続するよう制御する
出力制御手段とを有する。
前記出力手段は、音声出力手段及び対話文を表示する表
示手段の両方を含むことが望ましい。これによって、入
力文と応答文の両方が表示されるので、音声出力された
内容を確実に確認することが可能になる。
に基づく文が、従前の会話内容と関連しない場合、前記
追加手段による前記所定の辞書をリフレッシュする手段
を備えることが望ましい。これによって、対話の首題が
切り替わったと判断し、辞書の肥大化を防ぐと共に、新
たな首題にのみ対応する応答が可能になる。
を詳細に説明する。
の構成を示すブロック図である。この装置は、マイク1
と、A/D変換部2と、音声認識部3と、音声認識用の
文法/単語辞書4と、追加辞書5と、音声合成部6と、
音声合成用の文法/単語辞書7と、表示部8と、対話管
理部9と、D/A変換部10と、スピーカ11とから、
その主要部が構成されている。また、CPU13は本装
置全体の制御を司り、内部の主メモリに記憶されている
プログラムに従って動作し、処理部として機能する。
説明する。尚、同処理内容に係るプログラムはCPU1
3の主メモリに格納されている。
理は、合成文を生成するステップS11、音声合成の出
力を開始または継続するステップS12、音声入力が存
在するかどうかを判定するステップS13、音声合成出
力が終了したかどうかを判定するステップS14、ユー
ザの次入力を受け付けるステップS15、ユーザの音声
入力を認識するステップS16、ユーザの次入力内容が
話題を変えるものかどうかを判定するステップS17、
追加辞書をクリアするステップS18、音声合成出力を
一時中断するステップS19、ユーザの音声入力を認識
するステップS20、認識結果が合成文中の単語を含む
かどうか判定するステップS21、認識結果が「ええ」
「うん」などの相槌かどうかを判定するステップS2
2、合成文の出力開始位置を探すステップS23、合成
文中の文節の頭などの合成開始位置として切りの良い位
置を探すステップS24と、旅行案内システムなどのア
プリケーションにおいて、対話管理を行なうステップS
25とを備える。
声対話方式の動作について、図1および図4を参照しな
がら説明する。
(1)のように「神戸市立須磨海浜水族園の説明は。」
と発声したとする。
京」、「須磨」、「都」、「県」、「の」、「にあ
る」、「のいる」、「水族館」、「水族園」、「説
明」、「は」(わ)、「を知りたい」、「ええ」、「う
ん」、「ありがとう」などは認識語としてあらかじめ登
録されている認識可能語彙であり、「平方m」、「ラッ
コ」などは認識不可能であるとする。
問に対する合成文が、図4の手順(2)のように、「神
戸市立須磨…ラッコ館など7館が点在。」と生成され
る。
文法/単語辞書7を用いて、単語に分割され、品詞や読
みなどの単語情報が付与される。ここでは、「神戸」
(品詞=「名詞」、読み=「こーべ」)「水族園」(品
詞=「名詞」、読み=「すいぞくえん」)、…、「平方
m」(品詞=「接尾辞」、読み=「へーほーめーと
る」)、「ラッコ」(品詞=「名詞」、読み=「らっ
こ」)のようになる。
接尾辞などが追加辞書5に追加される。ここでは、「平
方m」、「敷地」、「ラッコ」が追加辞書5に追加さ
れ、新たに認識可能となる。
出力が開始される。ステップS14まで進んで、音声合
成出力が終了したと判定されると、ステップS15によ
って、ユーザの次の入力が受け付けられる。ここでは、
図4の手順(3)のように、ユーザが「東京都にあるラ
ッコのいる水族館を知りたい。」と発声したとする。こ
の発声中にある「東京」、「都」、「にある」、「ラッ
コ」、「のいる」、「水族館」、「を知りたい」、など
の単語はすべて認識可能なので、この発声は、ステップ
S16によって、文法/単語辞書4と追加辞書5を用い
て認識される。次に、ステップS17によって、この発
声が話題を変更するものかどうか判定される。現時点の
話題は「水族館」なので、この発声は話題を変更するも
のではない。従って、ステップS25に移り、この発声
の内容が解釈され、それに対応する応答文が、図4の手
順(4)のように「サンシャイン国際水族館です。」と
生成される。ここで、生成された応答文は、ステップS
11に送られる。さらに、ステップS15まで進んで、
ユーザの次の入力が受け付けられる。ここで、ユーザが
図4の手順(5)のように「ありがとう。」と発声する
と、ステップS16で音声認識され、ステップS17を
経て、ステップS25で対話の終了であると判定され、
対話が終了する。
の画面上に表示される。
ーザの問い合わせに対する応答文を出力するとき、その
応答文中に含まれる各自立語等(単語等)を辞書に追加
する。この結果、応答文を聞いたユーザは、その応答文
中に含まれる単語を用いて新たに問い合わせをすること
が可能になる。
図1と図5を参照して説明する。
「神戸市立須磨海浜水族園の説明は。」と発声したとす
る。この時点では、「何」(なん、なに)、「では」、
「神戸」、「東京」、「須磨」、「都」、「県」、
「の」、「にある」、「のいる」、「のいる」、「につ
いて」、「水族館」、「水族園」、「ゴルフ場」、「説
明」、「は」(わ)、「を知りたい」、「教えて」、
「ええ」、「うん」、「ありがとう」などは認識可能語
彙であり、「平方m」、「ラッコ」などは認識不可能で
あるとする。
て、この質問に対する合成文が、図4の手順(2)のよ
うに、「神戸市立須磨…ラッコ館など7館が点在。」と
生成される。この合成文は、ステップS11の合成文生
成部に送られ、文法/単語辞書7を用いて、単語に分割
され、品詞や読みなどの単語情報が付与される。
み=「こーべ」)「水族園」(品詞=「名詞」、読み=
「すいぞくえん」)、…、「平方m」(品詞=「接尾
辞」、読み=「へーほーめーとる」)、「ラッコ」(品
詞=「名詞」、読み=「らっこ」)のようになる。
接尾辞などが追加辞書5に追加される。ここでは、「平
方m」、「敷地」、「ラッコ」が追加辞書5に追加さ
れ、新たに認識可能となる。次に、ステップS12によ
って、音声合成出力が開始される。今、システムが図5
(2)のように、「神戸市立須磨海浜水族館の説明
は、」と出力した時点で、ユーザが「うん」もしくは
「はい」と発声したとする。すると、ステップS13に
よって音声入力が存在すると判定され、ステップS19
によって、音声合成出力が一時中断され、ステップS2
0によって、ユーザの音声入力が認識される。次に、ス
テップS21によって、認識結果「うん」が合成文中の
単語かどうか判定される。
ないので、ステップS22に移り、認識結果が「え
え」、「うん」などの相槌かどうか判定し、ステップS
24に移る。認識結果が相槌でなければ、ステップS1
7に移る。
頭や文節の先頭などの区切りの良い位置を捜し、ステッ
プS12に移って、図5の手順(4)のように「240
0平方mの敷地に水族館本館、…」と、音声出力が継続
される。ここで、ユーザが「何平方m](なんへいほう
めーとる)と聞き返すと、ステップS13によって、音
声合成出力が一時中断され、ステップS20によって、
ユーザの音声入力が「何」+「平方m」と認識される。
ステップS21によって、この認識結果が合成文中の単
語を含むかどうかが判定される。ここでは、「平方m」
が合成文中の単語であるので、ステップS23に移り、
合成文中の位置を探し、図5の手順(6)のように文節
などの区切りの良い位置から、ステップS12によって
「2400平方mの敷地に…が点在。」と、音声出力が
継続される。
を経て、ステップS15に移り、ユーザの次の発声を受
け付ける。いま、図5の手順(7)のように「では、ゴ
ルフ場について教えて。」と、ユーザが発声したとす
る。すると、ステップS17によって、この発声は「水
族館」から「ゴルフ場」に話題を変えるものであると判
定され、ステップS18によって「平方m」、「水族
館」、「ラッコ」が追加辞書5から削除される。
の画面上に表示される。
時音声入力を受け付ける音声認識手段と、音声入力に対
する応答を音声で出力する音声合成手段と、入力/出力
を管理する対話管理手段と、対話状況を表示する表示手
段と、対話管理手段で生成する応答文を音声合成手段で
単語に分割し、品詞や読みやアクセントやその他の単語
情報を、追加辞書等の認識辞書に追加して音声認識手段
に送り、その単語を新たに認識語彙に加える手段と、生
成する応答文の音声合成による応答を、ユーザの音声入
力の認識結果に応じてコントロールする手段と、ユーザ
からの音声入力期間中は、音声応答出力を一時中断する
手段と、応答文の出力をコントロールする手段として、
ユーザの音声入力によって音声応答出力が一時中断され
た時間から見ていき、前方または後方に、ユーザが音声
入力した単語を含む場合、その文節または文の文頭など
の区切りの良いところから音声出力を再開する手段と、
ユーザの発した内容が、過去の対話内容と同一であると
きは追加辞書は変更せず、同一でなく内容に変更があっ
たときは、追加辞書を更新する手段とを有することによ
り、システムが音声合成出力した単語を含む文をユーザ
が発生すると、システムがその単語を音声認識できて、
ユーザとシステムとの対話が自然になる。
システムに適用しても、1つの機器から成る装置に適用
しても良い。また、本発明は、システム或は装置にプロ
グラムを供給することによって達成される場合にも適用
できることは言うまでもない。
声入力による対話をスムースに、しかも自然に行うこと
が可能になる。する情報処理装置及びその制御方法を提
供しようとするものである。
れ図である。
装置の構成の一例を示すブロック図である。
示す図である。
る。
る。
Claims (2)
- 【請求項1】 合成文に基づいて合成音声を出力する出
力手段と、 音声を入力する音声入力手段と、 前記出力手段による合成音声の出力中に前記音声入力手
段により音声の入力があった場合、前記合成音声の出力
を中断し、該入力された音声を認識する認識手段と、 前記認識手段による認識結果の単語が前記合成文に含ま
れる場合、該認識結果の単語を含む文節位置から合成音
声の出力を継続するよう制御する出力制御手段と を有す
ることを特徴とする情報処理装置。 - 【請求項2】 合成文に基づいて合成音声を出力する出
力工程と、 音声を入力する音声入力工程と、 前記出力工程による合成音声の出力中に前記音声入力工
程により音声の入力があった場合、前記合成音声の出力
を中断し、該入力された音声を認識する認識工程と、 前記認識工程による認識結果の単語が前記合成文に含ま
れる場合、該認識結果の単語を含む文節位置から合成音
声の出力を継続するよう制御する出力制御工程と を有す
ることを特徴とする情報処理装置の制御方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP28325894A JP3513232B2 (ja) | 1994-11-17 | 1994-11-17 | 情報処理装置及びその制御方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP28325894A JP3513232B2 (ja) | 1994-11-17 | 1994-11-17 | 情報処理装置及びその制御方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH08146989A JPH08146989A (ja) | 1996-06-07 |
| JP3513232B2 true JP3513232B2 (ja) | 2004-03-31 |
Family
ID=17663131
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP28325894A Expired - Fee Related JP3513232B2 (ja) | 1994-11-17 | 1994-11-17 | 情報処理装置及びその制御方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3513232B2 (ja) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08146991A (ja) * | 1994-11-17 | 1996-06-07 | Canon Inc | 情報処理装置及びその制御方法 |
| JP3489772B2 (ja) * | 1996-11-07 | 2004-01-26 | 株式会社リコー | 作業支援システム |
| JP2001034292A (ja) * | 1999-07-26 | 2001-02-09 | Denso Corp | 単語列認識装置 |
| JP4413486B2 (ja) * | 2002-10-24 | 2010-02-10 | 株式会社ピートゥピーエー | 家電制御装置、家電制御方法及びプログラム |
| JP2013167806A (ja) * | 2012-02-16 | 2013-08-29 | Toshiba Corp | 情報通知支援装置、情報通知支援方法、および、プログラム |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06100959B2 (ja) * | 1985-08-16 | 1994-12-12 | 株式会社東芝 | 音声対話装置 |
| JPS62105198A (ja) * | 1985-10-31 | 1987-05-15 | 富士通株式会社 | 音声出力制御方式 |
| JPH0831021B2 (ja) * | 1986-10-13 | 1996-03-27 | 日本電信電話株式会社 | 音声ガイダンス出力制御方法 |
| JPH02103599A (ja) * | 1988-10-13 | 1990-04-16 | Ricoh Co Ltd | 音声認識装置 |
| JPH05216618A (ja) * | 1991-11-18 | 1993-08-27 | Toshiba Corp | 音声対話システム |
| JP3378595B2 (ja) * | 1992-09-30 | 2003-02-17 | 株式会社日立製作所 | 音声対話システムおよびその対話進行制御方法 |
| JP3278222B2 (ja) * | 1993-01-13 | 2002-04-30 | キヤノン株式会社 | 情報処理方法及び装置 |
| JPH08146991A (ja) * | 1994-11-17 | 1996-06-07 | Canon Inc | 情報処理装置及びその制御方法 |
-
1994
- 1994-11-17 JP JP28325894A patent/JP3513232B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH08146989A (ja) | 1996-06-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7096183B2 (en) | Customizing the speaking style of a speech synthesizer based on semantic analysis | |
| JP2009169139A (ja) | 音声認識装置 | |
| JPH10507536A (ja) | 言語認識 | |
| JP2006517037A (ja) | 韻律的模擬語合成方法および装置 | |
| JP2002511154A (ja) | ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム | |
| JP2001209662A (ja) | 情報処理装置および情報処理方法、並びに記録媒体 | |
| JP3384646B2 (ja) | 音声合成装置及び読み上げ時間演算装置 | |
| JPH08146991A (ja) | 情報処理装置及びその制御方法 | |
| JP2000267687A (ja) | 音声応答装置 | |
| JP3513232B2 (ja) | 情報処理装置及びその制御方法 | |
| JP3378595B2 (ja) | 音声対話システムおよびその対話進行制御方法 | |
| JP3518898B2 (ja) | 音声合成装置 | |
| JPH08263092A (ja) | 応答音声生成方法および音声対話システム | |
| JP2844817B2 (ja) | 発声練習用音声合成方式 | |
| US5897617A (en) | Method and device for preparing and using diphones for multilingual text-to-speech generating | |
| JPH08335096A (ja) | テキスト音声合成装置 | |
| JP3437064B2 (ja) | 音声合成装置 | |
| JP3465334B2 (ja) | 音声対話装置及び音声対話方法 | |
| JP4260071B2 (ja) | 音声合成方法、音声合成プログラム及び音声合成装置 | |
| JP3575919B2 (ja) | テキスト音声変換装置 | |
| JPH07200554A (ja) | 文章読み上げ装置 | |
| JP2007286376A (ja) | 音声案内システム | |
| JP3034554B2 (ja) | 日本語文章読上げ装置及び方法 | |
| JPH1063287A (ja) | 発音訓練装置 | |
| JP3192981B2 (ja) | テキスト音声合成装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20031215 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040109 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090116 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090116 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100116 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110116 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120116 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130116 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140116 Year of fee payment: 10 |
|
| LAPS | Cancellation because of no payment of annual fees |