JPH08146989A - 情報処理装置及びその制御方法 - Google Patents
情報処理装置及びその制御方法Info
- Publication number
- JPH08146989A JPH08146989A JP6283258A JP28325894A JPH08146989A JP H08146989 A JPH08146989 A JP H08146989A JP 6283258 A JP6283258 A JP 6283258A JP 28325894 A JP28325894 A JP 28325894A JP H08146989 A JPH08146989 A JP H08146989A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- output
- voice input
- voice
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
然に行うことを可能にする。 【構成】 マイク1から入力された音声をA/D変換部
2を介してデジタル信号にした後、音声認識部3で認識
する。この認識した結果に基づく応答文を作成し、それ
を音声合成部6で音声信号にすると共に、それを表示部
8に表示する。このとき、生成した応答文中の語彙を追
加辞書5に追加し、次の音声入力時の音声認識に対処す
る。
Description
御方法、詳しくは音声入力された問い合わせに対して応
答する情報処理装置及びその制御方法に関する。
なってきた。
内応を説明する。
(1)のように発生したとする。マイクに入力された音
声は、A/D変換処理を行い、アナログ信号からディジ
タル信号に変換され、そのディジタル信号は所定の辞書
を用いて認識され、日本語文に変換される。次に、この
日本語文の解釈処理を行い、例えばそれに対応する図3
(2)のような応答文が作成される。この応答文は、単
語に分割され、読みとアクセントが付加され、音韻パラ
メータと韻律パラメータとのディジタル信号に変換され
る。こうして得られた信号をD/A変換処理を行い、ア
ナログ信号に変換し、スピーカ等から音声として出力す
る。
返しによ、ユーザとシステムとの対話が行なわれてい
た。
は、話し手が説明しているとき、聞き手は、その説明に
関する単語を用いて問い返すことが多い。しかし、上述
した従来の音声対話方式では、システムが音声合成出力
した単語を含む文をユーザが発生しても、システムがそ
の単語を音声認識できず、対話が不自然になるという問
題点があった。
り、音声入力による対話をスムースに、しかも自然に行
うことを可能にする情報処理装置及びその制御方法を提
供しようとするものである。
情報処理装置は以下の構成を備える。すなわち、音声入
力手段と、音声認識手段と、前記音声入力手段に対して
応答する出力手段を備えた情報処理装置において、前記
音声入力手段から入力された音声を認識し、音声入力に
対応得る文を生成する文生成手段と、該文生成手段で生
成された文に対応する出力文を構成し、前記出力手段を
制御して外部に出力する出力制御手段と、該出力制御手
段で出力した文中の新たに発生した語彙を所定の辞書に
追加する追加手段とを備え、前記音声入力手段で入力さ
れた音声を認識するとき、前記追加手段で追加された辞
書を認識処理の参照辞書として使用する。
前記出力手段は、音声出力手段及び対話文を表示する表
示手段の両方を含むことが望ましい。これによって、入
力文と応答文の両方が表示されるので、音声出力された
内容を確実に確認することが可能になる。
入力に対する応答文を出力中に、前記音声入力手段から
ユーザからの音声入力を検出したとき、当該出力手段を
中断し、出力中であった応答文の中断位置から、区切り
位置を検索し、当該検索位置から出力を継続する手段を
備えることが望ましい。これによって、応答文を出力中
に所定の発声、例えば「うん」を発生することで、必要
な箇所から情報を即座に得ることが可能になる。
に基づく文が、従前の会話内容と関連しない場合、前記
追加手段による前記所定の辞書をリフレッシュする手段
を備えることが望ましい。これによって、対話の首題が
切り替わったと判断し、辞書の肥大化を防ぐと共に、新
たな首題にのみ対応する応答が可能になる。
を詳細に説明する。
の構成を示すブロック図である。この装置は、マイク1
と、A/D変換部2と、音声認識部3と、音声認識用の
文法/単語辞書4と、追加辞書5と、音声合成部6と、
音声合成用の文法/単語辞書7と、表示部8と、対話管
理部9と、D/A変換部10と、スピーカ11とから、
その主要部が構成されている。また、CPU13は本装
置全体の制御を司り、内部の主メモリに記憶されている
プログラムに従って動作し、処理部として機能する。
説明する。尚、同処理内容に係るプログラムはCPU1
3の主メモリに格納されている。
理は、合成文を生成するステップS11、音声合成の出
力を開始または継続するステップS12、音声入力が存
在するかどうかを判定するステップS13、音声合成出
力が終了したかどうかを判定するステップS14、ユー
ザの次入力を受け付けるステップS15、ユーザの音声
入力を認識するステップS16、ユーザの次入力内容が
話題を変えるものかどうかを判定するステップS17、
追加辞書をクリアするステップS18、音声合成出力を
一時中断するステップS19、ユーザの音声入力を認識
するステップS20、認識結果が合成文中の単語を文む
かどうか判定するステップS21、認識結果が「ええ」
「うん」などの相槌かどうかを判定するステップS2
2、合成文の出力開始位置を探すステップS23、合成
文中の文節の頭などの合成開始位置として切りの良い位
置を探すステップS24と、良好案内システムなどのア
プリケーションにおいて、対話管理を行なうステップS
25とを備える。
声対話方式の動作について、図1および図4を参照しな
がら説明する。
(1)のように「神戸市立須磨海浜水族園の説明は。」
と発声したとする。
京」、「須磨」、「都」、「県」、「の」、「にあ
る」、「のいる」、「水族館」、「水族園」、「説
明」、「は」(わ)、「を知りたい」、「ええ」、「う
ん」、「ありがとう」などは認識語としてあらかじめ登
録されている認識可能語彙であり、「平方m」、「ラッ
コ」などは認識不可能であるとする。
問に対する合成文が、図4の手順(2)のように、「神
戸市立須磨…ラッコ館など7館が点在。」と生成され
る。
文法/単語辞書7を用いて、単語に分割され、品詞や読
みなどの単語情報が付与される。ここでは、「神戸」
(品詞=「名詞」、読み=「こーべ」)「水族園」(品
詞=「名詞」、読み=「すいぞくえん」)、…、「平方
m」(品詞=「接尾辞」、読み=「へーほーめーと
る」)、「ラッコ」(品詞=「名詞」、読み=「らっ
こ」)のようになる。
接尾辞などが追加辞書5に追加される。ここでは、「平
方m」、「敷地」、「ラッコ」が追加辞書5に追加さ
れ、新たに認識可能となる。
出力が開始される。ステップS14まで進んで、音声合
成出力が終了したと判定されると、ステップS15によ
って、ユーザの次の入力が受け付けられる。ここでは、
図4の手順(3)のように、ユーザ化「東京都にあるラ
ッコのいる水族館を知りたい。」と発生したとする。こ
の発生中にある「東京」、「都」、「にある」、「ラッ
コ」、「のいる」、「水族館」、「を知りたい」、など
の単語はすべて認識可能なので、この発生は、ステップ
S16によって、文法/単語辞書4と追加辞書5を用い
て認識される。次に、ステップS17によって、この発
生が話題を変更するものかどうか判定される。現時点の
話題は「水族館」なので、この発生は話題を変更するも
のではない。従って、ステップS25に移り、この発生
の内容が解釈され、それに対応する応答文が、図4の手
順(4)のように「サンシャイン国際水族館です。」と
生成される。ここで、生成された応答文は、ステップS
11に送られる。さらに、ステップS15まで進んで、
ユーザの次の入力が受け付けられる。ここで、ユーザが
図4の手順(5)のように「ありがとう。」と発生する
と、ステップS16で音声認識され、ステップS17を
経て、ステップS25で対話の終了であると判定され、
対話が終了する。
の画面上に表示される。
ーザの問い合わせに対する応答文を出力するとき、その
応答文中に含まれる各自立語等(単語等)を辞書に追加
する。この結果、応答文を聞いたユーザは、その応答文
中に含まれる単語を用いて新たに問い合わせをすること
が可能になる。
図1と図5を参照して説明する。
「神戸市立須磨海浜水族園の説明は。」と発声したとす
る。この時点では、「何」(なん、なに)、「では」、
「神戸」、「東京」、「須磨」、「都」、「県」、
「の」、「にある」、「のいる」、「のいる」、「につ
いて」、「水族館」、「水族園」、「ゴルフ場」、「説
明」、「は」(わ)、「を知りたい」、「教えて」、
「ええ」、「うん」、「ありがとう」などは認識可能語
彙であり、「平方m」、「ラッコ」などは認識不可能で
あるとする。
て、この質問に対する合成文が、図4の手順(2)のよ
うに、「神戸市立須磨…ラッコ館など7館が点在。」と
生成される。この合成文は、ステップS11の合成文生
成部に送られ、文法/単語辞書7を用いて、単語に分割
され、品詞や読みなどの単語情報が付与される。
み=「こーべ」)「水族園」(品詞=「名詞」、読み=
「すいぞくえん」)、…、「平方m」(品詞=「接尾
辞」、読み=「へーほーめーとる」)、「ラッコ」(品
詞=「名詞」、読み=「らっこ」)のようになる。
接尾辞などが追加辞書5に追加される。ここでは、「平
方m」、「敷地」、「ラッコ」が追加辞書5に追加さ
れ、新たに認識可能となる。次に、ステップS12によ
って、音声合成出力が開始される。今、システムが図5
(2)のように、「神戸市立須磨海浜水族館の説明
は、」と出力した時点で、ユーザが「うん」もしくは
「はい」と発生したとする。すると、ステップS13に
よって音声入力が存在すると判定され、ステップS19
によって、音声合成出力が一時中断され、ステップS2
0によって、ユーザの音声入力が認識される。次に、ス
テップS21によって、認識結果「うん」が合成文中の
単語かどうか判定される。
ないので、ステップS22に移り、認識結果が「え
え」、「うん」などの相槌かどうか判定し、ステップS
24に移る。認識結果が相槌でなければ、ステップS1
7に移る。
頭や文節の先頭などの区切りの良い位置を捜し、ステッ
プS12に移って、図5の手順(4)のように「240
0平方mの敷地に水族館本館、…」と、音声出力が継続
される。ここで、ユーザが「何平方m](なんへいほう
めーとる)と聞き返すと、ステップS13によって、音
声合成出力が一時中断され、ステップS20によって、
ユーザの音声入力が「何」+「平方m」と認識される。
ステップS21によって、この認識結果が合成文中の単
語を含むかどうかが判定される。ここでは、「平方m」
が合成文中の単語であるので、ステップS23に移り、
合成文中の位置を探し、図5の手順(6)のように文節
などの区切りの良い位置から、ステップS12によって
「2400平方mの敷地に…が点在。」と、音声出力が
継続される。
経て、ステップS15に移り、ユーザの次の発声を受け
付ける。いま、図5の手順(7)のように「では、ゴル
フ場について教えて。」と、ユーザが発生したとする。
すると、ステップS17によって、この発生は「水族
館」から「ゴルフ場」に話題を変えるものであると判定
され、ステップS18によって「平方m」、「水族
園」、「ラッコ」が追加辞書5から削除される。
の画面上に表示される。
時音声入力を受け付ける音声認識手段と、音声入力に対
する応答を音声で出力する音声合成手段と、入力/出力
を管理する対話管理手段と、対話状況を表示する表示手
段と、対話管理手段で生成する応答文を音声合成手段で
単語に分割し、品詞や読みやアクセントやその他の単語
情報を、追加辞書等の認識辞書に追加して音声認識手段
に送り、その単語を新たに認識語彙に加える手段と、生
成する応答文の音声合成による応答を、ユーザの音声入
力の認識結果に応じてコントロールする手段と、ユーザ
からの音声入力期間中は、音声応答出力を一時中断する
手段と、応答文の出力をコントロールする手段として、
ユーザの音声入力によって音声応答出力が一時中断され
た時間から見ていき、前方または後方に、ユーザが音声
入力した単語を含む場合、その文節または文の文頭など
の区切りの良いところから音声出力を再開する手段と、
ユーザの発した内容が、過去の対話内容と同一であると
きは追加辞書は変更せず、同一でなく内容に変更があっ
たときは、追加辞書を更新する手段とを有することによ
り、システムが音声合成出力した単語を含む文をユーザ
が発生すると、システムがその単語を音声認識できて、
ユーザとシステムとの対話が自然になる。
システムに適用しても、1つの機器から成る装置に適用
しても良い。また、本発明は、システム或は装置にプロ
グラムを供給することによって達成される場合にも適用
できることは言うまでもない。
声入力による対話をスムースに、しかも自然に行うこと
が可能になる。する情報処理装置及びその制御方法を提
供しようとするものである。
れ図である。
装置の構成の一例を示すブロック図である。
示す図である。
る。
る。
Claims (8)
- 【請求項1】 音声入力手段と、音声認識手段と、前記
音声入力手段に対して応答する出力手段を備えた情報処
理装置において、 前記音声入力手段から入力された音声を認識し、音声入
力に対応得る文を生成する文生成手段と、 該文生成手段で生成された文に対応する出力文を構成
し、前記出力手段を制御して外部に出力する出力制御手
段と、 該出力制御手段で出力した文中の新たに発生した語彙を
所定の辞書に追加する追加手段とを備え、 前記音声入力手段で入力された音声を認識するとき、前
記追加手段で追加された辞書を認識処理の参照辞書とし
て使用することを特徴とする情報処理装置。 - 【請求項2】 前記出力手段は、音声出力手段及び対話
文を表示する表示手段の両方を含むことを特徴とする請
求項第1項に記載の情報処理装置。 - 【請求項3】 前記出力手段で、ユーザからの音声入力
に対する応答文を出力中に、前記音声入力手段からユー
ザからの音声入力を検出したとき、当該出力手段を中断
し、出力中であった応答文の中断位置から、区切り位置
を検索し、当該検索位置から出力を継続する手段を備え
ることを特徴とする請求項第1項に記載の情報処理装
置。 - 【請求項4】 前記音声入力手段で入力された音声に基
づく文が、従前の会話内容と関連しない場合、前記追加
手段による前記所定の辞書をリフレッシュする手段を備
えることを特徴とする請求項第1項に記載の情報処理装
置。 - 【請求項5】 音声入力手段と、音声認識手段と、前記
音声入力手段に対して応答する出力手段を備えた情報処
理装置の制御方法において、 前記音声入力手段から入力された音声を認識し、音声入
力に対応得る文を生成する文生成工程と、 該文生成工程で生成された文に対応する出力文を構成
し、前記出力手段を制御して外部に出力する出力制御工
程と、 該出力制御工程で出力した文中の新たに発生した語彙を
所定の辞書に追加する追加工程とを備え、 前記音声入力手段で入力された音声を認識するとき、前
記追加工程で追加された辞書を認識処理の参照辞書とし
て使用することを特徴とする情報処理装置の制御方法。 - 【請求項6】 前記出力手段は、音声出力手段及び対話
文を表示する表示手段の両方を含むことを特徴とする請
求項第5項に記載の情報処理装置の制御方法。 - 【請求項7】 前記出力手段で、ユーザからの音声入力
に対する応答文を出力中に、前記音声入力手段からユー
ザからの音声入力を検出したとき、当該出力手段を中断
し、出力中であった応答文の中断位置から、区切り位置
を検索し、当該検索位置から出力を継続する工程を備え
ることを特徴とする請求項第5項に記載の情報処理装置
の制御方法。 - 【請求項8】 前記音声入力手段で入力された音声に基
づく文が、従前の会話内容と関連しない場合、前記追加
工程による前記所定の辞書をリフレッシュする工程を備
えることを特徴とする請求項第5項に記載の情報処理装
置の制御方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP28325894A JP3513232B2 (ja) | 1994-11-17 | 1994-11-17 | 情報処理装置及びその制御方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP28325894A JP3513232B2 (ja) | 1994-11-17 | 1994-11-17 | 情報処理装置及びその制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08146989A true JPH08146989A (ja) | 1996-06-07 |
JP3513232B2 JP3513232B2 (ja) | 2004-03-31 |
Family
ID=17663131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP28325894A Expired - Fee Related JP3513232B2 (ja) | 1994-11-17 | 1994-11-17 | 情報処理装置及びその制御方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3513232B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08146991A (ja) * | 1994-11-17 | 1996-06-07 | Canon Inc | 情報処理装置及びその制御方法 |
JPH10143187A (ja) * | 1996-11-07 | 1998-05-29 | Ricoh Co Ltd | 作業支援システム |
JP2001034292A (ja) * | 1999-07-26 | 2001-02-09 | Denso Corp | 単語列認識装置 |
JP2004144993A (ja) * | 2002-10-24 | 2004-05-20 | P To Pa:Kk | 家電制御装置、家電制御方法及びプログラム |
JP2013167806A (ja) * | 2012-02-16 | 2013-08-29 | Toshiba Corp | 情報通知支援装置、情報通知支援方法、および、プログラム |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6240577A (ja) * | 1985-08-16 | 1987-02-21 | Toshiba Corp | 音声対話装置 |
JPS62105198A (ja) * | 1985-10-31 | 1987-05-15 | 富士通株式会社 | 音声出力制御方式 |
JPS6395532A (ja) * | 1986-10-13 | 1988-04-26 | Nippon Telegr & Teleph Corp <Ntt> | 音声ガイダンス出力制御方法 |
JPH02103599A (ja) * | 1988-10-13 | 1990-04-16 | Ricoh Co Ltd | 音声認識装置 |
JPH05216618A (ja) * | 1991-11-18 | 1993-08-27 | Toshiba Corp | 音声対話システム |
JPH06110835A (ja) * | 1992-09-30 | 1994-04-22 | Hitachi Ltd | 音声対話システムおよびその対話進行制御方法 |
JPH06208389A (ja) * | 1993-01-13 | 1994-07-26 | Canon Inc | 情報処理方法及び装置 |
JPH08146991A (ja) * | 1994-11-17 | 1996-06-07 | Canon Inc | 情報処理装置及びその制御方法 |
-
1994
- 1994-11-17 JP JP28325894A patent/JP3513232B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6240577A (ja) * | 1985-08-16 | 1987-02-21 | Toshiba Corp | 音声対話装置 |
JPS62105198A (ja) * | 1985-10-31 | 1987-05-15 | 富士通株式会社 | 音声出力制御方式 |
JPS6395532A (ja) * | 1986-10-13 | 1988-04-26 | Nippon Telegr & Teleph Corp <Ntt> | 音声ガイダンス出力制御方法 |
JPH02103599A (ja) * | 1988-10-13 | 1990-04-16 | Ricoh Co Ltd | 音声認識装置 |
JPH05216618A (ja) * | 1991-11-18 | 1993-08-27 | Toshiba Corp | 音声対話システム |
JPH06110835A (ja) * | 1992-09-30 | 1994-04-22 | Hitachi Ltd | 音声対話システムおよびその対話進行制御方法 |
JPH06208389A (ja) * | 1993-01-13 | 1994-07-26 | Canon Inc | 情報処理方法及び装置 |
JPH08146991A (ja) * | 1994-11-17 | 1996-06-07 | Canon Inc | 情報処理装置及びその制御方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08146991A (ja) * | 1994-11-17 | 1996-06-07 | Canon Inc | 情報処理装置及びその制御方法 |
JPH10143187A (ja) * | 1996-11-07 | 1998-05-29 | Ricoh Co Ltd | 作業支援システム |
JP2001034292A (ja) * | 1999-07-26 | 2001-02-09 | Denso Corp | 単語列認識装置 |
JP2004144993A (ja) * | 2002-10-24 | 2004-05-20 | P To Pa:Kk | 家電制御装置、家電制御方法及びプログラム |
JP2013167806A (ja) * | 2012-02-16 | 2013-08-29 | Toshiba Corp | 情報通知支援装置、情報通知支援方法、および、プログラム |
US10068575B2 (en) | 2012-02-16 | 2018-09-04 | Kabushiki Kaisha Toshiba | Information notification supporting device, information notification supporting method, and computer program product |
Also Published As
Publication number | Publication date |
---|---|
JP3513232B2 (ja) | 2004-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6801897B2 (en) | Method of providing concise forms of natural commands | |
US9484030B1 (en) | Audio triggered commands | |
EP3387646B1 (en) | Text-to-speech processing system and method | |
US7096183B2 (en) | Customizing the speaking style of a speech synthesizer based on semantic analysis | |
TWI281146B (en) | Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition | |
US7966186B2 (en) | System and method for blending synthetic voices | |
JP2009169139A (ja) | 音声認識装置 | |
US20210210100A1 (en) | Voice command processing for locked devices | |
JP2002511154A (ja) | ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム | |
JPH10507536A (ja) | 言語認識 | |
JP3278222B2 (ja) | 情報処理方法及び装置 | |
JP2006517037A (ja) | 韻律的模擬語合成方法および装置 | |
JP3605682B2 (ja) | 音声入力制御装置 | |
US11798559B2 (en) | Voice-controlled communication requests and responses | |
JPH08146991A (ja) | 情報処理装置及びその制御方法 | |
US10143027B1 (en) | Device selection for routing of communications | |
JP2000267687A (ja) | 音声応答装置 | |
JPH08339288A (ja) | 情報処理装置及びその制御方法 | |
JP3513232B2 (ja) | 情報処理装置及びその制御方法 | |
JP3378595B2 (ja) | 音声対話システムおよびその対話進行制御方法 | |
JP2001272991A (ja) | 音声対話方法及び音声対話装置 | |
JP3518898B2 (ja) | 音声合成装置 | |
JP2007286376A (ja) | 音声案内システム | |
JPH08263092A (ja) | 応答音声生成方法および音声対話システム | |
US20200296784A1 (en) | Routing of communications to a device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20031215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040109 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090116 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090116 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100116 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110116 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120116 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130116 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140116 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |