JPH05173589A - 音声認識応答装置 - Google Patents
音声認識応答装置Info
- Publication number
- JPH05173589A JPH05173589A JP4139390A JP13939092A JPH05173589A JP H05173589 A JPH05173589 A JP H05173589A JP 4139390 A JP4139390 A JP 4139390A JP 13939092 A JP13939092 A JP 13939092A JP H05173589 A JPH05173589 A JP H05173589A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- voice
- response
- input
- answer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】
【目的】人間と機械との間の自然で円滑な対話を可能と
して効果的な音声入力による情報処理を可能ならしめる
実用性の高い音声認識応答装置を提供する。 【構成】音声認識部13で入力音声を認識し、この認識
結果に対する応答文を音声応答出力部18から音声出力
する音声認識応答装置において、入力音声の発話速度を
測定する発話速度測定器16と、同一の意味を表わす応
答文について文字数の異なる表現形式を予め用意し、発
話速度測定器16により測定された発話速度に応じて音
声応答出力部18から音声出力される応答文の表現形式
を制御する音声応答制御部17とを備えた音声認識応答
装置。
して効果的な音声入力による情報処理を可能ならしめる
実用性の高い音声認識応答装置を提供する。 【構成】音声認識部13で入力音声を認識し、この認識
結果に対する応答文を音声応答出力部18から音声出力
する音声認識応答装置において、入力音声の発話速度を
測定する発話速度測定器16と、同一の意味を表わす応
答文について文字数の異なる表現形式を予め用意し、発
話速度測定器16により測定された発話速度に応じて音
声応答出力部18から音声出力される応答文の表現形式
を制御する音声応答制御部17とを備えた音声認識応答
装置。
Description
【0001】
【産業上の利用分野】本発明は音声入力による情報処理
システムに用いられる音声認識応答装置に関する。
システムに用いられる音声認識応答装置に関する。
【0002】
【従来の技術】近時、音声認識技術や音声合成技術の発
達が目覚ましく、例えば連続音声認識や不特定話者を対
象とした音声認識が可能となり、また線形予測符号化法
を用いた精度の高い音声合成が可能となっている。また
文章を音声に変換する為の規則合成法に関しても、盛ん
に研究開発されている。
達が目覚ましく、例えば連続音声認識や不特定話者を対
象とした音声認識が可能となり、また線形予測符号化法
を用いた精度の高い音声合成が可能となっている。また
文章を音声に変換する為の規則合成法に関しても、盛ん
に研究開発されている。
【0003】このような技術を用いて、例えば電話公衆
回線を利用した各種のサービスを行う電話音声応答サー
ビスシステムや、銀行等におけるオンライン業務システ
ムの開発が試行されており、その有用性が注目されてい
る。
回線を利用した各種のサービスを行う電話音声応答サー
ビスシステムや、銀行等におけるオンライン業務システ
ムの開発が試行されており、その有用性が注目されてい
る。
【0004】
【発明が解決しようとする課題】ところが、この種のシ
ステムの利用者は不特定多数であり、例えば老人や子供
等の不慣れな人、あるいは1日に何回となく利用する人
が存在する。これにも拘らず、従来装置にあっては、そ
の音声応答の内容が一様であり、またその発話速度も一
定であるため、人間と機械との対話が円滑になされてい
なかった。つまり応答が冗長で苛立たしさが生じたり、
或いは応答が分かり難いという問題が生じた。
ステムの利用者は不特定多数であり、例えば老人や子供
等の不慣れな人、あるいは1日に何回となく利用する人
が存在する。これにも拘らず、従来装置にあっては、そ
の音声応答の内容が一様であり、またその発話速度も一
定であるため、人間と機械との対話が円滑になされてい
なかった。つまり応答が冗長で苛立たしさが生じたり、
或いは応答が分かり難いという問題が生じた。
【0005】本発明はこのような事情を考慮してなされ
たもので、その目的とするところは人間と機械との間の
自然で円滑な対話を可能として効果的な音声入力による
情報処理を可能ならしめる実用性の高い音声認識応答装
置を提供することにある。
たもので、その目的とするところは人間と機械との間の
自然で円滑な対話を可能として効果的な音声入力による
情報処理を可能ならしめる実用性の高い音声認識応答装
置を提供することにある。
【0006】
【課題を解決するための手段】本発明は、入力音声を認
識し、この認識結果に対する応答文を音声出力する音声
認識応答装置において、前記入力音声の発話速度を測定
する測定手段と、同一の意味を表わす応答文について文
字数の異なる表現形式を予め用意し、前記測定手段によ
り測定された発話速度に応じて前記応答文の表現形式を
制御する制御手段とを備えたことを特徴とする。
識し、この認識結果に対する応答文を音声出力する音声
認識応答装置において、前記入力音声の発話速度を測定
する測定手段と、同一の意味を表わす応答文について文
字数の異なる表現形式を予め用意し、前記測定手段によ
り測定された発話速度に応じて前記応答文の表現形式を
制御する制御手段とを備えたことを特徴とする。
【0007】
【作用】このように本発明では、入力音声の発話速度に
応じて、応答文の表現形式を形御することにより、音声
入力者に対して適切な応答を与えることが可能となる。
例えば利用頻度の高い人に対しては文字数の少ない簡潔
な応答を与え、また利用頻度の低い人に対しては文字数
の多い丁寧な応答を与えることによって、音声入力の適
切な指示を与えることが可能となり、対話の自然性、円
滑性を十分に高めることができる。
応じて、応答文の表現形式を形御することにより、音声
入力者に対して適切な応答を与えることが可能となる。
例えば利用頻度の高い人に対しては文字数の少ない簡潔
な応答を与え、また利用頻度の低い人に対しては文字数
の多い丁寧な応答を与えることによって、音声入力の適
切な指示を与えることが可能となり、対話の自然性、円
滑性を十分に高めることができる。
【0008】
【実施例】以下、図面を参照して本発明の実施例につき
説明する。図1は、本発明の実施例に係る音声認識応答
装置の概略構成図である。この装置は、入力音声の発話
速度を検出して、応答文の内容自体を変えるようにした
もである。即ち、入力音声は分析器11を介して分析さ
れ、この分析により得られた音声パターンが音声パター
ンメモリ12に格納される。この音声パターンに対し
て、音声認識部13は辞書メモリ14に登録された音声
辞書を参照して認識を行っている。
説明する。図1は、本発明の実施例に係る音声認識応答
装置の概略構成図である。この装置は、入力音声の発話
速度を検出して、応答文の内容自体を変えるようにした
もである。即ち、入力音声は分析器11を介して分析さ
れ、この分析により得られた音声パターンが音声パター
ンメモリ12に格納される。この音声パターンに対し
て、音声認識部13は辞書メモリ14に登録された音声
辞書を参照して認識を行っている。
【0009】一方、前記入力音声はピッチ抽出器15を
介してそのピッチ周波数成分が抽出されている。このピ
ッチ周波数成分の抽出は、例えばケプストラム法、変形
相関法、ADM法等を用いて、前記入力音声の認識処理
とは独立に行われる。このピッチ周波数の時系列パター
ンの変化から、発話速度測定器16により上記入力音声
の発話速度vが求められている。音声応答制御部17
は、この発話速度vの情報と前記入力音声の認識結果と
を入力して、それに応じた内容の応答文を決定してお
り、これが音声応答出力部18を介して音声出力され
る。
介してそのピッチ周波数成分が抽出されている。このピ
ッチ周波数成分の抽出は、例えばケプストラム法、変形
相関法、ADM法等を用いて、前記入力音声の認識処理
とは独立に行われる。このピッチ周波数の時系列パター
ンの変化から、発話速度測定器16により上記入力音声
の発話速度vが求められている。音声応答制御部17
は、この発話速度vの情報と前記入力音声の認識結果と
を入力して、それに応じた内容の応答文を決定してお
り、これが音声応答出力部18を介して音声出力され
る。
【0010】即ち、音声認識結果とその発話速度に応じ
て、例えば「ありがとう」、「ありがとうございま
す」、「ありがとうございました、またどうぞ」等の同
一意味を表す応答であっても、その表現形式(文字数)
の異なるものの中の一つが選択制御されて音声出力され
る。つまり、音声入力者に応じた内容と速度の音声応答
がなされることになる。従って、音声応答として次の音
声入力指示を与えるような場合、少ない文字数で簡潔に
その指示を与えたり、不慣れな人に対しては多い文字数
で丁寧にその指示を与えたりすることが可能となり、対
話の自然性を高め、処理効率の向上を図ることが可能と
なる。
て、例えば「ありがとう」、「ありがとうございま
す」、「ありがとうございました、またどうぞ」等の同
一意味を表す応答であっても、その表現形式(文字数)
の異なるものの中の一つが選択制御されて音声出力され
る。つまり、音声入力者に応じた内容と速度の音声応答
がなされることになる。従って、音声応答として次の音
声入力指示を与えるような場合、少ない文字数で簡潔に
その指示を与えたり、不慣れな人に対しては多い文字数
で丁寧にその指示を与えたりすることが可能となり、対
話の自然性を高め、処理効率の向上を図ることが可能と
なる。
【0011】尚、本発明は上記実施例に限定されるもの
ではない、例えば入力音声の発話速度の測定を母音類似
度やスペクトルの時間的変化を利用して行ったり、数字
の連続発生を認識対象とするときにはそのポーズ時間長
を用いて行うようにすることもできる。その他、音声応
答の制御を、その内容文(表現形式)の制御と共に発話
速度をも制御して行うようにしても良い。また音声の認
識処理や音声合成の方式は、従来より知られて種々の方
式を適宜採用すればよい。要するに本発明は、その要旨
を逸脱しない範囲で種々変形して実施することができ
る。
ではない、例えば入力音声の発話速度の測定を母音類似
度やスペクトルの時間的変化を利用して行ったり、数字
の連続発生を認識対象とするときにはそのポーズ時間長
を用いて行うようにすることもできる。その他、音声応
答の制御を、その内容文(表現形式)の制御と共に発話
速度をも制御して行うようにしても良い。また音声の認
識処理や音声合成の方式は、従来より知られて種々の方
式を適宜採用すればよい。要するに本発明は、その要旨
を逸脱しない範囲で種々変形して実施することができ
る。
【0012】
【発明の効果】このように本発明によれば、音声入力者
の性格を良く反映する音声発話速度を検出し、これに応
じて音声応答の応答文の表現形式(文字数)を制御する
ので、音声入力者との間の対話の自然性を高めることが
できる。この結果、音声入力者に苛立たしさを与える等
の不具合がなくなる等の実用上多大なる効果が奏せられ
る。
の性格を良く反映する音声発話速度を検出し、これに応
じて音声応答の応答文の表現形式(文字数)を制御する
ので、音声入力者との間の対話の自然性を高めることが
できる。この結果、音声入力者に苛立たしさを与える等
の不具合がなくなる等の実用上多大なる効果が奏せられ
る。
【図1】本発明の一実施例に係る音声認識応答装置の概
略構成図である。
略構成図である。
11…分析器 12…音声パター
ンメモリ 13…音声認識部 14…辞書メモリ 15…ピッチ抽出器 16…発話速度測
定器 17…音声応答制御部 18…音声応答出
力部
ンメモリ 13…音声認識部 14…辞書メモリ 15…ピッチ抽出器 16…発話速度測
定器 17…音声応答制御部 18…音声応答出
力部
Claims (1)
- 【請求項1】入力音声を認識し、この認識結果に対する
応答文を音声出力する音声認識応答装置において、 前記入力音声の発話速度を測定する測定手段と、 同一の意味を表わす応答文について文字数の異なる表現
形式を予め用意し、前記測定手段により測定された発話
速度に応じて前記応答文の表現形式を制御する制御手段
とを備えたことを特徴とする音声認識応答装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4139390A JPH0731508B2 (ja) | 1992-05-29 | 1992-05-29 | 音声認識応答装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4139390A JPH0731508B2 (ja) | 1992-05-29 | 1992-05-29 | 音声認識応答装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58091809A Division JPH0721759B2 (ja) | 1983-05-25 | 1983-05-25 | 音声認識応答装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05173589A true JPH05173589A (ja) | 1993-07-13 |
JPH0731508B2 JPH0731508B2 (ja) | 1995-04-10 |
Family
ID=15244190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4139390A Expired - Lifetime JPH0731508B2 (ja) | 1992-05-29 | 1992-05-29 | 音声認識応答装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0731508B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10143187A (ja) * | 1996-11-07 | 1998-05-29 | Ricoh Co Ltd | 作業支援システム |
JP2002221976A (ja) * | 2001-01-24 | 2002-08-09 | Yamaha Corp | 話速検出方法および音声信号処理装置 |
JP2019053473A (ja) * | 2017-09-14 | 2019-04-04 | 日本電信電話株式会社 | 擬似応答送信装置、相づち表現学習装置、情報端末装置、通信システム、擬似応答送信方法、相づち表現学習方法および擬似応答送信プログラム |
-
1992
- 1992-05-29 JP JP4139390A patent/JPH0731508B2/ja not_active Expired - Lifetime
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10143187A (ja) * | 1996-11-07 | 1998-05-29 | Ricoh Co Ltd | 作業支援システム |
JP2002221976A (ja) * | 2001-01-24 | 2002-08-09 | Yamaha Corp | 話速検出方法および音声信号処理装置 |
JP2019053473A (ja) * | 2017-09-14 | 2019-04-04 | 日本電信電話株式会社 | 擬似応答送信装置、相づち表現学習装置、情報端末装置、通信システム、擬似応答送信方法、相づち表現学習方法および擬似応答送信プログラム |
Also Published As
Publication number | Publication date |
---|---|
JPH0731508B2 (ja) | 1995-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7280968B2 (en) | Synthetically generated speech responses including prosodic characteristics of speech inputs | |
US7062439B2 (en) | Speech synthesis apparatus and method | |
WO2007148493A1 (ja) | 感情認識装置 | |
JPH09500223A (ja) | 多言語音声認識システム | |
JPS6147440B2 (ja) | ||
GB2380381A (en) | Speech synthesis method and apparatus | |
Fellbaum et al. | Principles of electronic speech processing with applications for people with disabilities | |
Kethireddy et al. | Mel-weighted single frequency filtering spectrogram for dialect identification | |
JPS6138479B2 (ja) | ||
Fu et al. | A survey on Chinese speech recognition | |
Gilbert et al. | Intelligent virtual agents for contact center automation | |
JPH05173589A (ja) | 音声認識応答装置 | |
Cettolo et al. | Automatic detection of semantic boundaries based on acoustic and lexical knowledge. | |
JPH0721759B2 (ja) | 音声認識応答装置 | |
Tanprasert et al. | Text-dependent speaker identification using neural network on distinctive Thai tone marks | |
Abdullaeva et al. | Uzbek Speech synthesis using deep learning algorithms | |
Pranjol et al. | Bengali speech recognition: An overview | |
Heo et al. | Classification based on speech rhythm via a temporal alignment of spoken sentences | |
Schramm et al. | A Brazilian Portuguese language corpus development | |
JP3110025B2 (ja) | 発声変形検出装置 | |
Vafaie et al. | 4 Speech Recognition for Persian | |
Mallik et al. | Speech to text conversion for visually impaired person using µ law companding | |
JPH0634175B2 (ja) | 文章読上げ装置 | |
Zadeh | Technology of speech for a computer system | |
JPS6027433B2 (ja) | 日本語情報入力装置 |