JP2000047689A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JP2000047689A JP2000047689A JP10210771A JP21077198A JP2000047689A JP 2000047689 A JP2000047689 A JP 2000047689A JP 10210771 A JP10210771 A JP 10210771A JP 21077198 A JP21077198 A JP 21077198A JP 2000047689 A JP2000047689 A JP 2000047689A
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- speaker
- time
- speech
- message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
発声について適切なメッセージを与え、音声認識率の向
上を図った音声認識システムを提供する。 【解決手段】音声入力の受付開始時点から受付終了時点
までの受付可能期間内の所定時間に限り音声入力を受け
付け、受け付けた音声入力について音声認識を行う音声
認識装置において、発話者の発声開始時点が受付開始時
点よりも早い場合には、発声開始時点と受付開始時点の
時間差に応じて、発話者に再音声入力を要求するための
メッセージの内容を変更するメッセージ変更手段を備え
る。
Description
り、特に認識不能時における動作に関する。
採用されており、特に車載用においては、非常に便利な
ものになっている。例えば、運転者がナビゲーション機
器やオーディオ機器等を操作するに際して、運転中のス
イッチ操作による負担を軽減するために、運転者(発話
者)の発声した音声を認識して接続された電子機器(メ
インシステム)に適切な操作指示を行う音声認識装置が
ある。
発声タイミング(発声開始、発声終了)と適切な発声長
さが重要である。音声認識装置側では発声タイミングを
示するために発声開始音(以下、開始音と称す)を出
し、発話者は開始音を聞いてから発声する。理想的な発
声開始、発声終了、発声長さについて図4を用いて説明
する。
イムアウト・規定長と発話者の発声開始・発声終了・発
声長さの関係を示す図である。以下、図に従って説明す
る。音声認識装置より発声開始の合図として、「ピッと
いう音に後にお話下さい」とメッセージされる。このピ
ッという音が開始音(受付開始)で、ここからタイムア
ウト(受付終了)までの間が受付可能期間(例えば、5
秒間)であり、発話者はこの間に発声を終了しなければ
ならない。また、この受付可能期間のうち最初に発声を
検知した時点(認識開始)から所定時間内(規定長と称
し、認識可能期間に相当するもので、例えば3秒間)に
発声を終わらなければ発話者の音声は認識されない。つ
まり、発話者の発声開始が開始音(ピッ)よりも早い場
合、発声終了がタイムアウトよりも遅い場合、発声長さ
が規定長よりも長い場合はいずれも音声認識できず認識
エラーとなる。
できなかった時は、「認識できませんでした。もう一度
お話下さい」等のメッセージを出す。発話者はメッセー
ジに従って再度発声して認識させる。
は、音声認識装置が発話者の音声を認識できなかったの
で再発声を要求するが、そのメッセージは発声が極端に
不適切であっても同じであるため、発話者はどのような
発声方法の改善を行えばよいか判らず、同じような発声
を繰り返すことになる。その結果、何度も同じような失
敗を繰り返すので音声認識率が向上しないという問題が
ある。
応じて発話者に発声について適切なメッセージを与え、
音声認識率の向上を図った音声認識装置を提供すること
を目的とする。
に本発明は、音声入力の受付開始時点から受付終了時点
までの受付可能期間内の所定時間に限り音声入力を受け
付け、該受け付けた音声入力について音声認識を行う音
声認識装置において、前記発話者の発声開始時点が前記
受付開始時点よりも早い場合には、前記発声開始時点と
前記受付開始時点の時間差に応じて、前記発話者に再音
声入力を要求するためのメッセージの内容を変更する第
1のメッセージ変更手段を備えたことを特徴とするもの
である。
了時点までの受付可能期間内の所定時間に限り音声入力
を受け付け、該受け付けた音声入力について音声認識を
行う音声認識装置において、前記発話者の発声終了時点
が前記受付終了時点よりも遅い場合には、前記発声終了
時点と前記受付終了時点の時間差に応じて、前記発話者
に再音声入力を要求するためのメッセージの内容を変更
する第2のメッセージ変更手段を備えたことを特徴とす
るものである。
了時点までの受付可能期間内の所定時間に限り音声入力
を受け付け、該受け付けた音声入力について音声認識を
行う音声認識装置において、前記入力音声の時間長が前
記所定時間よりも長い場合には、前記入力音声の時間長
と前記所定時間の時間差に応じて、前記発話者に再音声
入力を要求するためのメッセージの内容を変更する第3
のメッセージ変更手段を備えたことを特徴とするもので
ある。
である。以下、図に従って説明する。1は運転者や同乗
者の音声を電気信号に変換する所定の位置に配置された
音声入力部で、マイクロフォンから入力された音声は雑
音除去用フィルタを通過後、A/D変換され認識処理部
2に入力される。2は発話者の音声を認識する認識処理
部で、音響処理部21と単語照合部22で構成され、音
響処理部21では音声の特徴を抽出し音素辞書23と照
合して単語に、そして単語照合部22で単語辞書24と
照合して入力された音声を認識する。3は認識処理部2
の認識結果に基いて操作されるナビゲーション装置等の
メインシステムで、人工衛星からの電波を受信するGP
S受信機31、地図情報が記憶されたCD−ROM及び
その読取装置からなる地図データベース32、車両の位
置を特定する処理及びメインシステム全体の制御を行う
マイクロコンピュータにより構成された制御部33、地
図情報を表示する液晶表示器等で構成された表示部3
4、キースイッチ等により入力指示を行う操作部35、
音声認識結果に基づき適切なメッセージを音声合成して
音声出力部37に出力する音声合成部36、音声合成さ
れたメッセージを音声出力する増幅器、スピーカ等から
構成される音声出力部37から構成される。
処理のフローチャートである。図2は音声認識装置にお
ける認識開始・タイムアウト・規定長と発話者の発声開
始・発声終了・発声長さの関係を示す図で、(a)は発
声開始が開始音よりも早い場合、(b)は発声終了がタ
イムアウトよりも遅い場合、(c)は発声長さが規定長
よりも長い場合である。以下、図に従って音声認識装置
における動作を説明する。
も早いか否かを判断して発声開始が早ければステップS
2に移り、発声開始が早くなければステップS5に移
る。この判断は音声認識装置が発話者に発声を促す合図
である開始音「ピッ」を発した時点と、発話者の音声を
音声入力部1が検出した時点のいずれが早いかで判断す
る。
も極端に早いか否かを判断して極端に早ければステップ
S3に移り、極端に早くなければ(開始音の直前に発声
を検出した時)ステップS4に移る。つまり、発話者の
発声開始が開始音よりどの程度早いかを判断するもの
で、例えば開始音「ピッ」を発した時点と発話者の音声
を音声入力部1が検出した時点の時間差の大小で判断す
る(例えば、1秒以上を極端に早い、1秒未満を早いと
する)。図2(a)において、は発声開始が開始音よ
りも極端に早い場合であり、は発声開始が開始音の直
前(僅かに早い)の場合である。
してからお話し下さい。」とメッセージを発して処理を
終える。つまり、発声開始が極端に早いので再発声を要
求するメッセージに「確認してから」という言葉を用い
て、発話者に開始音を聞いてから発声するように注意を
促す。ステップS4では、「ピッという音の後にもう少
し遅くお話し下さい。」とメッセージを発して処理を終
える。つまり、発声開始が開始音よりも僅かに早いだけ
なので再発声を要求するメッセージに「少し遅く」とい
う言葉を用いて、極端に発声が遅くならないように配慮
する。
て発話者へのメッセージの内容を変更する。発話者は適
切なメッセージにより発声開始のタイミングの調整を図
ることができ、認識処理の確率が向上する。尚、本例で
は発声開始の早さの程度を2段階に分けて説明したが、
さらに多くの段階に分けて適切なメッセージを発するよ
うにすると、より一層の効果が期待できる。
トの直前であるか否かを判断してタイムアウトの直前で
あればステップS7に移り、タイムアウトの直前でなけ
ればステップS6に移る。つまり、発話者の発声開始が
開始音よりどの程度遅いかを判断するもので、例えば開
始音「ピッ」を発した時点と発話者の音声を音声入力部
1が検出した時点の時間差の大小で判断する。図3
(c)において、は発声の開始が音声認識タイムアウ
トの直前の場合である。
トの直後であるか否かを判断してタイムアウトの直後で
あればステップS8に移り、タイムアウトの直後でなけ
ればステップS9に移る。つまり、発話者の発声終了が
タイムアウトよりどの程度遅いかを判断するものであ
る。図3(c)において、は発声の終了が音声認識タ
イムアウトの直後の場合である。
○秒以内にお話し下さい。」とメッセージを発して処理
を終える。つまり、発声開始が極端に遅く、そのために
発声終了がタイムアウト(受付終了)を超えてしまった
ので再発声を要求するメッセージに「ピッという音の○
○秒以内」という言葉を用いて、発話者に具体的に発声
のタイミングを指示する。ステップS8では、「ピッと
いう音の後にもう少し早くお話し下さい。」とメッセー
ジを発して処理を終える。つまり、発声終了が受付終了
よりも僅かに遅いだけなので再発声を要求するメッセー
ジに「少し早く」という言葉を用いて、極端に発声が早
くならないように配慮する。
て発話者へのメッセージの内容を変更する。発話者は適
切なメッセージにより発声開始(結果として発声終了)
のタイミングの調整を図ることができ、認識処理の確率
が向上する。ステップS9では、発声長さが規定長より
も極端に長いか否かを判断して規定長よりも極端に長け
ればステップS10に移り、規定長よりも少し長ければ
ステップS11に移る。つまり、発話者の発声開始から
発声終了までの期間が規定長よりをどれ程超えてるかを
判断するものである。規定長は音声を一時記憶しておく
メモリの容量等により制限されるもので、受付可能期間
内であっても1つの音声入力が規定長よりも長いと認識
できなくなる。図3(d)において、は規定長よりも
極端に長い場合であり、は規定長よりも少し長い場合
である。
に短くお話し下さい。」とメッセージを発して処理を終
える。つまり、発声長さが規定長よりも極端に長く、そ
のために認識できないので再発声を要求するメッセージ
に「短く」という言葉を用いて、発話者に充分に短く話
すように指示する。ステップS11では、「ピッという
音の後にもう少し短くお話し下さい。」とメッセージを
発して処理を終える。つまり、発声長さが規定長よりも
僅かに長いだけなので再発声を要求するメッセージに
「少し短く」という言葉を用いて、極端に発声が短くな
らないように配慮する。
者へのメッセージの内容を変更する。発話者は適切なメ
ッセージにより発声長さの調整を図ることができ、認識
処理の確率が向上する。以上のように本実施例では、音
声認識部が認識できなかった理由を発声開始、発声終
了、発声長さに区別し、さらに、その程度に応じて発話
者に対して、発声の仕方等の問題点に解消するような適
切なメッセージが発せられ、発話者は具体的な指示に基
いて発声するので再入力された音声の認識率が向上でき
る。
者の発声の仕方の問題点に応じて発話者に発声について
の適切なメッセージを与え、音声認識率の向上を図った
音声認識装置が提供できる。
ーチャートである。
・規定長と発話者の発声開始・発声終了・発声長さの関
係を示す図である。
・規定長と発話者の発声開始・発声終了・発声長さの関
係を示す図である。
S受信機、2・・・・認識処理部、 32
・・・地図データベース、21・・・音響処理部、
33・・・制御部、22・・・単語照合部、
34・・・表示部、23・・・音素辞
書、 35・・・操作部、24・・・単
語辞書、 36・・・音声合成部、3・
・・・メインシステム、 37・・・音声出力
部。
Claims (3)
- 【請求項1】 音声入力の受付開始時点から受付終了時
点までの受付可能期間内の所定時間に限り音声入力を受
け付け、該受け付けた音声入力について音声認識を行う
音声認識装置において、 前記発話者の発声開始時点が前記受付開始時点よりも早
い場合には、前記発声開始時点と前記受付開始時点の時
間差に応じて、前記発話者に再音声入力を要求するため
のメッセージの内容を変更する第1のメッセージ変更手
段を備えたことを特徴とする音声認識装置。 - 【請求項2】 音声入力の受付開始時点から受付終了時
点までの受付可能期間内の所定時間に限り音声入力を受
け付け、該受け付けた音声入力について音声認識を行う
音声認識装置において、 前記発話者の発声終了時点が前記受付終了時点よりも遅
い場合には、前記発声終了時点と前記受付終了時点の時
間差に応じて、前記発話者に再音声入力を要求するため
のメッセージの内容を変更する第2のメッセージ変更手
段を備えたことを特徴とする音声認識装置。 - 【請求項3】 音声入力の受付開始時点から受付終了時
点までの受付可能期間内の所定時間に限り音声入力を受
け付け、該受け付けた音声入力について音声認識を行う
音声認識装置において、 前記入力音声の時間長が前記所定時間よりも長い場合に
は、前記入力音声の時間長と前記所定時間の時間差に応
じて、前記発話者に再音声入力を要求するためのメッセ
ージの内容を変更する第3のメッセージ変更手段を備え
たことを特徴とする音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21077198A JP4101365B2 (ja) | 1998-07-27 | 1998-07-27 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21077198A JP4101365B2 (ja) | 1998-07-27 | 1998-07-27 | 音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000047689A true JP2000047689A (ja) | 2000-02-18 |
JP4101365B2 JP4101365B2 (ja) | 2008-06-18 |
Family
ID=16594876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP21077198A Expired - Fee Related JP4101365B2 (ja) | 1998-07-27 | 1998-07-27 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4101365B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008309966A (ja) * | 2007-06-13 | 2008-12-25 | Fujitsu Ten Ltd | 音声入力処理装置および音声入力処理方法 |
JP2018142329A (ja) * | 2018-03-27 | 2018-09-13 | 株式会社ユピテル | システム及びプログラム |
-
1998
- 1998-07-27 JP JP21077198A patent/JP4101365B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008309966A (ja) * | 2007-06-13 | 2008-12-25 | Fujitsu Ten Ltd | 音声入力処理装置および音声入力処理方法 |
JP2018142329A (ja) * | 2018-03-27 | 2018-09-13 | 株式会社ユピテル | システム及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4101365B2 (ja) | 2008-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8768701B2 (en) | Prosodic mimic method and apparatus | |
US20060212291A1 (en) | Speech recognition system, speech recognition method and storage medium | |
GB2366434A (en) | Selective speaker adaption for an in-vehicle speech recognition system | |
US20030061049A1 (en) | Synthesized speech intelligibility enhancement through environment awareness | |
EP1494208A1 (en) | Method for controlling a speech dialog system and speech dialog system | |
KR20080107376A (ko) | 화자 독립 음성 인식을 구비한 통신 장치 | |
US5054078A (en) | Method and apparatus to suspend speech | |
JPH11126092A (ja) | 音声認識装置および車両用音声認識装置 | |
JP2016061888A (ja) | 音声認識装置、音声認識対象区間設定方法、及び音声認識区間設定プログラム | |
JP4752516B2 (ja) | 音声対話装置および音声対話方法 | |
JP3916861B2 (ja) | 音声認識装置 | |
JP2001296891A (ja) | 音声認識方法および装置 | |
JP2000047689A (ja) | 音声認識装置 | |
JP2001343983A (ja) | 音声始端検出方法、音声認識装置における音声区間検出方法および音声認識装置 | |
JPH08263092A (ja) | 応答音声生成方法および音声対話システム | |
JP4979336B2 (ja) | 音声出力装置 | |
JPS63149699A (ja) | 音声入出力装置 | |
JP2003330487A (ja) | 対話エージェント | |
JP4765394B2 (ja) | 音声対話装置 | |
WO2015093013A1 (ja) | スピーチ認識装置及びスピーチ認識のためのコンピュータプログラム製品 | |
EP2706528A2 (en) | System and method to generate a narrator specific acoustic database without a predefined script | |
JP2004184803A (ja) | 車両用音声認識装置 | |
JPH11327593A (ja) | 音声認識システム | |
JPH11109989A (ja) | 音声認識装置 | |
JP3846500B2 (ja) | 音声認識対話装置および音声認識対話処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050616 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080318 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080319 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110328 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110328 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120328 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120328 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130328 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130328 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140328 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140328 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |