JP2000047689A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2000047689A
JP2000047689A JP10210771A JP21077198A JP2000047689A JP 2000047689 A JP2000047689 A JP 2000047689A JP 10210771 A JP10210771 A JP 10210771A JP 21077198 A JP21077198 A JP 21077198A JP 2000047689 A JP2000047689 A JP 2000047689A
Authority
JP
Japan
Prior art keywords
utterance
speaker
time
speech
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10210771A
Other languages
English (en)
Other versions
JP4101365B2 (ja
Inventor
Masahiro Kamiya
昌宏 神谷
Toshitaka Yamato
俊孝 大和
Toshiaki Kusano
俊明 草野
Kazuhiro Sakiyama
和広 崎山
Hideki Kitao
英樹 北尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP21077198A priority Critical patent/JP4101365B2/ja
Publication of JP2000047689A publication Critical patent/JP2000047689A/ja
Application granted granted Critical
Publication of JP4101365B2 publication Critical patent/JP4101365B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】発話者の発声の仕方の問題点に応じて発話者に
発声について適切なメッセージを与え、音声認識率の向
上を図った音声認識システムを提供する。 【解決手段】音声入力の受付開始時点から受付終了時点
までの受付可能期間内の所定時間に限り音声入力を受け
付け、受け付けた音声入力について音声認識を行う音声
認識装置において、発話者の発声開始時点が受付開始時
点よりも早い場合には、発声開始時点と受付開始時点の
時間差に応じて、発話者に再音声入力を要求するための
メッセージの内容を変更するメッセージ変更手段を備え
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識装置に係
り、特に認識不能時における動作に関する。
【0002】
【従来の技術】近年、種々の電子機器に音声認識装置が
採用されており、特に車載用においては、非常に便利な
ものになっている。例えば、運転者がナビゲーション機
器やオーディオ機器等を操作するに際して、運転中のス
イッチ操作による負担を軽減するために、運転者(発話
者)の発声した音声を認識して接続された電子機器(メ
インシステム)に適切な操作指示を行う音声認識装置が
ある。
【0003】認識処理を確実にするためには、発話者の
発声タイミング(発声開始、発声終了)と適切な発声長
さが重要である。音声認識装置側では発声タイミングを
示するために発声開始音(以下、開始音と称す)を出
し、発話者は開始音を聞いてから発声する。理想的な発
声開始、発声終了、発声長さについて図4を用いて説明
する。
【0004】図4は音声認識装置における認識開始・タ
イムアウト・規定長と発話者の発声開始・発声終了・発
声長さの関係を示す図である。以下、図に従って説明す
る。音声認識装置より発声開始の合図として、「ピッと
いう音に後にお話下さい」とメッセージされる。このピ
ッという音が開始音(受付開始)で、ここからタイムア
ウト(受付終了)までの間が受付可能期間(例えば、5
秒間)であり、発話者はこの間に発声を終了しなければ
ならない。また、この受付可能期間のうち最初に発声を
検知した時点(認識開始)から所定時間内(規定長と称
し、認識可能期間に相当するもので、例えば3秒間)に
発声を終わらなければ発話者の音声は認識されない。つ
まり、発話者の発声開始が開始音(ピッ)よりも早い場
合、発声終了がタイムアウトよりも遅い場合、発声長さ
が規定長よりも長い場合はいずれも音声認識できず認識
エラーとなる。
【0005】もし、音声認識装置が発話者の音声を認識
できなかった時は、「認識できませんでした。もう一度
お話下さい」等のメッセージを出す。発話者はメッセー
ジに従って再度発声して認識させる。
【0006】
【発明が解決しようとする課題】従来の音声認識装置で
は、音声認識装置が発話者の音声を認識できなかったの
で再発声を要求するが、そのメッセージは発声が極端に
不適切であっても同じであるため、発話者はどのような
発声方法の改善を行えばよいか判らず、同じような発声
を繰り返すことになる。その結果、何度も同じような失
敗を繰り返すので音声認識率が向上しないという問題が
ある。
【0007】本発明は、発話者の発声の仕方の問題点に
応じて発話者に発声について適切なメッセージを与え、
音声認識率の向上を図った音声認識装置を提供すること
を目的とする。
【0008】
【課題を解決するための手段】上記目的を達成するため
に本発明は、音声入力の受付開始時点から受付終了時点
までの受付可能期間内の所定時間に限り音声入力を受け
付け、該受け付けた音声入力について音声認識を行う音
声認識装置において、前記発話者の発声開始時点が前記
受付開始時点よりも早い場合には、前記発声開始時点と
前記受付開始時点の時間差に応じて、前記発話者に再音
声入力を要求するためのメッセージの内容を変更する第
1のメッセージ変更手段を備えたことを特徴とするもの
である。
【0009】また、音声入力の受付開始時点から受付終
了時点までの受付可能期間内の所定時間に限り音声入力
を受け付け、該受け付けた音声入力について音声認識を
行う音声認識装置において、前記発話者の発声終了時点
が前記受付終了時点よりも遅い場合には、前記発声終了
時点と前記受付終了時点の時間差に応じて、前記発話者
に再音声入力を要求するためのメッセージの内容を変更
する第2のメッセージ変更手段を備えたことを特徴とす
るものである。
【0010】また、音声入力の受付開始時点から受付終
了時点までの受付可能期間内の所定時間に限り音声入力
を受け付け、該受け付けた音声入力について音声認識を
行う音声認識装置において、前記入力音声の時間長が前
記所定時間よりも長い場合には、前記入力音声の時間長
と前記所定時間の時間差に応じて、前記発話者に再音声
入力を要求するためのメッセージの内容を変更する第3
のメッセージ変更手段を備えたことを特徴とするもので
ある。
【0011】
【実施例】図3は音声認識装置の構成を示すブロック図
である。以下、図に従って説明する。1は運転者や同乗
者の音声を電気信号に変換する所定の位置に配置された
音声入力部で、マイクロフォンから入力された音声は雑
音除去用フィルタを通過後、A/D変換され認識処理部
2に入力される。2は発話者の音声を認識する認識処理
部で、音響処理部21と単語照合部22で構成され、音
響処理部21では音声の特徴を抽出し音素辞書23と照
合して単語に、そして単語照合部22で単語辞書24と
照合して入力された音声を認識する。3は認識処理部2
の認識結果に基いて操作されるナビゲーション装置等の
メインシステムで、人工衛星からの電波を受信するGP
S受信機31、地図情報が記憶されたCD−ROM及び
その読取装置からなる地図データベース32、車両の位
置を特定する処理及びメインシステム全体の制御を行う
マイクロコンピュータにより構成された制御部33、地
図情報を表示する液晶表示器等で構成された表示部3
4、キースイッチ等により入力指示を行う操作部35、
音声認識結果に基づき適切なメッセージを音声合成して
音声出力部37に出力する音声合成部36、音声合成さ
れたメッセージを音声出力する増幅器、スピーカ等から
構成される音声出力部37から構成される。
【0012】図1は本発明の一実施例の音声認識装置の
処理のフローチャートである。図2は音声認識装置にお
ける認識開始・タイムアウト・規定長と発話者の発声開
始・発声終了・発声長さの関係を示す図で、(a)は発
声開始が開始音よりも早い場合、(b)は発声終了がタ
イムアウトよりも遅い場合、(c)は発声長さが規定長
よりも長い場合である。以下、図に従って音声認識装置
における動作を説明する。
【0013】ステップS1では、発声開始が開始音より
も早いか否かを判断して発声開始が早ければステップS
2に移り、発声開始が早くなければステップS5に移
る。この判断は音声認識装置が発話者に発声を促す合図
である開始音「ピッ」を発した時点と、発話者の音声を
音声入力部1が検出した時点のいずれが早いかで判断す
る。
【0014】ステップS2では、発声開始が開始音より
も極端に早いか否かを判断して極端に早ければステップ
S3に移り、極端に早くなければ(開始音の直前に発声
を検出した時)ステップS4に移る。つまり、発話者の
発声開始が開始音よりどの程度早いかを判断するもの
で、例えば開始音「ピッ」を発した時点と発話者の音声
を音声入力部1が検出した時点の時間差の大小で判断す
る(例えば、1秒以上を極端に早い、1秒未満を早いと
する)。図2(a)において、は発声開始が開始音よ
りも極端に早い場合であり、は発声開始が開始音の直
前(僅かに早い)の場合である。
【0015】ステップS3では、「ピッという音を確認
してからお話し下さい。」とメッセージを発して処理を
終える。つまり、発声開始が極端に早いので再発声を要
求するメッセージに「確認してから」という言葉を用い
て、発話者に開始音を聞いてから発声するように注意を
促す。ステップS4では、「ピッという音の後にもう少
し遅くお話し下さい。」とメッセージを発して処理を終
える。つまり、発声開始が開始音よりも僅かに早いだけ
なので再発声を要求するメッセージに「少し遅く」とい
う言葉を用いて、極端に発声が遅くならないように配慮
する。
【0016】このように、発声開始の早さの程度に応じ
て発話者へのメッセージの内容を変更する。発話者は適
切なメッセージにより発声開始のタイミングの調整を図
ることができ、認識処理の確率が向上する。尚、本例で
は発声開始の早さの程度を2段階に分けて説明したが、
さらに多くの段階に分けて適切なメッセージを発するよ
うにすると、より一層の効果が期待できる。
【0017】ステップS5では、発声開始がタイムアウ
トの直前であるか否かを判断してタイムアウトの直前で
あればステップS7に移り、タイムアウトの直前でなけ
ればステップS6に移る。つまり、発話者の発声開始が
開始音よりどの程度遅いかを判断するもので、例えば開
始音「ピッ」を発した時点と発話者の音声を音声入力部
1が検出した時点の時間差の大小で判断する。図3
(c)において、は発声の開始が音声認識タイムアウ
トの直前の場合である。
【0018】ステップS6では、発声終了がタイムアウ
トの直後であるか否かを判断してタイムアウトの直後で
あればステップS8に移り、タイムアウトの直後でなけ
ればステップS9に移る。つまり、発話者の発声終了が
タイムアウトよりどの程度遅いかを判断するものであ
る。図3(c)において、は発声の終了が音声認識タ
イムアウトの直後の場合である。
【0019】ステップS7では、「ピッという音の後○
○秒以内にお話し下さい。」とメッセージを発して処理
を終える。つまり、発声開始が極端に遅く、そのために
発声終了がタイムアウト(受付終了)を超えてしまった
ので再発声を要求するメッセージに「ピッという音の○
○秒以内」という言葉を用いて、発話者に具体的に発声
のタイミングを指示する。ステップS8では、「ピッと
いう音の後にもう少し早くお話し下さい。」とメッセー
ジを発して処理を終える。つまり、発声終了が受付終了
よりも僅かに遅いだけなので再発声を要求するメッセー
ジに「少し早く」という言葉を用いて、極端に発声が早
くならないように配慮する。
【0020】このように、発声終了の遅さの程度に応じ
て発話者へのメッセージの内容を変更する。発話者は適
切なメッセージにより発声開始(結果として発声終了)
のタイミングの調整を図ることができ、認識処理の確率
が向上する。ステップS9では、発声長さが規定長より
も極端に長いか否かを判断して規定長よりも極端に長け
ればステップS10に移り、規定長よりも少し長ければ
ステップS11に移る。つまり、発話者の発声開始から
発声終了までの期間が規定長よりをどれ程超えてるかを
判断するものである。規定長は音声を一時記憶しておく
メモリの容量等により制限されるもので、受付可能期間
内であっても1つの音声入力が規定長よりも長いと認識
できなくなる。図3(d)において、は規定長よりも
極端に長い場合であり、は規定長よりも少し長い場合
である。
【0021】ステップS10では、「ピッという音の後
に短くお話し下さい。」とメッセージを発して処理を終
える。つまり、発声長さが規定長よりも極端に長く、そ
のために認識できないので再発声を要求するメッセージ
に「短く」という言葉を用いて、発話者に充分に短く話
すように指示する。ステップS11では、「ピッという
音の後にもう少し短くお話し下さい。」とメッセージを
発して処理を終える。つまり、発声長さが規定長よりも
僅かに長いだけなので再発声を要求するメッセージに
「少し短く」という言葉を用いて、極端に発声が短くな
らないように配慮する。
【0022】このように、発声長さの程度に応じて発話
者へのメッセージの内容を変更する。発話者は適切なメ
ッセージにより発声長さの調整を図ることができ、認識
処理の確率が向上する。以上のように本実施例では、音
声認識部が認識できなかった理由を発声開始、発声終
了、発声長さに区別し、さらに、その程度に応じて発話
者に対して、発声の仕方等の問題点に解消するような適
切なメッセージが発せられ、発話者は具体的な指示に基
いて発声するので再入力された音声の認識率が向上でき
る。
【0023】
【発明の効果】以上説明したように、本発明では、発話
者の発声の仕方の問題点に応じて発話者に発声について
の適切なメッセージを与え、音声認識率の向上を図った
音声認識装置が提供できる。
【図面の簡単な説明】
【図1】本発明の一実施例の音声認識装置の処理のフロ
ーチャートである。
【図2】音声認識装置における認識開始・タイムアウト
・規定長と発話者の発声開始・発声終了・発声長さの関
係を示す図である。
【図3】音声認識装置の構成を示すブロック図である。
【図4】音声認識装置における認識開始・タイムアウト
・規定長と発話者の発声開始・発声終了・発声長さの関
係を示す図である。
【符号の説明】
1・・・・音声入力部、 31・・・GP
S受信機、2・・・・認識処理部、 32
・・・地図データベース、21・・・音響処理部、
33・・・制御部、22・・・単語照合部、
34・・・表示部、23・・・音素辞
書、 35・・・操作部、24・・・単
語辞書、 36・・・音声合成部、3・
・・・メインシステム、 37・・・音声出力
部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 崎山 和広 兵庫県神戸市兵庫区御所通1丁目2番28号 富士通テン株式会社内 (72)発明者 北尾 英樹 兵庫県神戸市兵庫区御所通1丁目2番28号 富士通テン株式会社内 Fターム(参考) 5D015 LL00

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 音声入力の受付開始時点から受付終了時
    点までの受付可能期間内の所定時間に限り音声入力を受
    け付け、該受け付けた音声入力について音声認識を行う
    音声認識装置において、 前記発話者の発声開始時点が前記受付開始時点よりも早
    い場合には、前記発声開始時点と前記受付開始時点の時
    間差に応じて、前記発話者に再音声入力を要求するため
    のメッセージの内容を変更する第1のメッセージ変更手
    段を備えたことを特徴とする音声認識装置。
  2. 【請求項2】 音声入力の受付開始時点から受付終了時
    点までの受付可能期間内の所定時間に限り音声入力を受
    け付け、該受け付けた音声入力について音声認識を行う
    音声認識装置において、 前記発話者の発声終了時点が前記受付終了時点よりも遅
    い場合には、前記発声終了時点と前記受付終了時点の時
    間差に応じて、前記発話者に再音声入力を要求するため
    のメッセージの内容を変更する第2のメッセージ変更手
    段を備えたことを特徴とする音声認識装置。
  3. 【請求項3】 音声入力の受付開始時点から受付終了時
    点までの受付可能期間内の所定時間に限り音声入力を受
    け付け、該受け付けた音声入力について音声認識を行う
    音声認識装置において、 前記入力音声の時間長が前記所定時間よりも長い場合に
    は、前記入力音声の時間長と前記所定時間の時間差に応
    じて、前記発話者に再音声入力を要求するためのメッセ
    ージの内容を変更する第3のメッセージ変更手段を備え
    たことを特徴とする音声認識装置。
JP21077198A 1998-07-27 1998-07-27 音声認識装置 Expired - Fee Related JP4101365B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21077198A JP4101365B2 (ja) 1998-07-27 1998-07-27 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21077198A JP4101365B2 (ja) 1998-07-27 1998-07-27 音声認識装置

Publications (2)

Publication Number Publication Date
JP2000047689A true JP2000047689A (ja) 2000-02-18
JP4101365B2 JP4101365B2 (ja) 2008-06-18

Family

ID=16594876

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21077198A Expired - Fee Related JP4101365B2 (ja) 1998-07-27 1998-07-27 音声認識装置

Country Status (1)

Country Link
JP (1) JP4101365B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008309966A (ja) * 2007-06-13 2008-12-25 Fujitsu Ten Ltd 音声入力処理装置および音声入力処理方法
JP2018142329A (ja) * 2018-03-27 2018-09-13 株式会社ユピテル システム及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008309966A (ja) * 2007-06-13 2008-12-25 Fujitsu Ten Ltd 音声入力処理装置および音声入力処理方法
JP2018142329A (ja) * 2018-03-27 2018-09-13 株式会社ユピテル システム及びプログラム

Also Published As

Publication number Publication date
JP4101365B2 (ja) 2008-06-18

Similar Documents

Publication Publication Date Title
US8768701B2 (en) Prosodic mimic method and apparatus
US20060212291A1 (en) Speech recognition system, speech recognition method and storage medium
GB2366434A (en) Selective speaker adaption for an in-vehicle speech recognition system
US20030061049A1 (en) Synthesized speech intelligibility enhancement through environment awareness
EP1494208A1 (en) Method for controlling a speech dialog system and speech dialog system
KR20080107376A (ko) 화자 독립 음성 인식을 구비한 통신 장치
US5054078A (en) Method and apparatus to suspend speech
JPH11126092A (ja) 音声認識装置および車両用音声認識装置
JP2016061888A (ja) 音声認識装置、音声認識対象区間設定方法、及び音声認識区間設定プログラム
JP4752516B2 (ja) 音声対話装置および音声対話方法
JP3916861B2 (ja) 音声認識装置
JP2001296891A (ja) 音声認識方法および装置
JP2000047689A (ja) 音声認識装置
JP2001343983A (ja) 音声始端検出方法、音声認識装置における音声区間検出方法および音声認識装置
JPH08263092A (ja) 応答音声生成方法および音声対話システム
JP4979336B2 (ja) 音声出力装置
JPS63149699A (ja) 音声入出力装置
JP2003330487A (ja) 対話エージェント
JP4765394B2 (ja) 音声対話装置
WO2015093013A1 (ja) スピーチ認識装置及びスピーチ認識のためのコンピュータプログラム製品
EP2706528A2 (en) System and method to generate a narrator specific acoustic database without a predefined script
JP2004184803A (ja) 車両用音声認識装置
JPH11327593A (ja) 音声認識システム
JPH11109989A (ja) 音声認識装置
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050616

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080319

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120328

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120328

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130328

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130328

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140328

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140328

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees