JP2000066697A - 音声認識装置および方法 - Google Patents

音声認識装置および方法

Info

Publication number
JP2000066697A
JP2000066697A JP10231237A JP23123798A JP2000066697A JP 2000066697 A JP2000066697 A JP 2000066697A JP 10231237 A JP10231237 A JP 10231237A JP 23123798 A JP23123798 A JP 23123798A JP 2000066697 A JP2000066697 A JP 2000066697A
Authority
JP
Japan
Prior art keywords
standard pattern
power source
voice
standard
engine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10231237A
Other languages
English (en)
Inventor
Yasuhiro Terada
泰宏 寺田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP10231237A priority Critical patent/JP2000066697A/ja
Publication of JP2000066697A publication Critical patent/JP2000066697A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】騒音環境下における複数の標準パターンを用い
る音声認識装置を提供する。 【解決手段】音声を入力する音声入力部11と、入力さ
れた音声から標準パターンと照合するためのパラメータ
を抽出する特徴パラメータ抽出部12と、入力音声から
抽出された特徴パラメータと標準パターンとを照合する
照合部13と、複数の標準パターンが格納されている標
準パターンデータベース格納部18と動力源として電気
モータとエンジンを有し、エンジンの効率により動力源
を切り換えるハイブリッド車両の動力源の情報を獲得す
る動力源情報獲得部15と、現在稼動している動力源に
よって標準パターンデータベース格納部から標準パター
ンを選択する標準パターン選択部16と、選択された標
準パターンを格納する標準パターン格納部17と、認識
結果を運転手等の発声者に知らせるための認識結果出力
部14とを備えることにより、単純な構成でハイブリッ
ド車両の室内の騒音に適した標準パターンが選択でき
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、車の室内、特に、
動力源を2つ以上有するハイブリッド車両の室内におけ
る音声認識装置および方法に関する。
【0002】
【従来の技術】従来、騒音環境下における複数の標準パ
ターンを用いる音声認識装置として、特開平5-165
492号公報に記載されたものが知られている。図4に
従来のシステム構成図を示す。認識対象音声の音声入力
部41と、入力音声信号を周波数分析し、分析された音
声スペクトルに対し推定雑音スペクトルを引き算して、
雑音を除去する雑音処理部43と、雑音処理部で得られ
た音声信号に基づき入力音声の特徴ベクトルを求める分
析部44と、雑音環境に応じた雑音重畳音声データを用
いて作成した標準パターンを格納しておき、雑音処理部
で除去できなかった残差雑音の雑音情報を求め、雑音情
報に基づいて、複数個の標準パターンの中から最適な標
準パターンを選択する標準パターン選択部45と、標準
パターン選択部により選択された標準パターンと特徴ベ
クトルとを照合して入力音声を認識する照合部46によ
り構成されている。
【0003】
【発明が解決しようとする課題】しかし、上記従来の音
声認識装置においては、標準パターンの選択のため雑音
を除去する処理を行わなければならないという問題があ
った。本発明は、上記従来の技術を解決するものであ
り、ハイブリッド車両の動力源の情報のみを用いて標準
パターンの選択を行うため、簡単な処理で標準パターン
の選択が可能となる。
【0004】
【課題を解決するための手段】この問題を解決するため
に、本発明は、音声発生者が発生した音声を入力する音
声入力部と、入力された音声から標準パターンと照合す
るためのパラメータを抽出する特徴パラメータ抽出部
と、入力音声から抽出された特徴パラメータと標準パラ
メータとを照合する照合部と、複数の標準パターンが格
納されている標準パターンデータベース格納部と、動力
源として電気モータとエンジンを有し、エンジンの効率
により動力源を切り換えるハイブリッド車両の動力源の
情報を獲得する動力源情報獲得部と、現在稼動している
動力源によって標準パターンデータベース格納部から標
準パターンを選択する標準パターン選択部と、選択され
た標準パターンを格納する標準パターン格納部と、認識
結果を前記音声発生者に知らせるための認識結果出力部
とを備えるハイブリッド車両の室内における音声認識装
置である。
【0005】これにより、ハイブリッド車両の動力源の
みで、ハイブリッド車両の動力源の変化により生じる走
行雑音等の車室内雑音の変化に対応した標準パターンの
選択が可能になる。更に、本発明は、入力された音声を
予め用意している標準パターンと照合して、最も近い語
彙を認識結果として出力する音声認識方法において、動
力源として電気モータとエンジンを有し、エンジンの効
率により動力源を切り換えるハイブリッド車両の現在稼
動している動力源によって標準パターンを切り換えるこ
とを特徴とするハイブリッド車両の室内における音声認
識方法である。これにより、ハイブリッド車両の動力源
が電気モータのときと動力源がエンジンのときとで生じ
る車室内騒音の違いを簡単な処理で軽減でき、安定した
認識性能が得られる。この音声認識装置は、例えば、カ
ーナビゲーション装置等に利用することができる。
【0006】
【発明の実施の形態】本発明の実施の形態について、図
1から図3を参照して説明する。 (第1の実施の形態)図1は、本発明の第1の実施形態を
示す構成図である。図面を参照して、第1の実施形態に
ついて説明する。運転手等の音声発声者から発せられた
音声は、マイクロホン等の媒体変換部を含む音声入力部
11によって、音波から電気信号である音声信号に変換
される。この音声信号は、特徴パラメータ抽出部12に
おいて、LPCケプストラム係数等の特徴パラメータに
変換される。照合部13では、DPマッチング、HMM
等の方法を用いて、特徴パラメータ抽出部12によって
抽出された特徴パラメータと標準パターン格納部17に
格納されている標準パターンとの照合を行う。認識結果
は、ディスプレイ、スピーカ等の認識結果出力部14に
よって運転手等の発声者に知らされる。標準パターン格
納部17には、動力源情報獲得部15から得られた情報
を基に標準パターン選択部16によって標準パターンデ
ータベース格納部18に格納されている少なくとも2種
類以上の標準パターンから選択された標準パターンが格
納されている。動力源情報獲得部15は、ハイブリッド
車両の動力源の状態が電気モータであるか、エンジンで
あるかの情報を、例えば、動力源の制御系に設けられた
動力源が何であるかのフラグを見ることによって獲得
し、動力源が切り替わるたび、あるいは音声認識が行わ
れる直前に標準パターン選択部16に情報を送る。標準
パターンデータベース格納部18には、動力源が電気モ
ータ用の標準パターンと動力源がエンジン用の標準パタ
ーンの最低2種類の標準パターンを格納する。例えば、
電気モータ用の標準パターンは、静かな環境で収録した
音声に電気モータ走行時に収録した騒音を付加した音声
信号,あるいは電気モータ走行時に収録した音声信号等
を用いて作成する。また、エンジン用の標準パターン
は、静かな環境で収録した音声信号にエンジン走行時に
収録した騒音を付加した音声信号、あるいはエンジン走
行時に収録した音声信号等を用いて作成する。標準パタ
ーン選択部16は、動力源情報獲得部15から現在の動
力源情報が送られてくるたびに、標準パターンデータベ
ース格納部18から現在の動力源に適した標準パター
ン、具体的には、現在の動力源が電気モータの場合に
は、上述した電気モータ用の標準パターン、また、現在
の動力源がエンジンの場合には、上述したエンジン用の
標準パターンを選択し、標準パターン格納部17に格納
する。
【0007】なお、現在稼動している動力源が、2つ以
上ある場合は、動力源としての比率が一番高い動力源用
の標準パターンを使用する。 (第2の実施の形態)図2は、本発明の第2の実施形態を
示すフローである。音声認識の開始を判断するステップ
21は、ユーザが音声認識を開始するためのボタンの押
し下げ等、音声認識を開始するためのトリガがかかった
か否かを判断する。音声認識の開始を判断するステップ
21で、音声認識を開始すると判断されたとき、動力源
が何であるかを判断するステップ22で、例えば動力源
の制御系に設けられた動力源が何であるかのフラグを調
べに行く等の方法により現在の動力源が電気モータであ
るか、エンジンであるかを判断する。動力源が何である
かを判断するステップ32で、現在の動力源が電気モー
タと判断された場合、電気モータ走行時の標準パターン
を選択するステップ23に進む。ここで選択される標準
パターンは、静かな環境で収録した音声に電気モータ走
行時に収録した騒音を付加した音声信号、あるいは電気
モータ走行時に収録した音声信号等を用いて作成したも
のである。また、動力源が何であるかを判断するステッ
プ22で、現在の動力源がエンジンであると判断された
場合、エンジン走行時の標準パターンを選択するステッ
プ24に進む。ここで選択される標準パターンは、静か
な環境で収録した音声にエンジン走行時に収録した騒音
を付加した音声信号、あるいはエンジン走行時に収録し
た音声信号等を用いて作成したものである。
【0008】なお、現在稼動している動力源が、2つ以
上ある場合は、動力源としての比率が一番高い動力源用
の標準パターンを使用する。 (第3の実施の形態)図3は、本発明の第3の実施の形態
である音声認識処理のフローを示す。音声認識の開始を
判断するステップ31は、ユーザが音声認識を開始する
ためのボタンの押し下げ等、音声認識を開始するための
トリガがかかったか否かを判断する。音声認識の開始を
判断するステップ31で、音声認識を開始すると判断さ
れたとき、動力源が何であるかを判断するステップ32
で、例えば動力源の制御系に設けられた動力源が何であ
るかのフラグを調べに行く等の方法により現在の動力源
が電気モータであるか、エンジンであるかを判断する。
動力源が何であるかを判断するステップ32で、現在の
動力源が電気モータと判断された場合、電気モータ走行
時の標準パターンを選択するステップ33に進む。ここ
で選択される標準パターンは、静かな環境で収録した音
声に電気モータ走行時に収録した騒音を付加した音声信
号、あるいは電気モータ走行時に収録した音声信号等を
用いて作成したものである。また、動力源が何であるか
を判断するステップ32で、現在の動力源がエンジンで
あると判断された場合、エンジン走行時の標準パターン
を選択するステップ34に進む。ここで選択される標準
パターンは、静かな環境で収録した音声にエンジン走行
時に収録した騒音を付加した音声信号、あるいはエンジ
ン走行時に収録した音声信号等を用いて作成したもので
ある。音声認識処理のステップ35では、動力源が何で
あるかを判断するステップ32で判断され、標準パター
ンを選択するステップ33あるいは34で選択された標
準パターンを用いて音声認識を行う。認識結果を出力す
るステップ36は、音声認識処理のステップ35の結果
を運転手等の音声発声者に知らせるため、認識結果を出
力する。
【0009】なお、現在稼動している動力源が、2つ以
上ある場合は、動力源としての比率が一番高い動力源用
の標準パターンを使用する。本発明による車載用音声認
識装置は、例えば、カーナビゲーション装置などに利用
することができる。具体的には、運転者が「詳細」とい
えば、カーナビゲーション装置の画面の縮尺が詳細地図
になったり、「目的地設定」といえば目的地設定が設定
できる画面になったりするものである。更に、認識結果
が運転者に知らされる内容としては、上述の例で言え
ば、運転者が「詳細」といったときに、カーナビゲーシ
ョン装置に付属しているスピーカから「詳細地図に変更
します」といったメッセージなどを出すことができる。
【0010】
【発明の効果】以上の説明したように、本発明によれ
ば、ハイブリッド車両特有の2つの動力源に適した標準
パターンを格納する標準パターンデータベース格納部
と、標準パターンを切り換える標準パターン切り換え部
とハイブリッド、非常に単純な方法、且つ構成でハイブ
リッド車両の室内における騒音の急激な変化に対して比
較的安定した認識性能がを得ることができるという効果
が得られる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示すブロック図であ
る。
【図2】本発明の第2の実施形態を示すブロック図であ
る。
【図3】本発明の第2の実施形態を示すブロック図であ
る。
【図4】従来のシステム構成図を示す。
【符号の説明】
11 音声入力部 12 特徴パラメータ抽出部 13 照合部 14 認識結果出力部 15 動力源情報獲得部 16 標準パターン選択部 17 標準パターン格納部 18 標準パターンデータベース 21 音声認識の開始を判断するステップ 22 動力源が何であるかを判断するステップ 23 電気モータ走行時の標準パターンを選択するステ
ップ 24 エンジン走行時の標準パターンを選択するステッ
プ 31 音声認識の開始を判断するステップ 32 動力源が何であるかを判断するステップ 33 電気モータ走行時の標準パターンを選択するステ
ップ 34 エンジン走行時の標準パターンを選択するステッ
プ 35 音声認識処理のステップ 36 認識結果を出力するステップ 41 音声入力部 42 A/D変換部 43 雑音処理部 44 分析部 45 標準パターン選択部 46 照合部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】音声発生者が発生した音声を入力する音声
    入力部と、 入力された音声から標準パターンと照合するためのパラ
    メータを抽出する特徴パラメータ抽出部と、 入力音声から抽出された特徴パラメータと標準パラメー
    タとを照合する照合部と、 複数の標準パターンが格納されている標準パターンデー
    タベース格納部と、 動力源として電気モータとエンジンを有し、エンジンの
    効率により動力源を切り換えるハイブリッド車両の動力
    源の情報を獲得する動力源情報獲得部と、 現在稼動している動力源によって標準パターンデータベ
    ース格納部から標準パターンを選択する標準パターン選
    択部と、 選択された標準パターンを格納する標準パターン格納部
    と、 認識結果を前記音声発生者に知らせるための認識結果出
    力部と、 を備えるハイブリッド車両の室内における音声認識装
    置。
  2. 【請求項2】入力された音声を予め用意している標準パ
    ターンと照合して、最も近い語彙を認識結果として出力
    する音声認識方法において、 動力源として電気モータとエンジンを有し、エンジンの
    効率により動力源を切り換えるハイブリッド車両の現在
    稼動している動力源によって標準パターンを選択するこ
    とを特徴とするハイブリッド車両の室内における音声認
    識方法。
  3. 【請求項3】音声発生者が発生した音声を入力するステ
    ップと、 入力された音声から標準パターンと照合するためのパラ
    メータを抽出するステップと、 入力音声から抽出された特徴パラメータと標準パラメー
    タとを照合するステップと、 標準パターンデータベース格納部に複数の標準パターン
    を格納するステップと、 動力源として電気モータとエンジンを有し、エンジンの
    効率により動力源を切り換えるハイブリッド車両の動力
    源の情報を獲得するステップと、 現在稼動している動力源によって標準パターンデータベ
    ース格納部から標準パターンを選択するステップと、 選択された標準パターンを格納するステップと、 認識結果を前記音声発生者に知らせるためのステップ
    と、を有するハイブリッド車両の室内における音声認識
    方法。
  4. 【請求項4】前記標準パターンを選択するステップは、
    音声認識の開始時のみ行い、音声認識の処理中は標準パ
    ターンの切り換えを行わないことを特徴とする請求項3
    に記載のハイブリッド車両の室内における音声認識方
    法。
JP10231237A 1998-08-18 1998-08-18 音声認識装置および方法 Pending JP2000066697A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10231237A JP2000066697A (ja) 1998-08-18 1998-08-18 音声認識装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10231237A JP2000066697A (ja) 1998-08-18 1998-08-18 音声認識装置および方法

Publications (1)

Publication Number Publication Date
JP2000066697A true JP2000066697A (ja) 2000-03-03

Family

ID=16920477

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10231237A Pending JP2000066697A (ja) 1998-08-18 1998-08-18 音声認識装置および方法

Country Status (1)

Country Link
JP (1) JP2000066697A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123278A (ja) * 2000-08-23 2002-04-26 Koninkl Philips Electronics Nv 特に自動車内で、音声信号を介して装置を制御する方法
JP2004037527A (ja) * 2002-06-28 2004-02-05 Canon Inc 情報処理装置およびその方法
KR101741661B1 (ko) * 2016-03-07 2017-05-30 현대자동차주식회사 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123278A (ja) * 2000-08-23 2002-04-26 Koninkl Philips Electronics Nv 特に自動車内で、音声信号を介して装置を制御する方法
JP2004037527A (ja) * 2002-06-28 2004-02-05 Canon Inc 情報処理装置およびその方法
US7337113B2 (en) 2002-06-28 2008-02-26 Canon Kabushiki Kaisha Speech recognition apparatus and method
KR101741661B1 (ko) * 2016-03-07 2017-05-30 현대자동차주식회사 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법

Similar Documents

Publication Publication Date Title
US8639508B2 (en) User-specific confidence thresholds for speech recognition
EP0911805B1 (en) Speech recognition method and speech recognition apparatus
US8762151B2 (en) Speech recognition for premature enunciation
US9082414B2 (en) Correcting unintelligible synthesized speech
US7983916B2 (en) Sampling rate independent speech recognition
US8756062B2 (en) Male acoustic model adaptation based on language-independent female speech data
US9484027B2 (en) Using pitch during speech recognition post-processing to improve recognition accuracy
US20130080172A1 (en) Objective evaluation of synthesized speech attributes
US9245526B2 (en) Dynamic clustering of nametags in an automated speech recognition system
US8744421B2 (en) Method of initiating a hands-free conference call
US9911408B2 (en) Dynamic speech system tuning
EP1994529B1 (en) Communication device having speaker independent speech recognition
US9997155B2 (en) Adapting a speech system to user pronunciation
JPH11506845A (ja) 実時間作動での音声対話又は音声命令による1つ又は複数の機器の自動制御方法及びこの方法を実施する装置
US20130211828A1 (en) Speech processing responsive to active noise control microphones
US20130211832A1 (en) Speech signal processing responsive to low noise levels
US8706492B2 (en) Voice recognition terminal
JP3654045B2 (ja) 音声認識装置
US20120197643A1 (en) Mapping obstruent speech energy to lower frequencies
EP1151431B1 (en) Method and apparatus for testing user interface integrity of speech-enabled devices
JP2000066697A (ja) 音声認識装置および方法
JP2000194392A (ja) 騒音適応型音声認識装置及び騒音適応型音声認識プログラムを記録した記録媒体
JP2000276187A (ja) 音声認識方法及び音声認識装置
JP2004301875A (ja) 音声認識装置
JPH1185185A (ja) 音声認識システムおよび音声認識制御プログラムを記録した記録媒体