JP2006285103A - 音声認識装置および方法 - Google Patents

音声認識装置および方法 Download PDF

Info

Publication number
JP2006285103A
JP2006285103A JP2005107877A JP2005107877A JP2006285103A JP 2006285103 A JP2006285103 A JP 2006285103A JP 2005107877 A JP2005107877 A JP 2005107877A JP 2005107877 A JP2005107877 A JP 2005107877A JP 2006285103 A JP2006285103 A JP 2006285103A
Authority
JP
Japan
Prior art keywords
contact
microphone
speech
speech recognition
language dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005107877A
Other languages
English (en)
Inventor
Masaru Yamazaki
勝 山崎
Kengo Suzuki
堅悟 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nissan Motor Co Ltd
Original Assignee
Nissan Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nissan Motor Co Ltd filed Critical Nissan Motor Co Ltd
Priority to JP2005107877A priority Critical patent/JP2006285103A/ja
Publication of JP2006285103A publication Critical patent/JP2006285103A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 複数のマイクで集音して音声認識を行う場合に音声認識性能を向上させる。
【解決手段】 人体から離して用いられ、人の発話音声の空気伝導音を集音する非接触型マイクと、人体に接触させて用いられ、人の発話音声の体内伝導音を集音する接触型マイクとで集音した音声を音声認識用の言語辞書を用いて認識する場合に、接触型マイクへの人体の接触を検知し、接触型マイクへの人体の接触が検知されると、言語辞書の中の接触型マイク用として予め設定した言葉のみを用いて接触型マイクにより集音した音声の認識処理を行う。
【選択図】 図6

Description

本発明は、複数の音声集音用マイクロフォン(以下、単にマイクという)を用いた音声認識装置および音声認識方法に関する。
携帯電話機の両面にそれぞれマイクを設け、出力音声レベルの高い方のマイクを選択して音声を集音するようにした音声入力装置が知られている(例えば、特許文献1参照)。
この出願の発明に関連する先行技術文献としては次のものがある。
特開2004−201015号公報
しかしながら、使用環境の変化にともなってそれぞれのマイクへ混入する雑音レベルが複雑に変化すると、出力音声レベルの高いマイクを選択すること自体が難しくなるため、上述した従来の音声入力装置により集音して音声認識処理を行うと音声認識性能が低下するという問題がある。
人体から離して用いられ、人の発話音声の空気伝導音を集音する非接触型マイクと、人体に接触させて用いられ、人の発話音声の体内伝導音を集音する接触型マイクとで集音した音声を音声認識用の言語辞書を用いて認識する場合に、接触型マイクへの人体の接触を検知し、接触型マイクへの人体の接触が検知されると、言語辞書の中の接触型マイク用として予め設定した言葉のみを用いて接触型マイクにより集音した音声の認識処理を行う。
本発明によれば、複数のマイクで集音して音声認識を行う場合に音声認識性能を向上させることができる。
本願発明の音声認識装置を車両に搭載して乗員、特に運転者の発話音声を認識する一実施の形態を説明する。なお、本願発明の音声認識装置は車両用に限定されず、あらゆる用途に適したものである。
《発明の第1の実施の形態》
図1は第1の実施の形態の構成を示す。非接触型マイク1は、乗員の発話音声の空気伝導音を集音して電気信号に変換するマイクであり、乗員の人体に接触させることなく発話音声を集音する。非接触型マイク1には、エレクトレットコンデンサマイク(ECM)などの一般的な形式のマイクを用いることができる。
この一実施の形態では、図2に示すように、非接触型マイク1を車室天井に設置されたマップランプ21の近傍に設置する。なお、非接触型マイク1の設置場所はこの一実施の形態の設置場所に限定されず、例えばステアリングホイールやインストルメントパネルなど、乗員の発話音声を集音可能な場所であればどこでもよい。
接触型マイク2〜4は、乗員の皮膚に直接、あるいは比較的薄い衣服を介して接触させ、乗員の発話による体内伝導音を集音して電気信号に変換するマイクである。この一実施の形態では接触型マイク2〜4にNAM(Non-Audible Murmur)マイクを用いた例を示す。
NAMマイクは、人体の皮膚に直接、接触させるか、または比較的薄い衣服を介して皮膚に接触させ、人の発話音声の体内伝導音を集音するマイクであり、日本音響学会講演論文集、2004年3月、pp452〜453などに紹介されている。NAMマイクは、人間の皮膚と音響インピーダンスがよく似たシリコーンなどの材料でエレクトレット膜をコーティングして形成され、特に1000Hz以下の周波数領域におけるS/N特性が一般的な非接触型マイクよりも優れ、人間の非可聴な“つぶやき”や“独り言”を集音することができるという特徴を有している。
シート部接触型マイク2は、運転席パワーシートを音声操作してスライド量、リフト量、リクライニング量、ランパーサポート量などを調節するためのパワーシート専用の接触型マイクである。シート部接触型マイク2はシートマイク接触検知センサー6と一体に形成し、図3に示すように、運転席シートのヘッドレスト22の運転者の後頭部が接触する位置に設置する。
シートマイク接触検知センサー6は運転者の後頭部がシート部接触型マイク2に接触すると抵抗値が変化し、これにより運転者の後頭部がシート接触型マイク2に接触したことを検知する。なお、シート部接触型マイク2とシートマイク接触検知センサー6を、シートバック23の表面上部の運転者の背中上部が接触する位置に設置してもよい。
ステアリング部接触型マイク3は、エアーコンディショナーを音声操作して外気導入/内気循環切り換え、吹き出し温度、風量、吹き出し口などを調節するためのエアコン専用の接触型マイクである。ステアリング部接触型マイク3はステアリングマイク接触検知センサー7と一体に形成し、図4に示すように、ステアリングホイール24のスポーク部に設置する。
ステアリングマイク接触検知センサー7は運転者の手(指)がステアリング部接触型マイク3に接触すると抵抗値が変化し、これにより運転者の手(指)がステアリング部接触型マイク3に接触したことを検知する。なお、ステアリング部接触型マイク3とステアリングマイク接触検知センサー7をインストルメントパネルなど、他の場所に設置してもよい。
ドア部接触型マイク4は、パワーウインドウを音声操作して窓の開閉、ドアロック/アンロックなどを行うためのパワーウインドウ専用の接触型マイクである。ドア部接触型マイク4はドアマイク接触検知センサー8と一体に形成し、図5に示すように、運転席ドアトリムアームレスト25に設置する。
ドアマイク接触検知センサー8は運転者の手(指)がドア部接触型マイク4に接触すると抵抗値が変化し、これにより運転者の手(指)がドア部接触型マイク4に接触したことを検知する。なお、ドア部接触型マイク4とドアマイク接触検知センサー8をドア内側の他の場所に設置してもよい。
この一実施の形態では、音声操作に用いる接触型マイク2〜4をそれぞれ音声操作対象の車載機器自体もしくはその近傍に設置し、運転者が音声操作を行いたい車載機器に直接、またはその車載機器と関連のある部位に手または体を触れることによって当該車載機器の音声操作を可能にしているが、音声操作対象の車載機器はこの一実施の形態に例示した運転席パワーシート、エアコン、パワーウインドウに限定されるものではない。
PTT(Push to talk)スイッチ5は音声認識を開始するときに運転者が操作するスイッチである。このPTTスイッチ5がオンすると、音声認識装置は発話音声を集音して音声認識処理を開始する。また、入力取消スイッチ9は、音声認識のために入力した音声を取り消すために運転者が操作するスイッチである。音声認識装置による音声認識結果はスピーカー17により放送されるが、放送された認識結果が乗員の発話した内容と異なる場合は、この入力取消スイッチ9を操作して入力音声を取り消すことができる。
この一実施の形態では、図4に示すように、PTTスイッチ5と入力取消スイッチ9をステアリングホイール24のスポーク部に設置する例を示すが、これらのスイッチの設置場所はこの一実施の形態に限定されず、運転者が運転中に容易に操作可能な位置であればどこでもよい。
処理装置10はCPU10a、ROM10b、RAM10c、増幅器10d、A/Dコンバーター10eなどから構成され、後述する音声認識制御プログラムを実行して非接触型マイク1と接触型マイク2〜4により集音された運転者の発話音声を認識し、パワーシート、エアーコンディショナー、パワーウインドウなどの車載機器を音声操作する。なお、増幅器10dは非接触型マイク1および接触型マイク2〜4から出力される音声信号を増幅し、A/Dコンバーター10eは音声信号をデジタル信号に変換する。
非接触型マイク用音響モデル記憶装置11は、運転者と非接触型マイク1との間の音声の空間伝達特性を反映した音響モデル、すなわち車室内雑音下で発話した音素パターンをモデル化し、非接触型マイク用音響モデルとして記憶している。この非接触型マイク用音響モデルと後述する“標準”言語辞書を、非接触型マイク1により集音した音声を認識するために用いる。
接触型マイク用音響モデル記憶装置12は、乗員と接触型マイク2〜4との間の音声の体内伝達特性を反映した音響モデル、すなわち車室内雑音の影響の少ない音素パターンをモデル化した接触型マイク用音響モデルを記憶している。この接触型マイク用音響モデルと後述する接触型マイク2〜4専用の言語辞書を、接触型マイク2〜4により集音した音声を認識するために用いる。
なお、各接触型マイク2〜4のそれぞれに適した接触型マイク用音響モデルを用意し、記憶装置に記憶しておくようにしてもよい。この場合には、接触型マイク2〜4ごとに音声操作対象の車載機器で用いる操作指令の音響モデルのみを収録おき、接触型マイク2〜4の内の接触が検知されたマイクに対応する音響モデルを選択すればよい。
言語辞書記憶装置13〜16は、パワーシート、エアーコンディショナー、パワーウインドウなどの車載機器操作用の言葉と、それらの言葉に対応する操作機能や制御機能を記憶している。
乗員が発話した音声を、まず音響モデルの音素パターンと照合して例えば“シー”、“ト”、“う”、“え”などの音素単位で認識し、次に複数の音素のつながりを言語辞書の例えば“シート上”などの言葉と照合して発話音声を言葉として認識する。
この一実施の形態では、音響モデルと言語辞書を用いて公知の最尤推定法による音声認識を行い、認識結果とすべき候補の言葉に対してそれぞれ認識の確からしさを表す“尤度”を求める。そして、尤度が最も高い言葉を音声認識結果として出力する。
標準言語辞書記憶装置13は、車載機器の音声操作に用いられる言語を記憶する記憶装置である。これらの言葉には、パワーシート、エアーコンディショナー、パワーウインドウなどの車載機器を音声操作するためのすべての言葉が含まれる。運転者によりPTTスイッチ5が操作されてオンすると、非接触型マイク1により運転者の発話音声を集音し、非接触型マイク用音響モデルとこの標準言語辞書を用いて音声認識を行い、認識結果の言葉を操作指令として該当する車載機器へ出力する。
シートマイク用言語辞書記憶装置14は、運転席パワーシートを操作するための言葉のみを収録した運転席パワーシート専用の言語辞書を記憶する記憶装置である。これらの言葉にはシート上、シート下、シート前、シート後、リクライニング、ランパーサポートなどのパワーシート操作指令が含まれる。シートマイク接触検知センサー6により運転者の後頭部がシート部接触型マイク2に接触したことを検知すると、接触型マイク用音響モデルとこのシートマイク用言語辞書を用いて音声認識を行い、認識結果の言葉を操作指令として運転席パワーシート駆動制御装置(不図示)へ出力する。
ステアリングマイク用言語辞書記憶装置15は、エアーコンディショナーを操作するための言葉のみを収録したエアコン専用の言語辞書を記憶する記憶装置である。これらの言葉には内気循環、外気導入、温度上げ、温度下げ、風量上げ、風量下げ、ベンチレーター吹き出し、足元吹き出し、デフロスター吹き出しなどのエアコン操作指令が含まれる。ステアリングマイク接触検知センサー7により運転者の指がステアリング部接触型マイク3に接触したことを検知すると、接触型マイク用音響モデルとこのステアリングマイク用言語辞書を用いて音声認識を行い、認識結果の言葉を操作指令としてエアーコンディショナー(不図示)へ出力する。
ドアマイク用言語辞書記憶装置16は、パワーウインドウを操作するための言葉のみを収録したパワーウインドウ専用の言語辞書を記憶する記憶装置である。これらの言葉には運転席窓開け、運転席窓閉め、助手席窓開け、助手席窓閉め、後部座席窓開け、後部座席窓閉め、全席ドアロック、全席アンロックなどのパワーウインドウ操作指令が含まれる。ドアマイク接触検知センサー8により運転者の指がドア部接触型マイク4に接触したことを検知すると、接触型マイク用音響モデルとこのドアマイク用言語辞書を用いて音声認識を行い、認識結果の言葉を操作指令としてパワーウインドウ駆動制御装置(不図示)へ出力する。
スピーカー17は音声認識のための案内放送を行うためのもので、乗員の発話音声を認識した結果を放送して乗員に確認するためにも用いる。
図6は第1の実施の形態の音声認識制御プログラムを示すフローチャートである。処理装置10は車両のイグニッションスイッチ(不図示)がオンすると所定時間、例えば100msecごとにこの制御プログラムを繰り返し実行する。
ステップ1において音声認識装置の初期化を行う。この一実施の形態では、非接触型マイク1を用いて音声認識を行うことを標準としており、非接触型マイク用音響モデルと標準言語辞書を初期値として選択する。
ステップ2でPTTスイッチ5がオンしているか否かを確認する。運転者がPTTスイッチ5を操作して発話を行う場合は、非接触型マイク1により運転者の発話音声を集音し、非接触型マイク用音響モデルと標準言語辞書を用いて音声認識を行う。一方、PTTスイッチ5を操作していない場合は、接触型マイク2〜4の内、運転者が接触したマイクを用いて運転者の発話音声を集音し、接触型マイク用音響モデルと運転者が接触したマイク専用の言語辞書を用いて音声認識を行う。
まず、非接触型マイク1を用いた音声認識処理を説明する。PTTスイッチ5がオンしているときはステップ3へ進み、音声入力の有無を確認する。非接触型マイク1から出力される音声信号のレベルが予め設定した音声入力有無判定しきい値を超えた場合は、運転者の発話があり、非接触型マイク1で集音したと判定する。音声入力がない場合はステップ2へ戻って上記処理を繰り返す。
運転者の発話があり、非接触型マイク1に音声入力があった場合はステップ4へ進み、非接触型マイク用音響モデルと標準言語辞書を用いて上述した音声認識処理を行う。続くステップ5で運転者が取消スイッチ9を操作して音声入力を取り消したか否かを確認し、音声入力の取消があった場合はステップ2へ戻り、上述した処理を繰り返す。音声入力の取消がない場合はステップ6へ進み、音声認識結果の言葉を操作指令として該当する車載機器へ出力する。
次に、接触型マイク2〜4を用いた音声認識処理を説明する。運転者によるPTTスイッチ5の操作がない場合はステップ7へ進み、シートマイク接触検知センサー6により運転者の後頭部がヘッドレスト22のシート部接触型マイク2に接触しているか否かを確認する。シート部接触型マイク2に接触している場合はステップ8へ進み、シートマイク用言語辞書を選択する。
ステップ3でシート部接触型マイク2への音声入力の有無を確認する。シート部接触型マイク2から出力される音声信号のレベルが予め設定した音声入力有無判定しきい値を超えた場合は、運転者の発話があり、シート部接触型マイク2で集音したと判定する。音声入力がない場合はステップ2へ戻って上記処理を繰り返す。
運転者の発話があり、シート部接触型マイク2に音声入力があった場合はステップ4へ進み、接触型マイク用音響モデルとシートマイク用の言語辞書を用いて上述した音声認識処理を行う。続くステップ5で運転者が取消スイッチ9を操作して音声入力を取り消したか否かを確認し、音声入力の取消があった場合はステップ2へ戻り、上述した処理を繰り返す。音声入力の取消がない場合はステップ6へ進み、音声認識結果の言葉を操作指令としてパワーシート駆動制御装置(不図示)へ出力する。
シート部接触型マイク2への接触がない場合はステップ9へ進み、ステアリングマイク接触検知センサー7により運転者の指がステアリングホイール24のステアリング部接触型マイク3に接触しているか否かを確認する。ステアリング部接触型マイク3に接触している場合はステップ10へ進み、ステアリングマイク用言語辞書を選択する。
ステップ3でステアリング部接触型マイク3への音声入力の有無を確認する。ステアリング部接触型マイク3から出力される音声信号のレベルが予め設定した音声入力有無判定しきい値を超えた場合は、運転者の発話があり、ステアリング部接触型マイク3で集音したと判定する。音声入力がない場合はステップ2へ戻って上記処理を繰り返す。
運転者の発話があり、ステアリング部接触型マイク3に音声入力があった場合はステップ4へ進み、接触型マイク用音響モデルとステアリングマイク用の言語辞書を用いて上述した音声認識処理を行う。続くステップ5で運転者が取消スイッチ9を操作して音声入力を取り消したか否かを確認し、音声入力の取消があった場合はステップ2へ戻り、上述した処理を繰り返す。音声入力の取消がない場合はステップ6へ進み、音声認識結果の言葉を操作指令としてエアーコンディショナー(不図示)へ出力する。
シート部接触型マイク2およびステアリング部接触型マイク3への接触がない場合はステップ11へ進み、ドアマイク接触検知センサー8により運転者の指が運転席ドアトリムアームレスト25のドア部接触型マイク4に接触しているか否かを確認する。ドア部接触型マイク4に接触している場合はステップ12へ進み、ドアマイク用言語辞書を選択する。
ステップ3でドア部接触型マイク4への音声入力の有無を確認する。ドア部接触型マイク4から出力される音声信号のレベルが予め設定した音声入力有無判定しきい値を超えた場合は、運転者の発話があり、ドア部接触型マイク4で集音したと判定する。音声入力がない場合はステップ2へ戻って上記処理を繰り返す。
運転者の発話があり、ドア部接触型マイク4に音声入力があった場合はステップ4へ進み、接触型マイク用音響モデルとドアマイク用の言語辞書を用いて上述した音声認識処理を行う。続くステップ5で運転者が取消スイッチ9を操作して音声入力を取り消したか否かを確認し、音声入力の取消があった場合はステップ2へ戻り、上述した処理を繰り返す。音声入力の取消がない場合はステップ6へ進み、音声認識結果の言葉を操作指令としてパワーウインドウ駆動制御装置(不図示)へ出力する。
このように、第1の実施の形態によれば、人体から離して用いられ、人の発話音声の空気伝導音を集音する非接触型マイクと、人体に接触させて用いられ、人の発話音声の体内伝導音を集音する接触型マイクとで集音した音声を音声認識用の言語辞書を用いて認識する際に、接触型マイクへの人体の接触を検知し、接触型マイクロフォンへの人体の接触が検知されると、言語辞書の中の接触型マイクロフォン用として予め設定した言葉のみを用いて接触型マイクロフォンにより集音した音声の認識処理を行うようにしたので、複数のマイクで集音して音声認識を行う場合に、使用するマイク専用に設定された言葉を用いて正確な音声認識結果を得ることができ、音声認識性能を向上させることができる。
なお、上述した第1の実施の形態では、各マイクごとに専用の言葉のみを専用の記憶装置に記憶する例を示したが、すべての言葉を1台の言語辞書記憶装置に記憶しておき、どのマイクの音声認識に用いる言葉かを示す属性を言葉ごとに設定しておく。そして、言葉の属性に基づいて言語辞書の中から人体の接触が検知された接触型マイクに対応する言葉を抽出し、抽出した言葉を用いて音声認識を行うようにしてもよい。
また、第1の一実施の形態によれば、接触型マイクを複数個備え、人体の接触が検知された接触型マイクに対し、記憶されている言語辞書の中の当該接触型マイクロフォン用として予め設定した言葉のみを用いて当該接触型マイクロフォンで集音した音声の認識処理を行うようにしたので、複数の接触型マイクで集音して音声認識を行う場合にも、使用する接触型マイク専用に設定された言葉のみを用いて正確な音声認識結果を得ることができ、音声認識性能を向上させることができる。特に、音声操作対象の機器ごとに接触型マイクを配置し、音声操作を行いたい機器の接触型マイクに接触することによって、音声操作を行いたい機器に対して設定された言葉のみを用いて正確な音声認識結果を得ることができる。
第1の実施の形態において、接触検知センサー6〜8により接触型マイク2〜4への接触を検知したときに発話音声の集音とその音声の認識処理を開始するようにしたので、接触型マイク2〜4を用いて音声操作する場合にはPTTスイッチ5の操作が不要となり、操作性が向上する。
第1の実施の形態では接触検知センサー6〜8により接触型マイク2〜4への接触を検知する例を示した。ところで、車両の走行中には運転者の意に反して接触型マイク2〜4への接触が不安定になったり、あるいは音声操作の意志がなく、例えばただ後頭部をヘッドレストにもたれかけることがある。そのような場合に音声認識を開始すると、誤認識による誤操作が起きる可能性がある。そこで、接触検知センサー6〜8の出力が予め設定した接触判定しきい値を超えた状態が予め設定した接触判定時間の間継続した場合に、音声操作のために運転者が接触型マイク2〜4へ接触していると判断し、音声入力と音声認識の待機状態に入るようにしてもよい。これにより、運転者の音声操作の意志を確認してから音声認識処理を開始することができ、接触型マイク2〜4への不安定な接触状態による誤認識を防止することができる。
《発明の第2の実施の形態》
上述した第1の実施の形態では、非接触型マイク1および接触型マイク2〜4に対しそれぞれ専用の言語辞書記憶装置13〜16を備え、それらの中から使用する接触型マイク2〜4に応じた言語辞書を選択する例を示した。この第2の実施の形態では、1台の言語辞書記憶装置にすべての言葉を記憶させるとともに、それらの言葉を接触型マイク2〜4に対しグループ分けし、それらのグループの中から使用する接触型マイク2〜4に応じたグループの言葉が認識される確率を他のグループの言葉よりも高くする。
図7は第2の実施の形態の構成を示す。なお、図1に示す機器と同様な機器に対しては同一の符号を付して相違点を中心に説明する。言語辞書記憶装置18は、車載機器の音声操作に用いられるすべての言葉と、それぞれの言葉に対応する操作内容および制御内容を記憶している。これらの言葉の内、運転席パワーシートを操作するための用いられる言葉をパワーシート操作用言語辞書グループ18a、エアコンを操作するために用いられる言葉をエアコン操作用言語辞書グループ18b、パワーウインドウを操作するために用いられる言葉をパワーウインドウ操作用言語辞書グループ18cとしてグループ分けして記憶する。
パワーシート操作用言語辞書グループ18aに含まれる言葉は、図1に示すシートマイク用言語辞書記憶装置13に記憶される言葉と同様なパワーシート操作指令である。エアコン操作用言語辞書グループ18bに含まれる言葉は、図1に示すステアリングマイク用言語辞書記憶装置15に記憶される言葉と同様なエアコン操作指令である。さらに、パワーウインドウ操作用言語辞書グループ18cに含まれる言葉は、図1に示すドアマイク用言語辞書記憶装置16に記憶される言葉と同様なパワーウインドウ操作指令である。
図8は第2の実施の形態の音声認識制御プログラムを示すフローチャートである。なお、図6に示す処理と同様な処理を行うステップに対しては同一の符号を付して相違点を中心に説明する。処理装置10は車両のイグニッションスイッチ(不図示)がオンすると所定時間、例えば100msecごとにこの制御プログラムを繰り返し実行する。
運転者によるPTTスイッチ5の操作がない場合はステップ21へ進み、シートマイク接触検知センサー6により運転者の後頭部がヘッドレスト22のシート部接触型マイク2に接触しているか否かを確認する。シート部接触型マイク2に接触している場合はステップ22へ進み、シート部接触型マイク2で運転者の発話音声を集音する。
シート部接触型マイク2への接触がない場合はステップ23へ進み、ステアリングマイク接触検知センサー7により運転者の指がステアリングホイール24のステアリング部接触型マイク3に接触しているか否かを確認する。ステアリング部接触型マイク3に接触している場合はステップ24へ進み、ステアリング部接触型マイク3で運転者の発話音声を集音する。
シート部接触型マイク2およびステアリング部接触型マイク3への接触がない場合はステップ25へ進み、ドアマイク接触検知センサー8により運転者の指が運転席ドアトリムアームレスト25のドア部接触型マイク4に接触しているか否かを確認する。ドア部接触型マイク4に接触している場合はステップ26へ進み、ドア部接触型マイク4で運転者の発話音声を集音する。なお、どの接触型マイク2〜4にも接触がない場合はステップ2へ戻り上述した処理を繰り返す。
接触型マイク2〜4のいずれかで運転者の発話音声を集音した後のステップ27において、接触型マイク用音響モデルと言語辞書を用いて音声認識処理を行う。この段階では、記憶装置18に記憶されているすべての言葉を用いて認識処理を行い、認識候補の言葉とそれらの言葉の尤度を求める。
続くステップ28で認識候補の言葉の内、使用した接触型マイクに対応する言語辞書グループに属する言葉の尤度を割り増しする。具体的には、所定の倍数を乗じるか、あるいは所定値を加算する。例えば、運転者がシート部接触型マイク2に後頭部を接触させて発話した場合には、認識候補の言葉の内、使用したシート部接触型マイク2に対応するパワーシート操作用言語辞書グループ18aに属する言葉の尤度のみを1.5倍にする。これにより、認識候補の言葉の内の使用マイクに対応する言語辞書グループに含まれる言葉が認識結果とされる確率が高くなる。
使用マイクの辞書グループに含まれる認識候補の言葉の尤度に割り増しを行った後、ステップ29ですべての認識候補の言葉の中から最も尤度が高い言葉を認識結果の言葉に決定する。
続くステップ5で運転者が取消スイッチ9を操作して音声入力を取り消したか否かを確認し、音声入力の取消があった場合はステップ2へ戻り、上述した処理を繰り返す。音声入力の取消がない場合はステップ6へ進み、音声認識結果の言葉を操作指令として使用マイクに対応する車載機器へ出力する。
このように第2の実施の形態によれば、複数の接触型マイクを備え、人体の接触が検知された接触型マイクに対し、記憶されている言語辞書の中の当該接触型マイク用として予め設定した言葉が認識される確率を高くした後に、すべての言葉を用いて当該接触型マイクで集音した音声の認識処理を行うようにしたので、複数の接触型マイクで集音して音声認識を行う場合にも、使用する接触型マイク専用に設定された言葉が認識される確率が高くなり、正確な音声認識結果を得ることができる。特に、音声操作対象の機器ごとに接触型マイクを配置し、音声操作を行いたい機器の接触型マイクに接触することによって、音声操作を行いたい機器に対して設定された言葉が認識される確率が高くなり、正確な音声認識結果を得ることができる。
《発明の第3の実施の形態》
複数の接触検知センサーにより複数の接触型マイクへの接触が検知された場合に、各接触型マイクの音圧エネルギーに基づいて言語辞書を適切に選択するようにした第3の実施の形態を説明する。なお、この第3の実施の形態の言語辞書の選択方法以外の音声認識手順および方法は上述した第1および第2の実施の形態と同様であり、それらの説明を省略する。
2個の接触型マイクm1とm2があり、それぞれ一体に形成された接触検知センサーを有するとともに、記憶装置にそれぞれの専用言語辞書AとBが記憶されているものとする。今、接触検知センサーにより接触型マイクm1とm2への運転者の接触が同時に検知されたとする。
図9に示すように、接触型マイクm1とm2で同時に集音した音声波形から同一時刻の一部の区間を切り出し、切り出した音声波形の音圧エネルギーを求める。そして、数式1により2つの音声波形の音圧エネルギーを比較し、Jeを算出する。
Figure 2006285103
比較結果のJeが1以上の場合は、接触型マイクm1の音圧エネルギーが接触型マイクm2の音圧エネルギーと同等かそれ以上であるから、接触型マイクm1の言語辞書Aを選択する。この場合は、接触型マイクm1で集音した音声を接触型マイク用音響モデルと言語辞書Aを用いて認識する。
一方、比較結果のJeが1未満の場合は、接触型マイクm1の音圧エネルギーが接触型マイクm2の音圧エネルギーよりも小さいから、接触型マイクm2の言語辞書Bを選択する。この場合は、接触型マイクm2で集音した音声を接触型マイク用音響モデルと言語辞書Bを用いて認識する。
このように第3の実施の形態によれば、人体の接触が検知された接触型マイクが複数個あった場合に、それらの接触型マイクで集音した音声の音圧エネルギーを計算し、音圧エネルギーが高い方の接触型マイクに対し、記憶されている言語辞書の中の当該接触型マイク用として予め設定した言葉のみを用いて当該接触型マイクで集音した音声の認識処理を行うようにしたので、複数の接触型マイクに同時に接触しても、意図する側の接触型マイクとそれに対応する言語辞書が自動的に選択され、正しい音声認識結果を得ることができる。
《発明の第4の実施の形態》
上述した第1および第2の実施の形態では非接触型マイク1を用いて音声操作を行う場合は標準言語辞書を選択し、接触型マイク2〜4を用いて音声操作を行う場合は各接触マイク専用の言語辞書を選択する例を示したが、非接触型マイクと接触型マイクで集音したそれぞれの音声に含まれる雑音エネルギーを比較してマイクを選択し、選択したマイクに適した言語辞書を用いて音声認識する第4の実施の形態を説明する。
図10は第4の実施の形態の構成を示す。説明を理解しやすくするために、この第4の実施の形態では図1に示す第1の実施の形態の構成機器の中からステアリング部接触型マイク3とドア部接触型マイク4、それらの接触検知センサー7,8と言語辞書記憶装置15,16を省き、非接触型マイク1とシート部接触型マイク2とそれらの関連機器を備えた音声認識装置を例に上げて説明する。なお、第4の実施の形態の各構成機器は、図1に示す第1の実施の形態の構成機器と同一の符号を付して説明を省略する。
図11に示すように、非接触型マイク1と接触型マイク2で同時に集音した音声波形から、接触検出後の運転者の発話のない同一時刻の短い区間を切り出し、数式2により非接触型マイク1の集音音声の雑音エネルギーJe1と、数式3により接触型マイク2の集音音声の雑音エネルギーJe2をそれぞれ求める。
Figure 2006285103
Figure 2006285103
まず、接触型マイク2の雑音エネルギーJe2を予め設定した雑音大小判定しきい値Sl2と比較する。比較の結果、接触型マイク2の雑音エネルギーJe2がしきい値Sl2よりも小さい場合は、接触型マイク2の集音音声に混入している雑音は少ないと判断し、接触型マイク2の集音音声を有効としてシートマイク用の言語辞書を選択する。
一方、接触型マイク2の雑音エネルギーJe2がしきい値Sl2以上の場合は、接触型マイク2の集音音声に混入している雑音が多いと判断し、非接触型マイク1の雑音エネルギーJe1を予め設定した雑音大小判定しきい値Sl1と比較する。比較の結果、非接触型マイク1の雑音エネルギーJe1がしきい値Sl1より小さい場合は、非接触型マイク1の集音音声に混入している雑音は少ないと判断し、非接触型マイク1の集音音声を有効として標準言語辞書を選択する。
なお、接触型マイク2の雑音エネルギーJe2がしきい値Sl2以上で、かつ非接触型マイク1の雑音エネルギーJe1がしきい値Sl1以上の場合は、接触型マイク1で集音した音声とシートマイク用言語辞書を選択して音声認識を行う。つまり、接触型マイク2の方が非接触型マイク1よりも周囲雑音の影響を受けにくいため、接触型マイク2の集音音声を優先的に音声認識に用いる。
図12は第4の実施の形態の音声認識制御プログラムを示すフローチャートである。なお、図6に示す処理と同様な処理を行うステップに対しては同一のステップ番号を付して相違点を中心に説明する。処理装置10は車両のイグニッションスイッチ(不図示)がオンすると所定時間、例えば100msecごとにこの制御プログラムを繰り返し実行する。
ステップ2でPTTスイッチ5の操作がなかった場合はステップ31へ進み、シートマイク接触検知センサー6により運転者の後頭部がシート部接触型マイク2に接触しているか否かを確認する。シート部接触型マイク2に接触しているときはステップ32へ進み、運転者の発話音声をシート部接触型マイク2で集音するとともに非接触型マイク1でも集音する。
ステップ33でシート部接触型マイク2で集音した音声の内、接触検出後の運転者の発話のない短い区間の音声に基づいて、数式3によりシート部接触型マイク2の集音音声の雑音エネルギーJe2を計算する。そして、続くステップ34でシート部接触型マイク2の雑音エネルギーJe2を予め設定した雑音大小判定しきい値Sl2と比較する。
シート部接触型マイク2の雑音エネルギーJe2がしきい値Sl2よりも小さい場合は、シート部接触型マイク2の集音音声に混入している雑音は少ないと判断し、ステップ35へ進む。ステップ35ではシート部接触型マイク2で集音した音声により接触型マイク用音響モデルとシートマイク用言語辞書を用いて音声認識処理を行う。
一方、シート部接触型マイク2の雑音エネルギーJe2がしきい値Sl2以上の場合は、シート部接触型マイク2の集音音声に混入している雑音が多いと判断し、ステップ36へ進む。ステップ36では非接触型マイク1で集音した音声の内、シートマイク接触検出後の運転者の発話のない短い区間の音声に基づいて、数式2により非接触型マイク1の集音音声の雑音エネルギーJe1を計算する。
ステップ37で非接触型マイク1の雑音エネルギーJe1を予め設定した雑音大小判定しきい値Sl1と比較する。非接触型マイク1の雑音エネルギーJe1がしきい値Sl1より小さい場合は、非接触型マイク1の集音音声に混入している雑音は少ないと判断し、ステップ38へ進む。ステップ38では非接触型マイク1で集音した音声により非接触型マイク用音響モデルと標準言語辞書を用いて音声認識処理を行う。
なお、ステップ34で接触型マイク2の雑音エネルギーJe2がしきい値Sl2以上あると判定され、さらにステップ37で非接触型マイク1の雑音エネルギーJe1がしきい値Sl1以上あると判定された場合は、ステップ35へ進んで接触型マイク2で集音した音声により接触型マイク用音響モデルとシートマイク用の言語辞書を用いて音声認識処理を行う。
音声認識後、ステップ5へ進み、運転者による音声入力の取消操作があるか否かを確認し、取消操作があればステップ2へ戻って上述した処理を繰り返し、取消操作がなければステップ6へ進み、音声認識結果の操作指令を該当する車載機器へ出力する。
このように第4の実施の形態によれば、非接触型マイクと接触型マイクとで集音した音声の雑音エネルギーをそれぞれ計算し、計算結果の雑音エネルギーに基づいて非接触型マイクと接触型マイクの内のいずれか一方のマイクを選択し、言語辞書の中の選択したマイク用の言葉を用いて音声認識処理を行うようにしたので、雑音の少ないマイクを適切に選択して音声認識を行うことができ、音声認識性能を向上させることができる。
《発明の第5の実施の形態》
複数の接触検知センサーにより複数の接触型マイクへの接触が検知された場合に、各接触型マイクの集音音声の平均振幅に基づいて言語辞書を適切に選択するようにした第5の実施の形態を説明する。なお、この第5の実施の形態の言語辞書の選択方法以外の音声認識手順および方法は上述した第1および第2の実施の形態と同様であり、それらの説明を省略する。
2個の接触型マイクm1とm2があり、それぞれ一体に形成された接触検知センサーを有するとともに、記憶装置にそれぞれの専用言語辞書AとBが記憶されているものとする。今、接触検知センサーにより接触型マイクm1とm2への運転者の接触が同時に検知されたとする。
図13に示すように、接触型マイクm1で集音した音声波形の平均振幅PP1を求めるとともに、接触型マイクm2で集音した音声波形の平均振幅PP2を求め、両者を比較する。接触型マイクm1の平均振幅PP1が接触型マイクm2の平均振幅PP2以上の場合は、平均振幅が大きい接触型マイクm1の集音音声を有効とし、接触型マイクm1専用の言語辞書Aを選択する。
一方、接触型マイクm1の平均振幅PP1が接触型マイク2の平均振幅PP2より小さい場合は、平均振幅が大きい接触型マイクm2の集音音声を有効とし、接触型マイクm2専用の言語辞書Bを選択する。
このように第5の実施の形態によれば、人体の接触が検知された接触型マイクが複数個あった場合に、それらの接触型マイクで集音した音声の平均振幅を計算し、平均振幅が大きい方の接触型マイクに対し、記憶されている言語辞書の中の当該接触型マイク用として予め設定した言葉のみを用いて当該接触型マイクで集音した音声の認識処理を行うようにしたので、複数の接触型マイクに同時に接触しても、意図する側の接触型マイクとそれに対応する言語辞書が自動的に選択され、正しい音声認識結果を得ることができる。
《発明の第6の実施の形態》
複数の接触検知センサーにより複数の接触型マイクへの接触が検知された場合に、各接触型マイクの集音音声の最大振幅に基づいて言語辞書を適切に選択するようにした第6の実施の形態を説明する。なお、この第6の実施の形態の言語辞書の選択方法以外の音声認識手順および方法は上述した第1および第2の実施の形態と同様であり、それらの説明を省略する。
2個の接触型マイクm1とm2があり、それぞれ一体に形成された接触検知センサーを有するとともに、記憶装置にそれぞれの専用言語辞書AとBが記憶されているものとする。今、接触検知センサーにより接触型マイクm1とm2への運転者の接触が同時に検知されたとする。
図14に示すように、接触型マイクm1で集音した音声波形を一定のサンプリング周期でデジタル変換し、最大振幅maxPP1を求めるとともに、接触型マイクm2で集音した音声波形を一定のサンプリング周期でデジタル変換し、最大振幅maxPP2を求め、両者を比較する。接触型マイクm1の最大振幅maxPP1が接触型マイクm2の最大振幅maxPP2以上の場合は、最大振幅が大きい接触型マイクm1の集音音声を有効とし、接触型マイクm1専用の言語辞書Aを選択する。
一方、接触型マイクm1の最大振幅maxPP1が接触型マイク2の最大振幅maxPP2より小さい場合は、最大振幅が大きい接触型マイクm2の集音音声を有効とし、接触型マイクm2専用の言語辞書Bを選択する。
このように第6の実施の形態によれば、人体の接触が検知された接触型マイクが複数個あった場合に、それらの接触型マイクで集音した音声の最大振幅を計算し、最大振幅が大きい方の接触型マイクに対し、記憶されている言語辞書の中の当該接触型マイク用として予め設定した言葉のみを用いて当該接触型マイクで集音した音声の認識処理を行うようにしたので、複数の接触型マイクに同時に接触しても、意図する側の接触型マイクとそれに対応する言語辞書が自動的に選択され、正しい音声認識結果を得ることができる。
特許請求の範囲の構成要素と一実施の形態の構成要素との対応関係は次の通りである。すなわち、処理装置10が処理手段を、シートマイク接触検知センサー6、ステアリングマイク接触検知センサー7およびドアマイク接触検知センサー8が接触検知手段を、標準言語辞書記憶装置13、シートマイク用言語辞書記憶装置14、ステアリングマイク用言語辞書記憶装置15、ドアマイク用言語辞書記憶装置16および言語辞書記憶装置18が記憶手段をそれぞれ構成する。なお、以上の説明はあくまで一例であり、発明を解釈する際、上記の実施の形態の記載事項と特許請求の範囲の記載事項との対応関係になんら限定も拘束もされない。
なお、上述した一実施の形態のよれば、接触型マイクにNAMマイクロフォンを用いたので、車両外部の他車両のエンジン雑音が高い1000Hz以下の周波数帯域におけるS/N特性を改善することができ、車外の騒音に妨げられることなく人の発話音声を確実に集音することができる。
また、骨伝導型マイクは頭部の頭蓋骨に当接する部位に押し当てる必要があるが、NAMマイクは頭蓋骨に当接する部位に限定されず、顔、首、胸部、背中上部などに接触させて人の発話音声を集音できるため、骨伝導マイクと比べて接触部位の制約が少ない。したがって、車両運転者の音声操作に用いても、運転者を拘束して運転操作に影響を与えることがない。
第1の実施の形態の構成を示す図である。 非接触型マイクの設置場所を示す図である。 シート部接触型マイクの設置場所を示す図である。 ステアリング部接触型マイクの設置場所を示す図である。 ドア部接触型マイクの設置場所を示す図である。 第1の実施の形態の音声認識制御プログラムを示すフローチャートである。 第2の実施の形態の構成を示す図である。 第2の実施の形態の音声認識制御プログラムを示すフローチャートである。 第3の実施の形態の言語辞書選択方法を説明するための図である。 第4の実施の形態の構成を示す図である。 第4の実施の形態の言語辞書選択方法を説明するための図である。 第4の実施の形態の音声認識制御プログラムを示すフローチャートである。 第5の実施の形態の言語辞書選択方法を説明するための図である。 第6の実施の形態の言語辞書選択方法を説明するための図である。
符号の説明
1 非接触型マイク
2 シート部接触型マイク
3 ステアリング部接触型マイク
4 ドア部接触型マイク
5 PTTスイッチ
6 シートマイク接触検知センサー
7 ステアリングマイク接触検知センサー
8 ドアマイク接触検知センサー
9 取消スイッチ
10 処理装置
10a CPU
10b ROM
10c RAM
10d 増幅器
10e A/Dコンバーター
11 非接触型マイク用音響モデル記憶装置
12 接触型マイク用音響モデル記憶装置
13 標準言語辞書記憶装置
14 シートマイク用言語辞書記憶装置
15 ステアリングマイク用言語辞書記憶装置
16 ドアマイク用言語辞書記憶装置
17 スピーカー
18 言語辞書記憶装置
18a パワーシート操作用言語辞書グループ
18b エアコン操作用言語辞書グループ
18c パワーウインドウ操作用言語辞書グループ

Claims (12)

  1. 人体から離して用いられ、人の発話音声の空気伝導音を集音する非接触型マイクロフォンと、
    人体に接触させて用いられ、人の発話音声の体内伝導音を集音する接触型マイクロフォンと、
    音声認識用の言語辞書を記憶する記憶手段と、
    前記記憶手段に記憶されている言語辞書を用いて前記マイクロフォンで集音した音声を認識する処理手段とを備えた音声認識装置であって、
    前記接触型マイクロフォンへの人体の接触を検知する接触検知手段を備え、
    前記処理手段は、前記接触検知手段により前記接触型マイクロフォンへの人体の接触が検知されると、前記記憶手段に記憶されている言語辞書の中の前記接触型マイクロフォン用として予め設定した言葉のみを用いて前記接触型マイクロフォンにより集音した音声の認識処理を行うことを特徴とする音声認識装置。
  2. 請求項1に記載の音声認識装置において、
    前記接触型マイクロフォンを複数個備え、
    前記処理手段は、前記接触検知手段により人体の接触が検知された前記接触型マイクロフォンに対し、前記記憶手段に記憶されている言語辞書の中の当該接触型マイクロフォン用として予め設定した言葉のみを用いて当該接触型マイクロフォンで集音した音声の認識処理を行うことを特徴とする音声認識装置。
  3. 請求項2に記載の音声認識装置において、
    前記処理手段は、前記接触検知手段により人体の接触が検知された前記接触型マイクロフォンが複数個あった場合に、それらの接触型マイクロフォンで集音した音声の音圧エネルギーを計算し、音圧エネルギーが高い方の前記接触型マイクロフォンに対し、前記記憶手段に記憶されている言語辞書の中の当該接触型マイクロフォン用として予め設定した言葉のみを用いて当該接触型マイクロフォンで集音した音声の認識処理を行うことを特徴とする音声認識装置。
  4. 請求項2に記載の音声認識装置において、
    前記処理手段は、前記接触検知手段により人体の接触が検知された前記接触型マイクロフォンが複数個あった場合に、それらの前記接触型マイクロフォンで集音した音声の平均振幅または最大振幅を計算し、平均振幅または最大振幅が大きい方の前記接触型マイクロフォンに対し、前記記憶手段に記憶されている言語辞書の中の当該接触型マイクロフォン用として予め設定した言葉のみを用いて当該接触型マイクロフォンで集音した音声の認識処理を行うことを特徴とする音声認識装置。
  5. 請求項1に記載の音声認識装置において、
    前記接触型マイクロフォンを複数個備え、
    前記処理手段は、前記接触検知手段により人体の接触が検知された前記接触型マイクロフォンに対し、前記記憶手段に記憶されている言語辞書の中の当該接触型マイクロフォン用として予め設定した言葉が認識される確率を高くした後に、すべての言葉を用いて当該接触型マイクロフォンで集音した音声の認識処理を行うことを特徴とする音声認識装置。
  6. 請求項5に記載の音声認識装置において、
    前記処理手段は、前記接触検知手段により人体の接触が検知された前記接触型マイクロフォンが複数個あった場合に、それらの前記接触型マイクロフォンで集音した音声の音圧エネルギーを計算し、音圧エネルギーが高い方の前記接触型マイクロフォンに対し、前記記憶手段に記憶されている言語辞書の中の当該接触型マイクロフォン用として予め設定した言葉が認識される確率を高くした後に、すべての言葉を用いて当該接触型マイクロフォンで集音した音声の認識処理を行うことを特徴とする音声認識装置。
  7. 請求項5に記載の音声認識装置において、
    前記処理手段は、前記接触検知手段により人体の接触が検知された前記接触型マイクロフォンが複数個あった場合に、それらの前記接触型マイクロフォンで集音した音声の平均振幅または最大振幅を計算し、平均振幅または最大振幅が大きい方の前記接触型マイクロフォンに対し、前記記憶手段に記憶されている言語辞書の中の当該接触型マイクロフォン用として予め設定した言葉が認識される確率を高くした後に、すべての言葉を用いて当該接触型マイクロフォンで集音した音声の認識処理を行うことを特徴とする音声認識装置。
  8. 請求項1に記載の音声認識装置において、
    前記処理手段は、前記非接触型マイクロフォンと前記接触型マイクロフォンとで集音した音声の雑音エネルギーをそれぞれ計算し、計算結果の雑音エネルギーに基づいて前記非接触型マイクロフォンと前記接触型マイクロフォンの内のいずれか一方のマイクロフォンを選択し、前記言語辞書の中の選択したマイクロフォン用の言葉を用いて音声認識処理を行うことを特徴とする音声認識装置。
  9. 請求項1〜8のいずれかの項に記載の音声認識装置において、
    前記処理手段は、前記接触検知手段により前記接触型マイクロフォンへの人体の接触が検出されたときに、前記接触型マイクロフォンによる音声の集音と集音音声の認識処理を開始することを特徴とする音声認識装置。
  10. 請求項1〜9のいずれかの項に記載の音声認識装置において、
    前記接触検知手段は、前記接触型マイクロフォンへの人体の接触状態が所定時間継続した場合に、前記接触型マイクロフォンへ人体が接触したと判定することを特徴とする音声認識装置。
  11. 請求項1〜10のいずれかの項に記載の音声認識装置において、
    前記接触型マイクロフォンにNAM(Non-Audible Murmur)マイクロフォンを用いることを特徴とする音声認識装置。
  12. 人体から離して用いられ、人の発話音声の空気伝導音を集音する非接触型マイクロフォンと、人体に接触させて用いられ、人の発話音声の体内伝導音を集音する接触型マイクロフォンとで集音した音声を音声認識用の言語辞書を用いて認識する音声認識方法であって、
    前記接触型マイクロフォンへの人体の接触を検知し、前記接触型マイクロフォンへの人体の接触が検知されると、前記言語辞書の中の前記接触型マイクロフォン用として予め設定した言葉のみを用いて前記接触型マイクロフォンにより集音した音声の認識処理を行うことを特徴とする音声認識方法。
JP2005107877A 2005-04-04 2005-04-04 音声認識装置および方法 Pending JP2006285103A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005107877A JP2006285103A (ja) 2005-04-04 2005-04-04 音声認識装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005107877A JP2006285103A (ja) 2005-04-04 2005-04-04 音声認識装置および方法

Publications (1)

Publication Number Publication Date
JP2006285103A true JP2006285103A (ja) 2006-10-19

Family

ID=37407078

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005107877A Pending JP2006285103A (ja) 2005-04-04 2005-04-04 音声認識装置および方法

Country Status (1)

Country Link
JP (1) JP2006285103A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011164538A (ja) * 2010-02-15 2011-08-25 Alpine Electronics Inc ナビゲーション装置
JP2012145636A (ja) * 2011-01-07 2012-08-02 Mitsubishi Electric Corp 音声認識装置および音声認識方法
CN107169096A (zh) * 2017-05-12 2017-09-15 北京小米移动软件有限公司 音频信息处理的方法及装置
WO2019220532A1 (ja) * 2018-05-15 2019-11-21 日本電気株式会社 パターン認識装置、パターン認識方法及びパターン認識プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011164538A (ja) * 2010-02-15 2011-08-25 Alpine Electronics Inc ナビゲーション装置
JP2012145636A (ja) * 2011-01-07 2012-08-02 Mitsubishi Electric Corp 音声認識装置および音声認識方法
CN107169096A (zh) * 2017-05-12 2017-09-15 北京小米移动软件有限公司 音频信息处理的方法及装置
CN107169096B (zh) * 2017-05-12 2020-08-07 北京小米移动软件有限公司 音频信息处理的方法及装置
WO2019220532A1 (ja) * 2018-05-15 2019-11-21 日本電気株式会社 パターン認識装置、パターン認識方法及びパターン認識プログラム
JPWO2019220532A1 (ja) * 2018-05-15 2021-05-20 日本電気株式会社 パターン認識装置、パターン認識方法及びパターン認識プログラム
JP7211419B2 (ja) 2018-05-15 2023-01-24 日本電気株式会社 パターン認識装置、パターン認識方法及びパターン認識プログラム
US11620985B2 (en) 2018-05-15 2023-04-04 Nec Corporation Pattern recognition robust to influence of a transfer path

Similar Documents

Publication Publication Date Title
US8285545B2 (en) Voice command acquisition system and method
JP5622744B2 (ja) 音声認識装置
US8738368B2 (en) Speech processing responsive to a determined active communication zone in a vehicle
EP1933303A1 (en) Speech dialog control based on signal pre-processing
CN108286386B (zh) 车窗控制的方法和装置
US7747446B2 (en) Voice recognition interactive system with a confirmation capability
EP3754653A1 (en) Techniques for wake-up word recognition and related systems and methods
JP2012025270A (ja) 車両用の音量制御装置および音量制御装置用のプログラム
JP2019183504A (ja) 車両用ドア制御装置
JP2006285103A (ja) 音声認識装置および方法
CN112309395A (zh) 人机对话方法、装置、机器人、计算机设备和存储介质
JP3654045B2 (ja) 音声認識装置
CN110211579B (zh) 一种语音指令识别方法、装置及系统
JP2018116130A (ja) 車内音声処理装置および車内音声処理方法
JP2007298592A (ja) 音声処理装置
US9503041B1 (en) Automatic gain control module, method for controlling the same, vehicle including the automatic gain control module, and method for controlling the vehicle
JP3900691B2 (ja) 雑音抑圧装置及び当該装置を用いた音声認識システム
JP4635683B2 (ja) 音声認識装置および方法
JP2007043356A (ja) 音量自動調節装置および音量自動調節方法
JP4320880B2 (ja) 音声認識装置及び車載ナビゲーションシステム
JP3764302B2 (ja) 音声認識装置
JP2004184803A (ja) 車両用音声認識装置
JP4581789B2 (ja) 音声認識装置および方法
US20210343275A1 (en) Method and device for recognizing speech in vehicle
JP2018169441A (ja) 車両制御装置