JPH10232691A - 複数マイク使用による認識結果選択機能付き音声認識装 置 - Google Patents

複数マイク使用による認識結果選択機能付き音声認識装 置

Info

Publication number
JPH10232691A
JPH10232691A JP9035992A JP3599297A JPH10232691A JP H10232691 A JPH10232691 A JP H10232691A JP 9035992 A JP9035992 A JP 9035992A JP 3599297 A JP3599297 A JP 3599297A JP H10232691 A JPH10232691 A JP H10232691A
Authority
JP
Japan
Prior art keywords
microphone
recognition
recognition result
voice
microphones
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9035992A
Other languages
English (en)
Other versions
JP3017118B2 (ja
Inventor
Eisuke Abumi
英輔 鐙
Satoshi Tsukada
聡 塚田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Robotics Engineering Ltd
Original Assignee
NEC Corp
NEC Robotics Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Robotics Engineering Ltd filed Critical NEC Corp
Priority to JP9035992A priority Critical patent/JP3017118B2/ja
Publication of JPH10232691A publication Critical patent/JPH10232691A/ja
Application granted granted Critical
Publication of JP3017118B2 publication Critical patent/JP3017118B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】音声認識率を上るため話者は一つのマイクロホ
ンに常に口を近づける必要があり、話者の姿勢や移動範
囲が制限される。 【解決手段】第1のマイクロホン111、第2のマイク
ロホン112、第3のマイクロホン113と、第1の音
声認識部121、第2の音声認識部122、第3の音声
認識部123と、総合処理部103で構成し、各マイク
ロホンより入力された音声は、それぞれのマイクロホン
毎に接続された音声認識部に入力され、音声認識部は音
声認識と認識結果の出力を総合処理部に送り、総合処理
部は最も適当な認識結果を選択する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は複数マイク使用によ
る認識結果選択機能付き音声認識装置に関し、特に複数
のマイクロホンによる音声入力機能と認識結果選択機能
を有する複数マイク使用による認識結果選択機能付き音
声認識装置に関する。
【0002】
【従来の技術】従来のマイクロホンによる音声入力機能
を有する音声認識装置が、特開平4−273298号公
報に記載されている。
【0003】これは単一指向性マイクロホンを放射状に
複数個配置した「ねぎぼうず状マイクロホン」を有する
音声認識装置である。
【0004】従来の音声認識装置はマイクロホン1本を
使用して音声入力を行うが、話者とマイクロホンが向か
い合った状態でない場合、マイクロホンの指向特性やマ
イクロホンまでの間隔が長くなる等の理由により認識性
能が低下するという欠点があった。
【0005】この欠点を解決するために特開平4−27
3298号公報では、マイクロホンを「ねぎぼうず状」
に配置してマイクロホン毎の認識結果を比較及び選択す
ることにより、音声入力部全体としての指向性を改善し
ている。
【0006】
【発明が解決しようとする課題】上述した従来のマイク
ロホンによる音声入力機能を有する音声認識装置の第1
の問題点は、ねぎぼうず状マイクロホンにより指向特性
は改善されても話者は依然としてマイクロホンを設置し
た場所の周辺に拘束されることである。
【0007】第2の問題点は、例えばマイクロホンに対
して真横を向いた場合や背中を向けた場合などは十分な
音声レベルの入力を行うことは難しい。
【0008】これらの理由は、ねぎぼうず状マイクロホ
ンを構成する各マイクロホンの配置が放射状であるから
である。1点を中心としてマイクロホンを配置した場
合、この1点に対しては指向性の問題は解決されるが、
別の方向を向いて発声した場合には効果はなくなってし
まう。従って、広義での音声入力部は1本であることに
は変わりはない。
【0009】
【課題を解決するための手段】本発明の第1の発明の複
数マイク使用による認識結果選択機能付き音声認識装置
は、マイクロホンを話者の姿勢や移動範囲に対応出来る
位置に複数個配置し、これらのマイクロホンより入力さ
れた音声の認識及び確度の出力を行う認識部と、各認識
部が出力した認識結果の認識結果や確度から最適な認識
結果を選択する総合処理部を有する。
【0010】また、第2の発明の複数マイク使用による
認識結果選択機能付き音声認識装置は、マイクロホンと
音声認識装置との接続をワイヤレス方式で行うように構
成されている。
【0011】また、第3の発明の複数マイク使用による
認識結果選択機能付き音声認識装置は、マイクロホンの
配置する位置を話者の体でなく話者の口を中心とした同
心円上もしくは同心円上に近い位置に配置するように構
成されている。
【0012】[作用]マイクロホンを話者の姿勢や移動
範囲に対応できる位置に複数個配置しているので、話者
は一つのマイクロホンに常に口を近づける必要が無くな
る。複数の認識部が出力した認識結果の比較・選択処理
を行っている。これにより装置全体としては常に確度の
高い認識結果を得ることが出来、認識率を向上させるこ
とが出来る。また、ワイヤレス方式を有することによ
り、話者の行動上の制約はさらに少なくなり、音声入力
時の負担を軽減することが出来る。
【0013】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
【0014】図1は本発明の複数マイク使用による認識
結果選択機能付き音声認識装置の原理を示すブロック図
である。
【0015】図1を参照すると、本発明は第1のマイク
ロホン111、第2のマイクロホン112、第3のマイ
クロホン113と、第1の音声認識部121、第2の音
声認識部122、第3の音声認識部123と、総合処理
部103から構成される。
【0016】第1のマイクロホン111、第2のマイク
ロホン112、第3のマイクロホン113より入力され
た音声は、それぞれのマイクロホン毎に接続された第1
の音声認識部121、第2の音声認識部122、第3の
音声認識部123に入力され、音声認識部は音声認識と
認識結果の出力を行う。
【0017】また、音声認識部は認識結果の確度の出力
も同時に行う。本実施の形態では確度を示す値として、
距離値を用いる。認識結果の確度は、距離値が小さくな
るほど確実になる。音声認識部より出力された認識結果
及び距離値は総合処理部103に送られ、総合処理部1
03はこれらの距離値の比較を行って最も適当な認識結
果を選択する。
【0018】第1のマイクロホン111は右肩、第2の
マイクロホン112は胸部中央、第3のマイクロホン1
13は左肩に装着し、単一指向性のものを使用する。
【0019】次に、本発明の第1の実施の形態につい
て、図2及び図3を参照して詳細に説明する。
【0020】図2は本発明の複数マイク使用による認識
結果選択機能付き音声認識装置の第1の実施の形態を示
すブロック図である。また、図3は本発明の複数マイク
使用による認識結果選択機能付き音声認識装置の第1の
実施の形態におけるマイクロホン装着者の姿勢による口
とマイクとの間隔の関係を示す図である。
【0021】図2では話者は右方向を向いて発声してい
るが、この時の口とマイクロホンとの間隔の関係は図3
のようになる。すなわち、話者が右を向くことによって
胸部中央に装着された第2のマイクロホン312及び左
肩に装着された第3のマイクロホン313と口との間隔
(それぞれL2とL3)は大きくなるが、右肩に装着さ
れた第1のマイクロホン311との間隔(L1)は小さ
くなる。同様に中央を向いて発声した場合には第2のマ
イクロホン312が、左を向いて発声した場合には第3
のマイクロホン313が、口との間隔(それぞれL2あ
るいはL3)が最も小さくなる。
【0022】一般にマイクロホンから音声を入力する場
合、口とマイクロホンとの間隔が小さい方が入力レベル
は大きくなる。また、騒音下の場合は騒音源とマイクロ
ホンとの間隔が十分にあれば、口との間隔に関わらず入
力される騒音のレベルは一定である。従って口とマイク
ロホンとの間隔が小さいほど騒音に対する音声の割合、
すなわちS/N比を向上させることが出来る。マイクロ
ホンの指向特性による影響も間隔が小さくなれば問題に
ならなくなる。
【0023】このような理由により、話者が左右を向い
た場合でもマイクロホンを胸部中央・両肩に装着してお
けば3つのうちの1つはS/N比の良い入力を行うこと
が出来る。
【0024】第1の音声認識部221、第2の音声認識
部222、及び第3の音声認識部223では入力された
音声の認識を行う。この時、一般にS/N比の良い入力
の方が認識率は良くなる。また、認識結果と同時に出力
される距離値も、S/N比の良い方が小さくなる。
【0025】この音声認識部の出力は総合処理部203
に送られる。総合処理部203は認識結果の比較を行
い、最も確度の高い認識結果を選択し、出力する。
【0026】第1の実施の形態の効果は、前述のように
話者が左右を向いて発声をした場合でもS/N比の良い
音声入力を行うことが出来、その結果話者の姿勢が認識
に与える影響を軽減することが出来る事である。
【0027】次に、本発明の第2の実施の形態につい
て、図4を参照して詳細に説明する。
【0028】図4は本発明の複数マイク使用による認識
結果選択機能付き音声認識装置の第2の実施の形態を示
すブロック図である。
【0029】第2の形態における第1のマイクロホン4
11、第2のマイクロホン412、第3のマイクロホン
413の装着方法及びその効果は第1の実施の形態と同
じであるが、図4のように音声認識と同時に総合処理部
の役割も同時に行う音声認識部兼総合処理部423を設
けてある。
【0030】このため、第2の形態では第1の実施の形
態の効果に加えて装置を簡略化させることが出来るとい
う効果を有する。
【0031】次に、本発明の第3の実施の形態につい
て、図5を参照して詳細に説明する。
【0032】図5は本発明の複数マイク使用による認識
結果選択機能付き音声認識装置の第3の実施の形態を示
すブロック図である。
【0033】第1の実施の形態及び第2の実施の形態で
はマイクロホンと音声認識部は有線接続されていたが、
例えば荷物を運びながらの入力といった場合は邪魔にな
ることがある。また、作業箇所が頻繁に変わるような場
合にも装置の移動が面倒である。そこで図5のように第
1のマイクロホン511、第2のマイクロホン512、
第3のマイクロホン513と、第1の音声認識部52
1、第2の音声認識部522、第3の音声認識部523
の接続を無線接続する。具体的には各マイクロホンに送
信部541,542,543を接続し、音声認識部には
送信部に対応した受信部551,552,553を接続
する。
【0034】第3の実施の形態の効果は第1の実施の形
態の効果に加え、配線により話者が受ける行動の制限を
軽減するという効果を有する。
【0035】次に、本発明の第4の実施の形態につい
て、図6を参照して詳細に説明する。
【0036】図6は本発明の複数マイク使用による認識
結果選択機能付き音声認識装置の第4の実施の形態を示
すブロック図である。
【0037】第4の実施の形態は図6を参照すると、第
1のマイクロホン611、第2のマイクロホン612、
第3のマイクロホン613と、それぞれ各マイクロホン
に送信部641,642,643を接続し、送信部に対
応した受信部651,652,653を無線で接続し、
受信部に対応した第1の音声認識部621、第2の音声
認識部622、及び音声認識部兼総合処理部623から
構成される。第4の実施の形態は第2の実施の形態と第
3の実施の形態を組み合わせた構成になっており、第1
の実施の形態の効果に加えて装置の簡略化及び配線によ
る話者の行動の制限の軽減という効果を得ることが出来
る。
【0038】次に、本発明の第5の実施の形態につい
て、図7を参照して詳細に説明する。
【0039】図7は本発明の複数マイク使用による認識
結果選択機能付き音声認識装置の第5の実施の形態を示
すブロック図である。
【0040】第1の実施の形態から第4の実施の形態ま
では話者に第1のマイクロホン711、第2のマイクロ
ホン712、第3のマイクロホン713を装着した構成
だったのに対して、第5の形態では図7のように作業机
に第1のマイクロホン711、第2のマイクロホン71
2、第3のマイクロホン713をを配置した構成になっ
ている。第1のマイクロホン711、第2のマイクロホ
ン712、第3のマイクロホン713は話者を中心とし
て同心円上に配置(より確度を上るのであれば話者の口
を中心とした同心円上もしくは同心円上に近いところに
配置)されており、話者が左右を向いても第1の実施の
形態と同様に常にどれかのマイクロホン711,71
2,713が最適な入力を得られるようになっている。
【0041】第5の形態では話者にマイクロホンを装着
しなくても済む為、第1の実施の形態の効果に加えて、
不特定話者が頻繁に席を交代して入力を行う場合のマイ
クロホン1の付け替えの煩雑さの解消、マイクロホンを
装着することによる服装の乱れ等の不快感の解消等の効
果を得ることが出来る。
【0042】なお、本発明の原理及び第1の実施の形態
から第5の実施の形態まで、マイクロホンを3本用いる
場合について説明したが、マイクロホン及びこれに対応
した音声認識部、送信部、受信部の数については複数で
あれば制限は無い。
【0043】また、本発明では確度を表す値として距離
値を用いたが、確度を表す値であれば距離値以外を用い
ても構わない。
【0044】
【発明の効果】以上説明したように、本発明の複数マイ
ク使用による認識結果選択機能付き音声認識装置の、第
1の効果は、話者の姿勢が音声認識装置の認識率に及ぼ
す影響を減少させることが出来るという事である。
【0045】その理由は、話者の姿勢に対応した場所に
マイクロホンを複数個配置することにより、少なくとも
その中のどれか1つは最適な音声入力が行われる為であ
る。またその最適な入力から得られた認識結果を他の確
度の低い認識結果や誤認識結果と比較して選択出来る為
である。
【0046】第2の効果は、話者が音声入力を行う際の
負担を軽減できることである。
【0047】その理由は、上記の第1の効果により話者
の姿勢を制限しなくても認識率を維持出来るからであ
る。
【図面の簡単な説明】
【図1】本発明の複数マイク使用による認識結果選択機
能付き音声認識装置の原理を示すブロック図である。
【図2】本発明の複数マイク使用による認識結果選択機
能付き音声認識装置の第1の実施の形態を示すブロック
図である。
【図3】本発明の複数マイク使用による認識結果選択機
能付き音声認識装置の第1の実施の形態におけるマイク
ロホン装着者の姿勢による口とマイクとの間隔の関係を
示す図である。
【図4】本発明の複数マイク使用による認識結果選択機
能付き音声認識装置の第2の実施の形態を示すブロック
図である。
【図5】本発明の複数マイク使用による認識結果選択機
能付き音声認識装置の第3の実施の形態を示すブロック
図である。
【図6】本発明の複数マイク使用による認識結果選択機
能付き音声認識装置の第4の実施の形態を示すブロック
図である。
【図7】本発明の複数マイク使用による認識結果選択機
能付き音声認識装置の第5の実施の形態を示すブロック
図である。
【符号の説明】
111,211,311,411,511,611,7
11 第1のマイクロホン 112,212,312,412,512,612,7
12 第2のマイクロホン 113,213,313,413,513,613,7
13 第3のマイクロホン 121,221,421,521,621,721
第1の音声認識部 122,222,422,522,622,722
第2の音声認識部 123,223,523,723 第3の音声認識部 103,203,503,703 総合処理部 541,542,543,641,642,643
送信部 551,552,553,651,652,653
受信部 423,623 音声認識部兼総合処理部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 塚田 聡 東京都港区芝五丁目7番1号 日本電気株 式会社内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 話者の姿勢が変化しても音声入力を行う
    ことが出来るように話者の体に複数個装着されたマイク
    ロホンと、前記マイクロホンから入力された音声信号の
    認識及び認識結果の出力を行う認識部と、前記認識部か
    ら出力された認識結果の比較を行い、最も確度の高い認
    識結果を選択・出力する総合処理部を備えることを特徴
    とする複数マイク使用による認識結果選択機能付き音声
    認識装置。
  2. 【請求項2】 前記マイクロホンと前記認識部との間を
    ワイヤレス接続化したことを特徴とする請求項1記載の
    複数マイク使用による認識結果選択機能付き音声認識装
    置。
  3. 【請求項3】 マイクロホンの配置する位置を話者の体
    でなく話者の口を中心とした同心円上もしくは同心円上
    に近い位置に配置したことを特徴とする請求項1又は請
    求項2記載の複数マイク使用による認識結果選択機能付
    き音声認識装置。
JP9035992A 1997-02-20 1997-02-20 複数マイク使用による認識結果選択機能付き音声認識装置 Expired - Fee Related JP3017118B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9035992A JP3017118B2 (ja) 1997-02-20 1997-02-20 複数マイク使用による認識結果選択機能付き音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9035992A JP3017118B2 (ja) 1997-02-20 1997-02-20 複数マイク使用による認識結果選択機能付き音声認識装置

Publications (2)

Publication Number Publication Date
JPH10232691A true JPH10232691A (ja) 1998-09-02
JP3017118B2 JP3017118B2 (ja) 2000-03-06

Family

ID=12457336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9035992A Expired - Fee Related JP3017118B2 (ja) 1997-02-20 1997-02-20 複数マイク使用による認識結果選択機能付き音声認識装置

Country Status (1)

Country Link
JP (1) JP3017118B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006276604A (ja) * 2005-03-30 2006-10-12 Nissan Motor Co Ltd 音声認識装置および方法
JP2006276603A (ja) * 2005-03-30 2006-10-12 Nissan Motor Co Ltd 音声認識装置および方法
KR100855592B1 (ko) 2007-01-11 2008-09-01 (주)에이치씨아이랩 발성자 거리 특성에 강인한 음성인식 장치 및 그 방법
KR101037374B1 (ko) * 2004-06-25 2011-05-26 레이디오펄스 주식회사 다중입력 데이터처리장치 및 방법
JPWO2011121978A1 (ja) * 2010-03-29 2013-07-04 日本電気株式会社 音声認識システム、装置、方法、およびプログラム
CN107424611A (zh) * 2017-07-07 2017-12-01 歌尔科技有限公司 语音交互方法及装置
CN109873678A (zh) * 2019-01-30 2019-06-11 努比亚技术有限公司 一种通话控制方法、设备及计算机可读存储介质
WO2019159253A1 (en) * 2018-02-14 2019-08-22 Nec Corporation Speech processing apparatus, method, and program

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101037374B1 (ko) * 2004-06-25 2011-05-26 레이디오펄스 주식회사 다중입력 데이터처리장치 및 방법
JP2006276604A (ja) * 2005-03-30 2006-10-12 Nissan Motor Co Ltd 音声認識装置および方法
JP2006276603A (ja) * 2005-03-30 2006-10-12 Nissan Motor Co Ltd 音声認識装置および方法
JP4581789B2 (ja) * 2005-03-30 2010-11-17 日産自動車株式会社 音声認識装置および方法
JP4635683B2 (ja) * 2005-03-30 2011-02-23 日産自動車株式会社 音声認識装置および方法
KR100855592B1 (ko) 2007-01-11 2008-09-01 (주)에이치씨아이랩 발성자 거리 특성에 강인한 음성인식 장치 및 그 방법
JPWO2011121978A1 (ja) * 2010-03-29 2013-07-04 日本電気株式会社 音声認識システム、装置、方法、およびプログラム
CN107424611A (zh) * 2017-07-07 2017-12-01 歌尔科技有限公司 语音交互方法及装置
CN107424611B (zh) * 2017-07-07 2021-10-15 歌尔科技有限公司 语音交互方法及装置
WO2019159253A1 (en) * 2018-02-14 2019-08-22 Nec Corporation Speech processing apparatus, method, and program
JP2021510427A (ja) * 2018-02-14 2021-04-22 日本電気株式会社 音声処理装置、方法およびプログラム
US11600273B2 (en) 2018-02-14 2023-03-07 Nec Corporation Speech processing apparatus, method, and program
CN109873678A (zh) * 2019-01-30 2019-06-11 努比亚技术有限公司 一种通话控制方法、设备及计算机可读存储介质

Also Published As

Publication number Publication date
JP3017118B2 (ja) 2000-03-06

Similar Documents

Publication Publication Date Title
US10524050B2 (en) Dual-use bilateral microphone array
JP4873913B2 (ja) 音源分離システムおよび音源分離方法、並びに音響信号取得装置
JP2843278B2 (ja) 騒音制御型送受話器
EP1489596B1 (en) Device and method for voice activity detection
EP3392668B1 (en) Method and apparatus for voice activity determination
US9949021B1 (en) Intelligent conversation control in wearable audio systems
EP3539301A1 (en) Controlling wind noise in a bilateral microphone array
US20180227677A1 (en) Binaural Hearing Assistance Operation
EP1017252A2 (en) Hearing aid system
US10206043B2 (en) Method and apparatus for audio pass-through
WO2004034734A1 (ja) アレイ装置および携帯端末
KR102545750B1 (ko) 헤드셋들을 위한 유연한 음성 캡처 프론트-엔드
JP2008191662A (ja) 音声制御システムおよび音声制御方法
EP3707917B1 (en) Intelligent conversation control in wearable audio systems
JP2007535219A (ja) マルチモード音声処理装置およびその制御方法
US20140355775A1 (en) Wired and wireless microphone arrays
WO2019090283A1 (en) Coordinating translation request metadata between devices
CN105575399A (zh) 用于选择音频过滤方案的系统和方法
CN109327769B (zh) 车载座椅独享声音设备
WO2009072040A1 (en) Hearing aid controlled by binaural acoustic source localizer
US10602274B2 (en) Audio input/output device
JPH10232691A (ja) 複数マイク使用による認識結果選択機能付き音声認識装 置
TW202147862A (zh) 強烈雜訊干擾存在下穩健的揚聲器定位系統與方法
US10491998B1 (en) Vehicle communication systems and methods of operating vehicle communication systems
US11889268B2 (en) Method for operating a hearing aid system having a hearing instrument, hearing aid system and hearing instrument

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19991207

LAPS Cancellation because of no payment of annual fees