JPH03131198A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH03131198A
JPH03131198A JP1270010A JP27001089A JPH03131198A JP H03131198 A JPH03131198 A JP H03131198A JP 1270010 A JP1270010 A JP 1270010A JP 27001089 A JP27001089 A JP 27001089A JP H03131198 A JPH03131198 A JP H03131198A
Authority
JP
Japan
Prior art keywords
microphone
voice
power ratio
source
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1270010A
Other languages
English (en)
Inventor
Akira Tsuruta
彰 鶴田
Shin Kamiya
伸 神谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1270010A priority Critical patent/JPH03131198A/ja
Publication of JPH03131198A publication Critical patent/JPH03131198A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は、入力された音声を認識する音声認識装置に
関し、特に音声源とマイクロホンとの相対位置が不適当
であることを検出することができろ音声認識装置に関す
る。
〈従来の技術〉 音声認識装置を内蔵したワード・プロセッサやパーソナ
ル・コンピュータ等を音声(こよって操作する場合は、
マイクロホンと音声源(話者の口)との相対位置関係が
適当であるか否かが認識率に大きく影響する。このよう
な音声源とマイクロポンとの相対位置のずれに起因した
誤認識は、特に特定話者による音声認識において音声登
録した日と音声認識の日との間に数日の間隔がある場合
に、音声登録の際のマイクロホンの音声源に対する位置
と音声認識の際のマイクロホンの音声源に対する位置と
が異なるため1.:発生しやすいのである。
従来の音声認識装置においては、マイクロホンと音声源
との相対位置は余り4慮されず、僅かに入力音声のスペ
クトル変動によってマイクロホン七音声源とのI’ll
対位置のずれを検出して相対位置の復元を話者に指示す
るらの(特開昭63−131194号公報)等が在るの
みである。
〈発明が解決しよろとする課題〉 しかしながら、上記従来のマイクロホンと音声源との相
対位置のずれ検出方法は、人力音声のスペクトル変動を
用いているため、発声の変化によるスペクトル変動をマ
イクロホンの位置変動上1娯認識する場合や逆の場合が
あり、認識率がさほど向上しないという問題がある。そ
こで、発声の変化によるスペクトル変動の少ない母音の
みのスペクトル変動を用いることが考えられろ。ところ
が、そのような場合には音声認識処理結果に基づいてマ
イクロポンと音声源との相対位置ずれ検出処理を実行し
なげればならず′、音声認識処理か′Jすヂす複雑にな
ってしようという問題がある。
そこで、この発明の目的は、マイクロポンと音声源との
相対位置が゛不適当であることを安定して検知できる音
声認識装置を提供するごとにある。
〈課題を解決するための手段〉 上記目的を達成するため、第1の発明は、音声信秒の特
徴j1に居づいて入力音声を認識する音声認識装置にお
いて、音声源の近傍に配置された第1マイクロホンと、
上2音声源から一定距離の位置1こ配置された第2マイ
クロホンと、上記第jマイク〔lポンからの出力のパワ
ーと1コ紀第2マイクロホンからの出力のパワーとに基
づいて両パワーのパワー比を求めろパワー比算出部と、
上記パワー比算出部によ−〕で求められたパワー比の値
か所定の条件を満たすか否かを判別し、その結果上記所
定の条件を満たず場合に上記第1マイクロホンの音声7
河(に対する位置力〈7′適当である七判定j′るマイ
ク〔lポン位置判定部を備えたことを特徴としている。
また、第2の発明は、上記音声北(識装置にお[)で、
音声登録時に−F;記パワー比算出部によ−)で求めら
れたパワー比の平均値である平均パワー比を格納するメ
モリを’Qえ、上記マイクロホン位1゛、¥判定部(j
、ゴニ記メモリ(こ格納された音声登録時の([;。
均パワー比のIi:i七音声認識時におけるパワー比の
値上を比較し、音声認識時のパワー比の値が音声登録時
の平均パワー比の値に基づく所定領域内に入らない場合
に上記第1マイクロホンの音声源に対する位置が不適当
であると判定することを特徴としている。
また、第3の発明は、上記各音声認識装置に713いて
、上記第17Iクロポンは音声源に対する位置が変更可
能であ−て、上記マイクロホン位置判定部によって上記
第1マイクロホンの音声源に対する位置が不適当である
と判定された場合に第1マイクロホンの位置変更の指示
を表示する表示部を備えたことを特徴としている。
く作用〉 第1の発明においては、音声源から発せられた音声は、
上記音声源の近傍に配置された第1マイクロポンと上記
音声源から一定距離に配置された第2マイクロホンとに
入力されろ。そして、パワー比算出部によって、上記第
1マイクロホンからの出力のパワーき第2マイクロ示ン
からの出力のパワーとに基づいて両パワーのパワー比か
求lられる。そうすると、マイクロホン位置判定部によ
って、上記パワー比算出部によって求められたパワー比
の値が所定の条件を満たす場合に、上記第1マイクロホ
ンの音声源に対する位置が不適当であると判定される。
したがって、第1マイクロホンの音声源に対する位置が
不適当か否かを常時監視できろ。
また、第2の発明においては、上記音声認識装置におけ
る上記パワー比算出部によって音声登録時に求められた
平均パワー比の値がメモリに格納される。そうすると、
音声認識時において、上記マイクロホン位置判定部によ
って上記メモリに格納された音声登録時の平均パワー比
の値と音声認識時におけるパワー比の値とが比較される
。そして、音声認識時のパワー比の値が音声登録時の平
均パワー比の値に基づく所定領域内に入らない場合に、
上記第17ンクロホンの音声源に対する位置か不適当で
あると判定されるのである。したかって、特定話者によ
る音声認識の際の音声R(識時に、常に音声登録時と同
じ状態で音声入力を行うことが可能となる。
また、第3の発明においては、上記各音声認識装置のマ
イクロホン位置判定部によって上記第1マイクロホンの
音声源に対する位置が不適当であると判定され、表示部
に第1マイクロホンの位置変更の指示が表示される。そ
うすると、上記表示部の表示内容に従って、操作者によ
って上記第1マイクロホンの音声源に対する位置が変更
される。
したがって、第1マイクロホンの音声源に対する位置が
常に最適な位置に保たれる。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。
第1図はこの発明の一実施例を示すブロック図である。
音声源1から発声された音声は、音声源1の近傍に配置
した第1マイクロホン2と音声源1から一定距盾に配置
された第2マイクロホン3とに人力する。そうすると、
第1マイクロホン2および第2マイクロホン3に入力さ
れた音声源1からの音声は夫々音響信号に変換されて増
幅部4に入力される。そして、増幅WJ4によって夫々
音声帯域のみが通過されと共に増幅されて特徴抽出部5
に送出される。特徴抽出部5は、入力された2+、第2
マイクロホン2.3からの音声信号の波形に居づいて特
徴量(例えば、パワー、パワー比ケプストラム等)を計
算し、入力音声の特徴パターンを求める。
標学パターン記憶WJ7には、予め種々の音声の標準パ
ターンが登録されており、音声認識部8は、例えば特徴
抽出部5から送出される入力音声の特徴パターンと標準
パターン記憶部7に登録されている標準パターンとのパ
ターンマツチングにより、標準パターン七の尤度を求め
て入力音声を認識する。そして、認識結果は表示部IO
に表示される。
メモリ9は上述の音声認識動作において使用される作業
用メモリであり、キーボード11は音声認識動作の指示
を入力するためのものである。制御部6は、特徴抽出部
5.漂学パターン記憶部7音声認識部8.メモリ91表
示m10.キーホード11等音声認識装置全体を制御し
て音声認識動作を実行する。それと同時に、後に詳述す
るようにして第1マイクロホン2の音声源1に対する位
置が不適当であるか否かの判定処理を実行する。
上記第1マイクロホン2と第2マイクロホン3は、例え
ば第2図に示すようなヘッドセット・マイクロホンで構
成干る。話者の頭部に沿うように湾曲した帯体21の両
端には、頭部に当接する面にバットが張られた頭部装着
部材22.23が夫々取り付けられている。そして、一
方の頭部装着部材23の外側に取り付けられた腕体保持
部材24には、この腕体保持部材24を貫通して貫通方
向に摺動可能にかつ腕体保持部材24を中心として回動
可能なように腕体25を装着する。また、腕体保持部材
24の腕体25の外側に(キイヤホン26を取り付ける
。その際に、イヤホン26の位置はヘッドセット・マイ
クロホンを頭部1こ装着した場合に調度耳の位置になる
ように設定しておく。
上記腕体25の前端には第1マイクロホン2を取り付け
、帯体21の頂点には第2マイクロホン3を取り付ける
。こうすることによって、ヘッドセット・マイクロホン
を頭部jこ装着した場合、ヘッドセット・マイクロホン
は頭部装着部材22,23によって頭部の所定の位置に
固定されるので、音声源である口に対する第2マイクロ
ホン3の距離は一定となるのである。一方、第1マイク
ロホン2は口の近傍に配置されると共に、その口に対す
る位置は第1マイクロホン2を手で前後にスライドした
り回転すること?こよって自由に変更できるのである。
上記構成の音声認識装置は次のようにして音声源1と第
1マイクロホン2との相対位置が不適当か否かを検知す
る。
音声源1と第1マイクロホン2との相対位置が理想的な
位置関係にある場合において、特徴抽出部5によって算
出された第1マイクロホン2からの出力のパワーをPa
、第2マイクロホン3からの出力のパワーをPb、両者
のパワー比(Pa/Pb)をC6とする。一方、音声認
識時において、第1マイクロホン2の位置が移動して第
1マイクロホン2からの出力のパワーがPa’に変化し
たとする。
そうすると、特徴抽出部5によって算出される第1マイ
クロホン2の移動後のパワー比はPa’/Pbとなる。
その場合、第1マイクロホン2の位置が変わって音声源
1からの相対位置が遠くなった場合のパワー比は、 Pa″/Pb<C6 となる。また、第1マイクロホン2の位置が変わって音
声源1からの相対位置が近くなった場合のパワー比は、 Pa’/Pb>C。
となる。
そこで、制御部6は、音声認識時におけるパワー比(P
a’/Pb)が理想条件におけるパワー比C8に対して
下記の(1)式のような関係にある場合には第1マイク
ロホン2の位置は理想位置より音声源1に近いと判定す
る。一方、(2)式のような関係1こある場合には第1
マイクロホン2の位置は理想位置より音声源1から離れ
ていると判定するのである。
P a’ /P b<αxco−(D Pa’/Pb>βXCo−(2) 但し、  (α<1<β) 但し、α、βは実験で求めた定数である。
そして、音声源1と第1マイクロホン2との相対位置が
理想的であるときのパワー比C6表音声認識時における
パワー比との関係に基づいて、その関係が例えば上述の
(+)式の関係になった場合には「マイクロホンを口元
に近付けてください。ゴと第1マイクロホン2の位置変
更の指示を表示部10に表示するのである。こうするこ
とによって、話者は表示部10の表示によって第1マイ
クロ示ン2の口元に対する位置が適当であるか否かを知
ることができ、音声操作によるワード・プロセッサやパ
ーソナル・コンピュータを長時間操作する場合でも、音
声源1と第1マイクロホン2との相対位置を常時理想的
な位置に保つことができるのである。
通常、音声操作間器を操作する際にR,7%−されろ音
声は、会話の際とは異なってほぼ一定の強さで発声され
る。したがって、発声内容が変化してらその平均パワー
は安定している。したがって、本実施例によるマイク0
ホンの位置が不適当か否かの判定は、スペクトル変動に
基づ< f−11定よ1ン安定して判定できるのである
このように、本実施例においては、音声源1の近傍に配
置した第1マイクロホン2からの音声信号と音声源1か
ら一定距離に配置した第2マイクロホン3からの音声信
号とに基づいて、特徴抽出部5によって夫々のパワーを
求めて両者のパワー比を算出する。そして、制御fi6
によって、音声源1と第1マイクロホン2との相対位置
か゛理想的な位置関係にある場合のパワー比C9吉音声
認識時におけるパワー比とから、上述の(1)、(2)
式に基づいて第1マイクロホン2の位置が不適当か否か
を判定する。そして、第1マイクロホン2のIff置が
゛不適当であると判定された場合にはその旨を表示11
10に表示する。
したがって、話者は表示f$10の表示内容従って第1
マイクロホン2の音声1原1に対する位置を常Iこ最J
/こ保つことかできる。すなわち、第1マイクロホン2
の位置ず右に起因する誤認識を無くすことができるので
ある。
また、上述の手法を利用して、次のようにして特定話者
による音声認識の際の誤認識の低減を図ることができる
すなわち、まず音声登録時における特定話者のパワー比
の平均値を#徴抽出部51こよって算出と7で特徴パタ
ーン記憶部7に記憶しておく。そして、制御部6は、上
記特徴パターン記憶部7に記憶された音声登録時の平均
パワー比の値を上記実施例における第1マイクロホン2
の位置が理想的な場合のパワー比の値C6とじて、上記
(1)、(2)式に基づいて音声認識時の第1マイクロ
ホン2の位置の良否を判定するのである。こうすること
によって、音声認識時における音声源1と第1マイクロ
ホン2との相対位置が音声登録時における音声源1と第
1マイクロホン2との相対位置と同じか否かを検知でき
るのである。
そして、上記実施例の場合と同様にパワー比の関係が例
えば上述の(2)式の関係になった場合には、表示部1
0に「マイクロホンを口元から遠ざけてください。Jと
表示するのである。したがって、話者は音声認識の際に
表示部10の表示に従って常に音声登録時の場合と同じ
状態で音声入力を実施できるのである。
このように、本実施例においては、特定話者による音声
認識の* /、:算出された第1マイクロホン2からの
出力のパq−と第2マイクロホン3からの出力のパワー
とからの平均パワー比の値を特徴パターン記憶部7に記
憶しておく。そして、制御部6は、この特徴パターン記
憶部7に記憶された平均パワー比の値と音声認識時にお
けるパワー比の値とから、上述の(1)、(2)式に基
づいて第1マイクaホン2の位置が′不適当か否かを判
定する。
そして、第1マイクロホン2の位置が不適当であると判
定された場合にはその旨を表示部10に表示する。
したかって、話者は表示LIOの表示内容に従って音声
認識時における第1マイクロホン2の音声源1に対する
位置を常に音声登録時と同じ最適位置に保つ二きができ
る。すなわち、特定話者による音声認識の際において、
音声登録時と音声認識装置の間に数日間の差があっても
音声登録時と同じ状陣で音声入力ができ、音声入力状態
の変動に起因する誤認識を無くすことができるのである
本実施例においては、音声認識時における第1マイクロ
ホン2の最適位置をパワーに基づいて求めている。すな
わち、本実施例は単なる第1マイクロホン2の音声源1
に対する距離を最適に保つのではなく、第1マイクロホ
ン2からの入力状態を最適1こ保つのである。したがっ
て、本実施例は音声登録時のマイクロホンと音声認識時
のマイクロホンが異なる場合にも適応できるのである。
また、本実施例において、音声登録時の際に上述の実施
例で述べた音声源と第1マイクロホンとの相対位置を理
想的な位置に保つ手法を用いれば、安定した平均パワー
比の値を求めることかできるのである。
上記谷実施例における表示F$10における表示は、C
RT(カソードルイ・チューブ)デイスプレィによる画
面表示でもよいし、第2図のイヤホン261こお?する
音声表示でもよい。
この発明における第1マイクロホン2の位置が不適当か
否かの判定のアルゴリズムは上記各実施例におけるアル
ゴリズムに限定されるものではない。
〈発明の効果〉 以上より明らかなように、第1の発明の音声認識装置は
、音声源近傍の第1マイクロホンからの出力のパワーと
音声源から一定距離の位置に在る第2マイクロホンから
の出力のパワーとに基づくパワー比をパワー比算出部に
よって求め、このパワー比の値に基づいて上記第1マイ
クロホンの音声源に対する位置の良否をマイクロホン位
置判定部によって判定するようにしたので、マイクロホ
ンと音声源との相対位置が不適当であることを安定して
検知でき、マイクロホンの位置の良否を常時監視できる
また、第2の発明の音声認識装置は、第1の発明の音声
認識装置に、音声登録時に上記パワー比算出部によって
算出される平均パワー比の値を格納するメモリを備えて
、上記マイクロホン位置判定部によって、音声認識時に
おけるパワー比の値と音声登録時の平均パワー比の値と
に基づいて上記第1マイクロホンの位置の良否を判定す
るようにしたので、音声認識時におけるマイクロホン七
音声源との相対位置が不適当であることを安定して検知
でき、音声認識時における音声入力状態を常時音声認識
時と同じに保つことができるようになる。
また、第3の発明の音声認識装置は、上記各音声認識装
置における上記第1マイクロホンの音声源に対する位置
を変更可能にすると共に、上記マイクロホン位置判定部
によって第1マイクロホンの位置か不適当であると判定
された場合に、第1マイクロホンの位置変更の借示を表
示部に表゛示するようにしたので、上記第1マイクロホ
ンの位置の良否を安定して判定すると共に、表示部の表
示結果に従って第1マイクロホンの位置を常時最適に推
持できる。
【図面の簡単な説明】
第1図はこの発明の音声認識装置における一実施例のブ
ロック図、第2図は第1図におけろマイクロホンの構成
の一実施例を示す図である。 1・・・音声源、    2・・・第1マイクロホン、
3・・・第2マイクロホン、   5・・・特徴抽出部
、6・・・制御部、     7・・・標準パターン記
憶部、8・・音声認識部、  10・・・表示部。

Claims (3)

    【特許請求の範囲】
  1. (1)音声信号の特徴量に基づいて入力音声を認識する
    音声認識装置において、 音声源の近傍に配置された第1マイクロホンと、上記音
    声源から一定距離の位置に配置された第2マイクロホン
    と、 上記第1マイクロホンからの出力のパワーと上記第2マ
    イクロホンからの出力のパワーとに基づいて両パワーの
    パワー比を求めるパワー比算出部と、 上記パワー比算出部によって求められたパワー比の値が
    所定の条件を満たすか否かを判別し、その結果上記所定
    の条件を満たす場合に上記第1マイクロホンの音声源に
    対する位置が不適当であると判定するマイクロホン位置
    判定部を備えたことを特徴とする音声認識装置。
  2. (2)請求項1に記載の音声認識装置において、音声登
    録時に上記パワー比算出部によって求められたパワー比
    の平均値である平均パワー比を格納するメモリを備え、 上記マイクロホン位置判定部は、上記メモリに格納され
    た音声登録時の平均パワー比の値と音声認識時における
    パワー比の値とを比較し、音声認識時のパワー比の値が
    音声登録時の平均パワー比の値に基づく所定領域内に入
    らない場合に上記第1マイクロホンの音声源に対する位
    置が不適当であると判定することを特徴とする音声認識
    装置。
  3. (3)請求項1あるいは請求項2に記載の音声認識装置
    において、 上記第1マイクロホンは音声源に対する位置が変更可能
    であって、 上記マイクロホン位置判定部によって上記第1マイクロ
    ホンの音声源に対する位置が不適当であると判定された
    場合に第1マイクロホンの位置変更の指示を表示する表
    示部を備えたことを特徴とする音声認識装置。
JP1270010A 1989-10-16 1989-10-16 音声認識装置 Pending JPH03131198A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1270010A JPH03131198A (ja) 1989-10-16 1989-10-16 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1270010A JPH03131198A (ja) 1989-10-16 1989-10-16 音声認識装置

Publications (1)

Publication Number Publication Date
JPH03131198A true JPH03131198A (ja) 1991-06-04

Family

ID=17480294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1270010A Pending JPH03131198A (ja) 1989-10-16 1989-10-16 音声認識装置

Country Status (1)

Country Link
JP (1) JPH03131198A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07191688A (ja) * 1993-12-27 1995-07-28 Nec Corp 音声認識装置
WO2017195412A1 (ja) * 2016-05-13 2017-11-16 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63131194A (ja) * 1986-11-21 1988-06-03 株式会社日立製作所 音声認識装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63131194A (ja) * 1986-11-21 1988-06-03 株式会社日立製作所 音声認識装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07191688A (ja) * 1993-12-27 1995-07-28 Nec Corp 音声認識装置
WO2017195412A1 (ja) * 2016-05-13 2017-11-16 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JPWO2017195412A1 (ja) * 2016-05-13 2019-03-14 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Similar Documents

Publication Publication Date Title
US10535362B2 (en) Speech enhancement for an electronic device
US20210385571A1 (en) Automatic active noise reduction (anr) control to improve user interaction
US9299344B2 (en) Apparatus and method to classify sound to detect speech
US7593849B2 (en) Normalization of speech accent
US20120022863A1 (en) Method and apparatus for voice activity detection
US20220253274A1 (en) Media-compensated pass-through and mode-switching
US9131876B2 (en) Portable sound source playing apparatus for testing hearing ability and method of testing hearing ability using the apparatus
US11290802B1 (en) Voice detection using hearable devices
US10602274B2 (en) Audio input/output device
WO2022072752A1 (en) Voice user interface using non-linguistic input
US20220230657A1 (en) Voice control method and apparatus, chip, earphones, and system
WO2020079918A1 (ja) 情報処理装置及び情報処理方法
JPH03131198A (ja) 音声認識装置
US20200045403A1 (en) Audio device with pre-adaptation
JP2016171565A (ja) ウェアラブル装置及び翻訳システム
JP3437492B2 (ja) 音声認識方法及び装置
JPH032793A (ja) 音声認識用前処理装置
Chen et al. Enabling Hands-Free Voice Assistant Activation on Earphones
TWM560746U (zh) 可優化外部的語音信號裝置
JP2005010652A (ja) 音声検出装置
US11812215B2 (en) Method and system for calibrating a structure-borne sound-sensitive acceleration sensor and method for correcting the measuring signals of a structure-borne sound-sensitive acceleration signal
US11710475B2 (en) Methods and apparatus for obtaining biometric data
JP5352382B2 (ja) 電子機器
US20230359430A1 (en) Media-compensated pass-through and mode-switching
JPS62157938A (ja) 音声によるカ−ソル位置制御方式