JP2004020952A - 骨伝導音声振動検出素子および音声認識システム - Google Patents

骨伝導音声振動検出素子および音声認識システム Download PDF

Info

Publication number
JP2004020952A
JP2004020952A JP2002176040A JP2002176040A JP2004020952A JP 2004020952 A JP2004020952 A JP 2004020952A JP 2002176040 A JP2002176040 A JP 2002176040A JP 2002176040 A JP2002176040 A JP 2002176040A JP 2004020952 A JP2004020952 A JP 2004020952A
Authority
JP
Japan
Prior art keywords
bone conduction
voice
elastic body
vibration
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002176040A
Other languages
English (en)
Inventor
Yoshimasa Hijikata
土方 啓暢
Yoshiyasu Yamada
山田  芳靖
Naoki Mitsumoto
光本  直樹
Taku Kaneko
金子  卓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2002176040A priority Critical patent/JP2004020952A/ja
Publication of JP2004020952A publication Critical patent/JP2004020952A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】不特定発話者の発声による骨伝導音声振動から音声認識を行う。
【解決手段】骨伝導音声振動検出素子10において、片持ち梁1が発話者の発声による身体振動によって振動し、検出部材3がこの振動に基づいて電気信号を生じ、信号検出回路9がこの電気信号を受信して、音声認識装置30に音声信号を出力するようにする。また、音声認識装置30が、印加回路8を時間デユーティ制御することにより、圧電部材2に印加する電圧を制御し、圧電部材2はこの電圧に基づいて片持ち梁1に応力を与えることで、発話者の発声の周波数特性に合うように弾性体の周波数応答特性を制御する。
【選択図】    図1

Description

【0001】
【発明の属する技術分野】
本発明は骨伝導により伝達された音声振動を検出する骨伝導音声振動検出素子、およびこの骨伝導音声振動検出素子を利用して音声認識をおこなう音声認識システムに関する。
【0002】
【従来の技術】
音声認識技術は研究段階から実用段階を迎え、現在自動車用のカーナビゲーションシステム等で広く採用されるようになってきており、その音声認識率も静寂環境なら90%以上の数値が得られるようになってきている。音声認識率とは、発話者の音声に含まれる言葉と、音声認識装置がその音声から認識した言葉とが合致する率のことである。
【0003】
しかしながら、周囲に騒音がある環境では、著しく認識率が低下することが一般的に知られている。例えば車室内においては、自動車のエンジン音や風切り音、ロードノイズなどが目立った騒音源であるし、同乗者のおしゃべりの声やラジオ音声などで音声認識が阻害されることが多々ある。
【0004】
そのような問題を解決するために従来より様々な対策が行われており、指向性マイクロホンの使用や、信号処理的な手法ではスペクトラムサブトラクション法などの採用により、一定の効果を挙げている。スペクトラムサブトラクション法とは、雑音の混入した音声信号の振幅スペクトラムから雑音の振幅スペクトラムを差し引く等の処理を行うことで雑音抑圧を実現するものである。しかしスペクトラムサブトラクション法は、定常的なノイズの除去効果は大きいものの、人の声などの非定常的なノイズの除去効果は小さく、音声認識のための手法としては十分ではない。その他にも様々な雑音分離技術が提案されているが、まだ実用に供されているものは少ない。
【0005】
ところで、人が発声して得られた音声には空気中を伝搬するものの他に、発声した本人の頭骨や皮膚組織などを通って、内耳の聴覚神経に到達して伝わる音声が存在する。これは一般的に骨伝導音と呼ばれている。発声した自分の声を自分で聞く場合と、テープレコーダーなどに録音した声を聞き比べると違って聞こえるのは、自分の耳には空気を伝わってきた音(気導音)と骨伝導音が両方とも入ってくるためであるといわれている。
【0006】
この骨伝導音は固体を伝搬する音声であり、音響インピーダンスの違いから空気中を伝わる騒音があったとしても、それから受ける影響は小さい。従って周囲が騒音環境であっても、発話者の声を高い対騒音信号比で取得することが可能となり、それを用いれば騒音環境下でも音声認識を実現することが可能であると考えられる。
【0007】
骨伝導音振動を外耳道で検出する振動検出素子としては、特開昭51−94218号公報、特開昭58−80997号公報および特開昭58−94298号公報に記載の技術のように、圧電型のものや、マグネティック型のものなどがある。しかしながら、これらの公報に記載の振動検出素子においては、音質が単一の梁の周波数応答特性により決定されるようになっているので、骨伝導により減衰する音声振動信号に対しては高域(1.0kHz以上)の出力が小さくなり、それゆえに気導音マイクロフォンに比べ音質が著しく劣るという欠点があった。この欠点を解消するため、特開平8−195995号公報に記載の振動検出素子は、異なる固有振動数の複数の梁を有し、それぞれの梁の検出部材の出力を電気的に加算するようにしている。
【0008】
図11は、特開平8−195995号公報に記載の骨伝導音声振動検出素子90の構成を示す図である。この骨伝導音声振動検出素子90は、ケース94内に、長さの異なる2つの片持ち梁92a、92bを有している。これらの片持ち梁92a、92bは互いに異なる固有振動数を有し、一端を支持部材95によって支持され、自由端部には重り93が配されている。これらの片持ち梁92a、92bの振動が、それぞれの片持ち梁92a、92bに接するように配された圧電体である検出部材91によって電気信号に変換され、この電気信号が引出線96によって外部に出力され、その後にこれら電気信号が加算されるようになっている。
【0009】
【発明が解決しようとする課題】
しかしながら、声質には個人差があるため、骨伝導音声振動検出素子の共振周波数と合っている人の声は聞き取りやすく、音声認識やこの振動を利用した通話は可能であるが、その一方で共振周波数が合っていない人の声は聞き取り難く、音声認識等は困難である。従って、このような骨伝導音声振動検出素子は、不特定の発話者の音声の認識には不適切である。
【0010】
本発明は上記の問題点を解決するためになされたものであり、不特定発話者の発声の特徴に応じて骨伝導音声振動から音声を検出すること目的とする。
【0011】
【課題を解決するための手段】
上記目的を達成するための請求項1に記載の発明は、発話者の発声による骨伝導音声振動によって振動する弾性体と、この弾性体の振動に基づいて電気信号を生ずる検出部材と、印加される電気的作用に基づいて弾性体に応力を与える圧電部材と、を有する振動検出部と、検出部材の電気信号を検出して、この電気信号に基づいた音声信号を出力する信号検出回路と、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電気的作用を圧電部材に印加する印加回路と、を備えた骨伝導音声振動検出素子である。
【0012】
これにより、弾性体が発話者の発声による身体振動によって振動し、検出部材がこの振動に基づいて電気信号を生じ、信号検出回路がこの電気信号を検出して(例えば音声認識装置に)出力するので、発話者の発声による骨伝導音声振動から音声認識を行うことができる。また、印加回路が、圧電部材に印加する電気的作用を変え、圧電部材はこの電気的作用に基づいて弾性体に応力を与えるので、弾性体に与える応力、ひいては弾性体の周波数応答特性を制御することができる。また印加回路は、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電気的作用を圧電部材に印加するので、不特定発話者の発声の特徴に応じて骨伝導音声振動から音声を検出することができる。
【0013】
ここで、電気的作用とは、電圧、電荷、電流等の、電気的現象を媒介として対象に及ぼす作用のことである。
【0014】
また、請求項2に記載の発明は、請求項1に記載の骨伝導音声振動検出素子において、圧電部材は、印加される電圧に基づいて弾性体に応力を与え、印加回路は、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を圧電部材に印加することを特徴とする。
【0015】
これにより、弾性体が発話者の発声による身体振動によって振動し、検出部材がこの振動に基づいて電気信号を生じ、信号検出回路がこの電気信号を検出して出力するので、発話者の発声による骨伝導音声振動から音声認識を行うことができる。また、印加回路が、圧電部材に印加する電圧を変え、圧電部材はこの電圧に基づいて弾性体に応力を与えるので、弾性体に与える応力、ひいては弾性体の周波数応答特性を制御することができる。また印加回路は、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を圧電部材に印加するので、不特定発話者の発声の特徴に応じて骨伝導音声振動から音声を検出することができる。
【0016】
また、請求項3に記載の発明は、請求項1または2に記載の骨伝導音声振動検出素子において、弾性体が梁状であることを特徴とする。
【0017】
このようにすることで、弾性体を平面的にすることができるので、骨伝導音声振動検出素子を小型に作成することが可能となる。
【0018】
また、請求項4に記載の発明は、請求項3に記載の骨伝導音声振動検出素子において、弾性体が片持ち梁であることを特徴とする。
【0019】
このようにすることで、弾性体に自由端が存在することになるので、発声による振動に対する感度が向上する。
【0020】
また、請求項5に記載の発明は、請求項1ないし4のいずれか1つに記載の骨伝導音声振動検出素子において、弾性体に応力を与える圧電部材を複数備え、印加回路は、複数の圧電部材に印加する電気的作用を独立に調整することを特徴とする。
【0021】
このようにすることで、弾性体へ与える応力の調整の自由度が増すので、弾性体の周波数応答特性の制御の精度が向上する。
【0022】
また、請求項6に記載の発明は、請求項1ないし5のいずれか1つに記載の骨伝導音声振動検出素子において、検出部材は圧電体からなることを特徴とする請求項1ないし5のいずれか1つに記載の骨伝導音声振動検出素子。
【0023】
また、請求項7に記載の発明は、請求項1ないし6のいずれか1つに記載の骨伝導音声振動検出素子において、検出部材は、圧電部材の一部を電気的に分離して形成されていることを特徴とする。
【0024】
これによって、1つの部材を検出部材および圧電部材として用いることができるので、構成材料および製造の工程の削減を行うことができる。
【0025】
また、請求項8に記載の発明は、請求項1ないし7のいずれか1つに記載の骨伝導音声振動検出素子において、圧電部材は弾性体の両面から応力を与えるような構造になっていることを特徴とする。
【0026】
これによって、梁の両側から応力を与えることができるので、片持ち梁1の反りを抑えることが可能となる。
【0027】
また、請求項9に記載の発明は、請求項1ないし8のいずれか1つに記載の骨伝導音声振動検出素子において、振動検出部を複数備え、これら複数の振動検出部が有する弾性体の固有振動数は互いに同一であることを特徴とする。
【0028】
このように、複数の振動検出部を持つことで、信号検出回路が受信する電力が増大し、受信感度が高くなる。
【0029】
また、請求項10に記載の発明は、請求項1ないし9のいずれか1つに記載の骨伝導音声振動検出素子において、振動検出部を複数備え、これら複数の振動検出部が有する弾性体の固有振動数は互いに異なることを特徴とする。
【0030】
このようにすることで、骨伝導音声振動検出素子は同時に複数の周波数の振動を検出することができるので、受信の広帯域化が実現する。
【0031】
また、請求項11に記載の発明は、請求項2ないし10のいずれか1つに記載の骨伝導音声振動検出素子において、印加回路は、電圧の出力の時間デューティー比を調整することによって、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を圧電部材に印加することを特徴とする。
【0032】
このようにすることで、印加回路は電圧の制御をすることができることに加え、電圧が時間的に変動することにより、弾性体の周波数応答特性が時間的に変動するので、発声による振動に対して感度が高い周波数帯が広がる。
【0033】
また請求項12に記載の発明は、請求項1に記載の骨伝導音声振動検出素子と、骨伝導音声振動検出素子の有する信号検出回路から音声信号を受信し、音声信号に基づいて音声認識を行う音声認識装置と、を備え、音声認識装置は、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、印加回路の印加する電気的作用を制御することを特徴とする音声認識システムである。
【0034】
これにより、弾性体が発話者の発声による身体振動によって振動し、検出部材がこの振動に基づいて電気信号を生じ、信号検出回路がこの電気信号を検出して音声認識装置に出力するので、発話者の発声による骨伝導音声振動から音声認識を行うことができる。また、音声認識装置が、印加回路の印加電気的作用を制御することにより、圧電部材はこの電気的作用に基づいて弾性体に応力を与えるので、弾性体に与える応力、ひいては弾性体の周波数応答特性を制御することができる。また、このような骨伝導音声振動検出素子を用い、音声認識装置が発話者の発声の周波数特性に合うように、印加回路が圧電部材に印加する電気的作用を調整させることができるので、不特定発話者の発声の特徴に応じて骨伝導音声振動から音声を検出することができる。また不特定発話者の発声による骨伝導音声振動から音声認識を行うことができる。
【0035】
また、請求項13に記載の発明は、請求項12に記載の音声認識システムにおいて、圧電部材は、印加される電圧に基づいて弾性体に応力を与え、印加回路は、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を圧電部材に印加することを特徴とする。
【0036】
これにより、弾性体が発話者の発声による身体振動によって振動し、検出部材がこの振動に基づいて電気信号を生じ、信号検出回路がこの電気信号を検出して音声認識装置に出力するので、発話者の発声による骨伝導音声振動から音声認識を行うことができる。また、音声認識装置が、印加回路の印加電圧を制御することにより、圧電部材はこの電圧に基づいて弾性体に応力を与えるので、弾性体に与える応力、ひいては弾性体の周波数応答特性を制御することができる。また、このような骨伝導音声振動検出素子を用い、音声認識装置が発話者の発声の周波数特性に合うように、印加回路が圧電部材に印加する電圧を調整させることができるので、不特定発話者の発声の特徴に応じて骨伝導音声振動から音声を検出することができる。また不特定発話者の発声による骨伝導音声振動から音声認識を行うことができる。
【0037】
また、請求項14に記載の発明は、請求項12または13に記載の音声認識システムにおいて、音声認識装置は、発話者の音声認識の前に、発話者の発声の周波数特性から、印加回路の印加する電気的作用を決定することを特徴とする。
【0038】
また、請求項15に記載の発明は、請求項13または14に記載の音声認識システムにおいて、印加回路は、出力する電圧の時間デューティー比を調整することによって、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を圧電部材に印加することを特徴とする。
【0039】
このようにすることで、印加回路は電圧の制御をすることができることに加え、電圧が時間的に変動することにより、弾性体の周波数応答特性が時間的に変動するので、発声による振動に対して感度が高い周波数帯が広がる。
【0040】
【発明の実施の形態】
(第1実施形態)
図1は、本発明の第1実施形態に係る、骨伝導音声振動検出素子10および音声認識装置30からなる音声認識システム50の構成を示す図である。
【0041】
骨伝導音声振動検出素子10は、振動検出部20、印加回路8、および信号検出回路9を有している。
【0042】
振動検出部20は、骨伝導音声振動を良く伝達する真鍮(黄銅)からなる図示しないケース内に固定された支持部材4と、この支持部材4に一端が固定されたリン青銅からなる片持ち梁1と、片持ち梁1のもう一方の端に固定された重り5と、片持ち梁1の上面に接して配された圧電部材2と、片持ち梁1の下面に接して配された検出部材3から成る。
【0043】
圧電部材2は圧電体であり、PZTにより形成されている。この圧電部材2は、印加回路8から電気的作用として電圧を印加されることにより、接触している片持ち梁1に引っ張り・圧縮応力を与えるようになっている。引っ張り・圧縮応力が与えられることにより、片持ち梁1の周波数応答特性が、固有振動数が大きくなる方向へ変化する。図2に、周波数応答特性の変化の一例として、圧電部材2に10Vの電圧を印加した場合と、電圧を印加しない場合における片持ち梁1の周波数応答特性のグラフを示す。縦軸はゲイン、横軸は周波数を示し、破線と実線はそれぞれ、圧電部材2に電圧を印加した場合と印加しない場合の片持ち梁1の周波数応答特性を示している。電圧を印加した場合は固有振動数、すなわち特性のピーク周波数が3000Hzを越えているのに対して、電圧を印加していない場合は、固有振動数が3000Hzに満たない。
【0044】
検出部材3は圧電体であり、圧電部材2と同様にPZTにより形成されている。この検出部材3は、接触している片持ち梁1の振動による応力に基づいて、信号検出回路9に電圧、すなわち電気信号を出力するようになっている。
【0045】
重り5は、片持ち梁1の振動を増幅するために片持ち梁1に固定されるものである。
【0046】
印加回路8は、圧電部材2に電圧を印加するものである。この印加回路8は、音声認識装置30のCPU31からハイレベル信号を受信することによって一定の電圧を圧電部材2に印加し、またCPU31からの信号がローレベルとなると、印加回路8への電圧の印加を停止するようになっている。このような印加回路8は、CPU31からの信号が高速(例えば1秒間に数十回)にハイレベルとローレベルで切り替わるようになっている場合、高速に電圧の印加(オン)、印加停止(オフ)を繰り返すことになる。このとき、切り替え時間に比べて十分長い時間分解能で見れば、印加回路8は一定の電圧値を圧電部材2に印加していることになる。また、この一定の電圧値は、CPU31からの信号がハイレベルである時間とローレベルである時間との比率(以下時間デューティ比と記す)で決まる。このようになっていることで、印加回路8は事実上、圧電部材2に印加する電圧を変化させることができるようになる。換言すれば、この制御によって、印加回路8は片持ち梁1に与えられる応力を制御することができる。
【0047】
信号検出回路9は、検出部材3から出力された信号を検知し、この信号を増幅して、音声信号として音声認識装置30内のCPU31に出力するものである。
【0048】
このような骨伝導音声振動検出素子10の振動検出部20は、上記したケースを覆うプラスチック部材(図示せず)と共に発話者の外耳内に装着される。このとき、片持ち梁1の長軸方向、すなわち支持部材4から重り5への方向が外耳道にほぼ直交するように装着方向を定める。これによって、片持ち梁1は外耳道の振動を感度よく拾うことができるようになる。
【0049】
このような骨伝導音声振動検出素子10が装着されたときに、発話者が発声したときの骨伝導音声振動検出素子10の作動について説明する。発話者による発声は、外耳道周辺の骨、皮膚を媒体とする振動として、外耳から上記したプラスチック部材を介してケースに伝達される。この振動はケースから支持部材4を経て片持ち梁1に伝達され、それによって片持ち梁1が振動する。
【0050】
片持ち梁1の振動によって検出部材3に応力が与えられ、それに基づいて検出部材3から信号検出回路9へ電気信号が出力される。この電気信号が信号検出回路9によって受信され、信号検出回路9は受信した信号に増幅等の処理を施して後、これを音声認識装置30に音声信号として出力する。
【0051】
音声認識装置30は、この音声信号を受信して、この信号を言語として認識し、この言語をユーザに表示する装置である。すなわち、音声認識を行う装置である。また音声認識装置30は、ある発話者が音声認識システム50を使用するとき、この発話者の音声認識にとって最適な比率で印加回路8に信号を出力するようになっている。すなわち、印加回路8の印加電圧制御を行うようになっている。最適な比率とは、この発話者の音声の周波数特性において、強度が最大となる周波数に、片持ち梁1の固有振動数が概ね一致するように電圧が印加されるための時間デューティ比である。またこの印加電圧制御のとき、音声認識装置30は、発話者が初めて音声認識システム50を使用する場合、この発話者が所定の文言を発声することによる音声信号をスペクトル解析し、この発話者の音声を最適な状態で受信するための時間デューティ比を導出し、この比率を記憶する。すなわち、音声認識のための学習を行うようになっている。
【0052】
このような音声認識装置30は、CPU31、入力装置32、表示装置33、および読み出し/書き込み可能なメモリ34を有している。
【0053】
入力装置32は、音声認識システム50を使用する発話者に操作されることにより、その操作に対応した信号をCPU31に出力する装置である。
【0054】
メモリ34には、上述した音声認識用のプログラム、印加電圧制御用のプログラム、学習用のプログラムが記録されている。またメモリ34には、個々の発話者毎の、この発話者の音声認識に最適な時間デューティ比が記録されている。
【0055】
またメモリ34は、学習用のプログラムが使用するための情報として、印加回路8への信号の時間デューティ比と、それに起因する圧電部材2の応力によって変化する片持ち梁1の固有振動数との対応表を記録している。この対応表は、骨伝導音声振動検出素子10の製造時にあらかじめ測定され、メモリ34に記録される。
【0056】
CPU31は、メモリ34に保存されている音声認識用のプログラムを読み出して実行することで、信号検出回路9から受信した信号に対して音声認識を行い、認識した文字を表示装置33に表示させるようになっている。音声認識用のプログラム例としては、IBM社製のViaVoice等がある。
【0057】
またCPU31は、メモリ34から学習用のプログラムを読み出して実行することで、信号検出回路9から受信した信号のスペクトル解析を行い、それに基づいて、この信号の音声認識を行うために最適な電圧を推定するようになっている。
【0058】
またCPU31は、音声認識時に、メモリ34から印加電圧制御用のプログラムを読み出して実行することで、発話者の音声認識に最適な時間デューティ比で印加回路8に信号を出力するようになっている。
【0059】
図3に、この印加電圧制御用のプログラム、学習用のプログラム、音声認識用のプログラムを含む、CPU31の全体的な処理のフローチャートを示す。
【0060】
CPU31は、電源投入による起動等によって印加電圧制御用のプログラムの実行を開始すると、まずメモリ34から発話者と最適な時間デューティ比との対応を読み出し、表示装置33に発話者の識別子のリストを表示させる(ステップ410)。
【0061】
この音声認識システム50を使用する発話者が、この表示に応じて入力装置32を操作することにより、リストの中の自分の識別子を選択する、あるいはこのリスト中には入っていない新規の発話者として自らの名前等の識別子を入力すると、CPU31はこれに対応した信号を入力装置32から受信する(ステップ420)。そしてCPU31は、この受信した信号によって、現在の発話者が新規の発話者であるか否かを判定する(ステップ430)。新規の発話者であるなら、学習用のプログラムを実行し、この発話者に最適な時間デューティ比を導出し、この時間デューティ比と受信した識別子とを対応づけてメモリ34に記録する(ステップ440)。
【0062】
ステップ430で新規の発話者と判定した場合、あるいはステップ440の次には、CPU31はメモリ34からこの発話者に対応した時間デューティ比で信号検出回路9に信号を出力する(ステップ450)。そして、この状態で音声認識プログラムをメモリ34から読み出して実行する(ステップ460)。
【0063】
CPU31は、全体として図3のような作動を行い、これによって、発話者の音声認識に最適になるように片持ち梁1の固有振動数を制御し、その上で音声認識を行う。
【0064】
図4に、上記のステップ440において実行される学習用のプログラムのフローチャートを示し、この図に基づき学習用プログラム実行時のCPU31の作動を説明する。学習用のプログラムの実行を開始すると、CPU31は、信号検出回路9から発話者が発する所定の文言による所定の音声信号を受信する(ステップ310)。この所定の文言としては、例えば音素バランス文のような、発話者の発声の周波数特性を効率よく決定するために用意された文章や、あるいは、特定のコマンド音声のような、音声認識システム50において特に頻繁に使用される単語が用いられる。
【0065】
次にCPU31は、この受信した信号をフーリエ変換し、周波数特性を求める。すなわちスペクトル解析を行う(ステップ320)。そして、このスペクトルにおいて、最も強度が大きくなっている周波数を見つけだし、またメモリ34が有する対応表を読み出し、この対応表から当該周波数に対応する時間デューティ比を検索、導出する(ステップ330)。この時間デューティ比が、発話者の音声認識に最適な時間デューティ比である。そして、この導出した比率を、発話者の名前等の識別子と対応させてメモリ34に記録する(ステップ340)。これによって、学習が完了する。
【0066】
なお、この学習においては、片持ち梁1の周波数応答特性を、発話者の発声による骨伝導音声振動の周波数特性に合わせるという目的のため、片持ち梁1の固有振動数が、この骨伝導音声振動の周波数特性において強度が最大となる周波数となるよう、時間デューティ比を決定しているが、この固有振動数を、強度が最大となる周波数に完全に一致させる必要はない。これらは、音声認識ができる程度に、片持ち梁1が発話者の発声に対応して振動するように合っていればよいのである。
【0067】
以上のような音声認識システム50の作動によって、発話者の音声認識にとって最適な時間デューティ比が記録され、この記録に従って印加回路8が電圧の印加、不印加を繰り返すことにより、片持ち梁1は発話者の音声認識にとって最適な固有振動数を有することになる。したがって不特定発話者の発声による骨伝導音声振動から音声認識を行うことができる。
【0068】
また、印加回路8は、出力する電圧のオン、オフの切り替えの繰り返しによって、圧電部材に電圧を印加するので、印加回路8は実効的に出力電圧の制御をすることができることに加え、厳密には出力電圧が時間的に変動することにより、弾性体の周波数応答特性が時間的に変動するので、発声による振動に対して感度が高い周波数帯が広がる。
【0069】
(第2実施形態)
図5は、本発明の第2実施形態に係る骨伝導音声振動検出素子10の構成を示す図である。図中、この骨伝導音声振動検出素子10の構成要素には、第1実施形態として図1に示した同様の機能を有するものと同じ符号を付す。
【0070】
骨伝導音声振動検出素子10は、第1実施形態に示した骨伝導音声振動検出素子10と比べて圧電部材2の構成が異なっている。すなわち、圧電部材2は複数に分割されて片持ち梁1上に配されている。そして、印加回路8が圧電部材2のそれぞれに印加する電圧を独立して制御するようになっている。例えば、それぞれに印加する電圧を異なるものにすることで、圧電部材2のそれぞれが片持ち梁1に異なる応力を与え、それによって片持ち梁1の周波数応答特性を細かく制御することができる。
【0071】
すなわち、これによって、弾性体へ与える応力の制御の自由度が増すので、片持ち梁1に与えられる引っ張り・圧縮応力の微調整ができる。したがって、第1実施形態の有する効果に加え、弾性体の周波数応答特性の制御の精度が向上する。
【0072】
(第3実施形態)
図6は、本発明の第3実施形態に係る骨伝導音声振動検出素子10の振動検出部20の構成を示す図である。図中、この振動検出部20の構成要素には、第2実施形態として図5に示した同様の機能を有するものと同じ符号を付す。
【0073】
振動検出部20は、第2実施形態に示した振動検出部20と比べて、圧電部材2および検出部材3の構成が異なっている。すなわち、圧電部材2は片持ち梁1の上面および下面に配されている。また、検出部材3は片持ち梁1の上面に配された圧電部材2の一部を電気的に分離することで形成されている。
【0074】
このように、圧電部材2を片持ち梁1の上面および下面に配することで、片持ち梁1に与えられる応力を上面と下面で均一にすることができる。したがって、第2実施形態の有する効果に加え、応力による片持ち梁1の反りを抑えることができる。
【0075】
また、検出部材3は片持ち梁1の上面に配された圧電部材2の一部を電気的に分離することで形成されているので、1つの材料を圧電部材2と検出部材3の材料として用いることができる。したがって、第2実施形態の有する効果に加え、構成材料数の低減および製造工程の簡略化が実現する。
【0076】
(第4実施形態)
図7は、本発明の第4実施形態に係る骨伝導音声振動検出素子10の構成を示す図である。図中、この骨伝導音声振動検出素子10の構成要素には、第2実施形態として図5に示した同様の機能を有するものと同じ符号を付す。
【0077】
振動検出部20は、第2実施形態に示した振動検出部20と比べて、圧電部材2および検出部材3の構成が異なっている。すなわち、圧電部材2は片持ち梁1の上面および下面に配されている。また、検出部材3も片持ち梁1の上面および下面に配されている。
【0078】
このように、圧電部材2を片持ち梁1の上面および下面に配することで、片持ち梁1に与えられる応力が上面と下面で均一になる。したがって、第2実施形態の有する効果に加え、応力による片持ち梁1の反りを抑えることができる。
【0079】
また検出部材3を片持ち梁1の上面および下面に配することで、複数の検出部材3から信号検出回路9に電圧が出力される。そして信号検出回路9においてこの電圧が加算される。したがって、第2実施形態の有する効果に加え、片持ち梁1の振動による信号検出回路9への出力が高くなり、骨伝導音声振動検出素子10の高感度化が実現される。
【0080】
(第5実施形態)
図8は、本発明の第5実施形態に係る骨伝導音声振動検出素子10の振動検出部20の構成を示す図である。図中、この振動検出部20の構成要素には、第4実施形態として図7に示した同様の機能を有するものと同じ符号を付す。
【0081】
振動検出部20は、第4実施形態に示した振動検出部20と比べて、圧電部材2が片持ち梁1の上面および下面に配され、また検出部材3が片持ち梁1の上面および下面に配されていることは同じである。ただし、圧電部材2および検出部材3が片持ち梁1の長軸方向に並んで配されていることが異なっている。
【0082】
この実施形態の効果は、第4実施形態のそれと同等である。
【0083】
(第6実施形態)
図9は、本発明の第6実施形態に係る骨伝導音声振動検出素子10の構成を示す図である。図中、この骨伝導音声振動検出素子10の構成要素には、第1実施形態として図1に示した同様の機能を有するものと同じ符号を付す。ただし、簡単のために圧電部材2、検出部材3、重り5、印加回路8、信号検出回路9は図示しない。
【0084】
本実施形態における骨伝導音声振動検出素子10は、第1実施形態において示した振動検出部20を層状に複数有している。そしてこれら振動検出部20のそれぞれが有する検出部材3の電圧出力は、1つの信号検出回路9に送られ、それらの出力は信号検出回路9で加算されるようになっている。また、振動検出部20のそれぞれが有する圧電部材2は、1つの印加回路8から電圧を印加されるようになっている。また、振動検出部20のそれぞれが有する片持ち梁1は全て同じ材質、同じ長さのものであり、それらの固有振動数は互いに同一である。
【0085】
このように、振動検出部20が複数あり、振動による振動検出部20からの電圧出力が信号検出回路9において加算されるようになっている。従って、第1実施形態の有する効果に加え、片持ち梁1の振動による信号検出回路9への出力が高くなり、骨伝導音声振動検出素子10の高感度化が実現される。
【0086】
(第7実施形態)
図10は、本発明の第7実施形態に係る骨伝導音声振動検出素子10の構成を示す図である。図中、この骨伝導音声振動検出素子10の構成要素には、第6実施形態として図9に示した同様の機能を有するものと同じ符号を付す。ただし、簡単のために圧電部材2、検出部材3、重り5、印加回路8、信号検出回路9は図示しない。
【0087】
本実施形態においては、第6実施形態に示した骨伝導音声振動検出素子10において、複数ある片持ち梁1の長さを変えることにより、片持ち梁1が互いに異なる固有振動数を有するようになっている。
【0088】
これによって、それぞれの片持ち梁1は異なる周波数の音声に反応するようになるので、例えば発話者の発声の周波数特性が、複数のピークを持つようなスペクトルで表せる場合、それらのピーク周波数に合うように個々の片持ち梁1に与える応力を調整することができる。このようにすることによって、同一の固有振動数を有する片持ち梁1の周波数応答特性を印加回路8からの印加電圧によって制御する場合よりも、骨伝導音声振動検出素子10が対応できる周波数帯域を広くすることができる。
【0089】
なお、第1〜7実施形態においては、片持ち梁1が弾性体に相当する。
【0090】
また、検出部材3は圧電体から成っているが、検出部材は必ずしも圧電体である必要はなく、弾性体の振動に基づいて電気信号を生ずるものであればよい。例えば、検出部材はピエゾ抵抗であってもよいし、または端子間の距離によって容量が変化するコンデンサ等の、半導体などによる歪み検出の方法を用いるものであってもよい。
【0091】
また、片持ち梁1の端部に重り5を固定しているが、この重り5は、片持ち梁1が骨伝導音声振動を十分検出できる場合には、必ずしも必要ではない。
【0092】
また、印加回路8は、電圧の印加・不印加の時間比率を切り替えることで、実効的に印加する電圧を変更していたが、必ずしもこのようにする必要はなく、例えば、印加回路8は一定電圧を出力するものであって、その出力電圧値を音声認識装置30から制御されるようになっていてもよい。また、印加回路8は必ずしも音声認識装置30からの制御によって出力電圧を変化させる必要はなく、例えば手動の電圧調整ダイヤルを有し、人がこれを操作することで電圧が変化するようになっていてもよい。
【0093】
また、CPU31の学習の作動は、発話者が初めてこの音声認識システム50を使用するときにのみ行われるようになっているが、これは、使用の度に随時行って、それにより最適な時間デューティ比を毎回微調整することで、学習の精度を向上させるようになっていてもよい。
【0094】
また、印加回路8が圧電部材2に電圧を印加することにより、圧電部材2がこの電圧に基づいて片持ち梁1に応力を与えるようになっているが、印加回路8が印可するのは電圧である必要はなく、電気的作用であればよい。例えば、印加回路8から圧電部材2へは電荷が印加され、圧電部材2はコンデンサのように印加される電荷に基づいて片持ち梁1に応力を与えるようになっていてもよい。
【0095】
また、骨伝導音声振動検出素子10の出力は、音声認識装置30に出力されて音声認識のために使用されるが、必ずしもこのようになっている必要はなく、骨伝導音声振動検出素子10の出力を音声通話に利用するようになっていてもよい。
【図面の簡単な説明】
【図1】本発明の第1実施形態に係る骨伝導音声振動検出素子10の構成を示す図である。
【図2】圧電部材2に10Vの電圧を印加した場合と、電圧を印加しない場合における片持ち梁1の周波数応答特性のグラフである。
【図3】印加電圧制御用のプログラムを含むCPU31の全体的な処理のフローチャートである。
【図4】CPU31が実行する学習用のプログラムのフローチャートである。
【図5】第2実施形態に係る骨伝導音声振動検出素子10の構成を示す図である。
【図6】第3実施形態に係る振動検出部20の構成を示す図である。
【図7】第4実施形態に係る骨伝導音声振動検出素子10の構成を示す図である。
【図8】第5実施形態に係る振動検出部20の構成を示す図である。
【図9】第6実施形態に係る骨伝導音声振動検出素子10の構成を示す図である。
【図10】第7実施形態に係る骨伝導音声振動検出素子10の構成を示す図である。
【図11】特開平8−195995号公報に記載の骨伝導音声振動検出素子90の構成を示す図である。
【符号の説明】
1…片持ち梁、2…圧電部材、3…検出部材、4…支持部材、5…重り、
8…印加回路、9…信号検出回路、10…骨伝導音声振動検出素子、
20…振動検出部、31…CPU、32…入力装置、33…表示装置、
34…メモリ、50…音声認識システム、90…骨伝導音声振動検出素子、
91…検出部材、92a…片持ち梁、92b…片持ち梁、93…重り、
94…ケース、95…支持部材、96…引出線。

Claims (15)

  1. 発話者の発声による骨伝導音声振動によって振動する弾性体と、この弾性体の振動に基づいて電気信号を生ずる検出部材と、印加される電気的作用に基づいて前記弾性体に応力を与える圧電部材と、を有する振動検出部と、
    前記検出部材の電気信号を検出して、この電気信号に基づいた音声信号を出力する信号検出回路と、
    前記弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電気的作用を前記圧電部材に印加する印加回路と、を備えた骨伝導音声振動検出素子。
  2. 前記圧電部材は、印加される電圧に基づいて前記弾性体に応力を与え、
    前記印加回路は、前記弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を前記圧電部材に印加することを特徴とする請求項1に記載の骨伝導音声振動検出素子。
  3. 前記弾性体が梁状であることを特徴とする請求項1または2に記載の骨伝導音声振動検出素子。
  4. 前記弾性体が片持ち梁であることを特徴とする請求項3に記載の骨伝導音声振動検出素子。
  5. 前記弾性体に応力を与える前記圧電部材を複数備え、
    前記印加回路は、前記複数の圧電部材に印加する電気的作用を独立に調整することを特徴とする請求項1ないし4のいずれか1つに記載の骨伝導音声振動検出素子。
  6. 前記検出部材は圧電体からなることを特徴とする請求項1ないし5のいずれか1つに記載の骨伝導音声振動検出素子。
  7. 前記検出部材は、前記圧電部材の一部を電気的に分離して形成されていることを特徴とする請求項1ないし6のいずれか1つに記載の骨伝導音声振動検出素子。
  8. 前記圧電部材は、前記弾性体の両面から応力を与えるような構造になっていることを特徴とする請求項1ないし7のいずれか1つに記載の骨伝導音声振動検出素子。
  9. 前記振動検出部を複数備え、これら複数の振動検出部が有する弾性体の固有振動数は互いに同一であることを特徴とする請求項1ないし8のいずれか1つに記載の骨伝導音声振動検出素子。
  10. 前記振動検出部を複数備え、これら複数の振動検出部が有する弾性体の固有振動数は互いに異なることを特徴とする請求項1ないし9のいずれか1つに記載の骨伝導音声振動検出素子。
  11. 前記印加回路は、電圧の出力の時間デューティー比を調整することによって、前記弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を前記圧電部材に印加することを特徴とする請求項2ないし10のいずれか1つに記載の骨伝導音声振動検出素子。
  12. 請求項1に記載の骨伝導音声振動検出素子と、
    前記骨伝導音声振動検出素子の有する信号検出回路から音声信号を受信し、前記音声信号に基づいて音声認識を行う音声認識装置と、を備え、
    前記音声認識装置は、前記弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、前記印加回路の印加する電気的作用を制御することを特徴とする音声認識システム。
  13. 前記圧電部材は、印加される電圧に基づいて前記弾性体に応力を与え、
    前記印加回路は、前記弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を前記圧電部材に印加することを特徴とする請求項12に記載の音声認識システム。
  14. 前記音声認識装置は、発話者の音声認識の前に、前記発話者の発声の周波数特性から、前記印加回路の印加する電気的作用を決定することを特徴とする請求項12または13に記載の音声認識システム。
  15. 前記印加回路は、電圧の出力の時間デューティー比を調整することによって、前記弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、印加電圧を前記圧電部材に印加することを特徴とする請求項13または14に記載の音声認識システム。
JP2002176040A 2002-06-17 2002-06-17 骨伝導音声振動検出素子および音声認識システム Pending JP2004020952A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002176040A JP2004020952A (ja) 2002-06-17 2002-06-17 骨伝導音声振動検出素子および音声認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002176040A JP2004020952A (ja) 2002-06-17 2002-06-17 骨伝導音声振動検出素子および音声認識システム

Publications (1)

Publication Number Publication Date
JP2004020952A true JP2004020952A (ja) 2004-01-22

Family

ID=31174515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002176040A Pending JP2004020952A (ja) 2002-06-17 2002-06-17 骨伝導音声振動検出素子および音声認識システム

Country Status (1)

Country Link
JP (1) JP2004020952A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108766468A (zh) * 2018-06-12 2018-11-06 歌尔科技有限公司 一种智能语音检测方法、无线耳机、tws耳机及终端
CN109192209A (zh) * 2018-10-23 2019-01-11 珠海格力电器股份有限公司 一种语音识别方法及装置
CN115031831A (zh) * 2022-06-20 2022-09-09 清华大学 声共振开关装置
RU2809760C1 (ru) * 2020-12-31 2023-12-18 Шэньчжэнь Шокз Ко., Лтд. Микрофоны с костной проводимостью

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108766468A (zh) * 2018-06-12 2018-11-06 歌尔科技有限公司 一种智能语音检测方法、无线耳机、tws耳机及终端
CN109192209A (zh) * 2018-10-23 2019-01-11 珠海格力电器股份有限公司 一种语音识别方法及装置
RU2809760C1 (ru) * 2020-12-31 2023-12-18 Шэньчжэнь Шокз Ко., Лтд. Микрофоны с костной проводимостью
RU2809949C1 (ru) * 2020-12-31 2023-12-19 Шэньчжэнь Шокз Ко., Лтд. Звукопередающие устройства с костной проводимостью
CN115031831A (zh) * 2022-06-20 2022-09-09 清华大学 声共振开关装置

Similar Documents

Publication Publication Date Title
KR0148085B1 (ko) 헤드폰
CN108141663B (zh) 集音装置以及集音装置的控制方法
JP5610903B2 (ja) 電気音響変換器
KR20140041727A (ko) 전기활성 중합체 액추에이터를 갖는 오디오 장치
JP2009284110A (ja) 音声入力装置及びその製造方法、並びに、情報処理システム
JP2003264883A (ja) 音声処理装置および音声処理方法
WO2019181955A1 (ja) 音声/振動変換装置
JP3045032B2 (ja) ヘッドホン
US12075234B2 (en) Control apparatus, signal processing method, and speaker apparatus
JP5391374B2 (ja) マイクロホン装置
JP2004020952A (ja) 骨伝導音声振動検出素子および音声認識システム
JP3344303B2 (ja) 聴覚補助装置および自己発話マイク
JP2000148200A (ja) 音声入力装置
JP2004013084A (ja) 音量制御装置
JP2007267331A (ja) 発話音声収集用コンビネーション・マイクロフォンシステム
KR100778143B1 (ko) 후두 임피던스 신호를 이용하는 넥마이크를 구비한 골도헤드셋
JP2003345381A (ja) 骨伝導音声振動検出素子及び音声認識システム
JP4635683B2 (ja) 音声認識装置および方法
JP7515128B2 (ja) 耳装着型デバイス、及び、再生方法
FIELD Reviews Of Acoustical Patents
WO2023149015A1 (ja) 音声処理装置、音声処理方法、音声処理プログラム、および音声処理システム
EP3737111A1 (en) Proactive sound detection with noise cancellation component within earphone or headset
JPH1155055A (ja) 音量制御音声合成装置
JP2007041371A (ja) 音声入力装置および方法
US20080147394A1 (en) System and method for improving an interactive experience with a speech-enabled system through the use of artificially generated white noise

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060530

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061003