JP2004020952A

JP2004020952A - 骨伝導音声振動検出素子および音声認識システム

Info

Publication number: JP2004020952A
Application number: JP2002176040A
Authority: JP
Inventors: Yoshimasa Hijikata; 土方　啓暢; Yoshiyasu Yamada; 山田　　芳靖; Naoki Mitsumoto; 光本　　直樹; Taku Kaneko; 金子　　卓
Original assignee: Denso Corp
Current assignee: Denso Corp
Priority date: 2002-06-17
Filing date: 2002-06-17
Publication date: 2004-01-22

Abstract

【課題】不特定発話者の発声による骨伝導音声振動から音声認識を行う。
【解決手段】骨伝導音声振動検出素子１０において、片持ち梁１が発話者の発声による身体振動によって振動し、検出部材３がこの振動に基づいて電気信号を生じ、信号検出回路９がこの電気信号を受信して、音声認識装置３０に音声信号を出力するようにする。また、音声認識装置３０が、印加回路８を時間デユーティ制御することにより、圧電部材２に印加する電圧を制御し、圧電部材２はこの電圧に基づいて片持ち梁１に応力を与えることで、発話者の発声の周波数特性に合うように弾性体の周波数応答特性を制御する。
【選択図】　　　　図１

Description

【０００１】
【発明の属する技術分野】
本発明は骨伝導により伝達された音声振動を検出する骨伝導音声振動検出素子、およびこの骨伝導音声振動検出素子を利用して音声認識をおこなう音声認識システムに関する。
【０００２】
【従来の技術】
音声認識技術は研究段階から実用段階を迎え、現在自動車用のカーナビゲーションシステム等で広く採用されるようになってきており、その音声認識率も静寂環境なら９０％以上の数値が得られるようになってきている。音声認識率とは、発話者の音声に含まれる言葉と、音声認識装置がその音声から認識した言葉とが合致する率のことである。
【０００３】
しかしながら、周囲に騒音がある環境では、著しく認識率が低下することが一般的に知られている。例えば車室内においては、自動車のエンジン音や風切り音、ロードノイズなどが目立った騒音源であるし、同乗者のおしゃべりの声やラジオ音声などで音声認識が阻害されることが多々ある。
【０００４】
そのような問題を解決するために従来より様々な対策が行われており、指向性マイクロホンの使用や、信号処理的な手法ではスペクトラムサブトラクション法などの採用により、一定の効果を挙げている。スペクトラムサブトラクション法とは、雑音の混入した音声信号の振幅スペクトラムから雑音の振幅スペクトラムを差し引く等の処理を行うことで雑音抑圧を実現するものである。しかしスペクトラムサブトラクション法は、定常的なノイズの除去効果は大きいものの、人の声などの非定常的なノイズの除去効果は小さく、音声認識のための手法としては十分ではない。その他にも様々な雑音分離技術が提案されているが、まだ実用に供されているものは少ない。
【０００５】
ところで、人が発声して得られた音声には空気中を伝搬するものの他に、発声した本人の頭骨や皮膚組織などを通って、内耳の聴覚神経に到達して伝わる音声が存在する。これは一般的に骨伝導音と呼ばれている。発声した自分の声を自分で聞く場合と、テープレコーダーなどに録音した声を聞き比べると違って聞こえるのは、自分の耳には空気を伝わってきた音（気導音）と骨伝導音が両方とも入ってくるためであるといわれている。
【０００６】
この骨伝導音は固体を伝搬する音声であり、音響インピーダンスの違いから空気中を伝わる騒音があったとしても、それから受ける影響は小さい。従って周囲が騒音環境であっても、発話者の声を高い対騒音信号比で取得することが可能となり、それを用いれば騒音環境下でも音声認識を実現することが可能であると考えられる。
【０００７】
骨伝導音振動を外耳道で検出する振動検出素子としては、特開昭５１−９４２１８号公報、特開昭５８−８０９９７号公報および特開昭５８−９４２９８号公報に記載の技術のように、圧電型のものや、マグネティック型のものなどがある。しかしながら、これらの公報に記載の振動検出素子においては、音質が単一の梁の周波数応答特性により決定されるようになっているので、骨伝導により減衰する音声振動信号に対しては高域（１．０ｋＨｚ以上）の出力が小さくなり、それゆえに気導音マイクロフォンに比べ音質が著しく劣るという欠点があった。この欠点を解消するため、特開平８−１９５９９５号公報に記載の振動検出素子は、異なる固有振動数の複数の梁を有し、それぞれの梁の検出部材の出力を電気的に加算するようにしている。
【０００８】
図１１は、特開平８−１９５９９５号公報に記載の骨伝導音声振動検出素子９０の構成を示す図である。この骨伝導音声振動検出素子９０は、ケース９４内に、長さの異なる２つの片持ち梁９２ａ、９２ｂを有している。これらの片持ち梁９２ａ、９２ｂは互いに異なる固有振動数を有し、一端を支持部材９５によって支持され、自由端部には重り９３が配されている。これらの片持ち梁９２ａ、９２ｂの振動が、それぞれの片持ち梁９２ａ、９２ｂに接するように配された圧電体である検出部材９１によって電気信号に変換され、この電気信号が引出線９６によって外部に出力され、その後にこれら電気信号が加算されるようになっている。
【０００９】
【発明が解決しようとする課題】
しかしながら、声質には個人差があるため、骨伝導音声振動検出素子の共振周波数と合っている人の声は聞き取りやすく、音声認識やこの振動を利用した通話は可能であるが、その一方で共振周波数が合っていない人の声は聞き取り難く、音声認識等は困難である。従って、このような骨伝導音声振動検出素子は、不特定の発話者の音声の認識には不適切である。
【００１０】
本発明は上記の問題点を解決するためになされたものであり、不特定発話者の発声の特徴に応じて骨伝導音声振動から音声を検出すること目的とする。
【００１１】
【課題を解決するための手段】
上記目的を達成するための請求項１に記載の発明は、発話者の発声による骨伝導音声振動によって振動する弾性体と、この弾性体の振動に基づいて電気信号を生ずる検出部材と、印加される電気的作用に基づいて弾性体に応力を与える圧電部材と、を有する振動検出部と、検出部材の電気信号を検出して、この電気信号に基づいた音声信号を出力する信号検出回路と、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電気的作用を圧電部材に印加する印加回路と、を備えた骨伝導音声振動検出素子である。
【００１２】
これにより、弾性体が発話者の発声による身体振動によって振動し、検出部材がこの振動に基づいて電気信号を生じ、信号検出回路がこの電気信号を検出して（例えば音声認識装置に）出力するので、発話者の発声による骨伝導音声振動から音声認識を行うことができる。また、印加回路が、圧電部材に印加する電気的作用を変え、圧電部材はこの電気的作用に基づいて弾性体に応力を与えるので、弾性体に与える応力、ひいては弾性体の周波数応答特性を制御することができる。また印加回路は、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電気的作用を圧電部材に印加するので、不特定発話者の発声の特徴に応じて骨伝導音声振動から音声を検出することができる。
【００１３】
ここで、電気的作用とは、電圧、電荷、電流等の、電気的現象を媒介として対象に及ぼす作用のことである。
【００１４】
また、請求項２に記載の発明は、請求項１に記載の骨伝導音声振動検出素子において、圧電部材は、印加される電圧に基づいて弾性体に応力を与え、印加回路は、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を圧電部材に印加することを特徴とする。
【００１５】
これにより、弾性体が発話者の発声による身体振動によって振動し、検出部材がこの振動に基づいて電気信号を生じ、信号検出回路がこの電気信号を検出して出力するので、発話者の発声による骨伝導音声振動から音声認識を行うことができる。また、印加回路が、圧電部材に印加する電圧を変え、圧電部材はこの電圧に基づいて弾性体に応力を与えるので、弾性体に与える応力、ひいては弾性体の周波数応答特性を制御することができる。また印加回路は、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を圧電部材に印加するので、不特定発話者の発声の特徴に応じて骨伝導音声振動から音声を検出することができる。
【００１６】
また、請求項３に記載の発明は、請求項１または２に記載の骨伝導音声振動検出素子において、弾性体が梁状であることを特徴とする。
【００１７】
このようにすることで、弾性体を平面的にすることができるので、骨伝導音声振動検出素子を小型に作成することが可能となる。
【００１８】
また、請求項４に記載の発明は、請求項３に記載の骨伝導音声振動検出素子において、弾性体が片持ち梁であることを特徴とする。
【００１９】
このようにすることで、弾性体に自由端が存在することになるので、発声による振動に対する感度が向上する。
【００２０】
また、請求項５に記載の発明は、請求項１ないし４のいずれか１つに記載の骨伝導音声振動検出素子において、弾性体に応力を与える圧電部材を複数備え、印加回路は、複数の圧電部材に印加する電気的作用を独立に調整することを特徴とする。
【００２１】
このようにすることで、弾性体へ与える応力の調整の自由度が増すので、弾性体の周波数応答特性の制御の精度が向上する。
【００２２】
また、請求項６に記載の発明は、請求項１ないし５のいずれか１つに記載の骨伝導音声振動検出素子において、検出部材は圧電体からなることを特徴とする請求項１ないし５のいずれか１つに記載の骨伝導音声振動検出素子。
【００２３】
また、請求項７に記載の発明は、請求項１ないし６のいずれか１つに記載の骨伝導音声振動検出素子において、検出部材は、圧電部材の一部を電気的に分離して形成されていることを特徴とする。
【００２４】
これによって、１つの部材を検出部材および圧電部材として用いることができるので、構成材料および製造の工程の削減を行うことができる。
【００２５】
また、請求項８に記載の発明は、請求項１ないし７のいずれか１つに記載の骨伝導音声振動検出素子において、圧電部材は弾性体の両面から応力を与えるような構造になっていることを特徴とする。
【００２６】
これによって、梁の両側から応力を与えることができるので、片持ち梁１の反りを抑えることが可能となる。
【００２７】
また、請求項９に記載の発明は、請求項１ないし８のいずれか１つに記載の骨伝導音声振動検出素子において、振動検出部を複数備え、これら複数の振動検出部が有する弾性体の固有振動数は互いに同一であることを特徴とする。
【００２８】
このように、複数の振動検出部を持つことで、信号検出回路が受信する電力が増大し、受信感度が高くなる。
【００２９】
また、請求項１０に記載の発明は、請求項１ないし９のいずれか１つに記載の骨伝導音声振動検出素子において、振動検出部を複数備え、これら複数の振動検出部が有する弾性体の固有振動数は互いに異なることを特徴とする。
【００３０】
このようにすることで、骨伝導音声振動検出素子は同時に複数の周波数の振動を検出することができるので、受信の広帯域化が実現する。
【００３１】
また、請求項１１に記載の発明は、請求項２ないし１０のいずれか１つに記載の骨伝導音声振動検出素子において、印加回路は、電圧の出力の時間デューティー比を調整することによって、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を圧電部材に印加することを特徴とする。
【００３２】
このようにすることで、印加回路は電圧の制御をすることができることに加え、電圧が時間的に変動することにより、弾性体の周波数応答特性が時間的に変動するので、発声による振動に対して感度が高い周波数帯が広がる。
【００３３】
また請求項１２に記載の発明は、請求項１に記載の骨伝導音声振動検出素子と、骨伝導音声振動検出素子の有する信号検出回路から音声信号を受信し、音声信号に基づいて音声認識を行う音声認識装置と、を備え、音声認識装置は、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、印加回路の印加する電気的作用を制御することを特徴とする音声認識システムである。
【００３４】
これにより、弾性体が発話者の発声による身体振動によって振動し、検出部材がこの振動に基づいて電気信号を生じ、信号検出回路がこの電気信号を検出して音声認識装置に出力するので、発話者の発声による骨伝導音声振動から音声認識を行うことができる。また、音声認識装置が、印加回路の印加電気的作用を制御することにより、圧電部材はこの電気的作用に基づいて弾性体に応力を与えるので、弾性体に与える応力、ひいては弾性体の周波数応答特性を制御することができる。また、このような骨伝導音声振動検出素子を用い、音声認識装置が発話者の発声の周波数特性に合うように、印加回路が圧電部材に印加する電気的作用を調整させることができるので、不特定発話者の発声の特徴に応じて骨伝導音声振動から音声を検出することができる。また不特定発話者の発声による骨伝導音声振動から音声認識を行うことができる。
【００３５】
また、請求項１３に記載の発明は、請求項１２に記載の音声認識システムにおいて、圧電部材は、印加される電圧に基づいて弾性体に応力を与え、印加回路は、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を圧電部材に印加することを特徴とする。
【００３６】
これにより、弾性体が発話者の発声による身体振動によって振動し、検出部材がこの振動に基づいて電気信号を生じ、信号検出回路がこの電気信号を検出して音声認識装置に出力するので、発話者の発声による骨伝導音声振動から音声認識を行うことができる。また、音声認識装置が、印加回路の印加電圧を制御することにより、圧電部材はこの電圧に基づいて弾性体に応力を与えるので、弾性体に与える応力、ひいては弾性体の周波数応答特性を制御することができる。また、このような骨伝導音声振動検出素子を用い、音声認識装置が発話者の発声の周波数特性に合うように、印加回路が圧電部材に印加する電圧を調整させることができるので、不特定発話者の発声の特徴に応じて骨伝導音声振動から音声を検出することができる。また不特定発話者の発声による骨伝導音声振動から音声認識を行うことができる。
【００３７】
また、請求項１４に記載の発明は、請求項１２または１３に記載の音声認識システムにおいて、音声認識装置は、発話者の音声認識の前に、発話者の発声の周波数特性から、印加回路の印加する電気的作用を決定することを特徴とする。
【００３８】
また、請求項１５に記載の発明は、請求項１３または１４に記載の音声認識システムにおいて、印加回路は、出力する電圧の時間デューティー比を調整することによって、弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を圧電部材に印加することを特徴とする。
【００３９】
このようにすることで、印加回路は電圧の制御をすることができることに加え、電圧が時間的に変動することにより、弾性体の周波数応答特性が時間的に変動するので、発声による振動に対して感度が高い周波数帯が広がる。
【００４０】
【発明の実施の形態】
（第１実施形態）
図１は、本発明の第１実施形態に係る、骨伝導音声振動検出素子１０および音声認識装置３０からなる音声認識システム５０の構成を示す図である。
【００４１】
骨伝導音声振動検出素子１０は、振動検出部２０、印加回路８、および信号検出回路９を有している。
【００４２】
振動検出部２０は、骨伝導音声振動を良く伝達する真鍮（黄銅）からなる図示しないケース内に固定された支持部材４と、この支持部材４に一端が固定されたリン青銅からなる片持ち梁１と、片持ち梁１のもう一方の端に固定された重り５と、片持ち梁１の上面に接して配された圧電部材２と、片持ち梁１の下面に接して配された検出部材３から成る。
【００４３】
圧電部材２は圧電体であり、ＰＺＴにより形成されている。この圧電部材２は、印加回路８から電気的作用として電圧を印加されることにより、接触している片持ち梁１に引っ張り・圧縮応力を与えるようになっている。引っ張り・圧縮応力が与えられることにより、片持ち梁１の周波数応答特性が、固有振動数が大きくなる方向へ変化する。図２に、周波数応答特性の変化の一例として、圧電部材２に１０Ｖの電圧を印加した場合と、電圧を印加しない場合における片持ち梁１の周波数応答特性のグラフを示す。縦軸はゲイン、横軸は周波数を示し、破線と実線はそれぞれ、圧電部材２に電圧を印加した場合と印加しない場合の片持ち梁１の周波数応答特性を示している。電圧を印加した場合は固有振動数、すなわち特性のピーク周波数が３０００Ｈｚを越えているのに対して、電圧を印加していない場合は、固有振動数が３０００Ｈｚに満たない。
【００４４】
検出部材３は圧電体であり、圧電部材２と同様にＰＺＴにより形成されている。この検出部材３は、接触している片持ち梁１の振動による応力に基づいて、信号検出回路９に電圧、すなわち電気信号を出力するようになっている。
【００４５】
重り５は、片持ち梁１の振動を増幅するために片持ち梁１に固定されるものである。
【００４６】
印加回路８は、圧電部材２に電圧を印加するものである。この印加回路８は、音声認識装置３０のＣＰＵ３１からハイレベル信号を受信することによって一定の電圧を圧電部材２に印加し、またＣＰＵ３１からの信号がローレベルとなると、印加回路８への電圧の印加を停止するようになっている。このような印加回路８は、ＣＰＵ３１からの信号が高速（例えば１秒間に数十回）にハイレベルとローレベルで切り替わるようになっている場合、高速に電圧の印加（オン）、印加停止（オフ）を繰り返すことになる。このとき、切り替え時間に比べて十分長い時間分解能で見れば、印加回路８は一定の電圧値を圧電部材２に印加していることになる。また、この一定の電圧値は、ＣＰＵ３１からの信号がハイレベルである時間とローレベルである時間との比率（以下時間デューティ比と記す）で決まる。このようになっていることで、印加回路８は事実上、圧電部材２に印加する電圧を変化させることができるようになる。換言すれば、この制御によって、印加回路８は片持ち梁１に与えられる応力を制御することができる。
【００４７】
信号検出回路９は、検出部材３から出力された信号を検知し、この信号を増幅して、音声信号として音声認識装置３０内のＣＰＵ３１に出力するものである。
【００４８】
このような骨伝導音声振動検出素子１０の振動検出部２０は、上記したケースを覆うプラスチック部材（図示せず）と共に発話者の外耳内に装着される。このとき、片持ち梁１の長軸方向、すなわち支持部材４から重り５への方向が外耳道にほぼ直交するように装着方向を定める。これによって、片持ち梁１は外耳道の振動を感度よく拾うことができるようになる。
【００４９】
このような骨伝導音声振動検出素子１０が装着されたときに、発話者が発声したときの骨伝導音声振動検出素子１０の作動について説明する。発話者による発声は、外耳道周辺の骨、皮膚を媒体とする振動として、外耳から上記したプラスチック部材を介してケースに伝達される。この振動はケースから支持部材４を経て片持ち梁１に伝達され、それによって片持ち梁１が振動する。
【００５０】
片持ち梁１の振動によって検出部材３に応力が与えられ、それに基づいて検出部材３から信号検出回路９へ電気信号が出力される。この電気信号が信号検出回路９によって受信され、信号検出回路９は受信した信号に増幅等の処理を施して後、これを音声認識装置３０に音声信号として出力する。
【００５１】
音声認識装置３０は、この音声信号を受信して、この信号を言語として認識し、この言語をユーザに表示する装置である。すなわち、音声認識を行う装置である。また音声認識装置３０は、ある発話者が音声認識システム５０を使用するとき、この発話者の音声認識にとって最適な比率で印加回路８に信号を出力するようになっている。すなわち、印加回路８の印加電圧制御を行うようになっている。最適な比率とは、この発話者の音声の周波数特性において、強度が最大となる周波数に、片持ち梁１の固有振動数が概ね一致するように電圧が印加されるための時間デューティ比である。またこの印加電圧制御のとき、音声認識装置３０は、発話者が初めて音声認識システム５０を使用する場合、この発話者が所定の文言を発声することによる音声信号をスペクトル解析し、この発話者の音声を最適な状態で受信するための時間デューティ比を導出し、この比率を記憶する。すなわち、音声認識のための学習を行うようになっている。
【００５２】
このような音声認識装置３０は、ＣＰＵ３１、入力装置３２、表示装置３３、および読み出し／書き込み可能なメモリ３４を有している。
【００５３】
入力装置３２は、音声認識システム５０を使用する発話者に操作されることにより、その操作に対応した信号をＣＰＵ３１に出力する装置である。
【００５４】
メモリ３４には、上述した音声認識用のプログラム、印加電圧制御用のプログラム、学習用のプログラムが記録されている。またメモリ３４には、個々の発話者毎の、この発話者の音声認識に最適な時間デューティ比が記録されている。
【００５５】
またメモリ３４は、学習用のプログラムが使用するための情報として、印加回路８への信号の時間デューティ比と、それに起因する圧電部材２の応力によって変化する片持ち梁１の固有振動数との対応表を記録している。この対応表は、骨伝導音声振動検出素子１０の製造時にあらかじめ測定され、メモリ３４に記録される。
【００５６】
ＣＰＵ３１は、メモリ３４に保存されている音声認識用のプログラムを読み出して実行することで、信号検出回路９から受信した信号に対して音声認識を行い、認識した文字を表示装置３３に表示させるようになっている。音声認識用のプログラム例としては、ＩＢＭ社製のＶｉａＶｏｉｃｅ等がある。
【００５７】
またＣＰＵ３１は、メモリ３４から学習用のプログラムを読み出して実行することで、信号検出回路９から受信した信号のスペクトル解析を行い、それに基づいて、この信号の音声認識を行うために最適な電圧を推定するようになっている。
【００５８】
またＣＰＵ３１は、音声認識時に、メモリ３４から印加電圧制御用のプログラムを読み出して実行することで、発話者の音声認識に最適な時間デューティ比で印加回路８に信号を出力するようになっている。
【００５９】
図３に、この印加電圧制御用のプログラム、学習用のプログラム、音声認識用のプログラムを含む、ＣＰＵ３１の全体的な処理のフローチャートを示す。
【００６０】
ＣＰＵ３１は、電源投入による起動等によって印加電圧制御用のプログラムの実行を開始すると、まずメモリ３４から発話者と最適な時間デューティ比との対応を読み出し、表示装置３３に発話者の識別子のリストを表示させる（ステップ４１０）。
【００６１】
この音声認識システム５０を使用する発話者が、この表示に応じて入力装置３２を操作することにより、リストの中の自分の識別子を選択する、あるいはこのリスト中には入っていない新規の発話者として自らの名前等の識別子を入力すると、ＣＰＵ３１はこれに対応した信号を入力装置３２から受信する（ステップ４２０）。そしてＣＰＵ３１は、この受信した信号によって、現在の発話者が新規の発話者であるか否かを判定する（ステップ４３０）。新規の発話者であるなら、学習用のプログラムを実行し、この発話者に最適な時間デューティ比を導出し、この時間デューティ比と受信した識別子とを対応づけてメモリ３４に記録する（ステップ４４０）。
【００６２】
ステップ４３０で新規の発話者と判定した場合、あるいはステップ４４０の次には、ＣＰＵ３１はメモリ３４からこの発話者に対応した時間デューティ比で信号検出回路９に信号を出力する（ステップ４５０）。そして、この状態で音声認識プログラムをメモリ３４から読み出して実行する（ステップ４６０）。
【００６３】
ＣＰＵ３１は、全体として図３のような作動を行い、これによって、発話者の音声認識に最適になるように片持ち梁１の固有振動数を制御し、その上で音声認識を行う。
【００６４】
図４に、上記のステップ４４０において実行される学習用のプログラムのフローチャートを示し、この図に基づき学習用プログラム実行時のＣＰＵ３１の作動を説明する。学習用のプログラムの実行を開始すると、ＣＰＵ３１は、信号検出回路９から発話者が発する所定の文言による所定の音声信号を受信する（ステップ３１０）。この所定の文言としては、例えば音素バランス文のような、発話者の発声の周波数特性を効率よく決定するために用意された文章や、あるいは、特定のコマンド音声のような、音声認識システム５０において特に頻繁に使用される単語が用いられる。
【００６５】
次にＣＰＵ３１は、この受信した信号をフーリエ変換し、周波数特性を求める。すなわちスペクトル解析を行う（ステップ３２０）。そして、このスペクトルにおいて、最も強度が大きくなっている周波数を見つけだし、またメモリ３４が有する対応表を読み出し、この対応表から当該周波数に対応する時間デューティ比を検索、導出する（ステップ３３０）。この時間デューティ比が、発話者の音声認識に最適な時間デューティ比である。そして、この導出した比率を、発話者の名前等の識別子と対応させてメモリ３４に記録する（ステップ３４０）。これによって、学習が完了する。
【００６６】
なお、この学習においては、片持ち梁１の周波数応答特性を、発話者の発声による骨伝導音声振動の周波数特性に合わせるという目的のため、片持ち梁１の固有振動数が、この骨伝導音声振動の周波数特性において強度が最大となる周波数となるよう、時間デューティ比を決定しているが、この固有振動数を、強度が最大となる周波数に完全に一致させる必要はない。これらは、音声認識ができる程度に、片持ち梁１が発話者の発声に対応して振動するように合っていればよいのである。
【００６７】
以上のような音声認識システム５０の作動によって、発話者の音声認識にとって最適な時間デューティ比が記録され、この記録に従って印加回路８が電圧の印加、不印加を繰り返すことにより、片持ち梁１は発話者の音声認識にとって最適な固有振動数を有することになる。したがって不特定発話者の発声による骨伝導音声振動から音声認識を行うことができる。
【００６８】
また、印加回路８は、出力する電圧のオン、オフの切り替えの繰り返しによって、圧電部材に電圧を印加するので、印加回路８は実効的に出力電圧の制御をすることができることに加え、厳密には出力電圧が時間的に変動することにより、弾性体の周波数応答特性が時間的に変動するので、発声による振動に対して感度が高い周波数帯が広がる。
【００６９】
（第２実施形態）
図５は、本発明の第２実施形態に係る骨伝導音声振動検出素子１０の構成を示す図である。図中、この骨伝導音声振動検出素子１０の構成要素には、第１実施形態として図１に示した同様の機能を有するものと同じ符号を付す。
【００７０】
骨伝導音声振動検出素子１０は、第１実施形態に示した骨伝導音声振動検出素子１０と比べて圧電部材２の構成が異なっている。すなわち、圧電部材２は複数に分割されて片持ち梁１上に配されている。そして、印加回路８が圧電部材２のそれぞれに印加する電圧を独立して制御するようになっている。例えば、それぞれに印加する電圧を異なるものにすることで、圧電部材２のそれぞれが片持ち梁１に異なる応力を与え、それによって片持ち梁１の周波数応答特性を細かく制御することができる。
【００７１】
すなわち、これによって、弾性体へ与える応力の制御の自由度が増すので、片持ち梁１に与えられる引っ張り・圧縮応力の微調整ができる。したがって、第１実施形態の有する効果に加え、弾性体の周波数応答特性の制御の精度が向上する。
【００７２】
（第３実施形態）
図６は、本発明の第３実施形態に係る骨伝導音声振動検出素子１０の振動検出部２０の構成を示す図である。図中、この振動検出部２０の構成要素には、第２実施形態として図５に示した同様の機能を有するものと同じ符号を付す。
【００７３】
振動検出部２０は、第２実施形態に示した振動検出部２０と比べて、圧電部材２および検出部材３の構成が異なっている。すなわち、圧電部材２は片持ち梁１の上面および下面に配されている。また、検出部材３は片持ち梁１の上面に配された圧電部材２の一部を電気的に分離することで形成されている。
【００７４】
このように、圧電部材２を片持ち梁１の上面および下面に配することで、片持ち梁１に与えられる応力を上面と下面で均一にすることができる。したがって、第２実施形態の有する効果に加え、応力による片持ち梁１の反りを抑えることができる。
【００７５】
また、検出部材３は片持ち梁１の上面に配された圧電部材２の一部を電気的に分離することで形成されているので、１つの材料を圧電部材２と検出部材３の材料として用いることができる。したがって、第２実施形態の有する効果に加え、構成材料数の低減および製造工程の簡略化が実現する。
【００７６】
（第４実施形態）
図７は、本発明の第４実施形態に係る骨伝導音声振動検出素子１０の構成を示す図である。図中、この骨伝導音声振動検出素子１０の構成要素には、第２実施形態として図５に示した同様の機能を有するものと同じ符号を付す。
【００７７】
振動検出部２０は、第２実施形態に示した振動検出部２０と比べて、圧電部材２および検出部材３の構成が異なっている。すなわち、圧電部材２は片持ち梁１の上面および下面に配されている。また、検出部材３も片持ち梁１の上面および下面に配されている。
【００７８】
このように、圧電部材２を片持ち梁１の上面および下面に配することで、片持ち梁１に与えられる応力が上面と下面で均一になる。したがって、第２実施形態の有する効果に加え、応力による片持ち梁１の反りを抑えることができる。
【００７９】
また検出部材３を片持ち梁１の上面および下面に配することで、複数の検出部材３から信号検出回路９に電圧が出力される。そして信号検出回路９においてこの電圧が加算される。したがって、第２実施形態の有する効果に加え、片持ち梁１の振動による信号検出回路９への出力が高くなり、骨伝導音声振動検出素子１０の高感度化が実現される。
【００８０】
（第５実施形態）
図８は、本発明の第５実施形態に係る骨伝導音声振動検出素子１０の振動検出部２０の構成を示す図である。図中、この振動検出部２０の構成要素には、第４実施形態として図７に示した同様の機能を有するものと同じ符号を付す。
【００８１】
振動検出部２０は、第４実施形態に示した振動検出部２０と比べて、圧電部材２が片持ち梁１の上面および下面に配され、また検出部材３が片持ち梁１の上面および下面に配されていることは同じである。ただし、圧電部材２および検出部材３が片持ち梁１の長軸方向に並んで配されていることが異なっている。
【００８２】
この実施形態の効果は、第４実施形態のそれと同等である。
【００８３】
（第６実施形態）
図９は、本発明の第６実施形態に係る骨伝導音声振動検出素子１０の構成を示す図である。図中、この骨伝導音声振動検出素子１０の構成要素には、第１実施形態として図１に示した同様の機能を有するものと同じ符号を付す。ただし、簡単のために圧電部材２、検出部材３、重り５、印加回路８、信号検出回路９は図示しない。
【００８４】
本実施形態における骨伝導音声振動検出素子１０は、第１実施形態において示した振動検出部２０を層状に複数有している。そしてこれら振動検出部２０のそれぞれが有する検出部材３の電圧出力は、１つの信号検出回路９に送られ、それらの出力は信号検出回路９で加算されるようになっている。また、振動検出部２０のそれぞれが有する圧電部材２は、１つの印加回路８から電圧を印加されるようになっている。また、振動検出部２０のそれぞれが有する片持ち梁１は全て同じ材質、同じ長さのものであり、それらの固有振動数は互いに同一である。
【００８５】
このように、振動検出部２０が複数あり、振動による振動検出部２０からの電圧出力が信号検出回路９において加算されるようになっている。従って、第１実施形態の有する効果に加え、片持ち梁１の振動による信号検出回路９への出力が高くなり、骨伝導音声振動検出素子１０の高感度化が実現される。
【００８６】
（第７実施形態）
図１０は、本発明の第７実施形態に係る骨伝導音声振動検出素子１０の構成を示す図である。図中、この骨伝導音声振動検出素子１０の構成要素には、第６実施形態として図９に示した同様の機能を有するものと同じ符号を付す。ただし、簡単のために圧電部材２、検出部材３、重り５、印加回路８、信号検出回路９は図示しない。
【００８７】
本実施形態においては、第６実施形態に示した骨伝導音声振動検出素子１０において、複数ある片持ち梁１の長さを変えることにより、片持ち梁１が互いに異なる固有振動数を有するようになっている。
【００８８】
これによって、それぞれの片持ち梁１は異なる周波数の音声に反応するようになるので、例えば発話者の発声の周波数特性が、複数のピークを持つようなスペクトルで表せる場合、それらのピーク周波数に合うように個々の片持ち梁１に与える応力を調整することができる。このようにすることによって、同一の固有振動数を有する片持ち梁１の周波数応答特性を印加回路８からの印加電圧によって制御する場合よりも、骨伝導音声振動検出素子１０が対応できる周波数帯域を広くすることができる。
【００８９】
なお、第１〜７実施形態においては、片持ち梁１が弾性体に相当する。
【００９０】
また、検出部材３は圧電体から成っているが、検出部材は必ずしも圧電体である必要はなく、弾性体の振動に基づいて電気信号を生ずるものであればよい。例えば、検出部材はピエゾ抵抗であってもよいし、または端子間の距離によって容量が変化するコンデンサ等の、半導体などによる歪み検出の方法を用いるものであってもよい。
【００９１】
また、片持ち梁１の端部に重り５を固定しているが、この重り５は、片持ち梁１が骨伝導音声振動を十分検出できる場合には、必ずしも必要ではない。
【００９２】
また、印加回路８は、電圧の印加・不印加の時間比率を切り替えることで、実効的に印加する電圧を変更していたが、必ずしもこのようにする必要はなく、例えば、印加回路８は一定電圧を出力するものであって、その出力電圧値を音声認識装置３０から制御されるようになっていてもよい。また、印加回路８は必ずしも音声認識装置３０からの制御によって出力電圧を変化させる必要はなく、例えば手動の電圧調整ダイヤルを有し、人がこれを操作することで電圧が変化するようになっていてもよい。
【００９３】
また、ＣＰＵ３１の学習の作動は、発話者が初めてこの音声認識システム５０を使用するときにのみ行われるようになっているが、これは、使用の度に随時行って、それにより最適な時間デューティ比を毎回微調整することで、学習の精度を向上させるようになっていてもよい。
【００９４】
また、印加回路８が圧電部材２に電圧を印加することにより、圧電部材２がこの電圧に基づいて片持ち梁１に応力を与えるようになっているが、印加回路８が印可するのは電圧である必要はなく、電気的作用であればよい。例えば、印加回路８から圧電部材２へは電荷が印加され、圧電部材２はコンデンサのように印加される電荷に基づいて片持ち梁１に応力を与えるようになっていてもよい。
【００９５】
また、骨伝導音声振動検出素子１０の出力は、音声認識装置３０に出力されて音声認識のために使用されるが、必ずしもこのようになっている必要はなく、骨伝導音声振動検出素子１０の出力を音声通話に利用するようになっていてもよい。
【図面の簡単な説明】
【図１】本発明の第１実施形態に係る骨伝導音声振動検出素子１０の構成を示す図である。
【図２】圧電部材２に１０Ｖの電圧を印加した場合と、電圧を印加しない場合における片持ち梁１の周波数応答特性のグラフである。
【図３】印加電圧制御用のプログラムを含むＣＰＵ３１の全体的な処理のフローチャートである。
【図４】ＣＰＵ３１が実行する学習用のプログラムのフローチャートである。
【図５】第２実施形態に係る骨伝導音声振動検出素子１０の構成を示す図である。
【図６】第３実施形態に係る振動検出部２０の構成を示す図である。
【図７】第４実施形態に係る骨伝導音声振動検出素子１０の構成を示す図である。
【図８】第５実施形態に係る振動検出部２０の構成を示す図である。
【図９】第６実施形態に係る骨伝導音声振動検出素子１０の構成を示す図である。
【図１０】第７実施形態に係る骨伝導音声振動検出素子１０の構成を示す図である。
【図１１】特開平８−１９５９９５号公報に記載の骨伝導音声振動検出素子９０の構成を示す図である。
【符号の説明】
１…片持ち梁、２…圧電部材、３…検出部材、４…支持部材、５…重り、
８…印加回路、９…信号検出回路、１０…骨伝導音声振動検出素子、
２０…振動検出部、３１…ＣＰＵ、３２…入力装置、３３…表示装置、
３４…メモリ、５０…音声認識システム、９０…骨伝導音声振動検出素子、
９１…検出部材、９２ａ…片持ち梁、９２ｂ…片持ち梁、９３…重り、
９４…ケース、９５…支持部材、９６…引出線。

Claims

発話者の発声による骨伝導音声振動によって振動する弾性体と、この弾性体の振動に基づいて電気信号を生ずる検出部材と、印加される電気的作用に基づいて前記弾性体に応力を与える圧電部材と、を有する振動検出部と、
前記検出部材の電気信号を検出して、この電気信号に基づいた音声信号を出力する信号検出回路と、
前記弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電気的作用を前記圧電部材に印加する印加回路と、を備えた骨伝導音声振動検出素子。
前記圧電部材は、印加される電圧に基づいて前記弾性体に応力を与え、
前記印加回路は、前記弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を前記圧電部材に印加することを特徴とする請求項１に記載の骨伝導音声振動検出素子。
前記弾性体が梁状であることを特徴とする請求項１または２に記載の骨伝導音声振動検出素子。
前記弾性体が片持ち梁であることを特徴とする請求項３に記載の骨伝導音声振動検出素子。
前記弾性体に応力を与える前記圧電部材を複数備え、
前記印加回路は、前記複数の圧電部材に印加する電気的作用を独立に調整することを特徴とする請求項１ないし４のいずれか１つに記載の骨伝導音声振動検出素子。
前記検出部材は圧電体からなることを特徴とする請求項１ないし５のいずれか１つに記載の骨伝導音声振動検出素子。
前記検出部材は、前記圧電部材の一部を電気的に分離して形成されていることを特徴とする請求項１ないし６のいずれか１つに記載の骨伝導音声振動検出素子。
前記圧電部材は、前記弾性体の両面から応力を与えるような構造になっていることを特徴とする請求項１ないし７のいずれか１つに記載の骨伝導音声振動検出素子。
前記振動検出部を複数備え、これら複数の振動検出部が有する弾性体の固有振動数は互いに同一であることを特徴とする請求項１ないし８のいずれか１つに記載の骨伝導音声振動検出素子。
前記振動検出部を複数備え、これら複数の振動検出部が有する弾性体の固有振動数は互いに異なることを特徴とする請求項１ないし９のいずれか１つに記載の骨伝導音声振動検出素子。
前記印加回路は、電圧の出力の時間デューティー比を調整することによって、前記弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を前記圧電部材に印加することを特徴とする請求項２ないし１０のいずれか１つに記載の骨伝導音声振動検出素子。
請求項１に記載の骨伝導音声振動検出素子と、
前記骨伝導音声振動検出素子の有する信号検出回路から音声信号を受信し、前記音声信号に基づいて音声認識を行う音声認識装置と、を備え、
前記音声認識装置は、前記弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、前記印加回路の印加する電気的作用を制御することを特徴とする音声認識システム。
前記圧電部材は、印加される電圧に基づいて前記弾性体に応力を与え、
前記印加回路は、前記弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、電圧を前記圧電部材に印加することを特徴とする請求項１２に記載の音声認識システム。
前記音声認識装置は、発話者の音声認識の前に、前記発話者の発声の周波数特性から、前記印加回路の印加する電気的作用を決定することを特徴とする請求項１２または１３に記載の音声認識システム。
前記印加回路は、電圧の出力の時間デューティー比を調整することによって、前記弾性体の周波数応答特性が、発話者の発声による骨伝導音声振動の周波数特性に合うよう、印加電圧を前記圧電部材に印加することを特徴とする請求項１３または１４に記載の音声認識システム。