JP6061069B2 - 極微小音声入力装置 - Google Patents

極微小音声入力装置 Download PDF

Info

Publication number
JP6061069B2
JP6061069B2 JP2012207909A JP2012207909A JP6061069B2 JP 6061069 B2 JP6061069 B2 JP 6061069B2 JP 2012207909 A JP2012207909 A JP 2012207909A JP 2012207909 A JP2012207909 A JP 2012207909A JP 6061069 B2 JP6061069 B2 JP 6061069B2
Authority
JP
Japan
Prior art keywords
sound
breathing
sound pressure
voice
utterance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012207909A
Other languages
English (en)
Other versions
JP2014063018A (ja
Inventor
孝之 香高
孝之 香高
Original Assignee
株式会社システック
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社システック filed Critical 株式会社システック
Priority to JP2012207909A priority Critical patent/JP6061069B2/ja
Publication of JP2014063018A publication Critical patent/JP2014063018A/ja
Application granted granted Critical
Publication of JP6061069B2 publication Critical patent/JP6061069B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Description

本発明は、キーボードなどでのデータ入力の代わりに音声で入力する装置に関するものである。
従来、音声入力する場合は、マイクロフォンから発話音を入力するが、通常行われているように、発話音は、通常耳にする音圧レベル(約60dB)のものであり、周辺からの雑音の音圧レベルはこれより小さいので問題がない。しかし、一人で個室での作業では問題にならないが、多数の作業者が同室で発話するのは、極めてうるさく、他人の発話は雑音になりやすい。そのために、発話音の音圧を下げる試みが必要となる。発話音の音圧を下げると、今まで気にならなかった呼吸音と同程度の音圧に近づく。呼吸音は、呼吸している本人が気にして聞こうとして聞かないと感じない程度なので、少し離れた(隣の)他人には聞こえない。このような状態では、他人からの影響を受けずに音声入力を行えるが、発話音の音圧と同程度の呼吸音がマイクロフォンで拾われるので、呼吸音の判別と除去処理が必要になる。音圧が同程度の場合は、音圧で分けることができないので、特別な手段が必要となる。呼吸音を除去する目的ではないが、非発話音と発話音を区別するための方法として、フラクタル次元数を計算する手法が特許文献1に示されている。又、周辺からの雑音と発話音を区別して、周辺の雑音を除く目的でカオス分析し、リアプノフ指数を算出する装置が特許文献2に示されている。両者とも数学的理論に基づき計算処理を行うが、計算処理が重いのが欠点となっている。
尚、上記の音声入力は、通常考えられるようにマイクロフォンを口先または特別の場合は、口腔内において行うものである。これとは全く別の分野になるが、一般にNAMマイクロフォンと呼ばれるものがある。これは、喉の奥で生ずる音を耳下の皮膚に接触したマイクロフォンで捉えるものであるが、喉から身体の骨、肉を伝達してくる音であり、更に未だ
口腔や鼻などでも共振を受けてない音であるので、これらの微小音は、本願の対象範囲のものではない。
特開2007−264567 特開2003−99094
本発明の課題は、今まで必要な信号より雑音が多いとして注目されず使われることが無かった発話音の音圧が呼吸音のそれより小さい領域(極微小音領域)での簡単な呼吸音判別と除去の手段を備えた音声入力装置を提供することである。
本発明の極微小音声入力装置は、呼吸音とこれより音圧の小さい極微小音声の間に設定した音圧閾値を基に音声が呼吸音であるか極微小音声であるかを判別し、呼吸音を除去するものであり以下詳述する。
請求項1記載の発明は、極微小音声入力装置であって、多数の話者が音声入力を行っても他人に聞こえず、他人の入力の妨げにならない音声入力装置であって、
呼吸音より小さい音圧の話者が発する極微小音声を含む音声を取得するために、口先又は口腔内又は口の周りの閉じた閉区間に設置されるマイクロフォンと前記マイクロフォンで取得した前記音声をアナログデジタル変換するAD変換器と、前記AD変換器の出力する音声データを記憶するメモリと、前記呼吸音と前記極微小音声の間に設定した比較判別のための音圧閾値と比較することで、前記音声の音圧が前記音圧閾値より大きい場合は、前記音声が、前記呼吸音であるとして除去し、前記音声の音圧が前記音圧閾値より小さい場合は、前記音声が前記極微小音声の発話であるとして残す呼吸音除去手段と、前記AD変換器と前記メモリと前記呼吸音除去手段を制御する中央演算ユニットとを有することを特徴とする。
請求項2記載の発明は、請求項1記載の極微小音声入力装置において、
前記呼吸音除去手段は、前記音声の音圧が前記音圧閾値より大きい場合には、前記呼吸音と話者が通常発する通常発話の音圧である通常音圧(60dB)の間に設定した比較判別のための第2の音圧閾値と比較することで、前記音声の音圧が前記第2の音圧閾値より小さい場合は、前記音声が、前記呼吸音であるとして除去し、前記音声の音圧が前記第2の音圧閾値より大きい場合は、前記音声が前記通常発話であるとして除去し、前記極微小音声での再度の音声入力を指示する判断を行うことを特徴とする。
請求項3記載の発明は、請求項1又は請求項2記載の極微小音声入力装置において、
前記呼吸音除去手段、又は前記中央演算ユニットは、前記メモリから前記音声データを前記呼吸音の呼気又は吸気の1つの時間区間の単位より小さい時間間隔で集団として前記音声データを取得し、二つの隣り合う集団が呼気又は吸気、又は発話として連続している場合には同一集団とし、1つの集団内で連続しない場合は異なる集団に分け、同一集団ごとに同じ処理を行うことを特徴とする。
請求項4記載の発明は、請求項1から請求項3のいずれか1つに記載の極微小音声入力装置において、
前記話者が単独での前記通常発話を行う場合と前記極微小音声での発話を行う場合の両者の間の切り替えを行うために、マイクロフォンの感度を低く、前記呼吸音除去手段が作動しない前記通常発話対応モードとマイクロフォンの感度が高く、前記呼吸音除去手段が作動する前記前記極微小音声発話モードの間で切り替えを行う入力モード切替手段を有することを特徴とする。
以上のように構成されているので本発明の極微小音声入力装置では、多数の作業者が音声入力を行っても他人に聞こえず、他人の入力の雑音にならず、呼吸音を除去して、モニタするに好都合であり、データ処理に好都合な処理が可能となる。
本発明の極微小音声入力装置の構成と処理フローの一実施態様を示す図である。 音声入力の発話音と呼吸音の音圧レベルを示す図である。 本発明の極微小音声入力装置に入力する音声入力と呼吸音除去後の発話音圧(強度)の時間推移を示す図である。
本発明の極微小音声入力装置は、多数の話者が音声入力を行っても他人に聞こえず、他人の入力の妨げにならない音声入力装置であって、
呼吸音より小さい音圧の話者が発する極微小音声を含む音声を取得するために、口先又は口腔内又は口の周りの閉じた閉区間に設置されるマイクロフォンとマイクロフォンで取得した音声をアナログデジタル変換するAD変換器と、AD変換器の出力する音声データを記憶するメモリと、呼吸音と極微小音声の間に設定した比較判別のための音圧閾値と比較することで、音声の音圧が音圧閾値より大きい場合は、音声が、呼吸音であるとして除去し、音声の音圧が音圧閾値より小さい場合は、音声が極微小音声の発話であるとして残す呼吸音除去手段と、AD変換器とメモリと呼吸音除去手段を制御する中央演算ユニットとを有する。以下、実施例に沿って説明する。
図2は、音声入力の発話音と呼吸音の音圧レベルを示す図である。マイクロフォン(特に都合がよいのは、単一指向性のマイクロフォン)を話者の口先又は特別の場合は、口腔内、又は口の周りに閉じた閉区間に設置して発話する。2−Bに示すように、通常会話の発話音圧は60dB程度で行われている。これに対して、人間が呼吸をしているときの呼吸音圧は、10〜20dBと言われている。通常会話の発話音圧では、呼吸音圧が極めて小さいので気にならず、又、音圧での区別が容易である。
通常会話の音圧から、どんどん音圧を下げてゆく(小さい声にしてゆく)と、微小発話音として示したように発話音圧が呼吸音とほぼ同じかやや大きい程度になり、音圧のみでの両者の区別は難しくなる。ここでの区別は、カオス解析などの数学的アプローチの手段が従来行われるが、計算処理が複雑で重たい処理であることは、従来例で述べた。
処理を簡単にする手段として、発話音と呼吸音の空気の流れの揺らぎを含む特性の違いに基づいて区別することが提案できる。
この微小発話音より更に音圧を下げていった場合、極微小発話音と記述したように呼吸音圧より小さいので、当然、隣にいる他人の耳には聞こえない。且つ、呼吸音よりは小さいが、マイクロフォンには発話音が取得できる。しかし、所望の発話音より呼吸音が大きいので、自分の入力した内容をモニタする場合、呼吸音が聞くに堪えない大きさである。データ処理としても呼吸音は不要なので除去したい。この音圧領域は通常は常識外の範囲なので使用されることが無かったが、多人数で行っても他者の迷惑にならない静かな音声入力にこだわると、他者に聞こえないという利点を享受できる。しかしながら弱点もある。
たまたま、他人の大きな発話などが入った場合は、これも除去する必要がある。
本願は、極微小音発話を対象にして音声入力を行う装置である。
2−Aには上に述べたことが表にして示している。
図3は、本発明の極微小音声入力装置に入力する音声入力と呼吸音除去後の発話音圧(強度)の時間推移を示す図である。3−A、3−Bでは、横軸に時間をとって、縦軸に音声の強度変化を概念的(実際の波形ではなく、波形の存在する範囲を枠囲で)に示している。3−Aは、音声入力後、3−Bは望ましい呼吸音除去が行われた後に対応している。3−Aでは、発話音の強度より大きな強度の吸気と呼気がある、発話がない場合は、吸気と呼気を繰り返す。発話がある場合は、通常は、呼気のところに発話がなされ、呼気の場合より時間幅が長く発話がなされる。発話は話す言葉の内容により長さが異なり、息継ぎをしてから追加発話がなされる場合も多いことは周知のことである。
図1は、本発明の極微小音声入力装置の構成と処理フローの一実施態様を示す図である。1−Aには、ハードウェア構成、1−Bには、呼吸音除去手段の処理フローの一例を示す。1−Aにおいて、マイクロフォン101とADC(アナログデジタル変換器)102とCPU(中央演算処理ユニット)103とメモリ104と呼吸音除去手段105を有している。尚、呼吸音除去手段105は、判断・処理を行うので、ソフトウェアで処理する場合には、CPU103、メモリ104(ハードディスクを含んでもよい)
に内在するという見方も可能である。
マイクロフォン101は、呼吸音より小さい極微小音声を取得するので、口先又は特別の場合は口腔内又は、口の周りに閉じた閉区間に設置される。又、周囲からの音を拾わないように単一指向性のマイクロフォンが好都合である。口腔内又は、口の周りに閉じた閉区間では単一指向性のマイクロフォンでなくとも使用できる。
マイクロフォン101で取得したアナログの音声データは、ADC102に入力し、デジタル量に変換され、メモリ104に記憶される。CPU103は、ADC102の動作とメモリ104の記憶動作を制御する。呼吸音除去手段105は、メモリ104から所望の時間間隔ごとのデータを読み取り、判断と処理を行って、呼吸音を除去したデータをメモリ104(他のメモリでもよい)又は、記述されていない他所へデータを送付する。
データの読み取り時間間隔は、呼吸の時間間隔(1〜2秒程度)を目安にそれより少ない時間間隔であることが好ましい。例えば、可聴音域(〜20kHz)に対してサンプリング定理を満足するように、ADCでのデータ取得は、可聴音域(〜20kHz)に対してサンプリング定理を満足するように例えば、50kHz等の可聴音域の2倍以上の取得周波数(サンプリング周波数)で行うが、1つの吸気、呼気、発話の集団を特定するには、取得したデータを1〜2秒程度又はそれより小さい読み取り時間間隔で読み取り集団付けることを行う。時間間隔ごとに読まれたデータは、連続する音圧時間区間を、必要に応じて同一の音に属するとして集団分けし、同一処理に委ねるということである。なぜなら、呼吸音も吸気、呼気は、その間は無音区間で隔てられ、それぞれ一つの集団と扱ってよい。又、発話音は、呼気の区間に発せられ、複数の語が連続しているか、又は、1語1語の間が無音区間で隔てられているかのいずれかである。連続している場合は、その区間は、同じ集団として同じ処理が可能である。又、1つの集団内で連続しない場合は、異なる集団に分けることも可能である。
尚、集団分けや処理の判断には、以下の発話の特性を考慮して行うことも可能である。
<音声の特性>
・ 発話は呼気(空気の流れは外向き)の始めからが多い。呼気の途中から始まるのは意図的な場合以外は極めて少ない。
呼気の最初のパターンが現われたら、そこから呼気と次の吸気の区間までは、呼吸音と判断できる。呼気の最初のパターンが現われずに発話になった場合は、発話区間になる。
・ 吸気(空気の流れは内向き)では発話しない。
・ 呼吸音は、空気の流れが1方向であり、発話に比べ揺らぎが無い。
・ 呼吸音の音圧は、同一個人ではいつも同じような呼吸をしていることで、発話音に比べてばらつきが少ない。
・ 鼻からの呼気では発話しない。
・ 発話音は500Hz以上の成分が多い。呼吸音は500Hz以下の成分が多い。
呼吸音除去手段105の動作の例を、1−Bで説明する。
マイクロフォン101から発話入力がなされる。発話入力の後には、メモリ104へのデータの格納を介して、又は直接に、1)音圧が閾値1より大きいかを判断する。閾値1は、呼吸音と極微小音の間の音圧値に設定される。例えば、図2の2−Bを参照すると、10dB周辺が適当である。この値は、図3の音声入力の測定値を実際に測定し、呼吸音と発話音の間の適度な値に設定してもよい。音圧が閾値1より小さい場合は、極微小発話音と判断してデータを除去せず存続する。音圧が閾値1より大きい場合は、2)音圧が閾値2より大きいかを判断する。閾値2は、呼吸音と通常発話音の間の音圧値に設定される。例えば30dB等が適当である。
音圧が閾値2より小さい場合は、呼吸音と判断して除去され、この時間区間は、無音化される。音圧が閾値2より大きい場合は、通常発話音が混入したと判断し除去され、且つ、「適正レベルで再度入力してください」という指示を出す。時間の進行に沿って、音声入力に対してこの判断処理を繰り返し行う。
尚、音圧が閾値2より大きいかの判断以降の処理は、必須ではないが、現実の中では、うっかり大きな声で入力してしまったり、他人の大きな声を拾ってしまう場合があるので、このような判断処理があると都合がよい。又、多人数の入力では、このような呼吸音除去手段を稼動させるが、部屋内で単独の作業の場合には、通常発話の音圧で入力してもよいので、この場合は、呼吸音除去手段の稼動・不稼動は特に気にせずに、マイクロフォンの感度を下げて入力すればよいので、両者の間の切り替えを行う入力モード切替手段を備えると好都合である。
以上のような処理によって、図3の3−Aの音声入力は、3−Bの呼吸音除去後の音声データを得ることができる。
以上のように構成されているため、本発明の極微小音声入力装置は、多数の作業者が音声入力を行っても他人聞こえず、他人の入力の雑音にならず、呼吸音を除去して、モニタするに好都合であり、データ処理に提供されるので、産業上利用性が極めて大きい。
101 マイクロフォン
102 ADC
103 CPU
104 メモリ
105 呼吸音除去手段

Claims (4)

  1. 多数の話者が音声入力を行っても他人に聞こえず、他人の入力の妨げにならない音声入力装置であって、
    呼吸音より小さい音圧の話者が発する極微小音声を含む音声を取得するために、口先又は口腔内又は口の周りの閉じた閉区間に設置されるマイクロフォンと前記マイクロフォンで取得した前記音声をアナログデジタル変換するAD変換器と、前記AD変換器の出力する音声データを記憶するメモリと、前記呼吸音と前記極微小音声の間に設定した比較判別のための音圧閾値と比較することで、前記音声の音圧が前記音圧閾値より大きい場合は、前記音声が、前記呼吸音であるとして除去し、前記音声の音圧が前記音圧閾値より小さい場合は、前記音声が前記極微小音声の発話であるとして残す呼吸音除去手段と、前記AD変換器と前記メモリと前記呼吸音除去手段を制御する中央演算ユニットとを有することを特徴とする極微小音声入力装置。
  2. 前記呼吸音除去手段は、前記音声の音圧が前記音圧閾値より大きい場合には、前記呼吸音と話者が通常発する通常発話の音圧である通常音圧(60dB)の間に設定した比較判別のための第2の音圧閾値と比較することで、前記音声の音圧が前記第2の音圧閾値より小さい場合は、前記音声が、前記呼吸音であるとして除去し、前記音声の音圧が前記第2の音圧閾値より大きい場合は、前記音声が前記通常発話であるとして除去し、前記極微小音声での再度の音声入力を指示する判断を行うことを特徴とする請求項1記載の極微小音声入力装置。
  3. 前記呼吸音除去手段、又は前記中央演算ユニットは、前記メモリから前記音声データを前記呼吸音の呼気又は吸気の1つの時間区間の単位より小さい時間間隔で集団として前記音声データを取得し、二つの隣り合う集団が呼気又は吸気、又は発話として連続している場合には同一集団とし、1つの集団内で連続しない場合は異なる集団に分け、同一集団ごとに同じ処理を行うことを特徴とする請求項1又は請求項2記載の極微小音声入力装置。
  4. 前記話者が単独での前記通常発話を行う場合と前記極微小音声での発話を行う場合の両者の間の切り替えを行うために、マイクロフォンの感度を低く、前記呼吸音除去手段が作動しない前記通常発話対応モードとマイクロフォンの感度が高く、前記呼吸音除去手段が作動する前記前記極微小音声発話モードの間で切り替えを行う入力モード切替手段を有することを特徴とする請求項1から請求項3のいずれか1つに記載の極微小音声入力装置。
JP2012207909A 2012-09-21 2012-09-21 極微小音声入力装置 Active JP6061069B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012207909A JP6061069B2 (ja) 2012-09-21 2012-09-21 極微小音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012207909A JP6061069B2 (ja) 2012-09-21 2012-09-21 極微小音声入力装置

Publications (2)

Publication Number Publication Date
JP2014063018A JP2014063018A (ja) 2014-04-10
JP6061069B2 true JP6061069B2 (ja) 2017-01-18

Family

ID=50618324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012207909A Active JP6061069B2 (ja) 2012-09-21 2012-09-21 極微小音声入力装置

Country Status (1)

Country Link
JP (1) JP6061069B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6519102B2 (ja) * 2014-06-03 2019-05-29 株式会社システック 複数者間干渉音声雑音を回避した音声入力処理装置
JP2019023674A (ja) * 2017-07-24 2019-02-14 株式会社システック 過大音混入対応音声入力装置
JP7458720B2 (ja) * 2019-08-07 2024-04-01 株式会社コーエーテクモゲームス 情報処理装置、情報処理方法、及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3096880B2 (ja) * 1994-05-18 2000-10-10 長野日本無線株式会社 音声信号処理方法及び装置
JP3069249B2 (ja) * 1994-09-28 2000-07-24 大日本スクリーン製造株式会社 画像切り抜き装置
JP3649032B2 (ja) * 1999-03-23 2005-05-18 沖電気工業株式会社 音声認識方法
JP4722653B2 (ja) * 2005-09-29 2011-07-13 株式会社コナミデジタルエンタテインメント 音声情報処理装置、音声情報処理方法、ならびに、プログラム

Also Published As

Publication number Publication date
JP2014063018A (ja) 2014-04-10

Similar Documents

Publication Publication Date Title
JP5740575B2 (ja) 音声処理装置および音声処理方法
KR101402551B1 (ko) 음성 활동 감지(vad) 장치 및 잡음 억제 시스템을 함께 이용하기 위한 방법
US10303436B2 (en) Assistive apparatus having accelerometer-based accessibility
JP6435644B2 (ja) 電子楽器、発音制御方法及びプログラム
JP6061069B2 (ja) 極微小音声入力装置
JP2014137430A (ja) 電子機器及び掃除機
JP4940414B2 (ja) 音声処理方法、音声処理プログラム、音声処理装置
JP2023105135A (ja) 情報処理装置、装着型機器、情報処理方法及びプログラム
WO2019228329A1 (zh) 个人听力装置、外部声音处理装置及相关计算机程序产品
Dupont et al. Combined use of close-talk and throat microphones for improved speech recognition under non-stationary background noise
JPWO2008007616A1 (ja) 無音声発声の入力警告装置と方法並びにプログラム
JP6519102B2 (ja) 複数者間干渉音声雑音を回避した音声入力処理装置
JP6296291B2 (ja) 会話音声レベル通知システム及び会話音声レベル通知方法
KR102353771B1 (ko) 청력 역치를 고려한 어음 청력 검사음 생성 장치, 방법 및 프로그램
JP2019023674A (ja) 過大音混入対応音声入力装置
JP4127155B2 (ja) 聴覚補助装置
JP2020161884A (ja) 音声処理装置、音声処理方法、および音声処理システム
JP2006171226A (ja) 音声処理装置
JP2011221101A (ja) コミュニケーション装置
JP2008042740A (ja) 非可聴つぶやき音声採取用マイクロホン
JP2020030271A (ja) 会話音声レベル通知システム及び会話音声レベル通知方法
Dekens et al. A Multi-sensor Speech Database with Applications towards Robust Speech Processing in hostile Environments.
JP4134844B2 (ja) 聴覚補助装置
JP4255897B2 (ja) 話者認識装置
TWI407433B (zh) 錄音設備及利用該錄音設備進行聲音處理與錄入的方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20150908

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161129

R150 Certificate of patent or registration of utility model

Ref document number: 6061069

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250