JP6061069B2 - 極微小音声入力装置 - Google Patents
極微小音声入力装置 Download PDFInfo
- Publication number
- JP6061069B2 JP6061069B2 JP2012207909A JP2012207909A JP6061069B2 JP 6061069 B2 JP6061069 B2 JP 6061069B2 JP 2012207909 A JP2012207909 A JP 2012207909A JP 2012207909 A JP2012207909 A JP 2012207909A JP 6061069 B2 JP6061069 B2 JP 6061069B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- breathing
- sound pressure
- voice
- utterance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000037656 Respiratory Sounds Diseases 0.000 claims description 76
- 230000035945 sensitivity Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 210000000214 mouth Anatomy 0.000 description 16
- 238000000034 method Methods 0.000 description 6
- 230000029058 respiratory gaseous exchange Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Description
尚、上記の音声入力は、通常考えられるようにマイクロフォンを口先または特別の場合は、口腔内において行うものである。これとは全く別の分野になるが、一般にNAMマイクロフォンと呼ばれるものがある。これは、喉の奥で生ずる音を耳下の皮膚に接触したマイクロフォンで捉えるものであるが、喉から身体の骨、肉を伝達してくる音であり、更に未だ
口腔や鼻などでも共振を受けてない音であるので、これらの微小音は、本願の対象範囲のものではない。
呼吸音より小さい音圧の話者が発する極微小音声を含む音声を取得するために、口先又は口腔内又は口の周りの閉じた閉区間に設置されるマイクロフォンと前記マイクロフォンで取得した前記音声をアナログデジタル変換するAD変換器と、前記AD変換器の出力する音声データを記憶するメモリと、前記呼吸音と前記極微小音声の間に設定した比較判別のための音圧閾値と比較することで、前記音声の音圧が前記音圧閾値より大きい場合は、前記音声が、前記呼吸音であるとして除去し、前記音声の音圧が前記音圧閾値より小さい場合は、前記音声が前記極微小音声の発話であるとして残す呼吸音除去手段と、前記AD変換器と前記メモリと前記呼吸音除去手段を制御する中央演算ユニットとを有することを特徴とする。
前記呼吸音除去手段は、前記音声の音圧が前記音圧閾値より大きい場合には、前記呼吸音と話者が通常発する通常発話の音圧である通常音圧(60dB)の間に設定した比較判別のための第2の音圧閾値と比較することで、前記音声の音圧が前記第2の音圧閾値より小さい場合は、前記音声が、前記呼吸音であるとして除去し、前記音声の音圧が前記第2の音圧閾値より大きい場合は、前記音声が前記通常発話であるとして除去し、前記極微小音声での再度の音声入力を指示する判断を行うことを特徴とする。
前記呼吸音除去手段、又は前記中央演算ユニットは、前記メモリから前記音声データを前記呼吸音の呼気又は吸気の1つの時間区間の単位より小さい時間間隔で集団として前記音声データを取得し、二つの隣り合う集団が呼気又は吸気、又は発話として連続している場合には同一集団とし、1つの集団内で連続しない場合は異なる集団に分け、同一集団ごとに同じ処理を行うことを特徴とする。
前記話者が単独での前記通常発話を行う場合と前記極微小音声での発話を行う場合の両者の間の切り替えを行うために、マイクロフォンの感度を低く、前記呼吸音除去手段が作動しない前記通常発話対応モードとマイクロフォンの感度が高く、前記呼吸音除去手段が作動する前記前記極微小音声発話モードの間で切り替えを行う入力モード切替手段を有することを特徴とする。
呼吸音より小さい音圧の話者が発する極微小音声を含む音声を取得するために、口先又は口腔内又は口の周りの閉じた閉区間に設置されるマイクロフォンとマイクロフォンで取得した音声をアナログデジタル変換するAD変換器と、AD変換器の出力する音声データを記憶するメモリと、呼吸音と極微小音声の間に設定した比較判別のための音圧閾値と比較することで、音声の音圧が音圧閾値より大きい場合は、音声が、呼吸音であるとして除去し、音声の音圧が音圧閾値より小さい場合は、音声が極微小音声の発話であるとして残す呼吸音除去手段と、AD変換器とメモリと呼吸音除去手段を制御する中央演算ユニットとを有する。以下、実施例に沿って説明する。
通常会話の音圧から、どんどん音圧を下げてゆく(小さい声にしてゆく)と、微小発話音として示したように発話音圧が呼吸音とほぼ同じかやや大きい程度になり、音圧のみでの両者の区別は難しくなる。ここでの区別は、カオス解析などの数学的アプローチの手段が従来行われるが、計算処理が複雑で重たい処理であることは、従来例で述べた。
処理を簡単にする手段として、発話音と呼吸音の空気の流れの揺らぎを含む特性の違いに基づいて区別することが提案できる。
たまたま、他人の大きな発話などが入った場合は、これも除去する必要がある。
本願は、極微小音発話を対象にして音声入力を行う装置である。
2−Aには上に述べたことが表にして示している。
に内在するという見方も可能である。
マイクロフォン101で取得したアナログの音声データは、ADC102に入力し、デジタル量に変換され、メモリ104に記憶される。CPU103は、ADC102の動作とメモリ104の記憶動作を制御する。呼吸音除去手段105は、メモリ104から所望の時間間隔ごとのデータを読み取り、判断と処理を行って、呼吸音を除去したデータをメモリ104(他のメモリでもよい)又は、記述されていない他所へデータを送付する。
<音声の特性>
・ 発話は呼気(空気の流れは外向き)の始めからが多い。呼気の途中から始まるのは意図的な場合以外は極めて少ない。
呼気の最初のパターンが現われたら、そこから呼気と次の吸気の区間までは、呼吸音と判断できる。呼気の最初のパターンが現われずに発話になった場合は、発話区間になる。
・ 吸気(空気の流れは内向き)では発話しない。
・ 呼吸音は、空気の流れが1方向であり、発話に比べ揺らぎが無い。
・ 呼吸音の音圧は、同一個人ではいつも同じような呼吸をしていることで、発話音に比べてばらつきが少ない。
・ 鼻からの呼気では発話しない。
・ 発話音は500Hz以上の成分が多い。呼吸音は500Hz以下の成分が多い。
マイクロフォン101から発話入力がなされる。発話入力の後には、メモリ104へのデータの格納を介して、又は直接に、1)音圧が閾値1より大きいかを判断する。閾値1は、呼吸音と極微小音の間の音圧値に設定される。例えば、図2の2−Bを参照すると、10dB周辺が適当である。この値は、図3の音声入力の測定値を実際に測定し、呼吸音と発話音の間の適度な値に設定してもよい。音圧が閾値1より小さい場合は、極微小発話音と判断してデータを除去せず存続する。音圧が閾値1より大きい場合は、2)音圧が閾値2より大きいかを判断する。閾値2は、呼吸音と通常発話音の間の音圧値に設定される。例えば30dB等が適当である。
音圧が閾値2より小さい場合は、呼吸音と判断して除去され、この時間区間は、無音化される。音圧が閾値2より大きい場合は、通常発話音が混入したと判断し除去され、且つ、「適正レベルで再度入力してください」という指示を出す。時間の進行に沿って、音声入力に対してこの判断処理を繰り返し行う。
以上のような処理によって、図3の3−Aの音声入力は、3−Bの呼吸音除去後の音声データを得ることができる。
102 ADC
103 CPU
104 メモリ
105 呼吸音除去手段
Claims (4)
- 多数の話者が音声入力を行っても他人に聞こえず、他人の入力の妨げにならない音声入力装置であって、
呼吸音より小さい音圧の話者が発する極微小音声を含む音声を取得するために、口先又は口腔内又は口の周りの閉じた閉区間に設置されるマイクロフォンと前記マイクロフォンで取得した前記音声をアナログデジタル変換するAD変換器と、前記AD変換器の出力する音声データを記憶するメモリと、前記呼吸音と前記極微小音声の間に設定した比較判別のための音圧閾値と比較することで、前記音声の音圧が前記音圧閾値より大きい場合は、前記音声が、前記呼吸音であるとして除去し、前記音声の音圧が前記音圧閾値より小さい場合は、前記音声が前記極微小音声の発話であるとして残す呼吸音除去手段と、前記AD変換器と前記メモリと前記呼吸音除去手段を制御する中央演算ユニットとを有することを特徴とする極微小音声入力装置。 - 前記呼吸音除去手段は、前記音声の音圧が前記音圧閾値より大きい場合には、前記呼吸音と話者が通常発する通常発話の音圧である通常音圧(60dB)の間に設定した比較判別のための第2の音圧閾値と比較することで、前記音声の音圧が前記第2の音圧閾値より小さい場合は、前記音声が、前記呼吸音であるとして除去し、前記音声の音圧が前記第2の音圧閾値より大きい場合は、前記音声が前記通常発話であるとして除去し、前記極微小音声での再度の音声入力を指示する判断を行うことを特徴とする請求項1記載の極微小音声入力装置。
- 前記呼吸音除去手段、又は前記中央演算ユニットは、前記メモリから前記音声データを前記呼吸音の呼気又は吸気の1つの時間区間の単位より小さい時間間隔で集団として前記音声データを取得し、二つの隣り合う集団が呼気又は吸気、又は発話として連続している場合には同一集団とし、1つの集団内で連続しない場合は異なる集団に分け、同一集団ごとに同じ処理を行うことを特徴とする請求項1又は請求項2記載の極微小音声入力装置。
- 前記話者が単独での前記通常発話を行う場合と前記極微小音声での発話を行う場合の両者の間の切り替えを行うために、マイクロフォンの感度を低く、前記呼吸音除去手段が作動しない前記通常発話対応モードとマイクロフォンの感度が高く、前記呼吸音除去手段が作動する前記前記極微小音声発話モードの間で切り替えを行う入力モード切替手段を有することを特徴とする請求項1から請求項3のいずれか1つに記載の極微小音声入力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012207909A JP6061069B2 (ja) | 2012-09-21 | 2012-09-21 | 極微小音声入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012207909A JP6061069B2 (ja) | 2012-09-21 | 2012-09-21 | 極微小音声入力装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014063018A JP2014063018A (ja) | 2014-04-10 |
JP6061069B2 true JP6061069B2 (ja) | 2017-01-18 |
Family
ID=50618324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012207909A Active JP6061069B2 (ja) | 2012-09-21 | 2012-09-21 | 極微小音声入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6061069B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6519102B2 (ja) * | 2014-06-03 | 2019-05-29 | 株式会社システック | 複数者間干渉音声雑音を回避した音声入力処理装置 |
JP2019023674A (ja) * | 2017-07-24 | 2019-02-14 | 株式会社システック | 過大音混入対応音声入力装置 |
JP7458720B2 (ja) * | 2019-08-07 | 2024-04-01 | 株式会社コーエーテクモゲームス | 情報処理装置、情報処理方法、及びプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3096880B2 (ja) * | 1994-05-18 | 2000-10-10 | 長野日本無線株式会社 | 音声信号処理方法及び装置 |
JP3069249B2 (ja) * | 1994-09-28 | 2000-07-24 | 大日本スクリーン製造株式会社 | 画像切り抜き装置 |
JP3649032B2 (ja) * | 1999-03-23 | 2005-05-18 | 沖電気工業株式会社 | 音声認識方法 |
JP4722653B2 (ja) * | 2005-09-29 | 2011-07-13 | 株式会社コナミデジタルエンタテインメント | 音声情報処理装置、音声情報処理方法、ならびに、プログラム |
-
2012
- 2012-09-21 JP JP2012207909A patent/JP6061069B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014063018A (ja) | 2014-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5740575B2 (ja) | 音声処理装置および音声処理方法 | |
KR101402551B1 (ko) | 음성 활동 감지(vad) 장치 및 잡음 억제 시스템을 함께 이용하기 위한 방법 | |
US10303436B2 (en) | Assistive apparatus having accelerometer-based accessibility | |
JP6435644B2 (ja) | 電子楽器、発音制御方法及びプログラム | |
JP6061069B2 (ja) | 極微小音声入力装置 | |
JP2014137430A (ja) | 電子機器及び掃除機 | |
JP4940414B2 (ja) | 音声処理方法、音声処理プログラム、音声処理装置 | |
JP2023105135A (ja) | 情報処理装置、装着型機器、情報処理方法及びプログラム | |
WO2019228329A1 (zh) | 个人听力装置、外部声音处理装置及相关计算机程序产品 | |
Dupont et al. | Combined use of close-talk and throat microphones for improved speech recognition under non-stationary background noise | |
JPWO2008007616A1 (ja) | 無音声発声の入力警告装置と方法並びにプログラム | |
JP6519102B2 (ja) | 複数者間干渉音声雑音を回避した音声入力処理装置 | |
JP6296291B2 (ja) | 会話音声レベル通知システム及び会話音声レベル通知方法 | |
KR102353771B1 (ko) | 청력 역치를 고려한 어음 청력 검사음 생성 장치, 방법 및 프로그램 | |
JP2019023674A (ja) | 過大音混入対応音声入力装置 | |
JP4127155B2 (ja) | 聴覚補助装置 | |
JP2020161884A (ja) | 音声処理装置、音声処理方法、および音声処理システム | |
JP2006171226A (ja) | 音声処理装置 | |
JP2011221101A (ja) | コミュニケーション装置 | |
JP2008042740A (ja) | 非可聴つぶやき音声採取用マイクロホン | |
JP2020030271A (ja) | 会話音声レベル通知システム及び会話音声レベル通知方法 | |
Dekens et al. | A Multi-sensor Speech Database with Applications towards Robust Speech Processing in hostile Environments. | |
JP4134844B2 (ja) | 聴覚補助装置 | |
JP4255897B2 (ja) | 話者認識装置 | |
TWI407433B (zh) | 錄音設備及利用該錄音設備進行聲音處理與錄入的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150907 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20150908 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161020 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161129 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6061069 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |