JP3647499B2 - 音声ピックアップシステム - Google Patents
音声ピックアップシステム Download PDFInfo
- Publication number
- JP3647499B2 JP3647499B2 JP07587595A JP7587595A JP3647499B2 JP 3647499 B2 JP3647499 B2 JP 3647499B2 JP 07587595 A JP07587595 A JP 07587595A JP 7587595 A JP7587595 A JP 7587595A JP 3647499 B2 JP3647499 B2 JP 3647499B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- spectrum
- pickup
- detected
- missing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
【産業上の利用分野】
本発明は音声ピックアップシステムに関し、更に詳しくは、骨伝導音や気道音をピックアップで検出する音声ピックアップシステムに関する。
【0002】
【従来の技術】
騒音が存在する環境で使用するマイクロホンとして、骨伝導音を検出する骨伝導音ピックアップが知られている。
【0003】
この骨伝導音ピックアップはユーザの顔面や頭部に密着させておき、ユーザの発声に伴う顔面や頭部の振動を検出するものである。
また、似たようなマイクロホンとして、イヤホンのような形状のピックアップを外耳に挿入して、外耳道の気道音を検出するものも存在している。
【0004】
以上のような骨伝導音や気道音を検出するピックアップは周囲の騒音を比較的拾わずに、目的とするユーザの音声を検出し易いという利点を有する。
【0005】
【発明が解決しようとする課題】
しかし、通常の音声のスペクトルが300Hz〜3kHzであるとした場合に、図5特性Bに示すように、1kHz以上の周波数領域で検出レベルが低下する問題を有している。
【0006】
すなわち、骨伝導音や気道音といった間接的に音声を検出する形式のピックアップの検出音は、通常のマイクロホンで検出した音声信号(図5特性A)と比較して、音声の低域成分が強調されて高域成分が徐々に低下する感じになり(図5特性B)、明瞭度が低下する問題を有している。
【0007】
図6は男性の声を実際に骨伝導音ピックアップで検出した場合の周波数特性を示す特性図である。この特性図からも高域成分の低下の様子が読み取れる。実際には、骨伝導音ピックアップを顔面若しくは頭部に押さえつける際の圧力や、男性/女性の別などによって高域成分の低下の度合は若干異なるが、高域成分が低下することには変わりがない。
【0008】
本発明は上記の問題点に鑑みてなされたもので、その目的は、周囲の騒音を拾うことなく、かつ、明瞭度の高い状態で音声を伝達することが可能な音声ピックアップシステムを提供することにある。
【0009】
【課題を解決するための手段】
本件出願の発明者は、従来の音声ピックアップシステムにおいて予想される明瞭度等の不具合を改良すべく鋭意研究を行った結果、従来は周波数特性の点で明瞭度に問題を有していた骨伝導音や気道音を検出するピックアップにおいても明瞭度の高い音声を伝達できる構成を見出し、本発明を完成させたものである。
【0010】
従って、課題を解決する手段である本発明は以下に説明するように構成されたものである。
(1)すなわち、上記の課題を解決する第1の手段は、骨伝導音若しくは気道音をピックアップで検出する音声ピックアップシステムにおいて、前記ピックアップで検出された検出音を認識可能な音声認識手段と、前記音声認識手段で認識された音のデータを用いて、この認識された音のデータを通常のマイクロホンで検出した場合の周波数成分のスペクトルを生成するスペクトル発生手段と、前記認識された前記検出音毎に、前記スペクトル発生手段が生成したスペクトルと前記ピックアップで検出された検出音のスペクトルとを比較して、両スペクトルの差分に応じた部分の欠落スペクトルを求める比較手段と、前記比較手段での比較の結果により、前記検出音毎に求められた欠落スペクトルを補完音として生成する欠落スペクトル発生手段と、前記ピックアップで検出された検出音と前記欠落スペクトル発生手段で生成された補完音とを加算して出力する合成手段と、を有することを特徴とする音声ピックアップシステムである。
【0011】
尚、このような音声ピックアップシステムにおいて、欠落スペクトル発生手段において生成する補完音としては、予めシステムに音声合成用の学習をさせておいて、使用者の音声に似せた音声を発生するために必要な欠落スペクトルとすることも可能である。
【0014】
【作用】
課題を解決する第1の手段である音声ピックアップシステムにおいて、骨伝導音若しくは気道音をピックアップで検出し、ピックアップで検出した音を音声認識手段で認識し、音声認識手段で認識された音のデータを用いて、この認識された音のデータを通常のマイクロホンで検出した場合の周波数成分のスペクトルを生成し、このように生成したスペクトルとピックアップで実際に検出した音のスペクトルとを比較手段で比較し欠落している周波数成分を求めて、比較手段での比較の結果からピックアップで検出した音に欠落している周波数成分の音を欠落スペクトル発生手段で補完音として生成し、ピックアップで検出した音と欠落スペクトル発生手段で生成した補完音とを合成手段において合成して出力する。
【0015】
以上のような音声ピックアップシステムによれば、骨伝導音や気道音を検出した後に音声認識して欠落スペクトルを補完することで、本人の音声の特徴を損なうことなく通常の音声に近い明瞭な音声信号を生成することができるようになる。また、周囲の騒音の影響を受けることもない。
【0018】
【実施例】
図面を用いて本発明の一実施例について詳細に説明する。
<音声ピックアップシステムの構成(1)>
まず、本発明の一実施例である音声ピックアップシステムの構成について図1を用いて説明を行なう。
【0019】
ピックアップ1は骨伝導音若しくは気道音などを検出する検出手段であり、骨伝導音を検出するものとしては骨伝導マイクロホン(骨伝導音ピックアップ)、気道音を検出するものとしては気道音マイクロホンが該当する。
【0020】
音声認識回路2は周知の音声若しくは音節を認識する回路であり、ユーザの個々の特徴部分を学習するものであっても、また、このような学習を行わないものであっても構わない。
【0021】
補完音生成回路3は前記音声認識回路2で認識された音(音声,音節)のデータを用いて、ピックアップ1で検出された音に欠落している周波数成分の音を補完音として生成する一種の人工音発生回路である。また、この補完音生成回路3は、スペクトル発生回路3aと、比較回路3bと、欠落スペクトル発生回路3cとから構成されている。
【0022】
スペクトル発生回路3aは前記音声認識回路2で認識された音のデータを用いて、認識された音が通常のマイクロホンで検出された場合のスペクトルを発生する。比較回路3bは前記スペクトル発生回路3aが発生したスペクトルと、前記ピックアップで検出した音のスペクトルとを比較する。欠落スペクトル発生回路3cは、比較回路3bの比較結果に応じて、スペクトルの差分に応じた部分のスペクトル(欠落スペクトル)を補完音として発生する。
【0023】
合成回路4はピックアップ1で検出された音(骨伝導音,気道音)と補完音生成回路3で生成された補完音とを合成して出力する出力手段である。
<音声ピックアップシステムの動作(1)>
本発明の一実施例である音声ピックアップシステムの動作は、大きく分けて以下に示したような▲1▼,▲2▼,▲3▼,▲4▼,▲5▼,▲6▼の各ステップにより構成されている。このステップを順を追って説明する。
【0024】
▲1▼音(骨伝導音,気道音)の検出:
ピックアップ1を用いて骨伝導音若しくは気道音を検出する。
▲2▼音(骨伝導音,気道音)の認識:
ピックアップ1の検出音を音声認識回路2で認識する。この場合、音声認識回路2の認識方法により、単音での認識か音節での認識かが異なるが、いずれであっても構わない。また、ユーザの音声を学習して認識するものであっても、また、ユーザを特定した学習を行わないで認識するものであっても構わない。
【0025】
▲3▼認識音のスペクトル発生:
認識音のデータを用いて、スペクトル発生回路3aが通常のマイクロホンで検出した場合に得られるであろうスペクトル(以下、これを標準音のスペクトルと言う)を発生する。このために、スペクトル発生回路3aは認識音(単音,音節)に従ったスペクトルを有しているものとし、認識音に従って対応するスペクトルが呼び出されるようになっている。
【0026】
この場合のスペクトルとしては、ユーザ毎のスペクトルを有しても良いし、標準的なスペクトルを有しても良い。また、標準的なスペクトルを有するとした場合には、成人男性,成人女性,子供等のように幾つかのスペクトルを有するようにしても構わない。
【0027】
▲4▼標準音と検出音とのスペクトル比較:
比較回路3bにおいて、標準音のスペクトルと検出音とのスペクトルとを比較する。
【0028】
例えば、図5を用いて説明すると、認識された検出音毎に、標準音のスペクトルAと検出音のスペクトルBとを比較して、検出音の欠落スペクトルC(=A−B)を算出する。
【0029】
▲5▼補完音(欠落スペクトル)発生:
比較回路3bで得られた欠落スペクトルのデータに応じて欠落スペクトル発生回路3cが欠落スペクトルの信号を発生する。この場合も、スペクトル発生回路3aと同じ様に、発生する欠落スペクトルとして、ユーザ毎のスペクトルを有しても良いし、標準的なスペクトルを有しても良い。また、標準的なスペクトルを有するとした場合には、成人男性,成人女性,子供等のように幾つかのスペクトルを有するようにしても構わない。
【0030】
▲6▼検出音と補完音との合成:
合成回路4において、欠落スペクトルと検出音のスペクトルとを合成する。この合成処理により、検出音の欠落スペクトルが補完音として加算され、標準スペクトルと同等なスペクトルの合成音が得られる。従って、標準的なマイクロホンで集音したものと同等な音声信号が得られる。
【0031】
尚、補完音がユーザ本人のものであれば合成された結果得られる合成音も本人のものとなるが、補完音が標準的なデータに基づくものであったとしても、補完音の部分は高域の部分のみであるので違和感は極めて少ない。
【0032】
尚、ユーザの声に応じた欠落スペクトルを発生したい場合には、図2に示すように、個人データメモリ3dを備えておいて、ユーザの音声を予め収録(サンプリング)しておいて特徴部分のデータを格納しておくことが可能である。
【0033】
また、ユーザの声の質を判定して、欠落スペクトル発生用に複数備えた標準的なスペクトルの中から近いものを自動的に選択するようなことも可能である。
<構成(1)により得られる効果>
以上のような音声ピックアップシステムによれば、骨伝導音や気道音を検出した後に音声認識して欠落スペクトルを補完することで、本人の音声の特徴を損なうことなく通常の音声に近い明瞭な音声信号を生成することができるようになる。また、周囲の騒音の影響を受けることもない。
【0034】
また、歯噛音などのようにピックアップで検出されるものの無意味な音については、音声認識の処理で意味をなさないので補完音が生成されない。従って、ピックアップで検出された低域成分のみが出力されるため、悪影響は少ない。
【0035】
<音声ピックアップシステムの構成(2)>
まず、本発明の第二の実施例である音声ピックアップシステムの構成について図3を用いて説明を行なう。
【0036】
ピックアップ1は骨伝導音若しくは気道音などを検出する検出手段であり、骨伝導音を検出するものとしては骨伝導マイクロホン、気道音を検出するものとしては気道音マイクロホンが該当する。
【0037】
音声認識回路2は周知の音声若しくは音節を認識する回路であり、ユーザの個々の特徴部分を学習するものであっても、また、このような学習を行わないものであっても構わない。
【0038】
人工音発生回路5は前記音声認識回路2で認識された音(音声,音節)のデータを用いて、ピックアップ1で検出された音に対応した人工音を生成するものである。
【0039】
<音声ピックアップシステムの動作(2)>
本発明の一実施例である音声ピックアップシステムの動作は、大きく分けて以下に示したような▲1▼,▲2▼,▲3▼の各ステップにより構成されている。このステップを順を追って説明する。
【0040】
▲1▼音(骨伝導音,気道音)の検出:
ピックアップ1を用いて骨伝導音若しくは気道音を検出する。
▲2▼音(骨伝導音,気道音)の認識:
ピックアップ1の検出音を音声認識回路2で認識する。この場合、音声認識回路2の認識方法により、単音での認識か音節での認識かが異なるが、いずれであっても構わない。また、ユーザの音声を学習して認識するものであっても、また、ユーザを特定した学習を行わないで認識するものであっても構わない。
【0041】
▲3▼認識音のスペクトル発生:
認識音のデータを用いて、人工音発生回路5が通常のマイクロホンで検出した場合に得られるであろう標準スペクトルを発生する。このために、人工音発生回路5は認識音(単音,音節)に従ったスペクトルを有しているものとし、認識音に従って対応するスペクトルが呼び出されるようになっている。
【0042】
この場合のスペクトルとしては、ユーザ毎のスペクトルを有しても良いし、標準的なスペクトルを有しても良い。また、標準的なスペクトルを有するとした場合には、成人男性,成人女性,子供等のように幾つかのスペクトルを有するようにして切り替えて使用する構成でも構わない。従って、標準的なマイクロホンで集音したものと同等な音声信号が得られる。
【0043】
尚、ユーザの声に応じた欠落スペクトルを発生したい場合には、図4に示すように、個人データメモリ6を備えておいて、ユーザの音声を予め収録(サンプリング)しておいて特徴部分のデータを格納しておくことが可能である。
【0044】
また、ユーザの声の質を判定して、欠落スペクトル発生用に複数備えた標準的なスペクトルの中から近いものを自動的に選択するようなことも可能である。
<構成(2)により得られる効果>
以上のような音声ピックアップシステムによれば、骨伝導音や気道音を検出し、音声認識されたデータにより対応する人工音声を発生することで、通常の音声に近い明瞭な音声信号を生成することができるようになる。また、周囲の騒音の影響を受けることもない。
【0045】
また、歯噛音などのようにピックアップで検出されるものの無意味な音については、音声認識の処理で意味をなさないので人工音が生成されない。従って、出力されないため悪影響は少ない。
【0046】
<その他の好ましい例>
以上のような音声ピックアップシステムは各種の応用が可能であるが、騒音環境下で音声を伝達する各種システムに組み込んで使用することが可能である。例えば、携帯電話等の機器に組み込むことで明瞭な送話が可能になる。そして、周囲の音を相手に聞かれることが無いという利点も有している。
【0047】
【発明の効果】
以上のような音声ピックアップシステムによれば、骨伝導音や気道音を検出した後に音声認識して欠落スペクトルを補完することで、本人の音声の特徴を損なうことなく通常の音声に近い明瞭な音声信号を生成することができるようになる。また、周囲の騒音の影響を受けることもない。従って、周囲の騒音を拾うことなく、かつ、明瞭度の高い状態で音声を伝達することが可能な音声ピックアップシステムを実現できるようになる。
【図面の簡単な説明】
【図1】本発明の一実施例の音声ピックアップシステムの構成を示す構成図である。
【図2】本発明の一実施例の音声ピックアップシステムの変形例の構成を示す構成図である。
【図3】本発明の第二の実施例の音声ピックアップシステムの構成を示す構成図である。
【図4】本発明の第二の実施例の音声ピックアップシステムの変形例の構成を示す構成図である。
【図5】音声のスペクトルを模式的に示す特性図である。
【図6】音声のスペクトルの実測結果を示す特性図である。
【符号の説明】
1 ピックアップ
2 音声認識回路
3 補完音生成回路
3a スペクトル発生回路
3b 比較回路
3c 欠落スペクトル発生回路
4 合成回路
Claims (1)
- 骨伝導音若しくは気道音をピックアップで検出する音声ピックアップシステムにおいて、前記ピックアップで検出された検出音を認識可能な音声認識手段と、
前記音声認識手段で認識された音のデータを用いて、この認識された音のデータを通常のマイクロホンで検出した場合の周波数成分のスペクトルを生成するスペクトル発生手段と、
前記認識された前記検出音毎に、前記スペクトル発生手段が生成したスペクトルと前記ピックアップで検出された検出音のスペクトルとを比較して、両スペクトルの差分に応じた部分の欠落スペクトルを求める比較手段と、
前記比較手段での比較の結果により、前記検出音毎に求められた欠落スペクトルを補完音として生成する欠落スペクトル発生手段と、
前記ピックアップで検出された検出音と前記欠落スペクトル発生手段で生成された補完音とを加算して出力する合成手段と、
を有することを特徴とする音声ピックアップシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07587595A JP3647499B2 (ja) | 1995-03-31 | 1995-03-31 | 音声ピックアップシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07587595A JP3647499B2 (ja) | 1995-03-31 | 1995-03-31 | 音声ピックアップシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08275279A JPH08275279A (ja) | 1996-10-18 |
JP3647499B2 true JP3647499B2 (ja) | 2005-05-11 |
Family
ID=13588896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP07587595A Expired - Fee Related JP3647499B2 (ja) | 1995-03-31 | 1995-03-31 | 音声ピックアップシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3647499B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003255993A (ja) | 2002-03-04 | 2003-09-10 | Ntt Docomo Inc | 音声認識システム、音声認識方法、音声認識プログラム、音声合成システム、音声合成方法、音声合成プログラム |
EP1538865B1 (en) * | 2002-08-30 | 2010-06-30 | National University Corporation Nara Institute of Science and Technology | Microphone and communication interface system |
US7778430B2 (en) | 2004-01-09 | 2010-08-17 | National University Corporation NARA Institute of Science and Technology | Flesh conducted sound microphone, signal processing device, communication interface system and sound sampling method |
KR100639968B1 (ko) | 2004-11-04 | 2006-11-01 | 한국전자통신연구원 | 음성 인식 장치 및 그 방법 |
JP6979300B2 (ja) * | 2017-08-10 | 2021-12-08 | 株式会社テクノリンク | 発声・発話学習装置及びマイクロホン |
-
1995
- 1995-03-31 JP JP07587595A patent/JP3647499B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH08275279A (ja) | 1996-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10475467B2 (en) | Systems, methods and devices for intelligent speech recognition and processing | |
US11115762B2 (en) | Hearing device for own voice detection and method of operating a hearing device | |
JP3760173B2 (ja) | マイクロフォン、コミュニケーションインタフェースシステム | |
US20100131268A1 (en) | Voice-estimation interface and communication system | |
US20230290333A1 (en) | Hearing apparatus with bone conduction sensor | |
CN110708625A (zh) | 基于智能终端的环境声抑制与增强可调节耳机系统与方法 | |
CA2473195A1 (en) | Head mounted multi-sensory audio input system | |
US10764669B2 (en) | Device and method for monitoring earphone wearing state | |
JP2002358089A (ja) | 音声処理装置及び音声処理方法 | |
CN108200492A (zh) | 语音控制优化方法、装置以及集成入耳式麦克风的耳机和穿戴设备 | |
US11900730B2 (en) | Biometric identification | |
JP3647499B2 (ja) | 音声ピックアップシステム | |
JP2000152394A (ja) | 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置 | |
CN109729448A (zh) | 脖戴式语音交互耳机的语音控制优化方法和装置 | |
JP2004279768A (ja) | 気導音推定装置及び気導音推定方法 | |
CN113411715B (zh) | 说话声音音量的提示方法、耳机及可读存储介质 | |
JP2007267331A (ja) | 発話音声収集用コンビネーション・マイクロフォンシステム | |
WO2017207286A1 (fr) | Combine audio micro/casque comprenant des moyens de detection d'activite vocale multiples a classifieur supervise | |
CN207518797U (zh) | 脖戴式语音交互耳机的语音控制优化装置 | |
CN110100278B (zh) | 说话者识别系统及说话者识别方法及入耳式装置 | |
JP3068370B2 (ja) | 携帯用音声認識出力補助装置 | |
Beskow et al. | Hearing at home-communication support in home environments for hearing impaired persons. | |
CN112399004B (zh) | 声音输出的调整方法及执行该调整方法的电子装置 | |
JPS6367400B2 (ja) | ||
JP3257379B2 (ja) | 話速変換機能付補聴器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040625 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040706 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050209 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080218 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090218 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090218 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100218 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100218 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110218 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120218 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120218 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130218 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130218 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140218 Year of fee payment: 9 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |