JPH08275279A - Voice pickup system - Google Patents

Voice pickup system

Info

Publication number
JPH08275279A
JPH08275279A JP7075875A JP7587595A JPH08275279A JP H08275279 A JPH08275279 A JP H08275279A JP 7075875 A JP7075875 A JP 7075875A JP 7587595 A JP7587595 A JP 7587595A JP H08275279 A JPH08275279 A JP H08275279A
Authority
JP
Japan
Prior art keywords
sound
spectrum
pickup
voice
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7075875A
Other languages
Japanese (ja)
Other versions
JP3647499B2 (en
Inventor
Takuro Yamaguchi
卓郎 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foster Electric Co Ltd
Original Assignee
Foster Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foster Electric Co Ltd filed Critical Foster Electric Co Ltd
Priority to JP07587595A priority Critical patent/JP3647499B2/en
Publication of JPH08275279A publication Critical patent/JPH08275279A/en
Application granted granted Critical
Publication of JP3647499B2 publication Critical patent/JP3647499B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

PURPOSE: To realize the voice pickup system in which a voice is sent with a high articulation without picking up a surrounding noise. CONSTITUTION: The voice pickup system detecting a bone conduction sound or an air conduction sound by a pickup 1 is provided with a voice recognition means 2 capable of recognizing a sound detected by the pickup 1 and a spectrum generating means 3a using the sound data recognized by the voice recognition means 2 to generate a spectrum with a frequency component when the sound data recognized with a conventional microcophone, and also with a comparison means 3b comparing the sound spectrum detected by the pickup 1 with the generated spectrum to obtain a missing frequency component, a missing spectrum generating means 3c generating a sound of the frequency component missing in the sound detected by the pickup 1 as a supplement sound according to the result of comparison by the comparator means 3b, and a synthesis means 4 synthesizing the sound detected by the pickup 1 with the supplement sound generated by the missing spectrum generating means 3c and providing the synthesized output.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は音声ピックアップシステ
ムに関し、更に詳しくは、骨伝導音や気道音をピックア
ップで検出する音声ピックアップシステムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice pickup system, and more particularly to a voice pickup system for detecting bone conduction sounds and airway sounds by a pickup.

【0002】[0002]

【従来の技術】騒音が存在する環境で使用するマイクロ
ホンとして、骨伝導音を検出する骨伝導音ピックアップ
が知られている。
2. Description of the Related Art A bone conduction sound pickup for detecting bone conduction sound is known as a microphone used in a noisy environment.

【0003】この骨伝導音ピックアップはユーザの顔面
や頭部に密着させておき、ユーザの発声に伴う顔面や頭
部の振動を検出するものである。また、似たようなマイ
クロホンとして、イヤホンのような形状のピックアップ
を外耳に挿入して、外耳道の気道音を検出するものも存
在している。
This bone conduction sound pickup is made to be in close contact with the user's face or head and detects the vibration of the face or head accompanying the user's utterance. In addition, as a similar microphone, there is a microphone that inserts a pickup having a shape like an earphone into the outer ear to detect airway sound of the ear canal.

【0004】以上のような骨伝導音や気道音を検出する
ピックアップは周囲の騒音を比較的拾わずに、目的とす
るユーザの音声を検出し易いという利点を有する。
The pickup for detecting bone conduction sound and airway sound as described above has an advantage that it is easy to detect the voice of the intended user without relatively picking up ambient noise.

【0005】[0005]

【発明が解決しようとする課題】しかし、通常の音声の
スペクトルが300Hz〜3kHzであるとした場合
に、図5特性Bに示すように、1kHz以上の周波数領
域で検出レベルが低下する問題を有している。
However, when the spectrum of normal voice is 300 Hz to 3 kHz, there is a problem that the detection level is lowered in the frequency region of 1 kHz or more as shown in the characteristic B of FIG. are doing.

【0006】すなわち、骨伝導音や気道音といった間接
的に音声を検出する形式のピックアップの検出音は、通
常のマイクロホンで検出した音声信号(図5特性A)と
比較して、音声の低域成分が強調されて高域成分が徐々
に低下する感じになり(図5特性B)、明瞭度が低下す
る問題を有している。
That is, a detection sound of a pickup that indirectly detects a sound such as a bone conduction sound or an airway sound is lower than a sound signal (characteristic A in FIG. 5) detected by an ordinary microphone. The component is emphasized and the high frequency component gradually decreases (characteristic B in FIG. 5), which causes a problem that the clarity decreases.

【0007】図6は男性の声を実際に骨伝導音ピックア
ップで検出した場合の周波数特性を示す特性図である。
この特性図からも高域成分の低下の様子が読み取れる。
実際には、骨伝導音ピックアップを顔面若しくは頭部に
押さえつける際の圧力や、男性/女性の別などによって
高域成分の低下の度合は若干異なるが、高域成分が低下
することには変わりがない。
FIG. 6 is a characteristic diagram showing frequency characteristics when a male voice is actually detected by a bone conduction sound pickup.
From this characteristic diagram, it is possible to read how the high frequency components are reduced.
Actually, the degree of lowering the high-frequency component is slightly different depending on the pressure when the bone conduction sound pickup is pressed against the face or head, and whether male / female or not, but the high-frequency component decreases. Absent.

【0008】本発明は上記の問題点に鑑みてなされたも
ので、その目的は、周囲の騒音を拾うことなく、かつ、
明瞭度の高い状態で音声を伝達することが可能な音声ピ
ックアップシステムを提供することにある。
The present invention has been made in view of the above problems, and an object of the present invention is to pick up ambient noise, and
An object of the present invention is to provide a voice pickup system capable of transmitting voice in a state of high intelligibility.

【0009】[0009]

【課題を解決するための手段】本件出願の発明者は、従
来の音声ピックアップシステムにおいて予想される明瞭
度等の不具合を改良すべく鋭意研究を行った結果、従来
は周波数特性の点で明瞭度に問題を有していた骨伝導音
や気道音を検出するピックアップにおいても明瞭度の高
い音声を伝達できる構成を見出し、本発明を完成させた
ものである。
Means for Solving the Problems The inventor of the present application has conducted earnest research to improve inconveniences and the like expected in a conventional voice pickup system, and as a result, conventionally, the intelligibility in terms of frequency characteristics has been improved. The present invention has been completed by finding out a configuration capable of transmitting a voice with high intelligibility even in a pickup for detecting bone conduction sound or airway sound, which had a problem in the above.

【0010】従って、課題を解決する手段である本発明
は以下に説明するように構成されたものである。 (1)すなわち、上記の課題を解決する第1の手段は、
骨伝導音若しくは気道音をピックアップで検出する音声
ピックアップシステムにおいて、前記ピックアップで検
出した音を認識可能な音声認識手段と、前記音声認識手
段で認識された音のデータを用いて、この認識された音
のデータを通常のマイクロホンで検出した場合の周波数
成分のスペクトルを生成するスペクトル発生手段と、こ
のスペクトル発生手段が生成したスペクトルと前記ピッ
クアップで検出した音のスペクトルとを比較して欠落し
ている周波数成分を求める比較手段と、前記比較手段で
の比較の結果から前記ピックアップで検出した音に欠落
している周波数成分の音を補完音として生成する欠落ス
ペクトル発生手段と、前記ピックアップで検出した音と
前記欠落スペクトル発生手段で生成した補完音とを合成
して出力する合成手段と、を有することを特徴とする音
声ピックアップシステムである。
Therefore, the present invention, which is a means for solving the problems, is configured as described below. (1) That is, the first means for solving the above problems is
In a voice pickup system that detects a bone conduction sound or an airway sound with a pickup, this recognition is performed by using a voice recognition unit capable of recognizing the sound detected by the pickup and the sound data recognized by the voice recognition unit. A spectrum generation unit that generates a spectrum of frequency components when sound data is detected by a normal microphone is compared with the spectrum generated by this spectrum generation unit and the spectrum of the sound detected by the pickup and is missing. Comparison means for obtaining a frequency component, missing spectrum generating means for generating a sound of a frequency component missing from the sound detected by the pickup as a complementary sound from the result of comparison by the comparison means, and sound detected by the pickup And a complementary sound generated by the missing spectrum generating means are combined and output. An audio pickup system comprising: the stage, a.

【0011】尚、このような音声ピックアップシステム
において、欠落スペクトル発生手段において生成する補
完音としては、予めシステムに音声合成用の学習をさせ
ておいて、使用者の音声に似せた音声を発生するために
必要な欠落スペクトルとすることも可能である。
In such a voice pickup system, as the complementary sound generated by the missing spectrum generating means, the system is preliminarily trained for voice synthesis and a voice similar to the voice of the user is generated. It is also possible to set a missing spectrum necessary for this.

【0012】(2)また、上記の課題を解決する第2の
手段は、骨伝導音若しくは気道音をピックアップで検出
する音声ピックアップシステムにおいて、前記ピックア
ップで検出した音を認識可能な音声認識手段と、前記音
声認識手段で認識された音のデータに対応する音を人工
音として生成する人工音生成手段と、を有することを特
徴とする音声ピックアップシステムである。
(2) A second means for solving the above-mentioned problems is a voice recognition means capable of recognizing the sound detected by the pickup in a voice pickup system for detecting bone conduction sound or airway sound by the pickup. And an artificial sound generation unit that generates a sound corresponding to the sound data recognized by the voice recognition unit as an artificial sound.

【0013】尚、このような音声ピックアップシステム
において、人工音生成手段において生成する人工音とし
ては、予めシステムに音声合成用の学習をさせておいて
使用者の音声に似せた音声を発生することも、別の一般
的な音声を発生することも可能である。
In such a voice pickup system, as the artificial sound generated by the artificial sound generating means, the system should be trained for voice synthesis in advance to generate a voice similar to the voice of the user. It is also possible to generate another common voice.

【0014】[0014]

【作用】課題を解決する第1の手段である音声ピックア
ップシステムにおいて、骨伝導音若しくは気道音をピッ
クアップで検出し、ピックアップで検出した音を音声認
識手段で認識し、音声認識手段で認識された音のデータ
を用いて、この認識された音のデータを通常のマイクロ
ホンで検出した場合の周波数成分のスペクトルを生成
し、このように生成したスペクトルとピックアップで実
際に検出した音のスペクトルとを比較手段で比較し欠落
している周波数成分を求めて、比較手段での比較の結果
からピックアップで検出した音に欠落している周波数成
分の音を欠落スペクトル発生手段で補完音として生成
し、ピックアップで検出した音と欠落スペクトル発生手
段で生成した補完音とを合成手段において合成して出力
する。
In the voice pickup system which is the first means for solving the problem, the bone conduction sound or the airway sound is detected by the pickup, the sound detected by the pickup is recognized by the voice recognition means, and the sound is recognized by the voice recognition means. The sound data is used to generate a spectrum of frequency components when this recognized sound data is detected by a normal microphone, and the spectrum thus generated is compared with the sound spectrum actually detected by the pickup. Means to find the missing frequency component, and from the result of the comparison in the comparing means, the sound of the missing frequency component in the sound detected by the pickup is generated as a complementary sound by the missing spectrum generating means, and is picked up by the pickup. The detected sound and the complementary sound generated by the missing spectrum generating means are combined by the combining means and output.

【0015】以上のような音声ピックアップシステムに
よれば、骨伝導音や気道音を検出した後に音声認識して
欠落スペクトルを補完することで、本人の音声の特徴を
損なうことなく通常の音声に近い明瞭な音声信号を生成
することができるようになる。また、周囲の騒音の影響
を受けることもない。
According to the voice pickup system as described above, by detecting bone conduction sound or airway sound and then recognizing the voice and complementing the missing spectrum, the voice is close to normal voice without spoiling the characteristics of the voice of the person. It becomes possible to generate a clear audio signal. In addition, it is not affected by ambient noise.

【0016】課題を解決する第2の手段である音声ピッ
クアップシステムにおいて、骨伝導音若しくは気道音を
ピックアップで検出し、ピックアップで検出した音を音
声認識手段で認識し、音声認識手段で認識された音に対
応する音を人工音生成手段で人工音として生成する。
In the voice pickup system as the second means for solving the problem, bone conduction sound or airway sound is detected by the pickup, the sound detected by the pickup is recognized by the voice recognition means, and is recognized by the voice recognition means. A sound corresponding to the sound is generated as an artificial sound by the artificial sound generating means.

【0017】以上のような音声ピックアップシステムに
よれば、骨伝導音や気道音を検出し、音声認識されたデ
ータにより対応する人工音声を発生することで、通常の
音声に近い明瞭な音声信号を生成することができるよう
になる。また、周囲の騒音の影響を受けることもない。
According to the voice pickup system as described above, a bone conduction sound or an airway sound is detected, and an artificial voice corresponding to the voice-recognized data is generated to generate a clear voice signal close to a normal voice. Will be able to generate. In addition, it is not affected by ambient noise.

【0018】[0018]

【実施例】図面を用いて本発明の一実施例について詳細
に説明する。 <音声ピックアップシステムの構成(1)>まず、本発
明の一実施例である音声ピックアップシステムの構成に
ついて図1を用いて説明を行なう。
An embodiment of the present invention will be described in detail with reference to the drawings. <Structure (1) of Voice Pickup System> First, the structure of a voice pickup system according to an embodiment of the present invention will be described with reference to FIG.

【0019】ピックアップ1は骨伝導音若しくは気道音
などを検出する検出手段であり、骨伝導音を検出するも
のとしては骨伝導マイクロホン(骨伝導音ピックアッ
プ)、気道音を検出するものとしては気道音マイクロホ
ンが該当する。
The pickup 1 is a detecting means for detecting bone conduction sound or airway sound. A bone conduction microphone (bone conduction sound pickup) is used for detecting bone conduction sound, and an airway sound is used for detecting airway sound. A microphone is applicable.

【0020】音声認識回路2は周知の音声若しくは音節
を認識する回路であり、ユーザの個々の特徴部分を学習
するものであっても、また、このような学習を行わない
ものであっても構わない。
The voice recognition circuit 2 is a well-known circuit for recognizing voices or syllables, and may or may not learn individual characteristic parts of the user. Absent.

【0021】補完音生成回路3は前記音声認識回路2で
認識された音(音声,音節)のデータを用いて、ピック
アップ1で検出された音に欠落している周波数成分の音
を補完音として生成する一種の人工音発生回路である。
また、この補完音生成回路3は、スペクトル発生回路3
aと、比較回路3bと、欠落スペクトル発生回路3cと
から構成されている。
The complementary sound generation circuit 3 uses the data of the sound (voice, syllable) recognized by the voice recognition circuit 2 as a complementary sound for the frequency component missing in the sound detected by the pickup 1. It is a kind of artificial sound generation circuit that generates.
In addition, the complementary sound generation circuit 3 includes a spectrum generation circuit 3
a, a comparison circuit 3b, and a missing spectrum generation circuit 3c.

【0022】スペクトル発生回路3aは前記音声認識回
路2で認識された音のデータを用いて、認識された音が
通常のマイクロホンで検出された場合のスペクトルを発
生する。比較回路3bは前記スペクトル発生回路3aが
発生したスペクトルと、前記ピックアップで検出した音
のスペクトルとを比較する。欠落スペクトル発生回路3
cは、比較回路3bの比較結果に応じて、スペクトルの
差分に応じた部分のスペクトル(欠落スペクトル)を補
完音として発生する。
The spectrum generation circuit 3a uses the sound data recognized by the voice recognition circuit 2 to generate a spectrum when the recognized sound is detected by a normal microphone. The comparison circuit 3b compares the spectrum generated by the spectrum generation circuit 3a with the spectrum of the sound detected by the pickup. Missing spectrum generation circuit 3
In accordance with the comparison result of the comparison circuit 3b, c generates a spectrum (missing spectrum) of a portion corresponding to the difference in spectrum as a complementary sound.

【0023】合成回路4はピックアップ1で検出された
音(骨伝導音,気道音)と補完音生成回路3で生成され
た補完音とを合成して出力する出力手段である。 <音声ピックアップシステムの動作(1)>本発明の一
実施例である音声ピックアップシステムの動作は、大き
く分けて以下に示したような,,,,,の
各ステップにより構成されている。このステップを順を
追って説明する。
The synthesizing circuit 4 is an output means for synthesizing the sound (bone conduction sound, airway sound) detected by the pickup 1 and the complementary sound generated by the complementary sound generating circuit 3 and outputting the synthesized sound. <Operation of Voice Pickup System (1)> The operation of the voice pickup system according to the embodiment of the present invention is roughly divided into the following steps ,. This step will be described step by step.

【0024】音(骨伝導音,気道音)の検出:ピック
アップ1を用いて骨伝導音若しくは気道音を検出する。 音(骨伝導音,気道音)の認識:ピックアップ1の検
出音を音声認識回路2で認識する。この場合、音声認識
回路2の認識方法により、単音での認識か音節での認識
かが異なるが、いずれであっても構わない。また、ユー
ザの音声を学習して認識するものであっても、また、ユ
ーザを特定した学習を行わないで認識するものであって
も構わない。
Detection of sound (bone conduction sound, airway sound): Bone conduction sound or airway sound is detected using the pickup 1. Recognition of sound (bone conduction sound, airway sound): The sound detected by the pickup 1 is recognized by the voice recognition circuit 2. In this case, depending on the recognition method of the voice recognition circuit 2, the recognition by a single sound or the recognition by a syllable differs, but either one may be used. Further, the user's voice may be learned and recognized, or the user's voice may be recognized without learning.

【0025】認識音のスペクトル発生:認識音のデー
タを用いて、スペクトル発生回路3aが通常のマイクロ
ホンで検出した場合に得られるであろうスペクトル(以
下、これを標準音のスペクトルと言う)を発生する。こ
のために、スペクトル発生回路3aは認識音(単音,音
節)に従ったスペクトルを有しているものとし、認識音
に従って対応するスペクトルが呼び出されるようになっ
ている。
Generation of spectrum of recognized sound: Using the data of the recognized sound, a spectrum that will be obtained when the spectrum generation circuit 3a detects it with a normal microphone (hereinafter referred to as a spectrum of a standard sound) is generated. To do. For this reason, the spectrum generation circuit 3a is assumed to have a spectrum according to the recognized sound (single note, syllable), and the corresponding spectrum is called according to the recognized sound.

【0026】この場合のスペクトルとしては、ユーザ毎
のスペクトルを有しても良いし、標準的なスペクトルを
有しても良い。また、標準的なスペクトルを有するとし
た場合には、成人男性,成人女性,子供等のように幾つ
かのスペクトルを有するようにしても構わない。
The spectrum in this case may be a spectrum for each user or a standard spectrum. Moreover, when it has a standard spectrum, it may have several spectra such as an adult male, an adult female, and a child.

【0027】標準音と検出音とのスペクトル比較:比
較回路3bにおいて、標準音のスペクトルと検出音との
スペクトルとを比較する。
Spectrum comparison between standard sound and detected sound: The comparison circuit 3b compares the spectrum of the standard sound with the spectrum of the detected sound.

【0028】例えば、図5を用いて説明すると、認識さ
れた検出音毎に、標準音のスペクトルAと検出音のスペ
クトルBとを比較して、検出音の欠落スペクトルC(=
A−B)を算出する。
For example, referring to FIG. 5, the spectrum A of the standard sound and the spectrum B of the detected sound are compared for each recognized detected sound, and the missing spectrum C (=
Calculate AB).

【0029】補完音(欠落スペクトル)発生:比較回
路3bで得られた欠落スペクトルのデータに応じて欠落
スペクトル発生回路3cが欠落スペクトルの信号を発生
する。この場合も、スペクトル発生回路3aと同じ様
に、発生する欠落スペクトルとして、ユーザ毎のスペク
トルを有しても良いし、標準的なスペクトルを有しても
良い。また、標準的なスペクトルを有するとした場合に
は、成人男性,成人女性,子供等のように幾つかのスペ
クトルを有するようにしても構わない。
Generation of complementary sound (missing spectrum): The missing spectrum generating circuit 3c generates a missing spectrum signal in accordance with the missing spectrum data obtained by the comparison circuit 3b. In this case as well, similar to the spectrum generating circuit 3a, the missing spectrum to be generated may have a spectrum for each user or may have a standard spectrum. Moreover, when it has a standard spectrum, it may have several spectra such as an adult male, an adult female, and a child.

【0030】検出音と補完音との合成:合成回路4に
おいて、欠落スペクトルと検出音のスペクトルとを合成
する。この合成処理により、検出音の欠落スペクトルが
補完音として加算され、標準スペクトルと同等なスペク
トルの合成音が得られる。従って、標準的なマイクロホ
ンで集音したものと同等な音声信号が得られる。
Synthesis of detected sound and complementary sound: The synthesis circuit 4 synthesizes the missing spectrum and the spectrum of the detected sound. By this synthesizing process, the missing spectrum of the detected sound is added as a complementary sound, and a synthetic sound having a spectrum equivalent to the standard spectrum is obtained. Therefore, an audio signal equivalent to that picked up by a standard microphone can be obtained.

【0031】尚、補完音がユーザ本人のものであれば合
成された結果得られる合成音も本人のものとなるが、補
完音が標準的なデータに基づくものであったとしても、
補完音の部分は高域の部分のみであるので違和感は極め
て少ない。
If the complementary sound is that of the user himself, the synthesized sound obtained as a result of synthesis is also that of the user himself. Even if the complementary sound is based on standard data,
Since the portion of the complementary sound is only the high frequency portion, there is very little discomfort.

【0032】尚、ユーザの声に応じた欠落スペクトルを
発生したい場合には、図2に示すように、個人データメ
モリ3dを備えておいて、ユーザの音声を予め収録(サ
ンプリング)しておいて特徴部分のデータを格納してお
くことが可能である。
When it is desired to generate a missing spectrum corresponding to the voice of the user, as shown in FIG. 2, the personal data memory 3d is provided and the voice of the user is recorded (sampled) in advance. It is possible to store the data of the characteristic part.

【0033】また、ユーザの声の質を判定して、欠落ス
ペクトル発生用に複数備えた標準的なスペクトルの中か
ら近いものを自動的に選択するようなことも可能であ
る。 <構成(1)により得られる効果>以上のような音声ピ
ックアップシステムによれば、骨伝導音や気道音を検出
した後に音声認識して欠落スペクトルを補完すること
で、本人の音声の特徴を損なうことなく通常の音声に近
い明瞭な音声信号を生成することができるようになる。
また、周囲の騒音の影響を受けることもない。
It is also possible to judge the quality of the user's voice and automatically select a close one from a plurality of standard spectra provided for generating a missing spectrum. <Effects Obtained by Configuration (1)> According to the voice pickup system as described above, the feature of the voice of the person is impaired by performing voice recognition and complementing the missing spectrum after detecting bone conduction sound or airway sound. It becomes possible to generate a clear voice signal close to a normal voice without the need.
In addition, it is not affected by ambient noise.

【0034】また、歯噛音などのようにピックアップで
検出されるものの無意味な音については、音声認識の処
理で意味をなさないので補完音が生成されない。従っ
て、ピックアップで検出された低域成分のみが出力され
るため、悪影響は少ない。
Further, regarding a meaningless sound such as a tooth-cluttering sound which is detected by the pickup, a complementary sound is not generated because it does not make sense in the voice recognition process. Therefore, since only the low frequency component detected by the pickup is output, the adverse effect is small.

【0035】<音声ピックアップシステムの構成(2)
>まず、本発明の第二の実施例である音声ピックアップ
システムの構成について図3を用いて説明を行なう。
<Structure of voice pickup system (2)
First, the configuration of the voice pickup system according to the second embodiment of the present invention will be described with reference to FIG.

【0036】ピックアップ1は骨伝導音若しくは気道音
などを検出する検出手段であり、骨伝導音を検出するも
のとしては骨伝導マイクロホン、気道音を検出するもの
としては気道音マイクロホンが該当する。
The pickup 1 is a detecting means for detecting bone conduction sound or airway sound, and a bone conduction microphone is used for detecting bone conduction sound, and an airway sound microphone is used for detecting airway sound.

【0037】音声認識回路2は周知の音声若しくは音節
を認識する回路であり、ユーザの個々の特徴部分を学習
するものであっても、また、このような学習を行わない
ものであっても構わない。
The voice recognition circuit 2 is a known circuit for recognizing voices or syllables, and may or may not learn individual characteristic parts of the user. Absent.

【0038】人工音発生回路5は前記音声認識回路2で
認識された音(音声,音節)のデータを用いて、ピック
アップ1で検出された音に対応した人工音を生成するも
のである。
The artificial sound generating circuit 5 uses the data of the sound (voice, syllable) recognized by the voice recognition circuit 2 to generate an artificial sound corresponding to the sound detected by the pickup 1.

【0039】<音声ピックアップシステムの動作(2)
>本発明の一実施例である音声ピックアップシステムの
動作は、大きく分けて以下に示したような,,の
各ステップにより構成されている。このステップを順を
追って説明する。
<Operation of the voice pickup system (2)
> The operation of the voice pickup system according to the embodiment of the present invention is roughly divided into the following steps. This step will be described step by step.

【0040】音(骨伝導音,気道音)の検出:ピック
アップ1を用いて骨伝導音若しくは気道音を検出する。 音(骨伝導音,気道音)の認識:ピックアップ1の検
出音を音声認識回路2で認識する。この場合、音声認識
回路2の認識方法により、単音での認識か音節での認識
かが異なるが、いずれであっても構わない。また、ユー
ザの音声を学習して認識するものであっても、また、ユ
ーザを特定した学習を行わないで認識するものであって
も構わない。
Detection of sound (bone conduction sound, airway sound): The pickup 1 is used to detect bone conduction sound or airway sound. Recognition of sound (bone conduction sound, airway sound): The sound detected by the pickup 1 is recognized by the voice recognition circuit 2. In this case, depending on the recognition method of the voice recognition circuit 2, the recognition by a single sound or the recognition by a syllable differs, but either one may be used. Further, the user's voice may be learned and recognized, or the user's voice may be recognized without learning.

【0041】認識音のスペクトル発生:認識音のデー
タを用いて、人工音発生回路5が通常のマイクロホンで
検出した場合に得られるであろう標準スペクトルを発生
する。このために、人工音発生回路5は認識音(単音,
音節)に従ったスペクトルを有しているものとし、認識
音に従って対応するスペクトルが呼び出されるようにな
っている。
Generation of spectrum of recognized sound: Data of the recognized sound is used to generate a standard spectrum that would be obtained when the artificial sound generation circuit 5 detects the sound with a normal microphone. For this reason, the artificial sound generation circuit 5 causes the recognition sound (single sound,
It has a spectrum according to a syllable), and a corresponding spectrum is called according to a recognized sound.

【0042】この場合のスペクトルとしては、ユーザ毎
のスペクトルを有しても良いし、標準的なスペクトルを
有しても良い。また、標準的なスペクトルを有するとし
た場合には、成人男性,成人女性,子供等のように幾つ
かのスペクトルを有するようにして切り替えて使用する
構成でも構わない。従って、標準的なマイクロホンで集
音したものと同等な音声信号が得られる。
The spectrum in this case may be a spectrum for each user or may be a standard spectrum. Further, in the case of having a standard spectrum, it may be configured to have several spectra such as an adult male, an adult female, a child, etc., and switch and use them. Therefore, an audio signal equivalent to that picked up by a standard microphone can be obtained.

【0043】尚、ユーザの声に応じた欠落スペクトルを
発生したい場合には、図4に示すように、個人データメ
モリ6を備えておいて、ユーザの音声を予め収録(サン
プリング)しておいて特徴部分のデータを格納しておく
ことが可能である。
When it is desired to generate a missing spectrum corresponding to the voice of the user, the personal data memory 6 is provided as shown in FIG. 4, and the voice of the user is recorded (sampled) in advance. It is possible to store the data of the characteristic part.

【0044】また、ユーザの声の質を判定して、欠落ス
ペクトル発生用に複数備えた標準的なスペクトルの中か
ら近いものを自動的に選択するようなことも可能であ
る。 <構成(2)により得られる効果>以上のような音声ピ
ックアップシステムによれば、骨伝導音や気道音を検出
し、音声認識されたデータにより対応する人工音声を発
生することで、通常の音声に近い明瞭な音声信号を生成
することができるようになる。また、周囲の騒音の影響
を受けることもない。
It is also possible to judge the quality of the user's voice and automatically select a close one from a plurality of standard spectra provided for generating a missing spectrum. <Effects Obtained by Configuration (2)> According to the voice pickup system as described above, a normal voice is generated by detecting bone conduction sound and airway sound and generating an artificial voice corresponding to the voice-recognized data. It becomes possible to generate a clear audio signal close to. In addition, it is not affected by ambient noise.

【0045】また、歯噛音などのようにピックアップで
検出されるものの無意味な音については、音声認識の処
理で意味をなさないので人工音が生成されない。従っ
て、出力されないため悪影響は少ない。
Further, as for a meaningless sound such as a tooth biting sound which is detected by the pickup, since it does not make sense in the voice recognition process, an artificial sound is not generated. Therefore, since it is not output, the adverse effect is small.

【0046】<その他の好ましい例>以上のような音声
ピックアップシステムは各種の応用が可能であるが、騒
音環境下で音声を伝達する各種システムに組み込んで使
用することが可能である。例えば、携帯電話等の機器に
組み込むことで明瞭な送話が可能になる。そして、周囲
の音を相手に聞かれることが無いという利点も有してい
る。
<Other Preferred Examples> Although the voice pickup system as described above can be applied in various ways, it can be used by incorporating it into various systems for transmitting voice in a noisy environment. For example, by incorporating it in a device such as a mobile phone, clear transmission becomes possible. It also has the advantage that the surrounding sound is not heard by the other party.

【0047】[0047]

【発明の効果】以上のような音声ピックアップシステム
によれば、骨伝導音や気道音を検出した後に音声認識し
て欠落スペクトルを補完することで、本人の音声の特徴
を損なうことなく通常の音声に近い明瞭な音声信号を生
成することができるようになる。また、周囲の騒音の影
響を受けることもない。従って、周囲の騒音を拾うこと
なく、かつ、明瞭度の高い状態で音声を伝達することが
可能な音声ピックアップシステムを実現できるようにな
る。
As described above, according to the voice pickup system as described above, the voice recognition is performed after the bone conduction sound or the airway sound is detected and the missing spectrum is complemented, so that the normal voice can be obtained without spoiling the characteristics of the voice of the person. It becomes possible to generate a clear audio signal close to. In addition, it is not affected by ambient noise. Therefore, it becomes possible to realize a voice pickup system capable of transmitting voice in a state of high intelligibility without picking up ambient noise.

【0048】また、骨伝導音や気道音を検出し、音声認
識されたデータにより対応する人工音声を発生すること
で、通常の音声に近い明瞭な音声信号を生成することが
できるようになる。また、周囲の騒音の影響を受けるこ
ともない。従って、周囲の騒音を拾うことなく、かつ、
明瞭度の高い状態で音声を伝達することが可能な音声ピ
ックアップシステムを実現できるようになる。
Further, by detecting bone conduction sound or airway sound and generating a corresponding artificial voice from the voice-recognized data, a clear voice signal close to a normal voice can be generated. In addition, it is not affected by ambient noise. Therefore, without picking up ambient noise, and
It becomes possible to realize a voice pickup system capable of transmitting voice in a state of high clarity.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の音声ピックアップシステム
の構成を示す構成図である。
FIG. 1 is a configuration diagram showing a configuration of an audio pickup system according to an embodiment of the present invention.

【図2】本発明の一実施例の音声ピックアップシステム
の変形例の構成を示す構成図である。
FIG. 2 is a configuration diagram showing a configuration of a modified example of the voice pickup system according to the exemplary embodiment of the present invention.

【図3】本発明の第二の実施例の音声ピックアップシス
テムの構成を示す構成図である。
FIG. 3 is a configuration diagram showing a configuration of a voice pickup system according to a second embodiment of the present invention.

【図4】本発明の第二の実施例の音声ピックアップシス
テムの変形例の構成を示す構成図である。
FIG. 4 is a configuration diagram showing a configuration of a modified example of the audio pickup system according to the second embodiment of the present invention.

【図5】音声のスペクトルを模式的に示す特性図であ
る。
FIG. 5 is a characteristic diagram schematically showing a spectrum of voice.

【図6】音声のスペクトルの実測結果を示す特性図であ
る。
FIG. 6 is a characteristic diagram showing an actual measurement result of a voice spectrum.

【符号の説明】[Explanation of symbols]

1 ピックアップ 2 音声認識回路 3 補完音生成回路 3a スペクトル発生回路 3b 比較回路 3c 欠落スペクトル発生回路 4 合成回路 1 Pickup 2 Voice recognition circuit 3 Complementary sound generation circuit 3a Spectrum generation circuit 3b Comparison circuit 3c Missing spectrum generation circuit 4 Synthesis circuit

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 骨伝導音若しくは気道音をピックアップ
で検出する音声ピックアップシステムにおいて、 前記ピックアップで検出した音を認識可能な音声認識手
段と、 前記音声認識手段で認識された音のデータを用いて、こ
の認識された音のデータを通常のマイクロホンで検出し
た場合の周波数成分のスペクトルを生成するスペクトル
発生手段と、 このスペクトル発生手段が生成したスペクトルと前記ピ
ックアップで検出した音のスペクトルとを比較して欠落
している周波数成分を求める比較手段と、 前記比較手段での比較の結果から前記ピックアップで検
出した音に欠落している周波数成分の音を補完音として
生成する欠落スペクトル発生手段と、 前記ピックアップで検出した音と前記欠落スペクトル発
生手段で生成した補完音とを合成して出力する合成手段
と、 を有することを特徴とする音声ピックアップシステム。
1. A voice pickup system for detecting a bone conduction sound or an airway sound by a pickup, using voice recognition means capable of recognizing a sound detected by the pickup, and sound data recognized by the voice recognition means. , Comparing the spectrum generated by this spectrum generating means with the spectrum of the sound detected by the pickup, and a spectrum generating means for generating a spectrum of frequency components when the recognized sound data is detected by an ordinary microphone. Comparing means for obtaining a missing frequency component, a missing spectrum generating means for producing a sound of a frequency component missing from the sound detected by the pickup as a complementary sound from the result of the comparison by the comparing means, and Synthesizes the sound detected by the pickup and the complementary sound generated by the missing spectrum generating means. Sound pickup system characterized by having a synthesizing means for outputting Te.
【請求項2】 骨伝導音若しくは気道音をピックアップ
で検出する音声ピックアップシステムにおいて、 前記ピックアップで検出した音を認識可能な音声認識手
段と、 前記音声認識手段で認識された音のデータに対応する音
を人工音として生成する人工音生成手段と、 を有することを特徴とする音声ピックアップシステム。
2. A voice pickup system for detecting a bone conduction sound or an airway sound by a pickup, which corresponds to voice recognition means capable of recognizing the sound detected by the pickup and sound data recognized by the voice recognition means. An artificial sound generating means for generating a sound as an artificial sound.
JP07587595A 1995-03-31 1995-03-31 Voice pickup system Expired - Fee Related JP3647499B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07587595A JP3647499B2 (en) 1995-03-31 1995-03-31 Voice pickup system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07587595A JP3647499B2 (en) 1995-03-31 1995-03-31 Voice pickup system

Publications (2)

Publication Number Publication Date
JPH08275279A true JPH08275279A (en) 1996-10-18
JP3647499B2 JP3647499B2 (en) 2005-05-11

Family

ID=13588896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07587595A Expired - Fee Related JP3647499B2 (en) 1995-03-31 1995-03-31 Voice pickup system

Country Status (1)

Country Link
JP (1) JP3647499B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004021738A1 (en) * 2002-08-30 2004-03-11 Asahi Kasei Kabushiki Kaisha Microphone and communication interface system
WO2005067340A1 (en) * 2004-01-09 2005-07-21 Asahi Kasei Kabushiki Kaisha Body conducted sound microphone, signal processing device, communication interface system, and sound collecting method
US7613611B2 (en) 2004-11-04 2009-11-03 Electronics And Telecommunications Research Institute Method and apparatus for vocal-cord signal recognition
US7680666B2 (en) 2002-03-04 2010-03-16 Ntt Docomo, Inc. Speech recognition system, speech recognition method, speech synthesis system, speech synthesis method, and program product
JP2019035818A (en) * 2017-08-10 2019-03-07 株式会社テクノリンク Vocalization utterance learning device and microphone

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7680666B2 (en) 2002-03-04 2010-03-16 Ntt Docomo, Inc. Speech recognition system, speech recognition method, speech synthesis system, speech synthesis method, and program product
WO2004021738A1 (en) * 2002-08-30 2004-03-11 Asahi Kasei Kabushiki Kaisha Microphone and communication interface system
WO2005067340A1 (en) * 2004-01-09 2005-07-21 Asahi Kasei Kabushiki Kaisha Body conducted sound microphone, signal processing device, communication interface system, and sound collecting method
US7778430B2 (en) 2004-01-09 2010-08-17 National University Corporation NARA Institute of Science and Technology Flesh conducted sound microphone, signal processing device, communication interface system and sound sampling method
JP4702795B2 (en) * 2004-01-09 2011-06-15 国立大学法人 奈良先端科学技術大学院大学 Body conduction sound microphone, signal processing device, communication interface system, sound collection method
US7613611B2 (en) 2004-11-04 2009-11-03 Electronics And Telecommunications Research Institute Method and apparatus for vocal-cord signal recognition
JP2019035818A (en) * 2017-08-10 2019-03-07 株式会社テクノリンク Vocalization utterance learning device and microphone

Also Published As

Publication number Publication date
JP3647499B2 (en) 2005-05-11

Similar Documents

Publication Publication Date Title
CN1679371B (en) Microphone and communication interface system
US10051365B2 (en) Method and device for voice operated control
US10382853B2 (en) Method and device for voice operated control
US8654998B2 (en) Hearing aid apparatus
US11115762B2 (en) Hearing device for own voice detection and method of operating a hearing device
US11948561B2 (en) Automatic speech recognition imposter rejection on a headphone with an accelerometer
JP2012510088A (en) Speech estimation interface and communication system
KR20170071585A (en) Systems, methods, and devices for intelligent speech recognition and processing
JP2005049876A5 (en)
US20230290333A1 (en) Hearing apparatus with bone conduction sensor
JP2002125298A (en) Microphone device and earphone microphone device
US20220122605A1 (en) Method and device for voice operated control
JP2002358089A (en) Method and device for speech processing
CN108200492A (en) Voice control optimization method, device and the earphone and wearable device that integrate In-Ear microphone
JP2009178783A (en) Communication robot and its control method
JP3647499B2 (en) Voice pickup system
JP2000152394A (en) Hearing aid for moderately hard of hearing, transmission system having provision for the moderately hard of hearing, recording and reproducing device for the moderately hard of hearing and reproducing device having provision for the moderately hard of hearing
JP3308567B2 (en) Digital voice processing apparatus and digital voice processing method
CN109729448A (en) Neck wears the voice control optimization method and device of formula interactive voice earphone
JP2004279768A (en) Device and method for estimating air-conducted sound
JP2004013084A (en) Sound volume controller
KR100778143B1 (en) A Headphone with neck microphone using bone conduction vibration
JPH1020885A (en) Speech synthesis device
Beskow et al. Hearing at home-communication support in home environments for hearing impaired persons.
JP2002062886A (en) Voice receiver with sensitivity adjusting function

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050209

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090218

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090218

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100218

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100218

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110218

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120218

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120218

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130218

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130218

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 9

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees