JPS5912500A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS5912500A JPS5912500A JP57121858A JP12185882A JPS5912500A JP S5912500 A JPS5912500 A JP S5912500A JP 57121858 A JP57121858 A JP 57121858A JP 12185882 A JP12185882 A JP 12185882A JP S5912500 A JPS5912500 A JP S5912500A
- Authority
- JP
- Japan
- Prior art keywords
- microphone
- sound source
- voice recognition
- voice
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は特定の話者のみを追尾して集音、認識する音声
認識装置に関するものである。
認識装置に関するものである。
従来の音声認識装置は、音声を集音するマイクロホンと
音声認識部は独立無関係てあった。そのため、超指向性
マイクロホンを用いた時は、特に遠方の音を集音する場
合、必しも音声が最適な状態で集音されていなかった。
音声認識部は独立無関係てあった。そのため、超指向性
マイクロホンを用いた時は、特に遠方の音を集音する場
合、必しも音声が最適な状態で集音されていなかった。
本発明は、上記欠点を改善するため、
(1)例えば、指向性を可変あるいはマイクを回転。
可動して、音源方向に追尾できるようにした超指向性マ
イクロホン、 (2)音源の内容を分析して、ある特定の音声にのみ追
尾する装置部、 す々わち、下記の音声認識部によって、音声のピンチ周
波数を検出し、ある範囲内の音声のみを追尾する、例え
ば男性上女性が話している場合、男性を注目すれば男性
のみを追尾するようにした音源追尾部、 (3)音声認識部 以上のようにマイクロホン、音源追尾部及び音声認識部
を一体的にシステム化した音声1忍識装置を提供するも
のである。
イクロホン、 (2)音源の内容を分析して、ある特定の音声にのみ追
尾する装置部、 す々わち、下記の音声認識部によって、音声のピンチ周
波数を検出し、ある範囲内の音声のみを追尾する、例え
ば男性上女性が話している場合、男性を注目すれば男性
のみを追尾するようにした音源追尾部、 (3)音声認識部 以上のようにマイクロホン、音源追尾部及び音声認識部
を一体的にシステム化した音声1忍識装置を提供するも
のである。
以下図面に従って本発明の一実施例を説明する。
図面はシステム構成例を示すグロック図である。
■は超指向性マイクロホン、2は受波方向可変装置、3
は最大値検出回路、4はSN比弁別回路、5は音声認識
回路、6は認識応答回路である。
は最大値検出回路、4はSN比弁別回路、5は音声認識
回路、6は認識応答回路である。
超指向性マイクロホン1は、マイクロホンを多数直線配
列した直線配列型、マイクロホンの振りジノ面をホーン
により等測的に広げたホーン型、無指向性マイクをパラ
ボラの焦点に設置したバラボラ型などかある。これらの
指向性はいずれも周波数に依存しており、周波数が高い
程指向角が挾くなっている。従って、マイクロホンを音
源方向に正確に合わせるへめには高い周波数の方が都合
がよい0 受波方向可変装置2は音源方向にマイクロホン■の指向
性を合わせるような動作を行なう。これハ、複数のマイ
クロホンの合成により指向性を合わせる方法と、マイク
ロホンを機械的に動かす場合がある。受波方向可変装置
2tri、マイクロホン1の型とのかねあいで、いずれ
をとることも可能である。
列した直線配列型、マイクロホンの振りジノ面をホーン
により等測的に広げたホーン型、無指向性マイクをパラ
ボラの焦点に設置したバラボラ型などかある。これらの
指向性はいずれも周波数に依存しており、周波数が高い
程指向角が挾くなっている。従って、マイクロホンを音
源方向に正確に合わせるへめには高い周波数の方が都合
がよい0 受波方向可変装置2は音源方向にマイクロホン■の指向
性を合わせるような動作を行なう。これハ、複数のマイ
クロホンの合成により指向性を合わせる方法と、マイク
ロホンを機械的に動かす場合がある。受波方向可変装置
2tri、マイクロホン1の型とのかねあいで、いずれ
をとることも可能である。
最大値検出回路3は、受波方向可変装置2に対して、音
源の受波信号中で現在注目している、音声の特徴で特に
話者に関するものを選び出し、その特徴レベル和か最大
値になるように設定する。
源の受波信号中で現在注目している、音声の特徴で特に
話者に関するものを選び出し、その特徴レベル和か最大
値になるように設定する。
特徴としては、例えば音声のピッチ成分、第4ホルマン
ト情報が適当である。−!た、音源が移動する場合は、
最大値より低いある値以下となりその一定時間経過が検
出されると、自動的に音源の最SN弁別回路4は、今注
目している音声の特徴量のベクトル和とノイズのベクト
ル和の比較により、注目している音声の有無を判定する
ものである。
ト情報が適当である。−!た、音源が移動する場合は、
最大値より低いある値以下となりその一定時間経過が検
出されると、自動的に音源の最SN弁別回路4は、今注
目している音声の特徴量のベクトル和とノイズのベクト
ル和の比較により、注目している音声の有無を判定する
ものである。
音声認識回路5は、音声分析てピッチ分析、ポルマント
分析等を行なっているので、それらを有機的に利用して
音声認識さ話者認識の特徴量を同時例抽出する。その中
で、音源追尾には、上記のSN弁別回路4、最大値検出
回IJPJ3を介し、話者認識の方の情報が主に使用さ
れる。
分析等を行なっているので、それらを有機的に利用して
音声認識さ話者認識の特徴量を同時例抽出する。その中
で、音源追尾には、上記のSN弁別回路4、最大値検出
回IJPJ3を介し、話者認識の方の情報が主に使用さ
れる。
ここでいう話4認識は、一般に行なわれているような本
格的なものでなくてもよい、音声と騒音の区別、男性1
女性、子供の区別でも充分に実用になり得る。
格的なものでなくてもよい、音声と騒音の区別、男性1
女性、子供の区別でも充分に実用になり得る。
以上のように本発明は、一体重にシステム化した音声認
識装置により、簡単な構成で、マイクロホンの指向性を
音源方向に追尾させ、音声認識に必要な情報を雑音の中
から、最適な状態で選び出すとケ勾75fできる。
識装置により、簡単な構成で、マイクロホンの指向性を
音源方向に追尾させ、音声認識に必要な情報を雑音の中
から、最適な状態で選び出すとケ勾75fできる。
図面は本発明の一実施例を示すシステム構成図である。
1・・超指向性マイクロホン、2・・・受波方向可変装
置、3・・・最大値検出回路、4・・・SN弁別回路、
5・・・音声認識回路。 代理人 弁理士 福 士 愛 彦 (他2名)1
2 5 63 4
置、3・・・最大値検出回路、4・・・SN弁別回路、
5・・・音声認識回路。 代理人 弁理士 福 士 愛 彦 (他2名)1
2 5 63 4
Claims (1)
- ■、超指向性マイクロホン、音声認識部、及び該音声認
識部の音源の内容の分析により、ある特定の音声に前記
超指向性マイクロホンを追尾させる装置部とより々る音
声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57121858A JPS5912500A (ja) | 1982-07-12 | 1982-07-12 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57121858A JPS5912500A (ja) | 1982-07-12 | 1982-07-12 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS5912500A true JPS5912500A (ja) | 1984-01-23 |
Family
ID=14821671
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57121858A Pending JPS5912500A (ja) | 1982-07-12 | 1982-07-12 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5912500A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01108599U (ja) * | 1988-01-11 | 1989-07-21 | ||
JPH02503112A (ja) * | 1988-02-01 | 1990-09-27 | キャタピラー インコーポレーテッド | 表面形状情報を決定する方法及び装置 |
JP2007241304A (ja) * | 2007-04-20 | 2007-09-20 | Sony Corp | 音声認識装置および音声認識方法、並びにプログラムおよび記録媒体 |
-
1982
- 1982-07-12 JP JP57121858A patent/JPS5912500A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01108599U (ja) * | 1988-01-11 | 1989-07-21 | ||
JPH02503112A (ja) * | 1988-02-01 | 1990-09-27 | キャタピラー インコーポレーテッド | 表面形状情報を決定する方法及び装置 |
JP2007241304A (ja) * | 2007-04-20 | 2007-09-20 | Sony Corp | 音声認識装置および音声認識方法、並びにプログラムおよび記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhou et al. | Hidden voice commands: Attacks and defenses on the VCS of autonomous driving cars | |
CN104246877B (zh) | 用于音频信号处理的系统和方法 | |
Weinstein et al. | A 1020-node modular microphone array and beamformer for intelligent computing spaces | |
CN103180900A (zh) | 用于话音活动检测的系统、方法和设备 | |
CN111445920A (zh) | 一种多声源的语音信号实时分离方法、装置和拾音器 | |
US6959095B2 (en) | Method and apparatus for providing multiple output channels in a microphone | |
CN110992972B (zh) | 基于多麦克风耳机的声源降噪方法、电子设备、计算机可读存储介质 | |
CN108449691A (zh) | 一种拾音装置及声源距离确定方法 | |
JPH11249693A (ja) | 収音装置 | |
JPS5912500A (ja) | 音声認識装置 | |
JP2002091756A (ja) | 多数の音響情報源を同時に提供するためのシステム及び方法 | |
CN112908336A (zh) | 一种用于语音处理装置的角色分离方法及其语音处理装置 | |
Knorr | Reliable voiced/unvoiced decision | |
US11749296B2 (en) | Voice capturing method and voice capturing system | |
JPH10243494A (ja) | 顔方向認識方法及び装置 | |
JP2992324B2 (ja) | 音声区間検出方法 | |
Bechler et al. | Three different reliability criteria for time delay estimates | |
KR20000074695A (ko) | 음향 또는 음성의 패턴 인식을 이용한 완구의 동작 제어 방법 | |
Moon et al. | Multi-channel audio source separation using azimuth-frequency analysis and convolutional neural network | |
Parry | Microphone arrays for desktop computers and speech recognition | |
CN210039630U (zh) | 一种麦克风阵列语音增强装置 | |
Mohammadamini et al. | RoboVox: A Single/Multi-channel Far-field Speaker Recognition Benchmark for a Mobile Robot | |
JPH01158499A (ja) | 定常雑音除去方式 | |
JPS598000A (ja) | 音声集音装置 | |
Morgan et al. | Automated evaluation of acoustic talker direction finder algorithms in the varechoic chamber |