JPS5912500A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS5912500A
JPS5912500A JP57121858A JP12185882A JPS5912500A JP S5912500 A JPS5912500 A JP S5912500A JP 57121858 A JP57121858 A JP 57121858A JP 12185882 A JP12185882 A JP 12185882A JP S5912500 A JPS5912500 A JP S5912500A
Authority
JP
Japan
Prior art keywords
microphone
sound source
voice recognition
voice
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57121858A
Other languages
English (en)
Inventor
本宮 恵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP57121858A priority Critical patent/JPS5912500A/ja
Publication of JPS5912500A publication Critical patent/JPS5912500A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は特定の話者のみを追尾して集音、認識する音声
認識装置に関するものである。
従来の音声認識装置は、音声を集音するマイクロホンと
音声認識部は独立無関係てあった。そのため、超指向性
マイクロホンを用いた時は、特に遠方の音を集音する場
合、必しも音声が最適な状態で集音されていなかった。
本発明は、上記欠点を改善するため、 (1)例えば、指向性を可変あるいはマイクを回転。
可動して、音源方向に追尾できるようにした超指向性マ
イクロホン、 (2)音源の内容を分析して、ある特定の音声にのみ追
尾する装置部、 す々わち、下記の音声認識部によって、音声のピンチ周
波数を検出し、ある範囲内の音声のみを追尾する、例え
ば男性上女性が話している場合、男性を注目すれば男性
のみを追尾するようにした音源追尾部、 (3)音声認識部 以上のようにマイクロホン、音源追尾部及び音声認識部
を一体的にシステム化した音声1忍識装置を提供するも
のである。
以下図面に従って本発明の一実施例を説明する。
図面はシステム構成例を示すグロック図である。
■は超指向性マイクロホン、2は受波方向可変装置、3
は最大値検出回路、4はSN比弁別回路、5は音声認識
回路、6は認識応答回路である。
超指向性マイクロホン1は、マイクロホンを多数直線配
列した直線配列型、マイクロホンの振りジノ面をホーン
により等測的に広げたホーン型、無指向性マイクをパラ
ボラの焦点に設置したバラボラ型などかある。これらの
指向性はいずれも周波数に依存しており、周波数が高い
程指向角が挾くなっている。従って、マイクロホンを音
源方向に正確に合わせるへめには高い周波数の方が都合
がよい0 受波方向可変装置2は音源方向にマイクロホン■の指向
性を合わせるような動作を行なう。これハ、複数のマイ
クロホンの合成により指向性を合わせる方法と、マイク
ロホンを機械的に動かす場合がある。受波方向可変装置
2tri、マイクロホン1の型とのかねあいで、いずれ
をとることも可能である。
最大値検出回路3は、受波方向可変装置2に対して、音
源の受波信号中で現在注目している、音声の特徴で特に
話者に関するものを選び出し、その特徴レベル和か最大
値になるように設定する。
特徴としては、例えば音声のピッチ成分、第4ホルマン
ト情報が適当である。−!た、音源が移動する場合は、
最大値より低いある値以下となりその一定時間経過が検
出されると、自動的に音源の最SN弁別回路4は、今注
目している音声の特徴量のベクトル和とノイズのベクト
ル和の比較により、注目している音声の有無を判定する
ものである。
音声認識回路5は、音声分析てピッチ分析、ポルマント
分析等を行なっているので、それらを有機的に利用して
音声認識さ話者認識の特徴量を同時例抽出する。その中
で、音源追尾には、上記のSN弁別回路4、最大値検出
回IJPJ3を介し、話者認識の方の情報が主に使用さ
れる。
ここでいう話4認識は、一般に行なわれているような本
格的なものでなくてもよい、音声と騒音の区別、男性1
女性、子供の区別でも充分に実用になり得る。
以上のように本発明は、一体重にシステム化した音声認
識装置により、簡単な構成で、マイクロホンの指向性を
音源方向に追尾させ、音声認識に必要な情報を雑音の中
から、最適な状態で選び出すとケ勾75fできる。
【図面の簡単な説明】
図面は本発明の一実施例を示すシステム構成図である。 1・・超指向性マイクロホン、2・・・受波方向可変装
置、3・・・最大値検出回路、4・・・SN弁別回路、
5・・・音声認識回路。 代理人 弁理士 福 士 愛 彦 (他2名)1   
2       5    63     4

Claims (1)

    【特許請求の範囲】
  1. ■、超指向性マイクロホン、音声認識部、及び該音声認
    識部の音源の内容の分析により、ある特定の音声に前記
    超指向性マイクロホンを追尾させる装置部とより々る音
    声認識装置。
JP57121858A 1982-07-12 1982-07-12 音声認識装置 Pending JPS5912500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57121858A JPS5912500A (ja) 1982-07-12 1982-07-12 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57121858A JPS5912500A (ja) 1982-07-12 1982-07-12 音声認識装置

Publications (1)

Publication Number Publication Date
JPS5912500A true JPS5912500A (ja) 1984-01-23

Family

ID=14821671

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57121858A Pending JPS5912500A (ja) 1982-07-12 1982-07-12 音声認識装置

Country Status (1)

Country Link
JP (1) JPS5912500A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01108599U (ja) * 1988-01-11 1989-07-21
JPH02503112A (ja) * 1988-02-01 1990-09-27 キャタピラー インコーポレーテッド 表面形状情報を決定する方法及び装置
JP2007241304A (ja) * 2007-04-20 2007-09-20 Sony Corp 音声認識装置および音声認識方法、並びにプログラムおよび記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01108599U (ja) * 1988-01-11 1989-07-21
JPH02503112A (ja) * 1988-02-01 1990-09-27 キャタピラー インコーポレーテッド 表面形状情報を決定する方法及び装置
JP2007241304A (ja) * 2007-04-20 2007-09-20 Sony Corp 音声認識装置および音声認識方法、並びにプログラムおよび記録媒体

Similar Documents

Publication Publication Date Title
Zhou et al. Hidden voice commands: Attacks and defenses on the VCS of autonomous driving cars
CN104246877B (zh) 用于音频信号处理的系统和方法
Weinstein et al. A 1020-node modular microphone array and beamformer for intelligent computing spaces
CN103180900A (zh) 用于话音活动检测的系统、方法和设备
CN111445920A (zh) 一种多声源的语音信号实时分离方法、装置和拾音器
US6959095B2 (en) Method and apparatus for providing multiple output channels in a microphone
CN110992972B (zh) 基于多麦克风耳机的声源降噪方法、电子设备、计算机可读存储介质
CN108449691A (zh) 一种拾音装置及声源距离确定方法
JPH11249693A (ja) 収音装置
JPS5912500A (ja) 音声認識装置
JP2002091756A (ja) 多数の音響情報源を同時に提供するためのシステム及び方法
CN112908336A (zh) 一种用于语音处理装置的角色分离方法及其语音处理装置
Knorr Reliable voiced/unvoiced decision
US11749296B2 (en) Voice capturing method and voice capturing system
JPH10243494A (ja) 顔方向認識方法及び装置
JP2992324B2 (ja) 音声区間検出方法
Bechler et al. Three different reliability criteria for time delay estimates
KR20000074695A (ko) 음향 또는 음성의 패턴 인식을 이용한 완구의 동작 제어 방법
Moon et al. Multi-channel audio source separation using azimuth-frequency analysis and convolutional neural network
Parry Microphone arrays for desktop computers and speech recognition
CN210039630U (zh) 一种麦克风阵列语音增强装置
Mohammadamini et al. RoboVox: A Single/Multi-channel Far-field Speaker Recognition Benchmark for a Mobile Robot
JPH01158499A (ja) 定常雑音除去方式
JPS598000A (ja) 音声集音装置
Morgan et al. Automated evaluation of acoustic talker direction finder algorithms in the varechoic chamber