KR910014869A - 음성신호 처리장치 - Google Patents

음성신호 처리장치 Download PDF

Info

Publication number
KR910014869A
KR910014869A KR1019910000760A KR910000760A KR910014869A KR 910014869 A KR910014869 A KR 910014869A KR 1019910000760 A KR1019910000760 A KR 1019910000760A KR 910000760 A KR910000760 A KR 910000760A KR 910014869 A KR910014869 A KR 910014869A
Authority
KR
South Korea
Prior art keywords
output
peak
signal
section
analysis section
Prior art date
Application number
KR1019910000760A
Other languages
English (en)
Other versions
KR960005739B1 (ko
Inventor
죠지 카네
아끼라 노하라
Original Assignee
다니이 아끼오
마쯔시다덴기산교 가부시기가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2008592A external-priority patent/JP2712691B2/ja
Priority claimed from JP2008595A external-priority patent/JP2712692B2/ja
Priority claimed from JP2017348A external-priority patent/JPH03220600A/ja
Priority claimed from JP2026507A external-priority patent/JP2712704B2/ja
Priority claimed from JP2026506A external-priority patent/JP2712703B2/ja
Priority claimed from JP2034297A external-priority patent/JP2712708B2/ja
Application filed by 다니이 아끼오, 마쯔시다덴기산교 가부시기가이샤 filed Critical 다니이 아끼오
Publication of KR910014869A publication Critical patent/KR910014869A/ko
Priority to KR1019940023426A priority Critical patent/KR950001068B1/ko
Priority to KR1019940023427A priority patent/KR950001069B1/ko
Application granted granted Critical
Publication of KR960005739B1 publication Critical patent/KR960005739B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Selective Calling Equipment (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

내용 없음

Description

음성신호 처리장치
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제2도는 제1도의 발명의 제1실시예에 있어서의 음성신호처리장치의 블럭도, 제4도는 캡스트럼특성도, 제7도는 제2의 발명의 실시예에 있어서 음성신호처리장치의 블록도.

Claims (11)

  1. 음성신호의 켑스트럼을 얻는 켑스트럼산출수단과, 상기 켑스트럼산출수단의 켑스트럼출력을 평균화하는 평균치산출수단과, 상기 평균치산출수단의 켑스트럼평균치출력을 토대로 음성검출임계레벨을 설정하는 임계설정수단과, 상기 평균치산출수단의 켑스트럼평균치출력과 상기 켑스트럼산출수단의 켑스트럼출력 및 임계설정수단의 임계출력신호가 공급되어 음성을 판별하는 음성판별수단을 구바한 것을 특징으로하는 음성신호처리장치.
  2. 제1항에 있어서. 음성판별수단에 있어서, 켑스트럼평균출력을 넘는 켑스트럼출력과 임계출력신호를 비교하는 것을 특징으로하는 음성신호처리장치.
  3. 제1항에 있어서, 음성판별수단으로서 켑스트럼평균치를 넘는 켑스트럼치를 가산하는 켑스트럼가산부와, 상기 켑스트럼가산부의 켑스트럼가산출력과 임계출력신호를 비교하는 비교기를 구비한 것을 특징으로하는 음성신호처리장치.
  4. 제1항에 있어서, 음성판별수단으로서 켑스트럼을 기억시키는 n조의 제1메모리군과 켑스터럼평균치를 기억시키는 n개의 제2메모리군을 설치하고, 상기 제1메모리에 대응하는 조의 제2메모리의 출력을 넘는 제1메모리의 출력을 가산하는 켑스트럼가나부와, 상기 켑스트럼가산부의 켑스트럼가산출력과 임계설정수단의 임계출력신호를 비교하는 비교기를 구비한 것을 특징으로하는 음성신호처리장치.
  5. 음성입력의 켑스트럼을 산출하는 켑스터럼산출수단과, 상기 켑스트럼산출수단의 켑스트럼출력의 피이크를 검출하는 피이크검출수단과, 상기 피이크검출수단의 피이크검출출력 및 동작모우드설정신호에 따라 분석구간을 설정하는 분석구간설정수단과, 상기 피이크검출수단의 피이크검출출력이 공급되는 음성판별수단을 구비하고, 상기 피이크검출수단의 피이크 검출구간은 상기 분석구간설정수단의 설정출력에 의해 제어되는 것을 특징으로하는 음성신호처리장치.
  6. 음성입력의 켑스트럼입력을 산출하는 켑스트럼산출수단과, 상기 켑스트럼산출수단의 켑스트럼출력의 피이크를 검출하는 피이크검축수단과, 상기 피이크 검출수단의 피이크검출출력에 따라 분석하기 위하여 퀘프렌시구간을 설정하는 구간데이터설정수단과, 상기 구간데이터설정수단의 설정출력이 제1스위치를 개재해서 공급되는 메모리군과, 미리 구간데이터를 설정해두는 메모리군과, 상기 복수의 메모리군의 메모리출력을 선정하는 제2스위치와, 상기 제1과 제2스위치를 제어하는 제어수단과, 상기 피이크검출수단의 피이크검출구간은 상기 제2스위치에 의해서 선정되는 메모리군의 출력에 의해 제어되는 것을 특징으로 하는 음성신호처리장치.
  7. 음성을 입력해서 켑스트럼을 산출하는 켑스트럼산출부와, 상기 켑스트럼으로부터 피이크를 지정된 분석구간에서 검출하는 피이크검출부와, 상기 피이크검출출력으로부터 음성검출출력을 얻은 음성검출부와, 상기 피이크검출출력으로부터 최적분석구간을 산출하는 동시에 상기 피이크검출부에 분석구간을 지정하는 분석구간설정부를 구비하고, 분석구, 간메모리와, 상기 최적분석구간을 기본으로 하는 분류처리한 분석구간을 상기 메모리에 기억하는 분석구간분류부를 형성하고, 상기 분석구간 설정부가 피이크검출부에 지정하는 분석구간은 모우드설정 입력에 대응해서 상기 분석구간분류부가 지정하는 것으로 하고, 상기 분석구간분류부는 상기 모우드설정입력에 대응해서 상기 최적분석구간을 상기 분석구간 메모리와 조회해서 상기 분석구간설정부에 지시하는 것을 특징으로하는 음성신호처리장치.
  8. 신호입력의 S/N비를 산출하는 S/N산출부의 출력과 신호입력의 유무를 검출하는 신호검출부의 출력과의 논리곱으로 상기 신호입력을 출력단부에 단속하는 수단을 구비하고, 신호입력의 파우어를 산출하는 파우어 산출부와, 신호입력의 켑스트럼을 산출하는 켑스트럼산출부와, 상기 켑스트럼의 피이크를 검출하는 피이크검출부를 형성하고, 상기 S/N산출부는 상기 파우어산출부의 출력과 상기 피이크검출부의 출력으로부터 S/N비를 산출하는 것으로 하고, 상기 신호검출부는 상기 피이크검출부의 출력으로부터 신호입력의 유무를 검출하는 것으로 하는 것을 특징으로하는 음성신호처리장치.
  9. 신호입력의 파우어를 기판입력신호의 레벨과 비교하는 비교기의 출력과 신호입력의 S/N비를 산출하는 S/N산출부의 출력과 신호입력의 유무를 검출하는 신호검출부의 출력과의 논리곱으로 상기 신호입력을 출력단부에 단속하는 수단을 구비하고, 신호입력의 파우어를 산출하는 파우어산출부와, 신호입력의 켑스트럼을 산출하는 켑스트럼산출부와, 상기 켑스트럼의 피이크를 검출해서 출력하는 피이크검출부를 형성하고, 상기 비교기는 상기 파우어산출부의 출력을 기준신호입력에 레벨과 비교하는 것으로 하고, 상기 S/N산출부는 상기 파우어산출부의 출력과 상기 피이크검출부의 출력으로부터 S/N비를 산출하는 것으로 하고, 상기 신호검출부는 상기 피이크검출부의 출력으로부터 신호입력의 유무를 검출하는 것으로 하는 것을 특징으로 하는 음성신호처리장치.
  10. 음성입력을 분석해서 분석신호를 출력하는 음성분석부와, 그 분석신호를 템플레이트와 비교해서 인식출력을 출력하는 매칭부를 구비한 음성 인식수단에 있어서, 상기 매칭부에 제1제어신호입력수단과 제2제어신호 입력수단을 형성하고, 음성입력으로부터 산출해서 켑스트럼을 출력하는 켑스트럼산출부와, 상기 켑스트럼의 피이크를 검출해서 피이크신호를 출력하는 피이크검출부와, 상기 피이크신호로부터 음성의 유무를 판정해서 제1제어신호를 출력하는 음성검출부와, 모우드설정입력 및 상기 피이크 신호에 대응해서 제2제어신호를 출력하는 제어부와, 상기 피이크신호를 기억하는 피이크치메모리를 형성하고, 상기 제어부는 모우드설정입력이 "설정"에 대응해서 상기 피이크신호를 상기 메모리에 기록하고, 또 상기 제어부는 모우드설정입력이 "인식"에 대응해서 상기 메모리의 피이크신호와 음성입력의 켑스트럼피이크 신호를 비교해서, 각각의 퀘프렌시스의 차에 대응해서 상기 제2제어신호를 출력하고, 상기 매칭부가 제1제어신호 및 제2제어신호의 입력에 의해 인식출력을 출력하도록 한 것을 특징으로하는 음성신호처리장치.
  11. 음성신호를 입력한 음성분석부의 분석출력을 사용해서 인신출력을 얻는 매칭부에 그 인식동작의 실행을 제어하는 제1제어신호의 입력수단 및 제2제어신호의 입력수단을 구비하고, 음성신호의 켑스트럼을 산출하는 켑스트럼산출부와, 그 켑스트럼의 피이크를 지정된 구간에서 검출해서 출력하는 피이크검출부와, 음성검출부를 형성하고, 상기 음성검출부는 상기 피이크검출부의 출력으로부터 음성신호의 유무에 대응하는 상기 제1제어신호를 출력하는 것으로 하고, 분석구간메모리와, 상기 분석구간을 상기 피이크검출부에 지정해서 출력하는 동시에 상기 켑스트럼피이크에 대응하는 최적분석구간을 산출해서 출력하는 분석구간처리부와, 상기 최적분석구간을 기본으로 하는 분류처리한 분석구간을 상기 분석기간메모리에 기억하는 분석구간분류부를 구비하고, 상기 분석구간처리부가 피이크검출부에 지정하는 분석구간은 모우드설정입력의 모우드에 대응해서 상기 분석구간분류부가 지정하는 것으로 하고, 상기 분석구간분류는 상기 모우드설정입력에 대응해서 상기 최적구간을 상기 구간메모리의 분석구간데이터와 조회해서 음성신호의 인식대상에 대응하는 제2제어신호를 출력하는 동시에, 상기 분석구간메모리의 분석구간데이터의 분류처리와 상기 분석구간처리부에의 분석구간지정을 행하고, 상기 제1 및 제2제어신호에 의한 제한은 음성신호가 있고, 또한 음성신호가 임식대상일때만 인식을 실행하는 것을 특징으로하는 음성신호처리장치.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019910000760A 1990-01-18 1991-01-18 음성검출장치 KR960005739B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1019940023426A KR950001068B1 (ko) 1990-01-18 1994-09-15 음성신호처리장치
KR1019940023427A KR950001069B1 (ko) 1990-01-18 1994-09-15 음성신호처리장치

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
JP2008592A JP2712691B2 (ja) 1990-01-18 1990-01-18 信号処理装置
JP2-8592 1990-01-18
JP2008595A JP2712692B2 (ja) 1990-01-18 1990-01-18 信号制御装置
JP2-8595 1990-01-18
JP2017348A JPH03220600A (ja) 1990-01-26 1990-01-26 音声検出装置
JP2-17348 1990-01-26
JP2-26506 1990-02-06
JP2-26507 1990-02-06
JP2026507A JP2712704B2 (ja) 1990-02-06 1990-02-06 信号処理装置
JP2026506A JP2712703B2 (ja) 1990-02-06 1990-02-06 信号処理装置
JP2-34297 1990-02-14
JP2034297A JP2712708B2 (ja) 1990-02-14 1990-02-14 音声検出装置

Related Child Applications (2)

Application Number Title Priority Date Filing Date
KR1019940023427A Division KR950001069B1 (ko) 1990-01-18 1994-09-15 음성신호처리장치
KR1019940023426A Division KR950001068B1 (ko) 1990-01-18 1994-09-15 음성신호처리장치

Publications (2)

Publication Number Publication Date
KR910014869A true KR910014869A (ko) 1991-08-31
KR960005739B1 KR960005739B1 (ko) 1996-05-01

Family

ID=27548141

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019910000760A KR960005739B1 (ko) 1990-01-18 1991-01-18 음성검출장치

Country Status (9)

Country Link
US (1) US5195138A (ko)
EP (4) EP0614171B1 (ko)
KR (1) KR960005739B1 (ko)
AU (1) AU644124B2 (ko)
CA (1) CA2034333C (ko)
DE (4) DE69112855T2 (ko)
FI (4) FI115569B (ko)
HK (4) HK184795A (ko)
NO (4) NO306489B1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5414674A (en) * 1993-11-12 1995-05-09 Discovery Bay Company Resonant energy analysis method and apparatus for seismic data
US5502717A (en) * 1994-08-01 1996-03-26 Motorola Inc. Method and apparatus for estimating echo cancellation time
US6427134B1 (en) 1996-07-03 2002-07-30 British Telecommunications Public Limited Company Voice activity detector for calculating spectral irregularity measure on the basis of spectral difference measurements
US6314396B1 (en) 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
JP3878482B2 (ja) * 1999-11-24 2007-02-07 富士通株式会社 音声検出装置および音声検出方法
US6876965B2 (en) 2001-02-28 2005-04-05 Telefonaktiebolaget Lm Ericsson (Publ) Reduced complexity voice activity detector
US7426470B2 (en) * 2002-10-03 2008-09-16 Ntt Docomo, Inc. Energy-based nonuniform time-scale modification of audio signals
WO2006005337A1 (en) * 2004-06-11 2006-01-19 Nanonord A/S A method for analyzing fundamental frequencies and application of the method
US8264909B2 (en) * 2010-02-02 2012-09-11 The United States Of America As Represented By The Secretary Of The Navy System and method for depth determination of an impulse acoustic source by cepstral analysis
KR102057795B1 (ko) * 2013-03-15 2019-12-19 애플 인크. 콘텍스트-민감성 방해 처리
CN104967793B (zh) * 2015-07-28 2023-09-19 格科微电子(上海)有限公司 适用于cmos图像传感器的电源噪声抵消电路
CN111883183B (zh) * 2020-03-16 2023-09-12 珠海市杰理科技股份有限公司 语音信号筛选方法、装置、音频设备和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1116300A (en) * 1977-12-28 1982-01-12 Hiroaki Sakoe Speech recognition system
JPH0795239B2 (ja) * 1987-04-03 1995-10-11 アメリカン テレフォン アンド テレグラフ カムパニー 音声フレーム中の基本周波数の存在を検出する装置および方法

Also Published As

Publication number Publication date
NO308335B1 (no) 2000-08-28
EP0614170A1 (en) 1994-09-07
AU6868891A (en) 1991-07-25
NO910221D0 (no) 1991-01-18
EP0614169A1 (en) 1994-09-07
EP0614171A1 (en) 1994-09-07
EP0614170B1 (en) 2000-04-26
FI20030088A (fi) 2003-01-21
NO308336B1 (no) 2000-08-28
FI20030087A (fi) 2003-01-21
KR960005739B1 (ko) 1996-05-01
EP0614169B1 (en) 1998-09-30
DE69132148D1 (de) 2000-05-31
DE69132147D1 (de) 2000-05-31
NO992257D0 (no) 1999-05-10
HK1010008A1 (en) 1999-06-11
NO992257L (no) 1991-07-19
DE69130294T2 (de) 1999-05-06
US5195138A (en) 1993-03-16
NO910221L (no) 1991-07-19
NO992256D0 (no) 1999-05-10
DE69112855T2 (de) 1996-02-15
NO306489B1 (no) 1999-11-08
FI117953B (fi) 2007-04-30
EP0439073A1 (en) 1991-07-31
HK1010007A1 (en) 1999-06-11
AU644124B2 (en) 1993-12-02
EP0439073B1 (en) 1995-09-13
HK184795A (en) 1995-12-15
NO992258D0 (no) 1999-05-10
FI20030089A (fi) 2003-01-21
FI116595B (fi) 2005-12-30
NO308337B1 (no) 2000-08-28
FI910293A0 (fi) 1991-01-18
DE69130294D1 (de) 1998-11-05
DE69132148T2 (de) 2000-09-21
CA2034333A1 (en) 1991-07-19
DE69112855D1 (de) 1995-10-19
DE69132147T2 (de) 2000-09-21
FI910293A (fi) 1991-07-19
FI116594B (fi) 2005-12-30
EP0614171B1 (en) 2000-04-26
NO992256L (no) 1991-07-19
HK1010006A1 (en) 1999-06-11
FI115569B (fi) 2005-05-31
CA2034333C (en) 1996-04-16
NO992258L (no) 1991-07-19

Similar Documents

Publication Publication Date Title
KR910014869A (ko) 음성신호 처리장치
Carletti et al. Audio surveillance using a bag of aural words classifier
JPH0222398B2 (ko)
KR910020641A (ko) 잡음예측장치와 이것을 사용한 신호처리장치
JPWO2003015076A1 (ja) 鳴声の音声的特徴分析に基づく犬の感情判別装置及びその方法
DE60234571D1 (de) Rechnergestützte bildanalyse
KR890002816A (ko) 저렴한 음성 인식 시스템 및 방법
EP1429314A1 (en) Correction of energy as input feature for speech processing
KR20170073113A (ko) 음성의 톤, 템포 정보를 이용한 감정인식 방법 및 그 장치
US20210312912A1 (en) Audio processing apparatus and method for audio scene classification
CN107644651B (zh) 用于语音识别的电路和方法
KR100273395B1 (ko) 음성인식시스템의음성구간검출방법
JPS5491009A (en) Audio recognition unit
KR102237286B1 (ko) 음성 구간 검출장치 및 그 방법
JP3474949B2 (ja) 音声認識装置
US4891602A (en) Visual/voice input recognition sensor
KR950001068B1 (ko) 음성신호처리장치
KR20190048208A (ko) 객체 오인식 제거기 생성 장치 및 방법
JP2712704B2 (ja) 信号処理装置
JP2792939B2 (ja) 音声切り出し方法
JP3299574B2 (ja) 認識装置
KR100262564B1 (ko) 차량용 음성 인식 장치
KR950001069B1 (ko) 음성신호처리장치
Mehta et al. Orca Call Detection using CNN and Spectrograms
JPH0531087A (ja) Vpc波形検出方式

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J2X1 Appeal (before the patent court)

Free format text: APPEAL AGAINST DECISION TO DECLINE REFUSAL

G160 Decision to publish patent application
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070424

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee