FI115569B - Ljudsignalsbehandlingsanordning - Google Patents

Ljudsignalsbehandlingsanordning Download PDF

Info

Publication number
FI115569B
FI115569B FI910293A FI910293A FI115569B FI 115569 B FI115569 B FI 115569B FI 910293 A FI910293 A FI 910293A FI 910293 A FI910293 A FI 910293A FI 115569 B FI115569 B FI 115569B
Authority
FI
Finland
Prior art keywords
signal
peak
section
analysis period
analysis
Prior art date
Application number
FI910293A
Other languages
English (en)
Finnish (fi)
Other versions
FI910293A (fi
FI910293A0 (fi
Inventor
Joji Kane
Akira Nohara
Original Assignee
Matsushita Electric Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2008595A external-priority patent/JP2712692B2/ja
Priority claimed from JP2008592A external-priority patent/JP2712691B2/ja
Priority claimed from JP2017348A external-priority patent/JPH03220600A/ja
Priority claimed from JP2026506A external-priority patent/JP2712703B2/ja
Priority claimed from JP2026507A external-priority patent/JP2712704B2/ja
Priority claimed from JP2034297A external-priority patent/JP2712708B2/ja
Application filed by Matsushita Electric Ind Co Ltd filed Critical Matsushita Electric Ind Co Ltd
Publication of FI910293A0 publication Critical patent/FI910293A0/fi
Publication of FI910293A publication Critical patent/FI910293A/fi
Application granted granted Critical
Publication of FI115569B publication Critical patent/FI115569B/sv

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Selective Calling Equipment (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (4)

1. Talsignaldetekteringsanordning, kännetecknad avatt den omfattar 5 ett kepstrumberäknande medel (1, 5, 11) för att bilda ett kepstrum av en ingängssignal, ett medelvärdesberäkningsmedel (2, 7, 13) för att bilda ett kep-strummedelvärde frän kepstrumutgängen frän det kepstrumberäknande medlet (1, 5,11) över ett givet kvefrensintervall, 10 ett tröskelinställande medel (4,10, 18) för att ställa in en taldetekte- ringströskelnivä pä basis av kepstrummedelvärdet frän medelvärdesberäk-ningsmedlet (2, 7,13), och ett ljuddetekteringsmedel (3, 8, 9,14 -17), tili vilket kepstrummedelvärdet frän medelvärdesberäkningsmedlet (2, 7, 13), kepstret frän det keps- 15 trumberäknande medlet (1, 5, 11) och den utgäende tröskelsignalen frän det tröskelinställande medlet (4, 10, 18) mätäs och som jämför ett utgäende kepstrum, som överstiger nämnda utgäende kepstrums medelvärde, med nämnda utgäende tröskelsignal för att detektera närvaron/fränvaron av en talsignal i ingängssignalen.
2. Signaldetekteringsanordning enligt patentkrav 1, k ä n n e - ]: tecknad avatt: nämnda ljuddetekteringsmedel (3, 8, 9, 14 - 17) uppvisar en keps-trumadderingssektion (8, 14) för att addera ett kepstrumvärde, som överstiger ·. kepstrummedelvärdet och en komparator (9, 15) för att jämföra den kepstrum- 25 adderade utgängen frän nämnda kepstrumadderingssektion (8, 14) med nämnda utgäende tröskelsignal.
’ * 3. Signaldetekteringsanordning enligt patentkrav 1, känne tecknad avatt nämnda ljuddetekteringsmedel (3, 8, 9,14 -17) uppvisar: t en n-ställig första minnesgrupp (16) för lagring av nämnda kep- 30 strum, • ett flertal n andra minnesgrupper (17) för lagring av nämnda kep- ·. strums medelvärde, ; ’ en kepstrumadderingssektion (14) för addering av det första min- “ : nets utgäng, som överstiger utgängen frän den andra minnesgruppen (17), .,.: 35 som motsvarar nämnda första minne (16), och 31 115569 en komparator (15) för jämförelse av den kepstrumadderade ut-gängen frän kepstrumadderingssektionen (14) med den utgäende tröskelsig-nalen frän nämnda tröskelinställande medel (18).
4. Talsignaldetekteringsförfarande, kännetecknat av att det 5 omfattar följande steg: beräkning av ett kepstrum för bildande av ett kepstrum av en in-kommande signal, beräkning av ett medelvärde över ett givet kvefrensintervall av keps-trumutgängen fran kepstrumberäkningssteget, 10 inställning av en tröskel för inställning av en taldetekteringströskel- nivä pä basis av kepstrummedelvärdesutgangen frän medelvärdesberäknings-steget, och detektering av närvaron/fränvaron av en talsignal i ingängssignalen genom jämförelse av en kepstrumutgang, som överstiger kepstrummedelvär-15 desutgangen frän medelvärdesberäkningssteget med tröskelutgängssignalen frän tröskelinställningssteget. » « ft
FI910293A 1990-01-18 1991-01-18 Ljudsignalsbehandlingsanordning FI115569B (sv)

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
JP859590 1990-01-18
JP2008595A JP2712692B2 (ja) 1990-01-18 1990-01-18 信号制御装置
JP859290 1990-01-18
JP2008592A JP2712691B2 (ja) 1990-01-18 1990-01-18 信号処理装置
JP1734890 1990-01-26
JP2017348A JPH03220600A (ja) 1990-01-26 1990-01-26 音声検出装置
JP2650690 1990-02-06
JP2026506A JP2712703B2 (ja) 1990-02-06 1990-02-06 信号処理装置
JP2650790 1990-02-06
JP2026507A JP2712704B2 (ja) 1990-02-06 1990-02-06 信号処理装置
JP3429790 1990-02-14
JP2034297A JP2712708B2 (ja) 1990-02-14 1990-02-14 音声検出装置

Publications (3)

Publication Number Publication Date
FI910293A0 FI910293A0 (fi) 1991-01-18
FI910293A FI910293A (fi) 1991-07-19
FI115569B true FI115569B (sv) 2005-05-31

Family

ID=27548141

Family Applications (4)

Application Number Title Priority Date Filing Date
FI910293A FI115569B (sv) 1990-01-18 1991-01-18 Ljudsignalsbehandlingsanordning
FI20030089A FI116595B (sv) 1990-01-18 2003-01-21 Ljudsignalsbehandlingsanordning
FI20030087A FI117953B (sv) 1990-01-18 2003-01-21 Ljudsignalsbehandlingsanordning
FI20030088A FI116594B (sv) 1990-01-18 2003-01-21 Ljudsignalsbehandlingsanordning

Family Applications After (3)

Application Number Title Priority Date Filing Date
FI20030089A FI116595B (sv) 1990-01-18 2003-01-21 Ljudsignalsbehandlingsanordning
FI20030087A FI117953B (sv) 1990-01-18 2003-01-21 Ljudsignalsbehandlingsanordning
FI20030088A FI116594B (sv) 1990-01-18 2003-01-21 Ljudsignalsbehandlingsanordning

Country Status (9)

Country Link
US (1) US5195138A (sv)
EP (4) EP0614171B1 (sv)
KR (1) KR960005739B1 (sv)
AU (1) AU644124B2 (sv)
CA (1) CA2034333C (sv)
DE (4) DE69130294T2 (sv)
FI (4) FI115569B (sv)
HK (4) HK184795A (sv)
NO (4) NO306489B1 (sv)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5414674A (en) * 1993-11-12 1995-05-09 Discovery Bay Company Resonant energy analysis method and apparatus for seismic data
US5502717A (en) * 1994-08-01 1996-03-26 Motorola Inc. Method and apparatus for estimating echo cancellation time
JP4307557B2 (ja) 1996-07-03 2009-08-05 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 音声活性度検出器
US6314396B1 (en) 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
JP3878482B2 (ja) * 1999-11-24 2007-02-07 富士通株式会社 音声検出装置および音声検出方法
US6876965B2 (en) 2001-02-28 2005-04-05 Telefonaktiebolaget Lm Ericsson (Publ) Reduced complexity voice activity detector
US7426470B2 (en) * 2002-10-03 2008-09-16 Ntt Docomo, Inc. Energy-based nonuniform time-scale modification of audio signals
WO2006005337A1 (en) * 2004-06-11 2006-01-19 Nanonord A/S A method for analyzing fundamental frequencies and application of the method
US8264909B2 (en) * 2010-02-02 2012-09-11 The United States Of America As Represented By The Secretary Of The Navy System and method for depth determination of an impulse acoustic source by cepstral analysis
WO2014168730A2 (en) * 2013-03-15 2014-10-16 Apple Inc. Context-sensitive handling of interruptions
CN104967793B (zh) * 2015-07-28 2023-09-19 格科微电子(上海)有限公司 适用于cmos图像传感器的电源噪声抵消电路
CN111883183B (zh) * 2020-03-16 2023-09-12 珠海市杰理科技股份有限公司 语音信号筛选方法、装置、音频设备和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1116300A (en) * 1977-12-28 1982-01-12 Hiroaki Sakoe Speech recognition system
WO1988007739A1 (en) * 1987-04-03 1988-10-06 American Telephone & Telegraph Company An adaptive threshold voiced detector

Also Published As

Publication number Publication date
NO992256L (no) 1991-07-19
EP0614169A1 (en) 1994-09-07
CA2034333A1 (en) 1991-07-19
DE69132148T2 (de) 2000-09-21
EP0614169B1 (en) 1998-09-30
US5195138A (en) 1993-03-16
DE69132148D1 (de) 2000-05-31
FI116595B (sv) 2005-12-30
DE69132147T2 (de) 2000-09-21
NO992256D0 (no) 1999-05-10
DE69112855T2 (de) 1996-02-15
FI20030088A (sv) 2003-01-21
HK1010008A1 (en) 1999-06-11
DE69130294T2 (de) 1999-05-06
NO306489B1 (no) 1999-11-08
HK1010006A1 (en) 1999-06-11
EP0614170A1 (en) 1994-09-07
NO992258D0 (no) 1999-05-10
EP0439073A1 (en) 1991-07-31
FI117953B (sv) 2007-04-30
AU644124B2 (en) 1993-12-02
HK184795A (en) 1995-12-15
KR960005739B1 (ko) 1996-05-01
NO992257D0 (no) 1999-05-10
EP0614171B1 (en) 2000-04-26
DE69130294D1 (de) 1998-11-05
NO992258L (no) 1991-07-19
FI116594B (sv) 2005-12-30
FI20030089A (sv) 2003-01-21
EP0614171A1 (en) 1994-09-07
HK1010007A1 (en) 1999-06-11
AU6868891A (en) 1991-07-25
NO910221L (no) 1991-07-19
EP0439073B1 (en) 1995-09-13
KR910014869A (ko) 1991-08-31
NO910221D0 (no) 1991-01-18
FI20030087A (sv) 2003-01-21
DE69112855D1 (de) 1995-10-19
NO308337B1 (no) 2000-08-28
FI910293A (fi) 1991-07-19
CA2034333C (en) 1996-04-16
NO308336B1 (no) 2000-08-28
NO992257L (no) 1991-07-19
DE69132147D1 (de) 2000-05-31
NO308335B1 (no) 2000-08-28
FI910293A0 (fi) 1991-01-18
EP0614170B1 (en) 2000-04-26

Similar Documents

Publication Publication Date Title
FI115569B (sv) Ljudsignalsbehandlingsanordning
US7957967B2 (en) Acoustic signal classification system
EP0891618B1 (en) Speech processing
US4677673A (en) Continuous speech recognition apparatus
EP1005019B1 (en) Segment-based similarity measurement method for speech recognition
CN111916109A (zh) 一种基于特征的音频分类方法、装置及计算设备
US7127392B1 (en) Device for and method of detecting voice activity
EP1513135A1 (en) Speech recognizing method and device thereof
US20030023434A1 (en) Linear discriminant based sound class similarities with unit value normalization
US6349148B1 (en) Signal verification device
CN109118242B (zh) 一种账户创建方法及其装置、电子设备
JPH01502779A (ja) 適応多変数推定装置
JP3008593B2 (ja) 音声認識装置
EP0310636B1 (en) Distance measurement control of a multiple detector system
JPH0683384A (ja) 音声中の複数話者の発話区間自動検出同定装置
JPH0619491A (ja) 音声認識装置
JP3031081B2 (ja) 音声認識装置
KR100349656B1 (ko) 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법
KR20010091093A (ko) 음성 인식 및 끝점 검출방법
AU2004200002B2 (en) Apparatus and methods for detecting emotions
US20040148168A1 (en) Method and device for automatically differentiating and/or detecting acoustic signals
CN117198282A (zh) 语音控制方法、装置、机器人及计算机可读存储介质
JPH03231299A (ja) 信号処理装置
CN111477223A (zh) 焊机控制方法、装置、终端设备及计算机可读存储介质
JPH01185600A (ja) 音声認識装置

Legal Events

Date Code Title Description
FG Patent granted

Ref document number: 115569

Country of ref document: FI