KR940024660A - 음성인식장치 - Google Patents

음성인식장치 Download PDF

Info

Publication number
KR940024660A
KR940024660A KR1019940007784A KR19940007784A KR940024660A KR 940024660 A KR940024660 A KR 940024660A KR 1019940007784 A KR1019940007784 A KR 1019940007784A KR 19940007784 A KR19940007784 A KR 19940007784A KR 940024660 A KR940024660 A KR 940024660A
Authority
KR
South Korea
Prior art keywords
duration
recognition
recognition unit
speech
factor
Prior art date
Application number
KR1019940007784A
Other languages
English (en)
Other versions
KR0134158B1 (ko
Inventor
유미 다키자와
Original Assignee
모리시타 요이찌
마쯔시다덴기산교 가부시기가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP5087127A external-priority patent/JPH06301400A/ja
Priority claimed from JP5217286A external-priority patent/JPH0772899A/ja
Application filed by 모리시타 요이찌, 마쯔시다덴기산교 가부시기가이샤 filed Critical 모리시타 요이찌
Publication of KR940024660A publication Critical patent/KR940024660A/ko
Application granted granted Critical
Publication of KR0134158B1 publication Critical patent/KR0134158B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1807Speech classification or search using natural language modelling using prosody or stress
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0638Interactive procedures

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Image Analysis (AREA)

Abstract

표준음성학습시에, 지속시간학습회로에 의해서 각각의 인식단위의 지속시간사이의 관계를 얻고, 음성인식시에, 우선 음성구간검출회로에 의해 입력음성의 시작과 종단을 검출하고, 다음에 상호관계의 입력음성구간 길이를 사용하여 입력음성에서 인식단위의 지속시간을 예측한다. 다음에, 정합수단에 의해서, 인식단위가 에측값부근의 지속시간을 가지도록, 산출된 예측값을 사용하여 표준음성과 입력음성을 정합한다.

Description

음성인식장치
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제 1도는 본 발명의 실시예의 의한 음성인식장치를 도시한 블록도, 제 2도는 본 발명의 실시예에 의한 지속시간학습회로를 도시한 블록도.

Claims (8)

  1. 음성을 인식할때에 입력음성보다 짧은 인식단위로 입력음성으로 인식하고, 이 인식단위의 각각의 인식 결과를 연속적으로 연결함으로써 얻은 최종인식결과를 출력하는 음성인식장치에 있어서, 입력음성의 시작과 종단을 검출함에 의해서 음성구간을 검출하는 음성구간검출수단과, 인식단위의 지속시간에 영햐을 주는 요인을 사용함에 의해 인식단위의 지속시간사이의 관계를 산출하는 지속시간학습수단과, 검출된 음성주기와 인식단위의 지속시간의 산출관계를 사용함에 의해, 입력음성에 대한 각각의 인식단위의 지속시간을 예측하는 지속시간예측수단과, 예측된 지속시간을 사용하여 인식결과를 정합하거나 결정하는 정합수단을 포함한것을 특징으로 하는 음성인식장치.
  2. 제 1항에 있어서,상기 지속시간학습수단은, 인식단위의 지속시간에 영향을 주는 각 요인마다 각 요인에 대한 동일범주에 속하는 인식단위의 평균지속시간을 얻음에 의해서 인식단위의 지속시간사이의 관계를 산출하는 것을 특징으로 하는 음성인식장치.
  3. 제 1항에 있어서,상기 지속시간학습수단은, 인식단위의 지속시간을 좌우하는 요인이 인식단위의 지속 시간에 영향을 주는 정도로 얻고 또한 각 요인에 대한 동일 범주에 속하는 인식단위의 평균지속시간을 얻음에 의해서 인식단위의 지속시간사이의 관계를 산출하는 것을 특징으로 하는 음성인식장치.
  4. 제 3항에 있어서, 상기 지속시간학습수단은, 각각의 요인에 대한 동일번주에 속하는 인식단위의 평균지속시간을 각각의 요인마다 구한 다음에 입력음성에 대한 음성구간길이 전체의 평균지속시간과 식(I)의 평균지속시간(f(j)(t))를 사용하여 각 인식단위의 평균지속시간사이의 비를 구하고 또한 각각의 요인마다 상기비와 함께 가증가산을 행함으로써, 음성구간의 전체길이를 1로 취하는 경우에 대해서 각각의 인식단위의 지속시간(식(1)의 S(n))을 산출하고, 지속시간예측수단은, 상기 S(n)와 음성구간의 전장(식(2)의 L)으로부터 입력음성에 대한 인식단위마다 지속시간의 예측값(식(2))을 산출하는 것을 특징으로 하는 음성인식장치.
    [식(1)]
    fj(n) : 요인(j)에 대한 n번째 음절로서 모든 음절의 평균지속시간.
    N : 1개의 음성구간에 포함된 인식단위의 총수.
    αj : 각 요인의 가중계수.
    S(n) : 음성구간전장을 1로한 경우 각 인식단위에 대한 지속시간예측값.
    [식(2)]
    (n)=L×S(n)
    (n) : n번째 인식단위에 대한 지속시간예측값.
    L : 전음성구간길이
  5. 제 3항에 있어서, 상기 지속시간학습수단은, 각각의 요인에 대한 동일범주에 속하는 인식단위의 평균지속시간을 구한 다음에, 이 평균지속시간(식(3)의 fj(i))을 사용하여, 입력음력에 대한 각각의 인식단위의 지속시간을 예측하고 또한 이와같이 예측한 값과 음성구간의 전체길이사이의 비를 구함으로써, 음성구간의 전장을 1로 취하는 경우에 대해서 각 인식단위의 지속시간(식(3)의 S(n))을 산출하고, 지속시간예측수단은, 지속시간 (S(n))을 산출하고, 지속시간예측수단은, 지속시간 (S(n))과 음성구간(식(4)의 L)의 전장으로부터 입력음성에 대해서 각각의 인식단위의 지속기간의 예측값(식(4))을 산출하는 것을 특징으로 하는 음성인식장치.
    [식(3)]
    S(n) : 전음성구간장을 1로한 경우 각 인식단위에 대한 지속시간예측값
    N : 1개의 음성구간에 포함된 인식단위의 총수
    fj(n) : 요인(j)에 대한 n번째 음절로서 모든 음절의 평균지속시간.
    αj : 각 요인에 대한 가중계수
    [식(4)]
    d(n)=L×S(n)
    d(n) : n번째 인식단위에 대한 지속시간예측값
    L : 전음성구간장
  6. 제 1항에 있어서, 상기 정합수단은, 각각의 음절에 대한 정합구간이 예측음절지속시간값 부근에 있도록, 인식단위에 대한 예측지속시간값을 사용하여 상기 정합이나 상기 인식결과결정을 행하는 것을 특징으로 하는 음성인식장치.
  7. 제 1항에 있어서, 인식단위에 대한 예측지속시간값을 사용하여 입력음성에서 각각의 인식단위에 대한 정합주기를 판정하는 정합구간결정수단을 부가하여 포함하고, 상기 정합수단은, 결정된 정합구간내에서 각각의 인식단위를 정합하도록, 상기 정합과 인식결과판정을 행하는 것을 특징으로 하는 음성인식장치.
  8. 제 1항에 있어서, 예측지속시간과 인식후보에 대한 정합결과사이의 차이를 산출하는 오차산출수단과, 상기 오차를 사용하여 확실성이 없는 인식후보를 제거하는 결과평가수단을 부가하여 포함한 것을 특징으로 하는 음성인식장치.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019940007784A 1993-04-14 1994-04-14 음성인식장치 KR0134158B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP93-87127 1993-04-14
JP5087127A JPH06301400A (ja) 1993-04-14 1993-04-14 音声認識装置
JP93-217286 1993-09-01
JP5217286A JPH0772899A (ja) 1993-09-01 1993-09-01 音声認識装置

Publications (2)

Publication Number Publication Date
KR940024660A true KR940024660A (ko) 1994-11-18
KR0134158B1 KR0134158B1 (ko) 1998-04-29

Family

ID=26428435

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940007784A KR0134158B1 (ko) 1993-04-14 1994-04-14 음성인식장치

Country Status (2)

Country Link
US (1) US5526466A (ko)
KR (1) KR0134158B1 (ko)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3004883B2 (ja) * 1994-10-18 2000-01-31 ケイディディ株式会社 終話検出方法及び装置並びに連続音声認識方法及び装置
JPH08248975A (ja) * 1995-03-09 1996-09-27 Nec Corp 標準パターン学習装置およびこの装置を使用した音声認識装置
JP3581752B2 (ja) * 1995-10-09 2004-10-27 株式会社リコー 音声認識装置及び音声認識方法
US9134398B2 (en) 1996-09-09 2015-09-15 Tracbeam Llc Wireless location using network centric location estimators
US7903029B2 (en) 1996-09-09 2011-03-08 Tracbeam Llc Wireless location routing applications and architecture therefor
US7714778B2 (en) 1997-08-20 2010-05-11 Tracbeam Llc Wireless location gateway and applications therefor
US6249252B1 (en) 1996-09-09 2001-06-19 Tracbeam Llc Wireless location using multiple location estimators
US6236365B1 (en) 1996-09-09 2001-05-22 Tracbeam, Llc Location of a mobile station using a plurality of commercial wireless infrastructures
WO1998010307A1 (en) 1996-09-09 1998-03-12 Dennis Jay Dupray Location of a mobile station
EP0856832A1 (fr) * 1997-02-03 1998-08-05 Koninklijke Philips Electronics N.V. Procédé de reconnaissance vocale de mots et dispositif dans lequel ledit procédé est mis en application
US8135413B2 (en) 1998-11-24 2012-03-13 Tracbeam Llc Platform and applications for wireless location and other complex services
KR100316776B1 (ko) * 1999-03-31 2001-12-12 윤종용 연속 숫자음 인식 장치 및 그 방법
US7117149B1 (en) * 1999-08-30 2006-10-03 Harman Becker Automotive Systems-Wavemakers, Inc. Sound source classification
EP1286735A1 (en) 1999-09-24 2003-03-05 Dennis Jay Dupray Geographically constrained network services
US10641861B2 (en) 2000-06-02 2020-05-05 Dennis J. Dupray Services and applications for a communications network
US10684350B2 (en) 2000-06-02 2020-06-16 Tracbeam Llc Services and applications for a communications network
US9875492B2 (en) 2001-05-22 2018-01-23 Dennis J. Dupray Real estate transaction system
US8082096B2 (en) 2001-05-22 2011-12-20 Tracbeam Llc Wireless location routing applications and architecture therefor
US8073689B2 (en) 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US7725315B2 (en) * 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US7949522B2 (en) * 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7895036B2 (en) * 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US7949520B2 (en) * 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
US7716046B2 (en) * 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US7610196B2 (en) * 2004-10-26 2009-10-27 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US8306821B2 (en) * 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
US8543390B2 (en) * 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
US8170879B2 (en) * 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US7680652B2 (en) 2004-10-26 2010-03-16 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US8284947B2 (en) * 2004-12-01 2012-10-09 Qnx Software Systems Limited Reverberation estimation and suppression system
US8027833B2 (en) 2005-05-09 2011-09-27 Qnx Software Systems Co. System for suppressing passing tire hiss
US8311819B2 (en) * 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
US8170875B2 (en) * 2005-06-15 2012-05-01 Qnx Software Systems Limited Speech end-pointer
US7844453B2 (en) 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
US8326620B2 (en) 2008-04-30 2012-12-04 Qnx Software Systems Limited Robust downlink speech and noise detector
US8335685B2 (en) * 2006-12-22 2012-12-18 Qnx Software Systems Limited Ambient noise compensation system robust to high excitation noise
US20080231557A1 (en) * 2007-03-20 2008-09-25 Leadis Technology, Inc. Emission control in aged active matrix oled display using voltage ratio or current ratio
US8904400B2 (en) * 2007-09-11 2014-12-02 2236008 Ontario Inc. Processing system having a partitioning component for resource partitioning
US8850154B2 (en) 2007-09-11 2014-09-30 2236008 Ontario Inc. Processing system having memory partitioning
US8694310B2 (en) 2007-09-17 2014-04-08 Qnx Software Systems Limited Remote control server protocol system
US8209514B2 (en) * 2008-02-04 2012-06-26 Qnx Software Systems Limited Media processing system having resource partitioning
US20150279354A1 (en) * 2010-05-19 2015-10-01 Google Inc. Personalization and Latency Reduction for Voice-Activated Commands
US9538493B2 (en) 2010-08-23 2017-01-03 Finetrak, Llc Locating a mobile station and applications therefor
DE112013001772B4 (de) * 2013-11-29 2020-02-13 Mitsubishi Electric Corporation Spracherkennungssystem
KR102515914B1 (ko) * 2022-12-21 2023-03-30 주식회사 액션파워 Stt 모델을 활용하는 발음 전사 방법

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4092493A (en) * 1976-11-30 1978-05-30 Bell Telephone Laboratories, Incorporated Speech recognition system
CA1116300A (en) * 1977-12-28 1982-01-12 Hiroaki Sakoe Speech recognition system
US4454586A (en) * 1981-11-19 1984-06-12 At&T Bell Laboratories Method and apparatus for generating speech pattern templates
JPS59226400A (ja) * 1983-06-07 1984-12-19 松下電器産業株式会社 音声認識装置
US4991216A (en) * 1983-09-22 1991-02-05 Matsushita Electric Industrial Co., Ltd. Method for speech recognition
US4802223A (en) * 1983-11-03 1989-01-31 Texas Instruments Incorporated Low data rate speech encoding employing syllable pitch patterns
US4918731A (en) * 1987-07-17 1990-04-17 Ricoh Company, Ltd. Speech recognition method and apparatus
US5025471A (en) * 1989-08-04 1991-06-18 Scott Instruments Corporation Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns

Also Published As

Publication number Publication date
US5526466A (en) 1996-06-11
KR0134158B1 (ko) 1998-04-29

Similar Documents

Publication Publication Date Title
KR940024660A (ko) 음성인식장치
US7415416B2 (en) Voice activated device
KR960035426A (ko) 음성 인식 대화 장치
EP0335521A1 (en) Voice activity detection
JPS53105103A (en) Voice identifying system
JPS58134700A (ja) 連続音声認識の改良
KR930022268A (ko) 음성 인식장치
JPS58134699A (ja) 連続ワ−トストリング認識方法および装置
WO2003042974A1 (en) Method and system for chinese speech pitch extraction
US4920568A (en) Method of distinguishing voice from noise
EP0439073B1 (en) Voice signal processing device
CN101030374B (zh) 基音周期提取方法及装置
JPWO2003107326A1 (ja) 音声認識方法及びその装置
CN1971707B (zh) 一种进行基音周期估计和清浊判决的方法及装置
Stanek et al. Comparison of fundamental frequency detection methods and introducing simple self-repairing algorithm for musical applications
JPH0772899A (ja) 音声認識装置
KR930010398B1 (ko) 음성신호 파형에서 비대칭율을 이용한 전이구간 검출방법
JP2679039B2 (ja) 母音切出し装置
JP2598518B2 (ja) 音声のセグメンテーション方法
JPH04130499A (ja) 音声のセグメンテーション方法
JPH0456999B2 (ko)
JPH03290700A (ja) 有音検出装置
JPH06110491A (ja) 音声認識装置
JPH0119159B2 (ko)
Pinkowski A template-based approach for recognition of intermittent sounds

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20041227

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee