KR940024660A - 음성인식장치 - Google Patents
음성인식장치 Download PDFInfo
- Publication number
- KR940024660A KR940024660A KR1019940007784A KR19940007784A KR940024660A KR 940024660 A KR940024660 A KR 940024660A KR 1019940007784 A KR1019940007784 A KR 1019940007784A KR 19940007784 A KR19940007784 A KR 19940007784A KR 940024660 A KR940024660 A KR 940024660A
- Authority
- KR
- South Korea
- Prior art keywords
- duration
- recognition
- recognition unit
- speech
- factor
- Prior art date
Links
- 238000001514 detection method Methods 0.000 claims abstract 2
- 238000000034 method Methods 0.000 claims 5
- 238000011156 evaluation Methods 0.000 claims 1
- 235000013555 soy sauce Nutrition 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 2
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1807—Speech classification or search using natural language modelling using prosody or stress
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0638—Interactive procedures
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Image Analysis (AREA)
Abstract
표준음성학습시에, 지속시간학습회로에 의해서 각각의 인식단위의 지속시간사이의 관계를 얻고, 음성인식시에, 우선 음성구간검출회로에 의해 입력음성의 시작과 종단을 검출하고, 다음에 상호관계의 입력음성구간 길이를 사용하여 입력음성에서 인식단위의 지속시간을 예측한다. 다음에, 정합수단에 의해서, 인식단위가 에측값부근의 지속시간을 가지도록, 산출된 예측값을 사용하여 표준음성과 입력음성을 정합한다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제 1도는 본 발명의 실시예의 의한 음성인식장치를 도시한 블록도, 제 2도는 본 발명의 실시예에 의한 지속시간학습회로를 도시한 블록도.
Claims (8)
- 음성을 인식할때에 입력음성보다 짧은 인식단위로 입력음성으로 인식하고, 이 인식단위의 각각의 인식 결과를 연속적으로 연결함으로써 얻은 최종인식결과를 출력하는 음성인식장치에 있어서, 입력음성의 시작과 종단을 검출함에 의해서 음성구간을 검출하는 음성구간검출수단과, 인식단위의 지속시간에 영햐을 주는 요인을 사용함에 의해 인식단위의 지속시간사이의 관계를 산출하는 지속시간학습수단과, 검출된 음성주기와 인식단위의 지속시간의 산출관계를 사용함에 의해, 입력음성에 대한 각각의 인식단위의 지속시간을 예측하는 지속시간예측수단과, 예측된 지속시간을 사용하여 인식결과를 정합하거나 결정하는 정합수단을 포함한것을 특징으로 하는 음성인식장치.
- 제 1항에 있어서,상기 지속시간학습수단은, 인식단위의 지속시간에 영향을 주는 각 요인마다 각 요인에 대한 동일범주에 속하는 인식단위의 평균지속시간을 얻음에 의해서 인식단위의 지속시간사이의 관계를 산출하는 것을 특징으로 하는 음성인식장치.
- 제 1항에 있어서,상기 지속시간학습수단은, 인식단위의 지속시간을 좌우하는 요인이 인식단위의 지속 시간에 영향을 주는 정도로 얻고 또한 각 요인에 대한 동일 범주에 속하는 인식단위의 평균지속시간을 얻음에 의해서 인식단위의 지속시간사이의 관계를 산출하는 것을 특징으로 하는 음성인식장치.
- 제 3항에 있어서, 상기 지속시간학습수단은, 각각의 요인에 대한 동일번주에 속하는 인식단위의 평균지속시간을 각각의 요인마다 구한 다음에 입력음성에 대한 음성구간길이 전체의 평균지속시간과 식(I)의 평균지속시간(f(j)(t))를 사용하여 각 인식단위의 평균지속시간사이의 비를 구하고 또한 각각의 요인마다 상기비와 함께 가증가산을 행함으로써, 음성구간의 전체길이를 1로 취하는 경우에 대해서 각각의 인식단위의 지속시간(식(1)의 S(n))을 산출하고, 지속시간예측수단은, 상기 S(n)와 음성구간의 전장(식(2)의 L)으로부터 입력음성에 대한 인식단위마다 지속시간의 예측값(식(2))을 산출하는 것을 특징으로 하는 음성인식장치.[식(1)]fj(n) : 요인(j)에 대한 n번째 음절로서 모든 음절의 평균지속시간.N : 1개의 음성구간에 포함된 인식단위의 총수.αj : 각 요인의 가중계수.S(n) : 음성구간전장을 1로한 경우 각 인식단위에 대한 지속시간예측값.[식(2)](n)=L×S(n)(n) : n번째 인식단위에 대한 지속시간예측값.L : 전음성구간길이
- 제 3항에 있어서, 상기 지속시간학습수단은, 각각의 요인에 대한 동일범주에 속하는 인식단위의 평균지속시간을 구한 다음에, 이 평균지속시간(식(3)의 fj(i))을 사용하여, 입력음력에 대한 각각의 인식단위의 지속시간을 예측하고 또한 이와같이 예측한 값과 음성구간의 전체길이사이의 비를 구함으로써, 음성구간의 전장을 1로 취하는 경우에 대해서 각 인식단위의 지속시간(식(3)의 S(n))을 산출하고, 지속시간예측수단은, 지속시간 (S(n))을 산출하고, 지속시간예측수단은, 지속시간 (S(n))과 음성구간(식(4)의 L)의 전장으로부터 입력음성에 대해서 각각의 인식단위의 지속기간의 예측값(식(4))을 산출하는 것을 특징으로 하는 음성인식장치.[식(3)]S(n) : 전음성구간장을 1로한 경우 각 인식단위에 대한 지속시간예측값N : 1개의 음성구간에 포함된 인식단위의 총수fj(n) : 요인(j)에 대한 n번째 음절로서 모든 음절의 평균지속시간.αj : 각 요인에 대한 가중계수[식(4)]d(n)=L×S(n)d(n) : n번째 인식단위에 대한 지속시간예측값L : 전음성구간장
- 제 1항에 있어서, 상기 정합수단은, 각각의 음절에 대한 정합구간이 예측음절지속시간값 부근에 있도록, 인식단위에 대한 예측지속시간값을 사용하여 상기 정합이나 상기 인식결과결정을 행하는 것을 특징으로 하는 음성인식장치.
- 제 1항에 있어서, 인식단위에 대한 예측지속시간값을 사용하여 입력음성에서 각각의 인식단위에 대한 정합주기를 판정하는 정합구간결정수단을 부가하여 포함하고, 상기 정합수단은, 결정된 정합구간내에서 각각의 인식단위를 정합하도록, 상기 정합과 인식결과판정을 행하는 것을 특징으로 하는 음성인식장치.
- 제 1항에 있어서, 예측지속시간과 인식후보에 대한 정합결과사이의 차이를 산출하는 오차산출수단과, 상기 오차를 사용하여 확실성이 없는 인식후보를 제거하는 결과평가수단을 부가하여 포함한 것을 특징으로 하는 음성인식장치.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP93-87127 | 1993-04-14 | ||
JP5087127A JPH06301400A (ja) | 1993-04-14 | 1993-04-14 | 音声認識装置 |
JP93-217286 | 1993-09-01 | ||
JP5217286A JPH0772899A (ja) | 1993-09-01 | 1993-09-01 | 音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR940024660A true KR940024660A (ko) | 1994-11-18 |
KR0134158B1 KR0134158B1 (ko) | 1998-04-29 |
Family
ID=26428435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019940007784A KR0134158B1 (ko) | 1993-04-14 | 1994-04-14 | 음성인식장치 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5526466A (ko) |
KR (1) | KR0134158B1 (ko) |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3004883B2 (ja) * | 1994-10-18 | 2000-01-31 | ケイディディ株式会社 | 終話検出方法及び装置並びに連続音声認識方法及び装置 |
JPH08248975A (ja) * | 1995-03-09 | 1996-09-27 | Nec Corp | 標準パターン学習装置およびこの装置を使用した音声認識装置 |
JP3581752B2 (ja) * | 1995-10-09 | 2004-10-27 | 株式会社リコー | 音声認識装置及び音声認識方法 |
US9134398B2 (en) | 1996-09-09 | 2015-09-15 | Tracbeam Llc | Wireless location using network centric location estimators |
US7903029B2 (en) | 1996-09-09 | 2011-03-08 | Tracbeam Llc | Wireless location routing applications and architecture therefor |
US7714778B2 (en) | 1997-08-20 | 2010-05-11 | Tracbeam Llc | Wireless location gateway and applications therefor |
US6249252B1 (en) | 1996-09-09 | 2001-06-19 | Tracbeam Llc | Wireless location using multiple location estimators |
US6236365B1 (en) | 1996-09-09 | 2001-05-22 | Tracbeam, Llc | Location of a mobile station using a plurality of commercial wireless infrastructures |
WO1998010307A1 (en) | 1996-09-09 | 1998-03-12 | Dennis Jay Dupray | Location of a mobile station |
EP0856832A1 (fr) * | 1997-02-03 | 1998-08-05 | Koninklijke Philips Electronics N.V. | Procédé de reconnaissance vocale de mots et dispositif dans lequel ledit procédé est mis en application |
US8135413B2 (en) | 1998-11-24 | 2012-03-13 | Tracbeam Llc | Platform and applications for wireless location and other complex services |
KR100316776B1 (ko) * | 1999-03-31 | 2001-12-12 | 윤종용 | 연속 숫자음 인식 장치 및 그 방법 |
US7117149B1 (en) * | 1999-08-30 | 2006-10-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Sound source classification |
EP1286735A1 (en) | 1999-09-24 | 2003-03-05 | Dennis Jay Dupray | Geographically constrained network services |
US10641861B2 (en) | 2000-06-02 | 2020-05-05 | Dennis J. Dupray | Services and applications for a communications network |
US10684350B2 (en) | 2000-06-02 | 2020-06-16 | Tracbeam Llc | Services and applications for a communications network |
US9875492B2 (en) | 2001-05-22 | 2018-01-23 | Dennis J. Dupray | Real estate transaction system |
US8082096B2 (en) | 2001-05-22 | 2011-12-20 | Tracbeam Llc | Wireless location routing applications and architecture therefor |
US8073689B2 (en) | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
US7885420B2 (en) * | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US8326621B2 (en) | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
US7725315B2 (en) * | 2003-02-21 | 2010-05-25 | Qnx Software Systems (Wavemakers), Inc. | Minimization of transient noises in a voice signal |
US7949522B2 (en) * | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US7895036B2 (en) * | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
US7949520B2 (en) * | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US7716046B2 (en) * | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US7610196B2 (en) * | 2004-10-26 | 2009-10-27 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8306821B2 (en) * | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US8543390B2 (en) * | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US8170879B2 (en) * | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US7680652B2 (en) | 2004-10-26 | 2010-03-16 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8284947B2 (en) * | 2004-12-01 | 2012-10-09 | Qnx Software Systems Limited | Reverberation estimation and suppression system |
US8027833B2 (en) | 2005-05-09 | 2011-09-27 | Qnx Software Systems Co. | System for suppressing passing tire hiss |
US8311819B2 (en) * | 2005-06-15 | 2012-11-13 | Qnx Software Systems Limited | System for detecting speech with background voice estimates and noise estimates |
US8170875B2 (en) * | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
US7844453B2 (en) | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
US8326620B2 (en) | 2008-04-30 | 2012-12-04 | Qnx Software Systems Limited | Robust downlink speech and noise detector |
US8335685B2 (en) * | 2006-12-22 | 2012-12-18 | Qnx Software Systems Limited | Ambient noise compensation system robust to high excitation noise |
US20080231557A1 (en) * | 2007-03-20 | 2008-09-25 | Leadis Technology, Inc. | Emission control in aged active matrix oled display using voltage ratio or current ratio |
US8904400B2 (en) * | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
US8850154B2 (en) | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
US8694310B2 (en) | 2007-09-17 | 2014-04-08 | Qnx Software Systems Limited | Remote control server protocol system |
US8209514B2 (en) * | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
US20150279354A1 (en) * | 2010-05-19 | 2015-10-01 | Google Inc. | Personalization and Latency Reduction for Voice-Activated Commands |
US9538493B2 (en) | 2010-08-23 | 2017-01-03 | Finetrak, Llc | Locating a mobile station and applications therefor |
DE112013001772B4 (de) * | 2013-11-29 | 2020-02-13 | Mitsubishi Electric Corporation | Spracherkennungssystem |
KR102515914B1 (ko) * | 2022-12-21 | 2023-03-30 | 주식회사 액션파워 | Stt 모델을 활용하는 발음 전사 방법 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4092493A (en) * | 1976-11-30 | 1978-05-30 | Bell Telephone Laboratories, Incorporated | Speech recognition system |
CA1116300A (en) * | 1977-12-28 | 1982-01-12 | Hiroaki Sakoe | Speech recognition system |
US4454586A (en) * | 1981-11-19 | 1984-06-12 | At&T Bell Laboratories | Method and apparatus for generating speech pattern templates |
JPS59226400A (ja) * | 1983-06-07 | 1984-12-19 | 松下電器産業株式会社 | 音声認識装置 |
US4991216A (en) * | 1983-09-22 | 1991-02-05 | Matsushita Electric Industrial Co., Ltd. | Method for speech recognition |
US4802223A (en) * | 1983-11-03 | 1989-01-31 | Texas Instruments Incorporated | Low data rate speech encoding employing syllable pitch patterns |
US4918731A (en) * | 1987-07-17 | 1990-04-17 | Ricoh Company, Ltd. | Speech recognition method and apparatus |
US5025471A (en) * | 1989-08-04 | 1991-06-18 | Scott Instruments Corporation | Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns |
-
1994
- 1994-04-11 US US08/225,630 patent/US5526466A/en not_active Expired - Fee Related
- 1994-04-14 KR KR1019940007784A patent/KR0134158B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
US5526466A (en) | 1996-06-11 |
KR0134158B1 (ko) | 1998-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR940024660A (ko) | 음성인식장치 | |
US7415416B2 (en) | Voice activated device | |
KR960035426A (ko) | 음성 인식 대화 장치 | |
EP0335521A1 (en) | Voice activity detection | |
JPS53105103A (en) | Voice identifying system | |
JPS58134700A (ja) | 連続音声認識の改良 | |
KR930022268A (ko) | 음성 인식장치 | |
JPS58134699A (ja) | 連続ワ−トストリング認識方法および装置 | |
WO2003042974A1 (en) | Method and system for chinese speech pitch extraction | |
US4920568A (en) | Method of distinguishing voice from noise | |
EP0439073B1 (en) | Voice signal processing device | |
CN101030374B (zh) | 基音周期提取方法及装置 | |
JPWO2003107326A1 (ja) | 音声認識方法及びその装置 | |
CN1971707B (zh) | 一种进行基音周期估计和清浊判决的方法及装置 | |
Stanek et al. | Comparison of fundamental frequency detection methods and introducing simple self-repairing algorithm for musical applications | |
JPH0772899A (ja) | 音声認識装置 | |
KR930010398B1 (ko) | 음성신호 파형에서 비대칭율을 이용한 전이구간 검출방법 | |
JP2679039B2 (ja) | 母音切出し装置 | |
JP2598518B2 (ja) | 音声のセグメンテーション方法 | |
JPH04130499A (ja) | 音声のセグメンテーション方法 | |
JPH0456999B2 (ko) | ||
JPH03290700A (ja) | 有音検出装置 | |
JPH06110491A (ja) | 音声認識装置 | |
JPH0119159B2 (ko) | ||
Pinkowski | A template-based approach for recognition of intermittent sounds |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20041227 Year of fee payment: 8 |
|
LAPS | Lapse due to unpaid annual fee |