KR890002816A - 저렴한 음성 인식 시스템 및 방법 - Google Patents
저렴한 음성 인식 시스템 및 방법 Download PDFInfo
- Publication number
- KR890002816A KR890002816A KR1019880009623A KR880009623A KR890002816A KR 890002816 A KR890002816 A KR 890002816A KR 1019880009623 A KR1019880009623 A KR 1019880009623A KR 880009623 A KR880009623 A KR 880009623A KR 890002816 A KR890002816 A KR 890002816A
- Authority
- KR
- South Korea
- Prior art keywords
- speech
- frame
- frames
- template
- binary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Radio Transmission System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Machine Translation (AREA)
- Image Analysis (AREA)
Abstract
Description
Claims (14)
- 선정된 간격으로 음성 신호를 샘플링하여 이 신호의 디지탈 표시를 발생시키기 위한 디지탈화기, 디지탈 신호를 프레임내에 그룹화시키고 각 프레임의 신호의 변형을 발생시키기 위해 디지탈화기기에 결합된 특징 추출기, 2진 특징 계수의 프레임을 수신하고 이 프레임들을 연속 순서로 정렬하기 위해 특징 추출기에 결합된 큐, 다수의 음성 프레임을 2진 특징 계수의 프레임을 갖고있는 다수의 기준 형판과 비교하고 이들 사이의 정합의 근접도를 나타내는 다수의 오차 값을 발생시키기 위해 상기 큐에 결합된 비교기, 및 비교의 결과를 수신하고 음성 발성의 일부와 기준형판 사이의 최상 정합을 선택하기 위해 비교기에 결합된 결정 제어기로 구성되고, 변형이 다수의 특징 계수를 갖고 있고, 각각의 특징 계수가 그 변환 값이 그 계수에 대한 미리 선택된 임계값보다 크거나 작은 값을 가지고 있는 것을 나타내는 대응 2진 특징 계수를 갖고 있는 것을 특징으로 하는 음성 인식 시스템.
- 제 1항에 있어서, 결정 제어기가 음향 에너지 레벨에 의해 정의된 바와같이 발성의 개시 및 종료를 검출하기 위한 장치를 포함하고, 결정 제어기가 발성이 완료된 후에만 최상 정합을 선택하는 것을 특징으로 하는 시스템.
- 제 2항에 있어서, 결정 제어기가 규내의 최소한 한개의 비교가 선정된 임계값 보다 적은 오차를 가질 때만 최상 정합을 선택하고, 그 이외의 경우에는 발성이 거부되는 것을 특징으로하느 시스템.
- 제 3항에 있어서, 가장 낮은 오차를 갖고 있는 2개의 비교가 서로 미리 선택된 범위내에 있는 오차 값을 갖고 있는 경우에 발성이 거부되는 것을 특징으로하는 시스템.
- 제 1항에 있어서, 비교기가 각각의 기준 형판의 각각의 프레임과 큐내의 대응 음성 프레임 사이에서 배타적-OR을 계산하고, 오차 신호가 대응 형판과 음성 프레임 사이가 정합되지 않는 비트의 수를 나타내는 것을 특징으로하는 시스템.
- 제 1항에 있어서, 큐내의 교번 프레임만이 형판으로의 각각의 비교 스텝을 위해 비교기에 의해 사용되는 것을 특징으로하는 시스템.
- 말한 워드를 인식하는 방법에 있어서,(a)미리 선택된 기간에 음성의 발성을 디지탈화 시키고, (b)디지탈회된 음성을 프레임내로 그룹화시키고, 각 프레임을 이것의 음향 특징을 나타내는 다수의 2진 계수로 변화시키며, (c) 2진 계수의 다수의 프레임을 각각 갖고 있는 다수의 기준 형판을 제공하고, (d) 스템(b)에서 발생된 연상 프레임을 기준 형판과 비교하고, 이들의 차이의 크기를 나타내는 오차 값을 발생시키며, (e)인식된 워드로써 가장 낮은 오차 값을 발생시키는 형판을 선택하는 스텝을 포함하는 것을 특징으로 하는 방법.
- 제 7항에 있어서, 형판이 이것의 오차 값이 선정된 값보다 작을 경우에만 스텝(e)에서 선택되는 것을 특징으로 하는 방법.
- 제 7항에 있어서, 기준 형판 프레임이 디지탈화된 음성 프레임의 2배 길이인 음성 프레임을 나타내고, 연속 음성 프레임들의 교번 프레임만이 스텝(d)에서 형판과 비교되는 것을 특징으로하는 방법.
- 제 7항에 있어서, 스텝(d)의 비교가 대응 음성과 기준 프레임 사이의 배타적 OR을 수행하는 것을 포함하며, 발생된 오차 값이 대응 프레임을 사이의 해밍 거리로 되는 것을 특징으로 하는 방법.
- 인식 시스템에 사용하기 위한 음성을 기재하는 방법에 있어서, (a) 기재될 워드를 선택하고 이것의 예상된 길이를 결정하며, (b) 발성을 수신하고, (c)발성을 디지탈화하고 이것의 샘플을 선정된 길이를 갖는 프레임내로 수집하며, (d) 각각의프레임에 대해 2진 특징을 추출하고, (e)발성의 길이를 예상된 길이에 비교하며, (f) 발상이 예상된 길이의 미리 선택된 범위내의 길이를 갖는 경우에, 발성의 프레임을 기준 형판으로써 기재하는 스텝을 포함하는 것을 특징으로 하는 방법.
- 제 11항에 있어서, 스텝(b) 및 (c)가 여러번 수행되고, 스텝(d)에서 추출된 2진 특징이 2진 특징 프레임의 합성 셋트를 발생시키는데 사용되는것을 특징으로하는 방법.
- 제 12항에 있어서, 다수의 발성이 단일 화자에 의해 이루어지는 것을 특징으로하는 방법.
- 제 12항에 있어서, 다수의 발성이 상이한 화자에 의해 이루어지는 것을 특징으로하는 방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US079,653 | 1987-07-30 | ||
US07/079,563 US4910784A (en) | 1987-07-30 | 1987-07-30 | Low cost speech recognition system and method |
US079,563 | 1987-07-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR890002816A true KR890002816A (ko) | 1989-04-11 |
KR0123934B1 KR0123934B1 (ko) | 1997-11-26 |
Family
ID=22151331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019880009623A Expired - Fee Related KR0123934B1 (ko) | 1987-07-30 | 1988-07-29 | 저렴한 음성 인식 시스템 및 방법 |
Country Status (5)
Country | Link |
---|---|
US (1) | US4910784A (ko) |
EP (1) | EP0302663B1 (ko) |
JP (2) | JPH01113798A (ko) |
KR (1) | KR0123934B1 (ko) |
DE (1) | DE3884880T2 (ko) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06332492A (ja) * | 1993-05-19 | 1994-12-02 | Matsushita Electric Ind Co Ltd | 音声検出方法および検出装置 |
CA2167200A1 (en) * | 1993-07-13 | 1995-01-26 | Theodore Austin Bordeaux | Multi-language speech recognition system |
US5680506A (en) * | 1994-12-29 | 1997-10-21 | Lucent Technologies Inc. | Apparatus and method for speech signal analysis |
US5832440A (en) * | 1996-06-10 | 1998-11-03 | Dace Technology | Trolling motor with remote-control system having both voice--command and manual modes |
US6654955B1 (en) | 1996-12-19 | 2003-11-25 | International Business Machines Corporation | Adding speech recognition libraries to an existing program at runtime |
US7630895B2 (en) * | 2000-01-21 | 2009-12-08 | At&T Intellectual Property I, L.P. | Speaker verification method |
US6012027A (en) * | 1997-05-27 | 2000-01-04 | Ameritech Corporation | Criteria for usable repetitions of an utterance during speech reference enrollment |
US5956675A (en) * | 1997-07-31 | 1999-09-21 | Lucent Technologies Inc. | Method and apparatus for word counting in continuous speech recognition useful for reliable barge-in and early end of speech detection |
WO2002097796A1 (en) * | 2001-05-28 | 2002-12-05 | Intel Corporation | Providing shorter uniform frame lengths in dynamic time warping for voice conversion |
US7171444B2 (en) * | 2001-11-14 | 2007-01-30 | Sharp Laboratories Of America, Inc. | Remote desktop protocol compression system |
US7398209B2 (en) * | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7693720B2 (en) * | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
US7640160B2 (en) | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7620549B2 (en) * | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US7949529B2 (en) | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
EP2026030A1 (en) * | 2007-08-16 | 2009-02-18 | Saab Ab | Method and device for detecting a fire shot event in a weapon |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US8589161B2 (en) * | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US9171541B2 (en) * | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
US9898459B2 (en) | 2014-09-16 | 2018-02-20 | Voicebox Technologies Corporation | Integration of domain information into state transitions of a finite state transducer for natural language processing |
CN107003996A (zh) | 2014-09-16 | 2017-08-01 | 声钰科技 | 语音商务 |
CN107003999B (zh) | 2014-10-15 | 2020-08-21 | 声钰科技 | 对用户的在先自然语言输入的后续响应的系统和方法 |
US10614799B2 (en) | 2014-11-26 | 2020-04-07 | Voicebox Technologies Corporation | System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US10331784B2 (en) | 2016-07-29 | 2019-06-25 | Voicebox Technologies Corporation | System and method of disambiguating natural language processing requests |
CA3053668A1 (en) | 2017-03-01 | 2018-09-07 | Soltare Inc. | Systems and methods for detection of a target sound |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2575909A (en) * | 1949-07-01 | 1951-11-20 | Bell Telephone Labor Inc | Voice-operated system |
US3225141A (en) * | 1962-07-02 | 1965-12-21 | Ibm | Sound analyzing system |
US3322898A (en) * | 1963-05-16 | 1967-05-30 | Meguer V Kalfaian | Means for interpreting complex information such as phonetic sounds |
US3647978A (en) * | 1969-04-30 | 1972-03-07 | Int Standard Electric Corp | Speech recognition apparatus |
US3742143A (en) * | 1971-03-01 | 1973-06-26 | Bell Telephone Labor Inc | Limited vocabulary speech recognition circuit for machine and telephone control |
US3812291A (en) * | 1972-06-19 | 1974-05-21 | Scope Inc | Signal pattern encoder and classifier |
US3943295A (en) * | 1974-07-17 | 1976-03-09 | Threshold Technology, Inc. | Apparatus and method for recognizing words from among continuous speech |
DE2536640C3 (de) * | 1975-08-16 | 1979-10-11 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Anordnung zur Erkennung von Geräuschen |
US4181813A (en) * | 1978-05-08 | 1980-01-01 | John Marley | System and method for speech recognition |
JPS5722296A (en) * | 1980-07-15 | 1982-02-05 | Matsushita Electric Works Ltd | Voice message identifying system |
JPS58130393A (ja) * | 1982-01-29 | 1983-08-03 | 株式会社東芝 | 音声認識装置 |
JPS6069698A (ja) * | 1983-09-27 | 1985-04-20 | 株式会社リコー | 音声パタ−ン比較装置 |
US4780906A (en) * | 1984-02-17 | 1988-10-25 | Texas Instruments Incorporated | Speaker-independent word recognition method and system based upon zero-crossing rate and energy measurement of analog speech signal |
JPS62121500A (ja) * | 1985-11-20 | 1987-06-02 | シャープ株式会社 | 音声認識方式 |
-
1987
- 1987-07-30 US US07/079,563 patent/US4910784A/en not_active Expired - Lifetime
-
1988
- 1988-07-28 EP EP88306967A patent/EP0302663B1/en not_active Expired - Lifetime
- 1988-07-28 DE DE88306967T patent/DE3884880T2/de not_active Expired - Fee Related
- 1988-07-29 KR KR1019880009623A patent/KR0123934B1/ko not_active Expired - Fee Related
- 1988-07-29 JP JP63190497A patent/JPH01113798A/ja active Pending
-
1999
- 1999-09-27 JP JP007339U patent/JP2000000013U/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
JPH01113798A (ja) | 1989-05-02 |
EP0302663A3 (en) | 1989-10-11 |
EP0302663B1 (en) | 1993-10-13 |
DE3884880D1 (de) | 1993-11-18 |
KR0123934B1 (ko) | 1997-11-26 |
JP2000000013U (ja) | 2000-02-02 |
DE3884880T2 (de) | 1994-02-10 |
EP0302663A2 (en) | 1989-02-08 |
US4910784A (en) | 1990-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR890002816A (ko) | 저렴한 음성 인식 시스템 및 방법 | |
KR100766761B1 (ko) | 화자-독립형 보이스 인식 시스템용 보이스 템플릿을구성하는 방법 및 장치 | |
CN1167045C (zh) | 语音识别的方法和装置 | |
GB2272554A (en) | Recognizing speech by using wavelet transform and transient response therefrom | |
JPH0990974A (ja) | 信号処理方法 | |
JPS62217295A (ja) | 音声認識方式 | |
CN110428853A (zh) | 语音活性检测方法、语音活性检测装置以及电子设备 | |
US7650281B1 (en) | Method of comparing voice signals that reduces false alarms | |
EP0474496B1 (en) | Speech recognition apparatus | |
JP2996019B2 (ja) | 音声認識装置 | |
JP2001083978A (ja) | 音声認識装置 | |
JPH04324499A (ja) | 音声認識装置 | |
KR100304665B1 (ko) | 피치 웨이브 특성을 이용한 음성 인식 장치 및 그 방법 | |
JPS63213899A (ja) | 話者照合方式 | |
JPH05303391A (ja) | 音声認識装置 | |
Kim et al. | A study on the improvement of speaker recognition system by voiced detection | |
JP2577891B2 (ja) | 単語音声予備選択装置 | |
JP2891259B2 (ja) | 音声区間検出装置 | |
JPH10214096A (ja) | 話者認識装置 | |
WO1997037345A1 (en) | Speech processing | |
Jin et al. | A high-performance text-independent speaker identification system based on BCDM. | |
Yalabik et al. | An efficient algorithm for recognizing isolated Turkish words | |
JPS62166400A (ja) | 音声ワ−ドプロセツサ装置 | |
JPH096381A (ja) | 音声単語認識方法 | |
Cheng et al. | A simple tone classifier for Cantonese recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
R17-X000 | Change to representative recorded |
St.27 status event code: A-3-3-R10-R17-oth-X000 |
|
P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
A201 | Request for examination | ||
P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
T11-X000 | Administrative time limit extension requested |
St.27 status event code: U-3-3-T10-T11-oth-X000 |
|
P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 6 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 7 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 8 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 9 |
|
FPAY | Annual fee payment |
Payment date: 20060714 Year of fee payment: 10 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 10 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20070923 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20070923 |
|
P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |