KR100868709B1 - 불리한 환경에서 동양 문자를 위한 하이브리드키패드/음성 인식 테크닉 - Google Patents
불리한 환경에서 동양 문자를 위한 하이브리드키패드/음성 인식 테크닉 Download PDFInfo
- Publication number
- KR100868709B1 KR100868709B1 KR1020010081533A KR20010081533A KR100868709B1 KR 100868709 B1 KR100868709 B1 KR 100868709B1 KR 1020010081533 A KR1020010081533 A KR 1020010081533A KR 20010081533 A KR20010081533 A KR 20010081533A KR 100868709 B1 KR100868709 B1 KR 100868709B1
- Authority
- KR
- South Korea
- Prior art keywords
- speech
- keys
- syllable
- voice
- phonemes
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000002411 adverse Effects 0.000 title abstract description 16
- 238000005259 measurement Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims 3
- 230000001413 cellular effect Effects 0.000 claims 1
- 238000007781 pre-processing Methods 0.000 claims 1
- 229920001690 polydopamine Polymers 0.000 abstract 1
- 230000001419 dependent effect Effects 0.000 description 8
- 238000003825 pressing Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000010183 spectrum analysis Methods 0.000 description 3
- 241001672694 Citrus reticulata Species 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011109 contamination Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012066 statistical methodology Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/02—Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators
- G06F15/0208—Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators for combination with other devices having a different main function, e.g. watches, pens
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/027—Syllables being the recognition units
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
- Calculators And Similar Devices (AREA)
Abstract
Description
Claims (17)
- 자음 더하기 모음 더하기 성조(tone) 또는 모음 더하기 성조의 음절 구조를 가진, 동양 언어로 구술된 음성을 입력하는 전자 디바이스로서, 상기 전자 디바이스는,상기 구술된 음성을 나타내는 음성 신호를 수신하는 음성 수신기와,상기 음성 수신기에 연결되고, 상기 음성 신호의 음성 특징을 뽑아내는 전처리(preprocessing) 수단과,복수의 키를 포함하며, 여기서 각 키에는 자음 및 모음을 포함하는 적어도 하나의 음소가 할당된 키패드 수단과,상기 음성 신호의 상기 음성 특징 및 상기 키패드 수단을 통해 순차적으로 얻어진 음소에 기초하여 상기 구술된 음성의 각 음절을 인식하는 음향 매칭 수단과,상기 음향 매칭 수단으로부터의 각 음절 및 상기 키패드 수단을 통해 순차적으로 키로 입력된(keyed-in) 음소에 기초하여 상기 구술된 음성 내에서, 복수의 음절로 이루어진 각 단어를 인식하는 고립된 음절 매칭 수단을 포함하되,상기 복수의 키 각각 내에 그룹 지어진 음소의 음향 특징 공간에서의 제1 차이점 측정치와 상기 복수의 키 사이의 복수의 음소의 음향 특징 공간에서의 제2 차이점 측정치의 비가 최대화되도록 각 키에 상기 적어도 하나의 음소가 할당되는, 전자 디바이스.
- 삭제
- 제 1 항에 있어서, 상기 구술된 음성에서의 각 음절의 첫번째 음소에 대응하는 키(key)는 각 음절이 발언(uttered)될 때 눌러지는, 전자 디바이스.
- 제 1 항에 있어서, 상기 전자 디바이스는 셀룰러 전화, 무선(wireless) 전화, 전자 사전, 개인용 디지털 보조 장치(personal digital assistant) 및 전자 시계로 이루어진 그룹으로부터 선택된 하나인, 전자 디바이스.
- 제 1 항에 있어서, 상기 구술된 음성은 적어도 하나의 다음절(multi-syllable) 단어로 이루어진 고립된 음성인, 전자 디바이스.
- 제 3 항에 있어서, 상기 구술된 음성에서의 각 음절의 첫번째 음소는 자음인, 전자 디바이스.
- 디스플레이를 가진 전자 디바이스로서,자음 더하기 모음 또는 모음 중 어느 하나의 음절 구조를 갖는 동양 언어로 구술된 음성을 나타내는 음성 신호를 수신하는 음성 수신 수단과,복수의 키를 가지며, 여기서 자음 및 모음을 포함하는 적어도 하나의 음소는 상기 복수의 키 각각에 할당되어 그 위에 가시적으로 나타내어진 숫자 키패드와,상기 숫자 키패드를 통해 순차적으로 얻어진 음소 및 상기 음성 수신 수단에 의해 수신된 상기 구술된 음성에 기초하여 상기 구술된 음성으로부터 동양 문자를 인식하는 음성 인식 수단과,상기 구술된 음성으로부터 상기 동양 문자를 상기 디스플레이 상에 보여주는 수단을 포함하되,상기 복수의 키 각각 내에 그룹 지어진 음소의 음향 특징 공간에서의 제1 차이점 측정치와 상기 복수의 키 사이의 복수의 음소의 음향 특징 공간에서의 제2 차이점 측정치의 비가 최대화되도록 복수의 키 각각에 상기 적어도 하나의 음소가 할당되어, 동양 언어가 상기 숫자 키패드 및 상기 음성 수신 수단을 통해 효과적으로 입력될 수 있게 하는, 디스플레이를 가진 전자 디바이스.
- 삭제
- 숫자 키패드를 통한 키 입력을 통해 동양 언어로 된 음성을 인식하는 방법으로서, 상기 동양 음성은 자음 더하기 모음 또는 모음의 음절 구조를 가지며, 상기 숫자 키패드는 복수의 키를 갖는, 상기 음성 인식 방법으로서,(a) 상기 음성을 나타내는 음성 신호를 입력하는 단계와,(b) 상기 음성 신호의 음성 특징을 뽑아내는 단계와,(c) 각 음절이 발언될 때 상기 음성에서의 각 음절의 첫번째 음소에 대응하는 키 정보를, 상기 숫자 키패드를 통해, 순차적으로 수신하는 단계와,(d) 상기 음성 신호의 상기 음성 특징 및 (c)단계로부터 순차적으로 수신된 음소에 기초하여 상기 음성의 각 음절을 인식하는 단계와,(e) (d)단계에서 인식된 각 음절 및 (c)단계로부터 순차적으로 수신된 음소에 기초하여 상기 음성 내에서, 복수의 음절로 이루어진, 각 단어를 인식하는 단계를 포함하되,상기 복수의 키 각각 내에 그룹 지어진 음소의 음향 특징 공간에서의 제1 차이점 측정치와 상기 복수의 키 사이의 복수의 음소의 음향 특징 공간에서의 제2 차이점 측정치의 비가 최대화되도록 상기 숫자 키패드의 상기 복수의 키 각각에는 자음 및 모음을 포함하는 적어도 하나의 상기 음소가 할당되며, (c) 단계에서의 상기 첫번째 음소는 자음인, 음성 인식 방법.
- 삭제
- 삭제
- 제 7 항에 있어서, 상기 최대화는(b1) 각 키 내에서의 상기 음소의 상기 음향 특징 공간에서의 첫번째 차이점(dissimilarity) 측정치를 최대화하여 각 키와 그룹 지어진 상기 복수의 음소가 음향상 구별되게 하는 최대화하는 것, 및(b2) 키 사이의 상기 음소의 상기 음향 특징 공간에서의 두번째 차이점 측정치를 최소화하여 가장 모호한 음소가 같은 키 내에 그룹 지어지지 않게 하는 최소화하는 것을포함하는, 디스플레이를 가진 전자 디바이스.
- 복수의 키로 이루어진 숫자 키패드 및 음성 입력 수단을 갖는 전자 디바이스에 동양 문자를 입력하는 방법으로서,자음 및 모음을 포함하는 적어도 하나의 음소는 상기 복수의 키 각각에 할당되고 그 위에 가시적으로 나타나고,상기 동양 문자를 나타내는 음성은 사용자에 의해 구술되고 상기 음성 입력 수단에 의해 수신되며, 상기 사용자가 상기 동양 문자 각각을 고립된 음성 모드로 발언할 때, 상기 동양 문자 각각에 대응하는 상기 음소의 첫번째 것을 나타내는 키를 순차적으로 누르며,대응하는 동양 문자는 순차적으로 키로 입력된 음소에 기초하여 선택되고,상기 복수의 키 각각 내에 그룹 지어진 음소의 음향 특징 공간에서의 제1 차이점 측정치와 상기 복수의 키 사이의 복수의 음소의 음향 특징 공간에서의 제2 차이점 측정치의 비가 최대화되도록 복수의 키 각각에 상기 적어도 하나의 음소가 할당되는 것을 특징으로 하는, 동양 문자를 입력하는 방법.
- 삭제
- 숫자 키패드를 통한 키 입력을 통해 동양 언어로 된 음성을 인식하기 위하여 프로세서로 하여금 복수의 단계를 수행하도록 동작하는, 컴퓨터 프로그램 제품을 포함하는 저장 매체로서,상기 동양 음성은 자음 더하기 모음 또는 모음의 음절 구조를 가지며,상기 숫자 키패드는 복수의 키를 가지며,상기 복수의 단계는(a) 상기 음성을 나타내는 음성 신호를 입력하는 단계와,(b) 상기 음성 신호의 음성 특징을 뽑아내는 단계와,(c) 각 음절이 발언될 때 상기 음성에서 각 음절의 첫번째 음소에 대응하는 키의 정보를, 상기 숫자 키패드를 통해 순차적으로 수신하는 단계와,(d) 상기 음성 신호의 상기 음성 특징 및 (c) 단계로부터 순차적으로 수신된 음소에 기초하여 상기 음성의 각 음절을 인식하는 단계와,(e) (d) 단계에서 인식된 각 음절 및 (c) 단계로부터 순차적으로 수신된 음소에 기초하여 상기 음성 내에서, 복수의 음절로 이루어진 각 단어를 인식하는 단계를포함하는, 컴퓨터 프로그램 제품을 포함하는 저장 매체.
- 제 16 항에 있어서, 상기 숫자 키패드의 상기 복수의 키 각각에는 상기 동양 언어의 자음 및 모음을 포함하는 적어도 하나의 상기 음소가 할당되며, (c) 단계에서 상기 첫 번째 음소는 자음인, 컴퓨터 프로그램 제품을 포함하는 저장 매체.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP00204815 | 2000-12-22 | ||
EP00204815.5 | 2000-12-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20020051842A KR20020051842A (ko) | 2002-06-29 |
KR100868709B1 true KR100868709B1 (ko) | 2008-11-13 |
Family
ID=8172572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020010081533A KR100868709B1 (ko) | 2000-12-22 | 2001-12-20 | 불리한 환경에서 동양 문자를 위한 하이브리드키패드/음성 인식 테크닉 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP4230142B2 (ko) |
KR (1) | KR100868709B1 (ko) |
CN (1) | CN1224955C (ko) |
TW (1) | TW533404B (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107193935A (zh) * | 2017-05-18 | 2017-09-22 | 上海思依暄机器人科技股份有限公司 | 一种拼音处理方法及系统 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW533404B (en) * | 2000-12-22 | 2003-05-21 | Koninkl Philips Electronics Nv | Hybrid keypad/speech recognition technique for oriental characters in adverse environments |
CN100419751C (zh) * | 2004-03-11 | 2008-09-17 | 台达电子工业股份有限公司 | 使用语音输入查询方式及使用语音输入的行动电子装置 |
CN1952995B (zh) * | 2005-10-18 | 2010-09-22 | 说宝堂信息科技(上海)有限公司 | 智能互动型语言练习装置及其方法 |
CN101739868B (zh) * | 2008-11-19 | 2012-03-28 | 中国科学院自动化研究所 | 一种用于口语测试的文本朗读水平自动评估诊断方法 |
CN103488306A (zh) * | 2013-08-30 | 2014-01-01 | 浙江佑安高科消防系统有限公司 | 汉语数音拼音输入法 |
US9711141B2 (en) * | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
KR102356788B1 (ko) * | 2015-07-13 | 2022-02-08 | 에스케이텔레콤 주식회사 | 키패드를 이용한 키워드 검색 방법 및 장치 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000056796A (ja) * | 1998-08-07 | 2000-02-25 | Asahi Chem Ind Co Ltd | 音声入力装置および方法 |
JP2000066819A (ja) * | 1998-08-18 | 2000-03-03 | Matsushita Electric Ind Co Ltd | 汎用中国語音声キーボード設定装置 |
JP2000305924A (ja) * | 1999-04-16 | 2000-11-02 | Matsushita Electric Ind Co Ltd | 数字キーによる漢字入力方法及びその装置 |
KR20010018532A (ko) * | 1999-08-20 | 2001-03-05 | 정선종 | 동시에 병렬적으로 문자인식 및 음성인식을 사용한 컴퓨터 사용자 인터페이스 방법 |
JP2002268680A (ja) * | 2000-12-22 | 2002-09-20 | Koninkl Philips Electronics Nv | 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術 |
-
2001
- 2001-11-16 TW TW090128512A patent/TW533404B/zh not_active IP Right Cessation
- 2001-12-19 CN CNB011456868A patent/CN1224955C/zh not_active Expired - Lifetime
- 2001-12-20 JP JP2001388362A patent/JP4230142B2/ja not_active Expired - Fee Related
- 2001-12-20 KR KR1020010081533A patent/KR100868709B1/ko not_active IP Right Cessation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000056796A (ja) * | 1998-08-07 | 2000-02-25 | Asahi Chem Ind Co Ltd | 音声入力装置および方法 |
JP2000066819A (ja) * | 1998-08-18 | 2000-03-03 | Matsushita Electric Ind Co Ltd | 汎用中国語音声キーボード設定装置 |
JP2000305924A (ja) * | 1999-04-16 | 2000-11-02 | Matsushita Electric Ind Co Ltd | 数字キーによる漢字入力方法及びその装置 |
KR20010018532A (ko) * | 1999-08-20 | 2001-03-05 | 정선종 | 동시에 병렬적으로 문자인식 및 음성인식을 사용한 컴퓨터 사용자 인터페이스 방법 |
JP2002268680A (ja) * | 2000-12-22 | 2002-09-20 | Koninkl Philips Electronics Nv | 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107193935A (zh) * | 2017-05-18 | 2017-09-22 | 上海思依暄机器人科技股份有限公司 | 一种拼音处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN1360301A (zh) | 2002-07-24 |
JP2002268680A (ja) | 2002-09-20 |
JP4230142B2 (ja) | 2009-02-25 |
KR20020051842A (ko) | 2002-06-29 |
TW533404B (en) | 2003-05-21 |
CN1224955C (zh) | 2005-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5787230A (en) | System and method of intelligent Mandarin speech input for Chinese computers | |
JP3126985B2 (ja) | 音声認識システムの言語モデルのサイズを適応させるための方法および装置 | |
Rudnicky et al. | Survey of current speech technology | |
JP2007500367A (ja) | 音声認識方法およびコミュニケーション機器 | |
Kumar et al. | Development of Indian language speech databases for large vocabulary speech recognition systems | |
GB2557714A (en) | Determining phonetic relationships | |
KR20060050277A (ko) | 다중 언어의 이름들의 음성 인식을 위한 방법 및 시스템 | |
JPH06214587A (ja) | 事前指定ワードスポッティングサブシステム及び事前ワードスポッティング方法 | |
CN110675866B (zh) | 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质 | |
WO1996003741A1 (en) | System and method for facilitating speech transcription | |
WO1996003741A9 (en) | System and method for facilitating speech transcription | |
Bhatt et al. | Feature extraction techniques with analysis of confusing words for speech recognition in the Hindi language | |
Kurian | A survey on speech recognition in Indian languages | |
KR100868709B1 (ko) | 불리한 환경에서 동양 문자를 위한 하이브리드키패드/음성 인식 테크닉 | |
Ronzhin et al. | Russian voice interface | |
Haraty et al. | CASRA+: A colloquial Arabic speech recognition application | |
CN107251137B (zh) | 利用语音改善至少一种语义单元的集合的方法、装置及计算机可读记录介质 | |
KR20150014235A (ko) | 자동 통역 장치 및 방법 | |
Sayem | Speech analysis for alphabets in Bangla language: automatic speech recognition | |
Nga et al. | A Survey of Vietnamese Automatic Speech Recognition | |
JP2011039468A (ja) | 電子辞書で音声認識を用いた単語探索装置及びその方法 | |
Syadida et al. | Sphinx4 for indonesian continuous speech recognition system | |
Ananthakrishna et al. | Effect of time-domain windowing on isolated speech recognition system performance | |
Sugamura et al. | Speech processing technologies and telecommunications applications at NTT | |
Pisarn et al. | An HMM-based method for Thai spelling speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121019 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20131017 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20141023 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20151016 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20161108 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20171026 Year of fee payment: 10 |
|
LAPS | Lapse due to unpaid annual fee |