KR950003388B1 - 음성인식 시스템의 확인방법 - Google Patents
음성인식 시스템의 확인방법 Download PDFInfo
- Publication number
- KR950003388B1 KR950003388B1 KR1019910020438A KR910020438A KR950003388B1 KR 950003388 B1 KR950003388 B1 KR 950003388B1 KR 1019910020438 A KR1019910020438 A KR 1019910020438A KR 910020438 A KR910020438 A KR 910020438A KR 950003388 B1 KR950003388 B1 KR 950003388B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- user
- ram
- registration
- sound
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 16
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 16
- 238000012790 confirmation Methods 0.000 claims abstract description 10
- 238000006243 chemical reaction Methods 0.000 claims 1
- 230000005236 sound signal Effects 0.000 abstract 1
- 230000002194 synthesizing effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 101100328887 Caenorhabditis elegans col-34 gene Proteins 0.000 description 4
- 230000003321 amplification Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Alarm Systems (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Abstract
내용 없음.
Description
제 1 도는 종래 특정화자용 음성인식 시스템의 블럭도.
제 2 도는 본 발명 음성인식 시스템의 블럭도.
제 3 도는 본 발명 음성인식 시스템의 등록시에 대한 신호흐름도.
제 4 도는 본 발명 음성인식 시스템의 확인시에 대한 신호흐름도.
* 도면의 주요부분에 대한 부호의 설명
1, 9 : 증폭부 2, 8 : 저역통과필터(LPF)
3 : 음성인식소자 4 : 인식용램
5 : 메인프로세서 6 : 음성합성소자
7 : 안내메세지용롬 10 : 스피커
11 : 합성용램 12 : 백업부
본 발명은 특정화자용 음성인식 시스템에 관한 것으로, 특히 화자가 등록한 제어단어가 정확시 등록되었는지의 여부와 후에 등록한 단어를 잊어버렸을 경우 재생해서 확인해 주도록 한 음성인식 시스템의 확인방법에 관한 것이다.
음성인식 시스템은 여러가지 용도의 기기들을 제어하는 수단으로서 인간의 음성을 사용하는 시스템인 것으로, 이는 특정화자용과 불특정화자용 인식시스템으로 분류된다. 여기서 특정화자용 인식시스템은 특정한 화자만이 사용할 수 있도록 사전에 제어할 명령들을 미리 등록시키는 절차를 거치게 된다.
이와 같이 하여 종래의 특정화자용 음성인식 시스템은 제 1 도에 도시한 바와 같이, 유선 마이크나 무선송신을 통해 증폭부(1)에 도달한 음성은 증폭된 후 저역통과필터(LPF)(2)를 통해 걸려지고, 음성인식소자(3)로 입력된 음성신호는 소자고유의 특징추출 알고리즘에 따라 특징을 추출한후 램(4)에 저장한다.
이때 특정화자용 인식시스템에서 필요한 사전등록과정을 통해 등록단어들이 인식용램(4)에 차례대로 저장되어 테이블을 형성한다. 그리고 등록을 끝낸 후 인식과정에서는 상기와 마찬가지의 과정을 통해 들어온 데이타의 특징을 램에 저장된 특징들과 비교한 후 유사도의 정도로서 데이타를 판별하여 그 결과를 메인프로세서(5)등에 보낸다.
그중 초기의 등록과정에서 사용자의 등록절차를 도와주기 위하여 등록안내메세지를 담은 롬(7)을 메인프로세서(5)의 지령에 따라 음성합성소자(6)가 재생해 낸다. 이와 같이 재생된 안내메세지는 출력단의 저역통과필터(8)와 증폭부(9)를 거쳐 스피커(10)에 출력되어 등록절차를 도와준다.
그런데 상기와 같은 종래의 음성인식시스템에 있어서는 등록과정에서 화자가 발음한 제어음성이 램에 제대로 등록되었는지를 확인하는 직접적인 방법이 없으며, 물론 액정(LED)과 같은 디스플레이로 표시하거나 제대로 등록된 없으며, 물론 액정(LED)과 같은 디스플레이로 표시하거나 제대로 등록된 경우 자동으로 다음과정으로 진행되지만, 전자의 경우는 고가의 부가장치가 필요하고, 후자의 경우는 등록자에게 의구심을 자아내게 하는 문제점이 있었다.
또한 초기의 등록과정을 마친 후 나중에 음성으로 제어(즉 인식)하려고 할때, 초기에 자신이 등록시킨 단어를 잊어버릴 수도 있는데, 이에 대한 대책이 없으므로 생각나는 단어를 마구 발음하거나, 최악의 경우 다시 등록시켜야 하는 불편함이 발생하는 문제점이 있었다.
본 발명의 목적은 상기와 같은 종래의 문제점을 해결하기 위해서, 확인기능을 추가하여 화자가 등록한 제어단자가 정확히 등록되었는지의 여부와 후에 등록한 단어를 잊어버렸을 경우 재생하여 확인해 줌으로써 음성인식 시스템의 편이성을 도모하고자 하는 음성인식 시스템의 확인방법을 창안한 것으로, 이하 첨부한 도면에 의해 상세히 설명한다.
제 2 도는 본 발명 음성인식 시스템의 블럭도로서 이에 도시한 바와 같이, 증폭부(1)에 인가된 음성을 저역통과필터(2)를 통해 음성인식소자(3)에 인가하여 인식용램(4)에 저장하되, 메인프로세서(5)로 상기 음성인식소자(3)를 제어하면서 음성합송소자(6)를 제어하여 안내메세지용롬(7)의 출력을 저역통과필터(8), 증폭부(9)를 통해 스피커(10)에 인가하게 구성된 종래의 음성인식시스템에 있어서, 상기 저역통과필터(2)의 출력음성을 음성합성소자(6)에도 인가하여, 상기 메인프로세서(5)로 백업부(12)를 갖춘 합성용램(11)과 음성합성소자(6)를 제어하여 음성합성소자(6)의 입력음성을 음성합성용램(11)에 저장하게 함과 아울러 스위치(SW)를 제어하여 음성합성소자(6)의 출력음성을 제어하게 구성한다. 여기서 합성용램(11)은 인식용램(4)과는 독립적인 것으로, 인식용램(4)은 음성인식용으로 음성데이타의 특징을 저장하기 위한 것이며, 합성용램(11)은 음성합성용으로 음성데이타의 디지탈 샘플링 데이타(Digital Sampling Data)가 저장된 것이다.
이하, 상기와 같이 구성된 본 발명의 작용효과를 등록시 및 확인시의 신호흐름도인 제 3 도 및 제 4 도를 참고로하여 설명한다.
우선 등록시에는 제 3 도에 도시한 바와 같이 저역통과필터(2)를 통과한 음성이 음성인식소자(3)에 인가됨과 아울러 음성합성소자(6)에도 인가된다. 이때 음성합성소자(6)는 이 음성신호를 디지탈 신호로 변환하여 합성용램(11)에 저장하며, 동시에 출력단의 저역통과필터(8), 증폭부(9)를 통해 실시간으로 스피커(10)에 출력한다.
이와 같이 하여 등록자는 자신이 등록하려했던 음성이 제대로 등록되었음을 실시간으로 확인함으로써 종래의 문제점을 해결할 수 있는 것이며, 추가로 제어단어들을 등록함에 따라 등록단어들의 데이타들이 합성용램(11)에 계속 저장된다.
인식시에는 인식시킬려고 발음한 제어단어가 스피커(10)로 출력되는 것을 막기위해 메인프로세서(5)로 스위치(SW)를 오프시켜 음성합성소자(6)에서 저역통과필터(8)로 가는 신호를 끊어준다.
한편 시일이 경과한 후 사용자가 과거에 등록한 제어단어가 기억나지 않을 경우에는 즉 확인시에는 제 4 도에 도시한 바와 같이, 확인개시 명령에 의한 메인프로세서(5)의 지시에 따라 음성합성소자(6)에 사용자번호를 지정하고, 합성용램(11)에 저장된 음성데이타를 아날로그신호로 변환하여 저역통과필터(8), 증폭부(9) 및 스피커(10)를 통해 확인시켜 줌으로써 이의 문제점을 해결할 수 있는 것이다.
이상에서 상세히 설명한 바와 같이 본 발명은 확인기능을 추가하여 등록과정의 확실성 및 간편성을 도모했으며, 상기 과정을 램의 추가와 메인프로세서의 소프트웨어 변경만으로 구현할 수 있다. 또한 사용과정에서도 등록된 단어를 확인할 수 있으므로 음성인식 시스템의 사용상 편의성과 신뢰성을 높일 수 있다.
Claims (2)
- 사용자의 등록개시명령에 따라 사용자의 음성을 음성인식소자 및 음성합성소자에 입력시키는 단계와, 상기 입력된 음성의 특징을 상기 음성인식소자에서 특정알고리즘에 따라 인식하여 인식용램(RAM)에 저장하는 음성인식단계와, 상기 입력된 음성신호를 디지탈 변환하여 그 데이타를 음성합성용램에 저장하고, 상기 저장된 내용을 스피커를 통하여 사용자에게 알려주는 확인단계와, 상기 음성인식단계 및 확인단계를 동시에 진행완료후 등록시키고, 이후 추가등록여부를 확인하여 추가등록이 없으면 음성등록을 완료시키는 단계로 이루어진 것을 특징으로 하는 음성인식시스템의 확인방법.
- 제 1 항에 있어서, 음성등록이후에 사용자의 확인개시명령에 따라 확인할 사용자를 선택하고, 음성합성소자에 해당사용자번호를 지정하는 단계와, 상기 해당사용자번호에 따라 음성합성용램에 저장된 데이타를 추출하여 스피커를 통해 사용자에게 알리는 확인단계를 포함하여 이루어진 것을 특징으로 하는 음성인식시스템의 확인방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019910020438A KR950003388B1 (ko) | 1991-11-16 | 1991-11-16 | 음성인식 시스템의 확인방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019910020438A KR950003388B1 (ko) | 1991-11-16 | 1991-11-16 | 음성인식 시스템의 확인방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR930010849A KR930010849A (ko) | 1993-06-23 |
KR950003388B1 true KR950003388B1 (ko) | 1995-04-12 |
Family
ID=19322944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019910020438A KR950003388B1 (ko) | 1991-11-16 | 1991-11-16 | 음성인식 시스템의 확인방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR950003388B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100432858B1 (ko) * | 2000-12-26 | 2004-05-24 | 주식회사 현대영어사 | 어학 학습기 |
-
1991
- 1991-11-16 KR KR1019910020438A patent/KR950003388B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR930010849A (ko) | 1993-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR0135975B1 (ko) | 텍스트 처리 시스템 | |
US7490039B1 (en) | Text to speech system and method having interactive spelling capabilities | |
TW347619B (en) | A communication system and method using a speaker dependent time-scaling technique a method for time-scale modification of speech using a modified version of the Waveform Similarity based Overlap-Add technique (WSOLA). | |
US20010056345A1 (en) | Method and system for speech recognition of the alphabet | |
KR950003388B1 (ko) | 음성인식 시스템의 확인방법 | |
CN109616116B (zh) | 通话系统及其通话方法 | |
JPS63149699A (ja) | 音声入出力装置 | |
JPH09319297A (ja) | 音声筆談器 | |
JPS643700A (en) | Voice recognition method and apparatus | |
JPS645320B2 (ko) | ||
JP6221253B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JP3192324B2 (ja) | 特定話者用単語音声認識装置 | |
JPS6126678B2 (ko) | ||
WO2020079655A1 (en) | Assistance system and method for users having communicative disorder | |
JPH08297673A (ja) | 音声入力翻訳装置 | |
JPS63305396A (ja) | 音声認識装置 | |
JP2811196B2 (ja) | 音声式報知器 | |
JPS63281196A (ja) | 音声認識装置 | |
JP2017062300A (ja) | 半導体装置、システム、電子機器、及び、音声認識方法 | |
JPH02162399A (ja) | 音声認識装置 | |
KR920022067A (ko) | 음성 인식 장치를 이용한 제어 시스템 | |
JPS60241096A (ja) | 音声情報入出力装置 | |
KR930014541A (ko) | 음성인식 비디오 카세트 레코더의 예약 제어장치 및 제어방법 | |
JPS62119594A (ja) | 単語音声認識装置 | |
KR960011829A (ko) | 전자악기의 기능선택 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
G160 | Decision to publish patent application | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20010329 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |