KR20060014773A - Apparatus and method for testing speech recognition - Google Patents
Apparatus and method for testing speech recognition Download PDFInfo
- Publication number
- KR20060014773A KR20060014773A KR1020040063462A KR20040063462A KR20060014773A KR 20060014773 A KR20060014773 A KR 20060014773A KR 1020040063462 A KR1020040063462 A KR 1020040063462A KR 20040063462 A KR20040063462 A KR 20040063462A KR 20060014773 A KR20060014773 A KR 20060014773A
- Authority
- KR
- South Korea
- Prior art keywords
- recognition test
- speech recognition
- voice recognition
- voice
- codec
- Prior art date
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title description 11
- 238000010998 test method Methods 0.000 claims description 23
- 230000006870 function Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
본 발명은 음성 인식 테스트 장치에서, 음성 인식 테스트 요구가 검출되면 음성 인식 테스트를 위해 미리 저장되어 있는 웨이브 파일들을 재생하여 출력하고, 상기 출력한 신호를 입력하여 하드웨어 특성을 반영시킨 후, 상기 하드웨어 특성이 반영된 신호를 입력하여 음성 인식하고, 상기 음성 인식 결과를 음성 인식 테스트 결과로 출력함으로써 객관적이고 일관성을 유지하면서도 하드웨어 특성까지 반영된 음성 인식 테스트를 가능하게 한다.When the voice recognition test request is detected, the present invention reproduces and outputs a wave file stored in advance for a voice recognition test, inputs the output signal to reflect the hardware characteristic, and then the hardware characteristic. By inputting the reflected signal, voice recognition is performed, and the voice recognition result is output as a voice recognition test result, thereby enabling a voice recognition test reflecting hardware characteristics while maintaining objective and consistency.
복합 방식 음성 인식 테스트, 온라인 음성 인식 테스트, 오프라인 음성 인식 테스트, 코덱/에코 캔슬러Hybrid Speech Recognition Test, Online Speech Recognition Test, Offline Speech Recognition Test, Codec / Eco Canceller
Description
도 1은 본 발명의 실시예에서의 기능을 수행하는 음성 인식 장치의 내부 구조를 개략적으로 도시한 도면1 is a diagram schematically showing an internal structure of a speech recognition apparatus that performs a function in an embodiment of the present invention.
도 2는 본 발명의 실시예에 따른 음성 인식 테스트 장치에서 음성 인식 테스트 과정을 도시한 순서도2 is a flowchart illustrating a speech recognition test process in a speech recognition test apparatus according to an embodiment of the present invention.
본 발명은 음성 인식 테스트 장치 및 방법에 관한 것으로서, 특히 온라인(online) 음성 인식 테스트 방식과 오프 라인(offline) 음성 인식 테스트(test) 방식을 결합한 복합 방식의 음성 인식 테스트를 수행하는 장치 및 방법에 관한 것이다.The present invention relates to a speech recognition test apparatus and method, and more particularly, to an apparatus and method for performing a complex speech recognition test combining an online speech recognition test method and an offline speech recognition test method. It is about.
일반적으로 음성 인식 테스트 방식은 온라인 음성 인식 테스트 방식과 오프라인 음성 인식 테스트 방식의 2가지 방식들로 분류되며, 상기 온라인 음성 인식 테스트 방식과 오프라인 음성 인식 테스트 방식에 대해서 설명하면 다음과 같다.In general, the speech recognition test method is classified into two methods, an online speech recognition test method and an offline speech recognition test method. The online speech recognition test method and the offline speech recognition test method will be described as follows.
첫 번째로, 상기 온라인 음성 인식 테스트 방식은 상기 음성 인식 테스트를 위해 음성 인식 테스트용 웨이브(wave) 파일들을 미리 생성해놓고, 음성 인식 테스트를 수행하는 경우 상기 미리 생성해놓은 웨이브 파일들을 사용하여 음성 인식 테스트를 수행하는 방식을 나타낸다. 상기에서 설명한 바와 같이 상기 온라인 음성 인식 테스트 방식은 미리 생성해놓은 웨이브 파일들을 사용하여 음성 인식 테스트를 수행하므로 객관적이면서도 연속적인 음성 인식 테스트를 가능하게 한다. 그러나, 상기 온라인 음성 인식 테스트 방식은 하드웨어(hardware), 일 예로 코덱(CODEC)과, 에코 캔슬러(echo canceler) 및 마이크 등과 같은 하드웨어 특성을 반영하는 것이 불가능하다는 문제점을 가진다.First, the online voice recognition test method generates wave files for a voice recognition test in advance for the voice recognition test, and uses the pre-generated wave files when the voice recognition test is performed. Indicates how to do it. As described above, the on-line speech recognition test method enables an objective and continuous speech recognition test by performing a speech recognition test using pre-generated wave files. However, the online speech recognition test method has a problem in that it is impossible to reflect hardware characteristics such as hardware, for example, a codec, an echo canceler and a microphone.
두 번째로, 상기 오프라인 음성 인식 테스트 방식은 상기 음성 인식 테스트를 위해 음성 인식 모듈을 하드웨어 플랫폼(platform)에 포팅한 후, 상기 음성 인식 테스트를 수행하고자 하는 테스트자가 직접 발성하여 음성 인식 테스트를 수행하는 방식을 나타낸다. 상기에서 설명한 바와 같이 상기 오프라인 음성 인식 테스트 방식은 음성 인식 모듈을 하드웨어 플랫폼에 포팅한 후 직접 음성 인식 테스트를 수행함으로써 하드웨어 특성을 반영하는 것을 가능하게 한다. 그러나, 상기 오프라인 음성 인식 테스트 방식은 음성 인식 테스트를 위한 환경이 비객관적이고 불연속적이라는 문제점을 가진다.Secondly, in the offline speech recognition test method, after porting a speech recognition module to a hardware platform for the speech recognition test, a tester who wants to perform the speech recognition test directly speaks to perform a speech recognition test. Indicates the method. As described above, the offline speech recognition test method enables porting the speech recognition module to a hardware platform and then directly performs the speech recognition test to reflect hardware characteristics. However, the offline speech recognition test method has a problem that the environment for the speech recognition test is non-objective and discontinuous.
따라서, 본 발명의 목적은 음성 인식 테스트 장치 및 방법을 제공함에 있다. Accordingly, an object of the present invention is to provide a speech recognition test apparatus and method.
본 발명의 다른 목적은 온라인 음성 인식 테스트 방식과 오프라인 음성 인식 테스트 방식을 결합한 복합 방식의 음성 인식 테스트를 수행하는 장치 및 방법을 제공함에 있다.Another object of the present invention is to provide an apparatus and method for performing a complex speech recognition test combining a speech recognition test method and an offline speech recognition test method.
상기한 목적들을 달성하기 위한 본 발명의 장치는; 음성 인식 테스트 장치에 있어서, 음성 인식 테스트를 위한 웨이브 파일들을 데이터 베이스 형태로 저장하는 메모리와, 음성 인식 테스트 요구가 검출될 경우 상기 웨이브 파일들을 재생하여 스피커를 통해 출력하는 음성 입력 모듈과, 상기 스피커를 통해 출력한 신호를 입력하여 하드웨어 특성을 반영하는 코덱/에코 캔슬러와, 상기 코덱/에코 캔슬러에서 출력하는 신호를 마이크를 통해 입력하여 음성 인식하여 음성 인식 테스트 결과를 출력하는 음성 인식 모듈을 포함함을 특징으로 한다.The apparatus of the present invention for achieving the above objects; A voice recognition test apparatus comprising: a memory for storing wave files for a voice recognition test in a database form, a voice input module for reproducing and outputting the wave files through a speaker when a voice recognition test request is detected; A codec / echo canceler that reflects hardware characteristics by inputting a signal output through a signal, and a voice recognition module that inputs a signal output from the codec / echo canceler through a microphone to perform voice recognition to output a voice recognition test result. It is characterized by including.
상기한 목적들을 달성하기 위한 본 발명의 방법은; 음성 인식 테스트 방법에 있어서, 음성 인식 테스트 요구가 검출되면 음성 인식 테스트를 위해 미리 저장되어 있는 웨이브 파일들을 재생하여 출력하는 과정과, 상기 출력한 신호를 입력하여 하드웨어 특성을 반영시키는 과정과, 상기 하드웨어 특성이 반영된 신호를 입력하여 음성 인식하고, 상기 음성 인식 결과를 음성 인식 테스트 결과로 출력하는 과정을 포함함을 특징으로 한다.
The method of the present invention for achieving the above objects; A voice recognition test method comprising: reproducing and outputting wave files stored in advance for a voice recognition test when a voice recognition test request is detected; and inputting the output signal to reflect hardware characteristics; And recognizing a speech by inputting a signal reflecting the characteristic, and outputting the speech recognition result as a speech recognition test result.
이하 본 발명의 바람직한 실시예들의 상세한 설명이 첨부된 도면들을 참조하 여 설명될 것이다. 도면들 중 동일한 구성들은 가능한 한 어느 곳에서든지 동일한 부호들을 나타내고 있음을 유의하여야 한다.DETAILED DESCRIPTION A detailed description of preferred embodiments of the present invention will now be described with reference to the accompanying drawings. It should be noted that the same components in the figures represent the same numerals wherever possible.
도 1은 본 발명의 실시예에서의 기능을 수행하는 음성 인식 장치의 내부 구조를 개략적으로 도시한 도면이다.1 is a diagram schematically showing an internal structure of a speech recognition apparatus that performs a function in an embodiment of the present invention.
상기 도 1을 참조하면, 상기 음성 인식 장치는 제어부(도시하지 않음)와, 음성 인식 모듈(module)(110)과, 음성 입력 모듈(120)과, 메모리(memory)(130)와, 스피커(140)와, 코덱(CODEC)/에코 캔슬러(echo canceler)(150)와, 마이크(160)로 구성된다.Referring to FIG. 1, the voice recognition apparatus includes a controller (not shown), a
먼저, 상기 제어부는 상기 음성 인식 테스트 장치의 전반적인 동작을 제어하는 기능을 수행한다. 특히, 본 발명의 실시예에서 상기 제어부는 온라인(online) 음성 인식 테스트 방식과 오프라인(offline) 음성 인식 테스트 방식을 결합한 형태의 복합 방식의 음성 인식 테스트 방식에 상응하게 음성 인식 테스트를 수행하도록 제어한다.First, the controller performs a function of controlling the overall operation of the speech recognition test apparatus. In particular, in an embodiment of the present invention, the control unit controls to perform a speech recognition test corresponding to a complex speech recognition test method of a combination of an online speech recognition test method and an offline speech recognition test method. .
상기 음성 인식 모듈(110)은 상기 제어부의 제어에 따라 입력되는 신호에 대해 음성 인식을 수행한다. 상기 음성 입력 모듈(120)은 상기 제어부의 제어에 따라 상기 메모리(130)에 저장되어 있는 웨이브(wave) 파일들을 재생하여 상기 스피커(140)를 통해 출력하여, 상기 스피커(140)를 통해 출력되는 신호가 상기 코덱/에코 캔슬러(150)로 입력되도록 한다. The
상기 메모리(130)는 프로그램 메모리와, 데이터 메모리로 구성된다. 여기서, 상기 프로그램 메모리는 상기 음성 인식 테스트 장치를 구동시키기 위한 각종 프로 그램들을 저장하며, 상기 데이터 메모리는 상기 제어부의 제어에 따른 동작을 수행하는 중에 발생하는 데이터를 저장한다. 특히, 본 발명의 실시예에서 상기 메모리(130)는 상기 음성 인식 테스트를 위한 웨이브 파일들을 데이터 베이스(database) 형태로 저장한다. The
상기 코덱/에코 캔슬러(150)는 상기 스피커(140)를 통해 출력된 신호를 입력하여 실제 하드웨어 특성을 반영한 후 상기 마이크(160)를 통해 상기 음성 인식 모듈(110)로 입력되도록 한다.The codec / echo canceler 150 inputs a signal output through the
상기 도 1에서는 본 발명의 실시예에서의 기능을 수행하는 음성 인식 테스트 장치의 내부 구조에 대해서 설명하였으며, 다음으로 도 2를 참조하여 본 발명의 실시예에 따른 음성 인식 테스트 과정에 대해서 설명하기로 한다.In FIG. 1, an internal structure of a speech recognition test apparatus that performs a function in an embodiment of the present invention has been described. Next, a speech recognition test process according to an embodiment of the present invention will be described with reference to FIG. do.
상기 도 2는 본 발명의 실시예에 따른 음성 인식 테스트 장치에서 음성 인식 테스트 과정을 도시한 순서도이다.2 is a flowchart illustrating a speech recognition test process in the speech recognition test apparatus according to the embodiment of the present invention.
상기 도 2를 참조하면, 먼저 211단계에서 상기 음성 인식 테스트 장치의 제어부는 음성 인식 테스트 요구가 있음을 검출하면 213단계로 진행한다. 상기 213단계에서 상기 제어부는 상기 메모리(130)의 데이터 베이스에 저장되어 있는 웨이브 파일들을 검출한 후 215단계로 진행한다. 상기 215단계에서 상기 제어부는 상기 웨이브 파일들을 음성 입력 모듈(120)을 통해 재생한 후 스피커(140)를 통해 출력되도록 제어한 후 217단계로 진행한다.Referring to FIG. 2, first, in
상기 217단계에서 상기 제어부는 상기 스피커(140)를 통해 출력된 신호를 코덱/에코 캔슬러(150)로 입력되도록 하고, 상기 코덱/에코 캔슬러(150)를 통한 신호 가 마이크(160)를 통해 음성 인식 모듈(110)로 입력되도록 제어하고 219단계로 진행한다. 상기 219단계에서 상기 제어부는 상기 음성 인식 모듈(110)이 상기 마이크(160)를 통해 입력된 신호를 음성 인식하도록 제어하고 221단계로 진행한다. 상기 221단계에서 상기 제어부는 상기 음성 인식 모듈(110)에서 음성 인식한 음성 인식 테스트 결과를 출력하고 종료한다.In
한편 본 발명의 상세한 설명에서는 구체적인 실시예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 안되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.Meanwhile, in the detailed description of the present invention, specific embodiments have been described, but various modifications are possible without departing from the scope of the present invention. Therefore, the scope of the present invention should not be limited to the described embodiments, but should be defined not only by the scope of the following claims, but also by the equivalents of the claims.
상술한 바와 같은 본 발명은, 온라인 음성 인식 테스트 방식과 오프라인 음성 인식 테스트 방식을 결합한 복합 방식의 음성 인식 테스트 방식을 새롭게 제안하여 객관적이면서도 연속적인 음성 인식 테스트를 가능하게 함과 동시에, 하드웨어 특성을 반영한 음성 인식 테스트를 가능하게 한다는 이점을 가진다.As described above, the present invention newly proposes a complex speech recognition test method that combines an online speech recognition test method and an offline speech recognition test method to enable an objective and continuous speech recognition test and to reflect hardware characteristics. It has the advantage of enabling speech recognition testing.
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040063462A KR20060014773A (en) | 2004-08-12 | 2004-08-12 | Apparatus and method for testing speech recognition |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040063462A KR20060014773A (en) | 2004-08-12 | 2004-08-12 | Apparatus and method for testing speech recognition |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20060014773A true KR20060014773A (en) | 2006-02-16 |
Family
ID=37123673
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040063462A KR20060014773A (en) | 2004-08-12 | 2004-08-12 | Apparatus and method for testing speech recognition |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20060014773A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110310664A (en) * | 2019-06-21 | 2019-10-08 | 深圳壹账通智能科技有限公司 | The test method and relevant device of equipment decrease of noise functions |
CN111798852A (en) * | 2019-06-27 | 2020-10-20 | 深圳市豪恩声学股份有限公司 | Voice wake-up recognition performance test method, device and system and terminal equipment |
-
2004
- 2004-08-12 KR KR1020040063462A patent/KR20060014773A/en not_active Application Discontinuation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110310664A (en) * | 2019-06-21 | 2019-10-08 | 深圳壹账通智能科技有限公司 | The test method and relevant device of equipment decrease of noise functions |
CN111798852A (en) * | 2019-06-27 | 2020-10-20 | 深圳市豪恩声学股份有限公司 | Voice wake-up recognition performance test method, device and system and terminal equipment |
CN111798852B (en) * | 2019-06-27 | 2024-03-29 | 深圳市豪恩声学股份有限公司 | Voice wakeup recognition performance test method, device, system and terminal equipment |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11887582B2 (en) | Training and testing utterance-based frameworks | |
CN109949783A (en) | Song synthetic method and system | |
JP5753869B2 (en) | Speech recognition terminal and speech recognition method using computer terminal | |
US10997965B2 (en) | Automated voice processing testing system and method | |
TWI590228B (en) | Voice control system, electronic device having the same, and voice control method | |
US20210243528A1 (en) | Spatial Audio Signal Filtering | |
CN110136749A (en) | The relevant end-to-end speech end-point detecting method of speaker and device | |
JP2019507362A (en) | Speech re-recognition using an external data source | |
WO2020014890A1 (en) | Accent-based voice recognition processing method, electronic device and storage medium | |
KR20180012639A (en) | Voice recognition method, voice recognition device, apparatus comprising Voice recognition device, storage medium storing a program for performing the Voice recognition method, and method for making transformation model | |
JP2012163692A (en) | Voice signal processing system, voice signal processing method, and voice signal processing method program | |
KR101571746B1 (en) | Appratus for determining similarity and operating method the same | |
KR20060014773A (en) | Apparatus and method for testing speech recognition | |
JP7481488B2 (en) | Automated Assistants Using Audio Presentation Dialogue | |
US11710476B2 (en) | System and method for automatic testing of conversational assistance | |
JP2019113636A (en) | Voice recognition system | |
Ramanan et al. | Eliminating data collection bottleneck for wake word engine training using found and synthetic data | |
KR20200058612A (en) | Artificial intelligence speaker and talk progress method using the artificial intelligence speaker | |
KR20220029877A (en) | Apparatus for taking minutes and method thereof | |
CN113485914B (en) | Vehicle-mounted voice SDK testing method, device and system | |
KR102344618B1 (en) | Apparatus for quality evaluation of voice recognition, and control method thereof | |
CN114822492B (en) | Speech synthesis method and device, electronic equipment and computer readable storage medium | |
US20230395047A1 (en) | Audio analysis method, audio analysis system and program | |
EP1426924A1 (en) | Speaker recognition for rejecting background speakers | |
CN117292705A (en) | Audio processing method, device, electronic equipment and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |