KR102368193B1 - Method and apparatus for verifying voice recognition using voice synthesis - Google Patents

Method and apparatus for verifying voice recognition using voice synthesis Download PDF

Info

Publication number
KR102368193B1
KR102368193B1 KR1020180130230A KR20180130230A KR102368193B1 KR 102368193 B1 KR102368193 B1 KR 102368193B1 KR 1020180130230 A KR1020180130230 A KR 1020180130230A KR 20180130230 A KR20180130230 A KR 20180130230A KR 102368193 B1 KR102368193 B1 KR 102368193B1
Authority
KR
South Korea
Prior art keywords
recognition function
voice recognition
voice
test
verifying
Prior art date
Application number
KR1020180130230A
Other languages
Korean (ko)
Other versions
KR20200049955A (en
Inventor
김인선
조용진
김종윤
이준배
Original Assignee
어니컴 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 어니컴 주식회사 filed Critical 어니컴 주식회사
Priority to KR1020180130230A priority Critical patent/KR102368193B1/en
Publication of KR20200049955A publication Critical patent/KR20200049955A/en
Application granted granted Critical
Publication of KR102368193B1 publication Critical patent/KR102368193B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

음성합성을 이용한 음성인식기능 검증 방법 및 장치를 제시하며, 일 실시예에 따르면, 음성합성을 이용한 음성인식기능 검증 장치에 있어서, 상기 음성인식기능을 검증에 이용되는 정보를 획득하는 입출력부, 획득된 정보에 기초하여 상기 음성인식기능을 검증하는 테스트케이스를 생성하고, 생성된 테스트케이스에 따라 상기 음성인식기능을 검증하는 제어부를 포함할 수 있다. A method and apparatus for verifying a speech recognition function using speech synthesis are provided, and according to an embodiment, in the apparatus for verifying a speech recognition function using speech synthesis, an input/output unit for obtaining information used for verifying the speech recognition function; and a control unit for generating a test case for verifying the voice recognition function based on the obtained information, and for verifying the voice recognition function according to the generated test case.

Description

음성합성을 이용한 음성인식기능 검증 방법 및 장치{METHOD AND APPARATUS FOR VERIFYING VOICE RECOGNITION USING VOICE SYNTHESIS}Method and apparatus for verifying speech recognition function using speech synthesis

본 명세서에서 개시되는 실시예들은 음성합성을 이용한 음성인식기능 검증 방법 및 장치에 관한 것으로, 보다 상세하게는 단말기의 스피커에서 나오는 음성을 단말의 마이크로 재입력 받아 음성인식 기능을 검증하는 방법 및 장치에 관한 것이다.Embodiments disclosed in the present specification relate to a method and apparatus for verifying a voice recognition function using voice synthesis, and more particularly, to a method and apparatus for verifying a voice recognition function by re-inputting a voice from a speaker of the terminal into the microphone of the terminal. it's about

최근 들어 음성을 이용한 기기의 제어를 하는 방법이 보편화되면서 사용자의 음성을 정확하게 인식하는 기술이 중요하게 되었다.Recently, as a method of controlling a device using a voice has become common, a technique for accurately recognizing a user's voice has become important.

이에 따라, 음성인식기술을 개발할 때 사용자의 음성을 이용하여 실제 사용자가 의도한 것과 동일하게 기기가 동작하는지 검증하는 과정을 수행한다. Accordingly, when developing the voice recognition technology, a process of verifying whether the device operates as intended by the actual user is performed using the user's voice.

하지만 검증을 수행할 때 검증을 담당하는 담당자가 다수의 테스트 케이스를 육성으로 반복 발화함에 따라 검증수행이 어렵다는 문제점이 있으며, 동일한 테스트를 수행할 경우 검증인이 반복하여 육성을 하여야 함에 따라 검증과정을 재사용할 수 없다는 문제점이 있다. However, when performing verification, there is a problem that verification is difficult as the person in charge of verification repeatedly ignites a large number of test cases through training. The problem is that it cannot be reused.

또한, 검증 진행과정에서 각 육성에 대한 검증 결과를 정리가 어려움에 따라 업무 효율이 떨어지는 문제점이 있다. In addition, there is a problem in that work efficiency is lowered as it is difficult to organize the verification results for each training in the verification process.

관련하여 선행기술 문헌인 한국특허공개번호 제10-2012-0072539호에서는 외국어 롤플레잉 학습 서비스 제공 방법에 관한 것으로서, 서비스 제공 서버가 저장하고 있는 학습대상언어로 구성된 제1 캐릭터 및 제2 캐릭터의 일상 대화 중에서 일방 캐릭터의 대사는 서비스 제공 서버가 사용자 단말기에 전송하고 타방 캐릭터의 대사를 음성인식엔진을 이용하여 사용자 단말기로부터 전송받는 실제 발성을 통한 롤플레잉 학습 형식을 채택하고, 각각의 대사에 대하여 연습 테스트 단계 및 누적 테스트 단계를 통한 체계적인 반복 학습을 유도함으로써, 표현에 대한 장기기억을 보다 견고하게 하고, 외국어의 대화 패턴을 내면화 할 수 있도록 하며, 대화 상황에 대한 다양한 감정이입을 통해 외국어 회화의 미묘한 느낌을 체험하면서 유사한 실제 상황에서의 외국어 표현의 회상을 용이하게 할 뿐, 상술된 문제점을 해결할 수 없다.In relation to this, Korea Patent Publication No. 10-2012-0072539, a prior art document, relates to a method of providing a foreign language role-playing learning service, and the daily life of a first character and a second character composed of a learning target language stored by a service providing server During the conversation, the service providing server transmits the dialogue of one character to the user terminal and the dialogue of the other character is transmitted from the user terminal using a voice recognition engine. A role-playing learning format is adopted through actual vocalization, and each line is practiced. By inducing systematic repetitive learning through the test stage and cumulative test stage, the long-term memory of expressions is strengthened, the conversation pattern of the foreign language can be internalized, and the subtleties of foreign language conversation through various empathy for the conversation situation It only facilitates recall of foreign language expressions in similar real situations while experiencing feelings, but cannot solve the above-mentioned problems.

따라서 상술된 문제점을 해결하기 위한 기술이 필요하게 되었다.Therefore, there is a need for a technique for solving the above-mentioned problems.

한편, 전술한 배경기술은 발명자가 본 발명의 도출을 위해 보유하고 있었거나, 본 발명의 도출 과정에서 습득한 기술 정보로서, 반드시 본 발명의 출원 전에 일반 공중에게 공개된 공지기술이라 할 수는 없다.On the other hand, the above-mentioned background art is technical information that the inventor possessed for the purpose of derivation of the present invention or acquired in the process of derivation of the present invention, and it cannot be said that it is necessarily known technology disclosed to the general public before the filing of the present invention. .

본 명세서에서 개시되는 실시예들은, 음성인식을 위해 입력되는 음성을 테스트에 따라 합성하여 음성인식기능을 검증하는 음성인식기능 검증 방법 및 장치를 제시하는데 목적이 있다. Embodiments disclosed in the present specification provide a method and apparatus for verifying a voice recognition function for verifying a voice recognition function by synthesizing a voice input for voice recognition according to a test.

본 명세서에서 개시되는 실시예들은, 테스트 케이스에서 이용된 음성을 반복적으로 이용하여 음성인식기능을 검증하는 음성인식기능 검증 방법 및 장치를 제시하는데 목적이 있다. Embodiments disclosed in the present specification provide a method and apparatus for verifying a voice recognition function by repeatedly using a voice used in a test case to verify a voice recognition function.

본 명세서에서 개시되는 실시예들은, 테스트 케이스에 따른 검증 과정을 순차적으로 처리하여 처리된 과정을 실시간으로 확인할 수 있는 음성인식 기능 검증 방법 및 장치를 제시하는데 목적이 있다.Embodiments disclosed in the present specification provide a method and apparatus for verifying a voice recognition function capable of sequentially processing a verification process according to a test case and confirming the processed process in real time.

본 명세서에서 개시되는 실시예들은, 테스트 케이스에 따른 검증 결과를 문서화하는 음성인식 기능 검증 방법 및 장치를 제시하는데 있다. Embodiments disclosed in the present specification provide a method and apparatus for verifying a voice recognition function for documenting a verification result according to a test case.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 일 실시예에 따르면, 음성합성을 이용한 음성인식기능 검증 장치에 있어서, 상기 음성인식기능을 검증에 이용되는 정보를 획득하는 입출력부, 획득된 정보에 기초하여 상기 음성인식기능을 검증하는 테스트케이스를 생성하고, 생성된 테스트케이스에 따라 상기 음성인식기능을 검증하는 제어부를 포함할 수 있다. As a technical means for achieving the above-described technical problem, according to an embodiment, in the apparatus for verifying a speech recognition function using speech synthesis, an input/output unit for obtaining information used for verifying the speech recognition function, It may include a control unit that generates a test case for verifying the voice recognition function based on the test case, and verifies the voice recognition function according to the generated test case.

다른 실시예에 따르면, 음성인식기능검증장치가 음성합성을 이용한 음성인식기능 검증 방법에 있어서, 상기 음성인식기능을 검증하는 테스트에 이용되는 정보를 획득하는 단계, 획득된 정보에 기초하여 상기 음성인식기능을 검증하는 테스트케이스를 생성하는 단계 및 생성된 테스트케이스에 따라 상기 음성인식기능을 검증하는 단계를 포함할 수 있다.According to another embodiment, in a method for verifying a voice recognition function using a voice synthesis by a voice recognition function verification apparatus, acquiring information used for a test for verifying the voice recognition function, the voice recognition based on the obtained information It may include generating a test case for verifying the function and verifying the voice recognition function according to the generated test case.

또 다른 실시예에 따르면, 음성인식기능검증방법을 수행하는 프로그램이 기록된 컴퓨터 판독이 가능한 기록매체로서, 상기 음성인식기능검증방법은, 상기 음성인식기능을 검증하는 테스트에 이용되는 정보를 획득하는 단계, 획득된 정보에 기초하여 상기 음성인식기능을 검증하는 테스트케이스를 생성하는 단계 및 생성된 테스트케이스에 따라 상기 음성인식기능을 검증하는 단계를 포함할 수 있다.According to another embodiment, as a computer-readable recording medium on which a program for performing a voice recognition function verification method is recorded, the voice recognition function verification method includes obtaining information used in a test for verifying the voice recognition function step, generating a test case for verifying the voice recognition function based on the obtained information, and verifying the voice recognition function according to the generated test case.

다른 실시예에 따르면, 음성인식기능검증장치에 의해 수행되며, 음성인식기능검증장치를 수행하기 위해 기록매체에 저장된 컴퓨터프로그램으로서, 상기 음성인식기능검증방법은, 상기 음성인식기능을 검증하는 테스트에 이용되는 정보를 획득하는 단계, 획득된 정보에 기초하여 상기 음성인식기능을 검증하는 테스트케이스를 생성하는 단계 및 생성된 테스트케이스에 따라 상기 음성인식기능을 검증하는 단계를 포함할 수 있다.According to another embodiment, as a computer program performed by a voice recognition function verification device and stored in a recording medium to perform the voice recognition function verification device, the voice recognition function verification method is performed in a test for verifying the voice recognition function. The method may include obtaining information to be used, generating a test case for verifying the speech recognition function based on the obtained information, and verifying the speech recognition function according to the generated test case.

전술한 과제 해결 수단 중 어느 하나에 의하면, 음성인식을 위해 입력되는 음성을 테스트에 따라 합성하여 음성인식기능을 검증하는 음성인식기능 검증 방법 및 장치를 제시할 수 있다. According to any one of the above-described problem solving means, it is possible to present a voice recognition function verification method and apparatus for verifying the voice recognition function by synthesizing the voice input for voice recognition according to a test.

전술한 과제 해결 수단 중 어느 하나에 의하면, 테스트 케이스에서 이용된 음성을 반복적으로 이용하여 음성인식기능을 검증하는 음성인식기능 검증 방법 및 장치를 제시할 수 있다. According to any one of the above-described problem solving means, it is possible to present a method and apparatus for verifying a voice recognition function for verifying a voice recognition function by repeatedly using a voice used in a test case.

전술한 과제 해결 수단 중 어느 하나에 의하면, 테스트 케이스에 따른 검증 과정을 순차적으로 처리하여 처리된 과정을 실시간으로 확인할 수 있는 음성인식 기능 검증 방법 및 장치를 제시할 수 있다. According to any one of the above-described problem solving means, it is possible to present a method and apparatus for verifying a voice recognition function capable of sequentially processing the verification process according to the test case and confirming the processed process in real time.

전술한 과제 해결 수단 중 어느 하나에 의하면, 테스트 케이스에 따른 검증 결과를 문서화함으로써 검증결과의 배포가 용이한 음성인식 기능 검증 방법 및 장치를 제시할 수 있다. According to any one of the above-described problem solving means, it is possible to present a method and apparatus for verifying a voice recognition function that facilitates distribution of the verification result by documenting the verification result according to the test case.

개시되는 실시예들에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 개시되는 실시예들이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.Effects obtainable in the disclosed embodiments are not limited to the above-mentioned effects, and other effects not mentioned are clear to those of ordinary skill in the art to which the embodiments disclosed from the description below belong. can be understood clearly.

도 1은 일 실시예에 따른 음성인식기능검증장치를 도시한 블록도이다.
도 2 내지 도 4 는 일 실시예에 따른 음성인식기능검증방법을 설명하기 위한 순서도이다.
도 5 는 일 실시예에 따른 음성인식기능검증방법을 설명하기 위한 예시도이다.
1 is a block diagram illustrating an apparatus for verifying a voice recognition function according to an embodiment.
2 to 4 are flowcharts for explaining a method for verifying a voice recognition function according to an embodiment.
5 is an exemplary diagram for explaining a method of verifying a voice recognition function according to an embodiment.

아래에서는 첨부한 도면을 참조하여 다양한 실시예들을 상세히 설명한다. 아래에서 설명되는 실시예들은 여러 가지 상이한 형태로 변형되어 실시될 수도 있다. 실시예들의 특징을 보다 명확히 설명하기 위하여, 이하의 실시예들이 속하는 기술분야에서 통상의 지식을 가진 자에게 널리 알려져 있는 사항들에 관해서 자세한 설명은 생략하였다. 그리고, 도면에서 실시예들의 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, various embodiments will be described in detail with reference to the accompanying drawings. The embodiments described below may be modified and implemented in various different forms. In order to more clearly describe the characteristics of the embodiments, detailed descriptions of matters widely known to those of ordinary skill in the art to which the following embodiments belong are omitted. In addition, in the drawings, parts irrelevant to the description of the embodiments are omitted, and similar reference numerals are attached to similar parts throughout the specification.

명세서 전체에서, 어떤 구성이 다른 구성과 "연결"되어 있다고 할 때, 이는 ‘직접적으로 연결’되어 있는 경우뿐 아니라, ‘그 중간에 다른 구성을 사이에 두고 연결’되어 있는 경우도 포함한다. 또한, 어떤 구성이 어떤 구성을 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한, 그 외 다른 구성을 제외하는 것이 아니라 다른 구성들을 더 포함할 수도 있음을 의미한다.Throughout the specification, when a component is said to be "connected" with another component, it includes not only the case where it is 'directly connected', but also the case where it is 'connected with another component in between'. In addition, when a component "includes" a component, it means that other components may be further included, rather than excluding other components, unless otherwise stated.

이하 첨부된 도면을 참고하여 실시예들을 상세히 설명하기로 한다.Hereinafter, embodiments will be described in detail with reference to the accompanying drawings.

도 1은 일 실시예에 따른 음성인식기능검증장치(10)를 설명하기 위한 블록도이다.1 is a block diagram for explaining a voice recognition function verification apparatus 10 according to an embodiment.

음성인식기능검증장치(10)은 네트워크(N)를 통해 원격지의 서버에 접속하거나, 타 단말 및 서버와 연결 가능한 컴퓨터나 휴대용 단말기, 텔레비전, 웨어러블 디바이스(Wearable Device) 등으로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop)등을 포함하고, 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), GSM(Global System for Mobile communications), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet), 스마트폰(Smart Phone), 모바일 WiMAX(Mobile Worldwide Interoperability for Microwave Access) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다. 또한, 텔레비전은 IPTV(Internet Protocol Television), 인터넷 TV(Internet Television), 지상파 TV, 케이블 TV 등을 포함할 수 있다. 나아가 웨어러블 디바이스는 예를 들어, 시계, 안경, 액세서리, 의복, 신발 등 인체에 직접 착용 가능한 타입의 정보처리장치로서, 직접 또는 다른 정보처리장치를 통해 네트워크를 경유하여 원격지의 서버에 접속하거나 타 단말과 연결될 수 있다.The voice recognition function verification apparatus 10 may be implemented as a computer or portable terminal, a television, a wearable device, etc. that can be connected to a remote server through the network N or connectable to other terminals and servers. Here, the computer includes, for example, a laptop, a desktop, and a laptop equipped with a web browser, and the portable terminal is, for example, a wireless communication device that ensures portability and mobility. , PCS (Personal Communication System), PDC (Personal Digital Cellular), PHS (Personal Handyphone System), PDA (Personal Digital Assistant), GSM (Global System for Mobile communications), IMT (International Mobile Telecommunication)-2000, CDMA (Code) All kinds of handhelds such as Division Multiple Access)-2000, W-Code Division Multiple Access (W-CDMA), Wireless Broadband Internet (Wibro), Smart Phone, Mobile Worldwide Interoperability for Microwave Access (WiMAX), etc. It may include a (Handheld)-based wireless communication device. In addition, the television may include IPTV (Internet Protocol Television), Internet TV (Internet Television), terrestrial TV, cable TV, and the like. Furthermore, the wearable device is, for example, a type of information processing device that can be worn directly on the human body, such as a watch, glasses, accessories, clothes, shoes, etc. can be connected with

도1 을 참조하면, 일 실시예에 따른 음성인식기능검증장치(10)은, 입출력부(110), 제어부(120), 통신부(130) 및 메모리(140)를 포함할 수 있다.Referring to FIG. 1 , a voice recognition function verification apparatus 10 according to an embodiment may include an input/output unit 110 , a control unit 120 , a communication unit 130 , and a memory 140 .

입출력부(110)는 사용자로부터 입력을 수신하기 위한 입력부와, 작업의 수행 결과 또는 음성인식기능검증장치(10)의 상태 등의 정보를 표시하기 위한 출력부를 포함할 수 있다. 예를 들어, 입출력부(110)는 사용자 입력을 수신하는 조작 패널(operation panel) 및 화면을 표시하는 디스플레이 패널(display panel) 등을 포함할 수 있다.The input/output unit 110 may include an input unit for receiving an input from a user, and an output unit for displaying information such as a result of a task or the state of the voice recognition function verification apparatus 10 . For example, the input/output unit 110 may include an operation panel for receiving a user input, a display panel for displaying a screen, and the like.

구체적으로, 입력부는 키보드, 물리 버튼, 터치 스크린, 카메라 또는 마이크 등과 같이 다양한 형태의 사용자 입력을 수신할 수 있는 장치들을 포함할 수 있다. 또한, 출력부는 디스플레이 패널 또는 스피커 등을 포함할 수 있다. 다만, 이에 한정되지 않고 입출력부(110)는 다양한 입출력을 지원하는 구성을 포함할 수 있다.Specifically, the input unit may include devices capable of receiving various types of user input, such as a keyboard, a physical button, a touch screen, a camera, or a microphone. Also, the output unit may include a display panel or a speaker. However, the present invention is not limited thereto, and the input/output unit 110 may include a configuration supporting various input/output.

입출력부(110)는 음성인식기능을 검증에 이용되는 정보를 입력받을 수 있다. The input/output unit 110 may receive information used to verify the voice recognition function.

예를 들어, 입출력부(110)는 키보드를 통해 사용자로부터 음성인식기능의 검증에 이용되는 텍스트를 입력받을 수 있다. For example, the input/output unit 110 may receive text used for verification of the voice recognition function from the user through the keyboard.

또는 예를 들어, 입출력부(110)는 마이크를 통해 사용자로부터 음성인식기능의 검증에 이용되는 음성을 입력받을 수 있다. Or, for example, the input/output unit 110 may receive a voice used for verification of the voice recognition function from the user through a microphone.

그리고 입출력부(110)는 음성인식기능의 검증에 이용되는 테스트음성을 출력할 수 있고, 출력되는 테스트음성을 입력받을 수 있다.In addition, the input/output unit 110 may output a test voice used for verification of the voice recognition function, and may receive the output test voice.

예를 들어, 입출력부(110)는 후술할 제어부(120)의 제어에 따라 테스트음성을 스피커를 통해 재생할 수 있고, 스피커를 통해 재생되는 테스트음성을 마이크를 통해 입력받을 수 있다. For example, the input/output unit 110 may reproduce a test voice through a speaker under the control of the controller 120 to be described later, and may receive a test voice reproduced through the speaker through a microphone.

제어부(120)는 음성인식기능검증장치(10)의 전체적인 동작을 제어하며, CPU 등과 같은 프로세서를 포함할 수 있다. 제어부(120)는 입출력부(110)를 통해 수신한 사용자 입력에 대응되는 동작을 수행하도록 음성인식기능검증장치(10)에 포함된 다른 구성들을 제어할 수 있다.The controller 120 controls the overall operation of the voice recognition function verification apparatus 10, and may include a processor such as a CPU. The controller 120 may control other components included in the voice recognition function verification apparatus 10 to perform an operation corresponding to a user input received through the input/output unit 110 .

예를 들어, 제어부(120)는 메모리(140)에 저장된 프로그램을 실행시키거나, 메모리(140)에 저장된 파일을 읽어오거나, 새로운 파일을 메모리(140)에 저장할 수도 있다.For example, the controller 120 may execute a program stored in the memory 140 , read a file stored in the memory 140 , or store a new file in the memory 140 .

이러한 제어부(120)는 입출력부(110)를 통해 획득된 정보에 기초하여 음성인식기능을 검증하는 테스트케이스를 생성할 수 있다. The control unit 120 may generate a test case for verifying the voice recognition function based on the information obtained through the input/output unit 110 .

이에 앞서, 제어부(120)는 음성인식기능을 검증하는데 이용되는 테스트음성을 생성할 수 있다. Prior to this, the controller 120 may generate a test voice used to verify the voice recognition function.

하나의 실시예에 따라, 제어부(120)는 입출력부(110)를 통해 획득된 정보에 기초하여 테스트음성을 생성할 수 있다. According to one embodiment, the control unit 120 may generate a test voice based on information obtained through the input/output unit 110 .

예를 들어, 제어부(120)는 키보드를 통해 입력되는 텍스트를 획득할 수 있고, 획득된 텍스트에 기초하여 음성합성API를 이용하여 텍스트를 음성으로 합성하여 테스트음성을 생성하되, 합성할 음성의 옵션을 설정받아 입력된 텍스와 옵션값으로 음성을 합성하여 재생가능한 파일로 변환할 수 있다. 그리고 제어부(120)는 변환된 파일을 서버(미도시)에 전송하여 저장할 수 있다. For example, the control unit 120 may obtain text input through the keyboard, synthesize text into speech using a speech synthesis API based on the obtained text, and generate a test speech, but the option of speech to be synthesized can be set and converted into a playable file by synthesizing the voice with the input text and option values. In addition, the controller 120 may transmit and store the converted file to a server (not shown).

이때 실시예에 따라, 제어부(120)는 생성된 테스트음성을 재생할 수 있으며, 사용자가 입력한 텍스트에 대응되는 음성인지 사용자로부터 검증받을 수 있다.In this case, according to an embodiment, the controller 120 may reproduce the generated test voice, and may receive verification from the user whether the voice corresponds to the text input by the user.

다른 실시예에 따라, 제어부(120)는 사용자로부터 획득된 음성에 기초하여 테스트음성을 생성할 수 있다. According to another embodiment, the controller 120 may generate a test voice based on a voice acquired from the user.

예를 들어, 제어부(120)는 입출력부(110)의 마이크를 통해 사용자로부터 음성을 녹음할 수 있고, 녹음된 음성에 기초하여 테스트음성을 생성할 수 있다. For example, the controller 120 may record a voice from the user through the microphone of the input/output unit 110 , and may generate a test voice based on the recorded voice.

그리고 제어부(120)는 생성된 테스트음성에 기초하여 음성인식기능을 검증하는 테스트케이스를 생성할 수 있다. In addition, the controller 120 may generate a test case for verifying the voice recognition function based on the generated test voice.

예를 들어, 제어부(120)는 사용자로부터 테스트케이스의 명칭인 ‘네비게이션’을 획득할 수 있고, ‘네비게이션 실행’ 테스트음성을 매칭하여 테스트케이스를 생성할 수 있다. For example, the control unit 120 may obtain 'navigation', which is the name of the test case from the user, and may generate a test case by matching the 'navigation execution' test voice.

이때, 제어부(120)는 실시예에 따라 생성된 테스트케이스를 서버(미도시)에 저장할 수 있다. In this case, the controller 120 may store the test case generated according to the embodiment in a server (not shown).

그리고 제어부(120)는 사용자로부터 적어도 하나의 테스트케이스를 순차적으로 수행하여 음성인식기능을 검증하는 시나리오인 프로젝트를 설정받을 수 있다. In addition, the control unit 120 may receive from the user a project that is a scenario in which the voice recognition function is verified by sequentially performing at least one test case.

예를 들어, 제어부(120)는 사용자로부터 프로젝트명칭을 입력받을 수 있고, 입력된 프로젝트명칭에 포함될 적어도 하나의 테스트케이스를 선택받을 수 있다. 이때 제어부(120)는 사용자에게 기 생성된 테스트케이스를 검색할 수 있도록 검색기능을 제공할 수 있다. For example, the control unit 120 may receive a project name input from the user, and may receive selection of at least one test case to be included in the input project name. In this case, the controller 120 may provide a search function to the user to search for the previously created test case.

그리고 제어부(120)는 음성인식기능의 정상동작결과인 정상결과정보를 획득하여 테스트케이스에 매칭할 수 있다. In addition, the control unit 120 may obtain normal result information, which is a normal operation result of the voice recognition function, and match the test case.

예를 들어, 제어부(120)는 네비게이션 실행에 대한 테스트케이스를 생성하기 위해, 테스트음성인 ‘네비게이션 실행’ 에 기초하여 정상결과정보인 네비게이션 앱의 실행에 대한 반환값을 테스트케이스에 매칭할 수 있다.For example, in order to generate a test case for navigation execution, the control unit 120 may match the return value for the execution of the navigation app, which is the normal result information, to the test case based on the test voice 'navigation execution'. .

이후, 제어부(120)는 프로젝트에 따라 적어도 하나의 테스트케이스를 순차적으로 수행하여 음성인식기능을 검증할 수 있다. Thereafter, the controller 120 may verify the voice recognition function by sequentially performing at least one test case according to a project.

이를 위해, 제어부(120)는 테스트케이스에 따라 테스트음성을 입출력부(110)를 통해 출력할 수 있고, 출력되는 테스트음성을 입출력부(110)를 통해 획득할 수 있다. To this end, the control unit 120 may output a test voice through the input/output unit 110 according to the test case, and may acquire the output test voice through the input/output unit 110 .

그리고 제어부(120)는 획득된 테스트음성을 이용하여 음성인식기능을 검증할 수 있다. In addition, the controller 120 may verify the voice recognition function by using the acquired test voice.

이때, 제어부(120)는 음성인식기능을 검증하는 동안 백그라운드를 통해 음성기능을 검증할 앱이 동시에 실행되도록 할 수 있다. In this case, the controller 120 may cause the app to verify the voice function to be simultaneously executed through the background while the voice recognition function is verified.

예를 들어, 제어부(120)는 음성인식기능을 검증하는 앱과 검증대상이 동시에 실행되어 유지되도록 사용자에게 백그라운드 서비스의 인터페이스를 제공할 수 있다.For example, the controller 120 may provide an interface of the background service to the user so that the app for verifying the voice recognition function and the verification target are simultaneously executed and maintained.

그리고 제어부(120)는 테스트케이스를 순차적으로 실행하면서 테스트케이스에 매칭된 정상결과정보에 기초하여 음성인식기능의 테스트결과를 분석할 수 있다. In addition, the control unit 120 may analyze the test result of the voice recognition function based on the normal result information matched to the test case while sequentially executing the test case.

예를 들어, 제어부(120)는 테스트케이스를 사용자가 설정한 순서대로 음성인식기능을 자동으로 검증할 수 있고, 테스트음성에 따라 출력되는 테스트결과와 정상결과정보를 비교하여 참 또는 거짓으로 자동으로 테스트결과를 분석할 수 있다. For example, the control unit 120 may automatically verify the voice recognition function in the order set by the user in the test case, and compare the test result output according to the test voice with the normal result information to automatically set the test case to true or false. Test results can be analyzed.

이후, 제어부(120)는 분석된 테스트결과에 기초하여 음성인식기능에 대한 검증결과를 제공할 수 있다. Thereafter, the controller 120 may provide a verification result for the voice recognition function based on the analyzed test result.

예를 들어, 제어부(120)는 테스트케이스 수행 후 검증결과값을 입력받아 서버에 저장할 수 있고, 검증결과를 문서로 출력하여 사용자에게 제공할 수 있다. For example, the control unit 120 may receive a verification result value after performing the test case and store it in the server, and may output the verification result as a document and provide it to the user.

통신부(130)는 다른 디바이스 또는 네트워크와 유무선 통신을 수행할 수 있다. 이를 위해, 통신부(130)는 다양한 유무선 통신 방법 중 적어도 하나를 지원하는 통신 모듈을 포함할 수 있다. 예를 들어, 통신 모듈은 칩셋(chipset)의 형태로 구현될 수 있다.The communication unit 130 may perform wired/wireless communication with other devices or networks. To this end, the communication unit 130 may include a communication module supporting at least one of various wired and wireless communication methods. For example, the communication module may be implemented in the form of a chipset.

통신부(130)가 지원하는 무선 통신은, 예를 들어 Wi-Fi(Wireless Fidelity), Wi-Fi Direct, 블루투스(Bluetooth), UWB(Ultra Wide Band) 또는 NFC(Near Field Communication) 등일 수 있다. 또한, 통신부(130)가 지원하는 유선 통신은, 예를 들어 USB 또는 HDMI(High Definition Multimedia Interface) 등일 수 있다.The wireless communication supported by the communication unit 130 may be, for example, Wireless Fidelity (Wi-Fi), Wi-Fi Direct, Bluetooth, Ultra Wide Band (UWB), or Near Field Communication (NFC). Also, wired communication supported by the communication unit 130 may be, for example, USB or High Definition Multimedia Interface (HDMI).

메모리(140)에는 파일, 어플리케이션 및 프로그램 등과 같은 다양한 종류의 데이터가 설치 및 저장될 수 있다. 제어부(120)는 메모리(140)에 저장된 데이터에 접근하여 이를 이용하거나, 또는 새로운 데이터를 메모리(140)에 저장할 수도 있다. 또한, 제어부(120)는 메모리(140)에 설치된 프로그램을 실행할 수도 있다. 도 1을 참조하면, 메모리(140)에는 음성인식기능검증을 수행하기 위한 프로그램이 설치될 수 있다.Various types of data such as files, applications, and programs may be installed and stored in the memory 140 . The controller 120 may access and use data stored in the memory 140 , or may store new data in the memory 140 . Also, the controller 120 may execute a program installed in the memory 140 . Referring to FIG. 1 , a program for performing voice recognition function verification may be installed in the memory 140 .

도 2 는 일 실시예에 따른 음성인식기능검증방법을 설명하기 위한 순서도이다. 2 is a flowchart illustrating a method for verifying a voice recognition function according to an embodiment.

도 2 내지 도 4에 도시된 실시예에 따른 음성인식기능검증방법은 도 1 에 도시된 음성인식기능검증장치(10)에서 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하에서 생략된 내용이라고 하더라도 도 1 에 도시된 음성인식기능검증장치(10)에 관하여 이상에서 기술한 내용은 도 2 내지 도 4 에 도시된 실시예에 따른 음성인식기능검증방법에도 적용될 수 있다.The method for verifying the voice recognition function according to the embodiment shown in FIGS. 2 to 4 includes steps that are time-series processed by the apparatus for verifying the voice recognition function shown in FIG. 1 . Therefore, even if omitted below, the contents described above with respect to the voice recognition function verification apparatus 10 shown in FIG. 1 may also be applied to the voice recognition function verification method according to the embodiment shown in FIGS. 2 to 4 . there is.

도 5 는 도 2 내지 도 4 를 참조하여 이하에서 후술된다. 도 5 는 일 실시예에 따른 음성인식기능검증방법을 설명하기 위한 예시도로서, 음성인식기능검증장치가 구현되는 전자단말기의 화면을 통해 나타나는 화면의 일례를 도시한 것이다.FIG. 5 will be described below with reference to FIGS. 2 to 4 . 5 is an exemplary view for explaining a method for verifying a voice recognition function according to an embodiment, and shows an example of a screen displayed through a screen of an electronic terminal on which a voice recognition function verification apparatus is implemented.

도 2 는 음성인식기능검증장치(10)가 수행하는 음성인식기능검증방법을 도시한 순서도이다. 2 is a flowchart illustrating a voice recognition function verification method performed by the voice recognition function verification apparatus 10 .

도 2 를 참조하면, 음성인식기능검증장치(10)는 음성인식기능의 검증에 이용되는 정보를 획득할 수 있다(S2001). Referring to FIG. 2 , the voice recognition function verification apparatus 10 may obtain information used for verification of the voice recognition function ( S2001 ).

예를 들어, 음성인식기능검증장치(10)는 입력장치인 키보드 또는 터치패드를 통해 사용자로부터 텍스트를 획득하거나 또는 마이크를 통해 사용자의 음성을 획득할 수 있다.For example, the voice recognition function verification apparatus 10 may obtain a text from the user through a keyboard or a touch pad, which is an input device, or obtain a user's voice through a microphone.

그리고 음성인식기능검증장치(10)는 음성인식기능을 검증에 이용되는 정보로 텍스트를 획득하면, 획득된 텍스트를 이용하여 텍스트음성을 합성할 수 있다. In addition, when the speech recognition function verification apparatus 10 obtains text as information used for verifying the speech recognition function, it may synthesize a text-to-speech using the obtained text.

예를 들어, 음성인식기능검증장치(10)는 키보드를 통해 입력되는 텍스트를 획득할 수 있고, 획득된 텍스트에 기초하여 음성합성API를 이용하여 텍스트를 음성으로 합성하여 테스트음성을 생성하되, 합성할 음성의 옵션을 설정받아 입력된 텍스와 옵션값으로 음성을 합성하여 재생가능한 파일로 변환할 수 있다. For example, the voice recognition function verification apparatus 10 may acquire text input through a keyboard, and based on the acquired text, synthesize the text into a voice using a voice synthesis API to generate a test voice, but synthesize You can set the voice option to be played, synthesize the voice with the input text and option value, and convert it into a playable file.

또는 예를 들어, 음성인식기능검증장치(10)는 마이크를 통해 획득된 사용자의 음성을 테스트음성으로 변환할 수 있다. Or, for example, the voice recognition function verification apparatus 10 may convert the user's voice acquired through the microphone into a test voice.

그리고 음성인식기능검증장치(10)는 획득된 정보에 기초하여 음성인식기능을 검증하는 테스트케이스를 생성할 수 있다(S2002). And the voice recognition function verification apparatus 10 may generate a test case for verifying the voice recognition function based on the obtained information (S2002).

예를 들어, 음성인식기능검증장치(10)는 테스트케이스의 명칭인 ‘문자보내기’를 획득할 수 있고, ‘문자보내줘’ 테스트음성을 매칭하여 테스트케이스를 생성할 수 있으며, 생성된 테스트케이스를 제 3 의 서버(미도시)에 저장할 수 있다. For example, the voice recognition function verification apparatus 10 may obtain 'send text', which is the name of the test case, and generate a test case by matching the test voice of 'send text', and use the generated test case. It can be stored in a third server (not shown).

이를 통해 음성인식기능검증장치(10)는 기 생성되어 저장한 테스트케이스를 이용하여 음성인식기능검증에 이용할 수 있다. Through this, the voice recognition function verification apparatus 10 can use the previously generated and stored test case to verify the voice recognition function.

그리고 음성인식기능검증장치(10)는 생성된 테스트케이스에 따라 상기 음성인식기능을 검증할 수 있다(S2003). And the voice recognition function verification apparatus 10 may verify the voice recognition function according to the generated test case (S2003).

즉, 음성인식기능검증장치(10)는 테스트케이스를 순차적으로 수행할 수 있다. That is, the voice recognition function verification apparatus 10 may sequentially perform the test cases.

예를 들어, 음성인식기능검증장치(10)는 음성인식기능검증장치(10)에 구비된 스피커를 통해 테스트케이스에 대응되는 테스트음성을 출력할 수 있고, 스피커를 통해 출력되는 테스트음성을 음성인식기능검증장치(10)에 구비된 마이크를 통해 획득하여 음성인식기능에 대해 검증을 수행할 수 있다. For example, the voice recognition function verification device 10 may output a test voice corresponding to the test case through a speaker provided in the voice recognition function verification device 10, and the test voice output through the speaker is voice recognized. It is possible to verify the voice recognition function by acquiring it through a microphone provided in the function verification device 10 .

이때, 음성인식기능검증장치(10)는 음성인식기능을 검증하는 동안 백그라운드를 통해 음성기능을 검증할 앱이 동시에 실행되도록 할 수 있으며, 이를 위해 사용자에게 백그라운드 서비스 인터페이스를 제공할 수 있다. At this time, the voice recognition function verification apparatus 10 may allow the app to verify the voice function to be simultaneously executed through the background while the voice recognition function is verified, and for this, a background service interface may be provided to the user.

도 5 를 참조하면, 음성인식기능검증장치(10)는 음성인식기능을 검증할 네비게이션 앱(501)을 백그라운드에서 실행하면서 음성인식기능을 검증하기 위한 인터페이스(502)를 동시에 제공할 수 있다. Referring to FIG. 5 , the voice recognition function verification apparatus 10 may simultaneously provide an interface 502 for verifying the voice recognition function while executing the navigation app 501 to verify the voice recognition function in the background.

그리고 음성인식기능검증장치(10)는 테스트케이스에 매칭된 정상결과정보에 기초하여 음성인식기능의 테스트결과를 분석할 수 있다(S2004). And the voice recognition function verification apparatus 10 may analyze the test result of the voice recognition function based on the normal result information matched to the test case (S2004).

예를 들어, 음성인식기능검증장치(10)는 테스트케이스에 매칭된 정상결과정보와 테스트음성을 이용한 테스트결과를 비교할 수 있고, 결과의 동일여부에 따라 통과/실패/불가 중 어느 하나로 테스트결과를 분석할 수 있다.For example, the voice recognition function verification apparatus 10 may compare the test result using the test voice with the normal result information matched to the test case, and select the test result as either pass/fail/fail depending on whether the results are the same. can be analyzed.

그리고 음성인식기능검증장치(10)는 테스트케이스에 따른 검증결과를 서버(미도시)에 저장할 수 있다. And the voice recognition function verification apparatus 10 may store the verification result according to the test case in a server (not shown).

이하에서는 음성인식기능검증방법의 각 단계를 구체적으로 설명한다. Hereinafter, each step of the voice recognition function verification method will be described in detail.

우선, 도 3 은 음성인식기능검증장치(10)의 테스트케이스를 생성하는 실시예를 도시한 순서도이다. First, FIG. 3 is a flowchart illustrating an embodiment of generating a test case of the voice recognition function verification apparatus 10 .

도 3 을 참조하면, 음성인식기능검증장치(10)는 사용자로부터 음성인식기능검증을 위해 합성되는 음성에 대응되는 텍스트를 입력받을 수 있다(S3001).Referring to FIG. 3 , the voice recognition function verification apparatus 10 may receive a text corresponding to a voice synthesized for verification of the voice recognition function from the user ( S3001 ).

예를 들어, 음성인식기능검증장치(10)는 키보드 또는 터치화면을 통해 사용자로부터 텍스트를 입력받거나 또는 기 저장된 텍스트 중 어느 하나를 선택받을 수 있다. For example, the voice recognition function verification apparatus 10 may receive a text input from the user through a keyboard or a touch screen or may receive a selection of any one of pre-stored text.

그리고 음성인식기능검증장치(10)는 합성할 음성의 옵션을 설정받을 수 있다(S3002). In addition, the voice recognition function verification apparatus 10 may receive an option of a voice to be synthesized (S3002).

예를 들어, 음성인식기능검증장치(10)는 텍스트를 합성할 음성의 성별, 빠르기, 억양, 사투리 여부 등을 옵션으로 사용자로부터 입력받을 수 있다. For example, the voice recognition function verification apparatus 10 may receive an input from the user as an option, such as gender, speed, intonation, dialect, etc. of the voice to be synthesized text.

그리고 음성인식기능검증장치(10)는 음성을 합성하여 재생가능한 파일로 변환할 수 있다(S3003). And the voice recognition function verification apparatus 10 may synthesize the voice and convert it into a playable file (S3003).

이때, 음성인식기능검증장치(10)는 음성합성API를 이용하여 S3001 및 S3002 단계에서 각각 입력받은 텍스트와 옵션에 따라 음성을 합성할 수 있다. In this case, the voice recognition function verification apparatus 10 may synthesize a voice according to the text and options received in steps S3001 and S3002, respectively, using the voice synthesis API.

예를 들어, 음성인식기능검증장치(10)는 S3001단계에서 사용자로부터 입력받은 텍스트인 “네비게이션 실행” 에 대해 S3002단계에서 선택된 옵션 “여성, 빠르게”에 따라 여성 목소리로 빠르게 텍스트를 읽는 테스트음성을 합성할 수 있다. For example, the voice recognition function verification device 10 performs a test voice for rapidly reading text with a female voice according to the option “Female, fast” selected in step S3002 for “navigation execution”, which is the text input from the user in step S3001. can be synthesized.

그리고 음성인식기능검증장치(10)는 합성된 테스트음성을 재생가능한 파일로 생성할 수 있다. In addition, the voice recognition function verification apparatus 10 may generate the synthesized test voice as a reproducible file.

예를 들어, 음성인식기능검증장치(10)는 합성된 테스트음성을 압축코덱인 MP4 또는 WMV 등을 이용하여 파일로 변환할 수 있다. For example, the voice recognition function verification apparatus 10 may convert the synthesized test voice into a file using a compressed codec such as MP4 or WMV.

그리고 음성인식기능검증장치(10)는 합성된 테스트음성을 파일 서버에 저장할 수 있다(S3004). And the voice recognition function verification apparatus 10 may store the synthesized test voice in the file server (S3004).

예를 들어, 음성인식기능검증장치(10)는 합성된 테스트음성을 기초로 테스트케이스를 생성할 수 있고, 테스트케이스와 매칭된 테스트음성을 제 3 의 서버로 전송하여 저장할 수 있다. For example, the voice recognition function verification apparatus 10 may generate a test case based on the synthesized test voice, and transmit and store the test voice matched with the test case to a third server.

그리고 도 4 는 음성인식기능검증장치(10)가 자동으로 음성인식기능검증을 하기 위한 프로젝트를 생성하는 과정을 도시한 순서도이다. And Figure 4 is a flow chart showing the process of generating a project for automatically verifying the voice recognition function verification apparatus 10 for the voice recognition function.

우선 음성인식기능검증장치(10)는 사용자로부터 프로젝트명을 입력받을 수 있다(S4001). First, the voice recognition function verification apparatus 10 may receive a project name from the user (S4001).

예를 들어, 음성인식기능검증장치(10)는 사용자로부터 프로젝트명을 입력받거나 기 설정된 프로젝트 중 어느 하나를 선택받을 수 있다. For example, the voice recognition function verification apparatus 10 may receive an input of a project name from the user or may receive a selection of any one of a preset project.

그리고 음성인식기능검증장치(10)는 프로젝트에 포함될 테스트케이스를 선택받을 수 있다(S4002). And the voice recognition function verification apparatus 10 may receive a selection of test cases to be included in the project (S4002).

예를 들어, 음성인식기능검증장치(10)는 도 3 의 S3004 단계에서 서버에 저장된 적어도 하나의 테스트케이스에 대한 목록을 제공할 수 있고, 제공된 목록에서 적어도 하나의 테스트케이스를 선택받을 수 있다. For example, the voice recognition function verification apparatus 10 may provide a list of at least one test case stored in the server in step S3004 of FIG. 3 , and may receive a selection of at least one test case from the provided list.

이때, 음성인식기능검증장치(10)는 선택된 적어도 하나의 테스트케이스의 순서를 입력받을 수 있다. In this case, the voice recognition function verification apparatus 10 may receive the order of the selected at least one test case.

그리고 음성인식기능검증장치(10)는 정상동작결과를 테스트케이스에 매칭할 수 있다(S4003).And the voice recognition function verification apparatus 10 may match the normal operation result to the test case (S4003).

즉, 음성인식기능검증장치(10)는 테스트음성에 따라 음성인식기능을 검증할 앱에서 정상동작결과인 음성, 텍스트 또는 이미지를 포함하는 정상동작결과 파일을 선택받을 수 있다.That is, the voice recognition function verification apparatus 10 may receive a selection of a normal operation result file including a voice, text, or image that is a normal operation result from the app to verify the voice recognition function according to the test voice.

예를 들어, 음성인식기능검증장치(10)는 사용자로부터 테스트음성에 따른 정상동작화면을 획득할 수 있고, 획득된 정상동작화면을 저장할 수 있다. 그리고 음성인식기능검증장치(10)는 저장된 정상동작화면 중 어느 하나를 사용자로부터 선택받을 수 있다. For example, the voice recognition function verification apparatus 10 may obtain a normal operation screen according to a test voice from the user, and may store the obtained normal operation screen. And the voice recognition function verification apparatus 10 may receive any one of the stored normal operation screen selected from the user.

그리고 음성인식기능검증장치(10)는 프로젝트에 정상동작결과 파일을 매칭할 수 있다. And the voice recognition function verification device 10 may match the normal operation result file to the project.

이후, 음성인식기능검증장치(10)는 프로젝트에 대해 매칭된 정상동작결과 파일을 저장할 수 있다(S4004).Thereafter, the voice recognition function verification apparatus 10 may store the matched normal operation result file for the project (S4004).

이를 통해 프로젝트에 포함된 텍스트케이스가 순차적으로 수행되면서 각 텍스트케이스의 테스트결과가 정상동작결과와 동일한지 여부를 자동으로 검증되도록 할 수 있다. Through this, it is possible to automatically verify whether the test result of each text case is the same as the normal operation result while the text cases included in the project are sequentially executed.

이상의 실시예들에서 사용되는 '~부'라는 용어는 소프트웨어 또는 FPGA(field programmable gate array) 또는 ASIC 와 같은 하드웨어 구성요소를 의미하며, '~부'는 어떤 역할들을 수행한다. 그렇지만 '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '~부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램특허 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들, 및 변수들을 포함한다.The term '~ unit' used in the above embodiments means software or hardware components such as field programmable gate array (FPGA) or ASIC, and '~ unit' performs certain roles. However, '-part' is not limited to software or hardware. '~' may be configured to reside on an addressable storage medium or may be configured to refresh one or more processors. Thus, as an example, '~' refers to components such as software components, object-oriented software components, class components, and task components, and processes, functions, properties, and procedures. , subroutines, segments of program patent code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays, and variables.

구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로부터 분리될 수 있다.The functions provided in the components and '~ units' may be combined into a smaller number of elements and '~ units' or separated from additional components and '~ units'.

뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU 들을 재생시키도록 구현될 수도 있다.In addition, components and '~ units' may be implemented to play one or more CPUs in a device or secure multimedia card.

도 2 내지 도 4 를 통해 설명된 실시예에 따른 음성인식기능검증방법은 컴퓨터에 의해 실행 가능한 명령어 및 데이터를 저장하는, 컴퓨터로 판독 가능한 매체의 형태로도 구현될 수 있다. 이때, 명령어 및 데이터는 프로그램 코드의 형태로 저장될 수 있으며, 프로세서에 의해 실행되었을 때, 소정의 프로그램 모듈을 생성하여 소정의 동작을 수행할 수 있다. 또한, 컴퓨터로 판독 가능한 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터로 판독 가능한 매체는 컴퓨터 기록 매체일 수 있는데, 컴퓨터 기록 매체는 컴퓨터 판독 가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함할 수 있다.예를 들어, 컴퓨터 기록 매체는 HDD 및 SSD 등과 같은 마그네틱 저장 매체, CD, DVD 및 블루레이 디스크 등과 같은 광학적 기록 매체, 또는 네트워크를 통해 접근 가능한 서버에 포함되는 메모리일 수 있다. The method for verifying the voice recognition function according to the embodiment described with reference to FIGS. 2 to 4 may also be implemented in the form of a computer-readable medium for storing instructions and data executable by a computer. In this case, the instructions and data may be stored in the form of program codes, and when executed by the processor, a predetermined program module may be generated to perform a predetermined operation. In addition, computer-readable media can be any available media that can be accessed by a computer, and includes both volatile and nonvolatile media, removable and non-removable media. In addition, the computer-readable medium may be a computer recording medium, which is a volatile and non-volatile and non-volatile storage medium implemented in any method or technology for storage of information such as computer-readable instructions, data structures, program modules, or other data. It may include both volatile, removable and non-removable media. For example, the computer recording medium may include magnetic storage media such as HDD and SSD, optical recording media such as CD, DVD and Blu-ray disc, or accessible through a network. It may be memory included in the server.

또한 도 2 내지 도 4 를 통해 설명된 실시예에 따른 음성인식기능검증방법은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 컴퓨터 프로그램(또는 컴퓨터 프로그램 제품)으로 구현될 수도 있다. 컴퓨터 프로그램은 프로세서에 의해 처리되는 프로그래밍 가능한 기계 명령어를 포함하고, 고레벨 프로그래밍 언어(High-level Programming Language), 객체 지향 프로그래밍 언어(Object-oriented Programming Language), 어셈블리 언어 또는 기계 언어 등으로 구현될 수 있다. 또한 컴퓨터 프로그램은 유형의 컴퓨터 판독가능 기록매체(예를 들어, 메모리, 하드디스크, 자기/광학 매체 또는 SSD(Solid-State Drive) 등)에 기록될 수 있다. Also, the voice recognition function verification method according to the embodiment described with reference to FIGS. 2 to 4 may be implemented as a computer program (or computer program product) including instructions executable by a computer. The computer program includes programmable machine instructions processed by a processor, and may be implemented in a high-level programming language, an object-oriented programming language, an assembly language, or a machine language. . In addition, the computer program may be recorded in a tangible computer-readable recording medium (eg, a memory, a hard disk, a magnetic/optical medium, or a solid-state drive (SSD), etc.).

따라서 도 2 내지 도 4 를 통해 설명된 실시예에 따른 음성인식기능검증방법은 상술한 바와 같은 컴퓨터 프로그램이 컴퓨팅 장치에 의해 실행됨으로써 구현될 수 있다. 컴퓨팅 장치는 프로세서와, 메모리와, 저장 장치와, 메모리 및 고속 확장포트에 접속하고 있는 고속 인터페이스와, 저속 버스와 저장 장치에 접속하고 있는 저속 인터페이스 중 적어도 일부를 포함할 수 있다. 이러한 성분들 각각은 다양한 버스를 이용하여 서로 접속되어 있으며, 공통 머더보드에 탑재되거나 다른 적절한 방식으로 장착될 수 있다. Accordingly, the voice recognition function verification method according to the embodiment described with reference to FIGS. 2 to 4 may be implemented by executing the computer program as described above by the computing device. The computing device may include at least a portion of a processor, a memory, a storage device, a high-speed interface connected to the memory and the high-speed expansion port, and a low-speed interface connected to the low-speed bus and the storage device. Each of these components is connected to each other using various buses, and may be mounted on a common motherboard or in any other suitable manner.

여기서 프로세서는 컴퓨팅 장치 내에서 명령어를 처리할 수 있는데, 이런 명령어로는, 예컨대 고속 인터페이스에 접속된 디스플레이처럼 외부 입력, 출력 장치상에 GUI(Graphic User Interface)를 제공하기 위한 그래픽 정보를 표시하기 위해 메모리나 저장 장치에 저장된 명령어를 들 수 있다. 다른 실시예로서, 다수의 프로세서 및(또는) 다수의 버스가 적절히 다수의 메모리 및 메모리 형태와 함께 이용될 수 있다. 또한 프로세서는 독립적인 다수의 아날로그 및(또는) 디지털 프로세서를 포함하는 칩들이 이루는 칩셋으로 구현될 수 있다. Here, the processor may process a command within the computing device, such as, for example, to display graphic information for providing a graphic user interface (GUI) on an external input or output device, such as a display connected to a high-speed interface. Examples are instructions stored in memory or a storage device. In other embodiments, multiple processors and/or multiple buses may be used with multiple memories and types of memory as appropriate. In addition, the processor may be implemented as a chipset formed by chips including a plurality of independent analog and/or digital processors.

또한 메모리는 컴퓨팅 장치 내에서 정보를 저장한다. 일례로, 메모리는 휘발성 메모리 유닛 또는 그들의 집합으로 구성될 수 있다. 다른 예로, 메모리는 비휘발성 메모리 유닛 또는 그들의 집합으로 구성될 수 있다. 또한 메모리는 예컨대, 자기 혹은 광 디스크와 같이 다른 형태의 컴퓨터 판독 가능한 매체일 수도 있다. Memory also stores information within the computing device. As an example, the memory may be configured as a volatile memory unit or a set thereof. As another example, the memory may be configured as a non-volatile memory unit or a set thereof. The memory may also be another form of computer readable medium, such as, for example, a magnetic or optical disk.

그리고 저장장치는 컴퓨팅 장치에게 대용량의 저장공간을 제공할 수 있다. 저장 장치는 컴퓨터 판독 가능한 매체이거나 이런 매체를 포함하는 구성일 수 있으며, 예를 들어 SAN(Storage Area Network) 내의 장치들이나 다른 구성도 포함할 수 있고, 플로피 디스크 장치, 하드 디스크 장치, 광 디스크 장치, 혹은 테이프 장치, 플래시 메모리, 그와 유사한 다른 반도체 메모리 장치 혹은 장치 어레이일 수 있다. In addition, the storage device may provide a large-capacity storage space to the computing device. A storage device may be a computer-readable medium or a component comprising such a medium, and may include, for example, devices or other components within a storage area network (SAN), a floppy disk device, a hard disk device, an optical disk device, or a tape device, a flash memory, or other semiconductor memory device or device array similar thereto.

상술된 실시예들은 예시를 위한 것이며, 상술된 실시예들이 속하는 기술분야의 통상의 지식을 가진 자는 상술된 실시예들이 갖는 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 상술된 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.The above-described embodiments are for illustration, and those of ordinary skill in the art to which the above-described embodiments pertain can easily transform into other specific forms without changing the technical idea or essential features of the above-described embodiments. You will understand. Therefore, it should be understood that the above-described embodiments are illustrative in all respects and not restrictive. For example, each component described as a single type may be implemented in a dispersed form, and likewise components described as distributed may be implemented in a combined form.

본 명세서를 통해 보호 받고자 하는 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태를 포함하는 것으로 해석되어야 한다.The scope to be protected through this specification is indicated by the claims described below rather than the detailed description, and it should be construed to include all changes or modifications derived from the meaning and scope of the claims and their equivalents. .

10: 음성인식기능검증장치
110: 입출력부
120: 제어부
130: 통신부
140: 메모리
10: voice recognition function verification device
110: input/output unit
120: control unit
130: communication department
140: memory

Claims (15)

음성합성을 이용한 음성인식기능 검증 장치에 있어서,
상기 음성인식기능의 검증에 이용되는 정보를 획득하는 입출력부;
획득된 정보에 기초하여 상기 음성인식기능을 검증하는 테스트케이스를 생성하고, 생성된 테스트케이스에 따라 상기 음성인식기능을 검증하는 제어부를 포함하며,
상기 제어부는,
상기 입출력부를 통해 사용자로부터 수신한 텍스트 및 음성 옵션에 따라서 테스트음성을 생성하며,
상기 입출력부에 포함된 스피커를 통해 출력되는 상기 음성인식기능을 검증하는 테스트음성을 상기 입출력부에 포함된 마이크를 통해 획득하고, 상기 획득된 테스트음성을 기초로 상기 음성인식기능을 검증하며,
상기 음성 옵션은 음성을 발성하는 사람의 성별, 억양, 사투리 사용 여부 및 음성의 빠르기 중 적어도 하나를 포함하는, 음성인식기능검증장치.
In the voice recognition function verification apparatus using voice synthesis,
an input/output unit for obtaining information used for verification of the voice recognition function;
a control unit that generates a test case for verifying the voice recognition function based on the obtained information, and verifies the voice recognition function according to the generated test case,
The control unit is
A test voice is generated according to the text and voice options received from the user through the input/output unit,
Obtaining a test voice for verifying the voice recognition function output through the speaker included in the input/output unit through the microphone included in the input/output unit, and verifying the voice recognition function based on the obtained test voice,
The voice option includes at least one of gender, intonation, use of a dialect, and speed of a person who utters the voice, the voice recognition function verification device.
삭제delete 제 1 항에 있어서,
상기 제어부는,
상기 음성인식기능을 검증에 이용되는 정보로 텍스트를 획득하면, 획득된 텍스트를 이용하여 텍스트음성을 합성하는, 음성인식기능검증장치.
The method of claim 1,
The control unit is
When a text is obtained as information used for verifying the speech recognition function, the apparatus for verifying a speech recognition function is to synthesize a text speech using the obtained text.
제 1 항에 있어서,
상기 제어부는,
상기 테스트케이스에 이용되는 정보로 음성을 획득하면, 획득된 음성에 기초하여 텍스트를 생성하는, 음성인식기능검증장치.
The method of claim 1,
The control unit is
When a voice is acquired with the information used in the test case, the voice recognition function verification apparatus generates text based on the acquired voice.
제 1 항에 있어서,
상기 제어부는,
상기 테스트케이스에서 검증하는 음성인식기능의 정상동작결과인 정상결과정보를 상기 테스트케이스에 매칭하는, 음성인식기능검증장치.
The method of claim 1,
The control unit is
A voice recognition function verification apparatus for matching normal result information, which is a result of normal operation of a voice recognition function verified in the test case, to the test case.
제 1 항에 있어서,
상기 제어부는,
상기 테스트케이스를 순차적으로 수행하되, 각 테스트케이스에 매칭된 정상결과정보에 기초하여 상기 음성인식기능의 테스트결과를 분석하는, 음성인식기능검증장치.
The method of claim 1,
The control unit is
A voice recognition function verification apparatus that sequentially executes the test cases, and analyzes the test results of the voice recognition function based on normal result information matched to each test case.
제 5 항에 있어서,
상기 제어부는,
분석된 테스트결과에 기초하여 상기 음성인식기능에 대한 검증결과를 제공하는, 음성인식기능검증장치.
6. The method of claim 5,
The control unit is
A voice recognition function verification apparatus that provides a verification result for the voice recognition function based on the analyzed test result.
음성인식기능검증장치가 음성합성을 이용한 음성인식기능 검증 방법에 있어서,
상기 음성인식기능의 검증에 이용되는 정보를 획득하는 단계;
획득된 정보에 기초하여 상기 음성인식기능을 검증하는 테스트케이스를 생성하는 단계; 및
생성된 테스트케이스에 따라 상기 음성인식기능을 검증하는 단계를 포함하며,
상기 음성인식기능을 검증하는 단계는,
상기 음성인식기능검증장치의 스피커를 통해 출력되는 상기 음성인식기능을 검증하는 테스트음성을, 상기 음성인식기능검증장치의 마이크를 통해 획득하여 상기 음성인식기능을 검증하며,
상기 테스트음성은, 상기 음성인식기능검증장치가 사용자로부터 수신한 텍스트 및 음성 옵션에 따라서 생성되며,
상기 음성 옵션은 음성을 발성하는 사람의 성별, 억양, 사투리 사용 여부 및 음성의 빠르기 중 적어도 하나를 포함하는 것을 특징으로 하는, 음성인식기능검증방법.
In the voice recognition function verification method using voice synthesis, the voice recognition function verification device,
obtaining information used to verify the voice recognition function;
generating a test case for verifying the voice recognition function based on the obtained information; and
Including the step of verifying the voice recognition function according to the generated test case,
The step of verifying the voice recognition function,
Obtaining a test voice for verifying the voice recognition function output through the speaker of the voice recognition function verification device through the microphone of the voice recognition function verification device to verify the voice recognition function,
The test voice is generated according to the text and voice options received by the voice recognition function verification device from the user,
The voice option is a voice recognition function verification method, characterized in that it comprises at least one of the gender, intonation, use of a dialect, and the speed of the person voicing the voice.
삭제delete 제 8 항에 있어서,
상기 정보를 획득하는 단계는,
상기 음성인식기능을 검증에 이용되는 정보로 텍스트를 획득하면, 획득된 텍스트를 이용하여 텍스트음성을 합성하는 단계를 포함하는, 음성인식기능검증방법.
9. The method of claim 8,
The step of obtaining the information is
and when text is acquired as information used for verifying the voice recognition function, synthesizing a text voice using the acquired text.
제 8 항에 있어서,
상기 테스트케이스를 생성하는 단계는,
상기 테스트케이스에서 테스트하는 음성인식기능의 정상동작결과인 정상결과정보를 상기 테스트케이스에 매칭하는 단계를 포함하는, 음성인식기능검증방법.
9. The method of claim 8,
The step of creating the test case is
and matching normal result information, which is a result of normal operation of the voice recognition function tested in the test case, to the test case.
제 8 항에 있어서,
상기 음성인식기능을 검증하는 단계는,
상기 테스트케이스를 순차적으로 수행하되, 각 테스트케이스에 매칭된 정상결과정보에 기초하여 상기 음성인식기능의 테스트결과를 분석하는 단계를 포함하는, 음성인식기능검증방법.
9. The method of claim 8,
The step of verifying the voice recognition function,
Sequentially performing the test cases, and analyzing the test results of the voice recognition function based on normal result information matched to each test case.
제 12 항에 있어서,
상기 음성인식기능검증방법은,
분석된 테스트결과에 기초하여 상기 음성인식기능에 대한 검증결과를 제공하는 단계를 더 포함하는, 음성인식기능검증방법.
13. The method of claim 12,
The voice recognition function verification method,
Further comprising the step of providing a verification result for the voice recognition function based on the analyzed test result, the voice recognition function verification method.
컴퓨터에 제 8 항에 기재된 방법을 실행시키기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체.A computer-readable recording medium in which a program for executing the method according to claim 8 is recorded on a computer. 음성인식기능검증장치에 의해 수행되며, 제 8 항에 기재된 방법을 수행하기 위해 매체에 저장된 컴퓨터 프로그램.
A computer program stored in a medium for performing the method according to claim 8, which is performed by the voice recognition function verification apparatus.
KR1020180130230A 2018-10-29 2018-10-29 Method and apparatus for verifying voice recognition using voice synthesis KR102368193B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180130230A KR102368193B1 (en) 2018-10-29 2018-10-29 Method and apparatus for verifying voice recognition using voice synthesis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180130230A KR102368193B1 (en) 2018-10-29 2018-10-29 Method and apparatus for verifying voice recognition using voice synthesis

Publications (2)

Publication Number Publication Date
KR20200049955A KR20200049955A (en) 2020-05-11
KR102368193B1 true KR102368193B1 (en) 2022-03-02

Family

ID=70729203

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180130230A KR102368193B1 (en) 2018-10-29 2018-10-29 Method and apparatus for verifying voice recognition using voice synthesis

Country Status (1)

Country Link
KR (1) KR102368193B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112908298B (en) * 2021-01-18 2022-12-09 杭州国芯科技股份有限公司 Automatic transcription and test method in voice recognition test project

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006505002A (en) * 2002-11-02 2006-02-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Speech recognition method and system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010056804A (en) * 1999-12-16 2001-07-04 서평원 A device and a method of automatic testing for voice recognition unit
KR20130029635A (en) * 2011-09-15 2013-03-25 현대모비스 주식회사 Evaluation module for speech recognition performance and method thereof
KR101698029B1 (en) * 2015-02-13 2017-01-20 어니컴 주식회사 System and method for automatic application test using script

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006505002A (en) * 2002-11-02 2006-02-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Speech recognition method and system

Also Published As

Publication number Publication date
KR20200049955A (en) 2020-05-11

Similar Documents

Publication Publication Date Title
Zhang et al. Comparing acoustic analyses of speech data collected remotely
US10847156B2 (en) Assembled voice interaction
US20200366959A1 (en) Sensitivity assessment for media production using artificial intelligence
KR102356623B1 (en) Virtual assistant electronic device and control method thereof
KR101986307B1 (en) Method and system of attention memory for locating an object through visual dialogue
KR102385899B1 (en) Conversational agent system and method based on user emotion
US20170155872A1 (en) Method and device for audio/video sharing
KR102368193B1 (en) Method and apparatus for verifying voice recognition using voice synthesis
US11893813B2 (en) Electronic device and control method therefor
KR102116395B1 (en) Apparatus and method for testing application
KR20200006027A (en) Apparatus and method for collecting user information
JP7243106B2 (en) Correction candidate presentation method, correction candidate presentation program, and information processing apparatus
KR102027560B1 (en) Appratus and method for tagging metadata
KR102273334B1 (en) Method and apparatus for learning neural network using multi channel image
CN110245068A (en) Automated testing method, device and the computer equipment of the H5 page
KR20180023864A (en) Apparatus and method for creating image contents
KR102622350B1 (en) Electronic apparatus and control method thereof
KR102176622B1 (en) Voice recognition apparatus and method for measuring confidence thereof
KR102048502B1 (en) Generating method for foreign language study content and apparatus thereof
KR102201074B1 (en) Method and system of goal-oriented dialog based on information theory
KR102108205B1 (en) Error detecting method based on scene for smart device application and apparatus thereof
US20230110006A1 (en) Electronic apparatus and controlling method thereof
US20240013790A1 (en) Method and system of detecting and improving real-time mispronunciation of words
Hashemi AutoVisual Fusion Suite: A Comprehensive Evaluation of Image Segmentation and Voice Conversion Tools on HuggingFace Platform
JP7159756B2 (en) Audio playback interval control method, audio playback interval control program, and information processing device

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant