KR102344628B1 - 자동화테스트장치 및 그 동작 방법 - Google Patents
자동화테스트장치 및 그 동작 방법 Download PDFInfo
- Publication number
- KR102344628B1 KR102344628B1 KR1020190149797A KR20190149797A KR102344628B1 KR 102344628 B1 KR102344628 B1 KR 102344628B1 KR 1020190149797 A KR1020190149797 A KR 1020190149797A KR 20190149797 A KR20190149797 A KR 20190149797A KR 102344628 B1 KR102344628 B1 KR 102344628B1
- Authority
- KR
- South Korea
- Prior art keywords
- sound source
- test
- radial arrangement
- arrangement structure
- voice
- Prior art date
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 117
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000004891 communication Methods 0.000 claims abstract description 56
- 230000007613 environmental effect Effects 0.000 claims abstract description 28
- 230000000694 effects Effects 0.000 claims description 17
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 238000003786 synthesis reaction Methods 0.000 claims description 5
- 238000011017 operating method Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 12
- 238000012795 verification Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 229920006227 ethylene-grafted-maleic anhydride Polymers 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 125000003345 AMP group Chemical group 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/34—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means
- H04R1/345—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means for loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/001—Monitoring arrangements; Testing arrangements for loudspeakers
- H04R29/002—Loudspeaker arrays
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
Abstract
본 발명은 음성대화기기의 음성 인식 성능을 검증하기 위한 테스트음원(음성명령, 환경소음 등)의 재생 방향 및 거리 감 제어를 가능하게 하는 자동화테스트장치 및 그 동작 방법에 관한 것이다.
Description
본 발명은 음성대화기기의 음성 인식 성능을 검증하기 위한 테스트음원(음성명령, 환경소음 등)의 재생 방향 및 거리 감 제어를 가능하게 하는 방안에 관한 것이다.
음성 인식 기술은 대표적인 HMI(Human Machine Interface) 기술 중의 하나로서 그 적용 처가 날로 확장되고 있다.
최근에는 통신 서비스와 방송 서비스가 결합된 양방향 방송 서비스인 IPTV(internet protocol television) 서비스에서도 이러한 음성 인식 기술이 채택되어, 예컨대, AI 스피커, 및 AI 셋탑박스(Set-Top Box) 등이 음성대화기기로서 이용되고 있다.
이러한, 음성대화기기의 경우 음성명령뿐만 아니라 다양한 환경소음이 함께 유입될 수 있으며, 더욱이 인접한 기기로부터의 재생 소리(예: TV 소리, 음악 등) 마저도 음반사에 의해 소음으로 유입될 가능성이 크다.
따라서, 음성대화기기에는 이러한 소음들을 제거하고 사용자의 음성명령에만 집중할 수 있는 기술이 필수적이며, Multi Array Microphone에 기반한 Beam Forming 기술 등을 적용하여 지속적으로 인식률 개선이 진행되고 있다.
헌데, 음성대화기기의 상용화를 위해선 해당 기기가 제공하는 음성 인식 성능에 대한 검증이 우선되어야 하는 반면, 기존에는 검증 과정에서 음성명령과 환경소음을 여러 방향에서 재생하기 위해 스피커를 수작업으로 배치하는 등의 다소 비 효율적인 검증 방식이 적용되고 있는 실정이다.
이에, 본 발명에서는 음성대화기기의 음성 인식 성능 검증을 위한 새로운 방안을 제안하고자 한다.
본 발명은 상기한 사정을 감안하여 창출된 것으로서, 본 발명에서 도달하고자 하는 목적은, 음성대화기기의 음성 인식 성능을 검증하기 위한 테스트음원(음성명령, 환경소음 등)의 재생 방향 및 거리 감 제어를 가능하게 하는데 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 자동화테스트장치는, 기 저장된 음원 목록으로부터 음성명령, 및 상기 음성명령과의 동시 재생을 위한 환경소음을 선택하여 음성대화기기를 테스트하기 위한 테스트음원을 생성하는 음원편집부; 및 상기 음성대화기기에 대해 스피커가 분산 배치된 테스트플레이트에서 상기 테스트음원이 증폭되어 출력되는 스피커를 선택하기 위한 출력경로를 결정하는 출력제어부를 포함하는 것을 특징으로 한다.
구체적으로, 상기 음원편집부는, 상기 음원 목록으로부터 선택되는 2 이상의 음원을 하나의 음원으로 합성하는 음원합성기능, 및 상기 음원 목록으로부터 선택되는 음원에 대해 특정 주파수 대역의 이득(Gain) 값의 조절하고 반향 효과를 부가하여 소리의 거리감을 구현하는 거리조절기능 중 적어도 하나를 기초로 상기 테스트음원을 생성할 수 있다.
구체적으로, 상기 테스트플레이트는, 상기 음성대화기기를 중심으로 한 특정 각도 단위로 각각의 스피커가 배치된 방사형 배치구조를 포함할 수 있다.
구체적으로, 상기 테스트플레이트는, 상기 방사형 배치구조의 중심에서 회전하는 회전판을 더 포함하며, 상기 출력제어부는, 상기 회전판을 회전 제어하여 상기 회전판 위에서 상기 방사형 배치구조의 외곽을 향하는 상기 음성대화기기의 지향 방향을 변경할 수 있다.
구체적으로, 상기 테스트플레이트는, 상기 방사형 배치구조로 배치된 스피커와는 별도로, 상기 방사형 배치구조의 외곽에서 상기 음성명령과 매칭되는 테스트음원이 재생되는 발화음성스피커를 더 포함하며, 상기 출력제어부는, 상기 방사형 배치구조의 외곽에서 상기 방사형 배치구조의 중심에 위치한 상기 음성대화기기를 향하는 상기 발황음성스피커의 지향 방향을 회전 제어할 수 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 자동화테스트장치의 동작 방법은, 기 저장된 음원 목록으로부터 음성명령, 및 상기 음성명령과의 동시 재생을 위한 환경소음을 선택하여 음성대화기기를 테스트하기 위한 테스트음원을 생성하는 음원편집단계; 및 상기 음성대화기기에 대해 스피커가 분산 배치된 테스트플레이트에서 상기 테스트음원이 증폭되어 출력되는 스피커를 선택하기 위한 출력경로를 결정하는 출력제어단계를 포함하는 것을 특징으로 한다.
구체적으로, 상기 음원편집단계는, 상기 음원 목록으로부터 선택되는 2 이상의 음원을 하나의 음원으로 합성하는 음원합성기능, 및 상기 음원 목록으로부터 선택되는 음원에 대해 특정 주파수 대역의 이득(Gain) 값의 조절하고 반향 효과를 부가하여 소리의 거리감을 구현하는 거리조절기능 중 적어도 하나를 기초로 상기 테스트음원을 생성할 수 있다.
구체적으로, 상기 테스트플레이트는, 상기 음성대화기기를 중심으로 한 특정 각도 단위로 각각의 스피커가 배치된 방사형 배치구조를 포함할 수 있다.
구체적으로, 상기 테스트플레이트는, 상기 방사형 배치구조의 중심에서 회전하는 회전판을 더 포함하며, 상기 출력제어단계는, 상기 회전판을 회전 제어하여 상기 회전판 위에서 상기 방사형 배치구조의 외곽을 향하는 상기 음성대화기기의 지향 방향을 변경할 수 있다.
구체적으로, 상기 테스트플레이트는, 상기 방사형 배치구조로 배치된 스피커와는 별도로, 상기 방사형 배치구조의 외곽에서 상기 음성명령과 매칭되는 테스트음원이 재생되는 발화음성스피커를 더 포함하며, 상기 출력제어단계는, 상기 방사형 배치구조의 외곽에서 상기 방사형 배치구조의 중심에 위치한 상기 음성대화기기를 향하는 상기 발황음성스피커의 지향 방향을 회전 제어할 수 있다.
이에, 본 발명에 따른 자동화테스트장치 및 그 동작 방법에 의하면, 테스트음원(음성명령, 환경소음 등)의 재생 방향 및 거리 감 제어를 통해서 음성대화기기(100)의 음성 인식 성능 검증함으로써, 검증 결과의 정확도 및 검증 과정의 효율성을 제고할 수 있다.
도 1은 본 발명의 일 실시예에 따른 음성 인식 성능 검증을 위한 자동화 테스트 환경을 설명하기 위한 예시도.
도 2는 본 발명의 일 실시예에 따른 자동화테스트장치의 개략적인 구성도.
도 3 내지 도 5는 본 발명의 일 실시예에 따른 테스트플레이트의 구조를 설명하기 위한 예시도.
도 6은 본 발명의 일 실시예에 따른 자동화테스트장치의 동작 방법을 설명하기 위한 순서도.
도 2는 본 발명의 일 실시예에 따른 자동화테스트장치의 개략적인 구성도.
도 3 내지 도 5는 본 발명의 일 실시예에 따른 테스트플레이트의 구조를 설명하기 위한 예시도.
도 6은 본 발명의 일 실시예에 따른 자동화테스트장치의 동작 방법을 설명하기 위한 순서도.
이하, 첨부된 도면을 참조하여 본 발명의 일 실시예에 대하여 설명한다.
도 1은 본 발명의 일 실시예에 따른 음성 인식 성능 검증을 위한 자동화 테스트 환경을 개략적으로 보여주고 있다.
도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 자동화 테스트 환경은, 음성대화기기(DUT, Device Under TEST: 100)의 음성 인식 성능 검증을 위한 자동화테스트장치(200)를 포함한다.
이러한, 자동화테스트장치(200)는 테스트음원 재생을 위해 음성대화기기(100)에 대해서 스피커가 분산 배치되는 장비인 테스트플레이를 통해 음성대화기기(100)의 음성 인식 성능을 검증(테스트)하는 장치를 일컫는다.
이러한, 자동화테스트장치(200)는 예컨대, 컴퓨터 시스템에 설치되는 프로그램 형태로도 구현되거나, 유무선 통신망을 통해 접속 가능한 서버의 형태로 구현될 수 있다.
참고로, 자동화테스트장치(200)가 서버의 형태로 구현되는 경우에는, 예컨대, 웹 서버, 데이터베이스 서버, 프록시 서버 등의 형태로 구현될 수 있으며, 네트워크 부하 분산 메커니즘, 내지 서비스 장치가 인터넷 또는 다른 네트워크 상에서 동작할 수 있도록 하는 다양한 소프트웨어 중 하나 이상이 설치될 수 있으며, 이를 통해 컴퓨터화된 시스템으로도 구현될 수 있다.
이처럼 본 발명의 일 실시예에 따른 자동화 테스트 환경에서는, 전술한 자동화테스트장치(200)를 통해 음성대화기기(100)의 음성 인식 성능을 검증(테스트)할 수 있는데, 이하에서는 이를 실현하기 위한 자동화테스트장치(200)의 구성에 대해 보다 구체적으로 설명하기로 한다.
도 2는 본 발명의 일 실시예에 따른 자동화테스트장치(200)의 구성을 개략적으로 보여주고 있다.
도 2에 도시된 바와 같이, 본 발명의 일 실시예에 따른 자동화테스트장치(200)는 음원저장소(210), 테스트음원을 생성하는 음원편집부(220), 및 테스트음원의 출력(재생)을 제어하는 출력제어부(230)를 포함하는 구성을 가질 수 있다.
또한, 본 발명의 일 실시예에 따른 자동화테스트장치(200)는 전술한 각 구성을 제어하기 위한 구성인 제어부(240)를 더 포함할 수 있다.
이러한, 자동화테스트장치(200)의 구성 전체 내지는 적어도 일부는 하드웨어 모듈 형태 또는 소프트웨어 모듈 형태로 구현되거나, 내지는 하드웨어 모듈과 소프트웨어 모듈이 조합된 형태로도 구현될 수 있다.
여기서, 소프트웨어 모듈이란, 예컨대, 자동화테스트장치(200) 내에서 연산을 제어하는 프로세서에 의해 실행되는 명령어로 이해될 수 있으며, 이러한 명령어는 자동화테스트장치(200) 내 메모리에 탑재된 어플리케이션의 형태를 가질 수 있을 것이다.
이상, 본 발명의 일 실시예에 따른 자동화테스트장치(200)는 전술한 구성을 통해서, 음성대화기기(100)의 음성 인식 성능을 검증하기 위한 테스트음원(음성명령, 환경소음 등)의 재생 방향 및 거리 감을 제어할 수 있는데, 이하에서는 이를 실현하기 위한 자동화테스트장치(200) 내 각 구성에 대해 보다 구체적으로 설명하기로 한다.
음원편집부(220)는 테스트음원을 생성하는 기능을 수행한다.
보다 구체적으로, 음원편집부(220)는 음원저장소(210)에 기 저장된 음원 목록으로부터 음성명령 및 환경소음을 선택하여 음성대화기기(100)를 테스트하기 위한 테스트음원을 생성하게 된다.
이때, 음원편집부(220)는 음원 목록으로부터 선택되는 2 이상의 음원을 하나의 음원으로 합성하는 음원합성기능, 및 음원 목록으로부터 선택되는 음원에 대해 특정 주파수 대역의 이득(Gain) 값의 조절하고 반향 효과를 부가하여 소리의 거리감을 구현하는 거리조절기능 중 적어도 하나를 이용하여 테스트음원을 생성할 수 있다.
이를 위해, 음원편집부(220)는 2 이상의 음원을 하나의 음원으로 합성하는 선택적 MUX부, 특정 주파수대역의 Gain값을 조정할 수 있는 이퀼라이저, 반향효과를 부가할 수 있는 반향효과부와, 그리고 이퀼라이저와 반향효과 특성을 관리하는 특성정보 관리DB를 포함할 수 있다.
여기서, 이퀄라이저, 및 반향효과부는 전달되는 거리에 따라 주파수대역별 감쇄율이 다르고, 파동의 산란에 따라 소리와 함께 전달되는 반향음의 크기와 지연속도도 달라지게 된다는 소리의 특성을 활용하여, 특정 주파수대역의 Gain값을 조정하고 반향효과를 부가할 수 있는 기능을 탑재하여 소리의 거리감을 구현할 수 있는 것이다.
또한, 특성정보 관리 DB는 거리에 따른 주파수대역별 감쇄율, 반향음 크기 등의 관계를 저장하는 저장소 역할을 한다.
한편, 음원저장소(210)는 전술한 바와 같이, 음성명령 및 환경소음에 해당하는 음원들을 저장하며, 특히 TV방송, 라디오 등과 같이 실시간으로 전송되는 소리도 실시간으로 전달받아 환경소음으로 인식 및 저장할 수 있다.
출력제어부(230)는 테스트음원의 출력을 제어하는 기능을 수행한다.
보다 구체적으로, 출력제어부(230)는 테그트음원 생성이 완료되면, 음성대화기기(10)에 대해 스피커가 분산 배치된 테스트플레이트(10)에서 테스트음원이 증폭되어 출력되는 스피커를 선택하기 위한 출력경로를 결정하게 된다.
이를 위해, 출력제어부(230)는 음원편집부(220)를 통과한 테스트음원을 스피커 재생을 위한 신호로 변환하는 AMP Array와 AMP Array에서 생성된 신호를 선택한 스피커로 전달하는 역할을 수행하는 출력선택부를 포함하도록 구성될 수 있다.
여기서, AMP Array에서의 AMP 수량은 동시에 재생하고자 하는 음원의 수량에 따라 결정하며, 출력선택부의 출력단 수량은 배치하고자 하는 전체 스피커 수량에 따라 결정될 수 있다.
한편, 본 발명의 일 실시예에 따른 테스트플레이트(10)의 경우, 예컨대, 도 3에 도시된 바와 같이, 음성 인식 성능 검증을 위해 위치하게 되는 음성대화기기(100)를 중심으로 한 특정 각도 단위로 스피커(1)가 각각 배치된 방사형 배치구조를 가질 수 있다.
이 경우, 출력제어부(230)는 방사형 배치구조로 배치된 스피커(1)를 이용하여 음성명령과 환경소음 각각에 해당하는 테스트음원의 재생각도를 다양화할 수 있으며, 같은 각도에서 2 이상의 소리재생(예: 음성명령+환경소음, 환경소음#1+환경소음#2)이 출력(재생)되도록 제어하는 것 또한 가능하다.
또한, 본 발명의 일 실시예에 따른 테스트플레이트(10)의 경우, 예컨대, 도 4에 도시된 바와 같이, 방사형 배치구조로 배치된 스피커(1)와는 별도로, 방사형 배치구조의 중심에서 회전하는 회전판(2), 및 방사형 배치구조의 외곽에서 음성명령과 매칭되는 테스트음원의 재생만을 위한 발화음성스피커(3)를 더 포함하는 구성을 가질 수 있다.
이와 관련하여, 출력제어부(230)는 음성대화기기(100)가 놓여지는 회전판(2)을 회전 제어하여 회전판(2) 위에서 방사형 배치구조의 외곽을 향하는 음성대화기기(100)의 지향 방향을 변경함으로써, 음성대화기기(100)와 특정 스피커(10) 간의 상대각도를 다양하게 부가할 수 있다.
이 경우, 회전판(2)의 회전 제어를 통해 상대적으로 적은 공간 안에서 음성대화기기(100)와 특정 스피커(10) 간의 상대각도를 다양하게 부가할 수 있다는 장점이 존재한다.
또한, 본 발명의 일 실시예에 따른 테스트플레이트(10)의 경우, 예컨대, 도 5에 도시된 바와 같이, 방사형 배치구조로 배치된 스피커(1)와는 별도로 회전 제어가 가능하며, 방사형 배치구조의 외곽에서 음성명령과 매칭되는 테스트음원의 재생만을 위한 발화음성스피커(3)를 더 포함하는 구성을 가질 수 있다.
이와 관련하여, 출력제어부(230)는 방사형 배치구조의 외곽에서 방사형 배치구조의 중심에 위치한 음성대화기기(100)를 향하는 발황음성스피커(3)의 지향 방향을 회전 제어할 수 있다.
이 경우, 발황음성스피커(3)의 회전 제어만이 이루어지므로, 음성대화기기(100)와 방사형 배치구조의 스피커(10) 간 상대각도 연산 및 각도 변경에 따른 출력대상 스피커의 자동변경과 같은 연산체계가 필요치 않다는 장점이 존재하게 된다.
제어부(240)는 음성 인식 성능 검증을 위한 전반적인 제어 기능을 수행한다.
보다 구체적으로, 제어부(240)는 음성대화기기(100)의 음성 인식 성능 검증을 위해 전술한 음원저장소(210), 음원편집부(220), 및 출력제어부(230)를 제어하게 된다.
이를 위해, 제어부(240)는 어떤 음원들을 재생할지 선택하기 위한 음원선택제어부, 선택된 음원들 중 어떤 음원들을 하나의 음원으로 합성할지에 대한 정보를 제공받아 선택적 MUX부를 제어하는 음원합성제어부, 선택적 MUX부를 통과한 각각의 음원들에 대해 어떤 거리 값을 부가할지에 대한 명령을 제공받아 이퀼라이저와 반향효과부를 제어하는 음 특성제어부, 음원 별로 음성대화기기(100)에 전달되었을 때 지정한 dB(decibel)값으로 전달될 수 있도록 AMP의 출력 값을 제어하는 출력레벨제어부, AMP Array를 통해 신호로 변환된 각각의 음원들을 어떤 스피커로 전송할지에 대한 명령을 전송받아 출력선택부를 제어하는 스피커선택제어부, 및 목표회전각도값을 전달받아 회전판(2) 또는 발황음성스피커(3)를 회전시키는 모터드라이버에 명령을 전송하는 역할을 수행하는 회전제어부를 포함할 수 있다.
이상에서 살펴본 바와 같이 본 발명의 일 실시예에 따른 자동화테스트장치(200)의 구성에 따르면, 테스트음원(음성명령, 환경소음 등)의 재생 방향 및 거리 감 제어를 통해서 음성대화기기(100)의 음성 인식 성능 검증함으로써, 검증 결과의 정확도 및 검증 과정의 효율성을 제고하는 효과를 성취할 수 있다.
이하에서는 도 6을 참조하여 본 발명의 일 실시예에 따른 자동화테스트장치(200)의 동작 방법을 설명하기로 한다.
먼저, 음원편집부(220)는 음원저장소(210)에 기 저장된 음원 목록으로부터 음성명령 및 환경소음을 선택하여 음성대화기기(100)를 테스트하기 위한 테스트음원을 생성한다(S10-S20).
이때, 음원편집부(220)는 음원 목록으로부터 선택되는 2 이상의 음원을 하나의 음원으로 합성하는 음원합성기능, 및 음원 목록으로부터 선택되는 음원에 대해 특정 주파수 대역의 이득(Gain) 값의 조절하고 반향 효과를 부가하여 소리의 거리감을 구현하는 거리조절기능 중 적어도 하나를 이용하여 테스트음원을 생성할 수 있다.
이후, 출력제어부(230)는 테그트음원 생성이 완료되면, 테스트음원을 증폭하며, 증폭된 테스트음원이 출력될 스피커를 선택하여 테스트음원을 출력을 제어한다(S30-S50).
이때, 음성대화기기(10)에 대해 스피커가 분산 배치된 테스트플레이트(10)에서 테스트음원이 증폭되어 출력되는 스피커를 선택하기 위한 출력경로를 결정할 수 있다.
한편, 본 발명의 일 실시예에 따른 테스트플레이트(10)의 경우, 예컨대, 도 3에 도시된 바와 같이, 음성 인식 성능 검증을 위해 위치하게 되는 음성대화기기(100)를 중심으로 한 특정 각도 단위로 스피커(1)가 각각 배치된 방사형 배치구조를 가질 수 있다.
이 경우, 출력제어부(230)는 방사형 배치구조로 배치된 스피커(1)를 이용하여 음성명령과 환경소음 각각에 해당하는 테스트음원의 재생각도를 다양화할 수 있으며, 같은 각도에서 2 이상의 소리재생(예: 음성명령+환경소음, 환경소음#1+환경소음#2)이 출력(재생)되도록 제어하는 것 또한 가능하다.
또한, 본 발명의 일 실시예에 따른 테스트플레이트(10)의 경우, 앞서 예시한, 도 4에 도시된 바와 같이, 방사형 배치구조로 배치된 스피커(1)와는 별도로, 방사형 배치구조의 중심에서 회전하는 회전판(2), 및 방사형 배치구조의 외곽에서 음성명령과 매칭되는 테스트음원의 재생만을 위한 발화음성스피커(3)를 더 포함하는 구성을 가질 수 있다.
이와 관련하여, 출력제어부(230)는 음성대화기기(100)가 놓여지는 회전판(2)을 회전 제어하여 회전판(2) 위에서 방사형 배치구조의 외곽을 향하는 음성대화기기(100)의 지향 방향을 변경함으로써, 음성대화기기(100)와 특정 스피커(10) 간의 상대각도를 다양하게 부가할 수 있다.
이 경우, 회전판(2)의 회전 제어를 통해 상대적으로 적은 공간 안에서 음성대화기기(100)와 특정 스피커(10) 간의 상대각도를 다양하게 부가할 수 있다는 장점이 존재한다.
또한, 본 발명의 일 실시예에 따른 테스트플레이트(10)의 경우, 앞서 예시한, 도 5에 도시된 바와 같이, 방사형 배치구조로 배치된 스피커(1)와는 별도로 회전 제어가 가능하며, 방사형 배치구조의 외곽에서 음성명령과 매칭되는 테스트음원의 재생만을 위한 발화음성스피커(3)를 더 포함하는 구성을 가질 수 있다.
이와 관련하여, 출력제어부(230)는 방사형 배치구조의 외곽에서 방사형 배치구조의 중심에 위치한 음성대화기기(100)를 향하는 발황음성스피커(3)의 지향 방향을 회전 제어할 수 있다.
이 경우, 발황음성스피커(3)의 회전 제어만이 이루어지므로, 음성대화기기(100)와 방사형 배치구조의 스피커(10) 간 상대각도 연산 및 각도 변경에 따른 출력대상 스피커의 자동변경과 같은 연산체계가 필요치 않다는 장점이 존재하게 된다.
이상에서 살펴본 바와 같이 본 발명의 일 실시예에 따른 자동화테스트장치(200)의 동작 방법에 따르면, 테스트음원(음성명령, 환경소음 등)의 재생 방향 및 거리 감 제어를 통해서 음성대화기기(100)의 음성 인식 성능 검증함으로써, 검증 결과의 정확도 및 검증 과정의 효율성을 제고하는 효과를 성취할 수 있다.
한편, 본 명세서에서 설명하는 기능적인 동작과 주제의 구현물들은 디지털 전자 회로로 구현되거나, 본 명세서에서 개시하는 구조 및 그 구조적인 등가물들을 포함하는 컴퓨터 소프트웨어, 펌웨어 혹은 하드웨어로 구현되거나, 이들 중 하나 이상의 결합으로 구현 가능하다. 본 명세서에서 설명하는 주제의 구현물들은 하나 이상의 컴퓨터 프로그램 제품, 다시 말해 제어 시스템의 동작을 제어하기 위하여 혹은 이것에 의한 실행을 위하여 유형의 프로그램 저장매체 상에 인코딩된 컴퓨터 프로그램 명령에 관한 하나 이상의 모듈로서 구현될 수 있다.
컴퓨터로 판독 가능한 매체는 기계로 판독 가능한 저장 장치, 기계로 판독 가능한 저장 기판, 메모리 장치, 기계로 판독 가능한 전파형 신호에 영향을 미치는 물질의 조성물 혹은 이들 중 하나 이상의 조합일 수 있다.
본 명세서에서 "시스템"이나 "장치"라 함은 예컨대 프로그래머블 프로세서, 컴퓨터 혹은 다중 프로세서나 컴퓨터를 포함하여 데이터를 제어하기 위한 모든 기구, 장치 및 기계를 포괄한다. 제어 시스템은, 하드웨어에 부가하여, 예컨대 프로세서 펌웨어를 구성하는 코드, 프로토콜 스택, 데이터베이스 관리 시스템, 운영 체제 혹은 이들 중 하나 이상의 조합 등 요청 시 컴퓨터 프로그램에 대한 실행 환경을 형성하는 코드를 포함할 수 있다.
컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 애플리케이션, 스크립트 혹은 코드로도 알려져 있음)은 컴파일되거나 해석된 언어나 선험적 혹은 절차적 언어를 포함하는 프로그래밍 언어의 어떠한 형태로도 작성될 수 있으며, 독립형 프로그램이나 모듈, 컴포넌트, 서브루틴 혹은 컴퓨터 환경에서 사용하기에 적합한 다른 유닛을 포함하여 어떠한 형태로도 전개될 수 있다. 컴퓨터 프로그램은 파일 시스템의 파일에 반드시 대응하는 것은 아니다. 프로그램은 요청된 프로그램에 제공되는 단일 파일 내에, 혹은 다중의 상호 작용하는 파일(예컨대, 하나 이상의 모듈, 하위 프로그램 혹은 코드의 일부를 저장하는 파일) 내에, 혹은 다른 프로그램이나 데이터를 보유하는 파일의 일부(예컨대, 마크업 언어 문서 내에 저장되는 하나 이상의 스크립트) 내에 저장될 수 있다. 컴퓨터 프로그램은 하나의 사이트에 위치하거나 복수의 사이트에 걸쳐서 분산되어 통신 네트워크에 의해 상호 접속된 다중 컴퓨터나 하나의 컴퓨터 상에서 실행되도록 전개될 수 있다.
한편, 컴퓨터 프로그램 명령어와 데이터를 저장하기에 적합한 컴퓨터로 판독 가능한 매체는, 예컨대 EPROM, EEPROM 및 플래시메모리 장치와 같은 반도체 메모리 장치, 예컨대 내부 하드디스크나 외장형 디스크와 같은 자기 디스크, 자기광학 디스크 및 CD-ROM과 DVD-ROM 디스크를 포함하여 모든 형태의 비휘발성 메모리, 매체 및 메모리 장치를 포함할 수 있다. 프로세서와 메모리는 특수 목적의 논리 회로에 의해 보충되거나, 그것에 통합될 수 있다.
본 명세서에서 설명한 주제의 구현물은 예컨대 데이터 서버와 같은 백엔드 컴포넌트를 포함하거나, 예컨대 애플리케이션 서버와 같은 미들웨어 컴포넌트를 포함하거나, 예컨대 사용자가 본 명세서에서 설명한 주제의 구현물과 상호 작용할 수 있는 웹 브라우저나 그래픽 유저 인터페이스를 갖는 클라이언트 컴퓨터와 같은 프론트엔드 컴포넌트 혹은 그러한 백엔드, 미들웨어 혹은 프론트엔드 컴포넌트의 하나 이상의 모든 조합을 포함하는 연산 시스템에서 구현될 수도 있다. 시스템의 컴포넌트는 예컨대 통신 네트워크와 같은 디지털 데이터 통신의 어떠한 형태나 매체에 의해서도 상호 접속 가능하다.
본 명세서는 다수의 특정한 구현물의 세부사항들을 포함하지만, 이들은 어떠한 발명이나 청구 가능한 것의 범위에 대해서도 제한적인 것으로서 이해되어서는 안되며, 오히려 특정한 발명의 특정한 실시형태에 특유할 수 있는 특징들에 대한 설명으로서 이해되어야 한다. 마찬가지로, 개별적인 실시형태의 문맥에서 본 명세서에 기술된 특정한 특징들은 단일 실시형태에서 조합하여 구현될 수도 있다. 반대로, 단일 실시형태의 문맥에서 기술한 다양한 특징들 역시 개별적으로 혹은 어떠한 적절한 하위 조합으로도 복수의 실시형태에서 구현 가능하다. 나아가, 특징들이 특정한 조합으로 동작하고 초기에 그와 같이 청구된 바와 같이 묘사될 수 있지만, 청구된 조합으로부터의 하나 이상의 특징들은 일부 경우에 그 조합으로부터 배제될 수 있으며, 그 청구된 조합은 하위 조합이나 하위 조합의 변형물로 변경될 수 있다.
또한, 본 명세서에서는 특정한 순서로 도면에서 동작들을 묘사하고 있지만, 이는 바람직한 결과를 얻기 위하여 도시된 그 특정한 순서나 순차적인 순서대로 그러한 동작들을 수행하여야 한다거나 모든 도시된 동작들이 수행되어야 하는 것으로 이해되어서는 안 된다. 특정한 경우, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다. 또한, 상술한 실시형태의 다양한 시스템 컴포넌트의 분리는 그러한 분리를 모든 실시형태에서 요구하는 것으로 이해되어서는 안되며, 설명한 프로그램 컴포넌트와 시스템들은 일반적으로 단일의 소프트웨어 제품으로 함께 통합되거나 다중 소프트웨어 제품에 패키징될 수 있다는 점을 이해하여야 한다
이와 같이, 본 명세서는 그 제시된 구체적인 용어에 본 발명을 제한하려는 의도가 아니다. 따라서, 상술한 예를 참조하여 본 발명을 상세하게 설명하였지만, 당업자라면 본 발명의 범위를 벗어나지 않으면서도 본 예들에 대한 개조, 변경 및 변형을 가할 수 있다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
본 발명에 일 실시예에 따른 자동화테스트장치 및 그 동작 방법에 따르면, 음성대화기기의 음성 인식 성능을 검증하기 위한 테스트음원(음성명령, 환경소음 등)의 재생 방향 및 거리 감 제어를 가능하게 한다는 점에서, 기존 기술의 한계를 뛰어 넘음에 따라 관련 기술에 대한 이용만이 아닌 적용되는 장치의 시판 또는 영업의 가능성이 충분할 뿐만 아니라 현실적으로 명백하게 실시할 수 있는 정도이므로 산업상 이용가능성이 있는 발명이다.
100: 음성대화기기
200: 자동화테스트장치
210: 음원편집부 220: 출력제어부
200: 자동화테스트장치
210: 음원편집부 220: 출력제어부
Claims (10)
- 기 저장된 음원 목록으로부터 음성명령 및 상기 음성명령과의 동시 재생을 위한 환경소음을 선택하여, 음성명령과 환경소음 각각에 해당하는 각 테스트음원을 생성하는 음원편집부; 및
상기 음성대화기기에 대해 스피커가 분산 배치된 테스트플레이트에서, 상기 생성한 각 테스트음원이 증폭되어 출력되는 스피커를 선택하기 위한 출력경로를 결정하는 출력제어부를 포함하며;
상기 음원편집부는,
거리에 따른 주파수대역별 감쇄율 및 반향음 크기의 관계를 근거로, 상기 각 테스트음원에 대하여 거리 값을 부가하는 명령에 따라 특정 주파수대역의 이득(Gain) 값을 조절하고 반향 효과를 부가하여 소리의 거리감을 구현하는 것을 특징으로 하는 자동화테스트장치. - 제 1 항에 있어서,
상기 음원편집부는,
상기 음원 목록으로부터 선택되는 2 이상의 음원을 하나의 음원으로 합성하는 선택적 MUX부,
상기 선택적 MUX부를 통과한 각각의 음원에 대해 특정 주파수대역의 이득(Gain) 값의 조절하고 반향 효과를 부가하여 상기 각 테스트음원을 생성하는 반향효과부,
거리에 따른 주파수대역별 감쇄율 및 반향음 크기의 관계를 저장하는 특성정보 관리DB를 포함하는 것을 특징으로 하는 자동화테스트장치. - 제 1 항에 있어서,
상기 테스트플레이트는,
상기 음성대화기기를 중심으로 한 특정 각도 단위로 각각의 스피커가 배치된 방사형 배치구조를 포함하는 것을 특징으로 하는 자동화테스트장치. - 제 3 항에 있어서,
상기 테스트플레이트는,
상기 방사형 배치구조의 중심에서 회전하는 회전판을 더 포함하며,
상기 출력제어부는,
상기 회전판을 회전 제어하여 상기 회전판 위에서 상기 방사형 배치구조의 외곽을 향하는 상기 음성대화기기의 지향 방향을 변경하는 것을 특징으로 하는 자동화테스트장치. - 제 3 항에 있어서,
상기 테스트플레이트는,
상기 방사형 배치구조로 배치된 스피커와는 별도로, 상기 방사형 배치구조의 외곽에서 상기 음성명령과 매칭되는 테스트음원이 재생되는 발화음성스피커를 더 포함하며,
상기 출력제어부는,
상기 방사형 배치구조의 외곽에서 상기 방사형 배치구조의 중심에 위치한 상기 음성대화기기를 향하는 상기 발화음성스피커의 지향 방향을 회전 제어하는 것을 특징으로 하는 자동화테스트장치. - 기 저장된 음원 목록으로부터 음성명령 및 상기 음성명령과의 동시 재생을 위한 환경소음을 선택하여, 음성명령과 환경소음 각각에 해당하는 각 테스트음원을 생성하는 음원편집단계; 및
상기 음성대화기기에 대해 스피커가 분산 배치된 테스트플레이트에서, 상기 생성한 각 테스트음원이 증폭되어 출력되는 스피커를 선택하기 위한 출력경로를 결정하는 출력제어단계를 포함하며;
상기 음원편집단계는,
거리에 따른 주파수대역별 감쇄율 및 반향음 크기의 관계를 근거로, 상기 각 테스트음원에 대하여 거리 값을 부가하는 명령에 따라 특정 주파수대역의 이득(Gain) 값을 조절하고 반향 효과를 부가하여 소리의 거리감을 구현하는 것을 특징으로 하는 자동화테스트장치의 동작 방법. - 제 6 항에 있어서,
상기 음원편집단계는,
상기 음원 목록으로부터 선택되는 2 이상의 음원을 하나의 음원으로 합성하는 음원합성기능, 상기 음원합성기능을 통과한 각각의 음원에 대해 특정 주파수대역의 이득(Gain) 값의 조절하고 반향 효과를 부가하는 거리조절기능을 기초로, 상기 각 테스트음원을 생성하는 것을 특징으로 하는 자동화테스트장치의 동작 방법. - 제 6 항에 있어서,
상기 테스트플레이트는,
상기 음성대화기기를 중심으로 한 특정 각도 단위로 각각의 스피커가 배치된 방사형 배치구조를 포함하는 것을 특징으로 하는 자동화테스트장치의 동작 방법. - 제 8 항에 있어서,
상기 테스트플레이트는,
상기 방사형 배치구조의 중심에서 회전하는 회전판을 더 포함하며,
상기 출력제어단계는,
상기 회전판을 회전 제어하여 상기 회전판 위에서 상기 방사형 배치구조의 외곽을 향하는 상기 음성대화기기의 지향 방향을 변경하는 것을 특징으로 하는 자동화테스트장치의 동작 방법. - 제 8 항에 있어서,
상기 테스트플레이트는,
상기 방사형 배치구조로 배치된 스피커와는 별도로, 상기 방사형 배치구조의 외곽에서 상기 음성명령과 매칭되는 테스트음원이 재생되는 발화음성스피커를 더 포함하며,
상기 출력제어단계는,
상기 방사형 배치구조의 외곽에서 상기 방사형 배치구조의 중심에 위치한 상기 음성대화기기를 향하는 상기 발화음성스피커의 지향 방향을 회전 제어하는 것을 특징으로 하는 자동화테스트장치의 동작 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190149797A KR102344628B1 (ko) | 2019-11-20 | 2019-11-20 | 자동화테스트장치 및 그 동작 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190149797A KR102344628B1 (ko) | 2019-11-20 | 2019-11-20 | 자동화테스트장치 및 그 동작 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210061810A KR20210061810A (ko) | 2021-05-28 |
KR102344628B1 true KR102344628B1 (ko) | 2021-12-30 |
Family
ID=76140416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190149797A KR102344628B1 (ko) | 2019-11-20 | 2019-11-20 | 자동화테스트장치 및 그 동작 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102344628B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102499559B1 (ko) * | 2022-09-08 | 2023-02-13 | 강민호 | 청각 반응 속도 및 방향성을 검사하기 위해, 복수의 스피커를 제어하는 전자 장치, 및 시스템 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100655489B1 (ko) * | 2004-12-06 | 2006-12-08 | 한국전자통신연구원 | 잡음환경하의 음성인식엔진 평가 시스템 및 자동화 방법 |
KR20080111290A (ko) * | 2007-06-18 | 2008-12-23 | 삼성전자주식회사 | 원거리 음성 인식을 위한 음성 성능을 평가하는 시스템 및방법 |
KR101145401B1 (ko) * | 2009-12-02 | 2012-05-16 | 한국생산기술연구원 | 로봇의 음성인식 성능 평가장치 및 평가 방법 |
-
2019
- 2019-11-20 KR KR1020190149797A patent/KR102344628B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR20210061810A (ko) | 2021-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12051423B2 (en) | Methods and systems for detecting and processing speech signals | |
JP7082126B2 (ja) | デバイス内の非対称配列の複数のマイクからの空間メタデータの分析 | |
US9913056B2 (en) | System and method to enhance speakers connected to devices with microphones | |
CN104919822B (zh) | 对不同重放扬声器组的空间音频信号的分段式调整 | |
US20170150289A1 (en) | Cloud hosted audio rendering based upon device and environment profiles | |
CN114339297B (zh) | 音频处理方法、装置、电子设备和计算机可读存储介质 | |
US11223924B2 (en) | Audio distance estimation for spatial audio processing | |
US20100223552A1 (en) | Playback Device For Generating Sound Events | |
JP2020500480A5 (ko) | ||
JPWO2018096954A1 (ja) | 再生装置、再生方法、情報処理装置、情報処理方法、およびプログラム | |
WO2014188231A1 (en) | A shared audio scene apparatus | |
CN105681820B (zh) | 一种视频弹幕录音方法及装置 | |
US10728688B2 (en) | Adaptive audio construction | |
KR102344628B1 (ko) | 자동화테스트장치 및 그 동작 방법 | |
US20220060824A1 (en) | An Audio Capturing Arrangement | |
EP2666309A1 (en) | An audio scene selection apparatus | |
CN103871439A (zh) | 一种音频播放的方法、装置及系统 | |
US9654891B2 (en) | System and method for determining proximity of a controller to a media rendering device | |
CN109511051B (zh) | 声音再现方法及声音再现装置 | |
CN111787460B (zh) | 设备控制方法及装置 | |
CN112261569B (zh) | 一种多声道播放的方法与设备 | |
US20240292179A1 (en) | Late reverberation distance attenuation | |
EP4174841A1 (en) | Systems and methods for generating a mixed audio file in a digital audio workstation | |
JP2015148441A (ja) | 位置推定装置及び方法、並びにコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |