KR20190086928A - Apparatus for recognizing call sign and method for the same - Google Patents

Apparatus for recognizing call sign and method for the same Download PDF

Info

Publication number
KR20190086928A
KR20190086928A KR1020180005064A KR20180005064A KR20190086928A KR 20190086928 A KR20190086928 A KR 20190086928A KR 1020180005064 A KR1020180005064 A KR 1020180005064A KR 20180005064 A KR20180005064 A KR 20180005064A KR 20190086928 A KR20190086928 A KR 20190086928A
Authority
KR
South Korea
Prior art keywords
voice
tone
sensing
ring tone
ringing
Prior art date
Application number
KR1020180005064A
Other languages
Korean (ko)
Other versions
KR102052634B1 (en
Inventor
최민석
한익상
정강래
Original Assignee
네이버 주식회사
라인 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 네이버 주식회사, 라인 가부시키가이샤 filed Critical 네이버 주식회사
Priority to KR1020180005064A priority Critical patent/KR102052634B1/en
Priority to JP2019003317A priority patent/JP6759370B2/en
Publication of KR20190086928A publication Critical patent/KR20190086928A/en
Priority to KR1020190157076A priority patent/KR102308022B1/en
Application granted granted Critical
Publication of KR102052634B1 publication Critical patent/KR102052634B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3231Monitoring the presence, absence or movement of users
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Telephone Function (AREA)

Abstract

The present application relates to an apparatus for recognizing ring back tone and a method thereof. According to one embodiment of the present invention, the apparatus may comprise: a voice reception unit receiving voice of a user and converting the voice into a voice signal; a first ring back tone sensing unit determining whether previously set ring back tone is included in the voice signal according to the first sensing characteristics; a second ring back tone sensing unit reexamining whether the ring back tone is included in the voice signal according to the second sensing characteristics if it is determined that the first ring back tone sensing unit includes the ring back tone; and a control unit generating a previously set wake-up signal if it is determined that the second ring back tone sensing unit includes the ring back tone.

Description

호출음 인식장치 및 호출음 인식방법 {Apparatus for recognizing call sign and method for the same}[0001] The present invention relates to a ring tone recognition apparatus and a ring tone recognition method,

본 출원은 호출음 인식장치 및 호출음 인식방법에 관한 것으로서, 사용자의 음성을 인식하여 단말장치 등을 활성화할 수 있는 호출음 인식장치 및 호출음 인식방법에 관한 것이다. The present invention relates to a ring tone recognition apparatus and a ring tone recognition method, and more particularly, to a ring tone recognition apparatus and a ring tone recognition method capable of recognizing a user's voice and activating a terminal apparatus and the like.

사람들간의 의사 전달 방법으로는, 글, 몸짓 및 음성 등과 같은 다양한 방법들이 있다. 특히, 음성은 사람의 의사 전달 중 가장 편리한 방법 중 하나이다. 이에 비하여 사람과 기계 장치간의 의사 소통방법으로는 키보드 및 마우스를 통한 입력과 입력에 대한 스피커 및 디스플레이 장치를 통한 출력에 의한 방법으로 매우 제한적이다. There are various ways of communication between people, such as writing, gesture, and voice. Especially, voice is one of the most convenient way of communicating people. On the other hand, a communication method between a person and a machine is very limited in terms of input through a keyboard and a mouse, and output through a speaker and a display device for input.

사람과 장치간의 의사 전달의 향상을 위해 음성을 통한 사람과 장치간의 의사 전달 방법이 시도되고 있다. 이러한 음성을 통한 사람과 장치간의 의사 전달을 위해 선행되는 기술이 음성인식 기술이다. 사람과 장치간의 음성을 통한 의사 전달을 위해서는 사람이 발화한 음성을 장치가 인식할 수 있어야 한다. 이를 위해 다양한 음성인식 기술들이 연구되고 있으며, 휴대폰과 같은 이동통신단말기, 기계, 컴퓨터의 제어 및 내비케이션 장치 등과 같이 다양한 분야에 적용되고 있다. A communication method between a person and a device via voice is being attempted to improve communication between a person and a device. Speech recognition technology is a technique that is prioritized for communication between a person and a device through such voice. In order to communicate through a voice between a person and a device, the device should be able to recognize the voice uttered by the person. Various speech recognition technologies have been studied for this purpose, and they have been applied to various fields such as a mobile communication terminal such as a mobile phone, a control device for a machine, a computer, and a navigation device.

통상적으로, 히든 마코브 모델(Hidden Markov Model: HMM) 및 다이나믹 타임 와핑(Dynamic Time Warping: DTW) 및 인공 신경망 등과 같은 음성인식 방법이 주로 사용되고 있다. Generally, speech recognition methods such as Hidden Markov Model (HMM) and Dynamic Time Warping (DTW) and artificial neural networks are mainly used.

본 출원은, 사용자의 음성을 인식하여 단말장치 등을 활성화할 수 있는 호출음 인식장치 및 호출음 인식방법을 제공하고자 한다. The present application is intended to provide a ring tone recognition device and a ring tone recognition method capable of recognizing a user's voice and activating a terminal device or the like.

본 출원은, 감지특성이 상이한 복수의 호출음 감지부를 이용하여 사용자가 호출음을 발화하는지 판별할 수 있는 호출음 인식장치 및 호출음 인식방법을 제공하고자 한다. The present application is to provide a ring tone recognition apparatus and a ring tone recognition method capable of discriminating whether or not a user utters a ring tone by using a plurality of ring tone detection units having different sensing characteristics.

본 출원은, 한번의 시도로 인한 키워드 인식시에는 다른 인식기로 추가 오인식검증을 하고, 사용자가 두번의 연속 시도를 한 경우에는 추가 검증 과정을 생략함으로써, 오수락율의 증가없이도 오거부율을 감소시킬 수 있는 호출음 인식장치 및 호출음 인식방법을 제공할 수 있다. In the present application, additional typing verification is performed by another recognizer when recognizing a keyword due to one attempt, and when the user makes two consecutive attempts, the additional verification process is omitted, thereby reducing the false rejection rate without increasing the false acceptance rate It is possible to provide a ring tone recognition device and a ring tone recognition method which can be used.

본 발명의 일 실시예에 의한 호출음 인식장치는, 사용자의 음성을 수신하여 음성신호로 변환하는 음성수신부; 제1 감지특성에 따라, 상기 음성신호 내에 기 설정된 호출음의 포함여부를 판별하는 제1 호출음감지부; 상기 제1 호출음감지부가 상기 호출음이 포함된 것으로 판별하면, 제2 감지특성에 따라 상기 음성신호 내에 상기 호출음의 포함여부를 재검사하는 제2 호출음감지부; 및 상기 제2 호출음감지부가 상기 호출음이 포함된 것으로 판별하면, 기 설정된 웨이크-업(wake-up) 신호를 생성하는 제어부를 포함할 수 있다. A ring tone recognizing apparatus according to an embodiment of the present invention includes a voice receiving unit for receiving a voice of a user and converting the voice into a voice signal; A first call sound sensing section for discriminating whether or not a preset ring tone is included in the voice signal according to the first sensing characteristic; A second ringing sound sensing unit for re-inspecting whether or not the ringing tone is included in the voice signal according to a second sensing characteristic when the first ringing tone sensing unit determines that the ringing tone is included; And a controller for generating a predetermined wake-up signal when the second ring tone detector determines that the ring tone is included.

본 발명의 일 실시예에 의한 호출음 인식장치는, 사용자의 음성을 수신하여 음성신호로 변환하는 음성수신부; 제1 감지특성에 따라, 상기 음성신호 내에 기 설정된 호출음의 포함여부를 판별하는 제1 호출음감지부; 제2 감지특성에 따라, 상기 음성신호 내에 상기 호출음의 포함여부를 판별하는 제2 호출음감지부; 및 상기 제1 호출음감지부의 감지결과, 제2 호출음감지부의 감지결과 및 설정된 보류시간에 기초하여 기 설정된 웨이크-업(wake-up) 신호를 생성하는 제어부를 포함할 수 있다. 여기서, 상기 보류시간은 상기 제1호출음 감지부에서 상기 호출음이 포함된 것으로 판별하고 상기 제2 호출음 감지부에서 상기 호출음이 포함되지 않은 것으로 판별한 경우, 설정될 수 있다. A ring tone recognizing apparatus according to an embodiment of the present invention includes a voice receiving unit for receiving a voice of a user and converting the voice into a voice signal; A first call sound sensing section for discriminating whether or not a preset ring tone is included in the voice signal according to the first sensing characteristic; A second ringing sound sensing unit for determining whether the ringing tone is included in the voice signal according to the second sensing characteristic; And a controller for generating a predetermined wake-up signal based on the detection result of the first ring tone detector, the detection result of the second ring tone detector, and the set retention time. Here, the hold time may be set when the first ring tones detection unit determines that the ring tone is included and determines that the ring tone is not included in the second ring tone detection unit.

본 발명의 일 실시예에 의한 호출음 인식방법은, 음성수신부가 사용자의 음성을 수신하여 음성신호로 변환하는 단계; 제1 감지특성을 가지는 제1 호출음감지부를 이용하여, 상기 음성신호에 기 설정된 호출음의 포함여부를 판별하는 단계; 상기 제1 호출음감지부가 상기 호출음이 포함된 것으로 판별하면, 제2 감지특성을 가지는 제2 호출음감지부를 이용하여, 상기 음성신호 내에 상기 호출음의 포함여부를 재검사하는 단계; 및 상기 제2 호출음감지부가 상기 호출음이 포함된 것으로 판별하면, 제어부가 기 설정된 웨이크-업(wake-up) 신호를 생성하는 단계를 포함할 수 있다.A method for recognizing a ring tone according to an embodiment of the present invention includes: receiving a voice of a user and converting the voice into a voice signal; Determining whether or not a predetermined ring tone is included in the voice signal using a first ring tone detector having a first sensing characteristic; Re-inspecting whether or not the ringing tone is included in the voice signal using a second ringing tone sensing part having a second sensing characteristic when the first ringing tone sensing part determines that the ringing tone is included; And a controller generating a predetermined wake-up signal when the second ring tone detector determines that the ring tone is included.

본 발명의 일 실시예에 의한 호출음 인식방법은, 음성수신부가 사용자의 음성을 수신하여 음성신호로 변환하는 단계; 제1 감지특성을 가지는 제1 호출음감지부를 이용하여, 상기 음성신호에 기 설정된 호출음의 포함여부를 판별하는 단계; 제2 감지특성을 가지는 제2 호출음감지부를 이용하여, 상기 음성신호 내에 상기 호출음의 포함여부를 판별하는 단계; 및 상기 제1 호출음감지부의 감지결과, 제2 호출음감지부의 감지결과 및 설정된 보류시간에 기초하여, 제어부가 기 설정된 웨이크-업(wake-up) 신호를 생성하는 단계를 포함할 수 있다. 여기서, 상기 보류시간은 상기 제1 호출음감지부가 상기 음성신호에 상기 호출음이 포함된 것으로 판별하고 상기 제2 호출음감지부가 상기 음성신호에 상기 호출음이 포함되지 않은 것으로 판별한 경우, 설정될 수 있다. A method for recognizing a ring tone according to an embodiment of the present invention includes: receiving a voice of a user and converting the voice into a voice signal; Determining whether or not a predetermined ring tone is included in the voice signal using a first ring tone detector having a first sensing characteristic; Determining whether the ringing tone is included in the voice signal using a second ringing tone detector having a second sensing characteristic; And generating a predetermined wake-up signal based on the detection result of the first call sound detection unit, the detection result of the second call sound detection unit, and the set pause time. Here, the hold time may be set when the first call sound sensing section determines that the ring tone is included in the voice signal and the second call sound sensing section determines that the ring tone is not included in the voice signal have.

덧붙여 상기한 과제의 해결수단은, 본 발명의 특징을 모두 열거한 것이 아니다. 본 발명의 다양한 특징과 그에 따른 장점과 효과는 아래의 구체적인 실시형태를 참조하여 보다 상세하게 이해될 수 있을 것이다.In addition, the means for solving the above-mentioned problems are not all enumerating the features of the present invention. The various features of the present invention and the advantages and effects thereof will be more fully understood by reference to the following specific embodiments.

본 발명의 일 실시예에 의한 호출음 인식장치 및 호출음 인식방법에 의하면, 감지특성이 상이한 복수의 호출음 감지부를 이용하여 사용자의 음성에 포함된 호출음을 감지하므로, 사용자가 발화한 호출음, 특히 연속 호출음에 대한 인식율을 높일 수 있다. According to the ring tone recognition apparatus and the ring tone recognition method according to an embodiment of the present invention, a ring tone included in a user's voice is detected using a plurality of ring tone detection units having different sensing characteristics, The recognition rate can be increased.

본 발명의 일 실시예에 의한 호출음 인식장치 및 호출음 인식방법에 의하면, 사용자가 연속된 호출음을 발화하는 경우, 호출음의 감지여부에 대한 추가적인 검증없이 단말장치 등을 활성화할 수 있다. 즉, 주변 소음이나 잡음이 심한 경우 등 사용자가 발화한 호출음을 인식하기 어려운 환경에서도, 사용자의 연속적인 호출시도에 대한 인식율을 향상시킬 수 있다. According to the ring tone recognition apparatus and the ring tone recognition method according to an embodiment of the present invention, when a user utters a continuous ring tone, the terminal apparatus and the like can be activated without further verification as to whether or not the ring tone is detected. That is, it is possible to improve the recognition rate of the user's continuous call attempt even in an environment where it is difficult to recognize a ringing tone that the user has uttered, such as when ambient noise or noise is severe.

본 발명의 일 실시예에 의한 호출음 인식장치 및 호출음 인식방법에 의하면 오수락율이 낮은 인식기의 성능을 유지하면서도, 오거부율을 낮출 수 있는 효과가 있다. According to the ring tone recognition apparatus and the ring tone recognition method according to an embodiment of the present invention, the false rejection rate can be lowered while maintaining the performance of the recognizer having a low false acceptance rate.

다만, 본 발명의 실시 예들에 따른 호출음 인식장치 및 호출음 인식방법이 달성할 수 있는 효과는 이상에서 언급한 것들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.However, the effects that can be achieved by the ringing tone recognition apparatus and the ringing tone recognition method according to the embodiments of the present invention are not limited to those described above, and other effects not mentioned can be obtained from the following description It will be understood by those of ordinary skill in the art.

도1은 본 발명의 일 실시예에 의한 호출음 인식장치를 나타내는 개략도이다.
도2는 본 발명의 일 실시예에 의한 호출음감지부에서의 오수락율 및 오거부율의 관계를 나타내는 개략도이다.
도3은 본 발명의 일 실시예에 의한 호출음 인식방법을 나타내는 순서도이다.
1 is a schematic diagram showing a ring tone recognition apparatus according to an embodiment of the present invention.
2 is a schematic diagram showing the relationship between a false acceptance rate and a false rejection rate in a call sound acceptance section according to an embodiment of the present invention.
3 is a flowchart illustrating a ring tone recognition method according to an embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 즉, 본 발명에서 사용되는 '부'라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, '부'는 어떤 역할들을 수행한다. 그렇지만 '부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '부'들로 결합되거나 추가적인 구성요소들과 '부'들로 더 분리될 수 있다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings, wherein like reference numerals are used to designate identical or similar elements, and redundant description thereof will be omitted. The suffix "module" and " part "for the components used in the following description are given or mixed in consideration of ease of specification, and do not have their own meaning or role. That is, the term 'part' used in the present invention means a hardware component such as software, FPGA or ASIC, and 'part' performs certain roles. However, 'minus' is not limited to software or hardware. The " part " may be configured to be in an addressable storage medium and configured to play back one or more processors. Thus, by way of example, and by no means, the terms " component " or " component " means any combination of components, such as software components, object- oriented software components, class components and task components, Subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays and variables. The functions provided in the components and parts may be combined into a smaller number of components and parts or further separated into additional components and parts.

또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.In the following description of the embodiments of the present invention, a detailed description of related arts will be omitted when it is determined that the gist of the embodiments disclosed herein may be blurred. It is to be understood that both the foregoing general description and the following detailed description are exemplary and explanatory and are intended to provide further explanation of the invention as claimed. , ≪ / RTI > equivalents, and alternatives.

도1은 본 발명의 일 실시예에 의한 호출음 인식시스템을 나타내는 개략도이다. 1 is a schematic diagram showing a ring tone recognition system according to an embodiment of the present invention.

도1을 참조하면, 본 발명의 일 실시예에 의한 호출음 인식시스템은 단말장치(1) 및 호출음 인식장치(100)를 포함할 수 있다. Referring to FIG. 1, a ring tone recognition system according to an embodiment of the present invention may include a terminal device 1 and a ring tone recognition device 100.

이하, 도1을 참조하여 본 발명의 일 실시예에 의한 호출음 인식시스템을 설명한다. Hereinafter, a ring tone recognition system according to an embodiment of the present invention will be described with reference to FIG.

단말장치(1)는 스피커, 디스플레이장치, 컴퓨터, 서버 등 다양한 종류의 장치일 수 있으며, 사용자(A)의 명령에 대응하는 동작을 수행하는 것일 수 있다. 여기서, 단말장치(1)는 절전모드 또는 슬립모드(sleep mode)로 대기 중에 있을 수 있으며, 호출음 인식장치(100)가 전송하는 웨이크-업(wake-up) 신호에 따라 절전모드 또는 슬립모드에서 동작모드(active mode)로 전환할 수 있다. The terminal device 1 may be various kinds of devices such as a speaker, a display device, a computer, a server, and the like, and may perform an operation corresponding to a command of the user A. Here, the terminal device 1 may be in a standby mode in a power saving mode or a sleep mode, and may be in a sleep mode or a sleep mode according to a wake-up signal transmitted by the ring back tone recognition device 100 It is possible to switch to the active mode.

호출음 인식장치(100)는 사용자(A)가 발화하는 음성을 인식할 수 있으며, 인식한 음성 내에 기 설정된 호출음이 포함되는지 여부를 판별할 수 있다. 호출음 인식장치(100)는 사용자가 발화한 음성 내에 호출음이 포함된 것으로 판별된 경우에는, 단말장치(1)로 웨이크-업 신호를 전송할 수 있다. 즉, 인식한 사용자의 음성명령에 대응하여, 단말장치(1)가 동작모드로 전환하도록 제어할 수 있다. 여기서, 호출음은 슬립모드인 단말장치(1)를 동작모드로 변환하기 위해 미리 설정된 키워드일 수 있다. The ring tone recognizing apparatus 100 can recognize a voice uttered by the user A and can determine whether or not a predetermined ring tone is included in the recognized voice. The ring tone recognizing apparatus 100 can transmit a wake-up signal to the terminal device 1 when it is determined that the ring tone is included in the voice uttered by the user. That is, it is possible to control the terminal device 1 to switch to the operation mode in response to the voice command of the recognized user. Here, the ringing tone may be a preset keyword for converting the terminal device 1 in the sleep mode into the operation mode.

실시예에 따라서는, 호출음 인식장치(100)가 호출음 이외에, 사용자가 입력하는 다양한 명령어 등을 인식하는 것도 가능하다. 즉, 호출음 인식장치(100)는 사용자가 음성으로 입력하는 명령어를 인식한 후, 각각의 명령어에 대응하는 제어신호를 생성하여 단말장치(1)로 전송할 수 있다. 예를들어, 호출음 인식장치(100)는 사용자가 음성으로 발화하는 TV의 채널 변경이나 볼률 조절 등에 대한 명령어를 인식할 수 있으며, 인식한 명령어에 대응하는 제어신호를 생성하여 TV로 전송할 수 있다. 이 경우, TV는 수신한 제어신호에 따라 채널변경이나 볼률 조절 등을 수행할 수 있다. According to the embodiment, it is also possible for the ring tone recognizing apparatus 100 to recognize various commands inputted by the user in addition to the ring tone. That is, the ring tone recognizing apparatus 100 may recognize a command input by the user as a voice, generate a control signal corresponding to each command, and transmit the control signal to the terminal apparatus 1. For example, the ring tone recognizing apparatus 100 can recognize a command for a channel change, a volume control, or the like of a TV which is uttered by a user, and can generate a control signal corresponding to the recognized command and transmit the control signal to the TV. In this case, the TV can perform a channel change, a volume control, and the like in accordance with the received control signal.

도1에서는 단말장치(1)와 호출음 인식장치(100)가 별도로 구현되는 것으로 표현되어 있으나, 실시예에 따라서는 호출음 인식장치(100)가 단말장치(1) 내에 포함되는 것도 가능하다. Although the terminal device 1 and the ring tone recognition device 100 are separately shown in FIG. 1, the ring tone recognition device 100 may be included in the terminal device 1 according to an embodiment.

한편, 도1을 참조하면, 호출음 인식장치(100)는 음성수신부(110), 제1 호출음감지부(110), 제2 호출음감지부(120) 및 제어부(140)를 포함할 수 있다. 1, the ring tone recognizing apparatus 100 may include a voice receiving unit 110, a first call sound sensing unit 110, a second call sound sensing unit 120, and a controller 140.

음성수신부(110)는 사용자(A)의 음성을 수신하여 음성신호로 변환할 수 있다. 음성수신부(110)는 마이크로폰(microphone) 등일 수 있으며, 사용자가 발화한 음성을 전기적 신호인 음성신호로 변환할 수 있다. 사용자의 음성은 특정한 주파수 및 진폭을 가지는 아날로그 형태의 신호에 해당하며, 음성수신부(110)는 입력되는 음성을 아날로그-디지털 변환기(미도시) 등을 통하여 디지털 신호인 음성신호로 변환할 수 있다. 여기서, 음성수신부(110)는 변환한 음성신호를 제1 호출감지부(120)로 제공할 수 있다. 도1에서는 음성수신부(110)가 음성신호를 제1 호출감지부(120)로만 제공하는 것으로 도시되어 있으나, 경우에 따라 음성수신부(110)가 제2 호출음감지부(130)에도 음성신호를 전달할 수 있다. The voice receiving unit 110 can receive the voice of the user A and convert it into a voice signal. The voice receiving unit 110 may be a microphone or the like and may convert a voice uttered by a user into a voice signal that is an electrical signal. The user's voice corresponds to an analog type signal having a specific frequency and amplitude, and the voice receiving unit 110 can convert the inputted voice into a voice signal, which is a digital signal, through an analog-digital converter (not shown). Here, the voice receiving unit 110 may provide the converted voice signal to the first call sensing unit 120. 1, although the voice receiving unit 110 provides voice signals only to the first call detecting unit 120, the voice receiving unit 110 may also transmit the voice signals to the second call sound detecting unit 130 .

제1 호출음감지부(120)는 제1 감지특성에 따라 음성신호에 기 설정된 호출음이 포함되는지 여부를 판별할 수 있다. 또한, 제1 호출음감지부(120)가 호출음이 포함된 것으로 판별하면, 제2 호출음감지부(130)는 제2 감지특성에 따라 음성신호 내에 호출음의 포함여부를 재검사할 수 있다. 즉, 서로 다른 감지특성을 가지는 제1 호출음감지부(120) 및 제2 호출음감지부(130)를 이용하여 호출음의 포함여부를 판별함으로써, 호출음의 인식성능을 향상시킬 수 있다 The first call sound sensing unit 120 may determine whether or not a predetermined ringing tone is included in the voice signal according to the first sensing characteristic. Also, if the first call sound sensing unit 120 determines that the ringing tone is included, the second ringing tone sensing unit 130 may re-check whether or not the ringing tone is included in the speech signal according to the second sensing characteristic. That is, the recognition performance of the ringing tones can be improved by determining whether or not the ringing tone is included by using the first ringing tone detector 120 and the second ringing tone detector 130 having different sensing characteristics

구체적으로, 제1 호출음감지부(120)은 오수락율(FAR: False Acceptance Rate)이 높고 오거부율(FRR: False Rejection Rate)이 낮은 제1 감지특성을 가질 수 있으며, 제2 호출음감지부(130)는 오거부율이 높고 오수락율이 낮은 제2 감지특성을 가질 수 있다. 여기서, 오수락율은 음성신호에 실제 호출음이 포함되지 않았으나 포함된 것으로 잘못 판단하는 비율이고, 오거부율은 음성신호에 실제 호출음이 포함되어 있으나 포함되지 않은 것으로 잘못 판단하는 비율에 해당한다. 오수락율이 높은 경우에는 단말장치(1)가 사용자의 의도와 상관없이 반응하기 때문에 사용자의 불편을 유발할 수 있으며, 오거부율이 높은 경우에는 사용자가 단말장치(1)를 호출해도 응답하지 않기 때문에 불편을 유발할 수 있다. Specifically, the first call sound sensing unit 120 may have a first sensing characteristic with a high false acceptance rate (FAR) and a low false rejection rate (FRR), and the second calling sound sensing unit 130 may have a second sensing characteristic with a high false reject rate and a low false accept rate. Here, the false acceptance rate is a rate at which the voice signal does not contain the actual voice but is mistakenly determined to be included, and the false reject rate corresponds to a rate at which the voice signal contains the actual voice but is mistakenly determined to be not included. If the false acceptance rate is high, the terminal device 1 may react to the user regardless of the intention of the user, thereby inconveniencing the user. If the false rejection rate is high, the user does not respond even when the terminal device 1 is called It can cause discomfort.

여기서, 오수락율과 오거부율은 도2에 도시한 바와 같이, 서로 상충관계(trade-off)에 있기 때문에, 두가지 성능을 모두 만족하기는 어렵다. 따라서, 여기서는 서로 다른 감지특성을 가지는 두개의 호출음감지부를 이용하여, 음성신호 내에 호출음의 포함여부를 판별하도록 할 수 있다. 이 때 바람직하게는, 제1 호출음감지부(120)의 오수락률이 제2 호출음감지부(130)보다 상대적으로 높거나 제1 호출음감지부(120)의 오거부율이 제2 호출음감지부(130)보다 상대적으로 낮게 할 수 있다.Here, since the false acceptance rate and the false rejection rate are in trade-off with each other as shown in FIG. 2, it is difficult to satisfy both of the two performances. Accordingly, in this case, it is possible to determine whether or not the ring tone is included in the voice signal by using two ring tone detectors having different detection characteristics. Preferably, the false acceptance rate of the first call sound sensing unit 120 is relatively higher than that of the second call sound sensing unit 130 or the false rejection rate of the first call sound sensing unit 120 is greater than the false acceptance rate of the second call sound sensing unit 130).

제1 호출음감지부(120)는 오수락율이 높은 제1 감지특성을 가지므로, 실제 호출음이 포함되지 않은 경우에도 호출음을 포함하는 것으로 판별할 확률이 높다. 다만, 오거부율은 낮기 때문에 제1 호출음감지부(120)를 이용하여, 호출음이 포함될 가능성이 있는 음성신호를 1차적으로 판별할 수 있다. 이후, 오거부율이 높은 제2 감지특성을 가지는 제2 호출음감지부(130)를 이용하여, 제1 호출음감지부(120)에서 호출음이 포함된 것으로 판단한 음성신호를 재검사할 수 있다. 즉, 제1 호출음감지부(120)에서 호출음이 포함되는 것으로 판단한 경우에도, 제2 호출음감지부(130)로 재검사하여 호출음이 없는 것으로 판별하면 최종적으로 호출음이 포함되지 않은 것으로 판별할 수 있다. 이를 통해, 오수락율이 높은 제1 호출음감지부(120)의 단점을 보완할 수 있다.Since the first call sound detection unit 120 has a first detection characteristic with a high false acceptance rate, even when the actual ring tone is not included, there is a high probability of discriminating that the ring tone is included. However, since the false rejection rate is low, the first call sound sensing unit 120 can be used to primarily determine a voice signal that may include a ringing tone. Thereafter, using the second ringing tone detector 130 having the second detection characteristic with a high false rejection rate, the first ringing tone detector 120 can re-examine the voice signal that is determined to include the ringing tone. That is, even if the first ringing tone detector 120 determines that a ringing tone is included, the second ringing tone detector 130 may re-examine the ringing tone to determine that the ringing tone is not included. This makes it possible to compensate for the disadvantage of the first call sound sensing unit 120 having a high erroneous acceptance rate.

실시예에 따라서는, 도2에 도시한 바와 같이, 제1 호출음감지부(120)는 오수락율이 FA1, 오거부율이 FR1일 수 있으며, 제2 호출음감지부(130)는 오수락율이 FA2, 오거부율이 FR2일 수 있다. 여기서, 각각의 호출음감지부들의 오수락율과 오거부율은 도2의 그래프에 따라 설정될 수 있으며, 이때 각각의 제1 감지특성 및 제2 감지특성을 유지하기 위해서는, 적어도 오수락율 FA1은 FA2보다 높고, 오거부율 FR2는 FR1보다 높게 선택할 수 있다. 도2는 하나의 커브만을 예시하고 있지만, 구현방법에 따라서는 각각의 호출음감지부가 서로 다른 오차 커브를 가지고 그 중 한 점을 선택할 수 있을 것이다. 2, the first call sound sensing unit 120 may have a false acceptance rate FA1 and a false rejection rate FR1, and the second call sound acceptance unit 130 may have a false acceptance rate FA2, and the false rejection rate may be FR2. Here, the false acceptance rate and the false reject rate of each call sound recognizing section can be set according to the graph of FIG. 2. In order to maintain each of the first and second sensing characteristics, at least the false acceptance rate FA1 is FA2 And the false rejection rate FR2 can be selected to be higher than FR1. Although FIG. 2 illustrates only one curve, depending on the implementation method, each ringing tone detector section may have different error curves and select one of them.

한편, 제1 호출음감지부(120)와 제2 호출음감지부(130)의 오수락율 및 오거부율은 각각의 제1 호출음감지부(120) 및 제2 호출음감지부(130)에 적용된 알고리즘 등에 따라 결정될 수 있다. The false acceptance rate and false rejection rate of the first call sound sensing unit 120 and the second call sound sensing unit 130 are determined by algorithms applied to the first call sound sensing unit 120 and the second call sound sensing unit 130, Can be determined accordingly.

이하에서는 상이한 감지 특성의 호출음감지부를 만드는 몇가지 실시예들에 대하여 설명한다. Hereinafter, some embodiments for making a ringing tone sensing part with different sensing characteristics will be described.

일 실시예에 따르면, 호출음감지부의 인식 임계값(threshold)를 변경하여 오수락율 및 오거부율을 조절할 수 있다. 호출음감지부의 구현방법에 따라, 0(false) 또는 1(true)이 아닌 호출음이 포함되었는지 여부에 대한 확률값이 인식 결과로 결정될 수 있다. 이때, 이 확률값을 기초로 인식 여부를 결정하는 인식 임계값을 변경하여 오수락율과 오거부율의 비율을 조절하는 것이 가능하다.According to one embodiment, the recognition error threshold and the false rejection rate can be adjusted by changing the recognition threshold of the ringing tone detector. Depending on the implementation of the ring tone detection section, a probability value for whether a ring tone other than 0 (false) or 1 (true) is included can be determined as a recognition result. At this time, it is possible to adjust the ratio of the false acceptance rate and the false rejection rate by changing the recognition threshold value for determining whether or not to recognize the probability value.

구체적인 구현 방법의 일 예로, 제1 호출음감지부(120)와 제2 호출음감지부(130)는 음성신호로부터 호출음에 대응하는 음성파형의 포함여부를 확인하여 호출음이 포함되는지 여부를 판별할 수 있으며, 음성신호 내에 호출음에 대응하는 음성파형의 포함여부는 확률값으로 계산할 수 있다. 여기서, 확률값이 기 설정된 임계확률값 이상이면 호출음이 포함된 것으로 판별할 수 있으며, 임계확률값의 설정에 따라 각각의 제1 호출음감지부(120)와 제2 호출음감지부(130)의 감지특성이 선택될 수 있다 예를들어, 임계확률값을 낮추는 경우에는 오수락율이 높아지므로 제1 감지특성에 가깝게 되고, 임계확률값을 높이는 경우에는 오거부율이 높아지므로 제2 감지특성에 가깝게 될 수 있다. As a concrete implementation method, the first call sound sensing unit 120 and the second call sound sensing unit 130 can check whether or not a voice tone corresponding to a ringing tone is included from a voice signal to determine whether or not a ringing tone is included , Whether or not the voice waveform corresponding to the ringing tone is included in the voice signal can be calculated as a probability value. If the probability value is greater than or equal to a predetermined threshold probability value, it can be determined that the ringing tone is included. Depending on the setting of the threshold probability value, the detection characteristics of each of the first ringing sound sensing portion 120 and the second ringing sound sensing portion 130 are selected For example, when the threshold probability value is lowered, the false acceptance rate becomes higher, so that it approaches the first sensing characteristic. When the threshold probability value is increased, the false rejection rate becomes higher.

또다른 방법으로, 호출음감지부의 언어 모델을 변경함으로써 서로 다른 감지특성을 가지는 호출음감지부를 만들 수 있다. 일 예로, 각각의 제1 호출음감지부(120) 및 제2 호출음감지부(130)에 설정되는 발음변이 인정범위에 따라서 각각의 감지특성이 결정될 수 있다. 예를들어, "클로바"가 호출음인 경우, "클로바"와 유사한 발음인 "클러바", "그로바", 크로바" 등이 김지되는 경우에는 호출음이 입력되는 것으로 판별할 수 있다. 이러한 발음변이 인정범위를 넓힐수록 오수락율이 높아지게 되지만, 발음변이 인정범위를 좁힐수록 오거부율이 높아지게 된다. 따라서, 발음변이의 인정범위를 설정하는 발음 모델 또는 발음 그래프 등을 조절하여 감지특성을 설정할 수 있다. Alternatively, by changing the language model of the ring tone detection section, a ring tone detection section having different sensing characteristics can be created. For example, the respective sensing characteristics may be determined according to the range of the pronunciation variation permitted to be set in the first ringing sound sensing portion 120 and the second ringing sound sensing portion 130, respectively. For example, when "Clover" is a ringing tone, it can be determined that a ringing tone is input when "Clover", "Grove", "Crover" The more the recognition range is widened, the higher the false acceptance rate becomes. However, the more the false recognition rate is narrowed, the higher the false rejection rate. .

또다른 방법으로 유사어 필터를 적용하는 방법을 이용할 수 있다. 감지하고자 하는 호출음과 유사한 발음이지만 다른 단어들을 미리 학습하여 유사어에 의한 오수락율을 감소시키는 것이다. 즉, 음성신호 내에 유사어가 포함되는 경우에는 호출음의 입력이 아닌 것으로 판별할 수 있다. 예를들어, "클로바"가 호출음인 경우, "들어봐", "틀어봐" 등의 유사어는 발음이 일부 유사하지만 실제로는 다른 의미를 가지는 것으로 사용자가 호출음의 입력을 의도하지 않은 것으로 판별할 수 있다. 따라서, 유사어들을 확장하여 설정하는 경우에는 오수락율은 낮출수 있으나 오거부율이 높아질 수 있으며, 유사어를 좁히거나 유사어 필터를 설정하지 않는 경우에는 오거부율은 낮출수 있으나 오수락율이 높아질 수 있다. Another method is to apply a similarity filter. The pronunciation is similar to the ringing tone to be detected, but the other words are learned in advance to reduce the false acceptance rate by the analogy. That is, when a similar word is included in the voice signal, it can be determined that the voice is not an input of a ringing tone. For example, when "Clover" is a ringing tone, similar words such as "Listen" and "Play" have some similarities but actually have different meanings, so that the user can determine that the ringing tone is not intended to be input have. Therefore, when the similarities are extended and set, the false acceptance rate can be lowered, but the false rejection rate can be increased. If the similarity is narrowed or the similarity filter is not set, the false rejection rate can be lowered, but the false acceptance rate can be increased.

또한, 호출음의 앞 또는 뒤에 포함되는 묵음을 감지하는 알고리즘을 적용하는 것도 가능하다. 일반적으로, 사용자가 호출음을 발화하는 경우에는 묵음을 포함되게 되므로, 입력된 음성신호로부터 묵음이 포함되는지 여부를 확인하여 묵음이 포함되는 경우에 한하여 호출음으로 인정할 수 있다. 이 경우, 오수락율은 크게 줄일 수 있으나, 사용자(A)가 발화하는 환경에 잡음 등이 많이 섞여있는 경우에는 묵음의 포함여부를 판별하기 어려우므로, 오거부율이 증가하는 등의 문제가 발생할 수 있다. It is also possible to apply an algorithm for detecting the silence included before or after the ringing tone. In general, when a user utters a ringing tone, silence is included. Therefore, it is possible to recognize whether a silence is included in the input voice signal, and to recognize the silence as a ringing tone only when silence is included. In this case, although the false acceptance rate can be greatly reduced, it is difficult to determine whether or not silence is included when a lot of noise, etc. are mixed in the environment in which the user A is uttering. Therefore, have.

한편, 실시예에 따라서는, 제1 호출음감지부(120) 및 제2 호출음감지부(130)에 대하여 머신러닝 등을 적용할 수 있다. 예를들어, 호출음을 포함하는 음성신호와 포함하지 않는 음성신호를 다양한 환경에서 반복하여 출력한 후, 제1 호출음감지부(120) 및 제2 호출음감지부(130)가 지속적으로 판별하도록 할 수 있다. 이때, 판별결과를 피드백하여 각각의 제1 호출음감지부(120) 및 제2 호출음감지부(130)를 학습시킬 수 있다. 이 경우, 호출음감지부(120) 또는 제2 호출음감지부(130)에 대하여, 잡음이 심한 환경에서의 학습결과를 추가하면 잡음환경에서의 오거부율을 낮추는 것이 가능하다. On the other hand, according to the embodiment, machine learning or the like can be applied to the first call sound sensing unit 120 and the second call sound sensing unit 130. [ For example, after the voice signal including the ringing tone and the voice signal not including the ringing tone are repeatedly output in various environments, the first ringing tone sensing section 120 and the second ringing tone sensing section 130 can continuously determine have. At this time, the first call sound sensing unit 120 and the second call sound sensing unit 130 can be learned by feeding back the determination result. In this case, it is possible to reduce the erroneous rejection rate in the noisy environment by adding the learning result in the noisy environment to the ringing sound sensing unit 120 or the second ringing sound sensing unit 130.

따라서, 제1 호출음감지부(120) 및 제2 호출음감지부(130)에 상술한 알고리즘 등을 적용하여, 제1 호출음감지부(120) 및 제2 호출음감지부(130)가 각각 제1 감지특성과 제2 감지특성을 가지도록 구현할 수 있다. 이상에서 기술한 실시예들은 독립적으로 사용하거나, 하나 이상의 방법이 결합되어 사용될 수 있을 것이다. Therefore, the first ringing sound sensing unit 120 and the second ringing sound sensing unit 130 are applied to the first ringing sound sensing unit 120 and the second ringing sound sensing unit 130, respectively, Characteristic and a second sensing characteristic. The embodiments described above may be used independently, or one or more methods may be used in combination.

제어부(140)는 제2 호출음감지부(130)가 호출음이 포함된 것으로 판별하면, 기 설정된 웨이크-업(wake-up) 신호를 생성할 수 있다. 제어부(140)는 생성한 웨이크-업 신호를 단말장치(1)로 전송할 수 있으며, 사용자의 호출음 발화에 대응하여 단말장치(1)가 동작모드로 동작하도록 할 수 있다. 즉, 제어부(140)는 제1 호출음감지부(120) 및 제2 호출음감지부(130)에서 모두 호출음이 포함되는 것으로 판별한 경우에 한하여 웨이크-업 신호를 생성할 수 있다. 이를 통하여, 사용자의 발화에 지나치게 자주 반응하여 단말장치(1)가 동작하는 등의 문제점을 방지할 수 있다. The control unit 140 may generate a predetermined wake-up signal when the second ringing tone sensing unit 130 determines that the ringing tone is included. The control unit 140 can transmit the generated wake-up signal to the terminal device 1, and can cause the terminal device 1 to operate in the operation mode in response to the user's ringing tone. That is, the control unit 140 can generate a wake-up signal only when it is determined that the ringing tone is included in both the first ringing sound sensing unit 120 and the second ringing sound sensing unit 130. Thus, it is possible to prevent problems such as the terminal device 1 being operated too frequently in response to user's utterance.

다만, 제2 호출음감지부(130)가 음성신호내에 호출음이 포함되지 않은 것으로 판별하면, 제어부(140)는 일정한 시간간격의 보류시간을 설정할 수 있다. 즉, 제2 호출음감지부(130)는 오거부율이 높기 때문에, 보류시간을 설정하여 보류시간 내에 사용자가 추가로 호출음을 포함하는 음성을 발화하는지 여부를 확인할 수 있다. 만약, 보류시간 내에 음성수신부(110)가 사용자의 음성을 재수신하고, 제1 호출음감지부(120)가 재수신한 음성에 대응하는 음성신호로부터 호출음이 포함된 것으로 판별하면, 제어부(140)는 웨이크-업 신호를 생성할 수 있다. 이는 사용자가 단말장치(1)의 동작을 위하여 호출음을 반복하여 입력하는 경우에 해당하므로, 오거부율이 높은 제2 호출음감지부(130)에 의한 재검사는 생략하고, 제1 호출음감지부(120)에서의 판별만으로 웨이크-업 신호를 생성하도록 할 수 있다. 이를 통하여, 호출음의 인식이 어려운 환경 등에서도, 사용자의 연속시도에 따른 인식율을 향상시키는 것이 가능하다. 여기서 보류시간은 5초로 설정될 수 있으나 이에 한정되는 것은 아니며, 실시예에 따라 다양하게 설정가능하다. However, if the second ringing tone detector 130 determines that the ringing tone is not included in the voice signal, the controller 140 may set a hold time of a predetermined time interval. That is, since the second call sound detection unit 130 has a high erroneous rejection rate, it is possible to set a hold time and confirm whether or not the user further utters a voice including a ringing tone within the hold time. If the voice receiving unit 110 re-receives the voice of the user within the hold time and the first call sound sensing unit 120 determines that the voice is included in the voice signal corresponding to the voice re-received, the control unit 140 A wake-up signal can be generated. This is because the user repeatedly inputs a ringing tone for the operation of the terminal device 1, so that the second ringing tone detector 130 having a high erroneous rejection rate is skipped and the first ringing tone detector 120, It is possible to generate the wake-up signal only by the discrimination in Fig. Thus, it is possible to improve the recognition rate according to the user's continuous attempt even in an environment where recognition of the ringing tones is difficult. Herein, the retention time may be set to 5 seconds, but the present invention is not limited thereto and can be variously set according to the embodiment.

제어부(140)는 제1 호출음감지부(120)가 상시 동작하도록 하여, 입력되는 음성신호에 대하여 즉각적으로 반응하도록 할 수 있다. 즉, 사용자가 발화하는 호출음을 언제든지 감지할 수 있도록, 제1 호출음감지부(120)는 상시적으로 동작하도록 할 수 있다. 반면에, 제2 호출음감지부(130)는 제1 호출음감지부(120)에서의 판별결과를 재검사하는 기능을 수행하는 것으로, 오거부율이 낮은 제1 호출음감지부(120)에서도 호출음이 포함되지 않은 것으로 판별된 음성신호에 대하여는, 재검사를 수행하지 않도록 제어될 수 있다. 또한, 제2 호출음감지부(130)는 보류시간 동안에도 동작하지 않도록 제어될 수 있다. The control unit 140 may cause the first call sound sensing unit 120 to operate at all times to promptly respond to the input voice signal. That is, the first call sound sensing unit 120 may be operated at all times so that the user can always hear a ringing tone to be uttered. On the other hand, the second call sound sensing unit 130 performs a function of re-examining the discrimination result in the first call sound sensing unit 120, so that even in the first call sound recognizing unit 120 having a low erroneous reject rate, It can be controlled so as not to perform the retest for the voice signal that has been determined to be non-existent. Also, the second ringing tone sensing part 130 can be controlled not to operate even during the hold time.

본 발명의 또다른 실시예에 따르면, 제1 호출음감지부(120) 및 제2 호출음감지부(130)가 상시적으로 동작하도록 할 수 있다. 제1 호출음감지부(120)의 동작 후 제2 호출음감지부(130)가 동작할 경우 연산에 추가시간이 필요하므로, 각각의 호출음감지부가 입력되는 음성신호에 대하여 동작을 수행하고, 그 결과를 기초로 최종적으로 호출음 포함 여부를 결정할 수 있다.According to another embodiment of the present invention, the first call sound sensing unit 120 and the second call sound sensing unit 130 may be operated at all times. When the second call sound sensing unit 130 operates after the operation of the first call sound sensing unit 120, an additional time is required for the calculation. Therefore, each call sound sensing unit performs an operation on the input voice signal, It is possible to finally decide whether to include a ringing tone.

최종 결과는 제1 호출음감지부(120) 및 제2 호출음감지부(130)의 감지 특성 및 성능을 고려하여 최종 결과를 결정하도록 설정될 수 있다. 일 예로, 제1 호출음감지부(120) 및 제2 호출음감지부(130)의 감지여부 및 앞서 설명한 보류 시간 이내인지 여부에 따라 최종 결과가 다음 표1과 같이 결정될 수 있다. The final result can be set to determine the final result in consideration of the sensing characteristics and performance of the first ringing sound sensing portion 120 and the second ringing sound sensing portion 130. For example, the final result may be determined according to whether or not the first call sound sensing unit 120 and the second call sound sensing unit 130 are sensed and within the above-described retention time, as shown in Table 1 below.

제1 호출음
감지부
First ring tone
The sensing unit
제2 호출음
감지부
Second ringing tone
The sensing unit
보류시간 이내인지 여부Is it within hold time 최종 결과Final result
감지Detection 감지Detection 무관irrelevant 호출음 포함Include Ringtone 감지Detection 감지못함Can not detect YesYes 호출음 포함Include Ringtone NONO 호출음 포함안함Do not include ringtone 감지못함Can not detect 감지Detection 무관irrelevant 호출음 포함Include Ringtone 감지못함Can not detect 감지못함Can not detect 무관irrelevant 호출음 포함안함Do not include ringtone

도3은 본 발명의 일 실시예에 의한 호출음 인식방법을 나타내는 순서도이다. 3 is a flowchart illustrating a ring tone recognition method according to an embodiment of the present invention.

도3을 참조하면, 먼저 음성처리부가 사용자의 음성을 수신하여 음성신호로 변환할 수 있다(S10). 이후, 제1 감지특성을 가지는 제1 호출음감지부를 이용하여 음성신호에 기 설정된 호출음의 포함여부를 판별할 수 있다(S20). 여기서, 제1 호출음감지부는 오수락율이 높고 오거부율이 낮은 제1 감지특성을 가질 수 있다. Referring to FIG. 3, a voice processing unit may receive a voice of a user and convert the voice into a voice signal (S10). Thereafter, it is possible to determine whether or not the voice signal includes a predetermined ringing tone by using the first ringing tone detector having the first sensing characteristic (S20). Here, the first call sound sensing section may have a first sensing characteristic with a high false acceptance rate and a low false rejection rate.

제1 호출음감지부에서 호출음이 포함된 것으로 판별된 경우에는(S30), 제2 감지특성을 가지는 제2 호출음감지부가 음성신호 내에 호출음이 포함되는지 여부를 재검사할 수 있다(S50). 여기서, 제2 호출음감지부는 오거부율이 높고 오수락율이 낮은 제2 감지특성을 가지는 것일 수 있다. If it is determined that the ringing tone is included in the first ringing tone detector (S30), the second ringing tone detector having the second sensing characteristic may check whether the ringing tone is included in the speech signal (S50). Here, the second call sound sensing section may have a second sensing characteristic with a high false rejection rate and a low false acceptance rate.

제2 호출음감지부가 음성신호 내에 호출음이 포함된 것으로 판별한 경우에는(S60), 제어부가 기 설정된 웨이크-업(wake-up) 신호를 생성할 수 있다(S70). 제어부가 생성한 웨이크-업 신호는 단말장치 등으로 전송될 수 있으며, 웨이크-업 신호에 의하여 슬립모드(sleep mode) 또는 절전모드의 단말장치를 동작모드(active mode)로 전환시킬 수 있다. If the second ringing tone detector determines that the ringing tone is included in the voice signal (S60), the control unit may generate a predetermined wake-up signal (S70). The wake-up signal generated by the controller can be transmitted to a terminal device or the like, and the sleep mode or the power saving mode terminal device can be switched to an active mode by a wake-up signal.

한편, 제2 호출음감지부가 음성신호 내에 호출음이 포함되지 않은 것으로 판별한 경우에는(S60), 제어부가 기 설정된 보류시간을 설정할 수 있다(S80). 즉, 보류시간 내에 사용자가 반복하여 호출음을 출력하는지 여부를 확인할 수 있다. 이를 위하여, 보류시간을 설정한 이후에(S80) 사용자가 발화하는 음성을 재수신하여 음성신호를 생성할 수 있으며(S10), 제1 호출음감지부는 재수신한 음성신호 내에 호출음이 포함되는지 여부를 다시 판별할 수 있다(S20). 여기서, 제1 호출음감지부가 호출음이 포함된 것으로 판별하면(S30), 음성신호가 보류시간 내에 수신된 것인지 여부를 확인할 수 있다(S40). 보류시간 내에 수신한 음성신호인 경우에는, 제어부가 웨이크업 신호를 생성할 수 있다(S70). 즉, 보류시간 내에 사용자가 다시 발화한 음성 내에 제1 호출음감지부가 호출음이 포함된 것으로 판단한 경우에는, 제2 호출음감지부에 의한 추가적인 재검사를 수행하지 않고, 웨이크 업 신호를 생성하도록 할 수 있다. 이를 통하여, 사용자의 연속시도에 따른 인식율을 향상시킬 수 있다. On the other hand, if the second call sound sensing unit determines that the ring tone is not included in the voice signal (S60), the control unit can set a predetermined hold time (S80). That is, it is possible to check whether the user repeatedly outputs the ringing tone within the hold time. To this end, after setting the retention time (S80), the user can re-receive the voice to generate a voice signal (S10), and the first call sound sensing section determines whether or not the ring back tone is included in the re- (S20). Here, if the first call sound sensing unit determines that the ring tone is included (S30), it can be checked whether the voice signal is received within the hold time (S40). If the received voice signal is within the hold time, the control unit can generate a wake-up signal (S70). That is, when the first call sound sensing section determines that the ring tone is included in the voice re-uttered by the user within the hold time, it is possible to generate the wake-up signal without performing the additional recheck by the second ring tone detector . Through this, the recognition rate according to the user's continuous attempts can be improved.

본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 본 발명에 따른 구성요소를 치환, 변형 및 변경할 수 있다는 것이 명백할 것이다.The present invention is not limited to the above-described embodiments and the accompanying drawings. It will be apparent to those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims.

1: 단말장치 100: 호출음 인식장치
110: 음성수신부 120: 제1 호출음감지부
130: 제2 호출음감지부 140: 제어부
1: Terminal device 100: Call tone recognition device
110: voice receiving unit 120: first call sound sensing unit
130: second call sound sensing section 140:

Claims (9)

사용자의 음성을 수신하여 음성신호로 변환하는 음성수신부;
제1 감지특성에 따라, 상기 음성신호 내에 기 설정된 호출음의 포함여부를 판별하는 제1 호출음감지부;
상기 제1 호출음감지부가 상기 호출음이 포함된 것으로 판별하면, 제2 감지특성에 따라 상기 음성신호 내에 상기 호출음의 포함여부를 재검사하는 제2 호출음감지부; 및
상기 제2 호출음감지부가 상기 호출음이 포함된 것으로 판별하면, 기 설정된 웨이크-업(wake-up) 신호를 생성하는 제어부를 포함하는 호출음 인식장치.
A voice receiving unit for receiving a voice of a user and converting the voice into a voice signal;
A first call sound sensing section for discriminating whether or not a preset ring tone is included in the voice signal according to the first sensing characteristic;
A second ringing sound sensing unit for re-inspecting whether or not the ringing tone is included in the voice signal according to a second sensing characteristic when the first ringing tone sensing unit determines that the ringing tone is included; And
And a controller for generating a predetermined wake-up signal when the second ringing tone detector determines that the ringing tone is included.
사용자의 음성을 수신하여 음성신호로 변환하는 음성수신부;
제1 감지특성에 따라, 상기 음성신호 내에 기 설정된 호출음의 포함여부를 판별하는 제1 호출음감지부;
제2 감지특성에 따라, 상기 음성신호 내에 상기 호출음의 포함여부를 판별하는 제2 호출음감지부; 및
상기 제1 호출음감지부의 감지결과, 제2 호출음감지부의 감지결과 및 설정된 보류시간에 기초하여 기 설정된 웨이크-업(wake-up) 신호를 생성하는 제어부를 포함하고,
상기 보류시간은, 상기 제1호출음 감지부에서 상기 호출음이 포함된 것으로 판별하고 상기 제2 호출음 감지부에서 상기 호출음이 포함되지 않은 것으로 판별한 경우, 설정되는 것을 특징으로 하는 호출음 인식장치.
A voice receiving unit for receiving a voice of a user and converting the voice into a voice signal;
A first call sound sensing section for discriminating whether or not a preset ring tone is included in the voice signal according to the first sensing characteristic;
A second ringing sound sensing unit for determining whether the ringing tone is included in the voice signal according to the second sensing characteristic; And
And a controller for generating a predetermined wake-up signal based on the detection result of the first ring tone detector, the detection result of the second ring tone detector, and the set retention time,
Wherein the hold time is set when it is determined that the ring tone is included in the first ring tone detection unit and that the ring tone is not included in the second ring tone detection unit.
제1항 또는 제2항에 있어서,
상기 제1 호출음감지부는 오수락율(FAR: False Acceptance rate)이 높고 오거부율(FRR: False Rejection rate)이 낮은 제1 감지특성을 가지고,
상기 제2 호출음감지부는 오거부율이 높고 오수락율이 낮은 제2 감지특성을 가지는 것을 특징으로 하는 호출음 인식장치.
3. The method according to claim 1 or 2,
Wherein the first call sound sensing unit has a first sensing characteristic with a high false acceptance rate (FAR) and a low false rejection rate (FRR)
Wherein the second call sound recognizing section has a second sensing characteristic with a high false rejection rate and a low false acceptance rate.
제3항에 있어서,
상기 제1 호출음감지부는 제1 오수락율 및 제1 오거부율을 가지고, 상기 제2 호출음감지부는 제2 오수락율 및 제2 오거부율을 가지며,
상기 제1 오수락율을 상기 제2 오수락율 이상이고, 상기 제2 오거부율은 상기 제1 오거부율 이상인 것을 특징으로 하는 호출음 인식장치.
The method of claim 3,
Wherein the first call sound detection section has a first false acceptance rate and a first false rejection rate and the second call sound acceptance section has a second false acceptance rate and a second false rejection rate,
The first erroneous acceptance rate is equal to or greater than the second erroneous acceptance rate, and the second erroneous rejection rate is equal to or greater than the first erroneous rejection rate.
제1항에 있어서, 상기 제어부는
상기 제2 호출음감지부가 상기 호출음이 포함되지 않은 것으로 판별하면, 보류시간을 설정하는 것을 특징으로 하는 호출음 인식장치.
The apparatus of claim 1, wherein the control unit
And sets a hold time when the second call sound sensing unit determines that the ring tone is not included.
제5항에 있어서, 상기 제어부는
상기 보류시간 내에 상기 제1 호출음감지부가 사용자의 음성을 재수신하여, 상기 재수신한 음성 내에 상기 호출음이 포함된 것으로 판별하면, 상기 웨이크-업 신호를 생성하는 것을 특징으로 하는 호출음 인식장치.
6. The apparatus of claim 5, wherein the control unit
Up signal when the first ring sensor section re-receives the user's voice in the retention time and determines that the ring tone is included in the re-received voice.
제6항에 있어서,
상기 제1 호출음감지부는 상시 동작하고,
상기 제2 호출음감지부는 상기 보류시간에 해당하거나, 상기 제1 호출음감지부가 상기 음성신호 내에 상기 호출음이 포함되지 않은 것으로 판별한 경우에는 동작하지 않는 것을 특징으로 하는 호출음 인식장치.
The method according to claim 6,
Wherein the first call sound sensing section operates at all times,
Wherein the second ringing tone sensing portion does not operate when it corresponds to the retention time or when the first ringing tone sensing portion determines that the ringing tone is not included in the voice signal.
음성수신부가 사용자의 음성을 수신하여 음성신호로 변환하는 단계;
제1 감지특성을 가지는 제1 호출음감지부를 이용하여, 상기 음성신호에 기 설정된 호출음의 포함여부를 판별하는 단계;
상기 제1 호출음감지부가 상기 호출음이 포함된 것으로 판별하면, 제2 감지특성을 가지는 제2 호출음감지부를 이용하여, 상기 음성신호 내에 상기 호출음의 포함여부를 재검사하는 단계; 및
상기 제2 호출음감지부가 상기 호출음이 포함된 것으로 판별하면, 제어부가 기 설정된 웨이크-업(wake-up) 신호를 생성하는 단계를 포함하는 호출음 인식방법.
Receiving a voice of a user and converting the voice into a voice signal;
Determining whether or not a predetermined ring tone is included in the voice signal using a first ring tone detector having a first sensing characteristic;
Re-inspecting whether or not the ringing tone is included in the voice signal using a second ringing tone sensing part having a second sensing characteristic when the first ringing tone sensing part determines that the ringing tone is included; And
Wherein the control unit generates a predetermined wake-up signal when the second ringing tone detector determines that the ringing tone is included.
음성수신부가 사용자의 음성을 수신하여 음성신호로 변환하는 단계;
제1 감지특성을 가지는 제1 호출음감지부를 이용하여, 상기 음성신호에 기 설정된 호출음의 포함여부를 판별하는 단계;
제2 감지특성을 가지는 제2 호출음감지부를 이용하여, 상기 음성신호 내에 상기 호출음의 포함여부를 판별하는 단계; 및
상기 제1 호출음감지부의 감지결과, 제2 호출음감지부의 감지결과 및 설정된 보류시간에 기초하여, 제어부가 기 설정된 웨이크-업(wake-up) 신호를 생성하는 단계를 포함하고,
상기 보류시간은, 상기 제1 호출음감지부가 상기 음성신호에 상기 호출음이 포함된 것으로 판별하고 상기 제2 호출음감지부가 상기 음성신호에 상기 호출음이 포함되지 않은 것으로 판별한 경우, 설정되는 것을 특징으로하는 호출음 인식방법.
Receiving a voice of a user and converting the voice into a voice signal;
Determining whether or not a predetermined ring tone is included in the voice signal using a first ring tone detector having a first sensing characteristic;
Determining whether the ringing tone is included in the voice signal using a second ringing tone detector having a second sensing characteristic; And
Generating a predetermined wake-up signal based on the detection result of the first ring tone detection section, the detection result of the second ring tone detection section, and the set retention time,
The hold time is set when the first call sound sensing section determines that the call sound is included in the voice signal and the second call sound sensing section determines that the call sound is not included in the voice signal / RTI >
KR1020180005064A 2018-01-15 2018-01-15 Apparatus for recognizing call sign and method for the same KR102052634B1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020180005064A KR102052634B1 (en) 2018-01-15 2018-01-15 Apparatus for recognizing call sign and method for the same
JP2019003317A JP6759370B2 (en) 2018-01-15 2019-01-11 Ring tone recognition device and ring tone recognition method
KR1020190157076A KR102308022B1 (en) 2018-01-15 2019-11-29 Apparatus for recognizing call sign and method for the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180005064A KR102052634B1 (en) 2018-01-15 2018-01-15 Apparatus for recognizing call sign and method for the same

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020190157076A Division KR102308022B1 (en) 2018-01-15 2019-11-29 Apparatus for recognizing call sign and method for the same

Publications (2)

Publication Number Publication Date
KR20190086928A true KR20190086928A (en) 2019-07-24
KR102052634B1 KR102052634B1 (en) 2019-12-06

Family

ID=67398741

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180005064A KR102052634B1 (en) 2018-01-15 2018-01-15 Apparatus for recognizing call sign and method for the same

Country Status (2)

Country Link
JP (1) JP6759370B2 (en)
KR (1) KR102052634B1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150106085A1 (en) * 2013-10-11 2015-04-16 Apple Inc. Speech recognition wake-up of a handheld portable electronic device

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9117449B2 (en) * 2012-04-26 2015-08-25 Nuance Communications, Inc. Embedded system for construction of small footprint speech recognition with user-definable constraints
JP6276513B2 (en) * 2013-04-12 2018-02-07 株式会社レイトロン Speech recognition apparatus and speech recognition program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150106085A1 (en) * 2013-10-11 2015-04-16 Apple Inc. Speech recognition wake-up of a handheld portable electronic device
US20160189716A1 (en) * 2013-10-11 2016-06-30 Apple Inc. Speech recognition wake-up of a handheld portable electronic device

Also Published As

Publication number Publication date
JP6759370B2 (en) 2020-09-23
KR102052634B1 (en) 2019-12-06
JP2019124937A (en) 2019-07-25

Similar Documents

Publication Publication Date Title
US11694695B2 (en) Speaker identification
US20180061396A1 (en) Methods and systems for keyword detection using keyword repetitions
US9354687B2 (en) Methods and apparatus for unsupervised wakeup with time-correlated acoustic events
US9553979B2 (en) Bluetooth headset and voice interaction control thereof
US9571617B2 (en) Controlling mute function on telephone
JP3674990B2 (en) Speech recognition dialogue apparatus and speech recognition dialogue processing method
US9940949B1 (en) Dynamic adjustment of expression detection criteria
US9830924B1 (en) Matching output volume to a command volume
US10147444B2 (en) Electronic apparatus and voice trigger method therefor
US5960393A (en) User selectable multiple threshold criteria for voice recognition
US9293134B1 (en) Source-specific speech interactions
US9335966B2 (en) Methods and apparatus for unsupervised wakeup
US20180174574A1 (en) Methods and systems for reducing false alarms in keyword detection
JP2019184809A (en) Voice recognition device and voice recognition method
KR102308022B1 (en) Apparatus for recognizing call sign and method for the same
KR20190086928A (en) Apparatus for recognizing call sign and method for the same
US11610596B2 (en) Adjustment method of sound output and electronic device performing the same
US11205433B2 (en) Method and apparatus for activating speech recognition
JP3846500B2 (en) Speech recognition dialogue apparatus and speech recognition dialogue processing method
EP4407618A1 (en) Dynamic selection of appropriate far-field signal separation algorithms
US20200321022A1 (en) Method and apparatus for detecting an end of an utterance
US7095846B2 (en) Half duplex device and signal processing method thereof
JPH10301595A (en) Voice recognition and response device
JPH04246696A (en) Voice recognition device

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right