KR20140059662A - Apparatus for processing voice recognition data and method thereof - Google Patents
Apparatus for processing voice recognition data and method thereofInfo
- Publication number
- KR20140059662A KR20140059662A KR1020120126341A KR20120126341A KR20140059662A KR 20140059662 A KR20140059662 A KR 20140059662A KR 1020120126341 A KR1020120126341 A KR 1020120126341A KR 20120126341 A KR20120126341 A KR 20120126341A KR 20140059662 A KR20140059662 A KR 20140059662A
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- signal
- noise
- voice signal
- database
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
본 발명은 음성인식 데이터 처리 장치 및 그 방법에 관한 것으로서, 보다 상세하게는 음성인식 시스템에서 사용자로부터 등록된 명령어가 아닌 음성이 입력된 경우 입력된 음성을 재생하여 줌으로써, 시스템은 제대로 동작하고 있으나 명령어가 아닌 음성이 입력된 것임을 용이하게 파악할 수 있도록 하는 음성인식 데이터 처리 장치 및 그 방법에 관한 것이다.
More particularly, the present invention relates to an apparatus and method for processing voice recognition data, and more particularly, to a system and method for processing voice recognition data, The present invention relates to a voice recognition data processing apparatus and a method thereof.
일반적으로, 차량 내에 구비된 AVN(Audio Video Navigation) 시스템의 경우, 사용자가 원하는 기능을 수행하기 위하여 버튼을 직접 입력하여 조작해야 하므로 매우 번거로운 뿐만 아니라, 운전에 집중도가 떨어져 안전운전에 방해요소로 작용할 수 있다.In general, in the case of an AVN (Audio Video Navigation) system provided in a vehicle, since a button is directly input and operated in order to perform a desired function, a user is not only troublesome, .
따라서, 최근 사용자의 편의와 안전성 향상을 위하여 차량용 AVN 장치에 음성인식 시스템을 장착하는 경우가 늘고 있다.Accordingly, in recent years, a voice recognition system has been installed in a vehicle AVN device for convenience and safety.
현재 차량용 AVN(Audio Video Navigation) 시스템의 음성인식 시스템은 외부 마이크를 장착하여, 마이크에 입력되는 음성을 AVN 시스템 내에 탑재된 음성인식 엔진을 사용하여 인식하고 처리한다.
Currently, a voice recognition system of an AVN (Audio Video Navigation) system for a vehicle is equipped with an external microphone and recognizes and processes the voice input to the microphone using a voice recognition engine installed in the AVN system.
이와 관련된 선행기술로는 대한민국 공개특허 10-2012-0019003호 "음성인식 안내 시스템 및 방법"(2012.03.06)이 있다.
A prior art related to this is Korean Patent Laid-Open Publication No. 10-00019003 entitled " Voice Recognition Guidance System and Method "(March 03, 2012).
일반적으로 음성인식 시스템은 AVN(Audio Video Navigation) 시스템의 기능을 수행하기 위한 다수의 명령어를 저장해두고, 사용자로부터 입력된 음성이 저장된 명령어와 일치할 경우에만 음성을 인식하여 명령어를 수행한다.In general, a speech recognition system stores a plurality of commands for performing a function of an AVN (Audio Video Navigation) system, and recognizes a voice only when a voice input from a user coincides with a stored command, and executes a command.
그러나, 사용자 입장에서는 명령어와 불일치하여 음성이 인식되지 않는 것인지 아니면, 노이즈와 같은 외부요인으로 인해 음성 입력이 제대로 이루어지지 않은 것인지와 같은 음성인식 에러의 원인을 정확하게 판별할 수 없으므로 시스템 신뢰도가 저하되는 문제점이 있다. However, since the user can not accurately determine the cause of the voice recognition error, such as whether the voice is not recognized due to inconsistency with the command or whether the voice input is not properly performed due to external factors such as noise, There is a problem.
본 발명은 상기와 같은 문제점을 개선하기 위해 창작된 것으로서, 음성인식 시스템에서 사용자로부터 등록된 명령어가 아닌 음성이 입력된 경우 입력된 음성을 재생하여 줌으로써, 시스템은 제대로 동작하고 있으나 명령어가 아닌 음성이 입력된 것임을 용이하게 파악할 수 있도록 하는 음성인식 데이터 처리 장치 및 그 방법을 제공하는데 그 목적이 있다.The present invention has been made in order to solve the above problems, and it is an object of the present invention to provide a voice recognition system in which a voice is inputted, A voice recognition data processing device and a method thereof.
또한, 본 발명은 사용자로부터 음성이 입력될 때, 노이즈 여부를 판단하여 안내해줌으로써 음성인식 에러의 원인을 보다 정확하게 파악할 수 있도록 하는 음성인식 데이터 처리 장치 및 그 방법을 제공하는데 그 목적이 있다.
It is another object of the present invention to provide a voice recognition data processing apparatus and a method thereof, which can more accurately grasp the cause of a voice recognition error by judging whether or not noise is inputted when a voice is input from a user.
본 발명의 일 측면에 따른 음성인식 데이터 처리 장치는, 마이크를 통해 입력된 음성신호를 녹음하여 저장하는 저장부; 다수의 명령어에 대응하는 각각의 음성데이터가 저장된 데이터베이스; 및 상기 녹음된 음성신호가 인식되면 상기 데이터베이스에 저장된 음성데이터들과 비교하여, 상기 음성데이터들 중 어느 하나와 일치하는 경우 해당 음성데이터에 대응되는 명령어 제어신호를 출력부를 통해 출력하고, 일치하지 않는 경우 상기 녹음된 음성신호를 스피커로 재생시키는 제어부; 를 포함하는 것을 특징으로 한다.According to an aspect of the present invention, there is provided an apparatus for processing speech recognition data, comprising: a storage unit for recording and storing a speech signal input through a microphone; A database storing respective voice data corresponding to a plurality of commands; And outputting a command control signal corresponding to the voice data when the recorded voice signal matches one of the voice data stored in the database through an output unit, A control unit for reproducing the recorded voice signal with a speaker; And a control unit.
본 발명은, 상기 저장부에 녹음된 음성신호의 신호대잡음비(SNR)를 계산하여, 상기 계산된 신호대잡음비에 따라 노이즈 여부를 판단하는 노이즈판단부; 를 더 포함하는 것을 특징으로 한다.The present invention may further comprise: a noise determination unit for calculating a signal-to-noise ratio (SNR) of the voice signal recorded in the storage unit and determining whether noise is present according to the calculated SNR; And further comprising:
본 발명에서, 상기 제어부는 상기 노이즈판단부를 통해 노이즈로 판단된 경우, 스피커로 노이즈 안내를 재생시키고, 노이즈가 아닌 것으로 판단된 경우, 상기 인식된 음성신호가 상기 데이터베이스에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하는 것을 특징으로 한다.In the present invention, when the noise is determined as noise through the noise determination unit, the control unit reproduces the noise guide with a speaker, and when it is determined that the noise is not noise, Is coincident with < / RTI >
본 발명의 다른 측면에 따른 음성인식 데이터 처리 방법은, 제어부가 마이크로부터 음성신호가 입력되는지 판단하는 단계; 상기 음성신호가 입력된 것으로 판단되면, 상기 음성신호를 녹음하여 저장하는 단계; 상기 녹음된 음성신호를 인식하여 데이터베이스에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하는 단계; 및 판단결과 일치하지 않는 경우, 상기 녹음된 음성신호를 스피커로 재생시키는 단계; 를 포함하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a method for processing speech recognition data, comprising: determining whether a control signal is input from a microphone; Recording and storing the voice signal when it is determined that the voice signal is input; Recognizing the recorded voice signal and determining whether it matches any one of voice data stored in a database; And reproducing the recorded voice signal with a speaker if the determination result is not coincident; And a control unit.
본 발명은, 상기 녹음된 음성신호가 스피커로 재생되면, 상기 녹음된 음성신호를 삭제하는 단계; 를 더 포함하는 것을 특징으로 한다.The method may further include deleting the recorded voice signal when the recorded voice signal is reproduced by a speaker. And further comprising:
본 발명에서, 상기 음성신호를 녹음하여 저장하는 단계는 상기 녹음된 음성신호의 신호대잡음비(SNR)를 계산하는 단계 및, 상기 계산된 신호대잡음비에 따라 노이즈 여부를 판단하는 단계를 더 포함하는 것을 특징으로 한다.In the present invention, the step of recording and storing the voice signal may further include calculating a signal-to-noise ratio (SNR) of the recorded voice signal, and determining whether noise is present according to the calculated SNR .
본 발명에서, 상기 신호대잡음비에 따라 노이즈 여부를 판단하는 단계는 상기 신호대잡음비가 기준값 이하인 경우, 노이즈로 판단하여 노이즈 안내를 재생하고, 상기 신호대잡음비가 기준값 초과인 경우, 노이즈가 아닌 것으로 판단하여 상기 인식된 음성신호가 상기 데이터베이스에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하는 단계를 수행하는 것을 특징으로 한다.In the present invention, it is preferable that the step of determining noise according to the signal-to-noise ratio comprises: if the signal-to-noise ratio is less than or equal to a reference value, And determining whether the recognized voice signal matches one of the voice data stored in the database.
본 발명에서, 상기 데이터베이스에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하는 단계는 판단결과 일치하는 경우, 해당 음성데이터에 대응되는 명령어 제어신호를 출력하는 단계를 더 포함하는 것을 특징으로 한다.
According to an embodiment of the present invention, the step of determining whether the voice data matches the voice data stored in the database may further include a step of outputting a command control signal corresponding to the voice data if the voice data match.
본 발명은 음성인식 시스템에서 사용자로부터 등록된 명령어가 아닌 음성이 입력된 경우 입력된 음성을 재생하여 줌으로써, 시스템은 제대로 동작하고 있으나 명령어가 아닌 음성이 입력된 것임을 용이하게 파악할 수 있어 사용자에게 시스템이 제대로 동작하고 있는 상황을 인식하여 줌으로써 시스템 신뢰도를 향상시킬 수 있다.The present invention can easily recognize that the system is operating properly but a voice other than the command is inputted by reproducing the inputted voice when the voice is inputted from the user rather than the registered command from the user in the voice recognition system, System reliability can be improved by recognizing the situation that is operating properly.
또한, 본 발명은 사용자로부터 음성이 입력될 때, 노이즈 여부를 판단하여 안내해줌으로써 음성인식 에러의 원인을 보다 정확하게 파악할 수 있도록 한다.
In addition, the present invention allows a user to more precisely understand the cause of a speech recognition error by determining whether noise is present when the user inputs speech.
도 1은 본 발명의 일 실시예에 따른 음성인식 데이터 처리 장치를 나타낸 블록구성도,
도 2는 본 발명의 일 실시예에 따른 음성인식 데이터 처리 방법을 설명하기 위한 순서도이다.1 is a block diagram illustrating a speech recognition data processing apparatus according to an embodiment of the present invention;
2 is a flowchart for explaining a speech recognition data processing method according to an embodiment of the present invention.
이하, 첨부된 도면을 참조하여 본 발명에 따른 음성인식 데이터 처리 장치 및 그 방법의 일 실시예를 상세하게 설명한다. 이러한 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로, 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.Hereinafter, an embodiment of a speech recognition data processing apparatus and method according to the present invention will be described in detail with reference to the accompanying drawings. In this process, the thicknesses of the lines and the sizes of the components shown in the drawings may be exaggerated for clarity and convenience of explanation. In addition, the terms described below are defined in consideration of the functions of the present invention, which may vary depending on the intention or custom of the user, the operator. Therefore, definitions of these terms should be made based on the contents throughout this specification.
도 1은 본 발명의 일 실시예에 따른 음성인식 데이터 처리 장치를 나타낸 블록구성도이다.1 is a block diagram illustrating a speech recognition data processing apparatus according to an embodiment of the present invention.
도 1에 도시된 바와 같이 본 발명은, 마이크(10), 저장부(20), 데이터베이스(30), 노이즈판단부(40), 제어부(50), 스피커(60) 및 출력부(70)를 포함한다.1, the present invention includes a
마이크(10)를 통해 사용자로부터 음성신호가 입력된다.A voice signal is input from the user through the
저장부(20)는 마이크(10)를 통해 입력된 음성신호를 녹음하여 저장한다.The
데이터베이스(30)는 다수의 명령어에 대응하는 각각의 음성데이터가 저장된다.The
노이즈판단부(40)는 저장부(20)에 녹음된 음성신호의 신호대잡음비(SNR)를 계산하여, 계산된 신호대잡음비에 따라 노이즈 여부를 판단하여 제어부(40)로 판단 결과를 전달한다.The
자세히는, 볼륨측정기(미도시)를 통해 녹음된 음성신호의 볼륨을 측정하고, 주변의 노이즈 세기를 측정하여 신호 및 노이즈의 세기를 통해 신호대잡음비를 계산하는데, 이렇게 계산된 신호대잡음비값이 6dB 이하인 경우, 노이즈로 판단한다.In detail, the volume of a recorded voice signal is measured by a volume meter (not shown), and the noise intensity of the surroundings is measured to calculate the signal-to-noise ratio through the intensity of the signal and noise. , It is judged as noise.
이때, 제어부(50)는 스피커(60)로 노이즈 안내를 재생시킨다.At this time, the
예를들면, "현재 주변 노이즈가 많아서 인식하기 힘든 환경입니다."와 같은 안내멘트를 재생시킨다.For example, it reproduces an announcement such as "This environment is inconceivable because of a lot of ambient noise."
또는, 안내멘트 대신 마이크(10) 입력 신호값에 대한 디지털 증폭을 실시하여 신호대잡음비를 인위적으로 조절하여 시스템 자체내에서 처리하도록 할 수도 있다.Alternatively, digital amplification of the input signal value of the
만약, 노이즈가 아닌 것으로 판단된 경우, 제어부(50)는 녹음된 음성신호가 인식되면 데이터베이스(30)에 저장된 음성데이터들과 비교하여, 음성데이터들 중 어느 하나와 일치하는 경우 일치하는 음성데이터에 대응되는 명령어 제어신호를 출력부(70)를 통해 출력하고, 일치하지 않는 경우 녹음된 음성신호를 스피커(60)로 재생시킨다.If it is determined that the noise is not noise, the
즉, 마이크(10)를 통해 입력된 음성신호를 그대로 피드백하여 스피커(60)로 재생시킨다.That is, the audio signal inputted through the
이때, 마이크(10)를 통해 입력된 음성신호에 안내멘트를 결합하여 스피커(60)로 재생시킬 수도 있다.At this time, the announcement can be combined with the voice signal input through the
예를들면, 오디오 구동중 마이크(10)를 통해 "채널 검색"이라는 음성신호가 입력되면, 데이터베이스(30)에 저장된 음성데이터와 비교하여, 데이터베이스(30)내에 존재하지 않는 경우 스피커(60)로 "채널 검색 명령은 등록되어 있지 않습니다."와 같은 멘트가 재생되도록 할 수도 있다.For example, when a voice signal of "channel search" is inputted through the
또한, 제어부(50)는 녹음된 음성신호가 인식되어 데이터베이스(30)에 저장된 음성데이터들 중 어느 하나와 일치하는 경우, 일치하는 음성데이터에 안내멘트를 결합하여 스피커(60)로 재생시킬 수도 있다. In addition, when the recorded voice signal is recognized and matches with any one of the voice data stored in the
예를들면, 오디오 구동중 마이크(10)를 통해 "채널 검색"이라는 음성신호가 입력되면, 데이터베이스(30)에 저장된 음성데이터와 비교하여, 데이터베이스(30)내에 존재하는 경우 스피커(60)로 "채널 검색 명령을 수행합니다."와 같은 멘트가 재생되도록 할 수도 있다.For example, when a voice signal of "channel search" is input through the
또한, 출력부(70)는 AVN시스템(미도시)과 같은 외부장치와 연동되어 제어부(40)로부터 전달되는 명령어 제어신호에 따라 AVN시스템이 구동되도록 할 수도 있다.The
따라서, 본 발명에 의한 음성인식 데이터 처리 장치에 따르면 음성인식 시스템에서 사용자로부터 등록된 명령어가 아닌 음성이 입력된 경우 입력된 음성을 재생하여 줌으로써, 시스템은 제대로 동작하고 있으나 명령어가 아닌 음성이 입력된 것임을 용이하게 파악할 수 있어 사용자에게 시스템이 제대로 동작하고 있는 상황을 인식하여 줌으로써 시스템 신뢰도를 향상시킬 수 있다.Therefore, according to the speech recognition data processing apparatus according to the present invention, when a voice is inputted from a user but not a command registered from the user in the voice recognition system, the inputted voice is reproduced so that the system operates properly, Therefore, it is possible to improve the system reliability by recognizing the situation where the system is operating properly.
또한, 사용자로부터 음성이 입력될 때, 노이즈 여부를 판단하여 안내해줌으로써 음성인식 에러의 원인을 보다 정확하게 파악할 수 있도록 한다.
Further, when a voice is input from the user, it is determined whether or not noise is present, and guidance is provided so that the cause of the voice recognition error can be grasped more accurately.
도 2는 본 발명의 일 실시예에 따른 음성인식 데이터 처리 방법의 동작 흐름을 도시한 순서도로써, 이를 참조하여 본 발명의 구체적인 동작을 설명한다.FIG. 2 is a flowchart illustrating an operational flow of a speech recognition data processing method according to an embodiment of the present invention. Referring to FIG. 2, a specific operation of the present invention will be described.
먼저, 제어부(50)가 마이크(10)로부터 음성신호가 입력되는지 판단한다(S10).First, the
이때, 음성신호가 입력된 것으로 판단되면, 음성신호를 녹음하여 저장한다(S20).At this time, if it is determined that the voice signal is input, the voice signal is recorded and stored (S20).
그 다음, 녹음된 음성신호의 신호대잡음비(SNR)를 계산한다(S30).Next, the signal-to-noise ratio (SNR) of the recorded voice signal is calculated (S30).
자세히는, 볼륨측정기(미도시)를 통해 녹음된 음성신호의 볼륨을 측정하고, 주변의 노이즈 세기를 측정하여 신호 및 노이즈의 세기를 통해 신호대잡음비를 계산하는데, 이렇게 계산된 신호대잡음비값이 6dB 이하인 경우, 노이즈로 판단한다(S40).In detail, the volume of a recorded voice signal is measured by a volume meter (not shown), and the noise intensity of the surroundings is measured to calculate the signal-to-noise ratio through the intensity of the signal and noise. , It is determined as noise (S40).
노이즈로 판단된 경우, 스피커(60)로 노이즈 안내를 재생시킨다(S41).If it is judged that the noise is noise, the noise guide is reproduced by the speaker 60 (S41).
예를들면, "현재 주변 노이즈가 많아서 인식하기 힘든 환경입니다."와 같은 안내멘트를 재생시킨다.For example, it reproduces an announcement such as "This environment is inconceivable because of a lot of ambient noise."
또는, 안내멘트 대신 마이크(10) 입력 신호값에 대한 디지털 증폭을 실시하여 신호대잡음비를 인위적으로 조절하여 시스템 자체내에서 처리하도록 할 수도 있다.Alternatively, digital amplification of the input signal value of the
만약, 노이즈가 아닌 것으로 판단된 경우, 녹음된 음성신호를 인식하여(S50) 데이터베이스(30)에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하고(S60), 일치하는 경우 해당 음성데이터에 대응되는 명령어 제어신호를 출력부(70)로 입력한다(S61).If it is determined that it is not noise, the recorded voice signal is recognized (S50) and it is judged whether it matches any one of the voice data stored in the database 30 (S60). If they match, The command control signal is input to the output unit 70 (S61).
이때, 출력부(70)는 AVN시스템(미도시)과 같은 외부장치와 연동되어 제어부(40)로부터 전달되는 명령어 제어신호에 따라 AVN시스템이 구동되도록 할 수도 있다.At this time, the
그러나, 녹음된 음성신호가 데이터베이스(30)에 저장된 음성데이터들 중 어느 하나와 일치하지 않는 경우 녹음된 음성신호를 스피커(60)로 재생시킨다(S70).However, if the recorded voice signal does not match any of the voice data stored in the
즉, 마이크(10)를 통해 입력된 음성신호를 그대로 피드백하여 스피커(60)로 재생시킨다.That is, the audio signal inputted through the
이때, 마이크(10)를 통해 입력된 음성신호에 안내멘트를 결합하여 스피커(60)로 재생시킬 수도 있다.At this time, the announcement can be combined with the voice signal input through the
예를들면, 오디오 구동중 마이크(10)를 통해 "채널 검색"이라는 음성신호가 입력되면, 데이터베이스(30)에 저장된 음성데이터와 비교하여, 데이터베이스(30)내에 존재하지 않는 경우 스피커(60)로 "채널 검색 명령은 등록되어 있지 않습니다."와 같은 멘트가 재생되도록 할 수도 있다.For example, when a voice signal of "channel search" is inputted through the
또한, 제어부(50)는 녹음된 음성신호가 데이터베이스(30)에 저장된 음성데이터들 중 어느 하나와 일치하는 경우, 일치하는 음성데이터에 안내멘트를 결합하여 스피커(60)로 재생시킬 수도 있다. When the recorded voice signal matches any one of the voice data stored in the
예를들면, 오디오 구동중 마이크(10)를 통해 "채널 검색"이라는 음성데이터가 입력되면, 데이터베이스(30)에 저장된 음성데이터와 비교하여, 데이터베이스(30)내에 존재하는 음성데이터인 경우 스피커(60)로 "채널 검색 명령을 수행합니다."와 같은 멘트가 재생되도록 할 수도 있다.For example, when voice data called "channel search" is inputted through the
이때, 녹음된 음성신호가 스피커(60)로 재생되면, 녹음된 음성신호가 초기화 되도록 삭제한다(S80).At this time, when the recorded voice signal is reproduced by the
따라서, 본 발명에 의한 음성인식 데이터 처리 방법에 따르면 음성인식 시스템에서 사용자로부터 등록된 명령어가 아닌 음성이 입력된 경우 입력된 음성을 재생하여 줌으로써, 시스템은 제대로 동작하고 있으나 명령어가 아닌 음성이 입력된 것임을 용이하게 파악할 수 있어 사용자에게 시스템이 제대로 동작하고 있는 상황을 인식하여 줌으로써 시스템 신뢰도를 향상시킬 수 있다.Therefore, according to the speech recognition data processing method according to the present invention, when a voice is inputted from a user but not a command registered from the user in the voice recognition system, the inputted voice is reproduced so that the system operates properly, Therefore, it is possible to improve the system reliability by recognizing the situation where the system is operating properly.
또한, 사용자로부터 음성이 입력될 때, 노이즈 여부를 판단하여 안내해줌으로써 음성인식 에러의 원인을 보다 정확하게 파악할 수 있도록 한다.
Further, when a voice is input from the user, it is determined whether or not noise is present, and guidance is provided so that the cause of the voice recognition error can be grasped more accurately.
본 발명은 도면에 도시된 실시예를 참고로 하여 설명되었으나, 이는 예시적인 것에 불과하며, 당해 기술이 속하는 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 기술적 보호범위는 아래의 특허청구범위에 의해서 정하여져야 할 것이다.
While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it will be understood by those of ordinary skill in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims. I will understand. Accordingly, the technical scope of the present invention should be defined by the following claims.
10 : 마이크 20 : 저장부
30 : 데이터베이스 40 : 노이즈판단부
50 : 제어부 60 : 스피커
70 : 출력부10: microphone 20: storage unit
30: Database 40: Noise judging unit
50: control unit 60: speaker
70:
Claims (8)
다수의 명령어에 대응하는 각각의 음성데이터가 저장된 데이터베이스; 및
상기 녹음된 음성신호가 인식되면 상기 데이터베이스에 저장된 음성데이터들과 비교하여, 상기 음성데이터들 중 어느 하나와 일치하는 경우 해당 음성데이터에 대응되는 명령어 제어신호를 출력부를 통해 출력하고, 일치하지 않는 경우 상기 녹음된 음성신호를 스피커로 재생시키는 제어부; 를 포함하는 음성인식 데이터 처리 장치.
A storage unit for recording and storing a voice signal input through a microphone;
A database storing respective voice data corresponding to a plurality of commands; And
If the recorded voice signal is recognized, it is compared with the voice data stored in the database, and if it matches any one of the voice data, a command control signal corresponding to the voice data is output through an output unit, A controller for reproducing the recorded voice signal with a speaker; And the voice recognition data processing unit.
상기 저장부에 녹음된 음성신호의 신호대잡음비(SNR)를 계산하여, 상기 계산된 신호대잡음비에 따라 노이즈 여부를 판단하는 노이즈판단부; 를 더 포함하는 음성인식 데이터 처리 장치.
The method according to claim 1,
A noise determination unit for calculating a signal-to-noise ratio (SNR) of the voice signal recorded in the storage unit and determining whether noise is present according to the calculated SNR; The speech recognition data processing apparatus further comprising:
상기 노이즈판단부를 통해 노이즈로 판단된 경우, 스피커로 노이즈 안내를 재생시키고,
노이즈가 아닌 것으로 판단된 경우, 상기 인식된 음성신호가 상기 데이터베이스에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하는 것을 특징으로 하는 음성인식 데이터 처리 장치.
3. The apparatus of claim 2, wherein the control unit
When the noise is determined as noise through the noise determination unit,
And determines whether the recognized voice signal matches any one of the voice data stored in the database when it is determined that the voice data is not noise.
상기 음성신호가 입력된 것으로 판단되면, 상기 음성신호를 녹음하여 저장하는 단계;
상기 녹음된 음성신호를 인식하여 데이터베이스에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하는 단계; 및
판단결과 일치하지 않는 경우, 상기 녹음된 음성신호를 스피커로 재생시키는 단계; 를 포함하는 음성인식 데이터 처리 방법.
Determining whether a voice signal is input from a microphone;
Recording and storing the voice signal when it is determined that the voice signal is input;
Recognizing the recorded voice signal and determining whether it matches any one of voice data stored in a database; And
Reproducing the recorded voice signal with a speaker if the determination result does not match; The speech recognition data processing method comprising the steps of:
상기 녹음된 음성신호가 스피커로 재생되면, 상기 녹음된 음성신호를 삭제하는 단계; 를 더 포함하는 음성인식 데이터 처리 방법.
5. The method of claim 4,
When the recorded voice signal is reproduced by a speaker, deleting the recorded voice signal; Further comprising the steps of:
상기 녹음된 음성신호의 신호대잡음비(SNR)를 계산하는 단계 및,
상기 계산된 신호대잡음비에 따라 노이즈 여부를 판단하는 단계를 더 포함하는 것을 특징으로 하는 음성인식 데이터 처리 방법.
5. The method of claim 4, wherein recording and storing the voice signal comprises:
Calculating a signal-to-noise ratio (SNR) of the recorded voice signal;
And determining whether noise is present according to the calculated signal-to-noise ratio.
상기 신호대잡음비가 기준값 이하인 경우, 노이즈로 판단하여 노이즈 안내를 재생하고, 상기 신호대잡음비가 기준값 초과인 경우, 노이즈가 아닌 것으로 판단하여 상기 인식된 음성신호가 상기 데이터베이스에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하는 단계를 수행하는 것을 특징으로 하는 음성인식 데이터 처리 방법.
7. The method of claim 6, wherein the step of determining whether noise is present according to the signal-
Determining whether the signal-to-noise ratio is not noise when the signal-to-noise ratio exceeds a reference value, determining that the recognized voice signal is not one of the voice data stored in the database, And determining whether the speech recognition data matches with the speech recognition data.
판단결과 일치하는 경우, 해당 음성데이터에 대응되는 명령어 제어신호를 출력하는 단계를 더 포함하는 것을 특징으로 하는 음성인식 데이터 처리 방법.5. The method of claim 4, wherein the step of determining whether any one of the voice data stored in the database matches
And outputting a command control signal corresponding to the voice data when the determination results match.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120126341A KR20140059662A (en) | 2012-11-08 | 2012-11-08 | Apparatus for processing voice recognition data and method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120126341A KR20140059662A (en) | 2012-11-08 | 2012-11-08 | Apparatus for processing voice recognition data and method thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20140059662A true KR20140059662A (en) | 2014-05-16 |
Family
ID=50889431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020120126341A KR20140059662A (en) | 2012-11-08 | 2012-11-08 | Apparatus for processing voice recognition data and method thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20140059662A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016208789A1 (en) * | 2015-06-26 | 2016-12-29 | 삼성전자 주식회사 | Method for determining sound and device therefor |
KR20190133962A (en) | 2018-05-24 | 2019-12-04 | 주식회사 케이티 | Device, server and method controlling operation based on customized voice command |
-
2012
- 2012-11-08 KR KR1020120126341A patent/KR20140059662A/en not_active Application Discontinuation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016208789A1 (en) * | 2015-06-26 | 2016-12-29 | 삼성전자 주식회사 | Method for determining sound and device therefor |
US10839827B2 (en) | 2015-06-26 | 2020-11-17 | Samsung Electronics Co., Ltd. | Method for determining sound and device therefor |
KR20190133962A (en) | 2018-05-24 | 2019-12-04 | 주식회사 케이티 | Device, server and method controlling operation based on customized voice command |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10991374B2 (en) | Request-response procedure based voice control method, voice control device and computer readable storage medium | |
US10586534B1 (en) | Voice-controlled device control using acoustic echo cancellation statistics | |
US10446155B2 (en) | Voice recognition device | |
US10643605B2 (en) | Automatic multi-performance evaluation system for hybrid speech recognition | |
US20210134291A1 (en) | Electronic device and controlling method thereof | |
US7822613B2 (en) | Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus | |
US20210243528A1 (en) | Spatial Audio Signal Filtering | |
JP5075664B2 (en) | Spoken dialogue apparatus and support method | |
CA2795189A1 (en) | Automatic gain control | |
US20180217985A1 (en) | Control method of translation device, translation device, and non-transitory computer-readable recording medium storing a program | |
US20200160862A1 (en) | In-vehicle device and speech recognition method | |
US10224029B2 (en) | Method for using voiceprint identification to operate voice recognition and electronic device thereof | |
KR20140059662A (en) | Apparatus for processing voice recognition data and method thereof | |
US20130197802A1 (en) | Information processing apparatus, non-transitory computer-readable recording medium, and information processing method | |
CN102906811A (en) | Method for adjusting voice recognition system comprising speaker and microphone, and voice recognition system | |
KR20180036032A (en) | Image processing apparatus and recording media | |
KR20180005828A (en) | Method and vehicle controller for intuitive adjusting sound volume | |
JP2007101892A (en) | Speech recognition device | |
US11735187B2 (en) | Hybrid routing for hands-free voice assistant, and related systems and methods | |
KR101710695B1 (en) | Microphone control system for voice recognition of automobile and control method therefor | |
KR20180124226A (en) | WEARABLE DEVICE, IoT DEVICE AND VEHICLE VOICE RECOGNITION OPERATING SYSTEM AND METHOD | |
US20220215854A1 (en) | Speech sound response device and speech sound response method | |
JP2010107614A (en) | Voice guidance and response method | |
KR20160044652A (en) | Control method of avn system for vehicle using voice recognition | |
JP6723033B2 (en) | Information processing device, information processing system, server, terminal device, information processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Withdrawal due to no request for examination |