KR20140059662A - Apparatus for processing voice recognition data and method thereof - Google Patents

Apparatus for processing voice recognition data and method thereof

Info

Publication number
KR20140059662A
KR20140059662A KR1020120126341A KR20120126341A KR20140059662A KR 20140059662 A KR20140059662 A KR 20140059662A KR 1020120126341 A KR1020120126341 A KR 1020120126341A KR 20120126341 A KR20120126341 A KR 20120126341A KR 20140059662 A KR20140059662 A KR 20140059662A
Authority
KR
South Korea
Prior art keywords
voice
signal
noise
voice signal
database
Prior art date
Application number
KR1020120126341A
Other languages
Korean (ko)
Inventor
김성중
Original Assignee
현대모비스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대모비스 주식회사 filed Critical 현대모비스 주식회사
Priority to KR1020120126341A priority Critical patent/KR20140059662A/en
Publication of KR20140059662A publication Critical patent/KR20140059662A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

The present invention provides a voice recognition data processing device and a method thereof. The voice recognition data processing device includes: a storage unit which records and stores a voice signal inputted through a microphone; a database in which voice datasets corresponding to a plurality of commands are stored; and a control unit which compares the voice signal with the voice datasets stored in the database if the recorded voice signal is recognized and, if the voice signal is matched to one among the voice datasets, outputs a command control signal corresponding to the matched voice dataset or, if no match, outputs the recorded voice signal through a speaker. According to the present invention, if a voice signal which is not a registered command is inputted from a user in a voice recognition system, the voice recognition data processing device plays the inputted voice signal so that the system is able to recognize that the system properly functions but the inputted voice signal is not a registered command.

Description

음성인식 데이터 처리 장치 및 그 방법{APPARATUS FOR PROCESSING VOICE RECOGNITION DATA AND METHOD THEREOF}[0001] APPARATUS FOR PROCESSING VOICE RECOGNITION DATA AND METHOD THEREOF [0002]

본 발명은 음성인식 데이터 처리 장치 및 그 방법에 관한 것으로서, 보다 상세하게는 음성인식 시스템에서 사용자로부터 등록된 명령어가 아닌 음성이 입력된 경우 입력된 음성을 재생하여 줌으로써, 시스템은 제대로 동작하고 있으나 명령어가 아닌 음성이 입력된 것임을 용이하게 파악할 수 있도록 하는 음성인식 데이터 처리 장치 및 그 방법에 관한 것이다.
More particularly, the present invention relates to an apparatus and method for processing voice recognition data, and more particularly, to a system and method for processing voice recognition data, The present invention relates to a voice recognition data processing apparatus and a method thereof.

일반적으로, 차량 내에 구비된 AVN(Audio Video Navigation) 시스템의 경우, 사용자가 원하는 기능을 수행하기 위하여 버튼을 직접 입력하여 조작해야 하므로 매우 번거로운 뿐만 아니라, 운전에 집중도가 떨어져 안전운전에 방해요소로 작용할 수 있다.In general, in the case of an AVN (Audio Video Navigation) system provided in a vehicle, since a button is directly input and operated in order to perform a desired function, a user is not only troublesome, .

따라서, 최근 사용자의 편의와 안전성 향상을 위하여 차량용 AVN 장치에 음성인식 시스템을 장착하는 경우가 늘고 있다.Accordingly, in recent years, a voice recognition system has been installed in a vehicle AVN device for convenience and safety.

현재 차량용 AVN(Audio Video Navigation) 시스템의 음성인식 시스템은 외부 마이크를 장착하여, 마이크에 입력되는 음성을 AVN 시스템 내에 탑재된 음성인식 엔진을 사용하여 인식하고 처리한다.
Currently, a voice recognition system of an AVN (Audio Video Navigation) system for a vehicle is equipped with an external microphone and recognizes and processes the voice input to the microphone using a voice recognition engine installed in the AVN system.

이와 관련된 선행기술로는 대한민국 공개특허 10-2012-0019003호 "음성인식 안내 시스템 및 방법"(2012.03.06)이 있다.
A prior art related to this is Korean Patent Laid-Open Publication No. 10-00019003 entitled " Voice Recognition Guidance System and Method "(March 03, 2012).

일반적으로 음성인식 시스템은 AVN(Audio Video Navigation) 시스템의 기능을 수행하기 위한 다수의 명령어를 저장해두고, 사용자로부터 입력된 음성이 저장된 명령어와 일치할 경우에만 음성을 인식하여 명령어를 수행한다.In general, a speech recognition system stores a plurality of commands for performing a function of an AVN (Audio Video Navigation) system, and recognizes a voice only when a voice input from a user coincides with a stored command, and executes a command.

그러나, 사용자 입장에서는 명령어와 불일치하여 음성이 인식되지 않는 것인지 아니면, 노이즈와 같은 외부요인으로 인해 음성 입력이 제대로 이루어지지 않은 것인지와 같은 음성인식 에러의 원인을 정확하게 판별할 수 없으므로 시스템 신뢰도가 저하되는 문제점이 있다. However, since the user can not accurately determine the cause of the voice recognition error, such as whether the voice is not recognized due to inconsistency with the command or whether the voice input is not properly performed due to external factors such as noise, There is a problem.

본 발명은 상기와 같은 문제점을 개선하기 위해 창작된 것으로서, 음성인식 시스템에서 사용자로부터 등록된 명령어가 아닌 음성이 입력된 경우 입력된 음성을 재생하여 줌으로써, 시스템은 제대로 동작하고 있으나 명령어가 아닌 음성이 입력된 것임을 용이하게 파악할 수 있도록 하는 음성인식 데이터 처리 장치 및 그 방법을 제공하는데 그 목적이 있다.The present invention has been made in order to solve the above problems, and it is an object of the present invention to provide a voice recognition system in which a voice is inputted, A voice recognition data processing device and a method thereof.

또한, 본 발명은 사용자로부터 음성이 입력될 때, 노이즈 여부를 판단하여 안내해줌으로써 음성인식 에러의 원인을 보다 정확하게 파악할 수 있도록 하는 음성인식 데이터 처리 장치 및 그 방법을 제공하는데 그 목적이 있다.
It is another object of the present invention to provide a voice recognition data processing apparatus and a method thereof, which can more accurately grasp the cause of a voice recognition error by judging whether or not noise is inputted when a voice is input from a user.

본 발명의 일 측면에 따른 음성인식 데이터 처리 장치는, 마이크를 통해 입력된 음성신호를 녹음하여 저장하는 저장부; 다수의 명령어에 대응하는 각각의 음성데이터가 저장된 데이터베이스; 및 상기 녹음된 음성신호가 인식되면 상기 데이터베이스에 저장된 음성데이터들과 비교하여, 상기 음성데이터들 중 어느 하나와 일치하는 경우 해당 음성데이터에 대응되는 명령어 제어신호를 출력부를 통해 출력하고, 일치하지 않는 경우 상기 녹음된 음성신호를 스피커로 재생시키는 제어부; 를 포함하는 것을 특징으로 한다.According to an aspect of the present invention, there is provided an apparatus for processing speech recognition data, comprising: a storage unit for recording and storing a speech signal input through a microphone; A database storing respective voice data corresponding to a plurality of commands; And outputting a command control signal corresponding to the voice data when the recorded voice signal matches one of the voice data stored in the database through an output unit, A control unit for reproducing the recorded voice signal with a speaker; And a control unit.

본 발명은, 상기 저장부에 녹음된 음성신호의 신호대잡음비(SNR)를 계산하여, 상기 계산된 신호대잡음비에 따라 노이즈 여부를 판단하는 노이즈판단부; 를 더 포함하는 것을 특징으로 한다.The present invention may further comprise: a noise determination unit for calculating a signal-to-noise ratio (SNR) of the voice signal recorded in the storage unit and determining whether noise is present according to the calculated SNR; And further comprising:

본 발명에서, 상기 제어부는 상기 노이즈판단부를 통해 노이즈로 판단된 경우, 스피커로 노이즈 안내를 재생시키고, 노이즈가 아닌 것으로 판단된 경우, 상기 인식된 음성신호가 상기 데이터베이스에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하는 것을 특징으로 한다.In the present invention, when the noise is determined as noise through the noise determination unit, the control unit reproduces the noise guide with a speaker, and when it is determined that the noise is not noise, Is coincident with < / RTI >

본 발명의 다른 측면에 따른 음성인식 데이터 처리 방법은, 제어부가 마이크로부터 음성신호가 입력되는지 판단하는 단계; 상기 음성신호가 입력된 것으로 판단되면, 상기 음성신호를 녹음하여 저장하는 단계; 상기 녹음된 음성신호를 인식하여 데이터베이스에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하는 단계; 및 판단결과 일치하지 않는 경우, 상기 녹음된 음성신호를 스피커로 재생시키는 단계; 를 포함하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a method for processing speech recognition data, comprising: determining whether a control signal is input from a microphone; Recording and storing the voice signal when it is determined that the voice signal is input; Recognizing the recorded voice signal and determining whether it matches any one of voice data stored in a database; And reproducing the recorded voice signal with a speaker if the determination result is not coincident; And a control unit.

본 발명은, 상기 녹음된 음성신호가 스피커로 재생되면, 상기 녹음된 음성신호를 삭제하는 단계; 를 더 포함하는 것을 특징으로 한다.The method may further include deleting the recorded voice signal when the recorded voice signal is reproduced by a speaker. And further comprising:

본 발명에서, 상기 음성신호를 녹음하여 저장하는 단계는 상기 녹음된 음성신호의 신호대잡음비(SNR)를 계산하는 단계 및, 상기 계산된 신호대잡음비에 따라 노이즈 여부를 판단하는 단계를 더 포함하는 것을 특징으로 한다.In the present invention, the step of recording and storing the voice signal may further include calculating a signal-to-noise ratio (SNR) of the recorded voice signal, and determining whether noise is present according to the calculated SNR .

본 발명에서, 상기 신호대잡음비에 따라 노이즈 여부를 판단하는 단계는 상기 신호대잡음비가 기준값 이하인 경우, 노이즈로 판단하여 노이즈 안내를 재생하고, 상기 신호대잡음비가 기준값 초과인 경우, 노이즈가 아닌 것으로 판단하여 상기 인식된 음성신호가 상기 데이터베이스에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하는 단계를 수행하는 것을 특징으로 한다.In the present invention, it is preferable that the step of determining noise according to the signal-to-noise ratio comprises: if the signal-to-noise ratio is less than or equal to a reference value, And determining whether the recognized voice signal matches one of the voice data stored in the database.

본 발명에서, 상기 데이터베이스에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하는 단계는 판단결과 일치하는 경우, 해당 음성데이터에 대응되는 명령어 제어신호를 출력하는 단계를 더 포함하는 것을 특징으로 한다.
According to an embodiment of the present invention, the step of determining whether the voice data matches the voice data stored in the database may further include a step of outputting a command control signal corresponding to the voice data if the voice data match.

본 발명은 음성인식 시스템에서 사용자로부터 등록된 명령어가 아닌 음성이 입력된 경우 입력된 음성을 재생하여 줌으로써, 시스템은 제대로 동작하고 있으나 명령어가 아닌 음성이 입력된 것임을 용이하게 파악할 수 있어 사용자에게 시스템이 제대로 동작하고 있는 상황을 인식하여 줌으로써 시스템 신뢰도를 향상시킬 수 있다.The present invention can easily recognize that the system is operating properly but a voice other than the command is inputted by reproducing the inputted voice when the voice is inputted from the user rather than the registered command from the user in the voice recognition system, System reliability can be improved by recognizing the situation that is operating properly.

또한, 본 발명은 사용자로부터 음성이 입력될 때, 노이즈 여부를 판단하여 안내해줌으로써 음성인식 에러의 원인을 보다 정확하게 파악할 수 있도록 한다.
In addition, the present invention allows a user to more precisely understand the cause of a speech recognition error by determining whether noise is present when the user inputs speech.

도 1은 본 발명의 일 실시예에 따른 음성인식 데이터 처리 장치를 나타낸 블록구성도,
도 2는 본 발명의 일 실시예에 따른 음성인식 데이터 처리 방법을 설명하기 위한 순서도이다.
1 is a block diagram illustrating a speech recognition data processing apparatus according to an embodiment of the present invention;
2 is a flowchart for explaining a speech recognition data processing method according to an embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 발명에 따른 음성인식 데이터 처리 장치 및 그 방법의 일 실시예를 상세하게 설명한다. 이러한 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로, 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.Hereinafter, an embodiment of a speech recognition data processing apparatus and method according to the present invention will be described in detail with reference to the accompanying drawings. In this process, the thicknesses of the lines and the sizes of the components shown in the drawings may be exaggerated for clarity and convenience of explanation. In addition, the terms described below are defined in consideration of the functions of the present invention, which may vary depending on the intention or custom of the user, the operator. Therefore, definitions of these terms should be made based on the contents throughout this specification.

도 1은 본 발명의 일 실시예에 따른 음성인식 데이터 처리 장치를 나타낸 블록구성도이다.1 is a block diagram illustrating a speech recognition data processing apparatus according to an embodiment of the present invention.

도 1에 도시된 바와 같이 본 발명은, 마이크(10), 저장부(20), 데이터베이스(30), 노이즈판단부(40), 제어부(50), 스피커(60) 및 출력부(70)를 포함한다.1, the present invention includes a microphone 10, a storage unit 20, a database 30, a noise determination unit 40, a control unit 50, a speaker 60, and an output unit 70 .

마이크(10)를 통해 사용자로부터 음성신호가 입력된다.A voice signal is input from the user through the microphone 10. [

저장부(20)는 마이크(10)를 통해 입력된 음성신호를 녹음하여 저장한다.The storage unit 20 records the voice signal inputted through the microphone 10 and stores the voice signal.

데이터베이스(30)는 다수의 명령어에 대응하는 각각의 음성데이터가 저장된다.The database 30 stores respective voice data corresponding to a plurality of commands.

노이즈판단부(40)는 저장부(20)에 녹음된 음성신호의 신호대잡음비(SNR)를 계산하여, 계산된 신호대잡음비에 따라 노이즈 여부를 판단하여 제어부(40)로 판단 결과를 전달한다.The noise determination unit 40 calculates a signal-to-noise ratio (SNR) of the voice signal recorded in the storage unit 20, determines whether noise is present according to the calculated signal-to-noise ratio, and transmits the determination result to the control unit 40.

자세히는, 볼륨측정기(미도시)를 통해 녹음된 음성신호의 볼륨을 측정하고, 주변의 노이즈 세기를 측정하여 신호 및 노이즈의 세기를 통해 신호대잡음비를 계산하는데, 이렇게 계산된 신호대잡음비값이 6dB 이하인 경우, 노이즈로 판단한다.In detail, the volume of a recorded voice signal is measured by a volume meter (not shown), and the noise intensity of the surroundings is measured to calculate the signal-to-noise ratio through the intensity of the signal and noise. , It is judged as noise.

이때, 제어부(50)는 스피커(60)로 노이즈 안내를 재생시킨다.At this time, the control unit 50 reproduces the noise guide with the speaker 60.

예를들면, "현재 주변 노이즈가 많아서 인식하기 힘든 환경입니다."와 같은 안내멘트를 재생시킨다.For example, it reproduces an announcement such as "This environment is inconceivable because of a lot of ambient noise."

또는, 안내멘트 대신 마이크(10) 입력 신호값에 대한 디지털 증폭을 실시하여 신호대잡음비를 인위적으로 조절하여 시스템 자체내에서 처리하도록 할 수도 있다.Alternatively, digital amplification of the input signal value of the microphone 10 may be performed instead of the announcement, so that the signal-to-noise ratio may be artificially adjusted to be processed in the system itself.

만약, 노이즈가 아닌 것으로 판단된 경우, 제어부(50)는 녹음된 음성신호가 인식되면 데이터베이스(30)에 저장된 음성데이터들과 비교하여, 음성데이터들 중 어느 하나와 일치하는 경우 일치하는 음성데이터에 대응되는 명령어 제어신호를 출력부(70)를 통해 출력하고, 일치하지 않는 경우 녹음된 음성신호를 스피커(60)로 재생시킨다.If it is determined that the noise is not noise, the control unit 50 compares the recorded voice signal with the voice data stored in the database 30, and if the voice data matches the voice data, Outputs the corresponding command control signal through the output unit 70, and reproduces the recorded voice signal to the speaker 60 when they do not match.

즉, 마이크(10)를 통해 입력된 음성신호를 그대로 피드백하여 스피커(60)로 재생시킨다.That is, the audio signal inputted through the microphone 10 is fed back as it is and reproduced by the speaker 60.

이때, 마이크(10)를 통해 입력된 음성신호에 안내멘트를 결합하여 스피커(60)로 재생시킬 수도 있다.At this time, the announcement can be combined with the voice signal input through the microphone 10 and reproduced by the speaker 60. [

예를들면, 오디오 구동중 마이크(10)를 통해 "채널 검색"이라는 음성신호가 입력되면, 데이터베이스(30)에 저장된 음성데이터와 비교하여, 데이터베이스(30)내에 존재하지 않는 경우 스피커(60)로 "채널 검색 명령은 등록되어 있지 않습니다."와 같은 멘트가 재생되도록 할 수도 있다.For example, when a voice signal of "channel search" is inputted through the microphone 10 during audio driving, the voice data is compared with the voice data stored in the database 30, and if it is not present in the database 30, It is also possible to cause a command such as "Channel search command is not registered" to be reproduced.

또한, 제어부(50)는 녹음된 음성신호가 인식되어 데이터베이스(30)에 저장된 음성데이터들 중 어느 하나와 일치하는 경우, 일치하는 음성데이터에 안내멘트를 결합하여 스피커(60)로 재생시킬 수도 있다. In addition, when the recorded voice signal is recognized and matches with any one of the voice data stored in the database 30, the control unit 50 may combine the announcement with the corresponding voice data to reproduce the voice data with the speaker 60 .

예를들면, 오디오 구동중 마이크(10)를 통해 "채널 검색"이라는 음성신호가 입력되면, 데이터베이스(30)에 저장된 음성데이터와 비교하여, 데이터베이스(30)내에 존재하는 경우 스피커(60)로 "채널 검색 명령을 수행합니다."와 같은 멘트가 재생되도록 할 수도 있다.For example, when a voice signal of "channel search" is input through the microphone 10 during audio driving, the voice data is compared with voice data stored in the database 30, Perform channel search command ".

또한, 출력부(70)는 AVN시스템(미도시)과 같은 외부장치와 연동되어 제어부(40)로부터 전달되는 명령어 제어신호에 따라 AVN시스템이 구동되도록 할 수도 있다.The output unit 70 may be configured to operate the AVN system in response to a command control signal transmitted from the control unit 40 in cooperation with an external device such as an AVN system (not shown).

따라서, 본 발명에 의한 음성인식 데이터 처리 장치에 따르면 음성인식 시스템에서 사용자로부터 등록된 명령어가 아닌 음성이 입력된 경우 입력된 음성을 재생하여 줌으로써, 시스템은 제대로 동작하고 있으나 명령어가 아닌 음성이 입력된 것임을 용이하게 파악할 수 있어 사용자에게 시스템이 제대로 동작하고 있는 상황을 인식하여 줌으로써 시스템 신뢰도를 향상시킬 수 있다.Therefore, according to the speech recognition data processing apparatus according to the present invention, when a voice is inputted from a user but not a command registered from the user in the voice recognition system, the inputted voice is reproduced so that the system operates properly, Therefore, it is possible to improve the system reliability by recognizing the situation where the system is operating properly.

또한, 사용자로부터 음성이 입력될 때, 노이즈 여부를 판단하여 안내해줌으로써 음성인식 에러의 원인을 보다 정확하게 파악할 수 있도록 한다.
Further, when a voice is input from the user, it is determined whether or not noise is present, and guidance is provided so that the cause of the voice recognition error can be grasped more accurately.

도 2는 본 발명의 일 실시예에 따른 음성인식 데이터 처리 방법의 동작 흐름을 도시한 순서도로써, 이를 참조하여 본 발명의 구체적인 동작을 설명한다.FIG. 2 is a flowchart illustrating an operational flow of a speech recognition data processing method according to an embodiment of the present invention. Referring to FIG. 2, a specific operation of the present invention will be described.

먼저, 제어부(50)가 마이크(10)로부터 음성신호가 입력되는지 판단한다(S10).First, the control unit 50 determines whether a voice signal is input from the microphone 10 (S10).

이때, 음성신호가 입력된 것으로 판단되면, 음성신호를 녹음하여 저장한다(S20).At this time, if it is determined that the voice signal is input, the voice signal is recorded and stored (S20).

그 다음, 녹음된 음성신호의 신호대잡음비(SNR)를 계산한다(S30).Next, the signal-to-noise ratio (SNR) of the recorded voice signal is calculated (S30).

자세히는, 볼륨측정기(미도시)를 통해 녹음된 음성신호의 볼륨을 측정하고, 주변의 노이즈 세기를 측정하여 신호 및 노이즈의 세기를 통해 신호대잡음비를 계산하는데, 이렇게 계산된 신호대잡음비값이 6dB 이하인 경우, 노이즈로 판단한다(S40).In detail, the volume of a recorded voice signal is measured by a volume meter (not shown), and the noise intensity of the surroundings is measured to calculate the signal-to-noise ratio through the intensity of the signal and noise. , It is determined as noise (S40).

노이즈로 판단된 경우, 스피커(60)로 노이즈 안내를 재생시킨다(S41).If it is judged that the noise is noise, the noise guide is reproduced by the speaker 60 (S41).

예를들면, "현재 주변 노이즈가 많아서 인식하기 힘든 환경입니다."와 같은 안내멘트를 재생시킨다.For example, it reproduces an announcement such as "This environment is inconceivable because of a lot of ambient noise."

또는, 안내멘트 대신 마이크(10) 입력 신호값에 대한 디지털 증폭을 실시하여 신호대잡음비를 인위적으로 조절하여 시스템 자체내에서 처리하도록 할 수도 있다.Alternatively, digital amplification of the input signal value of the microphone 10 may be performed instead of the announcement, so that the signal-to-noise ratio may be artificially adjusted to be processed in the system itself.

만약, 노이즈가 아닌 것으로 판단된 경우, 녹음된 음성신호를 인식하여(S50) 데이터베이스(30)에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하고(S60), 일치하는 경우 해당 음성데이터에 대응되는 명령어 제어신호를 출력부(70)로 입력한다(S61).If it is determined that it is not noise, the recorded voice signal is recognized (S50) and it is judged whether it matches any one of the voice data stored in the database 30 (S60). If they match, The command control signal is input to the output unit 70 (S61).

이때, 출력부(70)는 AVN시스템(미도시)과 같은 외부장치와 연동되어 제어부(40)로부터 전달되는 명령어 제어신호에 따라 AVN시스템이 구동되도록 할 수도 있다.At this time, the output unit 70 may operate the AVN system in accordance with a command control signal transmitted from the control unit 40 in cooperation with an external device such as an AVN system (not shown).

그러나, 녹음된 음성신호가 데이터베이스(30)에 저장된 음성데이터들 중 어느 하나와 일치하지 않는 경우 녹음된 음성신호를 스피커(60)로 재생시킨다(S70).However, if the recorded voice signal does not match any of the voice data stored in the database 30, the recorded voice signal is reproduced by the speaker 60 (S70).

즉, 마이크(10)를 통해 입력된 음성신호를 그대로 피드백하여 스피커(60)로 재생시킨다.That is, the audio signal inputted through the microphone 10 is fed back as it is and reproduced by the speaker 60.

이때, 마이크(10)를 통해 입력된 음성신호에 안내멘트를 결합하여 스피커(60)로 재생시킬 수도 있다.At this time, the announcement can be combined with the voice signal input through the microphone 10 and reproduced by the speaker 60. [

예를들면, 오디오 구동중 마이크(10)를 통해 "채널 검색"이라는 음성신호가 입력되면, 데이터베이스(30)에 저장된 음성데이터와 비교하여, 데이터베이스(30)내에 존재하지 않는 경우 스피커(60)로 "채널 검색 명령은 등록되어 있지 않습니다."와 같은 멘트가 재생되도록 할 수도 있다.For example, when a voice signal of "channel search" is inputted through the microphone 10 during audio driving, the voice data is compared with the voice data stored in the database 30, and if it is not present in the database 30, It is also possible to cause a command such as "Channel search command is not registered" to be reproduced.

또한, 제어부(50)는 녹음된 음성신호가 데이터베이스(30)에 저장된 음성데이터들 중 어느 하나와 일치하는 경우, 일치하는 음성데이터에 안내멘트를 결합하여 스피커(60)로 재생시킬 수도 있다. When the recorded voice signal matches any one of the voice data stored in the database 30, the control unit 50 may combine the voice data with the corresponding voice data to reproduce the voice data with the speaker 60. [

예를들면, 오디오 구동중 마이크(10)를 통해 "채널 검색"이라는 음성데이터가 입력되면, 데이터베이스(30)에 저장된 음성데이터와 비교하여, 데이터베이스(30)내에 존재하는 음성데이터인 경우 스피커(60)로 "채널 검색 명령을 수행합니다."와 같은 멘트가 재생되도록 할 수도 있다.For example, when voice data called "channel search" is inputted through the microphone 10 during audio driving, voice data existing in the database 30 is compared with voice data stored in the database 30, ), It is also possible to cause a command such as " Perform channel search command "to be reproduced.

이때, 녹음된 음성신호가 스피커(60)로 재생되면, 녹음된 음성신호가 초기화 되도록 삭제한다(S80).At this time, when the recorded voice signal is reproduced by the speaker 60, the recorded voice signal is deleted so as to be initialized (S80).

따라서, 본 발명에 의한 음성인식 데이터 처리 방법에 따르면 음성인식 시스템에서 사용자로부터 등록된 명령어가 아닌 음성이 입력된 경우 입력된 음성을 재생하여 줌으로써, 시스템은 제대로 동작하고 있으나 명령어가 아닌 음성이 입력된 것임을 용이하게 파악할 수 있어 사용자에게 시스템이 제대로 동작하고 있는 상황을 인식하여 줌으로써 시스템 신뢰도를 향상시킬 수 있다.Therefore, according to the speech recognition data processing method according to the present invention, when a voice is inputted from a user but not a command registered from the user in the voice recognition system, the inputted voice is reproduced so that the system operates properly, Therefore, it is possible to improve the system reliability by recognizing the situation where the system is operating properly.

또한, 사용자로부터 음성이 입력될 때, 노이즈 여부를 판단하여 안내해줌으로써 음성인식 에러의 원인을 보다 정확하게 파악할 수 있도록 한다.
Further, when a voice is input from the user, it is determined whether or not noise is present, and guidance is provided so that the cause of the voice recognition error can be grasped more accurately.

본 발명은 도면에 도시된 실시예를 참고로 하여 설명되었으나, 이는 예시적인 것에 불과하며, 당해 기술이 속하는 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 기술적 보호범위는 아래의 특허청구범위에 의해서 정하여져야 할 것이다.
While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it will be understood by those of ordinary skill in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims. I will understand. Accordingly, the technical scope of the present invention should be defined by the following claims.

10 : 마이크 20 : 저장부
30 : 데이터베이스 40 : 노이즈판단부
50 : 제어부 60 : 스피커
70 : 출력부
10: microphone 20: storage unit
30: Database 40: Noise judging unit
50: control unit 60: speaker
70:

Claims (8)

마이크를 통해 입력된 음성신호를 녹음하여 저장하는 저장부;
다수의 명령어에 대응하는 각각의 음성데이터가 저장된 데이터베이스; 및
상기 녹음된 음성신호가 인식되면 상기 데이터베이스에 저장된 음성데이터들과 비교하여, 상기 음성데이터들 중 어느 하나와 일치하는 경우 해당 음성데이터에 대응되는 명령어 제어신호를 출력부를 통해 출력하고, 일치하지 않는 경우 상기 녹음된 음성신호를 스피커로 재생시키는 제어부; 를 포함하는 음성인식 데이터 처리 장치.
A storage unit for recording and storing a voice signal input through a microphone;
A database storing respective voice data corresponding to a plurality of commands; And
If the recorded voice signal is recognized, it is compared with the voice data stored in the database, and if it matches any one of the voice data, a command control signal corresponding to the voice data is output through an output unit, A controller for reproducing the recorded voice signal with a speaker; And the voice recognition data processing unit.
제 1항에 있어서,
상기 저장부에 녹음된 음성신호의 신호대잡음비(SNR)를 계산하여, 상기 계산된 신호대잡음비에 따라 노이즈 여부를 판단하는 노이즈판단부; 를 더 포함하는 음성인식 데이터 처리 장치.
The method according to claim 1,
A noise determination unit for calculating a signal-to-noise ratio (SNR) of the voice signal recorded in the storage unit and determining whether noise is present according to the calculated SNR; The speech recognition data processing apparatus further comprising:
제 2항에 있어서, 상기 제어부는
상기 노이즈판단부를 통해 노이즈로 판단된 경우, 스피커로 노이즈 안내를 재생시키고,
노이즈가 아닌 것으로 판단된 경우, 상기 인식된 음성신호가 상기 데이터베이스에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하는 것을 특징으로 하는 음성인식 데이터 처리 장치.
3. The apparatus of claim 2, wherein the control unit
When the noise is determined as noise through the noise determination unit,
And determines whether the recognized voice signal matches any one of the voice data stored in the database when it is determined that the voice data is not noise.
제어부가 마이크로부터 음성신호가 입력되는지 판단하는 단계;
상기 음성신호가 입력된 것으로 판단되면, 상기 음성신호를 녹음하여 저장하는 단계;
상기 녹음된 음성신호를 인식하여 데이터베이스에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하는 단계; 및
판단결과 일치하지 않는 경우, 상기 녹음된 음성신호를 스피커로 재생시키는 단계; 를 포함하는 음성인식 데이터 처리 방법.
Determining whether a voice signal is input from a microphone;
Recording and storing the voice signal when it is determined that the voice signal is input;
Recognizing the recorded voice signal and determining whether it matches any one of voice data stored in a database; And
Reproducing the recorded voice signal with a speaker if the determination result does not match; The speech recognition data processing method comprising the steps of:
제 4항에 있어서,
상기 녹음된 음성신호가 스피커로 재생되면, 상기 녹음된 음성신호를 삭제하는 단계; 를 더 포함하는 음성인식 데이터 처리 방법.
5. The method of claim 4,
When the recorded voice signal is reproduced by a speaker, deleting the recorded voice signal; Further comprising the steps of:
제 4항에 있어서, 상기 음성신호를 녹음하여 저장하는 단계는
상기 녹음된 음성신호의 신호대잡음비(SNR)를 계산하는 단계 및,
상기 계산된 신호대잡음비에 따라 노이즈 여부를 판단하는 단계를 더 포함하는 것을 특징으로 하는 음성인식 데이터 처리 방법.
5. The method of claim 4, wherein recording and storing the voice signal comprises:
Calculating a signal-to-noise ratio (SNR) of the recorded voice signal;
And determining whether noise is present according to the calculated signal-to-noise ratio.
제 6항에 있어서, 상기 신호대잡음비에 따라 노이즈 여부를 판단하는 단계는
상기 신호대잡음비가 기준값 이하인 경우, 노이즈로 판단하여 노이즈 안내를 재생하고, 상기 신호대잡음비가 기준값 초과인 경우, 노이즈가 아닌 것으로 판단하여 상기 인식된 음성신호가 상기 데이터베이스에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하는 단계를 수행하는 것을 특징으로 하는 음성인식 데이터 처리 방법.
7. The method of claim 6, wherein the step of determining whether noise is present according to the signal-
Determining whether the signal-to-noise ratio is not noise when the signal-to-noise ratio exceeds a reference value, determining that the recognized voice signal is not one of the voice data stored in the database, And determining whether the speech recognition data matches with the speech recognition data.
제 4항에 있어서, 상기 데이터베이스에 저장된 음성데이터들 중 어느 하나와 일치하는지 판단하는 단계는
판단결과 일치하는 경우, 해당 음성데이터에 대응되는 명령어 제어신호를 출력하는 단계를 더 포함하는 것을 특징으로 하는 음성인식 데이터 처리 방법.
5. The method of claim 4, wherein the step of determining whether any one of the voice data stored in the database matches
And outputting a command control signal corresponding to the voice data when the determination results match.
KR1020120126341A 2012-11-08 2012-11-08 Apparatus for processing voice recognition data and method thereof KR20140059662A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120126341A KR20140059662A (en) 2012-11-08 2012-11-08 Apparatus for processing voice recognition data and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120126341A KR20140059662A (en) 2012-11-08 2012-11-08 Apparatus for processing voice recognition data and method thereof

Publications (1)

Publication Number Publication Date
KR20140059662A true KR20140059662A (en) 2014-05-16

Family

ID=50889431

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120126341A KR20140059662A (en) 2012-11-08 2012-11-08 Apparatus for processing voice recognition data and method thereof

Country Status (1)

Country Link
KR (1) KR20140059662A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016208789A1 (en) * 2015-06-26 2016-12-29 삼성전자 주식회사 Method for determining sound and device therefor
KR20190133962A (en) 2018-05-24 2019-12-04 주식회사 케이티 Device, server and method controlling operation based on customized voice command

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016208789A1 (en) * 2015-06-26 2016-12-29 삼성전자 주식회사 Method for determining sound and device therefor
US10839827B2 (en) 2015-06-26 2020-11-17 Samsung Electronics Co., Ltd. Method for determining sound and device therefor
KR20190133962A (en) 2018-05-24 2019-12-04 주식회사 케이티 Device, server and method controlling operation based on customized voice command

Similar Documents

Publication Publication Date Title
US10991374B2 (en) Request-response procedure based voice control method, voice control device and computer readable storage medium
US10586534B1 (en) Voice-controlled device control using acoustic echo cancellation statistics
US10446155B2 (en) Voice recognition device
US10643605B2 (en) Automatic multi-performance evaluation system for hybrid speech recognition
US20210134291A1 (en) Electronic device and controlling method thereof
US7822613B2 (en) Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus
US20210243528A1 (en) Spatial Audio Signal Filtering
JP5075664B2 (en) Spoken dialogue apparatus and support method
CA2795189A1 (en) Automatic gain control
US20180217985A1 (en) Control method of translation device, translation device, and non-transitory computer-readable recording medium storing a program
US20200160862A1 (en) In-vehicle device and speech recognition method
US10224029B2 (en) Method for using voiceprint identification to operate voice recognition and electronic device thereof
KR20140059662A (en) Apparatus for processing voice recognition data and method thereof
US20130197802A1 (en) Information processing apparatus, non-transitory computer-readable recording medium, and information processing method
CN102906811A (en) Method for adjusting voice recognition system comprising speaker and microphone, and voice recognition system
KR20180036032A (en) Image processing apparatus and recording media
KR20180005828A (en) Method and vehicle controller for intuitive adjusting sound volume
JP2007101892A (en) Speech recognition device
US11735187B2 (en) Hybrid routing for hands-free voice assistant, and related systems and methods
KR101710695B1 (en) Microphone control system for voice recognition of automobile and control method therefor
KR20180124226A (en) WEARABLE DEVICE, IoT DEVICE AND VEHICLE VOICE RECOGNITION OPERATING SYSTEM AND METHOD
US20220215854A1 (en) Speech sound response device and speech sound response method
JP2010107614A (en) Voice guidance and response method
KR20160044652A (en) Control method of avn system for vehicle using voice recognition
JP6723033B2 (en) Information processing device, information processing system, server, terminal device, information processing method, and program

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination