KR20030002196A - An automatic voice recognition system can be adjusted signal level for each channel over the telephone line - Google Patents
An automatic voice recognition system can be adjusted signal level for each channel over the telephone line Download PDFInfo
- Publication number
- KR20030002196A KR20030002196A KR1020010038947A KR20010038947A KR20030002196A KR 20030002196 A KR20030002196 A KR 20030002196A KR 1020010038947 A KR1020010038947 A KR 1020010038947A KR 20010038947 A KR20010038947 A KR 20010038947A KR 20030002196 A KR20030002196 A KR 20030002196A
- Authority
- KR
- South Korea
- Prior art keywords
- volume
- recognition system
- voice recognition
- line
- voice
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 32
- 230000002159 abnormal effect Effects 0.000 claims abstract description 5
- 238000001514 detection method Methods 0.000 claims description 8
- 238000004088 simulation Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000003321 amplification Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011038 discontinuous diafiltration by volume reduction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
본 발명은 전화회선별로 음량 조절이 가능한 음성인식 시스템 및 그 방법에 관한 것으로, 보다 상세하게 음성인식 시스템에 부가되어 음성 인식율을 향상시키기 위한 전화회선별로 음량 조절이 가능한 음성인식 시스템 및 그 방법에 관한 것이다.The present invention relates to a voice recognition system and a method for adjusting the volume per telephone line, and more particularly, to a voice recognition system and a method for adjusting the volume for each telephone line to improve the voice recognition rate in addition to the voice recognition system. will be.
주지된 바와 같이, 음성인식 시스템은 사람의 음성을 입력받아 인식기를 통해 인식음성의 결과를 유도해내는 시스템으로, 현재 이러한 인식기술을 이용한 다양한 서비스가 개발되어 상용화되고 있다.As is well known, the speech recognition system is a system that derives the result of speech recognition through a recognizer by receiving a human voice, and various services using such recognition technology have been developed and commercialized.
이러한 음성인식 시스템의 인식 과정에서 사용하는 중요한 파라미터 중의 하나가 HMM(Hidden Markov Model)이라고 하는 것인 바, 그 파라미터는, 여러 사람이 발성한 수많은 음성 파일들에서 특징을 추출하여 정하여진 음소별로 여러 가지의 확률 값을 설정한 것이다.One of the important parameters used in the recognition process of the speech recognition system is called HMM (Hidden Markov Model), which is a feature that is determined by extracting features from a large number of speech files produced by different people. The probability value of the branch is set.
이 때에는 발화자의 성별, 나이, 전화기의 종류 등 다양한 환경을 설정하여 수집한 음성 파일들로 파라미터를 생성하여야만, 입력되는 다양한 음성 데이터로부터 음성인식 시스템이 제대로 성능을 발휘할 수가 있다. 이러한 파라미터의 생성 작업을 "훈련 과정"이라고 부른다.In this case, parameters must be generated from voice files collected by setting various environments such as gender, age, type of telephone, and the like, so that the voice recognition system can perform properly from various input voice data. The creation of these parameters is called the "training process".
그러나, 실제 운용되는 음성인식 시스템에서의 인식 성능이 시뮬레이션의 결과보다 저하되는 경우가 있다. 그 이유 중의 하나가 회선상태의 문제인데, 훈련 과정에서 HMM 파라미터를 생성하기 위하여 사용하였던 음성파일들의 수집 환경과 운용 시스템에 입력되는 음성파일 들의 환경이 다른 경우에 이러한 현상이 생길 수 있다.However, there is a case where the recognition performance in an actual speech recognition system is lower than that of the simulation. One of the reasons is the condition of the line condition. This may occur when the environment of collecting voice files used to generate the HMM parameter during training and the environment of voice files input to the operating system are different.
이하, 실제 음성인식 시스템의 환경을 도 1을 참조하여 상세하게 기술한다.Hereinafter, the environment of the actual speech recognition system will be described in detail with reference to FIG. 1.
도 1은 종래의 실시예에 따른 음성인식 시스템의 구성을 개략적으로 도시한 모식도이다.1 is a schematic diagram schematically showing the configuration of a speech recognition system according to a conventional embodiment.
이를 참조하면, 일반적으로 PSTN 망에서 수집한 음성들(101-102-104의 경로로 입력된 음성들)와 PABX(사설교환기)를 통해서 수집한 음성들(103-104의 경로로 입력된 음성들)과는 차이가 있다. 이는 망의 특성에 따른 차이에 기인한 것인데 회선에 따라서 입력되는 음성이 너무 크거나 혹은 작은 경우가 생기게 된다.Referring to this, in general, voices collected through the PSTN network (voices input through the path of 101-102-104) and voices collected through the PABX (private exchange) (103-104) ) Is different. This is due to the difference in the characteristics of the network. Depending on the circuit, the input voice may be too loud or too small.
상기한 바와 같은 종래의 음성인식 시스템(200)은 이러한 음성파일의 크기가 다름으로 인해 그 인식율은 심각하게 저하된다. 종래의 기술은 입력되는 음성파일의 크기에 상관없이 바로 인식과정을 수행함으로써 회선마다의 특성을 반영하지 못했다는 단점이 있었다.In the conventional voice recognition system 200 as described above, the recognition rate is severely lowered due to the different size of the voice file. The prior art has a disadvantage in that it does not reflect the characteristics of each line by performing the recognition process irrespective of the size of the input voice file.
본 발명은 상기한 종래 기술의 사정을 감안하여 이루어진 것으로, 음성인식 시스템에서 입력으로 들어오는 음성에 대하여 회선별로 증폭 혹은 감쇄를 시켜 줌으로서 음량에 따라 인식 성능이 저하되는 것을 방지할 수 있도록 한 전화회선별로 음량 조절이 가능한 음성인식 시스템 및 그 방법을 제공함에 그 목적이 있다.The present invention has been made in view of the above-described state of the art, and a telephone line that amplifies or attenuates a line for a voice coming into an input in a voice recognition system to prevent a deterioration in recognition performance according to a volume. The purpose of the present invention is to provide a voice recognition system and a method thereof, in which volume is adjustable.
본 발명의 다른 목적은 음량의 문제로 인하여 인식 성능이 떨어지는 음성인식 시스템 전체에 대하여 음량을 증폭 혹은 감쇄의 비율을 제어함으로써 인식 성능을 향상시킨 전화회선별로 음량 조절이 가능한 음성인식 시스템 및 그 방법을 제공함에 있다.Another object of the present invention is to provide a voice recognition system and a method for adjusting the volume for each telephone line which improves the recognition performance by controlling the rate of amplification or attenuation of the entire voice recognition system having poor recognition performance due to the problem of volume. In providing.
도 1은 종래의 실시예에 따른 음성인식 시스템의 구성을 개략적으로 도시한 모식도,1 is a schematic diagram schematically showing the configuration of a speech recognition system according to a conventional embodiment;
도 2는 본 발명의 일실시예에 따른 전화회선별로 음량 조절이 가능한 음성인식 시스템의 구성을 도시한 도면,2 is a view showing the configuration of a voice recognition system capable of adjusting the volume for each telephone line according to an embodiment of the present invention,
도 3은 본 발명의 일실시예에 따른 전화회선별로 음량 조절이 가능한 음성인식장치의 회로 구성을 도시한 블록구성도,Figure 3 is a block diagram showing the circuit configuration of the voice recognition device capable of adjusting the volume for each telephone line according to an embodiment of the present invention,
도 4는 본 발명의 일실시예에 따른 전화회선별로 음량 조절이 가능한 음성인식 시스템의 신호흐름을 도시한 도면이다.4 is a diagram illustrating a signal flow of a voice recognition system capable of adjusting volume for each telephone line according to an embodiment of the present invention.
*도면의 주요부분에 대한 부호의 설명** Description of the symbols for the main parts of the drawings *
300:음량제어장치 310:음량검출부300: volume control device 310: volume detection unit
320:운영자설정부 330:실험값검출부320: operator setting unit 330: experimental value detection unit
340:스위칭부 350a∼350n:음량조절부340: switching section 350a to 350n: volume control section
355:경고음구동부 360:음량제어부355: warning sound drive unit 360: volume control unit
상기한 목적을 달성하기 위해, 본 발명의 바람직한 실시예에 따르면 각 회선별로 음성을 입력받아 인식하는 음성인식 시스템에 있어서, 그 회선단과 음성인식 시스템의 입력단의 사이에 매개하여 음성 인식시스템의 음성인식 수행과정 전단계에서 음량의 크기를 기설정치와 동일하게 조절하는 음량 제어수단이 구비된 것을 특징으로 하는 전화회선별로 음량 조절이 가능한 음성인식 시스템이 제공된다.In order to achieve the above object, according to a preferred embodiment of the present invention, in a speech recognition system that receives and recognizes speech for each line, the speech recognition of the speech recognition system is carried out between the line end and the input end of the speech recognition system. Provided is a voice recognition system that can adjust the volume for each telephone line, characterized in that the volume control means for adjusting the volume of the volume equal to the preset value in the previous step of the process.
바람직하게, 상기 음량 제어수단은 상기 음성인식 시스템의 회선별 입력단에 각각 접속되어 입력 음성의 음량을 검출하는 음량 검출부와; 음량 제어를 위한 수동 및 자동모드를 설정하고, 운용자가 직접 수동조작으로 음량 제어값을 설정하기 위한 운용자 설정부와; 각 회선별 음량 시뮬레이션 값을 기저장한 실험값 저장부와; 제어신호를 인가받아 기설정된 음량으로 조절하기 위하여 해당 회선을 선택적으로 스위칭하기 위한 스위칭부와; 상기 스위칭부의 턴온으로 기설정 음량으로 제어되어 상기 음성인식 시스템의 입력단으로 입력되는 음성데이터의 음량을 조절하는 음량 조절부와; 제어신호를 인가받아 경고음을 발생하는 경고음 구동부와; 상기 운영자 설정부를 매개로 음량 제어의 수동 또는 자동모드의 선택신호에 따라 해당 모드로 변환함과 더불어, 상기 음량 검출부로부터 음성인식 시스템으로 입력되는 음성 데이터의 음량을 검출하여 기설정치 이상인지의 여부를 판단하고, 상기 스위칭부에 제어신호를 발생하여 해당 회선별로 음량을 제어토록 하는 음량 제어부로구성된 것을 특징으로 하는 전화회선별로 음량 조절이 가능한 음성인식 시스템이 제공된다.Preferably, the volume control means includes a volume detection unit connected to each line input terminal of the speech recognition system for detecting the volume of the input voice; An operator setting unit for setting manual and automatic modes for volume control and for setting the volume control value by the operator by manual operation; An experimental value storage unit which pre-stores a volume simulation value for each line; A switching unit for selectively switching a corresponding line to receive a control signal and adjust a predetermined volume; A volume control unit which is controlled at a preset volume by turning on the switching unit and adjusts a volume of voice data input to an input terminal of the voice recognition system; A warning sound driver for generating a warning sound by receiving a control signal; The operator setting unit converts to the corresponding mode according to the manual or automatic mode selection signal of the volume control, and detects the volume of the voice data input from the volume detecting unit to the voice recognition system to determine whether or not the preset value is higher than the preset value. And a volume control unit configured to generate a control signal to the switching unit and control the volume for each corresponding line.
한편, 본 발명은 입력되는 각 회선별로 음량을 조절하는 음성인식 시스템에 있어서, 음성인식 시스템으로 유입되는 각 회선별로 음량을 검출하는 과정과; 검출음량이 기설정 음량 범위내에 존재하는 지의 여부를 비교하는 과정과; 기입력된 음량 조절모드를 판단하는 과정과; 해당 회선별로 음량을 조절하는 과정으로 이루어진 것을 특징으로 하는 음성인식 시스템의 회선별 음량 조절방법이 제공된다.On the other hand, the present invention is a voice recognition system for adjusting the volume for each input line, the process of detecting the volume for each line flowing into the voice recognition system; Comparing whether the detected volume is within a preset volume range; Determining a volume control mode previously input; Provided is a volume control method for each line of the voice recognition system, characterized in that the volume control process for each line.
바람직하게, 음량 조절이 가능한 조절모드는 자동 조절모드와 수동 조절모드 인 것을 특징으로 하는 음성인식 시스템의 회선별 음량 조절방법이 제공된다.Preferably, the volume control mode is provided with a volume control method for each line of the voice recognition system characterized in that the automatic control mode and the manual control mode.
보다 바람직하게, 음량 조절을 자동으로 행하는 자동 모드 설정시에는 시뮬레이션 값을 토대로 기저장된 설정치를 독취하여 해당 음량 검출값이 검출될 때까지 음량을 조절하는 과정을 더 포함하여 이루어진 것을 특징으로 하는 음성인식 시스템의 회선별 음량 조절방법이 제공된다.More preferably, in the automatic mode setting that automatically adjusts the volume, the voice recognition method may further include adjusting a volume until a predetermined volume detection value is detected by reading a preset value based on a simulation value. Provided is a volume control method for each line of the system.
또한, 음량 조절을 수동으로 행하는 수동 모드 설정시에 음량 비교값이 비정상적일 때에는 경고음을 통하여 운영자에게 음량 조절 요구상황을 통보하는 과정을 더 포함하여 이루어진 것을 특징으로 하는 음성인식 시스템의 회선별 음량 조절방법이 제공된다.In addition, when the volume comparison value is abnormal in the manual mode setting to manually adjust the volume, the volume control for each line of the voice recognition system further comprises the step of notifying the operator of the volume control request status through the warning sound. A method is provided.
한편, 상기 음량 조절을 행하는 과정에서 전체 회선의 음량을 동시에 조절하는 것도 가능한 것을 특징으로 하는 음성인식 시스템의 회선별 음량 조절방법이 제공된다.On the other hand, the volume control method for each line of the voice recognition system is characterized in that it is also possible to adjust the volume of the entire line at the same time in the volume adjustment process.
이하, 본 발명에 대해 도면을 참조하여 상세하게 설명한다.EMBODIMENT OF THE INVENTION Hereinafter, this invention is demonstrated in detail with reference to drawings.
도 2는 본 발명의 일실시예에 따른 전화회선별로 음량 조절이 가능한 음성인식 시스템의 구성을 도시한 도면이다.2 is a view showing the configuration of a voice recognition system that can adjust the volume for each telephone line according to an embodiment of the present invention.
이를 참조하면, 본 발명에 따른 전화회선별로 음량 조절이 가능한 음성인식 시스템(210)에는 PSTN 망에서 수집한 음성들(101-102-104의 경로로 입력된 음성들)와 PABX(사설교환기)를 통해서 수집한 음성들(103-104의 경로로 입력된 음성들)과의 입력 음성파일의 크기가 각기 상이함에 기인하여, 상기 음성인식 시스템(210)과 연계되어 그 음성인식 시스템(210)으로 입력되는 음성데이터의 크기, 즉 음량을 기설정치와 동일하도록 제어하는 음량제어장치(300)를 제공한다.Referring to this, the voice recognition system 210 capable of adjusting the volume for each telephone line according to the present invention includes voices collected from the PSTN network (voices input through the path of 101-102-104) and PABX (private switching system). Due to the different size of the input voice file from the voices collected through the voices 103-104, the voice recognition system 210 is inputted in association with the voice recognition system 210. It provides a volume control device 300 for controlling the size of the voice data, that is, the volume to be equal to the preset value.
따라서, 본 발명에 따른 상기 음성인식 시스템(210)과 연계된 상기 음량 제어장치(300)는 상기 음성인식 시스템(210)이 입력된 음성 데이터에 대한 인식처리를 행하기 전처리 과정으로 음량 조절을 행한다.Therefore, the volume control device 300 associated with the voice recognition system 210 according to the present invention performs volume control as a preprocessing process before the voice recognition system 210 performs recognition processing on input voice data. .
이때, 상기 음량 제어장치(300)는 상기 음성인식 시스템(210)의 입력 회선별로 그 음량 조절이 가능할 뿐 아니라, 전체 회선의 음량 조절도 가능하다.At this time, the volume control device 300 can not only adjust the volume for each input line of the voice recognition system 210, but also can adjust the volume of the entire line.
또한, 상기 음량 제어장치(300)는 실험 결과값에 의한 기설정 데이터와의 비교에 의해 입력되는 음량을 자동으로 조절할 수 있으며, 운영자에게 통보하여 수동으로 조절할 수 있다. 이는 각각의 모드 설정에 따라 연동 가능하다.In addition, the volume control device 300 may automatically adjust the volume input by comparison with the preset data according to the experiment result value, it can be manually adjusted by notifying the operator. It can be linked according to each mode setting.
도 3은 본 발명의 일실시예에 따른 전화회선별로 음량 조절이 가능한 음성인식장치의 회로 구성을 도시한 블록구성도이다.3 is a block diagram illustrating a circuit configuration of a voice recognition device capable of adjusting volume for each telephone line according to an embodiment of the present invention.
이를 참조하면, 상기 음량 제어장치(300)는 그 내부에 음량 검출부, 운용자설정부, 실험값 저장부, 스위칭부, 음량 조절부, 경고음 구동부 및 음량 제어부로 이루어진다.Referring to this, the volume control device 300 includes a volume detecting unit, an operator setting unit, an experimental value storage unit, a switching unit, a volume control unit, a warning sound driving unit, and a volume control unit therein.
보다 상세하게, 참조부호 310은 상기 음성인식 시스템(210)의 회선별 입력단에 각각 접속되어 그 음성인식 시스템(210)으로 인가되는 입력 음성의 음량을 검출하는 음량 검출부를 나타낸다.In more detail, reference numeral 310 denotes a volume detector which detects the volume of the input voice which is connected to each line input terminal of the voice recognition system 210 and applied to the voice recognition system 210.
또한, 참조부호 320은 상기 음량 제어장치(300)의 내부에 구비되어 음량 제어를 위한 수동 및 자동모드를 설정하고, 운용자가 직접 수동조작으로 음량 제어값을 설정하기 위한 운용자 설정부를 나타내며, 참조부호 330은 각 회선별 음량 시뮬레이션 값을 기저장한 실험값 저장부를 나타낸다.In addition, reference numeral 320 is provided inside the volume control device 300 to set the manual and automatic mode for the volume control, and indicates the operator setting unit for the operator to set the volume control value by manual operation. 330 denotes an experimental value storage unit which pre-stores a volume simulation value for each line.
한편, 참조부호 340은 제어신호를 인가받아 기설정된 음량으로 조절하기 위하여 해당 회선을 선택적으로 스위칭하기 위한 스위칭부를 나타내며, 참조부호 350은 상기 스위칭부(340)의 턴온으로 기설정 음량으로 제어되어 상기 음성인식 시스템(210)의 입력단으로 입력되는 음성데이터의 음량을 조절하는 음량 조절부를 나타낸다.Meanwhile, reference numeral 340 denotes a switching unit for selectively switching a corresponding line in order to receive a control signal and adjust the predetermined volume, and reference numeral 350 controls the preset volume by turning on the switching unit 340 to the A volume control unit for adjusting the volume of the voice data input to the input terminal of the voice recognition system 210.
또한, 참조부호 355는 음량 제어를 수동으로 조작하는 수동모드 설정시 상기 음량 검출부(310)에서 검출한 음성데이터의 음량이 기설정치 범위내에 존재하지 않을 때 제어신호를 인가받아 경고음을 발생하는 경고음 구동부를 나타낸다.In addition, reference numeral 355 denotes a warning sound driver that generates a warning sound by receiving a control signal when the volume of the voice data detected by the volume detector 310 does not exist within a preset value in the manual mode setting of manually controlling the volume control. Indicates.
한편, 참조부호 360은 상기 운영자 설정부(320)를 매개로 음량 제어의 수동 또는 자동모드의 선택신호에 따라 해당 모드로 변환함과 더불어, 상기 음량 검출부(310)로부터 음성인식 시스템으로 입력되는 음성 데이터의 음량을 검출하여기설정치 이상의 음량이 검출되면 상기 스위칭부(340)에 제어신호를 발생하고 상기 실험값 저장부(330)로부터 조절 데이터를 독취하여 해당 회선별로 음량을 제어토록 하는 음량 제어부를 나타낸다.On the other hand, reference numeral 360 converts to the corresponding mode according to the manual or automatic mode selection signal of the volume control via the operator setting unit 320, and the voice input from the volume detection unit 310 to the voice recognition system When the volume of the data is detected and the volume of the preset value is detected, the control unit generates a control signal to the switching unit 340, and reads the adjustment data from the experimental value storage unit 330 to indicate the volume control unit for controlling the volume for each line. .
또한, 상기 운영자 설정부(320)로부터 설정된 모드가 수동모드일 경우에 상기 음량제어부(360)는 상기 음량 검출부(310)로부터 음성 데이터의 음량을 검출하여 그 음량이 기설정치 이상이면 상기 경고음 구동부(355)를 구동하여 음량이 비정상적임을 통보한다. 그로인해, 운영자가 상기 운영자 설정부(320)를 매개로 특정 음량 설정을 행하면 해당 음량 설정신호는 상기 음량제어부(360)로 인가되어 음량 제어를 행한다.In addition, when the mode set by the operator setting unit 320 is the manual mode, the volume control unit 360 detects the volume of the voice data from the volume detecting unit 310 and if the volume is equal to or greater than a preset value, the warning sound driving unit ( 355) to notify that the volume is abnormal. Therefore, when the operator makes a specific volume setting via the operator setting unit 320, the corresponding volume setting signal is applied to the volume control unit 360 to control the volume.
상기한 구성의 본 발명의 일실시예에 따른 전화회선별로 음량 조절이 가능한 음성인식 시스템의 기능과 작용을 첨부된 도면을 참조하여 상세하게 설명한다.With reference to the accompanying drawings, the function and operation of the voice recognition system capable of adjusting the volume for each telephone line according to an embodiment of the present invention having the above configuration will be described in detail.
도 4는 본 발명의 일실시예에 따른 전화회선별로 음량 조절이 가능한 음성인식 시스템의 신호흐름을 도시한 도면이다.4 is a diagram illustrating a signal flow of a voice recognition system capable of adjusting volume for each telephone line according to an embodiment of the present invention.
먼저, 상기 음성 인식 시스템(210)으로 유입되는 각 회선별 음량을 상기 음량 검출부(310)를 매개로 검출한다(제 1 단계: ST-1).First, the volume for each line flowing into the speech recognition system 210 is detected through the volume detector 310 (first step: ST-1).
각 회선별 음량 검출신호를 인가받은 상기 음량 제어부(360)는 해당 음량 검출음량이 기설정치 범위내에 존재하는 지의 여부를 판단한다(제 2 단계: ST-2).The volume control unit 360, which has received the volume detection signal for each line, determines whether the volume detection volume is within a preset value range (second step: ST-2).
만약, 검출된 음량이 기설정치내에 존재하지 않을 경우에는 상기 음량 제어부(360)는 상기 운영자 설정부(320)로부터 설정된 모드가 자동 모드인 지의 여부를 판단한다(제 3 단계: ST-3).If the detected volume is not within the preset value, the volume controller 360 determines whether the mode set by the operator setting unit 320 is an automatic mode (third step: ST-3).
이때, 설정된 모드가 자동 모드인 경우에는 상기 음량 제어부(360)는 검출 음량 대비 음량 감쇄값을 상기 실험값 저장부(330)로부터 독취하여(제 4 단계: ST-4), 상기 스위칭부(340)를 스위칭하여 해당 회선의 음량을 기설정치이하로 조절토록 한다(제 5 단계: ST-5).At this time, when the set mode is the automatic mode, the volume controller 360 reads the volume reduction value compared to the detected volume from the experimental value storage unit 330 (step 4: ST-4), and the switching unit 340. Switch to adjust the volume of the line below the preset value (step 5: ST-5).
만약, 설정된 모드가 수동 모드인 경우에는 상기 음량 제어부(360)는 경고음 구동부(355)를 구동 제어하여 그 경고음으로 인해 상기 운영자에게 음성인식 시스템(210)으로 입력되는 음량이 비정상적임을 통보한다(제 6 단계: ST-6).If the set mode is the manual mode, the volume controller 360 controls the driving of the warning sound driver 355 and notifies the operator that the volume inputted to the voice recognition system 210 is abnormal due to the warning sound. Step 6: ST-6).
그로인해, 운영자가 상기 운영자 설정부(320)를 통해 음량을 수동으로 설정하면 상기 음량 제어부(360)는 해당 회선을 매개로 인가된 음량을 설정치에 적합하게 조절한다(제 7 단계: ST-7).Therefore, when the operator manually sets the volume through the operator setting unit 320, the volume control unit 360 adjusts the volume applied to the set value through the corresponding line (step 7: ST-7). ).
한편, 본 발명의 실시예에 따른 전화회선별로 음량 조절이 가능한 음성인식 시스템 및 그 방법은 단지 상기한 실시예에 한정되는 것이 아니라 그 기술적 요지를 이탈하지 않는 범위내에서 다양한 변경이 가능하다.On the other hand, the voice recognition system and the method that can adjust the volume for each telephone line according to an embodiment of the present invention is not limited to the above embodiments, but various modifications can be made within the scope without departing from the technical gist.
상기한 바와 같이, 본 발명에 따른 전화회선별로 음량 조절이 가능한 음성인식 시스템 및 그 방법은 특정한 회선을 통하여 들어온 음성의 음량이 너무 작거나 혹은 클 경우에 특정한 비율로 증폭 혹은 감쇄를 해 줌으로써 음량에 크기에 의해 야기되는 인식 성능의 저하를 막을 수 있다는 효과가 있으며, 음성 인식기에서 사용하는 파라미터를 생성하였던 개발 환경과 음성인식기가 작동하는 사이트의 환경이 다른 경우에 생길 수 있는 인식률 저하 현상을 줄이기 위하여 회선별로 음량을증폭 혹은 감쇄시킬 수 있다.As described above, the voice recognition system and the method capable of adjusting the volume for each telephone line according to the present invention provide amplification or attenuation at a specific rate when the volume of the voice input through a specific line is too small or too large. It is effective to prevent the degradation of recognition performance caused by size, and to reduce the recognition rate degradation that may occur when the development environment where the parameters used by the speech recognizer are generated and the environment of the site where the speech recognizer operates are different. Volume can be amplified or attenuated per line.
Claims (7)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020010038947A KR100560914B1 (en) | 2001-06-30 | 2001-06-30 | An automatic voice recognition system can be adjusted signal level for each channel over the telephone line |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020010038947A KR100560914B1 (en) | 2001-06-30 | 2001-06-30 | An automatic voice recognition system can be adjusted signal level for each channel over the telephone line |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20030002196A true KR20030002196A (en) | 2003-01-08 |
KR100560914B1 KR100560914B1 (en) | 2006-03-14 |
Family
ID=27712829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020010038947A KR100560914B1 (en) | 2001-06-30 | 2001-06-30 | An automatic voice recognition system can be adjusted signal level for each channel over the telephone line |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100560914B1 (en) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59181767A (en) * | 1983-03-31 | 1984-10-16 | Toshiba Corp | Audio response system |
JPH01142799A (en) * | 1987-11-30 | 1989-06-05 | Toshiba Corp | Voice input apparatus |
KR940007532Y1 (en) * | 1990-04-28 | 1994-10-22 | 삼성전자 주식회사 | Speech recognizing device |
JP2000069140A (en) * | 1998-08-24 | 2000-03-03 | Kyocera Corp | Telephone set with voice recognition function |
-
2001
- 2001-06-30 KR KR1020010038947A patent/KR100560914B1/en not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR100560914B1 (en) | 2006-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU667871B2 (en) | Voice controlled messaging system and processing method | |
EP0518638B1 (en) | Apparatus and method for identifying a speech pattern | |
EP0440439B1 (en) | Method and system for controlling an external machine by a voice command | |
US7164753B2 (en) | Real-time transcription correction system | |
EP2592546B1 (en) | Automatic Gain Control in a multi-talker audio system | |
US20050080627A1 (en) | Speech recognition device | |
EP0757342B1 (en) | User selectable multiple threshold criteria for voice recognition | |
WO2003038804A2 (en) | Non-target barge-in detection | |
US6574601B1 (en) | Acoustic speech recognizer system and method | |
US8190430B2 (en) | Method and system for using input signal quality in speech recognition | |
US5842161A (en) | Telecommunications instrument employing variable criteria speech recognition | |
GB2346001A (en) | Communication device and method for screening speech recognizer input | |
KR101661767B1 (en) | Voice Recognition Method and Apparatus for Providing User Interface by Using Voice | |
JP2006163392A (en) | Voice recognition system for automatically controlling input level, and voice recognition method using the same | |
EP1492085A2 (en) | Method of reflecting time/language distortion in objective speech quality assessment | |
JPH09179585A (en) | Method and system for recognizing voice | |
KR100560914B1 (en) | An automatic voice recognition system can be adjusted signal level for each channel over the telephone line | |
JPH06236196A (en) | Method and device for voice recognition | |
US7043427B1 (en) | Apparatus and method for speech recognition | |
JP2754960B2 (en) | Voice recognition device | |
EP1385148B1 (en) | Method for improving the recognition rate of a speech recognition system, and voice server using this method | |
JP2000039900A (en) | Speech interaction device with self-diagnosis function | |
JPH11220345A (en) | Automatic gain controller | |
KR20020095502A (en) | Method for detecting end point of noise surroundings | |
JPH08263093A (en) | Voice recognition controller |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120302 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |