WO2010151048A2 - 명료도 향상장치와 이를 이용한 음성출력장치 - Google Patents

명료도 향상장치와 이를 이용한 음성출력장치 Download PDF

Info

Publication number
WO2010151048A2
WO2010151048A2 PCT/KR2010/004078 KR2010004078W WO2010151048A2 WO 2010151048 A2 WO2010151048 A2 WO 2010151048A2 KR 2010004078 W KR2010004078 W KR 2010004078W WO 2010151048 A2 WO2010151048 A2 WO 2010151048A2
Authority
WO
WIPO (PCT)
Prior art keywords
voice
level
signal
output
input
Prior art date
Application number
PCT/KR2010/004078
Other languages
English (en)
French (fr)
Other versions
WO2010151048A3 (ko
WO2010151048A9 (ko
Inventor
박성진
Original Assignee
주식회사 더바인코퍼레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020100059196A external-priority patent/KR101068227B1/ko
Application filed by 주식회사 더바인코퍼레이션 filed Critical 주식회사 더바인코퍼레이션
Priority to US13/378,002 priority Critical patent/US20120116755A1/en
Publication of WO2010151048A2 publication Critical patent/WO2010151048A2/ko
Publication of WO2010151048A9 publication Critical patent/WO2010151048A9/ko
Publication of WO2010151048A3 publication Critical patent/WO2010151048A3/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Definitions

  • the present invention relates to a method and apparatus for improving the sound quality of a voice signal in the field of digital communication, and more particularly, to a device for improving the clarity of a received voice signal and a voice output device using the device.
  • the prior art for improving the reception sound quality of the mobile phone in the noise environment is a technology of the degree of noise reduction, equalizer or automatic reception volume;
  • Noise canceling technology is accompanied by metal noise due to distortion of voice signal, equalizer improves hearing quality, and amplification of received volume is a problem caused by slimming of mobile phone. Brings about.
  • the equalizer technique here is to amplify the overall signal by 3db to 10db to increase the intelligibility of speech when the listener is in a noisy area.
  • SNR Signal to Noise Ratio
  • the sound output from the voice output device is torn or distorted, and in the case of a small voice output device, the sound recording and distortion are more severe.
  • another object of the present invention is to provide a voice output device that adjusts the received volume control manually or automatically according to a call environment such as a noise environment or not, and improves voice clarity.
  • Another object of the present invention is to provide a voice output device that allows the user to visually check whether the output state according to the improvement of voice clarity.
  • the present invention includes an input envelope detection unit for detecting the level of the speech frame with respect to the input signal; An output envelope detector for detecting a level of an audio frame with respect to the output signal; Grasp the difference between the level of the N th speech frame received from the input envelope detector and the level of the N-1) th speech frame received from the output envelope detector, and amplify the consonant components of the input signal using the difference value.
  • a cutoff frequency predictor for calculating a cutoff frequency for the cutoff frequency
  • a shelving filter that filters the input signal according to the cutoff frequency calculated by the cutoff frequency predictor, and selectively filters a portion of the input signal that is assumed to be a consonant component of the input signal; And analyzing the input signal to identify a voice signal or a non-voice signal, and bypass the input signal to the output signal in the case of the non-voice signal, and the input envelope detector and the shelving filter in the case of the voice signal.
  • a clarity improving device characterized in that it comprises a voice detector provided as a negative input.
  • the cutoff frequency predicting unit lowers the cutoff frequency set by the shelving filter unit by a predetermined value when the level of the Nth speech frame is greater than the level of the (N-1) th speech frame, or the level of the Nth speech frame is increased.
  • the cutoff frequency set in the shelving filter unit is increased by a set value when the level is smaller than the level of the (N-1) th voice frame.
  • the present invention is a microphone for inputting and amplifying a first voice signal from the outside;
  • a noise environment determination unit which measures the strength of the first voice signal and determines whether the noise environment is based on the signal strength of the first voice signal;
  • a voice processor for converting an input voice signal into a second voice signal having a prescribed form and outputting the second voice signal;
  • a volume control unit for adjusting the sound output level to a setting level and amplifying the second voice signal to the adjusted setting level when the noise environment is determined by the noise environment determination unit;
  • An intelligibility enhancement unit that improves intelligibility of the third audio signal input through the volume control unit and outputs the fourth audio signal as a fourth audio signal;
  • a sound output unit configured to output the fourth voice signal and the voice signal output from the volume controller to the outside;
  • an output display unit for outputting an intelligibility display indicating that the fourth speech signal output by the sound output unit is an intelligibility enhanced speech signal in association with an intelligibility enhancement operation
  • Clarity improvement unit in the above is a clarity improving device according to an embodiment of the present invention.
  • the set level may be one level higher than the currently set sound output level or one of the highest sound output levels.
  • the volume controller may adjust and output the second voice signal to the specific sound output level when a setting to a specific sound output level is input from a user.
  • the intelligibility display is a display different from the first display indicative of the sound output level, and is displayed on the screen together with the first display, or is an audio or sound output informing that the intelligibility is improved.
  • the voice output device automatically detects the call environment of the user, thereby improving reception volume control and voice intelligibility corresponding to the call environment, thereby making a call in a state in which the reception sound quality is improved.
  • the user can listen to the sound quality of the received sound quality corresponding to the user's request by improving the clarity according to the user's sound quality improvement request.
  • the reception sound quality is improved to display the output state on the screen of the audio output device has the effect that the user can know that the sound currently output is improved sound quality.
  • FIG. 1 is a block diagram of an apparatus for improving clarity according to an embodiment of the present invention.
  • 2 is a graph of frequency characteristics of a typical shelving filter.
  • FIG. 3 is a diagram showing an example of a result of signal processing by mounting an embodiment of the present invention on a mobile phone terminal.
  • FIG. 4 is a diagram illustrating another example of a result of selectively filtering consonants by an apparatus for improving clarity according to an embodiment of the present invention.
  • FIG. 5 is a block diagram of an audio output device according to an exemplary embodiment of the present invention.
  • FIG. 6 is a flowchart illustrating a method of processing a reception sound in a voice output apparatus according to a first embodiment of the present invention.
  • FIG. 7 is a flowchart illustrating a method of processing a reception sound in a voice output apparatus according to a second embodiment of the present invention.
  • the consonant part of the voice signal has a relatively small signal component compared to the vowel.
  • this small signal component often tends to disappear or become small. As a result, it is often difficult to know when you are talking on a cell phone or when you hear your voice as to who the other person is.
  • the device for improving clarity according to an embodiment of the present invention does not allow the signal component of the consonant part to disappear or become small during the audio signal processing. That is, the apparatus for improving clarity in accordance with an embodiment of the present invention improves speech intelligibility by selectively emphasizing the signal component of the consonant part.
  • the clarity improving device 100 includes a shelving filter 101, an input envelope detector 102, and an output envelope detector 103.
  • the voice detector 104 and the cutoff frequency predictor 105 are included.
  • the input envelope detector 102 detects an amplitude level of an envelope (hereinafter, referred to as a current input audio signal level) with respect to a voice signal currently input, in units of voice frames, and cuts the detected amplitude level into a cutoff frequency predictor 105. To provide.
  • the output envelope detector 103 calculates an amplitude level of an envelope in units of voice frames with respect to the output voice signal, but includes an envelope amplitude level for a voice frame immediately preceding the currently output voice frame (hereinafter, referred to as an output voice signal). Level) is provided to the cutoff frequency predictor 105.
  • the voice detector 104 analyzes the frequency band of the received input signal to determine whether the input signal is a voice signal generated by a person. Generally called a Voice Activity Detector (VAD), if the input signal is not a voice signal, it is output by-pass as an output voice without passing through the shelving filter 101. When the input signal is a voice signal, the voice detector 104 passes through the determined shelving filter 101 to emphasize the voice signal of a specific part.
  • VAD Voice Activity Detector
  • the cutoff frequency predictor 105 receives the current input audio signal level from the input envelope detector 102, and receives the previous output audio signal level from the output envelope detector 103.
  • the cutoff frequency predictor 105 compares the current input audio signal level with the previous output audio signal level, compares the magnitude of the difference between the two amplitude levels, and dynamically changes the characteristics of the shelving filter 101. Calculate the frequency.
  • the cutoff frequency predictor 105 allows the cutoff frequency calculated according to the magnitude of the difference between the two amplitude levels to be the cutoff frequency of the shelving filter 101. That is, the cutoff frequency predictor 105 may be the cutoff frequency calculated according to the magnitude of the difference between the two amplitude levels. Change
  • the cutoff frequency predictor 105 sets the cutoff frequency when the magnitude of the difference between the two amplitude levels is positive (that is, the current input audio signal level is greater than the previous output audio signal level). As low as) On the other hand, if the difference between the two levels is negative, the cutoff frequency predictor 105 sets the cutoff frequency currently set in the shelving filter 101. Increase by). The value that is changed at this time, that is, the set value ( ) Is based on a pre-defined experimental value.
  • the shelving filter 101 receives the cutoff frequency calculated by the cutoff frequency predictor 105, and high-frequency filter the input voice signal according to the received cutoff frequency to output the output voice signal.
  • the shelving filter 101 is based on a shelving filter, which is widely used in audio design, and the transfer function H (s) of a general shelving filter is expressed by Equation 1 below, and the frequency characteristics Is as shown in FIG. 2.
  • Equation 2 here Is a coefficient to adjust the transition frequency, Wow Are constants obtained after calculating the envelope of each frame with gain values of zero and high frequency, respectively.
  • Equation 2 here of Re-expanding with respect to Equation 1 can be expressed as Equation 2 below.
  • Equation 2 Substituting Equation 2 into Equation 1 provides an analog transfer function as in Equation 3 below.
  • Equation 3 When Equation 3 is converted into a response characteristic of the digital domain by a bi-linear transform, the following Equation 4 is obtained.
  • Equation 4 is obtained.
  • the value is a value that determines the characteristics of the high pass filter.
  • the shelving filter 101 has the frequency characteristics of a general shelving filter, as shown in the graph shown in FIG.
  • the graph of the frequency characteristics of a typical shelving filter can be found in various literatures, and thus the description thereof is omitted.
  • the apparatus for improving clarity according to the embodiment of the present invention configured as described above improves speech intelligibility by selectively emphasizing a portion estimated as a consonant component of the input speech signal.
  • the following describes the operation of the device for improving clarity according to the embodiment of the present invention.
  • the voice detector 104 determines whether the input signal is a voice signal or a non-voice signal. In this case, when the input signal is a voice signal, the voice detector 104 provides the input signal to the shelving filter unit 101. In this case, the input signal input to the shelving filter 101 is also input to the input envelope detector 102, and the input envelope detector 102 detects an envelope level of the input signal and provides the cutoff frequency predictor 105.
  • the input signal input to the shelving filter unit 101 is signal-processed according to the filter transfer function set in the shelving filter unit 101 and then output as an output signal.
  • the output signal output from the shelving filter 101 is output to the outside, and is simultaneously input to the output envelope detection unit 103.
  • the output envelope detector 103 detects an envelope level with respect to the input output signal and provides the envelope level to the cutoff frequency predictor 105.
  • the cutoff frequency predicting unit 105 inputs an envelope level for the input signal and an envelope level for the output signal, but does not use the input signal and the output signal for the same voice frame, and the input signal and the previous signal of the current voice frame.
  • the output signal of the audio frame is used.
  • the cutoff frequency predictor 105 may include an envelope level (ie, previous output audio signal level) E2 for the output signal of the previous frame and an envelope level (ie, current input audio signal level) for the input signal of the current frame. Calculate the envelope level difference E1-E2 between (E1).
  • the cutoff frequency predictor 105 determines that the current input audio signal level is greater than the previous output audio signal level. It is determined that the signal level is smaller than the previous output audio signal level.
  • the cutoff frequency predictor 105 sets the cutoff frequency currently set in the shelving filter 101 when the difference between the two levels is positive. Lower by). On the other hand, if the difference between the two levels is negative, the cutoff frequency predictor 105 sets the cutoff frequency currently set in the shelving filter 101. Increase by).
  • the cutoff frequency predicting unit 105 emphasizes a specific high frequency component when the value of the envelope becomes small, considering that the audio signal has a lot of consonant components.
  • the high frequency component is in the range of about 1.5KHz to 2.5KHz.
  • the low degree of the cutoff frequency is determined experimentally predetermined value, that is, a set value according to the difference between the current audio input signal level and the previous output audio signal level.
  • the cutoff frequency changes by.
  • the consonants contain the main high frequency components compared to the vowels, the power of the pronunciation is increased when the output voice signal is the consonant. As a result, the speech intelligibility of the received voice signal is improved.
  • FIG. 1 is a diagram illustrating an example of a result of signal processing by mounting an embodiment of the present invention on a mobile phone terminal, in which a voice signal of "five", “six" and "two" is received.
  • FIG. 3 (a) is a frequency waveform diagram of an output audio signal output without signal processing according to the present invention, and (b) is a frequency of an output audio signal output with signal processing according to the present invention. It is a waveform diagram.
  • the clarity improving apparatus 100 is marked with a circle (marked) when the voice signals "five", “six” and “two” are received.
  • the clearness enhancing apparatus 100 according to the embodiment of the present invention selectively amplifies and outputs consonant signal components corresponding to "V", "X", and "T".
  • 4 illustrates another example in which speech intelligibility is improved by the apparatus for improving intelligibility according to the embodiment of the present invention.
  • 4 is a diagram illustrating another example of a result of selectively filtering consonants by an apparatus for improving clarity according to an embodiment of the present invention.
  • Figure 4 (a) is a frequency waveform diagram showing the audio signal input and output to the device for improving the clarity according to the present invention, the input is a waveform of the gray color waveform received, the processed is black A band is a waveform diagram of the output audio signal amplified by filtering.
  • the clarity improving device 100 cuts the frequency of the shelving filter 101 which is a high pass filter. Changes and the signal components of consonants “b”, “ch”, “k”, “p”, “zd”, “t”, and “sh” are emphasized (ie, amplified) relative to vowels. Shows.
  • FIG. 5 is a block diagram of an audio output device according to an exemplary embodiment of the present invention.
  • Voice output device 400 is a device for receiving and outputting a voice signal, a mobile phone, a general telephone, PMP, DMB, MP3, hands-free kit (vehicle hands-free kit), Bluetooth earset (bluetooth ear) -set) and the like.
  • the voice output device 400 is a mobile phone.
  • the voice output device 400 includes a receiver 401, a key input unit 402, a microphone 403, a voice processor 404, and a noise environment determiner. 405, a volume control unit 406, a clarity enhancement unit 407, a sound output unit 408, and an output display unit 409.
  • the receiver 401 receives a voice signal transmitted from the outside.
  • the receiver 401 is an antenna or the like.
  • the key input unit 402 includes a plurality of button keys, a touch pad, and the like, and inputs a user's operation.
  • the microphone 403 inputs and amplifies a user's voice or ambient noise.
  • the voice processor 404 decodes the voice signal received by the receiver 401 and outputs the analog signal.
  • the voice processor 404 includes a decoder, and further includes a digital to analog (D / A) converter when the received voice signal is a digital signal.
  • D / A digital to analog
  • the noise environment determiner 405 measures the intensity of the ambient noise collected through the microphone 403, measures the intensity of the analog voice signal received from the voice processor 404, and compares the measured two voice signals.
  • the intensity of the ambient noise is an average intensity of each of the ambient sounds.
  • the noise environment determination unit 405 determines that the noise environment is a noise environment when the intensity of the ambient noise is greater than that of the voice signal.
  • the noise environment determination unit 405 may not use the strength of the received voice signal when determining the noise environment. In this case, the noise environment determination unit 405 uses the set reference intensity, and determines that the noise environment is a noise when the intensity of the ambient noise is greater than the set reference intensity.
  • the volume controller 406 amplifies or reduces the voice signal received from the voice processor 404 or the microphone 403 to a set output volume level and outputs the sound signal to the sound controller 409.
  • the adjustment for the output volume level that is set is divided into manual (manual volume control) and automatic (automatic volume control).
  • volume control button key in the key input unit 402 to designate a specific volume output level.
  • the volume control unit 406 adjusts the output volume level to a specific volume output level specified by the user. .
  • the automatic expression is performed when the ambient noise level determined by the noise environment determination unit 405 is different from the set volume output level.
  • the volume adjusting unit 406 compares the ambient noise level with the level of the received voice signal and adjusts the volume output level higher than the ambient noise level if the ambient noise level is higher than the level of the received voice signal.
  • the volume adjusting unit 406 may adjust the volume output level by comparing the ambient noise level with the self-set volume output level.
  • Clarity enhancement unit 407 is a clarity improving device 100 according to an embodiment of the present invention described with reference to FIG.
  • the intelligibility enhancement unit 407 enhances and outputs the intelligibility of the audio signal input from the volume control unit 406, and the output audio signal is applied with the volume output level adjusted by the volume control unit 406.
  • the voice signal input to the clarity enhancing unit 407 is an analog voice signal input through the receiver 401 or an analog voice signal input through the microphone 403.
  • the clarity improving operation of the clarity improving unit 407 is performed when the surrounding environment is a noisy environment, when a button key for commanding the clarity improving is input, or when the voice output device 400 operates in the clarity improving mode.
  • the intelligibility enhancement unit 407 outputs a voice signal input to the microphone 403 to the sound output unit 408 or receives a voice signal from the receiver 401 and outputs the sound output unit. In the case of outputting at 408, the intelligibility enhancement operation is performed unconditionally.
  • the intelligibility enhancement unit 407 may operate only when the volume output level output to the sound output unit 409 is maximum, and may operate when the surrounding environment is a noise environment even when the volume output level is not maximum. Even if the environment is not a noisy environment, it can be operated at the request of the user.
  • the sound output unit 408 includes a speaker and outputs an analog voice signal output from the volume controller 406 through the speaker.
  • the speech signal output from the sound output unit 408 may or may not have been improved by the clarity enhancement unit 407.
  • the output display portion 409 displays the output level of the audio signal.
  • the output display section 409 externally displays a volume output level display corresponding to the volume output level adjusted by the volume adjusting section 406.
  • the output display unit 409 displays the intelligibility enhancement display together with the volume output level display when the outputted audio signal is the intelligibility enhancement output by the intelligibility enhancement unit 407.
  • the clarity improvement display is displayed separately from the volume output level display as shown in FIG.
  • the intelligibility improvement display enables the user to know that the intelligibility enhancement operation is performed by the voice output apparatus 400 with the naked eye.
  • the output display unit 408 may further include at least one of a vibrating unit (not shown) or an alarm unit (not shown) in conjunction with the display for improving clarity.
  • the vibrator vibrates the voice output device 400 in conjunction with the intelligibility improvement display of the output display unit 409, and the alarm unit outputs the intelligibility improvement notification sound informing of the intelligibility improvement in association with the intelligibility enhancement display of the output display unit 409.
  • the voice output device if the voice output device according to an embodiment of the present invention is a general telephone, the receiver 401 will be connected to the cable terminal, not the form of the antenna.
  • the voice output apparatus is a portable media player such as PMP, DMB, or MP3, it is not necessary to necessarily include a receiver 401, and the voice processor 404 plays an analog file by playing the stored multimedia file.
  • the voice signal will be provided to the volume controller 406.
  • the voice output apparatus is a handsfree kit or a Bluetooth earset
  • the receiver 401 and the voice processor 404 will not be required.
  • the audio output apparatus basically outputs a microphone 403, a noise environment determiner 405, a voice processor 404, a volume controller 406, a clarity enhancer 407, and a sound output.
  • the unit 408 and the output display unit 409 are configured.
  • FIG. 6 is a flowchart illustrating a method of processing a reception sound according to a first embodiment of the present invention.
  • the reception sound processing method according to the first embodiment of the present invention is for the case where the speech intelligibility improvement operation is always performed in a noise environment.
  • the voice output apparatus determines that the first voice signal should be output through the sound output unit 408 according to the first situation (S601).
  • the first condition may be a voice signal received through the receiver 401 (corresponding to the first voice signal), a reproduction of a voice file stored by a user's request, or input through the microphone 403 by a specific mode.
  • the voice signal (corresponding to the first voice signal) is output through the sound output unit 408.
  • an analog audio signal obtained by signal processing the audio file corresponds to the first audio signal.
  • the noise environment determination unit 405 measures the intensity of the first voice signal (S602) and measures the intensity of the ambient noise received through the microphone 403 (S603).
  • the noise environment determiner 405 compares the measured intensity of the first voice signal with the intensity of the ambient noise (S604). If the intensity of the ambient noise is greater than the strength of the first voice signal, the noise environment determiner 405 determines the noise environment. If it is less than the strength of the first voice signal, it is determined that the noise environment is not (S605).
  • the voice output apparatus 400 outputs the sound output unit 408 without improving the intelligibility of the first voice signal (S606).
  • the noise environment determiner 405 notifies the volume controller 406 that it is a noise environment, and the volume controller 406 sets a set volume output level corresponding to the noise environment, and the voice processor The first voice signal received through 404 is amplified to the set volume output level and provided to the clarity enhancing unit 407 (S607).
  • the set volume output level is a maximum volume output level or a volume output level close to the maximum volume level.
  • the volume control unit 406 becomes the maximum volume output level or maintains the currently set volume output level as it is.
  • the clarity enhancement unit 407 receives the first voice signal from the noise environment determination unit 405, the consonant component is selectively emphasized with respect to the received first voice signal to improve the clarity (S608). Outputs the improved first voice signal to the outside through the sound output unit 408 (S609).
  • the first voice signal having improved voice intelligibility is output through the sound output unit 408, and at the same time, the output display unit 409 is output through the sound output unit 408 in connection with the clarity improving operation of the clarity enhancer 407.
  • a clearness enhancement display indicating that clearness is improved is displayed on the screen (S610).
  • FIG. 7 is a flowchart illustrating a method of processing a reception sound in a voice output apparatus according to a second embodiment of the present invention.
  • the received sound processing method in the voice output apparatus according to the second exemplary embodiment of the present invention relates to a case in which the speech intelligibility improvement operation is performed regardless of the noise environment.
  • the voice output apparatus 400 determines that the first voice signal should be output through the sound output unit 408 according to the first situation (S701).
  • the first condition may be a voice signal received through the receiver 401 (corresponding to the first voice signal), a reproduction of a voice file stored by a user's request, or input through the microphone 403 by a specific mode.
  • the voice signal (corresponding to the first voice signal) is output through the sound output unit 408.
  • an analog audio signal obtained by signal processing the audio file corresponds to the first audio signal.
  • the noise environment determination unit 405 measures the intensity of the first voice signal according to the first situation (S702) and measures the intensity of the ambient noise received through the microphone 403 (S703).
  • the noise environment determiner 405 compares the strength of the first voice signal with the strength of the ambient noise (S704), and determines that the noise environment is greater than the strength of the first voice signal when the intensity of the ambient noise is greater than that of the first voice signal. If S is less than or equal to the strength of the first voice signal, it is determined that there is no noise environment (S705).
  • the noise environment determiner 405 notifies the volume controller 406 that it is a noise environment, and the volume controller 406 sets a set volume output level corresponding to the noise environment, and the voice processor 404.
  • the first voice signal received through the amplified signal is amplified to the set volume output level and provided to the clarity improving unit 407 (S706 and S707).
  • the set volume output level is a maximum volume output level or a volume output level close to the maximum volume level.
  • the volume control unit 406 may be the maximum volume output level or maintain the currently set volume output level as it is.
  • the clarity enhancement unit 407 receives the first voice signal from the noise environment determination unit 405, the consonant component is selectively emphasized with respect to the received first voice signal to improve clarity (S707). Outputs the improved first voice signal to the outside through the sound output unit 408 (S708).
  • the first voice signal having improved voice intelligibility is output through the sound output unit 408, and at the same time, the output display unit 409 is output through the sound output unit 408 in connection with the clarity improving operation of the clarity enhancer 407.
  • a clearness enhancement display indicating that clearness is improved is displayed on the screen (S709).
  • the processes S707, S708 to S709 are performed without the automatic volume control (S706 process) for the received first voice signal.
  • the operation of the voice output device 409 may be set so that automatic volume control and intelligibility of the received voice signal may not be improved.
  • the user may perform the intelligibility improvement of the received voice signal when the user presses a button key for intelligibility improvement. do.
  • the voice output device automatically grasps the call environment of the user, and adjusts the reception volume according to the call environment and improves the voice intelligibility so that the user can make a call while the received sound quality is improved. Even if a request for improving the sound quality is made, the intelligibility is improved in accordance with the user's request for improving the sound quality, so that the received sound quality of the user's request is improved.
  • the reception sound quality is improved to display the output state on the screen of the voice output device so that the user can know that the sound that is currently output is the sound quality improved reception.

Abstract

본 발명은 명료도 향상장치와 이를 이용한 음성출력장치에 관한 것으로, 입력포락선 검출부를 통해 입력 신호에 대해 음성 프레임의 레벨을 검출하여 컷오프주파수 예측부에 제공하고, 출력포락선 검출부를 통해 출력 신호에 대해 음성 프레임의 레벨을 검출하는 컷오프주파수 예측부에 제공하며, 컷오프주파수 예측부에서 입력포락선 검출부로부터 수신된 N번째 음성 프레임의 레벨과 출력포락선 검출부로부터 수신된 (N-1)번째 음성 프레임의 레벨 간의 차이값을 파악하고, 상기 차이값으로 상기 입력 신호의 자음 성분을 증폭시키기 위한 컷오프주파수를 산출하며, 쉘빙 필터부가 컷오프주파수 예측부에 의해 산출된 컷오프 주파수에 따라 상기 입력 신호를 필터링하되, 상기 입력 신호의 자음 성분으로 추측되는 부분을 선택적으로 증폭되게 한다. 이에 따라 쉘빙 필터부는 입력 신호에 자음성분이 많고 적음에 따라 컷오프 주파수가 동적으로 변동되어, 입력 신호의 자음 신호에 해당하는 고주파 성분이 증폭되는 반면에 저주파 성분을 감쇄시킴으로써, 자음 성분이 선택적으로 강조되게 하여 음성 명료도가 향상되게 한다.

Description

명료도 향상장치와 이를 이용한 음성출력장치
본 발명은 디지털 통신 분야에서 음성 신호의 음질을 향상시키는 방법 및 장치에 관한 것으로, 보다 상세하게는 수신되는 음성 신호의 명료도를 향상시키는 장치 및 이 장치를 이용하는 음성출력장치에 관한 것이다.
디지털 음악 기술이 보편화되면서 좋은 통화음질에 대한 소비자의 기대값 또한 상당히 높아지고 있다. 그러나 음성출력장치의 통화음질은 소형화, 슬림화를 거듭하면서 오히려 예전 수준에 미치지 못하고 있다.
특히, 잡음환경에서 휴대폰의 수신음질을 향상시키기 위한 종래기술은 잡음제거, 등화기 또는 수신음량 자동 조절 정도의 기술로서; 잡음제거 기술은 음성신호의 왜곡에 따른 메탈 잡음(Metalic noise)이 수반되고, 등화기는 청감상의 향상도가 미세하며, 수신음량 증폭은 휴대폰의 슬림화에 따른 문제로 스피커로의 최대음량 초과시 심각한 왜곡을 초래한다.
여기서 등화기 기술은 청취자가 잡음이 심한 지역에 있을 때에 음성의 명료도를 증가시키기 위해 전체적인 신호를 3db~10db 증폭시키는 것이다.
그러나, 더 큰 SNR(Signal to Noise Ratio, 신호 대 잡음비)을 얻기 위해서 전력을 높이는 것은 청취자에게 불안감과 청취 피로도를 주는 원인이 되기도 하고, 또한 대부분의 소형 단말기에서는 음의 찢어지기 바로 전 단계를 최대 볼륨으로 설정하므로, 추가적인 증폭은 음의 찢어짐을 수반한다.
사실, 잡음환경에서 통화 시에 더 큰 SNR을 확보하면, 청취자는 상대방의 말소리를 더 잘 들을 수 있다. 즉, 볼륨을 높이면 더 큰소리로 잘 들을 수 있다.
그러나, 증폭 정도를 일정 수준 이상 높이면 음성출력장치에서 출력되는 음이 찢어지거나 왜곡 현상이 발생하게 되고, 소형의 음성출력장치인 경우에는 음의 찍어짐 현상과 왜곡 현상이 더욱 심해진다.
본 발명이 이루고자 하는 과제는 수신되는 음성 신호에 대한 전체적인 출력이 아닌 음성 명료도만 높여 수신음질을 향상시키는 장치를 제공하는 것이다.
또한 본 발명이 이루고자 하는 다른 과제는 잡음 환경인지 그렇지 않은 환경인지 등의 통화 환경에 따라 수동 또는 자동으로 수신 음량조절을 조절하고 음성 명료도를 향상시키는 음성출력장치를 제공하는 것이다.
또한 본 발명이 이루고자 하는 또 다른 과제는 음성 명료도 향상에 따른 출력 상태인지를 사용자가 육안으로 확인할 수 있게 하는 음성출력장치를 제공하는 것이다.
상기 기술적 과제를 달성하기 위한 제1 특징에 따르면, 본 발명은 입력 신호에 대해 음성 프레임의 레벨을 검출하는 입력포락선 검출부; 출력 신호에 대해 음성 프레임의 레벨을 검출하는 출력포락선 검출부; 상기 입력포락선 검출부로부터 수신된 N번째 음성 프레임의 레벨과 상기 출력포락선 검출부로부터 수신된 N-1)번째 음성 프레임의 레벨 간의 차이값을 파악하고, 상기 차이값으로 상기 입력 신호의 자음 성분을 증폭시키기 위한 컷오프주파수를 산출하는 컷오프주파수 예측부; 상기 컷오프주파수 예측부에 의해 산출된 상기 컷오프 주파수에 따라 상기 입력 신호를 필터링하되, 상기 입력 신호의 자음 성분으로 추측되는 부분을 선택적으로 증폭되게 필터링하는 쉘빙 필터부; 및 상기 입력 신호를 분석하여 음성 신호인지 비음성 신호를 파악하며, 상기 비음성 신호인 경우에 상기 입력 신호를 상기 출력 신호로 바이패스시키고, 상기 음성 신호인 경우에 상기 입력포락선 검출부와 상기 쉘빙 필터부의 입력으로 제공하는 음성 검출기를 포함하는 것을 특징으로 하는 명료도 향상장치를 제공한다.
상기에서, 컷오프주파수 예측부는 상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 크면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 낮추거나, 상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 작으면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 높이는 것을 특징으로 한다.
상기 기술적 과제를 달성하기 위한 본 발명의 제2 특징에 따르면, 본 발명은 외부로부터 제1 음성 신호를 입력하여 증폭하는 마이크; 상기 제1 음성 신호의 세기를 측정하고 상기 제1 음성 신호의 신호 세기를 기반으로 잡음 환경인지를 판단하는 잡음환경 판단부; 입력되는 음성 신호를 규정된 형태의 제2 음성 신호로 바꾸어 출력하는 음성 처리부; 상기 잡음환경 판단부의 판단에 의해 잡음 환경인 경우에 음향 출력 레벨을 설정 레벨로 조절하고, 상기 제2 음성 신호를 상기 조절한 설정 레벨로 증폭하여 출력하는 음량 조절부; 상기 음량 조절부를 통해 입력되는 제3 음성 신호에 대해 명료도를 향상시켜 제4 음성 신호로 출력하는 명료도 향상부; 상기 제4 음성 신호 및 상기 음량 조절부에서 출력하는 음성 신호를 외부로 출력하는 소리 출력부; 및 상기 명료도 향상부의 명료도 향상 동작에 연동하여 상기 소리 출력부에 의해 출력되는 상기 제4 음성 신호가 명료도 향상된 음성 신호임을 나타내는 명료도 표시를 출력하는 출력 표시부를 포함하는 명료도 향상장치를 이용한 음성출력장치를 제공한다.
상기에서 명료도 향상부는 본 발명의 실시 예에 따른 명료도 향상장치이다.
상기 설정 레벨은 상기 현재 설정된 음향 출력 레벨보다 한 단계 높은 레벨이거나, 가장 높은 음향 출력 레벨 중 하나인 것을 특징으로 한다.
상기 음량 조절부는 사용자로부터 특정 음향 출력 레벨로의 설정이 입력되는 경우에, 상기 제2 음성 신호를 상기 특정 음향 출력 레벨로 조절하여 출력하는 것을 특징으로 한다.
상기 명료도 표시는 음향 출력 레벨을 나타내는 제1 표시와 차별화된 표시이며, 상기 제1 표시와 함께 화면상에 표시되거나, 명료도 향상된 음성 출력이 되고 있음을 알리는 음성 또는 음향 출력이다.
본 발명의 실시 예에 따르면, 음성출력장치가 자동으로 사용자의 통화 환경을 파악하여 통화 환경에 맞는 수신 음량 조절 및 음성 명료도를 향상시켜 수신음질이 향상된 상태에서 통화를 할 수 있게 하는 효과가 있다.
또한 본 발명의 실시 예에 따르면, 사용자가 통화 중에 음질 향상 요구를 하더라도 사용자의 음질향상 요구에 맞게 명료도 향상 동작을 하여 사용자의 요구에 부응하는 수신 음질이 향상된 소리를 들을 수 있게 하는 효과가 있다.
또한 본 발명의 실시 예에 따르면, 수신 음질이 향상되어 출력되는 상태를 음성출력장치의 화면상에 표시하여 사용자가 현재 출력되는 소리가 수신 음질이 향상된 소리임을 알 수 있게 하는 효과가 있다.
도 1은 본 발명의 실시 예에 따른 명료도 향상장치의 블록 구성도이다.
도 2는 일반적인 쉘빙 필터의 주파수 특성 그래프이다.
도 3은 본 발명의 실시 예를 휴대폰 단말기에 탑재 하여 신호처리 한 결과의 일 예를 보인 도면이다.
도 4는 본 발명의 실시 예에 따른 명료도 향상장치에 의해 선택적으로 자음을 필터링한 결과의 다른 예를 보인 도면이다.
도 5는 본 발명의 실시 예에 따른 음성출력장치의 블록 구성도이다.
도 6은 본 발명의 제1 실시 예에 따른 음성출력장치에서의 수신음 처리 방법을 보인 순서도이다.
도 7은 본 발명의 제2 실시 예에 따른 음성출력장치에서의 수신음 처리 방법을 보인 순서도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
이하에서는 도 1을 참조로 하여 본 발명의 실시 예에 따른 명료도 향상장치를 설명한다.
설명에 앞서, 음성신호에서 자음 부분은 모음에 비해 상대적으로 아주 작은 신호성분을 가지고 있다. 그러나, 이동통신 기기의 네트워크 장비 및 단말기의 오디오 신호처리 과정에서 이 작은 신호성분은 종종 사라지거나 작아지는 경향이 많다. 그 결과 휴대전화로 통화 시 상당히 둔탄한 소리를 느끼거나 상대방이 누구인지 목소리를 듣고서 알기 어려울 때가 많다.
본 발명의 실시 예에 따른 명료도 향상장치는 오디오 신호처리 과정에서 자음 부분의 신호 성분이 사라지거나 작아지지 않게 한다. 즉, 본 발명의 실시 예에 따른 명료도 향상장치는 자음 부분의 신호 성분을 선택적으로 강조하여 음성 명료도를 향상시킨다.
도 1은 본 발명의 실시 예에 따른 명료도 향상장치(100)의 블록 구성도이다. 도 1에 도시된 바와 같이, 본 발명의 실시 예에 따른 명료도 향상장치(100)는 쉘빙 필터부(101), 입력포락선(input envelop) 검출부(102), 출력포락선(output envelop) 검출부(103), 음성 검출기(104)와 컷오프주파수(cutoff frequency) 예측부(105)를 포함한다.
입력포락선 검출부(102)는 현재 입력되는 음성신호에 대해 음성 프레임 단위로 포락선(envelop)의 진폭 레벨(이하 현재 입력음성신호 레벨이라 함)을 검출하고, 검출한 진폭 레벨을 컷오프주파수 예측부(105)에 제공한다.
출력포락선 검출부(103)는 출력되는 음성신호에 대해 음성 프레임 단위로 포락선(envelop)의 진폭 레벨을 계산하되, 현재 출력되는 음성 프레임의 바로 이전의 음성 프레임에 대한 포락선 진폭 레벨(이하 이전 출력음성신호 레벨이라 함)을 컷오프주파수 예측부(105)에 제공한다.
음성 검출기(104)는 수신되는 입력 신호의 주파수 대역을 분석하여 입력 신호가 사람에 의해 발생된 음성신호인지를 판단한다. 일반적으로 Voice Activity Detector (VAD) 라고 불리우며, 입력신호가 음성신호가 아닌 경우에 쉘빙 필터부(101)를 거치지 않고 바로 출력 음성으로 by-pass 출력되게 한다. 그리고 음성 검출기(104)는 입력신호가 음성신호인 경우에는 정해진 쉘빙 필터부(101)를 통과하여 특정부분의 음성신호가 강조된다.
컷오프주파수 예측부(105)는 입력포락선 검출부(102)로부터 현재 입력음성신호 레벨을 수신하고, 출력포락선 검출부(103)로부터 이전 출력음성신호 레벨을 수신한다. 그리고 컷오프주파수 예측부(105)는 현재 입력음성신호 레벨과 이전 출력음성신호 레벨을 비교하여 두 진폭 레벨 간 차이의 크기를 비교하며, 쉘빙 필터부(101)의 특성을 동적으로 변경 가능하도록 하는 컷오프 주파수를 계산한다.
컷오프주파수 예측부(105)는 두 진폭 레벨 간 차이의 크기에 따라 계산한 컷오프 주파수가 쉘빙 필터부(101)의 컷오프 주파수가 되도록 한다. 즉, 컷오프주파수 예측부(105)는 두 진폭 레벨 간 차이의 크기에 따라 계산한 컷오프 주파수가 되도록 하기 수학식 4의
Figure PCTKR2010004078-appb-I000001
를 변경한다.
컷오프주파수 예측부(105)는 두 진폭 레벨 간 차이의 크기가 양수(즉, 현재 입력음성신호 레벨이 이전 출력음성신호 레벨보다 큼)인 경우에 컷오프 주파수를 설정치(
Figure PCTKR2010004078-appb-I000002
) 만큼 낮춘다. 반면에 컷오프주파수 예측부(105)는 상기 두 레벨간의 차이가 음수이면 쉘빙 필터부(101)에 현재 설정되어 있는 컷오프 주파수를 설정치(
Figure PCTKR2010004078-appb-I000003
)만큼 높여 준다. 이때 변경되는 값 즉, 설정치(
Figure PCTKR2010004078-appb-I000004
)는 미리 실험적으로 정해 둔 값에 의한다.
쉘빙 필터부(101)는 컷오프주파수 예측부(105)에서 산출한 컷오프 주파수를 수신하고, 수신한 컷오프 주파수에 따라 입력 음성신호를 고주파 통과 필터링하여 출력 음성신호를 출력한다.
이러한 쉘빙 필터부(101)는 오디오 설계에 많이 사용되는 쉘빙 필터(shelving filter)를 근간으로 하며, 일반적인 쉘빙 필터의 전달함수(H(s))는 다음의 수학식 1과 같이 나타내어지고, 주파수 특성은 도 2에 도시된 바와 같다.
수학식 1
Figure PCTKR2010004078-appb-M000001
여기서
Figure PCTKR2010004078-appb-I000005
는 전이주파수(transition frequency)를 조정하는 계수이고,
Figure PCTKR2010004078-appb-I000006
Figure PCTKR2010004078-appb-I000007
는 각각 제로와 고주파수의 게인 값으로 각 프레임의 포락선을 계산 후 얻어지는 상수이다. 여기서
Figure PCTKR2010004078-appb-I000008
Figure PCTKR2010004078-appb-I000009
에 대해 다시 전개하면 수학식 1은 다음의 수학식 2와 같이 나타낼 수 있다.
수학식 2
Figure PCTKR2010004078-appb-M000002
그리고 수학식 2를 수학식 1에 대입하면 다음의 수학식 3과 같이 아날로그 전달함수를 얻을 수 있다.
수학식 3
Figure PCTKR2010004078-appb-M000003
수학식 3을 쌍 일차 변환(Bi-linear transform)으로 디지털 도메인의 응답특성으로 변환하면 다음의 수학식 4와 같다. 여기서, 쌍 일차 변환은
Figure PCTKR2010004078-appb-I000010
Figure PCTKR2010004078-appb-I000011
와 같이 정의되어 있다.
수학식 4
Figure PCTKR2010004078-appb-M000004
수학식 4에서
Figure PCTKR2010004078-appb-I000012
값은 고주파 통과 필터의 특성을 결정하는 값이다.
이러한 전달함수에 의해 쉘빙 필터부(101)는 도 2에 도시된 그래프와 같이, 일반적인 쉘빙 필터의 주파수 특성을 가진다. 일반적인 쉘빙 필터의 주파수 특성 그래프는 여러 문헌에서 접할 수 있으므로 부연 설명은 생략한다.
이상과 같이 구성된 본 발명의 실시 예에 따른 명료도 향상 장치는 입력 음성신호의 자음 성분으로 추측되는 부분을 선택적으로 강조하여 음성 명료도를 향상시킨다. 아래는 이러한 본 발명의 실시 예에 따른 명료도 향상 장치의 동작을 설명한다.
입력 신호가 수신되면, 음성 검출기(104)는 입력 신호가 음성 신호인지 비음성 신호인지를 판단한다. 이러한 판단으로 입력 신호가 음성 신호인 경우에, 음성 검출기(104)는 입력 신호를 쉘빙 필터부(101)에 제공한다. 이때 쉘빙 필터부(101)에 입력되는 입력 신호는 입력포락선 검출부(102)에도 입력되며, 입력포락선 검출부(102)는 입력 신호에 대한 포락선 레벨을 검출하여 컷오프주파수 예측부(105)에 제공한다.
한편, 쉘빙 필터부(101)에 입력된 입력신호는 쉘빙 필터부(101)에 설정된 필터 전달함수에 따라 신호 처리된 후 출력 신호로서 출력된다. 이때 쉘빙 필터부(101)에서 출력된 출력 신호는 외부로 출력되고, 동시에 출력포락선 검출부(103)에 입력된다. 그러면, 출력포락선 검출부(103)는 입력된 출력 신호에 대하여 포락선 레벨을 검출하여 컷오프주파수 예측부(105)에 제공한다.
여기서, 컷오프주파수 예측부(105)는 입력신호에 대한 포락선 레벨과 출력신호에 대한 포락선 레벨을 입력하지만, 동일한 음성 프레임에 대한 입력신호와 출력신호를 이용하지 않고, 현재 음성프레임의 입력신호와 이전 음성프레임의 출력신호를 이용한다.
즉, 컷오프주파수 예측부(105)는 이전 프레임의 출력신호에 대한 포락선 레벨(즉, 이전 출력음성신호 레벨)(E2)과 현재 프레임의 입력신호에 대한 포락선 레벨(즉, 현재 입력음성신호 레벨)(E1) 간에 포락선 레벨 차이(E1-E2)를 계산한다.
컷오프주파수 예측부(105)는 현재 입력음성신호 레벨과 이전 출력음성신호 레벨간 차이(E1E2)의 크기가 양수이면 현재 입력음성신호 레벨이 이전 출력음성신호 레벨보다 크다고 판단하고, 음수이면 현재 입력음성신호 레벨이 이전 출력음성신호 레벨보다 작다고 판단한다.
컷오프주파수 예측부(105)는 상기 두 레벨간의 차이가 양수이면 쉘빙(shelving) 필터부(101)에 현재 설정되어 있는 컷오프 주파수를 설정치(
Figure PCTKR2010004078-appb-I000013
)만큼 낮추어 준다. 반면에 컷오프주파수 예측부(105)는 상기 두 레벨간의 차이가 음수이면 쉘빙 필터부(101)에 현재 설정되어 있는 컷오프 주파수를 설정치(
Figure PCTKR2010004078-appb-I000014
)만큼 높여 준다.
컷오프주파수 예측부(105)는 포락선의 값이 작아지면 음성신호에 자음성분이 많은 것으로 간주하여 특정 고주파 성분을 강조해 준다. 여기서 고주파 성분의 범위는 약 1.5KHz에서 2.5KHz 사이에 속한다.
이 때, 결정되는 컷오프 주파수의 낮음 정도는 현재 음성입력신호 레벨과 이전 출력음성신호 레벨의 차이에 따라 실험적으로 미리 정해진 값, 즉, 설정치(
Figure PCTKR2010004078-appb-I000015
)만큼 컷오프 주파수가 변화한다.
이와 같이 컷오프 주파수를 동적으로 변경함으로써, 쉘빙 필터부(101)에서 출력하는 출력 음성신호의 자음성분 고주파 성분이 증폭되는 반면에, 저주파 성분은 감쇄된다. 그러므로 평균적인 RMS(Root-Mean-Square) 에너지 정도는 필터링 후에도 변화하지 않고 유지된다.
이때 자음이 모음에 비해 주된 고주파 성분을 포함하고 있기 때문에, 출력 음성신호가 자음인 경우에 발음상의 파워가 증가되고, 이의 결과로 수신 음성신호에 대한 음성 명료도가 향상된다.
본 발명의 실시 예에 따른 명료도 향상장치에 의해 음성 명료도가 향상됨을 보여주는 일 예가 도 3에 도시되어 있다. 본 발명의 실시 예를 휴대폰 단말기에 탑재 하여 신호처리 한 결과의 일 예를 보인 도면으로, "five", "six" 그리고 "two"라는 음성 신호를 수신한 경우에 대한 것이다.
도 3에서 (a)는 본 발명에 따른 신호 처리를 하지 않은 상태로 출력되는 출력 음성신호의 주파수 파형도이고, (b)는 본 발명에 따른 신호 처리를 한 상태로 출력되는 출력 음성신호의 주파수 파형도이다.
(a)에 도시된 바와 같이,five, six와 two라는 음성신호가 수신되면 종래에는 원으로 마킹(marking)된 "F", "S", "W"에 해당하는 자음 신호 성분에 대한 증폭이 이루어지지 않고 있다.
이에 반해, (b)에 도시된 바와 같이 본 발명의 실시 예에 따른 명료도 향상장치(100)는 "five", "six"와 "two"라는 음성신호가 수신되면 원으로 마킹(marking)된 "F", "S", "W"에 해당하는 자음 신호 성분에 대해 선택적인 증폭하여 출력한다. 물론, 본 발명의 실시 예에 따른 명료도 향상장치(100)는 "V", "X", "T"에 해당하는 자음 신호 성분 또한 선택적인 증폭하여 출력하고 있음을 알 수 있다.
본 발명의 실시 예에 따른 명료도 향상장치에 의한 음성 명료도가 향상을 보인 다른 예가 도 4에 도시되어 있다. 도 4는 본 발명의 실시 예에 따른 명료도 향상장치에 의해 선택적으로 자음을 필터링한 결과의 다른 예를 보인 도면이다.
도 4의 (a)는 본 발명에 따른 명료도 향상장치에 입력 및 출력되는 음성신호를 보여주는 주파수 파형도로서, input은 회색을 띠는 파형도로서 수신되는 음성신호의 파형이고, processed은 검은색을 띠는 파형도로서 필터링에 의해 증폭된 출력되는 음성신호의 파형이다.
그리고 (b)는 입력 음성신호의 스펙트로그램이며, (c)는 출력 음성신호의 스펙트로그램이다.
(a)에 도시된 입력 음성신호와 출력 음성신호를 통해 알 수 있듯이 "beach exposed to trash"라는 음성신호가 수신되면 명료도 향상장치(100)는 고주파 통과 필터인 쉘빙 필터부(101)의 컷오프 주파수가 변화하면서 자음인 "b", "ch", "k", "p", "zd", "t", "sh"의 신호 성분을 모음에 비해 상대적으로 강조(즉, 증폭)을 하여 출력함을 보여준다.
그리고 (b)와 (c)에 도시된 스펙트로그램에서 알 수 있듯이, 원으로 마킹한 자음 부분은 입력 음성신호에 비해 출력 음성신호에서 고주파 성분에서의 분포가 높음을 알 수 있다.
이하에서는 도 5를 참조로 하여 본 발명의 실시 예에 따른 음성출력장치를 설명한다. 도 5는 본 발명의 실시 예에 따른 음성출력장치의 블록 구성도이다.
본 발명의 실시 예에 따른 음성출력장치(400)는 음성신호를 수신하고 출력하는 장치로서, 휴대폰, 일반전화기, PMP, DMB, MP3, 차량용 핸즈 프리킷(hands-free kit), 블루투스 이어셋(bluetooth ear-set) 등일 수 있다.
이하에서는 음성출력장치(400)가 휴대폰인 경우를 일 예로 하여 설명한다.
이와 같은 본 발명의 실시 예에 따른 음성출력장치(400)는 도 5에 도시된 바와 같이, 수신부(401), 키입력부(402), 마이크(403), 음성 처리부(404), 잡음환경 판단부(405), 음량 조절부(406), 명료도 향상부(407), 소리 출력부(408), 와 출력 표시부(409)를 포함한다.
수신부(401)는 외부로부터 전송되는 음성 신호를 수신한다. 예컨대, 수신부(401)는 안테나 등이다.
키입력부(402)는 복수의 버튼 키(button key)나 터치패드(touch pad) 등으로 이루어지며, 사용자의 조작을 입력한다. 마이크(403)는 사용자의 음성이나 주변 잡음을 입력하여 증폭한다.
음성 처리부(404)는 수신부(401)에 수신된 음성 신호를 복호화하여 아날로그 신호로 출력한다. 예컨대, 음성 처리부(404)는 디코더(decoder)를 포함된 형태이며, 수신된 음성 신호가 디지털 신호인 경우에 D/A(Digital to analog) 컨버터를 더 포함된 형태이다.
잡음환경 판단부(405)는 마이크(403)를 통해 수집되는 주변 잡음의 세기를 측정하고, 음성 처리부(404)로부터 수신되는 아날로그 음성 신호의 세기를 측정하며, 측정한 두 음성 신호를 비교한다. 이때 주변 잡음의 세기는 주변음들 각각의 세기에 대한 평균 세기이다.
잡음환경 판단부(405)는 주변 잡음의 세기가 음성 신호의 세기보다 큰 경우에 잡음 환경이라고 판단한다.
다른 예로, 잡음환경 판단부(405)는 잡음 환경 판단시에 수신된 음성 신호의 세기를 이용하지 않을 수 있다. 이 경우에 잡음환경 판단부(405)는 설정 기준 세기를 이용하는데, 주변 잡음의 세기가 설정 기준 세기보다 큰 경우에 잡음 환경이라고 판단한다.
음량 조절부(406)는 음성 처리부(404) 또는 마이크(403)로부터 수신한 음성 신호를 설정된 출력 음량 레벨로 증폭 또는 감소시켜 소리 출력부(409)로 출력되는데, 이때 음량 조절부(406)에 설정되는 출력 음량 레벨에 대한 조절은 수동식(수동 음량 조절)과 자동식(자동 음량 조절)으로 구분된다.
수동식은 사용자가 키입력부(402)에서 음량 조절 버튼키를 조절하여 특정 음량 출력 레벨을 지정하는 경우에 이루어지는데, 음량 조절부(406)는 사용자가 지정한 특정 음량 출력 레벨로 출력 음량 레벨을 조절한다.
자동식은 잡음환경 판단부(405)에 의해 판단된 주변 잡음 레벨이 설정된 음량 출력 레벨과 차이가 나는 경우에 이루어진다. 이 경우에 음량 조절부(406)는 주변 잡음 레벨과 수신된 음성 신호의 레벨을 비교하여 주변 잡음 레벨이 수신된 음성 신호의 레벨보다 높으면 음량 출력 레벨을 주변 잡음 레벨보다 높게 조절한다. 물론, 음량 조절부(406)는 주변 잡음 레벨을 자체 설정된 음량 출력 레벨과 비교하여 음량 출력 레벨을 조절할 수 있다.
명료도 향상부(407)는 도 1을 참조로 설명한 본 발명의 실시 예에 따른 명료도 향상장치(100)이다. 명료도 향상부(407)는 음량 조절부(406)로부터 입력되는 음성 신호에 대해 명료도를 향상시켜 출력하며, 이때 출력되는 음성 신호는 음량 조절부(406)에 의해 조절된 음량 출력 레벨을 적용받는다.
명료도 향상부(407)로 입력되는 음성 신호는 수신부(401)를 통해 입력되는 아날로그의 음성 신호이거나 마이크(403)를 통해 입력되는 아날로그 음성 신호이다.
명료도 향상부(407)의 명료도 향상 동작은 주변 환경이 잡음 환경이거나, 명료도 향상을 명령하는 버튼키의 입력이 있거나, 음성출력장치(400)가 명료도 향상 모드로 동작하는 경우에 이루어진다.
여기서, 명료도 향상 모드로 동작하는 경우에 명료도 향상부(407)는 마이크(403)로 입력되는 음성 신호가 소리 출력부(408)로 출력되거나, 수신부(401)로 음성 신호가 수신되어 소리 출력부(408)로 출력되는 경우에 무조건적으로 명료도 향상 동작을 수행한다.
명료도 향상부(407)는 소리 출력부(409)에 출력되는 음량 출력 레벨이 최대인 경우에만 동작할 수 있으며, 음량 출력 레벨이 최대가 아니어도 주변 환경이 잡음 환경인 경우에 동작할 수 있으며, 주변 환경이 잡음 환경이 아니어도 사용자의 요청이 있는 경우에 동작할 수 있다.
소리 출력부(408)는 스피커를 포함하고 있으며, 음량 조절부(406)에서 출력한 아날로그 음성 신호를 스피커를 통해 출력한다. 이때 소리 출력부(408)에서 출력되는 음성 신호는 명료도 향상부(407)에 의해 명료도가 향상되었을 수 있고 그렇지 않을 수 있다.
출력 표시부(409)는 음성 신호의 출력 레벨을 표시한다. 출력 표시부(409)는 음량 조절부(406)에 의해 조절된 음량 출력 레벨에 부합하는 음량 출력 레벨 표시를 외부에 나타낸다. 특히, 출력 표시부(409)는 출력되는 음성 신호가 명료도 향상부(407)에 의해 명료도 향상된 출력인 경우에 명료도 향상 표시를 음량 출력 레벨 표시와 함께 외부에 나타낸다.
예컨대, 도 5에 도시된 바와 같이 음성출력장치(400)의 전면 표시창(10)에 음량 출력 레벨 표시가 나타나는 경우에, 명료도 향상 표시는 A와 같이 음량 출력 레벨 표시와 별도로 표시하여 나타낸다.
이와 같이 별도의 표시로 나타냄으로써, 명료도 향상 표시는 사용자가 육안으로 음성출력장치(400)에서 명료도 향상 동작이 이루어지고 있음을 알 수 있게 된다.
한편, 본 발명의 다른 실시 예로서 출력 표시부(408)의 명료도 향상 표시에 연동하는 진동부(미도시) 또는 알람부(미도시) 중 적어도 하나를 더 포함할 수 있다. 진동부는 출력 표시부(409)의 명료도 향상 표시에 연동하여 음성출력장치(400)를 진동시키며, 알람부는 출력 표시부(409)의 명료도 향상 표시에 연동하여 명료도 향상을 알리는 명료도 향상 알림음을 출력한다.
한편, 본 발명의 실시 예에 따른 음성출력장치가 일반전화기인 경우에는 수신부(401)가 안테나 형태가 아닌 케이블 단자에 연결된 형태일 것이다. 그리고 본 발명의 실시 예에 따른 음성출력장치가 PMP, DMB, MP3 등과 같이 휴대용 미디어 재생기인 경우에는 필수적으로 수신부(401)를 구비하지 않아도 되며, 음성 처리부(404)가 저장된 멀티미디어 파일을 재생하여 아날로그 음성 신호를 음량 조절부(406)에 제공하게 될 것이다.
또한 본 발명의 실시 예에 따른 음성출력장치가 핸즈 프리킷 또는 블루투스 이어셋인 경우에는 수신부(401), 음성 처리부(404)를 필요로 하지 않을 것이다.
결국, 본 발명의 실시 예에 따른 음성출력장치는 기본적으로 마이크(403), 잡음환경 판단부(405), 음성 처리부(404), 음량 조절부(406), 명료도 향상부(407), 소리 출력부(408)와 출력 표시부(409)를 구성으로 하게 된다.
이하에서는 도 6을 참조로 하여 본 발명의 제1 실시 예에 따른 수신음 처리 방법의 예를 설명한다. 도 6은 본 발명의 제1 실시 예에 따른 수신음 처리 방법을 보인 순서도이다.
본 발명의 제1 실시 예에 따른 수신음 처리 방법은 잡음 환경인 경우에 음성 명료도 향상 동작이 항상 이루어지는 경우에 대한 것이다.
도 6에 도시된 바와 같이, 음성출력장치는 제1 상황에 따라 제1 음성신호가 소리 출력부(408)를 통해 출력되어야 하는 것임을 판단한다(S601).
이때 제1 조건은 수신부(401)를 통해 수신된 음성 신호(제1 음성 신호에 해당됨)이거나, 사용자의 요구에 의해 자체 저장된 음성 파일의 재생이거나, 특정 모드에 의해 마이크(403)를 통해 입력되는 음성 신호(제1 음성 신호에 해당됨)를 소리 출력부(408)를 통해 출력하는 상황 등이다. 그리고 음성 파일을 재생하는 경우에, 음성 파일을 신호 처리한 아날로그 음성 신호가 제1 음성 신호에 해당된다.
제1 상황에 따라 잡음환경 판단부(405)는 제1 음성신호의 세기를 측정하고(S602), 마이크(403)를 통해 수신된 주변 잡음의 세기를 측정한다(S603).
그리고 잡음환경 판단부(405)는 측정한 제1 음성신호의 세기와 주변 잡음의 세기를 비교하여(S604), 주변 잡음의 세기가 제1 음성신호의 세기보다 크면 잡음 환경이라고 판단하고, 주변 잡음의 세기가 제1 음성신호의 세기 이하이면 잡음 환경이 아니라고 판단한다(S605).
잡음 환경이 아닌 경우에, 음성출력장치(400)는 제1 음성신호에 대한 명료도 향상을 하지 않고 소리 출력부(408)를 통해 출력한다(S606).
반면에 잡음 환경이 경우에, 잡음환경 판단부(405)는 음량 조절부(406)에게 잡음 환경임을 알리며, 음량 조절부(406)는 잡음 환경에 대응한 설정 음량 출력 레벨을 설정하고, 음성 처리부(404)를 통해 수신되는 제1 음성 신호를 설정 음량 출력 레벨로 증폭하여 명료도 향상부(407)에 제공한다(S607).
여기서, 설정 음량 출력 레벨은 최대 음량 출력 레벨이거나 최대 음량 레벨에 근접한 음량 출력 레벨이다. 물론 현재 설정된 음량 조절부(406)의 음량 출력 레벨이 설정 음량 출력 레벨 이상이면, 음량 조절부(406)는 최대 음량 출력 레벨이 되게 하거나, 현재 설정된 음량 출력 레벨을 그대로 유지한다.
명료도 향상부(407)는 잡음환경 판단부(405)로부터 제1 음성 신호를 수신하면, 수신한 제1 음성 신호에 대하여 자음 성분이 선택적으로 강조되도록 하여 명료도를 향상시키고(S608), 이렇게 음성 명료도가 향상된 제1 음성 신호를 소리 출력부(408)를 통해 외부로 출력한다(S609).
소리 출력부(408)를 통해 음성 명료도가 향상된 제1 음성 신호가 출력됨과 동시에, 출력 표시부(409)는 명료도 향상부(407)의 명료도 향상 동작에 연계하여 소리 출력부(408)를 통해 출력되는 제1 음성 신호에 대한 신호 강도 표시와 함께 명료도 향상이 되었음을 알리는 명료도 향상 표시를 화면상에 표시한다(S610).
이하에서는 도 7을 참조로 하여 본 발명의 제2 실시 예에 따른 수신음 처리방법을 설명한다. 도 7은 본 발명의 제2 실시 예에 따른 음성출력장치에서의 수신음 처리 방법을 보인 순서도이다.
본 발명의 제2 실시 예에 따른 음성출력장치에서의 수신음 처리 방법은 잡음 환경에 무관하게 음성 명료도 향상 동작이 이루어지는 경우에 대한 것이다.
도 7에 도시된 바와 같이, 음성출력장치(400)는 제1 상황에 따라 제1 음성신호가 소리 출력부(408)를 통해 출력되어야 하는 것임을 판단한다(S701).
이때 제1 조건은 수신부(401)를 통해 수신된 음성 신호(제1 음성 신호에 해당됨)이거나, 사용자의 요구에 의해 자체 저장된 음성 파일의 재생이거나, 특정 모드에 의해 마이크(403)를 통해 입력되는 음성 신호(제1 음성 신호에 해당됨)를 소리 출력부(408)를 통해 출력하는 상황 등이다. 그리고 음성 파일을 재생하는 경우에, 음성 파일을 신호 처리한 아날로그 음성 신호가 제1 음성 신호에 해당된다.
제1 상황에 따라 잡음환경 판단부(405)는 제1 음성신호의 세기를 측정하고(S702), 마이크(403)를 통해 수신된 주변 잡음의 세기를 측정한다(S703).
그리고 잡음환경 판단부(405)는 제1 음성신호의 세기와 주변 잡음의 세기를 비교하여(S704), 주변 잡음의 세기가 제1 음성신호의 세기보다 크면 잡음 환경이라고 판단하고, 주변 잡음의 세기가 제1 음성신호의 세기 이하이면 잡음 환경이 아니라고 판단한다(S705).
잡음 환경이 경우에, 잡음환경 판단부(405)는 음량 조절부(406)에게 잡음 환경임을 알리며, 음량 조절부(406)는 잡음 환경에 대응한 설정 음량 출력 레벨을 설정하고, 음성 처리부(404)를 통해 수신되는 제1 음성 신호를 설정 음량 출력 레벨로 증폭하여 명료도 향상부(407)에 제공한다(S706, S707).
여기서, 설정 음량 출력 레벨은 최대 음량 출력 레벨이거나 최대 음량 레벨에 근접한 음량 출력 레벨이다. 물론 현재 설정된 음량 조절부(406)의 음량 출력 레벨이 설정 음량 출력 레벨 이상이면, 음량 조절부(406)는 최대 음량 출력 레벨이 되게 하거나, 현재 설정된 음량 출력 레벨을 그대로 유지한다.
명료도 향상부(407)는 잡음환경 판단부(405)로부터 제1 음성 신호를 수신하면, 수신한 제1 음성 신호에 대하여 자음 성분이 선택적으로 강조되도록 하여 명료도를 향상시키고(S707), 이렇게 음성 명료도가 향상된 제1 음성 신호를 소리 출력부(408)를 통해 외부로 출력한다(S708).
소리 출력부(408)를 통해 음성 명료도가 향상된 제1 음성 신호가 출력됨과 동시에, 출력 표시부(409)는 명료도 향상부(407)의 명료도 향상 동작에 연계하여 소리 출력부(408)를 통해 출력되는 제1 음성 신호에 대한 신호 강도 표시와 함께 명료도 향상이 되었음을 알리는 명료도 향상 표시를 화면상에 표시한다(S709).
그리고 상기 판단 과정(S705)에서 잡음 환경이 아닌 경우에는 수신된 제1 음성 신호에 대한 자동 음량 조절(S706 과정)을 하지 않은 상태로 S707, S708 과정 내지 S709 과정을 수행한다.
한편, 전술한 본 발명의 다른 실시 예에 따르면, 잡음 환경이 아닌 경우에는 수신된 음성 신호에 대한 자동 음량 조절 및 명료도 향상을 하지 않게 할 수 음성출력장치(409)의 동작을 설정할 수 있다. 물론 잡음 환경이 아닌 경우에 수신된 음성 신호에 대한 자동 음량 조절 및 명료도 향상을 하지 않게 설정하더라도, 사용자가 명료도 향상을 지시하는 버튼키 입력을 하는 경우에는 수신된 음성 신호에 대한 명료도 향상을 수행하게 된다.
이상에서 설명한 본 발명의 실시 예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있으며, 이러한 구현은 앞서 설명한 실시예의 기재로부터 본 발명이 속하는 기술분야의 전문가라면 쉽게 구현할 수 있는 것이다.
이상에서 본 발명의 실시 예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.
본 발명의 실시 예에 따르면, 음성출력장치가 자동으로 사용자의 통화 환경을 파악하여 통화 환경에 맞는 수신 음량 조절 및 음성 명료도를 향상시켜 수신음질이 향상된 상태에서 통화를 할 수 있게 하고, 사용자가 통화 중에 음질 향상 요구를 하더라도 사용자의 음질향상 요구에 맞게 명료도 향상 동작을 하여 사용자의 요구에 부응하는 수신 음질이 향상된 소리를 들을 수 있게 한다. 또한 본 발명의 실시 예에 따르면, 수신 음질이 향상되어 출력되는 상태를 음성출력장치의 화면상에 표시하여 사용자가 현재 출력되는 소리가 수신 음질이 향상된 소리임을 알 수 있게 한다.

Claims (13)

  1. 입력 신호에 대해 음성 프레임의 레벨을 검출하는 입력포락선 검출부;
    출력 신호에 대해 음성 프레임의 레벨을 검출하는 출력포락선 검출부;
    상기 입력포락선 검출부로부터 수신된 N번째 음성 프레임의 레벨과 상기 출력포락선 검출부로부터 수신된 (N-1)번째 음성 프레임의 레벨 간의 차이값을 파악하고, 상기 차이값으로 상기 입력 신호의 자음 성분을 증폭시키기 위한 컷오프주파수를 산출하는 컷오프주파수 예측부;
    상기 컷오프주파수 예측부에 의해 산출된 상기 컷오프 주파수에 따라 상기 입력 신호를 필터링하되, 상기 입력 신호의 자음 성분으로 추측되는 부분을 선택적으로 증폭되게 필터링하는 쉘빙 필터부; 및
    상기 입력 신호를 분석하여 음성 신호인지 비음성 신호를 파악하며, 상기 비음성 신호인 경우에 상기 입력 신호를 상기 출력 신호로 바이패스시키고, 상기 음성 신호인 경우에 상기 입력포락선 검출부와 상기 쉘빙 필터부의 입력으로 제공하는 음성 검출기를 포함하는 것을 특징으로 하는 명료도 향상장치.
  2. 제1항에 있어서,
    상기 컷오프주파수 예측부는,
    상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 크면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 낮추는 것을 특징으로 하는 명료도 향상장치.
  3. 제2항에 있어서,
    상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 작으면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 높이는 것을 특징으로 하는 명료도 향상장치.
  4. 외부로부터 제1 음성 신호를 입력하여 증폭하는 마이크;
    상기 제1 음성 신호의 세기를 측정하고 상기 제1 음성 신호의 신호 세기를 기반으로 잡음 환경인지를 판단하는 잡음환경 판단부;
    입력되는 음성 신호를 규정된 형태의 제2 음성 신호로 바꾸어 출력하는 음성 처리부;
    상기 잡음환경 판단부의 판단에 의해 잡음 환경인 경우에 음향 출력 레벨을 설정 레벨로 조절하고, 상기 제2 음성 신호를 상기 조절한 설정 레벨로 증폭하여 출력하는 음량 조절부;
    상기 음량 조절부를 통해 입력되는 제3 음성 신호에 대해 명료도를 향상시켜 제4 음성 신호로 출력하는 명료도 향상부;
    상기 제4 음성 신호 및 상기 음량 조절부에서 출력하는 음성 신호를 외부로 출력하는 소리 출력부; 및
    상기 명료도 향상부의 명료도 향상 동작에 연동하여 상기 소리 출력부에 의해 출력되는 상기 제4 음성 신호가 명료도 향상된 음성 신호임을 나타내는 명료도 표시를 출력하는 출력 표시부를 포함하는 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
  5. 제4항에 있어서,
    상기 명료도 향상부는,
    입력 신호에 대해 음성 프레임의 레벨을 검출하는 입력포락선 검출부,
    출력 신호에 대해 음성 프레임의 레벨을 검출하는 출력포락선 검출부,
    상기 입력포락선 검출부로부터 수신된 N번째 음성 프레임의 레벨과 상기 출력포락선 검출부로부터 수신된 (N-1)번째 음성 프레임의 레벨 간의 차이값을 파악하고, 상기 차이값으로 상기 입력 신호의 자음 성분을 증폭시키기 위한 컷오프주파수를 산출하는 컷오프주파수 예측부,
    상기 컷오프주파수 예측부에 의해 산출된 상기 컷오프 주파수에 따라 상기 입력 신호를 필터링하되, 상기 입력 신호의 자음 성분으로 추측되는 부분을 선택적으로 증폭되게 필터링하는 쉘빙 필터부와,
    상기 입력 신호를 분석하여 음성 신호인지 비음성 신호를 파악하며, 상기 비음성 신호인 경우에 상기 입력 신호를 상기 출력 신호로 바이패스시키고, 상기 음성 신호인 경우에 상기 입력포락선 검출부와 상기 쉘빙 필터부의 입력으로 제공하는 음성 검출기를 포함하는 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
  6. 제5항에 있어서,
    상기 컷오프주파수 예측부는,
    상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 크면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 낮추는 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
  7. 제6항에 있어서,
    상기 컷오프주파수 예측부는,
    상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 작으면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 높이는 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
  8. 제7항에 있어서,
    상기 설정 레벨은 상기 현재 설정된 음향 출력 레벨보다 한 단계 높은 레벨인 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
  9. 제7항에 있어서,
    상기 설정 레벨은 가장 높은 음향 출력 레벨인 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
  10. 제8항 또는 제9항에 있어서,
    상기 음량 조절부는 사용자로부터 특정 음향 출력 레벨로의 설정이 입력되는 경우에, 상기 제2 음성 신호를 상기 특정 음향 출력 레벨로 조절하여 출력하는 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
  11. 제10항에 있어서,
    상기 명료도 표시는 음향 출력 레벨을 나타내는 제1 표시와 차별화된 표시이며, 상기 제1 표시와 함께 화면상에 표시되는 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
  12. 제10항에 있어서,
    상기 명료도 표시는 명료도 향상된 음성 출력이 되고 있음을 알리는 음성 또는 음향 출력인 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
  13. 제10항에 있어서,
    상기 명료도 표시는 명료도 향상된 음성 출력이 되고 있음을 알리는 음성 또는 음향 출력 및 음향 출력 레벨을 나타내는 제1 표시와 차별화되어 화면상에 표시되는 표시인 것을 특징으로 하는 명료도 향상장치를 이용한 음성출력장치.
PCT/KR2010/004078 2009-06-23 2010-06-23 명료도 향상장치와 이를 이용한 음성출력장치 WO2010151048A2 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US13/378,002 US20120116755A1 (en) 2009-06-23 2010-06-23 Apparatus for enhancing intelligibility of speech and voice output apparatus using the same

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2009-0055845 2009-06-23
KR20090055845 2009-06-23
KR1020100059196A KR101068227B1 (ko) 2009-06-23 2010-06-22 명료도 향상장치와 이를 이용한 음성출력장치
KR10-2010-0059196 2010-06-22

Publications (3)

Publication Number Publication Date
WO2010151048A2 true WO2010151048A2 (ko) 2010-12-29
WO2010151048A9 WO2010151048A9 (ko) 2011-04-14
WO2010151048A3 WO2010151048A3 (ko) 2011-05-26

Family

ID=43387046

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2010/004078 WO2010151048A2 (ko) 2009-06-23 2010-06-23 명료도 향상장치와 이를 이용한 음성출력장치

Country Status (1)

Country Link
WO (1) WO2010151048A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110648686A (zh) * 2018-06-27 2020-01-03 塞舌尔商元鼎音讯股份有限公司 调整语音频率的方法及其声音播放装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100474310B1 (ko) * 2002-11-27 2005-03-10 엘지전자 주식회사 휴대폰의 소음 제거 장치
KR20050116294A (ko) * 2004-06-07 2005-12-12 엘지전자 주식회사 휴대단말기의 칙칙 노이즈 제거장치 및 방법
KR100579797B1 (ko) * 2004-05-31 2006-05-12 에스케이 텔레콤주식회사 음성 코드북 구축 시스템 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100474310B1 (ko) * 2002-11-27 2005-03-10 엘지전자 주식회사 휴대폰의 소음 제거 장치
KR100579797B1 (ko) * 2004-05-31 2006-05-12 에스케이 텔레콤주식회사 음성 코드북 구축 시스템 및 방법
KR20050116294A (ko) * 2004-06-07 2005-12-12 엘지전자 주식회사 휴대단말기의 칙칙 노이즈 제거장치 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110648686A (zh) * 2018-06-27 2020-01-03 塞舌尔商元鼎音讯股份有限公司 调整语音频率的方法及其声音播放装置
CN110648686B (zh) * 2018-06-27 2023-06-23 达发科技股份有限公司 调整语音频率的方法及其声音播放装置

Also Published As

Publication number Publication date
WO2010151048A3 (ko) 2011-05-26
WO2010151048A9 (ko) 2011-04-14

Similar Documents

Publication Publication Date Title
KR101068227B1 (ko) 명료도 향상장치와 이를 이용한 음성출력장치
US6639987B2 (en) Communication device with active equalization and method therefor
CN103959813B (zh) 耳孔可佩戴式声音收集设备,信号处理设备和声音收集方法
JP5151762B2 (ja) 音声強調装置、携帯端末、音声強調方法および音声強調プログラム
US20120112930A1 (en) Method and apparatus for controlling a device
CN101783828A (zh) 声音信号调节装置、程序和方法以及电话装置
CN104521247A (zh) 蓝牙耳机助听及抗噪方法和装置
WO2017026568A1 (ko) 음질 개선을 위한 방법 및 헤드셋
CN1682441A (zh) 在音频装置中基于电阻抗的音频补偿及其方法
GB2375935A (en) Speech quality indication
JP2007088521A (ja) イヤホンの音漏れ防止装置、方法、プログラム及び携帯電話無線機
EP4047955A1 (en) A hearing aid comprising a feedback control system
KR101253708B1 (ko) 보청장치의 외부 소음을 차폐하는 방법
JPH09331377A (ja) ノイズキャンセル回路
JPH08163227A (ja) 受話音量自動可変回路
JPH0968997A (ja) 音声処理方法及び装置
WO2010151048A2 (ko) 명료도 향상장치와 이를 이용한 음성출력장치
JP2009505603A (ja) 帰還信号除去機能を備えた補聴器
WO2019098779A1 (ko) 오디오 시스템 및 그 제어 방법
GB2394632A (en) Adjusting audio characteristics of a mobile communications device in accordance with audiometric testing
WO2023085858A1 (ko) 히어 모드 및 뮤직 모드를 제공하는 보청 이어폰의 모드 제공 방법 및 그 시스템
JP2001188599A (ja) オーディオ信号復号装置
JPH07111527A (ja) 音声の加工方法およびそれを用いた装置
JPH09116362A (ja) 自動音量制御装置
JP2002051108A (ja) 電話装置および着信音制御方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10792330

Country of ref document: EP

Kind code of ref document: A2

WWE Wipo information: entry into national phase

Ref document number: 13378002

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1)EPC

122 Ep: pct application non-entry in european phase

Ref document number: 10792330

Country of ref document: EP

Kind code of ref document: A2