JP2020135127A - Electronic apparatus - Google Patents
Electronic apparatus Download PDFInfo
- Publication number
- JP2020135127A JP2020135127A JP2019024654A JP2019024654A JP2020135127A JP 2020135127 A JP2020135127 A JP 2020135127A JP 2019024654 A JP2019024654 A JP 2019024654A JP 2019024654 A JP2019024654 A JP 2019024654A JP 2020135127 A JP2020135127 A JP 2020135127A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- electronic device
- predetermined level
- control unit
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本発明は、音声認識機能を利用する電子機器に関する。 The present invention relates to an electronic device that utilizes a voice recognition function.
音声認識機能を利用する電子機器は、ユーザーの発話を音声認識し、例えば、ユーザーの発話が質問であれば、その質問に対して、回答を行う(例えば、特許文献1参照。)。例えば、ユーザーは、電子機器に対して、「今日の天気は」という質問をし、電子機器は、「今日の天気は晴れです」という回答をする。 An electronic device that uses the voice recognition function recognizes the user's utterance by voice, and if the user's utterance is a question, for example, answers the question (see, for example, Patent Document 1). For example, a user asks an electronic device "what is the weather today" and the electronic device answers "the weather is fine today".
上述したような、音声認識機能を利用する従来の電子機器では、周囲に他の人間が存在すると、発話(入力)内容が、周囲の他の人間に知られてしまう。また、発話(入力)行為そのものが、周囲に雑音を撒き散らすことになる。また、ユーザーによっては、電子機器に対して発話することを恥ずかしく感じる場合もある。このように、音声認識機能を利用する従来の電子機器は、種々の問題がある。 In the conventional electronic device that uses the voice recognition function as described above, if another person exists in the vicinity, the utterance (input) content is known to the other people in the vicinity. In addition, the act of speaking (input) itself scatters noise around. Also, some users may feel embarrassed to speak to an electronic device. As described above, the conventional electronic device using the voice recognition function has various problems.
本発明の目的は、種々の問題を解決する、音声認識機能を利用する電子機器を提供することである。 An object of the present invention is to provide an electronic device that utilizes a voice recognition function to solve various problems.
第1の発明の電子機器は、音声認識の結果に対して音声を出力する電子機器であって、入力される音声のレベルが、所定のレベル以下である場合に、音声認識の結果に対して、音声出力の代わりに、表示を行う制御部を備えることを特徴とする。 The electronic device of the first invention is an electronic device that outputs voice with respect to the result of voice recognition, and when the level of input voice is equal to or lower than a predetermined level, the electronic device with respect to the result of voice recognition , It is characterized in that it is provided with a control unit that performs display instead of audio output.
本発明では、制御部は、入力される音声のレベルが、所定のレベル以下である場合に、音声認識の結果に対して、音声出力の代わりに、表示を行う。これにより、ユーザーは、小さい声で話せばよい。このため、発話(入力)内容を周囲の人間に知られることがない。また、周囲に雑音を撒き散らすこともない。また、ユーザーは、視覚で情報を得ることができる。このように、本発明によれば、種々の問題を解決することができる。 In the present invention, when the input voice level is equal to or lower than a predetermined level, the control unit displays the voice recognition result instead of the voice output. This allows the user to speak in a quiet voice. Therefore, the content of the utterance (input) is not known to the surrounding people. In addition, it does not scatter noise around. In addition, the user can obtain information visually. As described above, according to the present invention, various problems can be solved.
第2の発明の電子機器は、第1の発明の電子機器において、前記制御部は、入力される音声のレベルが、所定のレベル以下である場合に、スピーカー出力をミュートすることを特徴とする。 The electronic device of the second invention is the electronic device of the first invention, wherein the control unit mutes the speaker output when the level of the input voice is equal to or lower than a predetermined level. ..
第3の発明の電子機器は、第1又は第2の発明の電子機器において、前記制御部は、音声認識の結果と、それに対する実行内容と、を表示することを特徴とする。 The electronic device of the third invention is the electronic device of the first or second invention, wherein the control unit displays a result of voice recognition and an execution content thereof.
第4の発明の電子機器は、第1〜第3のいずれかの発明の電子機器において、複数のマイクと、前記複数のマイクのうち、いずれかのマイクが集音した音声を減衰する音量調整部と、をさらに備え、前記音量調整部による減衰量は、前記所定のレベル以下の音声である場合に、音声がクリップしない減衰量であることを特徴とする。 The electronic device of the fourth invention is the electronic device of any one of the first to third inventions, and the volume adjustment for attenuating a plurality of microphones and the sound collected by any of the plurality of microphones. The volume adjusting unit further comprises a unit, and the amount of attenuation by the volume adjusting unit is characterized in that the amount of attenuation that the sound does not clip when the sound is at or below the predetermined level.
第5の発明の電子機器は、第1〜第3のいずれかの発明の電子機器において、音声を集音し、集音した音声を、デジタル音声信号として出力するデジタルマイクと、前記所定のレベルを記憶するメモリと、をさらに備え、前記制御部は、前記メモリに記憶されている前記所定のレベルに基づいて、入力される音声が、前記所定のレベル以下であるか否かを判断することを特徴とする。 The electronic device of the fifth invention is the electronic device of any one of the first to third inventions, which includes a digital microphone that collects sound and outputs the collected sound as a digital voice signal, and the predetermined level. The control unit further includes a memory for storing the above, and the control unit determines whether or not the input voice is equal to or lower than the predetermined level based on the predetermined level stored in the memory. It is characterized by.
本発明によれば、種々の問題を解決することができる。 According to the present invention, various problems can be solved.
以下、本発明の実施形態について説明する。 Hereinafter, embodiments of the present invention will be described.
(第1実施形態)
図1は、第1実施形態に係るスピーカー装置1を示すブロック図である。図1に示すように、スピーカー装置1(電子機器)は、マイクロコンピューター2と、DSP(Digital Signal Processor)3と、D/Aコンバーター(以下、「DAC」という。)4と、アンプ5と、スピーカー6と、第1マイク71〜第nマイク7nと、第1プリアンプ81〜第(n−1)プリアンプ8n−1と、第1A/Dコンバーター(以下、「ADC」という。)91〜第nADC9nと、ボリュームIC10と、表示部11と、を備える。
(First Embodiment)
FIG. 1 is a block diagram showing a
マイクロコンピューター2(制御部)は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、入出力インターフェース等のハードウェアから構成されている。CPUは、ROMに格納されたプログラムに従って、スピーカー装置1を構成する各部を制御する。DSP3は、デジタル音声信号に、各種の信号処理を行う。DAC4は、DSP3から供給されるデジタル音声信号を、アナログ音声信号にD/A変換する。アンプ5は、DAC4から供給されるアナログ音声信号を増幅する。スピーカー6は、アンプ5から供給されるアナログ音声信号に基づいて、音声を出力する。
The microcomputer 2 (control unit) is composed of hardware such as a CPU (Central Processing Unit), a ROM (Read Only Memory), a RAM (Random Access Memory), and an input / output interface. The CPU controls each unit constituting the
第1マイク71〜第nマイク7n(複数のマイク)(マイク7)は、音声を集音する。第1マイク71〜第nマイク7は、アナログマイクである。第1プリアンプ81〜第(n−1)プリアンプ8n−1(プリアンプ8)は、マイクから供給されるアナログ音声信号を増幅する。第1ADC91〜第(n−1)ADC9n−1(ADC9)は、プリアンプから供給されるアナログ音声信号を、デジタル音声信号にD/A変換する。デジタル音声信号は、DSP3に供給される。
The
ボリュームIC10(音量調整部)は、第nマイク7nが集音した音声を減衰する。第nADC9nは、ボリュームIC10から供給されるアナログ音声信号を、デジタル信号にA/D変換する。デジタル音声信号は、DSP3に供給される。表示部11は、音声認識の状況を表示するためのLED、画像等を表示するLCDにより構成される。
The volume IC 10 (volume adjusting unit) attenuates the sound collected by the nth microphone 7n. The nADC9n A / D-converts the analog audio signal supplied from the
第nマイク7nは、ささやき声(所定のレベル以下の音声)認識用のマイクである。ここで、ボリュームICによる音声の減衰量は、第nマイク7nが集音した音声が、所定のレベル以下である場合に、クリップしない減衰量である。従って、第nマイク7nが集音した音声が、所定のレベル以下であれば、クリップせず、音声認識可能である。一方で、第nマイク7nが集音した音声が、所定のレベルよりも大きければ(例えば、普段の音声レベル)、クリップし、音声認識することができない。ささやき声のレベルであれば、ボリュームIC10からの出力は、正常な値となり、第nマイク7nが集音した音声により、音声認識が可能となる。ユーザーは、ボリュームIC10による減衰量を設定することができる。このため、ユーザーは、所望の音声レベルのささやき声が認識されるように、設定することができる。
The nth microphone 7n is a microphone for recognizing whispering voice (voice below a predetermined level). Here, the amount of sound attenuation by the volume IC is an amount of attenuation that does not clip when the sound collected by the nth microphone 7n is equal to or lower than a predetermined level. Therefore, if the sound collected by the nth microphone 7n is at a predetermined level or less, the sound can be recognized without clipping. On the other hand, if the voice collected by the nth microphone 7n is louder than a predetermined level (for example, a normal voice level), it cannot be clipped and the voice cannot be recognized. At the level of whispering, the output from the
通常、マイクロコンピューター2は、マイク7が集音した音声を、サーバーに送信し、サーバーから送信された質問に対する回答等を、スピーカー6に出力する。従って、スピーカー装置1は、音声認識の結果に対して音声を出力する。一方、マイクロコンピューター2は、第nマイク7nから入力される音声のレベルが、所定のレベル以下である場合、音声がクリップしていないことから、サーバーで音声認識可能であり、音声認識の結果に対して、音声出力の代わりに、表示部11のLCDに表示を行う。例えば、音声認識の結果が、「今日の天気は」(命令文)であり、それに対する実行内容が、「今日の天気は晴れです」(実行文)であった場合、マイクロコンピューター2は、これらをLCDに表示する。このとき、マイクロコンピューター2は、DAC4やアンプ5を制御し、スピーカー出力をミュートする。
Normally, the
以下、音声認識時のスピーカー装置101の処理動作を、図2に示すフローチャートに基づいて説明する。マイクロコンピューター2は、音声を受信すると(S1)、音声を認識できたか否かを判断する(S2)。マイクロコンピューター2は、音声認識できなかったと判断した場合(S2:No)、LEDにより、音声を受信できなかった旨を通知する(S3)。マイクロコンピューター2は、音声を認識できたと判断した場合(S2:Yes)、LEDにより、受信状況(受信できた旨)をユーザーにフィードバックする(S4)。次に、マイクロコンピューター2は、サーバーに受信した音声を送信する(S5)。次に、マイクロコンピューター2は、サーバーからの応答結果を受信する(S6)。
Hereinafter, the processing operation of the
次に、マイクロコンピューター2は、受話音量が40dB以下であるか否かを判断する(S7)。マイクロコンピューター2は、受話音量が40dB以下であると判断した場合(S7:Yes)、話者位置が2m以内であるか否かを判断する(S8)。ここで、スピーカー装置1は、マイク7を複数備えているため、話者の位置をある程度特定可能である。マイクロコンピューター102は、話者位置が2m以内でないと判断した場合(S8:No)、主要フォルマントの落ち込みが少ないか否かを判断する(S9)。マイクロコンピューター102は、受話音量が40dB以下でないと判断した場合(S7:No)、主要フォルマントの落ち込みが少なくないと判断した場合(S9:No)、応答結果を音声で返答する(S10)。マイクロコンピューター102は、話者位置が2m以内であると判断した場合(S8:Yes)、主要フォルマントの落ち込みが少ないと判断した場合(S9:Yes)、応答結果を画面に表示する(S11)。
Next, the
S9において、マイクロコンピューター2は、主要フォルマントの落ち込みが少ないと判断した場合(S9:Yes)、ささやき声であるため、応答結果を画面に表示し(S11)、主要フォルマントの落ち込みが少なくないと判断した場合(S9:No)、ささやき声でないため、応答結果を音声で返答する(S10)。このように、ささやき声が持つ通常の会話との音響特性の違いから、画面表示と音声とによる返答が、切り分けられている。
In S9, when the
以上説明したように、本実施形態では、マイクロコンピューター2は、入力される音声のレベルが、所定のレベル以下である場合に、音声認識の結果に対して、音声出力の代わりに、表示を行う。これにより、ユーザーは、小さい声で話せばよい。このため、発話(入力)内容を周囲の人間に知られることがない。また、周囲に雑音を撒き散らすこともない。また、ユーザーは、視覚で情報を得ることができる。このように、本実施形態によれば、種々の問題を解決することができる。
As described above, in the present embodiment, when the input voice level is equal to or lower than a predetermined level, the
(第2実施形態)
図3は、第2実施形態に係るスピーカー装置101を示すブロック図である。図3に示すように、スピーカー装置101(電子機器)は、マイクロコンピューター102と、DSP103と、DAC104と、アンプ105と、スピーカー106と、マイク107と、メモリ108と、表示部109と、を備える。第2実施形態に係るスピーカー装置101は、第1実施形態に係るスピーカー装置1と比べて、デジタルマイクであるマイク107が1つである点、プリアンプ、ADC、ボリュームICを備えていない点、メモリ108を備えている点が異なる。マイクロコンピューター102、DSP103、DAC104、アンプ105、スピーカー106、及び、表示部109は、それぞれ、マイクロコンピューター2、DSP3、DAC4、アンプ5、スピーカー6、及び、表示部11と同様の構成である。
(Second Embodiment)
FIG. 3 is a block diagram showing the
マイク107は、上述のように、デジタルマイクである。マイク107は、音声を集音し、集音した音声を、デジタル音声信号として出力する。デジタル音声信号は、DSP103に供給される。メモリ108は、例えば、フラッシュメモリである。メモリ108は、ささやき声を判定するための、所定のレベルを記憶している。マイクロコンピューター102は、マイク107が集音した音声が、メモリ108に記憶されている所定のレベル以下あるか否かを判断する。マイクロコンピューター102は、マイク107が集音した音声が、メモリ108に記憶されている所定のレベル以下であると判断した場合、音声認識の結果に対して、音声出力の代わりに、表示部11のLCDに表示を行う。
The
以上、本発明の実施形態について説明したが、本発明を適用可能な形態は、上述の実施形態には限られるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更を加えることが可能である。 Although the embodiments of the present invention have been described above, the embodiments to which the present invention can be applied are not limited to the above-described embodiments, and modifications can be made as appropriate without departing from the spirit of the present invention. is there.
本発明は、音声認識機能を利用する電子機器に好適に採用され得る。 The present invention can be suitably adopted in an electronic device that utilizes a voice recognition function.
1、101 スピーカー装置(電子機器)
2、102 マイクロコンピューター(制御部)
3、103 DSP
4、104 DAC
5、105 アンプ
6、106 スピーカー
7、107 マイク
8 プリアンプ
9 ADC
10 ボリュームIC(音量調整部)
11、109 表示部
108 メモリ
1,101 Speaker device (electronic device)
2,102 Microcomputer (control unit)
3,103 DSP
4,104 DAC
5, 105
10 Volume IC (volume control unit)
11, 109
Claims (5)
入力される音声のレベルが、所定のレベル以下である場合に、音声認識の結果に対して、音声出力の代わりに、表示を行う制御部を備えることを特徴とする電子機器。 An electronic device that outputs voice to the result of voice recognition.
An electronic device including a control unit that displays a voice recognition result instead of voice output when the input voice level is equal to or lower than a predetermined level.
前記複数のマイクのうち、いずれかのマイクが集音した音声を減衰する音量調整部と、 をさらに備え、
前記音量調整部による減衰量は、前記所定のレベル以下の音声である場合に、音声がクリップしない減衰量であることを特徴とする請求項1〜3のいずれか1項に記載の電子機器。 With multiple microphones
A volume control unit that attenuates the sound collected by any of the plurality of microphones is further provided.
The electronic device according to any one of claims 1 to 3, wherein the amount of attenuation by the volume adjusting unit is an amount of attenuation at which the sound is not clipped when the sound is at or below the predetermined level.
前記所定のレベルを記憶するメモリと、をさらに備え、
前記制御部は、前記メモリに記憶されている前記所定のレベルに基づいて、入力される音声が、前記所定のレベル以下であるか否かを判断することを特徴とする請求項1〜3のいずれか1項に記載の電子機器。 A digital microphone that collects sound and outputs the collected sound as a digital audio signal,
A memory for storing the predetermined level is further provided.
The control unit according to claim 1 to 3, wherein the control unit determines whether or not the input voice is equal to or lower than the predetermined level based on the predetermined level stored in the memory. The electronic device according to any one item.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019024654A JP2020135127A (en) | 2019-02-14 | 2019-02-14 | Electronic apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019024654A JP2020135127A (en) | 2019-02-14 | 2019-02-14 | Electronic apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020135127A true JP2020135127A (en) | 2020-08-31 |
Family
ID=72263152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019024654A Pending JP2020135127A (en) | 2019-02-14 | 2019-02-14 | Electronic apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020135127A (en) |
-
2019
- 2019-02-14 JP JP2019024654A patent/JP2020135127A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102487957B1 (en) | Personalized, real-time audio processing | |
CN110870201B (en) | Audio signal adjusting method, device, storage medium and terminal | |
US7706551B2 (en) | Dynamic volume control | |
US6988068B2 (en) | Compensating for ambient noise levels in text-to-speech applications | |
WO2015090163A1 (en) | Method and device for controlling output volume of audio in playing device | |
US9560316B1 (en) | Indicating sound quality during a conference | |
US20060085183A1 (en) | System and method for increasing recognition accuracy and modifying the behavior of a device in response to the detection of different levels of speech | |
JP6548045B2 (en) | Conference system, conference system control method, and program | |
CN110459212A (en) | Method for controlling volume and equipment | |
JP6648805B2 (en) | Voice control method, voice control device, and program | |
JP2006215206A (en) | Speech processor and control method therefor | |
EP3070709A1 (en) | Sound masking apparatus and sound masking method | |
Tomassi et al. | Effects of sidetone amplification on vocal function during telecommunication | |
JP2020135127A (en) | Electronic apparatus | |
WO2024001463A1 (en) | Audio signal processing method and apparatus, and electronic device, computer-readable storage medium and computer program product | |
JP2023501536A (en) | Control method and system for artificial intelligence type multimedia device | |
US20070116296A1 (en) | Audio processing system and method for hearing protection in an ambient environment | |
JP2008040431A (en) | Voice or speech machining device | |
JP2000511367A (en) | Hearing aid with improved percentile predictor | |
JP2018081147A (en) | Communication device, server, control method and information processing program | |
CN113223519B (en) | Far-field volume control method, device, storage medium and computer program product | |
KR20220107052A (en) | Listening device, how to adjust the listening device | |
CN111951801A (en) | Volume adjusting method and device based on voice control | |
JP5054477B2 (en) | Hearing aid | |
KR102350890B1 (en) | Portable hearing test device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20210928 |