JP2008152195A - 音声処理回路、発話システムおよび音声出力方法、電子機器 - Google Patents

音声処理回路、発話システムおよび音声出力方法、電子機器 Download PDF

Info

Publication number
JP2008152195A
JP2008152195A JP2006342665A JP2006342665A JP2008152195A JP 2008152195 A JP2008152195 A JP 2008152195A JP 2006342665 A JP2006342665 A JP 2006342665A JP 2006342665 A JP2006342665 A JP 2006342665A JP 2008152195 A JP2008152195 A JP 2008152195A
Authority
JP
Japan
Prior art keywords
audio
level
sound
audio signal
processing circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006342665A
Other languages
English (en)
Inventor
Koichi Kato
浩一 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rohm Co Ltd
Original Assignee
Rohm Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rohm Co Ltd filed Critical Rohm Co Ltd
Priority to JP2006342665A priority Critical patent/JP2008152195A/ja
Publication of JP2008152195A publication Critical patent/JP2008152195A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】複数の電子機器が同時発話すると、音声が聞き取りにくくなる。
【解決手段】音声処理回路100は、スピーカ120から出力すべき音声信号S1を生成する。音声レベル判定部10は、本回路に接続されるマイク140により検出された周囲環境音のレベルを判定する。音声生成部40は、音声信号S6を生成する。制御部30は、音声レベル判定部10により判定された周囲環境音のレベルが、所定のしきい値より高いとき、音声信号S6の再生を遅延させる。制御部30は、音声レベル判定部10により判定された周囲環境音のレベルに応じて、しきい値を適応的に変化させてもよい。
【選択図】図1

Description

本発明は、音声信号によりユーザに情報を伝達する技術に関する。
近年、民生機器を中心に音声発話を行う電子機器が増加している。こうした状況において、近接した位置に発話機能を有する複数の電子機器が配置される状況が発生しうる。
特開平5−30588号公報
こうした状況において、複数の電子機器が同時発話すると、音声が聞き取りにくくなるという問題がある。
本発明はこうした課題に鑑みてなされたものであり、その包括的な目的は、ユーザが聞き取り易い音声発話技術の提供にある。
本発明のある態様は、音声出力部から出力すべき音声信号を生成する音声処理回路に関する。この音声処理回路は、本回路に接続されるマイクにより検出された周囲環境音のレベルを判定する音声レベル判定部と、音声信号を生成する音声生成部と、音声生成部による音声信号の再生を制御する制御部と、を備える。制御部は、音声レベル判定部により判定された周囲環境音のレベルが、所定のしきい値より高いとき、音声信号の再生を遅延させる。
この態様によると、周囲環境音が大きくなると、音声出力のタイミングが遅延されるため、ユーザに通知すべきメッセージが周囲環境音に埋もれるのを防止することができ、ユーザに対して、より確実に音声を通知することができる。
制御部は、音声レベル判定部により判定された周囲環境音のレベルに応じて、しきい値を適応的に変化させてもよい。
定常的な周囲環境音のフロアレベルあるいは平均値を検出し、その値より高いしきい値を設定することにより、定常的な周囲環境音によって音声出力のタイミングが遅延するのを防止することができる。
音声レベル判定部は、定期的に周囲環境音のレベルを測定し、測定された値にもとづき、しきい値を更新してもよい。
この処理は、周囲環境音のフロアレベルが、時間とともに変化する場合に有効である。
制御部は、音声レベル判定部により判定された周囲環境音のレベルに応じて、音声信号の再生音量を変化させてもよい。
この場合、ユーザはより明瞭に、音声信号を聞き取ることができる。
制御部は、周囲環境音のレベルがしきい値より低くなるのを待って、音声信号を再生してもよい。
制御部は、所定の時間が経過すると、周囲環境音のレベルに関わらず、音声信号を再生してもよい。
この処理により、周囲環境音が高いレベルを長い間維持する場合に、音声信号が再生されない状況を防止することができる。
再生すべき音声信号の内容に応じて、異なる遅延処理を実行してもよい。
再生すべき音声信号ごとに優先度を定めておき、優先度に応じて異なる遅延処理を実行してもよい。
音声処理回路は、一つの半導体基板上に一体集積化されてもよい。「一体集積化」とは、回路の構成要素のすべてが半導体基板上に形成される場合や、回路の主要構成要素が一体集積化される場合が含まれ、回路定数の調節用に一部の抵抗やキャパシタなどが半導体基板の外部に設けられていてもよい。回路を1つのICとして集積化することにより、その面積を削減することができる。
本発明の別の態様は、電子機器である。この電子機器は、周囲環境音を検出するマイクと、マイクにより検出された周囲環境音のレベルにもとづき、音声を生成する上述の音声処理回路と、音声処理回路により生成された音声信号を出力するスピーカと、を備える。
本発明のさらに別の態様は、音声信号を出力する発話システムに関する。この発話システムは、スピーカと、周囲環境音を検出するマイクと、マイクにより検出された周囲環境音のレベルを判定する音声レベル判定部と、スピーカから出力すべき音声信号を生成する音声生成部と、音声生成部による音声信号の再生を制御する制御部と、を備える。制御部は、音声レベル判定部により判定された周囲環境音のレベルが、所定のしきい値より高いとき、音声信号の再生を遅延させる。
本発明のさらに別の態様は、音声出力方法である。この音声出力方法は、マイクを利用して周囲環境音を検出するステップと、検出された周囲環境音のレベルを判定するステップと、スピーカから出力すべき音声信号を生成するステップと、検出された周囲環境音のレベルが、所定のしきい値より高いとき、音声信号の再生を遅延させるステップと、を備える。
なお、以上の構成要素の任意の組合せ、本発明の表現を、方法、装置などの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、ユーザに対して音声をより確実に通知することができる。
以下、本発明を好適な実施の形態をもとに図面を参照しながら説明する。各図面に示される同一または同等の構成要素、部材、処理には、同一の符号を付するものとし、適宜重複した説明は省略する。また、実施の形態は、発明を限定するものではなく例示であって、実施の形態に記述されるすべての特徴やその組み合わせは、必ずしも発明の本質的なものであるとは限らない。
図1は、本発明の実施の形態に係る音声処理回路100を搭載した音声発話システム200の構成を示すブロック図である。音声発話システム200は、テレビ受像器、冷蔵庫や電子レンジなどの家電製品、時報機能を備える時計、パーソナルコンピュータやカーナビゲーションシステムなど、音声によってユーザに情報を通知する機能を備えた電子機器に搭載される。なお、「音声」とは特定の言語による発話に限定されず音楽なども含み、広くは聴覚によりユーザに情報を伝達可能な音をいう。
音声発話システム200は、音声処理回路100、増幅部110、スピーカ120、ホストプロセッサ130、マイク140を備える。ホストプロセッサ130は、電子機器全体を統合的に制御する。スピーカ120は、電気信号を音響波に変換し出力する音声出力部である。音声処理回路100は、ホストプロセッサ130からの制御信号S2を受ける。音声処理回路100は制御信号S2にもとづきスピーカ120から出力すべき音声信号S1を生成し、後段の増幅部110へと出力する。音声信号S1は、増幅部110によって増幅されスピーカ120に入力される。なお、増幅部110は、アナログアンプ、デジタルアンプのいずれで構成してもよい。
音声処理回路100は、音声レベル判定部10、制御部30、音声生成部40、D/A変換部50を備え、一つの半導体基板上に機能ICとして集積化される。
音声処理回路100には、マイク140が接続される。マイク140は、音声発話システム200が搭載される電子機器の周囲環境音(以下、単に環境音ともいう)を検出する。マイク140により検出された音声信号S3は、音声処理回路100の音声レベル判定部10へと入力される。
音声レベル判定部10は、音声処理回路100に接続されるマイク140により検出された環境音のレベルを判定する。音声レベル判定部10は、入力部12、A/D変換部14を含む。入力部12は、音声信号S3を受け、これを増幅してA/D変換部14へと出力する。A/D変換部14は、入力部12から出力される音声信号S3をA/D変換し、音声レベルを示すデジタル値(以下、音声レベル信号S4という)を出力する。
音声生成部40は、制御部30からの制御信号S5にもとづき、再生すべき音声信号S6を生成する。音声生成部40は、デコーダ42、ROM44を含む。ROM44には、音声信号S6を生成するためのデータが格納される。データの形式は、MP3(MPEG-Audio Layer-3)などの圧縮形式であってもよいし、WAVE形式のデータであってもよい。デコーダ42は、ROM44から必要なデータを取得してデコードし、合成する。デコードされた音声信号S6は、D/A変換部50へと出力される。D/A変換部50は、音声信号S6をデジタルアナログ変換する。なお、増幅部110がデジタルアンプである場合、D/A変換部50によるD/A変換処理は不要となる。
制御部30は、音声生成部40による音声信号S6の再生を制御する。制御部30には、ホストプロセッサ130からの制御信号S2に加えて、音声レベル判定部10により検出された音声レベル信号S4が入力されている。
制御部30は、原則的に制御信号S2により指定されたタイミングで音声信号を生成し、再生する。しかし、環境音が大きいときに音声信号を再生しても、ユーザがこれを聞き逃すおそれがある。そこで、制御部30は、音声レベル判定部10により判定された環境音レベルが、所定のしきい値レベルより高いとき、音声信号の再生を遅延させる。
つぎにしきい値レベルの設定方法について説明する。制御部30は、音声レベル判定部10により判定された環境音レベルに応じて、しきい値レベルを適応的に変化させる。音声レベル判定部10は、数分ごと、数時間ごと、数日ごとなど、所定の期間おきに定期的に周囲環境音レベルを判定してもよい。
しきい値レベルの設定は、以下のように行ってもよい。制御部30は、ある期間にわたって、音声レベル判定部10により取得された環境音レベルを平均し、平均環境音レベルを取得する。そしてこの平均環境音レベルに、所定のマージンを付加したレベルを、しきい値レベルに設定してもよい。この処理によって、静かな環境ではしきい値レベルが低く設定され、騒がしい環境ではしきい値レベルが高くなる。この処理によって、定常的な環境音によって音声発話システム200による発話が遅延されるのを防止できる。
制御部30は、制御信号S4により指定されたタイミングにおいて、環境音レベルがしきい値レベルより高い場合、音声生成部40に音声の再生をさせずに所定の待機時間Twの間、待機させる。そして待機時間Twが経過した後、ふたたび環境音レベルをチェックし、しきい値レベルと比較する。このときに環境音レベルの方が高ければ、再び音声生成部40の音声再生を待機させる。この処理を実行することにより、音声信号は環境音レベルがしきい値レベルより低くなった後に出力される。
なお、環境音レベルがしきい値レベルを上回った状態が長時間持続すると、音声が再生されなくなってしまう。そこで、待機時間Twの上限を設け、上限を超えると環境音レベルにかかわらず、強制的に音声を再生させるタイムアウト処理を行ってもよい。
さらに、制御部30は、音声レベル信号S4、すなわち環境音レベルにもとづいて、音声生成部40により生成される音声信号S6の音量を制御してもよい。すなわち、環境音レベルが高い場合、ボリウムを大きくし、環境音レベルが低い場合、ボリウムを小さくしてもよい。この処理によれば、ユーザに対して、音声発話システム200により再生される音声をより明瞭に伝達することができる。
制御部30は、再生すべき音声信号の内容に応じて、異なる遅延処理を実行してもよい。音声信号には、即時的な性質が要求されたり、あるいは緊急性が要求されるものが存在する。前者としては時報などが例示され、後者としては、ガス漏れ放置や火災報知などが例示される。こうした音声信号を、その他の音声信号と同様に遅延させると、音声による通知の意味をなさなくなる。そこで、音声信号の内容によって処理を分類してもよい。たとえば、あるグループに分類された音声信号については、環境音レベルによらず、遅延させず、あるいはタイムアウト時間(遅延時間の上限)を短く設定する。また、別のグループに分類された音声信号については、タイムアウト時間を長く設定したり、タイムアウト時間を設けないという処理も可能である。
さらに、音声信号の種類、性質に応じて、異なるしきい値レベルや、ボリウム値を設定してもよい。この処理によれば、音声信号ごとに最適な再生処理が可能となる。
また、音声信号ごとに優先度を定めておき、優先度に応じて異なる遅延処理を実行してもよい。たとえば、ホストプロセッサ130から、ほぼ同一のタイミングにおいて、2つ音声信号の出力が指示される場合が想定される。このとき、音声信号ごとに優先度を定めておき、この優先度にしたがって再生の順番を入れ替えたりしてもよい。この処理は、音声信号ごとに異なる遅延処理を行う場合に、特に有効である。
以上のように構成された音声発話システム200の動作について説明する。
図2(a)、(b)は、音声発話システム200の周囲環境音と発話タイミングの関係を示すタイムチャートである。図2(a)は、環境音のレベルが低いとき、図2(b)は、環境音のレベルが高い場合を示す。同図において、Lthはしきい値レベルを、S4は環境音レベルを、S2は再生タイミングを指示する制御信号を、S6は再生される音声波形を示す。同図の縦軸および横軸は、理解を容易とするために適宜拡大、縮小したものであり、また示される各波形も、理解の容易のために簡略化されている。
はじめに、図2(a)を参照し、環境音レベルが低い場合の動作について説明する。時刻t0以前、環境音レベルS4は、定常的なレベルに保たれている。しきい値レベルLthは、ある時刻またはある期間にわたる平均環境音レベルS4にマージンΔを加算した値に設定されている。
ホストプロセッサ130から制御部30に対して、再生すべき音声および、再生タイミングを指示する制御信号S2が出力される。図2(a)の例では、再生すべきタイミングは時刻t0であるが、制御信号S2が入力されるタイミングと、再生タイミングは一致しなくてもよい。時刻t0において、音声レベル判定部10により検出される環境音レベルS4は、しきい値レベルLthより低い。したがって、制御部30は、ただちに、再生すべき音声波形を生成しこれを出力する。その結果、スピーカ120からは制御部30により指示されたタイミングで、音声が出力される。
次に、図2(b)を参照し、環境音レベルが高い場合の動作について説明する。時刻t0以前、周囲環境音レベルS4は、定常的なレベルに保たれている。しきい値レベルLthが、環境音レベルS4にマージンΔを加算した値に設定されている点は図2(a)と同様である。
ホストプロセッサ130から制御部30に対して、再生すべき音声および、再生タイミングを指示する制御信号S2が出力される。時刻t0において、音声発話システム200が搭載される電子機器の以外の機器が音声を出力していたり、あるいは電子機器の周辺で人間が会話していた場合、音声レベル判定部10により検出される環境音レベルS4は、しきい値レベルLthより高くなる。したがって、制御部30は、待機時間Twの間、音声信号を再生せずに待機する。
待機時間Tw経過後の時刻t1に、制御部30は再び環境音レベルS4をしきい値レベルLthと比較する。外部機器の発話は停止していれば、環境音レベルS4の方が低くなるため、制御部30は、音声生成部40に直ちに音声信号を再生させる。
このように、本実施の形態に係る音声発話システム200によれば、外部機器による発話や周囲の人間による発声の最中に、音声信号を出力することによる音声の衝突を防止し、ユーザに必要な情報を確実に伝達することができる。
この実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
音声レベル判定部10は、マイク140により検出された環境音のうち、所定の周波数帯域の成分を抽出して、環境音レベルを判定してもよい。所定の周波数帯域は、音声発話システム200により再生される音声信号の帯域付近に設定するのが好ましい。具体的には、A/D変換部14の前段または後段にフィルタを設ければよい。人間の耳には、近い周波数の複数の音声が同時に入力されると区別が困難となるが、周波数が離れていれば、同時に発話されても認識が容易となる。この処理を行えば、再生する音声信号の周波数に近い環境音が発声しているときに、遅延させることができる。
実施の形態では、機能ICである音声処理回路100によって、音声信号の再生、出力タイミングの制御を行う場合について説明したが、本発明はこれに限定されるものではない。すなわち、パーソナルコンピュータなどのソフトウェアにより動作を制御可能な機器においては、CPU(Central Processing Unit)や汎用DSP(Digital Signal Processor)によって、図1の音声発話システム200の諸機能を実行させてもよい。
実施の形態にもとづき、本発明を説明したが、実施の形態は、本発明の原理、応用を示しているにすぎず、実施の形態には、請求の範囲に規定された本発明の思想を離脱しない範囲において、多くの変形例や配置の変更が可能である。
本発明の実施の形態に係る音声処理回路を搭載した音声発話システムの構成を示すブロック図である。 図2(a)、(b)は、音声発話システムの周囲環境音と発話タイミングの関係を示すタイムチャートである。
符号の説明
10 音声レベル判定部、 12 入力部、 14 A/D変換部、 30 制御部、 40 音声生成部、 42 デコーダ、 44 ROM、 50 D/A変換部、 100 音声処理回路、 110 増幅部、 120 スピーカ、 130 ホストプロセッサ、 140 マイク、 200 音声発話システム。

Claims (12)

  1. 音声出力部から出力すべき音声信号を生成する音声処理回路であって、
    本回路に接続されるマイクにより検出された周囲環境音のレベルを判定する音声レベル判定部と、
    前記音声信号を生成する音声生成部と、
    前記音声生成部による前記音声信号の再生を制御する制御部と、
    を備え、
    前記制御部は、前記音声レベル判定部により判定された周囲環境音のレベルが、所定のしきい値より高いとき、前記音声信号の再生を遅延させることを特徴とする音声処理回路。
  2. 前記制御部は、前記音声レベル判定部により判定された周囲環境音のレベルに応じて、前記しきい値を適応的に変化させることを特徴とする請求項1に記載の音声処理回路。
  3. 前記音声レベル判定部は、定期的に周囲環境音のレベルを測定し、測定された値にもとづき、前記しきい値を更新することを特徴とする請求項2に記載の音声処理回路。
  4. 前記制御部は、前記音声レベル判定部により判定された周囲環境音のレベルに応じて、前記音声信号の再生音量を変化させることを特徴とする請求項1に記載の音声処理回路。
  5. 前記制御部は、前記周囲環境音のレベルが前記しきい値より低くなるのを待って、前記音声信号を再生することを特徴とする請求項1に記載の音声処理回路。
  6. 前記制御部は、所定の時間が経過すると、周囲環境音のレベルに関わらず、前記音声信号を再生することを特徴とする請求項1に記載の音声処理回路。
  7. 再生すべき音声信号の内容に応じて、異なる遅延処理を実行することを特徴とする請求項1から6のいずれかに記載の音声処理回路。
  8. 再生すべき音声信号ごとに優先度を定めておき、優先度に応じて異なる遅延処理を実行することを特徴とする請求項1から6のいずれかに記載の音声処理回路。
  9. 一つの半導体基板上に一体集積化されたことを特徴とする請求項1から6のいずれかに記載の音声処理回路。
  10. 周囲環境音を検出するマイクと、
    前記マイクにより検出された周囲環境音のレベルにもとづき、音声を生成する請求項1から6のいずれかに記載の音声処理回路と、
    前記音声処理回路により生成された音声信号を出力するスピーカと、
    を備えることを特徴とする電子機器。
  11. 音声信号を出力する発話システムであって、
    スピーカと、
    周囲環境音を検出するマイクと、
    前記マイクにより検出された周囲環境音のレベルを判定する音声レベル判定部と、
    前記スピーカから出力すべき音声信号を生成する音声生成部と、
    前記音声生成部による前記音声信号の再生を制御する制御部と、
    を備え、
    前記制御部は、前記音声レベル判定部により判定された周囲環境音のレベルが、所定のしきい値より高いとき、前記音声信号の再生を遅延させることを特徴とする発話システム。
  12. マイクを利用して周囲環境音を検出するステップと、
    前記検出された周囲環境音のレベルを判定するステップと、
    スピーカから出力すべき音声信号を生成するステップと、
    検出された周囲環境音のレベルが、所定のしきい値より高いとき、前記音声信号の再生を遅延させるステップと、
    を備えることを特徴とする音声出力方法。
JP2006342665A 2006-12-20 2006-12-20 音声処理回路、発話システムおよび音声出力方法、電子機器 Pending JP2008152195A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006342665A JP2008152195A (ja) 2006-12-20 2006-12-20 音声処理回路、発話システムおよび音声出力方法、電子機器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006342665A JP2008152195A (ja) 2006-12-20 2006-12-20 音声処理回路、発話システムおよび音声出力方法、電子機器

Publications (1)

Publication Number Publication Date
JP2008152195A true JP2008152195A (ja) 2008-07-03

Family

ID=39654383

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006342665A Pending JP2008152195A (ja) 2006-12-20 2006-12-20 音声処理回路、発話システムおよび音声出力方法、電子機器

Country Status (1)

Country Link
JP (1) JP2008152195A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010189100A (ja) * 2009-02-17 2010-09-02 Hitachi Ltd 異常診断装置および異常診断方法
JP2014197207A (ja) * 2014-05-21 2014-10-16 日本電信電話株式会社 ディスプレイ装置、情報提示方法、および情報提示プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010189100A (ja) * 2009-02-17 2010-09-02 Hitachi Ltd 異常診断装置および異常診断方法
JP2014197207A (ja) * 2014-05-21 2014-10-16 日本電信電話株式会社 ディスプレイ装置、情報提示方法、および情報提示プログラム

Similar Documents

Publication Publication Date Title
US8972251B2 (en) Generating a masking signal on an electronic device
CN101903942B (zh) 具有基于噪声水平的增益控制的噪声消除系统
US10129624B2 (en) Method and device for voice operated control
JP4697267B2 (ja) ハウリング検出装置およびハウリング検出方法
US20130156212A1 (en) Method and arrangement for noise reduction
US7756280B2 (en) Audio processing system and method for automatically adjusting volume
US10510361B2 (en) Audio processing apparatus that outputs, among sounds surrounding user, sound to be provided to user
JP2008099163A (ja) ノイズキャンセルヘッドフォンおよびヘッドフォンにおけるノイズキャンセル方法
US10856064B2 (en) Operation of a personal audio device during insertion detection
US20220122605A1 (en) Method and device for voice operated control
JP6268033B2 (ja) 携帯端末
US9813809B1 (en) Mobile device and method for operating the same
KR20070070218A (ko) 사람을 모니터링하는 시스템
US8954322B2 (en) Acoustic shock protection device and method thereof
KR102493866B1 (ko) 디지털 마이크로폰을 가진 오디오 시스템
WO2012098856A1 (ja) 補聴器、及び、補聴器の制御方法
JP2008152195A (ja) 音声処理回路、発話システムおよび音声出力方法、電子機器
JP2006333396A (ja) 音声信号拡声装置
JP2008219713A (ja) ノイズキャンセルヘッドホン
US20070078545A1 (en) Sound output system and method
WO2016121234A1 (ja) 音声による自動送受切り替え方法及び装置
US20070076895A1 (en) Audio processing system and method for hearing protection
JP2010178224A (ja) 補聴装置
US20190355341A1 (en) Methods and apparatus for playback of captured ambient sounds
CN116709147A (zh) 语意评估的助听调整装置及其方法