JP2021129256A - ハンズフリー制御装置およびプログラム - Google Patents
ハンズフリー制御装置およびプログラム Download PDFInfo
- Publication number
- JP2021129256A JP2021129256A JP2020023993A JP2020023993A JP2021129256A JP 2021129256 A JP2021129256 A JP 2021129256A JP 2020023993 A JP2020023993 A JP 2020023993A JP 2020023993 A JP2020023993 A JP 2020023993A JP 2021129256 A JP2021129256 A JP 2021129256A
- Authority
- JP
- Japan
- Prior art keywords
- end speaker
- hands
- far
- voice information
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】通話相手の通話状況に応じて、より最適な通話音声に調整することができる。【解決手段】 遠端話者の音声情報を取得する通信部と、ハンズフリー通話時に表れる特有の特徴を解析対象とし、前記音声情報を用いて前記解析対象を解析する解析部と、前記遠端話者がハンズフリー通話を利用していることを前記解析結果が示す場合、前記遠端話者の音声情報を近端話者が聞き取りやすくなる音声調整のためのパラメータを設定するパラメータ設定部と、設定された前記パラメータに基づいて、前記遠端話者の音声情報を調整する音声調整部と、を備える。【選択図】図1
Description
本発明は、ハンズフリー制御装置およびプログラムに関する。
特許文献1には、ハンズフリー装置に関し、「ハンズフリー装置は、移動電話機本体と、マイク用のTxアッテネータ、スピーカ用のRxアッテネータ、TxアッテネータとRxアッテネータの減衰量を選定し、設定するアッテネータ制御部からなる。さらにアッテネータ制御部に接続する減衰量記憶部と相手側の電話機の種類を判別する相手側電話判別部を備えている。また、ハンズフリー装置は、ナビゲーション・システムに接続し、GPS装置からなる現在位置検出部からの現在位置データを、アッテネータ制御部が読み出す。アッテネータ制御部は、電話機の種類に応じ、固定電話機の場合は、市外局番と現在位置に基づき減衰量記憶部から減衰量を選定し、設定する。」と記載されている。
特許文献1には、通話相手の電話番号に基づいて固定電話か携帯電話か、また、相手が通話している地域を判定し、判定結果に基づいてアッテネータの減衰量を設定可能なハンズフリー装置が開示されている。しかしながら、同文献のハンズフリー装置は、受信した相手の通話音声を解析せずにアッテネータの減衰量を設定するため、最適な通話音声に調整することが難しいという課題がある。
また、通話音声は、ハンズフリー通話とハンドセット通話とで音声品質が大きく異なり、ハンズフリー通話は通話環境に影響を受け易いため、それに応じた通話音声の調整が必要となる。しかしながら、特許文献1のハンズフリー装置は、通話相手がハンズフリー通話を利用しているか否かを特定していないため、ハンズフリー通話に適した通話音声の調整を行うことが難しいという課題もある。
そこで、本発明は、通話相手の通話状況に応じて、より最適な通話音声に調整することを目的とする。
本願は、上記課題の少なくとも一部を解決する手段を複数含んでいるが、その例を挙げるならば、以下のとおりである。上記の課題を解決する本発明の一態様に係るハンズフリー制御装置は、遠端話者の音声情報を取得する通信部と、ハンズフリー通話時に表れる特有の特徴を解析対象とし、前記音声情報を用いて前記解析対象を解析する解析部と、前記遠端話者がハンズフリー通話を利用していることを前記解析結果が示す場合、前記遠端話者の音声情報を近端話者が聞き取りやすくなる音声調整のためのパラメータを設定するパラメータ設定部と、設定された前記パラメータに基づいて、前記遠端話者の音声情報を調整する音声調整部と、を備える。
また、前記解析部は、遠端話者の前記音声情報に含まれる音声レベルとノイズレベルとの差分を示すSNレベルと、前記音声情報に突発音が含まれているか否かを示すノイズ安定度と、前記音声情報に近端話者の発話音声であるエコー成分が含まれている場合にそのレベルを示すエコー成分のレベルと、を前記解析対象として前記音声情報を解析しても良い。
また、前記解析対象の解析結果を判定する判定部をさらに備え、前記判定部によって前記解析対象が所定の条件を満たしていないと判定された場合、前記パラメータ設定部は、所定の第1のパラメータを設定し、前記判定部によって前記解析対象が前記所定の条件を満たしていると判定された場合、前記パラメータ設定部は、前記解析結果に基づいた第2のパラメータを設定しても良い。
また、前記判定部は、前記解析対象が全ての所定の条件を満たしていることを前記解析結果が示す場合、遠端話者がハンズフリー通話を利用していると判定しても良い。
また、前記音声調整部は、遠端話者がハンズフリー通話を利用していることを前記解析結果が示す場合、近端話者が聞き取りやすくなる音声調整のための所定のパラメータを用いて近端話者の音声情報を調整し、前記通信部は、前記調整された近端話者の音声情報を遠端話者に送信しても良い。
また、本発明の一態様に係るプログラムは、コンピュータを、ハンズフリー制御装置として機能させるプログラムであって、前記コンピュータを、遠端話者の音声情報を取得する通信部と、ハンズフリー通話時に表れる特有の特徴を解析対象とし、前記音声情報を用いて前記解析対象を解析する解析部と、前記遠端話者がハンズフリー通話を利用していることを前記解析結果が示す場合、前記遠端話者の音声情報を近端話者が聞き取りやすくなる音声調整のためのパラメータを設定するパラメータ設定部と、設定された前記パラメータに基づいて、前記遠端話者の音声情報を調整する音声調整部と、して機能させる。
また、前記解析部は、遠端話者の前記音声情報に含まれる音声レベルとノイズレベルとの差分を示すSNレベルと、前記音声情報に突発音が含まれているか否かを示すノイズ安定度と、前記音声情報に近端話者の発話音声であるエコー成分が含まれている場合にそのレベルを示すエコー成分のレベルと、を前記解析対象として前記音声情報を解析しても良い。
また、前記コンピュータを、前記解析対象の解析結果を判定する判定部としてさらに機能させ、前記判定部によって前記解析対象が所定の条件を満たしていないと判定された場合、前記パラメータ設定部は、所定の第1のパラメータを設定し、前記判定部によって前記解析対象が前記所定の条件を満たしていると判定された場合、前記パラメータ設定部は、前記解析結果に基づいた第2のパラメータを設定しても良い。
本発明によれば、通話相手の通話状況に応じて、より最適な通話音声に調整することができる。
なお、上記以外の課題、構成および効果等は、以下の実施形態の説明により明らかにされる。
以下、本発明の一実施形態について説明する。
図1は、本実施形態に係るハンズフリー制御装置100を含むハンズフリー制御システムの概略構成の一例を示した図である。図示するように、ハンズフリー制御システムは、ハンズフリー制御装置100と、車載器200と、近端話者(車載器200が搭載された車両に乗車しているユーザ)の携帯端末300と、遠端話者(近端話者の通話相手)の端末400と、を有している。
ハンズフリー制御装置100は、車載器200に搭載され、近端話者のハンズフリー通話を制御する装置である。車載器200は、ハンズフリー制御装置100を内蔵し、近端話者と遠端話者との間の通話音声を含む通話情報を取得する通信装置210を備えたナビゲーション装置あるいはDA(Display Audio)である。近端話者の携帯端末300は、音声通話を行う機能を備えた携帯電話あるいはスマートフォンである。遠端話者の端末400は、固定電話や携帯電話あるいはスマートフォンなどである。なお、近端話者の携帯端末300と車載器200の通信装置210とは、例えばBluetooth(登録商標)などの通信規格を利用した無線通信あるいは有線通信により相互に通信可能に接続されているものとする。
ハンズフリー制御装置100は、車両に乗車しているユーザ(近端話者)のハンズフリー通話を支援および制御する装置である。具体的には、ハンズフリー制御装置100は、車載器200に搭載され、車載器200の通信装置210が近端話者の携帯端末300から取得した遠端話者との通話情報や、車載器200(あるいは車両)が有するマイクロフォン260を介して近端話者の音声情報を取得し、近端話者のハンズフリー通話における様々な処理を制御する。
より具体的には、ハンズフリー制御装置100は、図示するように、通信部101と、解析判定部102と、パラメータ設定部103と、音声調整部104とを機能部として有している。
通信部101は、近端話者の携帯端末300との間で通話情報などの情報通信を行う機能部である。具体的には、通信部101は、近端話者がハンズフリー通話を利用して遠端話者と通話した際の音声情報を含む通話情報を車載器200の通信装置210を介して取得する。また、通信部101は、車載器200(あるいは車両)が有するマイクロフォン260を介して近端話者の音声情報を取得する。また、通信部101は、取得した通話情報を解析判定部102に出力する。
解析判定部102は、通話情報を解析し、遠端話者の通話形態がハンズフリー通話かハンドセット通話かを判定する機能部である。具体的には、解析判定部102は、通話情報に含まれる音声情報を解析し、ハンズフリー通話に特有の特徴が検出されたか否かに基づいて、遠端話者の通話形態がハンズフリー通話かハンドセット通話かを判定する。より具体的には、解析判定部102は、ハンズフリー通話時に表れる特有の特徴すなわちSN(Signal Noise)レベル、突発的なノイズ(突発音)の発生を示すノイズ安定度およびエコー成分のレベルを解析対象として解析する。また、解析判定部102は、各解析結果に基づいて、遠端話者がハンズフリー通話か否かを判定する。これらの解析対象は、遠端話者から取得した音声情報にハンズフリー通話を示す特有の波形として表されるため、解析判定部102は、これらを解析対象とし、その解析結果を用いてハンズフリー通話か否かの判定を行うことで、精度良く遠端話者がハンズフリー通話であるか否かの判定が可能となる。
また、解析判定部102は、判定結果に応じて、スピーカ250から出力する遠端話者の音声情報の成分を調整するためのパラメータについて指示を出力する。具体的には、解析判定部102は、遠端話者の通話形態がハンドセット通話と判定した場合、所定の初期パラメータ値の設定指示をパラメータ設定部103に出力する。一方で、遠端話者の通話形態がハンズフリー通話と判定した場合、解析判定部102は、初期パラメータ値に変更を加えた合成パラメータの設定指示をパラメータ設定部103に出力する。
パラメータ設定部103は、音声情報の成分調整を行うためのパラメータを設定する機能部である。具体的には、パラメータ設定部103は、初期パラメータ値の設定指示を取得すると、かかる指示に応じて所定の初期パラメータ値を設定する。また、パラメータ設定部103は、合成パラメータの設定指示を取得すると、各解析対象に対する解析結果に応じた合成パラメータ値を設定する。また、パラメータ設定部103は、遠端話者の音声情報と設定したパラメータ値を音声調整部104に出力する。
音声調整部104は、パラメータ値に基づいて音声情報の成分を調整する機能部である。具体的には、音声調整部104は、パラメータ設定部103により設定されたパラメータ値に基づいて遠端話者の音声情報における各成分を調整する。より具体的には、音声調整部104は、遠端話者がハンドセット通話の場合、初期パラメータ値を用いて遠端話者の音声情報を調整し、遠端話者がハンズフリー通話の場合、各解析対象における解析結果に応じた合成パラメータ値に基づいて遠端話者の音声情報を調整する。また、音声調整部104は、調整後の遠端話者の音声情報をスピーカ250に出力する。これにより、車両あるいは車載器200が有するスピーカ250から、遠端話者の通話形態に応じて近端話者が聞き取りやすい音声品質の音声情報が出力される。
以上、ハンズフリー制御装置100の機能構成について説明した。
図2は、ハンズフリー制御装置100のハードウェア構成の一例を示した図である。図示するように、ハンズフリー制御装置100は、演算装置110と、記憶装置120と、通信装置130と、記憶装置120および演算装置110を電気的に接続するバス140と、通信装置130および演算装置110を電気的に接続するバス150と、を有している。
演算装置110は、例えばCPU(Central Processing Unit)などの処理装置である。記憶装置120は、RAM(Random Access Memory)やROM(Read Only Memory)などのメモリ装置である。通信装置130は、ハンズフリー制御装置100が接続される外部装置(例えば、車載器200)と相互通信可能に接続するための入出力インターフェイスあるいは外部装置(例えば、近端話者の携帯端末300)と直接的に情報通信を行うための通信モジュールである。
以上、ハンズフリー制御装置100のハードウェア構成について説明した。
なお、ハンズフリー制御装置100の解析判定部102、パラメータ設定部103および音声調整部104は、演算装置110のCPUに処理を行わせるプログラムによって実現される。これらのプログラムは、例えば記憶装置120に格納されており、実行にあたってRAM上にロードされ、CPUにより実行される。また、通信部101は、通信装置130により実現される。
また、ハンズフリー制御装置100の各機能ブロックは、本実施形態において実現される各機能を理解容易にするために、主な処理内容に応じて分類したものである。したがって、各機能の分類の仕方やその名称によって、本発明が制限されることはない。また、ハンズフリー制御装置100の各構成は、処理内容に応じて、さらに多くの構成要素に分類することもできる。また、1つの構成要素がさらに多くの処理を実行するように分類することもできる。
また、各機能部の全部または一部は、コンピュータに実装されるハードウェア(ASICといった集積回路など)により構築されてもよい。また、各機能部の処理が1つのハードウェアで実行されてもよいし、複数のハードウェアで実行されてもよい。また、ハンズフリー制御装置100は、例えば、DSP(Digital Signal Processor)により実現されても良い。
[動作の説明]
図3は、ハンズフリー制御装置100で実行される音声調整処理の一例を示したフロー図である。かかる処理は、車載器200の通信装置210を介して、ハンズフリー制御装置100の通信部101が近端話者と遠端話者との通話情報を取得すると開始される。
図3は、ハンズフリー制御装置100で実行される音声調整処理の一例を示したフロー図である。かかる処理は、車載器200の通信装置210を介して、ハンズフリー制御装置100の通信部101が近端話者と遠端話者との通話情報を取得すると開始される。
処理を開始すると、解析判定部102は、遠端話者が携帯端末を使用しているか否かを判定する(ステップS001)。具体的には、解析判定部102は、通話情報に含まれる付加情報(例えば、遠端話者の電話番号)を用いて、遠端話者が携帯端末を使用して通話しているか否かを判定する。そして、携帯端末を使用していないと判定した場合(ステップS001でNo)、解析判定部102は、遠端話者の音声情報と共に初期パラメータ値の設定指示をパラメータ設定部103に出力する。この場合、パラメータ設定部103は、所定の初期パラメータ値を設定し(ステップS006)、処理をステップS004に移行する。
一方で、携帯端末を使用していると判定した場合(ステップS001でYes)、解析判定部102は、処理をステップS002に移行する。
ステップS002では、解析判定部102は、遠端話者の通話形態判定処理を行う。具体的には、解析判定部102は、遠端話者の音声情報を解析して、通話形態がハンズフリー通話かハンドセット通話かを判定する。
図4は、通話形態判定処理の一例を示したフロー図である。かかる処理を開始すると、解析判定部102は、所定の解析対象について解析を行う。具体的には、解析判定部102は、SNレベルを解析する(ステップS011)。より具体的には、解析判定部102は、遠端話者の音声情報を音源分離し、遠端話者の音声を示すS(Signal)レベル(単位はdb:デシベル)と、環境音などのノイズを示すN(Noise)レベル(単位はdb:デシベル)とを各々解析する。SNレベルの解析は、既存の周知技術のため、詳細な説明は省略する。なお、携帯端末でのハンズフリー通話では、周囲の環境音がノイズとして集音されやすいため、ハンドセット通話に比べてSレベルが小さく、Nレベルが大きくなる傾向がある。
次に、解析判定部102は、ノイズ安定度を解析する(ステップS012)。具体的には、解析判定部102は、音源分離したノイズデータの中で突発的な音(例えば、それ以前のノイズの平均値に比べて瞬間的にNレベルの高い音)が含まれているか否かを解析する。ノイズデータの中から突発的な音を検知する技術は既存の周知技術のため、詳細な説明は省略する。なお、携帯端末でのハンズフリー通話では、環境音を拾いやすいため、例えば遠端話者がハンズフリー通話を利用して運転している場合、道路上のでこぼこやバンプを通過すると突発音が検出される。
次に、解析判定部102は、エコー成分のレベルを解析する(ステップS013)。なお、エコー(Echo)とは、近端話者の発話音声が遠端話者の端末400から出力され、それを遠端話者の端末400のマイクロフォンが集音して音声情報と共に近端話者の携帯端末300に送信されることで、遠端話者が発話した音声情報の中に近端話者の発話音声が含まれて聞こえることである。すなわち、エコー成分のレベルとは、遠端話者の音声情報に含まれる近端話者の発話音声の強さのことを指す。
解析判定部102は、近端話者の発話音声(リファレンス信号)を車載器200または車両のマイクロフォン260を介して取得し、これを一時的に記憶しておき、所定期間(例えば、数秒間)内に取得した遠端話者の音声情報の中に近端話者の発話音声が含まれているか否かを解析することで、エコー成分の有無およびそのレベルを解析する。エコー成分の解析は、既存の周知技術のため、詳細な説明は省略する。なお、携帯端末でのハンドセット通話の場合、受話器のスピーカは耳に近接しているため、スピーカから出た音は周囲に広がり難い。そのため、ハンドセット通話の場合には、遠端話者の端末400のマイクロフォンが近端話者の発話音声を拾うことは無く、エコーが発生することはほぼ無い。一方で、携帯端末でのハンズフリー通話では、マイクロフォンが近接話者の発話音声を拾いやすく、エコーが発生しやすい。
次に、解析判定部102は、各解析対象の解析結果に基づいて、遠端話者がハンズフリー通話か否かを判定する(ステップS014)。具体的には、ステップS011、ステップS012およびステップS013の各々の解析結果について、所定の条件が満たされているか否かを判定する。
より具体的には、解析判定部102は、ステップS011で解析したSレベルとNレベルとを比較し、SレベルとNレベルの差が所定デシベル(例えば、20デシベル)以下であるという条件が満たされているか否かを判定する。
また、解析判定部102は、ステップS012で解析したノイズ安定度について、遠端話者の音声情報の中に突発音が入り込んでいるという条件が満たされているか否かを判定する。
また、解析判定部102は、ステップS013で解析したエコー成分のレベルと近端話者の車内における発話音声(リファレンス信号)のレベルとが、ほぼ同レベル(例えば、エコー成分のレベルとリファレンス信号のレベルとの差が所定値未満)であるという条件が満たされているか否かを判定する。
そして、解析判定部102は、全ての条件が満たされていると判定した場合、遠端話者の通話形態がハンズフリー通話であると判定する。なお、判定基準はこれに限定されるものではなく、例えばこれらの条件のうち、少なくともいずれか一つが上記条件よりも高い条件(例えば、SNレベルの判定のみ条件が満たされている場合、SレベルとNレベルの差が10デシベル以下の場合、あるいはノイズ安定度の判定のみ条件が満たされている場合、検出された突発音の数が10回を超える場合、あるいはエコー成分のレベルの判定のみ条件が満たされている場合、エコー成分のレベルと近端話者のリファレンス信号のレベルとの差が上記の所定値よりも小さい場合など)を満たしている場合に遠端話者の通話形態がハンズフリー通話であると判定しても良い。
解析判定部102は、遠端話者の通話形態がハンズフリー通話ではないと判定した場合(ステップS014でNo)、所定の初期パラメータ値の設定指示をパラメータ設定部103に出力し(ステップS016)、音声調整処理のステップS003に移行する。一方で、遠端話者の通話形態がハンズフリー通話であると判定した場合(ステップS014でYes)、解析判定部102は、初期パラメータ値に変更を加えた合成パラメータの設定指示をパラメータ設定部103に出力し(ステップS015)、処理を音声調整処理のステップS003に移行する。
図3の音声調整処理のフローに戻って説明する。ステップS003では、パラメータ設定部103は、パラメータの設定を行う。具体的には、パラメータ設定部103は、解析判定部102から取得した指示に従って、初期パラメータまたは合成パラメータを設定する。
ここで、合成パラメータの設定について説明する。なお、合成パラタメータの設定方法については、最適版と簡易版の2種類ある。最適版は、ステップS011〜ステップS013の解析対象に対する解析結果を考慮し、フィードバックを掛けながら随時、解析対象が適切なレベルとなるようにパラメータ値の調整を行うことで最適なパラメータ値を算出し設定する方法である。また、簡易版は、他の解析対象に対する解析結果を考慮せず、遠端話者の音声情報がより聞き取り易くなるような固定値をパラメータ値として設定する方法である。なお、いずれの方法を用いるかは、演算装置110の性能に応じて決定されれば良い。
最適版の合成パラメータの設定について具体的に説明する。パラメータ設定部103は、ステップS011で解析されたSレベルとNレベルの値を参照し、SレベルおよびNレベルごとに個別にパラメータ値を調整する。具体的には、パラメータ設定部103は、既存のノイズキャンセラやノイズサプレッサといった周知技術を用いてNレベルを低減させ、Sレベルを基準レベル近くまで引き上げるようなパラメータ値を算出する。
また、パラメータ設定部103は、ステップS012で解析された突発的に発生するノイズのレベルを下げるようなパラメータ値を算出する。なお、パラメータ設定部103は、突発音の発生回数や突発音のレベルを解析結果から特定し、これらに応じたパラメータ値を算出する。
また、パラメータ設定部103は、ステップS013で解析されたエコー成分のレベルを低減させるパラメータ値を算出する。なお、エコー成分は、いわゆるダブルトーク(エコー成分を消去する際に、かかるエコー成分に重なっている遠端話者の音声情報まで消去されてしまう現象)と相互に影響し合うため、フィードバックを掛けてパラメータ値を調整する。
このように、最適版の合成パラメータの設定によれば、各解析対象のレベルがより最適値となるようなパラメータ値を算出し設定することができる。その結果、遠端話者の音声情報がより聞き取りやすく調整される。
また、簡易版の合成パラメータの設定について具体的に説明する。パラメータ設定部103は、各解析対象のレベル(SNレベル、突発音のレベルおよびエコー成分のレベル)が所定値(固定値)となるようにパラメータ値を設定する。
このように、簡易版の合成パラメータの設定によれば、固定値に基づいた負荷の少ない処理に基づき、遠端話者の音声情報が聞き取りやすく調整される。最適版の合成パラメータが設定された場合に比べて音声品質の改善率は低いが、初期パラメータが設定された場合に比べて遠端話者の音声情報は聞き取りやすく改善される。
図3に戻って説明する。ステップS003においてパラメータ設定部103によりパラメータが設定されると、パラメータ設定部103は、遠端話者の音声情報と共に設定したパラメータ値を音声調整部104に出力する。
次に、音声調整部104は、設定されたパラメータ値を用いて、遠端話者の音声情報を調整し(ステップS004)、調整後の音声情報をスピーカ250から出力させる。
次に、通信部101は、通話が終了したか否かを通話情報の受信に基づき判定し(ステップS005)、通話が終了していないと判定すると(ステップS005でNo)、処理をステップS001に移行する。なお、移行後に行うステップS001の処理は既に判定済みのため、遠端話者が携帯端末を使用しているか否かの判定は省略し、前回の判定結果に従って以後の処理に移行しても良い。一方で、通話が終了したと判定すると(ステップS005でYes)、通信部101は、本フローの処理を終了する。
以上、音声調整処理について説明した。
このようなハンズフリー制御装置100によれば、通話相手の通話状況に応じて、より最適な通話音声に調整することができる。特に、ハンズフリー制御装置100は、ハンズフリー通話時に表れる特有の特徴を解析対象とし、かかる解析対象であるSNレベル、ノイズ安定性およびエコー成分のレベルについて解析し、この解析結果に基づいて遠端話者がハンズフリー通話を利用しているか否かを判定する。そして、このような解析および判定結果に応じて、ハンズフリー通話の場合とハンドセット通話の場合とで異なるパラメータ値を設定し、遠端話者の音声情報を調整する。これにより、近端話者にとってより聞き取りやすい遠端話者の音声情報を出力することができる。
なお、前述の実施形態では、遠端話者の通話形態を特定し、かかる通話形態に応じて近端話者が聞き取り易くなるように遠端話者の音声情報を調整するハンズフリー制御装置100について説明したが、本発明はこれに限られるものではない。例えば、ハンズフリー制御装置100は、遠端話者が聞き取り易いように近端話者の音声情報を調整しても良い。
具体的には、音声調整部104は、車載器200あるいは車両が備えるマイクロフォン260を介して近端話者の音声情報を取得すると、ハンズフリー通話を利用している近端話者の音声情報を遠端話者が聞き取り易くなるように所定のパラメータ値を用いて近端話者の音声情報を調整し、通信部101に出力する。また、通信部101は、例えば車載器200の通信装置210を介して、調整された近端話者の音声情報を遠端話者に送信する。なお、かかるパラメータ値は、予め記憶装置120に格納されていれば良い。
このようなハンズフリー制御装置100によれば、ハンズフリー通話を行っている近端話者の音声情報を調整することができ、遠端話者にとっても近端話者の音声情報が聞き取りやすくなる。
また、前述の実施形態におけるステップS013でエコー成分のレベルを解析したが、これをダブルトークの解析に置き換えても良い。あるいは、エコー成分およびダブルトークの両方を解析するようにしても良い。
ダブルトークの解析では、解析判定部102は、通信部101が車載器200の通信装置210を介して遠端話者に近端話者の音声情報を送信してから所定期間内に遠端話者から受信した音声情報を解析する。そして、解析判定部102は、かかる音声情報に無音(ノイズ音も含まない)区間あるいはSレベルが著しく低い音声情報が含まれているか否かを解析する。そして、SNレベル、ノイズ安定度およびダブルトークの各解析で、無音やSレベルが著しく小さいという条件を満たしていると判定した場合であって、SNレベルおよびノイズ安定度についても条件が満たされていると判定した場合、解析判定部102は、遠端話者がハンズフリー通話であると判定する(ステップS014でYes)。
なお、この場合、パラメータ設定部103は、ステップS003の処理において、エコー成分のレベルを下げる調整量を小さくし、エコー成分の調整によって遠端話者の音声情報まで消えてしまうダブルトークの発生を低減させるためのパラメータ値を設定する。
このようなダブルトークの解析を加えることで、遠端話者がハンズフリー通話であるか否かの判定精度を高めることができる。
また、本発明は、上記の実施形態や変形例などに限られるものではなく、これら以外にも様々な実施形態および変形例が含まれる。例えば、上記の実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施形態の構成の一部を他の実施形態や変形例の構成に置き換えることが可能であり、ある実施形態の構成に他の実施形態の構成を加えることも可能である。また、各実施形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
100・・・ハンズフリー制御装置、101・・・通信部、102・・・解析判定部、103・・・パラメータ設定部、104・・・音声調整部、200・・・車載器、210・・・車載器の通信装置、250・・・スピーカ、260・・・マイクロフォン、300・・・近端話者の携帯端末、400・・・遠端話者の端末、110・・・演算装置、120・・・記憶装置、130・・・ハンズフリー制御装置の通信装置、140・・・記憶装置および演算装置間のバス、150・・・通信装置および演算装置間のバス
Claims (8)
- 遠端話者の音声情報を取得する通信部と、
ハンズフリー通話時に表れる特有の特徴を解析対象とし、前記音声情報を用いて前記解析対象を解析する解析部と、
前記遠端話者がハンズフリー通話を利用していることを前記解析結果が示す場合、前記遠端話者の音声情報を近端話者が聞き取りやすくなる音声調整のためのパラメータを設定するパラメータ設定部と、
設定された前記パラメータに基づいて、前記遠端話者の音声情報を調整する音声調整部と、を備える
ことを特徴とするハンズフリー制御装置。 - 請求項1に記載のハンズフリー制御装置であって、
前記解析部は、
遠端話者の前記音声情報に含まれる音声レベルとノイズレベルとの差分を示すSNレベルと、前記音声情報に突発音が含まれているか否かを示すノイズ安定度と、前記音声情報に近端話者の発話音声であるエコー成分が含まれている場合にそのレベルを示すエコー成分のレベルと、を前記解析対象として前記音声情報を解析する
ことを特徴とするハンズフリー制御装置。 - 請求項1または2に記載のハンズフリー制御装置であって、
前記解析対象の解析結果を判定する判定部をさらに備え、
前記判定部によって前記解析対象が所定の条件を満たしていないと判定された場合、前記パラメータ設定部は、所定の第1のパラメータを設定し、
前記判定部によって前記解析対象が前記所定の条件を満たしていると判定された場合、前記パラメータ設定部は、前記解析結果に基づいた第2のパラメータを設定する
ことを特徴とするハンズフリー制御装置。 - 請求項3に記載のハンズフリー制御装置であって、
前記判定部は、
前記解析対象が全ての所定の条件を満たしていることを前記解析結果が示す場合、遠端話者がハンズフリー通話を利用していると判定する
ことを特徴とするハンズフリー制御装置。 - 請求項1〜4のいずれか一項に記載のハンズフリー制御装置であって、
前記音声調整部は、
遠端話者がハンズフリー通話を利用していることを前記解析結果が示す場合、近端話者が聞き取りやすくなる音声調整のための所定のパラメータを用いて近端話者の音声情報を調整し、
前記通信部は、前記調整された近端話者の音声情報を遠端話者に送信する
ことを特徴とするハンズフリー制御装置。 - コンピュータを、ハンズフリー制御装置として機能させるプログラムであって、
前記コンピュータを、
遠端話者の音声情報を取得する通信部と、
ハンズフリー通話時に表れる特有の特徴を解析対象とし、前記音声情報を用いて前記解析対象を解析する解析部と、
前記遠端話者がハンズフリー通話を利用していることを前記解析結果が示す場合、前記遠端話者の音声情報を近端話者が聞き取りやすくなる音声調整のためのパラメータを設定するパラメータ設定部と、
設定された前記パラメータに基づいて、前記遠端話者の音声情報を調整する音声調整部と、して機能させる
ことを特徴とするプログラム。 - 請求項6に記載のプログラムであって、
前記解析部は、
遠端話者の前記音声情報に含まれる音声レベルとノイズレベルとの差分を示すSNレベルと、前記音声情報に突発音が含まれているか否かを示すノイズ安定度と、前記音声情報に近端話者の発話音声であるエコー成分が含まれている場合にそのレベルを示すエコー成分のレベルと、を前記解析対象として前記音声情報を解析する
ことを特徴とするプログラム。 - 請求項6または7に記載のプログラムであって、
前記コンピュータを、
前記解析対象の解析結果を判定する判定部としてさらに機能させ、
前記判定部によって前記解析対象が所定の条件を満たしていないと判定された場合、前記パラメータ設定部は、所定の第1のパラメータを設定し、
前記判定部によって前記解析対象が前記所定の条件を満たしていると判定された場合、前記パラメータ設定部は、前記解析結果に基づいた第2のパラメータを設定する
ことを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020023993A JP2021129256A (ja) | 2020-02-17 | 2020-02-17 | ハンズフリー制御装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020023993A JP2021129256A (ja) | 2020-02-17 | 2020-02-17 | ハンズフリー制御装置およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021129256A true JP2021129256A (ja) | 2021-09-02 |
Family
ID=77489087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020023993A Pending JP2021129256A (ja) | 2020-02-17 | 2020-02-17 | ハンズフリー制御装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021129256A (ja) |
-
2020
- 2020-02-17 JP JP2020023993A patent/JP2021129256A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2654942B2 (ja) | 音声通信装置及びその動作方法 | |
US20080020807A1 (en) | System for calibrating a hands-free system | |
CN110896509A (zh) | 耳机佩戴状态确定方法、电子设备控制方法及电子设备 | |
JPH11500277A (ja) | 音声活性度検出 | |
JP2002217793A (ja) | エコー抑圧装置 | |
CN101552823A (zh) | 音量管理系统及方法 | |
JP2006270601A (ja) | ハンズフリー通話装置 | |
US8280450B2 (en) | Hands-free phone-call device and tone quality control device | |
JP4400490B2 (ja) | 拡声通話装置、拡声通話システム | |
JP2021129256A (ja) | ハンズフリー制御装置およびプログラム | |
CN113329290B (zh) | 耳机控制方法、装置、无线耳机及存储介质 | |
US7760869B2 (en) | Method and apparatus for controlling the transmit volume level of a speakerphone | |
CN114745624A (zh) | 无线耳机寻找方法、装置、耳机及存储介质 | |
CN104717379B (zh) | 基于元数据的用于语音通信的协同语音处理的方法 | |
CN110933710B (zh) | 语音通信控制方法及系统 | |
NL1038762C2 (en) | Voice immersion smartphone application or headset for reduction of mobile annoyance. | |
JP3761473B2 (ja) | ハンズフリー通話用アダプタ装置 | |
JP4299768B2 (ja) | 音声認識装置、方法及び音声認識方法を用いた携帯型情報端末装置 | |
JP2001119470A (ja) | 電話音声処理装置 | |
JP2020077933A (ja) | ハンズフリー通話装置、及びハンズフリー通話装置の制御方法 | |
JP7084899B2 (ja) | 車載装置 | |
JP2013157924A (ja) | 通信装置、通信プログラム及び通信方法 | |
US20220139414A1 (en) | Communication device and sidetone volume adjusting method thereof | |
CN114446315A (zh) | 通讯装置及其调整输出侧音的方法 | |
JP2012217125A (ja) | 車載用ハンズフリー通話装置 |