JP2021129256A

JP2021129256A - ハンズフリー制御装置およびプログラム

Info

Publication number: JP2021129256A
Application number: JP2020023993A
Authority: JP
Inventors: 明子太田; Akiko Ota
Original assignee: Faurecia Clarion Electronics Co Ltd
Current assignee: Faurecia Clarion Electronics Co Ltd
Priority date: 2020-02-17
Filing date: 2020-02-17
Publication date: 2021-09-02

Abstract

【課題】通話相手の通話状況に応じて、より最適な通話音声に調整することができる。【解決手段】遠端話者の音声情報を取得する通信部と、ハンズフリー通話時に表れる特有の特徴を解析対象とし、前記音声情報を用いて前記解析対象を解析する解析部と、前記遠端話者がハンズフリー通話を利用していることを前記解析結果が示す場合、前記遠端話者の音声情報を近端話者が聞き取りやすくなる音声調整のためのパラメータを設定するパラメータ設定部と、設定された前記パラメータに基づいて、前記遠端話者の音声情報を調整する音声調整部と、を備える。【選択図】図１

Description

本発明は、ハンズフリー制御装置およびプログラムに関する。

特許文献１には、ハンズフリー装置に関し、「ハンズフリー装置は、移動電話機本体と、マイク用のＴｘアッテネータ、スピーカ用のＲｘアッテネータ、ＴｘアッテネータとＲｘアッテネータの減衰量を選定し、設定するアッテネータ制御部からなる。さらにアッテネータ制御部に接続する減衰量記憶部と相手側の電話機の種類を判別する相手側電話判別部を備えている。また、ハンズフリー装置は、ナビゲーション・システムに接続し、ＧＰＳ装置からなる現在位置検出部からの現在位置データを、アッテネータ制御部が読み出す。アッテネータ制御部は、電話機の種類に応じ、固定電話機の場合は、市外局番と現在位置に基づき減衰量記憶部から減衰量を選定し、設定する。」と記載されている。

特開２００５−１５０８１６号公報

特許文献１には、通話相手の電話番号に基づいて固定電話か携帯電話か、また、相手が通話している地域を判定し、判定結果に基づいてアッテネータの減衰量を設定可能なハンズフリー装置が開示されている。しかしながら、同文献のハンズフリー装置は、受信した相手の通話音声を解析せずにアッテネータの減衰量を設定するため、最適な通話音声に調整することが難しいという課題がある。

また、通話音声は、ハンズフリー通話とハンドセット通話とで音声品質が大きく異なり、ハンズフリー通話は通話環境に影響を受け易いため、それに応じた通話音声の調整が必要となる。しかしながら、特許文献１のハンズフリー装置は、通話相手がハンズフリー通話を利用しているか否かを特定していないため、ハンズフリー通話に適した通話音声の調整を行うことが難しいという課題もある。

そこで、本発明は、通話相手の通話状況に応じて、より最適な通話音声に調整することを目的とする。

本願は、上記課題の少なくとも一部を解決する手段を複数含んでいるが、その例を挙げるならば、以下のとおりである。上記の課題を解決する本発明の一態様に係るハンズフリー制御装置は、遠端話者の音声情報を取得する通信部と、ハンズフリー通話時に表れる特有の特徴を解析対象とし、前記音声情報を用いて前記解析対象を解析する解析部と、前記遠端話者がハンズフリー通話を利用していることを前記解析結果が示す場合、前記遠端話者の音声情報を近端話者が聞き取りやすくなる音声調整のためのパラメータを設定するパラメータ設定部と、設定された前記パラメータに基づいて、前記遠端話者の音声情報を調整する音声調整部と、を備える。

また、前記解析部は、遠端話者の前記音声情報に含まれる音声レベルとノイズレベルとの差分を示すＳＮレベルと、前記音声情報に突発音が含まれているか否かを示すノイズ安定度と、前記音声情報に近端話者の発話音声であるエコー成分が含まれている場合にそのレベルを示すエコー成分のレベルと、を前記解析対象として前記音声情報を解析しても良い。

また、前記解析対象の解析結果を判定する判定部をさらに備え、前記判定部によって前記解析対象が所定の条件を満たしていないと判定された場合、前記パラメータ設定部は、所定の第１のパラメータを設定し、前記判定部によって前記解析対象が前記所定の条件を満たしていると判定された場合、前記パラメータ設定部は、前記解析結果に基づいた第２のパラメータを設定しても良い。

また、前記判定部は、前記解析対象が全ての所定の条件を満たしていることを前記解析結果が示す場合、遠端話者がハンズフリー通話を利用していると判定しても良い。

また、前記音声調整部は、遠端話者がハンズフリー通話を利用していることを前記解析結果が示す場合、近端話者が聞き取りやすくなる音声調整のための所定のパラメータを用いて近端話者の音声情報を調整し、前記通信部は、前記調整された近端話者の音声情報を遠端話者に送信しても良い。

また、本発明の一態様に係るプログラムは、コンピュータを、ハンズフリー制御装置として機能させるプログラムであって、前記コンピュータを、遠端話者の音声情報を取得する通信部と、ハンズフリー通話時に表れる特有の特徴を解析対象とし、前記音声情報を用いて前記解析対象を解析する解析部と、前記遠端話者がハンズフリー通話を利用していることを前記解析結果が示す場合、前記遠端話者の音声情報を近端話者が聞き取りやすくなる音声調整のためのパラメータを設定するパラメータ設定部と、設定された前記パラメータに基づいて、前記遠端話者の音声情報を調整する音声調整部と、して機能させる。

また、前記コンピュータを、前記解析対象の解析結果を判定する判定部としてさらに機能させ、前記判定部によって前記解析対象が所定の条件を満たしていないと判定された場合、前記パラメータ設定部は、所定の第１のパラメータを設定し、前記判定部によって前記解析対象が前記所定の条件を満たしていると判定された場合、前記パラメータ設定部は、前記解析結果に基づいた第２のパラメータを設定しても良い。

本発明によれば、通話相手の通話状況に応じて、より最適な通話音声に調整することができる。

なお、上記以外の課題、構成および効果等は、以下の実施形態の説明により明らかにされる。

ハンズフリー制御装置を含むハンズフリー制御システムの概略構成の一例を示した図である。ハンズフリー制御装置のハードウェア構成の一例を示した図である。音声調整処理の一例を示したフロー図である。通話形態判定処理の一例を示したフロー図である。

以下、本発明の一実施形態について説明する。

図１は、本実施形態に係るハンズフリー制御装置１００を含むハンズフリー制御システムの概略構成の一例を示した図である。図示するように、ハンズフリー制御システムは、ハンズフリー制御装置１００と、車載器２００と、近端話者（車載器２００が搭載された車両に乗車しているユーザ）の携帯端末３００と、遠端話者（近端話者の通話相手）の端末４００と、を有している。

ハンズフリー制御装置１００は、車載器２００に搭載され、近端話者のハンズフリー通話を制御する装置である。車載器２００は、ハンズフリー制御装置１００を内蔵し、近端話者と遠端話者との間の通話音声を含む通話情報を取得する通信装置２１０を備えたナビゲーション装置あるいはＤＡ（ＤｉｓｐｌａｙＡｕｄｉｏ）である。近端話者の携帯端末３００は、音声通話を行う機能を備えた携帯電話あるいはスマートフォンである。遠端話者の端末４００は、固定電話や携帯電話あるいはスマートフォンなどである。なお、近端話者の携帯端末３００と車載器２００の通信装置２１０とは、例えばＢｌｕｅｔｏｏｔｈ（登録商標）などの通信規格を利用した無線通信あるいは有線通信により相互に通信可能に接続されているものとする。

ハンズフリー制御装置１００は、車両に乗車しているユーザ（近端話者）のハンズフリー通話を支援および制御する装置である。具体的には、ハンズフリー制御装置１００は、車載器２００に搭載され、車載器２００の通信装置２１０が近端話者の携帯端末３００から取得した遠端話者との通話情報や、車載器２００（あるいは車両）が有するマイクロフォン２６０を介して近端話者の音声情報を取得し、近端話者のハンズフリー通話における様々な処理を制御する。

より具体的には、ハンズフリー制御装置１００は、図示するように、通信部１０１と、解析判定部１０２と、パラメータ設定部１０３と、音声調整部１０４とを機能部として有している。

通信部１０１は、近端話者の携帯端末３００との間で通話情報などの情報通信を行う機能部である。具体的には、通信部１０１は、近端話者がハンズフリー通話を利用して遠端話者と通話した際の音声情報を含む通話情報を車載器２００の通信装置２１０を介して取得する。また、通信部１０１は、車載器２００（あるいは車両）が有するマイクロフォン２６０を介して近端話者の音声情報を取得する。また、通信部１０１は、取得した通話情報を解析判定部１０２に出力する。

解析判定部１０２は、通話情報を解析し、遠端話者の通話形態がハンズフリー通話かハンドセット通話かを判定する機能部である。具体的には、解析判定部１０２は、通話情報に含まれる音声情報を解析し、ハンズフリー通話に特有の特徴が検出されたか否かに基づいて、遠端話者の通話形態がハンズフリー通話かハンドセット通話かを判定する。より具体的には、解析判定部１０２は、ハンズフリー通話時に表れる特有の特徴すなわちＳＮ（ＳｉｇｎａｌＮｏｉｓｅ）レベル、突発的なノイズ（突発音）の発生を示すノイズ安定度およびエコー成分のレベルを解析対象として解析する。また、解析判定部１０２は、各解析結果に基づいて、遠端話者がハンズフリー通話か否かを判定する。これらの解析対象は、遠端話者から取得した音声情報にハンズフリー通話を示す特有の波形として表されるため、解析判定部１０２は、これらを解析対象とし、その解析結果を用いてハンズフリー通話か否かの判定を行うことで、精度良く遠端話者がハンズフリー通話であるか否かの判定が可能となる。

また、解析判定部１０２は、判定結果に応じて、スピーカ２５０から出力する遠端話者の音声情報の成分を調整するためのパラメータについて指示を出力する。具体的には、解析判定部１０２は、遠端話者の通話形態がハンドセット通話と判定した場合、所定の初期パラメータ値の設定指示をパラメータ設定部１０３に出力する。一方で、遠端話者の通話形態がハンズフリー通話と判定した場合、解析判定部１０２は、初期パラメータ値に変更を加えた合成パラメータの設定指示をパラメータ設定部１０３に出力する。

パラメータ設定部１０３は、音声情報の成分調整を行うためのパラメータを設定する機能部である。具体的には、パラメータ設定部１０３は、初期パラメータ値の設定指示を取得すると、かかる指示に応じて所定の初期パラメータ値を設定する。また、パラメータ設定部１０３は、合成パラメータの設定指示を取得すると、各解析対象に対する解析結果に応じた合成パラメータ値を設定する。また、パラメータ設定部１０３は、遠端話者の音声情報と設定したパラメータ値を音声調整部１０４に出力する。

音声調整部１０４は、パラメータ値に基づいて音声情報の成分を調整する機能部である。具体的には、音声調整部１０４は、パラメータ設定部１０３により設定されたパラメータ値に基づいて遠端話者の音声情報における各成分を調整する。より具体的には、音声調整部１０４は、遠端話者がハンドセット通話の場合、初期パラメータ値を用いて遠端話者の音声情報を調整し、遠端話者がハンズフリー通話の場合、各解析対象における解析結果に応じた合成パラメータ値に基づいて遠端話者の音声情報を調整する。また、音声調整部１０４は、調整後の遠端話者の音声情報をスピーカ２５０に出力する。これにより、車両あるいは車載器２００が有するスピーカ２５０から、遠端話者の通話形態に応じて近端話者が聞き取りやすい音声品質の音声情報が出力される。

以上、ハンズフリー制御装置１００の機能構成について説明した。

図２は、ハンズフリー制御装置１００のハードウェア構成の一例を示した図である。図示するように、ハンズフリー制御装置１００は、演算装置１１０と、記憶装置１２０と、通信装置１３０と、記憶装置１２０および演算装置１１０を電気的に接続するバス１４０と、通信装置１３０および演算装置１１０を電気的に接続するバス１５０と、を有している。

演算装置１１０は、例えばＣＰＵ(ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ)などの処理装置である。記憶装置１２０は、ＲＡＭ(ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ)やＲＯＭ(ＲｅａｄＯｎｌｙＭｅｍｏｒｙ)などのメモリ装置である。通信装置１３０は、ハンズフリー制御装置１００が接続される外部装置（例えば、車載器２００）と相互通信可能に接続するための入出力インターフェイスあるいは外部装置（例えば、近端話者の携帯端末３００）と直接的に情報通信を行うための通信モジュールである。

以上、ハンズフリー制御装置１００のハードウェア構成について説明した。

なお、ハンズフリー制御装置１００の解析判定部１０２、パラメータ設定部１０３および音声調整部１０４は、演算装置１１０のＣＰＵに処理を行わせるプログラムによって実現される。これらのプログラムは、例えば記憶装置１２０に格納されており、実行にあたってＲＡＭ上にロードされ、ＣＰＵにより実行される。また、通信部１０１は、通信装置１３０により実現される。

また、ハンズフリー制御装置１００の各機能ブロックは、本実施形態において実現される各機能を理解容易にするために、主な処理内容に応じて分類したものである。したがって、各機能の分類の仕方やその名称によって、本発明が制限されることはない。また、ハンズフリー制御装置１００の各構成は、処理内容に応じて、さらに多くの構成要素に分類することもできる。また、１つの構成要素がさらに多くの処理を実行するように分類することもできる。

また、各機能部の全部または一部は、コンピュータに実装されるハードウェア（ＡＳＩＣといった集積回路など）により構築されてもよい。また、各機能部の処理が１つのハードウェアで実行されてもよいし、複数のハードウェアで実行されてもよい。また、ハンズフリー制御装置１００は、例えば、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）により実現されても良い。

［動作の説明］
図３は、ハンズフリー制御装置１００で実行される音声調整処理の一例を示したフロー図である。かかる処理は、車載器２００の通信装置２１０を介して、ハンズフリー制御装置１００の通信部１０１が近端話者と遠端話者との通話情報を取得すると開始される。

処理を開始すると、解析判定部１０２は、遠端話者が携帯端末を使用しているか否かを判定する（ステップＳ００１）。具体的には、解析判定部１０２は、通話情報に含まれる付加情報（例えば、遠端話者の電話番号）を用いて、遠端話者が携帯端末を使用して通話しているか否かを判定する。そして、携帯端末を使用していないと判定した場合（ステップＳ００１でＮｏ）、解析判定部１０２は、遠端話者の音声情報と共に初期パラメータ値の設定指示をパラメータ設定部１０３に出力する。この場合、パラメータ設定部１０３は、所定の初期パラメータ値を設定し（ステップＳ００６）、処理をステップＳ００４に移行する。

一方で、携帯端末を使用していると判定した場合（ステップＳ００１でＹｅｓ）、解析判定部１０２は、処理をステップＳ００２に移行する。

ステップＳ００２では、解析判定部１０２は、遠端話者の通話形態判定処理を行う。具体的には、解析判定部１０２は、遠端話者の音声情報を解析して、通話形態がハンズフリー通話かハンドセット通話かを判定する。

図４は、通話形態判定処理の一例を示したフロー図である。かかる処理を開始すると、解析判定部１０２は、所定の解析対象について解析を行う。具体的には、解析判定部１０２は、ＳＮレベルを解析する（ステップＳ０１１）。より具体的には、解析判定部１０２は、遠端話者の音声情報を音源分離し、遠端話者の音声を示すＳ（Ｓｉｇｎａｌ）レベル（単位はｄｂ：デシベル）と、環境音などのノイズを示すＮ（Ｎｏｉｓｅ）レベル（単位はｄｂ：デシベル）とを各々解析する。ＳＮレベルの解析は、既存の周知技術のため、詳細な説明は省略する。なお、携帯端末でのハンズフリー通話では、周囲の環境音がノイズとして集音されやすいため、ハンドセット通話に比べてＳレベルが小さく、Ｎレベルが大きくなる傾向がある。

次に、解析判定部１０２は、ノイズ安定度を解析する（ステップＳ０１２）。具体的には、解析判定部１０２は、音源分離したノイズデータの中で突発的な音（例えば、それ以前のノイズの平均値に比べて瞬間的にＮレベルの高い音）が含まれているか否かを解析する。ノイズデータの中から突発的な音を検知する技術は既存の周知技術のため、詳細な説明は省略する。なお、携帯端末でのハンズフリー通話では、環境音を拾いやすいため、例えば遠端話者がハンズフリー通話を利用して運転している場合、道路上のでこぼこやバンプを通過すると突発音が検出される。

次に、解析判定部１０２は、エコー成分のレベルを解析する（ステップＳ０１３）。なお、エコー（Ｅｃｈｏ）とは、近端話者の発話音声が遠端話者の端末４００から出力され、それを遠端話者の端末４００のマイクロフォンが集音して音声情報と共に近端話者の携帯端末３００に送信されることで、遠端話者が発話した音声情報の中に近端話者の発話音声が含まれて聞こえることである。すなわち、エコー成分のレベルとは、遠端話者の音声情報に含まれる近端話者の発話音声の強さのことを指す。

解析判定部１０２は、近端話者の発話音声（リファレンス信号）を車載器２００または車両のマイクロフォン２６０を介して取得し、これを一時的に記憶しておき、所定期間（例えば、数秒間）内に取得した遠端話者の音声情報の中に近端話者の発話音声が含まれているか否かを解析することで、エコー成分の有無およびそのレベルを解析する。エコー成分の解析は、既存の周知技術のため、詳細な説明は省略する。なお、携帯端末でのハンドセット通話の場合、受話器のスピーカは耳に近接しているため、スピーカから出た音は周囲に広がり難い。そのため、ハンドセット通話の場合には、遠端話者の端末４００のマイクロフォンが近端話者の発話音声を拾うことは無く、エコーが発生することはほぼ無い。一方で、携帯端末でのハンズフリー通話では、マイクロフォンが近接話者の発話音声を拾いやすく、エコーが発生しやすい。

次に、解析判定部１０２は、各解析対象の解析結果に基づいて、遠端話者がハンズフリー通話か否かを判定する（ステップＳ０１４）。具体的には、ステップＳ０１１、ステップＳ０１２およびステップＳ０１３の各々の解析結果について、所定の条件が満たされているか否かを判定する。

より具体的には、解析判定部１０２は、ステップＳ０１１で解析したＳレベルとＮレベルとを比較し、ＳレベルとＮレベルの差が所定デシベル（例えば、２０デシベル）以下であるという条件が満たされているか否かを判定する。

また、解析判定部１０２は、ステップＳ０１２で解析したノイズ安定度について、遠端話者の音声情報の中に突発音が入り込んでいるという条件が満たされているか否かを判定する。

また、解析判定部１０２は、ステップＳ０１３で解析したエコー成分のレベルと近端話者の車内における発話音声（リファレンス信号）のレベルとが、ほぼ同レベル（例えば、エコー成分のレベルとリファレンス信号のレベルとの差が所定値未満）であるという条件が満たされているか否かを判定する。

そして、解析判定部１０２は、全ての条件が満たされていると判定した場合、遠端話者の通話形態がハンズフリー通話であると判定する。なお、判定基準はこれに限定されるものではなく、例えばこれらの条件のうち、少なくともいずれか一つが上記条件よりも高い条件（例えば、ＳＮレベルの判定のみ条件が満たされている場合、ＳレベルとＮレベルの差が１０デシベル以下の場合、あるいはノイズ安定度の判定のみ条件が満たされている場合、検出された突発音の数が１０回を超える場合、あるいはエコー成分のレベルの判定のみ条件が満たされている場合、エコー成分のレベルと近端話者のリファレンス信号のレベルとの差が上記の所定値よりも小さい場合など）を満たしている場合に遠端話者の通話形態がハンズフリー通話であると判定しても良い。

解析判定部１０２は、遠端話者の通話形態がハンズフリー通話ではないと判定した場合（ステップＳ０１４でＮｏ）、所定の初期パラメータ値の設定指示をパラメータ設定部１０３に出力し（ステップＳ０１６）、音声調整処理のステップＳ００３に移行する。一方で、遠端話者の通話形態がハンズフリー通話であると判定した場合（ステップＳ０１４でＹｅｓ）、解析判定部１０２は、初期パラメータ値に変更を加えた合成パラメータの設定指示をパラメータ設定部１０３に出力し（ステップＳ０１５）、処理を音声調整処理のステップＳ００３に移行する。

図３の音声調整処理のフローに戻って説明する。ステップＳ００３では、パラメータ設定部１０３は、パラメータの設定を行う。具体的には、パラメータ設定部１０３は、解析判定部１０２から取得した指示に従って、初期パラメータまたは合成パラメータを設定する。

ここで、合成パラメータの設定について説明する。なお、合成パラタメータの設定方法については、最適版と簡易版の２種類ある。最適版は、ステップＳ０１１〜ステップＳ０１３の解析対象に対する解析結果を考慮し、フィードバックを掛けながら随時、解析対象が適切なレベルとなるようにパラメータ値の調整を行うことで最適なパラメータ値を算出し設定する方法である。また、簡易版は、他の解析対象に対する解析結果を考慮せず、遠端話者の音声情報がより聞き取り易くなるような固定値をパラメータ値として設定する方法である。なお、いずれの方法を用いるかは、演算装置１１０の性能に応じて決定されれば良い。

最適版の合成パラメータの設定について具体的に説明する。パラメータ設定部１０３は、ステップＳ０１１で解析されたＳレベルとＮレベルの値を参照し、ＳレベルおよびＮレベルごとに個別にパラメータ値を調整する。具体的には、パラメータ設定部１０３は、既存のノイズキャンセラやノイズサプレッサといった周知技術を用いてＮレベルを低減させ、Ｓレベルを基準レベル近くまで引き上げるようなパラメータ値を算出する。

また、パラメータ設定部１０３は、ステップＳ０１２で解析された突発的に発生するノイズのレベルを下げるようなパラメータ値を算出する。なお、パラメータ設定部１０３は、突発音の発生回数や突発音のレベルを解析結果から特定し、これらに応じたパラメータ値を算出する。

また、パラメータ設定部１０３は、ステップＳ０１３で解析されたエコー成分のレベルを低減させるパラメータ値を算出する。なお、エコー成分は、いわゆるダブルトーク（エコー成分を消去する際に、かかるエコー成分に重なっている遠端話者の音声情報まで消去されてしまう現象）と相互に影響し合うため、フィードバックを掛けてパラメータ値を調整する。

このように、最適版の合成パラメータの設定によれば、各解析対象のレベルがより最適値となるようなパラメータ値を算出し設定することができる。その結果、遠端話者の音声情報がより聞き取りやすく調整される。

また、簡易版の合成パラメータの設定について具体的に説明する。パラメータ設定部１０３は、各解析対象のレベル（ＳＮレベル、突発音のレベルおよびエコー成分のレベル）が所定値（固定値）となるようにパラメータ値を設定する。

このように、簡易版の合成パラメータの設定によれば、固定値に基づいた負荷の少ない処理に基づき、遠端話者の音声情報が聞き取りやすく調整される。最適版の合成パラメータが設定された場合に比べて音声品質の改善率は低いが、初期パラメータが設定された場合に比べて遠端話者の音声情報は聞き取りやすく改善される。

図３に戻って説明する。ステップＳ００３においてパラメータ設定部１０３によりパラメータが設定されると、パラメータ設定部１０３は、遠端話者の音声情報と共に設定したパラメータ値を音声調整部１０４に出力する。

次に、音声調整部１０４は、設定されたパラメータ値を用いて、遠端話者の音声情報を調整し（ステップＳ００４）、調整後の音声情報をスピーカ２５０から出力させる。

次に、通信部１０１は、通話が終了したか否かを通話情報の受信に基づき判定し（ステップＳ００５）、通話が終了していないと判定すると（ステップＳ００５でＮｏ）、処理をステップＳ００１に移行する。なお、移行後に行うステップＳ００１の処理は既に判定済みのため、遠端話者が携帯端末を使用しているか否かの判定は省略し、前回の判定結果に従って以後の処理に移行しても良い。一方で、通話が終了したと判定すると（ステップＳ００５でＹｅｓ）、通信部１０１は、本フローの処理を終了する。

以上、音声調整処理について説明した。

このようなハンズフリー制御装置１００によれば、通話相手の通話状況に応じて、より最適な通話音声に調整することができる。特に、ハンズフリー制御装置１００は、ハンズフリー通話時に表れる特有の特徴を解析対象とし、かかる解析対象であるＳＮレベル、ノイズ安定性およびエコー成分のレベルについて解析し、この解析結果に基づいて遠端話者がハンズフリー通話を利用しているか否かを判定する。そして、このような解析および判定結果に応じて、ハンズフリー通話の場合とハンドセット通話の場合とで異なるパラメータ値を設定し、遠端話者の音声情報を調整する。これにより、近端話者にとってより聞き取りやすい遠端話者の音声情報を出力することができる。

なお、前述の実施形態では、遠端話者の通話形態を特定し、かかる通話形態に応じて近端話者が聞き取り易くなるように遠端話者の音声情報を調整するハンズフリー制御装置１００について説明したが、本発明はこれに限られるものではない。例えば、ハンズフリー制御装置１００は、遠端話者が聞き取り易いように近端話者の音声情報を調整しても良い。

具体的には、音声調整部１０４は、車載器２００あるいは車両が備えるマイクロフォン２６０を介して近端話者の音声情報を取得すると、ハンズフリー通話を利用している近端話者の音声情報を遠端話者が聞き取り易くなるように所定のパラメータ値を用いて近端話者の音声情報を調整し、通信部１０１に出力する。また、通信部１０１は、例えば車載器２００の通信装置２１０を介して、調整された近端話者の音声情報を遠端話者に送信する。なお、かかるパラメータ値は、予め記憶装置１２０に格納されていれば良い。

このようなハンズフリー制御装置１００によれば、ハンズフリー通話を行っている近端話者の音声情報を調整することができ、遠端話者にとっても近端話者の音声情報が聞き取りやすくなる。

また、前述の実施形態におけるステップＳ０１３でエコー成分のレベルを解析したが、これをダブルトークの解析に置き換えても良い。あるいは、エコー成分およびダブルトークの両方を解析するようにしても良い。

ダブルトークの解析では、解析判定部１０２は、通信部１０１が車載器２００の通信装置２１０を介して遠端話者に近端話者の音声情報を送信してから所定期間内に遠端話者から受信した音声情報を解析する。そして、解析判定部１０２は、かかる音声情報に無音（ノイズ音も含まない）区間あるいはＳレベルが著しく低い音声情報が含まれているか否かを解析する。そして、ＳＮレベル、ノイズ安定度およびダブルトークの各解析で、無音やＳレベルが著しく小さいという条件を満たしていると判定した場合であって、ＳＮレベルおよびノイズ安定度についても条件が満たされていると判定した場合、解析判定部１０２は、遠端話者がハンズフリー通話であると判定する（ステップＳ０１４でＹｅｓ）。

なお、この場合、パラメータ設定部１０３は、ステップＳ００３の処理において、エコー成分のレベルを下げる調整量を小さくし、エコー成分の調整によって遠端話者の音声情報まで消えてしまうダブルトークの発生を低減させるためのパラメータ値を設定する。

このようなダブルトークの解析を加えることで、遠端話者がハンズフリー通話であるか否かの判定精度を高めることができる。

また、本発明は、上記の実施形態や変形例などに限られるものではなく、これら以外にも様々な実施形態および変形例が含まれる。例えば、上記の実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施形態の構成の一部を他の実施形態や変形例の構成に置き換えることが可能であり、ある実施形態の構成に他の実施形態の構成を加えることも可能である。また、各実施形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。

１００・・・ハンズフリー制御装置、１０１・・・通信部、１０２・・・解析判定部、１０３・・・パラメータ設定部、１０４・・・音声調整部、２００・・・車載器、２１０・・・車載器の通信装置、２５０・・・スピーカ、２６０・・・マイクロフォン、３００・・・近端話者の携帯端末、４００・・・遠端話者の端末、１１０・・・演算装置、１２０・・・記憶装置、１３０・・・ハンズフリー制御装置の通信装置、１４０・・・記憶装置および演算装置間のバス、１５０・・・通信装置および演算装置間のバス

Claims

遠端話者の音声情報を取得する通信部と、
ハンズフリー通話時に表れる特有の特徴を解析対象とし、前記音声情報を用いて前記解析対象を解析する解析部と、
前記遠端話者がハンズフリー通話を利用していることを前記解析結果が示す場合、前記遠端話者の音声情報を近端話者が聞き取りやすくなる音声調整のためのパラメータを設定するパラメータ設定部と、
設定された前記パラメータに基づいて、前記遠端話者の音声情報を調整する音声調整部と、を備える
ことを特徴とするハンズフリー制御装置。
請求項１に記載のハンズフリー制御装置であって、
前記解析部は、
遠端話者の前記音声情報に含まれる音声レベルとノイズレベルとの差分を示すＳＮレベルと、前記音声情報に突発音が含まれているか否かを示すノイズ安定度と、前記音声情報に近端話者の発話音声であるエコー成分が含まれている場合にそのレベルを示すエコー成分のレベルと、を前記解析対象として前記音声情報を解析する
ことを特徴とするハンズフリー制御装置。
請求項１または２に記載のハンズフリー制御装置であって、
前記解析対象の解析結果を判定する判定部をさらに備え、
前記判定部によって前記解析対象が所定の条件を満たしていないと判定された場合、前記パラメータ設定部は、所定の第１のパラメータを設定し、
前記判定部によって前記解析対象が前記所定の条件を満たしていると判定された場合、前記パラメータ設定部は、前記解析結果に基づいた第２のパラメータを設定する
ことを特徴とするハンズフリー制御装置。
請求項３に記載のハンズフリー制御装置であって、
前記判定部は、
前記解析対象が全ての所定の条件を満たしていることを前記解析結果が示す場合、遠端話者がハンズフリー通話を利用していると判定する
ことを特徴とするハンズフリー制御装置。
請求項１〜４のいずれか一項に記載のハンズフリー制御装置であって、
前記音声調整部は、
遠端話者がハンズフリー通話を利用していることを前記解析結果が示す場合、近端話者が聞き取りやすくなる音声調整のための所定のパラメータを用いて近端話者の音声情報を調整し、
前記通信部は、前記調整された近端話者の音声情報を遠端話者に送信する
ことを特徴とするハンズフリー制御装置。
コンピュータを、ハンズフリー制御装置として機能させるプログラムであって、
前記コンピュータを、
遠端話者の音声情報を取得する通信部と、
ハンズフリー通話時に表れる特有の特徴を解析対象とし、前記音声情報を用いて前記解析対象を解析する解析部と、
前記遠端話者がハンズフリー通話を利用していることを前記解析結果が示す場合、前記遠端話者の音声情報を近端話者が聞き取りやすくなる音声調整のためのパラメータを設定するパラメータ設定部と、
設定された前記パラメータに基づいて、前記遠端話者の音声情報を調整する音声調整部と、して機能させる
ことを特徴とするプログラム。
請求項６に記載のプログラムであって、
前記解析部は、
遠端話者の前記音声情報に含まれる音声レベルとノイズレベルとの差分を示すＳＮレベルと、前記音声情報に突発音が含まれているか否かを示すノイズ安定度と、前記音声情報に近端話者の発話音声であるエコー成分が含まれている場合にそのレベルを示すエコー成分のレベルと、を前記解析対象として前記音声情報を解析する
ことを特徴とするプログラム。
請求項６または７に記載のプログラムであって、
前記コンピュータを、
前記解析対象の解析結果を判定する判定部としてさらに機能させ、
前記判定部によって前記解析対象が所定の条件を満たしていないと判定された場合、前記パラメータ設定部は、所定の第１のパラメータを設定し、
前記判定部によって前記解析対象が前記所定の条件を満たしていると判定された場合、前記パラメータ設定部は、前記解析結果に基づいた第２のパラメータを設定する
ことを特徴とするプログラム。