JP2010177961A

JP2010177961A - 通信機器及び通信システム

Info

Publication number: JP2010177961A
Application number: JP2009017326A
Authority: JP
Inventors: Yasuhiro Katayama; 泰宏片山; Juichi Hiramoto; 寿一平本
Original assignee: Kyocera Corp
Current assignee: Kyocera Corp
Priority date: 2009-01-28
Filing date: 2009-01-28
Publication date: 2010-08-12

Abstract

【課題】ユーザに正確な意図を伝えることが可能な通信機器及び通信システムを提供すること。
【解決手段】外部より音声データを受信するメインアンテナ８６と、メインアンテナ８６によって外部より受信された音声データを認識する音声認識装置５２と、音声データを文字データへ変換する制御部４０と、制御部４０によって変換された文字データを表示する表示部２１と、メインアンテナ８６より受信した音声データが不明瞭であると音声認識装置５２が認識した場合、通信相手に向けて、受信した音声データが不明瞭であることに基づく所定のデータを送信するＲＦ回路部５８送信部とを備える。
【選択図】図３

Description

本発明は、携帯電話等の通信機器及び通信システムに関する。

近年、音声認識機能を有する電話が多数開発されている。例えば、特許文献１には、留守番電話機能を有する電話機において、録音された音声データを文字データへと変換し、当該文字データを表示することによってユーザの利便性を図る技術が記載されている。そして、この音声認織機能による音声データの文字データへの変換機能は、耳の不自由な人の為の携帯電話に用いられることがある。例えば、通話時において、話し相手の音声を文字に変換して表示することによって、耳の不自由な人が話し相手の意図を認識できるという技術が知られている。

特開平３−１０８８５６号公報

しかしながら、前述した技術においては、話し相手の発音が不明瞭であった場合などは、音声認識機能が誤変換をしてしまい、話し相手の意図がユーザに対して正確に伝わらないという問題があった。

本発明は、ユーザに正確な意図を伝えることが可能な通信機器及び通信システムを提供することを目的とする。

本発明に係る通信機器は、外部機器から送信されてきたデータを受信する受信部と、前記受信部によって受信されたデータが音声データであるかどうかを認識する認識部と、当該音声データを文字データへ変換する変換部と、前記変換部によって変換された文字データを表示する表示部と、前記受信部より受信したデータが音声データとして不明瞭であると前記認識部が認識した場合、前記外部機器に向けて、音声データが不明瞭である旨を示す所定のデータを送信する送信部と、を備える。

また、上記通信機器では、前記所定のデータは、前記音声データが不明瞭である旨を示す音声データであることが好ましい。

また、上記通信機器では、前記変換部が一定時間以上音声データを認識しなかった場合、前記表示部は、音声データを一定時間認識していない旨を表示することが好ましい。

本発明に係る通信システムは、第１の通信機器と、第２の通信機器と、を含む通信システムであって、前記第１の通信機器は、前記第２の通信機器よりデータを受信する第１受信部と、前記第１受信部によって受信されたデータが音声データであるかどうかを認識する認識部と、当該音声データを文字データへ変換する変換部と、前記変換部によって変換された文字データを表示する第１表示部と、前記第１受信部より受信したデータが音声データとして不明瞭であると前記認識部が認識した場合、前記第２の通信機器に向けて、音声データが不明瞭である旨を示す所定のデータを送信する第１送信部と、を備え、前記第２の通信機器は、外部からの音声の入力を所定の集音の感度により受付ける音声入力部と、外部から受付けた前記音声を音声データへ変換する音声データ変換部と、前記音声データを前記第１の通信機器へ送信する第２送信部と、前記第１の通信機器から送信された前記所定のデータを受信する第２受信部と、当該第２受信部が前記所定のデータを受信したとき、所定の制御を行う第２制御部と、を備える。

また、上記通信システムでは、前記所定のデータは、人間の声を強調する周波数特性又は周辺ノイズの利得を下げる周波数特性の少なくとも一方を有するイコライジングデータであり、前記第２制御部は、前記イコライジングデータに基づいた周波数特性になるように前記音声入力部による前記集音の感度の制御を行うことが好ましい。

また、上記通信システムでは、前記所定のデータは、前記第１受信部が受信した音声データが不明瞭である旨の音声データであり、前記第２制御部は、当該音声データを音声にして出力することが好ましい。

本発明によれば、音声データを文字データに変換して表示部に表示する機能を備えることにより、通信相手の正確な意図を伝えることが可能となる。

本発明の第１実施形態に係る通話システムの構成を示す図である。本発明に係る携帯電子機器の一例である携帯電話装置１の外観を示す斜視図である。携帯電話装置１の機能を示す機能ブロック図である。制御部４０の機能を示すブロック図である。通話中において音声アナウンスを行う際の処理手順を示すフローチャートである。モード設定画面の一例を示す説明図である。通話中における相手先からの音声データに基づく文字表示例を示す説明図である。通話中における相手先からの音声データに基づく文字表示例を示す説明図である。本発明の第２実施形態に係る携帯電子機器における制御部４０の機能を示すブロック図である。機種判別部９０の処理を示すフローチャートである。周波数特性調整部９２の処理を示すフローチャートである。第２実施形態における、通話中において音声アナウンスを行う際の処理手順を示すフローチャートである。

以下、本発明の実施形態について説明する。

まず、本発明の第１実施形態について説明する。図１は、第１実施形態に係る通話システムの構成を示す図である。複数の携帯電話装置１（第１の通信機器および第２の通信機器）は、基地局５およびネットワーク６を介して互いに接続される。いずれか１つの携帯電話装置１においてユーザ操作によって発呼操作が行われた場合、発信者側の携帯電話装置１に近い基地局５に相手先電話番号のデータが送信される。さらに、発信者側の携帯電話装置１に近い基地局５からネットワーク６に相手先電話番号のデータが送信され、ネットワーク６からは、電話番号に対応する相手側の携帯電話装置１に近い基地局５を介して、相手側の携帯電話装置１に着信要求が送信される。そして、相手側の携帯電話装置１において着信を受ける操作が行われた場合に、発信者側の携帯電話装置１と相手側の携帯電話装置１との間で通話が可能となる。

図２は、本発明に係る通信機器の一例である携帯電話装置１の外観を示す斜視図である。なお、図１は、いわゆる折り畳み型の携帯電話装置の形態を示しているが、本発明に係る携帯電話装置の形態としては特にこれに限られない。例えば、両筐体を重ね合わせた状態から一方の筐体を一方向にスライドさせるようにしたスライド式や、重ね合せ方向に沿う軸線を中心に一方の筐体を回転させるようにした回転式（ターンタイプ）や、操作部と表示部とが１つの筐体に配置され、連結部を有さない形式（ストレートタイプ）でも良い。

携帯電話装置１は、操作部側筐体部２と、表示部側筐体部３と、を備えて構成される。操作部側筐体部２は、表面部１０に、操作部１１と、携帯電話装置１の使用者が通話時に発した音声が入力されるマイク１２と、を備えて構成される。操作部１１は、各種設定や電話帳機能やメール機能等の各種機能を作動させるための機能設定操作キー１３と、電話番号の数字やメール等の文字等を入力するための入力操作キー１４と、各種操作における決定やスクロール等を行う決定操作キー１５と、から構成されている。

また、表示部側筐体部３は、表面部２０に、各種情報を表示するためのＬＣＤ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）表示部２１と、通話の相手側の音声を出力するスピーカ２２と、を備えて構成されている。

また、操作部側筐体部２の上端部と表示部側筐体部３の下端部とは、ヒンジ機構４を介して連結されている。また、携帯電話装置１は、ヒンジ機構４を介して連結された操作部側筐体部２と表示部側筐体部３とを相対的に回転することにより、操作部側筐体部２と表示部側筐体部３とが互いに開いた状態（開放状態）にしたり、操作部側筐体部２と表示部側筐体部３とを折り畳んだ状態（折畳み状態）にしたりできる。

また、図３は、携帯電話装置１の機能を示す機能ブロック図である。携帯電話装置１には、図３に示すように、マイク１２と、表示部２１と、スピーカ２２と、制御部４０と、音声認識装置５２と、メモリ５４と、ＤＳＰ５６と、ＲＦ回路部５８、Ａ／Ｄ変換器６０と、Ｄ／Ａ変換器６２とが表示部側筐体部３に備えられている。なお、図１に示す通信システムにおいては、図３に示す携帯電話装置１において音声認識装置５２がないもの、すなわち詳細については後述するが、受信した音声データを文字データに変換して表示部２１に表示する機能がない携帯電話装置１であっても適用可能であることは言うまでもない。

ＤＳＰ５６には、フィルタ／利得回路部７０、７２と、エンコーダ７４と、デコーダ７６と、音声検出部７８と、レベル測定部８０が備えられている。ＲＦ回路部５８には、変調部８２と、復調部８４とが備えられている。

ＲＦ回路部５８は、メインアンテナ８６によって受信した信号を復調部８４において復調処理し、処理後の信号をＤＳＰ７４に供給する。そして、ＤＳＰ７４から供給された信号を変調部８２において変調処理し、メインアンテナ８６を介して基地局５に送信する。このように、ＲＦ回路部５８及びメインアンテナ８６は、外部機器（携帯電話装置１）から送信されてきたデータを受信する受信部、及び外部機器（携帯電話装置１）に向けて、データを送信する送信部として機能する。

復調部８４によって復調処理された受信信号は、デコーダ７６によって復号化され、フィルタ／利得回路部７２、音声検出部７８、レベル測定部８０に送信される。音声検出部７８においては、デコーダ７６からの信号に基づいて音声データの状態が検出される。例えば、音声検出部７８では、音声の有無や音声の抑揚などが検出される。レベル測定部８０においてはデコーダ７６からの信号のレベルが測定される。音声検出部７８の検出結果のデータ及びレベル測定部８０の測定結果のデータは、デコーダ７６からの音声データとともにフィルタ／利得回路部７０に送られる。

フィルタ／利得回路部７０においては、音声データの信号に対してノイズ除去、ゲイン調整の処理が行われる。フィルタ／利得回路部７２からの音声データ（デジタルデータ）は、Ｄ／Ａ変換器６２によってアナログ信号に変換され、スピーカ２２（第２音声変換部）によって音声出力される。

マイク１２（第２音声入力部）によって入力された音声データは、Ａ／Ｄ変換器６０によってデジタル信号に変換され、フィルタ／利得回路部７０によってノイズ除去、ゲイン調整の処理が行われる。フィルタ／利得回路部７０から出力された音声データの信号はエンコーダ７４によって符号化され、ＲＦ回路部５８、メインアンテナ８６を介して基地局５に送信される。

また、フィルタ／利得回路部７２は、音声認識装置５２に、音声データ（デジタルデータ）および音声検出部７８の検出結果のデータ、レベル測定部８０の測定結果のデータを送信する。音声認識装置５２は、フィルタ／利得回路部７２からの音声データが何の音声であるかを認識する（認識部）。音声認識装置５２は、認識結果を制御部４０に送信する。また、音声認識装置５２は、音声検出部７８の検出結果のデータおよびレベル測定部８０の測定結果のデータに基づいて、通話相手の感情や無音状態であるか否か、さらには保留音のような機械的な音声であるか等を判断し、その判断結果にふさわしい文字を指定するデータを制御部４０に送信する。例えば、音声認識装置５２は、相手が叫んでいると判断した場合には、「！」と表示部２１に表示させるデータを送信する。また、無音であれば、「返答待ちです」と表示部２１に表示させるデータを送信する。また、保留音であれば、「保留中です」と表示部２１に表示させるデータを送信する。なお、音声データの認識結果が認識不可能である場合には、「？」と表示部２１に表示させるデータを送信する。

図４は、制御部４０の機能を示すブロック図であり、制御部４０は、ＣＰＵ５０を備えている。制御部４０は、ＣＰＵ５０の処理によって、変換部４２、音声認識率算出部４４、送信部４６、表示制御部４８として機能する。変換部４２は、音声認識装置５２からの認識結果に基づいて、音声データを文字データに変換する。音声認識率算出部４４は、音声認識装置５２からの認識結果において、不明瞭と認識された結果を以外の認識結果の割合、言い換えると文字データに変換できた認識結果の割合を算出する。送信部４６は、音声認識率算出部４４が求めた音声認識率に応じて、発着信時、通話時において、メモリ５４に記憶されている複数の音声アナウンスデータの中から適宜選択して、エンコーダ７４に送信する。表示制御部４８は、変換部４２によって変換された文字データを表示部２１に表示させる制御を行う。

具体的には、音声認識率算出部４４が求めた音声認識率が予め設定した音声認識率よりも低い場合に、メモリ５４に記憶されている音声アナウンスデータが通話相手の携帯電話装置１に送信される。このため、通話相手の携帯電話装置１からは、相手先の音声の他に、通話相手の携帯電話装置１のメモリ５４に記憶されている音声アナウンスデータに基づく音声が出力される場合がある。

次に、第１実施形態の携帯電話装置１の動作について説明する。まず、着信時の動作について説明する。着信があった場合、着信音および表示部２１によってユーザに着信があることが知らさせる。そして、ユーザ操作により、機能設定操作キー１３（図２参照）が押下されることによって着信に応答し、通話を開始することが可能になる。ここで、通話開始時において、ＣＰＵ５０の制御によって、メモリ５４より音声アナウンスデータが引き出され、この音声アナウンスデータがＤＳＰ５６に送られる。このとき、ＤＳＰ５６は、ＤＳＰ５６内の送話音声パスを、マイク１２から、ＣＰＵ５０からの音声アナウンスデータに切り替えて、送話音声としてＲＦ回路部５８に送出するように制御を行う。これにより、通話相手先の携帯電話装置１からは、ユーザの携帯電話装置１から送信された音声アナウンスデータに基づく音声が出力されるようになる。

通話開始時のアナウンスデータとしては「音声認識装置を使用することの連絡」と「音声認識装置会話時の注意事項（ゆっくり、はっきり話す等）」といった音声ガイダンスがある。そして、音声アナウンス終了後、ＤＳＰ５６は、ＤＳＰ５６内の送話音声パスをマイク１２に切り替えることにより、ユーザは通話相手との間で音声通話を行うことができるようになる。

また、音声アナウンス中であることは、ＣＰＵ５０の制御によって表示部２１に表示される。これにより、通話相手と同様にユーザも音声アナウンス中であることを知ることができる。

なお、発信時における制御も着信時と同様に、発信後に相手が応答すると、ＣＰＵ５０からの音声アナウンスデータが、ＤＳＰ５６、ＲＦ回路部５８を介して、通話相手先の携帯電話装置１に送信される。そして、通話相手先の携帯電話装置１からは、ユーザの携帯電話装置１から送信された音声アナウンスデータに基づいて、音声アナウンスが音声出力されるようになる。

次に、通話中の動作について説明する。通話中においては、音声データが、フィルタ／利得回路部７２、音声認識装置５２に送られる。この時、音声認識装置５２に音声データが送られている間はスピーカ２２へのパスが切断されているので、スピーカ２２からは音は発生しない。音声認識装置５２からは、相手側音声を認識した結果のデータがＣＰＵ５０に送信される。ＣＰＵ５０（変換部）はその結果データを文字データに変換し、表示部２１（表示部）に表示させる。

ところで、音声認識装置が音声を認識できない場合がある。音声認識できないケースとしては、声の大きさ、騒音等を要因とするケースが想定される。第１実施形態においては、音声認識装置５２において受信した音声データが不明瞭であると認識した場合には、「もう一度繰り返して下さい」等という音声アナウンスが自動で返答される。具体的には、ＣＰＵ５０が、音声認識装置５２の認識結果に基づいて、相手側環境の騒音が大きくなってきて音声認識率に影響があるように判断すると「音声認識率が低下しています。もう少し静かな環境に移動して下さい。」等という音声アナウンスがスピーカ２２（第２制御部）によって自動で行われる。また、自動の音声アナウンス中においては、ユーザにもその旨が分かるように、表示部２１に文字が表示される。例えば、表示部２１に「音声認識率が低下しています。もう少し静かな環境に移動して下さい。」という文字が、例えば他の文字色とは異なる色で表示される。

図５は、通話中において音声アナウンスを行う際の処理手順を示すフローチャートである。

図５に示すように、ＣＰＵ５０は、通話中であるか否かを判定し（ステップＳ１０）、通話中の場合には、音声認識率の算出を行う（ステップＳ１２）。この処理が終了した場合には、ステップＳ１４に処理を移す。音声認識率の算出方法としては、例えば、単位時間当たりの音声認識を行った全体の音声認識結果において、音声認識に成功した割合、具体的には、文字データへの変換に成功した割合を算出する。通話が終了した場合には、次の通話まで待機状態とする。

ステップＳ１４において、ＣＰＵ５０は、音声認識エラーが発生したか否かを判定する処理を行う。この処理において、ＣＰＵ５０は、音声認識率が予め設定した基準音声認識率よりも低いと判定した場合に、音声認識エラーが発生したと判定する。音声認識エラーが発生したと判定した場合には、ステップＳ１６に処理を移し、音声認識エラーが発生したと判定しない場合には、ステップＳ１０に処理を移す。

ステップＳ１６において、ＣＰＵ５０は、通信相手側の通話環境によるノイズが大きいか否かを判定する処理を行う。この処理において、ＣＰＵ５０は、例えば、音声認識率が、基準音声認識率よりも低い値に予め設定した音声認識率よりも低いと判定した場合に、通話環境によるノイズが大きいと判定する。通話環境によるノイズが大きいと判定した場合には、ステップＳ２０に処理を移し、通話環境によるノイズが大きいと判定しない場合には、ステップＳ１８に処理を移す。

ステップＳ１８において、ＣＰＵ５０は、メモリ５４に記憶されている複数の音声アナウンスデータにおいて、例えば、「もう一度ゆっくり繰り返してください」という音声アナウンスデータを選択し、ＤＳＰ５６に送信する処理を行う。この処理により、音声アナウンスデータは、通信相手の携帯電話装置１に送信される。音声アナウンスデータを受信した通信相手の携帯電話装置１においては、スピーカ２２より「もう一度ゆっくり繰り返してください」という音声が出力される。この処理が終了した場合には、ステップＳ１０に処理を移す。

ステップＳ２０において、ＣＰＵ５０は、メモリ５４に記憶されている複数の音声アナウンスデータにおいて、例えば、「もう少し静かな環境に移動して下さい」という音声アナウンスデータを選択し、ＤＳＰ５６に送信する処理を行う。この処理により、音声アナウンスデータは、通信相手の携帯電話装置１に送信される。音声アナウンスデータを受信した通信相手の携帯電話装置１においては、スピーカ２２より「もう少し静かな環境に移動して下さい」という音声が出力される。この処理が終了した場合には、ステップＳ１０に処理を移す。

次に、表示部２１における表示例について、図６〜図８を用いて説明する。図６はモード設定画面の一例を示す説明図である。携帯電話装置１の設定メニューの１つに、モード設定画面があり、その中に、難聴者サポートモードのオン、オフを設定する項目がある。難聴者サポートモードがオンの場合には、通話相手の音声データを文字データに変換して表示部２１に表示する機能が実行される。

図７は通話中における相手先からの音声データに基づく文字表示例を示す説明図である。図７は、電話をかけた者（以下、発呼者と称する）の携帯電話装置１が難聴者サポートモードに設定されている場合を示すものである。通話相手（以下、着呼者と称する）が着信操作を行うと、発呼者の携帯電話装置１から、通話開始時の音声ガイダンスの音声データが着呼者の携帯電話装置１に送信され、着呼者の携帯電話装置１からは音声ガイダンスが出力される。

例えば、「この電話は、特許太郎さんからです。相手先は、難聴者サポートモードであり、あなたの声が、相手先に文字表示されます。このため、できるだけ静かな場所で通話していただけますようお願いいたします。それでは、通話を開始します。」という音声が、着呼者の携帯電話装置１から出力される。発呼者の携帯電話装置１の表示部２１においては、着呼者の携帯電話装置１に対して音声ガイダンスを出力している間に「音声アナウンス中」という表示が行われ、音声ガイダンスが終了すると「音声アナウンス終了」という表示が行われる。

そして、着呼者の携帯電話装置１から「もしもし」という音声データが送信されると、発呼者の携帯電話装置１の表示部２１には「もしもし」と文字表示される。さらに、発呼者が「特許花子さんでしょうか」と話した場合、着呼者の携帯電話装置１からは「特許花子」と音声出力されるが、このとき発呼者の、携帯電話装置１の表示部２１においては、文字表示は行われない。

また、発呼者の携帯電話装置１の表示部２１においては、文字としてひらがなが、音声認識された通りに表示される。このため、着呼者の発音によっては、正確に文字表示されない場合がある。例えば、着呼者の携帯電話装置１からは「特許太郎さんあっ、どうもこんにちは」と返答した場合、発呼者の携帯電話装置１の表示部２１には「とっきょたろおさんあっ！どうもこんにちわ」と文字表示される場合がある。このような正確に文字表示されない場合においては、ＣＰＵ５０は、文字データの変換に成功したものと見なし、音声認識率は低下しない。なお、ＣＰＵ５０は、文字データに変換できなかった音声データついては、「？」といった文字を携帯電話装置１の表示部２１に表示させる。

図８は、発呼者の携帯電話装置１が難聴者サポートモードに設定されており、着呼者の携帯電話装置１の通話環境が悪い場合を示すものである。例えば、着呼者が、工事現場の近くや駅のホームといったノイズが多い場所にいるときに、発呼者の携帯電話装置１からの着信を受けたとする。そして、着呼者の携帯電話装置１から「もしもし」という音声データが送信されたが、発呼者の携帯電話装置１において、音声データに含まれるノイズの影響によって音声認識ができずに文字データへの変換が行われなかったとする。この場合、表示部２１には「もし？？？？？」と文字表示される。

その後の通話において、文字データに変換できないことが多くなり、音声認識率が低下して基準音声認識率より低くなった場合に、音声ガイダンスの音声データが着呼者の携帯電話装置１に送信され、着呼者の携帯電話装置１からは音声ガイダンスが出力される。例えば、「もう一度ゆっくりと繰り返して下さい」という音声が、着呼者の携帯電話装置１から出力される。発呼者の携帯電話装置１の表示部２１においては、着呼者の携帯電話装置１に対して音声ガイダンスを出力している間に「「もう一度ゆっくりと繰り返して下さい」と返答しました」という表示が行われる。そして、音声ガイダンスを聞いた着呼者が、声の出し方を改めたり、ボリューム調節などを行うことによって、通話状態を良好にすることができる。

しかし、依然として、発呼者の携帯電話装置１において、音声データに含まれるノイズの影響によって音声認識ができずに文字データへの変換が行われなかった場合には、さらに音声認識率が低下して基準音声認識率よりさらに低い音声認識になった場合には、「音声アナウンス中「もう少し静かな環境に移動してください」という音声が、着呼者の携帯電話装置１から出力される。一方、発呼者の携帯電話装置１の表示部２１においては、「音声アナウンス中「もう少し静かな環境に移動してください」と返答しました」という表示が行われる。そして、音声ガイダンスを聞いた着呼者が、騒音の少ない通話場所に移動することによって、通話状態を良好にすることができる。

このように、第１実施形態によれば、通話相手に音声が不明瞭であることを伝えることが可能となるため、通話相手に通話環境を変える必要があることを喚起させることが可能になり、通話相手は、はっきり話す、ボリューム調節を行う、場所を変える、といった措置をとることが可能となる。

また、発呼者にとっては、相手先の音声が文字に変換されて表示部２１に表示されるため、相手先が話す内容が視覚的に認識することが可能となり、特に、難聴者に対して、使い勝手の良いサポートを提供することが可能となる。

次に、本発明の第２実施形態に係る携帯電話装置について説明する。第２実施形態の携帯電話装置１は、図４に示す第１実施形態の携帯電話装置１の制御部４０の機能に、さらに、図９に示すように、通話相手先の携帯電話装置１の機種を判別する機種判別部９０としての機能、及びイコライジングデータに基づいてフィルタ／利得回路部７２を自動調整する周波数特性調整部９２としての機能を持たせたものである。それ以外は、第１実施形態と同一である。

図１０は機種判別部９０の処理を示すフローチャートである。通話相手先の携帯電話装置１が、発呼者の携帯電話装置１による着信を受付けた場合、通話相手先の携帯電話装置１から、通話相手先の携帯電話装置１の機種情報が発呼者の携帯電話装置１に送信される。発呼者の携帯電話装置１が通話相手先の携帯電話装置１の機種情報を受信すると（ステップＳ３０）、ＣＰＵ５０は、通話相手先の携帯電話装置１が、発呼者側の携帯電話装置１が有する周波数特性調整部９２の機能と同一の機能を備えている機種であるか否かを判別する処理を行う（ステップＳ３２）。ＣＰＵ５０が、通話相手先の携帯電話装置１が難聴者サポートモードと同一の機能を備えている機種であると判別した場合には、ステップＳ３４に処理を移す。ＣＰＵ５０が、通話相手先の携帯電話装置１が周波数特性調整部９２の機能と同一の機能を備えている機種であると判別しない場合には、ステップＳ３６に処理を移す。

ステップＳ３４において、ＣＰＵ５０は、通話相手先の携帯電話装置１が周波数特性調整部９２の機能と同一の機能を備えているか否かを識別する機種フラグをオンにする処理を行う。この処理が終了した場合には、機種判別部９０による処理を終了する。

ステップＳ３６において、ＣＰＵ５０は、通話相手先の携帯電話装置１が周波数特性調整部９２の機能と同一の機能を備えているか否かを識別する機種フラグをオフにする処理を行う。この処理が終了した場合には、機種判別部９０による処理を終了する。

すなわち、通話相手先の携帯電話装置１が周波数特性調整部９２の機能と同一の機能を備えている場合には、機種フラグがオンになり、備えていない場合には、機種フラグがオフになる。

図１１は周波数特性調整部９２の処理を示すフローチャートである。携帯電話装置１がイコライジングデータを受信すると（ステップＳ４０）、ＣＰＵ５０（第２制御部）は、受信したイコライジングデータに基づいてフィルタ／利得回路部７０の調整を自動的に行うように制御する。すなわち、ＣＰＵ５０によってマイク１２（第２音声入力部）の集音感度の制御が行われる。この処理が終了した場合には、周波数特性調整部９２による処理を終了する。

図１２は、通話中において音声アナウンスを行う際の処理手順を示すフローチャートである。

図１２に示すように、ＣＰＵ５０は、通話中であるか否かを判定し（ステップＳ５０）、通話中の場合には、音声認識率の算出を行う（ステップＳ５２）。この処理が終了した場合には、ステップＳ５４に処理を移す。音声認識率の算出方法としては、例えば、単位時間当たりの音声認識を行った全体の音声認識結果において、文字データへの変換に成功した割合を算出する。通話が終了した場合には、次の通話まで待機状態とする。

ステップＳ５４において、ＣＰＵ５０は、音声認識エラーが発生したか否かを判定する処理を行う。この処理において、ＣＰＵ５０は、音声認識率が、予め設定した基準音声認識率よりも低いと判定した場合に、音声認識エラーが発生したと判定する。音声認識エラーが発生したと判定した場合には、ステップＳ５６に処理を移し、音声認識エラーが発生したと判定しない場合には、ステップＳ５０に処理を移す。

ステップＳ５６において、ＣＰＵ５０は、通信相手側の通話環境によるノイズが大きいか否かを判定する処理を行う。この処理において、ＣＰＵ５０は、例えば、音声認識率が、基準音声認識率よりも低い値に予め設定した音声認識率よりも低いと判定した場合に、通話環境によるノイズが大きいと判定する。通話環境によるノイズが大きいと判定した場合には、ステップＳ６４に処理を移し、通話環境によるノイズが大きいと判定しない場合には、ステップＳ５８に処理を移す。

ステップＳ５８において、ＣＰＵ５０は、機種フラグがオンであるか否かを判定する処理を行う。ＣＰＵ５０が、機種フラグがオンであると判定した場合には、ステップＳ６０に処理を移し、機種フラグがオンであると判定しない場合には、ステップＳ６２に処理を移す。

ステップＳ６０において、ＣＰＵ５０は、人間の声を強調するイコライジングデータをＤＳＰ５６に送信する処理を行う。このイコライジングデータは、通話相手の携帯電話装置１に送信され、通話相手の携帯電話装置１においては、ＣＰＵ５０の制御によって、受信したイコライジングデータに基づいて、人間の声を強調するような周波数特性になるようにフィルタ／利得回路部７２を自動的に調整する処理が行われる。この処理が終了した場合には、ステップＳ５０に処理を移す。

ステップＳ６２において、ＣＰＵ５０は、メモリ５４に記憶されている音声アナウンスパターンのデータにおいて、例えば、「もう一度ゆっくり繰り返してください」というデータを選択し、ＤＳＰ５６に送信する処理を行う。この処理が終了した場合には、ステップＳ５０に処理を移す。

ステップＳ６４において、ＣＰＵ５０は、機種フラグがオンであるか否かを判定する処理を行う。ＣＰＵ５０が、機種フラグがオンであると判定した場合には、ステップＳ６６に処理を移し、機種フラグがオンであると判定しない場合には、ステップＳ６８に処理を移す。

ステップＳ６６において、ＣＰＵ５０は、周辺ノイズの利得を下げるイコライジングデータをＤＳＰ５６に送信する処理を行う。このイコライジングデータは、通話相手の携帯電話装置１に送信され、通話相手の携帯電話装置１においては、ＣＰＵ５０の制御によって、受信したイコライジングデータに基づいて、周辺ノイズの利得を下げる周波数特性になるようにフィルタ／利得回路部７２を自動的に調整する処理が行われる。この処理が終了した場合には、ステップＳ５０に処理を移す。

ステップＳ６８において、ＣＰＵ５０は、メモリ５４に記憶されている音声アナウンスパターンのデータにおいて、例えば、「もう少し静かな環境に移動して下さい」というデータを選択し、ＤＳＰ５６に送信する処理を行う。この処理が終了した場合には、ステップＳ１０に処理を移す。

すなわち、通話相手先の携帯電話装置１が周波数特性調整部９２の機能と同一の機能を備えている場合には、例えば、発呼者の携帯電話装置１から着呼者の携帯電話装置１にイコライジングデータが送信され、着呼者の携帯電話装置１においては、イコライジングデータに基づいて周波数特性が自動調整される。これにより、着呼者が特段の操作を行うことなく、着呼者の携帯電話装置１において、発呼者の携帯電話装置１との通話状態が改善される。また、通話相手先の携帯電話装置１が周波数特性調整部９２の機能と同一の機能を備えていない場合には、通話相手先の携帯電話装置１から音声アナウンスが音声出力されることにより、相手側に通話環境を変える必要があることを喚起させることが可能になる。

なお、上述した第２実施形態においては、発呼者の携帯電話装置１から着呼者の携帯電話装置１にイコライジングデータが送信されているが、本発明はそれに限るものではない。例えば、着呼者の携帯電話装置１にイコライジングデータが例えばメモリ５４が記憶されており、発呼者の携帯電話装置１からは周波数特性の調整を行うことを指示するコマンドを着呼者の携帯電話装置１に送信する。そして、着呼者の携帯電話装置１において、ＣＰＵ５０が、受信したコマンドに対応するイコライジングデータをメモリ５４から呼び出して、周波数特性の調整を行う、というようなシステム構成としても良い。

以上、本発明の実施形態について説明したが、本発明はそれに限るものではない。例えば、音声認識装置５２が一定時間以上音声データの認識していない判定した場合、すなわち、無音であると判断している状態が一定時間以上継続した場合に、音声認識装置５２は、制御部４０に、音声データを一定時間認識していない旨を表示部２１に表示することを指示するデータを送信するようにしても良い。これにより、難聴者サポートモードに設定して携帯電話装置１を利用しているユーザに、携帯電話装置１が故障したと誤認しないような情報を提供することが可能になる。

また、上述した実施形態においては、例えば、発呼者の携帯電話装置１が難聴者サポートモードに設定されている場合、着呼者の携帯電話装置１からの音声データのみが文字データに変換されて、表示部２１に表示されるが、マイク１２から入力した発呼者の音声を、文字に変換して表示部２１に表示しても良い。

これにより、難聴者にとっては自身の声も認識することが難しい場合があり、自分が話した内容が確実に通話相手に伝達されているか不安になる。そこで、発呼者の音声を文字に変換して表示部２１に表示することによって、表示部２１を見ることによって自身が入力した音声の内容が確認することが可能になり、自分が話した内容が通話相手に伝わっているか否かが確認できる。

また、マイク１２から入力した発呼者の音声を、文字に変換して表示部２１に表示するとともに、音声レベルを伝達する表示を行っても良い。これにより、前述したように、難聴者にとっては自身の声も認識することが難しい場合があるため、自身の声が周囲に迷惑となっているか、また通話相手が認識できる程度の声の大きさになっているか判別することが難しい場合がある。そこで、音声レベルを伝達する表示を行うことにより、難聴者に対して声の大きさが適度なものであるか否かの情報を与えることが可能になる。

また、通話開始から通話終了までの文字データを、議事録としてメモリ５４に記憶するように、制御部４０によって制御させても良い。これにより、音声データよりもはるかに少ないデータ量で、議事録をメモリ５４に記憶することが可能になる。

１携帯電話装置
５基地局
６ネットワーク
２１表示部
２２スピーカ
４０制御部
４２変換部
４４音声認識率算出部
４６送信部
４８表示制御部
５０ＣＰＵ
５２音声認識装置
５４メモリ
５６ＤＳＰ
５８ＲＦ回路部
８６メインアンテナ
７０、７２フィルタ／利得回路部
９２周波数特性調整部

Claims

外部機器から送信されてきたデータを受信する受信部と、
前記受信部によって受信されたデータが音声データであるかどうかを認識する認識部と、
当該音声データを文字データへ変換する変換部と、
前記変換部によって変換された文字データを表示する表示部と、
前記受信部より受信したデータが音声データとして不明瞭であると前記認識部が認識した場合、前記外部機器に向けて、音声データが不明瞭である旨を示す所定のデータを送信する送信部と、
を備えることを特徴とする通信機器。
請求項１に記載の通信機器であって、
前記所定のデータは、前記音声データが不明瞭である旨を示す音声データであることを特徴とする通信機器。
請求項１または２に記載の通信機器であって、
前記変換部が一定時間以上音声データを認識しなかった場合、
前記表示部は、音声データを一定時間認識していない旨を表示することを特徴とする通信機器。
第１の通信機器と、第２の通信機器と、を含む通信システムであって、
前記第１の通信機器は、
前記第２の通信機器よりデータを受信する第１受信部と、
前記第１受信部によって受信されたデータが音声データであるかどうかを認識する認識部と、
当該音声データを文字データへ変換する変換部と、
前記変換部によって変換された文字データを表示する第１表示部と、
前記第１受信部より受信したデータが音声データとして不明瞭であると前記認識部が認識した場合、前記第２の通信機器に向けて、音声データが不明瞭である旨を示す所定のデータを送信する第１送信部と、
を備え、
前記第２の通信機器は、
外部からの音声の入力を所定の集音の感度により受付ける音声入力部と、
外部から受付けた前記音声を音声データへ変換する音声データ変換部と、
前記音声データを前記第１の通信機器へ送信する第２送信部と、
前記第１の通信機器から送信された前記所定のデータを受信する第２受信部と、
当該第２受信部が前記所定のデータを受信したとき、所定の制御を行う第２制御部と、
を備えることを特徴とする通信システム。
請求項４に記載の通信システムであって、
前記所定のデータは、人間の声を強調する周波数特性又は周辺ノイズの利得を下げる周波数特性の少なくとも一方を有するイコライジングデータであり、
前記第２制御部は、前記イコライジングデータに基づいた周波数特性になるように前記音声入力部による前記集音の感度の制御を行うことを特徴とする通信システム。
請求項４に記載の通信システムであって、
前記所定のデータは、前記第１受信部が受信した音声データが不明瞭である旨の音声データであり、
前記第２制御部は、当該音声データを音声にして出力することを特徴とする通信システム。