JP2010177961A - 通信機器及び通信システム - Google Patents
通信機器及び通信システム Download PDFInfo
- Publication number
- JP2010177961A JP2010177961A JP2009017326A JP2009017326A JP2010177961A JP 2010177961 A JP2010177961 A JP 2010177961A JP 2009017326 A JP2009017326 A JP 2009017326A JP 2009017326 A JP2009017326 A JP 2009017326A JP 2010177961 A JP2010177961 A JP 2010177961A
- Authority
- JP
- Japan
- Prior art keywords
- data
- unit
- voice
- mobile phone
- communication device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】ユーザに正確な意図を伝えることが可能な通信機器及び通信システムを提供すること。
【解決手段】外部より音声データを受信するメインアンテナ86と、メインアンテナ86によって外部より受信された音声データを認識する音声認識装置52と、音声データを文字データへ変換する制御部40と、制御部40によって変換された文字データを表示する表示部21と、メインアンテナ86より受信した音声データが不明瞭であると音声認識装置52が認識した場合、通信相手に向けて、受信した音声データが不明瞭であることに基づく所定のデータを送信するRF回路部58送信部とを備える。
【選択図】図3
【解決手段】外部より音声データを受信するメインアンテナ86と、メインアンテナ86によって外部より受信された音声データを認識する音声認識装置52と、音声データを文字データへ変換する制御部40と、制御部40によって変換された文字データを表示する表示部21と、メインアンテナ86より受信した音声データが不明瞭であると音声認識装置52が認識した場合、通信相手に向けて、受信した音声データが不明瞭であることに基づく所定のデータを送信するRF回路部58送信部とを備える。
【選択図】図3
Description
本発明は、携帯電話等の通信機器及び通信システムに関する。
近年、音声認識機能を有する電話が多数開発されている。例えば、特許文献1には、留守番電話機能を有する電話機において、録音された音声データを文字データへと変換し、当該文字データを表示することによってユーザの利便性を図る技術が記載されている。そして、この音声認織機能による音声データの文字データへの変換機能は、耳の不自由な人の為の携帯電話に用いられることがある。例えば、通話時において、話し相手の音声を文字に変換して表示することによって、耳の不自由な人が話し相手の意図を認識できるという技術が知られている。
しかしながら、前述した技術においては、話し相手の発音が不明瞭であった場合などは、音声認識機能が誤変換をしてしまい、話し相手の意図がユーザに対して正確に伝わらないという問題があった。
本発明は、ユーザに正確な意図を伝えることが可能な通信機器及び通信システムを提供することを目的とする。
本発明に係る通信機器は、外部機器から送信されてきたデータを受信する受信部と、前記受信部によって受信されたデータが音声データであるかどうかを認識する認識部と、当該音声データを文字データへ変換する変換部と、前記変換部によって変換された文字データを表示する表示部と、前記受信部より受信したデータが音声データとして不明瞭であると前記認識部が認識した場合、前記外部機器に向けて、音声データが不明瞭である旨を示す所定のデータを送信する送信部と、を備える。
また、上記通信機器では、前記所定のデータは、前記音声データが不明瞭である旨を示す音声データであることが好ましい。
また、上記通信機器では、前記変換部が一定時間以上音声データを認識しなかった場合、前記表示部は、音声データを一定時間認識していない旨を表示することが好ましい。
本発明に係る通信システムは、第1の通信機器と、第2の通信機器と、を含む通信システムであって、前記第1の通信機器は、前記第2の通信機器よりデータを受信する第1受信部と、前記第1受信部によって受信されたデータが音声データであるかどうかを認識する認識部と、当該音声データを文字データへ変換する変換部と、前記変換部によって変換された文字データを表示する第1表示部と、前記第1受信部より受信したデータが音声データとして不明瞭であると前記認識部が認識した場合、前記第2の通信機器に向けて、音声データが不明瞭である旨を示す所定のデータを送信する第1送信部と、を備え、前記第2の通信機器は、外部からの音声の入力を所定の集音の感度により受付ける音声入力部と、外部から受付けた前記音声を音声データへ変換する音声データ変換部と、前記音声データを前記第1の通信機器へ送信する第2送信部と、前記第1の通信機器から送信された前記所定のデータを受信する第2受信部と、当該第2受信部が前記所定のデータを受信したとき、所定の制御を行う第2制御部と、を備える。
また、上記通信システムでは、前記所定のデータは、人間の声を強調する周波数特性又は周辺ノイズの利得を下げる周波数特性の少なくとも一方を有するイコライジングデータであり、前記第2制御部は、前記イコライジングデータに基づいた周波数特性になるように前記音声入力部による前記集音の感度の制御を行うことが好ましい。
また、上記通信システムでは、前記所定のデータは、前記第1受信部が受信した音声データが不明瞭である旨の音声データであり、前記第2制御部は、当該音声データを音声にして出力することが好ましい。
本発明によれば、音声データを文字データに変換して表示部に表示する機能を備えることにより、通信相手の正確な意図を伝えることが可能となる。
以下、本発明の実施形態について説明する。
まず、本発明の第1実施形態について説明する。図1は、第1実施形態に係る通話システムの構成を示す図である。複数の携帯電話装置1(第1の通信機器および第2の通信機器)は、基地局5およびネットワーク6を介して互いに接続される。いずれか1つの携帯電話装置1においてユーザ操作によって発呼操作が行われた場合、発信者側の携帯電話装置1に近い基地局5に相手先電話番号のデータが送信される。さらに、発信者側の携帯電話装置1に近い基地局5からネットワーク6に相手先電話番号のデータが送信され、ネットワーク6からは、電話番号に対応する相手側の携帯電話装置1に近い基地局5を介して、相手側の携帯電話装置1に着信要求が送信される。そして、相手側の携帯電話装置1において着信を受ける操作が行われた場合に、発信者側の携帯電話装置1と相手側の携帯電話装置1との間で通話が可能となる。
図2は、本発明に係る通信機器の一例である携帯電話装置1の外観を示す斜視図である。なお、図1は、いわゆる折り畳み型の携帯電話装置の形態を示しているが、本発明に係る携帯電話装置の形態としては特にこれに限られない。例えば、両筐体を重ね合わせた状態から一方の筐体を一方向にスライドさせるようにしたスライド式や、重ね合せ方向に沿う軸線を中心に一方の筐体を回転させるようにした回転式(ターンタイプ)や、操作部と表示部とが1つの筐体に配置され、連結部を有さない形式(ストレートタイプ)でも良い。
携帯電話装置1は、操作部側筐体部2と、表示部側筐体部3と、を備えて構成される。操作部側筐体部2は、表面部10に、操作部11と、携帯電話装置1の使用者が通話時に発した音声が入力されるマイク12と、を備えて構成される。操作部11は、各種設定や電話帳機能やメール機能等の各種機能を作動させるための機能設定操作キー13と、電話番号の数字やメール等の文字等を入力するための入力操作キー14と、各種操作における決定やスクロール等を行う決定操作キー15と、から構成されている。
また、表示部側筐体部3は、表面部20に、各種情報を表示するためのLCD(Liquid Crystal Display)表示部21と、通話の相手側の音声を出力するスピーカ22と、を備えて構成されている。
また、操作部側筐体部2の上端部と表示部側筐体部3の下端部とは、ヒンジ機構4を介して連結されている。また、携帯電話装置1は、ヒンジ機構4を介して連結された操作部側筐体部2と表示部側筐体部3とを相対的に回転することにより、操作部側筐体部2と表示部側筐体部3とが互いに開いた状態(開放状態)にしたり、操作部側筐体部2と表示部側筐体部3とを折り畳んだ状態(折畳み状態)にしたりできる。
また、図3は、携帯電話装置1の機能を示す機能ブロック図である。携帯電話装置1には、図3に示すように、マイク12と、表示部21と、スピーカ22と、制御部40と、音声認識装置52と、メモリ54と、DSP56と、RF回路部58、A/D変換器60と、D/A変換器62とが表示部側筐体部3に備えられている。なお、図1に示す通信システムにおいては、図3に示す携帯電話装置1において音声認識装置52がないもの、すなわち詳細については後述するが、受信した音声データを文字データに変換して表示部21に表示する機能がない携帯電話装置1であっても適用可能であることは言うまでもない。
DSP56には、フィルタ/利得回路部70、72と、エンコーダ74と、デコーダ76と、音声検出部78と、レベル測定部80が備えられている。RF回路部58には、変調部82と、復調部84とが備えられている。
RF回路部58は、メインアンテナ86によって受信した信号を復調部84において復調処理し、処理後の信号をDSP74に供給する。そして、DSP74から供給された信号を変調部82において変調処理し、メインアンテナ86を介して基地局5に送信する。このように、RF回路部58及びメインアンテナ86は、外部機器(携帯電話装置1)から送信されてきたデータを受信する受信部、及び外部機器(携帯電話装置1)に向けて、データを送信する送信部として機能する。
復調部84によって復調処理された受信信号は、デコーダ76によって復号化され、フィルタ/利得回路部72、音声検出部78、レベル測定部80に送信される。音声検出部78においては、デコーダ76からの信号に基づいて音声データの状態が検出される。例えば、音声検出部78では、音声の有無や音声の抑揚などが検出される。レベル測定部80においてはデコーダ76からの信号のレベルが測定される。音声検出部78の検出結果のデータ及びレベル測定部80の測定結果のデータは、デコーダ76からの音声データとともにフィルタ/利得回路部70に送られる。
フィルタ/利得回路部70においては、音声データの信号に対してノイズ除去、ゲイン調整の処理が行われる。フィルタ/利得回路部72からの音声データ(デジタルデータ)は、D/A変換器62によってアナログ信号に変換され、スピーカ22(第2音声変換部)によって音声出力される。
マイク12(第2音声入力部)によって入力された音声データは、A/D変換器60によってデジタル信号に変換され、フィルタ/利得回路部70によってノイズ除去、ゲイン調整の処理が行われる。フィルタ/利得回路部70から出力された音声データの信号はエンコーダ74によって符号化され、RF回路部58、メインアンテナ86を介して基地局5に送信される。
また、フィルタ/利得回路部72は、音声認識装置52に、音声データ(デジタルデータ)および音声検出部78の検出結果のデータ、レベル測定部80の測定結果のデータを送信する。音声認識装置52は、フィルタ/利得回路部72からの音声データが何の音声であるかを認識する(認識部)。音声認識装置52は、認識結果を制御部40に送信する。また、音声認識装置52は、音声検出部78の検出結果のデータおよびレベル測定部80の測定結果のデータに基づいて、通話相手の感情や無音状態であるか否か、さらには保留音のような機械的な音声であるか等を判断し、その判断結果にふさわしい文字を指定するデータを制御部40に送信する。例えば、音声認識装置52は、相手が叫んでいると判断した場合には、「!」と表示部21に表示させるデータを送信する。また、無音であれば、「返答待ちです」と表示部21に表示させるデータを送信する。また、保留音であれば、「保留中です」と表示部21に表示させるデータを送信する。なお、音声データの認識結果が認識不可能である場合には、「?」と表示部21に表示させるデータを送信する。
図4は、制御部40の機能を示すブロック図であり、制御部40は、CPU50を備えている。制御部40は、CPU50の処理によって、変換部42、音声認識率算出部44、送信部46、表示制御部48として機能する。変換部42は、音声認識装置52からの認識結果に基づいて、音声データを文字データに変換する。音声認識率算出部44は、音声認識装置52からの認識結果において、不明瞭と認識された結果を以外の認識結果の割合、言い換えると文字データに変換できた認識結果の割合を算出する。送信部46は、音声認識率算出部44が求めた音声認識率に応じて、発着信時、通話時において、メモリ54に記憶されている複数の音声アナウンスデータの中から適宜選択して、エンコーダ74に送信する。表示制御部48は、変換部42によって変換された文字データを表示部21に表示させる制御を行う。
具体的には、音声認識率算出部44が求めた音声認識率が予め設定した音声認識率よりも低い場合に、メモリ54に記憶されている音声アナウンスデータが通話相手の携帯電話装置1に送信される。このため、通話相手の携帯電話装置1からは、相手先の音声の他に、通話相手の携帯電話装置1のメモリ54に記憶されている音声アナウンスデータに基づく音声が出力される場合がある。
次に、第1実施形態の携帯電話装置1の動作について説明する。まず、着信時の動作について説明する。着信があった場合、着信音および表示部21によってユーザに着信があることが知らさせる。そして、ユーザ操作により、機能設定操作キー13(図2参照)が押下されることによって着信に応答し、通話を開始することが可能になる。ここで、通話開始時において、CPU50の制御によって、メモリ54より音声アナウンスデータが引き出され、この音声アナウンスデータがDSP56に送られる。このとき、DSP56は、DSP56内の送話音声パスを、マイク12から、CPU50からの音声アナウンスデータに切り替えて、送話音声としてRF回路部58に送出するように制御を行う。これにより、通話相手先の携帯電話装置1からは、ユーザの携帯電話装置1から送信された音声アナウンスデータに基づく音声が出力されるようになる。
通話開始時のアナウンスデータとしては「音声認識装置を使用することの連絡」と「音声認識装置会話時の注意事項(ゆっくり、はっきり話す等)」といった音声ガイダンスがある。そして、音声アナウンス終了後、DSP56は、DSP56内の送話音声パスをマイク12に切り替えることにより、ユーザは通話相手との間で音声通話を行うことができるようになる。
また、音声アナウンス中であることは、CPU50の制御によって表示部21に表示される。これにより、通話相手と同様にユーザも音声アナウンス中であることを知ることができる。
なお、発信時における制御も着信時と同様に、発信後に相手が応答すると、CPU50からの音声アナウンスデータが、DSP56、RF回路部58を介して、通話相手先の携帯電話装置1に送信される。そして、通話相手先の携帯電話装置1からは、ユーザの携帯電話装置1から送信された音声アナウンスデータに基づいて、音声アナウンスが音声出力されるようになる。
次に、通話中の動作について説明する。通話中においては、音声データが、フィルタ/利得回路部72、音声認識装置52に送られる。この時、音声認識装置52に音声データが送られている間はスピーカ22へのパスが切断されているので、スピーカ22からは音は発生しない。音声認識装置52からは、相手側音声を認識した結果のデータがCPU50に送信される。CPU50(変換部)はその結果データを文字データに変換し、表示部21(表示部)に表示させる。
ところで、音声認識装置が音声を認識できない場合がある。音声認識できないケースとしては、声の大きさ、騒音等を要因とするケースが想定される。第1実施形態においては、音声認識装置52において受信した音声データが不明瞭であると認識した場合には、「もう一度繰り返して下さい」等という音声アナウンスが自動で返答される。具体的には、CPU50が、音声認識装置52の認識結果に基づいて、相手側環境の騒音が大きくなってきて音声認識率に影響があるように判断すると「音声認識率が低下しています。もう少し静かな環境に移動して下さい。」等という音声アナウンスがスピーカ22(第2制御部)によって自動で行われる。また、自動の音声アナウンス中においては、ユーザにもその旨が分かるように、表示部21に文字が表示される。例えば、表示部21に「音声認識率が低下しています。もう少し静かな環境に移動して下さい。」という文字が、例えば他の文字色とは異なる色で表示される。
図5は、通話中において音声アナウンスを行う際の処理手順を示すフローチャートである。
図5に示すように、CPU50は、通話中であるか否かを判定し(ステップS10)、通話中の場合には、音声認識率の算出を行う(ステップS12)。この処理が終了した場合には、ステップS14に処理を移す。音声認識率の算出方法としては、例えば、単位時間当たりの音声認識を行った全体の音声認識結果において、音声認識に成功した割合、具体的には、文字データへの変換に成功した割合を算出する。通話が終了した場合には、次の通話まで待機状態とする。
ステップS14において、CPU50は、音声認識エラーが発生したか否かを判定する処理を行う。この処理において、CPU50は、音声認識率が予め設定した基準音声認識率よりも低いと判定した場合に、音声認識エラーが発生したと判定する。音声認識エラーが発生したと判定した場合には、ステップS16に処理を移し、音声認識エラーが発生したと判定しない場合には、ステップS10に処理を移す。
ステップS16において、CPU50は、通信相手側の通話環境によるノイズが大きいか否かを判定する処理を行う。この処理において、CPU50は、例えば、音声認識率が、基準音声認識率よりも低い値に予め設定した音声認識率よりも低いと判定した場合に、通話環境によるノイズが大きいと判定する。通話環境によるノイズが大きいと判定した場合には、ステップS20に処理を移し、通話環境によるノイズが大きいと判定しない場合には、ステップS18に処理を移す。
ステップS18において、CPU50は、メモリ54に記憶されている複数の音声アナウンスデータにおいて、例えば、「もう一度ゆっくり繰り返してください」という音声アナウンスデータを選択し、DSP56に送信する処理を行う。この処理により、音声アナウンスデータは、通信相手の携帯電話装置1に送信される。音声アナウンスデータを受信した通信相手の携帯電話装置1においては、スピーカ22より「もう一度ゆっくり繰り返してください」という音声が出力される。この処理が終了した場合には、ステップS10に処理を移す。
ステップS20において、CPU50は、メモリ54に記憶されている複数の音声アナウンスデータにおいて、例えば、「もう少し静かな環境に移動して下さい」という音声アナウンスデータを選択し、DSP56に送信する処理を行う。この処理により、音声アナウンスデータは、通信相手の携帯電話装置1に送信される。音声アナウンスデータを受信した通信相手の携帯電話装置1においては、スピーカ22より「もう少し静かな環境に移動して下さい」という音声が出力される。この処理が終了した場合には、ステップS10に処理を移す。
次に、表示部21における表示例について、図6〜図8を用いて説明する。図6はモード設定画面の一例を示す説明図である。携帯電話装置1の設定メニューの1つに、モード設定画面があり、その中に、難聴者サポートモードのオン、オフを設定する項目がある。難聴者サポートモードがオンの場合には、通話相手の音声データを文字データに変換して表示部21に表示する機能が実行される。
図7は通話中における相手先からの音声データに基づく文字表示例を示す説明図である。図7は、電話をかけた者(以下、発呼者と称する)の携帯電話装置1が難聴者サポートモードに設定されている場合を示すものである。通話相手(以下、着呼者と称する)が着信操作を行うと、発呼者の携帯電話装置1から、通話開始時の音声ガイダンスの音声データが着呼者の携帯電話装置1に送信され、着呼者の携帯電話装置1からは音声ガイダンスが出力される。
例えば、「この電話は、特許太郎さんからです。相手先は、難聴者サポートモードであり、あなたの声が、相手先に文字表示されます。このため、できるだけ静かな場所で通話していただけますようお願いいたします。それでは、通話を開始します。」という音声が、着呼者の携帯電話装置1から出力される。発呼者の携帯電話装置1の表示部21においては、着呼者の携帯電話装置1に対して音声ガイダンスを出力している間に「音声アナウンス中」という表示が行われ、音声ガイダンスが終了すると「音声アナウンス終了」という表示が行われる。
そして、着呼者の携帯電話装置1から「もしもし」という音声データが送信されると、発呼者の携帯電話装置1の表示部21には「もしもし」と文字表示される。さらに、発呼者が「特許花子さんでしょうか」と話した場合、着呼者の携帯電話装置1からは「特許花子」と音声出力されるが、このとき発呼者の、携帯電話装置1の表示部21においては、文字表示は行われない。
また、発呼者の携帯電話装置1の表示部21においては、文字としてひらがなが、音声認識された通りに表示される。このため、着呼者の発音によっては、正確に文字表示されない場合がある。例えば、着呼者の携帯電話装置1からは「特許太郎さん あっ、どうもこんにちは」と返答した場合、発呼者の携帯電話装置1の表示部21には「とっきょたろおさん あっ!どうもこんにちわ」と文字表示される場合がある。このような正確に文字表示されない場合においては、CPU50は、文字データの変換に成功したものと見なし、音声認識率は低下しない。なお、CPU50は、文字データに変換できなかった音声データついては、「?」といった文字を携帯電話装置1の表示部21に表示させる。
図8は、発呼者の携帯電話装置1が難聴者サポートモードに設定されており、着呼者の携帯電話装置1の通話環境が悪い場合を示すものである。例えば、着呼者が、工事現場の近くや駅のホームといったノイズが多い場所にいるときに、発呼者の携帯電話装置1からの着信を受けたとする。そして、着呼者の携帯電話装置1から「もしもし」という音声データが送信されたが、発呼者の携帯電話装置1において、音声データに含まれるノイズの影響によって音声認識ができずに文字データへの変換が行われなかったとする。この場合、表示部21には「もし?????」と文字表示される。
その後の通話において、文字データに変換できないことが多くなり、音声認識率が低下して基準音声認識率より低くなった場合に、音声ガイダンスの音声データが着呼者の携帯電話装置1に送信され、着呼者の携帯電話装置1からは音声ガイダンスが出力される。例えば、「もう一度ゆっくりと繰り返して下さい」という音声が、着呼者の携帯電話装置1から出力される。発呼者の携帯電話装置1の表示部21においては、着呼者の携帯電話装置1に対して音声ガイダンスを出力している間に「「もう一度ゆっくりと繰り返して下さい」と返答しました」という表示が行われる。そして、音声ガイダンスを聞いた着呼者が、声の出し方を改めたり、ボリューム調節などを行うことによって、通話状態を良好にすることができる。
しかし、依然として、発呼者の携帯電話装置1において、音声データに含まれるノイズの影響によって音声認識ができずに文字データへの変換が行われなかった場合には、さらに音声認識率が低下して基準音声認識率よりさらに低い音声認識になった場合には、「音声アナウンス中「もう少し静かな環境に移動してください」という音声が、着呼者の携帯電話装置1から出力される。一方、発呼者の携帯電話装置1の表示部21においては、「音声アナウンス中「もう少し静かな環境に移動してください」と返答しました」という表示が行われる。そして、音声ガイダンスを聞いた着呼者が、騒音の少ない通話場所に移動することによって、通話状態を良好にすることができる。
このように、第1実施形態によれば、通話相手に音声が不明瞭であることを伝えることが可能となるため、通話相手に通話環境を変える必要があることを喚起させることが可能になり、通話相手は、はっきり話す、ボリューム調節を行う、場所を変える、といった措置をとることが可能となる。
また、発呼者にとっては、相手先の音声が文字に変換されて表示部21に表示されるため、相手先が話す内容が視覚的に認識することが可能となり、特に、難聴者に対して、使い勝手の良いサポートを提供することが可能となる。
次に、本発明の第2実施形態に係る携帯電話装置について説明する。第2実施形態の携帯電話装置1は、図4に示す第1実施形態の携帯電話装置1の制御部40の機能に、さらに、図9に示すように、通話相手先の携帯電話装置1の機種を判別する機種判別部90としての機能、及びイコライジングデータに基づいてフィルタ/利得回路部72を自動調整する周波数特性調整部92としての機能を持たせたものである。それ以外は、第1実施形態と同一である。
図10は機種判別部90の処理を示すフローチャートである。通話相手先の携帯電話装置1が、発呼者の携帯電話装置1による着信を受付けた場合、通話相手先の携帯電話装置1から、通話相手先の携帯電話装置1の機種情報が発呼者の携帯電話装置1に送信される。発呼者の携帯電話装置1が通話相手先の携帯電話装置1の機種情報を受信すると(ステップS30)、CPU50は、通話相手先の携帯電話装置1が、発呼者側の携帯電話装置1が有する周波数特性調整部92の機能と同一の機能を備えている機種であるか否かを判別する処理を行う(ステップS32)。CPU50が、通話相手先の携帯電話装置1が難聴者サポートモードと同一の機能を備えている機種であると判別した場合には、ステップS34に処理を移す。CPU50が、通話相手先の携帯電話装置1が周波数特性調整部92の機能と同一の機能を備えている機種であると判別しない場合には、ステップS36に処理を移す。
ステップS34において、CPU50は、通話相手先の携帯電話装置1が周波数特性調整部92の機能と同一の機能を備えているか否かを識別する機種フラグをオンにする処理を行う。この処理が終了した場合には、機種判別部90による処理を終了する。
ステップS36において、CPU50は、通話相手先の携帯電話装置1が周波数特性調整部92の機能と同一の機能を備えているか否かを識別する機種フラグをオフにする処理を行う。この処理が終了した場合には、機種判別部90による処理を終了する。
すなわち、通話相手先の携帯電話装置1が周波数特性調整部92の機能と同一の機能を備えている場合には、機種フラグがオンになり、備えていない場合には、機種フラグがオフになる。
図11は周波数特性調整部92の処理を示すフローチャートである。携帯電話装置1がイコライジングデータを受信すると(ステップS40)、CPU50(第2制御部)は、受信したイコライジングデータに基づいてフィルタ/利得回路部70の調整を自動的に行うように制御する。すなわち、CPU50によってマイク12(第2音声入力部)の集音感度の制御が行われる。この処理が終了した場合には、周波数特性調整部92による処理を終了する。
図12は、通話中において音声アナウンスを行う際の処理手順を示すフローチャートである。
図12に示すように、CPU50は、通話中であるか否かを判定し(ステップS50)、通話中の場合には、音声認識率の算出を行う(ステップS52)。この処理が終了した場合には、ステップS54に処理を移す。音声認識率の算出方法としては、例えば、単位時間当たりの音声認識を行った全体の音声認識結果において、文字データへの変換に成功した割合を算出する。通話が終了した場合には、次の通話まで待機状態とする。
ステップS54において、CPU50は、音声認識エラーが発生したか否かを判定する処理を行う。この処理において、CPU50は、音声認識率が、予め設定した基準音声認識率よりも低いと判定した場合に、音声認識エラーが発生したと判定する。音声認識エラーが発生したと判定した場合には、ステップS56に処理を移し、音声認識エラーが発生したと判定しない場合には、ステップS50に処理を移す。
ステップS56において、CPU50は、通信相手側の通話環境によるノイズが大きいか否かを判定する処理を行う。この処理において、CPU50は、例えば、音声認識率が、基準音声認識率よりも低い値に予め設定した音声認識率よりも低いと判定した場合に、通話環境によるノイズが大きいと判定する。通話環境によるノイズが大きいと判定した場合には、ステップS64に処理を移し、通話環境によるノイズが大きいと判定しない場合には、ステップS58に処理を移す。
ステップS58において、CPU50は、機種フラグがオンであるか否かを判定する処理を行う。CPU50が、機種フラグがオンであると判定した場合には、ステップS60に処理を移し、機種フラグがオンであると判定しない場合には、ステップS62に処理を移す。
ステップS60において、CPU50は、人間の声を強調するイコライジングデータをDSP56に送信する処理を行う。このイコライジングデータは、通話相手の携帯電話装置1に送信され、通話相手の携帯電話装置1においては、CPU50の制御によって、受信したイコライジングデータに基づいて、人間の声を強調するような周波数特性になるようにフィルタ/利得回路部72を自動的に調整する処理が行われる。この処理が終了した場合には、ステップS50に処理を移す。
ステップS62において、CPU50は、メモリ54に記憶されている音声アナウンスパターンのデータにおいて、例えば、「もう一度ゆっくり繰り返してください」というデータを選択し、DSP56に送信する処理を行う。この処理が終了した場合には、ステップS50に処理を移す。
ステップS64において、CPU50は、機種フラグがオンであるか否かを判定する処理を行う。CPU50が、機種フラグがオンであると判定した場合には、ステップS66に処理を移し、機種フラグがオンであると判定しない場合には、ステップS68に処理を移す。
ステップS66において、CPU50は、周辺ノイズの利得を下げるイコライジングデータをDSP56に送信する処理を行う。このイコライジングデータは、通話相手の携帯電話装置1に送信され、通話相手の携帯電話装置1においては、CPU50の制御によって、受信したイコライジングデータに基づいて、周辺ノイズの利得を下げる周波数特性になるようにフィルタ/利得回路部72を自動的に調整する処理が行われる。この処理が終了した場合には、ステップS50に処理を移す。
ステップS68において、CPU50は、メモリ54に記憶されている音声アナウンスパターンのデータにおいて、例えば、「もう少し静かな環境に移動して下さい」というデータを選択し、DSP56に送信する処理を行う。この処理が終了した場合には、ステップS10に処理を移す。
すなわち、通話相手先の携帯電話装置1が周波数特性調整部92の機能と同一の機能を備えている場合には、例えば、発呼者の携帯電話装置1から着呼者の携帯電話装置1にイコライジングデータが送信され、着呼者の携帯電話装置1においては、イコライジングデータに基づいて周波数特性が自動調整される。これにより、着呼者が特段の操作を行うことなく、着呼者の携帯電話装置1において、発呼者の携帯電話装置1との通話状態が改善される。また、通話相手先の携帯電話装置1が周波数特性調整部92の機能と同一の機能を備えていない場合には、通話相手先の携帯電話装置1から音声アナウンスが音声出力されることにより、相手側に通話環境を変える必要があることを喚起させることが可能になる。
なお、上述した第2実施形態においては、発呼者の携帯電話装置1から着呼者の携帯電話装置1にイコライジングデータが送信されているが、本発明はそれに限るものではない。例えば、着呼者の携帯電話装置1にイコライジングデータが例えばメモリ54が記憶されており、発呼者の携帯電話装置1からは周波数特性の調整を行うことを指示するコマンドを着呼者の携帯電話装置1に送信する。そして、着呼者の携帯電話装置1において、CPU50が、受信したコマンドに対応するイコライジングデータをメモリ54から呼び出して、周波数特性の調整を行う、というようなシステム構成としても良い。
以上、本発明の実施形態について説明したが、本発明はそれに限るものではない。例えば、音声認識装置52が一定時間以上音声データの認識していない判定した場合、すなわち、無音であると判断している状態が一定時間以上継続した場合に、音声認識装置52は、制御部40に、音声データを一定時間認識していない旨を表示部21に表示することを指示するデータを送信するようにしても良い。これにより、難聴者サポートモードに設定して携帯電話装置1を利用しているユーザに、携帯電話装置1が故障したと誤認しないような情報を提供することが可能になる。
また、上述した実施形態においては、例えば、発呼者の携帯電話装置1が難聴者サポートモードに設定されている場合、着呼者の携帯電話装置1からの音声データのみが文字データに変換されて、表示部21に表示されるが、マイク12から入力した発呼者の音声を、文字に変換して表示部21に表示しても良い。
これにより、難聴者にとっては自身の声も認識することが難しい場合があり、自分が話した内容が確実に通話相手に伝達されているか不安になる。そこで、発呼者の音声を文字に変換して表示部21に表示することによって、表示部21を見ることによって自身が入力した音声の内容が確認することが可能になり、自分が話した内容が通話相手に伝わっているか否かが確認できる。
また、マイク12から入力した発呼者の音声を、文字に変換して表示部21に表示するとともに、音声レベルを伝達する表示を行っても良い。これにより、前述したように、難聴者にとっては自身の声も認識することが難しい場合があるため、自身の声が周囲に迷惑となっているか、また通話相手が認識できる程度の声の大きさになっているか判別することが難しい場合がある。そこで、音声レベルを伝達する表示を行うことにより、難聴者に対して声の大きさが適度なものであるか否かの情報を与えることが可能になる。
また、通話開始から通話終了までの文字データを、議事録としてメモリ54に記憶するように、制御部40によって制御させても良い。これにより、音声データよりもはるかに少ないデータ量で、議事録をメモリ54に記憶することが可能になる。
1 携帯電話装置
5 基地局
6 ネットワーク
21 表示部
22 スピーカ
40 制御部
42 変換部
44 音声認識率算出部
46 送信部
48 表示制御部
50 CPU
52 音声認識装置
54 メモリ
56 DSP
58 RF回路部
86 メインアンテナ
70、72 フィルタ/利得回路部
92 周波数特性調整部
5 基地局
6 ネットワーク
21 表示部
22 スピーカ
40 制御部
42 変換部
44 音声認識率算出部
46 送信部
48 表示制御部
50 CPU
52 音声認識装置
54 メモリ
56 DSP
58 RF回路部
86 メインアンテナ
70、72 フィルタ/利得回路部
92 周波数特性調整部
Claims (6)
- 外部機器から送信されてきたデータを受信する受信部と、
前記受信部によって受信されたデータが音声データであるかどうかを認識する認識部と、
当該音声データを文字データへ変換する変換部と、
前記変換部によって変換された文字データを表示する表示部と、
前記受信部より受信したデータが音声データとして不明瞭であると前記認識部が認識した場合、前記外部機器に向けて、音声データが不明瞭である旨を示す所定のデータを送信する送信部と、
を備えることを特徴とする通信機器。 - 請求項1に記載の通信機器であって、
前記所定のデータは、前記音声データが不明瞭である旨を示す音声データであることを特徴とする通信機器。 - 請求項1または2に記載の通信機器であって、
前記変換部が一定時間以上音声データを認識しなかった場合、
前記表示部は、音声データを一定時間認識していない旨を表示することを特徴とする通信機器。 - 第1の通信機器と、第2の通信機器と、を含む通信システムであって、
前記第1の通信機器は、
前記第2の通信機器よりデータを受信する第1受信部と、
前記第1受信部によって受信されたデータが音声データであるかどうかを認識する認識部と、
当該音声データを文字データへ変換する変換部と、
前記変換部によって変換された文字データを表示する第1表示部と、
前記第1受信部より受信したデータが音声データとして不明瞭であると前記認識部が認識した場合、前記第2の通信機器に向けて、音声データが不明瞭である旨を示す所定のデータを送信する第1送信部と、
を備え、
前記第2の通信機器は、
外部からの音声の入力を所定の集音の感度により受付ける音声入力部と、
外部から受付けた前記音声を音声データへ変換する音声データ変換部と、
前記音声データを前記第1の通信機器へ送信する第2送信部と、
前記第1の通信機器から送信された前記所定のデータを受信する第2受信部と、
当該第2受信部が前記所定のデータを受信したとき、所定の制御を行う第2制御部と、
を備えることを特徴とする通信システム。 - 請求項4に記載の通信システムであって、
前記所定のデータは、人間の声を強調する周波数特性又は周辺ノイズの利得を下げる周波数特性の少なくとも一方を有するイコライジングデータであり、
前記第2制御部は、前記イコライジングデータに基づいた周波数特性になるように前記音声入力部による前記集音の感度の制御を行うことを特徴とする通信システム。 - 請求項4に記載の通信システムであって、
前記所定のデータは、前記第1受信部が受信した音声データが不明瞭である旨の音声データであり、
前記第2制御部は、当該音声データを音声にして出力することを特徴とする通信システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009017326A JP2010177961A (ja) | 2009-01-28 | 2009-01-28 | 通信機器及び通信システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009017326A JP2010177961A (ja) | 2009-01-28 | 2009-01-28 | 通信機器及び通信システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010177961A true JP2010177961A (ja) | 2010-08-12 |
Family
ID=42708482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009017326A Pending JP2010177961A (ja) | 2009-01-28 | 2009-01-28 | 通信機器及び通信システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010177961A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103247294A (zh) * | 2012-02-03 | 2013-08-14 | 索尼公司 | 信号处理设备、方法、系统和通信终端 |
JP2014027459A (ja) * | 2012-07-26 | 2014-02-06 | Brother Ind Ltd | 通信装置、通信方法及び通信プログラム |
JP2017163212A (ja) * | 2016-03-07 | 2017-09-14 | レノボ・シンガポール・プライベート・リミテッド | 情報処理装置、音声通信システム、音声通信方法、及びプログラム |
-
2009
- 2009-01-28 JP JP2009017326A patent/JP2010177961A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103247294A (zh) * | 2012-02-03 | 2013-08-14 | 索尼公司 | 信号处理设备、方法、系统和通信终端 |
JP2013162325A (ja) * | 2012-02-03 | 2013-08-19 | Sony Corp | 信号処理装置、信号処理方法、プログラム、信号処理システムおよび通信端末 |
US9531338B2 (en) | 2012-02-03 | 2016-12-27 | Sony Corporation | Signal processing apparatus, signal processing method, program, signal processing system, and communication terminal |
CN103247294B (zh) * | 2012-02-03 | 2017-11-07 | 索尼公司 | 信号处理设备、方法、系统和通信终端 |
JP2014027459A (ja) * | 2012-07-26 | 2014-02-06 | Brother Ind Ltd | 通信装置、通信方法及び通信プログラム |
JP2017163212A (ja) * | 2016-03-07 | 2017-09-14 | レノボ・シンガポール・プライベート・リミテッド | 情報処理装置、音声通信システム、音声通信方法、及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9666180B2 (en) | Synthesized audio message over communication links | |
US6813490B1 (en) | Mobile station with audio signal adaptation to hearing characteristics of the user | |
KR100640371B1 (ko) | 휴대용 단말기에서 문자 입출력 서비스를 실행하는 방법 | |
JP2007505564A (ja) | ミクストメディア通話フォーマッティングのための装置及び方法 | |
EP2092721B1 (en) | Method and device for changing to a speakerphone mode | |
EP1804237A1 (en) | System and method for personalized text to voice synthesis | |
KR101475333B1 (ko) | 전화번호부 업데이트 방법 및 이를 이용한 휴대 단말기 | |
JP2010177961A (ja) | 通信機器及び通信システム | |
KR100369804B1 (ko) | 휴대 전화 단말 시스템의 음성 인식 단문 메시지 전송장치 및 방법 | |
KR960012974B1 (ko) | 선택호출수신장치 | |
JP2009171336A (ja) | 携帯通信端末 | |
JP2002118689A (ja) | 携帯電話の発信時相手応答に対する自動音声再生機能 | |
JP4011095B2 (ja) | 携帯端末装置 | |
JP3879006B2 (ja) | 携帯端末装置 | |
MXPA02010052A (es) | Metodo y aparato para generacion de mensajes de llamada de contestacion basada en audio senales. | |
JP5644610B2 (ja) | 通信装置および受話音量設定プログラム | |
WO2006042042A1 (en) | Silent accept for incoming telephone calls | |
JP2015002386A (ja) | 通話装置、音声変更方法、及び音声変更プログラム | |
JP6727942B2 (ja) | 通信端末装置および通信端末装置の制御方法 | |
JP2008278327A (ja) | 音声通信装置及び音声通信装置の周波数特性制御方法 | |
JP2003188948A (ja) | 携帯端末装置 | |
JP2003163716A (ja) | 通信装置 | |
CN105872217A (zh) | 一种语音信箱留言获取方法、装置及手机 | |
JP2001298394A (ja) | 携帯電話装置 | |
KR100689464B1 (ko) | 벨소리 제어 장치 및 방법 |