JP2010258989A - 携帯電話機および音声情報提供システム - Google Patents

携帯電話機および音声情報提供システム Download PDF

Info

Publication number
JP2010258989A
JP2010258989A JP2009109701A JP2009109701A JP2010258989A JP 2010258989 A JP2010258989 A JP 2010258989A JP 2009109701 A JP2009109701 A JP 2009109701A JP 2009109701 A JP2009109701 A JP 2009109701A JP 2010258989 A JP2010258989 A JP 2010258989A
Authority
JP
Japan
Prior art keywords
voice
voice data
phrase
information
mobile phone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009109701A
Other languages
English (en)
Inventor
Hisashi Matsuyama
久 松山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Precision Inc
Original Assignee
Seiko Precision Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Precision Inc filed Critical Seiko Precision Inc
Priority to JP2009109701A priority Critical patent/JP2010258989A/ja
Publication of JP2010258989A publication Critical patent/JP2010258989A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

【課題】通話中の所定の音声を認識してそれに関する情報(例えば、時刻等)を通話中の音声として提供する。
【解決手段】マイクロホン29から入力された音声信号は、A/D28でデジタル信号に変換された後、加算器23を介して音声認識部20に与えられ、予め登録されている語句の検出が行われる。例えば、「今何時?」等の語句が検出されると、制御部12によって時計部16の時刻データが読み出され、音声合成部18に与えられる。時刻データは、音声合成部18で時刻を表す合成音声データに変換され、加算器21に与えられる。加算器21において、合成音声データは復号器17から出力される通話相手の音声データに重畳され、D/A26でアナログの音声信号に変換されてスピーカ27から出力される。
【選択図】図1

Description

本発明は、通話中の音声を認識してそれに関する情報を音声で提供する携帯電話機および音声情報提供システムに関する。
下記特許文献1には、サービスセンターに対して付加サービスの登録や設定をする場合の操作の簡略化を目的として、サービスセンターから受信する音声ガイダンスを音声認識処理を用いて判断し、音声ガイダンスに対して自動的に応答し、目的とするサービスセンターへの情報設定と登録を可能にする機能を備えた携帯電話機が記載されている。
特許文献2には、単音節単位で認識処理可能な不特定話者半音節音声認識器を備え、登録時には、氏名と電話番号を音節単位で離散発生した音声信号によって電話番号登録を行い、ダイアル時には、音節単位で離散発生した音声信号によって宛先の氏名を認識してダイアル操作を行う音声認識ダイアル装置が記載されている。
特許文献3には、現在時刻等を表示する表示部を持たず、マイクロホンから入力される使用者の音声を認識してそれに応じたメッセージを合成してスピーカから出力し、これに使用者が音声で応答していき、あたかも使用者が時計と会話しているような状況で、現在時刻の告知やタイマーの設定等を行う音声時計が記載されている。
特許文献4には、携帯電話機と通話相手の電話機との間の通話音声を中継する電話中継機に、音声データを重畳する機能を付加し、携帯電話機から指定された音声データベースの音声データを重畳して、通話相手の電話機に伝送する携帯電話システムが記載されている。
特許第3012619号公報 特開平11−65590号公報 特開2000−9864号公報 特開2006−173815号公報
しかしながら、特許文献1〜4では、通話中に各種の情報(例えば、時刻)を音声で得ることができないという課題があった。
即ち、特許文献1の携帯電話機は、サービスセンターに対して、予め定められた付加サービスの登録や設定を行うものであり、特許文献2の音声認識ダイアル装置は、音声認識を利用して電話番号の登録や音声ダイヤルを行うものである。また、特許文献3の音声時計は、単に音声認識を利用して、時計の操作や表示を音声で行うようにしたものである。更に、特許文献4の携帯電話システムは、携帯電話機から音声データベースの音声データを指定すると記載されているものの、具体的にどのような手段を用いて指定するのかについては明示されていない。
本発明は上記課題に鑑みてなされたものであり、通話中の所定の音声を認識してそれに関する情報を通話中の音声として出力することができる携帯電話機および情報提供システムを提供することを目的とする。
上記目的を達成するために、本発明の第1の観点に係る携帯電話機は、通話中のユーザの音声データに含まれる特定の語句を検出する音声認識手段と、前記音声認識手段で検出された語句に応じて情報を出力する情報出力手段と、前記情報出力手段から出力される情報を合成音声データに変換して出力する音声合成手段と、前記合成音声データを前記ユーザに音声信号として出力する出力手段と、を備えることを特徴とする。
なお、前記音声認識手段は、前記ユーザの音声データに加えて、通話相手の音声データに含まれる前記特定の語句を検出し、前記出力手段は、前記合成音声データを前記ユーザに音声信号として出力すると共に、該合成音声データを前記ユーザの音声データに重畳して前記通話相手に送信するように、構成することができる。
また、前記出力手段は、前記合成音声データを前記通話相手の音声データに重畳し、前記音声信号として出力するように構成しても良い。
更に、前記出力手段は、前記合成音声データと前記通話相手の音声データを、それぞれ第1および第2の音響出力手段から音声信号として出力するように構成することもできる。その場合、第1および第2の音響出力手段の内の1つは、骨伝導スピーカとすることができる。
ここで、前記特定の語句は、現在の時刻または日時を問い合わせるための語句であり、前記情報出力手段は、該特定の語句に応じて時刻または日時の情報を出力するように構成することができる。また、前記音声認識手段は、前記音声データに含まれる検出対象の特定の語句が複数の単語を所定の順番に並べた構成となっている場合に、該語句を複数の単語に分解して順次検出するように構成することができる。
本発明の第2の観点に係る音声情報提供システムは、電話交換網に接続され、通話中の音声データに含まれる特定の語句に応じて対応する情報を該音声データに重畳して出力する音声情報提供システムであって、前記通話中の音声データに含まれる特定の語句を検出する音声認識手段と、前記音声認識手段で検出された語句に応じて情報を出力する情報出力手段と、前記情報出力手段から出力される情報を合成音声データに変換して出力する音声合成手段と、前記合成音声データを前記音声データに重畳して出力する出力手段と、を備えることを特徴とする。
この音声情報提供システムにおいても、前記特定の語句は、現在の時刻または日時を問い合わせるための語句であり、前記情報出力手段は、該特定の語句に応じて時刻または日時の情報を出力するように構成することができる。また、前記音声認識手段は、前記音声データに含まれる検出対象の特定の語句が複数の単語を所定の順番に並べた構成となっている場合に、該語句を複数の単語に分解して順次検出するように構成することができる。
本発明の携帯電話機や音声情報提供システムは、通話中の音声データに含まれる特定の語句を検出する音声認識手段と、音声認識手段で検出された語句に応じて情報を出力する情報出力手段と、情報出力手段から出力される情報を合成音声データに変換して出力する音声合成手段を備えている。これにより、通話中の所定の音声を認識してそれに関する情報を通話中の音声として出力することができる。
本発明の第1の実施形態を示す携帯電話機の構成図である。 図1における第1の音声サービス処理のフローチャートである。 図1における第2の音声サービス処理のフローチャートである。 本発明の第2の実施形態を示す音声情報提供システムの構成図である。 図4における第1の音声サービス処理のフローチャートである。 図4における第2の音声サービス処理のフローチャートである。 図4の動作シーケンス(その1)を示す説明図である。 図4の動作シーケンス(その2)を示す説明図である。 本発明のその他の実施形態を示す携帯電話機の構成図である。 コンシェルジェ・サービスの一例を示す図である。
以下、本発明の実施の形態について図面を参照して詳細に説明する。
(第1の実施形態)
図1に示すように、本発明の第1の実施形態の携帯電話機は、大きく分けて無線ブロックと、制御ブロックと、通話・音声ブロックを備えている。この内、無線ブロックは、一般的な携帯電話機と同様に、無線を介して電話交換網の交換装置に接続するための携帯電話無線部11で構成されている。
制御ブロックは、無線ブロックや通話・音声ブロックの動作を制御するもので、プロセッサで構成される制御部12、プロセッサ用のプログラムや各種のデータを記憶するためのメモリ13、押しボタンスイッチ等の操作部14、液晶表示器等で構成される表示部15、現在時刻等の時刻データを提供するための時計部16等を有している。制御部12は、ユーザの発着呼操作に応じて携帯電話無線部11を制御する一般的な通話制御機能に加えて、後述するように、音声認識結果に応じて時計部16の時刻情報等を出力する機能を有している。
通話・音声ブロックは、ユーザとの間で通話等の音声の授受を行うもので、復号器17、音声合成部18、符号器19、音声認識部20、加算器21,22,23、スイッチ(SW)24,25、デジタル・アナログ変換器(以下、「D/A」という)26、スピーカ27、アナログ・デジタル変換器(以下、「A/D」という)28、マイクロホン29等を有している。
復号器17は、携帯電話無線部11で受信した相手側からの符号化された音声データを、アナログ信号に変換しやすい符号形式に復号するものである。音声合成部18は、例えば制御部12で読み出されて与えられる時計部16の時刻データを、音声で出力するための合成音声データに変換するものである。復号器17と音声合成部18から出力される音声データは、加算器21に与えられて加え合わされ、その加算結果がD/A26に与えられるようになっている。D/A26は、加算器21の加算結果であるデジタル信号を、アナログ信号に変換するものである。D/A26から出力されるアナログ信号は、スピーカ27に与えられ、音響信号としてユーザに出力されるようになっている。
一方、マイクロホン29は、ユーザの発した音声を電気信号に変換するものである。マイクロホン29から出力されるアナログの電気信号は、A/D28によってデジタル信号に変換されて、加算器22,23の第1の入力端子に与えられるようになっている。
加算器22の第2の入力端子には、音声合成部18の出力信号がスイッチ24を介して与えられ、この加算器22の加算結果が、符号器19に与えられている。符号器19は、デジタル化された音声信号を、無線伝送に適した符号形式のデジタル信号に変換するもので、この符号器19の出力信号が携帯電話無線部11に与えられるようになっている。
加算器23の第2の入力端子には、復号器17の出力信号がスイッチ25を介して与えられ、この加算器23の加算結果が、音声認識部20に与えられている。音声認識部20は、デジタル化された音声信号の中に、予め決められた特定の語句の存在を検出するものである。音声認識部20は、特定の語句の存在を検出したときに、制御部12に対して、検出結果の信号を出力するようになっている。
スイッチ24,25は、制御部12から与えられる制御信号に従って、それぞれ加算器22,23の第2の入力端子に与えるデジタル信号をオン・オフ制御するものである。
次に、図2を参照しつつ、図1の携帯電話機における第1の音声サービス処理を説明する。
制御部12は、携帯電話による通話の開始を監視し(ステップS1)、通話が開始されない間(ステップS1;いいえ)、監視を継続する。通話が開始されると(ステップS1;はい)、ステップS2の送受話認識設定処理に移る。
送受話認識設定処理では、認識対象として特定の語句を検出する音声を、送話音声に限定するか、あるいは送話音声に加えて相手からの受話音声も含めるかを設定する。送受話を認識対象とする場合(ステップS2;はい)、制御部12は、制御信号によってスイッチ24,25をオンに設定する。これにより、受話データの出力がオンとなり(ステップS3)、マイクロホン29から入力され、A/D28でデジタル信号に変換された送話の音声信号と、復号器17から出力されてスイッチ25を通る受話の音声信号が加算器23で加算され、音声認識部20に与えられるようになる。
一方、送話のみを認識対象とする場合(ステップS2;いいえ)、制御部12は、制御信号によってスイッチ24,25をオフに設定する。これにより、復号器17から出力される受話の音声信号はスイッチ25で遮断される(ステップS4)。そして、マイクロホン29から入力され、A/D28でデジタル信号に変換された送話の音声信号のみが、加算器23を介して音声認識部20に与えられるようになる。なお、スイッチ24,25は同時にオン・オフされる。送受話認識設定処理によってスイッチ24,25の設定が行われると、音声認識部20による音声認識処理が開始される(ステップS5)。
音声認識処理が開始されると、音声認識部20は、加算器23から与えられる音声データを、予め登録されている特定の単語や句の音声パターン(例えば、現在時刻を問い合わせるための、「今何時」、「今の時刻は」等の音声パターン)と比較し、特定の語句の検出を行う。音声認識部20による音声認識処理は、特定の音声パターンが検出されなくても(ステップS6;いいえ)、通話中(ステップS10;いいえ)は常に繰り返して実行される。
加算器23から与えられる音声データ中に所定の語句が検出されると(ステップS6;はい)、音声認識部20は、制御部12に対して検出結果の信号を出力する。これにより、制御部12は、時計部16から時刻データを読み出して、音声合成部18に与える(ステップS7)。
音声合成部18は、制御部12から与えられた時刻データを、音声合成して合成音声データを出力する(ステップS8)。
音声合成部18で合成されて出力された合成音声データは、加算器21に与えられ、復号器17から出力される受話データに加算される(ステップS9)。そして、加算器21の加算結果は、D/A26でアナログ信号に変換され、スピーカ27から音響信号として出力される。
更に、スイッチ24がオンの場合(即ち、相手からの受話音声も音声認識の対象としている場合)、音声合成部18から出力された合成音声データは、スイッチ24を介して加算器22に与えられる。そして、マイクロホン29から入力され、A/D28でデジタル信号に変換された送話の音声信号と、音声合成部18から出力された合成音声データが、加算器23で加算されて符号器19に与えられる(ステップS9)。なお、スイッチ24がオフの場合(即ち、相手からの受話音声を音声認識の対象としていない場合)、合成音声データは、加算器22に与えられない。
符号器19で符号化された送話データは、携帯電話無線部11を介して、相手側の電話機に伝えられる。
音声認識部20による音声認識処理は、特定の音声パターンが検出されなくても(ステップS6;いいえ)通話が行われている間(ステップS10;いいえ)、継続して繰り返し行われる。そして、通話が終了すると(ステップS10;はい)、音声認識処理も終了する(ステップS11)。
図2で説明した第1の音声サービス処理は、認識対象の語句を一括してパターン・マッチング等によって検出しているため、認識対象の語句の範囲を拡大すると比較するデータ量が膨大になり、処理時間が長くなるおそれがあった。以下に説明する第2の音声サービス処理では、認識対象の語句を2つに分離して処理することによって、音声認識処理の負担を軽減するものである。
次に、図3を参照しつつ、図1の携帯電話機における第2の音声サービス処理を説明する。なお、この図3において、図2と同様のステップについては同じ符号を付し、その説明を簡略化する。
図3のステップS2の送受話認識設定処理によってスイッチ24,25の設定が行われると、音声認識部20による第1の音声認識処理が開始される(ステップS12)。
第1の音声認識処理では、認識対象の語句(例えば、「今何時」、「今の時刻は」、「今日は何日」、「今日は何曜日」等)の内の、最初の単語である第1登録単語(この場合は、「今」、「今日は」)のみを認識対象単語として検出処理を行う(ステップS13)。このステップS13の検出処理は、第1登録単語が検出されず(ステップS13;いいえ)、かつ、通話が行われている間(ステップS14;いいえ)、継続して行われる。通話が終了すれば(ステップS14;はい)、ステップS19の音声認識終了処理へ進む。
ステップS13の検出処理で第1登録単語(例えば、「今」)が検出されると(ステップS13;はい)、第2の音声認識処理が開始される(ステップS15)。
第2の音声認識処理が開始されると、第1登録単語(この場合は、「今」)の後に続く第2登録単語(この場合は、「何時」と「時刻」)の検出処理を行う(ステップS16)。もしも、第1登録単語として「今日は」が検出された場合には、第2登録単語として、「何日」とび「何曜日」の検出処理を行うことになる。
第2登録単語の検出処理において、検出された単語が第2登録単語ではなく(ステップS16;いいえ)、かつ、その単語が登録外単語でない(ステップS17;いいえ)場合は、第2登録単語の検出処理が継続される。第2登録単語の検出処理(ステップS16)において、第2登録単語が検出されると(ステップS16;はい)、音声認識部20は、制御部12に対して検出結果の信号を出力する。これにより、制御部12は、時計部16から時刻データを読み出して、音声合成部18に与える(ステップS7)。
音声合成部18は、時刻データを音声合成して合成音声データを出力し(ステップS8)、加算器21はこの合成音声データを、復号器17から出力される受話データに加算する(ステップS9)。更に、加算器21の加算結果は、D/A26でアナログ信号に変換され、スピーカ27から音響信号として出力される。なお、制御部12では、通話終了の判定が行われる(ステップS18)。
第2登録単語の検出処理において、検出された単語が第2登録単語ではなく(ステップS16;いいえ)、かつ、その単語が登録外単語の場合(ステップS17;はい)、通話終了の判定を行う(ステップS18)。更に、通話が継続されていれば(ステップS18;いいえ)、ステップS12へ戻って、再び第1音声認識処理が開始される。そして、通話の終了により(ステップS18;はい)、音声認識処理も終了する(ステップS19)。
以上詳細に説明したように、この第1の実施形態の携帯電話機は、次のような利点がある。
(1) この携帯電話機は、通話中の音声を認識する音声認識部20と、認識結果に応じて要求された情報(例えば時刻情報)を出力する制御部12と、制御部12から出力される情報を音声データに変換する音声合成部18を有している。これにより、ユーザは、通話中に携帯電話機の操作部を操作せずに、必要な情報を音声で得ることができる。従って、ユーザは必要な情報を得るために、通話中に携帯電話機を耳から離して特別な操作をする必要がなくなり、通話をスムーズに継続しながら、必要な情報を取得することができる。
(2) 携帯電話機の所有者の音声だけでなく、通話相手の音声を認識して必要な情報を音声で相手側にも伝えるための加算器22,23や、スイッチ24,25を有している。これにより、スイッチ24,25の設定により、通話相手にも音声サービスを提供することができる。
(3) 図3に示した第2の音声サービス処理では、音声認識処理を2段階に分離している。これにより、各段階での認識対象の語句の種類が減少すると共に、認識対象の語句の長さ(即ち、データ量)も削減することができる。従って、音声認識処理のための負荷を大幅に軽減することができ、処理速度を向上することができる。
(第2の実施形態)
図4に示すように、本発明の第2の実施形態の音声情報提供システムは、複数の交換機1a,1b,…を収容する交換網1と、この交換網1に接続される音声サービス・サーバ2とで構成されている。交換機1a,1b,…には、図示していないが、電話機(携帯電話機、固定電話機を問わない)が接続されている。
音声サービス・サーバ2は、予め登録された電話機からの発呼や予め登録された電話機への着呼に応じて、3者通話における第3者として接続され、発呼側の電話機と着呼側の電話機の間の通話音声を認識し、所望の情報を音声データとして提供するものである。
音声サービス・サーバ2は、信号処理部2a、音声認識部2b、音声合成部2c、データベース2d、時計部2e、および制御部2fを備えている。
信号処理部2aは、3者通話のための接続制御や音声信号の加算等の信号処理を行うものである。音声認識部2bは、発呼側と着呼側の電話機から出力される音声信号を入力し、その音声信号の中に予め定められた語句があればその検出を行うものである。この音声認識部2bは、予め定められた語句を検出したときに、その検出内容を制御部2fに与えるようになっている。
音声合成部2cは、制御部2fから与えられる情報を音声データに変換するものである。この音声合成部2cで生成された合成音声データは、信号処理部2aに与えられ、発呼側と着呼側の電話機間で送受信される音声信号に重畳されるようになっている。
データベース2dは、音声サービスとして提供するための各種の情報を格納するものである。このデータベース2dは、制御部2fから与えられる検索要求に従って提供すべきデータを読み出し、制御部2fに出力するようになっている。時計部2eは、制御部2fからの要求に従って、現在時刻等の時刻データを提供するものである。
制御部2fは、音声サービス・サーバとしての全体の動作を制御するものである。即ち、この制御部2fは、交換網1からの接続要求を受けたときに、接続先の発呼側または着呼側の電話機がサービス対象の電話機として登録されているか否かを判定して信号処理部2aに対して接続の可否を指示するものである。また、制御部2fは、接続後に、音声認識部2bの検出結果に基づいて、データベース2dや時計部2eを検索して要求された情報を取得し、音声合成部2cに与える機能を有している。
次に、図5を参照しつつ、図4の音声情報提供システムにおける第1の音声サービス処理を説明する。
音声サービス・サーバ2の制御部2fは、信号処理部2aを介して交換網1から与えられる接続要求を監視する(ステップS21)。登録された電話機1a等からの接続要求がくるまでの間(ステップS21;いいえ)、監視処理を継続する。登録された電話機1a等からの接続要求があると(ステップS21;はい)、ステップS22の音声認識・合成チャネル設定処理に移る。
音声認識・合成チャネル設定処理では、発呼側交換機の発信者・着信者のサービス提供有無に従って、音声認識部2bと音声合成部2cに所定の信号を接続する(ステップS22)。これにより、交換網1からの音声信号が音声認識部2bに与えられ、音声認識処理が開始される(ステップS23)。また、音声合成部2cで合成される音声信号は、交換機1側へ出力されるようになる。
音声認識処理が開始されると、音声認識部2bは、信号処理部2aから与えられる音声データを、予め登録されている特定の語句の音声パターン(例えば、現在時刻を問い合わせるための、「今何時」、「今の時刻は」等の音声パターン)と比較し、特定の語句の検出を行う。音声認識部2bによる検出処理は、特定の音声パターンが検出されなくても(ステップS24;いいえ)、回線が通話状態となっている間は(ステップS28;いいえ)、常に繰り返して実行される。
信号処理部2aから与えられる音声データ中に所定の語句が検出されると(ステップS24;はい)、音声認識部2bは、制御部2fに対して検出結果の信号を出力する。これにより、制御部2fは、検出結果に応じてデータベース2dや時計部2eから所望の情報(例えば、「今何時」の場合は、時計部2eから時刻情報)を読み出して、音声合成部2cに与える(ステップS25)。
音声合成部2cは、制御部2fから与えられた情報(この場合は、時刻データ)を、音声合成して合成音声データを出力する(ステップS26)。音声合成部2cから出力された合成音声データは、信号処理部2aに与えられ、送受話データに加算される(ステップS27)。そして、信号処理部2aの加算結果は、交換網1を介して発呼側と着呼側の電話機に送信される。
音声認識部2bによる音声認識処理は、電話機間の回線が接続されて通話状態となっている間(ステップS28;いいえ)、継続して繰り返し行われる。そして、通話が終了すると(ステップS28;はい)、ステップS29の音声認識・合成チャネルクローズ処理が行われる。
音声認識・合成チャネルクローズ処理では、通話が終了した回線の信号を、音声認識部2bと音声合成部2cから開放し(ステップS29)、これによって音声サービス処理は終了する。
図5で説明した第1の音声サービス処理は、認識対象の語句を一括してパターン・マッチング等によって検出するようにしているため、認識対象の語句等の範囲を拡大すると比較するデータ量が膨大になり、処理時間が長くなるおそれがあった。以下に説明する第2の音声サービス処理は、図1および図3を用いて説明した携帯電話機における第2の音声サービスと同様に、認識対象の語句等を2つに分割して処理することによって、図4の音声サービス・サーバにおける音声認識処理の負担を軽減するものである。
次に、図6を参照しつつ、図4の音声情報提供システムにおける第2の音声サービス処理を説明する。なお、この図6において、図5と同様のステップについては同じ符号を付し、その説明を簡略化する。
音声サービス・サーバ2の制御部2fは、交換網1からの接続要求を監視し(ステップS21)、登録された電話機1a等からの接続要求がくるまでの間(ステップS21;いいえ)監視処理を継続する。登録された電話機1a等からの接続要求があると(ステップS21;はい)、ステップS22の音声認識・合成チャネル設定処理を行う。
音声認識・合成チャネル設定処理(ステップS22)の完了により、第1の音声認識処理が開始される(ステップS30)。
第1の音声認識処理では、認識対象の語句(例えば、「今何時」、「今の時刻は」、「今日は何日」、「今日は何曜日」等)の内の、最初の単語である第1登録単語(この場合は、「今」、「今日は」)のみを認識対象単語として検出処理を行う(ステップS31)。このステップS31の検出処理は、第1登録単語が検出されず(ステップS31;いいえ)、かつ、通話が行われている間(ステップS32;いいえ)、継続して行われる。通話が終了すれば(ステップS32;はい)、ステップS29の音声認識・合成チャネルクローズ処理へ進む。
ステップS31の検出処理で第1登録単語(例えば、「今」)が検出されると(ステップS31;はい)、第2の音声認識処理が開始される(ステップS33)。
第2の音声認識処理が開始されると、第1登録単語(この場合は、「今」)の後に続く第2登録単語(この場合は、「何時」と「時刻」)の検出処理を行う(ステップS34)。もしも、第1登録単語として「今日は」が検出された場合には、第2登録単語として、「何日」と「何曜日」の検出処理を行うことになる。
第2登録単語の検出処理において、検出された単語が第2登録単語ではなく(ステップS34;いいえ)、かつ、その単語が登録外単語でない(ステップS35;いいえ)場合は、第2登録単語の検出処理が継続される。第2登録単語の検出処理(ステップS34)において、第2登録単語が検出されると(ステップS34;はい)、音声認識部2bは、制御部2fに対して検出結果の信号を出力する。これにより、制御部2fは、データベース2dや時計部2eから所望の情報を読み出して、音声合成部2cに与える(ステップS25)。
音声合成部2cは、制御部2fから与えられた情報を音声合成して合成音声データを出力し(ステップS26)、信号処理部2aはこの合成音声データを、送受話データに加算する(ステップS27)。そして、信号処理部2aの加算結果は、交換網1を介して発呼側と着呼側の電話機に送信される。音声認識部2bによる音声認識処理は、電話機間の回線が接続されて通話状態となっている間(ステップS28;いいえ)継続して繰り返し行われ、通話が終了すると(ステップS28;はい)、ステップS29の音声認識・合成チャネルクローズ処理が行われる。
第2登録単語の検出処理において、検出された単語が第2登録単語ではなく(ステップS34;いいえ)、かつ、その単語が登録外単語の場合(ステップS35;はい)、通話終了の判定を行う(ステップS28)。更に、通話が継続されていれば(ステップS28;いいえ)、ステップS30へ戻って、再び第1音声認識処理が開始される。そして、通話の終了により(ステップS28;はい)、ステップS29の音声認識・合成チャネルクローズ処理が行われる。
図4の音声情報提供システムにおける発呼側と着呼側の電話機間での接続動作は、図7および図8に示すようなシーケンスで行われる。
図7は、音声サービス・サーバによるサービスが提供される場合の動作シーケンスを示している。
発呼電話機から発呼側交換機1aに対して「呼設定」が行われると、発呼側交換機1aは音声サービス・サーバ2に対して「サービス問い合わせ」を行い、音声サービス・サーバ2は、これに対して「サービス通知」を返す。発呼側交換機1aは、更に、着呼側交換機1bに対して「回線接続要求」を行う。
着呼側交換機1bは、発呼側交換機1aに対して「回線接続確認応答」を返すと共に、着呼電話機に対して「一斉呼び出し」と「呼設定」を行う。「呼設定」を受信した着呼電話機は、着信音を出力すると共に、着呼側交換機1bに対して「呼び出し中」信号を送信する。「呼び出し中」信号は、着呼側交換機1bから発呼側交換機1aを介して発呼電話機に送信され、発呼電話機から呼び出し中を示す呼び出し音が出力される。
着呼電話機のユーザが、着信音に従って応答すると、着呼電話機から通話開始を示す「応答」信号が着呼側交換機1bを介して発呼側交換機1aに送信される。「応答」信号を受けた発呼側交換機1aは、音声サービス・サーバ2に対して「サービス回線接続要求」を送信する。「サービス回線接続要求」を受けた音声サービス・サーバ2は、発呼側交換機1aに対して「サービス回線接続確認応答」を送信する。
発呼側交換機1aは発呼電話機に対して通話開始を示す「応答」信号を出力する。発呼電話機は、発呼側交換機1aに対して「確認応答」を送信し、この「確認応答」は、着呼側交換機1bを経由して着呼電話機に伝えられる。これにより、発呼電話機と着呼電話機の間の回線接続が行われると共に、この回線に音声サービス・サーバ2が接続され、音声サービスの提供が開始される。
通話を終了するとき、発呼電話機から発呼側交換機1aに「呼開放」信号を送信すると、この発呼側交換機1aは、着呼側交換機1bに「呼開放」信号を送信すると共に、音声サービス・サーバ2に対して「サービス回線開放要求」を送信する。これにより、音声サービス・サーバ2では、サービス回線を開放し、その回線に対する音声サービス処理を終了する。一方、「呼開放」信号を受信した着呼側交換機1bは、着呼電話機に「呼開放」信号を送信して回線を切断する。
図8は、音声サービス・サーバによるサービスが提供されない場合の動作シーケンスを示している。
発呼電話機から発呼側交換機1aに対して「呼設定」が行われると、発呼側交換機1aは音声サービス・サーバ2に対して「サービス問い合わせ」を行い、音声サービス・サーバ2は、これに対して「サービス通知」を返す。発呼交換機1aは、更に、着呼側交換機1bに対して「回線接続要求」を行う。
着呼側交換機1bは、発呼交換機1aに対して「回線接続確認応答」を返すと共に、着呼電話機に対して「一斉呼び出し」と「呼設定」を行う。「呼設定」を受信した着呼電話機は、着信音を出力すると共に、着呼側交換機1bに対して「呼び出し中」信号を送信する。「呼び出し中」信号は、着呼側交換機1bから発呼側交換機1aを介して発呼電話機に送信され、発呼電話機から呼び出し中を示す呼び出し音が出力される。
着呼電話機のユーザが、着信音に従って応答すると、着呼電話機から通話開始を示す「応答」信号が着呼側交換機1bを介して発呼側交換機1aに送信される。「応答」信号を受けた発呼側交換機1aは、音声サービス・サーバ2に対して「サービス回線接続要求」を送信する。「サービス回線接続要求」を受けた音声サービス・サーバ2は、発呼電話機や着呼電話機が登録されていない電話機の場合、発呼側交換機1aに対して「サービス回線接続不可応答」を送信する。
発呼側交換機1aは発呼電話機に対して通話開始を示す「応答」信号を出力する。発呼電話機は、発呼側交換機1aに対して「確認応答」を送信し、この「確認応答」は、着呼側交換機1bを経由して着呼電話機に伝えられる。
これにより、発呼電話機と着呼電話機の間の回線接続が行われる。この場合、回線に音声サービス・サーバ2は接続されず、音声サービスの提供は行われない。
通話を終了するとき、発呼電話機から発呼側交換機1aに「呼開放」信号を送信すると、この発呼側交換機1aは、着呼側交換機1bに「呼開放」信号を送信する。「呼開放」信号を受信した着呼側交換機1bは、着呼電話機に「呼開放」信号を送信して回線を切断する。
以上詳細に説明したように、この第2の実施形態の音声情報提供システムは、次のような利点がある。
交換網1に、3者通話における第3者として接続され、発呼側の電話機と着呼側の電話機の間の通話音声を認識し、所望の情報を音声データとして提供する機能を有する音声サービス・サーバ2を接続している。これにより、第1の実施形態の携帯電話機のように個々の電話機に音声認識機能等を設ける必要がない。即ち、一般的な電話機を使用して音声によって情報を得ることができる。
更に、図6に示した第2の音声サービス処理では、音声認識処理を2段階に分離している。これにより、各段階での認識対象の語句の種類が減少すると共に、認識対象の語句の長さ(即ち、データ量)も削減することができる。従って、音声認識処理のための負荷を大幅に削減することができ、処理速度を向上することができる。
なお、本発明は、上記実施形態に限定されるものではなく、下記のような種々の変形が可能である。
(a) 図1の携帯電話機では、スイッチ24,25を同時にオン・オフ制御するようにしているが、個別にオン・オフ制御するようにしても良い。例えば、スイッチ24をオン、スイッチ25をオフにすれば、受話音声は音声認識の対象とはならないが、送話音声に基づいて音声合成された音声データを相手側に送信することができる。
(b) 携帯電話機は、図1の構成に限定されない。例えば、図9に示すように、復号器17で復号された受話音声データと、音声合成部18で生成された合成音声データを、それぞれ別のD/A26a,26bでアナログ信号に変換し、更に別のスピーカ27a,27bから音響信号として出力するように構成しても良い。例えば、このとき、スピーカ27bに骨伝導スピーカを使用することもできる。これにより、受話音声と合成音声を明瞭に聞き分けることができる。
(c) 更に、図9に示すように、A/D28と加算器22の間にスイッチ30を挿入し、押しボタン等によって、このスイッチ30をオフ状態にできるように構成しても良い。これにより、ユーザが音声認識部20に時刻を問い合わせるときに、スイッチ30をオフ状態にして、例えば「今何時」と発声すると、この声は相手側の電話機に送信されない。従って、問い合わせの声やそれに対する応答の音声が相手側に送信されず、不必要な音声で相手側を混乱させるおそれをなくすことができる。
(d) 音声サービスとして提供する音声情報は、時刻情報に限定されない。時間、場所、天気、テレビ、番号・数、言語、買い物等の各種のカテゴリに対して、各種の情報を合成音声によって提供することができる。いわゆるコンシェルジェ・サービス(ホテルマンが、泊まり客の求めに応じて各種の案内を行うサービス)として考えられるサービスの例を図10に示す。
(e) 図3および図6では、音声認識を2段階に分けて行う音声サービス処理を説明したが、3段階以上に分けて音声認識を行うようにしても良い。これにより、図10に示すような複雑な要求を認識して、的確な情報を提供することが可能になる。
1 交換網
1a 発呼側交換機
1b 着呼側交換機
2 音声サービス・サーバ
2a 信号処理部
2b,20 音声認識部
2c 音声合成部
2d データベース
2e,16 時計部
2f,12 制御部
11 携帯電話無線部
13 メモリ
14 操作部
15 表示部
17 復号器
18 音声合成部
19 符号器
21〜23 加算器
24,25,30 スイッチ
26,26a,26b D/A(デジタル・アナログ変換器)
27,27a スピーカ
27b 骨伝導スピーカ
28 A/D(アナログ・デジタル変換器)
29 マイクロホン

Claims (10)

  1. 通話中のユーザの音声データに含まれる特定の語句を検出する音声認識手段と、
    前記音声認識手段で検出された語句に応じて情報を出力する情報出力手段と、
    前記情報出力手段から出力される情報を合成音声データに変換して出力する音声合成手段と、
    前記合成音声データを前記ユーザに音声信号として出力する出力手段と、
    を備えることを特徴とする携帯電話機。
  2. 前記音声認識手段は、前記ユーザの音声データに加えて、通話相手の音声データに含まれる前記特定の語句を検出し、
    前記出力手段は、前記合成音声データを前記ユーザに音声信号として出力すると共に、該合成音声データを前記ユーザの音声データに重畳して前記通話相手に送信する、
    ことを特徴とする請求項1に記載の携帯電話機。
  3. 前記出力手段は、前記合成音声データを前記通話相手の音声データに重畳し、前記音声信号として出力することを特徴とする請求項1または2に記載の携帯電話機。
  4. 前記出力手段は、前記合成音声データと前記通話相手の音声データを、それぞれ第1および第2の音響出力手段から音声信号として出力することを特徴とする請求項1または2に記載の携帯電話機。
  5. 前記第1および第2の音響出力手段の内の1つは、骨伝導スピーカであることを特徴とする請求項4に記載の携帯電話機。
  6. 前記特定の語句は、現在の時刻または日時を問い合わせるための語句であり、前記情報出力手段は、該特定の語句に応じて時刻または日時の情報を出力することを特徴とする請求項1乃至5のいずれか1項に記載の携帯電話機。
  7. 前記音声認識手段は、前記音声データに含まれる検出対象の特定の語句が複数の単語を所定の順番に並べた構成となっている場合に、該語句を複数の単語に分解して順次検出することを特徴とする請求項1乃至6のいずれか1項に記載の携帯電話機。
  8. 電話交換網に接続され、通話中の音声データに含まれる特定の語句に応じて対応する情報を該音声データに重畳して出力する音声情報提供システムであって、
    前記通話中の音声データに含まれる特定の語句を検出する音声認識手段と、
    前記音声認識手段で検出された語句に応じて情報を出力する情報出力手段と、
    前記情報出力手段から出力される情報を合成音声データに変換して出力する音声合成手段と、
    前記合成音声データを前記音声データに重畳して出力する出力手段と、
    を備えることを特徴とする音声情報提供システム。
  9. 前記特定の語句は、現在の時刻または日時を問い合わせるための語句であり、前記情報出力手段は、該特定の語句に応じて時刻または日時の情報を出力することを特徴とする請求項8に記載の音声情報提供システム。
  10. 前記音声認識手段は、前記音声データに含まれる検出対象の特定の語句が複数の単語を所定の順番に並べた構成となっている場合に、該語句を複数の単語に分解して順次検出することを特徴とする請求項8または9に記載の音声情報提供システム。
JP2009109701A 2009-04-28 2009-04-28 携帯電話機および音声情報提供システム Pending JP2010258989A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009109701A JP2010258989A (ja) 2009-04-28 2009-04-28 携帯電話機および音声情報提供システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009109701A JP2010258989A (ja) 2009-04-28 2009-04-28 携帯電話機および音声情報提供システム

Publications (1)

Publication Number Publication Date
JP2010258989A true JP2010258989A (ja) 2010-11-11

Family

ID=43319356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009109701A Pending JP2010258989A (ja) 2009-04-28 2009-04-28 携帯電話機および音声情報提供システム

Country Status (1)

Country Link
JP (1) JP2010258989A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017163492A (ja) * 2016-03-11 2017-09-14 ソフトバンク株式会社 通信システム及びプログラム
JPWO2019064388A1 (ja) * 2017-09-27 2020-04-09 三菱重工エンジン&ターボチャージャ株式会社 タービンハウジング及びこれを備えた過給機

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017163492A (ja) * 2016-03-11 2017-09-14 ソフトバンク株式会社 通信システム及びプログラム
JPWO2019064388A1 (ja) * 2017-09-27 2020-04-09 三菱重工エンジン&ターボチャージャ株式会社 タービンハウジング及びこれを備えた過給機

Similar Documents

Publication Publication Date Title
US7650168B2 (en) Voice activated dialing for wireless headsets
US9948772B2 (en) Configurable phone with interactive voice response engine
US8112125B2 (en) Voice activated dialing for wireless headsets
US7643619B2 (en) Method for offering TTY/TDD service in a wireless terminal and wireless terminal implementing the same
US20110111735A1 (en) Phone hold mechanism
CN102740227A (zh) 一种紧急呼叫方法及装置
KR20130018105A (ko) 모바일 개인 비서를 위한 방법 및 그 전자 장치
WO2003101077A1 (fr) Telephone portable
JP2010258989A (ja) 携帯電話機および音声情報提供システム
JP2003152856A (ja) 通信端末装置、通信方法、およびそのプログラム
JP2015023485A (ja) 特定音付き音声コマンド対応情報端末
JP2011004312A (ja) 通信装置及び通信システム
JP2005012398A (ja) 移動通信端末
JP2006014216A (ja) 通信端末及び辞書作成方法
JP2004343566A (ja) 移動電話端末及びプログラム
JP3477099B2 (ja) 電話装置
JP2005222410A (ja) 車載用ハンドフリーメール装置
JP2005354320A (ja) 通信処理装置、通信処理システム及び通信処理方法
KR100605802B1 (ko) 휴대용 단말기의 키소리음 제어방법
JP2005269259A (ja) 音声変換機能付き携帯電話及び通話方法並びにプログラム
KR20000042799A (ko) 동영상 전화장치의 영상 송,수신 제어방법
JP2003008696A (ja) 携帯電話装置
KR20040089899A (ko) 통신단말기용 발신자 정보 출력 제어 툴 및 발신자 정보출력 제어 방법
JP2002354101A (ja) 移動通信装置
JPH11112633A (ja) 携帯電話