JP3862069B2 - 音声入力装置 - Google Patents

音声入力装置 Download PDF

Info

Publication number
JP3862069B2
JP3862069B2 JP2002053632A JP2002053632A JP3862069B2 JP 3862069 B2 JP3862069 B2 JP 3862069B2 JP 2002053632 A JP2002053632 A JP 2002053632A JP 2002053632 A JP2002053632 A JP 2002053632A JP 3862069 B2 JP3862069 B2 JP 3862069B2
Authority
JP
Japan
Prior art keywords
voice recognition
mobile phone
voice
phone terminal
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002053632A
Other languages
English (en)
Other versions
JP2003259009A (ja
Inventor
正樹 内藤
恒夫 加藤
徹 清水
誉典 白井
新吾 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2002053632A priority Critical patent/JP3862069B2/ja
Publication of JP2003259009A publication Critical patent/JP2003259009A/ja
Application granted granted Critical
Publication of JP3862069B2 publication Critical patent/JP3862069B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声入力装置に関し、特に、携帯電話上のパケット通信などのデータ通信を用いた情報提供サービスにおける検索項目や検索語などの入力時の操作性を向上させることができる音声入力装置に関する。
【0002】
【従来の技術】
現在、パケット通信などを利用した種々の携帯電話向け情報提供サービスが行われており、携帯電話の利用者は、携帯電話端末から検索項目や検索語を入力することにより、自分の欲する各種情報を適宜取得し、それを画像あるいは文字として表示画面上に表示させることができるため、このサービスは、有用な情報源となっている。
【0003】
携帯電話端末からの検索項目や検索語の入力は、一般的には、携帯電話端末の表示画面上にメニューを表示させ、その中から適当なものを選択したり、キーを用いて文字入力したりすることにより行われる。
【0004】
また、これを音声入力により行うことも提案されている。例えば、特開2001−268241号には、無線携帯端末から音声により検索項目や検索語を入力し、入力された音声をセンタにおいて音声認識し、この認識結果に基づいてインターネットを介して情報検索を行い、検索結果である画像や音声情報を無線携帯端末に返送して画像や文字として表示させ、また、音声として出力させる無線携帯端末システムが記載されている。
【0005】
また、携帯型情報端末から入力した音声情報をサーバに送り、サーバ内で音声認識した結果を文字情報として携帯型情報端末に返送することにより、入力した音声を文字化して表示するようにした携帯型情報端末における音声情報の利用方式も、特開平7−222248号公報に記載されているように公知である。
【0006】
【発明が解決しようとする課題】
しかしながら、携帯電話端末の表示画面上に表示されたメニューを選択したりキーを入力したりして検索項目や検索語を入力するものでは、自分の欲する情報が取得されるまでの操作が多く、操作性が悪いという問題がある。
【0007】
また、特開2001−268241号に記載されている無線携帯端末システムは、音声制御部、音声認識部、情報検索部、音声変換部およびパケット制御部を有するセンタを設けて音声入力を可能にするものであり、センタにおいてインターネットを介して情報検索を行い、検索された情報をセンタを介して無線携帯端末に返送するものであるため、センタの設備が大掛かりになり、また、携帯電話向け情報提供サービスに既存する情報検索機能や情報送信機能を有効に利用しているとはいえない。
【0008】
また、特開平7−222248号公報に記載されているものは、単に、入力された音声を文字化して表示しようとするものであり、携帯電話向け情報提供サービスにおいての検索項目や検索語などの入力についてのものでなく、大規模なハードウエアを必要とする音声認識機能を携帯型情報端末とは別のサーバに持たせることを開示するにすぎない。
【0009】
本発明は、携帯電話向け情報提供サービスにおける問題を解決するものであり、携帯電話向け情報提供サービスにおいて既存する情報検索機能および情報送信機能を有効に利用しつつ、パケット通信などのデータ通信と音声通話上の音声認識機能とを連携させて、それを支援することにより携帯電話端末からの検索項目や検索語などの入力時の操作性を向上させることができる音声入力装置を提供することを目的とする。
【0010】
【課題を解決するための手段】
前記目的を達成するために、 携帯電話端末のIDと該携帯電話端末の電話番号を対応させて登録するユーザ登録部と、携帯電話向け情報提供サービス・音声認識連携部と、音声認識部と、携帯電話端末の電話番号とコンテンツ提供サイトから現在受けているサービスの内容に従って音声認識で認識すべき内容と該電話番号の携帯電話端末から電話網を介して送られる音声の認識結果を対応させて登録する携帯電話向け情報提供サービス・音声認識連携データベースとを具備し、前記音声認識部は、携帯電話端末から電話網を介して送られる音声を前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された音声認識で認識すべき内容に応じて認識し、その認識結果を該携帯電話端末の電話番号に対応させて前記携帯電話向け情報提供サービス・音声認識連携データベースに登録し、前記携帯電話向け情報提供サービス・音声認識連携部は、データ通信網を介して送られる携帯電話端末からの音声入力開始の指示により該携帯電話端末のIDに対応する電話番号を前記ユーザ登録部より取得して前記携帯電話向け情報提供サービス・音声認識連携データベースに登録すると共に、該携帯電話端末に対し前記音声認識部との音声通話の開始を指示し、さらに、前記ユーザ登録部を参照して前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された、該携帯電話端末に対応する認識結果を取得して前記データ通信網を介して返送する点に第1の特徴がる。
【0011】
また、本発明は、携帯電話向け情報提供サービス・音声認識連携部と、音声認識部と、携帯電話端末の電話番号とコンテンツ提供サイトから現在受けているサービスの内容に従って音声認識で認識すべき内容と該電話番号の携帯電話端末から電話網を介して送られる音声の認識結果を対応させて登録する携帯電話向け情報提供サービス・音声認識連携データベースとを具備し、前記音声認識部は、携帯電話端末から電話網を介して送られる音声を前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された音声認識で認識すべき内容に応じて認識し、その認識結果を該携帯電話端末の電話番号に対応させて前記携帯電話向け情報提供サービス・音声認識連携データベースに登録し、前記携帯電話向け情報提供サービス・音声認識連携部は、データ通信網を介して携帯電話端末から送られる声入力開始の指示および該携帯電話端末の電話番号を受け、該電話番号を前記携帯電話向け情報提供サービス・音声認識連携データベースに登録すると共に、該携帯電話端末に対し前記音声認識部との音声通話の開始を指示し、さらに、前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された、該携帯電話端末に対応する認識結果を取得して前記データ通信網を介して返送する点に第2の特徴がある。
【0012】
また、本発明は、携帯電話向け情報提供サービス・音声認識連携部と、音声認識部と、携帯電話端末のIDと前記音声認識部への電話回線のIDとの対応、前記電話回線のIDと前記音声認識部への電話回線の電話番号の対応、および前記電話回線のIDとコンテンツ提供サイトから現在受けているサービスの内容に従って音声認識で認識すべき内容と音声認識結果との対応を登録する携帯電話向け情報提供サービス・音声認識連携データベースとを具備し、前記音声認識部は、携帯電話端末から電話網を介して送られる音声を前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された音声認識で認識すべき内容に応じて認識し、その認識結果を携帯電話向け情報提供サービス・音声認識連携データベースに前記電話回線のIDに対応させて前記音声認識結果として登録し、前記携帯電話向け情報提供サービス・音声認識連携部は、データ通信網を介して携帯電話端末から送られる音声入力開始の指示により該携帯電話端末に対して音声認識に用いる電話回線を割り振り、該割り振った電話回線のIDと該携帯電話端末のIDとの対応を携帯電話向け情報提供サービス・音声認識連携データベースに登録すると共に、登録されている電話回線のIDと音声認識部への電話回線の電話番号との対応を参照して前記音声認識部への電話回線の電話番号を取得して該携帯電話端末に対し前記音声認識部との音声通話の開始を指示し、さらに、携帯電話向け情報提供サービス・音声認識連携データベースに登録された、電話回線のIDと音声認識結果との対応を参照して該携帯電話端末に対応する認識結果を取得して前記データ通信網を介して返送する点に第3の特徴がある。
【0013】
また、本発明は、携帯電話向け情報提供サービス・音声認識連携部と、音声認識部と、携帯電話端末のID、該携帯電話端末の電話番号とコンテンツ提供サイトから現在受けているサービスの内容に従って音声認識で認識すべき内容と該電話番号の携帯電話端末から電話網を介して送られる音声の認識結果を対応させて登録する携帯電話向け情報提供サービス・音声認識連携データベースとを具備し、前記音声認識部は、携帯電話端末から電話網を介して送られる音声を前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された音声認識で認識すべき内容に応じて認識し、その認識結果を該携帯電話端末の電話番号に対応させて前記携帯電話向け情報提供サービス・音声認識連携データベースに登録し、前記携帯電話向け情報提供サービス・音声認識連携部は、データ通信網を介して送られる携帯電話端末からの音声入力開始の指示により該携帯電話端末に対し前記音声認識部との音声通話の開始を指示し、さらに、前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された、該携帯電話端末に対応する認識結果を取得して前記データ通信網を介して返送する点に第4の特徴がある。
【0014】
さらに、本発明は、携帯電話向け情報提供サービス・音声認識連携部と、音声認識部と、携帯電話端末のID、前記音声認識部への電話回線のID、前記音声認識部への電話回線の電話番号とコンテンツ提供サイトから現在受けているサービスの内容に従って音声認識で認識すべき内容と音声認識結果との対応を登録する携帯電話向け情報提供サービス・音声認識連携データベースとを具備し、前記音声認識部は、携帯電話端末から電話網を介して送られる音声を前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された音声認識で認識すべき内容に応じて認識し、その認識結果を携帯電話向け情報提供サービス・音声認識連携データベースに前記電話回線のIDに対応させて前記音声認識結果として登録し、前記携帯電話向け情報提供サービス・音声認識連携部は、データ通信網を介して携帯電話端末から送られる音声入力開始の指示により該携帯電話端末に対して音声認識に用いる前記電話回線を割り振り、該割り振った電話回線のIDを該携帯電話端末のIDと対応させて携帯電話向け情報提供サービス・音声認識連携データベースに登録すると共に、登録されている電話回線のIDと音声認識部への電話回線の電話番号との対応を参照して前記音声認識部への電話回線の電話番号を取得して該携帯電話端末に対し前記音声認識部との音声通話の開始を指示し、さらに、携帯電話向け情報提供サービス・音声認識連携データベースに登録された、電話回線のIDと音声認識結果との対応を参照して該携帯電話端末に対応する認識結果を取得して前記データ通信網を介して返送する点に第5の特徴がある。
【0015】
第1ないし第5の特徴によれば、携帯電話向け情報提供サービスのシステムにおいて既存する情報検索機能および情報送信機能を有効に利用しつつ、データ通信と音声通話上の音声認識機能とを連携させて、それを支援することにより携帯電話端末からの検索項目や検索語などの入力時の操作性を向上させることができる
【0016】
また、第1および第4の特徴によれば、音声認識サイトが携帯電話端末のIDと該携帯電話端末の電話番号との対応表を持つため、その対応表を持たない複数のコンテンツ提供サイトでも音声認識サイトを利用することができる。
【0017】
また、第2の特徴によれば、コンテンツ提供サイトが既に携帯電話端末の電話番号に関する情報を有している場合に、新たにユーザ登録により携帯電話端末の電話番号を登録することが不要になり、その登録の手間が省ける。
【0018】
また、第3および第5の特徴によれば、携帯電話端末の電話番号を登録する必要がなく、その登録の手間が省けると共に、個人情報の保護を図ることができる。
【0019】
また、第4および第5の特徴によれば、処理が簡単になると共に、登録するデータ量を減らすことができる。
【0020】
【発明の実施の形態】
以下、図面を用いて、本発明の実施形態を詳細に説明する。図1は、本発明の音声入力装置の第1の実施形態を含む携帯電話向け情報提供サービスシステム全体の一例を示すブロック図である。同図において、音声認識サイト1は、本発明の音声入力装置を構成するものであり、ユーザ登録部2、携帯電話向け情報提供サービス・音声認識連携部(以下、連携部と記す。)3、携帯電話向け情報提供サービス・音声認識連携データベース(以下、連携DBと記す。)4および音声認識部5を有する。
【0021】
連携部3は、パケット通信網などのデータ通信網を介して携帯電話端末A、B、・・・に結合され、音声認識部5は、電話網を介して携帯電話端末A、B、・・・に結合される。携帯電話端末A、B、・・・は、音声認識サイト1に電話網を介して音声を送り、その認識結果をデータ通信網を介して受けることができ、また、コンテンツ提供サイトCP1、CP2、・・・からデータ通信網を介して情報提供サービスを受けることができる。なお、コンテンツ提供サイトCP1、CP2、・・・の各々は、携帯電話端末A、B、・・・からの要求に応じてそれら端末にメニュー画面を表示させるページ、音声認識結果を表示させるページ、情報検索の結果を表示させるページなどを有する。
【0022】
次に、音声認識サイト1の動作を主に、図1のシステムの動作について図2のフロー図を参照しつつ説明する。以下では、携帯電話端末Aを使用するユーザがコンテンツ提供サイトCP1から情報提供サービスを受ける場合を例として説明する。
【0023】
まず、準備段階として、音声認識サイト1のユーザー登録部2に、ユーザが使用する携帯電話端末のIDと該携帯電話端末の電話番号との対応表、すなわち、ユーザ端末ID−電話番号対応テーブルを用意する。ここで、携帯電話端末のIDは、パケット通信などのデータ通信上で該携帯電話端末を特定するものであり、携帯電話端末の電話番号は、音声通話上で携帯電話端末を特定するものである。図3(a)は、このテーブルの一例であり、例えば、携帯電話端末AのID「01234567」に対応してその電話番号「090-7777-1111」が登録される。
【0024】
このテーブルを用意するためには、例えば、携帯電話端末をデータ通信網を介して音声認識サイト1に接続し、携帯電話端末に「利用者登録」を含むメニュー画面および電話番号の入力画面を順次表示させて自己の電話番号を入力させ、これを音声認識サイト1に送信するようにすればよい。また、以前に登録された電話番号と異なる電話番号が入力されたときには以前に登録された電話番号が更新されるようにすることもできる。
【0025】
携帯電話端末Aを使用したコンテンツ提供サイトCP1の情報提供サービス(S1)において、コンテンツ提供サイトCP1は、音声入力を必要とする箇所で音声入力使用開始のために携帯電話端末Aに音声認識サイト1への接続要求を指示する(S2)。なお、情報提供サービスの過程において音声入力を必要とする箇所は、予めプログラムにより決めておくことができ、その箇所で音声入力を行うかキー入力を行うかなどを選択可能にしておけば、従来のキーによる入力も可能にすることができる。この際、現在受けているサービスの内容、例えば「気象情報」、「交通情報」、「店に関する情報」などに対応した認識すべき内容が指定される。
【0026】
音声認識サイト1への接続要求に従って、携帯電話端末Aは、データ通信網を介して音声認識サイト1の連携部3へ接続する。この接続により携帯電話端末AのIDが連携部3に送られ、指定された認識すべき内容も連携部3に送られる(S3)。
【0027】
なお、情報提供サービスを受けるに際してユーザが認識すべき内容を指定したときに自動的に、あるいは携帯電話端末Aに「音声入力開始」を含むメニュー画面を表示させてユーザに音声入力使用を選択させて音声認識サイト1への接続や認識すべき内容の送信などを行うようにすることもできる。
【0028】
音声認識サイト1の連携部3は、携帯電話端末Aからの送信を受けると、そのIDを取得し、図3(a)のユーザ端末ID−電話番号対応テーブルを参照してそのIDに対応する電話番号を検索する(S4、S5)。携帯電話端末AのIDが図3(a)での「01234567」であり、その電話番号が「090-7777-1111」であるとする。これにより検索された電話番号と携帯電話端末Aを介して送信された認識すべき内容「TASK2」は、音声認識情報管理テーブルに登録される(S6)。音声認識情報管理テーブルは、連携DB4に設けられており、例えば、図3(b)に示されているように、携帯電話端末Aの電話番号「090-7777-1111」と認識すべき内容「TASK2」とを対応させて登録するものである。また、後述する音声認識の認識結果「フジヤ」もこれに対応して登録される。
【0029】
続いて、連携部3は、データ通信網を介して携帯電話端末Aに音声認識部5への通話要求を送信し(S7)、携帯電話端末Aと音声認識部5との間の通話路を確立させ、携帯電話網を介する音声通話を開始させる(S8)。
【0030】
音声通話においては、まず、音声認識部5は、発信者電話番号の認識により携帯電話端末Aの電話番号を取得し(S8)、次に、この電話番号を元に図3(b)の音声認識情報管理テーブルを参照して認識すべき内容「TASK2」を取得し(S9、S10)、携帯電話網を介する音声通話により入力された音声を、取得した認識すべき内容に応じて認識する(S11)。
【0031】
なお、ここでユーザに対して認識すべき内容の音声の入力を促す案内や入力された音声の確認のアナウンスを携帯電話網を介して携帯電話端末に送ることもできる。音声認識による認識結果「フジヤ」は、図2(b)の音声認識情報管理テーブルに、携帯電話端末Aの電話番号と対応して登録される(S12)。次に、音声認識部5から携帯電話端末Aに通話切断要求が送信されて(S13)、音声通話は終了する。
【0032】
次に、連携部3は、携帯電話端末AのID「01234567」を取得し(S14)、図3(a)のユーザ端末ID−電話番号管理テーブルを参照してこのIDに対応する電話番号「090-7777-1111」を取得し(S15、S16)、さらに、図3(b)の音声認識情報管理テーブルを参照してこの電話番号から認識結果「フジヤ」を取得する(S17、S18)。
【0033】
以上のようにして取得された認識結果は、データ通信網を介して連携部3より携帯電話端末Aに送信され(S19)、さらにコンテンツ提供サイトCP1に送信されて(S20)携帯電話端末Aとコンテンツ提供サイトCP1との間での情報提供サービスにおいて利用される。コンテンツ提供サイトCP1においては、認識結果に基づく情報の検索などが行われ、この結果が携帯電話端末Aの表示画面上に画像や文字などとして表示される(S21)。
【0034】
は、本発明の音声入力装置の第2の実施形態を含む携帯電話向け情報提供サービスシステム全体の他の例を示すブロック図である。なお、図1と同一あるいは同等部分には同じ符号を付している。
【0035】
第1の実施形態では、音声認識サイト1の内部に、データ通信上でユーザ端末である携帯電話端末を特定する携帯電話端末のIDと音声通話上で携帯電話端末を特定する該携帯電話端末の電話番号との対応表を作成し管理するようにしているが、本実施形態は、コンテンツ提供サイトが既に携帯電話端末の電話番号に関する情報を有している場合であり、音声認識サイトの内部にそのような対応表を作成することなく、コンテンツ提供サイトから音声認識サイトに接続する都度、携帯電話端末の電話番号を音声認識サイトに通知するようにするものである。図5は、この動作を示すフロー図であり、以下、図5を参照しつつ図4のシステムの動作について説明する。
【0036】
携帯電話端末Aを使用したコンテンツ提供サイトCP1の情報提供サービス(S1)において、コンテンツ提供サイトCP1は、音声入力を必要とする箇所で音声入力使用開始のために携帯電話端末Aに音声認識サイト1への接続要求を指示する(S2)。本実施形態においては、音声認識サイト1への接続要求および認識すべき内容と共に、使用されている携帯電話端末Aの電話番号がコンテンツ提供サイトCP1から取得されて(S2)音声認識サイト1に送信される(S3)。
【0037】
音声認識サイト1の連携部3は、携帯電話端末Aの電話番号と認識すべき内容とを対応させて音声認識情報管理テーブルに登録する(S6)。このテーブルは、第1の実施形態における図3(b)と同様のものである。
【0038】
次に、連携部3は、データ通信網を介して携帯電話端末Aに音声認識部5への通話要求を送信し(S7)、携帯電話端末Aと音声認識部5との間の通話路を確立させ、携帯電話網を介する音声通話を開始させる(S8)。
【0039】
音声通話においては、まず、音声認識部5は、発信者電話番号の認識により携帯電話端末Aの電話番号を取得し(S8)、次に、この電話番号を元に音声認識情報管理テーブルを参照して認識すべき内容「TASK2」を取得し(S9、S10)、携帯電話網を介する音声通話により入力された音声を、取得した認識すべき内容に応じて認識する(S11)。
【0040】
音声認識による認識結果「フジヤ」は、音声認識情報管理テーブルに、携帯電話端末Aの電話番号と対応して登録される(S12)。次に、音声認識部5から携帯電話端末Aに通話切断要求が送信されて(S13)、音声通話は終了する。
【0041】
次に、携帯電話端末Aは、連携部3に接続して自身の電話番号を送信し(S14)、連携部3は、音声認識情報管理テーブルを参照して携帯電話端末の電話番号から認識結果「フジヤ」を取得する(S17、S18)。
【0042】
以上のようにして取得された認識結果は、データ通信網を介して連携部3より携帯電話端末Aに送信され(S19)、さらにコンテンツ提供サイトCP1に送信されて(S20)携帯電話端末Aとコンテンツ提供サイトCP1との間での情報提供サービスにおいて利用される(S21)。
【0043】
図6は、本発明の音声入力装置の第3の実施形態を含む携帯電話向け情報提供サービスシステム全体のさらに他の例を示すブロック図である。なお、図1と同一あるいは同等部分には同じ符号を付している。
【0044】
本実施形態は、携帯電話端末の電話番号の情報を使用することなく、音声認識サイトを実現可能にするものである。ここでは音声認識サイト1の音声認識部5は、複数の電話回線を通じて携帯電話網に接続されるものとする。図7は、この動作を示すフロー図であり、以下、図7を参照しつつ図6のシステムの動作について説明する。
【0045】
まず、準備段階として、音声認識部5の各電話回線を特定するためのIDと音声認識部5の電話番号との対応を音声認識部電話番号テーブルに登録する。図8(a)は、音声認識部電話番号テーブルの一例を示し、例えば、音声認識部5の電話回線「1」の電話番号は、「012-7777-1111」であることを表している。
【0046】
携帯電話端末Aを使用したコンテンツ提供サイトCP1の情報提供サービス(S1)において、コンテンツ提供サイトCP1は、音声入力を必要とする箇所で音声入力使用開始のために携帯電話端末Aに音声認識サイト1への接続要求を指示する(S2)。本実施形態においては、音声認識サイト1への接続要求と共に、認識すべき内容が送信される(S2)。
【0047】
音声認識サイト1への接続要求に従って、携帯電話端末Aは、データ通信網を介して音声認識サイト1の連携部3へ接続する。この接続により携帯電話端末AのIDが連携部3に送信され、認識すべき内容が指定されている場合には、この認識すべき内容も連携部3に送信される(S3)。
【0048】
音声認識サイト1の連携部3は、携帯電話端末Aからのデータ通信網を介してそのID「01234567」を取得すると共に、携帯電話端末Aに対して音声認識に用いる音声認識部5の電話回線、例えばID「1」の回線を割り振る。これにより割り振られた音声認識部5の電話回線のIDと携帯電話端末AのIDとの対応は、連携DB4に設けられた、例えば、図8(b)に示すユーザ端末ID−音声認識部回線IDテーブルに登録される(S22)。
【0049】
また、割り振られた音声認識部5の電話回線のIDと携帯電話端末Aからの認識すべき内容「TASK2」とが音声認識情報管理テーブルに登録される(S23、S24)。音声認識情報管理テーブルも連携DB4に設けられており、例えば、図8(c)に示されているように、例えば「1」の音声認識部回線IDと、例えば「TASK2」の認識すべき内容とを対応させて登録するものである。また、後述する音声認識の認識結果「フジヤ」もこれに対応して登録される。
【0050】
続いて、連携部3は、図8(a)の音声認識部電話番号テーブルを参照して携帯電話端末Aが音声認識部5への接続に使用する音声通話の電話番号「012-7777-1111」を取得し(S25、S26)、その電話番号による音声認識部5への通話要求をデータ通信網を介して携帯電話端末Aに送信する(S7)。
【0051】
携帯電話端末Aは、この通話要求による電話番号「012-7777-1111」を使用して音声認識部5へ接続し(S8)、音声認識部5は、音声が入力される認識部回線ID「1」を元に音声認識情報管理テーブルを参照して認識すべき内容「TASK2」を取得する(S27、S10)。
【0052】
続いて、携帯電話網を介する音声通話により入力された音声を、取得した認識すべき内容に応じて認識する(S11)。音声認識による認識結果「フジヤ」は、図8(c)の音声認識情報管理テーブルに、音声認識部回線IDと対応して登録される(S12)。次に、認識部5より携帯電話端末Aに対して通話切断要求が送信され、音声通話は終了する(S13)。
【0053】
次に、連携部3は、携帯電話端末AのID「01234567」を取得し(S15)、図8(b)のユーザ端末ID−音声認識部回線IDテーブルを参照してこのIDに対応する音声認識部回線ID、すなわち、音声認識に使用した音声認識部5の回線のIDを調べ(S28、S29)、さらに図8(c)の音声認識情報管理テーブルを参照して認識結果「フジヤ」を取得する(S17、S18)。
【0054】
以上のようにして取得された認識結果は、データ通信網を介して連携部3より携帯電話端末Aに送信され(S19)、さらにコンテンツ提供サイトCP1に送信され(S20)、携帯電話端末Aとコンテンツ提供サイトCP1との間での情報提供サービスにおける情報の検索などに利用される(S21)。
【0055】
コンテンツ提供サイトCP1において、認識結果に基づく情報の検索などが行われ、その結果が携帯電話端末Aの表示画面上に画像や文字などとして表示されることは、第1の実施形態と同様である。
【0056】
以上、第1ないし第3の実施形態について説明したが、第1の実施形態は、音声認識サイトが携帯電話端末のIDと該携帯電話端末の電話番号との対応表を持つため、その対応表を持たない複数のコンテンツ提供サイトが音声認識サイトを利用する際に有利であり、第2の実施形態は、コンテンツ提供サイトが既に携帯電話端末の電話番号に関する情報を有している場合に、新たにユーザ登録により携帯電話端末の電話番号を登録する必要がないという利点がある。また、第3の実施形態は、携帯電話端末の電話番号を登録する必要がなく、その登録の手間が省けると共に、個人情報の保護の観点で優れている。
【0057】
なお、上記各実施形態では、認識すべき内容を携帯電話端末より指定する場合について説明したが、認識すべき内容は、複数のコンテンツ提供サイトや多様なコンテンツのサービスが存在する場合に、それらサービスの内容に対応するものであり、認識すべき内容を指定し、この指定に応じて音声認識における認識手法や辞書、語句の長さなどを切り替えたり制限したりするなどすれば、処理の軽減、高速化および認識精度の向上が可能になる。
【0058】
また、携帯電話端末により音声入力の開始が指示されて音声認識サイトが接続される際に、音声認識サイトにおける処理の終了後の移動先を指定するようにすることもでき、これにより操作性を向上させることができる。
【0059】
以上ではデータ通信と音声通話の開始と終了の扱いについて具体的に説明していないが、データ通信と音声通話を同時に行うことができない携帯電話端末の場合には、音声開始指示によりデータ通信を終了させた後に音声通話を開始させ、音声通話終了指示により音声通話を終了させた後にデータ通信を開始させる必要がある。なお、データ通信と音声通話を同時に行うことができる携帯電話端末の場合には、そのような切り換えを行う必要はない。
【0060】
さらに、本発明は、上記実施形態に限定されず、実施に際して種々の変更が可能である。例えば、第1の実施形態において、図3(a)および(b)のテーブルを「ユーザ端末」、「電話番号」、「認識内容」、および「認識結果」の項目の1つのテーブルにまとめれば、図2のS4〜S6の3つの処理を、連携部3から連携DB4への「認識内容登録(端末のID、認識内容送信)」の1つの処理で済ますことができ、S15〜S18の4つの処理を、連携部3から連携DB4への「認識結果の取得要求(端末のID送信)」と連携DB4から連携部3への「認識結果送信」の2つの処理で済ますことができる。
【0061】
また、第3の実施形態において、図8(a)、(b)および(c)のテーブルを「音声認識部回線ID」、「音声認識部電話番号」、「ユーザ端末ID」、「認識内容」および「認識結果」の項目の1つのテーブルにまとめれば、図7のS22〜S26の5つの処理を、連携部3から連携DB4への「認識部の使用権取得要求(認識内容、端末のID送信)」と連携DB4から連携部3への「認識部の電話番号送信」の2つの処理で済ますことができ、S28、S29、S17、S18の4つの処理を、連携部3から連携DB4への「認識結果の取得要求(端末のID送信)」と連携DB4から連携部3への「認識結果送信」の2つの処理で済ますことができる。さらに、音声認識部5の回線IDとその電話番号とを同一にすればS25とS26の処理が必要なくなる。
【0062】
【発明の効果】
以上詳細に説明したように、本発明によれば、従来の携帯電話向け情報提供サービスにおいて既存する情報検索機能および情報送信機能を有効に利用しつつ、データ通信と音声通話上の音声認識機能とを連携させて、それを支援することにより携帯電話端末からの検索項目や検索語などの入力時の操作性を向上させることができる。
【0063】
また、従来の音声通話上で行う音声認識を使用した各種サービスでは、ユーザと音声認識装置間での手順を予め決めておく必要があるため、1台の音声認識装置で多様なコンテンツに対応した複数の異なる対話を処理しようとする場合には通話開始後にユーザが音声もしくはトーン信号により対話内容を選択し、目的とする対話を開始する必要があり、ユーザの負担が大きいが、本発明では、音声認識で認識すべき内容は、音声認識部への通話を開始する前にデータ通信網を介して指定されるため、通話開始後にユーザが対話内容を選択する必要がなく、ユーザの負担を増やすことなく1台の音声認識サイトで複数のコンテンツ提供サイトや多様なコンテンツのサービスに対応した音声入力装置を提供することができ、複数のコンテンツ提供サイトや多様なコンテンツのサービスが存在する場合に、認識すべき内容を指定して絞り込むことにより処理を軽減し、高速化および認識精度の向上を図ることができる。
【図面の簡単な説明】
【図1】 本発明の音声入力装置の第1の実施形態を含む携帯電話向け情報提供サービスシステム全体の一例を示すブロック図である。
【図2】 図1の動作を説明するためのフロー図である。
【図3】 本発明の第1の実施形態で用いられるユーザ端末ID−電話番号対応テーブルおよび音声認識情報管理テーブルの一例を示す構成図である。
【図4】 本発明の音声入力装置の第2の実施形態を含む携帯電話向け情報提供サービスシステム全体の他の例を示すブロック図である。
【図5】 図4の動作を説明するためのフロー図である。
【図6】 本発明の音声入力装置の第3の他の実施形態を含む携帯電話向け情報提供サービスシステム全体のさらに他の例を示すブロック図である。
【図7】 図6の動作を説明するためのフロー図である。
【図8】 本発明の第3の実施形態で用いられる音声認識部電話番号テーブル、ユーザ端末ID−音声認識部回線IDテーブルおよび音声認識情報管理テーブルの一例を示す構成図である。
【符号の説明】
1・・・音声認識サイト、2・・・ユーザ登録部、3・・・携帯電話向け情報提供サービス・音声認識連携部、4・・・携帯電話向け情報提供サービス・音声認識連携DB、5・・・音声認識部、A,B・・・携帯電話端末、CP1,CP2・・・コンテンツ提供サイト

Claims (5)

  1. 携帯電話端末のIDと該携帯電話端末の電話番号を対応させて登録するユーザ登録部と、
    携帯電話向け情報提供サービス・音声認識連携部と、
    音声認識部と、
    携帯電話端末の電話番号とコンテンツ提供サイトから現在受けているサービスの内容に従って音声認識で認識すべき内容と該電話番号の携帯電話端末から電話網を介して送られる音声の認識結果を対応させて登録する携帯電話向け情報提供サービス・音声認識連携データベースとを具備し、
    前記音声認識部は、携帯電話端末から電話網を介して送られる音声を前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された音声認識で認識すべき内容に応じて認識し、その認識結果を該携帯電話端末の電話番号に対応させて前記携帯電話向け情報提供サービス・音声認識連携データベースに登録し、
    前記携帯電話向け情報提供サービス・音声認識連携部は、データ通信網を介して送られる携帯電話端末からの音声入力開始の指示により該携帯電話端末のIDに対応する電話番号を前記ユーザ登録部より取得して前記携帯電話向け情報提供サービス・音声認識連携データベースに登録すると共に、該携帯電話端末に対し前記音声認識部との音声通話の開始を指示し、さらに、前記ユーザ登録部を参照して前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された、該携帯電話端末に対応する認識結果を取得して前記データ通信網を介して返送することを特徴とする音声入力装置。
  2. 携帯電話向け情報提供サービス・音声認識連携部と、
    音声認識部と、
    携帯電話端末の電話番号とコンテンツ提供サイトから現在受けているサービスの内容に従って音声認識で認識すべき内容と該電話番号の携帯電話端末から電話網を介して送られる音声の認識結果を対応させて登録する携帯電話向け情報提供サービス・音声認識連携データベースとを具備し、
    前記音声認識部は、携帯電話端末から電話網を介して送られる音声を前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された音声認識で認識すべき内容に応じて認識し、その認識結果を該携帯電話端末の電話番号に対応させて前記携帯電話向け情報提供サービス・音声認識連携データベースに登録し、
    前記携帯電話向け情報提供サービス・音声認識連携部は、データ通信網を介して携帯電話端末から送られる声入力開始の指示および該携帯電話端末の電話番号を受け、該電話番号を前記携帯電話向け情報提供サービス・音声認識連携データベースに登録すると共に、該携帯電話端末に対し前記音声認識部との音声通話の開始を指示し、さらに、前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された、該携帯電話端末に対応する認識結果を取得して前記データ通信網を介して返送することを特徴とする音声入力装置。
  3. 携帯電話向け情報提供サービス・音声認識連携部と、
    音声認識部と、
    携帯電話端末のIDと前記音声認識部への電話回線のIDとの対応、前記電話回線のIDと前記音声認識部への電話回線の電話番号の対応、および前記電話回線のIDとコンテンツ提供サイトから現在受けているサービスの内容に従って音声認識で認識すべき内容と音声認識結果との対応を登録する携帯電話向け情報提供サービス・音声認識連携データベースとを具備し、
    前記音声認識部は、携帯電話端末から電話網を介して送られる音声を前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された音声認識で認識すべき内容に応じて認識し、その認識結果を携帯電話向け情報提供サービス・音声認識連携データベースに前記電話回線のIDに対応させて前記音声認識結果として登録し、
    前記携帯電話向け情報提供サービス・音声認識連携部は、データ通信網を介して携帯電話端末から送られる音声入力開始の指示により該携帯電話端末に対して音声認識に用いる電話回線を割り振り、該割り振った電話回線のIDと該携帯電話端末のIDとの対応を携帯電話向け情報提供サービス・音声認識連携データベースに登録すると共に、登録されている電話回線のIDと音声認識部への電話回線の電話番号との対応を参照して前記音声認識部への電話回線の電話番号を取得して該携帯電話端末に対し前記音声認識部との音声通話の開始を指示し、さらに、携帯電話向け情報提供サービス・音声認識連携データベースに登録された、電話回線のIDと音声認識結果との対応を参照して該携帯電話端末に対応する認識結果を取得して前記データ通信網を介して返送することを特徴とする音声入力装置。
  4. 携帯電話向け情報提供サービス・音声認識連携部と、
    音声認識部と、
    携帯電話端末のID、該携帯電話端末の電話番号とコンテンツ提供サイトから現在受けているサービスの内容に従って音声認識で認識すべき内容と該電話番号の携帯電話端末から電話網を介して送られる音声の認識結果を対応させて登録する携帯電話向け情報提供サービス・音声認識連携データベースとを具備し、
    前記音声認識部は、携帯電話端末から電話網を介して送られる音声を前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された音声認識で認識すべき内容に応じて認識し、その認識結果を該携帯電話端末の電話番号に対応させて前記携帯電話向け情報提供サービス・音声認識連携データベースに登録し、
    前記携帯電話向け情報提供サービス・音声認識連携部は、データ通信網を介して送られる携帯電話端末からの音声入力開始の指示により該携帯電話端末に対し前記音声認識部との音声通話の開始を指示し、さらに、前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された、該携帯電話端末に対応する認識結果を取得して前記データ通信網を介して返送することを特徴とする音声入力装置。
  5. 携帯電話向け情報提供サービス・音声認識連携部と、
    音声認識部と、
    携帯電話端末のID、前記音声認識部への電話回線のID、前記音声認識部への電話回線の電話番号とコンテンツ提供サイトから現在受けているサービスの内容に従って音声認識で認識すべき内容と音声認識結果との対応を登録する携帯電話向け情報提供サービス・音声認識連携データベースとを具備し、
    前記音声認識部は、携帯電話端末から電話網を介して送られる音声を前記携帯電話向け情報提供サービス・音声認識連携データベースに登録された音声認識で認識すべき内容に応じて認識し、その認識結果を携帯電話向け情報提供サービス・音声認識連携データベースに前記電話回線のIDに対応させて前記音声認識結果として登録し、
    前記携帯電話向け情報提供サービス・音声認識連携部は、データ通信網を介して携帯電話端末から送られる音声入力開始の指示により該携帯電話端末に対して音声認識に用いる前記電話回線を割り振り、該割り振った電話回線のIDを該携帯電話端末のIDと対応させて携帯電話向け情報提供サービス・音声認識連携データベースに登録すると共に、登録されている電話回線のIDと音声認識部への電話回線の電話番号との対応を参照して前記音声認識部への電話回線の電話番号を取得して該携帯電話端末に対し前記音声認識部との音声通話の開始を指示し、さらに、携帯電話向け情報提供サービス・音声認識連携データベースに登録された、電話回線のIDと音声認識結果との対応を参照して該携帯電話端末に対応する認識結果を取得して前記データ通信網を介して返送することを特徴とする音声入力装置。
JP2002053632A 2002-02-28 2002-02-28 音声入力装置 Expired - Lifetime JP3862069B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002053632A JP3862069B2 (ja) 2002-02-28 2002-02-28 音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002053632A JP3862069B2 (ja) 2002-02-28 2002-02-28 音声入力装置

Publications (2)

Publication Number Publication Date
JP2003259009A JP2003259009A (ja) 2003-09-12
JP3862069B2 true JP3862069B2 (ja) 2006-12-27

Family

ID=28665006

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002053632A Expired - Lifetime JP3862069B2 (ja) 2002-02-28 2002-02-28 音声入力装置

Country Status (1)

Country Link
JP (1) JP3862069B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009031940A (ja) * 2007-07-25 2009-02-12 Tis Kk ワンタイムパスワードの発行システム
US20130143525A1 (en) * 2011-12-02 2013-06-06 The Boeing Company Point of Use Verified Aircraft Assembly Time Collection

Also Published As

Publication number Publication date
JP2003259009A (ja) 2003-09-12

Similar Documents

Publication Publication Date Title
US6850766B2 (en) Voice activated wireless locator service
KR100354996B1 (ko) 셀룰러무선전화기용디렉토리정보저장방법및셀룰러무선전화시스템
JPH11266326A (ja) 自動電話連結を支援する電話番号検索装置及び方法
US20020174177A1 (en) Voice activated navigation of a computer network
JP3322262B2 (ja) 無線携帯端末通信システム
CA2332762C (en) Information search system using radio portable terminal
JPH11341156A (ja) 電話番号案内方法およびシステム並びに携帯型電話機
JP3862069B2 (ja) 音声入力装置
JP3792022B2 (ja) 発信元表示システム並びにそのための交換機,電話回線管理センタおよびプログラム記憶媒体
EP1411712B1 (en) Operator guided user assistance for programming of wireless communication devices
JP2002033820A (ja) 音声認識電話装置および携帯電話機
KR100424508B1 (ko) 음성인식을 통한 무선인터넷 사이트 접속 방법
JPH10164210A (ja) 携帯電話機
EP1524870B1 (en) Method for communicating information in a preferred language from a server via a mobile communication device
JPH10164249A (ja) 情報処理装置
JP2003223448A (ja) 携帯端末と、それを用いたデータベース検索システムおよび処理方法
JP2001320504A (ja) インターネット対応携帯電話へインターネット情報サービスを接続するシステムおよび方法
JP2004221902A (ja) 情報提供システムおよびその情報提供方法
JP4003544B2 (ja) 表示・音声連携システム、サーバおよび方法
JP2000275056A (ja) 車載用通信システム
JPH10173761A (ja) 通信装置
JPH11341164A (ja) 電話帳システム
JP2001036968A (ja) 移動体通信システム及びそのサービス提供方法、並びに記録媒体
JP2004029456A (ja) 端末通信システム、連携サーバ、音声対話サーバ、音声対話処理方法および音声対話処理プログラム
JP2003008747A (ja) 携帯端末のユーザサポートシステムおよびユーザサポート方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040922

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060614

A131 Notification of reasons for refusal

Effective date: 20060621

Free format text: JAPANESE INTERMEDIATE CODE: A131

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060821

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060920

A61 First payment of annual fees (during grant procedure)

Effective date: 20060920

Free format text: JAPANESE INTERMEDIATE CODE: A61

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 6

Free format text: PAYMENT UNTIL: 20121006