以下、本発明の一実施の形態について、図面を参照して詳細に説明する。
図1は、本発明の一実施の形態に係るユーザデータ管理システムおよび情報提供システムを用いたIVRシステムの構成の一例を示すシステム構成図である。本実施の形態は、本発明を、電話での自動応答により各種情報の提供を行うIVRシステムに適用した例である。
図1において、IVRシステム100は、インターネット200、電話通信網300、携帯電話機400−1〜400−N、およびIVRサーバ500を有する。携帯電話機400−1〜400−Nは、それぞれ異なるユーザが所持する端末であり、IVRサーバ500は、これら端末のユーザに対して各種情報の提供サービス(以下単に「サービス」という)を行う情報サービス提供事業者の設備である。携帯電話機400−1〜400−Nは、同一の構成を有する。IVRサーバ500は、本発明に係るユーザデータ管理システムおよび情報提供システムを含むものである。
ここで、本実施の形態に係るIVRサーバ500の処理のフェーズについて説明する。IVRサーバ500がユーザごとに実施する処理のフェーズは、3段階に大きく分かれる。IVRサーバ500は、第1段階として、ユーザに対してメールでパスワードを発行し、第2段階として、ユーザからの電話での発話されるパスワードによりメールアドレスと電話番号との対応付けを行い、第3段階として、ユーザからの情報提供の要求受け付けを電話で行い、ユーザに対する情報提供を上記対応付けに基づいて電子メールで行う。すなわち、IVRサーバ500は、第1段階および第2段階において、情報提供サービスへのユーザ登録を実施し、第3段階において、情報提供サービスを実施する。以下、各装置部の機能および動作の説明を、適宜、上記した処理フェーズに分けて行う。
携帯電話機400およびIVRサーバ500は、電話機能および電子メール送受信機能を有し、無線または有線によりインターネット200と電話通信網300の両方に接続可能である。具体的には、携帯電話機400およびIVRサーバ500は、メールサーバやメールゲートウェイ装置(図示せず)を介して、SMTP(simple mail transfer protocol)やPOP3(post office protocol version 3)を用いてメールの送受信を行う。また、携帯電話機400およびIVRサーバ500は、電話通信網300で使用され、少なくとも発信者番号通知機能を備えた所定の通信プロトコルを用いて、発呼や音声データの送受信を含む電話通信を行う。
まず、上記第1段階における各装置の機能について説明する。
携帯電話機400は、インターネット200を介して、IVRサーバ500との間で電子メール通信を行う。携帯電話機400は、ユーザ操作を受けて、サービスへのユーザ登録を要求するための電子メール(以下単に「メール」という)である登録要求メールを、IVRサーバ500に送信する。
IVRサーバ500は、携帯電話機400から登録要求メールを受信したとき、その登録要求メールの送信元に、ユーザ登録を完了するために必要となるパスワードを発行する。具体的には、IVRサーバ500は、ユーザを一意に特定できるユニークなパスワードを本文に記載したメールを、パスワードを発行するためのパスワード発行メールとして、登録要求元に送信する。
このようなIVRシステム100によれば、第1段階として、携帯電話機400からIVRサーバ500に登録要求メールが送信されるごとに、その送信元に対してパスワードが発行される。
次いで、上記第2段階における各装置の機能について説明する。
携帯電話機400は、電話通信網300を介してIVRサーバ500に発呼し、IVRサーバ500との間で電話通信を行う。携帯電話機400は、ユーザ操作を受けて、上記したユーザ登録を完了するための電話である登録要求電話を、IVRサーバ500に発信する。
IVRサーバ500は、携帯電話機400から登録要求電話を受けたとき、電話通信により送られてくる音声に対して音声認識処理を行う。そして、IVRサーバ500は、自装置が発行したパスワードが認識結果に含まれているときは、そのパスワードを発行した相手先のメールアドレスと、パスワードが発話された登録要求電話の発信者番号とを対応付ける。
このようなIVRシステム100によれば、第2段階として、携帯電話機400のユーザが発行を受けたパスワードをIVRサーバ500への登録要求電話で読み上げると、IVRサーバ500側で、パスワードを発行した相手先のメールアドレスと、パスワードが発話された登録要求電話の発信者番号とが対応付けられる。
このように、IVRシステム100によれば、第1段階と第2段階とを経て、IVRサーバ500側で生成されたパスワードを媒介として、ユーザごとにそのユーザの電話番号とメールアドレスとの対応付け(マッチング)を行うことができる。
次いで、上記第3段階における各装置の機能について説明する。
携帯電話機400は、ユーザ操作を受けて、具体的な情報提供を要求するための電話である情報要求電話を、IVRサーバ500に発信する。
IVRサーバ500は、携帯電話機400から情報要求電話を受けたときで、その発信元の電話番号に対するメールアドレスの対応付けが成されているときは、要求されたサービス情報を格納または添付したメールを、情報提供メールとして、発信者番号に対応付けられたメールアドレスに宛てて送信する。
このようなIVRサーバ500によれば、ユーザ登録によって行われた対応付けに基づいて、情報提供の要求受け付けが電話で行われ、情報提供が電子メールで行われる。これにより、文字での情報伝達に有効なメールと、音声での情報伝達に有効な電話との、それぞれのメリットを十分に生かしたサービスを実現することができる。
ここで、上記マッチングにパスワードを用いることのメリットについて、音声認識処理の仕組みと併せて説明する。
音声認識処理では、音声データに対するフレーム処理、および各フレームに対するフーリエ解析を含む所定の処理を経て、ケプストラムパラメータなどの音声特徴量が抽出される。そして、解析結果から、ユーザの音声が含まれている音声区間が検出され、音声区間の音声特徴量のみによる時系列データが生成される。
更に、音声認識処理では、生成時系列データに基づき、音響モデル、言語モデル、および辞書を用いて、テキストデータが作成される。音響モデルは、音声データから得られる特徴量と発音記号との確率的な対応付けをデータ化したものである。言語モデルは、学習対象の文字列における文脈のパターンを、関連語彙数によりモデル化したNグラムモデルである。辞書は、音声認識の対象となる単語の発音記号をデータ化したものである。
具体的には、音声認識処理では、各発音記号の尤度が音響モデルから求められ、各発音記号の組み合わせに対応する単語が辞書から求められ、Nグラムによる文脈上の各単語の出現確率が言語モデルから求められる。そして、例えば、発音記号の尤度と単語の出現確率との積が最大となる単語列の探索が音声データに対して行われ、探索された単語列からテキストデータが作成される。
例えば、登録要求電話でメールアドレスを発話することによって上記マッチングを行おうとした場合、アルファベットと数字の総組合せが認識対象となり、前後の文脈も利用できないことから、発音記号の尤度に依存した文字単位での探索となる。この場合、発音のばらつきを補完することが困難であり、誤った認識結果となる可能性が高くなる。また、例えば、数字の「9」とアルファベットの「Q」は、音のみでは識別できないなどの問題もある。
メールアドレスが誤って認識されると、ユーザが所望するサービス情報が正しいユーザに提供されないだけでなく、第三者に誤って送信されてしまう可能性もあり、セキュリティ面で問題が生ずる。したがって、音声認識でメールアドレスが誤って認識された場合には、ユーザは、キースイッチを操作して誤った箇所を文字入力操作により修正しなければならない。ところが、このことは、ユーザ負担軽減の観点から望ましくない。
そこで、メールで電話番号を送信することが考えられる。ところが、電話番号の文字入力操作によりユーザに負担を掛けるだけでなく、第三者に電話番号とメールアドレスとを一度に傍受される可能性が高くなり、セキュリティ確保の観点からも望ましくない。
そこで、本実施の形態のIVRサーバ500は、発話しやすい文章など、高い精度で音声認識が可能な語句をパスワードとし、このパスワードをユーザに電話で発話させる。これにより、高い音声認識率を実現してより信頼性の高いマッチングを実現する。すなわち、IVRサーバ500側で任意に生成可能なパスワードを用いることにより、より少ないユーザ負担で、より高い信頼性で、かつ高いセキュリティを確保した状態で、ユーザごとの電話番号とメールアドレスとのマッチングを行うことができる。
次に、各装置の構成について、ブロック図を用いて説明する。
まず、携帯電話機400の構成について説明する。
図2は、携帯電話機400の構成を示すブロック図である。
図2に示すように、携帯電話機400は、メーラ起動部410、メーラ部420、および電話通信部430を有する。また、携帯電話機400は、キースイッチ、ディスプレイ、マイクロフォン、およびディジタルカメラなど(図示せず)を更に有する。
メーラ起動部410は、所定のイベントの発生をトリガとして、メーラ部420を起動する。所定のイベントには、例えば、キースイッチの所定の操作、ディスプレイに表示された所定のメニュー、アイコン、またはウェブページからのハイパーリンクの選択、およびディジタルカメラでの所定のQRコード(quick response code)の撮影が含まれる。
メーラ部420は、メーラ起動部410により起動され、メールデータの作成およびメールの送受信を行う。メーラ部420は、メール送信部421およびメール受信部422を有する。
メール送信部421は、ユーザの操作を受けて、自端末のメールアドレス含むメールデータを作成し、指定されたメールアドレスを宛先として送信する。具体的には、メール送信部421は、送信メールのヘッダ情報に、送信元として自端末のメールアドレスを記述する。メール送信部421は、起動のトリガとなった情報がIVRサーバ500のメールアドレスへのメール送信を指示するものである場合には、そのメールアドレスを宛先アドレスとして記述した空メールを作成する。IVRサーバ500を宛先とする送信メールは、上述の登録要求メールとなる。
メール受信部422は、ユーザの操作を受けて、または定期的に、自端末を宛先とするメールを受信する。また、メール受信部422は、ユーザの操作を受けて、受信メールの内容を表示または音声出力する。受信メールがIVRサーバ500からのパスワード発行メールである場合には、パスワードが携帯電話機400のユーザに通知されることになる。
電話通信部430は、ユーザのキースイッチ操作を受けて、指定された電話番号に発呼する。発呼先がIVRサーバ500の電話番号である場合には、その電話は、登録要求電話または情報要求電話となる。電話通信部430は、入力された音声をデータ化した音声データを電話通信の相手先に送信するとともに、キースイッチのプッシュ操作の内容を示すプッシュキー情報を、音声によるプッシュ信号に変換し、音声データに挿入する。また、電話通信部430は、発信者番号通知機能を有し、少なくとも登録要求電話および情報要求電話において、自端末の電話番号を、発信者番号としてIVRサーバ500に通知する。
携帯電話機400は、CPU(central processing unit)、制御プログラムを格納したROM(read only memory)などの記憶媒体、RAM(random access memory)などの作業用メモリ、および無線通信回路などを含んで構成される。すなわち、図2に示す携帯電話機400の各部の機能は、CPUが制御プログラムを実行することによって実現することができる。
次いで、IVRサーバ500の構成について説明する。
図3は、IVRサーバ500の構成を示すブロック図である。
図3に示すように、IVRサーバ500は、ユーザデータ記憶部510、メール受信部520、データベース設定部530、メール送信部540、電話応答部550、音声認識部560、データベース更新部570、データベース検索部580、およびサービス提供部590を有する。
ユーザデータ記憶部510は、パスワードとメールアドレスとを対応付けて記述するパスワード設定テーブルと、メールアドレスと電話番号とを対応付けて記述するユーザデータテーブルとを格納する。パスワード設定テーブルおよびユーザデータテーブルの詳細については後述する。
メール受信部520は、登録要求メールを受信する。メール受信部520は、メールアドレス抽出部521およびユニークパスワード生成部522を有する。
メールアドレス抽出部521は、登録要求メールから送信元のメールアドレスを抽出し、抽出したメールアドレスを、データベース設定部530とメール送信部540とにそれぞれ出力する。具体的には、メールアドレス抽出部521は、受信メールのヘッダ情報から、送信元のメールアドレスを取得する。
ユニークパスワード生成部522は、登録要求メールが受信されるごとに、または登録要求メールの送信元のメールアドレスごとに、ユニークなパスワードを生成し、生成したパスワードを、データベース設定部530とメール送信部540とにそれぞれ出力する。具体的には、ユニークパスワード生成部522は、高い精度で音声認識が可能であって、かつ、少なくとも予め定めた生成数において重複しないようなパスワードを生成する。これにより、異なるユーザ間でメールアドレスと電話番号との誤った対応付けが行われるのを防止することができる。
例えば、ユニークパスワード生成部522は、主語と述語のそれぞれに、他の単語と混同されにくい単語を予め100種類ずつ用意しておき、総当りの形で主語+述語から成るパスワードを生成する。この場合、生成可能なパスワードは、1万通りである。なお、他のユーザに発行したパスワードと音が似ているパスワードを明示的に避けることにより、パスワードの音声認識率を更に向上させることが可能である。また、パスワード生成部522は、予め完成形として用意されたパスワードの中から単に選択するようにしてもよい。
また、ユニークパスワード生成部522は、生成可能なパスワードの数を超えてユーザ登録を行うために、後述するパスワード設定テーブルから削除されたパスワードや、発行してから十分に時間が経過したパスワードを再利用する。
データベース設定部530は、ユーザデータ記憶部510に格納されたパスワード設定テーブルにおいて、メールアドレス抽出部521から入力されたメールアドレスと、ユニークパスワード生成部522から入力されたパスワードとを対応付ける。
図4は、パスワード設定テーブルの内容の一例を示す図である。
図4に示すように、パスワード設定テーブル610は、メールアドレスのフィールド611と、パスワードのフィールド612と、エントリ時刻のフィールド613とにより構成される。
データベース設定部530は、メールアドレス抽出部521から入力されたメールアドレスを、パスワード設定テーブル610のフィールド611に記述し、このメールアドレスについてユニークパスワード生成部522で生成されたパスワードを、対応するエントリのフィールド612に記述する。また、データベース設定部530は、エントリの作成または更新時刻を、対応するエントリのフィールド613に記述する。
ここでは、例えば、第1のエントリ621のフィールド611、612、613には、それぞれ「aaa@bbb.com」、「猿は可愛い」、「2007年11月1日15時10分」と記述されている。これは、「aaa@bbb.com」というメールアドレスに対応して、「猿は可愛い」というパスワードが、2007年11月1日15時10分に生成され、メールアドレス「aaa@bbb.com」の携帯電話機400のユーザに対して発行されたことを示す。すなわち、パスワード設定テーブル610には、パスワードとその発行先との対応付けと、その対応付けがされた時刻とが記述される。このようなパスワード設定テーブル610を用いることにより、メールアドレスと電話番号との対応付けを効率良く行うことができる。
なお、データベース設定部530は、パスワード設定テーブル610のエントリ時刻のフィールド613を参照し、エントリ数の増大を防止すべく、古いエントリを適宜削除する。
メール送信部540は、メール受信部520からメールアドレスおよびパスワードが入力されたとき、入力されたパスワードを本文に記載し、入力されたメールアドレスを送信先とするメールを作成し、パスワード発行メールとして送信する。また、メール送信部540は、データベース検索部580からメールアドレスが入力され、サービス提供部590からサービス情報が入力されたとき、入力されたメールアドレスを宛先とし、入力されたサービス情報を格納または添付した情報提供メールを作成し、情報提供メールとして送信する。なお、メール送信部540は、パスワード発行メールの本文に、自装置の電話番号をパスワードと併せて記載してもよい。これにより、パスワードの発行先のユーザがIVRサーバ500の電話番号を知らない場合にも対応できる。また、通常、携帯電話機400では、メールの本文に記載された電話番号を選択することにより発呼を簡単に行えることから、ユーザの電話番号の入力ミスを防いだり、ユーザの手間を軽減することができる。
電話応答部550は、登録要求電話および情報要求電話を受け付け、音声ガイダンスにより、ユーザ登録および情報提供のための応答処理を行う。電話応答部550は、発信者番号取得部551、音声データ取得部552、プッシュ信号検出部553、および音声ガイダンス部554を有する。
発信者番号取得部551は、登録要求電話および情報要求電話から、発信者番号、つまり発信元の携帯電話機400の電話番号を取得し、取得した電話番号を、データベース更新部570とデータベース検索部580とにそれぞれ出力する。
音声データ取得部552は、登録要求電話および情報要求電話において、通話の相手先から音声データを受信し、受信した音声データを、音声認識部560に出力する。
プッシュ信号検出部553は、情報要求電話において、通話の相手先から受信された音声データからプッシュ信号を検出し、検出したプッシュ信号を元のプッシュキー情報に変換して、サービス提供部590に出力する。
音声ガイダンス部554は、着信した登録要求電話および情報要求電話に対して、合成音声によるガイダンスを行う。具体的には、音声ガイダンス部554は、選択肢の内容および各選択肢に対応して発話すべき語句または行うべきプッシュ操作、パスワードを発話すべきタイミング、サービス情報を指定する入力情報(以下単に「入力情報」という)を送信すべきタイミングなどを、音声により通知する。音声ガイダンスが提示する選択肢には、登録要求電話と情報要求電話のいずれであるか、どのサービス情報の提供を望むかなどが含まれる。
音声認識部560は、音声データ取得部552から入力された音声データに対して音声認識を行い、ユーザの発話した語句を取得する。そして、音声認識部560は、取得した語句を、データベース更新部570にはパスワードとして出力し、データベース検索部580には提供の対象となるサービス情報を指定する情報(以下「情報指定ワード」という)として出力する。
データベース更新部570は、発信者番号取得部551から電話番号が入力され、音声認識部560からパスワードが入力されたとき、入力されたパスワードを検索キーとして、パスワード設定テーブル610のパスワードのフィールド612を検索する。音声認識部560は、取得した語句に一致するパスワードがフィールド612に存在した場合、該当するエントリのメールアドレスのフィールド611に記述されたメールアドレスを取得する。そして、音声認識部560は、ユーザデータ記憶部510に格納されたユーザデータテーブルにおいて、取得したメールアドレスと、発信者番号取得部551から入力された電話番号とを対応付ける。
図5は、ユーザデータテーブルの内容の一例を示す図である。
図5に示すように、ユーザデータテーブル710は、メールアドレスのフィールド711と、電話番号のフィールド712と、エントリ時刻のフィールド713とにより構成される。
データベース更新部570は、ユーザデータテーブル710から取得したメールアドレスを、ユーザデータテーブル710のフィールド711に記述し、このメールアドレスに対応するパスワードが発話された電話の相手先の電話番号を、対応するエントリのフィールド712に記述する。また、データベース更新部570は、エントリの作成または更新時刻を、対応するエントリのフィールド713に記述する。
ここでは、例えば、第1のエントリ721のフィールド711、712、713には、それぞれ「aaa@bbb.com」、「09012345678」、「2007年11月1日15時17分」と記述されている。これは、「aaa@bbb.com」というメールアドレスを宛先として送信したパスワードを発話する音声データを、「09012345678」という電話番号の相手先から、2007年11月1日15時17分に受信したことを示す。すなわち、ユーザデータテーブル710には、同一のユーザについての電話番号とメールアドレスとの対応付けと、これらの対応付けがされた時刻とが記述される。このようなユーザデータテーブル710を用いることにより、電話番号から対応するメールアドレスの特定を効率良く行うことができる。なお、図4で説明したパスワード設定テーブル610と、ユーザデータテーブル710とを、1つのテーブルとしてもよい。この場合には、データベース設定部530は、ユーザ登録が完了した時点やエントリ作成から一定時間が経過した後に、パスワードのフィールドの記述内容を削除する。
図3のデータベース検索部580は、発信者番号取得部551から電話番号を入力されたとき、入力された電話番号を検索キーとして、ユーザデータテーブル710の電話番号のフィールド712を検索する。データベース検索部580は、入力された電話番号に一致する電話番号がフィールド712に存在した場合、該当するエントリのメールアドレスのフィールド711に記述されたメールアドレスを取得する。そして、データベース検索部580は、取得したメールアドレスを、メール送信部540に出力する。
サービス提供部590は、プッシュ信号検出部553または音声認識部560から、プッシュキー情報または情報報指定ワード(入力情報)が入力されると、その入力情報により指定されるサービス情報を、メール送信部540に出力する。サービス情報は、サービス提供部590に格納されていてもよいが、サービス提供部590の外部、またはインターネット200上の他のサーバから取得し、メール送信部540に転送するようにしてもよい。具体的には、サービス提供部590は、入力情報が資料請求番号として入力された場合には、該当する資料を取得したり、情報指定ワードが検索キーワードとして入力された場合には、該当するドキュメントやURLをデータベースやネットワーク上で検索して取得する。また、サービス提供部590は、ユーザが発話した文章のテキスト化が要求されている場合には、ユーザの発話音声を音声認識して書き起こし、テキスト情報に整形する。
なお、電話応答部550は、音声ガイダンス部554のガイダンスの進行に対応して、音声データ取得部552およびプッシュ信号検出部553の情報の出力の可否を制御するようにしてもよい。具体的には、例えば、電話応答部550は、パスワードの発話を指示したタイミングから所定の長さの区間と、サービス情報の番号の発話を指示したタイミングから所定の長さの区間に取得された音声データのみを、音声データ取得部552に出力する。これにより、発行したパスワードと偶然に同じ語句が発音されて誤ってマッチングが行われたり、提供を要求していないサービス情報が誤って提供されてしまったりする可能性を低減することができるだけでなく、不必要な音声処理の実行を防ぎ、装置負荷を軽減することができる。
また、電話応答部550は、携帯電話機400のユーザに対する質問とその応答内容とにより、携帯電話機400からの電話が登録要求電話であるか情報要求電話であるかを判断するようにしてもよい。この場合には、例えば、電話応答部550は、登録要求電話の場合には、データベース検索部580への発信者番号の出力を行わず、情報要求電話の場合には、データベース更新部570への発信者番号の出力を行わないようにする。この場合にも、誤ったマッチングやサービス情報提供の可能性を低減することができるとともに、装置負荷を軽減することができる。
IVRサーバ500は、CPU、制御プログラムを格納したハードディスク(hard disc)またはROMなどの記憶媒体、RAMなどの作業用メモリ、および通信回路などを含んで構成される。すなわち、図3に示すIVRサーバ500の各部の機能は、CPUが制御プログラムを実行することによって実現することができる。
次に、上記構成を有する各装置の動作について説明する。まず、IVRサーバ500の動作について、フローチャートを用いて説明する。
IVRサーバ500は、上記した第1段階に対応する処理として、ユーザにメールでパスワードを発行するためのパスワード発行処理を実行する。また、IVRサーバ500は、上記した第2段階に対応する処理として、第1段階で発行されたパスワードを媒介としてメールアドレスと電話番号とを対応付けるための電話アドレス対応付け処理を実行する。更に、IVRサーバ500は、上記した第3段階に対応する処理として、第2段階で行われた対応付けに基づいて情報提供の要求受け付けを電話で行い情報提供を電子メールで行う情報提供処理を実行する。以下、パスワード発行処理、電話アドレス対応付け処理、および情報提供処理のそれぞれについて、順に説明する。
まず、IVRサーバ500におけるパスワード発行処理について説明する。
図6は、IVRサーバ500におけるパスワード発行処理の流れを示すフローチャートである。
まず、IVRサーバ500は、メール受信部520で登録要求メールを受信すると(S1100:YES)、メールアドレス抽出部521で、そのメールから送信元のメールアドレスを抽出し(S1200)、ユニークパスワード生成部522で、登録要求メールごとにユニークなパスワードを生成する(S1300)。そして、IVRサーバ500は、データベース設定部530で、登録要求メールから抽出したメールアドレスと生成したパスワードとを対応付けてパスワード設定テーブル610に登録し(S1400)、メール送信部540で、パスワードを、登録要求メールから抽出したメールアドレスを宛先としてメールにより返信する(S1500)。これにより、ユーザ登録の要求元にパスワードが発行されるとともに、発行したパスワードと発行先のメールアドレスとが組み付けられる。
そして、IVRサーバ500は、データベース設定部530で、パスワード設定テーブル610から古いエントリを適宜削除し(S1600)、パスワード発行処理を継続する場合には(S1700:YES)、ステップS1100に戻り、パスワードの発行の終了を指示されるなどした場合は(S1700:NO)、一連の処理を終了する。
このように、パスワード発行処理によって、ユーザ登録を望むユーザに対して、メールにてパスワードが発行されるとともに、IVRサーバ500においてユーザのメールアドレスとパスワードとが対応付けられる。登録要求電話で発話すべきパスワードを知っているのは、そのパスワードの発行を受けたユーザのみということになる。
また、以上説明したパスワード発行処理では、IVRサーバ500は、登録要求メールの送信元のメールアドレスを、そのメールから抽出するので、ユーザ側から任意のタイミングでユーザ登録を開始させることができる。なお、IVRサーバ500側でユーザ登録を希望するユーザのメールアドレスを予め把握している場合には、IVRサーバ500は、登録要求メールを待たずに、そのメールアドレスに対するパスワードの発行およびパスワードとメールアドレスとの対応付けを行ってもよい。
次いで、IVRサーバ500における電話アドレス対応付け処理について説明する。
図7は、IVRサーバ500における電話アドレス対応付け処理の流れを示すフローチャートである。
まず、IVRサーバ500は、電話応答部550で携帯電話機400から登録要求電話を着信すると(S2100:YES)、発信者番号取得部551で、登録要求電話の発信者番号を、発信元の電話番号として取得し(S2200)、音声データ取得部552で、登録要求電話の音声データを取得する(S2300)。そして、IVRサーバ500は、音声ガイダンス部554で、「パスワードをどうぞ」などパスワードの発話を促す音声ガイダンスを再生し、音声認識部560で、取得した音声データに対して音声認識処理を行い(S2400)、データベース更新部570で、パスワード設定テーブル610に設定したパスワードが発話されたか否かを判断する(S2500)。
そして、IVRサーバ500は、パスワード設定テーブル610に設定したパスワードが発話された場合には(S2500:YES)、データベース更新部570で、設定したパスワードに組み付けたメールアドレスと、登録要求電話から取得した電話番号、つまり発信者番号とを対応付けてユーザデータテーブル710に登録する(S2600)。そして、IVRサーバ500は、パスワード設定テーブル610から、登録が完了したメールアドレスのエントリを削除するとともに古いエントリを適宜削除し(S2700)、電話アドレス対応付け処理を継続する場合は(S2800:YES)、ステップS2100に戻り、ユーザ登録の終了を指示されるなどした場合には(S2800:NO)、一連の処理を終了する。ユーザデータテーブル710の登録が完了後に、パスワード設定テーブル610に一時記憶したメールアドレスとパスワードとの対を削除して繰り返し利用することにより、パスワード数を制限しつつ多量のユーザにパスワード設定することができる。
一方、パスワード設定テーブル610に設定したパスワードが発話されなかった場合には(S2500:NO)、処理はそのままステップS2800に進む。
なお、電話応答部550で、ガイダンスによりパスワードの発話タイミングを指定し、そのタイミングから所定の時間が経過しても対応するメールアドレスが検索されない場合には、IVRサーバ500は、ユーザ登録が失敗した旨を携帯電話機400に通知するようにしてもよい。また、所定回数の範囲内で、パスワードの発話をやり直させるようにしてもよい。また、IVRサーバ500は、情報提供電話において声紋認証を行うために、発話音声から声紋データを抽出し、抽出した声紋データを電話番号に対応付けて記録しておくようにしてもよい。また、電話応答部550で着信した電話が登録要求電話か否かを判断しない場合には、電話の着信があったときにステップS2200に進むようにしてもよい。この場合には、パスワード設定テーブル610に設定したパスワードが発話された時点で、着信電話は事後的に登録要求電話となる。
このように、電話アドレス対応付け処理によって、ユーザ登録を望むユーザのうち、メールにて発行されたパスワードと同一のパスワードを発話したユーザについて、IVRサーバ500側でメールアドレスと電話番号とが対応付けられる。上述したように、発話すべきパスワードを知っているのはそのパスワードの発行を受けたユーザのみであるため、パスワードの発行先として用いられたメールアドレスと、当該パスワードの発話元として用いられた電話番号とは、同一のユーザに属している。すなわち、パスワード発行処理と電話アドレス対応付け処理とによって、ユーザごとのメールアドレスと電話番号とが正しく組み付けられ、ユーザデータテーブル710に登録される。
また、以上説明した電話アドレス対応付け処理では、IVRサーバ500は、音声の送信元の電話番号を、電話通信の発信者番号から取得するので、ユーザ側から任意のタイミングでユーザ登録を完了させることができる。なお、IVRサーバ500側でユーザ登録を希望するユーザの電話番号を予め把握している場合には、IVRサーバ500側から発呼してパスワードを問い合わせ、パスワードの発話を受けて、発呼先の電話番号と発話されたパスワードとの対応付けを行うようにしてもよい。
次いで、IVRサーバ500における情報提供処理について説明する。
図8は、IVRサーバ500における情報提供処理の流れを示すフローチャートである。
まず、IVRサーバ500は、電話応答部550で携帯電話機400から情報要求電話を着信すると(S3100:YES)、発信者番号取得部551で、情報要求電話の発信者番号を、発信元の電話番号として取得し(S3200)、音声データ取得部552で情報提供電話の音声データを、またはプッシュ信号検出部553で情報提供電話のプッシュキー情報を取得する(S3300)。音声データが取得された場合には、更に、音声認識部560で、情報指定ワードが音声認識される。
そして、IVRサーバ500は、サービス提供部590で、ユーザの入力情報、つまり受信した情報指定ワードまたはプッシュキー情報が指定するサービス情報を提供可能であり(S3400:YES)、データベース検索部580で、登録要求電話から取得された電話番号が、ユーザデータテーブル710に存在する場合には(S3500:YES)、メール送信部540で、指定されたサービス情報を、電話番号に組み付けられたメールアドレスを宛先として、メールにて送信する(S3600)。そして、IVRサーバ500は、情報提供処理を継続する場合は(S3700:YES)、ステップS3100に戻り、情報提供の終了を指示されるなどした場合には(S3700:NO)、一連の処理を終了する。
一方、指定されたサービス情報が提供可能ではない場合や(S3400:NO)、取得された電話番号がユーザデータテーブル710に存在しない場合は(S3500:NO)、処理はそのままステップS3700に進む。
なお、電話応答部550で、ガイダンスにより入力情報の送信タイミングを指定し、そのタイミングから所定の時間が経過しても提供すべきサービス情報が提供可能であると判断されない場合には、IVRサーバ500は、ユーザ登録が失敗した旨を携帯電話機400に通知するようにしてもよい。また、所定回数の範囲内で、情報指定ワードの発話やプッシュ操作をやり直させるようにしてもよい。また、IVRサーバ500は、登録要求電話で声紋データを電話番号に対応付けて記録しておいた場合には、記録しておいた声紋データを用いて、発話音声の声紋認証を行い、声紋が一致すると判断された場合にのみ、情報提供を行うようにしてもよい。また、電話応答部550で着信した電話が情報要求電話か否かを判断しない場合には、電話の着信があったときにステップS3200に進むようにしてもよい。この場合、提供すべきサービス情報が提供可能であると判断された時点で、着信電話は事後的に情報要求電話となる。
このように、情報提供処理によって、サービス情報の提供の要求が電話で受け付けられ、対応するサービス情報はメールで提供される。上述したように、ユーザデータテーブル710には、ユーザごとのメールアドレスと電話番号との対応付けが正しく記録されているため、情報要求電話で要求されたサービス情報は、その要求元のユーザのみに対して、メールにて正しく送信されることになる。
以下、IVRシステム100が運用されたときの、ユーザの操作、各装置の処理、および通信の流れを、IVRシステム100の動作として説明する。
図9は、ユーザ登録におけるIVRシステム100の動作の一例を示すシーケンス図である。ここでは、説明の簡便化のため、IVRサーバ500を、ユーザデータ記憶部510と、その他の装置部から成るユーザデータ管理部500aとに分けて扱うものとする。
図9に示すように、まず、携帯電話機400のユーザ400aが、携帯電話機400を用いて、例えば本文の無い空メールを登録要求メールとしてユーザデータ管理部500aに送信すると(S4100)、ユーザデータ管理部500aで、この空メールから送信元のメールアドレスが取得され(S4200)、ユニークなパスワードが自動生成される(S4300)。そして、ユーザデータ管理部500aにより、取得したメールアドレスとパスワードとを対応付けたエントリが、ユーザデータ記憶部510に登録されるとともに(S4400)、パスワードとIVRサーバ500の電話番号とを記載したパスワード発行メールが、携帯電話機400に送信される(S4500)。
このようにして、ユーザデータ管理部500aにメールを送信したユーザ400aには、登録要求電話用の電話番号と、登録要求電話において発話すべきパスワードとが通知される。ユーザ400aは、携帯電話機400を操作して、メール本文として表示されたユーザデータ管理部500aの電話番号の文字列を選択するなどして、任意のタイミングで登録要求電話を行うことができる。
ユーザ400aが携帯電話機400を用いてユーザデータ管理部500aに発呼し、発信者番号がユーザデータ管理部500aに通知されると(S4600)、ユーザデータ管理部500aからは、回線接続後に、携帯電話機400を介して、ユーザ登録のためのパスワードの発話を促すガイダンスメッセージが再生される(S4700)。ユーザ400aは、再生されたメッセージに従って、携帯電話機400のマイクロフォンに、パスワード発行メールで発行されたパスワードを発話し、発話されたパスワードは、ユーザデータ管理部500aで、音声認識処理により認識される(S4800)。そして、ユーザデータ管理部500aにより、ユーザデータ記憶部510のパスワード設定テーブル610からパスワードを検索キーとして対応するメールアドレスが取得され、取得されたメールアドレスと発信者番号とを対応付けたエントリのユーザデータ記憶部510への登録が行われる。すなわち、ユーザデータ記憶部510の電話番号とメールアドレスとの対応付けが更新される(S4900)。そして、ユーザデータ管理部500aにより、ユーザ登録が完了した旨、つまり、以降は同一の電話番号からの発呼にて情報要求電話が可能である旨が、音声メッセージなどにより携帯電話機400に通知される(S5000)。
このように、ユーザ400aは、空メールをユーザ管理部500aに送信し、電話番号およびパスワードの返信を受けた後、電話番号に発呼してパスワードを発話することにより、簡単にユーザ登録を行うことができる。すなわち、より少ないユーザ負担で、ユーザごとに電話番号とメールアドレスとの対応付けを行うことができる。
なお、ユーザが使用するメールアドレスが変更された場合には、ユーザ登録を再度実施すればよい。これにより、ユーザデータテーブル710の内容は、変更後のメールアドレスに対応した内容に更新され、ユーザは、メールアドレスの変更後も継続してサービスを享受することができる。
図10は、ユーザ登録が完了した後の、情報提供における各装置の処理および通信の流れの一例を示すシーケンス図である。
図10に示すように、ユーザ登録を済ませたユーザ400aは、登録要求電話に使用した携帯電話機400を用いてユーザデータ管理部500aに発呼し、発信者番号がユーザデータ管理部500aに通知されると(S5100)、ユーザデータ管理部500aからは、回線接続後に、サービス情報の指定を促すガイダンスメッセージが再生される(S5200)。ユーザ400aは、メッセージに従って、あるサービス情報を指定する情報を、音声発話またはプッシュ操作により携帯電話機400に入力し、ユーザデータ管理部500aでは、受信した入力情報を基に、対応するサービス情報の検索および取得が行われる(S5300)。更に、ユーザデータ管理部500aでは、発信者番号から取得した電話番号を検索キーとして、ユーザデータ記憶部510のユーザデータテーブル710が検索され(S5400)、対応するメールアドレスが取得される(S5500)。そして、ユーザデータ管理部500aにより、サービス情報を格納または添付した情報提供メールが、携帯電話機400に送信される(S5600)。
このように、ユーザ400aは、ユーザ登録の完了後、電話によってサービス情報の提供を要求し、サービス情報の提供をメールで受けることができる。すなわち、ユーザは、簡単に、所望のサービス情報を閲覧することができる。
以上説明したように、本実施の形態によれば、IVRサーバ500は、電子メール通信により特定メールアドレス宛に仮パスワードを発行するとともに、仮パスワードと特定メールアドレスとを対応付けて一時記憶し、特定電話番号からの電話音声で発話された仮パスワードを認識し、認識した仮パスワードに対応するメールアドレスと電話番号とを対応付けて記憶する。これにより、ユーザは、パスワードを文字データにより受け取り、これを音声により読み上げることによりユーザ登録を行うことができるため、文字入力することなくユーザ登録をすることができる。また、メールアドレスとは異なる普通の単語からなるパスワードを音声認識の対象とすることができるので、例えば高い精度で音声認識可能な単語を用いることができる。すなわち、ユーザに文字入力操作を課す必要がなくなり、より少ないユーザ負担で、ユーザごとに電話番号とメールアドレスとを対応付けることができる。
また、IVRサーバ500は、電話通信により情報提供の要求を受け付け、ユーザデータテーブル710で要求元の電話番号に対応付けられたメールアドレスに宛てて、要求された情報をメールにて送信するので、ユーザに対し、利便性に富んだサービスを提供することができる。
また、電話通信で受信した音声に対して音声認識処理を行って、情報提供の要求を受け付けるので、ユーザに対し、更に利用し易いサービスを提供することができる。
なお、以上説明した実施の形態では、IVRサーバ500のメールアドレスを1つのみとし、IVRサーバ500に送られてきたメールアドレスを全て登録要求メールとして取り扱うものとして説明したが、これに限定されるものではない。IVRサーバ500に複数のメールアドレスが割り当てられている場合には、そのうちの一部のみを登録要求メールとして取り扱うようにしてもよい。
また、IVRサーバ500の電話番号を1つのみとし、IVRサーバ500に掛かってきた電話を全て登録要求電話または情報要求電話として取り扱うものとして説明したが、これに限定されるものではない。IVRサーバ500に複数の電話番号が割り当てられている場合には、そのうちの一部のみを登録要求電話として取り扱い、他の一部のみを情報提供電話として取り扱うようにしてもよい。
また、図2に示すIVRサーバ500の各装置部は、必ずしも同一の装置内に配置しなく、ネットワーク上の別個の装置に配置するようにしてもよい。例えば、メール受信部520、メール送信部540、およびデータベース設定部530を1つの装置に配置し、電話応答部550、音声認識部560、データベース更新部570、データベース検索部580、およびサービス提供部590を別の装置に配置し、ユーザデータ記憶部510を更に別の装置に配置することが考えられる。
また、電話応答部550を、登録要求電話用と情報要求電話用とで別に用意するようにしてもよい。この場合には、IVRサーバ500は、パスワード発行メールにて、またはユーザ登録が完了した旨を通知するメールにて、携帯電話機400側に、情報要求電話用の電話番号を通知することが望ましい。
また、ユーザ側で電話通信に使用される端末とメール通信に使用される端末とは、必ずしも同一でなくてもよい。例えば、電話には携帯電話機を使用し、メール通信には自宅のパーソナルコンピュータを使用する場合にも、本発明を適用することができる。
また、本発明を、電話での自動応答により各種情報の提供を行うIVRシステムに適用した例について説明したが、これに限定されるものではなく、本発明は、ユーザごとに電話番号とメールアドレスとの対応付けが必要な各種システムに適用することができる。例えば、メールによる要求に対応して、電話音声によってサービス情報を提供するシステムに適用することが可能である。また、ユーザの電話番号は、携帯電話機400の電話番号に限定されるものではなく、固定電話やPHS(personal handyphone system)端末など各種電話機の電話番号としてもよい。