JP2005286886A - サーバ - Google Patents

サーバ Download PDF

Info

Publication number
JP2005286886A
JP2005286886A JP2004100637A JP2004100637A JP2005286886A JP 2005286886 A JP2005286886 A JP 2005286886A JP 2004100637 A JP2004100637 A JP 2004100637A JP 2004100637 A JP2004100637 A JP 2004100637A JP 2005286886 A JP2005286886 A JP 2005286886A
Authority
JP
Japan
Prior art keywords
communication
conversation
server
sound signal
call
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004100637A
Other languages
English (en)
Inventor
Koichi Shimamura
光一 島村
Toshihiro Shiren
俊弘 枝連
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SoftBank Corp
Advanced Media Inc
Original Assignee
Vodafone KK
Advanced Media Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vodafone KK, Advanced Media Inc filed Critical Vodafone KK
Priority to JP2004100637A priority Critical patent/JP2005286886A/ja
Publication of JP2005286886A publication Critical patent/JP2005286886A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 複数の携帯電話機の利用者間でなされている会話の内容に応じた音信号を携帯電話機に送信するという新規な通信サービスの提供が可能になるサーバ及び通信サービスシステムを提供する。
【解決手段】 会話エージェントサーバ20は、外部通信部210、主制御部220、会話認識部230及び応答音生成部240を備える。会話認識部230は音声信号に基づいて音声の内容を認識する。応答音生成部240は音声の内容に応じた音信号を生成する。主制御部220は、複数の携帯電話機40,50との間で通信回線を確立し、通信回線を確立した状態で携帯電話機間の通話中における利用者間の会話の音声信号を取得し、その音声信号に基づいて会話の内容を会話認識部230で認識し、認識した会話の内容に応じた応答用の音信号を応答音生成部240で生成し、応答用の音信号を外部通信部210で携帯電話機40,50に送信する。
【選択図】 図1

Description

本発明は、通信ネットワークを介した通話機能を有する複数の携帯電話機等の通信端末との間で通信するための通信手段を備えた通信サービス用のサーバ、及びそのサーバを含む通信サービスシステムに関するものである。
従来、携帯電話機、固定電話機、ファクシミリ端末等の通信端末の通話機能を利用した通信サービスシステムとして、利用者の通信端末から入力された音声信号を通信ネットワークを介して受け、その音声信号に応答するように所定の情報を上記利用者の通信端末に送信するサーバを用いたものが知られている(例えば特許文献1、2参照)。
例えば、特許文献1に記載のサーバ(ホームページアクセス装置)は、利用者が通信端末から入力したホームページのアドレス及び閲覧項目の音声信号を通信ネットワークを介して受信する。そして、その音声信号を音声認識した結果に基づいて取得した上記所定のホームページ情報を上記利用者の通信端末に送信する。
また、特許文献2に記載のサーバ(自動音声応答サーバ)は、利用者が通信端末(固定電話や携帯電話)から入力した要求の音声信号を通信ネットワークを介して受信する。そして、その音声信号を音声認識した結果に基づいて情報データベースを検索し該当する情報を上記利用者の通信端末に送信する。
特開2001−109687号公報 特開2003−169147号公報
上記従来の音声通話を用いた通信サービスシステムは、携帯電話、固定電話及びファクシミリ端末等の通信端末から入力した音声信号を通信ネットワーク上のサーバで受信し、その音声信号に応答するように所定の情報をサーバから通信端末に送信するという、一つの通信端末とサーバとの間の1対1の音声通信によるサービスであった。
一方、近年、上記通話機能を有する携帯電話機等の通信端末の普及に伴い、その通信端末から利用できる通信サービスも多様化してきている。通信端末の通話機能を利用した通信サービスについても、複数の利用者間で会話することができるという特徴を生かした多様な通信サービスが提供されると、通信端末の利用態様がさらに増えることになる。
本発明は以上の問題点に鑑みなされたものであり、その目的は、複数の通信端末の利用者間でなされている会話の内容に応じた音信号をそれらの複数の通信端末の少なくとも一つに送信するという新規な通信サービスの提供が可能になる通信サービス用のサーバ及び通信サービスシステムを提供することである。
上記目的を達成するために、請求項1の発明は、通信ネットワークを介した通話機能を有する複数の通信端末との間で通信するための通信手段を備えた通信サービス用のサーバであって、音声信号に基づいて音声の内容を認識する認識手段と、該音声の内容に応じた音信号を生成する音信号生成手段と、上記通信手段、該認識手段及び該音信号生成手段を制御する制御手段とを備え、該制御手段は、複数の通信端末との間で通信回線を確立し、該通信回線を確立した状態で該複数の通信端末間の通話中における利用者間の会話の音声信号を取得し、該会話の音声信号に基づいて該会話の内容を該認識手段で認識し、該認識した会話の内容に応じた応答用の音信号を該音信号生成手段で生成し、該応答用の音信号を該通信手段で該複数の通信端末の少なくとも一つに送信するように制御することを特徴とするものである。
また、請求項2の発明は、請求項1の通信サービス用のサーバにおいて、上記認識手段は、上記会話の音声信号について音声認識処理を行い、この音声認識結果の中から特徴的なキーワードを抽出し、上記音信号生成手段は、該認識手段で抽出したキーワードに応じた応答用の音信号を生成することを特徴とするものである。
また、請求項3の発明は、請求項1又は2の通信サービス用のサーバにおいて、上記制御手段は、上記複数の通信端末の一つである発信元の通信端末から通話先の端末情報を含む発呼を受けたときに、該発信元の通信端末との間で通信回線を確立し、該通話先の端末情報に基づいて該通話先の通信端末に対して発呼し、該通話先の通信端末との間で通信回線を確立するように制御することを特徴とするものである。
また、請求項4の発明は、請求項3のサーバと、通信ネットワーク上で複数の通信端末間の通信及び通信端末と該サーバとの間の通信を中継する通信中継装置とを備え、該通信中継装置は、上記発信元の通信端末から通話先の端末情報と該サーバへの接続情報とを含む発呼があったときに、該発信元の通信端末と該サーバとの間の通信を中継し、該サーバから該通話先の通信端末に対する発呼があったときに、該サーバと該通話先の通信端末との間の通信を中継することを特徴とするものである。
また、請求項5の発明は、請求項4の通信サービスシステムにおいて、上記通信ネットワークを介して上記サーバと通信可能な複数の通信端末を更に備え、該通信端末は、通話先の端末情報と該サーバへの接続情報とを含む発呼が可能なことを特徴とするものである。
なお、上記「応答用の音信号」としては、利用者間の会話を演出するような効果音や、サーバ内で合成した音声や予め録音して記憶手段に保存している音声等の人の音声が挙げられるが、会話の内容に対応したものであればこれらに限定されるものではない。
また、上記「通信端末」としては、PDC(Personal Digital Cellular)方式、GSM(Global System for Mobile Communication)方式、TIA(Telecommunications Industry Association)方式等の携帯電話機、IMT(International Mobile Telecommunications)−2000で標準化された携帯電話機、TD−SCDMA(Time Division ynchronous Code Division Multiple Access)方式の一つであるTD−SCDMA(MC:Multi Carrier)方式の携帯電話機、PHS(登録商標:Personal Handyphone Service)、自動車電話機、固定電話機等の通話機能を有する電話機が挙げられる。また、この「通信端末」としては、上記電話機のほか、通話機能を有するPDA(Personal Digital Assistance)やパーソナルコンピュータ等の通信端末も挙げられる。更に、この「通信端末」としては、IP(Internet Protocol)電話を利用可能な通信端末も挙げられる。
また、上記通信端末における制御や情報処理は、その通信端末に設けられたコンピュータで所定のプログラムを実行することによって実現することもできる。このコンピュータで用いるプログラムの受け渡しは、デジタル情報としてプログラムを記録したFD,CD−ROM等の記録媒体を用いて行なってもいいし、コンピュータネットワーク等の通信ネットワークを用いて行なってもよい。
請求項1乃至5の発明によれば、通信サービス用のサーバの制御手段で制御される各手段により、次のような処理を行う。すなわち、通信手段は、複数の通信端末との間で通信回線を確立し、この通信回線が確立した状態で複数の通信端末間の通話中における利用者間の会話の音声信号を取得する。認識手段は、通信手段で取得した音声信号に基づいて会話の内容を認識する。音信号生成手段は、認識手段で認識した会話の内容に応じた応答用の音信号を生成する。通信手段は、音信号生成手段で生成した応答用の音信号を複数の通信端末の少なくとも一つに送信する。サーバから応答用の音信号を受信した通信端末では、その利用者が行っている会話の内容に応じた応答用の音信号を出力することができる。このように複数の通信端末の利用者間でなされている会話の内容に応じた音信号をその通信端末に送信するという新規な通信サービスの提供が可能になるという効果がある。
特に、請求項2の発明によれば、上記複数の通信端末の利用者間の会話に含まれる特徴的なキーワードを抽出することができる。このように抽出した特徴的なキーワードを用いることにより、自然言語による会話の音声認識結果の全体から内容を特定する場合に比して、自然言語による会話の内容をより速やかに特定することができるという効果がある。
また特に、請求項3、4及び5の発明によれば、発信元の通信端末から、通話先の端末情報とサーバへの接続情報とを含む発呼があると、通信ネットワーク上の通信制御装置は、発信元の通信端末とサーバとの間の通信を中継する。これにより、発信元の通信端末とサーバとの間で通信回線が確立される。サーバは、発信元の通信端末からの発呼に含まれる通話先の端末情報に基づいて、通話先の通信端末に対する発呼を行う。通信制御装置は、この発呼を受けて、サーバと通話先の通信端末との間の通信を中継する。これにより、サーバと通話先の通信端末との間で通信回線が確立される。以上により、発信元の通信端末、サーバ及び通話先の通信端末の間で通信可能な状態になる。このように発信元の通信端末から所定の情報を含む発呼を行うという簡単な操作で、発信元の通信端末、サーバ及び通話先の通信端末の間で通信可能な状態にし、通信端末の利用者が上記通信サービスを受けることができるようになるという効果がある。
以下、本発明を通信端末としての携帯電話機を用いた通信サービスシステムに適用した実施形態について説明する。
図1は本実施形態に係る通信サービスシステムの概略構成図である。この通信サービスシステムは、通信ネットワークとしての携帯電話通信網10上に設けられた音声通信サービス用のサーバ20及び通信中継装置としての交換機30を用いて構成されている。サーバ20は、複数の携帯電話機の利用者間の音声通話による会話の内容を自動認識し、その会話の内容に応じた効果音や音声等の応答用の音信号を携帯電話機に送信する仮想的な擬似人格をもった会話エージェントとして機能するものである。以下、このサーバ20を会話エージェントサーバと呼ぶことにする。
図2は、上記会話エージェントサーバ20の概略構成を示すブロック図である。この会話エージェントサーバ20は、通信手段としての外部通信部210と、制御手段としての主制御部220と、認識手段としての会話認識部230と、音信号生成手段としての応答音生成部240とを備えている。外部通信部210は、携帯電話通信網10を介した通話機能を有する複数の携帯電話機との間で通信する機能を有する。会話認識部230は、会話の音声信号に基づいて会話の内容を認識する機能を有する。応答音生成部240は、会話の内容に応じた音信号を生成する機能を有する。主制御部220は、上記各部を制御したり、その他の情報処理を実行したりする。この制御及び情報処理により、複数の携帯電話機との間で通信回線を確立し、この通信回線を確立した状態で複数の携帯電話機間の通話中における利用者間の会話の音声信号を取得する。そして、取得した音声信号に基づいて会話の内容を認識し、認識した会話の内容に応じた応答用の音信号を生成し、複数の携帯電話機の少なくとも一つに送信することができる。各部の詳細については後述する。
図3は、上記会話エージェントサーバ20のハードウェア構成の一例を示すブロック図である。この会話エージェントサーバ20は、システムバス200、CPU201、内部記憶装置、外部記憶装置204、入力装置205、出力装置206、及び携帯電話用通信装置207を備えている。上記内部記憶装置は、RAM202やROM203等で構成されている。上記外部記憶装置は、ハードディスクドライブ(HDD)や光ディスクドライブ等で構成されている。上記入力装置205は、マウスやキーボード等で構成されている。上記出力装置206は、ディスプレイやプリンタ等で構成されている。上記携帯電話用通信装置207は、携帯電話通信網50を介して各利用者の携帯電話機40,50と通信するための装置であり、通常の固定電話機や携帯電話機と同様な有線通信機能や無線通信機能を有する通信モジュール等を用いて構成することができる。
上記CPU201やRAM202等の構成要素はお互いに、システムバス200を介して、データやプログラムの命令等のやり取りを行っている。この会話エージェントサーバ20を所定の手順に従って動作させるためのプログラムはROM203や外部記憶装置204に記憶されており、必要に応じてCPU201やRAM202上の作業エリアに呼び出されて実行される。
また、上記会話エージェントサーバ20は、一部又は全体を専用の制御装置として構成してもいいし、一部又は全体を汎用のコンピュータシステムを用いて構成してもよい。本実施形態では、図2の1点鎖線で囲んだ部分250をコンピュータシステムを用いて構成している。また、会話エージェントサーバ20は、1台のコンピュータで構成してもいいし、複数の機能をそれぞれ受け持つ複数台のコンピュータをネットワークで結んで構成してもよい。
図4は、上記外部通信部210のより具体的な構成例を示すブロック図である。この外部通信部210は、通信中継部211、音声信号取得部212、音声信号混合部213及びインターフェース部214を備えている。
上記通信中継部211は、携帯電話機40,50との通信回線を確立するための処理を実行したり、携帯電話機40,50間でなされる通話の通信を中継する処理を実行したりする。また、通信中継部211は、携帯電話機40,50間でなされる通話中の信号を音声信号取得部212に連続して送ったり、各携帯電話機の利用者の音声信号に応答用の音信号を混合したものを音声信号混合部213から受け取って各携帯電話機に送信したりする機能も有している。
上記音声信号取得部212は、通信中継部211から連続して受けている信号から通話中の利用者A,Bの音声信号を取得し、インターフェース部214を介して主制御部220に送ったり、音信号混合部213に送ったりする。
上記音信号混合部213は、インターフェース部214を介して主制御部220から受けた応答用の音信号と、音声信号取得部212から受けた利用者A,Bの音声信号とを混合し、通信中継部211へ送る。
図5は、上記会話認識部230のより具体的な構成例を示すブロック図である。この会話認識部230は、ディクテーション処理部231、キーワード抽出処理部232及びキーワードデータベース233を備えている。
上記ディクテーション処理部231は、必要に応じてノイズ処理や補正処理を行った後、ディクテーションを使用する方法によって音声をテキスト化する処理を行う。このディクテーション処理は、一般的な文章を「てにをは」を含めて認識する。あらかじめ作成した単語等のリストにある単語を認識対象とするルールグラマーを利用した方法に比べると、多くの可能性のある中で処理をする点で困難な方法である。そこで、この困難の緩和のために、公知のアルゴリズムであるNグラムモデルを用いる。
このNグラムモデルは、N=3の場合(トライグラムという)を例にとると、与えられた単語列w1w2・・・wnの出現確率P(w1w2・・・wn)の推定をする場合に、P(w1w2・・・wn)=ΠP(wi|wi-2、wi-1)のような近似をするモデルである。右辺のP(wi|wi-2、wi-1)は、単語wi-2、wi-1と来たときに、次にwiが来る条件付確率を表す。P(wi|wi-2、wi-1)のすべての積を計算し、P(w1w2・・・wn)が最も大きな値を取る単語列の組み合わせを認識結果として決定する。
このように、ディクテーション処理によって、音声をテキスト化できるので、このテキストを文字列検索することでキーワードの検出が容易にできる。
上記キーワード抽出処理部232は、キーワードデータベース233を使って、上記ディクテーション処理部231で得られた文字列からなる音声認識結果から特徴的なキーワードを抽出する処理を行う。このキーワード抽出処理部232で抽出したキーワードは、次の応答音生成部240に送られる。
上記キーワード抽出処理部232で使用するキーワードデータベース233は、利用者の会話に比較的頻繁に登場すると考えられる各種単語を予め保存したデータベースである。このキーワードデータベース233には、次の応答音生成部240で応答用の音情報の生成の対象になっている単語だけを保存するようにしてもよい。
図6は、上記応答音生成部240のより具体的な構成例を示すブロック図である。この応答音生成部240は、応答音データベース241及び応答音信号合成部242を備えている。
上記応答音データベース241は、上記キーワード抽出処理部232で抽出される各キーワードに対応する応答用の音信号を合成するための音合成用データを保存したデータベースである。この音信号としては、例えば、利用者の会話を盛り上げる効果音やBGM、利用者の会話に答えるような内容の人の音声等がある。この応答音データベース241は、前述の会話認識部230で用いるキーワードデータベース233と一体的に構成してもよい。
上記応答音信号合成部242は、会話認識部230から受けたキーワードの情報に基づいて応答音データベース241から特定の合成用データを読み出し、この特定の合成用データを用いて応答用の音信号を合成する。この合成された応答用の音信号は、主制御部220を経由して外部通信部210に送られる。
図7は、上記応答音生成部240の他の構成例を示すブロック図である。この応答音生成部240は、上記応答音信号合成部242の代わりに応答音信号選択部243を備えている。また、この構成例で使用する応答音データベース241には、録音済みの効果音や音声などの各種音信号の電子データが、上記キーワード抽出処理部232で抽出される各キーワードと関連付けて保存されている。
上記応答音信号選択部243は、会話認識部230から受けたキーワードの情報に基づいて応答音データベース241から特定の録音済みの音信号のデータを選択して読み出す。この読み出した応答用の音信号は、主制御部220を経由して外部通信部210に送られる。
なお、上記応答音データベース241の音合成用データやの録音済みの音信号データは、複数のキーワードが同時期に抽出された場合にのみ読み出されるように保存してもよい。例えば、表1に示すように一つの応答用の音信号を複数のキーワード群に関連付けて保存してもよい。この場合、表1に示すように複数のキーワード間に論理積や論理和の条件を付与してもよい。
Figure 2005286886
上記交換機30は、交換機30は、携帯電話機40,50や会話エージェントサーバ20からの発呼に基づいて、各携帯電話機間や各携帯電話機と会話エージェントサーバ20との間で通信回線を確立できるように、それぞれの間の通信を中継するものである。
図8は、上記通信サービスシステムで使用可能な携帯電話機の概略構成を示すブロック図である。この図8では、利用者Aの携帯電話機40について示しているが、利用者Bの携帯電話機50も同様な構成を有し同様に動作するものである。
この携帯電話機40は、制御手段としての主制御部410と、記憶手段としての内部メモリ411と、通信手段としての無線通信部413及びアンテナ412とを備えている。
上記主制御部410は、例えばCPU、キャッシュメモリ、ROM、システムバス等で構成され、所定の制御プログラムを実行することにより、内部メモリ411や無線通信部413等の各部との間でデータの送受信を行ったり、各部を制御したりする。この主制御部410には、音声処理部414を介してマイク415及びスピーカ416が接続され、表示制御部417を介して表示部418が接続されている。更に、主制御部410には、複数のキーからなるキー操作部419も接続されている。
上記表示部418は液晶ディスプレイ等を用いて構成され、文字や画像等の各種情報が表示される。上記キー操作部419は、データ入力キー(テンキー、*キー、#キー)、通話開始キー、終話キー、スクロールキー、多機能キー等を備え、電話の発信や着信のほか、表示部418に表示される情報のスクロールや選択等に用いる。
上記内部メモリ411は、例えばRAMやROMなどの半導体メモリで構成され、主制御部410で実行する制御プログラムや各種データを記憶するものである。また、この内部メモリ410は、情報提供サイトなどからダウンロードした画像、音楽、プログラム等のコンテンツデータを記憶するコンテンツデータ記憶手段としても用いられる。更に、この内部メモリ410は、スピーカ416から出力する音のデータ、表示部418に表示する画像データ等を記憶する記憶手段としても用いられる。
上記無線通信部413は主制御部410で制御され、アンテナ412を介して、所定の通信方式により携帯電話通信網10の基地局との間で無線通信を行うものである。この無線通信により、特定の携帯電話機等との間で音声電話通信を行ったり、電子メールの送受信や情報提供サイトからのコンテンツダウンロード等のデータ通信を行ったりすることができる。
図9は、上記会話エージェントの通信サービスを開始するときの携帯電話機40,50と会話エージェントサーバ20との間で通信路(通信回線)を確立するときの手順を示すシーケンス図である。この図9は、利用者Aから利用者Bに電話をかけるときの手順を示している。
まず、利用者Aが携帯電話機40から発呼操作を行う。具体的には、会話エージェントサーバ20に付与されている番号(エージェント特番)と、利用者Bの携帯電話機50の電話番号とを入力し、通話開始キーを押下する。この発呼操作により、携帯電話機40は、交換機30を介して会話エージェントサーバ20に、上記エージェント特番及び利用者Bの携帯電話機50の電話番号とともに所定の発呼信号を送信する。
上記発呼信号を受けた会話エージェントサーバ20は、交換機30を介して利用者Aの携帯電話機40に、所定の応答信号を送信する。
上記応答信号を携帯電話機40が受信することにより、利用者Aの携帯電話機40と会話エージェントサーバ20との間で通信路(通信回線)が確立され、両者の間で音声信号の送受信が可能な状態になる。
次に、会話エージェントサーバ20は、上記応答信号を送信した後、交換機30を介して利用者Aの携帯電話機40に、利用者Bの携帯電話機50の電話番号とともに所定の発呼信号を送信する。利用者Bの携帯電話機50は、会話エージェントサーバ20からの発呼信号を受信すると、着呼操作を促す呼出音を出力する。この呼び出し音を聞いた利用者Bが着呼操作を行うと、携帯電話機50は、交換機30を介して会話エージェントサーバ20に応答信号を送信する。
上記応答信号を会話エージェントサーバ20が受信することにより、会話エージェントサーバ20と利用者Bの携帯電話機50との間で通信路(通信回線)が確立され、両者の間で音声信号の送受信が可能な状態になる。
以上により、三者間の通信路(通信回線)、すなわち利用者Aの携帯電話機40と会話エージェントサーバ20と利用者Bの携帯電話機50との間で通信路(通信回線)が確立され、三者の間で音声信号の送受信可能な状態になる。
上記三者間の通信路(通信回線)が確立された状態で、三者間の音声等を含む信号の送受信は例えば次のような手順で行われる。
利用者Aのみが発話している場合は、利用者Aの携帯電話機40から送信された音声信号が会話エージェントサーバ20を経由して利用者Bの携帯電話機50にそのまま転送される。
また、利用者A及びBが発話している場合は、利用者Aの携帯電話機40から送信された音声信号が会話エージェントサーバ20を経由して利用者Bの携帯電話機50にそのまま転送される。同時に、利用者Bの携帯電話機50から送信された音声信号が会話エージェントサーバ20を経由して利用者Aの携帯電話機40にそのまま転送される。
また、会話エージェントサーバ20から効果音、BGM、人の音声等の音信号を発する場合は、会話エージェントサーバ20で生成した音信号が利用者A及びBの携帯電話機40、50のそれぞれに送信される。
また、利用者A及びBが発話しているときに会話エージェントサーバ20から効果音、BGM、人の音声等の音信号を発する場合は、利用者Aの携帯電話機40から送信された音声信号に会話エージェントサーバ20で生成された音信号が音声信号混合部213で混合され、その混合された信号が利用者Bの携帯電話機50に送信される。同時に、利用者Bの携帯電話機50から送信された音声信号に会話エージェントサーバ20で生成された音信号が音声信号混合部213で混合され、その混合された信号が利用者Aの携帯電話機40に送信される。
図10は、上記図9の手順で三者間の通信路(通信回線)が確立された後の会話エージェントサーバ20における会話エージェント処理の手順を示すフローチャートである。
まず、上記通話可能な状態で利用者A及びBが発話して会話すると、その会話の音声信号を取得し、取得した音声信号に基づいて会話内容の音声認識処理を実行し、会話に含まれる特徴的なキーワードを抽出する(ステップ1、2)。
次に、音声認識処理で得られたキーワードに基づいて、利用者A及びBの会話に応答するか否かを判断する(ステップ3)。この判断は、応答タイミングを予め設定したタイマーに基づいて行ってもよい。ここで、応答すると判断した場合は、上記音声認識処理で抽出したキーワードの情報に基づいて、そのキーワードに対応した効果音、BGM、人の音声等からなる応答用の音信号を生成する(ステップ4)。この応答用の音信号の生成は、前述のように音信号を合成して生成してもいいし、予め録音した複数の音データから選択することにより生成してもよい。
次に、上記生成した音信号を交換機30を含む携帯電話通信網10を介して利用者A及びBの携帯電話機40、50に送信する。各携帯電話機40、50では、通話先の携帯電話機からの利用者の音声と同じように、会話エージェントサーバ20から送信されてきた応答用の音信号に対応する効果音、BGM、人の音声等を出力することができる。
以上、本実施形態によれば、複数の携帯電話機40,50の利用者間でなされている会話の内容に応じた効果音、BGM、人の音声等の音信号を携帯電話機40,50に送信するという新規な通信サービスの提供が可能になる。
また、本実施形態によれば、会話エージェントサーバ20において、上記複数の携帯電話機40,50の利用者A,B間の会話から抽出した特徴的なキーワードを用いることにより、自然言語による会話の音声認識結果の全体から内容を特定する場合に比して、自然言語による会話の内容をより速やかに特定することができる。
また、本実施形態によれば、発信元の携帯電話機40から所定の情報(エージェント特番及び利用者Bの携帯電話機50の電話番号)を含む発呼を行うという簡単な操作で、発信元の利用者Aの携帯電話機40、会話エージェントサーバ20、及び通話先の利用者Bの携帯電話機50の間で通信可能な状態にし、携帯電話機の利用者A,Bが上記会話エージェントの通信サービスを受けることができる。
なお、上記実施形態では通信端末が携帯電話機の場合について説明したが、本発明は、通話機能を有するものであれば、PHS(登録商標)、自動車電話機、固定電話機等の電話機、PDA等の他の通信端末の場合についても適用でき、同様な効果が得られるものである。
また、本実施形態では通話している携帯電話機が2台の場合について説明したが、携帯電話機が3台以上であってもよく、本発明は、携帯電話機等の通信端末の台数による制限を受けないものである。
また、上記実施形態において、会話エージェントサーバ20及び交換機30とともに利用者の携帯電話機を含めた全体を通信サービスシステムとしてもよい。
また、上記実施形態において、携帯電話通信網は、回線交換の通信網、パケット交換の通信網及びそれらが混在した通信網のいずれであってもよい。
本発明の実施形態に係る携帯電話機を用いた通信サービスシステムの概略構成図。 同通信サービスシステムを構成する会話エージェントサーバの概略構成を示すブロック図。 同会話エージェントサーバのハードウェア構成の一例を示すブロック図。 同会話エージェントサーバを構成する外部通信部のより具体的な構成例を示すブロック図。 同会話エージェントサーバを構成する会話認識部のより具体的な構成例を示すブロック図。 同会話エージェントサーバを構成する応答音生成部のより具体的な構成例を示すブロック図。 同応答音生成部の他の構成例を示すブロック図。 本実施形態の通信サービスシステムで使用可能な携帯電話機の概略構成を示すブロック図。 会話エージェントの通信サービスを開始するときの携帯電話機と会話エージェントサーバとの間で通信路(通信回線)を確立するときの手順を示すシーケンス図。 会話エージェントサーバにおける会話エージェント処理の手順を示すフローチャート。
符号の説明
10 携帯電話通信網
20 会話エージェントサーバ
30 交換機
40、50 携帯電話機

Claims (5)

  1. 通信ネットワークを介した通話機能を有する複数の通信端末との間で通信するための通信手段を備えた通信サービス用のサーバであって、
    音声信号に基づいて音声の内容を認識する認識手段と、
    該音声の内容に応じた音信号を生成する音信号生成手段と、
    上記通信手段、該認識手段及び該音信号生成手段を制御する制御手段とを備え、
    該制御手段は、複数の通信端末との間で通信回線を確立し、該通信回線を確立した状態で該複数の通信端末間の通話中における利用者間の会話の音声信号を取得し、該会話の音声信号に基づいて該会話の内容を該認識手段で認識し、該認識した会話の内容に応じた応答用の音信号を該音信号生成手段で生成し、該応答用の音信号を該通信手段で該複数の通信端末の少なくとも一つに送信するように制御することを特徴とする通信サービス用のサーバ。
  2. 請求項1の通信サービス用のサーバにおいて、
    上記認識手段は、上記会話の音声信号について音声認識処理を行い、この音声認識結果の中から特徴的なキーワードを抽出し、
    上記音信号生成手段は、該認識手段で抽出したキーワードに応じた応答用の音信号を生成することを特徴とする通信サービス用のサーバ。
  3. 請求項1又は2の通信サービス用のサーバにおいて、
    上記制御手段は、上記複数の通信端末の一つである発信元の通信端末から通話先の端末情報を含む発呼を受けたときに、該発信元の通信端末との間で通信回線を確立し、該通話先の端末情報に基づいて該通話先の通信端末に対して発呼し、該通話先の通信端末との間で通信回線を確立するように制御することを特徴とする通信サービス用のサーバ。
  4. 請求項3のサーバと、通信ネットワーク上で複数の通信端末間の通信及び通信端末と該サーバとの間の通信を中継する通信中継装置とを備え、
    該通信中継装置は、上記発信元の通信端末から通話先の端末情報を付加した発呼があったときに、該発信元の通信端末と該サーバとの間の通信を中継し、該サーバから該通話先の通信端末に対する発呼があったときに、該サーバと該通話先の通信端末との間の通信を中継することを特徴とする通信サービスシステム。
  5. 請求項4の通信サービスシステムにおいて、
    上記通信ネットワークを介して上記サーバと通信可能な複数の通信端末を更に備え、
    該通信端末は、通話先の端末情報と該サーバへの接続情報とを含む発呼が可能なことを特徴とする通信サービスシステム。
JP2004100637A 2004-03-30 2004-03-30 サーバ Pending JP2005286886A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004100637A JP2005286886A (ja) 2004-03-30 2004-03-30 サーバ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004100637A JP2005286886A (ja) 2004-03-30 2004-03-30 サーバ

Publications (1)

Publication Number Publication Date
JP2005286886A true JP2005286886A (ja) 2005-10-13

Family

ID=35184777

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004100637A Pending JP2005286886A (ja) 2004-03-30 2004-03-30 サーバ

Country Status (1)

Country Link
JP (1) JP2005286886A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010206717A (ja) * 2009-03-05 2010-09-16 Nec Corp 音声応答システム、音声応答装置および音声応答方法
JP2015018174A (ja) * 2013-07-12 2015-01-29 ヤフー株式会社 情報処理装置及び方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010206717A (ja) * 2009-03-05 2010-09-16 Nec Corp 音声応答システム、音声応答装置および音声応答方法
JP2015018174A (ja) * 2013-07-12 2015-01-29 ヤフー株式会社 情報処理装置及び方法

Similar Documents

Publication Publication Date Title
JP3884851B2 (ja) 通信システムおよびこれに用いられる無線通信端末装置
US6424945B1 (en) Voice packet data network browsing for mobile terminals system and method using a dual-mode wireless connection
US8285257B2 (en) Emotion recognition message system, mobile communication terminal therefor and message storage server therefor
AU684872B2 (en) Communication system
US7400712B2 (en) Network provided information using text-to-speech and speech recognition and text or speech activated network control sequences for complimentary feature access
KR100627718B1 (ko) 문자 메시지에 포함되어 있는 전화 번호에 하이퍼링크기능을 제공하는 이동통신 단말기 및 그 방법
US20090198497A1 (en) Method and apparatus for speech synthesis of text message
JP2000305583A (ja) 音声合成装置
JP2005346252A (ja) 情報伝達システムおよび情報伝達方法
JP2007529916A (ja) コンピュータでの音声通信
KR101367722B1 (ko) 휴대단말기의 통화 서비스 방법
US20050049879A1 (en) Communication device capable of interworking between voice communications and text communications
KR100380829B1 (ko) 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체
JP3741025B2 (ja) 電話システム、電話機およびコンピュータプログラム
JP2005286886A (ja) サーバ
JP2007019600A (ja) 電話装置及び着信通知方法
JP5175231B2 (ja) 通話システム、通話方法、通話プログラム、電話端末及び交換機
JP5423970B2 (ja) 音声メール実現システム、音声メール実現サーバ、その方法及びそのプログラム
JP2001251429A (ja) 携帯電話を使用した音声翻訳システムおよび携帯電話
KR100703383B1 (ko) 휴대용 단말기의 전자사전서비스 방법
JP2007264466A (ja) 音声合成装置
KR100553437B1 (ko) 음성 합성을 이용한 음성 메시지 전송 기능을 가지는무선통신 단말기 및 그 방법
JP2002218016A (ja) 携帯電話機及び携帯電話機を用いた翻訳方法
JP2003242148A (ja) 情報端末、管理装置、及び情報処理方法
JP2003141116A (ja) 翻訳システム、翻訳方法、および、翻訳プログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20051209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060929

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061128

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070413

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070613

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070809

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20070831

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080501