JP5291554B2 - 通信システム、マッチングデータベースサーバ - Google Patents

通信システム、マッチングデータベースサーバ Download PDF

Info

Publication number
JP5291554B2
JP5291554B2 JP2009158006A JP2009158006A JP5291554B2 JP 5291554 B2 JP5291554 B2 JP 5291554B2 JP 2009158006 A JP2009158006 A JP 2009158006A JP 2009158006 A JP2009158006 A JP 2009158006A JP 5291554 B2 JP5291554 B2 JP 5291554B2
Authority
JP
Japan
Prior art keywords
mobile terminal
terminal device
synthesis
matching
representation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009158006A
Other languages
English (en)
Other versions
JP2011013970A (ja
Inventor
悠 古城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2009158006A priority Critical patent/JP5291554B2/ja
Publication of JP2011013970A publication Critical patent/JP2011013970A/ja
Application granted granted Critical
Publication of JP5291554B2 publication Critical patent/JP5291554B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、送信側移動端末装置から発したテキストデータに基づいて受信側移動端末装置で当該テキストデータに対応する、例えば、発信者を模した顔の画像や音声等の知覚表象を合成する表象合成コミュニケーションモードでの通信が可能な通信システム、および、このような通信システムに係る、表象合成用アプリケーションプログラムデータベースサーバ、マッチングデータベースサーバ、移動端末装置に関する。
送信側移動端末装置からの宛先情報とテキストデータを含むメッセージ情報に基づいて音声メッセージを合成するメッセージ変換サーバを設け、合成された音声メッセージを、宛先情報に対応した通信装置に送信する通信システムが提供されている(例えば、特許文献1参照)。
特許文献1の提案では、受信側の移動端末装置にテキストデータに基づいて音声メッセージを合成する機能が搭載されていない場合であっても、送信側が音声メッセージでの受信を所望する場合に、これを実現することができるとされている。
また、メールの差出人本人の音声と特徴を交えてメールを読み上げ、確実に差出人を認識しつつメールの内容を確認できるようにしようとする提案がある(例えば、特許文献2参照)。
特許文献2に提案されている技術では、移動端末装置は、キーワードと個人音声との対応データ、一般音声データ、電子メールデータ、および、個人情報をそれぞれ記憶する各記憶部を備える。そして、電子メールデータを入力して、記憶されている個人情報から差出人を特定し、音声読み上げエンジンによって、この差出人に対応する個人音声データと一般音声データとから音声を合成してスピーカから出力する。
更にまた、移動端末装置内には音声合成手段を持たずに、受信側移動端末装置において電子メールを読み上げることを可能にする技術も既に提案されている(例えば、特許文献3参照)。
特許文献3に提案されている技術では、サーバシステムに着信したメールのコピーを音声合成エンジンで音声ファイルに変換し、この音声ファイルを受信側移動端末装置にダウンロードする。そして、受信側移動端末装置においてダウンロードした音声ファイルを自動的に読み上げる。
また、テキストデータに基づいて音声を発生させるのみならず、音声に対応する適切なタイミングで顔などの動画像を発生させようとする提案がある(例えば、特許文献4参照)。
特許文献4に提案されている技術では、テキストデータに基づいて音声を合成する音声合成手段と、音声発生のタイミングに歩調を合わせた動画像を発生させる動画像発生手段とを持つサーバを移動パケット通信網上に設け、移動端末装置同士で、このサーバを経由して通信を行う。
更に、搭載容量の限られた移動端末装置等において、大規模の音声データベースを利用する場合と同様の高品質な音声合成を可能にしようとする提案もある(例えば、特許文献5参照)。
特許文献5に提案されている技術では、移動端末装置側に小規模のローカル音声データベースを用意し、ここに保有された限りのデータでテキストデータから音声を合成する一方、適宜にネットワーク介して遠隔地の大規模・大容量音声データベースから豊富な音声素片データをダウンロードし、これを利用して音声を合成する。
更にまた、ネットワークサーバを介して、複雑な画像処理を含む動画像を用いた通信を移動端末装置間で行えるようにしようとする提案もある(例えば、特許文献6参照)。
特許文献6に提案されている技術では、移動端末装置に搭載されたカメラで撮影した顔写真の画像データをネットワークサーバに登録しておき、所望の登録画像に基づいて好みに応じてカスタマイズ処理可能な中間画像を生成し、この中間画像をユーザの移動端末装置に送信してカスタマイズされた顔画像の表示に供する。
特開2007−179305号公報(要約、請求項1、段落0014、段落0022、他) 特開2007−299352号公報(要約、段落0005、他) 特開2007−233435号公報(要約、請求項1、段落0009、段落0017、他) 特開2006−48379号公報(要約、請求項1、段落0003、段落0004、他) 特開2003−233386号公報(要約、請求項1、段落0004、段落0005、他) 特開2003−242480号公報(要約、請求項2、他)
上掲の従来技術では、何れも、送信側主導でテキストデータから音声や顔の動画像等の知覚表象を合成するように指示し、これらの知覚表象を受信側で再生させる(特許文献1〜6)。受信側でこのような知覚表象の合成処理を実行することは移動端末装置としては、合成に必要なデータベースを保持することが出来ないか、あるいは、合成処理の負担が大きいといった理由により、中継サーバにおいてこの合成処理を担うようにシステムを構築することも既に提案されている(特許文献1における「メッセージ変換サーバ」、特許文献3における「サーバシステム」、特許文献4における「サーバ」、特許文献5における「サーバ」等)。
但し、近年、特に処理負荷の観点では、携帯電話のような小型の端末における情報処理能力が著しく向上し、音声合成を問題なく行えるようになるなど解決されつつある。
一方、知覚表象の合成処理に供する音声素片データや撮影画像データ等をネットワーク上のサーバに用意しておき、移動端末装置では、適宜これらのデータを利用して知覚表象の合成処理を実行している(特許文献5における大規模・大容量音声データベースの音声素片データ、特許文献6におけるネットワークサーバに登録された顔写真の画像データ等)。
この場合、送信側移動端末装置から発したテキストデータに基づいて受信側移動端末装置で当該テキストデータに対応する、例えば、発信者を模した顔の画像や音声等の知覚表象を合成する表象合成コミュニケーションモードにおいて、発信者本人を表す知覚表象を合成する場合には、着信者側の端末で、発信側が指定する可能性のある全てのプログラムを予め保持するといったことは現実的ではない。このため、着信者側の端末で合成された知覚表象を再生するために、中継サーバにおいて汎用的なファイル形式(.WAV/.3gp/.flv etc)に変換し、該変換を施したデータを渡す必要があった。従って、発信者・着信者間で本人を模した表象合成コミュニケーションモードでの通信を行おうとした場合、表象合成コミュニケーションモードでの通信の継続中はテキストデータに基づいて知覚表象を合成する処理を持続させ、処理結果のデータを受信側に供給し続けるといった方法を採る場合にはネットワークサーバの負担が極めて重くなる。
またユーザにおいても、特に映像ファイルなどの比較的大容量のファイルをダウンロードする場合における遅延時間が、端末で映像を合成するケースに比べて長くなってしまい、発信者が指定する知覚表象合成プログラムを利用したコミュニケーションは課題があった。
さらに当該知覚表象の態様を、発信者側だけでなく、受信者側の要望ないし事情に応じたものにしようとする視点が無いため、例えば受信側の意思と関係なく音声・画像・映像ファイルを送信され、受信側のパケット料金が高額になる恐れがあるといった課題があった。
本願発明は、上述のような状況に鑑みてなされたものであり、受信側移動端末装置で再生される知覚表象の態様を受信者側の要望ないし事情に適合したものにすると共に、テキストデータに基づく本人を模した表象合成コミュニケーションに介在するネットワークサーバを合成処理サーバとしてではなく、移動端末装置での合成処理のためのアシストサーバとして位置づけ、ネットワークサーバの負担を大きく軽減する、通信システム、表象合成用アプリケーションプログラムデータベースサーバ、マッチングデータベースサーバ、移動端末装置を提供することを目的とする。
上記目的を達成するために、本願では、次に列記するような技術を提案する。
(1)信側移動端末装置における知覚表象の合成処理に適用する表象合成用アプリケーションプログラムの候補を複数保有する合成用プログラムデータベース部と、前記合成用プログラムデータベース部に保有された複数の表象合成用アプリケーションプログラムのうち前記受信側移動端末装置からの選択に応じたものを前記受信側移動端末装置に供給する合成用プログラムデータ供給部と、を有し、送信側移動端末装置から送信されたテキストデータに基づいて、少なくとも静止画像、動画像、および、筆跡のうちの一つを含む知覚表象を合成する表象合成用アプリケーションプログラムデータベースサーバと、
前記受信側移動端末装置で当該テキストデータに基づいて知覚表象を合成する処理に適用する表象合成用アプリケーションプログラムを選択的に取得するに際しての適切な選択を規定するマッチングデータを保有するマッチングデータベース部と、前記マッチングデータベース部に保有されたマッチングデータを前記受信側移動端末装置に提供するマッチングデータ供給部と、を有するマッチングデータベースサーバと、を備え、
前記表象合成用アプリケーションプログラムデータベースサーバと前記マッチングデータベースサーバとを、前記受信側移動端末装置からアクセス可能に、ネットワーク上に設けて、前記受信側移動端末装置で前記知覚表象を合成し再生する表象合成コミュニケーションモードでの通信を行うことを特徴とする通信システム。
上記(1)の通信システムは、送信側移動端末装置から送信されたテキストデータに基づいて受信側移動端末装置で知覚表象を合成し再生する表象合成コミュニケーションモードでの通信が可能に構築され、前記受信側移動端末装置からアクセス可能に、ネットワーク上に、表象合成用アプリケーションプログラムデータベースサーバとマッチングデータベースサーバとが設けられている。
この表象合成用アプリケーションプログラムデータベースサーバは、合成用プログラムデータベース部と、合成用プログラムデータ供給部とを有し、送信側移動端末装置から送信されたテキストデータに基づいて、少なくとも静止画像、動画像、および、筆跡のうちの一つを含む知覚表象を合成する。この合成用プログラムデータベース部は、前記受信側移動端末装置における知覚表象の合成処理に適用する表象合成用アプリケーションプログラムの候補を複数保有する。また、合成用プログラムデータ供給部は、前記合成用プログラムデータベース部に保有された複数の表象合成用アプリケーションプログラムのうち前記受信側移動端末装置からの選択に応じたものを前記受信側移動端末装置に供給する。
このマッチングデータベースサーバは、マッチングデータベース部と、マッチングデータ供給部とを有する。このマッチングデータベース部は、前記受信側移動端末装置で当該テキストデータに基づいて知覚表象を合成する処理に適用する表象合成用アプリケーションプログラムを選択的に取得するに際しての適切な選択を規定するマッチングデータを保有する。また、マッチングデータ供給部は、前記マッチングデータベース部に保有されたマッチングデータを前記受信側移動端末装置に提供する。
前記受信側移動端末装置は、ネットワークを介し、表象合成用アプリケーションプログラムデータベースサーバからその合成用プログラムデータ供給部を通して表象合成用アプリケーションプログラムを取得できる。また、前記受信側移動端末装置は、ネットワークを介し、マッチングデータベースサーバからそのマッチングデータ供給部を通して上述のマッチングデータを取得できる。受信側移動端末装置では、該マッチングデータに依拠して、当該送信側移動端末装置から送信されたテキストデータに基づいて知覚表象を合成する処理に適用する表象合成用アプリケーションプログラムを適切に選択することができる。更に、前記受信側移動端末装置では、該取得した表象合成用アプリケーションプログラムを自装置で稼動させることによって、送信側移動端末装置から送信されたテキストデータに基づいて、受信者が指定した知覚表象を合成する。さらに、表象合成用アプリケーションプログラムデータベースサーバからこのような表象合成用アプリケーションプログラムを取得した受信側移動端末装置では、該取得した表象合成用アプリケーションプログラムによって少なくとも静止画像、動画像、および、筆跡のうちの一つを含む知覚表象を合成することができる。
(2)前記静止画像および前記動画像は、前記送信側移動端末装置のユーザの顔を撮影したデータに基づいてその顔を模して再構築された静止画像および動画像、又は前記受信側移動端末装置で選択されたカスタマイズされた静止画像または動画像であることを特徴とする(1)の通信システム。
上記(2)の通信システムは、(1)の通信システムにおいて特に、前記静止画像および前記動画像を、前記送信側移動端末装置のユーザの顔を撮影したデータに基づいてその顔を模して再構築された静止画像および動画像、又は前記受信側移動端末装置で選択されたカスタマイズされた静止画像または動画像としている。
(3)前記知覚現象として、音声をさらに含み、
前記音声は、前記送信側移動端末装置のユーザの声若しくは前記ユーザの声を模した声音、又は前記受信側移動端末装置で選択されたカスタマイズされた音声であることを特徴とする(1)又は(2)の通信システム。
上記(3)の通信システムは、(1)又は(2)の通信システムにおいて特に、前記音声が、前記送信側移動端末装置のユーザの声若しくは前記ユーザの声を模した声音、又は前記受信側移動端末装置で選択されたカスタマイズされた音声である。
(4)前記通信が、前記送信側移動端末装置及び前記受信側移動端末装置間のチャットであることを特徴とする(1)から(3)のいずれかの通信システム。
上記(4)の通信システムは、(1)から(3)のいずれかに記載の通信システムにおいて特に、前記受信側移動端末装置で行われる前記知覚表象を合成し再生する表象合成コミュニケーションモードでの通信がチャットである。
(5)前記表象合成用アプリケーションプログラムデータベースサーバの前記合成用プログラムデータベース部は、同一の前記受信側移動端末装置に対応する選択可能な複数の表象合成用アプリケーションプログラムを保有することを特徴とする(1)から(4)のいずれかに記載の通信システム
上記(5)通信システムは、(1)から(4)のいずれかの通信システムにおいて特に、その合成用プログラムデータベース部は、同一の前記受信側移動端末装置に対応する選択可能な複数の表象合成用アプリケーションプログラムを保有する。従って、同一の前記受信側移動端末装置において、受信者の所望に応じた態様での表象合成を行うことができる。また、同一の前記受信側移動端末装置において、例えば、顔の動画像と音声といったような複数の知覚表象を同時に合成して顔の動きと音声とを伴った表象合成コミュニケーションモードでの通信を行うことができる。
(6)受信側移動端末装置で知覚表象を合成し再生する表象合成コミュニケーションモードでの通信が可能な通信システムにおいて、前記受信側移動端末装置からアクセス可能にネットワーク上に設けられ、
前記受信側移動端末装置で送信側移動端末装置から送信されたテキストデータに基づいて少なくとも静止画像、動画像、および、筆跡を含む知覚表象を合成する処理に適用する表象合成用アプリケーションプログラムを選択的に取得するに際しての適切な選択を規定するマッチングデータを保有するマッチングデータベース部と、
前記マッチングデータベース部に保有されたマッチングデータを前記受信側移動端末装置に提供するマッチングデータ供給部と、
を備える
ことを特徴とするマッチングデータベースサーバ。
上記(6)のマッチングデータベースサーバは、前記受信側移動端末装置からアクセス可能に、前記ネットワーク上に設けてある。
このマッチングデータベースサーバは、前記受信側移動端末装置で送信側移動端末装置から送信されたテキストデータに基づいて少なくとも静止画像、動画像、および、筆跡を含む知覚表象を合成する処理に適用する表象合成用アプリケーションプログラムを選択的に取得するに際しての適切な選択を規定するマッチングデータを保有するマッチングデータベース部と、前記マッチングデータベース部に保有されたマッチングデータを前記受信側移動端末装置に提供するマッチングデータ供給部と、を有する。
前記受信側移動端末装置は、ネットワークを介し、マッチングデータベースサーバからそのマッチングデータ供給部を通して上述のマッチングデータを取得できる。受信側移動端末装置では、該マッチングデータに依拠して、当該送信側移動端末装置から送信されたテキストデータに基づいて知覚表象を合成する処理に適用する表象合成用アプリケーションプログラムを適切に選択することができる。
(7)前記マッチングデータベース部は、複数の受信側移動端末装置に各別に対応する複数のマッチングデータを保有することを特徴とする(6)のマッチングデータベースサーバ。
上記(7)のマッチングデータベースサーバは、(6)のマッチングデータベースサーバにおいて特に、そのマッチングデータベース部は、複数の受信側移動端末装置に各別に対応する複数のマッチングデータを保有する。受信側移動端末装置は、自装置に対応するマッチングデータを取得でき、該マッチングデータに依拠して、当該送信側移動端末装置から送信されたテキストデータに基づいて知覚表象を合成する処理に適用する表象合成用アプリケーションプログラムを適切に選択することができる。従って、上述のようなマッチングデータベースサーバを備えた通信システムでは、単一のマッチングデータベースサーバによって、複数の移動端末装置における表象合成コミュニケーションモードでの通信を賄うことができる。
(8)前記静止画像および前記動画像は、前記送信側移動端末装置のユーザの顔を撮影したデータに基づいてその顔を模して再構築された静止画像および動画像、又は前記受信側移動端末装置で選択されたカスタマイズされた静止画像または動画像であることを特徴とする(6)又は(7)に記載のマッチングデータベースサーバ。
受信側移動端末装置で再生される知覚表象の態様を受信者側の要望ないし事情に適合したものにすると共に、テキストデータに基づく知覚表象の合成処理に介在するネットワークサーバの負担が過剰になることを抑止した通信システム、表象合成用アプリケーションプログラムデータベースサーバ、マッチングデータベースサーバ、移動端末装置を具現することができる。
本発明の通信システムの一つの実施の形態を表す概念図である。 図1の通信システムの動作を表すシーケンスチャートである。 図1の通信システムにおいて受信側移動端末装置として用いる移動端末装置の構成例を表す機能ブロック図である。 図3の移動端末装置において稼動する表象合成コミュニケーション用アプリケーションプログラムの構造を表す概念図である。 図1の表象合成用アプリケーションプログラムデータベースサーバにおける表象合成用アプリケーションプログラムの保有形態を例示する概念図である。 図1のマッチングデータベースサーバにおけるマッチングデータの保有形態を例示する概念図である。
以下に図面を参照しつつ本発明の実施の形態につき詳述することにより本発明を明らかにする。
(通信システムの構成例)
図1は、本発明の通信システムの一つの実施の形態を表す概念図である。この通信システム100は、第1の移動端末装置101から送信されたテキストデータに基づいて例えば、送信者の顔の動画像や音声などの知覚表象を第2の移動端末装置102で合成し、再生(表示・発音)する表象合成コミュニケーションモードでの通信が可能に構築されている。
第1および第2の移動端末装置101,102は、ユーザの操作に応じて、一方が送信側移動端末装置として機能し他方が受信側移動端末装置として機能する点ではこの種の通常の移動端末装置と変わりがなく、また、図3を参照して後述するように、双方とも同様の構成を有する。
第1の移動端末装置101と第2の移動端末装置102とは通常の如く呼制御装置110を介してメール等によるテキストデータのコミュニケーションが可能である。
尚、図1では第1の移動端末装置101と呼制御装置110との間の無線区間および有線区間を含む情報の伝送路111を成すインフラストラクチャが介在するが、本発明ではそのインフラストラクチャの具体的態様を問うものではなく、従って、象徴的表記で略記されている。同様に、第2の移動端末装置102と呼制御装置110との間の伝送路112も象徴的表記で略記されている。
一方、第1および第2の移動端末装置101,102からアクセス可能に、ネットワーク上に、表象合成用アプリケーションプログラムデータベースサーバ120およびマッチングデータベースサーバ130が設けられている。
表象合成用アプリケーションプログラムデータベースサーバ120は、合成用プログラムデータベース部121と、合成用プログラムデータ供給部122とを有する。
合成用プログラムデータベース部121は、第1および第2の移動端末装置101,102における知覚表象の合成処理に適用する表象合成用アプリケーションプログラムの候補を複数保有する。
また、合成用プログラムデータ供給部122は、合成用プログラムデータベース部121に保有された複数の表象合成用アプリケーションプログラムのうち受信側移動端末装置(例えば、ある時間区間では第2の移動端末装置102)からの選択に応じたものを受信側移動端末装置(上述の時間区間では第2の移動端末装置102)に供給する。この供給は該当するデータのダウンロードの形で行われる。
一方、マッチングデータベースサーバ130は、マッチングデータベース部131と、マッチングデータ供給部132とを有する。
マッチングデータベース部131は、受信側移動端末装置(上述の時間区間では第2の移動端末装置102)で当該テキストデータに基づいて知覚表象を合成する処理に適用する表象合成用アプリケーションプログラムを選択的に取得するに際しての適切な選択を規定するマッチングデータを保有する。
また、マッチングデータベース部131に保有された上述のマッチングデータを、受信側移動端末装置(上述の時間区間では第2の移動端末装置102)に提供する。
上述のような構成において、表象合成用アプリケーションプログラムデータベースサーバ120の合成用プログラムデータベース部121に保有されている表象合成用アプリケーションプログラムは、受信側移動端末装置(上述の時間区間では第2の移動端末装置102)内で稼動することによって、送信側の移動端末装置(上述の時間区間では第1の移動端末装置101)から供給されたテキストデータに基づいて、音声、静止画像、動画像、および、筆跡のうちの少なくとも一つを含む知覚表象を合成するように機能する。
因みに、音声は、送信側のユーザの声やその声を模した声音のみならず、受信側のユーザが所望に応じて選択するカスタマイズされた音声である。同様に、静止画像や動画像は、送信側のユーザの顔を撮影したデータに基づいてその顔を模して再構築された静止画像や動画像のみならず受信側のユーザが所望に応じて選択するカスタマイズされた静止画像や動画像である。
上述におけるカスタマイズは、表象合成用アプリケーションプログラムがそのカスタマイズに適合するものとして構成され、該構成された表象合成用アプリケーションプログラムが表象合成処理を実行するべく稼動することによって達成される。
尚、これら受信側で再生される知覚表象に関しては、筆跡についても同様である。また、三次元のCG画像(3D−CG)等も上述の知覚表象として適用され得る。更に、これら音声、静止画像、動画像、および、3D−CGのような知覚表象が適宜に組み合わされて再生されるように構成してもよい。
(通信システムの動作)
次に、図面を参照して、図1の通信システムの動作について説明する。
図2は、図1の通信システムの動作を表すシーケンスチャートである。
チャット実行要求(SIP_Invite)が第1の移動端末装置101から発せられると、このSIP_Inviteが呼制御装置110を経て第2の移動端末装置102に送信される(S201;S202)。このSIP_Inviteは、自装置で利用可能なコミュニケーション手段(例えば、ユーザの顔をシンボリックに表す動画像と声音とをそれぞれ合成するアプリケーションソフトウェアを特定する情報)に関する情報を含むような態様を採り得る。
ステップS202のチャット実行要求SIP_Inviteを受けて、第2の移動端末装置102は、SIP_Inviteに対する200OKなるチャット実行受諾応答を、呼制御装置を経て第1の移動端末装置101に返す(S203;S204)。
このチャット実行受諾応答200OKは、相手方が利用可能なコミュニケーション手段(例えば、ユーザの顔をシンボリックに表す動画像と声音とをそれぞれ合成するアプリケーションソフトウェアを特定する情報)のうち自装置側が利用可能なコミュニケーション手段に関する情報を含むような態様を採り得る。
S204でのチャット実行受諾応答200OKを受けた第1の移動端末装置101は、200OKに対するACKを、呼制御装置を経て第2の移動端末装置102に返す(S205;S206)。
S206においてACKが返されることにより3way hand shakeが結ばれ、メディアプレーンが確立する。
次いで、第2の移動端末装置102は、S202で受けたチャット実行要求に基づいて、第1の移動端末装置101が利用可能であり且つ自装置側で所望する形態でのチャットを実現するために、本セッションにおいて適用するアプリケーションソフトウェアを表す情報(例えば、送信元である第1の移動端末装置101のユーザの顔をシンボリックに表す動画像と声音とをそれぞれ合成するアプリケーションソフトウェアを特定する情報)をマッチングデータベースサーバに要求する(S207)。
S207の要求を受けたマッチングデータベースサーバは、この要求に適合するアプリケーションソフトウェアを検索し(S208のマッチング処理)、該当するアプリケーションソフトウェアを表す情報を第2の移動端末装置102に返す(S209)。
但し、既述の例のようにSIP_Inviteが第1の移動端末装置101で利用可能なコミュニケーション手段に関する情報を含む態様を採り、且つ、200OKが第2の移動端末装置102で利用可能なコミュニケーション手段に関する情報を含む態様を採ることによって、本セッションにおいて適用するアプリケーションソフトウェアを特定する情報を交換済である場合には、これらのステップS207〜ステップS209の処理は省略される。
一方、第1の移動端末装置101も、同様に、自装置(第1の移動端末装置101)が利用可能であり且つ第2の移動端末装置102側が所望する形態でのチャットを実現するために、適用するアプリケーションソフトウェアを表す情報(例えば、相手先…第2の移動端末装置102のユーザ…の顔をシンボリックに表す動画像と声音とをそれぞれ合成するアプリケーションソフトウェアを特定する情報)をマッチングデータベースサーバに要求する(S210)。
S210の要求を受けたマッチングデータベースサーバは、この要求に適合するアプリケーションソフトウェアを検索し(S211)、該当するアプリケーションソフトウェアを表す情報を第1の移動端末装置101に返す(S212)。
一方、既に、上述のS209のマッチング応答を受けた第2の移動端末装置102は、マッチング応答で取得した情報に基づいて、この情報によって表されるアプリケーションソフトウェア(例えば、送信元である第1の移動端末装置101のユーザの顔をシンボリックに表す動画像と声音とをそれぞれ合成するアプリケーションソフトウェア)を表象合成用アプリケーションプログラムデータベースサーバ120に要求する(S213)。
S213の要求を受けた表象合成用アプリケーションプログラムデータベースサーバ120は、要求されたアプリケーションソフトウェアを第2の移動端末装置102に供給する(S214)。
また、第1の移動端末装置101も、同様に、S212のマッチング応答を受けると、マッチング応答で取得した情報に基づいて、この情報によって表されるアプリケーションソフトウェア(例えば、相手先…第2の移動端末装置102のユーザ…の顔をシンボリックに表す動画像と声音とをそれぞれ合成するアプリケーションソフトウェア)を表象合成用アプリケーションプログラムデータベースサーバ120に要求する(S215)。
S215の要求を受けた表象合成用アプリケーションプログラムデータベースサーバ120は、要求されたアプリケーションソフトウェアを第1の移動端末装置101に供給する(S216)。
第2の移動端末装置102は、S216までのステップで、文字データに基づいて、送信元である第1の移動端末装置101のユーザの顔をシンボリックに表す動画像と声音とをそれぞれ合成する準備ができ、この準備が整った旨の準備完了応答を第1の移動端末装置101に送る(S217;S218)。
S218の準備完了応答を受けた第1の移動端末装置101は、チャット開始要求を第2の移動端末装置102に送る(S219;S220)。
尚、ステップS201〜ステップS204で第1の移動端末装置101および第2の移動端末装置102間でIPアドレスの交換が行われており、上述の準備が完了した側から相手方にチャット開始要求を送信することができる。
S220でのチャット開始要求を第2の移動端末装置102が受けると、第1の移動端末装置101および第2の移動端末装置102間でのセッションが確立する(S221)。ここに「セッション」とは、アプリケーション上でのセッション認識であり、コアネットワーク(SIPレイヤ)としてのセッションはステップS204までで確立している。
第2の移動端末装置102では、S214までのステップで取得した動画像と声音とを文字データに基づいて合成する表象合成用アプリケーションソフトウェアによって、自装置(第2の移動端末装置102)の表示部に(例えば、第1の移動端末装置101のユーザの顔をシンボリックに表す動画像の)表示を行い、発音部から声音を発生させる(S222)。
S222での表示と声音を視聴した第2の移動端末装置102のユーザの操作による返信が第2の移動端末装置102から第1の移動端末装置101に返される(S223;S224)。
第1の移動端末装置101では、第2の移動端末装置102におけると同様に、S216までのステップで取得した動画像と声音とを文字データに基づいて合成するアプリケーションソフトウェアによって、自機の表示部に(例えば、第2の移動端末装置102のユーザの顔をシンボリックに表す動画像の)表示を行い、発音部から声音を発生させる(S225)。
以上、図2を参照して説明したところから容易に理解されるとおり、受信側移動端末装置として機能する移動端末装置(102、101)は、ネットワークを介し、表象合成用アプリケーションプログラムデータベースサーバ120からその合成用プログラムデータ供給部122を通して表象合成用アプリケーションプログラムを取得できる。この取得はマッチングデータベースサーバ130からのマッチングデータに依拠して行う。
更に、受信側移動端末装置として機能する移動端末装置(102、101)では、該取得マッチングデータに依拠して取得した表象合成用アプリケーションプログラムを自装置で稼動させることによって、送信側移動端末装置として機能する移動端末装置(101、102)から送信されたテキストデータに基づいて知覚表象を合成する。上述の如くして表象合成コミュニケーションモードでの通信が行われる。
従って、表象合成用アプリケーションプログラムデータベースサーバ120やマッチングデータベースサーバ130等のネットワークサーバでは、表象合成コミュニケーションモードでの通信の継続期間に亘って知覚表象の合成処理を持続するといった必要がなく、その負担が過剰になることが抑止される。
また、受信側移動端末装置で再生される知覚表象の態様を、通信の当事者の所望に応じたカスタマイズを施すことによって本人性を模した、或いは受信者側の要望ないし事情に適合したものにすることができる。
(移動端末装置の構成例)
図3は、図1の通信システムにおいて受信側移動端末装置として用いる移動端末装置の構成例を表す機能ブロック図である。
図3の移動端末装置は、既述のように同様の構成を有する第1および第2の移動端末装置101,102を代表的に表し、送信側および受信側の何れの移動端末装置としても適合し、ここでは両者を総じて参照符号310を割り当てている。
この移動端末装置310は、操作部311、送受信部312、メモリ313、画像合成処理部314、画像表示部315、音声合成処理部316、および、音声出力部317を備え、これら各部は制御部318によって統括的に管理されるように構成されている。また、制御部318とその管理対象である各部はバス319によって結ばれている。
操作部311は複数の入力キーを含んで構成され、ユーザによる通信その他の機能を利用するための種々の入力操作を受付ける。
送受信部312は、操作部311および制御部318との協働によって通信の相手方である移動端末装置との信号の授受や、ネットワーク上の種々のサイトへのアクセスおよび当該サイトからのデータのダウンロード等の機能を賄う。この移動端末装置310における、表象合成用アプリケーションプログラムデータベースサーバ120からの表象合成用アプリケーションプログラムの取得も、この送受信部312を通して行われる。同様に、マッチングデータベースサーバ130からのマッチングデータの取得も、この送受信部312を通して行われる。
また、図1の呼制御装置110を介してのテキストデータによるコミュニケーション(所謂携帯メール)も、この送受信部312を通して行われる。
メモリ313は、移動端末装置310がその仕様の通り機能するためのプログラムを保持し、また、所要のワークメモリとしての領域を提供している。
画像合成処理部314は、取得した表象合成用アプリケーションプログラムを稼動させて、テキストデータに基づいて、既述の、静止画像、動画像、および、筆跡のような視覚に訴える知覚表象を形成する。ここで形成された知覚表象は画像表示部315に表示される。
一方、音声合成処理部316は、取得した表象合成用アプリケーションプログラムを稼動させて、テキストデータに基づいて、既述のような顔画像や音声である知覚表象を形成する。ここで形成された知覚表象は音声出力部317から発音される。
以上の構成において、操作部311、送受信部312、および、制御部318によって、表象合成用アプリケーションプログラム取得部321が構成されている。この表象合成用アプリケーションプログラム取得部321が、表象合成用アプリケーションプログラムデータベースサーバ120から自装置における知覚表象の合成に適用する表象合成用アプリケーションプログラムを選択的に取得する。この取得には、操作部311からの操作を受け付ける動作によって受信側のユーザの意思が反映される。
また、画像合成処理部314、音声合成処理部316、および、制御部318によって知覚表象合成部322が構成されている。この知覚表象合成部322が、表象合成用アプリケーションプログラム取得手段312で取得した表象合成用アプリケーションプログラムによって受信したテキストデータに基づいて所定の知覚表象を合成する。
尚、図示の移動端末装置310では、操作部311、送受信部312、および、制御部318の協働によって、マッチングデータベースサーバ130からのマッチングデータの取得も行われる。
図4は、図1、図2、および、図3における移動端末装置(101、102、310)が既述の表象合成コミュニケーションモードでの通信を実行するために機能する表象合成コミュニケーション用アプリケーションプログラム(複数のプログラムの総称)410の内容を表す概念図である。
合成プログラムダウンロードアプリケーション411は、その稼動によって、図3の表象合成用アプリケーションプログラム取得部321が選択された表象合成用アプリケーションプログラムをダウンロードによって取得するべく機能する。
顔画像合成プログラム412は、図3の表象合成用アプリケーションプログラム取得部321によって送信側の移動端末装置のユーザの顔の画像ないし顔を模した画像、或いは、受信側端末装置のユーザの所望する顔画像を、受信されたテキストデータに基づいて合成する。この合成処理は、既述の知覚表象合成部322のうちの該当する機能部がその処理の実行環境である顔画像合成実行環境413となって実行される。
同様に、音声合成プログラム414は、図3の表象合成用アプリケーションプログラム取得部321によって送信側の移動端末装置のユーザの声音ないし声音を模した音声、或いは、受信側端末装置のユーザの所望する音声を、受信されたテキストデータに基づいて合成する。この合成処理は、既述の知覚表象合成部322のうちの該当する機能部がその処理の実行環境である音声合成実行環境415となって実行される。
そして、この表象合成コミュニケーションモードでの通信では、顔画像(その変化)と音声とが双方における相応の同期を維持しつつ、且つ、テキストデータの伝送と適度のタイミング関係を保ちながら、逐次表象合成処理を実行するために、複数合成プログラムマネージメントプログラム414が備えられている。この複数合成プログラムマネージメントプログラム416が既述の制御部318をその実行環境として所定の管理機能を発現し、知覚表象の適切な合成と再生(表示と発音)が統括的に管理される。
(表象合成用アプリケーションプログラムの保有形態)
図5は、図1の表象合成用アプリケーションプログラムデータベースサーバにおける表象合成用アプリケーションプログラムの保有形態を例示する概念図である。
一人のユーザのID毎に、そのユーザが送信元のユーザに対応する知覚表象として用い得る複数の知覚表象を合成するプログラムが保有される。図5の例では、一人のユーザのID0001に対して、ユーザ0001用顔画像合成プログラム、ユーザ0001用音声合成プログラム、および、ユーザ0001用筆跡合成プログラム、等々が保有される。
他のユーザについても同様に、知覚表象を合成するプログラムが保有される。これらは、受信側移動端末装置(従って、そのユーザ)から、表象合成コミュニケーションモードでの通信を行うに際して選択可能である。
従って、表象合成用アプリケーションプログラムデータベースサーバ120は、その合成用プログラムデータベース部121において、同一の受信側移動端末装置(例えば、ユーザ0001のもの)に対応する選択可能な複数の表象合成用アプリケーションプログラムを保有する。このため、同一の受信側移動端末装置において、受信者の所望に応じた態様での表象合成を行うことができる。また、同一の受信側移動端末装置において、例えば、顔の動画像と音声といったような複数の知覚表象を同時に合成して顔の動きと音声とを伴った表象合成コミュニケーションモードでの通信を行うことができる。
(マッチングデータの保有形態)
図6は、図1のマッチングデータベースサーバにおけるマッチングデータの保有形態を例示する概念図である。
マッチングデータベースサーバ130のマッチングデータベース部131には、複数の受信側移動端末装置に各別に対応する複数のマッチングデータが保有される。図6の例では、一人のユーザのID0001に対して、該当するプログラムのリストに顔画像合成プログラムの使用の有無(有)、音声合成プログラムの使用の有無(有)、3D−CG合成プログラムの使用の有無(無)、筆跡合成プログラムの使用の有無(無)…、等々が保持される。
また、更に、ユーザ0001に対する相手方毎に知覚表象の種別に応じた公開可否の条件を既定するデータが保有される。これは、例えば、相手方の電話番号の別に応じて区分されている。受信側のユーザ(受信側移動端末装置)は、上述のようなマッチングデータによって規定される条件に応じて知覚表象合成用のプログラムを選択的に適用する。
視点を転じて見れば、上述のようなマッチングデータベースサーバを備えた通信システムでは、単一のマッチングデータベースサーバによって、複数の移動端末装置における表象合成コミュニケーションモードでの通信を賄うことができる。
送信側移動端末装置から送信されたテキストデータに基づいて受信側移動端末装置で知覚表象を合成し再生する表象合成コミュニケーションモードでの通信が可能な通信システムの構築に利用することができる。
100………………通信システム
101………………第1の移動端末装置
102………………第2の移動端末装置
110………………呼制御装置
111………………伝送路
112………………伝送路
120………………表象合成用アプリケーションプログラムデータベースサーバ
121………………合成用プログラムデータベース部
122………………合成用プログラムデータ供給部
130………………マッチングデータベースサーバ
131………………マッチングデータベース部
132………………マッチングデータ供給部
310………………移動端末装置
311………………操作部
312………………送受信部
313………………メモリ
314………………画像合成処理部
315………………画像表示部
316………………音声合成処理部
317………………音声出力部
318………………制御部
319………………バス
321………………表象合成用アプリケーションプログラム取得部
322………………知覚表象合成部
410………………表象合成コミュニケーション用アプリケーションプログラム
411………………合成プログラムダウンロードアプリケーション
412………………顔画像合成プログラム
413………………顔画像合成実行環境
414………………音声合成プログラム
415………………音声合成実行環境
416………………複数合成プログラムマネージメントプログラム

Claims (8)

  1. 信側移動端末装置における知覚表象の合成処理に適用する表象合成用アプリケーションプログラムの候補を複数保有する合成用プログラムデータベース部と、前記合成用プログラムデータベース部に保有された複数の表象合成用アプリケーションプログラムのうち前記受信側移動端末装置からの選択に応じたものを前記受信側移動端末装置に供給する合成用プログラムデータ供給部と、を有し、送信側移動端末装置から送信されたテキストデータに基づいて、少なくとも静止画像、動画像、および、筆跡のうちの一つを含む知覚表象を合成する表象合成用アプリケーションプログラムデータベースサーバと、
    前記受信側移動端末装置で当該テキストデータに基づいて知覚表象を合成する処理に適用する表象合成用アプリケーションプログラムを選択的に取得するに際しての適切な選択を規定するマッチングデータを保有するマッチングデータベース部と、前記マッチングデータベース部に保有されたマッチングデータを前記受信側移動端末装置に提供するマッチングデータ供給部と、を有するマッチングデータベースサーバと、を備え、
    前記表象合成用アプリケーションプログラムデータベースサーバと前記マッチングデータベースサーバとを、前記受信側移動端末装置からアクセス可能に、ネットワーク上に設けて、前記受信側移動端末装置で前記知覚表象を合成し再生する表象合成コミュニケーションモードでの通信を行うことを特徴とする通信システム。
  2. 前記静止画像および前記動画像は、前記送信側移動端末装置のユーザの顔を撮影したデータに基づいてその顔を模して再構築された静止画像および動画像、又は前記受信側移動端末装置で選択されたカスタマイズされた静止画像または動画像であることを特徴とする請求項1に記載の通信システム。
  3. 前記知覚現象として、音声をさらに含み、
    前記音声は、前記送信側移動端末装置のユーザの声若しくは前記ユーザの声を模した声音、又は前記受信側移動端末装置で選択されたカスタマイズされた音声であることを特徴とする請求項1又は請求項2に記載の通信システム。
  4. 前記通信が、前記送信側移動端末装置及び前記受信側移動端末装置間のチャットであることを特徴とする請求項1から請求項3のいずれか1項に記載の通信システム。
  5. 前記表象合成用アプリケーションプログラムデータベースサーバの前記合成用プログラムデータベース部は、同一の前記受信側移動端末装置に対応する選択可能な複数の表象合成用アプリケーションプログラムを保有することを特徴とする請求項1から請求項4のいずれか1項に記載の通信システム
  6. 信側移動端末装置で知覚表象を合成し再生する表象合成コミュニケーションモードでの通信が可能な通信システムにおいて、前記受信側移動端末装置からアクセス可能にネットワーク上に設けられ、
    前記受信側移動端末装置で送信側移動端末装置から送信されたテキストデータに基づいて少なくとも静止画像、動画像、および、筆跡を含む知覚表象を合成する処理に適用する表象合成用アプリケーションプログラムを選択的に取得するに際しての適切な選択を規定するマッチングデータを保有するマッチングデータベース部と、
    前記マッチングデータベース部に保有されたマッチングデータを前記受信側移動端末装置に提供するマッチングデータ供給部と、
    を備える
    ことを特徴とするマッチングデータベースサーバ。
  7. 前記マッチングデータベース部は、複数の受信側移動端末装置に各別に対応する複数のマッチングデータを保有することを特徴とする請求項6に記載のマッチングデータベースサーバ。
  8. 前記静止画像および前記動画像は、前記送信側移動端末装置のユーザの顔を撮影したデータに基づいてその顔を模して再構築された静止画像および動画像、又は前記受信側移動端末装置で選択されたカスタマイズされた静止画像または動画像であることを特徴とする請求項6又は請求項7に記載のマッチングデータベースサーバ。
JP2009158006A 2009-07-02 2009-07-02 通信システム、マッチングデータベースサーバ Expired - Fee Related JP5291554B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009158006A JP5291554B2 (ja) 2009-07-02 2009-07-02 通信システム、マッチングデータベースサーバ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009158006A JP5291554B2 (ja) 2009-07-02 2009-07-02 通信システム、マッチングデータベースサーバ

Publications (2)

Publication Number Publication Date
JP2011013970A JP2011013970A (ja) 2011-01-20
JP5291554B2 true JP5291554B2 (ja) 2013-09-18

Family

ID=43592777

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009158006A Expired - Fee Related JP5291554B2 (ja) 2009-07-02 2009-07-02 通信システム、マッチングデータベースサーバ

Country Status (1)

Country Link
JP (1) JP5291554B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004077738A (ja) * 2002-08-16 2004-03-11 Oki Electric Ind Co Ltd コンテンツ音声化提供システム
JP2005070105A (ja) * 2003-08-25 2005-03-17 Canon Inc ネットワークシステム、音声合成処理管理装置、音声合成処理装置、方法、及びコンピュータ読み取り可能な記憶媒体
JP2005345751A (ja) * 2004-06-03 2005-12-15 Hitachi Ltd Web情報アクセス方法、その実施装置、及びプログラム
JP2006074219A (ja) * 2004-08-31 2006-03-16 Nec Corp 携帯端末装置および文章読み上げシステム

Also Published As

Publication number Publication date
JP2011013970A (ja) 2011-01-20

Similar Documents

Publication Publication Date Title
US11722602B2 (en) System and method for processing media requests during telephony sessions
CN101557440B (zh) 情绪识别消息系统、其移动通信终端和消息存储服务器
FI115868B (fi) Puhesynteesi
US20090198497A1 (en) Method and apparatus for speech synthesis of text message
CN101202568B (zh) 支持联合播放的终端及方法
CN1286304C (zh) 一种实现即时通信系统客户间情景聊天的方法
WO2010037064A1 (en) System and method for processing media requests during a telephony sessions
TW200302667A (en) Communication device
KR102639526B1 (ko) 발화 영상 제공 방법
CN110012059B (zh) 电子红包实现方法以及装置
CN105282621A (zh) 一种语音消息可视化服务的实现方法及装置
KR20120088493A (ko) 개인 휴대 단말에서의 음성 인식을 이용한 멀티미디어 콘텐츠 합성 영상 채팅 서비스 제공 방법 및 시스템
JP5291554B2 (ja) 通信システム、マッチングデータベースサーバ
KR101027406B1 (ko) 감정 인식 메시지 시스템과, 이 시스템의 모바일 통신 단말및 메시지 기억 서버
JP4590835B2 (ja) 情報処理装置および情報処理方法、情報処理システム、記憶媒体、並びに、プログラム
JP2005062420A (ja) コンテンツ生成システム、コンテンツ生成方法およびコンテンツ生成プログラム
KR20080026792A (ko) 인스턴트 메시징 서비스를 위한 시스템 및 그 방법
JP2007251581A (ja) 音声送信端末および音声再生端末
KR102546532B1 (ko) 발화 영상 제공 방법 및 이를 수행하기 위한 컴퓨팅 장치
KR101595856B1 (ko) 3d 캐릭터 기반 음성 sns 시스템 및 방법
US20240046540A1 (en) Speech image providing method and computing device for performing the same
JP2006324940A (ja) 自動アニメーション付き留守番電話機能を備えた画像表示機能付き通信装置および自動アニメーション付き留守番電話機能を用いた通信方法
KR100725122B1 (ko) 소봇을 이용한 메신저 서비스 제공 시스템 및 방법
JP2018037724A (ja) 通信装置、通信方法および通信プログラム
JP2006092052A (ja) メール配信システム、メールサーバ及びそれらに用いるメール送受信方法並びにそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120227

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130131

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130306

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130312

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130607

R150 Certificate of patent or registration of utility model

Ref document number: 5291554

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees