JP2005328394A - Ipテレビ電話サービスシステム - Google Patents

Ipテレビ電話サービスシステム Download PDF

Info

Publication number
JP2005328394A
JP2005328394A JP2004145529A JP2004145529A JP2005328394A JP 2005328394 A JP2005328394 A JP 2005328394A JP 2004145529 A JP2004145529 A JP 2004145529A JP 2004145529 A JP2004145529 A JP 2004145529A JP 2005328394 A JP2005328394 A JP 2005328394A
Authority
JP
Japan
Prior art keywords
videophone
video
distribution
media
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004145529A
Other languages
English (en)
Inventor
Arnold Siboro
アーノルド シボロ
Koretake Hayashi
維毅 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2004145529A priority Critical patent/JP2005328394A/ja
Priority to PCT/JP2005/008500 priority patent/WO2005112453A1/ja
Publication of JP2005328394A publication Critical patent/JP2005328394A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/16Analogue secrecy systems; Analogue subscription systems
    • H04N7/173Analogue secrecy systems; Analogue subscription systems with two-way working, e.g. subscriber sending a programme selection signal
    • H04N7/17309Transmission or handling of upstream communications
    • H04N7/17336Handling of requests in head-ends
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47202End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/64Addressing
    • H04N21/6408Unicasting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/643Communication protocols
    • H04N21/64322IP
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6581Reference data, e.g. a movie identifier for ordering a movie or a product identifier in a home shopping application
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8146Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics
    • H04N21/8153Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics comprising still images, e.g. texture, background image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/148Interfacing a video terminal to a particular transmission medium, e.g. ISDN

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Graphics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】従来電話が提供できなかった非実時間映像による双方向サービスを実現できるIPテレビ電話サービスシステムを提供する。
【解決手段】IPテレビ電話サービスが提供されているIPネットワーク10に接続されている配信サーバ50に、予め設定された配信手順に従い、IPテレビ電話サービス利用者の応答により配信する動画クリップ、静止画、文字、音声などの様々なメディア及びその配信方法を決定し、これらのメディアをストリーミング映像としてIPテレビ電話に配信する手段を持たせる。これにより、IPテレビ電話のユーザは、従来の電話操作及び電話通話のみで、様々な情報を対話的かつ視聴覚的に取得することができる。
【選択図】 図1

Description

本発明は、IPネットワークを使用して非実時間映像による双方向サービスを実現するIPテレビ電話サービスシステムに関する。
IP(Internet Protocol)電話技術は、近年の常時接続ブロードバンドの普及に伴い実用的になってきている。しかし、現在のIP電話サービスは、常時接続広帯域IPネットワークという新しいインフラを利用するだけで、二人あるいはそれ以上の人数の音声通話といった従来電話が提供してきたサービスからほとんど発展していない。
以下に、従来のIP電話に関する技術について、図3および図4を参照しながら説明する。
A.IP電話技術
IP電話サービスが利用する主なIP電話技術として、ISO(International Standard Organization)の規格であるH.323(インターネットやLANなどのように、通信の伝送品質が保証されていないネットワークにおいて使用される、マルチメディア圧縮、多重、分離、端末制御方式についてのITU−T勧告(標準))に基づいたIP電話技術と、IETF(Internet Engineering Task Force)の規格であるSIP(Session Initiation Protocol)に基づいたIP電話技術がある。
B.従来電話の各種のサービスを実現するIP電話技術
1.1対1の音声通話
IPネットワークで接続されている2箇所のIP電話機あるいはIP電話ソフトウェアの間で、実時間通話が可能になる。
2.n対nの音声通信(電話会議)
MCU(Multipoint Control Unit)を用いると、図3(b)に示すように、2ヶ所以上のIP電話機あるいはIP電話ソフトウェアの間に同時実時間通話を実現し、IP電話を用いたいわゆる多拠点電話会議が可能になる。
3.テレビ電話技術
これらの音声通話技術に加え、通話する相手の動画を実時間的に見ることができるIPテレビ電話やIPテレビ会議を可能にする従来技術としては、メッセージング技術がある。これは、通話相手が電話に出られないときや留守にしているときに伝言を受付けて、あとから通話相手が再生できるようにする技術である。このようなテレビ電話装置としては、1対1の通信については特許文献1に、n対nの通信については特許文献2に、それぞれ開示されたものがある。
さらに、これらの従来技術の発展として、電話やIP電話、FAX、電子メールなど様々な経路で送受信されるメッセージを統合し、一元的に管理を行なうためのユニファイドメッセージング技術がある。
上記に示したテレビ電話本発明の関連する従来技術のシステム構成図を図3(a)および(b)に、従来技術のブロック図を図4にまとめて示す。
図3(a)において、IPネットワーク10には、1対1にIPテレビ電話1,2が接続され、後述のゲートキーパ20により制御されて相互に通信を行う。図3(b)においては、IPネットワーク10には、複数のIPテレビ電話1〜nが接続され、ゲートキーパ20および多地点接続装置(MCU)30により複数のIPテレビ電話1〜n間で通信可能であり、テレビ会議が行える。
図4に示すように、IPテレビ電話1(2,・・・,n)は、CCDカメラなどの撮像手段からの映像信号を入力する映像入力手段11と、映像信号を符号化するエンコード手段12と、音声データと共に映像信号をIPネットワーク10に転送する転送手段13と、受信した映像信号を復号化するデコード手段15と、映像信号を液晶ディスプレイ等に出力する映像出力手段16とを有している。なお、音声信号を取り扱う手段については、省略している。
C.ゲートキーパ
ゲートキーパ技術は、H.323端末などに対して、アドレス変換およびLANへのアクセス制御を提供する技術である。図4に示すゲートキーパ20は、マルチメディアネットワークにあるデバイスのレジストリを管理する。これらのデバイスは起動時にゲートキーパに登録され、コールのアドミッション(受け付け)をゲートキーパに要求する。
ゲートキーパ20には、以下の4つの必須機能がある。
1.アドレス変換手段21
H.323IDとE.164号(標準の電話番号)をエンドポイントのIPアドレスに変換する。
2.受付制御手段22
アドミッション制御−H.323ネットワークへのエンドポイントのアドミッションを制御する。この機能を実現するために、ゲートキーパは次のものを使用する。
(1)H.225RAS(Registration, Admission, and Status)メッセージ
(2)Admission Request(ARQ,アドミッション要求)
(3)Admission Confirm(ACF、アドミッション確認)
(4)Admission Reject(ARJ、アドミッション拒否)
3.帯域制御手段23
エンドポイントの帯域幅要求を管理する。この機能を実現するために、ゲートキーパは次のH.225RASメッセージを使用する:
(1)Bandwidth Request(BRQ、帯域幅要求)
(2)Bandwidth Confirm(BCF、帯域幅確認)
(3)Bandwidth Reject(BRJ、帯域幅拒否)
4.ゾーン制御手段24
ゲートウェイによって、ゾーン内に存在する登録済みのエンドポイントすべてのゾーン管理が行われる。たとえば、エンドポイントの登録プロセスが制御される。
また、以下の4つのオプション機能がある。
(1)呼認証手段25
このオプションを使用すると、特定の端末またはゲートウェイへのアクセスの制限及び、ToD(Time−of−Day)ポリシーアクセス制限を実装することが可能である。
(2)呼管理手段26
このオプションを使用すると、ゲートウェイによってアクティブコールの情報が保持され、ビジー状態のエンドポイントを示す場合や、コールをリダイレクトしたりする際にこの情報が使用される。
(3)帯域管理手段27
このオプションを使用すると、必要な帯域幅が使用できないときにゲートウェイでアドミッションを拒否できる。
(4)呼制御シグナリング手段28
このオプションを使用すると、GKRCS(Gatekeeper-Routed Call Signaling)モデルを使用して、ゲートウェイがH.323エンドポイント間のコールシグナリングメッセージをルーティングできる。
もう1つの方法として、エンドポイント同士が互いに直接H.225コールシグナリングメッセージを送信することもできる。
D.多地点接続装置(MCU)
多地点接続装置30は、IPテレビ電話1〜nと接続するために、IPテレビ電話1〜nのような手段(転送手段31,エンコード手段32,デコード手段33,IP電話コマンド手段34)を備えると共に、電話会議を行うために必要な多地点制御手段35と、多地点処理手段36も備えている。多地点制御手段35は、電話会議に参加する各IPテレビ電話と交渉(handshake)し共通機能を決定し、マルチキャストのような会議リソースを制御する。多地点処理手段36は電話会議に参加する各IPテレビ電話からの実際のオーディオやビデオのデータを受けて多重化などを行う。
E.マルチメディアコンテンツ
各種メディアを組み合わせから構成された映像の記述言語に関する従来技術としてSMILやXTLという従来技術がある。また、映像の記述と各種メディアそのものが一体となるMPEGという従来技術がある。これらについて以下に述べる。
1.SMIL(Synchronized Multimedia Integration Language)
SMIL(マルチメディアファイルを統合的に扱う言語)は動画、静止画、音声、音楽、文字など様々な形式のデータの再生を制御して同期させる言語であり、XMLで記述されている。1998年4月にW3C標準として勧告された。どの位置に、どのタイミングで、どのくらいの時間表示するのか、といったことが制御できる。これを実装した製品としてはRealNetworks社のRealSystem G2がある。
2.XTL
XTLは、Microsoft(商標)、DirectShow(商標)、Editing Services(DES)を用いたランタイム記述言語であり、SMILと同様でXMLで記述されている。DESはアプリケーションプログラミングインターフェース(API)である、DirectShowのコア技術を用いて各種のメディア形式をノンリニアのビデオ編集及び再生を可能にする。したがって、基本的にSMILと似ているといえる。
3.MPEG4
MPEG4とは、オーディオとビデオだけでなく、3Dオブジェクト、スプライト、テキストなどのメディアを扱えるマルチメディア標準規格である。MPEG4には、オーディオ・ビデオ以外に3Dオブジェクトやアニメーションオブジェクトが含まれている。これによりMPEG4の各シーンが構成される。
MPEGのシーンを記述するにはXMT(Extensible MPEG-4 Textual format)というフレームワークが用いられる。XMTはすでに標準化されているコンテンツ記述言語であるSMILをベースにしている。
特開2002−140162号公報 特開2004−48551号公報
Infonetics Researchは、世界のIP電話機器市場は2003年の最後3ヵ月で31%増えたと報告し、また2007年に3倍になると予測している。一方、国内市場として、矢野経済研究所「IP電話市場に関する調査結果」(2003年6月)によると、IP電話関連機器の市場規模は2002年末に388億円、2007年末には最大で1,280億円になる見込みである。
上記の市場方向および予測は今後のIP電話市場の明るい見通しに見えるが、同研究所によれば、IP電話市場の問題点としては、関連機器が従来のレガシシステムの単なる置き換えビジネスになっており、各種アプリケーションとの連動や、通信システムを含めたインテグレートなど総合提案をしなければ、価格競争に陥る。また、ISPとして当然求められるサービスとなったが、アクセスチャージの上昇や設備投資のわりに利益の上がらないサービスであると同レポートにまとめられている。
まさに今は上記のような状況になっている。ユーザから見ても、ほとんどの場合、唯一のIP電話利用動機はその格安さである。そうなっている大きな要因はIP電話が提供しているサービスは、従来電話が提供しているものからほとんど発展していないからである。音声通話、テレビ電話通話、音声伝言といった現在のIP電話が提供するサービスは少なくとも10年前からあって、1973年にIPネットワーク(インターネット)が開発される前からあったものも少なくない。結局、IP電話の新しい部分は常時接続広帯域IPネットワークというインフラのみであるのが、ユーザが感じるこの新しいインフラの効果は安価な通話料金のみである。そのためユーザにとってIP電話を導入するメリットはこの安価な料金以外はほとんどない。
産業界にとって、こういう状況は価格競争を意味しており、その結果、大手企業しかこのIP電話事業を提供し続けることができない。IP電話サービスはまさに利益の上がらないサービスとなっており、資金力の豊富な大手企業にとっては他の利益の上がるサービスのための集客手段として用いられている。
この悪状況から抜け出すにはまったく新しいサービスを生み出す必要がある。産業界のニーズは、利益のあがるビジネスにするために、今までになかったまったく新しいIP電話サービスを作り出し展開していくことである。これによりユーザは価格以外にIP電話導入動機を見つけることができ、日本経済にも健全なビジネスモデルが誕生し生活の様々部分にIP電話が浸透していくことが可能にする。
e−Japan計画というIT政策を掲げられてからIT産業界に大きな変化が生じ、ブロードバンド(高速大容量)の普及がものすごいスピードで進んできた。政府は資金と努力をかけ、産業界も競争しe−Japan計画が掲げられた2000年に考えられない導入しやすさ及び価格で、今ADSLなどのブロードバンドを広く普及させた。最新の総務省の報告によると、2004年1月のADSLの累積サービス提供数は10,612,671になっており、1年前の1.7倍にも増加した。総務省がまとめた電気通信モニター調査によると、ADSLを使ってインターネットに接続する利用者が2003年9月に全体の41.7%に達し、固定電話回線を使って利用ごとに接続する「ダイヤルアップ」の35.0%を上回った。光ファイバーによる接続も4.0%を占め、高速ネット接続の普及が裏付けられた。
しかし年齢別に見ると、60歳以上の利用者の48.8%が「ダイヤルアップ」での利用となっている。地域別では、九州の利用者の50.7%が「ダイヤルアップ」であった。地域や年齢層によっては、ブロードバンドを活用した動画像サービスなどを利用できる環境になっていない利用者が多い。インターネットは普及しているが、若者や都市部との情報格差は依然として残っている。ブロードバンド普及の恩恵を受けているのは、ほとんどコンピュータを自由自在に扱える人だけなのが実情である。
ブロードバンドのさらなる普及にはキラーコンテンツが必要であるといわれてきているが、以上の状況があり、キラーコンテンツを運ぶキラーアプリケーションが必要不可欠であると考えている。そのキラーアプリケーションとは、誰にでも日常的なもののように扱えるものでなければならない。このようなアプリケーションを研究開発するのはこれからの産業界の役割であり、成長をもたらす鍵となる。
従来のIP電話技術では、IP電話技術は従来電話の実時間通信に着目し、非実時間対話型サービスをサポートする技術が大変不十分なため、IPネットワークをほとんど単なる従来電話網(PSTN)の代わりとして用いるのみである。したがって、従来電話で提供してきたサービス(音声やテレビの1対1通話または会議通話のサービス、伝言のサービスなど)しか提供できない。
また、従来マルチメディアコンテンツ技術はクライアント側の複雑な処理のため、マルチメディアコンテンツ技術を用いたサービスは高度なクライアントを必要としており、また利用者に、ある程度高度な知識を必要としているという課題がある。このことにより、従来マルチメディアコンテンツ技術は幅広い視聴者にコンテンツを提供することができない。
本発明は、今までの累積技術をベースにし、従来電話が提供できなかった非実時間映像による双方向サービスを実現できるIPテレビ電話サービスシステムを提供することを目的とする。
前記課題を解決するための本発明の第1の構成は、IPテレビ電話サービスが提供されているIPネットワークに接続されている配信サーバは、予め設定された配信手順に従い、IPテレビ電話サービス利用者の応答により配信する動画クリップ、静止画、文字、音声などの様々なメディア及びその配信方法を決定し、これらのメディアをストリーミング映像としてIPテレビ電話に配信する手段を備えていることを特徴とする。
この第1の構成により、IPテレビ電話のユーザは、従来の電話操作及び電話通話で、様々な情報を対話的かつ視聴覚的に取得することができる。
本発明の第2の構成は、前記配信サーバは、記録されているメディアのみ、または記録されているメディアと生中継のメディアとの組み合わせを配信する手段を備えていることを特徴とする。
この第2の構成により、必要に応じて、記録されているメディアのみならず、生中継のメディアとの組み合わせを配信することができる。
本発明の第3の構成は、前記配信手順は、前記様々なメディアの配信時刻、配信時間、IPテレビ電話画面上の位置、表示方法という振る舞いを記述したものであることを特徴とする。
この第3の構成により、どのタイミングでどれくらいの時間、あるメディアを配信するか、また、次の手順で、IPテレビ電話画面上のどの位置に、どのような表示の仕方でメディアを表示するかを規定することができる。
この場合、配信手順は、ユーザのどのような応答に対しても、その応答を受けた時刻をもとに、様々なメディアの振る舞いを決定するように記述することもできる。
本発明の第4の構成は、前記配信サーバは、IPテレビ電話サービス利用者のIPテレビ電話番号や言語設定などの利用者環境に合わせて、前記配信手順に従い、配信する映像の選択及び配信方法を調整する手段を備えていることを特徴とする。
この第4の構成により、IPテレビ電話サービス利用者が使用する言語に対応した言語での表示を選択し、また、初心者か慣れている人か等により配信方法を調整することができる。
本発明はまた、次の構成を採ることができる。
(1)第1の構成において、多量のアクセスに備えるために複数の配信サーバを備える場合、IPテレビ電話端末は配信サーバに接続してくるとき、過負荷にならないように自動的に接続を受付ける配信サーバを決める。
(2)第1〜第3の構成において、ユーザはIPテレビ電話端末から普通に話したりすることで、配信サーバがそのユーザのオーディオ及びビデオを受信し、自動的に配信手順の記述(配信手順書またはシナリオともいう)及びそれぞれのメディアを作成する。
本発明の第5の構成は、前記配信サーバは、IPテレビ電話サービス利用者の指示に従いシナリオを自動的に作成し、そしてIPテレビ電話サービス利用者から音声やビデオを受信し、それぞれのメディアを自動的に作成する手段を備えていることを特徴とする。
この第5の構成により、IPテレビ電話サービス利用者の指示に従い、受信した音声やビデオを用いてシナリオ及び各種メディアを自動的に作成することができる。
本発明の第6の構成は、IPテレビ電話サービスを利用するためのIPテレビ電話端末と、そのIPテレビ電話端末に映像を配信する配信サーバと、配信される動画クリップ、静止画、文字、音声等の各種メディア及びそのキャッシュを格納するファイルサーバと、IPテレビ電話番号解決や帯域管理を行うゲートキーパとで構成されるIPネットワークにおいて、前記配信サーバは、前記IPネットワーク上にデータを転送する転送手段と、IPテレビ電話端末のデータとして符号化されたデータをオーディオデータやビデオデータなどに復号するデコード手段と、オーディオデータやビデオデータなどをIPテレビ電話端末のデータとして符号化するエンコード手段と、IPテレビ電話端末とのやり取りを行うために必要なコマンドを出すIP電話コマンド手段と、前記ファイルサーバに保管されている各種メディアを入出力する媒体アクセス手段とを有するものである。
この第6の構成により、IPテレビ電話のユーザは、従来の電話操作及び電話通話で、様々な情報を対話的かつ視聴覚的に取得することができる。
本発明の第7の構成は、前記ファイルサーバは、シナリオを保持するシナリオデータベースを備え、前記配信サーバは、さらに、前記シナリオを処理し予め設定された配信手順に従って実施するシナリオ処理手段を有し、前記配信手順は、前記様々なメディアの配信時刻、配信時間、IPテレビ電話画面上の位置、表示方法という振る舞いを記述したものである。
この第7の構成においては、IP電話サービス利用者のIP電話番号や言語設定などの利用者環境に合わせて、前記配信手順に従い配信する映像の選択及び配信方法を調整することができる。
本発明は、さらに、以下の構成とすることができる。
(1)第6の構成において、配信サーバに複数のIP電話の映像を一つの映像にする多地点制御手段、多地点処理手段を設けることにより、ファイルサーバに記録されているメディアのみまたは記録されているメディアと生中継のメディアとの組み合わせ配信をすることができる。
(2)第7の構成において、ファイルサーバは、シナリオを保持するシナリオデータベースを備え、配信サーバはさらに、記憶装置に保管されている各種メディアから構成される映像を記憶装置に保管し、必要になったら読み出すコンテンツキャッシュ手段を備え、また配信手順として様々なメディアの配信時刻、配信時間、IPテレビ電話画面上の位置、表示方法という振る舞いを記述することにより、どのタイミングでどれくらいの時間、あるメディアを配信するか、また、次の手順で、IPテレビ電話画面上のどの位置に、どのような表示の仕方でメディアを表示するかを規定することができる。また、配信手順は、ユーザのどのような応答に対しても、その応答を受けた時刻をもとに、様々なメディアの振る舞いを決定するように記述することもできる。
(3)第6の構成に加え、ファイルサーバは、シナリオを保持するシナリオデータベースと、動画クリップ、静止画、文字、音声などの様々なメディアを保持するメディアデータベースと、記憶装置に保管されている各種メディアから配信サーバの処理によりできた映像を保持するキャッシュデータベースとを備え、配信サーバは、ユーザ応答処理手段と、シナリオを処理しそのとおりに実施するシナリオ処理手段を有し、配信手順として、ユーザのどのような応答に対しても、その応答を受けた時刻をもとに前記様々なメディアの振る舞いを決定することにより、ユーザにとって、あたかも実時間的に対話しているようなサービスを提供することができる。
(4)第7の構成に加え、ゲートキーパは、アドレス変換手段と、サーバ負荷管理手段とを有し、配信サーバは、配信サーバのCPUやメモリの使用状況を時々刻々監視するサーバ負荷監視手段を有することで、多量のアクセスに備えるために複数の配信サーバからなるサービスにおいて、IPテレビ電話が配信サーバに接続してくるとき、過負荷にならないように自動的に接続を受付ける配信サーバを決めることができる。
本発明によれば、IPテレビ電話サービスが提供されているIPネットワークに接続されている配信サーバは、予め設定された配信手順に従い、IPテレビ電話サービス利用者の応答により配信する動画クリップ、静止画、文字、音声などの様々なメディア及びその配信方法を決定し、これらのメディアをストリーミング映像としてIPテレビ電話に配信する手段を備えているので、IPテレビ電話利用者は従来の電話通話及び電話操作で視聴覚的に豊富な情報コンテンツとやり取りすることができる。
また、非実時間通信に適しているIPテレビ電話技術を確立することにより、今までなかった通話外サービスを可能することで、通話のサービスに限られてしまうという課題を解決できる。
以下、本発明の実施の形態を、図1に示すシステム構成図および図2に示すブロック図を用いて説明する。
本発明の実施の形態は、IPテレビ電話サービスを利用するためのIPテレビ電話1〜nと、そのIPテレビ電話端末に映像を配信する配信サーバ50と、配信される動画クリップ、静止画、文字、音声といった各種メディア及びそのキャッシュを格納するファイルサーバ60と、IPテレビ電話番号解決や帯域管理を行うゲートキーパ20とで構成されるIPネットワーク10からなる。
IPテレビ電話1〜nは、CCDカメラなどの撮像手段からの映像信号を入力する映像入力手段11と、映像信号を符号化するエンコード手段12と、音声データと共に映像信号をIPネットワーク10に転送する転送手段13と、IP電話コマンド手段14と、受信した映像信号を復号化するデコード手段15と、映像信号を液晶ディスプレイ等に出力する映像出力手段16とを有している。
配信サーバ50は、IPネットワーク上にデータを転送する転送手段51と、IPテレビ電話1〜nのデータとして符号化されたデータをオーディオデータやビデオデータなどに復号するデコード手段52と、オーディオデータやビデオデータなどをIPテレビ電話のデータとして符号化するエンコード手段53と、IPテレビ電話ボタン操作やユーザの音声などを受信しシナリオの通りに処理するユーザ応答処理手段54と、IPテレビ電話とのやり取りを行うために必要なコマンドを出すIP電話コマンド手段55と、電話会議に参加する各IPテレビ電話と交渉(handshake)し共通機能を決定し、マルチキャストのような会議リソースを制御する多地点処理手段56と、電話会議に参加する各IPテレビ電話からの実際のオーディオやビデオのデータを受けて多重化などを行う多地点制御手段57と、シナリオを処理しそのとおりに実施するシナリオ処理手段58と、ファイルサーバ60の各データベースに保管されている各種メディアを入出力する媒体アクセス手段59と、ファイルサーバ60に保管されている各種メディアから構成される映像をデータベースに保管し、必要になったら読み出すコンテンツキャッシュ手段71と、配信サーバ50のCPUやメモリの使用状況を時々刻々監視するサーバ負荷監視手段72と、媒体アクセス手段59で出力された各種メディアをIPネットワーク10に転送する際のコマンドを生成するHTTP/FTPコマンド手段73と、接続してくるIPテレビ電話のユーザを認証するユーザ認証手段74と、この配信サーバ50に接続しているIPテレビ電話を別の配信サーバに転送させるアクセス転送手段75とを有する。
ファイルサーバ60は、シナリオを保持するシナリオDB(データベース)61と、動画クリップ、静止画、文字、音声などの様々なメディアを保持するメディアDB62と、記憶装置に保管されている各種メディアから配信サーバの処理によりできた映像を保持するキャッシュDB63とを備えている。
ゲートキーパ20は、IPアドレスと電話番号の間に変換を行うアドレス変換手段21と、接続してくるIPテレビ電話の接続を受付ける受付制御手段22と、IPテレビ電話の帯域幅要求を管理する帯域制御手段23と、IPテレビ電話がゲートキーパに接続するための処理を行うゾーン制御手段24と、アクセスの制限やポリシーアクセス制限するために認証を行う呼認証手段25と、IPテレビ電話の接続状況を管理する呼管理手段26と、要求される帯域が確保できないときのアドミッション拒否を行う帯域管理手段27と、接続してくるIPテレビ電話との接続を確立ためのシグナリングを制御する呼制御シグナリング手段28と、各配信サーバの負荷状況の情報を管理するサーバ負荷管理手段81と、各配信サーバのCPU使用率やメモリ使用率を保持する負荷状況DB82と、各配信サーバの負荷状況を時々刻々監視するネットワーク負荷監視手段83とを有する。
以下、本発明の実施例について説明する。
本発明の実施例1は、IPテレビ電話サービスに関するものであり、図2を参照して説明する。
本実施例では、IPテレビ電話サービスを利用するためのIPテレビ電話1〜nと、そのIPテレビ電話1〜nに映像を配信する配信サーバ50と、配信される動画クリップ、静止画、文字、音声等の各種メディア及びそのキャッシュを格納するファイルサーバ60と、IPテレビ電話番号解決や帯域管理を行うゲートキーパ20とで構成されるIPネットワーク10において、配信サーバ50は、IPネットワーク10上にデータを転送する転送手段51と、IPテレビ電話1〜nのデータとして符号化されたデータをオーディオデータやビデオデータなどに復号するデコード手段52と、オーディオデータやビデオデータなどをIPテレビ電話1〜nのデータとして符号化するエンコード手段53と、IPテレビ電話1〜nとのやり取りを行うために必要なコマンドを出すIP電話コマンド手段55と、ファイルサーバ60に保管されている各種メディアを入出力する媒体アクセス手段59とを有する。
転送手段51は、TCP(Transmission Control Protocol)およびUDP(User Datagram Protocol)といったプロトコルを用いて、IPネットワーク10上にデータを転送する。転送手段51に渡されるデータはRTP(Real-time Transport Protocol)やHTTP(Hyper Text Transfer Protocol)技術を用いて渡されることができる。
IP電話コマンド手段55は、H.323やSIP(Session Initiation Protocol)技術を用いることができる。H.323は、インターネット電話を実現するVoIP(Voice over IP)のプロトコルとしても採用されているほか、多地点間で、テレビ会議などを行うなど、リアルタイムなマルチメディア・データを統合的に扱うことができ、またマルチキャスト通信も可能となっている。動画像の圧縮技術としては、H.261(64kbps〜2Mbps)またはMPEG−4の基礎となった規格であるH.263(64kbps以下)が、音声圧縮技術としては、G.711、G.722、G.723.1などが使用される。
この実施例1の構成により、IPテレビ電話のユーザは、従来の電話操作及び電話通話で、様々な情報を対話的かつ視聴覚的に取得することができる。
本実施例1の構成例を図5に示す。この図5を参照しながら説明する。
配信サーバ50は配信サーバ50−1、配信サーバ50−2、配信サーバ50−3からなる。これらの配信サーバはファイルサーバ60を共有している。IPテレビ電話1〜nは、IPテレビ電話1、IPテレビ電話2、IPテレビ電話3からなる。
配信サーバ50の実施例を図6〜9を参照しながら説明する。図6は、配信サーバ50の全体を説明するための図である。図7は、配信サーバ50のインタラクションエンジン及びメディアエンジンを説明するための図である。図8は、インタラクションエンジンを説明するための図である。図9は、メディアエンジンを説明するための図である。
まず図6を用いて配信サーバ50の全体について説明する。
デコード手段52、エンコード手段53は、ビデオとオーディオのそれぞれのデータのためにオーディオコーデック101,ビデオコーデック102、オーディオチャンネル103,ビデオチャンネル104、オーディオ入出力デバイス105,ビデオ入出力デバイス106として実現されている。
シナリオ処理手段58、ユーザ応答処理手段54はメディアエンジン107とインタラクションエンジン108として実現されている。オーディオ入出力デバイス105は、オーディオバッファ109から、ビデオ入出力デバイス106はビデオバッファ110から、IPテレビ電話1〜nに配信するオーディオ・ビデオのそれぞれのデータを取得する。
IP電話コマンド手段55は、H.323エンドポイント111、H.323接続112で実現されている。
IPテレビ電話1〜nから配信サーバ50に着信が発生すると、H.323エンドポイント111がその着信を受信し、H.323接続112を確立すると共に、シナリオに基づいてインタラクションエンジン108、メディアエンジン107に映像(ビデオとオーディオ)を作成させる。ビデオ入出力デバイス106は作成されたビデオをビデオバッファ110から、オーディオ入出力デバイス105は作成されたオーディオをオーディオバッファ109からそれぞれ取得し、H.323接続112を通してIPテレビ電話1〜nに配信する。
次に図7を用いて、配信サーバ50のインタラクションエンジン108及びメディアエンジン107について説明する。
インタラクションエンジン108は、シナリオDB113をもとにユーザとの対話のための処理を行い、メディアエンジン107に対応するビデオ・オーディオを作成させる。インタラクションエンジン108はシナリオDB113からシナリオを読込み処理し、またIPテレビ電話1〜nとの接続及び対話状況をセッション情報DB114に格納する。
メディアエンジン107は、インタラクションエンジン108の指示に従い、ビデオ・オーディオを作成し、IPテレビ電話1〜nに配信する。ビデオ・オーディオは、メディアDB115,クリップDB116,キャッシュ117に格納される。
次に図8を用いてインタラクションエンジンについて説明する。
インタラクションエンジン108は、インタラクションエンジンコア120を中心に対話処理を行う。
インタラクションエンジンコア120は、ローカルディスクに格納されているシナリオについてはローカルメディアアクセス121を用いて、リモートディスクに格納されているシナリオについてはリモートメディアアクセス122を用いてアクセスする。アクセスしたシナリオを処理し、そのシナリオに基づいてIPテレビ電話1〜nから転送されてきたユーザ環境やユーザ応答といった様々な情報を、応答認識エンジン123により認識させる。応答認識エンジン123は、DTMF(テレビ電話ボタンからの数字入力)124、音声125、ビデオ126を認識する。シナリオに照し合わせた認識結果をもとに、インタラクションエンジンコア120は作成すべきビデオ・オーディオを決定し、メディアエンジン107に通知する。
次に図9を用いてメディアエンジンについて説明する。
メディアエンジン107は、インタラクションエンジン108からの通知を受けてメディア(映像)を作成する。この通知には作成すべき映像を構成するビデオ・オーディオの記述を含むファイル名が含まれており、メディアエンジン107はそのファイルを読出し、メディアインタプリタ131に通し、解読させる。この記述ファイルには、ネイティブな形式のもの(ネイティブメディアスクリプト132)もあるし、XTL133、SMIL134、MPEG−4 135などの形式のものもある。それぞれの形式に対応するメディアインタプリタが用意される。
メディアエンジン107は、この解読結果をもとに映像プロセッサ136を用いて映像を作成させ、それをIPテレビ電話1〜nに配信する。
配信手順書について図10を用いて説明する。
配信手順書は、様々なメディアの配信時刻、配信時間、IPテレビ電話画面上の位置、表示方法という振る舞いの記述であり、シナリオともいう。
シナリオDB113は対話のためのものと、映像を作成するためのものの2つの部分から構成されている。対話のためのシナリオを対話シナリオといい、映像を作成するためのシナリオをメディアシナリオという。
メディアシナリオは、作成すべきメディアDB(映像)115の作成方法を記述する。
クリップDB116は、単一的な内容を持つビデオやオーディオのデータそのものである。
図10に示すように、対話シナリオはメディアシナリオを参照する。対話シナリオは複数のメディアシナリオを組合わせて高度な対話マルチメディアコンテンツを構築する。
また、メディアシナリオはクリップDB116を参照する。メディアシナリオは複数クリップを組み合わせ、複雑なビデオ・オーディオを構築する。
また、図10に示すように、一つの対話シナリオは他の対話シナリオを参照することができる。参照されない対話シナリオはレイヤ1の対話シナリオという。この対話シナリオが参照する対話シナリオのレイヤはレイヤ2となる。このように対話シナリオのレイヤ番号がつけられる。レイヤ番号は相対的な番号である。
具体的なコンテンツを記述するシナリオについて、図面を参照しながら説明する。図11にコンテンツの構成を示している。コンテンツは4つの主なメニューからなり、それぞれ「九州紹介」、「飯塚紹介」、「新曲視聴」、「終了」である。また、「九州紹介」は9つのメニュー、「飯塚紹介」は5つのメニュー、「新曲視聴」は5つのメニューから構成されている。図11の各メニュー項目の前についている番号はユーザが選択する番号であり、その番号が選択されるとそのメニューが実行される。
上記のコンテンツ構成をシナリオにしたのが図12(図12aと図12b)である。図12は対話シナリオとメディアシナリオを含むが、実際のメディアシナリオの内容は別のファイルに格納される。シナリオ中の「PlayMedia()」という部分はメディアシナリオの部分である、メディア(映像)の作成及び配信を行う部分である。例えば、インタラクションエンジンは「PlayMedia("index.mml", true);」を読むと、index.mmlという対話シナリオをメディアエンジンに渡し、メディアエンジンはそれに基づいてメディアを作成し、IPテレビ電話に配信するためにバッファに格納する。配信サーバはこれをデコードしIPテレビ電話に配信する。
シナリオ中の「GetDigit("123456789");」は利用者の応答として1〜9の数字入力を受付けることを意味する。それから各数字に対応するシナリオが書かれており、例えば「1」という応答を受信すると「PlayMedia("scene010.mml", true);」が実行され、scene010.mmlというメディアシナリオをメディアエンジンに送られることとなる。
図12に示すシナリオのメディア構成を図13に示す。番号は利用者の応答として受付ける数字である。
図14にメディアシナリオが記述されるindex.mmlの内容を示す。メディアは各クリップを組み合わせて一つの映像を作成する。クリップをclipで指定する。clipは複数指定可能なtrackで位置し、tractはgroupの中に位置する。groupにはビデオ用のものと、オーディオのものの2つがる。groupはtimelineの中に位置する。timelineは全体の映像の時間軸となる。図14には、butterfly.aviというビデオクリップと、menuindex.bmpという静止画の組み合わせでビデオを作成し、またこれをbutterfly.aviのオーディオの部分と合成し、映像を作り出す。
従来の電話操作及び電話通話で、様々な情報を対話的かつ視聴覚的に取得することについて、図15を用いながら説明する。
IPテレビ電話1〜nのいずれかの利用者がIPテレビ電話のボタンで配信サーバ50−1〜50−nのいずれかの番号をダイヤルすると、そのIPテレビ電話からゲートキーパ20に受付依頼が送られる(1)。ゲートキーパ20は受付処理後、受付完了通知をIPテレビ電話に送る(2)。この受付完了通知には、配信サーバ50−1〜50−nのIPアドレスが含まれる。IPテレビ電話はこのIPアドレスに接続確立依頼を送る(3)。配信サーバは接続確立する(4)。それから、配信サーバはシナリオDB61を参照し、はじめに配信する映像を決定する(5)。その映像を作成するための材料となる各種クリップを取得し映像を作成する(6)。作成された映像をIPテレビ電話用にエンコードする(7)。それからその映像をIPテレビ電話に配信する(8)。
配信サーバとIPテレビ電話との接続が確立されると、IPテレビ電話の利用者は配信サーバに反応を送ることができる。例えば、配信サーバからIPテレビ電話に初めの映像が配信されたら(8)、IPテレビ電話の利用者は電話ボタンの操作を行うと、押されたボタンの情報が配信サーバに送られる(9)。その情報を受けたシナリオ処理手段58は、またシナリオDB61を参照し、その利用者の応答に対する動作を決定する。つまり、その利用者の応答に対してどんな映像を配信すればよいかである。
図15に示す動作を図12のシナリオに当てはめると、配信サーバからはまずindex.mmlに基づいて作成された映像がIPテレビ電話に配信される。それから、IPテレビ電話の利用者が電話ボタンで1を押すと、その「1」という情報が配信サーバに送られ、ユーザ応答処理手段54で認識され、対話シナリオに基づいてscene011.mmlというメディアシナリオが読込まれ、それに基づいてまた映像が作成され、IPテレビ電話に配信される。このようにして利用者の時々刻々の応答に対して送られる映像が切り替わっていく。
図16は、図15で示す動作を時系列的に表すものである。左側にはサーバの時間軸、右側には利用者側の時間軸である。時間経過は上から下となっている。この利用者の応答に対して適切な映像がサーバから送られてくるこの動作が繰り返すことで、対話的かつ視聴覚的なやりとりを実現する。
この実施例1において、配信サーバ50に設けられた多地点処理手段56,多地点制御手段57を用いることで、ファイルサーバ60に記録されているメディアのみだけでなく、その記録されているメディアと生中継のメディアとの組み合わせ配信をすることができる。
このことを、図面を用いながら説明する。図17は記録されているメディアと生中継のメディアを組み合わせて用いるシナリオの仕組みを示す。図19は利用者のIPテレビ電話に表示される画面のイメージを示す。
図17に示すように、この場合のシナリオは図10に示すシナリオと似ているが、但し、あるクリップはディスクに実際に存在しているビデオやオーディオではなく、配信サーバに接続されているIPテレビ電話から直接取得するクリップであるという点が異なっている。
図18に示すように、利用者はこのシナリオをアクセスすると(1)、配信サーバは通常のようにシナリオを取得し(2)処理し、そして各種クリップを読込む(2)。シナリオ中に生中継のメディアが含まれると、配信サーバは指定されているIPテレビ電話(このIPテレビ電話のことをサービス提供者のIPテレビ電話という)に発信し、そのIPテレビ電話と接続を開始する。それからその利用者のIPテレビ電話から送られる映像をサービス提供者のIPテレビ電話に配信し(4)、配信サーバはこの映像をシナリオが必用としているクリップとして用いる(5)。このクリップと共に映像が作成され、IPテレビ電話ユーザに配信される(6)。
図18のように、サービス提供者のIPテレビ電話からの映像をシナリオに従いその他のディスク上のクリップと共に利用者のIPテレビ電話の画面に配置される。
本発明の実施例2は、IPテレビ電話ユーザ指向サービスに関するものである。このサービスは、実施例1の基本構成に加え、ファイルサーバ60に、シナリオを保持するシナリオデータベース61を備え、配信サーバ50には、さらに、シナリオを処理し予め設定された配信手順に従って実施するシナリオ処理手段58を有している。
その配信手順には、様々なメディアの配信時刻、配信時間、IPテレビ電話画面上の位置、表示方法という振る舞いを記述する。
これにより、IP電話サービス利用者のIP電話番号や言語設定などの利用者環境に合わせて、配信手順に従い配信する映像の選択及び配信方法を調整することができる。
このことを、図面を用いながら説明する。
図20に利用者の環境に合わせた配信を指示するシナリオを示す。あるショッピングコンテンツは2つの地域から発信してくる利用者に対して異なる映像を送るようにしている場合を考える。地域1からの利用者は地域1限定の商品情報を、地域2からの利用者には地域2限定の商品情報を配信するようになっている。但し、地域共通のクリップもある。また、各地域には言語1と言語2という2つの言語が使われているため、利用者の言語によりビデオが同じでもオーディオが発信してくる利用者の言語対応するオーディオを配信するようになっている。この仕組みを図20に示すシナリオ構成に表されている。
図20を用いながら具体的な動作を説明する。例えば、地域1からの言語1を話す利用者が発信してくると、対話シナリオの記述に従い地域1のメディアシナリオが使用される(1)。さらに、地域1のメディアシナリオの従い、ビデオクリップは地域1(共通)を使用されるが(2)、オーディオクリップ(音声の部分)は言語1のものが使用される(3)。
本発明の実施例3は、IPテレビ電話対話サービスに関するものである。このサービスは、実施例1の基本構成に加え、ファイルサーバ60は、シナリオを保持するシナリオDB61と、動画クリップ、静止画、文字、音声などの様々なメディアを保持するメディアDB62と、記憶装置に保管されている各種メディアから配信サーバの処理によりできた映像を保持するキャッシュDB63とを備え、配信サーバ50は、ユーザ応答処理手段54と、シナリオを処理しそのとおりに実施するシナリオ処理手段58を有している。
これにより、どのタイミングでどれくらいの時間、あるメディアを配信するか、また、次の手順で、IPテレビ電話画面上のどの位置に、どのような表示の仕方でメディアを表示するかを規定することができる。配信手順として、ユーザのどのような応答に対しても、その応答を受けた時刻をもとに前記様々なメディアの振る舞いを決定するような記述を行っておく。
これにより、ユーザにとって、あたかも実時間的に対話しているようなサービスを提供することができる。
このことを、図面を用いながら説明する。
図21に店員と顧客の対話的かつ実時間のやり取りを示す。
このような実時間的な対話を非実時間であるクリップ集で実現するのは図22に示す配信サーバと利用者との映像のやり取りである。配信サーバは利用者の意思に従い、次々と異なる映像を配信していく。
図23に図22の画面のイメージを示す。この画面のイメージに示すように背景のビデオ・オーディオ、選択肢を表すメニューのビデオなどはがある。また、映っている人物(店員)はまるで向こう側にいる人間のように振舞うが、実際はディスクに記録されているビデオクリップである。これらはそれぞれクリップの集まりであり、各クリップの属性はシナリオで制御されている。
これらの映像は各種クリップの選択、表示開始時刻、表示期間、表示方法(効果など)、画面での表示位置などを決めるシナリオをもとに作成されるため、利用者に実時間対話を体験させる。
本発明の実施例4は、IPテレビ電話ユーザ指向サービスに関するものである。このサービスは、実施例2の基本構成に加え、記憶装置に保管されている各種メディアから構成される映像を記憶装置に保管し、必要になったら読み出すコンテンツキャッシュ手段71を備え、また配信手順として様々なメディアの配信時刻、配信時間、IPテレビ電話画面上の位置、表示方法という振る舞いを記述することにより、どのタイミングでどれくらいの時間、あるメディアを配信するか、また、次の手順で、IPテレビ電話画面上のどの位置に、どのような表示の仕方でメディアを表示するかを規定することができる。また、配信手順は、ユーザのどのような応答に対しても、その応答を受けた時刻をもとに、様々なメディアの振る舞いを決定するように記述することもできる。
本発明の実施例5は、IPテレビ電話負荷分散サービスに関するものである。このサービスは、実施例2の構成に加え、ゲートキーパ20は、アドレス変換手段21と、サーバ負荷管理手段81とを有し、配信サーバ50は、配信サーバのCPUやメモリの使用状況を時々刻々監視するサーバ負荷監視手段72を有することで、多量のアクセスに備えるために複数の配信サーバ50からなるサービスにおいて、IPテレビ電話1〜nは配信サーバ50に接続してくるとき、過負荷にならないように自動的に接続を受付ける配信サーバ50を決めることができる。
このことを、図面を用いながら説明する。
図24はゲートキーパ20を用いる配信サーバの負荷分散を示す。IPテレビ電話1が配信サーバ50−1に接続されサービスを受けている状態で、IPテレビ電話2が接続を開始しようとしてゲートキーパ20に受付依頼を行う(1)。この受付依頼を受けたゲートキーパ20はサーバ負荷管理手段81により各サーバの負荷状況82を調査する(2)。このIPテレビ電話2にサービスすることで過負荷にならないサーバのIPアドレスを通知する(3)。ここで配信サーバ50−1が過負荷状態にならずに新たなIPテレビ電話にサービスを提供できないという判断したので、ゲートキーパ20は余裕のある配信サーバ50−2のIPアドレスを通知する(5)。これをもって、IPテレビ電話は通常通り配信サーバ50−2にアクセスし、映像が送られてくる。
本発明の実施例6は、IPテレビ電話ユーザ参加型サービスに関するものである。このサービスは、実施例1〜5のいずれの構成でも可能であるが、配信サーバ50にユーザ応答処理手段54を設け、ユーザがIPテレビ電話1〜nから普通に話したりすることで、配信サーバ50がそのユーザのオーディオ及びビデオを受信し、自動的にIPテレビ電話シナリオ及びそれぞれのメディアを作成する機能を持たせたものである。
すでに図15に示したように、IPテレビ電話の利用者が配信サーバに発信し、利用者によるシナリオ自動生成用のシナリオをアクセスすると、図25のような画面が利用者のIPテレビ電話に表示される。この画面では、通常のようにシナリオにより作成される映像と共に、IPテレビ電話の利用者自身の生の映像が表示されている。利用者は映像に映っている案内人の案内に従い、電話で人間と会話しているのと同様に自己紹介などを自然に話す。そのIPテレビ電話の利用者の映像が配信サーバに送られ、オーディオとビデオのそれぞれの各クリップとして保存される。そして、自動生成用のシナリオの通りにシナリオが生成される。IPテレビ電話の利用者誰でもこのシナリオをアクセスするとその内容が再生される。
本発明は、IPネットワークを使用した非実時間映像による双方向サービスを実現するIPテレビ電話サービスシステムとして利用することができる。
本発明の実施の形態を示すシステム構成図である。 本発明の実施の形態を示すブロック図である。 従来技術のシステム構成図である。 従来技術のブロック図である。 本発明の実施例1の構成を示すシステム構成図である。 実施例1における配信サーバの構成を示すブロック図である。 実施例1における配信サーバの一部の構成を示すブロック図である。 実施例1におけるインタラクションエンジンの構成を示すブロック図である。 実施例1におけるメディアエンジンの構成を示すブロック図である。 実施例1における対話シナリオの作成状態を示す説明図である。 実施例1におけるコンテンツの構成例を示す説明図である。 図11のコンテンツ構成をシナリオにしたリストである。 図11のコンテンツ構成をシナリオにしたリストである。 図12に示すシナリオのメディア構成を示す系統図である。 メディアシナリオの記述内容を示すリストである。 実施例1における基本動作の説明図である。 図15で示す動作の時系列フロー図である。 記録されているメディアと生中継のメディアを組み合わせて用いるシナリオの仕組みを示す説明図である。 図17のシナリオを実現するための処理の流れを示す説明図である。 利用者のIPテレビ電話に表示される画面のイメージである。 実施例2における利用者の環境に合わせた配信を指示するシナリオの説明図である。 実施例3における店員と顧客の対話的かつ実時間のやり取りを示す説明図である。 実施例3のやりとりの流れを示すタイムチャートである。 実施例3におけるやりとりの画面のイメージである。 実施例5におけるIPテレビ電話負荷分散サービスにおける流れを示すブロック図である。 実施例6におけるIPテレビ電話ユーザ参加型サービスの画面のイメージである。
符号の説明
1〜n IPテレビ電話
10 IPネットワーク
11 映像入力手段
12 エンコード手段
13 転送手段
14 IP電話コマンド手段
15 デコード手段
16 映像出力手段
20 ゲートキーパ
21 アドレス変換手段
22 受付制御手段
23 帯域制御手段
24 ゾーン制御手段
25 呼認証手段
26 呼管理手段
27 帯域管理手段
28 呼制御シグナリング手段
50 配信サーバ
51 転送手段
52 デコード手段
53 エンコード手段
54 ユーザ応答処理手段
55 IP電話コマンド手段
56 多地点処理手段
57 多地点制御手段
58 シナリオ処理手段
59 媒体アクセス手段
60 ファイルサーバ
61 シナリオDB
62 メディアDB
63 キャッシュDB
71 コンテンツキャッシュ手段
72 サーバ負荷監視手段
73 HTTP/FTPコマンド手段
74 ユーザ認証手段
75 アクセス転送手段
81 サーバ負荷管理手段
82 負荷状況DB
83 ネットワーク負荷監視手段
101 オーディオコーデック
102 ビデオコーデック
103 オーディオチャンネル
104 ビデオチャンネル
105 オーディオ入出力デバイス
106 ビデオ入出力デバイス
107 メディアエンジン
108 インタラクションエンジン
109 オーディオバッファ
110 ビデオバッファ
111 H.323エンドポイント
112 H.323接続
113 シナリオDB
114 セッション情報DB
115 メディアDB
116 クリップDB
117 キャッシュ
120 インタラクションエンジンコア
121 ローカルメディアアクセス
122 リモートメディアアクセス
123 応答認識エンジン
124 DTMF
125 音声
126 ビデオ
131 メディアインタプリタ
132 ネイティブメディアスクリプト
133 XTL
134 SMIL
135 MPEG−4
136 映像プロセッサ

Claims (7)

  1. IPテレビ電話サービスが提供されているIPネットワークに接続されている配信サーバは、予め設定された配信手順に従い、IPテレビ電話サービス利用者の応答により配信する動画クリップ、静止画、文字、音声などの様々なメディア及びその配信方法を決定し、これらのメディアをストリーミング映像としてIPテレビ電話に配信する手段を備えていることを特徴とするIPテレビ電話サービスシステム。
  2. 前記配信サーバは、記録されているメディアのみ、または記録されているメディアと生中継のメディアとの組み合わせを配信する手段を備えていることを特徴とする請求項1記載のIPテレビ電話サービスシステム。
  3. 前記配信手順は、前記様々なメディアの配信時刻、配信時間、IPテレビ電話画面上の位置、表示方法という振る舞いを記述したものであることを特徴とする請求項1または2に記載のIPテレビ電話サービスシステム。
  4. 前記配信サーバは、IPテレビ電話サービス利用者のIPテレビ電話番号や言語設定などの利用者環境に合わせて、前記配信手順に従い、配信する映像の選択及び配信方法を調整する手段を備えていることを特徴とする請求項1から3のいずれかの項に記載のIPテレビ電話サービスシステム。
  5. 前記配信サーバは、IPテレビ電話サービス利用者の指示に従い配信手順を自動的に作成し、そしてIPテレビ電話サービス利用者から音声やビデオを受信し、それぞれのメディアを自動的に作成する手段を備えていることを特徴とする請求項1から4のいずれかの項に記載のIPテレビ電話サービスシステム。
  6. IPテレビ電話サービスを利用するためのIPテレビ電話端末と、
    そのIPテレビ電話端末に映像を配信する配信サーバと、
    配信される動画クリップ、静止画、文字、音声等の各種メディア及びそのキャッシュを格納するファイルサーバと、
    IPテレビ電話番号解決や帯域管理を行うゲートキーパとで構成されるIPネットワークにおいて、
    前記配信サーバは、
    前記IPネットワーク上にデータを転送する転送手段と、
    IPテレビ電話端末のデータとして符号化されたデータをオーディオデータやビデオデータなどに復号するデコード手段と、
    オーディオデータやビデオデータなどをIPテレビ電話端末のデータとして符号化するエンコード手段と、
    IPテレビ電話端末とのやり取りを行うために必要なコマンドを出すIP電話コマンド手段と、
    前記ファイルサーバに保管されている各種メディアを入出力する媒体アクセス手段と、
    を有することを特徴とするIPテレビ電話サービスシステム。
  7. 前記ファイルサーバは、配信手順の記述を保持するシナリオデータベースを備え、
    前記配信サーバは、さらに、前記配信手順の記述を処理し予め設定された配信手順に従って実施するシナリオ処理手段を有し、
    前記配信手順は、前記様々なメディアの配信時刻、配信時間、IPテレビ電話画面上の位置、表示方法という振る舞いを記述したものであることを特徴とする請求項6記載のIPテレビ電話サービスシステム。
JP2004145529A 2004-05-14 2004-05-14 Ipテレビ電話サービスシステム Pending JP2005328394A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004145529A JP2005328394A (ja) 2004-05-14 2004-05-14 Ipテレビ電話サービスシステム
PCT/JP2005/008500 WO2005112453A1 (ja) 2004-05-14 2005-05-10 Ipテレビ電話サービスシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004145529A JP2005328394A (ja) 2004-05-14 2004-05-14 Ipテレビ電話サービスシステム

Publications (1)

Publication Number Publication Date
JP2005328394A true JP2005328394A (ja) 2005-11-24

Family

ID=35394529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004145529A Pending JP2005328394A (ja) 2004-05-14 2004-05-14 Ipテレビ電話サービスシステム

Country Status (2)

Country Link
JP (1) JP2005328394A (ja)
WO (1) WO2005112453A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8266666B2 (en) 2008-09-12 2012-09-11 At&T Intellectual Property I, Lp System for controlling media presentations
US8316410B2 (en) 2007-07-23 2012-11-20 At&T Intellectual Property I, Lp Apparatus and method for communicating media between communication devices
US8479230B2 (en) 2006-12-19 2013-07-02 At&T Intellectual Property I, Lp System and apparatus for managing media content
US8555330B2 (en) 2007-10-03 2013-10-08 At&T Intellectual Property I, L.P. System for managing media services
US8683527B2 (en) 2007-04-20 2014-03-25 At&T Intellectual Property I, Lp System and apparatus for supplying media content to portable communication devices
US8881205B2 (en) 2008-09-12 2014-11-04 At&T Intellectual Property I, Lp System for controlling media presentation devices
JP2015061086A (ja) * 2013-09-17 2015-03-30 株式会社リコー 伝送端末及びプログラム
JP2020184761A (ja) * 2019-05-02 2020-11-12 華康(新加坡)有限公司DynaLab (Singapore) Ltd. 固定電話でインターネット・プロトコル・テレビジョン遠隔対話型顧客サービスを起動し、実行するシステム及びその方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2007034550A1 (ja) * 2005-09-22 2009-03-19 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 動画像配信装置およびその方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000137752A (ja) * 1998-10-29 2000-05-16 Recruit Co Ltd 情報配信システム
JP2001168923A (ja) * 1999-12-08 2001-06-22 Toshiba Corp マルチメディア提供システム、マルチメディア変換サーバ、およびマルチメディア端末
JP2001197207A (ja) * 2000-01-17 2001-07-19 Mega Chips Corp 多言語応対装置
JP2001211437A (ja) * 2000-01-28 2001-08-03 Mitsubishi Electric Corp マルチメディアctiシステム
JP2001218181A (ja) * 2000-02-04 2001-08-10 Megafusion Corp 双方向通信方法
JP2003338830A (ja) * 2002-03-12 2003-11-28 Matsushita Electric Ind Co Ltd メディア送信方法、メディア受信方法、メディア送信装置及びメディア受信装置
JP2004356897A (ja) * 2003-05-28 2004-12-16 Neu & Computing Inc ゲートウェイ装置およびそれを用いた情報提供システム

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8479230B2 (en) 2006-12-19 2013-07-02 At&T Intellectual Property I, Lp System and apparatus for managing media content
US8584164B2 (en) 2006-12-19 2013-11-12 At&T Intellectual Property I, Lp System and apparatus for managing media content
US8683527B2 (en) 2007-04-20 2014-03-25 At&T Intellectual Property I, Lp System and apparatus for supplying media content to portable communication devices
US8893211B2 (en) 2007-07-23 2014-11-18 At&T Intellectual Property I, Lp Apparatus and method for communicating media between communication devices
US8316410B2 (en) 2007-07-23 2012-11-20 At&T Intellectual Property I, Lp Apparatus and method for communicating media between communication devices
US10194198B2 (en) 2007-07-23 2019-01-29 At&T Intellectual Property I, L.P. Apparatus and method for communicating media between communication devices
US9681180B2 (en) 2007-07-23 2017-06-13 At&T Intellectual Property I, L.P. Apparatus and method for communicating media between communication devices
US9912999B2 (en) 2007-10-03 2018-03-06 At&T Intellectual Property I, L.P. System for managing media services
US9338518B2 (en) 2007-10-03 2016-05-10 At&T Intellectual Property I, Lp System for managing media services
US8555330B2 (en) 2007-10-03 2013-10-08 At&T Intellectual Property I, L.P. System for managing media services
US9294801B2 (en) 2008-09-12 2016-03-22 At&T Intellectual Property I, Lp System for controlling media presentation devices
US8881205B2 (en) 2008-09-12 2014-11-04 At&T Intellectual Property I, Lp System for controlling media presentation devices
US8266666B2 (en) 2008-09-12 2012-09-11 At&T Intellectual Property I, Lp System for controlling media presentations
JP2015061086A (ja) * 2013-09-17 2015-03-30 株式会社リコー 伝送端末及びプログラム
JP2020184761A (ja) * 2019-05-02 2020-11-12 華康(新加坡)有限公司DynaLab (Singapore) Ltd. 固定電話でインターネット・プロトコル・テレビジョン遠隔対話型顧客サービスを起動し、実行するシステム及びその方法
JP7034206B2 (ja) 2019-05-02 2022-03-11 華康(新加坡)有限公司 固定電話でインターネット・プロトコル・テレビジョン遠隔対話型顧客サービスを起動し、実行するシステム及びその方法

Also Published As

Publication number Publication date
WO2005112453A1 (ja) 2005-11-24

Similar Documents

Publication Publication Date Title
US9300705B2 (en) Methods and systems for interfacing heterogeneous endpoints and web-based media sources in a video conference
US20170048286A1 (en) Live broadcast system
US9049338B2 (en) Interactive video collaboration framework
US7764632B2 (en) Software bridge for multi-point multi-media teleconferencing and telecollaboration
US20060066717A1 (en) Video conference choreographer
US20070177606A1 (en) Multimedia streaming and gaming architecture and services
US9584564B2 (en) Systems and methods for integrating live audio communication in a live web event
WO2005112453A1 (ja) Ipテレビ電話サービスシステム
US20080192736A1 (en) Method and apparatus for a multimedia value added service delivery system
US20080084470A1 (en) System, method and computer program for providing scalability in two or more streaming and/or archiving systems for video conference calls
US9019372B2 (en) Remote controlled studio camera system
US20080181201A1 (en) System and method for data transfer between terminals in voice communication under voice over internet protocol (voip)
TW200951835A (en) Techniques to manage a whiteboard for multimedia conference events
CA2591861A1 (en) Associating independent multimedia sources into a conference call
CN103269408A (zh) 一种融合通信系统
NO325064B1 (no) Kommunikasjonsklient
JP2019036969A (ja) ライブ放送システム
CN105553967A (zh) 网络会议方法及装置
KR20140103156A (ko) 멀티미디어 서비스를 이용하기 위한 시스템, 장치 및 방법
EP1949682A1 (en) Method for gatekeeper streaming
KR20020050903A (ko) 인터넷을 이용한 교육,방송, 다자간 화상 회의,채팅서비스 제공 방법
JP2003271530A (ja) 通信システム,システム間関連装置,プログラム,及び,記録媒体
KR20090087958A (ko) Poc 미디어 시스템, 장치 및 방법
JP2006345103A (ja) メディア会議システム、その制御方法、プログラムおよび記憶媒体
JP2003032651A (ja) 説明会情報配信方法、説明会情報配信システム及び説明会情報配信プログラム