JP4655065B2 - Content distribution system, content distribution system distribution server and display terminal, and content distribution program - Google Patents
Content distribution system, content distribution system distribution server and display terminal, and content distribution program Download PDFInfo
- Publication number
- JP4655065B2 JP4655065B2 JP2007158882A JP2007158882A JP4655065B2 JP 4655065 B2 JP4655065 B2 JP 4655065B2 JP 2007158882 A JP2007158882 A JP 2007158882A JP 2007158882 A JP2007158882 A JP 2007158882A JP 4655065 B2 JP4655065 B2 JP 4655065B2
- Authority
- JP
- Japan
- Prior art keywords
- video content
- character information
- character
- image
- display terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Transfer Between Computers (AREA)
Description
本発明は、伝送路を介して映像コンテンツを配信サーバから利用者の表示端末に配信するシステムに関し、特に、携帯通信端末等の表示部の狭い表示端末に対し配信を行なうコンテンツ配信システムとその配信サーバ及び表示端末、コンテンツ配信プログラムに関する。 The present invention relates to a system for distributing video content from a distribution server to a user's display terminal via a transmission line, and in particular, a content distribution system for distributing to a display terminal having a narrow display unit such as a mobile communication terminal and the distribution thereof The present invention relates to a server, a display terminal, and a content distribution program.
図13は、従来の映像配信システムの構成を示すブロック図であり、映像を配信する映像配信サーバ60から、伝送路30を介して映像コンテンツを配信し、利用者の映像表示端末70が映像コンテンツを受信して提示する。
FIG. 13 is a block diagram showing a configuration of a conventional video distribution system, in which video content is distributed from a
また、特開2000−324416号公報では、テレビ受像機においてその受信したテレビ放送からテロップ情報を抽出し、これをリモコン端末等の静止画表示端末に送信して表示することで、文字情報を高画質にみせる技術が提案されている。 Also, in Japanese Patent Laid-Open No. 2000-324416, telop information is extracted from a received television broadcast in a television receiver, and is transmitted to a still image display terminal such as a remote control terminal for display. Technologies that show image quality have been proposed.
テロップ情報は、ニュース番組のテロップ、映画の字幕などのテロップ情報など映像視聴時にストーリーや内容の理解に重要な情報が含まれていることが多く、これを高画質の読み易い画像により利用者に提示することは効果的である。 The telop information often contains information important for understanding the story and content when watching video, such as news program telop, movie subtitles, etc. Presenting is effective.
また、上記従来技術には含まれないが、テロップ情報だけでなく、CMの商品に書かれた商品名、ドラマの背景の看板や標識の文字など一般のシーンに存在するテロップ以外の文字情報を抽出することも有用である。 Although not included in the above-mentioned prior art, not only telop information but also character information other than telop existing in general scenes such as product names written on commercial products, signs of signs of drama, signs and signs, etc. It is also useful to extract.
上記の特開2000−324416号公報の従来技術の対象は一般のテレビ放送であるが、最近ではインターネットの高速化、特に無線通信の高速化により、家庭のPC、あるいは外出先の携帯電話において、映画広告、音楽プロモーションビデオなど、蓄積された映像クリップを見ることができるようになってきている。また、Webカメラなどと称して、観光地や道路に設置したカメラの映像をインターネットで配信するといった、ライブ映像の配信も行われている。 The subject of the prior art disclosed in the above Japanese Patent Laid-Open No. 2000-324416 is a general television broadcast, but recently, due to the speeding up of the Internet, particularly the speeding up of wireless communication, It has become possible to see accumulated video clips such as movie advertisements and music promotion videos. In addition, live video distribution such as the distribution of video from a camera installed on a sightseeing spot or road, such as a Web camera, is also performed.
このような映像をそのまま配信するためには非常に広帯域な通信路が必要であるが、画像の圧縮符号化技術により、情報量を削減できる。例えば、64kbps程度の帯域のインターネットでも、圧縮した映像を配信してそれを受けた端末で復号することにより、映像の閲覧ができる。 In order to distribute such video as it is, a very wide-band communication channel is required, but the amount of information can be reduced by image compression coding technology. For example, even on the Internet having a bandwidth of about 64 kbps, it is possible to view the video by distributing the compressed video and decoding it with a terminal that receives the compressed video.
しかし、64kbps程度の低ビットレートで映像を送信するためには、映像の解像度を落としたり、映像の品質を落としたりして映像の符号化を行ない、携帯端末や家庭のPCに送信している。このように解像度を落としたり、画質を落とすと、映像中に含まれる文字情報が不明瞭になり、非常に読みにくくなる。 However, in order to transmit a video at a low bit rate of about 64 kbps, the video is encoded by reducing the resolution of the video or the quality of the video, and the encoded video is transmitted to a portable terminal or a home PC. . If the resolution is lowered or the image quality is lowered as described above, the character information included in the video becomes unclear and becomes very difficult to read.
先に述べたように文字情報は映像視聴に重要な情報が含まれるが、文字情報が読みにくくなると映像視聴に支障をきたすこともありうる。
上述したように従来の技術では、以下に述べるような問題点があった。 As described above, the conventional techniques have the following problems.
従来では、低ビットレートで映像コンテンツを配信する時に、テロップ情報をはじめとした文字情報を抽出して高画質に符号化して配信し、それを利用者の端末に表示させる技術が存在しなかった。例えば、特開2000−324416号公報の従来技術では、受信した一般のテレビ放送からテロップを抽出するものの、携帯通信端末等が再生する低ビットレートで配信される映像コンテンツに対しては、既に文字が不明瞭な状態で配信されるためテロップ抽出を行なうことができなかった。 Conventionally, when distributing video content at a low bit rate, there has been no technology that extracts text information including telop information, encodes and distributes it with high image quality, and displays it on the user's terminal . For example, in the prior art disclosed in Japanese Patent Laid-Open No. 2000-324416, a telop is extracted from a received general television broadcast. However, for video content distributed at a low bit rate reproduced by a mobile communication terminal or the like, text has already been written. Telop extraction could not be performed because is distributed in an unclear state.
本発明の目的は、上記従来技術の欠点を解決し、低ビットレートで配信される映像コンテンツにおいても、受信側の表示端末が文字を明瞭に表示して利用者に提示することのできるコンテンツ配信システムとその配信サーバ及び表示端末、コンテンツ配信プログラムを提供することにある。 An object of the present invention is to solve the above-mentioned drawbacks of the prior art, and even for video content distributed at a low bit rate, content distribution that can be displayed to the user by the display terminal on the receiving side clearly displaying characters To provide a system, its distribution server, display terminal, and content distribution program.
本発明のコンテンツ配信システムの第1の態様は、配信サーバから表示端末に対し映像コンテンツを配信するコンテンツ配信システムにおいて、前記配信サーバが、映像コンテンツの画像から文字が表示される領域を検出し、検出した前記領域の画像のコントラストを高めた画像を、前記映像コンテンツの文字情報として生成し、前記映像コンテンツと同時に、生成した文字情報を前記表示端末に配信し、前記表示端末が、前記配信サーバから受信した前記映像コンテンツの文字情報を、同時に受信した前記映像コンテンツと共に提示することを特徴とする。According to a first aspect of the content distribution system of the present invention, in the content distribution system that distributes video content from a distribution server to a display terminal, the distribution server detects an area in which characters are displayed from an image of the video content, An image in which the contrast of the detected image of the region is increased is generated as character information of the video content, and the generated character information is distributed to the display terminal simultaneously with the video content, and the display terminal is connected to the distribution server. The character information of the video content received from the video content is presented together with the video content received simultaneously.
本発明のコンテンツ配信システムの第2の態様は、配信サーバから表示端末に対し映像コンテンツを配信するコンテンツ配信システムにおいて、前記配信サーバが、映像コンテンツの画像から文字が表示される領域を検出し、検出した前記領域の画像のビットレートを高くし、画質を高めた画像を、前記映像コンテンツの文字情報として生成し、、前記映像コンテンツと同時に、生成した文字情報を前記表示端末に配信し、前記表示端末が、前記配信サーバから受信した前記映像コンテンツの文字情報を、同時に受信した前記映像コンテンツと共に提示することを特徴とするAccording to a second aspect of the content distribution system of the present invention, in the content distribution system that distributes video content from the distribution server to the display terminal, the distribution server detects an area in which characters are displayed from an image of the video content, Increasing the bit rate of the image of the detected area and generating an image with improved image quality as character information of the video content, and simultaneously distributing the generated character information to the display terminal simultaneously with the video content, The display terminal presents the character information of the video content received from the distribution server together with the video content received simultaneously.
本発明のコンテンツ配信システムの第3の態様は、配信サーバから表示端末に対し映像コンテンツを配信するコンテンツ配信システムにおいて、前記配信サーバが、映像コンテンツの画像から文字が表示される領域を検出し、検出した前記領域の画像を別の符号化方式で符号化した画像を、前記映像コンテンツの文字情報として生成し、前記映像コンテンツと同時に、生成した文字情報を前記表示端末に配信し、前記表示端末が、前記配信サーバから受信した前記映像コンテンツの文字情報を、同時に受信した前記映像コンテンツと共に提示することを特徴とする。According to a third aspect of the content distribution system of the present invention, in the content distribution system that distributes video content from the distribution server to the display terminal, the distribution server detects an area in which characters are displayed from an image of the video content, An image obtained by encoding the detected image of the region by another encoding method is generated as character information of the video content, and simultaneously with the video content, the generated character information is distributed to the display terminal, and the display terminal The character information of the video content received from the distribution server is presented together with the video content received simultaneously.
本発明の配信サーバの第1の態様は、表示端末に対しコンテンツを配信する配信サーバにおいて、映像コンテンツの画像から文字が表示される領域を検出する手段と、検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、前記文字情報を生成する手段は、検出した前記領域に示される文字のテキストデータを文字認識により取得し、前記文字認識により取得した前記テキストデータを指定された言語に翻訳した翻訳文を、前記映像コンテンツの文字情報として生成することを特徴とする。According to a first aspect of the distribution server of the present invention, in the distribution server that distributes the content to the display terminal, the means for detecting an area where characters are displayed from the image of the video content, and the video content from the detected area A means for generating character information; and a means for delivering the video content to the display terminal simultaneously with the generated character information. The means for generating the character information is a text of the character indicated in the detected area. Data is acquired by character recognition, and a translated sentence obtained by translating the text data acquired by character recognition into a specified language is generated as character information of the video content.
本発明の配信サーバの第2の態様は、表示端末に対しコンテンツを配信する配信サーバにおいて、映像コンテンツの画像から文字が表示される領域を検出する手段と、検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、前記文字情報を生成する手段は、検出した前記領域の画像のコントラストを高めた画像を、前記映像コンテンツの文字情報として生成することを特徴とする。According to a second aspect of the distribution server of the present invention, in the distribution server that distributes the content to the display terminal, the means for detecting an area where characters are displayed from the image of the video content, and the video content from the detected area A means for generating character information; and a means for distributing the video content to the display terminal simultaneously with the generated character information. The means for generating the character information increases the contrast of the detected image in the region. The generated image is generated as character information of the video content.
本発明の配信サーバの第3の態様は、表示端末に対しコンテンツを配信する配信サーバにおいて、映像コンテンツの画像から文字が表示される領域を検出する手段と、検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、前記文字情報を生成する手段は、検出した前記領域の画像を二値化した画像を、前記映像コンテンツの文字情報として生成することを特徴とする。According to a third aspect of the distribution server of the present invention, in the distribution server that distributes the content to the display terminal, the means for detecting an area in which characters are displayed from the image of the video content, and the video content from the detected area And a means for generating character information, and a means for delivering the video content to the display terminal simultaneously with the generated character information. The means for generating the character information binarizes the image of the detected area. The generated image is generated as character information of the video content.
本発明の配信サーバの第4の態様は、表示端末に対しコンテンツを配信する配信サーバにおいて、映像コンテンツの画像から文字が表示される領域を検出する手段と、検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、前記文字情報を生成する手段は、検出した前記領域の画像のビットレートを高くし、画質を高めた画像を、前記映像コンテンツの文字情報として生成することを特徴とする。According to a fourth aspect of the distribution server of the present invention, in the distribution server that distributes the content to the display terminal, the means for detecting an area in which characters are displayed from the image of the video content, and the video content from the detected area And a means for generating character information, and a means for distributing the video content to the display terminal simultaneously with the generated character information. The means for generating the character information sets the bit rate of the image of the detected area. An image having a high image quality and a high image quality is generated as character information of the video content.
本発明の配信サーバの第5の態様は、表示端末に対しコンテンツを配信する配信サーバにおいて、映像コンテンツの画像から文字が表示される領域を検出する手段と、検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、前記文字情報を生成する手段は、検出した前記領域の画像を別の符号化方式で符号化した画像を、前記映像コンテンツの文字情報として生成することを特徴とする配信サーバ。According to a fifth aspect of the distribution server of the present invention, in the distribution server that distributes the content to the display terminal, the means for detecting an area where characters are displayed from the image of the video content, and the video content from the detected area Means for generating character information; and means for distributing the video content to the display terminal simultaneously with the generated character information, wherein the means for generating the character information uses a different code for the detected image of the region. A distribution server characterized in that an image encoded by an encoding method is generated as character information of the video content.
本発明の表示端末の第1の態様は、配信サーバから、映像コンテンツの画像に表示される文字から映像コンテンツとは別に生成された文字情報と当該映像コンテンツとを同時に受信する手段と、受信した前記文字情報と前記映像コンテンツとを共に提示する手段を備え、前記映像コンテンツの文字情報が、前記映像コンテンツから検出された前記領域、文字の特徴を示す文字補助情報を含み、前記配信サーバから受信した前記映像コンテンツの文字情報を、前記文字情報に含まれる前記文字補助情報に基づいて提示する手段を備えることを特徴とする。According to a first aspect of the display terminal of the present invention, the distribution server receives from the distribution server the character information generated separately from the video content from the characters displayed on the video content image and the video content at the same time. Means for presenting both the character information and the video content, wherein the character information of the video content includes character auxiliary information indicating characteristics of the area and characters detected from the video content, and is received from the distribution server; And a means for presenting the character information of the video content based on the character auxiliary information included in the character information.
以上説明したように本発明によれば、低ビットレートで配信される映像コンテンツにおいても、配信サーバで映像コンテンツ中から文字情報を抽出し、それを映像コンテンツとは別にテキストデータや高画質な符号化方法を用いて符号化した画像により配信することにより、利用者に映像コンテンツの内容をわかりやすく提示することができる。 As described above, according to the present invention, even for video content distributed at a low bit rate, character information is extracted from the video content by the distribution server, and is separated from the video content with text data and high-quality code. By distributing with an image encoded using the conversion method, the contents of the video content can be presented to the user in an easy-to-understand manner.
このため、表示端末には文字抽出を行なうための処理能力を必要とせず、更に携帯通信端末等の表示画面の狭い表示端末においても、映像コンテンツの中の文字を明瞭に表示することができ、利用者に映像コンテンツの内容をわかりやすく提示することができる。 For this reason, the display terminal does not require processing ability to perform character extraction, and even in a display terminal with a narrow display screen such as a mobile communication terminal, the characters in the video content can be clearly displayed. The contents of video content can be presented to the user in an easy-to-understand manner.
以下、本発明の実施の形態について図面を参照して詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は、本発明の第1の実施の形態によるコンテンツ配信システムの構成を示すブロック図であり、本実施の形態の配信サーバ10及び表示端末20の構成も示している。
FIG. 1 is a block diagram showing the configuration of the content distribution system according to the first embodiment of the present invention, and also shows the configuration of the
図1を参照すると、本実施の形態の配信サーバ10は、プログラム制御されるCPU等で実現され、映像入力部11、映像符号化部12、文字抽出部13、映像送信部14、文字送信部15を備えている。本実施の形態の表示端末20は、プログラム制御されるCPU等で実現され、映像受信部21、映像復号部22、映像表示部23、文字受信部24、文字復号部25、文字表示部26を備えている。
Referring to FIG. 1, a
配信サーバ10が対象とする映像コンテンツは、テレビ放送等のライブコンテンツでもよいし、映画の予告映像など既に符号化されて蓄積された映像コンテンツでもよい。
The video content targeted by the
配信サーバ10と表示端末20を結ぶ伝送路30として、特に制限はないが、ここでは携帯電話やPHSなどの一般無線回線、ISDNなどの一般電話回線での利用を想定し、64kbps〜384kbps程度である場合を例に説明する。
The
図2は、本実施の形態の配信サーバ10の動作を説明するためのフローチャートであり、図3は、本実施の形態の表示端末20の動作を説明するためのフローチャートである。
FIG. 2 is a flowchart for explaining the operation of the
本実施の形態の配信サーバ10は、映像入力部11に映像コンテンツが入力され(ステップ201)、文字抽出部13により映像コンテンツ中に文字が表示されている領域(文字領域)を検出し、その文字を確認するために用いる文字情報を生成する(ステップ202)。そして、映像コンテンツを映像符号化部12で符号化し(ステップ203)、映像送信部14が表示端末20へ符号化した映像コンテンツを送信し、同時に文字送信部15が表示端末20へ文字情報を送信する(ステップ204)。
The
表示端末20は、配信サーバ10から送信された映像情報(映像コンテンツ)を映像受信部21により受信し、文字情報を文字受信部24により受信する(ステップ301)。そして、映像復号部22でその映像コンテンツを復号し、文字復号部25でその文字情報を復号する(ステップ302)。そして、映像表示部23で映像コンテンツを表示し、文字表示部26で文字情報を表示して、これらを利用者に提示する(ステップ303)。これにより、表示端末20の利用者は、映像情報及び文字情報を見ることができる。
The
本実施の形態では、配信サーバ10から表示端末20へ映像コンテンツ及び文字情報を送信するための伝送路として、共通の伝送路30を用いているが、特に共通の伝送路30とする方式に限定する必要はない。例えば、映像コンテンツと文字情報を同じ携帯電話のパケット交換を利用して送信する方式以外にも、文字情報のみを携帯電話のパケット交換、映像コンテンツは携帯電話の回線交換を利用して送信することも可能である。
In the present embodiment, the
ここで、映像コンテンツと文字情報とを異なる伝送路で配信する場合には、映像コンテンツはテレビ電話のような端末で視聴するが、文字情報はインターネットで受信するといった利用形態等も実施することができる。 Here, when video content and character information are distributed through different transmission paths, the video content is viewed on a terminal such as a videophone, but the character information is received on the Internet. it can.
また、映像コンテンツと文字情報とを共通の伝送路30で配信する場合は、本発明の第2の実施の形態に示すように、映像コンテンツと文字情報とを多重化し配信する方式を採用することができる。
Further, when distributing video content and character information through a
図4は、本発明の第2の実施の形態によるコンテンツ配信システムの構成を示すブロック図である。本実施の形態では、配信サーバ10aにおいて、第1の実施の形態の映像送信部14と文字送信部15の替わりに多重化部16と送信部17を備え、表示端末20aにおいて、第1の実施の形態の映像受信部21と文字受信部24の変わりに受信部27と多重化分離部28を備えている。
FIG. 4 is a block diagram showing a configuration of a content distribution system according to the second embodiment of the present invention. In the present embodiment, the
図5は、本実施の形態の配信サーバ10aの動作を説明するためのフローチャートであり、図6は、本実施の形態の表示端末20aの動作を説明するためのフローチャートである。
FIG. 5 is a flowchart for explaining the operation of the
図5、図6を参照すると本実施の形態の動作の第1の実施の形態との違いは、配信サーバ10aは、映像符号化部12で符号化した映像コンテンツ及び、文字抽出部13で抽出した文字情報を多重化部16で多重化し(ステップ404)、送信部17で表示端末20aでその多重化したコンテンツを送信する(ステップ405)点が異なる。表示端末20aは、受信部27で受信した多重化されたコンテンツを(ステップ501)、多重化分離部28で映像コンテンツと文字情報とに分離し(ステップ502)、その分離した映像コンテンツと文字情報のそれぞれを復号し表示する(ステップ503、504)点が異なる。
Referring to FIGS. 5 and 6, the difference between the operation of the present embodiment and the first embodiment is that the
多重化を行なう方法としては、ITU−Tによって定められたテレビ電話を行なうための標準規格であるH.324/Mなどを用いて、映像や音声の情報とテキスト情報を多重化することが可能である。 As a method of multiplexing, H.264, which is a standard for making a videophone call defined by ITU-T. It is possible to multiplex video and audio information and text information using 324 / M or the like.
また、ここではライブ映像や蓄積映像を読み出した映像コンテンツを映像入力部11に入力して配信する方式であるが、映像符号化部12や文字抽出部13で処理した結果を蓄積しておき、利用者からの要求があった時に蓄積済みの映像コンテンツを読み出す方式も、同様に実施することができる。
In addition, here, the video content obtained by reading live video or stored video is input to the video input unit 11 and distributed. However, the results processed by the
次に、図7を用いて、配信サーバ10aが映像コンテンツから生成した文字情報とその映像コンテンツとを配信し、表示端末20aで表示する方法について説明する。なおここでの説明は、第2の実施の形態のみではなく、第1の実施の形態においても同様である。
Next, with reference to FIG. 7, a description will be given of a method in which the
図7では、利用者がニュース番組を視聴している場面を示しており、図7の(1)のオリジナル画像には、ニュース番組はアナウンサーの映像とそれにニュースのヘッドラインを示すテロップが重畳されている。 FIG. 7 shows a scene in which a user is watching a news program. In the original image of (1) in FIG. 7, a news program is superimposed with an announcer video and a telop indicating a news headline. ing.
ここでは文字情報として、テロップ情報を対象にして説明をするが、テロップではない映像シーン中の看板の文字など一般の文字、データ放送や文字放送などで映像に多重化されてきた文字なども同様に対象とすることができる。 Here, we will explain telop information as text information. However, the same applies to general text such as signboard characters in video scenes that are not telop, as well as text that has been multiplexed on video by data broadcasting or text broadcasting. Can be targeted.
図7の表示画面20−3aには、従来のようにそのまま映像を符号化して送信した場合の、表示端末20aにおける表示の一例を示している。 The display screen 20-3a in FIG. 7 shows an example of display on the display terminal 20a when the video is encoded and transmitted as it is as in the prior art.
ここで伝送路30は、64kbps〜384kbps程度の低ビットレートの伝送路30であり、このような低ビットレートの伝送路30を用いて符号化した映像を送信するためには、以下の(1)(2)のような符号化方法を用いる必要がある。(1)入力映像の解像度を低くして、符号化する(2)符号化に必要なビットレートを下げ、画質を悪くする
Here, the
通常、テレビのニュース映像のテロップはテレビの解像度(例えば、720×480)で視聴することを前提としているため、携帯電話での映像配信によく用いられるQCIF(176×144)やCIF(352×288)といった解像度まで落としてしまうと文字が小さくなったり、潰れてしまい、非常に読みにくくなる。 Usually, television news video telops are premised on viewing at television resolution (eg, 720 × 480), so QCIF (176 × 144) and CIF (352 ×) often used for video distribution on mobile phones. If the resolution is reduced to 288), the characters become smaller or crushed and become very difficult to read.
また、画質を悪くすると、通常コントラストが低くなり、文字が不明瞭になる。例えばISO標準規格のMPEGでは、映像をブロックに分割しブロック単位で符号化を行なっているため、画質を悪くすると、各ブロックの境目が目立ち、更にブロックの中のコントラストも低くなる。このため、テロップ文字のようにコントラストが明瞭であることの必要な部分においても、そのコントラストが低くなることでその文字を読むことが困難になる。 Further, when the image quality is deteriorated, the contrast is usually lowered and the characters become unclear. For example, in the MPEG of the ISO standard, video is divided into blocks and encoding is performed in units of blocks. Therefore, if the image quality is deteriorated, the boundaries between the blocks become conspicuous, and the contrast in the blocks also decreases. For this reason, even in a portion that requires a clear contrast such as a telop character, it becomes difficult to read the character due to the low contrast.
図7では、携帯電話で映像を視聴する利用イメージを示しているが、これは表示画面の狭い携帯電話のみに発生する問題ではなく、低ビットレートの伝送路30を利用して映像配信を行なう時には表示端末20aがどのようなものでも起こりうる問題である。
Although FIG. 7 shows a usage image for viewing video on a mobile phone, this is not a problem that occurs only on a mobile phone with a narrow display screen, and video distribution is performed using a low-bit-
この問題は、低ビットレートで符号化を行なう時に、人物のような自然の映像と人工的な文字情報を同時に扱うために生じる問題と考えることができる。そこで本発明の第1、第2の実施の形態においては、映像コンテンツをそのまま送信するのではなく、図7の(2)に示されるように、配信サーバ10、10aにおいて映像コンテンツの画像から文字の表示される文字領域を検出し、その表示される文字を確認するために用いる情報(文字情報)を生成し、この文字情報を映像コンテンツと共に表示端末20、20aに配信する。
This problem can be considered as a problem caused by simultaneously handling a natural image such as a person and artificial character information when encoding at a low bit rate. Therefore, in the first and second embodiments of the present invention, the video content is not transmitted as it is, but characters are extracted from the video content image in the
つまり、映像コンテンツは、表示画面20−3aの従来の場合と同様にしてオリジナル画像のまま送信するが、本実施の形態(及び第1の実施の形態)では、文字領域の文字を確認するために用いる情報(文字情報)を、映像コンテンツと別の方式で符号化などを行ない、送信する。 That is, the video content is transmitted as the original image as in the conventional case of the display screen 20-3a, but in this embodiment (and the first embodiment), the characters in the character area are confirmed. The information (character information) used for is encoded and transmitted using a method different from that for video content.
例えば、抽出した文字領域の映像に対して文字認識を行ない、表示されている文字のテキストデータを取得し、各文字をアスキーコードのような数値情報(文字コード)により示して送信することができる。表示画面20−3bは、このように分離して送信した場合における表示端末20aの表示の一例である。 For example, character recognition can be performed on the extracted image of the character area, text data of the displayed characters can be acquired, and each character can be indicated by numerical information (character code) such as an ASCII code and transmitted. . The display screen 20-3b is an example of the display of the display terminal 20a when transmitted separately in this way.
テキストデータ(文字コード)で送信することで通信量は少なくなり、また、表示端末20aでは任意の大きさで表示できるので、大きく表示して読みやすくすること等ができる。 By transmitting text data (character code), the amount of communication is reduced, and the display terminal 20a can display an arbitrary size, so that it can be displayed in a large size for easy reading.
この文字認識の処理は、現在販売されているOCRソフトウェア等に用いられている技術や、その他従来の技術を用いて実施することができる。 This character recognition processing can be performed using a technique used in currently sold OCR software or the like, or other conventional techniques.
また、上記のように文字認識技術を用いる場合には、文字認識の自動処理において文字の認識を間違えることが多くあるので、文字情報として、文字認識により得たテキストデータではなく文字の表示されている文字領域の画像を送信する方式も有効である。 In addition, when character recognition technology is used as described above, character recognition is often mistaken in automatic character recognition processing, so characters are displayed as character information instead of text data obtained by character recognition. A method of transmitting an image of a character area is also effective.
この場合、全体の画像は低解像度であるが、抽出した文字領域の部分だけ高解像度で符号化して送信することで、図7の表示画面20−3cに示されるように読みやすく表示することができる。図7の表示画面20−3cでは、高解像度の文字領域の映像を全体の映像コンテンツの下に表示している。 In this case, the entire image has a low resolution, but only the extracted character region portion is encoded at a high resolution and transmitted, so that it can be displayed in an easy-to-read manner as shown in the display screen 20-3c in FIG. it can. On the display screen 20-3c of FIG. 7, a high-resolution video of the character area is displayed below the entire video content.
また、通常テロップ情報は人が読むことができるように数秒間は同じテロップが流れていることが多いため、これを利用して、テロップ情報が変化した時だけ新たに文字情報を送信する等の制御を行なうことが可能である。高解像度で符号化した画像をそのまま送信すると、伝送路30の容量を圧迫することなるが、このようにしてその送信頻度を下げて文字領域の映像を伝送することにより、その帯域を小さくすることができる。
In addition, since normal telop information often flows the same telop for a few seconds so that people can read it, this can be used to send new text information only when the telop information changes. Control can be performed. If an image encoded at a high resolution is transmitted as it is, the capacity of the
また、抽出した文字領域のカラー画像をそのまま送信するのではなく、その画像を二値化して文字は黒、背景は白とする等による二値の画像に減色した上で符号化して送信することにより、更に伝送量を下げることができる。 Also, instead of transmitting the extracted color image of the character area as it is, the image is binarized, the character is black, the background is white, etc. Thus, the transmission amount can be further reduced.
このように、文字領域を高解像度で符号化するためには、動画像の符号化方式であるMPEG等を用いることができる。また更に、静止画の符号化方式であるJPEGやJPEG2000を用いたり、二値画像に対してはJBIGなどの符号化方式を用いることもできる。 Thus, in order to encode the character area with high resolution, MPEG or the like, which is a moving image encoding method, can be used. Still further, JPEG or JPEG2000, which are encoding methods for still images, can be used, and encoding methods such as JBIG can be used for binary images.
本実施の形態の文字抽出部13は、文字領域の抽出を行なうが、その文字領域抽出方法としては従来から実施されている技術を用いることができる。
The
例えば、テロップ情報は、以下の(1)〜(3)に示されるような特徴があるので、このような特徴を利用して抽出を行なうことができる。(1)白い文字を使うことが多い(2)動きが少ない(3)文字は単独で現れずに複数の文字がまとまっている For example, since the telop information has the characteristics as shown in the following (1) to (3), extraction can be performed using such characteristics. (1) Many white characters are used. (2) There is little movement. (3) Characters do not appear independently but multiple characters are grouped.
また、文字抽出部13は、文字領域の抽出や文字領域の文字認識を行なうだけでなく、文字領域の映像中の位置の抽出や文字領域の文書レイアウト構造を解析することも可能であり、文字抽出部13が文字領域の位置やレイアウト構造等を抽出し、文字送信部15で送信することができる。
The
このような文字領域の映像コンテンツ中の位置や文字領域のレイアウト構造を、文字補助情報と呼ぶことにする。また、文字情報には、以上説明した文字領域の画像(映像)や文字認識により取得したテキストデータ等に加えて、文字補助情報を含むこととする。 Such a position of the character area in the video content and the layout structure of the character area are referred to as character auxiliary information. The character information includes character auxiliary information in addition to the above-described image (video) of the character area, text data acquired by character recognition, and the like.
以上はテロップ情報や映像シーン中の文字情報の抽出に関する説明であるが、データ放送等の文字が映像に多重化されている場合においてはこのような処理は必要ではなく、文字抽出部13が、データ放送等において多重化されている文字情報を分離してテキストデータを抽出する方式も可能である。 The above is the explanation regarding the extraction of the telop information and the character information in the video scene. However, when characters such as data broadcasting are multiplexed on the video, such processing is not necessary, and the character extraction unit 13 A method of extracting text data by separating character information multiplexed in data broadcasting or the like is also possible.
図7では文字情報と映像情報を分離して送信することで、利用者が文字情報を明瞭に読むことができることを説明したが、図8を用いて利用者への文字情報の提示方法を示す。 In FIG. 7, it has been explained that the user can clearly read the character information by transmitting the character information and the video information separately, but FIG. 8 shows a method of presenting the character information to the user. .
図8の表示画面20−4aは、文字情報等を表示することなく、従来と同様にして通常の映像を表示している場合である。この状態では、利用者には映像コンテンツ以外に情報は提示されない。また、従来においても、表示画面20−4bに示されるようにして、表示中の映像のチャンネル番号や番組名など一般的な情報を(文字放送等を利用して)表示させることにより、利用者が何を視聴しているのかを分かるようにする従来技術がある。本実施の形態の表示端末20aは、通常は表示画面20−4aや表示画面20−4bのような表示を行なっている。 The display screen 20-4a in FIG. 8 is a case where a normal image is displayed in the same manner as in the past without displaying character information or the like. In this state, no information other than video content is presented to the user. Further, conventionally, as shown on the display screen 20-4b, by displaying general information such as a channel number of a video being displayed and a program name (using text broadcasting or the like), a user can be displayed. There is a conventional technique that makes it possible to understand what is watching. The display terminal 20a of the present embodiment normally performs display such as the display screen 20-4a and the display screen 20-4b.
ここで、利用者がテロップなど文字情報が不明瞭だと感じた場合、配信サーバ10aからその文字情報を受信して、映像コンテンツとは別に表示する。
Here, when the user feels that the character information such as a telop is unclear, the character information is received from the
また、表示端末20aは、配信サーバ10aから送信されてくる文字情報を常時受信する方式も可能であるが、ここでは本実施の形態を、帯域の節約のため通常は文字情報を受信せずに、必要な時だけ配信サーバ10aに文字情報送信要求を出し文字情報を受信する方式により説明する。
Further, the display terminal 20a may be configured to always receive the character information transmitted from the
表示端末20aは、配信サーバ10aに文字情報の要求を出すことで、配信サーバ10aから映像中の文字情報の配信を受け付けて、その文字情報を表示する。
The display terminal 20a issues a character information request to the
文字情報は、文字認識等により得られたテキストデータで送信されてくる場合と、高画質の画像により送信される場合があり、配信サーバ10aの能力によって使い分けてもよいが、利用者が文字情報の送信を配信サーバ10aに要求を出したように、文字認識した結果と画像のままのどちらが欲しいかを選択できるようにしてもよい。
The character information may be transmitted as text data obtained by character recognition or the like, or may be transmitted as a high-quality image, and may be properly used depending on the capability of the
表示画面20−4cは、受信した文字情報が文字認識されてテキストデータで送信されてきた場合の表示例であり、映像コンテンツに隣り合わせて、その文字情報を表示させている。また、表示画面20−4bのように番組情報等を表示している場合は、その番組情報等と文字情報とを切り替えて表示させることにより、狭い画面でも効率よく利用することができる。 The display screen 20-4c is a display example when the received character information is recognized and transmitted as text data, and the character information is displayed next to the video content. Further, when program information or the like is displayed as in the display screen 20-4b, the program information or the like and character information can be switched and displayed, so that even a narrow screen can be used efficiently.
また、表示画面20−4cでは、文字情報が短いため、タイル状に並べて映像情報と文字情報を表示することができているが、文字情報が長い場合は、文字を縦方向、横方向、あるいは両者にスクロールさせて表示させてもよい。 On the display screen 20-4c, since the character information is short, the video information and the character information can be displayed in a tiled manner. However, if the character information is long, the character is displayed in the vertical direction, the horizontal direction, or You may scroll and display both.
また、表示画面20−4cのようにタイル状に並べるのではなく、映像の上に文字情報の一部が重なるように配置してもよい。更に、配信サーバ10aから文字補助情報として文字情報の映像中での位置を受信している場合は、表示画面20−4fに示されるように文字情報を元の映像の位置に重畳して表示することもできる。
Further, instead of arranging them in a tile shape as in the display screen 20-4c, they may be arranged so that part of the character information overlaps on the video. Further, when the position of the character information in the video is received as the auxiliary character information from the
次に、配信サーバ10aが、映像コンテンツ中に文字が表示される領域を複数個所検出した場合の処理を説明する。
Next, processing when the
この場合、配信サーバ10aは、検出された映像コンテンツ中の全ての文字情報を表示端末20aに配信することも可能であるが、これ以外にも利用者が指定した領域中の文字情報のみを配信する方式も可能である。
In this case, the
この場合の動作の一実施例を説明する。配信サーバ10aは、表示端末20aに対し、各領域の文字や文章のレイアウト情報や検出された各領域の位置情報といった文字補助情報を含めて送信する。そして、表示端末20aにおいて、その文字補助情報を利用して利用者が文字情報を見たい領域を選択し配信サーバ10aに通知する。そして、配信サーバ10aは、その表示端末20aから通知された利用者が選択した領域から、文字情報を生成して表示端末20aに配信する。
An example of the operation in this case will be described. The
また、文字補助情報がない場合にも、表示端末20aにおいて、配信サーバ10aに対し文字情報の切り替えを指示して順次切り替え、その各文字情報の内容を参照して選択する方式等が可能である。
Further, even when there is no character auxiliary information, it is possible to use a method in which the display terminal 20a instructs the
このように、配信サーバ10aは、表示端末20aに全ての文字情報を配信するのではなく、表示端末20aから通知された見たい文字情報や、配信する文字情報の切り替えの指示等の文字情報送信の要求に基づいて、映像コンテンツ中のその要求された文字情報のみを配信することが可能である。
In this way, the
この場合、配信サーバ10aは、映像コンテンツの画像から最初に検出された文字領域の文字情報を最初に表示端末20aに配信し、最初に表示端末20aで表示させることとしてもよいが、更に好ましくは映像コンテンツ中に表示される位置や文字認識した結果の文字情報の内容を基に、配信する順番を決定することとしてもよい。
In this case, the
例えば、映像コンテンツの下部の中央に横書きで示される文字は、テロップである可能性が高いためその文字情報を最優先で配信することとし、逆に映像コンテンツの上部の左又は右の隅に狭い範囲で示される文字は、現在時刻の表示である可能性が高くその重要性が低いためこれ以外の他の文字情報を優先して配信する等が考えられる。 For example, text written horizontally in the lower center of video content is likely to be a telop, so the text information is distributed with the highest priority, and conversely, it is narrow in the left or right corner at the top of the video content. Since the character indicated by the range is likely to be the display of the current time and its importance is low, it is conceivable that other character information is preferentially distributed.
また、配信サーバ10aが表示端末20aに全ての文字情報を配信し、表示端末20aの側で表示する文字情報を選択する方式も可能である。
In addition, a method in which the
また、表示画面20−4dに示すように、配信サーバ10aが、その文字認識した文字情報のテキストデータを指定された他の言語に自動翻訳して、その翻訳文を文字情報として表示端末20aに配信し表示させることもできる。
Further, as shown in the display screen 20-4d, the
この自動翻訳は、翻訳ソフトウェア等における従来の技術を用いることで、表示画面20−4dに示される日本語から英語の場合や、英語から日本語等の様々な言語間の翻訳が可能である。このように抽出した文字情報を自動翻訳して配信することにより、様々な言語の映像コンテンツを提供するサービスが簡単になる。翻訳文を表示する表示方法は、表示画面20−4cの場合と同様である。 This automatic translation can translate between various languages such as Japanese to English or English to Japanese shown on the display screen 20-4d by using a conventional technique in translation software or the like. By automatically translating and distributing character information extracted in this way, a service for providing video contents in various languages is simplified. The display method for displaying the translation is the same as in the display screen 20-4c.
次に、表示画面20−4eに示すように、配信サーバ10aが文字情報をその文字の表示される領域の画像(映像)で配信する場合も、表示画面20−4cと同様にして映像コンテンツとは別のウィンドウにより文字情報を表示することができる。
Next, as shown in the display screen 20-4e, when the
また、画面サイズより大きな文字情報の画像が配信された場合には、表示端末20aが文字情報の画像を縮小して表示させたり、詳細を見たい場合は拡大して縦方向や横方向などにスクロールさせて表示させること等が可能である。 When a character information image larger than the screen size is distributed, the display terminal 20a displays the image of the character information in a reduced size, or enlarges it in the vertical direction or the horizontal direction to view details. It is possible to display by scrolling.
また、表示端末20aは、文字情報中にレイアウト情報などの文字補助情報が含まれている場合は、これを利用して文字領域の画像を読みやすいように生成しなおして提示することも可能である。 In addition, if the character information includes auxiliary character information such as layout information, the display terminal 20a can use this to regenerate and present the image of the character area so that it can be easily read. is there.
また、表示画面20−4fに示すように、文字情報を画像で配信する場合においても、文字情報の画像を映像コンテンツとは別の領域ではなく、文字情報を映像と同じ領域に重畳して表示させることができる。特に、元の映像コンテンツの文字領域に重ねるように文字情報を表示することで、文字情報の画像を読みやすく表示することができる。 In addition, as shown in the display screen 20-4f, even when character information is distributed as an image, the character information image is not displayed in a region separate from the video content, but is displayed superimposed on the same region as the video. Can be made. In particular, by displaying the character information so as to overlap the character area of the original video content, it is possible to display the character information image in an easy-to-read manner.
配信される文字情報の画像は、通常は元の映像コンテンツよりも高解像度であるため、先の表示画面20−4eの場合と同様に、最初は配信された文字情報の画像を縮小して元の映像コンテンツに重畳させて表示し、必要になれば縮小を解除して(また指定サイズにサイズを変更して)スクロールさせながら表示させること等が可能である。 Since the character information image to be distributed usually has a higher resolution than the original video content, as in the case of the previous display screen 20-4e, the image of the character information distributed is initially reduced to the original. The video content can be displayed superimposed on the video content, and if necessary, the reduction can be canceled (or the size can be changed to a specified size) and the content can be displayed while scrolling.
表示画面20−4dのように文字情報を文字認識して他言語に翻訳したものを映像コンテンツとは別のウィンドウに表示することもできるが、これを同様にして表示画面20−4gに示すように、映像コンテンツ中に重畳させて表示することもできる。 As shown in the display screen 20-4g, the character information recognized as characters and translated into another language can be displayed in a window different from the video content. In addition, it can be displayed superimposed on the video content.
これは、外国映画の映像コンテンツの字幕などに応用でき、映画に集中したい場合に、他のウィンドウを見て集中が削がれるということがなくなる。これを実現するために、テキストデータで配信される翻訳文の文字情報をそのまま映像に重畳させてもよいし、その翻訳文のテキストデータから文字領域の大きさにあわせて文字画像を作成して表示させること等が可能である。 This can be applied to subtitles of video content of foreign movies, and when you want to concentrate on a movie, you will not lose your focus by looking at other windows. In order to achieve this, the text information of the translated text distributed as text data may be superimposed on the video as it is, or a text image is created from the text data of the translated text according to the size of the text area. It is possible to display it.
また、配信サーバ10aで文字認識した結果をテキストデータにより配信するのではなく、そのテキストデータの文字を表示する文字画像を生成して、これを文字情報として表示端末20aに配信することも可能である。この場合、表示端末20aは、受信した文字情報の画像を重畳させて表示するのみで鮮明に文字を表示することができる。
In addition, instead of distributing the result of character recognition by the
また、特に語学学習用や外国映画等の映像コンテンツの場合には、映像コンテンツに表示させる字幕を消去したいといった要求もある。 There is also a demand for deleting subtitles to be displayed on video content, particularly in the case of video content for language learning or foreign movies.
この場合、表示画面20−4hに示されるように、配信された文字補助情報において示される映像コンテンツ中での文字が表示される領域の位置情報に基づいて、表示端末20aがその領域を消去して利用者に提供することができる。 In this case, as shown in the display screen 20-4h, the display terminal 20a erases the area based on the position information of the area where the character in the video content indicated in the distributed character auxiliary information is displayed. Can be provided to users.
またこの場合、語学の勉強中に答が知りたいなどといった用途の時は、表示端末20aは、利用者の操作に応じて、表示画面20−4c〜20−4gのような手法で文字情報を表示させたり消去したり、切り替えながら利用者に提示することが可能である。 In this case, when the user wants to know the answer while studying the language, the display terminal 20a displays the character information by a method such as the display screens 20-4c to 20-4g according to the operation of the user. It can be displayed, erased, or presented to the user while switching.
なお、上記の第1、第2の実施の形態の映像コンテンツ及び文字情報の提示方法の説明においては、表示端末20、20aを携帯電話等の携帯通信端末とする場合を例に説明したが、特に表示端末20aを携帯電話に限定する必要はない。本発明のコンテンツ配信システムは、配信先の表示端末20、20aが表示部の面積が狭い場合に特に効果的であるが、同様にしてパソコンやノートパソコン等の端末に対し配信することも可能である。
In the description of the video content and text information presentation method according to the first and second embodiments, the case where the
以上説明したように、上記第1、第2の実施の形態のコンテンツ配信システムによれば、低ビットレートで配信される映像コンテンツにおいても、受信側の表示端末が文字を明瞭に表示して利用者に提示することができる。 As described above, according to the content distribution systems of the first and second embodiments, the display terminal on the receiving side clearly displays and uses the video content distributed at a low bit rate. Can be presented to the person.
次に、本発明の第3の実施の形態を説明する。図9は、本発明の第3の実施の形態によるコンテンツ配信システムの構成を示すブロック図である。本実施の形態は、配信サーバ10を用いずに表示端末20bだけで文字情報を抽出して表示する行なう形態である。
Next, a third embodiment of the present invention will be described. FIG. 9 is a block diagram showing a configuration of a content distribution system according to the third embodiment of the present invention. In the present embodiment, character information is extracted and displayed only on the display terminal 20b without using the
図10は、本実施の形態の表示端末20bの動作を説明するためのフローチャートである。 FIG. 10 is a flowchart for explaining the operation of the display terminal 20b of the present embodiment.
本実施の形態の表示端末20bは、テレビ放送などの放送映像を受信する携帯端末であり、映像受信部21で電波等により外部の放送局40等から放送中のテレビ番組等の映像コンテンツを受信する(ステップ601)。受信した映像コンテンツを映像復号部22で復号し(ステップ602)、文字抽出部29によりその文字情報を生成して(ステップ603)、映像表示部23で映像コンテンツとその文字情報を表示する(ステップ604)。
The display terminal 20b according to the present embodiment is a mobile terminal that receives broadcast video such as television broadcast, and the
表示端末20bは、携帯用を念頭においているので、表示することができる解像度が低く、映像表示部23では映像コンテンツを縮小して表示する。この時、縮小された映像コンテンツは、テロップ等の文字が不明瞭になったり潰れてしまうことがある。
Since the display terminal 20b is intended to be portable, the resolution that can be displayed is low, and the
一方、映像復号部22で復号する映像は通常の解像度の映像が復号されるので、通常の解像度の映像を用いて、文字抽出部29にて文字領域を抽出し、文字表示部26で文字情報を表示することで、利用者に映像内容をわかりやすく提示する。また、文字抽出部29は、文字領域を抽出するだけでなく、文字認識も行ない表示される文字のテキストデータを取得することも可能である。この場合、その取得したテキストデータを文字表示部26により表示する。
On the other hand, since the video decoded by the
本実施の形態の表示端末20bの文字情報の表示手法は、上述の第1、第2の実施の形態の説明と同様にして実施することができる。 The display method of the character information of the display terminal 20b according to the present embodiment can be performed in the same manner as described in the first and second embodiments.
以上説明したように本実施の形態によれば、表示端末20bが文字抽出を行なうための十分な処理能力を備える場合には、配信サーバを必要とせずに、表示端末20b自身により、テレビ放送などの映像コンテンツから文字情報を抽出して、抽出した文字情報を高解像度に表示することができる。これにより、第1、第2の実施の形態の表示端末20、20aと同様にして、携帯端末などの小画面の表示端末20bにおいても利用者に映像コンテンツの内容をわかりやすく提示することができる。
As described above, according to the present embodiment, when the display terminal 20b has sufficient processing capability to perform character extraction, the display terminal 20b itself does not require a distribution server, and the television broadcast or the like. The character information can be extracted from the video content and the extracted character information can be displayed with high resolution. As a result, similar to the
次に、本発明の第4の実施の形態を説明する。図11は、本発明の第4の実施の形態によるコンテンツ配信システムの構成を示すブロック図である。 Next, a fourth embodiment of the present invention will be described. FIG. 11 is a block diagram showing a configuration of a content distribution system according to the fourth embodiment of the present invention.
第3の実施の形態では映像を表示端末20bで直接受信し、文字領域抽出も表示端末20bで行なう方式であったが、一般に携帯型の機器は処理能力が低いため、文字領域抽出が困難な場合もありうる。 In the third embodiment, the video is directly received by the display terminal 20b and the character area extraction is also performed by the display terminal 20b. However, since the portable device generally has low processing capability, it is difficult to extract the character area. There may be cases.
図12は、本実施の形態の配信サーバ10bの動作を説明するためのフローチャートである。 FIG. 12 is a flowchart for explaining the operation of the distribution server 10b of the present embodiment.
そこで本実施の形態では、配信サーバ10cにおいて表示端末20cが外部の放送局40から受信している番組と同じ番組の映像コンテンツを映像入力部11で受信し(ステップ701)、文字抽出部13でその文字情報を抽出して(ステップ702)、文字送信部15でその文字情報を表示端末20cに送信する(ステップ703)。表示端末20cでは、第1、第2の実施の形態と同様にして、配信サーバ10cから配信される文字情報を文字受信部24で受信し、文字復号部25で必要な復号処理を行い、文字表示部26で文字情報を表示する。
Therefore, in the present embodiment, the video input unit 11 receives the video content of the same program as the program received by the display terminal 20c from the
一方、映像コンテンツは、第3の実施の形態と同様に配信サーバ10c以外の放送局40等から、映像受信部21で受信し、映像復号部22で必要な復号処理を行い、映像表示部23でその映像コンテンツを表示する。
On the other hand, the video content is received by the
本実施の形態の表示端末20cの文字情報の表示手法は、上述の第1、第2の実施の形態の説明と同様にして実施することができる。 The display method of the character information of the display terminal 20c of the present embodiment can be performed in the same manner as described in the first and second embodiments.
以上説明したように、本実施の形態によれば、第3の実施の形態の効果に加えて、文字領域抽出の処理が困難な表示端末20cでも文字情報を表示することができる。また、配信サーバ10が文字情報のみを配信し、表示端末20cが映像コンテンツを他の放送局40等から受信する方式により、上記第1、第2の実施の形態のコンテンツ配信システムと同様の効果を実現することができる。
As described above, according to the present embodiment, in addition to the effects of the third embodiment, it is possible to display character information even on the display terminal 20c where the character region extraction process is difficult. Further, the
また、通常データ量が多い映像情報を配信サーバ10cから受信せず、直接電波等を利用して映像を受信することで、データ通信に要する費用などを抑えることができ、第1や第2の実施の形態よりも効率よく文字情報の配信ができる。
In addition, by receiving video using direct radio waves or the like without receiving video information with a large amount of normal data from the
なお、上記各実施の形態では、表示端末20、20a、20b、20cでは映像コンテンツとその文字情報とを同時に表示する方式であったが、文字情報のみを表示して映像コンテンツは表示しないという形態も可能である。これにより、より少ない通信量により映像コンテンツの文字情報を表示することができる。
In each of the above embodiments, the
なお、上記各実施の形態のコンテンツ配信システムは、配信サーバ10、10a、10cにおける映像入力部11、映像符号化部12、文字抽出部13、映像送信部14、文字送信部15、多重化部16、送信部17の機能や、表示端末20、20a、20b、20cにおける映像受信部21、映像復号部22、映像表示部23、文字受信部24、文字復号部25、文字表示部26、受信部27、多重化分離部28、文字抽出部29の機能や、その他の機能をハードウェア的に実現することは勿論として、各機能を備えるコンピュータプログラムであるコンテンツ配信プログラム90、90a、90c、91、91a、91b、91cを、コンピュータ処理装置のメモリにロードされることで実現することができる。このコンテンツ配信プログラム90、90a、90c、91、91a、91b、91cは、磁気ディスク、半導体メモリその他の記録媒体に格納される。そして、その記録媒体からコンピュータ処理装置にロードされ、コンピュータ処理装置の動作を制御することにより、上述した各機能を実現する。
The content distribution system of each of the above embodiments includes the video input unit 11, the
以上好ましい実施の形態及び実施例をあげて本発明を説明したが、本発明は必ずしも上記実施の形態及び実施例に限定されるものではなく、その技術的思想の範囲内において様々に変形して実施することができる。 Although the present invention has been described with reference to the preferred embodiments and examples, the present invention is not necessarily limited to the above-described embodiments and examples, and various modifications can be made within the scope of the technical idea. Can be implemented.
10、10a、10c 配信サーバ
11 映像入力部
12 映像符号化部
13 文字抽出部
14 映像送信部
15 文字送信部
16 多重化部
17 送信部
20、20a、20b、20c 表示端末
21 映像受信部
22 映像復号部
23 映像表示部
24 文字受信部
25 文字復号部
26 文字表示部
27 受信部
28 多重化分離部
29 文字抽出部
30 伝送路
60 映像配信サーバ
61 映像入力部
62 映像符号化部
64 映像送信部
70 映像表示端末
71 映像受信部
72 映像復号部
73 映像表示部
90、90a、90c、91、91a、91b、91c 配信プログラム
10, 10a, 10c Distribution server 11
Claims (25)
前記配信サーバが、映像コンテンツの画像から文字が表示される領域を検出し、検出した前記領域の画像のコントラストを高めた画像を、前記映像コンテンツの文字情報として生成し、前記映像コンテンツと同時に、生成した文字情報を前記表示端末に配信し、
前記表示端末が、前記配信サーバから受信した前記映像コンテンツの文字情報を、同時に受信した前記映像コンテンツと共に提示することを特徴とするコンテンツ配信システム。
In a content distribution system that distributes video content from a distribution server to a display terminal,
The distribution server detects an area where characters are displayed from the image of the video content, generates an image with increased contrast of the detected image of the area as character information of the video content, and simultaneously with the video content, Deliver the generated character information to the display terminal,
The content distribution system, wherein the display terminal presents the character information of the video content received from the distribution server together with the video content received simultaneously.
The content distribution system according to claim 1 , wherein the image with the increased contrast is an image obtained by binarizing the detected image of the region.
前記配信サーバが、映像コンテンツの画像から文字が表示される領域を検出し、検出した前記領域の画像のビットレートを高くし、画質を高めた画像を、前記映像コンテンツの文字情報として生成し、前記映像コンテンツと同時に、生成した文字情報を前記表示端末に配信し、 The distribution server detects an area where characters are displayed from an image of video content, increases the bit rate of the detected image of the area, and generates an image with improved image quality as character information of the video content, Simultaneously with the video content, the generated character information is distributed to the display terminal,
前記表示端末が、前記配信サーバから受信した前記映像コンテンツの文字情報を、同時に受信した前記映像コンテンツと共に提示することを特徴とするコンテンツ配信システム。 The content distribution system, wherein the display terminal presents the character information of the video content received from the distribution server together with the video content received simultaneously.
前記配信サーバが、映像コンテンツの画像から文字が表示される領域を検出し、検出した前記領域の画像を別の符号化方式で符号化した画像を、前記映像コンテンツの文字情報として生成し、前記映像コンテンツと同時に、生成した文字情報を前記表示端末に配信し、 The distribution server detects an area where characters are displayed from an image of video content, generates an image obtained by encoding the detected image of the area with another encoding method as character information of the video content, and Simultaneously with the video content, the generated text information is distributed to the display terminal,
前記表示端末が、前記配信サーバから受信した前記映像コンテンツの文字情報を、同時に受信した前記映像コンテンツと共に提示することを特徴とするコンテンツ配信システム。 The content distribution system, wherein the display terminal presents the character information of the video content received from the distribution server together with the video content received simultaneously.
When a plurality of areas in which characters are displayed are detected from the image of the video content, the distribution server accepts designation of the area from the display terminal, and the character information generated by the designated area is content delivery system according to any one of claims 1 to 4, characterized in that the delivery to the display terminal.
The content distribution according to any one of claims 1 to 5 , wherein the distribution server multiplexes the character information of the video content and the video content and distributes the multiplexed information to the display terminal. system.
The said display terminal receives the character information of the said video content received from an external broadcasting station from the said delivery server, and presents the character information of the said video content with the said video content. Item 7. The content distribution system according to any one of Items 6 to 6 .
前記表示端末が、前記配信サーバから受信した前記映像コンテンツの文字情報を、前記文字情報に含まれる前記文字補助情報に基づいて提示することを特徴とする請求項1から請求項7のいずれか1つに記載のコンテンツ配信システム。
As the character information of the video content, in addition to the character information generated separately from the video content, the detected region, the character auxiliary information indicating the character characteristics are included at the same time,
The display terminal, the character information of the video content received from the distribution server, any of claims 1 to 7, characterized in that presented on the basis of the character auxiliary information included in the character information 1 Content distribution system described in 1.
The content distribution system according to claim 8 , wherein the text auxiliary information of the video content includes information on a position in the image of the region detected from the image of the video content.
The content distribution system according to claim 8 or 9 , wherein the character auxiliary information of the video content includes information on a layout structure of characters displayed on the image of the video content.
映像コンテンツの画像から文字が表示される領域を検出する手段と、
検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、
生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、
前記文字情報を生成する手段は、検出した前記領域に示される文字のテキストデータを文字認識により取得し、前記文字認識により取得した前記テキストデータを指定された言語に翻訳した翻訳文を、前記映像コンテンツの文字情報として生成する
ことを特徴とする配信サーバ。
In a distribution server that distributes content to display terminals,
Means for detecting an area in which characters are displayed from an image of video content;
Means for generating character information separately from the video content from the detected area;
Means for delivering the video content to the display terminal simultaneously with the generated character information;
The means for generating the character information obtains the text data of the character indicated in the detected area by character recognition, and translates the text data obtained by the character recognition into a specified language as the video. A distribution server that generates character information of content .
映像コンテンツの画像から文字が表示される領域を検出する手段と、 Means for detecting an area where characters are displayed from an image of video content;
検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、 Means for generating character information separately from the video content from the detected area;
生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、 Means for delivering the video content to the display terminal simultaneously with the generated character information;
前記文字情報を生成する手段は、検出した前記領域の画像のコントラストを高めた画像を、前記映像コンテンツの文字情報として生成する The means for generating the character information generates an image in which the contrast of the detected image of the region is increased as the character information of the video content.
ことを特徴とする配信サーバ。A distribution server characterized by that.
映像コンテンツの画像から文字が表示される領域を検出する手段と、 Means for detecting an area where characters are displayed from an image of video content;
検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、 Means for generating character information separately from the video content from the detected area;
生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、 Means for delivering the video content to the display terminal simultaneously with the generated character information;
前記文字情報を生成する手段は、検出した前記領域の画像を二値化した画像を、前記映像コンテンツの文字情報として生成することを特徴とする配信サーバ。 The distribution server characterized in that the means for generating the character information generates an image obtained by binarizing the detected image of the region as the character information of the video content.
映像コンテンツの画像から文字が表示される領域を検出する手段と、 Means for detecting an area where characters are displayed from an image of video content;
検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、 Means for generating character information separately from the video content from the detected area;
生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、 Means for delivering the video content to the display terminal simultaneously with the generated character information;
前記文字情報を生成する手段は、検出した前記領域の画像のビットレートを高くし、画質を高めた画像を、前記映像コンテンツの文字情報として生成する The means for generating the character information increases the bit rate of the image of the detected area and generates an image with improved image quality as the character information of the video content.
ことを特徴とする配信サーバ。A distribution server characterized by that.
映像コンテンツの画像から文字が表示される領域を検出する手段と、 Means for detecting an area where characters are displayed from an image of video content;
検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、 Means for generating character information separately from the video content from the detected area;
生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、 Means for delivering the video content to the display terminal simultaneously with the generated character information;
前記文字情報を生成する手段は、検出した前記領域の画像を別の符号化方式で符号化した画像を、前記映像コンテンツの文字情報として生成するThe means for generating the character information generates, as character information of the video content, an image obtained by encoding the detected image of the region by another encoding method.
ことを特徴とする配信サーバ。A distribution server characterized by that.
指定された前記領域において生成した文字情報を前記表示端末に対し配信すること
を特徴とする請求項11から請求項15のいずれか一つに記載の配信サーバ。
Means for receiving designation of the area from the display terminal when a plurality of areas in which characters are displayed are detected from the image of the video content;
The distribution server according to any one of claims 11 to 15 , wherein character information generated in the designated area is distributed to the display terminal.
The distribution server according to any one of claims 11 to 16 , further comprising means for multiplexing the character information of the video content and the video content and distributing the multiplexed information to the display terminal.
As character information of the video content, in addition to character information generated separately from the video content, the device includes means for identifying the region and character characteristics, and the identified region and character feature information is used as character auxiliary information. The distribution server according to any one of claims 11 to 17 , wherein the distribution server includes the character information of the video content and distributes the image content to the display terminal.
前記表示端末からの要求に応じて、要求された前記映像コンテンツ及び前記映像コンテンツの文字情報を前記表示端末に配信する手段を備えることを特徴とする請求項11から請求項18のいずれか1つに記載の配信サーバ。
Means for recording the video content and character information of the video content;
The apparatus according to any one of claims 11 to 18 , further comprising means for distributing the requested video content and character information of the video content to the display terminal in response to a request from the display terminal. The delivery server described in.
受信した前記文字情報と前記映像コンテンツとを共に提示する手段を備え、 Means for presenting both the received character information and the video content;
前記映像コンテンツの文字情報が、前記映像コンテンツから検出された前記領域、文字の特徴を示す文字補助情報を含み、 The character information of the video content includes character auxiliary information indicating characteristics of the region and characters detected from the video content,
前記配信サーバから受信した前記映像コンテンツの文字情報を、前記文字情報に含まれる前記文字補助情報に基づいて提示する手段を備えることを特徴とする表示端末。 A display terminal comprising: means for presenting character information of the video content received from the distribution server based on the character auxiliary information included in the character information.
前記映像コンテンツを、前記文字補助情報に示される前記文字が表示される領域を消去して提示する手段を備えることを特徴とする請求項20に記載の表示端末。
The character auxiliary information includes information on a position in the image of an area in which characters in the image of the video content are displayed,
21. The display terminal according to claim 20 , further comprising means for erasing and presenting the video content by deleting an area in which the character indicated by the character auxiliary information is displayed.
備えることを特徴とする請求項20又は請求項21に記載の表示端末。
The display terminal according to claim 20 or 21 , further comprising means for instructing the delivery server whether the character information can be transmitted.
The display terminal according to any one of claims 20 to 22 , further comprising means for simultaneously displaying the character information of the video content and the video content in separate windows on a display screen.
The display terminal according to any one of claims 20 to 23 , further comprising means for simultaneously displaying character information of the video content in an area for displaying the video content in a display screen.
The display terminal according to any one of claims 20 to 24 , wherein the display terminal is a mobile communication terminal.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007158882A JP4655065B2 (en) | 2007-06-15 | 2007-06-15 | Content distribution system, content distribution system distribution server and display terminal, and content distribution program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007158882A JP4655065B2 (en) | 2007-06-15 | 2007-06-15 | Content distribution system, content distribution system distribution server and display terminal, and content distribution program |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001376701A Division JP4000844B2 (en) | 2001-12-11 | 2001-12-11 | Content distribution system, content distribution system distribution server and display terminal, and content distribution program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007325282A JP2007325282A (en) | 2007-12-13 |
JP4655065B2 true JP4655065B2 (en) | 2011-03-23 |
Family
ID=38857612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007158882A Expired - Fee Related JP4655065B2 (en) | 2007-06-15 | 2007-06-15 | Content distribution system, content distribution system distribution server and display terminal, and content distribution program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4655065B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9497492B2 (en) | 2013-03-15 | 2016-11-15 | Ricoh Company, Limited | Distribution control system, distribution system, distribution control method, and computer-readable storage medium |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009177448A (en) * | 2008-01-24 | 2009-08-06 | Sanyo Electric Co Ltd | Video image reproducing apparatus, video image reproduction system, content server, caption display method, and caption display program |
JP5376685B2 (en) * | 2011-07-13 | 2013-12-25 | Necビッグローブ株式会社 | CONTENT DATA DISPLAY DEVICE, CONTENT DATA DISPLAY METHOD, AND PROGRAM |
JP6555151B2 (en) * | 2015-12-15 | 2019-08-07 | 株式会社リコー | Communication apparatus and communication system |
JP6977632B2 (en) * | 2018-03-12 | 2021-12-08 | 株式会社Jvcケンウッド | Subtitle generator, subtitle generator and program |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000242661A (en) * | 1999-02-23 | 2000-09-08 | Fujitsu Ltd | Relating information retrieval device and storage medium recording program for executing relating information retrieval processing |
JP2001045445A (en) * | 1999-07-29 | 2001-02-16 | Nippon Telegr & Teleph Corp <Ntt> | Live video image transmission reception system. live video image transmitter and receiver |
-
2007
- 2007-06-15 JP JP2007158882A patent/JP4655065B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000242661A (en) * | 1999-02-23 | 2000-09-08 | Fujitsu Ltd | Relating information retrieval device and storage medium recording program for executing relating information retrieval processing |
JP2001045445A (en) * | 1999-07-29 | 2001-02-16 | Nippon Telegr & Teleph Corp <Ntt> | Live video image transmission reception system. live video image transmitter and receiver |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9497492B2 (en) | 2013-03-15 | 2016-11-15 | Ricoh Company, Limited | Distribution control system, distribution system, distribution control method, and computer-readable storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP2007325282A (en) | 2007-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4000844B2 (en) | Content distribution system, content distribution system distribution server and display terminal, and content distribution program | |
US10187668B2 (en) | Method, system and server for live streaming audio-video file | |
KR100943128B1 (en) | Mpeg-4 remote communication device | |
KR100826156B1 (en) | Apparatus and method for wallpaper setting of audio channel in a digital multimedia broadcasting service | |
JP5576667B2 (en) | Information transmission display system | |
EP2479982A1 (en) | Closed captioning language translation | |
US20160261927A1 (en) | Method and System for Providing and Displaying Optional Overlays | |
US11812100B2 (en) | Apparatus, systems and methods for accessing information based on an image presented on a display | |
KR100767673B1 (en) | Digital Broadcasting Terminal with Emboding Slide Show and Method of Emboding Slide Show Using Same | |
CN105263031A (en) | System and method for distributing auxiliary data embedded in video data | |
US20150350565A1 (en) | Techniques for magnifying a high resolution image | |
JP4655065B2 (en) | Content distribution system, content distribution system distribution server and display terminal, and content distribution program | |
CN102088631B (en) | Live and demand broadcast method of digital television (TV) programs as well as related device and system | |
KR20180105026A (en) | Electronic apparatus and the control method thereof | |
CN101632069A (en) | Be used to present the method and system of the information relevant with recorded content | |
US6665318B1 (en) | Stream decoder | |
CN115580738B (en) | High-resolution video display method, device and system for on-demand transmission | |
KR100926911B1 (en) | Method and system for providing advertisement in digital broadcasting | |
KR20070076781A (en) | Method and apparatus for data communication using settop-box | |
KR20040046537A (en) | Method for harmfulness information interception of video on demand service | |
JP2002540657A (en) | Coding hot spots into television signals | |
JP2005091571A (en) | Display controller and display system | |
KR20090002810A (en) | Method for storing the broadcast on a data broadcast and a imaging apparatus having the same | |
CN115225928A (en) | Multi-type audio and video mixed broadcasting system and method | |
KR101181764B1 (en) | Method for Providing Image Contents and Digital Broadcasting Terminal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20080613 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20090511 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100907 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101207 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140107 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4655065 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |