JP4655065B2 - Content distribution system, content distribution system distribution server and display terminal, and content distribution program - Google Patents

Content distribution system, content distribution system distribution server and display terminal, and content distribution program Download PDF

Info

Publication number
JP4655065B2
JP4655065B2 JP2007158882A JP2007158882A JP4655065B2 JP 4655065 B2 JP4655065 B2 JP 4655065B2 JP 2007158882 A JP2007158882 A JP 2007158882A JP 2007158882 A JP2007158882 A JP 2007158882A JP 4655065 B2 JP4655065 B2 JP 4655065B2
Authority
JP
Japan
Prior art keywords
video content
character information
character
image
display terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007158882A
Other languages
Japanese (ja)
Other versions
JP2007325282A (en
Inventor
浩三 里田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007158882A priority Critical patent/JP4655065B2/en
Publication of JP2007325282A publication Critical patent/JP2007325282A/en
Application granted granted Critical
Publication of JP4655065B2 publication Critical patent/JP4655065B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明は、伝送路を介して映像コンテンツを配信サーバから利用者の表示端末に配信するシステムに関し、特に、携帯通信端末等の表示部の狭い表示端末に対し配信を行なうコンテンツ配信システムとその配信サーバ及び表示端末、コンテンツ配信プログラムに関する。   The present invention relates to a system for distributing video content from a distribution server to a user's display terminal via a transmission line, and in particular, a content distribution system for distributing to a display terminal having a narrow display unit such as a mobile communication terminal and the distribution thereof The present invention relates to a server, a display terminal, and a content distribution program.

図13は、従来の映像配信システムの構成を示すブロック図であり、映像を配信する映像配信サーバ60から、伝送路30を介して映像コンテンツを配信し、利用者の映像表示端末70が映像コンテンツを受信して提示する。   FIG. 13 is a block diagram showing a configuration of a conventional video distribution system, in which video content is distributed from a video distribution server 60 that distributes video via a transmission path 30, and the video display terminal 70 of the user receives the video content. Receive and present.

また、特開2000−324416号公報では、テレビ受像機においてその受信したテレビ放送からテロップ情報を抽出し、これをリモコン端末等の静止画表示端末に送信して表示することで、文字情報を高画質にみせる技術が提案されている。   Also, in Japanese Patent Laid-Open No. 2000-324416, telop information is extracted from a received television broadcast in a television receiver, and is transmitted to a still image display terminal such as a remote control terminal for display. Technologies that show image quality have been proposed.

テロップ情報は、ニュース番組のテロップ、映画の字幕などのテロップ情報など映像視聴時にストーリーや内容の理解に重要な情報が含まれていることが多く、これを高画質の読み易い画像により利用者に提示することは効果的である。   The telop information often contains information important for understanding the story and content when watching video, such as news program telop, movie subtitles, etc. Presenting is effective.

また、上記従来技術には含まれないが、テロップ情報だけでなく、CMの商品に書かれた商品名、ドラマの背景の看板や標識の文字など一般のシーンに存在するテロップ以外の文字情報を抽出することも有用である。   Although not included in the above-mentioned prior art, not only telop information but also character information other than telop existing in general scenes such as product names written on commercial products, signs of signs of drama, signs and signs, etc. It is also useful to extract.

上記の特開2000−324416号公報の従来技術の対象は一般のテレビ放送であるが、最近ではインターネットの高速化、特に無線通信の高速化により、家庭のPC、あるいは外出先の携帯電話において、映画広告、音楽プロモーションビデオなど、蓄積された映像クリップを見ることができるようになってきている。また、Webカメラなどと称して、観光地や道路に設置したカメラの映像をインターネットで配信するといった、ライブ映像の配信も行われている。   The subject of the prior art disclosed in the above Japanese Patent Laid-Open No. 2000-324416 is a general television broadcast, but recently, due to the speeding up of the Internet, particularly the speeding up of wireless communication, It has become possible to see accumulated video clips such as movie advertisements and music promotion videos. In addition, live video distribution such as the distribution of video from a camera installed on a sightseeing spot or road, such as a Web camera, is also performed.

このような映像をそのまま配信するためには非常に広帯域な通信路が必要であるが、画像の圧縮符号化技術により、情報量を削減できる。例えば、64kbps程度の帯域のインターネットでも、圧縮した映像を配信してそれを受けた端末で復号することにより、映像の閲覧ができる。   In order to distribute such video as it is, a very wide-band communication channel is required, but the amount of information can be reduced by image compression coding technology. For example, even on the Internet having a bandwidth of about 64 kbps, it is possible to view the video by distributing the compressed video and decoding it with a terminal that receives the compressed video.

しかし、64kbps程度の低ビットレートで映像を送信するためには、映像の解像度を落としたり、映像の品質を落としたりして映像の符号化を行ない、携帯端末や家庭のPCに送信している。このように解像度を落としたり、画質を落とすと、映像中に含まれる文字情報が不明瞭になり、非常に読みにくくなる。   However, in order to transmit a video at a low bit rate of about 64 kbps, the video is encoded by reducing the resolution of the video or the quality of the video, and the encoded video is transmitted to a portable terminal or a home PC. . If the resolution is lowered or the image quality is lowered as described above, the character information included in the video becomes unclear and becomes very difficult to read.

先に述べたように文字情報は映像視聴に重要な情報が含まれるが、文字情報が読みにくくなると映像視聴に支障をきたすこともありうる。
特開2000−324416号公報
As described above, the text information includes information important for video viewing. However, if the text information becomes difficult to read, video viewing may be hindered.
JP 2000-324416 A

上述したように従来の技術では、以下に述べるような問題点があった。   As described above, the conventional techniques have the following problems.

従来では、低ビットレートで映像コンテンツを配信する時に、テロップ情報をはじめとした文字情報を抽出して高画質に符号化して配信し、それを利用者の端末に表示させる技術が存在しなかった。例えば、特開2000−324416号公報の従来技術では、受信した一般のテレビ放送からテロップを抽出するものの、携帯通信端末等が再生する低ビットレートで配信される映像コンテンツに対しては、既に文字が不明瞭な状態で配信されるためテロップ抽出を行なうことができなかった。   Conventionally, when distributing video content at a low bit rate, there has been no technology that extracts text information including telop information, encodes and distributes it with high image quality, and displays it on the user's terminal . For example, in the prior art disclosed in Japanese Patent Laid-Open No. 2000-324416, a telop is extracted from a received general television broadcast. However, for video content distributed at a low bit rate reproduced by a mobile communication terminal or the like, text has already been written. Telop extraction could not be performed because is distributed in an unclear state.

本発明の目的は、上記従来技術の欠点を解決し、低ビットレートで配信される映像コンテンツにおいても、受信側の表示端末が文字を明瞭に表示して利用者に提示することのできるコンテンツ配信システムとその配信サーバ及び表示端末、コンテンツ配信プログラムを提供することにある。   An object of the present invention is to solve the above-mentioned drawbacks of the prior art, and even for video content distributed at a low bit rate, content distribution that can be displayed to the user by the display terminal on the receiving side clearly displaying characters To provide a system, its distribution server, display terminal, and content distribution program.

本発明のコンテンツ配信システムの第1の態様は、配信サーバから表示端末に対し映像コンテンツを配信するコンテンツ配信システムにおいて、前記配信サーバが、映像コンテンツの画像から文字が表示される領域を検出し、検出した前記領域の画像のコントラストを高めた画像を、前記映像コンテンツの文字情報として生成し、前記映像コンテンツと同時に、生成した文字情報を前記表示端末に配信し、前記表示端末が、前記配信サーバから受信した前記映像コンテンツの文字情報を、同時に受信した前記映像コンテンツと共に提示することを特徴とする。According to a first aspect of the content distribution system of the present invention, in the content distribution system that distributes video content from a distribution server to a display terminal, the distribution server detects an area in which characters are displayed from an image of the video content, An image in which the contrast of the detected image of the region is increased is generated as character information of the video content, and the generated character information is distributed to the display terminal simultaneously with the video content, and the display terminal is connected to the distribution server. The character information of the video content received from the video content is presented together with the video content received simultaneously.

本発明のコンテンツ配信システムの第2の態様は、配信サーバから表示端末に対し映像コンテンツを配信するコンテンツ配信システムにおいて、前記配信サーバが、映像コンテンツの画像から文字が表示される領域を検出し、検出した前記領域の画像のビットレートを高くし、画質を高めた画像を、前記映像コンテンツの文字情報として生成し、、前記映像コンテンツと同時に、生成した文字情報を前記表示端末に配信し、前記表示端末が、前記配信サーバから受信した前記映像コンテンツの文字情報を、同時に受信した前記映像コンテンツと共に提示することを特徴とするAccording to a second aspect of the content distribution system of the present invention, in the content distribution system that distributes video content from the distribution server to the display terminal, the distribution server detects an area in which characters are displayed from an image of the video content, Increasing the bit rate of the image of the detected area and generating an image with improved image quality as character information of the video content, and simultaneously distributing the generated character information to the display terminal simultaneously with the video content, The display terminal presents the character information of the video content received from the distribution server together with the video content received simultaneously.

本発明のコンテンツ配信システムの第3の態様は、配信サーバから表示端末に対し映像コンテンツを配信するコンテンツ配信システムにおいて、前記配信サーバが、映像コンテンツの画像から文字が表示される領域を検出し、検出した前記領域の画像を別の符号化方式で符号化した画像を、前記映像コンテンツの文字情報として生成し、前記映像コンテンツと同時に、生成した文字情報を前記表示端末に配信し、前記表示端末が、前記配信サーバから受信した前記映像コンテンツの文字情報を、同時に受信した前記映像コンテンツと共に提示することを特徴とする。According to a third aspect of the content distribution system of the present invention, in the content distribution system that distributes video content from the distribution server to the display terminal, the distribution server detects an area in which characters are displayed from an image of the video content, An image obtained by encoding the detected image of the region by another encoding method is generated as character information of the video content, and simultaneously with the video content, the generated character information is distributed to the display terminal, and the display terminal The character information of the video content received from the distribution server is presented together with the video content received simultaneously.

本発明の配信サーバの第1の態様は、表示端末に対しコンテンツを配信する配信サーバにおいて、映像コンテンツの画像から文字が表示される領域を検出する手段と、検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、前記文字情報を生成する手段は、検出した前記領域に示される文字のテキストデータを文字認識により取得し、前記文字認識により取得した前記テキストデータを指定された言語に翻訳した翻訳文を、前記映像コンテンツの文字情報として生成することを特徴とする。According to a first aspect of the distribution server of the present invention, in the distribution server that distributes the content to the display terminal, the means for detecting an area where characters are displayed from the image of the video content, and the video content from the detected area A means for generating character information; and a means for delivering the video content to the display terminal simultaneously with the generated character information. The means for generating the character information is a text of the character indicated in the detected area. Data is acquired by character recognition, and a translated sentence obtained by translating the text data acquired by character recognition into a specified language is generated as character information of the video content.

本発明の配信サーバの第2の態様は、表示端末に対しコンテンツを配信する配信サーバにおいて、映像コンテンツの画像から文字が表示される領域を検出する手段と、検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、前記文字情報を生成する手段は、検出した前記領域の画像のコントラストを高めた画像を、前記映像コンテンツの文字情報として生成することを特徴とする。According to a second aspect of the distribution server of the present invention, in the distribution server that distributes the content to the display terminal, the means for detecting an area where characters are displayed from the image of the video content, and the video content from the detected area A means for generating character information; and a means for distributing the video content to the display terminal simultaneously with the generated character information. The means for generating the character information increases the contrast of the detected image in the region. The generated image is generated as character information of the video content.

本発明の配信サーバの第3の態様は、表示端末に対しコンテンツを配信する配信サーバにおいて、映像コンテンツの画像から文字が表示される領域を検出する手段と、検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、前記文字情報を生成する手段は、検出した前記領域の画像を二値化した画像を、前記映像コンテンツの文字情報として生成することを特徴とする。According to a third aspect of the distribution server of the present invention, in the distribution server that distributes the content to the display terminal, the means for detecting an area in which characters are displayed from the image of the video content, and the video content from the detected area And a means for generating character information, and a means for delivering the video content to the display terminal simultaneously with the generated character information. The means for generating the character information binarizes the image of the detected area. The generated image is generated as character information of the video content.

本発明の配信サーバの第4の態様は、表示端末に対しコンテンツを配信する配信サーバにおいて、映像コンテンツの画像から文字が表示される領域を検出する手段と、検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、前記文字情報を生成する手段は、検出した前記領域の画像のビットレートを高くし、画質を高めた画像を、前記映像コンテンツの文字情報として生成することを特徴とする。According to a fourth aspect of the distribution server of the present invention, in the distribution server that distributes the content to the display terminal, the means for detecting an area in which characters are displayed from the image of the video content, and the video content from the detected area And a means for generating character information, and a means for distributing the video content to the display terminal simultaneously with the generated character information. The means for generating the character information sets the bit rate of the image of the detected area. An image having a high image quality and a high image quality is generated as character information of the video content.

本発明の配信サーバの第5の態様は、表示端末に対しコンテンツを配信する配信サーバにおいて、映像コンテンツの画像から文字が表示される領域を検出する手段と、検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、前記文字情報を生成する手段は、検出した前記領域の画像を別の符号化方式で符号化した画像を、前記映像コンテンツの文字情報として生成することを特徴とする配信サーバ。According to a fifth aspect of the distribution server of the present invention, in the distribution server that distributes the content to the display terminal, the means for detecting an area where characters are displayed from the image of the video content, and the video content from the detected area Means for generating character information; and means for distributing the video content to the display terminal simultaneously with the generated character information, wherein the means for generating the character information uses a different code for the detected image of the region. A distribution server characterized in that an image encoded by an encoding method is generated as character information of the video content.

本発明の表示端末の第1の態様は、配信サーバから、映像コンテンツの画像に表示される文字から映像コンテンツとは別に生成された文字情報と当該映像コンテンツとを同時に受信する手段と、受信した前記文字情報と前記映像コンテンツとを共に提示する手段を備え、前記映像コンテンツの文字情報が、前記映像コンテンツから検出された前記領域、文字の特徴を示す文字補助情報を含み、前記配信サーバから受信した前記映像コンテンツの文字情報を、前記文字情報に含まれる前記文字補助情報に基づいて提示する手段を備えることを特徴とする。According to a first aspect of the display terminal of the present invention, the distribution server receives from the distribution server the character information generated separately from the video content from the characters displayed on the video content image and the video content at the same time. Means for presenting both the character information and the video content, wherein the character information of the video content includes character auxiliary information indicating characteristics of the area and characters detected from the video content, and is received from the distribution server; And a means for presenting the character information of the video content based on the character auxiliary information included in the character information.

以上説明したように本発明によれば、低ビットレートで配信される映像コンテンツにおいても、配信サーバで映像コンテンツ中から文字情報を抽出し、それを映像コンテンツとは別にテキストデータや高画質な符号化方法を用いて符号化した画像により配信することにより、利用者に映像コンテンツの内容をわかりやすく提示することができる。   As described above, according to the present invention, even for video content distributed at a low bit rate, character information is extracted from the video content by the distribution server, and is separated from the video content with text data and high-quality code. By distributing with an image encoded using the conversion method, the contents of the video content can be presented to the user in an easy-to-understand manner.

このため、表示端末には文字抽出を行なうための処理能力を必要とせず、更に携帯通信端末等の表示画面の狭い表示端末においても、映像コンテンツの中の文字を明瞭に表示することができ、利用者に映像コンテンツの内容をわかりやすく提示することができる。   For this reason, the display terminal does not require processing ability to perform character extraction, and even in a display terminal with a narrow display screen such as a mobile communication terminal, the characters in the video content can be clearly displayed. The contents of video content can be presented to the user in an easy-to-understand manner.

以下、本発明の実施の形態について図面を参照して詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本発明の第1の実施の形態によるコンテンツ配信システムの構成を示すブロック図であり、本実施の形態の配信サーバ10及び表示端末20の構成も示している。   FIG. 1 is a block diagram showing the configuration of the content distribution system according to the first embodiment of the present invention, and also shows the configuration of the distribution server 10 and the display terminal 20 of the present embodiment.

図1を参照すると、本実施の形態の配信サーバ10は、プログラム制御されるCPU等で実現され、映像入力部11、映像符号化部12、文字抽出部13、映像送信部14、文字送信部15を備えている。本実施の形態の表示端末20は、プログラム制御されるCPU等で実現され、映像受信部21、映像復号部22、映像表示部23、文字受信部24、文字復号部25、文字表示部26を備えている。   Referring to FIG. 1, a distribution server 10 according to the present embodiment is realized by a program-controlled CPU or the like, and includes a video input unit 11, a video encoding unit 12, a character extraction unit 13, a video transmission unit 14, and a character transmission unit. 15 is provided. The display terminal 20 of the present embodiment is realized by a program-controlled CPU or the like, and includes a video receiving unit 21, a video decoding unit 22, a video display unit 23, a character receiving unit 24, a character decoding unit 25, and a character display unit 26. I have.

配信サーバ10が対象とする映像コンテンツは、テレビ放送等のライブコンテンツでもよいし、映画の予告映像など既に符号化されて蓄積された映像コンテンツでもよい。   The video content targeted by the distribution server 10 may be a live content such as a television broadcast, or a video content that has already been encoded and stored, such as a preview video of a movie.

配信サーバ10と表示端末20を結ぶ伝送路30として、特に制限はないが、ここでは携帯電話やPHSなどの一般無線回線、ISDNなどの一般電話回線での利用を想定し、64kbps〜384kbps程度である場合を例に説明する。   The transmission path 30 connecting the distribution server 10 and the display terminal 20 is not particularly limited, but here it is assumed to be used on a general wireless line such as a mobile phone or PHS, or a general telephone line such as ISDN, and is about 64 kbps to 384 kbps. A case will be described as an example.

図2は、本実施の形態の配信サーバ10の動作を説明するためのフローチャートであり、図3は、本実施の形態の表示端末20の動作を説明するためのフローチャートである。   FIG. 2 is a flowchart for explaining the operation of the distribution server 10 of the present embodiment, and FIG. 3 is a flowchart for explaining the operation of the display terminal 20 of the present embodiment.

本実施の形態の配信サーバ10は、映像入力部11に映像コンテンツが入力され(ステップ201)、文字抽出部13により映像コンテンツ中に文字が表示されている領域(文字領域)を検出し、その文字を確認するために用いる文字情報を生成する(ステップ202)。そして、映像コンテンツを映像符号化部12で符号化し(ステップ203)、映像送信部14が表示端末20へ符号化した映像コンテンツを送信し、同時に文字送信部15が表示端末20へ文字情報を送信する(ステップ204)。   The distribution server 10 according to the present embodiment receives video content in the video input unit 11 (step 201), detects a region (character region) where characters are displayed in the video content by the character extraction unit 13, and Character information used to confirm the character is generated (step 202). Then, the video content is encoded by the video encoding unit 12 (step 203), the video transmission unit 14 transmits the encoded video content to the display terminal 20, and at the same time, the character transmission unit 15 transmits the character information to the display terminal 20. (Step 204).

表示端末20は、配信サーバ10から送信された映像情報(映像コンテンツ)を映像受信部21により受信し、文字情報を文字受信部24により受信する(ステップ301)。そして、映像復号部22でその映像コンテンツを復号し、文字復号部25でその文字情報を復号する(ステップ302)。そして、映像表示部23で映像コンテンツを表示し、文字表示部26で文字情報を表示して、これらを利用者に提示する(ステップ303)。これにより、表示端末20の利用者は、映像情報及び文字情報を見ることができる。   The display terminal 20 receives the video information (video content) transmitted from the distribution server 10 by the video receiving unit 21 and the character information by the character receiving unit 24 (step 301). Then, the video decoding unit 22 decodes the video content, and the character decoding unit 25 decodes the character information (step 302). Then, the video content is displayed on the video display unit 23, the character information is displayed on the character display unit 26, and these are presented to the user (step 303). Thereby, the user of the display terminal 20 can see video information and character information.

本実施の形態では、配信サーバ10から表示端末20へ映像コンテンツ及び文字情報を送信するための伝送路として、共通の伝送路30を用いているが、特に共通の伝送路30とする方式に限定する必要はない。例えば、映像コンテンツと文字情報を同じ携帯電話のパケット交換を利用して送信する方式以外にも、文字情報のみを携帯電話のパケット交換、映像コンテンツは携帯電話の回線交換を利用して送信することも可能である。   In the present embodiment, the common transmission path 30 is used as a transmission path for transmitting video content and text information from the distribution server 10 to the display terminal 20, but the method is limited to the common transmission path 30. do not have to. For example, in addition to the method of transmitting video content and text information using packet switching of the same mobile phone, only text information should be transmitted using mobile phone packet switching, and video content should be transmitted using mobile phone line switching. Is also possible.

ここで、映像コンテンツと文字情報とを異なる伝送路で配信する場合には、映像コンテンツはテレビ電話のような端末で視聴するが、文字情報はインターネットで受信するといった利用形態等も実施することができる。   Here, when video content and character information are distributed through different transmission paths, the video content is viewed on a terminal such as a videophone, but the character information is received on the Internet. it can.

また、映像コンテンツと文字情報とを共通の伝送路30で配信する場合は、本発明の第2の実施の形態に示すように、映像コンテンツと文字情報とを多重化し配信する方式を採用することができる。   Further, when distributing video content and character information through a common transmission line 30, a method of multiplexing and distributing video content and character information as shown in the second embodiment of the present invention is adopted. Can do.

図4は、本発明の第2の実施の形態によるコンテンツ配信システムの構成を示すブロック図である。本実施の形態では、配信サーバ10aにおいて、第1の実施の形態の映像送信部14と文字送信部15の替わりに多重化部16と送信部17を備え、表示端末20aにおいて、第1の実施の形態の映像受信部21と文字受信部24の変わりに受信部27と多重化分離部28を備えている。   FIG. 4 is a block diagram showing a configuration of a content distribution system according to the second embodiment of the present invention. In the present embodiment, the distribution server 10a includes a multiplexing unit 16 and a transmission unit 17 instead of the video transmission unit 14 and the character transmission unit 15 of the first embodiment, and the display terminal 20a performs the first implementation. The receiving unit 27 and the demultiplexing unit 28 are provided instead of the video receiving unit 21 and the character receiving unit 24 of the form.

図5は、本実施の形態の配信サーバ10aの動作を説明するためのフローチャートであり、図6は、本実施の形態の表示端末20aの動作を説明するためのフローチャートである。   FIG. 5 is a flowchart for explaining the operation of the distribution server 10a of the present embodiment, and FIG. 6 is a flowchart for explaining the operation of the display terminal 20a of the present embodiment.

図5、図6を参照すると本実施の形態の動作の第1の実施の形態との違いは、配信サーバ10aは、映像符号化部12で符号化した映像コンテンツ及び、文字抽出部13で抽出した文字情報を多重化部16で多重化し(ステップ404)、送信部17で表示端末20aでその多重化したコンテンツを送信する(ステップ405)点が異なる。表示端末20aは、受信部27で受信した多重化されたコンテンツを(ステップ501)、多重化分離部28で映像コンテンツと文字情報とに分離し(ステップ502)、その分離した映像コンテンツと文字情報のそれぞれを復号し表示する(ステップ503、504)点が異なる。   Referring to FIGS. 5 and 6, the difference between the operation of the present embodiment and the first embodiment is that the distribution server 10 a extracts the video content encoded by the video encoding unit 12 and the character extraction unit 13. The multiplexed character information is multiplexed by the multiplexing unit 16 (step 404), and the transmission unit 17 transmits the multiplexed content by the display terminal 20a (step 405). The display terminal 20a separates the multiplexed content received by the receiving unit 27 (step 501) into video content and character information by the demultiplexing unit 28 (step 502), and the separated video content and character information. These are different in that they are decoded and displayed (steps 503 and 504).

多重化を行なう方法としては、ITU−Tによって定められたテレビ電話を行なうための標準規格であるH.324/Mなどを用いて、映像や音声の情報とテキスト情報を多重化することが可能である。   As a method of multiplexing, H.264, which is a standard for making a videophone call defined by ITU-T. It is possible to multiplex video and audio information and text information using 324 / M or the like.

また、ここではライブ映像や蓄積映像を読み出した映像コンテンツを映像入力部11に入力して配信する方式であるが、映像符号化部12や文字抽出部13で処理した結果を蓄積しておき、利用者からの要求があった時に蓄積済みの映像コンテンツを読み出す方式も、同様に実施することができる。   In addition, here, the video content obtained by reading live video or stored video is input to the video input unit 11 and distributed. However, the results processed by the video encoding unit 12 and the character extraction unit 13 are accumulated, A method of reading out the stored video content when requested by the user can be similarly implemented.

次に、図7を用いて、配信サーバ10aが映像コンテンツから生成した文字情報とその映像コンテンツとを配信し、表示端末20aで表示する方法について説明する。なおここでの説明は、第2の実施の形態のみではなく、第1の実施の形態においても同様である。   Next, with reference to FIG. 7, a description will be given of a method in which the distribution server 10a distributes the character information generated from the video content and the video content and displays them on the display terminal 20a. The description here applies not only to the second embodiment but also to the first embodiment.

図7では、利用者がニュース番組を視聴している場面を示しており、図7の(1)のオリジナル画像には、ニュース番組はアナウンサーの映像とそれにニュースのヘッドラインを示すテロップが重畳されている。   FIG. 7 shows a scene in which a user is watching a news program. In the original image of (1) in FIG. 7, a news program is superimposed with an announcer video and a telop indicating a news headline. ing.

ここでは文字情報として、テロップ情報を対象にして説明をするが、テロップではない映像シーン中の看板の文字など一般の文字、データ放送や文字放送などで映像に多重化されてきた文字なども同様に対象とすることができる。   Here, we will explain telop information as text information. However, the same applies to general text such as signboard characters in video scenes that are not telop, as well as text that has been multiplexed on video by data broadcasting or text broadcasting. Can be targeted.

図7の表示画面20−3aには、従来のようにそのまま映像を符号化して送信した場合の、表示端末20aにおける表示の一例を示している。   The display screen 20-3a in FIG. 7 shows an example of display on the display terminal 20a when the video is encoded and transmitted as it is as in the prior art.

ここで伝送路30は、64kbps〜384kbps程度の低ビットレートの伝送路30であり、このような低ビットレートの伝送路30を用いて符号化した映像を送信するためには、以下の(1)(2)のような符号化方法を用いる必要がある。(1)入力映像の解像度を低くして、符号化する(2)符号化に必要なビットレートを下げ、画質を悪くする   Here, the transmission path 30 is a transmission path 30 with a low bit rate of about 64 kbps to 384 kbps. In order to transmit a video encoded using such a transmission path 30 with a low bit rate, the following (1 It is necessary to use an encoding method such as (2). (1) Decrease the resolution of the input video and encode it. (2) Decrease the bit rate required for encoding and degrade the image quality.

通常、テレビのニュース映像のテロップはテレビの解像度(例えば、720×480)で視聴することを前提としているため、携帯電話での映像配信によく用いられるQCIF(176×144)やCIF(352×288)といった解像度まで落としてしまうと文字が小さくなったり、潰れてしまい、非常に読みにくくなる。   Usually, television news video telops are premised on viewing at television resolution (eg, 720 × 480), so QCIF (176 × 144) and CIF (352 ×) often used for video distribution on mobile phones. If the resolution is reduced to 288), the characters become smaller or crushed and become very difficult to read.

また、画質を悪くすると、通常コントラストが低くなり、文字が不明瞭になる。例えばISO標準規格のMPEGでは、映像をブロックに分割しブロック単位で符号化を行なっているため、画質を悪くすると、各ブロックの境目が目立ち、更にブロックの中のコントラストも低くなる。このため、テロップ文字のようにコントラストが明瞭であることの必要な部分においても、そのコントラストが低くなることでその文字を読むことが困難になる。   Further, when the image quality is deteriorated, the contrast is usually lowered and the characters become unclear. For example, in the MPEG of the ISO standard, video is divided into blocks and encoding is performed in units of blocks. Therefore, if the image quality is deteriorated, the boundaries between the blocks become conspicuous, and the contrast in the blocks also decreases. For this reason, even in a portion that requires a clear contrast such as a telop character, it becomes difficult to read the character due to the low contrast.

図7では、携帯電話で映像を視聴する利用イメージを示しているが、これは表示画面の狭い携帯電話のみに発生する問題ではなく、低ビットレートの伝送路30を利用して映像配信を行なう時には表示端末20aがどのようなものでも起こりうる問題である。   Although FIG. 7 shows a usage image for viewing video on a mobile phone, this is not a problem that occurs only on a mobile phone with a narrow display screen, and video distribution is performed using a low-bit-rate transmission path 30. At times, any display terminal 20a can be a problem.

この問題は、低ビットレートで符号化を行なう時に、人物のような自然の映像と人工的な文字情報を同時に扱うために生じる問題と考えることができる。そこで本発明の第1、第2の実施の形態においては、映像コンテンツをそのまま送信するのではなく、図7の(2)に示されるように、配信サーバ10、10aにおいて映像コンテンツの画像から文字の表示される文字領域を検出し、その表示される文字を確認するために用いる情報(文字情報)を生成し、この文字情報を映像コンテンツと共に表示端末20、20aに配信する。   This problem can be considered as a problem caused by simultaneously handling a natural image such as a person and artificial character information when encoding at a low bit rate. Therefore, in the first and second embodiments of the present invention, the video content is not transmitted as it is, but characters are extracted from the video content image in the distribution servers 10 and 10a as shown in (2) of FIG. Is detected, information (character information) used for confirming the displayed character is generated, and the character information is distributed to the display terminals 20 and 20a together with the video content.

つまり、映像コンテンツは、表示画面20−3aの従来の場合と同様にしてオリジナル画像のまま送信するが、本実施の形態(及び第1の実施の形態)では、文字領域の文字を確認するために用いる情報(文字情報)を、映像コンテンツと別の方式で符号化などを行ない、送信する。   That is, the video content is transmitted as the original image as in the conventional case of the display screen 20-3a, but in this embodiment (and the first embodiment), the characters in the character area are confirmed. The information (character information) used for is encoded and transmitted using a method different from that for video content.

例えば、抽出した文字領域の映像に対して文字認識を行ない、表示されている文字のテキストデータを取得し、各文字をアスキーコードのような数値情報(文字コード)により示して送信することができる。表示画面20−3bは、このように分離して送信した場合における表示端末20aの表示の一例である。   For example, character recognition can be performed on the extracted image of the character area, text data of the displayed characters can be acquired, and each character can be indicated by numerical information (character code) such as an ASCII code and transmitted. . The display screen 20-3b is an example of the display of the display terminal 20a when transmitted separately in this way.

テキストデータ(文字コード)で送信することで通信量は少なくなり、また、表示端末20aでは任意の大きさで表示できるので、大きく表示して読みやすくすること等ができる。   By transmitting text data (character code), the amount of communication is reduced, and the display terminal 20a can display an arbitrary size, so that it can be displayed in a large size for easy reading.

この文字認識の処理は、現在販売されているOCRソフトウェア等に用いられている技術や、その他従来の技術を用いて実施することができる。   This character recognition processing can be performed using a technique used in currently sold OCR software or the like, or other conventional techniques.

また、上記のように文字認識技術を用いる場合には、文字認識の自動処理において文字の認識を間違えることが多くあるので、文字情報として、文字認識により得たテキストデータではなく文字の表示されている文字領域の画像を送信する方式も有効である。   In addition, when character recognition technology is used as described above, character recognition is often mistaken in automatic character recognition processing, so characters are displayed as character information instead of text data obtained by character recognition. A method of transmitting an image of a character area is also effective.

この場合、全体の画像は低解像度であるが、抽出した文字領域の部分だけ高解像度で符号化して送信することで、図7の表示画面20−3cに示されるように読みやすく表示することができる。図7の表示画面20−3cでは、高解像度の文字領域の映像を全体の映像コンテンツの下に表示している。   In this case, the entire image has a low resolution, but only the extracted character region portion is encoded at a high resolution and transmitted, so that it can be displayed in an easy-to-read manner as shown in the display screen 20-3c in FIG. it can. On the display screen 20-3c of FIG. 7, a high-resolution video of the character area is displayed below the entire video content.

また、通常テロップ情報は人が読むことができるように数秒間は同じテロップが流れていることが多いため、これを利用して、テロップ情報が変化した時だけ新たに文字情報を送信する等の制御を行なうことが可能である。高解像度で符号化した画像をそのまま送信すると、伝送路30の容量を圧迫することなるが、このようにしてその送信頻度を下げて文字領域の映像を伝送することにより、その帯域を小さくすることができる。   In addition, since normal telop information often flows the same telop for a few seconds so that people can read it, this can be used to send new text information only when the telop information changes. Control can be performed. If an image encoded at a high resolution is transmitted as it is, the capacity of the transmission path 30 will be reduced. In this way, by reducing the transmission frequency and transmitting the image of the character area, the band can be reduced. Can do.

また、抽出した文字領域のカラー画像をそのまま送信するのではなく、その画像を二値化して文字は黒、背景は白とする等による二値の画像に減色した上で符号化して送信することにより、更に伝送量を下げることができる。   Also, instead of transmitting the extracted color image of the character area as it is, the image is binarized, the character is black, the background is white, etc. Thus, the transmission amount can be further reduced.

このように、文字領域を高解像度で符号化するためには、動画像の符号化方式であるMPEG等を用いることができる。また更に、静止画の符号化方式であるJPEGやJPEG2000を用いたり、二値画像に対してはJBIGなどの符号化方式を用いることもできる。   Thus, in order to encode the character area with high resolution, MPEG or the like, which is a moving image encoding method, can be used. Still further, JPEG or JPEG2000, which are encoding methods for still images, can be used, and encoding methods such as JBIG can be used for binary images.

本実施の形態の文字抽出部13は、文字領域の抽出を行なうが、その文字領域抽出方法としては従来から実施されている技術を用いることができる。   The character extraction unit 13 according to the present embodiment extracts a character area. As a method for extracting the character area, a conventionally implemented technique can be used.

例えば、テロップ情報は、以下の(1)〜(3)に示されるような特徴があるので、このような特徴を利用して抽出を行なうことができる。(1)白い文字を使うことが多い(2)動きが少ない(3)文字は単独で現れずに複数の文字がまとまっている   For example, since the telop information has the characteristics as shown in the following (1) to (3), extraction can be performed using such characteristics. (1) Many white characters are used. (2) There is little movement. (3) Characters do not appear independently but multiple characters are grouped.

また、文字抽出部13は、文字領域の抽出や文字領域の文字認識を行なうだけでなく、文字領域の映像中の位置の抽出や文字領域の文書レイアウト構造を解析することも可能であり、文字抽出部13が文字領域の位置やレイアウト構造等を抽出し、文字送信部15で送信することができる。   The character extraction unit 13 can extract not only the character area and character recognition of the character area but also extract the position of the character area in the video and analyze the document layout structure of the character area. The extraction unit 13 can extract the position of the character area, the layout structure, and the like, and can be transmitted by the character transmission unit 15.

このような文字領域の映像コンテンツ中の位置や文字領域のレイアウト構造を、文字補助情報と呼ぶことにする。また、文字情報には、以上説明した文字領域の画像(映像)や文字認識により取得したテキストデータ等に加えて、文字補助情報を含むこととする。   Such a position of the character area in the video content and the layout structure of the character area are referred to as character auxiliary information. The character information includes character auxiliary information in addition to the above-described image (video) of the character area, text data acquired by character recognition, and the like.

以上はテロップ情報や映像シーン中の文字情報の抽出に関する説明であるが、データ放送等の文字が映像に多重化されている場合においてはこのような処理は必要ではなく、文字抽出部13が、データ放送等において多重化されている文字情報を分離してテキストデータを抽出する方式も可能である。   The above is the explanation regarding the extraction of the telop information and the character information in the video scene. However, when characters such as data broadcasting are multiplexed on the video, such processing is not necessary, and the character extraction unit 13 A method of extracting text data by separating character information multiplexed in data broadcasting or the like is also possible.

図7では文字情報と映像情報を分離して送信することで、利用者が文字情報を明瞭に読むことができることを説明したが、図8を用いて利用者への文字情報の提示方法を示す。   In FIG. 7, it has been explained that the user can clearly read the character information by transmitting the character information and the video information separately, but FIG. 8 shows a method of presenting the character information to the user. .

図8の表示画面20−4aは、文字情報等を表示することなく、従来と同様にして通常の映像を表示している場合である。この状態では、利用者には映像コンテンツ以外に情報は提示されない。また、従来においても、表示画面20−4bに示されるようにして、表示中の映像のチャンネル番号や番組名など一般的な情報を(文字放送等を利用して)表示させることにより、利用者が何を視聴しているのかを分かるようにする従来技術がある。本実施の形態の表示端末20aは、通常は表示画面20−4aや表示画面20−4bのような表示を行なっている。   The display screen 20-4a in FIG. 8 is a case where a normal image is displayed in the same manner as in the past without displaying character information or the like. In this state, no information other than video content is presented to the user. Further, conventionally, as shown on the display screen 20-4b, by displaying general information such as a channel number of a video being displayed and a program name (using text broadcasting or the like), a user can be displayed. There is a conventional technique that makes it possible to understand what is watching. The display terminal 20a of the present embodiment normally performs display such as the display screen 20-4a and the display screen 20-4b.

ここで、利用者がテロップなど文字情報が不明瞭だと感じた場合、配信サーバ10aからその文字情報を受信して、映像コンテンツとは別に表示する。   Here, when the user feels that the character information such as a telop is unclear, the character information is received from the distribution server 10a and displayed separately from the video content.

また、表示端末20aは、配信サーバ10aから送信されてくる文字情報を常時受信する方式も可能であるが、ここでは本実施の形態を、帯域の節約のため通常は文字情報を受信せずに、必要な時だけ配信サーバ10aに文字情報送信要求を出し文字情報を受信する方式により説明する。   Further, the display terminal 20a may be configured to always receive the character information transmitted from the distribution server 10a. However, here, the present embodiment does not normally receive the character information in order to save bandwidth. A description will be given of a method in which a character information transmission request is issued to the distribution server 10a only when necessary, and character information is received.

表示端末20aは、配信サーバ10aに文字情報の要求を出すことで、配信サーバ10aから映像中の文字情報の配信を受け付けて、その文字情報を表示する。   The display terminal 20a issues a character information request to the distribution server 10a, thereby accepting distribution of the character information in the video from the distribution server 10a and displaying the character information.

文字情報は、文字認識等により得られたテキストデータで送信されてくる場合と、高画質の画像により送信される場合があり、配信サーバ10aの能力によって使い分けてもよいが、利用者が文字情報の送信を配信サーバ10aに要求を出したように、文字認識した結果と画像のままのどちらが欲しいかを選択できるようにしてもよい。   The character information may be transmitted as text data obtained by character recognition or the like, or may be transmitted as a high-quality image, and may be properly used depending on the capability of the distribution server 10a. It may be possible to select whether the result of character recognition or the image is desired as if a request for transmission is sent to the distribution server 10a.

表示画面20−4cは、受信した文字情報が文字認識されてテキストデータで送信されてきた場合の表示例であり、映像コンテンツに隣り合わせて、その文字情報を表示させている。また、表示画面20−4bのように番組情報等を表示している場合は、その番組情報等と文字情報とを切り替えて表示させることにより、狭い画面でも効率よく利用することができる。   The display screen 20-4c is a display example when the received character information is recognized and transmitted as text data, and the character information is displayed next to the video content. Further, when program information or the like is displayed as in the display screen 20-4b, the program information or the like and character information can be switched and displayed, so that even a narrow screen can be used efficiently.

また、表示画面20−4cでは、文字情報が短いため、タイル状に並べて映像情報と文字情報を表示することができているが、文字情報が長い場合は、文字を縦方向、横方向、あるいは両者にスクロールさせて表示させてもよい。   On the display screen 20-4c, since the character information is short, the video information and the character information can be displayed in a tiled manner. However, if the character information is long, the character is displayed in the vertical direction, the horizontal direction, or You may scroll and display both.

また、表示画面20−4cのようにタイル状に並べるのではなく、映像の上に文字情報の一部が重なるように配置してもよい。更に、配信サーバ10aから文字補助情報として文字情報の映像中での位置を受信している場合は、表示画面20−4fに示されるように文字情報を元の映像の位置に重畳して表示することもできる。   Further, instead of arranging them in a tile shape as in the display screen 20-4c, they may be arranged so that part of the character information overlaps on the video. Further, when the position of the character information in the video is received as the auxiliary character information from the distribution server 10a, the character information is displayed superimposed on the position of the original video as shown on the display screen 20-4f. You can also

次に、配信サーバ10aが、映像コンテンツ中に文字が表示される領域を複数個所検出した場合の処理を説明する。   Next, processing when the distribution server 10a detects a plurality of areas where characters are displayed in the video content will be described.

この場合、配信サーバ10aは、検出された映像コンテンツ中の全ての文字情報を表示端末20aに配信することも可能であるが、これ以外にも利用者が指定した領域中の文字情報のみを配信する方式も可能である。   In this case, the distribution server 10a can distribute all the character information in the detected video content to the display terminal 20a, but also distributes only the character information in the area designated by the user. It is also possible to do this.

この場合の動作の一実施例を説明する。配信サーバ10aは、表示端末20aに対し、各領域の文字や文章のレイアウト情報や検出された各領域の位置情報といった文字補助情報を含めて送信する。そして、表示端末20aにおいて、その文字補助情報を利用して利用者が文字情報を見たい領域を選択し配信サーバ10aに通知する。そして、配信サーバ10aは、その表示端末20aから通知された利用者が選択した領域から、文字情報を生成して表示端末20aに配信する。   An example of the operation in this case will be described. The distribution server 10a transmits to the display terminal 20a including character auxiliary information such as layout information of characters and sentences in each region and position information of each detected region. Then, on the display terminal 20a, using the character auxiliary information, the user selects a region where the user wants to see the character information and notifies the distribution server 10a of the region. And the delivery server 10a produces | generates character information from the area | region which the user notified from the display terminal 20a selected, and delivers to the display terminal 20a.

また、文字補助情報がない場合にも、表示端末20aにおいて、配信サーバ10aに対し文字情報の切り替えを指示して順次切り替え、その各文字情報の内容を参照して選択する方式等が可能である。   Further, even when there is no character auxiliary information, it is possible to use a method in which the display terminal 20a instructs the distribution server 10a to switch the character information, sequentially switches, and selects the content by referring to the contents of each character information. .

このように、配信サーバ10aは、表示端末20aに全ての文字情報を配信するのではなく、表示端末20aから通知された見たい文字情報や、配信する文字情報の切り替えの指示等の文字情報送信の要求に基づいて、映像コンテンツ中のその要求された文字情報のみを配信することが可能である。   In this way, the distribution server 10a does not distribute all the character information to the display terminal 20a, but transmits character information such as the character information that the user wants to see notified from the display terminal 20a and an instruction to switch the character information to be distributed. It is possible to deliver only the requested character information in the video content based on the request.

この場合、配信サーバ10aは、映像コンテンツの画像から最初に検出された文字領域の文字情報を最初に表示端末20aに配信し、最初に表示端末20aで表示させることとしてもよいが、更に好ましくは映像コンテンツ中に表示される位置や文字認識した結果の文字情報の内容を基に、配信する順番を決定することとしてもよい。   In this case, the distribution server 10a may first distribute the character information of the character area first detected from the image of the video content to the display terminal 20a, and first display it on the display terminal 20a. The distribution order may be determined based on the position displayed in the video content and the content of character information obtained as a result of character recognition.

例えば、映像コンテンツの下部の中央に横書きで示される文字は、テロップである可能性が高いためその文字情報を最優先で配信することとし、逆に映像コンテンツの上部の左又は右の隅に狭い範囲で示される文字は、現在時刻の表示である可能性が高くその重要性が低いためこれ以外の他の文字情報を優先して配信する等が考えられる。   For example, text written horizontally in the lower center of video content is likely to be a telop, so the text information is distributed with the highest priority, and conversely, it is narrow in the left or right corner at the top of the video content. Since the character indicated by the range is likely to be the display of the current time and its importance is low, it is conceivable that other character information is preferentially distributed.

また、配信サーバ10aが表示端末20aに全ての文字情報を配信し、表示端末20aの側で表示する文字情報を選択する方式も可能である。   In addition, a method in which the distribution server 10a distributes all the character information to the display terminal 20a and selects the character information to be displayed on the display terminal 20a side is also possible.

また、表示画面20−4dに示すように、配信サーバ10aが、その文字認識した文字情報のテキストデータを指定された他の言語に自動翻訳して、その翻訳文を文字情報として表示端末20aに配信し表示させることもできる。   Further, as shown in the display screen 20-4d, the distribution server 10a automatically translates the text data of the character information recognized for the character into another designated language, and the translated sentence is displayed as character information on the display terminal 20a. It can also be distributed and displayed.

この自動翻訳は、翻訳ソフトウェア等における従来の技術を用いることで、表示画面20−4dに示される日本語から英語の場合や、英語から日本語等の様々な言語間の翻訳が可能である。このように抽出した文字情報を自動翻訳して配信することにより、様々な言語の映像コンテンツを提供するサービスが簡単になる。翻訳文を表示する表示方法は、表示画面20−4cの場合と同様である。   This automatic translation can translate between various languages such as Japanese to English or English to Japanese shown on the display screen 20-4d by using a conventional technique in translation software or the like. By automatically translating and distributing character information extracted in this way, a service for providing video contents in various languages is simplified. The display method for displaying the translation is the same as in the display screen 20-4c.

次に、表示画面20−4eに示すように、配信サーバ10aが文字情報をその文字の表示される領域の画像(映像)で配信する場合も、表示画面20−4cと同様にして映像コンテンツとは別のウィンドウにより文字情報を表示することができる。   Next, as shown in the display screen 20-4e, when the distribution server 10a distributes the character information as an image (video) in the area where the character is displayed, the video content and the content are displayed in the same manner as the display screen 20-4c. Can display character information in a separate window.

また、画面サイズより大きな文字情報の画像が配信された場合には、表示端末20aが文字情報の画像を縮小して表示させたり、詳細を見たい場合は拡大して縦方向や横方向などにスクロールさせて表示させること等が可能である。   When a character information image larger than the screen size is distributed, the display terminal 20a displays the image of the character information in a reduced size, or enlarges it in the vertical direction or the horizontal direction to view details. It is possible to display by scrolling.

また、表示端末20aは、文字情報中にレイアウト情報などの文字補助情報が含まれている場合は、これを利用して文字領域の画像を読みやすいように生成しなおして提示することも可能である。   In addition, if the character information includes auxiliary character information such as layout information, the display terminal 20a can use this to regenerate and present the image of the character area so that it can be easily read. is there.

また、表示画面20−4fに示すように、文字情報を画像で配信する場合においても、文字情報の画像を映像コンテンツとは別の領域ではなく、文字情報を映像と同じ領域に重畳して表示させることができる。特に、元の映像コンテンツの文字領域に重ねるように文字情報を表示することで、文字情報の画像を読みやすく表示することができる。   In addition, as shown in the display screen 20-4f, even when character information is distributed as an image, the character information image is not displayed in a region separate from the video content, but is displayed superimposed on the same region as the video. Can be made. In particular, by displaying the character information so as to overlap the character area of the original video content, it is possible to display the character information image in an easy-to-read manner.

配信される文字情報の画像は、通常は元の映像コンテンツよりも高解像度であるため、先の表示画面20−4eの場合と同様に、最初は配信された文字情報の画像を縮小して元の映像コンテンツに重畳させて表示し、必要になれば縮小を解除して(また指定サイズにサイズを変更して)スクロールさせながら表示させること等が可能である。   Since the character information image to be distributed usually has a higher resolution than the original video content, as in the case of the previous display screen 20-4e, the image of the character information distributed is initially reduced to the original. The video content can be displayed superimposed on the video content, and if necessary, the reduction can be canceled (or the size can be changed to a specified size) and the content can be displayed while scrolling.

表示画面20−4dのように文字情報を文字認識して他言語に翻訳したものを映像コンテンツとは別のウィンドウに表示することもできるが、これを同様にして表示画面20−4gに示すように、映像コンテンツ中に重畳させて表示することもできる。   As shown in the display screen 20-4g, the character information recognized as characters and translated into another language can be displayed in a window different from the video content. In addition, it can be displayed superimposed on the video content.

これは、外国映画の映像コンテンツの字幕などに応用でき、映画に集中したい場合に、他のウィンドウを見て集中が削がれるということがなくなる。これを実現するために、テキストデータで配信される翻訳文の文字情報をそのまま映像に重畳させてもよいし、その翻訳文のテキストデータから文字領域の大きさにあわせて文字画像を作成して表示させること等が可能である。   This can be applied to subtitles of video content of foreign movies, and when you want to concentrate on a movie, you will not lose your focus by looking at other windows. In order to achieve this, the text information of the translated text distributed as text data may be superimposed on the video as it is, or a text image is created from the text data of the translated text according to the size of the text area. It is possible to display it.

また、配信サーバ10aで文字認識した結果をテキストデータにより配信するのではなく、そのテキストデータの文字を表示する文字画像を生成して、これを文字情報として表示端末20aに配信することも可能である。この場合、表示端末20aは、受信した文字情報の画像を重畳させて表示するのみで鮮明に文字を表示することができる。   In addition, instead of distributing the result of character recognition by the distribution server 10a as text data, it is also possible to generate a character image that displays characters of the text data and distribute it as character information to the display terminal 20a. is there. In this case, the display terminal 20a can display characters clearly only by superimposing and displaying the received character information image.

また、特に語学学習用や外国映画等の映像コンテンツの場合には、映像コンテンツに表示させる字幕を消去したいといった要求もある。   There is also a demand for deleting subtitles to be displayed on video content, particularly in the case of video content for language learning or foreign movies.

この場合、表示画面20−4hに示されるように、配信された文字補助情報において示される映像コンテンツ中での文字が表示される領域の位置情報に基づいて、表示端末20aがその領域を消去して利用者に提供することができる。   In this case, as shown in the display screen 20-4h, the display terminal 20a erases the area based on the position information of the area where the character in the video content indicated in the distributed character auxiliary information is displayed. Can be provided to users.

またこの場合、語学の勉強中に答が知りたいなどといった用途の時は、表示端末20aは、利用者の操作に応じて、表示画面20−4c〜20−4gのような手法で文字情報を表示させたり消去したり、切り替えながら利用者に提示することが可能である。   In this case, when the user wants to know the answer while studying the language, the display terminal 20a displays the character information by a method such as the display screens 20-4c to 20-4g according to the operation of the user. It can be displayed, erased, or presented to the user while switching.

なお、上記の第1、第2の実施の形態の映像コンテンツ及び文字情報の提示方法の説明においては、表示端末20、20aを携帯電話等の携帯通信端末とする場合を例に説明したが、特に表示端末20aを携帯電話に限定する必要はない。本発明のコンテンツ配信システムは、配信先の表示端末20、20aが表示部の面積が狭い場合に特に効果的であるが、同様にしてパソコンやノートパソコン等の端末に対し配信することも可能である。   In the description of the video content and text information presentation method according to the first and second embodiments, the case where the display terminals 20 and 20a are mobile communication terminals such as mobile phones has been described as an example. In particular, it is not necessary to limit the display terminal 20a to a mobile phone. The content distribution system of the present invention is particularly effective when the display terminals 20 and 20a of the distribution destination have a small area of the display unit, but can also be distributed to terminals such as personal computers and laptop computers in the same manner. is there.

以上説明したように、上記第1、第2の実施の形態のコンテンツ配信システムによれば、低ビットレートで配信される映像コンテンツにおいても、受信側の表示端末が文字を明瞭に表示して利用者に提示することができる。   As described above, according to the content distribution systems of the first and second embodiments, the display terminal on the receiving side clearly displays and uses the video content distributed at a low bit rate. Can be presented to the person.

次に、本発明の第3の実施の形態を説明する。図9は、本発明の第3の実施の形態によるコンテンツ配信システムの構成を示すブロック図である。本実施の形態は、配信サーバ10を用いずに表示端末20bだけで文字情報を抽出して表示する行なう形態である。   Next, a third embodiment of the present invention will be described. FIG. 9 is a block diagram showing a configuration of a content distribution system according to the third embodiment of the present invention. In the present embodiment, character information is extracted and displayed only on the display terminal 20b without using the distribution server 10.

図10は、本実施の形態の表示端末20bの動作を説明するためのフローチャートである。   FIG. 10 is a flowchart for explaining the operation of the display terminal 20b of the present embodiment.

本実施の形態の表示端末20bは、テレビ放送などの放送映像を受信する携帯端末であり、映像受信部21で電波等により外部の放送局40等から放送中のテレビ番組等の映像コンテンツを受信する(ステップ601)。受信した映像コンテンツを映像復号部22で復号し(ステップ602)、文字抽出部29によりその文字情報を生成して(ステップ603)、映像表示部23で映像コンテンツとその文字情報を表示する(ステップ604)。   The display terminal 20b according to the present embodiment is a mobile terminal that receives broadcast video such as television broadcast, and the video receiver 21 receives video content such as a TV program being broadcast from an external broadcasting station 40 or the like by radio waves or the like. (Step 601). The received video content is decoded by the video decoding unit 22 (step 602), the character information is generated by the character extraction unit 29 (step 603), and the video content and its character information are displayed by the video display unit 23 (step 603). 604).

表示端末20bは、携帯用を念頭においているので、表示することができる解像度が低く、映像表示部23では映像コンテンツを縮小して表示する。この時、縮小された映像コンテンツは、テロップ等の文字が不明瞭になったり潰れてしまうことがある。   Since the display terminal 20b is intended to be portable, the resolution that can be displayed is low, and the video display unit 23 displays the video content in a reduced size. At this time, in the reduced video content, characters such as telop may become unclear or crushed.

一方、映像復号部22で復号する映像は通常の解像度の映像が復号されるので、通常の解像度の映像を用いて、文字抽出部29にて文字領域を抽出し、文字表示部26で文字情報を表示することで、利用者に映像内容をわかりやすく提示する。また、文字抽出部29は、文字領域を抽出するだけでなく、文字認識も行ない表示される文字のテキストデータを取得することも可能である。この場合、その取得したテキストデータを文字表示部26により表示する。   On the other hand, since the video decoded by the video decoding unit 22 is decoded at the normal resolution, the character extraction unit 29 extracts the character area using the normal resolution video, and the character display unit 26 detects the character information. By displaying, the video content is presented to the user in an easy-to-understand manner. The character extraction unit 29 can not only extract a character region but also perform character recognition and acquire text data of a displayed character. In this case, the acquired text data is displayed by the character display unit 26.

本実施の形態の表示端末20bの文字情報の表示手法は、上述の第1、第2の実施の形態の説明と同様にして実施することができる。   The display method of the character information of the display terminal 20b according to the present embodiment can be performed in the same manner as described in the first and second embodiments.

以上説明したように本実施の形態によれば、表示端末20bが文字抽出を行なうための十分な処理能力を備える場合には、配信サーバを必要とせずに、表示端末20b自身により、テレビ放送などの映像コンテンツから文字情報を抽出して、抽出した文字情報を高解像度に表示することができる。これにより、第1、第2の実施の形態の表示端末20、20aと同様にして、携帯端末などの小画面の表示端末20bにおいても利用者に映像コンテンツの内容をわかりやすく提示することができる。   As described above, according to the present embodiment, when the display terminal 20b has sufficient processing capability to perform character extraction, the display terminal 20b itself does not require a distribution server, and the television broadcast or the like. The character information can be extracted from the video content and the extracted character information can be displayed with high resolution. As a result, similar to the display terminals 20 and 20a of the first and second embodiments, the contents of the video content can be presented to the user in an easy-to-understand manner on the small-screen display terminal 20b such as a portable terminal. .

次に、本発明の第4の実施の形態を説明する。図11は、本発明の第4の実施の形態によるコンテンツ配信システムの構成を示すブロック図である。   Next, a fourth embodiment of the present invention will be described. FIG. 11 is a block diagram showing a configuration of a content distribution system according to the fourth embodiment of the present invention.

第3の実施の形態では映像を表示端末20bで直接受信し、文字領域抽出も表示端末20bで行なう方式であったが、一般に携帯型の機器は処理能力が低いため、文字領域抽出が困難な場合もありうる。   In the third embodiment, the video is directly received by the display terminal 20b and the character area extraction is also performed by the display terminal 20b. However, since the portable device generally has low processing capability, it is difficult to extract the character area. There may be cases.

図12は、本実施の形態の配信サーバ10bの動作を説明するためのフローチャートである。   FIG. 12 is a flowchart for explaining the operation of the distribution server 10b of the present embodiment.

そこで本実施の形態では、配信サーバ10cにおいて表示端末20cが外部の放送局40から受信している番組と同じ番組の映像コンテンツを映像入力部11で受信し(ステップ701)、文字抽出部13でその文字情報を抽出して(ステップ702)、文字送信部15でその文字情報を表示端末20cに送信する(ステップ703)。表示端末20cでは、第1、第2の実施の形態と同様にして、配信サーバ10cから配信される文字情報を文字受信部24で受信し、文字復号部25で必要な復号処理を行い、文字表示部26で文字情報を表示する。   Therefore, in the present embodiment, the video input unit 11 receives the video content of the same program as the program received by the display terminal 20c from the external broadcasting station 40 in the distribution server 10c (step 701), and the character extraction unit 13 The character information is extracted (step 702), and the character transmission unit 15 transmits the character information to the display terminal 20c (step 703). In the display terminal 20c, as in the first and second embodiments, the character information distributed from the distribution server 10c is received by the character receiving unit 24, and the necessary decoding process is performed by the character decoding unit 25. Character information is displayed on the display unit 26.

一方、映像コンテンツは、第3の実施の形態と同様に配信サーバ10c以外の放送局40等から、映像受信部21で受信し、映像復号部22で必要な復号処理を行い、映像表示部23でその映像コンテンツを表示する。   On the other hand, the video content is received by the video receiving unit 21 from the broadcasting station 40 other than the distribution server 10c as in the third embodiment, and the video decoding unit 22 performs the necessary decoding processing, and the video display unit 23 To display the video content.

本実施の形態の表示端末20cの文字情報の表示手法は、上述の第1、第2の実施の形態の説明と同様にして実施することができる。   The display method of the character information of the display terminal 20c of the present embodiment can be performed in the same manner as described in the first and second embodiments.

以上説明したように、本実施の形態によれば、第3の実施の形態の効果に加えて、文字領域抽出の処理が困難な表示端末20cでも文字情報を表示することができる。また、配信サーバ10が文字情報のみを配信し、表示端末20cが映像コンテンツを他の放送局40等から受信する方式により、上記第1、第2の実施の形態のコンテンツ配信システムと同様の効果を実現することができる。   As described above, according to the present embodiment, in addition to the effects of the third embodiment, it is possible to display character information even on the display terminal 20c where the character region extraction process is difficult. Further, the distribution server 10 distributes only character information, and the display terminal 20c receives the video content from other broadcast stations 40 and the like, thereby providing the same effects as the content distribution systems of the first and second embodiments. Can be realized.

また、通常データ量が多い映像情報を配信サーバ10cから受信せず、直接電波等を利用して映像を受信することで、データ通信に要する費用などを抑えることができ、第1や第2の実施の形態よりも効率よく文字情報の配信ができる。   In addition, by receiving video using direct radio waves or the like without receiving video information with a large amount of normal data from the distribution server 10c, the cost required for data communication can be reduced. Character information can be distributed more efficiently than in the embodiment.

なお、上記各実施の形態では、表示端末20、20a、20b、20cでは映像コンテンツとその文字情報とを同時に表示する方式であったが、文字情報のみを表示して映像コンテンツは表示しないという形態も可能である。これにより、より少ない通信量により映像コンテンツの文字情報を表示することができる。   In each of the above embodiments, the display terminals 20, 20a, 20b, and 20c display the video content and its character information at the same time. However, only the character information is displayed and the video content is not displayed. Is also possible. Thereby, the character information of the video content can be displayed with a smaller communication amount.

なお、上記各実施の形態のコンテンツ配信システムは、配信サーバ10、10a、10cにおける映像入力部11、映像符号化部12、文字抽出部13、映像送信部14、文字送信部15、多重化部16、送信部17の機能や、表示端末20、20a、20b、20cにおける映像受信部21、映像復号部22、映像表示部23、文字受信部24、文字復号部25、文字表示部26、受信部27、多重化分離部28、文字抽出部29の機能や、その他の機能をハードウェア的に実現することは勿論として、各機能を備えるコンピュータプログラムであるコンテンツ配信プログラム90、90a、90c、91、91a、91b、91cを、コンピュータ処理装置のメモリにロードされることで実現することができる。このコンテンツ配信プログラム90、90a、90c、91、91a、91b、91cは、磁気ディスク、半導体メモリその他の記録媒体に格納される。そして、その記録媒体からコンピュータ処理装置にロードされ、コンピュータ処理装置の動作を制御することにより、上述した各機能を実現する。   The content distribution system of each of the above embodiments includes the video input unit 11, the video encoding unit 12, the character extraction unit 13, the video transmission unit 14, the character transmission unit 15, and the multiplexing unit in the distribution servers 10, 10a, and 10c. 16, the function of the transmission unit 17, the video reception unit 21, the video decoding unit 22, the video display unit 23, the character reception unit 24, the character decoding unit 25, the character display unit 26, the reception in the display terminals 20, 20a, 20b, and 20c. The contents distribution programs 90, 90a, 90c, 91, which are computer programs having the respective functions, as well as the functions of the unit 27, the demultiplexing unit 28, the character extraction unit 29, and other functions are realized in hardware. , 91a, 91b, 91c can be realized by being loaded into the memory of the computer processing apparatus. The content distribution programs 90, 90a, 90c, 91, 91a, 91b, 91c are stored in a magnetic disk, a semiconductor memory, or other recording media. Each function described above is realized by being loaded from the recording medium into the computer processing apparatus and controlling the operation of the computer processing apparatus.

以上好ましい実施の形態及び実施例をあげて本発明を説明したが、本発明は必ずしも上記実施の形態及び実施例に限定されるものではなく、その技術的思想の範囲内において様々に変形して実施することができる。   Although the present invention has been described with reference to the preferred embodiments and examples, the present invention is not necessarily limited to the above-described embodiments and examples, and various modifications can be made within the scope of the technical idea. Can be implemented.

本発明の第1の実施の形態によるコンテンツ配信システムの構成を示すブロック図である。It is a block diagram which shows the structure of the content delivery system by the 1st Embodiment of this invention. 本発明の第1の実施の形態の配信サーバの動作を説明するためのフローチャートである。It is a flowchart for demonstrating operation | movement of the delivery server of the 1st Embodiment of this invention. 本発明の第1の実施の形態の表示端末の動作を説明するためのフローチャートである。It is a flowchart for demonstrating operation | movement of the display terminal of the 1st Embodiment of this invention. 本発明の第2の実施の形態によるコンテンツ配信システムの構成を示すブロック図である。It is a block diagram which shows the structure of the content delivery system by the 2nd Embodiment of this invention. 本発明の第2の実施の形態の配信サーバの動作を説明するためのフローチャートである。It is a flowchart for demonstrating operation | movement of the delivery server of the 2nd Embodiment of this invention. 本発明の第2の実施の形態の表示端末の動作を説明するためのフローチャートである。It is a flowchart for demonstrating operation | movement of the display terminal of the 2nd Embodiment of this invention. 本発明の第2の実施の形態の文字領域分抽出の説明図である。It is explanatory drawing of the character region part extraction of the 2nd Embodiment of this invention. 本発明の第2の実施の形態の表示端末における映像表示方式の説明図である。It is explanatory drawing of the video display system in the display terminal of the 2nd Embodiment of this invention. 本発明の第3の実施の形態によるコンテンツ配信システムの構成を示すブロック図である。It is a block diagram which shows the structure of the content delivery system by the 3rd Embodiment of this invention. 本発明の第3の実施の形態の表示端末の動作を説明するためのフローチャートである。It is a flowchart for demonstrating operation | movement of the display terminal of the 3rd Embodiment of this invention. 本発明の第4の実施の形態によるコンテンツ配信システムの構成を示すブロック図である。It is a block diagram which shows the structure of the content delivery system by the 4th Embodiment of this invention. 本発明の第4の実施の形態の配信サーバの動作を説明するためのフローチャートである。It is a flowchart for demonstrating operation | movement of the delivery server of the 4th Embodiment of this invention. 従来の映像コンテンツ配信システムの構成を示すブロック図である。It is a block diagram which shows the structure of the conventional video content delivery system.

符号の説明Explanation of symbols

10、10a、10c 配信サーバ
11 映像入力部
12 映像符号化部
13 文字抽出部
14 映像送信部
15 文字送信部
16 多重化部
17 送信部
20、20a、20b、20c 表示端末
21 映像受信部
22 映像復号部
23 映像表示部
24 文字受信部
25 文字復号部
26 文字表示部
27 受信部
28 多重化分離部
29 文字抽出部
30 伝送路
60 映像配信サーバ
61 映像入力部
62 映像符号化部
64 映像送信部
70 映像表示端末
71 映像受信部
72 映像復号部
73 映像表示部
90、90a、90c、91、91a、91b、91c 配信プログラム
10, 10a, 10c Distribution server 11 Video input unit 12 Video encoding unit 13 Character extraction unit 14 Video transmission unit 15 Character transmission unit 16 Multiplexing unit 17 Transmission units 20, 20a, 20b, 20c Display terminal 21 Video reception unit 22 Video Decoding unit 23 Video display unit 24 Character reception unit 25 Character decoding unit 26 Character display unit 27 Reception unit 28 Demultiplexing unit 29 Character extraction unit 30 Transmission path 60 Video distribution server 61 Video input unit 62 Video encoding unit 64 Video transmission unit 70 Video display terminal 71 Video receiving unit 72 Video decoding unit 73 Video display units 90, 90a, 90c, 91, 91a, 91b, 91c Distribution program

Claims (25)

配信サーバから表示端末に対し映像コンテンツを配信するコンテンツ配信システムにおいて、
前記配信サーバが、映像コンテンツの画像から文字が表示される領域を検出し、検出した前記領域の画像のコントラストを高めた画像を、前記映像コンテンツの文字情報として生成し、前記映像コンテンツと同時に、生成した文字情報を前記表示端末に配信し、
前記表示端末が、前記配信サーバから受信した前記映像コンテンツの文字情報を、同時に受信した前記映像コンテンツと共に提示することを特徴とするコンテンツ配信システム。
In a content distribution system that distributes video content from a distribution server to a display terminal,
The distribution server detects an area where characters are displayed from the image of the video content, generates an image with increased contrast of the detected image of the area as character information of the video content, and simultaneously with the video content, Deliver the generated character information to the display terminal,
The content distribution system, wherein the display terminal presents the character information of the video content received from the distribution server together with the video content received simultaneously.
前記コントラストを高めた画像は、検出した前記領域の画像を二値化した画像であることを特徴とする請求項に記載のコンテンツ配信システム。
The content distribution system according to claim 1 , wherein the image with the increased contrast is an image obtained by binarizing the detected image of the region.
配信サーバから表示端末に対し映像コンテンツを配信するコンテンツ配信システムにおいて、In a content distribution system that distributes video content from a distribution server to a display terminal,
前記配信サーバが、映像コンテンツの画像から文字が表示される領域を検出し、検出した前記領域の画像のビットレートを高くし、画質を高めた画像を、前記映像コンテンツの文字情報として生成し、前記映像コンテンツと同時に、生成した文字情報を前記表示端末に配信し、  The distribution server detects an area where characters are displayed from an image of video content, increases the bit rate of the detected image of the area, and generates an image with improved image quality as character information of the video content, Simultaneously with the video content, the generated character information is distributed to the display terminal,
前記表示端末が、前記配信サーバから受信した前記映像コンテンツの文字情報を、同時に受信した前記映像コンテンツと共に提示することを特徴とするコンテンツ配信システム。  The content distribution system, wherein the display terminal presents the character information of the video content received from the distribution server together with the video content received simultaneously.
配信サーバから表示端末に対し映像コンテンツを配信するコンテンツ配信システムにおいて、In a content distribution system that distributes video content from a distribution server to a display terminal,
前記配信サーバが、映像コンテンツの画像から文字が表示される領域を検出し、検出した前記領域の画像を別の符号化方式で符号化した画像を、前記映像コンテンツの文字情報として生成し、前記映像コンテンツと同時に、生成した文字情報を前記表示端末に配信し、  The distribution server detects an area where characters are displayed from an image of video content, generates an image obtained by encoding the detected image of the area with another encoding method as character information of the video content, and Simultaneously with the video content, the generated text information is distributed to the display terminal,
前記表示端末が、前記配信サーバから受信した前記映像コンテンツの文字情報を、同時に受信した前記映像コンテンツと共に提示することを特徴とするコンテンツ配信システム。  The content distribution system, wherein the display terminal presents the character information of the video content received from the distribution server together with the video content received simultaneously.
前記配信サーバが、文字が表示される領域が前記映像コンテンツの画像から複数個所検出される場合に、前記表示端末から前記領域の指定を受け付け、指定された前記領域により生成した前記文字情報を前記表示端末に対し配信することを特徴とする請求項1から請求項のいずれか一つに記載のコンテンツ配信システム。
When a plurality of areas in which characters are displayed are detected from the image of the video content, the distribution server accepts designation of the area from the display terminal, and the character information generated by the designated area is content delivery system according to any one of claims 1 to 4, characterized in that the delivery to the display terminal.
前記配信サーバが、前記映像コンテンツの文字情報と、前記映像コンテンツとを多重化して前記表示端末に対し配信することを特徴とする請求項1から請求項のいずれか一つに記載のコンテンツ配信システム。
The content distribution according to any one of claims 1 to 5 , wherein the distribution server multiplexes the character information of the video content and the video content and distributes the multiplexed information to the display terminal. system.
前記表示端末が、外部の放送局から受信する前記映像コンテンツの文字情報を、前記配信サーバから受信し、前記映像コンテンツの文字情報を前記映像コンテンツと共に提示することを特徴とする請求項1から請求項のいずれか1つに記載のコンテンツ配信システム。
The said display terminal receives the character information of the said video content received from an external broadcasting station from the said delivery server, and presents the character information of the said video content with the said video content. Item 7. The content distribution system according to any one of Items 6 to 6 .
前記映像コンテンツの文字情報として、映像コンテンツとは別に生成した前記文字情報に加えて、検出した前記領域、文字の特徴を示す文字補助情報を同時に含み、
前記表示端末が、前記配信サーバから受信した前記映像コンテンツの文字情報を、前記文字情報に含まれる前記文字補助情報に基づいて提示することを特徴とする請求項1から請求項のいずれか1つに記載のコンテンツ配信システム。
As the character information of the video content, in addition to the character information generated separately from the video content, the detected region, the character auxiliary information indicating the character characteristics are included at the same time,
The display terminal, the character information of the video content received from the distribution server, any of claims 1 to 7, characterized in that presented on the basis of the character auxiliary information included in the character information 1 Content distribution system described in 1.
前記映像コンテンツの文字補助情報が、前記映像コンテンツの画像から検出された前記領域の、前記画像中の位置の情報を含むことを特徴とする請求項に記載のコンテンツ配信システム。
The content distribution system according to claim 8 , wherein the text auxiliary information of the video content includes information on a position in the image of the region detected from the image of the video content.
前記映像コンテンツの文字補助情報が、前記映像コンテンツの画像に表示される文字のレイアウト構造の情報を含むことを特徴とする請求項又は請求項に記載のコンテンツ配信システム。
The content distribution system according to claim 8 or 9 , wherein the character auxiliary information of the video content includes information on a layout structure of characters displayed on the image of the video content.
表示端末に対しコンテンツを配信する配信サーバにおいて、
映像コンテンツの画像から文字が表示される領域を検出する手段と、
検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、
生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、
前記文字情報を生成する手段は、検出した前記領域に示される文字のテキストデータを文字認識により取得し、前記文字認識により取得した前記テキストデータを指定された言語に翻訳した翻訳文を、前記映像コンテンツの文字情報として生成する
ことを特徴とする配信サーバ。
In a distribution server that distributes content to display terminals,
Means for detecting an area in which characters are displayed from an image of video content;
Means for generating character information separately from the video content from the detected area;
Means for delivering the video content to the display terminal simultaneously with the generated character information;
The means for generating the character information obtains the text data of the character indicated in the detected area by character recognition, and translates the text data obtained by the character recognition into a specified language as the video. A distribution server that generates character information of content .
表示端末に対しコンテンツを配信する配信サーバにおいて、In a distribution server that distributes content to display terminals,
映像コンテンツの画像から文字が表示される領域を検出する手段と、  Means for detecting an area where characters are displayed from an image of video content;
検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、  Means for generating character information separately from the video content from the detected area;
生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、  Means for delivering the video content to the display terminal simultaneously with the generated character information;
前記文字情報を生成する手段は、検出した前記領域の画像のコントラストを高めた画像を、前記映像コンテンツの文字情報として生成する  The means for generating the character information generates an image in which the contrast of the detected image of the region is increased as the character information of the video content.
ことを特徴とする配信サーバ。A distribution server characterized by that.
表示端末に対しコンテンツを配信する配信サーバにおいて、In a distribution server that distributes content to display terminals,
映像コンテンツの画像から文字が表示される領域を検出する手段と、  Means for detecting an area where characters are displayed from an image of video content;
検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、  Means for generating character information separately from the video content from the detected area;
生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、  Means for delivering the video content to the display terminal simultaneously with the generated character information;
前記文字情報を生成する手段は、検出した前記領域の画像を二値化した画像を、前記映像コンテンツの文字情報として生成することを特徴とする配信サーバ。  The distribution server characterized in that the means for generating the character information generates an image obtained by binarizing the detected image of the region as the character information of the video content.
表示端末に対しコンテンツを配信する配信サーバにおいて、In a distribution server that distributes content to display terminals,
映像コンテンツの画像から文字が表示される領域を検出する手段と、  Means for detecting an area where characters are displayed from an image of video content;
検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、  Means for generating character information separately from the video content from the detected area;
生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、  Means for delivering the video content to the display terminal simultaneously with the generated character information;
前記文字情報を生成する手段は、検出した前記領域の画像のビットレートを高くし、画質を高めた画像を、前記映像コンテンツの文字情報として生成する  The means for generating the character information increases the bit rate of the image of the detected area and generates an image with improved image quality as the character information of the video content.
ことを特徴とする配信サーバ。A distribution server characterized by that.
表示端末に対しコンテンツを配信する配信サーバにおいて、In a distribution server that distributes content to display terminals,
映像コンテンツの画像から文字が表示される領域を検出する手段と、  Means for detecting an area where characters are displayed from an image of video content;
検出した前記領域から映像コンテンツとは別に文字情報を生成する手段と、  Means for generating character information separately from the video content from the detected area;
生成した前記文字情報と同時に前記映像コンテンツを前記表示端末に配信する手段とを備え、  Means for delivering the video content to the display terminal simultaneously with the generated character information;
前記文字情報を生成する手段は、検出した前記領域の画像を別の符号化方式で符号化した画像を、前記映像コンテンツの文字情報として生成するThe means for generating the character information generates, as character information of the video content, an image obtained by encoding the detected image of the region by another encoding method.
ことを特徴とする配信サーバ。A distribution server characterized by that.
文字が表示される領域が前記映像コンテンツの画像から複数個所検出される場合に、前記表示端末から前記領域の指定を受け付ける手段を備え、
指定された前記領域において生成した文字情報を前記表示端末に対し配信すること
を特徴とする請求項11から請求項15のいずれか一つに記載の配信サーバ。
Means for receiving designation of the area from the display terminal when a plurality of areas in which characters are displayed are detected from the image of the video content;
The distribution server according to any one of claims 11 to 15 , wherein character information generated in the designated area is distributed to the display terminal.
前記映像コンテンツの文字情報と、前記映像コンテンツとを多重化して前記表示端末に対し配信する手段を備えることを特徴とする請求項11から請求項16のいずれか一つに記載の配信サーバ。
The distribution server according to any one of claims 11 to 16 , further comprising means for multiplexing the character information of the video content and the video content and distributing the multiplexed information to the display terminal.
前記映像コンテンツの文字情報として、映像コンテンツとは別に生成した文字情報に加えて、前記領域、文字の特徴を識別する手段を備え、識別した前記領域、文字の特徴の情報を文字補助情報として、前記映像コンテンツの文字情報に含めて前記表示端末に対し配信することを特徴とする請求項11から請求項17のいずれか1つに記載の配信サーバ。
As character information of the video content, in addition to character information generated separately from the video content, the device includes means for identifying the region and character characteristics, and the identified region and character feature information is used as character auxiliary information. The distribution server according to any one of claims 11 to 17 , wherein the distribution server includes the character information of the video content and distributes the image content to the display terminal.
前記映像コンテンツ及び前記映像コンテンツの文字情報を記録して備える手段と、
前記表示端末からの要求に応じて、要求された前記映像コンテンツ及び前記映像コンテンツの文字情報を前記表示端末に配信する手段を備えることを特徴とする請求項11から請求項18のいずれか1つに記載の配信サーバ。
Means for recording the video content and character information of the video content;
The apparatus according to any one of claims 11 to 18 , further comprising means for distributing the requested video content and character information of the video content to the display terminal in response to a request from the display terminal. The delivery server described in.
コンテンツを配信する請求項11から請求項19のいずれか1つに記載される前記配信サーバから、映像コンテンツの画像に表示される文字から映像コンテンツとは別に生成された文字情報と当該映像コンテンツとを同時に受信する手段と、The character information generated separately from the video content from the characters displayed in the image of the video content from the distribution server according to any one of claims 11 to 19 for distributing the content, and the video content Means for simultaneously receiving
受信した前記文字情報と前記映像コンテンツとを共に提示する手段を備え、  Means for presenting both the received character information and the video content;
前記映像コンテンツの文字情報が、前記映像コンテンツから検出された前記領域、文字の特徴を示す文字補助情報を含み、  The character information of the video content includes character auxiliary information indicating characteristics of the region and characters detected from the video content,
前記配信サーバから受信した前記映像コンテンツの文字情報を、前記文字情報に含まれる前記文字補助情報に基づいて提示する手段を備えることを特徴とする表示端末。  A display terminal comprising: means for presenting character information of the video content received from the distribution server based on the character auxiliary information included in the character information.
前記文字補助情報が、前記映像コンテンツの画像中の文字が表示される領域の、前記画像中の位置の情報を含み、
前記映像コンテンツを、前記文字補助情報に示される前記文字が表示される領域を消去して提示する手段を備えることを特徴とする請求項20に記載の表示端末。
The character auxiliary information includes information on a position in the image of an area in which characters in the image of the video content are displayed,
21. The display terminal according to claim 20 , further comprising means for erasing and presenting the video content by deleting an area in which the character indicated by the character auxiliary information is displayed.
前記配信サーバに対して、前記文字情報の送信の可否を指示する手段を
備えることを特徴とする請求項20又は請求項21に記載の表示端末。
The display terminal according to claim 20 or 21 , further comprising means for instructing the delivery server whether the character information can be transmitted.
前記映像コンテンツの文字情報と、前記映像コンテンツとを表示画面中にそれぞれに別のウィンドウにより同時に表示する手段を備えることを特徴とする請求項20から請求項22に記載の表示端末。
The display terminal according to any one of claims 20 to 22 , further comprising means for simultaneously displaying the character information of the video content and the video content in separate windows on a display screen.
表示画面中の前記映像コンテンツを表示するエリア内に、前記映像コンテンツの文字情報を同時に表示する手段を備えることを特徴とする請求項20から請求項23のいずれか1つに記載の表示端末。
The display terminal according to any one of claims 20 to 23 , further comprising means for simultaneously displaying character information of the video content in an area for displaying the video content in a display screen.
携帯通信端末であることを特徴とする請求項20から請求項24のいずれか1つに記載の表示端末。
The display terminal according to any one of claims 20 to 24 , wherein the display terminal is a mobile communication terminal.
JP2007158882A 2007-06-15 2007-06-15 Content distribution system, content distribution system distribution server and display terminal, and content distribution program Expired - Fee Related JP4655065B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007158882A JP4655065B2 (en) 2007-06-15 2007-06-15 Content distribution system, content distribution system distribution server and display terminal, and content distribution program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007158882A JP4655065B2 (en) 2007-06-15 2007-06-15 Content distribution system, content distribution system distribution server and display terminal, and content distribution program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001376701A Division JP4000844B2 (en) 2001-12-11 2001-12-11 Content distribution system, content distribution system distribution server and display terminal, and content distribution program

Publications (2)

Publication Number Publication Date
JP2007325282A JP2007325282A (en) 2007-12-13
JP4655065B2 true JP4655065B2 (en) 2011-03-23

Family

ID=38857612

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007158882A Expired - Fee Related JP4655065B2 (en) 2007-06-15 2007-06-15 Content distribution system, content distribution system distribution server and display terminal, and content distribution program

Country Status (1)

Country Link
JP (1) JP4655065B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9497492B2 (en) 2013-03-15 2016-11-15 Ricoh Company, Limited Distribution control system, distribution system, distribution control method, and computer-readable storage medium

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009177448A (en) * 2008-01-24 2009-08-06 Sanyo Electric Co Ltd Video image reproducing apparatus, video image reproduction system, content server, caption display method, and caption display program
JP5376685B2 (en) * 2011-07-13 2013-12-25 Necビッグローブ株式会社 CONTENT DATA DISPLAY DEVICE, CONTENT DATA DISPLAY METHOD, AND PROGRAM
JP6555151B2 (en) * 2015-12-15 2019-08-07 株式会社リコー Communication apparatus and communication system
JP6977632B2 (en) * 2018-03-12 2021-12-08 株式会社Jvcケンウッド Subtitle generator, subtitle generator and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000242661A (en) * 1999-02-23 2000-09-08 Fujitsu Ltd Relating information retrieval device and storage medium recording program for executing relating information retrieval processing
JP2001045445A (en) * 1999-07-29 2001-02-16 Nippon Telegr & Teleph Corp <Ntt> Live video image transmission reception system. live video image transmitter and receiver

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000242661A (en) * 1999-02-23 2000-09-08 Fujitsu Ltd Relating information retrieval device and storage medium recording program for executing relating information retrieval processing
JP2001045445A (en) * 1999-07-29 2001-02-16 Nippon Telegr & Teleph Corp <Ntt> Live video image transmission reception system. live video image transmitter and receiver

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9497492B2 (en) 2013-03-15 2016-11-15 Ricoh Company, Limited Distribution control system, distribution system, distribution control method, and computer-readable storage medium

Also Published As

Publication number Publication date
JP2007325282A (en) 2007-12-13

Similar Documents

Publication Publication Date Title
JP4000844B2 (en) Content distribution system, content distribution system distribution server and display terminal, and content distribution program
US10187668B2 (en) Method, system and server for live streaming audio-video file
KR100943128B1 (en) Mpeg-4 remote communication device
KR100826156B1 (en) Apparatus and method for wallpaper setting of audio channel in a digital multimedia broadcasting service
JP5576667B2 (en) Information transmission display system
EP2479982A1 (en) Closed captioning language translation
US20160261927A1 (en) Method and System for Providing and Displaying Optional Overlays
US11812100B2 (en) Apparatus, systems and methods for accessing information based on an image presented on a display
KR100767673B1 (en) Digital Broadcasting Terminal with Emboding Slide Show and Method of Emboding Slide Show Using Same
CN105263031A (en) System and method for distributing auxiliary data embedded in video data
US20150350565A1 (en) Techniques for magnifying a high resolution image
JP4655065B2 (en) Content distribution system, content distribution system distribution server and display terminal, and content distribution program
CN102088631B (en) Live and demand broadcast method of digital television (TV) programs as well as related device and system
KR20180105026A (en) Electronic apparatus and the control method thereof
CN101632069A (en) Be used to present the method and system of the information relevant with recorded content
US6665318B1 (en) Stream decoder
CN115580738B (en) High-resolution video display method, device and system for on-demand transmission
KR100926911B1 (en) Method and system for providing advertisement in digital broadcasting
KR20070076781A (en) Method and apparatus for data communication using settop-box
KR20040046537A (en) Method for harmfulness information interception of video on demand service
JP2002540657A (en) Coding hot spots into television signals
JP2005091571A (en) Display controller and display system
KR20090002810A (en) Method for storing the broadcast on a data broadcast and a imaging apparatus having the same
CN115225928A (en) Multi-type audio and video mixed broadcasting system and method
KR101181764B1 (en) Method for Providing Image Contents and Digital Broadcasting Terminal

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080613

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20090511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100907

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4655065

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees