JP2006100880A - Method, system and program for analyzing caption in multimedia program - Google Patents

Method, system and program for analyzing caption in multimedia program Download PDF

Info

Publication number
JP2006100880A
JP2006100880A JP2004280918A JP2004280918A JP2006100880A JP 2006100880 A JP2006100880 A JP 2006100880A JP 2004280918 A JP2004280918 A JP 2004280918A JP 2004280918 A JP2004280918 A JP 2004280918A JP 2006100880 A JP2006100880 A JP 2006100880A
Authority
JP
Japan
Prior art keywords
multimedia program
program data
subtitles
data
multimedia
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004280918A
Other languages
Japanese (ja)
Inventor
Janice Marie Girouard
ジャニス・マリー・ジロウアード
Mark Joseph Hamzy
マーク・ジョセフ・ハムジー
Emily Jane Ratliff
エミリー・ジェーン・ラトリフ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2004280918A priority Critical patent/JP2006100880A/en
Publication of JP2006100880A publication Critical patent/JP2006100880A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Character Discrimination (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a method, a system and a computer program for processing video data. <P>SOLUTION: A data processing system identifies texts in captions of multimedia program data to produce a series of texts, analyzes a series of the texts to produce a result of the analysis, identifies video segments to be altered on the basis of the result of the analysis, generates the identified video segments and alters the identified segments. Further, the system may execute color correction in order to enhance the visibility of the texts in the captions. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、一般に、改良されたデータ処理システムに関し、詳細には、データを処理するための方法および装置に関する。より詳細には、本発明は、マルチメディア番組データを処理するための方法、装置、およびコンピュータ命令に関する。   The present invention relates generally to an improved data processing system, and more particularly to a method and apparatus for processing data. More particularly, the present invention relates to a method, apparatus, and computer instructions for processing multimedia program data.

パーソナル・ビデオ・レコーダ(PVR)の一般消費者への普及が一段と進んでいる。デジタル・ビデオ・レコーダ(DVR)とも呼ばれるこれらのレコーダを使用すれば、ユーザは新しい番組を録画しながら、録画済の番組を再生することができる。ある場合には、1つのチャンネルで放送中の番組を視聴しながら、異なるチャンネルで別の番組を録画することもできる。また、ユーザは放送中の番組を視聴している最中に、あるシーンで停止させたり、そのシーンを再生したりすることもできる。一般にPVRは、デジタル映像/音声コンテンツ(digital video and audio content)を受信するため、ケーブルまたは衛星システムに接続される。PVRを使用すれば、従来のビデオ・カセット・レコーダのように、番組を放送後に視聴することが可能になるが、それ以外にもある番組のすべての回の放送を録画するなど、他の多くの機能を享受することができる。こうしたシステムは、通常ハード・ディスク・ドライブを備え、番組を保存するのに使用する。   Personal video recorders (PVRs) are becoming increasingly popular with general consumers. Using these recorders, also called digital video recorders (DVRs), the user can play back recorded programs while recording new programs. In some cases, another program can be recorded on a different channel while watching a program being broadcast on one channel. Further, the user can stop at a certain scene or play back the scene while viewing the program being broadcast. Generally, a PVR is connected to a cable or satellite system to receive digital video and audio content. PVR makes it possible to watch a program after it is broadcast, like a traditional video cassette recorder, but there are many others, such as recording all other broadcasts of a program. You can enjoy the functions. Such systems typically include a hard disk drive and are used to store programs.

PVRは、録画した番組をネットワークを介して他のPVRと共用する機能、デジタル画像を保存する機能、MP3ファイルを保存する機能など、その他の機能も提供する。しかし、PVRが備えていない機能の1つに、不快な内容を排除する機能がある。ある場合には、ユーザはある番組を視聴したいと思うと同時に、その番組から不快な内容を排除したいと思うかもしれないが、そうした機能は現時点では提供されていない。   The PVR also provides other functions such as a function of sharing a recorded program with other PVRs via a network, a function of storing a digital image, and a function of storing an MP3 file. However, one of the functions that the PVR does not have is a function that eliminates unpleasant content. In some cases, a user may want to watch a program and at the same time want to eliminate unpleasant content from the program, but such functionality is not currently available.

したがって、PVR上で番組を管理するための改良された方法、システム、およびコンピュータ・プログラムが存在すれば有利であろう。   Accordingly, it would be advantageous to have an improved method, system, and computer program for managing programs on a PVR.

本発明は、映像データを処理するための方法、システム、およびコンピュータ・プログラムを提供する。マルチメディア番組データの字幕中のテキストを識別して、一連のテキストを生成する。その一連のテキストを分析して、分析結果を形成する。その分析結果に基づいて改変すべき映像セグメントを識別して、識別映像セグメントを形成し、その識別セグメントを改変する。さらに、字幕中のテキストの可視性を向上させるため、訂正を実行することもできる。   The present invention provides a method, system, and computer program for processing video data. Identify text in subtitles in multimedia program data and generate a series of text. The series of texts is analyzed to form an analysis result. Based on the analysis result, a video segment to be modified is identified, an identification video segment is formed, and the identification segment is modified. In addition, corrections can be performed to improve the visibility of text in subtitles.

本発明の特徴をなすと考えられる新規な特徴を、添付の特許請求の範囲に記載する。しかし、本発明自体、ならびに好ましい使用の態様、本発明のその他の目的および利点は、説明的な実施形態の以下の詳細な説明を添付の図面と併せて読むことによって最も良く理解されるであろう。   The novel features believed characteristic of the invention are set forth in the appended claims. However, the invention itself, as well as preferred modes of use, and other objects and advantages of the invention, are best understood when the following detailed description of the illustrative embodiments is read in conjunction with the accompanying drawings. Let's go.

次に図面を、特に図1を参照すると、本発明を実施することができるデータ処理システムのブロック図が示されている。データ処理システム100は、デジタル・ビデオ・レコーダ(DVR)とも呼ばれるパーソナル・ビデオ・レコーダ(PVR)の一例である。図示するように、データ処理システム100内の構成要素は、バス・システム102を介して相互接続される。   With reference now to the figures and in particular with reference to FIG. 1, a block diagram of a data processing system is shown in which the present invention may be implemented. Data processing system 100 is an example of a personal video recorder (PVR), also called a digital video recorder (DVR). As shown, the components within data processing system 100 are interconnected via a bus system 102.

データ処理システム100は、処理ユニット104、メモリ106、音声ユニット108、映像ユニット110、通信ユニット112、記憶装置114、および字幕/映像分析ユニット(subtitle and video analysis unit)116を含む。メモリ106は、様々なPVR機能を提供するために処理ユニット104によって実行することができる命令を格納する。そうした機能には、例えば、番組を録画する機能、番組を再生する機能、処理のために映像を分析する機能、およびデータ処理システム100内に保存することができる番組を管理する機能が含まれる。   The data processing system 100 includes a processing unit 104, a memory 106, an audio unit 108, a video unit 110, a communication unit 112, a storage device 114, and a subtitle / video analysis unit 116. The memory 106 stores instructions that can be executed by the processing unit 104 to provide various PVR functions. Such functions include, for example, a function for recording a program, a function for reproducing a program, a function for analyzing video for processing, and a function for managing programs that can be stored in the data processing system 100.

音声ユニット108は、音声を入力から受け取り、音声を出力するのに使用される構成要素を含む。そうした構成要素には、例えば、音声アナログ−デジタル変換器(ADC)、および音声デジタル−アナログ変換器(DAC)が含まれ得る。映像ユニット110は、データ処理システム100内で映像を受け取り、映像を出力するのに使用される。映像ユニット110には、例えば、オーディオ・ビジュアル(AV)符号器/復号器(コーデック)(coder/decoder (codec))が含まれ得る。映像ユニット110は、ディスプレイ118など、データ処理システム100に接続される表示装置に提示される映像を出力することができる。   The audio unit 108 includes components used to receive audio from input and output audio. Such components may include, for example, an audio analog-to-digital converter (ADC) and an audio digital-to-analog converter (DAC). The video unit 110 is used to receive video and output video within the data processing system 100. Video unit 110 may include, for example, an audio-visual (AV) encoder / decoder (codec). The video unit 110 can output a video presented on a display device connected to the data processing system 100 such as the display 118.

具体的な実装に応じて、音声ユニット108および映像ユニット110内の構成要素は、ハードウェア構成要素として処理ユニット104内に実装することができる。通信ユニット112は、マルチメディア番組を受信するためのコネクションを提供する。この例では、マルチメディア番組は、映像(動画、および/または静止画、以下同様)および音声データを含む。マルチメディア番組は、字幕などのクローズド・キャプション・データ(closed caption data)を含むこともできる。こうした字幕は、ユーザの好みに応じて、表示することも表示しないこともできる。マルチメディア番組の例として、テレビ番組、映画、および音楽ビデオなどがある。これらのマルチメディア番組は、通信ユニット112をインターネット、ケーブル・ネットワーク、地上波デジタル放送または衛星を介して様々な番組発信元に接続することによって取得することができる。   Depending on the specific implementation, the components in the audio unit 108 and the video unit 110 can be implemented in the processing unit 104 as hardware components. The communication unit 112 provides a connection for receiving multimedia programs. In this example, the multimedia program includes video (moving and / or still images, and so on) and audio data. Multimedia programs can also include closed caption data such as closed captions. Such subtitles can be displayed or not displayed depending on user preference. Examples of multimedia programs include television programs, movies, and music videos. These multimedia programs can be obtained by connecting the communication unit 112 to various program sources via the Internet, cable networks, terrestrial digital broadcasting or satellite.

記憶装置114は、マルチメディア番組を保存する場所を提供する。字幕/映像分析ユニット116は、マルチメディア番組の字幕中のテキストを分析し、それらの番組のあるセグメントで音を消したり、映像を見えなくしたり、またはセグメントを完全に削除したりすべきかどうか識別する機構を提供する。このようにすることで、ユーザは、自分にとって不快かもしれない番組の部分を取り除いた形で、マルチメディア番組を視聴することができる。   Storage device 114 provides a place to store multimedia programs. The subtitle / video analysis unit 116 analyzes the text in the subtitles of the multimedia programs and identifies whether to silence, hide the video or delete the segments completely in certain segments of those programs Provide a mechanism to In this way, the user can view the multimedia program in a form that removes a part of the program that may be unpleasant for him.

字幕/映像分析ユニット116は、マルチメディア番組の映像部分を処理のために復号化する。字幕情報は一般に、映像ストリーム内で映像とは異なるチャネルに割り当てられる。字幕情報は、ユーザが字幕を見たいと望む場合、提示のためにビデオ・アダプタまたはユニットのフレーム・バッファ内で映像に重ね合わされる。この字幕は、映像のクローズド・キャプション部分とも呼ばれる。   The subtitle / video analysis unit 116 decodes the video portion of the multimedia program for processing. Subtitle information is generally assigned to a different channel from the video in the video stream. The caption information is superimposed on the video in the video adapter or unit's frame buffer for presentation when the user wishes to view the caption. This subtitle is also called the closed caption portion of the video.

字幕中のテキストが識別される。テキストは、具体的な実装に応じて、異なる方法で識別することができる。図示の例では、字幕出力専用の映像のクローズド・キャプション部分に対して光学文字認識(OCR:Optical character reader)を実行することができる。この処理から出力されるテキストをフィルタに入力して、不快かもしれないマルチメディア番組の部分を識別することができる。   The text in the subtitle is identified. The text can be identified in different ways, depending on the specific implementation. In the illustrated example, optical character recognition (OCR: Optical character reader) can be performed on a closed caption portion of a video dedicated to subtitle output. The text output from this process can be entered into a filter to identify portions of the multimedia program that may be uncomfortable.

これらの例では、フィルタリングは、ベイジアン・フィルタ(baysean filter)を用いて実行され、ベイジアン・フィルタは、字幕/映像分析ユニット116内に実装することができる。ベイズ・フィルタリングは現在、電子メールのSPAMをフィルタリングする際に使用されている。このタイプのフィルタリングは、マルチメディア番組の様々な部分を格付けするのにも適用することができる。ベイジアン・フィルタでは、マルチメディア番組の1つのシーンまたはセグメント中で、PG(parentalguidance:保護者の付き添いが望ましい)指定の映画にはしばしば現れるが、G指定の映画にはめったに現れないようなテキストが字幕に表示されるならば、そのテキストを含むマルチメディア番組のそのセグメントはPG指定である可能性が高いというベイジアンの推論(bayseaninference)を利用することができる。選択基準がG指定のマルチメディア番組に設定されている場合、その特定のシーンを修正したり削除したりすることができる。そのセグメントに関して、映像を見えなくし、音声を聞こえなくし、または消音と消去の両方を実行することができる。   In these examples, the filtering is performed using a Bayesian filter, which can be implemented in the caption / video analysis unit 116. Bayesian filtering is currently used in filtering email SPAM. This type of filtering can also be applied to rank different parts of a multimedia program. The Bayesian filter contains text that often appears in a PG (parentalguidance) movie but rarely appears in a G movie in a scene or segment of a multimedia program. If displayed in subtitles, Bayesian inference can be used that the segment of the multimedia program containing the text is likely to be PG designated. When the selection criterion is set to a multimedia program designated by G, the specific scene can be corrected or deleted. For that segment, the video can be invisible, the audio can not be heard, or both mute and erase can be performed.

これらの例では、映像のセグメントとは、1つの字幕が表示されている間の映像部分のことである。新しい字幕が表示された場合、マルチメディア番組のセグメントは新しいセグメントに変わる。   In these examples, a video segment is a video portion while one caption is displayed. When a new subtitle is displayed, the segment of the multimedia program is changed to a new segment.

マルチメディア番組をフィルタリングするのに使用する情報は、データ処理システム100のユーザが設定することができる。G(general:一般向け)、PG、PG−13(13才以下は、保護者の付き添いが望ましい)、R(restricted:成人向け)など、様々な映画格付け用のデフォルト設定ファイルを作成することができる。こうしたデフォルト・ファイルは、記憶装置114に保存することができる。さらに、フィルタリングで使用するユーザが提供するファイルも、記憶装置114に保存することができる。このユーザ・ファイルは、様々なソースからもたらされ得る。例えば、フィルタリング機能を含む電子メール・ユーティリティをソースとして使用することができる。SPAMメールをフィルタリングするのに使用するファイルを、データ処理システム100にダウンロードすることができる。もちろん、このファイルとして任意の外部ファイルを使用することもできる。   Information used to filter multimedia programs can be set by a user of the data processing system 100. It is possible to create default setting files for various movie ratings such as G (general: general), PG, PG-13 (under 13 years old, parental guardian is desirable), R (restricted: for adults) it can. Such default files can be stored in the storage device 114. Furthermore, a file provided by a user used for filtering can also be stored in the storage device 114. This user file can come from a variety of sources. For example, an e-mail utility that includes a filtering function can be used as a source. Files used to filter SPAM mail can be downloaded to the data processing system 100. Of course, any external file can be used as this file.

さらに、字幕/映像分析ユニット116は、字幕の可読性を向上させるため、映像に修正を施すことができる。こうした修正には、字幕が現れる画面部分の色を調整したり、字幕中のテキスト表示を調整したりする色訂正を含むことができる。例えば、テキストの色が背景色と類似している場合、テキストを構成する文字を、背景と異なる色で縁取ることができる。さらに、字幕が表示される領域の背景色を変更して、字幕をより読み易くするコントラストを提供することもできる。   Furthermore, the caption / video analysis unit 116 can modify the video to improve the readability of the caption. Such corrections can include color corrections that adjust the color of the screen portion where the subtitles appear or adjust the text display in the subtitles. For example, when the color of the text is similar to the background color, characters constituting the text can be outlined with a color different from the background. Furthermore, the background color of the area where the caption is displayed can be changed to provide contrast that makes the caption more readable.

これらの例において、字幕/映像分析ユニット116は、様々な形態で実装することができる。例えば、この映像ユニットは、適切な特定用途向け集積回路(ASIC)を用いた別個の処理ユニット、および本発明の説明的な例における機能を実行する命令として実装することができる。あるいは、字幕/映像分析ユニット116は、それらの機能を提供するため、処理ユニット104によって実行される命令を含むことができる。   In these examples, the caption / video analysis unit 116 can be implemented in various forms. For example, the video unit can be implemented as a separate processing unit using a suitable application specific integrated circuit (ASIC) and instructions that perform the functions in the illustrative example of the invention. Alternatively, the caption / video analysis unit 116 can include instructions executed by the processing unit 104 to provide those functions.

これらの例において、データ処理システム100は、PVRの形態をとる。この説明には、本発明の機構を実施し得るアーキテクチャに関して限定を設ける意図はない。データ処理システム100は、PVRに見出される機能を使用するマルチメディア番組の受信および操作を可能にするソフトウェアと適切なアダプタ・カードを有するコンピュータを用いて実施することもできる。   In these examples, the data processing system 100 takes the form of a PVR. This description is not intended to be construed as limiting with respect to the architecture in which the features of the present invention may be implemented. The data processing system 100 may also be implemented using a computer with software and an appropriate adapter card that enables the reception and manipulation of multimedia programs that use the functions found in PVR.

このようにして、本発明の機構は、マルチメディア番組の部分をフィルタリングする機能を提供する。あるマルチメディア番組が、全体にわたって不快であるとの格付けを有するとしても、不快な部分を取り除いて、その番組を視聴することができる。音声を聞こえなくし、映像を見えなくし、または消音と消去の両方を実行することができる。   In this way, the mechanism of the present invention provides the ability to filter parts of multimedia programs. Even if a multimedia program has a rating of being unpleasant throughout, it is possible to watch the program with the unpleasant part removed. The sound can be inaudible, the video invisible, or both mute and erase can be performed.

次に図2に移ると、本発明の好ましい一実施形態による、マルチメディア番組をフィルタリングする処理のフローチャートが示されている。図2に示す処理は、図1の字幕/映像分析ユニット116などのフィルタリング・システム内で実施することができる。   Turning now to FIG. 2, there is shown a flowchart of a process for filtering multimedia programs according to a preferred embodiment of the present invention. The process shown in FIG. 2 can be implemented in a filtering system such as the caption / video analysis unit 116 of FIG.

処理は、マルチメディア番組の復号化から開始される(ステップ200)。これらの例では、MPEG2、MPEG3、またはJPEGなどの形式で、映像ストリームを受信する。これらのマルチメディア・ファイルでは、音声チャネルと映像チャネルは、別個のチャネルに分けられている。字幕を含むクローズド・キャプション部は、映像および音声とは別のチャネルに割り当てられる。必要に応じて、クローズド・キャプション部は、字幕を提示するために、映像に重ね合わされる。   The process begins with the decoding of the multimedia program (step 200). In these examples, the video stream is received in a format such as MPEG2, MPEG3, or JPEG. In these multimedia files, the audio and video channels are divided into separate channels. A closed caption section including subtitles is assigned to a channel different from that for video and audio. If necessary, the closed caption unit is superimposed on the video to present subtitles.

このデータの復号化は、図1の処理ユニット104のような処理ユニットなどの構成要素における符号器/復号器処理を用いて実行することができる。符号化および復号化は、具体的な実装に応じて、例で説明するように、または符号化および復号化機能を含む論理回路などのハードウェアで実施することができる。   This data decoding can be performed using encoder / decoder processing in a component such as a processing unit such as processing unit 104 of FIG. Encoding and decoding may be performed in hardware, such as a logic circuit including encoding and decoding functions, as described in the examples, depending on the specific implementation.

復号化されたマルチメディア番組データのセグメントを選択する(ステップ202)。これらの説明的な例では、マルチメディア番組データ内のデータのセグメントは、複数のフレームとして定義される。映像データは通常、セグメント当り30個のフレームで提示される。   A segment of the decoded multimedia program data is selected (step 202). In these illustrative examples, a segment of data within multimedia program data is defined as a plurality of frames. Video data is typically presented in 30 frames per segment.

次に、そのセグメントのデータのクローズド・キャプション部内の字幕からテキストを取得するため、マルチメディア番組データのセグメントに対して光学文字認識を実行する(ステップ204)。このテキストをフィルタリング・アルゴリズムに供給する(ステップ206)。次に、格付けを取得する(ステップ208)。このセグメントの格付けをユーザが選択した選択基準と比較する(ステップ210)。この選択基準は、例えば、PG−13またはRなどの映画の格付けとすることができる。   Next, optical character recognition is performed on the segment of the multimedia program data in order to obtain text from the caption in the closed caption portion of the segment data (step 204). This text is supplied to the filtering algorithm (step 206). Next, a rating is acquired (step 208). The rating of this segment is compared to the selection criteria selected by the user (step 210). This selection criterion can be, for example, a movie rating such as PG-13 or R.

ユーザが選択した選択基準に対してセグメントが適切かどうかについて判断が下される(ステップ212)。例えば、適切な格付けとしてPG−13をユーザが選択しており、フィルタリングの結果、セグメントからRに格付けられたテキストが識別された場合、そのセグメントは不適切なセグメントとして識別される。セグメントが不適切である場合、映像および音声の消去または消音を適宜組み合わせて実行する(ステップ214)。この処理はセグメントに対して実行されるが、実際にはステップ214では、セグメント内のフレーム毎に消去または消音が実行される。修正済のマルチメディア番組データは保存される(ステップ216)。   A determination is made as to whether the segment is appropriate for the selection criteria selected by the user (step 212). For example, if the user has selected PG-13 as an appropriate rating, and the filtering has identified text rated R from the segment, the segment is identified as an inappropriate segment. If the segment is inappropriate, the video and audio are erased or muted appropriately in combination (step 214). This process is performed on the segment. Actually, however, in step 214, erasure or mute is performed for each frame in the segment. The corrected multimedia program data is saved (step 216).

次に、まだ未処理のセグメントが存在するかどうかについて判断が下される(ステップ218)。まだ未処理のセグメントが存在する場合、処理はステップ202に復帰する。もう未処理のセグメントが存在しない場合、マルチメディア番組データを再符号化し(ステップ220)、処理済のマルチメディア番組を保存し(ステップ222)、その後、処理を終了させる。   Next, a determination is made as to whether there are any unprocessed segments (step 218). If there are still unprocessed segments, the process returns to step 202. If there are no more unprocessed segments, the multimedia program data is re-encoded (step 220), the processed multimedia program is saved (step 222), and then the process is terminated.

図2に示す例では、セグメントに関して処理が発生する。もちろん、具体的な実装に応じて、フレームを単位に処理を発生させることができる。さらに、符号化および復号化をハードウェアで実施する場合、ベイズ・フィルタリングなどの他の機能、およびフレーム・バッファを、同じハードウェア・ユニット内に配置することもできる。   In the example shown in FIG. 2, processing occurs for the segment. Of course, processing can be generated in units of frames according to specific implementation. In addition, when encoding and decoding are implemented in hardware, other functions such as Bayesian filtering and the frame buffer can be located in the same hardware unit.

次に図3に移ると、本発明の好ましい一実施形態による、字幕の色訂正を実行する処理のフローチャートが示されている。図3に示す処理は、図1の字幕/映像分析ユニット116などのフィルタリング・システム内で実施することができる。   Turning now to FIG. 3, there is shown a flowchart of a process for performing subtitle color correction according to a preferred embodiment of the present invention. The process shown in FIG. 3 may be implemented in a filtering system such as the caption / video analysis unit 116 of FIG.

処理は、マルチメディア番組データの復号化から開始される(ステップ300)。この例では、マルチメディア番組の映像部分は変更されない。復号化されたデータは保存される(ステップ302)。マルチメディア番組の復号化映像データのセグメントを処理のために選択する(ステップ304)。選択セグメント中の字幕の可読性を向上させるため、このセグメントが色訂正を必要とするかどうかについて判断が下される(ステップ306)。実装に応じて、ステップ306では、字幕中のテキストを覆い隠したり、判読不能にしたりすべきかどうかについて判断を下すこともできる。このステップは、有害なまたはその他の不快な言葉を覆い隠すために実行することができる。訂正が必要な場合、訂正(例えば、色)を実行する(ステップ308)。実行する訂正の具体的なタイプは、実装に応じて変化し得る。例えば、テキストの背景またはテキストを変化させて、背景とテキストとのコントラストを際立たせることができる。別の例では、背景とのコントラストがより大きい色で、テキストを縁取ることができる。また別の例では、テキストのフォントサイズやフォントの種類を変化させることができる。   The process begins with the decoding of the multimedia program data (step 300). In this example, the video portion of the multimedia program is not changed. The decrypted data is stored (step 302). A segment of the decoded video data of the multimedia program is selected for processing (step 304). In order to improve the readability of the subtitles in the selected segment, a determination is made as to whether this segment requires color correction (step 306). Depending on the implementation, at step 306, a determination may be made as to whether the text in the subtitle should be obscured or unreadable. This step can be performed to cover up harmful or other unpleasant language. If correction is necessary, correction (eg, color) is performed (step 308). The specific type of correction to perform can vary depending on the implementation. For example, the background of the text or the text can be changed to enhance the contrast between the background and the text. In another example, the text can be bordered with a color that has a greater contrast with the background. In another example, the text font size and font type can be changed.

次に、映像データ中にまだ未処理のセグメントが存在するかどうかについて判断が下される(ステップ310)。まだ未処理のセグメントが存在する場合、処理はステップ304に復帰する。もう未処理のセグメントが存在しない場合、データを再符号化し(ステップ312)、処理済のマルチメディア番組を後で再生するために保存し(ステップ314)、その後、処理を終了させる。再びステップ306を参照すると、訂正が必要ではない場合、処理は上述したステップ310に進む。   Next, a determination is made as to whether there are any unprocessed segments in the video data (step 310). If there are still unprocessed segments, the process returns to step 304. If there are no more unprocessed segments, the data is re-encoded (step 312) and the processed multimedia program is saved for later playback (step 314), after which the process ends. Referring again to step 306, if no correction is required, processing proceeds to step 310 described above.

したがって、本発明は、マルチメディア番組をフィルタリングするための改良された方法、システム、およびコンピュータ・プログラムを提供する。説明的な例における本発明の機構は、ユーザの選択基準に合致するようにマルチメディア番組のある部分またはセグメントを修正し、その他の部分は修正しないでおくことを可能にする。示された例では、こうした修正には、映像セグメントの消去、そのセグメントの音声の消音、またはそのセグメントの映像消去および音声消音が含まれ得る。   Accordingly, the present invention provides an improved method, system, and computer program for filtering multimedia programs. The inventive mechanism in the illustrative example allows one part or segment of the multimedia program to be modified to meet the user's selection criteria, while the other part is left unmodified. In the example shown, such modifications may include erasing the video segment, muting the audio for the segment, or erasing the video and audio for the segment.

データ処理システムが完全な機能を備えるものとして、本発明を説明してきたが、本発明の処理は命令および様々な形式をとるコンピュータ可読媒体の形式で分散させることが可能であり、本発明が分散を実施するのに使用される信号搬送媒体の具体的なタイプにかかわらず等しく適用されることは、当業者であれば理解されるであろう。このことに留意することが重要である。コンピュータ可読媒体の例として、フロッピ・ディスク、ハード・ディスク・ドライブ、RAM、CD−ROM、DVD−ROMなどの記録可能型媒体と、例えば、無線周波および光波伝送などの伝送形態を用いる、デジタルおよびアナログ通信リンク、有線または無線通信リンクなどの伝送型媒体が挙げられる。コンピュータ可読媒体は、具体的なデータ処理システムで実際に使用する際に復号化される符号化形式の形をとることができる。   Although the present invention has been described as a data processing system having full functionality, the processing of the present invention can be distributed in the form of instructions and computer readable media in various forms. Those skilled in the art will appreciate that the present invention applies equally regardless of the specific type of signal carrier medium used to implement the. It is important to keep this in mind. Examples of computer readable media include digital and digital media using recordable media such as floppy disks, hard disk drives, RAM, CD-ROMs, DVD-ROMs, and transmission forms such as radio frequency and light wave transmissions. Examples include transmission media such as analog communication links, wired or wireless communication links. The computer readable medium may take the form of an encoded form that is decoded when actually used in a specific data processing system.

本発明の説明は、例示および説明の目的で提示されたものであり、開示された形態の本発明に対して網羅的または限定的であろうと意図したものではない。多くの変更および変形が当業者には明らかであろう。開示された実施形態を選択し、説明したのは、本発明の原理および実際の用途を最も良く説明するためであり、他の当業者が本発明を理解して、企図された具体的な用途に適するように様々な変更を施した様々な実施形態を実施できるようにするためである。   The description of the present invention has been presented for purposes of illustration and description, and is not intended to be exhaustive or limiting to the invention in the form disclosed. Many modifications and variations will be apparent to practitioners skilled in this art. The disclosed embodiments have been chosen and described in order to best explain the principles and practical applications of the invention, and specific uses contemplated by others skilled in the art upon understanding the invention. This is because various embodiments in which various modifications are made so as to be suitable for the above can be implemented.

本発明を実施することができるデータ処理システムのブロック図である。1 is a block diagram of a data processing system in which the present invention can be implemented. 本発明の好ましい実施形態による、マルチメディア番組をフィルタリングする処理のフローチャートである。6 is a flowchart of a process for filtering multimedia programs according to a preferred embodiment of the present invention. 本発明の好ましい実施形態による、字幕の色訂正を実行する処理のフローチャートである。6 is a flowchart of a process for performing subtitle color correction according to a preferred embodiment of the present invention;

符号の説明Explanation of symbols

100 データ処理システム
102 バス・システム
104 処理ユニット
106 メモリ
108 音声ユニット
110 映像ユニット
112 通信ユニット
114 記憶装置
116 字幕/映像分析ユニット
118 ディスプレイ
100 Data Processing System 102 Bus System 104 Processing Unit 106 Memory 108 Audio Unit 110 Video Unit 112 Communication Unit 114 Storage Device 116 Subtitle / Video Analysis Unit 118 Display

Claims (22)

マルチメディア番組データを処理するためのデータ処理システムにおける方法であって、
前記マルチメディア番組データの字幕中のテキストを識別して、一連のテキストを生成するステップと、
前記一連のテキストを分析して、分析結果を形成するステップと、
前記分析結果に基づいて改変すべき前記マルチメディア番組データの部分を識別して、識別部分を形成するステップと、
前記識別部分を改変するステップとを含む方法。
A method in a data processing system for processing multimedia program data comprising:
Identifying text in subtitles of the multimedia program data to generate a series of text;
Analyzing the series of texts to form analysis results;
Identifying a portion of the multimedia program data to be modified based on the analysis results to form an identification portion;
Modifying the identification portion.
前記一連のテキストを生成するステップが、
前記マルチメディア番組データの字幕に対して光学文字認識を実行して、前記一連のテキストを生成する、請求項1に記載の方法。
Generating the series of text comprises:
The method of claim 1, wherein optical character recognition is performed on subtitles of the multimedia program data to generate the series of texts.
前記マルチメディア番組データが、映像成分と音声成分とを含み、前記識別部分が、映像部分と音声部分との少なくとも一方を消すことで改変される、請求項1に記載の方法。   The method according to claim 1, wherein the multimedia program data includes a video component and an audio component, and the identification portion is modified by deleting at least one of the video portion and the audio portion. 前記分析結果を形成するステップが、
前記一連のテキストに対してベイジアン・フィルタを実行するステップを含む、請求項1に記載の方法。
Forming the analysis results,
The method of claim 1, comprising performing a Bayesian filter on the series of text.
前記前記一連のテキストを生成するステップの前に実行する、前記マルチメディア番組データを復号化するステップと、
前記識別部分を改変するステップの後に実行する、前記マルチメディア番組データを再符号化するステップとをさらに含む、請求項1に記載の方法。
Decoding the multimedia program data, performed prior to generating the series of text;
The method of claim 1, further comprising re-encoding the multimedia program data performed after the step of modifying the identification portion.
前記マルチメディア番組データが、フレームか、またはフレームのグループかである、請求項1に記載の方法。   The method of claim 1, wherein the multimedia program data is a frame or a group of frames. 前記マルチメディア番組が、映画である、請求項1に記載の方法。   The method of claim 1, wherein the multimedia program is a movie. マルチメディア番組を処理するためのデータ処理システムにおける方法であって、
前記マルチメディア番組を復号化して、復号化マルチメディア番組データを形成するステップと、
前記マルチメディア番組データのある部分を分析するステップと、
前記マルチメディア番組データの前記部分の中にある字幕の可読性が改善を必要とするかどうかを判断するステップと、
前記マルチメディア番組データの前記部分の中にある前記字幕の改善を必要とする前記可読性に応答して、前記字幕を含む前記マルチメディア番組データの一部に対して訂正を実行して、前記字幕の可読性を改善するステップとを含む方法。
A method in a data processing system for processing a multimedia program comprising:
Decoding the multimedia program to form decoded multimedia program data;
Analyzing a portion of the multimedia program data;
Determining whether the readability of subtitles in the portion of the multimedia program data requires improvement;
In response to the readability requiring improvement of the subtitles in the portion of the multimedia program data, performing correction on a portion of the multimedia program data including the subtitles, and Improving the readability of.
マルチメディア番組データを処理するためのデータ処理システムであって、
前記マルチメディア番組データの字幕中のテキストを識別して、一連のテキストを生成する識別手段と、
前記一連のテキストを分析して、分析結果を形成する分析手段と、
前記分析結果に基づいて改変すべき前記マルチメディア番組データの部分を識別して、識別部分を形成する識別手段と、
前記識別部分を改変する改変手段とを含むデータ処理システム。
A data processing system for processing multimedia program data,
Identifying means for identifying text in subtitles of the multimedia program data and generating a series of text;
Analyzing means for analyzing the series of texts to form an analysis result;
Identifying means for identifying a portion of the multimedia program data to be modified based on the analysis result to form an identification portion;
A data processing system including a modification unit that modifies the identification portion.
前記マルチメディア番組データが、映像成分と音声成分を含み、前記改変手段は前記識別部分の映像部分と音声部分との少なくとも一方を消すことで改変する、請求項9に記載のデータ処理システム。   The data processing system according to claim 9, wherein the multimedia program data includes a video component and an audio component, and the modifying unit modifies by deleting at least one of the video portion and the audio portion of the identification portion. 前記分析手段が、
前記一連のテキストに対してベイジアン・フィルタを実行する実行手段を含む、請求項9に記載のデータ処理システム。
The analysis means is
The data processing system according to claim 9, comprising execution means for performing a Bayesian filter on the series of texts.
一連のテキストを生成する前に、前記マルチメディア番組データを復号化する復号化手段と、
前記識別部分を改変した後に、前記マルチメディア番組データを再符号化する再符号化手段とをさらに含む、請求項9に記載のデータ処理システム。
Decoding means for decoding the multimedia program data before generating a series of text;
The data processing system according to claim 9, further comprising re-encoding means for re-encoding the multimedia program data after modifying the identification portion.
前記マルチメディア番組データが、フレームか、またはフレームのグループかである、請求項9に記載のデータ処理システム。   The data processing system according to claim 9, wherein the multimedia program data is a frame or a group of frames. マルチメディア番組を処理するためのデータ処理システムであって、
前記マルチメディア番組を復号化して、復号化済マルチメディア番組データを形成する復号化手段と、
前記復号化済マルチメディア番組データの部分を分析する分析手段と、
前記復号化済マルチメディア番組データの前記部分の中にある字幕の可読性が改善を必要とするかどうかを判断する判断手段と、
前記復号化済マルチメディア番組データの前記部分の中にある前記字幕の改善を必要とする前記可読性に応答して、前記字幕を含む前記復号化済マルチメディア番組データの一部に対して訂正を実行して、前記字幕の可読性を改善する実行手段とを含むデータ処理システム。
A data processing system for processing multimedia programs,
Decoding means for decoding the multimedia program to form decoded multimedia program data;
Analyzing means for analyzing a portion of the decrypted multimedia program data;
Determining means for determining whether the readability of subtitles in the portion of the decoded multimedia program data requires improvement;
In response to the readability requiring improvement of the subtitles in the portion of the decoded multimedia program data, a correction is made to a portion of the decoded multimedia program data that includes the subtitles. A data processing system including execution means for improving readability of the subtitles.
マルチメディア番組データを処理するためのコンピュータ可読媒体中のコンピュータ・プログラムであって、
前記マルチメディア番組データの字幕中のテキストを識別して、一連のテキストを生成する第1の命令と、
前記一連のテキストを分析して、分析結果を形成する第2の命令と、
前記分析結果に基づいて改変すべき前記マルチメディア番組データの部分を識別して、識別部分を形成する第3の命令と、
前記識別部分を改変する第4の命令とを含むコンピュータ・プログラム。
A computer program in a computer readable medium for processing multimedia program data comprising:
A first instruction for identifying text in subtitles of the multimedia program data and generating a series of text;
A second instruction that analyzes the series of texts to form an analysis result;
A third instruction for identifying a part of the multimedia program data to be modified based on the analysis result and forming an identification part;
And a fourth instruction for modifying the identification portion.
前記マルチメディア番組データが、映像成分と音声成分とを含み、前記識別部分が、映像部分と音声部分との少なくとも一方を消すことで改変される、請求項15に記載のコンピュータ・プログラム。   The computer program according to claim 15, wherein the multimedia program data includes a video component and an audio component, and the identification portion is modified by deleting at least one of the video portion and the audio portion. 前記第2の命令が、
前記一連のテキストに対してベイジアン・フィルタを実行するサブ命令を含む、請求項15に記載のコンピュータ・プログラム。
The second instruction is
The computer program product of claim 15, comprising sub-instructions that perform a Bayesian filter on the series of texts.
一連のテキストを生成する前に、前記マルチメディア番組データを復号化する第5の命令と、
前記識別部分を改変した後に、前記マルチメディア番組データを再符号化する第6の命令とをさらに含む、請求項15に記載のコンピュータ・プログラム。
A fifth instruction for decoding the multimedia program data before generating the sequence of text;
The computer program according to claim 15, further comprising: a sixth instruction for re-encoding the multimedia program data after modifying the identification part.
前記マルチメディア番組データが、フレームか、またはフレームのグループかである、請求項15に記載のコンピュータ・プログラム。   The computer program product of claim 15, wherein the multimedia program data is a frame or a group of frames. マルチメディア番組を処理するためのコンピュータ可読媒体中のコンピュータ・プログラムであって、
前記マルチメディア番組を復号化して、復号化済マルチメディア番組データを形成する第1の命令と、
前記復号化済マルチメディア番組データの部分を分析する第2の命令と、
前記復号化済マルチメディア番組データの前記部分の中にある字幕の可読性が改善を必要とするかどうかを判断する第3の命令と、
前記復号化済マルチメディア番組データの前記部分の中にある前記字幕の改善を必要とする前記可読性に応答して、前記字幕を含む前記復号化済マルチメディア番組データの一部に対して訂正を実行して、前記字幕の可読性を改善する第4の命令とを含むコンピュータ・プログラム。
A computer program in a computer readable medium for processing a multimedia program comprising:
A first instruction for decoding the multimedia program to form decoded multimedia program data;
A second instruction for analyzing a portion of the decrypted multimedia program data;
A third instruction for determining whether the readability of subtitles in the portion of the decoded multimedia program data requires improvement;
In response to the readability requiring improvement of the subtitles in the portion of the decoded multimedia program data, a correction is made to a portion of the decoded multimedia program data that includes the subtitles. And a fourth instruction that executes to improve the readability of the subtitles.
バス・システムと、
前記バス・システムに接続される通信ユニットと、
前記バス・システムに接続される、複数の命令を含むメモリと、
前記バス・システムに接続される処理ユニットとを備え、前記処理ユニットに、マルチメディア番組データの字幕中のテキストを識別させ、一連のテキストを生成させる命令と、前記一連のテキストを分析させ、分析結果を形成させる命令と、前記分析結果に基づいて改変すべき前記マルチメディア番組データの部分を識別させ、識別部分を形成させる命令と、前記識別部分を改変させる命令を含むデータ処理システム。
A bus system,
A communication unit connected to the bus system;
A memory including a plurality of instructions connected to the bus system;
A processing unit connected to the bus system, wherein the processing unit is made to identify text in subtitles of multimedia program data and generate a series of text, and to analyze the series of text A data processing system comprising: an instruction for forming a result; an instruction for identifying a part of the multimedia program data to be modified based on the analysis result; forming an identification part; and an instruction for modifying the identification part.
バス・システムと、
前記バス・システムに接続される通信ユニットと、
前記バス・システムに接続される、複数の命令を含むメモリと、
前記バス・システムに接続される処理ユニットとを備え、前記処理ユニットに、マルチメディア番組を復号化させ、復号化マルチメディア番組データを形成させる命令と、前記マルチメディア番組データの部分を分析させる命令と、前記マルチメディア番組データの前記部分の中にある字幕の可読性が改善を必要とするかどうかを判断させる命令と、前記マルチメディア番組データの前記部分の中にある前記字幕の改善を必要とする前記可読性に応答して、前記字幕を含む前記マルチメディア番組データの一部に対して訂正を実行させ、前記字幕の可読性を改善させる命令とを含むデータ処理システム。
A bus system,
A communication unit connected to the bus system;
A memory including a plurality of instructions connected to the bus system;
A processing unit connected to the bus system, instructions for causing the processing unit to decode multimedia programs and to form decoded multimedia program data, and instructions for analyzing a part of the multimedia program data And instructions for determining whether the readability of subtitles in the portion of the multimedia program data requires improvement, and improvement of the subtitles in the portion of the multimedia program data is required. In response to the readability, a data processing system including an instruction for executing correction on a part of the multimedia program data including the caption and improving the readability of the caption.
JP2004280918A 2004-09-28 2004-09-28 Method, system and program for analyzing caption in multimedia program Withdrawn JP2006100880A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004280918A JP2006100880A (en) 2004-09-28 2004-09-28 Method, system and program for analyzing caption in multimedia program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004280918A JP2006100880A (en) 2004-09-28 2004-09-28 Method, system and program for analyzing caption in multimedia program

Publications (1)

Publication Number Publication Date
JP2006100880A true JP2006100880A (en) 2006-04-13

Family

ID=36240324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004280918A Withdrawn JP2006100880A (en) 2004-09-28 2004-09-28 Method, system and program for analyzing caption in multimedia program

Country Status (1)

Country Link
JP (1) JP2006100880A (en)

Similar Documents

Publication Publication Date Title
JP2005110263A (en) Method, system and program for analyzing subtitles in multimedia program
MXPA04010029A (en) Display of closed captioned information during video trick modes.
US7149365B2 (en) Image information summary apparatus, image information summary method and image information summary processing program
JP4735413B2 (en) Content playback apparatus and content playback method
JP2000057749A (en) Recording apparatus and recording method, reproducing apparatus and reproducing method, and storage medium
US20080063361A1 (en) Recording/reproduction apparatus, display control method, and program
US20080056663A1 (en) File Recording Apparatus, File Recording Method, Program of File Recording Process, Storage Medium in Which a Program of File Recording Processing in Stored, File Playback Apparatus File Playback Method Program of File Playback Process
JP4786888B2 (en) Video stream processing device
US20070230907A1 (en) Image processing apparatus and file reproducing method
US8005338B2 (en) Recording and reproducing device
JP2008154132A (en) Audio/video stream compression apparatus and audio/video recording device
US8406612B2 (en) Broadcast recording apparatus and broadcast recording method
JP2006100880A (en) Method, system and program for analyzing caption in multimedia program
JP2007288686A (en) Broadcast recording apparatus and method
JP2009094966A (en) Reproducing device, reproduction method, and reproduction control program
JP2008141383A (en) Video editing device, system, and method
JP7308457B2 (en) Recording device and recording method
JP2008206076A (en) Playback apparatus and method, and program
JP6646561B2 (en) Electronic device and display control method
JP2008011397A (en) Data broadcast playback apparatus and method
KR100839695B1 (en) Apparatus and method for ripping in digital recorder
KR100546666B1 (en) Fabrication of digital recoder and Operating method of the same
JP5559238B2 (en) Electronic apparatus and method
JP2009218874A (en) Recording/reproducing device
JP2007234089A (en) Recording and reproducing device

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060711

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060725

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20061025

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20061030

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070115