JP2009049474A - Information processing apparatus and re-encoding method - Google Patents

Information processing apparatus and re-encoding method Download PDF

Info

Publication number
JP2009049474A
JP2009049474A JP2007210973A JP2007210973A JP2009049474A JP 2009049474 A JP2009049474 A JP 2009049474A JP 2007210973 A JP2007210973 A JP 2007210973A JP 2007210973 A JP2007210973 A JP 2007210973A JP 2009049474 A JP2009049474 A JP 2009049474A
Authority
JP
Japan
Prior art keywords
encoding
information
indexing
encoding method
image information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007210973A
Other languages
Japanese (ja)
Inventor
Yoshiyuki Hirabayashi
義幸 平林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2007210973A priority Critical patent/JP2009049474A/en
Publication of JP2009049474A publication Critical patent/JP2009049474A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an information processing apparatus capable of adjusting a bit rate depending on the importance of a scene by using information obtained by indexing, and to provide a re-encoding method. <P>SOLUTION: The information processing apparatus has a structure in which motion picture data are decoded, the decoded motion picture data are subjected to indexing processing by an indexing processing section 60, and the motion picture data are re-encoded on the basis of a result of the indexing processing and a parameter set in advance. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

この発明は、例えば画像情報をトランスコードする技術に係り、特に所定の条件に一致した箇所の画質を向上することができる情報処理装置および再符号化方法に関する。   The present invention relates to a technique for transcoding image information, for example, and more particularly to an information processing apparatus and a re-encoding method that can improve image quality at a location that matches a predetermined condition.

近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き予測・補償とにより圧縮するMPEGなどの方式に準拠した装置が普及している。   In recent years, image information has been handled as digital data. At that time, for the purpose of efficient transmission and storage of information, compression is performed by orthogonal transform such as discrete cosine transform and motion prediction / compensation using redundancy unique to image information. An apparatus conforming to a system such as MPEG is widely used.

さらに、テレビ会議用の画像符号化を当初の目的として、H.264(ITU-T Q6/16 VCEG)符号化方式の標準化が行われた。H.264は、MPEG2やMPEG4といった従来の符号化方式に比して、その符号化、復号により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。   Furthermore, the standardization of the H.264 (ITU-T Q6 / 16 VCEG) encoding method was performed with the initial purpose of image encoding for video conferencing. H. H.264 is known to achieve higher encoding efficiency than a conventional encoding method such as MPEG2 or MPEG4, although a larger amount of calculation is required for encoding and decoding.

例えば、MPEG2形式の符号化情報からH.264形式の符号化情報にトランスコードする場合、トランスコードの際画質の低下を抑えるために、入力ストリームをメモリに一時記憶し、長時間(数分)画質の推移を把握してエンコードに反映させる方法が開示されている(例えば特許文献1等参照)。
特開2006−295502公報
For example, MPEG-2 format encoded information is converted into H.264 format. When transcoding to H.264 format encoded information, the input stream is temporarily stored in memory in order to suppress degradation in image quality during transcoding, and the transition of image quality over a long period (several minutes) is grasped and reflected in the encoding. A method is disclosed (see, for example, Patent Document 1).
JP 2006-295502 A

この特許文献1の技術では、入力ストリームの画質の変化に応じてエンコードのパラメータを動的に変化させるだけであり、映像シーンに応じた制御を行うことができない。   In the technique of this patent document 1, only the encoding parameter is dynamically changed according to the change in the image quality of the input stream, and control according to the video scene cannot be performed.

この発明は、このような事情を考慮してなされたものであり、シーンの重要度に応じてビットレートを調節することができる情報処理装置および再符号化方法を提供することを目的とする。   The present invention has been made in view of such circumstances, and an object thereof is to provide an information processing apparatus and a re-encoding method capable of adjusting the bit rate according to the importance of a scene.

上記目的を達成するために、本発明の一態様によれば、画像情報が第1の符号化方式で符号化された第1符号化データを、第2の符号化方式で符号化された第2符号化データにトランスコードする情報処理装置であって、前記第1符号化データを復号化する復号化手段と、前記復号化手段が復号化した画像情報に対し、1以上のインデックスを付与して複数のシーンに分割するインデキシング手段と、前記復号化手段が復号化した画像情報を、前記インデキシング手段が分割した各シーン毎に異なる画質で符号化して前記第2符号化データに符号化する符号化手段と、を具備することを特徴とする情報処理装置が提供される。   In order to achieve the above object, according to one aspect of the present invention, first encoded data obtained by encoding image information using a first encoding scheme is encoded using a second encoding scheme. An information processing apparatus that transcodes into two encoded data, the decoding means for decoding the first encoded data, and one or more indexes assigned to the image information decoded by the decoding means An indexing unit that divides the image into a plurality of scenes, and a code that encodes the image information decoded by the decoding unit with different image quality for each scene divided by the indexing unit and encodes the second encoded data And an information processing apparatus.

また、画像情報が第1の符号化方式で符号化された第1符号化データを、第2の符号化方式で符号化された第2符号化データにトランスコードする再符号化方法であって、前記第1符号化データを復号化する復号化ステップと、前記復号化ステップで復号化された画像情報に対し、1以上のインデックスを付与して複数のシーンに分割するインデキシングステップと、前記復号化手段が復号化した画像情報を、前記インデキシング手段が分割した各シーン毎に異なる画質で符号化して前記第2符号化データに符号化する符号化ステップと、を有することを特徴とする再符号化方法が提供される。   A re-encoding method for transcoding first encoded data obtained by encoding image information using a first encoding method into second encoded data encoded using a second encoding method. A decoding step of decoding the first encoded data, an indexing step of assigning one or more indexes to the image information decoded in the decoding step and dividing the information into a plurality of scenes, and the decoding And a coding step of coding the image information decoded by the coding means with different image quality for each scene divided by the indexing means and coding the second coded data. A method is provided.

この発明によれば、シーンの重要度に応じてビットレートを調節することができる情報処理装置および再符号化方法を提供できる。   According to the present invention, it is possible to provide an information processing apparatus and a re-encoding method that can adjust the bit rate according to the importance of a scene.

以下、図面を参照して、この発明の実施の形態を説明する。   Embodiments of the present invention will be described below with reference to the drawings.

まず、図1および図2を参照して、この発明の一実施形態に係る情報処理装置の構成について説明する。この情報処理装置は、例えばノートブック型パーソナルコンピュータ10として実現されている。   First, the configuration of an information processing apparatus according to an embodiment of the present invention will be described with reference to FIGS. This information processing apparatus is realized as, for example, a notebook personal computer 10.

図1は、ノートブック型パーソナルコンピュータ10のディスプレイユニットを開いた状態における斜視図である。本コンピュータ10は、コンピュータ本体1と、ディスプレイユニット2とから構成されている。ディスプレイユニット2には、LCD(Liquid Crystal Display)3から構成される表示装置が組み込まれており、そのLCD3の表示画面は、ディスプレイユニット2のほぼ中央に位置されている。   FIG. 1 is a perspective view of the notebook personal computer 10 with the display unit opened. The computer 10 includes a computer main body 1 and a display unit 2. The display unit 2 incorporates a display device composed of an LCD (Liquid Crystal Display) 3, and the display screen of the LCD 3 is positioned substantially at the center of the display unit 2.

ディスプレイユニット2は、コンピュータ本体1に対して開放位置と閉塞位置との間を回動自在に取り付けられている。コンピュータ本体1は薄い箱形の筐体を有しており、その上面にはキーボード4、本コンピュータ10を電源オン/オフするためのパワーボタン5、入力操作パネル6およびタッチパッド7などが配置されている。   The display unit 2 is attached to the computer main body 1 so as to be rotatable between an open position and a closed position. The computer main body 1 has a thin box-shaped housing, and a keyboard 4, a power button 5 for turning on / off the computer 10, an input operation panel 6, a touch pad 7, and the like are arranged on the upper surface. ing.

入力操作パネル6は、押下されたボタンに対応するイベントをシステムに入力する入力装置であり、複数の機能をそれぞれに起動するための複数のボタンを備えている。これらボタン群には、TV起動ボタン6A、DVD(Digital Versatile Disc)起動ボタン6Bが含まれている。TV起動ボタン6Aは、デジタルTV放送番組のような放送番組データの再生及び記録を行うためのTV機能を起動するためのボタンであり、ユーザによって押下されると、このTV機能を実行するためのTVアプリケーションプログラムが起動される。また、DVD起動ボタン6Bは、DVDに記録されたビデオコンテンツを再生するためのボタンであり、ユーザによって押下されると、ビデオコンテンツを再生するためのアプリケーションプログラムが自動的に起動される。   The input operation panel 6 is an input device that inputs an event corresponding to a pressed button to the system, and includes a plurality of buttons for starting a plurality of functions. These button groups include a TV start button 6A and a DVD (Digital Versatile Disc) start button 6B. The TV start button 6A is a button for starting a TV function for reproducing and recording broadcast program data such as a digital TV broadcast program. When the TV start button 6A is pressed by the user, the TV function is executed. The TV application program is activated. The DVD activation button 6B is a button for reproducing the video content recorded on the DVD. When pressed by the user, an application program for reproducing the video content is automatically activated.

次に、図2を参照して、本コンピュータ10のシステム構成について説明する。   Next, the system configuration of the computer 10 will be described with reference to FIG.

コンピュータ10は、図2に示されているように、CPU11、ノースブリッジ12、主メモリ13、グラフィクスコントローラ14、サウスブリッジ15、BIOS−ROM16、ハードディスクドライブ(HDD)17、光ディスクドライブ(ODD)18、デジタルTV放送チューナ19、エンベデッドコントローラ/キーボードコントローラIC(EC/KBC)20およびネットワークコントローラ21、副プロセッサ90等を備えている。   As shown in FIG. 2, the computer 10 includes a CPU 11, a north bridge 12, a main memory 13, a graphics controller 14, a south bridge 15, a BIOS-ROM 16, a hard disk drive (HDD) 17, an optical disk drive (ODD) 18, A digital TV broadcast tuner 19, an embedded controller / keyboard controller IC (EC / KBC) 20, a network controller 21, a sub processor 90, and the like are provided.

CPU11は、本コンピュータ10の動作を制御するために設けられたプロセッサであり、HDD17から主メモリ13にロードされる、オペレーティングシステム(OS)およびビデオ再生アプリケーションプログラム100のような各種アプリケーションプログラムを実行する。   The CPU 11 is a processor provided for controlling the operation of the computer 10, and executes various application programs such as an operating system (OS) and a video playback application program 100 that are loaded from the HDD 17 to the main memory 13. .

副プロセッサ90は、符号化された動画像データを復号化(デコード)、再符号化および再生するためのハードウェアである。この副プロセッサ90は、H.264/AVC規格に対応するハードウェアデコーダである。副プロセッサ90は、H.264/AVC規格で定義された符号化方式で符号化されている動画像ストリーム(例えばデジタルTV放送チューナ19により受信されるデジタルTV放送番組やODD18から読み出されるHD(High Definition)規格のビデオコンテンツなど)をデコードするデコード機能を有している。また、デコードして得られるTV番組等を再符号化する機能を有している。この再符号化は、例えば、録画されたTV番組中のCM等の重要度の低いシーンのビットレートを低くする処理等を行い、ファイル容量を少なくする等を目的として行う。   The sub processor 90 is hardware for decoding (decoding), re-encoding and reproducing encoded moving image data. The sub processor 90 is connected to the H.264. This is a hardware decoder corresponding to the H.264 / AVC standard. The secondary processor 90 is connected to the H.264. H.264 / AVC standard encoded video stream (for example, a digital TV broadcast program received by the digital TV broadcast tuner 19 or an HD (High Definition) standard video content read from the ODD 18) ). It also has a function of re-encoding a TV program obtained by decoding. This re-encoding is performed for the purpose of reducing the file capacity by performing a process of reducing the bit rate of a low importance scene such as a CM in a recorded TV program, for example.

この他、副プロセッサ90は、デコードして得られるTV番組等の動画像を解析して、例えば無音区間の検出や、顔画像の検出等に応じてインデキシング処理も行う。インデキシング処理では、該動画像に対してインデックスを付与することにより、複数のシーンに分割することができ、例えばCM区間や、特定の人物が出演しているシーン等を区別することができる。   In addition, the sub processor 90 analyzes a moving image such as a TV program obtained by decoding, and performs an indexing process in accordance with, for example, detection of a silent section or detection of a face image. In the indexing process, an index is assigned to the moving image, so that it can be divided into a plurality of scenes. For example, a CM section, a scene where a specific person appears, and the like can be distinguished.

CPU11は、BIOS−ROM16に格納されたBIOS(Basic Input Output System)も実行する。BIOSはハードウェア制御のためのプログラムである。   The CPU 11 also executes a basic input output system (BIOS) stored in the BIOS-ROM 16. The BIOS is a program for hardware control.

ノースブリッジ12は、CPU11のローカルバスとサウスブリッジ15との間を接続するブリッジデバイスである。ノースブリッジ12には、主メモリ13をアクセス制御するメモリコントローラも内蔵されている。また、ノースブリッジ12は、AGP(Accelerated Graphics Port)バスなどを介してグラフィクスコントローラ14との通信を実行する機能も有している。   The north bridge 12 is a bridge device that connects the local bus of the CPU 11 and the south bridge 15. The north bridge 12 also includes a memory controller that controls access to the main memory 13. The north bridge 12 also has a function of executing communication with the graphics controller 14 via an AGP (Accelerated Graphics Port) bus or the like.

グラフィクスコントローラ14は本コンピュータ10のディスプレイモニタとして使用されるLCD3を制御する表示コントローラである。このグラフィクスコントローラ14はビデオメモリ(VRAM)14Aに書き込まれた画像データからLCD3に送出すべき表示信号を生成する。   The graphics controller 14 is a display controller that controls the LCD 3 used as a display monitor of the computer 10. The graphics controller 14 generates a display signal to be sent to the LCD 3 from the image data written in the video memory (VRAM) 14A.

サウスブリッジ15は、LPC(Low Pin Count)バス上の各デバイス、およびPCI(Peripheral Component Interconnect)バス上の各デバイスを制御する。また、サウスブリッジ15は、HDD17、ODD18を制御するためのIDE(Integrated Drive Electronics)コントローラを内蔵している。さらに、サウスブリッジ15は、BIOS−ROM16をアクセス制御するための機能、およびPCIバスを介してデジタルTV放送チューナ19を制御する機能も有している。   The south bridge 15 controls each device on an LPC (Low Pin Count) bus and each device on a PCI (Peripheral Component Interconnect) bus. The south bridge 15 includes an IDE (Integrated Drive Electronics) controller for controlling the HDD 17 and the ODD 18. Further, the south bridge 15 has a function for controlling access to the BIOS-ROM 16 and a function for controlling the digital TV broadcast tuner 19 via the PCI bus.

HDD17は、各種ソフトウェア及びデータを格納する記憶装置である。光ディスクドライブ(ODD)18は、ビデオコンテンツが格納されたDVDなどの記憶メディアを駆動するためのドライブユニットである。デジタルTV放送チューナ19は、デジタルTV放送番組のような放送番組データを外部から受信するための受信装置である。   The HDD 17 is a storage device that stores various software and data. An optical disk drive (ODD) 18 is a drive unit for driving a storage medium such as a DVD in which video content is stored. The digital TV broadcast tuner 19 is a receiving device for receiving broadcast program data such as a digital TV broadcast program from the outside.

EC/KBC20は、電力管理のためのエンベデッドコントローラと、キーボード(KB)4およびタッチパッド7を制御するためのキーボードコントローラとが集積された1チップマイクロコンピュータである。EC/KBC20は、ユーザによるパワーボタン5の操作に応じて本コンピュータ10を電源オン/オフする機能を有している。さらに、EC/KBC20は、ユーザによるTV起動ボタン6A、DVD起動ボタン6Bの操作に応じて、本コンピュータ10を電源オンすることもできる。ネットワークコントローラ21は、例えばインターネット等の外部ネットワークとの通信を実行する通信装置である。   The EC / KBC 20 is a one-chip microcomputer in which an embedded controller for power management and a keyboard controller for controlling the keyboard (KB) 4 and the touch pad 7 are integrated. The EC / KBC 20 has a function of turning on / off the computer 10 in accordance with the operation of the power button 5 by the user. Further, the EC / KBC 20 can also turn on the computer 10 in accordance with the operation of the TV start button 6A and the DVD start button 6B by the user. The network controller 21 is a communication device that executes communication with an external network such as the Internet.

図3は、このような構成のコンピュータ10上で動作する副プロセッサ90が有する機能の機能ブロック図である。   FIG. 3 is a functional block diagram of functions of the sub-processor 90 operating on the computer 10 having the above configuration.

副プロセッサ90は、図3に示すように、Transcode前の記憶装置50、Reader51、64、Demuxer52、映像Decoder53、映像Encoder61、音声Decoder54、音声Encoder55、スケーラ56、Muxer57、Writer58、65、Transcode後の記憶装置59、インデキシング処理部60、インデキシングデータの記憶装置66、インデキシング後処理部63、EPGなどの番組情報62を備えている。   As shown in FIG. 3, the sub processor 90 stores the storage device 50 before Transcode, Readers 51 and 64, Demuxer 52, video Decoder 53, video Encoder 61, audio Decoder 54, audio Encoder 55, scaler 56, Muxer 57, Writer 58 and 65, and storage after Transcode. A device 59, an indexing processing unit 60, an indexing data storage device 66, a post-indexing processing unit 63, and program information 62 such as an EPG are provided.

Transcode前記憶装置50は、録画されたTV番組等である画像情報を記憶するHDD17である。Reader51は、録画されたTV番組等である画像情報をTranscode前記憶装置50から読み出す。Demuxer52は、画像情報から音声情報と映像情報とを分離する。映像Decoder53、音声Decoder54は、それぞれ映像情報および音声情報のデコードを行う。音声Encoder55は、デコードされた音声のエンコードを行う。スケーラ56は、映像情報のスケールの変更を行う。Muxer57は、エンコードされた音声情報とスケールの変更が行われた映像情報とを合成処理する。インデキシング処理部60は、音声Decoder54およびスケーラ56からの音声情報および映像情報によって、インデキシング処理を行ってインデックスを付与して複数のシーンに分割すると共に、各シーンの重要度を決定する。インデキシングデータの記憶装置66は、インデキシングデータをWriter65により記憶するHDD17である。EPGなどの番組情報62は、EPG等の番組情報を配信しているサイト等から受信した番組表データである。インデキシング後処理部63は、インデキシングデータの記憶装置66からインデキシングデータをReader64によって読み出し、画像情報に適用する。この際、EPGなどの番組情報62から番組情報も読み出し、インデキシング後処理に適用する。このインデキシング後処理によって、画像情報は、CM等の重要度の低い箇所(シーン)のビットレートを下げる処理が行われ、映像Encoder61に出力される。   The pre-Transcode storage device 50 is an HDD 17 that stores image information such as recorded TV programs. The Reader 51 reads image information such as a recorded TV program from the pre-Transcode storage device 50. The Demuxer 52 separates audio information and video information from the image information. The video decoder 53 and the audio decoder 54 decode video information and audio information, respectively. The audio encoder 55 encodes the decoded audio. The scaler 56 changes the scale of the video information. The Muxer 57 synthesizes the encoded audio information and the video information whose scale has been changed. The indexing processing unit 60 performs indexing processing according to audio information and video information from the audio decoder 54 and the scaler 56, assigns an index to divide it into a plurality of scenes, and determines the importance of each scene. The indexing data storage device 66 is the HDD 17 that stores the indexing data by the writer 65. Program information 62 such as EPG is program guide data received from a site or the like that distributes program information such as EPG. The post-indexing processing unit 63 reads the indexing data from the indexing data storage device 66 by the reader 64 and applies it to the image information. At this time, the program information is also read from the program information 62 such as EPG and applied to the post-indexing process. By this post-indexing process, the image information is subjected to a process of reducing the bit rate of a less important part (scene) such as a CM, and is output to the video encoder 61.

画像情報の重要度の高低(評価値)は、例えば図4に示すように、予めパラメータ情報として設定される。例えば、録画したTV番組のジャンルによって、以下のように設定する。なお、録画したTV番組のジャンルは、EPG等の番組表データに基づいて判別可能である。   The level of importance (evaluation value) of the image information is set in advance as parameter information, for example, as shown in FIG. For example, the following settings are made according to the genre of the recorded TV program. The genre of the recorded TV program can be determined based on program guide data such as EPG.

まず、録画されたTV番組の元の画質が、例えば17Mbps(第1符号化データ)であるとする。この画質を所定の条件によって、第2符号化データである、15〜8.5Mbpsにトランスコードする。   First, it is assumed that the original image quality of a recorded TV program is, for example, 17 Mbps (first encoded data). This image quality is transcoded to 15 to 8.5 Mbps, which is the second encoded data, according to a predetermined condition.

例えば、CMは全番組において、ビットレート8.5Mbpsとして、最低の画質にトランスコードの設定を行う。また、録画されたTV番組がスポーツ、例えばサッカーであれば、例えば、アナウンサー等の音声データを検出し、「ゴール」や「フリーキック」等のキーワードを検出した場合は、評価値0.8として17Mbpsのビットレート(最高画質)とする。また、歓声の音量を検出し、歓声の音量の割合によって、評価値を設定する。例えば、評価値は0.2〜0.8とする。ビットレートは、図4に示すように評価値に対応して、10、12、15、17(Mbps)とする。   For example, CM sets transcode to the lowest image quality at a bit rate of 8.5 Mbps in all programs. If the recorded TV program is a sport such as soccer, for example, voice data such as an announcer is detected, and if a keyword such as “goal” or “free kick” is detected, the evaluation value is 0.8. The bit rate (maximum image quality) is 17 Mbps. Also, the cheer volume is detected, and the evaluation value is set according to the ratio of the cheer volume. For example, the evaluation value is 0.2 to 0.8. As shown in FIG. 4, the bit rate is set to 10, 12, 15, 17 (Mbps) corresponding to the evaluation value.

さらに、録画されたTV番組のジャンルがドラマであれば、お気に入りの出演者を登録し、この出演者に一致する条件の割合で評価値を0〜0.8に設定する。例えば、字幕のキーワードに一致した回数や、顔認識を用いて、お気に入りの出演者である確率の高さ等で評価値を設定する。例えば、評価値は0.2〜0.8とする。ビットレートは、図4に示すように評価値に対応して、10、12、15、17(Mbps)とする。   Furthermore, if the genre of the recorded TV program is a drama, a favorite performer is registered, and the evaluation value is set to 0 to 0.8 at a ratio of conditions that match the performer. For example, the evaluation value is set based on the number of times that the keyword matches the subtitle keyword, the probability of being a favorite performer, or the like using face recognition. For example, the evaluation value is 0.2 to 0.8. As shown in FIG. 4, the bit rate is set to 10, 12, 15, 17 (Mbps) corresponding to the evaluation value.

また、録画されたTV番組のジャンルが歌番組であれば、お気に入りの出演者や歌を登録し、この出演者や歌に一致する条件の割合で評価値を0〜0.8に設定する。例えば、字幕のキーワードに一致した回数や、顔認識を用いて、お気に入りの出演者である確率の高さ等で評価値を設定する。さらに、メロディーの一致度に応じて、登録した歌である確率に応じて評価値を設定することもできる。例えば、評価値は0.2〜0.8とする。ビットレートは、図4に示すように評価値に対応して、10、12、15、17(Mbps)とする。   Further, if the genre of the recorded TV program is a song program, a favorite performer or song is registered, and the evaluation value is set to 0 to 0.8 at a ratio of conditions matching the performer or song. For example, the evaluation value is set based on the number of times that the keyword matches the subtitle keyword, the probability of being a favorite performer, or the like using face recognition. Furthermore, an evaluation value can be set according to the probability of being a registered song according to the degree of coincidence of the melody. For example, the evaluation value is 0.2 to 0.8. As shown in FIG. 4, the bit rate is set to 10, 12, 15, 17 (Mbps) corresponding to the evaluation value.

次に、図5のフローチャートを参照して、副プロセッサ90の処理の手順を説明する。   Next, the processing procedure of the sub processor 90 will be described with reference to the flowchart of FIG.

Transcode前記憶装置50は、録画されたTV番組等である画像情報を読み出し、動画データの再生を開始する(ステップS101)。副プロセッサ90はTVアプリケーションプログラムの設定が画質重視設定か否かを判別する(ステップS102)。副プロセッサ90は、TVアプリケーションプログラムの設定が画質重視設定であった場合には、画質設定に従って処理を行う。すなわち、トランスコードを行わずに、すべて最高画質で動画データを保存する。   The pre-Transcode storage device 50 reads out image information such as a recorded TV program and starts reproduction of moving image data (step S101). The sub processor 90 determines whether or not the setting of the TV application program is an image quality-oriented setting (step S102). If the setting of the TV application program is an image quality-oriented setting, the sub processor 90 performs processing according to the image quality setting. That is, the moving image data is stored with the highest image quality without transcoding.

一方、TVアプリケーションプログラムの設定が画質重視設定でない場合は(ステップS102のNO)、副プロセッサ90は、動画データのインデキシング処理を行う。このインデキシング処理では、動画データの音声検出や、字幕検出、歓声検出、顔認識、CM検出等を行い、インデキシングデータとしてインデキシングデータの記憶装置66に記憶する(ステップS103)。   On the other hand, when the setting of the TV application program is not the image quality priority setting (NO in step S102), the sub processor 90 performs the indexing process of the moving image data. In this indexing process, voice detection of video data, caption detection, cheer detection, face recognition, CM detection, and the like are performed and stored as indexing data in the indexing data storage device 66 (step S103).

副プロセッサ90のインデキシング後処理部63は、インデキシングデータの記憶装置66からインデキシングデータを読み出し、またEPGなどの番組情報62から番組情報も読み出し(ステップS104)、インデキシング後処理を行う(ステップS105)。このインデキシング後処理によって、画像情報は、CM等の重要度の低い箇所(シーン)のビットレートを下げる処理が行われ。映像Encoder61に出力される。   The post-indexing processing unit 63 of the sub processor 90 reads the indexing data from the indexing data storage device 66, and also reads the program information from the program information 62 such as EPG (step S104), and performs post-indexing processing (step S105). By this post-indexing process, the image information is subjected to a process of lowering the bit rate of a less important part (scene) such as a CM. It is output to the video Encoder 61.

以上のように、本実施形態によれば、インデキシングにより得られた情報などを用いて、シーンの重要度に応じてビットレートを調節することができる。このため、重要度の低いシーンでは、ビットレートを下げることができるため、録画された番組データのファイルサイズを抑えることができる。   As described above, according to the present embodiment, the bit rate can be adjusted according to the importance of the scene using information obtained by indexing or the like. For this reason, since the bit rate can be lowered in a less important scene, the file size of recorded program data can be suppressed.

なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。   Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. In addition, various inventions can be formed by appropriately combining a plurality of components disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.

本発明の一実施形態に係るコンピュータの外観を示す斜視図。The perspective view showing the appearance of the computer concerning one embodiment of the present invention. 同実施形態のコンピュータのシステム構成を示す図。The figure which shows the system configuration | structure of the computer of the embodiment. 同実施形態のコンピュータで用いられる副プロセッサが有する機能の機能ブロック図。The functional block diagram of the function which the subprocessor used with the computer of the embodiment has. インデキシング処理に用いる各種パラメータを示す模式図。The schematic diagram which shows the various parameters used for an indexing process. 同実施形態の処理の手順を示すフローチャート。The flowchart which shows the procedure of the process of the embodiment.

符号の説明Explanation of symbols

1…コンピュータ本体、2…ディスプレイユニット、3…LCD、4…キーボード、5…パワーボタン、6…入力操作パネル、6A…TV起動ボタン、6B…DVD起動ボタン、7…タッチパッド、10…コンピュータ、11…CPU、12…ノースブリッジ、13…主メモリ、14…グラフィクスコントローラ、14A…ビデオメモリ、15…サウスブリッジ、16…BIOS−ROM、17…ハードディスクドライブ(HDD)、18…光ディスクドライブ(ODD)、19…デジタルTV放送チューナ、20…エンベデッドコントローラ/キーボードコントローラIC(EC/KBC)、21…ネットワークコントローラ、50…Transcode前の記憶装置、51、64…Reader、52…Demuxer、53…映像Decoder、61…映像Encoder、54…音声Decoder、55…音声Encoder、56…スケーラ、57…Muxer、58、65…Writer、59…Transcode後の記憶装置、60…インデキシング処理部、62…EPGなどの番組情報、63…インデキシング後処理部、66…インデキシングデータの記憶装置、90…副プロセッサ、100…ビデオ再生アプリケーションプログラム、110…復号処理部、111…スライスヘッダ処理部、112…スライスデータ処理部、112A…マクロブロック構文解析処理部、120…信号処理部、121…信号処理制御部、122…マクロブロック信号処理部、123…デブロック処理部、201…逆量子化部、202…逆DCT部、203…加算部、204…モード切替スイッチ部、205…イントラ予測部、206…重み付き予測部、207…動きベクトル予測部、208…補間予測部。 DESCRIPTION OF SYMBOLS 1 ... Computer main body, 2 ... Display unit, 3 ... LCD, 4 ... Keyboard, 5 ... Power button, 6 ... Input operation panel, 6A ... TV start button, 6B ... DVD start button, 7 ... Touchpad, 10 ... Computer, DESCRIPTION OF SYMBOLS 11 ... CPU, 12 ... North bridge, 13 ... Main memory, 14 ... Graphics controller, 14A ... Video memory, 15 ... South bridge, 16 ... BIOS-ROM, 17 ... Hard disk drive (HDD), 18 ... Optical disk drive (ODD) , 19 ... Digital TV broadcast tuner, 20 ... Embedded controller / keyboard controller IC (EC / KBC), 21 ... Network controller, 50 ... Storage device before Transcode, 51, 64 ... Reader, 52 ... Demuxer, 53 ... Video decoder, 61 ... Video Encoder, 54 ... Audio D ecoder, 55 ... audio encoder, 56 ... scaler, 57 ... muxer, 58, 65 ... writer, 59 ... storage device after transcoding, 60 ... indexing processing unit, 62 ... program information such as EPG, 63 ... post-indexing processing unit, 66 ... Indexing data storage device, 90 ... Sub processor, 100 ... Video playback application program, 110 ... Decoding processing unit, 111 ... Slice header processing unit, 112 ... Slice data processing unit, 112A ... Macroblock parsing processing unit, 120 DESCRIPTION OF SYMBOLS ... Signal processing part 121 ... Signal processing control part 122 ... Macroblock signal processing part 123 ... Deblock processing part 201 ... Inverse quantization part 202 ... Inverse DCT part 203 ... Adder part 204 ... Mode change switch , 205 ... Intra prediction unit, 206 ... Weighted prediction unit, 207 ... Motion vector prediction , 208 ... interpolation prediction unit.

Claims (8)

画像情報が第1の符号化方式で符号化された第1符号化データを、第2の符号化方式で符号化された第2符号化データにトランスコードする情報処理装置であって、
前記第1符号化データを復号化する復号化手段と、
前記復号化手段が復号化した画像情報に対し、1以上のインデックスを付与して複数のシーンに分割するインデキシング手段と、
前記復号化手段が復号化した画像情報を、前記インデキシング手段が分割した各シーン毎に異なる画質で符号化して前記第2符号化データに符号化する符号化手段と、
を具備することを特徴とする情報処理装置。
An information processing apparatus that transcodes first encoded data obtained by encoding image information using a first encoding method into second encoded data encoded using a second encoding method,
Decoding means for decoding the first encoded data;
Indexing means for assigning one or more indexes to the image information decoded by the decoding means and dividing the image information into a plurality of scenes;
Encoding means for encoding the image information decoded by the decoding means with different image quality for each scene divided by the indexing means and encoding the second encoded data;
An information processing apparatus comprising:
前記インデキシング手段は、前記画像情報に関連付けられたジャンル情報に基づいてインデックスを付与することを特徴とする請求項1記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the indexing unit assigns an index based on genre information associated with the image information. 前記符号化手段は、各シーン毎にビットレートを設定することを特徴とする請求項1記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the encoding unit sets a bit rate for each scene. 前記符号化手段は、音声認識によるキーワード、字幕検出によるキーワード、CM検出、歓声検出、および顔認識による一致のいずれか1つ以上の情報に基づいて、各シーンの画質を決定することを特徴とする請求項1記載の情報処理装置。   The encoding means determines the image quality of each scene based on one or more information of a keyword based on speech recognition, a keyword based on subtitle detection, CM detection, cheer detection, and matching based on face recognition. The information processing apparatus according to claim 1. 画像情報が第1の符号化方式で符号化された第1符号化データを、第2の符号化方式で符号化された第2符号化データにトランスコードする再符号化方法であって、
前記第1符号化データを復号化する復号化ステップと、
前記復号化ステップで復号化された画像情報に対し、1以上のインデックスを付与して複数のシーンに分割するインデキシングステップと、
前記復号化手段が復号化した画像情報を、前記インデキシング手段が分割した各シーン毎に異なる画質で符号化して前記第2符号化データに符号化する符号化ステップと、
を有することを特徴とする再符号化方法。
A re-encoding method for transcoding first encoded data in which image information is encoded by a first encoding method into second encoded data encoded by a second encoding method,
A decoding step of decoding the first encoded data;
An indexing step of assigning one or more indexes to the image information decoded in the decoding step and dividing the image information into a plurality of scenes;
An encoding step of encoding the image information decoded by the decoding unit with different image quality for each scene divided by the indexing unit and encoding the second encoded data;
A re-encoding method comprising:
前記インデキシングステップでは、前記画像情報に関連付けられたジャンル情報に基づいてインデックスを付与することを特徴とする請求項5記載の再符号化方法。   6. The re-encoding method according to claim 5, wherein, in the indexing step, an index is assigned based on genre information associated with the image information. 前記符号化ステップでは、各シーン毎にビットレートを設定することを特徴とする請求項5記載の再符号化方法。   6. The re-encoding method according to claim 5, wherein a bit rate is set for each scene in the encoding step. 前記符号化ステップでは、音声認識によるキーワード、字幕検出によるキーワード、CM検出、歓声検出、および顔認識による一致のいずれか1つ以上の情報に基づいて、各シーンの画質を決定することを特徴とする請求項5記載の再符号化方法。   In the encoding step, the image quality of each scene is determined based on one or more information of a keyword based on speech recognition, a keyword based on subtitle detection, CM detection, cheer detection, and matching based on face recognition. The re-encoding method according to claim 5.
JP2007210973A 2007-08-13 2007-08-13 Information processing apparatus and re-encoding method Pending JP2009049474A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007210973A JP2009049474A (en) 2007-08-13 2007-08-13 Information processing apparatus and re-encoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007210973A JP2009049474A (en) 2007-08-13 2007-08-13 Information processing apparatus and re-encoding method

Publications (1)

Publication Number Publication Date
JP2009049474A true JP2009049474A (en) 2009-03-05

Family

ID=40501322

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007210973A Pending JP2009049474A (en) 2007-08-13 2007-08-13 Information processing apparatus and re-encoding method

Country Status (1)

Country Link
JP (1) JP2009049474A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120105970A (en) * 2011-03-17 2012-09-26 에스케이플래닛 주식회사 Video transcoding method and its system for maximizing transcoding capacity by considering network condition, content characteristics, and computational capacity of transcoding server
EP2560405A1 (en) 2011-08-19 2013-02-20 Funai Electric Co., Ltd. Digital broadcast reception device
JP2014511137A (en) * 2011-01-28 2014-05-08 アイ アイオー,リミテッド・ライアビリティ・カンパニー Applicable bit rate control based on scene

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014511137A (en) * 2011-01-28 2014-05-08 アイ アイオー,リミテッド・ライアビリティ・カンパニー Applicable bit rate control based on scene
KR20120105970A (en) * 2011-03-17 2012-09-26 에스케이플래닛 주식회사 Video transcoding method and its system for maximizing transcoding capacity by considering network condition, content characteristics, and computational capacity of transcoding server
KR101882889B1 (en) * 2011-03-17 2018-07-30 에스케이플래닛 주식회사 Video transcoding method and its system for maximizing transcoding capacity by considering network condition, content characteristics, and computational capacity of transcoding server
EP2560405A1 (en) 2011-08-19 2013-02-20 Funai Electric Co., Ltd. Digital broadcast reception device

Similar Documents

Publication Publication Date Title
US8625668B2 (en) Information processing apparatus and video decoding method of information processing apparatus
US20060067406A1 (en) Information processing apparatus and program for use in the same
US7174091B2 (en) Method and apparatus for improving video reproduction quality
JP4825644B2 (en) Image decoding apparatus, image encoding apparatus, and system LSI
US11706424B2 (en) Device and method of video decoding with first and second decoding code
US20060203917A1 (en) Information processing apparatus with a decoder
JP2008072647A (en) Information processor, decoder, and operational control method of reproducing device
US20080031356A1 (en) Information processing apparatus and decode controlling method of an information processing apparatus
US11849124B2 (en) Device and method of video encoding with first and second encoding code
US20090034615A1 (en) Decoding device and decoding method
US20060203909A1 (en) Information processing apparatus and decoding method
US8611433B2 (en) Information processing apparatus and video decoding method of information processing apparatus
US20060203910A1 (en) Information processing apparatus and decoding method
JP2007295392A (en) Information processing apparatus, decoding processing method, and program
JP2009049474A (en) Information processing apparatus and re-encoding method
US20060222259A1 (en) Information processing apparatus and image processing method
US8107536B2 (en) Video decoder
JP4751413B2 (en) Information processing apparatus and determination mode setting method for decoder
JP2006101321A (en) Information processing apparatus and program used for the processing apparatus
JP2006101405A (en) Information processing apparatus and program used for the processing apparatus
US7200562B2 (en) Multimedia data decoder
JP4291185B2 (en) Transcoding method, transcoder and program
JP5238850B2 (en) Information processing apparatus and moving picture stream decoding method
JP2010148048A (en) Device and method for recompression of moving image
JP2010028436A (en) Dynamic image decoding apparatus, program, and simplified decoding method