CN101924889B - 图像处理装置和图像处理方法 - Google Patents

图像处理装置和图像处理方法 Download PDF

Info

Publication number
CN101924889B
CN101924889B CN2010101989997A CN201010198999A CN101924889B CN 101924889 B CN101924889 B CN 101924889B CN 2010101989997 A CN2010101989997 A CN 2010101989997A CN 201010198999 A CN201010198999 A CN 201010198999A CN 101924889 B CN101924889 B CN 101924889B
Authority
CN
China
Prior art keywords
block size
image processing
size
processing apparatus
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2010101989997A
Other languages
English (en)
Other versions
CN101924889A (zh
Inventor
樱井裕音
田中润一
佐藤数史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN101924889A publication Critical patent/CN101924889A/zh
Application granted granted Critical
Publication of CN101924889B publication Critical patent/CN101924889B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4821End-user interface for program selection using a grid, e.g. sorted out by channel and broadcast time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/775Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television receiver
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种图像处理装置和图像处理方法,其中该图像处理装置包括:接收单元,配置成接收节目内容的图像数据以及与该节目内容相关的类型信息;选择单元,配置成选择大小选择参数,该大小选择参数用于使接收单元所接收的类型信息反映在块大小上,该块大小用于正交变换;确定单元,配置成根据选择单元所选择的大小选择参数来确定块大小;以及正交变换单元,配置成以确定单元所确定的块大小对接收单元所接收的图像数据执行正交变换。

Description

图像处理装置和图像处理方法
技术领域
本发明涉及适于在例如编码装置中使用的图像处理装置和图像处理方法,所述编码装置可用来对通过地面数字广播分发的图像数据进行编码。 
背景技术
一般而言,有广泛可用的图像处理装置,其配置成对通过地面数字广播等分发的广播节目内容进行编码,以及将经编码的内容存储在诸如硬盘或光盘的盘中。图像处理装置的例子包括硬盘记录器和蓝光盘(注册商标)记录器。 
观众所观看的广播节目内容以及有关广播节目内容的信息(以下称为“EPG信息”)是通过地面数字广播来分发的。EPG信息包括广播节目内容的描述和关键词、广播时间表以及表示广播节目内容类型的类型信息。 
一种这样的图像处理装置被配置成使得存储在图像处理装置中且在一定时间段内不再现的广播节目内容再次以较高的压缩率存储(参见例如日本未审查专利申请公开第2009-10603号)。在该图像处理装置中,根据类型信息来选择压缩率以及以比该压缩率高的压缩率进行存储的定时。 
发明内容
类型信息是根据广播节目内容的描述来分类的。取决于广播节目内容,图像数据的特征可变化。因此,图像处理装置可更高效地使用类型信息来对图像数据进行编码。 
因此,期望提供能够实现图像质量改善的图像处理装置和图像处理方法。 
在本发明一实施例中,一种图像处理装置包括:接收单元,配置成接收节目内容的图像数据以及与该节目内容相关的类型信息;选择单元,配置成选择大小选择参数,该大小选择参数用于使接收单元所接收的类型信息反映在块大小上,该块大小用于正交变换;确定单元,配置成根据选择单元所选 择的大小选择参数来确定块大小;以及正交变换单元,配置成以确定单元所确定的块大小对接收单元所接收的图像数据执行正交变换。 
因此,该图像处理装置可以使广播节目内容反映在块大小上,由此适当地设置块大小。 
在本发明的另一实施例中,一种图像处理方法包括如下步骤:接收节目内容的图像数据以及与该节目内容相关的类型信息;选择大小选择参数,该大小选择参数用于使在接收步骤中接收的类型信息反映在块大小上,该块大小用于正交变换;根据在选择步骤中选择的大小选择参数来确定块大小;以及以在确定步骤中确定的块大小对在接收步骤中接收的图像数据执行正交变换。 
因此,在该图像处理方法中,广播节目内容可以反映在块大小上,因此可以适当地设置块大小。 
根据本发明一实施例,广播节目内容可以反映在块大小上,因此可以适当地设置块大小。因此,可以实现能够实现图像质量改善的图像处理装置和图像处理方法。 
附图说明
图1是示出了图像处理装置的配置的示意图; 
图2是示出了图像编码单元的配置的示意图; 
图3A和3B是描述方差和纹理的示意图; 
图4是描述大小选择参数的确定的示意图; 
图5是示出了设置表的示意图; 
图6是描述块大小设置处理过程的流程图; 
图7是示出了附加系数表的示意图; 
图8是描述根据另一实施例的例外大小选择参数的示意图;以及 
图9是示出了使用时间信息的示范性滤波器特性改变处理的示意图。 
具体实施方式
下面将参照附图详细描述本发明的实施例。该描述将按如下顺序进行: 
1.第一实施例(根据图像特性的DCT块大小的改变) 
2.第二实施例(其它信息的使用) 
3.其它实施例 
1.第一实施例 
1-1.图像处理装置的配置 
图1示出了图像处理装置1。图像处理装置1可以是诸如硬盘记录器或个人计算机的设备,其配置成接收用作节目内容的广播节目内容以及存储所接收的广播节目内容。 
数字广播接收单元2可以是例如外部接口,其连接到天线或诸如因特网的网络,并且配置成接收广播信号S1,诸如地面数字广播信号。广播信号S1可以是例如根据运动图像专家组2(MPEG-2)标准而编码的信号。 
在接收到表示广播节目内容的广播信号S1时,数字广播接收单元2将广播信号S1提供给数字调谐单元3作为广播信号S2。数字调谐单元3对广播信号S2进行解码,以生成电子节目指南(EPG)信息S3、图像数据S4以及音频数据S5,并且将EPG信息S3、图像数据S4以及音频数据S5提供给例如显示装置(未示出),诸如电视装置。EPG信息S3可包括广播节目内容的描述和关键词、广播时间表、广播站信息、事件信息、时间信息、类型信息以及其它适当的信息。 
由此,在显示装置上显示基于图像数据S4的图像,并且输出基于音频数据S5的音频。此外,响应于来自用户的请求,显示EPG信息S3中的各种信息。 
数字调谐单元3将EPG信息S3和图像数据S4提供给图像编码单元4,并且将音频数据S5提供给音频编码单元5。图像编码单元4执行下面将要描述的图像编码处理,以便根据H.264/高级视频编码(AVC)方案来对图像数据S4进行编码,以生成比特流S6,并且将比特流S6提供给存储单元6。 
音频编码单元5根据预定的编码方案对音频数据S5进行编码以生成编码的音频数据S7,并且将编码的音频数据S7提供给存储单元6。存储单元6可以是例如诸如硬盘或蓝光盘(注册商标)的光盘、闪存等。存储单元6存储彼此关联的所提供的比特流S6和编码的音频数据S7。 
因此,广播节目内容的编码版本被存储在存储单元6中。响应于来自用 户的请求,图像处理装置1读取存储在存储单元6中的广播节目内容,使用解码单元(未示出)对所读取的广播节目内容进行解码,并且再现图像数据S4和音频数据S5。解码单元将图像数据S4和音频数据S5提供给显示装置。因此,基于图像数据S4的图像显示在显示装置上,并且基于音频数据S5的音频被输出到显示装置。 
1-2.图像编码单元的配置 
参考图2,当通过输入终端10将EPG信息S3和图像数据S4从数字调谐单元3提供给图像编码单元4时,EPG信息S3被提供给EPG信息获取单元31,而图像数据S4被提供给屏幕重排缓冲器11。 
屏幕重排缓冲器11根据图像数据S4中的画面组(GOP)结构来重排图像数据S4,并且将重排的图像数据S4提供给方差计算单元12。方差计算单元12计算每个宏块的方差值MB_Var,并且将方差值MB_Var提供给块大小设置单元34。方差计算单元12将所提供的图像数据S4提供给运算单元13、运动估算/补偿单元14以及内预测单元15。 
当要对图像数据S4进行互编码(inter-encode)时,运算单元13从图像数据S4减去从运动估算/补偿单元14提供的预测值L5,并且将其之间的差提供给正交变换单元17作为差值数据D1。当要对图像数据S4进行内编码(intra-encode)时,运算单元13从图像数据S4减去从内预测单元15提供的预测值L5,并且将其之间的差提供给正交变换单元17作为差值数据D1。 
正交变换单元17通过执行离散余弦变换(DCT)处理来对差值数据D1执行正交变换,并且将DCT系数D2提供给量化单元18。 
量化单元18使用在比率控制单元19的控制下确定的量化参数QP来量化DCT系数D2,并且将量化的系数D3提供给逆量化单元23以及无损编码单元20。无损编码单元20根据诸如基于上下文的自适应可变长编码(CAVLC)和上下文自适应二进制算术编码(CABAC)的熵编码来执行量化的系数D3的无损编码,并且将无损编码的数据D5提供给存储缓冲器21。 
无损编码单元20从运动估算/补偿单元14和内预测单元15获取有关内编码和互编码的信息,并且将所获得的信息设置在无损编码的数据D5的头信息中。 
存储缓冲器21存储无损编码的数据D5,并且还以预定的传输速度输出无损编码的数据D5作为比特流S6。比率控制单元19监视存储缓冲器21, 并且确定量化参数QP,使得针对无损编码的数据D5所生成的编码量可以接近以特定控制单位(诸如以帧或GOP为单位)表示的特定编码量。 
逆量化单元23对量化的系数D3进行逆量化以生成再现DCT系数L1,并且将再现DCT系数L1提供给逆正交变换单元24。逆正交变换单元24对再现DCT系数L1执行逆正交变换以生成再现差值数据L2,并且将再现差值数据L2提供给运算单元25。 
运算单元25对从运动估算/补偿单元14或内预测单元15提供的预测值L5以及再现差值数据L2进行求和,以生成待处理块的本地解码图像L3,并且将本地解码图像L3提供给解块滤波器26和帧存储器27。 
解块滤波器26对待处理块执行解块滤波处理,并且将结果提供给帧存储器27。因此,将经解块滤波的本地解码图像L4存储在帧存储器27中。 
帧存储器27将经解块滤波的本地解码图像L4中对应于参考块的本地解码图像L4提供给运动估算/补偿单元14或内预测单元15。运动估算/补偿单元14通过参考本地解码图像L4来对图像数据S4执行运动估算,以生成针对待处理块的预测值L5,并且将预测值L5提供给运算单元13和25。内预测单元15通过参考本地解码图像L4来对图像数据S4执行内预测,以生成针对待处理块的预测值L5,并且将预测值L5提供给运算单元13和25。 
因此,图像编码单元4配置成对图像数据S4进行编码以及生成比特流S6。 
1-3.块大小设置处理 
接下来,将描述块大小设置处理。 
在MPEG-2方案中,DCT处理是使用8×8像素的DCT块来执行的。与之相比,在AVC/H.264方案中,采用4×4像素的DCT块,以便降低蚊式噪声或块噪声。一般理解,使用4×4像素的DCT块的DCT处理可能会降低编码效率。 
在AVC/H.264方案中,在2005年2月被标准化为用于高清晰度视频的规范的保真度范围扩展(FRExt)能够实现在逐宏块的基础上在8×8像素的DCT块与4×4像素的DCT块之间进行切换。AVC/H.264FRExt的标准化使得有可能尽可能多地降低蚊式噪声或块噪声而不降低编码效率。 
具体而言,图像编码单元4考虑到噪声降低和编码效率之间的平衡,在 宏块中的像素值(例如,亮度值)的方差值MB_Var的基础上,选择4×4像素的DCT块或8×8像素的DCT块。 
也就是说,当方差值MB_Var大于大小选择阈值DCT_TH时,图像的复杂度高,且噪声的发生概率高。因此,图像编码单元4优先考虑噪声降低,并且选择4×4像素的DCT块。 
对于方差值MB_Var小于或等于大小选择阈值DCT_TH且蚊式噪声或块噪声发生的可能性较小的图像数据S4,图像编码单元4优先考虑编码效率,并且选择8×8像素的DCT块。 
因此,图像编码单元4可以尽可能多地降低蚊式噪声或块噪声而不降低编码效率。 
然而,方差值MB_Var可能不一定完全表示蚊式噪声或块噪声的发生概率。例如,如图3A和3B所示,即使当所出现的亮度值的总数相同时,蚊式噪声或块噪声的发生概率也可能不同。图3A示出了蚊式噪声或块噪声发生的可能性较小的低频图像。另一方面,图3B示出了蚊式噪声或块噪声可能发生的高频图像。 
此外,具有大量运动的图像趋向于包括蚊式噪声或块噪声,这是因为有可能发生大量针对差值数据D1的编码,并且使用了大的量化参数QP。然而,根据方差值MB_Var是难以识别该趋势的。 
如上所述,广播节目内容和EPG信息是通过地面数字广播来分发的。除了广播时间表信息和表示广播节目内容的描述的信息外,EPG信息还包括有关类型的类型信息,其中广播节目内容是根据广播节目内容的描述而分类成所述类型的。 
类型信息可表示每个广播节目内容的图像数据S4的特征。因此,根据本实施例的图像编码单元4配置成根据类型信息来改变大小选择阈值DCT_TH,由此根据广播节目内容的描述而在噪声降低的优先级或编码效率的优先级之间进行切换。 
具体而言,针对具有其中有可能发生噪声的纹理(画面)的广播节目内容,图像编码单元4优先考虑噪声降低,并且优先使用4×4像素的DCT块。针对具有其中发生噪声的可能性较小的纹理的广播节目内容,图像编码单元4优先考虑编码效率,并且优先使用8×8像素的DCT块。 
针对有可能发生噪声且运动量大的类型信息,图像编码单元4优先考虑噪声降低,并且优先使用4×4像素的DCT块。针对发生噪声的可能性较小 且运动量小的类型信息,图像编码单元4优先考虑编码效率,并且优先使用8×8像素的DCT块。 
一般理解,使用8×8像素的DCT块使得能够提高层次质量。针对层次的重要性高的类型信息所表示的广播节目内容,图像编码单元4优先考虑图像质量,并且优先使用8×8像素的DCT块。 
如上所述,当方差值MB_Var大于大小选择阈值DCT_TH时,图像编码单元4选择4×4像素的DCT块,而当方差值MB_Var小于或等于大小选择阈值DCT_TH时,选择8×8像素的DCT块。 
当优先使用4×4像素的DCT块时,图像编码单元4将负偏移量OF(例如“-1000”)加到大小选择阈值DCT_TH的默认值(例如“2000”)。因此,大小选择阈值DCT_TH减小,并且图像编码单元4允许更频繁地选择4×4像素的DCT块。 
当优先使用8×8像素的DCT块时,图像编码单元4将正偏移量OF(例如“+1000”)加到大小选择阈值DCT_TH的默认值(例如“2000”)。因此,大小选择阈值DCT_TH增大,并且图像编码单元4允许更频繁地选择8×8像素的DCT块。 
图4示出了类型信息以及与类型信息相关联的大小选择参数的列表。在地面数字广播中,广播节目内容被分类为12个类型(称为主分类类型)。在本实施例中,根据上述规则,表示4×4像素的DCT块的优先级的4×4优先级元素被给予得分,并且根据总得分确定相应的偏移量OF。在本实施例中,“纹理”、“运动”和“层次”被提供作为4×4优先级元素。得分越高,噪声降低的优先级越高。在此情况下,优先考虑4×4像素的DCT块。 
具体而言,4×4优先级元素“纹理”表示根据画面有可能发生噪声的程度。噪声发生概率越高,得分越高。具有大量“运动”的广播节目内容所属的类型因为有可能发生噪声而具有高得分。4×4优先级元素“层次”表示输入图像数据S4中的层次的重要性。层次的重要性越高,得分越低。这是因为期望优先使用8×8像素的DCT块。 
各个4×4优先级元素的最高得分是不同的(以括号中的数字表示)。也就是说,根据其重要性来对噪声优先级元素进行加权。 
当通过对各个4×4优先级元素的值进行求和而获得的总得分高时,优先考虑噪声降低而不是编码效率,即,更优先使用4×4像素的DCT块。另一方面,当总得分低时,优先考虑编码效率而不是噪声降低,即,更优先使用 8×8像素的DCT块。 
在本实施例中,当总得分为“11”时可取中间值。当总得分处于“10”到“12”的范围内时,可选择大小选择参数“默认”,并且可将偏移量OF设置为“0”。当总得分大于或等于“13”时,可选择大小选择参数“4×4优先”,并且可将偏移量OF设置为“-1000”。当总得分小于或等于“9”时,可选择大小选择参数“8×8优先”,并且可将偏移量OF设置为“+1000”。 
具体而言,新闻/新闻报告类型包括各种纹理的图像,诸如在演播室捕获的图像以及在诸如事件现场的户外捕获的图像。因此,新闻/新闻报告类型被评估为具有元素“纹理”“4”,其是中间值。新闻/新闻报告类型进一步包括具有大量运动的图像(诸如体育)以及几乎静止的图像(诸如报告新闻的新闻播报员的图像),并因此也被评估为具有元素“运动”“4”,其是中间值。新闻/新闻报告类型没有关于层次的重要性,并因此被评估为具有元素“层次”“3”,其是中间值。因此,总得分是“11”,选择大小选择参数“默认”,并且将偏移量OF设置为“0”。 
体育类型并不呈现明显的特征,因此被评估为具有元素“纹理”“4”,其是中间值。由于快速运动的重要性,因此体育类型被评估为具有元素“运动”“7”,其是最大值。由于层次不是特别重要,因此体育类型被评估为具有元素“层次”“3”,其是中间值。因此,总得分是“14”,选择大小选择参数“4×4优先”,并且将偏移量OF设置为“-1000”。 
与新闻/新闻报告类型类似,由于提供各种图像数据S4,因此娱乐和闲谈类型被评估为分别具有元素“纹理”“4”、“运动”“4”和“层次”“3”,它们是中间值。因此,在娱乐和闲谈类型中,总得分是“11”,选择大小选择参数“默认”,并且将偏移量OF设置为“0”。 
戏剧类型具有各类戏剧,包括例如具有相对小量的运动的戏剧(诸如浪漫戏剧)以及具有大量运动的戏剧(诸如动作戏剧和体育戏剧)。此外,由于没有明显的纹理特征和层次重要性,因此与新闻/新闻报告类型类似,戏剧类型被评估为分别具有元素“纹理”“4”、“运动”“4”和“层次”“3”,它们是中间值。因此,在戏剧类型中,总得分是“11”,选择大小选择参数“默认”,并且将偏移量OF设置为“0”。 
由于大量的摄影技巧、闪光照明、闪烁灯饰等,因此音乐类型被评估为具有元素“运动”“7”,其是大值。由于没有明显的纹理特征和层次重要性,因此音乐类型被评估为分别具有元素“纹理”“4”和“层次”“3”,它们是 中间值。因此,在音乐类型中,总得分是“14”,选择大小选择参数“4×4优先”,并且将偏移量OF设置为“-1000”。 
由于具有例如动作游戏中的相对大量的执行者运动以及大量的摄影技巧,因此杂项类型被评估为具有元素“运动”“6”。由于没有明显的纹理特征和层次重要性,因此杂项类型被评估为分别具有元素“纹理”“4”和“层次”“3”,它们是中间值。因此,在杂项类型中,总得分是“13”,选择大小选择参数“4×4优先”,并且将偏移量OF设置为“-1000”。 
与戏剧类型类似,电影类型具有各类电影,包括具有相对小量的运动的电影(诸如浪漫电影)以及具有大量运动的电影(诸如动作电影和体育电影)。与戏剧类型类似,由于没有明显的纹理特征,因此与新闻/新闻报告类型和戏剧类型类似,电影类型被评估为分别具有元素“运动”“4”和“纹理”“4”,它们是中间值。由于具有高的层次重要性,因此电影类型被评估为具有元素“层次”“1”,其是最低值。因此,在电影类型中,总得分是“9”,选择大小选择参数“8×8优先”,并且将偏移量OF设置为“+1000”。 
动画/SFX类型具有大量的线条图,并且可以是动画-SFX组合类型。动画主要包含具有快速色调变化的线条图,并且具有由于快速的颜色变化而有可能发生块噪声或蚊式噪声的特征。与之相比,SFX是写实动作(live action),并且包括少量的摄影技巧和少量的运动,这些是与动画的特征大为不同的特征。在本实施例中,优先考虑动画质量的改善,并且基于动画来选择大小选择参数。动画/SFX类型被评估为具有元素“纹理”“7”,其是最大值,以及分别具有元素“运动”“4”和“层次”“3”,它们是中间值。因此,在动画/SFX类型中,总得分是“14”,选择大小选择参数“4×4优先”,并且将偏移量OF设置为“-1000”。 
文档/教育类型通常包括具有缓慢颜色变化的场景,诸如自然、风景和其它场景。因此,文档/教育类型被评估为具有元素“纹理”“1”。此外,由于风景等的照片而不是人(执行者)的照片为主要的,因此运动量较小。因此,文档/教育类型被评估为具有元素“运动”“3”。由于具有许多风景的图像,因此文档/教育类型在诸如日落、天空等的场景中具有相对高的层次重要性,并且被评估为具有元素“层次”“2”。在文档/教育类型中,总得分是“6”,选择大小选择参数“8×8优先”,并且将偏移量OF设置为“+1000”。 
剧院/舞台类型具有各种表演,包括具有相对小量的运动的表演(诸如落语(Rakugo)或日本喜剧舞台)以及具有大量运动和大量摄影技巧的表演(诸如舞蹈和芭蕾舞演出)。因此,剧院/舞台类型被评估为分别具有元素“纹理” “4”、“运动”“4”和“层次”“3”,它们是中间值。因此,在剧院/舞台类型中,总得分是“11”,选择大小选择参数“默认”,并且将偏移量OF设置为“0”。 
业余爱好/教育类型通常包括具有相对小量的运动的节目,诸如园艺节目、围棋节目以及日本将棋(Shogi)或日本象棋节目,并且许多说明是以静止图像来进行的。此外,一般而言,也可使用相对简单的画面。因此,业余爱好/教育类型被评估为具有:元素“运动”“2”;元素“纹理”“3”,比中间值略小的值;以及元素“层次”“3”,其是中间值。因此,在业余爱好/教育类型中,总得分是“8”,选择大小选择参数“8×8优先”,并且将偏移量OF设置为“+1000”。 
福利类型具有各种节目,包括具有少量运动的节目(诸如报告福利问题的节目)以及具有大量运动的节目(诸如具有文本广播的历史节目)。因此,与新闻/新闻报告类型以及戏剧类型类似,福利类型被评估为分别具有元素“纹理”“4”、“运动”“4”和“层次”“3”,它们是中间值。因此,在福利类型中,总得分是“11”,选择大小选择参数“默认”,并且将偏移量OF设置为“0”。 
具体而言,在接收到从数字调谐单元3(图1)提供的EPG信息S3时,图像编码单元4的EPG信息获取单元31(图2)将EPG信息S3提供给类型信息获取单元32。类型信息获取单元32从EPG信息S3提取对应于待记录的广播节目内容的类型信息,并且将类型信息提供给参数确定单元33。 
参数确定单元33存储设置表,其中类型信息与大小选择阈值DCT_TH相关联。在图5中,举例来说,默认的大小选择阈值DCT_TH是“2000”。也就是说,当选择了对应于类型信息的大小选择阈值DCT_TH时,选择了通过将对应于大小选择参数的偏移量OF自动加到默认的大小选择阈值DCT_TH上而获得的值。当选择了对应于类型信息的大小选择阈值DCT_TH时,参数确定单元33将大小选择阈值DCT_TH提供给块大小设置单元34。 
每个宏块的方差值MB_Var从方差计算单元12提供给块大小设置单元34。块大小设置单元34将方差值MB_Var与大小选择阈值DCT_TH相比较。 
当方差值MB_Var大于大小选择阈值DCT_TH时,块大小设置单元34选择4×4像素的DCT块,并且将表示选择4×4像素的DCT块的大小信号提供给正交变换单元17。当方差值MB_Var小于或等于大小选择阈值DCT_TH时,块大小设置单元34选择8×8像素的DCT块,并且将表示选择8×8像素 的DCT块的信号提供给正交变换单元  17。 
正交变换单元17以从块大小设置单元34提供的大小信号所表示的块大小对差值数据D1执行DCT处理  。 
因此,图像编码单元4根据每种类型的广播节目内容所包含的图像数据 S4中的噪声发生概率,评估表示4×4像素的DCT块的优先级的4×4优先级元素。图像编码单元4使对4×4优先级元素的评估在DCT处理中反映在块大小上。 
因此,图像编码单元4不仅可以使图像数据S4的方差值MB_Var而且可以使噪声发生概率反映在DCT块的块大小上,其中根据方差值MB_Var不一定可识别所述噪声发生概率。因此,图像编码单元4可以设置适合于图像数据S4的块大小,并且可以提高比特流S6的图像质量。 
以上所述的编码和块大小设置处理的系列可以由硬件或软件来执行。当编码和块大小设置处理的系列由软件实现时,在中央处理单元(CPU)和随机存取存储器(RAM)中以虚拟方式形成图像编码单元4。然后,当在RAM上展开存储在只读存储器(ROM)中的块大小设置程序时,编码处理被执行。 
1-4.块大小设置处理例程 
现在将参照图6的流程图描述根据块大小设置处理程序来执行的块大小设置处理例程RT1。 
图像编码单元4开始块大小设置处理例程RT1。当在步骤SP1中提供了EPG信息S3和图像数据S4时,图像编码单元4前进到步骤SP2。 
在步骤SP2中,图像编码单元4从EPG信息S3获得类型信息。然后,图像编码单元4前进到步骤SP3。 
在步骤SP3中,图像编码单元4选择对应于类型信息的大小选择参数。当选择了大小选择参数“4×4优先”时,图像编码单元4前进到步骤SP4。当选择了大小选择参数“默认”时,图像编码单元4前进到步骤SP5。当选择了大小选择参数“8×8优先”时,图像编码单元4前进到步骤SP6。在第一实施例中,选择对应于大小选择参数的大小选择阈值DCT_TH,由此使得能够间接地选择大小选择参数。 
在步骤SP4中,图像编码单元4将大小选择阈值DCT_TH设置为 “1000”。然后,图像编码单元4前进到步骤SP7。 
在步骤SP5中,图像编码单元4将大小选择阈值DCT_TH设置为“2000”。然后,图像编码单元4前进到步骤SP7。 
在步骤SP6中,图像编码单元4将大小选择阈值DCT_TH设置为“3000”。然后,图像编码单元4前进到步骤SP7。 
在步骤SP7中,图像编码单元4将在步骤SP4到SP6中的任何一个步骤中设置的大小选择阈值DCT_TH与宏块的方差值MB_Var相比较,以确定块大小。然后,图像编码单元4前进到步骤SP8。 
在步骤SP8中,图像编码单元4以在步骤SP7中确定的块大小对差值数据D1执行DCT处理。然后,图像编码单元4前进到结束步骤,并且该处理结束。 
1-5.操作和有利效果 
在以上配置中,图像处理装置1中的图像编码单元4接收用作节目内容的广播节目内容的图像数据S4以及有关该广播节目内容的类型信息,并且选择大小选择参数,其用于使类型信息反映在块大小上。图像编码单元4选择对应于大小选择参数的大小选择阈值DCT_TH,从而基于大小选择参数来确定用于正交变换的块大小。图像编码单元4以所确定的块大小来对差值数据D1执行正交变换,所述差值数据D1是要基于图像数据S4而处理的数据。 
因此,图像编码单元4可以使与类型信息所表示的广播节目内容的描述相对应的图像数据S4的特征反映在所确定的块大小上。因此,可以使用适当的块大小来执行用作正交变换的DCT处理。 
图像编码单元4将表示图像数据S4的像素值特征的指标值与根据大小选择参数所选择的块选择阈值DCT_TH相比较,并且选择用于DCT变换的块大小,由此使类型信息反映在块大小上。 
因此,图像编码单元4不仅可以使根据广播节目内容的描述的图像数据S4的特征而且可以使像素值特征反映在所确定的块大小上。也就是说,图像编码单元4可以使可以通过图像数据S4的分析而识别的像素值特征反映在块大小的确定上,并且可以进一步使通过图像数据S4的分析不一定可识别的并且对应于广播节目内容的描述的图像数据S4的特征反映在块大小的确定上。因此,图像编码单元4可以更适当地选择块大小。 
图像编码单元4采用表示作为编码单位的每个宏块的方差的方差值MB_Var作为像素值的特征。 
因此,图像编码单元4可以使可以通过图像数据S4的分析而识别的噪声发生概率反映在块大小的确定上。因此,可以选择更适当的块大小。 
图像编码单元4根据4×4像素的DCT块的预定第一块大小以及比4×4像素的DCT块的第一块大小大的8×8像素的DCT块的第二块大小来确定块大小。当要优先考虑噪声降低时,图像编码单元4降低块选择阈值DCT_TH,从而优先使用4×4像素的DCT块的大小作为用于DCT变换的块大小。当要优先考虑编码效率时,图像编码单元4提高块选择阈值DCT_TH,从而优先使用8×8像素的DCT块的大小作为用于DCT变换的块大小。 
因此,当不必降低噪声时,图像编码单元4优先考虑编码效率,从而优先使用8×8像素的DCT块,由此可以提高编码效率而不降低图像质量。 
当要强调层次时,图像编码单元4提高块选择阈值DCT_TH,从而优先使用8×8像素的DCT块的大小作为用于DCT变换的块大小。 
因此,图像编码单元4可以提高诸如电影的广播节目内容中的层次的质量,其中所述广播节目内容具有高层次重要性的场景。 
当类型信息表示体育类型时,图像编码单元4降低块选择阈值DCT_TH,从而优先使用4×4像素的DCT块的大小作为用于DCT变换的块大小。 
因此,图像编码单元4可以通过优先考虑属于体育类型的广播节目内容中的噪声降低来提高图像质量,在所述体育类型中,运动量大且噪声发生概率高。 
当类型信息表示动画/SFX类型时,图像编码单元4降低块选择阈值DCT_TH,从而优先使用4×4像素的DCT块的大小作为用于DCT变换的块大小。 
因此,图像编码单元4可以通过优先考虑属于动画类型的广播节目内容中的噪声降低来提高图像质量,在所述动画类型中,主要使用线条图且噪声发生概率高。 
当类型信息表示音乐类型时,图像编码单元4降低块选择阈值DCT_TH,从而优先使用4×4像素的DCT块的大小作为用于DCT变换的块大小。 
因此,图像编码单元4可以通过优先考虑属于音乐类型的广播节目内容中的噪声降低来提高图像质量,在所述音乐类型中,由于闪光照明和灯饰的使用,因此运动量大。 
当类型信息表示杂项类型时,图像编码单元4降低块选择阈值DCT_TH,从而优先使用4×4像素的DCT块的大小作为用于DCT变换的块大小。 
因此,图像编码单元4可以通过优先考虑属于杂项类型的广播节目内容中的噪声降低来提高图像质量,在所述杂项类型中,运动量大且噪声发生概率高。 
当类型信息表示文档/教育类型时,图像编码单元4提高块选择阈值DCT_TH,从而优先使用8×8像素的DCT块的大小作为用于DCT变换的块大小。 
因此,图像编码单元4可以在保持属于文档/教育类型的广播节目内容中的图像质量的同时提高编码效率,在所述文档/教育类型中,包括大量的低频图像且噪声发生概率低。 
当类型信息表示业余爱好/教育类型时,图像编码单元4提高块选择阈值DCT_TH,从而优先使用8×8像素的DCT块的大小作为用于DCT变换的块大小。 
因此,图像编码单元4可以在保持属于业余爱好/教育类型的广播节目内容中的图像质量的同时提高编码效率,在所述业余爱好/教育类型中,运动量小且噪声发生概率低。 
图像编码单元4根据H.264/AVC方案对图像数据进行编码。正交变换单元17使用表示像素值之间的差的差值数据D1作为要经受DCT处理的图像数据,并且执行作为正交变换的DCT处理。 
因此,图像编码单元4可以以高压缩比对广播节目内容的图像数据S4进行编码。 
图像编码单元4在用作优先级元素的多个4×4优先级元素的基础上,评估优先考虑噪声降低和编码效率中的哪个,所述优先级元素中的每个表示图像数据S4的噪声发生概率。4×4优先级元素用单独的值来加权。 
因此,图像编码单元4可以在考虑多个因素的重要性的同时,在多个因素的基础上适当地评估噪声发生概率。 
利用以上配置,图像编码单元4使用根据类型信息所表示的广播节目内容的描述的图像数据S4的特征,选择要反映在块大小上的大小选择参数。图像编码单元4使大小选择参数反映在用于DCT处理的块大小上。 
因此,图像编码单元4可以使仅通过图像数据S4的分析不一定可识别的广播节目内容反映在块大小上,并且可以适当地确定噪声降低或编码效率的优先级。因此,根据本发明一实施例,可以实现能够提高图像质量的图像处理装置和图像处理方法。 
2.第二实施例 
2-1.使用除类型信息以外的信息的块大小设置处理 
在第二实施例中,与图1到6中所示的第一实施例的部分相对应的部分以相同的标号来表示,并且将省略其描述。第二实施例与第一实施例的不同之处在于不仅使用类型信息而且也使用除包括在EPG信息S3中的类型信息以外的信息来改变块大小。 
除了类型信息以外,EPG信息S3还包括表示分发广播节目内容的广播站的广播站信息、描述广播节目内容的事件信息以及其它适当的信息。 
一般在分发器(即广播站)中捕获和编辑广播节目内容,并且由于取决于广播站而使用的设备或技术的差异,广播节目内容趋向于具有不同的包括在图像数据S4中的噪声水平。可针对基于广播信号S1的图像数据S4来优先考虑编码效率,其中广播信号S1从趋向于分发具有较少噪声的广播节目内容的广播站分发。相反,可针对基于广播信号S1的图像数据S4来优先考虑噪声降低,其中广播信号S1从趋向于分发具有较多噪声的广播节目内容的广播站分发。 
因此,根据第二实施例的图像编码单元(未在图中示出)(以下称为“图像编码单元104”)配置成使广播站信息反映在大小选择参数上。 
事件信息直接表示广播节目内容。例如,当事件信息包括诸如“实时广播(live broadcasting)”、“现场广播(on-the-spot broadcasting)”或“实时视频(live video)”的文本时,至少广播节目内容的主要部分是可能实时广播的。 
通常,所记录的广播节目内容可在事先通过某种图像处理而使噪声降低的情况下进行分发。另一方面,由于没有足够的时间来进行这样的修改,因 此实时广播内容通常包含较多的噪声。因此,主要被实时广播的广播节目内容具有高噪声发生概率,并且期望优先考虑噪声降低。 
此外,当与属于除体育类型以外的类型(诸如电影类型、戏剧类型以及业余爱好/教育类型)的广播节目内容相对应的事件信息包含体育名称时,至少广播节目内容的主要部分有可能包含体育场景。在此情况下,噪声发生概率高,并且期望优先考虑噪声降低。 
当有关属于文档/教育类型的广播节目内容的事件信息包括具有著名自然景点或历史建筑物的地方的地理名称,或者包括表示具有著名自然景点或历史建筑物的地方的词时,至少广播节目内容的主要部分有可能包含该著名自然景点或历史建筑物的场景。具有著名自然景点或历史建筑物的地方的地理名称的例子包括“大峡谷”和“大堡礁”,并且表示具有著名自然景点或历史建筑物的地方的词的例子包括“珊瑚礁”、“山毛榉原始森林”、“丛林”、“世界遗产”以及“古城”。这样的广播节目内容具有低噪声发生概率,并且期望优先考虑编码效率。 
因此,当事件信息包括这种表示图像数据S4的视觉特征的关键词(以下称为“特征关键词”)时,图像编码单元104使特征关键词反映在大小选择参数上  。 
当从EPG信息获取单元31提供了EPG信息S3时,对应于类型信息获取单元32的类型信息获取单元(未在图中示出)(以下称为“类型信息获取单元132”)从EPG信息S3中提取对应于当前正在记录的广播节目内容的类型信息和广播站信息,并且将所提取的类型信息以及广播站信息提供给对应于参数确定单元33的参数确定单元(未在图中示出)(以下称为“参数确定单元133”)。 
类型信息获取单元132存储表示图像数据S4的视觉特征的特征关键词的列表。类型信息获取单元132从EPG信息S3内的对应于当前正在记录的广播节目内容的事件信息中搜索特征关键词。当事件信息包括特征关键词时,类型信息获取单元132将特征关键词与类型信息和广播站信息一起提供给参数确定单元133。 
参数确定单元133存储其中总得分与类型信息相关联的得分表,取代使用其中大小选择阈值DCT_TH(图5)与类型信息相关联的设置表。此外,参数确定单元133存储附加系数表,其中如图7所示,广播站信息、特征关键词和附加系数彼此相互关联。 
参数确定单元133根据得分表来选择对应于类型信息的总得分。参数确定单元133进一步根据附加系数表来选择附加系数,其对应于从类型信息获取单元132提供的广播站信息和特征关键词。 
当类型信息表示体育类型时,已经在假设包括体育场景的情况下确定了总得分,并且得分表不适用。当提供了体育的名称时,参数确定单元133检查类型信息,并且仅当类型信息不表示体育类型时选择附加系数。 
类似地,对于自然景点的名称,当提供了具有著名自然景点或历史建筑物的地方的地理名称或者表示具有著名自然景点或历史建筑物的地方的词时,参数确定单元133检查类型信息,并且仅当类型信息不表示文档/教育类型时选择附加系数。 
参数确定单元133将所选择的总得分乘以对应的附加系数,并且计算所得到的乘积得分。例如,类型信息表示文档/教育类型,广播站信息表示内容“H”,并且提供特征关键词“实时广播”。在此情况下,将总得分“6”乘以针对内容“H”的“0.9”和针对特征关键词“实时广播”的“1.2”。因此,乘积得分为6×0.9×1.2=6.48。此外,当没有提供特征关键词时,参数确定单元133将对应于类型信息的总得分仅乘以对应于广播站信息的附加系数。 
参数确定单元133具有五个级别的偏移量OF,即,“-2000”、“-1000”、“0”、“+1000”以及“+2000”,并且根据所得到的得分来选择一个偏移量OF。在本实施例中,偏移量OF表示大小选择参数的数值。 
当乘积得分是“小于7.0”时,参数确定单元133选择偏移量OF“-2000”。当乘积得分是“大于或等于7.0且小于或等于10.0”时,参数确定单元133选择偏移量OF“-1000”。当乘积得分是“大于或等于10.0且小于或等于13.0”时,参数确定单元133选择偏移量OF“0”。当乘积得分是“大于13.0且小于15.0”时,参数确定单元133选择偏移量OF“+1000”。当乘积得分是“大于或等于15.0”时,参数确定单元133选择偏移量OF“+2000”。 
参数确定单元133将所选择的偏移量OF提供给对应于块大小设置单元34的块大小设置单元(未在图中示出)(以下称为“块大小设置单元134”)。块大小设置单元134将所提供的偏移量OF加到默认值“2000”上,从而计算大小选择阈值DCT_TH。块大小设置单元134将大小选择阈值DCT_TH与从方差计算单元12提供的方差值MB_Var相比较。 
因此,图像编码单元104计算乘积得分,从而除了类型信息外,还使用广播站信息和特征关键词来确定图像数据S4中的噪声降低与分辨率保持的 优先级。 
因此,图像编码单元104可以使用图像数据S4中的噪声发生概率来确定噪声降低和编码效率的优先级,其中仅根据类型信息不一定可识别图像数据S4的噪声发生概率,并且可以更适当地选择块大小。 
2-2.操作和有利效果 
在以上配置中,图像编码单元104接收描述包括在EPG信息S3中的广播节目内容的事件信息。当事件信息包括表示图像数据中的噪声发生概率的特征关键词时,图像编码单元104使特征关键词反映在块大小的确定上。 
因此,图像编码单元104可以使用直接表示广播节目内容的特征关键词来确定块大小,因此可以更适当地设置块大小。 
图像编码单元104接收表示已分发广播节目内容的广播站的广播站信息,并且使表示已分发广播节目内容的广播站的广播站信息反映在块大小的确定上。 
因此,图像编码单元104可以使每个广播站的噪声发生概率反映在块大小的确定上,因此可以更适当地设置块大小。 
图像编码单元104根据广播节目内容所属的主分类类型来确定大小选择阈值DCT_TH。当广播节目内容所属的次分类类型对于主分类类型所表示的噪声发生概率是例外时,图像编码单元104使该例外次分类类型反映在块大小的确定上,而不管对应于主分类类型的大小选择阈值DCT_TH。 
因此,图像编码单元104可以使广播节目内容适当地反映在块大小的确定上,并且可以更适当地设置块大小。 
利用以上配置,图像编码单元104使包括在事件信息中的特征关键词反映在块大小的确定上,由此使得图像数据S4中的噪声发生概率更适当地反映在块大小上。因此,图像编码单元104可以适当地调节噪声降低和编码效率之间的平衡,并且可以提高比特流S6中的图像质量。 
3.其它实施例 
在上述第一和第二实施例中,举例来说,图像编码单元根据广播节目内容所属的主分类类型来确定大小选择参数。本发明并不局限于此,例如,在 一实施例中,可根据类型信息所表示的广播节目内容所属的次分类类型来确定大小选择参数。在此情况下,图像编码单元存储设置表,其中次分类类型与大小选择参数相关联,并且根据次分类类型来选择大小选择参数。然后,例如,图像编码单元使用对应于该大小选择参数的大小选择阈值DCT_TH。 
因此,图像编码单元实现了对广播节目内容的更详细的分类,因此更适当地选择大小选择参数。 
图像编码单元也可具有如下设置表(图8):其中例外次分类与大小选择参数相关联,该例外次分类表示广播节目内容所属的次分类类型对于广播节目内容所属的主分类类型所表示的噪声发生概率是例外。当广播节目内容所属的次分类类型是例外次分类类型时,图像编码单元将对应于该例外次分类类型的大小选择参数确定为广播节目内容的大小选择参数,而不管对应于广播节目内容所属的主分类类型的大小选择参数。 
当次分类类型是“政治和议会/辩论和会议”(“新闻/新闻报告”)、“生活方式/食物和烹饪/健康和医药”(“娱乐和闲谈”)、“古典和歌剧”(“音乐”)、“旅行和旅游”(“杂项”)、“SFX”(“动画/SFX”)、“历史和旅行/访谈和讨论”(“文档/教育”)或“喜剧和情景喜剧”(“剧院/舞台”)时,图像编码单元优先使用8×8像素的块大小。当次分类类型是“动画”(“电影”)、“体育”(“文档/教育”)或“舞蹈和芭蕾舞”(“剧院/舞台”)时,图像编码单元优先使用4×4像素的块大小。在以上例子中,括号中的词表示次分类类型所属的主分类类型。 
因此,图像编码单元可以以适当的块大小对属于例外次分类类型的广播节目内容执行DCT处理,其中该例外次分类类型具有与对应的主分类类型不同的趋势。 
此外,在上述第一实施例中,根据类型信息来选择大小选择参数。本发明并不局限于此,并且在一实施例中,可进一步接收表示当前时间的时间信息,并且可将时间信息反映在块大小上。例如,在一般分发低质量视频的午夜时间区,图像质量趋向于低。因此,可优先考虑噪声降低,并且可优先使用4×4像素的DCT块的大小。 
此外,如图9所示,当时间信息所表示的时间处于事先确定的指定时间段(例如,从上午5:00到上午8:59)内时,对于显示当前时间的时间显示区域TM,图像编码单元可优先使用4×4像素的DCT块的大小。在此情况下,对于除时间显示区域TM以外的区域,图像编码单元使用类似于第一实施例 的方法来确定大小选择参数。 
因此,图像编码单元可以降低帧图像50中显示文本信息的时间显示区域TM中的噪声,因此可以适当地去除有可能在文本信息周围发生的噪声。这避免了因为文本信息由于噪声而不清楚,因而图像编码单元给用户以整个图像的质量低的印象。 
此外,除了图9所示的例子以外,例如,可优先使用4×4像素的DCT块的大小用于叠加区域或者用于帧图像的整体,其中在该叠加区域中,在具有大量叠加文本的内容的类型(诸如杂项表演)中,场景与文本相叠加。 
此外,在上述第一和第二实施例中,正交变换单元17提供在4×4像素的DCT块和8×8像素的DCT块之间进行切换。本发明并不局限于此,并且对于要切换的DCT块的大小并没有限制。例如,也可使用16×16像素的DCT块或32×32像素的DCT块。此外,可使用三个或更多个大小作为块大小,并且可根据多个选择阈值来选择块大小。 
此外,在上述第一和第二实施例中,举例来说,使用DCT处理作为正交变换。本发明并不局限于此,并且在一实施例中,可使用各种正交变换处理,诸如小波变换。 
此外,在上述第一和第二实施例中,举例来说,使用方差值MB_Var作为表示像素特征的指标。本发明并不局限于此,并且可使用各种指标。指标可以不必针对作为编码单位的每个宏块而进行计算,而是可以以各种大小为单位来计算,例如,以8×8像素或32×32像素为单位。在本发明的实施例中,对默认值并没有限制,默认值可被设置为任何值。对偏移量OF的数目、偏移量OF的值以及用于计算偏移量OF的方法没有限制。例如,可通过将作为大小选择参数的总得分乘以预定系数来计算偏移量OF。 
此外,在上述第一和第二实施例中,本发明的实施例应用于地面数字广播的分发。本发明并不局限于此,并且本发明的实施例可应用于例如各类节目内容,诸如通过因特网分发的节目内容流以及按需分发的节目内容。此外,EPG信息S3可不必与广播信号S1同时获得,并且可通过诸如因特网的网络而单独获得。在此情况下,可以获取更详细的类型信息。可存储对应于这种类型信息的设置表或得分表,由此使得能够根据更详细的分类来设置块大小。 
在上述第一和第二实施例中,根据AVC/H.264方案来执行编码处理。本发明并不局限于此,并且本发明的实施例也可以应用于任何使用滤波器的编 码方案,该滤波器能够降低编码所导致的噪声。 
此外,在上述第一实施例中,举例来说,4×4优先级元素被评估为用于评估噪声降低优先级的优先级元素。本发明并不局限于此,并且可评估编码效率的优先级。此外,对于优先级元素的数目没有限制,并且可使用一个或多个期望的优先级元素。 
此外,在上述第二实施例中,举例来说,将根据类型信息所选择的大小选择参数乘以根据广播站信息和特征关键词所选择的附加系数。本发明并不局限于此,并且应理解,可将广播站信息和特征关键词中的任何一个或两者反映在块大小的确定上。例如,可添加根据广播站信息和特征关键词所选择的附加系数。作为备选方案,可根据广播站信息和特征关键词之一来选择附加系数。此外,在本发明一实施例中,可将广播站信息和特征关键词中的任何一个或两者反映在块大小的确定上,而不使用类型信息。在此情况下,从设置表中选择大小选择参数、与其相对应的大小选择阈值DCT_TH等,在该设置表中,广播站信息和特征关键词之一或两者与大小选择参数相关联。作为备选方案,图5中所示的大小选择阈值DCT_TH可被选择为大小选择参数,并且可乘以附加系数,以确定实际要使用的选择阈值DCT_TH。 
此外,在上述实施例中,举例来说,编码程序、块大小设置程序等事先存储在ROM、硬盘驱动器等中。本发明并不局限于此,并且以上程序可从诸如记忆棒(索尼公司的注册商标)的外部存储介质安装到闪存等中。此外,块大小设置程序等可通过基于通用串行总线(USB)、以太网(注册商标)、电气和电子工程师协会(IEEE)802.11a/b/g或任何其它适当标准的无线局域网(LAN)而从外部获得,并且可进一步通过地面数字电视广播或广播卫星(BS)数字电视广播进行分发。 
在上述实施例中,用作编码装置的图像编码单元4是如下配置的:使用对应于屏幕重排缓冲器11和EPG信息获取单元31的接收单元、对应于参数确定单元33的选择单元和确定单元、以及对应于正交变换单元17的正交变换单元。根据本发明一实施例的图像处理装置可至少包括接收单元、选择单元、确定单元和正交变换单元,并且可仅使用例如图像编码单元4来配置。作为备选方案,根据本发明一实施例的编码装置可使用可具有其它各种配置的接收单元、选择单元、确定单元和正交变换单元来配置。 
本申请包含与2009年6月11日向日本专利局提交的日本优先权专利申请JP 2009-140368中公开的主题相关的主题,其全部内容在此经引用而并入本文。 
本领域技术人员应当理解,在所附权利要求或其等同方案的范围内,根据设计需求和其它因素,可进行各种修改、组合、子组合和变更。 

Claims (20)

1.一种图像处理装置,包括:
接收单元,配置成接收节目内容的图像数据以及与所述节目内容相关的类型信息;
选择单元,配置成选择大小选择参数,所述大小选择参数用于使所述接收单元所接收的所述类型信息反映在块大小上,所述块大小用于正交变换;
确定单元,配置成根据所述选择单元所选择的大小选择参数来确定所述块大小;以及
正交变换单元,配置成以所述确定单元所确定的块大小对所述接收单元所接收的图像数据执行正交变换。
2.根据权利要求1所述的图像处理装置,其中所述确定单元通过将表示所述接收单元所接收的图像数据的像素值特征的指标值与根据所述大小选择参数所选择的块选择阈值相比较来选择所述块大小,并且使所述类型信息反映在用于正交变换的所述块大小上。
3.根据权利要求2所述的图像处理装置,其中所述指标值是表示编码单位的方差的方差值。
4.根据权利要求3所述的图像处理装置,其中所述确定单元通过在要优先考虑噪声降低时降低所述块选择阈值,在预定第一块大小和大于所述第一块大小的第二块大小中,优先使用所述第一块大小作为用于正交变换的所述块大小,以及
所述确定单元通过在要优先考虑编码效率时提高所述块选择阈值,优先使用所述第二块大小作为用于正交变换的所述块大小。
5.根据权利要求4所述的图像处理装置,其中所述确定单元通过在要强调层次时提高所述块选择阈值,优先使用所述第二块大小作为用于正交变换的所述块大小。
6.根据权利要求4所述的图像处理装置,其中所述确定单元通过在所述类型信息表示体育类型时降低所述块选择阈值,优先使用所述第一块大小作为用于正交变换的所述块大小。
7.根据权利要求6所述的图像处理装置,其中所述确定单元通过在所述类型信息表示动画/SFX类型时降低所述块选择阈值,优先使用所述第一块大小作为用于正交变换的所述块大小。
8.根据权利要求7所述的图像处理装置,其中所述确定单元通过在所述类型信息表示音乐类型时降低所述块选择阈值,优先使用所述第一块大小作为用于正交变换的所述块大小。
9.根据权利要求8所述的图像处理装置,其中所述确定单元通过在所述类型信息表示杂项类型时降低所述块选择阈值,优先使用所述第一块大小作为用于正交变换的所述块大小。
10.根据权利要求9所述的图像处理装置,其中所述确定单元通过在所述类型信息表示文档/教育类型时提高所述块选择阈值,优先使用所述第二块大小作为用于正交变换的所述块大小。
11.根据权利要求10所述的图像处理装置,其中所述确定单元通过在所述类型信息表示业余爱好/教育类型时提高所述块选择阈值,优先使用所述第二块大小作为用于正交变换的所述块大小。
12.根据权利要求10所述的图像处理装置,其中所述图像处理装置根据H.264/高级视频编码来对所述图像数据来进行编码,以及
其中所述正交变换单元使用表示像素值间的差的差值数据作为要经受正交变换的图像数据,并且对所述图像数据执行作为正交变换的DCT处理。
13.根据权利要求4所述的图像处理装置,其中所述接收单元接收描述所述节目内容的事件信息,以及
其中当所述事件信息包括特征关键词时,所述确定单元使所述特征关键词反映在所述块大小的确定上,所述特征关键词表示所述图像数据的噪声发生概率。
14.根据权利要求13所述的图像处理装置,其中所述接收单元接收表示已分发了所述节目内容的广播站的广播站信息,以及
其中所述确定单元使所述广播站信息反映在所述块大小的确定上。
15.根据权利要求14所述的图像处理装置,其中所述确定单元根据所述节目内容所属的主分类类型来确定所述块选择阈值,以及
其中当所述节目内容所属的次分类类型对于所述主分类类型所表示的噪声发生概率是例外时,所述确定单元使所述次分类类型反映在所述块大小的确定上,而不管对应于所述主分类类型的大小选择阈值。
16.根据权利要求14所述的图像处理装置,其中所述确定单元使所述类型信息所表示的节目内容所属的次分类类型反映在所述块大小的确定上。
17.根据权利要求13所述的图像处理装置,其中所述接收单元接收表示当前时间的时间信息,以及
其中所述确定单元使所述时间信息反映在所述块大小的确定上。
18.根据权利要求17所述的图像处理装置,其中当所述时间信息所表示的当前时间处于预定的指定时间段内时,对于显示所述当前时间的时间显示区域,所述确定单元优先使用所述第一块大小作为用于正交变换的所述块大小。
19.根据权利要求9所述的图像处理装置,进一步包括:
调谐单元,配置成接收包括所述节目内容的广播信号以及生成所述图像数据;以及
存储单元,配置成存储编码单元所编码的图像数据。
20.一种图像处理方法,包括以下步骤:
接收节目内容的图像数据以及与所述节目内容相关的类型信息;
选择大小选择参数,所述大小选择参数用于使在接收步骤中接收的所述类型信息反映在块大小上,所述块大小用于正交变换;
根据在选择步骤中选择的所述大小选择参数来确定所述块大小;以及
以在确定步骤中确定的所述块大小对在所述接收步骤中接收的所述图像数据执行正交变换。
CN2010101989997A 2009-06-11 2010-06-04 图像处理装置和图像处理方法 Expired - Fee Related CN101924889B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009-140368 2009-06-11
JP2009140368A JP2010288080A (ja) 2009-06-11 2009-06-11 画像処理装置及び画像処理方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2013103138714A Division CN103402088A (zh) 2009-06-11 2010-06-04 图像处理装置和图像处理方法

Publications (2)

Publication Number Publication Date
CN101924889A CN101924889A (zh) 2010-12-22
CN101924889B true CN101924889B (zh) 2013-08-28

Family

ID=43307565

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2013103138714A Pending CN103402088A (zh) 2009-06-11 2010-06-04 图像处理装置和图像处理方法
CN2010101989997A Expired - Fee Related CN101924889B (zh) 2009-06-11 2010-06-04 图像处理装置和图像处理方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2013103138714A Pending CN103402088A (zh) 2009-06-11 2010-06-04 图像处理装置和图像处理方法

Country Status (3)

Country Link
US (3) US8472741B2 (zh)
JP (1) JP2010288080A (zh)
CN (2) CN103402088A (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010288080A (ja) * 2009-06-11 2010-12-24 Sony Corp 画像処理装置及び画像処理方法
JP2012129979A (ja) * 2010-11-24 2012-07-05 Jvc Kenwood Corp 区間作成装置、区間作成方法、及び区間作成プログラム
CN107371021B (zh) * 2011-12-28 2020-01-24 Jvc 建伍株式会社 动图像编码装置、动图像编码方法以及存储介质
TWI684354B (zh) * 2011-12-28 2020-02-01 日商Jvc建伍股份有限公司 動態影像解碼裝置及動態影像解碼方法
US20150055697A1 (en) * 2013-08-20 2015-02-26 Media Tek Inc. Method and Apparatus of Transform Process for Video Coding
US10070173B2 (en) 2016-12-22 2018-09-04 Arris Enterprises Llc Video encoder customization through use of crowdsourcing and program metadata
KR20190056888A (ko) * 2017-11-17 2019-05-27 삼성전자주식회사 비디오 부호화 장치 및 방법
EP3503548B1 (en) * 2017-12-19 2019-10-23 Axis AB Video encoding method and system
CN109344289B (zh) * 2018-09-21 2020-12-11 北京字节跳动网络技术有限公司 用于生成信息的方法和装置
CN110889844B (zh) * 2019-11-29 2023-03-21 哈尔滨工程大学 一种基于深度聚类分析的珊瑚分布及健康状况评估方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1379594A (zh) * 2001-03-27 2002-11-13 皇家菲利浦电子有限公司 对被编码的视频信号同时进行格式压缩和解码的方法
EP1445958A1 (en) * 2003-02-05 2004-08-11 STMicroelectronics S.r.l. Quantization method and system, for instance for video MPEG applications, and computer program product therefor
CN101052129A (zh) * 2006-04-03 2007-10-10 株式会社日立制作所 数字广播接收装置
JP2009124300A (ja) * 2007-11-13 2009-06-04 Nippon Telegr & Teleph Corp <Ntt> 透かし埋め込み付きjpeg符号化装置,透かし埋め込み付きjpeg符号化方法,透かし埋め込み付きjpeg符号化プログラム及びそのプログラムを記録した記録媒体、その透かし埋め込み付きjpeg画像データに対する改ざん検出装置,透かし埋め込み付きjpeg画像データに対する改ざん検出方法,透かし埋め込み付きjpeg画像データに対する改ざん検出プログラム及びそのプログラムを記録した記録媒体

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5241395A (en) * 1989-08-07 1993-08-31 Bell Communications Research, Inc. Adaptive transform coding using variable block size
JP3363915B2 (ja) * 1991-09-30 2003-01-08 株式会社日立国際電気 高能率符号化方式
US6226618B1 (en) * 1998-08-13 2001-05-01 International Business Machines Corporation Electronic content delivery system
JP3588564B2 (ja) * 1999-03-31 2004-11-10 株式会社東芝 映像データ記録装置
JP2001238216A (ja) * 2000-02-23 2001-08-31 Matsushita Electric Ind Co Ltd 動画像圧縮装置および動画像圧縮方法
JP2003244595A (ja) * 2002-02-14 2003-08-29 Toshiba Corp 情報エンコード装置及び方法
US7433582B2 (en) * 2002-06-25 2008-10-07 International Business Machines Corporation Personal video recording with machine learning for messaging
EP1618743A1 (en) * 2003-04-17 2006-01-25 Koninklijke Philips Electronics N.V. Content analysis of coded video data
CN1236617C (zh) * 2003-09-01 2006-01-11 浙江大学 图像和视频编码中兼容4×4变换的8×8变换方法
JP4532980B2 (ja) * 2004-05-12 2010-08-25 キヤノン株式会社 動画像符号化装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP4520821B2 (ja) 2004-10-29 2010-08-11 日東工器株式会社 管継手及び雄型継手
JP2006157481A (ja) * 2004-11-30 2006-06-15 Canon Inc 画像符号化装置及びその方法
JP2007123984A (ja) * 2005-10-25 2007-05-17 Matsushita Electric Ind Co Ltd コンテンツ配信システム、ストリーム送出装置、受信装置、およびコンテンツ配信方法
JP2007201558A (ja) * 2006-01-23 2007-08-09 Matsushita Electric Ind Co Ltd 動画像符号化装置および動画像符号化方法
JP4921239B2 (ja) * 2007-05-09 2012-04-25 キヤノン株式会社 画像処理装置およびその方法
JP2009010603A (ja) * 2007-06-27 2009-01-15 Sony Corp 記録装置および記録方法
JP2009055236A (ja) * 2007-08-24 2009-03-12 Canon Inc 映像符号化装置及び方法
JP2009218742A (ja) * 2008-03-07 2009-09-24 Canon Inc 画像符号化装置
JP5413002B2 (ja) 2008-09-08 2014-02-12 ソニー株式会社 撮像装置および方法、並びにプログラム
JP2010288080A (ja) * 2009-06-11 2010-12-24 Sony Corp 画像処理装置及び画像処理方法
JP2010288079A (ja) * 2009-06-11 2010-12-24 Sony Corp 画像処理装置及び画像処理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1379594A (zh) * 2001-03-27 2002-11-13 皇家菲利浦电子有限公司 对被编码的视频信号同时进行格式压缩和解码的方法
EP1445958A1 (en) * 2003-02-05 2004-08-11 STMicroelectronics S.r.l. Quantization method and system, for instance for video MPEG applications, and computer program product therefor
CN101052129A (zh) * 2006-04-03 2007-10-10 株式会社日立制作所 数字广播接收装置
JP2009124300A (ja) * 2007-11-13 2009-06-04 Nippon Telegr & Teleph Corp <Ntt> 透かし埋め込み付きjpeg符号化装置,透かし埋め込み付きjpeg符号化方法,透かし埋め込み付きjpeg符号化プログラム及びそのプログラムを記録した記録媒体、その透かし埋め込み付きjpeg画像データに対する改ざん検出装置,透かし埋め込み付きjpeg画像データに対する改ざん検出方法,透かし埋め込み付きjpeg画像データに対する改ざん検出プログラム及びそのプログラムを記録した記録媒体

Also Published As

Publication number Publication date
US20100319030A1 (en) 2010-12-16
US9264714B2 (en) 2016-02-16
US20160119644A1 (en) 2016-04-28
JP2010288080A (ja) 2010-12-24
US9414089B2 (en) 2016-08-09
CN103402088A (zh) 2013-11-20
CN101924889A (zh) 2010-12-22
US20130247110A1 (en) 2013-09-19
US8472741B2 (en) 2013-06-25

Similar Documents

Publication Publication Date Title
CN101924889B (zh) 图像处理装置和图像处理方法
CN106716997B (zh) 使用环路内滤波器参数预测的视频编码方法和设备
CN101924890B (zh) 图像处理设备和图像处理方法
US9826254B2 (en) Method for entropy-encoding slice segment and apparatus therefor, and method for entropy-decoding slice segment and apparatus therefor
RU2745021C1 (ru) Способ и устройства для конфигурирования преобразования для сжатия видео
US20200175724A1 (en) Distinct encoding and decoding of stable information and transient/stochastic information
US20230059802A1 (en) Signaling of information indicating transform kernel set in image coding
US11778201B2 (en) Video encoding and video decoding
JP2022529688A (ja) 変換インデックスを利用する映像コーディング
CN111263150B (zh) 视频编码设备和视频解码设备
CN113170197A (zh) 基于二次变换的图像编码方法及其装置
KR20200050284A (ko) 영상 적응적 양자화 테이블을 이용한 영상의 부호화 장치 및 방법
López et al. Methodological and statistical background on the world’s technological capacity to store, communicate, and compute information
US10997426B1 (en) Optimal fragmentation of video based on shot analysis
US20220377342A1 (en) Video encoding and video decoding
US20240137512A1 (en) Transform-based image coding method and device therefor
GB2587363A (en) Method of signalling in a video codec
EA046317B1 (ru) Внутреннее прогнозирование цветности в кодировании и декодировании видео
CN114762344A (zh) 基于变换的图像编码方法及其装置
CN114762338A (zh) 基于变换的图像编码方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130828

Termination date: 20150604

EXPY Termination of patent right or utility model