CN1148770A - 消除字幕数据噪声的数字视频数据编码和译码装置及方法 - Google Patents

消除字幕数据噪声的数字视频数据编码和译码装置及方法 Download PDF

Info

Publication number
CN1148770A
CN1148770A CN96112149A CN96112149A CN1148770A CN 1148770 A CN1148770 A CN 1148770A CN 96112149 A CN96112149 A CN 96112149A CN 96112149 A CN96112149 A CN 96112149A CN 1148770 A CN1148770 A CN 1148770A
Authority
CN
China
Prior art keywords
pixel
noise
caption data
data
ambient level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN96112149A
Other languages
English (en)
Inventor
越郁夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1148770A publication Critical patent/CN1148770A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • H04N7/087Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only
    • H04N7/088Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital
    • H04N7/0884Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection
    • H04N7/0885Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection for the transmission of subtitles
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/24Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing noise
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/21Circuitry for suppressing or minimising disturbance, e.g. moiré or halo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Abstract

一种用于对其中包括有字幕数据的数字视频数据进行编码和译码的装置和方法,利用由字幕数据表示的字幕的像素与该字幕的相邻像素之间的相关性从该字幕数据中消除噪声。特别是,当与噪声像素相邻并垂直或水平校直的像素是背景电平像素时,表示字幕中噪声的字幕像素被改变成背景电平像素。在数字视频数据译码期间,由已经消除了噪声的字幕数据表示的字幕被叠加到由该数字视频数据表示的视频图像上。

Description

消除字幕数据噪声的数字视频数据 编码和译码装置及方法
本发明涉及一种对数字视频数据进行编码和译码的装置和方法,特别是涉及到一种用于对能够从其中所包含的字幕数据中消除噪声的数字视频数据进行编码和译码的装置和方法。
如所知,表示将要被叠加在一个视频图像上的字幕的字幕数据在被记录和传送以前与视频信号一起存储。在一个称为CAPTAIN系统的系统中,字幕是以点图形的字符代码形式传送的。在公知的数据格式CD-G(光盘图形)下,图形图像和字幕数据被存储在数据格式的子码区。如图1(a)到图1(c)所示,这些图简要地示出了CD-G格式的数据结构,一个块的数据包含有98个帧,每一帧包含有一个字节的子码区,在其后是32个字节的数据。一帧中32个字节数据由6个4字节的样本和一个8字节误差校正码组成,如图1(A)所示,每个样本由2个字节的L通道数据和2个字节的R通道数据组成。如图1(b)所示,一个块由98个帧即帧0到97组成,且如图1(c)所示,每个块也被分成8个通道P、Q、R、S、T、U、V和W。帧0和帧1的子码数据被作为同步模式S0和S1存储在P到W8个通道的每一个之中,并且在R到W通道中的同步模式后面各跟随有一个96字节的数据区,在该数据区中存储有帧2-97的数据。跟在同步模式S0和S1之后的通道P和Q通常包括“搜索”数据,该“搜索”数据被用于搜索光道,图形数据通常被存储在通道R到W中同步模式S0和S1之后。这样,在每一个块中存储有每通道96位乘以6个通道R至W=576位图形数据。另外,当以75赫兹的周期频率传送每个块时,用于一个块的数据传送速率是7.25kHz(75Hz×98字节),从而使子码传送位速率为7.35kbs(每秒千字节)。
图2简要地示出了图1中通道R到W的传送格式,其中,所传送的“码元”由来自通道R到W中每通道的单个位的组合构成,所传送的“包”由96个码元组成,而所传送的“子包”包括24个码元0到23。每个子包的码元0的通道R、S和T的三个位被保留给“模式”数据,且每个子包的码元0的通道U、V和W三个位被保留给“项”数据。下面示出的表1表示当使用模式数据和项数据进行定义时的各种数据模式。
            表1
    模式     项   数据模式
    000     000   0模式
    001     000   图形模式
    001     001   TV图形模式
    111     000   用户模式
指令信息被存储在每个子包的码元1中,奇偶校验和其它附加信息被存储在每个子包的码元2到7中。图形数据通常被存储在每个子包的码元8至19中,误差校正码被存储在每个子包剩余的码元20-23中。
在上面所讨论的格式下,每个子包可以存储6×12=72个图形数据位或图形数据的72个像素。如果一个单一的字符被存储在每个子包的8-19(6位×12码元)中,那么,每秒种以75Hz的位传送速率传送300个字符。在CD-G格式下,一个单一的图像包括192行,其中每行包括288个水平像素,这样,传送每个图像需要2.56秒,如等式1所示:
(288/6)×(192/12)/300=2.56(秒)    (1)
如果以十六进制形式来表示每个像素值,并且一个像素的每个十六进制表示需要4位,那么,传送一个单一图像所需的时间量约是10.24秒。
在CAPTAIN系统中,每个图像显示192行(每行248个水平像素),但是,对于数字电视的720×480分辨率来讲,这一分辨率是不够的。另外,由于混淆或其它的现象,以上述数据格式存储的字幕字符可能失真(例如,“参差不齐”)。避免字幕字符在其编码和译码期间失真的一种技术就是使用高分辨率滤波器把数字图像转换成“多值”数据,但这种滤波器通常都很昂贵,并且它们可能引起画面背景图像失真。
通常,表示字幕字符的位映像数据都要经过“加强”(thickening)处理,其中对字符的边缘“加轮廓”,但这种处理通常使字符在水平方向上“拖尾”。因此,所得到的由位映像数据表示的字幕的质量一般很差。
因此,本发明的目的是提供一种用于对数字视频数据进行编码和译码的装置和方法,其克服了上述技术中的缺点。
本发明的另一个目的是提供一种装置和方法,用于对具有字幕数据的数字视频数据进行编码和译码并从字幕数据中消除噪声。
本发明的再一个目的就是提供一种装置和方法,用于将数字视频信号与字幕数据一起进行编码,它在字幕数据和数字视频信号相结合之前从字幕数据中消除了噪声。
本发明的各种其它的目的,优点和特征对于本专业技术领域以内的普通技术人员将变得非常明显,且在所附权利要求书中将特别指出本发明的新颖特征。
根据本发明的一个实施例,运用本发明的装置和方法接收字幕数据,该数据表示具有多个像素的字幕,根据字幕各像素和与各像素相邻的像素之间的相互关系从字幕数据中消除噪声,并对数字视频数据与已消除噪声的字幕数据一起进行编码。
作为本发明的一个方面,当通过确定一个像素的值是否小于背景电平像素的值而该像素表示一个噪声像素时,则各像素被变成背景电平像素,且相邻像素代表背景电平像素。
作为本发明的另一方面,与各个像素相邻并垂直校直的像素被用于确定是否改变各像素的值。
作为本发明的另一方面,与各个像素相邻并水平校直的像素被用于确定是否改变各像素的值。
根据本发明的另一实施例,运用本发明的装置和方法接收包括字幕数据的数字视频数据,所述的字幕数据表示具有多个像素的字幕;从所接收的数字视频数据中提取该字幕数据;根据该字幕的各个像素和与该各像素相邻的像素之间的相互关系从所提取的字幕数据中消除噪声,和将由已被消除噪声的字幕数据表示的字幕叠加到由数字视频数据表示的一个视频图像上。
根据本发明的再一个实施例,运用本发明的装置和方法接收含有噪声的字幕数据;确定在该字幕中的各个像素是否是噪声像素;确定在该字幕中与该各像素相邻的像素是否是背景电平像素;并且当所述各像素被确定为是噪声像素且相邻像素被确定是背景电平像素时,把代表各像素的字幕数据改变成背景电平。
下面将结合附图借助于举例对本发明进行详细描述,这些例子对本发明不构成限定,图中相同的标号表示相同的元件或部分,其中,
图1(a)到1(c)简要地示出了DC-G数据格式的数据结构;
图2简要示出了图1(a)到1(c)所示数据格式的传送格式;
图3的方框图示出了依据本发明的一个数据译码设备;
图4的方框图示出了图3所示的字幕译码器7;
图5(a)和5(b)是地址表,它示出了一个内容表(TOC)的内容;
图6(a)和6(b)简要地示出了存储在一个记录介质上的视频,音频和子码数据的数据流;
图7的表示出了在系统控制器14和35之间的各种通信;
图8的表示出了系统控制器14和35之间各种通信的参数;
图9(a)到9(c)示出了根据本发明的字幕数据的信号波形;
图10示出了在本发明编码处理期间使用的彩色查询表;
图11的方框图示出了根据本发明的数据译码设备;
图12(a)和12(b)简要地示出了图11所示的划变数据取样器70;
图13是由本发明编码和译码设备使用的另一个彩色查询表;
图14简要地示出了本发明字幕译码器的代码缓冲器的内容;
图15的方框图示出了本发明字幕译码器缓冲器;
图16(a)到16(c)简要地示出了彩色划变操作;
图17的方框图示出了彩色查询表电路;
图18(a)到18(c)简要示出了显示位置改变操作;
图19是位置控制电路的方框图;
图20(a)和20(b)简要地示出了加有和未加有噪声的位映像数据;
图21的方框图示出了根据本发明的噪声消除滤波器;和
图22(a)和22(b)简要地示出了由加有和未加有噪声的字符数据表示的一个字幕字符。
参看图3,该图示出了根据本发明的一个数据译码设备的方框图。该数据译码设备包括一个数据译码器/信号分离器1、缓冲存储器2、4、6、和12、视频译码器3、信箱电路5、字幕译码器7、复合编码器8、模式显示电路9、D/A转换器10和13、音频转换器11和系统控制器14。可选择地,所述数据译码设备还可以包括一个驱动控制器15;用于将字幕数据存储到一个例如磁光盘91的记录介质上或从该记录介质上再现该字幕数据。
其中具有被编码的音频、视频和字幕数据的视频信号被提供给译码器/信号分离器1(此后称之为信号分离器1),该信号分离器1对所提供的信号进行译码并进行误差校正,同时对其中的视频、字幕和音频数据进行多路分解,并将多路分解的视频、字幕和音频数据分别提供给视频译码器3、字幕译码器7和音频译码器11。存储器2是一个由信号分离器1以公知方式使用的缓冲存储器。
视频译码器3对提供给它的多路分解的视频数据进行译码,并将译码后的视频数据提供给信箱电路5,当需要时,该信箱电路5进行操作以在垂直方向上将由该视频信号表示的视频图像压缩3/4,以使得视频图像可以被显示在宽高比为4∶3的一个视频监视器上。信箱电路5将该视频数据提供给字幕译码器7(下面讨论)。
音频译码器11对提供给它的多路分解的音频数据以公知方式进行译码,并将译码后的音频数据提供给D/A转换器13,该转换器13将数字音频数据转换成模拟音频信号以输出。视频译码器3、信箱电路5和音频译码器11分别以现有技术中公知方式使用缓冲存储器4、6和12。
字幕译码器7以下面将要讨论的方式对提供给它的字幕数据进行译码,并将字幕数据叠加到由信箱电路5提供的视频信号上,然后将组合的视频和字幕数据提供给复合编码器8。复合编码器8将其上叠加有字幕数据的视频信号以现有技术中公知的方式转换成NTSC、PAL或SECAM信号,并将转换后的信号提供给D/A转换器10,该转换器10将数字视频数据转换成模拟信号输出。
上面讨论的图3所示译码器设备每一电路的操作是由系统控制器14以及模式显示电路9控制的,所述模式显示电路9允许用户向系统控制器14提供指令并监视和显示各种操作。
图4以方框图的形式表示了字幕译码器7,它包括一个字检测器电路20、一个调度电路21、一个代码缓冲器22、一个逆变长编码器(逆VLC)23、一个逆游程长度电路24、一个3∶4滤波器25、一个彩色查询表(CLUT)电路26、一个混合器34、一个字幕系统控制器35和一个噪声消除滤波器400。如将要讨论的,字幕译码器7接收位流形式的字幕数据,并在将其存储到代码缓冲器22之后在指定时间对该位流进行译码。如图3所示的信号分离器1输出的字幕数据被提供给字检测器20,以检测其首标信息、首标误差信息和数据误差信息(下面将要讨论),并将检测后的信息提供给系统控制器35。字检测器20另外还要检测并从所提供的字幕数据中提取时间标记(PTSS)数据,该数据用于识别所述字幕什么时候被叠加到该视频信号上;位置数据,该数据用于识别在视频图像的什么位置处该字幕被进行叠加;像素数据,该数据用于表示字幕本身;以及更新的CLUT数据。所提取的数据被提供给代码缓冲器22,该缓冲器22用于在其中存储数据。调度器21控制代码缓冲器22的读出和写入操作,代码缓冲器22的读/写“存取”带宽是根据存储器存取调度处理过程决定的,该过程是由数据从信号分离器1传送的数据的位速率以及显示速率控制的。例如,如果信号分离器1的位速率输出最大是20Mbps(每秒兆位)且代码缓冲器22具有一个8位的I/O端口,那么将数据存储到代码缓冲器22中的最佳速率是2.5MHz。但是,数据是根据垂直和水平同步信号,存储在代码缓冲器22中的位置信息以及从系统控制器14中接收译码起动信号而从代码缓冲器22中读出的。数据是以13.5MHz的像素取样速率从代码缓冲器22中读出,并且由于写入速率是2.5MHz,所以,最慢的读出速率是3.375MHz,该速率是13.5MHz的1/4。换言之,处于13.5MHz时钟速率的每4个时钟周期中的一个被用于写入操作,而每4个时钟周期中其余的三个时钟周期被用于从代码缓冲器22读出数据。由于代码缓冲器22的I/O端口是8位宽,所以在每4个时钟周期中从中读出3个时钟周期×8位=24位,并且如果子码的每个像素最多包含6位,字幕的实时显示是可能的。
如前所述,字检测器20提供字幕显示时间标记(PTSS)数据给系统控制器35,该控制器35将PTSS数据提供给系统控制器14。系统控制器14将时间标记数据和系统时钟(未示出)的当前时间进行比较,并且当到达由该时间标记所指出的时间时,系统控制器14把一个适当的指令提供给字幕译码器7中的系统控制器35,该控制器35响应提供给它的指令控制调度器21和代码缓冲器22输出其中存储的字幕数据。另外,在普通重放模式下,存储在代码缓冲器22中的字幕数据被重复读出,从而使该字幕被连续地叠加到该视频图像的每一帧上,直到达到字幕显示结束时间为止,这种信息被包括在字幕显示时间标记数据之内。在特殊重放模式下,例如,在“n”倍的快进或快倒模式下,字幕数据从代码缓冲器22读出的持续时间是在普通重放模式期间它被读出所用时间长度的1/n。在普通和特殊重放模式下通常可以使用一个脉冲计数器以确定从代码缓冲器22的字幕数据的读出操作在什么时候将被中止,其中,脉冲计数器在普通重放模式下加1计数到规定的数(或从规定的数减到0),在特殊重放模式下以速率n计数到规定的数。
来自代码缓冲器22的字幕数据提供给逆VLC电路23,如果需要的话,该电路对读出的数据执行逆变长编码操作并将译码后的数据提供给逆游程长度电路24,该电路通过以现有技术中公知的方式产生“电平”数据对所述数据译码,并将译码后的数据(即扩展数据)提供给3∶4滤波器25。当一个显示器的宽高比为4∶3时,扩展后的字幕数据在3∶4滤波器25内以水平方向压缩,这种压缩是响应来自系统控制器35的X挤压命令而形成的。当监视器的宽高比为16∶9或当字幕数据表示多个字形时,字幕数据不进行水平压缩。
如前所述,系统控制器14在一个适当的时刻向系统控制器35提供一个译码开始指令,但是,由字幕译码器各个电路开始进行译码的时间被延迟一个预定的时间量,以补偿视频信号(没有字幕数据)译码的任一延迟。同样,该视频信号的译码可以被延迟一个预先确定的时间量,从而可以使字幕数据向该视频信号的叠加同步。
滤波器25将字幕数据提供给噪声消除滤波器400,如下面将要讨论的,根据本发明,该滤波器400用于从字幕数据中消除噪声并且将(已经消除了噪声的)字幕数据提供给彩色查询表(CLUT)电路26。如前所述,字检测器20从字幕数据中提取更新后的CLUT数据,并将CLUT数据提供给其中存储有数据的代码缓冲器22。该CLUT数据从代码缓冲器22中读出并提供给CLUT电路26,该电路26根据提供给它的CLTU数据产生用于由噪声消除滤波器400提供的字幕数据的适当的色彩,并为每个像素选择与字幕数据相对应的地址,同时向混合器34提供混合比率K和彩色分量Y、Cr和Cb。混合器34响应来自控制器35的适当的叠加控制信号根据混合率K利用处于适当位置(如用字幕位置数据所确定的)的视频数据对由CLUT电路26提供的彩色数据Y、Cr和Cb进行“混合”。另外,当在模式信息中规定衰减系数时,如前所述,实现来自该视频图像的字幕的渐显和渐隐。当该字幕未被叠加在视频信号上时,如由来自控制器35的叠加控制信号所识别的,混合器34仅提供加给它的视频数据作为输出。
当字幕发生器(在图11中表示为字符发生器55)以将被叠加到一个视频信号上的位映像数据形式产生并提供一个字幕时,该数据通常以模拟信号的形式通过一个适当的模拟系统传送到一个字幕编码器,该编码器在该字幕数据被叠加到一个视频信号上之前对它进行编码。由于这种模拟系统的各种频率特性和带宽函数,将导致上升的“过量”和/或“不足”,并与位映像数据相重合,这将使得位映像数据在水平方向上“拖尾”。图20(A)示出了一个有“拖尾”的位映像数据,且如这里所标记的,该位映像数据表示了加有“噪声”的字幕数据。图20(B)示出了一个无拖尾的位映像数据,该数据表示已经消除了噪声的字幕数据。本发明字幕译码器的噪声消除滤波器400消除字幕数据中的“噪声”(即消除拖尾)(下面还要讨论)并将消除了噪声的字幕数据提供给CLUT电路26。
下面结合附图5(A)和5(B)来说明从一个记录介质(例如数字视频盘)中提取字幕的方式。与上述将视频、音频和子码数据多路转换成一个单一视频信号然后再将其提供给信号分离器1的数据格式不同,字幕数据可以与视频和音频数据分开存储,或者所有的视频,音频和字幕数据可以被存储在例如一个数字视频盘的记录介质上,其中,当需要时,本发明的译码装置从盘91中提取在其上面存储的字幕数据。如图5(A)所示,一个通常被存储在盘91最内缘(称为“引入”)上的内容表(TOC)包括对应每一子码帧号(N、N+1等)的识别帧位置的一字节指针值(PONT)和与该帧的时间相对应的时间代码(PMIN、PSEC、PFRAME)。示于图5(B)的内容表识别包括在数据流(即:视频、音频或字幕数据)中的数据的类型,各数据流的帧号以及在所述盘上各数据流被存储的起始和结束地址(起始扇区地址和结束扇区地址)。如图3所示,系统控制器14借助于驱动控制器15从盘91中提取TOC数据,以识别所选数据流的位置。
另外,记录在盘上各个位置处的一个流“映像”识别该数据流的存取点,以提供从记录介质上提取字幕的另一种手段。流映像被作为数据包加以提供,并用于识别视频、音频和字幕数据的位置以及各种消隐信息的位置,同时还用于识别每一数据流的包长度,流映像的长度等等。系统控制器14以类似于提取TOC数据的方式提取特定的流映像。
从数字视频盘中提取字幕的另一种方法是利用由每一个字幕(这里被定义为“当前字幕”)进行存储的字幕流扇区地址数据,该数据包括附属于以前字幕的数据,即在包括该扇区地址数据的字幕之前进行叠加的字幕,且该字幕还包括附属于跟在当前字幕之后的一个字幕的数据,即在当前字幕被叠加之后将要被叠加在该视频图像上的下一个字幕(这里被定义为“后续字幕”)。下面的表2示出了字幕流扇区地址数据的数据结构。
                                表2
    数据ID    位数     助记符
    user_data_flag     1     uimsbf
    if(user_data_flag=″1″) [
    length_of_user_data     16     bslbf
    next_subtitle_address_offset     24     bslbf
    reserved     8     bslbf
    previous_subtitle_address_offset     24     bslbf
    reserved]     8     bslbf
字幕译码器7对字幕流扇区地址数据进行译码,并将译码后的数据通过字幕系统控制器35提供给系统控制器14,该控制器14从盘91中提取在其上记录的与所需字幕相应的字幕数据。
图6(A)示出了在数据流中被分配有字幕数据的位置。如所示,包括在每一组字幕数据中的字幕流扇区地址数据“指向”数据流中的设置有“以前”和“后续”字幕的位置。另外,图6(A)还示出了在一个再现设备普通重放模式下被提取的“普通模式”流,其中,每一个字幕页被作为部分的或“划分的”页Sp被存储在视频盘上数据流中的多个位置处。图6(B)示出了在该再现设备特殊重放模式(例如快进)下提取的“特技模式”流,其中,紧接在一个字幕页之前存储的数据表示一个帧内编码的视频图像(V_I)(即一个“I”图像)。在数据流中每个全部或“整个”字幕页Sw之前是一个“I”图像,所以可以利用一个特殊的重放模式(例如快进或快倒模式)与字幕一起再现视频图像。在图6(A)和图6(B)中,VP表示一个预编码图像(“P”图像),V_B表示一个双向预编码图像(“B”图像)及“A”表示一个音频数据包。
图7是一个示出了在译码设备的系统控制器14和字幕译码的系统控制器35之间各种通信的表,图8的表示出了从系统控制器14传送给系统控制器35的每种数据的位数。由于系统控制器14和35之间的精确通信不属于本发明的一部分,所以这里省略对它们的进一步描述。
下面参照图9(a)到9(c)来描述一种使用4位编码方法对字幕数据进行编码的方法。图9(a)简要地示出了将要被叠加到一个视频图像上的字符“A”,9(b)和9(c)分别示出了与图9(a)中水平行相对应的填充数据和关键数据的字幕数据信号电平。填充数据对应于字幕像素的亮度电平(Y),且如图9(b)所示在时间周期T1、T2、T4和T5期间填充数据处于最低电平“0h”(十六进制格式),只有在周期T3内处于高于最低电平的一个电平。关键数据表示混合率K并且通常对应于填充数据与视频图像混合的程度,且如图9(c)所示,关键数据在周期T1和T5期间内处于电平“0h”,所以仅提供视频图像(这里也称之为“背景图像”),该图像在周期T2和T4期间处于“0h”和“E0h”之间的中间电平,从而不同程度地使字幕和背景图像进行混合,所述视频图像在周期T3期间处于“E0h”电平,从而仅提供由填充数据所表示的字幕。由于与字幕图像相邻的背景图像被部分地进行了“噪声抑制”,并且“落后于”字幕图像的背景图像被全部进行了“噪声抑制”,所以在视频图像中字幕图像是完整并清晰可见的。
图10示出了包括在图4所示CLUT电路26中的一个彩色查询表(CLUT),当字幕和背景图像相互混合(即叠加)时利用该表。该表被表示为包括0到F(十六进制)的多个地址,每个地址具有各自亮度(Y)和色度(Cr和Cb)值和关键数据K,其中对于具有亮度电平为0和关键值K为E0h的地址仅仅显示字幕(没有与其相混合的任何背景图像)。
参看图11,这里示出了一个包括有本发明噪声消除滤波器的一个数据编码设备的方框图。电视摄像机51产生一个模拟视频信号并将其提供给视频编码单元52,该单元52把模拟视频信号转换成数字视频信号并对该数字视频信号进行压缩,然后将压缩后的数据以包为单位提供给多路复合器58。另外,视频信号还可以从一个记录介质中再现出来并提供给视频编码单元52。视频编码单元52包括一个速率控制器52a,用于响应由一个字幕缓冲检验器(SBV)68(下面讨论)提供的位速率信号,根据将要被包括在其中的字幕数据的量来控制视频数据压缩的程度。
话筒53提供一个模拟音频信号给音频编码单元54,该单元54将模拟音频信号转换成数字音频数据,并对该数字音频数据进行压缩,然后将压缩后的数字音频数据以包为单位提供给多路复合器58。另外,音频信号也可以从一个记录介质中再现出来并提供给音频编码单元54。
字符发生器55以数字位映像数据的形式产生字幕数据,并将该数字位映像数据提供给字幕编码单元57。另外,飞点扫描器56以模拟位映像信号的形式提供字幕数据给字幕编码单元57。字幕编码单元57包括开关61、62和69、处理电路63、数字滤波器72、量化电路64、划变数据取样器和位置取样器电路70、彩色查询表电路71、微分PCM编码器(DPCM)电路65、游程长度编码电路66、变长编码电路67、字幕缓冲检验器(SBV)电路68和噪声消除滤波器200。
字符发生器55将字幕数据(即填充数据)提供给开关61的“a”端,将关键数据提供给开关61的“b”端。另外,字符发生器55还将消隐数据提供给开关62的“a”端。字幕数据和关键数据通过开关61被时分多路复用,并被提供给数字滤波器72,该滤波器以现有技术中公知的方式对字幕和关键数据进行滤波,并将滤波后的数据提供给开关62的“b”端。假如飞点扫描器56提供字幕数据,那么该数据在被转换成数字信号并以公知方式在处理电路63中进行处理之后提供给开关62的“c”端。
开关62将由字符发生器或扫描器提供的字幕数据提供给量化电路64,该电路64使用存储在电路71中的彩色查询表中的数据对字幕数据进行量化并将量化后的字幕数据提供给噪声消除滤波器200。在字幕数据通过开关69被提供给DPCM电路65以前,以将要在滤波器200中讨论的方式从中消除噪声,所述DPCM电路65对字幕数据进行微分PCM编码,并将编码后的字幕数据提供给游程长度编码电路66,而后再提供给变长编码电路67,该电路67以公知方式对字幕数据进行压缩。
以RGB数据或位置数据的形式存在并用于提供滚动字幕(例如用于卡拉0K)的彩色划变数据是在一个彩色划变发生器(未示出)中产生的,并通过一个划变控制杆81提供给一个适配器82,该适配器82提供彩色划变数据给转换开关83和划变数据取样器70。转换开关83从字符发生器55中接收字幕数据并使该字幕数据和提供给它的彩色划变数据相互叠加,然后将结合的字幕数据提供给监视器84,从而使所产生的字幕数据可视。
图12(a)简要地示出了所产生的字幕的帧的显示,图12(b)是划变数据取样器70的方框图。如所示,适配器82把RGB彩色数据提供给电路70的寄存器300和比较器301。寄存器300锁存包括在所提供信号之中的每个像素的值,并将锁存的值提供给比较器301,比较器301把(来自适配器82的)所提供像素的值和(来自寄存器300的)以前提供的像素的值进行比较,并且在每当比较值相等时控制计数器302的计数值加1。换言之,当多个像素中的每一个都是根据同一彩色查询表产生时,比较器301输出“真”状态,而当彩色查询表改变时则输出“假”。如此形成的计数值等于当前和以前值之间匹配的数量,这与彩色查询表改变的位置相同。每当出现水平或垂直同步信号时,计数器302内的计数被复位,且在每个垂直同步信号处该计数被锁存到寄存器303之中。寄存器303通过开关69将锁存的计数值提供给DPCM电路65,然后提供电路67和68,它们对计数数据进行压缩并以包的形式提供给多路复合器58。
字幕彩色划变信息或字幕位置信息以帧为单位进行编码,但是也可以把多个帧归并成一个单一的单元进行编码。字幕缓冲器68控制量化电路64的量化电平,所以,由于对缓冲器68提供大量的已编码字幕数据,所以它不会溢出。
图13示出了类似于图10所示彩色查询表的一个彩色查询表(CLUT)并且该表被包括在彩色查询表(CLUT)电路71中。如所示,0到F(十六进制)地址中的每一个具有各自的亮度(Y)、色度(Cr和Cb)以及关键数据K的值。亮度值Y对应于填充数据,关键数据K对应于混合比率。CLUT电路71将彩色查询表的值提供给字幕缓冲器68,从而和字幕数据一起存储这个表。在译码设备中再现CLUT数据以在其中建立CLUT值,这点如前所述。当需要用于不同的字幕时,可以对彩色查询表进行修改。
字幕缓冲器68(或字幕缓冲检验器68)接收扇区地址数据,普通/特技播放数据和位置数据等,并将所提供的数据组合成经过压缩和编码的字幕数据,而后将产生的字幕数据提供给多路复合器58。字幕缓冲器68通过控制量化电路64的量化电平来控制它的输入的位速度以避免其中数据的下溢或上溢。
多路复合器58多路复用、例如时分多路复用由视频编码单元52提供的视频数据、由音频编码单元54提供的音频数据以及由字幕缓冲器68提供的字幕数据,对多路复用数据执行误差校正,并调制多路复用的数据(例如:8到14调制)。多路复合器58把作为数据流的多路复用数据输出给分区处理器100,该处理器100根据所提供的数据流产生固定长度的扇区,每个扇区包括一个或多于一个的数据包并提供每个数据扇区,或输出到盘91上进行记录或通过传送通道进行传送。分区处理器100还将每个数据扇区提供给一个内容表(TOC)和流映像产生器101,该产生器101如前所述地根据提供给它的扇区数据产生该内容表和流映像,并将该内容表及流映像数据作为输出提供给盘91进行记录。
参看图14,下面来讨论图11所示的字幕缓冲器68的操作,其中,竖轴表示数据量,横轴表示时间,缓冲器的大小(即数据容量)由斜线A和B之间的垂直距离表示,且缓冲器的读/写位速率由斜线A和B的斜率表示。“步进”线C表示也将要被传送的存储在代码缓冲器中的数据量,并且“步进”线C需避免和线A交叉,因为交叉将导致下溢状态,同时要避免线C和线B交叉,因为这种交叉将导致上溢状态。几个数据项S0、S1、S2和S3被相继存储在代码缓冲器中并在所指出显示时间处开始输出。线C的水平部分表示时间,在这些时间处数据被存储在代码缓冲器中,线C的垂直部分表示数据被从代码缓冲器中提取出来的时间。虽然在图14中斜线A和B的斜率被表示为一个常数,但是可以考虑可变的位速率(即可变的斜率)。
回过来考虑在图4所示字幕译码器中的代码缓冲器22,代码缓冲器22的工作方式类似于参考字幕缓冲器68和图14所描述的方式。图15示出了代码缓冲器22的方框图,它被表示成包括一个代码缓冲器22-1、显示存储器22-2和一个分析程序22-3。提供给代码缓冲器22的位流被提供并存储在代码缓冲器22-1中,当系统时钟在时间上与显示时间PTSS数据相一致时,代码缓冲器22-1将其中的一页字幕数据传输给显示缓冲器22-2,分析程序22-3将首标数据从剩余的字幕数据中分离出来。图15所示的电路23-26先前已经参照图4进行了描述。
下面参照图16到19来描述当彩色划变数据被包括在该位流的字幕数据中时CLUT电路26的操作。首先看图16(a)到16(c)。图16(a)示出了一个位置A,在该位置处,该彩色查询表被从第一彩色查询表转换到一个不同的彩色查询表。将要被显示的图16(b)中所示每一字幕(n、n+1、n+2......等)字幕模式数据和划变数据(WPA、WPB等)被存储在代码缓冲器22中,其中,每个字幕的数据量示于图16(c)中,且其中图16(b)中的每个PTS代表一个指示将要显示各个字幕的时间的时间“标记”。当达到了由第一字幕n的时间标记PTS所指示的时间时,字幕n的字幕数据从代码缓冲器中读出,译码和显示(即叠加到视频图像上)。当到达由下一个字幕n+1的时间标记PTS所指示的时间时,在收到垂直同步信号时在帧n+1的垂直消隐间隔的期间内,划变数据WPA被从代码缓冲器22中读出并锁存在寄存器205中,如图17所示。寄存器205将锁存的划变数据WPA提供给像素计数器208,以对CLUT电路26内CLUT表中的值进行修改。划变数据例如规定对上层地址和下层地址中的表数据的转换,以提供表的下部中的“上层”数据和提供表的上部内的“下层”数据。
从寄存器205提供给像素计数器208的划变数据被存储在其中,在这期间,每出现一次水平同步信号,其中的计数都被递减。对于“水平划变”时间处的每一行执行类似的处理。当像素计数器等于零时,在其中设置借位标记,并将该借位标记提供给CLUT电路26,该电路26响应提供给它的标记执行划变操作。
与划变数据不同,字幕模式数据在该视频信号的有效周期内被从代码缓冲器22中读出并提供给逆VLC电路23,随后通过电路24、25和400提供给CLUT电路26,如前所述。
参看图13,所示的彩色查询表包括两组彩色,一组用于地址0h到7h,第二组用于地址8h到Fh。因此,通过改变CLUT地址的最高有效位(MSB)可以改变划变彩色。如图17所示从像素计数器208输出的借位标记BR可以作为CLUT地址的MSB而被提供,当每个像素由4位表示时,这使需要被编码的位的数量减少到3,而当每个像素由2位表示时,这使需要被编码的位数减少到1。另外,由于使用了每2个像素4位的格式,所以只有MSB被用于彩色控制,而其余的3位被用作像素信息。
下面参照附图18(a)到18(c)和19来描述多个字幕位置的移动操作。诸如图18(a)所示表示沿着一个图像水平轴的一个字幕位置的位置数据如图18(c)所示在一个适当的帧期间内和字幕数据一起被提供给字幕译码器。类似于图16(b),图18(b)示出了每个字幕的显示时间标记PTS和字幕数据,其中包括划变数据WPA、WPB等。如图19所示,在每个垂直同步信号处位置数据被从代码缓冲器22中读出并锁存在寄存器205中,并且被锁存的位置数据被提供给像素计数器208,计数器208在其中存储该位置,并在每个水平同步信号处递减所存储的位置。当所存储的位置数据等于零时,设置借位标记BR,系统控制器35(图4)响应该借位标记的设定控制代码缓冲器22和游程长度译码器24开始读出和译码该字幕。
下面参考图20到22来描述依据本发明的在图4和11中示出的噪声消除滤波器200和400的操作。如在前面所讨论的,由于模拟设备的频率特性和带宽函数,以来自例如图11所示编码设备的扫描器56的模拟信号的形式提供的位映像数据在由一个字幕译码器进行编码时是“拖尾”的。该拖尾结果是由于位映像数据的上升和下降的“过量”和/或“不足”造成的。图20(A)示出了一个有拖尾的位映像数据,由一个拖尾的位映像数据所表示的字幕的质量是低劣的。
根据本发明,如前所述,噪声消除滤波器被包括在数据编码和译码设备中,其中,如图11所示,噪声消除滤波器200被设置在编码设备中量化电路64之后,而噪声消除滤波器400如图4所示被设置在译码设备中滤波器25之后。量化后的每个像素用4位表示,所以对于每个像素而言具有总数为16的不同值。前4个电平0到3用于作为“边缘附着”关键电平,其余的电平4到15用作填充数据,如结合图9所述。为讨论的目的,假设电平4代表背景视频电平,即在这个电平处不存在字幕,该背景视频电平例如是图9(b)所示时间周期T1、T2、T4和T5内填充数据的值。因此,由于关键电平原来应当为4或更大,所以低于4的关键电平(即关键电平0到3)被认为是“噪声”。
图21的方框图示出了依据本发明的噪声消除滤波器(滤波器200和400)。如所示,噪声消除滤波器由行延迟器210和211以及布尔逻辑门电路212-230组成。像素数据的水平行、由4位组成的每个像素被相继地提供给行延迟器210,并提供给门电路212-215。行延迟器210在其中存储水平行数据,并在该延迟等于一个水平行间隔之后陆续输出所存储的数据作为延迟的水平行,并将该延迟的水平行提供给行延迟器211。从行延迟210输出的延迟的水平行还被提供给门电路216、217以及门电路227-230。与行延迟器210类似,行延迟器211存储提供给它的已经延迟了的水平数据,并在该延迟等于一个水平行间隔之后输出所存储的数据作为双倍延迟的水平行。双倍延迟的水平行被提供给门电路219-222。
为讨论的目的,提供给图21的电路(以及提供给行延迟器210)的像素数据的水平行这里被定义为“以前像素行”,从行延迟器210输出的延迟后的水平行这里被定义为“当前像素行”,由行延迟器211输出的双倍延迟的水平行这里被定义为“后续像素行”。根据本发明,当4位像素值小于4时,与位于“当前像素行”内的单个像素相对应的4位数据被认为是噪声(如前所述),且该4位数据被垂直置于其像素值与背景视频电平4相对应的两个像素之间。当这种噪声像素被垂直定位在两个“背景”像素之间时,根据本发明,该噪声像素的数据在噪声消除滤波器中被改变成4的背景电平。图21的电路实现该结果。
如前所述,以前像素行(即提供给图21的噪声消除滤波器的像素数据的水平行)被提供给门电路212-215,当前像素行(即行延迟器210的输出)提供给门电路216、217以及门电路227-230,而后续像素行(行延迟器211的输出)提供给门电路219-222。每个像素的4个位被并行地提供给各门电路,其中,在以前像素行中一个像素的位1(最低有效位)、位2和位4(最高有效位)被分别提供给“非”电路214、213和212,这些电路使所提供的各位值反相。“非”电路212-214的输出以及该像素的位3被提供给“与”电路215,当所提供的所有值均为高时,与电路215输出高值(即一个“真”值)由此有效地确定在当前像素行中所提供像素的4位值是否是“0100”(二进制),该值相当于值4(十进制)。
类似地,在后续像素行中相应像素的位1、2和4被分别提供给“非”电路221、220和219,这些电路将提供给它们的位值反相并将其各自的输出提供给“与”电路222。“与”电路222还被提供有未被反相的位3,由此来确定在后续像素行中所提供像素的4位值是否是与值4相对应的“0100”。
在当前像素行中对应像素的位3和4(两个最高有效位)被分别提供给“非”电路217和216,使提供给它们的位值反相并将其各自的输出提供给“与”电路218。由于只有当该像素的4位值小于4时位3和位4才是“0”,所以,“与”电路218确定该像素值是否小于4。
“与”门电路215、218和222中每一个的输出都被提供给“与”门电路223,当满足上面所讨论的条件时,“与”门电路223输出为高(或“真”)。就是说,当在当前像素行中的像素是噪声(由门电路216-218确定)时,“与”门电路输出高值,在当前像素行中对应像素的值是4(由门电路212-215确定),且在后续像素行中相应像素的值是4(由门电路219-222确定)。因此,当“与”门电路输出一个高值时,当前像素行中该像素的值被改变成背景电平4,而当“与”门电路输出低电平时,则表示上述的所有条件都没有被满足,在当前像素行中像素的值不改变。门电路224-230实现该结果。
在当前像素行中一个像素的位1、2、3和4(来自行延迟器210的输出)被分别提供给“与”门230、“与”门229、“或”门228和“与”门227。“与”门223的输出被提供给“或”门228并提供给“非”电路224-226。“非”电路224-226的输出被分别提供给“与”门227、229和230。如可以理解的,当“与”门223的输出为低时,“与”门227-230输出提供给它们的各位值,但当“与”门223的输出为高时,“与”门230、229、228和227的输出分别被强制为各电平0、0、1、0,这与4位像素值“0010”或4(十进制)相对应。由此,当与那个噪声像素垂直相邻的像素处于背景电平时,图21的电路进行工作以将噪声像素值变成背景电平4。
图20(B)示出了消除了图20(A)所示噪声像素的位映像字幕数据。图22(A)简要地示出了由被加有噪声的像素位映像数据所表示的字幕字符“A”,图22(B)简要地示出了由字幕数据表示的字幕字符“A”,在所述字幕数据中,利用依据本发明的噪声消除滤波器200或400从中消除了噪声。
根据本发明的另一实施例,当那个噪声像素被水平地定位在两个相邻的具有与背景视频像素电平4相对应的像素值的像素之间时,可操作噪声消除滤波器改变小于4的噪声像素的4位值。如果利用像素延迟器来取代行延迟器210和211,那么可操作图21的电路执行这种噪声消除,其中,输入给噪声消除滤波器的输入将构成“以前像素”,(像素)延迟器210的输出将是“当前像素”,而(像素)延迟器211的输出将是“后续像素”。由此,利用本发明也可以消除在垂直方向上发生的“拖尾”。
在结合最佳实施例对本发明作了具体的表示和叙述以后,对于本专业技术领域以内的普通技术人员来讲易于理解,在不脱离本发明精神和范围的前提下可对本发明作出各种修改。例如,虽然已描述过的噪声消除滤波器是利用与噪声像素垂直或水平相邻的像素,但本发明并不局限于与噪声像素相邻的像素,而是可以利用各种其它像素值来判断噪声像素是否应改变为背景电平像素。例如,可以使用在噪声像素以上的若干垂直相邻像素的值和该噪声像素以下的若干垂直相邻像素的值,关于水平相邻像素,与此类似。
作为另外一个例子,虽然本说明书的描述是针对数字视频信号,本发明并不仅仅局限于这种类型的信号,而可广泛地应用于从视频信号的各种其它类型的字幕数据中消除噪声。
另外,虽然这里的噪声是按照像素值小于4或者小于背景像素电平所描述的,也可以用其它的电平。
因此,希望所附权利要求书被理解为包括本说明书描述的实施例、上述替换方案以及所有与其等效的内容。

Claims (32)

1、一种用于对包括有字幕数据的数字视频数据进行编码的装置,包括:
用于接收字幕数据的装置,所述字幕数据表示具有多个像素的一个字幕;
用于根据所述字幕各个像素和与所述各个像素相邻的多个像素之间的相关性从所述字幕数据中消除噪声的装置;和
用于对所述数字视频数据和其中已经消除了噪声的所述字幕数据一起进行编码的装置。
2、如权利要求1的装置,其中,所述用于消除的装置包括用于确定所述各个像素是否是噪声像素的装置和用于当相邻像素是背景电平像素时把所述噪声像素改变成背景电平像素的装置。
3、如权利要求2的装置,其中,当所述各像素的值小于与背景电平相对应的一个值时,用于确定的所述装置工作以确定所述各像素是噪声像素。
4、如权利要求2的装置,其中,当与所述噪声像素相邻并垂直校直的多个像素是背景电平像素时,所述用于改变的装置工作以把所述噪声像素改变成背景电平像素。
5、如权利要求2的装置,其中,当与所述噪声像素相邻并水平校直的像素是背景电平像素时,所述用于改变的装置工作以把所述的噪声像素改变成背景电平像素。
6、如权利要求1的装置,其中,用于接收的所述装置连续接收字幕数据的水平行,其中的每个水平行表示所述字幕的像素的各自水平行;和所述用于消除的装置包括:第一延迟装置,用于延迟所接收的字幕数据的水平行以产生字幕数据的第一延迟行;第二延迟装置,用于延迟字幕数据的所述第一延迟行以产生字幕数据的第二延迟行;以及一装置,用于当所述每个像素具有小于背景电平值的像素值并且在所接收的水平行和第二延迟行中与所述每个像素相应的多个像素具有等于背景电平值的像素值时,把在第一延迟行中每个像素的像素值改变成背景电平值。
7、如权利要求1的装置,还包括用于量化所接收字幕数据的一个装置,且其中所述用于消除噪声的装置可操作从量化后的字幕数据中消除噪声。
8、一种用于对其中包括有字幕数据的数字视频数据进行译码的装置,包括:
用于接收所述包括字幕数据的数字视频数据的装置,所述字幕数据代表具有多个像素的字幕;
用于从所接收的数字视频数据中提取所述字幕数据的装置,
用于根据所述字幕各像素和与所述各像素相邻的像素之间的相关性从所提取的字幕数据中消除噪声的装置;和
用于把由已经消除噪声的所述字幕数据表示的所述字幕叠加到由所述数字视频数据表示的一个视频图像上的装置。
9、如权利要求8的装置,其中所述用于消除的装置包括用于确定所述各像素是否是噪声像素的装置,以及用于当相邻像素是背景电平像素时把所述噪声像素变成背景电平像素的装置。
10、如权利要求9的装置,其中用于确定的所述装置工作以当所述各像素值低于与背景电平相对应的值时,确定所述各像素是噪声像素。
11、如权利要求9的装置,其中,用于改变的所述装置进行工作以当与所述噪声像素相邻并垂直校直的像素是背景电平像素时,把所述的噪声像素改变成背景电平像素。
12、如权利要求9的装置,其中,用于改变的所述装置当与所述噪声像素相邻并水平校直的像素是背景电平像素时,用于把所述的噪声像素改变成背景电平像素。
13、如权利要求8的装置,其中,用于接收的所述装置连续接收字幕数据的水平行,其中的每一行代表所述字幕像素的各水平行;且所述用于消除的装置包括第一延迟装置和第二延迟装置,所述第一延迟装置用于延迟字幕数据的一个所接收的水平行以产生字幕数据的第一延迟行,所述第二延迟装置用于延迟字幕数据的所述第一延迟行以产生字幕数据的第二延迟行;还包括一个装置,用于当所述每个像素的像素值小于背景电平值并且在所接收的水平行及第二延迟行中与所述每个像素对应的像素的像素值等于背景电平值时,将第一延迟行中每个像素的像素值改变成背景电平值。
14、一种用于对包括字幕数据的数字视频数据进行编码的方法,包括如下步骤:
接收表示具有多个像素的一个字幕的字幕数据;
根据所述字幕各像素和与所述各像素相邻的像素之间的相关性,从所述字幕数据中消除噪声;和
对所述数字视频数据和其中已经消除了噪声的所述字幕数据一起进行编码。
15、如权利要求14的方法,其中,用于消除的所述步骤包括确定所述各像素是否是噪声像素并且当相邻像素是背景电平像素时将所述噪声像素改变成背景电平像素的步骤。
16、如权利要求15的方法,其中,所述用于确定的步骤是当所述各像素的值小于与背景电平相应的值时,通过确定所述各像素是噪声像素而执行的。
17、如权利要求15的方法,其中,所述用于改变的步骤是当与所述噪声像素相邻并垂直校直的像素是背景电平像素时,通过把所述的噪声像素改变成背景电平像素而执行的。
18、如权利要求15的方法,其中,所述用于改变的步骤是当与所述噪声像素相邻并水平校直的像素是背景电平像素时,通过将所述噪声像素改变成背景电平像素而执行的。
19、如权利要求14的方法,其中,所述用于接收的步骤是通过连续地接收字幕数据的水平行而执行的,每一个水平行代表所述字幕的像素的各水平行;且所述用于消除的步骤包括如下步骤:
延迟所接收的字幕数据的水平行以产生字幕数据的第一延迟行,
延迟字幕数据的所述第一延迟行以产生字幕数据的第二延迟行,和
当所述每个像素的像素值小于背景电平值且在所接收的水平行和第二延迟行中与所述每个像素相对应的多个像素的像素值等于背景电平值时,把在第一延迟行中每个像素的像素值改变成背景电平值。
20、如权利要求14的方法,还包括量化所接收的字幕数据的步骤;其中,所述消除的步骤是通过从量化后的字幕数据中消除噪声而执行的。
21、一种用于对其中包括有字幕数据的数字视频数据进行译码的方法,包括如下步骤:
接收包括有表示具有多个像素的一个字幕的字幕数据的所述数字视频数据;
从所接收的数字视频数据中提取所述字幕数据;
根据所述字幕各像素和与所述各像素相邻的像素之间的相关性,从所提取的字幕数据中消除噪声;和
将由其中已经消除了噪声的字幕数据所表示的所述字幕叠加到由所述数字视频数据所表示的一个视频图像上。
22、如权利要求21的方法,其中,所述用于消除的步骤包括确定所述各像素是否是噪声像素、并且当相邻像素是背景电平像素时将所述噪声像素改变成背景电平像素的步骤。
23、如权利要求22的方法,其中,所述用于确定的步骤是当所述各像素的值小于与背景电平相对应的值时,通过确定所述各像素是噪声像素而执行的。
24、如权利要求22的方法,其中所述用于改变的步骤是当与所述噪声像素相邻并垂直校直的像素是背景电平像素时,通过把所述噪声像素改变成背景电平像素而执行的。
25、如权利要求22的方法,其中所述用于改变的步骤是当与所述噪声像素相邻并水平校直的像素是背景电平像素时,通过把所述的噪声像素改变成背景电平像素而执行的。
26、如权利要求21的方法,其中,所述用于接收的步骤是通过连续地接收字幕数据的水平行而执行的;每个水平行代表所述字幕的像素的各自水平行,且所述用于消除的步骤包括如下步骤:
延迟所接收的字幕数据的水平行以产生字幕数据的第一延迟行;
延迟字幕数据的所述第一延迟行以产生字幕数据的第二延迟行;和
当所述每个像素的像素值小于背景电平值且在所接收的水平行和第二延迟行中与所述每个像素对应像素的像素值等于背景电平值时,将在第一延迟中的每个像素的像素值改变成背景电平值。
27、一种用于从代表具有多个像素的一个字幕的字幕数据中消除噪声的装置,包括:
用于断定所述字幕中的各像素是否是噪声像素的装置;
用于确定与所述字幕中各像素相邻的像素是否是背景电平像素的装置;和
一装置,用于当所述用于断定的装置断定所述各像素是噪声像素和所述用于确定的装置确定相邻的像素是背景电平像素时将表示所述各像素的字幕数据改变成表示背景电平像素的背景电平。
28、如权利要求27的装置,其中所述用于断定的装置工作以当表示所述各像素的字幕数据小于所述背景电平时,断定所述的各像素是噪声像素。
29、如权利要求27的装置,其中所述用于确定的装置工作以确定在所述字幕中与所述各像素相邻并垂直校直的多个像素是否是背景电平像素。
30、一种用于从表示具有多个像素的一个字幕的标题数据中消除噪声的方法,包括如下步骤:
断定在所述字幕中的各像素是否是噪声像素;
确定与所述字幕中所述各像素相邻的像素是否是背景电平像素;和
当所述各像素被断定为是噪声像素且相邻像素被确定是背景电平像素时,将表示所述各像素的字幕数据变成表示背景电平像素的背景电平。
31、如权利要求30的方法,其中,所述用于断定的步骤是当表示所述各像素的字幕数据小于所述背景电平时,通过断定所述的各像素是噪声像素而执行的。
32、如权利要求30的方法,其中,所述用于确定的步骤是通过确定与所述字幕中所述各像素相邻并垂直校直的像素是否是背景电平像素而执行的。
CN96112149A 1995-08-04 1996-08-04 消除字幕数据噪声的数字视频数据编码和译码装置及方法 Pending CN1148770A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP7218239A JPH0951489A (ja) 1995-08-04 1995-08-04 データ符号化/復号化方法および装置
JP218239/95 1995-08-04

Publications (1)

Publication Number Publication Date
CN1148770A true CN1148770A (zh) 1997-04-30

Family

ID=16716780

Family Applications (1)

Application Number Title Priority Date Filing Date
CN96112149A Pending CN1148770A (zh) 1995-08-04 1996-08-04 消除字幕数据噪声的数字视频数据编码和译码装置及方法

Country Status (10)

Country Link
US (1) US6115077A (zh)
JP (1) JPH0951489A (zh)
KR (1) KR970012598A (zh)
CN (1) CN1148770A (zh)
AU (1) AU702797B2 (zh)
BR (1) BR9603261A (zh)
CA (1) CA2181866A1 (zh)
MX (1) MX9603109A (zh)
MY (1) MY114724A (zh)
TW (1) TW314681B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106105186A (zh) * 2014-03-07 2016-11-09 美国莱迪思半导体公司 通过多媒体通信连结通信的传送装置、接收装置及非暂态电脑可读媒体
CN112423059A (zh) * 2020-10-09 2021-02-26 深圳Tcl新技术有限公司 基于手势的视频控制方法、电视和计算机可读存储介质

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100513907B1 (ko) * 1997-06-13 2005-09-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 복수의 상호 관련된 오브젝트들의 주기적 전송방법
EP0917147A3 (de) * 1997-11-11 1999-12-22 Deutsche Thomson-Brandt Gmbh Verfahren und Vorrichtung zur Steuerung eines Daten-Zwischenspeichers
US6539054B1 (en) * 1998-09-18 2003-03-25 Matsushita Electric Industrial Co., Ltd. Image output apparatus, image reproduction method, object composition apparatus, object composition method, and data storage medium
US6587635B1 (en) * 1999-03-29 2003-07-01 Sony Corporation Subpicture master control
US6885775B2 (en) * 2000-01-21 2005-04-26 Matsushita Electric Industrial Co., Ltd. Image processing method and image processing apparatus
FR2806227B1 (fr) * 2000-03-09 2003-09-05 Auteuil Participation Et Conse Procede pour le codage d'images
KR100399999B1 (ko) * 2001-02-05 2003-09-29 삼성전자주식회사 멀티스트림이 기록된 기록매체, 그 기록장치, 그기록방법, 그 재생장치, 및 그 재생방법
JP4095271B2 (ja) * 2001-09-19 2008-06-04 アルパイン株式会社 ディスク再生装置
US7852411B2 (en) 2002-11-15 2010-12-14 Thomson Licensing Method and apparatus for composition of subtitles
US8737810B2 (en) 2002-11-15 2014-05-27 Thomson Licensing Method and apparatus for cropping of subtitle elements
EP1652184A4 (en) * 2003-07-24 2007-05-23 Lg Electronics Inc RECORD MEDIA WITH A DATA STRUCTURE FOR MANAGING THE PLAYING OF TEXT SUBTITLE DATA RECORDED THEREFOR AND RECORDING AND PLAYBACK METHOD AND DEVICES
KR20050012328A (ko) * 2003-07-25 2005-02-02 엘지전자 주식회사 고밀도 광디스크의 프레젠테이션 그래픽 데이터 관리 및재생방법과 그에 따른 고밀도 광디스크
US20050071888A1 (en) * 2003-09-30 2005-03-31 International Business Machines Corporation Method and apparatus for analyzing subtitles in a video
KR20050035678A (ko) * 2003-10-14 2005-04-19 엘지전자 주식회사 광디스크 장치의 부가 데이터 재생방법 및 장치와, 이를위한 광디스크
KR20050036277A (ko) * 2003-10-15 2005-04-20 엘지전자 주식회사 고밀도 광디스크의 네비게이션 정보 관리방법
EP1685705A1 (en) * 2003-11-10 2006-08-02 Koninklijke Philips Electronics N.V. Adaptation of close-captioned text based on surrounding video content
KR20050054557A (ko) * 2003-12-05 2005-06-10 삼성전자주식회사 방송 영상 저장 및 재생 장치 및 방법
WO2005076601A1 (en) * 2004-02-10 2005-08-18 Lg Electronic Inc. Text subtitle decoder and method for decoding text subtitle streams
KR100716973B1 (ko) * 2004-02-21 2007-05-10 삼성전자주식회사 Av 데이터에 동기된 텍스트 서브 타이틀 데이터를기록한 정보저장매체, 재생방법 및 장치
WO2005088635A1 (en) 2004-03-18 2005-09-22 Lg Electronics Inc. Recording medium and method and apparatus for reproducing text subtitle stream recorded on the recording medium
US7571386B2 (en) * 2004-05-03 2009-08-04 Lg Electronics Inc. Recording medium having a data structure for managing reproduction of text subtitle data and methods and apparatuses associated therewith
KR20070043016A (ko) * 2004-07-27 2007-04-24 코닌클리케 필립스 일렉트로닉스 엔.브이. 트릭 재생 중 및 트릭 재생 후의 그래픽의 접근성의 향상
TWI248762B (en) * 2004-11-10 2006-02-01 Realtek Semiconductor Corp Video processing device and method thereof
JP4739738B2 (ja) * 2004-12-01 2011-08-03 ジーイー・メディカル・システムズ・グローバル・テクノロジー・カンパニー・エルエルシー 線量評価方法およびx線ct装置
AU2006225460A1 (en) * 2005-03-22 2006-09-28 Samsung Electronics Co., Ltd. Method and apparatus for transmitting packet data
JP4173148B2 (ja) * 2005-03-31 2008-10-29 シャープ株式会社 信号処理装置及び画像出力装置
US8130319B2 (en) * 2008-12-02 2012-03-06 Himax Media Solutions, Inc. Signal processing device and method
CN102799572B (zh) * 2012-07-27 2015-09-09 深圳万兴信息科技股份有限公司 一种文本编码方式和文本编码装置
KR20200098806A (ko) 2019-02-12 2020-08-21 삼성전자주식회사 이상 픽셀을 포함하는 센서로부터의 데이터를 처리하기 위한 프로세서
DE102019122671A1 (de) * 2019-08-22 2021-02-25 RUHR-UNIVERSITäT BOCHUM Passiver mikromechanischer Zähler

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3737855A (en) * 1971-09-30 1973-06-05 Ibm Character video enhancement system
US4573070A (en) * 1977-01-31 1986-02-25 Cooper J Carl Noise reduction system for video signals
JP2589298B2 (ja) * 1987-01-28 1997-03-12 キヤノン株式会社 符号化画像データの復号化装置
US4962542A (en) * 1988-08-29 1990-10-09 Eastman Kodak Company Method for reducing artifacts in error diffused images
DE69028345T2 (de) * 1989-04-18 1997-01-23 Canon Kk Bildverarbeitungsgerät
US5029226A (en) * 1989-10-10 1991-07-02 Unisys Corporation Method and apparatus for effecting spot/void filtering of image data
US5185808A (en) * 1991-06-06 1993-02-09 Eastman Kodak Company Method for merging images
US5245677A (en) * 1991-08-08 1993-09-14 Hughes Aircraft Company Directional running average segmentation
SE9201182L (sv) * 1992-04-13 1993-06-28 Dv Sweden Ab Saett att detektera och avlaegsna fel oeverstigande en specifik kontrast i digitala videosignaler
JP3097785B2 (ja) * 1992-04-30 2000-10-10 株式会社リコー 画像処理装置
JPH0662325A (ja) * 1992-08-11 1994-03-04 Toshiba Corp 固体撮像素子を使用した撮像装置
GB9316153D0 (en) * 1993-08-04 1993-09-22 Avt Communications Ltd Image processing
JP3256619B2 (ja) * 1993-12-24 2002-02-12 株式会社東芝 文字情報表示装置
JP3555696B2 (ja) * 1994-07-12 2004-08-18 ソニー株式会社 テレビジヨン信号受信装置
US5568167A (en) * 1994-09-23 1996-10-22 C-Cube Microsystems, Inc. System for providing antialiased video overlays
US5982459A (en) * 1995-05-31 1999-11-09 8×8, Inc. Integrated multimedia communications processor and codec

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106105186A (zh) * 2014-03-07 2016-11-09 美国莱迪思半导体公司 通过多媒体通信连结通信的传送装置、接收装置及非暂态电脑可读媒体
CN112423059A (zh) * 2020-10-09 2021-02-26 深圳Tcl新技术有限公司 基于手势的视频控制方法、电视和计算机可读存储介质
CN112423059B (zh) * 2020-10-09 2023-08-01 深圳Tcl新技术有限公司 基于手势的视频控制方法、电视和计算机可读存储介质

Also Published As

Publication number Publication date
AU6086696A (en) 1997-02-06
KR970012598A (ko) 1997-03-29
US6115077A (en) 2000-09-05
MX9603109A (es) 1997-06-28
JPH0951489A (ja) 1997-02-18
CA2181866A1 (en) 1997-02-05
TW314681B (zh) 1997-09-01
MY114724A (en) 2002-12-31
AU702797B2 (en) 1999-03-04
BR9603261A (pt) 1998-04-28

Similar Documents

Publication Publication Date Title
CN1148770A (zh) 消除字幕数据噪声的数字视频数据编码和译码装置及方法
CN1144210C (zh) 子标题读出方法和设备
CN1249714C (zh) 多数据流搜索方法和装置
CN1233176C (zh) 处理辅助字幕数据的辅助字幕处理器
CN1237815C (zh) 字幕彩色划变与定位方法及装置
US4799677A (en) Video game having video disk read only memory
CN1151682C (zh) 压缩视频信息发送方法、视频压缩系统及含该系统的组合
CN1139258C (zh) 用于传送和接收数字视频信号的装置
US5742352A (en) Video caption data decoding device
CN1139250C (zh) 电视接收机和附加信息发送方法
CN1073780C (zh) 电视集成录像机装置
CN102047656B (zh) 三维视频转换记录装置、三维视频转换记录方法、三维视频转换装置以及三维视频传输装置
JPH08265661A (ja) 字幕データ符号化/復号化方法および装置、および符号化字幕データ記録媒体
EP0966162A1 (en) Video signal reproducing device and hierarchical video signal decoder
CN101088289A (zh) 运动图像拍摄设备、拍摄运动图像的方法、其中通过该拍摄设备记录视频信号的记录介质、再现该介质中记录的视频信号的运动图像再现设备、以及再现运动图像的方法
CN1138725A (zh) 记录、记录/重放及重放数字视频信号的装置
CN1798348A (zh) 个人视频记录器系统以及在系统中再现广播信号的方法
CN1138413C (zh) 一种数字记录和再现设备
JPH0946630A (ja) 画像情報記録装置及び画像情報再生装置及び光ディスク
EP0558853A2 (en) Recording medium and digital video-information recording/reproducing system
JPH07288775A (ja) ディジタル画像データの伝送装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication