CN1886898A - 使用基于子码元的代码来保护数据不被删除 - Google Patents

使用基于子码元的代码来保护数据不被删除 Download PDF

Info

Publication number
CN1886898A
CN1886898A CNA2004800352151A CN200480035215A CN1886898A CN 1886898 A CN1886898 A CN 1886898A CN A2004800352151 A CNA2004800352151 A CN A2004800352151A CN 200480035215 A CN200480035215 A CN 200480035215A CN 1886898 A CN1886898 A CN 1886898A
Authority
CN
China
Prior art keywords
symbols
input
output
sub
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004800352151A
Other languages
English (en)
Other versions
CN100505552C (zh
Inventor
M·A·肖克罗拉西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Digital Fountain Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Fountain Inc filed Critical Digital Fountain Inc
Publication of CN1886898A publication Critical patent/CN1886898A/zh
Application granted granted Critical
Publication of CN100505552C publication Critical patent/CN100505552C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/02Digital function generators
    • G06F1/03Digital function generators working, at least partly, by table look-up
    • G06F1/0307Logarithmic or exponential functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1608Error detection by comparing the output signals of redundant hardware
    • G06F11/1625Error detection by comparing the output signals of redundant hardware in communications, e.g. transmission, interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/17Interprocessor communication using an input/output type connection, e.g. channel, I/O port
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/44Encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/03Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words
    • H03M13/05Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words using block codes, i.e. a predetermined number of check bits joined to a predetermined number of information bits
    • H03M13/13Linear codes
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/03Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words
    • H03M13/05Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words using block codes, i.e. a predetermined number of check bits joined to a predetermined number of information bits
    • H03M13/13Linear codes
    • H03M13/132Algebraic geometric codes, e.g. Goppa codes
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Error Detection And Correction (AREA)

Abstract

编码器(115)读取构成输入文件(101)或输入流(105)的有序的多个输入码元(110),并产生输出子码元。该有序的多个输入码元各自是从输入字母表中选择的,且所生成的输出子码元包含输出子码元字母表中的选择。输出子码元是使用应用于输入码元的子码元的函数求值器来生成的。用于生成输出子码元的函数可以是对输入子码元中的某一些的XOR,且这些函数是从在扩域GF(2)上定义的线性码中获得的。在解码器(155)中,由接收方接收的输出子码元是从由基于输入序列的编码生成输出码元的一个发送方发送的这些输出子码元中获得的。

Description

使用基于子码元的代码来保护数据不被删除
相关申请的交叉引用
本申请要求以下共同待批的美国临时专利申请的优先权:于2003年12月1日提交的名为“Protection of Data From Erasures Using Interleaved Transformationsand Codes From Algebraic Geometry(使用来自代数几何的交叉变换和代码来保护数据不被删除)”的美国临时专利申请60/526,218号(代理案卷号19186-005400US);以及于2003年12月2日提交的名为“Protection of Data From Erasures UsingInterleaved Transformations and Codes From Algebraic Geometry(使用来自代数几何的交叉变换和代码来保护数据不被删除)”的美国临时专利申请60/526,452号,为所有目的,这些申请通过引用包含在此,如同在本文中全文描述。
本申请也引用以下共同所有的专利和申请,包括:授予Luby的名为“Information Additive Code Generator and Decoder for Communication Systems(用于通信系统的信息加成码生成器和解码器)”的美国专利6,307,487号(后文中称为“Luby I”)以及授予Shokrollahi等人的名为“Multi-Stage Code Generator andDecoder for Communication Systems(用于通信系统的多级码生成器和解码器)”的美国专利(于2001年12月21日提交的美国专利申请10/032,156号)(后文中称为“Shokrollahi I”),为所有目的,这些专利及申请中的每一个都通过引用包含在此,如同在本文档中全文描述。
发明背景
通过受损(impaired)网络传输数据成为了众多研究的主题。在众多计算机网络,诸如因特网或任何其它基于分组的网络上,通过首先将数据细分成分组,然后经由网络独立地将分组路由至目的地来发送数据。在这样的网络中,通常预期到分组的丢失。由于传输物理层上的错误、由于路由器或其它网点的溢出引起设备丢弃分组等可能会丢失分组。为确保完整地接收数据,通常使用各种机制来保护数据免于这种丢失。一般而言,丢失的单位是分组,因为分组或者被正确接收,或者就被认为丢失,并采取步骤来处理整个分组的丢失。因此,如果接收到分组的多个比特,但没有正确完整地接收该分组,该整个分组也被认为丢失。丢失可以采用遗失整个分组的形式,或可以采用确定分组中存在错误而产生不可靠的比特的形式,即删除和出错。
近年来,提出了两种类型的代码用于当预期在传输期间将丢失数据时保护数据:链式反应码和多级链式反应码。对具有k个码元的给定内容,这些代码产生实际无限的输出码元流,使得能够从累积次数大约等于k的不同输出码元的任何集合的接收中恢复原始的k个码元。除非另外指出,否则应该理解,如此处所使用的对“一个链式反应码”或“多个链式反应码”的引用可应用于链式反应码,诸如在Luby I和/或其它地方描述的那些,且也可用于多级链式反应码,诸如Shokrollahi I中描述的那些。
使用链式反应码,对给定的k个输入码元的输入集合的可能的输出码元个数被称为是“实际无限的”,因为几乎在所有情况中,相对于实际生成的输出码元,可能的输出码元个数要多得多,或者用于输入码元恢复的输出码元个数远小于可能码元的个数。例如,如果有10,000比特的输入码元码,且一般预期的传输是大小高达10吉比特的文件或流,则编码器应被设计成处理k=1,000,000个码元的输入。这样的解码器可被配置成能够生成多达232(40亿)个没有重复的输出码元。如果这还不够,则解码器可被配置成能够生成更多的没有重复的输出码元。当然,由于所有的物理可实现系统都是有限的,因此解码器最终将到达一种状态,在该状态中它重复,但总是可如此设计该状态,使得对任何预期的传输和出错率,没有重复的输出码元的个数是实际无限的。
此处,分组可携带一个或多个码元。尽管不是必需的,但输入码元中所编码的比特数和输出码元中所编码的比特数可以是相同的。
在某些实施例中,这些代码通过在输入码元上执行XOR来对数据编码,且它们通过在所接收的码元上执行XOR来解码,但也可使用或改为使用其它运算。XOR是有用的运算,因为它快速且可逆。其它运算也可提供这些优点。
这些代码解决了将在其中发送方或接收方未知丢失率的受损网络上数据从一个或多个发送方分发到一个或多个接收方的问题。原因之一在于,当可能的输出码元数相对于输入码元数较大时,接收方可以在即使接收方之间没有协调的情况下也以该压倒性的多余(overwhelming odds)而不重复由另一接收方发送的分组。该特性被称为接收方是“信息加成(information additive)”的。
在某些情况中,不必或不期望从给定内容中产生实际无限数量的输出码元。例如,当接收方时间受限时,可能无法享受等待附加码元在给定时间间隔之后到达的奢侈。例如,当将实况电影发送给一个或多个接收方时,情况就是这样。由于实况传输的本质,不可能总是等待足够的编码数据到达接收方,因为接收方的反馈必须与发送方的发送同步而不能被长时间地中断。在这样的情况中,预期到丢失,发送方可对内容添加固定数量的附加的冗余码元,并将内容与冗余码元一起发送。如果在内容传输期间发生的丢失的数量不大于冗余码元的个数,则预期将在接收方恢复所丢失的数据。
也可使用链式反应码来解决这个问题。在这样的情况中,编码器仅生成固定数量的已编码数据,而不是实际无限的数据流。然而,在某些情况中,可能更适宜使用不同的解决方案。例如,由于链式反应码的解码过程的概率性本质,这些过程可能导致对非常小的内容大小的某些额外的开销。
Reed-Solomon码(“RS码”)是用于处理受到编码器输出与解码器输入之间的删除的数据的传输或存储的一类码。在本公开全文中,应理解,编码不限于传输,而是在时间、空间等分离的编码器处表示经由当已编码数据流经信道时可能展现出删除和/或错误的信道而来自解码器的原始数据。众多研究者曾对众多条件、数据和信道广泛地研究了RS码,且RS码已知具有某些性质。
一种这样的条件被描述为“最优性条件”。RS码不在二元域而在更大的伽罗瓦域上运算。RS码的基本性质之一是它们满足最优性条件,使得当使用RS码对k个码元编码时,产生用于存储或传输的n<k个码元,可从所编码的n个码元的k个不同的接收码元的任何可能的组合中肯定地恢复原始的k个码元。由于原始的k个码元不能从少于k个不同的接收码元中恢复,因此该接收码元数被认为是“最优的”。
该最优性是有代价的,因为编码所需的运算次数较多,且随着代码的变长(即,使用伽罗瓦域),次数变多。使用RS码,提前确定最大块长度n,其中块长度是从原始的k个输入码元中生成的输出码元的个数。注意到,如果丢失了多于n-k个输出码元,则不能恢复原始的k个输入码元。块长度n不能被任意加长来处理任何预期的条件,因为对较大的块长度计算变得更难,且对非常大的块长度是不切实际的。
可以显示,对在以块长度n和维数k的伽罗瓦域GF(2A)上定义的Reed-Solomon码,产生输出码元的码元的XOR的次数平均等于k*(n-k)*A/(2*n)。使用这样的Reed-Solomon码,使用k个输入码元来产生总共n个输出码元,其中一般k个输入码元包含在n个输出码元中,且n大于k。与之对比,当使用链式反应码时,产生输出码元的码元的XOR的平均次数等于独立于k的常数或所产生的输出码元的个数。对解码器也成立类似的结果。
Reed-Solomon码的长度n不能超过2A+1。这后一条件与通常将A选为2的幂的事实一起有时可能相当大地减慢了编码和解码过程。例如,假设原始内容大小为32KB(其中1KB=1024字节),每一分组可对1KB的输入数据进行编码,并总共将要发送48个分组。在该示例中,内容可分为32个1KB的组块(每一组块分配给将要发送的一个分组),然后每一组块可进一步细分成X个输入码元。然后可以并行地应用Reed-Solomon编码过程X次,每次对来自每一组块的一个输入码元进行运算(诸如对每一组块的所有第一输入码元进行运算,然后对每一组块的第二输入码元进行运算等),这意味着每一运算考虑32个输入码元。假设这为X个位置中的每一个产生16个附加的输出码元,且将每一组X个输出码元放在一起来产生要发送的16个附加的分组,每一个长1KB。在该示例中,作为2的幂的最小可接受的A是A=8,因为对A=4则将得到2A+1=17,这小于48。在该操作中,Reed-Solomon码在域GF(256)中运算,因此每一码元为1字节长,且X=1024。如该示例所示,尽管这些码可满足最优性条件,但它们要求相当多的计算且对可能的码长度有限制。
引出对编码论的一些概念的介绍。传输粒度指的是作为单位发送和接收的对象的大小。例如,分组网络以分组发送和接收数据。即使仅删除或破坏了分组的某些比特,但整个分组被丢弃,并激活机制(前向纠错、请求再次发送等)来整体恢复分组。因此,这样的对象以其整体或者被无错地接收或者被删除。在某些应用中,对象大小可以是传输分组的大小或者更小。当预期到传输分组之间的丢失的相关性时,则传输粒度的大于分组大小。在其它应用中,传输粒度可小于分组大小。
计算粒度指的是在编码器和/或解码器中对其运算的对象的大小。因此,如果编码器的基本运算为XOR 128字节单位,则这就是计算粒度。包含细分成128-字节子码元的1024个字节的码元(例如,可以为分组)可以是分成8个子码元的码元(如果所有子码元具有相同大小,这不是必需的,但较为简单)且在这些子码元进行XOR。计算粒度因此为128字节。
Reed-Solomon码的最优性的原因之一在于其传输粒度与其计算粒度之间的关系。一个示例将示出这一点。
考虑域GF(256)上的Reed-Solomon码,它用于对给定文件编码,并经由信道以各自大小为1024字节的分组发送所编码的信息。在该示例中,计算粒度可等于128字节(1024字节除以8),而传输粒度等于1024字节。在该示例中,诸如比特序列的XOR等基本运算在作为整体的128字节单位上进行。
通常,编码和解码的效率随计算粒度而变化。可按照多种方式测量效率,而测量的一种方法是按照编码或解码数据单位的运算的平均次数。通常,编码和解码对较细的计算粒度效率较低,而对较粗的计算粒度效率较高。然而,较细计算粒度的代码可提供较好的接收开销,即确保对表示向编码器提供的码元数上的正确解码所需接收的额外码元数可保持非常小。作为结果,对给定码在编码效率与传输开销之间存在折衷。
Reed-Solomon码处于该编码折衷的一端,因为计算粒度足够小,使得在接收了与编码一样多的数据之后,可保证对面临删除的数据的最优恢复。在另一端,在二元字母表上定义的码(诸如用于在分组网络上传输的那些)具有与传输粒度一样大的计算粒度,但可能在确保完整解码所需的接收开销上效率低下。
如上所述,Reed-Solomon码需要预先确定最大出错率,即如果将k个码元编码成n个RS-码元,则大于(n-k)/n的出错率将使得解码器不能恢复所发送的数据。因此,在由所发送数据的不成功恢复的最终概率测量的传输系统中,Reed-Solomon码尽管其最优性但还是显示出正的失败概率。这是因为,存在由接收方接收的数据量实际上小于所发送的数据的正概率。作为结果,最终,编码系统可能具有较低效率的编码,而仍旧具有需要降低的失败概率。
因此,需要的是这样一种用于编码和解码经由信道发送的数据的编码系统和方法,它可如特定应用、可用的处理能力和数据集所需地折衷计算工作量和开销效率。
发明概述
在根据本发明的通信系统的一个实施例中,编码器使用输出码元的子码元来实现或控制计算工作量和开销效率的折衷,用于例如,以少量的开销效率为代价极大地减少计算工作量。编码器读取构成输入文件或输入流的有序的多个输入码元,并产生输出子码元。该有序的多个输入码元各自是从输入字母表中选择的,且所生成的输出子码元构成输出子码元字母表中的选择。输出子码元是使用应用于输入码元的子码元的函数求值器生成的。在某些实施例中,可调用编码器一次或多次,每一次产生一个输出子码元。然后可将输出子码元组装成输出码元,并将其发送至其目的地。
在根据本发明的各方面的一个编码过程中,用于从输入子码元生成输出子码元的函数是对输入子码元中某一些的XOR。在根据本发明的各个方面的另一编码过程中,这些函数是通过使用GF(2)上的扩域的正则表达式将该码的生成矩阵或奇偶校验矩阵中的每一条目变换成适当的二元矩阵,从在GF(2)的扩域上定义的线性码获得的。
在根据本发明的各方面的解码器中,由接收方接收的输出子码元是从由基于输入序列(文件、流等)的编码生成这些输出码元的一个发送方发送的输出码元中获得的。因为在传输中输出码元可能丢失,即使解码器仅接收到所发送的输出码元的任意一部分,它也正常操作。
本发明提供诸如能够控制计算工作量与传输消息的折衷的优点。例如,放松最优性要求,对可能的传输工作量的小小增加将可极大地减少计算工作量。使用某些代码,可容易地得到附加的输出,使得可仅在接收超过最优性条件下解码所需的码元数的相对少量的附加码元的情况下任意地减少解码失败率。在实现中,通过计算单位(作为单独的编码或解码运算的一部分的数据之间的界限)和丢失单位(数据之间的界限,其中如果单位界限内的任何数据不可用则,该单位界限内的所有数据被认为丢失)可减少计算工作量。在具体实现中,丢失单位为码元或分组,计算单位为子码元。
可通过参考说明书的其余部分和附图来实现对此处所公开的本发明的本质和优点的进一步理解。
附图描述
图1是根据本发明的一个实施例的通信系统的框图。
图2是更详细示出的图1中的编码器1的一部分的框图。
图3示出了生成矩阵;图3A示出了GF(4)域上的基础矩阵,而图3B示出了GF(2)上的二元生成矩阵。
图4是图1中输出码元生成器的图示。
图5是图1中子码元生成器的图示。
发明的详细描述
在此处所述的示例中,描述了称为“基于子码元的编码”的编码方案,首先是对本说明书中使用的各种术语的意义和范围的解释。
编码器是从文件、流或其它输入数据源接收输入数据并对该数据编码使得信道可能对数据产生的影响可由信道的另一端处的解码器纠正,而使解码器能以所需的任何准确度重新生成原始数据的软件过程、硬件装置、组合等。
使用基于子码元的编码,由发送方按所需从输入文件中生成输出码元。每一输出码元包含一个或多个子码元,其中至少一个输出码元包含至少两个子码元。输出码元内的每一子码元是通过使用编码器或解码器软件和/或硬件,对构成输入文件的码元的子码元执行计算运算来生成的。一旦生成之后,输出码元然后可置于分组之中,并发送至其目的地,每一分组包含一个或多个输出码元。
如此处所使用的,术语“文件”指的是存储在一个或多个源处且要作为一个单位传递到一个或多个目的地的任何数据。因此,来自文件服务器或计算机存储设备的文档、图像和文件都是可传递的“文件”的示例。文件可具有已知大小(诸如存储在硬盘上的1兆图像)或可具有未知大小(诸如从流源的输出取出的文件)。在任一方法中,文件都是输入码元的序列,其中每一输入码元具有一个文件中的位置和一个值。
传输是经由信道将数据从一个或多个发送方发送到一个或多个接收方以便传递文件的过程。如果一个发送方经由完美的信道连接至任何数量的接收方,则由于所有的数据都将被正确接收,因此所接收的数据可以是输入文件的精确副本。此处,假定信道不是完美的,这也是大多数现实信道的情况。在众多信道不完善性之中,所感兴趣的两个不完善性是数据删除和数据不完整性(这可作为数据删除的特殊情况处理)。当信道丢失或掉落数据时发生数据删除。当接收方在数据中的某些已经通过之前没有开始接收数据、接收方在传输结束之前停止接收、或接收方间断地停止并再次开始接收数据时,发生数据不完整性。作为数据不完整性的一个示例,移动卫星发送方可能发送表示输入文件的数据并在接收方处于范围之中之前开始发送。一旦接收方位于范围之中,可接收数据直到卫星移动到范围之外,此处接收方可重定向其卫星天线(在此期间它没有接收数据)来开始接收关于由已经移动到范围之内的另一卫星发送的同一输入文件的数据。
如通过阅读本说明书应该显而易见的,由于接收方可如同接收方在全部时间内都在范围之内,但直到接收方开始接收数据的那一点之前信道丢失所有的数据一样来对待数据不完整性(且接收方具有相同的问题),因此数据不完整性是数据删除的特殊情况。同样,如在通信系统设计中公知的,可单单通过掉落含有可检测错误的所有数据块或码元,可检测错误可等价于删除。
一般而言,传输是通过连接发送方和接收方的信道将数据从发送方移动到接收方的动作。信道可以是实时信道,其中当信道获得数据时信道将数据从发送方移动到接收方,或者信道可以是在数据从发送方到接收方的传输中存储某些或所有数据的存储信道。后者的一个示例是磁盘存储或其它存储设备。在该示例中,生成数据的程序或设备可被看作是发送方,它将数据发送给存储设备。接收方是从存储设备中读取数据的程序或设备。发送方用来将数据放到存储设备上的机制、存储设备本身以及接收方用来从存储设备中获得数据的机制共同构成了信道。如果存在这些机制或存储设备可能丢失数据的几率,则将被作为信道中的数据删除来对待。
1.基本实现
在一个典型实现中,使用基于子码元的编码来发送文件涉及,从输入文件中生成、形成或提取输入码元,为每一输入码元生成子码元、将这些子码元编码成一个或多个输出子码元、从输出子码元中创建输出码元以及通过信道将该输出码元发送到一个或多个接收方。
使用基于子码元的编码来接收(或重建)输入文件的副本涉及,从一个或多个数据流接收输出码元的某一集合或子集、为每一所接收到的输出码元生成子码元、从所接收的输出子码元的值中解码输入子码元、从所解码的输入子码元中创建输入码元、以及从输入码元中重新组装输入文件。在某些实施例中,例如当输入文件可从所解码的输入子码元中直接重新组装时,丢弃了最后一步。
现在将参考附图来描述本发明的各方面。
图1是使用基于子码元的编码的通信系统100的框图。在通信系统100中,向子码元生成器110提供输入文件101或输入流105。子码元生成器110从输入文件或流中生成一个或多个输入子码元的序列(IS(0,0),IS(0,1),IS(0,2),…),每一输入码元具有一个值和两个位置(图1中示为括号内的整数)。子码元生成器110将值m用作为其输入之一,这是每一输入或输出码元内的子码元的个数。子码元生成器的输出被分成每组m个的组,使用第二括号内的整数标识每一组的元素,它是0与m-1之间的整数。
如上所述,每一输入子码元的大小是编码系统的计算粒度,而传输粒度可以是大于或等于m倍计算粒度的任何数字。在此处所提供的示例中,为说明简单起见,通常假定子码元的大小都是相等的,但应该理解,大小可以有变化,且对正确的运行而言不必使用恒定的大小。
输入子码元的可能值,即其字母表,一般是2M个码元的字母表,使得每一输入码元对输入文件的M个比特编码。M的值一般由通信系统100的用途来确定,但通用系统可包括对输入子码元生成器110的子码元大小输入,使得M可随用途而有所变化。将输入子码元生成器110的输出提供给编码器115。
编码器115从由输入子码元生成器110提供的输入子码元生成输出子码元,其值为OS(i,j)。每一输出子码元的值是基于对一个或多个输入子码元的某一函数生成的,这些输入子码元在此处称为输出子码元的“相关联输入码元”或简称为“关联”。函数(“值函数”)和关联的选择是根据以下将更详细描述的过程完成的。通常,但不总是,M对输入子码元和输出子码元是相同的,即它们均对同样个数的比特编码。
在某些实施例中,编码器使用输入子码元的个数K来选择关联。如果K事先未知,诸如当输入是流文件时,则K可以仅仅是估计值。值K也可由编码器115用来为输入子码元分配存储。
编码器115向输出码元生成器135提供输出子码元。也向输出码元生成器135提供每一码元内的子码元个数m。输出码元生成器135将图1中示为OS(0),OS(1),…,等的其输出提供给发送模块140。发送模块140通过信道145将输出码元发送给接收模块150。假定信道145为删除信道,但这不是通信系统100的正确操作的要求。模块140、145和150可以是任何合适的硬件组件、软件组件、物理介质或其任何组合,只要发送模块140适于将输出码元以及关于它们的键的任何所需数据发送到信道145,且接收模块150适于从信道145接收码元和可能某些关于它们的键的数据。值K如果用于确定关联,则可经由信道145发送它,或者它可由编码器115和解码器155的协议预先设定。
如上所述,信道145可以是实时信道,诸如穿过因特网的路径或从电视发射机到电视接收器的广播链路或从一点到另一点的电话连接,或者信道145可以是存储信道,诸如CD-ROM、磁盘驱动器、万维网站等。信道145甚至可能是实时信道和存储信道的组合,诸如当一人通过电话线将输入文件从个人计算机发送到因特网服务供应商(ISP)时形成的信道,输入文件存储在Web服务器上,并随后经由因特网发送给接收方。
因为假定信道145是删除信道,因此通信系统100不假定离开接收模块150的输出码元与进入发送模块140的输出码元之间的一一对应。事实上,当信道145包括分组网络时,通信系统100甚至可能不能假定通过信道145的传输中保持的任何两个或多个分组的相对顺序。
接收模块150将所接收到的码元RS(0)、RS(1)提供给子码元生成器160。也向该生成器给出每一所接收的输出码元包含的子码元个数的值m。该信息可在传输之前在发送方与接收方之间共享,它可以是传输的一部分,或者如果它对接收方未知且接收方不必立刻解码,则它可在稍后提供。如前所述,对所有接收的输出码元,值m不必相同。
子码元生成器160生成示为RS(0,0),RS(0,1),…,等的输出,并将其给予解码器155。当每一所接收的码元包含m个子码元时,子码元生成器160的输出被分成各自含有m个的组,其中每一组对应于每一所接收的码元内的子码元。第二括号内的整数对应于子码元在所接收的码元内的位置,而第一个整数对应于输出的子码元是其子码元的所接收的码元。在这种情况中,子码元生成器的输出为RS(0,0),…,RS(0,m-1),RS(1,0),…RS(1,m-1)等。
解码器155使用由子码元生成器160提供的输出子码元来恢复输入子码元(再一次为IS(0,0),IS(0,1),IS(0,2),…)。解码器155将所恢复的输入子码元提供给码元生成器162,后者又产生输入码元IS(0),IS(0),…等。将这些输入码元提供给输入文件重新组装器165,后者生成输入文件101或输入流105的副本170。在某些应用中,可绕过码元生成器162,而将输出直接转发给输入文件重新组装器165。
2.基本编码器
图2是基本编码器的示例性框图。对每一生成的输出码元230,它包含由F(i,j)表示的函数求值器。在图2的示例中,m=4且总共存在12个输入子码元,由201,…,212表示。函数求值器220计算输入子码元的函数来生成输出子码元230。例如,在图2所示的情况中,函数求值器使用函数F(i,j)来从输入IS(0,0),IS(0,3),IS(1,1),IS(1,3)和IS(2,2)中生成其输出OS(i,j)的值。
在某些实施例中,每一生成的输出子码元具有不同的相关联的函数,这是确定性或伪随机生成的。在其它实施例中,函数求值器220可以对所生成的输出码元中的多个是相同的,且可仅在用于函数的输入值集合中有所不同。例如,如果使用简单的交叉方案,则对j的所有值,F(i,j)都可以是相同的,且仅在输入值集合中有所不同。特别地,在该情况中,函数F(i,j)仅使用子码元IS(0,j),IS(1,j),IS(2,j)等作为输入。
如图2中所示,函数求值器220可以是其输入的任何函数。在某些实施例中,尤其在那些期望具有线性码的情况中,应选择是自变量的线性函数的函数,例如自变量的XOR。现在将描述可由函数求值器220使用的一类这样的线性函数,称为“交叉变换”。
3.交叉变换
此处描述的某些过程使用了Bloemer、Kalfane、Karp、Karpinski、Luby和Zuckerman的国际计算机科学协会(ICSI)技术报告TR-95-048“An XOR basederasure resilient coding scheme(基于XOR的删除弹性编码方案)”中隐含叙述的方法。
考虑将以s个码元组织的输入数据变换成以t个码元组织的输出数据的变换过程,其中(输入数据和输出数据的)每一码元包含相等大小的m个子码元,且其中变换使用t行s列的基础矩阵,每一基础矩阵的条目是有限域GF(2m)中的值。
该变换过程由将基础矩阵的每一条目变换成m行m列的二元矩阵开始。该变换使用有限域的正则表达式作为GF(2)的模,这是有限代数和编码理论领域中普通技术人员所公知的概念,因此将不在这里详细描述。对原始的基础矩阵的所有条目应用该变换,产生t*m行s*m列的新的二元矩阵。该变换过程对输入数据的s*m个子码元应用该新的矩阵来得出t*m个输出子码元,新二元矩阵每行一个。新二元矩阵的每一行对应于一个子码元,其中该变换过程通过对行和列中有一个1的每一输入子码元进行XOR来确定给定的输出子码元。以这种方式创建的最终的t*m个子码元被分组成各自具有m个子码元的组来产生t个码元。
注意,该变换过程仅需要执行子码元的XOR。它执行XOR的次数取决于原始矩阵,但该次数平均等于s*t*m/2。
作为上述变换过程的一个示例,考虑图3A中所示的在域GF(4)={0,1,α,α2}上的s=5而t=2的基础矩阵。对GF(4),m=2。使用GF(4)在对于基{1,α}的GF(2)上的正则表达式,图3A的基础矩阵变换成图3B中所示的新二元矩阵,它是s*m=10行t*m=4列的矩阵。
使用该变换后的矩阵,包含5个码元、每一码元包含2个子码元的原始数据如下变换:四个输出子码元中的第一个被计算为输入子码元3,6,7,9,10的XOR,因为这些是图3B的矩阵的第一行中“1”的位置。注意,“1”是对二元值的一种状态的任意指示,因此应将其视为使用输入码元的标志。
第二个输出子码元被计算为输入子码元4,5,6,8,9的XOR。第三输出子码元被计算为输入子码元1,5,8,10的XOR。最后,最后一个(第四个)输出子码元被计算为输入子码元2,6,7,8,9,10的XOR。在该情形中,执行子码元的XOR的总次数为20。
如下给出该特定示例中的函数F(i,j):
F(0,0)=IS(1,0)+IS(2,1)+IS(3,0)+IS(4,0)+IS(4,1)
F(0,1)=IS(1,1)+IS(2,0)+IS(2,1)+IS(3,1)+IS(4,0)
F(1,0)=IS(0,0)+IS(2,0)+IS(3,1)+IS(4,1)
F(1,1)=IS(0,1)+IS(2,1)+IS(3,0)+IS(3,1)+IS(4,0)+IS(4,1)
其中符号“+”表示XOR。
交叉变换可用作使用由GF(2)扩域上的其生成矩阵和奇偶校验矩阵定义的代码的编码器和/或解码器的实施例的一部分。
4.基本输出码元生成器
图4是输出码元生成器135的框图。该图例示了m=4且3个输出码元的情况。在该示例中,输出码元生成器135将四个输出码元的组,示为OS(i,0),OS(i,1),OS(i,2),…,OS(i,m-1)(该附图中标为401,…412)打包成输出码元OS(i)(在附图中标为420、430和440)。对所有输出码元选择相同的值m仅是为了简明起见。该值对不同的输出码元可有所不同,只要输出码元生成器指示对要生成的输出码元值m是什么。
5.基本子码元生成器
图5是基本子码元生成器160的框图。该图例示了m=4,且3个所接收码元RS(0)、RS(1)、RS(2)的情况。子码元生成器160的运算对应于图4中给出的输出码元生成器135的运算的逆运算。
在图5中给出的示例中,子码元生成器135为每一所接收到的码元创建4个子码元(图中子码元标记为501,…,512)。子码元RS(i,0),…,RS(i,3)对应于所接收到的码元RS(i)(该附图中标记为520、530和540)。对所有所接收的码元选择相同的值m仅是为了简明起见。该值对不同的所接收码元可有所不同,只要对每一所接收的码元向子码元生成器提供对该码元的值m为何的指示。这样的指示可通过来自发送器的带外信息或者通过由发送方和接收方共享的预先确定的算法来提供给子码元生成器。
6.使用GF(2)扩域上的交叉变换和代码的基于子码元的编码
如上所述,基于子码元的编码可与此处所述的交叉变换一起使用来设计用于在预期删除的分组网络上传输的代码,使得该代码显示出关于计算和删除粒度与工作量的期望折衷。
在一个实施例中,编码器和解码器被配置成使用在扩域GF(2m)上定义的代码。该代码可由生成矩阵、奇偶校验矩阵或达到类似结果的某种抽象编码过程或规则集来定义。为表达简明起见,此处示例使用生成矩阵来描述编码,但应理解,可对相同、相似、不同的结果使用其它方法。
假设生成矩阵具有n行和k列。假定该代码是系统的,可以理解,该代码也可以改为非系统的。
使用系统码,包含前k列的子矩阵是单位矩阵。包含其余的r=n-k列的子矩阵此处称为C。该矩阵C具有r行和k列。假定要编码的数据是k个码元(或分组)长。则编码过程是将以上的交叉变换过程应用于矩阵C和要编码的数据的过程。
与以往的编码方法相比,这种编码方法的优点之一在于,传输方案的开销性质由有限域GF(2m)上原始码的结构来支配,而计算是在域GF(2)上执行的。对代码参数的明智选择,诸如此处所述的或根据此处所述的选择方法,可能获得提供上述折衷的优异平衡的编码结构。
由于子码元的存在,解码过程更为复杂,且一般以如下所述的步骤进行。值得注意的是,解码计算工作量仍旧可比用来获得相同的错误恢复结果的前述方法少。
在一个示例解码过程中,假定所编码的数据分组各自具有相关联的位置,且该位置可由1到n的整数表示。前k个位置被称为系统位置,在传输之前处于这些位置中的所编码数据与要编码的数据完全相同。其余位置中的数据(或分组)称为冗余分组。如前所述,假定给出一个生成矩阵,其中前k行形成单位矩阵,而其余的r行形成矩阵C。
在解码过程的一个实施例中,步骤如下:
1)记录和存储已删除系统分组的位置q1,q2,…,qe,其中e是这样的已删除分组的个数。如果没有这样的分组存在,声明成功解码并退出。
2)置计数器l=0。
3)当解码不成功(即,还没有恢复所有的原始分组),执行以下的子步骤(a)到(e):
(a)找出e+l个非已删除冗余分组。如果少于e+l个非已删除冗余分组可用,则声明解码出错。否则,由p1,p2,…,pe+l表示e+l个非已删除冗余分组的位置。
(b)形成包含对应于位置p1,p2,…pe+l的行和对应于位置q1,q2,…,qe的列的生成矩阵的子矩阵。将这个矩阵称为D。注意到该矩阵为C的子矩阵。
(c)找出D的可逆的e×e子矩阵,例如通过高斯消去法或显式确定或其它方法。如果这样的子矩阵不存在,则对计数器l增加1并前进至步骤3。
(d)如果这样的可逆子矩阵存在,则记录其行r1,…,re,并在基域上计算其逆,将该逆称为B。
(e)对矩阵B和包含位置r1,…,re处的冗余分组的数据应用交叉变换来获得位置q1,q2,…,qe处的已删除系统分组。声明解码成功并停止。
以下是使用一个特定值集的这种解码过程的详细示例。假设k=16且n=24,并假设在传输了24个分组之后,接收到位置1,2,4,5,6,7,8,9,11,12,13,14,15,16,18,20,22处的分组。丢失了位置3和10处的系统分组,而其它14个正确接收。所以q1=3而q2=10。将计数器l置为0,获得2+0=2个非已删除冗余分组。这可以是位置18和20处的分组,所以p1=18而p2=20。设置具有生成矩阵的行18和20以及列3和10的矩阵,即行2和4以及列3和10的C的子矩阵。假设该矩阵的秩不为2,则步骤3(c)不成功。增加计数器l为1,并返回至步骤3,该过程继续。此时,例如设置p1=18,p2=20且p3=22,可形成包含生成矩阵的这几行和列3和10的C的子矩阵。如果该矩阵满秩,则步骤3(c)将成功,且对应于非已删除系统位置18和22的行1和3将形成可逆子矩阵。在步骤3(d)计算该矩阵的逆,称为B,并将交叉变换过程(步骤3(e))应用于该矩阵和包含位置18和22处冗余分组的数据,这将产生在位置3和10处的已删除分组的值。
在某些实施例中,在步骤2中,可对值l选择某个大于0的数字。这可在例如如果预期对所有的小值l,步骤3(c)将不成功时发生。有可能有众多其它的变化,本领域的普通技术人员可在阅读本公开之后推导出这些变化。
7.代数几何码
结合交叉变换的子码元解码过程产生尤其良好结果的一类代码为代数几何码类,即“AG码”。AG码是Reed-Solomon码的扩展,它允许在同一域上构造远长于Reed-Solomon码的代码。这些代码是使用有限域上的曲线的点以及曲线在规定的极点上的函数构造的。对这些代码的构造对有限代数和编码论领域的普通技术人员而言是公知的,从而不在此处详细描述。这些代码的各种文献之一是Goppa,V.D的“Geometry and Codes(几何与代码)”(Kluwer Academic Publisher 1988)。
AG码共享许多Reed-Solomon码的性质。它们通常可由显式的生成矩阵和奇偶校验矩阵描述,且给定其维数k和块长度n,其最小距离不能小于n-k+1-g,其中g是作为底层曲线的参数的非负整数。该参数被称为曲线的亏格(genus)。亏格0的曲线一般产生Reed-Solomon码,而较高亏格的曲线可产生就块长度而言有实质改进(虽然以较小的最小距离为代价)的代码。
例如,如果底层域为GF(16),则最长的可能的Reed-Solomon码具有块长度17。与之对比,可能显示出具有块长度24的亏格1的AG码。该代码的最小距离比最优值小1。这样的代码可用于以下示例性情况中。该情况仅用于说明性的目的描述,而不旨在限制应用的范围。
假设将经由网络传输16KB长的一段数据,其中分组具有1KB的有效负载。而且,假设针对33%的丢失保护数据。然后,使用亏格1、块长度24且维数16的AG码的生成矩阵,并使用上述交叉变换过程,可能产生24KB的经编码的内容。由于每一子码元是分组有效负载(即,码元)的1/4,该变换涉及大小为256字节的子码元的XOR。得到的代码具有以1的概率从接收的17个分组的任意集合中解码原始的16个分组,并以大约96%的概率形成接收的16个分组的集合(即,16个分组的可能组合的96%使得可从该组合中解码原始的16个分组)的能力。
可使AG码成为系统的。例如,在以上情况中,所编码数据的前16KB可等于原始的16KB,附加的8KB表示冗余数据。为产生该冗余数据,对8行16列的矩阵应用上述交叉变换过程。在这样的情况中,产生冗余数据的子码元XOR的次数平均为8*16*4/2,即256。在该操作之后,所产生的经编码的数据包含96个子码元,使得每个生成的子码元的子码元XOR次数为256/96,稍小于3。
如果以上使用Reed-Solomon码,则其上定义Reed-Solomon码、作为2的幂的最小可能的域扩张需要为GF(256)。在这种情况中,子码元将与前一情况中的一半一样大,且它平均需要8*16*8/2=512次子码元的XOR来产生冗余数据,这又转化成前一情况的编码速度的一半。
以下描述了可用于在分组有效负载大小为1KB的基于分组的网络上传输多达64KB大小的内容的某种AG码。这些示例仅用于说明性的目的,而不应解释为限制本发明的范围。这些示例由所编码内容的长度而不是原始内容的长度作为参数。对后者的转换可通过期望的保护丢失率来进行。例如,当所编码内容的长度为24KB,且预期25%的丢失时,则原始内容的长度可设为等于18KB。
对多达8KB的所编码内容大小而言,可能使用来自带有9个有理点的最大可能个数的GF(4)上的椭圆曲线的AG码。这样的曲线的一个示例为Hermitian曲线。对应于该曲线的代码保证可能从最多超过1个附加分组来恢复内容。对该任务的Reed-Solomon码将必须在域GF(16)中操作,并大约折半此示例中构造的AG码的编码和解码速度。
对多达24KB的所编码内容大小而言,可能使用来自带有25个有理点的最大可能个数的GF(16)上的椭圆曲线的AG码。这样的曲线对本领域的普通技术人员而言是公知的,因此可容易地构造相应的代码。对这些代码,保证上述解码过程中的索引l永远不会超过1。换言之,如果所接收的分组个数比原始分组个数大1,则解码过程即成功。然而,如果所接收到的分组的个数等于原始分组的个数,则存在与解码器相关联的失败的某种概率。在此情况中,该概率可在数学上计算,大约等于1/25,即4%。
对多达32KB的所编码内容大小而言,可能使用来自带有33个点的GF(16)上亏格2的最大超椭圆曲线的AG码。该曲线对本领域的普通技术人员而言也是公知的,相关联代码的构造也是如此。在该情况中,以上过程中的索引l永不超过2。对多达37KB的所编码内容大小而言,可能使用来自带有38个点的GF(16)上亏格3的最大曲线的AG码。在该情况中,以上过程中的索引l永不超过3。对多达44KB的所编码内容大小而言,可能使用来自带有38个点的GF(16)上亏格4的最大曲线的AG码。在该情况中,以上过程中的索引l永不超过4。对多达64KB的所编码内容大小而言,可能使用带有65个有理点的GF(16)上的Hermitian曲线。在该情况中,索引l永不超过值6。
在以上情况的每一个中,从任何k个所接收到的分组中都能以某一良好的概率恢复包含k个分组的原始内容,且该概率随这所接收到的分组的个数超过k而快速增加,如果超过的量等于所使用的曲线的亏格则到达概率1。
8.随机码
与交叉变换结合的基于子码元的编码过程对块码决不特别。一般而言,本发明的教导可受益于有限域GF(2m)上的任何码,或者更一般地,任何有限域GF(q)上的任何码。例如,该过程可与随机码结合来获得有益的效果。
随机码可用作块码,或类似于链式反应码,对其而言,可生成的输出码元的个数预先是不固定的,而约为大于输入码元个数的数量级。具体地,可能的输出码元的个数可以比任何预期的丢失模式大,使得发送器(或一组发送器,可能未协调的)不必为期望成功传输而在一段时间上重复输出码元。尽管没有物理过程可以真正是无限的且可重复的,但可容易地使用如Luby I或他处所述的链式反应码,使得给定输入序列的输出码元的个数是实际无限的。因为输出码元的不相关序列不太可能重叠(由于给定输入序列的输出码元的较大空间),这些码有时被称为“信息加成码”。
对随机块码,生成矩阵是通过随机或伪随机地选择GF(q)中的元素获得的。应理解,如此处所用,“随机”也可包含“伪随机”,但为改进本公开的可读性起见,没有在所有地方都明确地指出。域大小q负责矩阵的秩性质。一般而言,q越大,则给定维数的矩阵具有满秩的可能性越高。上述解码过程中步骤3(c)的成功与否是由矩阵的秩性质确定的。
对GF(q)上的随机链式反应码,每一输出码元是使用如Luby I和Shokrollahi I中所述的键来生成的。对每一键,选择输入码元的子集,并随之对输入码元元素中的每一个选择域GF(q)中的随机或伪随机元素。概念上,形成包含GF(q)中所选值以及对对应于未选择的输入码元的那些位置的0的向量,且将结合交叉变换的基于子码元的编码过程应用于该矩阵。创建矩阵的中间步骤纯粹是概念性的,可在应用中整体省略。
作为示例,再次考虑GF(16)上的代码的情况。k行k列的随机矩阵在有大约等于93%的概率的GF(16)上可逆。(应理解,除非以其它方式指出,否则对此处描述为“随机”的任何事物,也可使用“伪随机”。)这意味着,在应用上述解码过程中,在93%的情况中,计数器l保持为0,因此不需要接收超过原始数据大小的数据。k行k+l列的随机矩阵有大约等于99.5%的概率具有秩k。这意味着,仅在0.5%的情况中,计数器l才会达到2。类似地,l永不超过2的概率大约为99.7%,l永不超过3的概率大约为99.998%,l永不超过4的概率大约为99.99998%,诸如此类,且它超过6的概率大约为4×10-9。表1示出了解码器对所接收的超额分组的个数的各个其它值的出错概率。表1中的数据示出了可能构造具有非常良好的开销的随机码,因为它们是在较小的域上构建的,因此它们具有比Reed-Solomon码更有效编码和解码算法。
表1
  所接收到的超额分组   解码出错概率
  0   6.6×10-2
  1   4.2×10-3
  2   2.7×10-4
  3   1.7×10-5
  4   1.2×10-6
  5   6.4×10-8
  6   4.0×10-9
  7   2.5×10-10
  8   1.6×10-11
  9   9.8×10-13
  10   6.1×10-14
域GF(4)上发生类似的结果。表2示出了GF(4)上作为所接收的超额分组的个数的函数的解码器的出错概率。注意,相比GF(16)上的代码,GF(4)增加了一倍的编码和解码速度。
表2
  所接收到的超额分组   解码出错概率
  0   3.1×10-1
  1   8.2×10-2
  2   2.1×10-2
  3   5.2×10-3
  4   1.3×10-3
  5   3.3×10-4
  6   8.2×10-5
  7   2.1×10-5
  8   5.1×10-6
  9   1.3×10-6
  10   3.2×10-7
以上的数字示出,即使在非常小的开销的情况下,基于信息加成码的GF(4)或GF(16)上的随机码也运行得非常优异。
尽管示出了与交叉变换一起使用的非Reed-Solomon编码的若干示例,但其它非Reed-Solomon基础矩阵也可起作用。
变化
在某些变化中,并行操作编码器来更快速地生成输出码元。为了获得子码元操作的某些便利,并行编码器模块应该是相互依赖而不是完全独立操作的。例如,并行编码器可协调在多个输入码元中对子码元集合的选择用于值函数的应用,使得子码元在多个输入码元中混合且来自输入码元内的不同子码元位置。
结论
基于子码元的编码可使用少于Reed-Solomon码的算术运算来操作。注意到,如果要求了最优性条件,则这样的代码不存在,但是通过放松该要求,则可能有所感兴趣的代码。尽管可示出,对这样的码不得不丧失就必须接收以便能够解码原始内容的输出码元的个数而言的最优性条件,但是某类代码显示出示出它们在大多数情况中类似于Reed-Solomon码执行,且仅在少量情况中需要额外的码元来恢复原始内容的合理的统计特性。
观察到不总是要求绝对的最优性,且这并不总是导向对数据的完全恢复,通常可以相当少的计算工作量来得到足够好的接近最优传输效率。例如,使用具有较小字母表的代码极大地减少了计算工作量,同时仅引起对绝对最优性的稍微放松。
在某些较佳实施例中,向经由可能有损的通信介质通信的两个或多个多用途计算机提供执行上述通信过程的指令集(或软件)。机器的个数可从一个发送方和一个接收方变化到任何数量的发送和/或接收的机器。连接机器的通信介质可以是有线、光学、无线等。上述通信系统具有多种用途,通过阅读本说明书这是显而易见的。
以上描述是说明性而非限制性的。在审阅本公开之后,对本领域的技术人员而言,本发明的各种变化是显而易见的。从而,本发明的范围不是参考以上描述确定的,而是参考所附权利要求书以及其等效实施方式的全部范围来确定的。

Claims (16)

1.一种用于经由通信信道将数据从源发送到目的地的方法,其中所述要发送的数据被排列成输入码元的有序集合,所述方法还包括:
指定所述数据的输入子码元,其中输入子码元是输入码元的一部分或全部,且至少一个输入码元被分成两个或多个子码元,且每一输入子码元可使用其输入码元内唯一的索引来标识;
从所述输入子码元中生成多个输出子码元,其中输出子码元是使用值函数和一组关联从一个或多个输入子码元中生成的,所述一组关联标识应用所述值函数的所述输入子码元,其中至少一个输出子码元是各自含有其输入码元内的不同索引的多个输入子码元的函数;
从所生成的多个码元的输出中生成多个输出码元,其中所述多个输出码元是使得对与所编码的输入码元相等大小的所接收的输出码元的至少一个可能的集合,需要附加接收输出码元来完全地解码所接收的输出码元,以重新生成所编码的输入码元;以及
经由所述通信信道发送所述多个输出码元,使得接收方可从多个输出码元中的一些或所有中重新生成所述输入码元的有序集合。
2.如权利要求1所述的方法,其特征在于,所述给定输入码元的集合的可能的输出码元的个数相对于重新生成所述输入码元的集合所需的输出码元的个数实际上是无限的。
3.如权利要求1所述的方法,其特征在于,所述至少一个输出子码元是从一个以上输入子码元、且从少于所述输入子码元集合中的所有输入子码元、且从少于至少一个输入码元中的所有子码元中生成的。
4.如权利要求1所述的方法,其特征在于,所述每一输入码元被分成公共个数的子码元,且所述公共个数大于1。
5.如权利要求1所述的方法,其特征在于,所述值函数对所有的输出子码元相同。
6.如权利要求1所述的方法,其特征在于,所述值函数对至少两个输出子码元不同。
7.如权利要求1所述的方法,其特征在于,所述一组关联是使用链式反应编码过程来确定的。
8.如权利要求1所述的方法,其特征在于,所述值函数是所述一组关联的线性函数。
9.如权利要求8所述的方法,其特征在于,所述线性函数是使用交叉变换过程导出的。
10.如权利要求1所述的方法,其特征在于,所述值函数随输出子码元变化,它是使用交叉变换过程导出的所述一组关联的线性函数,其中多个值函数是使用应用于在至少高于其素域2次的有限域上定义的代码的生成矩阵的交叉变换得到的。
11.如权利要求10所述的方法,其特征在于,所述代码是在亏格大于0的曲线上定义的代数几何码。
12.如权利要求10所述的方法,其特征在于,所述代码是随机码。
13.如权利要求10所述的方法,其特征在于,所述代码是在作为高于其素域至少2次的扩张的有限域上定义的链式反应码。
14.如权利要求13所述的方法,其特征在于,所述链式反应码是随机码。
15.一种将包含s个输入码元的数据编码成t个码元的方法,其中s是大于1的整数,t是大于1的整数,所述方法包括:
将所述s个输入码元中的每一个分成具有相同大小的m个子码元;
获得具有t行和s列的基础矩阵,所述基础矩阵的条目为有限域GF(2m)的成员,所述基础矩阵具有除Reed-Solomon基础矩阵以外的形式;
通过使用作为GF(2)模的有限域的正则表达式代替所述基础矩阵的每一条目,从所述基础矩阵中生成扩展二元矩阵,从而生成t*m行s*m列的二元矩阵;
在所述s*m个输入子码元上操作所述扩展的二元矩阵来形成个t*m个输出子码元,以及
将所述m个输出子码元组分组成输出码元,从而形成t个输出码元,它们与所述s个输入码元一起,可用于所述s个输入码元的纠错。
16.如权利要求15所述的方法,其特征在于,所述基础矩阵表示基于亏格大于0的曲线的代数几何码。
CNB2004800352151A 2003-12-01 2004-12-01 使用基于子码元的代码来保护数据不被删除 Expired - Fee Related CN100505552C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US52621803P 2003-12-01 2003-12-01
US60/526,218 2003-12-01
US52645203P 2003-12-02 2003-12-02
US60/526,452 2003-12-02

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN200910141602.8A Division CN101582698B (zh) 2003-12-01 2004-12-01 使用基于子码元的代码来保护数据不被删除

Publications (2)

Publication Number Publication Date
CN1886898A true CN1886898A (zh) 2006-12-27
CN100505552C CN100505552C (zh) 2009-06-24

Family

ID=36928958

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB2004800352151A Expired - Fee Related CN100505552C (zh) 2003-12-01 2004-12-01 使用基于子码元的代码来保护数据不被删除
CN200910141602.8A Expired - Fee Related CN101582698B (zh) 2003-12-01 2004-12-01 使用基于子码元的代码来保护数据不被删除

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN200910141602.8A Expired - Fee Related CN101582698B (zh) 2003-12-01 2004-12-01 使用基于子码元的代码来保护数据不被删除

Country Status (6)

Country Link
US (1) US7412641B2 (zh)
EP (1) EP1706946A4 (zh)
JP (1) JP4787167B2 (zh)
KR (1) KR101041762B1 (zh)
CN (2) CN100505552C (zh)
WO (1) WO2005055016A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101779190B (zh) * 2007-08-30 2013-06-05 S·A·奥斯莫洛夫斯基 信息传输和综合保护的方法

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6307487B1 (en) 1998-09-23 2001-10-23 Digital Fountain, Inc. Information additive code generator and decoder for communication systems
US7068729B2 (en) 2001-12-21 2006-06-27 Digital Fountain, Inc. Multi-stage code generator and decoder for communication systems
US20020129159A1 (en) * 2001-03-09 2002-09-12 Michael Luby Multi-output packet server with independent streams
US9240810B2 (en) 2002-06-11 2016-01-19 Digital Fountain, Inc. Systems and processes for decoding chain reaction codes through inactivation
WO2004034589A2 (en) 2002-10-05 2004-04-22 Digital Fountain, Inc. Systematic encoding and decoding of chain reaction codes
CN101834610B (zh) 2003-10-06 2013-01-30 数字方敦股份有限公司 通过通信信道接收从源发射的数据的方法和装置
KR101161193B1 (ko) 2004-05-07 2012-07-02 디지털 파운튼, 인크. 파일 다운로드 및 스트리밍 시스템
FR2880218B1 (fr) * 2004-12-23 2007-02-16 Canon Kk Procede de decodage pour codes de geometrie algebrique et dispositif associe
US7596673B2 (en) * 2005-12-08 2009-09-29 Sony Corporation Failure tolerant data storage
JP5550834B2 (ja) 2006-02-13 2014-07-16 デジタル ファウンテン, インコーポレイテッド 可変fecオーバヘッド及び保護期間を利用したストリーミング及びバッファリング
US9270414B2 (en) 2006-02-21 2016-02-23 Digital Fountain, Inc. Multiple-field based code generator and decoder for communications systems
WO2007134196A2 (en) 2006-05-10 2007-11-22 Digital Fountain, Inc. Code generator and decoder using hybrid codes
US9380096B2 (en) 2006-06-09 2016-06-28 Qualcomm Incorporated Enhanced block-request streaming system for handling low-latency streaming
US9419749B2 (en) 2009-08-19 2016-08-16 Qualcomm Incorporated Methods and apparatus employing FEC codes with permanent inactivation of symbols for encoding and decoding processes
US9386064B2 (en) 2006-06-09 2016-07-05 Qualcomm Incorporated Enhanced block-request streaming using URL templates and construction rules
US9432433B2 (en) 2006-06-09 2016-08-30 Qualcomm Incorporated Enhanced block-request streaming system using signaling or block creation
US9209934B2 (en) 2006-06-09 2015-12-08 Qualcomm Incorporated Enhanced block-request streaming using cooperative parallel HTTP and forward error correction
US9178535B2 (en) 2006-06-09 2015-11-03 Digital Fountain, Inc. Dynamic stream interleaving and sub-stream based delivery
US9237101B2 (en) 2007-09-12 2016-01-12 Digital Fountain, Inc. Generating and communicating source identification information to enable reliable communications
US8127212B2 (en) * 2007-09-26 2012-02-28 Hewlett-Packard Development Company, L.P. System and method for determining the fault-tolerance of an erasure code
US8250427B2 (en) * 2008-06-18 2012-08-21 Hewlett-Packard Development Company Selecting erasure codes for a fault tolerant system
US7925927B2 (en) * 2008-06-23 2011-04-12 Hewlett-Packard Development Company, L.P. Simulator for determining data loss in a fault tolerant system
US9281847B2 (en) 2009-02-27 2016-03-08 Qualcomm Incorporated Mobile reception of digital video broadcasting—terrestrial services
EP2234304B1 (en) * 2009-03-19 2013-01-02 Deutsches Zentrum für Luft- und Raumfahrt e.V. Method for recovery of lost and/ or corrupted data
US9288010B2 (en) 2009-08-19 2016-03-15 Qualcomm Incorporated Universal file delivery methods for providing unequal error protection and bundled file delivery services
US9917874B2 (en) 2009-09-22 2018-03-13 Qualcomm Incorporated Enhanced block-request streaming using block partitioning or request controls for improved client-side handling
US8479082B2 (en) * 2010-04-07 2013-07-02 Indian Institute Of Technology Delhi Packet error correction in networks
US9225961B2 (en) 2010-05-13 2015-12-29 Qualcomm Incorporated Frame packing for asymmetric stereo video
US9596447B2 (en) 2010-07-21 2017-03-14 Qualcomm Incorporated Providing frame packing type information for video coding
US9456015B2 (en) 2010-08-10 2016-09-27 Qualcomm Incorporated Representation groups for network streaming of coded multimedia data
US8958375B2 (en) 2011-02-11 2015-02-17 Qualcomm Incorporated Framing for an improved radio link protocol including FEC
US9270299B2 (en) 2011-02-11 2016-02-23 Qualcomm Incorporated Encoding and decoding using elastic codes with flexible source block mapping
US9253233B2 (en) 2011-08-31 2016-02-02 Qualcomm Incorporated Switch signaling methods providing improved switching between representations for adaptive HTTP streaming
US9843844B2 (en) 2011-10-05 2017-12-12 Qualcomm Incorporated Network streaming of media data
ITVI20120026A1 (it) * 2012-01-27 2013-07-28 St Microelectronics Srl Metodi per la condivisione di files relativi al protocollo bit fountain
US9294226B2 (en) 2012-03-26 2016-03-22 Qualcomm Incorporated Universal object delivery and template-based file delivery
WO2014047882A1 (en) * 2012-09-28 2014-04-03 France Telecom Method for transmitting data content in content centric network
CN104508982B (zh) * 2012-10-31 2017-05-31 慧与发展有限责任合伙企业 组合的块符号纠错
US9311640B2 (en) 2014-02-11 2016-04-12 Digimarc Corporation Methods and arrangements for smartphone payments and transactions
US9425952B2 (en) * 2014-03-27 2016-08-23 Samsung Israel Research Corporation Algebraic manipulation detection codes from algebraic curves
EP3672139A1 (en) * 2018-12-19 2020-06-24 Koninklijke Philips N.V. A circuit compiling device and circuit evaluation device
CN110071727B (zh) * 2019-04-26 2023-05-05 成都海光集成电路设计有限公司 编码方法、译码方法、纠错方法及装置
US12101412B2 (en) 2022-09-12 2024-09-24 Nxp Usa, Inc. Lightweight fault detection mechanism for streaming of cryptographic data objects

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE108587T1 (de) * 1986-09-13 1994-07-15 Philips Nv Verfahren und schaltungsanordung zur bitratenreduktion.
US5164963A (en) * 1990-11-07 1992-11-17 At&T Bell Laboratories Coding for digital transmission
AU665716B2 (en) * 1993-07-05 1996-01-11 Mitsubishi Denki Kabushiki Kaisha A transmitter for encoding error correction codes and a receiver for decoding error correction codes on a transmission frame
JPH11505685A (ja) * 1995-04-27 1999-05-21 トラスティーズ・オブ・ザ・スティーブンス・インスティテュート・オブ・テクノロジー 時間限界マルチメディアネットワークアプリケーションのための高保全性伝送
DE19716011A1 (de) * 1997-04-17 1998-10-22 Abb Research Ltd Verfahren und Vorrichtung zur Informationsübertragung über Stromversorgungsleitungen
US6088330A (en) * 1997-09-09 2000-07-11 Bruck; Joshua Reliable array of distributed computing nodes
US7068729B2 (en) 2001-12-21 2006-06-27 Digital Fountain, Inc. Multi-stage code generator and decoder for communication systems
US6307487B1 (en) 1998-09-23 2001-10-23 Digital Fountain, Inc. Information additive code generator and decoder for communication systems
GB2366159B (en) * 2000-08-10 2003-10-08 Mitel Corp Combination reed-solomon and turbo coding
US6694478B1 (en) * 2000-11-07 2004-02-17 Agere Systems Inc. Low delay channel codes for correcting bursts of lost packets
JP4120461B2 (ja) * 2002-07-12 2008-07-16 住友電気工業株式会社 伝送データ生成方法及び伝送データ生成装置
US7254754B2 (en) * 2003-07-14 2007-08-07 International Business Machines Corporation Raid 3+3
US7240236B2 (en) * 2004-03-23 2007-07-03 Archivas, Inc. Fixed content distributed data storage using permutation ring encoding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101779190B (zh) * 2007-08-30 2013-06-05 S·A·奥斯莫洛夫斯基 信息传输和综合保护的方法

Also Published As

Publication number Publication date
EP1706946A2 (en) 2006-10-04
US7412641B2 (en) 2008-08-12
WO2005055016A2 (en) 2005-06-16
US20050219070A1 (en) 2005-10-06
CN100505552C (zh) 2009-06-24
EP1706946A4 (en) 2006-10-18
WO2005055016A3 (en) 2006-05-04
KR101041762B1 (ko) 2011-06-17
CN101582698A (zh) 2009-11-18
JP4787167B2 (ja) 2011-10-05
KR20060096156A (ko) 2006-09-07
JP2007513549A (ja) 2007-05-24
CN101582698B (zh) 2014-02-12

Similar Documents

Publication Publication Date Title
CN1886898A (zh) 使用基于子码元的代码来保护数据不被删除
EP2357732B1 (en) Systematic encoding and decoding of chain reaction codes
CN1714512A (zh) 速率兼容的低密度奇偶校验(ldpc)码
CN1783729A (zh) 用联合节点处理来解码低密度奇偶校验码的方法和设备
CN101080873A (zh) 用于使用信道代码解码的装置和方法
CN1976479A (zh) 在无线网络中发送数据的方法和设备
CN1773866A (zh) 用于低密度奇偶校验码解码的解码器和方法
CN102804661A (zh) 通信系统中的对象的块聚合
US11303305B2 (en) Sparse graph creation device and sparse graph creation method
Yu et al. Novel LT coding scheme with limited feedback in broadcast systems
CN1561005A (zh) 快速纠双错bch码译码器
CN1144376C (zh) 简化的里德-索罗门译码电路及其译码方法
CN1655462A (zh) 改进的迭代n维解码
JP2009152781A (ja) エラー訂正回路

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180417

Address after: American California

Patentee after: Qualcomm Inc.

Address before: American California

Patentee before: Digital Fountain Inc.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090624

Termination date: 20181201