WO2012146124A1

WO2012146124A1 - Turbo译码的方法及装置

Info

Publication number: WO2012146124A1
Application number: PCT/CN2012/073593
Authority: WO
Inventors: 杜金周
Original assignee: 中兴通讯股份有限公司
Priority date: 2011-04-26
Filing date: 2012-04-06
Publication date: 2012-11-01
Also published as: CN102158235A; CN102158235B; RU2571597C2; EP2704330A4; EP2704330A1; RU2013152333A

Description

TURBO译码的方法及装置技术领域本发明涉及通信领域，具体而言，涉及一种 TURBO译码的方法及装置。背景技术 TURBO码自 1993年提出以来，由于其接近 Shannon极限的优异性能，被广泛应用于无线通信系统中，并且已被确定为第三代合作伙伴计划（Third Generation Partnership Project, 简称为 3GPP)移动通信系统的信道编译码方案之一。在长期演进 (Long Term Evolution, 简称为 LTE) 系统中，要求更高的传输速率和更好的误码性能，对信道编译码的要求也相应提高。然而，由于 Turbo码译码算法的迭代特性，它在硬件实现时可能会存在问题，其中，最主要的就是译码速度。因此，降低译码复杂度和译码时延成为硬件实现的重要问题，性能和资源上的折衷考虑是实现 Turbo码的关键。在相关技术中， turbo译码在算法上一般采用 log-MAP或者 MAX-log-MAP算法。由于该算法在硬件实现中的重要特征就是需要不断进行多次迭代，而每次迭代的时候也需要对中间变量 alpha和 beta进行递推迭代。这些特点造成了 turbo译码的系统延时较大，不利于在高速的 3G和 LTE系统中的应用。针对该问题，目前，相关技术中提出的一种解决方案是采用多路并行的译码方法，该方法将接收到的数据按照码约束长度和输入数据的实际长度分为多块，对接收数据同时进行译码，在完成一次译码后均送入其后相应的误差因子控制器，计算其误差因子。在该方法中，在每个并行译码模块处理上，分别对中间变量（alpha和 beta) 进行计算，因此，译码时间较长。相关技术中采用的另一种解决方案是基于滑窗控制的 turbo译码方法，基于滑窗进行控制的目的是为了节省中间变量（alpha和 beta) 的存储空间，并未解决中间变量的递推过程弓 I起的硬件实现上的问题。发明内容本发明提供了一种 turbo译码的方法及装置，以至少解决相关技术中由于分别递归计算中间变量而导致译码延时过大，译码速度不高的问题。根据本发明的一个方面，提供了一种 turbo译码的方法，在对待译码的码块进行多路并行译码过程中，在每一次迭代过程中，每路译码模块在进行译码时，所述方法包括：对当前路的待译码的码块，所述译码模块采用从前往后递推的方式得到当前路的所有第一中间变量，同时采用从后往前递推的方式得到当前路的所有第二中间变量; 所述译码模块根据得到所有所述第一中间变量、所有所述第二中间变量以及所述待译码的模块的所有分支转移度量，得到当前路的所有对数似然比（LLR); 所述译码模块根据所有所述对数似然比，得到当前路输出的先验信息和译码结果。优选地，所述译码模块采用从前往后递推的方式得到当前路的所有第一中间变量，同时采用从后往前递推的方式得到当前路的所有第二中间变量包括：所述译码模块采用从前往后递推的方式得到所述当前路的所有分支转移变量，并根据得到的所有所述分支转移变量从前往后递推得到所述当前路的所有所述第一中间变量；同时，所述译码模块采用从后往前递推的方式得到所述当前路的所有分支转移变量，并根据本次得到的所有所述分支转移变量从后往前递推得到所述当前路的所有所述第二中间变量。优选地，所述译码模块根据得到的所有所述分支转移变量从前往后递推得到所述当前路的所有所述第一中间变量包括：所述译码模块在递推所述当前路的待译码的码块的前半部分的从前往后的第一个所述第一中间变量时，在进行加操作之后，在进行归一化操作的同时，执行递推所述当前路的待译码的码块的后半部分的从前往后的第一个所述第一中间变量的加操作；所述译码模块执行递推所述前半部分的从前往后的第二个所述第一中间变量的加操作，同时执行所述后半部分的从前往后的第一个所述第一中间变量的归一化操作，然后在执行所述前半部分的从前往后的第二个所述第一中间变量的归一化操作的同时执行所述后半部分的从前往后的第二个所述第一中间变量的加操作，以此循环，递推得到所述当前路的所有所述第一中间变量。优选地，所述译码模块根据得到的所有所述分支转移变量从后往前递推得到所述当前路的所有所述第二中间变量包括：所述译码模块在递推所述当前路的待译码的码块的后半部分的从后往前的第一个所述第二中间变量时，在进行加操作之后，在进行归一化操作的同时，执行递推所述当前路的待译码的码块的前半部分的从后往前的第一个所述第二中间变量的加操作；所述译码模块执行递推所述后半部分的从后往前的第二个所述第二中间变量的加操作，同时执行所述前半部分的从后往前的第一个所述第二中间变量的归一化操作，并在执行所述后半部分的从后往前的第二个所述第二中间变量的归一化操作的同时执行所述前半部分的从后往前的第二个所述第二中间变量的加操作，以此循环，递推得到所述当前路的所有所述第二中间变量。优选地，所述方法还包括：所述译码模块将与所述前半部分的前一半的码块对应的各个所述第一中间变量以及与所述后半部分的前一半的码块对应的各个所述第一中间变量存储到存储器中；所述译码模块将与所述后半部分的后一半的码块对应的各个所述第二中间变量以及与所述前半部分的后一半的码块对应的各个所述第二中间变量存储到存储器中。优选地，所述译码模块根据得到所有所述第一中间变量、所有所述第二中间变量以及所述待译码的模块的所有分支转移度量，得到当前路的所有对数似然比包括：所述译码模块在递推与所述前半部分的后一半码块对应的各个所述第一中间变量以及所述后半部分的后一半码块对应的各个所述第一中间变量时，每递推得到一个所述第一中间变量时，读取存储的与该位置对应的所述第二中间变量，并根据该第一中间变量、该第二中间变量以及该位置对应的分支转移度量，依次得到一个与该位置对应的所述对数似然比；所述译码模块在递推与所述后半部分的前一半码块对应的各个所述第二中间变量以及所述前半部分的前一半码块对应的各个所述第二中间变量时，每递推得到一个所述第二中间变量时，读取存储的与该位置对应的所述第一中间变量，并根据该第二中间变量、该第一中间变量以及该位置对应的分支转移度量，依次得到一个与该位置对应的所述对数似然比。优选地，在得到各路的译码结果之后，所述方法还包括：根据各路的所述译码结果与待译码的码块的循环冗余校验（CRC)码进行 CRC校验，如果校验正确，则停止迭代，完成译码过程，否则，利用各路输出的所述先验信息进行下一次的迭代过程。根据本发明的另一方面，提供了一种 turbo译码装置，包括多路译码模块，其中，每路所述译码模块包括：递推模块，设置为对当前路的待译码的码块，采用从前往后递推的方式得到当前路的所有第一中间变量，同时采用从后往前递推的方式得到当前路的所有第二中间变量； LLR计算模块，设置为根据得到所有所述第一中间变量、所有所述第二中间变量以及所述待译码的模块的所有分支转移度量，得到当前路的所有对数似然比（LLR)，并根据所有所述 LLR，输出先验信息；硬判模块，设置为对所述 LLR计算模块得到的所有所述 LLR执行硬判，将硬判结果作为译码结果输出。优选地，所述递推模块包括：第一分支转移变量计算模块，设置为采用从前往后递推的方式得到所述当前路的所有分支转移变量；第一中间变量计算模块，设置为根据所述第一分支转移变量计算模块得到的所有所述分支转移变量从前往后递推得到所述当前路的所有所述第一中间变量；第二分支转移变量计算模块，设置为采用从后往前递推的方式得到所述当前路的所有分支转移变量；第二中间变量计算模块，设置为根据所述第二分支转移变量计算模块得到的所有所述分支转移变量从后往前递推得到所述当前路的所有所述第二中间变量。优选地，所述第一中间变量计算模块包括：第一加操作单元和第一归一化操作单元，其中，所述第一加操作单元设置为在递推各个所述第一中间变量的过程中执行加操作；所述第一归一化操作单元设置为在递推各个所述第一中间变量的过程中执行归一化操作。优选地，所述第二中间变量计算模块包括：第二加操作单元和第二归一化操作单元，其中，所述第二加操作单元设置为在递推各个所述第二中间变量的过程中执行加操作；所述第二归一化操作单元设置为在递推各个所述第二中间变量的过程中执行归一化操作。优选地，所述译码模块还包括：存储模块，设置为存储所述递推模块递推得到的与所述前半部分的前一半的码块对应的各个所述第一中间变量以及与所述后半部分的前一半的码块对应的各个所述第一中间变量，与所述后半部分的后一半的码块对应的各个所述第二中间变量以及与所述前半部分的后一半的码块对应的各个所述第二中间变量。优选地，所述装置还包括：输出控制模块，设置为根据各路所述译码模块输出的译码结果与待译码的码块的 CRC码进行 CRC校验，如果校验正确，则停止迭代，完成译码过程，否则，利用各路所述译码模块输出的所述先验信息进行下一次的迭代过程。通过本发明，采用在并行的各路译码模块中，两个中间变量分别从前往后及从后往前同时递归计算，从而解决了现有的并行译码方法中每次迭代的时间过长的问题，进而达到了大大缩短了译码延迟，提高了译码的速度的技术性效果。附图说明此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：图 1是 turbo译码的基本原理图；图 2是 turbo译码装置的硬件架构示意图；图 3是根据本发明实施例的 turbo译码方法的流程图；图 4是根据本发明实施例的多路并行译码的示意图；图 5是根据本发明实施例的多路并行时第 2路的处理过程示意图；图 6是根据本发明实施例的 turbo译码装置中的译码模块的结构示意图；图 7是根据本发明优选实施例的递推模块的结构示意图；图 8是根据本发明另一优选实施例的译码模块的结构示意图；以及图 9是根据本发明优选实施例的译码模块的硬件结构示意图。具体实施方式下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。图 1是 turbo译码的基本原理图，如图 1所示，先验信息（¾)及校验比特 1 (y_lk) 输入到译码模块 1 (DEC1 )中，对于采用 long-MAP或者 MAX-long-MAP算法的译码方法， DEC1中对输入的待译码的码块进行 MAPI计算，然后将结果输入到交织模块进行交织后，输入到译码模块 2 (DEC2) 与输入的校验比特 2 (y_2k) 一起进行 MAP2 计算，结果经解交织模块输出或作为先验信息输入到译码模块 1。图 2是 turbo译码的硬件架构示意图，如图 2所示，该装置主要包括：输入控制模块、系统比特 /校验比特 /先验信息模块、交织模块、译码模块（DEC)、译码控制模块和输出控制模块。其中，输入控制模块主要负责将 turbo译码器输入的数据按照系统比特、校验比特 1、校验比特 2数据、系统尾比特、交织的系统尾比特、校验 1尾比特和校验 2尾比特进行区分，同时产生相关的片选控制信号，控制系统比特 RAM和校验比特 RAM 的写操作。系统比特 /校验比特 /先验信息模块分别完成系统比特、校验比特、先验信息的读写操作。将来自输入控制模块的待译码数据根据译码并行度写入相应的 RAM;在译码启动后，按照顺序 /交织地址分别从各自的 RAM中读取数据，送给译码模块进行译码。交织模块实时提供交织地址，以便 turbo译码器在计算 MAP2时能够取得交织后的系统比特和先验信息，从而进行当前先验信息的计算，并将先验信息写入先验信息存储 RAM中。译码模块主要根据系统、校验和先验信息模块输出的数据进行译码，并将计算得到的先验信息数据回写到先验信息存储 RAM中，将译码结果送给输出控制模块。译码控制模块控制整个 turbo译码核的工作，负责产生译码启动信号、码块相关参数、数据读写使能、地址、乒乓控制信号、及计算使能等信号。输出控制模块负责码块译码结果的解交织、读写控制及相关参数的输出。以长度为 K的码块为例， turbo译码过程主要包括以下步骤：步骤 1、输入的译码数据（共 3K+12个）经过输入控制模块的处理，被拆分成 K 个系统比特、 K个校验比特 1、 K个校验比特 2、 3个系统尾比特、 3个交织的系统尾比特、 3个校验 1尾比特、 3个校验 2尾比特，并按照 PU个数，将其存入对应的 RAM 中。步骤 2、数据全部写入后，启动信号 start将被拉高，开始多路并行译码。步骤 3、 MAPI处理：按照原始地址分别从相应的 RAM中读取系统比特和校验比特 1，送入并行 MAP处理单元进行 MAPI计算（计算第 1次迭代时 MAPI先验信息取零），并将计算得到的外信息写入先验信息 RAM中。在启动译码的同时，也将启动交织器，进行交织地址的计算并加以存储，为后续 MAP2提前准备交织地址。步骤 4、 MAP2处理：把按照原始地址读取的校验比特 2、交织地址读取的系统比特和先验信息（第一次迭代时 MAP2用到的尾比特先验信息取零，且对应尾比特的相关数据的读写不参与交织），送入并行 MAP处理单元进行 MAP2计算，并将计算得到的先验信息和硬判结果分别写入先验信息 RAM和译码结果 RAM中。至此，就完成了一次 turbo迭代译码。步骤 5、还可以根据一定的条件判断是否满足迭代终止的条件，如果满足，立即停止迭代译码，否则返回至步骤 3直到设定的最大迭代次数。图 3是根据本发明实施例的译码方法的流程图，如图 3所示，在对待译码的码块进行多路并行译码过程中，在每一次迭代过程中，每路译码模块在进行译码时（包括 MAPI计算和 MAP2计算），该方法主要包括以下步骤（步骤 S302—步骤 S306): 步骤 S302，对当前路的待译码的码块，译码模块采用从前往后递推的方式得到当前路的所有第一中间变量（即 alpha), 同时采用从后往前递推的方式得到当前路的所有第二中间变量（即 beta); 其中，第一中间变量可以为 alpha, 而第二中间变量为 beta, 或者反之亦可，即第一中间变量为 beta, 第二中间变量为 alpha。优选地，在本发明实施例中，第一中间变量为 alpha, 而第二中间变量为 beta。在本发明实施例的优选实施方式中，为了减少存储器的空间，可以分别针对第一中间变量和第二中间变量计算递归需要的分支转移变量（即 gamma), 对于第一中间变量，译码模块采用从前往后递推的方式得到当前路的所有分支转移变量，并根据得到的所有分支转移变量从前往后递推得到当前路的所有第一中间变量（alpha); 同时，对于第二中间变量，译码模块采用从后往前递推的方式得到当前路的所有分支转移变量，并根据本次得到的所有分支转移变量从后往前递推得到当前路的所有第二中间变量（beta)。直接采用递推公式计算第一中间变量和第二中间变量，不利用采用硬件流水线的处理，并且，每次第一中间变量和第二中间变量的递归计算包括 gamma与第一中间变量或第二中间变量的加操作和归一化操作两个部分，组合电路逻辑的延时也比较大。因此，在本发明实施例的优选实施方式中，每次第一中间变量或第二中间变量的递归计算分为 2步完成，先做加操作，再做归一化处理，即每次第一中间变量或第二中间变量的递归计算在 2拍（elk) 内完成。在本发明实施例的优选实施方式中，对同一路的待译码的码块的前后半部分的第一中间变量和第二中间变量进行分时计算。例如，译码模块在递推当前路的待译码的码块的前半部分的从前往后的第一个第一中间变量（例如， alpha) 时，在进行加操作之后，在进行归一化操作的同时，执行递推当前路的待译码的码块的后半部分的从前往后的第一个第一中间变量（alpha) 的加操作；译码模块执行递推前半部分的从前往后的第二个第一中间变量（例如， alpha) 的加操作，同时执行后半部分的从前往后的第一个第一中间变量（例如， alpha) 的归一化操作，然后在执行前半部分的从前往后的第二个第一中间变量（alpha) 的归一化操作的同时执行后半部分的从前往后的第二个第一中间变量（alpha) 的加操作，以此循环，递推得到当前路的所有第一中间变量 ( alpha )。类似地，译码模块在递推当前路的待译码的码块的后半部分的从后往前的第一个第二中间变量（例如， beta) 时，在进行加操作之后，在进行归一化操作的同时，执行递推当前路的待译码的码块的前半部分的从后往前的第一个第二中间变量（beta) 的加操作；译码模块执行递推后半部分的从后往前的第二个第二中间变量（beta) 的加操作，同时执行前半部分的从后往前的第一个第二中间变量（beta) 的归一化操作，并在执行后半部分的从后往前的第二个第二中间变量（beta) 的归一化操作的同时执行前半部分的从后往前的第二个第二中间变量（beta) 的加操作，以此循环，递推得到当前路的所有第二中间变量（beta)。采用上述的两种方式递归计算第一中间变量和第二中间变量，当计算到前半部分的中间比特对应的第一中间变量后，在递归计算前半部分的后一半对应的第一中间变量时，这部分对应的第二中间变量已计算得到，因此，这部分计算得到的第一中间变量可以不用存储，在得到第一中间变量后，直接根据存储的与该位置对应的第二中间变量以及该位置对应的分支转移度量计算该位置对应的对数似然比（LLR)，同样，当后半部分的中间比特对应的第二中间变量后，在递归计算后半部分的前一半对应的第二中间变量时，这部分对应的第一中间变量已计算得到，因此，这部分计算得到的第二中间变量可以不用存储，在得到第二中间变量后，直接根据存储的与该位置对应的第一中间变量以及该位置对应的分支转移度量计算该位置对应的对数似然比（LLR)。因此，为了节约存储空间，在本发明实施例的优选实施方式中，在进行上述操作的同时，译码模块将与前半部分的前一半的码块对应的各个第一中间变量（alpha) 以及与后半部分的前一半的码块对应的各个第一中间变量（alpha) 存储到存储器中；译码模块将与后半部分的后一半的码块对应的各个第二中间变量（beta) 以及与前半部分的后一半的码块对应的各个第二中间变量（beta) 存储到存储器中。步骤 S304, 所述译码模块根据得到所有所述第一中间变量、所有所述第二中间变量以及所述待译码的模块的所有分支转移度量，得到当前路的所有对数似然比（LLR); 例如，在本实施例中，译码模块可以在递推与前半部分的后一半码块对应的各个第一中间变量（alpha) 以及后半部分的后一半码块对应的各个第一中间变量（alpha) 时，每递推得到一个第一中间变量（alpha) 时，读取存储的与该位置对应的第二中间变量（beta), 并根据该第一中间变量（alpha) 和第二中间变量（beta) 以及该位置对应的分支转移度量（gamma), 得到一个与该位置对应的对数似然比；而译码模块在递推与后半部分的前一半码块对应的各个第二中间变量（beta) 以及前半部分的前一半码块对应的各个第二中间变量（beta) 时，每递推得到一个第二中间变量（beta) 时，读取存储的与该位置对应的第一中间变量（alpha), 并根据该第二中间变量（beta)和第一中间变量（alpha) 以及该位置对应的分支转移度量（gamma), 得到一个与该位置对应的对数似然比。例如，可以按照以下方式计算对数似然比: for k = 1： N

LIR(k) = max ( [alpha(k, 0+1) + gamn ia_l(k, 0+1) + beta(k+l, 4+1), alpha(k, 1+1) + gamna_l(k, 1+1) + beta(k+l, 0+1), ...

alpha(k, 2+1) + gamna_l(k, 2+1) + beta(k+l, 1+1), ...

alpha(k, 3+1) + gamna_l(k, 3+1) + beta(k+l, 5+1), -..

alpha(k, 4+1) + gamna_l(k, 4+1) + beta(k+l, 6+1), ...

alpha(k, 5+1) + gamna_l(k, 5+1) + beta(k+l, 2+1), -..

alpha(k, 6+1) + gamna_l(k, 6+1) + beta(k+l, 3+1), -..

alpha(k, 7+1) + gamna_l(k, 7+1) + beta(k+l, 7+1), ...]) max ([alpha(k, 0+1) + gamma_l(k, 0+1) + beta(k+l, 00+1), ...

alpha(k, 1+1) + gamna_l(k, 1+1) + beta(k+l, 4+1), ...

alpha(k, 2+1) + gamna_l(k, 2+1) + beta(k+l, 5+1), ...

alpha(k, 3+1) + gamna_l(k, 3+1) + beta(k+l, 1+1), ..·

alpha(k, 4+1) + gamna_l(k, 4+1) + beta(k+l, 2+1), -..

alpha(k, 5+1) + gamna_l(k, 5+1) + beta(k+l, 6+1), ...

alpha(k, 6+1) + gamna_l(k, 6+1) + beta(k+l, 7+1), -..

alpha(k, 7+1) + gamna_l(k, 7+1) + beta(k+l, 3+1), ...]) ； end 步骤 S306, 所述译码模块根据所有所述对数似然比，得到当前路输出的先验信息和译码结果。例如，在得到对数似然比之后，根据当前计算得到的 LLR和当前输入的系统比特、先验信息可以计算得到的当前输出的先验信息。在本实施例中，在得到各路的译码结果之后，根据各路的译码结果与待译码的码块的循环冗余校验（CRC)码进行 CRC校验，如果校验正确，则停止迭代，完成译码过程，否则，利用各路输出的所述先验信息进行下一次的迭代过程。相关技术中，没有采用对第一中间变量（alpha) 和第二中间变量（beta) 进行同时的迭代计算，从而没有解决系统延时过长的问题，而且在处理当迭代正确的情况下，不能够实时终止迭代操作，进一步增加了系统处理时间，而本实施例采用第一中间变量（alpha) 和第二中间变量（beta) 进行同时的迭代计算的方法，是系统延时缩短至原来的二分之一，同时采用 CRC的检验方式对译码结果进行校验，如果得到校验正确的结果，会及时终止后续的反复迭代过程，省去了时间成本。以第一中间变量为 alpha, 第二中间变量为 beta为例，本发明实施例的并行 turbo 译码过程主要包括以下步骤：步骤 1 : 按照码块的长度平均分若干个 PU (处理单元，又称为并行路数，在本文 1个 PU同时也是 1个滑动窗）准备进行多路并行译码。对每个 PU又平分成前后两部分，分别记作 PU-f (PU的前半部分）和 PU-b (PU的后半部分）；步骤 2: 设置 PU-f和 PU-b的 alpha和 beta初值（记为 alpha0、 betaO, 由 alpha0、 betaO迭代得到 alphal、 betal , 再由 alphal、 betal迭代得到 alpha2、 beta2, 依此类推），以及各自的 overlap (重叠窗长）。其中，在 alpha从前往后迭代时，第 1个 PU的 PU-f 没有 overlap;在 beta从后往前迭代时，最后 1个 PU的 PU-b没有 overlap; 步骤 3 : 分别利用步骤 1和步骤 2的分段方法，根据对应的系统比特、校验比特和先验信息计算各个 PU的 PU-f和 PU-b的 gamma。步骤 4: 利用 gamma计算 alpha。分 2步（cycle) 实现，即先计算 alpha+gamma, 再做归一化处理，得到下一个 alpha。在这里，进行 PU-f的第 n个 alpha的归一化处理的同时，进行 PU-b的第 n个数的 alpha+gamma运算，保证为了使译码的吞吐率不受影响，同时，保存 PU-f和 PU-b的前一半的 alpha的值； beta的处理过程与 alpha类似，但是保存的是 PU-f和 PU-b的后一半的 beta值；步骤 5: 当 PU-f或 PU-b计算到一半时，利用 PU-f或 PU-b的后一半计算得到的 alpha和后一半保存的 beta和对应的分支转移度量（gamma) 做计算，得到 LLR (对数似然比），然后再根据当前计算得到的 LLR和当前输入的系统比特、先验信息计算得到输出的先验信息；同时，利用 PU-f或 PU-b的前一半计算得到的 beta和前一半保存的 alpha和对应的分支转移度量（gamma) 做计算，得到 LLR，并进一步得到输出的先验信息；步骤 6: 完成 1次迭代后，利用 LLR得到硬判结果，并对其继续 CRC校验，当校验错误时，继续进行下一次的迭代，直到预先设定的最大迭代次数。当校验正确时，立即停止迭代，准备进行下一个 CB (码块）的译码。采用本发明实施例提供的上述方法，与现有的并行译码方法相比，在每次迭代时总的 cycle数（时钟周期数）不变的情况下，大大缩短了 turbo译码的 alpha, beta迭代时的 ACS关键路径的长度（由原来的 1个 elk完成加比选操作变成了 2个 elk完成，更有利于 FPGA和 ASIC实现，硬件电路的频率和吞吐率也将更高）； alpha和 beta分别从前、后同时对撞计算使得每次迭代时的译码延时减少到原来的 1/2;在信道质量较好时，利用 CRC的迭代终止，使得译码的迭代次数又成倍的减少（比如，最大迭代 8 次，实际只迭代 1次就正确，增加利用 CRC迭代终止后，译码时间仅为原来的 1/8)。同样以码块长度为 K， 4路并行为例，整体的处理过程如图 4所示，各路并行译码。具体到每一路，先进行 overlap部分的计算（虚线箭头），然后进行有效数据的计算（实线箭头），如图 4所示。在 MAPI处理时，分别从每一路的两头同时计算 alpha 和 beta。以比较典型的第 2路为例，第 3路与第 2路相同，第 1路前半部分计算 alpha 时没有 overlap, 第 4路后半部分计算 beta的时候， overlap就是整个码块的尾比特。考虑到每路的重叠部分 overlap , 相当于在时间上分别先后从码块 K 的第

(K/4-overlap) 和第（3K/8-overlap) 处开始，按照地址依次加 1的规律同时读取相应的系统比特、校验比特和先验信息，按照公式 (1)计算 gamma。这样按照如下次序得到 gamma(K/4-overlap) 、 gamma(3K/8-overlap) 、 gamma(K/4-overlap+ 1 ) 、 gamma(3K/8-overlap+l),...,gamma(3K/8-l)、gamma(K/2-l),得到 gamma后，按照公式（2) 由 gamma依次得到 K/4个对应的 alpha, 如图 5所示。由于 alpha 的计算采用递推公式，不利于采用硬件流水线的处理方式。并且每次 alpha的计算包括 gamma+alpha和归一化两部分，组合电路逻辑延时比较大，也不利于 FPGA或 ASIC的硬件实现。因此，在本实施例中，把 alpha的计算分成 2步完成，先做加法，再做归一化处理。因此，在本实施例中，对同 1路的前、后半部分 alpha计算（已经分 2拍完成）采用了分时计算。具体如下，第 1个 elk完成 alpha ( K/4-overlap ) 的加操作，第 2个 elk完成 alpha(K/4-overlap)的归一化操作（得到 alpha( K/4-overlap ) )，同时完成 alpha (3K/8-overlap) 的加操作，第 3个 elk完成 alpha (3K/8-overlap) 的归一化操作（得到 alpha (3K/8-overlap)), 同时完成 alpha (K/4-overlap+l ) 的加操作，依此类推，直到（K/4+overlap) 个 elk后，得到当前路所有的 alpha值（包括 overlap 部分的 alpha, 共有 K/4+overlap个）。 beta的计算过程与 alpha类似而且同时，只是方向相反，在时间上分别先后从码块的第（3K/8-l+overlap)和（K/2-l+overlap) 处开始，按照地址减 1的规律读取相应的系统比特、校验比特和先验信息，按照公式（1 ) 计算 gamma。这样按照如下次序得至 lj gamma(3 K/ 8 - 1 +overlap) 、 gamma(K/2- 1 +overlap) 、 gamma(3 K/ 8 -2+overlap) 、 gamma(K/2-2+overlap), ... ,gamma(K/4) gamma(3K/8) ，再利用得到的 gamma, 按照与 alpha计算相似的处理方法，把每次 beta的计算拆成 2步完成的方法，得到当前路所有的 beta值，如图 5所示。本实施例采用 alpha和 beta的对撞计算，不需要保存当前路所有的 alpha和 beta 值，只保存 K/8个 alpha和 K/8个 beta值（alpha和 beta可以保存在 1个 K/4深度的 RAM里）。其中， alpha需要保存第 K/4处到第 5K/16-1处和第 3K/8处到 7K/16-1处的值; beta需要保存第 3K/8-1处到 5K/16处的值和第 K/2-1处到 7K/16处的值。当 alpha 先后分别递增计算到第 5K/16 处和 7K/16 处时， beta恰好先后分别递减计算到第 5K/16-1处和 7K/16-1处。这时每当同时计算完 1个 alpha和 beta,利用从 alpha和 beta 的存储 RAM读出的对应值再结合该位置对应的分支转移度量（gamma) 进行计算，可以同时得出 2个 LLR，从而使得译码时间缩短约 1/2。计算完 LLR后，对应每个 LLR计算得出先验信息。 MAPI处理后，对先验信息存储 RAM采取顺序写交织读的方法实现其交织; MAP2处理后，对先验信息存储 RAM 采取交织写顺序读的方法实现其解交织。进行完 1次迭代后（包括 MAPI和 MAP2), 利用 LTE的码块分割以及附加 CRC 校验码的特征，对每次迭代后的硬判数据进行 CRC校验，如果校验正确，则停止迭代。否则，利用迭代后产生的新的先验信息，与接收到的系统比特和校验比特一起进行下次的迭代。根据本发明实施例还提供了一种 turbo译码装置，该装置用于实施本发明实施例提供的上述方法。根据本发明实施例的 turbo译码装置对图 2所示的 turbo译码装置进行改进，其中的译码模块采用多路并行的译码模块，图 6是根据本发明实施例的 turbo译码装置中，每个译码模块的结构示意图，如图 6所示，每路译码模块可以包括：递推模块 10、LLR 计算模块 20以及硬判模块 30。其中，递推模块 10，设置为对当前路的待译码的码块，采用从前往后递推的方式得到当前路的所有第一中间变量（例如， alpha ) , 同时采用从后往前递推的方式得到当前路的所有第二中间变量（例如， beta) ; LLR计算模块 20，连接至递推模块 10，设置为根据得到所有第一中间变量（alpha)、所有第二中间变量（beta) 以及所述待译码的模块的所有分支转移度量（gamma) , 得到当前路的所有对数似然比 LLR，并根据所有 LLR，输出先验信息；硬判模块 30，连接至 LLR计算模块 20，设置为对 LLR计算模块得到的所有 LLR执行硬判，将硬判结果作为译码结果输出。在本发明实施例的优选实施方式中，如图 7所示，递推模块 10可以包括：第一分支转移变量计算模块 100，设置为采用从前往后递推的方式得到当前路的所有分支转移变量；第一中间变量计算模块 102，设置为根据第一分支转移变量计算模块 100得到的所有分支转移变量从前往后递推得到当前路的所有第一中间变量（alpha) ; 第二分支转移变量计算模块 104，设置为采用从后往前递推的方式得到当前路的所有分支转移变量；第二中间变量计算模块 106，设置为根据第二分支转移变量计算模块 104 得到的所有分支转移变量从后往前递推得到当前路的所有第二中间变量（beta)。其中，第一中间变量计算模块 102可以包括：第一加操作单元和第一归一化操作单元，所述第一加操作单元设置为在递推各个所述第一中间变量的过程中执行加操作；所述第一归一化操作单元设置为在递推各个所述第一中间变量的过程中执行归一化操作。其中，在第一加操作单元执行递推当前路的待译码的码块的前半部分的从前往后的第一个第一中间变量（例如， alpha) 时的加操作之后，在第一归一化操作单元执行归一化操作的同时，第一操作单元执行递推当前路的待译码的码块的后半部分的从前往后的第一个第一中间变量（alpha) 的加操作；然后，第一操作单元执行递推前半部分的从前往后的第二个第一中间变量（例如， alpha) 的加操作，同时第一归一化操作单元执行后半部分的从前往后的第一个第一中间变量（例如， alpha) 的归一化操作，然后在第一归一化操作单元执行前半部分的从前往后的第二个第一中间变量（alpha) 的归一化操作的同时第一加操作单元执行后半部分的从前往后的第二个第一中间变量 ( alpha) 的加操作，以此循环，递推得到当前路的所有第一中间变量（alpha)。第二中间变量计算模块 106可以包括：第二加操作单元和第二归一化操作单元，所述第二加操作单元设置为在递推各个所述第二中间变量的过程中执行加操作；所述第二归一化操作单元设置为在递推各个所述第二中间变量的过程中执行归一化操作。例如，在第二加操作单元在执行递推当前路的待译码的码块的后半部分的从后往前的第一个第二中间变量（例如， beta) 的加操作，在第二归一化操作执行归一化操作的同时，第二操作单元执行递推当前路的待译码的码块的前半部分的从后往前的第一个第二中间变量（beta) 的加操作；然后，第二加操作单元执行递推后半部分的从后往前的第二个第二中间变量（beta) 的加操作，同时第二归一化操作单元执行前半部分的从后往前的第一个第二中间变量（beta) 的归一化操作，并在第二归一化操作单元执行后半部分的从后往前的第二个第二中间变量（beta) 的归一化操作的同时第二加操作单元执行前半部分的从后往前的第二个第二中间变量（beta) 的加操作，以此循环，递推得到当前路的所有第二中间变量（beta)。在本发明实施例的一种优选实施方式中，如图 8所示，每路译码模块还可以包括一个存储模块 40，设置为存储所述递推模块 10递推得到的与所述前半部分的前一半的码块对应的各个所述第一中间变量以及与所述后半部分的前一半的码块对应的各个所述第一中间变量，与所述后半部分的后一半的码块对应的各个所述第二中间变量以及与所述前半部分的后一半的码块对应的各个所述第二中间变量。在本发明实施例的一个优选实施方式中，该装置还可以对图 2中的输出控制模块进行改进，该输出控制模块设置为根据各路所述译码模块输出的译码结果与待译码的码块的循环冗余校验码进行 CRC校验，如果校验正确，则停止迭代，完成译码过程，否则，利用各路所述译码模块输出的所述先验信息进行下一次的迭代过程。在本发明实施例的一种优选实施方式中，也可以分别设置与第一中间变量和第二变量中间对应的两个 LLR计算模块 20，相应的硬判模块也可以设置两个。图 9根据本发明优选实施例的译码模块 30的结构示意图，如图 9所示，系统信息 (sys)、校验信息（对于 MAPI计算为校验信息 1，对于 MAP2计算为校验信息 2)和先验信息（apri) 输入到针对 alpha的 gamma计算模块 (相当于第一分支转移变量计算模块)和针对 beta 的 gamma计算模块（相当于第二分支转移变量计算模块），第一分支转移变量计算模块从前往后的递归出 LLR输入到 alpha计算模块（相当于第一中间变量计算模块）， alpha计算模块计算出该路的 alpha, —部分存储到数据 RAM中，一部分输入到 LLR 计算模块， LLR计算模块根据输入的 alpha和数据 RAM中存储的 beta计算 LLR，并输出先验信息（ext_apri)，并将计算得到的 LLR输出到硬判模块，硬判模块根据输入的 LLR、系统信息和先验信息（apri)。同样，对于 beta进行相应的处理。从以上的描述中，可以看出，通过本发明实施例提供的技术方案，采用了 alpha 和 beta的同时计算，缩短了约 1/2的译码延时；同时，在每 1路的关键路径 alpha和 beta的计算上，通过在控制上的改进，把译码的关键路径 alpha/beta的迭代计算可以由原来只能采用的一级流水线变成两级流水线但不降低译码器的吞吐率，大大提高了 turbo译码器的硬件可实现性和稳定性，也提高了吞吐率。并且，在硬件资源上， alpha、 beta对撞的计算方法，只是增加了部分寄存器资源，并没有增加 RAM资源，对整个设计电路的规模也没有产生大的影响。显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

权利要求书

1. 一种 TURBO译码的方法，在对待译码的码块进行多路并行译码过程中，在每一次迭代过程中，每路译码模块在进行译码时，所述方法包括：

对当前路的待译码的码块，所述译码模块采用从前往后递推的方式得到当前路的所有第一中间变量，同时采用从后往前递推的方式得到当前路的所有第二中间变量；

所述译码模块根据得到所有所述第一中间变量、所有所述第二中间变量以及所述待译码的模块的所有分支转移度量，得到当前路的所有对数似然比 LLR; 所述译码模块根据所有所述对数似然比，得到当前路输出的先验信息和译码结果。

2. 根据权利要求 1所述的方法，其中，所述译码模块采用从前往后递推的方式得到当前路的所有第一中间变量，同时采用从后往前递推的方式得到当前路的所有第二中间变量包括：

所述译码模块采用从前往后递推的方式得到所述当前路的所有分支转移变量，并根据得到的所有所述分支转移变量从前往后递推得到所述当前路的所有所述第一中间变量；同时，

所述译码模块采用从后往前递推的方式得到所述当前路的所有分支转移变量，并根据本次得到的所有所述分支转移变量从后往前递推得到所述当前路的所有所述第二中间变量。

3. 根据权利要求 2所述的方法，其中，所述译码模块根据得到的所有所述分支转移变量从前往后递推得到所述当前路的所有所述第一中间变量包括：

所述译码模块在递推所述当前路的待译码的码块的前半部分的从前往后的第一个所述第一中间变量时，在进行加操作之后，在进行归一化操作的同时，执行递推所述当前路的待译码的码块的后半部分的从前往后的第一个所述第一中间变量的加操作；

所述译码模块执行递推所述前半部分的从前往后的第二个所述第一中间变量的加操作，同时执行所述后半部分的从前往后的第一个所述第一中间变量的归一化操作，然后在执行所述前半部分的从前往后的第二个所述第一中间变量的归一化操作的同时执行所述后半部分的从前往后的第二个所述第一中间变量的加操作，以此循环，递推得到所述当前路的所有所述第一中间变量。

4. 根据权利要求 3所述的方法，其中，所述译码模块根据得到的所有所述分支转移变量从后往前递推得到所述当前路的所有所述第二中间变量包括：

所述译码模块在递推所述当前路的待译码的码块的后半部分的从后往前的第一个所述第二中间变量时，在进行加操作之后，在进行归一化操作的同时，执行递推所述当前路的待译码的码块的前半部分的从后往前的第一个所述第二中间变量的加操作；

所述译码模块执行递推所述后半部分的从后往前的第二个所述第二中间变量的加操作，同时执行所述前半部分的从后往前的第一个所述第二中间变量的归一化操作，并在执行所述后半部分的从后往前的第二个所述第二中间变量的归一化操作的同时执行所述前半部分的从后往前的第二个所述第二中间变量的加操作，以此循环，递推得到所述当前路的所有所述第二中间变量。

5. 根据权利要求 4所述的方法，其中，所述方法还包括：所述译码模块将与所述前半部分的前一半的码块对应的各个所述第一中间变量以及与所述后半部分的前一半的码块对应的各个所述第一中间变量存储到存储器中；所述译码模块将与所述后半部分的后一半的码块对应的各个所述第二中间变量以及与所述前半部分的后一半的码块对应的各个所述第二中间变量存储到存储器中。

6. 根据权利要求 5所述的方法，其中，所述译码模块根据得到所有所述第一中间变量、所有所述第二中间变量以及所述待译码的模块的所有分支转移度量，得到当前路的所有对数似然比包括：

所述译码模块在递推与所述前半部分的后一半码块对应的各个所述第一中间变量以及所述后半部分的后一半码块对应的各个所述第一中间变量时，每递推得到一个所述第一中间变量时，读取存储的与该位置对应的所述第二中间变量，并根据该第一中间变量、该第二中间变量以及该位置对应的分支转移度量，得到一个与该位置对应的所述对数似然比；

所述译码模块在递推与所述后半部分的前一半码块对应的各个所述第二中间变量以及所述前半部分的前一半码块对应的各个所述第二中间变量时，每递推得到一个所述第二中间变量时，读取存储的与该位置对应的所述第一中间变量，并根据该第二中间变量、第一中间变量以及该位置对应的分支转移度量，得到一个与该位置对应的所述对数似然比。

7. 根据权利要求 1至 6中任一项所述的方法，其中，在得到各路的译码结果之后，所述方法还包括：

根据各路的所述译码结果与待译码的码块的循环冗余校验 CRC 码进行 CRC校验，如果校验正确，则停止迭代，完成译码过程，否则，利用各路输出的所述先验信息进行下一次的迭代过程。

8. —种 TURBO译码的装置，包括：多路译码模块，其中，每路所述译码模块包括：

递推模块，设置为对当前路的待译码的码块，采用从前往后递推的方式得到当前路的所有第一中间变量，同时采用从后往前递推的方式得到当前路的所有第二中间变量；

LLR计算模块，设置为根据得到所有所述第一中间变量、所有所述第二中间变量以及所述待译码的模块的所有分支转移度量，得到当前路的所有对数似然比 LLR，并根据所有所述 LLR，输出先验信息；

硬判模块，设置为对所述 LLR计算模块得到的所有所述 LLR执行硬判，将硬判结果作为译码结果输出。

9. 根据权利要求 8所述的装置，其中，所述递推模块包括：第一分支转移变量计算模块，设置为采用从前往后递推的方式得到所述当前路的所有分支转移变量；

第一中间变量计算模块，设置为根据所述第一分支转移变量计算模块得到的所有所述分支转移变量从前往后递推得到所述当前路的所有所述第一中间变第二分支转移变量计算模块，设置为采用从后往前递推的方式得到所述当前路的所有分支转移变量；

第二中间变量计算模块，设置为根据所述第二分支转移变量计算模块得到的所有所述分支转移变量从后往前递推得到所述当前路的所有所述第二中间变

根据权利要求 9所述的装置，其中，所述第一中间

操作单元和第一归一化操作单元，其中，

所述第一加操作单元设置为在递推各个所述第

操作；所述第一归一化操作单元设置为在递推各个所述第一中间变量的过程中执行归一化操作。

11. 根据权利要求 9所述的装置，其中，所述第二中间变量计算模块包括：第二加操作单元和第二归一化操作单元，其中，

所述第二加操作单元设置为在递推各个所述第二中间变量的过程中执行加操作；

所述第二归一化操作单元设置为在递推各个所述第二中间变量的过程中执行归一化操作。

12. 根据权利要求 8至 10中任一项所述的装置，其中，所述译码模块还包括：存储模块，设置为存储所述递推模块递推得到的与所述前半部分的前一半的码块对应的各个所述第一中间变量以及与所述后半部分的前一半的码块对应的各个所述第一中间变量，与所述后半部分的后一半的码块对应的各个所述第二中间变量以及与所述前半部分的后一半的码块对应的各个所述第二中间变

13. 根据权利要求 8至 10中任一项所述的装置，其中，所述装置还包括：

输出控制模块，设置为根据各路所述译码模块输出的译码结果与待译码的码块的循环冗余校验 CRC码进行 CRC校验，如果校验正确，则停止迭代，完成译码过程，否则，利用各路所述译码模块输出的所述先验信息进行下一次的迭代过程。