CN115955297B

CN115955297B - 语义编码方法、语义编码装置、语义译码方法及装置

Info

Publication number: CN115955297B
Application number: CN202310239583.2A
Authority: CN
Inventors: 魏急波; 赵海涛; 张亦弛; 曹阔; 熊俊; 王喆
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2023-03-14
Filing date: 2023-03-14
Publication date: 2023-05-30
Anticipated expiration: 2043-03-14
Also published as: CN115955297A

Abstract

本发明提供一种语义编码方法、语义编码装置、语义译码方法及装置，编码时，依据码字间的信道传输概率和码字对应的单词间的语义距离构建码表的平均语义损失函数；求解使平均语义损失最小的码表，将其作为最终的信源编码码表，对待传输的信息进行信源编码。译码时，根据信源编码码表，对输入码字进行信源译码，得到传输信息中每个目标单词的候选单词集合；根据传输信息单词间的上下文共现概率构建译码目标函数，从候选单词集合中选择共现概率最大的单词组成语义译码输出结果。本发明提供的所提出的语义编译码策略可以提高通信系统的可靠性，提高传输和恢复消息之间的语义准确性。

Description

语义编码方法、语义编码装置、语义译码方法及装置

技术领域

本发明属于智能通信技术领域，特别涉及一种语义编码方法、语义编码装置、语义译码方法及装置。

背景技术

语义通信在经典通信系统的基础上考虑传输信息的语义特征，来提高整个通信系统的可靠性和有效性。

现有的语义通信系统往往采用信源信道联合编译码策略和自动编译码模型，同时需要假设通信系统需要获得完美的信道状态信息，即（perfectchannel stateinformation）。除此之外，采用以词向量作为编码码字的语义通信系统中的编码后的码字往往是实数而非是二进制数，需要额外设计调制和解调才可以应用于实际的通信信道中。

发明内容

针对现有技术存在的技术问题，本发明提出了一种语义编码方法、语义编码装置、语义译码方法及装置，其能够考虑发送与恢复信息间的语义差异和上下文相关性，以提高通信系统的可靠性和有效性。

为实现上述技术目的，本发明提出的技术方案为：

一方面，本发明提供一种语义编码方法，包括：

对所有词语表

随机生成初始码表/>

；

依据码字间的信道传输概率

和码字对应的单词间的语义距离

构建码表的平均语义损失函数/>

；

求解使平均语义损失最小的码表，将其作为最终的信源编码码表；

基于信源编码码表，对待传输的信息进行信源编码。

作为本发明的优选方案，本发明利用模拟退火算法求解使平均语义损失最小的码表

，即：

；

其中

表示使平均语义损失最小的码表，/>

代表所有编码码表的集合，/>

表示当前码表/>

的平均语义损失值，码表/>

即对词语表/>

中所有待编码的元素随机分配一个等长二进制码字/>

，/>

为码字集合，所述元素包括单词、符号、字符，/>

和/>

表示词语表/>

中任意两个元素，/>

表示码字集合/>

中任意两个二进制码字/>

和/>

间的信道传输概率即

，/>

为/>

的二进制码字中第k个符号，其中/>

为/>

在编码码表g中的信源码字/>

，/>

为确定性编码函数；/>

表示/>

和/>

间的语义距离。

另一方面，本发明提供一种语义译码方法，包括：

获取经信道译码后的输入码字；

根据信源编码码表，对输入码字进行信源译码，得到传输信息中每个目标单词的候选单词集合；

根据传输信息单词间的上下文共现概率即信息序列联合共现概率构建译码目标函数，从候选单词集合中选择共现概率最大的单词组成语义译码输出结果。

作为本发明的优选方案，本发明所述译码目标函数为：

；

其中h代表语义信源译码策略，

为码字/>

被发送端发送经过信道后接收机收到的二进制码字，/>

为已知接收机接收到的第i位目标单词的二进制码字/>

和第i位目标单词的上下文/>

通过译码策略h将第i位目标单词译码成单词/>

，

，/>

代表信息序列联合共现概率，条件概率/>

为已知目标单词/>

的上文单词/>

的前提下后面接目标单词/>

的概率或者已知上文/>

后当前位置是/>

的出现概率，/>

表示为目标单词/>

的上文。

作为本发明的优选方案，本发明所述条件概率

以通过排列语言模型建模求解。

作为本发明的优选方案，本发明利用动态规划算法求解译码目标函数。

另一方面，本发明提供一种语义编码装置，包括：

初始码表生成单元，用于对所有词语表

随机生成初始码表/>

；

平均语义损失构建单元，用于依据码字间的信道传输概率

和码字对应的单词间的语义距离/>

构建码表的平均语义损失函数/>

；

信源编码码表生成单元，用于求解使平均语义损失最小的码表，将其作为最终的信源编码码表；

编码单元，用于基于信源编码码表，对待传输的信息进行信源编码。

另一方面，本发明提供一种语义编码装置，包括处理器、存储器、收发器和总线，所述处理器、存储器、收发器通过总线连接，其中，所述存储器用于存储一组程序代码，所述收发器用于收发信息，所述处理器用于调用所述存储器中存储的程序代码，执行以下操作：

对所有词语表

随机生成初始码表/>

；

依据码字间的信道传输概率

和码字对应的单词间的语义距离

构建码表的平均语义损失函数/>

；

基于信源编码码表，对待传输的信息进行信源编码。

另一方面，本发明提供一种语义译码装置，包括：

接收单元,用于获取经信道译码后的输入码字；

信源译码单元，用于根据信源编码码表，对输入码字进行信源译码，得到传输信息中每个目标单词的候选单词集合；

共现概率计算及输出单元，用于根据传输信息单词间的上下文共现概率构建译码目标函数，从候选单词集合中选择共现概率最大的单词组成语义译码输出结果。

另一方面，本发明提供一种语义译码装置，包括处理器、存储器、收发器和总线，所述处理器、存储器、收发器通过总线连接，其中，所述存储器用于存储一组程序代码，所述收发器用于收发信息，所述处理器用于调用所述存储器中存储的程序代码，执行以下操作：

获取经信道译码后的输入码字；

根据传输信息单词间的上下文共现概率构建译码目标函数，从候选单词集合中选择共现概率最大的单词组成语义译码输出结果。

与现有技术相比，本发明的优点在于：

本发明提供的语义编码方法中使用词语间的语义距离和码字间的码字距离来定义码表的平均语义损失，并且生成使平均语义损失最小的码表。

本发明提供的语义译码方法中，进一步考虑并利用码字表和词语间上下文语义关联来恢复消息。

本发明提供的所提出的语义编译码策略可以提高通信系统的可靠性，提高传输和恢复消息之间的语义准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。

图1为本发明一实施例提供的一种语义编码方法的流程图；

图2为本发明一实施例提供的一种语义译码方法的流程图；

图3为本发明一个实施例中利用模拟退火算法求解使平均语义损失最小的码表的流程示意图；

图4为本发明一个实施例中语义编码方法的模拟退火算法迭代收敛图；

图5为一个实施例中利用本发明提供的语义编码及译码方法与最新语义通信系统基于BPSK调制在高斯白噪声信道上的BLEU(4-gram)得分仿真结果对比示意图；

图6为一个实施例中利用本发明提供的语义编码及译码方法与最新语义通信系统基于QPSK调制在高斯白噪声信道上的BLEU(4-gram)得分仿真结果对比示意图；

图7为一个实施例中利用本发明提供的语义编码及译码方法与最新语义通信系统在瑞利衰落信道上的BLEU（4-gram）得分仿真结果对比示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚明白，下面将以附图及详细叙述来清楚说明本发明所揭示内容的精神，任何所属技术领域技术人员在了解本发明内容的实施例后，当可由本发明内容所教示的技术，加以改变及修饰，其并不脱离本发明内容的精神与范围。本发明的示意性实施例及其说明用于解释本发明，但并不作为对本发明的限定。

参照图1，本发明一实施例提供一种语义编码方法，包括：

对所有词语表

随机生成初始码表/>

；

依据码字间的信道传输概率

和码字对应的单词间的语义距离

构建码表的平均语义损失函数/>

；

基于信源编码码表，对待传输的信息进行信源编码。

可以理解，本领域技术人员可以采用现有的各种码表生成方法，生成初始码表。本发明一实施例中，针对所有词语表

先随机产生一个码表作为初始码表。可以理解，生成码表/>

即对词语表/>

中所有待编码的元素（包括单词、符号、字符等）随机分配一个等长码字/>

，/>

为码字集合。等长码字的码字长度/>

与词语表的大小/>

有关，它们的关系为/>

。

本发明一实施例中，依据码字间的信道传输概率

和码字对应的单词间的语义距离/>

构建码表/>

的平均语义损失函数/>

，定义如下：

其中/>

和/>

表示词语表/>

中任意两个元素，

表示码字集合/>

中任意两个二进制码字/>

和/>

间的信道传输概率即/>

，/>

为/>

的二进制码字中第k个符号，其中/>

为/>

在编码码表g中的信源码字/>

，/>

为确定性编码函数；码字间的信道传输概率/>

，即：

；

其中，

可以由错误检测概率/>

和正确检测概率/>

建模为：

；

另一方面，在语义通信系统中，

错误检测成/>

的代价还需要考虑/>

和/>

间的语义差异特征。/>

和/>

间的语义距离/>

是一种语义差异特征，用于衡量/>

和/>

间语义差异特征。语义距离/>

定义为：

；

其中，

为/>

和/>

间的语义相似度。语义相似度的范围为0到1之间。语义相似度/>

可以建模为/>

和/>

的词向量间的余弦相似度，可以表示为：

；

其中，

的词向量/>

是高维特征向量（K维的特征向量，其中每个元素为实数），可以用来表征/>

。同样的，/>

的词向量/>

。/>

代表Euclidean欧式距离。

本发明一实施例中，利用模拟退火算法求解使平均语义损失最小的码表

，即：/>

；

其中

表示使平均语义损失最小的码表，/>

代表所有编码码表的集合，/>

表示当前码表/>

的平均语义损失值，/>

表示/>

和/>

间的语义距离。

参照图3，流程如下：首先设定初始温度

和终止温度/>

，设置内、外循环的次数/>

和/>

，以及最大迭代次数/>

。然后，在每个内循环内随机在解决方案空间中产生R个新解，实现对当前解/>

的扰动和更改；在这些扰动的新解中找到语义损失值最小的对应的解作为/>

，并且记录其语义损失值为/>

。记录新解的语义损失值和当前解的语义损失值之间的差值/>

。接着，当/>

，即新解比当前解的语义损失值更小，那么就保留新的可行解；否则，新可行解没有当前解的好，那么就根据Metropolis准则，以/>

概率判断是否接受新可行解/>

，这样做的目的是可以跳出局部最优解。根据Metropolis准则，接受新可行解的概率为

；

当接受差的新可行解的次数l超过最大的次数限制

，那就跳出循环。将扰动后的当前解/>

的语义损失值/>

与保存的最优解/>

的语义损失值/>

进行比较。如果当前解的语义损失值/>

比保存的最优解的语义损失值/>

更小，那么将当前解保存为新的最优解/>

。根据温度衰减因子，降低温度，当温度由初始温度/>

降到终止温度/>

，就将当前最优解/>

输出。

可以理解，使平均语义损失最小的码表

即最终的信源编码码表。按照信源编码码对待传输的信息进行语义信源编码，然后按照经典通信系统对信源编码后的码字进行处理，包括但不仅限于信道译码、调制等。

参照图2，本发明一实施例提供一种语义译码方法，包括：

获取经信道译码后的输入码字；

根据传输信息单词间的上下文共现概率（即信息序列联合共现概率）构建译码目标函数，从候选单词集合中选择共现概率最大的单词组成语义译码输出结果。

可以理解，在译码阶段，接收机接收到信号，接收机对经过信道的信号进行处理至信道译码后得到输入码字y。因为经过噪声信道，所以输入码字y可能会存在错误。

接收机在信源编码码表

中寻找目标单词/>

的所有候选词集合/>

，其中候选词集合中每个元素都满足该元素的码字/>

和目标词的码字/>

之间的汉明距离小于阈值/>

（即/>

,/>

）。汉明距离表示两个（相同长度）字符串对应位置的不同字符的数量，通常以d(x,y)表示两个字x,y之间的汉明距离。

本发明根据传输信息单词间的上下文共现概率c，从候选单词集合中选择共现概率最大的单词组成语义译码输出结果

，其中h代表语义信源译码策略。

可以理解，确定候选单词集合后，接收机可以利用目标单词周围的历史消息作为目标词的先验上下文c来恢复信息序列

。考虑因果语言模型来制定信息序列联合共现概率/>

，为：

；

其中，

表示为目标单词/>

的上文。

对信息序列联合共现概率

建模后，语义信源译码策略的译码目标函数为：

；

其中h代表语义信源译码策略，

为码字/>

被发送端发送经过信道后接收机收到的二进制码字，/>

为已知接收机接收到的第i位目标单词的二进制码字

和第i位目标单词的上下文/>

通过译码策略h将第i位目标单词译码成单词/>

，

，/>

代表序列联合共现概率，条件概率/>

为已知目标单词

的上文单词/>

的前提下后面接目标单词/>

的概率或者已知上文/>

后当前位置是/>

的出现概率，/>

表示为目标单词/>

的上文。

其中条件概率

可以通过排列语言模型（permutationlanguagemodel）建模求解。其中，排列语言模型打乱了原序列并在原序列的基础上产生多种新排列组合。每个新排列都用马尔可夫模型考虑上文信息，再对每种情况取平均就可以得到双向上下文信息。其条件概率可以表示为/>

；

其中，

为XLNET网络中训练出来的单词/>

的输出向量（神经网络中嵌入层的输出向量），/>

为网络输入（目标单词上文）的隐藏层的输出表示，/>

为码字表里所有词的总数目。

利用动态规划算法求解

，即恢复后的信息满足序列联合共现概率

最大的要求。

在本发明一实施例中，提供一种语义信源编译码处理方法，包括编码过程和译码过程，其中所述编码过程包括：

随机生成初始码表；

依据码字间的信道传输概率和码字对应的单词间的语义距离构建码表的平均语义损失函数；

基于信源编码码表，对待传输的信息进行信源编码；

所述译码过程包括：

获取经信道译码后的输入码字；

在一个实施例中，为了更直观且全面地说明上述语义编码方法以及语义译码方法的有效性，下面提供的是应用本申请上述语义编码方法以及语义译码方法和高斯白噪声瑞利衰落信道模型的仿真示例。

需要说明的是，本说明书中给出的仿真示例仅为示意性的，并非为本发明具体实施案例的唯一限定，本领域技术人员可以在本发明提供的实施案例的示意下，同理采用本发明上述提供的语义编码方法以及语义译码方法，实现对不同应用场景的仿真、实际应用或试验。

高斯白噪声信道模型满足

，/>

。瑞利衰落信道模型满足信道响应/>

服从复高斯分布/>

，即/>

。考虑BLEU (4-gram) “双语评估替补”作为评价指标，用于计算发送文本与恢复后文本的语义相似度。将本发明的方法和最新的语义通信方法相比较。图4是所提编码策略中模拟退火算法的迭代收敛图。该图显示了迭代次数与语义损失值之间的关系。其中，初始温度为100，终止温度为/>

，冷却系数为0.99。内循环数为10，外循环数为20，连续接受差解的最大不超过1500次。由该收敛图可知在7000次迭代后，算法收敛。

图5和图6所示，在加性高斯白噪声（AWGN）信道中，所提出的语义编码/解码策优于其他两种语义编码方法，尤其是在低信噪比时，本发明的优势更明显。Semantic_game方法（即现有方法（二））和ContextSC(CBOW)（即现有方法（一））是两种典型的语义信源编译码策略。其中横坐标为信噪比，纵坐标为BLEU（4-gram）得分。

补充说明，在BPSK调制中，错误检测概率（即0传输错判为1或者1错判为0）为：

。

正确检测概率为：

。

在QPSK调制中，调制符号为

，当码字距离为1时（例如 00和01间码字距离为1）错误检测概率是：

；

当码字距离为2时（例如00和11码字间距离为2）错误检测概率为：

。

正确检测概率（例如00传输为00）为：

。

在图7中，将本发明的语义信源编译码方法(即图中本发明方法)与ContextSC（CBOW）+CC（即现有方法（三））、ECSC（即现有方法（四））和DeepSC（即现有方法（五））网络进行性能比较，其中CC 为信道编码方法，信道编码方法采用LDPC信道编码（2/3速率）方法。ECSC和DeepSC网络是最新的联合语义信源信道编码方法。这两种基于深度学习的自动编码器结构（ECSC模型和DeepSC网络）在低SNR区域比其他方法表现好，但在SNR超过6dB时比其他方法表现差。所提出的模型在相对较低的SNR区域可以获得比ContextSC（CBOW）+CC更好的性能。

另一方面，本发明一实施例中提供一种语义编码装置，包括：

初始码表生成单元，用于对所有词语表

随机生成初始码表/>

；

平均语义损失构建单元，用于依据码字间的信道传输概率

和码字对应的单词间的语义距离/>

构建码表的平均语义损失函数/>

；

上述各模块功能的实现方法，可以采用前述各实施例中相同的方法实现，在此不再赘述。

另一方面，本发明一实施例中提供一种语义编码装置，包括处理器、存储器、收发器和总线，所述处理器、存储器、收发器通过总线连接，其中，所述存储器用于存储一组程序代码，所述收发器用于收发信息，所述处理器用于调用所述存储器中存储的程序代码，执行以下操作：

对所有词语表

随机生成初始码表/>

；

依据码字间的信道传输概率

和码字对应的单词间的语义距离/>

构建码表的平均语义损失函数/>

；

基于信源编码码表，对待传输的信息进行信源编码。

另一方面，本发明一实施例中提供一种语义译码装置，包括：

接收单元,用于获取经信道译码后的输入码字；

另一方面，本发明一实施例中提供一种语义译码装置，包括处理器、存储器、收发器和总线，所述处理器、存储器、收发器通过总线连接，其中，所述存储器用于存储一组程序代码，所述收发器用于收发信息，所述处理器用于调用所述存储器中存储的程序代码，执行以下操作：

获取经信道译码后的输入码字；

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.语义编码方法，其特征在于，包括：

对所有词语表

随机生成初始码表g；

依据码字间的信道传输概率

和码字对应的单词间的语义距离/>

构建码表的平均语义损失函数/>

；

，

其中

和/>

表示词语表/>

中任意两个元素；

基于信源编码码表，对待传输的信息进行信源编码。

2.根据权利要求1所述的语义编码方法，其特征在于，利用模拟退火算法求解使平均语义损失最小的码表

，即：

，

其中

表示使平均语义损失最小的码表，/>

代表所有编码码表的集合，/>

表示当前码表/>

的平均语义损失值，码表/>

即对词语表/>

中所有待编码的元素随机分配一个等长二进制码字/>

，/>

为码字集合，所述元素包括单词、符号、字符，

表示码字集合/>

中任意两个二进制码字/>

和

间的信道传输概率即/>

，/>

为/>

的二进制码字中第k个符号，其中/>

为/>

在编码码表g中的信源码字/>

，

为确定性编码函数，T表示转置；/>

表示/>

和/>

间的语义距离。

3.语义译码方法，其特征在于，包括：

获取经信道译码后的输入码字；

根据信源编码码表，对输入码字进行信源译码，得到传输信息中每个目标单词的候选单词集合，其中所述信源编码码表采用如下方法获得：

对所有词语表

随机生成初始码表g；

依据码字间的信道传输概率

和码字对应的单词间的语义距离/>

构建码表的平均语义损失函数/>

；/>

，

其中

和/>

表示词语表/>

中任意两个元素；

根据传输信息单词间的上下文共现概率即信息序列联合共现概率构建译码目标函数，从候选单词集合中选择共现概率最大的单词组成语义译码输出结果，其中译码目标函数为：

，

其中h代表语义信源译码策略，

为码字/>

被发送端发送经过信道后接收机收到的二进制码字，/>

为已知接收机接收到的第i位目标单词的二进制码字/>

和第i位目标单词的上下文/>

通过译码策略h将第i位目标单词译码成单词/>

，

，/>

代表序列联合共现概率，条件概率/>

为已知目标单词/>

的上文单词/>

的前提下后面接目标单词/>

的概率或者已知上文/>

后当前位置是/>

的出现概率，/>

表示为目标单词/>

的上文。

4.根据权利要求3所述的语义译码方法，其特征在于，条件概率

以通过排列语言模型建模求解。

5.根据权利要求3所述的语义译码方法，其特征在于，利用动态规划算法求解译码目标函数。

6.语义编码装置，其特征在于，包括：

初始码表生成单元，用于对所有词语表

随机生成初始码表g；

平均语义损失构建单元，用于依据码字间的信道传输概率

和码字对应的单词间的语义距离/>

构建码表的平均语义损失函数/>

；

，/>

其中

和/>

表示词语表/>

中任意两个元素；

7.语义编码装置，其特征在于，包括处理器、存储器、收发器和总线，所述处理器、存储器、收发器通过总线连接，其中，所述存储器用于存储一组程序代码，所述收发器用于收发信息，所述处理器用于调用所述存储器中存储的程序代码，执行以下操作：

对所有词语表

随机生成初始码表g；

依据码字间的信道传输概率

和码字对应的单词间的语义距离/>

构建码表的平均语义损失函数/>

；

，

其中

和/>

表示词语表/>

中任意两个元素；

基于信源编码码表，对待传输的信息进行信源编码。

8.语义译码装置，其特征在于，包括：

接收单元,用于获取经信道译码后的输入码字；

信源译码单元，用于根据信源编码码表，对输入码字进行信源译码，得到传输信息中每个目标单词的候选单词集合，其中所述信源编码码表采用如下方法获得：

对所有词语表

随机生成初始码表g；

依据码字间的信道传输概率

和码字对应的单词间的语义距离/>

构建码表的平均语义损失函数/>

；

，/>

其中

和/>

表示词语表/>

中任意两个元素；

共现概率计算及输出单元，用于根据传输信息单词间的上下文共现概率构建译码目标函数，从候选单词集合中选择共现概率最大的单词组成语义译码输出结果，其中译码目标函数为：

，

其中h代表语义信源译码策略，

为码字/>

被发送端发送经过信道后接收机收到的二进制码字，/>

为已知接收机接收到的第i位目标单词的二进制码字/>

和第i位目标单词的上下文/>

通过译码策略h将第i位目标单词译码成单词/>

，

，/>

代表序列联合共现概率，条件概率/>

为已知目标单词/>

的上文单词/>

的前提下后面接目标单词/>

的概率或者已知上文/>

后当前位置是/>

的出现概率，/>

表示为目标单词/>

的上文。

9.语义译码装置，其特征在于，包括处理器、存储器、收发器和总线，所述处理器、存储器、收发器通过总线连接，其中，所述存储器用于存储一组程序代码，所述收发器用于收发信息，所述处理器用于调用所述存储器中存储的程序代码，执行以下操作：

获取经信道译码后的输入码字；

对所有词语表

随机生成初始码表g；

依据码字间的信道传输概率

和码字对应的单词间的语义距离/>

构建码表的平均语义损失函数/>

；

，

其中

和/>

表示词语表/>

中任意两个元素；

根据传输信息单词间的上下文共现概率构建译码目标函数，从候选单词集合中选择共现概率最大的单词组成语义译码输出结果，其中译码目标函数为：

，

其中h代表语义信源译码策略，

为码字/>

被发送端发送经过信道后接收机收到的二进制码字，/>

为已知接收机接收到的第i位目标单词的二进制码字/>

和第i位目标单词的上下文/>

通过译码策略h将第i位目标单词译码成单词/>

，

，/>

代表序列联合共现概率，条件概率/>

为已知目标单词

的上文单词/>

的前提下后面接目标单词/>

的概率或者已知上文/>

后当前位置是

的出现概率，/>

表示为目标单词/>

的上文。/>