CN117592455A

CN117592455A - 一种文本的动态可变邻近语义连贯性评估方法与装置

Info

Publication number: CN117592455A
Application number: CN202311606296.7A
Authority: CN
Inventors: 王丽清; 普恒峰; 肖懿恒; 徐永跃
Original assignee: Yunnan University YNU
Current assignee: Yunnan University YNU
Priority date: 2023-11-29
Filing date: 2023-11-29
Publication date: 2024-02-23
Anticipated expiration: 2043-11-29
Also published as: CN117592455B

Abstract

本发明提供一种文本的动态可变邻近语义连贯性评估方法与装置。该方法包括：获取文本信息；将文本信息分割成若干单句语句文本；确定第一单句语句文本与第二单句语句文本之间的第一连贯性评分；根据第一连贯性评分是否趋于连贯，来动态合并相邻的若干条语句，并确定动态合并后的语句文本与其相邻的下一单句语句文本之间的连贯性评分，直到最后一个单句语句文本的连贯性评分被确定；根据所有相邻单句语句文本之间确定的所有连贯性评分即可确定所述文本信息的语义连贯性。本发明提供的方法，提高了文本语义信息连贯性的评估精度和文本按语义分割的准确性。

Description

一种文本的动态可变邻近语义连贯性评估方法与装置

技术领域

本发明涉及信息处理技术领域，尤其涉及一种文本的动态可变邻近语义连贯性评估方法与装置。

背景技术

文本和对话分割的目的是将文本和对话分割成语义连贯的线性序列片段，每个片段中的文本都密切相关。它在社交媒体分析、摘要分析、对话归纳、对话生成、反馈预测、对话评价、问答，以及众包协同文本处理任务切分分配等多种任务中发挥着至关重要的作用。

语义的连贯性评估是对话和文本分割任务的关键，决定了分割的合理和准确性。目前的方法主要侧重于计算相邻的两个单句语句文本或固定个数单句语句文本之间的连贯性。但是对话的结构和特点与单纯的文本不同。对话是一系列交互的语言行为，更加简短、精炼。单句对话很大程度上依赖于前面的上下文，并且存在更多的主题漂移以及指代现象，有时还涉及多个参与者。而现有方法，往往由于短句语义信息的丢失，从而导致语义信息连贯性评估时误差增大的问题。

发明内容

本发明提供一种文本的动态可变邻近语义连贯性评估方法与装置，用以解决现有技术中语义信息连贯性评估误差大的缺陷。

一种文本的动态可变邻近语义连贯性评估方法，包括：

获取文本信息；

将所述文本信息分割成若干单句语句文本；

确定第一单句语句文本与第二单句语句文本之间的第一连贯性评分；所述第一单句语句文本与第二单句语句文本为一对相邻的语句文本；

根据所述第一连贯性评分是否趋于连贯，来动态合并相邻的若干条语句，并确定动态合并后的语句文本与其相邻的下一单句语句文本之间的连贯性评分，直到最后一个单句语句文本的连贯性评分被确定；

根据所有相邻单句语句文本之间确定的所有连贯性评分即可确定所述文本信息的语义连贯性。

进一步地，如上所述的文本的动态可变邻近语义连贯性评估方法，所述根据所述第一连贯性评分是否趋于连贯，来动态合并相邻的若干条语句，并确定动态合并后的语句文本与其相邻的下一单句语句文本之间的连贯性评分，直到最后一个单句语句文本的连贯性评分被确定包括：

在所述第一连贯性评分为趋于连贯的情况下，将所述第一单句语句文本与第二单句语句文本合并，作为所述动态合并后的语句文本。

进一步地，如上所述的文本的动态可变邻近语义连贯性评估方法，在所述第一连贯性评分为不趋于连贯的情况下，将所述第二单句语句文本与其相邻的下一单句语句文本合并，并确定合并后的语句文本与所述第一单句语句文本之间的第二连贯性评分；

在所述第二连贯性评分为趋于连贯的情况下，将所述第一单句语句文本、第二单句语句文本、与所述第二单句语句文本相邻的下一单句语句文本合并，作为所述动态合并后的语句文本。

进一步地，如上所述的文本的动态可变邻近语义连贯性评估方法，在所述第二连贯性评分为不趋于连贯的情况下，以所述第二单句语句文本作为前置语句，判断与其相邻的下一单句语句文本之间的连贯性评分。

进一步地，如上所述的文本的动态可变邻近语义连贯性评估方法，根据所有相邻单句语句文本之间确定的所有连贯性评分即可确定所述文本信息的语义连贯性包括：

确定完所有相邻单句语句文本之间的连贯性评分后，即可按各相邻句之间的连贯性确定所述文本信息的语义连贯性，并据此完成文本分割。

一种文本的动态可变邻近语义连贯性评估装置，包括：

获取单元，用于获取文本信息；

分割单元，用于将所述文本信息分割成若干单句语句文本；

确定单元，用于确定第一单句语句文本与第二单句语句文本之间的第一连贯性评分；所述第一单句语句文本与第二单句语句文本为一对相邻的语句文本；

所述确定单元，还用于根据所述第一连贯性评分是否趋于连贯，来动态合并相邻的若干条语句，并确定动态合并后的语句文本与其相邻的下一单句语句文本之间的连贯性评分，直到最后一个单句语句文本的连贯性评分被确定；

所述确定单元，还用于根据所有相邻单句语句文本之间确定的所有连贯性评分即可确定所述文本信息的语义连贯性。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述文本的动态可变邻近语义连贯性评估方法。

本发明提供的文本的动态可变邻近语义连贯性评估方法与装置，该方法通过根据第一单句语句文本与第二单句语句文本之间的第一连贯性评分，来确定下一单句语句文本与之前单句语句文本之间的连贯性评分，最终根据所有相邻单句语句文本之间确定的所有连贯性评分确定所述文本的语义连贯性，该方法提高了语义信息连贯性评估精度和文本按语义分割的准确性。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的文本的动态可变邻近语义连贯性评估方法流程图之一；

图2为本发明提供的文本的动态可变邻近语义连贯性评估方法流程图之二；

图3是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

目前，在语义连贯性建模中，为确定潜在句段边界而进行相邻句段的语义相似性计算时，采用了相邻的两个单句或者固定长度(例如上下各两句)的对话组合来进行语义相似性计算，但由于对话的交互性，以及常常出现的共指指代和上下文远距离依赖现象，这种采用静态相邻方法进行语义相似度计算的误差较大，降低了对话主题分割的准确度。为此，本发明提出了一种可变动态邻近语义连贯性评估计算方法，该方法根据语义相关度，使用可变的n个上下文句子，而不是单个对话句，来计算语义连贯性，再根据计算结果，标注发生语义主题变化的段边界，完成分割，从而避免远距离依赖带来的语义丢失，提升计算准确性。

下面对本发明的方案进行详细的介绍。

图1为本发明提供的文本的动态可变邻近语义连贯性评估方法流程图，如图1所示，该方法包括如下步骤：

步骤101：获取文本信息；

步骤102：将所述文本信息分割成若干单句语句文本；

步骤103：确定第一单句语句文本与第二单句语句文本之间的第一连贯性评分；所述第一单句语句文本与第二单句语句文本为一对相邻的语句文本；

步骤104：根据所述第一连贯性评分是否趋于连贯，来动态合并相邻的若干条语句，并确定动态合并后的语句文本与其相邻的下一单句语句文本之间的连贯性评分，直到最后一个单句语句文本的连贯性评分被确定；

步骤105：根据所有相邻单句语句文本之间确定的所有连贯性评分即可确定所述文本信息的语义连贯性。

进一步地，在所述第一连贯性评分为趋于连贯的情况下，将所述第一单句语句文本与第二单句语句文本合并，作为所述动态合并后的语句文本。在所述第一连贯性评分为不趋于连贯的情况下，将所述第二单句语句文本与其相邻的下一单句语句文本合并，并确定合并后的语句文本与所述第一单句语句文本之间的第二连贯性评分；

在所述第二连贯性评分为趋于连贯的情况下，将所述第一单句语句文本、第二单句语句文本、与所述第二单句语句文本相邻的下一单句语句文本合并，作为所述动态合并后的语句文本。在所述第二连贯性评分为不趋于连贯的情况下，以所述第二单句语句文本作为前置语句，判断与其相邻的下一单句语句文本之间的连贯性评分。

具体地，对话主题语义分割的目标是根据对话文本的主题语义确定对话的段边界。为描述本发明提供的方法，假设给定对话D有n句对话句，表示为：D＝{u1，u2，...，u_n}，n和n-1两两间隔相邻的对话句构成句对vi，表示为V＝{v1，v2，...，v_n-1}。分割结果表示为R＝{r1，r2，...，r_n-1}，其中ri是一个二进制值，代表话语ui是否为段边界，1则是段边界，0则不是。

在分割时，会在ui和ui+1之间计算语义连贯性评分si，si∈[0，1]，si越接近于1则表示ui和ui+1属于同一段的概率越高。在完成所有连贯性分数计算后，得到S＝{s1，s2，...，s_n-1}，再据此得出分段边界。

图2为本发明提供的文本的动态可变邻近语义连贯性评估方法流程图之二，如图2所示，本发明实施例以一对相邻的对话句(x，y)作为输入。连贯性评估模型的输出结果形式为[趋于连贯的数值C₁，趋于不连贯的数值C₂]，当C₁大于C₂时，即认为趋于连贯，否则为趋于不连贯。一开始，x，y即ui和ui+1，然后对ui和ui+1之间的连贯性进行判断。如果趋于连贯，则将ui和ui+1两句拼接成uiui+1，作为模型下一轮输入的x，并输出连贯性评分S。如果判断ui和ui+1趋于不连贯时，先保存C₁为Stmp，然后扩展增加后续相邻的句子，将ui+1扩展拼接为ui+1 ui+2作为y，再进一步判断ui和ui+1 ui+2之间的连贯性趋势。如果扩展后的增量判断趋向于连贯，则认为ui和ui+1也趋向于连贯，并把S赋值为此时得到的C₁。如果扩展后判断仍然趋于不连贯，那么认为ui和ui+1确实倾向于不相关。因此，把之前保留的评分Stmp作为未扩展前的句对ui和ui+1的连贯性评分，再把ui+1单独作为模型下一轮的输入x，ui+2作为y，循环进入下一轮句对判断，直至全部对话句D判断完成。

下面以一具体实施例对本发明提供的方案做具体说明：

本实例构建的待完成任务由以下话语组成的对话作为示范：

1、你喜欢吃梅子吗？

2、喜欢啊。

3、那不如我们小院搞个团建吧。

4、团建？

5、去果园采摘，一边吃一边拿。

6、费用呢？多少钱一个人？

7、提什么钱呀，我请客，还管饭。

8、那可以啊，老板请客。什么时候？

9、择日不如撞日，那就明天吧。

10、明天啊？

11、你有安排？

12、那倒没有。

13、那就这么定了。

14、明天娜娜要去店里啊。

15、那就歇业。

任务以话语对的形式进行。

第一轮输入话语对：(“你喜欢吃梅子吗？”，“喜欢啊。”)，首先判断其连贯性趋势，连贯性评分模型的输出结果形式为[C₁,C₂]，这里，得出的结果为C₁>C₂趋于连贯，基于此，下一轮输入话语对的前置设定为：“你喜欢吃梅子吗？喜欢啊。”，同时得到本轮输入话语对的连贯性分数是s1，s1取为sigmoid(C₁)。

第一轮过后的实例状态如下表1：

表1

编号	输入话语对	连贯性分数	下一轮输入前置
				1	“你喜欢吃梅子吗？”，“喜欢啊。”	s₁	“你喜欢吃梅子吗？喜欢啊。”

第二轮输入话语对：(“你喜欢吃梅子吗？喜欢啊。”，“那不如我们小院搞个团建吧。”)，首先判断其连贯性趋势，连贯性评分模型的输出结果[C₁,C₂]，且C₁<C₂判定为趋于不连贯，则扩大输入话语对的后置，通过增加后置信息，对输入话语对多做一轮连贯性趋势判断，即再次判断(“你喜欢吃梅子吗？喜欢啊。”，“那不如我们小院搞个团建吧。团建？”)的连贯性趋势，此时输出结果为[C₃,C₄]，且C₃<C₄，扩增话语对仍判定为趋于不连贯。双重不连贯，说明输入话语对(“你喜欢吃梅子吗？喜欢啊。”，“那不如我们小院搞个团建吧。”)确实是趋于不连贯的。基于此，下一轮输入话语对的前置更新为：“那不如我们小院搞个团建吧。”，同时得到本轮输入话语对的连贯性分数s₂。s₂等于sigmoid(C₁)

第二轮过后的实例状态如下表2：

表2

第三轮输入话语对：(“那不如我们小院搞个团建吧。”，“团建？”)，首先判断其连贯性趋势，连贯性评分模型判定为趋于连贯。基于此，下一轮输入话语对的前置设定为：“那不如我们小院搞个团建吧。团建？”，同时得到本轮输入话语对的连贯性分数s3。

第三轮过后的实例状态如下表3：

表3

第四轮输入话语对：(“那不如我们小院搞个团建吧。团建？”，“去果园采摘，一边吃一边拿。”)，首先判断其连贯性趋势，判定为趋于不连贯。扩大输入话语对的后置，再次判断(“那不如我们小院搞个团建吧。团建？”，“去果园采摘，一边吃一边拿。费用呢？多少钱一个人？”)的连贯性趋势，仍判定为趋于不连贯。双重不连贯，说明输入话语对(“那不如我们小院搞个团建吧。团建？”，“去果园采摘，一边吃一边拿。”)确实是趋于不连贯的。基于此，下一轮输入话语对的前置更新为：“去果园采摘，一边吃一边拿。”，同时得到本轮输入话语对的连贯性分数s₄。

第四轮过后的实例状态如下表4：

表4

第五轮输入话语对：(“去果园采摘，一边吃一边拿。”，“费用呢？多少钱一个人？”)，先判断其连贯性趋势，连贯性评分判定为趋于连贯。基于此，下一轮输入话语对的前置设定为：“去果园采摘，一边吃一边拿。费用呢？多少钱一个人？”，同时得到本轮输入话语对的连贯性分数s₅。

第五轮过后的实例状态如下表5：

表5

第六轮输入话语对：(“去果园采摘，一边吃一边拿。费用呢？多少钱一个人？”，“提什么钱呀，我请客，还管饭。”)，先判断其连贯性趋势，判定为趋于连贯。基于此，下一轮输入话语对的前置设定为：“去果园采摘，一边吃一边拿。费用呢？多少钱一个人？提什么钱呀，我请客，还管饭。”，同时得到本轮输入话语对的连贯性分数s₆。

第六轮过后的实例状态如下表6：

表6：

如此反复，直到最后第十四轮输入话语对：(“去果园采摘，一边吃一边拿。费用呢？多少钱一个人？提什么钱呀，我请客，还管饭。那可以啊，老板请客。什么时候？择日不如撞日，那就明天吧。明天啊？你有安排？那倒没有。那就这么定了。明天娜娜要去店里啊。”，“那就歇业。”)，先判断其连贯性趋势，输入话语对判定为趋于连贯。基于此，下一轮输入话语对的前置设定为：“去果园采摘，一边吃一边拿。费用呢？多少钱一个人？提什么钱呀，我请客，还管饭。那可以啊，老板请客。什么时候？择日不如撞日，那就明天吧。明天啊？你有安排？那倒没有。那就这么定了。明天娜娜要去店里啊。那就歇业。”，同时得到本轮输入话语对的连贯性分数s₁₄。

第十四轮过后的实例状态如下表14：

表14：

至此，得到了所有话语对之间的连贯性分数s＝{s₁,s₂,…,s₁₄}，即可根据该连贯性分数得出该段文本的语义连贯情况，并得到分割点。最终结果为：本例有2个分割点，分别在第2句和第4句之后。

本发明提供的动态可变邻近的上下文连贯性评估方法将对单个句对的判断根据相关性动态地扩展到语义相关的数个语句中，解决了现有语义连贯性评分模型在对话语义分割过程中由于对话远距离上下文关联带来的评估误差问题。

下面对本发明提供的一种文本的动态可变邻近语义连贯性评估装置进行描述，下文描述的一种文本的动态可变邻近语义连贯性评估装置与上文描述的一种文本的动态可变邻近语义连贯性评估方法可相互对应参照。

一种文本的动态可变邻近语义连贯性评估装置，包括：

获取单元，用于获取文本信息；

分割单元，用于将所述文本信息分割成若干单句语句文本；

图3示例了一种电子设备的实体结构示意图，如图3所示，该电子设备可以包括：处理器(processor)310、通信接口(CommunicationsInterface)320、存储器(memory)330和通信总线340，其中，处理器310，通信接口320，存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令，以执行文本的动态可变邻近语义连贯性评估方法。

此外，上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种文本的动态可变邻近语义连贯性评估方法，其特征在于，包括：

获取文本信息；

将所述文本信息分割成若干单句语句文本；

2.根据权利要求1所述的文本的动态可变邻近语义连贯性评估方法，其特征在于，根据所述第一连贯性评分是否趋于连贯，来动态合并相邻的若干条语句，并确定动态合并后的语句文本与其相邻的下一单句语句文本之间的连贯性评分，直到最后一个单句语句文本的连贯性评分被确定包括：

3.根据权利要求1所述的文本的动态可变邻近语义连贯性评估方法，其特征在于，在所述第一连贯性评分为不趋于连贯的情况下，将所述第二单句语句文本与其相邻的下一单句语句文本合并，并确定合并后的语句文本与所述第一单句语句文本之间的第二连贯性评分；

4.根据权利要求3所述的文本的动态可变邻近语义连贯性评估方法，其特征在于，在所述第二连贯性评分为不趋于连贯的情况下，以所述第二单句语句文本作为前置语句，判断与其相邻的下一单句语句文本之间的连贯性评分。

5.根据权利要求1所述的文本的动态可变邻近语义连贯性评估方法，其特征在于，根据所有相邻单句语句文本之间确定的所有连贯性评分即可确定所述文本信息的语义连贯性包括：

6.一种文本的动态可变邻近语义连贯性评估装置，其特征在于，包括：

获取单元，用于获取文本信息；

分割单元，用于将所述文本信息分割成若干单句语句文本；

7.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至5任一项所述文本的动态可变邻近语义连贯性评估方法。