CN112650595B - 一种通讯内容处理方法及相关装置 - Google Patents
一种通讯内容处理方法及相关装置 Download PDFInfo
- Publication number
- CN112650595B CN112650595B CN201910961938.2A CN201910961938A CN112650595B CN 112650595 B CN112650595 B CN 112650595B CN 201910961938 A CN201910961938 A CN 201910961938A CN 112650595 B CN112650595 B CN 112650595B
- Authority
- CN
- China
- Prior art keywords
- communication
- theme
- message
- instant messaging
- session identifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004891 communication Methods 0.000 title claims abstract description 638
- 238000003672 processing method Methods 0.000 title abstract description 10
- 238000000034 method Methods 0.000 claims abstract description 54
- 238000004590 computer program Methods 0.000 claims description 13
- 238000009499 grossing Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims 4
- 238000010586 diagram Methods 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 235000012054 meals Nutrition 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 241000733943 Hapalogaster mertensii Species 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/542—Event management; Broadcasting; Multicasting; Notifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/546—Message passing systems or structures, e.g. queues
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请实施例公开了一种通讯内容处理方法及相关装置,该方法包括:获取至少一个会话标识对应的满足预设条件的即时通讯消息;根据所述满足预设条件的即时通讯消息确定至少一个与所述至少一个会话标识一一对应的通讯主题以及与所述通讯主题相关联的目标即时通讯消息,其中所述目标即时通讯消息包括消息内容和消息发送对象;对所述通讯主题进行显示,其中所述通讯主题或所述通讯主题形成的通讯主题集合标识与所述至少一个会话标识相对独立。采用本申请实施例,能够方便用户快速获知即时通讯应用中的消息内容。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种通讯内容处理方法及相关装置。
背景技术
随着计算机技术以及通信技术的快速发展,即时通讯应用的普及度也越来越高,例如,微信、QQ、MSN等即时通讯引用已在各类人群中有着广泛应用,无论是工作、学习还是生活中,基于即时通讯应用进行日常沟通已经非常普遍。在使用即时通讯应用通讯的过程中通常会遇到这样一种情况,即不断的有新的消息内容发送过来,但是由于用户没有注意到或者比较忙而无法立即查看这些消息内容,导致当用户后续去查看消息内容时,需要查看的消息内容已高达成百上千条,从而使得用户根本无法在短时间内获知这些通讯内容。如何让用户快速获知即时通讯应用中的消息内容是本领域的技术人员正在研究的技术问题。
发明内容
本申请实施例提供一种通讯内容处理方法及相关装置,能够方便用户快速获知即时通讯应用中的消息内容。
第一方面,本申请实施例提供一种通讯内容处理方法,该方法包括:
获取至少一个会话标识对应的满足预设条件的即时通讯消息;
根据所述满足预设条件的即时通讯消息确定至少一个与所述至少一个会话标识一一对应的通讯主题以及与所述通讯主题相关联的目标即时通讯消息,其中所述目标即时通讯消息包括消息内容和消息发送对象;
对所述通讯主题进行显示,其中所述通讯主题或所述通讯主题形成的通讯主题集合标识与所述至少一个会话标识相对独立。
可选的,所述满足预设条件的即时通讯消息为:处于预设时间段内的即时通讯消息,或者为未读的即时通讯消息,或者为预先设定的通讯对象的即时通讯消息,或者为与预设关键词具有预设匹配关系的即时通讯消息。
可选的,所述对所述通讯主题进行显示之后,还包括:
接收针对显示的所述通讯主题中的目标通讯主题的选择操作;
响应所述选择操作,显示与所述目标通讯主题相关联的所述目标即时通讯消息。
可选的,所述对所述通讯主题进行显示,包括:
对所述通讯主题和摘要内容进行显示,其中,所述摘要内容为根据所述通讯主题相关联的目标即时通讯消息提取的。
可选的,若确定出的通讯主题为多个通讯主题;所述对所述通讯主题进行显示,包括:
对所述多个通讯主题按照顺序进行显示,其中,对应的会话标识所表示的会话中满足所述预设条件的即时通讯消息越多的通讯主题的排序越靠前。
可选的,所述根据所述满足预设条件的即时通讯消息确定至少一个与所述至少一个会话标识一一对应的通讯主题,包括:
确定所述满足预设条件的即时通讯消息所描述的一个或者多个第一事件;
提取所述一个或者多个第一事件中的摘要以得到至少一个与所述至少一个会话标识一一对应的摘要内容;
根据至少一个与所述至少一个会话标识一一对应的摘要内容确定至少一个与所述至少一个会话标识一一对应的通讯主题。
可选的,所述对所述通讯主题进行显示,包括:
向设备发送所述通讯主题以及与所述通讯主题相关联的目标即时通讯消息,以供所述设备进行显示。
可选的,所述对所述通讯主题进行显示之后,还包括:
根据新生成的满足所述预设条件的即时通讯消息生成一个或者多个第二事件;
若存在第二事件与所述第一事件的相似度超过预设阈值,则将所述相似度超过所述预设阈值的所述第一事件和所述第二事件合并为一个事件;
根据未合并的所述第一事件、未合并的所述第二事件和合并后的事件,确定新的通讯主题以及与所述新的通讯主题相关联的目标即时通讯消息;
对所述新的通讯主题进行显示。
第二方面,本申请实施例提供一种通讯内容处理方法,该方法包括:
接收服务器发送的至少一个与至少一个会话标识一一对应的通讯主题以及与所述通讯主题相关联的目标即时通讯消息,其中所述目标即时通讯消息包括消息内容和消息发送对象;
显示所述通讯主题,其中所述通讯主题或所述通讯主题形成的通讯主题集合标识与所述至少一个会话标识相对独立。
可选的,所述显示所述通讯主题之后,还包括:
接收针对显示的所述通讯主题中的目标通讯主题的选择操作;
响应所述选择操作,显示与所述目标通讯主题相关联的所述目标即时通讯消息。
可选的,所述显示所述通讯主题,包括:
显示所述通讯主题和摘要内容,其中,所述摘要内容为根据所述通讯主题相关联的目标即时通讯消息提取的。
第三方面,本申请实施例提供一种通讯内容处理装置,该装置包括:
获取单元,用于获取至少一个会话标识对应的满足预设条件的即时通讯消息;
第一确定单元,用于根据所述满足预设条件的即时通讯消息确定至少一个与所述至少一个会话标识一一对应的通讯主题以及与所述通讯主题相关联的目标即时通讯消息,其中所述目标即时通讯消息包括消息内容和消息发送对象;
显示单元,用于对所述通讯主题进行显示,其中所述通讯主题或所述通讯主题形成的通讯主题集合标识与所述至少一个会话标识相对独立。
可选的,所述满足预设条件的即时通讯消息为:处于预设时间段内的即时通讯消息,或者为未读的即时通讯消息,或者为预先设定的通讯对象的即时通讯消息,或者为与预设关键词具有预设匹配关系的即时通讯消息。
可选的,所述装置还包括:
接收单元,用于在所述显示单元对所述通讯主题进行显示之后,接收针对显示的所述通讯主题中的目标通讯主题的选择操作;
响应单元,用于响应所述选择操作,显示与所述目标通讯主题相关联的所述目标即时通讯消息。
可选的,所述显示单元,用于对所述通讯主题进行显示,具体为包括:
对所述通讯主题和摘要内容进行显示,其中,所述摘要内容为根据所述通讯主题相关联的目标即时通讯消息提取的。
可选的,若确定出的通讯主题为多个通讯主题;所述显示单元,用于对所述通讯主题进行显示,具体为:
对所述多个通讯主题按照顺序进行显示,其中,对应的会话标识所表示的会话中满足所述预设条件的即时通讯消息越多的通讯主题的排序越靠前。
可选的,所述第一确定单元,用于根据所述满足预设条件的即时通讯消息确定至少一个与所述至少一个会话标识一一对应的通讯主题,具体为:
确定所述满足预设条件的即时通讯消息所描述的一个或者多个第一事件;
提取所述一个或者多个第一事件中的摘要以得到至少一个与所述至少一个会话标识一一对应的摘要内容;
根据至少一个与所述至少一个会话标识一一对应的摘要内容确定至少一个与所述至少一个会话标识一一对应的通讯主题。
可选的,所述显示单元,用于对所述通讯主题进行显示,具体为:
向设备发送所述通讯主题以及与所述通讯主题相关联的目标即时通讯消息,以供所述设备进行显示。
可选的,还包括:
生成单元,用于在所述显示单元对所述通讯主题进行显示之后,根据新生成的满足所述预设条件的即时通讯消息生成一个或者多个第二事件;
合并单元,用于在存在第二事件与所述第一事件的相似度超过预设阈值的情况下,将所述相似度超过所述预设阈值的所述第一事件和所述第二事件合并为一个事件;
第二确定单元,用于根据未合并的所述第一事件、未合并的所述第二事件和合并后的事件,确定新的通讯主题以及与所述新的通讯主题相关联的目标即时通讯消息;
所述显示单元,还用于对所述新的通讯主题进行显示。
第四方面,本申请实施例提供一种通讯内容处理装置,该装置包括:
第一接收单元,用于接收服务器发送的至少一个与至少一个会话标识一一对应的通讯主题以及与所述通讯主题相关联的目标即时通讯消息,其中所述目标即时通讯消息包括消息内容和消息发送对象;
显示单元,用于显示所述通讯主题,其中所述通讯主题或所述通讯主题形成的通讯主题集合标识与所述至少一个会话标识相对独立。
可选的,所述装置还包括:
第二接收单元,用于在所述显示单元显示所述通讯主题之后,接收针对显示的所述通讯主题中的目标通讯主题的选择操作;
响应单元,用于响应所述选择操作,显示与所述目标通讯主题相关联的所述目标即时通讯消息。
可选的,所述显示单元,用于显示所述通讯主题,具体为:
显示所述通讯主题和摘要内容,其中,所述摘要内容为根据所述通讯主题相关联的目标即时通讯消息提取的。
第五方面,本申请实施例提供一种通讯内容处理装置,该装置包括:处理器和存储器;所述处理器和存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行第一方面所描述的方法。
第六方面,本申请实施例提供一种通讯内容处理装置,该装置包括:处理器和存储器;所述处理器和存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行第二方面所描述的方法。
第七方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行第一方面或者第二方面所述的方法。
通过实施本申请实施例,根据至少一个会话标志对应的满足预设条件的即时通讯内容确定至少一个会话标识各自对应的通讯主题,然后将确定出的各个通讯主题和各个会话标识相对独立显示;这样一来,用户可以根据通讯主题快速获知每个会话标识表示的会话中的主旨内容,并且在用户对通讯主题进行操作后可以显示对应的满足预设条件的即时通讯内容,即用户能够很方便地获取到该通讯主题背后的详细信息;同时,由于各个通讯主题和各个会话标识相对独立显示,因此终端对通讯主题的显示并不妨碍用户采用传统方式对每个会话进行查看。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种网络架构示意图;
图2是本申请实施例提供的一种通讯内容处理方法的流程示意图;
图3是本申请实施例提供的一种通讯主题识别方法的流程示意图;
图4-8是本申请实施例提供的一种应用程序界面交互示意图;
图9是本申请实施例提供的又一种通讯内容处理方法的流程示意图;
图10是本申请实施例提供的一种通讯内容处理装置的结构示意图;
图11是本申请实施例提供的又一种通讯内容处理装置的结构示意图;
图12是本申请实施例提供的又一种通讯内容处理装置结构示意图;
图13是本申请实施例提供的又一种通讯内容处理装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例需要实现通讯内容处理,通讯内容处理过程中涉及即时通讯内容的获取,通讯主题的生成,通讯主题的显示,等等。这些操作可以都通过终端来实现,也可以通过终端和服务器来共同实现,例如,服务器实现即时通讯内容的获取,通讯主题的生成,终端实现通讯主题的显示。
该终端可以为手持设备(例如,手机、平板电脑、掌上电脑等)、车载设备(例如,汽车、自行车、电动车、飞机、船舶等)、可穿戴设备(例如智能手表(如iWatch等)、智能手环、计步器等)、智能家居设备(例如,冰箱、电视、空调、电表等)、智能机器人、车间设备,等等。
该服务器可以由提供即时通讯服务的企业或者单位提供,其部署方式(如部署的量以及部署的位置)可以由提供通讯服务的企业或者单位来决定。
下面针对终端和服务器来共同实现的情况提供一种网络架构图,具体请参见图1。图1是本申请实施例提供的一种网络架构示意图。该网络架构包括服务器101和终端102,其中,该服务器101可以是单个服务器也可以是由多个服务器构成的服务器集群,该终端102的数量可以为一个也可以为多个,图1中仅以一个为例进行示意。该服务器101和该终端102中均部署了应用程序,该服务器101上部署的应用程序与该终端102上部署的应用程序耦合,以实现服务器101与终端102之间的通讯。通常该终端102上部署的用于与服务器101进行通讯的应用程序也可以称为通讯客户端、或者通讯应用(application,APP)。
上述网络架构用于进行通讯内容处理,处理过程中涉及到服务器101与终端102之间的交互。下面例举一种可选的交互流程:终端102上的客户端中包含负责收集信息的模块,用于记录当前距离上一次查看通讯主题之间间隔的时间time,以及这段时间内共有多少条未读的消息msgcount(即通讯内容),消息的具体内容msg,消息的发送方标识fromUIN,收消息方所在的会话fromplace等,该负责收集信息的模块可以通过接口进行调用,如通过接口client_receive_msg进行调用。相应地,服务器101从终端102处获取终端上的客户端采集的原始消息数据,然后通过负责快速识别信息主题摘要的模块对该原始消息数据进行识别处理,从而得出一段时间内终端上接收的消息内容的通讯主题(也称主题摘要,如topic),以及与通讯主题相关的未读的通讯内容msg;该负责快速识别信息主题摘要的模块可通过接口进行调用,如通过接口sever_msg_cluster进行调用。接着,服务器101将识别处理得到的通讯主题、以及该通讯主题所来自的会话等各种相关信息发送给终端102;终端102通过客户端的显示模块将通讯主题、以及通讯主题所来自的会话等各种相关信息显示给用户,该显示模块可通过接口进行调用,如通过接口client_show_topic进行调用。
请参见图2,图2是本申请实施例提供的一种通讯内容处理方法的流程示意图,该方法中,即时通讯内容的获取,通讯主题的生成,通讯主题的显示均由终端来实现,该方法包括但不限于如下步骤。
步骤S201:终端获取至少一个会话标识对应的满足预设条件的即时通讯消息。
具体地,在即时通讯客户端中一般支持群聊和单聊,群聊是针对一群人聊天的会话,单聊是针对某一个人的会话,每个会话都对应有各自的会话标识,任意一个会话的会话标识用于对该会话进行唯一标记和区分。会话标识对应的满足预设条件的即时通讯消息具体是指该会话标识所标记的会话中满足预设条件的通讯消息。
本申请实施例中,预设条件是根据需要预先配置,下面进行举例说明。
案例一,所述满足预设条件的即时通讯消息为处于预设时间段内的即时通讯消息,一种方案,该预设时间段可以为一个预先设定的固定长度(例如30分钟),其结束时间为当前时间。又一种方案,该预设时间段可以具体为从当前到上一次查看通讯主题(也称通讯内容的主题摘要)的这段时间。又一种方案,确定通讯主题是周期性进行的,该预设时间段为其中一个周期。
案例二,所述满足预设条件的即时通讯消息为未读的即时通讯消息。例如,即时通讯客户端已经接收到但未被用户读取的即时通讯消息。可以理解的是,用户针对每个会话的操作情况可以被检测到,因此哪些消息已读哪些消息未读是可以检测出来的。
案例三,所述满足预设条件的即时通讯消息为预先设定的通讯对象的即时通讯消息,该通讯对象可以是某个或者某一些特定的人物,例如,企业领导,男友,女友,闺蜜等,需要重点关注的对象都可以将其作为本申请中预先设定的通讯对象。这样一来,就可以针对性地获取到这些通讯对象的即时通讯消息。
案例四,所述满足预设条件的即时通讯消息为与预设关键词具有预设匹配关系的即时通讯消息。可选的,该预设匹配关系可以是相似关系,相似关系的确定有很多成熟的手段,此处不再展开描述。这里的预设关键词也是根据需要预先设定好的,例如,可以设置为“吃饭”、“打球”、“高考”等等。
案例五,所述满足预设条件的即时通讯消息为符合预设语义的即时通讯消息,其中,该预设语义可以为用户设定的,通过这种方式可以选择出与用户期望的语义相一致的即时通讯消息。
本申请实施例中,当上述至少一个会话标识具体为一个会话标识时,获取的就是一个会话标识对应的满足预设条件的即时通讯消息。当上述至少一个会话标识具体为多个会话标识时,获取的就是多个会话标识各自对应的满足预设条件的即时通讯消息,例如,该多个会话标识为会话标识1、会话标识2和会话标识3,那么,获取的就是会话标识1对应的满足预设条件的即时通讯消息,会话标识2对应的满足预设条件的即时通讯消息,以及会话标识3对应的满足预设条件的即时通讯消息。
步骤S202:终端根据所述满足预设条件的即时通讯消息确定至少一个与所述至少一个会话标识一一对应的通讯主题以及与所述通讯主题相关联的目标即时通讯消息。
具体地,有多少个会话标识对应的满足预设条件的即时通讯消息,则相应地确定出多个通讯主题及与所述通讯主题相关联的目标即时通讯消息。举例来说,假若获取的了会话标识1对应的满足预设条件的即时通讯消息,会话标识2对应的满足预设条件的即时通讯消息,以及会话标识3对应的满足预设条件的即时通讯消息;那么,相应地根据会话标识1对应的满足预设条件的即时通讯消息确定会话标识1对应的通讯主题以及与该通讯主题相关联的目标即时通讯消息,根据会话标识2对应的满足预设条件的即时通讯消息确定会话标识2对应的通讯主题以及与该通讯主题相关联的目标即时通讯消息,根据会话标识3对应的满足预设条件的即时通讯消息确定会话标识3对应的通讯主题以及与该通讯主题相关联的目标即时通讯消息。
下面对根据满足预设条件的即时通讯消息确定通讯主题的方式进行介绍,可选的,可以根据满足预设条件的即时通讯消息确定所述该满足预设条件的即时通讯消息所描述的一个或者多个第一事件,通常来说,满足预设条件的通讯消息可能比较零散,通过相应算法(如机器学习算法)对这些零散的通讯内容进行处理可以得到这些零散的内容所描述的事件,得到的事件称为第一事件以方便后续描述,得到的第一事件可能为一个也可能为多个。然后,提取所述一个或者多个第一事件中的摘要以得到至少一个与所述至少一个会话标识一一对应的摘要内容,并根据至少一个与所述至少一个会话标识一一对应的摘要内容确定至少一个与所述至少一个会话标识一一对应的通讯主题。可以理解,根据会话标识1对应的满足预设条件的即时通讯消息确定的第一事件,用来提取摘要以生成该会话标识1对应的通讯主题;根据会话标识2对应的满足预设条件的即时通讯消息确定的第一事件,用来提取摘要以生成该会话标识2对应的通讯主题,其余依此类推。可以理解,对摘要内容进行提炼,以及对摘要内容按照语言逻辑进行编排就可以得到通讯主题。理想情况下,通讯主题的内容相对较短,信息浓缩度较高,描述了事件的主要信息。对应的事件描述的就是通讯主题背后的来龙去脉和各种细节内容。当然,未读的通讯内容中也可能会存在一些不理想的通讯内容(也称query),如“大闸蟹的最佳食用日期”,可能还需要后续的一些事件或者通讯消息与不理想的通讯消息进行结合分析才能确定出相关的通讯主题。以上讲述的就是生成了新的通讯主题的情况。
当然,也可能在此之前已经分析得到的一些通讯主题,因此在根据未读的通讯内容确定一个或者多个事件之后,直接根据该一个或者多个事件就可以查找到已有的通讯主题,而无需对该一个或者多个事件进行摘要提取来得到通讯主题。这种情况就相当于直接沿用已有的通讯主题。
可选的,是需要生成新的通讯主题还是沿用已有的通讯主题可以具体通过图3所示的流程进行判断:
步骤1、输入为一连串的query(一个query相当于一条通讯内容,一连串的query相当于时序上一连串的通讯内容)的时序PV数据,采用前端补0的方式对输入的时序数据补齐周期。比如,周期为10分钟(min),则输入的时序点必须为10min的整数倍。如果输入数据为15min,则前端补零,补成20min。
步骤2、时序平滑和分段,采取累计pv的方式。这一步的目的是减少毛刺。比如,10min作为一个周期,输入数据为8个间隔5min的数据点,那么这8个间隔5min的数据点会被平滑为4个间隔10min的数据点。
步骤3、对时序数据的每个数据点,计算该数据点的动量,计算公式如下:
步骤4、对计算得到的动量序列,计算最大子序列 。最大子序列的开始点 ,作为第一个突发时间点。最大子序列的结束点,作为突发结束的时间点。
步骤5、计算最大子序列结束点与最大子序列开始点的动量差,若动量差大于预先设定的动量阈值,则最大子序列结束点对应的query被判断为突发query。如果该最大子序列结束点对应的query被判断为突发query,那么表明有新的通讯主题产生,因此要根据满足预设条件的即时通讯消息生成一个或者多个事件,并根据该一个或者多个事件生成新的通讯主题;如果该最大子序列结束点对应的query未被判断为突发query,那么表明没有新的通讯主题产生,因此根据满足预设条件的即时通讯消息生成一个或者多个事件,然就根据一个或者多个事件找到已有的通讯主题即可。
本申请实施例中,与每个通讯主题关联的目标即时通讯消息可以具体为确定该通信主题时所用到的满足预设条件的即时通讯消息。例如,与通讯主题1关联的目标即时通讯消息为确定该通信主题1时所用到的满足预设条件的即时通讯内容,即通讯主题1对应的会话标识所对应的满足预设条件的即时通讯内容。与通讯主题2关联的目标即时通讯消息为确定该通信主题2时所用到的满足预设条件的即时通讯内容,即通讯主题2对应的会话标识所对应的满足预设条件的即时通讯内容。进一步地,所述目标即时通讯消息包括消息内容和消息发送对象,用于用户识别哪条消息是哪个用户发送的。例如,该目标即时通讯消息包括消息内容1、消息内容2和消息内容3,且标记了消息内容1是由聊天对象A发送的,消息内容2是由聊天对象B发送的,消息内容3是由聊天对象A发送的。
在一种可选的方案中,若前面确定出的至少一个通讯主题为多个通讯主题,则根据上述至少一个会话标识各自标识的会话中满足预设条件的即时通讯消息确定该多个通讯主题的热度,对应的会话标识所表示的会话中满足所述预设条件的即时通讯消息越多的通讯主题的热度越高,例如,通讯主题1对应的会话标识所表示的会话中满足预设条件的即时通讯消息数量多于通讯主题2对应的会话标识所表示的会话中满足预设条件的即时通讯消息数量,则认为通讯主题1的热度高于通讯主题2的热度。后续在对多个通讯主题进行显示时,可以将热度高的通讯主题显示在显眼或者靠前的区域。
步骤S203:终端对所述通讯主题进行显示。
具体地,其中所述通讯主题或所述通讯主题形成的通讯主题集合标识与所述至少一个会话标识相对独立。为了便于理解,下面进行举例说明。
案例一,所述通讯主题与所述至少一个会话标识相对独立,如图4所示,显示了三个通讯主题,分别为通讯主题401、通讯主题402和通讯主题403,另外,还显示了三个会话标识,分别为会话标识404、会话标识405和会话标识406,可以看出,通讯主题和会话标识是相对独立显示的。可选的,通讯主题401对应会话标识404、通讯主题402对应会话标识405、通讯主题403对应会话标识406。
案例二,所述通讯主题形成的通讯主题集合标识与所述至少一个会话标识相对独立,如图5所示,显示了所述通讯主题形成的通讯主题集合标识407,以及显示了三个会话标识,分别为会话标识404、会话标识405和会话标识406,可以看出,通讯主题集合标识和会话标识是相对独立显示的。当用户对通讯主题集合标识407进行触控点击时,进一步显示图4所示的界面,即向用户呈现通讯主题集合内的各个通讯主题,如通讯主题401、通讯主题402和通信主题403。
本申请实施例中,终端向用户显示通讯主题之后,还可以进一步与用户进行交互,例如,终端接收针对显示的所述通讯主题中的目标通讯主题的选择操作,可以理解,这里存在至少一个通讯主题,当用户选择其中哪个通讯主题,则该通信主题为此处的目标通讯主题,用户可以通过触控、声控、物理按键控制等方式执行选择,例如,对其中某个通讯主题所显示的位置进行触控点击则可以实现对该某个通讯主题的选择。然后,终端响应所述选择操作,显示与所述目标通讯主题相关联的所述目标即时通讯消息。举例来说,如图6所示,用户触控点击通讯主题401所显示的位置,相应地,如图7所示,终端显示与通讯主题401关联的目标即时通讯消息408,在目标即时通讯消息408中,“我今天发表了两篇沦为,请大家吃饭”属于消息内容,“好友A”属于消息发送对象,用于表明“我今天发表了两篇沦为,请大家吃饭”是“好友A”发送的。目标即时通讯消息408中的还存在其他消息内容和消息发送对象,此处不一一举例。
在一种可选的方案中,当需要显示的通讯主题的数量为多个通讯主题的时候,所述对所述通讯主题进行显示,可以包括:对所述多个通讯主题按照顺序进行显示,其中,对应的会话标识所表示的会话中满足所述预设条件的即时通讯消息越多的通讯主题的排序越靠前。在前面已经介绍过,可以计算每个通讯主题的热度,这里对多个通讯主题按照顺序进行显示就是按照热度来的,热度越高的显示越显眼或者越靠前,热度是根据对应的会话中满足预设条件的即时通讯消息的数量计算得到的。为了便于理解,可以参照图4,图4中示意了三个通讯主题,依次为通讯主题401、通讯主题402和通讯主题403,其中,由于通讯主题401的热度高于通讯主题402的热度,通讯主题402的热度高于通讯主题403的热度,因此按照用户惯常的从左往右的阅读习惯(即先看左边后看右边的阅读习惯),从左往右依次显示通讯主题401、通讯主题402和通信主题403。
在一种可选的方案中,所述对所述通讯主题进行显示,可以包括:对所述通讯主题和摘要内容进行显示,其中,所述摘要内容为根据所述通讯主题相关联的目标即时通讯消息提取的。例如,直接从目标即时通讯消息中提取,或者对目标即时通讯消息进行处理之后再提取。对所述通讯主题和摘要内容进行显示的依旧是终端,显示的效果可以如图8所示,在通讯主题401下面显示该通信主题关联的摘要内容409,在通讯主题402下面显示该通信主题关联的摘要内容410,在通讯主题403下面显示该通信主题关联的摘要内容411。
在一种可选的方案中,所述对所述通讯主题进行显示之后,还包括:
终端根据新生成的满足所述预设条件的通讯内容生成一个或者多个第二事件,例如,对新生成的满足所述预设条件的即时通讯消息进行聚类,聚类可以基于密度的聚类算法DBSCAN来实现,聚类前,首先定义通讯内容之间关键词的距离,同样计算通讯内容的关键词pair(关键词对)间的命名实体、关键词、内容的相似性,加权计算得到通讯内容的距离;然后根据聚类后的每一类即时通讯消息确定一个事件,为了便于描述可以称此处确定的事件为第二事件。
若存在第二事件与前面提到的第一事件的相似度超过预设阈值,则将所述相似度超过所述预设阈值的所述第一事件和所述第二事件合并为一个事件。对于任意一个第二事件,使用事件关键词从IR(一种现有模型)中召回相似的第一事件,利用训练好的XGBoost分类模型,计算该第二事件与召回的第一事件的相似度。选择其中满足预设阈值且相似度最高的第一事件,与该第二事件合并;若无满足预设阈值的第一事件,则该第二事件为新事件,因此不与任何第一事件合并。可选的,两个事件的相似度可以具体为两个事件中关键词对对应的query的相似度,也可以为两个事件中标题的分词的相似度,也可以为两个事件中关键词的相似度,等等。
终端根据未合并的所述第一事件、未合并的第二事件和合并后的事件,确定新的通讯主题;可以理解的是,不同的事件可能是围绕同样的主题展开的,因此通过机器学习算法可以对一些不同的事件进行分析得出一个新的通讯主题。也即是说,随着即时通讯客户端中的即时通讯消息的实时更新,所涉及的事件也会更新,相应也会导致通讯主题的实时更新。
所述终端显示该新的通讯主题和以及与所述新的通讯主题相关联的目标即时通讯消息。
在一种可选的方案中,终端根据未合并的所述第一事件、未合并的第二事件和合并后的事件,确定新的通讯主题,可以具体为:先确定未合并的所述第一事件、未合并的所述第二事件和合并后的事件之间的脉络关系;可以理解,热点事件挖掘中,需要对多个关联事件聚合形成话题,称为大事件,在事件库中体现出来即为挖掘各个子事件中的脉络关联,通过多个角度的线索对事件进行关联,而线索可以转化成搜索相关性来解决。例如在百度新闻中搜索某事件,会出现很多最新发生的事件的新闻,这体现了该事件各个子事件之间的相关性,因而可以通过模型对事件脉络关联进行学习和判断。获得脉络关系之后,根据所述脉络关系从所述未合并的所述第一事件、未合并的所述第二事件和合并后的事件中提取摘要内容,并基于该摘要得到新的通讯主题。通过这种方式得到的新的通讯主题能够更好的反映事件的最新进展。
可选的,可以基于事件对应的query搜索脉络关系,例如,基于事件1对应的query和事件2的文本内容(doc)搜索脉络关系;可选的,还可以基于事件关键词(keyword)搜索脉络关系,例如,基于事件1的keyword和事件2的文本内容(doc)搜索脉络关系。对事件脉络关联进行学习和判断的模型可以为XGBoost模型,该模型进行学习是输入的样本可以为40个(当然也可以为其他数量,此处仅为举例)特征的样本。
在图2所示的方法中,根据至少一个会话标志对应的满足预设条件的即时通讯内容确定至少一个会话标识各自对应的通讯主题,然后将确定出的各个通讯主题和各个会话标识相对独立显示;这样一来,用户可以根据通讯主题快速获知每个会话标识表示的会话中的主旨内容,并且在用户对通讯主题进行操作后可以显示对应的满足预设条件的即时通讯内容,即用户能够很方便地获取到该通讯主题背后的详细信息;同时,由于各个通讯主题和各个会话标识相对独立显示,因此终端对通讯主题的显示并不妨碍用户采用传统方式对每个会话进行查看。
请参见图9,图9是本申请实施例提供的一种通讯内容处理方法的流程示意图,该方法可以由终端和服务器组成的架构来实现(如图1),该方法包括但不限于如下步骤。
步骤S901:服务器获取至少一个会话标识对应的满足预设条件的即时通讯消息。
具体地,在即时通讯客户端中一般支持群聊和单聊,群聊是针对一群人聊天的会话,单聊是针对某一个人的会话,每个会话都对应有各自的会话标识,任意一个会话的会话标识用于对该会话进行唯一标记和区分。会话标识对应的满足预设条件的即时通讯消息具体是指该会话标识所标记的会话中满足预设条件的通讯消息。
本申请实施例中,预设条件是根据需要预先配置,下面进行举例说明。
案例一,所述满足预设条件的即时通讯消息为处于预设时间段内的即时通讯消息,一种方案,该预设时间段可以为一个预先设定的固定长度(例如30分钟),其结束时间为当前时间。又一种方案,该预设时间段可以具体为从当前到上一次查看通讯主题(也称通讯内容的主题摘要)的这段时间。又一种方案,确定通讯主题是周期性进行的,该预设时间段为其中一个周期。
案例二,所述满足预设条件的即时通讯消息为未读的即时通讯消息。例如,即时通讯客户端已经接收到但未被用户读取的即时通讯消息。可以理解的是,用户针对每个会话的操作情况可以被检测到,因此哪些消息已读哪些消息未读是可以检测出来的。
案例三,所述满足预设条件的即时通讯消息为预先设定的通讯对象的即时通讯消息,该通讯对象可以是某个或者某一些特定的人物,例如,企业领导,男友,女友,闺蜜等,需要重点关注的对象都可以将其作为本申请中预先设定的通讯对象。这样一来,就可以针对性地获取到这些通讯对象的即时通讯消息。
案例四,所述满足预设条件的即时通讯消息为与预设关键词具有预设匹配关系的即时通讯消息。可选的,该预设匹配关系可以是相似关系,相似关系的确定有很多成熟的手段,此处不再展开描述。这里的预设关键词也是根据需要预先设定好的,例如,可以设置为“吃饭”、“打球”、“高考”等等。
案例五,所述满足预设条件的即时通讯消息为符合预设语义的即时通讯消息,其中,该预设语义可以为用户设定的,通过这种方式可以选择出与用户期望的语义相一致的即时通讯消息。
本申请实施例中,当上述至少一个会话标识具体为一个会话标识时,获取的就是一个会话标识对应的满足预设条件的即时通讯消息。当上述至少一个会话标识具体为多个会话标识时,获取的就是多个会话标识各自对应的满足预设条件的即时通讯消息,例如,该多个会话标识为会话标识1、会话标识2和会话标识3,那么,获取的就是会话标识1对应的满足预设条件的即时通讯消息,会话标识2对应的满足预设条件的即时通讯消息,以及会话标识3对应的满足预设条件的即时通讯消息。
步骤S902:服务器根据所述满足预设条件的即时通讯消息确定至少一个与所述至少一个会话标识一一对应的通讯主题以及与所述通讯主题相关联的目标即时通讯消息。
具体地,有多少个会话标识对应的满足预设条件的即时通讯消息,则相应地确定出多个通讯主题及与所述通讯主题相关联的目标即时通讯消息。举例来说,假若获取的了会话标识1对应的满足预设条件的即时通讯消息,会话标识2对应的满足预设条件的即时通讯消息,以及会话标识3对应的满足预设条件的即时通讯消息;那么,相应地根据会话标识1对应的满足预设条件的即时通讯消息确定会话标识1对应的通讯主题以及与该通讯主题相关联的目标即时通讯消息,根据会话标识2对应的满足预设条件的即时通讯消息确定会话标识2对应的通讯主题以及与该通讯主题相关联的目标即时通讯消息,根据会话标识3对应的满足预设条件的即时通讯消息确定会话标识3对应的通讯主题以及与该通讯主题相关联的目标即时通讯消息。
下面对根据满足预设条件的即时通讯消息确定通讯主题的方式进行介绍,可选的,可以根据满足预设条件的即时通讯消息确定所述该满足预设条件的即时通讯消息所描述的一个或者多个第一事件,通常来说,满足预设条件的通讯消息可能比较零散,通过相应算法(如机器学习算法)对这些零散的通讯内容进行处理可以得到这些零散的内容所描述的事件,得到的事件称为第一事件以方便后续描述,得到的第一事件可能为一个也可能为多个。然后,提取所述一个或者多个第一事件中的摘要以得到至少一个与所述至少一个会话标识一一对应的摘要内容,并根据至少一个与所述至少一个会话标识一一对应的摘要内容确定至少一个与所述至少一个会话标识一一对应的通讯主题。可以理解,根据会话标识1对应的满足预设条件的即时通讯消息确定的第一事件,用来提取摘要以生成该会话标识1对应的通讯主题;根据会话标识2对应的满足预设条件的即时通讯消息确定的第一事件,用来提取摘要以生成该会话标识2对应的通讯主题,其余依此类推。可以理解,对摘要内容进行提炼,以及对摘要内容按照语言逻辑进行编排就可以得到通讯主题。理想情况下,通讯主题的内容相对较短,信息浓缩度较高,描述了事件的主要信息。对应的事件描述的就是通讯主题背后的来龙去脉和各种细节内容。当然,未读的通讯内容中也可能会存在一些不理想的通讯内容(也称query),如“大闸蟹的最佳食用日期”,可能还需要后续的一些事件或者通讯消息与不理想的通讯消息进行结合分析才能确定出相关的通讯主题。以上讲述的就是生成了新的通讯主题的情况。
当然,也可能在此之前已经分析得到的一些通讯主题,因此在根据未读的通讯内容确定一个或者多个事件之后,直接根据该一个或者多个事件就可以查找到已有的通讯主题,而无需对该一个或者多个事件进行摘要提取来得到通讯主题。这种情况就相当于直接沿用已有的通讯主题。
可选的,是需要生成新的通讯主题还是沿用已有的通讯主题可以具体通过图3所示的流程进行判断:
步骤1、输入为一连串的query(一个query相当于一条通讯内容,一连串的query相当于时序上一连串的通讯内容)的时序PV数据,采用前端补0的方式对输入的时序数据补齐周期。比如,周期为10分钟(min),则输入的时序点必须为10min的整数倍。如果输入数据为15min,则前端补零,补成90min。
步骤2、时序平滑和分段,采取累计pv的方式。这一步的目的是减少毛刺。比如,10min作为一个周期,输入数据为8个间隔5min的数据点,那么这8个间隔5min的数据点会被平滑为4个间隔10min的数据点。
步骤3、对时序数据的每个数据点,计算该数据点的动量,计算公式如下:
步骤4、对计算得到的动量序列,计算最大子序列 。最大子序列的开始点 ,作为第一个突发时间点。最大子序列的结束点,作为突发结束的时间点。
步骤5、计算最大子序列结束点与最大子序列开始点的动量差,若动量差大于预先设定的动量阈值,则最大子序列结束点对应的query被判断为突发query。如果该最大子序列结束点对应的query被判断为突发query,那么表明有新的通讯主题产生,因此要根据满足预设条件的即时通讯消息生成一个或者多个事件,并根据该一个或者多个事件生成新的通讯主题;如果该最大子序列结束点对应的query未被判断为突发query,那么表明没有新的通讯主题产生,因此根据满足预设条件的即时通讯消息生成一个或者多个事件,然就根据一个或者多个事件找到已有的通讯主题即可。
本申请实施例中,与每个通讯主题关联的目标即时通讯消息可以具体为确定该通信主题时所用到的满足预设条件的即时通讯消息。例如,与通讯主题1关联的目标即时通讯消息为确定该通信主题1时所用到的满足预设条件的即时通讯内容,即通讯主题1对应的会话标识所对应的满足预设条件的即时通讯内容。与通讯主题2关联的目标即时通讯消息为确定该通信主题2时所用到的满足预设条件的即时通讯内容,即通讯主题2对应的会话标识所对应的满足预设条件的即时通讯内容。进一步地,所述目标即时通讯消息包括消息内容和消息发送对象,用于用户识别哪条消息是哪个用户发送的。例如,该目标即时通讯消息包括消息内容1、消息内容2和消息内容3,且标记了消息内容1是由聊天对象A发送的,消息内容2是由聊天对象B发送的,消息内容3是由聊天对象A发送的。
在一种可选的方案中,若前面确定出的至少一个通讯主题为多个通讯主题,则根据上述至少一个会话标识各自标识的会话中满足预设条件的即时通讯消息确定该多个通讯主题的热度,对应的会话标识所表示的会话中满足所述预设条件的即时通讯消息越多的通讯主题的热度越高,例如,通讯主题1对应的会话标识所表示的会话中满足预设条件的即时通讯消息数量多于通讯主题2对应的会话标识所表示的会话中满足预设条件的即时通讯消息数量,则认为通讯主题1的热度高于通讯主题2的热度。后续在对多个通讯主题进行显示时,可以将热度高的通讯主题显示在显眼或者靠前的区域。
步骤S903:服务器对所述通讯主题进行显示。
具体地,其中所述通讯主题或所述通讯主题形成的通讯主题集合标识与所述至少一个会话标识相对独立。为了便于理解,下面进行举例说明。
案例一,所述通讯主题与所述至少一个会话标识相对独立,如图4所示,显示了三个通讯主题,分别为通讯主题401、通讯主题402和通讯主题403,另外,还显示了三个会话标识,分别为会话标识404、会话标识405和会话标识406,可以看出,通讯主题和会话标识是相对独立显示的。可选的,通讯主题401对应会话标识404、通讯主题402对应会话标识405、通讯主题403对应会话标识406。
案例二,所述通讯主题形成的通讯主题集合标识与所述至少一个会话标识相对独立,如图5所示,显示了所述通讯主题形成的通讯主题集合标识407,以及显示了三个会话标识,分别为会话标识404、会话标识405和会话标识406,可以看出,通讯主题集合标识和会话标识是相对独立显示的。当用户对通讯主题集合标识407进行触控点击时,进一步显示图4所示的界面,即向用户呈现通讯主题集合内的各个通讯主题,如通讯主题401、通讯主题402和通信主题403。
可选的,该服务器对通讯主题进行显示可以为该服务器将该通讯主题发送给终端,由终端来进行显示。
本申请实施例中,终端向用户显示通讯主题之后,还可以进一步与用户进行交互,例如,终端接收针对显示的所述通讯主题中的目标通讯主题的选择操作,可以理解,这里存在至少一个通讯主题,当用户选择其中哪个通讯主题,则该通信主题为此处的目标通讯主题,用户可以通过触控、声控、物理按键控制等方式执行选择,例如,对其中某个通讯主题所显示的位置进行触控点击则可以实现对该某个通讯主题的选择。然后,终端响应所述选择操作,显示与所述目标通讯主题相关联的所述目标即时通讯消息。举例来说,如图6所示,用户触控点击通讯主题401所显示的位置,相应地,如图7所示,终端显示与通讯主题401关联的目标即时通讯消息408,在目标即时通讯消息408中,“我今天发表了两篇沦为,请大家吃饭”属于消息内容,“好友A”属于消息发送对象,用于表明“我今天发表了两篇沦为,请大家吃饭”是“好友A”发送的。目标即时通讯消息408中的还存在其他消息内容和消息发送对象,此处不一一举例。
在一种可选的方案中,当需要显示的通讯主题的数量为多个通讯主题的时候,所述对所述通讯主题进行显示,可以包括:对所述多个通讯主题按照顺序进行显示,其中,对应的会话标识所表示的会话中满足所述预设条件的即时通讯消息越多的通讯主题的排序越靠前。在前面已经介绍过,可以计算每个通讯主题的热度,这里对多个通讯主题按照顺序进行显示就是按照热度来的,热度越高的显示越显眼或者越靠前,热度是根据对应的会话中满足预设条件的即时通讯消息的数量计算得到的。为了便于理解,可以参照图4,图4中示意了三个通讯主题,依次为通讯主题401、通讯主题402和通讯主题403,其中,由于通讯主题401的热度高于通讯主题402的热度,通讯主题402的热度高于通讯主题403的热度,因此按照用户惯常的从左往右的阅读习惯(即先看左边后看右边的阅读习惯),从左往右依次显示通讯主题401、通讯主题402和通信主题403。
在一种可选的方案中,所述对所述通讯主题进行显示,可以包括:对所述通讯主题和摘要内容进行显示,其中,所述摘要内容为根据所述通讯主题相关联的目标即时通讯消息提取的。例如,直接从目标即时通讯消息中提取,或者对目标即时通讯消息进行处理之后再提取。对所述通讯主题和摘要内容进行显示的依旧是终端,显示的效果可以如图8所示,在通讯主题401下面显示该通信主题关联的摘要内容409,在通讯主题402下面显示该通信主题关联的摘要内容410,在通讯主题403下面显示该通信主题关联的摘要内容411。
在一种可选的方案中,所述对所述通讯主题进行显示之后,还包括:
服务器根据新生成的满足所述预设条件的通讯内容生成一个或者多个第二事件,例如,对新生成的满足所述预设条件的即时通讯消息进行聚类,聚类可以基于密度的聚类算法DBSCAN来实现,聚类前,首先定义通讯内容之间关键词的距离,同样计算通讯内容的关键词pair(关键词对)间的命名实体、关键词、内容的相似性,加权计算得到通讯内容的距离;然后根据聚类后的每一类即时通讯消息确定一个事件,为了便于描述可以称此处确定的事件为第二事件。
若存在第二事件与前面提到的第一事件的相似度超过预设阈值,则将所述相似度超过所述预设阈值的所述第一事件和所述第二事件合并为一个事件。对于任意一个第二事件,使用事件关键词从IR(一种现有模型)中召回相似的第一事件,利用训练好的XGBoost分类模型,计算该第二事件与召回的第一事件的相似度。选择其中满足预设阈值且相似度最高的第一事件,与该第二事件合并;若无满足预设阈值的第一事件,则该第二事件为新事件,因此不与任何第一事件合并。可选的,两个事件的相似度可以具体为两个事件中关键词对对应的query的相似度,也可以为两个事件中标题的分词的相似度,也可以为两个事件中关键词的相似度,等等。
服务器根据未合并的所述第一事件、未合并的第二事件和合并后的事件,确定新的通讯主题;可以理解的是,不同的事件可能是围绕同样的主题展开的,因此通过机器学习算法可以对一些不同的事件进行分析得出一个新的通讯主题。也即是说,随着即时通讯客户端中的即时通讯消息的实时更新,所涉及的事件也会更新,相应也会导致通讯主题的实时更新。
服务器向所述终端发送所述新的通讯主题和以及与所述新的通讯主题相关联的目标即时通讯消息,相应地,所述终端接收该新的通讯主题和以及与所述新的通讯主题相关联的目标即时通讯消息,然后将这些信息进行显示。
在一种可选的方案中,服务器根据未合并的所述第一事件、未合并的第二事件和合并后的事件,确定新的通讯主题,可以具体为:先确定未合并的所述第一事件、未合并的所述第二事件和合并后的事件之间的脉络关系;可以理解,热点事件挖掘中,需要对多个关联事件聚合形成话题,称为大事件,在事件库中体现出来即为挖掘各个子事件中的脉络关联,通过多个角度的线索对事件进行关联,而线索可以转化成搜索相关性来解决。例如在百度新闻中搜索某事件,会出现很多最新发生的事件的新闻,这体现了该事件各个子事件之间的相关性,因而可以通过模型对事件脉络关联进行学习和判断。获得脉络关系之后,根据所述脉络关系从所述未合并的所述第一事件、未合并的所述第二事件和合并后的事件中提取摘要内容,并基于该摘要得到新的通讯主题。通过这种方式得到的新的通讯主题能够更好的反映事件的最新进展。
可选的,可以基于事件对应的query搜索脉络关系,例如,基于事件1对应的query和事件2的文本内容(doc)搜索脉络关系;可选的,还可以基于事件关键词(keyword)搜索脉络关系,例如,基于事件1的keyword和事件2的文本内容(doc)搜索脉络关系。对事件脉络关联进行学习和判断的模型可以为XGBoost模型,该模型进行学习是输入的样本可以为40个(当然也可以为其他数量,此处仅为举例)特征的样本。
在图9所示的方法中,根据至少一个会话标志对应的满足预设条件的即时通讯内容确定至少一个会话标识各自对应的通讯主题,然后将确定出的各个通讯主题和各个会话标识相对独立显示;这样一来,用户可以根据通讯主题快速获知每个会话标识表示的会话中的主旨内容,并且在用户对通讯主题进行操作后可以显示对应的满足预设条件的即时通讯内容,即用户能够很方便地获取到该通讯主题背后的详细信息;同时,由于各个通讯主题和各个会话标识相对独立显示,因此终端对通讯主题的显示并不妨碍用户采用传统方式对每个会话进行查看。
上述详细阐述了本申请实施例的方法,下面提供了本申请实施例的装置。
请参见图10,图10是本申请实施例提供的一种通讯内容处理装置100的结构示意图,该装置可以为图2所示的方法实施例中的终端。该装置100可以包括获取单元1001、第一确定单元1002和显示单元1003,其中,各个单元的详细描述如下。
获取单元1001,用于获取至少一个会话标识对应的满足预设条件的即时通讯消息;
第一确定单元1002,用于根据所述满足预设条件的即时通讯消息确定至少一个与所述至少一个会话标识一一对应的通讯主题以及与所述通讯主题相关联的目标即时通讯消息,其中所述目标即时通讯消息包括消息内容和消息发送对象;
显示单元1003,用于对所述通讯主题进行显示,其中所述通讯主题或所述通讯主题形成的通讯主题集合标识与所述至少一个会话标识相对独立。
可选的,所述满足预设条件的即时通讯消息为:处于预设时间段内的即时通讯消息,或者为未读的即时通讯消息,或者为预先设定的通讯对象的即时通讯消息,或者为与预设关键词具有预设匹配关系的即时通讯消息。
可选的,所述装置100还包括:
接收单元,用于在所述显示单元1003对所述通讯主题进行显示之后,接收针对显示的所述通讯主题中的目标通讯主题的选择操作;
响应单元,用于响应所述选择操作,显示与所述目标通讯主题相关联的所述目标即时通讯消息。
可选的,所述显示单元1003,用于对所述通讯主题进行显示,具体为包括:
对所述通讯主题和摘要内容进行显示,其中,所述摘要内容为根据所述通讯主题相关联的目标即时通讯消息提取的。
可选的,若确定出的通讯主题为多个通讯主题;所述显示单元1003,用于对所述通讯主题进行显示,具体为:
对所述多个通讯主题按照顺序进行显示,其中,对应的会话标识所表示的会话中满足所述预设条件的即时通讯消息越多的通讯主题的排序越靠前。
可选的,所述第一确定单元,用于根据所述满足预设条件的即时通讯消息确定至少一个与所述至少一个会话标识一一对应的通讯主题,具体为:
确定所述满足预设条件的即时通讯消息所描述的一个或者多个第一事件;
提取所述一个或者多个第一事件中的摘要以得到至少一个与所述至少一个会话标识一一对应的摘要内容;
根据至少一个与所述至少一个会话标识一一对应的摘要内容确定至少一个与所述至少一个会话标识一一对应的通讯主题。
可选的,所述显示单元1003,用于对所述通讯主题进行显示,具体为:
向设备发送所述通讯主题以及与所述通讯主题相关联的目标即时通讯消息,以供所述设备进行显示。
可选的,还包括:
生成单元,用于在所述显示单元1003对所述通讯主题进行显示之后,根据新生成的满足所述预设条件的即时通讯消息生成一个或者多个第二事件;
合并单元,用于在存在第二事件与所述第一事件的相似度超过预设阈值的情况下,将所述相似度超过所述预设阈值的所述第一事件和所述第二事件合并为一个事件;
第二确定单元,用于根据未合并的所述第一事件、未合并的所述第二事件和合并后的事件,确定新的通讯主题以及与所述新的通讯主题相关联的目标即时通讯消息;
所述显示单元1003,还用于对所述新的通讯主题进行显示。
需要说明的是,各个单元的实现还可以对应参照图2所示的方法实施例的相应描述。
在图10所描述的装置100中,根据至少一个会话标志对应的满足预设条件的即时通讯内容确定至少一个会话标识各自对应的通讯主题,然后将确定出的各个通讯主题和各个会话标识相对独立显示;这样一来,用户可以根据通讯主题快速获知每个会话标识表示的会话中的主旨内容,并且在用户对通讯主题进行操作后可以显示对应的满足预设条件的即时通讯内容,即用户能够很方便地获取到该通讯主题背后的详细信息;同时,由于各个通讯主题和各个会话标识相对独立显示,因此终端对通讯主题的显示并不妨碍用户采用传统方式对每个会话进行查看。
请参见图11,图11是本申请实施例提供的一种通讯内容处理装置110的结构示意图,该装置110可以为图9所示的终端,该装置110可以包括第一接收单元1101和显示单元1102,其中,各个单元的详细描述如下。
第一接收单元1101,用于接收服务器发送的至少一个与至少一个会话标识一一对应的通讯主题以及与所述通讯主题相关联的目标即时通讯消息,其中所述目标即时通讯消息包括消息内容和消息发送对象;
显示单元1102,用于显示所述通讯主题,其中所述通讯主题或所述通讯主题形成的通讯主题集合标识与所述至少一个会话标识相对独立。
可选的,所述装置110还包括:
第二接收单元,用于在所述显示单元显示所述通讯主题之后,接收针对显示的所述通讯主题中的目标通讯主题的选择操作;
响应单元,用于响应所述选择操作,显示与所述目标通讯主题相关联的所述目标即时通讯消息。
可选的,所述显示单元1102,用于显示所述通讯主题,具体为:
显示所述通讯主题和摘要内容,其中,所述摘要内容为根据所述通讯主题相关联的目标即时通讯消息提取的。
需要说明的是,各个单元的实现还可以对应参照图9所示的方法实施例的相应描述。
在图11所描述的终端110中,根据至少一个会话标志对应的满足预设条件的即时通讯内容确定至少一个会话标识各自对应的通讯主题,然后将确定出的各个通讯主题和各个会话标识相对独立显示;这样一来,用户可以根据通讯主题快速获知每个会话标识表示的会话中的主旨内容,并且在用户对通讯主题进行操作后可以显示对应的满足预设条件的即时通讯内容,即用户能够很方便地获取到该通讯主题背后的详细信息;同时,由于各个通讯主题和各个会话标识相对独立显示,因此终端对通讯主题的显示并不妨碍用户采用传统方式对每个会话进行查看。
请参见图12,图12是本申请实施例提供的又一种装置120的结构示意图。如图12所示,该装置120可以为图2所示的方法实施例中的终端,该装置120可以包括:处理器1201,网络接口1204和存储器1205,此外,该装置120还可以包括:用户接口1203,和至少一个通信总线1202。其中,通信总线1202用于实现这些组件之间的连接通信。其中,用户接口1203可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1203还可以包括标准的有线接口、无线接口。网络接口1204可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1204可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1205可选的还可以是至少一个位于远离前述处理器1201的存储装置。如图12所示,作为一种计算机可读存储介质的存储器1205中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在如图12所示的装置120中,网络接口1204可提供网络通讯功能;而用户接口1203主要用于为用户提供输入的接口;而处理器1201可以用于调用存储器1205中存储的设备控制应用程序,以实现上述图2所对应实施例中对所述通讯内容处理方法的描述,这里不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
请参见图13,图13是本申请实施例提供的又一种装置130的结构示意图。如图13所示,该装置130可以为图9所示的方法实施例中的终端,该装置130可以包括:处理器1301,网络接口1304和存储器1305,此外,该终端130还可以包括:用户接口1303,和至少一个通信总线1302。其中,通信总线1302用于实现这些组件之间的连接通信。其中,用户接口1303可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1303还可以包括标准的有线接口、无线接口。网络接口1304可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1304可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1305可选的还可以是至少一个位于远离前述处理器1301的存储装置。如图13所示,作为一种计算机可读存储介质的存储器1305中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在如图13所示的装置130中,网络接口1304可提供网络通讯功能;而用户接口1303主要用于为用户提供输入的接口;而处理器1301可以用于调用存储器1305中存储的设备控制应用程序,以实现上述图9所对应实施例中对所述通讯内容处理方法的描述,这里不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且所述计算机可读存储介质中存储有前文提及的服务器或者终端所执行的计算机程序,且所述计算机程序包括程序指令,当所述处理器执行所述程序指令时,能够执行前文图2或图9所对应实施例中对所述通讯内容处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储存储器(Read-Only Memory,ROM)或随机存储存储器(Random AccessMemory,RAM)等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。
Claims (12)
1.一种通讯内容处理方法,其特征在于,包括:
获取至少一个会话标识对应的满足预设条件的即时通讯消息;
根据所述满足预设条件的即时通讯消息确定至少一个与所述至少一个会话标识一一对应的通讯主题以及与所述通讯主题相关联的目标即时通讯消息,其中所述目标即时通讯消息包括消息内容和消息发送对象;
对所述通讯主题进行显示,其中所述通讯主题或所述通讯主题形成的通讯主题集合标识与所述至少一个会话标识所标记的会话相对独立显示;
接收针对显示的所述通讯主题中的目标通讯主题的选择操作;
响应所述选择操作,显示与所述目标通讯主题相关联的所述目标即时通讯消息;
所述对所述通讯主题进行显示之后,还包括:
接收新生成的满足所述预设条件的即时通讯消息;
获取所述新生成的满足所述预设条件的即时通讯消息的时序数据;
对所述时序数据进行预处理,所述预处理包括时序平滑和时序分段;
计算预处理后的时序数据的动量序列,并计算所述动量序列的最大子序列;
计算所述最大子序列的结束点与开始点之间的动量差,若所述动量差大于预设的动量阈值,则根据所述新生成的满足所述预设条件的即时通讯消息确定新的通讯主题。
2.根据权利要求1所述的方法,其特征在于,所述满足预设条件的即时通讯消息为:处于预设时间段内的即时通讯消息,或者为未读的即时通讯消息,或者为预先设定的通讯对象的即时通讯消息,或者为与预设关键词具有预设匹配关系的即时通讯消息。
3.根据权利要求1或2所述的方法,其特征在于,所述对所述通讯主题进行显示,包括:
对所述通讯主题和摘要内容进行显示,其中,所述摘要内容为根据所述通讯主题相关联的目标即时通讯消息提取的。
4.根据权利要求1或2所述的方法,其特征在于,若确定出的通讯主题为多个通讯主题;所述对所述通讯主题进行显示,包括:
对所述多个通讯主题按照顺序进行显示,其中,对应的会话标识所表示的会话中满足所述预设条件的即时通讯消息越多的通讯主题的排序越靠前。
5.根据权利要求1或2所述的方法,其特征在于,所述根据所述满足预设条件的即时通讯消息确定至少一个与所述至少一个会话标识一一对应的通讯主题,包括:
确定所述满足预设条件的即时通讯消息所描述的一个或者多个第一事件;
提取所述一个或者多个第一事件中的摘要以得到至少一个与所述至少一个会话标识一一对应的摘要内容;
根据至少一个与所述至少一个会话标识一一对应的摘要内容确定至少一个与所述至少一个会话标识一一对应的通讯主题。
6.根据权利要求1或2所述的方法,其特征在于,所述对所述通讯主题进行显示,包括:
向设备发送所述通讯主题以及与所述通讯主题相关联的目标即时通讯消息,以供所述设备进行显示。
7.根据权利要求5所述的方法,其特征在于,所述对所述通讯主题进行显示之后,还包括:
根据新生成的满足所述预设条件的即时通讯消息生成一个或者多个第二事件;
若存在第二事件与所述第一事件的相似度超过预设阈值,则将所述相似度超过所述预设阈值的所述第一事件和所述第二事件合并为一个事件;
根据未合并的所述第一事件、未合并的所述第二事件和合并后的事件,确定新的通讯主题以及与所述新的通讯主题相关联的目标即时通讯消息;
对所述新的通讯主题进行显示。
8.一种通讯内容处理方法,其特征在于,包括:
接收服务器发送的至少一个与至少一个会话标识一一对应的通讯主题以及与所述通讯主题相关联的目标即时通讯消息,其中所述目标即时通讯消息包括消息内容和消息发送对象;
显示所述通讯主题,其中所述通讯主题或所述通讯主题形成的通讯主题集合标识与所述至少一个会话标识所标记的会话相对独立显示;
接收针对显示的所述通讯主题中的目标通讯主题的选择操作;
响应所述选择操作,显示与所述目标通讯主题相关联的所述目标即时通讯消息;
所述显示所述通讯主题之后,还包括:
显示新的通讯主题,所述新的通讯主题是所述服务器接收新生成的满足预设条件的即时通讯消息,获取所述新生成的满足预设条件的即时通讯消息的时序数据,对所述时序数据进行预处理,所述预处理包括时序平滑和时序分段,计算预处理后的时序数据的动量序列,并计算所述动量序列的最大子序列,计算所述最大子序列的结束点与开始点之间的动量差,在所述动量差大于预设的动量阈值的情况下,根据所述新生成的满足预设条件的即时通讯消息确定的。
9.根据权利要求8所述的方法,其特征在于,所述显示所述通讯主题,包括:
显示所述通讯主题和摘要内容,其中,所述摘要内容为根据所述通讯主题相关联的目标即时通讯消息提取的。
10.一种通讯内容处理装置,其特征在于,包括:处理器和存储器;
所述处理器和存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行如权利要求1-7任一项所述的方法。
11.一种通讯内容处理装置,其特征在于,包括:处理器和存储器;
所述处理器和存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行如权利要求8或9所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1-9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910961938.2A CN112650595B (zh) | 2019-10-11 | 2019-10-11 | 一种通讯内容处理方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910961938.2A CN112650595B (zh) | 2019-10-11 | 2019-10-11 | 一种通讯内容处理方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112650595A CN112650595A (zh) | 2021-04-13 |
CN112650595B true CN112650595B (zh) | 2023-06-23 |
Family
ID=75343589
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910961938.2A Active CN112650595B (zh) | 2019-10-11 | 2019-10-11 | 一种通讯内容处理方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112650595B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113595886A (zh) * | 2021-07-29 | 2021-11-02 | 北京达佳互联信息技术有限公司 | 即时通讯消息的处理方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105141502A (zh) * | 2015-08-12 | 2015-12-09 | 深圳前海珩昌科技有限公司 | 一种即时通信过程的管理方法及装置 |
CN107566255A (zh) * | 2017-09-06 | 2018-01-09 | 叶进蓉 | 未读消息摘要生成方法及装置 |
CN109857290A (zh) * | 2018-12-24 | 2019-06-07 | 维沃移动通信有限公司 | 一种未读内容显示方法及终端设备 |
CN110138645A (zh) * | 2019-03-29 | 2019-08-16 | 腾讯科技(深圳)有限公司 | 会话消息的显示方法、装置、设备及存储介质 |
-
2019
- 2019-10-11 CN CN201910961938.2A patent/CN112650595B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105141502A (zh) * | 2015-08-12 | 2015-12-09 | 深圳前海珩昌科技有限公司 | 一种即时通信过程的管理方法及装置 |
CN107566255A (zh) * | 2017-09-06 | 2018-01-09 | 叶进蓉 | 未读消息摘要生成方法及装置 |
CN109857290A (zh) * | 2018-12-24 | 2019-06-07 | 维沃移动通信有限公司 | 一种未读内容显示方法及终端设备 |
CN110138645A (zh) * | 2019-03-29 | 2019-08-16 | 腾讯科技(深圳)有限公司 | 会话消息的显示方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112650595A (zh) | 2021-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106202095B (zh) | 群组消息显示方法及装置 | |
JP7283067B2 (ja) | 通信プラットフォームにおける割り込み会話のデタングル化システムと方法、非構造化メッセージを解析する方法、プログラム、及びコンピュータ装置 | |
CN103279513B (zh) | 产生内容标签的方法、提供多媒体内容信息的方法及装置 | |
CN107229645B (zh) | 信息处理方法、服务平台及客户端 | |
JP2019212290A (ja) | ビデオを処理する方法及び装置 | |
WO2016150083A1 (zh) | 一种信息输入方法和装置 | |
CN111767396B (zh) | 数据处理方法、装置、设备及计算机可读存储介质 | |
CN103902535B (zh) | 获取联想词的方法、装置及系统 | |
US20120316972A1 (en) | Intelligent feature expansion of online text ads | |
CN110209810B (zh) | 相似文本识别方法以及装置 | |
CN108768824B (zh) | 信息处理方法及装置 | |
CN113569037A (zh) | 一种消息处理方法、装置以及可读存储介质 | |
CN111368063B (zh) | 一种基于机器学习的信息推送方法以及相关装置 | |
CN113779381B (zh) | 资源推荐方法、装置、电子设备和存储介质 | |
WO2021190470A1 (zh) | 电子设备定位的方法、装置、服务器、系统以及存储介质 | |
CN110233745A (zh) | 管理群消息的方法及装置 | |
CN116016421A (zh) | 促进在计算装置中执行的基于媒体的内容共享的方法、计算装置可读存储介质以及计算装置 | |
CN109558531A (zh) | 新闻信息推送方法、装置以及计算机设备 | |
CN113626624B (zh) | 一种资源识别方法和相关装置 | |
CN112650595B (zh) | 一种通讯内容处理方法及相关装置 | |
CN114338586A (zh) | 一种消息推送方法、装置、电子设备及存储介质 | |
CN106202222B (zh) | 热点事件的确定方法及装置 | |
CN106487653B (zh) | 一种消息处理方法及服务器 | |
CN111666498A (zh) | 一种基于互动信息的好友推荐方法、相关装置及存储介质 | |
CN111831938A (zh) | 信息显示方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40041961 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |