CN112765364A - 群聊会话排序方法、装置、存储介质和电子设备 - Google Patents
群聊会话排序方法、装置、存储介质和电子设备 Download PDFInfo
- Publication number
- CN112765364A CN112765364A CN202110071404.XA CN202110071404A CN112765364A CN 112765364 A CN112765364 A CN 112765364A CN 202110071404 A CN202110071404 A CN 202110071404A CN 112765364 A CN112765364 A CN 112765364A
- Authority
- CN
- China
- Prior art keywords
- information
- group chat
- feature information
- group
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000004927 fusion Effects 0.000 claims abstract description 42
- 238000012545 processing Methods 0.000 claims description 29
- 238000004891 communication Methods 0.000 claims description 19
- 230000002427 irreversible effect Effects 0.000 claims description 18
- 238000012512 characterization method Methods 0.000 claims description 15
- 238000012163 sequencing technique Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 238000013503 de-identification Methods 0.000 claims description 10
- 108091026890 Coding region Proteins 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 4
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002354 daily effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000586 desensitisation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请提供了一种群聊会话排序方法和装置、存储介质和电子设备,其中,该方法包括:获取群聊信息,所述群聊信息包括群聊会话内容、群用户属性信息和群用户之间的关系图谱,所述关系图谱基于历史群聊会话内容构建;分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息;针对群聊中每一用户基于所述语义特征信息、所述第一特征信息和所述第二特征信息进行加权融合得到用户融合特征信息;基于所述融合特征信息对用户进行排序通过本申请,解决了相关技术中存在在多个未读的群聊信息中难以定位到重要的信息的问题。
Description
技术领域
本申请涉及互联网领域,尤其涉及一种群聊会话排序方法、装置、存储介质和电子设备。
背景技术
随着互联网的发展,网络社交工具(如微信、企业微信等)已经在人们的日常生活和工作中的普及度越来越高,同时也为人们的生活和工作带来了极大的便利。在我们使用聊天工具及办公软件的过程中,不可避免的会加入到很多的群聊之中,因此每天都会收到大量的信息,对于每天收到的大量群聊数据,往往与我们相关的数据并不是很多。因此,本文主要目的是通过对聊天数据与用户的相关度进行排序,以使用户能及时看到对自己最重要的信息,同时在处理过程中将用户的隐私信息保护起来,以保证数据安全。对于现存的社交软件,对于群聊信息的处理,大多的社交软件只显示有多少条未读消息,而不存在对消息进行智能排序的情况。同时现有的大多数文本序列排序的算法只是利用了文本的局部特征,或者针对性的某一特征进行的文本的重要程度排序,因此对于不同的用户不能完全的定制化并动态的体现出文本内容以及其附属关系综合的重要性表示。容易导致用户在多个未读的群聊信息中难以定位到重要的信息,影响用户沟通效率。
发明内容
本申请提供了一种群聊会话排序方法和装置、存储介质和电子设备,以至少解决相关技术中存在在多个未读的群聊信息中难以定位到重要的信息的问题。
根据本申请实施例的一个方面,提供了一种群聊会话排序方法,包括:获取群聊信息,所述群聊信息包括群聊会话内容、群用户属性信息和群用户之间的关系图谱,所述关系图谱基于历史群聊会话内容构建;分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息;针对群聊中每一用户基于所述语义特征信息、所述第一特征信息和所述第二特征信息进行加权融合得到用户融合特征信息;基于所述融合特征信息对用户进行排序。
可选地,所述分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息包括:基于双向长短期记忆网络模型提取会话内容中的语义特征信息;基于transformer模型提取群用户属性信息中的第一特征信息;基于图卷积网络提取所述关系图谱中的第二特征信息。
可选地,在所述分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息之前包括:基于隐私保护模型对所述群聊信息进行不可逆表征处理,分别得到对应的不可逆的实体编码。
可选地,所述基于隐私保护模型对所述群聊信息进行不可逆表征处理,得到不可逆的实体编码包括:A.对所述群聊信息进行编码,得到编码序列;B.基于去识别化模型对所述序列编码进行去识别化处理得到特征序列;C.计算所述特征序列和所述编码序列的相似度;D.将相似度大于预设相似度的对应的群聊信息加入噪声,并重复执行步骤A-D,直至所述相似度小于预设相似度,得到所述不可逆的实体编码。
可选地,所述对所述群聊信息进行编码,得到编码序列包括:将上述群聊信息通过Embedding进行编码,得到编码信息;将所述编码信息通过表征模型进行表征处理,生成所述编码序列。
可选地,所述针对群聊中每一用户基于所述语义特征信息、所述第一特征信息和所述第二特征信息进行加权融合得到用户融合特征信息包括:将所述语义特征信息、所述第一特征信息和所述第二特征信息通过非线性映射函数进行处理,得到用户融合特征信息。
可选地,基于所述融合特征信息对用户进行排序包括:针对获取当前用户所述群聊信息和所述当前用户的群聊未读数据;基于所述群聊未读数据获取所述群聊未读数据对应的用户的融合特征信息;基于所述当前用户的群聊信息和群聊未读数据对应的用户的融合特征信息对群聊未读数据对应的用户进行评分;按照所述评分对所述群聊未读数据对应的用户进行排序。
根据本申请实施例的又一个方面,还提供了一种群聊会话排序装置,包括:获取模块,用于获取群聊信息,所述群聊信息包括群聊会话内容、群用户属性信息和群用户之间的关系图谱,所述关系图谱基于历史群聊会话内容构建;提取模块,用于分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息;融合模块,用于针对群聊中每一用户基于所述语义特征信息、所述第一特征信息和所述第二特征信息进行加权融合得到用户融合特征信息;排序模块,用于基于所述融合特征信息对用户进行排序。
根据本申请实施例的又一个方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;其中,存储器,用于存储计算机程序;处理器,用于通过运行所述存储器上所存储的所述计算机程序来执行上述任一实施例中的方法步骤。
根据本申请实施例的又一个方面,还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一实施例中的方法步骤。
在本申请中,通过同时获取群聊信息包括群聊会话内容、群用户属性信息和群用户之间的关系图谱,并分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息;对上述信息进行融合,基于融合特征信息对用户进行排序,可以综合了各个维度的特征数据,保证了结果的精确性,使聊天会话进行定制化的重要性排序,以便于当用户的群聊中存在多条未读信息时,可以很快的定位到对自己来说重要的信息,可以高效的对时间进行利用以及对资源进行分配。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种可选的群聊会话排序方法的硬件环境的示意图;
图2是根据本申请实施例的一种可选的群聊会话排序方法的流程示意图;
图3是根据本申请实施例的一种可选的群聊会话排序方法的示意图;
图4是根据本申请实施例的一种可选的群聊会话排序装置的结构框图;
图5是根据本申请实施例的一种可选的电子设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一个方面,提供了一种群聊会话排序方法。可选地,在本实施例中,上述群聊会话排序法可以应用于如图1所示的硬件环境中。如图1所示,
根据本申请实施例的一个方面,提供了一种群聊会话排序方法。可选地,在本实施例中,上述群聊会话排序方法可以应用于如图1所示的由终端102和服务器104所构成的硬件环境中。如图1所示,服务器104通过网络与终端102进行连接,可用于为终端或终端上安装的客户端提供服务(如游戏服务、应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器104提供数据存储服务,还可以用于处理云服务,上述网络包括但不限于:广域网、城域网或局域网,终端102并不限定于PC、手机、平板电脑等。本申请实施例的群聊会话排序方法可以由服务器104来执行,也可以由终端102来执行,还可以是由服务器104和终端102共同执行。其中,终端102执行本申请实施例的群聊会话排序方法也可以是由安装在其上的客户端来执行。
以由服务器104和/或终端102来执行本实施例中的群聊会话排序方法为例,图2是根据本申请实施例的一种可选的群聊会话排序方法的流程示意图,如图2所示,该方法的流程可以包括以下步骤:
步骤S202,获取群聊信息。所述群聊信息包括群聊会话内容、群用户属性信息和群用户之间的关系图谱,所述关系图谱基于历史群聊会话内容构建。
步骤S204,分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息。
步骤S206,针对群聊中每一用户基于所述语义特征信息、所述第一特征信息和所述第二特征信息进行加权融合得到用户融合特征信息。
步骤S208,基于所述融合特征信息对用户进行排序。
通过上述步骤S202至步骤S206,通过同时获取群聊信息包括群聊会话内容、群用户属性信息和群用户之间的关系图谱,并分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息;对上述信息进行融合,基于融合特征信息对用户进行排序,可以综合了各个维度的特征数据,保证了结果的精确性,使聊天会话进行定制化的重要性排序,以便于当用户的群聊中存在多条未读信息时,可以很快的定位到对自己来说重要的信息,可以高效的对时间进行利用以及对资源进行分配。
在步骤S202的技术方案中,群聊信息包括群聊会话内容、群用户属性信息和群用户之间的关系图谱,所述关系图谱基于历史群聊会话内容构建。作为示例性的实施例,会话内容可以包括群聊信息中的各个用户发送或当前用户接收到的会话消息,群用户属性信息可以包括用户的基础信息,例如,姓名、年龄、性别、职位以及与当前用户的关系等基础个人信息。所称群用户之间的关系图谱可以历史群聊会话内容构建,示例性的,可以解析历史群聊会话内容中的语义信息,以及上下文信息,并基于语义信息和上下文信息挖掘参与群聊的用户之间的关系特征,例如,可以按照用户在群聊中的发送会话信息的顺序或会话内容实体等确定用户之间的关系图谱。
在步骤S204的技术方案中,分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息。示例性的,可以基于双向长短期记忆网络模型提取会话内容中的语义特征信息;基于transformer模型提取群用户属性信息中的第一特征信息;基于图卷积网络提取所述关系图谱中的第二特征信息。作为示例性的实施例,针对不同的群聊信息采用不同的网络模型进行针对性的提取对应的特征信息,可以较为精准的提取群聊信息中的多维度信息,更为全面的更精准高效的掌握最重要的信息。
在步骤S206的技术方案中,针对群聊中每一用户基于所述语义特征信息、所述第一特征信息和所述第二特征信息进行加权融合得到用户融合特征信息。作为示例性的实施例,语义特征信息、所述第一特征信息和所述第二特征信息通过非线性映射函数(RULE)的处理。对于同一用户的不同数据进行加权融合,可以将用户的多维度信息进行融合。
在步骤S208的技术方案中,在对用户进行排序时,可以将所有会话中不同用户的特征以及其会话数据进行打分排序,输出对其用者来说其重要对由高到低的一个排序信息,示例性的,针对获取当前用户所述群聊信息和所述当前用户的群聊未读数据;基于所述群聊未读数据获取所述群聊未读数据对应的用户的融合特征信息;基于所述当前用户的群聊信息和群聊未读数据对应的用户的融合特征信息对群聊未读数据对应的用户进行评分;按照所述评分对所述群聊未读数据对应的用户进行排序。具体的,如图3所示,可以以群聊天用户的某一特征形式(如,微信头像)输出到微信侧边栏的特定位置进行显示,方便使用者点击去阅读重要人员所发的重要信息,当有一定数量的来自不同人员的群聊未读数据时,会按照会话内容、人员特征、关系特征等进行排序。最终使用某个显示特征进行展示(此处使用的是用户头像),当点击某个头像时,会筛选出此用户这段时间的所有会话。使得使用者可以更精准高效的掌握最重要的信息,实现工作的便捷,有助于资源的高效利用。
在使用聊天工具及办公软件的过程中,不可避免的会加入到很多的群聊之中,因此每天都会收到大量的信息,在这些信息中不可避免的有涉及到一些个人隐私的信息,因此,在用户能及时看到对自己最重要的信息,同时需要在处理过程中将用户的隐私信息进行保护,保证数据安全,对于现存的大多数后台文本处理过程,都是直接使用的全量的文本信息,很难做到对用户信息的保护,使得用户在使用过程中时刻担忧自己信息是否会被泄漏或者不当利用,影响用户的体验,基于此,在一种可选地实施例中,在所述分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息之前,基于隐私保护模型对所述群聊信息进行不可逆表征处理,分别得到对应的不可逆的实体编码,作为示例性的实例,通过隐私保护模型进行文本的不可逆表征后,得到不可反向解码的稠密向量,作为处理后的输入信息传输到对应的模块中进行特征提取。作为示例性的实施例,隐私保护模型可以采用Privacy-Preserving模型进行隐私保护,具体的,基于隐私保护模型对群聊信息中的敏感信息进行脱敏处理,在本实施例中可以包括如下步骤:
A.对所述群聊信息进行编码,得到编码序列;
B.基于去识别化模型对所述序列编码进行去识别化处理得到特征序列;
C.计算所述特征序列和所述编码序列的相似度;
D.将相似度大于预设相似度的对应的群聊信息加入噪声,并重复执行步骤A-D,直至所述相似度小于预设相似度,得到所述不可逆的实体编码。
具体的,在得到群聊信息之后,例如,群聊会话内容、群用户属性信息和群用户之间的关系图谱,先经过Embedding进行编码,得到编码信息;将所述编码信息通过表征模型进行表征处理,生成所述编码序列,例如LSTM+CRF等,生成序列表征,之后对于序列表征使用去识别化模型(去识别化模型可以根据需求选定)进行去识别化处理,得到特征序列。可以对敏感信息应进行去标识化处理,确保根据数据无法进行个人敏感信息匹配还原,通过技术和管理方面的措施,防止个人信息的泄漏、损毁、丢失、篡改。在得到去识别化的特征序列之后,可以计算特征序列与编码序列的相似度,或者计算特征序列与编码信息的相似度,具体的,相似度的计算可以采用余弦向量,可以采用相关系数等方法计算相似度,如果相似度高于设定阈值,则在群聊信息或编码信息或编码序列中加入噪声信息,例如可以加入高斯噪声,重新进行编码和表征处理,得到编码序列,并基于去识别化模型对所述序列编码进行去识别化处理得到新的特征序列,继续计算新的特征序列与群聊信息或编码信息的相似度,直至相似度小于阈值,则将当前的特征序列作为不可逆的实体编码。
示例性的,对于会话内容,使用隐私保护模块分别对会话内容进行表征处理后生成不可逆的实体编码,由于会话内容是一条长短不定的序列,且其语义信息需要兼顾上下文的信息,在本实施例中采用BI-LSTM模型进行的语义特征提取。对于表述群用户之间的关系的关系图谱,使用隐私保护模块分别对实体属性进行表征处理后生成不可逆的实体编码,然后使用图卷积网络进行特征提取。对于群用户的属性信息,采用了隐私保护模块进行不可逆的编码处理后,送入到transformer模型中进行特征提取。结合了会话内容特征信息的提取,各用户与使用者关系信息的提取、以及各用户本身的特征信息,综合了各个维度的特征数据,保证了结果的精确性。同时使用了隐私保护模块,可以很好的保护用户的隐私数据,保证数据安全。通过本发明可以很大程度的提升用户对群聊信息获取的效率,加快使用者的工作效率和生活便捷性。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM(Read-Only Memory,只读存储器)/RAM(Random Access Memory,随机存取存储器)、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述群聊会话排序方法的群聊会话排序装置。图4是根据本申请实施例的一种可选的群聊会话排序装置的示意图,如图4所示,该装置可以包括:
(1)获取模块402,用于获取群聊信息,所述群聊信息包括群聊会话内容、群用户属性信息和群用户之间的关系图谱,所述关系图谱基于历史群聊会话内容构建;
(2)提取模块404,用于分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息;
(3)融合模块406,用于针对群聊中每一用户基于所述语义特征信息、所述第一特征信息和所述第二特征信息进行加权融合得到用户融合特征信息;
(4)排序模块408,用于基于所述融合特征信息对用户进行排序。
需要说明的是,该实施例中的获取模块402可以用于执行上述步骤S202,该实施例中的提取模块404可以用于执行上述步骤S204,该实施例中的融合模块406可以用于执行上述步骤S206,该实施例中的排序模块408可以用于执行上述步骤S208。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
根据本申请实施例的又一个方面,还提供了一种用于实施上述群聊会话排序方法的电子设备,该电子设备可以是服务器、终端、或者其组合。
图5是根据本申请实施例的一种可选的电子设备的结构框图,如图5所示,包括处理器502、通信接口504、存储器506和通信总线508,其中,处理器502、通信接口504和存储器506通过通信总线508完成相互间的通信,其中,
存储器506,用于存储计算机程序;
处理器502,用于执行存储器506上所存放的计算机程序时,实现如下步骤:
S1.获取群聊信息,所述群聊信息包括群聊会话内容、群用户属性信息和群用户之间的关系图谱,所述关系图谱基于历史群聊会话内容构建;
S2.分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息;
S3.针对群聊中每一用户基于所述语义特征信息、所述第一特征信息和所述第二特征信息进行加权融合得到用户融合特征信息;
S4.基于所述融合特征信息对用户进行排序。
可选地,在本实施例中,上述的通信总线可以是PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线、或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括RAM,也可以包括非易失性存储器(non-volatile memory),例如,至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
作为一种示例,如图5所示,上述存储器502中可以但不限于包括上述群聊会话排序装置中的获取模块402、提取模块404、融合模块406和排序模块408。此外,还可以包括但不限于上述群聊会话排序装置中的其他模块单元,本示例中不再赘述。
上述处理器可以是通用处理器,可以包含但不限于:CPU(Central ProcessingUnit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(DigitalSignal Processing,数字信号处理器)、ASIC(Application Specific IntegratedCircuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图5所示的结构仅为示意,实施上述群聊会话排序方法的设备可以是终端设备,该终端设备可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图5其并不对上述电子装置的结构造成限定。例如,终端设备还可包括比图5中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图5所示的不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
根据本申请实施例的又一个方面,还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行群聊会话排序方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
S1.获取群聊信息,所述群聊信息包括群聊会话内容、群用户属性信息和群用户之间的关系图谱,所述关系图谱基于历史群聊会话内容构建;
S2.分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息;
S3.针对群聊中每一用户基于所述语义特征信息、所述第一特征信息和所述第二特征信息进行加权融合得到用户融合特征信息;
S4.基于所述融合特征信息对用户进行排序。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例中对此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、ROM、RAM、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例中所提供的方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种群聊会话排序方法,其特征在于,
获取群聊信息,所述群聊信息包括群聊会话内容、群用户属性信息和群用户之间的关系图谱,所述关系图谱基于历史群聊会话内容构建;
分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息;
针对群聊中每一用户基于所述语义特征信息、所述第一特征信息和所述第二特征信息进行加权融合得到用户融合特征信息;
基于所述融合特征信息对用户进行排序。
2.如权利要求1所述的群聊会话排序方法,其特征在于,所述分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息包括:
基于双向长短期记忆网络模型提取会话内容中的语义特征信息;
基于transformer模型提取群用户属性信息中的第一特征信息;
基于图卷积网络提取所述关系图谱中的第二特征信息。
3.如权利要求1所述的群聊会话排序方法,其特征在于,在所述分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息之前包括:
基于隐私保护模型对所述群聊信息进行不可逆表征处理,分别得到对应的不可逆的实体编码。
4.如权利要求3所述的群聊会话排序方法,其特征在于,所述基于隐私保护模型对所述群聊信息进行不可逆表征处理,得到不可逆的实体编码包括:
A.对所述群聊信息进行编码,得到编码序列;
B.基于去识别化模型对所述序列编码进行去识别化处理得到特征序列;
C.计算所述特征序列和所述编码序列的相似度;
D.将相似度大于预设相似度的对应的群聊信息加入噪声,并重复执行步骤A-D,直至所述相似度小于预设相似度,得到所述不可逆的实体编码。
5.如权利要求1所述的群聊会话排序方法,其特征在于,所述对所述群聊信息进行编码,得到编码序列包括:
将上述群聊信息通过Embedding进行编码,得到编码信息;
将所述编码信息通过表征模型进行表征处理,生成所述编码序列。
6.如权利要求1所述的群聊会话排序方法,其特征在于,所述针对群聊中每一用户基于所述语义特征信息、所述第一特征信息和所述第二特征信息进行加权融合得到用户融合特征信息包括:
将所述语义特征信息、所述第一特征信息和所述第二特征信息通过非线性映射函数进行处理,得到用户融合特征信息。
7.如权利要求1所述的群聊会话排序方法,其特征在于,基于所述融合特征信息对用户进行排序包括:
针对获取当前用户所述群聊信息和所述当前用户的群聊未读数据;
基于所述群聊未读数据获取所述群聊未读数据对应的用户的融合特征信息;
基于所述当前用户的群聊信息和群聊未读数据对应的用户的融合特征信息对群聊未读数据对应的用户进行评分;
按照所述评分对所述群聊未读数据对应的用户进行排序。
8.一种群聊会话排序装置,其特征在于,包括:
获取模块,用于获取群聊信息,所述群聊信息包括群聊会话内容、群用户属性信息和群用户之间的关系图谱,所述关系图谱基于历史群聊会话内容构建;
提取模块,用于分别基于不同的网络模型提取所述会话内容中的语义特征信息、所述群用户属性信息中的第一特征信息和所述关系图谱中的第二特征信息;
融合模块,用于针对群聊中每一用户基于所述语义特征信息、所述第一特征信息和所述第二特征信息进行加权融合得到用户融合特征信息;
排序模块,用于基于所述融合特征信息对用户进行排序。
9.一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信,其特征在于,
所述存储器,用于存储计算机程序;
所述处理器,用于通过运行所述存储器上所存储的所述计算机程序来执行权利要求1至7中任一项所述的群聊会话排序方法的步骤。
10.一种计算机可读的存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1至7中任一项所述的群聊会话排序方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110071404.XA CN112765364A (zh) | 2021-01-19 | 2021-01-19 | 群聊会话排序方法、装置、存储介质和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110071404.XA CN112765364A (zh) | 2021-01-19 | 2021-01-19 | 群聊会话排序方法、装置、存储介质和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112765364A true CN112765364A (zh) | 2021-05-07 |
Family
ID=75703318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110071404.XA Pending CN112765364A (zh) | 2021-01-19 | 2021-01-19 | 群聊会话排序方法、装置、存储介质和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112765364A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114666176A (zh) * | 2022-03-23 | 2022-06-24 | 瓴里网络科技(上海)有限公司 | 基于场景的自适应人员排序方法和系统及智能终端 |
CN114997817A (zh) * | 2022-05-13 | 2022-09-02 | 北京百度网讯科技有限公司 | 一种参会推荐方法、装置、电子设备及存储介质 |
CN116016761A (zh) * | 2022-11-30 | 2023-04-25 | 深圳传音控股股份有限公司 | 显示方法、智能终端及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014067358A (ja) * | 2012-09-27 | 2014-04-17 | Konami Digital Entertainment Co Ltd | メッセージ表示装置、管理サーバ、メッセージ表示制御方法およびプログラム |
CN106341310A (zh) * | 2016-09-28 | 2017-01-18 | 江西博瑞彤芸科技有限公司 | 会话消息的展示方法 |
CN106445929A (zh) * | 2015-08-04 | 2017-02-22 | 广州华多网络科技有限公司 | 基于活跃度的用户排序方法及系统 |
CN107241514A (zh) * | 2017-07-07 | 2017-10-10 | Tcl移动通信科技(宁波)有限公司 | 一种信息输出方法、终端设备及存储介质 |
-
2021
- 2021-01-19 CN CN202110071404.XA patent/CN112765364A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014067358A (ja) * | 2012-09-27 | 2014-04-17 | Konami Digital Entertainment Co Ltd | メッセージ表示装置、管理サーバ、メッセージ表示制御方法およびプログラム |
CN106445929A (zh) * | 2015-08-04 | 2017-02-22 | 广州华多网络科技有限公司 | 基于活跃度的用户排序方法及系统 |
CN106341310A (zh) * | 2016-09-28 | 2017-01-18 | 江西博瑞彤芸科技有限公司 | 会话消息的展示方法 |
CN107241514A (zh) * | 2017-07-07 | 2017-10-10 | Tcl移动通信科技(宁波)有限公司 | 一种信息输出方法、终端设备及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114666176A (zh) * | 2022-03-23 | 2022-06-24 | 瓴里网络科技(上海)有限公司 | 基于场景的自适应人员排序方法和系统及智能终端 |
CN114997817A (zh) * | 2022-05-13 | 2022-09-02 | 北京百度网讯科技有限公司 | 一种参会推荐方法、装置、电子设备及存储介质 |
CN114997817B (zh) * | 2022-05-13 | 2023-10-27 | 北京百度网讯科技有限公司 | 一种参会推荐方法、装置、电子设备及存储介质 |
CN116016761A (zh) * | 2022-11-30 | 2023-04-25 | 深圳传音控股股份有限公司 | 显示方法、智能终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10650311B2 (en) | Suggesting resources using context hashing | |
CN112765364A (zh) | 群聊会话排序方法、装置、存储介质和电子设备 | |
CN106874253A (zh) | 识别敏感信息的方法及装置 | |
CN113283238B (zh) | 文本数据处理的方法和装置、电子设备和存储介质 | |
CN110401545B (zh) | 聊天群组创建方法、装置、计算机设备和存储介质 | |
CN112328876B (zh) | 基于知识图谱的电子卡片生成推送方法、装置 | |
CN107634897B (zh) | 群推荐方法和装置 | |
CN109840319B (zh) | 确定对象实体的方法、系统及计算机设备和存储介质 | |
CN110427453B (zh) | 数据的相似度计算方法、装置、计算机设备及存储介质 | |
CN113538070B (zh) | 用户生命价值周期检测方法、装置和计算机设备 | |
CN110209921B (zh) | 媒体资源的推送方法和装置、以及存储介质和电子装置 | |
CN113407851A (zh) | 基于双塔模型的确定推荐信息的方法、装置、设备和介质 | |
CN112100221A (zh) | 一种资讯推荐方法、装置、推荐服务器及存储介质 | |
CN111552767A (zh) | 搜索方法、搜索装置以及计算机设备 | |
CN112291423A (zh) | 通信呼叫智能应答处理方法、装置、电子设备及存储介质 | |
CN115496970A (zh) | 图像任务模型的训练方法、图像识别方法以及相关装置 | |
CN112732893A (zh) | 文本信息的提取方法和装置、存储介质和电子设备 | |
CN111651666A (zh) | 用户主题推荐方法、装置、计算机设备及存储介质 | |
CN112800209A (zh) | 会话语料推荐方法、装置、存储介质和电子设备 | |
CN105630996B (zh) | 一种信息处理方法和服务器 | |
CN116775815B (zh) | 对话数据的处理方法、装置、电子设备及存储介质 | |
CN116303937A (zh) | 回复方法、装置、电子设备及可读存储介质 | |
CN112615774B (zh) | 即时通讯信息处理方法、装置、即时通讯系统及电子设备 | |
CN112784032A (zh) | 会话语料推荐评价方法、装置、存储介质和电子设备 | |
CN114186039A (zh) | 一种视觉问答方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |