CN115774762A - 即时通讯信息处理方法、装置、设备及存储介质 - Google Patents

即时通讯信息处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115774762A
CN115774762A CN202211527641.3A CN202211527641A CN115774762A CN 115774762 A CN115774762 A CN 115774762A CN 202211527641 A CN202211527641 A CN 202211527641A CN 115774762 A CN115774762 A CN 115774762A
Authority
CN
China
Prior art keywords
data
security level
transmitted
security
receiving object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211527641.3A
Other languages
English (en)
Inventor
林加卫
郑传义
高峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Zhongfu Information Technology Co Ltd
Original Assignee
Nanjing Zhongfu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Zhongfu Information Technology Co Ltd filed Critical Nanjing Zhongfu Information Technology Co Ltd
Priority to CN202211527641.3A priority Critical patent/CN115774762A/zh
Publication of CN115774762A publication Critical patent/CN115774762A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本申请提供一种即时通讯信息处理方法、装置、设备及存储介质,属于信息传输技术领域。该方法包括:接收由第一客户端发送的即时消息,即时消息中包括:待传输数据以及接收对象的标识;根据预先训练得到的密级分类模型以及分类策略库,确定待传输数据的密级,密级分类模型用于根据待传输数据的语义信息进行密级识别,分类策略库用于记录属于各种密级的关键词的组合策略;根据接收对象的标识以及预设的接收对象密级库,确定接收对象的密级;根据待传输数据的密级以及接收对象的密级,确定待传输数据与接收对象的密级是否匹配;若是,将待传输数据发送给接收对象所登录的第二客户端。本申请可以提高信息传输的安全性。

Description

即时通讯信息处理方法、装置、设备及存储介质
技术领域
本申请涉及信息传输技术领域,具体而言,涉及一种即时通讯信息处理方法、装置、设备及存储介质。
背景技术
在一些通过通讯软件进行即时信息交互的过程中,通常需要进行部分重要信息的传输,例如:重要的文档、视频等。
现有技术中,在实现这些信息的传输时,通常是由发送者通过相关软件直接将信息发送给接收者,进而使得接收者获取到这些信息。
然而,在实际工作中,由于发送者失误,可能导致信息的错发等问题,这就导致可能让接收者之外的其他人接收到这些信息,这可能会导致泄密等问题的出现,使得信息传输的安全性较低。
发明内容
本申请的目的在于提供一种即时通讯信息处理方法、装置、设备及存储介质,可以提高信息传输的安全性。
本申请的实施例是这样实现的:
本申请实施例的一方面,提供一种即时通讯信息处理方法,该方法应用于服务器,服务器与多个客户端通信连接;该方法包括:
接收由第一客户端发送的即时消息,即时消息中包括:待传输数据以及接收对象的标识;
根据预先训练得到的密级分类模型以及分类策略库,确定待传输数据的密级,密级分类模型用于根据待传输数据的语义信息进行密级识别,分类策略库用于记录属于各种密级的关键词的组合策略;
根据接收对象的标识以及预设的接收对象密级库,确定接收对象的密级;
根据待传输数据的密级以及接收对象的密级,确定待传输数据与接收对象的密级是否匹配;
若是,将待传输数据发送给接收对象所登录的第二客户端。
可选地,根据预先训练得到的密级分类模型以及分类策略库,确定待传输数据的密级,包括:
将待传输数据输入密级分类模型,得到待传输数据的第一可选密级;
根据分类策略库,得到待传输数据的第二可选密级;
确定第一可选密级以及第二可选密级中的最高密级,将最高密级作为待传输数据的密级。
可选地,将待传输数据输入密级分类模型,得到待传输数据的第一可选密级,包括:
将待传输数据输入密级分类模型,由密级分类模型对待传输数据进行语义识别,根据语义识别的结果,生成特征向量,对特征向量进行编码以及解码,得到待传输数据的第一可选密级。
可选地,根据分类策略库,得到待传输数据的第二可选密级,包括:
对待传输数据进行解析,得到目标文本;
从目标文本中提取多个关键词;
将多个关键词构建为正则表达式;
将正则表达式与分类策略库中的各种密级的关键词的组合策略进行匹配,确定与正则表达式匹配的目标组合策略;
将目标组合策略对应的密级作为待传输数据的第二可选密级。
可选地,根据接收对象的标识以及预设的接收对象密级库,确定接收对象的密级,包括:
根据接收对象的标识,从接收对象密级库中查找接收对象的密级。
可选地,将待传输数据输入至预先训练好的密级分类模型之前,该方法还包括:
采集数据样本,数据样本为任意类型的待传输数据;
对数据样本进行标注,生成训练集和测试集;
基于训练集和测试集对初始识别模型进行训练,得到密级分类模型。
可选地,根据待传输数据的密级以及接收对象的密级,确定待传输数据与接收对象的密级是否匹配之后,包括:
若待传输数据与接收对象的密级不匹配,则向第一客户端反馈发送失败指示信息。
本申请实施例的另一方面,提供一种即时通讯信息处理装置,该装置应用于服务器,服务器与多个客户端通信连接;该装置包括:接收模块、密级确定模块、对象确定模块、匹配模块以及发送模块;
接收模块,用于接收由第一客户端发送的即时消息,即时消息中包括:待传输数据以及接收对象的标识;
密级确定模块,用于根据预先训练得到的密级分类模型以及分类策略库,确定待传输数据的密级,密级分类模型用于根据待传输数据的语义信息进行密级识别,分类策略库用于记录属于各种密级的关键词的组合策略;
对象确定模块,用于根据接收对象的标识以及预设的接收对象密级库,确定接收对象的密级;
匹配模块,用于根据待传输数据的密级以及接收对象的密级,确定待传输数据与接收对象的密级是否匹配;
发送模块,用于在匹配的情况下,将待传输数据发送给接收对象所登录的第二客户端。
可选地,密级确定模块,具体用于将待传输数据输入密级分类模型,得到待传输数据的第一可选密级;根据分类策略库,得到待传输数据的第二可选密级;确定第一可选密级以及第二可选密级中的最高密级,将最高密级作为待传输数据的密级。
可选地,密级确定模块,具体用于将待传输数据输入密级分类模型,由密级分类模型对待传输数据进行语义识别,根据语义识别的结果,生成特征向量,对特征向量进行编码以及解码,得到待传输数据的第一可选密级。
可选地,密级确定模块,具体用于对待传输数据进行解析,得到目标文本;从目标文本中提取多个关键词;将多个关键词构建为正则表达式;将正则表达式与分类策略库中的各种密级的关键词的组合策略进行匹配,确定与正则表达式匹配的目标组合策略;将目标组合策略对应的密级作为待传输数据的第二可选密级。
可选地,对象确定模块,具体用于根据接收对象的标识,从接收对象密级库中查找接收对象的密级。
可选地,密级确定模块,还用于采集数据样本,数据样本为任意类型的待传输数据;对数据样本进行标注,生成训练集和测试集;基于训练集和测试集对初始识别模型进行训练,得到密级分类模型。
可选地,发送模块,还用于在待传输数据与接收对象的密级不匹配的情况下,向第一客户端反馈发送失败指示信息。
本申请实施例的另一方面,提供一种计算机设备,包括:存储器、处理器,存储器中存储有可在处理器上运行的计算机程序,处理器执行计算机程序时,实现即时通讯信息处理方法的步骤。
本申请实施例的另一方面,提供一种计算机可读存储介质,存储介质上存储有计算机程序,该计算机程序被处理器执行时,实现即时通讯信息处理方法的步骤。
本申请实施例的有益效果包括:
本申请实施例提供的一种即时通讯信息处理方法、装置、设备及存储介质中,可以在接收到第一客户端发送的即时消息之后,根据预先训练得到的密级分类模型以及分类策略库,确定待传输数据的密级,进而可以根据接收对象的标识以及预设的接收对象密级库,确定接收对象的密级,进而将待传输数据发送给密级匹配的接收对象所登录的第二客户端,由于其中的密级分类模型以及分类策略库可以实现对语义以及关键词组合的识别,进而可以更加准确地确定出待传输数据的密级,从而可以更加准确地实现将待传输数据发送给密级相匹配的接收对象,避免了由于错发导致的待传输数据的泄密问题,提高了数据传输的安全性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的应用场景的结构示意图;
图2为本申请实施例提供的即时通讯信息处理方法的流程示意图;
图3为本申请实施例提供的即时通讯信息处理方法的另一流程示意图;
图4为本申请实施例提供的即时通讯信息处理方法的另一流程示意图;
图5为本申请实施例提供的即时通讯信息处理方法的另一流程示意图;
图6为本申请实施例提供的即时通讯信息处理装置的结构示意图;
图7为本申请实施例提供的计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在现有技术中的信息传输时,为了提高信息的安全性,通常是对待传输数据的发起者的发送权限进行限制,数据是否可以发送通常是由本地客户端进行检测的,对于同一个待传输数据而言,是否可以发送出去是固定的结果。由于实际发送的是即时消息,基于本地客户端进行检测可能会因为本地的设置导致的误判,若因为误判导致消息不能及时发出,则可能导致信息发送不及时所带来的影响。
为了避免现有技术中存在的上述问题,提高信息在传输过程中的安全性,本申请是实施例中提供了一种即时通讯信息处理方法,下面来具体解释该方法所应用的实际场景。
图1为本申请实施例提供的应用场景的结构示意图,请参照图1,该方法应用于服务器100,服务器100与多个客户端200通信连接。
其中,服务器100具体可以是云端的服务器,例如:聊天软件的后台服务器等,在此不作限制。客户端200可以是在电子设备中设置的软件端口,例如:用于进行聊天或者消息传输的娱乐软件或者办公软件等,在此不作具体限制。
其中,各客户端200可以对应至少一个接收对象,具体可以是登录该客户端200的虚拟账号,不同的用户可以通过注册的方式获取对应的虚拟账号,通过任意一个客户端200实现该虚拟账号的登录,在实现信息交互的过程中,具体可以是用户通过在客户端200上登录的虚拟账号向服务器发送或者从服务器接收对应的数据。
下面来基于上述实际应用场景解释本申请实施例中提供的即时通讯信息处理方法的具体实施过程。
图2为本申请实施例提供的即时通讯信息处理方法的流程示意图,请参照图2,该方法包括:
S210:接收由第一客户端发送的即时消息。
其中,即时消息中包括:待传输数据以及接收对象的标识。
可选地,该方法的执行主体可以是上述服务器,服务器可以接收由第一客户端发送的即时消息,其中,第一客户端可以是上述与服务器通信连接的多个客户端中的任意一个,在此不作具体限制,即时消息可以是用户通过客户端即时发送的消息。
可选地,即时消息中的待传输数据具体可以是任意类型的数据,例如:文字、图片、视频、音频或者文档等任意类型的传输文件。
接收对象的标识可以是用于标注接收对象的编码,例如:身份序号或者其他类型通过编码的方式表征一个接收对象的数据,接收对象具体可以是任意一个客户端上所登录的账号。
例如:用户之间通过账号进行消息传输,用户1通过第一客户端登录了账号A,并向账号B发送了文字信息,则账号B即为接收对象,账号B对应的标识即为接收对象对应的标识,发送的文字信息即为待传输数据。
S220:根据预先训练得到的密级分类模型以及分类策略库,确定待传输数据的密级。
其中,密级分类模型用于根据待传输数据的语义信息进行密级识别,分类策略库用于记录属于各种密级的关键词的组合策略。
可选地,服务器接收到即时消息之后,可以基于待传输消息以及预先训练得到的密级分类模型以及分类策略库,确定待传输数据的密级。
其中,密级分类模型和分类策略库可以是两种并列的方式,可以选择其中一种确定待传输数据的密级也可以采用两种分别确定待传输数据的密级。
需要说明的是,待传输数据的密级具体可以是用于表征该待传输数据的重要程度或者加密优先级的一个参数,例如:可以设置重要程度越高则密级越高。
待传输数据的密级的界定可以是预先通过对密级分类模型的训练以及对分类策略库的配置设置的,并不唯一或者固定,可以根据实际情况进行变更。
其中,密级分类模型具体可以是用于根据待传输数据的语义信息进行密级识别的模型,该模型的输入可以是一段文字,通过该模型确定该段文字的语义信息,并基于语义信息确定该段文字对应的密级。
分类策略库具体可以是用于记录属于各种密级的关键词的组合策略的数据库,在获取到一段文字之后,可以进行关键字提取,进而基于关键字的组合关系确定该段文字的密级。
具体地,关键词的组合策略具体指的是预先设置的多个关键词之间的组合关系,例如:组合策略1可以是关键词A+关键词B;组合策略2可以是关键词A+关键词C,可以根据提取到的多个关键词的组合关系确定对应的组合策略。对于不同的组合策略中,其对应的密级也可以不同。
S230:根据接收对象的标识以及预设的接收对象密级库,确定接收对象的密级。
可选地,上述S230的步骤和前述S220的步骤可以同步进行也可以依次进行,图2中以同步进行为例,在实际实施的过程中也可以先执行S220再执行S230或者先执行S230再执行S220,在此不作具体限制。
可选地,根据接收对象的标识以及预设的接收对象密级库,确定接收对象的密级,包括:根据接收对象的标识,从接收对象密级库中查找接收对象的密级。
需要说明的是,预设的接收对象密级库可以是预先在服务器中存储的数据,在该接收对象密级库中可以记录有每个接收对象的标识与其对应的密级的对应关系,接收到即时消息之后,可以根据接收对象的标识确定该接收对象的密级。
S240:根据待传输数据的密级以及接收对象的密级,确定待传输数据与接收对象的密级是否匹配。
可选地,待传输数据与接收对象的密级匹配关系可以是按照预先设置的匹配方式进行匹配得到结果,例如:可以是当待传输数据的密级与接收对象的密级相同时视为匹配成功,或者,也可以是当接收对象的密级大于或者等于待传输数据的密级时视为匹配成功,在此不作具体限制,可以根据实际的匹配需求来确定是否匹配成功。
接收对象的密级可以用于表征该接收对象的权限的大小,例如:密级越大则权限越大。
需要说明的是,接收对象的密级可以是预先进行配置的,对于不同的接收对象其对应的密级也并不相同,可以根据实际需求进行密级的配置,例如:根据账号对应的用户的岗位、根据账号本身的使用时长、根据账号的类型等,在此不作具体限制,可以根据实际情况进行接收对象的配置。
例如:若将密级分为1-4级,密级为4的接收对象可以与密级为1-4所有的待传输数据匹配;密级为3的接收对象可以与密级1-3所有的待传输数据匹配;密级为2的接收对象可以与密级1-2所有的待传输数据匹配;密级为1的接收对象可以与密级为1所有的待传输数据匹配。
S250:若是,将待传输数据发送给接收对象所登录的第二客户端。
可选地,确定接收对象与待传输数据匹配之后,可以将待传输数据发送给接收对象所登录的第二客户端,其中,第二客户端也可以是与服务器通信连接的多个客户端中的其中一个,可以与第一客户端是同一个客户端,也可以是不同的客户端,在此不作具体限制。
相对地,若接收对象与待传输数据不匹配,则不能向接收对象所登录的第二客户端发送待传输数据。
本申请实施例提供的一种即时通讯信息处理方法中,可以在接收到第一客户端发送的即时消息之后,根据预先训练得到的密级分类模型以及分类策略库,确定待传输数据的密级,进而可以根据接收对象的标识以及预设的接收对象密级库,确定接收对象的密级,进而将待传输数据发送给密级匹配的接收对象所登录的第二客户端,由于其中的密级分类模型以及分类策略库可以实现对语义以及关键词组合的识别,进而可以更加准确地确定出待传输数据的密级,从而可以更加准确地实现将待传输数据发送给密级相匹配的接收对象,避免了由于错发导致的待传输数据的泄密问题,提高了数据传输的安全性。
下面来具体解释本申请实施例中提供的即时通讯信息处理方法的另一具体实施过程。
图3为本申请实施例提供的即时通讯信息处理方法的另一流程示意图,请参照图3,根据预先训练得到的密级分类模型以及分类策略库,确定待传输数据的密级,包括:
S310:将待传输数据输入密级分类模型,得到待传输数据的第一可选密级。
需要说明的是,该实施例中以分别采用密级分类模型和分类策略库进行密级确定的方式,在实际执行的过程中,也可以仅采用其中的一种进行判定,并不以此为限制。
可选地,可以将待传输数据输入到密级分类模型中,由于密级分类模型的输入为一段文字,而待传输数据可以为任意类型的传输文件,因此在输入到模型中时可以先进行文字转换。
具体的,对于本身是文字的信息可以直接输入;对于图片类型的信息可以进行图片识别以及文字提取等工作后获取到对应的文字信息;对于视频类型的信息可以进行逐帧采样后得到图片,进而采用上述图片类型的信息处理方式得到文字信息;对于音频类型的信息可以进行语音识别,得到对应的文字信息;对于文档类型的信息可以对文档进行读取,获取文档中涉及的文字、图片等信息,进而采用上述对应的方式实现文字转换。
可选地,若采用上述方式将待传输数据输入密级分类模型,则可以得到待传输数据的第一可选密级;若仅采用密级分类模型进行密级确定,则该第一可选密级即为待传输数据的密级。
S320:根据分类策略库,得到待传输数据的第二可选密级。
可选地,上述S310的步骤和前述S320的步骤可以同步进行也可以依次进行,图2中以同步进行为例,在实际实施的过程中也可以先执行S310再执行S320或者先执行S320再执行S310,在此不作具体限制。
可选地,处理方式与S310中类似,可以先将待传输数据转换为对应的文字数据,进而进行文字的关键词提取,从而得到多个关键词,进而采用根据分类策略库以及这些关键词确定待传输数据的第二可选密级。
可选地,若采用上述方式与分类策略库进行策略匹配,则可以得到待传输数据的第二可选密级;若仅采用分类策略库进行密级确定,则该第二可选密级即为待传输数据的密级。
S330:确定第一可选密级以及第二可选密级中的最高密级,将最高密级作为待传输数据的密级。
可选地,采用上述两种方式分别得到第一可选密级以及第二可选密级之后,可以将其中的最高密级作为待传输数据的密级;相应地,若二者密级相等,则可以采用任意一个作为待传输数据的密级。
例如:第一可选密级为4级,第二可选密级为3级,则可以将第一可选密级作为待传输数据的密级。
需要说明的是,将最高密级作为待传输数据的密级仅为其中的一种可行方案,在实际实施的过程中,也可以根据实际需求将最低密级作为待传输数据的密级,在此不作具体限制。
本申请实施例提供的一种即时通讯信息处理方法中,可以待传输数据输入密级分类模型,得到待传输数据的第一可选密级;根据分类策略库,得到待传输数据的第二可选密级;确定第一可选密级以及第二可选密级中的最高密级,将最高密级作为待传输数据的密级。其中,分别通过密级分类模型和分类策略库进行密级的判定,可以更加准确地确定待传输数据的密级,进而可以更加准确地实现将待传输数据发送给密级相匹配的接收对象,避免了由于错发导致的待传输数据的泄密问题,提高了数据传输的安全性。
下面来分别解释上述S310和S320在具体实施的过程中确定待传输数据的可选密级的具体过程。
可选地,将待传输数据输入密级分类模型,得到待传输数据的第一可选密级,包括:将待传输数据输入密级分类模型,由密级分类模型对待传输数据进行语义识别,根据语义识别的结果,生成特征向量,对特征向量进行编码以及解码,得到待传输数据的第一可选密级。
其中,密级分类模型可以是通过卷积神经网络或者深度神经网络进行训练之后得到的模型,将待传输数据转换为文字的形式输入到密级分类模型之后,可以由密级分类模型对该文字的语义进行识别,进而确定对应的语义识别结果,并可以以特征向量的形式表征该语义识别结果。
得到特征向量之后,可以基于模型中的神经网络进行编码以及解码,最终得到对应的输出,该输出即为上述待传输数据的第一可选密级。
需要说明的是,上述解释的模型识别过程以卷积神经网络的过程为例,在实际使用的过程中,也可以采用不同的神经网络模型进行密级的识别确定,并不以上述示例为限制。
对于分类策略库识别的过程,图4为本申请实施例提供的即时通讯信息处理方法的另一流程示意图,请参照图4,根据分类策略库,得到待传输数据的第二可选密级,包括:
S410:对待传输数据进行解析,得到目标文本。
可选地,得到待传输数据之后可以进行格式转换,也即是前述将待传输数据转换为文本的具体过程,在此不加赘述,可以得到目标文本,目标文本即为从待传输数据中进行解析后得到的文字内容。
S420:从目标文本中提取多个关键词。
可选地,可以采用预先配置的关键词提取方式获取目标文本中的多个关键词,例如:可以采用特定关键词识别的模型进行关键词提取,或者也可以根据词出现的频率次数等方式进行提取,在此不作具体限制,凡是可以实现从目标文本中实现关键词提取的方式即可。
可以采用上述方式得到多个关键词。
S430:将多个关键词构建为正则表达式。
可选地,得到多个关键词之后,可以将这些关键词构建为正则表达式,例如:可以是一个关键词,或者多个关键词的组合情况等,正则表达式的确定可以是根据预先配置的正则表达式构建规则,例如:根据各个关键词的词性,或者关键词出现在原段落中的位置、次数等方式确定这些关键词具体如何进行组合等,最终构建出至少一种可以组合的方式,该组合的方式即为正则表达式。
S440:将正则表达式与分类策略库中的各种密级的关键词的组合策略进行匹配,确定与正则表达式匹配的目标组合策略。
可选地,得到正则表达式之后,可以将正则表达式与分类策略库中的各种密级的关键词的组合策略进行匹配,若有落入其中的任意一个组合策略,则可以认为匹配成功,可以将正则表达式相匹配的组合策略作为目标组合策略。
其中,分类策略库中的各种密级的关键词的组合策略也可以是预先配置好的公式,例如:组合策略为:关键词A+关键词B;若正则表达式为关键词A+关键词B,则完全落入其中,可以认为匹配成功;若正则表达式为关键词C+关键词D,则没有落入其中,可以认为匹配失败;若正则表达式为关键词A+关键词C,可以认为部分落入其中,可以进行进一步判定,例如:关键词之间的优先级等,来确定是否匹配成功,具体是否匹配成功可以由预先配置的计算公式,例如存在多个关键词时,每个关键词占据一定的比例,根据最终的总的比例所处的区间确定是否匹配成功。
需要说明的是,上述以组合策略中存在两个关键词为例,在实际使用的过程中,可以存在更多的关键词,在此不作具体限制。
S450:将目标组合策略对应的密级作为待传输数据的第二可选密级。
可选地,得到目标组合策略之后,可以查询目标组合策略对应的密级,进而可以将目标组合策略对应的密级作为待传输数据的第二可选密级。
本申请实施例提供的一种即时通讯信息处理方法中,可以对待传输数据进行解析,得到目标文本;从目标文本中提取多个关键词;将多个关键词构建为正则表达式;将正则表达式与分类策略库中的各种密级的关键词的组合策略进行匹配,确定与正则表达式匹配的目标组合策略;将目标组合策略对应的密级作为待传输数据的第二可选密级。其中,通过上述方式可以更加准确地得到第二可选密级,进而可以更加准确地确定待传输数据的密级,从而可以更加准确地实现将待传输数据发送给密级相匹配的接收对象,避免了由于错发导致的待传输数据的泄密问题,提高了数据传输的安全性。
下面来具体解释本申请实施例中提供的即时通讯信息处理方法中对密级分类模型进行训练的具体实施过程。
图5为本申请实施例提供的即时通讯信息处理方法的另一流程示意图,请参照图5,将待传输数据输入至预先训练好的密级分类模型之前,该方法还包括:
S510:采集数据样本。
其中,数据样本为任意类型的待传输数据。
可选地,数据样本可以是预先生成的任意类型的待传输数据,具体可以是转换为文字形式的待传输数据。
S520:对数据样本进行标注,生成训练集和测试集。
可选地,可以自动对数据样本进行标注,也可以是工作人员进行的手动标注,在此不作具体限制,可以将上述数据样本划分为训练集和测试集。
其中,训练集用于对初始模型进行训练,测试集用于对训练完成后的模型进行测试。
S530:基于训练集和测试集对初始识别模型进行训练,得到密级分类模型。
可选地,得到训练集和测试集后可以对初始识别模型进行训练以及训练完成后的测试,最终得到满足收敛条件的模型后,可以对该模型进行验证,若验证通过,可以将该模型作为上述密级分类模型;相应地,若验证不通过,可以重新进行数据样本的采样,重复上述步骤,直至得到满足条件的密级分类模型。
可选地,根据待传输数据的密级以及接收对象的密级,确定待传输数据与接收对象的密级是否匹配之后,包括:若待传输数据与接收对象的密级不匹配,则向第一客户端反馈发送失败指示信息。
需要说明的是,若待传输数据与接收对象的密级不匹配,则可以向第一客户端反馈发送失败指示信息。
其中,接收对象可以是多个也可以是一个,若为一个接收对象,则反馈的失败指示信息可以是该接收对象接收待传输数据失败,并可以给出相应的原因解释,例如:因密级较低导致的接收失败。
若为多个接收对象,则可以反馈多个上述失败指示信息,第二客户端可以根据各个失败指示信息确定发送的多个接收对象中,接收到待传输信息的子对象,以及没有接收到待传输信息的子对象,从而使得第一客户端对应的用户即时了解到待传输数据的传输情况。
下述对用以执行的本申请所提供的即时通讯信息处理方法对应的装置、设备及存储介质等进行说明,其具体的实现过程以及技术效果参见上述,下述不再赘述。
图6为本申请实施例提供的即时通讯信息处理装置的结构示意图,请参照图6,即时通讯信息处理装置,该装置应用于服务器,服务器与多个客户端通信连接;该装置包括:接收模块610、密级确定模块620、对象确定模块630、匹配模块640以及发送模块650;
接收模块610,用于接收由第一客户端发送的即时消息,即时消息中包括:待传输数据以及接收对象的标识;
密级确定模块620,用于根据预先训练得到的密级分类模型以及分类策略库,确定待传输数据的密级,密级分类模型用于根据待传输数据的语义信息进行密级识别,分类策略库用于记录属于各种密级的关键词的组合策略;
对象确定模块630,用于根据接收对象的标识以及预设的接收对象密级库,确定接收对象的密级;
匹配模块640,用于根据待传输数据的密级以及接收对象的密级,确定待传输数据与接收对象的密级是否匹配;
发送模块650,用于在匹配的情况下,将待传输数据发送给接收对象所登录的第二客户端。
可选地,密级确定模块620,具体用于将待传输数据输入密级分类模型,得到待传输数据的第一可选密级;根据分类策略库,得到待传输数据的第二可选密级;确定第一可选密级以及第二可选密级中的最高密级,将最高密级作为待传输数据的密级。
可选地,密级确定模块620,具体用于将待传输数据输入密级分类模型,由密级分类模型对待传输数据进行语义识别,根据语义识别的结果,生成特征向量,对特征向量进行编码以及解码,得到待传输数据的第一可选密级。
可选地,密级确定模块620,具体用于对待传输数据进行解析,得到目标文本;从目标文本中提取多个关键词;将多个关键词构建为正则表达式;将正则表达式与分类策略库中的各种密级的关键词的组合策略进行匹配,确定与正则表达式匹配的目标组合策略;将目标组合策略对应的密级作为待传输数据的第二可选密级。
可选地,对象确定模块630,具体用于根据接收对象的标识,从接收对象密级库中查找接收对象的密级。
可选地,密级确定模块620,还用于采集数据样本,数据样本为任意类型的待传输数据;对数据样本进行标注,生成训练集和测试集;基于训练集和测试集对初始识别模型进行训练,得到密级分类模型。
可选地,发送模块650,还用于在待传输数据与接收对象的密级不匹配的情况下,向第一客户端反馈发送失败指示信息。
本申请实施例提供的一种即时通讯信息处理装置中,可以在接收到第一客户端发送的即时消息之后,根据预先训练得到的密级分类模型以及分类策略库,确定待传输数据的密级,进而可以根据接收对象的标识以及预设的接收对象密级库,确定接收对象的密级,进而将待传输数据发送给密级匹配的接收对象所登录的第二客户端,由于其中的密级分类模型以及分类策略库可以实现对语义以及关键词组合的识别,进而可以更加准确地确定出待传输数据的密级,从而可以更加准确地实现将待传输数据发送给密级相匹配的接收对象,避免了由于错发导致的待传输数据的泄密问题,提高了数据传输的安全性。
上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器,或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
图7为本申请实施例提供的计算机设备的结构示意图,请参照图7,本申请实施例的另一方面,提供一种计算机设备,包括:存储器710、处理器720,存储器710中存储有可在处理器720上运行的计算机程序,处理器720执行计算机程序时,实现即时通讯信息处理方法的步骤。
其中,该计算机设备具体可以是上述服务器。
本申请实施例的另一方面,还提供一种计算机可读存储介质,存储介质上存储有计算机程序,该计算机程序被处理器执行时,实现即时通讯信息处理方法的步骤。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种即时通讯信息处理方法,其特征在于,所述方法应用于服务器,所述服务器与多个客户端通信连接;所述方法包括:
接收由第一客户端发送的即时消息,所述即时消息中包括:待传输数据以及接收对象的标识;
根据预先训练得到的密级分类模型以及分类策略库,确定所述待传输数据的密级,所述密级分类模型用于根据所述待传输数据的语义信息进行密级识别,所述分类策略库用于记录属于各种密级的关键词的组合策略;
根据所述接收对象的标识以及预设的接收对象密级库,确定所述接收对象的密级;
根据所述待传输数据的密级以及所述接收对象的密级,确定所述待传输数据与所述接收对象的密级是否匹配;
若是,将所述待传输数据发送给所述接收对象所登录的第二客户端。
2.如权利要求1所述的即时通讯信息处理方法,其特征在于,所述根据预先训练得到的密级分类模型以及分类策略库,确定所述待传输数据的密级,包括:
将所述待传输数据输入所述密级分类模型,得到所述待传输数据的第一可选密级;
根据所述分类策略库,得到所述待传输数据的第二可选密级;
确定所述第一可选密级以及所述第二可选密级中的最高密级,将所述最高密级作为所述待传输数据的密级。
3.如权利要求2所述的即时通讯信息处理方法,其特征在于,所述将所述待传输数据输入所述密级分类模型,得到所述待传输数据的第一可选密级,包括:
将所述待传输数据输入所述密级分类模型,由所述密级分类模型对所述待传输数据进行语义识别,根据语义识别的结果,生成特征向量,对所述特征向量进行编码以及解码,得到所述待传输数据的第一可选密级。
4.如权利要求2所述的即时通讯信息处理方法,其特征在于,所述根据所述分类策略库,得到所述待传输数据的第二可选密级,包括:
对所述待传输数据进行解析,得到目标文本;
从所述目标文本中提取多个关键词;
将所述多个关键词构建为正则表达式;
将所述正则表达式与所述分类策略库中的各种密级的关键词的组合策略进行匹配,确定与所述正则表达式匹配的目标组合策略;
将所述目标组合策略对应的密级作为待传输数据的第二可选密级。
5.如权利要求1所述的即时通讯信息处理方法,其特征在于,根据所述接收对象的标识以及预设的接收对象密级库,确定所述接收对象的密级,包括:
根据所述接收对象的标识,从所述接收对象密级库中查找所述接收对象的密级。
6.如权利要求1-5任一项所述的即时通讯信息处理方法,其特征在于,所述将所述待传输数据输入至预先训练好的密级分类模型之前,所述方法还包括:
采集数据样本,所述数据样本为任意类型的待传输数据;
对所述数据样本进行标注,生成训练集和测试集;
基于所述训练集和所述测试集对初始识别模型进行训练,得到所述密级分类模型。
7.如权利要求1所述的即时通讯信息处理方法,其特征在于,所述根据所述待传输数据的密级以及所述接收对象的密级,确定所述待传输数据与所述接收对象的密级是否匹配之后,包括:
若所述待传输数据与所述接收对象的密级不匹配,则向所述第一客户端反馈发送失败指示信息。
8.一种即时通讯信息处理装置,其特征在于,所述装置应用于服务器,所述服务器与多个客户端通信连接;所述装置包括:接收模块、密级确定模块、对象确定模块、匹配模块以及发送模块;
所述接收模块,用于接收由第一客户端发送的即时消息,所述即时消息中包括:待传输数据以及接收对象的标识;
所述密级确定模块,用于根据预先训练得到的密级分类模型以及分类策略库,确定所述待传输数据的密级,所述密级分类模型用于根据所述待传输数据的语义信息进行密级识别,所述分类策略库用于记录属于各种密级的关键词的组合策略;
所述对象确定模块,用于根据所述接收对象的标识以及预设的接收对象密级库,确定所述接收对象的密级;
所述匹配模块,用于根据所述待传输数据的密级以及所述接收对象的密级,确定所述待传输数据与所述接收对象的密级是否匹配;
所述发送模块,用于在匹配的情况下,将所述待传输数据发送给所述接收对象所登录的第二客户端。
9.一种计算机设备,其特征在于,包括:存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现权利要求1至7任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,该计算机程序被处理器执行时,实现权利要求1至7中任一项所述方法的步骤。
CN202211527641.3A 2022-11-30 2022-11-30 即时通讯信息处理方法、装置、设备及存储介质 Pending CN115774762A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211527641.3A CN115774762A (zh) 2022-11-30 2022-11-30 即时通讯信息处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211527641.3A CN115774762A (zh) 2022-11-30 2022-11-30 即时通讯信息处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115774762A true CN115774762A (zh) 2023-03-10

Family

ID=85390957

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211527641.3A Pending CN115774762A (zh) 2022-11-30 2022-11-30 即时通讯信息处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115774762A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117082021A (zh) * 2023-10-12 2023-11-17 太平金融科技服务(上海)有限公司 邮件干预方法、装置、设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117082021A (zh) * 2023-10-12 2023-11-17 太平金融科技服务(上海)有限公司 邮件干预方法、装置、设备及介质
CN117082021B (zh) * 2023-10-12 2024-01-02 太平金融科技服务(上海)有限公司 邮件干预方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN108874777B (zh) 一种文本反垃圾的方法及装置
CN111343162B (zh) 系统安全登录方法、装置、介质及电子设备
CN113469298B (zh) 模型训练方法及资源推荐方法
CN111367874B (zh) 一种日志处理方法、装置、介质和设备
CN112770129A (zh) 基于直播的群聊建立方法、相关装置、设备及介质
CN113704328A (zh) 基于人工智能的用户行为大数据挖掘方法及系统
CN115774762A (zh) 即时通讯信息处理方法、装置、设备及存储介质
CN114036264B (zh) 一种基于小样本学习的电子邮件作者身份归属识别方法
CN110390109B (zh) 分析多条群聊消息间关联关系的方法和装置
CN115238105A (zh) 融合多媒体的违规内容检测方法及系统、设备和介质
CN113571048B (zh) 一种音频数据检测方法、装置、设备及可读存储介质
CN113450147A (zh) 基于决策树的产品匹配方法、装置、设备及存储介质
CN113420230A (zh) 基于群聊的匹配咨询推送方法、相关装置、设备及介质
CN113449829A (zh) 基于光学字符识别技术的数据传输方法及相关装置
CN116828087B (zh) 基于区块链连接的信息安全系统
CN116055067B (zh) 一种弱口令检测的方法、装置、电子设备及介质
CN110413770B (zh) 将群消息归类到群话题的方法及装置
CN115314268B (zh) 基于流量指纹和行为的恶意加密流量检测方法和系统
CN114065187B (zh) 异常登录检测方法、装置、计算设备及存储介质
CN111464687A (zh) 一种陌生呼叫请求的处理方法及装置
CN114499980A (zh) 一种钓鱼邮件检测方法、装置、设备及存储介质
CN113691548A (zh) 一种数据采集和分类存储方法及其系统
CN114363664A (zh) 生成视频合集标题的方法及装置
CN113852835A (zh) 直播音频处理方法、装置、电子设备以及存储介质
CN111639280A (zh) 一种信息分享方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination