CN111177362B - 一种信息处理方法、装置、服务器及介质 - Google Patents

一种信息处理方法、装置、服务器及介质 Download PDF

Info

Publication number
CN111177362B
CN111177362B CN201911399184.2A CN201911399184A CN111177362B CN 111177362 B CN111177362 B CN 111177362B CN 201911399184 A CN201911399184 A CN 201911399184A CN 111177362 B CN111177362 B CN 111177362B
Authority
CN
China
Prior art keywords
information
base
matching
preset
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911399184.2A
Other languages
English (en)
Other versions
CN111177362A (zh
Inventor
余文胜
杨奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Montnets Technology Co ltd
Original Assignee
Shenzhen Montnets Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Montnets Technology Co ltd filed Critical Shenzhen Montnets Technology Co ltd
Priority to CN201911399184.2A priority Critical patent/CN111177362B/zh
Publication of CN111177362A publication Critical patent/CN111177362A/zh
Application granted granted Critical
Publication of CN111177362B publication Critical patent/CN111177362B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/30Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information
    • H04L63/306Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information intercepting packet switched data communications, e.g. Web, Internet or IMS communications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud
    • H04W12/128Anti-malware arrangements, e.g. protection against SMS fraud or mobile malware
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/80Arrangements enabling lawful interception [LI]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Technology Law (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Collating Specific Patterns (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请适用于通信技术领域,提供了一种信息处理方法、装置、服务器及介质,所述方法包括:当接收到待处理的信息时,计算所述信息的指纹值;根据所述指纹值,将所述信息与预设的第一信息库中的第一信息进行匹配;若在所述第一信息库中匹配到与所述信息对应的第一目标信息,则按照所述第一目标信息对应的第一属性信息对所述信息进行处理;若在所述第一信息库中未匹配到与所述信息对应的第一目标信息,则将所述信息与预设的第二信息库中的第二信息进行匹配,根据所述第二信息库的匹配结果对所述信息进行处理。通过上述方法,能够提升信息处理的准确度与效率。

Description

一种信息处理方法、装置、服务器及介质
技术领域
本申请属于通信技术领域,尤其涉及一种信息处理方法、装置、服务器及介质。
背景技术
在日常生活中,经常会接收到信息,其中一些信息是用户正常通讯产生的,但还有一些敏感信息是用户不希望收到的,例如诈骗信息、促销广告信息。敏感信息是指不当使用或未经授权被人接触或修改会不利于国家利益或不利于个人依法享有的个人隐私权的所有信息。随着手机行业的日益发展,敏感信息的问题越发严重,反敏感短信的技术也在不断的进步。现有的技术是基于已有的敏感词库,通过正则表达式的技术进行短信内容匹配,若匹配到短信内容中有部分词汇在敏感词表中,则判定敏感短信,从而进行拦截。
中文的语义复杂,将敏感词穷举是很困难且没有必要的。因此,根据敏感词库来进行信息内容匹配,会导致较大概率的误拦截和误通信,使得信息传递的及时性和准确性受到影响。
发明内容
本申请实施例提供了一种信息处理方法、装置、服务器及介质,可以解决信息拦截错误率高的问题。
第一方面,本申请实施例提供了一种信息处理方法,包括:
当接收到待处理的信息时,计算所述信息的指纹值;
根据所述指纹值,将所述信息与预设的第一信息库中的第一信息进行匹配;
若在所述第一信息库中匹配到与所述信息对应的第一目标信息,则按照所述第一目标信息对应的第一属性信息对所述信息进行处理;
若在所述第一信息库中未匹配到与所述信息对应的第一目标信息,则将所述信息与预设的第二信息库中的第二信息进行匹配,根据所述第二信息库的匹配结果对所述信息进行处理。
第二方面,本申请实施例提供了一种信息处理装置,包括:
计算模块,用于当接收到待处理的信息时,计算所述信息的指纹值;
第一匹配模块,用于根据所述指纹值,将所述信息与预设的第一信息库中的第一信息进行匹配;
处理模块,用于若在所述第一信息库中匹配到与所述信息对应的第一目标信息,则按照所述第一目标信息对应的第一属性信息对所述信息进行处理;
第二匹配模块,用于若在所述第一信息库中未匹配到与所述信息对应的第一目标信息,则将所述信息与预设的第二信息库中的第二信息进行匹配,根据所述第二信息库的匹配结果对所述信息进行处理。
第三方面,本申请实施例提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在服务器上运行时,使得服务器执行上述第一方面中所述的方法。
本申请实施例与现有技术相比存在的有益效果是:服务器中存在预设的第一信息库,第一信息库中包括各个第一信息,每个第一信息对应一个第一属性信息,第一属性信息中包括了对应的第一信息的处理方式;当服务器接收到信息时,可以计算该信息的指纹值,并根据该信息的指纹值,将该信息与第一信息库中的各个第一信息进行匹配;若第一信息库中存在与该信息匹配的第一目标信息,则按照所述第一目标信息的对应的第一属性信息对该信息进行处理;若在第一信息库中未匹配到与该信息对应的第一目标信息,则将该信息与第二信息库中的第二信息进行匹配,再根据该信息在第二信息库中的匹配结果对该信息进行处理。本申请实施例中对接收到的信息通过双重匹配降低了信息拦截的错误率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例一提供的一种信息处理方法流程示意图;
图2是本申请实施例二提供的一种信息处理方法流程示意图;
图3是本申请实施例三提供的一种信息处理方法流程示意图;
图4是本申请实施例四提供的一种信息处理装置的结构示意图;
图5是本申请实施例五提供的服务器的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
图1是本申请实施例一提供的一种信息处理方法流程示意图,如图1所示,所述方法包括:
S101,当接收到待处理的信息时,计算所述信息的指纹值;
本实施例的执行主体为服务器,所述服务器包括云端服务器,能够用来对信息进行处理。
上述待处理的信息是服务器接收到的需要转发给用户的信息。上述指纹值是对信息通过计算得到的,能够用来标识该信息,可以反映该信息的特征。
具体地,当服务器在接收到信息时,可以对该信息进行处理,计算该信息的指纹值。中文语义复杂,单纯的文字比对可能会造成信息拦截错误率高,因而可以先计算信息的指纹值,再利用指纹值与标准信息进行比对。
S102,根据所述指纹值,将所述信息与预设的第一信息库中的第一信息进行匹配;
上述第一信息库中存放的第一信息均为标准信息,且第一信息的属性信息包括对该第一信息的处置方式,处置方式是指服务器接下来对该信息的处理方法,包括:直接通过、直接拦截、提交进行一步审核等。前述标准信息可以包括标准正常信息和标准敏感信息。标准正常信息的属性信息一般为直接通过;标准敏感信息的属性信息一般为直接拦截。第一信息库中的信息可以预先设置,例如在第一信息库中包括第一信息“尊敬的用户您好,您此次的验证码是1234。”,该第一信息的属性信息为“直接通过”,这是提前在第一信息库中设置的一个正常信息。第一信息库中的第一信息,可以是预先设置一些常见形式的正常信息和敏感信息,也可以在信息处理过程中对第一信息库中的第一信息进行增删查改。
具体地,第一信息库中的各个第一信息具有对应的第一指纹值,将接收到的信息的指纹值逐个与第一信息的第一指纹值进行匹配。当信息的指纹值与第一指纹值的相似度在一定范围内,则判定为二者匹配,即该信息与该第一信息匹配。
S103,若在所述第一信息库中匹配到与所述信息对应的第一目标信息,则按照所述第一目标信息对应的第一属性信息对所述信息进行处理;
具体地,若在第一信息库中匹配到该信息的第一目标信息,表明该信息与该第一目标信息属于同一类信息,因此可以采用第一目标信息的处理方式去处理该信息。第一目标信息的处理方式存储在对应的第一属性信息中,因此可以采用第一目标信息对应的第一属性信息处理该信息。例如,若该信息与“尊敬的用户您好,您此次的验证码是1234。”这一第一信息匹配,可以采用其对应的属性信息“直接通过”对该信息处理,将该信息直接通过,发送至目标终端。
S104,若在所述第一信息库中未匹配到与所述信息对应的第一目标信息,则将所述信息与预设的第二信息库中的第二信息进行匹配,根据所述第二信息库的匹配结果对所述信息进行处理。
上述第二信息库可以是历史信息库,历史信息库中可以包括服务器中存放的所有收发过的信息及其对应的属性信息。当该信息在第一信息库中未找到对应的第一目标信息,则可以将该信息与历史信息库中的信息进行匹配,若该信息在历史信息库中匹配到对应的第二信息,则可以将该信息按照该对应的第二信息的属性信息进行处理。
本实施例中,将接收到的信息与第一信息库中的标准信息进行比对,若该信息与标准信息相似,则可以按照标准信息的处理方式对该信息进行处理;若在第一信息库中未匹配到与该信息相似的标准信息,可以将其与第二信息库中的历史信息进行匹配,根据匹配结果对该信息进行处理。在对信息的处理过程中,通过双重匹配,提高了处理的正确率;通过指纹值的匹配,降低了匹配过程中因为语义复杂而造成的影响。
图2是本申请实施例二提供的一种信息处理方法流程示意图,如图2所示,所述方法包括:
S201,当接收到待处理的信息时,根据预设的分词库,对所述信息进行分词;
上述分词库中包括短信可能会有的词语,例如“您好”,“是”等等,对信息进行分词,是指若该信息是一个较长的语句,将其划分为各个词语,这些词语必须是分词库中包含的词语。存在一些情况,几个词语按不同的语序组成不同的语句,各个语句的信息相同,将信息分词,能够在进行信息匹配时,减少语序对信息内容的影响。
具体地,当服务器接收到信息时,对信息按照预设的分词库,将信息分为各个词语,以便于接下来对信息进行指纹值运算。一般情况下,信息中的标点符号,可以不参与分词,对于不在分词库中的词语,可以不参与分词。例如,收到信息为“您好,您此次的验证码是a5c2.”,按照分词库对其进行分词得到“您好”,“您”,“此次”,“验证码”,“是”。对于标点符号、“的”以及“a5c2”,因为其不在分词库中,所以可以不参与分词。一般情况下,“的”是一个结构助词,对信息内容不会造成影响,因此可以不用将“的”进行分词。
S202,计算分词后的各个词语的哈希值,并确定所述各个词语的权重值;
具体地,采用哈希算法计算各个词语的哈希值,并确定各个词语的权重值。词语的权重值可以根据其位置、信息含量、频率等等进行确定。例如,可以根据词语在信息中的位置确定其权重值,对于信息“您好,您此次的验证码是a5c2.”,可以按照位置确定各个词语的权重为:“您好(5),您(4),此次(3),验证码(2),是(1)”,括号中的数字为各个词语的权重。
S203,根据所述各个词语的权重值,对所述各个词语的哈希值按位进行加权求和,得到所述信息的指纹值;
具体地,采用各个词语的哈希值的二进制形式对哈希值进行处理。若哈希值中的二进制位上为“1”,将这一位用数字“1”表示;若哈希值中的二进制位上为“0”,将这一位用数字“-1”表示,再将哈希值各个位的数字表示为该位的数字乘以该词语的权重值,然后将各个词语的哈希值按位进行加法运算,对于得到的结果,如果其某一位上的数字,大于0,则记为1,否则记为0,对结果进行降维得到该信息的指纹值。
示例性的,对于信息“您好,您此次的验证码是a5c2.”,进行分词得到“您好”,“您”,“此次”,“验证码”,“是”这5个词语,再按照这些词语的位置赋予各个词语权重值为分别5、4、3、2、1。
对各个词语分别计算得到其哈希值分别为:
您好:101011
您:101111
此次:101010
验证码:111011
是:001011
若哈希值中的二进制位上为“1”,将这一位用数字“+1”表示;若哈希值中的二进制位上为“0”,将这一位用数字“-1”表示,得到结果为:
您好:+1-1+1-1+1+1
您:+1-1+1+1+1+1
此次:+1-1+1-1+1-1
验证码:+1+1+1-1+1+1
是:-1-1+1-1+1+1
再将哈希值各个位的数字表示为该位的数字乘以该词语的权重值,得到结果为:
您好:+5-5+5-5+5+5
您:+4-4+4+4+4+4
此次:+3-3+3-3+3-3
验证码:+2+2+2-2+2+2
是:-1-1+1-1+1+1
然后将各个词语的哈希值按位进行加法运算,得到结果为:
13-11+15-7+15+10
对其进行降维,即对于得到的结果,如果其某一位上的数字,大于0,记为1,否则记为0,得到该信息的指纹值为101011。
S204,逐个计算所述指纹值与所述第一信息库中各个第一信息的第一指纹值之间的相似度;
第一信息库中的各个第一信息采用与S203中相同的办法计算其对应的第一指纹值。
在进行匹配时,逐个计算该信息的指纹值与第一信息库中的各个第一信息的第一指纹值的相似度。指纹值与第一指纹值均为二进制数字,可以采用任何计算两个二进制数字之间相似度的算法来计算二者的相似度。
S205,当计算得到所述相似度在预设范围内时,则识别在预设范围内的所述相似度对应的第一信息为与所述信息匹配的第一目标信息,并停止计算所述指纹值与所述第一信息库中其他第一指纹值之间的相似度;
具体地,若存在一个第一信息的第一指纹与该信息的指纹值的相似度在预设范围内,则可以将该第一信息记为第一目标信息。此时,停止对该信息与第一信息匹配,即停止计算指纹值与第一信息库中其他第一指纹值之间的相似度。
在其他可能的实现方式中,也可以分别计算出指纹值与第一信息库中各个第一信息的第一指纹值的相似度,然后选取其中最大的相似度与相似度范围进行比较,若该最大相似度在相似度范围内,则将该最大相似度对应的第一信息识别为与该信息匹配的第一目标信息。
S206,若在所述第一信息库中匹配到与所述信息对应的第一目标信息,则按照所述第一目标信息对应的第一属性信息对所述信息进行处理;
具体地,若在第一信息库中匹配到该信息的第一目标信息,则表明该信息与第一目标信息属于同一类信息,若第一目标信息为正常信息,则将该信息也识别为正常信息;若第一目标信息为敏感信息,则将该信息也识别为敏感信息。采用第一目标信息的属性信息对该信息进行处理。其中第一目标信息的属性信息中存储了第一目标信息对应的处理方式。
S207,若在所述第一信息库中未匹配到与所述信息对应的第一目标信息,则将所述信息与预设的第二信息库中的第二信息进行匹配,根据所述第二信息库的匹配结果对所述信息进行处理。
第二信息库可以是指历史信息库,其中包括了服务器处理过的信息及其对应的处理方式。
具体地,若该信息在第一信息库中未找到对应的第一目标信息,则可以将该信息与历史信息库中的信息进行匹配,若该信息在历史信息库中匹配到对应的第二信息,则可以将该信息按照该对应的第二信息的属性信息进行处理;若该信息在历史信息库中未匹配到对应的第二信息,则可以将该信息提交至人工审核处进行处理。
本实施例中,在进行指纹值计算时,对信息进行了分词,并根据各个分词的哈希值和权重值计算得到指纹值,避免了语序和无意义词语的影响;通过指纹值对待处理信息和标准信息进行匹配,降低了因为中文语义复杂造成的影响,提高信息处理的准确率;信息处理过程中进行了双重匹配,第一重匹配可以对大多数常见信息进行处理,第二重匹配可以对一些不常见信息或新形式信息进行处理,通过两次匹配,提高了信息处理的效率。
图3是本申请实施例三提供的一种信息处理方法流程示意图,如图3所示,所述方法包括:
S301,当接收到待处理的信息时,计算所述信息的指纹值;
S302,根据所述指纹值,将所述信息与预设的第一信息库中的第一信息进行匹配;
S303,若在所述第一信息库中匹配到与所述信息对应的第一目标信息,则按照所述第一目标信息对应的第一属性信息对所述信息进行处理;
本实施例中的S301-S303与前述实施例一中的S101-S103相似,可以相互参考,不再赘述。
S304,逐个计算所述指纹值与所述各个第一指纹值的汉明距离;
具体地,可以采用指纹值与各个第一指纹值的字符差异数量即汉明距离来表示二者之间的相似度。指纹值与第一指纹值的汉明距离越大,说明二者之间的相似度越低;指纹值与第一指纹值之间的汉明距离越小,说明二者之间的相似度越高。汉明距离可以表示两个相同长度的字符串对应位不同的数量,对两个字符串进行异或运算,并统计结果为1的个数,那么这个数就是汉明距离。
示例性的,若该信息的内容为“尊敬的用户你好,你此次的验证码是1234。”,经过计算得到的指纹值为:100011;第一信息库中的第一信息为“尊敬的用户您好,您此次的验证码是1234。”经过计算得出第一指纹值为:101011。则该指纹值与第一指纹值之间的汉明距离为1。
S305,若所述指纹值与某一第一指纹值的汉明距离小于预设的汉明距离阈值,则判定所述指纹值与所述第一指纹值的相似度在预设范围内,则识别在预设范围内的所述相似度对应的第一信息为与所述信息匹配的第一目标信息;
具体地,设置一个汉明距离阈值,当指纹值与第一指纹值的汉明距离小于该汉明距离阈值时,则判定该指纹值与第一指纹值的相似度在预设范围内,识别该第一信息为第一目标信息,并将该信息按照第一目标信息的属性信息进行处理。
S306,将所述信息添加至所述第一信息库中,对所述第一目标信息的匹配次数加1;
具体地,为了更新第一信息库中的第一信息,可以将接收到的信息添加至第一信息库中,将第一目标信息的属性信息添加至该信息的属性信息中。同时,第一信息库中的第一目标信息完成了一次成功的匹配,可以将第一目标信息的匹配次数加1。第一信息库中的每个第一信息对应一个匹配次数,用来表示各个第一信息在单位时间内被匹配的次数,初始值为0,若在信息处理过程中,某一第一信息被匹配为服务器接收的待处理信息的第一目标信息,则可以将该第一信息的匹配次数加1。第一信息的匹配次数越大,表明服务器接收到的信息中与该第一信息相似的信息越多,该第一信息在第一信息库中的利用率高,因而其更有必要作为一个标准信息出现在第一信息库中。
一般情况下,第一信息库中应该包括各种常见形式的第一信息,因此大部分信息可以在与第一信息库中的第一信息匹配后,就能得到相对应的处理方式。第一信息是否属于常见的信息格式,可以采用其对应的匹配次数来衡量。
S307,若所述指纹值与任一第一指纹值的汉明距离大于预设的汉明距离阈值,则在所述第一信息库中未匹配到与所述信息对应的第一目标信息,则将所述信息与预设的第二信息库中的第二信息进行匹配;
具体地,若计算得到该指纹与每个第一指纹值的汉明距离均大于汉明距离阈值,则表明该信息在第一信息库中未匹配到相似的第一信息,此时可以将该信息与第二信息库中的第二信息进行匹配。
服务器有时会接收到的一些信息可能属于比较少见的形式,或者是新的形式,这些信息与第一信息库中的所有第一信息都不相似,因此无法通过第一信息库中的第一信息判断这些信息对应的处理方式。因而需要将这些信息与第二信息库中的信息进行匹配。
S308,若在所述第二信息库中匹配到与所述信息对应的第二目标信息,则按照所述第二目标信息对应的第二属性信息对所述信息进行处理,并将所述信息添加至所述第一信息库,对所述信息的匹配次数加1;
具体地,该信息与第二信息库中的第二信息的匹配,也是通过指纹值来进行的,该信息与第二信息的相似度计算和匹配判断过程可以参考该信息与第一信息的相似度计算和匹配判断过程。若该信息与某一第二信息的相似度在预设范围内,则表明该信息与该第二信息匹配,可以按照该第二信息的属性信息处理该信息。而且可以将该信息作为标准信息添加至第一信息库中,因为该信息与第二信息匹配成功过一次,所以将该信息的匹配次数加1。
第二信息库可以为历史信息库,其中包含了服务器中存储的处理过的所有历史信息,上述第二信息即历史信息。历史信息库中的信息有些是常见的形式,有些属于不常见的形式。对于与第一信息库中第一信息匹配失败的信息,很可能与之前服务器处理过的某个历史信息相似,因而可以采用服务器对历史信息的处理方式处理该信息。
在本实施例的另一种可能的实现方式中,将该信息设置为临时标准信息,统计其在预设统计周期内的匹配次数,若其超过一定数值,则可以将其在一定时间内添加至第一信息库中。示例性地,预设统计周期及阈值为:4小时内,临时标准信息的匹配次数不小于100次,则将该临时标准信息在接下来的30天内设置为标准信息;30天内,临时标准信息的匹配次数不小于1000次,则将该临时标准信息在接下来的365天内设置为标准信息。
示例性地,预设统计周期为24小时,若临时标准信息的匹配次数不小于100次,则将该临时标准信息在接下来的30天内设置为标准信息;标准信息或临时标准信息的匹配次数小于10次,则将该标准信息或临时标准信息从标准信息库中删除;
30天内,临时标准信息的匹配次数不小于1000次,则将该临时标准信息在接下来的365天内设置为标准信息。
S309,若在所述第二信息库中未匹配到与所述信息对应的第二目标信息,则获取经人工审核提交的针对所述信息的处理方式,按照所述处理方式对所述信息进行处理;
服务器接收到的信息,若与历史信息库中的历史信息全部都不相似,则可以将该信息提交至人工审核处,获取人工审核的处理结果,再对其进行处理。
之后该信息会存储在历史信息库中,其处理方式作为对应的属性信息也存储在历史信息库中。
S310,统计预设时间内所述第一信息库中的各个第一信息的匹配次数;
具体地,可以统计第一信息库中各个第一信息的匹配次数,来判断在这段时间内,第一信息是否属于常见的信息种类。
S311,若某一第一信息的匹配次数小于预设阈值,则将所述匹配次数小于预设阈值的第一信息从所述第一信息库中删除;
具体地,可以预先设置一个数值作为预设时间内第一信息库中第一信息的最低匹配次数,可以将该数值记为预设阈值。在预设时间内,若某一第一信息的匹配次数小于预设阈值,则表明其在这段时间内并没有达到预设的利用率,因而可以将其从第一信息库中删除,减少第一信息库中的第一信息数量,从而降低待处理信息与第一信息库中的第一信息进行匹配时的计算成本。
示例性地,预设时间为24小时,第一预设阈值为10;即在24小时内,若某一第一信息的匹配次数小于10,则将该第一信息从第一信息库中删除。
S312,若某一第一信息的匹配次数大于或等于预设阈值,则将所述匹配次数大于或等于预设阈值的第一信息添加至第一信息库中。
具体地,在预设时间内,若某一第一信息的匹配次数大于或等于预设阈值,则表明该第一信息在预设时间内的利用率达到预期值,则将该第一信息继续留在第一信息库中作为标准信息与之后的待处理信息进行匹配。
每隔预设时间,需要统计第一信息库中的第一信息的匹配次数,根据各个第一信息的匹配次数,对第一信息库进行更新。更新完第一信息库后,可以将更新后的第一信息库中的第一信息的匹配次数设置为0。
本实施例中,可以根据接收到的信息与标准信息相似度匹配结果,对接收到的信息进行处理,并可根据监测标准信息的匹配频率,对第一信息库进行更新,相当于进一步优化处置规则,极大的提升了信息处理的准确度与效率。
图4是本申请实施例四提供的一种信息处理装置的结构示意图,如图4所示,所述信息处理装置4包括以下模块:
计算模块41,用于当接收到待处理的信息时,计算所述信息的指纹值;
第一匹配模块42,用于根据所述指纹值,将所述信息与预设的第一信息库中的第一信息进行匹配;
处理模块43,用于若在所述第一信息库中匹配到与所述信息对应的第一目标信息,则按照所述第一目标信息对应的第一属性信息对所述信息进行处理;
第二匹配模块44,用于若在所述第一信息库中未匹配到与所述信息对应的第一目标信息,则将所述信息与预设的第二信息库中的第二信息进行匹配,根据所述第二信息库的匹配结果对所述信息进行处理。
上述信息处理装置4的计算模块41具体可以包括以下子模块:
分词子模块,用于当接收到待处理的信息时,根据预设的分词库,对所述信息进行分词;
哈希值计算子模块,用于计算分词后的各个词语的哈希值,并确定所述各个词语的权重值;
指纹值计算子模块,用于根据所述各个词语的权重值,对所述各个词语的哈希值按位进行加权求和,得到所述信息的指纹值。
上述信息处理装置4的第一匹配模块42具体可以包括以下子模块:
相似度计算子模块,用于逐个计算所述指纹值与所述第一信息库中各个第一信息的第一指纹值之间的相似度;
判断子模块,用于当计算得到所述相似度在预设范围内时,则识别在预设范围内的所述相似度对应的第一信息为与所述信息匹配的第一目标信息,并停止计算所述指纹值与所述第一信息库中其他第一指纹值之间的相似度。
上述信息处理装置4的计算模块41中的相似度计算子模块具体可以包括以下单元:
汉明距离计算单元,用于逐个计算所述指纹值与所述各个第一指纹值的汉明距离;
汉明距离判断单元,用于若所述指纹值与某一第一指纹值的汉明距离小于预设的汉明距离阈值,则判定所述指纹值与所述第一指纹值的相似度在预设范围内。
上述信息处理装置4的具体可以还包括以下模块:
第一信息库增添模块,用于将所述信息添加至所述第一信息库中,对所述第一目标信息的匹配次数加1。
上述信息处理装置4的第二匹配模块44具体可以包括以下子模块:
第二目标信息确定子模块,用于若在所述第二信息库中匹配到与所述信息对应的第二目标信息,则按照所述第二目标信息对应的第二属性信息对所述信息进行处理,并将所述信息添加至所述第一信息库,对所述信息的匹配次数加1;
人工审核提交子模块,用于若在所述第二信息库中未匹配到与所述信息对应的第二目标信息,则获取经人工审核提交的针对所述信息的处理方式,按照所述处理方式对所述信息进行处理。
上述信息处理装置4的具体可以还包括以下模块:
匹配次数统计模块,用于统计预设时间内所述第一信息库中的各个第一信息的匹配次数;
第一信息删除模块,用于若某一第一信息的匹配次数小于预设阈值,则将所述匹配次数小于预设阈值的第一信息从所述第一信息库中删除;
第一信息添加模块,用于若某一第一信息的匹配次数大于或等于预设阈值,则将所述匹配次数大于或等于预设阈值的第一信息添加至第一信息库中。
图5为本申请实施例五提供的服务器的结构示意图。如图5所示,该实施例的服务器5包括:至少一个处理器50(图5中仅示出一个)处理器、存储器51以及存储在所述存储器51中并可在所述至少一个处理器50上运行的计算机程序52,所述处理器50执行所述计算机程序52时实现上述任意各个方法实施例中的步骤。
该服务器可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图5仅仅是服务器5的举例,并不构成对服务器5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
所称处理器50可以是中央处理单元(CentralProcessingUnit,CPU),该处理器50还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现成可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器51在一些实施例中可以是所述服务器5的内部存储单元,例如服务器5的硬盘或内存。所述存储器51在另一些实施例中也可以是所述服务器5的外部存储设备,例如所述服务器5上配备的插接式硬盘,智能存储卡(SmartMediaCard,SMC),安全数字(SecureDigital,SD)卡,闪存卡(FlashCard)等。进一步地,所述存储器51还可以既包括所述服务器5的内部存储单元也包括外部存储设备。所述存储器51用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在服务器上运行时,使得服务器执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/服务器的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (8)

1.一种信息处理方法,其特征在于,应用于服务器,所述方法包括:
当接收到待处理的信息时,计算所述信息的指纹值;
根据所述指纹值,将所述信息与预设的第一信息库中的第一信息进行匹配;其中,所述第一信息库中存放的第一信息均为标准信息,所述标准信息包括标准正常信息和标准敏感信息;
若在所述第一信息库中匹配到与所述信息对应的第一目标信息,则按照所述第一目标信息对应的第一属性信息对所述信息进行处理;
若在所述第一信息库中未匹配到与所述信息对应的第一目标信息,则将所述信息与预设的第二信息库中的第二信息进行匹配,根据所述第二信息库的匹配结果对所述信息进行处理,包括:
若所述信息在第二信息库中匹配到对应的第二信息,则将所述信息按照所述对应的第二信息的属性信息进行处理;其中,所述第二信息库是历史信息库,历史信息库中包括服务器中存放的所有收发过的信息及其对应的属性信息;
其中,所述将所述信息与预设的第二信息库中的第二信息进行匹配,根据所述第二信息库的匹配结果对所述信息进行处理,包括:
若在所述第二信息库中匹配到与所述信息对应的第二目标信息,则按照所述第二目标信息对应的第二属性信息对所述信息进行处理,并将所述信息设置为临时标准信息,统计其在预设统计周期内的匹配次数,若其超过一定数值,则将其在一定时间内添加至第一信息库中;
若在所述第二信息库中未匹配到与所述信息对应的第二目标信息,则获取经人工审核提交的针对所述信息的处理方式,按照所述处理方式对所述信息进行处理;
统计预设时间内所述第一信息库中的各个第一信息的匹配次数;
若某一第一信息的匹配次数小于预设阈值,则将所述匹配次数小于预设阈值的第一信息从所述第一信息库中删除;
若某一第一信息的匹配次数大于或等于预设阈值,则将所述匹配次数大于或等于预设阈值的第一信息添加至第一信息库中。
2.如权利要求1所述的方法,其特征在于,所述当接收到待处理的信息时,计算所述信息的指纹值,包括:
当接收到待处理的信息时,根据预设的分词库,对所述信息进行分词;
计算分词后的各个词语的哈希值,并确定所述各个词语的权重值;
根据所述各个词语的权重值,对所述各个词语的哈希值按位进行加权求和,得到所述信息的指纹值。
3.如权利要求1所述的方法,其特征在于,所述根据所述指纹值,将所述信息与预设的第一信息库中的第一信息进行匹配,包括:
逐个计算所述指纹值与所述第一信息库中各个第一信息的第一指纹值之间的相似度;
当计算得到所述相似度在预设范围内时,则识别在预设范围内的所述相似度对应的第一信息为与所述信息匹配的第一目标信息,并停止计算所述指纹值与所述第一信息库中其他第一指纹值之间的相似度。
4.如权利要求3所述的方法,其特征在于,所述逐个计算所述指纹值与所述第一信息库中各个第一信息的第一指纹值之间的相似度,包括:
逐个计算所述指纹值与所述各个第一信息的第一指纹值的汉明距离;
若所述指纹值与某一第一指纹值的汉明距离小于预设的汉明距离阈值,则判定所述指纹值与所述第一指纹值的相似度在预设范围内。
5.如权利要求1所述的方法,其特征在于,在按照所述第一目标信息对应的第一属性信息对所述信息进行处理之后,还包括:
将所述信息添加至所述第一信息库中,对所述第一目标信息的匹配次数加1。
6.一种信息处理装置,其特征在于,包括:
计算模块,用于当接收到待处理的信息时,计算所述信息的指纹值;
第一匹配模块,用于根据所述指纹值,将所述信息与预设的第一信息库中的第一信息进行匹配;其中,所述第一信息库中存放的第一信息均为标准信息,所述标准信息包括标准正常信息和标准敏感信息;
处理模块,用于若在所述第一信息库中匹配到与所述信息对应的第一目标信息,则按照所述第一目标信息对应的第一属性信息对所述信息进行处理;
第二匹配模块,用于若在所述第一信息库中未匹配到与所述信息对应的第一目标信息,则将所述信息与预设的第二信息库中的第二信息进行匹配,根据所述第二信息库的匹配结果对所述信息进行处理;其中,所述第二信息库是历史信息库,历史信息库中包括服务器中存放的所有收发过的信息及其对应的属性信息,包括:
若所述信息在第二信息库中匹配到对应的第二信息,则将所述信息按照所述对应的第二信息的属性信息进行处理;
其中,所述将所述信息与预设的第二信息库中的第二信息进行匹配,根据所述第二信息库的匹配结果对所述信息进行处理,包括:
若在所述第二信息库中匹配到与所述信息对应的第二目标信息,则按照所述第二目标信息对应的第二属性信息对所述信息进行处理,并将所述信息设置为临时标准信息,统计其在预设统计周期内的匹配次数,若其超过一定数值,则将其在一定时间内添加至第一信息库中;
若在所述第二信息库中未匹配到与所述信息对应的第二目标信息,则获取经人工审核提交的针对所述信息的处理方式,按照所述处理方式对所述信息进行处理;
统计预设时间内所述第一信息库中的各个第一信息的匹配次数;
若某一第一信息的匹配次数小于预设阈值,则将所述匹配次数小于预设阈值的第一信息从所述第一信息库中删除;
若某一第一信息的匹配次数大于或等于预设阈值,则将所述匹配次数大于或等于预设阈值的第一信息添加至第一信息库中。
7.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的方法。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的方法。
CN201911399184.2A 2019-12-30 2019-12-30 一种信息处理方法、装置、服务器及介质 Active CN111177362B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911399184.2A CN111177362B (zh) 2019-12-30 2019-12-30 一种信息处理方法、装置、服务器及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911399184.2A CN111177362B (zh) 2019-12-30 2019-12-30 一种信息处理方法、装置、服务器及介质

Publications (2)

Publication Number Publication Date
CN111177362A CN111177362A (zh) 2020-05-19
CN111177362B true CN111177362B (zh) 2023-08-22

Family

ID=70650526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911399184.2A Active CN111177362B (zh) 2019-12-30 2019-12-30 一种信息处理方法、装置、服务器及介质

Country Status (1)

Country Link
CN (1) CN111177362B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113312127A (zh) * 2021-05-13 2021-08-27 深圳市梦网云创科技有限公司 一种信息的显示方法、装置、服务器和介质
CN115374366B (zh) * 2022-09-15 2023-04-07 中航信移动科技有限公司 一种匹配信息的生成方法、存储介质及电子设备
CN116737908A (zh) * 2023-07-19 2023-09-12 北京百度网讯科技有限公司 知识问答方法、装置、设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8272051B1 (en) * 2008-03-27 2012-09-18 Trend Micro Incorporated Method and apparatus of information leakage prevention for database tables
CN109614608A (zh) * 2018-10-26 2019-04-12 平安科技(深圳)有限公司 电子装置、文本信息检测方法及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3990115B2 (ja) * 2001-03-12 2007-10-10 株式会社東芝 サーバ側プロキシ装置及びプログラム
CN106066884A (zh) * 2016-06-06 2016-11-02 珠海市小源科技有限公司 一种信息安全识别方法和装置
CN109359183B (zh) * 2018-10-11 2021-04-23 南京中孚信息技术有限公司 文本信息的查重方法、装置及电子设备
CN109710729A (zh) * 2018-12-14 2019-05-03 麒麟合盛网络技术股份有限公司 一种文本数据的采集方法及装置
CN109766525A (zh) * 2019-01-14 2019-05-17 湖南大学 一种数据驱动的敏感信息泄露检测框架
CN110414251B (zh) * 2019-07-31 2021-01-05 北京明朝万达科技股份有限公司 数据监测方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8272051B1 (en) * 2008-03-27 2012-09-18 Trend Micro Incorporated Method and apparatus of information leakage prevention for database tables
CN109614608A (zh) * 2018-10-26 2019-04-12 平安科技(深圳)有限公司 电子装置、文本信息检测方法及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于短语级情感分析的不良信息检测方法;明弋洋;刘晓洁;;四川大学学报(自然科学版);56(06);第60-65页 *

Also Published As

Publication number Publication date
CN111177362A (zh) 2020-05-19

Similar Documents

Publication Publication Date Title
CN111177362B (zh) 一种信息处理方法、装置、服务器及介质
KR101627592B1 (ko) 비밀 정보의 검출
US10152531B2 (en) Computer-implemented systems and methods for comparing and associating objects
WO2020134657A1 (zh) 系统日志脱敏方法、脱敏系统、计算机设备及存储介质
CN106294105B (zh) 刷量工具检测方法和装置
WO2021135919A1 (zh) 基于机器学习的sql语句安全检测方法、装置、设备及介质
CN108009435B (zh) 数据脱敏方法、装置及存储介质
CN114265740A (zh) 错误信息处理方法、装置、设备及存储介质
CN118396786A (zh) 合同文档审核方法和装置、电子设备及计算机可读存储介质
CN111340574B (zh) 风险用户的识别方法、装置和电子设备
CN110380952B (zh) 邮件收发方法及装置
CN112488857B (zh) 事件识别的方法、装置、电子设备和存储介质
US11651246B2 (en) Question inference device
CN109033070B (zh) 一种数据处理方法、服务器及计算机可读介质
CN113282837A (zh) 事件分析方法、装置、计算机设备及存储介质
CN112686762A (zh) 保单数据违规检测方法、装置、计算机设备及存储介质
CN113449232A (zh) 一种数据处理方法、装置、设备和存储介质
CN107690130A (zh) 一种信息识别方法及系统
CN113591440B (zh) 一种文本处理方法、装置及电子设备
CN112381408B (zh) 质检方法、装置和电子设备
CN115527226B (zh) 文字可靠识别的方法、装置和电子设备
CN117011011A (zh) 审核数据的处理方法、装置、设备及存储介质
CN108306811B (zh) 一种消息处理方法及装置
CN117150264A (zh) 一种敏感数据识别方法及系统
CN116663562A (zh) 基于人工智能的实体识别方法、装置、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant