CN109522423B - 指纹植入和信息识别方法、装置、计算机设备和存储介质 - Google Patents

指纹植入和信息识别方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109522423B
CN109522423B CN201811295446.6A CN201811295446A CN109522423B CN 109522423 B CN109522423 B CN 109522423B CN 201811295446 A CN201811295446 A CN 201811295446A CN 109522423 B CN109522423 B CN 109522423B
Authority
CN
China
Prior art keywords
information
fingerprint
type
issued
implanting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811295446.6A
Other languages
English (en)
Other versions
CN109522423A (zh
Inventor
袁亚南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shangzhouwang Technology Co ltd
Original Assignee
Shenzhen Shangzhouwang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Shangzhouwang Technology Co ltd filed Critical Shenzhen Shangzhouwang Technology Co ltd
Priority to CN201811295446.6A priority Critical patent/CN109522423B/zh
Publication of CN109522423A publication Critical patent/CN109522423A/zh
Application granted granted Critical
Publication of CN109522423B publication Critical patent/CN109522423B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Collating Specific Patterns (AREA)

Abstract

本申请涉及一种指纹植入方法,所述方法包括:检测待发布信息,获得信息类型,所述信息类型为第一文本类型或第二文本类型;根据所述信息类型生成信息指纹,并将所述信息指纹植入所述待发布信息中,生成发布信息;将所述发布信息发送至网络中。一种信息识别方法,所述方法包括:获取网络信息集合;依照指定的信息指纹,在网络信息集合中筛选与指定的信息指纹相匹配的发布信息。上述方法,通过在用户的信息中,加入信息指纹,让用户的信息具有很好的识别性,可以快速从众多类似信息中,找出归属于特定用户的信息,在获取到的大量同类信息时,利用信息指纹排准确找出特定用户的信息,可以大幅度提高互联网特定信息鉴别和提取的准确性。

Description

指纹植入和信息识别方法、装置、计算机设备和存储介质
技术领域
本申请涉及信息处理技术,特别是涉及一种指纹植入和信息识别方法、装置、计算机设备和存储介质。
背景技术
随着互联网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找自己所需的信息,就象大海捞针一样,信息处理技术则应运而生,信息处理是指将网络上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库,从而对用户提出的各种检索作出响应,提供用户所需的信息或相关指针。用户的检索途径主要包括自由词全文检索、关键词检索、分类检索及其他特殊信息的检索。
在网络推广领域,一般需要为用户大量发布商业内容,并对发布的商业内容的收录、排名、访问量等进行统计。在许多情况下,根据网页内容来准确判断该内容是否属于特定用户,从而将各种统计数据归入该用户名下。
目前的传统方法,由于推广内容常常发布在第三方平台,平台对内容会进行补充、整合、加工,从而导致内容变形,在进行信息处理时,鉴别信息的归属方面误判率较高。
发明内容
基于此,有必要针对上述技术问题,提供一种能够准确鉴别信息的归属方面的指纹植入和信息识别方法、装置、计算机设备和存储介质。
一种指纹植入方法,
所述指纹植入方法包括:
检测待发布信息,获得信息类型,所述信息类型为第一文本类型或第二文本类型;
根据所述信息类型生成信息指纹,并将所述信息指纹植入所述待发布信息中,生成发布信息,所述信息指纹包括多个指纹特征;
将所述发布信息发送至网络中。
在其中一个实施例中,所述信息指纹为多个指纹特征,所述信息指纹包括分别与不同的文本类型相对应的第一指纹和第二指纹,所述第一指纹和所述第二指纹分别包括多个指纹特征。
在其中一个实施例中,
所述根据所述信息类型生成信息指纹,并将所述信息指纹植入所述待发布信息中步骤还包括:
若所述信息类型为所述第一文本类型,则将所述信息指纹以字符的方式植入所述待发布信息中;
若所述信息类型为所述第二文本类型,则将所述信息指纹以标签和/或字符的方式植入所述待发布信息中。
在其中一个实施例中,所述第一文本类型为纯文本格式,所述第二文本类型为富文本格式。
一种信息识别方法,所述方法包括:
获取网络信息集合;
依照指定的信息指纹,在网络信息集合中筛选与指定的信息指纹相匹配的发布信息;其中,所述发布信息是所述的指纹植入方法生成。
在其中一个实施例中,所述依照指定的信息指纹,在网络信息集合中筛选与指定的信息指纹相匹配的发布信息包括:
通过多个所述指纹特征筛选所述网络信息集合;或
通过单一所述指纹特征筛选所述网络信息集合。
一种指纹植入装置,所述指纹植入装置包括:
检测模块,用于检测待发布信息,获得信息类型,所述信息类型为第一文本类型或第二文本类型;
指纹模块,用于根据所述信息类型生成信息指纹,并将所述信息指纹植入所述待发布信息中,生成发布信息;
发布模块,用于将所述发布信息发送至网络中。
一种信息识别装置,所述信息识别装置包括:
获取模块,用于获取网络信息集合
筛选模块,用于依照指定的信息指纹,在网络信息集合中筛选与指定的信息指纹相匹配的发布信息;其中,所述发布信息是所述的指纹植入方法生成。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
检测待发布信息,获得信息类型,所述信息类型为第一文本类型或第二文本类型;
根据所述信息类型生成信息指纹,并将所述信息指纹植入所述待发布信息中,生成发布信息;
将所述发布信息发送至网络中;
获取网络信息集合;
依照指定的信息指纹,在网络信息集合中筛选与指定的信息指纹相匹配的发布信息;其中,所述发布信息是所述的指纹植入方法生成。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
检测待发布信息,获得信息类型,所述信息类型为第一文本类型或第二文本类型;
根据所述信息类型生成信息指纹,并将所述信息指纹植入所述待发布信息中,生成发布信息;
将所述发布信息发送至网络中;
获取网络信息集合;
依照指定的信息指纹,在网络信息集合中筛选与指定的信息指纹相匹配的发布信息;其中,所述发布信息是所述的指纹植入方法生成。
上述指纹植入和信息识别方法、装置、计算机设备和存储介质方法、装置、计算机设备和存储介质,通过在用户的信息中,加入信息指纹,让用户的信息具有很好的识别性,同时,不破坏或极少破坏用户信息的可读性和自然性,可以快速从众多类似信息中,找出归属于特定用户的信息,从而在获取到的大量同类信息时,利用信息指纹排准确找出特定用户的信息,可以大幅度提高互联网特定信息鉴别和提取的准确性。
附图说明
图1为一个实施例中指纹植入方法的流程示意图;
图2为一个实施例中信息识别方法的流程示意图;
图3为一个实施例中指纹植入装置的结构框图;
图4为一个实施例中信息识别装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种指纹植入方法,包括以下步骤:
步骤102,检测待发布信息,获得信息类型,所述信息类型为第一文本类型或第二文本类型。
可选地,所述第一文本类型为纯文本格式,所述第二文本类型为富文本格式。其中,所述纯文本格式为没有任何文本修饰的文本,即没有任何粗体,下划线,斜体,图形,符号或特殊字符及特殊打印格式的文本,只存在文本,不存在其格式设置。所述纯文本格式将所有的分节符、分页符、新行字符转换为段落标记。
所述富文本格式(Rich Text Format,一般简称为RTF)由未格式化本文、控制字、控制符和组组成,所述富文本格式的文件能同时包括字体、格式、屏幕颜色、图形、脚注、注释(注解)、文件头和文件尾、摘要信息、域和书签的组合,以及文档、区段、段落和字符的格式属性。
步骤104,根据所述信息类型生成信息指纹,并将所述信息指纹植入所述待发布信息中,生成发布信息。
其中,所述信息指纹为多个指纹特征。所述信息指纹包括分别与不同的文本类型相对应的第一指纹和第二指纹,所述第一指纹和所述第二指纹分别包括多个指纹特征。
所述步骤还包括:
若所述信息类型为所述第一文本类型,则将所述信息指纹以字符的方式植入所述待发布信息中。
若所述信息类型为所述第二文本类型,则将所述信息指纹以标签和/或字符的方式植入所述待发布信息中。
可选地,若所述信息类型为所述纯文本格式,则将所述第一指纹以字符的方式植入所述待发布信息中。具体地,所述第一指纹采用特定字符进行组合生成多个所述指纹特征,其中所述特定字符采用较少出现的组合,提高生成所述发布信息的独特性,使用出现概率越小的组合,则发布信息与未植入指纹的信息更容易区分。所述特定字符包括但不限于稀缺汉字、稀缺英文单词、错别字、稀缺字符或其他低概率出现的字符组合。在一个实施例中,若所述纯文本格式为中文,则所述特定字符采用生僻汉字进行组合作为信息指纹植入所述待发布信息中。在另一实施例中,若所述纯文本格式为英文字母,则所述特定字符采用特定拼写的英文作为信息指纹植入所述待发布信息中。可以理解,所述特定字符的类型不限,只需使用出现概率较低的组合即可。
可选地,若所述信息类型为所述富文本格式,则将所述第二指纹以标签和/或字符的方式植入所述待发布信息中。具体地,所述第二指纹采用特殊的编码组成,将所述第二指纹以标签的方式植入富文本格式的待发布信息中,因特殊的编码重复概率低,使生成的发布信息的独特性提高。所述第二指纹以字符方式植入所述待发布信息与所述第一指纹相同,在此不做赘述。可以理解,所述富文本格式也可以通过标签和字符的方式植入所述待发布信息,增加生成的所述发布信息的独特性。
步骤106,将所述发布信息发送至网络中。
所述发布信息发布在第三方平台,所述第三方平台再将所述发布信息发布于网络上。
上述指纹植入方法通过在用户的信息中,加入信息指纹,让用户的信息具有很好的识别性,同时不破坏或极少破坏用户信息的可读性和自然性。
在一个实施例中,如图1所示,提供了一种信息识别方法,包括以下步骤:
步骤202,获取网络信息集合。
其中,所述网络信息集合为网络上的信息集合。
获取网络信息集合,并将各网络信息的收录、排名、访问量等数据进行统计。
步骤204,依照指定的信息指纹,在网络信息集合中筛选与指定的信息指纹相匹配的发布信息。
其中,所述发布信息是所述的指纹植入方法生成。
所述步骤还包括:
通过多个所述指纹特征筛选所述网络信息集合;或
通过单一所述指纹特征筛选所述网络信息集合。
通过设置不同的筛选条件用以不同精度的筛选,当多个指纹特征吻合度越高,则筛选得到的信息准确度也越高。筛选的过程中,因筛选条件的不同,所述筛选速度具有相应变化。筛选用到的指纹特征越多,则筛选速度越慢,准确率越高。
上述信息识别方法,可以快速从所述网络信息集合中众多类似信息中,找出归属于特定用户的信息。从而处理获取到的大量同类信息时,利用信息指纹排准确找出特定用户的信息,可以大幅度提高互联网特定信息鉴别和提取的准确性。所述方法还可以通过设置不同的筛选条件,满足不同的情况下对发布信息筛选。
应该理解的是,虽然图1~2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1~2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种指纹植入装置,包括:检测模块、指纹模块和发布模块,其中:
检测模块,用于检测待发布信息,获得信息类型,所述信息类型为第一文本类型或第二文本类型。
指纹模块,用于根据所述信息类型生成信息指纹,并将所述信息指纹植入所述待发布信息中,生成发布信息。
发布模块,用于将所述发布信息发送至网络中。
所述指纹模块还包括生成单元和植入单元。
所述生成单元,用于根据所述信息类型生成所述信息指纹。
所述植入单元,用于将所述信息指纹植入所述待发布信息中。
关于指纹植入装置的具体限定可以参见上文中对于指纹植入方法的限定,在此不再赘述。上述指纹植入装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,如图4所示,提供了一种信息识别装置,包括:获取模块和筛选模块,其中:
获取模块,用于获取网络信息集合。
筛选模块,用于依照指定的信息指纹,在网络信息集合中筛选与指定的信息指纹相匹配的发布信息;其中,所述发布信息是所述的指纹植入方法生成。
所述筛选模块还包括:单特征筛选单元以及多特征筛选单元。
所述单特征筛选单元,用于通过多个所述指纹特征筛选所述网络信息集合。
所述多特征筛选单元,用于通过单一所述指纹特征筛选所述网络信息集合。
关于信息识别装置的具体限定可以参见上文中对于信息识别方法的限定,在此不再赘述。上述信息识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储网络信息集合的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种指纹植入和信息识别方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
步骤102,检测待发布信息,获得信息类型,所述信息类型为第一文本类型或第二文本类型。
步骤104,根据所述信息类型生成信息指纹,并将所述信息指纹植入所述待发布信息中,生成发布信息。
步骤106,将所述发布信息发送至网络中。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
步骤202,获取网络信息集合。
步骤204,依照指定的信息指纹,在网络信息集合中筛选与指定的信息指纹相匹配的发布信息;其中,所述发布信息是所述的指纹植入方法生成。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
步骤102,检测待发布信息,获得信息类型,所述信息类型为第一文本类型或第二文本类型。
步骤104,根据所述信息类型生成信息指纹,并将所述信息指纹植入所述待发布信息中,生成发布信息。
步骤106,将所述发布信息发送至网络中。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
步骤202,获取网络信息集合。
步骤204,依照指定的信息指纹,在网络信息集合中筛选与指定的信息指纹相匹配的发布信息;其中,所述发布信息是所述的指纹植入方法生成。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (8)

1.一种指纹植入方法,其特征在于,所述指纹植入方法包括:
检测待发布信息,获得信息类型,所述信息类型为第一文本类型或第二文本类型;
根据所述信息类型生成信息指纹,并将所述信息指纹植入所述待发布信息中,生成发布信息,所述信息指纹包括多个指纹特征;
将所述发布信息发送至网络中;
所述根据所述信息类型生成信息指纹,并将所述信息指纹植入所述待发布信息中,生成发布信息包括:
其中,所述信息指纹包括分别与不同的文本类型相对应的第一指纹和第二指纹,所述第一指纹和所述第二指纹分别包括多个指纹特征;
若所述信息类型为所述第一文本类型,则将所述信息指纹以字符的方式植入所述待发布信息中,生成发布信息;
若所述信息类型为所述第二文本类型,则将所述信息指纹以标签和/或字符的方式植入所述待发布信息中,生成发布信息。
2.根据权利要求1所述的指纹植入方法,其特征在于,所述第一文本类型为纯文本格式,所述第二文本类型为富文本格式。
3.一种信息识别方法,其特征在于,所述信息识别方法包括:
获取网络信息集合;
依照指定的信息指纹,在网络信息集合中筛选与指定的信息指纹相匹配的发布信息;其中,所述发布信息是依照1至2任一项所述的指纹植入方法生成。
4.根据权利要求3所述的信息识别方法,其特征在于,所述依照指定的信息指纹,在网络信息集合中筛选与指定的信息指纹相匹配的发布信息包括:
通过多个所述指纹特征筛选所述网络信息集合;或
通过单一所述指纹特征筛选所述网络信息集合。
5.一种指纹植入装置,其特征在于,所述指纹植入装置包括:
检测模块,用于检测待发布信息,获得信息类型,所述信息类型为第一文本类型或第二文本类型;
指纹模块,用于根据所述信息类型生成信息指纹,并将所述信息指纹植入所述待发布信息中,生成发布信息;
发布模块,用于将所述发布信息发送至网络中。
6.一种信息识别装置,其特征在于,所述信息识别装置包括:
获取模块,用于获取网络信息集合;
筛选模块,用于依照指定的信息指纹,在网络信息集合中筛选与指定的信息指纹相匹配的发布信息;其中,所述发布信息是依照1至2任一项所述的指纹植入方法生成。
7.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至2或3至4中任一项所述方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至2或3至4中任一项所述的方法的步骤。
CN201811295446.6A 2018-11-01 2018-11-01 指纹植入和信息识别方法、装置、计算机设备和存储介质 Active CN109522423B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811295446.6A CN109522423B (zh) 2018-11-01 2018-11-01 指纹植入和信息识别方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811295446.6A CN109522423B (zh) 2018-11-01 2018-11-01 指纹植入和信息识别方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN109522423A CN109522423A (zh) 2019-03-26
CN109522423B true CN109522423B (zh) 2020-12-11

Family

ID=65774265

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811295446.6A Active CN109522423B (zh) 2018-11-01 2018-11-01 指纹植入和信息识别方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN109522423B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968600A (zh) * 2012-10-30 2013-03-13 国网电力科学研究院 一种基于指纹信息植入的敏感数据文件的全生命周期管理方法
CN103971061A (zh) * 2014-05-26 2014-08-06 中电长城网际系统应用有限公司 文本文件指纹获取方法及其装置、数据管理方法
CN104376067A (zh) * 2014-11-13 2015-02-25 北京海泰方圆科技有限公司 一种索引文件的录入和基于该索引文件的检索方法
CN107885619A (zh) * 2017-11-16 2018-04-06 郑州云海信息技术有限公司 一种数据精简去重和镜像异地备份保护的方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968600A (zh) * 2012-10-30 2013-03-13 国网电力科学研究院 一种基于指纹信息植入的敏感数据文件的全生命周期管理方法
CN103971061A (zh) * 2014-05-26 2014-08-06 中电长城网际系统应用有限公司 文本文件指纹获取方法及其装置、数据管理方法
CN104376067A (zh) * 2014-11-13 2015-02-25 北京海泰方圆科技有限公司 一种索引文件的录入和基于该索引文件的检索方法
CN107885619A (zh) * 2017-11-16 2018-04-06 郑州云海信息技术有限公司 一种数据精简去重和镜像异地备份保护的方法及系统

Also Published As

Publication number Publication date
CN109522423A (zh) 2019-03-26

Similar Documents

Publication Publication Date Title
CN111680634B (zh) 公文文件处理方法、装置、计算机设备及存储介质
CN111352907A (zh) 流水文件解析方法、装置、计算机设备和存储介质
CN112651238A (zh) 训练语料扩充方法及装置、意图识别模型训练方法及装置
CN107341143B (zh) 一种句子连贯性判断方法及装置和电子设备
US11495014B2 (en) Systems and methods for automated document image orientation correction
CN115081440B (zh) 文本中变种词的识别及提取原敏感词的方法、装置及设备
CN112464845B (zh) 票据识别方法、设备及计算机存储介质
CN110765754A (zh) 文本数据排版方法、装置、计算机设备及存储介质
CN111191028A (zh) 样本标注方法、装置、计算机设备和存储介质
CN114357174B (zh) 基于ocr和机器学习的代码分类系统及方法
CN115269842A (zh) 一种智能标签生成方法、装置、计算机设备和存储介质
CN113961768A (zh) 敏感词检测方法、装置、计算机设备和存储介质
JP6834774B2 (ja) 情報抽出装置
CN111357015B (zh) 文本转换方法、装置、计算机设备和计算机可读存储介质
CN109522423B (zh) 指纹植入和信息识别方法、装置、计算机设备和存储介质
CN115983198A (zh) 从pdf文档中提取页眉或者页脚的方法、装置和存储介质
CN115294593A (zh) 一种图像信息抽取方法、装置、计算机设备及存储介质
CN112800771B (zh) 文章识别方法、装置、计算机可读存储介质和计算机设备
CN114169331A (zh) 地址解析方法、装置、计算机设备和存储介质
CN112364640A (zh) 实体名词链接方法、装置、计算机设备和存储介质
CN113743982A (zh) 广告投放方案推荐方法、装置、计算机设备及存储介质
US20230045484A1 (en) Learning data generation device, method, and record medium for storing program
CN117688927B (zh) 病历章节重配置方法、系统、终端及存储介质
CN113239128B (zh) 基于隐式特征的数据对分类方法、装置、设备和存储介质
CN107402930B (zh) 网页文本的修改方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant