CN111144334B - 一种文件匹配方法、装置、电子设备及存储介质 - Google Patents

一种文件匹配方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111144334B
CN111144334B CN201911390107.0A CN201911390107A CN111144334B CN 111144334 B CN111144334 B CN 111144334B CN 201911390107 A CN201911390107 A CN 201911390107A CN 111144334 B CN111144334 B CN 111144334B
Authority
CN
China
Prior art keywords
file
files
matching
template
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911390107.0A
Other languages
English (en)
Other versions
CN111144334A (zh
Inventor
付莉珺
宋鹏举
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Topsec Technology Co Ltd
Beijing Topsec Network Security Technology Co Ltd
Beijing Topsec Software Co Ltd
Original Assignee
Beijing Topsec Technology Co Ltd
Beijing Topsec Network Security Technology Co Ltd
Beijing Topsec Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Topsec Technology Co Ltd, Beijing Topsec Network Security Technology Co Ltd, Beijing Topsec Software Co Ltd filed Critical Beijing Topsec Technology Co Ltd
Priority to CN201911390107.0A priority Critical patent/CN111144334B/zh
Publication of CN111144334A publication Critical patent/CN111144334A/zh
Application granted granted Critical
Publication of CN111144334B publication Critical patent/CN111144334B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种文件匹配方法、装置、电子设备及存储介质,该方法包括:获得文件模板的格式字段;将格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果,该匹配结果表征匹配的文件信息。在上述的实现过程中,通过获得文件模板的格式字段,并将格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果;也就是说,通过文件模板中的格式字段与预设范围内的多个文件的匹配,提高了根据文件模板匹配文件的准确度,从而有效地获得了与文件模板匹配的文件。

Description

一种文件匹配方法、装置、电子设备及存储介质
技术领域
本申请涉及数据处理和文件匹配搜索的技术领域,具体而言,涉及一种文件匹配方法、装置、电子设备及存储介质。
背景技术
目前,在操作系统的文件系统中匹配文件,通常是根据文件的路径、文件名称或者文件后缀来搜索匹配的文件,然而在具体的实践中,通常并不是所有的文件都有着良好规范的命名,在这种情况下,就无法匹配到同一类型的数据。具体例如:想找到某个文件夹下的所有简历文件,这些简历文件均是由简历模板填写后生成的文件,简历文件命名不统一,且简历文件的名称没有规律,文件后缀包括:doc、docx、xls、xlsx等各种文件类型。在这种场景下,就难以在命名不规范且后缀不统一的情况下获得与模板匹配的文件。
发明内容
本申请实施例的目的在于提供一种文件匹配方法、装置、电子设备及存储介质,用于改善难以在命名不规范且后缀不统一的情况下获得与模板匹配的文件的问题。
本申请实施例提供了一种文件匹配方法,包括:获得文件模板的格式字段;将所述格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果,所述匹配结果表征匹配的文件信息。在上述的实现过程中,通过获得文件模板的格式字段;将格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果,所述匹配结果表征匹配的文件信息;也就是说,通过文件模板中的格式字段与预设范围内的多个文件的匹配,提高了根据文件模板匹配文件的准确度,从而有效地获得了与文件模板匹配的文件。
可选地,在本申请实施例中,在所述将所述格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果之前,还包括:使用文件抽取工具获取所述预设范围内的多个文件的信息内容。在上述的实现过程中,通过使用文件抽取工具获取预设范围内的多个文件的信息内容;从而有效地提高了获取预设范围内的多个文件的信息内容的速度。
可选地,在本申请实施例中,所述预设范围包括:至少一个云盘或者至少一个硬盘;在所述使用文件抽取工具获取所述预设范围内的多个文件的信息内容之前,还包括:根据所述至少一个云盘或者所述至少一个硬盘确定查找范围;在所述查找范围内确定所述多个文件。在上述的实现过程中,通过确定查找范围;在查找范围内确定文件;也就是说,通过缩小了确定文件的范围,从而有效地提高了获取预设范围内的多个文件的信息内容的速度。
可选地,在本申请实施例中,所述将所述格式字段与预设范围内的多个文件的信息内容进行匹配,包括:根据所述格式字段的顺序匹配所述文件模板和所述多个文件中的每个文件。在上述的实现过程中,通过根据格式字段的顺序匹配文件模板和多个文件中的每个文件;也就是说,通过文件模板中的字段顺序来判断文件中的信息内容是否匹配,从而提高了文件模板和文件的匹配程度,有效地获取到更加匹配的文件。
可选地,在本申请实施例中,所述获得文件模板的格式字段,包括:响应于鼠标的点击操作,获得所述文件模板的格式字段;或者响应于键盘的快捷键或者组合键被按下的操作,获得所述文件模板的格式字段。在上述的实现过程中,通过响应于鼠标的点击操作,获得文件模板的格式字段;或者响应于键盘的快捷键或者组合键被按下的操作,获得文件模板的格式字段;通过自定义选择触发获得文件模板字段信息,即只要点击鼠标或者按下快捷键或组合件,即可执行文件匹配方法,从而有效地提高了该方法在执行时间上的灵活性。
可选地,在本申请实施例中,所述匹配结果包括多个匹配文件;在所述将所述格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果,所述匹配结果表征匹配的文件信息之后,还包括:对所述多个匹配文件进行排序,获得排序后的多个匹配文件。在上述的实现过程中,通过对多个匹配文件进行排序,获得排序后的多个匹配文件;从而有效地提高了文件结果的可辨识度,方便了用户查看匹配的文件。
可选地,在本申请实施例中,在所述获得排序后的多个匹配文件之后,还包括:将所述排序后的多个匹配文件的文件信息显示在输出设备上;或者将所述排序后的多个匹配文件的文件信息存储至剪切板中。在上述的实现过程中,通过将排序后的多个匹配文件的文件信息显示在输出设备上;或者将排序后的多个匹配文件的文件信息存储至剪切板中;从而有效方便了用户查看或者使用匹配的文件。
本申请实施例还提供了一种文件匹配装置,包括:字段获得模块,用于获得文件模板的格式字段;文件获得模块,用于将所述格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果,所述匹配结果表征匹配的文件信息。
可选地,在本申请实施例中,还包括:内容获取模块,用于使用文件抽取工具获取所述预设范围内的多个文件的信息内容。
可选地,在本申请实施例中,所述预设范围包括:至少一个云盘或者至少一个硬盘;还包括:范围确定模块,用于根据所述至少一个云盘或者所述至少一个硬盘确定查找范围;文件确定模块,用于在所述查找范围内确定所述多个文件。
可选地,在本申请实施例中,所述文件获得模块,包括:顺序匹配模块,用于根据所述格式字段的顺序匹配所述文件模板和所述多个文件中的每个文件。
可选地,在本申请实施例中,所述字段获得模块,包括:响应操作模块,用于响应于鼠标的点击操作,获得所述文件模板的格式字段;或者响应于键盘的快捷键或者组合键被按下的操作,获得所述文件模板的格式字段。
可选地,在本申请实施例中,所述匹配结果包括多个匹配文件;所述文件匹配装置还包括:文件排序模块,用于对所述多个匹配文件进行排序,获得排序后的多个匹配文件。
可选地,在本申请实施例中,所述文件匹配装置还包括:信息输出模块,用于将所述排序后的多个匹配文件的文件信息显示在输出设备上;或者将所述排序后的多个匹配文件的文件信息存储至剪切板中。
本申请实施例还提供了一种电子设备,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述机器可读指令被所述处理器执行时执行如上所述的方法。
本申请实施例还提供了一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上所述的方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出的本申请实施例提供的文件匹配方法的示意图;
图2示出的本申请实施例提供的简历模板的示意图;
图3示出的本申请实施例提供的预设文件夹下的所有文件的示意图;
图4示出的本申请实施例提供的输出设备显示的文件信息的示意图;
图5示出的本申请实施例提供的在图形界面上显示文件信息的示意图;
图6示出的本申请实施例提供的文件匹配装置示意图;
图7示出的本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述。
在介绍本申请实施例提供的文件匹配方法之前,先介绍本申请实施例所涉及的一些概念,本申请实施例所涉及的一些概念如下:
模式匹配(pattern matching),也称为串匹配(string matching),是指数据结构中字符串的一种基本运算,假设给定一个子串,要求在某个字符串中找出与该子串相同的所有子串,这就是模式匹配;具体例如:给定一组特定的字符串集合P,对于任意的一个字符串T,找出P中的字符串在T中的所有出现位置。
鼠标,是指计算机的一种外接输入设备,也是计算机显示系统纵横坐标定位的指示器,因形似老鼠而得名;鼠标器由运动传感器、一个或多个按钮组成,鼠标器的运动常常被转换为显示器上的光标运动。
数据库(DataBase,DB),是指存储电子数据或者电子文件的集合,简而言之可视为电子化的文件柜,用户可以对文件中的数据运行新增、截取、更新、删除等操作。所谓“数据库”是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。
传输控制协议(Transmission Control Protocol,TCP),又名网络通讯协议,是Internet最基本的协议、Internet国际互联网络的基础,由网络层的IP协议和传输层的TCP协议组成。可以是基于传输控制协议/因特网互联协议(TCP/IP),也可以是基于超文本传输协议进行通信。
服务器是指通过网络提供计算服务的设备,服务器例如:x86服务器以及非x86服务器,非x86服务器包括:大型机、小型机和UNIX服务器。当然在具体的实施过程中,上述的服务器可以具体选择大型机或者小型机,这里的小型机是指采用精简指令集计算(ReducedInstruction Set Computing,RISC)、单字长定点指令平均执行速度(MillionInstructions Per Second,MIPS)等专用处理器,主要支持UNIX操作系统的封闭且专用的提供计算服务的设备;这里的大型机,又名大型主机,是指使用专用的处理器指令集、操作系统和应用软件来提供计算服务的设备。
需要说明的是,本申请实施例提供的文件匹配方法可以被电子设备执行,这里的电子设备是指具有执行计算机程序功能的设备终端或者上述的服务器,设备终端例如:智能手机、个人电脑(personal computer,PC)、平板电脑、个人数字助理(personal digitalassistant,PDA)、移动上网设备(mobile Internet device,MID)、网络交换机或网络路由器等。
在介绍本申请实施例提供的文件匹配方法之前,先介绍该文件匹配方法适用的应用场景,这里的应用场景包括但不限于:使用该文件匹配方法获得与文件模板相匹配的文件,使用该文件匹配方法根据文件模板进行文件搜索、文件查询或者文件匹配等操作,这里的文件模板包括但不限于:简历模板、合同模板、招标书模板和投标书模板等;使用该文件匹配方法在操作系统中查找到与简历模板相匹配的多个简历文件,这里的多个简历文件是填写该简历模板获得的。
请参见图1示出的本申请实施例提供的文件匹配方法的示意图;该文件匹配方法可以包括如下步骤:
步骤S110:电子设备获得文件模板的格式字段。
格式字段,是指文件的格式或者文件中的字段内容,具体例如:若文件为word文档或者txt文档,那么格式例如:论文模板中的研究导论、文献综述、环境分析、研究建议与不足和结束语等,因此,这里的格式也可以理解为文件中的章标题、节标题或者段落标题;若文件为excel表格,那么字段例如:简历模板中的姓名、性别、出生年月和籍贯等;在具体实施过程中,可以根据文件模板的具体格式和形式来确定文件模板的格式或者字段。
文件模板,是指包括格式字段的模板信息的文件,常见的文件模板例如:简历模板、合同模板、招标书模板和投标书模板等,文件模板又例如:某公司所有员工的入职申请书、资产申请表或加班统计表等。
上述的文件模板的获得方式包括:第一种方式,获取预先存储的文件模板,这里获取预先存储的方式包括从数据库中获取;第二种方式,从其他设备接收获得文件模板,这里的从其他设备接收获得文件模板包括:通过文件传输协议(File Transfer Protocol,FTP)从其他设备接收获得文件模板;第三种方式,使用浏览器等软件获取互联网上的文件模板,或者使用其他应用程序访问互联网获得文件模板。这里的FTP协议是指用于在网络上进行文件传输的一套标准协议,FTP协议是传输控制协议模型的第四层,即应用层,使用传输控制协议传输而不是用户数据报协议,客户在和服务器建立连接前要经过一个“三次握手”的过程,保证客户与服务器之间的连接是可靠的,而且是面向连接,为数据传输提供可靠保证。
上述的获得文件模板的格式字段的实施方式,即步骤S110的实施方式可以包括如下步骤:
步骤S111:使用文件模板录入工具录入文件模板中的格式字段。
文件模板录入工具,是指按照文件模板的规范录入文件模板中的格式字段的工具,例如:若确定文件模板为简历模板,那么将简历信息中的字段按照顺序录入文件模板中,即可获得文件模板中的格式字段。
请参见图2示出的本申请实施例提供的简历模板的示意图;图中的公司员工履历表是简历模板,这里的简历模板可以理解为上述的文件模板,该简历模板中的姓名、性别和出生年月等等可以理解为上述的格式字段;上述的使用文件模板录入工具录入文件模板中的格式字段实施方式例如:使用文件模板录入工具录入简历模板中的格式字段,这里的格式字段包括:姓名、性别、出生年月、籍贯和民族等等。
上述的电子设备获得文件模板的触发方式有很多种,例如:根据输入设备的不同,可以有两种触发方式如下:
第一种方式,鼠标的点击操作触发的方式,那么步骤S110可以包括如下步骤:
步骤S112:电子设备响应于鼠标的点击操作,获得文件模板的格式字段。
上述的电子设备响应于鼠标的点击操作的实施方式例如:电子设备响应于鼠标右键菜单的点击操作,右键菜单包括多个选项,其中,点击操作是在多个选项中的其中一个选项位置处点击的;这里的多个选项例如可以包括:获得文件模板的格式字段、获得文件模板的内容等等,那么当用户点击“获得文件模板的格式字段”后,则获得文件模板的格式字段。
第二种方式,键盘的按键触发的方式,那么步骤S110可以包括如下步骤:
步骤S113:电子设备响应于键盘的快捷键或者组合键被按下的操作,获得文件模板的格式字段。
上述的电子设备响应于键盘的快捷键或者组合键被按下的操作的实施方式与上面的步骤S112类似,区别仅在于,这里是通过快捷键或者组合键触发,而步骤S112是通过鼠标点击触发。当然,这里的快捷键或者组合键可以由用户自行设置,这里的快捷键或者组合键例如:在选择该文件时,将“M”键确定为触发获得格式字段的快捷键,或者,在选择该文件时,将“Ctrl”键加“M”键确定为触发获得格式字段的组合键。
在上述的实现过程中,通过响应于鼠标的点击操作,获得文件模板的格式字段;或者响应于键盘的快捷键或者组合键被按下的操作,获得文件模板的格式字段;通过自定义选择触发获得文件模板字段信息,即只要点击鼠标或者按下快捷键或组合件,即可执行文件匹配方法,从而有效地提高了该方法在执行时间上的灵活性。
在步骤S110之后,执行步骤S120:电子设备将格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果。
预设范围,是指需要匹配的文件范围,例如:可以将一个文件夹确定为预设范围,那么表示需要匹配这个文件夹中的文件,当然可以根据具体情况设置是否需要匹配该文件夹中的子文件夹中的文件;当然除了匹配一个文件夹中的文件之外,还可以匹配多个文件夹中的文件,或者匹配一个云盘、硬盘或者虚拟盘里面的文件,或者匹配多个云盘、硬盘或者虚拟盘里面的文件;上述的文件夹、子文件夹、云盘、硬盘或者虚拟盘都可以理解为上述的预设范围。
多个文件,是在上述的预设范围内的多个文件,这里的多个文件可以是预设范围内的全部文件,这里的全部文件包括特殊文件和/或特殊文件夹下的文件,特殊文件例如:系统文件、隐藏文件、受保护的文件和/或没有权限访问的文件等等,这里的特殊文件夹例如:系统文件夹、隐藏文件夹、受保护的文件夹和/或没有权限访问的文件夹等等。这里的多个文件也可以是预设范围内的普通文件,这里的普通文件是指预设范围内的全部文件中排除特殊文件和/或特殊文件夹下的文件之后的文件;具体例如:特殊文件或特殊文件夹在操作系统中是点号开头命名的,以Linux操作系统为例,文件夹为/root下的文件包括:.bash文件、.ssh文件夹和test.txt文件;那么这里的.bash则可以理解为特殊文件,这里的.ssh文件夹可以理解为特殊文件夹,这里的test.txt文件可以理解为普通文件。若仅对普通文件进行匹配,缩小了需要匹配的范围,从而提高了对文件进行匹配的速度。
匹配结果,是指将格式字段与预设范围内的多个文件的信息内容进行匹配的结果,这里的匹配结果表征匹配的文件信息;匹配结果具体例如:没有匹配到文件、匹配到一个文件、两个文件或者两个以上的文件等;这里匹配到的文件可以理解为匹配文件。这里的匹配文件是指该匹配文件中的信息内容与文件模板中的格式字段匹配的文件,这里的文件均是由文件模板衍生而来的文件,因此,这里的匹配文件也可以理解为半结构化文件,这里的半结构化文件是指由文件模板衍生而来的文件,半结构化文件例如:公司由规定的员工入职表模板,每个员工入职后填写的入职表都是半结构化文件。半结构化文件又例如:若毕业论文有一个文件模板,文件模板包括至少一个格式字段,其中的格式例如:研究背景、研究现状、论文综述、研究过程和论文结论等等;根据该模板写的交底书也称为半结构化文件。
信息内容,是指文件信息的内在含义或者文件内容特征的表述;这里的信息内容可以包括至少一个格式字段,由于格式字段可以理解为格式和字段,因此下面的匹配方式也可以分为字段匹配和格式匹配的两种情况。第一种情况,字段匹配的情况,那么上述的将格式字段与预设范围内的多个文件的信息内容进行匹配的实施方式可以包括如下步骤:
步骤S121:电子设备根据格式字段的顺序匹配文件模板和多个文件中的每个文件。
电子设备根据格式字段的顺序匹配文件模板和多个文件中的每个文件的实施方式例如:若文件模板中的字段的数量和第一文件中的字段的数量不同,则确定该文件模板与第一文件不匹配;若文件模板中的字段的数量和第二文件中的字段的数量相同,但文件模板中的字段的顺序和第二文件中的字段的顺序不同,则确定该文件模板与第二文件不匹配;若文件模板中的字段的数量和第三文件中的字段的数量相同,且文件模板中的字段的顺序和第三文件中的字段的顺序相同,则确定文件模板与第三文件匹配。
上述的电子设备根据格式字段的顺序匹配文件模板和多个文件中的每个文件的实施方式又例如:简历模板中的格式字段的顺序为:姓名、性别、出生年月和籍贯,那么就需要根据姓名、性别、出生年月和籍贯这个顺序来确定是否与至少一个字段匹配,具体例如:若简历模板中包括:姓名、性别、出生年月和籍贯等字段,而第一文件中只包括:姓名、性别和出生年月,或者第二文件中包括上述字段,但是第二文件中的字段顺序为:姓名、性别、籍贯和出生年月,那么第一文件和第二文件均无法与简历模板匹配。换句话说,在具体实践过程中,字段的数量或字段的顺序均可以成为文件匹配的参考标准之一。
上述的电子设备根据格式字段的顺序匹配文件模板和多个文件中的每个文件的实施方式又例如:使用模式匹配算法根据格式字段的顺序判断格式字段中的每个字段是否与至少一个字段中的每个字段匹配,这里的模式匹配算法包括:单模式匹配算法和多模式匹配算法;其中,这里的多模式匹配算法例如:AC(Aho and Corasick)算法,单模式匹配算法例如:KMP算法;这里的KMP算法是指一种改进的字符串匹配算法,由克努特(D.E.Knuth)、莫里斯(J.H.Morris)和普拉特(V.R.Pratt)同时发现,这种算法的关键是根据给定的模式串定义了一个next函数,next函数包含了模式串本身局部匹配的信息。
在上述的实现过程中,通过根据格式字段的顺序判断格式字段中的每个字段是否与至少一个字段中的每个字段匹配;也就是说,通过文件模板中的字段顺序来判断文件中的信息内容是否匹配,从而提高了文件模板和文件的匹配程度,有效地获取到更加匹配的文件。
需要说明的是,这里的文件模板中的格式字段的顺序非常重要,若模板文件中的格式字段的顺序不同,则可以理解为是不同的模板,因此,在根据文件模板匹配文件过程中,可以根据文件模板中的格式字段的顺序进行匹配。
在上述的实现过程中,通过获得文件模板的格式字段;将格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果,匹配结果表征匹配的文件信息;也就是说,通过文件模板中的格式字段与预设范围内的多个文件的匹配,提高了根据文件模板匹配文件的准确度,从而有效地获得了与文件模板匹配的文件。
第二种情况,格式匹配的情况,那么上述的将格式字段与预设范围内的多个文件的信息内容进行匹配的实施方式可以包括如下步骤:
步骤S122:电子设备根据格式字段中的格式匹配文件模板和多个文件中的每个文件。
上述的电子设备根据格式字段中的格式匹配文件模板和多个文件中的每个文件的实施方式例如:若模板文件为文本文件,则可以根据模板文件的格式来匹配文件模板和多个文件中的每个文件;这里的文本文件例如:文件后缀为txt的文件,即能够被notepad软件正常打开的文件;或者后缀为doc或docx的文件,即能够被officeword软件正常打开的文件。这里的根据模板文件的格式来匹配的实施方式具体例如:若模板文件为论文模板,那么可以根据论文模板中的研究导论、文献综述、环境分析、研究建议和结束语等格式来匹配文件;也就是说,若第一文件中包括研究导论、文献综述、环境分析、研究建议和结束语的章节标题,则可以确定文件模板匹配该第一文件。
可选地,在本申请实施例中,在将格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果之前,还可以在确定的查找范围内获取多个文件的信息内容;那么在步骤S120之前,还可以包括如下步骤:
步骤S210:电子设备根据至少一个云盘或者至少一个硬盘确定查找范围。
云盘,是指云存储服务中提供的虚拟磁盘,这里的云存储是指把网络中的多种存储资源整合在一起,以存储服务的形式提供给用户使用的一种存储模式。上述的硬盘是指一种硬质圆盘形磁表面存储媒体,硬盘的基底可以为硬质镁铝合金、玻璃材料或玻璃釉陶瓷等材料。
上述的电子设备确定查找范围的实施方式例如:根据至少一个云盘或者至少一个硬盘确定查找范围;根据硬盘确定查找范围的实施方式具体例如:在C盘或D盘中查找与简历模板匹配的文件,那么这里的C盘或者D盘则是这里的查找范围,即可以确定这里的C盘或者D盘为查找范围;这里的C盘或D盘包括:云盘、本地硬盘或虚拟磁盘。当然在具体的实施过程中,也可以根据某个具体的文件夹来确定查找范围,即若查找预设文件夹下的所有文件是否匹配简历模板,则将预设文件夹确定为这里的查找范围,这里的预设文件夹可以根据具体情况进行具体设置,例如:从至少一个云盘、至少一个虚拟磁盘或者至少一个硬盘中选择至少一个文件夹,将该文件夹确定为预设文件夹。
步骤S220:电子设备在查找范围内确定多个文件。
请参见图3示出的本申请实施例提供的预设文件夹下的所有文件的示意图;上述的电子设备在查找范围内确定多个文件的实施方式例如:若确定为查找范围为图中的文件夹,那么可以扫描该文件夹下的所有文件,例如该文件夹下的文件可以包括:DSB数据list.xlsx、Python数据科学手册.pdf、solr安装文档.docx、部门2_李四.xlsx、个人履历.docx、个人信息.pdf、履历表1.xlsx、张三_履历.xlsx和资格审核excel参考格式等文件,这些文件就可以理解为上述的多个文件。在上述的实现过程中,通过确定查找范围;在查找范围内确定多个文件;也就是说,通过缩小了确定多个文件的范围,从而有效地提高了获取预设范围内的匹配文件的信息内容的速度。
步骤S230:电子设备使用文件抽取工具获取预设范围内的多个文件的信息内容。
文件抽取工具,是指获取文件信息的内容的软件工具,具体例如:对于txt文件来说,notepad软件可以获得txt文件的内容,那么这里的notepad软件可以理解为文件抽取工具;当然在具体的实施过程中,文件抽取工具可以抽取的文件格式包括但不限于:txt、xls、xlsx、doc、docx和pdf等格式。
上述的电子设备使用文件抽取工具获取预设范围内的多个文件的信息内容的实施方式例如:若文件是文字字符内容,则可以使用文字阅读器获取该文件的信息内容;若文件为图像内容,则可以使用光学字符识别(Optical Character Recognition,OCR)技术获得图像内容中的文字信息内容;这里的OCR是指利用相机、扫描仪等光学输入设备对票据、订单号、文本文件或其它载体上的字符进行拍摄或扫描,然后对拍摄或扫描后的图像文件进行数字化处理,得到文字信息的过程。在上述的实现过程中,通过使用文件抽取工具获取预设范围内的多个文件的信息内容;从而有效地提高了获取预设范围内的多个文件的信息内容的速度。
步骤S240:电子设备获得文件模板的格式字段。
其中,该步骤的实施原理和实施方式与步骤S110的实施原理和实施方式是相似或类似的,因此,这里不再对该步骤的实施方式和实施原理进行说明,如有不清楚的地方,可以参考对步骤S110的描述。
步骤S250:电子设备将格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果,匹配结果表征匹配的文件信息。
其中,该步骤的实施原理和实施方式与步骤S120的实施原理和实施方式是相似或类似的,因此,这里不再对该步骤的实施方式和实施原理进行说明,如有不清楚的地方,可以参考对步骤S120的描述。
可选地,在本申请实施例中,匹配结果包括多个匹配文件;在将格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果,匹配结果表征匹配的文件信息之后,即在步骤S250之后还可以包括如下步骤:
步骤S260:电子设备对多个匹配文件进行排序,获得排序后的多个匹配文件。
上述的电子设备对多个匹配文件进行排序,获得排序后的多个匹配文件的实施方式例如:电子设备根据预设顺序对多个匹配文件进行排序,获得排序后的多个匹配文件,这里的预设顺序包括但不限于:文件名称、匹配的时间、文件创建时间、文件上一次修改的时间和文件创建者名称;当然具体在排序时也有很多方式,例如按照顺序排序或者逆序排序等。在上述的实现过程中,通过对多个匹配文件进行排序,获得排序后的多个匹配文件;从而有效地提高了文件结果的可辨识度,方便了用户查看匹配的文件。
可选地,在本申请实施例中,在获得排序后的多个匹配文件之后,还可以将文件信息显示在输出设备上;那么在步骤S260之后,还可以包括如下步骤:
步骤S261:电子设备将排序后的多个匹配文件的文件信息显示在输出设备上。
请参见图4示出的本申请实施例提供的输出设备显示的文件信息的示意图;图中的大括号里面包括两部分数据:等号之前的数据和等号之后的数据;其中,等号之前的数据表征文件名称和文件后缀,等号之后的数据为匹配结果,若匹配结果为0,则表示该文件与模板不匹配,相对应地,若匹配结果为1,则表示该文件与模板匹配。上述的电子设备将排序后的多个匹配文件的文件信息显示在输出设备上的实施方式例如:电子设备将排序后的多个匹配文件的文件信息以终端窗口的方式显示在输出设备上,当然在具体实施过程中,若用户使用终端窗口使用命令行的方式匹配文件,那么电子设备可以在终端窗口中显示在输出设备上。
请参见图5示出的本申请实施例提供的在图形界面上显示文件信息的示意图;图中的match_result存放的是匹配的文件,这里匹配的文件包括:部门2_李四.xlsx、个人履历.docx、个人信息.pdf、履历表1.xls和张三_履历.xlsx。上述的电子设备将排序后的多个匹配文件的文件信息显示在输出设备上的实施方式又例如:若是用户使用图形用户界面(Graphical User Interface,GUI)的方式匹配文件,那么电子设备可以在GUI窗口中显示在输出设备上,这里的GUI又称图形用户接口,是指采用图形方式显示的计算机操作用户界面;GUI是一种用户界面,利用图像和其他图形元素,以简化与软件互动的过程,也被视作软件的“所见即所得”。
或者在获得排序后的多个匹配文件之后,还可以将文件信息存储在剪切板中;那么在步骤S260之后,还可以包括如下步骤:
步骤S262:电子设备将排序后的多个匹配文件的文件信息存储至剪切板中。
剪切板,是指操作系统为便于操作而提供的一段存储区域,例如:windows操作系统中的剪切板等。
其中,该步骤的实施原理和实施方式与步骤S261的实施原理和实施方式是相似或类似的,区别仅在于步骤S261是将文件信息输出至显示设备,而步骤S262是将文件信息存储至剪切板中;因此,这里不再对该步骤的实施方式和实施原理进行说明,如有不清楚的地方,可以参考对步骤S261的描述。
或者在获得排序后的多个匹配文件之后,还可以将文件信息存储在数据库中;即在步骤S260之后,还可以包括如下步骤:
步骤S263:电子设备将排序后的多个匹配文件的文件信息存储至数据库中。
上述的电子设备将排序后的多个匹配文件的文件信息存储至数据库中的实施方式例如:电子设备将排序后的多个匹配文件的文件信息存储至关系型数据库中,这里的关系型数据库是指采用关系模型来组织数据的数据库,关系型数据库以行和列的形式存储数据,以便于用户理解,关系型数据库这一系列的行和列被称为表,常见的关系型数据库例如:Mysql、PostgreSQL、Oracle和SQLSever等。
上述的电子设备将排序后的多个匹配文件的文件信息存储至数据库中的实施方式又例如:电子设备将排序后的多个匹配文件的文件信息存储至内存数据库中,这里的内存数据库是指基于随机存储记忆体(Random Access Memory,RAM)查找的数据集合,特点为读写速度快,因此也被称为缓存数据库,常见的内存数据库例如:Memcached和Redis等。
上述的电子设备将排序后的多个匹配文件的文件信息存储至数据库中的实施方式又例如:电子设备将排序后的多个匹配文件的文件信息存储至非关系型数据库中,这里的非关系型数据库又被称为NoSQL(Not OnlySQL),意为不仅仅是结构化查询语言(Structured QueryLanguage,SQL),非关系型数据库根据结构化方法以及应用场合的不同,主要分为:面向列式存储、面向文档存储和键值对存储的三种非关系型数据库,常见的非关系型数据库包括:grakn知识图谱数据库、Neo4j图数据库、Hadoop子系统HBase、MongoDB和CouchDB等。
或者在获得排序后的多个匹配文件之后,还可以将文件信息存储在数据库中;那么在步骤S260之后,还可以包括如下步骤:
步骤S264:电子设备向终端设备发送排序后的多个匹配文件的文件信息。
终端设备,是指指具有执行计算机程序功能的设备,例如:终端设备可以是平板电脑、智能手机、个人数字助理或电子书阅读器等;或者,该终端设备也可以是智能音响、录音笔、手机、遥控器、个人电脑、网络交换机、网络路由器或台式主机等,具体的例如:台式电脑或者笔记本电脑等个人计算机设备。
上述的电子设备向终端设备发送排序后的多个匹配文件的文件信息的实施方式例如:电子设备通过TCP协议或者超文本传输协议(Hyper Text Transfer Protocol,HTTP)向终端设备发送排序后的多个匹配文件的文件信息;这里的HTTP协议是一个简单的请求响应协议,HTTP协议通常运行在传输控制协议(Transmission Control Protocol,TCP)之上,HTTP协议指定了客户端可能发送给服务器什么样的消息以及得到什么样的响应。
上述的电子设备向终端设备发送排序后的多个匹配文件的文件信息的实施方式又例如:电子设备通过安全外壳(Secure Shell,SSH)协议或者安全文件传送协议(SSHFile Transfer Protocol,SFTP)向终端设备发送排序后的多个匹配文件的文件信息;这里的SSH协议是指建立在应用层基础上的安全协议;SSH协议是目前较为可靠的,且能够为远程登录会话和其他网络服务提供安全性的协议;这里的SFTP协议是一种数据流连接,提供文件访问、传输和管理功能的网络传输协议。
在上述的实现过程中,通过将排序后的多个匹配文件的文件信息显示在输出设备上;或者将排序后的多个匹配文件的文件信息存储至剪切板中;从而有效方便了用户查看或者使用匹配的文件。
请参见图6示出的本申请实施例提供的文件匹配装置示意图;本申请实施例提供了一种文件匹配装置600,包括:
字段获得模块610,用于获得文件模板的格式字段。
文件获得模块620,用于将格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果,匹配结果表征匹配的文件信息。
可选地,在本申请实施例中,还可以包括:
内容获取模块,用于使用文件抽取工具获取预设范围内的多个文件的信息内容。
可选地,在本申请实施例中,预设范围包括:至少一个云盘或者至少一个硬盘;该装置还包括:
范围确定模块,用于根据至少一个云盘或者至少一个硬盘确定查找范围。
文件确定模块,用于在查找范围内确定多个文件。
可选地,在本申请实施例中,文件获得模块,包括:
顺序匹配模块,用于根据格式字段的顺序匹配文件模板和多个文件中的每个文件。
可选地,在本申请实施例中,字段获得模块,包括:
响应操作模块,用于响应于鼠标的点击操作,获得文件模板的格式字段;或者响应于键盘的快捷键或者组合键被按下的操作,获得文件模板的格式字段。
可选地,在本申请实施例中,匹配结果包括多个匹配文件;文件匹配装置还包括:
文件排序模块,用于对多个匹配文件进行排序,获得排序后的多个匹配文件。
可选地,在本申请实施例中,文件匹配装置还包括:
信息输出模块,用于将排序后的多个匹配文件的文件信息显示在输出设备上;或者将排序后的多个匹配文件的文件信息存储至剪切板中。
应理解的是,该装置与上述的文件匹配方法实施例对应,能够执行上述方法实施例涉及的各个步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置包括至少一个能以软件或固件(firmware)的形式存储于存储器中或固化在装置的操作系统(operating system,OS)中的软件功能模块。
请参见图7示出的本申请实施例提供的电子设备的结构示意图。本申请实施例提供的一种电子设备700,包括:处理器710和存储器720,存储器720存储有处理器710可执行的机器可读指令,机器可读指令被处理器710执行时执行如上的方法。
本申请实施例还提供了一种存储介质730,该存储介质730上存储有计算机程序,该计算机程序被处理器710运行时执行如上的文件匹配方法。
其中,存储介质730可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
本申请实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其他的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请实施例的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请实施例各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上的描述,仅为本申请实施例的可选实施方式,但本申请实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请实施例的保护范围之内。

Claims (9)

1.一种文件匹配方法,其特征在于,包括:
获得文件模板的格式字段;
将所述格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果,所述匹配结果表征匹配的文件信息;
其中,所述匹配结果包括多个匹配文件;在所述将所述格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果,所述匹配结果表征匹配的文件信息之后,还包括:
对所述多个匹配文件进行排序,获得排序后的多个匹配文件。
2.根据权利要求1所述的方法,其特征在于,在所述将所述格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果之前,还包括:
使用文件抽取工具获取所述预设范围内的多个文件的信息内容。
3.根据权利要求2所述的方法,其特征在于,所述预设范围包括:至少一个云盘或者至少一个硬盘;在所述使用文件抽取工具获取所述预设范围内的多个文件的信息内容之前,还包括:
根据所述至少一个云盘或者所述至少一个硬盘确定查找范围;
在所述查找范围内确定所述多个文件。
4.根据权利要求1-3任一所述的方法,其特征在于,所述将所述格式字段与预设范围内的多个文件的信息内容进行匹配,包括:
根据所述格式字段的顺序匹配所述文件模板和所述多个文件中的每个文件。
5.根据权利要求1-3任一所述的方法,其特征在于,所述获得文件模板的格式字段,包括:
响应于鼠标的点击操作,获得所述文件模板的格式字段;或者
响应于键盘的快捷键或者组合键被按下的操作,获得所述文件模板的格式字段。
6.根据权利要求1所述的方法,其特征在于,在所述获得排序后的多个匹配文件之后,还包括:
将所述排序后的多个匹配文件的文件信息显示在输出设备上;或者
将所述排序后的多个匹配文件的文件信息存储至剪切板中。
7.一种文件匹配装置,其特征在于,包括:
字段获得模块,用于获得文件模板的格式字段;
文件获得模块,用于将所述格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果,所述匹配结果表征匹配的文件信息;
其中,所述匹配结果包括多个匹配文件;在所述将所述格式字段与预设范围内的多个文件的信息内容进行匹配,获得匹配结果,所述匹配结果表征匹配的文件信息之后,所述装置还包括:文件排序模块,用于对所述多个匹配文件进行排序,获得排序后的多个匹配文件。
8.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述机器可读指令被所述处理器执行时执行如权利要求1至6任一所述的方法。
9.一种存储介质,其特征在于,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至6任一所述的方法。
CN201911390107.0A 2019-12-27 2019-12-27 一种文件匹配方法、装置、电子设备及存储介质 Active CN111144334B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911390107.0A CN111144334B (zh) 2019-12-27 2019-12-27 一种文件匹配方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911390107.0A CN111144334B (zh) 2019-12-27 2019-12-27 一种文件匹配方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111144334A CN111144334A (zh) 2020-05-12
CN111144334B true CN111144334B (zh) 2023-09-26

Family

ID=70521599

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911390107.0A Active CN111144334B (zh) 2019-12-27 2019-12-27 一种文件匹配方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111144334B (zh)

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101013445A (zh) * 2007-02-14 2007-08-08 白杰 一种目标文件的确定方法和装置
US7367056B1 (en) * 2002-06-04 2008-04-29 Symantec Corporation Countering malicious code infections to computer files that have been infected more than once
CN101398844A (zh) * 2008-10-28 2009-04-01 深圳华为通信技术有限公司 资源文件的搜索方法及移动终端
CN102103594A (zh) * 2009-12-22 2011-06-22 北京大学 字符数据识别及处理的方法和装置
JP2013105383A (ja) * 2011-11-15 2013-05-30 Takanao Handa 複数文書認識システム、複数文書認識用テンプレート及び複数文書認識方法
CN103377213A (zh) * 2012-04-23 2013-10-30 富泰华工业(深圳)有限公司 文件上传系统及方法
CN104252531A (zh) * 2014-09-11 2014-12-31 北京优特捷信息技术有限公司 一种文件类型识别方法及装置
CN105488210A (zh) * 2015-12-11 2016-04-13 金蝶软件(中国)有限公司 一种批量数据匹配方法及装置
CN105740900A (zh) * 2016-01-29 2016-07-06 百度在线网络技术(北京)有限公司 信息识别的方法和装置
CN107220072A (zh) * 2016-03-21 2017-09-29 阿里巴巴集团控股有限公司 基于序列化格式的配置文件校验方法和装置
CN108874881A (zh) * 2018-05-04 2018-11-23 昆山丘钛微电子科技有限公司 一种点检方法、装置、设备及介质
CN109389109A (zh) * 2018-09-11 2019-02-26 厦门商集网络科技有限责任公司 一种ocr全文本识别正确率的自动化测试方法及设备
CN109753964A (zh) * 2017-11-06 2019-05-14 株式会社日立制作所 计算机以及文件识别方法
CN110069449A (zh) * 2019-03-20 2019-07-30 平安科技(深圳)有限公司 文件处理方法、装置、计算机设备和存储介质
CN110377702A (zh) * 2019-07-18 2019-10-25 中科鼎富(北京)科技发展有限公司 一种简历信息匹配方法及装置
CN110472219A (zh) * 2019-08-22 2019-11-19 浙江大搜车软件技术有限公司 电子文件生成方法、装置、计算机设备和存储介质
CN110502514A (zh) * 2019-08-15 2019-11-26 中国平安财产保险股份有限公司 数据采集方法、装置、设备及计算机可读存储介质
CN110502486A (zh) * 2019-08-21 2019-11-26 中国工商银行股份有限公司 日志处理方法、装置、电子设备和计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140280254A1 (en) * 2013-03-15 2014-09-18 Feichtner Data Group, Inc. Data Acquisition System

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7367056B1 (en) * 2002-06-04 2008-04-29 Symantec Corporation Countering malicious code infections to computer files that have been infected more than once
CN101013445A (zh) * 2007-02-14 2007-08-08 白杰 一种目标文件的确定方法和装置
CN101398844A (zh) * 2008-10-28 2009-04-01 深圳华为通信技术有限公司 资源文件的搜索方法及移动终端
CN102103594A (zh) * 2009-12-22 2011-06-22 北京大学 字符数据识别及处理的方法和装置
JP2013105383A (ja) * 2011-11-15 2013-05-30 Takanao Handa 複数文書認識システム、複数文書認識用テンプレート及び複数文書認識方法
CN103377213A (zh) * 2012-04-23 2013-10-30 富泰华工业(深圳)有限公司 文件上传系统及方法
CN104252531A (zh) * 2014-09-11 2014-12-31 北京优特捷信息技术有限公司 一种文件类型识别方法及装置
CN105488210A (zh) * 2015-12-11 2016-04-13 金蝶软件(中国)有限公司 一种批量数据匹配方法及装置
CN105740900A (zh) * 2016-01-29 2016-07-06 百度在线网络技术(北京)有限公司 信息识别的方法和装置
CN107220072A (zh) * 2016-03-21 2017-09-29 阿里巴巴集团控股有限公司 基于序列化格式的配置文件校验方法和装置
CN109753964A (zh) * 2017-11-06 2019-05-14 株式会社日立制作所 计算机以及文件识别方法
CN108874881A (zh) * 2018-05-04 2018-11-23 昆山丘钛微电子科技有限公司 一种点检方法、装置、设备及介质
CN109389109A (zh) * 2018-09-11 2019-02-26 厦门商集网络科技有限责任公司 一种ocr全文本识别正确率的自动化测试方法及设备
CN110069449A (zh) * 2019-03-20 2019-07-30 平安科技(深圳)有限公司 文件处理方法、装置、计算机设备和存储介质
CN110377702A (zh) * 2019-07-18 2019-10-25 中科鼎富(北京)科技发展有限公司 一种简历信息匹配方法及装置
CN110502514A (zh) * 2019-08-15 2019-11-26 中国平安财产保险股份有限公司 数据采集方法、装置、设备及计算机可读存储介质
CN110502486A (zh) * 2019-08-21 2019-11-26 中国工商银行股份有限公司 日志处理方法、装置、电子设备和计算机可读存储介质
CN110472219A (zh) * 2019-08-22 2019-11-19 浙江大搜车软件技术有限公司 电子文件生成方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN111144334A (zh) 2020-05-12

Similar Documents

Publication Publication Date Title
US9811536B2 (en) Categorizing captured images for subsequent search
US20180113862A1 (en) Method and System for Electronic Document Version Tracking and Comparison
US10154039B1 (en) Hierarchical policy-based shared resource access control
US8838657B1 (en) Document fingerprints using block encoding of text
US10872236B1 (en) Layout-agnostic clustering-based classification of document keys and values
US9122681B2 (en) Systems and methods for classifying electronic information using advanced active learning techniques
US9020267B2 (en) Information processing apparatus and handwritten document search method
CN108572952B (zh) 一种工程电子文件的结构化处理方法和系统
US9588952B2 (en) Collaboratively reconstituting tables
US10298663B2 (en) Method for associating previously created social media data with an individual or entity
US11941135B2 (en) Automated sensitive data classification in computerized databases
US9047368B1 (en) Self-organizing user-centric document vault
WO2016018683A1 (en) Image based search to identify objects in documents
US20210174109A1 (en) Optical Character Recognition Error Correction Model
WO2015196981A1 (zh) 一种鉴别图片垃圾文件的方法及装置
US20120096078A1 (en) Systems and methods for archiving media assets
US20160275095A1 (en) Electronic device, method and storage medium
CN111488556A (zh) 一种嵌套文档提取方法、装置及电子设备和存储介质
US11704279B2 (en) Event driven migration, recall, and data placement optimization based on custom metadata
CN111144334B (zh) 一种文件匹配方法、装置、电子设备及存储介质
CN117194322A (zh) 文件分类管理方法、系统及计算设备
US11714637B1 (en) User support content generation
US11487768B2 (en) Generating search results utilizing access control
US20220291886A1 (en) Methods and systems for directly printing multiple documents stored over multiple/different cloud locations
US10776500B2 (en) Autonomous hint generator

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant