CN112597275A - 内容搜索方法及装置 - Google Patents

内容搜索方法及装置 Download PDF

Info

Publication number
CN112597275A
CN112597275A CN202011563599.1A CN202011563599A CN112597275A CN 112597275 A CN112597275 A CN 112597275A CN 202011563599 A CN202011563599 A CN 202011563599A CN 112597275 A CN112597275 A CN 112597275A
Authority
CN
China
Prior art keywords
document
search
searched
content
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011563599.1A
Other languages
English (en)
Inventor
杜世伟
刘冬
魏林
郝艳斐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Hode Information Technology Co Ltd
Original Assignee
Shanghai Hode Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Hode Information Technology Co Ltd filed Critical Shanghai Hode Information Technology Co Ltd
Priority to CN202011563599.1A priority Critical patent/CN112597275A/zh
Publication of CN112597275A publication Critical patent/CN112597275A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供内容搜索方法及装置,其中所述内容搜索方法包括:通过内容搜索界面,确定至少一个待搜索文档;针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容;在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。如此,无需打开待搜索文档,也可以直接通过内容搜索界面对至少一个待搜索文档进行搜索,无需等待打开文档的时间,且充分利用多线程,减少线性执行的时间成本,提高搜索效率,快速定位想要搜索的内容。

Description

内容搜索方法及装置
技术领域
本申请涉及计算机技术领域,特别涉及一种内容搜索方法。本申请同时涉及一种内容搜索装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
随着计算机技术的快速发展,越来越多的电子文档应用而生,不同的文档使用的数据存储方式不同,如对于游戏数据来说,配表文档使用Excel电子表格编辑和存储,剧情文档使用文本文件(word)进行编辑和存储。为了满足对文档中包括的数据各种各样的需求,往往需要搜索文档中的某些目标内容。
现有技术中,往往是用户打开某个待搜索的文档,系统将该文档包括的文本数据加载到内存中,然后用户在该文档的搜索框中输入需要搜索的内容,在文本数据中进行搜索,搜索完毕后关闭该文档,之后再打开其他需要搜索的文档,重复执行上述步骤进行搜索。
然而,上述内容搜索方法,当需要搜索很多文档中的相同内容时,只能够手动依次一个个打开需要搜索的文档,然后再一个个地对需要搜索的内容进行搜索,需要耗费大量的人力,且相同的搜索内容,需要针对不同的文档执行重复相同的操作流程,浪费处理资源,耗费搜索时间,搜索效率低下;并且,文档太大或文档数量过多的时候,一一打开各个文档,将文档包括的文本数据加载到内存中,耗时较长,会占用较大内存,可能导致系统负载较高,进而可能导致系统卡顿。
发明内容
有鉴于此,本申请实施例提供了一种内容搜索方法。本申请同时涉及一种内容搜索装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的搜索效率低下的问题。
根据本申请实施例的第一方面,提供了一种内容搜索方法,包括:
通过内容搜索界面,确定至少一个待搜索文档;
针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容;
在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。
根据本申请实施例的第二方面,提供了一种内容搜索装置,包括:
第一确定模块,被配置为通过内容搜索界面,确定至少一个待搜索文档;
解析模块,被配置为针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容;
第一显示模块,被配置为在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。
根据本申请实施例的第三方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现下述方法:
通过内容搜索界面,确定至少一个待搜索文档;
针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容;
在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。
根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现任意所述内容搜索方法的步骤。
本申请提供的内容搜索方法,可以通过内容搜索界面,确定至少一个待搜索文档;然后针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容;之后,在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。这种情况下,无需打开待搜索文档,可以直接通过内容搜索界面对至少一个待搜索文档进行搜索,也即可以针对单个文档进行搜索,也可以针对多个待搜索文档进行批量搜索,无需等待打开文档的时间,充分利用多线程,减少线性执行的时间成本,提高搜索效率,快速定位想要搜索的内容;另外,如果待搜索文档过多或过大,则在执行批量搜索和单个文档搜索时,通过多线程进行文档读取不会对操作系统造成很高的负载,避免系统卡顿。
附图说明
图1是本申请一实施例提供的一种内容搜索方法的流程图;
图2是本申请一实施例提供的一种内容搜索界面的示意图;
图3是本申请一实施例提供的一种内容搜索界面显示搜索内容的示意图;
图4是本申请一实施例提供的另一种内容搜索方法的流程图;
图5是本申请一实施例提供的一种内容搜索装置的结构示意图;
图6是本申请一实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本申请一个或多个实施例涉及的名词术语进行解释。
正则表达式(regular expression):有时称为有理表达式,是定义搜索模式的字符序列,通常这种模式通过字符串搜索算法,用于字符串上的“查找”或“查找并替换”操作,或者用于输入验证。它是在理论计算机科学和形式语言理论中发展起来的一种技术。也即,正则表达式描述了一种字符串匹配的模式(pattern),可以用来检查一个字符串是否含有某种子字符串、将匹配的子字符串替换或者从某个字符串中取出符合某个条件的子字符串等。
GUI:图形用户界面(Graphical User Interface,简称GUI,又称图形用户接口),是指采用图形方式显示的计算机操作用户界面,是一种人与计算机通信的界面显示格式,允许用户使用鼠标等输入设备操纵屏幕上的图标或菜单选项,以选择命令、调用文件、启动程序或执行其它一些日常任务。
多线程(multithreading):是指从软件或者硬件上实现多个线程并发执行的技术。在计算机体系结构中,多线程是由操作系统支持的中央处理器(或多核处理器中的单核)同时具有执行多个线程能力的方法。这种方法不同于多处理,在多线程应用程序中,线程共享单个或多个内核的资源,包括计算单元、中央处理器缓存和转换查找缓冲器。
线程:在计算机科学中,执行线程是可由调度器独立管理的最小程序指令序列,调度程序通常是操作系统的一部分。在大多数情况下,线程是进程的一个组成部分,多个线程可以存在于一个进程中,一个进程中的线程同时执行并共享内存等资源,而不同的进程不共享这些资源。特别是,同一个进程的线程可以在任何给定时间共享其可执行代码及其动态分配变量和非线程全局变量的值。当多处理系统在一个或多个内核中包括多个完整的处理单元时,多线程旨在通过使用线程级并行和指令级并行来提高单个内核的利用率。
迭代器(Iterator):是一个实现了迭代器协议的对象,它能够用来遍历标准模板库容器中的部分或全部元素,每个迭代器对象代表容器中的确定的地址。通俗点说,迭代器表现的像指针,读取集合或者数组中的一个值,读完以后又指向下一条数据,一个个数过去。
生成器(generator):是通过yield语句快速生成迭代器。
在本申请中,提供了一种内容搜索方法,本申请同时涉及一种内容搜索装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1示出了根据本申请一实施例提供的一种内容搜索方法的流程图,具体包括以下步骤:
步骤102:通过内容搜索界面,确定至少一个待搜索文档。
实际应用中,若需要搜索很多文档中的相同内容,则只能够手动依次一个个打开需要搜索的文档,然后再一个个地对需要搜索的内容进行搜索,需要耗费大量的人力,且相同的搜索内容,需要针对不同的文档执行重复相同的操作流程,浪费处理资源,耗费搜索时间,搜索效率低下;并且,文档太大或文档数量过多的时候,一一打开各个文档,将文档包括的文本数据加载到内存中,耗时较长,会占用较大内存,可能导致系统负载较高,进而可能导致系统卡顿。
因而,为了提高文档内容的搜索效率,本申请提供了一种内容搜索方法,可以通过内容搜索界面,确定至少一个待搜索文档;然后针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容;之后,在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。这种情况下,无需一一打开待搜索文档,可以直接通过内容搜索界面对至少一个待搜索文档进行搜索,无需等待打开文档的时间,充分利用多线程,减少线性执行的时间成本,提高搜索效率,快速定位想要搜索的内容。
具体的,内容搜索界面是指提供文件夹选择功能或文档选择功能的GUI界面,用户可以在该内容搜索界面中选择待搜索文档,后续触发搜索指令,对选择出的待搜索文档进行搜索。
本实施例一个可选的实施方式中,通过内容搜索界面,确定至少一个待搜索文档,具体实现过程可以如下:
在通过所述内容搜索界面检测到针对目标文件夹的选择操作的情况下,将所述目标文件夹中包括的文档确定为所述待搜索文档;
在通过所述内容搜索界面检测到针对目标文件夹中目标文档的选择操作的情况下,将所述目标文档确定为所述待搜索文档。
需要说明的是,可以直接选择某个文件夹(目标文件夹),将该文件夹下包括的全部文档作为待搜索文档,或者也可以从某个文件夹中选择某个文档(目标文档)作为待搜索文档。也即,本申请中可以对一个待搜索文档进行单文档搜索,还可以对多个待搜索文档进行批量搜索,无论是单文档搜索,还是多文档批量搜索,均无需手动打开待搜索文档,只需在内容搜索界面中选择待搜索文档即可,无需等待打开文档的时间,提供后续文档搜索效率。
示例的,图2是本申请一实施例提供的一种内容搜索界面的示意图,如图2所示,内容搜索界面中包括文件选择控件、参考搜索规则(用于匹配搜索内容),用户点击该文件选择控件后,弹出文件选择界面,在该文件选择界面中可以从待搜索的文件夹(文件夹1、文件夹2和文件夹3)中选择目标文件夹(文件夹1),点击确定控件后,即检测到针对目标文件夹的选择操作;当选择目标文件夹,点击打开控件后,文件选择界面会显示该目标文件夹下面包括的各个文档(文档1、文档2和文档3),选择某个或某些文档后(文档1),点击确定控件,即检测到针对目标文件夹(文件夹1)中目标文档(文档1)的选择操作,其中,目标文档为用户选择的文档。
本实施例一个可选的实施方式中,内容搜索界面包括搜索规则输入框,所述搜索规则输入框包括参考搜索规则;通过内容搜索界面,确定至少一个待搜索文档之前,还包括:
确定是否接收到针对所述参考搜索规则的第一修改指令;
在接收到针对所述参考搜索规则的第一修改指令的情况下,将所述第一修改指令中携带的搜索规则确定为目标搜索规则;
在未接收到针对所述参考搜索规则的第一修改指令的情况下,将所述参考搜索规则确定为目标搜索规则。
具体的,参考搜索规则是内容搜索界面默认的搜索规则,参考搜索规则可以是工作人员预先根据大部分实际应用场景设置的搜索规则;而目标搜索规则是后续对待搜索文档包括的文本数据进行匹配的规则,即用于描述后续需要在待搜索文档中搜索的内容;实际实现时,参考搜索规则和目标搜索规则均可以为正则表达式,用于查找待搜索文档中的目标字符。因而,在通过内容搜索界面对待搜索文档进行搜索之前,还可以先确定是否对参考搜索规则进行修改,如果对参考搜索规则进行了修改,则将修改后的搜索规则确定为目标搜索规则,如果没有对参考搜索规则进行修改,则依旧将参考搜索规则确定为目标搜索规则。
本实施例一个可选的实施方式中,除了可以预先设置对待搜索文档包括的文本数据进行匹配的搜索规则外,还可以预先设置待搜索文档中哪些文本数据无需匹配,即预先设置过滤规则,此时内容搜索界面包括过滤规则输入框,所述过滤规则输入框包括参考过滤规则;所述通过内容搜索界面,确定至少一个待搜索文档之前,还包括:
确定是否接收到针对所述参考过滤规则的第二修改指令;
在接收到针对所述参考过滤规则的第二修改指令的情况下,将所述第二修改指令中携带的过滤规则确定为目标过滤规则;
在未接收到针对所述参考过滤规则的第二修改指令的情况下,将所述参考过滤规则确定为目标过滤规则。
具体的,参考过滤规则是内容搜索界面默认的过滤规则,参考过滤规则可以是工作人员预先根据大部分实际应用场景设置的过滤规则;而目标过滤规则是后续对待搜索文档包括的文本数据进行过滤的规则,即用于描述后续待搜索文档中无需进行搜索的内容;实际实现时,过滤规则也是匹配规则的一种表现形式,即不想匹配的内容,即正则匹配的取反。因而,在通过内容搜索界面对待搜索文档进行搜索之前,还可以先确定是否对参考过滤规则进行修改,如果对参考过滤规则进行了修改,则将修改后的过滤规则确定为目标过滤规则,如果没有对参考过滤规则进行修改,则依旧将参考过滤规则确定为目标过滤规则。
本申请中支持自定义搜索规则和过滤规则,从而满足不同应用场景下需要搜索的内容的需求,灵活性高,从而可以适应各种不同的搜索场景。
步骤104:针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容。
具体的,在通过内容搜索界面,确定至少一个待搜索文档的基础上,进一步的,将针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容。
需要说明的是,针对至少一个待搜索文档中的每个待搜索文档都可以创建一个对应的线程,对该待搜索文档进行搜索;也即是,可以通过多线程同时分别对不同的待搜索文档进行处理,使用多线程充分利用操作系统多核的优势,减少线性执行的时间成本,提高搜索效率,快速定位想要搜索的内容。
实际实现时,传统内容搜索可能会需要打开文档,此时如果文档内容过大的话需要全部加载到内存中,且如果需要搜索多个文档的话,可能会需要重复选择多个文档进行打开操作,重复操作太多,并且打开的文档数量太多的话可能会造成操作系统卡顿的现象。而本申请中通过迭代器和生成器技术进行大文档内容查找,也即可以在待搜索文档的文本数据读取的时候使用多线程和生成器、迭代器的方式对文本数据进行读取,能够更快速的对多文档同时进行操作,并且在对多个文本内容读取操作的时候不会因文档数量太多和内容过大造成系统卡顿,操作时间复杂度降低不止一个数量级。
本实施例一个可选的实施方式中,可以根据文档的格式对文档进行解析,从而进行搜索,也即通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容,具体实现过程可以如下:
确定所述待搜索文档的文档格式;
根据所述文档格式对应的解析规则,对所述待搜索文档进行解析,获取所述待搜索文档的文本数据;
根据目标搜索规则对所述待搜索文档的文本数据进行匹配,获取对应的搜索内容。
实际应用中,除了根据目标搜索规则对所述待搜索文档的文本数据进行匹配,获取对应的搜索内容之外,若设置了目标过滤规则,则还可以根据目标搜索规则和目标过滤规则对所述待搜索文档的文本数据进行匹配,获取对应的搜索内容。也即,可以先通过目标过滤规则过滤掉无需进行匹配的文本数据,然后再根据目标匹配规则对过滤后的文本数据进行匹配,获取对应的搜索内容,从而提高匹配速率,减少资源消耗。
需要说明的是,不同的待搜索文档的文档格式可能并不相同,且不同文档格式的文档解析规则也并不相同,如文档格式可以为Excel、Word等。因而,可以通过每个待搜索文档对应的线程确定该待搜索文档的文档格式,然后按照相应的解析规则进行解析,获取对应的文本数据。如此,本申请可以支持多种常见文件格式内容查找,包括复杂的Excel电子表格内容。
另外,由于现有的办公软件不是根据不同路径进行文档区分,而是根据打开的文档名称进行文档区分,因而如果打开相同类型的同名文档,虽然文档在不同的路径下,现有的办公软件可能依旧会提示无法同时打开两个同名文档。而本申请中是针对任意待搜索文档,都可以通过其对应的线程,根据文档的路径,采用对应格式的解析规则进行解析,能够有效的避免使用现有办公软件无法打开相同类型同名文档的弊端。
再者,由于本申请中是通过创建线程,对待搜索文档进行解析,因而能够有效的支持跨平台操作,如linux在命令行模式下不能直接打开Excel电子表格文件,进而不能直接对此文件内容进行有效的搜索,而本申请中无论是在命令行模式下还是GUI(图形界面)模式下都能有效的进行文档搜索。
本实施例一个可选的实施方式中,除了直接将所述待搜索文档的文本数据中与目标搜索规则最匹配的内容作为搜索结果(即搜索内容)外,还可以根据相似度进行排序,将较为相似的多个高匹配结果作为搜索内容,因而根据目标搜索规则对所述待搜索文档的文本数据进行匹配,获取对应的搜索内容,包括:
确定所述待搜索文档对应的文本数据和所述目标搜索规则的匹配度;
将所述匹配度大于预设阈值的文本数据确定为所述搜索内容。
具体的,匹配度是指待搜索文档对应的各个文本数据和所述目标搜索规则的相似度。预设阈值是预先设置的数值,用于判断文本数据和目标搜索规则的相似程度。若某个文本数据和目标搜索规则的匹配度大于预设阈值,则说明该文本数据和目标搜索规则较为相似,可以作为搜索结果。
本申请中可以将文本数据和目标搜索规则的匹配度大于预设阈值的文本数据确定为搜索内容(即搜索结果),通过搜索结果的序列相似性的度量进行文本数据相似度排序,方便查看待搜索文档的文本数据中与目标搜索规则高度匹配的内容。
步骤106:在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。
具体的,在针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容的基础上,进一步的,将在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。
需要说明的是,针对至少一个待搜索文档可以分别通过其对应的线程,同时进行内容搜索,因而可以同时得到各个待搜索文档对应的搜索内容,从而在内容搜索界面同时显示该至少一个待搜索文档对应的搜索内容。
实际实现时,若同时对多个待搜索文档进行搜索的话,内容搜索界面的结果显示区域会同时显示多个待搜索文档的搜索结果,具体显示的搜索内容是文档名称和其对应的搜索内容。
示例的,图3是本申请一实施例提供的一种内容搜索界面显示搜索内容的示意图,如图3所示,待搜索文档包括文档1、文档2、文档3和文档4,将内容搜索界面的搜索内容展示区域划分为4个部分,分别展示每个待搜索文档对应的搜索内容。
本实施例一个可选的实施方式中,在内容搜索界面的结果显示区域显示待搜索文档的搜索结果可以有两种显示方式,具体实现时可以根据需求进行选择,因而在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容,具体实现过程可以如下:
确定所述内容搜索界面的显示规则;
在所述显示规则为显示文档的情况下,在所述内容搜索界面显示所述待搜索文档的文本数据,并对所述待搜索文档的文本数据中所述搜索内容进行标注;
在所述显示规则为显示搜索结果的情况下,在所述内容搜索界面显示所述搜索内容。
需要说明的是,显示规则为显示文档是指在内容搜索界面的结果显示区域内显示待搜索文档的全部文本数据,并对待搜索文档的文本数据中搜索内容进行标注,通过滚动的方式上下滑动进行查看,其中,对待搜索文档的文本数据中搜索内容进行标注可以为对搜索内容添加背景,高亮显示。而显示规则为显示搜索结果则是指在内容搜索界面的结果显示区域内仅显示待搜索文档的搜索内容。实际应用中,若想查看搜索结果的上下文内容,则可以通过上述第一种方式展示搜索内容,若只关注搜索结果,则可以通过第二种方式展示搜索内容。
本申请中可以通过不同的方式展示搜索内容,从而满足不同用户的展示需求,能够针对搜索结果提供友好的展示方式,灵活性更高,适用于各种不同的实际应用场景。
本实施例一个可选的实施方式中,在内容搜索界面显示搜索内容后,还可以直接在内容搜索界面提供针对搜索内容的处理操作,也即在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容之后,还包括:
检测是否接收到针对所述至少一个待搜索文档对应的目标搜索内容的处理操作;
在检测到所述处理操作的情况下,根据所述目标搜索内容对应的待搜索文档的标识,获取所述待搜索文档的文本数据,对所述目标搜索内容进行处理。
具体的,待搜索文档的标识即待搜索文档的路径标识,通过待搜索文档的标识可以唯一找到对应的待搜索文档。需要说明的是,若检测到针对至少一个待搜索文档对应的目标搜索内容的处理操作,则说明用户想用针对目标搜索内容进行处理,因而可以直接根据对应的待搜索文档的标识,找到对应的待搜索文档,对其文本数据进行处理。
本实施例一个可选的实施方式中,检测是否接收到针对所述至少一个待搜索文档对应的目标搜索内容的处理操作,具体实现过程可以如下:
当检测到针对所述目标搜索内容所处行的第一预设操作时,确定检测到针对所述目标搜索内容的复制操作;
当检测到针对目标搜索内容所处行的第二预设操作时,确定检测到针对所述目标搜索内容的编辑操作。
具体的,第一预设操作可以为针对某行文本进行的双击操作;第二预设操作可以是针对某行文本进行的单击编辑操作,如单击右键,弹出功能选项(如替换、删除等),选择某个功能选项后,对该行文本进行相应的编辑操作。
本申请中为了方便搜索内容的后续操作,提供了快速便捷的复制和编辑操作。实际实现时,复制操作只需要双击被标记的搜索内容所处行,会复制当前所处行的文本数据;编辑操作会根据单击所选的搜索内容所在的待搜索文档进行文本数据编辑操作,会根据所选搜索内容对应的文档的类型进行不同文本数据类型的编辑处理,提供了一种快捷编辑搜索内容的入口,无需重新选择文件夹,找到相应的待搜索文档进行文本数据编辑,大大的降低了操作时间复杂度。
另外,由于搜索方式分为批量文档搜索和单个文档搜索,如果是单个文档单独进行搜索内容操作的话,在内容搜索界面的搜索结果展示区,通过单击搜索内容进行编辑时,选中的行即为对应的文档内包括的行,当前编辑的文档标识即为单独搜索的待搜索文档的文档标识。批量文档搜索的话,会将搜索内容在内容搜索界面的搜索结果展示区进行批量展示,在展示的过程中会显示搜索内容所在文档和位置的标识,若搜索结束后再对搜索内容进行后续操作,则可以根据文档和位置的标识快速定位到对应的待搜索文档和所在的行数。另外,在进行搜索内容显示和编辑的时候,会根据待搜索文档的文档类型进行不同类型的读取和保存。
本实施例一个可选的实施方式中,在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容之后,还包括:
统计所述至少一个待搜索文档对应的搜索内容的数目;
在目标区域内显示所述搜索内容的数目,所述目标区域为所述内容搜索界面内的非展示区域,或者所述目标区域为创建的新弹窗中的显示区域。
需要说明的是,搜索结束后,还可以向用户展示搜索到的搜索内容的总数目,具体实现时,可以直接在内容搜索界面内的非展示区域显示该搜索内容的数目,其中,内容搜索界面内的非展示区域是指内容搜索界面内不展示搜索结果的区域;或者,可以创建一个新的弹窗,在该新的弹窗中显示该搜索内容的数目。
本申请提供的内容搜索方法,可以通过内容搜索界面,确定至少一个待搜索文档;然后针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容;之后,在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。这种情况下,无需打开待搜索文档,可以直接通过内容搜索界面对至少一个待搜索文档进行搜索,也即可以针对单个文档进行搜索,也可以针对多个待搜索文档进行批量搜索,无需等待打开文档的时间,充分利用多线程,减少线性执行的时间成本,提高搜索效率,快速定位想要搜索的内容;另外,如果待搜索文档过多或过大,则在执行批量搜索和单个文档搜索时,通过多线程进行文档读取不会对操作系统造成很高的负载,避免系统卡顿。
图4示出了本申请一实施例提供的另一种内容搜索方法的流程图,具体包括以下步骤:
步骤402:确定是否接收到针对所述参考搜索规则的第一修改指令。
步骤404:在接收到针对所述参考搜索规则的第一修改指令的情况下,将所述第一修改指令中携带的搜索规则确定为目标搜索规则。
步骤406:在未接收到针对所述参考搜索规则的第一修改指令的情况下,将所述参考搜索规则确定为目标搜索规则。
步骤408:确定是否接收到针对所述参考过滤规则的第二修改指令。
步骤410:在接收到针对所述参考过滤规则的第二修改指令的情况下,将所述第二修改指令中携带的过滤规则确定为目标过滤规则。
步骤412:在未接收到针对所述参考过滤规则的第二修改指令的情况下,将所述参考过滤规则确定为目标过滤规则。
步骤414:在通过所述内容搜索界面检测到针对目标文件夹的选择操作的情况下,将所述目标文件夹中包括的文档确定为所述待搜索文档;在通过所述内容搜索界面检测到针对目标文件夹中目标文档的选择操作的情况下,将所述目标文档确定为所述待搜索文档。
步骤416:针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程确定所述待搜索文档的文档格式,根据所述文档格式对应的解析规则,对所述待搜索文档进行解析,获取所述待搜索文档的文本数据;根据目标搜索规则和目标过滤规则对所述待搜索文档的文本数据进行匹配,获取对应的搜索内容。
步骤418:在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。
步骤420:检测是否接收到针对所述至少一个待搜索文档对应的目标搜索内容的处理操作;在检测到所述处理操作的情况下,根据所述目标搜索内容对应的待搜索文档的标识,获取所述待搜索文档的文本数据,对所述目标搜索内容进行处理。
本申请提供的内容搜索方法,可以通过内容搜索界面,确定至少一个待搜索文档;然后针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容;之后,在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。这种情况下,无需打开待搜索文档,可以直接通过内容搜索界面对至少一个待搜索文档进行搜索,也即可以针对单个文档进行搜索,也可以针对多个待搜索文档进行批量搜索,无需等待打开文档的时间,充分利用多线程,减少线性执行的时间成本,提高搜索效率,快速定位想要搜索的内容;另外,如果待搜索文档过多或过大,则在执行批量搜索和单个文档搜索时,通过多线程进行文档读取不会对操作系统造成很高的负载,避免系统卡顿。
与上述方法实施例相对应,本申请还提供了内容搜索装置实施例,图5示出了本申请一实施例提供的一种内容搜索装置的结构示意图。如图5所示,该装置包括:
第一确定模块502,被配置为通过内容搜索界面,确定至少一个待搜索文档;
解析模块504,被配置为针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容;
第一显示模块506,被配置为在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。
可选的,所述内容搜索界面包括搜索规则输入框,所述搜索规则输入框包括参考搜索规则;所述装置还包括:
第二确定模块,被配置为确定是否接收到针对所述参考搜索规则的第一修改指令;
第三确定模块,被配置为在接收到针对所述参考搜索规则的第一修改指令的情况下,将所述第一修改指令中携带的搜索规则确定为目标搜索规则;
第四确定模块,被配置为在未接收到针对所述参考搜索规则的第一修改指令的情况下,将所述参考搜索规则确定为目标搜索规则。
可选的,所述内容搜索界面包括过滤规则输入框,所述过滤规则输入框包括参考过滤规则;所述装置还包括:
第五确定模块,被配置为确定是否接收到针对所述参考过滤规则的第二修改指令;
第六确定模块,被配置为在接收到针对所述参考过滤规则的第二修改指令的情况下,将所述第二修改指令中携带的过滤规则确定为目标过滤规则;
第七确定模块,被配置为在未接收到针对所述参考过滤规则的第二修改指令的情况下,将所述参考过滤规则确定为目标过滤规则。
可选的,第一确定模块502进一步被配置为:
在通过所述内容搜索界面检测到针对目标文件夹的选择操作的情况下,将所述目标文件夹中包括的文档确定为所述待搜索文档;
在通过所述内容搜索界面检测到针对目标文件夹中目标文档的选择操作的情况下,将所述目标文档确定为所述待搜索文档。
可选的,解析模块504进一步被配置为:
确定所述待搜索文档的文档格式;
根据所述文档格式对应的解析规则,对所述待搜索文档进行解析,获取所述待搜索文档的文本数据;
根据目标搜索规则对所述待搜索文档的文本数据进行匹配,获取对应的搜索内容。
可选的,第一显示模块506进一步被配置为:
确定所述内容搜索界面的显示规则;
在所述显示规则为显示文档的情况下,在所述内容搜索界面显示所述待搜索文档的文本数据,并对所述待搜索文档的文本数据中所述搜索内容进行标注;
在所述显示规则为显示搜索结果的情况下,在所述内容搜索界面显示所述搜索内容。
可选的,解析模块504进一步被配置为:
确定所述待搜索文档对应的文本数据和所述目标搜索规则的匹配度;
将所述匹配度大于预设阈值的文本数据确定为所述搜索内容。
可选的,所述装置还包括:
检测模块,被配置为检测是否接收到针对所述至少一个待搜索文档对应的目标搜索内容的处理操作;
获取模块,被配置为在检测到所述处理操作的情况下,根据所述目标搜索内容对应的待搜索文档的标识,获取所述待搜索文档的文本数据,对所述目标搜索内容进行处理。
可选的,检测模块进一步被配置为:
当检测到针对所述目标搜索内容所处行的第一预设操作时,确定检测到针对所述目标搜索内容的复制操作;
当检测到针对目标搜索内容所处行的第二预设操作时,确定检测到针对所述目标搜索内容的编辑操作。
可选的,所述装置还包括:
统计模块,被配置为统计所述至少一个待搜索文档对应的搜索内容的数目;
第二显示模块,被配置为在目标区域内显示所述搜索内容的数目,所述目标区域为所述内容搜索界面内的非展示区域,或者所述目标区域为创建的新弹窗中的显示区域。
本申请提供的内容搜索装置,可以通过内容搜索界面,确定至少一个待搜索文档;然后针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容;之后,在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。这种情况下,无需打开待搜索文档,可以直接通过内容搜索界面对至少一个待搜索文档进行搜索,也即可以针对单个文档进行搜索,也可以针对多个待搜索文档进行批量搜索,无需等待打开文档的时间,充分利用多线程,减少线性执行的时间成本,提高搜索效率,快速定位想要搜索的内容;另外,如果待搜索文档过多或过大,则在执行批量搜索和单个文档搜索时,通过多线程进行文档读取不会对操作系统造成很高的负载,避免系统卡顿。
上述为本实施例的一种内容搜索装置的示意性方案。需要说明的是,该内容搜索装置的技术方案与上述的内容搜索方法的技术方案属于同一构思,内容搜索装置的技术方案未详细描述的细节内容,均可以参见上述内容搜索方法的技术方案的描述。
图6示出了根据本申请一实施例提供的一种计算设备600的结构框图。该计算设备600的部件包括但不限于存储器610和处理器620。处理器620与存储器610通过总线630相连接,数据库650用于保存数据。
计算设备600还包括接入设备640,接入设备640使得计算设备600能够经由一个或多个网络660通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备640可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本申请的一个实施例中,计算设备600的上述部件以及图6中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图6所示的计算设备结构框图仅仅是出于示例的目的,而不是对本申请范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备600可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备600还可以是移动式或静止式的服务器。
其中,处理器620用于执行如下计算机可执行指令,以实现下述方法:
通过内容搜索界面,确定至少一个待搜索文档;
针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容;
在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的内容搜索方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述内容搜索方法的技术方案的描述。
本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于:
通过内容搜索界面,确定至少一个待搜索文档;
针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容;
在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的内容搜索方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述内容搜索方法的技术方案的描述。
上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本申请的内容,可作很多的修改和变化。本申请选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

Claims (13)

1.一种内容搜索方法,其特征在于,包括:
通过内容搜索界面,确定至少一个待搜索文档;
针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容;
在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。
2.根据权利要求1所述的内容搜索方法,其特征在于,所述内容搜索界面包括搜索规则输入框,所述搜索规则输入框包括参考搜索规则;
所述通过内容搜索界面,确定至少一个待搜索文档之前,还包括:
确定是否接收到针对所述参考搜索规则的第一修改指令;
在接收到针对所述参考搜索规则的第一修改指令的情况下,将所述第一修改指令中携带的搜索规则确定为目标搜索规则;
在未接收到针对所述参考搜索规则的第一修改指令的情况下,将所述参考搜索规则确定为目标搜索规则。
3.根据权利要求1所述的内容搜索方法,其特征在于,所述内容搜索界面包括过滤规则输入框,所述过滤规则输入框包括参考过滤规则;
所述通过内容搜索界面,确定至少一个待搜索文档之前,还包括:
确定是否接收到针对所述参考过滤规则的第二修改指令;
在接收到针对所述参考过滤规则的第二修改指令的情况下,将所述第二修改指令中携带的过滤规则确定为目标过滤规则;
在未接收到针对所述参考过滤规则的第二修改指令的情况下,将所述参考过滤规则确定为目标过滤规则。
4.根据权利要求1-3任一所述的内容搜索方法,其特征在于,所述通过内容搜索界面,确定至少一个待搜索文档,包括:
在通过所述内容搜索界面检测到针对目标文件夹的选择操作的情况下,将所述目标文件夹中包括的文档确定为所述待搜索文档;
在通过所述内容搜索界面检测到针对目标文件夹中目标文档的选择操作的情况下,将所述目标文档确定为所述待搜索文档。
5.根据权利要求1-3任一所述的内容搜索方法,其特征在于,所述通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容,包括:
确定所述待搜索文档的文档格式;
根据所述文档格式对应的解析规则,对所述待搜索文档进行解析,获取所述待搜索文档的文本数据;
根据目标搜索规则对所述待搜索文档的文本数据进行匹配,获取对应的搜索内容。
6.根据权利要求1-3任一所述的内容搜索方法,其特征在于,所述在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容,包括:
确定所述内容搜索界面的显示规则;
在所述显示规则为显示文档的情况下,在所述内容搜索界面显示所述待搜索文档的文本数据,并对所述待搜索文档的文本数据中所述搜索内容进行标注;
在所述显示规则为显示搜索结果的情况下,在所述内容搜索界面显示所述搜索内容。
7.根据权利要求5所述的内容搜索方法,其特征在于,所述根据目标搜索规则对所述待搜索文档的文本数据进行匹配,获取对应的搜索内容,包括:
确定所述待搜索文档对应的文本数据和所述目标搜索规则的匹配度;
将所述匹配度大于预设阈值的文本数据确定为所述搜索内容。
8.根据权利要求1-3任一所述的内容搜索方法,其特征在于,所述在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容之后,还包括:
检测是否接收到针对所述至少一个待搜索文档对应的目标搜索内容的处理操作;
在检测到所述处理操作的情况下,根据所述目标搜索内容对应的待搜索文档的标识,获取所述待搜索文档的文本数据,对所述目标搜索内容进行处理。
9.根据权利要求8所述的内容搜索方法,其特征在于,所述检测是否接收到针对所述至少一个待搜索文档对应的目标搜索内容的处理操作,包括:
当检测到针对所述目标搜索内容所处行的第一预设操作时,确定检测到针对所述目标搜索内容的复制操作;
当检测到针对目标搜索内容所处行的第二预设操作时,确定检测到针对所述目标搜索内容的编辑操作。
10.根据权利要求1所述的内容搜索方法,其特征在于,所述在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容之后,还包括:
统计所述至少一个待搜索文档对应的搜索内容的数目;
在目标区域内显示所述搜索内容的数目,所述目标区域为所述内容搜索界面内的非展示区域,或者所述目标区域为创建的新弹窗中的显示区域。
11.一种内容搜索装置,其特征在于,包括:
第一确定模块,被配置为通过内容搜索界面,确定至少一个待搜索文档;
解析模块,被配置为针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容;
第一显示模块,被配置为在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。
12.一种计算设备,其特征在于,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现下述方法:
通过内容搜索界面,确定至少一个待搜索文档;
针对所述至少一个待搜索文档中的每个所述待搜索文档,创建对应的线程,通过所述线程对所述待搜索文档进行解析,获取所述待搜索文档对应的搜索内容;
在所述内容搜索界面显示所述至少一个待搜索文档对应的搜索内容。
13.一种计算机可读存储介质,其特征在于,其存储有计算机指令,该指令被处理器执行时实现权利要求1至10任意一项所述内容搜索方法的步骤。
CN202011563599.1A 2020-12-25 2020-12-25 内容搜索方法及装置 Pending CN112597275A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011563599.1A CN112597275A (zh) 2020-12-25 2020-12-25 内容搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011563599.1A CN112597275A (zh) 2020-12-25 2020-12-25 内容搜索方法及装置

Publications (1)

Publication Number Publication Date
CN112597275A true CN112597275A (zh) 2021-04-02

Family

ID=75202175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011563599.1A Pending CN112597275A (zh) 2020-12-25 2020-12-25 内容搜索方法及装置

Country Status (1)

Country Link
CN (1) CN112597275A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115658610A (zh) * 2022-12-22 2023-01-31 北京万里红科技有限公司 一种文件内容检查方法、计算设备及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008210A (zh) * 2014-06-20 2014-08-27 李玉坤 一种基于多搜索引擎的Web信息检索方法
CN107436948A (zh) * 2017-08-04 2017-12-05 广东欧珀移动通信有限公司 文件搜索方法、装置及终端
CN107870915A (zh) * 2016-09-23 2018-04-03 伊姆西Ip控股有限责任公司 对搜索结果的指示
CN109977279A (zh) * 2019-03-15 2019-07-05 天津字节跳动科技有限公司 在套件中搜索在线文档方法及装置
CN110188166A (zh) * 2019-05-15 2019-08-30 北京字节跳动网络技术有限公司 文档搜索方法、装置及电子设备
CN110765357A (zh) * 2019-10-24 2020-02-07 北京字节跳动网络技术有限公司 在线文档的搜索方法、装置、设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008210A (zh) * 2014-06-20 2014-08-27 李玉坤 一种基于多搜索引擎的Web信息检索方法
CN107870915A (zh) * 2016-09-23 2018-04-03 伊姆西Ip控股有限责任公司 对搜索结果的指示
CN107436948A (zh) * 2017-08-04 2017-12-05 广东欧珀移动通信有限公司 文件搜索方法、装置及终端
CN109977279A (zh) * 2019-03-15 2019-07-05 天津字节跳动科技有限公司 在套件中搜索在线文档方法及装置
CN110188166A (zh) * 2019-05-15 2019-08-30 北京字节跳动网络技术有限公司 文档搜索方法、装置及电子设备
CN110765357A (zh) * 2019-10-24 2020-02-07 北京字节跳动网络技术有限公司 在线文档的搜索方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115658610A (zh) * 2022-12-22 2023-01-31 北京万里红科技有限公司 一种文件内容检查方法、计算设备及可读存储介质

Similar Documents

Publication Publication Date Title
Shen et al. Layoutparser: A unified toolkit for deep learning based document image analysis
Staar et al. Corpus conversion service: A machine learning platform to ingest documents at scale
CA3047939C (en) Automated extraction of rules embedded in software application code using machine learning
US11507677B2 (en) Image classification modeling while maintaining data privacy compliance
US11373423B2 (en) Automated classification and interpretation of life science documents
US11880323B2 (en) System and method for building and implementing automated workflows
WO2022132944A1 (en) Generation and/or recommendation of tools for automating aspects of computer programming
Velasco-Elizondo et al. Knowledge representation and information extraction for analysing architectural patterns
CN112597275A (zh) 内容搜索方法及装置
US11574491B2 (en) Automated classification and interpretation of life science documents
WO2024044038A1 (en) Software development context history operations
CN111142871A (zh) 一种前端页面开发系统、方法、设备、介质
CN111858366A (zh) 一种测试用例生成方法、装置、设备及存储介质
EP4071599A1 (en) System and method for modernization of legacy batch based on functional context
KR20200103133A (ko) 하둡 기반의 빅데이터 시스템에서 etl 절차를 수행하는 방법 및 장치
Krishna et al. SHR++: An interface for morpho-syntactic annotation of Sanskrit corpora
CN114115831A (zh) 数据处理方法、装置、设备和存储介质
JP2015102878A (ja) プログラム関連分析方法
Chrystal et al. Text mining and classification of product reviews using structured support vector machine
CN113259358A (zh) 一种数据异常识别方法及装置
CN109446239A (zh) 线下文本挖掘方法、装置及计算机可读存储介质
JP7429374B2 (ja) 情報処理システム、情報処理方法及び情報処理プログラム
CN113297306B (zh) 数据处理方法及装置
EP4009194A1 (en) Automated classification and interpretation of life science documents
CN112445391B (zh) 一种服务数据生成方法、装置和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination