CN107291949A - 信息搜索方法及装置 - Google Patents
信息搜索方法及装置 Download PDFInfo
- Publication number
- CN107291949A CN107291949A CN201710580951.4A CN201710580951A CN107291949A CN 107291949 A CN107291949 A CN 107291949A CN 201710580951 A CN201710580951 A CN 201710580951A CN 107291949 A CN107291949 A CN 107291949A
- Authority
- CN
- China
- Prior art keywords
- file
- keyword
- information
- search method
- format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
- G06F16/986—Document structures and storage, e.g. HTML extensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/116—Details of conversion of file system types or formats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种信息搜索方法及装置,其中,信息搜索方法包括:接收用户上传的文件;确定文件的格式;当文件为第一预设格式时,从文件中获取关键词;根据关键词查询并获取与关键词相关的信息。本发明实施例的信息搜索方法及装置,通过接收用户上传的文件,确定文件的格式,并当文件为第一预设格式时,从文件中获取关键词,以及根据关键词查询并获取与关键词相关的信息,能够直观、方便地搜索到用户所需的信息,智能程度高、易用性强。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种信息搜索方法及装置。
背景技术
目前,通过在搜索引擎提供的文本输入框中,输入关键词进行搜索的方式已成为人们最常见的信息检索方式。而对于一个文件中的内容,用户需要先手动打开该文件,查找到关键词,然后再将关键词复制粘贴至搜索引擎中,再进行搜索。上述过程需要用户经过多次人工操作,不够直观、方便,且对于处理大量的数据以及复杂的逻辑的时候,错误率高。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种信息搜索方法,能够直观、方便地搜索到用户所需的信息,智能程度高、易用性强。
本发明的第二个目的在于提出一种信息搜索装置。
本发明的第三个目的在于提出一种信息搜索装置。
本发明的第四个目的在于提出一种计算机程序产品。
本发明的第五个目的在于提出一种非临时性计算机可读存储介质。
为达上述目的,本发明第一方面实施例提出了一种信息搜索方法,包括:接收用户上传的文件;确定所述文件的格式;当所述文件为第一预设格式时,从所述文件中获取关键词;根据所述关键词查询并获取与所述关键词相关的信息。
本发明实施例的信息搜索方法,通过接收用户上传的文件,确定文件的格式,并当文件为第一预设格式时,从文件中获取关键词,以及根据关键词查询并获取与所述关键词相关的信息,能够直观、方便地搜索到用户所需的信息,智能程度高、易用性强。
另外,本发明实施例的信息搜索方法,还有以下附加技术特征:
在本发明的一个实施例中,接收用户上传的文件,包括:
提供搜索页面及所述搜索页面上的搜索框;
确定所述用户上传的文件被拖动至所述搜索框。
在本发明的一个实施例中,确定所述文件的格式,包括:
获取所述文件的扩展名;
根据所述扩展名确定所述文件的格式。
在本发明的一个实施例中,当所述文件为第一预设格式时,从所述文件中获取关键词,包括:
基于预设规则,直接从所述文件的内容中提取所述关键词;或者
对所述文件进行OCR识别,并从识别成功后的文件的内容中提取所述关键词。
在本发明的一个实施例中,当所述文件为第二预设格式时,对所述文件进行人脸识别,并基于人脸识别出的识别结果进行查询并获取与所述识别结果相关的信息。
在本发明的一个实施例中,所述第一预设格式包括文本格式、超文本格式、网页文本格式、可转换成文本格式的图片格式、可转换成文本格式的压缩格式中的一种。
在本发明的一个实施例中,所述第二预设格式包括包含人脸的图片格式。
为达上述目的,本发明第二方面实施例提出了一种信息搜索装置,包括:接收模块,用于接收用户上传的文件;确定模块,用于确定所述文件的格式;第一获取模块,用于当所述文件为第一预设格式时,从所述文件中获取关键词;查询模块,用于根据所述关键词查询并获取与所述关键词相关的信息。
本发明实施例的信息搜索装置,通过接收用户上传的文件,确定文件的格式,并当文件为第一预设格式时,从文件中获取关键词,以及根据关键词查询并获取与所述关键词相关的信息,能够直观、方便地搜索到用户所需的信息,智能程度高、易用性强。
另外,本发明实施例的信息搜索装置,还有以下附加技术特征:
在本发明的一个实施例中,所述接收模块,用于:
提供搜索页面及所述搜索页面上的搜索框;
确定所述用户上传的文件被拖动至所述搜索框。
在本发明的一个实施例中,所述确定模块,用于:
获取所述文件的扩展名;
根据所述扩展名确定所述文件的格式。
在本发明的一个实施例中,所述第一获取模块,用于:
当所述文件为第一预设格式时,基于预设规则,直接从所述文件的内容中提取所述关键词;或者
对所述文件进行OCR识别,并从识别成功后的文件的内容中提取所述关键词。
在本发明的一个实施例中,所述装置还包括:第二获取模块,用于当所述文件为第二预设格式时,对所述文件进行人脸识别,并基于人脸识别出的识别结果进行查询并获取与所述识别结果相关的信息。
在本发明的一个实施例中,所述第一预设格式包括文本格式、超文本格式、网页文本格式、可转换成文本格式的图片格式、可转换成文本格式的压缩格式中的一种。
在本发明的一个实施例中,所述第二预设格式包括包含人脸的图片格式。
为达上述目的,本发明第三方面实施例提出了一种信息搜索装置,包括存储器和处理器,其中,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行如上述第一方面实施例所述的信息搜索方法。
为达上述目的,本发明第四方面实施例提出一种计算机程序产品,当计算机程序产品中的指令由处理器执行时,执行如第一方面实施例所述的信息搜索方法。
为达上述目的,本发明第五方面实施例提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面实施例所述的信息搜索方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例提供的一种信息搜索方法的流程示意图;
图2为本发明实施例提供的另一种信息搜索方法的流程示意图;
图3为本发明实施例提供的一种信息搜索装置的结构示意图;
图4为本发明实施例提供的另一种信息搜索装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的信息搜索方法及装置。
图1为本发明实施例提供的一种信息搜索方法的流程示意图。
如图1所示,该信息搜索方法包括:
S101,接收用户上传的文件。
在现有技术中,用户只能够通过打开文件,从文件中手动选出需要查找的关键词,再将关键词复制粘贴至搜索引擎中进行搜索,过程繁琐。因此,亟需一种快速、方便的信息搜索方法。
在本发明的一个实施例中,可先提供一个搜索页面,搜索页面上具有搜索框。该搜索框除现有的输入功能外,还可以通过拖拽文件的方式接收输入,用户可通过文件管理器拖动想要搜索的文件到搜索框,即可实现文件上传。
S102,确定文件的格式。
在接收到用户上传的文件之后,可确定文件的格式。
在本发明的一个实施例中,可获取文件的扩展名,再根据扩展名来确定文件的格式。例如:扩展名为txt、doc、docx等的文件,可以确定为文本格式。
S103,当文件为第一预设格式时,从文件中获取关键词。
其中,第一预设格式包括文本格式、超文本格式、网页文本格式、可转换成文本格式的图片格式、可转换成文本格式的压缩格式中的一种。
在本发明的实施例中,可通过两种方法从文件中获取关键词。第一种方法:可基于预设规则,直接从文件的内容中提取关键词。例如:预设规则可以设定为手机号码、身份证号码等表明身份信息的数字。也就是说,可以对上传的文件进行解析,通过查找文本的内容中是否有手机号码、身份证号码,如果有则将其作为搜索用的关键词。
第二种方法:可对文件进行OCR识别,并从识别成功后的文件的内容中提取关键词。例如:对于一些不可编辑的文本文件,无法直接对文件进行文本解析,则可通过OCR技术对该文件进行识别,如可通过该技术识别名片上的手机号码,再将识别出的手机号码作为搜索用的关键词。
S104,根据关键词查询并获取与关键词相关的信息。
在获取关键词之后,可根据关键词查询相关的数据库,并从该数据库中获取与关键词相关的信息。例如:通过手机号码,可以搜索到与该手机号码相关联的信息,如现在的手机号码均是实名制,因此可通过手机号码获取到对应的人物的一些相关信息,姓名、年龄、该手机号码的开通时间等等,从而对上述信息能够方便、统一的管理。
本发明实施例的信息搜索方法,通过接收用户上传的文件,确定文件的格式,并当文件为第一预设格式时,从文件中获取关键词,以及根据关键词查询并获取与关键词相关的信息,能够直观、方便地搜索到用户所需的信息,智能程度高、易用性强。
如图2所示,该信息搜索方法还可包括:
S105,当文件为第二预设格式时,对文件进行人脸识别,并基于人脸识别出的识别结果进行查询并获取与识别结果相关的信息。
其中,第二预设格式包括包含人脸的图片格式。
在本发明的一个实施例中,在确定用户上传的文件是包含人脸的图片格式时,可利用人脸识别技术对文件中的人脸进行识别,再根据识别出的识别结果进行查询,从而获得识别结果相关的信息。例如:上传的文件是一张两寸的证件照,则可识别证件照中的人脸特征,从数据库中查找出与该人脸特征一致的人物信息,如手机号码、身份证号码、身高、体重等等。利用图片来搜索所需的信息,进一步提高搜索的效率。
本发明实施例的信息搜索方法,通过接收用户上传的文件,确定文件的格式,并当文件为第二预设格式时,对文件进行人脸识别,并基于人脸识别出的识别结果进行查询并获取与识别结果相关的信息,进一步提高搜索到用户所需的信息的效率,智能程度更高、易用性更强。
为了实现上述目的,本发明实施例还提出一种信息搜索装置。
图3为本发明实施例提供的一种信息搜索装置的结构示意图。
如图3所示,该信息搜索装置包括:接收模块31、确定模块32、第一获取模块33和查询模块34。
接收模块31用于接收用户上传的文件。
确定模块32用于确定文件的格式。
第一获取模块33用于当文件为第一预设格式时,从文件中获取关键词。
查询模块34用于根据关键词查询并获取与关键词相关的信息。
可选的,接收模块31用于提供搜索页面及搜索页面上的搜索框;确定用户上传的文件被拖动至搜索框。
可选的,确定模块32用于获取文件的扩展名;根据扩展名确定文件的格式。
可选的,第一获取模块33用于当文件为第一预设格式时,基于预设规则,直接从文件的内容中提取关键词;或者对文件进行OCR识别,并从识别成功后的文件的内容中提取关键词。
可选的,第一预设格式包括文本格式、超文本格式、网页文本格式、可转换成文本格式的图片格式、可转换成文本格式的压缩格式中的一种。
如图4所示,信息搜索装置还可包括第二获取模块35。
第二获取模块35用于当文件为第二预设格式时,对文件进行人脸识别,并基于人脸识别出的识别结果进行查询并获取与识别结果相关的信息。
可选的,第二预设格式包括包含人脸的图片格式。
需要说明的是,上述实施例提出的信息搜索方法,也适用于本发明实施例提出的信息搜索装置,在此不赘述。
本发明实施例的信息搜索装置,通过接收用户上传的文件,确定文件的格式,并当文件为第一预设格式时,从文件中获取关键词,以及根据关键词查询并获取与关键词相关的信息,能够直观、方便地搜索到用户所需的信息,智能程度高、易用性强。
为了实现上述目的,本发明实施例提出了一种信息搜索装置,包括存储器和处理器,其中,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行如上述实施例的信息搜索方法。
为了实现上述目的,本发明实施例提出一种计算机程序产品,当计算机程序产品中的指令由处理器执行时,执行如上述实施例的信息搜索方法。
为了实现上述目的,本发明实施例提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述实施例的信息搜索方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (17)
1.一种信息搜索方法,其特征在于,包括:
接收用户上传的文件;
确定所述文件的格式;
当所述文件为第一预设格式时,从所述文件中获取关键词;
根据所述关键词查询并获取与所述关键词相关的信息。
2.如权利要求1所述的信息搜索方法,其特征在于,接收用户上传的文件,包括:
提供搜索页面及所述搜索页面上的搜索框;
确定所述用户上传的文件被拖动至所述搜索框。
3.如权利要求1所述的信息搜索方法,其特征在于,确定所述文件的格式,包括:
获取所述文件的扩展名;
根据所述扩展名确定所述文件的格式。
4.如权利要求1所述的信息搜索方法,其特征在于,当所述文件为第一预设格式时,从所述文件中获取关键词,包括:
基于预设规则,直接从所述文件的内容中提取所述关键词;或者
对所述文件进行OCR识别,并从识别成功后的文件的内容中提取所述关键词。
5.如权利要求1所述的信息搜索方法,其特征在于,还包括:
当所述文件为第二预设格式时,对所述文件进行人脸识别,并基于人脸识别出的识别结果进行查询并获取与所述识别结果相关的信息。
6.如权利要求1所述的信息搜索方法,其特征在于,所述第一预设格式包括文本格式、超文本格式、网页文本格式、可转换成文本格式的图片格式、可转换成文本格式的压缩格式中的一种。
7.如权利要求5所述的信息搜索方法,其特征在于,所述第二预设格式包括包含人脸的图片格式。
8.一种信息搜索装置,其特征在于,包括:
接收模块,用于接收用户上传的文件;
确定模块,用于确定所述文件的格式;
第一获取模块,用于当所述文件为第一预设格式时,从所述文件中获取关键词;
查询模块,用于根据所述关键词查询并获取与所述关键词相关的信息。
9.如权利要求8所述的信息搜索装置,其特征在于,所述接收模块,用于:
提供搜索页面及所述搜索页面上的搜索框;
确定所述用户上传的文件被拖动至所述搜索框。
10.如权利要求8所述的信息搜索装置,其特征在于,所述确定模块,用于:
获取所述文件的扩展名;
根据所述扩展名确定所述文件的格式。
11.如权利要求8所述的信息搜索装置,其特征在于,所述第一获取模块,用于:
当所述文件为第一预设格式时,基于预设规则,直接从所述文件的内容中提取所述关键词;或者
对所述文件进行OCR识别,并从识别成功后的文件的内容中提取所述关键词。
12.如权利要求8所述的信息搜索装置,其特征在于,还包括:
第二获取模块,用于当所述文件为第二预设格式时,对所述文件进行人脸识别,并基于人脸识别出的识别结果进行查询并获取与所述识别结果相关的信息。
13.如权利要求8所述的信息搜索装置,其特征在于,所述第一预设格式包括文本格式、超文本格式、网页文本格式、可转换成文本格式的图片格式、可转换成文本格式的压缩格式中的一种。
14.如权利要求12所述的信息搜索装置,其特征在于,所述第二预设格式包括包含人脸的图片格式。
15.一种信息搜索装置,其特征在于,包括存储器和处理器,其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行如权利要求1-7中任一项所述的信息搜索方法。
16.一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如权利要求1-7中任一项所述的信息搜索方法。
17.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的信息搜索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710580951.4A CN107291949B (zh) | 2017-07-17 | 2017-07-17 | 信息搜索方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710580951.4A CN107291949B (zh) | 2017-07-17 | 2017-07-17 | 信息搜索方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107291949A true CN107291949A (zh) | 2017-10-24 |
CN107291949B CN107291949B (zh) | 2020-11-13 |
Family
ID=60100897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710580951.4A Active CN107291949B (zh) | 2017-07-17 | 2017-07-17 | 信息搜索方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107291949B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664973A (zh) * | 2018-03-28 | 2018-10-16 | 北京捷通华声科技股份有限公司 | 文本处理方法和装置 |
CN110955633A (zh) * | 2018-09-26 | 2020-04-03 | 北京国双科技有限公司 | 检索方法及装置 |
CN111049887A (zh) * | 2019-11-29 | 2020-04-21 | 天脉聚源(杭州)传媒科技有限公司 | 基于动态搜索策略的下载控制方法、系统及存储介质 |
CN111739585A (zh) * | 2020-06-24 | 2020-10-02 | 胡嘉欣 | 一种基于ncbi数据库的信息提取方法及其相关设备 |
CN112347061A (zh) * | 2020-11-27 | 2021-02-09 | 中国农业银行股份有限公司 | 一种文件上传方法及装置 |
CN113590542A (zh) * | 2021-09-30 | 2021-11-02 | 统信软件技术有限公司 | 一种文件搜索方法、计算设备及存储介质 |
CN117114711A (zh) * | 2023-08-18 | 2023-11-24 | 广东烟草云浮市有限责任公司 | 基于人工智能的烟草专卖执法用数据分析管理方法及平台 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005135041A (ja) * | 2003-10-29 | 2005-05-26 | Hitachi Ltd | 文書検索・閲覧手法及び文書検索・閲覧装置 |
US20070233692A1 (en) * | 2006-04-03 | 2007-10-04 | Lisa Steven G | System, methods and applications for embedded internet searching and result display |
US20100215272A1 (en) * | 2008-09-23 | 2010-08-26 | Andrey Isaev | Automatic file name generation in ocr systems |
CN102682111A (zh) * | 2012-05-11 | 2012-09-19 | 广东欧珀移动通信有限公司 | 一种图片检索方法 |
US20120265759A1 (en) * | 2011-04-15 | 2012-10-18 | Xerox Corporation | File processing of native file formats |
CN102779140A (zh) * | 2011-05-13 | 2012-11-14 | 富士通株式会社 | 一种关键词获取方法及装置 |
CN102868765A (zh) * | 2012-10-09 | 2013-01-09 | 乐视网信息技术(北京)股份有限公司 | 文件上传方法和系统 |
CN103064972A (zh) * | 2013-01-08 | 2013-04-24 | 深圳市中兴移动通信有限公司 | 移动终端图像检索的方法和装置 |
CN103294693A (zh) * | 2012-02-27 | 2013-09-11 | 华为技术有限公司 | 搜索方法、服务器及系统 |
CN106021390A (zh) * | 2016-05-12 | 2016-10-12 | 福建南威软件有限公司 | 一种文件的管理方法和装置 |
CN106575300A (zh) * | 2014-07-28 | 2017-04-19 | 微软技术许可有限责任公司 | 用于识别文档中的对象的基于图像的搜索 |
-
2017
- 2017-07-17 CN CN201710580951.4A patent/CN107291949B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005135041A (ja) * | 2003-10-29 | 2005-05-26 | Hitachi Ltd | 文書検索・閲覧手法及び文書検索・閲覧装置 |
US20070233692A1 (en) * | 2006-04-03 | 2007-10-04 | Lisa Steven G | System, methods and applications for embedded internet searching and result display |
US20100215272A1 (en) * | 2008-09-23 | 2010-08-26 | Andrey Isaev | Automatic file name generation in ocr systems |
US20120265759A1 (en) * | 2011-04-15 | 2012-10-18 | Xerox Corporation | File processing of native file formats |
CN102779140A (zh) * | 2011-05-13 | 2012-11-14 | 富士通株式会社 | 一种关键词获取方法及装置 |
CN103294693A (zh) * | 2012-02-27 | 2013-09-11 | 华为技术有限公司 | 搜索方法、服务器及系统 |
CN102682111A (zh) * | 2012-05-11 | 2012-09-19 | 广东欧珀移动通信有限公司 | 一种图片检索方法 |
CN102868765A (zh) * | 2012-10-09 | 2013-01-09 | 乐视网信息技术(北京)股份有限公司 | 文件上传方法和系统 |
CN103064972A (zh) * | 2013-01-08 | 2013-04-24 | 深圳市中兴移动通信有限公司 | 移动终端图像检索的方法和装置 |
CN106575300A (zh) * | 2014-07-28 | 2017-04-19 | 微软技术许可有限责任公司 | 用于识别文档中的对象的基于图像的搜索 |
CN106021390A (zh) * | 2016-05-12 | 2016-10-12 | 福建南威软件有限公司 | 一种文件的管理方法和装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664973A (zh) * | 2018-03-28 | 2018-10-16 | 北京捷通华声科技股份有限公司 | 文本处理方法和装置 |
CN110955633A (zh) * | 2018-09-26 | 2020-04-03 | 北京国双科技有限公司 | 检索方法及装置 |
CN111049887A (zh) * | 2019-11-29 | 2020-04-21 | 天脉聚源(杭州)传媒科技有限公司 | 基于动态搜索策略的下载控制方法、系统及存储介质 |
CN111739585A (zh) * | 2020-06-24 | 2020-10-02 | 胡嘉欣 | 一种基于ncbi数据库的信息提取方法及其相关设备 |
CN111739585B (zh) * | 2020-06-24 | 2022-10-18 | 胡嘉欣 | 一种基于ncbi数据库的信息提取方法及其相关设备 |
CN112347061A (zh) * | 2020-11-27 | 2021-02-09 | 中国农业银行股份有限公司 | 一种文件上传方法及装置 |
CN113590542A (zh) * | 2021-09-30 | 2021-11-02 | 统信软件技术有限公司 | 一种文件搜索方法、计算设备及存储介质 |
CN117114711A (zh) * | 2023-08-18 | 2023-11-24 | 广东烟草云浮市有限责任公司 | 基于人工智能的烟草专卖执法用数据分析管理方法及平台 |
CN117114711B (zh) * | 2023-08-18 | 2024-08-02 | 广东烟草云浮市有限责任公司 | 基于人工智能的烟草专卖执法用数据分析管理方法及平台 |
Also Published As
Publication number | Publication date |
---|---|
CN107291949B (zh) | 2020-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107291949A (zh) | 信息搜索方法及装置 | |
CN110765770B (zh) | 一种合同自动生成方法及装置 | |
US7937338B2 (en) | System and method for identifying document structure and associated metainformation | |
CN107705066A (zh) | 一种商品入库时信息录入方法及电子设备 | |
CN111125343A (zh) | 适用于人岗匹配推荐系统的文本解析方法及装置 | |
US11625660B2 (en) | Machine learning for automatic extraction and workflow assignment of action items | |
CN111144370B (zh) | 单据要素抽取方法、装置、设备及存储介质 | |
CN114117171A (zh) | 一种基于赋能思维的工程档案智能收整方法及系统 | |
CN110334217A (zh) | 一种要素抽取方法、装置、设备及存储介质 | |
CN108595544A (zh) | 一种文档图片分类方法 | |
CN110472057B (zh) | 话题标签的生成方法及装置 | |
CN107203265A (zh) | 信息交互方法和装置 | |
CN206411669U (zh) | 一种SaaS古籍知识服务云平台 | |
CN110795561B (zh) | 一种电子卷宗材料类型自动识别系统及其自主学习方法 | |
KR102185733B1 (ko) | 프로필 자동생성서버 및 방법 | |
CN117573876A (zh) | 一种业务数据分类分级方法及装置 | |
CN111401438B (zh) | 图像分拣方法、装置及系统 | |
CN109993381B (zh) | 基于知识图谱的需求管理应用方法、装置、设备及介质 | |
CN115659969A (zh) | 文档标注方法、装置、电子设备及存储介质 | |
US20230065089A1 (en) | System, apparatus, non-transitory computer-readable medium, and method for automatically generating responses to requests for information using artificial intelligence | |
CN111401047A (zh) | 法律文书的争议焦点生成方法、装置及计算机设备 | |
CN115050042A (zh) | 一种理赔资料录入方法、装置、计算机设备及存储介质 | |
Kumar et al. | Optical Character Recognition Technology using Machine Learning | |
CN112579747B (zh) | 一种身份信息提取方法及装置 | |
Wu et al. | Automatic semantic knowledge extraction from electronic forms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20190903 Address after: 100192 Dongsheng Science Park, Zhongguancun, 66 Xixiaokou Road, Haidian District, Beijing Applicant after: Green Bay Network Technology Co., Ltd. Address before: 100089 Beijing Haidian District Xixiaokou Road 66 Zhongguancun Dongsheng Science Park B-6 Building B 5 floors Applicant before: Grass count language (Beijing) Technology Co., Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |