CN111563204B - 一种信息提取方法及系统 - Google Patents

一种信息提取方法及系统 Download PDF

Info

Publication number
CN111563204B
CN111563204B CN202010397905.2A CN202010397905A CN111563204B CN 111563204 B CN111563204 B CN 111563204B CN 202010397905 A CN202010397905 A CN 202010397905A CN 111563204 B CN111563204 B CN 111563204B
Authority
CN
China
Prior art keywords
information
extraction
webpage
item
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010397905.2A
Other languages
English (en)
Other versions
CN111563204A (zh
Inventor
崔旭明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Qipeng Information Technology Co ltd
Original Assignee
Guangzhou Qipeng Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Qipeng Information Technology Co ltd filed Critical Guangzhou Qipeng Information Technology Co ltd
Priority to CN202010397905.2A priority Critical patent/CN111563204B/zh
Publication of CN111563204A publication Critical patent/CN111563204A/zh
Application granted granted Critical
Publication of CN111563204B publication Critical patent/CN111563204B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种信息提取方法及系统,其中,方法包括:步骤1:获取用户输入的需求信息;步骤2:基于需求信息生成网页获取请求;步骤3:基于网页获取需求获取至少一个待提取网页;步骤4:获取预先输入的对应于需求信息的至少一个提取项;步骤5:基于提取项从待提取网页提取对应于提取项的网页信息。本发明的信息提取方法,根据用户输入的需求信息,自动获取项目发布的网页,并对网页进行分析,提取项目名称、优惠政策、评定时间、评定材料要求、申报项目的企业条件要求、项目指标要求等,实现智能分析,方便用户解读项目内容。

Description

一种信息提取方法及系统
技术领域
本发明涉及信息提取技术领域,特别涉及一种信息提取方法及系统。
背景技术
目前,工信、发改、农业、教育、商贸都会有一些项目出台,但是这些项目有些对应的企业范围很广,一家物料公司也可以申报工信项目(物流信息化)、农业项目(助农物料);此外,不同政府层级出台的政策也存在区别。
现在,企业还是需要去阅读政府网站上的项目通知,并对项目通知进行人工分析。
发明内容
本发明目的之一在于提供了一种信息提取方法,根据用户输入的需求信息,自动获取项目发布的网页,并对网页进行分析,提取项目名称、优惠政策、评定时间、评定材料要求、申报项目的企业条件要求、项目指标要求等,实现智能分析,方便用户解读项目内容。
本发明实施例提供的一种信息提取方法,包括:
步骤1:获取用户输入的需求信息;
步骤2:基于需求信息生成网页获取请求;
步骤3:基于网页获取需求获取至少一个待提取网页;
步骤4:获取预先输入的对应于需求信息的至少一个提取项;
步骤5:基于提取项从待提取网页提取对应于提取项的网页信息。
优选的,提取项包括:项目名称、优惠政策、评定时间、评定材料要求、申报项目的企业条件要求、项目指标要求中一种或多种结合。
优选的,需求信息包括企业名称、意向部门、意向时间、企业所属区域中一种或多种结合。
优选的,信息提取方法还包括:
步骤6:打开待提取网页中的附件文档,基于提取项从附件文档的内容中提取对应于提取项的文档信息;
步骤7:将文档信息和网页信息填入预设模板中对应提取项的位置,做成信息提取结果并输出。
优选的,附件文档包括PDF文档、DOC文档、XLS文档中一种或多种结合。
优选的,基于提取项从待提取网页提取对应于提取项的网页信息,具体包括如下步骤:
解析提取项,获取提取项对应的提取关键词和预设与关键词关联的至少一个特征词;
解析待提取网页中的文字信息,定位关键词在待提取网页中的文字信息出现的位置,提取关键词前后预设长度的文字信息作为提取项对应的网页信息;
和/或,
在待提取网页中查找特征词,解析特征词前后预设长度的文字信息是否与提取项关联,当与提取项关联时提取特征词作为提取项对应的网页信息。
优选的,信息提取结果中的提取项对应的网页信息和文档信息为多个,且信息提取结果还包括:每个网页信息的源网页链接和每个文档信息的源文档链接。
优选的,步骤2:基于需求信息生成网页获取请求,具体包括:
解析需求,获取企业名称、意向部门和企业所属区域;
基于企业名称、意向部门和企业所属区域,在预先存储的网址库中确定至少一个项目发布的网址;
步骤3:基于网页获取需求获取至少一个待提取网页;具体包括:
打开项目发布的网址,获取发布网址中超链接的网页。
优选的,信息提取方法还包括:在步骤4和步骤5之间还包括:
步骤11:获取历史信息提取记录,历史提取记录中待提取网页、提取项和信息提取结果一一对应存储;
步骤12:当待提取网页未在历史信息提取记录中时,直接根据待提取网页和提取项从历史信息提取记录中获取信息提取结果;
步骤13:当待提取网页未在历史信息提取记录中时,执行步骤5。
本发明还提供一种信息提取系统,包括:
需求获取模块,用于获取用户输入的需求信息;
网页获取请求模块,用于基于需求信息生成网页获取请求;
网页获取模块,用于基于网页获取需求获取至少一个待提取网页;
提取项确定模块,用于获取预先输入的对应于需求信息的至少一个提取项;
网页信息提取模块,用于基于提取项从待提取网页提取对应于提取项的网页信息;
文档信息提取模块,用于打开待提取网页中的附件文档,基于提取项从附件文档的内容中提取对应于提取项的文档信息;
信息提取结果输出模块,用于将文档信息和网页信息填入预设模板中对应提取项的位置,做成信息提取结果并输出。
优选的,提取项包括:项目名称、优惠政策、评定时间、评定材料要求、申报项目的企业条件要求、项目指标要求中一种或多种结合。
优选的,需求信息包括企业名称、意向部门、意向时间、企业所属区域中一种或多种结合。
优选的,附件文档包括PDF文档、DOC文档、XLS文档中一种或多种结合。
优选的,网页信息提取模块执行包括如下步骤:
解析提取项,获取提取项对应的提取关键词和预设与关键词关联的至少一个特征词;
解析待提取网页中的文字信息,定位关键词在待提取网页中的文字信息出现的位置,提取关键词前后预设长度的文字信息作为提取项对应的网页信息;
和/或,
在待提取网页中查找特征词,解析特征词前后预设长度的文字信息是否与提取项关联,当与提取项关联时提取特征词作为提取项对应的网页信息。
优选的,信息提取结果中的提取项对应的网页信息和文档信息为多个,且信息提取结果还包括:每个网页信息的源网页链接和每个文档信息的源文档链接。
优选的,网页获取请求模块执行包括如下操作:
解析需求,获取企业名称、意向部门和企业所属区域;
基于企业名称、意向部门和企业所属区域,在预先存储的网址库中确定至少一个项目发布的网址;
网页获取模块执行包括如下操作:
打开项目发布的网址,获取发布网址中超链接的网页。
优选的,信息提取系统还包括
历史信息获取模块,用于获取历史信息提取记录,历史提取记录中待提取网页、提取项和信息提取结果一一对应存储;
查询模块,用于当待提取网页未在历史信息提取记录中时,直接根据待提取网页和提取项从历史信息提取记录中获取信息提取结果;当待提取网页未在历史信息提取记录中时,转给网页信息提取模块进行处理。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种信息提取方法的示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明实施例提供了一种信息提取方法,如图1所示,包括:
步骤1:获取用户输入的需求信息;需求信息包括:企业名称、意向部门、意向时间、企业所属区域等,需求信息获取手段可以在用户注册时采用采集表的形式,采集企业名称、意向部门、意向时间、企业所属区域;此外还可采集企业的详情,例如:企业规模、研发人员数量、正在进行的项目和已经获得的项目等。
步骤2:基于需求信息生成网页获取请求;主要是根据企业所属区域,从预设的项目发布网址目录上挑选需要提取信息的网页的网址;此外,如果用户输入了意向部门,还根据用户的意向部门进一步确定网址;
步骤3:基于网页获取需求获取至少一个待提取网页;即打开确定的项目发布网址,根据项目发布网址的网页上的超链接,依次获取项目发布网页,即待提取网页;
步骤4:获取预先输入的对应于需求信息的至少一个提取项;提取项包括:项目名称、优惠政策、评定时间、评定材料要求、申报项目的企业条件要求、项目指标要求等;
步骤5:基于提取项从待提取网页提取对应于提取项的网页信息。即在获取的项目发布网页将提取项对应的信息进行提取。
本发明的信息提取方法,根据用户输入的需求信息,自动获取项目发布的网页,并对网页进行分析,提取项目名称、优惠政策、评定时间、评定材料要求、申报项目的企业条件要求、项目指标要求等,实现智能分析,方便用户解读项目内容。
在一个实施例中,提取项包括:项目名称、优惠政策、评定时间、评定材料要求、申报项目的企业条件要求、项目指标要求中一种或多种结合。
在一个实施例中,需求信息包括企业名称、意向部门、意向时间、企业所属区域中一种或多种结合。
当需求信息只是企业名称时,采用爬虫程序从企查查等企业查询网站获取企业信息,确定企业所属区域等相关信息。需求信息为意向时间时,主要是在输出提取结果时根据意向时间对评定时间进行筛选。
在一个实施例中,信息提取方法还包括:
步骤6:打开待提取网页中的附件文档,基于提取项从附件文档的内容中提取对应于提取项的文档信息;通常在项目发布网页还超链接或嵌设有文档,文档格式为PDF或DOC或XLS。有些项目发布,在项目发布网页上的内容只是简要通知,而在附件文档中写明了项目的具体规定。故还需对附件文档进行信息提取;
步骤7:将文档信息和网页信息填入预设模板中对应提取项的位置,做成信息提取结果并输出。文档信息和网页信息在填入预设模板中,要经过合并和整合。
在一个实施例中,附件文档包括PDF文档、DOC文档、XLS文档中一种或多种结合。
为了实现网页信息和文档信息的提取,在一个实施例中,基于提取项从待提取网页提取对应于提取项的网页信息,具体包括如下步骤:
解析提取项,获取提取项对应的提取关键词和预设与关键词关联的至少一个特征词;
解析待提取网页中的文字信息,定位关键词在待提取网页中的文字信息出现的位置,提取关键词前后预设长度的文字信息作为提取项对应的网页信息;
和/或,
在待提取网页中查找特征词,解析特征词前后预设长度的文字信息是否与提取项关联,当与提取项关联时提取特征词作为提取项对应的网页信息。
在一个实施例中,信息提取结果中的提取项对应的网页信息和文档信息为多个,且信息提取结果还包括:每个网页信息的源网页链接和每个文档信息的源文档链接。
将所有提取项的对应提取信息都罗列出,方便用户区分。当文档信息为多个时,采用下拉菜单方式进行罗列。
在一个实施例中,步骤2:基于需求信息生成网页获取请求,具体包括:
解析需求,获取企业名称、意向部门和企业所属区域;
基于企业名称、意向部门和企业所属区域,在预先存储的网址库中确定至少一个项目发布的网址;
步骤3:基于网页获取需求获取至少一个待提取网页;具体包括:
打开项目发布的网址,获取发布网址中超链接的网页。
在一个实施例中,信息提取方法还包括:在步骤4和步骤5之间还包括:
步骤11:获取历史信息提取记录,历史提取记录中待提取网页、提取项和信息提取结果一一对应存储;
步骤12:当待提取网页未在历史信息提取记录中时,直接根据待提取网页和提取项从历史信息提取记录中获取信息提取结果;
步骤13:当待提取网页未在历史信息提取记录中时,执行步骤5。
通过信息提取记录的存储和调用,提高了信息提取的速度,即只需将历史信息提取记录中未提取的网页进行提取即可。
在一个实施例中,在输出信息提取结果时,计算信息提取结果与企业信息详情的匹配度,按照匹配度从大到小的顺序将提取结果进行排列;匹配度与企业信息详情中符合申报项目的企业条件要求的数目成正比;
和/或,
比较信息提取结果中评定时间与当前时间,当评定时间早于当前时间时,将该条信息提取结果做第一预设格式显示【例如灰度显示】,当评定时间在距当前时间的一个第一预设时间【例如两个月】内时将该条信息提取结果做第二预设格式显示【例如红色显示】;当评定时间在距当前时间的一个第一预设时间【例如两个月】与距当前时间的一个第二预设时间【例如一年】之间时将该条信息提取结果做第三预设格式显示【例如黄色显示】;当评定时间在距当前时间的一个第二预设时间【例如一年】之后时将该条信息提取结果做第四预设格式显示【例如绿色显示】。通过显示格式的不同提醒用户项目评定紧急情况。
本发明还提供一种信息提取系统,包括:
需求获取模块,用于获取用户输入的需求信息;需求信息包括:企业名称、意向部门、意向时间、企业所属区域等,需求信息获取手段可以在用户注册时采用采集表的形式,采集企业名称、意向部门、意向时间、企业所属区域;此外还可采集企业的详情,例如:企业规模、研发人员数量、正在进行的项目和已经获得的项目等。
网页获取请求模块,用于基于需求信息生成网页获取请求;主要是根据企业所属区域,从预设的项目发布网址目录上挑选需要提取信息的网页的网址;此外,如果用户输入了意向部门,还根据用户的意向部门进一步确定网址;
网页获取模块,用于基于网页获取需求获取至少一个待提取网页;即打开确定的项目发布网址,根据项目发布网址的网页上的超链接,依次获取项目发布网页,即待提取网页;
提取项确定模块,用于获取预先输入的对应于需求信息的至少一个提取项;提取项包括:项目名称、优惠政策、评定时间、评定材料要求、申报项目的企业条件要求、项目指标要求等;
网页信息提取模块,用于基于提取项从待提取网页提取对应于提取项的网页信息;即在获取的项目发布网页将提取项对应的信息进行提取。
文档信息提取模块,用于打开待提取网页中的附件文档,基于提取项从附件文档的内容中提取对应于提取项的文档信息;通常在项目发布网页还超链接或嵌设有文档,文档格式为PDF或DOC或XLS。有些项目发布,在项目发布网页上的内容只是简要通知,而在附件文档中写明了项目的具体规定。故还需对附件文档进行信息提取;
信息提取结果输出模块,用于将文档信息和网页信息填入预设模板中对应提取项的位置,做成信息提取结果并输出。文档信息和网页信息在填入预设模板中,要经过合并和整合。
本发明的信息提取系统,根据用户输入的需求信息,自动获取项目发布的网页,并对网页进行分析,提取项目名称、优惠政策、评定时间、评定材料要求、申报项目的企业条件要求、项目指标要求等,实现智能分析,方便用户解读项目内容。
在一个实施例中,提取项包括:项目名称、优惠政策、评定时间、评定材料要求、申报项目的企业条件要求、项目指标要求中一种或多种结合。
在一个实施例中,需求信息包括企业名称、意向部门、意向时间、企业所属区域中一种或多种结合。
在一个实施例中,附件文档包括PDF文档、DOC文档、XLS文档中一种或多种结合。
为了实现网页信息和文档信息的提取,在一个实施例中,网页信息提取模块执行包括如下步骤:
解析提取项,获取提取项对应的提取关键词和预设与关键词关联的至少一个特征词;
解析待提取网页中的文字信息,定位关键词在待提取网页中的文字信息出现的位置,提取关键词前后预设长度的文字信息作为提取项对应的网页信息;
和/或,
在待提取网页中查找特征词,解析特征词前后预设长度的文字信息是否与提取项关联,当与提取项关联时提取特征词作为提取项对应的网页信息。
在一个实施例中,信息提取结果中的提取项对应的网页信息和文档信息为多个,且信息提取结果还包括:每个网页信息的源网页链接和每个文档信息的源文档链接。
将所有提取项的对应提取信息都罗列出,方便用户区分。
在一个实施例中,网页获取请求模块执行包括如下操作:
解析需求,获取企业名称、意向部门和企业所属区域;
基于企业名称、意向部门和企业所属区域,在预先存储的网址库中确定至少一个项目发布的网址;
网页获取模块执行包括如下操作:
打开项目发布的网址,获取发布网址中超链接的网页。
在一个实施例中,信息提取系统还包括
历史信息获取模块,用于获取历史信息提取记录,历史提取记录中待提取网页、提取项和信息提取结果一一对应存储;
查询模块,用于当待提取网页未在历史信息提取记录中时,直接根据待提取网页和提取项从历史信息提取记录中获取信息提取结果;当待提取网页未在历史信息提取记录中时,转给网页信息提取模块进行处理。
通过信息提取记录的存储和调用,提高了信息提取的速度,即只需将历史信息提取记录中未提取的网页进行提取即可。
在一个实施例中,信息提取结果输出模块在输出信息提取结果时,计算信息提取结果与企业信息详情的匹配度,按照匹配度从大到小的顺序将提取结果进行排列;匹配度与企业信息详情中符合申报项目的企业条件要求的数目成正比;
和/或,
比较信息提取结果中评定时间与当前时间,当评定时间早于当前时间时,将该条信息提取结果做第一预设格式显示【例如灰度显示】,当评定时间在距当前时间的一个第一预设时间【例如两个月】内时将该条信息提取结果做第二预设格式显示【例如红色显示】;当评定时间在距当前时间的一个第一预设时间【例如两个月】与距当前时间的一个第二预设时间【例如一年】之间时将该条信息提取结果做第三预设格式显示【例如黄色显示】;当评定时间在距当前时间的一个第二预设时间【例如一年】之后时将该条信息提取结果做第四预设格式显示【例如绿色显示】。通过显示格式的不同提醒用户项目评定紧急情况。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种信息提取方法,其特征在于,包括:
步骤1:获取用户输入的需求信息;
步骤2:基于所述需求信息生成网页获取请求;
步骤3:基于所述网页获取需求获取至少一个待提取网页;
步骤4:获取预先输入的对应于所述需求信息的至少一个提取项;
步骤5:基于所述提取项从所述待提取网页提取对应于所述提取项的网页信息,具体包括如下步骤:
解析所述提取项,获取提取项对应的提取关键词和预设与所述关键词关联的至少一个特征词;
解析所述待提取网页中的文字信息,定位所述关键词在所述待提取网页中的文字信息出现的位置,提取关键词前后预设长度的文字信息作为所述提取项对应的网页信息;
和/或,
在所述待提取网页中查找特征词,解析所述特征词前后预设长度的文字信息是否与所述提取项关联,当与所述提取项关联时提取所述特征词作为所述提取项对应的网页信息;
步骤6:打开所述待提取网页中的附件文档,基于所述提取项从所述附件文档的内容中提取对应于所述提取项的文档信息;
步骤7:将所述文档信息和所述网页信息填入预设模板中对应所述提取项的位置,做成信息提取结果并输出。
2.如权利要求1所述的一种信息提取方法,其特征在于,所述提取项包括:项目名称、优惠政策、评定时间、评定材料要求、申报项目的企业条件要求、项目指标要求中一种或多种结合。
3.如权利要求1所述的一种信息提取方法,其特征在于,所述需求信息包括企业名称、意向部门、意向时间、企业所属区域中一种或多种结合。
4.如权利要求1所述的一种信息提取方法,其特征在于,所述附件文档包括PDF文档、DOC文档、XLS文档中一种或多种结合。
5.如权利要求1所述的一种信息提取方法,其特征在于,所述信息提取结果中的所述提取项对应的所述网页信息和所述文档信息为多个,且所述信息提取结果还包括:每个所述网页信息的源网页链接和每个所述文档信息的源文档链接。
6.如权利要求1所述的一种信息提取方法,其特征在于,所述步骤2:基于所述需求信息生成网页获取请求,具体包括:
解析所述需求,获取企业名称、意向部门和企业所属区域;
基于所述企业名称、所述意向部门和所述企业所属区域,在预先存储的网址库中确定至少一个项目发布的网址;
所述步骤3:基于所述网页获取需求获取至少一个待提取网页;具体包括:
打开所述项目发布的网址,获取发布网址中超链接的网页。
7.如权利要求1所述的一种信息提取方法,其特征在于,还包括:在所述步骤4和步骤5之间还包括:
步骤11:获取历史信息提取记录,所述历史提取记录中所述待提取网页、所述提取项和信息提取结果一一对应存储;
步骤12:当所述待提取网页未在所述历史信息提取记录中时,直接根据所述待提取网页和所述提取项从所述历史信息提取记录中获取所述信息提取结果;
步骤13:当所述待提取网页未在所述历史信息提取记录中时,执行步骤5。
8.一种信息提取系统,其特征在于,包括:
需求获取模块,用于获取用户输入的需求信息;
网页获取请求模块,用于基于所述需求信息生成网页获取请求;
网页获取模块,用于基于所述网页获取需求获取至少一个待提取网页;
提取项确定模块,用于获取预先输入的对应于所述需求信息的至少一个提取项;
网页信息提取模块,用于基于所述提取项从所述待提取网页提取对应于所述提取项的网页信息;
网页信息提取模块执行包括如下步骤:
解析所述提取项,获取提取项对应的提取关键词和预设与所述关键词关联的至少一个特征词;
解析所述待提取网页中的文字信息,定位所述关键词在所述待提取网页中的文字信息出现的位置,提取关键词前后预设长度的文字信息作为所述提取项对应的网页信息;
和/或,
在所述待提取网页中查找特征词,解析所述特征词前后预设长度的文字信息是否与所述提取项关联,当与所述提取项关联时提取所述特征词作为所述提取项对应的网页信息;
文档信息提取模块,用于打开所述待提取网页中的附件文档,基于所述提取项从所述附件文档的内容中提取对应于所述提取项的文档信息;
信息提取结果输出模块,用于将所述文档信息和所述网页信息填入预设模板中对应所述提取项的位置,做成信息提取结果并输出。
CN202010397905.2A 2020-05-12 2020-05-12 一种信息提取方法及系统 Active CN111563204B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010397905.2A CN111563204B (zh) 2020-05-12 2020-05-12 一种信息提取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010397905.2A CN111563204B (zh) 2020-05-12 2020-05-12 一种信息提取方法及系统

Publications (2)

Publication Number Publication Date
CN111563204A CN111563204A (zh) 2020-08-21
CN111563204B true CN111563204B (zh) 2023-07-25

Family

ID=72074641

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010397905.2A Active CN111563204B (zh) 2020-05-12 2020-05-12 一种信息提取方法及系统

Country Status (1)

Country Link
CN (1) CN111563204B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114201700A (zh) * 2021-12-10 2022-03-18 北京金堤科技有限公司 网页正文获取方法、装置、存储介质及电子设备
CN114528516A (zh) * 2022-01-08 2022-05-24 广东电力信息科技有限公司 一种智慧信息化项目管理方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015194955A (ja) * 2014-03-31 2015-11-05 株式会社ナビット 入札情報検索システム
CN108256832A (zh) * 2018-03-28 2018-07-06 施益斌 建筑设计招投标系统
CN110442768A (zh) * 2019-08-01 2019-11-12 广州高企云信息科技有限公司 一种智能的政策信息采集和查询方法及其系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015194955A (ja) * 2014-03-31 2015-11-05 株式会社ナビット 入札情報検索システム
CN108256832A (zh) * 2018-03-28 2018-07-06 施益斌 建筑设计招投标系统
CN110442768A (zh) * 2019-08-01 2019-11-12 广州高企云信息科技有限公司 一种智能的政策信息采集和查询方法及其系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冯思平.Web招标信息搜索及管理系统的设计.《中国优秀硕士学位论文全文数据库 信息科技辑》.2012,(第03期),I138-2742. *

Also Published As

Publication number Publication date
CN111563204A (zh) 2020-08-21

Similar Documents

Publication Publication Date Title
US10614527B2 (en) System and method for automatic generation of reports based on electronic documents
US9811604B2 (en) Method and system for defining an extension taxonomy
CN111125343A (zh) 适用于人岗匹配推荐系统的文本解析方法及装置
US10572726B1 (en) Media summarizer
CN111563204B (zh) 一种信息提取方法及系统
US20090210787A1 (en) Document data managing method, managing system, and computer software
US20120066580A1 (en) System for extracting relevant data from an intellectual property database
CN113282955B (zh) 隐私政策中隐私信息提取方法、系统、终端及介质
CN107783950A (zh) 药品说明书处理方法及装置
JP2008515061A (ja) 概念的メタデータおよび文脈的メタデータの検索エンジンを用いたウェブ上におけるデータ要素の検索方法
CN111191435B (zh) 一种用于海关报表的动态模板生成报表的方法及其装置
TWI453608B (zh) System and method for managing a large number of multiple data
US20080147631A1 (en) Method and system for collecting and retrieving information from web sites
CN110991988A (zh) 基于岗位信息文档的目标简历文件筛选方法和装置
CN112836018A (zh) 应急预案的处理方法及装置
US6745185B2 (en) System and method for online agency service of data mining and analyzing
US7716639B2 (en) Specification wizard
CA3051919C (en) Machine learning (ml) based expansion of a data set
US20210240334A1 (en) Interactive patent visualization systems and methods
KR20200091561A (ko) 세관신고를 위한 신고기재 오류 방지 시스템
CN113806661A (zh) 网站信息无障碍检测工具
CN112416992A (zh) 基于大数据和关键词的行业类型识别方法、系统及设备
CN101566987A (zh) 二次信息资源数据库系统及其资源处理方法
CN113407678A (zh) 知识图谱构建方法、装置和设备
JP2013037580A (ja) 情報処理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant