CN110232110A - 一种专利检索分析方法、系统及存储介质 - Google Patents
一种专利检索分析方法、系统及存储介质 Download PDFInfo
- Publication number
- CN110232110A CN110232110A CN201910458620.2A CN201910458620A CN110232110A CN 110232110 A CN110232110 A CN 110232110A CN 201910458620 A CN201910458620 A CN 201910458620A CN 110232110 A CN110232110 A CN 110232110A
- Authority
- CN
- China
- Prior art keywords
- retrieval
- word
- group
- keyword
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种专利检索分析方法、系统及存储介质,方法包括:步骤S101,获取用户输入的文本数据;步骤S102,判断文本数据的类型;步骤S103,当文本数据为关键词,进入步骤S106;步骤S104,当文本数据为段落文字,将段落文字转换为若干待选字组,并将转换的待选字组输出至用户界面供用户选择;步骤S105,根据用户的操作指令获取用户选择的待选字组得到关键词,进入步骤S106;步骤S106,根据关键词生成若干检索式;步骤S107,将每一检索式输入数据库获取相关检索结果,并将所有检索结果进行汇总后输出。本发明的专利检索分析方法、系统及存储介质可快速得出检索结果供用户进一步筛选或使用,可提升用户的检索效率,降低专利检索的难度,且遗漏率较低。
Description
技术领域
本发明涉及数据检索技术领域,特别是涉及一种专利检索分析方法、系统及存储介质。
背景技术
现有的专利数据库较多,专利领域从业人员基于各种需求需要在专利数据库中检索所需的专利,由于专利数据库中专利数据众多,因此想检索出有用的专利数据一般是一种困难的事情,当前专利领域从业人员主要靠人工检索获取专利文献,效率低且遗漏率高。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种可辅助人工进行快速检索、遗漏率较低的专利检索分析方法、系统及存储介质。
技术方案:为实现上述目的,本发明的专利检索分析方法,所述方法包括:
步骤S101,获取用户输入的文本数据;
步骤S102,判断所述文本数据的类型;
步骤S103,当所述文本数据为关键词,进入步骤S106;
步骤S104,当所述文本数据为段落文字,将所述段落文字转换为若干待选字组,并将转换的待选字组输出至用户界面供用户选择;
步骤S105,根据用户的操作指令获取用户选择的待选字组,并将用户选择的待选字组作为关键词,进入步骤S106;
步骤S106,根据关键词生成若干检索式;
步骤S107,将每一检索式输入数据库获取相关检索结果,并将所有检索式获取的检索结果进行汇总后输出。
可选地,所述将所述段落文字转换为若干待选字组包括:
步骤S201,利用预设的分词词典对所述段落文字进行拆分生成第一字组集;
步骤S202,按照预设的第一筛选方法对所述第一字组集中的字组进行筛选得到待选字组。
可选地,所述按照预设的第一筛选方法对所述第一字组集中的字组进行筛选得到待选字组包括:
步骤S301,对所述第一字组集中的每一个字组的词性进行标记;
步骤S302,提取其中的特定词性的字组得到待选字组。
可选地,所述根据关键词生成若干检索式包括:
步骤S401,将所有关键词按照排列组合方式进行组合,并对各组合的关键词之间建立和的逻辑关系;
步骤S402,从预设的关联词典中选取对应于各关键词的近似字组,并将近似字组以或的逻辑关系关联至各关键词。
可选地,所述根据关键词生成若干检索式之后还包括:
步骤S501,为各检索式匹配第一关联度;
所述将每一检索式输入数据库获取相关检索结果之后还包括:
步骤S601,计算每一条目的检索结果相对于检索式的第二关联度;
步骤S602,计算每一条目的检索结果的总关联度,其中,总关联度为第一关联度与第二关联度的乘积;
所述将所有检索式获取的检索结果进行汇总后输出包括:
步骤S701,筛选总关联度高于设定阈值的检索结果,并将各条目的检索结果进行排序,生成总关联度由高到低的检索条目列表;
步骤S702,输出所述检索条目列表。
一种专利检索分析系统,所述系统包括处理器以及存储器;
所述存储器用于存储可执行程序;
所述处理器用于执行所述可执行程序以实现上述的专利检索分析方法。
一种存储介质,所述存储介质上存储有可执行程序,所述可执行程序被执行时以实现上述的专利检索分析方法。
有益效果:本发明的专利检索分析方法、系统及存储介质可通过用户输入的关键词或文本段落生成检索式并自行检索,得出相应的检索结果供用户进一步筛选或使用,可提升用户的检索效率,降低专利检索的难度,且遗漏率较低。
附图说明
附图1为专利检索分析方法的流程图;
附图2为将段落文字转换为若干待选字组的流程图;
附图3为按照预设的第一筛选方法对第一字组集中的字组进行筛选得到待选字组的流程图;
附图4为根据关键词生成若干检索式的流程图;
附图5为计算各检索结果的关联度的流程图;
附图6为将所有检索式获取的检索结果进行汇总后输出的流程图。
具体实施方式
下面结合附图对本发明作更进一步的说明。
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
如附图1所示的专利检索分析方法,所述方法包括:
步骤S101,获取用户输入的文本数据;
步骤S102,判断所述文本数据的类型;
步骤S103,当所述文本数据为关键词,进入步骤S106;
步骤S104,当所述文本数据为段落文字,将所述段落文字转换为若干待选字组,并将转换的待选字组输出至用户界面供用户选择;
步骤S105,根据用户的操作指令获取用户选择的待选字组,并将用户选择的待选字组作为关键词,进入步骤S106;
步骤S106,根据关键词生成若干检索式;
步骤S107,将每一检索式输入数据库获取相关检索结果,并将所有检索式获取的检索结果进行汇总后输出。
可选地,如附图2所示,步骤S104中所述将所述段落文字转换为若干待选字组包括:
步骤S201,利用预设的分词词典对所述段落文字进行拆分生成第一字组集;
步骤S202,按照预设的第一筛选方法对所述第一字组集中的字组进行筛选得到待选字组。
可选地,如附图3所示,步骤S202中所述按照预设的第一筛选方法对所述第一字组集中的字组进行筛选得到待选字组包括:
步骤S301,对所述第一字组集中的每一个字组的词性进行标记;常见的词性如名词、动词、介词、形容词、量词等;
步骤S302,提取其中的特定词性的字组得到待选字组。如提取其中的名词与形容词。
可选地,如附图4所示,步骤S106中所述根据关键词生成若干检索式包括:
步骤S401,将所有关键词按照排列组合方式进行组合,并对各组合的关键词之间建立和的逻辑关系;
本步骤中,排列组合方式为从所有关键词中抽取若干数目的关键词,并列出所有的抽取组合,其中一般抽出的关键词的数量不少于两项。
步骤S402,从预设的关联词典中选取对应于各关键词的近似字组,并将近似字组以或的逻辑关系关联至各关键词。
可选地,步骤S106中所述根据关键词生成若干检索式之后还包括:
步骤S501,为各检索式匹配第一关联度;其中,检索式包含的关键词越多,第一关联度的值越高;
如附图5所示,步骤S107中所述将每一检索式输入数据库获取相关检索结果之后还包括:
步骤S601,计算每一条目的检索结果相对于检索式的第二关联度;其中,检索结果与检索式的匹配度越高,其第二关联度越大;
步骤S602,计算每一条目的检索结果的总关联度,其中,总关联度为第一关联度与第二关联度的乘积;
如附图6所示,步骤S107中所述将所有检索式获取的检索结果进行汇总后输出包括:
步骤S701,筛选总关联度高于设定阈值的检索结果,并将各条目的检索结果进行排序,生成总关联度由高到低的检索条目列表;
步骤S702,输出所述检索条目列表。
此外,本发明还公开了一种专利检索分析系统,所述系统包括处理器以及存储器;所述存储器用于存储可执行程序;所述处理器用于执行所述可执行程序以实现上述的专利检索分析方法。
此外,本发明还公开了一种存储介质,所述存储介质上存储有可执行程序,所述可执行程序被执行时以实现上述的专利检索分析方法。
本发明的专利检索分析方法、系统及存储介质可通过用户输入的关键词或文本段落生成检索式并自行检索,得出相应的检索结果供用户进一步筛选或使用,可提升用户的检索效率,降低专利检索的难度,且遗漏率较低。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (7)
1.一种专利检索分析方法,其特征在于,所述方法包括:
步骤S101,获取用户输入的文本数据;
步骤S102,判断所述文本数据的类型;
步骤S103,当所述文本数据为关键词,进入步骤S106;
步骤S104,当所述文本数据为段落文字,将所述段落文字转换为若干待选字组,并将转换的待选字组输出至用户界面供用户选择;
步骤S105,根据用户的操作指令获取用户选择的待选字组,并将用户选择的待选字组作为关键词,进入步骤S106;
步骤S106,根据关键词生成若干检索式;
步骤S107,将每一检索式输入数据库获取相关检索结果,并将所有检索式获取的检索结果进行汇总后输出。
2.由权利要求1所述的专利检索分析方法,其特征在于,所述将所述段落文字转换为若干待选字组包括:
步骤S201,利用预设的分词词典对所述段落文字进行拆分生成第一字组集;
步骤S202,按照预设的第一筛选方法对所述第一字组集中的字组进行筛选得到待选字组。
3.由权利要求2所述的专利检索分析方法,其特征在于,所述按照预设的第一筛选方法对所述第一字组集中的字组进行筛选得到待选字组包括:
步骤S301,对所述第一字组集中的每一个字组的词性进行标记;
步骤S302,提取其中的特定词性的字组得到待选字组。
4.由权利要求1所述的专利检索分析方法,其特征在于,所述根据关键词生成若干检索式包括:
步骤S401,将所有关键词按照排列组合方式进行组合,并对各组合的关键词之间建立和的逻辑关系;
步骤S402,从预设的关联词典中选取对应于各关键词的近似字组,并将近似字组以或的逻辑关系关联至各关键词。
5.由权利要求1所述的专利检索分析方法,其特征在于,所述根据关键词生成若干检索式之后还包括:
步骤S501,为各检索式匹配第一关联度;
所述将每一检索式输入数据库获取相关检索结果之后还包括:
步骤S601,计算每一条目的检索结果相对于检索式的第二关联度;
步骤S602,计算每一条目的检索结果的总关联度,其中,总关联度为第一关联度与第二关联度的乘积;
所述将所有检索式获取的检索结果进行汇总后输出包括:
步骤S701,筛选总关联度高于设定阈值的检索结果,并将各条目的检索结果进行排序,生成总关联度由高到低的检索条目列表;
步骤S702,输出所述检索条目列表。
6.一种专利检索分析系统,其特征在于,所述系统包括处理器以及存储器;
所述存储器用于存储可执行程序;
所述处理器用于执行所述可执行程序以实现如权利要求1-5任一项所述的专利检索分析方法。
7.一种存储介质,其特征在于,所述存储介质上存储有可执行程序,所述可执行程序被执行时以实现如权利要求1-5任一项所述的专利检索分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910458620.2A CN110232110A (zh) | 2019-05-29 | 2019-05-29 | 一种专利检索分析方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910458620.2A CN110232110A (zh) | 2019-05-29 | 2019-05-29 | 一种专利检索分析方法、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110232110A true CN110232110A (zh) | 2019-09-13 |
Family
ID=67858631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910458620.2A Withdrawn CN110232110A (zh) | 2019-05-29 | 2019-05-29 | 一种专利检索分析方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110232110A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113010072A (zh) * | 2021-04-27 | 2021-06-22 | 维沃移动通信(杭州)有限公司 | 搜索方法、装置、电子设备及可读存储介质 |
-
2019
- 2019-05-29 CN CN201910458620.2A patent/CN110232110A/zh not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113010072A (zh) * | 2021-04-27 | 2021-06-22 | 维沃移动通信(杭州)有限公司 | 搜索方法、装置、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6665661B1 (en) | System and method for use in text analysis of documents and records | |
USRE36727E (en) | Method of indexing and retrieval of electronically-stored documents | |
JP4953468B2 (ja) | オントロジーデータのインポート/エクスポートのための方法および装置 | |
CN104199965B (zh) | 一种语义信息检索方法 | |
Wang et al. | Vchunkjoin: An efficient algorithm for edit similarity joins | |
JP6231668B2 (ja) | キーワード拡張方法及びシステム並びに分類コーパス注釈方法及びシステム | |
de Kretser et al. | Effective document presentation with a locality-based similarity heuristic | |
US20020078044A1 (en) | System for automatically classifying documents by category learning using a genetic algorithm and a term cluster and method thereof | |
CN103390004B (zh) | 一种语义冗余的确定方法和装置、对应的搜索方法和装置 | |
CN109783787A (zh) | 一种结构化文档的生成方法、装置及存储介质 | |
JPH08500691A (ja) | バイリンガルデータベース処理方法とその装置 | |
KR101423549B1 (ko) | 감상 기반 질의 처리 시스템 및 방법 | |
WO2000003315A2 (en) | A search system and method for retrieval of data, and the use thereof in a search engine | |
US20070179940A1 (en) | System and method for formulating data search queries | |
Pourvali et al. | Automated text summarization base on lexicales chain and graph using of wordnet and wikipedia knowledge base | |
EP3232336A1 (en) | Method and device for recognizing stop word | |
Pande et al. | Application of natural language processing tools in stemming | |
Benitez et al. | Semantic knowledge construction from annotated image collections | |
CN110232110A (zh) | 一种专利检索分析方法、系统及存储介质 | |
Jiang et al. | Extraction of coherent relevant passages using hidden markov models | |
CN110555199B (zh) | 基于热点素材的文章生成方法、装置、设备及存储介质 | |
Bossard et al. | An evolutionary algorithm for automatic summarization | |
JP2004341948A (ja) | 概念抽出システム、概念抽出方法、プログラム及び記憶媒体 | |
KR20150008635A (ko) | 핵심 키워드 선정 장치, 핵심 키워드 선정 방법 및 이를 이용한 검색 서비스 제공 방법 | |
CN102750278B (zh) | 信息的获取方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20190913 |