CN116431930A - 科技成果转化数据查询方法、系统、终端及存储介质 - Google Patents

科技成果转化数据查询方法、系统、终端及存储介质 Download PDF

Info

Publication number
CN116431930A
CN116431930A CN202310691816.2A CN202310691816A CN116431930A CN 116431930 A CN116431930 A CN 116431930A CN 202310691816 A CN202310691816 A CN 202310691816A CN 116431930 A CN116431930 A CN 116431930A
Authority
CN
China
Prior art keywords
data
preset
query
word
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310691816.2A
Other languages
English (en)
Inventor
张佩佩
房玉峰
张潘丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Lianchuang Technology Development Co ltd
Original Assignee
Tianjin Lianchuang Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Lianchuang Technology Development Co ltd filed Critical Tianjin Lianchuang Technology Development Co ltd
Priority to CN202310691816.2A priority Critical patent/CN116431930A/zh
Publication of CN116431930A publication Critical patent/CN116431930A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种科技成果转化数据查询方法、系统、终端及存储介质,涉及数据查询的领域,其包括获取查询关键词;将所述查询关键词进行分词处理,得到包含若干个字段的分词数组;在预设数据库中提取预设关键词,并将每个所述预设关键词与相应的数据结果列表进行关联,得到关联集合;将所述分词数组中的每个字段分别与所述关联集合中的每个所述预设关键词进行匹配,匹配成功后将与所述预设关键词关联的所述数据结果列表加入查询结果列表;将所述查询结果列表返回至终端用户。本申请具有便于快速、准确地输出查询结果的效果。

Description

科技成果转化数据查询方法、系统、终端及存储介质
技术领域
本申请涉及数据查询及检索技术领域,尤其是涉及一种科技成果转化数据查询方法、系统、终端及存储介质。
背景技术
目前,随着数字化信息资源共享的体系架构的逐步形成,网络数据资源的整体开发、交流、利用的深度、广度以及传播的速度正在发生革命性的变化,这为广大的公众特别是科技人员共享科技信息的资源提供了良好的技术与资源保障。
但是现有的网络数据资源繁杂,尤其是科技成果转化领域相关数据,这使得用户在筛选和查询数据时无法做到快速准确定位,难以直接获取有价值信息,无法满足用户进行专业分析的需求。
发明内容
为了解决上述现有技术中存在的难题,本申请提供一种科技成果转化数据查询方法、系统、终端及存储介质。
第一方面,本申请提供一种科技成果转化数据查询方法,采用如下的技术方案:
一种科技成果转化数据查询方法,包括:
获取查询关键词;
将所述查询关键词进行分词处理,得到包含若干个字段的分词数组;
在预设数据库中提取预设关键词,并将每个所述预设关键词与相应的数据结果列表进行关联,得到关联集合;
将所述分词数组中的每个字段分别与所述关联集合中的每个所述预设关键词进行匹配,匹配成功后将与所述预设关键词关联的所述数据结果列表加入查询结果列表;
将所述查询结果列表返回至终端用户。
可选地,所述在预设数据库中提取预设关键词,包括:
获取预设数据库中的若干个数据主题;
将所述数据主题中的每个词作为节点,词与词共同出现在同一窗口内作为节点与节点之间的链,计算所述数据主题中每个词出现的概率及权重;
计算每个词在所有数据主题中的总权重,并根据每个词的总权重高低排序靠前的一部分提取预设关键词。
可选地,计算所述数据主题中的每个词出现的概率及权重,以及计算每个词在所有数据主题中的总权重,包括:
在其中一个所述数据主题中词
Figure SMS_1
出现的概率为:
Figure SMS_2
其中,
Figure SMS_4
表示词
Figure SMS_10
出现的概率,
Figure SMS_13
表示词
Figure SMS_6
出现的概率,
Figure SMS_9
表示 词
Figure SMS_12
和词
Figure SMS_15
有关联的概率,
Figure SMS_3
表示预设关键词
Figure SMS_7
关联到预设关键词
Figure SMS_11
的数目,
Figure SMS_14
表示词
Figure SMS_5
的出链数目,
Figure SMS_8
表示设定的窗口大小;
在其中一个所述数据主题中词
Figure SMS_16
的权重为:
Figure SMS_17
其中,
Figure SMS_26
表示词
Figure SMS_20
的权重,
Figure SMS_30
表示词
Figure SMS_22
的权重,
Figure SMS_31
表示 词
Figure SMS_23
出现的概率,
Figure SMS_32
表示词
Figure SMS_19
出现的概率,
Figure SMS_29
表示随机设定的概率,
Figure SMS_18
表示设定 的窗口大小,
Figure SMS_27
表示词
Figure SMS_24
的入链数目,
Figure SMS_34
表示词
Figure SMS_21
和词
Figure SMS_28
同时出现的 概率乘积,
Figure SMS_25
表示词
Figure SMS_33
的出链数目;
在所有数据主题中词
Figure SMS_35
的总权重为:
Figure SMS_36
其中,
Figure SMS_37
表示词
Figure SMS_38
的总权重,
Figure SMS_39
表示词
Figure SMS_40
在其中一个数据主 题中的权重,
Figure SMS_41
表示词
Figure SMS_42
在其中一个数据主题中出现的概率。
可选地,还包括:
根据预设筛选信息对预设数据库中的数据进行筛选分别得到筛选列表,并将预设筛选信息与相应的筛选列表进行关联;
获取用户筛选信息,所述用户筛选信息为预设筛选信息中的一种或多种;
根据用户筛选信息,将相应的筛选列表加入筛选结果列表;
将所述筛选结果列表返回至终端用户。
可选地,还包括:
获取数据类型;
若干个所述数据类型分别对应不同的预设数据库;
根据获取的数据类型,将所述分词数组中的每个字段分别与所述数据类型对应的预设数据库的所述关联集合中的每个所述预设关键词进行匹配。
可选地,所述数据类型包括产业数据、专家数据、成果数据、投资机构数据、科技政策数据、报告数据。
可选地,还包括:
获取终端用户权限级别;
根据终端用户权限级别对查询结果列表中部分内容或全部内容进行分级显示/隐藏处理。
第二方面,本申请提供一种科技成果转化数据查询系统,采用如下的技术方案:
一种科技成果转化数据查询系统,包括:
数据获取模块,用于获取查询关键词;
数据处理模块,用于将所述查询关键词进行分词处理,得到包含若干个字段的分词数组;
数据管理模块,用于在预设数据库中提取预设关键词,并将每个所述预设关键词与相应的数据结果列表进行关联,得到关联集合;
所述数据处理模块还用于将所述分词数组中的每个字段分别与所述关联集合中的每个所述预设关键词进行匹配,匹配成功后将与所述预设关键词关联的所述数据结果列表加入查询结果列表;
所述数据处理模块还用于将所述查询结果列表返回至终端用户。
第三方面,本申请提供一种智能终端,采用如下的技术方案:
一种智能终端,包括存储器、处理器,所述存储器中用于存储能够在所述处理器上运行的计算机程序,所述处理器加载计算机程序时,执行上述的方法。
第四方面,本申请提供一种计算机可读存储介质,采用如下的技术方案:
一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器加载时,执行上述的方法。
综上所述,本申请包括以下至少一种有益技术效果:
本申请根据预设数据库中词的权重提取预设关键词,并将关键词与相应地数据结果列表进行关联,便于在终端用户查询时直接与预设关键词进行匹配,以便于快速、准确地输出查询结果;
本申请针对终端用户输入的查询关键词进行分词处理,并将分词数据的每个字段与预设关键词进行匹配,提高了查询结果的完整性和准确性;
本申请通过预设筛选信息,并将筛选信息与相应的筛选列表进行关联,便于终端用户直接根据预设筛选信息进行查询,不仅方便终端用户使用,也有效提高了查询速度;
本申请对数据类型进行分类,将不同的数据类型分别建立对应的预设数据库,便于终端用户快速、准确地得到查询结果。
附图说明
图1是本申请实施例的流程示意图。
具体实施方式
以下结合附图1对本申请作进一步详细说明。
本申请实施例公开一种科技成果转化数据查询方法。
参照图1,一种科技成果转化数据查询方法,包括:
步骤S101:获取查询关键词。
具体地,终端用户通过文本输入或选择框触发指令,进而获取查询关键词str。
步骤S102:将查询关键词str进行分词处理,得到包含若干个字段的分词数组,并输出分词数组resultArr={str1,str2,...,strN}。
步骤S103:在预设数据库中提取预设关键词,并将每个预设关键词与相应的数据结果列表进行关联,得到关联集合,具体包括:
步骤S1031:获取预设数据库中的若干个数据主题。
步骤S1032:将数据主题中的每个词作为节点,词与词共同出现在同一窗口内作为节点与节点之间的链,计算数据主题中每个词出现的概率及权重。
具体地,若词
Figure SMS_43
与词
Figure SMS_44
在同一窗口内,则词
Figure SMS_45
出现的概率为:
Figure SMS_46
其中,
Figure SMS_47
表示词
Figure SMS_48
出现的概率,
Figure SMS_49
表示词
Figure SMS_50
出现的概率,
Figure SMS_51
表示 词
Figure SMS_52
和词
Figure SMS_53
有关联的概率。
由上述计算方式可得,在其中一个数据主题中词
Figure SMS_54
出现的概率为:
Figure SMS_55
其中,
Figure SMS_58
表示词
Figure SMS_63
出现的概率,
Figure SMS_66
表示词
Figure SMS_59
出现的概率,
Figure SMS_62
表示 词
Figure SMS_65
和词
Figure SMS_68
有关联的概率,
Figure SMS_56
表示预设关键词
Figure SMS_61
关联到预设关键词
Figure SMS_64
的数目,
Figure SMS_67
表示词
Figure SMS_57
的出链数目,
Figure SMS_60
表示设定的窗口大小。
词A的权重计算公式为:
Figure SMS_69
其中,
Figure SMS_76
表示词
Figure SMS_73
的权重,
Figure SMS_83
表示词
Figure SMS_78
的权重,
Figure SMS_82
表示 词
Figure SMS_72
出现的概率,
Figure SMS_80
表示词
Figure SMS_71
出现的概率,
Figure SMS_79
表示随机设定的概率,
Figure SMS_70
表示设定 的窗口大小,
Figure SMS_81
表示词
Figure SMS_75
的入链数目,
Figure SMS_86
表示词
Figure SMS_74
和词
Figure SMS_84
同时出现的 概率乘积,
Figure SMS_77
表示词
Figure SMS_85
的出链数目。
对于词
Figure SMS_87
,根据训练得到词
Figure SMS_88
在每个数据主题中的分布,且可把概率值根据跳转 概率得到,则在其中一个数据主题中词
Figure SMS_89
的权重为:
Figure SMS_90
其中,
Figure SMS_99
表示词
Figure SMS_98
的权重,
Figure SMS_105
表示词
Figure SMS_95
的权重,
Figure SMS_102
表示 词
Figure SMS_94
出现的概率,
Figure SMS_100
表示词
Figure SMS_91
出现的概率,
Figure SMS_101
表示随机设定的概率,
Figure SMS_92
表示设定 的窗口大小,
Figure SMS_106
表示词
Figure SMS_97
的入链数目,
Figure SMS_103
表示词
Figure SMS_93
和词
Figure SMS_104
同时出现的 概率乘积,
Figure SMS_96
表示词
Figure SMS_107
的出链数目。
步骤S1033:计算每个词在所有数据主题中的总权重,并根据每个词的总权重高低排序靠前的一部分提取预设关键词。
具体地,在所有数据主题中词
Figure SMS_108
的总权重为:
Figure SMS_109
其中,
Figure SMS_110
表示词
Figure SMS_111
的总权重,
Figure SMS_112
表示词
Figure SMS_113
在其中一个数据主 题中的权重,
Figure SMS_114
表示词
Figure SMS_115
在其中一个数据主题中出现的概率。
在本实施例中,根据每个词的总权重高低排序,取总权重排序处于前1000的词进行提取关键词。
进一步地,将关键词与相应数据进行关联,关键词为key,相应数据列表为value,得到关联集合key-value。
其中,系统用户能够对预设数据库中的数据进行新增、删除、编辑、查询等操作,以保证数据是最新的、正确的、有效的信息。
步骤S104:将分词数组中的每个字段分别与关联集合中的每个预设关键词进行匹配,匹配成功后将与预设关键词关联的数据结果列表加入查询结果列表,具体包括:
步骤S1041:循环分词数组resultArr={str1,str2,...,strN},读取分词数组中第一个值str1。
步骤S1042:循环关联集合key-value。
步骤S1043:将str1与循环关联集合key-value中的每一个关键词key进行匹配,若匹配,则将该关键词key相应的数据列表为value加入查询结果列表resultList,结束本次循环。
步骤S1044:读取分词数组中下一个值,并再次执行步骤步骤S1043,直至读取分词数组中最后一个值strN后结束。
步骤S105:将查询结果列表resultList返回至终端用户。
其中,还包括获取终端用户权限级别,并根据终端用户权限级别对查询结果列表中部分内容或全部内容进行分级显示/隐藏处理。
在本申请的另一实施例中,步骤S101中还包括获取数据类型,若干个数据类型分别对应不同的预设数据库。
具体地,在本实施例中,数据类型包括产业数据、专家数据、成果数据、投资机构数据、科技政策数据、报告数据。其中,产业数据对应的预设数据库为产业数据库,专家数据对应的预设数据库为专家数据库,成果数据对应的预设数据库为成果数据库,投资机构数据对应的预设数据库为投资机构数据库,科技政策数据对应的预设数据库为科技政策数据库,报告数据对应的预设数据库为报告数据库。
相应地,步骤S103中对每种类型的预设数据库分别提取预设关键词,并将每个预设关键词与相应的数据结果列表进行关联,得到关联集合。
步骤S104中将分词数组中的每个字段分别与获取的数据类型对应的预设数据库形成的关联集合中的每个预设关键词进行匹配,匹配成功后将与预设关键词关联的数据结果列表加入查询结果列表。
通过上述查询方法,能够对预设数据库中的数据进行分析,根据数据中词的权重得到预设关键词,便于在终端用户查询时直接与预设关键词进行匹配,以便于快速、准确地输出查询结果。
除了上述能够根据预设数据库得到预设关键词的方式,本申请还能够直接预设筛选信息,进一步便于终端用户进行查询。
具体地,在本申请的另一实施例中,一种科技成果转化数据查询方法还包括:
根据预设筛选信息对预设数据库中的数据进行筛选分别得到筛选列表,并将预设筛选信息与相应的筛选列表进行关联;
获取用户筛选信息,用户筛选信息为预设筛选信息中的一种或多种;
根据用户筛选信息,将相应的筛选列表加入筛选结果列表;
将筛选结果列表返回至终端用户。
在本实施例中,产业数据库的预设筛选信息包括产业名称、地区、融资阶段和所属行业;专家数据库的预设筛选信息包括专家名称和所属地区;成果数据库的预设筛选信息包括成果名称、所属地区和所属行业;投资机构数据库的预设筛选信息包括投资机构名称;科技政策数据库的预设筛选信息包括政策名称、政策类型和省份;报告数据库的预设筛选信息包括报告名称、行业领域和报告年份。
本实施例还公开一种科技成果转化数据查询系统。
一种科技成果转化数据查询系统,包括:
终端用户模块,用于管理终端用户的数据。
其中,每个终端用户均拥有唯一账号,终端用户数据还包括姓名、手机号、单位、职位、所在地、用户权限级别。
系统用户模块,用于管理查询系统。
其中,每个系统用户均拥有唯一账号,系统用户能够对系统管理的数据进行新增、删除、编辑、查询等操作。
数据获取模块,用于获取查询关键词。
具体地,终端用户通过文本输入或选择框触发指令,进而获取查询关键词str。
数据处理模块,将查询关键词str进行分词处理,得到包含若干个字段的分词数组,并输出分词数组resultArr={str1,str2,...,strN}。
数据管理模块,用于在预设数据库中提取预设关键词,并将每个预设关键词与相应的数据结果列表进行关联,得到关联集合,具体包括:
在预设数据库中提取预设关键词,并将每个预设关键词与相应的数据结果列表进行关联,得到关联集合,具体包括:
获取预设数据库中的若干个数据主题;
将数据主题中的每个词作为节点,词与词共同出现在同一窗口内作为节点与节点之间的链,计算数据主题中每个词出现的概率及权重。
具体地,若词
Figure SMS_116
与词
Figure SMS_117
在同一窗口内,则词
Figure SMS_118
出现的概率为:
Figure SMS_119
其中,
Figure SMS_120
表示词
Figure SMS_121
出现的概率,
Figure SMS_122
表示词
Figure SMS_123
出现的概率,
Figure SMS_124
表示 词
Figure SMS_125
和词
Figure SMS_126
有关联的概率。
由上述计算方式可得,在其中一个数据主题中词
Figure SMS_127
出现的概率为:
Figure SMS_128
其中,
Figure SMS_131
表示词
Figure SMS_134
出现的概率,
Figure SMS_139
表示词
Figure SMS_132
出现的概率,
Figure SMS_135
表示 词
Figure SMS_138
和词
Figure SMS_141
有关联的概率,
Figure SMS_129
表示预设关键词
Figure SMS_133
关联到预设关键词
Figure SMS_137
的数目,
Figure SMS_140
表示词
Figure SMS_130
的出链数目,
Figure SMS_136
表示设定的窗口大小。
词A的权重计算公式为:
Figure SMS_142
其中,
Figure SMS_145
表示词
Figure SMS_146
的权重,
Figure SMS_153
表示词
Figure SMS_147
的权重,
Figure SMS_155
表示 词
Figure SMS_151
出现的概率,
Figure SMS_158
表示词
Figure SMS_144
出现的概率,
Figure SMS_154
表示随机设定的概率,
Figure SMS_143
表示设定 的窗口大小,
Figure SMS_152
表示词
Figure SMS_150
的入链数目,
Figure SMS_159
表示词
Figure SMS_148
和词
Figure SMS_156
同时出现的 概率乘积,
Figure SMS_149
表示词
Figure SMS_157
的出链数目。
对于词
Figure SMS_160
,根据训练得到词
Figure SMS_161
在每个数据主题中的分布,且可把概率值根据跳转 概率得到,则在其中一个数据主题中词
Figure SMS_162
的权重为:
Figure SMS_163
其中,
Figure SMS_167
表示词
Figure SMS_170
的权重,
Figure SMS_174
表示词
Figure SMS_172
的权重,
Figure SMS_175
表示 词
Figure SMS_171
出现的概率,
Figure SMS_178
表示词
Figure SMS_165
出现的概率,
Figure SMS_173
表示随机设定的概率,
Figure SMS_164
表示设定 的窗口大小,
Figure SMS_179
表示词的入链数目,
Figure SMS_177
表示词
Figure SMS_166
和词
Figure SMS_176
同时出现的 概率乘积,
Figure SMS_169
表示词
Figure SMS_180
的出链数目。
计算每个词在所有数据主题中的总权重,并根据每个词的总权重高低排序靠前的一部分提取预设关键词。
具体地,在所有数据主题中词
Figure SMS_181
的总权重为:
Figure SMS_182
其中,
Figure SMS_183
表示词
Figure SMS_184
的总权重,
Figure SMS_185
表示词
Figure SMS_186
在其中一个数据主 题中的权重,
Figure SMS_187
表示词
Figure SMS_188
在其中一个数据主题中出现的概率。
在本实施例中,根据每个词的总权重高低排序,取总权重排序处于前1000的词进行提取关键词。
进一步地,将关键词与相应数据进行关联,关键词为key,相应数据列表为value,得到关联集合key-value。
数据处理模块还用于将分词数组中的每个字段分别与关联集合中的每个预设关键词进行匹配,匹配成功后将与预设关键词关联的数据结果列表加入查询结果列表,具体包括:
循环分词数组resultArr={str1,str2,...,strN},读取分词数组中第一个值str1;
循环关联集合key-value;
将str1与循环关联集合key-value中的每一个关键词key进行匹配,若匹配,则将该关键词key相应的数据列表为value加入查询结果列表resultList,结束本次循环;
读取分词数组中下一个值,并再次执行步骤步骤S1043,直至读取分词数组中最后一个值strN后结束。
数据处理模块还用于将查询结果列表返回至终端用户。
权限管理模块,用于获取终端用户权限级别,并根据终端用户权限级别对查询结果列表中部分内容或全部内容进行分级显示/隐藏处理。
在本申请的另一实施例中,数据获取模块还用于获取数据类型,若干个数据类型分别对应不同的预设数据库。
具体地,在本实施例中,数据类型包括产业数据、专家数据、成果数据、投资机构数据、科技政策数据、报告数据。其中,产业数据对应的预设数据库为产业数据库,专家数据对应的预设数据库为专家数据库,成果数据对应的预设数据库为成果数据库,投资机构数据对应的预设数据库为投资机构数据库,科技政策数据对应的预设数据库为科技政策数据库,报告数据对应的预设数据库为报告数据库。
系统用户能够对上述预设数据库进行新增、删除、编辑、查询等操作。
相应地,数据管理模块还用于对每种类型的预设数据库分别提取预设关键词,并将每个预设关键词与相应的数据结果列表进行关联,得到关联集合。
数据处理模块还用于将分词数组中的每个字段分别与获取的数据类型对应的预设数据库形成的关联集合中的每个预设关键词进行匹配,匹配成功后将与预设关键词关联的数据结果列表加入查询结果列表。
在本申请的另一实施例中,数据管理模块还用于根据预设筛选信息对预设数据库中的数据进行筛选分别得到筛选列表,并将预设筛选信息与相应的筛选列表进行关联;
相应地,数据获取模块还用于获取用户筛选信息,用户筛选信息为预设筛选信息中的一种或多种;
数据处理模块还用于根据用户筛选信息,将相应的筛选列表加入筛选结果列表,并将筛选结果列表返回至终端用户。
在本实施例中,产业数据库的预设筛选信息包括产业名称、地区、融资阶段和所属行业;专家数据库的预设筛选信息包括专家名称和所属地区;成果数据库的预设筛选信息包括成果名称、所属地区和所属行业;投资机构数据库的预设筛选信息包括投资机构名称;科技政策数据库的预设筛选信息包括政策名称、政策类型和省份;报告数据库的预设筛选信息包括报告名称、行业领域和报告年份。
本实施例还公开一种智能终端,包括存储器、处理器,存储器中用于存储能够在处理器上运行的计算机程序,处理器加载计算机程序时,执行上述的方法。
本实施例还公开一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序被处理器加载时,执行上述的方法。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,除非另有说明,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
最后应说明的是,上述技术方案只是本发明的一种实施方式,对于本领域内的技术人员而言,在本发明公开了应用方法和原理的基础上,很容易做出各种类型的改进或变形,而不仅限于本发明上述具体实施方式所描述的方法,因此前面描述的方式只是优选的,而并不具有限制性的意义。

Claims (10)

1.一种科技成果转化数据查询方法,其特征在于,包括:
获取查询关键词;
将所述查询关键词进行分词处理,得到包含若干个字段的分词数组;
在预设数据库中提取预设关键词,并将每个所述预设关键词与相应的数据结果列表进行关联,得到关联集合;
将所述分词数组中的每个字段分别与所述关联集合中的每个所述预设关键词进行匹配,匹配成功后将与所述预设关键词关联的所述数据结果列表加入查询结果列表;
将所述查询结果列表返回至终端用户。
2.根据权利要求1所述的科技成果转化数据查询方法,其特征在于,所述在预设数据库中提取预设关键词,包括:
获取预设数据库中的若干个数据主题;
将所述数据主题中的每个词作为节点,词与词共同出现在同一窗口内作为节点与节点之间的链,计算所述数据主题中每个词出现的概率及权重;
计算每个词在所有数据主题中的总权重,并根据每个词的总权重高低排序靠前的一部分提取预设关键词。
3.根据权利要求2所述的科技成果转化数据查询方法,其特征在于,计算所述数据主题中的每个词出现的概率及权重,以及计算每个词在所有数据主题中的总权重,包括:
在其中一个所述数据主题中词
Figure QLYQS_1
出现的概率为:
Figure QLYQS_2
其中,
Figure QLYQS_6
表示词
Figure QLYQS_10
出现的概率,
Figure QLYQS_13
表示词
Figure QLYQS_5
出现的概率,
Figure QLYQS_8
表示词
Figure QLYQS_12
和词
Figure QLYQS_15
有关联的概率,
Figure QLYQS_3
表示预设关键词
Figure QLYQS_9
关联到预设关键词
Figure QLYQS_11
的数目,
Figure QLYQS_14
表 示词
Figure QLYQS_4
的出链数目,
Figure QLYQS_7
表示设定的窗口大小;
在其中一个所述数据主题中词
Figure QLYQS_16
的权重为:
Figure QLYQS_17
其中,
Figure QLYQS_22
表示词
Figure QLYQS_20
的权重,
Figure QLYQS_28
表示词
Figure QLYQS_23
的权重,
Figure QLYQS_33
表示词
Figure QLYQS_25
出现的概率,
Figure QLYQS_31
表示词
Figure QLYQS_19
出现的概率,
Figure QLYQS_30
表示随机设定的概率,
Figure QLYQS_18
表示设定的窗 口大小,
Figure QLYQS_27
表示词
Figure QLYQS_21
的入链数目,
Figure QLYQS_34
表示词
Figure QLYQS_24
和词
Figure QLYQS_32
同时出现的概率 乘积,
Figure QLYQS_26
表示词
Figure QLYQS_29
的出链数目;
在所有数据主题中词
Figure QLYQS_35
的总权重为:
Figure QLYQS_36
其中,
Figure QLYQS_37
表示词
Figure QLYQS_38
的总权重,
Figure QLYQS_39
表示词
Figure QLYQS_40
在其中一个数据主题中 的权重,
Figure QLYQS_41
表示词
Figure QLYQS_42
在其中一个数据主题中出现的概率。
4.根据权利要求1所述的科技成果转化数据查询方法,其特征在于,还包括:
根据预设筛选信息对预设数据库中的数据进行筛选分别得到筛选列表,并将预设筛选信息与相应的筛选列表进行关联;
获取用户筛选信息,所述用户筛选信息为预设筛选信息中的一种或多种;
根据用户筛选信息,将相应的筛选列表加入筛选结果列表;
将所述筛选结果列表返回至终端用户。
5.根据权利要求1所述的科技成果转化数据查询方法,其特征在于,还包括:
获取数据类型;
若干个所述数据类型分别对应不同的预设数据库;
根据获取的数据类型,将所述分词数组中的每个字段分别与所述数据类型对应的预设数据库的所述关联集合中的每个所述预设关键词进行匹配。
6.根据权利要求5所述的科技成果转化数据查询方法,其特征在于,所述数据类型包括产业数据、专家数据、成果数据、投资机构数据、科技政策数据、报告数据。
7.根据权利要求1所述的科技成果转化数据查询方法,其特征在于,还包括:
获取终端用户权限级别;
根据终端用户权限级别对查询结果列表中部分内容或全部内容进行分级显示/隐藏处理。
8.一种科技成果转化数据查询系统,其特征在于,包括:
数据获取模块,用于获取查询关键词;
数据处理模块,用于将所述查询关键词进行分词处理,得到包含若干个字段的分词数组;
数据管理模块,用于在预设数据库中提取预设关键词,并将每个所述预设关键词与相应的数据结果列表进行关联,得到关联集合;
所述数据处理模块还用于将所述分词数组中的每个字段分别与所述关联集合中的每个所述预设关键词进行匹配,匹配成功后将与所述预设关键词关联的所述数据结果列表加入查询结果列表;
所述数据处理模块还用于将所述查询结果列表返回至终端用户。
9.一种智能终端,包括存储器、处理器,其特征在于,所述存储器中用于存储能够在所述处理器上运行的计算机程序,所述处理器加载计算机程序时,执行权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其特征在于,所述计算机程序被处理器加载时,执行权利要求1-7中任一项所述的方法。
CN202310691816.2A 2023-06-13 2023-06-13 科技成果转化数据查询方法、系统、终端及存储介质 Pending CN116431930A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310691816.2A CN116431930A (zh) 2023-06-13 2023-06-13 科技成果转化数据查询方法、系统、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310691816.2A CN116431930A (zh) 2023-06-13 2023-06-13 科技成果转化数据查询方法、系统、终端及存储介质

Publications (1)

Publication Number Publication Date
CN116431930A true CN116431930A (zh) 2023-07-14

Family

ID=87080063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310691816.2A Pending CN116431930A (zh) 2023-06-13 2023-06-13 科技成果转化数据查询方法、系统、终端及存储介质

Country Status (1)

Country Link
CN (1) CN116431930A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103823799A (zh) * 2012-11-16 2014-05-28 镇江诺尼基智能技术有限公司 新一代行业知识全文检索方法
CN105843795A (zh) * 2016-03-21 2016-08-10 华南理工大学 基于主题模型的文档关键词抽取方法及其系统
CN108845982A (zh) * 2017-12-08 2018-11-20 昆明理工大学 一种基于词的关联特征的中文分词方法
CN110222260A (zh) * 2019-05-21 2019-09-10 深圳壹账通智能科技有限公司 一种搜索方法、装置及存储介质
CN110781669A (zh) * 2019-10-24 2020-02-11 泰康保险集团股份有限公司 文本关键信息提取方法与装置、电子设备、存储介质
CN114186002A (zh) * 2021-12-14 2022-03-15 智博天宫(苏州)人工智能产业研究院有限公司 科技成果数据处理分析方法及系统
CN114780673A (zh) * 2022-03-28 2022-07-22 西安远诺技术转移有限公司 基于领域匹配的科技成果管理方法和科技成果管理平台
CN115964384A (zh) * 2023-01-10 2023-04-14 中国建设银行股份有限公司 一种数据查询方法、装置、电子设备及计算机可读介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103823799A (zh) * 2012-11-16 2014-05-28 镇江诺尼基智能技术有限公司 新一代行业知识全文检索方法
CN105843795A (zh) * 2016-03-21 2016-08-10 华南理工大学 基于主题模型的文档关键词抽取方法及其系统
CN108845982A (zh) * 2017-12-08 2018-11-20 昆明理工大学 一种基于词的关联特征的中文分词方法
CN110222260A (zh) * 2019-05-21 2019-09-10 深圳壹账通智能科技有限公司 一种搜索方法、装置及存储介质
CN110781669A (zh) * 2019-10-24 2020-02-11 泰康保险集团股份有限公司 文本关键信息提取方法与装置、电子设备、存储介质
CN114186002A (zh) * 2021-12-14 2022-03-15 智博天宫(苏州)人工智能产业研究院有限公司 科技成果数据处理分析方法及系统
CN114780673A (zh) * 2022-03-28 2022-07-22 西安远诺技术转移有限公司 基于领域匹配的科技成果管理方法和科技成果管理平台
CN115964384A (zh) * 2023-01-10 2023-04-14 中国建设银行股份有限公司 一种数据查询方法、装置、电子设备及计算机可读介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ROUCHTIME: "几种关键词算法", pages 2 - 10, Retrieved from the Internet <URL:https://blog.csdn.netrouchtimearticledetails78021789ops_request_misc=&request_id=&biz_id=102&utm_term=topical%20textrank%C2%A0%20TPR&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-1-78021789.142^v89^chatsearch, 239^v2^insert_chatgpt&spm=1018.2226.3001.4187> *

Similar Documents

Publication Publication Date Title
CN110457302B (zh) 一种结构化数据智能清洗方法
CN103425687A (zh) 一种基于关键词的检索方法和系统
CN111767796A (zh) 一种视频关联方法、装置、服务器和可读存储介质
CN116415564B (zh) 基于知识图谱的功能点扩增方法和系统
CN110598109A (zh) 一种信息推荐方法、装置、设备及存储介质
CN111159563A (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
Yin et al. Maximum entropy model for mobile text classification in cloud computing using improved information gain algorithm
CN107885875B (zh) 检索词的同义变换方法、装置及服务器
CN111813744A (zh) 文件的搜索方法、装置、设备及存储介质
CN113535817B (zh) 特征宽表生成及业务处理模型的训练方法和装置
CN116383412B (zh) 基于知识图谱的功能点扩增方法和系统
CN115952770B (zh) 一种数据标准化的处理方法、装置、电子设备及存储介质
CN116431930A (zh) 科技成果转化数据查询方法、系统、终端及存储介质
CN116431826A (zh) 知识图谱的更新方法、装置、设备及存储介质
CN111737571B (zh) 搜索方法、装置和电子设备
CN114443634A (zh) 数据质量检核方法、装置、设备及存储介质
KR20220061388A (ko) 키워드-종목 맵핑 정보 서비스 제공 프로그램이 기록된 기록매체
JP2011154576A (ja) 評判分析装置、評判分析方法及び評判分析プログラム
Curado Malta et al. State of the art on methodologies for the development of a metadata application profile
CN113010744A (zh) 一种图数据生成方法、装置、服务器及存储介质
Xia et al. A novel data schema integration framework for the human-centric services in smart city
CN117725192B (zh) 基于langchain的专有工业品信息交互调用方法
CN117708350B (zh) 企业政策的信息关联方法、装置及电子设备
CN112685623B (zh) 一种数据处理方法、装置、电子设备及存储介质
CN117172792A (zh) 客户信息管理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination