CN117494726B - 一种情报关键词提取方法 - Google Patents
一种情报关键词提取方法 Download PDFInfo
- Publication number
- CN117494726B CN117494726B CN202311841515.XA CN202311841515A CN117494726B CN 117494726 B CN117494726 B CN 117494726B CN 202311841515 A CN202311841515 A CN 202311841515A CN 117494726 B CN117494726 B CN 117494726B
- Authority
- CN
- China
- Prior art keywords
- semantic
- keyword
- fitness
- representing
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 20
- 238000000034 method Methods 0.000 claims description 30
- 238000005457 optimization Methods 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 7
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 230000010365 information processing Effects 0.000 abstract description 2
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种情报关键词提取方法,属于关键词提取技术领域,包括以下步骤:S1、获取待处理情报文本,并将待处理情报文本均匀划分为若干个情报文本块;S2、计算各个情报文本块的语义适应度;S3、提取所有情报文本块的关键词,生成关键词序列;S4、利用各个情报文本块的语义适应度,对关键词序列进行更新,确定待处理情报文本的所有关键词。本发明公开了一种情报关键词提取方法,可以对多个情报文本块进行单独的语义分析,得到表征各个情报文本块语义情况的语义适应度,并利用语义适应度对所有情报文本块的关键词进行更新修正,保证提取的关键词准确无误,进而提高情报信息处理能力,大大提高情报查找效率。
Description
技术领域
本发明属于关键词提取技术领域,具体涉及一种情报关键词提取方法。
背景技术
情报工作是一项非常复杂且庞大的工程,特别是情报信息来源丰富,内容结构不一致,数据体量庞大,情报文本的关键词可以帮助用户快速了解情报表述内容。而传统提取关键词的机器算法加人工筛选中需要投入大量人力和机器算力,已无法满足互联网信息爆炸式高速发展所产生的数据资料处理的需求。
发明内容
本发明为了解决以上问题,提出了一种情报关键词提取方法。
本发明的技术方案是:一种情报关键词提取方法包括以下步骤:
S1、获取待处理情报文本,并将待处理情报文本均匀划分为若干个情报文本块;
S2、计算各个情报文本块的语义适应度;
S3、提取所有情报文本块的关键词,生成关键词序列;
S4、利用各个情报文本块的语义适应度,对关键词序列进行更新,确定待处理情报文本的所有关键词。
进一步地,S2包括以下子步骤:
S21、提取情报文本块中各个单词的词频,生成词频集合;
S22、构建语义筛选条件,将词频满足语义筛选条件的单词作为语义单词集合的子集;
S23、提取语义单词集合中各个单词的逆文本频率,生成语义特征矩阵;
S24、对语义特征矩阵进行奇异值分解,将语义特征矩阵的奇异值作为情报文本块的语义适应度。
上述进一步方案的有益效果是:在本发明中,根据情报文本块中各个单词的词频参数和逆文本频率参数来确定一个包含单词特征参数的语义特征矩阵,该语义特征矩阵的奇异值可以作为整个情报文本块的语义适应度,来表征整个情报文本块的单词词频等参数分布情况。
进一步地,S22中,语义筛选条件的表达式为:
;
式中,表示词频集合的最大值,/>表示词频集合的最小值,/>表示情报文本块中第/>个单词的词频,/>表示词频集合中所有词频的标准差,/>表示情报文本块的文本长度。
进一步地,S23中,语义特征矩阵的表达式为:
;
式中,表示语义单词集合中第一个单词在所属情报文本块的逆文本频率,
表示语义单词集合中第二个单词在所属情报文本块的逆文本频率,表示语义单词集合
中第个单词在所属情报文本块的逆文本频率,表示语义单词集合中第个单词在所
属情报文本块的逆文本频率,表示语义单词集合的单词个数,表示转置。
进一步地,S3中,利用TextRank算法提取各个情报文本块的关键词,生成关键词序列。
TextRank算法是一种基于图的排序算法,可以用于关键词提取的文本摘要抽取。
进一步地,S4包括以下子步骤:
S41、从关键词序列中随机选择一个关键词作为第一优化关键词,将关键词序列中词频最大且与第一优化关键词不同的关键词作为第二优化关键词;这里的词频指该关键词在整个待处理情报文本的词频。
S42、判断第一优化关键词和第二优化关键词是否属于同一情报文本块,若是则进入S43,否则进入S44;
S43、将第一优化关键词所属情报文本块的语义适应度作为优化语义适应度,并进入S45;
S44、将第一优化关键词所属情报文本块的语义适应度与第二优化关键词所属情报文本块的语义适应度之间的均值作为优化语义适应度,并进入S45;
S45、根据优化语义适应度以及关键词序列中词频最小的关键词所属情报文本块的语义适应度,确定最佳语义适应度;这里的词频指该关键词在整个待处理情报文本的词频。
S46、判断关键词序列中是否存在词频小于最佳语义适应度的关键词,若是则进入S47,否则不对关键词序列进行更新;这里的词频指该关键词在整个待处理情报文本的词频。
S47、计算词频小于最佳语义适应度的各个关键词在待处理情报文本中的语义置信度;这里的词频指该关键词在整个待处理情报文本的词频。
S48、根据词频小于最佳语义适应度的各个关键词在待处理情报文本中的语义置信度,对关键词集合进行更新。
上述进一步方案的有益效果是:在本发明中,通过随机选择的关键词所属情报文本块以及整个待处理情报文本中词频最大的关键词所属情报文本块来确定一个优化语义适应度,并对优化语义适应度进行修正调整,得到最佳语义适应度,通过最佳语义适应度来判断是否进行关键词更新,保证提取的所有关键词准确且恰当。
进一步地,S45中,最佳语义适应度的计算公式为:
;
式中,表示第一优化关键词所属情报文本块的语义适应度,/>表示第二优化关键词所属情报文本块的语义适应度,/>表示优化语义适应度,/>表示情报文本块的个数,/>表示关键词序列中词频最小的关键词所属情报文本块的语义适应度,/>表示所有情报文本块的最小语义适应度,/>表示指数函数,/>表示最大值函数。
进一步地,S47中,词频小于最佳语义适应度的关键词在待处理情报文本中的语义置信度的计算公式为:
;
式中,表示待处理情报文本的文本长度,/>表示情报文本块的个数,/>表示第个情报文本块的语义适应度,/>表示关键词在待处理文本中的词频。
进一步地,S48中,对关键词集合进行更新的具体方法为:将语义置信度小于0.5的关键词从关键词集合中剔除,完成更新。
本发明的有益效果是:本发明公开了一种情报关键词提取方法,可以对多个情报文本块进行单独的语义分析,得到表征各个情报文本块语义情况的语义适应度,并利用语义适应度对所有情报文本块的关键词进行更新修正,保证提取的关键词准确无误,进而提高情报信息处理能力,大大提高情报查找效率。
附图说明
图1为情报关键词提取方法的流程图。
具体实施方式
下面结合附图对本发明的实施例作进一步的说明。
如图1所示,本发明提供了一种情报关键词提取方法,包括以下步骤:
S1、获取待处理情报文本,并将待处理情报文本均匀划分为若干个情报文本块;
S2、计算各个情报文本块的语义适应度;
S3、提取所有情报文本块的关键词,生成关键词序列;
S4、利用各个情报文本块的语义适应度,对关键词序列进行更新,确定待处理情报文本的所有关键词。
在本发明实施例中,S2包括以下子步骤:
S21、提取情报文本块中各个单词的词频,生成词频集合;
S22、构建语义筛选条件,将词频满足语义筛选条件的单词作为语义单词集合的子集;
S23、提取语义单词集合中各个单词的逆文本频率,生成语义特征矩阵;
S24、对语义特征矩阵进行奇异值分解,将语义特征矩阵的奇异值作为情报文本块的语义适应度。
在本发明中,根据情报文本块中各个单词的词频参数和逆文本频率参数来确定一个包含单词特征参数的语义特征矩阵,该语义特征矩阵的奇异值可以作为整个情报文本块的语义适应度,来表征整个情报文本块的单词词频等参数分布情况。
在本发明实施例中,S22中,语义筛选条件的表达式为:
;
式中,表示词频集合的最大值,/>表示词频集合的最小值,/>表示情报文本块中第/>个单词的词频,/>表示词频集合中所有词频的标准差,/>表示情报文本块的文本长度。
在本发明实施例中,S23中,语义特征矩阵的表达式为:
;
式中,表示语义单词集合中第一个单词在所属情报文本块的逆文本频率,
表示语义单词集合中第二个单词在所属情报文本块的逆文本频率,表示语义单词集合
中第个单词在所属情报文本块的逆文本频率,表示语义单词集合中第个单词在所
属情报文本块的逆文本频率,表示语义单词集合的单词个数,表示转置。
在本发明实施例中,S3中,利用TextRank算法提取各个情报文本块的关键词,生成关键词序列。
TextRank算法是一种基于图的排序算法,可以用于关键词提取的文本摘要抽取。
在本发明实施例中,S4包括以下子步骤:
S41、从关键词序列中随机选择一个关键词作为第一优化关键词,将关键词序列中词频最大且与第一优化关键词不同的关键词作为第二优化关键词;这里的词频指该关键词在整个待处理情报文本的词频。
S42、判断第一优化关键词和第二优化关键词是否属于同一情报文本块,若是则进入S43,否则进入S44;
S43、将第一优化关键词所属情报文本块的语义适应度作为优化语义适应度,并进入S45;
S44、将第一优化关键词所属情报文本块的语义适应度与第二优化关键词所属情报文本块的语义适应度之间的均值作为优化语义适应度,并进入S45;
S45、根据优化语义适应度以及关键词序列中词频最小的关键词所属情报文本块的语义适应度,确定最佳语义适应度;这里的词频指该关键词在整个待处理情报文本的词频。
S46、判断关键词序列中是否存在词频小于最佳语义适应度的关键词,若是则进入S47,否则不对关键词序列进行更新;这里的词频指该关键词在整个待处理情报文本的词频。
S47、计算词频小于最佳语义适应度的各个关键词在待处理情报文本中的语义置信度;这里的词频指该关键词在整个待处理情报文本的词频。
S48、根据词频小于最佳语义适应度的各个关键词在待处理情报文本中的语义置信度,对关键词集合进行更新。
在本发明中,通过随机选择的关键词所属情报文本块以及整个待处理情报文本中词频最大的关键词所属情报文本块来确定一个优化语义适应度,并对优化语义适应度进行修正调整,得到最佳语义适应度,通过最佳语义适应度来判断是否进行关键词更新,保证提取的所有关键词准确且恰当。
在本发明实施例中,S45中,最佳语义适应度的计算公式为:
;
式中,表示第一优化关键词所属情报文本块的语义适应度,/>表示第二优化关键词所属情报文本块的语义适应度,/>表示优化语义适应度,/>表示情报文本块的个数,/>表示关键词序列中词频最小的关键词所属情报文本块的语义适应度,/>表示所有情报文本块的最小语义适应度,/>表示指数函数,/>表示最大值函数。
在本发明实施例中,S47中,词频小于最佳语义适应度的关键词在待处理情报文本中的语义置信度的计算公式为:
;
式中,表示待处理情报文本的文本长度,/>表示情报文本块的个数,/>表示第个情报文本块的语义适应度,/>表示关键词在待处理文本中的词频。
在本发明实施例中,S48中,对关键词集合进行更新的具体方法为:将语义置信度小于0.5的关键词从关键词集合中剔除,完成更新。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (7)
1.一种情报关键词提取方法,其特征在于,包括以下步骤:
S1、获取待处理情报文本,并将待处理情报文本均匀划分为若干个情报文本块;
S2、计算各个情报文本块的语义适应度;
S3、提取所有情报文本块的关键词,生成关键词序列;
S4、利用各个情报文本块的语义适应度,对关键词序列进行更新,确定待处理情报文本的所有关键词;
所述S2包括以下子步骤:
S21、提取情报文本块中各个单词的词频,生成词频集合;
S22、构建语义筛选条件,将词频满足语义筛选条件的单词作为语义单词集合的子集;
S23、提取语义单词集合中各个单词的逆文本频率,生成语义特征矩阵;
S24、对语义特征矩阵进行奇异值分解,将语义特征矩阵的奇异值作为情报文本块的语义适应度;
所述S4包括以下子步骤:
S41、从关键词序列中随机选择一个关键词作为第一优化关键词,将关键词序列中词频最大且与第一优化关键词不同的关键词作为第二优化关键词;
S42、判断第一优化关键词和第二优化关键词是否属于同一情报文本块,若是则进入S43,否则进入S44;
S43、将第一优化关键词所属情报文本块的语义适应度作为优化语义适应度,并进入S45;
S44、将第一优化关键词所属情报文本块的语义适应度与第二优化关键词所属情报文本块的语义适应度之间的均值作为优化语义适应度,并进入S45;
S45、根据优化语义适应度以及关键词序列中词频最小的关键词所属情报文本块的语义适应度,确定最佳语义适应度;
S46、判断关键词序列中是否存在词频小于最佳语义适应度的关键词,若是则进入S47,否则不对关键词序列进行更新;
S47、计算词频小于最佳语义适应度的各个关键词在待处理情报文本中的语义置信度;
S48、根据词频小于最佳语义适应度的各个关键词在待处理情报文本中的语义置信度,对关键词集合进行更新。
2.根据权利要求1所述的情报关键词提取方法,其特征在于,所述S22中,语义筛选条件的表达式为:
;
式中,表示词频集合的最大值,/>表示词频集合的最小值,/>表示情报文本块中第/>个单词的词频,/>表示词频集合中所有词频的标准差,/>表示情报文本块的文本长度。
3.根据权利要求1所述的情报关键词提取方法,其特征在于,所述S23中,语义特征矩阵的表达式为:
;
式中,表示语义单词集合中第一个单词在所属情报文本块的逆文本频率,/>表示语义单词集合中第二个单词在所属情报文本块的逆文本频率,/>表示语义单词集合中第个单词在所属情报文本块的逆文本频率,/>表示语义单词集合中第/>个单词在所属情报文本块的逆文本频率,/>表示语义单词集合的单词个数,/>表示转置。
4.根据权利要求1所述的情报关键词提取方法,其特征在于,所述S3中,利用TextRank算法提取各个情报文本块的关键词,生成关键词序列。
5.根据权利要求1所述的情报关键词提取方法,其特征在于,所述S45中,最佳语义适应度的计算公式为:
;
式中,表示第一优化关键词所属情报文本块的语义适应度,/>表示第二优化关键词所属情报文本块的语义适应度,/>表示优化语义适应度,/>表示情报文本块的个数,/>表示关键词序列中词频最小的关键词所属情报文本块的语义适应度,/>表示所有情报文本块的最小语义适应度,/>表示指数函数,/>表示最大值函数。
6.根据权利要求1所述的情报关键词提取方法,其特征在于,所述S47中,词频小于最佳语义适应度的关键词在待处理情报文本中的语义置信度的计算公式为:
;
式中,表示待处理情报文本的文本长度,/>表示情报文本块的个数,/>表示第/>个情报文本块的语义适应度,/>表示关键词在待处理文本中的词频。
7.根据权利要求1所述的情报关键词提取方法,其特征在于,所述S48中,对关键词集合进行更新的具体方法为:将语义置信度小于0.5的关键词从关键词集合中剔除,完成更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311841515.XA CN117494726B (zh) | 2023-12-29 | 2023-12-29 | 一种情报关键词提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311841515.XA CN117494726B (zh) | 2023-12-29 | 2023-12-29 | 一种情报关键词提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117494726A CN117494726A (zh) | 2024-02-02 |
CN117494726B true CN117494726B (zh) | 2024-04-12 |
Family
ID=89678616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311841515.XA Active CN117494726B (zh) | 2023-12-29 | 2023-12-29 | 一种情报关键词提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117494726B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103870523A (zh) * | 2005-12-22 | 2014-06-18 | 清晰传媒广告有限公司 | 通过分析内容确定上下文并且基于该上下文提供相关内容 |
CN106776562A (zh) * | 2016-12-20 | 2017-05-31 | 上海智臻智能网络科技股份有限公司 | 一种关键词提取方法和提取系统 |
CN106776530A (zh) * | 2015-11-23 | 2017-05-31 | 北京国双科技有限公司 | 主题词抽取方法及装置 |
CN108038099A (zh) * | 2017-11-29 | 2018-05-15 | 贵州大学 | 基于词聚类的低频关键词识别方法 |
CN108460039A (zh) * | 2017-02-20 | 2018-08-28 | 微软技术许可有限责任公司 | 提供推荐内容 |
CN108563735A (zh) * | 2018-04-10 | 2018-09-21 | 国网浙江省电力有限公司 | 一种基于词语关联的数据分割搜索方法 |
CN109543017A (zh) * | 2018-11-21 | 2019-03-29 | 广州语义科技有限公司 | 法律问题关键词生成方法及其系统 |
CN110188344A (zh) * | 2019-04-23 | 2019-08-30 | 浙江工业大学 | 一种多特征融合的关键词提取方法 |
CN111767713A (zh) * | 2020-05-09 | 2020-10-13 | 北京奇艺世纪科技有限公司 | 关键词的提取方法、装置、电子设备及存储介质 |
CN115577080A (zh) * | 2022-09-08 | 2023-01-06 | 深圳市雁联计算系统有限公司 | 一种问题回复匹配方法、系统、服务器及存储介质 |
CN117195890A (zh) * | 2023-11-07 | 2023-12-08 | 成都航空职业技术学院 | 一种基于机器学习的文本推荐方法 |
-
2023
- 2023-12-29 CN CN202311841515.XA patent/CN117494726B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103870523A (zh) * | 2005-12-22 | 2014-06-18 | 清晰传媒广告有限公司 | 通过分析内容确定上下文并且基于该上下文提供相关内容 |
CN106776530A (zh) * | 2015-11-23 | 2017-05-31 | 北京国双科技有限公司 | 主题词抽取方法及装置 |
CN106776562A (zh) * | 2016-12-20 | 2017-05-31 | 上海智臻智能网络科技股份有限公司 | 一种关键词提取方法和提取系统 |
CN108460039A (zh) * | 2017-02-20 | 2018-08-28 | 微软技术许可有限责任公司 | 提供推荐内容 |
CN108038099A (zh) * | 2017-11-29 | 2018-05-15 | 贵州大学 | 基于词聚类的低频关键词识别方法 |
CN108563735A (zh) * | 2018-04-10 | 2018-09-21 | 国网浙江省电力有限公司 | 一种基于词语关联的数据分割搜索方法 |
CN109543017A (zh) * | 2018-11-21 | 2019-03-29 | 广州语义科技有限公司 | 法律问题关键词生成方法及其系统 |
CN110188344A (zh) * | 2019-04-23 | 2019-08-30 | 浙江工业大学 | 一种多特征融合的关键词提取方法 |
CN111767713A (zh) * | 2020-05-09 | 2020-10-13 | 北京奇艺世纪科技有限公司 | 关键词的提取方法、装置、电子设备及存储介质 |
CN115577080A (zh) * | 2022-09-08 | 2023-01-06 | 深圳市雁联计算系统有限公司 | 一种问题回复匹配方法、系统、服务器及存储介质 |
CN117195890A (zh) * | 2023-11-07 | 2023-12-08 | 成都航空职业技术学院 | 一种基于机器学习的文本推荐方法 |
Non-Patent Citations (4)
Title |
---|
Li Juanzi 等.Keyword extraction based on tf-idf for Chinese new document.《Wuhan University Journal of Natural Sciences》.2007,第12卷917-921. * |
Semantic Based Text Block Segmentation Using WordNet;Nyein Myint Myint Aung 等;《International Journal of Computer and COmmunication ENgneering》;20131001;第2卷(第5期);601-604 * |
卞真旭.一种关键词抽取方法研究.《安徽电气工程职业技术学院学报》.2011,第16卷149-153. * |
张博.基于领域知识库的简历信息抽取系统的设计与实现.《中国优秀硕士学位论文全文数据库》.2018,I138-939. * |
Also Published As
Publication number | Publication date |
---|---|
CN117494726A (zh) | 2024-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107193801B (zh) | 一种基于深度信念网络的短文本特征优化及情感分析方法 | |
CN104008166B (zh) | 一种基于形态和语义相似度的对话短文本聚类方法 | |
CN104199965B (zh) | 一种语义信息检索方法 | |
CN108595696A (zh) | 一种基于云平台的人机交互智能问答方法和系统 | |
CN112069310B (zh) | 基于主动学习策略的文本分类方法及系统 | |
CN109522011B (zh) | 一种基于编程现场上下文深度感知的代码行推荐方法 | |
CN112380319B (zh) | 一种模型训练的方法及相关装置 | |
CN111538989B (zh) | 基于图卷积网络和主题模型的恶意代码同源性分析方法 | |
CN109597901B (zh) | 一种基于生物数据的数据分析方法 | |
CN117494726B (zh) | 一种情报关键词提取方法 | |
CN112417296B (zh) | 一种互联网关键数据信息采集提取方法 | |
CN116432125B (zh) | 基于哈希算法的代码分类方法 | |
CN112487110A (zh) | 基于网络结构和节点内容的重叠社区演化分析方法及系统 | |
CN106407332B (zh) | 基于人工智能的搜索方法和装置 | |
CN108664548B (zh) | 一种退化条件下的网络访问行为特征群体动态挖掘方法及系统 | |
CN114169100A (zh) | 一种超大变量叶轮机械高效设计优化方法及系统及应用 | |
CN114969511A (zh) | 基于分片的内容推荐方法、设备及介质 | |
CN114547286A (zh) | 一种信息搜索方法、装置及电子设备 | |
Butka et al. | A proposal of the information retrieval system based on the generalized one-sided concept lattices | |
CN112464648A (zh) | 基于多源数据分析的行业标准空白特征识别系统及方法 | |
CN112231442A (zh) | 一种敏感词过滤方法及装置 | |
CN116431776B (zh) | 一种面向中文资料的关键词检索方法 | |
CN114036946B (zh) | 一种文本特征提取及辅助检索的系统及方法 | |
CN116150379B (zh) | 短信文本分类方法、装置、电子设备及存储介质 | |
CN117131427B (zh) | 一种基于多元nlp的社交平台账号数据关联性分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |