CN111190994B - 一种为提案委员会推荐提案承办单位的方法 - Google Patents

一种为提案委员会推荐提案承办单位的方法 Download PDF

Info

Publication number
CN111190994B
CN111190994B CN201911396262.3A CN201911396262A CN111190994B CN 111190994 B CN111190994 B CN 111190994B CN 201911396262 A CN201911396262 A CN 201911396262A CN 111190994 B CN111190994 B CN 111190994B
Authority
CN
China
Prior art keywords
proposal
undertaking
word segmentation
unit
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911396262.3A
Other languages
English (en)
Other versions
CN111190994A (zh
Inventor
许建兵
李军
许凯
周沛
陶飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Suncn Pap Information Technology Co ltd
Original Assignee
Anhui Suncn Pap Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Suncn Pap Information Technology Co ltd filed Critical Anhui Suncn Pap Information Technology Co ltd
Priority to CN201911396262.3A priority Critical patent/CN111190994B/zh
Publication of CN111190994A publication Critical patent/CN111190994A/zh
Application granted granted Critical
Publication of CN111190994B publication Critical patent/CN111190994B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种为提案委员会推荐提案承办单位的方法,包括:根据提案内容构建提案内容属性索引;根据多个承办单位的历年办理提案和承办单位标签,分别构建多个承办单位属性索引;计算所述提案内容属性索引和多个所述承办单位属性索引之间的相关性;根据所述相关性的高低推荐所述承办单位。通过本发明,能快速对大量的推荐单位进行分析,从而大幅度减少在承办单位选择时耗费的人力物力。使提案委员会可以按推荐的顺序对承办单位进行筛选,节省了提案委员会的提案分配工作时间,从而大大提高了提案委员会的工作效率。

Description

一种为提案委员会推荐提案承办单位的方法
技术领域
本发明属于政协办公技术领域,特别涉及一种为提案委员会推荐提案承办单位的方法。
背景技术
随着科学技术发展,国内外的自然语言理解技术已经得到了前所未有的突破,并且已经独立成长为一门相对独立的学科。为了响应政府对于政务系统信息化的号召,并且同时为了解决现有提案委员会在审核提案,选择提案承办单位工作中所面临的切实问题,结合自然语言理解等前沿技术,提出了一种面向提案委员会根据提案内容自动推荐承办单位的方法。
发明内容
针对上述问题,本发明提出了一种为提案委员会推荐提案承办单位的方法,包括:
根据提案内容构建提案内容属性索引;
根据多个承办单位的历年办理提案和承办单位标签,分别构建多个承办单位属性索引;
计算所述提案内容属性索引和多个所述承办单位属性索引之间的相关性;
根据所述相关性的高低推荐所述承办单位。
优选的,所述根据提案内容构建提案内容属性索引包括:
通过分词算法对所述提案内容进行分词处理;
对所述分词处理后的提案内容进行权重计算;
根据所述权重计算的结果构建所述提案内容属性索引。
优选的,所述根据多个承办单位的历年办理提案和承办单位标签,分别构建多个承办单位属性索引包括:
通过分词算法分别对多个所述承办单位的历年办理提案进行分词处理;
分别提取多个所述承办单位的标签信息;
将每个所述承办单位的分词处理结果和标签信息合并,进行权重计算;
根据所述权重计算结果分别构建每个所述承办单位的承办单位属性索引。
优选的,所述分词算法采用jieba分词工具。
优选的,所述权重计算的算法包括TF-IDF权重计算算法。
优选的,所述相关性计算的算法包括余弦相似度算法或皮尔逊算法。
优选的,所述通过分词算法对所述提案内容进行分词处理包括:
通过分词算法对所述提案内容进行中文分词和去停用词处理,提取所述提案内容的关键词;
所述通过分词算法分别对多个所述承办单位的历年办理提案进行分词处理包括:
通过分词算法分别对每个所述承办单位的历年承办提案内容进行中文分词和去停用词处理,提取每个所述承办单位历年办理提案的关键词。
优选的,所述对分词处理后的提案内容进行权重计算包括:
计算所述提案内容中每个关键词的频率;
所述将每个所述承办单位的分词处理结果和标签信息合并,进行权重计算包括:
计算每个所述承办单位历年办理提案的关键词的频率。
优选的,所述根据权重计算结果构建提案内容属性索引包括:
根据所述提案内容中每个关键词的频率构建所述提案内容的特征向量;
根据权重计算结果构建承办单位属性索引包括:
根据每个所述承办单位历年办理提案中关键词的频率,分别构建每个所述承办单位的特征向量。
优选的,所述计算提案内容属性索引和多个承办单位属性索引之间的相关性包括:
计算所述提案内容的特征向量和每个所述承办单位的特征向量之间的相关性。
本发明的有益效果在于通过本发明,能快速对大量的推荐单位进行分析,从而大幅度减少在承办单位选择时耗费的人力物力。使提案委员会可以按推荐的顺序对承办单位进行筛选,节省了提案委员会的提案分配工作时间,从而大大提高了提案委员会的工作效率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明的原理框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种为提案委员会推荐提案承办单位的方法,通过对提案委员会的提案以及提案承办单位历年提案内容进行比较分析,为提案委员会推荐承办单位。
图1示出了一种为提案委员会推荐提案承办单位的方法的流程框图,如图1所示,一种为提案委员会推荐提案承办单位的方法包括,对提案委员会的提案的内容进行分词处理,得到分词处理后的提案信息。并根据分词处理后的提案信息建立提案的内容属性索引。以及对承办单位历年承办提案进行内容分析,结合承办单位标签建立承办单位内容属性索引。通过进行提案委员会内容属性索引和承办单位的内容属性索引进行相关性计算,即可按照相关性的高低对承办单位进行排序,从而得到推荐的承办单位。
其中,分词是将连续的字序列按照一定的规范重新组合成词序列的过程。目前国内实现分词操作的工具类型众多,其中python常用的分词包有jieba分词、SnowNLP、THULAC、NLPIR等。本发明中可以采用以上任意一种分词工具对提案委员会的提案内容进行分词处理,从而获取提案内容的词序列。对于提案内容和承办单位信息的分词处理包括中文分词和去停词处理,将其中的意义不大的词例如不常用词、副词、助词等去掉,例如“的”“得”“地”等,剩下的即为提取到的关键词。具体地,该步骤可通过jieba分词进行处理完成。
以jieba分词工具为例进行示例性说明,jieba分词包括三种模式:精确模式:试图将句子最精确地切分,适合文本分析。
全模式:将句子中所有可以成词的词语扫描出,速度快,但是不能解决歧义。
搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
jieba分词过程中主要涉及如下几种算法:
(1)基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG);
(2)采用了动态规划查找最大概率路径,找出基于词频的最大切分组合;
(3)对于未登录词,采用了基于汉字成词能力的HMM模型,采用Viterbi算法进行计算;
(4)基于Viterbi算法做词性标注;
(5)基于TF-IDF和textrank模型抽取关键词。
对分词处理后的提案信息进行TF-IDF权重计算,构建提案的内容属性索引;TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF指词频(Term Frequency),IDF为逆文本频率指数(Inverse DocumentFrequency)。需要说明的是,TF-IDF仅作为权重计算方法的一种示例性说明,对分词处理后的提案信息进行权重计算的方法并不限于TF-IDF,也可以为其他类型的信息检索数据挖掘加权技术。经过权重计算后,即可根据权重计算结果构建提案委员会提案的内容属性索引。
对承办单位办理的提案进行内容分析;通过对所有承办单位的历年办理提案进行分词处理,获取所有承办单位历年办理提案的词序列。
提取所有承办单位的标签信息;将内容分析结果和标签信息合并,计算权重值,构建承办单位的属性索引。即将获取的所有承办单位历年办理提案的词序列对应所有承办单位的标签信息进行合并,计算其权重值,构建所有单位的属性索引。需要说明的是,标签信息即为承办单位的标签。并且,在提取过程中可能发现已存在的单位标签信息,上述单位标签信息可作为对应该单位标签信息的提案的分词处理结果。
对提案的内容属性索引和承办单位的属性索引进行相关性计算,按照相关性对承办单位进行排序。示例性的,可以以相关性由高到低建立TOP8(前8名)个承办单位清单列表。需要说明的是,排序数量根据实际需要进行设定,可以为TOP5(前5名),也可以为TOP10(前10名)。
相关性计算包括将提案内容分析的属性索引与承办单位的属性索引集合运用余弦相似度算法计算二者的相关性。需要说明的是,余弦相似度计算算法仅作为本技术方案中相关性计算的一种示例性说明,本技术方案的相关性计算方法并不限于余弦相似度,还可以为其他类型的计算算法。
余弦相似度量算法的核心是分别构建样本和目标的特征向量,并分别计算样本空间向量和每个目标特征向量的余弦值,即计算样本空间向量和每个特征向量之间的夹角。相似度越小,夹角越大。相似度越大,夹角越小。例如样本和目标完全相同,则样本的空间向量和目标的空间向量的夹角为0°,余弦值为1;若样本和目标完全不同,则样本的空间向量和目标的空间向量的夹角为180°,其余弦值为-1。
示例性的,对提案内容进行分析后得到a、b、c、d、e五个关键词,并且在提案内容中上述五个关键词的出现TF-IDF值分别为a0、b0、c0、d0、e0。从而构建提案内容的特征向量
Figure DEST_PATH_IMAGE001
=[a0,0,... 0, b0,0, ..., 0, c0,0,..., 0,d0,0,..., 0, e0]。(需要说明的是,
Figure 113705DEST_PATH_IMAGE001
的维度取决于TF-IDF词袋的大小,在实际操作过程中,提案内容所提取的关键词数量并不限于五个,其数量可能极为庞大,也可能少于五个)。
之后对所有的承办单位历年的提案的关键词进行分析,分析上述五个关键词在每年的提案中出现的TF-IDF值,并计算每个关键词TF-IDF值的期望值,从而构建每个提案的多维向量。示例性的,若分析X单位历史五年的提案,可获知历史近五年a、b、c、d、e五个关键词的频率。如关键词a在X单位五年中最远一年的频率为aX1,最近一年的频率为aX5,可以获知关键词a在五年中的频率分别为aX1、aX2、aX3、aX4、aX5,并且根据在五年的关键词频率分析得到五年时间关键词的期望值。例如a的期望值为EaX=(aX1+aX2+aX3+aX4+aX5)/5。以此类推,分析得到b的期望值EbX,c的期望值为EcX,d的期望值为EdX,e的期望值为EeX。综上所述,可计算得到X单位历史五年的特征向量
Figure DEST_PATH_IMAGE002
=[EaX,,0,... 0,EbX,0,... 0,EcX,0,... 0,EdX,0,...0,EeX],同样的可计算其他单位的历年的特征向量。例如,Y单位历年的特征向量即为
Figure DEST_PATH_IMAGE003
=[EaY,0,... 0,EbY,0,... 0,EcY,0,... 0,EdY,0,... 0,EeY],Z单位历年的特征向量即为
Figure DEST_PATH_IMAGE004
=[EaZ,0,... 0,EbZ,0,... 0,EcZ,0,... 0,EdZ,0,... 0,EeZ]。
需要说明的是,期望值的计算除平均值外,还可以为加权平均值,即EaX1=(EaX1×1+EaX2×2+EaX3×3+EaX4×4+EaX5×5)/(1+2+3+4+5),加权平均值能够更好的反应承办单位历年提案的变化趋势。
在计算X单位的特征向量和提案内容的特征向量之间的相关性时,可以采用余弦相似度算法,也可以采用皮尔逊算法进行计算。需要说明的是,在进行相关性计算时,并不限于上述两种算法,还可以为其他类限定相似度算法,例如欧式距离算法等。
以下以余弦像相似度算法为例进行说明,可计算得到提案单位构建的特征向量
Figure 732643DEST_PATH_IMAGE001
与X单位历史五年提案内容构建的特征向量
Figure 981221DEST_PATH_IMAGE002
之间的余弦值为
Figure DEST_PATH_IMAGE005
以此类推,可分别计算特征向量
Figure 986218DEST_PATH_IMAGE001
与Y单位历史五年提案内容构建的特征向量
Figure 269432DEST_PATH_IMAGE003
之间的余弦值为
Figure DEST_PATH_IMAGE006
;
特征向量
Figure 154211DEST_PATH_IMAGE001
与Y单位历史五年提案内容构建的特征向量
Figure 278636DEST_PATH_IMAGE004
之间的余弦值为
Figure DEST_PATH_IMAGE007
示例性的,经分析进行排序,
Figure DEST_PATH_IMAGE008
>
Figure DEST_PATH_IMAGE009
>
Figure DEST_PATH_IMAGE010
,即可认为X单位相对于Y单位和W单位,其提案内容与提案委员会的提案最为接近。可形成TOP3的排名。即X单位为NO1,Y单位为NO2,Z单位为NO3。
皮尔逊相关系数的计算是先对向量每一分量减去分量均值,再求余弦相似度。这一操作称为中心化。
以上述的X、Y、Z三个单位五年的提案进行分析。皮尔逊相关系数计算过程如下:
与余弦相似度算法相同的是,在执行皮尔逊算法之前,同样需要对提案内容进行分析后得到a、b、c、d、e五个关键词,并且获知在提案内容中上述五个关键词的出现TF-IDF值分别为a0、b0、c0、d0、e0。从而构建提案内容的特征向量
Figure DEST_PATH_IMAGE011
=
Figure 257962DEST_PATH_IMAGE011
=[a0,0,... 0, b0,0, ...,0, c0,0,..., 0,d0,0,..., 0, e0]。
同样的,计算得到X单位历史五年的特征向量
Figure 271048DEST_PATH_IMAGE002
=[EaX,0,... 0,EbX,0,... 0,EcX,0,... 0,EdX,0,... 0,EeX],以及,Y单位历年的特征向量
Figure 733254DEST_PATH_IMAGE003
=[EaY,0,... 0,EbY,0,... 0,EcY,0,... 0,EdY,0,... 0,EeY],Z单位历年的特征向量
Figure 815479DEST_PATH_IMAGE004
=[EaZ,0,... 0,EbZ,0,... 0,EcZ,0,... 0,EdZ,0,... 0,EeZ]。
同样的,在皮尔逊算法执行前的期望值的计算除平均值外,还可以为加权平均值,即EaX1=(EaX1×1+EaX2×2+EaX3×3+EaX4×4+EaX5×5)/(1+2+3+4+5),加权平均值能够更好的反应承办单位历年提案的变化趋势。
皮尔逊算法计算得到待分类提案的特征向量
Figure DEST_PATH_IMAGE012
与历史五年每条提案内容构建的特征向量
Figure 867005DEST_PATH_IMAGE002
之间的相关系数为:
Figure DEST_PATH_IMAGE013
其中,
Figure DEST_PATH_IMAGE014
为所有关键词出现频率的平均值,即
Figure DEST_PATH_IMAGE015
Figure DEST_PATH_IMAGE016
即为X单位中所有关键词的平均值,即
Figure DEST_PATH_IMAGE017
以此类推,可分别计算特征向量
Figure 177DEST_PATH_IMAGE012
与Y单位历史五年提案内容构建的特征向量
Figure 23497DEST_PATH_IMAGE003
之间的皮尔逊相关系数为
Figure 733964DEST_PATH_IMAGE018
特征向量
Figure 586251DEST_PATH_IMAGE012
与Y单位历史五年提案内容构建的特征向量
Figure 557618DEST_PATH_IMAGE004
之间的皮尔逊相关系数为
Figure DEST_PATH_IMAGE019
示例性的,经分析进行排序,
Figure 705834DEST_PATH_IMAGE020
,即可认为X单位相对于Y单位和W单位,其提案内容与提案委员会的提案最为接近。可形成TOP3的排名。即X单位为NO1,Y单位为NO2,Z单位为NO3。
通过本发明,能快速对大量的推荐单位进行分析,从而大幅度减少在承办单位选择时耗费的人力物力。使提案委员会可以按推荐的顺序对承办单位进行筛选,节省了提案委员会的提案分配工作时间,从而大大提高了提案委员会的工作效率。
尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.一种为提案委员会推荐提案承办单位的方法,其特征在于,包括:
根据提案内容构建提案内容属性索引:通过分词算法对所述提案内容进行分词处理;对所述分词处理后的提案内容进行权重计算,所述权重计算的算法包括TF-IDF权重计算算法;根据所述权重计算的结果构建所述提案内容属性索引;
根据多个承办单位的历年办理提案和承办单位标签,分别构建多个承办单位属性索引:通过分词算法分别对多个所述承办单位的历年办理提案进行分词处理;分别提取多个所述承办单位的标签信息;将每个所述承办单位的分词处理结果和标签信息合并,进行权重计算,所述权重计算的算法包括TF-IDF权重计算算法;根据所述权重计算结果分别构建每个所述承办单位的承办单位属性索引;
计算所述提案内容属性索引和多个所述承办单位属性索引之间的相关性,所述相关性包括计算所述提案内容的特征向量和每个所述承办单位的特征向量之间的相关性:
Figure 233207DEST_PATH_IMAGE001
其中,W为提案内容的特征向量;X为X单位历史五年的特征向量;
a0、b0、c0、d0和e0分别为提案内容中五个关键词a、b、c、d和e的逆文本频率指数值;ax1、bx1、cx1、dx1、ex1分别为关键词a、b、c、d、e五年的期望值;
Figure 652687DEST_PATH_IMAGE002
为所有关键词出现频率的平均值,
Figure 392583DEST_PATH_IMAGE003
为X单位中所有关键词的平均值;所述期望值的计算方法包括平均值法或加权平均值法,所述X单位历史五年的特征向量是根据五年中关键词a、b、c、d、e频率计算得到的期望值来构建的;
分别计算所述提案内容的特征向量和剩余每个所述承办单位的特征向量之间的相关性,根据所述相关性的高低推荐所述承办单位。
2.根据权利要求1所述的为提案委员会推荐提案承办单位的方法,其特征在于,
所述分词算法采用jieba分词工具。
3.根据权利要求1所述的为提案委员会推荐提案承办单位的方法,其特征在于,
所述相关性计算的算法包括余弦相似度算法或皮尔逊算法。
4.根据权利要求1所述的为提案委员会推荐提案承办单位的方法,其特征在于,
所述通过分词算法对所述提案内容进行分词处理包括:
通过分词算法对所述提案内容进行中文分词和去停用词处理,提取所述提案内容的关键词;
所述通过分词算法分别对多个所述承办单位的历年办理提案进行分词处理包括:
通过分词算法分别对每个所述承办单位的历年承办提案内容进行中文分词和去停用词处理,提取每个所述承办单位历年办理提案的关键词。
5.根据权利要求1所述的为提案委员会推荐提案承办单位的方法,其特征在于,
所述对所述分词处理后的提案内容进行权重计算包括:
计算所述提案内容中每个关键词的频率;
所述将每个所述承办单位的分词处理结果和标签信息合并,进行权重计算包括:
计算每个所述承办单位历年办理提案的关键词的频率。
6.根据权利要求1所述的为提案委员会推荐提案承办单位的方法,其特征在于,
所述根据权重计算结果构建提案内容属性索引包括:
根据所述提案内容中每个关键词的频率构建所述提案内容的特征向量;
根据权重计算结果构建承办单位属性索引包括:
根据每个所述承办单位历年办理提案中关键词的频率,分别构建每个所述承办单位的特征向量。
CN201911396262.3A 2019-12-30 2019-12-30 一种为提案委员会推荐提案承办单位的方法 Active CN111190994B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911396262.3A CN111190994B (zh) 2019-12-30 2019-12-30 一种为提案委员会推荐提案承办单位的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911396262.3A CN111190994B (zh) 2019-12-30 2019-12-30 一种为提案委员会推荐提案承办单位的方法

Publications (2)

Publication Number Publication Date
CN111190994A CN111190994A (zh) 2020-05-22
CN111190994B true CN111190994B (zh) 2021-07-23

Family

ID=70709487

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911396262.3A Active CN111190994B (zh) 2019-12-30 2019-12-30 一种为提案委员会推荐提案承办单位的方法

Country Status (1)

Country Link
CN (1) CN111190994B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116644175B (zh) * 2023-07-26 2023-10-20 山东唐和智能科技有限公司 一种提案办理单位的推荐系统及方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180322427A1 (en) * 2017-05-04 2018-11-08 International Business Machines Corporation System and method for time critical automation
CN108763566A (zh) * 2018-06-05 2018-11-06 北京玄科技有限公司 文本相似度计算方法及装置、智能机器人
CN108985713A (zh) * 2018-07-03 2018-12-11 龙马智芯(珠海横琴)科技有限公司 为招标单位推荐投标单位的方法及计算机可读介质

Also Published As

Publication number Publication date
CN111190994A (zh) 2020-05-22

Similar Documents

Publication Publication Date Title
CN108804641B (zh) 一种文本相似度的计算方法、装置、设备和存储介质
US7099819B2 (en) Text information analysis apparatus and method
CN111797214A (zh) 基于faq数据库的问题筛选方法、装置、计算机设备及介质
CN112380319B (zh) 一种模型训练的方法及相关装置
CN108363691B (zh) 一种用于电力95598工单的领域术语识别系统及方法
CN111475603A (zh) 企业标识识别方法、装置、计算机设备及存储介质
US8583669B2 (en) Query suggestion for efficient legal E-discovery
CN111813930B (zh) 相似文档检索方法及装置
CN113157918A (zh) 一种基于注意力机制的商品名称短文本分类方法和系统
CN117273134A (zh) 一种基于预训练语言模型的零样本知识图谱补全方法
CN110704638A (zh) 一种基于聚类算法的电力文本词典构造方法
CN111158641A (zh) 一种基于语义分析和文本挖掘的事务类功能点自动识别方法及相应存储介质与电子装置
CN111008530A (zh) 一种基于文档分词的复杂语义识别方法
CN111538846A (zh) 基于混合协同过滤的第三方库推荐方法
CN113010752A (zh) 召回内容的确定方法、装置、设备以及存储介质
CN118245564B (zh) 一种支持语义查重查新的特征比对库构建方法及装置
CN116910599A (zh) 数据聚类方法、系统、电子设备及存储介质
CN114491034B (zh) 一种文本分类方法及智能设备
CN111753067A (zh) 一种技术交底文本创新性评估方法、装置和设备
CN111190994B (zh) 一种为提案委员会推荐提案承办单位的方法
CN117235137B (zh) 一种基于向量数据库的职业信息查询方法及装置
Berrahou et al. How to extract unit of measure in scientific documents?
CN106156181B (zh) 一种别名获取方法及装置
CN115563515A (zh) 文本相似性检测方法、装置、设备及存储介质
CN113761902B (zh) 目标关键词提取系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 501, building A4, phase I, innovation industrial park, No. 800, Wangjiang West Road, high tech Zone, Hefei City, Anhui Province

Applicant after: ANHUI SUNCN PAP INFORMATION TECHNOLOGY Co.,Ltd.

Address before: Room 501, building A4, phase I, innovation industrial park, No. 800, Wangjiang West Road, high tech Zone, Shushan District, Hefei City, Anhui Province

Applicant before: ANHUI SUNCN PAP INFORMATION TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant