CN106776978B - 专家库建立办法和装置 - Google Patents

专家库建立办法和装置 Download PDF

Info

Publication number
CN106776978B
CN106776978B CN201611108848.1A CN201611108848A CN106776978B CN 106776978 B CN106776978 B CN 106776978B CN 201611108848 A CN201611108848 A CN 201611108848A CN 106776978 B CN106776978 B CN 106776978B
Authority
CN
China
Prior art keywords
expert
degree
cooperation
once
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611108848.1A
Other languages
English (en)
Other versions
CN106776978A (zh
Inventor
霍东云
崔星汉
方垚
李燕茜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Time Technology Co Ltd
Original Assignee
Beijing Time Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Time Technology Co Ltd filed Critical Beijing Time Technology Co Ltd
Priority to CN201611108848.1A priority Critical patent/CN106776978B/zh
Publication of CN106776978A publication Critical patent/CN106776978A/zh
Application granted granted Critical
Publication of CN106776978B publication Critical patent/CN106776978B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism

Abstract

本发明涉及一种专家库建立方法和装置,该方法包括以下步骤:样本收集步骤,收集特定领域的专家样本,包括专家的论文、专利和项目,形成训练集;专家分类模型建立步骤,根据训练库建立专家分类模型;直接专家识别步骤,利用所建立的专家分类模型,对全部待分类专家进行识别和分类,判断其是否属于所述特定领域的专家;合作专家识别步骤,根据待分类专家与所述特定领域的专家的合作度确定待分类专家是否属于所述特定领域的专家。

Description

专家库建立办法和装置
技术领域
本发明涉及专家库的建立。
背景技术
专家是特定领域有卓越表现和高度专业能力的个人。一方面,专家可以在科技项目开发中起到重要的作用,另一方面,很多评审等活动需要专家的参与,例如招标等。实际上,2003年发改委还专门制定了《评标专家和评标专家库管理暂行办法》。但是目前所建立的专家数据库要么局限在人员手工的收集,要么是专家自己的报名。现有技术中,没有好的办法根据大量的信息(例如互联网信息)或大的总库中寻找特定专家的办法。
发明内容
本发明针对现有技术的以上缺点做出,用以克服现有技术的一个或更多个缺点,至少提供一种有益的选择。
根据本发明的一个方面,提供了一种专家库建立方法,包括以下步骤:样本收集步骤,收集特定领域的专家样本,包括专家的论文、专利和项目,形成训练集;专家分类模型建立步骤,根据训练库建立专家模型;直接专家识别步骤,利用所建立的专家模型,对全部待分类专家进行识别和分类,判断其是否属于所述特定领域的专家;合作专家识别步骤,根据待分类专家与所述特定领域的专家的合作度确定待分类专家是否属于领域专家。
根据本发明的另一方面,提供了一种专家库建立装置,包括:专家样本收集装置,收集特定领域的专家样本,包括专家的论文、专利和项目,形成训练集;专家分类模型建立装置,根据训练库建立专家分类模型;直接专家识别装置,利用所建立的专家分类模型,对全部待分类专家进行识别和分类,判断其是否属于所述特定领域的专家;合作专家识别装置,根据待分类专家与所述特定领域的专家的合作度确定待分类专家是否属于所述特定领域的专家。
根据本发明的实施方式,可以快速而准确地建立专家库。
附图说明
附图仅仅是示例性的,不是对本发明的保护范围的限制。
图1示出了依据本发明的一种实施方式的专家库建立方法的流程图。
图2示出了依据本发明的另一种实施方式的专家库建立方法的流程图。
图3示出了依据本发明的一种实施方式的专家库建立装置的示意图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,对本发明的以下描述仅仅是为了本领域技术人员能够实现本发明,不是对本发明的保护范围的限制。
图1示出了依据本发明的一种实施方式的专家库建立方法的流程图。如图1所示,首先在步骤101中进行专家样本收集。收集特定领域的专家的样本,包含该专家所作的论文、专利、项目。这些样本可被分为训练集和测试集。训练集用于建立专家模型,测试集用于测试和改进专家模型。根据本发明的一种实施方式,训练集中的样本数目是测试集中的样本数目的4.5倍到9倍。另外,根据本发明的一种实施方式,将训练集分为论文训练集、专利训练集和项目训练集。将测试集分为论文测试集、专利测试集和项目测试集。训练集中出现的样本被称为训练语料。测试集中的出现的样本被称为测试语料。
接着在步骤102,构建专家分类模型。该步骤可以分为专家分类模型构建步骤1021和专家分类模型修正步骤1022。在专家分类模型构建步骤中,利用训练集构建专利分类模型。在专家分类模型修正步骤中,利用测试集对专家分类模型进行测试,并调整参数,得到错判、漏判率都较低的模型。
根据本发明的一种实施方式,专家分类模型构建步骤中,利用向量空间模型来表达文本。将文档转化为m维词条空间中的一个向量d=(W1,W2,W3…Wm)T,其中Wi为向量在第i个词条上的权重。根据一种实施方式,依据以下公式计算各词条的权重:
其中,w(t,d)为词条t在文本d中的权重,tf(t,d)为词条t在文本d中的词频,N为训练文本的总数,nt为训练文本中出现t的文本数。根据本发明的一种实施方式,对于2008年之后的专利文件,tf(t,d)另外乘以1.1到1.5之间的系数,对于2002年之前的专利文献,tf(t,d)另外乘以0.8到0.95之间的系数。该系数的大小根据专利所涉及的技术领域确定。
根据本发明的一种实施方式,利用文档频率法进行特征选择。词条的文档频率是指在训练语料中出现该词条的文档数。将文档频率小于预定义阈值的低频词从原始向量空间中移除。依据本发明的一种实施方式,低频词为在所有训练语料中出现该词条的文档数低于第一阈值,并且在近3年的训练语料中,出现该词条的文档数低于第二阈值。依据该实施方式,可以避免将新出现的边缘学科的专家排除在外。另外依据本发明的一种实施方式,包括新词确认步骤。在该步骤中,对于这样的低频词,即3年前的所有训练语料中均未出现,但是在近3年的训练语料中有第三阈值的文档中出现该词的,进行提示,由创建专家库的人员确认是否列入低频词。
根据本发明的一种实施方式,采用SVM方法作为分类器算法。
依据本发明一种实施方式,SVM利用公式2作为分类函数,并以公式3为约束条件。
yi[(ω·xi)+b]-1≥0,i=1,2,...,n (3)
其中,ω为间隔系数。所述间隔是指该最优分类面到最近样本的距离,即2/||ω||。分类线方程为y=xω+b,(xi,yi)表示样本坐标,i=1,2,...,n,x∈Rd,y∈{+1,-1}。αi为每个约束条件(公式3)对应的Lagrange乘子。b*是分类阈值,可以用任一个支持向量(满足公式3中的等号)求得。
应该注意,以上的描述均为示意性的,并不是对本发明的限制,受益于本发明的技术人员可以想到用其他的方法,例如回归模型法、最近邻分类法、朴素贝叶斯分类法、决策树法、规则学习算法、相关反馈法、选举分类法、神经网络法、纠错输出编码法、最大熵法、休眠专家法等作为分类其的算法。
进一步,在步骤103,利用所建立的专家模型,对全部待分类专家进行识别和分类,判断其是否属于该特定领域的专家。根据一种实施方式,将待分类专家的论文、专利或项目与专家库模型进行比对,如果距离小于阈值,则可判断该专家为该领域专家,并将其并入该专家库。
根据一种实施方式,专家模型还分为专利子模型、论文子模型、项目子模型。待分类专家与总模型之间的距离小于所述阈值时,还进一步与各子模型进行比对,与任一子模型之间的距离小于特定阈值时即可认为该专家属于该领域专家。
进一步,在步骤104,计算剩余待分类专家中各专家的合作度。剩余待分类专家即全部待分类专家去除在步骤103中已经被确定为该领域专家的专家之后剩余的专家。将专家之间的关系分为一度合作关系、N度合作关系(一般取N为大于等于2小于等于5)以及无合作关系。具有直接合作关系的专家,例如论文的共同作者、专利的发明人、项目的共同参与者为一度合作关系。具有间接合作关系的专家,例如论文X(一度合作文本)的共同作者为A、B,论文Y(二度合作文本)的共同作者为B、C,则A与C之间通过一个连接人B而发生关联,成为二度合作关系。如果C进一步与D合作发表了论文Z(三度合作文本),则A与D之间的关系为三度合作关系,依次类推。合作关系可以根据全专家数据库、全论文数据库等获得。
根据一种实施方式,待分类专家与已识别出的领域专家之间的合作度如下地进行计算:
首先计算已识别出的领域专家中与待分类专家为一度合作者的人数,以及一度合作的论文、专利、项目以及它们的数量,即合作次数。根据合作次数确定一度合作权重系数j1,合作的次数越多,一度合作权重系数j1越大,例如可以对各次合作进行求和。根据一种实施方式,还根据合作的论文、专利、项目的质量调整各次合作权重系数。即计算所合作的论文、专利、项目与专家分类模型之间的距离,距离越小,各次一度合作权重系数越大。
同样地,计算已识别出的领域专家中与待分类专家为二度合作者的人数,以及二度合作的论文、专利、项目以及数量,即合作次数。然后计算二度合作权重系数j2。合作的次数越多,二度合作权重系数j2越大,例如可以对各次合作进行求和。根据一种实施方式,正对每次二次合作,还根据合作的论文、专利、项目的质量调整合作权重系数。即计算出一度合作的论文、专利、项目(一度合作文本)与专家分类模型之间的距离,以及该二度合作文件与专家分类模型之间的距离,并计算综合距离,距离越小,每次的二度合作权重系数越大。综合距离为考虑一度合作论文的权重调节系数和二度合作论文的权重调节系数之后得到的距离。
对于单次合作,一度合作权重系数大于二度合作系数。
根据具体情况,可以确定一直计算到几度合作关系。但一般来说,计算到4度合作关系就可以了。
然后根据所计算出的合作人数和合作权重系数,计算合作度。
例如合作度H=所有的一度合作系数j1和所有的二度合作系数j2的和。
然后,在步骤105,将合作度大于阈值的专家加入到该领域的专家库中。
图2示出了依据本发明的另一种实施方式的专家库建立方法的流程图。
图2所示的专家库建立方法与图1所示的专家库建立方法基本相同。不同之处在于,在步骤103′处,不但与图1所示的步骤103相同,利用所建立的专家模型,对全部待分类专家进行识别和分类,判断其是否属于特定的某个领域的专家;还同时确定待进一步确认专家。即将待分类专家的论文、专利或项目与专家库模型进行比对,如果距离小于第一阈值,则可判断该专家为该领域专家,并将其并入该专家库。如果距离虽然大于第一阈值但是小于第二阈值,则将其列为待进一步确认专家。
在步骤104′,仅仅针对待确认专家而不是针对所有的剩余专家,进行合作度计算。
下面描述本发明的专家库建立装置,可以参考上文对方法的描述来理解本发明的装置。
图3示出了依据本发明的一种实施方式的专家库建立装置的示意图。如图3所示,依据本发明的一种实施方式的专家库建立装置,包括:专家样本收集装置31,收集特定领域的专家样本,包括专家的论文、专利和项目,形成训练集;专家分类模型建立装置32,该专家分类模型建立装置32包括专家分类模型构建装置321,用于根据训练库建立专家分类模型;直接专家识别装置33,利用所建立的专家分类模型,对全部待分类专家进行识别和分类,判断其是否属于所述特定领域的专家;合作度计算装置34,确定待分类专家与所述特定领域的专家的合作度;以及合作专家识别装置35,根据待分类专家与所述特定领域的专家的合作度确定待分类专家是否属于所述特定领域的专家。
根据一种实施方式,专家样本收集装置31还收集该特定领域的专家样本来形成测试集,所述专家分类模型建立装置32还包括专家分类模型修正装置322,专家分类模型修正装置322使用所述测试集对所述专家分类模型进行测试和修正。
根据一种实施方式,所述合作专家识别装置包括:一度合作者确定装置,计算已识别出的所述特定领域专家中与待分类专家为一度合作者的人数,一度合作的论文、专利、项目以及其数量,即一度合作次数;一度合作权重系数确定装置,针对各一度合作者,根据所述一度合作的论文、专利、项目以及所述一度合作次数,确定各一度合作者的权重系数;二度合作者确定装置,计算已识别出的所述特定领域专家中与待分类专家为二度合作者的人数,二度合作的论文、专利、项目以及其数量,即二度合作次数;二度合作权重系数确定装置,针对各二度合作者,根据所述一度合作的论文、专利、项目以及所述二度合作次数,所述二度合作的论文、专利、项目以及所述合作次数确定各二度合作者的权重系数,合作度计算装置,根据各所述一度合作者的权重系数和各所述二度合作者的权重系数计算各待分类专家与所述特定领域的专家的合作度。
根据一种实施方式,在所述一度合作权重系数装置中,根据合作次数确定一度合作权重系数j1,合作的次数越多,一度合作权重系数j1越大,还根据合作的论文、专利、项目的质量调整各次合作权重系数,即计算所合作的论文、专利、项目与专家分类模型之间的距离,距离越小,该次一度合作权重系数越大。
根据一种实施方式,在所述二度合作权重系数确定装置中,二次合作的次数越多,二度合作权重系数j2越大,还根据一度合作的论文、专利、项目的质量、二度合作论文的质量调整每次二度合作的二次合作权重系数。
根据一种实施方式,在所述二度合作权重系数确定装置中,计算一度合作的论文、专利、项目与专家分类模型之间的距离,以及该二度合作的论文、专利、项目与专家分类模型之间的距离,并计算综合距离,距离越小,则该次二度合作权重系数越大,综合距离为考虑一度合作论文的权重调节系数和二度合作论文的权重调节系数之后得到的距离。
根据一种实施方式,专家分类模型建立装置包括利用文档频率法进行特征选择的装置:将文档频率小于预定义阈值的低频词从原始向量空间中移除,所述低频词为在所有训练集的样本中出现该词条的文档数低于第一阈值,并且在近3年的训练集的样本中,出现该词条的文档数低于第二阈值。
根据一种实施方式,所述利用文档频率法进行特征选择的装置包括新词确认步骤:对于这样的低频词,即3年前的所有训练集的样本中均未出现,但是在近3年的训练集的样本中有大于第三阈值的样本中出现该词的,进行提示,由所述方法的使用者确认是否列入低频词。
根据一种实施方式,所述专家分类模型建立装置还包括:使用向量空间模型来表达文本的装置,以及采用SVM方法进行分类的装置;其中,在使用向量空间模型来表达文本时,将文档转化为m维词条空间中的一个向量d=(W1,W2,W3…Wm)T,其中Wi为向量在第i个词条上的权重并依据以下公式计算各词条的权重:
其中,w(t,d)为词条t在文本d中的权重,tf(t,d)为词条t在文本d中的词频,N为训练文本的总数,nt为训练文本中出现t的文本数,对于2008年之后的专利文件,tf(t,d)另外乘以1.1到1.5之间的系数,对于2002年之前的专利文献,tf(t,d)另外乘以0.8到0.95之间的系数。该系数的大小根据专利所涉及的技术领域确定;
所述SVM方法利用公式2作为分类函数,并以公式3为约束条件,
yi[(ω·xi)+b]-1≥0,i=1,2,...,n (3)
其中,ω为间隔系数,所述间隔是指该最优分类面到最近样本的距离,即2/||ω||,分类线方程为y=xω+b,(xi,yi)表示样本坐标,i=1,2,...,n,y∈{+1,-1}。αi为每个约束条件对应的拉格朗日乘子,b*是分类阈值,能够通过满足公式3中的等号而求得。
应该理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因而,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。此外,本发明的权利要求旨在涵盖落入权利要求范围和边界或者这种范围和边界的等同形式内的全部变型和改进。

Claims (10)

1.一种专家库建立方法,包括以下步骤:
专家样本收集步骤,收集特定领域的专家样本,包括专家的论文、专利和项目,形成训练集;
专家分类模型建立步骤,根据训练集建立专家分类模型;
直接专家识别步骤,利用所建立的专家分类模型,对全部待分类专家进行识别和分类,判断其是否属于所述特定领域的专家;
合作专家识别步骤,根据待分类专家与所述特定领域的专家的合作度确定待分类专家是否属于所述特定领域的专家。
2.根据权利要求1所述的专家库建立方法,其特征在于,在所述专家样本收集步骤,还形成测试集,所述专家分类模型建立步骤还包括使用所述测试集对所述专家分类模型进行测试和修正。
3.根据权利要求2所述的专家库建立方法,其特征在于,所述合作专家识别步骤包括:
一度合作者确定步骤,确定已识别出的所述特定领域专家中与待分类专家为一度合作者的专家,一度合作的论文、专利、项目以及其数量,即一度合作次数;
一度合作权重系数确定步骤,针对各一度合作者,根据所述一度合作的论文、专利、项目以及所述一度合作次数,确定各一度合作者的权重系数;
二度合作者确定步骤,确定已识别出的所述特定领域专家中与待分类专家为二度合作者的专家,二度合作的论文、专利、项目以及其数量,即二度合作次数;
二度合作权重系数确定步骤,针对各二度合作者,根据所述一度合作的论文、专利、项目以及所述二度合作次数,所述二度合作的论文、专利、项目以及所述合作次数确定各二度合作者的权重系数;
合作度计算步骤,根据各所述一度合作者的权重系数和各所述二度合作者的权重系数计算各待分类专家与所述特定领域的专家的合作度。
4.根据权利要求3所述的专家库建立方法,其特征在于,在所述一度合作权重系数确定步骤中,根据合作次数确定一度合作权重系数j1,合作的次数越多,一度合作权重系数j1越大,还根据合作的论文、专利、项目的质量调整各次合作权重系数,即计算所合作的论文、专利、项目与专家分类模型之间的距离,距离越小,该次一度合作权重系数越大。
5.根据权利要求4所述的专家库建立方法,其特征在于,在所述二度合作权重系数确定步骤中,二次合作的次数越多,二度合作权重系数j2越大,还根据一度合作的论文、专利、项目的质量、二度合作论文的质量调整每次二度合作的二次合作权重系数。
6.根据权利要求5所述的专家库建立方法,其特征在于,在所述二度合作权重系数确定步骤中,计算一度合作的论文、专利、项目与专家分类模型之间的距离,以及该二度合作的论文、专利、项目与专家分类模型之间的距离,并计算综合距离,距离越小,则该次二度合作权重系数越大,综合距离为考虑一度合作论文的权重调节系数和二度合作论文的权重调节系数之后得到的距离。
7.根据权利要求6所述的专家库建立方法,所述专家分类模型建立步骤包括利用文档频率法进行特征选择的步骤:将文档频率小于预定义阈值的低频词从原始向量空间中移除,所述低频词为在所有训练集的样本中出现该低频词的文档数低于第一阈值,并且在近3年的训练集的样本中,出现该低频词的文档数低于第二阈值。
8.根据权利要求7所述的专家库建立方法,所述利用文档频率法进行特征选择的步骤包括新词确认步骤:对于这样的低频词,即3年前的所有训练集的样本中均未出现,但是在近3年的训练集的样本中有大于第三阈值的样本中出现该词的,进行提示,由所述方法的使用者确认是否列入低频词。
9.根据权利要求8所述的方法,所述专家分类模型建立步骤还包括:使用向量空间模型来表达文本的步骤,以及采用SVM方法进行分类的步骤;
其中,在使用向量空间模型来表达文本时,将文档转化为m维词条空间中的一个向量d=(W1,W2,W3…Wm)T,其中Wi为向量在第i个词条上的权重并依据以下公式计算各词条的权重:
其中,w(t,d)为词条t在文本d中的权重,tf(t,d)为词条t在文本d中的词频,N为训练文本的总数,nt为训练文本中出现t的文本数,对于2008年之后的专利文件,tf(t,d)另外乘以1.1到1.5之间的系数,对于2002年之前的专利文献,tf(t,d)另外乘以0.8到0.95之间的系数,该系数的大小根据专利所涉及的技术领域确定;
所述SVM方法利用公式2作为分类函数,并以公式3为约束条件,
yi[(ω·xi)+b]-1≥0,i=1,2,...,n (3)
其中,ω为间隔系数,所述间隔是指最优分类面到最近样本的距离,即2/||ω||,分类线方程为y=xω+b,(xi,yi)表示样本坐标,i=1,2,...,n,y∈{+1,-1}, αi为每个约束条件对应的拉格朗日乘子,b*是分类阈值,能够通过满足公式3中的等号而求得。
10.一种专家库建立装置,包括:
专家样本收集装置,收集特定领域的专家样本,包括专家的论文、专利和项目,形成训练集;
专家分类模型建立装置,根据训练集建立专家分类模型;
直接专家识别装置,利用所建立的专家分类模型,对全部待分类专家进行识别和分类,判断其是否属于所述特定领域的专家;
合作专家识别装置,根据待分类专家与所述特定领域的专家的合作度确定待分类专家是否属于所述特定领域的专家。
CN201611108848.1A 2016-12-06 2016-12-06 专家库建立办法和装置 Active CN106776978B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611108848.1A CN106776978B (zh) 2016-12-06 2016-12-06 专家库建立办法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611108848.1A CN106776978B (zh) 2016-12-06 2016-12-06 专家库建立办法和装置

Publications (2)

Publication Number Publication Date
CN106776978A CN106776978A (zh) 2017-05-31
CN106776978B true CN106776978B (zh) 2019-08-16

Family

ID=58879077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611108848.1A Active CN106776978B (zh) 2016-12-06 2016-12-06 专家库建立办法和装置

Country Status (1)

Country Link
CN (1) CN106776978B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506374B (zh) * 2017-07-14 2020-02-21 北京赛时科技有限公司 邮箱作者对应方法和装置及计算机可读存储介质
CN109740947A (zh) * 2019-01-08 2019-05-10 上海市研发公共服务平台管理中心 基于专利数据的专家挖掘方法、系统、存储介质及电子终端
CN110909236A (zh) * 2019-10-24 2020-03-24 东莞成电智信信息科技有限公司 一种基于大数据的专家推荐方法
CN112434965A (zh) * 2020-12-04 2021-03-02 广东电力信息科技有限公司 一种基于词频的专家标签产生方法、装置、终端

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101236615A (zh) * 2008-01-22 2008-08-06 安徽科大讯飞信息科技股份有限公司 一种智能发音学习语料生成方法
CN102156706A (zh) * 2011-01-28 2011-08-17 清华大学 一种指导者推荐系统及方法
CN102184225A (zh) * 2011-05-09 2011-09-14 北京奥米时代生物技术有限公司 一种在问答系统中搜索优选专家信息的方法
CN104463398A (zh) * 2013-11-25 2015-03-25 北京建筑大学 一种学位信息管理方法和系统
CN105868900A (zh) * 2016-03-28 2016-08-17 大连理工大学 基于支持向量机的企业预合作伙伴分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101236615A (zh) * 2008-01-22 2008-08-06 安徽科大讯飞信息科技股份有限公司 一种智能发音学习语料生成方法
CN102156706A (zh) * 2011-01-28 2011-08-17 清华大学 一种指导者推荐系统及方法
CN102184225A (zh) * 2011-05-09 2011-09-14 北京奥米时代生物技术有限公司 一种在问答系统中搜索优选专家信息的方法
CN104463398A (zh) * 2013-11-25 2015-03-25 北京建筑大学 一种学位信息管理方法和系统
CN105868900A (zh) * 2016-03-28 2016-08-17 大连理工大学 基于支持向量机的企业预合作伙伴分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"社交网络中领域专家的识别研究";翟伯荫;《中国优秀硕士学位论文全文数据库信息科技辑(月刊)》;20151015(第10期);I141-5

Also Published As

Publication number Publication date
CN106776978A (zh) 2017-05-31

Similar Documents

Publication Publication Date Title
CN106776978B (zh) 专家库建立办法和装置
Angelidis et al. Multiple instance learning networks for fine-grained sentiment analysis
CN106202177B (zh) 一种文本分类方法及装置
CN108898479B (zh) 信用评价模型的构建方法及装置
CN104881689B (zh) 一种多标签主动学习分类方法及系统
CN103207913B (zh) 商品细粒度语义关系的获取方法和系统
CN107766418A (zh) 一种基于融合模型的信用评估方法、电子设备和存储介质
CN105320960A (zh) 一种基于投票的跨语言主客观情感分类方法
CN104834940A (zh) 一种基于支持向量机的医疗影像检查疾病分类方法
CN110134792B (zh) 文本识别方法、装置、电子设备以及存储介质
Hewahi et al. Age estimation based on neural networks using face features
WO2015008567A1 (ja) 顔印象度推定方法、装置、及びプログラム
CN108052625A (zh) 一种实体精细分类方法
CN105786898B (zh) 一种领域本体的构建方法和装置
CN108897750A (zh) 融合多元上下文信息的个性化地点推荐方法及设备
CN107193806A (zh) 一种词汇义原的自动预测方法及装置
CN104598648A (zh) 一种微博用户交互式性别识别方法及装置
CN109344248B (zh) 一种基于科技文献摘要聚类的学术主题生命周期分析方法
TWI254880B (en) Method for classifying electronic document analysis
CN104573726B (zh) 基于四等分及各成分重构误差最优组合的人脸图像识别方法
CN110990662B (zh) 一种基于引文网络与科研合作网络的领域专家遴选方法
CN111078859B (zh) 一种基于引用次数的作者推荐方法
CN108647259A (zh) 基于改进深度特征加权的朴素贝叶斯文本分类方法
CN109657710A (zh) 数据筛选方法、装置、服务器及存储介质
CN109460474A (zh) 用户偏好趋势挖掘方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant