CN105022845A - 一种基于特征子空间的新闻分类方法及系统 - Google Patents

一种基于特征子空间的新闻分类方法及系统 Download PDF

Info

Publication number
CN105022845A
CN105022845A CN201510530700.6A CN201510530700A CN105022845A CN 105022845 A CN105022845 A CN 105022845A CN 201510530700 A CN201510530700 A CN 201510530700A CN 105022845 A CN105022845 A CN 105022845A
Authority
CN
China
Prior art keywords
classification
mood
news
sample
tendency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510530700.6A
Other languages
English (en)
Inventor
李寿山
张栋
刘欢欢
周国栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhangjiagang Institute of Industrial Technologies Soochow University
Original Assignee
Zhangjiagang Institute of Industrial Technologies Soochow University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhangjiagang Institute of Industrial Technologies Soochow University filed Critical Zhangjiagang Institute of Industrial Technologies Soochow University
Priority to CN201510530700.6A priority Critical patent/CN105022845A/zh
Publication of CN105022845A publication Critical patent/CN105022845A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于特征子空间的新闻分类方法及系统,该方法包括:将已标注样本的整个特征空间划分为若干个不相交的特征子空间,并对若干个不相交的特征子空间中各个特征子空间进行训练,得到与各个特征子空间对应的子分类器;利用训练得到的子分类器对未标注样本进行分类,得到未标注样本的情绪倾向类别,并将已知情绪倾向类别的未标注样本更新至标注样本集中;利用标注样本集构建情绪倾向分类器,并利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到待分类新闻的情绪倾向类别。当获知待分类新闻的情绪倾向类别后,可以将待分类新闻划分到其含有的情绪倾向类别对应的新闻中,从而提高了用户浏览新闻时的体验度。

Description

一种基于特征子空间的新闻分类方法及系统
技术领域
本发明涉及自然语言处理及模式识别技术领域,特别是涉及一种基于特征子空间的新闻分类方法和系统。
背景技术
当今,用户可以通过网络对新闻中的人物、事件和现象等表达自己的观点和态度。在用户的活动中,用户对事物的态度往往与用户的情绪倾向是紧密联系的,也就是说可以从用户的情绪倾向观察到用户对事物的观点倾向。其中,情绪倾向是指用户内在的心理反应与感受的倾向性,即积极情绪倾向或消极情绪倾向。
现有技术中,对于新闻的分类,通常是利用主题分类技术对新闻进行分类、管理和检索的,例如基于新闻的主题(如体育、经济、娱乐、政治等)对新闻进行分类、管理和检索。然而,在实际生活中,针对不同主题的新闻,用户产生的情绪倾向也会不同,而现有技术中并不存在基于情绪倾向性对新闻进行分类的技术方案,因此,不能满足用户按自己的情绪倾向来查找新闻的需求,从而降低了用户浏览新闻时的体验度。
综上所述可以看出,如何实现对新闻进行情绪倾向性分类,从而改善用户浏览新闻时的用户体验是目前亟待解决的问题。其中,对新闻进行情绪倾向性分类是指:按用户看到新闻时的情绪倾向将新闻标记为某种情绪倾向类别的新闻。
发明内容
有鉴于此,本发明提供了一种基于特征子空间的新闻分类方法和系统,以实现对新闻进行情绪倾向性分类,从而提高用户浏览新闻时的体验度的目的。
为解决上述技术问题,本发明提供一种基于特征子空间的新闻分类方法,包括:
将已标注样本的整个特征空间划分为若干个不相交的特征子空间,并对若干个不相交的特征子空间中各个特征子空间进行训练,得到与所述各个特征子空间对应的子分类器;其中,所述已标注样本为已知情绪倾向类别的样本;
利用训练得到的子分类器对未标注样本进行分类,得到所述未标注样本的情绪倾向类别,并将已知情绪倾向类别的所述未标注样本更新至标注样本集中;
利用所述标注样本集构建情绪倾向分类器,并利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到所述待分类新闻的情绪倾向类别;
其中,所述情绪倾向类别包括积极情绪类别和消极情绪类别。
优选的,所述将已知情绪倾向类别的所述未标注样本更新至标注样本集中,包括:
将情绪倾向类别对应的置信度最高的所述未标注样本更新至所述标注样本集中,迭代上述更新过程直至所有所述未标注样本更新至所述标注样本集中。
优选的,将相同数量的积极情绪类别的所述未标注样本和消极情绪类别的所述未标注样本更新至所述标注样本集中。
优选的,利用机器学习分类算法对所述若干个不相交的特征子空间中各个特征子空间进行训练,得到与所述各个特征子空间对应的子分类器。
优选的,所述机器学习分类算法为朴素贝叶斯分类算法。
优选的,所述利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到所述待分类新闻的情绪倾向类别,包括:
利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到分类结果;其中,所述分类结果包括与任一情绪倾向类别对应的后验概率,所述与任一情绪倾向类别对应的后验概率表示所述待分类新闻含有该情绪倾向类别的后验概率;
判断所述积极情绪类别对应的后验概率是否大于所述消极情绪类别对应的后验概率,如果是,则判定所述待分类新闻的情绪倾向类别为积极情绪类别,否则,判定所述待分类新闻的情绪倾向类别为消极情绪类别。
本发明还提供了一种基于特征子空间的新闻分类系统,包括:
子分类器确定单元,用于将已标注样本的整个特征空间划分为若干个不相交的特征子空间,并对所述若干个不相交的特征子空间中各个特征子空间进行训练,得到与所述各个特征子空间对应的子分类器;其中,所述已标注样本为已知情绪倾向类别的样本;
标注样本集更新单元,用于利用训练得到的子分类器对未标注样本进行分类,得到所述未标注样本的情绪倾向类别,并将已知情绪倾向类别的所述未标注样本更新至标注样本集中;
分类单元,用于利用所述标注样本集构建情绪倾向分类器,并利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到所述待分类新闻的情绪倾向类别;
其中,所述情绪倾向类别包括积极情绪类别和消极情绪类别。
以上本发明提供的一种基于特征子空间的新闻分类方法及系统中,新闻的情绪倾向类别包括积极和消极两种,最开始就已知情绪倾向类别的样本称为已标注样本,反之,最开始未知情绪倾向类别的样本称为未标注样本,基于此,首先,将已标注样本的整个特征空间划分为若干个不相交的特征子空间,并对这些特征子空间中各个特征子空间进行训练,得到对应的子分类器;然后,利用训练得到的子分类器对未标注样本进行分类,并将已知情绪倾向类别的未标注样本更新至标注样本集中;最后,利用最终更新好的标注样本集构建情绪倾向分类器,并利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到待分类新闻的情绪倾向类别。当获知待分类新闻的情绪倾向类别后,可以将待分类新闻划分到其含有的情绪倾向类别对应的新闻中,从而提高了用户浏览新闻时的体验度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明一种基于特征子空间的新闻分类方法实施例1的流程图;
图2为本发明一种基于特征子空间的新闻分类方法实施例2的流程图;
图3为本发明一种基于特征子空间的新闻分类系统实施例1的结构框图示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的核心是提供一种基于特征子空间的新闻分类方法和系统,以实现对新闻进行情绪倾向性分类,从而提高用户浏览新闻时的体验度的目的。
在发明中,新闻的情绪倾向类别可以是每个用户看到同一篇新闻时产生的情绪倾向,当然,也可以统计看到同一篇新闻时产生某一相同情绪倾向的用户数量占看到该新闻的所有用户数量的比例,当该比例较大时,认为该新闻含有相应的情绪倾向类别,否则,认为含其它相应的情绪倾向类别。所有用户数量可以设定为一定数量,例如可以是1000人,而无需设定为某个市或者某个省的全部人口数量,否则会提高计算时间,降低效率。
本发明中,新闻的情绪倾向类别可以分为现实生活中比较常见的积极情绪类别和消极情绪类别两种,当然,还可以是其它的情绪倾向,比如中立或者抵制等,本发明在此不做严格限定。本发明以下内容以积极和消极两种情绪类别进行说明。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
参考图1,示出了本发明一种基于特征子空间的新闻分类方法实施例1的流程图。本发明中,将最开始就已知情绪倾向类别的样本称为已标注样本,反之,最开始未知情绪倾向类别的样本称为未标注样本,基于此,该方法具体可以包括如下步骤:
步骤S100、将已标注样本的整个特征空间随机划分为若干个不相交的特征子空间,并对若干个不相交的特征子空间中各个特征子空间进行训练,得到与各个特征子空间对应的子分类器;
其中,已标注样本的特征空间包括已获知情绪倾向类别的新闻文本所包含的所有特征。
具体地,从已获知情绪倾向类别的新闻中,将所包含的所有特征随机分成多个不相关的特征集,特征集的维数相同。
进一步地,利用机器学习分类算法对若干个不相交的特征子空间中各个特征子空间进行训练,得到与各个特征子空间对应的子分类器。进一步地,机器学习分类算法为朴素贝叶斯分类算法。朴素贝叶斯分类方法是基于贝叶斯定理和特征条件独立假设的分类方法。基于此,以下步骤S101中利用训练得到的子分类器对未标注样本进行分类,得到未标注样本的情绪倾向类别的具体实现内容,可参照后文针对步骤S200的叙述。
步骤S101、利用训练得到的子分类器对未标注样本进行分类,得到未标注样本的情绪倾向类别,并将已知情绪倾向类别的未标注样本更新至标注样本集中,实现对标注样本集中已标注样本的自动扩充;
具体地,在步骤S102构建最终的情绪倾向分类器之前,需要在步骤S101中使用预先采集的少量已标注样本实现对大量未标注样本的自动标注,即使用基于已标注样本的特征子空间训练得到的各个子分类器来对未标注样本进行分类、标注及更新。其中,采集的新闻数量也可以预先设定,即采用预设数量的新闻,已获知情绪倾向类别的预设数量要远少于未获知情绪倾向类别的新闻预设数量,例如已获知情绪倾向类别的新闻数量可以是10,未获知情绪倾向类别的新闻数量可以是800。在本实施例中预设数量可以依据不同应用场景设定不同取值,对此本实施例不加以限制。
其中,自动标注是基于随机特征子空间的半监督分类方法实现的,用于判定大量未标注新闻中含有某种情绪的倾向。需要说明的是,自动标注的过程是一个迭代过程,迭代结束的条件是所有未获知情绪倾向类别的样本(即未标注样本)全部加入到标注样本集中。需要注意的是,每次迭代时,在构建整个特征空间时,已获知情绪倾向类别的新闻,不仅包括预设数量的已获知情绪倾向类别的新闻,还包括挑选出用于更新标注样本集的新闻。
进一步地,本发明中,将情绪倾向类别对应的置信度最高的未标注样本更新至标注样本集中,迭代上述更新过程直至所有未标注样本更新至标注样本集中。更进一步地,将相同数量的积极情绪类别的未标注样本和消极情绪类别的未标注样本更新至标注样本集中。
步骤S102、利用标注样本集构建情绪倾向分类器,并利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到待分类新闻的情绪倾向类别。
在发明中,使用少量已标注样本对大量未标注样本进行自动标注,更新已标注样本,实现对已标注样本的自动扩充,得到最终的标注样本集,构建情绪倾向分类器。使用构建的情绪倾向分类器对待分类新闻进行情绪倾向判定分类,得到待分类新闻含有的情绪倾向类别。由于情绪倾向判定是指判定待分类新闻是否含有用户看到待分类新闻时产生的情绪倾向,判定结果表明待分类新闻含有的情绪倾向,所以使用判定结果,即可以得到待分类新闻含有的情绪倾向类别。当获知待分类新闻含有的情绪倾向类别后,可以将待分类新闻划分到其含有的情绪倾向类别对应的新闻中,实现了基于情绪倾向性对新闻进行分类的目的,从而提高了用户浏览新闻时的用户体验度。
当然,在得到待分类新闻的情绪倾向类别后,还可以依据情绪倾向类别将待分类新闻划分至不同情绪倾向类别的数据库中。此外,用户在看新闻时,还可以将划分到数据库中的待分类新闻推荐给用户,其中,在推荐新闻时,可以根据用户选择的情绪倾向类别进行推荐。
在实际应用中,用户选择的情绪倾向类别可以是用户通过点击遥控器中的“情绪倾向”按钮时,“情绪倾向”按钮所对应的情绪倾向类别。
参考图2,示出了本发明一种基于特征子空间的新闻分类方法实施例2的流程图,具体地,在步骤S102中,基于朴素贝叶斯分类算法,利用标注样本集构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到待分类新闻的情绪倾向类别,具体内容如下:
步骤S200、利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到分类结果;
其中,在朴素贝叶斯分类算法下,情绪倾向分类器的分类结果包括与任一情绪倾向类别对应的后验概率,也即,对任一待分类新闻进行分类的情绪倾向分类器都会产生两个情绪倾向类别对应的后验概率,并且与任一情绪倾向类别对应的后验概率表示待分类新闻含有该情绪倾向类别的后验概率。比如,上述两个情绪倾向类别包括“积极”情绪倾向类别和“消极”情绪倾向类别,“积极”情绪对应的后验概率是待分类新闻含有“积极”情绪倾向类别的后验概率,“消极”情绪对应的后验概率则是待分类新闻含有“消极”情绪倾向类别的后验概率。
具体地,第i(i=1,2)种情绪倾向类别对应的后验概率可以标记为P(ci|D),其表示待分类新闻中含有ci情绪倾向类别的后验概率。
其中,第i种情绪倾向类别对应的后验概率P(ci|D)的计算公式是:
P(ci|D)=P(ci)[∏P(tki)];
其中,ci表示情绪倾向类别;P(ci)为确定的新闻文本中,情绪倾向类别ci出现的先验概率;P(tki)为待确定新闻文本中,特征词集合中的特征词k出现在情绪倾向类别ci中的概率;∏P(tki)为各个P(tki)的乘积。
将待分类新闻对应的两种情绪倾向类别对应的后验概率计算出来,即可得到每一情绪倾向类别对应的最终的后验概率,也即得到最终的分类结果。
步骤S201、判断积极情绪类别对应的后验概率是否大于消极情绪类别对应的后验概率,如果是,则进入步骤S202,否则,进入步骤S203;
具体的,上述两个情绪倾向类别包括“积极”情绪倾向类别和“消极”情绪倾向类别,将“积极”情绪倾向类别确认为第一情绪倾向类别,将“消极”情绪倾向类别确认为第二情绪倾向类别,分类结果采用Emotion[i]=P(ci|D)表示,Emotion[i]的值为最大时,表明待分类新闻含有第i种情绪倾向类别。
步骤S202、判定待分类新闻的情绪倾向类别为积极情绪类别;
步骤S203、判定待分类新闻的情绪倾向类别为消极情绪类别。
与上述本发明一种基于特征子空间的新闻分类方法实施例1相对应,本发明还提供了一种基于特征子空间的新闻分类系统实施例1,参考图3,该系统300可以包括如下内容:
子分类器确定单元301,用于将已标注样本的整个特征空间划分为若干个不相交的特征子空间,并对若干个不相交的特征子空间中各个特征子空间进行训练,得到与各个特征子空间对应的子分类器;其中,已标注样本为已知情绪倾向类别的样本;
标注样本集更新单元302,用于利用训练得到的子分类器对未标注样本进行分类,得到未标注样本的情绪倾向类别,并将已知情绪倾向类别的未标注样本更新至标注样本集中;
分类单元303,用于利用标注样本集构建情绪倾向分类器,并利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到待分类新闻的情绪倾向类别;
其中,情绪倾向类别包括积极情绪类别和消极情绪类别。
为了验测本发明提供的基于特征子空间的新闻分类方法在新闻分类上的有效性,本发明使用一定量的已标注样本、未标注样本和测试样本进行训练和测试,其中特征子空间个数设置为4,每次迭代中每个子分类器挑选出两种情绪倾向类别各2个样本。情绪倾向类别有两种,分别为:积极、消极。实验中使用的样本是已经标注过的含有情绪倾向标签的新闻样本,实验所用的已标注正负类样本各10篇,未标注正负类样本各800篇,用于测试的正负类样本各200篇,整个实验过程中保持不变。
本发明采用准确率(Acc.),精确率(Pre.)、召回率(Rec.)和F值(F_s)四个评价标准进行评价,四个评价标准计算公式如下:
A c c . = A + D A + B + C + D
Pr e . = A A + B
Re c . = A A + C
F _ s = 2 * Re c . * Pr e . Re c . + Pr e .
其中,A表示正确地分配到该类别的文本数;B表示不正确地分配到该类别的文本数;C表示被该类别不正确拒绝的文本数;D表示正确地分配到其他类别的文本数。
表1为进行分类后采用上述四种评价标准得到的测试效果,其中分类方法采用了两种:正负各10个样本的全监督方法、基于随机特征子空间的半监督分类方法。
表1
Acc. Pre. Rec. F_s
全监督分类 0.775 0.781 0.77 0.7755
半监督分类 0.8875 0.8918 0.879 0.8854
从表1所示的数据可以看出,本发明提供的基于特征子空间的新闻分类方法能够取得不错的效果,准确率达到0.88左右。而且使用正负各10个样本进行全监督分类得到的结果好,这为使用较少已标注样本进行新闻推荐提供了有效的依据,减少了大量的人力、物力和财力。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统类实施例而言,由于其与方法实施例基本相似,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
以上对本发明所提供的一种基于特征子空间的新闻分类方法及系统进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (7)

1.一种基于特征子空间的新闻分类方法,其特征在于,包括:
将已标注样本的整个特征空间划分为若干个不相交的特征子空间,并对若干个不相交的特征子空间中各个特征子空间进行训练,得到与所述各个特征子空间对应的子分类器;其中,所述已标注样本为已知情绪倾向类别的样本;
利用训练得到的子分类器对未标注样本进行分类,得到所述未标注样本的情绪倾向类别,并将已知情绪倾向类别的所述未标注样本更新至标注样本集中;
利用所述标注样本集构建情绪倾向分类器,并利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到所述待分类新闻的情绪倾向类别;
其中,所述情绪倾向类别包括积极情绪类别和消极情绪类别。
2.如权利要求1所述的方法,其特征在于,所述将已知情绪倾向类别的所述未标注样本更新至标注样本集中,包括:
将情绪倾向类别对应的置信度最高的所述未标注样本更新至所述标注样本集中,迭代上述更新过程直至所有所述未标注样本更新至所述标注样本集中。
3.如权利要求2所述的方法,其特征在于,将相同数量的积极情绪类别的所述未标注样本和消极情绪类别的所述未标注样本更新至所述标注样本集中。
4.如权利要求1所述的方法,其特征在于,利用机器学习分类算法对所述若干个不相交的特征子空间中各个特征子空间进行训练,得到与所述各个特征子空间对应的子分类器。
5.如权利要求4所述的方法,其特征在于,所述机器学习分类算法为朴素贝叶斯分类算法。
6.如权利要求1至5任意一项所述的方法,其特征在于,所述利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到所述待分类新闻的情绪倾向类别,包括:
利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到分类结果;其中,所述分类结果包括与任一情绪倾向类别对应的后验概率,所述与任一情绪倾向类别对应的后验概率表示所述待分类新闻含有该情绪倾向类别的后验概率;
判断所述积极情绪类别对应的后验概率是否大于所述消极情绪类别对应的后验概率,如果是,则判定所述待分类新闻的情绪倾向类别为积极情绪类别,否则,判定所述待分类新闻的情绪倾向类别为消极情绪类别。
7.一种基于特征子空间的新闻分类系统,其特征在于,包括:
子分类器确定单元,用于将已标注样本的整个特征空间划分为若干个不相交的特征子空间,并对所述若干个不相交的特征子空间中各个特征子空间进行训练,得到与所述各个特征子空间对应的子分类器;其中,所述已标注样本为已知情绪倾向类别的样本;
标注样本集更新单元,用于利用训练得到的子分类器对未标注样本进行分类,得到所述未标注样本的情绪倾向类别,并将已知情绪倾向类别的所述未标注样本更新至标注样本集中;
分类单元,用于利用所述标注样本集构建情绪倾向分类器,并利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到所述待分类新闻的情绪倾向类别;
其中,所述情绪倾向类别包括积极情绪类别和消极情绪类别。
CN201510530700.6A 2015-08-26 2015-08-26 一种基于特征子空间的新闻分类方法及系统 Pending CN105022845A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510530700.6A CN105022845A (zh) 2015-08-26 2015-08-26 一种基于特征子空间的新闻分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510530700.6A CN105022845A (zh) 2015-08-26 2015-08-26 一种基于特征子空间的新闻分类方法及系统

Publications (1)

Publication Number Publication Date
CN105022845A true CN105022845A (zh) 2015-11-04

Family

ID=54412814

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510530700.6A Pending CN105022845A (zh) 2015-08-26 2015-08-26 一种基于特征子空间的新闻分类方法及系统

Country Status (1)

Country Link
CN (1) CN105022845A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126751A (zh) * 2016-08-18 2016-11-16 苏州大学 一种具有时间适应性的分类方法及装置
CN107103171A (zh) * 2016-02-19 2017-08-29 阿里巴巴集团控股有限公司 机器学习模型的建模方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504150A (zh) * 2015-01-09 2015-04-08 成都布林特信息技术有限公司 新闻舆情监测系统
CN104731812A (zh) * 2013-12-23 2015-06-24 北京华易互动科技有限公司 一种基于文本情感倾向识别的舆情检测方法
CN104794241A (zh) * 2015-05-11 2015-07-22 苏州大学 一种基于情绪倾向性的新闻分类方法及系统
US20150205864A1 (en) * 2013-03-14 2015-07-23 Aperture Investments, Llc Music selection and organization using audio fingerprints

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150205864A1 (en) * 2013-03-14 2015-07-23 Aperture Investments, Llc Music selection and organization using audio fingerprints
CN104731812A (zh) * 2013-12-23 2015-06-24 北京华易互动科技有限公司 一种基于文本情感倾向识别的舆情检测方法
CN104504150A (zh) * 2015-01-09 2015-04-08 成都布林特信息技术有限公司 新闻舆情监测系统
CN104794241A (zh) * 2015-05-11 2015-07-22 苏州大学 一种基于情绪倾向性的新闻分类方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谭琨: "《高光谱遥感影像半监督分类研究》", 1 January 2014, 中国矿业大学出版社 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107103171A (zh) * 2016-02-19 2017-08-29 阿里巴巴集团控股有限公司 机器学习模型的建模方法及装置
CN107103171B (zh) * 2016-02-19 2020-09-25 阿里巴巴集团控股有限公司 机器学习模型的建模方法及装置
CN106126751A (zh) * 2016-08-18 2016-11-16 苏州大学 一种具有时间适应性的分类方法及装置

Similar Documents

Publication Publication Date Title
CN108234463B (zh) 一种基于多维行为模型的用户风险评估与分析方法
CN105138624B (zh) 一种基于在线课程用户数据的个性化推荐方法
Kardan et al. A Framework for Capturing Distinguishing User Interaction Behaviors in Novel Interfaces.
CN107656948A (zh) 自动问答系统中的问题聚类处理方法及装置
CN104536953B (zh) 一种文本情绪极性的识别方法及装置
CN105373606A (zh) 一种改进c4.5决策树算法下的不平衡数据抽样方法
CN106445919A (zh) 一种情感分类方法及装置
CN107545038B (zh) 一种文本分类方法与设备
CN106815192A (zh) 模型训练方法及装置和语句情感识别方法及装置
CN112819023A (zh) 样本集的获取方法、装置、计算机设备和存储介质
CN103473317A (zh) 提取关键词的方法和设备
CN104794241A (zh) 一种基于情绪倾向性的新闻分类方法及系统
CN110472057B (zh) 话题标签的生成方法及装置
CN103324758B (zh) 一种新闻分类方法和系统
CN104834918A (zh) 一种基于高斯过程分类器的人体行为识别方法
CN104572982A (zh) 基于问题引导的个性化推荐方法及系统
CN110728543A (zh) 异常账号的识别方法及装置
CN110347701A (zh) 一种面向实体检索查询的目标类型标识方法
CN104809104A (zh) 一种微博文本情绪识别方法及系统
CN108090040A (zh) 一种文本信息分类方法及系统
CN112348417A (zh) 一种基于主成分分析算法的营销价值评估方法及装置
CN103268346A (zh) 半监督分类方法及系统
CN108197337A (zh) 一种文本分类方法及装置
CN103218419B (zh) 网络标签聚类方法和系统
Ghanem et al. Agents of influence in social networks.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151104

RJ01 Rejection of invention patent application after publication