CN105718444B - 基于新闻语料的金融概念对应股票关联方法及其装置 - Google Patents

基于新闻语料的金融概念对应股票关联方法及其装置 Download PDF

Info

Publication number
CN105718444B
CN105718444B CN201610051993.4A CN201610051993A CN105718444B CN 105718444 B CN105718444 B CN 105718444B CN 201610051993 A CN201610051993 A CN 201610051993A CN 105718444 B CN105718444 B CN 105718444B
Authority
CN
China
Prior art keywords
stock
association
financial
degree
concept
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610051993.4A
Other languages
English (en)
Other versions
CN105718444A (zh
Inventor
陈发君
黄金才
刘忠
程光权
朱承
修保新
陈超
冯旸赫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN201610051993.4A priority Critical patent/CN105718444B/zh
Publication of CN105718444A publication Critical patent/CN105718444A/zh
Application granted granted Critical
Publication of CN105718444B publication Critical patent/CN105718444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明提供一种基于新闻语料的金融概念对应股票关联方法,该方法以爬取的互联网上财经新闻或社交论坛获的文章为语料,通过统计语料中关键词的出现频次,动态建立金融概念与个股之间的关联关系,作为决策资讯提供给投资者。

Description

基于新闻语料的金融概念对应股票关联方法及其装置
技术领域
本发明涉及基于海量文本的实体关联分析方法,尤其涉及一种基于新闻语料的金融概念对应股票关联方法及其装置。
背景技术
目前,社会上出现热点事件时,人们通常会形成一套对热点事件的固定用词,比如,柴静拍摄的纪录片《穹顶之下》在网络上播出后,“柴静”、“穹顶之下”就成为该事件的相关热点词。通常股票容易受到社会突发事件的影响,使其股价发生波动,此类与热点事件相关的个股常称为概念成分股。
现有主要通过行业分析师撰写相关领域股票的分析文章,以获得热点词与概念成分股之间的关联。但人工分析存在以下问题,一是存在主观因素,不同分析师针对同一热点事件,给出的概念成分股难以完全一致;二是金融概念涉及社会生产的方方面面,热点事件对应的概念不断涌现,人工分析要想实现全面掌握,工作量巨大。
发明内容
本发明的目的在于提供一种基于新闻语料的金融概念对应股票关联方法及其装置,该发明解决了现有技术中依靠人工获取与某一金融概念相关的股票时,工作量巨大,准确性一致性较差的技术问题。
本发明提供一种基于新闻语料的金融概念对应股票关联方法,包括:步骤S100:对经过清洗的新闻语料进行分词,得到分词文档;步骤S200:获取分词文档的子句中金融概念Ci词的出现频次count(Ci)、股票Aj词的出现频次count(Aj)以及金融概念Ci词和股票Aj词同时出现的频次count(Ci,Aj),其中i为任一金融概念,j为任一股票;步骤S300:按式一计算得到金融概念Ci和股票Aj的共现关联度Dij 式一。
进一步地,新闻语料为从新闻网站财经频道获取的最近一个月内的财经新闻语料。
进一步地,子句通过以下步骤获得:步骤S210:依据句尾终结符对文档进行分句,得到分句文档;步骤S220:依据句中分隔符将分句文档的句子分为多个子句。
进一步地,S300还包括以下步骤:步骤S310:按式二计算对金融概念Ci归一化其与股票Aj的第一归一关联度
式二
其中Dij为共现关联度,maxk Dik为股票库k与金融概念Ci的最大关联度值;
按式三计算对股票Aj归一化其与金融概念Ci的第二归一关联度
式三
其中Dij为共现关联度,maxl Dlj为金融概念库l与股票Aj的最大关联度值;
按式四计算金融概念与股票之间的对称关联度
式四
其中为第一归一关联度,为第二归一关联度;
步骤S320:判断对称关联度,当其大于0.8时,股票为金融概念的概念成分股。
本发明另一方面还提供了一种如上述的基于新闻语料的金融概念对应股票关联方法用装置,包括:分词模块:用于对经过清洗的新闻语料进行分词,得到分词文档;概率统计模块:用于获取分词文档的子句中金融概念Ci词的出现频次count(Ci)、股票Aj词的出现频次count(Aj)以及金融概念Ci词和股票Aj词同时出现的频次count(Ci,Aj),其中i为任一金融概念,j为任一股票;关联度计算模块:用于按式一计算金融概念Ci和股票Aj的共现关联度Dij
式一。
进一步地,概率统计模块还包括:分句模块:用于依据句尾终结符对文档进行分句,得到分句文档;子句模块:用于依据句中分隔符将分句文档的句子分为多个子句。
进一步地,关联度计算模块还包括:金融概念归一化模块:用于按式二计算对金融概念Ci归一化其与股票Aj的第一归一关联度
式二
其中Dij为共现关联度,maxk Dik为股票库k与金融概念Ci的最大关联度值;
股票归一化模块:用于按式三计算对股票Aj归一化其与金融概念Ci的第二归一关联度
式三
其中Dij为共现关联度,maxk Dlj为金融概念库l与股票Aj的最大关联度值;
对称关联模块:用于按式四计算金融概念与股票之间的对称关联度
式四
其中为第一归一关联度,为第二归一关联度;
判断模块:用于判断对称关联度,当对称关联度大于0.8时,股票为金融概念的概念成分股。
本发明的技术效果:
本发明提供的基于新闻语料的金融概念对应股票关联方法通过从各大新闻网站的财经频道,获取近期发表的海量财经新闻语料,对新闻语料中出现的金融概念词和具体个股出现的频率进行统计,并计算二者的共现关联度,从而得到了新闻语料中近期出现的金融概念与具体股票的关联度。通过对其进行判断,可以根据金融概念获得具体个股是否为其概念成分股。从而为投资提供有实际意义的参考信息。减少人工筛选的劳动强度,提高个股与金融概念之间的关联度准确性。
本发明提供的基于新闻语料的金融概念对应股票关联装置用于在金融数据分析中,建立金融概念与个股之间的关联关系,构造概念成分股。能够帮助金融投资者建立热点概念与个股之间的关联,给投资者提供投资决策资讯。
具体请参考根据本发明的基于新闻语料的金融概念对应股票关联方法提出的各种实施例的如下描述,将使得本发明的上述和其他方面显而易见。
附图说明
图1是本发明优选实施例基于新闻语料的金融概念对应股票关联方法的流程示意图;
图2是本发明优选实施例基于新闻语料的金融概念对应股票关联装置的结构示意图。
具体实施方式
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
本文中金融概念是指在新闻语料中针对近期关注度较高的热点事件,形成专有固定用词。比如,国家提出“一带一路”战略构想后,“一带一路”即为金融概念。金融概念和具体股票之间的关联度会随着时间会动态变化。原因有:①公司主营业务变更;②概念内涵具有时代特征,会变化;③公司产品与概念因为新技术等原因产生关联关系变更。由此可知,金融概念与个股之间的关联度需要进行实时更新。
参见图1,本发明提供了一种基于新闻语料的金融概念对应股票关联方法,包括:
步骤S100:对经过清洗的新闻语料进行分词,得到分词文档;
步骤S200:获取分词文档的子句中金融概念Ci词的出现频次count(Ci)、股票Aj词的出现频次count(Aj)以及金融概念Ci词和股票Aj词同时出现的频次count(Ci,Aj),其中i为任一金融概念,j为任一股票;
步骤S300:按式一计算得到金融概念Ci和股票Aj的共现关联度Dij
式一。
所得结果可以用于确定股票Ai为金融概念Ci的概念成分股的几率大小。共现关联度越大则股票Ai为金融概念Ci的概念成分股的几率越大。
通过上述步骤,可以得到新闻语料中出现的金融概念与具体股票同时出现的几率,从而确定使得选股时有更具体的参考,该过程简单,能有效节省人力。所得结果统一度较高。同时对新闻语料分词后,能提高所得结果的准确性。此处的股票的出现频次是指统计句子中出现的该股票的全称、简称或股票代码等的出现次数。金融概念的出现频次是指统计具体金融概念词出现的次数
优选的,清洗可以为对超过5个连续空格用句号替换;“\r\n”或“\n”用句号替换;删除所有html标签和剩余的空白字符;文档末尾如果不是句号,添加句号。对新闻语料按此进行清洗能耐剔除与实际语料内容无关的符号,并保持语料中句子完整。提高后续统计的准确性。
优选的,新闻语料为从新闻网站财经频道获取的最近一个月内的财经新闻语料。具体是指,从获取关联度之日起前推1个月内的相关新闻语料。采用该时间段内的新闻语料,能保证所得结果的时效性,以防止所得结果发生改变,而无法指导股票的选择。
优选的,子句通过以下步骤获得:
步骤S210:依据句尾终结符对文档进行分句,得到分句文档;
步骤S220:依据句中分隔符将分句文档的句子分为多个子句。
具体为依据句尾终结符(如句号、感叹号、问号、冒号等)对已经分为多个单独词的分词文档进行分句。以获得具有单独完整意思的句子。然后依据句内分隔符(如逗号、顿号等)把分句文档的同一句中的词分成子句。该子句为一个完整句子的一部分。采用上述方法可以提高对语料中相关词的统计结果准确性,降低漏词的几率。
优选的,S300还包括以下步骤:
步骤S310:按式二计算对金融概念Ci归一化其与股票Aj的第一归一关联度
式二
其中Dij为共现关联度,maxk Dik为股票库k与金融概念Ci的最大关联度值;
按式三计算对股票Aj归一化其与金融概念Ci的第二归一关联度
式三
其中Dij为共现关联度,maxl Dlj为金融概念库l与股票Aj的最大关联度值;
按式四计算金融概念与股票之间的对称关联度
式四
其中为第一归一关联度,为第二归一关联度;
步骤S320:判断对称关联度,当其大于0.8时,股票为金融概念的概念成分股。
此处的金融概念库是指包含多个金融概念词的数据库,该库可以为购买得到,也可以为人工筛选后得到的。股票库为由多个个股相关关键信息组成的数据库,该库可以为购买得到,也可以为人工筛选后得到的。关键信息可以为股票的代码、简称或全称。通过对所得统计结果进行归一化处理,能使所得对称关联度的取值范围为[0,1]的区间。提高所得结果的可分析性,方便其用于指导具体个股的选择。同时所得对称关联度值还具有对称性,保证从金融概念出发找相关个股,与从个股出发找相关概念得到一致的结论。因为基于金融概念构造概念成分股是基于某个关联度阈值,如果关联度不具有对称性,可能会得出从概念出发找成分股时存在某个股票,但是从股票出发找相关概念却不存在对应概念的情形。
所得结果能直接用于对概念成分股的选取,当对称关联度大于0.8时,股票为金融概念的概念成分股。如果股票Aj与金融概念Ci的对称关联度越大,即越接近1,那么该股票与该金融概念相关性越强,当对称关联度大于0.8时,建议把该股票作为概念的成分股作为投资参考。另一方面,如果把个股作为投资决策起点,那么该关联度可以清晰地展现给投资者股票的概念属性由哪些金融概念组成,当关联度大于0.8时,股票与该金融概念为强相关。此外,量化投资者可以把该关联度作为投资权重,加入到量化投资模型中进行投资决策分析。
参见图2,本发明的另一方面还提供了一种上述方法用的基于新闻语料的金融概念对应股票关联装置包括:
分词模块100:用于对经过清洗的新闻语料进行分词,得到分词文档;
概率统计模块200:用于获取分词文档的子句中金融概念Ci词的出现频次count(Ci)、股票Aj词的出现频次count(Aj)以及金融概念Ci词和股票Aj词同时出现的频次count(Ci,Aj),其中i为任一金融概念,j为任一股票;
关联度计算模块300:用于按式一计算金融概念Ci和股票Aj的共现关联度Dij
式一。
采用该装置,能实现对新闻语料中所反映的金融概念与股票的关联性,从而简便的使投资者,能直观的获取具体可能的概念成分股,用于投资。
当然所得结果可以通过分析模块来进行分析,该分析模块:用于判断共现关联度,共现关联度越大则股票Ai为金融概念Ci的概念成分股的几率越大。
优选的,概率统计模块还包括:
分句模块:用于依据句尾终结符对文档进行分句,得到分句文档;
子句模块:用于依据句中分隔符将分句文档的句子分为多个子句。
采用该模块,能实现对新闻语料的分析和处理,提高对金融概念和个股的统计准确性。
优选的,关联度计算模块还包括:
金融概念归一化模块:用于按式二计算对金融概念Ci归一化其与股票Aj的第一归一关联度
式二
其中Dij为共现关联度,maxk Dik为股票库k与金融概念Ci的最大关联度值;
股票归一化模块:用于按式三计算对股票Aj归一化其与金融概念Ci的第二归一关联度
式三
其中Dij为共现关联度,maxl Dlj为金融概念库l与股票Aj的最大关联度值;
对称关联模块:用于按式四计算金融概念与股票之间的对称关联度
式四
其中为第一归一关联度,为第二归一关联度;
判断模块:用于判断对称关联度,当对称关联度大于0.8时,股票为金融概念的概念成分股。采用该装置能直观的得到具有金融概念与具体个股的量化关联度,从而很好的用于指导投资的进行。
本发明提供的方法和装置,具有以下优点:
1.本发明实现了计算机自动获得金融概念与个股的关联关系,极大降低了人工成本;
2.本发明集大成互联网上对金融概念与个股的关联分析,关联结果更准确客观;
3.本发明可动态更新金融概念与个股的关联关系,对投资者而言时效性更好;
4.本发明得到的概念与个股关联度取值在[0-1]区间,具有对称性,易于投资者理解。所得结果较好。
本领域技术人员将清楚本发明的范围不限制于以上讨论的示例,有可能对其进行若干改变和修改,而不脱离所附权利要求书限定的本发明的范围。尽管己经在附图和说明书中详细图示和描述了本发明,但这样的说明和描述仅是说明或示意性的,而非限制性的。本发明并不限于所公开的实施例。
通过对附图,说明书和权利要求书的研究,在实施本发明时本领域技术人员可以理解和实现所公开的实施例的变形。在权利要求书中,术语“包括”不排除其他步骤或元素,而不定冠词“一个”或“一种”不排除多个。在彼此不同的从属权利要求中引用的某些措施的事实不意味着这些措施的组合不能被有利地使用。权利要求书中的任何参考标记不构成对本发明的范围的限制。

Claims (5)

1.一种基于新闻语料的金融概念对应股票关联方法,其特征在于,包括:
步骤S100:对经过清洗的所述新闻语料进行分词,得到分词文档;
步骤S200:获取所述分词文档的子句中所述金融概念Ci词的出现频次count(Ci)、所述股票Aj词的出现频次count(Aj)以及所述金融概念Ci词和所述股票Aj词同时出现的频次count(Ci,Aj),其中i为任一所述金融概念,j为任一所述股票;
步骤S300:按式一计算得到所述金融概念Ci和所述股票Aj的共现关联度Dij
所述S300包括以下步骤:
步骤S310:按式二计算对所述金融概念Ci归一化其与所述股票Aj的第一归一关联度
其中Dij为所述共现关联度,maxkDik为股票库k与所述金融概念Ci的最大关联度值;
按式三计算对所述股票Aj归一化其与所述金融概念Ci的第二归一关联度
其中Dij为所述共现关联度,maxlDlj为金融概念库l与所述股票Aj的最大关联度值;
按式四计算所述金融概念与所述股票之间的对称关联度
其中为第一归一关联度,为第二归一关联度;
步骤S320:判断所述对称关联度,当其大于0.8时,所述股票为所述金融概念的概念成分股。
2.根据权利要求1所述的基于新闻语料的金融概念对应股票关联方法,其特征在于,所述新闻语料为从新闻网站财经频道获取的最近一个月内的财经新闻语料。
3.根据权利要求2所述的基于新闻语料的金融概念对应股票关联方法,其特征在于,所述子句通过以下步骤获得:
步骤S210:依据句尾终结符对所述文档进行分句,得到分句文档;
步骤S220:依据句中分隔符将所述分句文档的句子分为多个子句。
4.一种如权利要求1~3中任一项所述的基于新闻语料的金融概念对应股票关联方法用装置,其特征在于,包括:
分词模块:用于对经过清洗的所述新闻语料进行分词,得到分词文档;
概率统计模块:用于获取所述分词文档的子句中所述金融概念Ci词的出现频次count(Ci)、所述股票Aj词的出现频次count(Aj)以及所述金融概念Ci词和所述股票Aj词同时出现的频次count(Ci,Aj),其中i为任一所述金融概念,j为任一所述股票;
关联度计算模块:用于按式一计算所述金融概念Ci和所述股票Aj的共现关联度Dij
所述关联度计算模块还包括:
金融概念归一化模块:用于按式二计算对所述金融概念Ci归一化其与所述股票Aj的第一归一关联度
其中Dij为所述共现关联度,maxkDik为股票库k与所述金融概念Ci的最大关联度值;
股票归一化模块:用于按式三计算对所述股票Aj归一化其与所述金融概念Ci的第二归一关联度
其中Dij为所述共现关联度,maxlDlj为金融概念库l与所述股票Aj的最大关联度值;
对称关联模块:用于按式四计算所述金融概念与所述股票之间的对称关联度
其中为第一归一关联度,为第二归一关联度;
判断模块:用于判断所述对称关联度,当所述对称关联度大于0.8时,所述股票为所述金融概念的概念成分股。
5.根据权利要求4所述的基于新闻语料的金融概念对应股票关联方法用装置,其特征在于,所述概率统计模块还包括:
分句模块:用于依据句尾终结符对所述文档进行分句,得到分句文档;
子句模块:用于依据句中分隔符将所述分句文档的句子分为多个子句。
CN201610051993.4A 2016-01-26 2016-01-26 基于新闻语料的金融概念对应股票关联方法及其装置 Active CN105718444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610051993.4A CN105718444B (zh) 2016-01-26 2016-01-26 基于新闻语料的金融概念对应股票关联方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610051993.4A CN105718444B (zh) 2016-01-26 2016-01-26 基于新闻语料的金融概念对应股票关联方法及其装置

Publications (2)

Publication Number Publication Date
CN105718444A CN105718444A (zh) 2016-06-29
CN105718444B true CN105718444B (zh) 2018-05-11

Family

ID=56155051

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610051993.4A Active CN105718444B (zh) 2016-01-26 2016-01-26 基于新闻语料的金融概念对应股票关联方法及其装置

Country Status (1)

Country Link
CN (1) CN105718444B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247707B (zh) * 2017-06-27 2020-08-04 鼎富智能科技有限公司 基于补全策略的企业关联关系信息提取方法和装置
CN107392433B (zh) * 2017-06-27 2018-09-04 北京神州泰岳软件股份有限公司 一种提取企业关联关系信息的方法和装置
CN110941713B (zh) * 2018-09-21 2023-12-22 上海仪电(集团)有限公司中央研究院 基于主题模型的自优化金融资讯版块分类方法
CN113722432B (zh) * 2021-08-26 2024-01-09 杭州隆埠科技有限公司 新闻与股票的关联方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609433A (zh) * 2011-12-16 2012-07-25 北京大学 基于用户日志进行查询推荐的方法及系统
CN103778215A (zh) * 2014-01-17 2014-05-07 北京理工大学 一种基于情感分析和隐马尔科夫模型融合的股市预测方法
CN104008106A (zh) * 2013-02-25 2014-08-27 腾讯科技(深圳)有限公司 一种获取热点话题的方法及装置
CN104102723A (zh) * 2014-07-21 2014-10-15 百度在线网络技术(北京)有限公司 搜索内容提供方法和搜索引擎
CN104408102A (zh) * 2014-11-19 2015-03-11 北京国双科技有限公司 用于网络热词与对象的关联度的数据处理方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901235B (zh) * 2009-05-27 2013-03-27 国际商业机器公司 文档处理方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609433A (zh) * 2011-12-16 2012-07-25 北京大学 基于用户日志进行查询推荐的方法及系统
CN104008106A (zh) * 2013-02-25 2014-08-27 腾讯科技(深圳)有限公司 一种获取热点话题的方法及装置
CN103778215A (zh) * 2014-01-17 2014-05-07 北京理工大学 一种基于情感分析和隐马尔科夫模型融合的股市预测方法
CN104102723A (zh) * 2014-07-21 2014-10-15 百度在线网络技术(北京)有限公司 搜索内容提供方法和搜索引擎
CN104408102A (zh) * 2014-11-19 2015-03-11 北京国双科技有限公司 用于网络热词与对象的关联度的数据处理方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
结合统计和词间关系的文本关键词计算方法;石雁 等;《计算机技术与发展》;20151231;第25卷(第12期);22-27 *
词网络的新闻事件关联建模;张辉 等;《国防科技大学学报》;20140831;第36卷(第4期);169-176 *

Also Published As

Publication number Publication date
CN105718444A (zh) 2016-06-29

Similar Documents

Publication Publication Date Title
AU2017243270B2 (en) Method and device for extracting core words from commodity short text
Eren et al. Why Levallois? A morphometric comparison of experimental ‘preferential’Levallois flakes versus debitage flakes
Revathy et al. Sentiment analysis using machine learning: Progress in the machine intelligence for data science
TWI518528B (zh) Method, apparatus and system for identifying target words
CN105718444B (zh) 基于新闻语料的金融概念对应股票关联方法及其装置
CN106919689A (zh) 基于术语释义知识单元的专业领域知识图谱动态构建方法
CN104077407B (zh) 一种智能数据搜索系统及方法
CN107403017A (zh) 一种智能分析实时新闻对金融市场影响的方法
CN109947951B (zh) 一种可自动更新的用于金融文本分析的情感字典构建方法
CN110334202A (zh) 基于新闻应用软件的用户兴趣标签构建方法及相关设备
CN105138577B (zh) 一种基于大数据的事件演化分析方法
CN108335210A (zh) 一种基于舆论数据的股票异动分析方法
CN108388660A (zh) 一种改进的电商产品痛点分析方法
CN104077417A (zh) 社交网络中的人物标签推荐方法和系统
WO2016009419A1 (en) System and method for ranking news feeds
TWI828928B (zh) 高擴展性、多標籤的文本分類方法和裝置
CN109558587A (zh) 一种针对类别分布不平衡的舆论倾向性识别的分类方法
CN109213869B (zh) 基于多源数据的热点技术预测方法
CN108829806A (zh) 一种跨事件新闻文本情感分析方法
CN110110013B (zh) 一种基于时空属性的实体竞争关系数据挖掘方法
US20220222715A1 (en) System and method for detecting and analyzing discussion points from written reviews
Gao et al. Identification of Deceptive Reviews by Sentimental Analysis and Characteristics of Reviewers.
Harshvardhan et al. Topic modelling Twitterati sentiments using Latent Dirichlet allocation during demonetization
CN105787101A (zh) 一种信息处理方法和电子设备
CN110119464A (zh) 一种合同中数值的智能推荐方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant