CN104781837B - 用于通过使用基于事件的情绪分析来形成预测的系统和方法 - Google Patents

用于通过使用基于事件的情绪分析来形成预测的系统和方法 Download PDF

Info

Publication number
CN104781837B
CN104781837B CN201380043348.2A CN201380043348A CN104781837B CN 104781837 B CN104781837 B CN 104781837B CN 201380043348 A CN201380043348 A CN 201380043348A CN 104781837 B CN104781837 B CN 104781837B
Authority
CN
China
Prior art keywords
event
messages
message
index
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201380043348.2A
Other languages
English (en)
Other versions
CN104781837A (zh
Inventor
廖文慧
马苏德·马克雷奇
萨梅纳·沙哈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ma SudeMakeleiqi
Thomson Reuters Global Resources ULC
Original Assignee
Ma SudeMakeleiqi
Thomson Reuters Global Resources ULC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ma SudeMakeleiqi, Thomson Reuters Global Resources ULC filed Critical Ma SudeMakeleiqi
Publication of CN104781837A publication Critical patent/CN104781837A/zh
Application granted granted Critical
Publication of CN104781837B publication Critical patent/CN104781837B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

在实施例中,情绪分析器识别第一事件并且访问第一消息集合。所述情绪分析器使所述第一事件与所述第一集合相关联并且分析消息以识别情绪特征集合。所述情绪特征集合被用于分析第二消息集合以形成与第二事件相关联的预测。所述预测可以被用于助于事件相关的服务。

Description

用于通过使用基于事件的情绪分析来形成预测的系统和方法
相关申请的交叉引用
本申请要求下列权益:于2012年8月15日提交的美国临时申请No.61/683,375,通过引用方式将其全部内容清楚地并入本文中。本申请与在2013年3月15日提交的美国申请No.13/836,520相关联。
背景技术
公众心情和市场表现是相关联的以使得、比如当人们高兴、乐观并且处于好的心情时,他们更可能增加投资,这继而改善了证券市场表现。因而,由此得出结论,基于多种类型和程度的公众情绪,市场事件也许是可预测的。针对于影响公众情绪和/或被公众情绪所影响的多种类型的事件而言,相同的关联性也许是正确的。
发明内容
本发明的实施例基于在用户消息中被检测到的情绪(具体地、例如涉及这种情绪的单词或短语),而有助于形成与事件相关联的预测。例如,本发明的实施例涉及针对表示与事件相关联的用户心情、情感、感想而在网络上提供的挖掘消息(mining message)。已经发生的事件被识别,并且在事件发生的时间周围所产生的消息与该事件相关联。这些事件可以被限定资格为,比如盈利事件(比如利息项的值增加了)或者亏损事件(该项的值减少了)。因此,发生在盈利事件的发生时间的周围处的消息可以被自动认为是表示积极情绪,并且相同的概念可以被施加到亏损事件和相关联的消息。
基于本发明的实施例的获得,这些消息可以被分析为识别可以被存储在动态词典中的情绪特征集合(比如,典型地针对盈利事件的“万岁”、“太棒了”)。这个动态词典可以随后被用于识别后续接收到的消息中的情绪,并且因此可以被用于形成与事件相关联的预测。这些预测可以被用于提供诸如、例如有价证券交易策略和建议的事件相关的服务。
具体地,本发明的一些实施例包括用于形成与事件相关联的预测的方法。在实施例中,该方法包括:访问来自事件信息源的事件信息并且基于事件标准和事件信息来识别第一事件。从消息源来访问第一消息集合,并且第一消息集合与第一事件相关联。实施例还包括基于第一事件来分析所述第一消息集合以识别情绪特征集合。所述情绪特征集合可以包括表示与所述第一事件相关联的用户情绪的至少一个文本特征。所述情绪特征的集合可以被存储在计算机存储器的动态词典中。方法的实施例还包括访问来自所述消息源的第二消息集合,并且基于所述情绪特征集合来分析所述第二消息集合以形成与第二事件相关联的预测。所述预测被存储在存储器中。
本发明的实施例包括括用于形成与事件相关联的预测的另一方法。该方法的实施例包括:访问来自消息源的消息集合并且访问存储在计算机存储器中的动态词典。所述动态词典可以包括情绪特征集合。所述情绪特征集合可以包括表示与第一事件相关联的用户情绪的至少一个文本特征。方法的实施例还包括基于所述情绪特征集合来分析所述消息集合以形成与第二事件相关联的预测并且将所述预测存储在计算机存储器中。
在实施例中,用于形成与事件相关联的预测的系统包括服务器,所述服务器构造为从消息源接收由消息用户产生的消息。所述服务器包括实例化存储在存储器中的多个软件组件。在实施例中,所述软件组件包括构造为基于第一事件分析第一消息集合来识别情绪特征集合。所述情绪分析器还可以被构造为分析第二消息集合以形成与第二事件相关联的预测。在实施例中,所述系统还包括服务组件,其构造为基于所述预测而助于事件相关的服务。
附图说明
图1是说明根据本发明实施例的操作环境(以及,在一些实施例中,本发明的方面)的框图;
图2是描述了根据本发明实施例的在图1中示出的服务器的组件的框图;
图3是描述了根据本发明实施例的形成与事件相关联的预测的示例性方法的流程图;
图4是描述了根据本发明实施例的利用监督分类器来形成与事件相关联的预测的示例性方法的另一流程图;
虽然本发明可服从于多种修改和可替换形式,但借由附图中的事例已经显示了具体实施例并且具体实施例在以下被详细地阐述。然而,本发明并非试图限制描述的特定实施例。相反,本发明试图覆盖落入由所附权利要求限定的本发明的保护范围的所有修改、等同实施例以及可选实施例。
虽然术语“块”可以被用于此以意味着所使用的示例性方法的不同元件,但是除非以及除了当清楚地参考各个步骤的顺序之外,否则该术语不应该被解释为隐含此处所描述的各个步骤中或步骤之间的特定顺序或步骤的任意要求。
具体实施方式
通信平台的用户经常会产生关于诸如、例如股票价格变化、体育赛事和赛马的结果、零售产品或娱乐(比如电影)的成功或质量等的事件的消息。由用户产生的一些消息包括可以建议表示总的心情、乐观、悲观、和感想等情绪的文本。用户经常通过诸如、例如社交媒体消息、电子邮件、短信服务(SMS)消息、博客帖子(blog post)、互联网公开的文章等任意数量的多个类型的消息来使参考与这种事件相关联。根据实施例,这些消息可以被分析以形成与事件相关联的预测。
与事件相关联的预测可以包括、例如事件的发生预测、事件发生的时间的预测或关于事件的结果或影响的预测等。本发明的实施例可以被实施为形成与任意类型事件相关联的预测,其中该任意类型事件包括诸如、例如股票价格变动、石油价格变动、收入通告、其他宏观经济事件、零售产品成功、票房成功等的可量化的度量。这些预测可以例如有助于对应于将来事件的动作的策略和/或过程的发展。例如,特定股票价格不久将显著上升的预测对于有助于在上升之前准备买股票是有用的。预测可以被用于向消费者提供建议以产生事件相关的产品等。
虽然术语“事件”可以涉及包含可量化的度量的任意类型的事件,但股票价格波动(比如在有价证券市场交易的公司股票在价格上的增加或减少)的特定示例将被用于贯穿本公开以阐明本发明实施例的多种方面。在其他类型事件的场所中,参考股票价格的变化并不意味着暗示术语“事件”的保护范围的任何限制,而是仅用于清楚的目的。
在有价证券(securities)示例的情景中,本发明的实施例涉及监视股票(或一组股票)的表现从而帮助建立还包括事件信息和用户消息的训练数据。训练数据可以被用于对应于股票(或一组股票)在价格上的增加或减少的情绪的监督式学习。分类器或其他模型可以被用于发展情绪特征的动态词典,当后续消息的情绪被接收到的时候,动态词典可以被用于识别后续消息的情绪。可以基于被识别到的情绪的聚集来确定情绪分数,并且情绪分数可以被用于形成与将来的股票表现相关联的预测。
图1描述了根据本发明实施例的操作环境100(以及,在一些实施例中,本发明的多个方面)的示例。图1所示,操作环境100包括通过网络104从消息源106访问消息的服务器102。网络104可以为或者包括任意数量不同类型的诸如、例如短信服务、局域网(LAN)、广域网(WAN)或互联网等通信网络。消息源106可以包括、例如互联网、电子邮件提供商、社交媒体平台或网页等。根据实施例,服务器102实施使用被访问的消息来形成与事件相关联的预测的情绪分析器108。
情绪分析器108可以利用从事件信息源110获取的事件信息来限定事件标准、识别事件或开发训练数据等。事件信息源110可以包括、例如新闻提供商、统计表提供商、市场数据提供商或公司网站等。服务器102可以比如、例如通过利用服务组件112使用预测来助于任意数量的事件相关的服务,其中,服务的消费者可以利用访问装置114来访问服务组件112。
如图1所示,服务器102可以被实施在包括处理器116和存储器118的计算装置上。情绪分析器108可以被存储在存储器118中。在实施例中,处理器116使情绪分析器108执行,这可以有助于分析事件信息和消息以发展预测模型。如上所示的,这些消息可以包括由消息用户通过网络104提供的任意数量不同类型的通信,诸如、例如社交媒体消息、电子邮件、短信服务消息、博客帖子(blog post)、互联网公开的文章等。社交媒体消息可以包括由用户通过社交媒体平台提供的任意数量不同类型的通信(比如微文本)。社交媒体平台可以包括例如、能够使用户与其他用户和用户组分享信息(例如通过虚拟社区和网络)的平台以及包括诸如
Figure BDA0000673088260000041
以及
Figure BDA0000673088260000042
等的平台。社交媒体信息可以包括,例如“喜欢”、涂鸦、“跟随”推文、回推、回答等。
仍然参考图1,服务器102包括从事件信息源110获取、复制、或者另外地访问事件信息的事件信息取回器(retriever)120以及从消息源106获取、复制、或者另外地访问消息的消息取回器122。事件信息取回器120可以存储内容、部分内容,和/或从存储器118中的内容提取的信息,并且可以例如通过使用数据库124来索引内容。相似地,消息取回器122可以存储消息、部分消息、和/或从存储器118中的消息提取的信息,并且可以例如通过使用数据库124来索引消息。可以指代一个或多个数据库的数据库124可以为或者包括一个或多个表格、一个或多个相关数据库或一个或多个多维数据立方体等。此外,虽然被说明为实施在存储器118中的单一组件,但实际上,数据库124可以为多个数据库124、比如数据库簇,其可以被实施在单一计算装置上或者分布在多个计算装置或存储器组件之间等。
在操作中,情绪分析器108访问事件信息(比如通过存储器118或者事件信息取回器120),并且,通过使用事件信息来基于事件标准识别事件。此处所使用的术语“基于”并不意味着是限制性的,而是表示通过至少使用跟随“基于”的术语作为输入来执行确定、识别、预测或计算等。例如,基于特定事件标准来识别事件的情绪分析器108还可以基于另一事件标准而识别。
已经识别到了事件,情绪分析器108访问消息集合(比如从存储器118或消息取回器122)并且该消息集合与事件相关联。在实施例中,根据对消息执行的搜索查询,情绪分析器108访问消息并且使消息与事件相关联,其在特定时段期间发起,该特定时段比如事件发生之前的、事件发生之后的、和/或事件发生期间的时段(例如一天)。在实施例中,事件信息取回器120和/或消息取回器122可以包括搜索功能(例如应用程序界面(API)和/或搜索引擎等)或与搜索功能相互作用。例如,可以通过使用
Figure BDA0000673088260000051
搜索API来访问推文。在有价证券示例中,例如,包括多个术语的查询可以被开发,这些术语可以被用于指代
Figure BDA0000673088260000052
上的具体公司。例如,对于
Figure BDA0000673088260000053
公司而言,搜索查询可以包括“苹果公司”、“苹果”、“AAPL”、“#AAPL”以及“$AAPL”,并且包括这些术语的推文将与事件相关联,虽然该查询也许不保证返回所有相关的推文,但由于消息和情绪的聚集,因此一些数量的噪声可以是可容忍的。
根据实施例,情绪分析器108发展以及保持动态词典,该词典包括一个或多个集合(比如向量)的诸如情绪特征的特征。情绪特征可以包括例如、表达与事件相关联的用户情绪(比如表示心情、感觉、情感、感想)的文本特征、和/或元数据特征。元数据特征可以包括例如识别特定符号的存在以及与消息相关联的发起次数等。情绪分析器108通过分析在事件的上下文中的消息而产生情绪特征集合。
在实施例中,通过使用建立的动态词典,预测可以被用于助于一个或多个服务。可以通过使用可以包括(例如应用和/或服务功能等的)服务组件112来提供服务的方面,以提供与一个或多个将来事件、关于策略决定的建议(其可以是比如基于一个或多个预测)和/或用于产生产品的信息等相关联的预测。此外,服务器102可以有助于(比如通过提供信息)基于预测来产生产品和/或可以向其他实体提供预测以用在产生事件相关的产品和/或服务中。在实施例中,例如,在有价证券相关的预测可以用于产生用于建立、发展和/或管理有价证券资产组合和/或基金(比如交易型开放式基金(ETF))等建议和策略。在实施例中,服务器102可以提供关于预约代理的保证建议等。
根据实施例,操作环境100的多种组件、如在图1中说明的,可以被实施在一个或多个计算装置上。例如,服务器102、消息源106、事件信息源110以及访问装置114中的每一个可以为或驻留在一个或多个计算装置中。计算装置可以包括适于实施本发明实施例的任意类型的计算装置。计算装置的示例包括专用计算装置或通用计算装置、比如“工作站”、“服务器”、“便携式电脑”、“台式计算机”、“平板电脑”、“手持装置”等,参考操作环境100的多种组件,所有这些都被考虑在图1的范围中。
在实施例中,计算装置包括总线,其直接和/或间接使下列装置耦接:处理器、存储器、输入/输出(I/O)端口、I/O组件以及电源。任意数量的额外组件、不同组件和/或组件的组合还可以被包括在计算装置中。总线表示为可以为一条或多条总线(比如、例如地址总线、数据总线或者两者的组合)。相似地,在实施例中,计算装置包括多个处理器、多个存储器组件、多个I/O端口、多个I/O组件和/或多个电源。此外,任意数量的这些组件或其组合可以横跨多个计算装置来分布和/或复制。
在实施例中,存储器118包括易失性和/或非易失性存储器形式的计算机可读介质并且存储器118可以是可移除的、非可移除的或两者的组合。介质示例包括随机存取存储器(RAM);只读存储器(ROM)、电可擦除只读存储器(EEPROM);闪存;光学全息介质;磁带盒、磁带、磁盘存储器和其他磁盘存储装置;数据传输;以及可以被用于存储信息并且可以被例如量子态存储器等的计算装置访问的任意其他介质。在实施例中,存储器118存储计算机可执行指令以用于使处理器116实施此处讨论的系统组件的实施例的方面和/或执行此处讨论的方法和程序的实施例的方面。计算机可执行指令可以包括例如、计算机代码、机器可用指令等等,例如能够由与计算装置相关联的一个或多个处理器执行的程序组件。这种程序组件的示例包括情绪分析器108(以及如在图2中说明并且在以下被描述的其组件)、服务组件112、事件信息取回器120、消息取回器122、数据库124以及网络服务器210(如在图2中说明的)。此处所考虑的一些功能性或所有功能性还可以在硬件和/或固件中来实施。
显示在图1中的示例性操作环境100并不试图对于使用范围或者本发明的功能性进行任何限制性暗示。示例性操作环境100不被解释为具有涉及此处说明的任意单一组件或组件组合的任何依赖或需求。
图2为描述根据本发明实施例的服务器102的组件的框图。如上所指出的,情绪分析器108可以构造为分析由消息取回器122访问的消息以形成与事件相关联的预测。分析的结果可以被用于助于向消费者提供服务(比如通过使分析结果可用)。例如,网络服务器210可以被用于提供由访问装置114可访问的一个或多个网页。如图2所示,情绪分析器108可以包括提取模块202、情绪分类器204、动态词典206以及预测模块208。根据实施例,在图2中描述的情绪分析器108的组件202、204、206和208中的任意一个或多个可以与此处所描述的其他组件的多个组件(和/或未示出的组件)中的各个一起分享资源或者集成在一起。此外,组件202、204、206和208中的任意一个或多个可以驻留在服务器102上或者访问装置114上,或者可以被分布在服务器102和访问装置114之间。
根据实施例,事件信息取回器120获取、复制、或者另外地访问事件信息并且收集与以下信息相关联的属性,所述信息例如为事件信息源110(从此处事件信息被访问)的识别、事件信息被创建的数据和时间、以及在信息中参考的时间所发生的的日期和时间。
根据实施例,提取模块202构造为从事件信息提取标记(比如“正的”、“负的”、“+1”、“-1”)并且使用被提取的标记来产生用于训练诸如分类器的预测模块的训练数据。提取模块202可以在事件信息内识别一个或多个事件。为了识别事件,提取模块202可以利用诸如、比如一个或多个规则集合或分类器等的事件标准。例如,提取模块202可以基于实体或项的条件或状态的改变、和/或预选事件的列目等等来识别事件。在有价证券示例中,可以基于超过阈值的的增加量或减少量来识别股票价格事件,在实施例中,该阈值可以基于诸如另一股票和/或市场指数等(比如股市指数、市场行业指数等)的比较值。股市指数的一些示例包括标准普尔500(S&P 500)指数、美国证交所综合指数(AMEX Composite)、纳斯达克全球市场综合指数(NASDAQ Global Market Composite)、纽约证券交易所综合指数(NYSEComposite)、拉塞尔(Russel)1000指数、以及威尔希尔(Wilshire)5000指数。类似地,市场行业指数(Market Sector Index)的一些示例包括道琼斯工业指数(Dow Industrials)、美国银行指数(KBW Bank Index)、纳斯达克金融100指数(NASDAQ Financial-100)、费城证券交易所化工行业(PHLX Chemical Sector)指数、拉塞尔(Russel)1000成长指数以及SIGEnergy MLP指数。
例如,假设t0和tc为特定股票在给定日的开始时间和关闭时间,tc-t0=8代表正式的市场操作小时数。此外,针对由tc-t0限定的时间框架,假设rsp为与S&P 500相关联的利润,并且F(t0)和F(tc)分别为股票的开始价格和结束价格。正面和负面事件可以被分别限定为盈利事件和亏损事件。其中,当(F(t0)-F(tc))/F(t0)>3.0%+rsp时,可以被识别为盈利事件,当(F(t0)-F(tc))/F(t0)<-3.0%-rsp时,可以被识别为亏损事件。也就是说,在这个示例中,在给定日中,如果股票的利润在S&P 500的利润的3%以内,则不存在识别事件。然而,如果股票价格经历净盈利并且该盈利超过高于S&P 500的利润3%以上,则盈利事件被识别了;又,这一日的股票价格经历净损失并且该净损失超过低于S&P 500的利润3%以下,则亏损事件被识别了。根据实施例,任意数量不同的阈值、比较值和/或关系可以被用作为用于识别事件的标准。
根据实施例,消息取回器122获取、复制、或者另外地访问消息并且收集与以下每个消息相关联的属性,该消息例如为消息平台(从此处访问消息)的识别、消息创建的日期和时间以及包括在消息中的内容(比如文本、超链接、统一资源定位器(URL)、表格、图表和/或图像等)。此外,在实施例中,可以收集具体针对消息平台的其他属性。例如,对于通过
Figure BDA0000673088260000081
发送的消息(比如推文),消息取回器122可以收集诸如话题标记、记载、回复、特别喜欢的事、回推(re-tweets)和/或跟随者的识别等的特性。作为另外一个示例,对于通过
Figure BDA0000673088260000091
发送的消息,消息取回器122可以收集诸如“喜欢”、帖子、“状态”指示、链接和/或朋友等。
此外,如上所描述访问事件信息之外,在本发明的实施例中,提取模块202也访问对应于事件标准的消息集合。为了识别这些消息,提取模块202可以利用例如、一个或多个规则集合和/或分类器等。根据实施例,提取模块202利用简单规则的集合来使效率最大化,从而能够迅速识别事件和消息以有助于“跟上”多种市场和消息行为的几乎实时速度的服务。例如,提取模块202可以访问以下消息,该消息在事件发生之前、事件发生之后或者事件发生期间的特定时段期间产生。该时段可以是、例如多个小时、多天、多周并且可以基于分类器的输出被最优化。在实施例中,对于特定时段的来自于消息源106的所有可用的消息可以被访问,而在其他实施例中,提取模块202可以访问特定消息,比如那些更可能与事件相关的消息。例如,提取模块202可以通过识别消息中的特定类型的内容(例如看起来与事件相关联的内容、涉及事件的项或实体、事件相关的活动、大体上与一个或多个事件相关的活动相关联的字符串等)来识别消息。
提取模块202构造为使所述消息集合与事件相关联并且通过分析基于事件的消息来识别情绪特征集合212。情绪特征集合212可以包括表示与事件相关联的用户情绪的文本特征,并且可以被存储在存储器118中的动态词典206中(并且可以被索引,比如在图1所示的数据库124中)。动态词典206可以包括任意数量的情绪特征集合212,其可以包括特征向量、和词汇表等等。为了生成情绪特征集合212,情绪分析器108可以使用自动产生的训练数据来认知图形或发展回归模型。
在实施例中,如图2所示,这种模型可以包括情绪分类器204。情绪分类器204可以为或包括一个或多个监督或未监督的统计分类器,其构造为根据情绪对消息进行分类。提取模块202可以利用支持向量机(SVM),以分析特征,诸如基于列表的特征(比如字符顺序是否包括在正/负情绪词汇表里)或一元和二元单词特征等。在实施例中,可以使用Rocchio分类器。分类可以例如基于与事件相关联的消息中检测到的情绪。例如,提取模块202可以使用训练数据来训练监督情绪分类器204。在这种情况下,提取模块202可以基于事件标准来将标记分配给该消息集合中的每个消息以创建被标记消息集合,其中,每个标记对应于预定情绪值。这些被标记消息可以被用于训练分类器204。
在实施例中,被分配至集合中的、与事件相关联的消息中的每个消息的标记可以是相同的,从而有助于消息的自动标记。标记可以是二元的,离散的,定量的和/或定性的。在实施例中,例如,标记可以为正号或负号,分别表示正面情绪和负面情绪。在这种方式中,分类器可以学习去认知表达正面情绪和负面情绪的特定图样的符号、单词、短语或特殊符号。在实施例中,消息可以标记有暂时情绪,比如用户是否期望、经历或回忆正面或负面情绪。根据实施例,除了正面特征或负面特征,还可以通过基于与每个消息相关联的元数据使用特征来训练分类器204。例如,可以基于标签、股票代码、URL或回推等对推文进行分类。在一些情形中,训练数据可以是不平衡的(比如其相对于负面示例可以包括更多的正面示例,反之亦然)。在这种情形中,处于特征水平处的过采样技术可以被使用。例如,如果负面标记的消息是正面标记的消息的一半,则在产生的特征向量中的正面特征的数量可以是负面特征数量的两倍,从而平衡了训练过程中的少数标记的表示。
例如,针对有价证券示例,已经观察到总体上,显著的股票价格波动可以影响人们的心情并且人们的心情继而影响股市。因此,本发明的实施例利用以下这种思想,即当股票价格相对于总体股市或特定指数(比如S&P 500)增加了特定数量时,与股票相关的社交媒体消息大致上反映正面心情;并且相似的,当股票价格下降了特定相对数量时,相关的社交媒体消息大致上反映负面心情。提取模块202可以使用股票价格变化来将消息的情绪标记为正或负。
在实施例中,其他正面和负面的事件可以被用于标记消息以用于训练有价证券预测分类器。例如,公司收入可以引起显著的股票价格活动并且还可以触发引人注目的公众情绪。其他事件诸如合并和收购通告、诸如月度工作报告的宏观经济事件以及金融政策通告等都可以影响股市以及公众情绪,并且因此可以被用于标记消息。
如上所示的,提取模块202可以利用任意数量不同的技术来学习例如分类、回归、关联分析和/或图样分析等的情绪。任意数量多种前述的组合还可以被使用。例如,已经观察到,
Figure BDA0000673088260000101
时间序列经常包括自动关联,这可归因于人类情感,该人类情感可能取决于最接近的过去的人类情感。提取模块202可以使用自动回归模型来解释诸如、例如以下模式的这种类型的历史相依性:
SPXreturn(1)~class(-1)+class(-2)+class(-3)+pos(0)+neg(0)+class
(0)+SPXreturn(-1)+SPXreturn(-2)-1;
其中,SPXreturn(t)代表在第t天的S&P 500的日算数利润,被限定为((开度值/闭合值)-1)。回归可以每天进行,其中当天被表示为第0天。在上述示例中,t=-1代表在第0天之前的交易日,pos(t)代表推特序列在第t天的按天聚集的正面性,neg(t)代表序列按天聚集的负面性。class(t)表示在第t天的净正面性或负面性(其可以比如包括量级,被表示为“+1”或“-1”等),并且常数因子(-1)被用于移除截距(intercept)。在实施例中,每一天,来自于最后十天的训练集合可以被收集并且被使用在回归模型中。根据实施例,任意数量的不同的自动回归模型可以被用于解释自动关联。
如上所示的,情绪分类器204可以被用于识别被保持在动态词典206中的一个或多个情绪特征集合212。预测模块208可以构造为使用动态词典206来识别与后续接收到的消息相关联的情绪并且使用被识别到的情绪来形成与可能的将来事件相关联的预测。预测模块208可以利用由分类器204产生的信息、来自于目标信息源(比如在图1中显示的事件信息源110)的信息、和/或有助于形成预测的其他信息。在实施例中,可以通过提供给消费者等的服务组件112来利用该预测。
在示例性实施方式中,例如,当汤森路透(Thomson Reuters)股票的价格平衡地增加或减少时,此处描述的情绪分析器(比如图1中的情绪分析器108)的实施例可以被用于进行预测。在这个实施方式中,情绪分析器可以构造为基于事件标准来识别与股票相关联的正面事件和负面事件。例如,正面事件可以是以以下交易日为特征的,在交日易期间,股票价格的相对增加超过了S&P 500指数的相对增加的3%以上。相似地,负面事件可以是以以下交易日为特征的,在交日易期间,股票的价格的相对减少超过了S&P 500指数的相对减少的3%以上。对于每个事件而言,消息取回器(比如图1中示出的消息取回器122)可以使用搜索查询(比如“Thomson OR TR OR TRI OR Reuters OR#TRI OR$TRI”)以从事件之前的天取回潜在相关推文集合。也就是说,第一消息集合可以包括在正面事件之前的发起的天并且满足搜索查询的所有推文。相似地,第二消息集合可以包括负面事件之前的发起的天的并且满足搜索查询的所有推文。
情绪分析器可以随后使第一消息集合与正面事件相关联以及使第二消息集合与负面事件相关联。由于所有第一消息集合发生在汤森路透的股票价格增加的前一天,因此情绪分析器可以将第一消息集合中的每个消息均标记为正(比如通过用“+1”表示正面情绪),并且相似地,可以将第二消息集合中的每个消息均标记为负(比如通过用“-1”表示负面情绪)。这些正面的和负面的被标记情绪集合可以随后被用于训练监督分类器以在将来推文中识别正面情绪和负面情绪。在这种情况下,分类器可以学习以使多种情绪特征例如、多种单词和短语(比如“是的”、“极好的”、“TRI很热”、“汤姆森看起来不错”、“对于TRI是好日子”等)与正面情绪相关联,以及使其他单词或短语(比如、“讨厌”、“不”、“垃圾TRI”、“汤姆森在挣扎”、“对于TRI是坏日子”等)与负面情绪相关联。
随后,在后续天,消息取回器可以取回满足以上限定的询问的所有推文(并且在实施例中,可以周期性地或连续性地在这一整天取得这种推文)并且基于学习到的情绪特征来分析推文。也就是说,例如,情绪分析器可以分析在午间的推文集合并基于其观察的情绪特征来识别与每个推文相关联的情绪。假设,例如情绪分析器3000分析具有诸如“讨厌”、“不”、“糟糕的”的单词和短语的300个推文及具有诸如“是的”、“极好的”以及“不错”的单词和短语的500个推文。在这种情形下,情绪分析器可以识别具有负面情绪的300个推文和具有500个正面情绪的推文。在示例性实施方式的实施例中,情绪分析器可以随后聚集这些情绪并且计算情绪分数。所述情绪分数可以反映例如、具有正面情绪的推文的净百分比(比如+0.625)。
这个情绪分数可以被用于在次日形成与汤森路透股票的表现相关联的预测,即,例如,汤森路透的股票价格被预测为在第二天增加,在第二天不减少,在第二天轻微地增加、或在接下来的几天增加,等等。在这种方式中,例如,可以基于预测来建立交易策略。例如,如果股票被预测为上升,则策略可以包括对股票持长期立场(比如买股票或保持股票份额),然而如果股票被预测为下降,则策略可以包括对股票持短期立场(比如售卖股票份额)。根据实施例,分类器或者分类器组合可以构造为随时间通过观察进行学习,即如果比如具有大于特定阈值(比如0.625)的正面情绪的推文的净百分比被识别,则股票可以为强烈“买进”。可以通过分析与多种类型事件相关联的消息中的模式来收藏关于策略决定的强度的其他相似观察。
如上所述,情绪分析器(比如图1中示出的情绪分析器108)可以分析消息以有助于形成与事件相关联的预测。分析的结果可以有助于策略和建议以针对与例如项或实体的表现的事件的将来结果相关联的动作,这可以被用于提供事件相关的服务。图3是描述了用于预测事件的示例性计算机实施的方法300的流程图。示例性方法300的实施例包括限定事件标准(框302)并且访问事件信息(框304)。在实施例中,服务器(比如图1中示出的服务器102)可以实施事件信息取回器,其从信息源(比如图1中的信息源110)获取、复制、或者另外地访问内容。提取模块(比如图2中的提取模块202)通过使用事件信息基于事件标准(框306)来识别第一事件。在实施例中,第一事件可以为与股票价格相关联的盈利事件或与股票价格相关联的亏损事件。例如,当在时段期间(比如交易日)内的股票价格的相对增加超过了比与股票市场指数相关联的利润多3%以上时,可以识别为盈利事件,相似地,当在时段期间内的股票价格的相对减少超过了比与股票市场指数相关联的利润少3%以下时,可以识别为亏损事件。
如图3所示,内容取回器访问第一消息集合(框308)。可以基于事件标准来访问这些消息。也就是说,例如,被访问的消息可以对应于由事件标准指定的时段和/或可以基于事件标准包括满足查询请求的文本等。消息可以包括任意数量不同类型的消息比如、例如社交媒体消息、电子邮件、短信服务消息、博客帖子、回复帖子和/或互联网公开的文章等。提取模块(比如图2中所示的提取模块202)使第一消息集合与第一被识别事件相关联(框310)。情绪分析器通过分析第一消息集合来识别情绪特征集合(框312)。在实施例中,情绪分析器可以通过实施一个或多个统计分类器来分析消息,其中该一个或多个统计分类器构造为学习与诸如、例如短语、单词、字符、特殊字符或这些模式的组合等的第一事件相关联的情绪特征集合。在实施例中,情绪分析器可以使用回归分析、词汇表或其他技术来分析消息从而学习与事件相关联的情绪。可以通过使用自动回归模型分析、误差补偿技术、标准化、和/或用于精炼所引起的情绪特征集合的预测能力的其他技术来增强分析。
方法300的实施例还包括访问第二消息集合(框314),并且使用所述情绪特征集合,形成与第二事件相关联的预测(框316)。所述预测可以为将来事件发生的预测、将来事件发生的结果的预测、与将来事件的发生相关联的利润的量的预测和/或正在发生的事件的结果的预测等。可以基于预测来提供事件相关的服务(框318)。
此外,用于预测如本发明实施例所考虑的事件的其可选及覆盖方面在图4中被描述了。如上所述,情绪分析器(比如、图1中示出的情绪分析器108)可以利用监督分类器来识别情绪特征集合,其可以被用于形成与诸如、例如涉及有价证券市场的事件相关联的预测。图4为描述了利用监督分类器来形成与事件相关联的预测的示例性计算机实施的方法400的流程图,其中,通过使用从第一被识别事件和第一被访问消息集合提取的自动产生的训练数据来训练分类器。示例性方法400的实施例包括基于事件标准将标记分配至第一消息集合中的每个消息(框402)。例如,在有价证券示例中,将标记分配至第一消息集合中的每个消息可以包括当第一事件为盈利事件时将第一消息集合中的每个消息标记为正,并且当第一事件为亏损事件时将第一消息集合中的每个消息标记为负。
情绪分析器通过使用第一被标记消息集合来训练一个或多个分类器。当访问第二消息集合时,情绪分类器使用分类器来识别用于第二消息集合中的每个消息的情绪值(框406)并且聚集被识别的情绪值(框408)。基于聚集的被识别的情绪值,情绪分数被确定(框410)。例如,被识别的情绪可以是正号和负号并且情绪分数可以为、或者包括净情绪的指示。也就是说,如果在聚集的被识别的情绪中存在比负号更多的正号,则情绪分数可以为或者包括正号。在实施例中,情绪分数可以包括量级、权重和/或诸如误差项、置信水平、概率估计等任意数量额外类型的因素。例如,在实施例中,情绪分数也许是数字,S,以使得-1≤S≤1。在这个示例中,符号(+或-)指示情绪的净质量(分别是正面的或负面的),同时数字表示情绪(比如其中-1实质上表示负面情绪,0表示中性情绪、+1实质上表示正面情绪)的净数量(比如水平)。在实施例中,情绪分析器实施聚集情绪值并且确定情绪分数的预测模块(比如图2中示出的预测模块208)。如图4所示,预测模块基于情绪分数形成与第二事件相关联的预测(框412)。此外,在实施例中,基于预测以及与第二事件相关联的后续被访问的信息,可以更新情绪分类器204(框414)。
虽然利用专一性描述了本发明的实施例,但描述本身并不试图限制本专利的保护范围。例如,当涉及预测股票价格波动的实施例在此处已被描述了,如前所示的,本发明的实施例可以被用在形成与多种类型的事件相关联的预测,其中,多种类型的事件包括可量化的特性并且影响公众情绪和/或被公开情绪所影响。例如,基于学习的情绪、与房地产市场、产品市场、金融市场(比如保险市场)或法律市场相关联的预测,本发明可以被用于形成预测。此外,本发明的实施例也许使能可定制的分析组件诸如、例如这样一种组件:其允许用户提供用于提出假设、考虑特定变量或选择事件标准的输入。因此,连同其他技术一起,发明人已经考虑到了要求保护的发明也许还以另外方式来体现,以包括类似于在本文献中描述的不同步骤或特征,或者步骤或特征的组合。

Claims (22)

1.一种用于形成与事件相关联的预测的计算机实施的方法,所述方法包括:
通过使用具有处理器和存储器的计算装置来访问来自事件信息源的事件信息;
通过使用所述处理器和事件信息基于事件标准来识别第一事件;
通过使用所述计算装置来访问来自消息源的第一消息集合,其中所述第一消息集合由多个消息用户来产生;
通过使用所述处理器来使所述第一消息集合与所述第一事件相关联;
通过使用所述处理器来识别情绪特征集合,所述情绪特征集合包括表示与所述第一事件相关联的用户情绪的至少一个文本特征,其中,识别所述情绪特征集合包括基于所述第一事件来分析第一消息集合;
通过使用所述计算装置来访问来自所述消息源的第二消息集合;
通过使用所述处理器基于所述情绪特征集合来分析所述第二消息集合以形成与第二事件相关联的预测;
将所述预测存储在所述存储器中;并且其中
将所述情绪特征集合存储在所述存储器的动态词典中,情绪分析器发展和维护所述动态词典;
其中,所述第一消息集合和第二消息集合中的至少一个包括社交媒体消息,并且所述第一消息集合中的每一个消息均在所述第一事件发生之前产生;
其中,所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件,其中当所述事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件。
2.根据权利要求1所述的方法,还包括:
基于所述预测而助于事件相关的服务。
3.根据权利要求2所述的方法,其中,所述第二事件包括与股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件。
4.根据权利要求3所述的方法,其中,助于所述事件相关的服务包括:
建立基于所述预测的有价证券交易策略,所述有价证券交易策略包括:
如果所述第二事件包括盈利事件,则针对股票持长期立场;以及
如果所述第二事件包括亏损事件,则针对股票持短期立场。
5.根据权利要求1所述的方法,其中,所述情绪特征集合包括短语、单词、字符以及特殊符号中的至少一个。
6.根据权利要求1所述的方法,其中,所述社交媒体消息包括推文。
7.根据权利要求1所述的方法,其中,还包括:基于所述预测识别额外的情绪特征集合以更新所述动态词典,并且将所述额外的情绪特征集合存储在所述动态词典中。
8.根据权利要求1所述的方法,其中,分析所述第一消息集合包括:
基于所述事件标准将标记分配至所述第一消息集合中的每个消息以创建第一被标记消息集合,其中所述标记对应于预定情绪值;
通过使用所述第一被标记消息集合来训练分类器;并且
通过使用所述分类器来识别所述情绪特征集合。
9.根据权利要求8所述的方法,分析所述第二消息集合包括:
通过使用所述分类器来识别用于所述第二消息集合中的每一个消息的情绪值;
聚集至少一部分被识别的情绪值;
基于聚集的被识别的情绪值来确定情绪分数;并且
基于所述情绪分数形成预测。
10.根据权利要求9所述的方法,其中所述情绪分数为-1至1范围内的数字。
11.根据权利要求1所述的方法,
其中,盈利事件被限定为在时段内的以下股票价格的相对增加,该股票价格的相对增加超过了比与市场指数相关联的利润多百分之三以上;并且
其中,亏损事件被限定为在时段内的以下股票价格的相对减少,该股票价格的相对减少超过了比与市场指数相关联的利润少百分之三以下。
12.根据权利要求11所述的方法,其中,所述市场指数包括标准普尔500指数、美国证交所综合指数、纳斯达克全球市场综合指数、纽约证券交易所综合指数、拉塞尔1000指数、威尔希尔5000指数、道琼斯工业指数、美国银行指数、纳斯达克金融100指数、费城证券交易所化工行业指数、拉塞尔1000成长指数以及SIG Energy MLP指数中的至少一个。
13.根据权利要求8所述的方法,其中将所述标记分配至所述第一消息集合中的每个消息包括:
当所述第一事件为盈利事件时,将所述第一消息集合中的每个消息标记为正;
当所述第一事件为亏损事件时,将所述第一消息集合中的每个消息标记为负。
14.根据权利要求1所述的方法,其中,分析所述第一消息集合包括施加自动回归模型。
15.一种用于形成与事件相关联的预测的计算机实施的方法,所述方法包括:
通过使用具有处理器和存储器的计算装置来访问来自消息源的消息集合;其中所述消息集合由多个消息用户产生;
通过使用所述处理器来访问存储在所述存储器中的动态词典,所述动态词典包括情绪特征集合,所述情绪特征集合包括表示与第一事件相关联的用户情绪的至少一个文本特征;
通过使用所述处理器基于所述情绪特征集合来分析所述消息集合以形成与第二事件相关联的预测;并且
将所述预测存储在所述存储器中;并且其中
将所述情绪特征集合存储在所述存储器的动态词典中,情绪分析器发展和维护所述动态词典;
其中,第一消息集合和第二消息集合中的至少一个包括社交媒体消息,并且所述第一消息集合中的每一个消息均在所述第一事件发生之前产生;
其中,所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件,其中当事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件。
16.根据权利要求15所述的方法,还包括:
基于所述预测而助于事件相关的服务。
17.根据权利要求15所述的方法,其中,所述消息集合包括社交媒体消息。
18.根据权利要求17所述的方法,所述社交媒体消息包括推文。
19.一种用于预测事件的系统,所述系统包括:
服务器,其构造为从消息源接收由多个消息用户产生的多个消息,所述服务器包括处理器,所述处理器实例化存储在存储器中的多个软件组件,所述多个软件组件包括:
情绪分析器,其构造为:(a)识别情绪特征集合,所述情绪特征集合包括表示与第一事件相关联的用户情绪的至少一个文本特征,其中所述情绪分析器构造为基于所述第一事件来分析所述多个消息的第一集合以识别所述情绪特征集合;以及(b)基于所述情绪特征集合来形成与第二事件相关联的预测,其中所述情绪分析器构造为通过分析所述多个消息的第二集合来形成所述预测;以及
服务组件,其构造为基于所述预测而助于事件相关的服务;并且其中
将所述情绪特征集合存储在所述存储器的动态词典中,所述情绪分析器发展和维护所述动态词典;
其中,第一消息集合和第二消息集合中的至少一个包括社交媒体消息,并且所述第一消息集合中的每一个消息均在所述第一事件发生之前产生;
其中,所述第一事件包括与股票的股票价格相关联的盈利事件或者与所述股票价格相关联的亏损事件,其中当事件信息指示超过与市场指数相关联的预定利润的所述股票价格的相对增加时所述第一事件是盈利事件,并且其中当所述事件信息指示超过与所述市场指数相关联的预定损失的所述股票价格的相对减少时所述第一事件是损失事件。
20.根据权利要求19所述的系统,其中,所述情绪分析器包括情绪分类器以及提取模块,并且其中所述提取模块构造为:
基于事件标准将标记分配至所述第一消息集合中的每个消息以创建被标记消息集合,其中所述标记对应于预定情绪值;以及
通过使用所述被标记消息集合来训练所述分类器。
21.根据权利要求19所述的系统,其中,所述多个消息包括社交媒体消息集合。
22.根据权利要求21所述的系统,其中,所述社交媒体消息集合包括推文集合。
CN201380043348.2A 2012-08-15 2013-08-14 用于通过使用基于事件的情绪分析来形成预测的系统和方法 Active CN104781837B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261683375P 2012-08-15 2012-08-15
US61/683,375 2012-08-15
PCT/US2013/054992 WO2014028648A2 (en) 2012-08-15 2013-08-14 System and method for forming predictions using event-based sentiment analysis

Publications (2)

Publication Number Publication Date
CN104781837A CN104781837A (zh) 2015-07-15
CN104781837B true CN104781837B (zh) 2020-09-22

Family

ID=50100811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380043348.2A Active CN104781837B (zh) 2012-08-15 2013-08-14 用于通过使用基于事件的情绪分析来形成预测的系统和方法

Country Status (4)

Country Link
US (1) US11348012B2 (zh)
EP (1) EP2885756A4 (zh)
CN (1) CN104781837B (zh)
WO (1) WO2014028648A2 (zh)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9852239B2 (en) * 2012-09-24 2017-12-26 Adobe Systems Incorporated Method and apparatus for prediction of community reaction to a post
US20160055497A1 (en) * 2014-08-20 2016-02-25 Telefonaktiebolaget L M Ericsson (Publ) Method and polling system for supporting evaluation of a delivered service
EP3012745A1 (en) * 2014-10-23 2016-04-27 CRM S.r.l. Welike Chorally platform for digital caring and social CRM
SG10201407018YA (en) * 2014-10-28 2016-05-30 Chee Seng Keith Lim System and method for processing heartbeat information
US20160189181A1 (en) * 2014-12-29 2016-06-30 The Nielsen Company (Us), Llc Methods and apparatus to estimate demographics of an audience of a media event using social media message sentiment
US11100285B2 (en) * 2015-01-23 2021-08-24 Conversica, Inc. Systems and methods for configurable messaging with feature extraction
US10042625B2 (en) * 2015-03-04 2018-08-07 International Business Machines Corporation Software patch management incorporating sentiment analysis
US10289731B2 (en) * 2015-08-17 2019-05-14 International Business Machines Corporation Sentiment aggregation
US20170193051A1 (en) * 2015-12-31 2017-07-06 Mehdi Ghafourifar Systems and methods for automatic archiving, sorting, and/or indexing of secondary message content
US20170213138A1 (en) * 2016-01-27 2017-07-27 Machine Zone, Inc. Determining user sentiment in chat data
US10719854B2 (en) 2016-02-03 2020-07-21 Conduent Business Services, LLC. Method and system for predicting future activities of user on social media platforms
JP6457986B2 (ja) * 2016-08-30 2019-01-23 株式会社ソニー・インタラクティブエンタテインメント メッセージ分類システム、メッセージ分類方法及びプログラム
US11080723B2 (en) * 2017-03-07 2021-08-03 International Business Machines Corporation Real time event audience sentiment analysis utilizing biometric data
US10484320B2 (en) 2017-05-10 2019-11-19 International Business Machines Corporation Technology for multi-recipient electronic message modification based on recipient subset
US10748215B1 (en) 2017-05-30 2020-08-18 Michael C. Winfield Predicting box office performance of future film releases based upon determination of likely patterns of competitive dynamics on a particular future film release date
CN107402997B (zh) * 2017-07-20 2020-08-07 中国电子科技集团公司电子科学研究院 网络舆情态势的安全评估方法、终端及计算机存储介质
CN107301171B (zh) * 2017-08-18 2020-09-01 武汉红茶数据技术有限公司 一种基于情感词典学习的文本情感分析方法和系统
CN107784083A (zh) * 2017-09-30 2018-03-09 北京合力智联科技有限公司 一种网络舆情信息有效性的自动识别处理方法
US11270082B2 (en) 2018-08-20 2022-03-08 Verint Americas Inc. Hybrid natural language understanding
US11217226B2 (en) 2018-10-30 2022-01-04 Verint Americas Inc. System to detect and reduce understanding bias in intelligent virtual assistants
US11604927B2 (en) * 2019-03-07 2023-03-14 Verint Americas Inc. System and method for adapting sentiment analysis to user profiles to reduce bias
WO2020247586A1 (en) 2019-06-06 2020-12-10 Verint Americas Inc. Automated conversation review to surface virtual assistant misunderstandings
CN111159166A (zh) * 2019-12-27 2020-05-15 沃民高新科技(北京)股份有限公司 事件的预测方法及装置、存储介质及处理器
CN111459959B (zh) * 2020-03-31 2023-06-30 北京百度网讯科技有限公司 用于更新事件集合的方法和装置
CN111581983B (zh) * 2020-05-13 2023-08-08 中国人民解放军国防科技大学 基于群体分析的网络舆论事件中社会关注热点的预测方法
CN112766063B (zh) * 2020-12-31 2024-04-23 沈阳康泰电子科技股份有限公司 基于位移补偿的微表情拟合方法和系统
CN113010784B (zh) * 2021-03-17 2024-02-06 北京十一贝科技有限公司 用于生成预测信息的方法、装置、电子设备和介质
CN113256397B (zh) * 2021-07-02 2021-10-26 佛山市墨纳森智能科技有限公司 基于大数据的商品推荐方法、系统及计算机可读存储介质
CN115964499B (zh) * 2023-03-16 2023-05-09 北京长河数智科技有限责任公司 基于知识图谱的社会治理事件挖掘方法及装置
CN116503107B (zh) * 2023-06-25 2023-10-03 青岛华正信息技术股份有限公司 一种应用人工智能的业务大数据处理方法及系统

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7539637B2 (en) 1998-04-24 2009-05-26 Starmine Corporation Security analyst estimates performance viewing system and method
US7249080B1 (en) 1999-10-25 2007-07-24 Upstream Technologies Llc Investment advice systems and methods
US6938068B1 (en) 2000-06-30 2005-08-30 International Business Machines Corporation System for managing an exchange of questions and answers through an expert answer web site
US7356484B2 (en) 2000-10-03 2008-04-08 Agile Software Corporation Self-learning method and apparatus for rating service providers and predicting future performance
US7636680B2 (en) 2001-10-03 2009-12-22 Starmine Corporation Methods and systems for measuring performance of a security analyst
US20040117291A1 (en) * 2002-12-12 2004-06-17 O'callahan Dennis M. Method of trading derivative investment products based on an index adapted to reflect the relative performance of two different investment assets
US8499043B2 (en) 2004-08-12 2013-07-30 Sap Aktiengesellschaft Reports for email processing in an email response management system
US7711623B2 (en) 2004-08-20 2010-05-04 Consulting Services Support Corporation Decision assistance platform configured for facilitating financial consulting services
US7877309B2 (en) 2004-10-18 2011-01-25 Starmine Corporation System and method for analyzing analyst recommendations on a single stock basis
JP3981387B2 (ja) * 2005-02-04 2007-09-26 有限会社増田経済研究所 株式指数の表示装置
US20060242040A1 (en) * 2005-04-20 2006-10-26 Aim Holdings Llc Method and system for conducting sentiment analysis for securities research
US8930254B2 (en) * 2005-06-13 2015-01-06 CommEq Asset Management Ltd. Financial methodology to valuate and predict the news impact of major events on financial instruments
EP2022003A4 (en) 2006-05-01 2011-07-13 Cake Financial Corp CONSOLIDATION, SHARING AND ANALYSIS OF INVESTMENT INFORMATION
US8731994B2 (en) * 2006-10-06 2014-05-20 Accenture Global Services Limited Technology event detection, analysis, and reporting system
US20080189634A1 (en) 2007-02-01 2008-08-07 Avadis Tevanian Graphical Prediction Editor
US7890408B2 (en) 2007-10-11 2011-02-15 Morgan Stanley Capital International, Inc. System and method for attributing performance, risk and risk-adjusted performance of an investment portfolio to custom factors
CN101685527A (zh) * 2008-09-27 2010-03-31 上海万纬信息技术有限公司 股指期货期现套利交易系统及其方法
US20100114795A1 (en) 2008-10-31 2010-05-06 Hudson Robert P Stock broker social-professional website system
US20100179930A1 (en) 2009-01-13 2010-07-15 Eric Teller Method and System for Developing Predictions from Disparate Data Sources Using Intelligent Processing
US20120011044A1 (en) * 2009-02-27 2012-01-12 Rodman & Renshaw, Llc Method and system for issuing primary securities in a trading market
US8166032B2 (en) * 2009-04-09 2012-04-24 MarketChorus, Inc. System and method for sentiment-based text classification and relevancy ranking
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US20120296845A1 (en) * 2009-12-01 2012-11-22 Andrews Sarah L Methods and systems for generating composite index using social media sourced data and sentiment analysis
US8356025B2 (en) 2009-12-09 2013-01-15 International Business Machines Corporation Systems and methods for detecting sentiment-based topics
CN101794430A (zh) * 2010-02-11 2010-08-04 帅亿 全自动操盘服务器
US8402035B2 (en) * 2010-03-12 2013-03-19 General Sentiment, Inc. Methods and systems for determing media value
US8874727B2 (en) 2010-05-31 2014-10-28 The Nielsen Company (Us), Llc Methods, apparatus, and articles of manufacture to rank users in an online social network
US20120191596A1 (en) 2011-01-26 2012-07-26 Gary Kremen Evaluating, monitoring, and controlling financial risks using stability scoring of information received from social networks and other qualified accounts
US9105008B2 (en) 2010-11-29 2015-08-11 Yahoo! Inc. Detecting controversial events
US20130073480A1 (en) * 2011-03-22 2013-03-21 Lionel Alberti Real time cross correlation of intensity and sentiment from social media messages

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"INVESTIGATING PREDICTIVE POWER OF STOCK MICRO BLOG SENTIMENT IN FORECASTING FUTURE STOCK PRICE DIRECTIONAL MOVEMENT";Chong Oh等;《Knowledge Management and Business Intelligence》;20111231;摘要以及正文第7-10页 *

Also Published As

Publication number Publication date
CN104781837A (zh) 2015-07-15
EP2885756A2 (en) 2015-06-24
WO2014028648A2 (en) 2014-02-20
US20140052684A1 (en) 2014-02-20
WO2014028648A3 (en) 2014-05-08
US11348012B2 (en) 2022-05-31
EP2885756A4 (en) 2016-07-06

Similar Documents

Publication Publication Date Title
CN104781837B (zh) 用于通过使用基于事件的情绪分析来形成预测的系统和方法
Li et al. Discovering public sentiment in social media for predicting stock movement of publicly listed companies
Pröllochs et al. Business analytics for strategic management: Identifying and assessing corporate challenges via topic modeling
George Successful strategic plan implementation in public organizations: Connecting people, process, and plan (3Ps)
Li et al. Tourism companies' risk exposures on text disclosure
Stevenson et al. The value of text for small business default prediction: A deep learning approach
US10290058B2 (en) System and method for determining and utilizing successful observed performance
EP3706064A1 (en) Generation of corporate green score using social media sourced data and sentiment analysis
Chen et al. Exploiting social media for stock market prediction with factorization machine
US20190384814A1 (en) System and method for processing natural language statements
Polyzos et al. Twitter and market efficiency in energy markets: Evidence using LDA clustered topic extraction
Fu et al. A sentiment-aware trading volume prediction model for P2P market using LSTM
Liu et al. Identifying individual expectations in service recovery through natural language processing and machine learning
Fritzsch et al. Estimating the relation between digitalization and the market value of insurers
Meoli et al. Machine-learning forecasting of successful ICOs
CN112016850A (zh) 业务评估方法以及装置
CN113378090B (zh) 一种互联网网站相似度分析方法、装置以及可读存储介质
CN111179055A (zh) 授信额度调整方法、装置和电子设备
Jahanbin et al. Aspect-based sentiment analysis of Twitter influencers to predict the trend of cryptocurrencies based on hybrid deep transfer learning models
Liu et al. Stock price movement prediction based on Stocktwits investor sentiment using FinBERT and ensemble SVM
Choi et al. Fake review identification and utility evaluation model using machine learning
Birbeck et al. Using stock prices as ground truth in sentiment analysis to generate profitable trading signals
US20210073247A1 (en) System and method for machine learning architecture for interdependence detection
CN112115258B (zh) 一种用户的信用评价方法、装置、服务器及存储介质
Consoli et al. Forecasting the IBEX-35 stock index using deep learning and news emotions

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Swiss Swiss

Applicant after: Thomsen Reuters global resources non limited company

Applicant after: Liao Wenhui

Applicant after: Ma Sude mark thunder is strange

Applicant after: Sa Meinashaha

Address before: Swiss Swiss

Applicant before: Thomson Reuters Globle Resources

Applicant before: Liao Wenhui

Applicant before: Ma Sude mark thunder is strange

Applicant before: Sa Meinashaha

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant