CN115048487A - 基于人工智能的舆情分析方法、装置、计算机设备及介质 - Google Patents

基于人工智能的舆情分析方法、装置、计算机设备及介质 Download PDF

Info

Publication number
CN115048487A
CN115048487A CN202210602742.6A CN202210602742A CN115048487A CN 115048487 A CN115048487 A CN 115048487A CN 202210602742 A CN202210602742 A CN 202210602742A CN 115048487 A CN115048487 A CN 115048487A
Authority
CN
China
Prior art keywords
index
historical
public opinion
current
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210602742.6A
Other languages
English (en)
Other versions
CN115048487B (zh
Inventor
唐路桥
陈少杰
杨龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202210602742.6A priority Critical patent/CN115048487B/zh
Publication of CN115048487A publication Critical patent/CN115048487A/zh
Application granted granted Critical
Publication of CN115048487B publication Critical patent/CN115048487B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请适用于人工智能技术领域,尤其涉及一种基于人工智能的舆情分析方法、装置、计算机设备及介质。该方法根据前一天的交易时间段内针对N个目标事件的历史反馈信息,结合对应目标事件的初始权重,生成历史舆情指数,以前一天的交易时间段内目标对象的历史实际指数为依据,优化每个目标事件的优化权重,根据当前天的非交易时间段内每个目标事件的实时反馈信息和优化权重,确定当前舆情指数,根据当前舆情指数预测目标对象在当前天的交易时间段内的指数走势,实现基于历史舆情优化权重,使用优化后的权重对当前舆情进行舆情指数分析,从而可以准确地分析舆情和指数的关联性,使用该指数能够较为准确地预测目标对象的走势,为量化交易提供依据。

Description

基于人工智能的舆情分析方法、装置、计算机设备及介质
技术领域
本申请适用于人工智能技术领域,尤其涉及一种基于人工智能的舆情分析方法、装置、计算机设备及介质。
背景技术
目前,随着互联网的快速发展,特别是移动互联网的快速发展,网络媒体作为一种新的信息传播形式。金融产品价格波动与社会事件以及承载在社会事件的舆情的相关度越来越高,探索情绪变化与金融产品价格波动之间的关系成为量化交易的基础。当前在进行股票舆情指数分析时,需要对股票标识信息和预先设置的各预定模式对不同类型的数据源中的实时数据分别进行过滤统计,以确定不同类型的数据源中针对股票标识信息所存在的各预定模式,根据不同类型的数据源的权重值以及不同类型的数据源中所存在的各预定模式的权重值计算确定股票标识信息的股票舆情指数。上述过程不能够从当前真实舆情出发,合理的预测指数与舆情之间的关系,使得预测出的指数与舆情之间关联性较差,导致预测的准确率较差,无法实现量化交易。因此,如何准确地分析舆情与指数的关联性,以提高基于舆情的指数预测的准确率成为亟待解决的问题。
发明内容
有鉴于此,本申请实施例提供了一种基于人工智能的舆情分析方法、装置、计算机设备及介质,以解决准确地分析舆情与指数的关联性,以提高基于舆情的指数预测的准确率的问题。
第一方面,本申请实施例提供一种基于人工智能的舆情分析方法,所述舆情分析方法包括:
获取前一天的交易时间段内针对N个目标事件的第一历史反馈信息,分析每个目标事件对应的第一历史反馈信息,确定对应的情绪值和反馈时刻,N为大于零的整数;
针对任一反馈时刻,将每个目标事件的情绪值与对应目标事件的初始权重进行加权求和,确定加权求和结果为对应反馈时刻下的指数值,并将所述指数值按照时间顺序生成第一历史舆情指数;
根据目标对象在所述前一天的交易时间段内的历史实际指数,对每个目标事件的初始权重进行优化,得到对应目标事件的优化权重,使得根据所述优化权重生成的第一历史舆情指数与所述历史实际指数的走势相同;
根据当前天的非交易时间段内针对每个目标事件的实时反馈信息和所述优化权重,确定当前舆情指数,并根据所述当前舆情指数,预测所述目标对象在所述当前天的交易时间段内的指数走势。
第二方面,本申请实施例提供一种基于人工智能的舆情分析装置,所述舆情分析装置包括:
第一预处理模块,用于获取前一天的交易时间段内针对N个目标事件的第一历史反馈信息,分析每个目标事件对应的第一历史反馈信息,确定对应的情绪值和反馈时刻,N为大于零的整数;
第一指数确定模块,用于针对任一反馈时刻,将每个目标事件的情绪值与对应目标事件的初始权重进行加权求和,确定加权求和结果为对应反馈时刻下的指数值,并将所述指数值按照时间顺序生成第一历史舆情指数;
权重优化模块,用于根据目标对象在所述前一天的交易时间段内的历史实际指数,对每个目标事件的初始权重进行优化,得到对应目标事件的优化权重,使得根据所述优化权重生成的第一历史舆情指数与所述历史实际指数的走势相同;
走势预测模块,用于根据当前天的非交易时间段内针对每个目标事件的实时反馈信息和所述优化权重,确定当前舆情指数,并根据所述当前舆情指数,预测所述目标对象在所述当前天的交易时间段内的指数走势。
第三方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的舆情分析方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的舆情分析方法。
本申请实施例与现有技术相比存在的有益效果是:本申请根据前一天的交易时间段内针对N个目标事件的第一历史反馈信息,结合对应目标事件的初始权重,生成第一历史舆情指数,根据目标对象在前一天的交易时间段内的历史实际指数,对每个目标事件的初始权重进行优化,得到对应目标事件的优化权重,根据当前天的非交易时间段内针对每个目标事件的实时反馈信息和优化权重,确定当前舆情指数,并根据当前舆情指数,预测目标对象在当前天的交易时间段内的指数走势,实现基于历史舆情优化权重,使用优化后的权重对当前舆情进行舆情指数分析,从而可以准确地分析舆情和指数的关联性,使用该指数能够较为准确地预测目标对象的走势,为量化交易提供依据。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例一提供的一种基于人工智能的舆情分析方法的一应用环境示意图;
图2是本申请实施例二提供的一种基于人工智能的舆情分析方法的流程示意图;
图3是本申请实施例三提供的一种基于人工智能的舆情分析方法的流程示意图;
图4是本申请实施例四提供的一种基于人工智能的舆情分析装置的结构示意图;
图5是本申请实施例五提供的一种计算机设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
应理解,以下实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
为了说明本申请的技术方案,下面通过具体实施例来进行说明。
本申请实施例一提供的一种基于人工智能的舆情分析方法,可应用在如图1的应用环境中,其中,客户端与服务端进行通信。其中,客户端包括但不限于掌上电脑、桌上型计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、云端计算机设备、个人数字助理(personal digital assistant,PDA)等计算机设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
参见图2,是本申请实施例二提供的一种基于人工智能的舆情分析方法的流程示意图,上述舆情分析方法可以应用于图1中的服务端,服务端对应的计算机设备连接相应的数据库,以获取数据库中相应的数据。上述计算机设备还可以连接服务器设备,以采集服务器中实时更新的数据。如图2所示,该舆情分析方法可以包括以下步骤:
步骤S201,获取前一天的交易时间段内针对N个目标事件的第一历史反馈信息,分析每个目标事件对应的第一历史反馈信息,确定对应的情绪值和反馈时刻。
本申请中,N为大于零的整数。通过前一天的信息来预测当天的信息,因此,前一天可以是指需要预测的当前天的前一天,交易时间段可以是指针对目标对象而言设置的交易时间。例如,目标对象为股市指数,交易时间段即为该股市的交易时间。
事件可以是指描述一个已经发生的事实。例如,一年期基准利率下调50个基点这一事件。目标事件为根据需求从事件中选取的一个事件,针对目标事件而言,相应的服务器设备能够收集用户对该目标事件的反馈信息,反馈信息可以是指用户针对目标事件的评论、发言等。用户也即是事件的受众,包括个人、团体、机构等,例如,针对股市而言,个人受众即为股民,团体受众即为投资公司等,机构受众即为证券、基金等机构。
收集前一天的交易时间段目标事件对应的反馈信息为第一历史反馈信息,反馈信息中包含反馈内容以及对应的反馈时刻,因此,针对该第一历史反馈信息进行分析可以确定对应目标事件的每个反馈内容和反馈时刻,将同一反馈时刻的反馈内容整合,可以确定该反馈时刻的情绪值。
对反馈内容进行自然语言识别和情绪识别,可以确定对应的情绪状态,进而通过量化分析可以确定反馈内容对应的情绪。同一反馈时刻内存在至少一个反馈内容,即存在至少一个情绪,将同一反馈时刻的所有情绪进行整合即为该反馈时刻的情绪值。
可选的是,分析每个目标事件对应的第一历史反馈信息,确定对应的情绪值和反馈时刻包括:
针对任一目标事件,提取目标事件下所有第一历史反馈信息的反馈时刻和反馈内容,对每个反馈内容进行关键词分析,确定对应反馈内容的情绪得分;
对处于相同反馈时刻的所有反馈内容的情绪得分求均值,确定均值为对应相同反馈时刻的情绪值,遍历所有目标事件,得到对应目标事件的情绪值和反馈时刻。
其中,对反馈内容进行关键词分析可以是基于情绪词法分析器来实现,当然,也可以采用其他关键词提取与情绪分析结合的方式来实现。在确定情绪得分之前,需要定义情绪的分类和分类中每种情绪所对应的情绪得分,进而在确定情绪后即可对应得到该情绪的情绪得分。
将情绪简化为两类:恐惧和贪婪,恐惧(-):负向情绪,定义分类:-1为担忧、-2为害怕、-3为恐慌、-4为胆颤心惊、-5为绝望,贪婪(+):正向情绪,定义分类:+1为愿意、+2为积极、+3为喜悦、+4为雀跃、+5为疯狂。通过情绪对应的分值,将同一反馈时刻的所有情绪相加求均值,确定对应均值为该反馈时刻的情绪值。
例如,就股票交易而言,针对一年期基准利率下调50个基点这一事件,在交易时间段内的9:30,存在5个受众的情绪,分别为担忧、愿意、雀跃、疯狂和害怕,对应该9:30的情绪值为(-1+1+4+5-2)/5=1.4。
步骤S202,针对任一反馈时刻,将每个目标事件的情绪值与对应目标事件的初始权重进行加权求和,确定加权求和结果为对应反馈时刻下的指数值,并将指数值按照时间顺序生成第一历史舆情指数。
本申请中,针对目标事件,定义每个事件的初始权重,用于计算情绪对应的舆情指数。不同的事件对舆情的影响不同,重要事件对舆情的影响程度较高,一般事件对舆情的影响程度较低。
在任一个反馈时刻,舆情对应的指数值可以由事件对应的权重和情绪值进行加权求和来确定,其中,针对N个目标事件,如果在某一个反馈时刻仅有M个目标事件存在情绪值,剩余的目标事件的情绪值置为0,M小于N,极端的情况是,在某一反馈时刻没有任何目标事件对应的情绪值,则该反馈时刻对应的指数值为0。
在得到所有反馈时刻对应的指数值后,按照时间顺序将所有的指数值连接形成曲线,即为根据第一历史反馈信息分析得到的第一历史舆情指数。
在一实施方式中,根据目标事件所对应的反馈信息的信息量来定义每个事件的初始权重,在一目标事件对应的反馈信息的信息量较多时,定义该目标事件的初始权重为相对较高,在一目标事件对应的反馈信息的信息量较少时,定义该目标事件的初始权重为相对较低,即事件的影响程度高对应了反馈信息的信息量较多,事件的影响程度低对应了反馈信息的信息量较少,从而更好地体现事件与舆情的关系。因此,在执行步骤S202之前,还统计每个目标事件对应的反馈信息的信息个数,将每个目标事件对应的信息个数进行归一化处理,进而得到每个目标事件对应的权重。
步骤S203,根据目标对象在前一天的交易时间段内的历史实际指数,对每个目标事件的初始权重进行优化,得到对应目标事件的优化权重。
本申请中,优化的目标为使得根据优化权重生成的第一历史舆情指数与历史实际指数的走势相同。权重优化是基于反馈机制而实行的优化策略,具体可以采用鲸鱼优化算法等。
历史实际指数可以是指前一天的交易时间段针对上述目标对象的实际指数,也即是目标对象在交易时间段的走势。例如,在目标对象为股票时,实际指数即为股票指数或股票走势。上述第一历史舆情指数与该历史实际指数的时间相对应,由于舆情指数影响实际指数或者实际指数影响舆情指数,需要第一历史舆情指数与历史实际指数的走势应为相同的。
上述第一历史舆情指数中权重为人为划定,为了满足第一历史舆情指数与历史实际指数的走势相同,需要对权重进行修正,修正后的优化权重再次与上述步骤S201的情绪值和反馈时刻共同形成新的第一历史舆情指数,该新的第一历史舆情指数的走势与历史实际指数的走势相同。
步骤S204,根据当前天的非交易时间段内针对每个目标事件的实时反馈信息和优化权重,确定当前舆情指数,并根据当前舆情指数,预测目标对象在当前天的交易时间段内的指数走势。
本申请中,采集当前天的非交易时间段内的实时反馈信息用于预测交易时间段的指数走势,非交易时间段可以是指一天内除交易时间段以外的时间段,如果预测交易时间段的指数走势,则非交易时间段为当前天内在交易时间段的开始时间以前的时间。例如,交易时间段为每天的上午9时至下午6时,如果要预测上午9时之后的指数走势,则无法获取上午9时之后的反馈信息,实时反馈信息为当前天的非交易时间段为0时至上午9时内的反馈信息。
针对实时反馈信息进行处理,确定目标事件对应的情绪值和反馈时刻,针对任一反馈时刻,将每个目标事件的情绪值与对应目标事件的优化权重进行加权求和,确定加权求和结果为对应反馈时刻下的指数值,并将指数值按照时间顺序生成指数即为当前舆情指数。
本申请中,对当前舆情指数进行拟合可以得到拟合曲线,通过时间前移和差值的方法得到交易时间段的曲线部分,将交易时间段的曲线部分作为预测的目标对象的指数走势。
在一实施方式中,将当前舆情指数中截取预设时间段的指数作为交易时间段的开始时间至目标时间之间的指数,开始时间与目标时间的间隔与预设时间段的长度相同。进一步地,截取的预设时间段的尾部为当前舆情指数的尾部,而目标时间之后的指数可以由实时获取的当前舆情指数的尾部之后的反馈信息进行计算得到。
可选的是,根据当前舆情指数,预测目标对象在当前天的交易时间段内的指数走势包括:
将当前舆情指数在前置时间点的实际走势作为当前时刻的预测走势,前置时间点为当前时刻前的与当前时刻间隔预设时间的时刻,当前时刻为交易时间段内的任一时刻;
获取当前时刻的实际交易值,并使用预测走势计算下一时刻的预测交易值。
其中,前置时间点可以是指针对当前时刻前的与当前时刻间隔预设时间的时刻,前置时间点的实际走势可以是指该前置时间点与下一时间点的变化趋势,例如,增长斜率等。
实际交易值可以是指当前时刻的指数实际值,例如,针对股票而言,在股票交易的开始时刻对应的股票值即为指数实际值。将变化趋势与指数交易值结合即可以得到下一时刻的预测交易值,实现指数的预测。
可选的是,在根据当前舆情指数,预测目标对象在当前天的交易时间段内的指数走势之后,还包括:
获取当前天的交易时间段内针对每个目标事件的实时反馈信息,结合优化权重,得到实时更新的实时舆情指数;
在前置时间点落入交易时间段内时,使用实时舆情指数,预测前置时间点后预设时间对应时刻的预测走势。
其中,采用非交易时间段的反馈信息得到的当前舆情指数,前置时间点最终会达到该当前舆情指数的尾部时刻,使用该当前舆情指数无法再对前置时间点超过尾部后对应的当前时刻的指数进行预测。
在当前时间达到当前舆情指数的尾部时刻后,采集当前时间的反馈信息作为实时信息,从而可以更新当前舆情指数,即得到实时更新的实时舆情指数,相应地,采用前置时间点的预测方式可以继续预测预设时间后对应时刻的走势。
本申请实施例获取前一天的交易时间段内针对N个目标事件的第一历史反馈信息,分析每个目标事件对应的第一历史反馈信息,确定对应的情绪值和反馈时刻,针对任一反馈时刻,将每个目标事件的情绪值与对应目标事件的初始权重进行加权求和,确定加权求和结果为对应反馈时刻下的指数值,并将指数值按照时间顺序生成第一历史舆情指数,根据目标对象在前一天的交易时间段内的历史实际指数,对每个目标事件的初始权重进行优化,得到对应目标事件的优化权重,使得根据优化权重生成的第一历史舆情指数与历史实际指数的走势相同,根据当前天的非交易时间段内针对每个目标事件的实时反馈信息和优化权重,确定当前舆情指数,并根据当前舆情指数,预测目标对象在当前天的交易时间段内的指数走势,实现基于历史舆情优化权重,使用优化后的权重对当前舆情进行舆情指数分析,从而可以准确地分析舆情和指数的关联性,使用该指数能够较为准确地预测目标对象的走势,为量化交易提供依据。
参见图3,是本申请实施例三提供的一种基于人工智能的舆情分析方法的流程示意图,如图3所示,该舆情分析方法可以包括以下步骤:
步骤S301,获取前一天的交易时间段内针对N个目标事件的第一历史反馈信息,分析每个目标事件对应的第一历史反馈信息,确定对应的情绪值和反馈时刻。
步骤S302,针对任一反馈时刻,将每个目标事件的情绪值与对应目标事件的初始权重进行加权求和,确定加权求和结果为对应反馈时刻下的指数值,并将指数值按照时间顺序生成第一历史舆情指数。
其中,步骤S301至步骤S302与上述步骤S201至步骤S202的内容相同,可参考步骤S201至步骤S202的描述,在此不再赘述。
步骤S303,获取前一天的非交易时间段内针对每个目标事件的第二历史反馈信息,并根据第二历史反馈信息,得到第二历史舆情指数。
本申请中,前一天的非交易时间段也可以获取到针对每个目标事件的反馈信息即第二历史反馈信息,对该第二历史反馈信息进行解析,可以得到对应情绪值和反馈时刻,同样地,针对任一反馈时刻,将每个目标事件的情绪值与对应目标事件的初始权重进行加权求和,确定加权求和结果为对应反馈时刻下的指数值,并将指数值按照时间顺序生成第二历史舆情指数。
步骤S304,将第一历史舆情指数与第二历史舆情指数整合为全天历史舆情指数。
本申请中,第二历史舆情指数为非交易时间段的舆情指数,第一历史舆情指数为交易时间段的舆情指数。将两者整合即可得到全天的舆情指数,即全天历史舆情指数,该指数的时间长度为全天。
步骤S305,根据目标对象在前一天的交易时间段内的历史实际指数,并使用插值算法对非交易时间段进行插值拟合,得到前一天的全天历史拟合指数。
本申请中,在获取到交易时间段内历史实际指数后,通过差值拟合的方式拟合得到针对目标对象的全天指数,即全天历史拟合指数,包括拟合部分和实际部分,该指数的时间长度为全天。
步骤S306,对每个目标事件的初始权重进行优化,得到对应目标事件的优化权重。
本申请中,使得根据优化权重生成的全天历史舆情指数与全天历史拟合指数的走势相同。
优化的具体过程可参考上述步骤S303的内容,在此不再赘述。
步骤S307,根据当前天的非交易时间段内针对每个目标事件的实时反馈信息和优化权重,确定当前舆情指数,并根据当前舆情指数,预测目标对象在当前天的交易时间段内的指数走势。
其中,步骤S307与上述步骤S204的内容相同,可参考步骤S204的描述,在此不再赘述。
可选的是,根据当前舆情指数,预测目标对象在当前天的交易时间段内的指数走势包括:
根据当前舆情指数,并使用插值算法对交易时间段进行插值拟合,确定拟合结果为目标对象在当前天的交易时间段内的指数走势。
其中,基于差值拟合的方式可以对实际指数进行拟合得到非交易时间段的拟合指数,同样地,采用差值拟合的方式可以对当前天的非交易时间段的当前舆情指数进行拟合,得到交易时间段的舆情的拟合指数,将该舆情的拟合指数的走势作为目标对象在当前天的交易时间段内的指数走势。
本申请实施例获取前一天的全天内针对N个目标事件的第一历史反馈信息,分析每个目标事件对应的第一历史反馈信息和第二历史反馈信息,确定对应的情绪值和反馈时刻,针对任一反馈时刻,将每个目标事件的情绪值与对应目标事件的初始权重进行加权求和,确定加权求和结果为对应反馈时刻下的指数值,并将指数值按照时间顺序生成全天历史舆情指数,根据目标对象在前一天的交易时间段内的历史实际指数拟合得到全天历史拟合指数,对每个目标事件的初始权重进行优化,得到对应目标事件的优化权重,使得根据优化权重生成的全天历史舆情指数与全天历史拟合指数的走势相同,根据当前天的非交易时间段内针对每个目标事件的实时反馈信息和优化权重,确定当前舆情指数,并根据当前舆情指数,预测目标对象在当前天的交易时间段内的指数走势,实现基于全天历史舆情的权重优化,使用优化后的权重对当前舆情进行舆情指数分析,从而可以准确地分析舆情和指数的关联性,使用该指数能够较为准确地预测目标对象的走势,为量化交易提供依据。
对应于上文实施例的舆情分析方法,图4示出了本申请实施例四提供的基于人工智能的舆情分析装置的结构框图,上述舆情分析装置可以应用于图1中的服务端,服务端对应的计算机设备连接相应的数据库,以获取数据库中相应的数据。上述计算机设备还可以连接服务器设备,以采集服务器中实时更新的数据。为了便于说明,仅示出了与本申请实施例相关的部分。
参见图4,该舆情分析装置包括:
第一预处理模块41,用于获取前一天的交易时间段内针对N个目标事件的第一历史反馈信息,分析每个目标事件对应的第一历史反馈信息,确定对应的情绪值和反馈时刻,N为大于零的整数;
第一指数确定模块42,用于针对任一反馈时刻,将每个目标事件的情绪值与对应目标事件的初始权重进行加权求和,确定加权求和结果为对应反馈时刻下的指数值,并将指数值按照时间顺序生成第一历史舆情指数;
权重优化模块43,用于根据目标对象在前一天的交易时间段内的历史实际指数,对每个目标事件的初始权重进行优化,得到对应目标事件的优化权重,使得根据优化权重生成的第一历史舆情指数与历史实际指数的走势相同;
走势预测模块44,用于根据当前天的非交易时间段内针对每个目标事件的实时反馈信息和优化权重,确定当前舆情指数,并根据当前舆情指数,预测目标对象在当前天的交易时间段内的指数走势。
可选的是,上述舆情分析装置还包括:
第二指数确定模块,用于获取前一天的非交易时间段内针对每个目标事件的第二历史反馈信息,并根据第二历史反馈信息,得到第二历史舆情指数;
第三指数确定模块,用于将第一历史舆情指数与第二历史舆情指数整合为全天历史舆情指数;
上述权重优化模块43包括:
第一拟合单元,用于根据目标对象在前一天的交易时间段内的历史实际指数,并使用插值算法对非交易时间段进行插值拟合,得到前一天的全天历史拟合指数;
权重优化单元,用于对每个目标事件的初始权重进行优化,得到对应目标事件的优化权重,使得根据优化权重生成的全天历史舆情指数与全天历史拟合指数的走势相同。
可选的是,上述走势预测模块44包括:
拟合走势单元,用于根据当前舆情指数,并使用插值算法对交易时间段进行插值拟合,确定拟合结果为目标对象在当前天的交易时间段内的指数走势。
可选的是,上述第一预处理模块41包括:
情绪得分确定单元,用于针对任一目标事件,提取目标事件下所有第一历史反馈信息的反馈时刻和反馈内容,对每个反馈内容进行关键词分析,确定对应反馈内容的情绪得分;
情绪值确定单元,用于对处于相同反馈时刻的所有反馈内容的情绪得分求均值,确定均值为对应相同反馈时刻的情绪值,遍历所有目标事件,得到对应目标事件的情绪值和反馈时刻。
可选的是,上述走势预测模块44包括:
走势确定单元,用于将当前舆情指数在前置时间点的实际走势作为当前时刻的预测走势,前置时间点为当前时刻前的与当前时刻间隔预设时间的时刻,当前时刻为交易时间段内的任一时刻;
交易值预测单元,用于获取当前时刻的实际交易值,并使用预测走势计算下一时刻的预测交易值。
可选的是,上述舆情分析装置还包括:
舆情指数更新模块,用于在根据当前舆情指数,预测目标对象在当前天的交易时间段内的指数走势之后,获取当前天的交易时间段内针对每个目标事件的实时反馈信息,结合优化权重,得到实时更新的实时舆情指数;
走势预测更新模块,用于在前置时间点落入交易时间段内时,使用实时舆情指数,预测前置时间点后预设时间对应时刻的预测走势。
需要说明的是,上述模块之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
图5为本申请实施例五提供的一种计算机设备的结构示意图。如图5所示,该实施例的计算机设备包括:至少一个处理器(图5中仅示出一个)、存储器以及存储在存储器中并可在至少一个处理器上运行的计算机程序,处理器执行计算机程序时实现上述任意各个舆情分析方法实施例中的步骤。
该计算机设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,图5仅仅是计算机设备的举例,并不构成对计算机设备的限定,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括网络接口、显示屏和输入装置等。
所称处理器可以是CPU,该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器包括可读存储介质、内存储器等,其中,内存储器可以是计算机设备的内存,内存储器为可读存储介质中的操作系统和计算机可读指令的运行提供环境。可读存储介质可以是计算机设备的硬盘,在另一些实施例中也可以是计算机设备的外部存储设备,例如,计算机设备上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,存储器还可以既包括计算机设备的内部存储单元也包括外部存储设备。存储器用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,该其他程序如计算机程序的程序代码等。存储器还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质至少可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
本申请实现上述实施例方法中的全部或部分流程,也可以通过一种计算机程序产品来完成,当计算机程序产品在计算机设备上运行时,使得计算机设备执行时实现可实现上述方法实施例中的步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/计算机设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/计算机设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于人工智能的舆情分析方法,其特征在于,所述舆情分析方法包括:
获取前一天的交易时间段内针对N个目标事件的第一历史反馈信息,分析每个目标事件对应的第一历史反馈信息,确定对应的情绪值和反馈时刻,N为大于零的整数;
针对任一反馈时刻,将每个目标事件的情绪值与对应目标事件的初始权重进行加权求和,确定加权求和结果为对应反馈时刻下的指数值,并将所述指数值按照时间顺序生成第一历史舆情指数;
根据目标对象在所述前一天的交易时间段内的历史实际指数,对每个目标事件的初始权重进行优化,得到对应目标事件的优化权重,使得根据所述优化权重生成的第一历史舆情指数与所述历史实际指数的走势相同;
根据当前天的非交易时间段内针对每个目标事件的实时反馈信息和所述优化权重,确定当前舆情指数,并根据所述当前舆情指数,预测所述目标对象在所述当前天的交易时间段内的指数走势。
2.根据权利要求1所述的舆情分析方法,其特征在于,所述舆情分析方法还包括:
获取所述前一天的非交易时间段内针对每个目标事件的第二历史反馈信息,并根据所述第二历史反馈信息,得到第二历史舆情指数;
将所述第一历史舆情指数与所述第二历史舆情指数整合为全天历史舆情指数;
根据目标对象在所述前一天的交易时间段内的历史实际指数,对每个目标事件的初始权重进行优化,得到对应目标事件的优化权重包括:
根据目标对象在所述前一天的交易时间段内的历史实际指数,并使用插值算法对非交易时间段进行插值拟合,得到所述前一天的全天历史拟合指数;
对每个目标事件的初始权重进行优化,得到对应目标事件的优化权重,使得根据所述优化权重生成的全天历史舆情指数与所述全天历史拟合指数的走势相同。
3.根据权利要求2所述的舆情分析方法,其特征在于,根据所述当前舆情指数,预测所述目标对象在所述当前天的交易时间段内的指数走势包括:
根据所述当前舆情指数,并使用所述插值算法对交易时间段进行插值拟合,确定拟合结果为所述目标对象在所述当前天的交易时间段内的指数走势。
4.根据权利要求1所述的舆情分析方法,其特征在于,分析每个目标事件对应的第一历史反馈信息,确定对应的情绪值和反馈时刻包括:
针对任一目标事件,提取目标事件下所有第一历史反馈信息的反馈时刻和反馈内容,对每个反馈内容进行关键词分析,确定对应反馈内容的情绪得分;
对处于相同反馈时刻的所有反馈内容的情绪得分求均值,确定均值为对应相同反馈时刻的情绪值,遍历所有目标事件,得到对应目标事件的情绪值和反馈时刻。
5.根据权利要求1所述的舆情分析方法,其特征在于,根据所述当前舆情指数,预测所述目标对象在所述当前天的交易时间段内的指数走势包括:
将所述当前舆情指数在前置时间点的实际走势作为所述当前时刻的预测走势,所述前置时间点为所述当前时刻前的与所述当前时刻间隔预设时间的时刻,所述当前时刻为交易时间段内的任一时刻;
获取所述当前时刻的实际交易值,并使用所述预测走势计算下一时刻的预测交易值。
6.根据权利要求5所述的舆情分析方法,其特征在于,在根据所述当前舆情指数,预测所述目标对象在所述当前天的交易时间段内的指数走势之后,还包括:
获取所述当前天的交易时间段内针对每个目标事件的实时反馈信息,结合所述优化权重,得到实时更新的实时舆情指数;
在所述前置时间点落入交易时间段内时,使用所述实时舆情指数,预测所述前置时间点后预设时间对应时刻的预测走势。
7.一种基于人工智能的舆情分析装置,其特征在于,所述舆情分析装置包括:
第一预处理模块,用于获取前一天的交易时间段内针对N个目标事件的第一历史反馈信息,分析每个目标事件对应的第一历史反馈信息,确定对应的情绪值和反馈时刻,N为大于零的整数;
第一指数确定模块,用于针对任一反馈时刻,将每个目标事件的情绪值与对应目标事件的初始权重进行加权求和,确定加权求和结果为对应反馈时刻下的指数值,并将所述指数值按照时间顺序生成第一历史舆情指数;
权重优化模块,用于根据目标对象在所述前一天的交易时间段内的历史实际指数,对每个目标事件的初始权重进行优化,得到对应目标事件的优化权重,使得根据所述优化权重生成的第一历史舆情指数与所述历史实际指数的走势相同;
走势预测模块,用于根据当前天的非交易时间段内针对每个目标事件的实时反馈信息和所述优化权重,确定当前舆情指数,并根据所述当前舆情指数,预测所述目标对象在所述当前天的交易时间段内的指数走势。
8.根据权利要求7所述的舆情分析装置,其特征在于,所述舆情分析装置还包括:
第二指数确定模块,用于获取所述前一天的非交易时间段内针对每个目标事件的第二历史反馈信息,并根据所述第二历史反馈信息,得到第二历史舆情指数;
第三指数确定模块,用于将所述第一历史舆情指数与所述第二历史舆情指数整合为全天历史舆情指数;
所述权重优化模块包括:
第一拟合单元,用于根据目标对象在所述前一天的交易时间段内的历史实际指数,并使用插值算法对非交易时间段进行插值拟合,得到所述前一天的全天历史拟合指数;
权重优化单元,用于对每个目标事件的初始权重进行优化,得到对应目标事件的优化权重,使得根据所述优化权重生成的全天历史舆情指数与所述全天历史拟合指数的走势相同。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的舆情分析方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的舆情分析方法。
CN202210602742.6A 2022-05-30 2022-05-30 基于人工智能的舆情分析方法、装置、计算机设备及介质 Active CN115048487B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210602742.6A CN115048487B (zh) 2022-05-30 2022-05-30 基于人工智能的舆情分析方法、装置、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210602742.6A CN115048487B (zh) 2022-05-30 2022-05-30 基于人工智能的舆情分析方法、装置、计算机设备及介质

Publications (2)

Publication Number Publication Date
CN115048487A true CN115048487A (zh) 2022-09-13
CN115048487B CN115048487B (zh) 2024-05-03

Family

ID=83158853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210602742.6A Active CN115048487B (zh) 2022-05-30 2022-05-30 基于人工智能的舆情分析方法、装置、计算机设备及介质

Country Status (1)

Country Link
CN (1) CN115048487B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116187094A (zh) * 2023-04-18 2023-05-30 中国标准化研究院 一种基于工作情况实时分析的质量工作预测系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021704A (zh) * 2017-12-27 2018-05-11 广东广业开元科技有限公司 一种基于社会舆情数据挖掘技术的坐席优化配置方法
CN109410046A (zh) * 2018-08-31 2019-03-01 平安科技(深圳)有限公司 目标股票选择方法、装置及存储介质
CN110110250A (zh) * 2018-01-18 2019-08-09 北京京东尚科信息技术有限公司 信息输出方法和装置
CN112330041A (zh) * 2020-11-16 2021-02-05 上海携宁计算机科技股份有限公司 信息预测方法、装置、电子设备及存储介质
CN112419029A (zh) * 2020-11-27 2021-02-26 诺丁汉(宁波保税区)区块链有限公司 类金融机构风险监控方法、风险模拟系统及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021704A (zh) * 2017-12-27 2018-05-11 广东广业开元科技有限公司 一种基于社会舆情数据挖掘技术的坐席优化配置方法
CN110110250A (zh) * 2018-01-18 2019-08-09 北京京东尚科信息技术有限公司 信息输出方法和装置
CN109410046A (zh) * 2018-08-31 2019-03-01 平安科技(深圳)有限公司 目标股票选择方法、装置及存储介质
CN112330041A (zh) * 2020-11-16 2021-02-05 上海携宁计算机科技股份有限公司 信息预测方法、装置、电子设备及存储介质
CN112419029A (zh) * 2020-11-27 2021-02-26 诺丁汉(宁波保税区)区块链有限公司 类金融机构风险监控方法、风险模拟系统及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116187094A (zh) * 2023-04-18 2023-05-30 中国标准化研究院 一种基于工作情况实时分析的质量工作预测系统

Also Published As

Publication number Publication date
CN115048487B (zh) 2024-05-03

Similar Documents

Publication Publication Date Title
Cavalli et al. CNN-based multivariate data analysis for bitcoin trend prediction
CN109615487A (zh) 基于用户行为的产品推荐方法、装置、设备及存储介质
CN109784779B (zh) 财务风险预测方法、装置及存储介质
CN111179051A (zh) 金融目标客户确定方法、装置及电子设备
CN113254542A (zh) 数据可视化处理方法及装置、电子设备
Fu et al. A sentiment-aware trading volume prediction model for P2P market using LSTM
CN114387061A (zh) 产品推送方法、装置、电子设备及可读存储介质
CN113392920B (zh) 生成作弊预测模型的方法、装置、设备、介质及程序产品
WO2019242453A1 (zh) 信息处理方法及装置、存储介质、电子装置
CN114817683A (zh) 一种信息推荐方法、装置、计算机设备及存储介质
US10922633B2 (en) Utilizing econometric and machine learning models to maximize total returns for an entity
CN111723180A (zh) 一种面试方法和装置
CN111274853B (zh) 图像处理方法和装置
US20210349920A1 (en) Method and apparatus for outputting information
CN115048487A (zh) 基于人工智能的舆情分析方法、装置、计算机设备及介质
CN112749238A (zh) 搜索排序方法、装置、电子设备以及计算机可读存储介质
CN109523296B (zh) 用户行为概率分析方法及装置、电子设备、存储介质
Xu et al. Web mining for financial market prediction based on online sentiments
CN114398562B (zh) 一种店铺数据管理方法、装置、设备及存储介质
CN113849618A (zh) 基于知识图谱的策略确定方法、装置、电子设备及介质
CN110737749B (zh) 创业计划评价方法、装置、计算机设备及存储介质
CN113112299A (zh) 一种贵金属价格趋势预测方法及装置
JP2023505058A (ja) 確定値及び推定値に基づくデータ定量化方法
Tao et al. Mining Pain Points from Hotel Online Comments Based on Sentiment Analysis
CN113837764B (zh) 风险预警方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant