CN109299226A - 一种数据处理方法及系统 - Google Patents

一种数据处理方法及系统 Download PDF

Info

Publication number
CN109299226A
CN109299226A CN201811248880.9A CN201811248880A CN109299226A CN 109299226 A CN109299226 A CN 109299226A CN 201811248880 A CN201811248880 A CN 201811248880A CN 109299226 A CN109299226 A CN 109299226A
Authority
CN
China
Prior art keywords
information
works
emotion
emotion information
participle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811248880.9A
Other languages
English (en)
Inventor
黄福伟
周伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201811248880.9A priority Critical patent/CN109299226A/zh
Publication of CN109299226A publication Critical patent/CN109299226A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

本申请提供了一种数据处理方法及系统,所述方法及系统通过分别对作品对象的对象信息以及使用者对作品对象的反馈信息进行情感分析,得到了作品对象自身的第一情感信息以及使用者对作品对象的第二情感信息,并存储作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息,这就使得能够为创作者后续作品对象的创作过程提供情感方面的相关参照/参考信息,从而,后续可利用已存储的至少一个作品对象的第一情感信息、第二情感信息及对象标识,从情感方面对创作者当前作品对象的创作过程进行协助,填补了现有技术未能从情感方面对内容创作者进行协助创作的空白,进一步提升了对内容创作者的协助创作效果。

Description

一种数据处理方法及系统
技术领域
本发明属于新媒体技术领域,尤其涉及一种数据处理方法及系统。
背景技术
随着新媒体平台的不断运营及多样化发展,全民创作的时代来临,新媒体内容创作越来越流行化与普遍化,在进行新媒体内容创作时,所关注的重点在于优质内容的创作,以使得所创作的作品能够获得较高的自然推荐量或粉丝订阅量/传播量。
目前的内容创作系统,如各种新媒体平台所提供的内容创作系统等,为了协助内容创作者创作出接受度较高的优质作品,相应提供了一些协助创作措施,这些措施主要在于智能检测所创作内容的拼写错误以及对受众用户(即是指作品的使用者,如观看、使用或传播创作者的创作作品的用户)进行画像等方面,例如通过对受众用户的性别、年龄、星座、地域、观看行为等方面信息进行统计实现对受众用户进行画像,在此基础上将受众用户的画像反馈给内容创作者以协助其后续内容的创作,使其结合受众用户画像创作出适用于受众用户的优质作品,然而,发明人经研究发现,目前各新媒体平台的内容创作系统在协助内容创作者进行内容创作时,未能从情感方面对内容创作者进行协助,导致协助效果不够理想。
发明内容
有鉴于此,本发明的目的在于提供一种数据处理方法及系统,以实现能够从情感方面协助内容创作者进行内容创作,从而提升对内容创作者的协助创作效果。
为此,本发明公开如下技术方案:
一种数据处理方法,包括:
获得作品对象的预定类型的对象信息;
对所述对象信息进行情感分析,得到所述作品对象的第一情感信息;
获得使用者对所述作品对象的反馈信息;
对所述反馈信息进行情感分析,得到使用者对所述作品对象所产生的情感的第二情感信息;
存储所述作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息;
基于已存储的至少一个作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息,为创作者当前作品对象的创作过程提供参考信息。
优选的,所述获得作品对象的预定类型的对象信息,包括:
获得所述作品对象的标题信息、描述信息及内容信息;
相对应地,所述对所述对象信息进行情感分析,得到所述作品对象的第一情感信息,包括:
对所述作品对象的标题信息、描述信息及内容信息进行情感分析,得到所述作品对象的第一情感信息。
优选的,所述获得使用者对所述作品对象的反馈信息,包括:
收集所述作品对象被使用过程中所产生的反馈信息。
优选的,所述对所述反馈信息进行情感分析,得到使用者对所述作品对象的第二情感信息,包括:
对所述作品对象被使用过程中所产生的反馈信息进行分词处理,并对分词处理后所得的各个分词进行词频统计,得到各个分词的词频;
基于预先制定的情感词典确定各个分词所对应的情感类别,并统计预先划分的各个第一预定时长的时间段内每种情感类别所对应包括的各个分词的总词频;作品对象的各个分词与各个分词的词频的对应关系以及各第一预定时长的时间段内每种情感类别与该情感类别对应包括的各个分词的总词频的对应关系构成作品对象的所述第二情感信息。
优选的,所述基于已存储的至少一个作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息,为创作者当前作品对象的创作过程提供参考信息,包括:
对当前作品对象的对象信息进行情感分析,得到所述当前作品对象的目标情感信息;
获得作品查询指令,所述作品查询指令包括所述目标情感信息;
从已存储的所述创作者的各个作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息中,查询出第一情感信息与所述目标情感信息相匹配的各个作品对象;
获得情感信息查看请求,所述情感信息查看请求包括所述相匹配的各个作品对象中目标作品对象的对象标识;
基于所述目标作品对象的对象标识,获得所述目标作品对象的第二情感信息,并以预定方式展示所述第二情感信息,以基于展示的目标作品对象的第二情感信息为创作者当前作品对象的创作过程提供参考信息。
优选的,所述以预定方式展示所述第二情感信息,包括:
以第一图示方式展示所述目标作品对象的反馈信息中的各个分词及分词对应的词频;
以第二图示方式按第二预定时长的时间段展示所述目标作品对象的反馈信息所对应的各个情感类别的占比信息;每个情感类别的占比信息为该情感类别对应包括的各分词的总词频在所述目标作品对象的反馈信息中所包括的所有分词的总词频中所占的比例。
一种数据处理系统,包括:
第一获取单元,用于获得作品对象的预定类型的对象信息;
第一情感分析单元,用于对所述对象信息进行情感分析,得到所述作品对象的第一情感信息;
第二获取单元,用于获得使用者对所述作品对象的反馈信息;
第二情感分析单元,用于对所述反馈信息进行情感分析,得到使用者对所述作品对象所产生的情感的第二情感信息;
存储单元,用于存储所述作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息;
协助创作单元,用于基于已存储的至少一个作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息,为创作者当前作品对象的创作过程提供参考信息。
优选的,所述第一获取单元,具体用于:获得所述作品对象的标题信息、描述信息及内容信息;
所述第一情感分析单元,具体用于:对所述作品对象的标题信息、描述信息及内容信息进行情感分析,得到所述作品对象的第一情感信息。
优选的,所述第二获取单元,具体用于:收集所述作品对象被使用过程中所产生的反馈信息。
优选的,所述第二情感分析单元对所述反馈信息进行情感分析,具体包括:
对所述作品对象被使用过程中所产生的反馈信息进行分词处理,并对分词处理后所得的各个分词进行词频统计,得到各个分词的词频;
基于预先制定的情感词典确定各个分词所对应的情感类别,并统计预先划分的各个第一预定时长的时间段内每种情感类别所对应包括的各个分词的总词频;作品对象的各个分词与各个分词的词频的对应关系以及各第一预定时长的时间段内每种情感类别与该情感类别对应包括的各个分词的总词频的对应关系构成作品对象的所述第二情感信息。
优选的,所述协助创作单元,具体用于:
对创作者在创作的当前作品对象的对象信息进行情感分析,得到所述当前作品对象的目标情感信息;
获得作品查询指令,所述作品查询指令包括所述目标情感信息;
从已存储的所述创作者的各个作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息中,查询出第一情感信息与所述目标情感信息相匹配的各个作品对象;
获得情感信息查看请求,所述情感信息查看请求包括所述相匹配的各个作品对象中目标作品对象的对象标识;
基于所述目标作品对象的对象标识,获得所述目标作品对象的第二情感信息,并以预定方式展示所述第二情感信息,以基于所展示的目标作品对象的第二情感信息为创作者当前作品对象的创作过程提供参考信息。
优选的,所述协助创作单元以预定方式展示所述第二情感信息,具体包括:
以第一图示方式展示所述目标作品对象的反馈信息中的各个分词及分词对应的词频;
以第二图示方式按第二预定时长的时间段展示所述目标作品对象的反馈信息所对应的各个情感类别的占比信息;每个情感类别的占比信息为该情感类别对应包括的各分词的总词频在所述目标作品对象的反馈信息中所包括的所有分词的总词频中所占的比例。
由以上方案可知,本申请提供的数据处理方法及系统,通过分别对作品对象的对象信息以及使用者对作品对象的反馈信息进行情感分析,得到了作品对象自身的第一情感信息以及使用者对作品对象的第二情感信息,并存储作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息,这就使得能够为创作者后续作品对象的创作过程提供情感方面的相关参照/参考信息,从而,后续可利用已存储的至少一个作品对象的第一情感信息、第二情感信息及对象标识,从情感方面对创作者当前作品对象的创作过程进行协助,填补了现有技术未能从情感方面对内容创作者进行协助创作的空白,进一步提升了对内容创作者的协助创作效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本申请实施例一提供的数据处理方法的流程图;
图2是本申请实施例二提供的数据处理方法的流程图;
图3是本申请实施例二提供的一种词频统计图;
图4是本申请实施例二提供的另一种词频统计图;
图5是本申请实施例二提供的相应时间段内用户反馈信息的情感信息占比示意图;
图6是本申请实施例三提供的数据处理系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了填补现有技术未能从情感方面对内容创作者进行协助创作的空白,实现能够从情感方面协助内容创作者进行内容创作,从而提升对内容创作者的协助创作效果,本申请提供了一种数据处理方法及系统,以下将通过多个实施例对本申请的数据处理方法及系统进行说明。
参考图1,是本申请提供的一种数据处理方法实施例一的流程图,该方法可以应用于但不限于终端设备或内容创作平台的后台服务器中,如图1所示,该数据处理方法包括如下步骤:
步骤101、获得作品对象的预定类型的对象信息。
所述作品对象可以是内容创作者在内容创作平台上创作的各种类型的新媒体作品,如文章、视频、图集等等。
本步骤中获得作品对象的预定类型的信息可以包括但不限于获得作品对象的标题、相关描述及内容等各类信息。
容易理解的是,现有技术的微信平台或各类视频营销平台等都可以看作是内容创作平台(当然还可以是其他的能够提供内容创作功能的平台),内容创作者可以通过其所持有的相应内容创作平台的账号,如微信公众号、视频营销平台账号等,在内容创作平台上进行文章、视频或图集等作品对象的内容创作。
步骤102、对所述对象信息进行情感分析,得到所述作品对象的第一情感信息。
在获得作品对象的标题、相关描述及内容等各类信息后,本步骤通过对作品对象的标题、相关描述及内容等各类信息进行情感分析,来给出所述作品对象自身的情感信息结果,即所述第一情感信息。
也就是说,所述第一情感信息用于反映所述作品对象的自身情感状况,所述第一情感信息可以包括但不限于作品对象自身所属的情感类别,如所述作品对象具体是属于正向(如励志型作品)、中性(如客观纪实型作品)还是负向(如消沉型作品)情感倾向的作品等。
步骤103、获得使用者对所述作品对象的反馈信息。
所述使用者是指通常所说的消费者,就是普通的用户,他一般不生产作品内容,只是对内容创作平台上的已有作品对象进行观看、使用或传播。
获得使用者对所述作品对象的反馈信息,具体可以是获得作品对象被使用过程中所产生的弹幕信息和/或评论信息,但并不以此为限。
步骤104、对所述反馈信息进行情感分析,得到使用者对所述作品对象所产生的情感的第二情感信息。
作品对象被使用过程中所产生的弹幕信息和/或评论信息,是作品对象的各使用者在观看、使用或传播作品对象的过程中基于其对作品内容的感受所给出的反馈信息,通常能够反映使用者对作品是否喜爱/是否接受/是否满意等方面的情感信息,鉴于此,本步骤将所获得的弹幕信息和/或评论信息应用于对使用者对作品对象的情感分析中,通过对作品对象被使用过程中所产生的弹幕信息和/或评论信息进行情感分析,得到使用者对所述作品对象所产生的情感的第二情感信息。
与所述第一情感信息相区别,所述第二情感信息具体反映的是使用者对作品对象所产生的情感的情感状况,所述第二情感信息可以包括但不限于使用者对作品对象所产生的情感所属的情感类别,如正向(喜爱/接受/满意)、中性、负向(不喜爱/不接受/不满意)等。
这里,需要说明的是,所述第一情感信息及所述第二情感信息中所包括的所述情感类别还可以采用其他的划分方式,具体可以由技术人员依据实际的情感处理需求确定,不必以本实施例提供的上述“正向、中性、负向”的划分方式为限。
步骤105、存储所述作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息。
所述对象标识例如可以是但不限于文章/视频/图集的名称、编号等信息。
所述存储所述作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息,在具体实施中,可以是直接存储作品对象的第一情感信息、第二情感信息及对象标识这三者之间的对应关系,如采用信息表的形式将三者作为表的三个列来存储这三者之间的对应关系等;或者,还可以分别存储作品对象的第一情感信息与作品对象的标识之间的对应关系,以及存储作品对象的第二情感信息与作品对象的标识之间的对应关系,基于所存储的这两种对应关系使得作品对象的第一情感信息与第二情感信息间接具备对应关系。
通过存储所述作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息,就可以使得能够为创作者后续作品对象的创作过程提供情感方面的相关参照/参考信息。
步骤106、基于已存储的至少一个作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息,为创作者当前作品对象的创作过程提供参考信息。
在上述步骤的基础上,可以将创作者所创作的一个或多个历史作品对象的相关情感信息(即所述第一情感信息、第二情感信息及对象标识的对应关系信息)进行存储,从而,在后续当创作者继续创作新的作品对象时,可以以其历史作品对象的相关情感信息为参照/参考,通过查看其历史作品对象的情感信息,如使用者对其某一情感类别(如正向)的历史作品对象所产生的情感信息等,来实时确定或调整其当前正在创作的作品的方向或内容等,以创作出更优质的作品对象。
由以上方案可知,本实施例提供的数据处理方法,通过分别对作品对象的对象信息以及使用者对作品对象的反馈信息进行情感分析,得到了作品对象自身的第一情感信息以及使用者对作品对象的第二情感信息,并存储作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息,这就使得能够为创作者后续作品对象的创作过程提供情感方面的相关参照/参考信息,从而,后续可利用已存储的至少一个历史作品对象的第一情感信息、第二情感信息及对象标识,从情感方面对创作者当前作品对象的创作过程进行协助,填补了现有技术未能从情感方面对内容创作者进行协助创作的空白,进一步提升了对内容创作者的协助创作效果。
在接下来的另一实施例中,继续对本申请的数据处理方法进行进一步详述,参考图2,是本申请提供的一种数据处理方法实施例二的流程图,本实施例二中,该方法可以通过如下的处理过程实现:
步骤201、获得作品对象的标题信息、描述信息及内容信息。
具体地,可在内容创作者,如B(Business)端作者使用内容创作平台进行作品对象的内容创作过程中,对作者输入的标题、描述及内容等信息进行获取并存储,以使得为后续的作品自身情感分析提供数据基础。
步骤202、对所述作品对象的标题信息、描述信息及内容信息进行情感分析,得到所述作品对象的第一情感信息。
可基于NLP(Natural Language Processing,自然语言处理)分词技术对作品对象的标题信息、描述信息及内容信息进行分词处理,得到作品对象的标题信息、描述信息及内容信息对应的各个分词,之后,利用情感词典确定出每个分词对应的情感信息(如正向、中性、负向等的情感类别)。其中,情感词典包括一系列的词语及其情感信息的对应关系信息。
需要说明的是,在当今的网络时代,随着网络用语的不断涌现与更迭,现有的情感词典已不能较好的满足其情感分析需求,针对这一情况,可以建立新的情感字典。具体地,可自动抓取网络中的词汇用语,人工确认、审核其对应的情感信息,并录入情感词典,比如,抓取网络词语“么么哒”,经过人工审核后,批注其为正向的情感,进而将该词语及其对应的情感信息录入情感词典等,使得情感词典能够适应当下不断涌现的网络词汇的情感分析需求。
在得到作品对象的标题信息、描述信息及内容信息的各个分词所对应的情感信息后,可通过词频统计确定出每种情感信息如每种情感类别所对应包括的各个词语的总词频,进而选取出总词频最高的情感信息作为作品对象的第一情感信息,例如,假设作品对象的属于正向情感的各个词语的总词频最高,则最终可将作品对象的第一情感信息也即作品对象的自身情感信息确定为“正向”情感。当然,在对作品对象的标题信息、描述信息及内容信息对应的各个分词基于其所属的情感类别进行总词频统计时,还可以针对分词的来源(来源于标题、描述还是内容)为其分配相应的权重,示例性地,例如,为标题及描述中的分词分配一较高权重,而内容中的分词分配一较低权重等,进而结合权重信息进行每种情感类别下的词频统计,以最终确定出作品对象所对应的第一情感信息。
步骤203、收集所述作品对象被使用过程中所产生的反馈信息。
所收集的反馈信息可以包括但不限于作品对象被使用过程中所产生的弹幕信息和/或评论信息。
作品对象被使用过程中所产生的弹幕信息和/或评论信息,是作品对象的各使用者在观看、使用或传播作品对象的过程中基于其对作品内容的感受所给出的反馈信息,通常能够反映使用者对作品是否喜爱/是否接受/是否满意等方面的情感信息,鉴于此,可通过收集作品对象被使用过程中所产生的弹幕信息和/或评论信息,如在C端(Customer)用户观看作品过程中,实时收集所产生的弹幕信息、评论信息等,来为使用者对作品对象所产生情感的情感分析过程提供数据基础。
步骤204、对所述作品对象被使用过程中所产生的反馈信息进行分词处理,并对分词处理后所得的各个分词进行词频统计,得到各个分词的词频。
具体地,可基于NLP分词技术对所收集的弹幕和/或评论信息进行分词,从而得到所收集的弹幕和/或评论信息所对应的各个分词。
之后,可继续对各个分词进行词频统计,得到各个分词的词频并对其进行存储,其中,词语的词频是指词语在所考察的范畴内(如一个文件或视频的所有反馈信息)中出现的次数,本申请中,一个词语的词频则是指该词语在作品对象被使用过程中所产生的弹幕和/或评论等反馈信息中出现的次数;对词频进行存储时所采用的存储结构可参见以下的表1,该表1示例性地给出了作品对象反馈信息(弹幕和/或评论)的分词及其词频的存储结构。
表1
作品ID 词频
A0001 1000
A0001 好看 2000
步骤205、基于情感词典确定各个分词所对应的情感类别,并统计预先划分的各个第一预定时长的时段内每种情感类别所对应包括的各个分词的总词频。
在得到作品对象反馈信息(弹幕和/或评论)的分词及其词频后,可继续基于情感词典确定各个分词所对应的情感类别,并按时间顺序(即沿时间轴按时间的先后顺序)统计各第一预定时长的时间段内每种情感类别所对应包括的各个分词的总词频,同时存储统计结果信息。
如通过情感词典确定出弹幕或评论中的分词“赞”、“好看”、“么么哒”、“稀饭”属于“正向”情感,而“郁闷”、“丧爆了”、“累觉不爱”等则属于“负向”情感,“天了噜”、“走你”、“宅男”等则属于“中性”情感。所述情感词典,优选地可采用前文所述的通过网络词汇抓取、人工情感审核等处理加入了网络词汇情感信息的情感词典。
在按时间顺序统计出各第一预定时长的时间段内每种情感类别所对应包括的各个分词的总词频后,可采用以下的表2示例性示出的存储结构按时间轴对各情感类别对应包括的各个分词的总词频进行存储:
表2
日期 正向 中性 负向
2017/10/01 1000 500 300
2017/10/02 3000 300 200
在上述处理的基础上,作品对象的各个分词与各个分词的词频的对应关系以及各第一预定时长的时间段内每种情感类别与该情感类别对应包括的各个分词的总词频的对应关系构成作品对象的所述第二情感信息(反映使用者对作品对象所产生的情感)。
步骤206、存储所述作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息。
所述对象标识可以是但不限于文章/视频/图集的名称、编号等信息。
通过存储所述作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息,就可以使得能够为创作者后续作品对象的创作过程提供情感方面的相关参照信息。
步骤207、对当前作品对象的对象信息进行情感分析,得到所述当前作品对象的目标情感信息;获得作品查询指令,所述作品查询指令包括所述目标情感信息。
通过将创作者所创作的一个或多个历史作品对象的相关情感信息(即所述第一情感信息、第二情感信息及对象标识的对应关系信息)进行存储,在后续当创作者继续创作新的作品对象时,可以以其历史作品对象的相关情感信息为参照,来创作出更优质的作品对象。
所述目标情感信息可以是但不限于创作者当前所创作的作品对象的情感类别。
具体地,可在内容创作平台中内容创作模块的编辑器界面的工具栏中增加一个用于触发实时监测情感的图标,在内容创作者进行当前作品对象的创作时,其可通过操作(如点击)该图标,来调用后台服务获取其输入的作品的标题、描述及内容等相关信息并对其进行实时的情感分析,从而得到所述当前作品对象的自身情感信息,即所述目标情感信息,如前文所述,所述目标情感信息可以是但不限于创作者当前所创作的作品对象的情感类别。
当然,作为另一种可能的实施方式,还可以在用户进行当前作品对象的创作过程中,由内容创作平台自动获取当前作品对象的相关对象信息并自动对其进行情感分析,而并非由创作者通过操作上文所述的情感检测图标来触发内容创作平台进行作品情感的分析,具体实施本申请时,可采用上述的任一种实现方式,本申请对此不进行限定。
假设创作者当前正在创作的作品对象的情感类别为“正向”,则内容创作平台可自动生成包括该“正向”情感类别的作品查询指令(当然也可以是基于用户的查询操作所触发生成的查询指令),以用于查询出该创作者之前发布的情感类别为“正向”的所有历史作品对象的作品列表,进而可由用户通过查看作品列表中作品的情感信息,为当前正创作的作品对象提供情感方面的参考信息(作品列表中的各作品对象与当前作品对象属于同类情感,可理解为同类作品,往往能够在情感方面为当前作品提供高价值的参考信息)。
步骤208、从已存储的所述创作者的各个作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息中,查询出第一情感信息与所述目标情感信息相匹配的各个作品对象。
相对应地,内容创作平台在生成所述作品查询指令后,可响应该指令,从已存储的该创作者的各个历史作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息中,查询出第一情感信息与该“正向”的情感类别相匹配的各个作品对象,并显示该创作者之前发布的情感类别为“正向”的所有作品对象的作品列表。
步骤209、获得情感信息查看请求,所述情感信息查看请求包括所述相匹配的各个作品对象中目标作品对象的对象标识。
在显示该创作者之前发布的情感类别为所需类别如“正向”的所有作品对象的作品列表基础上,创作者可进一步选择其中的某一作品对象,以实现向内容创作平台发出包含所选作品对象的对象标识的情感信息查看请求。
步骤210、基于所述目标作品对象的对象标识,获得所述目标作品对象的第二情感信息,并以预定方式展示所述第二情感信息。
内容创作平台在接收到包括目标作品对象的对象标识的情感信息查看请求后,可调出该目标作品对象的第二情感信息(即使用者对目标作品对象的反馈信息所对应的情感),并以预定方式展示所述第二情感信息。
所述以预定方式展示目标作品对象的第二情感信息,可以包括但不限于:以第一图示方式展示所述目标作品对象的反馈信息(弹幕和/或评论等)中的各个分词及分词对应的词频信息;以第二图示方式按第二预定时长的时间段展示所述目标作品对象的反馈信息所对应的各个情感类别的占比信息,每个情感类别的占比信息为该情感类别对应包括的各分词的总词频在所述目标作品对象的弹幕信息和/或评论信息中所包括的所有分词的总词频中所占的比例。
示例性地,参考图3示出的词频统计图,在展示目标作品对象的反馈信息(弹幕和/或评论)中的各个分词及其词频时,可基于分词的字体大小来体现分词的词频,其中,分词的词频越高字体越大,在显示效果上其就越醒目,反之,词频越低则字体越小,以通过与高词频分词在字体大小上的反差来向创作者重点突出高词频分词,进而便于创作者通过高词频分词了解使用者对其作品对象的主要情感。比如,图3中,“国产航母”出现1000次、“二手车”出现200次、“抢个沙发”出现180次,则“国产航母”的字体就最大,“抢个沙发”的字体最小。
进一步地,如图3所示,还可以在每个分词上关联其所对应的具体弹幕内容和/或评论内容,从而当鼠标/用户手指/触控笔等操作体操作相应分词(如将鼠标指针放在某一分词上)时,能够进一步显示用户发布的具体弹幕内容或者评论内容。
需要说明的是,在以字体大小来体现分词词频时,不必受限于图3的方式,还可以是其他的各种可行的方式,如图4所示,是本实施例提供的对分词及其词频进行展示的另一种词频统计图,其中,与图3的示例相类似,分词的词频越高字体越大,反之,词频越低则字体越小。
除了以图示方式展示目标作品对象反馈信息(用户弹幕和/或评论)的分词及其词频,还可以进一步按时间计算目标作品对象的反馈信息所对应的各个情感类别的占比,具体地,可基于所需时间段内各个情感类别分别对应包括的各个分词的总词频计算得到该时间段内各个情感类别的占比,如图5所示,以圆环方式示例性提供了“最近30天”以及“全部”这两个时间段内(即在图5的示例中,所述第二预定时长有“最近30天”及“全部”两种)各个情感类别的占比信息。
具体应用中,当创作者需查看其某一历史作品(一般来说,该需查看的历史作品与当前正创作的作品具有关联,如在作品情感方面同属于“正向”作品)的使用者情感信息时,可响应于创作者的查看操作,向其展示如图3/图4所示的词频统计图,以及如图5所示的情感类别占比信息图,从而,创作者即可以基于图3或图4了解使用者对其同类历史作品的较为详细的情感方面的评价信息,又可以基于图5从宏观方面了解使用者对该作品的情感占比,以确定使用者对其历史同类作品是否支持/喜欢以及支持/喜欢程度的情况。
除此之外,具体应用中,还可以针对每个历史作品,基于其用户反馈信息提供相对应的用户反馈情感曲线,其中,横轴为时间,纵轴为情感(正向、中性,负向),以通过该曲线反映用户在不同时间对该历史作品对象的情感走向信息,进一步为用户后续作品对象的创作过程提供参考。
步骤211、基于展示的目标作品对象的第二情感信息为创作者当前作品对象的创作过程提供参考信息,以协助创作者确定或调整其当前作品对象的创作方向或内容。
创作者在查看其历史同类作品的情感信息基础上,可进一步以用户对其历史同类作品的情感信息为参考,实时地确定或调整其当前作品对象的创作方向或内容,以创作出更优质的作品对象。
当然,实际应用中,内容创作平台还可以在向使用者展示其历史作品对象的情感信息基础上,同时向使用者提供与展示的情感信息相匹配的一些分析结果或建议,以供使用者结合这些信息更好地进行内容创作。
本实施例可利用已存储的至少一个历史作品对象的第一情感信息、第二情感信息及对象标识,从情感方面对创作者当前作品对象的创作过程进行协助,填补了现有技术未能从情感方面对内容创作者进行协助创作的空白,进一步提升了对内容创作者的协助创作效果。
与上述各实施例的数据处理方法相对应,本申请还提供了一种数据处理系统,该系统可以应用于但不限于终端设备或内容创作平台的后台服务器中,如图6所示,是本申请实施例三提供的数据处理系统的结构示意图,该数据处理系统包括:
第一获取单元601,用于获得作品对象的预定类型的对象信息;
第一情感分析单元602,用于对所述对象信息进行情感分析,得到所述作品对象的第一情感信息;
第二获取单元603,用于获得使用者对所述作品对象的反馈信息;
第二情感分析单元604,用于对所述反馈信息进行情感分析,得到使用者对所述作品对象所产生的情感的第二情感信息;
存储单元605,用于存储所述作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息;
协助创作单元606,用于基于已存储的至少一个历史作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息,对创作者当前作品对象的创作过程进行协助提供参考信息。
在本申请实施例的一实施方式中,所述第一获取单元601,具体用于:获得所述作品对象的标题信息、描述信息及内容信息;
所述第一情感分析单元602,具体用于:对所述作品对象的标题信息、描述信息及内容信息进行情感分析,得到所述作品对象的第一情感信息。
在本申请实施例的一实施方式中,所述第二获取单元603,具体用于:收集所述作品对象被使用过程中所产生的反馈信息。
在本申请实施例的一实施方式中,所述第二情感分析单元604对所述反馈信息进行情感分析,具体包括:对所述作品对象被使用过程中所产生的反馈信息进行分词处理,并对分词处理后所得的各个分词进行词频统计,得到各个分词的词频;基于预先制定的情感词典确定各个分词所对应的情感类别,并统计预先划分的各个第一预定时长的时间段内每种情感类别所对应包括的各个分词的总词频;作品对象的各个分词与各个分词的词频的对应关系以及各第一预定时长的时间段内每种情感类别与该情感类别对应包括的各个分词的总词频的对应关系构成作品对象的所述第二情感信息。
在本申请实施例的一实施方式中,所述协助创作单元606,具体用于:对创作者在创作的当前作品对象的对象信息进行情感分析,得到所述当前作品对象的目标情感信息;获得作品查询指令,所述作品查询指令包括所述目标情感信息;从已存储的所述创作者的各个历史作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息中,查询出第一情感信息与所述目标情感信息相匹配的各个作品对象;获得情感信息查看请求,所述情感信息查看请求包括所述相匹配的各个作品对象中目标作品对象的对象标识;基于所述目标作品对象的对象标识,获得所述目标作品对象的第二情感信息,并以预定方式展示所述第二情感信息,以基于所展示的目标作品对象的第二情感信息为创作者当前作品对象的创作过程提供参考信息。
在本申请实施例的一实施方式中,所述协助创作单元606,以预定方式展示所述第二情感信息,具体包括:以第一图示方式展示所述目标作品对象的反馈信息中的各个分词及分词对应的词频;以第二图示方式按第二预定时长的时间段展示所述目标作品对象的反馈信息所对应的各个情感类别的占比信息,每个情感类别的占比信息为该情感类别对应包括的各分词的总词频在所述目标作品对象的反馈信息中所包括的所有分词的总词频中所占的比例。
对于本发明实施例三公开的数据处理系统而言,由于其与实施例一至实施例二公开的数据处理方法相对应,所以描述的比较简单,相关相似之处请参见实施例一至实施例二中数据处理系统部分的说明即可,此处不再详述。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
为了描述的方便,描述以上系统或系统时以功能分为各种模块或单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
最后,还需要说明的是,在本文中,诸如第一、第二、第三和第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (12)

1.一种数据处理方法,其特征在于,包括:
获得作品对象的预定类型的对象信息;
对所述对象信息进行情感分析,得到所述作品对象的第一情感信息;
获得使用者对所述作品对象的反馈信息;
对所述反馈信息进行情感分析,得到使用者对所述作品对象所产生的情感的第二情感信息;
存储所述作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息;
基于已存储的至少一个作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息,为创作者当前作品对象的创作过程提供参考信息。
2.根据权利要求1所述的方法,其特征在于,所述获得作品对象的预定类型的对象信息,包括:
获得所述作品对象的标题信息、描述信息及内容信息;
相对应地,所述对所述对象信息进行情感分析,得到所述作品对象的第一情感信息,包括:
对所述作品对象的标题信息、描述信息及内容信息进行情感分析,得到所述作品对象的第一情感信息。
3.根据权利要求1所述的方法,其特征在于,所述获得使用者对所述作品对象的反馈信息,包括:
收集所述作品对象被使用过程中所产生的反馈信息。
4.根据权利要求3所述的方法,其特征在于,所述对所述反馈信息进行情感分析,得到使用者对所述作品对象的第二情感信息,包括:
对所述作品对象被使用过程中所产生的反馈信息进行分词处理,并对分词处理后所得的各个分词进行词频统计,得到各个分词的词频;
基于预先制定的情感词典确定各个分词所对应的情感类别,并统计预先划分的各个第一预定时长的时间段内每种情感类别所对应包括的各个分词的总词频;作品对象的各个分词与各个分词的词频的对应关系以及各第一预定时长的时间段内每种情感类别与该情感类别对应包括的各个分词的总词频的对应关系构成作品对象的所述第二情感信息。
5.根据权利要求4所述的方法,其特征在于,所述基于已存储的至少一个作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息,为创作者当前作品对象的创作过程提供参考信息,包括:
对当前作品对象的对象信息进行情感分析,得到所述当前作品对象的目标情感信息;
获得作品查询指令,所述作品查询指令包括所述目标情感信息;
从已存储的所述创作者的各个作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息中,查询出第一情感信息与所述目标情感信息相匹配的各个作品对象;
获得情感信息查看请求,所述情感信息查看请求包括所述相匹配的各个作品对象中目标作品对象的对象标识;
基于所述目标作品对象的对象标识,获得所述目标作品对象的第二情感信息,并以预定方式展示所述第二情感信息,以基于展示的目标作品对象的第二情感信息为创作者当前作品对象的创作过程提供参考信息。
6.根据权利要求5所述的方法,其特征在于,所述以预定方式展示所述第二情感信息,包括:
以第一图示方式展示所述目标作品对象的反馈信息中的各个分词及分词对应的词频;
以第二图示方式按第二预定时长的时间段展示所述目标作品对象的反馈信息所对应的各个情感类别的占比信息;每个情感类别的占比信息为该情感类别对应包括的各分词的总词频在所述目标作品对象的反馈信息中所包括的所有分词的总词频中所占的比例。
7.一种数据处理系统,其特征在于,包括:
第一获取单元,用于获得作品对象的预定类型的对象信息;
第一情感分析单元,用于对所述对象信息进行情感分析,得到所述作品对象的第一情感信息;
第二获取单元,用于获得使用者对所述作品对象的反馈信息;
第二情感分析单元,用于对所述反馈信息进行情感分析,得到使用者对所述作品对象所产生的情感的第二情感信息;
存储单元,用于存储所述作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息;
协助创作单元,用于基于已存储的至少一个作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息,为创作者当前作品对象的创作过程提供参考信息。
8.根据权利要求7所述的系统,其特征在于,所述第一获取单元,具体用于:获得所述作品对象的标题信息、描述信息及内容信息;
所述第一情感分析单元,具体用于:对所述作品对象的标题信息、描述信息及内容信息进行情感分析,得到所述作品对象的第一情感信息。
9.根据权利要求7所述的系统,其特征在于,所述第二获取单元,具体用于:收集所述作品对象被使用过程中所产生的反馈信息。
10.根据权利要求9所述的系统,其特征在于,所述第二情感分析单元对所述反馈信息进行情感分析,具体包括:
对所述作品对象被使用过程中所产生的反馈信息进行分词处理,并对分词处理后所得的各个分词进行词频统计,得到各个分词的词频;
基于预先制定的情感词典确定各个分词所对应的情感类别,并统计预先划分的各个第一预定时长的时间段内每种情感类别所对应包括的各个分词的总词频;作品对象的各个分词与各个分词的词频的对应关系以及各第一预定时长的时间段内每种情感类别与该情感类别对应包括的各个分词的总词频的对应关系构成作品对象的所述第二情感信息。
11.根据权利要求10所述的系统,其特征在于,所述协助创作单元,具体用于:
对创作者在创作的当前作品对象的对象信息进行情感分析,得到所述当前作品对象的目标情感信息;
获得作品查询指令,所述作品查询指令包括所述目标情感信息;
从已存储的所述创作者的各个作品对象的第一情感信息、第二情感信息及对象标识的对应关系信息中,查询出第一情感信息与所述目标情感信息相匹配的各个作品对象;
获得情感信息查看请求,所述情感信息查看请求包括所述相匹配的各个作品对象中目标作品对象的对象标识;
基于所述目标作品对象的对象标识,获得所述目标作品对象的第二情感信息,并以预定方式展示所述第二情感信息,以基于所展示的目标作品对象的第二情感信息为创作者当前作品对象的创作过程提供参考信息。
12.根据权利要求11所述的系统,其特征在于,所述协助创作单元以预定方式展示所述第二情感信息,具体包括:
以第一图示方式展示所述目标作品对象的反馈信息中的各个分词及分词对应的词频;
以第二图示方式按第二预定时长的时间段展示所述目标作品对象的反馈信息所对应的各个情感类别的占比信息;每个情感类别的占比信息为该情感类别对应包括的各分词的总词频在所述目标作品对象的反馈信息中所包括的所有分词的总词频中所占的比例。
CN201811248880.9A 2018-10-25 2018-10-25 一种数据处理方法及系统 Pending CN109299226A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811248880.9A CN109299226A (zh) 2018-10-25 2018-10-25 一种数据处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811248880.9A CN109299226A (zh) 2018-10-25 2018-10-25 一种数据处理方法及系统

Publications (1)

Publication Number Publication Date
CN109299226A true CN109299226A (zh) 2019-02-01

Family

ID=65157816

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811248880.9A Pending CN109299226A (zh) 2018-10-25 2018-10-25 一种数据处理方法及系统

Country Status (1)

Country Link
CN (1) CN109299226A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100262597A1 (en) * 2007-12-24 2010-10-14 Soung-Joo Han Method and system for searching information of collective emotion based on comments about contents on internet
CN102257492A (zh) * 2008-12-19 2011-11-23 伊斯曼柯达公司 用于产生语境增强的交流作品的系统和方法
CN102663046A (zh) * 2012-03-29 2012-09-12 中国科学院自动化研究所 一种面向微博短文本的情感分析方法
CN103793503A (zh) * 2014-01-24 2014-05-14 北京理工大学 一种基于web文本的观点挖掘与分类的方法
CN105930416A (zh) * 2016-04-19 2016-09-07 中山大学 一种用户反馈信息的可视化处理方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100262597A1 (en) * 2007-12-24 2010-10-14 Soung-Joo Han Method and system for searching information of collective emotion based on comments about contents on internet
CN102257492A (zh) * 2008-12-19 2011-11-23 伊斯曼柯达公司 用于产生语境增强的交流作品的系统和方法
CN102663046A (zh) * 2012-03-29 2012-09-12 中国科学院自动化研究所 一种面向微博短文本的情感分析方法
CN103793503A (zh) * 2014-01-24 2014-05-14 北京理工大学 一种基于web文本的观点挖掘与分类的方法
CN105930416A (zh) * 2016-04-19 2016-09-07 中山大学 一种用户反馈信息的可视化处理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李婷: "微博客文学研究", 《中国优秀硕士学位论文全文数据库》 *

Similar Documents

Publication Publication Date Title
Floyd et al. Timing of visual bodily behavior in repair sequences: Evidence from three languages
Kendrick et al. Gaze direction signals response preference in conversation
CN110741601B (zh) 具有会议功能的自动助理
Obleser et al. Expectancy constraints in degraded speech modulate the language comprehension network
US20190028520A1 (en) Ai mediated conference monitoring and document generation
Gonzalez-Vallejo et al. “Save angels perhaps”: A critical examination of unconscious thought theory and the deliberation-without-attention effect
CN105704425B (zh) 会议系统和用于控制会议系统的方法
Smallman Public Understanding of Science in turbulent times III: Deficit to dialogue, champions to critics
DE102017125196A1 (de) Proaktive Aufnahme von nicht angefordertem Inhalt in Mensch-Computer-Dialoge
KR102198946B1 (ko) 목표달성을 위한 개인화커리큘럼제공장치 및 방법
Hurtienne et al. Prior experience and intuitive use: image schemas in user centred design
Brown A lasting legacy? Sustaining innovation in a social work context
Baur et al. eXplainable cooperative machine learning with NOVA
Griffin The eyes are right when the mouth is wrong
North et al. The relationship between pop music and lyrics: A computerized content analysis of the United Kingdom’s weekly top five singles, 1999–2013
Drahota et al. The sociogram: A useful tool in the analysis of focus groups
Wagner et al. Applying cooperative machine learning to speed up the annotation of social signals in large multi-modal corpora
Kirjavainen et al. Can filled pauses be represented as linguistic items? Investigating the effect of exposure on the perception and production of um
Tokita et al. Precision and bias in approximate numerical judgment in auditory, tactile, and cross-modal presentation
Scheepers et al. Evidence for serial coercion: A time course analysis using the visual-world paradigm
CN109299226A (zh) 一种数据处理方法及系统
US20080126127A1 (en) Method and System for Estimating Usage of Blood Products
Weichbroth et al. A note on the affective computing systems and machines: a classification and appraisal
Gumnior et al. Assimilation in existing and novel German compounds
Maier et al. The effects of effort-feedback on time spent for information processing in multi-criteria decision making

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190201

RJ01 Rejection of invention patent application after publication