CN110110217A - 一种对信息的情感倾向性分析及信息推荐方法和装置 - Google Patents

一种对信息的情感倾向性分析及信息推荐方法和装置 Download PDF

Info

Publication number
CN110110217A
CN110110217A CN201810105327.3A CN201810105327A CN110110217A CN 110110217 A CN110110217 A CN 110110217A CN 201810105327 A CN201810105327 A CN 201810105327A CN 110110217 A CN110110217 A CN 110110217A
Authority
CN
China
Prior art keywords
value
user
emotion
score
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810105327.3A
Other languages
English (en)
Inventor
吴伟勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Ucweb Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ucweb Inc filed Critical Ucweb Inc
Priority to CN201810105327.3A priority Critical patent/CN110110217A/zh
Publication of CN110110217A publication Critical patent/CN110110217A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种对信息的情感倾向性分析及信息推荐方法和装置。所述对信息情感倾向性的分析方法包括:对网络上的信息内容提取多个关键词,其包括用于表示正向情感倾向程度的正向饱满度词、和用于表示负向情感倾向程度的负向饱满度词;基于所提取的关键词和预置词汇库中记录的正向饱满度词及分值、和负向饱满度词及分值,分别计算所提取的关键词中的正向饱满度词的总分值和负向饱满度词的总分值;比较正向饱满度词的总分值与负向饱满度词的总分值的绝对值,由此可以分析出该信息所表达的情感倾向性,即正向情感或负向情感。

Description

一种对信息的情感倾向性分析及信息推荐方法和装置
技术领域
本发明涉及信息处理技术领域,具体而言涉及一种对信息的情感倾向性分析及信息推荐方法和装置。
背景技术
随着互联网和智能移动终端的普及和发展,越来越多的用户从使用接入互联网的例如计算机等终端设备来浏览和获取网络上的信息,例如新闻、小说等,扩展到经常使用例如智能手机、平板电脑等智能移动终端来上网浏览和获取网络上的信息。使用浏览器和具有自有业务的应用程序(APP)是用户浏览信息的重要工具和方式。
对于浏览器开发商或是具有自有业务的应用程序产品开发商而言,希望用户使用自己的产品能有好的使用体验,需要在产品上不断提供新功能来满足用户的使用需求。提供向用户主动推荐信息的功能,方便用户快速浏览期望的信息,这可以较好地满足用户对信息的需求。对于作为信息浏览的工具-浏览器,浏览器开发商更是在信息推荐方面做了很多技术研发工作并且有多种推荐方法在浏览器上已经使用。
目前,现有的信息推荐方法包括:根据热点推荐信息,例如新闻、小说、评论文章;基于用户经常浏览的版块页面推荐该版块页面上的信息;推荐重要时事新闻或评论文章,例如国家刚刚出台的新政策、新华社刚刚发布重要新闻或评论性文章等等。另外,确定热点信息的具体方式也有很多种方法,例如确定点评量排在前面的信息为热点信息,确定浏览量在前面的信息为热点信息等等。
但是,现有的信息推荐方法基本上是向用户推荐公众感兴趣的信息,但这满足不了不同用户的个性化需求。即便采用基于用户经常浏览的版块页面推荐该版块页面上的信息的方法,但推荐的信息未必是用户最感兴趣的信息,例如用户经常浏览体育新闻版块,但该用户若是只对足球信息感兴趣,此时推荐的信息是体育新闻版块上的非足球类的信息,例如篮球方面的信息,则该用户未必能关注推荐的信息,这无法提高用户的使用体验;再例如,用户经常浏览小说类板块,但该用户喜欢玄幻类小说,如果推荐的信息是小说类板块上的非玄幻类小说的信息,则该用户同样未必能关注推荐的信息。
除此之外,目前现有的信息推荐方法还包括例如根据用户正在浏览的信息推荐类似的信息,但这种类似信息仅仅是将标注的同类标签默认为类似信息,在无同类标签的情况下,推荐相同大类别的信息,例如当用户浏览的信息包含了多个标签,向用户推荐具有与其中一个标签相同标签的信息时,该信息不一定是该用户感兴趣的。举例:用户在使用浏览器观看其提供的短视频,该短视频的标签是:周星驰、喜剧;如果该用户是周星驰的影迷,当推荐具有喜剧标签但非周星驰主演的短视频信息,甚至可能推荐的是该用户不喜欢的演员主演的喜剧短视频信息时,该用户不会关注所推荐的信息。现有的这种推荐方法依然无法实现对用户精确推荐其感兴趣的信息。
目前,需要继续开发新的信息推荐方法来实现向用户精确推荐其感兴趣的信息。
发明内容
本发明的目的在于提供一种对信息的情感倾向性分析及信息推荐方法和装置,以改善上述问题。
本发明第一实施例提供了一种对信息的情感倾向性的分析方法,包括:
对网络上的信息内容提取多个关键词,其包括用于表示正向情感倾向程度的正向饱满度词、和用于表示负向情感倾向程度的负向饱满度词;
基于所提取的多个关键词和预置的包含有多个所述正向饱满度词和所述负向饱满度词的词汇库中记录的正向饱满度词及其分值、和负向饱满度词及其分值,分别计算所提取的多个关键词中的正向饱满度词的总分值和负向饱满度词的总分值;
比较正向饱满度词的总分值与负向饱满度词的总分值的绝对值,当正向饱满度词的总分值大于或等于负向饱满度词的总分值的绝对值时该信息所表达的情感为正向情感;当正向饱满度词的总分值小于负向饱满度词的总分值的绝对值时该信息所表达的情感为负向情感。
本发明第二实施例提供了一种信息情感倾向性的分析装置,其包括:
关键词提取单元,用于对网络上的信息内容提取多个关键词,其包括用于表示正向情感倾向程度的正向饱满度词、和用于表示负向情感倾向程度的负向饱满度词;
信息情感值计算单元,用于基于所提取的多个关键词和预置的包含有多个所述正向饱满度词和所述负向饱满度词的词汇库中记录的正向饱满度词及其分值、和负向饱满度词及其分值,分别计算所提取的多个关键词中的正向饱满度词的总分值和负向饱满度词的总分值;
信息情感倾向性确定单元,用于比较正向饱满度词的总分值与负向饱满度词的总分值的绝对值,当正向饱满度词的总分值大于或等于负向饱满度词的总分值的绝对值时该信息所表达的情感为正向情感;当正向饱满度词的总分值小于负向饱满度词的总分值的绝对值时该信息所表达的情感为负向情感。
本发明第三实施例提供了一种信息推荐方法,其包括:
基于第一实施例所述的分析方法获得网络上的信息的情感倾向性,将所述信息的情感倾向性数值化为位于一个任意设定的区间内的具体值;
用所述任意设定的区间内的数值大小表征用户的情绪状态;
实时确定用户的实际情绪区间值,将该情感倾向性值位于该实际情绪区间值之内的信息推荐给该用户。
本发明第四实施例提供了一种信息推荐装置,其包括:
如第二实施例所述的信息情感倾向性的分析装置,用于获得网络上的信息的情感倾向性;
情感倾向性数值化单元,用于将所述信息的情感倾向性数值化为位于一个任意设定的区间内的具体值;
用户情绪数值化单元,用于使用所述任意设定的区间内的数值大小表征用户的情绪状态;
推荐单元,用于实时确定所述用户的实际情绪区间值,将该情感倾向性值位于该实际情绪区间值之内的信息推荐给该用户。
根据本发明实施例提供的对信息情感倾向性的分析方法和装置,可以定性分析出网络上的页面信息的情感倾向性,即正向情感或负向情感,还能够对所述页面信息的情感倾向性进行定量分析,这为基于用户的情绪状态而进行个性化的精确推荐信息提供了数据基础,还可以定性和定量分析用户浏览过的网页信息,进而为该用户画像,得出该用户的情感偏好。本发明实施例还提供了信息推荐方法和装置,其结合了所述对信息情感倾向性的分析方法和装置,通过定性和定量分析出网络上的页面信息的情感倾向性,以及实时确定出用户的当前情绪状态,向其推荐符合其情绪的信息或文章等,有助于提高用户对所推荐的信息的兴趣度,进而实现个性化的精确推荐信息的目的。
附图说明
图1是本发明第一实施例提供的对信息情感倾向性的分析方法的流程图;
图2是本发明第一实施例提供的对信息情感倾向性的分析方法的流程图;
图3是本发明第二实施例提供的信息情感倾向性的分析装置的示意性框图;
图4是本发明第二实施例提供的信息情感倾向性的分析装置的示意性框图;
图5是本发明第三实施例提供的信息推荐方法的流程图;
图6是本发明第四实施例提供的信息推荐装置的示意性框图;
图7是本发明第四实施例提供的信息推荐装置的示意性框图;
图8是显示可用于实现本发明的实施例的实施环境的硬件配置的例子的框图。
具体实施方式
下面将结合本发明实施例和附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明第一实施例提供的对信息的情感倾向性分析方法的流程图。如图1所示,本发明第一实施例提供的对信息的情感倾向性的分析方法包括:
S1:对网络上的信息内容提取多个关键词,其包括用于表示正向情感倾向程度的正向饱满度词、和用于表示负向情感倾向程度的负向饱满度词。
在上下文中涉及的网络上的信息或者用户浏览的页面信息包括但不限于:各类新闻、资讯、评论性文章或其他文章等。一般来说,作者在网页上发布一篇文章时往往会在标题上或内容中使用包含一些情感倾向信息的词语,例如在标题为“中国队8:0横扫伊朗队,为里皮报回一箭之仇!”的某篇资讯文章中,叙述了中国U19女足8:0横扫伊朗队的体育消息,文中使用了“捍卫”、“荣誉”、“重拾尊严”等与情绪相关的词语,这些关键词信息体现了文章所表达的情感倾向性。用户在阅读这类资讯文章时也会有自己的情感倾向性,并且更倾向于浏览符合自己的情感倾向性的文章,尤其是新闻类、资讯类、评论性文章等。
在本文中,使用正向饱满度词来表示正向情感倾向性程度,即将表现正向意义的自然词或者复合词等定义为正向饱满度词,例如“荣耀”、“激励”、“承前启后”等。
使用负向饱满度词来表示负向情感倾向性程度,即将表现负向意义的自然词或者复合词等定义为负向饱满度词,例如“凄惨”、“可怜”、“遗臭万年”等。
采用公知的分词方法对网络上的信息内容进行分词处理并提取出多个关键词,所提取的多个关键词中包括了用于表示正向情感倾向程度的所述正向饱满度词、和用于表示负向情感倾向程度的所述负向饱满度词。
S2:基于所提取的多个关键词和预置的包含有多个所述正向饱满度词和所述负向饱满度词的词汇库中记录的正向饱满度词及其分值、和负向饱满度词及其分值,分别计算所提取的多个关键词中的正向饱满度词的总分值和负向饱满度词的总分值。
在该第一实施例提供的对信息的情感倾向性分析方法中,通常会预置一个词汇库,该词汇库里包含有多个所述正向饱满度词和所述负向饱满度词,并且所包含的每个正向饱满度词都有相应的分值以表示正向情感倾向程度的大小,所包含的每个负向饱满度词都有相应的分值以表示负向情感倾向程度的大小。通常,以正数表示正向饱满度词的分值,以负数表示负向饱满度词的分值;进一步,还可以用正整数表示正向饱满度词的分值,用负整数表示负向饱满度词的分值。在预先收集多个表示正向情感倾向程度的正向饱满度词和多个表示负向情感倾向程度的负向饱满度词以用于建立词汇库的过程中,可以按照一定规则给收集的每个正向饱满度词赋予一个分值、和给收集的每个负向饱满度词赋予一个分值。例如,假设采用5分制表示情感倾向性程度,给“荣耀”赋予的分值为5,给“激励”赋予的分值是3,给“承前启后”赋予的分值是1;给“凄惨”赋予的分值为-5,给“可恶”赋予的分值是-4,给“可怜”赋予的分值是-2。
这样,基于所提取的多个关键词和预置的包含有多个所述正向饱满度词和所述负向饱满度词的词汇库中记录的正向饱满度词及其分值、和负向饱满度词及其分值,就能够分别计算所提取的多个关键词中的表示正向情感倾向程度的正向饱满度词的总分值和表示负向情感倾向程度的负向饱满度词的总分值。即,从在步骤S1提取的多个关键词中取出每一个关键词与预置词汇库中记录的正向饱满度词和负向饱满度词进行比对,当某个关键词与所述词汇库中的某个正向饱满度词或者某个负向饱满度词相符合时,记录该关键词及其相应的分值,由此可以得到所提取的多个关键词中涉及的多个正向饱满度词及其分值、和多个负向饱满度词及其分值,将得到的所述多个正向饱满度词的分值进行累加以得到表示正向情感倾向程度的正向饱满度词的总分值,将得到的所述多个负向饱满度词的分值进行累加以得到表示负向情感倾向程度的负向饱满度词的总分值。
关于预置词汇库,可以使用人工整理和/或人工智能学习的方式,采集众多资源样本中的各种表征情感倾向性的词语(自然词或者复合词等),包括正向饱满度词和负向饱满度词。在一个实施例中,所述词汇库中记录的表示正向情感倾向程度的正向饱满度词的分值和表示负向情感倾向程度的负向饱满度词的分值的确定方法包括:采集多个样本,根据在所述多个样本中正向饱满度词和负向饱满度词的出现频率来确定每个正向饱满度词的分值和每个负向饱满度词的分值。在一个更具体的实施例中,在所述多个样本中正向饱满度词和负向饱满度词的出现频率的基础上,还可以考虑正向饱满度词和负向饱满度词在日常使用过程中自身所表达的语气程度和感情程度,综合评价确定每个正向饱满度词的分值和每个负向饱满度词的分值。
另外,在所述确定正向饱满度词的分值和负向饱满度词的分值的方法中,还可以按照相同标准将正向饱满度词的分值和负向饱满度词的分值分为2个或2个以上档次,不同档次的分值不同,不同档次对应于正向饱满度词和负向饱满度词在所述多个样本中在不同范围之内的出现频率。例如,假设采用5分制表示情感倾向性程度,将分值分为3个档次,设定出现频率在较低范围内的为高档,分值为5分,出现频率在中间范围内的为中档,分值为3分,出现频率在较高范围内的为低档,分值为1分;在这个例子中,可以设定正向饱满度词或负向饱满度词在样本中的出现频率的范围在0-30%之间为高档,出现频率的范围在30-70%之间为中档,出现频率的范围在70-100%之间为低档。
S3:比较正向饱满度词的总分值与负向饱满度词的总分值的绝对值,当正向饱满度词的总分值大于或等于负向饱满度词的总分值的绝对值时该信息所表达的情感为正向情感;当正向饱满度词的总分值小于负向饱满度词的总分值的绝对值时该信息所表达的情感为负向情感。
因为用正数表示正向饱满度词的分值,用负数表示负向饱满度词的分值,所以在进行总分值比较时,用正向饱满度词的总分值与负向饱满度词的总分值的绝对值进行比较,当正向饱满度词的总分值大于或等于负向饱满度词的总分值的绝对值时该信息所表达的情感为正向情感;当正向饱满度词的总分值小于负向饱满度词的总分值的绝对值时该信息所表达的情感为负向情感。
在该第一实施例中,可以分析出信息所表达的情感倾向性为正向还是负向,但这仅仅是定性分析,有时候还需要能够定量看到信息所表征的情感倾向,因此对分析出的信息的情感倾向性进行数值化处理就显得很有必要。
在另一个具体实施例中,还可以将分析出的信息的情感倾向性进行数值化处理。由此,如图2所示,本发明第一实施例提供的对信息的情感倾向性的分析方法进一步包括:
S4:将对信息的情感倾向性进行数值化,其中:
当所述信息所表达的情感倾向性为正向情感时,将该信息所表达的正向情感数值化为:
正向情感值=(|score_p/score_n|-100%)*A+B
其中:
score_p表示正向饱满度词的总分值;
score_n表示负向饱满度词的总分值;
A和B是常数;
当所述信息所表达的情感倾向性为负向情感时,将该信息所表达的负向情感数值化为:
负向情感值=B-(|score_n/score_p|-100%)*A
其中:
score_p表示正向饱满度词的总分值;
score_n表示负向饱满度词的总分值;
A和B是常数。
其中,在将信息所表达的正向情感和负向情感数值化过程中,设定任意一个区间值,A用作为放大因子,可以自定义设置具体值,也可以根据实践经验值进行设置,B取值为该区间最大值的一半,取|score_p/score_n|和|score_n/score_p|的整数部分,并且当正向情感值大于该区间最大值时将其设定为该区间最大值,当负向情感值小于该区间最小值时将其设定为该区间最小值。
例如,设定区间值[0,100]表示信息所表达的正向情感和负向情感的情感趋向,B取值为该区间最大值的一半,即50,该中位数分值50作为分界值,A可以取5,用作为放大因子,计算出的正向情感值大于等于50,计算出的负向情感值小于50。另外,根据当正向情感值大于该区间最大值时将其设定为该区间最大值,当负向情感值小于该区间最小值时将其设定为该区间最小值的描述可知,在这个例子中,当计算出的信息的正向情感值大于100时将该正向情感值设定为100;当计算出的信息的负向情感值小于0时将该负向情感值设定为0。
根据本发明第一实施例提供的对信息情感倾向性的分析方法,可以定性分析出网络上的页面信息的情感倾向性,即正向情感或负向情感,还能够对所述页面信息的情感倾向性进行定量分析,这为基于用户的情绪状态而进行个性化的精确推荐信息提供了数据基础,还可以定性和定量分析用户浏览过的网页信息,进而为该用户画像,得出该用户的情感偏好。
图3是本发明第二实施例提供的对信息的情感倾向性分析装置的示意性框图。如图3所示,本发明第二实施例提供的对信息的情感倾向性分析装置包括:
关键词提取单元,用于对网络上的信息内容提取多个关键词,其包括用于表示正向情感倾向程度的正向饱满度词、和用于表示负向情感倾向程度的负向饱满度词;
信息情感值计算单元,用于基于所提取的多个关键词和预置的包含有多个所述正向饱满度词和所述负向饱满度词的词汇库中记录的正向饱满度词及其分值、和负向饱满度词及其分值,分别计算所提取的多个关键词中的正向饱满度词的总分值和负向饱满度词的总分值;
信息情感倾向性确定单元,用于比较正向饱满度词的总分值与负向饱满度词的总分值的绝对值,当正向饱满度词的总分值大于或等于负向饱满度词的总分值的绝对值时该信息所表达的情感为正向情感;当正向饱满度词的总分值小于负向饱满度词的总分值的绝对值时该信息所表达的情感为负向情感。
所述对信息的情感倾向性分析装置还包括:分值确定单元,用于确定所述词汇库中记录的表示正向情感倾向程度的正向饱满度词的分值和表示负向情感倾向程度的负向饱满度词的分值,该确定过程包括:采集多个样本,根据在所述多个样本中正向饱满度词和负向饱满度词的出现频率来确定每个正向饱满度词的分值和每个负向饱满度词的分值。
其中,在所述确定正向饱满度词的分值和负向饱满度词的分值的过程中,按照相同标准将正向饱满度词的分值和负向饱满度词的分值分为2个或以上档次,不同档次的分值不同,不同档次对应于正向饱满度词和负向饱满度词在所述多个样本中不同范围的出现频率。
出于定量分析信息所表达的情感倾向的需要,如图4所示,所述对信息的情感倾向性分析装置还包括:信息情感倾向性数值化单元,用于将对信息的情感倾向性数值化,其中:
当所述信息所表达的情感倾向性为正向情感时,将该信息所表达的正向情感数值化为:
正向情感值=(|score_p/score_n|-100%)*A+B
其中:
score_p表示正向饱满度词的总分值;
score_n表示负向饱满度词的总分值;
A和B是常数;
当所述信息所表达的情感倾向性为负向情感时,将该信息所表达的负向情感数值化为:
负向情感值=B-(|score_n/score_p|-100%)*A
其中:
score_p表示正向饱满度词的总分值;
score_n表示负向饱满度词的总分值;
A和B是常数。
其中,在将信息所表达的正向情感和负向情感数值化过程中,设定任意一个区间值,A用作为放大因子,可以自定义设置具体值,也可以根据实践经验值进行设置,B取值为该区间最大值的一半,取|score_p/score_n|和|score_n/score_p|的整数部分,并且当正向情感值大于该区间最大值时将其设定为该区间最大值,当负向情感值小于该区间最小值时将其设定为该区间最小值。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述第二实施例描述的装置的具体工作过程,可以参考前述第一实施例中的对应的方法实施过程,前述第一实施例中列举的例子和相关描述,同样适用于解释第二实施例描述的装置的工作过程,在此不再重复描述。
根据本发明第二实施例提供的信息情感倾向性的分析装置,可以定性分析出网络上的页面信息的情感倾向性,即正向情感或负向情感,还能够对所述页面信息的情感倾向性进行定量分析,这为基于用户的情绪状态而进行个性化的精确推荐信息提供了数据基础,还可以定性和定量分析用户浏览过的网页信息,进而为该用户画像,得出该用户的情感偏好。
被发表的信息或文章等都会包含一定的情感倾向性,发明人发现:用户在通过网络搜索信息进行阅读时,除了搜索在工作、生活等所需要的资讯之外,通常会寻找符合自己当前情绪的网页信息或文章来进行浏览,那么在通过上述的对信息的情感倾向性分析方法获知了信息所表达的情感倾向性后,再分析用户的当前情绪以便向其推荐符合其情绪的信息或文章等,有助于提高用户对所推荐的信息的兴趣度,进而实现个性化的精确推荐信息的目的。
图5是本发明第三实施例提供的信息推荐方法的流程图。如图5所示,本发明第三实施例提供的信息推荐方法包括:
S21:基于前述第一实施例或该第一实施例与其它具体实施例的组合所述的分析方法获得网络上的信息的情感倾向性,将所述信息的情感倾向性数值化为位于一个任意设定的区间内的具体值。
可以使用前述第一实施例所述的分析方法:
对网络上的信息内容提取多个关键词,其包括用于表示正向情感倾向程度的正向饱满度词、和用于表示负向情感倾向程度的负向饱满度词;
基于所提取的多个关键词和预置的包含有多个所述正向饱满度词和所述负向饱满度词的词汇库中记录的正向饱满度词及其分值、和负向饱满度词及其分值,分别计算所提取的多个关键词中的正向饱满度词的总分值和负向饱满度词的总分值;
比较正向饱满度词的总分值与负向饱满度词的总分值的绝对值,当正向饱满度词的总分值大于或等于负向饱满度词的总分值的绝对值时该信息所表达的情感为正向情感;当正向饱满度词的总分值小于负向饱满度词的总分值的绝对值时该信息所表达的情感为负向情感;
其中还可以使用上述的词汇库中记录的正向饱满度词的分值和负向饱满度词的分值的确定方法包括:采集多个样本,根据在所述多个样本中正向饱满度词和负向饱满度词的出现频率来确定每个正向饱满度词的分值和每个负向饱满度词的分值;以及,在所述确定正向饱满度词的分值和负向饱满度词的分值的方法中,按照相同标准将正向饱满度词的分值和负向饱满度词的分值分为2个或以上档次,不同档次的分值不同,不同档次对应于正向饱满度词和负向饱满度词在所述多个样本中不同范围的出现频率。
由此,获得网络上的信息的情感倾向性。
接着,将网络上的这些信息的情感倾向性进行数值化为位于一个任意设定的区间内的具体值,即为信息的情感倾向性值。
即,可以任意设定一个数值区间,采用公知的方法将网络上的信息的情感倾向性进行数值化并且得到的具体数值要位于该设定的数值区间内。
当然,这里还可以采用上述第一实施例中介绍的将对信息的情感倾向性进行数值化的具体方法。即,在一个具体实施例中,在将网络上的信息的情感倾向性数值化为位于一个任意设定的区间内的具体值的步骤中,使用根据所述第一实施例中的对信息的情感倾向性进行数值化的方法将网络上的信息的情感倾向性数值化为某一具体值,并且该具体数值要位于所设定的数值区间内。所述对信息的情感倾向性进行数值化的方法包括:
当所述信息所表达的情感倾向性为正向情感时,将该信息所表达的正向情感数值化为:
正向情感值=(|score_p/score_n|-100%)*A+B
其中:
score_p表示正向饱满度词的总分值;
score_n表示负向饱满度词的总分值;
A和B是常数;
当所述信息所表达的情感倾向性为负向情感时,将该信息所表达的负向情感数值化为:
负向情感值=B-(|score_n/score_p|-100%)*A
其中:
score_p表示正向饱满度词的总分值;
score_n表示负向饱满度词的总分值;
A和B是常数。
其中,在将信息所表达的正向情感和负向情感数值化过程中,设定任意一个区间值,A用作为放大因子,可以自定义设置具体值,也可以根据实践经验值进行设置,B取值为该区间最大值的一半,取|score_p/score_n|和|score_n/score_p|的整数部分,并且当正向情感值大于该区间最大值时将其设定为该区间最大值,当负向情感值小于该区间最小值时将其设定为该区间最小值。
S22:用所述任意设定的区间内的数值大小表征用户的情绪状态。
可以使用数值大小来表征用户的情绪状态以及程度。为了实现个性化的信息推荐的目的,需要将表征用户的情绪状态以及程度的数值区间设定成与为所述情感倾向性值设定的数值区间相同,因此可以用为信息的情感倾向性值任意设定的数值区间内的数值大小来表征用户的情绪状态以及程度。将该数值区间内最大值的一半作为分界值,大于等于该分界值的数值表征用户的情绪状态为正向情绪,这与信息表达的正向情感相对应;反之,小于该分界值的数值表征用户的情绪状态为负向情绪,这与信息表达的负向情感相对应。通常会对用户的用户情绪值预先设置一初始值,该初始值为设定的用户情绪区间值中最大值的一半,即将分界值设置为初始值。例如,设定区间值[0,100]表示信息所表达的正向情感和负向情感的情感趋向,则将表征用户的情绪状态以及程度的数值区间设定为相同的区间值[0,100],该中位数分值50作为分界值,预先设置用户情绪值的初始值为50。
S23:实时确定用户的实际情绪区间值,将该情感倾向性值位于该实际情绪区间值之内的信息推荐给该用户。
具体而言,在实时确定用户的实际情绪区间值的步骤中,该确定方法可以包括以下方式:
结合用户的用户情绪值和预设的情绪推荐区间值计算所述用户的实际情绪区间值,其中:基于用户的用户情绪值和该用户刚浏览过的信息的情感倾向性值计算该用户的最新用户情绪值,并且使用该最新用户情绪值替换原用户情绪值。
这里需要说明的是:用户的用户情绪值默认的初始值为设定的表征用户的情绪状态以及程度的数值区间内的分界值,即该数值区间中最大值的一半。但随着用户浏览了网络上的网页信息之后,用户情绪会受到所浏览的信息内容的感染,该用户的用户情绪值会发生变化,需要实时计算该用户的最新用户情绪值,并且使用该最新用户情绪值替换原用户情绪值。因此,在基于用户的用户情绪值和该用户刚浏览过的信息的情感倾向性值计算该用户的最新用户情绪值的过程中,该用户的用户情绪值可能是初始值,也可能是更新的用户情绪值,例如在用户启动智能终端(例如智能手机)尚未浏览网络上的网页信息之前,该用户的用户情绪值为默认的初始值,在浏览了网页信息之后,该用户的用户情绪值会被更新为最新的用户情绪值,即由初始值变为更新的用户情绪值。
另外,通常,人的情绪具有波动性、多样性、多变性、易感染性等特点,需要实时确定用户的实际情绪区间值,将情感倾向性值位于该实际情绪区间值之内的信息推荐给该用户,这可以实现所推荐的信息的多样性,并且根据用户浏览的信息,尤其是浏览的推荐信息来实时分析该用户当前的最新情绪。由此,有必要预先设置一个情绪推荐区间值,可以根据已经研究出的人的情绪在一天内的波动性、变化性等结论来自定义所述情绪推荐区间值、或者根据实践经验值等来预置情绪推荐区间值,这样结合用户的用户情绪值和预设的情绪推荐区间值计算所述用户的实际情绪区间值,最简单的计算方式就是将用户的用户情绪值分别与所述情绪推荐区间值的两个端值相加,得到所述用户的实际情绪区间值的两个端值。
用户的情绪常会在正向情绪和负向情绪之间变化,由此在一个具体实施例中,所述预设的情绪推荐区间值通常包括:1个负数端值和一个正数端值;更具体的,1个负整数端值和一个正整数端值。
另外,在向用户推荐情感倾向性值位于该用户的实际情绪区间值之内的信息时,利用在步骤S21中得到的网络上的信息的情感倾向性值来搜索合适的可推荐的信息,搜索到的可推荐的信息数目可能是大量的,此时可以采用随机选取信息的方式从多条可推荐的信息中随机选取1条或多条信息向用户推荐。当然,也可以结合使用其他现有的推荐方法,从多条可推荐的信息中选取1条或多条信息向用户推荐。例如,从多条可推荐的信息中选取热点信息、选取时事评论信息、选取与用户正在浏览信息相近似或同类的信息等向用户进行推荐。所述的信息包括但不限于新闻类信息、资讯类信息、评论性信息等。
上面介绍了人的情绪具有波动性、多样性、多变性、易感染性等特点,虽然可以在用户浏览了网页信息的同时或之后立刻实时更新该用户的用户情绪值,但用户情绪状态是一个短时段内的状态,具有时间有效性。在用户经过一段较长时间没有浏览网页信息之后,再使用之前更新的用户情绪值可能不会准确地表征该用户的当前情绪状态。因此,需要设定一有效时间,用户在该有效时间内浏览信息时更新该用户的用户情绪值;如果用户在该有效时间内没有浏览信息时,需要将该用户的用户情绪值恢复为默认的初始值。
这样,基于所述第二实施例所述的推荐方法或是该第二实施例与所述的具体实施例的组合所述的推荐方法,所述信息推荐方法还可以包括:针对用户的用户情绪设定一有效时间,当用户在该有效时间内浏览信息时,基于用户的用户情绪值和该用户刚浏览过的信息的情感倾向性值计算该用户的最新用户情绪值,并且使用该最新用户情绪值替换原用户情绪值,有效时间重置;当用户在该有效时间内没有浏览信息时所述用户情绪值恢复为初始值。
该有效时间值可以自定义设置,也可以根据实践经验值设置。另外,所述结合用户的用户情绪值和预设的情绪推荐区间值计算用于信息推荐的实际情绪区间值的方法与上述的具体实施例相同,可以包括以下方式:将用户的用户情绪值与预设的情绪推荐区间值中的两个端值相加,得到用于信息推荐的实际情绪区间值的两个端值。
另外,在一个具体实施例中,在所述第二实施例中或是该第二实施例与所述的具体实施例的组合中,所述的基于用户的用户情绪值和该用户刚浏览过的信息的情感倾向性值计算该用户的最新用户情绪值的方法可以包括以下方式:
score_mood_new=score_mood+(score_i-score_mood)*C
其中:
score_mood_new表示用户的最新用户情绪值;
score_mood表示用户的用户情绪值;
score_i表示用户刚浏览过的信息的情感倾向性值;
C是常数。
常数C在这里起弱化因子的作用,常数C的取值可以自定义设置,优选的,根据实践经验值来设置。
下面通过具体实例说明第二实施例所述的推荐方法或是该第二实施例与所述的具体实施例的组合所述的推荐方法。
设定区间值[0,100]表示信息所表达的正向情感和负向情感的情感趋向;同样的,设定区间值[0,100]来表征用户的情绪状态以及程度,将用户情绪值的初始值预设为50,将情绪推荐区间值预设为[-15,15],有效时间预设为3个小时,弱化因子C设置为0.2。
当一个用户使用浏览器或资讯类APP开始浏览网络上的页面信息时,可以根据用户打开的网站或页面先分析获得该网站或页面所在网站上的多个页面信息或者所有页面信息的情感倾向性,将所述每个信息的情感倾向性数值化为位于设定的区间[0,100]内的具体值,确定所述用户的实际情绪区间值,通过将用户的用户情绪值分别与所述情绪推荐区间值的两个端值相加,即[-15+50,15+50],得到所述用户的实际情绪区间值为[35,65]。所述浏览器或资讯类APP会搜索情感倾向性值位于数值区间[35,65]之内的多条信息,例如新闻或资讯,从中随机选取一条或多条信息向该用户推荐,也可以结合现有的信息推荐方法从搜索到的情感倾向性值位于数值区间[35,65]之内的多条信息中选取一条或多条信息向该用户推荐,并且在该用户浏览了一条信息的同时开始计算该用户的最新用户情绪值,假设该用户浏览的信息的情感倾向性值是60,则最新用户情绪值为:50+(60-50)*0.2=52;假设该用户浏览的信息的情感倾向性值是35,则最新用户情绪值为:50+(35-50)*0.2=47。同时,计时器开始计时工作,并且在更新了用户情绪值的同时重新生成所述用户的新的实际情绪区间值,例如最新用户情绪值为52,则[-15+52,15+52],得到所述用户的实际情绪区间值为[37,67],所述浏览器或资讯类APP继续搜索情感倾向性值位于数值区间[37,67]之内的多条信息,从中随机选取一条或多条信息继续向该用户推荐,也可以结合现有的信息推荐方法从搜索到的情感倾向性值位于数值区间[37,67]之内的多条信息中选取一条或多条信息继续向该用户推荐;例如最新用户情绪值为47,则[-15+47,15+47],得到所述用户的实际情绪区间值为[32,62],所述浏览器或资讯类APP继续搜索情感倾向性值位于数值区间[32,62]之内的多条信息,从中随机选取一条或多条信息继续向该用户推荐,也可以结合现有的信息推荐方法从搜索到的情感倾向性值位于数值区间[32,62]之内的多条信息中选取一条或多条信息继续向该用户推荐。
如果该用户在3个小时内使用浏览器或资讯类APP继续浏览网络上的页面信息,尤其是浏览推荐的信息,则该用户每浏览一次新的信息,都要更新该用户的用户情绪值,更新所述用户的实际情绪区间值,搜索情感倾向性值位于更新的所述用户的实际情绪区间值之内的多条信息,从中随机选取一条或多条信息继续向该用户推荐,也可以结合现有的信息推荐方法从搜索到的情感倾向性值位于更新的所述用户的实际情绪区间值之内的多条信息中选取一条或多条信息继续向该用户推荐,并且计时器重置时间以重新开始计时工作。如果该用户在3个小时内没有使用浏览器或资讯类APP继续浏览网络上的页面信息,则将该用户的用户情绪值恢复为初始值50,在该用户下一次使用浏览器或资讯类APP浏览网页信息时,使用该用户的用户情绪初始值和预设的情绪推荐区间值来重新计算所述用户的实际情绪区间值。
本发明第三实施例提供的信息推荐方法,结合了第一实施例所述的对信息情感倾向性的分析方法,通过定性和定量分析出网络上的页面信息的情感倾向性,以及实时确定出用户的当前情绪状态,向其推荐符合其情绪的信息或文章等,有助于提高用户对所推荐的信息的兴趣度,进而实现个性化的精确推荐信息的目的。
图6是本发明第四实施例提供的信息推荐装置的示意性框图。如图6所示,本发明第四实施例提供的信息推荐装置包括:
信息情感倾向性的分析装置,用于获得网络上的信息的情感倾向性;
情感倾向性数值化单元,用于将所述信息的情感倾向性数值化为位于一个任意设定的区间内的具体值;
用户情绪数值化单元,用于使用所述任意设定的区间内的数值大小表征用户的情绪状态;
推荐单元,用于实时确定所述用户的实际情绪区间值,将该情感倾向性值位于该实际情绪区间值之内的信息推荐给该用户。
其中,信息情感倾向性的分析装置是上述第二实施例所述的分析装置,或者该第二实施例与相关的具体实施例的组合所述的分析装置。
其中,所述推荐单元在实时确定所述用户的实际情绪区间值的过程中,结合用户的用户情绪值和预设的情绪推荐区间值计算所述用户的实际情绪区间值,其中:基于用户的用户情绪值和该用户刚浏览过的信息的情感倾向性值计算该用户的最新用户情绪值,并且使用该最新用户情绪值替换原用户情绪值。
其中,用户的用户情绪值被预先设置了初始值,该初始值为设定的用户情绪区间值中最大值的一半。
其中,所述信息推荐装置还包括:计时器,用于针对用户的用户情绪设定一有效时间;
当用户在该有效时间内浏览信息时,所述推荐单元基于用户的用户情绪值和该用户刚浏览过的信息的情感倾向性值计算该用户的最新用户情绪值,并且使用该最新用户情绪值替换原用户情绪值,该计时器重置有效时间;
当用户在该有效时间内没有浏览信息时所述用户情绪值恢复为初始值。
其中,所述推荐单元在结合用户的用户情绪值和预设的情绪推荐区间值计算用于信息推荐的实际情绪区间值的过程中,通过将用户的用户情绪值与预设的情绪推荐区间值中的两个端值相加,得到用于信息推荐的实际情绪区间值的两个端值。
其中,所述预设的情绪推荐区间值包括:1个负数端值和1个正数端值。
其中,所述情感倾向性数值化单元是根据在第二实施例中的具体实施例所述的信息情感倾向性数值化单元,用于将信息的情感倾向性数值化为某一具体值。在这种具体实施例中,因为在第二实施例中的具体实施例所述的信息情感倾向性数值化单元也是包含在所述的信息情感倾向性的分析装置中,因此所述信息推荐装置的示意性结构框图还可以如图7所示的那样,即所述情感倾向性数值化单元包含在所述的信息情感倾向性的分析装置中。
其中,所述推荐单元在基于用户的用户情绪值和该用户刚浏览过的信息的情感倾向性值计算该用户的最新用户情绪值的具体过程采用如下方法:
score_mood_new=score_mood+(score_i-score_mood)*C
其中:
score_mood_new表示用户的最新用户情绪值;
score_mood表示用户的用户情绪值;
score_i表示用户刚浏览过的信息的情感倾向性值;
C是常数。
常数C在这里起弱化因子的作用,常数C的取值可以自定义设置,优选的,根据实践经验值来设置。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述第四实施例描述的装置的具体工作过程,可以参考前述第三实施例中的对应的方法实施过程,前述第三实施例中列举的例子和相关描述,同样适用于解释第四实施例描述的装置的工作过程,在此不再重复描述。
本发明第四实施例提供的信息推荐装置,结合了第二实施例所述的对信息情感倾向性的分析方法,通过定性和定量分析出网络上的页面信息的情感倾向性,以及实时确定出用户的当前情绪状态,向其推荐符合其情绪的信息或文章等,有助于提高用户对所推荐的信息的兴趣度,进而实现个性化的精确推荐信息的目的。
图8是示出可以实现本发明的实施例的实施环境1000的硬件配置的框图。
如图8所示,实施环境1000包括服务器1100、客户端1200以及网络1300。
服务器1100例如可以是刀片服务器等。在一个例子中,服务器1100可以是一台计算机。在另一个例子中,服务器1100可以如图8所示,包括处理器1110、存储器1120、接口装置1130、通信装置1140、显示装置1150、输入装置1160。尽管服务器也可以包括扬声器、麦克风等等,但是,这些部件与本发明无关,故在此省略。其中,处理器1110例如可以是中央处理器CPU、微处理器MCU等。存储器1120例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1130例如包括USB接口、串行接口等。通信装置1140例如能够进行有线或无线通信。显示装置1150例如是液晶显示屏。输入装置1160例如可以包括触摸屏、键盘等。
图8所示硬件配置中的客户端1200也称为终端设备,其可以是便携式电脑(1200-1)、台式计算机(1200-2)、手机(1200-3)、平板电脑(1200-4)等。如图8所示,客户端1200可以包括处理器1210、存储器1220、接口装置1230、通信装置1240、显示装置1250、输入装置1260、扬声器1270、麦克风1280,等等。其中,处理器1210可以是中央处理器CPU、微处理器MCU等。存储器1220例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1230例如包括USB接口、耳机接口等。通信装置1240例如能够进行有线或无线通信。显示装置1250例如是液晶显示屏、触摸显示屏等。输入装置1260例如可以包括触摸屏、键盘等。用户可以通过扬声器1270和麦克风1280输入/输出语音信息。
通信网络1300可以是无线网络也可以是有线网络,可以是局域网也可以是广域网。在图8所示的实施环境1000中,客户端1200-1、1200-2、1200-3、1200-4以及服务器1100可以通过通信网络1300进行通信。
图8所示的实施环境1000仅是解释性的,并且决不是为了要限制本发明、其应用或用途。应用于本发明的实施例中,服务器1100的所述存储器1120用于存储指令,所述指令用于控制所述处理器1110进行操作以执行本发明实施例提供的分析方法和信息推荐方法。此外,客户端1200的所述存储器1220用于存储指令,所述指令用于控制所述处理器1210进行操作以执行本发明实施例提供的信息推荐方法。本领域技术人员应当理解,尽管在图8中对服务器1100以及客户端1200都示出有多个装置,但是,本发明可以仅涉及其中的部分装置。根据本发明所公开的方案设计程序指令来控制处理器进行相应操作,这是本领域技术人员都能够实现的,故在此不再详细描述。
本发明第五实施例还提供了一种存储设备,其中存储有多条指令,所述指令适于由处理器加载并执行第一实施例或是该第一实施例与所述相关的具体实施例的组合所述的方法。
本发明第六实施例还提供了一种存储设备,其中存储有多条指令,所述指令适于由处理器加载并执行第三实施例或是该第三实施例与所述相关的具体实施例的组合所述的方法
本发明的其他实施例还提供了信息情感倾向性的分析方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行第一实施例或是该第一实施例与所述的具体实施例的组合所述的对信息情感倾向性的分析方法,在此不再赘述。
本发明的其他实施例还提供了信息推荐方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行第三实施例或是该第三实施例与所述的具体实施例的组合所述的信息推荐方法,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,智能平板电脑,智能手机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (27)

1.一种对信息的情感倾向性的分析方法,其包括:
对网络上的信息内容提取多个关键词,其包括用于表示正向情感倾向程度的正向饱满度词、和用于表示负向情感倾向程度的负向饱满度词;
基于所提取的多个关键词和预置的包含有多个所述正向饱满度词和所述负向饱满度词的词汇库中记录的正向饱满度词及其分值、和负向饱满度词及其分值,分别计算所提取的多个关键词中的正向饱满度词的总分值和负向饱满度词的总分值;
比较正向饱满度词的总分值与负向饱满度词的总分值的绝对值,当正向饱满度词的总分值大于或等于负向饱满度词的总分值的绝对值时该信息所表达的情感为正向情感;当正向饱满度词的总分值小于负向饱满度词的总分值的绝对值时该信息所表达的情感为负向情感。
2.根据权利要求1所述的方法,其特征在于所述词汇库中记录的正向饱满度词的分值和负向饱满度词的分值的确定方法包括:采集多个样本,根据在所述多个样本中正向饱满度词和负向饱满度词的出现频率来确定每个正向饱满度词的分值和每个负向饱满度词的分值。
3.根据权利要求2所述的方法,其特征在于在所述确定正向饱满度词的分值和负向饱满度词的分值的方法中,按照相同标准将正向饱满度词的分值和负向饱满度词的分值分为2个或以上档次,不同档次的分值不同,不同档次对应于正向饱满度词和负向饱满度词在所述多个样本中不同范围的出现频率。
4.根据权利要求1-3之一所述的方法,其特征在于还包括:将对信息的情感倾向性数值化,其中:
当所述信息所表达的情感倾向性为正向情感时,将该信息所表达的正向情感数值化为:
正向情感值=(|score_p/score_n|-100%)*A+B
其中:
score_p表示正向饱满度词的总分值;
score_n表示负向饱满度词的总分值;
A和B是常数;
当所述信息所表达的情感倾向性为负向情感时,将该信息所表达的负向情感数值化为:
负向情感值=B-(|score_n/score_p|-100%)*A
其中:
score_p表示正向饱满度词的总分值;
score_n表示负向饱满度词的总分值;
A和B是常数。
5.根据权利要求4所述的方法,其特征在于在将信息所表达的正向情感和负向情感数值化过程中,设定任意一个区间值,A的值为自定义设置,B取值为该区间最大值的一半,取|score_p/score_n|和|score_n/score_p|的整数部分,并且当正向情感值大于该区间最大值时将其设定为该区间最大值,当负向情感值小于该区间最小值时将其设定为该区间最小值。
6.一种信息推荐方法,其包括:
基于权利要求1所述的分析方法获得网络上的信息的情感倾向性,将所述信息的情感倾向性数值化为位于一个任意设定的区间内的具体值;
用所述任意设定的区间内的数值大小表征用户的情绪状态;
实时确定用户的实际情绪区间值,将该情感倾向性值位于该实际情绪区间值之内的信息推荐给该用户。
7.根据权利要求6所述的方法,其特征在于在实时确定用户的实际情绪区间值的步骤中,该确定方法包括:
结合该用户的用户情绪值和预设的情绪推荐区间值计算所述用户的实际情绪区间值,其中:基于用户的用户情绪值和该用户刚浏览过的信息的情感倾向性值计算该用户的最新用户情绪值,并且使用该最新用户情绪值替换原用户情绪值。
8.根据权利要求7所述的方法,其特征在于包括:对于用户的用户情绪值预先设置了初始值,该初始值为设定的用户情绪区间值中最大值的一半。
9.根据权利要求8所述的方法,其特征在于还包括:针对用户的用户情绪设定一有效时间,当用户在该有效时间内浏览信息时,基于用户的用户情绪值和该用户刚浏览过的信息的情感倾向性值计算该用户的最新用户情绪值,并且使用该最新用户情绪值替换原用户情绪值,有效时间重置;当用户在该有效时间内没有浏览信息时所述用户情绪值恢复为初始值。
10.根据权利要求7所述的方法,其特征在于所述结合用户的用户情绪值和预设的情绪推荐区间值计算用于信息推荐的实际情绪区间值的方法包括:将用户的用户情绪值与预设的情绪推荐区间值中的两个端值相加,得到用于信息推荐的实际情绪区间值的两个端值。
11.根据权利要求10所述的方法,其特征在于所述预设的情绪推荐区间值包括:1个负数端值和1个正数端值。
12.根据权利要求6所述的方法,其特征在于在将信息的情感倾向性数值化为位于一个任意设定的区间内的具体值的步骤中,使用根据权利要求4或5的方法将信息的情感倾向性数值化为某一具体值。
13.根据权利要求7所述的方法,其特征在于所述基于用户的用户情绪值和该用户刚浏览过的信息的情感倾向性值计算该用户的最新用户情绪值的方法包括:
score_mood_new=score_mood+(score_i-score_mood)*C
其中:
score_mood_new表示用户的最新用户情绪值;
score_mood表示用户的用户情绪值;
score_i表示用户刚浏览过的信息的情感倾向性值;
C是常数。
14.一种信息情感倾向性的分析装置,其包括:
关键词提取单元,用于对网络上的信息内容提取多个关键词,其包括用于表示正向情感倾向程度的正向饱满度词、和用于表示负向情感倾向程度的负向饱满度词;
信息情感值计算单元,用于基于所提取的多个关键词和预置的包含有多个所述正向饱满度词和所述负向饱满度词的词汇库中记录的正向饱满度词及其分值、和负向饱满度词及其分值,分别计算所提取的多个关键词中的正向饱满度词的总分值和负向饱满度词的总分值;
信息情感倾向性确定单元,用于比较正向饱满度词的总分值与负向饱满度词的总分值的绝对值,当正向饱满度词的总分值大于或等于负向饱满度词的总分值的绝对值时该信息所表达的情感为正向情感;当正向饱满度词的总分值小于负向饱满度词的总分值的绝对值时该信息所表达的情感为负向情感。
15.根据权利要求14所述的装置,其特征在于还包括:分值确定单元,用于确定所述词汇库中记录的表示正向情感倾向程度的正向饱满度词的分值和表示负向情感倾向程度的负向饱满度词的分值,该确定过程包括:采集多个样本,根据在所述多个样本中正向饱满度词和负向饱满度词的出现频率来确定每个正向饱满度词的分值和每个负向饱满度词的分值。
16.根据权利要求15所述的装置,其特征在于在所述确定正向饱满度词的分值和负向饱满度词的分值的过程中,按照相同标准将正向饱满度词的分值和负向饱满度词的分值分为2个或以上档次,不同档次的分值不同,不同档次对应于正向饱满度词和负向饱满度词在所述多个样本中不同范围的出现频率。
17.根据权利要求14-16之一所述的装置,其特征在于还包括:信息情感倾向性数值化单元,用于将对信息的情感倾向性数值化,其中:
当所述信息所表达的情感倾向性为正向情感时,将该信息所表达的正向情感数值化为:
正向情感值=(|score_p/score_n|-100%)*A+B
其中:
score_p表示正向饱满度词的总分值;
score_n表示负向饱满度词的总分值;
A和B是常数;
当所述信息所表达的情感倾向性为负向情感时,将该信息所表达的负向情感数值化为:
负向情感值=B-(|score_n/score_p|-100%)*A
其中:
score_p表示正向饱满度词的总分值;
score_n表示负向饱满度词的总分值;
A和B是常数。
18.根据权利要求17所述的装置,其特征在于将信息所表达的正向情感和负向情感数值化过程中,设定任意一个区间值,A的值为自定义设置,B取值为该区间最大值的一半,取|score_p/score_n|和|score_n/score_p|的整数部分,并且当正向情感值大于该区间最大值时将其设定为该区间最大值,当负向情感值小于该区间最小值时将其设定为该区间最小值。
19.一种信息推荐装置,其包括:
如权利要求14所述的信息情感倾向性的分析装置,用于获得网络上的信息的情感倾向性;
情感倾向性数值化单元,用于将所述信息的情感倾向性数值化为位于一个任意设定的区间内的具体值;
用户情绪数值化单元,用于使用所述任意设定的区间内的数值大小表征用户的情绪状态;
推荐单元,用于实时确定所述用户的实际情绪区间值,将该情感倾向性值位于该实际情绪区间值之内的信息推荐给该用户。
20.根据权利要求19所述的装置,其特征在于所述推荐单元在实时确定所述用户的实际情绪区间值的过程中,结合用户的用户情绪值和预设的情绪推荐区间值计算所述用户的实际情绪区间值,其中:基于用户的用户情绪值和该用户刚浏览过的信息的情感倾向性值计算该用户的最新用户情绪值,并且使用该最新用户情绪值替换原用户情绪值。
21.根据权利要求20所述的装置,其特征在于包括:对于用户的用户情绪值预先设置了初始值,该初始值为设定的用户情绪区间值中最大值的一半。
22.根据权利要求21所述的装置,其特征在于还包括:计时器,用于针对用户的用户情绪设定一有效时间;
当用户在该有效时间内浏览信息时,所述推荐单元基于用户的用户情绪值和该用户刚浏览过的信息的情感倾向性值计算该用户的最新用户情绪值,并且使用该最新用户情绪值替换原用户情绪值,该计时器重置有效时间;
当用户在该有效时间内没有浏览信息时所述用户情绪值恢复为初始值。
23.根据权利要求20所述的装置,其特征在于所述推荐单元在结合用户的用户情绪值和预设的情绪推荐区间值计算用于信息推荐的实际情绪区间值的过程中,通过将用户的用户情绪值与预设的情绪推荐区间值中的两个端值相加,得到用于信息推荐的实际情绪区间值的两个端值。
24.根据权利要求23所述的装置,其特征在于所述预设的情绪推荐区间值包括:1个负数端值和1个正数端值。
25.根据权利要求19所述的装置,其特征在于所述情感倾向性数值化单元是根据权利要求17或18所述的信息情感倾向性数值化单元,用于将信息的情感倾向性数值化为某一具体值。
26.根据权利要求20所述的装置,其特征在于所述推荐单元在基于用户的用户情绪值和该用户刚浏览过的信息的情感倾向性值计算该用户的最新用户情绪值的具体过程采用如下方法:
score_mood_new=score_mood+(score_i-score_mood)*C
其中:
score_mood_new表示用户的最新用户情绪值;
score_mood表示用户的用户情绪值;
score_i表示用户刚浏览过的信息的情感倾向性值;
C是常数。
27.一种存储设备,其中存储有多条指令,所述指令适于由处理器加载并执行如权利要求1-5之一所述的方法或者如权利要求6-13之一所述的方法。
CN201810105327.3A 2018-02-02 2018-02-02 一种对信息的情感倾向性分析及信息推荐方法和装置 Pending CN110110217A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810105327.3A CN110110217A (zh) 2018-02-02 2018-02-02 一种对信息的情感倾向性分析及信息推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810105327.3A CN110110217A (zh) 2018-02-02 2018-02-02 一种对信息的情感倾向性分析及信息推荐方法和装置

Publications (1)

Publication Number Publication Date
CN110110217A true CN110110217A (zh) 2019-08-09

Family

ID=67483321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810105327.3A Pending CN110110217A (zh) 2018-02-02 2018-02-02 一种对信息的情感倾向性分析及信息推荐方法和装置

Country Status (1)

Country Link
CN (1) CN110110217A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110634017A (zh) * 2019-08-23 2019-12-31 深圳市新系区块链技术有限公司 信息分类方法、装置及设备
CN113536805A (zh) * 2021-07-09 2021-10-22 北京奇艺世纪科技有限公司 热点事件的舆情分析方法、装置、设备及存储介质
CN114648027A (zh) * 2022-05-23 2022-06-21 每日互动股份有限公司 一种文本信息的处理方法、装置、计算机设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101782898A (zh) * 2010-03-25 2010-07-21 中国科学院计算技术研究所 一种情感词倾向性的分析方法
CN103235818A (zh) * 2013-04-27 2013-08-07 北京百度网讯科技有限公司 一种基于网页情感倾向性的信息推送方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101782898A (zh) * 2010-03-25 2010-07-21 中国科学院计算技术研究所 一种情感词倾向性的分析方法
CN103235818A (zh) * 2013-04-27 2013-08-07 北京百度网讯科技有限公司 一种基于网页情感倾向性的信息推送方法和装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110634017A (zh) * 2019-08-23 2019-12-31 深圳市新系区块链技术有限公司 信息分类方法、装置及设备
CN113536805A (zh) * 2021-07-09 2021-10-22 北京奇艺世纪科技有限公司 热点事件的舆情分析方法、装置、设备及存储介质
CN113536805B (zh) * 2021-07-09 2023-07-14 北京奇艺世纪科技有限公司 热点事件的舆情分析方法、装置、设备及存储介质
CN114648027A (zh) * 2022-05-23 2022-06-21 每日互动股份有限公司 一种文本信息的处理方法、装置、计算机设备及存储介质
CN114648027B (zh) * 2022-05-23 2022-09-30 每日互动股份有限公司 一种文本信息的处理方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN107463591B (zh) 响应于搜索查询对待与内容匹配的图像动态排序的方法和系统
JP6266080B2 (ja) 類似性スコアに基づきコンテンツアイテムと画像とのマッチングを評価する方法、およびシステム
US9720913B1 (en) Automatic generation of snippets based on context and user interest
US9953011B1 (en) Dynamically paginated user interface
CN104111941B (zh) 信息展示的方法及设备
WO2015188699A1 (zh) 推荐项目的方法和装置
US20130311487A1 (en) Semantic search using a single-source semantic model
US20170154116A1 (en) Method and system for recommending contents based on social network
WO2012092059A2 (en) Continuous content refinement of topics of user interest
JP2007507801A (ja) ウェブ検索の個人化
CN107562939A (zh) 垂直领域新闻推荐方法、装置及可读储存介质
JP2007018285A (ja) 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム
JP4851299B2 (ja) ブックマーク管理装置,ブックマーク管理プログラムおよびブックマーク管理方法
CN110110217A (zh) 一种对信息的情感倾向性分析及信息推荐方法和装置
CN105528338B (zh) 智能预测的输入方法和系统
Feuerbach et al. Enhancing an Interactive Recommendation System with Review-based Information Filtering.
CN107766398B (zh) 用于使图像与内容项目匹配的方法、装置和数据处理系统
JP5048852B2 (ja) 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
CN108205545B (zh) 一种为用户提供推荐信息的方法与设备
CN112825089A (zh) 文章推荐方法、装置、设备及存储介质
JP2002269106A (ja) 書籍紹介装置
JP5805134B2 (ja) 端末装置および装置のプログラム
CN106445922B (zh) 确定多媒体资源的标题的方法及装置
KR20150002409A (ko) 사용자 선호도 학습 방법 및 장치
CN105446971B (zh) 一种信息显示方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200526

Address after: 310051 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 100083, Beijing, Haidian District, Cheng Fu Road, No. 28, A building, block 12

Applicant before: UC MOBILE Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190809