CN103678304B - 为预定网页推送特定内容的方法、装置 - Google Patents
为预定网页推送特定内容的方法、装置 Download PDFInfo
- Publication number
- CN103678304B CN103678304B CN201210318654.XA CN201210318654A CN103678304B CN 103678304 B CN103678304 B CN 103678304B CN 201210318654 A CN201210318654 A CN 201210318654A CN 103678304 B CN103678304 B CN 103678304B
- Authority
- CN
- China
- Prior art keywords
- emotion
- content
- word
- word content
- matching degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本公开涉及一种为预定网页推送特定内容的方法、装置和网站服务器。该为预定网页上的文字内容推送特定内容的方法包括:对预定网页上的文字内容进行情感分析;将所述情感分析的结果与所推送的特定内容所表达的情感进行匹配度确定;以及响应于所确定的匹配度满足预定条件,将所述文字内容的一部分与所推送的特定内容相组合从而形成特定于用户的推送内容。利用本发明的技术可以避免用户对推送内容产生反感,并且提高推送的精确度。
Description
技术领域
本公开涉及一种为预定网页推送特定内容的方法、装置和网站服务器。更具体地,本公开涉及通过对网页上的内容进行情感分析来为该网页推送特定内容。
背景技术
如今,几乎所有的网站都提供了可供用户输入的功能。举例来说,各类门户网站例如新浪、搜狐、人民网等提供了用户输入的接口以供人们对上面的各种新闻、消息等做出评论。另一个例子是为数众多的社交网站,例如facebook、开心网、个人博客、微博等。人们可以通过这些社交网站与其他人分享各种内容并且得到其他人通过这些网站输入的回复,从而在网络上形成互动。
海量的用户输入内容实际上构成了宝贵的资源。在现有技术中已经存在针对用户输入推送预定内容的技术。然而,现有的技术在推送内容时采用了粗犷的方式。例如,在现有的推送技术中,通常仅仅简单地判断用户输入中是否存在特定的词语。如果存在,那么则直接推送预先为该特定词语准备好的信息,而不管用户输入的内容到底是什么以及代表了怎样的情感。换言之,在现有技术中,推送技术采用了以推送内容为中心的方式。这在很大程度上忽略了用户输入的内容以及推送内容与用户输入的内容是否匹配。结果,很可能导致推送的内容并不符合用户的期望,甚至导致用户对推送内容产生反感。由此,使用现有的推送技术可能会导致降低用户的满意度。
发明内容
基于上述以及其他问题,本公开提供了一种面向用户的推送技术,其以用户输入的内容为中心确定如何推送预定的内容,从而提高推送的效率和用户相关性。
根据本公开的一个方面,提供了一种为预定网页上的文字内容推送特定内容的方法,包括:对预定网页上的文字内容进行情感分析;将所述情感分析的结果与所推送的特定内容所表达的情感进行匹配度确定;以及响应于所确定的匹配度满足预定条件,将所述文字内容的一部分与所推送的特定内容相组合从而形成特定于用户的推送内容。
根据本公开的另一方面,提供了一种为预定网页上的文字内容推送特定内容的方法,包括:对预定网页上的文字内容和该文字内容的回复文字内容进行情感分析;将对该文字内容的回复文字内容情感分析的结果与对该文字内容情感分析的结果和所推送的特定内容所表达的情感分别进行匹配度确定,从而得到第一匹配度和第二匹配度;以及响应于确定出的第一匹配度和第二匹配度满足预定条件,将该文字内容的回复文字内容的一部分与所推送的特定内容相组合从而形成特定于用户的推送内容,并将其显示在所述预定网页上。
根据本公开的另一方面,提供了一种为预定网页上的文字内容推送特定内容的装置,包括:情感分析单元,被配置为对预定网页上的文字内容进行情感分析;匹配度确定单元,被配置为将所述情感分析的结果与所推送的特定内容所表达的情感进行匹配度确定;以及推送单元,被配置为响应于所确定的匹配度满足预定条件,将所述文字内容的一部分与所推送的特定内容相组合从而形成特定于用户的推送内容。
根据本公开的另一方面,提供了一种为预定网页上的文字内容推送特定内容的装置,包括:情感分析单元,被配置为对预定网页上的文字内容和该文字内容的回复文字内容进行情感分析;匹配度确定单元,被配置为将对该文字内容的回复文字内容情感分析的结果与对该文字内容情感分析的结果和所推送的特定内容所表达的情感分别进行匹配度确定,从而得到第一匹配度和第二匹配度;以及推送单元,被配置为响应于响应于确定出的第一匹配度和第二匹配度满足预定条件,为预定网页上的文字内容,将该文字内容的回复文字内容的一部分与所推送的特定内容相组合从而形成特定于用户的推送内容。
本公开的一个实施例,能够以用户输入的内容为中心确定如何推送预定的内容,从而提高推送的客户接受度,提高推送效果。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1示出了适于用来实现本公开实施方式的示例性计算系统100的框图;
图2示例性地示出了根据本公开一个实施例的方法200的流程图;
图3示意性地示出了一个典型的用户输入文字内容的网页的截图;
图4A示出了情感坐标系400以及将情感类映射到情感坐标系400中获得的情感坐标;
图4B示出了获取用户输入内容中的情感直到确定情感匹配度的示意性过程;
图5示出了使用根据本公开的推送技术后的效果;
图6示例性地示出了根据本公开一个实施例的方法600的流程图
图7示出了根据本公开的另一实施例的确定情感匹配度的示意图;
图8示例性地示出了一部分用户输入;
图9示例性地示出了根据本公开的一个实施例的情感匹配度计算的示意图;
图10示例性地示出了应用该实施例的推送技术后的效果;以及
图11示例性地示出了根据本公开实施例的用于为网页推送内容的装置。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
所属技术领域的技术人员知道,本发明可以实现为系统、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
下面将参照本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,这些计算机程序指令通过计算机或其它可编程数据处理装置执行,产生了实现流程图和/或框图中的方框中规定的功能/操作的装置。
也可以把这些计算机程序指令存储在能使得计算机或其它可编程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令就产生出一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置(instructionmeans)的制造品(manufacture)。
也可以把计算机程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其它可编程装置上执行的指令能够提供实现流程图和/或框图中的方框中规定的功能/操作的过程。
图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。图1显示的计算机系统/服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图1所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图1未显示,通常称为“硬盘驱动器”)。尽管图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机系统/服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
附图2示例性地示出了根据本公开一个实施例的方法200的流程图。方法200始于步骤210。随后,在步骤220,对预定网页上的文字内容进行情感分析。在步骤230,将所述情感分析的结果与所推送的特定内容所表达的情感进行匹配度确定。在步骤240,响应于匹配度满足预定条件,将所述文字内容的一部分与所推送的特定内容相组合从而形成特定于用户的推送内容,并将其显示在所述预定网页上。以下将结合附图详细描述方法200的各步骤。
作为示例而非限制性的,假设在一个实施例中将要推送的内容是“把快乐与朋友分享,那么你将会得到双倍的快乐”。本领域技术人员可以理解,可以自由地选择其他的推送内容。
附图3示意性地示出了一个典型的用户输入文字内容的网页的截图。如图所示,在该网页上示意性地示出了微博上四名用户输入的文字内容和符号。在一个示意性的网页上,共有4名用户输入了文字。其中用户A写道:
“今天收到了神秘礼物”。
随后,用户B、C、D分别提供了如下回复:
“啥礼物,赶紧公布一下,真替你高兴啊”;
“恭喜”;
“哇,好开心啊”
然而本领域技术人员完全能够理解,本公开可以应用于各种其他类型的包括用户输入内容的网站,并且网页上可以包含更多或者更少的用户输入的内容。根据本公开的一个实施例,对预定网页上的文字内容进行情感分析。
正如附图2所示,目前大多数网站都提供了包含了各种表情符号的预定符号集以供用户表示情感。因此,在一个实施例中,可以直接从网页提取这些符号作为用户输入文字的表情。如附图所示,用户A、B的输入内容中分别包含表情符号和。另一方面,可以从网页中的文字内容中提取情感词。可以从网页提取出用户输入的内容,并且从中提取出情感词,上述提取情感词的技术可以参见Shenghua Bao,Shengliang Xu等人的“MiningSocial Emotions from Affective Text”,IEEE Transactions on Knowledge and DataEngineering(IEEE TKDE),2012”,该文献通过引用并入本文。
根据上述提取情感词的技术,例如,从用户A的输入中提取出情感词“礼物”。从用户B的输入中提取出了情感词“高兴”。从用户C的输入中提取出了情感词“恭喜”。从用户D的输入中提取出了情感词“开心”。
接下来,将所提取的符号和/或情感词划分到预定情感类集合中的具体情感类。在根据本公开的一个实施例中,预定情感类集合可以包括:高兴、轻松、惊喜、温馨、依赖、悲伤、惊恐、轻蔑、生气等八个情感类。然而,本领域技术人员应当理解,此处的情感类仅仅是为了说明而给出的例子,情感类集合中的情感类可以是预先确定的,并且可以使用更多或更少的情感类。在根据本公开的一个实施例中,可以将大多数网站提供的常用表情符号直接划分到预定的情感类中。例如,如图3所示,可以预先设定,将用户A和B所输入的表情符号和划分到“高兴”这个情感类中。在根据本公开的一个实施例中,常用表情符号与情感类的对应关系可以是预定的。例如将常用表情符号与情感类的对应关系存储在特定的数据库中。在从网页提取出表情符号之后,可以通过查找可以得出某一表情符号所对应的情感类。由此,可以网页上出现的表情符号的情感类。
另一方面,可以将提取出的情感词划分到预定的情感类中。类似的,情感词到情感类的划分可以通过查找存储有预先确定的对应关系的数据库来实现。在根据本公开的一个实施例中,该数据库可以包含预先选定的词语并且为每一个词语设定了对应的情感类。以附图3为例,根据上述关于情感提取的文献,例如,从用户A提取出的情感词为“礼物”。在对应的数据库中可以预先将情感词“礼物”所对应的情感类设定为“高兴”。从用户B输入的内容提取出的情感词可能是“高兴”,可以将该情感词归类为情感类“高兴”。类似的,对于用户C输入的“恭喜”,可以将其归为“温馨”,以及对于用户D,可以将“开心”归为“高兴”。然而,上述对应关系仅仅是为了讲述本公开的实施例而示例性地给出的,本领域技术人员可以理解,可以将情感词合理地对应为其他的情感类。例如,在另一数据库中,词语“礼物”也可以对应于情感类“温馨”或者“惊喜”。可以根据推送的内容来选择性地使用不同的数据库,例如,当推送内容较多地涉及温馨的情感时,可以使用将“礼物”对应于情感类“温馨”的数据库。
注意到,对于用户A、B来说,其输入内容同时包括了表情符号和文字内容,此时,可以对表情符号和文字内容分别划分情感类,并在随后的匹配度确定中分别计算。然而,本领域技术人员可以理解,也可以对情感词和表情符号二者进行组合以得到用于用户输入的情感类。
回到附图2,在完成了用户输入的文字内容的情感分析之后,在步骤230,将情感分析的结果与所推送的特定内容所表达的情感进行匹配度确定。以下参考附图4A、4B详细描述上述匹配度确定。如上所述,在一个实施例中,示例性的推送内容为“把快乐与朋友分享,那么你将会得到双倍的快乐”。对于该推送内容,可以预先确定上述推送内容的情感类。例如,可以将该推送内容的情感类预先设定为“高兴”。此时,将推送内容的情感类作为基准情感类,将用户输入的情感类作为目标情感类,计算二者之间的匹配度。
附图4A示出了情感坐标系400。该情感坐标系包括三个坐标轴,分别表示激活度、愉悦度和优势度,每一类情感(例如高兴、惊喜等)在情感坐标系中占据了预定的空间。根据该情感坐标系,每一种情感都可以被分解为三个分量,即,激活度分量、愉悦度分量和优势度分量。当将情感坐标系400的三个坐标轴标注为x轴(激活度)、y轴(愉悦度)和z轴(优势度)时,每一个情感都可以映射到情感坐标系400中以具有例如(x,y,z)坐标的形式。由此,可以获取用户A-D的目标情感类在情感坐标系400中的目标情感坐标401A(xA,yA,zA)、401B(xB,yB,zB)、401C(xC,yC,zC)、401D(xD,yD,zD),以及基准情感类在情感坐标系400中的基准情感坐标402。
如上文所述,用户A、B、D的输入被确定为情感类“高兴”,用户C的输入被确定为情感类“温馨”。如图所示,每一类情感在情感坐标系400中占据了一定的空间。在计算时,可以使用每一类情感的占据空间的中心点的坐标,作为该类情感的坐标。由此,用户A、B、D(都具有情感类“高兴”)在情感坐标系400中具有相同的坐标,即“高兴”的情感空间的中心点的情感坐标。类似地,用户C的输入具有位于“温馨”的情感空间的中心点的情感坐标。
上述情感坐标系以及获取每一类情感的坐标的细节请参见[http://en.wikipedia.org/wiki/PAD_emotional_state_model][Mehrabian,Albert(1980).Basicdimensions for a general psychological theory.pp.39-53.ISBN0-89946-004-6.][Bales,Robert Freed(2001).Social interaction systems:theory andmeasurement.pp.139-140.ISBN 0-7658-0872-2.][Liu,Ye;Fu,Xiaolan;Tao,Linmi:PADBased Emotion Measurement;CCF Communication V6,Issue 5.pp.9-13,2010.5],上述文献通过引用并入本文。图4B示出了获取用户输入内容中的情感直到确定情感匹配度的示意性过程。在另一实施例中,可以省略划分情感类的步骤,而直接将情感词/表情符号映射到情感坐标系中,并直接使用这些情感坐标系进行如下所述的计算。
当获得了目标情感坐标401A、401B、401C、401D和基准情感坐标402之后,计算目标情感坐标和基准情感坐标之间的距离作为匹配度的度量。换言之,计算在一个实施例中,可以使用如下公式来计算在情感坐标系中任意两点之间的距离:
在三维坐标系中,计算任意两点之间距离的技术是公知的,本领域技术人员还可以使用其他方法计算上述距离。
回到附图2,当确定了用户输入内容的情感与推送内容所表达的情感之间的匹配度之后,判断二者之间的匹配度是否满足预定条件,并且当用户的情感匹配度满足预定条件时,为该用户推送预定的内容。具体来说,在根据本公开的一个实施例中,可以将目标情感坐标和基准情感坐标之间的距离小于预定阈值的作为预定条件,例如,取距离最短的n个距离(也即,以距离最短排名第n的距离作为阈值)。可以理解,目标情感坐标和基准情感坐标之间的距离越短,表明二者所代表的情感越相似。如图所示,在情感坐标系400中,表现为目标情感坐标401A、401B、401D与基准情感坐标402具有最近的距离(在本实施例中,上述坐标重叠,均为情感空间“高兴”的中心点坐标),而目标情感坐标401C与基准情感坐标402距离稍远。当选择了合适的阈值时,可以排除用户C(具有目标情感坐标401C)的输入,而面向用户A、B、D推送预定内容。另一方面,可以将目标情感坐标和基准情感坐标之间距离最短作为预定条件,此时,选出的是最贴合预定推送内容的用户输入。如图所示,在情感坐标系400中,表现为目标情感类401A、401B、401D与基准情感坐标402具有最近的距离(重叠)。此时用户A、B、D输入的内容被认为与预定推送内容最为匹配。
如上所述,预定推送内容“把快乐与朋友分享,那么你将会得到双倍的快乐”的情感类是可以预先设定的。在根据本公开的一个实施例中,该预定推送内容的情感坐标也是可以预先设定的。可以事先确定推送内容的情感类和情感坐标,以使得该推送内容能够与特定情感类的用户输入相匹配。在另一实施例中,可以对预定推送内容进行情感分析,进而为该推送内容获得情感坐标,此处的情感分析技术与前述对用户输入进行的情感分析技术相同。
在确定了满足了预定条件的用户输入之后,将所述文字内容的一部分与所推送的特定内容相组合从而形成特定于用户的推送内容,并将其显示在所述预定网页上。如上所述,目前选择了用户A、B、D的输入与推送内容“把快乐与朋友分享,那么你将会得到双倍的快乐”相匹配。由此,利用语义分析工具确定情感词所属的文字内容的最小语段。上述在本文中,语段是指两个标点符号之间的语言片段。例如,对于用户A,包含情感词“礼物”的最小语段是“今天收到了神秘礼物”,对于用户B、D包含情感词的最小语段分别是“真替你高兴啊”和“好开心啊”。在根据本公开的一个实施例中,将这些最小语段与预定推送内容组合,形成特定于用户的推送内容。在根据本公开的一个实施例中,可以预先为推送内容设计组合模板,从而将来自用户输入的内容放置在相对于推送内容的特定位置,从而形成新的推送内容。附图5示出了使用根据本公开的推送技术后推送的效果,推送后的内容变成了:
今天收到了神秘礼物,把快乐与朋友分享,那么你将会得到双倍的快乐
真替你高兴啊,把快乐与朋友分享,那么你将会得到双倍的快乐
好开心啊,把快乐与朋友分享,那么你将会得到双倍的快乐
由于已经判断出用户A、B、D的输入所表达的情感与推送内容的匹配度满足预定条件,因此在推送时已经考虑了用户的输入和情感,并且组合形成的推送内容包含了用户自身输入内容。用户可以发现,推送的内容中包含了他自己输入的文字内容,这使得用户对推送的内容感到更加亲切。这样的推送技术将会大大提高用户体验。在另一个实施例中,也可以在推送内容中包含用户使用的表情符号。
如图所示,此处的模板简单地采用了“_____,推送内容”(在下划线的空白处填入从用户输入的内容中提取的内容)的方式,然而,本领域技术人员可以理解,完全可以设计其他更多形式的模板。
在根据本公开的一个实施例中,对所形成的特定于用户A、B、D的推送内容进行语义分析,挑选组合最恰当的推送内容。例如,在根据本公开的一个实施例中,可以选择当前网页所属的网站在过去一段时间内所有用户输入的内容作为语料库,也可以选择其他的包含大量用户输入内容的数据库作为语料库。当选择了适当的语料库后,例如,可以在该语料库中分析用户A、B、D的输入中的情感词与推送内容中预定的关键词在同一个句子中一起出现的频率,并从中选择出现频率最高的情感词和关键词对。这样,可以选出用户A、B、D中的至少其中一个作为用于组合的最恰当用户输入,并随后从中提取选择语段与预定推送内容组合。具体来说,例如,在语料库中检索发现,“开心”与“快乐”这一对词语同时出现的频率最高,则可以选择用户D的输入的一部分“好开心啊”用于与推送内容组合。本领域技术人员可以理解,也可以选择出现频率高于预定阈值的多个输入。此外,可以灵活地适用恰当性标准。例如,当发现所有符合匹配度要求的用户输入都不满足适当性标准时,可以降低匹配度的阈值,以选入更多合适的用户输入,并再一次进行适当性判断。
进行恰当性分析可以排除在情感上接近、但是组合后的内容却并不恰当的情况,例如组合后不通顺或者在语言习惯上不适于同时在一个句子中同时使用等等。
以下参考附图6讲述根据本公开的方法600。附图6示例性地示出了根据本公开一个实施例的方法600的流程图。方法600始于步骤610。随后,在步骤620,对预定网页上的文字内容和该文字内容的回复文字内容进行情感分析。在步骤630,将对该文字内容的回复文字内容情感分析的结果在对该文字内容情感分析的结果和所推送的特定内容所表达的情感之间进行匹配度确定。在步骤640,响应于确定出的匹配度满足预定条件,将该文字内容的回复文字内容的一部分与所推送的特定内容相组合从而形成特定于用户的推送内容,并将其显示在所述预定网页上。以下将结合附图详细描述方法600的各步骤。
在附图2的方法200中,对用户A、B、C、D输入的文字内容进行情感分析并将这些用户输入内容的情感坐标确定为目标情感坐标,将推送内容的情感坐标作为基准情感坐标。由此,确定这些用户输入的内容(包括A、B、C、D)相对于预定推送内容(基准情感坐标)的情感距离。与上述实施例不同的是,在附图6所示的方法600中,不再将用户A的输入内容的情感作为目标,而是将其作为另一个基准。由此,仅将提供回复内容的用户B、C、D的输入内容的情感坐标作为目标情感坐标。
具体来说,将从用户A的输入内容提取的符号和/或情感词划分到预定情感集合中的情感类作为第一情感类,将从对用户A的回复文字内容提取的符号和/或情感词划分到预定情感集合中的情感类作为第二情感类。由于对于用户A可能存在着多个回复内容,因此可以存在多个第二情感类。最后,可以将预先确定的推送内容的情感类作为第三情感类。接下来,将上述第一情感类,第二情感类(一个或多个)和第三情感类映射到情感坐标系中,分别获得第一情感坐标、第二情感坐标(一个或多个)和第三情感坐标。很清楚的,这里的第一情感坐标对应于用户A的输入,一个或多个第二情感坐标对应于一个或多个对于用户A的回复内容,而第三情感坐标对应于推送内容。上述确定情感类以及映射情感坐标的细节与参照附图2所述的实施例相同,在此不再赘述。
在本实施例中,将第一情感坐标和第三情感坐标作为基准,判断每个第二情感坐标分别与第一情感坐标和第三情感坐标之间的距离的距离之和作为情感匹配度的度量。
附图7示出了根据该实施例的一种情况。如图所示,举例来说,假设对应于用户A的第一情感坐标表示“温馨”,对应于推送内容的第三情感坐标表示“高兴”,而对应于提供回复内容的三个用户的示例性第二情感坐标分别表示“悲伤”、“依赖”和“惊喜”。此时,计算分别为三个回复内容计算第一情感坐标与第二情感坐标之间的距离作为第一匹配度的度量、第二情感坐标与第三情感坐标之间的距离作为第二匹配度的度量,并且计算两个度量之和,也即上述两个距离的距离和。可以看出,在图示的例子中,“惊喜”所代表的用户回复与用户A以及推送内容二者的情感之间的距离和最短,因此,可以对情感为“惊喜”的用户回复推送预定的内容。
在该实施例中,将发布消息的用户(情感为“温馨”)和推送内容(情感为“高兴”)作为两个基准,在多个回复内容中选择能够将发布消息的情感恰当地转变为推送内容情感的回复内容,也即,回复内容的情感“惊喜”在情感坐标系中位于“温馨”和“高兴”之间,并且与后二者的距离最短。以这样的方式选择出来的回复内容能够在发布消息的用户A和推送内容之间起到“桥梁”的作用。由此,所形成的推送内容是面向用户的,并且仅针对部分适合推送的内容进行推送。这可以大大提高用户体验度。本领域技术人员可以理解,此处也可以直接使用提取的情感词和表情符号的情感坐标进行匹配度确定,而不必划分情感类。
本领域技术人员可以理解,在本实施例中,其余步骤与参照附图2-5所述的实施例相同,在此不再赘述。
以下将讲述根据本公开的另一实施方式。在上述实施例中,用户的回复均涉及单一的情感。附图8和9示出了另一种情况。有时,人们会在网页上发布带有负面情绪的,例如工作遇到挫折、遭遇家庭问题等等。此时,上述实施例仍然适用,即,可以判断用户情感与推送内容情感的关系来选择性的推送,或者基于发布消息的用户和推送内容判断是否对回复消息中的一部分推送内容。然而,在上述情况下,在某些回帖中会包含“情感转化”的内容,这有助于帮助用户的情绪由负面向正面转化。因而,在根据本公开的一个实施例中,将会关注用户情绪的这种转化,并且总是利用合适的推送内容帮助用户的情感向正面情感转化。
可以选择多种有益于将情感转为正面的推送内容。作为示例,在以下的说明中,使用了如下的推送内容,“天行健,君子以自强不息”。然而,本领域技术人员可以理解,还可以选择多种使得情感转为正面情感的推送内容,例如从悲伤转为高兴,从挫折转为温馨等等。
附图8示出了示例性的一部分用户输入。如图所示,在根据本公开的一个实施例中,例如,用户A输入内容“烦人”的分析结果可以表明其情感类属于愤怒。而通过语义分析可以得出,用户D的回复内容“要坚强哦”包含了情感转化,即,从不坚强变得坚强。由此,可以通过语义分析从用户D的回复中提取出情感转化前的情感词“不坚强”和情感转化后的情感词“坚强”。在根据本公开的一个实施例中,包含情感转化内容的词语也可以预先存储在数据库中。举例来说,例如“变得”、“要”、“希望”、“走出”、“脱离”、“不要”等词语均可能代表了情感转化的内容。
在附图9中示出了该实施例的情感坐标系的计算。对于用户B、C的回复(其情感词为“加油”、“同病相怜”)来说,其并不包含情感转化的内容,仍然可以使用如上文所述的方式计算匹配程度。对于包含情感转化内容的用户D的输入内容,分别将情感转化前的情感词/表情符号和情感转化后的情感词/表情符号划分到情感类中分别得到第四和第五情感类,并映射到情感坐标系中得到第四和第五情感坐标。这里,对于“变得坚强”,其情感转化之前的情感为“软弱”,则第四情感类可以为“轻蔑”,而情感转化之后的情感为“坚强”,则第五情感类可以为“温馨”。由此可以相应地确定“温馨”和“轻蔑”的情感空间的中心点的坐标作为第四情感坐标和第五情感坐标。
对于用户B,其情感词为“加油”,其情感类可以归为“依赖”。对于用户C,其情感词为“同病相怜”,其情感类也可以归为“依赖”。因此,用户B、C具有相同的情感坐标902。
对于推送内容“天行健,君子以自强不息”,可以预先规定其情感类为“高兴”,具有情感坐标903。
此时,如图9所示,计算第一情感坐标901(对应于用户A的“生气”)与第四情感坐标904(对应于用户D的情感转化前的“轻蔑”)之间的距离作为第一匹配度的度量,以及计算第三情感坐标903(对应于推送内容)与第五情感坐标905(对应于用户D的情感转化后的“温馨”)之间的距离第二匹配度的度量,并且第一和第二匹配度的度量之和,也即,计算情感坐标901与904之间的距离与情感坐标903与905之间的距离之和。此时,判断该距离之和以及对于用户B、C的情感坐标与情感坐标901与903之间的距离和中的最短距离和/小于预定阈值的距离和。
从附图9可知,由于存在着情感转化,因此,情感转化前的情感坐标904将会与用户A的情感坐标901(负面)较为接近,而情感转化后的坐标905通常将会与推送内容的情感坐标903(正面)更为接近。因此,正如图9所示出的那样,对于包含了情感转化的用户回复来说,其与负面情感的用户输入以及推送正面情感的内容之间匹配程度通常较高,表现为第一、第四情感坐标以及第三、第五情感坐标之间的距离的和通常较小。此时,取其距离和中小于预定阈值的用户回复或者取距离和最小的用户回复作为推送目标。
图10示出了应用该实施例的推送技术后的效果。与前述实施例类似的,可以设计各种模板来将用户回复的内容与推送内容相互组合,从而形成特定于用户的推送内容。在根据本公开的一个实施例中,类似于前文所述,可以进行适当性判断。为了简洁起见,此处不再赘述。
根据本公开的实施例,可以识别出包含有情感转化的用户回复,从而可以更恰当、自然地为具有负面的用户推送具有正面情绪的内容。这大大增强了推送内容的精确程度和适当性,进而极大地提升了用户体验。
以下讲述根据本公开的用于向预定网页推送预定内容的装置。附图11示出了根据本公开的一个实施例的为预定网页上的文字内容推送特定内容的装置1100,包括:情感分析单元1110,被配置为对预定网页上的文字内容进行情感分析;匹配度确定单元1120,被配置为将所述情感分析的结果与所推送的特定内容所表达的情感进行匹配度确定;以及推送单元1130,被配置为响应于所确定的匹配度满足预定条件,将所述文字内容的一部分与所推送的特定内容相组合从而形成特定于用户的推送内容。
可选地,情感分析单元包括提取单元(未示出),被配置为:从所述预定网页提取表示情感的符号,其中所述符号属于规定的符号集;以及从预定网页上的文字内容中提取情感词。
可选地,匹配度确定单元进一步被配置为:将提取的符号和/或情感词划分到预定情感类集合中的情感类作为目标情感类,其中所述预定情感类集合中的情感类是预先规定的,且符号和/或情感词与情感类的对应关系是通过查找存储有符号和/或情感词与情感类的对应关系的数据库进行的。
可选地,匹配度确定单元进一步被配置为:将所推送的特定内容所属于的情感类作为基准情感类;将所述目标情感类以及所述基准情感类映射到情感坐标系中的情感坐标以获得目标情感坐标和基准情感坐标;计算所述目标情感坐标与所述基准情感坐标之间的距离作为匹配度的度量。
可选地,匹配度满足预定条件是指以下中的一个:如果所述目标情感坐标与所述基准情感坐标之间的距离小于预定阈值,则认为匹配度满足预定条件;获取与基准情感坐标距离最短的目标情感坐标,认为该目标情感坐标与基准情感坐标的匹配度满足预定条件。
可选地,当所述文字内容中同时存在多个情感词时,分别为每个情感词判断匹配度。
可选地,所述文字内容的一部分是包含该特定符号和/或情感词的最小语段,语段是指两个标点符号之间的语言片断。
可选地,推送单元通过预定模板将所述文字内容的一部分与所推送的特定内容相组合。
可选地,推送单元包括恰当性判断单元,被配置为判断将所述文字内容的一部分与所推送的特定内容相组合后的恰当性,仅在所述组合恰当的情况下才将该组合显示在所述预定网页上。
根据另一个实施例的一种为预定网页上的文字内容推送特定内容的装置1100包括:情感分析单元1110,被配置为对预定网页上的文字内容和该文字内容的回复文字内容进行情感分析;匹配度确定单元1120,被配置为将对该文字内容的回复文字内容情感分析的结果与对该文字内容情感分析的结果、所推送的特定内容所表达的情感分别进行匹配度确定,从而得到第一匹配度和第二匹配度;以及推送单元1130,被配置为响应于确定出的第一匹配度和第二匹配度满足预定条件,将该文字内容的回复文字内容的一部分与所推送的特定内容相组合从而形成特定于用户的推送内容。
可选地,情感分析单元包括提取单元(未示出),被配置为:从所述预定网页上的文字内容和该文字内容的回复文字内容提取表示情感的符号,其中所述符号属于规定的符号集;以及从预定网页上的文字内容和该文字内容的回复文字内容中提取情感词。
可选地,匹配度确定单元进一步被配置为将从预定网页上的文字内容提取的符号和/或情感词划分到预定情感集合中的情感类作为第一情感类,以及将从该文字内容的回复文字内容提取的符号和/或情感词划分到预定情感集合中的情感类作为第二情感类,其中符号和/或情感词与情感类的对应关系是通过查找存储有符号和/或情感词与情感类的对应关系的数据库进行的。
可选地,匹配度确定单元进一步被配置为:将所推送的特定内容所属于的情感类作为第三情感类;如果该文字内容的回复文字内容中不包含情感转化,则将第一情感类、第二情感类和第三情感类映射在情感坐标系中分别得到第一情感坐标、第二情感坐标和第三情感坐标,计算第一情感坐标与第二情感坐标之间的距离作为所述第一匹配度的度量,以及计算第二情感坐标与第三情感坐标之间的距离作为所述第二匹配度的度量。
可选地,匹配度确定单元进一步被配置为:将所推送的特定内容所属于的情感类作为第三情感类;如果该文字内容的回复文字内容中包含情感转化,则提取出情感转化前的符号和/或情感词和情感转化后的符号和/或情感词并将其划分到预定情感集合中的情感类,从而分别得到第四情感类和第五情感类,将第一情感类、第三情感类、第四情感类和第五情感类映射在情感坐标系中分别得到第一情感坐标、第三情感坐标、第四情感坐标和第五情感坐标,计算第一情感坐标与第四情感坐标之间的距离作为所述第一匹配度的度量,第三情感坐标与第五情感坐标之间的距离作为所述第二匹配度的度量。
可选地,匹配度满足预定条件是指以下中的一个:如果第一匹配度和第二匹配度的度量之和小于预定阈值,则认为所述第一匹配度和第二匹配度满足预定条件;对于所有回复文字内容获取所述第一匹配度和第二匹配度的度量之和,认为其中具有最小值的度量的回复文字内容的匹配度满足预定条件。
可选地,当所述预定网页上的文字内容和该文字内容的回复文字中的任意一个中同时存在多个情感词时,分别为每个情感词判断匹配度。
可选地,如果从所述预定网页上的文字内容既包括符号又包括情感词,则分别为所提取出的符号和情感词确定情感匹配度。
可选地,所述文字内容的回复文字内容的一部分是包含该特定符号和/或情感词的最小语段,语段是指两个标点符号之间的语言片断。
可选地,推送单元通过预定模板将该文字内容的回复文字内容的一部分与所推送的特定内容相组合。
可选地,推送单元判断包括恰当性判断单元,被配置为将所述文字内容的回复文字内容的一部分与所推送的特定内容相组合后的恰当性,仅在所述文字内容的回复文字内容的一部分与所推送的特定内容的组合恰当的情况下才将该组合显示在所述文字内容所在的网页上。
本领域技术人员理解,装置1100可以驻留于特定网站,为该网站的网页推送内容。另一方面,装置1100还可以驻留于服务器中,通过服务器的网络接口远程地为其他网站的网页推送内容。以上讲述了本公开的多个实施例,然而,应当理解,上述说明是示例性的而非穷尽的。例如,在用户回复中可能同时存在情感词和表情符号,此时,可以对情感词和表情符号分别进行匹配度分析,以查找满足预定条件的匹配度。在该实施例中,在组合时,可以组合表情符号,也可以组合表情符号所属的句子中含有情感词的最小语段。在另一个实施例中,用户输入的文字(初始输入的文字以及随后回复的文字)中可能存在多个情感词。此时,无论作用基准或目标的情感坐标有多少个,根据本公开的精神,只需要寻找与这些基准和目标的匹配度满足预定条件的用户回复。因此,可以为这些多个情感词计算分别计算情感匹配度,并最终查找满足预定条件的用户输入文字用于组合。
值得说明的是,由于计算机软件和硬件之间是可以相互转换的,例如,一段软件代码可以通过硬件描述语言(例如Verlog等)转化为相应的硬件,例如现场可编程门阵列(FPGA)或者被转化为相应的专用芯片。因此,本公开的实施例可以使用软件实现,可以使用硬件实现,也可以固件的形式实现。本公开已经充分地公开了能够实现本公开目的的装置的组成部件以及通过信号的传递公开了各组成部件之间的连接关系,因此,本领域技术人员完全能够理解,此处公开的技术可以以硬件或固件的方式实现。此外,为了简明起见,本文仅仅描述了与实现本公开密切相关的那些步骤、模块,而省略了其他的组成部件。然而,本领域技术人员应当理解,本公开的方法或装置还可以包括除了上述之外的步骤和组成模块。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (16)
1.一种为预定网页上的文字内容推送特定内容的方法,包括:
对预定网页上的文字内容和该文字内容的回复文字内容进行情感分析;
将对该文字内容的回复文字内容情感分析的结果与对该文字内容情感分析的结果、所推送的特定内容所表达的情感分别进行匹配度确定,从而得到第一匹配度和第二匹配度;以及
响应于确定出的第一匹配度和第二匹配度满足预定条件,将该文字内容的回复文字内容的一部分与所推送的特定内容相组合从而形成特定于用户的推送内容。
2.如权利要求1所述的方法,其中对预定网页上的文字内容和该文字内容的回复文字内容进行情感分析包括以下中的至少一种:
从所述预定网页上的文字内容和该文字内容的回复文字内容提取表示情感的符号,其中所述符号属于规定的符号集;以及
从预定网页上的文字内容和该文字内容的回复文字内容中提取情感词。
3.如权利要求2所述的方法,其中对预定网页上的文字内容和该文字内容的回复文字内容进行情感分析包括将从预定网页上的文字内容提取的符号和/或情感词划分到预定情感集合中的情感类作为第一情感类,以及将从该文字内容的回复文字内容提取的符号和/或情感词划分到预定情感集合中的情感类作为第二情感类,
其中符号和/或情感词与情感类的对应关系是通过查找存储有符号和/或情感词与情感类的对应关系的数据库进行的。
4.如权利要求3所述的方法,其中将对该文字内容的回复文字内容情感分析的结果与对该文字内容情感分析的结果和所推送的特定内容所表达的情感分别进行匹配度确定从而得到第一匹配度和第二匹配度包括:
将所推送的特定内容所属于的情感类作为第三情感类;
如果该文字内容的回复文字内容中不包含情感转化,则将第一情感类、第二情感类和第三情感类映射在情感坐标系中分别得到第一情感坐标、第二情感坐标和第三情感坐标,计算第一情感坐标与第二情感坐标之间的距离作为所述第一匹配度的度量,以及计算第二情感坐标与第三情感坐标之间的距离作为所述第二匹配度的度量。
5.如权利要求3所述的方法,其中将对该文字内容的回复文字内容情感分析的结果与对该文字内容情感分析的结果和所推送的特定内容所表达的情感分别进行匹配度确定,从而得到第一匹配度和第二匹配度包括:
将所推送的特定内容所属于的情感类作为第三情感类;
如果该文字内容的回复文字内容中包含情感转化,则提取出情感转化前的符号和/或情感词和情感转化后的符号和/或情感词并将其划分到预定情感集合中的情感类,从而分别得到第四情感类和第五情感类,将第一情感类、第三情感类、第四情感类和第五情感类映射在情感坐标系中分别得到第一情感坐标、第三情感坐标、第四情感坐标和第五情感坐标,计算第一情感坐标与第四情感坐标之间的距离作为所述第一匹配度的度量,第三情感坐标与第五情感坐标之间的距离作为所述第二匹配度的度量。
6.如权利要求4或5所述的方法,其中匹配度满足预定条件是指以下中的一个:
如果第一匹配度和第二匹配度的度量之和小于预定阈值,则认为所述第一匹配度和第二匹配度满足预定条件;
对于所有回复文字内容获取所述第一匹配度和第二匹配度的度量之和,认为其中具有最小值的度量的回复文字内容的匹配度满足预定条件。
7.如权利要求1-5中任一项所述的方法,其中通过预定模板将该文字内容的回复文字内容的一部分与所推送的特定内容相组合。
8.如权利要求1-5中任一项所述的方法,还包括:判断将所述文字内容的回复文字内容的一部分与所推送的特定内容相组合后的恰当性,仅在所述文字内容的回复文字内容的一部分与所推送的特定内容的组合恰当的情况下才将该组合显示在所述文字内容所在的网页上。
9.一种为预定网页上的文字内容推送特定内容的装置,包括:
用于对预定网页上的文字内容和该文字内容的回复文字内容进行情感分析的装置;
用于将对该文字内容的回复文字内容情感分析的结果与对该文字内容情感分析的结果、所推送的特定内容所表达的情感分别进行匹配度确定从而得到第一匹配度和第二匹配度的装置;以及
用于响应于确定出的第一匹配度和第二匹配度满足预定条件,将该文字内容的回复文字内容的一部分与所推送的特定内容相组合从而形成特定于用户的推送内容。
10.如权利要求9所述的装置,其中对预定网页上的文字内容和该文字内容的回复文字内容进行情感分析包括以下中的至少一种:
从所述预定网页上的文字内容和该文字内容的回复文字内容提取表示情感的符号,其中所述符号属于规定的符号集;以及
从预定网页上的文字内容和该文字内容的回复文字内容中提取情感词。
11.如权利要求10所述的装置,其中对预定网页上的文字内容和该文字内容的回复文字内容进行情感分析包括将从预定网页上的文字内容提取的符号和/或情感词划分到预定情感集合中的情感类作为第一情感类,以及将从该文字内容的回复文字内容提取的符号和/或情感词划分到预定情感集合中的情感类作为第二情感类,
其中符号和/或情感词与情感类的对应关系是通过查找存储有符号和/或情感词与情感类的对应关系的数据库进行的。
12.如权利要求11所述的装置,其中将对该文字内容的回复文字内容情感分析的结果与对该文字内容情感分析的结果和所推送的特定内容所表达的情感分别进行匹配度确定从而得到第一匹配度和第二匹配度包括:
将所推送的特定内容所属于的情感类作为第三情感类;
如果该文字内容的回复文字内容中不包含情感转化,则将第一情感类、第二情感类和第三情感类映射在情感坐标系中分别得到第一情感坐标、第二情感坐标和第三情感坐标,计算第一情感坐标与第二情感坐标之间的距离作为所述第一匹配度的度量,以及计算第二情感坐标与第三情感坐标之间的距离作为所述第二匹配度的度量。
13.如权利要求11所述的装置,其中将对该文字内容的回复文字内容情感分析的结果与对该文字内容情感分析的结果和所推送的特定内容所表达的情感分别进行匹配度确定,从而得到第一匹配度和第二匹配度包括:
将所推送的特定内容所属于的情感类作为第三情感类;
如果该文字内容的回复文字内容中包含情感转化,则提取出情感转化前的符号和/或情感词和情感转化后的符号和/或情感词并将其划分到预定情感集合中的情感类,从而分别得到第四情感类和第五情感类,将第一情感类、第三情感类、第四情感类和第五情感类映射在情感坐标系中分别得到第一情感坐标、第三情感坐标、第四情感坐标和第五情感坐标,计算第一情感坐标与第四情感坐标之间的距离作为所述第一匹配度的度量,第三情感坐标与第五情感坐标之间的距离作为所述第二匹配度的度量。
14.如权利要求12或13所述的装置,其中匹配度满足预定条件是指以下中的一个:
如果第一匹配度和第二匹配度的度量之和小于预定阈值,则认为所述第一匹配度和第二匹配度满足预定条件;
对于所有回复文字内容获取所述第一匹配度和第二匹配度的度量之和,认为其中具有最小值的度量的回复文字内容的匹配度满足预定条件。
15.如权利要求9-13中任一项所述的装置,其中通过预定模板将该文字内容的回复文字内容的一部分与所推送的特定内容相组合。
16.如权利要求9-13中任一项所述的装置,还包括:判断将所述文字内容的回复文字内容的一部分与所推送的特定内容相组合后的恰当性,仅在所述文字内容的回复文字内容的一部分与所推送的特定内容的组合恰当的情况下才将该组合显示在所述文字内容所在的网页上。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210318654.XA CN103678304B (zh) | 2012-08-31 | 2012-08-31 | 为预定网页推送特定内容的方法、装置 |
US14/012,085 US9230035B2 (en) | 2012-08-31 | 2013-08-28 | Pushing specific content to a predetermined webpage |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210318654.XA CN103678304B (zh) | 2012-08-31 | 2012-08-31 | 为预定网页推送特定内容的方法、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103678304A CN103678304A (zh) | 2014-03-26 |
CN103678304B true CN103678304B (zh) | 2017-04-12 |
Family
ID=50188914
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210318654.XA Active CN103678304B (zh) | 2012-08-31 | 2012-08-31 | 为预定网页推送特定内容的方法、装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9230035B2 (zh) |
CN (1) | CN103678304B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013085409A1 (ru) * | 2011-12-08 | 2013-06-13 | Общество С Ограниченной Ответственностью Базелевс-Инновации | Способ анимации sms-сообщений |
US9681166B2 (en) * | 2014-02-25 | 2017-06-13 | Facebook, Inc. | Techniques for emotion detection and content delivery |
CN104376104A (zh) * | 2014-11-25 | 2015-02-25 | 苏州迪云信息科技有限公司 | 一种用于分析目标数据中关键信息的方法和装置 |
CN104504024B (zh) * | 2014-12-11 | 2018-09-07 | 中国科学院计算技术研究所 | 基于微博内容的关键词挖掘方法及系统 |
CN104618222B (zh) * | 2015-01-07 | 2017-12-08 | 腾讯科技(深圳)有限公司 | 一种匹配表情图像的方法及装置 |
CN105205097A (zh) * | 2015-08-18 | 2015-12-30 | 耿懿超 | 一种信息推送方法及信息推送装置 |
CN106790336B (zh) * | 2015-11-25 | 2020-11-24 | 上海优扬新媒信息技术有限公司 | 信息的推送方法、推送装置及用于显示信息的方法和装置 |
CN108733666B (zh) * | 2017-04-13 | 2022-03-08 | 腾讯科技(深圳)有限公司 | 服务器信息推送方法、终端信息发送方法及装置、系统 |
CN107241260B (zh) * | 2017-06-02 | 2020-05-05 | 北京百度网讯科技有限公司 | 基于人工智能的新闻推送的方法和装置 |
CN107832344A (zh) * | 2017-10-16 | 2018-03-23 | 广州大学 | 一种基于storm流计算框架的食品安全网络舆情分析方法 |
CN110858234A (zh) * | 2018-08-24 | 2020-03-03 | 中移(杭州)信息技术有限公司 | 一种根据人物情感进行信息推送的方法及装置 |
CN109522486A (zh) * | 2018-11-30 | 2019-03-26 | 北京字节跳动网络技术有限公司 | 用于匹配信息的方法和装置 |
CN110795660B (zh) * | 2019-09-26 | 2022-10-18 | 北京大米科技有限公司 | 数据分析方法、装置、电子设备及介质 |
CN111291259B (zh) * | 2020-01-20 | 2023-05-26 | 北京字节跳动网络技术有限公司 | 一种数据筛选方法、装置、电子设备和存储介质 |
CN113010784B (zh) * | 2021-03-17 | 2024-02-06 | 北京十一贝科技有限公司 | 用于生成预测信息的方法、装置、电子设备和介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751458A (zh) * | 2009-12-31 | 2010-06-23 | 暨南大学 | 一种网络舆情监控系统及方法 |
WO2010119379A1 (en) * | 2009-04-15 | 2010-10-21 | Imagini Holdings Limited | A method and system for providing customized content using emotional preference |
CN102122297A (zh) * | 2011-03-04 | 2011-07-13 | 北京航空航天大学 | 一种基于语义的汉语网络文本情感提取方法 |
CN102300163A (zh) * | 2011-09-22 | 2011-12-28 | 宇龙计算机通信科技(深圳)有限公司 | 信息推送方法、移动终端和系统 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7073129B1 (en) * | 1998-12-18 | 2006-07-04 | Tangis Corporation | Automated selection of appropriate information based on a computer user's context |
US20030072289A1 (en) * | 2001-10-16 | 2003-04-17 | Maria Yuang | Quality-of-service guaranteed media access control method with dynamic granularity control for local wireless ATM networks |
US7958150B2 (en) * | 2004-04-30 | 2011-06-07 | International Business Machines Corporation | Method for implementing fine-grained access control using access restrictions |
WO2006061481A1 (fr) * | 2004-12-09 | 2006-06-15 | France Telecom | Dispositif et procede de controle d’acces, noyau a composants le comportant et son utilisation |
US8762552B2 (en) * | 2005-04-13 | 2014-06-24 | Brocade Communications Systems, Inc. | Fine granularity access control for a storage area network |
US8560390B2 (en) | 2008-03-03 | 2013-10-15 | Yahoo! Inc. | Method and apparatus for social network marketing with brand referral |
EP2297685A1 (en) | 2008-07-04 | 2011-03-23 | Yogesh Chunilal Rathod | Methods and systems for brands social networks (bsn) platform |
US20100185564A1 (en) | 2009-01-21 | 2010-07-22 | Mccormick & Company, Inc. | Method and questionnaire for measuring consumer emotions associated with products |
US8676628B2 (en) | 2009-09-11 | 2014-03-18 | Roil Results Pty Limited | Method and system for determining effectiveness of marketing |
US20120036085A1 (en) | 2010-08-05 | 2012-02-09 | Accenture Global Services Gmbh | Social media variable analytical system |
US9536269B2 (en) | 2011-01-19 | 2017-01-03 | 24/7 Customer, Inc. | Method and apparatus for analyzing and applying data related to customer interactions with social media |
US20130066716A1 (en) * | 2011-09-12 | 2013-03-14 | Founton Technologies, Ltd. | Sentiment-targeting for online advertisement |
-
2012
- 2012-08-31 CN CN201210318654.XA patent/CN103678304B/zh active Active
-
2013
- 2013-08-28 US US14/012,085 patent/US9230035B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010119379A1 (en) * | 2009-04-15 | 2010-10-21 | Imagini Holdings Limited | A method and system for providing customized content using emotional preference |
CN101751458A (zh) * | 2009-12-31 | 2010-06-23 | 暨南大学 | 一种网络舆情监控系统及方法 |
CN102122297A (zh) * | 2011-03-04 | 2011-07-13 | 北京航空航天大学 | 一种基于语义的汉语网络文本情感提取方法 |
CN102300163A (zh) * | 2011-09-22 | 2011-12-28 | 宇龙计算机通信科技(深圳)有限公司 | 信息推送方法、移动终端和系统 |
Also Published As
Publication number | Publication date |
---|---|
US20140067818A1 (en) | 2014-03-06 |
CN103678304A (zh) | 2014-03-26 |
US9230035B2 (en) | 2016-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103678304B (zh) | 为预定网页推送特定内容的方法、装置 | |
CN109657054A (zh) | 摘要生成方法、装置、服务器及存储介质 | |
EP3617952A1 (en) | Information search method, apparatus and system | |
CN103377262B (zh) | 对用户进行分组的方法和装置 | |
JP2019504413A (ja) | 絵文字を提案するためのシステムおよび方法 | |
CN107526800A (zh) | 信息推荐的装置、方法及计算机可读存储介质 | |
CN102651719B (zh) | 用于在消息交互环境中跟踪消息话题的方法和设备 | |
JP2013545189A (ja) | マルチステージを使用したカテゴリ情報の決定 | |
CN108845986A (zh) | 一种情感分析方法、设备及系统、计算机可读存储介质 | |
CN104239373A (zh) | 为文档添加标签的方法及装置 | |
CN112733042A (zh) | 推荐信息的生成方法、相关装置及计算机程序产品 | |
CN105378717A (zh) | 用于对社交媒体的用户分类的方法、计算机程序和计算机 | |
WO2017016122A1 (zh) | 一种信息推送方法及装置 | |
CN115212561B (zh) | 基于玩家的语音游戏数据的服务处理方法及相关产品 | |
CN107368509B (zh) | 通信方法、通信系统及计算机可读非暂时性存储介质 | |
CN107357777A (zh) | 提取标签信息的方法和装置 | |
JP6605410B2 (ja) | 感情要因推定支援装置、感情要因推定支援方法及び感情要因推定支援用プログラム | |
CN110070410A (zh) | 一种基于大数据的人口社交分析方法及系统 | |
JP2019053386A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
McGlynn | ‘Fat boys make you feel thinner!’: fat GBQ men’s comfort and stigma in UK bear spaces | |
CN109408735A (zh) | 一种陌生人社交用户画像的生成方法与系统 | |
CN110909247B (zh) | 文本信息的推送方法、电子设备及计算机存储介质 | |
CN105426382A (zh) | 一种基于Personal Rank的情绪上下文感知的音乐推荐方法 | |
CN112214663A (zh) | 获取舆情声量的方法、系统、装置、存储介质及移动终端 | |
CN116775815B (zh) | 对话数据的处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |