CN107924398B - 用于提供以评论为中心的新闻阅读器的系统和方法 - Google Patents

用于提供以评论为中心的新闻阅读器的系统和方法 Download PDF

Info

Publication number
CN107924398B
CN107924398B CN201580082049.9A CN201580082049A CN107924398B CN 107924398 B CN107924398 B CN 107924398B CN 201580082049 A CN201580082049 A CN 201580082049A CN 107924398 B CN107924398 B CN 107924398B
Authority
CN
China
Prior art keywords
content item
comment
computer
comments
computing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580082049.9A
Other languages
English (en)
Other versions
CN107924398A (zh
Inventor
韦福如
周明
刘洋
曹自强
黄绍晗
董力
崔磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN107924398A publication Critical patent/CN107924398A/zh
Application granted granted Critical
Publication of CN107924398B publication Critical patent/CN107924398B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/131Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/134Hyperlinking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Machine Translation (AREA)

Abstract

用于将评论链接到内容项的部分的方法和系统。示例计算设备接收与由源系统产生的内容项相关联的信息,内容项可由其他计算设备经由网络访问,并且接收与内容项相关联的评论,评论由其他计算设备中的一个产生。响应于接收信息和评论,计算设备至少基于与内容项目和评论相关联的细节来预测要链接到接收到的评论的内容项的子部分,然后使得与内容项的所预测的子部分相关联的信息可用于请求访问内容项的其他计算设备。

Description

用于提供以评论为中心的新闻阅读器的系统和方法
背景
存在许多产生新闻和观点文章的网站。在一些此类网站中,用户可发布关于特定新闻文章的评论。然而,新闻内容和对应的评论常常是分开的或未经链接的。此外,在大多数场景中,用户必须滚动到与新闻不同的区域才能阅读其他人的评论或张贴他们自己的评论。
其他允许评论的新闻网站要求用户在张贴他们的(一个或多个)评论之前必须首先从所呈现的新闻文章中手动地选择单词或短语。这增加了用户的负担,由此削减了用户的体验。
概述
本文描述了用于提供评论和内容链接和呈现技术的技术。
本文中公开的配置允许接收与由源系统产生的内容项相关联的信息,该内容项可由其他计算设备经由网络来访问,并且接收与该内容项相关联的评论,该评论由其他计算设备中的一个产生。响应于接收到信息和评论,计算设备至少基于与内容项和评论相关联的细节来预测要链接到所接收到的评论的内容项的子部分,然后使得与内容项的所预测的子部分相关联的信息可用于请求访问内容项的其他计算设备。
所公开的配置允许用户在阅读新闻文章期间更容易地查看/阅读其他评论,并允许用户张贴关于文章的特定部分的评论,而不必主动地指定文章的特定部分。这提供更直观的交互式用户体验评论,并改善用户与计算机进行交互时的效率。这降低了用户的负担,由此增加了用户的效率和体验。
应当理解,上述主题可被实现为计算机控制的装置、计算机进程、计算系统或诸如计算机可读存储介质等制品。通过阅读下面的详细描述并审阅相关联的附图,这些及各种其他特征将变得显而易见。
提供本概述以便以简化的形式介绍以下在详细描述中进一步描述的一些概念。本概述不旨在标识所要求保护的主题的关键或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。例如术语“技术”可指代上述上下文和通篇文档中所准许的(诸)系统、(诸)方法、计算机可读指令、(诸)模块、算法、硬件逻辑和/或(诸)操作。
附图简述
结合附图来描述具体实施方式。在附图中,附图标记最左边的数字标识该附图标记首次出现的附图。不同附图中的相同参考标记指示相似或相同的项。
图1是描绘用于实现新闻阅读器和评论链接应用的示例环境的图。
图2A-B示出了被允许基于由图1所示的系统的各组件所提供的功能来呈现内容和评论的示例移动设备。
图3是描绘用于训练新闻/评论链接和呈现系统的过程的示例操作的流程图。
图4示出了描述用于预测评论与新闻内容之间的链接的过程的示例操作的流程图。
图5是示出了能够实现本文所呈现的配置的各方面的计算设备的说明性计算机硬件和软件体系结构的计算机体系结构图。
详细描述
概览
本文所描述的各示例提供具有主机服务器的系统的构造,该主机服务器提供通往诸如新闻文章之类的网络可访问内容内的特定位置的评论链接。系统还具有用于将内容与经链接的评论一起呈现的客户端侧组件。
进一步参考图1-5来描述各示例、场景和方面。
说明性环境
图1例示了用于实现以评论为中心的新闻阅读器的示例环境。以评论为中心的新闻阅读器根据用户当前正与所接收到的内容项(例如,新闻文章)的什么部分进行交互(例如,阅读、观看、收听、感测等)来呈现(最近的和过去的)评论。
在示例中,基于网络的系统100包括一个或多个内容服务器102、多个客户端计算设备104(1)-(N)以及一个或多个内容/评论链接服务器108。内容服务器102、客户端计算设备104(1)-(N)以及内容/评论链接服务器108全部跨一个或多个网络106进行通信。
(诸)网络106可包括诸如因特网之类的公共网络、诸如机构和/或个人内联网之类的专用网络、或专用网络和公共网络的某种组合。(诸)网络106还可包括任何类型的有线和/或无线网络,包括但不限于局域网(LAN)、广域网(WAN)、卫星网络、有线网络、Wi-Fi网络、WiMax网络、移动通信网络(如3G、4G等等)或它们的任意组合。(诸)网络106可利用通信协议,包括基于分组的和/或基于数据报的协议,诸如互联网协议(IP)、传输控制协议(TCP)、用户数据报协议(UDP)或其他类型的协议。而且,(诸)网络106还可包括便于网络通信和/或形成网络的硬件基础的若干设备,诸如交换机、路由器、网关、接入点、防火墙、基站、中继器、主干设备等等。
在示例场景中,服务器102、108可包括一个或多个可在群集中操作或在其他分组的配置中操作以共享资源、平衡负载、提升性能、提供故障转移支持或冗余或出于其他目的的一个或多个计算设备。服务器102、108可属于各种各样的设备类别或分类,诸如传统的服务器类型的设备、台式计算机类型的设备、移动类型的设备、专用类型的设备、嵌入式类型的设备和/或可穿戴类型的设备。由此,虽然被例示为塔式计算机,但是服务器102、108可包括多种多样的设备类型并不限于特定类型的设备。服务器102、108可表示但不限于:台式计算机、服务器计算机、web服务器计算机、个人计算机、移动计算机、膝上型计算机、平板计算机、可穿戴计算机、植入式计算设备、电信设备、车载计算机、启用网络的电视机、瘦客户机、终端、个人数据助理(PDA)、游戏控制台、游戏设备、工作站、媒体播放器、个人录像机(PVR)、机顶盒、相机、用于包括在计算设备内的集成组件、家用电器,或任何其他类型的计算设备。
在一些示例中,内容/评论链接服务器108可至少包括处理器110、存储器112以及输入/输出(I/O)设备114。存储器112可至少包括内容/评论链接模块116。当由处理器110执行时,内容/评论链接模块116导致接收由用户在设备104(1)-(N)中的任何一个处生成的评论以及接收关于作为评论的目标的内容的信息。通过处理器110的内容/评论链接模块116的执行导致将所接收到的评论链接到相关联的内容的特定部分。
客户端设备104(1)-(N)至少包括处理器118、显示器120、用户界面120、存储器124以及I/O设备126。存储器124可储存内容/评论模块128,该内容/评论模块128在由处理器118执行时从特定内容服务器102接收内容和与来自内容/评论链接服务器108的链接有关的经链接的评论信息。基于对当前在显示器120上正被呈现的内容和接收到的经链接的评论信息的知晓,执行内容/评论模块128的其他组件的处理器118呈现先前被链接到当前所呈现的内容的评论。而且,处理器118在执行内容/评论模块128的其他组件时可在显示器120上呈现评论区域。评论区域可接收与所呈现的内容有关的用户评论。如果客户端设备104包括内容/评论链接模块116,则接收到的评论可在内容/评论链接服务器108处或客户端设备104处被链接到内容的特定部分。客户端设备104的其他组件的示例在图5中被示出。
由模块116、128提供的功能可位于网络上的其他计算位置,或者可跨网络上的多个计算位置分布。
图2A示出了被实现为移动设备200(即,智能电话、个人数据助理等)的客户端设备104的示例。移动设备200包括显示器202并可包括用户界面控件204。内容/评论模块128导致处理器118在必要时通过与内容服务器102和/或(诸)内容/评论链接服务器108进行通信来将关于内容和评论的信息呈现在显示器202上。处理器118在执行内容/评论模块128的各组件时基于用户的请求来呈现来自内容服务器102的内容。用户对内容的请求的示例可包括将新闻源网站地址输入到被呈现在显示器202上的浏览器(未示出)中。所请求的内容(例如,新闻文章网页)被部分地呈现在显示器202的内容呈现区域206内。
被呈现的内容可包括标题和正文。在该示例中,标题被呈现在内容呈现区域206的标题部分206a中。内容的正文被呈现在内容呈现区域206的正文部分206b中。
显示器202包括评论区域208。评论区域208可以是示出过去和实况评论的选定的区域。当由用户查看时,评论区域208可被呈现在内容呈现区域206之上、之下或附近。内容/评论模块128可导致处理器118维持与实体(例如,内容/评论链接服务器108)的开放通信链接,该实体将评论链接到内容呈现区域206中的当前被呈现的内容。如果其他客户端设备104(1)-(N)包括内容/评论链接模块116,则该实体可以是那些其他设备。该开放通信链接允许将来自其他用户的评论被链接到、被发送、随后被实况地或接近实时地呈现在显示器202上。因此,仅那些先前被链接到或将被链接到当前在内容呈现区域206中显示的内容的评论被呈现在评论区域208中。这些评论的选择将由用户与内容进行交互的当前位置(哪些句子在屏幕上被示出)来确定。
如果评论的数目超过阈值或评论或者一组评论的大小超过评论区域208的大小值,则经链接的评论将水平或垂直滚动。该滚动可自动地发生,或响应于用户对用户界面控件204或显示器202(如果该显示器包括触摸屏组件的话)的动作而发生。
在内容呈现区域206中被呈现的内容的具有经链接的评论的句子可被突出显示或者以独特于那些没有(诸)经链接的评论的句子的方式被显示。
显示器202还可包括评论输入区域210。评论输入区域210包括用于允许用户发布他们自己的评论的评论输入框。在用户已将评论输入到评论输入区域210的评论输入框后,用户可通过激活前往(Go)按钮212或类似的激活机制将评论与内容或者与内容呈现区域206内的被呈现的内容相关联。当在评论输入区域210中输入评论时,所输入的评论和内容信息被发送到内容/评论链接服务器108。替代地,当被储存在存储器124中时,内容/评论模块128使得处理器118将评论链接到内容内的特定句子/短语。
图2B示出了用户已滚动正文部分206b中的文章之后的客户端设备104。因为现在文章的不同部分出现在了正文部分206b中,所以客户端设备104滚动评论区域208以示出被标识为被链接到现在出现在正文部分206b中的句子的评论。
评论被自动地链接到在分类框架中的内容的句子,该分类框架包括基于评论/句子对的集合来训练模型。从样本评论和句子中提取出的特征的训练集被首先创建。该训练集可使用先前与许多不同的内容帖子相关联的许多不同的评论。训练集被用来训练用于使用自然语言处理技术来对各实例进行分类的分类器。这被描述成如下:
给定具有评论集C={c1,c2,…,cm}的内容项S={s1,s2,…,sn}(s=句子),通过计算这两个集合的笛卡尔乘积(Cartesian product)来获得候选评论-句子对T={t11,t12,…,tmn}。
词汇级(lexical-level)、实体级(entity-level)、以及主题级(topic-level)特征从所获得的对中被提取出。根据训练对tpq的每个cp和sq的提取出的特征来创建特征向量v(tpq)。
tpq的类别被指派为ypq=1,并且任何其他对t'pq=<cp,so>(其中o≠q)被指派为ypo=0。训练实例<t,y>被输入到支持向量机(SVM)分类器中,该分类器学习每一对的权重值。
对于新的评论-句子对,SVM分类器可被用来在已经针对该对提取出特征之后来预测该对为真的可能性。
表1列出了提取出的词汇特征的示例。
Figure BDA0001561798060000061
表1:提取出的特征
词汇特征包括句子与被表示为两个Tf-idf向量的评论之间的余弦相似性。Tf-idf表示术语频率(term-frequency)乘以文档频率的倒数。词汇特征还包括常用词、词干、词性(POS)标签和功能词的数目。功能词包括动词和名词,因为它们是最重要的单词类型。
实体级特征根据通用实体类型的数目和每种类型内的通用实体的数目来计算。所有词汇级和实体级数目被相关联的内容句子的长度取平均。主题级特征基于对评论和句子的潜在狄利克雷分配(LDA)分析。在LDA之后,为每个评论或句子生成主题向量,其中每个维度表示文本中的一个潜在主题。评论与句子主题向量的余弦相似性被确定。这表示评论与内容句子之间的语义相似性。
词汇特征被用来生成特征向量。管理该训练操作的人基于这个人对每一对是否为可能的链接的感知来向每一对的特征向量施加权重。经加权的对被应用于建模器/分类器,诸如SVM分类器,其创建用于将评论链接到句子的模型/分类器。
说明性过程
过程300-400被例示为逻辑流程图中的各框的集合,其表示可在硬件、软件或其组合中被实现的操作序列。在软件的上下文中,这些框表示被储存在一个或多个计算机可读存储介质上的计算机可执行指令,这些指令在由一个或多个处理器执行时执行所述操作。计算机可执行指令可包括执行特定功能或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等。描述操作的次序并不旨在被解释为限制,并且任何数量的所描述的框可以按任何次序和/或并行地进行组合以实现所例示的过程。本文中所描述的过程中的一个或多个可独立地或以任何次序(无论是串行还是并行地)关联发生。
如在说明书和权利要求书中使用的术语“计算机可读指令”及其变型,在本文被用来广泛地包括例程、应用、应用模块、程序模块、程序、组件、数据结构、算法等等。计算机可读指令可以在各种系统配置上被实现,包括单处理器或多处理器系统、小型计算机、大型计算机、个人计算机、手持式计算设备、基于微处理器的可编程消费电子产品、其组合等等。
因此,应当理解,本文所描述的逻辑操作被实现为:(1)一系列计算机实现的动作或运行在计算系统上的程序模块;和/或(2)计算系统内的互连的机器逻辑电路或电路模块。该实现是取决于计算系统的性能及其他要求的选择问题。因此,本文所描述的逻辑操作被不同地称为状态、操作、结构设备、动作或模块。这些操作、结构设备、动作和模块可以用软件、固件、专用数字逻辑及其任何组合来实现。
图3例示了用于训练在自动链接过程中使用的链接模型的高级过程300。过程300是使用自然语言处理(NLP)技术的特定实现。首先在框302,一组评论-句子对从训练评论和句子中被获得。该组对可针对各种体裁(例如,国际新闻、本地新闻、体育、观点、美食、娱乐、音乐等)被获得。使用不同体裁的各组对导致不同体裁的训练模型。当使用与类似于当前所查看的内容的体裁相关联的训练模型时,则将评论链接到内容的过程可产生更准确的经链接的结果。
接下来,在框304,针对每对的两个项来标识评论和句子的单词、单词词根、功能词以及词性(POS)。
在框306,标识每对的评论和句子的名称实体。命名对象的示例包括埃菲尔铁塔、林肯总统、以及弦乐柔板(Adagio for Strings)。
然后,在框308,标识每个评论/句子对的主题。主题的标识包括在文本中找到抽象主题。在自然语言处理中,主题模型是用于发现可能在文档集合中出现的抽象主题的一类统计模型。直观地,假设文档是关于特定主题的,人将会预期特定单词较频繁或较不频繁地出现在文档中。文档通常以不同的比例涉及多个主题。主题模型在数学框架中被捕获——主题向量,该主题向量包括与多个主题中的每一个相关联的各个句子中的单词的比例。
然后,在框310,基于主题向量、名称实体以及在框304处找到的其他细节来提取特征。特征提取的结果产生每个评论/句子对中的评论和句子的特征向量。
在框312,训练者基于对每对特征向量是否为匹配的可能性的感知来注释每对特征向量。该注释可以是被指派给该特征向量对的权重值的形式。
在框314,基于经注释的特征向量对来训练模型或分类器。在一个示例中,SVM至少基于经注释的特征向量对来生成模型或分类器。
在判定框316,一旦训练被确定为完成,则过程300准备好分析并将实际评论链接到内容句子,参见图4中的过程400。
图4例示了用于自动地将评论链接到被包括在内容中的一个句子的高级过程400。除了仅使用一个内容和评论外,框402-410中所示的步骤类似于图3的框302-310中所示的步骤。
首先在框402,从所输入的评论和经定义的内容中的各句子中获得一组评论-句子对。
接下来,在框404,针对每对的两个项来标识评论和句子的单词、单词词根、功能词以及POS。
在框406,标识每对的评论和句子的名称实体。
然后,在框408,标识每个评论/句子对的主题向量。如训练过程300中的那些主题向量可能在大小上受到限制。限制主题向量的大小减少了与此链接过程相关联的时间和成本。
然后,在框410,基于主题向量来提取特征。特征提取的结果产生每个评论/句子对中的评论和句子的特征向量。
在框412,基于与图3的经训练的模型的比较来确定每个评论/句子对是否为最佳匹配的预测。结果是该内容的句子之一被确定为所输入的评论的最佳匹配/链接。
然后,在框414,将评论链接到所标识的最佳匹配/链接句子。该所标识的链接被输出以供系统100的组件(诸如内容/评论模块128)将来使用。
下面示出示例评论/内容句子对和相关联的分析。
评论:
GoPro has some cool products,but it seems like they would be reallyeasy to knock off.(GoPro有一些很酷的产品,但看起来似乎它们很容易会被敲坏。)Arugged camera isn't rocket science.(一个坚固的相机并不是什么尖端技术。)
来自内容的句子:
The Yi itself features a 16-megapixel camera capable of shooting1080p video at 60frames per second—better on paper than the$130GoPro Hero,which can only shoot 1080p footage at 30frames per second,or 720p film at60frames.(Yi本身以一种能够以每秒60帧拍摄1080p的视频的1600万像素的相机为特色——理论上比$130的GoPro Hero更好,GoPro Hero只能以每秒30帧拍摄1080p的录像,或以每秒60帧拍摄720p的影片。)
首先,对该对中的每个句子进行词根化、令牌化、POS标签化(粗体字是POS标签):
Figure BDA0001561798060000101
以下是POS标签的示例列表:
CC 并列连词
CD 基数
DT 限定词
EX 存在于该处
FW 外来词
IN 介词或从属连词
JJ 形容词
JJR 形容词,比较级
JJS 形容词,最高级
LS 列表项标记
MD 情态
NN 名词,单数或集合
NNS 名词,复数
NNP 专有名词,单数
NNPS 专有名词,复数
PDT 前置限定词
POS 所有格字尾
PRP 人称代词
PRP$ 物主代词
RB 副词
RBR 副词,比较级
RBS 副词,最高级
RP 虚词
SYM 符号
TO 至
UH 感叹词
VB 动词,基础形式
VBD 动词,过去式
VBG 动词,动名词或现在分词
VBN 动词,过去分词
VBP 动词,存在非第三人称单数
VBZ 动词,存在第三人称单数
WDT wh 限定词
WP wh 代词
WP$ 所有格wh代词
WRB Wh 副词
接下来,句子被分析以找到名称实体。评论中的结果是:[GoPro]。内容句子中的结果是:[Yi,GoPro,Hero]。
在此示例中,主题的数目被选择为五个。以下是该句子的主题模型的主题向量:
[0.1,0.1,0.4,0.3,0.1]
以及对于该评论的主题向量:
[0.2,0,0.2,0.5,0.1]
这些向量的每个维度与一个抽象主题相关联,并且它的值等于与该抽象主题相关联的评论或句子的单词的比例。
然后,基于以上分析从该对的评论和句子中提取出特征以获得每一对的句子和评论的特征向量:
F句子
F评论
假设训练已经发生,则关于经训练的模型/分类器(经训练的SVM分类器)来分析这些特征向量以及所有其他评论/内容句子对的特征向量以确定这些句子中的哪个将被标识成该评论的链接。
尽管以上示例涉及将文本评论链接到文本句子。本发明的实现可被应用于可听评论以及音频和/或视频内容。语音到文本(voice to text)可被用作用于将语音转换成文本的技术。视频分析技术可被用来标识视频中的事件(例如,改变事件)并随后使用该信息作为链接到评论的基础。
图5示出了能够执行上述用于提供以评论为中心的新闻阅读器和链接系统的程序组件的图1中所示的组件的示例计算机体系结构的附加细节。图5所示的计算机体系结构例示了游戏控制台、常规服务器计算机、工作站、台式计算机、膝上型计算机、平板、平板手机、网络设备、个人数字助理(“PDA”)、电子阅读器、数字蜂窝电话或其他计算设备,并且可被用来执行在本文中被呈现出的任一软件组件。例如,图5所示的计算机体系结构可被用来执行上述任一软件组件。尽管本文描述的一些组件专用于客户端设备104,但可以理解这些组件和其他组件可以是服务器108的一部分。
客户端设备104包括基板502或“母板”,其是大量组件或设备可通过系统总线或其他电子通信路径所连接到的印刷电路板。在一个说明性配置中,一个或多个中央处理单元(“CPU”)504结合芯片组506一起操作。CPU 504可以是执行客户端设备104的操作必需的算术和逻辑操作的标准可编程处理器。
CPU 504通过从一个分立的物理状态转换到下一状态来执行操作,该转换是通过操纵在各状态之间进行区分并改变这些状态的切换元件来实现的。切换元件一般可包括维持两个二进制状态之一的电子电路,诸如触发电路(flip-flop),以及基于一个或多个其他切换元件的状态的逻辑组合来提供输出状态的电子电路,诸如逻辑门。这些基本切换元件可被组合以创建更复杂的逻辑电路,包括寄存器、加法器-减法器、算术逻辑单元、浮点单元等等。
芯片组506提供CPU 504与基板502上的其余组件和器件之间的接口。芯片组506可提供对用作客户端设备104中的主存储器的RAM 508的接口。芯片组506还可提供对诸如只读存储器(“ROM”)510或非易失性RAM(“NVRAM”)之类的用于储存有助于启动客户端设备104并在各种组件和器件之间传送信息的基本例程的计算机可读存储介质的接口。ROM 510或NVRAM还可储存根据本文描述的配置的客户端设备104的操作所必需的其他软件组件。
客户端设备104可以使用通过诸如局域网106之类的网络到远程计算设备和计算机系统的逻辑连接来在联网环境中操作。芯片组506可包括用于通过诸如千兆比特以太网适配器等网络接口控制器(NIC)512提供网络连通性的功能。NIC 512能够通过网络106将客户端设备104连接到其他计算设备。应理解,多个NIC 512可存在于客户端设备104中,以将该计算机连接到其他类型的网络和远程计算机系统。网络106允许客户端设备104与远程服务和服务器(诸如服务器102、108)通信。
客户端设备104可连接到为计算设备提供非易失性存储的大容量存储设备526。大容量存储设备526可储存已经在本文更详细地描述的系统程序、应用程序、其他程序模块和数据。大容量存储设备526可以通过连接到芯片组506的存储控制器515连接到客户端设备104。大容量存储设备526可由一个或多个物理存储单元构成。存储控制器515可以通过串行附连SCSI(“SAS”)接口、串行高级技术附连(“SATA”)接口、光纤通道(“FC”)接口或用于在计算机和物理存储单元之间物理地连接和传送数据的其他类型的接口与物理存储单元对接。还应理解,大容量存储设备526、其他存储介质和存储控制器515可包括多媒体卡(MMC)组件、eMMC组件、安全数字(SD)组件、PCI高速组件等。
客户端设备104可通过变换物理存储单元的物理状态以反映被储存的信息来将数据储存在大容量存储设备526上。在本说明书的不同实现中,物理状态的具体变换可取决于各种因素。这些因素的示例可以包括,但不仅限于:用于实现物理存储单元的技术,大容量存储设备526被表征为主存储还是辅存储等等。
例如,客户端设备104可通过经由存储控制器515发出以下指令来将信息储存在大容量存储设备526:更改磁盘驱动器单元内的特定位置的磁特性、光存储单元中的特定位置的反射或折射特性,或者固态存储单元中的特定电容器、晶体管或其他分立组件的电特性。在没有偏离本说明书的范围和精神的情况下,物理介质的其他变换也是可能的,前面提供的示例只是为了便于此描述。客户端设备104还可通过检测物理存储单元内的一个或多个特定位置的物理状态或特性来从大容量存储设备526中进一步读取信息。
除了上述大容量存储设备526之外,客户端设备104还可以能访问其他计算机可读介质以储存和检索信息,诸如程序模块、数据结构或其他数据。由此,尽管程序模块116、128和其他模块被描绘为被储存在大容量存储设备526中的数据和软件,但应理解,这些组件和/或其他模块可被至少部分地被储存在客户端设备104的其他计算机可读存储介质中。虽然对此处包含的计算机可读介质的描述引用了诸如固态驱动器、硬盘或CD-ROM驱动器之类的大容量存储设备,但是本领域的技术人员应该明白,计算机可读介质可以是可由客户端设备104访问的任何可用计算机存储介质或通信介质。
通信介质包括诸如载波或其他传输机制等已调制数据信号中的计算机可读指令、数据结构、程序模块或其他数据,且包含任何传递介质。术语“已调制数据信号”指的是其一个或多个特征以在信号中编码信息的方式被更改或设定的信号。作为示例而非限制,通信介质包括诸如有线网络或直接线连接之类的有线介质,以及诸如声学、RF、红外及其他无线介质之类的无线介质。上述的任意组合也应包括在计算机可读介质的范围之内。
作为示例而非限制,计算机存储介质可包括以用于储存诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。例如,计算机介质包括但不限于,RAM、ROM、EPROM、EEPROM、闪存或其他固态存储器技术,CD-ROM、数字多功能盘(“DVD”)、HD-DVD、BLU-RAY或其他光学存储,磁带盒、磁带、磁盘存储或其他磁性存储设备,或能用于储存所需信息且可以由客户端设备104访问的任何其他介质。为了声明的目的,短语“计算机存储介质”及其变型不包括波或信号本身和/或通信介质。
大容量存储设备526可储存用于控制客户端设备104的操作的操作系统527。根据一个配置,操作系统包括游戏操作系统。根据另一配置,操作系统包括可从其相应的制造商获得的
Figure BDA0001561798060000151
UNIX、ANDROID、WINDOWSPHONE或iOS操作系统。应理解,也可利用其他操作系统。大容量存储设备526可储存由客户端设备104利用的其他系统或应用程序和数据,诸如程序模块116、128、上下文数据529和/或上述任意其他软件组件和数据。大容量存储设备526可能还储存本文未具体标识的其他程序和数据。
在一个配置中,大容量存储设备526或其他计算机可读存储介质用计算机可执行指令来编码,这些计算机可执行指令在被加载到客户端设备104中时将计算机从通用计算系统变换成能够实现本文描述的配置的专用计算机。这些计算机可执行指令通过如上所述地指定CPU 504如何在各状态之间转换来变换客户端设备104。根据一个配置,客户端设备104具有对储存计算机可执行指令的计算机可读存储介质的访问,这些计算机可执行指令在由客户端设备104执行时执行以上参考图5和其他附图描述的各个例程。客户端设备104可能还包括用于执行本文描述的任意其他计算机实现的操作的计算机可读存储介质。
客户端设备104还可包括用于接收并处理来自诸如键盘、鼠标、话筒、耳机、触摸垫、触摸屏、电子指示笔、或任何其他类型的输入设备之类的多个输入设备的输入的一个或多个输入/输出控制器516。还示出输入/输出控制器516与输入/输出设备525通信。输入/输出控制器516可向诸如计算机监视器、HDM、平板显示器、数字投影仪、打印机、绘图仪或其他类型的输出设备之类的显示器提供输出。输入/输出控制器516可提供与诸如话筒518、扬声器520、游戏控制器和/或音频设备等其他设备的输入通信。另外地或替代地,视频输出522可以与芯片组506通信并且独立于输入/输出控制器516进行操作。应当理解,客户端设备104可以不包括图5所示的全部组件,可以包括未在图5中明确示出的其他组件,或者可使用完全不同于图5所示的体系结构。
示例条款
A:一种计算机实现的方法,包括:在计算设备处接收与由源系统产生的内容项相关联的信息,所述内容项能被其他所述计算设备经由网络访问;在所述计算设备处接收与所述内容项相关联的评论,所述评论由所述其他计算设备中的一个产生;响应于接收所述信息和所述评论,在所述计算设备处至少基于与所述内容项和所述评论相关联的细节来预测要链接到所接收到的评论的所述内容项的子部分;以及使得与所述内容项的所预测的子部分相关联的信息对请求访问所述内容项的其他计算设备可用。
B:如条款A所述的计算机实现的方法,其中预测包括:标识所述评论和所述相关联的内容项的每个句子的对;比较所标识的对;以及至少基于所述所标识的对的所述比较来预测要与所述评论链接的所述内容项的所述句子。
C:如条款B所述的计算机实现的方法,其中比较所述所标识的对包括:标识每个对的所述评论和所述句子的词汇级特征;标识每个对的所述评论和所述句子的实体级特征;标识每个对的所述评论和所述句子的主题向量;至少基于所标识的词汇级特征、实体级特征和主题向量来创建特征向量;以及比较所创建的特征向量。
D:如条款C所述的计算机实现的方法,其中比较所创建的特征向量包括:使用基于来自多个不同来源的内容项的评论和句子的样本集合训练的分类器来分析所创建的特征向量。
E:如条款D所述的计算机实现的方法,其中所述分类器包括:与来自多个不同来源的内容项的评论和句子的样本集合相关联地从下面创建的多个特征向量:每个对的所述评论和所述句子的词汇级特征;每个对的所述评论和所述句子的实体级特征;每个对的所述评论和所述句子的主题向量;以及至少基于所标识的词汇级特征的特征向量,其中所述分类器的所述多个特征向量中的每一个包括基于被手动指派的链接值信息的权重值。
F:如条款E所述的计算机实现的方法,还包括使用支持向量机来生成所述分类器。
G:如条款A至F所述的计算机实现的方法,其中与所述内容项相关联的所述信息包括关于在接收所述评论期间所述内容项的什么部分被呈现的信息。
H:如条款A-G所述的计算机实现的方法,还包括:从另一计算设备接收对所述内容项的请求;以及将至少与所述内容项的所预测的子部分相关联的所述信息传送到发起对所述内容项的所述请求的所述计算设备。
I:如条款A-H所述的计算机实现的方法,还包括:从另一计算设备接收对所述内容项的请求;传送所请求的内容项;以及将与所述内容项的所预测的子部分相关联的所述信息传送到发起对所述内容项的所述请求的所述计算设备。
J:如条款A-I所述的计算机实现的方法,其中所产生的内容项包括包含新文章的网站。
K:一种计算设备,包括:处理器;显示设备;以及与所述处理器进行通信的计算机可读存储介质,所述计算机可读存储介质具有被储存在其上的计算机可执行指令,所述计算机可执行指令在被所述处理器执行时使得所述计算机:接收与由源系统产生的内容项相关联的信息,所述内容项能被其他所述计算设备经由网络访问;接收与所述内容项相关联的评论,所述评论由所述其他计算设备中的一个产生;响应于接收所述信息和所述评论,至少基于与所述内容项和所述评论相关联的细节来预测要链接到所接收到的评论的所述内容项的子部分;以及使得与所述内容项的所预测的子部分相关联的信息对请求访问所述内容项的其他计算设备可用。
L:如条款K所述的计算设备,其中预测包括:标识所述评论和所述相关联的内容项的每个句子的对;比较所标识的对;以及至少基于所标识的对的比较来预测要与所述评论链接的所述内容项的所述句子。
M:如条款L所述的计算设备,比较所标识的对包括:标识每个对的所述评论和所述句子的词汇级特征;标识每个对的所述评论和所述句子的实体级特征;标识每个对的所述评论和所述句子的主题向量;至少基于所标识的词汇级特征、实体级特征和主题向量来创建特征向量;以及比较所创建的特征向量。
N:如条款M所述的计算设备,其中比较所创建的特征向量包括:使用基于来自多个不同来源的内容项的评论和句子的样本集合训练的分类器来分析所创建的特征向量。
O:如条款N所述的计算设备,其中所述分类器包括:与来自多个不同来源的内容项的评论和句子的样本集合相关联地从下面创建的多个特征向量:每个对的所述评论和所述句子的词汇级特征;每个对的所述评论和所述句子的实体级特征;每个对的所述评论和所述句子的主题向量;以及至少基于所标识的词汇级特征的特征向量,其中所述分类器的所述多个特征向量中的每一个包括基于被手动指派的链接值信息的权重值。
P:如条款O所述的计算设备,其中与所述内容项相关联的所述信息包括关于在接收所述评论期间所述内容项的什么部分被呈现的信息。
Q:如条款K-O所述的计算设备,其中所述计算机可读存储介质具有被储存在其上的另外的计算机可执行指令,所述另外的计算机可执行指令使得所述计算机:从另一计算设备接收对所述内容项的请求;传送所请求的内容项;以及将与所述内容项的所预测的子部分相关联的所述信息传送到发起对所述内容项的所述请求的所述计算设备,其中所产生的内容项包括包含新文章的网站。
R:一种具有被储存在其上的计算机可执行指令的计算机可读存储介质,所述计算机可执行指令在由计算机执行时使得所述计算机:接收与由源系统产生的内容项相关联的信息,所述内容项能被其他所述计算设备经由网络访问;接收与所述内容项相关联的评论,所述评论由所述其他计算设备中的一个产生;响应于接收所述信息和所述评论,至少基于与所述内容项和所述评论相关联的细节来预测要链接到所接收到的评论的所述内容项的子部分;以及使得与所述内容项的所预测的子部分相关联的信息对请求访问所述内容项的其他计算设备可用。
S:如条款R所述的计算机可读存储介质,所述预测包括:标识所述评论和所述相关联的内容项的每个句子的对;比较所标识的对;以及至少基于所标识的对的比较来预测要与所述评论链接的所述内容项的所述句子,其中比较所标识的对包括:标识每个对的所述评论和所述句子的词汇级特征;标识每个对的所述评论和所述句子的实体级特征;标识每个对的所述评论和所述句子的主题向量;至少基于所标识的词汇级特征、实体级特征和主题向量来创建特征向量;以及比较所创建的特征向量。
T如条款R-S所述的计算机可读存储介质,还包括计算机可执行指令,所述计算机可执行指令使得所述计算机:从另一计算设备接收对所述内容项的请求;传送所请求的内容项;以及将与所述内容项的所预测的子部分相关联的所述信息传送到发起对所述内容项的所述请求的所述计算设备,其中所产生的内容项包括包含新文章的网站。
结语
虽然已经用对结构特征和/或方法动作专用的语言描述了各项技术,但是应该理解,所附权利要求不必限于所述的特征或动作。相反,这些特征和动作是作为实现这些技术的示例形式而描述的。
示例过程的操作在单独的框中示出,并且参考这些框来概括。这些过程被示为逻辑框流,其每个框可表示可用硬件、软件或其组合实现的一个或多个操作。在软件的上下文中,这些操作表示储存在一个或多个计算机可读介质上的计算机可执行指令,这些指令在由一个或多个处理器执行时使得一个或多个处理器执行既定操作。一般而言,计算机可执行指令包括执行特定功能或实现特定抽象数据类型的例程、程序、对象、模块、组件、数据结构等。描述操作的次序并不旨在解释为限制,并且任何数量的所述操作可以按任何次序执行、按任何次序进行组合、细分成多个子操作、和/或并行执行,以实现所描述的过程。可由与一个或多个计算设备102相关联的资源(诸如一个或多个内部或外部CPU或GPU)和/或硬件逻辑的一个或多个片段(诸如FPGA、DSP或其他类型的加速器)来执行所描述的过程。
上述所有方法和过程可以用由一个或多个通用计算机或处理器执行的软件代码模块来具体化,并且可经由这些软件代码模块来完全自动化。这些代码模块可以储存在任何类型的计算机可执行存储介质或其他计算机存储设备中。这些方法中的某些或全部可替代地用专用计算机硬件来具体化。
本文所述和/或附图中描述的流程图中任何例行描述、元素或框应理解成潜在地表示包括用于实现该例程中具体逻辑功能或元素的一个或多个可执行指令的代码的模块、片段或部分。替代实现被包括在本文描述的示例的范围内,其中各元素或功能可被删除,或与所示出或讨论的顺序不一致地执行,包括基本上同步地执行或按相反顺序执行,这取决于所涉及的功能,如本领域技术人也将理解的。所有这样的修改和变型本文旨在被包括在本公开的范围内并且由所附权利要求书保护。

Claims (19)

1.一种计算机实现的方法,包括:
在计算设备处接收与由源系统产生的内容项相关联的信息,所述内容项能被其他所述计算设备经由网络访问;
在所述计算设备处接收与所述内容项相关联的评论,所述评论由所述其他计算设备中的一个产生;
响应于接收所述信息和所述评论,在所述计算设备处至少基于与所述内容项和所述评论相关联的细节来预测要链接到所接收到的评论的所述内容项的子部分;以及
使得与所述内容项的所预测的子部分相关联的信息对请求访问所述内容项的其他计算设备可用;
其中预测包括:
标识所述评论和相关联的内容项的每个句子的对;
比较所标识的对;以及
通过至少基于所标识的对的比较确定所述对是否是最佳匹配来预测要与所述评论链接的所述内容项的所述句子。
2.如权利要求1所述的计算机实现的方法,其特征在于,其中比较所标识的对包括:
标识每个对的所述评论和所述句子的词汇级特征;
标识每个对的所述评论和所述句子的实体级特征;
标识每个对的所述评论和所述句子的主题向量;
至少基于所标识的词汇级特征、实体级特征和主题向量来创建特征向量;以及
比较所创建的特征向量。
3.如权利要求2所述的计算机实现的方法,其特征在于,其中比较所创建的特征向量包括:
使用基于来自多个不同来源的内容项的评论和句子的样本集合训练的分类器来分析所创建的特征向量。
4.如权利要求3所述的计算机实现的方法,其特征在于,其中所述分类器包括:
与来自多个不同来源的内容项的评论和句子的所述样本集合相关联地从下面创建的多个特征向量:
每个对的所述评论和所述句子的词汇级特征;
每个对的所述评论和所述句子的实体级特征;
每个对的所述评论和所述句子的主题向量;以及
至少基于所标识的词汇级特征的特征向量,
其中所述分类器的所述多个特征向量中的每一个包括基于被手动指派的链接值信息的权重值。
5.如权利要求4所述的计算机实现的方法,其特征在于,还包括使用支持向量机来生成所述分类器。
6.如权利要求1所述的计算机实现的方法,其特征在于,其中与所述内容项相关联的所述信息包括关于在接收所述评论期间所述内容项的什么部分被呈现的信息。
7.如权利要求1所述的计算机实现的方法,其特征在于,还包括:
从另一计算设备接收对所述内容项的请求;以及
将至少与所述内容项的所预测的子部分相关联的所述信息传送到发起对所述内容项的所述请求的所述计算设备。
8.如权利要求1所述的计算机实现的方法,其特征在于,还包括:
从另一计算设备接收对所述内容项的请求;
传送所请求的内容项;以及
将与所述内容项的所预测的子部分相关联的所述信息传送到发起对所述内容项的所述请求的所述计算设备。
9.如权利要求8所述的计算机实现的方法,其特征在于,其中所产生的内容项包括包含新文章的网站。
10.一种计算设备,包括:
处理器;
显示设备;以及
与所述处理器进行通信的计算机可读存储介质,所述计算机可读存储介质具有被储存在其上的计算机可执行指令,所述计算机可执行指令在被所述处理器执行时使得所述计算设备:
接收与由源系统产生的内容项相关联的信息,所述内容项能被其他所述计算设备经由网络访问;
接收与所述内容项相关联的评论,所述评论由所述其他计算设备中的一个产生;
响应于接收所述信息和所述评论,至少基于与所述内容项和所述评论相关联的细节来预测要链接到所接收到的评论的所述内容项的子部分;以及
使得与所述内容项的所预测的子部分相关联的信息对请求访问所述内容项的其他计算设备可用;
其中预测包括:
标识所述评论和所述相关联的内容项的每个句子的对;
比较所标识的对;以及
通过至少基于所标识的对的比较确定所述对是否是最佳匹配来预测要与所述评论链接的所述内容项的所述句子。
11.如权利要求10所述的计算设备,其特征在于,比较所标识的对包括:
标识每个对的所述评论和所述句子的词汇级特征;
标识每个对的所述评论和所述句子的实体级特征;
标识每个对的所述评论和所述句子的主题向量;
至少基于所标识的词汇级特征、实体级特征和主题向量来创建特征向量;以及
比较所创建的特征向量。
12.如权利要求11所述的计算设备,其特征在于,其中比较所创建的特征向量包括:
使用基于来自多个不同来源的内容项的评论和句子的样本集合训练的分类器来分析所创建的特征向量。
13.如权利要求12所述的计算设备,其特征在于,其中所述分类器包括:
与来自多个不同来源的内容项的评论和句子的所述样本集合相关联的从下面创建的多个特征向量:
每个对的所述评论和所述句子的词汇级特征;
每个对的所述评论和所述句子的实体级特征;
每个对的所述评论和所述句子的主题向量;以及
至少基于所标识的词汇级特征的特征向量,
其中所述分类器的所述多个特征向量中的每一个包括基于被手动指派的链接值信息的权重值。
14.如权利要求13所述的计算设备,其特征在于,其中与所述内容项相关联的所述信息包括关于在接收所述评论期间所述内容项的什么部分被呈现的信息。
15.如权利要求10所述的计算设备,其特征在于,其中所述计算机可读存储介质具有被储存在其上的另外的计算机可执行指令,所述另外的计算机可执行指令使得所述计算设备:
从另一计算设备接收对所述内容项的请求;
传送所请求的内容项;以及
将与所述内容项的所预测的子部分相关联的所述信息传送到发起对所述内容项的所述请求的所述计算设备,
其中所产生的内容项包括包含新文章的网站。
16.一种具有被储存在其上的计算机可执行指令的计算机可读存储介质,所述计算机可执行指令在由计算机执行时使得计算设备:
接收与由源系统产生的内容项相关联的信息,所述内容项能被其他所述计算设备经由网络访问;
接收与所述内容项相关联的评论,所述评论由所述其他计算设备中的一个产生;
响应于接收所述信息和所述评论,至少基于与所述内容项和所述评论相关联的细节来预测要链接到所接收到的评论的所述内容项的子部分;以及
使得与所述内容项的所预测的子部分相关联的信息对请求访问所述内容项的其他计算设备可用;
其中预测包括:
标识所述评论和所述相关联的内容项的每个句子的对;
比较所标识的对;以及
通过至少基于所标识的对的比较确定所述对是否是最佳匹配来预测要与所述评论链接的所述内容项的所述句子,
其中比较所标识的对包括:
标识每个对的所述评论和所述句子的词汇级特征;
标识每个对的所述评论和所述句子的实体级特征;
标识每个对的所述评论和所述句子的主题向量;
至少基于所标识的词汇级特征、实体级特征和主题向量来创建特征向量;以及
比较所创建的特征向量。
17.如权利要求16所述的计算机可读存储介质,其特征在于,还包括计算机可执行指令,所述计算机可执行指令使得所述计算设备:
从另一计算设备接收对所述内容项的请求;
传送所请求的内容项;以及
将与所述内容项的所预测的子部分相关联的所述信息传送到发起对所述内容项的所述请求的所述计算设备,
其中所产生的内容项包括包含新文章的网站。
18.一种具有指令的计算机可读存储介质,当所述指令被执行时使得机器执行如权利要求1、3-8中任一权利要求所述的方法。
19.一种计算机系统,包括用于执行如权利要求1-9中任一权利要求所述的方法的装置。
CN201580082049.9A 2015-05-29 2015-05-29 用于提供以评论为中心的新闻阅读器的系统和方法 Active CN107924398B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2015/080223 WO2016191913A1 (en) 2015-05-29 2015-05-29 Systems and methods for providing a comment-centered news reader

Publications (2)

Publication Number Publication Date
CN107924398A CN107924398A (zh) 2018-04-17
CN107924398B true CN107924398B (zh) 2022-04-29

Family

ID=57439860

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580082049.9A Active CN107924398B (zh) 2015-05-29 2015-05-29 用于提供以评论为中心的新闻阅读器的系统和方法

Country Status (4)

Country Link
US (2) US11516159B2 (zh)
EP (1) EP3304343A4 (zh)
CN (1) CN107924398B (zh)
WO (1) WO2016191913A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3304343A4 (en) 2015-05-29 2019-02-20 Microsoft Technology Licensing, LLC SYSTEMS AND METHOD FOR PROVIDING A COMMENTARY MESSAGE READER
EP3304342A4 (en) 2015-05-29 2019-01-16 Microsoft Technology Licensing, LLC COMMENTARY MESSAGE READER
CN106649345A (zh) 2015-10-30 2017-05-10 微软技术许可有限责任公司 用于新闻的自动会话创建器
US11210328B2 (en) * 2016-12-29 2021-12-28 Ncsoft Corporation Apparatus and method for learning narrative of document, and apparatus and method for generating narrative of document
CN112955893B (zh) * 2018-10-30 2024-08-02 谷歌有限责任公司 文档的自动超链接
CN112579730A (zh) * 2019-09-11 2021-03-30 慧科讯业有限公司 高扩展性、多标签的文本分类方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462363A (zh) * 2014-12-08 2015-03-25 百度在线网络技术(北京)有限公司 评论点的展现方法和装置

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005050472A2 (en) 2003-11-21 2005-06-02 Philips Intellectual Property & Standards Gmbh Text segmentation and topic annotation for document structuring
US20070118794A1 (en) 2004-09-08 2007-05-24 Josef Hollander Shared annotation system and method
WO2008031625A2 (en) 2006-09-15 2008-03-20 Exbiblio B.V. Capture and display of annotations in paper and electronic documents
US8819719B1 (en) 2006-12-06 2014-08-26 Google Inc. Real-time video commenting
US8806320B1 (en) 2008-07-28 2014-08-12 Cut2It, Inc. System and method for dynamic and automatic synchronization and manipulation of real-time and on-line streaming media
US9176943B2 (en) * 2008-05-12 2015-11-03 Adobe Systems Incorporated Comment presentation in electronic documents
US8346534B2 (en) 2008-11-06 2013-01-01 University of North Texas System Method, system and apparatus for automatic keyword extraction
US8373741B2 (en) * 2009-11-20 2013-02-12 At&T Intellectual Property I, Lp Apparatus and method for collaborative network in an enterprise setting
CN102163187B (zh) * 2010-02-21 2014-11-26 国际商业机器公司 文档标记方法和装置
WO2012027262A1 (en) 2010-08-23 2012-03-01 Google Inc. Parallel document mining
KR20120099836A (ko) 2011-03-02 2012-09-12 삼성전자주식회사 이동통신 단말기에서 댓글을 공유하기 위한 장치 및 방법
KR101111031B1 (ko) 2011-04-13 2012-02-13 장진혁 피디에프 문서 기반의 이북용 멀티미디어 재생 시스템 및 그 재생 방법
US9268857B2 (en) 2011-06-03 2016-02-23 Facebook, Inc. Suggesting search results to users before receiving any search query from the users
US9112623B2 (en) * 2011-06-06 2015-08-18 Comcast Cable Communications, Llc Asynchronous interaction at specific points in content
US8972413B2 (en) 2011-06-22 2015-03-03 Rogers Communications Inc. System and method for matching comment data to text data
US20130073545A1 (en) 2011-09-15 2013-03-21 Yahoo! Inc. Method and system for providing recommended content for user generated content on an article
US9141595B2 (en) 2011-10-05 2015-09-22 Adobe Systems Incorporated Contextual commenting on the web
CN103051513B (zh) 2011-10-11 2015-10-07 深圳市快播科技有限公司 一种消息实时交互方法及系统
US9116596B2 (en) 2012-06-10 2015-08-25 Apple Inc. Sharing images and comments across different devices
US8869046B2 (en) * 2012-07-03 2014-10-21 Wendell Brown System and method for online rating of electronic content
US20140052540A1 (en) * 2012-08-20 2014-02-20 Giridhar Rajaram Providing content using inferred topics extracted from communications in a social networking system
CN103581280B (zh) 2012-08-30 2017-02-15 网易传媒科技(北京)有限公司 一种基于微博平台的界面交互方法和设备
US20140094241A1 (en) 2012-09-28 2014-04-03 Wms Gaming Inc. Wagering game with progressive jackpot award driven by social communications
CN103853761B (zh) 2012-12-03 2016-05-25 腾讯科技(深圳)有限公司 网页内容的评论显示、添加方法及装置
US9935910B2 (en) 2012-12-21 2018-04-03 Google Llc Recipient location aware notifications in response to related posts
US9817556B2 (en) * 2012-12-26 2017-11-14 Roovy, Inc. Federated commenting for digital content
US9386107B1 (en) 2013-03-06 2016-07-05 Blab, Inc. Analyzing distributed group discussions
US9152675B2 (en) 2013-03-15 2015-10-06 Facebook, Inc. Selection and ranking of comments for presentation to social networking system users
US20140298201A1 (en) 2013-04-01 2014-10-02 Htc Corporation Method for performing merging control of feeds on at least one social network, and associated apparatus and associated computer program product
US20150026192A1 (en) 2013-04-19 2015-01-22 salesforce.com,inc. Systems and methods for topic filter recommendation for online social environments
US9509758B2 (en) 2013-05-17 2016-11-29 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Relevant commentary for media content
CN103412920B (zh) 2013-08-09 2018-11-30 宇龙计算机通信科技(深圳)有限公司 终端、服务器和信息显示方法
US20150106304A1 (en) 2013-10-15 2015-04-16 Adobe Systems Incorporated Identifying Purchase Intent in Social Posts
US9292597B2 (en) 2013-10-24 2016-03-22 International Business Machines Corporation Smart question routing and answerer growing for online community question-answer services
US20150120840A1 (en) * 2013-10-29 2015-04-30 International Business Machines Corporation Resource referencing in a collaboration application system and method
US9299028B2 (en) 2013-11-04 2016-03-29 Adobe Systems Incorporated Identifying suggestive intent in social posts
JP6122768B2 (ja) 2013-11-19 2017-04-26 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置、表示方法およびコンピュータプログラム
US9767439B2 (en) 2013-11-25 2017-09-19 Yahoo Holdings Inc. Automatic draft email notification
US20160171111A1 (en) 2014-12-16 2016-06-16 Yahoo! Inc. Method and system to detect use cases in documents for providing structured text objects
CN104571818B (zh) 2014-12-26 2018-12-28 网易(杭州)网络有限公司 一种显示文章评论的方法及装置
CN104504131A (zh) * 2014-12-31 2015-04-08 广州爱书旗信息技术有限公司 基于划线实现用户评论的方法、装置、终端设备及系统
US20160246769A1 (en) 2015-02-19 2016-08-25 Christian Screen System and method for user collaboration in a business intelligence software tool
US20160269345A1 (en) 2015-03-02 2016-09-15 Mordechai Weizman Systems and Method for Reducing Biases and Clutter When Ranking User Content and Ideas
CN104820704A (zh) 2015-05-12 2015-08-05 东南大学 一种网络文本的行内标注式评论的新建方法及其浏览方法
EP3304343A4 (en) 2015-05-29 2019-02-20 Microsoft Technology Licensing, LLC SYSTEMS AND METHOD FOR PROVIDING A COMMENTARY MESSAGE READER
EP3304342A4 (en) 2015-05-29 2019-01-16 Microsoft Technology Licensing, LLC COMMENTARY MESSAGE READER
CN106649345A (zh) 2015-10-30 2017-05-10 微软技术许可有限责任公司 用于新闻的自动会话创建器

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462363A (zh) * 2014-12-08 2015-03-25 百度在线网络技术(北京)有限公司 评论点的展现方法和装置

Also Published As

Publication number Publication date
EP3304343A1 (en) 2018-04-11
US11516159B2 (en) 2022-11-29
US20230076387A1 (en) 2023-03-09
US20180159804A1 (en) 2018-06-07
EP3304343A4 (en) 2019-02-20
CN107924398A (zh) 2018-04-17
WO2016191913A1 (en) 2016-12-08

Similar Documents

Publication Publication Date Title
US10891322B2 (en) Automatic conversation creator for news
US11645314B2 (en) Interactive information retrieval using knowledge graphs
US9923860B2 (en) Annotating content with contextually relevant comments
US10089299B2 (en) Multi-media context language processing
CN107924398B (zh) 用于提供以评论为中心的新闻阅读器的系统和方法
JP7301922B2 (ja) 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム
WO2019037258A1 (zh) 信息推荐的装置、方法、系统及计算机可读存储介质
US20200134398A1 (en) Determining intent from multimodal content embedded in a common geometric space
US10108698B2 (en) Common data repository for improving transactional efficiencies of user interactions with a computing device
US20120056901A1 (en) System and method for adaptive content summarization
US11573995B2 (en) Analyzing the tone of textual data
TW201519075A (zh) 文字範圍的智慧選擇
CN106663123B (zh) 以评论为中心的新闻阅读器
US11010687B2 (en) Detecting abusive language using character N-gram features
CN107861948B (zh) 一种标签提取方法、装置、设备和介质
CN116796730A (zh) 基于人工智能的文本纠错方法、装置、设备及存储介质
US20190080354A1 (en) Location prediction based on tag data
WO2010132062A1 (en) System and methods for sentiment analysis
US9946762B2 (en) Building a domain knowledge and term identity using crowd sourcing
CN110147488B (zh) 页面内容的处理方法、处理装置、计算设备及存储介质
US11520839B2 (en) User based network document modification
CN111191025B (zh) 文章相关性的确定方法、装置、可读介质及电子设备
CN115392389A (zh) 跨模态信息匹配、处理方法、装置、电子设备及存储介质
Deli Opinion Mining by Generating the Summaries of Users’ Reviews

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant