CN104462173A - 用于改善社交媒体数据的方法和系统 - Google Patents

用于改善社交媒体数据的方法和系统 Download PDF

Info

Publication number
CN104462173A
CN104462173A CN201410474908.6A CN201410474908A CN104462173A CN 104462173 A CN104462173 A CN 104462173A CN 201410474908 A CN201410474908 A CN 201410474908A CN 104462173 A CN104462173 A CN 104462173A
Authority
CN
China
Prior art keywords
data
user
computer
preference
social media
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410474908.6A
Other languages
English (en)
Other versions
CN104462173B (zh
Inventor
S.M.M.M.阿里
O.A.D.A.艾拉巴蒂
H.E.埃尔施什尼
S.萨布里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN104462173A publication Critical patent/CN104462173A/zh
Application granted granted Critical
Publication of CN104462173B publication Critical patent/CN104462173B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/214Monitoring or handling of messages using selective forwarding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Multimedia (AREA)

Abstract

本发明涉及一种用于来自个社交网络供给的社交媒体数据的呈现的方法。该方法包括聚集从所述多个社交网络供给接收的社交媒体内容。该方法还包括通过从所接收的聚集社交媒体内容中消除重复数据来生成过滤数据。该方法还包括分析所述过滤数据用于确定至少一个数据类别以及基于所确定的至少一个数据类别呈现所述社交媒体内容的摘要。

Description

用于改善社交媒体数据的方法和系统
技术领域
本发明总体涉及一种使用通讯网络上的计算机的社交网络领域,并且尤其涉及改善所传送内容的质量、相关性和形式以及其对传送带宽的影响。
背景技术
社交网络服务是一种在线服务、平台或网站,其聚焦于促进在例如具有共同兴趣、活动、背景或实际生活连接的人们之间构建社交网络或社交关系。社交网络服务由每个用户的表征,即简档,用户的社交连接以及各种附加服务构成。大多社交网络服务是基于网络的,并且为用户提供在英特网上及性交互的手段,诸如电子邮件以及即时消息发送。社交网络网站容许用户在他们各自的网络中分享观点、活动、时间以及兴趣。
社交媒体主要依赖于用户驱动的内容,这是社交网络的定义特征。因此,大量的数据每天流过这些社交网络频道。不过,用户接收到的相关内容可能会被掩埋在低质量信息中。例如,用户会接收到用户不愿意接收到的大量内容。因此,用户可以快速发现其自身被他们不能控制的无关的庞大内容所淹没。这对于正试图限制他们经由智能电话的数据使用成本的移动网络用户尤其存在问题。
发明内容
提供了一种改善来自多个社交网络供给的社交媒体数据的方法,该方法包括聚集从所述多个社交网络供给接收的社交媒体内容。该方法还包括通过从所接收的聚集社交媒体内容中消除重复数据来生成过滤数据。该方法还包括分析所述过滤数据用于确定至少一个数据类别以及基于所确定的至少一个数据类别呈现所述社交媒体内容的摘要。
提供了一种用于改善来自多个社交网络供给的社交媒体数据的计算机系统,该计算机系统包括聚集从所述多个社交网络供给接收的社交媒体内容。该计算机系统还包括通过从所接收的聚集社交媒体内容中消除重复数据来生成过滤数据。该计算机系统还包括分析所述过滤数据用于确定至少一个数据类别以及基于所确定的至少一个数据类别呈现所述社交媒体内容的摘要。
提供了一种用于改善来自多个社交网络供给的社交媒体数据的计算机程序产品,该计算机程序产品可包括聚集从所述多个社交网络供给接收的社交媒体内容。该计算机程序产品还包括通过从所接收的聚集社交媒体内容中消除重复数据来生成过滤数据。该计算机程序产品还包括分析所述过滤数据用于确定至少一个数据类别以及基于所确定的至少一个数据类别呈现所述社交媒体内容的摘要。
附图说明
根据将要结合下面的附图阅读的示例实施例的详细描述将清楚本发明的这些以及其他目标、特征以及优点。该附图的特种特征并不是按照所示的比例显示,因为所示的内容是为了便于本领域技术人员结合详细描述清楚理解本发明。在这些附图中:
图1图释了根据一个实施例的网络计算机环境;
图2图释了具有用于改善被传送给用户的信息内容以及改善对这些内容的传送带宽的影响的实例程序的网络计算机环境;
图3是操作流程图,图释了由程序执行以改善传送给用户的信息内容以及改善对这些内容的传送带宽的影响的步骤;以及
图4是图1所示的计算机和服务器的内外组件的框图。
具体实施方式
在此披露了所要求保护的构造和方法的详细实施例,不过,可以理解到,所披露的实施例仅仅是所要求保护的构造和方法的示例,其可以以各种形式来实施。不过,本发明可以以多种不同形式实施并且不应该被认为限于此处给出的示例实施例。相反,提供这些示例实施例是为了使得本公开能够完全和完整地以及完整地将本发明的范围传递给本领域的技术人员。在本说明书中,公知的特征和技术的细节将被省略以避免不必要地使得所给出的实施例被模糊。
本发明的实施例总体设计在通信网络上使用计算机进行社交网络联系的领域,并且尤其涉及改善传送给用户的内容以及对传送带宽的影响。下面描述的示例实施例提供了一种用于改善传送给用户的内容的质量、相关性和形式以及对传送带宽的影响的系统、方法和程序产品。
如上所述,社交媒体主要依赖于用户驱动的内容,并且因此每天有大量的数据流过这些社交网络信道。不过,由于内容结构变得更差,因此相关内容可能掩埋在低质量信息中,并且用户可能可快发现自身被他们不能控制的无关的判断内容所淹没。这对于正试图限制他们经由智能电话的数据使用成本的移动网络用户尤其存在问题。
当前,有多种技术途径来解决这些问题。有些方案聚焦于对来自诸如数据库的多个数据源或来自社交网络的供给进行抽取、聚集、清除以及可视化。例如,数据质量问题当前通过数据清除得到解决。可以使用一些技术使得用户改善数据指令并且处理数据被错误呈现(例如,拼写错误)、冗余或具有不同呈现的情况。正被利用的其他现有技术包括使用语义网技术来分析社交网络和从焦点集中于诸如信任和名义的主题的现有数据抽取知识。
不过,对于这些现有技术方法,用户对传送给用户的数据表证没有控制。此外,也没有考虑用户数据使用限制方面的变化。而且主题标识和内容过滤是动态地基于用户的当前时线(timeline)和位置的。
根据本发明的至少一个实施例,数据从不同社交网络聚集并以在控制和减少在移动网络上的数据使用的同时减少混乱和改善内容质量的方式被处理。
所属技术领域的技术人员知道,本发明的各个方面可以实现为系统、方法或计算机程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如(Java以及所有基于Java的商标及标识都是Oracle公司和/或其关联公司的商标或注册商标。)、Smalltalk、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
下面将参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。
也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机、其它可编程数据处理装置、或其他设备以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品(article of manufacture)。
计算机程序还也可以被加载到计算机、其他可编程数据处理装置或其他设备以便使得一系列可操作步骤在计算机、其他可编程数据处理装置或其他设备上执行,以便产生计算机实现的处理,使得在计算机、其他可编程数据处理装置或其他设备上执行的指令提供用于实现在流程图和/或框图框或块中所说明的功能/动作的处理。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
下面描述的示例实施例提供了一种用于改善传送给用户的内容的质量、相关性和形式以及对传送带宽的影响的系统、方法和程序产品
根据本发明的至少一个实施例,可以利用用户简档和偏好资料库。所述资料库可以包含用户可以跟踪的所有用户社交媒体帐户、以优先方式排列的用户兴趣列表以及关于内容的传送方法的用户偏好(即尺寸限制或优选格式)。此外,本发明的至少一个实施例可以提供可在“运行时间”处以及基于不同社交网络上的时间轴的当前快照而执行的另一个过滤阶段,所过滤的内容被分类并呈现给用户,使得用户可以选择所期望的主题,并且用户希望进行咨询(consult)。
本发明的实施例可以包括以下主要组件:偏好资料数据库、实体资料数据库、代理机以及摘。所述偏好资料数据库可以由与将被传送的内容的质量和呈现相关的用户偏好组成。所述实体资料数据库可以存储聚集有所有其可能的表证的实体名称(即,人员、位置、事情或事件)、同义词以及所有链接到单一实体ID(即,用户标识)的已知名称。
代理机可以截取从不同网络供应商传送给用户的内容,处理该内容并基于用户的偏好将修改后内容发送给终端用户智能电话或计算机。该内容可以以关于用户偏好的摘要形式呈现给用户并且按照主题被分类。
本发明的实施例可以使得用户控制用户希望应用在所接收的内容上的过滤器,以便减少数据的使用而不是对媒体的尺寸或类型施加具体约束(如现在所使用的方法中那样)。此外,本发明的实施例可以分两个阶段过滤机制来实现,其说明了与在偏好资料库中所设置的媒体类型和尺寸相关的总体偏好指南和在请求服务时可获得的具体主题或事件。
参见图1,描述了更具实施例的示例网络计算机环境100。网络连接的计算机环境100可包括计算机102,其具有处理器104和数据存储器件106并且可被启动来运行软件程序108。网络连接的计算机环境100还可以包括社交网络112、服务器114以及通讯网络110。网络连接的计算机环境100可以包括多个计算机102和服务器114,其中仅仅显示了一个。通讯网络可以包括各种类型通讯网络,诸如广域网(WAN)、局域网(LAN)、电信网络、无线网络、公用交换网络和/或卫星网络。应该理解的是,图1仅仅提供了一种实现方式的图例,并且并不意味着对其中可以实现不同实施例的环境的任何限制。可以基于设计和实施要求而做出对所示环境的多种修改。
客户计算机102可以经由通讯网络110与运行在服务器计算机114上的社交网络112进行通信。通讯网络110可以包括诸如有线、无线、通信链接、光纤电缆的连接。如将参照图4所讨论的,服务器114可以分别包括内部组件800a和外部组件900a,客户计算机102可以分别包括内部组件880b和外部组件900b。客户计算机102例如可以是移动设备、电话、个人数字助理、上网本(netbook)、膝上计算机、平板计算机、台式机、或能够访问社交网络的任何类型的计算机设备。
如前所述,客户计算机102可以经由通讯网络110访问运行在服务器计算机114上的社交网络112,例如,使用运行在客户计算机102上的应用程序108(例如,)(Firefox和所有基于Firefox的商标和标志都是Mozzilla和/或其分支机构的商标或注册商标)的用户可以经由通讯网络110连接到可能在服务器计算机114上运行的他们的社交网络帐户112之一。
现在参见图2,其描述了根据一个实施例的网络连接的计算机环境,其具有示例代理机210和偏好程序212,用于改善被传送到用户的信息内容以及改善对这种内容的传送带宽的影响。偏好程序212可以在服务器202、计算机102B或终端用户移动设备206B上运行时被实现。不过。仅仅作为举例来说,偏好程序212描绘为运行在服务器202上。客户计算机102A以及终端移动设备206A可以经由通讯网络110与可能运行在服务器计算机114上的社交网络112通信。根据至少一个实施例的前摄地改善被传送给计算机102B上的用户的信息内容以及改善对该内容的传送带宽的影响可以实现为在与运行在服务器114上的社交网络112相互作用的服务器202上运行的偏好程序212和代理机210。在服务器202上运行的代理机210也可以与实体资料数据库208和偏好资料数据库202相互作用。
偏好程序212可以是在终端用户移动设备206B或计算机102B上改善传送给用户的内容以及改善对来自诸如(Twitter和所有基于Twitter的商标和标志都是Twitter和/或其分支机构的商标或注册商标)或(Facebook和所有基于Facebook的商标和标志都是Facebook和/或其分支机构的商标或注册商标)的社交网络112的这种内容的传送带宽的影响的计算机程序。代理机210可以从计算机102A接收用户请求,从在社交网络112的不同社交媒体服务提供商收集数据以及在将内容发送给在其终端用户移动设备206B或其计算机102B上的用户之前偏好程序212可以对所接收到的供给执行一系列步骤(这将在下面参照图3进行详细解释)。
偏好资料数据库204可以存储代理机210服务的订阅者的用户简档并保持其社交媒体(例如Facebook、Twitter等)订阅以及其偏好。偏好资料数据库204可以在以摘要呈现时提供过滤器配置,其可以是基于上下文或状态的主题过滤。兴趣偏好可以作为标签输入并且作为实体ID(即,用户标识)存储到位于偏好资料数据库204的底层存储器。此外,可以存储传送偏好。传送偏好可以是与传送格式相关的偏好,诸如容许的最大带宽消耗、优选数据格式(即,文本、图像以及视频)。而且,实体资料数据库208可以存储聚集有所有其可能表证、同义词以及所有链接到单一实体ID(即,用户标识)的已知名称的实体名称。
根据至少一个实施例,用户可以登录到偏好资料数据库204(图2),以便建立和维护用户简档(即,与社交媒体数据相关联的一组用户定义的偏好)。一旦设置用户简档,偏好就可以被推送到代理机210用于未来的内容过滤。当用户需要访问该服务是,可以向代理机210发出服务请求(图2)。然后代理机210(图2)可以连接到用于社交网络112(图1)的服务提供商,用户订阅社交网络112(图1)并且原始内容可以从与用户相关联的不同社交网络提供商112(图1)被提供给代理机210(图2)。接着,代理机210(图2)可以处理根据所有源合并的内容并给予用户偏好对其进行过滤,并且可以将内容作为按照主题被分类的摘要呈现在终端用户的移动设备206B(图2)或计算机102B(图2)上。
现在参见图3,描述了一个操作流程图,其图释由偏好程序212(图2)执行来改善传送给用户的信息内容以及改善对这种内容的传送带宽的影响的步骤。如之前所述,该方法可以通过利用偏好资料库204(图2)、实体资料数据库208(图2)、代理机210(图2)以及摘要来实现。好资料库204(图2)可以由与将被传送的内容的指令和呈现相关的所述用户定义的偏好构成。代理机210(图2)可以截取将从不同社交网络提供商传送到用户的内容、处理所截取的内容以及基于用户的偏好将修改后的内容发送到终端用户智能电话206B(图2)或计算机102B(图2)。所述内容以与用户偏好相关并且按照主题分类的摘要的形式呈现给用户。
在步骤302处,内容被聚集(即,供给(feed)被合并)。例如,从不同社交网络112(图1)来的不同供给被合并到一个时间轴并且社交网凭证(credential)保持为偏好资料数据库204(图2)中的用户简档的部分。
接着,在步骤304处,内容被过滤(即,净化数据)并且分析这些条目(entry)仪表消除(即,合并或删除)重复数据。一种实施方式可以检测和移除抽取匹配(extract match)(即,指向相同链接和具有相同文件签名的数据)。另一种实施方式可以检测相似供给并利用包含有一些条目的所有品那些变化形式或已知名称的元数据库(即,实体资料数据库208(图2))将它们聚集在单一条目中,其中所有不同单一条目记载(mention)都被唯一ID(即,用户标识)所替代。随后,基于该ID,冗余供给和在相同事件下的供给多是被识别。所识别的相同事件ID可以作为元数据附于该供给。另一个实施方式可以是重复来自网络中的不同源或来自不同供给源的供给被扩大(augment)使得该供给内容自身被保持完整而关于源的信息,诸如ID、地理-标签以及时间戳,可以被附为元数据。
下面,在步骤306处,分析内容(即,数据分类)。例如,可以通过分析供给内的图案(pattern)为两个主要类型来推演所述归类。一种类型可以永久类别(诸如,运动、文化等等),其可以通过相关的分类关键词或用户标识(即,ID)、时间戳以及地理-标签来识别。该永久类别可以是用户希望大约基于永久基础接收信息的类别。永久类别可以保持为用户定义的偏好,直到该用户改变永久类别为止。另一种类型是临时类别,其代表一种时间,诸如现场运动事件,由元数据信息(即,相同用户标识(即,ID)、时间戳以及在较窄的间隔内的地理-标签)识别。关于所述临时类别,可能是在两个条目之间的链接,其仅仅在一定时间量之内有效。例如,可能是在参与一项运动比赛的两个队之间的连接。一旦比赛(即,现场运动事件)结束,则该连接不再有效。
此外,在紧数据约束情况下,使用数据漫游或缓慢连接,本发明的一个实施方式可以使得用户可以请求接收来自临时类别的单一实例(即,在该类别中的最频繁的一个)。该例子可以是在足球比赛中射门得分的守门员的现场画面。根据本发明的一个实施方式,如果用户具有紧数据限制,则用户可以请求接收时间的单一实例。就所述足球例子而言,用户可能希望接收描述在现场足球比赛中射门得分的守门员的一幅画面。因此,画面的名称的地理-标签(即,地理位置标签)、ID(即,用户标识)以及时间戳(即,所选取的画面的时间)可以考虑在内。就足球例子而言,体育场的位置的地理-标签、描述该画面的类似名称的ID(例如,球队名称)以及显示画面被选取的几乎相同时间的时间戳可能在确定相同事件(即,包含相同上下文)的多个实例时被考虑在内。因此,在足球比赛期间用户可以接收特定时间的一幅画面而不是接收相同画面的多个实例。而且,在一定类别下到来的供给的数量可以被分析以便有助于趋势检测。例如,如果大量的供给与诸如烹饪的一定类别相关联,那么这可能有助于确定是否正产生一种就某一特定类别而言的趋势。
在步骤308处,基于数据尺寸、数据类型以及数据类别(即,应用数据呈现偏好),经由终端用户的移动设备206B(图2)或计算机102B将摘要呈现给用户。根据本发明的一个实施方式,数据尺寸偏好存储在偏好资料库204(图2)中。这作为基于用户偏好对内容执行的过滤的第一阶段。数据尺寸偏好可以定义数据将如何依赖于其带宽或连接速度被呈现给用户。一种实施方式可以是在用户的数据计划具有使用数据漫游的紧数据约束或具有缓慢连接时显示文本表征而不是图像(例如,图像替换标签或图像名称)。另一个实施方式可以用于将根据简档(即,当用户正在漫游时)将被上下文地启用或基于时间计划的数据尺寸偏好。此外,数据尺寸偏好以及数据类型偏好可以结合起来用于从时间轴上去除不感兴趣的供给。
根据本发明另一个实施例,可以创建过滤后内容的摘要并按照类别或由之前描述的组件所识别的事件将其呈现给用户。随后,基于以上所述,基于所述用户选择与用户最相关的类别而应用第二阶段过滤。
图4是根据本发明的图释实施例的图1中所示的计算机的内部和外部组件的框图。应该理解到,图4仅仅提供了一个实施方式的图示,并不意味着是对实现不同实施例的环境的任何限制。基于设计和实施要求可以对所示的环境进行多种修改。
数据处理系统800、900代表任何能够执行机器可读程序指令的电子设备。数据处理系统800、900可以代表智能电话、计算机系统、PDA或其他电子设备。可以由数据处理系统800、900代表的计算系统、环境和/或配置的例子包括,但不限于,个人计算机系统、服务器计算机系统、薄客户机、厚客户机、手持式设备或膝上设备、多处理器系统、基于微处理器的系统、网络PC、迷你计算机系统以及包括任何上述系统或设备的分布式云计算环境。
用户客户计算机102(图1)以及网络服务器114(图1)包括图4所示的各自的内部组件800a、b和外部组件900a、b的组。每组内部组件800a、b包括一个或多个处理器820、在一条或多条总线826上的一个或多个计算机可读RAM 822和一个或多个计算机可读ROM 824以及一个和多个操作系统828和一个或多个计算机可读有形存储器件830。在客户计算机102中的所述一个和多个操作系统828以及软件按程序108(图1)存储在一个或多个计算机可读有形存储器件830上用于经由一个或多个计算机可读RAM 822(其通常包括高速缓冲存储器)由一个或多个处理器820执行。在图4所示的实施例中,每个计算机可读有形存储器件830为内部硬驱的磁盘存储器件。或者,每个计算机可读有形存储器件830为为半导体存储器件,诸如,ROM 824、EPROM、闪存或能够存储计算机程序和数字信息的任何其他计算机可读有形存储器件。
每组内部组件800a、b还包括用于从诸如CD-ROM、DVD、记忆棒、磁带、磁盘、光盘或半导体存储器件的一个或多个便携式计算机可读有形存储器件936读取或向其写入内容的R/W驱动或接口832。诸如代理机210的软件程序108可以存储在一个或多个便携式计算机可读有形存储器件936上,经由R/W驱动或接口832被读取并且被加载到各个硬驱830。
每组内部组件800a、b还包括网络适配器或接口836,诸如TCP/IP适配器卡、无线Wi-Fi接口卡、或3G或4G无线接口卡或其他有线或无线通信连接。客户计算机102中的程序108和网络服务器202中的代理机210可以经由网络(例如,英特网、局域网或其他的广域网)以及相应的网络适配器或接口836从外部计算机被下载到客户计算机102。从网络适配器或接口836,客户计算机102中的程序108和网络服务器202中的代理机210被加载到相应的硬驱830。所述网络可以包括铜线、光纤、无线传输路由器、防火墙、切换器、网关计算机和/或边缘(edge)服务器。
每组外部组件900a、b包括计算机显示监视器920、键盘930、以及计算机鼠标934。外部组件900a、b还可包括触摸屏、虚拟键盘、触摸垫、指示设备以及其他人类接口设备。每组内部组件800a、b还包括设备驱动器840,其接口到计算机显示监视器920、键盘930、以及计算机鼠标934。设备驱动器840、R/W驱动或接口832以及网络适配器或接口836包括硬件和软件(存储在存储器件930和/或ROM 824)。
为了说明目的已经给出了各种本发明的实施例的描述,但是这些描述并不意图穷尽或限制所披露的实施例。本领域普通技术人员将清楚,在不脱离所描述的实施例的范围的情况下,可以有多种修改方式和变化形式,此处所使用的术语被选择用来最好地解释这些实施例的原理,优于在市场中发现的技术的实际应用或技术改进,或者用于使得本领域技术人员中的其他人员能够理解此处所披露的实施例。

Claims (16)

1.一种改善来自多个社交网络供给的社交媒体数据的方法,包括:
聚集从所述多个社交网络供给接收的社交媒体内容;
通过从所接收的聚集社交媒体内容中消除重复数据来生成过滤数据;
分析所述过滤数据用于确定至少一个数据类别;以及
基于所确定的至少一个数据类别呈现所述社交媒体内容的摘要。
2.根据权利要求1所述的方法,还包括:
生成一组用户定义的偏好,其中在分析所述过滤数据期间基于应用所述用户定义的偏好来确定所述至少一个数据类别;以及
将所述一组用户定义的偏好添加到偏好资料数据库.
3.根据权利要求2所述的方法,其中所述用户定义的偏好包括包含传送格式的传送偏好。
4.根据权利要求1所述的方法,其中所述消除重复数据包括:
从所接收的聚集社交媒体内容中合并或删除重复数据。
5.根据权利要求1所述的方法,其中所述生成所述过滤数据包括利用偏好资料数据库和实体资料数据库。
6.根据权利要求1所述的方法,其中所述至少一个数据类别包括永久类别和临时类别中至少一个并且通过包含用户标识、时间戳以及具有狭窄间隔的地理-标签的元数据来识别。
7.根据权利要求1所述的方法,其中所述摘要的呈现包括利用数据尺寸、数据类型以及数据类别中的至少一个。
8.根据权利要求6所述的方法,其中所述临时类别包括对包含传送内容和传送格式的一组用户定义的偏好的临时改变。
9.一种用于改善来自多个社交网络供给的社交媒体数据的计算机系统,包括:
一个或多个处理器、一个或多个计算机可读内存、一个或多个计算机可读有形存储器件以及存储在所述一个或多个存储器件中的至少一个上用于经由所述一个或多个计算机可读内存的至少一个由所述由所述一个或多个处理器的至少一个执行的程序指令,其中所述计算机系统能够执行一种方法,该方法包括:
聚集从所述多个社交网络供给接收的社交媒体内容;
通过从所接收的聚集社交媒体内容中消除重复数据来生成过滤数据;
分析所述过滤数据用于确定至少一个数据类别;以及
基于所确定的至少一个数据类别呈现所述社交媒体内容的摘要。
10.根据权利要求9所述的计算机系统,还包括:
生成一组用户定义的偏好,其中在分析所述过滤数据期间基于应用所述用户定义的偏好来确定所述至少一个数据类别;以及
将所述一组用户定义的偏好添加到偏好资料数据库.
11.根据权利要求10所述的计算机系统,其中所述用户定义的偏好包括包含传送格式的传送偏好。
12.根据权利要求9所述的计算机系统,其中所述消除重复数据包括:
从所接收的聚集社交媒体内容中合并或删除重复数据。
13.根据权利要求9所述的计算机系统,其中所述生成所述过滤数据包括利用偏好资料数据库和实体资料数据库。
14.根据权利要求9所述的计算机系统,其中所述至少一个数据类别包括永久类别和临时类别中至少一个并且通过包含用户标识、时间戳以及具有狭窄间隔的地理-标签的元数据来识别。
15.根据权利要求9所述的计算机系统,其中所述摘要的呈现包括利用数据尺寸、数据类型以及数据类别中的至少一个。
16.根据权利要求14所述的计算机系统,其中所述临时类别包括对包含传送内容和传送格式的一组用户定义的偏好的临时改变。
CN201410474908.6A 2013-09-17 2014-09-17 用于改善社交媒体数据的方法和系统 Active CN104462173B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/028,564 2013-09-17
US14/028,564 US9953079B2 (en) 2013-09-17 2013-09-17 Preference based system and method for multiple feed aggregation and presentation

Publications (2)

Publication Number Publication Date
CN104462173A true CN104462173A (zh) 2015-03-25
CN104462173B CN104462173B (zh) 2018-06-05

Family

ID=52668957

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410474908.6A Active CN104462173B (zh) 2013-09-17 2014-09-17 用于改善社交媒体数据的方法和系统

Country Status (2)

Country Link
US (2) US9953079B2 (zh)
CN (1) CN104462173B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106302131A (zh) * 2016-09-14 2017-01-04 广东欧珀移动通信有限公司 一种聊天信息区别同步的方法及装置
US9910915B2 (en) 2013-09-17 2018-03-06 International Business Machines Corporation Preference based system and method for multiple feed aggregation and presentation
CN108780463A (zh) * 2016-03-18 2018-11-09 微软技术许可有限责任公司 社交图的生成和管理
CN110968795A (zh) * 2019-11-27 2020-04-07 国网能源研究院有限公司 一种公司形象提升系统的数据关联匹配系统

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5346417B1 (ja) * 2012-12-27 2013-11-20 楽天株式会社 提供装置、提供方法、プログラム、及び、記録媒体
US20140298201A1 (en) * 2013-04-01 2014-10-02 Htc Corporation Method for performing merging control of feeds on at least one social network, and associated apparatus and associated computer program product
US9461948B2 (en) * 2014-01-26 2016-10-04 American Megatrends, Inc. System having a gateway for providing email based on interest in subscriber profile
US10164946B2 (en) 2015-06-24 2018-12-25 International Business Machines Corporation Mention identification for untrusted content
CA2992495A1 (en) * 2015-07-17 2017-01-26 Tribune Broadcasting Company, Llc Video-production system with social-media features
US10289282B2 (en) * 2015-12-21 2019-05-14 Microsoft Technology Licensing, Llc While you were away experience
US11062239B2 (en) 2018-02-17 2021-07-13 Bank Of America Corporation Structuring computer-mediated communication and determining relevant case type
US11715042B1 (en) 2018-04-20 2023-08-01 Meta Platforms Technologies, Llc Interpretability of deep reinforcement learning models in assistant systems
US11307880B2 (en) 2018-04-20 2022-04-19 Meta Platforms, Inc. Assisting users with personalized and contextual communication content
US11010436B1 (en) 2018-04-20 2021-05-18 Facebook, Inc. Engaging users by personalized composing-content recommendation
US11886473B2 (en) 2018-04-20 2024-01-30 Meta Platforms, Inc. Intent identification for agent matching by assistant systems
US11676220B2 (en) 2018-04-20 2023-06-13 Meta Platforms, Inc. Processing multimodal user input for assistant systems
US11244284B2 (en) 2018-05-31 2022-02-08 Microsoft Technology Licensing, Llc Document status management system
US10614406B2 (en) 2018-06-18 2020-04-07 Bank Of America Corporation Core process framework for integrating disparate applications
US11567788B1 (en) 2019-10-18 2023-01-31 Meta Platforms, Inc. Generating proactive reminders for assistant systems
US11861674B1 (en) 2019-10-18 2024-01-02 Meta Platforms Technologies, Llc Method, one or more computer-readable non-transitory storage media, and a system for generating comprehensive information for products of interest by assistant systems
US11563706B2 (en) 2020-12-29 2023-01-24 Meta Platforms, Inc. Generating context-aware rendering of media contents for assistant systems
US11809480B1 (en) 2020-12-31 2023-11-07 Meta Platforms, Inc. Generating dynamic knowledge graph of media contents for assistant systems
US12118790B2 (en) 2021-04-21 2024-10-15 Meta Platforms, Inc. Auto-capture of interesting moments by assistant systems
US11861315B2 (en) 2021-04-21 2024-01-02 Meta Platforms, Inc. Continuous learning for natural-language understanding models for assistant systems
US12045568B1 (en) 2021-11-12 2024-07-23 Meta Platforms, Inc. Span pointer networks for non-autoregressive task-oriented semantic parsing for assistant systems
WO2024092312A1 (en) * 2022-11-04 2024-05-10 Melody Regan System and method for generating a screened and consolidated social media data feed
US11983329B1 (en) 2022-12-05 2024-05-14 Meta Platforms, Inc. Detecting head gestures using inertial measurement unit signals
US12112001B1 (en) 2023-03-14 2024-10-08 Meta Platforms, Inc. Preventing false activations based on don/doff detection for assistant systems

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6047299A (en) * 1996-03-27 2000-04-04 Hitachi Business International, Ltd. Document composition supporting method and system, and electronic dictionary for terminology
US20060173985A1 (en) * 2005-02-01 2006-08-03 Moore James F Enhanced syndication
CN101297567A (zh) * 2005-10-25 2008-10-29 索尼爱立信移动通讯股份有限公司 根据无线通信设备能力修整电子内容获取的方法和设备
US20110004831A1 (en) * 2009-03-04 2011-01-06 Arieh Steinberg Filtering Content in a Social Networking Service
CN102713965A (zh) * 2010-01-21 2012-10-03 微软公司 数据源的可缩放主题聚集

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6901585B2 (en) * 2001-04-12 2005-05-31 International Business Machines Corporation Active ALT tag in HTML documents to increase the accessibility to users with visual, audio impairment
US20050060365A1 (en) * 2002-01-24 2005-03-17 Robinson Scott L. Context-based information processing
JP3958190B2 (ja) 2002-01-29 2007-08-15 株式会社リコー パーソナルダイジェスト配信システム
US20060168126A1 (en) * 2004-12-21 2006-07-27 Jose Costa-Requena Aggregated content listing for ad-hoc peer to peer networks
EP2110760A1 (en) 2008-04-14 2009-10-21 Alcatel Lucent Method for aggregating web feed minimizing redudancies
US9277021B2 (en) 2009-08-21 2016-03-01 Avaya Inc. Sending a user associated telecommunication address
US20110106807A1 (en) * 2009-10-30 2011-05-05 Janya, Inc Systems and methods for information integration through context-based entity disambiguation
US9258231B2 (en) * 2010-09-08 2016-02-09 International Business Machines Corporation Bandwidth allocation management
US8732584B2 (en) 2010-11-09 2014-05-20 Palo Alto Research Center Incorporated System and method for generating an information stream summary using a display metric
US9208252B1 (en) * 2011-01-31 2015-12-08 Symantec Corporation Reducing multi-source feed reader content redundancy
AU2011202182B1 (en) 2011-05-11 2011-10-13 Frequency Ip Holdings, Llc Creation and presentation of selective digital content feeds
US20130021370A1 (en) 2011-07-18 2013-01-24 Salesforce.Com, Inc. Computer implemented methods and apparatus for presentation of feed items in an information feed to be displayed on a display device
US20130041901A1 (en) * 2011-08-12 2013-02-14 Rawllin International Inc. News feed by filter
US8874781B2 (en) 2011-10-17 2014-10-28 Qualcomm Incorporated System and apparatus for power efficient delivery of social network updates to a receiver device in a broadcast network
US8509816B2 (en) 2011-11-11 2013-08-13 International Business Machines Corporation Data pre-fetching based on user demographics
EP2608137A3 (en) 2011-12-19 2013-07-24 Gface GmbH Computer-implemented method for selectively displaying content to a user of a social network, computer system and computer readable medium thereof
US9953079B2 (en) 2013-09-17 2018-04-24 International Business Machines Corporation Preference based system and method for multiple feed aggregation and presentation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6047299A (en) * 1996-03-27 2000-04-04 Hitachi Business International, Ltd. Document composition supporting method and system, and electronic dictionary for terminology
US20060173985A1 (en) * 2005-02-01 2006-08-03 Moore James F Enhanced syndication
CN101297567A (zh) * 2005-10-25 2008-10-29 索尼爱立信移动通讯股份有限公司 根据无线通信设备能力修整电子内容获取的方法和设备
US20110004831A1 (en) * 2009-03-04 2011-01-06 Arieh Steinberg Filtering Content in a Social Networking Service
CN102713965A (zh) * 2010-01-21 2012-10-03 微软公司 数据源的可缩放主题聚集

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9910915B2 (en) 2013-09-17 2018-03-06 International Business Machines Corporation Preference based system and method for multiple feed aggregation and presentation
US9953079B2 (en) 2013-09-17 2018-04-24 International Business Machines Corporation Preference based system and method for multiple feed aggregation and presentation
CN108780463A (zh) * 2016-03-18 2018-11-09 微软技术许可有限责任公司 社交图的生成和管理
CN108780463B (zh) * 2016-03-18 2021-12-03 微软技术许可有限责任公司 社交图的生成和管理
CN106302131A (zh) * 2016-09-14 2017-01-04 广东欧珀移动通信有限公司 一种聊天信息区别同步的方法及装置
CN106302131B (zh) * 2016-09-14 2018-05-29 广东欧珀移动通信有限公司 一种聊天信息区别同步的方法及装置
CN110968795A (zh) * 2019-11-27 2020-04-07 国网能源研究院有限公司 一种公司形象提升系统的数据关联匹配系统
CN110968795B (zh) * 2019-11-27 2023-06-02 国网能源研究院有限公司 一种公司形象提升系统的数据关联匹配系统

Also Published As

Publication number Publication date
CN104462173B (zh) 2018-06-05
US20150081674A1 (en) 2015-03-19
US20150081670A1 (en) 2015-03-19
US9953079B2 (en) 2018-04-24
US9910915B2 (en) 2018-03-06

Similar Documents

Publication Publication Date Title
CN104462173A (zh) 用于改善社交媒体数据的方法和系统
US11399079B2 (en) Zero-knowledge environment based networking engine
US10057349B2 (en) Data stream consolidation in a social networking system for near real-time analysis
US10083239B2 (en) Aggregating social networking system user information for display via stories
US10614467B2 (en) Displaying recommendations for social networking system entity information via a timeline interface
KR101331570B1 (ko) 소셜 네트워킹 시스템에서 제 3 자 웹페이지와 객체의 맵핑
US8943145B1 (en) Customer support via social network
US20090284531A1 (en) Information Processing Apparatus, Information Processing Method and Program
US10152544B1 (en) Viral content propagation analyzer in a social networking system
US10713319B2 (en) Systems and methods to determine trending topics for a user based on social graph data
US9117179B2 (en) Predicting user activity in social media applications
US20120323647A1 (en) Analyzing consumer behavior involving use of social networking benefits associated with content
CN104636130B (zh) 用于生成事件树的方法和系统
US20160179823A1 (en) Method for Processing and Displaying Real-Time Social Data on Map
CN108702481B (zh) 创建复合视频的系统和方法
US20170149852A1 (en) Systems and methods to control event based information
US20200233574A1 (en) Systems and methods for sharing content
AU2016398632A1 (en) Systems and methods for identifying matching content
US20220284069A1 (en) Entity validation of a content originator
US20220141166A1 (en) Utilizing encrypted ephemeral messages to modify ephemeral message duration settings
Chang et al. Forensic Analysis of Social Networks Based on Instagram.
US20200012669A1 (en) Medical clinical trial site identification
US20170085657A1 (en) Location-based recommendation generator
JP2006302032A (ja) ビジネスプロセス例外処理生成支援装置およびプログラム
Polakis et al. Security and privacy measurements in social networks: experiences and lessons learned

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant