CN102884530A - 用于包括冲击分析和影响跟踪的数据收集、跟踪和分析 - Google Patents

用于包括冲击分析和影响跟踪的数据收集、跟踪和分析 Download PDF

Info

Publication number
CN102884530A
CN102884530A CN2011800243987A CN201180024398A CN102884530A CN 102884530 A CN102884530 A CN 102884530A CN 2011800243987 A CN2011800243987 A CN 2011800243987A CN 201180024398 A CN201180024398 A CN 201180024398A CN 102884530 A CN102884530 A CN 102884530A
Authority
CN
China
Prior art keywords
data
database
source
search
media
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011800243987A
Other languages
English (en)
Inventor
D.W.巴曼
P.布雷尔
T.J.勒皮恩
B.B.斯特克蒂
D.M.巴曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Access Business Group International LLC
Original Assignee
Access Business Group International LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Access Business Group International LLC filed Critical Access Business Group International LLC
Publication of CN102884530A publication Critical patent/CN102884530A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

公开了一种用于数据收集、媒体分析以及网络跟踪的系统。所收集数据可以包括用于参考数据库的宽搜索和用于比较数据库的窄搜索。使用联系人关系管理数据库来存储和分发用于个人和公司的简档。RSS馈送内容数据库可以频繁地更新并提供相关搜索结果。该系统可以分析所收集数据和该数据的跟踪。该分析可以用来识别相关数据。可以将用户和企业的简档建立用于将可以包括用于用户或企业的特定信息的简档数据确定为目标并生成该简档数据。可以将监视和/或跟踪用于识别数据的变化。该系统可以基于鉴于特定事件/源基于用户印象或网络点击数来提供事件/影响的冲击的分析。该冲击可以包括社会影响价值。在另一实施例中,提供了鉴于影响的投资回报(“ROI”)。

Description

用于包括冲击分析和影响跟踪的数据收集、跟踪和分析
优先权
本申请要求2010年5月16日提交且被通过引用结合到本文中的题为“DATA COLLECTION, TRACKING, AND ANALYSIS FOR MULTIPLE MEDIA INCLUDING IMPACT ANALYSIS AND INFLUENCE TRACKING”的美国临时专利申请号为61/345,127的优先权。
背景技术
数据、事件或个人的因特网或网络跟踪、诸如该概念通过因特网的扩散一般局限于因特网服务提供商(“ISP”),并且可能进一步局限于用于要监视和跟踪的项目的标签的使用。图像搜索已经局限于返回与搜索文本相关联的关联图形或媒体元素的文本搜索。由于因特网上的数据量,思想、新闻稿、事件或媒体发布的扩散的跟踪可能是困难的。因特网的尺寸还使得难以识别相关材料和分析该材料。当该分析包括相关性或影响的确定时,其一般局限于手动和主观检查。这可能由于大公司的复杂性和规模进一步复杂化。来自许多雇员的搜索和词语的数目可能跨越该组织产生不同的结果。能够识别所有雇员可获得的更好模式、词语以及信息以限制潜在的错误信息可能是有帮助的。具有构建更好的方法和搜索词语并将其组织为整体的和的系统可以改善使用此信息时的对相关数据的搜索。
附图说明
参考以下附图和描述可以更好地理解该系统和方法。参考以下各图来描述本发明的非限制性和非排他性实施例。图中的部件不一定按比例描绘,而是注重于举例说明本发明的原理。在图中,相同的附图标记遍及不同的视图指示相应的部分。
图1图示出跟踪和分析的一般概述;
图2图示出示例性网络系统的简化方框图;
图3a和3b图示出用于收集、跟踪、分析以及确定用于特定事件的冲击(impact)的系统;
图4图示出用于事件的数据的请求和参考数据库的生成;
图5图示出如何使用爬虫数据来分析媒体和文本;
图6图示出可以将文本、徽标或图像标记用于比较;
图7图示出使用音频模式(pattern)的音频分析;
图8图示出语言、图像、文本和音频之间的参考;
图9图示出与初始数据集的数据库比较;
图10图示出联系人关系管理(“CRM”)数据库的使用;
图11图示出用来验证社会专长的资源以及用于评价和影响的CRM数据;
图12图示出目标数据的收集以及联系人信息的分析和评价;
图13图示出如何能够将图像转换成有用数据;
图14图示出投资回报引擎;
图15图示出冲击分析的可视化;
图16图示出可以使用上下文中的项目来跟踪事件或一系列事件的成功;
图17图示出冲击分析的可视化;
图18图示出用于收集附加数据的过程;
图19图示出示例性过程;
图20图示出示例性媒体类型;
图21图示出示例性数据分析;以及
图22图示出用于公司的公共词语的开发。
具体实施方式
以介绍的方式,公开的实施例涉及以有组织方式来组织和收集用于一个组织的大量搜索词语以便搜索、跟踪和提供关于包括多个媒体格式的单个或多个可搜索元素的扩散或成功的分析性分析。可搜索元素可以包括特定事件,其可以包括展出、新闻稿、文章、网页、产品或其他离散的偶然事件。还可以按种类将事件分段。例如,种类可以包括社会责任、情感诉求、洞察力和领导能力、财务业绩、工作地点环境或产品和服务。事件可以包括图片、视频、网络媒体、博客会话、电子邮件、RSS馈送内容、网络对象以及可以是可搜索或连接的其他联网信息源。这可以是相关的,因为因特网变成了用以跟踪和分析事件的成功的最重要的媒体源。可以用这些事件的投资回报(“ROI”)来衡量该成功,其可以允许分配到各种销售领域(包括广告)的货币(marketing dollars)适当的投资以在使开销最小化的同时使曝光最大化。此冲击分析可以用于调查、销售、人力资源、营销、市场调查、公共关系、法律、品牌跟踪、消费者调查等。这些潜在的目标是用于搜索的不同基本原理,其可以基于用于每个目标的特定要求而利用不同ROI分析。
因特网内的存储库/服务器、连接和用户的收集是动态的。内容被添加、复制、修改和删除。因特网搜索引擎周期性地在因特网上爬行并产生可以作为爬行时的因特网静态快照的索引。本实施例涉及用于捕捉、分析和报告因特网的动态性质的系统和方法,并且提供了可以用来检测和报告变化、特别是相对于由一个或多个特定事件触发的变化的方法。这样,可以从思想或事件以及特别地表达或描述思想或事件的这样的内容的第一次引入开始、随着该内容跨越连接和数据存储库被复制、修改或增补或随着基于该内容的衍生内容被添加、复制、修改或增补等而对此类内容进行跟踪。被跟踪和分析的思想或事件可以包括可以在因特网上找到的公司、产品、人、活动或其他概念。
在一个实施例中,可以跟踪商业品牌的引入,诸如从其第一次被公开展示的时间开始。该跟踪可以包括针对该品牌的业务和提及而监视因特网。数据可以被动态地收集用于品牌意识和公众印象(impression)的跟踪。可以跟踪关于或描述品牌的内容的扩散以评估该品牌的商业冲击或效益。可以使用扩散源的分析来进一步确定冲击。例如,可以使用(企业或个人的)简档来确定源的潜在价值并将来自这些源的冲击量化。
公开的实施例还可以包括生成和收集数据,包括跟踪数据。可以分析和更新所收集的数据。该分析可以包括数据聚合、内容匹配、用户跟踪以及识别相关数据和应收集的其他数据。可以执行附加分析以将所收集数据的成功或冲击量化。
公开的实施例还公开了一种执行文本引用的匹配、声音字节的音频确认以及图形、视频或其他图形媒体中的图像确认的系统。此内容匹配用来将参考媒体与大的媒体集合进行比较和匹配。该参考媒体可以包括关于最近事件或产品图片的文章。此系统可以使用语音识别软件以及能够分析图片、图形文件和视频文件以及文本搜索的图像分析软件。使用文本、引用、图像、音频以及视频的参考数据库,该系统寻找与来自参考数据库的事件对准的匹配。为了简单起见,该系统将被描述为跟踪和分析事件,但事件还可以包括展出、新闻稿、产品发布、公司重整、促销、产品预览、文章、网页、产品或其他离散的偶然事件。其还可以用来跟踪特定的趋势、技术、竞争公司、品牌等。该系统使用爬虫来定义参考数据库的使用区域。然后可以将所收集数据存储在搜索数据库中,诸如具有搜索结果的列表。可以按类型(例如文本、图形类型、图片、音频、照片、因特网服务提供商(“ISP”)、网际协议(“IP”)地址等)、日期或与结果有关的其他数据来参考这些搜索结果。可以用到上文所列的参考的链接来维护另一搜索数据库。一旦搜索列表已经完成,则另一确认引擎可以处理文本以及关于音频、视频和图像的数字分析。然后将每个确认存储在第一参考数据库内并使每组搜索参考与事件相关。这些可以用搜索的最终分析和确认来跟踪。数据随时间推移按事件形成历史以确定具有与之相关联的用于ROI分析的影响或评价的进行中活动、冲击、印象、联系或联系类型。
该系统可以使用多个项目的上下文来开发所识别相关数据的更好图片。该系统可以使用该信息更深地进行挖掘以获得附加的理解。使用文本、图像、联网细节、情感、视频或音频,系统能够构建非常特定的活动覆盖区。情感可以是由预测提示的态度、思想或判断。例如,可以使用上述所列的种类以及特定的情感词典。情感词典可以是作为已经预定的社会中的标准判断而可容易地获得的。在一个实施例中,可以通过以下计算来进行主体性计算:
相关性主体性 = 积极参考 / 总参考。
主题主体性 = 主题分数 / 总参考。
目标相近性 = 相近性分数 / 总参考。
相关性=相关性主体性 + 主题主体性+ 目标相近性。
这可以用于每个相应的参考以完成用于情感的总相关性。还可以对如上所列的附加种类打分以示出跟踪或监视的特定分组或种类中的相对性能。另外,可以通过更深地到达印象和影响因素所贡献和/或影响的网络输入的价值中来增建其特性。可以包括能够通过每个相应的跟踪来分析的影响因素分数。可以测量和监视任何事件的冲击分析。特别地,该冲击可以包括用于具有最高冲击的源的进一步数据挖掘。
图1图示出跟踪和分析的一般概述。在方框102中,收集和/或生成数据。所收集数据可以包括跟踪数据。如下文所讨论的,该系统生成数据库(例如参考数据库、社会联系人数据库、社会联系人数据库等)并收集数据。在方框104中,分析并监视收集数据。该分析包括从所收集/跟踪数据、用户/企业的简档、企业的持续监视和/或内容/源跟踪来识别相关数据。相关数据的识别可以包括内容匹配。在方框106中,分析所收集数据(包括跟踪数据)以确定所收集数据的成功或影响或投资回报(ROI)。此分析可以包括用于确定特定数据源的价值的社会价值或影响因素价值。
图2描述了图示出示例性网络系统200的一个实施例的简化方框图。网络系统200可以提供用于下文所讨论的数据跟踪和/或分析的平台。网络系统200可以包括用于在因特网上爬行以收集和跟踪数据的功能。在网络系统200中,用户设备202通过网络204与搜索引擎206耦合。如下文所述,搜索引擎206可以包括从网络204分发数据的网络服务器或与之耦合。可以将跟踪器/分析器212与网络204和/或搜索引擎206耦合。在本文中,将短语“与...耦合”定义为意指被直接连接到或通过一个或多个中间部件间接地连接。此类中间部件可以包括基于硬件和软件的部件。在不脱离如在本文中阐述的权利要求的精神和范围的情况下可以实现部件的布置和类型的变化。可以提供附加、不同或更少的部件。
用户设备202可以是允许用户连接至诸如因特网的网络204的计算设备。用户设备的示例包括但不限于个人计算机、个人数字助理(“PDA”)、蜂窝电话或其他电子设备。可以将用户设备202配置成允许用户与搜索引擎206、跟踪器/分析器212或网络系统200的其他部件相交互。用户设备202可以包括键盘、键区或光标控制设备,例如鼠标、或操纵杆、触摸屏显示器、遥控器或可操作用于允许用户与搜索引擎206和/或经由用户设备202相交互的任何其他设备。可以将用户设备202配置成使用网络浏览器通过网络204来访问除网页之外的其他数据/信息,诸如INTERNET EXPLORER?(由华盛顿雷德蒙的微软公司出售)或FIREFOX?(由Mozilla提供)。浏览器所显示的数据可以包括用于跟踪数据、为了分析而提供的数据和/或用于数据分析的结果的请求。在替换实施例中,除网络浏览器之外的软件程序也可以通过网络204或从不同的源显示数据。
搜索引擎206可以提供被提供给用户设备202的网页,并且可以是响应于从用户设备202接收到搜索查询而提供的搜索结果。如下文所讨论的,可以将搜索查询用于数据跟踪。在一个实施例中,搜索引擎206可以是或可以通过网络204连接至充当接口的网络服务器以便向用户设备202提供网页。搜索引擎206可以为用户设备202提供任何页面,包括来自用户设备202的用户的跟踪请求。
可以使用跟踪器/分析器212来检索跟踪数据,或者可以用来分析可用跟踪数据。跟踪器/分析器212可以是用于收集跟踪数据或其他媒体和/或分析该数据或媒体的计算设备。跟踪器/分析器212可以包括处理器220、存储器218、软件216和接口214。如所示,跟踪器和分析器可以是同一设备;然而,在不同实施例中,跟踪器和分析器可以是不同的设备,并且可以包括也可以不包括所有的接口214、软件216、存储器218和/或处理器220。搜索引擎206可以用来提供跟踪数据。
接口214可以是用户输入设备或显示器。接口214可以包括键盘、键区或光标控制设备,诸如鼠标、或操纵杆、触摸屏显示器、遥控器或可操作用于允许用户或管理员与跟踪器/分析器212相交互的任何其他设备。接口214可以与用户设备202、搜索引擎206和/或跟踪器/分析器212中的任一个相通信。接口214可以包括被配置成允许用户和/或管理员与跟踪器/分析器212的任何部件相交互的用户接口。例如,管理员和/或用户可以能够检查或更新用于跟踪数据的请求、跟踪数据本身、该数据的分析。接口214可以包括与处理器220耦合并被配置成显示来自处理器220的输出的显示器。该显示器(未示出)可以是液晶显示器(LCD)、有机发光二极管(OLED)、平板显示器、固态显示器、阴极射线管(CRT)、投影仪、打印机或用于输出所确定信息的其他现在已知或以后开发的显示设备。该显示器可以充当用于用户观看处理器220的运行的接口或者作为用于提供数据的与软件216的接口。
跟踪器/分析器212中的处理器220可以包括中央处理单元(CPU)、图形处理单元(GPU)、数字信号处理器(DSP)或其他类型的处理设备。处理器220可以是多种系统中的任何一个中的部件。例如,处理器220可以是标准个人计算机或工作站的一部分。处理器220可以是一个或多个通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列、服务器、网络、数字电路、模拟电路、其组合或用于分析和处理数据的其他现在已知和以后开发的设备。处理器220可以与软件程序、诸如手动地生成(即编程)的代码相结合地操作。
处理器220可以与存储器218耦合,或者存储器218可以是单独部件。可以将软件216存储在存储器218中。存储器218可以包括但不限于计算机可读存储介质,诸如各种类型的易失性和非易失性存储介质,包括随机存取存储器、只读存储器、可编程序只读存储器、电可编程序只读存储器、电可擦只读存储器、闪速存储器、磁带或磁盘、光学介质等。存储器218可以包括用于处理器220的随机存取存储器。替换地,存储器218可以与处理器220分离,诸如处理器的高速缓冲存储器、系统存储器或其他存储器。存储器218可以是用于存储所记录跟踪数据或数据分析的外部存储设备或数据库。示例包括硬盘驱动器、致密光盘(“CD”)、数字视频光盘(“DVD”)、存储卡、记忆棒、软盘、通用串行总线(“USB”)存储设备或可操作用于存储数据的任何其他设备。存储器218可操作用于存储可由处理器220执行的指令。
在图中示出或在本文中描述的功能、动作或任务可以由执行存储在存储器218中的指令的已编程处理器来执行。该功能、动作或任务独立于特定类型的指令集、存储介质、处理器或处理策略,并且可以由单独地或组合地操作的软件、硬件、集成电路、固件、微代码等来执行。同样地,处理策略可以包括多重处理、多重任务、并行处理等。处理器220被配置成执行软件216。
本公开设想一种计算机可读介质,其包括指令或响应于所传播信号而接收并执行指令,使得连接到网络的设备能够通过网络来传送语音、视频、音频、图像或任何其他数据。接口214可以用来经由通信端口通过网络来提供指令。可以以软件方式创建通信端口,或者其可以是硬件方式的物理连接。可以将通信端口配置成与网络、存储介质、显示器或系统200中的任何其他部件或其组合相连接。与网络的连接可以是物理连接,诸如有线以太网连接,或者可以是无线地建立的,如下文所讨论的。同样地,与系统200的其他部件的连接可以是物理连接,或者可以是无线地建立的。
可以通过网络、包括但不限于网络204将系统200中的任何部件相互耦合。例如,可以通过网络将跟踪器/分析器212与搜索引擎206和/或用户设备202耦合。因此,系统200中的任何部件可以包括被配置成与网络相连的通信端口。可以连接系统200中的任何部件以使得能够实现设备之间的数据通信的网络可以包括有线网络、无线网络或其组合。无线网络可以是蜂窝电话网络、根据诸如由电子和电气工程师协会公司公布的IEEE 802.11、802.16、802.20的标准化协议操作的网络或WiMAX网络。此外,该一个或多个网络可以是公共网络,诸如因特网、专用网络,诸如内部网或其组合,并且可以利用现在可用或以后开发的多种联网协议,包括但不限于基于TCP/IP的联网协议。该一个或多个网络可以包括局域网(LAN)、广域网(WAN)、诸如通过通用串行总线(USB)端口的直接连接等中的一个或多个,并且可以包括构成因特网的互联网络集合。该一个或多个网络可以包括任何通信方法,或者采用用于将信息从一个设备传送至另一个的任何形式的机器可读介质。
图3a和3b图示出用于收集、跟踪、分析以及确定用于特定事件的冲击的系统。如下文所述,该系统包括多个数据收集机制(例如爬虫搜索)、用于存储数据的多个数据库(例如参考、比较、媒体置入、媒体价值、CRM以及价值/影响数据库)以及用于进一步数据分析和冲击分析的机制。
主题和客户信息302包括感兴趣的主题,诸如事件。该客户信息可以包括搜索器和与搜索器有关的信息。该信息可以用来使搜索聚焦。针对关于特定主题的搜索,存在被用来创建参考数据库306的第一爬虫搜索304。可以将参考数据库306中的数据视为能够进一步精选的第一遍数据。第一爬虫搜索304可以是公共网页搜索(例如GOOGLE、YAHOO、BING等)。基于参考数据库中的信息,可以存在与比较数据库310一起使用的文本、引用以及上下文314及图像和标记312。文本、引用以及上下文314及其他媒体和标记312可以包括能够用来将参考数据库306缩窄的数据示例,并且可以与主题和客户302有关。比较数据库310遍历数据和媒体分析308以创建相关数据库316。
在一个示例中,可以基于感兴趣的故事来识别领域、作者及其他相关数据。可以应系统的命令(潜在地自动化)执行第二爬行以返回至特定源以吸引感兴趣的附加信息。该感兴趣的附加信息可以包括来自源的文本细节,或者其可能包括来自类似领域的附加文章以参考该站点的上下文,或者可以与来自源的初始收集有关的来自该站点的图像。
在另一示例中,第一爬行识别具有关于品牌的负面讨论的文章。第二爬行返回至该文章并从该站点收集附加文章以识别第一文章的相关性。相关性可以是根据用连接词使用的多个单词的交叉引用进行的上下文的验证。例如,在句子“现代奇迹eCoupled向类似于现代世界博览会的CES提供无线功率”中,“无线功率”、“eCoupled”、“现代,奇迹”、“CES”的使用可以定义用于一组所监视词语的相关性。(EVENT)开始定义用于特定的一组所监视词语的相关性。可以将用于所监视的一组词语的词典设置为分组或可能的分组。在特定段落中使用的词语越多,该特定段落变得越相关。同样地,特定语句中的词语的频率也可以增加相关性。上文所列种类也可以用于此相关性确定。伙伴列表及其他特定词典可以针对相对比较或分数定义交替分组或分类分数。另一示例是发起第二爬行以收集最初被完全捕捉的文章。可以按照特定群组和兴趣通过词典内的有组织数据的理解或上下文来辅助此收集。可以如上所列的特定过滤器将针对许多群组收集的数据切割并进行组织以根据特定兴趣而呈现或可视化。与法定研究相比较的消费者研究可以具有用于收集类似数据的不同原因,并且可以具有词典中的不同关键字。
可以存在与主题&客户302有关的多个新闻发布。除新闻发布之外,可以针对比较数据库310收集与客户有关的其他项目。主题或客户可以包括项目、公司或个人,包括主题或客户的代表,可以用来识别相关媒体,针对该媒体,一个人用来生成比较数据库310。例如,来自特定客户的新闻发布可以包括由于到客户的关联而被自动地识别为相关的引用(例如,该引用是用于客户的广告,其中,该引用将被添加到比较数据库310)。数据和媒体分析308可以将比较数据库310与离开因特网的参考数据库306相比较。搜索主题302用来使用第一爬虫搜索304来生成参考数据库306。搜索主题302可以包括搜索的文本,其可以包括单词的特定分组。替换地,其可以包括引用,其使用受到监视。数据和媒体分析308可以是被与搜索材料相比较以将其使用、上下文和兴趣分类的一系列词典。可以将参考数据库306与和期望搜索有关的第二组信息(比较数据库310)相比较。此事件系列可以对分类、分数和联系进行精选进一步定义相关数据。
参考数据库306是与主题302有关的总表。该总表被与来自比较数据库310的比较列表相比较,其包括来自数据和媒体分析308的附加数据和图像。例如,寻找旧苹果计算机图片的用户将具有包括所有类型的苹果的所有图像的总表。该总表的精选可以包括作为比较数据库310的一部分来放置苹果徽标。此上下文帮助进一步缩窄参考数据库306中的总表。在图4~5中进一步描述参考数据库306的全域和使用。
参考数据库306可能具有大量的搜索结果或命中,其中的许多可能是不相关的。用已分析比较数据库310来精选参考数据库306得到相关数据库316。此精选可以由相对于图7~8进一步描述的数据和媒体分析308来执行。本质上,此精选类似于搜索项的缩窄或精选以识别相关数据;然而,此精选是以自动化方式而不是作为手动过程执行的。参考数据库306是涵盖过广数据库,其包括来自被设计成提供大量搜索结果的第一爬虫搜索304的结果。因此,参考数据集306具有过多的信息,因为大多数信息可能与主题和客户302不相关。比较数据库301也是参考数据库,但用来基于图像和标记312或文本、引用以及上下文314的示例来缩窄结果。
一般地,将来自参考数据库306的数据与来自比较数据库310的数据相比较。然后分析该数据以过滤出任何无关数据以简化由数据和媒体分析308进行的后续数据挖掘。该后续数据挖掘可以包括用于找到社会联系、情感、社会影响、影响专长、媒体置入(从媒体置入数据库320)等的附加爬虫步骤(第二爬虫搜索318)。在某些实施例中,由于因特网的尺寸,可能需要多个爬虫搜索以便在网络中搜索更多相关数据。该搜索可以使用参考数据、词语、种类和相关性词典来更深地进行挖掘。这些爬虫搜索系统可以使此过程自动化。用该数据,另一爬虫(第三爬虫搜索322)随后搜索媒体置入值并基于每次置入的成本来编辑媒体价值数据库324,所述每次置入成本基于类型、比较成本、媒体成本、媒体定时以及关联影响因素。在第三爬虫搜索322中,可以获得不同的信息系列。例如,可以确定用于站点的命中的数目(A 对比 B 对比 C)。替换地,还可以确定跟帖者的数目、博客条目的数目。通过记录此数据并以相关或虚拟形式对其进行比较,用此影响因素数据,相关性变得更加明显。在替换实施例中,可以以减少搜索数目的方式将多个爬虫搜索组合或使其自动化。
提取相关数据以形成相关数据库316。相对于图9进一步参考相关数据库316。一旦识别了相关数据,则运行第二爬虫搜索318。第二爬虫搜索318在相关数据上进行搜索。例如,可以进行关于相关数据的作者/所有者的确定。这可以包括与联系人关系管理数据库319的协调。CRM数据库319可以包括关于个人、企业或其他站点的任各种数据,诸如他们与谁讲话、媒体置入的类型和/或社会价值/影响。下面相对于图10来讨论CRM数据库319的全域。此信息是相关的,因为具有高影响力的源可能具有非常高的冲击。例如,史蒂夫乔布斯的文章将以正面或负面的方式具有显著的冲击。次要的博客主将具有小得多的冲击。发起者可以参考搜索结果的作者或所有者,或者可以参考特定事件。CRM数据库319可以记录关于所有联系人的数据,诸如可以针对该联系人进行量化的所确定冲击或影响。
媒体置入数据库320与识别和记录特定事件或位置的定位有关。基于媒体置入,冲击可能改变。例如,ABC新闻上的源或访问记将具有大量的观看者,并且是高影响力的源。相反,用于普通人的博客的访问可能具有低影响力。对于在ABC上的置入,其可能价值相当于在其网站上的一定量的置入和一定量的业务对比从其底层开始工作的普通人。他将具有与其博客相关联的远不那么显著的媒体置入或媒体价值。因此,媒体置入数据库320可以包括媒体列表和用于该特定媒体的估计数目的印象。此量化影响可以直接与印象的数目相关。可以将媒体置入数据库320与联系人关系管理数据库319相关联,使得联系人关系管理数据库319包括媒体置入信息。
使用媒体置入320,可以将第三爬虫搜索322用于媒体价值数据库324。第三爬虫搜索322可以包括数据源上的搜索。可以在类似的过程中精选媒体价值并独立于媒体跟踪进行更新但参考金融或趋势跟踪。可以使第三爬虫搜索322与相对于图13描述的示例性图像搜索相关。可以基于来自第三爬虫搜索322的搜索结果来分析源。此分析包括数据聚合和第二层的相关数据328,其可以用来产生存储在价值/影响数据库326中的总分。相对于图14来描述数据聚合328。价值/影响数据库326可以包括社会价值或情感。这表示关于特定源的信息的更深分析和数据收集。此信息已被采集并已构建了关于此源的参考列表。第三爬虫搜索322被用于评估媒体或搜索结果来自的源。第二爬虫搜索318被用于检查源并构建包括来自许多源的信息的CRM数据库319。从第二爬虫搜索318生成并创建了媒体置入数据库320。此信息提供谁的和哪里的源和媒体。
媒体价值数据库324还可以存储用于随着特定源出现的成本。例如,主要电视网络上的商业广告将明显比博客上的在线广告花费更多。这也涉及到媒体置入数据库320,其包括置入的度量。登广告的成本很可能相当于用于特定源的“循环”或“印象”。在一个实施例中,当某个人想要登广告时,该广告的成本和此类广告的成功将是用于媒体价值的因素。针对任何广告要确定的成果是ROI。成功还可以包括信誉评级。影响的量可以根据一个人的信誉而变。问题变成应花费多少以便扰乱或改变或发送正面消息以改善信誉。在一个实施例中,可以使用以下等式来计算用于公司的总体信誉:
信誉等级 = 视觉分数+ 情感分数+ 产品分数+ 服务分数+ 工作地点分数+ 性能分数+ 社会分数。
每个单独分数可以具有情感元素和用于确定相对准确度的相关性元素。可以随着此返回信息被评估而更新所监视的分组或词语的词典。应注意的是用于个人或其他实体的信誉可以包括不同的子分组(sub groupings)。
分析成果和结果330包括多个因素。例如,区域的ROI价值334、地区或事件的关键影响336、媒体的冲击338以及冲击事件可以全部是用于成果和结果330的分析的因素。获得所有该数据并对其进行概括是有价值的,以便对其进行分析并提供结果以便报告332且以便反复地更新区域的ROI 334、关键影响因素336、冲击媒体338以及事件的冲击340。可以将存储在价值/影响数据库326中的价值/影响因素与社会价值、情感和/或媒体价值一起使用以识别正面的源并识别负面的源。例如,站点、人、媒体和博客可以具有特定的跟帖,并且影响可以指示多少人将看到、听到或跟踪事件。可以将此基数外推为影响因素价值并在添加媒体价值时进一步增强。这可以在特定媒体可以具有TV、无线电或其他发布途径时使用。当被相应地跟踪和输入时,这可以扩大得分。进一步分析包括影响的确定。关键影响因素336可能对识别可能具有最高冲击的源或事件有帮助。例如,关键影响因素可以是对特定主题产生大量兴趣的某些博客或其他站点。那些关键影响因素提供坚实的ROI,因为回报率是高的。例如,发布新闻稿并在丹麦存在大的轰动和点击数。识别该轰动的来源是重要的。可能的是可能存在开始该轰动的单个集线器(例如丹麦技术站点)。此站点是具有潜在高ROI的关键影响因素。
尽管有巨大的成本,某些广告的冲击或影响可能是低的。例如,印刷媒体和进入世界职业棒球大赛总决赛可能由于高成本而不是性价比最高。其对于品牌置入而言可能是好的,但消费者意识可能不存在。需要监视和跟踪媒体的冲击。在本垒板后面具有翻转板的世界职业棒球大赛处的广告可能仅是三十二秒的置入。随后可以测量跨越所有印象和轰动的理解,并且其可能是最小的。冲击分析可以是报告332的一部分。营销和公共关系的此分析与监视和跟踪图像有关。如果找到关于一个人的产品的负面文章或评论,则如果影响是足够高的,可能需要响应。这是高目标营销的示例。
冲击分析可以取决于源和主题。例如,史蒂夫乔布斯将具有讨论技术的高影响力而迈克尔乔丹将具有讨论篮球的高影响力。然而,如果将角色颠倒,影响力将是非常小的。通过针对特定的源理解这些根源并通过对这些进行表征和定义,可以针对不同的源、主题以及置入分配和跟踪价值。针对已知站点测量冲击可以由其曝光率、阅读数目、谈话的人的影响和谁看到它及其通过网络所具有的影响来定义。能够跟踪和监视源和影响数目在保持正面知觉方面可能有帮助。爬虫可以扫描网络以监视关于人、公司、品牌或包括情感的产品发布的文本、图像、音频或视频。冲击的定量测量可以基于诸如因特网的网络的内流行性(例如搜索结果、提及、页面等)。影响因素模块可以随着其跟踪多少人正在关于所监视主题进行观看、重新公布或发博客而识别相对流行性。流行性可以是随着关键影响因素非常流行的影响力的子元素。
图4图示出用于事件的数据402的请求和参考数据库306的生成。参考数据库306被设计成包括用于所搜索的种类、产品、品牌、媒体发布途径、博客以及事件日历的特定监视元素。事件日历可以包括特定事件和到特定媒体的链接,其将跟随每个相应事件。可以将此数据库链接至包括用于活动的短语、词语、图像以及目标监视资产的营销。这包括用于比较请求数据的匹配引擎420。基于文本的参考项目和基于图像的参考项目被用于第一搜索爬虫304。替换地,该搜索可以包括其他媒体类型,诸如音频、视频或其他媒体。如所图示的那样,所请求数据402包括基于文本的请求数据404和基于图像的请求数据406。基于文本的请求数据404可以包括品牌名称、事件或合作者、引用或其他形式的文本。分析部分考虑用于请求数据402的上下文。例如,“说”附近的名称很可能被视为引用。
基于图像的请求数据406可以包括图像中的徽标、视频中的徽标、图像中的标记、视频中的标记或其他形式的图像。所请求数据可以用于基于文本的搜索408。基于文本的搜索408提供文本指针和数据410。基于文本的图像搜索412生成按类型图像指针414。所请求数据402、文本指针和数据的结果410以及按类型图像指针414被提供用于数据和图像420的分析和比较。数据和图像420的分析和比较还包括与文本搜索对齐的图像和标记的识别,并生成用于相关数据库422的搜索报告和统计信息。文本指针和数据410及按类型图像指针414被提供为用于参考数据库306。
基于图像的请求数据406可以是在网络上被搜索的基线对象。分析部分寻找上下文。例如,在演讲中,其可以查看上下文并给出该演讲的更显著版本。其还以寻找引用的上下文。可以跟踪请求数据402以识别数据的不同来源。还可以通过分析影响因素和情感来测量数据的有效性。在一个实施例中,基于文本的图像搜索可以提供文本指针和数据。可以按类型来识别图像指针,并且其可以包括用于参考数据库306的链接指针。数据和图像的分析和比较包括与被用于构建搜索报告统计信息的文本搜索对齐的图像和标记的识别,所述搜索报告统计信息包括其是在哪里找到的、其源自于哪里以及通过网络的传播。在替换实施例中,如相对于图5和6所讨论的,可以通过图像搜索来将图像添加到参考数据库306。
图5图示出如何使用爬虫数据来分析媒体和文本。向一般搜索列表504和与搜索相关联的文本&图像508提供图像搜索请求406。向填充参考数据库306的网络爬虫506提供一般搜索列表504。一般搜索列表504可以包括用于提供能够随时间推移被监视以监视历史和冲击的相对分数的品牌、词语和/或短语的列表。参考数据库306被提供给分析定序器510。分析定序器510分析图像512、基于文本的引用514、视频图像分析516以及视频和图像标记搜索518以用于标记。标记可以是如相对于图6所讨论的徽标或其他标识符。来自分析定序器510的分析被针对匹配数据和图像管理器图像、视频、统计信息、链接、ISP、ISP链接、区域、标记跟踪、引用跟踪和使用以及图像使用统计信息520进行传递。统计信息520被用于图像和文本使用报告522。此报告522可以用来进一步构建出请求数据或参考字典以获得统计准确度。
标记可以是在图像中被标记以帮助识别图像的某个东西。如图6所示,标记可以是与徽标相结合地使用的MOTOROLA Q蜂窝电话。可以用不同的背景幕来展示不同的产品样机。同样地,可以针对特定新闻稿、一系列通信或消息来展示不同的图片。
可以将徽标图像识别用于识别不同的标记。其他标记包括水印,类似于页面的模糊部分或褪色部分,在那里,那些像素表示标记。构成红色、绿色、蓝色、黄色、橙色、黄绿色、红色的拐角中的仅10个像素可以是标记。返回参考图5,可以通过分析520来对所识别数据进行精选并用更相关的数据来生成新的数据库内容。基于图像或数据类型,适当的分析引擎被用于视频、gif、pdf、jpeg等。匹配还发起附加信息被存储以用于该比较,诸如ISP数据、匹配百分比或准确度、客户数据、参考图像和标记关联、参考文本、上下文和引用数据、情感数据、区域和链接、观看数据、使用统计信息等。
图6图示出如何可以将存储在参考数据库中的特定产品或特性的文本、徽标或图像标记用于特定比较。如上所述,图6图示出用于识别的图像识别的使用。在方框602中,选择图像以用于发布或公布。在方框604中向图像添加标记以进行跟踪。在方框606中公布该图像。如所示,可以将徽标用于图像识别。MOTOROLA Q电话可以充当具有徽标的标记。该标记可以包括元数据、水印、隐藏图像或被用于跟踪的特定图像。
可以使用能够在因特网上的大型(或者可能的开放式)图像集合中找到已知用户提供图像的图像匹配算法。特别地,用户的图像可以是公司的专有或营销材料(照片、图画、徽标),并且公司可能对其在各种相关网站上的使用、传播或分发感兴趣。该算法可以在存在常常在图像被重新用于不同上下文时应用的可能的显著图像修改的情况下操作。例如,修改可以包括图像尺寸调整/缩放、修整、压缩、到其他图像中的插入(整体或部分)且反之亦然以及色彩/对比度编辑。除针对上述因素的不变性之外,应理想地匹配从其主机站点下载查询图像的速度。这意味着每个图像大约一秒或(基本上)更少的典型处理时间,独立于要进行比较的用户图像的数目。
该框架可以涉及从每个图像提取签名(例如一组特征),相对于所覆盖类型的图像变换是不变的。可以以不变的方式提取每个特征并为其分配存储在索引/搜索结构中(或针对该索引/搜索结构被查询)的不变描述符。类似图像必须在类似的位置上具有类似特征(具有类似描述符)。对两个图像进行匹配,并且如果其具有与其之间的映射一致的足够数目的匹配特征,则找到其之间的映射。
可以通过编索引和查询来实现识别技术。在编索引模式中,处理用户的图像集并将其转换成针对搜索效率被最优化的索引结构。可以脱机地(以显著的计算成本)执行此程序一次,但是结果得到的索引使得能够实现查询模式的快速在线操作。在查询模式中,提取并针对索引来测试查询图像的特征签名。这识别具有与查询图像中的那些匹配的许多特征的编索引图像之中的所有候选。使用稳健的投票式程序针对查询图像来匹配那些候选图像中的每一个以找到与最高数目的匹配特征对一致的两个图像之间的映射(缩放、移位和修整)。如果后面的数目是足够高的,则认为该候选是有效的,即认为在相应的编索引图像中找到了查询图像(或其碎片)。
可以在两个编索引和查询模式中相同地应用图像处理(特征)签名提取器。其可以包括三个主要子框中的任何一个:生成图像的尺度-空间表示;在不同的尺度下检测感兴趣点(或特征点);以及在每个所检测特征点处生成特征描述符(描述本地图像模式的多维向量)。尺度-空间表示可以是原始图像的已滤波和子采样形式的金字塔(pyramid),被设计成在输入图像被调整尺寸的情况下产生或多或少相同的结果。可以将特征检测器设计成使可重复性最大化,即以在输入图像的各种修改的情况下产生或多或少相同的感兴趣点。最后,可以将特征描述符设计成使不变性和特殊性之间的权衡最优化:描述符向量对于无关点而言可以是不同的,但是对于在图像的各种被覆盖修改下的相应点而言可以是类似的。在一个实施例中,该算法是基于哈里斯-拉普拉斯特征检测器和SIFT特征描述符。这种实施方式可以利用算法缩减,以召回-精度性能的最小代价实现了较高的速度和较小的存储器要求。
特征索引可以表示度量树结构,内置于自上而下框架中,具有相对大的分支因数(~8-16)和低的深度(~5-6)。从保持编索引图像的所有特征的根节点开始,可以在其特征描述符上使用k均值聚类算法将每个节点分裂成固定数目的分支。可以将每个特征分配给最近的节点(对应于其聚类)和所有其他分支节点,到该所有其他分支节点的距离并不明显大于到最近节点。聚类和分支过程可以持续直到每个节点中的特征的数目在某个阈值以下。在完成的索引中,每个特征可以存在于多个叶节点中。此架构意味着更大的索引但更快的查询,并且来自查询图像的每个特征被沿着树一直向下传播至单个叶节点,其可以包括很可能与之匹配的所有编索引特征。
可以在图像匹配模块中评估具有足够数目的匹配特征的候选。为了找到最佳映射,可以利用标准两阶段过程的变体—随机样本一致性(RANSAC),后面是非线性最优化。可以随机地选择成对的匹配特征并用来估计两个图像之间的映射参数(缩放和移位)。选择其余特征之中的具有最高支持的映射并且稍后通过非线性支持最大化进行微调。如果结果得到的支持是足够高的,则可以报告检测。为了实现足够水平的支持,可以以几何一致的方式存在在图像之间匹配的显著比例的特征。
另外,为了图像/徽标匹配,系统还可以匹配音频。图7图示出使用音频模式的音频分析。正如可以将图像识别用于对图像进行定位和识别一样,还可以将音频识别用于识别已知音频。如所讨论的,可以将图像或音频的识别用于识别该图像/音频的分发和/或冲击。例如,可以使用图像或音频识别来识别使用该图像或音频的站点的数目。如图7所示,可以使用用于单词词典的音频模式来扫描文件(例如视频、音乐、电子书等)并找到在可听上下文中使用这些单词的地方。使用词语苹果,可以监视苹果的所有使用(例如电影)以确定人使用单词苹果的一般情感。理论上,可以记录单词苹果的每个可获得使用并编索引,诸如其在电影中的使用。
在图7中描述的音频分析器可以是相对于图3a描述的数据和媒体分析308的一部分。这还可以包括使得在其文本中的每个参考被编索引。使用此系统,引用的输入可以得到该引用在电影中或书籍中的每次使用。该分析提供向视频中进行搜索并寻找词语且对那些词语编索引的能力。可以用这些不同的单词来构建词典。基于识别,可以存在具有不同上下文的音频段的索引。例如,今日秀(Today Show)的分析可以包括用于任何期望词语的提及的评论,诸如产品名称。可以监视今日秀以确定其何时提及感兴趣的产品,这充当品牌意识。此分析在被用于跟踪特定产品时具有更多的价值。可以将跟踪用于识别最有影响力的那些源或联系人。
图8图示出语言、图像、文本以及音频之间的参考。如图8所示,用于特定主题/概念的网络搜索(也称为词典项)可以覆盖多个形式和语言。例如,可以通过音频、文本或图像或者使用不同的语言来搜索苹果。可以将请求数据304预先链接并分组成活动资产、定时和种类。可以将一系列通信和合作者和词语链接至图像及其他资产。该系统然后可以构建到其中使用这些词典项的位置的指针列表。可以存在图像词典、语言词典、文本词典以及图像词典。用户可以跨越因特网查找苹果,并且其将获得以每种语言使用的苹果的所有文本版本。图8中的词典实际上是3D数据库。替换地,可以将单独的数据库用于语言、音频、文本或图像。使用文本,一个人能够找到所有不同的语言。当文本是已知的时,可以访问所有不同的语言。在一个示例中,文本可以转变成20种语言和20个不同的音频模式,并且图像可以转变成苹果的多个图像。这可以是下一代网络的一部分,其中,当你想穿过网络时,媒体也将穿过网络,与仅仅驻留在一个地方相反。
图9图示出与初始数据集比较的数据库。图9中图示出的处理可以在数据&媒体分析308和/或比较数据库310内发生。初始数据集可以是网络数据902,诸如视频904、图像906和/或文本908。视频数据904可以包括与水印、标记、嵌入式URL或文本算法标签910的关联。图像数据906可以包括与水印、徽标、标记、文本算法标签或元数据912的关联。文本数据908可以包括与关键拷贝、URL或文本算法标签914的关联。验证916所述标记以检查其唯一性。如果其不是唯一的,则再次运行该过程,因为数据将不能识别相关文档。如果其是唯一的,则匹配地存储基准或原始数据918。比较该数据,并且基于该比较,可以存储原始内容、内容数据、发布途径链接、匹配数据。使用要跟踪920的时间的长度。该跟踪可以是连续的,并且为了获得更好的结果,可能需要一定时间段以进行识别以用于数据比较。例如,可以将CES展示视为被定时和跟踪的时间段。跟踪的时段可以是用户定义的或由RSS馈送内容发起的。
从被返回以用于存储和比较918的RSS馈送内容922和其他已知源924收集附加数据。这生成参考数据库306和报告标准日期范围930,其产生仪表板可视化932。仪表板可视化可以提供关于其点击数和印象的统计信息,如图16所图示的那样。仪表板可视化可以类似于显示过去和当前业务和/或流行性的证券报价机。其还可以包括可能正在影响流行性的最近事件。可以将该数据记录在相关数据库330中以进一步生成事件的成功或ROI的度量。相关数据库330是由分析928构建而成的,其还提供用于已知源924的读者搜索用户名。读者搜索926可以记录读者的用户名或者搜索用于被用于人口统计信息的用户名的其他发布途径。CRM数据库还可以提供名称、地址、公司、标题及其他数据以允许使用此数据的用于相关性的进一步比较。CRM上的目标帐户可以提供优先级的区域性信息和区域。可以将读者搜索数据926提供为用于数据的组织和比较918。
图10图示出联系人关系管理(“CRM”)数据库319的使用。特别地,通过使用CRM数据库319来记录关于联系人的信息,CRM通过使内容以用户或企业为目标来提供附加价值。可以通过网际协议(“IP”)地址或用用户简档数据来执行重新路由。可以基于CRM数据库319的内容使用特定用户的跟踪来以相关材料为目标。目标确定可以包括基于用于该用户的CRM数据库中的数据来显示网站的版本。例如,如果用户运行致力于绿色且环境友好的博客,则所显示站点可以显示强调所有者对环境的奉献的材料。此外,可以使企业的每个参与者坚持该企业的特定规则。例如,可以使CRM工具中的每个相应用户与Facebook帐户、Twitter、网站、博客、用户ID和/或可能在跟踪符合性或兴趣时有用的其他数据相关联。
用户在方框1002中访问站点并在方框1004中进行关于是否存在CRM 网上信息块(cookie)的确定。如果不存在网上信息块,则在方框1006中获得IP地址。在方框1008中,在CRM数据库中检查IP地址。如果在CRM数据库中不存在IP地址,则将其添加到包括网上信息块的系统。然后针对该用户测量变量1010,并且如果存在可用于该特定用户的特定内容,则在方框1012处针对该用户显示目标站点。如果在CRM数据中不存在匹配的IP,则在方框1014中将用户引导至标准站点,并且在方框1016中跟踪站点统计信息、联系人信息和/或变量。在方框1008处将此用户信息存储在CRM数据库中。在方框1004处,如果存在网上信息块,则该网上信息块将识别要显示给用户的目标站点。
在一个实施例中,可以将此目标确定用于包括在CRM中的公司。该目标确定知道特定公司正在访问该站点的时间。这可以用于竞争性分析或用于从公司征募业务/将其作为目标。例如,如果公司的成员查看某些产品,则可以使那些产品以该公司的所有雇员为目标。
图11图示出用来验证社会专长的资源和用于估价和影响的CRM数据。可以基于业务或业务线的重要性来对使用各种类(诸如上文所讨论的那些)和子元素的分数进行估价。可以通过看例如SKU和FCC列表来验证产品概念对比产品。可访问此数据可以提供产生有价值标签的组合和可能需要手动地跟踪的触发器。向爬虫/监视器1108提供包括公共源1102、财务数据1104以及行业出版物1106的附加数据。公共信息可以包括政府机构及其他组织,诸如ECD、FCC、USPTO、CGP、NCJRS以及CRSP。爬虫的此方面获得与用户、联系人、博客主、媒体联系人或公司有关的所有数据并获得统计信息。此数据和相关统计信息形成每个联系人、公司博客主和意见和估价或相关印象。例如,专利申请可以指示公司的当前技术追求。FCC可以具有关于产品的最新公开。财务单据1104和行业出版物1106还提供关于人或公司追求的线索,其可以存储在CRM数据库310中。对于个人而言,也可以检查犯罪数据库。包括社会网络的网络可以提供用于将简档放在一起的附加公开数据。对于同名的人而言,可以使用匹配来识别正确的个人。
此爬行用来填充相关数据库306。另外,还可以使用关键雇员姓名1110、政府ID 1112、产品名称1114以及公司名称1116来识别相关数据。跟踪专利、产品以及技术中的涉入度可以是合同的CDA服从和潜在违约的标志。可以使用相关数据库306来建立与媒体数据库1124、CRM数据库310、用户简档1120以及全球日历1122的相关1118。该相关被报告给用户1126。可以跟踪所报告的发现以标记潜在的活动1128。
图12说明联系人信息的收集、存储以及估价。估价引擎1236可以自动地确定用于每个联系人/企业的价值。在一个示例中,将每个联系人/企业存储在CRM数据库310中。识别在线网络存在1202,其包括社会网络1204、个人信息1206、文章/演讲1208、语调/参考1210、品牌提及1212、公共数据库参考1214、影响1216、价值1218以及网络状态1220。此数据用来标记用户类型1222,其被与CRM 1224、IP网上信息块系统1226、价值计算引擎1230以及媒体数据库1232交叉引用1234。交叉引用1234用来记录在估价引擎1238中所使用的数据点1236。社会网络1204可以包括Facebook、MySpace、Twitter和/或其他社会网络。个人信息1206可以包括姓名、地址、用户名以及其他相关信息。文章和演讲1208可以包括与主题和使用及与演讲者或个人信息有关的内容。语调和参考1210可以涉及情感分数和内容或上下文。品牌提及1212可以是与品牌有关的参考文献列表。公共数据库提及1214包括公共记录、专利、犯罪记录、纳税申报表格、人口普查数据和与用户有关的任何其他数据。影响1216可以是作为次级搜索的相关列表或影响表格,所述次级搜索针对每个用户或站点的相关影响对其进行记分。IP网上信息块1226可以是到能够在网站上跟踪的个人数据的另一链接。价值计算引擎1230可以是一系列算法和链接以基于连接根本不同的数据和分数来形成判定和分数。媒体数据库1232可以包括多个数据片,诸如链接、报告者或博客主,并且其次,其可以包括用于每个的影响和媒体价值。媒体数据库1232可以保持所有媒体链接或实际数据的历史以明确地表达长期远景和历史。可以基于在线网络存在1202的所有信息对每个联系人进行估价。联系人的经济情况、工作可以影响该价值。来自估价引擎1238的报告提供关于影响的细节。例如,具有数千个FACEBOOK朋友的某个人将具有显著的社会影响。经济因素对于该价值而言是显著的。
估价引擎1236可以在统计上评估在搜索中使用的每个关键字。例如,如相对于图22所讨论的,可以评估关键字,因为其与兴趣有关。该评估可以使用起始参考数据来监视系统。该数据然后可以用来使用提及、情感、影响数和/或媒体价值来计算值。这可以是初始的一遍价值,但是基于业务需要可能变得更复杂。此评估提供用于历史跟踪的相关数据的基本集合,并且还可以包括所讨论的种类和被认为商机所需要的附加限定词。该评估可以允许词语和返回的数据表示统计相关性。与用户设置价值量相反,系统可以示出每个关键字的相关性和这些关键字的使用之间的上下文。例如,估价引擎1236可以分析一系列的搜索配置,其在统计上分析数据以示出哪些词语与系统设法检索的信息具有统计相关性。基于返回的统计信息,可以为每个搜索词语分配真值,因为其与统计值有关。
图13图示出如何能够将图像转换成有用数据。例如,可以使用强大的网络工具将已经被购买的家用物品的图片转换成关于该项目的有价值且有用的数据以基于该图片来收集用于该用户的信息。可以将重要的项目的图片用于识别相关项目或可能与用户相关联的项目。图像数据库1302存储相关项目且可以是参考数据库306或比较数据库310的一部分。然后可以使用图像数据库1302来识别用于被拍照产品的替换零件。
为了识别关于一个人的存储图像的相关数据或信息,图像比较和识别爬虫1304可以在方框1306中用另一数据库来执行搜索。第二爬虫生成包括与图像和文本的比较的关联列表。第三爬虫如在方框1308中一样收集用于产品和服务的公司信息。在替换实施例中,可以将第二和第三爬虫组合。第二爬虫可以用来允许在下一遍搜索动态内容,允许数据集有机地增长。这可以用来使内容准确度最优化。初始爬行可以显示可以改变搜索词语的链接。可以使用动态独特单词或短语列表来进一步限定人如何进行交谈并对其进行跟踪作为具有原始搜索的多个子元素的新动态搜索集。其还可以按人、媒体、种类和用于特定问题、兴趣和分析的其他相关数据的不同数据集。最后爬行的结果是相关个性化数据。相关个性化数据可以包括个人网页或个人搜索引擎。其可以包括用于用户的相关个人信息。所呈现的信息是基于相关的个性化数据。在一个示例中,该数据可以包括能够用来识别用于该产品的替换部件的先前购买的产品。在另一示例中,该系统可以提供识别出售替换零件的卖方的能力。此个性化充当可以存在于客户端侧的搜索引擎的本地版本。
图14图示出用于计算用于某些源(诸如广告)的ROI的投资回报(“ROI”)引擎。此系统可以在方框1402中查看由标准时间帧和内容简档建立的一日或每年营销努力。数据聚合器1404将数据聚合并寻找正面表示以创建用于价值的潜力。数据聚合器1404可以从用户简档1406、全球日历1122、媒体数据库1410、内容简档1412、社会监视1414以及CRM数据库310接收数据。系统然后可以将数据1418分类并计算团体。该团体可以包括登广告1420、组织1422、社会1424、事件1426以及领导(lead)1428。数据聚合器可以使用时间、分数以及计数的数据链接来存储在算法改变的情况下能够被重新分析的数据的历史浏览次数。这可以是被重新计算以允许进一步分析的数据的原始形式。可能还需要保存词典、算法以及词语以允许相关性并跟踪特定变化以获得对所检索数据的更好理解。可以将实际数据存储为可以删除的未来链接。此数据集可以用来计算ROI和理解遍及时间和事件的复杂营销或消费者研究决策。登广告团体1420可以包括如用“每千人成本”模型计算的登广告的价值以定义与用户的相关性或流行性。该相关性/流行性可以确定用于登广告媒体的定价。在一个示例中,组织团体1422可以包括跨网络向其他站点有组织地传播的故事。社会群体1424可以包括社会数据,诸如社会网络站点爱好者基地和追随者的量以确定社会影响。事件群组1426可以包括诸如“消费者电子展”的事件,其中,可以将特定的印象归因于涉及该事件的媒体。领导群体1428可以包括已经通过CRM活动产生的领导,并且可以通过基于日期范围的领导自动选择或确定而归因于事件。换言之,在与商业展示相同的日期范围期间产生的领导,其中用户识别到“商业展示”是连接的源。种类包括种类特定算法1430。基于那些计算,可以针对每个种类确定和报告1434 ROI和成功1432。报告1434可以包含每个媒体类型和发布途径、时间或视频或文章尺寸、置入的相对成本和总价值。针对特定事件的累积计数,在图17中也可以看到用来计算ROI报告的价值,其中该数目被乘以影响和媒体价值。
图15图示出如何将文本和图像参考信息植入媒体发布中并随后针对上下文经由参考数据库306来进行跟踪。在方框1502中,存在营销或公共关系事件或活动。在方框1504中,针对诸如产品发布的事件或活动生成可追踪文本和图像。在图17中可以看到可追踪性且其示出被链接至媒体的事件。虽然本示例图示出媒体,但在其他实施例中,可以将其链接至类似于FC通告、专利及其他事件的其他事件。在方框1506中,公开网络和媒体信息。在方框1508中,公开的信息和媒体可追踪至活动或事件。
图16图示出可以使用上下文中的项目来跟踪事件或一系列事件的成功。在1602中对文本进行匹配。在1604中对图像进行匹配。在方框1606中对图像和视频标记进行匹配。事件或活动跟踪器1608包括文本、图像以及图像标记以确认匹配。成功跟踪1610跟踪统计信息、链接、ISP、使用计数、ID的参考以及印象。在图17中可以看到跟踪该成功的示例。
图17图示出冲击分析的可视化。累积印象曲线跟踪进行中的活动而不是瞬时数目。特别地,累积曲线是进行中印象的数目,而其他曲线是印象、网络业务以及社会媒体提及的瞬时值。情感可以包括负面和正面情感指示符。印象中的负面影响对累计数乘以那些印象中的该超出的影响因数具有负面冲击。如果影响较大,则冲击较大。如果影响较少,则冲击较少。换言之,已被发现具有非常高的冲击的源将具有较高的影响因数。数据的此影响和测量可以用来测量特定源的影响。可以在成本或冲击方面跟踪信誉问题。这可以用来确定用于某些营销成本的ROI。
该图表可以提供用以确定哪些事件最成功的方式。可以基于网络点击数、印象或社会媒体提及来测量该成功。在其他实施例中,可以测量附加分析。可以通过将任何峰值或谷值与事件、文章或其他离散事件相比较来使此数据相关。在一个示例中,小博客可能公布文章且印象可能并不大大地改变,因为小的博客具有低影响因数。相反,大的博客可以张贴正面文章且印象可能在接下来的几天内大大地增强。此正面影响可能是巨大的,因为大的博客具有高影响因数。正在描述的冲击分析可以帮助以正面的方式使尽可能多的人的曝光最大化,使得传达正面消息。在分配到各种销售领域(包括广告)的货币情况下可以以最有影响且正面的源/事件为目标,同时能够避免没有影响或负面的源/事件。
图18图示出用于收集附加数据的过程。可以用RSS馈送内容1802来识别该数据。例如,附加数据可以是一个或多个RSS馈送内容,其被自动地解析以创建由事件从所识别源生成的其他预定义相关馈送内容。使用RSS馈送内容提供用以确定任何信息是否已改变的容易机制。基于来自RSS馈送内容1802的关键字生成与客户和事件1804相关联的表格。每个RSS馈送内容被按照类别1806、等级1808、分数1810以及过滤器1812来处理以生成RSS馈送内容数据库1814。可以以基于用户的报告需要而生成多个维度的方式来解析数据。在一个示例中,可以随着其与图22相关对此数据进行组织,使得组织的每个相应方面包括关于搜索的该方面的相关数据。创建MDX转折点1816以便以不同的方式来评论该数据。转折点1816馈送第二发布途径RSS馈送内容数据库1818。建立数据维度1820且其可以返回MDX转折点1816。从数据维度1820,填充相关数据库316且报告引擎1822可以生成快速报告。
RSS馈送内容数据库1814、1818可以是参考数据库306的一部分。用RSS馈送内容, 用户可以查找某个主题,但是该数据是以随机方式接收的。RSS馈送内容每当那些事件正在改变或发生时发生,而您的爬虫可以在预定时间帧出去并刚好获得该信息。以不同的间隔来处理RSS馈送内容数据库。可以将数据组织成在多个维度上堆叠并沿这些方向向外流动。在一个示例中,如图22中所示,每个相应的兴趣可以开始在搜索周围组织特定兴趣。例如,竞争空间中的产品搜索可以返回重要数据以进行研究和开发。法定相关搜索可以包括能够触发感兴趣的特定公开的附加搜索词语。可以通过用语言来再现每个附加词典、添加图像并添加声音模式来将其放大。
图19图示出示例性过程。可以将该示例性过程视为用于数据收集的更直接和特定的源。在方框1902中,识别感兴趣的事件或项目。在方框1904中,编译存储与事件或项目相关联的媒体的参考数据库。在方框1906中,监视或跟踪关联媒体的传播。在方框1908中分析关联媒体的冲击。
图20图示出可以被跟踪和/或分析的示例性媒体类型。媒体类型2002包括文本2004、图片或图像2006、视频2008以及音频2010。媒体类型2002表示可以识别的任何项目或事件。在一个实施例中,使用数字标签来跟踪媒体。
图21图示出示例性数据分析。数据分析2102包括用户简档建立2104、企业简档建立2106、包括数字标签的内容简档建立、全球日历2110以及成功引擎2112。其被设计成限定内容、定时和潜在的源并随后跟踪该事件的成功和内容扩散。
图22图示出用于公司的公共词语的开发。在一个实施例中,图22图示出参考数据库306的全域。组织2202可以促进用于产品、研究、品牌、法人兴趣、人力资源兴趣、财务跟踪及其他相关信息的公共列表以在搜索和兴趣的背景下搜集相关信息。组织2202可以包括母公司2206、公司2206、竞争公司2208、品牌2210、竞争品牌2212、产品2214、竞争产品2216或具有组织或组织竞争者的人。组织2202可以生成被分类且被上下文地组织的关键字或图像2218。这些关键字2218可以从语言的文本词典2220和图像词典2222生成。文本词典2220可以从API搜索调用2226以及数据分类、统计分析和算法2230接收附加所需数据2224。API搜索调用2226可以包括编索引网络数据和服务2228且数据分类、统计分析和算法2230可以包括与关键字2218相连的可视化2232。
在一个实施例中,一种方法通过接收用于访问网站的请求、检查来自网站的网上信息块、从网上信息块获得相关内容并在网上信息块存在时基于该相关内容来提供网站的目标版本、在没有网上信息块可用时检查IP地址并与联系人数据库相比较、在没有网上信息块可用时当IP地址位于联系人数据库中时从联系人数据库接收相关内容、监视用户和点击以在当先前没有网上信息块可用且在联系人数据库中不存在简档时生成将存储在网站网上信息块中的用户简档,此外其中来自用户简档的信息被存储在网站网上信息块中、以及利用该网上信息块来更新网站网上信息块来创建和利用用户简档。
在另一实施例中,通过接收主题、使用该主题来执行第一爬虫搜索以生成参考数据库、将该参考数据库与包括更多相关内容的比较数据库相比较来生成相关数据库,其中,比较数据库包括与主题、客户、事件相关联的内容、并根据参考数据库与比较数据库的比较来生成相关数据库,其中,该生成包括基于与比较数据库的比较的参考数据库的精选。
在另一实施例中,通过识别要跟踪的媒体、将所识别媒体存储在参考数据库中、将公共源与存储媒体相比较、基于该比较来识别包括所存储媒体的位置以及分析该位置以确定该位置和所存储媒体的成功来确定用于媒体的冲击。
在另一实施例中,通过使用第一爬虫从网络创建参考数据库、用图像、标记、文本、引用或上下文来创建比较参考数据库、分析比较参考数据库和一般参考数据库、基于该分析来识别相关数据、使用第二爬虫来确定用于社会联系人数据库的相关数据的源、使用第三爬虫来从社会联系人数据库搜索关于每个源的信息、基于用第三爬虫的搜索来确定用于每个源的社会价值或影响以及将用于每个源的社会价值或影响添加到媒体置入数据库来确定用于源的社会冲击。
可以在信号承载介质、诸如存储器的计算机可读介质中对上述系统和过程进行编码、在诸如一个或多个集成电路的设备、一个或多个处理器内进行编程或由控制器或计算机来处理。可以在计算机系统中分析该数据并用来创建谱。如果用软件来执行该方法,则软件可以存在于驻留于或对接至与传送机通信的存储设备、同步器、通信接口或非易失性或易失性存储器的存储器中。电路或电子设备被设计成将数据发送至另一位置。该存储器可以包括用于实现逻辑功能的可执行指令的有序列表。可以通过光学电路、数字电路、通过源代码、通过模拟电路、通过诸如模拟电、音频或视频信号的模拟源或组合来实现所述的逻辑功能或任何系统元件。可以在任何计算机可读或信号承载介质中体现软件以供指令可执行系统、装置或设备使用或与之相结合。此类系统可以包括基于计算机的系统、包含处理器的系统或可以选择性地从也可以执行指令的指令可执行系统、装置或设备获取指令的另一系统。
“计算机可读介质”、“机器可读介质”、“传播信号”介质和/或“信号承载介质”可以包括包含存储、传送、传播或传输软件以供指令可执行系统、装置或设备使用或与之相结合的任何设备。机器可读介质可以选择性地是但不限于电子、磁性、光学、电磁、红外或半导体系统、装置、设备或传播介质。机器可读介质的示例的非穷举列表将包括:具有一个或多个导线的电连接“电子”、便携式磁或光盘、诸如随机存取存储器“RAM”、只读存储器“ROM”、可擦可编程序只读存储器(EPROM或闪速存储器)的易失性存储器或光纤。机器可读介质还可以包括在其上面印刷了软件的有形介质,因为可以将软件以电子方式存储为图像或采取另一格式(例如通过光学扫描)、然后进行编译和/或解释或以其他方式处理。然后可以将已处理介质存储在计算机和/或机器存储器中。
本文所述的实施例的说明意图提供各种实施例的结构的一般理解。该说明并不意图充当利用本文所述结构或方法的装置和系统的所有元件和特征的完整描述。在仔细阅读本公开时,本领域的技术人员可以清楚许多其他实施例。可以利用并从本公开导出其他实施例,使得在不脱离本公开的范围的情况下可以进行结构和逻辑替代和修改。另外,该说明仅仅是代表性的且可以不按比例描绘。可以将说明内的某些比例放大,同时可以使其他比例最小化。因此,应将本公开和图视为说明性而非限制性的。
仅仅为了方便起见且在并不意图使本申请的范围自动地局限于任何特定发明或发明概念的情况下,在本文中可以单独地和/或共同地用术语“发明”来参考本公开的一个或多个实施例。此外,虽然在本文中已说明并描述了特定实施例,但应认识到的是被设计成实现相同或类似目的的任何后续布置可以代替所示的特定实施例。本公开意图覆盖各种实施例的任何和所有后续修改或变化。在仔细阅读以上描述时,本领域的技术人员将清楚以上实施例的组合以及在本文中未具体描述的其他实施例。
应将上述公开的主题视为说明性而非限制性的,并且所附权利要求意图覆盖所有此类修改、增强及其他实施例,其落在本发明的真实精神和范围内。因此,在法律允许的最大程度上,应由以下权利要求及其等价物的最广泛可允许解释来确定本发明,并且其不应受前述详细描述的约束或限制。虽然已描述了本发明的各种实施例,但本领域的技术人员将清楚的是在本发明的范围内可以有更多的实施例和实施方式。因此,除了按照所附权利要求及其等价物之外,本发明不受限制。

Claims (27)

1.一种用于确定源的社会冲击的方法,其包括:
使用第一爬虫来从网络创建参考数据库;
用图像、标记、文本、引用或上下文来创建比较参考数据库;
分析所述比较参考数据库和所述参考数据库;
基于所述分析来识别相关数据;
使用第二爬虫来确定用于社会联系人数据库的相关数据的源;
使用第三爬虫来从社会联系人数据库搜索关于所述每个源的信息;
基于用第三爬虫的搜索来确定用于所述每个源的社会价值;以及
将用于所述每个源的社会价值添加到媒体置入数据库。
2.根据权利要求1所述的方法,还包括利用所述媒体置入数据库来追踪具有较高冲击的站点。
3.根据权利要求2所述的方法,其中,由所述源的流行性来确定所述冲击。
4.根据权利要求3所述的方法,其中,所述流行性包括从搜索得到的多个搜索结果、多个提及或多个页面中的至少一个。
5.根据权利要求1所述的方法,其中,所述相关数据包括文本、图像、视频或音频中的至少一个。
6.根据权利要求1所述的方法,其中,所述社会价值包括投资回报(“ROI”)。
7.根据权利要求6所述的方法,其中,使用多个印象乘以影响因数来计算所述ROI。
8.根据权利要求1所述的方法,其中,所述社会价值包括将正面提及除以总提及的情感计算。
9.根据权利要求1所述的方法,其中,所述源包括要分析的事件,其中,所述事件包括产品、展示、新闻稿、文章或网页中的至少一个。
10.根据权利要求1所述的方法,其中,所述参考数据库包括要监视的元素,此外,其中,所述元素包括词语、短语、图像、音频或其他目标监视资产中的至少一个作为活动的一部分。
11.一种具有存储在其中的数据的非临时计算机可读存储介质,所述数据表示可由已编程处理器执行以便生成相关数据库的指令,所述存储介质包括可操作用于以下各项的指令:
接收主题;
使用所述主题来执行第一爬虫搜索以生成参考数据库;
将所述参考数据库与包括更多相关内容的比较数据库相比较,其中,所述比较数据库包括与所述主题、客户、事件相关联的内容;
根据所述参考数据库与所述比较数据库的比较来生成相关数据库,其中,所述生成包括基于与所述比较数据库的比较进行的参考数据库的精选。
12.根据权利要求11所述的计算机可读存储介质,还包括;
通过RSS馈送内容来收集数据以便生成所述参考数据库。
13.根据权利要求11所述的计算机可读存储介质,还包括生成联系人关系管理数据库。
14.一种用于确定来自媒体的冲击的方法,其包括:
识别要跟踪的所述媒体;
将所识别媒体存储在参考数据库中;
将公共源与所述存储媒体相比较;
基于所述比较来识别包括所存储媒体的位置;以及
分析所述位置以确定位置和所存储媒体的成功。
15.根据权利要求14所述的方法,其中,要跟踪的媒体包括与事件或产品相关联的媒体。
16.根据权利要求14所述的方法,其中,所述公共源和位置包括可通过因特网获得的数据或页面。
17.根据权利要求14所述的方法,其中,所述成功包括ROI,或者基于浏览次数的分析。
18.根据权利要求14所述的方法,其中,所述成功包括所述位置是网页时的页面浏览次数。
19.根据权利要求14所述的方法,还包括生成提供印象或网络业务的视觉显示的仪表板可视化。
20.根据权利要求14所述的方法,还包括生成联系人关系管理数据库。
21.一种具有存储在其中的数据的非临时计算机可读存储介质,所述数据表示可由已编程处理器执行以便生成目标数据库的指令,所述存储介质包括可操作用于以下各项的指令:
接收用于访问网站的请求;
识别所述用于访问的请求的源;
监视和跟踪来自所述源的请求和行为以获得关于所述源的变量;
将用于所述源的变量添加至所述目标数据库;
利用用于所述源的目标数据库中的存储变量响应于来自所述源的用于特定站点的未来请求而提供目标站点,其中,所述目标站点是基于用于源的所述变量修整的特定站点的修改版本。
22.根据权利要求21所述的计算机可读存储介质,其中,基于网上信息块或IP地址来识别所述源。
23.根据权利要求21所述的计算机可读存储介质,其中,用于所述源的变量包括所述源在其中操作的企业类型,此外,其中,用用于所述企业类型的规则基于特定站点的比较来对目标站点进行自定义。
24.根据权利要求21所述的计算机可读存储介质,其中,用于所述源的所述变量包括来自包括博客或社会网络站点的公共网站的信息。
25.一种用于创建和利用用户简档的方法,其包括:
接收用于访问网站的请求;
检查来自所述网站的网上信息块;
从网上信息块获得相关内容并在网上信息块存在时基于所述相关内容来提供网站的目标版本;
当没有网上信息块可用时检查IP地址并与联系人数据库相比较;
当没有网上信息块可用时,当IP地址位于联系人数据库中时从所述联系人数据库接收相关内容;
监视用户和点击以在当先前没有网上信息块可用且在所述联系人数据库中不存在简档时生成将存储在网站网上信息块中的用户简档,此外其中来自所述用户简档的信息被存储在所述网站网上信息块中;以及
利用所述网上信息块来更新所述网站网上信息块。
26.根据权利要求25所述的方法,当所述IP地址不是位于所述联系人数据库中时且当没有网上信息块可用时,还将所述用户数据与参考数据库相比较以识别相关数据。
27.根据权利要求25所述的方法,其中,所述用户简档包括至少一个图像,并将所述图像与存储图像相比较以确定其是否匹配且是相关的。
CN2011800243987A 2010-05-16 2011-05-16 用于包括冲击分析和影响跟踪的数据收集、跟踪和分析 Pending CN102884530A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US34512710P 2010-05-16 2010-05-16
US61/345,127 2010-05-16
PCT/US2011/036641 WO2011146391A2 (en) 2010-05-16 2011-05-16 Data collection, tracking, and analysis for multiple media including impact analysis and influence tracking

Publications (1)

Publication Number Publication Date
CN102884530A true CN102884530A (zh) 2013-01-16

Family

ID=44912641

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011800243987A Pending CN102884530A (zh) 2010-05-16 2011-05-16 用于包括冲击分析和影响跟踪的数据收集、跟踪和分析

Country Status (5)

Country Link
US (1) US20110282860A1 (zh)
JP (1) JP5810452B2 (zh)
KR (1) KR20130083838A (zh)
CN (1) CN102884530A (zh)
WO (1) WO2011146391A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555454A (zh) * 2018-06-01 2019-12-10 国际商业机器公司 从上下文数据跟踪主题排名的演变
CN110889707A (zh) * 2018-09-10 2020-03-17 西门子股份公司 追踪产品部件的计算机实现方法、系统和计算机程序产品
CN112929235A (zh) * 2021-02-06 2021-06-08 珠海市鸿瑞信息技术股份有限公司 一种基于互联网的网络监测系统

Families Citing this family (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11409825B2 (en) 2009-12-18 2022-08-09 Graphika Technologies, Inc. Methods and systems for identifying markers of coordinated activity in social media movements
US10324598B2 (en) 2009-12-18 2019-06-18 Graphika, Inc. System and method for a search engine content filter
US8762417B2 (en) * 2010-05-04 2014-06-24 International Business Machines Corporation Event impact analysis
US20120130940A1 (en) * 2010-11-18 2012-05-24 Wal-Mart Stores, Inc. Real-time analytics of streaming data
US9721229B1 (en) * 2010-12-30 2017-08-01 United Services Automobile Association (Usaa) Systems and methods for monitored social media participation
US9940672B2 (en) 2011-03-22 2018-04-10 Isentium, Llc System for generating data from social media messages for the real-time evaluation of publicly traded assets
US8645353B2 (en) * 2011-06-23 2014-02-04 Microsoft Corporation Anchor image identification for vertical video search
US8954449B2 (en) * 2011-07-12 2015-02-10 Salesforce.Com, Inc. Method and system for determining a user's brand influence
US9390147B2 (en) * 2011-09-23 2016-07-12 Red Lambda, Inc. System and method for storing stream data in distributed relational tables with data provenance
IL216057A (en) * 2011-10-31 2017-04-30 Verint Systems Ltd System and method for intercepting IP traffic by image processing
KR20130062433A (ko) * 2011-11-18 2013-06-13 고려대학교 산학협력단 소셜 네트워크를 이용한 사용자 요구사항 추출방법
US9081777B1 (en) * 2011-11-22 2015-07-14 CMN, Inc. Systems and methods for searching for media content
US9081468B2 (en) * 2011-11-23 2015-07-14 Offerpop Corporation Integrated user participation profiles
US8572107B2 (en) * 2011-12-09 2013-10-29 International Business Machines Corporation Identifying inconsistencies in object similarities from multiple information sources
US8868558B2 (en) * 2011-12-19 2014-10-21 Yahoo! Inc. Quote-based search
US9218629B2 (en) * 2012-01-20 2015-12-22 Blackberry Limited Prioritizing and providing information about user contacts
US9646095B1 (en) 2012-03-01 2017-05-09 Pathmatics, Inc. Systems and methods for generating and maintaining internet user profile data
US9069880B2 (en) * 2012-03-16 2015-06-30 Microsoft Technology Licensing, Llc Prediction and isolation of patterns across datasets
US9268750B2 (en) 2012-04-04 2016-02-23 Offerpop Corporation Shared link tracking in online social networking systems
WO2013166073A2 (en) * 2012-04-30 2013-11-07 Ubervu Ltd. Methods and systems useful for identifying the most influent social media users in query-based social data streams
WO2013166076A1 (en) 2012-04-30 2013-11-07 Ubervu Ltd. Insights detection for query-based social data stream
US20130297778A1 (en) 2012-05-02 2013-11-07 Google Inc. System for centralized analytics tracking via server-side sessionization
US10304036B2 (en) * 2012-05-07 2019-05-28 Nasdaq, Inc. Social media profiling for one or more authors using one or more social media platforms
US9418389B2 (en) 2012-05-07 2016-08-16 Nasdaq, Inc. Social intelligence architecture using social media message queues
WO2014031616A1 (en) * 2012-08-22 2014-02-27 Bitvore Corp. Enterprise data processing
US9594823B2 (en) * 2012-08-22 2017-03-14 Bitvore Corp. Data relationships storage platform
IL222743A (en) 2012-10-29 2017-03-30 Verint Systems Ltd A system and method for identifying the connections of a target user on a social network
CN103810202B (zh) * 2012-11-13 2016-03-30 腾讯科技(深圳)有限公司 数据收集方法及数据收集系统
US10679259B2 (en) * 2012-11-27 2020-06-09 Synqy Corporation Method and system for dynamic online digital brand assets
US9141867B1 (en) * 2012-12-06 2015-09-22 Amazon Technologies, Inc. Determining word segment boundaries
WO2014123929A1 (en) * 2013-02-05 2014-08-14 Morningside Analytics, Llc System and method for classifying a contagious phenomenon propagating on a network
US9940605B2 (en) 2013-02-05 2018-04-10 Facebook, Inc. Inferring web preferences from mobile
US9154838B2 (en) * 2013-03-14 2015-10-06 Universal Electronics Inc. System and method for identifying social media influencers
US9706008B2 (en) * 2013-03-15 2017-07-11 Excalibur Ip, Llc Method and system for efficient matching of user profiles with audience segments
WO2014165601A1 (en) * 2013-04-02 2014-10-09 Orbis Technologies, Inc. Data center analytics and dashboard
US20140351005A1 (en) * 2013-05-24 2014-11-27 Hitachi, Ltd. Data Collection Method and Apparatus
WO2015037499A1 (ja) * 2013-09-13 2015-03-19 株式会社Ubic 行動解析システム、行動解析方法および行動解析プログラム
US9589024B2 (en) 2013-09-27 2017-03-07 Intel Corporation Mechanism for facilitating dynamic and proactive data management for computing devices
US20150302478A1 (en) * 2014-02-08 2015-10-22 DigitalMR International Limited Integrated System for Brand Ambassador Programmes & Co-creation
US10437912B2 (en) 2014-02-28 2019-10-08 International Business Machines Corporation Sorting and displaying documents according to sentiment level in an online community
US20150277687A1 (en) * 2014-03-28 2015-10-01 An-Sheng JHANG System and method for manipulating and presenting information
US10949753B2 (en) 2014-04-03 2021-03-16 Adobe Inc. Causal modeling and attribution
US9711146B1 (en) 2014-06-05 2017-07-18 ProSports Technologies, LLC Wireless system for social media management
US9343066B1 (en) 2014-07-11 2016-05-17 ProSports Technologies, LLC Social network system
JP6592237B2 (ja) * 2014-10-10 2019-10-16 Jcc株式会社 情報取得サーバー、情報取得方法、及び情報取得配信システム
CN104376406B (zh) * 2014-11-05 2019-04-16 上海计算机软件技术开发中心 一种基于大数据的企业创新资源管理与分析方法
US9223881B1 (en) * 2014-11-13 2015-12-29 Quotabelle, Inc. Quotation management platform
US11151601B1 (en) * 2014-12-10 2021-10-19 Pathmatics, Inc. Systems and methods for event detection using web-based advertisement data
US10311329B2 (en) * 2015-01-30 2019-06-04 International Business Machines Corporation Social connection via real-time image comparison
US10565601B2 (en) * 2015-02-27 2020-02-18 The Nielsen Company (Us), Llc Methods and apparatus to identify non-traditional asset-bundles for purchasing groups using social media
US10061977B1 (en) 2015-04-20 2018-08-28 Snap Inc. Determining a mood for a group
US10210143B2 (en) 2015-05-05 2019-02-19 International Business Machines Corporation Analyzing a click path in a spherical landscape viewport
US9489401B1 (en) * 2015-06-16 2016-11-08 My EyeSpy PTY Ltd. Methods and systems for object recognition
SG10201912947XA (en) 2015-10-21 2020-02-27 15 Seconds Of Fame Inc Methods and apparatus for false positive minimization in facial recognition applications
US20170154314A1 (en) * 2015-11-30 2017-06-01 FAMA Technologies, Inc. System for searching and correlating online activity with individual classification factors
US10467888B2 (en) * 2015-12-18 2019-11-05 International Business Machines Corporation System and method for dynamically adjusting an emergency coordination simulation system
US20170262869A1 (en) * 2016-03-10 2017-09-14 International Business Machines Corporation Measuring social media impact for brands
US20170308798A1 (en) * 2016-04-22 2017-10-26 FiscalNote, Inc. Systems and Methods for Predicting Policy Adoption
US20180025389A1 (en) * 2016-07-21 2018-01-25 Facebook, Inc. Determining an efficient bid amount for each impression opportunity for a content item to be presented to a viewing user of an online system
US10922701B2 (en) * 2016-07-28 2021-02-16 Mastercard International Incorporated Systems and methods for characterizing geographic regions
US10169312B2 (en) * 2017-03-08 2019-01-01 Salesforce.Com, Inc. System and method in a social networking system for displaying updates in an information feed
WO2018187448A1 (en) * 2017-04-07 2018-10-11 Kimberly-Clark Worldwide, Inc. Methods and systems for allocating resources in response to social media conversations
US11182825B2 (en) 2017-04-21 2021-11-23 International Business Machines Corporation Processing image using narrowed search space based on textual context to detect items in the image
US11200633B2 (en) * 2017-08-01 2021-12-14 Datalogic IP Tech, S.r.l. Systems and methods for watermarking digital images
US10937071B2 (en) 2018-02-01 2021-03-02 Givewith LLC Social platform promotion system and method
SG11202008136SA (en) * 2018-03-03 2020-09-29 Financial & Risk Organisation Ltd System and methods for generating an enhanced output of relevant content to facilitate content analysis
US10936856B2 (en) 2018-08-31 2021-03-02 15 Seconds of Fame, Inc. Methods and apparatus for reducing false positives in facial recognition
US11361076B2 (en) * 2018-10-26 2022-06-14 ThreatWatch Inc. Vulnerability-detection crawler
MY195007A (en) * 2018-12-31 2022-12-30 Mimos Berhad A system and method for impact analysis of change request that affects database structure through classificiation and keyword similarity analysis
US11010596B2 (en) 2019-03-07 2021-05-18 15 Seconds of Fame, Inc. Apparatus and methods for facial recognition systems to identify proximity-based connections
US11341351B2 (en) 2020-01-03 2022-05-24 15 Seconds of Fame, Inc. Methods and apparatus for facial recognition on a user device

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7236969B1 (en) * 1999-07-08 2007-06-26 Nortel Networks Limited Associative search engine
JP5072160B2 (ja) * 2000-01-12 2012-11-14 ネットレイティングス・インコーポレーティッド ワールドワイドウェブのディジタルコンテントの普及を見積もるシステム及び方法
US8218829B2 (en) * 2001-08-20 2012-07-10 Polycom, Inc. System and method for using biometrics technology in conferencing
JP4191559B2 (ja) * 2003-08-15 2008-12-03 日本電信電話株式会社 インターネット上の情報伝播測定システムおよび方法
US7263529B2 (en) * 2003-08-29 2007-08-28 Pitney Bowes Inc. Method and system for creating and maintaining a database of user profiles and a related value rating database for information sources and for generating a list of information sources having a high estimated value
WO2005057358A2 (en) * 2003-12-04 2005-06-23 Perfect Market Technologies, Inc. Search engine that dynamically generates search listings
US7975000B2 (en) * 2005-01-27 2011-07-05 Fmr Llc A/B testing of a webpage
JP2006338086A (ja) * 2005-05-31 2006-12-14 Nomura Research Institute Ltd 話題規模管理装置
JP4451354B2 (ja) * 2005-06-30 2010-04-14 株式会社野村総合研究所 話題規模管理装置
JP4621118B2 (ja) * 2005-11-10 2011-01-26 パナソニック株式会社 コンテンツ関連情報取得装置
JP4970919B2 (ja) * 2006-12-08 2012-07-11 富士通株式会社 閲覧対象情報の評価システム、方法、およびプログラム
KR100892845B1 (ko) * 2007-03-29 2009-04-10 엔에이치엔(주) 노출용 광고 정보를 제공하는 방법 및 시스템
JP5206686B2 (ja) * 2007-10-18 2013-06-12 日本電気株式会社 情報影響力評価方法、情報影響力評価システム及び情報影響力評価用プログラム
JP2009116457A (ja) * 2007-11-02 2009-05-28 Intec Systems Institute Inc インターネットサイト情報分析方法と装置
US20090216775A1 (en) * 2008-02-22 2009-08-27 Marc Gregory Ratliff Platform for real-time tracking and analysis
JP2009211127A (ja) * 2008-02-29 2009-09-17 Csk-Is:Kk 情報分析装置及び情報分析プログラム
KR100843544B1 (ko) * 2008-03-24 2008-07-04 방용정 웹 사이트의 접속자별로 접속 통계를 생성하는 방법
US8406531B2 (en) * 2008-05-15 2013-03-26 Yahoo! Inc. Data access based on content of image recorded by a mobile device
JP5258532B2 (ja) * 2008-06-10 2013-08-07 ヤフー株式会社 評判指数を出力する方法及び評判指数出力装置
US8214346B2 (en) * 2008-06-27 2012-07-03 Cbs Interactive Inc. Personalization engine for classifying unstructured documents
JP5180743B2 (ja) * 2008-09-03 2013-04-10 ニフティ株式会社 ブランド分析方法及び装置
US20110282739A1 (en) * 2010-05-11 2011-11-17 Alex Mashinsky Method and System for Optimizing Advertising Conversion

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555454A (zh) * 2018-06-01 2019-12-10 国际商业机器公司 从上下文数据跟踪主题排名的演变
CN110555454B (zh) * 2018-06-01 2023-07-25 国际商业机器公司 用于跟踪网络中的主题随时间的演变的方法、系统和介质
CN110889707A (zh) * 2018-09-10 2020-03-17 西门子股份公司 追踪产品部件的计算机实现方法、系统和计算机程序产品
CN110889707B (zh) * 2018-09-10 2023-11-28 西门子股份公司 追踪产品部件的计算机实现方法、系统和计算机程序产品
CN112929235A (zh) * 2021-02-06 2021-06-08 珠海市鸿瑞信息技术股份有限公司 一种基于互联网的网络监测系统

Also Published As

Publication number Publication date
JP5810452B2 (ja) 2015-11-11
WO2011146391A3 (en) 2012-02-02
WO2011146391A2 (en) 2011-11-24
US20110282860A1 (en) 2011-11-17
JP2013526747A (ja) 2013-06-24
KR20130083838A (ko) 2013-07-23

Similar Documents

Publication Publication Date Title
CN102884530A (zh) 用于包括冲击分析和影响跟踪的数据收集、跟踪和分析
Zhang et al. Predicting the helpfulness of online product reviews: A multilingual approach
US11204972B2 (en) Comprehensive search engine scoring and modeling of user relevance
Kimble et al. Big data and business intelligence: Debunking the myths
US11157926B2 (en) Digital content prioritization to accelerate hyper-targeting
Ahlemeyer-Stubbe et al. A practical guide to data mining for business and industry
WO2017190610A1 (zh) 目标用户定向方法、装置和计算机存储介质
Kim et al. Why am I satisfied? See my reviews–Price and location matter in the restaurant industry
US20210406685A1 (en) Artificial intelligence for keyword recommendation
CN103733217A (zh) 用图说明跨渠道转化路径
CN102541971A (zh) 将登广告者目标映射到关键字
CN103597509A (zh) 利用用户交互分组聚合转化路径
WO2008144444A1 (en) Ranking online advertisements using product and seller reputation
CN102737333A (zh) 用于计算用户和要约到微小细分的匹配的顺序引擎
CN106062743A (zh) 用于关键字建议的系统和方法
CA2892169A1 (en) Ad-words optimization based on performance across multiple channels
Kelly Assessment of digitized library and archives materials: A literature review
TW201528181A (zh) 搜尋結果標定系統與方法
Hoffmann et al. The market of disinformation
CN110637317A (zh) 用于在数字通信网络上跨多个设备建立数字接触点的分布式节点群集
Moniz Inferring employees’ social media perceptions of corporate culture and the link to firm value
König et al. Party ideology and legislative agendas: Estimating contextual policy positions for the study of EU decision-making
Li et al. Do online reviews truly matter? A study of the characteristics of consumers involved in different online review scenarios
Jin et al. Cryptoeconomics: Data application for token sales analysis
Upreti et al. Online content match-making in B2B markets: Application of neural content modeling

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130116