CN117255993A - 用于检测内容消费激增的机器学习技术 - Google Patents
用于检测内容消费激增的机器学习技术 Download PDFInfo
- Publication number
- CN117255993A CN117255993A CN202280031706.7A CN202280031706A CN117255993A CN 117255993 A CN117255993 A CN 117255993A CN 202280031706 A CN202280031706 A CN 202280031706A CN 117255993 A CN117255993 A CN 117255993A
- Authority
- CN
- China
- Prior art keywords
- ccm
- data
- score
- user
- identifying
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 194
- 238000010801 machine learning Methods 0.000 title claims description 85
- 230000008520 organization Effects 0.000 claims abstract description 49
- 230000008859 change Effects 0.000 claims abstract description 38
- 230000006870 function Effects 0.000 claims description 30
- 230000009471 action Effects 0.000 claims description 24
- 230000007423 decrease Effects 0.000 claims description 22
- 230000000694 effects Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 15
- 238000013507 mapping Methods 0.000 claims description 6
- 230000003993 interaction Effects 0.000 abstract description 26
- 239000013598 vector Substances 0.000 description 92
- 230000015654 memory Effects 0.000 description 54
- 238000004891 communication Methods 0.000 description 49
- 238000003860 storage Methods 0.000 description 40
- 238000012549 training Methods 0.000 description 40
- 238000004422 calculation algorithm Methods 0.000 description 39
- 230000008569 process Effects 0.000 description 36
- 238000012545 processing Methods 0.000 description 23
- 238000005516 engineering process Methods 0.000 description 22
- 238000001514 detection method Methods 0.000 description 20
- 238000013528 artificial neural network Methods 0.000 description 18
- 230000004044 response Effects 0.000 description 17
- 235000014510 cooky Nutrition 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 15
- 230000001413 cellular effect Effects 0.000 description 13
- 238000003058 natural language processing Methods 0.000 description 13
- 238000013473 artificial intelligence Methods 0.000 description 12
- 230000033001 locomotion Effects 0.000 description 11
- 230000001276 controlling effect Effects 0.000 description 9
- 210000002569 neuron Anatomy 0.000 description 9
- 230000002093 peripheral effect Effects 0.000 description 9
- 239000002131 composite material Substances 0.000 description 8
- 230000006399 behavior Effects 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 7
- 238000007726 management method Methods 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 238000013515 script Methods 0.000 description 7
- 239000007787 solid Substances 0.000 description 7
- 102100035353 Cyclin-dependent kinase 2-associated protein 1 Human genes 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 238000011960 computer-aided design Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 230000003442 weekly effect Effects 0.000 description 6
- 230000001133 acceleration Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 230000005291 magnetic effect Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 239000010979 ruby Substances 0.000 description 4
- 229910001750 ruby Inorganic materials 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 210000004556 brain Anatomy 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013145 classification model Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000004424 eye movement Effects 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 230000002085 persistent effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- IRLPACMLTUPBCL-KQYNXXCUSA-N 5'-adenylyl sulfate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OS(O)(=O)=O)[C@@H](O)[C@H]1O IRLPACMLTUPBCL-KQYNXXCUSA-N 0.000 description 2
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical group [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000011982 device technology Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 239000000976 ink Substances 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 229910052744 lithium Inorganic materials 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 240000001436 Antirrhinum majus Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000408659 Darpa Species 0.000 description 1
- 241000086550 Dinosauria Species 0.000 description 1
- 241000592183 Eidolon Species 0.000 description 1
- 235000008694 Humulus lupulus Nutrition 0.000 description 1
- HBBGRARXTFLTSG-UHFFFAOYSA-N Lithium ion Chemical compound [Li+] HBBGRARXTFLTSG-UHFFFAOYSA-N 0.000 description 1
- 101100408383 Mus musculus Piwil1 gene Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000000078 claw Anatomy 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013503 de-identification Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001152 differential interference contrast microscopy Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 229920001746 electroactive polymer Polymers 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000005530 etching Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229910001416 lithium ion Inorganic materials 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001012 protector Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- APTZNLHMIGJTEW-UHFFFAOYSA-N pyraflufen-ethyl Chemical compound C1=C(Cl)C(OCC(=O)OCC)=CC(C=2C(=C(OC(F)F)N(C)N=2)Cl)=C1F APTZNLHMIGJTEW-UHFFFAOYSA-N 0.000 description 1
- ZLIBICFPKPWGIZ-UHFFFAOYSA-N pyrimethanil Chemical compound CC1=CC(C)=NC(NC=2C=CC=CC=2)=N1 ZLIBICFPKPWGIZ-UHFFFAOYSA-N 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 229910001285 shape-memory alloy Inorganic materials 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 210000000225 synapse Anatomy 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000010809 targeting technique Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/231—Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/104—Peer-to-peer [P2P] networks
- H04L67/1044—Group management mechanisms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/14—Session management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/251—Learning process for intelligent management, e.g. learning user preferences for recommending movies
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Signal Processing (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Computer Networks & Wireless Communication (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Multimedia (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
Abstract
本公开描述了一种内容消费监测器(CCM),其基于内容消费评分的变化来确定内容消费的激增。所述CCM基于由来自组织(org)和/或域的不同装置/用户生成的会话事件、由所述org/域生成的事件的数量、由所述事件所指示的内容和/或与所述内容的用户交互、所述内容与一个或多个主题的相关性评分和/或其它标准来确定所述域和/或org的所述内容消费评分。当所述消费评分达到阈值时和/或在某个时间段内,所述CCM检测对所述域/org的主题的消费或兴趣的激增。所述CCM可以基于相关性、事件的数量和/或用户的数量在不同时间段内的变化来调整所述消费评分。
Description
相关申请
本申请要求2021年3月1日提交的第17/189,073号美国申请的优先权,第17/189,073号美国申请是2015年12月28日提交的第14/981,529号美国申请的部分继续(CIP)申请,第14/981,529号美国申请是2014年9月26日提交的第14/498,056号美国申请(即现在的第9,940,634号美国专利)的CIP,这些申请中的每个申请的内容在此通过引用整体并入本文。
技术领域
本公开总体上涉及机器学习(ML)和人工智能(AI),并且具体地,涉及用于将网络地址与内容和/或信息对象的访问位置相关联的ML/AI技术。
背景技术
用户从随机的各种不同企业接收随机的各种不同信息。例如,用户可以接收促销宣传、广告、信息通知、事件通知等。用户可以通过例如在网站上注册以接收销售信息或其它宣传来请求这些信息中的一些信息。然而,用户对这些信息中的大部分几乎不感兴趣或完全不感兴趣。例如,用户可能接收到宣布每个即将到来的研讨会的电子邮件,而不管主题是什么。
用户也可能接收到未经请求的信息。例如,用户可以在网站上注册以下载关于特定主题的白皮书。然后,引导服务可能会将电子邮件地址出售给其它公司,这些公司会向用户发送未经请求的广告。用户最终会忽略大部分或所有这些电子邮件,因为大部分信息没有相关性或兴趣。可替代地,用户会将所有这些电子邮件定向到垃圾邮件文件夹中。被忽略和不相关的信息最终会浪费大量的计算和网络资源。
附图说明
图1描绘了示例的内容消费监测器(CCM)。图2更详细地描绘了CCM的示例。图3描绘了CCM标签的示例性操作。图4描绘了由CCM处理的示例性事件。图5描绘了示例性用户意图向量。图6描绘了用于细分用户的示例性过程。图7描绘了用于生成组织(org)意图向量的示例性过程。
图8描绘了示例性消费评分生成器。图9更详细地描绘了示例性消费评分生成器。图10描绘了用于标识消费评分激增的示例性过程。图11描绘了用于计算初始消费评分的示例性过程。图12描绘了用于基于历史基线事件调整初始消费评分的示例性过程。
图13描绘了用于将激增主题与联系人进行映射的示例性过程。图14描绘了计算内容意图的示例性内容消费监测器。图15描绘了用于基于内容意图调整消费评分的示例性过程。
图16描绘了适用于实践本文所讨论的各个方面的示例性计算系统。图17展示了适用于实践本文所讨论的各个方面的示例性神经网络。
具体实施方式
公司可以研究互联网上的主题,作为购买与主题相关的项目或服务的前奏。内容消费监测器(CCM)生成消费评分,该消费评分标识公司对不同主题的兴趣程度。CCM可以不仅标识对特定主题感兴趣的公司,还标识激增数据,该激增数据指示公司何时最容易接受关于不同主题的直接联系人。服务提供商和/或发布者可以使用激增数据来增加对所发布信息的兴趣。在一个实例中,服务提供商和/或发布者可以包括使用激增数据来提高广告转换率的广告商。
本公开描述了网络资源兴趣检测服务,并且具体地涉及在组织级别检测网络资源兴趣。机器学习(ML)分类系统使用各种ML技术来基于由来自不同组织(org)或以其它方式与不同组织相关联的用户所采取的动作来确定对特定网络资源(例如,网站、网页、网络应用程序等)的兴趣。实体预测器预测与不同网络地址(例如,IP地址)的实体关联,其中不同网络地址由一组获得的网络事件指示。主机名提取器从一组获得的网络事件中提取被访问信息对象的主机名。特征生成器基于所提取的主机名、被预测的实体和/或包含在所获得的网络事件中的其它信息来生成不同的特征。然后,这些特征被用于预测被预测实体对所访问的信息对象和/或主机名组织的兴趣水平。
CCM可以使用这些分类和/或预测来生成消费评分和/或激增评分/信号。通过更好地预测特定org的意图和/或兴趣水平,CCM可以生成比现有/常规解决方案更准确的意图数据。CCM通过生成更准确的消费评分和/或激增评分/信号来更高效地使用处理资源。CCM还可以在不使用个人身份信息(PII)、敏感数据和/或机密数据的情况下通过生成org的消费评分和/或激增评分/信号来提供更安全的网络分析,由此提高最终用户的信息安全性。
资源兴趣分类和预测和/或意图预测可以用于更高效地处理事件,更准确地计算消费评分,以及更准确地检测相关的激增,如组织(org)激增(也被称为“公司激增”等)。更准确的意图数据和消费评分允许第三方服务提供商通过提供更好地瞄准用户的手段来节省计算和网络资源,使得不想要的和看似随机的内容不会被分发给不想要此类内容的用户。这是一项技术进步,因为它通过减少生成和发送到最终用户装置的内容数量,节省了分发此内容的组织(org)的网络和计算资源。通过减少或消除使用资源来接收不想要的内容的需要,可以在终端用户装置处减少和/或保留网络资源,并且通过减少或消除实施垃圾邮件过滤器的需要和/或减少在分析和/或删除此类内容时要处理的数据量,可以在终端用户装置处减少和/或保留计算资源。这相当于机器学习和网络跟踪技术的技术领域的改进,并且也相当于计算系统和计算网络本身的功能的改进。
此外,由于分类和预测标识与特定网络地址相关联的特定org以及这些org感兴趣的信息对象,因此本文讨论的实施方案可以用于其它用例,例如网络故障排除、反垃圾邮件和反网络钓鱼技术(例如,用于电子邮件系统等)、网络安全威胁检测和跟踪、系统/网络监测和日志记录、网络资源分配和/或网络设备拓扑优化等。
1.机器学习方面
机器学习(ML)涉及使用示例(训练)数据和/或过去的经验对计算系统进行编程以优化性能标准。ML涉及使用算法来执行特定的任务,而不使用明确的指令来执行特定的任务,而是依赖于学习的模式和/或推理。ML使用统计学来建立数学模型(也被称为“ML模型”或简称为“模型”),以便基于样本数据(例如,训练数据)进行预测或决策。模型被定义为具有参数集合,并且学习是计算机程序的执行,用于使用训练数据或过去的经验来优化模型的参数。经训练的模型可以是基于输入数据集进行预测的预测性模型、从输入数据集获取知识的描述性模型,或者同时是预测性模型和描述性模型。一旦模型被学习(训练),它就可以被用来进行推断(例如,预测)。
ML算法对训练数据集执行训练过程,以估计底层ML模型。ML算法是从关于一些任务和一些性能计量/度量的经验中学习的计算机程序,ML模型是在用训练数据训练ML算法之后创建的对象或数据结构。换句话说,术语“ML模型”或“模型”可以描述用训练数据训练的ML算法的输出。在训练之后,ML模型可以用于对新数据集进行预测。另外地,在推断或预测生成期间,单独训练的AI/ML模型可以在AI/ML流水线中链接在一起。尽管术语“ML算法”是指与术语“ML模型”不同的概念,但是出于本公开的目的,这些术语可以互换使用。
ML技术通常落入以下学习问题类别的主要类型内:监督式学习、非监督式学习和强化学习。监督式学习是一种ML任务,其目的是考虑到所标记的数据集,学习从输入到输出的映射函数。监督式学习算法由包含输入和期望输出两者的数据集合构建模型。例如,监督式学习可以涉及学习函数(模型),该函数基于示例输入-输出对或包含训练实例集合的某种其它形式的标记训练数据将输入映射到输出。每个输入-输出对包含输入对象(例如,向量)和期望的输出对象或值(被称为“监控信号”)。监督式学习可以分组为分类算法、回归算法和基于实例的算法。
在ML的上下文中,分类是指用于确定各种数据点所属的种类的ML技术。此处,术语“种类(class或classes)”可以指类别,并且有时也被称为“目标”或“标记”。当输出被限制为有限的一组可定量属性时,使用分类。分类算法可以描述单独(数据)实例,其类别将使用特征向量来预测。作为示例,当实例包含文本集合(语料库)时,特征向量中的每个特征可以是特定单词在文本语料库中出现的频率。在ML分类中,标记被分配给实例,并且模型被训练以从训练实例中正确地预测预先分配的标记。用于分类的ML算法可以被称为“分类器”。分类器的实例包含线性分类器、k-最近邻(kNN)、决策树、随机森林、支持向量机(SVM)、贝叶斯分类器、卷积神经网络(CNN)等(应注意,这些算法中的一些算法也可以用于其它ML任务)。
在ML的上下文中,回归算法和/或回归分析是指用于估计因变量(通常被称为“结果变量”)与一个或多个自变量(通常被称为“预测值”、“协变量”或“特征”)之间的关系的一组统计过程。回归算法/模型的实例包含逻辑回归、线性回归、梯度下降(GD)、随机GD(SGD)等。
基于实例的学习(有时也被称为“基于记忆的学习”)在ML的上下文中是指一系列学习算法,这些算法不是执行显式概括,而是将新的问题实例与训练中看到的已经存储在存储器中的实例进行比较。基于实例的算法的示例包含k-最近邻等、决策树算法(例如,分类与回归树(CART)、迭代二分器3(ID3)、C4.5、卡方自动交互检测(CHAID)等)、模糊决策树(FDT)等、支持向量机(SVM)、贝叶斯算法(例如,贝叶斯网络(BN)、动态BN(DBN)、朴素贝叶斯等)、以及集成算法(例如,极端梯度提升、投票集成、自助聚集(“装袋”)、随机森林等)。
在ML的上下文中,“ML特征”(或简称为“特征”)是被观察现象的单独可测量性质或特性。特征通常使用数量/数字(例如,整数)、字符串、变量、序数、实数值和/或类别等来表示。另外地或可替代地,ML特征是基于可以定量和记录的可观察现象的单独变量,该单独变量可以是独立变量。ML模型使用一个或多个特征来进行预测或推断。在一些实施方案中,新特征可以衍生自旧特征。特征集合可以被称为“特征向量”。向量是被称为标量的一个或多个值的元组,并且特征向量可以包含一个或多个特征的元组。与这些向量相关联的向量空间通常被称为“特征空间”。为了减少特征空间的维数,可以采用许多维数减少技术。
非监督式学习是一种ML任务,旨在从未经标记的数据中学习描述隐藏结构的函数。非监督式学习算法由仅包含输入而不包含期望的输出标签的数据集合构建模型。非监督式学习算法用于发现数据中的结构,如数据点的分组或聚类。非监督式学习的一些示例是K均值聚类、主成分分析(PCA)和主题建模等。具体地,主题建模是一种非监督式机器学习技术,扫描一组信息对象(例如,文档、网页等),检测信息对象内的单词和短语模式,并且自动聚类最能表征一组信息对象的单词组和类似表达。半监督式学习算法从不完整的训练数据开发ML模型,其中一部分样本输入不包含标记。非监督式学习的示例是主题建模。主题建模涉及对单词进行计数和对相似的单词模式进行分组,以推断非结构化数据中的主题。通过检测如词频和词与词之间的距离等模式,主题模型将相似的反馈以及最常出现的词和表达聚集在一起。在此信息的情况下,可以快速推断出单独一组文本的主题。
强化学习(RL)是一种基于与环境互动的目标导向学习。在RL中,智能体的目标是通过基于试错过程与环境交互来优化长期目标。RL算法的示例包含马尔可夫决策过程(Markov decision process)、马尔可夫链、Q学习、多臂老虎机学习(multi-armed banditlearning)和深度RL。
人工神经网络或神经网络(NN)涵盖各种ML技术,其中连接的人工神经元或节点的集合(松散地)对生物脑中可以向其它动脉神经元或节点传输信号的神经元进行建模,其中人工神经元或节点之间的连接(或边缘)在生物脑的突触上(松散地)建模。人工神经元和边缘通常具有随着学习进行而调整的权重。权重增加或减少连接处的信号的强度。神经元可以具有阈值,使得仅当集合信号越过阈值时才发送信号。人造神经元可以被聚集或分组到一个或多个层中,其中不同的层可以对其输入执行不同的变换。信号从第一层(输入层)行进到最后一层(输出层),可能需要多次在各层跨越。NN通常用于监督式学习,但也可以用于非监督式学习。NN的实例包含深度NN(DNN)、前馈NN(FFN)、深度FNN(DFF)、卷积NN(CNN)、深度CNN(DCN)、去卷积NN(DNN)、深度信念NN、感知NN、递归NN(RNN)(例如,包含长短期记忆(LSTM)算法、门控递归单元(GRU)等)、深度堆叠网络(DSN)。
其中,ML可能需要获得和清理数据集、执行特征选择、选择ML算法、将数据集分成训练数据和测试数据、训练模型(例如,使用所选择的ML算法)、测试模型、优化或调整模型以及确定模型的度量。根据使用案例和/或所使用的实施方案,这些任务中的一些可以是任选的或省略的。ML算法接受参数和/或超参数(本文被统称为“训练参数”、“模型参数”,或本文被简称为“参数”),参数和/或超参数可用于控制训练过程和所得模型的某些性质。
参数是在训练期间学习的训练过程的特性或性质。单独实验的模型参数可能不同,并且可能取决于数据类型和正在执行的ML任务。超参数是训练过程的特性、性质或参数,其不能在训练过程期间学习,并且在训练发生之前设置。为参数和/或超参数选择的特定值影响训练速度、训练资源消耗和学习过程的质量。作为示例,用于主题分类/建模、自然语言处理(NLP)和/或自然语言理解(NLU)的模型参数可以包含词频、句子长度、每个句子的名词或动词分布、每个单词的特定字符n元语法的数量、词汇多样性、约束、权重等。超参数的示例可以包含模型大小(例如,根据存储空间或字节)、是否(以及多少)混洗训练数据、评估实例或时期的数量(例如,在训练数据上迭代或通过的数量)、学习速率(例如,算法达到(收敛到)最优权重的速度)、学习速率衰减(或权重衰减)、隐藏层的数量和大小、权重初始化方案、下降和梯度限幅阈值等。参数和/或超参数可以另外地或可替代地包含向量大小和/或词向量大小。
任何前述的ML技术,全部或部分,以及其变型和/或组合,可以用于本文所讨论的任何示例实施例。
2.内容消费监测器
图1描绘了内容消费监测器(CCM)100。CCM 100包括一个或多个物理和/或虚拟化的系统,该系统与服务提供商118通信并且监测用户对信息对象112(例如,第三方内容等)的访问。物理和/或虚拟化的系统包括在本地或跨越一个或多个地理位置分布的一个或多个逻辑或物理连接的服务器和/或数据存储装置。在一些实施方案中,CCM 100可以由云计算服务和/或数据中心中的机器集群提供(或操作)。在一些实施方案中,CCM 100可以是由内容递送网络(CDN)或边缘计算网络的各种服务器提供(或操作)的分布式应用。在其它实施方案中,其它实施方式也是可能的。
服务提供商118(也被称为“发布者”、“B2B发布者”等)包括由公司、企业和/或个体拥有和/或操作的一个或多个物理和/或虚拟化计算系统,其中所述公司、企业和/或个体想要向感兴趣的一组用户发送信息对象114,所述信息对象可以包括目标内容等。此组用户可替代地被称为“联系人节段124”。物理和/或虚拟化系统包括在本地或跨越一个或多个地理位置分布的一个或多个逻辑或物理连接的服务器和/或数据存储装置。通常,服务提供商118使用IP/网络资源向不同的用户/客户端装置提供信息对象,如电子文档、网页、表格、应用程序(例如,网络应用程序)、数据、服务、网络服务、媒体和/或内容。作为示例,服务提供商118可以提供搜索引擎服务、社交媒体/网络服务、内容(媒体)流服务、电子商务服务、区块链服务、通信服务、沉浸式游戏体验、和/或其它类似的服务。利用由服务提供商118提供的服务的用户/客户端装置可以被称为“订阅者”。尽管图1仅示出了单个服务提供商118,但是服务提供商118可以代表多个服务提供商118,所述多个服务提供商中的每个服务提供商可以具有它们自己的订阅用户。
在一个实例中,服务提供商118可以是销售电动汽车的公司。服务提供商118可以具有已经参加过之前的研讨会或者已经在服务提供商118的网站上注册的客户的电子邮件地址的联系人列表120。联系人列表120也可以由CCM标签110生成,这将在下文更详细地描述。服务提供商118还可以从由第三方引导服务、零售店和/或其它促销或销售点等或其任何组合提供的引导列表中生成联系人列表120。服务提供商118可能想要发送即将到来的电动汽车研讨会的电子邮件通知。服务提供商118想要增加研讨会出席者的数量。在另一示例中,服务提供商118可以是向他们的订阅者提供各种用户定向服务的平台或服务提供商,如销售支持、数字广告、内容/参与营销和营销自动化等。
信息对象112包括任何数据结构,数据结构包括或指示关于任何用户访问的任何主题的信息。信息对象112可以包括任何类型的信息对象(或信息对象的集合)。信息对象112可以包括电子文档、数据库对象、电子文件、资源和/或包括一个或多个数据元素的任何数据结构,数据元素中的每个数据元素可以包括一个或多个数据值和/或内容项目。
在一些实施方案中,信息对象112可以包括由不同服务提供商、企业和/或个体操作的一个或多个网络服务器和/或应用服务器提供(或服务)的网页。例如,信息对象112可以来自由在线零售商和批发商、在线报纸、大学、博客、市政当局、社交媒体网站或任何其它提供内容的实体操作的不同网站。另外地或可替代地,信息对象112还可以包括不直接从网站访问的信息。例如,用户可以在研讨会、零售店和其它事件中访问注册信息。信息对象112还可以包括由服务提供商118提供的内容。另外地,信息对象112可以与一个或多个主题102相关联。信息对象112的主题102可以指所述信息对象112的主体、含义和/或主题。
CCM 100可以使用主题分析模型/技术来标识或确定信息对象112的一个或多个主题102。主题分析(也被称为“主题检测”、“主题建模”或“主题提取”)指的是通过根据每个单独的信息对象112的主题(topic)或题目(theme)分配标签或类别来组织和理解大量文本数据集合的ML技术。主题模型是一种用于发现出现在信息对象集合112或其它文本集合中的主题102的统计模型。主题模型可以用于发现信息对象112或其它文本集合中隐藏的语义结构。在一个示例中,使用主题分类技术,其中主题分类模型在一组训练数据(例如,用标签/主题102标记的信息对象112)上被训练,然后在一组测试数据上被测试,以确定主题分类模型将数据分类到不同主题102中的效果。一旦被训练,主题分类模型被用于确定/预测各种信息对象112中的主题102。在另一个实例中,使用主题建模技术,其中主题建模模型自动分析信息对象112以确定一组文档的聚类单词。主题建模是一种非监督式ML技术,不需要使用训练数据进行训练。任何合适的主题分类、主题建模和/或NLP/NLU技术都可以用于主题分析,如本文所讨论的和/或在Yoav Goldberg,“自然语言处理中的神经网络方法(NeuralNetwork Methods in Natural Language Processing)”,《人类语言技术综合讲座(Synthesis Lectures on Human Language Technologies)》,第37讲,Morgan和Claypool(2017年4月17日)(下文称为“[Goldberg_NLP]”)中讨论的,所述文献特此通过引用整体并入本文。
与服务提供商118、内容节段124和CCM 100相关联的计算机和/或服务器可以通过互联网或任何其它有线或无线网络进行通信,其中网络包括局域网(LAN)、广域网(WAN)、无线网络、蜂窝网络、WiFi网络、个人局域网(例如,等)、数字用户线路(DSL)和/或有线网络等,和/或其任何组合。
一些信息对象112包含捕获网络会话事件108(或简称为“事件108”)并将其发送给CCM 100的CCM标签110。例如,CCM标签110可以包括添加到网站的网页上的JavaScript(或者网络应用程序等的单独组件)。网站将网页连同CCM标签110一起下载到用户计算机(例如,图2的计算机230)。CCM标签110(例如,当由用户计算机执行时)监测会话,并且将一些或所有捕获的会话事件108发送到CCM 100。
在一个实例中,CCM标签110可以截取或以其它方式获得由计算机230发送和/或发送到计算机230的HTTP消息,这些HTTP消息可以作为事件108提供给CCM 100。在此实例中,CCM标签110或CCM 100可以从HTTP报头的X-Forwarded-For(XFF)字段获得网络地址、从HTTP报头的日期字段获得HTTP消息的发送时间和日期、和/或获得包含在HTTP消息的HTTP报头的用户代理字段中的用户代理字符串。用户代理字符串可以指示发送装置(例如,计算机230)的操作系统(OS)类型/版本、发送装置(例如,计算机230)的系统信息、发送装置(例如,计算机230)的浏览器版本/类型、发送装置(例如,计算机230)的渲染引擎版本/类型、发送装置(例如,计算机230)的装置类型,以及其它信息。在另一个实例中,CCM标签110可以从计算机230得到通常不包含在HTTP报头中的各种信息,如时区信息、GPS坐标、计算机230的屏幕或显示分辨率、来自由计算机230操作的一个或多个应用程序的数据和/或其它类似信息。在各个实施方案中,CCM标签110可以基于所监测的会话来生成和发送事件108或消息。例如,当检测到各种事件/触发时,CCM标签110可以获得数据,并且可以发回信息(例如,在另外的HTTP消息中)。可以使用其它方法来获得或得到用户信息。
在一些实施方案中,包含CCM标签110的信息对象112可以由服务提供商118的集合来提供或托管,服务提供商118例如是著名的企业对企业(B2B)发行商、营销商、代理商、技术提供商、研究公司、活动公司和/或任何其它期望的实体/组织类型。服务提供商118的这个集合可以被称为“数据合作(data cooperative)”或“数据合作(data co-op)”。另外地或可替代地,事件108可以由与CCM 100分离的一个或多个其它数据跟踪实体收集,并且作为一个或多个数据集提供给CCM 100(例如,“批量”数据集等)。在一个实例中,CCM 100或其它数据跟踪实体可以实施一个或多个事件监听器(或事件处理程序)来检测事件108,并且响应于检测到事件108(图1中未示出)来执行某个动作,如本文所描述的任何动作/过程。事件处理程序或事件监听器是处置接收到的输入(例如,事件108)的软件元素/实体。
在此,“会话”可以指两个或更多个通信装置之间、计算机与用户之间、和/或两个或更多个远程装置/系统之间的临时和交互式信息交换。另外地或可替代地,“会话”可以指在一段时间内和/或关于任务的完成所采取的用户动作的测量单位(这些类型的会话也可以被称为“访问”)。在这些实施方案中,会话可以是基于用户活动的连续性的时间导向会话,或者是基于所请求和/或消费的信息对象链的连续性的导航导向会话。时间导向会话基于一组或预定义的用户不活动时段(被称为“不活动阈值”)。一旦达到此不活动时段,会话就结束(例如,假设用户已经离开网站或者完全停止使用浏览器/客户端)。在不活动阈值之后来自同一用户的另外的请求被认为是第二会话的一部分。导航导向会话基于用户在不同信息对象之间的移动,如通过使用相应的超链接在网站的不同网页之间导航。另外地或可替代地,会话可以是(或包括)预定义的会话,如数据库会话、工作单元、客户端或浏览器会话、服务器会话、远程会话(例如,远程桌面会话等)、网络会话、网页会话、HTTP会话、telnet远程登录会话、会话发起协议(SIP)会话、传输控制协议(TCP)会话(例如,TCP虚拟电路、TCP连接或已建立的TCP套接字)、用户数据报协议(UDP)会话、蜂窝网络会话和/或其它类型的会话。针对会话期间执行的一个或多个操作或动作引发或触发事件108。
单独事件108是由系统、装置和/或软件元素识别的动作或事件,其可以异步地源自外部环境。每个事件108可以是或包括来自底层框架的一条信息,和/或可以表示用于读取文件或网络流的数据的可用性。单独事件108标识或指示信息对象112和访问信息对象112的用户。例如,事件108可以包括到信息对象112的URL或链接,并且可以包括与访问所指示的信息对象112的用户相关联的标识符(ID),如与用户相关联的散列电子邮件地址或cookie标识符(ID)。事件108还可以标识与所指示的信息对象112相关联的访问活动。例如,事件108可以指示用户查看网页、下载电子文档、注册研讨会以及用户如何完成这些动作(例如,从搜索引擎引用、电子邮件中的链接、在网络浏览器的搜索栏中键入URL等)。另外地或可替代地,事件108可以标识与信息对象112的各种用户交互,例如主题消费、滚动速度、停留时间和/或其它用户交互,如本文所讨论的那些。在一个实例中,标签110可以收集关于访问用户的网络地址(例如,IP地址)、匿名cookie ID、用户何时访问或访问信息对象112的时间戳和/或与用户的计算装置相关联的地理位置信息的匿名信息。装置指纹识别可以用来跟踪用户。另外地或可替代地,可以排除装置指纹识别以保持用户匿名。另外地或可替代地,事件108可以是或包括数据库会话事件、工作单元事件、客户端或浏览器会话事件、服务器会话事件、远程会话事件(例如,远程桌面会话事件等)、网络会话事件、网页会话事件、HTTP会话事件、telnet远程登录会话事件、SIP会话事件、TCP会话事件、UDP会话事件、蜂窝网络事件和/或其它会话类型的其它事件。
CCM 100由事件108构建用户档案104。用户档案104可以包括将信息对象112与特定用户相关联的匿名标识符105。用户档案104还可以包括意图数据106。意图数据106包括或指示对用户兴趣的洞察,并且可以包括关于他们基于其内容消费采取某些行动的潜力的预测。意图数据106标识或指示由用户访问的信息对象112中的主题102。例如,意图数据106可以包括用户意图向量(例如,图2的用户意图向量245、图5的意图向量594等),用户意图向量标识或指示主题102并标识用户对主题102的兴趣水平。
这种用于意图数据106收集的方法使得用于测量内容消费的一致且稳定的历史基线成为可能。这个基线有效地跨越了网络,以比任何一个站点都大的指数规模递送。CCM100监测来自服务提供商118的集合(例如,前述数据合作)的内容消费行为,并且应用数据科学和/或ML技术来标识与历史基线相比的活动变化。作为示例,研究频率、参与深度和内容相关性都有助于检测org对主题102的兴趣。CCM 100可以采用NLP/NLU引擎,该引擎读取、解密和理解在周期性基础上(例如,每月、每周等)增长的意图主题102的分类中的内容。NLP/NLU引擎可以操作或执行先前所讨论的主题分析模型。
如先前所述,服务提供商118可能想要向对电动汽车感兴趣的用户的特定联系人节段124发送通知电动汽车研讨会的电子邮件。服务提供商118可以向CCM 100发送信息对象114,如前述电子邮件,CCM 100标识信息对象114中的主题102。CCM 100将内容主题102与意图数据106进行比较,标识指示对信息对象114感兴趣的用户档案104。然后,CCM 100向服务提供商118发送匿名联系人节段116,其包含与所标识的用户档案104相关联的匿名或假名标识符105。CCM 100包括与匿名器122相同或相似的匿名器或假名器,以匿名化或假名化用户标识符。
联系人列表120可以包括个人标识信息(PII)和/或个人数据,如电子邮件地址、姓名、电话号码或一些其它用户标识符或其任何组合。另外地或可替代地,联系人列表120可以包括敏感数据和/或机密信息。联系人列表120中的个人、敏感和/或机密数据被匿名器122匿名化或假名化或以其它方式去标识。
匿名器122可以使用任何数量的数据匿名化或假名化技术对任何个人、敏感和/或机密数据进行匿名化或假名化,技术包括例如数据加密、替换、混洗、数字和日期变化以及取消特定字段或数据集。数据加密是一种用加密数据替代个人/敏感/机密数据的匿名化或假名化技术。合适的散列算法可以用作匿名化或假名化技术。匿名化是一种从数据或数据集中去除个人、敏感和/或机密数据,使得由数据/数据集描述或指示的人或信息保持匿名的信息净化技术。假名化是一种数据管理和去标识过程,通过该过程,信息对象(例如,字段和/或记录、数据元素、文档等)内的个人、敏感和/或机密数据被一个或多个人工标识符或假名替代。在大多数假名化机制中,为每个被替代的数据项或被替代的数据项的集合提供单个假名,这使得数据更难标识,同时仍然适合于数据分析和数据处理。尽管“匿名化”和“假名化”指的是不同的概念,但是这些术语在本公开中可以互换使用。
服务提供商118将来自联系人列表120的匿名/假名标识符(例如,散列标识符)与匿名联系人节段116中的匿名标识符105进行比较。任何匹配的标识符都被标识为联系人节段124。服务提供商118标识联系人列表120中与联系人节段124相关联的未加密的电子邮件地址。服务提供商118将信息对象114发送到为联系人节段124标识的地址(例如,电子邮件地址)。例如,服务提供商118可以向联系人节段124发送通知电动汽车研讨会的电子邮件。
向联系人节段124发送信息对象114可以显著提升积极响应126的数量。例如,假设服务提供商118想要发送通知即将到来的研讨会早鸟特价的电子邮件。研讨会可能包含十个不同的主题,如电动汽车、环境问题、可再生能源等。过去,服务提供商118可能已经为每个单独轨道向联系人列表120中的每个人发送了十封不同的电子邮件。
服务提供商118现在可以仅将关于电动车轨道的电子邮件发送给在联系人节段124中标识的联系人。由于内容114现在针对的是对电动汽车感兴趣的用户,注册研讨会的电动汽车轨道的积极响应126的数量可以显著增加。
在另一个示例中,CCM 100可以提供本地广告活动或电子邮件细分。例如,CCM 100可以提供关于特定广告是否应当显示给特定用户的“是”或“否”选项。在此实例中,CCM 100可以使用散列数据,而无需重新标识用户,并且“是/否”动作建议可以切断去标识的散列值。
CCM 100可以重新激活服务提供商联系人列表120中的冷门联系人。CCM 100可以标识联系人列表120中当前正在访问其它信息对象112的用户,并且标识与信息对象112相关联的主题。通过监测对信息对象112的访问,CCM 100可以标识当前的用户兴趣,即使这些兴趣可能与服务提供商118当前提供的内容不一致。服务提供商118可以通过提供与信息对象112中标识的最相关主题更一致的内容114来重新吸引冷门联系人。
图2是更详细地解释了内容消费管理器的示意图。用户可以例如通过搜索引擎向计算机230中输入搜索查询232。计算机230可以包括任何通信和/或处理器电路系统,通信和/或处理器电路系统包括但不限于台式计算机、工作站、膝上型计算机、智能手机、平板计算机、可穿戴装置、服务器、智能设备、网络设备等或其任何组合。用户可以为组织Y(org_Y)工作。例如,用户可以具有相关联的电子邮件地址:user@org_y.com。
响应于搜索查询232,搜索引擎可以分别在网站1和网站2上显示对信息对象112A和112B的链接或其它引用(应注意,网站1和网站2也可以是相应的信息对象112或信息对象112的集合)。用户可以点击到网站1的链接,并且网站1可以将网页下载到由计算机230操作的客户端应用程序,网页包含到信息对象112A的链接,信息对象在此示例中可以是白皮书。网站1可以包括具有CCM标签110A的一个或多个网页,标签110A在网站1与计算机230之间(或者网站1与由计算机230操作的客户端应用程序之间)的网络会话(例如,网页会话)期间捕获不同的事件108。网站1或另一个网站可能已经将cookie下载到在计算机230上进行操作的网络浏览器上。cookie可以包括标识符X,如与计算机230上的网络浏览器相关联的唯一的字母数字字符集。
在与网站1的会话期间,计算机230的用户可以点击到白皮书112A的链接。响应于鼠标点击,CCM标签110A可以将事件108A下载到CCM 100。事件108A可以标识加载在计算机230的网络浏览器上的cookie标识符X。另外或可替代地,CCM标签110A可以捕获在会话期间输入到一个或多个网页字段中的用户名和/或电子邮件地址。CCM标签110散列所述电子邮件地址,并且在事件108A中包含散列的电子邮件地址。与用户相关联的任何标识符通常被称为用户X或用户ID。
CCM标签110A还可以在事件108A中包括到从网站1下载到计算机230的白皮书的链接。例如,CCM标签110A可以捕获白皮书112A的URL。CCM标签110A还可以包括事件108A中的事件类型标识符,事件类型标识符标识与信息对象112A相关联的动作或活动。例如,CCM标签110A可以将指示用户下载了电子文档的事件类型标识符插入到事件108A中。
CCM标签110A还可以标识用于访问信息对象112B的启动平台。例如,CCM标签110B可以标识链接www.searchengine.com,其为到用于访问网站1的搜索引擎的链接。
CCM 100中的事件剖析器240将事件108A中标识的URL转发到内容分析器242。内容分析器242生成与白皮书112A相关联或由白皮书112A建议的一组主题236。例如,主题236可以包括电动汽车、汽车、智能汽车、电池等。每个主题236可以具有相关的相关性评分,相关性评分指示白皮书112A中主题的相关性。标识文档中主题的内容分析器对于本领域技术人员来说是已知的,因此不再详细描述。
事件剖析器240将来自事件108A的用户ID、主题236、事件类型和任何其它数据转发到事件处理器244。事件处理器244可以将在事件108A中捕获的个人信息存储在个人数据库248中。例如,在与网站1的会话期间,用户可能已经将雇主公司名称输入到网页表单字段中。CCM标签110A可以将雇主公司名称复制到事件108A中。可替代地,CCM 100可以从用户电子邮件地址的域名中标识公司名称。
事件处理器244可以将来自事件108A的其它人口群体统计信息存储在个人数据库248中,如用户职位、年龄、性别、地理位置(邮政地址)等。在一个实例中,个人数据库248中的一些信息被散列,如用户ID和/或任何其它个人可标识信息。个人数据库248中的其它信息对于任何特定用户都可以是匿名的,如org名称和职位。
事件处理器244由主题向量236构建用户意图向量245。事件处理器244基于其它接收到的事件108不断更新用户意图向量245。例如,搜索引擎可以响应于搜索查询132显示到网站2的第二链接。用户X可以点击第二链接,并且网站2可以将网页下载到计算机230,该网页通知关于电动汽车的研讨会。
通过网站2下载的网页也可以包含CCM标签110B。用户X可以在与网站2的会话期间注册研讨会。CCM标签110B可以生成第二事件108B,第二事件108B包括用户ID:X、到通知研讨会的网页的URL链接、以及指示用户注册了在网页上广告的电动汽车研讨会的事件类型。
CCM标签110B向CCM 100发送事件108B。内容分析器242生成第二组主题236。事件108B可以包含与用户X相关联的其他个人信息。事件处理器244可以将其他的个人信息添加到个人数据库248。
事件处理器244基于为事件108B标识的第二组主题236更新用户意图向量245。事件处理器244可以向用户意图向量245添加新主题,或者可以改变现有主题的相关性评分。例如,在事件108A和108B两者中标识的主题可以被分配更高的相关性评分。事件处理器244还可以基于事件108中标识的相关事件类型来调整相关性评分。
服务提供商118可以经由计算机255上的用户界面252向CCM 100提交搜索查询254。例如,搜索查询254可以询问“谁有兴趣购买电动汽车?”CCM 100中的运输器250在用户意图向量245中搜索具有高相关性评分的电动汽车主题。运输器250可以为用户X标识用户意图向量245。运输器250在搜索结果156中标识用户X和对电动汽车感兴趣的其他用户A、B和C。
如上所述,用户ID可以被散列(hashed),并且CCM 100可能不知道用户X、A、B和C的实际身份。响应于查询254,CCM 100可以向服务提供商118提供散列的用户ID X、A、B和C的节段。
服务提供商118可以具有用户的联系人列表120(参见例如图1)。服务提供商118可以散列联系人列表120中的电子邮件地址,并且将散列的标识符与加密的或散列的用户IDX、A、B和C进行比较。服务提供商118标识未经加密的电子邮件地址,以匹配用户标识符。服务提供商118然后将与电动汽车相关的信息发送到所标识的用户节段的电子邮件地址。例如,服务提供商118可以发送包含白皮书、广告、文章、公告、研讨会通知等或其任何组合的电子邮件。
CCM 100可以响应于搜索查询254提供其它信息。例如,事件处理器244可以将同一公司Y雇用的用户的用户意图向量245聚集成org意图向量。org Y的org意向向量可以表明对电动汽车的强烈兴趣。因此,CCM 100可以在搜索结果156中标识org Y。通过聚集用户意图向量245,CCM 100可以标识公司或其它类别的意图,而不公开任何特定的用户个人信息(例如,不考虑用户的在线浏览活动)。
CCM 100连续接收不同第三方内容的事件108。事件处理器244可以聚集特定时间段的事件108,如当天、过去一周或过去30天内。事件处理器244然后可以标识所述特定时间段内的趋势主题158。例如,事件处理器244可以标识在过去30天中具有最高平均相关性值的主题。
不同的过滤器259可以应用于存储在事件数据库246中的意图数据。例如,过滤器259可以指导事件处理器244标识特定公司Y中对电动汽车感兴趣的用户。在另一个示例中,过滤器259可以指导事件处理器244标识对电动汽车感兴趣的员工少于200人的公司。
过滤器259还可以指导事件处理器244标识对电动汽车感兴趣的具有特定职务的用户,或者标识特定城市中对电动汽车感兴趣的用户。CCM 100可以使用个人数据库248中的任何人口统计信息来对查询254进行过滤。
CCM 100监测从多个不同的第三方网站访问的内容。这允许CCM 100更好地标识更广泛的用户、公司或任何其他人口统计的当前意图。CCM 100可以使用散列和/或其它匿名标识符来维护用户隐私。CCM 100进一步通过标识普通用户节段的意图来维持用户匿名,普通用户节段例如公司、营销组、地理位置或任何其他用户人口统计。
图3描绘了由CCM标签110执行的示例操作。在操作370中,服务提供商118在网页376上提供用于监测的表单字段374的列表。在操作372中,生成CCM标签110并将其加载到服务提供商118的网站上的网页376中。例如,CCM标签110A被加载到服务提供商118网站的第一网页376A上,CCM标签110B被加载到服务提供商118网站的第二网页376B上。在一个实例中,CCM标签110包括加载到网页文档对象模型(DOM)中的JavaScript。
服务提供商118可以在会话期间将网页376连同CCM标签110一起下载到用户计算机(例如,图2的计算机230)。另外地或可替代地,当用户计算机访问和/或加载网页376时(例如,在浏览器、移动应用程序或其它客户端应用程序内),可以执行CCM标签110。CCM标签110A捕获输入到一些表单字段374A中的数据,并且CCM标签110B捕获输入到一些表单字段374B中的数据。
用户在会话期间将信息输入到表单字段374A和374B中。例如,在用户注册过程或购物车结账过程期间,用户可以将电子邮件地址输入到表单字段374A之一中。CCM标签110可以在操作378中捕获电子邮件地址,验证并散列电子邮件地址,然后在事件108中将散列的电子邮件地址发送到CCM 100。
CCM标签110可以首先确认电子邮件地址包括有效的域语法,然后使用散列算法来编码有效的电子邮件地址串。CCM标签110还可以捕获其它匿名用户标识符,如cookie标识符。如果不存在标识符,CCM标签110可以创建唯一的标识符。也可以捕获其它数据,如客户端应用程序数据、从其它应用挖掘的数据和/或来自用户计算机的其它数据。
CCM标签110可以捕获输入到字段374中的任何信息。例如,CCM标签110还可以捕获用户人口统计数据,如组织(org)名称、年龄、性别、邮政地址等。在一个实例中,CCM标签110捕获服务提供商联系人列表120的一些信息。
在操作378中,CCM标签110还可以标识信息对象112和相关联的事件活动。例如,CCM标签110A可以检测用户下载白皮书112A或注册研讨会(例如,通过由网站1或某个其它网站或网络应用程序托管的在线表单等)。CCM标签110A捕获白皮书112A的URL,并且生成事件类型标识符,将事件标识为文档下载。
取决于应用,在操作378中,CCM标签110在事件108中将捕获的网络会话信息发送到服务提供商118和/或CCM 100。例如,当CCM标签110用于生成服务提供商联系人列表120时,事件108被发送到服务提供商118。在另一个实例中,当CCM标签110用于生成意图数据时,事件108被发送到CCM 100。
CCM标签110可以响应于用户离开网页376、存在表单字段374之一、选择提交图标、移开表单字段374之一、鼠标点击、离焦和/或任何其它用户动作来捕获会话信息。应再次注意,CCM 100可能永远不会接收个人可标识信息(PII),因为事件108中的任何PII数据都被CCM标签110散列。
图4是示出CCM如何生成意图数据106的图。如先前所述,CCM标签110可以向CCM100发送所捕获的原始事件108。例如,响应于用户下载白皮书,CCM标签110可以向CCM 100发送事件108。在此示例中,事件108可以包含指示何时下载白皮书的时间戳、事件108的标识符(ID)、与下载白皮书的用户相关联的用户ID、所下载的白皮书的URL以及内容的启动平台的网络地址。事件108还可以包括指示例如用户下载了电子文档的事件类型。
事件剖析器240和事件处理器244可以由一个或多个事件108生成意图数据106。意图数据106可以存储在结构化查询语言(SQL)数据库或非SQL数据库中。在一个示例中,意图数据106存储在用户档案104A中,并且包括用户ID 452和相关联的事件数据454。
事件数据454A与用户下载白皮书相关联。事件剖析器240标识白皮书中的汽车主题402和燃料效率主题402。事件剖析器240可以向汽车主题分配0.5的相关性值,并且向燃料效率主题402分配0.6的相关性值。
事件处理器244可以向事件数据454A分配权重值464。事件处理器244可以将较大的权重值264分配给更自信的事件,如下载白皮书。事件处理器244可以将较小的权重值464分配给不太自信的事件,如查看网页。事件处理器244可以为查看或下载不同类型的媒体分配其它权重值464,如下载文本、视频、音频、电子书、在线杂志和报纸等。
CCM 100可以接收由同一用户访问的第二段内容的第二事件108。CCM 100生成第二事件108的事件数据454B并将其存储在用户档案104A中。对于与事件数据454B相关联的内容,事件剖析器240可以以0.4的相关性值标识第一汽车主题,以0.8的相关性值标识第二云计算主题。事件处理器244可以向事件数据454B分配权重值0.2。
CCM 100可以接收由同一用户访问的第三段内容的第三事件108。CCM 100生成第三事件108的事件数据454C并将其存储在用户档案104A中。事件剖析器240以1.2的相关性值标识与电动汽车相关联的第一主题,以0.8的相关性值标识与电池相关联的第二主题。事件处理器244可以向事件数据454C分配权重值0.4。
事件数据454和相关联的权重值264可以提供用户兴趣/意图的更好指示符。例如,用户可以在服务提供商网站上完成表单,表明对云计算的兴趣。然而,CCM 100可以接收由同一用户访问的第三方内容的事件108。事件108可以指示用户下载了讨论电动汽车的白皮书并且注册了与电动汽车相关的研讨会。
CCM 100基于接收到的事件108生成意图数据106。相关性值466结合权重值464可以指示用户对电动汽车高度感兴趣。即使用户在服务提供商网站上表示对云计算感兴趣,CCM 100也根据第三方内容确定用户实际上对电动汽车更感兴趣。
CCM 100可以将来自事件108的其它个人用户信息存储在用户档案104B中。例如,事件处理器244可以存储与用户ID 452相关联的第三方标识符460和属性462。第三方标识符460可以包括用户名或第三方用来标识用户452的任何其它标识符。属性462可以包括与用户ID 452相关联的org名称(例如,雇主公司名称)、org规模、国家、职位、散列域名和/或散列电子邮件地址。属性462可以根据从由用户访问的不同网站接收到的不同事件108来组合。CCM 100还可以从第三方数据源(无论是在线的还是离线的)获得用户档案104中的不同人口统计数据。
聚合器可以使用用户档案104来更新和/或聚合不同节段的意图数据,如服务提供商联系人列表、公司、职位等。聚合器还可以创建选定时间段内的意图数据106的快照。
事件处理器244可以为已知用户和未知用户生成意图数据106。例如,用户可以访问网页并将电子邮件地址输入到网页中的表单字段中。CCM标签110捕获并散列电子邮件地址,并将散列的电子邮件地址与用户ID 452相关联。
用户可以不将电子邮件地址输入到表单字段中。可替代地,CCM标签110可以在事件108中捕获匿名cookie ID。事件处理器244然后将cookie ID与用户标识符452相关联。用户可以清除cookie或访问不同计算机上的数据。事件处理器244可以为同一用户生成不同的用户标识符452和新意图数据106。
cookie ID可以用于创建去标识的cookie数据集。然后,去标识的cookie数据集可以与广告平台集成,或者用于标识目标广告的目标。
CCM 100可以单独分析不同匿名用户ID的意图数据106。如果用户曾经填写了提供电子邮件地址的表单,则事件处理器可以将不同的意图数据106与相同的用户标识符452重新关联。
图5描绘了CCM 100如何从先前在图4中描述的事件数据中生成用户意图向量594的示例。用户意图向量594可以与图2的用户意图向量245相同或相似。用户可以使用计算机530(其可以与图2的计算机230相同或相似)来访问不同的信息对象582(包括信息对象582A、582B和582C)。例如,用户可以下载与存储虚拟化相关联的白皮书282A,在网页582B上注册网络安全研讨会,查看与虚拟专用网络(VPN)相关的网页文章582C。作为实例,信息对象582A、582B和582C可以来自相同的网站或者来自不同的网站。
CCM标签110捕获分别与信息对象582A、582B和582C相关联的三个事件584A、584B和584C。CCM 100标识内容582A、582B和/或582C中的主题586。主题586包括虚拟存储、网络安全和VPN。CCM 100基于已知算法向主题586分配相关性值590。例如,可以基于在内容582中标识不同相关联的关键词的次数来分配相关性值590。
CCM 100基于相关联的事件活动向内容582分配权重值588。例如,CCM 100将相对较高的权重值0.7分配给更自信的离线活动,如注册网络安全研讨会。CCM 100将相对较低的权重值0.2分配给更被动的在线活动,如查看VPN网页。
CCM 100基于相关性值590在用户档案104中生成用户意图向量594。例如,CCM 100可以将相关性值590乘以相关联的权重值588。CCM 100然后可以将相同主题的加权相关性值加在一起,以生成用户意图向量594。
CCM 100使用意图向量594来表示用户、表示由用户访问的内容、表示与内容相关联的用户访问活动,并且有效地表示用户的意图/兴趣。另外地或可替代地,CCM 100可以向用户意图向量594中的每个主题分配1或0的二进制评分。CCM 100可以使用其它技术来得到用户意图向量594。例如,CCM 100可以基于时间戳对相关性值进行加权。
图6描绘了CCM 100如何细分用户的示例。CCM 100可以为两个不同的用户生成用户意图向量594A和594B,在此示例中所述用户包括用户X和用户Y。服务提供商118可能想要将内容698通过电子邮件发送到感兴趣的一部分用户。服务提供商向CCM 100提交内容698。CCM 100标识主题586和内容698的相关联的相关性值600。
CCM 100可以使用任何种类的不同算法来标识与内容698相关联的一部分用户意图向量594。例如,相关性值600B指示内容698主要与网络安全相关。CCM 100可以标识包括具有高于给定阈值的相关性值的网络安全主题的任何用户意图向量594。
在此示例中,假设网络安全主题的相关性值阈值为0.5。CCM 100将用户意图向量594A标识为满足阈值的用户部分的一部分。因此,CCM 100向内容698的服务提供商发送包含与用户意图向量594A相关联的用户ID的联系人节段。如上文所述,用户ID可以是散列的电子邮件地址、cookie ID或与用户相关联的一些其它经加密或未经加密的标识符。
在另一个实例中,CCM 100计算用户意图向量594与内容698之间的向量叉积。生成高于给定阈值的叉积值的任何用户意图向量594由CCM 100标识,并且被发送到服务提供商118。
图7描绘了CCM 100如何聚合意图数据106的示例。在此示例中,操作计算机702(其可以与图2和5的计算机230和计算机530相同或相似)的服务提供商118向CCM 100提交搜索查询704,询问哪些公司对电动汽车感兴趣。在此示例中,CCM 100将五个不同的主题586与用户档案104相关联。主题586包含存储虚拟化、网络安全、电动汽车、电子商务和金融。
CCM 100生成用户意图向量594,如先前在图6中所描述的。用户意图向量594具有相关联的个人信息,如职位707和org(例如,雇主公司)名称710。如上文所解释的,当访问服务提供商118或第三方网站时,用户可以在表单字段中提供个人信息,如雇主姓名和职位。
先前描述的CCM标签110捕获并向CCM 100发送职位和雇主姓名信息。CCM 100将职位和雇主信息存储在相关联的用户档案104中。CCM 100搜索用户档案104并标识与同一雇主名称710相关联的三个用户意图向量594A、594B和594C。CCM 100确定用户意图向量594A和594B与分析师的相同职位相关联,并且用户意图向量594C与财务VP的职位相关联。
响应于搜索查询704或在搜索查询704之前,CCM 100生成公司X的公司意图向量712A。CCM 100可以通过对与公司X相关联的所有用户意图向量594的主题相关性值求和来生成公司意图向量712A。
响应于搜索查询704,CCM 100标识包括具有大于给定阈值的相关性值的电动汽车主题586的任何公司意图向量712。例如,CCM 100可以标识相关性值大于4.0的任何公司。在此示例中,CCM 100在搜索结果706中标识Org X。
在一个实例中,针对特定邮政编码(如邮政编码11201)的公司标识意图。CCM 100可以获取客户提供的离线数据,如来自客户关系管理(CRM)数据库的离线数据,并且标识与公司和邮政编码11201相匹配的用户以创建节段。
在另一个示例中,服务提供商118可以输入查询705,询问哪些公司对与电动汽车相关的文档(DOC 1)感兴趣。计算机702向CCM 100提交查询705和DOC 1。CCM 100生成DOC 1的主题向量,并且将DOC 1主题向量与所有已知的公司意图向量712A进行比较。
CCM 100可以标识DOC 1中具有高相关性值的电动汽车主题,并且标识具有高于给定阈值的电动汽车相关性值的公司意图向量712。在另一个实例中,CCM 100可以执行DOC 1主题与不同公司意图向量712之间的向量叉积。CCM 100可以标识向量叉积值高于给定阈值的任何公司的名称,并且在搜索结果706中显示所标识的公司名称。
CCM 100可以为不同的职位分配权重值708。例如,可以向分析师分配1.0的权重值,并且给副总裁(VP)分配7.0的权重值。权重值708可以反映与职位707相关联的购买权限。例如,财务VP可能比分析师拥有更高的购买电动汽车的权限。权重值708可以基于职位与特定主题的相关性而变化。例如,CCM 100可以为研究主题向分析师分配更高的权重值708。
CCM 100可以基于加权值708生成加权的公司意图向量712B。例如,CCM 100可以将用户意图向量594A和594B的相关性值乘以权重值1.0,并且将用户意图向量594C的相关性值乘以权重值3.0。用户意图向量594A、594B和594C的加权主题相关性值然后被加在一起以生成加权的公司意图向量712B。
CCM 100可以将其它类别的意图向量聚合在一起,如职位。例如,CCM 100可以将所有用户意图向量594与财务VP职位一起聚合成财务VP意图向量714。意图向量714标识财务VP感兴趣的主题。
CCM 100还可以基于职位或任何其它类别来执行搜索。例如,服务提供商118可以输入检索“对电动汽车感兴趣的财务VP列表?”CCM 100将所有用户意图向量594与相关联的VP财务职位707进行标识。CCM 100然后细分具有高于给定阈值的电动汽车主题相关性值的用户意图向量组594。
CCM 100可以生成复合档案716。复合档案716可以包含由特定服务提供商118或实体提供的具体信息。例如,第一服务提供商118可以将用户标识为财务VP,第二服务提供商118可以将同一用户标识为工程VP。复合档案716可以包括其它服务提供商118提供的信息,如公司规模、公司位置、公司领域。
当为第一服务提供商118提供用户细分时,CCM 100可以使用第一复合档案716。第一复合档案716可以将用户职位标识为财务VP。当为第二服务提供商118提供用户细分时,CCM 100可以使用第二复合档案716。第二复合档案716可以将同一用户的职位标识为工程VP。复合档案716与从其它第三方内容得到的用户档案104结合使用。
在又另一个实例中,CCM 100可以基于事件类型对用户进行细分。例如,CCM 100可以标识下载了特定文章的所有用户,或者标识注册了特定研讨会的来自特定公司的所有用户。
3.消费评分
图8描绘了在CCM 100中使用的示例消费评分生成器800。如上文所解释的,CCM100可以接收与不同信息对象112相关联的多个事件108。例如,用户可以使用客户端应用程序(例如,网络浏览器或任何其它应用)来访问或查看来自不同资源(例如,在不同网站上)的信息对象112。信息对象112可以包括任何网页、电子文档、文章、广告或用户可看到或可听到的任何其它信息,如本文所讨论的那些。在此实例中,信息对象112可以包括与网络防火墙相关的网页文章或文档。
CCM标签110可以捕获事件108,事件108标识用户在网络或应用会话期间访问的信息对象112。例如,事件108可以包括各种事件数据,如标识符(ID)(例如,用户ID(userId)、应用会话ID、网络会话ID、装置ID、产品ID、电子产品代码(EPC)、序列号和/或RFID标签ID等)、URL、网络地址(NetAdr)、事件类型(eventType)和时间戳(TS)。ID字段可以携带与用户和/或用户装置相关联的、与网络会话、应用、应用会话、应用程序实例、应用程序会话、应用程序生成的标识符和/或CCM标签110可以生成的标识符相关联的任何合适的标识符。例如,当使用用户ID时,用户ID可以是特定客户端应用程序和/或特定用户装置上的特定用户的唯一标识符。另外地或可替代地,userId可以是或包括以下中的一个或多个:用户ID(UID)(例如,由类Unix OS分配给用户的正整数)、有效用户ID(euid)、文件系统用户ID(fsuid)、保存的用户id(suid)、真实用户id(ruid)、cookie ID、域名、域ID、登录用户名、网络凭证、社交媒体账户名、会话ID和/或与特定用户或装置相关联的任何其它类似标识符。URL可以是用户在会话期间访问的信息对象112的链接、资源标识符(例如,统一资源标识符(URI))或网址。
NetAdr字段包含与网络节点相关联的任何标识符。作为示例,NetAdr字段可以包括任何合适的网络地址(或网络地址的组合),如互联网协议(IP)网络中的IP地址(例如,IP版本4(Ipv4)、IP版本6(IPv6)等)、公共交换电话号码中的电话号码、蜂窝网络地址(例如,国际移动用户标识(IMSI)、移动用户ISDN号码(MSISDN)、订购永久标识符(SUPI)、临时移动用户标识(TMSI)、全球唯一临时标识符(GUTI)、通用公共订购标识符(GPSI)等)、互联网分组交换(IPX)地址、X.25地址、X.21地址、端口号(例如,当使用传输控制协议(TCP)或用户数据报协议(UDP)时)、媒体访问控制(MAC)地址、由EPCglobal标签数据标准定义的电子产品代码(EPC)、蓝牙硬件装置地址(BD_ADDR)、统一资源定位器(URL)和/或电子邮件地址等。NetAdr可以用于用户用来访问网络(例如,互联网、企业网络等)和信息对象112的网络装置。
如先前所解释的,事件类型可以标识与信息对象112相关联的动作或活动。在此示例中,事件类型可以指示用户下载了电子文档或显示了网页。时间戳(TS)可以标识用户访问信息对象112的日期和/或时间,并且可以以任何合适的时间戳格式包括在TS字段中,如由ISO 8601等定义的那些格式。
消费评分生成器(CSG)800可以访问NetAdr-Org数据库806,以在事件108中识别与NetAdr 804相关联的公司/实体和位置808。在一个实例中,当NetAdr是网络地址并且Org是如公司和/或企业等实体时,NetAdr-Org数据库806可以是IP/公司806。例如,现有服务可以提供标识与网络地址相关联的公司和公司地址的数据库806。NetAdr(例如,IP地址)和/或相关联的org通常可以被称为域。CSG 800可以从数据库806中标识的不同公司808的事件108中生成度量。
在另一个实例中,CCM标签110可以在事件108中包括域名。例如,用户可以在网络会话期间将电子邮件地址输入到网页字段中。CCM 100可以散列电子邮件地址或去除电子邮件域地址。CCM 100可以使用域名从数据库806中标识特定的公司和位置808。
同样如先前所描述的,事件处理器244可以生成指示信息对象112与不同主题102的相关性的相关性评分802。例如,信息对象112可以包括与主题102相关联的多个词。事件处理器244可以基于与所选择的主题相关联的数量和位置词来计算信息对象112的相关性评分802。
CSG 800可以根据特定公司808的事件108计算度量。例如,CSG 800可以标识当前周的一组事件108,所述一组事件包括与相同公司和公司位置808相关联的相同NetAdr804。CSG 800可以基于所述一组事件108的平均相关性评分802来计算公司808的消费评分810。CSG 800还可以基于事件108的数量和生成事件108的唯一用户的数量来调整消费评分810。
CSG 800在一系列时间段内生成org 808的消费评分810。CSG 800可以基于消费评分810在一系列时间段内的变化来标识消费评分810的激增812。例如,CSG 800可以基于内容相关性、唯一用户的数量、特定信息对象的唯一用户访问的数量、事件数量在一个或多个时间段(例如,几周)内的变化、与特定信息对象的特定类型的用户交互的数量和/或任何其它合适的参数/标准来标识激增812。已经发现,激增812对应于唯一时段,此时org对特定主题的兴趣增加,并且更有可能参与与所述主题相关的直接邀约。当目标org(例如,org 808)指示对由服务提供商118提供的产品或服务的活跃需求时,激增812(也被称为“激增评分812”等)通知服务提供商118。
CCM 100可以向服务提供商118发送消费评分810和/或任何激增指示符812。服务提供商118可以存储包括org ABC的联系人818的联系人列表815。例如,联系人列表815可以包括org ABC的雇员的电子邮件地址或电话号码。服务提供商118可以从任何来源获得联系人列表815,如从客户关系管理(CRM)系统、商业联系人列表、个人联系人、第三方引导服务、零售店、促销或销售点等或其任何组合获得。
在一个实例中,CCM 100可以向服务提供商118发送每周消费评分810。在另一个实例中,服务提供商118可以使CCM 100仅发送针对特定主题102激增的列表815上的公司的激增通知812。
服务提供商118可以向联系人818发送与激增主题相关的信息对象820。例如,由服务提供商118发送给联系人818的信息对象820可以包括与防火墙产品/服务相关的电子邮件广告、文献或横幅广告。可替代地,服务提供商118可以呼叫或发送关于防火墙的直接邮件给联系人818。由于CCM 100在org ABC处为防火墙主题标识了激增812,所以org ABC处的联系人818更有可能对阅读和/或响应于与防火墙相关的内容820感兴趣。因此,当在激增812期间发送给org ABC的联系人818时,内容820更有可能具有更高的影响和转换率。
在另一个实例中,服务提供商118可以销售特定的产品,如防火墙。服务提供商118可能具有已知参与购买防火墙设备的org ABC的联系人列表818。例如,联系人418可以包括org ABC的首席技术官(CTO)和信息技术(IT)经理。每当检测到org ABC处的防火墙的激增812时,CCM 100可以向服务提供商118发送通知。然后,服务提供商118可以自动将内容820发送给org ABC处的特定联系人818,所述联系人的职位最有可能对防火墙感兴趣。
CCM 100还可以使用消费评分810来进行广告验证。例如,CCM 100可以将消费评分810与发送给公司或个体的广告内容820进行比较。具有特定主题的广告内容820被发送给对于相同主题具有高消费评分或激增的公司或个体,可以接收更高的广告费率。
图9示出了CCM 100如何生成消费评分810的更详细的示例。CCM 100每天可以从与数千个不同域相关联的数百万个不同用户接收数百万个事件108。CCM 100可以累积不同时间段内的事件108,如每天、每周、每月等等。周时间段仅是一个示例,并且CCM 100可以累积任何可选择时间段内的事件108。CCM 100还可以存储任何可选择主题内容的一组主题102。如先前所描述的,CCM 100还可以基于事件108中标识的内容动态地生成一些主题102。
如先前所描述以及如图9所示,事件108可以包括标识符(ID)950(例如,用户ID、会话ID、装置ID、产品ID/代码和/或序列号等)、URL 952、网络地址954、事件类型956和时间戳958(其可以被统称为“事件数据”等)。事件处理器244标识定位于URL 942处的信息对象112,并且选择主题102之一与信息对象112进行比较。事件处理器244可以生成相关联的相关性评分802,其指示信息对象112与所选择的主题102的相关性。相关性评分802可以可替代地被称为“主题评分”等。
CSG 800由事件108生成消费数据960。例如,CSG 800可以标识或确定与网络地址954相关联的org 960A(例如,图9中的“Org ABC”)。CSG 800还计算信息对象112与所选择的主题960B之间的相关性评分960C。CSG 800还标识或确定公司960A的位置960D,并且标识检测到事件108的日期960E和时间960F。
CSG 800由消费数据960生成消费度量980。例如,CSG 800可以计算在第一时间段期间(例如第一周)所有主题的与org 960A(例如,Org ABC)和位置960D(例如,位置Y)相关联的事件总数970A。CSG 800还计算第一周内生成与org ABC和主题960B相关联的事件108的唯一用户972A的数量。例如,CSG 800可以计算第一周内由org ABC为主题960B(例如,主题量974A)生成的事件总数。CSG 800还可以计算由org ABC访问并且与主题960B相关联的内容的平均主题相关性976A。CSG 800可以生成连续时间段如连续三周内的消费度量980A-980C。
CSG 800可以基于消费度量980A-980C生成消费评分910。例如,CSG 800可以部分地基于第1周内的消费度量980A与第2周内的消费度量980B之间的变化,生成第1周内的第一消费评分910A和生成第2周内的第二消费评分910B。CSG 800可以部分地基于分别针对第1周、第2周和第3周内的消费度量980A、980B与980C之间的变化来生成第3周内的第三消费评分910C。在一个示例中,任何高于阈值的消费评分910被标识为激增812。
另外地或可替代地,消费度量980可以包括如交互的主题消费、唯一用户的主题消费、主题相关性权重和参与度等度量。交互的主题消费是在给定时间段内与历史数据的更大时间段相比来自org的交互的数量,例如,与历史数据的先前12周时间段相比的先前三周时间段内的交互的数量。唯一用户的主题消费是指与历史数据的更大时间段相比,在给定时间段内来自研究相关主题的org的唯一个体的数量,例如,与历史数据的先前12周时间段相比,在先前三周时间段内来自研究相关主题的org的个体的数量。主题相关性权重是指对感兴趣的主题中内容片段的“密集度”的量度,如所述主题是内容片段的焦点还是在内容片段中很少被提及。参与度是指org与内容的参与度的深度,这可以基于与所述org相关联的个体用户的参与度总和。可以基于用户与信息对象的交互来测量参与度,如通过测量停留时间、滚动速度、滚动深度和/或如本文所讨论的任何其它合适的用户交互。
图10描绘了用于标识消费评分激增的过程。在操作1001中,CCM 100标识给定时间段内的所有域事件。例如,对于当前周,CCM 100可以累积与每个主题102相关联的每个网络地址(例如,IP地址、域等)的所有事件。
CCM 100可以使用阈值来选择生成消费评分的域。例如,对于当前周,CCM 100可以对特定域的事件总数进行计数(域级事件计数(DEC)),并且对特定位置处的域的事件总数进行计数(都市级事件计数(DMEC))。
CCM 100计算事件数量超过阈值(DEC>阈值)的域的消费评分。阈值可以基于域的数量和事件的数量而变化。CCM 100可以使用第二DMEC阈值来确定何时为不同的域位置生成单独的消费评分。例如,CCM 100可以为亚特兰大、纽约和洛杉矶的城市分离org ABC事件的子组,这些城市各自具有高于第二阈值的事件数量DMEC。
在操作1002中,CCM 100为每个主题确定所有选择的域的总体相关性评分。例如,在当前周内,CCM 100可以计算与防火墙主题相关联的所有域事件的总体平均相关性评分。
在操作1004中,CCM 100确定特定域的相关性评分。例如,CCM 100可以标识具有与org ABC相关联的相同网络地址的一组事件108。CCM 100可以计算与防火墙主题相关联的org ABC事件的平均域相关性评分。
在操作1006中,CCM 100基于域相关性评分与总体相关性评分的比较来生成初始消费评分。例如,当域相关性评分比总体相关性评分小某个数量时,CCM 100可以分配初始低消费评分。当域相关性评分大约是与总体相关性评分相同的值时,CCM 100可以分配大于低消费评分的初始中等消费评分。当域相关性评分比总体相关性评分大某个数量时,CCM100可以分配大于中等消费评分的初始高消费评分。这仅是一个示例,CCM 100可以使用任何其它类型的比较来确定域/主题的初始消费评分。
在操作1008中,CCM 100基于与主题相关的域事件的历史基线来调整消费评分。这可替代地被称为消费。例如,CCM 100可以计算前几周内与防火墙主题相关联的org ABC的域事件的数量。
CCM 100可以基于域事件数量在前几周内的变化来降低当前周消费评分。例如,当域事件的数量在当前周下降时,CCM 100可以降低初始消费评分;当域事件的数量在当前周上升时,可以不降低初始消费评分。
在操作1010中,CCM 100进一步基于消费与主题相关联的内容的唯一用户数量来调整消费评分。例如,CCM 100可以在当前周内对与防火墙相关联的org ABC事件的唯一用户ID(唯一用户)的数量进行计数。当防火墙事件的唯一用户的数量比前一周增加时,CCM100可以不降低初始消费评分;当唯一用户的数量比前一周下降时,可以降低初始消费评分。
在操作1012中,CCM 100基于调整后的每周消费评分标识或确定激增。例如,当调整后的消费评分高于阈值时,CCM 100可以标识激增。
图11更详细地描绘了用于生成初始消费评分的过程。应当理解,这仅是一个示例方案,并且在其它实施方案中也可以使用各种其它方案。
在操作1102中,CCM 100计算所有域中的每个主题的算术平均值(M)和标准偏差(SD)。CCM 100可以为包含主题的所有域的所有事件计算M和SD,或者可替代地为包含主题的事件的某个代表性(足够大的)子集计算M和SD。CCM 100可以根据以下等式计算总体平均值和标准偏差:
等式1可以用于确定平均值,并且等式可以用于确定标准差(SD)。在等式1和2中,xi是主题相关性,n是事件总数。
在操作1104中,CCM 100计算每个主题的每组域和/或域/都市事件的平均(平均)域相关性。例如,对于过去的一周,CCM 100可以计算防火墙的org ABC事件的平均相关性。
在操作1106中,CCM 100将域平均相关性(DMR)与所有域的总体平均(M)相关性和超标准偏差(SD)相关性进行比较。例如,如表1所示,CCM 100可以向DMR分配三个不同级别中的至少一个。
表1
低 | DMR<M-0.5*SD | 占所有值的约33% |
中等 | M-0.5*SD<DMR<M+0.5*SD | 占所有值的约33% |
高 | DMR>M+0.5*SD | 占所有值的约33% |
在操作1108中,CCM 100基于上述相关性水平计算域/主题的初始消费评分。例如,对于当前周,CCM 100可以将表2所示的初始消费评分之一分配给org ABC防火墙主题。同样,这仅是CCM 100可以如何向域/主题分配初始消费评分的一个示例。
表2
相关性 | 初始消费评分 |
高 | 100 |
中等 | 70 |
低 | 40 |
图12描绘了CCM 100可以如何调整初始消费评分的一个示例。这些也仅是示例,并且在其它实施方案中,CCM 100可以使用其它方案来计算最终消费评分。在操作1201中,CCM100向域/位置/主题分配初始消费评分,如先前在图11中所描述的。
CCM 100可以计算当前周的域/位置/主题的事件数量。事件数量可替代地被称为消费。CCM 100还可以计算前几周的域/位置/主题事件的数量,并且基于当前周消费与前几周消费的比较来调整初始消费评分。
在操作1202中,CCM 100确定当前周的消费是否高于先前连续周的历史基线消费。例如,CCM 100可以确定当前周的域/位置/主题事件的数量是否高于至少前两周的域/位置/主题事件的平均数量。如果高于平均数量,CCM 100可能不会降低图11中得出的初始消费值。
在操作542中,如果当前消费不高于平均消费,则CCM 100在操作1204中确定当前消费是否高于前一周的历史基线。例如,CCM 100可以确定当前周的域/位置/主题事件的数量是否高于前一周的域/位置/主题事件的平均数量。如果高于平均数量,则CCM 100在操作1206中将初始消费评分降低第一数量。
在操作1204中,如果当前消费不高于前一周消费,则CCM 100在操作1208中确定当前消费是否高于历史消费基线但有中断。例如,CCM 100可以确定域/位置/主题事件的数量在最近几周内是否下降然后上升。如果是,则CCM 100在操作1210中将初始消费评分降低第二数量。
在操作1208中,如果当前消费不高于历史中断基线,则CCM 100在操作1212中确定消费是否低于历史消费基线。例如,CCM 100可以确定域/位置/主题事件的当前数量是否低于上周。如果低于,则CCM 100在操作1214中将初始消费评分降低第三数量。
在操作1212中,如果当前消费高于历史基线,则CCM 100在操作1216中确定消费是否是针对第一时间域的。例如,CCM 100可以确定正在为新公司或先前没有足够事件来计算消费评分的公司计算消费评分。如果是,则CCM 100在操作1218中可以将初始消费评分降低第四数量。
在一个示例中,CCM 100可以将初始消费评分降低以下数量。在它实施方案中,CCM100可以使用任何值和因子来调整消费评分。
消费高于连续数周历史基线(操作542)–0
消费高于上周历史基线(操作544)–20(第一数量)。
消费高于多周历史基线但有中断(操作548)–30(第二数量)。
消费低于历史基线(操作552)–40(第三数量)。
观察到第一时间域(域/都市)(操作556)–30(第四数量)。
如上文所解释的,CCM 100还可以基于唯一用户的数量来调整初始消费评分。图8中的CCM标签110可以包括放置在具有唯一标识符的网络浏览器中的cookie。cookie可以将唯一标识符分配给在网络浏览器上捕获的事件。因此,每个唯一标识符通常可以表示唯一用户的网络浏览器。CCM 100可以将域/位置/主题的唯一标识符的数量标识为唯一用户的数量。唯一用户的数量可以提供对所述主题感兴趣的不同域用户数量的指示。
在操作1220中,CCM 100将当前周内的域/位置/主题的唯一用户的数量与前一周的唯一用户的数量进行比较。如果唯一用户的数量比前一周增加,则CCM 100可能不会降低消费评分。当唯一用户的数量减少时,在操作1222中,CCM 100可以进一步将消费评分减少第五数量。例如,CCM 100可以将消费评分降低10。
CCM 100可以对较慢的事件日(如周末)的消费评分进行规范化(normalize)。同样,CCM 100可以使用不同的时间段来生成消费评分,如每月、每周、每天、每小时等。高于阈值的消费评分被标识为激增或峰值,并且可以表示公司或个体对特定主题的兴趣的速度或加速度。激增可以指示公司或个体更有可能与呈现类似于激增主题的内容的服务提供商118合作。激增有助于服务提供商118标识对服务提供商118的产品/服务处于主动研究模式的org,从而服务提供商118可以主动协调具有主动意图的org周围的销售和营销活动,和/或通过高度有针对性的活动获得或递送更好的结果,它们集中于围绕某个主题展示意图的org。
4.消费DNA
基于域的激增检测的一个优点是,可以在不使用org人员(例如,公司雇员)的个人可标识信息(PII)、敏感数据或机密数据的情况下标识org的激增。CCM 100基于org的网络地址得到激增数据,而不使用与生成事件108的用户相关联的PII、敏感数据或机密数据。
在另一个示例中,用户可能在网络/网页会话期间提供PII、敏感数据和/或机密数据。例如,用户可能同意在访问内容之前将他们的电子邮件地址输入到表单中。如先前所描述的,CCM 100可以匿名化(例如,散列等)PII、敏感数据或机密数据,并且CCM 100包括具有org消费评分或具有个体消费评分的匿名化数据。
图13示出了用于将域消费数据映射到个体的示例过程。在操作1301中,如先前所描述的,CCM 100标识或确定org(例如,位置Y处的org ABC)的激增主题。例如,CCM 100可以为纽约的org ABC标识防火墙的激增812。
在操作1302中,CCM 100标识或确定与org ABC相关联的用户。如上文所述,在事件108期间,一些org ABC人员可能已经在网页的字段中输入了个人、敏感或机密数据,如他们的办公室位置和/或职位。在另一示例中,服务提供商118或其它方可以从CRM客户档案或第三方列表获得org ABC的雇员的联系信息。
无论哪种方式,CCM 100或服务提供商118都可以获得与位置Y处的org ABC相关联的雇员/用户的列表。所述列表还可以包括一些雇员/用户的职位和位置。CCM 100或服务提供商118可以将激增主题与员工职位进行比较。例如,CCM 100或服务提供商可以确定激增的防火墙主题与具有如工程师、首席技术官(CTO)或信息技术(IT)等职称的用户最相关。
在操作1304中,CCM 100或服务提供商118将激增的主题(例如,此示例中的防火墙)映射到org ABC的已标识的人员的档案。在另一个示例中,CCM 100或服务提供商118可能不会随意将防火墙激增映射到与org ABC相关联的任何用户。CCM 100或服务提供商然后可以将与激增主题相关联的内容引导到所标识的用户。例如,服务提供商可以将针对防火墙研讨会、产品和/或服务的横幅广告或电子邮件引导到所标识的用户。
为单独用户标识的消费数据可替代地被称为“恐龙DNA(Dino DNA)”,通用域消费数据可替代地被称为“青蛙DNA(frog DNA)”。将域消费和激增数据与和所述域相关联的个体用户关联起来可以通过向更可能对主题感兴趣的用户提供更直接的联系来增加转化率。
本文所描述的示例通过提供从用户装置(例如,图2和图14的计算机232和1404,以及图16的平台1600)收集网络会话事件118、访问信息对象112/114、确定单独网站在特定时间段从特定域名/网络地址处或与特定域名/网络地址相关的用户装置接收的流量的量、以及标识峰值(激增812)的特定机制来提供对计算装置和计算网络的功能的改进。所收集的数据可以用于分析激增的原因(例如,特定信息对象112、114中的相关主题),这提供了对现有系统的特定改进,从而提高了网络/流量监测能力和资源消耗效率。本文所讨论的示例允许从极其大量的数据中发现信息,这在先前的传统计算架构中是不可能的。
以这种方式标识流量的峰值(例如,激增)允许内容提供商更好地向特定用户提供他们的内容。至少从内容提供商、服务提供商和网络运营商的角度来看,在没有目标的情况下向众多用户提供内容(例如,响应于对内容的网络请求等)可能是计算密集型的,并且可能消耗大量的计算和网络资源。由本发明权利要求提供的改进的网络/流量监测和资源效率是一种技术改进,因为内容提供商、服务提供商和网络运营商可以通过关注相关内容来减少提供给用户的内容总量,从而减少与向用户提供内容有关的网络和计算资源开销。另外地,内容提供商、服务提供商和网络运营商可以使用改进的网络/流量监测来更好地调整资源分配,以便在高峰时间为用户服务,从而随时间推移使他们的资源消耗更平滑。
5.意图测量
图14描绘了CCM 100可以如何基于用户参与度来计算消费评分。计算机1400可以操作客户端应用程序1404(例如,浏览器、桌面/移动应用程序等)来访问信息对象112,例如通过发送适当的HTTP消息等,并且作为响应,服务器端应用可以动态地生成并向客户端应用程序1404提供代码、脚本、标记文档和/或其它信息对象112,以在客户端应用程序1404内呈现和显示信息对象112。如先前所述,信息对象112可以是包括图形用户界面(GUI)的网页或网络应用程序,其中GUI包含用于访问服务提供商(例如,服务提供商118)和/或与之交互的图形控制元素(GCE)。服务器端应用可以用任何合适的服务器端编程语言或技术来开发,如PHP,基于JavaTM的技术如Java Servlets、JavaServer Pages(JSP)、JavaServer Faces(JSF)等,ASP.NET,Ruby或Ruby on Rails,特定平台和/或专有开发工具和/或编程语言,和/或呈现超文本标记语言(HTML)的任何其它类似技术。计算机1400可以是膝上型电脑、智能手机、平板电脑和/或任何其它装置,如本文所讨论的任何装置。在此示例中,用户可以在计算机1400的屏幕1402上打开客户端应用程序1404。
CCM标签110可以在客户端应用程序1404内操作,并且监测用户网络会话。如先前所解释的,CCM标签110可以为网页/网络会话生成事件108,其包含各种事件数据950-958,如ID 950(例如,用户ID、会话ID、应用ID等)、被访问的信息对象112的URL 952、访问信息对象112的用户/用户装置的网络地址954、标识与被访问的信息对象112相关联的动作或活动的事件类型956、以及事件108的时间戳958。例如,CCM标签110可以将事件类型标识符添加到事件108中,指示用户下载了信息对象112。另外地或可替代地,事件108可以包括参与度度量(EM)字段1410,以包括参与度的度量(携带参与度度量的数据字段/数据元素,并且参与度度量本身在本文中可以被称为“参与度度量1410”或“EM 1410”)。
在一个示例中,CCM标签110可以生成一组印象,所述一组印象可替代地被称为参与度度量1410,指示用户在消费信息对象112时采取的动作(例如,用户交互)。例如,参与度度量1410可以指示用户在信息对象112上停留了多长时间、用户如何滚动信息对象112等。参与度度量1410可以指示用户对信息对象112的参与度或兴趣水平。例如,当用户对信息对象112更感兴趣时,用户可能在网页上花费更多的时间,并且以较慢的速度滚动网页。
CCM 100基于参与度度量1410计算信息对象112的参与度评分1412。CCM 100可以使用参与度评分1412来调整信息对象112的相关性评分802。例如,当用户花费大量时间仔细翻阅信息对象112时,CCM 100可以计算较大的参与度评分1412。CCM 100然后可以基于较大的参与度评分1412增加信息对象112的相关性评分802。CSG 800可以基于增加的相关性802来调整消费评分910,以更准确地标识域激增主题。例如,较大的参与度评分1412可以产生较大的相关性802,较大的相关性802产生较大的消费评分910。
图15描绘了用于计算内容的参与度评分的示例过程。在操作1520中,CCM 100标识或确定信息对象112的参与度度量1410。CCM 100可以接收包括一个或多个信息对象112的内容参与度度量1410的事件108。信息对象112的参与度度量1410可以是内容印象等。作为示例,参与度度量1410可以指示与信息对象112的任何用户交互,包含按键、动作选择、计时器值和/或计时器到期指示符、切换到不同页面的选项卡选择、页面移动、鼠标页面滚动、鼠标点击、鼠标移动、滚动条页面滚动、键盘页面移动、触摸屏页面滚动、眼睛跟踪数据(例如,注视位置、注视时间、感兴趣的注视区域、眼睛移动频率/速度/定向等)、触摸数据(例如,触摸手势等)和/或任何其它内容的移动或内容显示指示符。
在操作1522中,CCM 100基于参与度度量1410来标识或确定参与度水平。在一个实例中,在操作1522,CCM 100标识/确定内容停留时间。停留时间可以指示用户主动查看一页内容的时间长度。在一个示例中,当用户改变页面选项卡或在页面上变得不活动时,标签110可以停止停留时间计数器。当用户开始用鼠标滚动或开始切换时,标签110可以再次启动停留时间计数器。另外地或可替代地,在操作1522处,CCM 100根据事件108标识/确定内容的滚动深度。例如,CCM 100可以确定用户滚动或查看了页面的多少部分。在一个示例中,CCM标签110或CCM 100可以将屏幕上的像素计数转换成页面的百分比。另外地或可替代地,在操作1522处,CCM 100标识/确定上/下滚动速度。例如,拖动滚动条可以对应于快滚动速度,并且指示用户对内容不太感兴趣。使用鼠标滚轮滚动内容可能对应于较慢的滚动速度,并且指示用户对内容更感兴趣。另外地或可替代地,在操作1522处,CCM 100基于一些或所有参与度度量1410(如本文所讨论的那些中的任何一个)来标识/确定参与度的各种其它方面/水平。另外地或可替代地,CCM 100可以向指示较高用户兴趣的参与度度量1410(例如,印象)分配较高的值,并且向指示较低用户兴趣的参与度度量分配较低的值。例如,当用户花费更多时间主动停留在页面上时,CCM 100可以在操作1522中分配较大的值,并且当用户花费较少时间主动停留在页面上时,可以分配较小的值。
在操作1524中,CCM 100基于在操作1520-1522中得到的值来计算内容参与度评分1412。例如,CCM 100可以将在操作1520-1522中得到的不同值相加并归一化。在其它实施方案中,可以对这些值执行其它操作。
在操作1526,CCM 100基于内容参与度评分1412调整先前在图1-14中描述的相关性值(例如,相关性评分802)。例如,当信息对象112具有高参与度评分时,CCM 100可以增加相关性值(例如,相关性评分802),并且对于较低的参与度评分,降低相关性(例如,相关性评分802)。
图14中的CCM 100或CCM标签110可以基于用于观看内容的装置1400的类型来调整在操作1520-1524中分配的值。例如,智能手机、平板电脑、笔记本电脑与台式计算机之间的停留时间、滚动深度和滚动速度可能会有所不同。CCM 100或标签110可以归一化或缩放参与度度量值,使得不同的装置提供相似的相对用户参与度结果。
通过以本文所讨论的方式提供更准确的意图数据和消费评分,允许服务提供商118通过提供更好地瞄准用户的手段来节省计算和网络资源,使得不想要的和看似随机的内容不会被分发给不想要此类内容的用户。这是一项技术进步,因为它通过减少生成和发送到最终用户装置的内容数量,节省了分发此内容的服务提供商118和/或其它组织(org)的网络和计算资源。终端用户装置可以通过减少或消除使用网络和计算资源来获取(下载)和查看不想要的内容的需求来减少此类资源的消耗。另外地,终端用户装置可以通过减少或消除实施垃圾邮件过滤器的需求以及减少在分析和/或删除此类内容时要处理的数据量来减少网络和计算资源消耗。
此外,与传统的定向技术不同,本文的示例基于对特定内容的兴趣激增来提供用户定向,这允许服务提供商118定制何时向个体用户发送内容以最大化参与度,这可以包括基于所确定的位置来定制内容。这允许内容提供商随着时间推移展开内容分发。展开内容分发减少了网络内各种节点处的拥塞和过载情况,并且因此,至少当与现有/传统的大规模/批量分发技术相比时,本文中的实施例还减少了内容提供商118、内容分发平台和互联网服务提供商(ISP)的计算负担和网络资源消耗。
6.结构语义
各种信息对象112之间的关系(例如,链接)和/或信息对象112内的元素之间的关系被称为结构语义。例如,结构语义可以包括构成单独网站的网页之间的关系、多个网站的网页之间的关系和/或构成单独网页的网络组件之间的关系。
在一些实施方案中,资源分类器使用这些关系来捕获一组信息对象112中的所有信息对象112的结构语义。在一个实例中,机器人、爬虫器或其它类似的实体系统地浏览单独的信息对象112,以标识在概念上等效于特定网络的语言的信息对象。机器人/爬虫器可以从信息对象112中的特定节点开始,并且标识到其它节点的路径。
所生成的路径在概念上类似于一句话,有效地表示了网络或一组信息对象112的自然语言结构的示例。NLP中合适的单词嵌入技术,例如Word2Vec(例如,参见Mikolov等人,“向量空间中单词表示的有效估计(Efficient Estimation of Word Representations inVector Space.)”,arXiv电子预印本arXiv:1301.3781(2013年1月16日),所述文献特此通过引用整体并入本文),用于将在文档语料库中的大量句子示例中发现的单独单词转换成低维向量,捕获它们与其它单词的接近度的语义结构,如人类语言中存在的那样。类似地,如大规模信息网络嵌入(LINE)、如DeepWalk(参见例如,Perozzi等人,“深度行走:社交表示的在线学习(DeepWalk:Online Learning of Social Representations)”,arXiv:1403.6652v2(2014年6月27日),可在https://arxiv.org/pdf/1403.6652.pdf处获得;10页,所述文献特此通过引用整体并入)、GraphSAGE(参见例如,Hamilton等人,“大型图上的归纳表示学习(Inductive Representation Learning on Large Graphs)”,arXiv:1706.02216v4(2018年9月10日),所述文献特此通过引用整体并入)等图形神经网络(GNN)等网站/网络(图形)嵌入技术可以用于将在信息对象112的集合(例如,引用网站的集合)中找到的信息对象112的序列转换成低维向量,捕获它们与其它页面的关系的语义结构。
然后,资源分类器使用NLP技术将不同的路径转换成一个或多个结构化语义向量(也被称为“嵌入”)。资源分类器可以为每个信息对象112生成结构语义向量,并且将这些向量馈送到合适的ML模型中,以对信息对象112进行分类。在信息对象112是网页的示例中,资源分类器可以通过求和将同一网站的结构语义向量组合在一起,以生成网站结构语义向量。在此示例中,资源分类器将此网站向量馈送到逻辑回归模型中,逻辑回归模型然后将网站分类为特定类型的网站。
资源分类器可以基于结构语义特征对信息对象112进行分类。另外地,资源分类器可以生成并且使用信息对象112的其它特征来对信息对象112进行分类。作为示例,由资源分类器生成的特征可以包含但不限于以下内容。
特征F1:基于信息对象112之间(例如,由超链接提供的网页之间)的结构关系生成的结构语义。
特征F2:内容语义。内容语义F2可以捕获包含在信息对象112内的内容的语言和元数据语义。例如,经训练的NLP模型可以预测与内容相关联的主题。另外,资源分类器还可以标识内容元数据,如内容的气息、内容的分节的数量(例如,页数、报头数、分节符数、段落数等)、内容中的词数(例如,词频或词计数)、单词相对于内容中其它单词的位置、内容中主题的数量、内容中变化的数量和/或其它类型的元数据。
内容语义F2还可以包括任何其它数据元素(例如,HTML元素、XML元素等)和/或可以与如iFrame、文档对象模型(DOM)节点/元素等不同类型的信息对象112相关联的属性和参数。
特征F3:主题语义。主题语义企业对企业(B2B)主题标识包含在信息对象112中的不同商业主题。标识B2B主题和生成相关联的主题向量在先前已经描述过了(参见例如,与图2相关的讨论)。例如,CCM 100可以标识单独信息对象112中的不同商业相关主题。
特征F4:内容交互行为。内容交互行为可替代地被称为内容消费或内容使用。内容交互行为标识信息对象112的用户交互/消费模式。特征F4中反映的用户交互/消费的类型可以包含但不限于一天中的时间、一周中的某一天、用户消费/查看的内容总量、装置类型、用于访问信息对象112的不同装置类型的百分比、用户花费在信息对象112上的持续时间以及用户对信息对象112的总参与度、访问信息对象112的不同用户档案的数量与信息对象112的事件总数、停留时间、滚动深度、滚动速度、内容消费随时间的变化、切换到不同信息对象112的选项卡选择、页面移动、鼠标页面滚动、鼠标点击、鼠标移动、滚动条页面滚动、键盘页面移动、触摸屏页面滚动、眼睛跟踪数据(例如,注视位置、注视时间、感兴趣的注视区域、眼睛移动频率/速度/方向等)和/或触摸数据(例如,触摸手势等)等。标识与这些不同的用户内容交互行为(消费)相关联的不同事件类型以及相关联的参与度评分在先前已更详细地描述。例如,资源分类器可以基于在与每个信息对象112相关联的事件108中标识的事件类型和参与度度量来生成内容交互特征F4。
特征F5:实体类型。实体类型特征标识行业、公司、组织、基于机器人的应用或访问网页的用户的类型或位置。例如,CCM 100可以将每个用户事件108标识为与特定企业、机构、移动网络运营商、机器人/爬虫和/或其它应用等相关联。关于如何标识访问信息对象112的org和/或位置的类型的细节描述于2021年1月20日提交的题为“用于将网络地址与信息对象访问位置相关联的机器学习技术(MACHINE LEARNING TECHNIQUES FORASSOCIATING NETWORK ADDRESSES WITH INFORMATION OBJECT ACCESS LOCATIONS)”的第17/153,673号美国申请中,所述美国申请特此通过引用整体并入本文。
特征F6:词汇语义。词汇语义是指信息对象112的语法结构,以及特定上下文中单独单词之间的关系。词汇语义F6可以从信息对象112的初始NLP/NLU分析中得到,以标识信息对象112的词汇方面。作为示例,这些词汇方面可以包括下位词(一般词汇项目的特定词汇项目(上位词))、部分词(表示某事物的组成部分或成员的文本和单词的逻辑布置)、多义性(单词或短语的意义之间的关系,尽管略有不同,但具有共同的核心)、同义词(具有相同意义或与另一个几乎相同意义的单词)、反义词(具有接近相反意义的单词)和/或同音异义词(发音相同并且拼写相似但具有不同意义的两个单词)等。
特征F1、F2、F3和F6可以统称为信息对象语义特征。特征F4和F5以及与信息对象112的任何其它用户交互可以统称为行为特征。
在一个示例中,资源分类器为每个信息对象112生成一个或多个特征向量F1-F5。资源分类器然后组合所有相同的信息对象112特征向量,以生成总体信息对象112特征向量。例如,资源分类器可以将为一组信息对象112中的每个单独的信息对象112生成的结构语义特征向量F1加在一起。资源分类器然后将总和除以信息对象112的数量,以生成信息对象112的平均结构语义特征向量F1。资源分类器对其它特征F2-F5中的每一个执行相同的平均,以形成组合的特征向量。资源分类器将组合的特征向量馈送到合适的ML模型中,模型将信息对象112(例如,分类器等)分类为多个信息对象类型中的一个类型。再次,这仅是一个示例,并且特征F1-F5的任何组合或者任何其它特征都可以用于对信息对象112进行分类。
CCM 100还可以使用先前所描述的信息对象结构和特征来改进信息对象112或信息对象112的单独节点的主题预测。例如,当信息对象112是网站时,CCM 100可以标识网站的最有影响力的网页,其可以是具有最多链接、最多内容、与特定主题具有最高相关性、最多用户访问和/或具有比网站的其它网页更大或不同的一些其它方面/特征的网页。与最有影响力的网页距离较近的网页(例如,与最有影响力的网页相比具有较少数量的链接或跳转)可以被标识为比与最有影响力的网页距离较远的网页更有影响力。在此示例中,CCM100可以增加更有影响力的网页或直接连接到该网页的网页的主题预测值,和/或减少影响力较小的网页的主题预测值。资源分类器可以基于与特定信息对象112相关联的org来修改相关性评分。例如,资源分类器可以将第一类型的信息对象112的相关性评分增加或减少第一数量,和/或将第二类型的信息对象112的相关性评分增加或减少第二数量,等等。
CCM 100和/或资源分类器可以生成一个或多个信息对象112的数据结构或图形来训练主题模型。在ML模型训练期间,主题模型可以为不同信息对象112(例如,网站的单独网页)生成主题相关性评级(例如,相关性评分)。在一些情况下,ML模型可能不准确地标识了第一信息对象112上的主题,但是可以准确地标识了其它紧密链接的信息对象112上的主题。在训练和测试期间,模型性能不仅可以基于标识一个特定信息对象112上的主题102的准确度来评级,还可以基于标识其它紧密链接的信息对象112上的相关主题102的准确度来评级。
7.示例硬件和软件配置和实施方案
图16展示了计算系统1600的示例(也被称为“计算装置1600”、“平台1600”、“装置1600”、“设备1600”、“服务器1600”等)。计算系统1600可以适合用作本文所讨论的任何计算机装置,并且执行上文所讨论的过程的任何组合。作为示例,计算装置1600可以在服务器-客户端网络环境中以服务器或客户端机器的能力操作,或者作为对等(或分布式)网络环境中的对等机器操作。另外地或可替代地,系统1600可以表示CCM 100、用户计算机230/530/1400、网络装置和/或网络设备、应用服务器(例如,由服务提供商118拥有/操作)、托管和/或服务信息对象112的第三方平台或服务器集合、和/或先前所讨论的任何其它系统或装置。另外地或可替代地,根据系统1600所表示的特定系统/装置,可以包含图16所描绘的组件的各种组合。例如,当系统1600表示用户或客户端装置时,系统1600可以包含图16所示的一些或所有组件。在另一个示例中,当系统1600是CCM 100或服务器计算机系统时,系统1600可以不包括通信电路系统1609或电池1624,而是可以包括多个NIC 1616等。作为示例,系统1600和/或远程系统1655可以包括台式计算机、工作站、膝上型计算机、移动蜂窝电话(例如,“智能手机”)、平板计算机、便携式媒体播放器、可穿戴计算装置、服务器计算机系统、网页设备(web appliance)、网络设备(network appliance)、计算资源的集合(例如,在基于云的环境中)或能够直接或间接与网络1650或其它网络对接的一些其它计算装置,和/或能够执行指定所述机器要采取的动作的指令(顺序或其它方式)的任何其它机器或装置。
系统1600的组件可以被实施为单独的计算机系统,或者被实施为以其它方式结合在更大系统的机箱内的组件。系统1600的组件可以被实施为集成电路(IC)或其它分立的电子装置,具有在计算机系统1600中适配的适当逻辑、软件、固件或其组合。另外地或可替代地,系统1600的一些组件可以被组合并且被实施为合适的片上系统(SoC)、系统级封装(SiP)、多芯片封装(MCP)等。
系统1600包括能够向/从远程系统1655提供和/或访问内容和/或服务的物理硬件装置和软件组件。系统1600和/或远程系统1655可以被实施为可用于相互访问和/或提供内容/服务的任何合适的计算系统或其它数据处理设备。远程系统1655可以具有与系统1600相同或相似的配置和/或相同或相似的组件。系统1600与远程系统1655通信,并且反之亦然,以使用例如传输控制协议(TCP)/互联网协议(IP)上的超文本传输协议(HTTP);或者一个或多个其它常见的互联网协议,如文件传输协议(FTP);具有会话描述协议(SDP)、实时传输协议(RTP)或实时流协议(RTSP)的会话发起协议(SIP);安全外壳(SSH)、可延伸发信与呈现协定(XMPP);WebSocket和/或一些其它通信协议,如本文所讨论的协议,来获得/提供内容/服务。在一些实例中,事件108可以是或包括由任何前述协议定义的会话事件。
如本文所使用的,术语“内容”是指要传达给特定观众或终端用户的视觉或听觉信息,并且可以包括或传达关于特定话题或主题的信息。内容或内容项目可以是不同的内容类型(例如,文本、图像、音频、视频等),和/或可以具有不同的格式(例如,包含 文档、可移植文档格式(PDF)文档、HTML文档的文本文件;音频文件,如MPEG-4音频文件和WebM音频和/或视频文件;等等)。如本文所使用的,术语“服务”是指代表如系统1600等请求方执行的特定功能或一组功能。作为示例,服务可以包括或涉及指定信息的取得或一组操作的执行。为了访问内容/服务,系统1600包括如处理器、存储器装置、通信接口等组件。然而,术语“内容”和“服务”在本公开中可以互换使用,即使这些术语是指不同的概念。
现在参考系统1600,系统1600包括处理器电路系统1602,处理器电路系统1602可配置或可操作以执行程序代码,和/或顺序地和自动地执行一系列算术或逻辑运算,以及记录、存储和/或传输数字数据。处理器电路系统1602包括但不限于例如一个或多个处理器核和以下中的一个或多个:高速缓冲存储器、低压降电压调节器(LDO)、中断控制器、如串行外围接口(SPI)等串行接口、内部集成电路(I2C)或通用可编程串行接口电路、实时时钟(RTC)、包含间隔和监视定时器的定时器计数器、通用输入输出(I/O)、存储卡控制器、互连(IX)控制器和/或接口、通用串行总线(USB)接口、移动工业处理器接口(MIPI)接口、连接测试存取组(JTAG)测试存取端口等。处理器电路系统1602可以包括片上存储器电路系统或高速缓存存储器电路系统,片上存储器电路系统或高速缓存存储器电路系统可以包括任何合适的易失性和/或非易失性存储器,如DRAM、SRAM、EPROM、EEPROM、闪速存储器、固态存储器和/或任何其它类型的存储器装置技术,如本文所讨论的存储器装置技术。处理器电路系统1602的单独处理器(或单独处理器核)可以与存储器/存储装置耦接,或者可以包括存储器/存储装置,并且可以是可配置的或可操作的,以执行存储在存储器/存储装置中的指令,从而使得各种应用或操作系统能够在系统1600上运行。处理器电路系统1602的处理器(或核)是可配置的或可操作的,以操作应用软件(例如,逻辑/模块1680)来向系统1600的用户提供特定服务。在一些实施例中,处理器电路系统1602可以包括专用处理器/控制器,以根据本文的各个示例实施方案进行操作。
在各个实施方案中,处理器电路系统1602的处理器可以包括例如一个或多个处理器核(CPU)、图形处理单元(GPU)、张量处理单元(TPU)、精简指令集计算(RISC)处理器、Acorn RISC机器(ARM)处理器、复杂指令集计算(CISC)处理器、数字信号处理器(DSP)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、SOC和/或可编程SOC、微处理器或控制器或者其任何合适的组合。作为示例,处理器电路系统1602可以包括基于CoreTM的处理器、MCU类处理器、处理器、高级微装置(AMD)核心架构处理器(如或Epyc处理器、加速处理单元(APU)、MxGPU等)、公司的A、S、W和T系列处理器、技术公司的SnapdragonTM或CentriqTM处理器、Texas Instruments,的开放多媒体应用平台(OMAP)处理器、由基金会和/或提供的功率架构处理器、由MIPS技术公司提供的MIPS Warrior M级/Warrior I级和Warrior P级处理器、ARM控股有限公司授权的ARM Cortex-A/Cortex-R和Cortex-M系列处理器、CaviumTM公司提供的提供的和/或其它类似GPU等等。处理器电路系统1602的其它示例可以在本公开的其它地方提及。
在一些实施方案中,处理器电路系统1602的处理器可以是或可以包括一个或多个媒体处理器,一个或多个媒体处理器包括被专门设计为实时处理数字流数据的基于微处理器的SoC、FPGA或DSP,其可以包括编码器/解码器电路系统,用于压缩/解压缩(或编码和解码)高级视频编码(AVC)(也被称为H.264和MPEG-4)数字数据和/或高效视频编码(HEVC)(也被称为H.265和MPEG-H部分2)数字数据等。
在一些实施方案中,处理器电路系统1602可以包括一个或多个硬件加速器。硬件加速器可以是微处理器、可配置硬件(例如,FPGA、可编程ASIC、可编程SOC、DSP等)或被定制成执行一个或多个特定任务或工作负载的某个其它合适的专用处理装置,例如CCM 100、IP2D解析系统850和/或本文所讨论的某个其它系统/装置的子系统的特定任务或工作负载,其可能比使用通用处理器核更高效。可以从处理器电路系统1602的一个或多个处理器卸载特定的任务或工作负载。在这些实施方案中,处理器电路系统1602的电路系统可以包括逻辑块或逻辑结构,逻辑块或逻辑结构包括可以被编程为执行各种功能的其它互连资源,如本文所讨论的各个示例实施方案的过程、方法、功能等。另外地或可替代地,处理器电路系统1602可以包括用于在LUT等中存储逻辑块、逻辑结构、数据等的存储器单元(例如,EPROM、EEPROM、闪速存储器、静态存储器,例如SRAM、反熔丝等)。
在一些实施方案中,处理器电路系统1602可以包括专门为机器学习功能定制的硬件元件,如用于操作先前关于图2讨论的CCM 100的子系统。在这些实施方案中,处理器电路系统1602可以是或者可以包括AI引擎芯片,一旦加载了适当的权重和训练代码,AI引擎芯片就可以运行许多不同种类的AI指令集。另外地或可替代地,处理器电路系统1602可以是或可以包括AI加速器,AI加速器可以是被设计用于AI应用的硬件加速的一个或多个前述硬件加速器,如CCM 100、IP2D解析系统850和/或本文所讨论的某个其它系统/装置的一个或多个子系统。作为示例,这些处理器或加速器可以是一组人工智能(AI)GPU、公司开发的张量处理单元(TPU)、由提供的Real AI处理器(RAPsTM)、由公司提供的NervanaTM神经网络处理器(NNP)、MovidiusTMMyriadTMX视觉处理单元(VPU)、基于PXTM的GPU、由General提供的NM500芯片、由公司提供的Hardware 3或由提供的基于EpiphanyTM的处理器等。另外地或可替代地,处理器电路系统1602和/或硬件加速器电路系统可以被实施为AI加速协处理器,如由提供的Hexagon 685DSP、由Imagination Technologies提供的PowerVR 2NX神经网络加速器(NNA)、A11或A12仿生SoC内的神经引擎核心和/或由提供的海思麒麟970内的神经处理单元(NPU)等。
在一些实施方案中,处理器电路系统1602的处理器可以是或可以包括一个或多个定制设计的硅核,硅核被专门设计为操作CCM 100、IP2D解析系统850和/或本文所讨论的某个其它系统/装置的对应子系统。这些核可以被设计为包括硬件描述语言逻辑(例如,寄存器传输逻辑、verilog、超高速集成电路硬件描述语言(VHDL)等)的可合成核,包括电子组件和连接的门级描述和/或特定工艺超大规模集成电路(VLSI)布局的网表核(netlistcores),和/或晶体管布局格式的模拟或数字逻辑。在这些实施方案中,CCM 100、IP2D解析系统850和/或本文所讨论的某个其它系统/装置的一个或多个子系统可以至少部分地在定制设计的硅芯上操作。这些“硬件化”的子系统可以集成到更大的芯片组中,但可能比使用通用处理器核更高效。
系统存储器电路系统1604包括被布置成提供主存储的任何数量的存储器装置,处理器电路系统1602从所述主存储中连续读取存储在其中的指令1682以供执行。另外地或可替代地,存储器电路系统1604是与处理器电路系统1602相关联的片上存储器或寄存器。作为示例,存储器电路系统1604可以包含易失性存储器,如随机存取存储器(RAM)、动态RAM(DRAM)、同步DRAM(SDRAM)等。存储器电路系统1604还可以包括非易失性存储器(NVM),例如高速电可擦除存储器(通常被称为“闪速存储器”)、相变RAM(PRAM)、电阻存储器(如磁阻式随机存取存储器(MRAM))等。存储器电路系统1604还可以包括永久存储装置,其可以是任何类型的临时和/或永久存储装置,包含但不限于非易失性存储器,光、磁和/或固态大容量存储装置等。
在一些实施方案中,存储器电路系统1604和存储电路系统1608的一些方面(或装置)可以与处理装置1602集成在一起,例如安置在集成电路微处理器等内的RAM或FLASH存储器。在其它实施方案中,存储器电路系统1604和/或存储电路系统1608可以包括独立的装置,如外部磁盘驱动器、存储阵列或数据库系统中使用的任何其它存储装置。存储器装置和处理装置可以可操作地耦接在一起,或者例如通过I/O端口、网络连接等彼此通信,使得处理装置可以读取存储在存储器上的文件。
根据权限设置,一些存储器按设计可能是“只读”的(ROM),也可能不是。存储器的其它示例可以包括但不限于WORM、EPROM、EEPROM、FLASH等,它们可以在固态半导体装置中实施。其它存储器可以包括移动部件,如传统的旋转磁盘驱动器。所有此类存储器都可以是“机器可读的”,因为它们可以被处理装置读取。
存储电路系统1608被布置成提供如数据、应用、操作系统(OS)等信息的持久存储。作为实例,存储电路系统1608可以被实施为硬盘驱动器(HDD)、微型HDD、固态盘驱动器(SSDD)、闪存卡(例如,SD卡、microSD卡、xD图像卡等)、USB闪存驱动器、与处理器电路系统1602相关联的片上存储器或寄存器、电阻变化存储器、相变存储器、全息存储器或化学存储器等。
存储电路系统1608是可配置的或可操作的,以软件、固件、微码或硬件级指令的形式存储计算逻辑1680(或“模块1680”),以实施本文所描述的技术。计算逻辑1680可以用于存储编程指令的工作副本和/或永久副本,或存储用于创建编程指令的数据,用于系统1600的各个组件(例如,驱动器、库、应用程序编程接口(API)等)、系统1600的OS、一个或多个应用的操作,和/或用于执行本文所讨论的各个方面。计算逻辑1680可以作为指令1682或用于创建指令1682的数据被存储或加载到存储器电路系统1604中,其然后被处理器电路系统1602访问以供执行,从而实施本文所描述的功能。处理器电路系统1602通过互连(IX)1606访问存储器电路系统1604和/或存储电路系统1608。指令1682指导处理器电路系统1602执行特定的动作序列或流程,例如,如关于先前所描绘的操作和功能的流程图和框图所描述的。各种元件可以由处理器电路系统1602支持的汇编指令或高级语言来实施,汇编指令或高级语言可以被编译成指令1684或用于创建指令1684的数据,以由处理器电路系统1602执行。编程指令的永久副本可以在工厂或现场通过例如分发介质(未示出)、通过通信接口(例如,来自分发服务器(未示出))或空中下载(OTA)放置在存储电路系统1608的永久存储装置中。
系统1600的操作系统(OS)可以是通用OS或专门为计算系统1600编写和定制的OS。例如,当系统1600是服务器系统或台式/膝上型系统1600时,OS可以是Unix或类似Unix的OS,如例如由红帽企业版(Red Hat Enterprise)提供的Linux、由Microsoft提供的Windows 10TM或由Apple提供的macOS等。在系统1600是移动装置的另一个示例中,OS可以是移动OS,如由Google提供的由Apple提供的由Microsoft提供的Windows 10或由KaiOS技术公司提供的KaiOS等。
OS管理计算机硬件和软件资源,并且为各种应用(例如,一个或多个loci/模块1680)提供公共服务。OS可以包括一个或多个驱动器或API,其操作以控制嵌入在系统1600中、连接到系统1600或以其它方式与系统1600通信耦接的特定装置。驱动器可以包括允许系统1600的其它组件交互或控制可能存在于系统1600内或连接到所述系统的各种I/O装置的单独驱动器。例如,驱动器可以包括用于控制和允许访问显示装置的显示驱动器、用于控制和允许访问系统1600的触摸屏接口的触摸屏驱动器、用于获得传感器电路系统1621的传感器读数并且控制和允许访问传感器电路系统1621的传感器驱动器、用于获得致动器1622的致动器位置和/或控制和允许访问致动器1622的致动器驱动器、用于控制和允许访问嵌入式图像捕获装置的相机驱动器、用于控制和允许访问一个或多个音频装置的音频驱动器。OS还可以包括一个或多个库、驱动器、API、固件、中间件、软件胶等,它们为一个或多个应用提供程序代码和/或软件组件,以获得和使用来自由系统1600操作的其它应用的数据,如CCM 100、IP2D解析系统850和/或先前所讨论的某个其它系统/装置的各个子系统。
系统1600的组件通过互连(IX)1606彼此通信。IX 1606可以包括任何数量的IX技术,如工业标准架构(ISA)、扩展ISA(EISA)、内部集成电路(I2C)、串行外围接口(SPI)、点对点接口、电源管理总线(PMBus)、外围组件互连(PCI)、PCI快速(PCIe)、Ultra Path接口(UPI)、加速器链接(IAL)、通用应用程序编程接口(CAPI)、QuickPath互连(QPI)、Omni-Path架构(OPA)IX、RapidIOTM系统互连、以太网、加速器高速缓存一致性互连(CCIA)、Gen-Z联盟IX、开放一致加速器处理器接口(OpenCAPI)和/或任何数量的其它IX技术。IX 1606可以是例如在基于SoC的系统中使用的专有总线。
通信电路系统1609是用于通过一个或多个网络(例如,网络1650)和/或与其它装置通信的硬件元件或硬件元件的集合。通信电路系统1609包括调制解调器1610和收发器电路系统(“TRx”)812。调制解调器1610包括一个或多个处理装置(例如,基带处理器),以执行各种协议和无线电控制功能。调制解调器1610可以与系统1600的应用电路系统(例如,处理器电路系统1602和CRM 860的组合)对接,用于生成和处理基带信号以及控制TRx 1612的操作。调制解调器1610可以处理各种无线电控制功能,无线电控制功能使得能够根据一个或多个无线通信协议经由TRx 1612与一个或多个无线电网络进行通信。调制解调器1610可以包括如但不限于一个或多个单核或多核处理器(例如,一个或多个基带处理器)或控制逻辑的电路系统,以处理从TRx 1612的接收信号路径接收到的基带信号,并且生成要经由发射信号路径提供给TRx 1612的基带信号。调制解调器1610可以实施实时OS(RTOS)来管理调制解调器1610的资源、调度任务等。
通信电路系统1609还包括TRx 1612,以使用调制的电磁辐射通过非固体介质实现与无线网络的通信。TRx 1612包括接收信号路径,信号接收路径包括电路系统,以将模拟RF信号(例如,现有的或接收到的调制波形)转换成要提供给调制解调器1610的数字基带信号。TRx 1612还包含发射信号路径,发射信号路径包括可配置或可操作以将由调制解调器1610提供的数字基带信号转换成模拟RF信号(例如,调制波形)的电路系统,其中模拟RF信号将被放大并通过包括一个或多个天线元件(未示出)的天线阵列发射。天线阵列可以是在一个或多个印刷电路板的表面上制造的多个微带天线或印刷天线。天线阵列可以形成为各种形状的金属箔片(例如,贴片天线),并且可以使用金属传输线等与TRx1612耦接。
TRx 1612可以包括一个或多个无线电设备,一个或多个无线电设备与以下无线电通信技术和/或标准中的任何一种或多种兼容和/或可以根据以下技术和/或标准进行操作,包括但不限于:全球移动通信系统(GSM)无线电通信技术、通用分组无线业务(GPRS)无线通信技术、增强型数据速率GSM演进(EDGE)无线通信技术和/或第三代合作伙伴计划(3GPP)无线通信技术(例如通用移动电信系统(UMTS)、多媒体接入自由(FOMA)、3GPP长期演进(LTE)、3GPP高级长期演进(LTE高级)、码分多址2000(CDM2000)、蜂窝数字分组数据(CDPD)、Mobitex、第三代(3G)、电路交换数据(CSD)、高速电路交换数据(HSCSD)、通用移动电信系统(第三代)(UMTS(3G))、宽带码分多址(通用移动电信系统)(W-CDMA(UMTS))、高速分组接入(HSPA)、高速下行链路分组接入(HSDPA)、高速上行链路分组接入(HSUPA)、高速分组接入增强(HSPA+)、通用移动电信系统-时分双工(UMTS-TDD)、时分-码分多址(TD-CDMA)、时分-同步码分多址(TD-CDMA)、第3代合作伙伴计划版本8(第4代之前)(3GPP Rel.8(4G之前))、3GPP Rel.9(第3代合作伙伴计划第9版)、3GPP Rel.10(第3代合作伙伴计划第10版)、3GPP Rel.11(第3代合作伙伴计划第11版)、3GPP Rel.12(第3代合作伙伴计划第12版)、3GPP Rel.8(第3代合作伙伴计划第8版)、3GPP Rel.14(第3代合作伙伴计划第14版)、3GPPRel.15(第3代合作伙伴计划第15版)、3GPP Rel.16(第3代合作伙伴计划第16版)、3GPPRel.17(第3代合作伙伴计划第17版)和后续版本(如Rel.18,Rel.19等)、3GPP 5G、3GPP LTEExtra、进阶升级版LTE、LTE许可辅助接入(LAA)、MuLTEfire、UMTS陆地无线接入(UTRA)、演进的UMTS陆地无线接入(E-UTRA)、高级长期演进(第4代)(高级LTE(4G))、cdmaOne(2G)、码分多址2000(第三代)(CDM2000(3G))、演进数据优化或仅演进数据(EV-DO)、高级移动电话系统(第1代)(AMPS(1G))、全接入通信系统/扩展全接入通信系统(TACS/ETACS)、数字AMPS(第2代)(D-AMPS(2G))、一键通(PTT)、移动电话系统(MTS)、改进的移动电话系统(IMTS)、高级移动电话系统(AMTS)、OLT(挪威语为Offentlig Landmobil Telefoni,公共陆地移动电话)、MTD(移动电话系统D或移动电话系统D的瑞典语缩写)、公共自动陆地移动(Autotel/PALM)、ARP(芬兰语为Autoradiopuhelin,“汽车无线电话”)、NMT(北欧移动电话)、NTT(日本电报电话)的高容量版本(Hicap)、蜂窝数字分组数据(CDPD)、Mobitex、DataTAC、集成数字增强网络(iDEN)、个人数字蜂窝(PDC)、电路交换数据(CSD)、个人手持电话系统(PHS)、宽带集成数字增强网络(WiDEN)、iBurst、无执照移动接入(UMA),也被称为3GPP通用接入网络或GAN标准)、蓝牙、蓝牙低能量(BLE)、基于IEEE 802.15.4的协议(例如,低功率无线个人局域网(6L0WPAN)上的IPv6、WirelessHART、MiWi、Thread、1600.11a等)WiFi-direct、ANT/ANT+、ZigBee、Z-Wave、3GPP装置到装置(D2D)或邻近服务(ProSe)、通用即插即用(UPnP)、低功率广域网(LPWAN)、LoRaWANTM(远程广域网)、Sigfox、无线千兆联盟(WiGig)标准、毫米波标准(工作在10-300GHz及以上的无线系统,如WiGig、IEEE 802.11ad、IEEE 802.11ay等)、工作在300GHz和THz波段以上的技术、(基于3GPP/LTE或IEEE 802.11p和其它)车对车(V2V)和车对X(V2X)以及车对基础设施(V2I)和基础设施对车(I2V)通信技术、3GPP蜂窝V2X、DSRC(专用短程通信)通信系统(如智能运输系统等)、欧洲ITS-G5系统(即,基于IEEE 802.11p的DSRC的欧洲风格,包括ITS-G5A(即,ITS-G5在欧洲ITS频带中的操作,专用于频率范围为5,875GHz至5,905GHz的ITS的安全相关应用)、ITS-G5B(即,在欧洲ITS频带中的操作,专用于频率范围为5,855GHz至5,875GHz的ITS的非安全应用)、ITS-G5C(即,ITS应用在5,470GHz至5,725GHz的频率范围内运行)等)。除了上文列出的标准之外,任何数量的卫星上行链路技术可以用于TRx 1612,包括例如符合ITU(国际电信联盟)或ETSI(欧洲电信标准协会)发布的标准的无线电,以及其它现有的和尚未制定的技术。
可以包括网络接口电路系统/控制器(NIC)1616,以使用标准网络接口协议向网络1650或其它装置提供有线通信。标准网络接口协议可以包括以太网、基于GRE隧道的以太网、基于多协议标签交换(MPLS)的以太网、基于USB的以太网,或者可以基于其它类型的网络协议,如控制器局域网(CAN)、本地互连网络(LIN)、DeviceNet、ControlNet、高速公路+(Data Highway+)、PROFIBUS或PROFINET等。可以使用物理连接通过NIC 1616向/从系统1600提供网络连接,物理连接可以是电的(例如,“铜互连”)或光的。物理连接还包括合适的输入连接器(例如,端口、插座、插口等)和输出连接器(例如,插头、引脚等)。NIC 1616可以包括一个或多个专用处理器和/或FPGA,以使用一个或多个上述网络接口协议进行通信。在一些实施方案中,NIC 1616可以包括多个控制器,以提供到使用相同或不同协议的其它网络的连接。例如,系统1600可以包括通过以太网向云提供通信的第一NIC 1616,以及通过另一种类型的网络向其它装置提供通信的第二NIC 1616。在一些实施方案中,NIC 1616可以是用于将系统1600连接到路由或交换装置的高速串行接口(HSSI)NIC。
网络1650包括计算机、各个计算机之间(例如,系统1600与远程系统1655之间)的网络连接、以及用于使得计算机之间能够通过相应的网络连接进行通信的软件例程。在这方面,网络1650包括一个或多个网络元件,所述一个或多个网络元件可以包括一个或多个处理器、通信系统(例如,包括网络接口控制器、连接到一个或多个天线的一个或多个发射器/接收器等)以及计算机可读介质。此类网络元件的示例可以包括无线接入点(WAP)、家庭/商业服务器(具有或不具有射频(RF)通信电路系统)、路由器、交换机、集线器、无线电信标、基站、微微蜂窝或小蜂窝基站和/或任何其它类似的网络装置。到网络1650的连接可以使用下文所讨论的各种通信协议通过有线或无线连接。如本文所使用的,有线或无线通信协议可以指由通信装置/系统实施以与其它装置通信的一组标准化规则或指令,包括用于数据打包/解包、调制/解调信号、协议栈实施等的指令。在所展示的装置之间的通信会话中可以涉及多于一个网络。到网络1650的连接可能需要计算机执行软件例程,软件例程启用例如计算机网络的OSI模型的七层或无线(或蜂窝)电话网络中的等效物。
网络1650可以表示互联网、一个或多个蜂窝网络、局域网(LAN)或广域网(WAN)(包含专有和/或企业网络)、基于传输控制协议(TCP)/互联网协议(IP)的网络或其组合。网络1650可以与拥有或控制提供网络相关服务所必需的设备和其它元件的网络运营商相关联,设备和元件例如是一个或多个基站或接入点、用于路由数字数据或电话呼叫的一个或多个服务器(例如,核心网络或骨干网络)等。可以使用其它网络来代替互联网或作为互联网的补充,其它网络如内联网、外联网、虚拟专用网(VPN)、企业网络、非基于TCP/IP的网络、任何LAN或WAN等。
外部接口1618(也被称为“I/O接口电路系统”等)是可配置的或可操作的,以将系统1600与外部装置或子系统连接或耦接。外部接口1618可以包含任何合适的接口控制器和连接器,以将系统1600与外部组件/装置耦接。作为实例,外部接口1618可以是外部扩展总线(例如,通用串行总线(USB)、FireWire、Thunderbolt等),用于将系统1600与外部(外设)组件/装置连接。外部装置除其它外包括传感器电路系统1621、致动器1622和定位电路系统1645,但也可以包括图16未示出的其它装置或子系统。
传感器电路系统1621可以包括装置、模块或子系统,其目的是检测其环境中的事件或变化并将关于检测到的事件的信息(传感器数据)发送到某个其它装置、模块、子系统等。此类传感器621的示例除其它外包括惯性测量单元(IMU),包括加速度计、陀螺仪和/或磁力计;微机电系统(MEMS)或纳米机电系统(NEMS),包括3轴加速度计,3轴陀螺仪和/或磁力计;液位传感器;流量传感器;温度传感器(例如,热敏电阻器);压力传感器;气压传感器;重力仪;高度计;图像捕获装置(例如,相机);光检测和测距(LiDAR)传感器;接近传感器(例如,红外辐射探测器等);深度传感器;环境光传感器;超声波收发器;麦克风;等等。
外部接口1618将系统1600连接到致动器1622,致动器1622允许系统1600改变其状态、位置和/或定向,或者移动或控制机构或系统。致动器1622包括用于移动或控制机构或系统的电气和/或机械装置,和/或将能量(例如,电流或移动的空气和/或液体)转换为某种运动。致动器1622可以包括一个或多个电子(或电化学)装置,如压电生物晶型、固态致动器、固态继电器(SSR)、基于形状记忆合金的致动器、基于电活性聚合物的致动器、继电器驱动器集成电路(IC)和/或类似物。致动器1622可以包括一个或多个机电装置,如气动致动器、液压致动器、包含机电继电器(EMR)的机电开关、电机(例如,直流电机、步进电机、伺服机构等)、轮子、推进器、螺旋桨、爪子、夹子、钩子、可听声音发生器和/或其它类似的机电组件。系统1600可以被配置或可操作,以基于从服务提供商和/或各种客户端系统接收的一个或多个捕获的事件和/或指令或控制信号来操作一个或多个致动器1622。系统1600可以向各种致动器1622(或控制一个或多个致动器1622的控制器)发送指令,以如本文所描述的重新配置电气网络。
定位电路系统1645包括用于接收和解码由全球导航卫星系统(GNSS)的定位网络发射/广播的信号的电路系统。导航卫星星座(或GNSS)的示例包括美国的全球定位系统(GPS)、俄罗斯的全球导航系统(GLONASS)、欧盟的伽利略系统、中国的北斗导航卫星系统、区域导航系统或GNSS增强系统(例如,印度星座导航(NAVIC)、日本的准天顶卫星系统(QZSS)、法国的多普勒轨道测量和卫星集成无线电定位(DORIS)等)等。定位电路系统1645包括各种硬件元件(例如,包括硬件装置,如开关、过滤器、放大器、天线元件等,以促进OTA通信),以与定位网络(如导航卫星星座节点)进行通信。定位电路系统1645可以包括用于定位、导航和定时(Micro-PNT)IC的微技术,其使用主定时时钟在没有GNSS辅助的情况下执行位置跟踪/估计。定位电路系统1645还可以是通信电路系统1609的一部分或与之交互,以与定位网络的节点和组件进行通信。定位电路系统1645还可以向应用电路系统提供位置数据和/或时间数据,其可以使用所述数据与各种基础设施(例如,无线电基站)同步操作,用于逐圈导航等。
输入/输出(I/O)装置1656可以存在于系统1600内部或连接到系统1600。I/O装置1656包括输入装置电路系统和输出装置电路系统,输入装置电路系统和输出装置电路系统包括一个或多个被设计为使得用户能够与系统1600交互的用户界面和/或被设计为使得外围组件与系统1600交互的外围组件接口。输入装置电路系统包括用于接受输入的任何物理或虚拟装置,除其它外,包括一个或多个物理或虚拟按钮(例如,复位按钮)、物理键盘、小键盘、鼠标、触摸板、触摸屏、麦克风、扫描仪和/或耳机等。输出装置电路系统用于显示或传达信息,如传感器读数、致动器位置或其它类似信息。数据和/或图形可以显示在输出装置电路系统的一个或多个用户界面组件上。输出装置电路系统可以包括任何数量的和/或音频或视频显示的组合,除其它外,包括一个或多个简单的可视输出/指示器(例如,二进制状态指示器(例如,发光二极管(LED))和多字符可视输出,或更复杂的输出,如显示装置或触摸屏(例如,液体晶体显示器(LCD)、LED显示器、量子点显示器、投影仪等),其输出的字符、图形、多媒体对象等由系统1600的操作生成或产生。输出装置电路系统还可以包括扬声器或其它音频发射装置和/或打印机等。传感器电路系统1621可以用作输入装置电路系统(例如,图像捕捉装置、运动捕捉装置等),一个或多个致动器1622可以用作输出装置电路系统(例如,用于提供触觉反馈的致动器等)。在另一个示例中,近场通信(NFC)电路系统(包括与天线元件耦接的NFC控制器和处理装置)可以被包括,以读取电子标签和/或与另一个NFC启用装置连接。外围组件接口可以包括但不限于非易失性存储器端口、通用串行总线(USB)端口、音频插孔、电源接口等。
电池1624可以耦接到系统1600以向系统1600供电,其可用于其中系统1600不在固定位置的实施方案中,如当系统1600是移动或膝上型客户端系统时。电池1624可以是锂离子电池、铅酸汽车电池或金属空气电池,如锌空气电池、铝空气电池、锂空气电池和/或锂聚合物电池等。在将系统1600安装在固定位置的实施方案中,如当系统被实施为服务器计算机系统时,系统1600可以具有耦接到电网的电源。在这些实例中,系统1600可以包括电源三通电路系统,以提供从网络电缆抽取的电力,从而使用单根电缆向系统1600提供电源和数据连接。
电源管理集成电路系统(PMIC)1626可以包括在系统1600中以跟踪电池1624的充电状态(SoCh),并且控制系统1600的充电。PMIC 1626可以用于监测电池1624的其它参数以提供故障预测,如电池1624的健康状态(SoH)和功能状态(SoF)。PMIC 1626可以包括电压调节器、浪涌保护器、电源报警检测电路系统。电源报警检测电路系统可以检测一种或多种欠压(电压不足)和浪涌(过压)状况。PMIC 1626可以通过IX 1606将电池1624上的信息传送到处理器电路系统1602。PMIC 1626还可以包括模数(ADC)转换器,ADC转换器允许处理器电路系统1602直接监测电池1624的电压或来自电池1624的电流。电池参数可以用于确定系统1600可以执行的动作,如传输频率、网状网络操作、感测频率等。
电力块1628,或耦接到电网的其它电源,可以与PMIC 1626耦接以对电池1624进行充电。在一些实例中,电力块1628可以被无线电力接收器替代,从而以无线方式获得电力,例如,通过系统1600中的环形天线。在这些实施方案中,无线电池充电电路可以包括在PMIC1626中。所选择的具体充电电路取决于电池1624的大小和所需的电流。
系统1600可以包括图16所示的组件的任何组合,然而,一些组件可以省略,也可以存在其它的组件,并且示出的组件的不同布置可能发生在其它实施方案中。在系统1600是或属于服务器计算机系统的一个实例中,电池1624、通信电路系统1609、传感器1621、致动器1622和/或POS1645以及可能部分或全部的I/O装置1656可以被省略。
此外,本文所讨论的示例实施方案可以采取计算机程序产品或数据的形式来创建计算机程序,其中将计算机程序或数据体现在任何有形或非暂时性表达介质中,将计算机可用的程序代码(或用于创建计算机程序的数据)体现在所述介质中。例如,存储器电路系统1604和/或存储电路系统1608可以实现为非暂时性计算机可读存储介质(NTCRSM),其可能适合于用于存储指令(或创建指令的数据),响应于设备对的指令的执行,所述指令使设备(如关于图1-35所描述的任何装置/组件/系统)实践本公开的所选方面。如所示出的,NTCRSM可以包括许多编程指令1684、1682(或用于创建编程指令的数据)。编程指令1684、1682可以是可配置的或可操作的,以使得装置(例如,关于图1-17所描述的任何装置/组件/系统)响应于编程指令1684、1682的执行,执行与操作系统功能、一个或多个应用和/或本公开的各方面相关的各种编程操作(包含与图1-17相关联的各种编程操作)。编程指令1684、1682可以对应于先前所讨论的关于图16的计算逻辑1680、指令1682和1684中的任何一个。
另外地或可替代地,编程指令1684、1682(或用于创建指令1684、1682的数据)可以安置在多个NTCRSM上。另外地或可替代地,编程指令1684、1682(或用于创建指令1684、1682的数据)可以安置在如信号等计算机可读暂时性存储介质上。由机器可读介质1684、1682体现的编程指令可以利用许多传输协议中的任何一种(例如,HTTP等)通过网络接口装置(例如,图16的通信电路系统1609和/或NIC 1616)使用传输介质在通信网络上发射或接收。
一种或多种计算机可用介质或计算机可读介质的任何组合可以用作或代替NTCRSM。计算机可用或计算机可读介质例如可以是但不限于一种或多种电子、磁性、光学、电磁、红外或半导体系统、设备、装置或传播介质。例如,NTCRSM可以由先前所描述的用于存储电路系统1608和/或存储器电路系统1604的装置来实现。计算机可读介质的更具体的示例(非详尽清单)可以包括如下项目:具有一根或多根导线的电气连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM、闪速存储器等)、光纤、便携式光盘只读存储器(CD-ROM)、光存储装置和/或光盘、传输介质(如支持互联网或内部网的介质)、磁性存储装置或任何数量的其它硬件装置。在本公开的上下文中,计算机可用或计算机可读介质可以是可以包含、存储、传送、传播或传输程序(或用于创建程序的数据)以供指令执行系统、设备或装置使用或与之连接的任何介质。计算机可用介质可以包括传播的数据信号与计算机可用程序代码(例如,包括编程指令1684、1682)或用于创建与其一起体现的程序代码的数据,无论是在基带中还是作为载波的一部分。计算机可用于创建程序的程序代码或数据可以使用任何适当的介质进行传输,包含但不限于无线、有线、光纤电缆、射频等。
另外地或可替代地,本文所描述的程序代码(或用于创建程序代码的数据)可以以压缩格式、加密格式、片段格式、打包格式等中的一种或多种存储。程序代码(例如,编程指令1684、1682)或用于创建本文所描述的程序代码的数据可能需要以下中的一项或多项:安装、修改、适配、更新、组合、补充、配置、解密、解压缩、解包、分发、重新分配等,以便使它们可由计算装置和/或其它机器直接读取和/或可执行。例如,程序代码或用于创建程序代码的数据可以存储在多个部分中,这些部分被单独压缩、加密并存储在单独的计算装置上,其中这些部分在解密、解压缩和组合时形成一组可执行指令,这些指令实施程序代码或数据以创建程序代码,如本文所描述的那些。在另一个实例中,程序代码或用于创建程序代码的数据可以存储在它们可以被计算机读取的状态中,但需要添加库(例如,动态链接库)、软件开发工具包(SDK)、应用程序编程接口(API)等,以便在特定计算装置或其它装置上执行指令。在另一个实例中,程序代码或用于创建程序代码的数据可能需要被配置(例如,存储的设置、数据输入、记录的网络地址等),然后才能全部或部分执行/使用程序代码或用于创建程序代码的数据。在此实例中,程序代码(或用于创建程序代码的数据)可以被解压缩、配置以供正确执行,并且存储在第一位置,其中配置指令位于与第一位置不同的第二位置。配置指令可以由不与启用所公开技术的指令共位于存储或执行位置的动作、触发器或指令启动。因此,所公开的程序代码或用于创建程序代码的数据旨在涵盖此类机器可读指令和/或程序或数据以创建此类机器可读的指令和/或程序,而不管机器可读指令和/或程序在存储或以其它方式静止或传输时的特定格式或状态。
用于执行本公开的操作的计算机程序代码,包括例如编程指令1684、1682、计算逻辑指令1680、指令1682和/或指令1684,可以实施为要由一个或多个处理器使用任何合适的计算机语言执行的软件代码,例如Python、PyTorch、NumPy、ArcPy、Ruby、Ruby on Rails、Scala、Smalltalk、JavaTM、C++、C#、“C”、Kotlin、Swift、Rust、Go(或“Golang”)、ECMAScript、JavaScript、TypeScript、Jscript、ActionScript、Server-Side JavaScript(SSJS)、PHP、Pearl、Lua、带即时编译器的Torch/Lua(LuaJIT)、加速移动页面脚本(AMPscript)、VBScript、JavaServer Pages(JSP)、Active Server Pages(ASP)、Node.js、ASP.NET、JAMscript、超文本标记语言(HTML)、可扩展HTML(XHTML)、可扩展标记语言(XML)、XML用户界面语言(XUL)、可扩展矢量图形(SVG)、RESTful API建模语言(RAML)、wiki标记或Wikitext、无线标记语言(WML)、Java脚本对象概念(JSON)、Apache MessagePackTM、级联样式表(CSS)、可扩展样式表语言(XSL)、Mustache模板语言、Handlebars模板语言、指南模板语言(GTL)、Thrift、抽象语法符号一(ASN.1)、协议缓冲(protobuf)、Bitcoin Script、字节码、SolidityTM、Vyper(Python衍生)、Bamboo、Lisp样语言(LLL)、BlockstreamTM、Rholang、Michelson、Counterfactual、Plasma、Plutus、Sophia、和/或任何其它编程语言、标记语言、脚本、代码等。在某些实施方案中,合适的集成开发环境(IDE)或软件开发工具包(SDK)可以用于开发此处讨论的程序代码或软件元素,例如,StudioTMIDE、 SDK或包括专有编程语言和/或开发工具的开发工具。此外,本文所描述的部分或全部软件组件或功能可以利用合适的查询语言来查询和存储一个或多个数据库或数据结构中的信息,例如,结构查询语言(SQL)、noSQL和/或其它查询语言。软件代码可以作为计算机或处理器可执行指令或命令存储在物理非暂时性计算机可读介质上。用于执行本公开操作的计算机程序代码也可以用本文讨论的编程语言的任何组合编写。程序代码可以完全在系统1600上执行,部分在系统1600上作为独立软件包执行,部分在系统1600上执行,部分在远程计算机上执行(例如,远程系统1655),或者完全在远程计算机上执行(例如,远程系统1655)。在后一种情况下,远程计算机可以通过任何类型的网络(例如,网络1650)连接到系统1600。
虽然仅示出单个计算装置1600,但计算装置1600可以包括单独或联合执行一组(或多组)指令以执行上述任何一个或多个操作的任何装置或电路系统的集合。计算装置1600可以是集成控制系统或系统管理器的一部分,或者可以作为便携式电子装置提供,可配置或可操作以经由无线传输本地地或远程地与联网系统对接。
前面描述的一些操作可以在软件中实现,而其它操作可以在硬件中实现。本文所描述的一个或多个操作、过程或方法可以由类似于本文描述的设备、装置或系统执行,并参考所展示的图。
图17展示了适合于由计算系统(如先前所讨论的计算系统)使用的NN 1700的示例,如本文讨论的任何示例。NN 1700可以适合于由本文所讨论的一个或多个子系统和/或各种实施方案使用,部分地由UVCS模块的硬件加速器实施。如图所示,示例NN 1700可以是多层前馈NN(FNN),FNN包括输入层1712、一个或多个隐藏层1714和输出层1716。输入层1712接收输入变量(xi)1702的数据。隐藏层1714处理输入,并且最终,输出层1716输出决定或评估(yi)1704。在一个示例实施方案中,NN的输入变量(xi)1702被设置为包含相关变量数据的向量,而NN 1700的输出决定或评估(yi)1704也被设定为向量。作为示例,多层FNN可以通过以下等式表示:
其中i=1、...、N
其中i=1、...、S
在这些等式中,hoi和yi分别是隐藏层变量和最终输出。f()通常是非线性函数,如模拟人脑神经元的sigmoid函数或整流线性(ReLu)函数。R是输入的数量。N是隐藏层的大小,或神经元的数量。S是输出的数量。
FNN的目标是通过训练调整网络变量iw、hw、hb和ob,从而最小化网络输出和期望目标之间的误差函数E,如下所示:
其中
在此等式中,ykp和tkp分别是样本k的pth输出单元的预测值和目标值,m是样本数。另外地或可替代地,NN 1700用于一个或多个计算子系统,如本文讨论的计算子系统。输入变量(xi)1702可以包括由远程装置/传感器收集的各种数据、由各种嵌入式或可访问传感器收集的数据、通过消息交换获得的数据以及描述决策相关因素的数据。输出变量(yi)1704可以包括确定的响应(例如,调整速度、制动、改变车道等)。NN 1700隐藏层的网络变量通过训练数据确定。
所使用的特征可以是特定于实施方案的,并且可以基于例如要检测的对象和要开发和/或使用的模型。评估阶段涉及通过将获得的图像数据与在注册阶段创建的现有对象模型进行比较来标识或分类对象。在评估阶段期间,使用合适的模式识别技术将从图像数据中提取的特征与对象标识模型进行比较。对象模型可以是定性或功能描述、几何表面信息和/或抽象特征向量,并且可以存储在合适的数据库中,数据库使用某种类型的索引方案进行组织,以方便从考虑中消除不太可能的候选对象。
在一个示例中,NN 1700用于基于从一个或多个传感器获得的y传感器数据的运动检测。在另一个示例中,NN 1700用于对象检测/分类。对象检测或识别模型可以包括注册阶段和评估阶段。在注册阶段,从传感器数据(例如,图像或视频数据)中提取一个或多个特征。特征是单独可测量的性质或特性。对于对象检测,对象特征可以包括对象大小、颜色、形状、与其它对象的关系和/或图像的任何区域或部分,如边缘、脊、角落、斑点和/或一些定义的感兴趣区域(ROI)等。
在另一个示例中,NN 1700用于对象跟踪。对象跟踪和/或计算机视觉技术可以包括例如,边缘检测、角落检测、斑点检测、卡尔曼滤波器、高斯混合模型、粒子滤波器、基于均值偏移的内核跟踪、ML对象检测技术(例如,Viola-Jones对象检测框架、尺度不变特征变换(SIFT)、定向梯度直方图(HOG)等)、深度学习对象检测技术(例如,全卷积神经网络(FCNN)、区域建议卷积神经网络(R-CNN)、单次多盒检测器、‘你只看一次’(‘you only look once’)(YOLO)算法等)等。
在另一个示例中,NN 1700用于字符识别,其中特征可以包括沿水平和竖直方向计算黑色像素数的直方图、内部孔数、笔划检测和许多其它项目。
在另一个示例中,NN 1700用于主题分类,其中特征可以包括单个主题、令牌、令牌序列、术语频率、文档频率和/或反向文档频率、对数计数比率(例如,当使用朴素贝叶斯算法时)等。
在另一个示例中,NN 1700是特征提取模型,其学习从表示的信息对象中提取显著特征,例如使用词嵌入。词嵌入是单词的分布式表示,其中具有相似含义(例如,基于其用法)的不同单词也具有相似的表示。另外地或可替代地,可以使用完全连接的模型来解释所提取的特征,以预测输出。在此示例中,NN 1700可以是卷积NN(CNN),CNN可以集成到更大的网络中,并且被训练为与其协同工作以产生最终结果。CNN层的职责是提取有意义的子结构,所述子结构对手头的整体预测任务很有用。用于主题分类和/或NLP的CNN和NN 1700的其它方面在[Goldberg_NLP]中有讨论。
在图17的示例中,为了便于说明,在NN中仅有一个隐藏层,然而在一些实施方案中,可以有多个隐藏层。此外,NN可以使用其它类型的拓扑来实施,如卷积NN(CNN)、递归NN(RNN)、长短期记忆(LSTM)算法、深度CNN(DCN)、反卷积NN(DNN)、门控循环单元(GRU)、深度信念NN,前馈NN(FFN)、深度FNN(DFF)、深度堆叠网络、马尔可夫链、感知NN、贝叶斯网络(BN)、动态BN(DBN)、线性动力系统(LDS)、交换LDS(SLDS)和/或任何其它合适的NN布置或拓扑,例如本文所讨论的拓扑。
8.示例实施方案
除了目前描述的示例实施方案,其它的示例包括以下非限制性示例实施方案。每个非限制性示例可以独立存在,或者可以与下面或整个本公开中提供的任何一个或多个其它示例以任何排列或组合方式组合。
示例A01包括一种方法,所述方法包括:标识来自域的事件;确定事件的数量;标识与所述事件相关联的内容;标识主题;标识所述内容与所述主题的相关性;以及基于所述事件的数量和所述内容与所述主题的相关性为所述域和所述主题生成消费评分。
示例A02包括示例A01和/或本文中的一些其它示例的方法,并进一步包括:将所述消费评分中达到阈值的值标记为激增。
示例A03包括示例A01-A02和/或本文中的一些其它示例的方法,并进一步包括:标识所述事件的数量在不同时间段内的变化;以及根据所述事件的数量的变化来调整所述消费评分。
示例A04包括示例A01-A03和/或本文中的一些其它示例的方法,并进一步包括:标识在不同时间段内生成所述事件的用户的数量;标识所述用户的数量在不同时间段内的变化;以及基于所述用户的数量的变化来调整所述消费评分。
示例A05包括示例A01-A04和/或本文中的一些其它示例的方法,并进一步包括:比较从多个不同域访问的内容的相关性与整体相关性;当所述相关性低于所述整体相关性时,为所述消费评分分配较低的初始值;当所述相关性与所述整体相关性大致相同时,为所述消费评分分配中等初始值;当所述相关性高于所述整体相关性时,为所述消费评分分配较高的初始值。
示例A06包括示例A01-A05和/或本文中的一些其它包括的方法,并进一步包括:标识所述用户参与所述内容的类型;以及基于所述用户参与所述内容的类型调整所述内容的相关性。
示例A07包括示例A06和/或本文中的一些其它示例的方法,其中用户参与的类型包括页面停留时间和页面滚动的类型。
示例A08包括示例A01-A07和/或本文中的一些其它一些示例的方法,并进一步包括:计算在第一时间段内生成第一数量的所述事件的第一用户数量;计算在第二时间段内生成第二数量的所述事件的第二用户数量;当所述第二用户数量小于所述第一用户数量时,降低所述第二时间段内的消费评分。
示例A09包括示例A01-A08和/或本文中的一些其它示例的方法,并进一步包括:标识来自网络地址的事件;标识与所述网络地址相关联的公司;以及将所述公司与所述消费评分相关联。
示例A10包括示例A10和/或本文中的一些其它示例的方法,并进一步包括:标识与所述网络地址相关联的公司的位置;以及将所述位置与消费评分相关联。
示例A11包括示例A01-A10和/或本文中的一些其它示例的方法,并进一步包括:标识第一时间段内的第一组事件;标识在所述第一组事件期间访问的第一组内容;标识所述第一组内容与所述主题的第一相关性;基于所述第一组事件的数量和所述第一相关性生成所述第一时间段内的消费评分的第一值;标识所述第一时间段之后的第二时间段内的第二组事件;标识在所述第二组事件期间访问的第二组内容;标识所述第二组内容与所述主题的第二相关性;以及基于所述第二组事件的数量和所述第二相关性生成所述第二时间段内的消费评分的第二值。
示例A12包括示例A11和/或本文中的一些其它示例的方法,并进一步包括:基于所述第一组事件的数量与所述第二组事件的数量之间的变化来调整所述第二值。
示例A13包括示例A11-A12和/或本文中的一些其它一些示例的方法,并进一步包括:标识所述第二时间段之后的第三时间段内的第三组事件;标识在所述第三组事件期间访问的第三组内容;标识所述第三组内容与所述主题的第三相关性;基于所述第三组事件的数量和所述第三相关性生成所述第三时间段内的消费评分的第三值;以及基于所述第一组事件的数量、所述第二组事件的数量与所述第三组事件的数量之间的变化来调整所述第三值。
示例A14包括一种方法,所述方法包括:标识与实体相关联的事件;标识与事件相关的内容;标识所述内容在一个时间段内与所述主题的相关性;标识所述时间段内的事件的数量;以及基于所述内容的相关性和所述事件的数量计算所述时间段内的消费评分。
示例A15包括示例A14和/或本文中的一些其它示例的方法,并进一步包括:标识在所述时间段内生成所述事件的用户的数量;以及基于所述用户的数量计算所述消费评分。
示例A16包括示例A14-A16和/或本文中的一些其它示例的方法,并进一步包括:标识在一系列时间段内与所述实体和所述主题相关联的事件的数量;以及基于所述事件的数量在所述一系列时间段内的变化调整所述消费评分。
示例A17包括示例A16和/或本文中的一些其它示例的方法,并进一步包括:标识在一系列时间段内生成事件的用户数量;以及基于所述用户的数量在所述一系列时间段内的变化调整所述消费评分。
示例A18包括示例A16-A17和/或本文中的一些其它示例的方法,并进一步包括:标识与实体相关联的位置;基于所述内容的相关性和与所述位置关联的所述事件的数量计算所述位置的消费评分。
示例A19包括示例A16-A18和/或本文中的一些其它示例的方法,并进一步包括:当所述消费评分达到阈值时,标识所述消费评分中的激增。
示例A20包括示例A19和/或本文中的一些其它示例的方法,并进一步包括:将所述激增映射到与所述实体相关联的联系人。
示例A21包括示例A20和/或本文中的一些其它示例的方法,并进一步包括:向发布者发送所述激增的通知。
示例A22包括示例A21和/或本文中的一些其它示例的方法,其中所述激增的通知被配置成触发发布者将与所述主题相关联的信息发送到与所述实体相关联的联系人。
示例A23包括示例A22和/或本文中的一些其它示例的方法,其中所述激增的通知被配置成触发发布者将所述信息发送到具有与所述主题相关联的职位的联系人。
示例A24包括一种方法,所述方法包括:标识或确定与访问内容相关联的事件;标识或确定用户参与所述内容的类型;基于所述用户参与的类型计算所述内容的参与度评分;计算所述内容与主题的相关性;以及基于所述参与度评分调整所述内容的相关性。
示例A25包括示例A24和/或本文中的一些其它示例的方法,并进一步包括:基于用户内容停留时间计算所述参与度评分。
示例A26包括示例A25和/或本文中的一些其它示例的方法,并进一步包括:基于内容滚动深度计算所述参与度评分。
示例A27包括示例A24-A26和/或本文中的一些其它一些示例的方法,并进一步包括:基于内容滚动速度计算所述参与度评分。
示例A28包括示例A24-A27和/或本文中的一些其它示例的方法,并进一步包括:基于所述相关性计算消费评分。
示例B01.0包括一种操作内容消费监测器(CCM)的方法,所述方法包括:从访问信息对象的计算机装置获取数据包,所述数据包包括关于会话事件的信息,所述信息对象包括监测和捕获所述会话事件的标签;确定与由所述会话事件中的至少一个会话事件所指示的至少一个网络地址相关联的组织的域名;对于多个时间段中的每个时间段,标识或确定一组所述会话事件,所述一组所述会话事件包括所述组织的域名或与所述组织相关联的一个或多个网络地址;对于所述多个时间段中的每个时间段,标识或确定由所述一组会话事件所指示的组织的成员所访问的一组信息对象;基于所述一组信息对象中的一个或多个词标识或确定多个主题;确定所述一组信息对象与所述多个主题中的每个主题的相关性评分;确定在所述时间段中的每个时间段内生成所述会话事件的组织的唯一用户的数量,所述唯一用户是一个或多个所述计算机装置的用户;基于由所述组织生成的所述会话事件的数量、所述组织的唯一用户的数量以及每个主题的平均相关性评分,生成所述多个时间段中的每个时间段内的所述组织的消费评分;以及基于所述组织的消费评分在所述多个时间段内的变化,确定所述组织的消费评分的激增。
示例B01.1包括示例B01.0和/或本文中的一些其它示例的方法,其中所述标签包括程序代码,所述程序代码使计算机装置监测和捕获由所述计算机装置生成的会话事件并且将包括被捕获的会话事件的数据包发送到CCM。
示例B01.2包括示例B01-B01.1和/或本文中的一些其它示例的方法,其中所述会话事件中的每个会话事件至少标识被访问的信息对象、标识事件类型标识符、以及标识网络地址,其中所述事件类型标识符标识与所述被访问的信息对象相关联的动作或活动,以及从诉述网络地址访问所述被访问的信息对象。
示例B01.3包括示例B01-B01.2和/或本文中的一些其它示例的方法,其中所述信息对象是网页或嵌入在网页中的内容。
示例B01.4包括示例B01-B01.3和/或本文中的一些其它示例的方法,其中确定所述域名包括:从数据库中标识或确定所述域名。
示例B01.5包括示例B01-B01.4和/或本文中的一些其它示例的方法,其中所述相关性评分是平均相关性评分,并且所述平均相关性评分是所述一组信息对象与每个主题的多个相关性评分的平均值,所述多个相关性评分中的每个相关性评分是部分地基于所述一组信息对象中的与每个主题相关联的词的数量和由所述一组会话事件所指示的所述一组信息对象执行的事件类型而计算的。
示例B01.6包括示例B01-B01.5和/或本文中的一些其它示例的方法,其中确定所述多个主题包括:使用机器学习(ML)主题模型确定所述多个主题。
示例B01.7包括示例B01.6和/或本文中的一些其它示例的方法,其中确定所述一组信息对象的相关性评分包括:使用所述ML主题模型或另一个ML模型来确定所述相关性评分。
示例B02包括示例B01-B01.7和/或本文中的一些其它示例的方法,其中为了标识所述激增,执行所述指令以使所述硬件处理器:将所述消费评分中达到所述阈值的值标识为所述激增。
示例B03包括示例B01-B02和/或本文中的一些其它示例的方法,所述方法进一步包括:标识或确定所述会话事件的数量在不同时间段内的变化,并且基于所述会话事件的数量的变化调整所述消费评分;和/或标识或确定在不同时间段内生成所述会话事件的用户的数量,标识所述用户的数量在不同时间段内的变化,并且基于所述用户的数量的变化来调整所述消费评分。
示例B04包括示例B01-B03和/或本文中的一些其它示例的方法,所述方法进一步包括:将所述组织的相关性评分与从与所述组织无关的多个计算机装置访问的信息对象的总体相关性评分进行比较;当所述平均相关性评分低于所述总体相关性时,将“低”初始值分配给所述组织的消费评分;当所述平均相关性评分与所述总体相关性大致相同时,将“中等”初始值分配给所述组织的消费评分;当所述平均相关性评分高于所述总体相关性评分时,将“高”初始值分配给所述消费评分。
示例B05包括示例B01-B05和/或本文中的一些其它示例的方法,所述方法进一步包括:基于所述会话事件中包括的信息来标识或确定用户参与所述信息对象的类型;以及基于用户参与所述内容的类型调整所述信息对象的相关性。
示例B06包括示例B05和/或本文中的一些其它示例的方法,其中所述用户参与的类型包括以下中的一项或多项:信息对象停留时间、滚动数据(例如,滚动类型、滚动深度、滚动速度、滚动条滚动)、鼠标数据(例如,鼠标滚动、鼠标点击、鼠标移动等)、键盘数据(例如,按键等)、触摸数据(例如,触摸手势等)、眼动跟踪数据(例如,注视位置、注视时间、注视感兴趣区域、眼球运动频率/速度/方向等)、一段时间内内容消费的差异以及在信息对象之间切换的选项卡选择。
示例B07包括示例B01-B06和/或本文中的一些其它示例的方法,所述方法进一步包括:计算在第一时间段内生成第一数量的所述会话事件的第一用户数量;计算在第二时间段内生成第二数量的所述会话事件的第二用户数量;当所述第二用户数量小于所述第一用户数量时,降低所述第二时间段内的消费评分。
示例B08包括示例B01-B07和/或本文中的一些其它示例的方法,所述方法进一步包括:标识或确定第一时间段内的来自同一网络地址的第一组会话事件;基于所述第一组会话事件与每个主题的平均相关性评分计算第一消费评分;标识或确定第二时间段内的来自同一网络地址的第二组会话事件;基于所述第二组会话事件与每个主题的平均相关性评分计算第二消费评分;以及基于所述第一消费评分与所述第二消费评分之间的变化计算所述组织的激增评分。
示例B09包括示例B01-B08和/或本文中的一些其它示例的方法,所述方法进一步包括:基于与所述组织相关联的一个或多个网络地址来标识或确定所述组织;基于所述一个或多个网络地址标识或确定所述组织的位置;以及将所标识的位置与所述消费评分相关联。
示例B10包括示例B01-B09和/或本文中的一些其它示例的方法,其中所述一组会话事件包括第一组会话事件和第二组会话事件,并且执行所述指令以使所述硬件处理器:标识或确定第一时间段内的所述第一组会话事件;标识或确定在所述第一组会话事件期间访问的第一组信息对象;标识或确定所述第一组信息对象与每个主题的第一相关性评分;基于所述第一组会话事件的数量和所述第一相关性评分,生成所述第一时间段内的所述消费评分的第一值;标识或确定所述第一时间段之后的第二时间段内的所述第二组会话事件;标识或确定在所述第二组所述会话事件期间访问的第二组信息对象;标识或确定所述第二组信息对象与每个主题的第二相关性评分;标识或确定所述第二相关性评分从所述第一相关性评分增加或减少的速率;以及基于所述第二组会话事件的数量和所述第二相关性评分从所述第一相关性评分增加或减少的速率,生成所述第二时间段内的所述消费评分的第二值。
示例B11包括示例B10和/或本文中的一些其它示例的方法,所述方法进一步包括:基于所述第一组会话事件的数量与所述第二组会话事件的数量之间的变化来调整所述第二值。
示例B12包括示例B11和/或本文中的一些其它一些示例的方法,所述方法进一步包括:标识或确定所述第二时间段之后的第三时间段内的第三组会话事件;标识或确定在所述第三组会话事件期间访问的第三组信息对象;标识或确定所述第三组信息对象与每个主题的第三相关性评分;基于所述第三组会话事件的数量和所述第三相关性生成所述第三时间段内的消费评分的第三值,并且基于所述第一组会话事件的数量、所述第二组会话事件的数量与所述第三组会话事件的数量之间的变化调整所述第三值。
示例B13.0包括一种操作内容消费监测器(CCM)的方法,所述方法包括:从访问信息对象的计算机装置获得包括会话事件的数据包,所述信息对象包括网页、网页中包括的内容或应用程序,所述信息对象包括标签,所述标签包括可执行指令,所述可执行指令使所述计算机装置监测和捕获由所述计算机装置生成的会话事件并且将包括被捕获的会话事件的数据包发送到CCM,所述会话事件中的每个会话事件标识被访问的信息对象、标识事件类型标识符以及标识网络地址,其中所述事件类型标识符标识与所述被访问的信息对象相关联的动作或活动,以及从所述网络地址访问所述被访问的信息对象;访问数据库,以标识与由所述会话事件中的至少一个会话事件所指示的至少一个网络地址相关联的组织的域名;标识或确定多个时间段中的每个时间段内的一组会话事件,所述一组会话事件包括所述组织的域名或与所述组织相关联的一个或多个网络地址;对于每个时间段,标识或确定由所述一组会话事件所指示的组织的成员所访问的一组信息对象;为所述组织标识或确定每个时间段内的一组信息对象与多个主题中的每个主题的平均相关性评分,所述平均相关性评分是基于针对所述一组信息对象与每个主题而计算的多个相关性评分,所述多个相关性评分中的每个相关性评分是部分地基于所述一组信息对象中的与每个主题相关联的词的数量和事件类型而计算的,所述事件类型由所述一组信息对象执行的一组会话事件标识;标识或确定在每个时间段内生成所述会话事件的所述组织的唯一用户数量,所述唯一用户是所述计算机装置中的一个或多个计算机装置的用户;基于由所述组织生成的会话事件数量、所述组织的唯一用户数量和每个时间段内的所述一组信息对象与所述组织的每个主题的所述平均相关性评分来标识或确定每个时间段内的所述组织的消费评分;基于所述组织的消费评分在所述多个时间段内的变化标识或确定所述组织的消费评分的激增;以及向显示装置提供指示所述消费评分和消费评分的激增的数据,以在由所述显示装置显示的用户界面中显示。
示例B13.1包括示例B13和/或本文中的一些其它示例的方法,其中确定所述多个主题包括:使用机器学习(ML)主题模型确定所述多个主题。
示例B13.2包括示例B13.0-B13.1和/或本文中的一些其它示例的方法,其中确定所述一组信息对象的相关性评分包括:使用所述ML主题模型或另一个ML模型确定所述一组信息对象与每个主题的所述平均相关性评分。
示例B14包括示例B13.0-B13.2和/或本文中的一些其它示例的方法,所述方法进一步包括:标识或确定在所述时间段内生成所述会话事件的用户的数量;以及进一步基于所述用户的数量计算所述消费评分。
示例B15包括示例B13-B14和/或本文中的一些其它示例的方法,所述方法进一步包括:标识或确定在所述多个时间段内生成所述会话事件的用户的数量;以及基于所述用户的数量在所述多个时间段内的变化调整所述消费评分。
示例B16包括示例B13-B15和/或本文中的一些其它示例的方法,所述方法进一步包括:标识或确定与所述组织相关联的位置;基于所述信息对象的所述多个相关性评分和与所述位置关联的会话事件的数量计算所述位置的消费评分。
示例B17包括示例B13-B16和/或本文中的一些其它示例的方法,所述方法进一步包括:当所述消费评分达到阈值时标识或确定所述消费评分中的激增。
示例B18包括示例B17和/或本文中的一些其它示例的方法,所述方法进一步包括:将所述激增映射到与所述组织相关联的联系人。
示例B19包括示例B18和/或本文中的一些其它示例的方法,所述方法进一步包括:向服务提供商发送所述激增的通知。
示例B20包括示例B19和/或本文中的一些其它示例的方法,其中所述激增的通知被配置成触发所述服务提供商向与所述组织相关联的联系人发送与所述多个主题中的至少一个主题相关联的信息。
示例B21包括示例B20和/或本文中的一些其它示例的方法,其中所述激增的通知被配置成触发发布者将信息发送到具有与所述多个主题中的至少一个主题相关联的职位的联系人。
示例X01包括示例A01-A28、B01-B21和/或本文中的一些其它示例的方法,其中所述事件包括以下中的一项或多项:数据库会话事件、工作单元事件、客户端或浏览器会话事件、服务器会话事件、远程会话事件(例如,远程桌面会话事件等)、网络会话事件、网页会话事件、HTTP会话事件、telnet远程登录会话事件、SIP会话事件、传输控制协议(TCP)会话事件、用户数据报协议(UDP)会话事件、蜂窝网络事件和/或其它会话类型的其它事件,如本文所描述的会话事件。
示例X02包括示例A01-A28、B01-B21、X01和/或本文中的一些其它示例的方法,其中所述网络地址是互联网协议(IP)地址、公共交换电话号码中的电话号码、蜂窝网络地址、因特网分组交换(IPX)地址、X.25地址、X.21地址、传输控制协议(TCP)或用户数据报协议(UDP)端口号、媒体访问控制(MAC)地址、电子产品代码(EPC)、蓝牙硬件装置地址、通用资源定位器(URL)和/或电子邮件地址。
示例X03包括示例A01-A28、B01-B21、X01-X02和/或本文中的一些其它一些示例的方法,其中示例A01-A28中的任何一个或多个示例可以与示例B01-B21和/或本文中的一些其它示例中任何一个或多个示例组合。
示例Z01包括一种或多种计算机可读介质,所述计算机可读介质包括指令,其中由处理器电路系统执行所述指令将使得所述处理器电路系统执行根据示例A01-A28、B01-B21、X01-X03和/或本文中的一些其它示例中任一项所述的方法。示例Z02包括一种计算机程序,所述计算机程序包括示例Z01的指令。示例Z03a包括一种应用程序编程接口,所述应用程序编程接口针对根据示例Z02所述的计算机程序定义函数、方法、变量、数据结构和/或协议。示例Z03b包括一种定义函数、方法、变量、数据结构、协议等的API或规范,其定义或涉及使用示例A01-A28、B01-B21、X01-X03或其部分中的任一个,或以其它方式与示例A01-A28、B01-B21、X01-X03或其部分中的任一个相关。示例Z04包括一种设备,所述设备包括加载有示例Z01的所述指令的电路系统。示例Z05包括一种设备,所述设备包括能够操作以运行示例Z01的所述指令的电路系统。示例Z06包括一种集成电路系统,所述集成电路系统包括示例Z01的所述处理器电路系统和根据示例Z01所述的一种或多种计算机可读介质中的一者或多者。示例Z07包括一种计算系统,所述计算系统包括示例Z01所述的一种或多种计算机可读介质以及所述处理器电路系统。示例Z08包括示例Z07的计算系统和/或本文中的一个或多个其它示例,其中所述计算系统是系统级封装(SiP)、多芯片封装(MCP)、片上系统(SoC)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、专用集成电路系统(ASIC)、可编程逻辑装置(PLD)、复数PLD(CPLD)、中央处理器(CPU)、图形处理单元(GPU)和/或计算系统包括彼此互连的SiP、MCP、SoC、DSP、FPGA、ASIC、PLD、CPLD、CPU、GPU中的两个或更多个。示例Z09包括一种设备,所述设备包括用于执行示例Z01的所述指令的构件。示例Z10包括一种信号,所述信号是作为执行示例Z01的所述指令的结果而生成的。示例Z11包括一种数据单元,所述数据单元是作为执行示例Z01的所述指令的结果而生成的。示例Z12包括示例Z11的数据单元和/或本文中的一些其它示例,其中所述数据单元是数据报、网络数据包、数据帧、数据段、协议数据单元(PDU)、服务数据单元(SDU)、消息或数据库对象。示例Z13包括一种信号,所述信号是用示例Z11和/或Z12的所述数据单元编码的。示例Z14包括一种电磁信号,所述电磁信号携带示例Z01的所述指令。示例Z15包括一种设备,所述设备包括用于执行根据示例A01-A28、B01-B21、X01-X03中任一项所述和/或本文中的一些其它示例的方法的构件。
上述任何示例可以与任何其它示例(或示例的组合)组合,除非另有明确说明。上述技术的实施可以通过任何数量的规范、配置或硬件和软件的示例部署来实现。应当理解,本说明书中描述的功能单元或能力可能已被引用或标记为组件或模块,以便更特别地强调它们的实现独立性。这些组件可以由任何数量的软件或硬件形式实施。例如,组件或模块可以实施为硬件电路,包括定制的超大规模集成(VLSI)电路系统或门阵列、现成的半导体(如逻辑芯片、晶体管或其它分立元件)。组件或模块还可以在可编程硬件装置中实施,所述可编程硬件装置如现场可编程门阵列、可编程阵列逻辑、可编程逻辑装置等。组件或模块也可以在软件中实施,以便由各种类型的处理器执行。例如,可执行代码的已标识组件或模块可以包括计算机指令的一个或多个物理或逻辑块,这些指令可以组织为对象、过程或功能。然而,所标识的组件或模块的可执行文件不需要物理上位于一起,但可以包括存储在不同位置的不同指令,当这些指令逻辑连接在一起时,包括组件或模块并实现组件或模块的既定目的。可执行代码的组件或模块可以是单个指令或多个指令,甚至可以分布在几个不同的代码段上、不同的程序中、以及跨越几个存储装置或处理系统。具体地,所描述过程的某些方面(如代码重写和代码分析)可以发生在与部署代码的计算机不同的处理系统(例如,在数据中心的计算机中),而不是在嵌入传感器或机器人中的计算机中。类似地,操作数据可以在此组件或模块内被标识和说明,并且可以以任何合适的形式体现并在任何合适的数据结构类型中组织。操作数据可以作为单个数据集收集,也可以分布在不同的位置,包括不同的存储装置,并且可能至少部分地仅作为系统或网络上的电子信号存在。组件或模块可以是被动的或主动的,包括可操作以执行所需功能的代理。
9.术语
本文使用的术语用于以下目的:仅描述特定实施方案并且不旨在限制本公开。已经参考根据本公开的示例实施方案的方法、设备(系统)和/或计算机程序产品的流程图和/或框图描述了本公开。在附图中,一些结构或方法特征可以以特定的布置和/或顺序示出。然而,应当理解,可能不需要此类具体布置和/或排序。相反,在一些示例中,这些特征可以以不同于说明性附图所示的方式和/或顺序布置。另外地,在特定附图中包括结构或方法特征并不意味着在所有方面都需要所述特征,并且在一些示例中,可能不包括或可能与其它特征组合。
如本文所使用的,除非上下文另外清楚地指示,否则单数形式“一个/一种(a/an)”和“所述”也旨在包含复数形式。将进一步理解的是,当在本说明书中使用时,术语“包括(comprises)”和/或“包括(comprising)”指定所陈述的特征、整数、步骤、操作、要素和/或组件的存在,但不排除存在或添加一个或多个其它特征、整数、步骤、操作、要素、组件和/或其组。短语“A和/或B”意指(A)、(B)或(A和B)。出于本公开的目的,短语“A、B和/或C”意指(A)、(B)、(C)、(A和B)、(A和C)、(B和C)或(A、B和C)。描述可以使用短语“在一实施例中”或“在一些实施例中”,其可以各自指一个或多个相同或不同的实施例。描述可以使用短语“在一实施方案中”或“在一些实施方案中”,其可以各自指一个或多个相同或不同的实施例和/或实施方案。此外,如关于本公开的实施例所使用的术语“包括”、“包含”、“具有”等是同义的。
术语“耦接”、“通信地耦接”和其派生词在本文中使用。术语“耦接”可以表示两个或更多个元件彼此直接物理或电接触,可能意味着两个或更多个元件间接地相互接触但仍相互合作或交互,和/或可能意味着一个或多个其它元件在所说相互耦接的元件之间耦接或连接。术语“直接耦接”可能意味着两个或更多个元件彼此直接接触。术语“通信耦接”可能意味着两个或更多个元件可以通过通信手段相互接触,包含通过导线或其它互连连接、通过无线通信通道或油墨(ink)等。
术语“电路系统”是指可配置或可操作以在电子装置中执行特定功能的电路或多个电路的系统。电路或电路系统可以是一个或多个硬件组件的一部分,也可以包括一个或多个硬件组件,如逻辑电路系统、处理器(共享、专用或组)和/或存储器(共享、专用或组)、ASIC、FPGA、可编程逻辑控制器(PLC)、SoC、SiP、多芯片封装(MCP)、DSP等,所述组件可配置或可操作以提供所描述的功能。另外,术语“电路系统”还可以指一个或多个硬件元件与用于执行所述程序代码的功能的程序代码的组合。一些类型的电路系统可以执行一个或多个软件或固件程序以提供至少一些所描述的功能。硬件元件和程序代码的此类组合可以被称为特定类型的电路系统。
如本文所使用的,术语“处理器电路系统”是指,是能够顺序和自动地执行一系列算术或逻辑运算,或记录、存储和/或传输数字数据的电路系统的一部分或包含所述电路系统。术语“处理器电路系统”可以指一个或多个应用处理器、一个或多个基带处理器、物理CPU、单核处理器、双核处理器、三核处理器、四核处理器和/或能够执行或以其它方式操作计算机可执行指令(如程序代码、软件模块和/或功能过程)的任何其它装置。术语“应用电路系统”和/或“基带电路系统”可以被视为“处理器电路系统”的同义词,并且也可以被称为“处理器电路系统”。
如本文所使用的,术语“存储器”和/或“存储器电路系统”是指用于存储数据的一个或多个硬件装置,包括RAM、MRAM、PRAM、DRAM、和/或SDRAM、核心存储器、ROM、磁盘存储介质、光存储介质、闪速存储器装置或其它用于存储数据的机器可读介质。术语“计算机可读介质”可以包括但不限于存储器、便携式或固定存储装置、光学存储装置以及能够存储、包括或携带指令或数据的各种其它介质。“计算机可读存储介质”(或可替代地,“机器可读存储介质”)可以包括所有上述类型的存储器,以及将来可能出现的新技术,只要它们能够存储计算机程序或其它数据性质的数字信息,至少是暂时的,以这样的方式存储的信息可以被适当的处理装置“读取”。术语“计算机可读”可能不限于“计算机”的历史用法,从而仅表示完整的大型机、微型计算机、台式机、无线装置,甚至便携式计算机。相反,“计算机可读”可以包括可以由处理器、处理装置或任何计算系统可读的存储介质。此类介质可以是计算机或处理器可本地和/或远程访问的任何可用介质,并且可以包括易失性和非易失性介质,以及可移动和不可移动介质。
如本文所使用的,术语“接口电路系统”是指能够在两个或更多个组件或装置之间交换信息的电路系统、是所述电路系统的一部分或包含所述电路系统。术语“接口电路系统”可以指一个或多个硬件接口,例如总线、I/O接口、外围组件接口和/或网络接口卡等。
术语“元件”是指在给定的抽象级别上不可分割并具有明确定义的边界的单元,其中元件可以是任何类型的实体,包括例如一个或多个装置、系统、控制器、网络元件、模块等,或其组合。术语“装置”是指嵌入在其附近的另一个物理实体内部或连接到其附近的另一个物理实体的物理实体,具有从所述物理实体或向所述物理实体传送数字信息的能力。术语“实体”是指架构或装置的不同组件,或作为有效载荷传输的信息。术语“控制器”是指能够影响物理实体的元件或实体,例如通过更改其状态或引起物理实体移动。
如本文所使用的,术语“计算机系统”是指任何类型的互连电子装置、计算机装置或其组件。另外地,术语“计算机系统”和/或“系统”可以指计算机中相互通信耦接的各种组件。此外,术语“计算机系统”和/或“系统”可以指彼此通信耦接并且可配置或可操作以共享计算和/或网络资源的多个计算机装置和/或多个计算系统。
如本文所使用的,术语“结构”是指计算机结构或网络结构。“网络架构”是网络中软件和/或硬件元件的物理和逻辑设计或安排,包含通信协议、接口和媒体传输。“计算机结构”是计算系统或平台中软件和/或硬件元件的物理和逻辑设计或安排,包含它们之间交互的技术标准。
如本文所使用的,术语“设备”、“计算机设备”等是指具有程序代码(例如,软件或固件)的被专门设计为提供特定的计算资源的计算机装置或计算机系统。“虚拟设备”是将由配备有管理程序的装置实施的虚拟机镜像,所述装置虚拟化或仿真计算机设备,或者专用于提供特定的计算资源。
术语“云计算”或“云”是指用于使网络能够访问可共享计算资源的可扩展和弹性池的范式,所述池具有按需自助服务供应和管理,并且无需由用户主动管理。云计算提供云计算服务(或云服务),所述云计算服务是通过云计算提供的一种或多种功能,所述功能使用定义的接口(例如,API等)调用。术语“计算资源”或简称“资源”是指计算机系统或网络中可用性有限的任何物理或虚拟组件,或此类组件的使用。计算资源的示例包含在一段时间内使用/访问服务器、处理器、存储装置、存储装置、内存区域、网络、电源、输入/输出(外围)装置、机械装置、网络连接(例如通道/链路、端口、网络套接字等)、操作系统、虚拟机(VM)、软件/应用程序和/或计算机文件等。“硬件资源”可以指物理硬件元件提供的计算、存储和/或网络资源。“虚拟化资源”可以是指虚拟化基础架构向应用程序、装置、系统等提供的计算、存储和/或网络资源。术语“网络资源”或“通信资源”可以指计算机装置/系统可通过通信网络访问的资源。术语“系统资源”可以指任何类型的共享实体来提供服务,并且可以包含计算和/或网络资源。系统资源可以被视为一组连贯的功能、网络数据对象或服务,可通过服务器访问,其中此类系统资源驻留在单个主机或多个主机上,并且可清楚地标识。
如本文所使用的,术语“实例化(instantiate)”、“实例化(instantiation)”等是指实例的创建。“实例”也指对象的具体出现,例如,在程序代码执行期间可能发生。
术语“信息对象”是指包括一个或多个数据元素的数据结构,其中每个元素包含一个或多个数据值。信息对象的实例包含电子文档、数据库对象、数据文件、资源、网页、网络表单、应用程序(例如网络应用程序)、服务、网络服务和/或媒体或内容等。信息对象可以根据数据格式进行存储和/或处理。数据格式定义了用于存储和/或传送信息对象的内容/数据和/或数据元素的布置。每种数据格式还可以定义管理信息存储和/或交换的语言、语法、词汇和/或协议。可以用于本文所讨论的任何信息对象的数据格式示例可以包含加速移动页面脚本(AMPscript),抽象语法表示法一(ASN.l)、Backus-Naur形式(BNF)、扩展BNF、Bencode、BSON、ColdFusion标记语言(CFML)、逗号分隔值(CSV)、控制信息交换数据模型(C2IEDM)、级联样式表(CSS)、DARPA代理标记语言(DAML)、文档类型定义(DTD)、电子数据交换(EDI)、可扩展数据表示法(EDN)、可扩展标记语言(XML)、高效XML交换(EXI)、可扩展样式表语言(XSL)、自由文本(FT)、固定字格式(FWF)、蚀刻、通用接口定义语言(IDL)、地理标记语言(GML)、地理空间可扩展访问控制标记语言(GeoXACML)、地理空间数据抽象库(GDAL)、指南模板语言(GTL)、车把模板语言、超文本标记语言(HTML)、交互式金融交换(IFX)、钥匙孔标记语言(KML)和/或KML压缩(KMZ)、JAMscript、Java脚本对象概念(JSON)、JSON模式语言、MessagePack、MustacheTM模板语言、本体交换语言(OIL)、开放服务接口定义、开放金融交换(OFX)、精确图形标记语言(PGML)、协议缓冲区(protobuf)、金融交易所(QFX)、XML下一代常规语言(RelaxNG)模式语言、正则表达式、资源描述框架(RDF)模式语言、RESTful服务描述语言(RSDL)、可缩放矢量图形(SVG)、Schematron、Shapefile(SHP)、VBScript、文本文件(TXT)、网络应用程序描述语言(WADL)、网络地图服务(WMS)、网络本体语言(OWL)、网络服务描述语言(WSDL)、wiki标记或Wikitext、无线标记语言(WML)、可扩展的HTML(XHTML)、XPath、XQuery、XML DTD语言、XML架构定义(XSD)、XML架构语言、XSL转换(XSLT)、YAML(“Yet Another Markup Language”或“YANL Ain't Markup Language”)、Thrift和/或本文其它地方讨论的任何其它语言。另外地或可替代地,本文讨论的信息对象的数据格式可以是战术数据链路(TDL)格式,包含例如用于链路16的J系列消息格式;JREAP消息;多功能高级数据链路(MADL)、集成广播服务/通用消息格式(IBS/CMF)、超视距目标黄金(OTH-T Gold)、可变消息格式(VMF)、美国消息文本格式(USMTF)以及任何未来的高级TDL格式。
另外地或可替代地,用于信息对象的数据格式可以是文档和/或纯文本、电子表格、图形和/或表示格式,包括例如美国国家标准协会(ANSI)文本、计算机辅助设计(CAD)应用程序文件格式(例如,“.c3d”、“.dwg”、“.dft”、“.iam”、“.iaw”、“.tct”和/或其它类似的文件扩展名)、格式(包含用于Google的相关格式、GoogleGoogleGoogle等)、格式(例如“.doc”、“.ppt”、“.xls”、“.vsd”和/或其它类似的文件扩展名)、OpenDocument格式(包含像关联的文档、图形、演示文稿和电子表格格式)、Open Office XML(OOXML)格式(包含相关联的文档、图形、演示文稿和电子表格格式)、可移植文档格式(PDF)、问题对象文件格式(QUOX)、富文本文件(RTF)、TeX和/或LaTeX(“.tex”文件扩展名)、文本文件(TXT)、文件(“.tax”文件扩展名)、您需要预算(You Need a Budget,YNAB)文件和/或任何其它类似的文档或纯文本文件格式。
另外地或可替代地,用于信息对象的数据格式可以是存储元数据和连接文件的存档文件格式,并且可以压缩或可以不压缩用于存储的文件。如本文所使用的,术语“存档文件”是指具有将一个或多个文件组合或连接成单个文件或信息对象的文件格式或数据格式的文件。存档文件通常存储目录结构、错误检测和更正信息、任意注释,并且有时使用内置加密。术语“存档格式”是指存档文件的数据格式或文件格式,并且可以包含例如存储元数据和连接文件的仅存档格式,例如,包含目录或路径信息;仅压缩文件集合的仅压缩格式;用于创建软件包(包含自安装文件)的软件包格式,用于创建用于大容量存储、系统恢复和/或其它类似目的的磁盘映像的磁盘映像格式;以及多功能存档格式,可以存储元数据、连接、压缩、加密、创建错误检测和恢复信息,并且将存档打包为自解压和自扩展文件。出于本公开的目的,术语“存档文件”可以指具有任何前述存档格式类型的存档文件。存档文件格式的示例可以包含包(APK);应用程序包(APPX);精灵时间线备份索引文件(GBP);图形交换格式(GIF);由GNU ProjectTM提供的gzip(.gz);Archive(JAR);Mike O'Brien Pack(MPQ)存档;开放打包约定(OPC)包,包含OOXML文件、OpenXPS文件等;Rar存档(RAR);Red包/安装程序(RPM);SketchUp备份文件(SKB);TAR存档(“.tar”);和/或XPInstall或XPI安装程序模块;ZIP(.zip或.zipx)等。
术语“数据元素”是指在某一时间点具有至少一个特定属性的特定对象的原子状态,并且可以包含一个或多个数据元素名称或标识符、数据元素定义、一个或多个表示术语、枚举值或代码(例如,元数据)、和/或其它元数据注册表中数据元素的同义词列表。另外地或可替代地,“数据元素”可以指包含一个数据的数据类型。数据元素可以存储数据,所述数据可能称为数据元素的内容(或“内容项”)。内容项可以包含文本内容、性质、属性和/或其它被称为“子元素”的元素。另外地或可替代地,数据元素可以包含零个或多个属性和/或零个或多个性质,其中每个属性或性质可以定义为数据库对象(例如,字段、记录等)、对象实例和/或其它数据元素。“属性”可以指标记构造,包含存在于开始标记或空元素标记中的名称-值对。属性包含与其元素相关的数据和/或控制元素的行为。
术语“数据库对象”、“数据结构”等可以指以对象、属性-值对(AVP)、键-值对(KVP)、元组等形式表示的信息的任何表示,并且可以包含变量、数据结构、函数、方法、类、数据库记录、数据库字段、数据库实体、数据和/或数据库实体之间的关联(也被称为“关系”),区块链实施方案中的块和块之间的链接,和/或类似的概念。术语“信息元素”是指包含一个或多个字段的结构元素。术语“字段”是指信息元素的单独内容或包含内容的数据元素。术语“数据框”或“DF”可以指按预定义顺序包含多个数据元素的数据类型。
术语“个人数据”、“个人可标识信息”、“PII”或类似物是指与已标识或可标识的个人相关的信息。另外地或可替代地,“个人数据”、“个人身份信息”、“PII”等是指可以单独使用或与其它信息结合使用的信息,以标识、联系或定位个人,或在环境中标识个人。术语“敏感数据”可以是指与种族或民族血统、政治观点、宗教或哲学信仰或工会会员资格、遗传数据、生物特征数据、健康数据、和/或有关自然人性生活或性取向的数据相关的数据。术语“机密数据”是指个人或实体根据法律或合同有义务保护免受未经授权的访问、使用、公开、修改或破坏的任何形式的信息。另外地或可替代地,“机密数据”可以指个人或实体拥有或许可的任何数据,这些数据不是有意与公众共享的,或者是由个人或实体分类的,其名称排除了与公众共享。
术语“假名化”或类似物是指以这样的方式处理个人数据或敏感数据的任何手段,使得个人/敏感数据不能再归因于特定的数据主体(例如,个人或实体),而不使用另外的信息。另外的信息可能与个人/敏感数据分开保存,并可能受到技术和组织措施的约束,以确保个人/敏感数据不链接于已标识或可标识的自然人。
术语“应用程序”可以指在操作环境中实现特定功能的完整和可部署的包。术语“AI/ML应用程序”等可以是包含一些AI/ML模型和应用程序级描述的应用程序。术语“机器学习”或“ML”是指使用实现算法和/或统计模型的计算机系统来执行特定任务,而无需使用明确的指令,而是依赖于模式和推理。ML算法基于样本数据(称为“训练数据”、“模型训练信息”等)构建或估计数学模型(称为“ML模型”等),以便在不显式编程以执行此类任务的情况下做出预测或决策。通常,ML算法是从某些任务和某些性能度量方面的经验中学习的计算机程序,并且ML模型可以是使用一个或多个训练数据集训练ML算法后创建的任何对象或数据结构。在训练之后,ML模型可以用于对新数据集进行预测。尽管术语“ML算法”是指与术语“ML模型”不同的概念,但是出于本公开的目的,如本文所讨论的这些术语可以互换使用。术语“会话”是指两个或更多个通信装置、两个或更多个应用程序实例之间、计算机与用户之间或任何两个或更多个实体或元素之间的临时和交互式信息交换。
术语“网络地址”是指用于计算机网络中节点或主机的标识符,并且可以是跨网络的唯一标识符和/或可以是网络本地管理部分的唯一标识符。网络地址的实例包含公共交换电话号码中的电话号码、蜂窝网络地址(例如,国际移动用户标识(IMSI)、移动用户ISDN号码(MSISDN)、订阅永久标识符(SUPI)、临时移动用户标识(TMSI)、全局唯一临时标识符(GUTI)、通用公共订阅标识符(GPSI等)、IP网络中的互联网协议(IP)地址(例如,IP版本4(Ipv4)、IP版本6(IPv6)等)、互联网数据包交换(IPX)地址、X.25地址、X.21地址、端口号(例如,使用传输控制协议(TCP)或用户数据报协议(UDP)时)、媒体访问控制(MAC)地址、EPCglobal标签数据标准定义的电子产品代码(EPC)、蓝牙硬件装置地址(BD_ADDR)、通用资源定位器(URL)和/或电子邮件地址等。
术语“组织”或“org”是指包括一个或多个人和/或用户并且具有特定目的的实体,例如公司、企业、机构、协会、监管机构、政府机构、标准机构等。另外或可替代地,“组织”可以指表示实体/组织以及实例和/或数据结构中的关联数据的标识符。
术语“意图数据”可以是指根据网络内容消费收集的有关用户观察到的行为的数据,这些数据提供了对他们兴趣的洞察并表明采取行动的潜在意图。
术语“参与度”是指可测量或可观察的用户与内容项或信息对象的交互。术语“参与率”是指从内容项或信息对象生成的用户交互级别。出于本公开的目的,术语“参与度”可以指与组织或实体生成的内容或信息对象的交互量,其可以基于与所述组织或实体相关联的用户的总参与度。
术语“会话”是指两个或更多个通信装置、两个或更多个应用程序实例之间、计算机与用户之间或任何两个或更多个实体或元素之间的临时和交互式信息交换。另外地或可替代地,术语“会话”可以指连接服务或提供或支持两个实体或元件之间数据交换的其它服务。另外地或可替代地,术语“会话”可以指用户在一段时间内和/或完成任务时所采取的行动的度量单位。术语“网络会话(network session)”可以指网络上两个或更多个通信装置之间的会话,并且“网页会话(web session)”可以指两个或更多个通信装置之间通过网页或互联网进行的会话。“会话标识符”、“会话ID”或“会话令牌”是指网络通信中用于标识会话和/或一系列消息交换的一段数据。
尽管已经参考具体的示例方面描述了各种示例实施例和示例实施方案,但显而易见的是,可以在不脱离本公开的更广泛范围的情况下对这些方面进行各种修改和更改。本文所描述的许多布置和过程可以组合或并行实施使用,以提供更大的带宽/吞吐量,并支持可以用于所服务的边缘系统的边缘服务选择。因此,说明书和附图应被认为是说明性的而不是限制性的。就此形成一部分的附图通过展示而非限制的方式示出其中可以实践主题的具体方面。充分地详细描述所展示的方面以使本领域技术人员能够实践本文所公开的教导。可以利用其它布置并从中导出其它方面,从而使得可以在不脱离本公开的范围的情况下进行结构和逻辑替代和改变。因此,具体实施方式不应被视为具有限制意义,并且各种方面的范围由所附权利要求以及这些权利要求所赋予的等同物的全部范围来限定。
本文中可以单独地和/或共同地提及本发明主题的各方面,这仅仅是为了方便起见,并且在实际上公开了多于一个方面或发明概念的情况下不旨在有意将本申请的范围限制于任何单个方面或发明概念。尽管本文中已经展示和描述了具体方面,但是应了解到,打算实现相同目的的任何布置可以替换示出的具体方面。本公开旨在覆盖各个方面的任何和所有改编或变型。回顾以上描述,以上方面的组合以及本文未具体描述的其它方面对于本领域的技术人员而言将是显而易见的。为了方便起见,操作可以描述为各种互连或耦接的功能块或图。然而,在某些情况下,这些功能块或图可以等效地聚合到边界不明确的单个逻辑装置、程序或操作中。此外,在不背离此类原则的情况下,本文所讨论的实例可以在布置和细节上加以修改。权利要求书涵盖了以下权利要求的精神和范围内的所有修改和变化。
Claims (37)
1.一种用于操作内容消费监测器(CCM)的方法,其特征在于,所述方法包括:
获得关于被访问的信息对象的被捕获的会话事件的信息,所述被访问的信息对象包括标签,所述标签包括程序代码,所述程序代码使得计算机装置监测和捕获由计算机装置生成的会话事件并且将所述被捕获的会话事件发送到所述CCM,所述会话事件中的每个会话事件至少标识被访问的信息对象、标识事件类型标识符以及标识网络地址,其中所述事件类型标识符标识与所述被访问的信息对象相关联的动作或活动,所述被访问的信息对象是从所述网络地址访问的;
标识或确定组织(org)的域名,其中所述组织与由所述会话事件中的至少一个会话事件所指示的至少一个网络地址相关联;
对于多个时间段中的每个时间段,标识或确定一组所述会话事件,所述一组会话事件包括所述org的域名或与所述org相关联的一个或多个网络地址;
对于所述多个时间段中的每个时间段,标识或确定由所述org的成员所访问的由所述一组会话事件所指示的一组信息对象;
使用机器学习(ML)主题模型,基于所述一组信息对象中的一个或多个词来标识或确定多个主题;
使用所述ML主题模型标识或确定所述一组信息对象与所述多个主题中的每个主题的平均相关性评分,其中所述平均相关性评分是所述一组信息对象与每个主题的多个相关性评分的平均值,所述多个相关性评分中的每个相关性评分是部分地基于所述一组信息对象中的与每个主题相关联的词的数量和由所述一组所述会话事件所指示的所述一组信息对象集合执行的事件类型来计算的;
标识或确定在所述多个时间段中的每个时间段内生成所述会话事件的org的唯一用户的数量;
基于由所述org生成的会话事件的数量、所述org的唯一用户的数量以及每个主题的平均相关性评分,生成所述org在所述多个时间段中的每个时间段内的消费评分;以及
基于所述org的消费评分在所述多个时间段内的变化,确定所述org的消费评分的激增。
2.根据权利要求1所述的方法,其特征在于,标识所述激增包括:将所述消费评分中的达到阈值的值标识为所述激增。
3.根据权利要求1或2所述的方法,其特征在于,所述方法包括:
标识所述会话事件的数量在不同时间段内的变化;以及
基于所述会话事件的数量的变化来调整所述消费评分。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法包括:
标识在所述不同时间段内生成所述会话事件的用户的数量;
标识所述用户的数量在所述不同时间段内的变化;以及
基于所述用户的数量的变化来调整所述消费评分。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法包括:
将所述org的平均相关性评分与从多个计算机装置访问的信息对象的总体相关性评分进行比较,其中所述多个计算机装置不与所述org相关联;
当所述平均相关性评分低于所述总体相关性时,将“低”初始值分配给所述org的消费评分;
当所述平均相关性评分与所述总体相关性为大致相同的值时,将“中”初始值分配给所述org的消费评分;以及
当所述平均相关性评分高于所述总体相关性评分时,将“高”初始值分配给所述消费评分。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述方法包括:
基于包括在所述会话事件中的信息,标识用户参与所述信息对象的类型;以及
基于用户参与内容的类型来调整所述信息对象的相关性。
7.根据权利要求6所述的方法,其特征在于,所述用户参与的类型包括以下中的一个或多个:信息对象停留时间、滚动数据、鼠标数据、键盘数据、触摸数据、眼睛跟踪数据、某个时间段内的内容消费变化以及在信息对象之间切换的选项卡选择。
8.根据权利要求1至7中任一项所述的方法,其特征在于,所述方法包括:
计算在第一时间段内生成第一数量的所述会话事件的第一用户数量;
计算在第二时间段内生成第二数量的所述会话事件的第二用户数量;以及
当所述第二用户数量小于所述第一用户数量时,降低所述第二时间段内的所述消费评分。
9.根据权利要求1至8中任一项所述的方法,其特征在于,所述方法包括:
标识第一时间段内的来自同一网络地址的第一组会话事件;
基于所述第一组会话事件与每个主题的平均相关性评分来计算第一消费评分;
标识第二时间段内的来自所述同一网络地址的第二组会话事件;
基于所述第二组会话事件与每个主题的平均相关性评分来计算第二消费评分;以及
基于所述第一消费评分与所述第二消费评分之间的变化来计算所述org的激增评分。
10.根据权利要求1至9中任一项所述的方法,其特征在于,所述方法包括:
基于与所述org相关联的一个或多个网络地址来标识所述org;
基于所述一个或多个网络地址来标识所述org的位置;以及
将所述标识的位置与所述消费评分相关联。
11.根据权利要求10所述的方法,其特征在于,所述方法包括:基于所述信息对象的所述多个相关性评分和与所述位置相关联的会话事件的数量来计算所述位置的消费评分。
12.根据权利要求1至11中任一项所述的方法,其特征在于,所述一组所述会话事件包括第一组会话事件和第二组会话事件,所述方法包括:
标识第一时间段内的所述第一组会话事件;
标识在所述第一组会话事件期间标识的第一组信息对象;
标识所述第一组信息对象与每个主题的第一相关性评分;
基于所述第一组会话事件的数量和所述第一相关性评分,生成所述第一时间段内的所述消费评分的第一值;
标识所述第一时间段之后的第二时间段内的所述第二组会话事件;
标识在所述第二组会话事件期间访问的第二组信息对象;
标识所述第二组信息对象与每个主题的第二相关性评分;
确定所述第二相关性评分从所述第一相关性评分增加或减少的速率;以及
基于所述第二组会话事件的数量和所述第二相关性评分从所述第一相关性评分增加或减少的速率,生成所述第二时间段内的所述消费评分的第二值。
13.根据权利要求12所述的方法,其特征在于,所述方法包括:基于所述第一组会话事件的数量与所述第二组会话事件的数量之间的变化来调整所述第二值。
14.根据权利要求13所述的方法,其特征在于,指令的执行将使所述计算装置执行以下各项:
标识所述第二时间段之后的第三时间段内的第三组会话事件;
标识在所述第三组会话事件期间访问的第三组信息对象;
标识所述第三组信息对象与每个主题的第三相关性评分;
基于所述第三组会话事件的数量和所述第三相关性,生成所述第三时间段内的所述消费评分的第三值;以及
基于所述第一组会话事件的数量、所述第二组会话事件的数量与所述第三组会话事件的数量之间的变化来调整所述第三值。
15.根据权利要求1至14中任一项所述的方法,其特征在于,所述方法包括:从访问所述信息对象的一个或多个计算机装置获得所述会话事件。
16.根据权利要求1至15中任一项所述的方法,其特征在于,标识所述域名包括:访问数据库以标识所述org的域名。
17.根据权利要求1至16中任一项所述的方法,其特征在于,标识所述一组会话事件包括:标识多个时间段中的每个时间段内的所述一组会话事件,其包括所述org的域名或与所述org相关联的一个或多个网络地址。
18.根据权利要求1至17中任一项所述的设备,其特征在于,所述唯一用户是所述计算机装置中的一个或多个计算机装置的用户。
19.根据权利要求1至18中任一项所述的设备,其特征在于,包括:向显示装置提供指示所述消费评分和消费评分的所述激增的数据,以在由所述显示装置显示的用户界面中显示。
20.根据权利要求19所述的设备,其特征在于,包括:将所述激增映射到与所述org相关联的联系人。
21.根据权利要求20所述的设备,其特征在于,包括:向服务提供商发送所述激增的通知。
22.根据权利要求21所述的设备,其特征在于,所述通知被配置成触发所述服务提供商向与所述org相关联的联系人发送与所述多个主题中的至少一个主题相关联的信息。
23.根据权利要求21所述的设备,其特征在于,所述通知被配置成触发发布者向所述联系人发送所述信息,所述联系人具有与所述多个主题中的至少一个主题相关联的元数据项。
24.一种或多种计算机可读介质,其特征在于,所述计算机可读介质包括指令,其中由处理器电路系统执行所述指令将使所述处理器电路系统执行根据权利要求1至23中任一项所述的方法。
25.一种计算机程序,其特征在于,所述计算机程序包括根据权利要求24所述的指令。
26.一种应用程序编程接口,其特征在于,所述应用程序编程接口针对根据权利要求25所述的计算机程序定义函数、方法、变量、数据结构和/或协议。
27.一种设备,其特征在于,所述设备包括电路系统,所述电路系统加载有根据权利要求24所述的指令。
28.一种设备,其特征在于,所述设备包括电路系统,所述电路系统能够操作以运行根据权利要求24所述的指令。
29.一种集成电路,其特征在于,所述集成电路包括根据权利要求24所述的处理器电路系统和根据权利要求24所述的一种或多种计算机可读介质。
30.一种计算系统,其特征在于,所述计算系统包括根据权利要求24所述的一种或多种计算机可读介质以及根据权利要求24所述的处理器电路系统。
31.一种设备,其特征在于,所述设备包括构件,所述构件用于执行根据权利要求24所述的指令。
32.一种信号,其特征在于,所述信号是作为执行根据权利要求24所述的指令的结果而生成。
33.一种数据单元,其特征在于,所述数据单元是作为执行根据权利要求24所述的指令的结果而生成。
34.根据权利要求33所述的数据单元,其特征在于,所述数据单元是数据报、网络数据包、数据帧、数据段、协议数据单元(PDU)、服务数据单元(SDU)、消息或数据库对象。
35.一种信号,其特征在于,所述信号是用根据权利要求33或34所述的数据单元编码的。
36.一种电磁信号,其特征在于,所述电磁信号携带根据权利要求24所述的指令。
37.一种设备,其特征在于,所述设备包括构件,所述构件用于执行根据权利要求1至23中任一项所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/189,073 | 2021-03-01 | ||
US17/189,073 US11589083B2 (en) | 2014-09-26 | 2021-03-01 | Machine learning techniques for detecting surges in content consumption |
PCT/US2022/017422 WO2022187040A1 (en) | 2021-03-01 | 2022-02-23 | Machine learning techniques for detecting surges in content consumption |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117255993A true CN117255993A (zh) | 2023-12-19 |
Family
ID=83006684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280031706.7A Pending CN117255993A (zh) | 2021-03-01 | 2022-02-23 | 用于检测内容消费激增的机器学习技术 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP4302207A1 (zh) |
CN (1) | CN117255993A (zh) |
CA (1) | CA3210618A1 (zh) |
MX (1) | MX2023010207A (zh) |
WO (1) | WO2022187040A1 (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2177010B1 (en) * | 2006-12-13 | 2015-10-28 | Quickplay Media Inc. | Mobile media platform |
US8976955B2 (en) * | 2011-11-28 | 2015-03-10 | Nice-Systems Ltd. | System and method for tracking web interactions with real time analytics |
US9940634B1 (en) * | 2014-09-26 | 2018-04-10 | Bombora, Inc. | Content consumption monitor |
US20160132906A1 (en) * | 2014-09-26 | 2016-05-12 | Bombora, Inc. | Surge detector for content consumption |
-
2022
- 2022-02-23 WO PCT/US2022/017422 patent/WO2022187040A1/en active Application Filing
- 2022-02-23 EP EP22763779.0A patent/EP4302207A1/en active Pending
- 2022-02-23 CA CA3210618A patent/CA3210618A1/en active Pending
- 2022-02-23 MX MX2023010207A patent/MX2023010207A/es unknown
- 2022-02-23 CN CN202280031706.7A patent/CN117255993A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
MX2023010207A (es) | 2023-11-28 |
EP4302207A1 (en) | 2024-01-10 |
CA3210618A1 (en) | 2022-09-09 |
WO2022187040A1 (en) | 2022-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220188700A1 (en) | Distributed machine learning hyperparameter optimization | |
US11631015B2 (en) | Machine learning techniques for internet protocol address to domain name resolution systems | |
US11589083B2 (en) | Machine learning techniques for detecting surges in content consumption | |
US11556942B2 (en) | Content consumption monitor | |
US20220188699A1 (en) | Machine learning techniques for web resource fingerprinting | |
US20210365445A1 (en) | Technologies for collecting, managing, and providing contact tracing information for infectious disease response and mitigation | |
US10841323B2 (en) | Detecting robotic internet activity across domains utilizing one-class and domain adaptation machine-learning models | |
US20200401886A1 (en) | Method and system for providing machine learning service | |
US20220188698A1 (en) | Machine learning techniques for web resource interest detection | |
US8996693B2 (en) | Method and apparatus for providing dynamic stream processing of data based on static analytics | |
US10242082B2 (en) | Context-driven multi-user communication | |
US20130007063A1 (en) | Method and apparatus for real-time processing of data items | |
US20220230078A1 (en) | Machine learning techniques for associating network addresses with information object access locations | |
US20220358240A1 (en) | Adaptive data privacy platform | |
US20150052087A1 (en) | Predicting Reactions to Short-Text Posts | |
WO2022216753A1 (en) | Distributed machine learning hyperparameter optimization | |
Prabhu | Fog computing, deep learning and big data analytics-research directions | |
CN110866040B (zh) | 用户画像生成方法、装置和系统 | |
US20160042015A1 (en) | Activity information schema discovery and schema change detection and notification | |
US20160239533A1 (en) | Identity workflow that utilizes multiple storage engines to support various lifecycles | |
Dong et al. | Ppm: A privacy prediction model for online social networks | |
Zhao et al. | TrCMP: A dependable app usage inference design for user behavior analysis through cyber-physical parameters | |
US20190138511A1 (en) | Systems and methods for real-time data processing analytics engine with artificial intelligence for content characterization | |
US20190138930A1 (en) | Systems and methods for real-time data processing analytics engine with artificial intelligence for target information protection | |
CN117255993A (zh) | 用于检测内容消费激增的机器学习技术 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40104986 Country of ref document: HK |