CN1954336A - 用于确定通信网络用户概况的系统和方法 - Google Patents

用于确定通信网络用户概况的系统和方法 Download PDF

Info

Publication number
CN1954336A
CN1954336A CNA2005800151015A CN200580015101A CN1954336A CN 1954336 A CN1954336 A CN 1954336A CN A2005800151015 A CNA2005800151015 A CN A2005800151015A CN 200580015101 A CN200580015101 A CN 200580015101A CN 1954336 A CN1954336 A CN 1954336A
Authority
CN
China
Prior art keywords
user
website
probability
attribute
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800151015A
Other languages
English (en)
Inventor
S·帕里斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weborama
Original Assignee
Weborama
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weborama filed Critical Weborama
Publication of CN1954336A publication Critical patent/CN1954336A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Abstract

本发明涉及一种用于确定通信网络用户概况的方法,其包括以下阶段:-将关于已知网络用户的概况数据保存在数据库中,这些用户形成参考人口,关于已知用户的概况数据(Pi)包括与每个用户(i)相关的一组属性(j)值(Pij),-根据参考人口的用户连接到网站或者网站的一部分的连接历史,对于通过网络可访问的一组感兴趣网站的每个网站或者网站的一部分(s),使用处理装置确定表示连接到所述网站或者网站(s)的一部分的用户的属性值的一组概率(Psj),-根据与用户在给定时间周期内连接的感兴趣的因特网网站或者网站的一部分(s)相关的概率,使用处理装置确定待识别用户具有给定属性的概率。该方法的特征在于,处理装置将待识别用户具有特定属性(j)的概率(m3j)确定为去相关概率值(m1j)与相关概率值(m2j)的组合,该去相关概率值考虑到了与因特网网站或者网站的部分(s)有关的概率,该相关概率值考虑到了关于其为参考人口的一部分的用户的平均概况数据(gj)。

Description

用于确定通信网络用户概况的系统和方法
本发明涉及因特网用户或者任何其它通信网络用户进行行为研究的领域。
因特网服务提供商,不管是代理商、广告商、电子商务公司、出版商或者更通常的数字内容的广播公司为了优化效率(optimiseefficiency)都愿意根据每个因特网用户的概况(profile)动态地适应他们提供的数字内容。例如,他们希望能够显示根据浏览网站的每个因特网用户的概况而定制的广告标题,还能够根据因特网用户的类型重点突出各种不同的产品。
文献WO 02/33626(2002年4月25号出版)描述了允许确定给定的未知因特网用户的概括的方法。这种方法在于主要根据因特网用户浏览的因特网页的URL地址、他在其搜索和所选择标题栏中使用的关键词,以概率的方式来确定因特网用户的人口统计属性(婚姻状态,年龄,性别,收入,职业)。出于此目的,该方法在于从包括已知社会人口统计概况的因特网用户的参考人口,为包括例如性别、婚姻状态或者职业的一组属性确定多组不同的URL地址。这样确定的这些组URL地址允许为每个未知的因特网用户获得与每个属性相关联的分数(score),该分数根据因特网用户已经浏览过的URL地址被计算出。
这种剖析方法根据最普通的因特网人口给出结果,也就是,提供最普遍属性的人口。另一方面,这种方法并不很适于确定少数因特网用户的概况。
另外,在文献WO 02/33626中提出的方法基于URL地址,并不允许确定关于因特网用户的社会人口统计概况的可靠结论。
本发明的目的是提供一种比现有技术中的方法得到的结果更精确的一种剖析方法。
出于此目的,本发明提供一种用于确定要被鉴定的通信网络用户概况的方法,包括以下步骤:
-把关于已知网络用户的概况数据存入数据库,这些用户作为参考人口的一部分,关于已知用户的概况数据包括与每个用户相关联的一组属性数据,
-对于通过网络希望到达的每个网站或者一组网站中其中一个网站,根据到网站或者网站一部分的参考人口的用户的连接历史,使用处理装置确定一组概率,其表示连接到该网站或者网站一部分的用户属性值。
-根据在给定的时间周期内用户希望连接的网站或者网站的一部分的概率,使用处理装置确定待识别用户具有给定属性的概率。
其中处理装置将待识别用户具有给定属性的概率确定为去相关概率值与相关概率值的组合,去相关概率值考虑到了与感兴趣的网站或者网站一部分有关的概率,相关概率值考虑到了关于其为参考人口一部分的用户的平均概况数据。
表述“网站的一部分”指的是属于相同网站并且为应用该方法构成同一主题实体(themed entity)的网页或一组网页。
去相关概率的计算完全依赖于待识别用户已经浏览过的该组网站或者网站的一部分,以及与浏览过的网站或者网站的部分的每个属性相关的概率。
相关概率的计算也考虑到了参考人口成员的平均概况;也就是,对于每个属性而言,与参考人口的所有成员的该属性相关的平均概率。
这种方法具有组合去相关方法和相关方法的优点,去相关方法促进由参考人口预测主要特征,相关方法促进从参考人口的成员之中预测少数特征。该方法产生比现有技术提供的方法更相关的结果。
可以根据以经验方式建立的组合规则来执行两种类型概率的结合,该经验方式根据参考人口的行为(假设参考人口代表了网络用户的全部人口)。
在本发明的实施例中,去相关和相关概率值的组合是线性组合。
去相关和相关概率值的组合依赖于可以根据参考人口以经验确定的结合参数。
特别是,这些参数是通过将概率计算应用于参考人口的成员来确定的,以便限定要被应用在相关方法和去相关方法之间的混合率(mixing rate)。
在本发明的实施例中,当待识别的网络用户使用网络连接到主管网站的服务器(sever hosting a site)上时,主管网站的服务器将用户的识别请求发送给用户文件服务器(profiling server),用户文件服务器将与用户概况相关的数据返回给主管网站的服务器。
因此,主管网站的服务器根据与用户概况相关的数据修改网站的表述。
本发明也提到一种用于确定通信网络的待识别用户的概况的系统,包括与网络连接并包括处理装置的用户文件服务器,其中处理装置适于根据与所述在给定时间段内用户连接过的感兴趣网站相关的概率确定待识别用户具有给定属性的概率。
在该系统中,处理装置将用户具有特定属性的概率确定为去相关概率值与相关概率值的组合,去相关概率值考虑到了与感兴趣的网站有关的概率,相关概率值考虑到了关于其为参考人口一部分的用户的平均概况数据。
出于此目的,在该系统的实施例中,服务器适于连接到包含与网络的已知用户相关的概况数据的数据库,这些用户是参考人口的一部分,与已知用户相关的概况数据包括与每个用户相关的一组属性值。
另外,处理装置适于根据参考人口的用户对于网站的连接历史,通过网络为希望到达的一组网站的每个网站确定表示连接到网站的用户属性值的一组概率。
其它特征和优点将在下面的描述中示出,其仅用于展示和非限制的目的,必须同时参考唯一的附图进行阅读。该图是表示根据本发明的用户文件系统的图。
在该图中,用户文件系统100连接到通信网络200(例如因特网),其与一组300感兴趣的网络服务器301到304相连。每个网络服务器主管一个网站,或主管通过服务提供商对网络200用户(因特网用户)可用的数字内容。
为了适应他们提供的服务,服务提供商希望能够实时知道浏览其网页的因特网用户概况。
用户文件系统100包括用户文件服务器101,其包括适于计算关于连接到感兴趣的网络服务器301到304的因特网用户的概况数据的处理装置。
用户文件服务器101连接到数据库102,其包括关于因特网用户的参考人口400的成员的数据。
用户文件服务器101连接到数据库102,其包括与因特网用户的参考人口400的成员相关的数据。
统计因特网用户人口400对同意提供其概况数据的自愿型因特网用户进行分组(group)。例如通过电话或者直接通过因特网在线,根据被认为是全部人口的代表的社会人口统计学规则(例如,一个国家中的因特网用户的人口),对这些因特网用户进行征集(recruit)。传感器软件和/或信息文件(cookie)被安装在计算机401上或者因特网用户参考人口的每个成员的导航(navigation)站上。征集的成员要经过选择过程或者处理操作,以便产生可以被认为具有代表性的人口。
信息文件包括可以识别因特网用户的数据。
传感器软件的目的在于记录因特网用户的浏览;也就是,用户一段时间浏览的多个网站或者网站的部分。传感器软件通过网络200有规律地把关于参考人口的成员的浏览历史的信息发送给用户文件服务器。用户文件服务器101将其从软件收到的信息记录到数据库102中。也可以使用如下所述的放在感兴趣网站的网页上的标记器(marker)进行信息收集。
根据参考人口的成员浏览的不同网站,用户文件服务器101适于统计地确定连接到感兴趣的特定网站301到304的因特网用户的概况。
因特网用户的概况由与该用户相关的一系列属性值组成。属性是与服务提供商感兴趣的每个因特网用户相关的数据元素。这些属性涉及,例如,因特网用户的性别、年龄、以及社会职业类别。其它类型的属性也可能是服务商感兴趣的,并且能够包含在用户服务文件中的,例如因特网用户的收入水平、他/她的地理位置、感兴趣的领域、他/她使用的计算机类型(家庭计算机或者工作,浏览器类型,屏幕分辨率,连接速度)。
用户文件服务器101将给定因特网用户i的概况Pi确定为包括N个属性值Pij的序列,Pij是因特网用户i具有属性j的概率。
因特网用户i的概况如下:
Pi=(Pi1,Pi2,Pi3,Pi4,Pi5,Pi6,Pi7,Pi8,Pi9,Pi10,Pi11,,Pi12,Pi13,…PiN)[1]
其中,特别是,Pi1是因特网用户i是女人(j=1)的概率,Pi2是因特网用户I是男人(j=2)的概率,Pi3、Pi4、Pi5、Pi6、Pi7、Pi8分别是因特网用户i是0到14岁(j=3)、15到24岁(j=4)、25到34岁(j=5)、35到49岁(j=6)、50到64岁(j=7)、大于65岁(j=8)的概率,Pi9、Pi10、Pi11、Pi12、Pi13、是因特网用户i属于某种类型的社会职业类别的概率(j=9,10,11,12,或13),其它属性14到N也在考虑之列。
另外,概况Pi的属性值Pij必须满足以下条件:
Pi1+Pi2=1                    [2]
Pi3+Pi4+Pi5+Pi6+Pi7+Pi8=1    [3]
Pi9+Pi10+Pi11+Pi12+Pi13=1    [4]
用户文件服务器101也将感兴趣的给定网站的概况Ps确定为包括N个属性值Psj的序列,Psj是浏览网站s的因特网用户具有属性j的概率。
网站概况如下:
Ps=(Ps1,Ps2,Ps3,Ps4,Ps5,Ps6,Ps7,Ps8,Ps9,Ps10,Ps11,Ps12,Ps13,...PsN)[5]
其中概况Ps的属性值Psj根据浏览网站s的参考人口的因特网用户的属性值来确定。
对于感兴趣的给定网站s,属性j的值Psj是与浏览网站s的参考人口的因特网用户相关的值Pij的平均。因此,如果在浏览网站s的参考人口400的因特网用户中,40%是女性以及60%是男性,那么我们得出Ps1=0.4以及Ps2=0.6。
当因特网用户501,其可以是已知的因特网用户(也就是,他/她属于参考人400)或者未知的因特网用户(也就是,他/她不属于参考人400)连接到网站s时,主管网站的网络服务器601将因特网用户识别请求发送给用户文件服务器101。用户文件服务器101确定包含所述因特网用户概况的数据,并将其返回给网络服务器601。根据感兴趣的网络服务器301到304上的因特网用户501的连接历史,通过将该历史与参考人口400的成员的历史进行比较来确定该概况。
为了获得因特网用户501的历史,网络服务器301到304主管网站,在这些网站中一些页面已被网页标记器所标记。这些标记器驻存在用户文件服务器101上,以便当因特网用户501访问被这样标记的网页时,标记器的下载触发发送请求到用户文件服务器101。该请求指示用户文件服务器101因特网用户已经加载了特殊的网页。
当因特网用户501连续地连接到一系列网站时,他/她触发了连续的发送请求到用户文件服务器101。这些请求都由用户文件服务器解释为浏览数据。该数据由用户文件服务器101记录到数据库102中,并且构成待识别因特网用户的浏览历史。
从该历史中,用户文件服务器101可以通过对其与参考入口400的因特网用户相关的数据进行比较,确定待识别因特网用户501的统计概况。
出于此目的,用户文件服务器101根据被称为“去相关(decorrelated)”的原始计算方法确定因特网用户501的第一统计概况M1。该方法完全依赖于因特网用户501已经浏览过的多组网站s,并由此依赖于与用于浏览的网站的每个属性相关的概率。
M1=(m1,1,m1,2,m1,3,m1,4,m1,5,m1,6,m1,7,m1,8,m1,9,m1,10,m1,11,m1,12
      m1,13,...,m1,N)                             [6]
其中 m 1 , j = Π s = 1 x ( p sj ) ln ( e + n s - 1 ) - - - [ 7 ]
其中ns是因特网用户在特定的时间周期(例如,在最近两个月内)浏览网站s的次数,e是欧拉数,x是因特网用户501浏览网站的数量。
用户文件服务器101根据被称为“相关”的第二计算方法还确定因特网用户501的第二统计概况M2
该方法在参考人口400中考虑了因特网用户的平均概况G;也就是,对于每个属性j,对于参考人口的所有成员而言与该属性相关的平均概率Pij。平均概况G由下式确定:
G=(g1,g2,g3,g4,g5,g6,g7,g8,g9,g10,g11,g12,g13,...,gN)[8]其中对于每个属性j,gj是对于参考人400的所有成员的属性j的平均值。
第二统计概况由下式定义:
M2=(m2,1,m2,2,m2,3,m2,4,m2,5,m2,6,m2,7,m2,8,m2,9,m2,10,m2,11,m2,12
     m2,13,...,m2,N)    [9]
其中 m 2 , j = Π s = 1 x ( p sj g j ) ln ( e + n s - 1 ) - - - [ 10 ]
其中ns是因特网用户501在特定的时间周期(例如,在最近两个月内)浏览网站s的次数,e是欧拉数,x是因特网用户浏览网站的数量。
应当注意到在以上的两种计算方法(方程[7]和[10])中,幂函数ln(e+ns-1)考虑了参数ns,其相应于在特定的时间周期内因特网用户501浏览过网站s的次数。根据这些计算方法,浏览同一网站的次数越多,在确定因特网用户501的概况时与该网站相关的属性就越重要。然而,有可能认为确定标准不是因特网用户浏览同一网站的次数,而是因特网用户浏览网站的差异。在这种情况下,在方程[7]和[10]中的函数ln(e+ns-1)可以由不同的函数f(ns)来代替,尤其是慢增长函数或者等于1的常量函数。
被称为“去相关”的第一计算方法便于预测与参考人口400的大部分成员相关的属性值一致的属性值,同时被称为“相关”的第二计算方法便于预测与参考人口400的少数部分成员相关的属性值一致的属性值。
例如,假如一方面基于参考人口400(其意味着代表全部因特网用户人口)我们发现连接到网站的是30%女性和70%男性。另一方面,我们认定基本浏览过网站301到304的特殊因特网用户501,其概况为60%男性和40%女性。这些因特网用户501将被认为主要是由第一计算方法得到的男性,因为他们浏览了倾向于被男性浏览的网站。另一方面,这些相同的因特网用户将被认为是由第二计算方法得到的女性,因为她们浏览了比其它网站更易被女性浏览的网站。
为了进行大部分的“相关”和“去相关”计算机方法以便获得接近真实的结果,用户文件服务器101对所获得因特网用户501的组合统计概况M3进行计算,就象根据去相关概率计算的M1概况与根据相关概率计算的M2概况的组合。
M3=(m3,1,m3,2,m3,3,m3,4,m3,5,m3,6,m3,7,m3,8,m3,9,m3,10,m3,11,m3,12
             m3,13,...,m3,N)                   [11]
其中m3,j=αjm1,j+(1-αj)m2,j  其中j∈[1,N]    [12]
其中αj是为属性j确定的去相关概率值m1,j和相关概率值m2,j的组合参数,组成的αj介于0和1之间。
线性组合参数αj可以通过对参考人口400的成员应用概率计算以经验的方式确定,从而确定应用在相关方法和去相关方法之间要被应用的组合率。为了考虑参考人口的增长,这些组合参数都规律地进行更新。
为了进行直接的计算,用户文件服务器101可以用下述的方式确定新的平均概况G3
G3=(g3,1,g3,2,g3,3,g3,4,g3,5,g3,6,g3,7,g3,8,g3,9,g3,10,g3,11,g3,12,g3,13,...,g3,N)
                                                                                                [13]
其中 g 3 , j = 1 a j + 1 - a j g j - - - [ 14 ]
从而混合统计概况M3可以用下述方式通过用户文件服务器直接计算:
m 3 , j = Π s = 1 x ( p s , j g 3 , j ) ln ( e + n s - 1 ) - - - [ 15 ]
m 3 , j = Π s = 1 x ( a j · p s , j + ( 1 + a j ) p s , j g 3 , j ) ln ( e + n s - 1 ) - - - [ 16 ]
可以使用的组合参数序列的实例如下:
A=(α1,α2,α3,α4,α5,α6,α7,α8,α9,α10,α11,α12,...αN)
A=(0,30,0,30,
0,65,0,65,0,65,0,65,0,65,0,65,
0,40,0,40,0,40,0,76,0,76
...αN)                                       [17]
根据可选的阶段,用户文件服务器101可以将因特网用户501的概率概况M3转化为“确定的”概况I。这种转化为确定概况的转化阶段在于将概率m3,j转化为包括特殊属性的因特网用户501的确定概况D,以下述方式:
D3=(di,1,di,2,di,3,di,4,di,5,di,6,di,7,di,8,di,9,di,10,di,11,di,12,di,13,...,di,N)[18]其中di,j等于0或1,同时遵守条件[2],[3]和[4]。确定的概况D指示无论待识别因特网用户501是男性还是女性,他/她所属的年龄范围以及他/她的社会职业类别,以及其它属性。
这种必要的转化导致依赖于因特网用户i的浏览历史的规模(size)的预测误差。实际上,因特网用户浏览网站的数量越多,这种预测就更精确。因此,转化为确定概况将被执行,而不依赖于由这种转化产生的误差小于或不小于对每个属性可接受的预测误差。
与概况结果要发送到的每个网站的服务提供商协作对可接受的预测误差进行确定。
应当注意到下述方面:
N,因特网用户i浏览过的网站或者网站的部分的数量,并且在预定的时间周期(例如最近两个月内)被用户文件服务器101记录,
ej,当用户文件服务器101预测因特网用户具有属性j时产生的误差(百分比),
Figure A20058001510100151
当用户文件服务器101预测因特网用户具有属性j时最大可接受的误差(百分比),
Figure A20058001510100152
与必须要预测的属性j相关的最小概率阈值,因特网用户呈现属性j使得预测误差ej小于
Figure A20058001510100153
该最小概率阈值取决于因特网用户浏览过的网站数量或者网站N的多个部分。
基于已经进行了给定浏览次数N的参考人口400的已知因特网用户,用户文件服务器101为每个属性j确定低于预测误差ej小于
Figure A20058001510100154
的概率阈值
Figure A20058001510100155
对于每个N值都执行该计算。
对于已经进行了N次浏览的因特网用户i来讲,确定概况D如下计算:
对于每个属性j,如果
Figure A20058001510100156
那么dij=1           [19]
该条件意味着当属性m3j低于特定阈值时,因特网用户i被认为呈现属性j。用户文件服务器101把由此确定的概况D记录入数据库102。
另外,在本发明的优选实施例中,确定概况D由用户文件服务器通过根据预定的优先顺序Z考虑一组预定属性的每个属性j进行计算。用户文件服务器101在属性j的优先顺序Z中为每个属性j校验条件(方程[19])。根据对于特定的服务提供商而言每个属性的商业重要性对该预定顺序进行选择。
顺序Z可以如下所示,例如:
Z=(j=2,j=1,j=8,j=5,j=4,j=6,j=7,j=3...)从而使校验的条件基于一些属性,根据因特网用户是男性(j=2),女性(j=1),因特网用户大于65岁(j=8),在25到34岁之间(j=5),在15到25岁之间(j=4),在35到49岁之间(j=6),在50到64岁之间(j=7),以及在0到14岁之间(j=3),按照这种顺序。
顺序Z可以随时间并根据概况结果要被发送到的服务提供商而进行修改。结果是建议的概况方法可以根据每个服务提供商想突出作为优先的概况类型而进行修改。
当因特网用户501连接到网站时,主管网站的网络服务器601将因特网用户501识别请求发送给用户文件服务器101。用户文件服务器101作为回报实时地提供关于因特网用户的概况的数据。尤其是,其传送(forward)了考虑中的(in question)因特网用户501的概况D。接着,网络服务器101可以根据与因特网用户的社会人口统计性概况相关的数据修改网站的表达:图形,浏览方法或者广告空间。网络服务器101可以保持与因特网用户的概况相关的数据或者将其存储在信息文件中,所述信息文件安装在因特网用户的浏览器中。因此,因特网用户501的概况对网络服务器501将立即是可用的,用于因特网用户在特定的时间周期(例如,三星期的周期)内进行随后的浏览。
包含在数据库102中的与参考人口400相关的数据随着人口发展被有规则地更新。与不同网站相关的数据也根据参考人口的成员进行更新。
用户文件服务器101也被修改以在连接到特别感兴趣的网站时产生记录。该记录可以由网站的服务提供商使用服务器101在线访问。该记录指出,例如,在特定的时间周期内浏览过网站并且以统计方式呈现这些因特网用户的概况的因特网用户的数量。该记录也包括与所呈现概况数据相关的预测误差率。
在可选实施例中,用户文件系统(profiling system)100和网络服务器601不位于相同的因特网区域。在这种情况下,网络服务器601不能访问因特网用户501概况。在该可选实施例中,服务器601请求因特网用户501浏览器将识别请求发送给用户文件服务器101。这样,因特网用户501浏览器将识别请求发送给用户文件服务器101,而不是服务器601。
这样的请求可以以闭塞的方式(blocking manner)执行,因特网用户501不访问网站直到服务器601获得了包含他/她的概况的数据。在这种情况下,服务器601将待识别因特网用户501传送给用户文件服务器101。用户文件服务器101确定与因特网用户501概况相关的数据,并且出于此目的其为该因特网用户确定概况D,或者从数据库102中提取出此概况。然后,用户文件服务器101将因特网用户501传送给初始请求的服务器601的URL地址。这次,利用与因特网用户的概况相关的数据充实(enrich)因特网用户请求。作为替代,该请求可以用非闭塞(non-blocking manner)的方式执行,例如,通过可视的图像。
另外,用户文件服务器101将指示它已经将特定因特网用户的概况D发送给服务器601的数据元素记录到数据库102中。如果因特网用户是参考人口400的一部分,那么用户文件服务器101对它已经确定的概况D的质量进行校验;也就是,对它已经确定的概况D与因特网用户所声明的概况进行比较。如果概况D和所声明概况之间存在差异,则用户文件服务器101可以将因特网用户所声明的概况发送给301服务器。

Claims (23)

1、一种用于确定通信网络(200)的待识别用户(501)的概况的方法,包括以下步骤:
-将关于已知网络用户的概况数据存入数据库(102),这些用户是参考人口(400)的一部分,关于已知用户的概况数据(Pi)包括与每个用户(i)相关的一组属性(j)值(Pij),
-为可通过网络(200)访问的一组感兴趣的网站(300)的每个网站或者一部分网站(s),根据连接到网站或者网站的一部分(s)的参考人口(400)的用户的连接历史,使用处理装置,确定表示连接到所述网站或者网站的一部分的用户的属性值的一组概率(Psj),
-根据用户在给定时间周期内连接到感兴趣的多个网站或者多个网站的部分(s)的概率,使用处理装置,确定待识别用户(501)具有给定属性的概率,
其中处理装置将待识别用户(501)具有给定属性(j)的概率(m3j)确定为去相关概率值(m1j)与相关概率值(m2j)的组合,该去相关概率值考虑到了与感兴趣的多个网站或者多个网站的部分(s)有关的概率,该相关概率值考虑到了关于其为参考人口(400)的一部分的用户的平均概况数据(gj)。
2.根据权利要求1的方法,其中去相关概率值(m1j)和相关概率值(m2j)的组合是线性组合。
3.根据权利要求1或2的方法,其中去相关概率值(m1j)和相关概率值(m2j)的组合取决于组合参数,其根据与参考人口(400)的已知用户相关的概况数据被经验地确定。
4.根据权利要求3的方法,其中组合参数被有规律地更新,以便考虑参考人口的发展。
5.根据前述任一权利要求的方法,其中处理装置确定待识别用户(501)具有给定属性j的去相关概率m1j,根据关系式:
m 1 , j = Π s = 1 x ( P sj ) f ( n s )
其中f(ns)是幂函数,其取决于待识别用户(501)在给定时间周期内浏览过感兴趣网站s的次数ns,e是欧拉数,x是用户(501)浏览网站的数量。
6.根据前述任一权利要求的方法,其中处理装置确定待识别用户(501)具有给定属性j的相关概率m2,j,根据关系式:
m 2 , j = Π s = 1 x ( P sj g j ) f ( n s )
其中f(ns)是幂函数,其取决于待识别用户(501)在给定时间周期内浏览过感兴趣网站s的次数ns,e是欧拉数,x是用户浏览网站的数量,而gj是对于参考人口(400)的全部已知用户的属性j的平均值。
7.根据权利要求5或6的方法,其中幂函数f(ns)等于ln(e+ns-1)。
8.根据前述任一权利要求的方法,其中处理装置确定待识别用户(501)具有特殊属性j的概率m3,j,根据关系式:
m3,j=αjm1,j+(1-αj)m2,j
其中αj是为属性j确定的去相关概率值m1,j和相关概率值m2,j的组合参数。
9.根据前述任一权利要求的方法,进一步包括一个步骤,其在于将待识别用户(501)具有一个或数个给定属性(j)的概率m3,j转化为包括给定属性的用户(501)的确定概况(D)。
10.根据权利要求9的方法,其中转化步骤被执行与否取决于由该转化产生的误差(ej)是否小于或不小于对于每个属性(j)可接受的预测误差(êj)。
11.根据权利要求10的方法,其中当待识别用户(501)具有特定属性(j)的概率(m3j)大于对该属性可接受的预测误差(êj)的特定阈值 时,待识别用户(501)被认为具有属性(j)。
12.根据权利要求9到11的任一权利要求的方法,其中确定概况(D)由处理装置根据预定的优先(Z)考虑预定的一组属性的每个属性(j)进行计算,这种优先顺序(Z)根据对于给定的服务提供商而言每个属性(j)的商业重要性进行选择。
13.根据前述任一权利要求的方法,其中处理装置确定待识别用户(501)具有给定属性(j)的概率,该属性与性别、年龄、社会职业类别、收入水平、地理位置、感兴趣领域或者用户计算机类型有关。
14.根据权利要求1至13中任一权利要求的方法,其中感兴趣的网站包括页面,一些页面使用页面标记器进行标记,标记器的下载触发对处理装置的发送请求,该请求指示给定用户下载了特殊页面。
15.根据前述任一权利要求的方法,其中当待识别用户(501)通过网络(200)连接到主管网站(s)的服务器(601)上时,主管网站的服务器(601)将待识别用户(501)的识别请求发送到给包括处理装置的用户文件服务器(101),而用户文件服务器(101)将与待识别用户(501)相关的数据返回给主管网站(s)的服务器(601)。
16.根据权利要求1至14中任一权利要求的方法,其中当待识别用户(501)通过网络(200)连接到主管网站(s)的服务器(601)上时,主管网站的服务器(601)将待识别用户(501)传送给包括处理装置的用户文件服务器(101),用户文件服务器(101)确定与用户的概况相关的数据并且将该用户重新发送给主管网站(s)的服务器(601),用与待识别用户(501)的概况相关的数据充实其请求。
17.根据权利要求15或16的方法,其中主管网站(s)的服务器(601)根据与待识别用户(501)的概况相关的数据修改网站的表述。
18.根据权利要求15至17中的任一方法,其中主管网站(s)的服务器(601)将由用户文件服务器(101)返回的与用户的概况相关的数据保持在存储器中,或者将该数据存储在信息文件中,该信息文件安装在待识别用户(501)的浏览器中。
19.根据前述任一权利要求的方法,其中用户文件服务器(101)产生关于连接到服务器(601)主管的网站(s)的报告,该报告指示在特定的时间周期内浏览过网站的用户数量,并且提供关于这些用户的概况数据。
20.根据权利要求19的方法,其中由用户文件服务器(101)产生的报告包括与所提供概况数据相关的预测误差率。
21、一种用于确定通信网络(200)的待识别用户(501)的概况的系统(100),包括与网络(200)连接的用户文件服务器(101),并且其包括处理装置,其中处理装置适于根据与用户在给定时间周期内连接过的所述感兴趣网站相关的概率,确定待识别用户(501)具有给定属性的概率,
其中处理装置将用户具有特定属性(j)的概率(m3j)确定为去相关概率值(m1j)与相关概率值(m2j)的组合,该去相关概率值考虑到了与感兴趣的多个网站相关的概率,该相关概率值考虑到了关于其为参考人口(400)的一部分的用户的平均概况数据(gj)。
22、根据权利要求21的系统(100),其中服务器适于连接到包含关于网络已知用户的概况数据(Pi)的数据库(102),这些用户是参考人口(400)的一部分,关于已知用户的概况数据(Pi)包括与每个用户(i)相关的一组属性(j)值(Pij)。
23、根据权利要求21或22的系统,其中处理装置适于根据参考人口(400)的用户连接到网站(s)的连接历史,为通过网络(200)可访问的一组感兴趣网站的每个网站(s)确定一组(Ps)概率(Psj),其表示连接到网站(s)的用户的属性值。
CNA2005800151015A 2004-03-10 2005-03-10 用于确定通信网络用户概况的系统和方法 Pending CN1954336A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0402476A FR2867584B1 (fr) 2004-03-10 2004-03-10 Procede de determination d'un profil d'un utilisateur d'un reseau de communication
FR0402476 2004-03-10

Publications (1)

Publication Number Publication Date
CN1954336A true CN1954336A (zh) 2007-04-25

Family

ID=34896420

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800151015A Pending CN1954336A (zh) 2004-03-10 2005-03-10 用于确定通信网络用户概况的系统和方法

Country Status (6)

Country Link
US (1) US20070198937A1 (zh)
EP (1) EP1723586A1 (zh)
CN (1) CN1954336A (zh)
BR (1) BRPI0508634A (zh)
FR (1) FR2867584B1 (zh)
WO (1) WO2005088498A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530312A (zh) * 2012-07-05 2014-01-22 国际商业机器公司 使用多方面足迹的用户标识的方法和系统
CN104281635A (zh) * 2014-03-13 2015-01-14 电子科技大学 基于隐私反馈预测移动用户基础属性的方法

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7515560B2 (en) * 2005-09-07 2009-04-07 F4W, Inc. Apparatus and method for dynamically updating and communicating within flexible networks
US20070208728A1 (en) * 2006-03-03 2007-09-06 Microsoft Corporation Predicting demographic attributes based on online behavior
US8073719B2 (en) * 2006-06-30 2011-12-06 Rearden Commerce, Inc. System and method for core identity with personas across multiple domains with permissions on profile data based on rights of domain
US8095402B2 (en) * 2006-07-10 2012-01-10 Rearden Commerce, Inc. System and method for transferring a service policy between domains
US9430773B2 (en) 2006-07-18 2016-08-30 American Express Travel Related Services Company, Inc. Loyalty incentive program using transaction cards
US9542690B2 (en) 2006-07-18 2017-01-10 American Express Travel Related Services Company, Inc. System and method for providing international coupon-less discounts
US9558505B2 (en) 2006-07-18 2017-01-31 American Express Travel Related Services Company, Inc. System and method for prepaid rewards
US20080201432A1 (en) * 2007-02-16 2008-08-21 Rearden Commerce, Inc. System and Method for Facilitating Transfer of Experience Data in to Generate a New Member Profile for a Online Service Portal
US7447996B1 (en) * 2008-02-28 2008-11-04 International Business Machines Corporation System for using gender analysis of names to assign avatars in instant messaging applications
FR2935185A1 (fr) * 2008-08-22 2010-02-26 Weborama Procede et systeme de determination d'un profil comportemental d'internaute
US9721013B2 (en) 2008-09-15 2017-08-01 Mordehai Margalit Holding Ltd. Method and system for providing targeted searching and browsing
US8341151B2 (en) * 2008-09-15 2012-12-25 Margalit Mordehai Method and system for providing targeted searching and browsing
US10475047B2 (en) * 2009-08-28 2019-11-12 Resonate Networks, Inc. Method and apparatus for delivering targeted content to website visitors
US20110119278A1 (en) * 2009-08-28 2011-05-19 Resonate Networks, Inc. Method and apparatus for delivering targeted content to website visitors to promote products and brands
US9357024B2 (en) * 2010-08-05 2016-05-31 Qualcomm Incorporated Communication management utilizing destination device user presence probability
US9443211B2 (en) * 2010-10-13 2016-09-13 International Business Machines Corporation Describing a paradigmatic member of a task directed community in a complex heterogeneous environment based on non-linear attributes
US8732569B2 (en) * 2011-05-04 2014-05-20 Google Inc. Predicting user navigation events
US8151341B1 (en) 2011-05-23 2012-04-03 Kaspersky Lab Zao System and method for reducing false positives during detection of network attacks
US8849699B2 (en) * 2011-09-26 2014-09-30 American Express Travel Related Services Company, Inc. Systems and methods for targeting ad impressions
US8750852B2 (en) 2011-10-27 2014-06-10 Qualcomm Incorporated Controlling access to a mobile device
US9195988B2 (en) 2012-03-13 2015-11-24 American Express Travel Related Services Company, Inc. Systems and methods for an analysis cycle to determine interest merchants
US9697529B2 (en) 2012-03-13 2017-07-04 American Express Travel Related Services Company, Inc. Systems and methods for tailoring marketing
US10664883B2 (en) 2012-09-16 2020-05-26 American Express Travel Related Services Company, Inc. System and method for monitoring activities in a digital channel
US9754277B2 (en) 2012-09-16 2017-09-05 American Express Travel Related Services Company, Inc. System and method for purchasing in a digital channel
US10504132B2 (en) 2012-11-27 2019-12-10 American Express Travel Related Services Company, Inc. Dynamic rewards program
CN103970752B (zh) * 2013-01-25 2017-12-05 秒针信息技术有限公司 独立访问者数量估算方法和系统
US10395237B2 (en) 2014-05-22 2019-08-27 American Express Travel Related Services Company, Inc. Systems and methods for dynamic proximity based E-commerce transactions
US10911370B2 (en) 2017-09-26 2021-02-02 Facebook, Inc. Systems and methods for providing predicted web page resources
US11551251B2 (en) 2020-11-12 2023-01-10 Rodney Yates System and method for transactional data acquisition, aggregation, processing, and dissemination in coordination with a preference matching algorithm

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7155508B2 (en) * 2000-09-01 2006-12-26 Yodlee.Com, Inc. Target information generation and ad server
US20020112035A1 (en) * 2000-10-30 2002-08-15 Carey Brian M. System and method for performing content experience management
US20030020739A1 (en) * 2001-07-26 2003-01-30 Cohen Jeremy Stein System and method for comparing populations of entities
US7162522B2 (en) * 2001-11-02 2007-01-09 Xerox Corporation User profile classification by web usage analysis
US20030154126A1 (en) * 2002-02-11 2003-08-14 Gehlot Narayan L. System and method for identifying and offering advertising over the internet according to a generated recipient profile

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530312A (zh) * 2012-07-05 2014-01-22 国际商业机器公司 使用多方面足迹的用户标识的方法和系统
CN103530312B (zh) * 2012-07-05 2016-12-28 国际商业机器公司 使用多方面足迹的用户标识的方法和系统
CN104281635A (zh) * 2014-03-13 2015-01-14 电子科技大学 基于隐私反馈预测移动用户基础属性的方法

Also Published As

Publication number Publication date
FR2867584B1 (fr) 2006-06-09
EP1723586A1 (en) 2006-11-22
WO2005088498A1 (en) 2005-09-22
BRPI0508634A (pt) 2007-09-04
US20070198937A1 (en) 2007-08-23
FR2867584A1 (fr) 2005-09-16

Similar Documents

Publication Publication Date Title
CN1954336A (zh) 用于确定通信网络用户概况的系统和方法
US8620746B2 (en) Scoring quality of traffic to network sites
CN103220305B (zh) 网络媒介信息的分享处理系统和处理方法
US8150732B2 (en) Audience targeting system with segment management
US20110218859A1 (en) Method, Apparatus and System for Increasing Website Data Transfer Speed
US20010007097A1 (en) System and method for recording internet advertisement access history
US20110202407A1 (en) System and method for improving internet search results using telecommunications data
US20090234727A1 (en) System and method for determining relevance ratings for keywords and matching users with content, advertising, and other users based on keyword ratings
US20050038894A1 (en) Internet domain keyword optimization
US20050125290A1 (en) Audience targeting system with profile synchronization
US20080195609A1 (en) Method and System for Generating a Population Representative of a Set of Users of a Communication Network
CN103049452A (zh) 一种基于预估下载率进行应用排序的方法与设备
CN106776660A (zh) 一种信息推荐方法及装置
US9578135B2 (en) Method of identifying remote users of websites
CN108460082A (zh) 一种推荐方法及装置,电子设备
WO2001044984A1 (en) Internet tool
US10275793B2 (en) Content delivery system using natural query events
KR100366772B1 (ko) 인터넷을 이용한 지식/정보 제공 서비스 방법
WO2007105909A1 (en) Method for targeting web advertisement clickers based on click pattern by using a collaborative filtering system with neural networks and system thereof
JP2003022376A (ja) 情報提供事業システムおよび情報提供事業方法
CN104917812B (zh) 一种应用于群智计算的服务节点选择方法
CN110533454B (zh) 一种识别业务对象群体的方法及系统
JP2006277678A (ja) メッセージ生成システム、メッセージ生成方法、およびコンピュータプログラム
KR101123372B1 (ko) 목표 유입수에 따른 추천 키워드 제공 방법 및 장치
WO2002033626A1 (en) Demographic profiling engine

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20070425