CN101916264B - 基于用户面部表情与目光分布检测的个性化网页推荐方法 - Google Patents

基于用户面部表情与目光分布检测的个性化网页推荐方法 Download PDF

Info

Publication number
CN101916264B
CN101916264B CN2010102422531A CN201010242253A CN101916264B CN 101916264 B CN101916264 B CN 101916264B CN 2010102422531 A CN2010102422531 A CN 2010102422531A CN 201010242253 A CN201010242253 A CN 201010242253A CN 101916264 B CN101916264 B CN 101916264B
Authority
CN
China
Prior art keywords
user
webpage
reading
interest
notional word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2010102422531A
Other languages
English (en)
Other versions
CN101916264A (zh
Inventor
江浩
徐颂华
刘智满
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2010102422531A priority Critical patent/CN101916264B/zh
Publication of CN101916264A publication Critical patent/CN101916264A/zh
Application granted granted Critical
Publication of CN101916264B publication Critical patent/CN101916264B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种基于用户面部表情与目光分布检测的个性化网页推荐方法。包括以下步骤:1)侦测用户在阅读网页时其目光在屏幕上的关注点;2)侦测用户在阅读网页时的面部表情,并估算其每一时刻的阅读专注度;3)根据用户阅读过的网页,估算用户对每个实词的阅读兴趣;4)对用户尚未阅读的网页,预测该用户对该网页的阅读兴趣;5)利用用户阅读兴趣,结合传统搜索技术生成个性化的网页推荐结果。本发明有效地利用了用户在浏览网页时的面部表情和目光分布,将用户的阅读专注度结合在网页搜索与排序过程中,使得最终的个性化网页推荐结果更加接近用户的期待结果。

Description

基于用户面部表情与目光分布检测的个性化网页推荐方法
技术领域
本发明涉及计算机信息与检索领域,尤其涉及一种基于用户面部表情与目光分布检测的个性化网页推荐方法。
背景技术
在当前,个性化的网络信息检索已经成为了最热门的计算机研究方向之一。目前,流行的网页搜索引擎对不同用户实现个性化的搜索结果主要是通过用户点击数据、历史网站、网络地址等比较容易获得但不易于发掘用户个性化的特征。这些并不是最好的方法,最好的搜索结果应该是根据用户的兴趣来排名。在2008年ACM推荐系统会议中公布的一篇论文“借助商用眼球跟踪装置的个性化在线文档、图像与视频推荐”(“Personalized online document,image andvideo recommendation via commodity eye-tracking”)提出了一个方法,通过追踪用户在浏览网页时的眼球焦点,以推测当前及将来可能吸引用户的内容。其中的一个关键步骤是该算法引入了人类体表特征(眼球聚焦点)所蕴含的用户个性化需求信息。在本发明中,我们提出了一种新的个性化网页推荐方法,不仅仅通过跟踪眼球获得了用户的当前阅读内容,更进一步考虑了用户在阅读不同内容时的专注程度,并通过用户在阅读时的面部表情来捕获,可以更可靠地估计用户对不同网页内容的不同感兴趣程度。以此,我们可以产生一个更准确的个性化的网页排名,更加逼近个人用户的阅读兴趣,使得最终的个性化网页推荐结果更加接近用户的期待搜索结果。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于用户面部表情与目光分布检测的个性化网页推荐方法。
基于用户面部表情与目光分布检测的个性化网页推荐方法包括以下步骤:
1)侦测用户在阅读网页时其目光在屏幕上的关注点;
2)侦测用户在阅读网页时的面部表情,并估算其每一时刻的阅读专注度;
3)根据用户阅读过的网页,估算用户对每个实词的阅读兴趣;
4)对用户尚未阅读的网页,预测该用户对该网页的阅读兴趣;
5)利用用户阅读兴趣,结合传统搜索技术生成个性化的网页推荐结果。
所述的侦测用户在阅读网页时其目光在屏幕上的关注点步骤:
(a)在用户阅读网页文档时,每隔0.5秒,通过眼球跟踪装置或摄像头,追踪该用户每一时刻其目光在屏幕上的关注点位置(x,y);
所述的侦测用户在阅读网页时的面部表情,并估算其每一时刻的阅读专注度步骤为:
(b)在用户阅读网页文档时,每隔0.5秒,利用人脸表情识别装置,获得该用户每一时刻的面部表情概率向量F:
F=[f1,f2,f3,f4,f5,f6];
其中f1至f6均为取值0到1之间的实数,分别代表该用户面部表情为快乐、吃惊、生气、厌恶、害怕、悲哀的概率;
(c)计算该用户在时刻t时的阅读专注度r(t):
r ( t ) = f 1 2 + f 2 2 + f 3 2 + f 4 2 + f 5 2 + f 6 2 ;
所述的根据用户阅读过的网页,估算用户对每个实词的阅读兴趣步骤:
(d)对网页中的每个实词wi,设其在时刻t时在屏幕上的位置为(xi,yi),则该实词在时刻t时的用户阅读兴趣I(wi,t)为:
I ( w i , t ) = r ( t ) exp ( - ( x i - x ) 2 2 W 2 - ( y i - y ) 2 2 H 2 ) ;
其中(x,y)为在步骤(a)中所获得的该用户在时刻t时的目光关注点位置;r(t)为步骤(b)-步骤(c)所获得的该用户在时刻t时的阅读专注度;W和H分别是该网页中每个实词在屏幕上的平均宽度和平均高度;
(e)设用户在阅读网页的过程中,步骤(a)与步骤(b)分别获得了m个眼神关注点与阅读专注度样本;设用户对每个实词w的阅读兴趣为I(w),计算I(w)为:
I ( w ) = Σ j = 1 m I ( w , t j ) ;
其中,I(w,tj)为通过步骤(d)所获得的用户在时刻tj时对实词w的阅读兴趣;
所述的对用户尚未阅读的网页,预测该用户对该网页的阅读兴趣步骤为:
(f)对出现在用户阅读过网页中的每个实词wi,计算其词及逆文档频(TF×IDF)系数TI(wi)为:
TI ( w i ) = 1 Z ( 1 + ln q ( w i ) ) ln ( 1 + M q O ( w i ) ) ;
其中,M表示用户已经阅读过的网页个数;q(wi)表示实词wi在M个网页中的出现次数;qO(wi)表示在M个网页中含有实词wi的网页个数;Z为系数,其值为:
Z = Σ j = 1 N ( 1 + ln q ( w j ) ) ;
其中,N表示在M个网页中不同实词的个数;q(wj)表示在N个实词中的第j个实词wj的出现次数;
(g)对一个用户尚未阅读的网页D,设D中共有n个不同的实词w1(D),w2(D),...,wn(D);计算其中每个实词在D中的词频(TF)系数TF(wi(D))为:
TF ( w i ( D ) ) = 1 Z D ( 1 + ln q ( w i ( D ) ) ) ;
其中,q(wi(D))为网页D中的第i个实词wi(D)在网页D中的出现次数;ZD为系数,其值为:
Z D = Σ j = 1 n ( 1 + ln q ( w j ( D ) ) ) ;
其中,q(wj(D))表示在网页D中的第j个实词wj(D)的出现次数;
(h)预测用户对于网页D中的第i个实词wi(D)的阅读兴趣RI(wi(D))为:
RI ( w i ( D ) ) = Σ j = 1 N ( I ( w j ) · S ( w j , w i ( D ) ) · TI ( w j ) ) ;
其中S(wj,wi(D))为取值在0至1之间的实数,表示wj与wi(D)在词网(WordNet)中的词义相似度;若wj或wi(D)不是英文,则将其翻译为英文再在词网(WordNet)中获得其词义相似度;
(i)预测用户对于网页D的阅读兴趣RI(D)为:
RI ( D ) = Σ i = 1 n ( RI ( w i ( D ) ) TF ( w i ( D ) ) ) Σ i = 1 n TF ( w i ( D ) ) ;
所述的利用用户阅读兴趣,结合传统搜索技术生成个性化的网页推荐结果步骤为:
(j)当用户提交一个查询请求时,服务端首先将查询重定向至传统搜索引擎如谷歌(Google),并获得返回的前50~100个网页,对于返回的每个网页,使用步骤(f)~(i)中的方法预测该用户对该网页的阅读兴趣;
(k)设RI(Di)表示传统搜索引擎返回结果中的第i个网页Di的用户阅读兴趣,计算用户对该网页的综合兴趣OI(Di):
OI ( D i ) = ( 1 - z ) · RI ( D i ) + z · 2 exp ( - k · i ) 1 + exp ( - k · i ) ;
其中,exp()表示指数函数;参数z用来控制用户阅读兴趣的重要程度,其值通常设为exp(-M/100);k为一个用户可控参数,用来控制用户阅读兴趣随排名下降的坡度,其预设值为0.2;
(1)对返回的50~100个网页,按照用户对它们的综合兴趣,从大到小重新排序,作为个性化网页推荐结果。
本发明有效地利用了用户在浏览网页时的面部表情和目光分布,将用户的阅读专注度结合在网页搜索与排序过程中,使得最终的个性化网页推荐结果更加接近用户的期待的搜索结果,从而使得网页搜索引擎能为用户提供更好的个性化服务。
附图说明
图1是基于用户面部表情与目光分布检测的个性化网页推荐方法的流程图;
图2是用户使用传统搜索引擎谷歌(Google)对关键词ABC进行查询的界面结果截图;
图3是用户使用本发明实施例系统对关键词ABC进行查询的界面结果截图;
图4是20个用户对15个不同关键词做网页搜索的实验数据箱图(box-plotdiagram);该图的详细数据列在表1中。
具体实施方式
基于用户面部表情与目光分布检测的个性化网页推荐方法包括以下步骤:
1)侦测用户在阅读网页时其目光在屏幕上的关注点;
2)侦测用户在阅读网页时的面部表情,并估算其每一时刻的阅读专注度;
3)根据用户阅读过的网页,估算用户对每个实词的阅读兴趣;
4)对用户尚未阅读的网页,预测该用户对该网页的阅读兴趣;
5)利用用户阅读兴趣,结合传统搜索技术生成个性化的网页推荐结果。
所述的侦测用户在阅读网页时其目光在屏幕上的关注点步骤为:
(a)在用户阅读网页文档时,每隔0.5秒,通过眼球跟踪装置或摄像头,追踪该用户每一时刻其目光在屏幕上的关注点位置(x,y);
所述的侦测用户在阅读网页时的面部表情,并估算其每一时刻的阅读专注度步骤为:
(b)在用户阅读网页文档时,每隔0.5秒,利用人脸表情识别装置,获得该用户每一时刻的面部表情概率向量F:
F=[f1,f2,f3,f4,f5,f6];
其中f1至f6均为取值0到1之间的实数,分别代表该用户面部表情为快乐、吃惊、生气、厌恶、害怕、悲哀的概率;
(c)计算该用户在时刻t时的阅读专注度r(t):
r ( t ) = f 1 2 + f 2 2 + f 3 2 + f 4 2 + f 5 2 + f 6 2 ;
所述的根据用户阅读过的网页,估算用户对每个实词的阅读兴趣步骤为:
(d)对网页中的每个实词wi,设其在时刻t时在屏幕上的位置为(xi,yi),则该实词在时刻t时的用户阅读兴趣I(wi,t)为:
I ( w i , t ) = r ( t ) exp ( - ( x i - x ) 2 2 W 2 - ( y i - y ) 2 2 H 2 ) ;
其中(x,y)为在步骤(a)中所获得的该用户在时刻t时的目光关注点位置;r(t)为步骤(b)-步骤(c)所获得的该用户在时刻t时的阅读专注度;W和H分别是该网页中每个实词在屏幕上的平均宽度和平均高度;
(e)设用户在阅读网页的过程中,步骤(a)与步骤(b)分别获得了m个眼神关注点与阅读专注度样本;设用户对每个实词w的阅读兴趣为I(w),计算I(w)为:
I ( w ) = Σ j = 1 m I ( w , t j ) ;
其中,I(w,tj)为通过步骤(d)所获得的用户在时刻tj时对实词w的阅读兴趣;
所述的对用户尚未阅读的网页,预测该用户对该网页的阅读兴趣步骤为:
(f)对出现在用户阅读过网页中的每个实词wi,计算其词及逆文档频(TF×IDF)系数TI(wi)为:
TI ( w i ) = 1 Z ( 1 + ln q ( w i ) ) ln ( 1 + M q O ( w i ) ) ;
其中,M表示用户已经阅读过的网页个数;q(wi)表示实词wi在M个网页中的出现次数;qO(wi)表示在M个网页中含有实词wi的网页个数;Z为系数,其值为:
Z = Σ j = 1 N ( 1 + ln q ( w j ) ) ;
其中,N表示在M个网页中不同实词的个数;q(wj)表示在N个实词中的第j个实词wj的出现次数;
(g)对一个用户尚未阅读的网页D,设D中共有n个不同的实词w1(D),w2(D),...,wn(D);计算其中每个实词在D中的词频(TF)系数TF(wi(D))为:
TF ( w i ( D ) ) = 1 Z D ( 1 + ln q ( w i ( D ) ) ) ;
其中,q(wi(D))为网页D中的第i个实词wi(D)在网页D中的出现次数;ZD为系数,其值为:
Z D = Σ j = 1 n ( 1 + ln q ( w j ( D ) ) ) ;
其中,q(wj(D))表示在网页D中的第j个实词wj(D)的出现次数;
(h)预测用户对于网页D中的第i个实词wi(D)的阅读兴趣RI(wi(D))为:
RI ( w i ( D ) ) = Σ j = 1 N ( I ( w j ) · S ( w j , w i ( D ) ) · TI ( w j ) ) ;
其中S(wj,wi(D))为取值在0至1之间的实数,表示wj与wi(D)在词网(WordNet)中的词义相似度;若wj或wi(D)不是英文,则将其翻译为英文再在词网(WordNet)中获得其词义相似度;
(i)预测用户对于网页D的阅读兴趣RI(D)为:
RI ( D ) = Σ i = 1 n ( RI ( w i ( D ) ) TF ( w i ( D ) ) ) Σ i = 1 n TF ( w i ( D ) ) ;
所述的利用用户阅读兴趣,结合传统搜索技术生成个性化的网页推荐结果步骤为:
(j)当用户提交一个查询请求时,服务端首先将查询重定向至传统搜索引擎如谷歌(Google),并获得返回的前50~100个网页,对于返回的每个网页,使用步骤(f)~(i)中的方法预测该用户对该网页的阅读兴趣;
(k)设RI(Di)表示传统搜索引擎返回结果中的第i个网页Di的用户阅读兴趣,计算用户对该网页的综合兴趣OI(Di):
OI ( D i ) = ( 1 - z ) · RI ( D i ) + z · 2 exp ( - k · i ) 1 + exp ( - k · i ) ;
其中,exp()表示指数函数;参数z用来控制用户阅读兴趣的重要程度,其值通常设为exp(-M/100);k为一个用户可控参数,用来控制用户阅读兴趣随排名下降的坡度,其预设值为0.2;
(l)对返回的50~100个网页,按照用户对它们的综合兴趣,从大到小重新排序,作为个性化网页推荐结果。
实施例:
如图1所示,该个性化网页推荐系统包括:眼球跟踪装置10、表情获取装置20、样本手机模块30、网页预处理模块40、文本分析模块50、用户数据库60、查询界面70、传统引擎模块80、阅读兴趣预测模块90、排序模块100。
眼球跟踪装置10,利用先进的眼球运动捕捉仪器,分析当前用户目光所在的屏幕位置;在本实施例中眼球跟踪装置采用普通摄像头(LogitechQuickcam Notebook Pro)搭配开源眼球跟踪系统Enable Viacam(http://eviacam.sourceforge.net)组装而成。
表情获取装置20,在用户阅读网页文档时,利用人脸表情识别装置,获得该用户每一时刻的面部表情概率向量F:
F=[f1,f2,f3,f4,f5,f6];
其中f1至f6均为取值0到1之间的实数,分别代表该用户面部表情为快乐、吃惊、生气、厌恶、害怕、悲哀的概率;在本实施例中人脸表情识别装置采用普通摄像头(Logitech Quickcam Notebook Pro)搭配人脸表情识别系统eMotion(http://www.visual-recognition.n1)组装而成。
样本收集模块30,根据从眼球跟踪装置10与表情获取装置20获得的面部表情与目光分布数据,计算用户对每个实词的阅读兴趣,连同用户阅读过的网页文本一并存入对应用户的数据库中;具体步骤如下:
计算该用户在时刻t时的阅读专注度r(t):
r ( t ) = f 1 2 + f 2 2 + f 3 2 + f 4 2 + f 5 2 + f 6 2 ;
对网页中的每个实词wi,设其在时刻t时在屏幕上的位置为(xi,yi),则该实词在时刻t时的用户阅读兴趣I(wi,t)为:
I ( w i , t ) = r ( t ) exp ( - ( x i - x ) 2 2 W 2 - ( y i - y ) 2 2 H 2 ) ;
其中(x,y)为在眼球跟踪装置10中所获得的该用户在时刻t时的目光关注点位置;W和H分别是该网页中每个实词在屏幕上的平均宽度和平均高度;
设用户在阅读网页的过程中,分别获得了m个眼神关注点与阅读专注度样本;设用户对每个实词w的阅读兴趣为I(w),计算I(w)为:
I ( w ) = Σ j = 1 m I ( w , t j ) ;
用户数据库40,存储用户对各个实词的阅读兴趣,以及其阅读过的网页文本;在本实施例中用MYSQL数据库存储。
查询界面50,提供一个用户使用本发明所述网页推荐系统的web入口,提供网页搜索服务;在本实施例中,此查询界面用jsp实现。
传统引擎模块60,当用户提交一个查询请求时,系统会对传统搜索引擎的搜索结果页面进行解析并获取其返回结果中的前50~100个网页;本实施例采用了谷歌(Google)作为传统搜索引擎以供调用。
文档预处理模块70,直接从网站下载下来的网页包含很多无用信息,比如HTML标签,广告栏,导航栏等;此模块用于去除网页中的无用信息,保留用户将关注的主体文档;本实施例实现去除HTML标签的功能。
文本分析模块80,对出现在用户阅读过网页中的每个实词wi,计算其词及逆文档频(TF×IDF)系数TI(wi)为:
TI ( w i ) = 1 Z ( 1 + ln q ( w i ) ) ln ( 1 + M q O ( w i ) ) ;
其中,M表示用户已经阅读过的网页个数;q(wi)表示实词wi在M个网页中的出现次数;qO(wi)表示在M个网页中含有实词wi的网页个数;Z为系数,其值为:
Z = Σ j = 1 N ( 1 + ln q ( w j ) ) ;
其中,N表示在M个网页中不同实词的个数;q(wj)表示在N个实词中的第j个实词wj的出现次数;
对一个用户尚未阅读的网页D,设D中共有n个不同的实词
w1(D),w2(D),...,wn(D);计算其中每个实词在D中的词频(TF)系数TF(wi(D))为:
TF ( w i ( D ) ) = 1 Z D ( 1 + ln q ( w i ( D ) ) ) ;
其中,q(wi(D))为网页D中的第i个实词wi(D)在网页D中的出现次数;ZD为系数,其值为:
Z D = Σ j = 1 n ( 1 + ln q ( w j ( D ) ) ) ;
其中,q(wj(D))表示在网页D中的第j个实词wj(D)的出现次数。
阅读兴趣预测模块90,具体步骤如下:
预测用户对于网页D中的第i个实词wi(D)的阅读兴趣RI(wi(D))为:
RI ( w i ( D ) ) = Σ j = 1 N ( I ( w j ) · S ( w j , w i ( D ) ) · TI ( w j ) ) ;
其中S(wj,wi(D))为取值在0至1之间的实数,表示wj与wi(D)在词网(WordNet)中的词义相似度;若wj或wi(D)不是英文,则将其翻译为英文再在词网(WordNet)中获得其词义相似度;
预测用户对于网页D的阅读兴趣RI(D)为:
RI ( D ) = Σ i = 1 n ( RI ( w i ( D ) ) TF ( w i ( D ) ) ) Σ i = 1 n TF ( w i ( D ) ) ;
设RI(Di)表示传统引擎模块60返回结果中的第i个网页Di的用户阅读兴趣,计算用户对该网页的综合兴趣OI(Di):
OI ( D i ) = ( 1 - z ) · RI ( D i ) + z · 2 exp ( - k · i ) 1 + exp ( - k · i ) ;
其中,exp()表示指数函数;参数z用来控制用户阅读兴趣的重要程度,其值通常设为exp(-M/100);k为一个用户可控参数,用来控制用户阅读兴趣随排名下降的坡度,其预设值为0.2。
排序模块100,排序模块将结果按照所有网页的用户综合兴趣进行倒序排列,并将结果返回给用户。
表1的实验结果清晰的显示出本方法的优越性;
表1是20个用户对15个不同关键词做网页搜索的实验数据;每一行表示每组实验中用5种不同方法所得搜索结果与用户理想搜索结果之间的搜索错误度(Search Error Score,简写为SES);
错误度(SES)用以衡量两个排名之间的差异,与用户理想排名的错误度越小则该排名越接近用户的理想排名;设n个网页分别被排成A和B的两个排名;设在A排名中的第i个网页在B排名中的名次为bi,则A与B之间的错误度(SES)为:
SES ( A , B ) = Σ i = 1 n ( w i | i - b i | ) Σ i = 1 n w i ;
其中,系数wi的取值为:
w i = 2.5 ( 1 ≤ i ≤ 5 ) 2.0 ( 6 ≤ i ≤ 10 ) 1.5 ( 11 ≤ i ≤ 15 ) 1.0 ( 16 ≤ i ≤ n ) ;
5种方法包括3个流行搜索引擎:谷歌(Google)、雅虎(Yahoo)、必应(Bing),与发表在2008年由美国计算机协会举办的推荐系统会议(ACMRecommender Systems)上的一篇论文《基于商用眼球跟踪装置的个性化在线文档、图像与视频推荐》(“Personalized online document,image and videorecommendation via commodity eye-tracking”)中所述的方法(简写为AT08),以及本发明所述方法;这些数据也以图形化的形式显示在图4中;
表1
Figure BSA00000212935800111
上述表格表明,本发明有效地将用户的喜好结合在搜索过程中,使得最终的排名结果更加接近用户期待的理想排名,从而使得网页搜索引擎为用户提供更好的个性化服务。
以上所述仅为本发明的基于面部表情与目光分布检测的个性化网页推荐方法的较佳实施例,并非用以限定本发明的实质技术内容的范围。本发明的基于面部表情与目光分布检测的个性化网页推荐方法,其实质技术内容是广泛的定义于权利要求书中,任何他人所完成的技术实体或方法,若是与权利要求书中所定义者完全相同,或是同一等效的变更,均将被视为涵盖于此专利保护范围之内。

Claims (1)

1.一种基于用户面部表情与目光分布检测的个性化网页推荐方法,其特征在于包括以下步骤:
1)侦测用户在阅读网页时其目光在屏幕上的关注点;
2)侦测用户在阅读网页时的面部表情,并估算其每一时刻的阅读专注度;
3)根据用户阅读过的网页,估算用户对每个实词的阅读兴趣;
4)对用户尚未阅读的网页,预测该用户对该网页的阅读兴趣;
5)利用用户阅读兴趣,结合传统搜索技术生成个性化的网页推荐结果;
所述的侦测用户在阅读网页时其目光在屏幕上的关注点步骤为:
(a)在用户阅读网页文档时,每隔0.5秒,通过眼球跟踪装置,追踪该用户每一时刻其目光在屏幕上的关注点位置(x,y);
所述的侦测用户在阅读网页时的面部表情,并估算其每一时刻的阅读专注度步骤为:
(b)在用户阅读网页文档时,每隔0.5秒,利用人脸表情识别装置,获得该用户每一时刻的面部表情概率向量F:
F=[f1,f2,f3,f4,f5,f6];
其f1至f6均为取值0到1之间的实数,分别代表该用户面部表情为快乐、吃惊、生气、厌恶、害怕、悲哀的概率;
(c)计算该用户在时刻t时的阅读专注度r(t):
Figure FSB00000807168000011
所述的根据用户阅读过的网页,估算用户对每个实词的阅读兴趣步骤为:
(d)对网页中的每个实词wi,设其在时刻t时在屏幕上的位置为(xi,yi),则该实词在时刻t时的用户阅读兴趣I(wi,t)为:
Figure FSB00000807168000012
其中(x,y)为在步骤(a)中所获得的该用户在时刻t时的目光关注点位置;r(t)为步骤(b)-步骤(c)所获得的该用户在时刻t时的阅读专注度;W和H分别是该网页中每个实词在屏幕上的平均宽度和平均高度;
(e)设用户在阅读网页的过程中,分别获得了m个眼神关注点与阅读专注度样本;设用户对每个实词w的阅读兴趣为I(w),计算I(w)为: 
Figure FSB00000807168000021
其中,I(w,tj)为通过步骤(d)所获得的用户在时刻tj时对实词w的阅读兴趣;
所述的对用户尚未阅读的网页,预测该用户对该网页的阅读兴趣步骤为:
(f)对出现在用户阅读过网页中的每个实词wi,计算其词及逆文档频系数TI(wi)为:
Figure FSB00000807168000022
其中,M表示用户已经阅读过的网页个数;q(wi)表示实词wi在M个网页中的出现次数;qO(wi)表示在M个网页中含有实词wi的网页个数;Z为系数,其值为:
其中,N表示在M个网页中不同实词的个数;q(wj)表示在N个实词中的第j个实词Wj的出现次数;
(g)对一个用户尚未阅读的网页D,设D中共有n个不同的实词w1(D),w2(D),...,wn(D);计算其中每个实词在D中的词频系数TF(wi(D))为:
其中,q(wi(D))为网页D中的第i个实词wi(D)在网页D中的出现次数;ZD为系数,
其值为:
Figure FSB00000807168000025
其中,q(wj(D))表示在网页D中的第j个实词wj(D)的出现次数;
(h)预测用户对于网页D中的第i个实词wi(D)的阅读兴趣RI(wi(D))为: 
其中S(wj,wi(D))为取值在0至1之间的实数,表示wj与wi(D)在词网中的词义相似度;若wj或wi(D)不是英文,则将其翻译为英文再在词网中获得其词义相似度;
(i)预测用户对于网页D的阅读兴趣RI(D)为:
Figure FSB00000807168000032
所述的利用用户阅读兴趣,结合传统搜索技术生成个性化的网页推荐结果步骤为:
(j)当用户提交一个查询请求时,服务端首先将查询重定向至传统搜索引擎,并获得返回的前50~100个网页,对于返回的每个网页,使用步骤(f)~(i)中的方法预测该用户对该网页的阅读兴趣,所述传统搜索引擎为谷歌;
(k)设RI(Di)表示传统搜索引擎返回结果中的第i个网页Di的用户阅读兴趣,计算用户对该网页的综合兴趣OI(Di):
其中,exp()表示指数函数;参数z用来控制用户阅读兴趣的重要程度,其值设为exp(-M/100);k为一个用户可控参数,用来控制用户阅读兴趣随排名下降的坡度,其预设值为0.2,M表示用户已经阅读过的网页个数;
(l)对返回的50~100个网页,按照用户对它们的综合兴趣,从大到小重新排序,作为个性化网页推荐结果。 
CN2010102422531A 2010-07-30 2010-07-30 基于用户面部表情与目光分布检测的个性化网页推荐方法 Expired - Fee Related CN101916264B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102422531A CN101916264B (zh) 2010-07-30 2010-07-30 基于用户面部表情与目光分布检测的个性化网页推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102422531A CN101916264B (zh) 2010-07-30 2010-07-30 基于用户面部表情与目光分布检测的个性化网页推荐方法

Publications (2)

Publication Number Publication Date
CN101916264A CN101916264A (zh) 2010-12-15
CN101916264B true CN101916264B (zh) 2012-09-19

Family

ID=43323776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102422531A Expired - Fee Related CN101916264B (zh) 2010-07-30 2010-07-30 基于用户面部表情与目光分布检测的个性化网页推荐方法

Country Status (1)

Country Link
CN (1) CN101916264B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9317834B2 (en) * 2011-06-30 2016-04-19 Microsoft Technology Licensing, Llc User computing device with personal agent program for recommending meeting a friend at a service location based on current location, travel direction, and calendar activity
US20130117259A1 (en) * 2011-11-04 2013-05-09 Nathan J. Ackerman Search Query Context
CN102402765B (zh) * 2011-12-27 2017-07-28 北京京东尚科信息技术有限公司 基于用户表情分析的电子商务推荐方法
CN103167115B (zh) * 2012-05-25 2015-01-07 深圳市金立通信设备有限公司 基于人脑记忆特点的手机浏览器辅助搜索系统及方法
JP2015046089A (ja) * 2013-08-29 2015-03-12 ソニー株式会社 情報処理装置および情報処理方法
IN2014DE02666A (zh) * 2013-09-18 2015-06-26 Booktrack Holdings Ltd
CN103810278B (zh) * 2014-02-14 2018-02-06 北京百纳威尔科技有限公司 终端的网页处理方法及装置
CN103995822A (zh) * 2014-03-19 2014-08-20 宇龙计算机通信科技(深圳)有限公司 一种终端及信息搜索方法
CN105094292A (zh) * 2014-05-05 2015-11-25 索尼公司 评价用户关注度的方法和设备
CN105335369A (zh) * 2014-06-11 2016-02-17 数伦计算机技术(上海)有限公司 计算机用户兴趣点反馈系统及反馈方法
CN104299225A (zh) * 2014-09-12 2015-01-21 姜羚 一种表情识别在大数据分析的应用方法及系统
CN104484044B (zh) * 2014-12-23 2018-07-31 上海斐讯数据通信技术有限公司 一种广告推送方法和系统
CN106503050B (zh) * 2016-09-23 2021-04-16 耀灵人工智能(浙江)有限公司 一种基于大数据进行阅读文章推荐的方法与系统
CN107247733B (zh) * 2017-05-05 2020-01-07 中广热点云科技有限公司 一种视频片段观看热度分析方法及系统
CN107832698A (zh) * 2017-11-02 2018-03-23 北方工业大学 基于阵列镜头的学习兴趣测试方法及装置
CN108492224A (zh) * 2018-03-09 2018-09-04 上海开放大学 基于深度学习在线教育学生综合画像标签管理系统
CN113515335A (zh) * 2021-05-20 2021-10-19 口碑(上海)信息技术有限公司 一种服务信息展示形式的确定方法、装置以及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320387A (zh) * 2008-07-11 2008-12-10 浙江大学 基于用户关注时间的网页文本与图像排序方法
CN101382939A (zh) * 2008-10-23 2009-03-11 浙江大学 基于眼球跟踪的网页文本个性化搜索方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008005175A (ja) * 2006-06-21 2008-01-10 Fuji Xerox Co Ltd 情報配信装置、情報配信方法およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320387A (zh) * 2008-07-11 2008-12-10 浙江大学 基于用户关注时间的网页文本与图像排序方法
CN101382939A (zh) * 2008-10-23 2009-03-11 浙江大学 基于眼球跟踪的网页文本个性化搜索方法

Also Published As

Publication number Publication date
CN101916264A (zh) 2010-12-15

Similar Documents

Publication Publication Date Title
CN101916264B (zh) 基于用户面部表情与目光分布检测的个性化网页推荐方法
US11195057B2 (en) System and method for extremely efficient image and pattern recognition and artificial intelligence platform
US11914674B2 (en) System and method for extremely efficient image and pattern recognition and artificial intelligence platform
Aliannejadi et al. Personalized context-aware point of interest recommendation
US11074495B2 (en) System and method for extremely efficient image and pattern recognition and artificial intelligence platform
Asani et al. Restaurant recommender system based on sentiment analysis
Cai et al. A survey of query auto completion in information retrieval
US9916538B2 (en) Method and system for feature detection
Li et al. Contextual recommendation based on text mining
US20140079297A1 (en) Application of Z-Webs and Z-factors to Analytics, Search Engine, Learning, Recognition, Natural Language, and Other Utilities
US10102482B2 (en) Factorized models
JP6381775B2 (ja) 情報処理システム及び情報処理方法
US11023503B2 (en) Suggesting text in an electronic document
US20090187540A1 (en) Prediction of informational interests
US20110035375A1 (en) Building user profiles for website personalization
Zhu et al. A recommendation engine for travel products based on topic sequential patterns
KR101659064B1 (ko) 사용자 피드백을 이용하여 컨텐츠에 대한 평가 점수를 산출하기 위한 방법 및 장치
Elsafty et al. Document-based recommender system for job postings using dense representations
CN111683294B (zh) 一种信息抽取的弹幕评论推荐方法
Takano et al. An adaptive e-learning recommender based on user's web-browsing behavior
JP5133294B2 (ja) 時空間検索装置及び方法及びプログラム
Chuklin et al. Potential good abandonment prediction
KR20190130410A (ko) 스마트 시니어를 위한 맞춤형 콘텐츠 추천 장치 및 방법
Olivares et al. The big five: Discovering linguistic characteristics that typify distinct personality traits across Yahoo! Answers Members
CN114207650A (zh) 用于化妆品推荐的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120919

Termination date: 20130730