CN101916264A - 基于用户面部表情与目光分布检测的个性化网页推荐方法 - Google Patents

基于用户面部表情与目光分布检测的个性化网页推荐方法 Download PDF

Info

Publication number
CN101916264A
CN101916264A CN 201010242253 CN201010242253A CN101916264A CN 101916264 A CN101916264 A CN 101916264A CN 201010242253 CN201010242253 CN 201010242253 CN 201010242253 A CN201010242253 A CN 201010242253A CN 101916264 A CN101916264 A CN 101916264A
Authority
CN
China
Prior art keywords
user
webpage
reading
interest
notional word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010242253
Other languages
English (en)
Other versions
CN101916264B (zh
Inventor
江浩
徐颂华
刘智满
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2010102422531A priority Critical patent/CN101916264B/zh
Publication of CN101916264A publication Critical patent/CN101916264A/zh
Application granted granted Critical
Publication of CN101916264B publication Critical patent/CN101916264B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种基于用户面部表情与目光分布检测的个性化网页推荐方法。包括以下步骤:1)侦测用户在阅读网页时其目光在屏幕上的关注点;2)侦测用户在阅读网页时的面部表情,并估算其每一时刻的阅读专注度;3)根据用户阅读过的网页,估算用户对每个实词的阅读兴趣;4)对用户尚未阅读的网页,预测该用户对该网页的阅读兴趣;5)利用用户阅读兴趣,结合传统搜索技术生成个性化的网页推荐结果。本发明有效地利用了用户在浏览网页时的面部表情和目光分布,将用户的阅读专注度结合在网页搜索与排序过程中,使得最终的个性化网页推荐结果更加接近用户的期待结果。

Description

基于用户面部表情与目光分布检测的个性化网页推荐方法
技术领域
本发明涉及计算机信息与检索领域,尤其涉及一种基于用户面部表情与目光分布检测的个性化网页推荐方法。
背景技术
在当前,个性化的网络信息检索已经成为了最热门的计算机研究方向之一。目前,流行的网页搜索引擎对不同用户实现个性化的搜索结果主要是通过用户点击数据、历史网站、网络地址等比较容易获得但不易于发掘用户个性化的特征。这些并不是最好的方法,最好的搜索结果应该是根据用户的兴趣来排名。在2008年ACM推荐系统会议中公布的一篇论文“借助商用眼球跟踪装置的个性化在线文档、图像与视频推荐”(“Personalized online document,image and video recommendation via commodity eye-tracking”)提出了一个方法,通过追踪用户在浏览网页时的眼球焦点,以推测当前及将来可能吸引用户的内容。其中的一个关键步骤是该算法引入了人类体表特征(眼球聚焦点)所蕴含的用户个性化需求信息。在本发明中,我们提出了一种新的个性化网页推荐方法,不仅仅通过跟踪眼球获得了用户的当前阅读内容,更进一步考虑了用户在阅读不同内容时的专注程度,并通过用户在阅读时的面部表情来捕获,可以更可靠地估计用户对不同网页内容的不同感兴趣程度。以此,我们可以产生一个更准确的个性化的网页排名,更加逼近个人用户的阅读兴趣,使得最终的个性化网页推荐结果更加接近用户的期待搜索结果。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于用户面部表情与目光分布检测的个性化网页推荐方法。
基于用户面部表情与目光分布检测的个性化网页推荐方法包括以下步骤:
1)侦测用户在阅读网页时其目光在屏幕上的关注点;
2)侦测用户在阅读网页时的面部表情,并估算其每一时刻的阅读专注度;
3)根据用户阅读过的网页,估算用户对每个实词的阅读兴趣;
4)对用户尚未阅读的网页,预测该用户对该网页的阅读兴趣;
5)利用用户阅读兴趣,结合传统搜索技术生成个性化的网页推荐结果。
所述的侦测用户在阅读网页时其目光在屏幕上的关注点步骤:
(a)在用户阅读网页文档时,每隔0.5秒,通过眼球跟踪装置或摄像头,追踪该用户每一时刻其目光在屏幕上的关注点位置(x,y);
所述的侦测用户在阅读网页时的面部表情,并估算其每一时刻的阅读专注度步骤为:
(b)在用户阅读网页文档时,每隔0.5秒,利用人脸表情识别装置,获得该用户每一时刻的面部表情概率向量F:
F=[f1,f2,f3,f4,f5,f6];
其中f1至f6均为取值0到1之间的实数,分别代表该用户面部表情为快乐、吃惊、生气、厌恶、害怕、悲哀的概率;
(c)计算该用户在时刻t时的阅读专注度r(t):
r ( t ) = f 1 2 + f 2 2 + f 3 2 + f 4 2 + f 5 2 + f 6 2 ;
所述的根据用户阅读过的网页,估算用户对每个实词的阅读兴趣步骤:
(d)对网页中的每个实词wi,设其在时刻t时在屏幕上的位置为(xi,yi),则该实词在时刻t时的用户阅读兴趣I(wi,t)为:
I ( w i , t ) = r ( t ) exp ( - ( x i - x ) 2 2 W 2 - ( y i - y ) 2 2 H 2 ) ;
其中(x,y)为在步骤(a)中所获得的该用户在时刻t时的目光关注点位置;r(t)为步骤(b)-步骤(c)所获得的该用户在时刻t时的阅读专注度;W和H分别是该网页中每个实词在屏幕上的平均宽度和平均高度;
(e)设用户在阅读网页的过程中,步骤(a)与步骤(b)分别获得了m个眼神关注点与阅读专注度样本;设用户对每个实词w的阅读兴趣为I(w),计算I(w)为:
I ( w ) = Σ j = 1 m I ( w , t j ) ;
其中,I(w,tj)为通过步骤(d)所获得的用户在时刻tj时对实词w的阅读兴趣;
所述的对用户尚未阅读的网页,预测该用户对该网页的阅读兴趣步骤为:
(f)对出现在用户阅读过网页中的每个实词wi,计算其词及逆文档频(TF×IDF)系数TI(wi)为:
TI ( w i ) = 1 Z ( 1 + ln q ( w i ) ) ln ( 1 + M q O ( w i ) ) ;
其中,M表示用户已经阅读过的网页个数;q(wi)表示实词wi在M个网页中的出现次数;qO(wi)表示在M个网页中含有实词wi的网页个数;Z为系数,其值为:
Z = Σ j = 1 N ( 1 + ln q ( w j ) ) ;
其中,N表示在M个网页中不同实词的个数;q(wj)表示在N个实词中的第j个实词wj的出现次数;
(g)对一个用户尚未阅读的网页D,设D中共有n个不同的实词w1(D),w2(D),...,wn(D);计算其中每个实词在D中的词频(TF)系数TF(wi(D))为:
TF ( w i ( D ) ) = 1 Z D ( 1 + ln q ( w i ( D ) ) ) ;
其中,q(wi(D))为网页D中的第i个实词wi(D)在网页D中的出现次数;ZD为系数,其值为:
Z D = Σ j = 1 n ( 1 + ln q ( w j ( D ) ) ) ;
其中,q(wj(D))表示在网页D中的第j个实词wj(D)的出现次数;
(h)预测用户对于网页D中的第i个实词wi(D)的阅读兴趣RI(wi(D))为:
RI ( w i ( D ) ) = Σ j = 1 N ( I ( w j ) · S ( w j , w i ( D ) ) · TI ( w j ) ) ;
其中S(wj,wi(D))为取值在0至1之间的实数,表示wj与wi(D)在词网(WordNet)中的词义相似度;若wj或wi(D)不是英文,则将其翻译为英文再在词网(WordNet)中获得其词义相似度;
(i)预测用户对于网页D的阅读兴趣RI(D)为:
RI ( D ) = Σ i = 1 n ( RI ( w i ( D ) ) TF ( w i ( D ) ) ) Σ i = 1 n TF ( w i ( D ) ) ;
所述的利用用户阅读兴趣,结合传统搜索技术生成个性化的网页推荐结果步骤为:
(j)当用户提交一个查询请求时,服务端首先将查询重定向至传统搜索引擎如谷歌(Google),并获得返回的前50~100个网页,对于返回的每个网页,使用步骤(f)~(i)中的方法预测该用户对该网页的阅读兴趣;
(k)设RI(Di)表示传统搜索引擎返回结果中的第i个网页Di的用户阅读兴趣,计算用户对该网页的综合兴趣OI(Di):
OI ( D i ) = ( 1 - z ) · RI ( D i ) + z · 2 exp ( - k · i ) 1 + exp ( - k · i ) ;
其中,exp()表示指数函数;参数z用来控制用户阅读兴趣的重要程度,其值通常设为exp(-M/100);k为一个用户可控参数,用来控制用户阅读兴趣随排名下降的坡度,其预设值为0.2;
(1)对返回的50~100个网页,按照用户对它们的综合兴趣,从大到小重新排序,作为个性化网页推荐结果。
本发明有效地利用了用户在浏览网页时的面部表情和目光分布,将用户的阅读专注度结合在网页搜索与排序过程中,使得最终的个性化网页推荐结果更加接近用户的期待的搜索结果,从而使得网页搜索引擎能为用户提供更好的个性化服务。
附图说明
图1是基于用户面部表情与目光分布检测的个性化网页推荐方法的流程图;
图2是用户使用传统搜索引擎谷歌(Google)对关键词ABC进行查询的界面结果截图;
图3是用户使用本发明实施例系统对关键词ABC进行查询的界面结果截图;
图4是20个用户对15个不同关键词做网页搜索的实验数据箱图(box-plot diagram);该图的详细数据列在表1中。
具体实施方式
基于用户面部表情与目光分布检测的个性化网页推荐方法包括以下步骤:
1)侦测用户在阅读网页时其目光在屏幕上的关注点;
2)侦测用户在阅读网页时的面部表情,并估算其每一时刻的阅读专注度;
3)根据用户阅读过的网页,估算用户对每个实词的阅读兴趣;
4)对用户尚未阅读的网页,预测该用户对该网页的阅读兴趣;
5)利用用户阅读兴趣,结合传统搜索技术生成个性化的网页推荐结果。
所述的侦测用户在阅读网页时其目光在屏幕上的关注点步骤为:
(a)在用户阅读网页文档时,每隔0.5秒,通过眼球跟踪装置或摄像头,追踪该用户每一时刻其目光在屏幕上的关注点位置(x,y);
所述的侦测用户在阅读网页时的面部表情,并估算其每一时刻的阅读专注度步骤为:
(b)在用户阅读网页文档时,每隔0.5秒,利用人脸表情识别装置,获得该用户每一时刻的面部表情概率向量F:
F=[f1,f2,f3,f4,f5,f6];
其中f1至f6均为取值0到1之间的实数,分别代表该用户面部表情为快乐、吃惊、生气、厌恶、害怕、悲哀的概率;
(c)计算该用户在时刻t时的阅读专注度r(t):
r ( t ) = f 1 2 + f 2 2 + f 3 2 + f 4 2 + f 5 2 + f 6 2 ;
所述的根据用户阅读过的网页,估算用户对每个实词的阅读兴趣步骤为:
(d)对网页中的每个实词wi,设其在时刻t时在屏幕上的位置为(xi,yi),则该实词在时刻t时的用户阅读兴趣I(wi,t)为:
I ( w i , t ) = r ( t ) exp ( - ( x i - x ) 2 2 W 2 - ( y i - y ) 2 2 H 2 ) ;
其中(x,y)为在步骤(a)中所获得的该用户在时刻t时的目光关注点位置;r(t)为步骤(b)-步骤(c)所获得的该用户在时刻t时的阅读专注度;W和H分别是该网页中每个实词在屏幕上的平均宽度和平均高度;
(e)设用户在阅读网页的过程中,步骤(a)与步骤(b)分别获得了m个眼神关注点与阅读专注度样本;设用户对每个实词w的阅读兴趣为I(w),计算I(w)为:
I ( w ) = Σ j = 1 m I ( w , t j ) ;
其中,I(w,tj)为通过步骤(d)所获得的用户在时刻tj时对实词w的阅读兴趣;
所述的对用户尚未阅读的网页,预测该用户对该网页的阅读兴趣步骤为:
(f)对出现在用户阅读过网页中的每个实词wi,计算其词及逆文档频(TF×IDF)系数TI(wi)为:
TI ( w i ) = 1 Z ( 1 + ln q ( w i ) ) ln ( 1 + M q O ( w i ) ) ;
其中,M表示用户已经阅读过的网页个数;q(wi)表示实词wi在M个网页中的出现次数;qO(wi)表示在M个网页中含有实词wi的网页个数;Z为系数,其值为:
Z = Σ j = 1 N ( 1 + ln q ( w j ) ) ;
其中,N表示在M个网页中不同实词的个数;q(wj)表示在N个实词中的第j个实词wj的出现次数;
(g)对一个用户尚未阅读的网页D,设D中共有n个不同的实词w1(D),w2(D),...,wn(D);计算其中每个实词在D中的词频(TF)系数TF(wi(D))为:
TF ( w i ( D ) ) = 1 Z D ( 1 + ln q ( w i ( D ) ) ) ;
其中,q(wi(D))为网页D中的第i个实词wi(D)在网页D中的出现次数;ZD为系数,其值为:
Z D = Σ j = 1 n ( 1 + ln q ( w j ( D ) ) ) ;
其中,q(wj(D))表示在网页D中的第j个实词wj(D)的出现次数;
(h)预测用户对于网页D中的第i个实词wi(D)的阅读兴趣RI(wi(D))为:
RI ( w i ( D ) ) = Σ j = 1 N ( I ( w j ) · S ( w j , w i ( D ) ) · TI ( w j ) ) ;
其中S(wj,wi(D))为取值在0至1之间的实数,表示wj与wi(D)在词网(WordNet)中的词义相似度;若wj或wi(D)不是英文,则将其翻译为英文再在词网(WordNet)中获得其词义相似度;
(i)预测用户对于网页D的阅读兴趣RI(D)为:
RI ( D ) = Σ i = 1 n ( RI ( w i ( D ) ) TF ( w i ( D ) ) ) Σ i = 1 n TF ( w i ( D ) ) ;
所述的利用用户阅读兴趣,结合传统搜索技术生成个性化的网页推荐结果步骤为:
(j)当用户提交一个查询请求时,服务端首先将查询重定向至传统搜索引擎如谷歌(Google),并获得返回的前50~100个网页,对于返回的每个网页,使用步骤(f)~(i)中的方法预测该用户对该网页的阅读兴趣;
(k)设RI(Di)表示传统搜索引擎返回结果中的第i个网页Di的用户阅读兴趣,计算用户对该网页的综合兴趣OI(Di):
OI ( D i ) = ( 1 - z ) · RI ( D i ) + z · 2 exp ( - k · i ) 1 + exp ( - k · i ) ;
其中,exp()表示指数函数;参数z用来控制用户阅读兴趣的重要程度,其值通常设为exp(-M/100);k为一个用户可控参数,用来控制用户阅读兴趣随排名下降的坡度,其预设值为0.2;
(l)对返回的50~100个网页,按照用户对它们的综合兴趣,从大到小重新排序,作为个性化网页推荐结果。
实施例:
如图1所示,该个性化网页推荐系统包括:眼球跟踪装置10、表情获取装置20、样本手机模块30、网页预处理模块40、文本分析模块50、用户数据库60、查询界面70、传统引擎模块80、阅读兴趣预测模块90、排序模块100。
眼球跟踪装置10,利用先进的眼球运动捕捉仪器,分析当前用户目光所在的屏幕位置;在本实施例中眼球跟踪装置采用普通摄像头(Logitech Quickcam Notebook Pro)搭配开源眼球跟踪系统Enable Viacam (http://eviacam.sourceforge.net)组装而成。
表情获取装置20,在用户阅读网页文档时,利用人脸表情识别装置,获得该用户每一时刻的面部表情概率向量F:
F=[f1,f2,f3,f4,f5,f6];
其中f1至f6均为取值0到1之间的实数,分别代表该用户面部表情为快乐、吃惊、生气、厌恶、害怕、悲哀的概率;在本实施例中人脸表情识别装置采用普通摄像头(Logitech Quickcam Notebook Pro)搭配人脸表情识别系统eMotion(http://www.visual-recognition.n1)组装而成。
样本收集模块30,根据从眼球跟踪装置10与表情获取装置20获得的面部表情与目光分布数据,计算用户对每个实词的阅读兴趣,连同用户阅读过的网页文本一并存入对应用户的数据库中;具体步骤如下:
计算该用户在时刻t时的阅读专注度r(t):
r ( t ) = f 1 2 + f 2 2 + f 3 2 + f 4 2 + f 5 2 + f 6 2 ;
对网页中的每个实词wi,设其在时刻t时在屏幕上的位置为(xi,yi),则该实词在时刻t时的用户阅读兴趣I(wi,t)为:
I ( w i , t ) = r ( t ) exp ( - ( x i - x ) 2 2 W 2 - ( y i - y ) 2 2 H 2 ) ;
其中(x,y)为在眼球跟踪装置10中所获得的该用户在时刻t时的目光关注点位置;W和H分别是该网页中每个实词在屏幕上的平均宽度和平均高度;
设用户在阅读网页的过程中,分别获得了m个眼神关注点与阅读专注度样本;设用户对每个实词w的阅读兴趣为I(w),计算I(w)为:
I ( w ) = Σ j = 1 m I ( w , t j ) ;
用户数据库40,存储用户对各个实词的阅读兴趣,以及其阅读过的网页文本;在本实施例中用MYSQL数据库存储。
查询界面50,提供一个用户使用本发明所述网页推荐系统的web入口,提供网页搜索服务;在本实施例中,此查询界面用jsp实现。
传统引擎模块60,当用户提交一个查询请求时,系统会对传统搜索引擎的搜索结果页面进行解析并获取其返回结果中的前50~100个网页;本实施例采用了谷歌(Google)作为传统搜索引擎以供调用。
文档预处理模块70,直接从网站下载下来的网页包含很多无用信息,比如HTML标签,广告栏,导航栏等;此模块用于去除网页中的无用信息,保留用户将关注的主体文档;本实施例实现去除HTML标签的功能。
文本分析模块80,对出现在用户阅读过网页中的每个实词wi,计算其词及逆文档频(TF×IDF)系数TI(wi)为:
TI ( w i ) = 1 Z ( 1 + ln q ( w i ) ) ln ( 1 + M q O ( w i ) ) ;
其中,M表示用户已经阅读过的网页个数;q(wi)表示实词wi在M个网页中的出现次数;qO(wi)表示在M个网页中含有实词wi的网页个数;Z为系数,其值为:
Z = Σ j = 1 N ( 1 + ln q ( w j ) ) ;
其中,N表示在M个网页中不同实词的个数;q(wj)表示在N个实词中的第j个实词wj的出现次数;
对一个用户尚未阅读的网页D,设D中共有n个不同的实词
w1(D),w2(D),...,wn(D);计算其中每个实词在D中的词频(TF)系数TF(wi(D))为:
TF ( w i ( D ) ) = 1 Z D ( 1 + ln q ( w i ( D ) ) ) ;
其中,q(wi(D))为网页D中的第i个实词wi(D)在网页D中的出现次数;ZD为系数,其值为:
Z D = Σ j = 1 n ( 1 + ln q ( w j ( D ) ) ) ;
其中,q(wj(D))表示在网页D中的第j个实词wj(D)的出现次数。
阅读兴趣预测模块90,具体步骤如下:
预测用户对于网页D中的第i个实词wi(D)的阅读兴趣RI(wi(D))为:
RI ( w i ( D ) ) = Σ j = 1 N ( I ( w j ) · S ( w j , w i ( D ) ) · TI ( w j ) ) ;
其中S(wj,wi(D))为取值在0至1之间的实数,表示wj与wi(D)在词网(WordNet)中的词义相似度;若wj或wi(D)不是英文,则将其翻译为英文再在词网(WordNet)中获得其词义相似度;
预测用户对于网页D的阅读兴趣RI(D)为:
RI ( D ) = Σ i = 1 n ( RI ( w i ( D ) ) TF ( w i ( D ) ) ) Σ i = 1 n TF ( w i ( D ) ) ;
设RI(Di)表示传统引擎模块60返回结果中的第i个网页Di的用户阅读兴趣,计算用户对该网页的综合兴趣OI(Di):
OI ( D i ) = ( 1 - z ) · RI ( D i ) + z · 2 exp ( - k · i ) 1 + exp ( - k · i ) ;
其中,exp()表示指数函数;参数z用来控制用户阅读兴趣的重要程度,其值通常设为exp(-M/100);k为一个用户可控参数,用来控制用户阅读兴趣随排名下降的坡度,其预设值为0.2。
排序模块100,排序模块将结果按照所有网页的用户综合兴趣进行倒序排列,并将结果返回给用户。
表1的实验结果清晰的显示出本方法的优越性;
表1是20个用户对15个不同关键词做网页搜索的实验数据;每一行表示每组实验中用5种不同方法所得搜索结果与用户理想搜索结果之间的搜索错误度(Search Error Score,简写为SES);
错误度(SES)用以衡量两个排名之间的差异,与用户理想排名的错误度越小则该排名越接近用户的理想排名;设n个网页分别被排成A和B的两个排名;设在A排名中的第i个网页在B排名中的名次为bi,则A与B之间的错误度(SES)为:
SES ( A , B ) = Σ i = 1 n ( w i | i - b i | ) Σ i = 1 n w i ;
其中,系数wi的取值为:
w i = 2.5 ( 1 ≤ i ≤ 5 ) 2.0 ( 6 ≤ i ≤ 10 ) 1.5 ( 11 ≤ i ≤ 15 ) 1.0 ( 16 ≤ i ≤ n ) ;
5种方法包括3个流行搜索引擎:谷歌(Google)、雅虎(Yahoo)、必应(Bing),与发表在2008年由美国计算机协会举办的推荐系统会议(ACMRecommender Systems)上的一篇论文《基于商用眼球跟踪装置的个性化在线文档、图像与视频推荐》(“Personalized online document,image and video recommendation via commodity eye-tracking”)中所述的方法(简写为AT08),以及本发明所述方法;这些数据也以图形化的形式显示在图4中;
表1
Figure BSA00000212935800111
上述表格表明,本发明有效地将用户的喜好结合在搜索过程中,使得最终的排名结果更加接近用户期待的理想排名,从而使得网页搜索引擎为用户提供更好的个性化服务。
以上所述仅为本发明的基于面部表情与目光分布检测的个性化网页推荐方法的较佳实施例,并非用以限定本发明的实质技术内容的范围。本发明的基于面部表情与目光分布检测的个性化网页推荐方法,其实质技术内容是广泛的定义于权利要求书中,任何他人所完成的技术实体或方法,若是与权利要求书中所定义者完全相同,或是同一等效的变更,均将被视为涵盖于此专利保护范围之内。

Claims (6)

1.一种基于用户面部表情与目光分布检测的个性化网页推荐方法,其特征在于包括以下步骤:
1)侦测用户在阅读网页时其目光在屏幕上的关注点;
2)侦测用户在阅读网页时的面部表情,并估算其每一时刻的阅读专注度;
3)根据用户阅读过的网页,估算用户对每个实词的阅读兴趣;
4)对用户尚未阅读的网页,预测该用户对该网页的阅读兴趣;
5)利用用户阅读兴趣,结合传统搜索技术生成个性化的网页推荐结果。
2.根据权利要求1所述的一种基于用户面部表情与目光分布检测的个性化网页推荐方法,其特征在于所述的侦测用户在阅读网页时其目光在屏幕上的关注点步骤为:
(a)在用户阅读网页文档时,每隔0.5秒,通过眼球跟踪装置或摄像头,追踪该用户每一时刻其目光在屏幕上的关注点位置(x,y);
3.根据权利要求1所述的一种基于用户面部表情与目光分布检测的个性化网页推荐方法,其特征在于所述的侦测用户在阅读网页时的面部表情,并估算其每一时刻的阅读专注度步骤为:
(b)在用户阅读网页文档时,每隔0.5秒,利用人脸表情识别装置,获得该用户每一时刻的面部表情概率向量F:
F=[f1,f2,f3,f4,f5,f6];
其中f1至f6均为取值0到1之间的实数,分别代表该用户面部表情为快乐、吃惊、生气、厌恶、害怕、悲哀的概率;
(c)计算该用户在时刻t时的阅读专注度r(t):
r ( t ) = f 1 2 + f 2 2 + f 3 2 + f 4 2 + f 5 2 + f 6 2 ;
4.根据权利要求1所述的一种基于用户面部表情与目光分布检测的个性化网页推荐方法,其特征在于所述的根据用户阅读过的网页,估算用户对每个实词的阅读兴趣步骤为:
(d)对网页中的每个实词wi,设其在时刻t时在屏幕上的位置为(xi,yi),则该实词在时刻t时的用户阅读兴趣I(wi,t)为:
I ( w i , t ) = r ( t ) exp ( - ( x i - x ) 2 2 W 2 - ( y i - y ) 2 2 H 2 ) ;
其中(x,y)为在步骤(a)中所获得的该用户在时刻t时的目光关注点位置;r(t)为步骤(b)-步骤(c)所获得的该用户在时刻t时的阅读专注度;W和H分别是该网页中每个实词在屏幕上的平均宽度和平均高度;
(e)设用户在阅读网页的过程中,步骤(a)与步骤(b)分别获得了m个眼神关注点与阅读专注度样本;设用户对每个实词w的阅读兴趣为I(w),计算I(w)为:
I ( w ) = Σ j = 1 m I ( w , t j ) ;
其中,I(w,tj)为通过步骤(d)所获得的用户在时刻tj时对实词w的阅读兴趣;
5.根据权利要求1所述的一种基于用户面部表情与目光分布检测的个性化网页推荐方法,其特征在于所述的对用户尚未阅读的网页,预测该用户对该网页的阅读兴趣步骤为:
(f)对出现在用户阅读过网页中的每个实词wi,计算其词及逆文档频(TF×IDF)系数TI(wi)为:
TI ( w i ) = 1 Z ( 1 + ln q ( w i ) ) ln ( 1 + M q O ( w i ) ) ;
其中,M表示用户已经阅读过的网页个数;q(wi)表示实词wi在M个网页中的出现次数;qO(wi)表示在M个网页中含有实词wi的网页个数;Z为系数,其值为:
Z = Σ j = 1 N ( 1 + ln q ( w j ) ) ;
其中,N表示在M个网页中不同实词的个数;q(wj)表示在N个实词中的第j个实词wj的出现次数;
(g)对一个用户尚未阅读的网页D,设D中共有n个不同的实词w1(D),w2(D),...,wn(D);计算其中每个实词在D中的词频(TF)系数TF(wi(D))为:
TF ( w i ( D ) ) = 1 Z D ( 1 + ln q ( w i ( D ) ) ) ;
其中,q(wi(D))为网页D中的第i个实词wi(D)在网页D中的出现次数;ZD为系数,其值为:
Z D = Σ j = 1 n ( 1 + ln q ( w j ( D ) ) ) ;
其中,q(wj(D))表示在网页D中的第j个实词wj(D)的出现次数;
(h)预测用户对于网页D中的第i个实词wi(D)的阅读兴趣RI(wi(D))为:
RI ( w i ( D ) ) = Σ j = 1 N ( I ( w j ) · S ( w j , w i ( D ) ) · TI ( w j ) ) ;
其中S(wj,wi(D))为取值在0至1之间的实数,表示wj与wi(D)在词网(WordNet)中的词义相似度;若wj或wi(D)不是英文,则将其翻译为英文再在词网(WordNet)中获得其词义相似度;
(i)预测用户对于网页D的阅读兴趣RI(D)为:
RI ( D ) = Σ i = 1 n ( RI ( w i ( D ) ) TF ( w i ( D ) ) ) Σ i = 1 n TF ( w i ( D ) ) ;
6.根据权利要求1所述的一种基于用户面部表情与目光分布检测的个性化网页推荐方法,其特征在于所述的利用用户阅读兴趣,结合传统搜索技术生成个性化的网页推荐结果步骤为:
(j)当用户提交一个查询请求时,服务端首先将查询重定向至传统搜索引擎如谷歌(Google),并获得返回的前50~100个网页,对于返回的每个网页,使用步骤(f)~(i)中的方法预测该用户对该网页的阅读兴趣;
(k)设RI(Di)表示传统搜索引擎返回结果中的第i个网页Di的用户阅读兴趣,计算用户对该网页的综合兴趣OI(Di):
OI ( D i ) = ( 1 - z ) · RI ( D i ) + z · 2 exp ( - k · i ) 1 + exp ( - k · i ) ;
其中,exp()表示指数函数;参数z用来控制用户阅读兴趣的重要程度,其值通常设为exp(-M/100);k为一个用户可控参数,用来控制用户阅读兴趣随排名下降的坡度,其预设值为0.2;
(l)对返回的50~100个网页,按照用户对它们的综合兴趣,从大到小重新排序,作为个性化网页推荐结果。
CN2010102422531A 2010-07-30 2010-07-30 基于用户面部表情与目光分布检测的个性化网页推荐方法 Expired - Fee Related CN101916264B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102422531A CN101916264B (zh) 2010-07-30 2010-07-30 基于用户面部表情与目光分布检测的个性化网页推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102422531A CN101916264B (zh) 2010-07-30 2010-07-30 基于用户面部表情与目光分布检测的个性化网页推荐方法

Publications (2)

Publication Number Publication Date
CN101916264A true CN101916264A (zh) 2010-12-15
CN101916264B CN101916264B (zh) 2012-09-19

Family

ID=43323776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102422531A Expired - Fee Related CN101916264B (zh) 2010-07-30 2010-07-30 基于用户面部表情与目光分布检测的个性化网页推荐方法

Country Status (1)

Country Link
CN (1) CN101916264B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402765A (zh) * 2011-12-27 2012-04-04 纽海信息技术(上海)有限公司 基于用户表情分析的电子商务推荐方法
CN102902822A (zh) * 2011-11-04 2013-01-30 微软公司 搜索查询上下文
CN103167115A (zh) * 2012-05-25 2013-06-19 深圳市金立通信设备有限公司 基于人脑记忆特点的手机浏览器辅助搜索系统及方法
CN103635895A (zh) * 2011-06-30 2014-03-12 微软公司 用于提供多个支持服务的个人长期代理
CN103810278A (zh) * 2014-02-14 2014-05-21 北京百纳威尔科技有限公司 终端的网页处理方法及装置
CN103995822A (zh) * 2014-03-19 2014-08-20 宇龙计算机通信科技(深圳)有限公司 一种终端及信息搜索方法
CN104299225A (zh) * 2014-09-12 2015-01-21 姜羚 一种表情识别在大数据分析的应用方法及系统
CN104464769A (zh) * 2013-09-18 2015-03-25 布克查克控股有限公司 用于电子媒体内容的同步声道回放系统
CN104484044A (zh) * 2014-12-23 2015-04-01 上海斐讯数据通信技术有限公司 一种广告推送方法和系统
CN105094292A (zh) * 2014-05-05 2015-11-25 索尼公司 评价用户关注度的方法和设备
CN105335369A (zh) * 2014-06-11 2016-02-17 数伦计算机技术(上海)有限公司 计算机用户兴趣点反馈系统及反馈方法
CN105518666A (zh) * 2013-08-29 2016-04-20 索尼公司 信息处理装置和信息处理方法
CN106503050A (zh) * 2016-09-23 2017-03-15 厦门市杜若科技有限公司 一种基于大数据进行阅读文章推荐的方法与系统
CN107247733A (zh) * 2017-05-05 2017-10-13 中广热点云科技有限公司 一种视频片段观看热度分析方法及系统
CN107832698A (zh) * 2017-11-02 2018-03-23 北方工业大学 基于阵列镜头的学习兴趣测试方法及装置
CN108492224A (zh) * 2018-03-09 2018-09-04 上海开放大学 基于深度学习在线教育学生综合画像标签管理系统
CN113515335A (zh) * 2021-05-20 2021-10-19 口碑(上海)信息技术有限公司 一种服务信息展示形式的确定方法、装置以及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070299911A1 (en) * 2006-06-21 2007-12-27 Fuji Xerox Co., Ltd. Information delivery apparatus, information delivery method and program product therefor
CN101320387A (zh) * 2008-07-11 2008-12-10 浙江大学 基于用户关注时间的网页文本与图像排序方法
CN101382939A (zh) * 2008-10-23 2009-03-11 浙江大学 基于眼球跟踪的网页文本个性化搜索方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070299911A1 (en) * 2006-06-21 2007-12-27 Fuji Xerox Co., Ltd. Information delivery apparatus, information delivery method and program product therefor
CN101320387A (zh) * 2008-07-11 2008-12-10 浙江大学 基于用户关注时间的网页文本与图像排序方法
CN101382939A (zh) * 2008-10-23 2009-03-11 浙江大学 基于眼球跟踪的网页文本个性化搜索方法

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9317834B2 (en) 2011-06-30 2016-04-19 Microsoft Technology Licensing, Llc User computing device with personal agent program for recommending meeting a friend at a service location based on current location, travel direction, and calendar activity
CN103635895A (zh) * 2011-06-30 2014-03-12 微软公司 用于提供多个支持服务的个人长期代理
US9569726B2 (en) 2011-06-30 2017-02-14 Microsoft Technology Licensing, Llc Server computing device for recommending meeting a friend at a service location based on current location, travel direction, and calendar activity
CN102902822A (zh) * 2011-11-04 2013-01-30 微软公司 搜索查询上下文
CN102402765A (zh) * 2011-12-27 2012-04-04 纽海信息技术(上海)有限公司 基于用户表情分析的电子商务推荐方法
CN102402765B (zh) * 2011-12-27 2017-07-28 北京京东尚科信息技术有限公司 基于用户表情分析的电子商务推荐方法
CN103167115A (zh) * 2012-05-25 2013-06-19 深圳市金立通信设备有限公司 基于人脑记忆特点的手机浏览器辅助搜索系统及方法
CN105518666B (zh) * 2013-08-29 2020-01-17 索尼公司 信息处理装置和信息处理方法
CN105518666A (zh) * 2013-08-29 2016-04-20 索尼公司 信息处理装置和信息处理方法
CN104464769A (zh) * 2013-09-18 2015-03-25 布克查克控股有限公司 用于电子媒体内容的同步声道回放系统
CN103810278A (zh) * 2014-02-14 2014-05-21 北京百纳威尔科技有限公司 终端的网页处理方法及装置
CN103995822A (zh) * 2014-03-19 2014-08-20 宇龙计算机通信科技(深圳)有限公司 一种终端及信息搜索方法
CN105094292A (zh) * 2014-05-05 2015-11-25 索尼公司 评价用户关注度的方法和设备
CN105335369A (zh) * 2014-06-11 2016-02-17 数伦计算机技术(上海)有限公司 计算机用户兴趣点反馈系统及反馈方法
CN104299225A (zh) * 2014-09-12 2015-01-21 姜羚 一种表情识别在大数据分析的应用方法及系统
CN104484044A (zh) * 2014-12-23 2015-04-01 上海斐讯数据通信技术有限公司 一种广告推送方法和系统
CN104484044B (zh) * 2014-12-23 2018-07-31 上海斐讯数据通信技术有限公司 一种广告推送方法和系统
CN106503050A (zh) * 2016-09-23 2017-03-15 厦门市杜若科技有限公司 一种基于大数据进行阅读文章推荐的方法与系统
CN106503050B (zh) * 2016-09-23 2021-04-16 耀灵人工智能(浙江)有限公司 一种基于大数据进行阅读文章推荐的方法与系统
CN107247733A (zh) * 2017-05-05 2017-10-13 中广热点云科技有限公司 一种视频片段观看热度分析方法及系统
CN107832698A (zh) * 2017-11-02 2018-03-23 北方工业大学 基于阵列镜头的学习兴趣测试方法及装置
CN108492224A (zh) * 2018-03-09 2018-09-04 上海开放大学 基于深度学习在线教育学生综合画像标签管理系统
CN113515335A (zh) * 2021-05-20 2021-10-19 口碑(上海)信息技术有限公司 一种服务信息展示形式的确定方法、装置以及电子设备

Also Published As

Publication number Publication date
CN101916264B (zh) 2012-09-19

Similar Documents

Publication Publication Date Title
CN101916264B (zh) 基于用户面部表情与目光分布检测的个性化网页推荐方法
Cai et al. A survey of query auto completion in information retrieval
Raman et al. Toward whole-session relevance: Exploring intrinsic diversity in web search
US10180979B2 (en) System and method for generating suggestions by a search engine in response to search queries
US10102482B2 (en) Factorized models
US20140201126A1 (en) Methods and Systems for Applications for Z-numbers
US20140079297A1 (en) Application of Z-Webs and Z-factors to Analytics, Search Engine, Learning, Recognition, Natural Language, and Other Utilities
Mahajan et al. Logucb: an explore-exploit algorithm for comments recommendation
US20130204833A1 (en) Personalized recommendation of user comments
US20090187540A1 (en) Prediction of informational interests
US11023503B2 (en) Suggesting text in an electronic document
Li et al. Group-based recurrent neural networks for POI recommendation
Arguello Aggregated search
Bouras et al. Improving news articles recommendations via user clustering
Zhu et al. A recommendation engine for travel products based on topic sequential patterns
KR101659064B1 (ko) 사용자 피드백을 이용하여 컨텐츠에 대한 평가 점수를 산출하기 위한 방법 및 장치
Kacem et al. Time-sensitive user profile for optimizing search personlization
Elsafty et al. Document-based recommender system for job postings using dense representations
CN111683294B (zh) 一种信息抽取的弹幕评论推荐方法
JP5133294B2 (ja) 時空間検索装置及び方法及びプログラム
Chuklin et al. Potential good abandonment prediction
Noorian A BERT-based sequential POI recommender system in social media
Yan et al. A personalized search query generating method for safety-enhanced vehicle-to-people networks
KR20190130410A (ko) 스마트 시니어를 위한 맞춤형 콘텐츠 추천 장치 및 방법
Olivares et al. The big five: Discovering linguistic characteristics that typify distinct personality traits across Yahoo! Answers Members

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120919

Termination date: 20130730