CN101571826B - 基于用户操作记录的信息源关联方法 - Google Patents

基于用户操作记录的信息源关联方法 Download PDF

Info

Publication number
CN101571826B
CN101571826B CN2009100862888A CN200910086288A CN101571826B CN 101571826 B CN101571826 B CN 101571826B CN 2009100862888 A CN2009100862888 A CN 2009100862888A CN 200910086288 A CN200910086288 A CN 200910086288A CN 101571826 B CN101571826 B CN 101571826B
Authority
CN
China
Prior art keywords
user
information source
res
information
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009100862888A
Other languages
English (en)
Other versions
CN101571826A (zh
Inventor
韩爽
王衡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN2009100862888A priority Critical patent/CN101571826B/zh
Publication of CN101571826A publication Critical patent/CN101571826A/zh
Application granted granted Critical
Publication of CN101571826B publication Critical patent/CN101571826B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于用户操作记录的信息源关联方法,属于计算机软件技术领域。本发明方法包括a)监听用户对两个或多个目标信息源所作的操作;b)当用户的最近操作为设定的触发操作时,基于操作记录计算用户当前使用的所述信息源R0和其他所述信息源Ri之间的关联程度:关联程度=同时访问比率×互切计数;其中,同时访问比率表示用户同时使用R0和Ri的累计时长除以用户使用R0和Ri中至少一项的累计时长;互切计数表示用户在R0和Ri间切换的次数;c)按所述关联程度高低排列Ri。本发明可以节省用户查找信息源的时间开销,无需用户进行任何冗余操作。

Description

基于用户操作记录的信息源关联方法
技术领域
本发明涉及操作系统环境下基于用户操作记录的信息源关联方法,属于计算机软件技术领域。
背景技术
当今用户的个人信息量越来越大,信息用户每天要使用不同的工具与各种不同类型的信息源打交道,必须合理地维护所有信息源的存储和分布才能确保日常工作的顺利进行。然而,随着用户个人信息源数量的无限增加,操作系统传统的目录存储结构已无法满足用户快速寻找到所需信息源的需求:文件数量日趋扩大,目录层次日趋复杂(参见:R.Boardman,M.A.Sasse,“Stuff goes into the computer and doesn′t come out”:A Cross-toolStudy of Personal Information Management,Proceedings of CHI 2004,ACM Conference onHuman Factors in computing Systems,CHI Letters 6(1),2004);网页收藏夹的组织和管理面临着和文件系统同样的问题;联系人的管理则更为混乱,如果用户没有将联系人恰当地进行分类,联系信息将湮没在冗长的列表中难以找回。
设计用于协助用户查找信息源的智能工具可以缩短用户在个人信息系统中寻找信息的时间。过往的大量工作集中在个人信息管理(参见:W.Jones,Personal informationmanagement.Ann.Rev.Info.Science and Tech.,in press),或是设计推荐系统向用户推荐信息源(参见:J.Riedl,P.Dourish,Introduction to the Special Section on Recommender Systems,ACM Transactions on Computer-Human Interaction,12(3),2005)以帮助人们更好地完成任务,并且取得了显著的成果。
大多数的个人信息管理系统注重的是信息源的组织方式。Ofer Bergman等所实现的项目文件夹(参见:Ofer Bergman,Ruth Beyth-Marom,Rafi Nachmias,The Project FragmentationProblem in Personal Information Management,CHI 2006 Proceedings,2006)将用户的所有同主题信息(包括文档、邮件、收藏的页面等)存储于同一文件夹下,用户可以在同一目录下存储和找回同主题信息。E.Cutrell等(参见:E.Cutrell,D.C.Robbins,S.T.Dumais,R.Sarin,Fast,flexible filtering with Phlat-personal search and organization made easy,Proceedings of CHI 2006,ACM Conference on Human Factors in computing Systems,2004)实现的个人信息管理系统Phlat,使用不同的分类方式(包括时间、多级标签、路径、人名、文件类型等等)为用户的搜索请求进行过滤;用户通过对过滤器的操作,对文件进行自主标记,从而达到按个人习惯组织个人信息的目的。然而,个人信息管理系统着眼于信息的组织方式,却忽略了用户行为操作中最重要的上下文信息,并不能根据用户当前的工作状态向用户呈现准确而相关的信息源。
推荐系统近年来的大多数工作集中在隐式查询系统以及以活动为中心的管理系统。其中,隐式查询方法(implicit query approaches)抛弃了显式的查询方式,它可以自动根据用户工作的上下文(多为文本信息)自动进行查询并显示结果,这种方法的好处是不需要中断用户当前的工作。但大多数隐式查询系统只是将搜索过程自动化,通常用于网页查询(参见:J.Budzik,K.Hammond,Watson.Anticipating and contextualizing information needs,Proc.ASIS,1999);而应用在用户个人计算机中的隐式查询系统为了满足实时性,只能使用较为简陋的上下文信息(如窗口标题)而得不到很好的效果,例如窗口标题或文件名称根本不反映用户工作内容的状况。对于以活动为中心的管理系统,任务预测器TaskPredictor(参见:X.Bao,J.L.Herlocker,T.G.Dietterich,Fewer clicks and less frustration:reducing the costof reaching the right folder,Proceedings of the 11th International Conference on IntelligentUser Interfaces,2006)能够实现目标文件夹的预测,力图将用户导航到目标文件夹所需的操作次数降至最低;Malibu资源推荐系统(参见:J.Shen,W.Geyer,M.Muller,C.Dugan,B.Brownholtz,D.R.Millen,Automatically Finding and Recommending Resources to SupportKnowledge Workers’Activities,Proceedings of the 13th International Conference on IntelligentUser Interfaces,2008)建立在IBM的活动管理系统Lotus Activities(参见:M.Moore,M.Estrada,T.Finley,M.Muller,W.Geyer,Next generation activity-centric computing,Proc.CSCW,2006)上,向协作环境中的单独用户进行信息源的实时推荐。但前者需要用户预先将所有信息源分类,未能从根本上将用户从繁重的冗余操作中解脱出来;后者为满足实时性,同样只使用简单的上下文文本信息,存在着与个人计算机中的隐式查询系统同样的问题。
以信息源的访问时间信息为依据,可以为个人计算机用户提供一种实时而准确的信息源推荐方式,解决上述系统存在的问题。
发明内容
本发明的目的在于提出一种信息源关联方法。本发明主要应用在用户的个人计算机中,根据用户最近访问的信息源在用户查找信息源之前向用户推荐相关信息源,为用户节省查找信息源的时间开销。
为达成上述目的,本发明根据用户对个人计算机中信息源的操作历史记录,自动学习用户对信息源的操作偏好,在用户切换信息源窗口时根据最近活动的信息源实时地计算与该信息源最为相关的其它信息源并呈现给用户,在全部过程中无需用户进行任何额外操作。该方法包括下列步骤:
a)在操作系统环境下,监听用户对两个或多个目标信息源所作的操作;
b)当用户的最近操作为设定的触发操作时,基于步骤a所述操作记录,按下式计算用户当前使用的所述信息源R0和其他所述信息源Ri(i=1,2,...,i为自然数)之间的关联程度:
关联程度=同时访问比率×互切计数
其中,所述同时访问比率表示自开始所述监听始,用户同时使用R0和Ri的累计时长除以用户使用R0和Ri中至少一项的累计时长;所述互切计数表示自开始所述监听始,用户由R0切换至Ri和由Ri切换至R0的次数总和;
c)按所述关联程度由高到低的顺序排列所述各项Ri,并以所述排列作为R0的关联信息源。
其中,所述目标信息源选自文档、联系人和网页中的一种或多种;
步骤a所述用户操作包括:打开信息源、关闭信息源、由一项信息源或由无信息源状态切换到另一项信息源;
优选地,步骤a通过在各个目标信息源中设置监听插件监听用户的操作记录,所述监听插件包括Office系列文档类应用程序插件,Outlook插件和IE插件等;
优选地,步骤a通过下述方式实现对所述两个或多个目标信息源的监听:监听用户的操作事件;将所述事件转换为交互数据;由所述交互数据筛选用户对两个或多个目标信息源所作的操作;所述交互数据可整体储存于本地或远程数据库备用;
优选地,步骤b所述触发操作包括:由一项信息源或由无信息源状态切换到另一项信息源。
优选地,步骤c所述各项Ri的排列以信息源推荐界面的形式向用户展示。
综合而言,本发明方法可通过以下方式实施:
1)利用监听模块监听用户在PC机中的操作事件并实时将其发送到信息收集与发布模块;
2)利用信息收集与发布模块实时获取来自监听模块的操作事件,记录到数据库,并实时将其发送到事件过滤模块;
3)利用事件过滤模块对接收到的事件进行过滤筛选,将包含特定属性的事件发给关联资源管理模块,当收到来自关联资源管理模块的刷新事件便刷新资源推荐界面;
4)利用关联资源管理模块,当接收到事件时重新计算所有资源间的关联程度,并根据接收到的事件类型判断是否应当触发事件过滤模块的刷新事件,如应触发则发送新的资源推荐列表。
所述资源包括但不限于下列资源的一种或几种:文档、联系人和网页。
所述监听模块的工作方法为:
1)为应用程序实现插件,利用各插件监听应用程序中的所需事件;需要实现的插件可以包括:Office系列文档类应用程序插件,Outlook插件,IE插件等。
2)将监听到的事件实时发送到信息收集与发布模块。
所述信息收集与发布模块的工作方法为:
1)将来自监听模块的交互事件转换为交互数据;
2)将交互数据记录到数据库(本地或远程);
3)将交互数据发送到事件过滤模块。
所述事件过滤模块的工作方法为:
1)过滤接收到的交互数据;
2)将过滤后的交互数据发给关联资源管理模块。
上述过滤交互数据的方法为,判断交互数据的事件类型是否为所需事件,如不是则抛弃,如是则保留该交互数据的有用属性。
上述交互数据的有用属性,与文件相关的属性可以包括事件类型、时间、文件路径,与网页相关的属性可以包括事件类型、时间、网页URL、网页标题,与联系人相关的属性可以包括事件类型、时间、联系人email、联系人姓名。
所述关联资源管理模块的工作方法为:
1)更新所有资源间的关联程度;
2)根据接收到的交互数据事件类型判断是否触发资源推荐更新,如应触发,则根据目标资源发送新的资源推荐列表。
上述目标资源为与接收到的交互数据直接关联的资源。
上述步骤1)中资源间的关联程度的计算方法如下:
a)计算两项资源间的同时访问比率;
b)计算两项资源间的互切计数;
c)根据两项资源间的同时访问比率和互切计数,计算得到资源间的关联程度。
上述两项资源间的同时访问比率为两项资源同时呈现打开状态的时长,与这两项资源中至少有一项呈现打开状态的时长之比。
上述两项资源间的互切计数为从其中一项资源切出活动状态后立即切入另一项资源活动状态的总次数。
上述资源间关联程度的计算方法是:关联程度=同时访问比率×互切计数。
资源推荐界面可以列表形式按关联程度降序排列呈现推荐的资源。
本发明的积极效果为:
利用用户与计算机交互的实时事件,向用户展现有意义的关联信息源,以节省用户查找信息源的时间开销。本发明与现有技术相比,采用时间信息作为上下文,克服了个人计算机中文本类型上下文的不确定性带来的问题,同时可以实时地满足用户对个人资源的个性化需求;以用户操作的时间轨迹为线索,忠实地考虑用户的操作偏好;无需用户进行任何冗余操作。
附图说明
图1示出了本发明的系统框图;
图2示出了监听模块的流程图;
图3示出了信息收集与发布模块的流程图;
图4示出了事件过滤模块的流程图;
图5示出了关联资源管理模块的流程图;
图6示出了资源推荐列表的实例。
具体实施方式
下面通过实施例结合附图对本发明作进一步描述。
本发明方法通过图1所示的实施例系统实施。
如图1所示,本实施例系统主要包括:监听模块,用于实时监听与发送用户交互事件;信息收集与发布模块,用于收集交互事件与发布交互数据;订阅者模块,用于过滤交互数据和刷新资源推荐界面;关联资源管理模块,用于触发刷新资源推荐界面事件,提供最新的资源推荐列表。其中,所述订阅者模块涵盖了发明内容部分所述的“事件过滤模块”所具有的功能。
下面介绍各模块的内部流程。
监听模块由多个应用程序插件组成(如图2):Word插件、Excel插件、Outlook插件、IE插件以及其它应用程序插件。其中Word插件和Excel插件负责实时监听Word及Excel窗口的打开、关闭、切入活动状态、切出活动状态事件以及其它事件,并探测处于活动状态的文件;Outlook插件负责实时监听撰写新邮件窗口的打开、关闭、切入活动状态、切出活动状态,以及发送邮件事件以及其它事件;IE插件负责实时监听IE Tab的打开、关闭、切入活动状态、切出活动状态,以及网页的浏览、转向、结束浏览事件以及其它事件。所有应用程序插件将实时把监听到的事件发送到信息收集与发布模块。
信息收集与发布模块负责收集和发布来自监听模块的交互事件(如图3)。首先将交互事件转换成交互数据,将交互数据记录到数据库,数据库中的数据可以用作其它应用;同时将交互数据发送到订阅者模块。
订阅者模块负责交互数据的过滤和刷新资源推荐界面(如图4)。过滤交互数据的方法为,判断交互数据的事件类型是否为所需事件,所需事件为上述监听模块中提及的事件,不包含其它事件。如不为所需事件则将该项交互数据抛弃不加处理;如是则保留该交互数据的有用属性,与Word与Excel交互数据相关的属性可以包括事件类型、时间、文件路径,与IE交互数据相关的属性可以包括事件类型、时间、网页URL、网页标题,与Outlook交互数据相关的属性可以包括事件类型、时间、联系人email、联系人姓名。当订阅者模块接收到刷新资源推荐界面事件,则根据刷新事件中包含的推荐资源列表,按照列表中的资源顺序刷新资源推荐界面。
关联资源管理模块负责实时更新资源间关联程度,以及根据事件类型触发订阅者模块的刷新资源推荐界面事件(如图5)。更新资源间关联程度是通过更新资源间同时访问比率和互切计算实现的。设任意两项不相等的资源为resi、resj,当前事件时间为timecur,上次事件时间为timepre,当前事件类型为typecur,上次事件类型为typepre,当前资源为rescur,上次资源为respre
更新前两项资源同时呈现打开状态的累计时长为in(resi,resj)old,至少有一项呈现打开状态的累计时长为un(resi,resj)old,那么同时访问比率rate(resi,resj)old=in(resi,resj)old/un(resi,resj)old;互切计数为swi(resi,resj)old;那么更新前资源间关联程度为:
rel(resi,resj)old=swi(resi,resj)old×rate(resi,resj)old
=swi(resi,resj)old×in(resi,resj)old/un(resi,resj)old
更新后两项资源同时呈现打开状态的累计时长为in(resi,resj)new,至少有一项呈现打开状态的累计时长为un(resi,resj)new,那么同时访问比率rate(resi,resj)new=in(resi,resj)new/un(resi,resj)new;互切计数为swi(resi,resj)new;那么更新后资源间关联程度为:
rel(resi,resj)new=swi(resi,resj)new×rate(resi,resj)new
=swi(resi,resj)new×in(resi,resj)new/un(resi,resj)new
首先,如果resi、resj都在打开资源列表中,则in(resi,resj)new=in(resi,resj)old+(timecur-timepre);如果resi、resj至少其中之一在打开资源列表中,则:
un(resi,resj)new=un(resi,resj)old+(timecur-timepre)。
然后,判断typecur,如为打开事件,则将相应资源加入打开资源列表;如为关闭事件,则将相应资源从打开资源列表中排除;如为切入活动状态事件,并且typepre为切出活动状态事件且timecur=timepre,则:
swi(respre,rescur)new=swi(respre,rescur)old+1
swi(rescur,respre)new=swi(rescur,respre)old+1
接着,更新timepre、typepre、respre
最后,假如typecur为切入活动状态事件,则找出所有符合resi=rescur的资源对(resi,resj),将所有resj按照关联程度rel(resi,resj)new的降序排序,得到关于resj的资源列表,即为新的推荐资源列表。触发订阅者的刷新资源推荐界面事件,并在事件中包含新的推荐资源列表。
实时资源推荐的目的是实时地向用户呈现与最近活动资源最为相关的其它资源,以不中断或影响用户当前工作为前提,因此资源推荐视图应尽可能简洁小巧。图6示出了一个资源推荐视图的例子,用户可以通过直接双击视图中的资源来执行打开操作。

Claims (8)

1.一种基于用户操作记录的信息源关联方法,包括下列步骤:
a)在操作系统环境下,监听用户对两个或更多个目标信息源所作的操作;
b)当用户的最近操作为设定的触发操作时,基于步骤a所述操作的记录,按下式计算用户当前使用的所述信息源R0和其他所述信息源Ri之间的关联程度,其中i=1,2,…,i为自然数;
关联程度=同时访问比率×互切计数
其中,所述同时访问比率表示自开始所述监听始,用户同时使用R0和Ri的累计时长除以用户使用R0和Ri中至少一项的累计时长;所述互切计数表示自开始所述监听始,用户由R0切换至Ri和由Ri切换至R0的次数总和;
c)按所述关联程度由高到低的顺序排列所述各项Ri,并以所述排列作为R0的关联信息源,将所述各项Ri的排列以信息源推荐界面的形式向用户展示。
2.如权利要求1所述的方法,其特征在于,所述目标信息源选自文档、联系人和网页中的一种或多种。
3.如权利要求1所述的方法,其特征在于,步骤a所述用户操作包括打开信息源、关闭信息源、和由一项信息源或由无信息源状态切换到另一项信息源之一。
4.如权利要求1所述的方法,其特征在于,步骤a通过在各个目标信息源中设置监听插件监听用户的操作记录。
5.如权利要求4所述的方法,其特征在于,所述监听插件包括:Office系列文档类应用程序插件,Outlook插件和IE插件。
6.如权利要求1所述的方法,其特征在于,步骤a通过下述方式实现对所述两个或更多个目标信息源的监听:监听用户的操作事件;将所述事件转换为交互数据;由所述交互数据筛选用户对两个或更多个目标信息源所作的操作。
7.如权利要求6所述的方法,其特征在于,将所述交互数据储存于本地或远程数据库。
8.如权利要求1所述的方法,其特征在于,步骤b所述触发操作包括:由一项信息源或由无信息源状态切换到另一项信息源。
CN2009100862888A 2009-06-09 2009-06-09 基于用户操作记录的信息源关联方法 Expired - Fee Related CN101571826B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100862888A CN101571826B (zh) 2009-06-09 2009-06-09 基于用户操作记录的信息源关联方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100862888A CN101571826B (zh) 2009-06-09 2009-06-09 基于用户操作记录的信息源关联方法

Publications (2)

Publication Number Publication Date
CN101571826A CN101571826A (zh) 2009-11-04
CN101571826B true CN101571826B (zh) 2010-11-17

Family

ID=41231185

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100862888A Expired - Fee Related CN101571826B (zh) 2009-06-09 2009-06-09 基于用户操作记录的信息源关联方法

Country Status (1)

Country Link
CN (1) CN101571826B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2013175751A1 (ja) * 2012-05-25 2016-01-12 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 情報処理装置、情報処理方法及び情報処理プログラム
CN102880687B (zh) * 2012-09-14 2015-07-29 北京大学 基于标签技术的个人交互数据检索方法及其系统
CN104142780B (zh) * 2013-05-06 2018-02-27 北京三星通信技术研究有限公司 一种终端设备及其关联窗口的显示方法
KR20140131863A (ko) 2013-05-06 2014-11-14 삼성전자주식회사 단말 장치 및 그의 관련 창을 표시하기 위한 방법
CN107357795B (zh) * 2016-05-10 2020-03-03 北京国双科技有限公司 网站间关联度的监测方法和装置

Also Published As

Publication number Publication date
CN101571826A (zh) 2009-11-04

Similar Documents

Publication Publication Date Title
US7668813B2 (en) Techniques for searching future events
EP2478431B1 (en) Automatically finding contextually related items of a task
US9460193B2 (en) Context and process based search ranking
CN102769781B (zh) 推荐电视节目的方法及装置
CN102521308B (zh) 实体追随
CN101571826B (zh) 基于用户操作记录的信息源关联方法
US20030131013A1 (en) Automated system and methods for determining relationships between information resources
US20050246360A1 (en) Automated system and methods for determining the activity focus of a user in a computerized environment
US20150019544A1 (en) Information service for facts extracted from differing sources on a wide area network
EP2859472A1 (en) A system and method for automatic generation of information-rich content from multiple microblogs, each microblog containing only sparse information
CN105608100A (zh) 信息提取方法和信息提取装置
US20150169743A1 (en) Profile management system, information device, profile updating method, and recording medium storing computer programs
Fitchett et al. An empirical characterisation of file retrieval
CN106843817A (zh) 一种移动终端桌面组件的智能显示方法及装置
KR101441219B1 (ko) 정보 엔터티들의 자동 연관
Jin et al. Personal web revisitation by context and content keywords with relevance feedback
CN109241410A (zh) 一种文章推荐方法和装置
JP2012198710A (ja) カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム
CN113282694B (zh) 一种地理实体数据库用户定制化方法、系统及存储介质
Bergman The user-subjective approach to personal information management: from theory to practice
CN101923579B (zh) 一种基于情境流的文件管理方法
Berendt et al. STORIES in time: a graph-based interface for news tracking and discovery
Abela et al. Behaviour mining for automatic task-keeping and visualisations for task-refinding
Oh et al. Semantic networks of mobile life-log for associative search based on activity theory
Sun et al. Using mobile services based on SNS to recommend who, how, and when to collaborate

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101117

Termination date: 20160609

CF01 Termination of patent right due to non-payment of annual fee