CN102662940A - 书签提取装置、方法以及计算机产品 - Google Patents

书签提取装置、方法以及计算机产品 Download PDF

Info

Publication number
CN102662940A
CN102662940A CN2011104242415A CN201110424241A CN102662940A CN 102662940 A CN102662940 A CN 102662940A CN 2011104242415 A CN2011104242415 A CN 2011104242415A CN 201110424241 A CN201110424241 A CN 201110424241A CN 102662940 A CN102662940 A CN 102662940A
Authority
CN
China
Prior art keywords
bookmark
key word
unit
browsing
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011104242415A
Other languages
English (en)
Other versions
CN102662940B (zh
Inventor
今井祥子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN102662940A publication Critical patent/CN102662940A/zh
Application granted granted Critical
Publication of CN102662940B publication Critical patent/CN102662940B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management

Abstract

本发明涉及一种书签提取装置、方法和计算机程序。公开了书签提取装置,并公开了该装置从提前注册的书签中准确选择与当前正在浏览的web站点相关的最适合的书签,并将它们提供给用户。该书签提取装置包括关键字提取单元,该提取单元基于web站点至今的浏览历史信息,提取关键字,以及提供单元,该提供单元基于所述关键字,从多个已注册的书签中提供与所述提取单元所提取的所述关键字相关的书签。

Description

书签提取装置、方法以及计算机产品
本申请基于并且要求2010年12月14日提交的日本专利申请第2010-278012号的优先权,通过引用将上述申请的全部公开内容合并于此。
技术领域
本发明涉及web站点的浏览技术。特别地,本发明涉及在浏览web站点时从多个注册的书签为用户提供最合适书签的web站点浏览技术。
背景技术
使用浏览器(浏览器软件)来浏览国际互联网web站点(以下,其可以被称为“web站点”,或“web页面”)在人们中广为流行。一般的浏览器具有所谓的书签功能。根据书签功能,通过在浏览器中按照与用户想要的标题相关联的方式存储web页面的URL(统一资源定位符),下一次可以实现用户对所需web页面的方便访问。然而,在一般情况下,当浏览器使用了很长的时间段,注册到浏览器的书签的数量趋于增加。在这样的书签功能中,也具有一种已知的功能,其中假设上述情况,用户本身将web页面分类(组织)到文件夹,提供用户所期望的文件夹名称。
然而,在这种浏览器的实际使用场景中,大量的书签已经被提前注册,更加困难将是用户立即访问对应于所期望web页面的书签。甚至当通过分类文件夹中注册的书签时,类似地发生这种趋势。这样的结果是,在这种情况下,即使将大量书签注册到浏览器,出现大部分出现不会被有效地使用的情况。
也有已知的具有从多个注册的书签搜索想要的书签的功能的浏览器。然而,为了充分利用这种搜索功能,用户必须记住之前已经注册了所需的书签的事实,而且进一步,必须记住所期望的书签的标题或类似的以将其用作搜索关键字。出于这个原因,用户不容易有效地使用这样的搜索功能,因此它是不方便的。
因此,为了改善这种一般浏览器功能和它的书签功能的便利,已经提出了根据用户位置在浏览器屏幕上容易地可访问的(可操作的)位置处指示用户将要访问的书签的技术。如这种技术的一个例子,在专利文件1(日本专利申请公开号2007-299170)中,公开了的一种技术是,为了促进有效使用大量注册的书签,基于正在浏览的web页面的ULR提取与用户想知道的项有关的书签,并且将它们提供给用户。
也就是说,专利文件1公开了一种从管理器数据库获取与正在浏览的web页面相关性的书签技术,在管理数据库中将URL与和URL内容相关的书签进行关联。也就是说,在专利文件1中,这种管理数据库是由不同于先前的第三人的第三人准备的。作为向管理数据库查询目前正在浏览的web页面的URL的结果,用户获得相关的URL组。然后,在专利文件1中,如果落入所获得的URL组的书签已经注册了用户使用的浏览器的书签,可以将这些书签的列表提供给用户。在专利文件2(日本专利申请公开号2004-070441)中,公开了一种技术,其为了在最合适的时机提供可用于用户的web页面的内容的目的,根据时间和用户的位置从注册的书签提供最合适的书签。
然而,在专利文件1公开的技术中,提前执行将数据注册到管理数据库中。因此,已注册的信息是永远比用户访问时的信息要老的信息。出于这个原因,在专利文件1所披露的技术中,它不能立即处理在书签的变化和相关URL的内容变化。同样,仅基于web页面内容自动提取书签时,可以提取与用户的需要不同的书签,例如当用户想要了解的信息仅由web页面的较少部分指示时。
此外,在专利文件1所公开的技术中,执行按使用分类的URL关联。。出于这个原因,根据使用分类的设置,还具有执行不对应于web页面内容的分类的可能性。
在专利文献2所披露的技术中,用户目前正在浏览的web页面的内容不被视为提供给用户的书签。
因此,本发明的主要目的是提供一种书签提取装置等,其从现在注册的书签中准确地选择与目前正在浏览的web页面相关性的最合适的书签,并将他们提供给用户。
发明内容
为了实现该目标,根据本发明的书签提取装置具有下面配置。
即,作为本发明的一个方面,一种书签提取装置,包括:
关键字提取装置,用于基于web站点至今的浏览历史信息提取关键字;以及
提供单元,用于基于所述关键字,从多个注册的书签中提供与所述关键字提取单元提取的所述关键字相关的书签。
在上述情况下,例如基于在所述浏览历史信息中包括的、关于当前正在浏览的web站点的信息,所述关键字提取单元获取所述当前浏览的web站点的内容,并且从所述内容中提取所述关键字。
作为本发明的另一方面,在上述书签提取装置中,当通过分析所述浏览历史信息,确定已经从搜索站点进行了到当前正在浏览的web站点的转变时,所述关键字提取单元可以提取在到所述当前浏览的web站点的所述转变之前已经使用的搜索关键字作为所述关键字,并且所述提供单元可以基于所述搜索关键字,从所述多个书签中提供与所述搜索关键字相关的书签。
在任何上述配置中,所述提供单元可以包括相关性确定单元,用于例如根据所述关键字在包括在关于所述多个书签的信息中的每个所述书签的所述属性信息中所述关键字被包括的程度,确定在所述关键字和所述每个书签的之间的相关性的存在。
同时,还使用计算机,通过计算机程序以及通过其中存储了所述计算机程序的计算机可读存储器介质来获得该目标,该计算机程序实现具有前述配置的书签提取装置和对应的方法。
根据本发明,实现了提供书签提取装置等,其从提前注册的书签中准确地选择与正在浏览的web站点相关的最适合的书签,并且将它们提供给用户。
附图说明
结合附图且通过下面的详细说明,本发明的示例性特征和优点将更为明显,其中:
图1是示出了根据本发明的第一示例性实施方式的书签提取装置的结构的框图;
图2是示出了根据本发明的第二示例性实施方式的包括书签提取系统的通信环境的框图;
图3是示出了根据本发明的第二示例性实施方式的由书签提取系统100处理的书签提取的流程图;
图4是示出了根据第二实施方式的书签提取处理中图3所示的步骤S102、步骤S104、步骤S105和步骤S110中的处理的细节;
图5是示出了根据第二实施方式的搜索词提取处理和用于关于其是否是搜索站点的单个历史的确定处理的流程图;
图6是示出了在本发明的第二示例性实施方式中的相关性确定处理的流程图;
图7是示出了基于概念的在搜索站点信息存储单元106中保持的搜索站点信息的示意图;;
图8A和图8B是示例性介绍根据本发明的第二示例性实施方式的实例中用户进行网络浏览时的屏幕转换的示意图;
图9A和图9B是概念地描述图8A和图8B中示出的屏幕转换情况中书签提取系统的操作的示意图;
图10A是概念地说明与在浏览器200的书签存储单元206注册的关于多个书签的书签信息块之间的书签1的数据结构的示意图;
图10B是概念地说明与在浏览器200的书签存储单元206注册的关于多个书签的书签信息块之间的书签2的数据结构的示意图;
图10C是概念地说明与在浏览器200的书签存储单元206注册的关于多个书签的书签信息块之间的书签3的数据结构的示意图;
图10D是概念地说明与在浏览器200的书签存储单元206注册的关于多个书签的书签信息块之间的书签4的数据结构的示意图;
图10E是概念地说明与在浏览器200的书签存储单元206注册的关于多个书签的书签信息块之间的书签5的数据结构的示意图;
图10F是概念地说明与在浏览器200的书签存储单元206注册的关于多个书签的书签信息块之间的书签6的数据结构的示意图;
图11是示出了根据本发明的第二示例性实施方式的相关书签的列表屏幕的显示形式的示意图;
图12是示出了根据本发明的第三示例性实施方式的包括书签提取系统的通信环境的框图;
图13是示出了根据本发明的第三示例性实施方式的由书签提取系统100A进行的书签提取处理的流程图;
图14是示出了在本发明的第三示例性实施方式中的相关性确定处理中的流程图;
图15是示出了在本发明的第四示例性实施方式的相关性确定处理中的流程图;
图16是示出了在本发明的第四示例性实施方式的相关书签的列表屏幕的显示形式的示意图;
图17是示例性地介绍了可以实现本发明的第一到第四示例性实施方式的计算机(信息处理装置)的硬件配置的示意图。
具体实施方式
下面,将参考附图来详细地介绍用于执行本发明的示例性实施方式。
<第一示例性实施方式>
图1是示出了根据本发明的第一示例性实施方式的书签提取装置的结构的框图。图1中示出的书签提取装置1具有关键字提取单元3和相关书签提取单元5。
也就是说,关键字提取单元3基于到目前为止的用于web站点(web页面)的浏览历史信息2来提取关键字。浏览历史信息2包括与目前正在浏览的web站点相关的信息。
基于关键字,相关书签提供单元5从关于书签(书签信息)4的多个注册信息块选择与关键字提取单元3提取的关键字相关的书签。然后,相关的书签提供单元5提供(或报告)所选的书签给用户。例如,浏览历史信息2和书签信息4可以从图1中未示出的网络浏览器(网络浏览装置)来获得。虽然,作为提供这些选定书签的形式,假设在显示器上的指示(图1中没有示出,但是在之后提到的实例中,可以采用图17中示出的计算机1000的显示器12)),例如,它不仅限于指示。
根据以上所述的第一示例性实施方式,它是可以从先前注册的书签精确地选择与目前正在浏览的web站点相关的最适合的书签以提供给用户。也就是说,在根据这个示例性实施方式的书签提取装置1中,关键字提取单元3基于关于web站点的浏览到当前日期的浏览历史信息2来提取关键字,信息2包括关于正在浏览的web站点的信息。然后,通过指示所提取的关键字,书签提取装置1选择与关键字相关的书签并且将所选的书签提供给用户。因此,即使当由于具有大量的注册书签而导致用户不记得每个书签时,或者,甚至当由于已经通过将书签分类到类别来注册书签而导致用户已经忘记将书签注册到哪个类别。书签提取装置1可以将与目前正在浏览的web站点相关的最合适书签提供给用户。
<第二示例性实施方式>
接下来,将通过参考附图来详细地介绍基于上述第一示例性实施方式的第二示例性实施方式。图2是示出了根据本发明的第二示例性实施方式的包括书签提取系统的通信环境的框图。。图2中示出的通信环境包括书签提取系统100,浏览器200,网络300和web站点400。
书签提取系统100和web站点400可以通过诸如国际互联网的通信网络(以下,简称为“网络”)进行通信。在这个示例性的实施方式中,它应该是,web站点400是提前注册到浏览器200的书签的链接目的地。在图2中,例如(详细的介绍将在之后通过参照图17来进行),书签提取系统100和浏览器200可以被认为是在图17中示出的单个信息处理装置图(计算机)中执行的软件程序的配置,。然而,通过物理地或虚拟地能够彼此相互通信的不同实体的信息处理装置来单独地实现书签提取系统100和浏览器200。
(书签提取系统100)
书签提取系统100具有浏览历史获取单元102、浏览历史分析单元104、搜索web站点信息存储单元106、浏览的内容获取单元108、浏览的内容分析单元110、书签信息获取单元112、书签属性相关性确定单元114、书签内容获取单元116、书签内容相关性确定单元118和相关的书签显示单元120。书签提取系统100对应于上述第一示例性实施方式中的书签提取设备1。
也就是说,在书签提取系统100中,浏览历史获取单元102从浏览器200获得web站点的浏览历史(其对应于第一示例性实施方式中的web站点的浏览历史信息2)0。搜索web站点信息存储单元106持有的搜索web站点的URL并且在诸如图7中示出的web站点搜索信息50的搜索web站点中的搜索字提取方法。通过基于从搜索web站点信息存储单元106获得的浏览历史分析从浏览历史获取单元102获得的浏览历史,浏览历史分析单元104提取已经在搜索时使用过的关键字。浏览的内容获取单元108从浏览器200获得在浏览器200中浏览的web站点的内容。通过分析从浏览器200经由浏览的内容获取单元108获得的web站点的内容,浏览的内容分析单元110提取与web站点相关的关键字。书签信息获取单元112从浏览器200获取被注册到浏览器200的书签信息。
在书签提取系统100中,书签属性相关性确定单元114确定通过书签信息获取单元112获取的书签属性AT和由浏览器历史记录分析单元104或由浏览的内容分析单元100提取的关键字之间的相关性。在这里,“书签的属性AT”是详细信息(属性信息),其包括字符串和以及类似关于诸如注册为书签的web站点的标题和URL书签以及文件夹通路,(以下,应当应用系统的含义)。书签内容获取单元116获取由书签表示的web站点400(链接目的URL)的内容,通过网络从web站点400经由书签信息采集单元112获取所述书签。针对通过书签内容获取单元116获取的内容,书签内容相关性确定单元118确定由浏览历史分析单元104或浏览的内容分析单元110所提取的关键字的相关性。然后,相关的书签显示单元120提供由书签属性相关性确定单元114和书签内容相关性确定单元118确定的书签,作为具有与通过在指示浏览器200的屏幕中指示它们的用户的相关性(此后,它们可以被称为“相关书签”)。
(浏览器200)
浏览器200有显示包括web站点400的各种web站点的内容的功能,使得它们可以被用户阅读。。这个浏览器200具有浏览历史存储单元202、浏览的内容存储单元204和书签存储单元206。
也就是说,关于用户已经浏览的web站点,浏览历史存储单元202持有浏览历史(浏览历史信息),例如web站点的URL。浏览的内容存储单元204持有用户正在浏览的web站点的内容。书签存储单元206持有关于用户已经注册的所需web站点的书签的信息(书签信息:它对应于第一示例性实施方式中的书签信息4)(参考图10A-10F)。书签存储单元206只有,如书签信息,代表已经注册的书签的名称(标题),以及对应于书签的web站点的URL和属性信息。同时,书签存储单元206可以持有额外的信息,如关于注册的另外书签的标签和关键字。
(操作说明)
接下来,将会详细地介绍具有前述配置的这种示例性实施方式的操作。
图3是示出了根据本发明的第二示例性实施方式的书签提取系统100进行的书签提取处理的流程图。根据所述示例性实施方式,书签提取系统100响应于用户使用浏览器200访问所期望的web页面来开始操作。也就是说,根据所述示例性实施方式,响应于检测浏览器200对web页面的访问来开始书签提取处理。
当检测到对web页面的访问时,浏览历史获取单元102从浏览器200的浏览历史存储单元202获取浏览历史(步骤S 102)。接下来,浏览历史记录分析单元104分析在步骤S 102获得的浏览历史(步骤S104)。然后,浏览历史分析单元104确定正在被浏览器200浏览的web页面是否是这样的页面,从指示在搜索web站点中指示的搜索结果或者不基于分析结果的页面直接移动到所述页面。。
作为步骤SI05中确定的结果,当目前浏览的web页面不是来自搜索web站点的移动时,浏览的内容获取单元108基于web页面的内容执行关键字的提取处理(第一搜索过程)(步骤S106)。也就是说,在步骤S106中,浏览的内容获取单元108从浏览器200的浏览的内容存储单元204获取用户正在浏览的web页面的内容。然后,通过分析在步骤S106获得的内容,浏览的内容分析单元110根据关键字提取web页面的内容中包括的重要字(步骤SI08)。在重要字的提取处理中,例如(其可以通过其它方法来完成,并且此后,应当应用同样的方法),可以基于web页面中的字的出现(使用量)的频率来执行特定字是否是重要字。
另一方面,当web页面是来自搜索web站点的移动时,浏览历史记录分析单元104执行基于浏览历史的关键词的提取处理(第二搜索过程)(步骤S110)。
同时,由浏览历史分析单元(步骤S102、步骤S104以及步骤S105)进行浏览历史的分析处理的说明,以及稍后将通过参考图4来进行基于浏览历史的关键字提取处理(步骤S110)。
在步骤S112和S114,通过使用由上述的关键字提取处理块中的一个所获得的关键字,提取与关键字相关的书签。也就是说,书签信息获取单元112从浏览器200书签存储单元206获取关于注册到浏览器的书签的信息(书签信息)(步骤S 112)。接下来,在步骤S 114,执行关键字和书签信息之间的相关性的确定处理。通过书签属性相关性确定单元114、书签内容获取单元116和书签内容相关性确定单元118来实现所述确定处理(后文将通过参考图5来详细地说明)。
在步骤S114完成相关性的确定之后,例如,相关的书签显示单元120通过图11中示出的显示形式将相关书签的列表提供给用户(步骤S116)。
图11是示出了在本发明的第二示例性实施方式中相关书签的列表屏幕的显示形式的示意图。图11中示出的实例表明一种状态,其中在目前根据网络200显示的网页的左侧框架中指示与web页面相关的书签列表。
此处,将通过参照图4来介绍浏览历史分析单元104的操作。图4是示出了根据第二示例性实施方式的书签提取处理中包括的图3中示出的步骤S102、步骤S104、步骤S105和步骤S110中的详细处理的流程图。
首先,浏览历史分析单元104获取表示历史的历史信息,直到已经从在浏览器200的浏览历史存储单元202中存储的浏览历史信息到达(对应于web页面的历史)用户正在浏览的web页面(步骤202)。
接下来,通过参照在步骤S202获取的历史信息,浏览历史分析单元104确定当前正在浏览的Web页面是否为搜索站点(步骤S204)。这里,作为用于步骤S204中确定是否为搜索站点的方法,例如可以采用现在通用的诸如利用预先存储的搜索站点的URL进行图形匹配的处理等的过程。稍后将参照图5对这种过程的特定示例进行描述。
当确定当前正在浏览的Web页面为搜索站点时,浏览历史分析单元104提取用户输入到搜索站点的搜索词(步骤S210)。另一方面,当确定当前正在浏览的Web页面不是搜索站点时,浏览历史分析单元104从在步骤202获取的浏览信息获取关于恰好在当前正在浏览Web页面之前浏览过的Web页面的历史信息(步骤S206)。然后,通过参照在步骤S206获取的历史信息,浏览历史分析单元104确定恰好在当前Web页面之前浏览的Web页面是否是搜索站点(步骤S208)。在步骤S208中的确定处理中,可以采用与上述步骤S204相同的通用处理过程。
图5是一个流程图,示出根据第二示例性实施方式的搜索词的提取处理,以及对是搜索站点还是不是以单个历史为目标的确定处理,并且更具体地表明上述图4所示一系列处理的一部分(步骤S204-S210)。
浏览历史分析单元104获取包括在图4所示在步骤S202获取的历史信息中的URL(步骤S212)。接下来,浏览历史分析单元104从搜索站点信息存储单元106中获取搜索站点信息片段(步骤S214)。
以恰好在当前正在浏览的Web页面之前浏览的Web页面为目标,浏览历史分析单元104确定URL的开头是否等于在步骤S214获取的搜索站点信息标识的搜索站点的URL(步骤S216)。
当在步骤S216的确定中已经确定其等于搜索站点,则浏览历史分析单元104根据对应于搜索站点的搜索词获取方法获取搜索词(步骤S220)。另一方面,当确定它不等于搜索站点时,浏览历史分析单元104确定还没有验证的搜索站点是否保留在搜索站点信息存储单元106中存储的搜索站点信息中(步骤S218)。当存在在该确定中发现的未验证的搜索站点时,处理返回到步骤S214。另一方面,当确定不存在未验证的搜索站点时,浏览历史分析单元104结束该处理。
与此同时,由于关于保持在搜索站点信息存储单元106中的搜索站点的信息依赖于搜索站点的实现,所以需要周期性更新。作为这样的更新,可以考虑:通过系统的分发者的周期性信息派送的自动校正;搜索站点信息的分享;以及用户的手动校正。
接下来,将参照图6描述涉及书签属性相关性确定单元114、书签内容获取单元116和书签内容相关性确定单元118的组合的相关性确定处理的细节。
图6是示出本发明第二示例性实施方式中的相关性确定处理的流程图,并表明上述图3所示步骤S 114的细节。
首先,通过参考在步骤S 112通过书签信息获取单元112获取的书签信息(图3),书签属性相关性确定单元114以包括在书签的属性AT中的字符串为目标执行对关键词的搜索(步骤S302)。这里,在该步骤中将搜索的关键词是在基于上述Web页面的内容的关键词提取处理中(第一搜索处理:图3的步骤S106)或基于浏览历史的关键词提取处理(第二搜索处理:图3(步骤S110)、图4和图5)中提取的关键词。
作为在步骤S302中的搜索结果,当在书签的属性AT中存在所有关键字是,书签内容获取单元116访问特定的web站点400,该web站点是书签的链接目的地(步骤S308)。由此,书签内容获取单元116经由网络300获取特定web站点400的内容。
当在步骤S308中已经能够获取内容时,鉴于在用户已经注册过书签的时间之后内容的改变,书签内容相关性确定单元118在书签内容获取单元116已经获取的内容的字符串中搜索关键字(步骤S309)。
作为在步骤S309中的搜索结果,当包括至少一个关键字时,书签内容相关性确定单元118确定在作为链接目的地的特定web站点400与当前正在浏览的web站点之间存在相关性(步骤S312)。对比而言,当完全不包括关键字时,书签内容相关性确定单元118确定在作为链接目的地的特定web站点400与当前正在浏览的web站点之间不存在相关性(步骤S310)。同时,在当对应于书签的特定web站点400是失效链接的情况下,过程前进到步骤S310。同样在该情况下,书签内容相关性确定单元118确定在作为链接目的地的特定web站点400与当前正在浏览的web站点之间不存在相关性。
另一方面,作为在步骤S302中的搜索结果,当部分或全部关键字不存在书签的属性AT中时,书签内容获取单元116经由网络300,通过访问作为书签的链接目的地的web站点400来获取内容,这是步骤S308中的情形(步骤S304)。继而,通过定向在所获取的内容中包括的字符串,书签内容相关性确定单元118搜索还没有被包括在书签的属性AT中的关键字(步骤S306)。同时,为了降低当时的过程中的负载,可以经由网络300,通过使用搜索站点执行从获取内容到搜索关键字的过程。
作为在步骤S306中的搜索结果,当确定为在书签的属性AT中没有包括的所有关键字包括在步骤S304中获取的内容中时,书签内容相关性确定单元118确定在作为链接目的地的特定web站点400和当前正在浏览的web站点之间存在相关性(步骤S312)。
另一方面,当没有包括在书签的属性AT中的部分或全部关键字不包括在所获取的内容中时,书签内容相关性确定单元118确定在所关注的作为链接目的地的特定的web站点400与当前正在浏览的web站点之间不存在相关性。(步骤S310)。
(示例)
接下来,通过使用具体的示例来描述上述一系列处理步骤的整个画面。首先描述在该说明书中的前提条件。
图8A和图8B是示例性描述了在本发明的第二示例性实施方式的示例中,在的用户浏览web的时候的屏幕转换的图。图9A和图9B是在图8A和图8B中说明的屏幕转换的情况下的概念性描述书签提取系统的操作的图。
也就是说,在图8A中说明的模式1示出了其中例如通过在其自身的博客中直接输入期望web站点的URL到达当前正在浏览的web站点的情况。另一方面,在图8B中说明的模式2显示了其中通过在搜索站点中输入关键字获取关于期望关键字的搜索结果,并进一步通过进行到在搜索结果中包括的期望web站点的转换,从而当前正在浏览期望的web站点的情况。
同时,在图8A,图8B,图9A和图9B中,“Internet Explorer”,“Media player”,“Office”,“Windows”是注册商标(下文中,同样适用)。
假设在图7中概念性地说明的信息被称为从搜索站点信息存储单元106中获取的搜索站点信息。同样,假设用户之前已经注册图10A到10F中概念性地说明的书签(书签1到6)。然而,假设该用户由于注册了大量其它书签,从而导致已经无法发现这些书签1到6。或者,假设由于这些书签已经被注册的事实本身被遗忘,该用户就无法再仅通过自己的操作容易地找到这些书签了。
在图10A到10F中说明的书签信息的示例中,参考文件夹路径,可以发现对大部分书签,用户已经将相关的书签在Microsoft(注册商标)文件夹中按软件组织起来。然而,仅有书签6(图10F)不是基于该组织程序的。例如,一个原因是假设在注册书签6时,书签的组织方法已经被改变的情况,或者注册的位置被临时改变的情况。
在满足上述前提的一般技术的情况下,为了使用户能够找到书签6,首先,必不可少的是用户自己记住书签6已经被注册的事实。另外,用户除了记住之前有关于书签的组织方法并且按照该组织方法查找书签6,或者通过搜索调查外别无选择。然而,当使用一般书签搜索功能,并且如果使用的关键字是与在模式1(图8A)和模式2(图8B)中例示的页面转换过程中用户想要了解的项相关的、诸如“Office”和“Windows”(Office和Windows是注册商标)之类的词,则无法找到书签6。
与这种一般技术相比,根据该示例实施方式中上文所提到的技术,用户被鼓励有效地使用如以上前提的被埋藏在大量书签中的书签。
下文中,针对图8A和图8B中说明的屏幕转换的书签提取系统100的操作将参考图9A和图9B描述。
首先,将描述图9A中说明的模式1的示例。模式1指示“web页面被浏览”已经被直接从“自己的博客”页面中找到而不需要访问搜索站点的情况。在该模式1的示例中,假设用户当前在浏览的web页面是具有指示了与信息技术相关的列的web页面。假设当用户以前浏览过该we b页面时,比较OS(操作系统)的专题出现在web页面上。还假设在当前的浏览中,关于快捷键的专题被发布在web页面上。
在这种情况下,在书签提取系统100中,浏览历史获取单元102从浏览历史存储单元202中获取浏览历史(图3的步骤S102)。然后,通过分析获取的浏览历史,浏览历史分析单元104确定当前浏览的web站点是否是从搜索站点的搜索结果的页面中直接得到转换(找到)的页面(图3的步骤S104)。在模式1中,当前浏览的web站点的转换不是经由搜索站点的转换。基于这个原因,作为关键字的提取过程,浏览内容获取单元108获取从浏览器200的浏览内容存储单元204获取的浏览内容(图3的步骤S106)。
接下来,通过分析所获取的内容,浏览内容分析单元110从“正在被浏览的web页面”中提取重要的词作为关键字(图3的步骤S 108)。在图9A示出的模式1的情况下,假设“Windows”和“快捷键”作为这类关键字被获取。
为了从多数已经注册的书签中提取与关键字相关的书签,书签信息获取单元112从浏览器200的书签存储单元206中获取书签信息(图3的步骤S112)。在这种情况下,图10A到10F中说明的书签1-6被获取。另外,通过联合使用书签属性相关性确定单元114,书签内容获取单元116和书签内容相关性确定单元118,可以确定这些书签和关键字之间的相关性(图3中的步骤S114,和图6)。由此,在该示例中,从书签1到6中选出书签1,3,5和6作为与关键字相关的书签(相关书签)。例如,相关书签显示单元120通过图11示出的显示表格向用户提供相关书签列表(图3的步骤S116)。
这里,关于对模式1的情况下的浏览历史的分析处理和相关性确定处理的具体的过程(处理流程)将在下文描述。
首先,将要描述对浏览历史的分析处理。在模式1中(图9A),基于被浏览的web页面的内容,如上所述,重要的词汇被提取作为关键字。将会增加关于该过程的描述。
浏览历史分析单元104从由步骤S102(图3)获取的浏览历史中获取历史作为对正在被浏览的web页面的访问信息,该历史体现了直到达到当前浏览的web页面的浏览过程。然后,浏览历史分析单元104确认正在被浏览的web页面是搜索站点(图4的步骤S204)。在该示例中,正在被浏览的web页面不是搜索站点。基于这个原因,浏览历史分析单元104从浏览历史中获取web页面的历史(图4的步骤S206),该历史恰好在当前正在被浏览的web页面之前被浏览。在这种情况下,对“用户自己的博客”的访问信息被如图9A所示获取。由于恰好在当前浏览页面之前被浏览的web页面依据该访问信息被确定为不是搜索站点(在图4的步骤S208,否),浏览历史分析单元104确定用户当前正在浏览的web页面不是通过搜索站点找到的页面。
接下来,描述相关性确定过程。首先,从书签的属性AT中包括的特征字符串中,书签属性相关性确定单元114搜索上述在模式1中提取的关键字“Windows”和“快捷键”。在模式1中,作为包括所有书签的属性AT中的关键字的书签,书签1和2被从书签1到6中选中。书签3,4,5和6被从书签1到6中选中作为书签,其中部分或没有关键字不被包括。
关于每个书签1和2,通过经由网路300访问链接目标的web站点400,书签内容获取单元116获取关注的web站点的内容(图6的步骤S308).书签2(图10B)是属于失效链接,其中在步骤S308未能获取内容。基于这个原因,书签内容相关性确定单元118确定当前正在被浏览的web站点和书签2没有相关性(图6的步骤S310)。
另一方面,关于能够获取内容的书签1,书签内容相关性确定单元118搜索关键字(“Windows”和“快捷键”)以找到获取的内容中包括的特征字符串(图6的步骤S309)。由于书签1包括关键字,书签内容相关性确定单元118确定当前正在被浏览的web站点和书签1之间具有相关性(图6的步骤S312)。
同样关于书签3,4,5和6,通过经由网路300访问链接目标的web站点400,书签内容获取单元获取关注的web站点的内容(图6的步骤S 304)。此外,通过定向所获取的内容的特征字符串,书签内容相关性确定单元118搜索没有包括在关注的书签的属性AT中的关键字(图6的步骤S306)。由此,书签内容相关性确定单元118将在其内容中包括所有关键字的书签3,5和6(图10C,10E和10F)为确定为具有相关性的书签(图6的步骤S312)。另一方面,书签内容相关性确定单元118将仅包括所有关键字中的部分关键字的书签4(图10D)判断为不具有相关性的书签(图6的步骤S310)。
在第一次浏览web站点期间,用户倾向执行使用关于特定web站点的URL的使用分类的注册操作。在一般的技术下,当假设重要词汇作为使用分类时,可以认为“OS;比较”等设置作为使用分类。另一方面,作为该示例(模式1)的前提,用户当前正在浏览的web页面是具有如上所示指示了与信息技术相关的列的web页面。由于该web页面是列站点,例如出现在其上的内容有很高概率被周期性地更新。对应的,在模式1的情况下,与该web站点第一次被浏览时的内容不同,它以图9A说明的Windows的快捷键作为特征。当基于例如某个web站点第一次被浏览时的内容的信息执行关联时,例如关键字“OS;比较”,在一般技术的情况下作为如上所述的使用分类来注册。基于这个原因,依据一般技术,不存在与关键字“Windows”和“快捷键”相关的与当前内容对应的书签。相比之下,在该示例中,利用该次web页面被浏览时的信息,书签提取系统100将web页面和注册的书签进行关联。结果,依据该示例,相关的书签1,3,5和6可以使用与当前正在浏览的web页面的内容对应的关键字“Windows”和“快捷键”来提取。也就是说,可能从预先注册的书签中准确地选择最合适的与当前正在浏览的web站点相关的书签,并且将他们提供给用户。
接下来,将描述图9B中图示的模式2中的示例。模式2是其中已经经由搜索站点到达“正在浏览的web页面”的示例。
同样,在模式2的情况下,对浏览历史进行分析,正如上述模式1那样,以便确定向当前正浏览的web页面移动(转移)的方法(图3的步骤S102-S105)。然而,因为模式2是经由搜索站点的示例,所以作为关键字提取过程,浏览历史分析单元104基于浏览历史提取搜索词(图3的步骤S110),该搜索词是用户已经输入搜索站点中的用于搜索的关键字。这时,在模式2中,将“Microsoft”、“Office”、“快捷键”作为关键字获得。
接下来,与模式1的情况相同(图3的步骤S112),从书签存储单元206中获取书签信息,并且在这个情况下,获得图10A到10F中图示的书签1到书签6。此外,通过以组合的方式使用书签属性相关性确定单元114,书签内容获取单元116和书签内容相关性确定单元118,对书签和关键字之间的相关性进行确定(图3的步骤S114)。作为结果,从书签1到书签6中选择书签3、4和6(图10C、10D和10F)作为与关键字有关的相关联书签。
在此,关于模式2的情况中的浏览历史的分析处理以及相关性的确定处理,下面将描述书签提取系统100执行的处理的具体流程。
将首先描述浏览历史分析单元104(图4)的处理。模式2中(图9B),如上所述将搜索站点中的搜索词作为关键字提取。在模式2的情况中,在浏览历史的分析处理中,在步骤S204确定正在浏览的web页面不是搜索站点之后,浏览历史分析单元104从浏览历史中获取与正好在正浏览的web页面之前浏览的web页面有关的历史信息(步骤S206)。
在图9B中示出的示例的情况下,获取与搜索站点的“搜索结果”屏幕有关的访问信息。在模式2中,在步骤S208中,在步骤S206中获取的访问信息与先前存储的搜索站点一致(此处假设它与图7中示出的搜索站点信息中的搜索站点ID 1相对应)。因此,在步骤S210中执行搜索词的提取。
例如基于在图7中显示的搜索站点信息中包括的“搜索词提取方法”,执行这种搜索词的提取。在这种情况下,浏览历史分析单元104从历史信息中获取与“搜索结果”相对应的URL,并且从URL的查询字符串中获取作为搜索词的值q。在图7中显示的“搜索词提取方法”中,当包含作为搜索词的多个词时,通过符号“+”将它们相连。这个符号“+”表示,当为搜索词相连的状态时,也就是说,当存在“关键字1+关键字2”的字符串时,对字符串进行划分,并得到“关键字1”和“关键字2”。也就是说,在步骤S210中,通过使用值q对字符串进行划分,获得可以获取的搜索词组(多个搜索词)。在图9B中显示的示例的情况下,将“Microsoft”、“Offiice”、“快捷键”作为搜索词获得。在对书签的内容进行搜索期间,使用所获得的搜索词作为关键字(图6的步骤S306和步骤S309)。
因此,根据上述示例,可以提取更符合用户想要了解的内容的关键字。与此相反,在采用通用技术的情况下,当已经经由搜索站点到达当前正浏览的web站点时(例如图8B中显示的模式2),可以预期从正在浏览的web站点的内容中提取出“Windows”和“快捷键”这样重要的(使用频率很高的)词作为关键字。因此,在采用通用技术的情况下,因为可能会提取出与用户想要了解的内容无关的书签,所以不方便。
接下来,将以图9B中显示的模式2作为示例对相关性确定操作进行描述。首先,以书签属性AT中包含的字符串为目标,书签属性相关性确定单元114搜索关键字“Microsoft”、“Office”、“快捷键”(图6的步骤S302)。在这个情况下,选择出书签4为包含书签属性中的全部关键字的书签。选择出书签1、2、3、5为不包含全部关键字中的一部分或全部的书签。
对于书签4(图10D),通过经由网络300访问作为链接目的地的特定web页面400,书签内容获取单元116获取该具体web站点的内容(图6的步骤S308)。当已经能够获取内容时,以该内容中的字符串为目标,书签内容相关性确定单元118搜索关键字(图6的步骤S309)。在这种情况下,因为书签4包括这些关键字,所以书签内容相关性确定单元118确定书签4与正在浏览的web站点有相关性(图6的步骤S312)。
同样,对于书签1、2、3、5中的每一个,通过经由网络300访问作为链接目的地的特定web站点400,书签内容获取单元116获取该特定web站点的内容(图6的步骤S304)。此外,以所获取的内容中的字符串为目标,书签内容相关性确定单元118搜索未包含在所涉及的书签的属性中的关键字(图6的步骤S306)。在这种情况下,因为书签3(图10C)包含该内容中的全部关键字,书签内容相关性确定单元118确定书签3和6与正浏览的web站点有相关性(图6的步骤S312)。另一方面,书签1、2和5(图10A、B、E)不包含内容中的关键字的一部分或全部。相应地,书签内容相关性确定单元118确定书签1、2、5与正浏览的web站点没有相关性(图6的步骤S310)。
类似于之前描述的浏览历史分析单元104执行处理的情况,根据通用技术,可以预期在模式2的情况下,基于当前正浏览的web站点提取出“Windows”和“快捷键”作为关键字,基于该关键字提取出书签1、3、5和6。在这种情况下,将省略用户想要了解的基本上包含在正在浏览的web站点中的项目,即,与“Microsoft”、“Office”、“快捷键”有相关性的书签。与此相反,根据该示例,可以将与“Microsoft”、“Office”、“快捷键”相关联的书签3、4和6作为更符合用户想要了解的内容的书签提供给用户。
因此,在第二示例性实施方式及其上述示例中,书签提取系统100可以使用浏览器200从先前注册的书签中准确地选择与用户当前正浏览的web站点相关联的最合适的书签,并且将它们提供给用户。
通常而言,即使已经通过搜索等处理找到web站点,并且之前已经将这些web站点作为书签注册了,仍然有可能因为已经注册了大量的书签而不会再找到需要的书签。可替换地,通过已经忘记某个已经注册的书签这个事实本身,用户可能无法再利用它。对于这种情形,根据第二示例性实施方式以及上述示例,在上述模式1和模式2这两种情况下,与web页面相关联的书签可以在该web页面被浏览时提供给用户。因此,用户可以更快速地到达描述了其想要了解的内容的web页面。其原因在于,通过例如书签属性相关性确定单元114和书签内容相关性确定单元118的功能,可以准确地提取出与用户当前正浏览的web页面相关联的书签。
根据第二示例性实施方式及上述提及的示例,反映用户意图的书签可以被更正确地提取,其中用户已经参考正在被浏览的网站。特定地声明,在模式2(图8B),在利用使用频率或类似的方式对正在被浏览的网站内容进行分析时,“窗口”和“快捷键”似乎根据常规技术作为关键字被获取。但是,在模式2的情况下,用户已经到达当该网站,该网站由于执行“office快捷键”的搜索而被浏览。从而,在这种情况下,可以认为用户期望搜索词相关的信息被输入到搜索站。根据第二示例性实施方式及上述例子(图9B),因为书签的提取可以通过利用搜索词来执行,与用户的期望更一致的书签可被提取。另外,当用户忘记之前注册的书签,并在搜索站点执行相同目的的搜索时,之前注册的书签可以被提供给用户。这是因为可以通过浏览历史分析单元104分析浏览历史来得知用户通过哪种方式参考该网站。
同样根据第二示例性实施方式及上述提及的示例,当用户已经访问正在被浏览的web页面时,与该web页面内容相关的书签可以被提取。从而,相应于自从用户最后一次登录该web页面起的内容的变化,与当前状态更一致的书签可以被提取。其理由是,关于与一注册的书签相关的一web页面,其相关性被验证,通过被浏览内容分析单元110分析被浏览的该web页面正被浏览时的内容。
还是根据第二示例性实施方式及上述提及的例子,与登录正在被浏览的web页面时该书签的内容一致的书签可以被提取。从而,可以进行对不能通过在该书签的属性AT中包括的信息找到的相关书签的提取,或者可以进行对相关书签的失效链接的书签的排除。其理由是,在相关性确定过程中,不仅在关键字和属性信息之间的相关性被确定,书签的链接目的地的内容也可以以组合的方式通过书签内容相关性确定单元118来确定。
<第3示例性实施方式>
接下来,基于上述提及的第一和第二示例性实施方式的第三示意性实施方式将被描述。在此后的描述中,将主要描述实施方式的特征部分。在这种情况下,通过与上述示例性实施方式中的相同结构采用相同的参考号码,重复的描述将被省略。
图12是例示了包括根据本发明的第三示例性实施方式所示的书签提取系统的通信环境的框图。若粗略地归类,如图12所示的通信环境包括书签提取系统100A,浏览器200,网络300以及web站点400。在根据图2所示的第二实施方式的书签提取系统100之外,该书签提取系统100A还进一步包括相关书签高速缓存操作单元122,相关书签高速缓冲存储器单元124以及共同关键字相关性确定单元126。书签提取系统100A对应于上述提及的第一示例性实施方式中的该书签提取装置1。
在该示例性实施方式中,提供相关书签高速缓冲存储器单元124和相关书签高速缓存操作单元122,主要为了减少提取相关书签时的负荷。也即,在该示例性实施方式中,相关书签高速缓冲存储器单元124和相关书签高速缓存操作单元122实现了各种数据的高速缓存功能。
关于到目前为止用户采用浏览器200已经浏览的web页面(也即,包括正在被浏览的web页面),相关书签高速缓冲存储器单元124保持数据高速缓存(cache)。该高速缓存与信息对应,在信息中:比如,包括多个以下描述的数据项目;并且它们之间相互关联。
-至今为止用户采用浏览器200已经浏览的web页面(也即,包括正在被浏览的web页面)的URL;
-从上述web页面中提取的关键字;
-上述web页面的相关书签的识别信息(ID);
-上述web页面中的每个的最后登录时间。
在此,被提取的关键字是在上述第二示例性实施方式中的第一或第二搜索过程中已经被提取的关键字。相关书签是在有相关性的第二示例性实施方式中由书签属性相关性确定单元114和书签内容相关性确定单元118确定的书签。
假设高速缓存单元保持的信息的生存时间持续到当浏览器200的操作被完成(直到浏览器功能的使用结束)或者当系统断电,举例来说。这是为了与web页面和书签的内容的改变相应。共同关键字相关性确定单元126确定提取的共同关键字的相关性。
(操作的描述)
接下来,具有此前提到规程的示例性实施方式的操作将被具体地描述。
图13是示出了根据本发明的第三示例性实施方式的书签提取系统100A执行的书签提取过程的流程图。书签提取系统100A响应于用户通过使用浏览器200登录期望的web页面而开始操作,如第二示例性实施方式的情形。
首先,通过查阅相关书签高速缓冲存储器单元124,相关书签高速缓存操作单元122获取具有最接近于当前时间的最后登录时间(数据和时间)的若干高速缓存(步骤S402)。接下来,定向于步骤S402获得的高速缓存,共同关键字相关性确定单元126提取在上述高速缓存缓存中共同出现的关键字作为与上述高速缓存相关的共同关键字(步骤S406)。通过查阅相关书签高速缓冲存储器单元124,相关书签高速缓存操作单元122获得与该用户当前正在浏览的web页面的URL相对应的高速缓存(步骤S408)。
通过步骤S408的尝试获得缓存,相关书签高速缓存操作单元122确定与正被浏览的web页面的对应的高速缓存是否存在(步骤S410)。在此,高速缓存存在的情形是指这样的情形,其中当前被浏览的web页面的URL与存储在相关书签高速缓冲存储器单元124中的过去曾被浏览的web页面的URL相同。相关书签高速缓存操作单元122在步骤410中搜索并检测这样的URL。
当确定存在这样的高速缓存时(在步骤S410,是),通过从相关书签高速缓冲存储器单元124获得的所有相关书签识别信息作为一个关键字,共同关键字相关性确定单元126获得关于书签信息获取单元112的所有相关书签的属性信息(AT)。共同关键字相关性确定单元126经由书签内容获取单元116获取上述web页面的相关书签的连接目的地的web页面的内容。然后,以获得的属性AT以及相关书签的内容为目标,共同关键字相关性确定单元126测量共同关键字出现的数目,保持所测得的数值(步骤S428),并且处理前进到步骤S430。在此,在步骤S428从相关书签高速缓冲存储器单元124获得的所有书签表示与当前时间相近的若干web页面(URLs)相关联的所有相关书签。
另一方面,当确定不存在这样的缓存时(在步骤S410,否),类似于上述第二示例性实施方式中提及的处理步骤S 102到S 114(图3)的处理在步骤S412到步骤S426执行。然而,步骤S426中的处理与步骤S114部分不同,其将参考图.14在后续提到。
然后,相关书签显示器单元120指示在步骤S426被确定为有相关性的书签或者在步骤S428被作为测量对象的所有书签,以共同关键字的出现次数排序的列表(步骤S430)。例如,当以图10A到10F所示的显示形式作为示例描述,书签1、3和5在书签中按照出现次数的顺序从高到低地显示。
在此,在步骤S426执行的相关性确定处理将参考图14被描述。图14是示出了本发明第三示例性实施方式中的相关性确定过程的流程图,并指示了上述提及的图13中的步骤S426的细节。除去与在第二示例性实施方式中提及的相关性确定过程之外(图6),该流程图还包括了在步骤S312之后的步骤S501。也即,步骤S501,以在步骤S312确定的有相关性的所有书签作为目标,共同关键字相关性确定单元126测量在书签的属性AT以及内容中共同关键字的出现次数,并且保持测量值,并且过程前进到步骤S430。
根据上述提及的第三示例性实施方式,有可能从提前注册的书签中选择与当前正在被浏览的网站最适合的书签,并且将其提供给用户,正如上述提及的第二示例性实施方式所示。此外,根据该示例性实施方式,通过使用相关的书签高速缓存操作单元122以及相关的书签高速缓冲存储器单元124实现的高速缓存功能,上述的相关信息可以被高速缓存。从而,当分析浏览历史、浏览内容以及书签内容时的负荷可以减少。
同样根据上述提及的第三示例性实施方式,通过上述高速缓存功能,有可能通过浏览器导航的对应操作例如“前进”和“返回”。
<第四示例性实施方式>
接下来,基于第一和第二示例性实施方式的第四示例性实施方式将被描述。在此后的描述中,将主要描述实施方式的特征部分。在这种情况下,通过与上述示例性实施方式中的相同结构采用相同的参考号码,重复的描述将被省略。
在该示例性实施方式中,如下所述,向用户提供另一个显示形式。也就是,在该实施方式中的另一显示,当与用户当前正在浏览的web站点相关的书签被提供给用户时,以根据其与该web站点的相关程度排列的显示形式提供已注册的书签。
在下述描述中,作为示例,假设相关性等级有6级,从等级1(相关性:高)到等级6(相关性:低)。即:
等级1:其中所有关键字在书签属性AT和内容这两者中的情形;
等级2:其中书签属性AT包括部分关键字,并且内容中包括所有关键字的情形;
等级3:其中书签属性AT不包括任意关键字,并且内容中包括所有关键字的情形;
等级4:其中书签属性AT包括所有关键字,并且内容中包括部分关键字的情形;
等级5:其中书签属性AT包括部分关键字,并且内容中包括所有剩余关键字的情形;以及
等级6:其中书签属性AT包括所有关键字,并且内容中不包括关键字的情形。
在这个实施方式中,系统配置和整个处理配置几乎与上述第二示例性实施方式相同。然而,如上所述,由书签属性相关性确定单元114、书签内容获取单元116和书签内容相关性确定单元118实现的相关性确定处理的配置不同。
图15是示出了在本发明的第四示例性实施方式中的相关性确定处理的流程图,并且指示了上述图3中示出的步骤S114的详细内容。
首先,与第二示例性实施方式中的步骤S302(图6)类似,通过参考由书签信息获取单元112在步骤S112(图3)获取的书签信息,书签属性相关性确定单元114执行以包含在书签属性AT中的字符串为目标的关键词查找(步骤S602)。
根据步骤602中的确定结果,书签内容获取单元116分出执行步骤S604、步骤S612和步骤S616中任意步骤的处理的多个支路。也就是说,当书签的属性AT中包含关键词的一部分时,执行步骤S604。当书签的属性AT中不包含关键词的一部分时,执行步骤S612。当书签的属性AT中包含所有关键词时,执行步骤S616。
在步骤S604、步骤S612和步骤S616中,正如第二示例性实施方式中的步骤S304和步骤S308(图6)那样,书签内容获取单元116访问作为所涉及的书签的链路目的地的特定的网站400。由此,书签内容获取单元116经由网络300获取特定Web站点400的内容。
当虽然在步骤S616中进行了尝试但仍不能获得内容时,可以确定该特定站点400具有失效的链接。因此,书签内容相关性确定单元118确定与该网站对应的书签与当前正浏览的网站没有相关性(步骤S628)。在这种情况下,书签内容相关性确定单元118可以通过指示等向用户报告出现了失效的链接。
在另一方面,正如第二示例性实施方式中的步骤S309(图6)那样,当能够根据步骤S616中的处理获得内容时,由于当书签已经由用户注册时内容会随着时间变化,所以书签内容获取单元116在所获取的内容的字符串中查找该关键词(步骤S618)。
继而,根据步骤S618的查询结果,书签内容获取单元116分出执行步骤S620、步骤S622和步骤S624的多个支路。也就是说,当在步骤S616获取的内容中不包含关键词时,书签内容相关性确定单元118给出等级6(步骤S620)。当在步骤S616获取的内容中包含关键词的一部分时,书签内容相关性确定单元118给出等级4(步骤S624)。而且,在这三种情况下,如第二示例性实施方式中的步骤S312(图6)的情况那样,书签内容相关性确定单元118确定作为链接目的地的网站400与当前正浏览的网站有相关性(步骤S630)。
正如第二示例性实施方式中的步骤S306(图6)那样,当在步骤S604和步骤S612获取内容后,书签内容相关性确定单元118在所获取的内容中包含的字符串中查找未包含在书签的属性AT中的关键词(步骤S306和步骤S614)。
作为在步骤S614中查找的结果,当所获取的内容包含所有关键词时,书签内容相关性确定单元118给出等级3(步骤S626)。在这种情况下,书签内容相关性确定单元118确定作为链接目的地的网站400与当前正浏览的网站有相关性(步骤S630)。与此相反,当所获取的内容不包含任何关键词时,或者当所获取的内容仅包含关键词的一部分时,书签内容相关性确定单元118确定作为链接目的地的网站400与当前正浏览的网站没有相关性(步骤S628)。
进一步地,作为步骤S606中查找的结果,当未包含在书签属性AT中的关键词中只有一部分关键词或没有关键词包含在步骤S604获取的内容中时,书签内容相关性确定单元118确定作为链接目的地的特定网站400与当前正浏览的网站没有相关性。
与此相反,作为步骤S606中查找的结果,当未包含在书签属性AT中的所有余下的关键词都包含在步骤S604获取的内容中时,书签内容相关性确定单元118给出等级5(步骤S608)。当在步骤S604获取的内容中包含所有关键词时,由书签内容相关性确定单元118给出等级2(步骤S610)。在这些情况下,书签内容相关性确定单元118确定作为链接目的地的特定网站400与当前正浏览的网站有相关性(步骤S630)。
图16是示例本发明的第四示例性实施方式的相关联书签的列表屏幕的显示格式的示图。显示在图16中的该示例标示如下的状态,即,在当前正标示的网页的左侧的框中,由浏览器200的功能实体对与网页相关联的书签的列表进行标示。在这种情况下,作为相关联的书签,按照从等级1到等级3的顺序对书签1、5、3进行标示。进一步地,在这个示例中,作为与注册的内容相比可能已经变化的书签,对书签3进行标示。同样在这个示例中,作为链路可能失效的书签,对书签2进行标示。
根据上述第四示例性实施方式,如第一和第二示例性实施方式的情况那样,有可能从先前注册的书签中准确地选择与当前浏览的网站相关的最合适的书签,并将这些书签提供给用户。进一步地,根据这个示例性实施方式,因为在相关性确定处理中执行了等级确定,所以有可能根据相关程度准确地选择相关性更符合正浏览的网页的书签。并且以容易区分的方式将这些书签提供给用户。
同样根据上述第四示例性实施方式,当以容易区分的方式向用户注册了书签时,有可能报告出现失效链路以及内容随时间改变。
<第一到第四示例性实施方式的通用示例>
接下来,将参考图17描述第一到第四示例性实施方式的通用示例。将描述使用计算机(信息处理装置)实现根据上述第一到第四示例性实施方式的书签提取系统100、100A和浏览器200的情况。也就是说,虽然可能由专门的硬件实现根据第一到第四示例性实施方式的装置,但是还可以如本示例的情况那样,由计算机中的计算机程序(软件)作为硬件资源来实现该装置。
图17是示例性描述能够实现本发明的第一到第四示例性实施方式的计算机(信息处理装置)的硬件配置的示图。图17中显示的计算机1000的硬件包括:CPU 11(中央处理单元)、显示器12和通信接口(I/F)13、ROM(只读存储器)17、RAM(随机接入存储器)15和硬盘驱动器(HD)16,并且具有经由总线17将这些硬件相连接的结构。在上述示例性实施方式中的每一个中,通信接口13是实现经由网络300与图2和图12所示的网站进行通信的通用通信装置。在这种硬件配置中,CPU11控制至少作为书签提取系统100(100A)的计算机1000的通用操作。
在将能够实现描述中提及的流程图(图3到图6以及图13到图15)的功能的计算机程序提供给图17中示出的计算机1000之后,通过将计算机程序读入计算机1000的CPU 11中并执行该计算机程序,实现了以上述第一到第四示例性实施方式为示例的本发明。提供给计算机1000中的计算机程序可以存储在存储设备(存储介质)中,例如临时存储存储器(15)或能够被读写的硬盘设备(16)。
此处,在上述每个示例性实施方式的情况下,与每个上述流程图相关联的计算机程序分别表示浏览历史获取单元102、浏览历史分析单元104、浏览内容获取单元108、浏览内容分析单元110、书签信息获取单元112、书签属性相关性确定单元114、书签内容获取单元116、属性内容相关性确定单元118、相关联书签显示单元120、相关联书签高速缓存操作单元122以及公共关键词相关性确定单元126。这种计算机程序例如与存储在硬盘驱动器(HD)16中的程序21相对应。
浏览器200中的浏览器历史存储单元202、浏览内容存储单元204以及书签存储单元206可以例如作为各种存储信息22存储在硬盘驱动器16中。同样,书签提取系统100、100A中的查找站点信息存储单元106以及相关联书签高速缓存单元124可以例如作为各种存储信息22存储在硬盘驱动器16中。根据程序21的执行对存储信息22进行更新。
在上述情况下,作为将计算机程序提供给计算机的方法,可以采用诸如经由各种记录介质(例如CD-ROM)将计算机程序安装在计算机中以及经由通信线路(例如互联网)从外部下载计算机程序的方法之类的、当前通用的步骤。在这种情况下,可以识别出本发明由计算机程序(程序21)代码或由存储这些代码的存储介质来配置。
如上所述,根据上述每个示例性实施方式及其示例,有可能从先前注册的书签中准确地选择与当前正浏览的网站相关联的最合适的书签,并且将这些书签提供给用户。
同时,还可以将上述示例性实施方式以及它们的部分或全部修改描述为以下附加内容的形式。然而,通过示例性实施方式示例性地描述的本发明以及上述修改不限于以下内容。
(附加1).一种书签提取装置,包括:
关键字提取装置,用于基于web站点至今的浏览历史信息提取关键字;以及
提供单元,用于基于所述关键字,从多个注册的书签中提供与所述关键字提取单元提取的所述关键字相关的书签。
(附加2).根据附加1所述的书签提取装置,其中
基于在所述浏览历史信息中包括的、关于当前正在浏览的web站点的信息,所述关键字提取单元获取所述当前浏览的web站点的内容,并且从所述内容中提取所述关键字。
(附加3).根据附加2所述的书签提取装置,其中
所述关键字提取单元包括重要关键字提取单元,用于提取在从所述当前浏览的web站点获取的所述内容中包括的重要关键字作为所述关键字,并且其中
所述提供单元基于所述重要关键字,从所述多个书签中提供与所述重要关键字相关的书签。
(附加4).根据附加3所述的书签提取装置,其中
所述重要关键字提取单元根据在所述内容中出现的频率确定所述重要关键字。
(附加5).根据附加1所述的书签提取装置,其中,
通过分析所述浏览历史信息,当当前正在浏览的web站点被确定为已经从搜索站点进行了转变时,所述关键字提取单元提取在到所述当前浏览的web站点的所述转变之前已经使用的搜索关键字作为所述关键字,并且其中
所述提供单元基于所述搜索关键字,从所述多个书签中提供与所述搜索关键字相关的书签。
(附加6).根据附加5所述的书签提取装置,其中,
当恰好到所述当前浏览的web站点的所述转变之前已经被浏览的web站点是搜索站点时,所述关键字提取单元提取已经在所述搜索站点中使用的搜索关键字作为所述关键字。
(附加7).根据附加1至6之任一所述的书签提取装置,其中
所述提供单元包括相关性确定单元,用于根据在每个书签的所述属性信息中所述关键字被包括的程度,确定在所述关键字和在关于所述多个书签的信息中包括的书签中的所述每个书签之间的相关性的存在。
(附加8).根据附加1至6之任一所述的书签提取装置,其中
所述提供单元包括相关性确定单元,用于根据与关注的所述书签链接的web站点的所述内容中的所述关键字被包括的程度,确定在所述关键字和所述每个书签之间相关性的存在。
(附加9).根据附加1至6之任一所述的书签提取装置,其中
所述提供单元包括相关性确定单元,用于根据在所述每个书签的所述属性信息中的所述关键字被包括的程度以及与关注的所述书签链接的web站点的所述内容中的所述关键字被包括的程度的组合,确定在所述关键字和所述每个书签之间相关性的存在。
(附加10).根据附加7至9之任一所述的书签提取装置,其中
所述提供单源以排序的方式,提供已经由所述相关性确定单元确定为具有相关性的多个书签。
(附加11).根据附加7所述的书签提取装置,其中,
基于所述相关性确定单元确定的结果,所述提供单元提供给用户与来自所述书签注册的时间的所述书签对应的web站点的内容改变的可能性的信息,或者到所述web站点的链接失效的信息。
(附加12).一种书签提取方法,包括:
基于web站点至今的浏览历史信息提取关键字;以及
基于所述关键字,从多个提前注册的书签中提供与所述提取的关键字相关的书签。
(附加13).根据附加12所述的书签提取方法,其中,
当提取所述关键字时,基于在所述浏览历史信息中包括的、关于当前浏览的web站点的信息,获取所述当前浏览的web站点的内容,从所述内容中提取所述关键字。
(附加14).根据附加11所述的书签提取方法,其中,
当提取所述关键字时,作为分析所述浏览历史信息的结果,在当前浏览的web站点被确定为已经从搜索站点进行了转变的情况下,提取在到所述当前浏览的web站点的所述转变之前已经使用的搜索关键字作为所述关键字,并且其中
基于所述搜索关键字,从所述多个书签中提供与所述搜索关键字相关的书签。
(附加15).根据附加14所述的书签提取方法,其中,
当提取所述关键字时,在恰好到所述当前浏览的web站点的所述转变之前已经被浏览的web站点是搜索站点的情况下,提取已经在所述搜索站点中使用的搜索关键字作为所述关键字。
(附加16).一种用于控制书签提取装置的操作的计算机程序,所述计算机程序使得计算机实现:
关键字提取功能,用于基于web站点至今的浏览历史信息提取关键字;以及
提供功能,用于基于所述关键字,从多个注册的书签中提供与所述关键字提取功能所提取的所述关键字相关的书签。
(附加17).根据附加16所述的计算机程序,其中,
基于在所述浏览历史信息中包括的、关于当前浏览的web站点的信息,所述关键字提取功能获取所述当前浏览的web站点的内容,并且从所述内容中提取所述关键字。
(附加18).根据附加16所述的计算机程序,其中,
作为分析所述浏览历史信息的结果,当当前浏览的web站点被确定为已经从搜索站点进行了转变时,所述关键字提取功能提取在到所述当前浏览的web站点的所述转变之前已经使用的搜索关键字作为所述关键字,并且其中
所述提供功能基于所述搜索关键字,从所述多个书签中提供与所述搜索关键字相关的书签。
(附加19).根据附加18所述的计算机程序,其中,
当恰好到所述当前浏览的web站点的所述转变之前浏览的web站点是搜索站点的情况下,所述关键字提取功能提取已经在所述搜索站点中使用的搜索关键字作为所述关键字。
提供上文描述的实施方式以使得本领域技术人员进行和使用本发明。此外,对这些示例性实施方式的各种变型对本领域技术人员来说是明显的,并且在此定义的普通原理和具体示例可以应用到其他实施方式中,而不偏离发明的实质。因而,本发明并不旨在限制于在此描述的示例性实施方式,而是与权利要求及其等同物的限制所定义的最宽范围一致。
进而,注意发明人的意图是即使在诉讼期间修改权利要求,也保留所有所要求的发明的等同物。

Claims (20)

1.一种书签提取装置,包括:
关键字提取装置,用于基于web站点至今的浏览历史信息提取关键字;以及
提供单元,用于基于所述关键字,从多个注册的书签中提供与所述关键字提取单元提取的所述关键字相关的书签。
2.根据权利要求1所述的书签提取装置,其中
基于在所述浏览历史信息中包括的、关于当前正在浏览的web站点的信息,所述关键字提取单元获取所述当前浏览的web站点的内容,并且从所述内容中提取所述关键字。
3.根据权利要求2所述的书签提取装置,其中
所述关键字提取单元包括重要关键字提取单元,用于提取在从所述当前浏览的web站点获取的所述内容中包括的重要关键字作为所述关键字,并且其中
所述提供单元基于所述重要关键字,从所述多个书签中提供与所述重要关键字相关的书签。
4.根据权利要求3所述的书签提取装置,其中
所述重要关键字提取单元根据在所述内容中出现的频率确定所述重要关键字。
5.根据权利要求1所述的书签提取装置,其中,
通过分析所述浏览历史信息,当当前正在浏览的web站点被确定为已经从搜索站点进行了转变时,所述关键字提取单元提取在到所述当前浏览的web站点的所述转变之前已经使用的搜索关键字作为所述关键字,并且其中
所述提供单元基于所述搜索关键字,从所述多个书签中提供与所述搜索关键字相关的书签。
6.根据权利要求5所述的书签提取装置,其中,
当恰好到所述当前浏览的web站点的所述转变之前已经被浏览的web站点是搜索站点时,所述关键字提取单元提取已经在所述搜索站点中使用的搜索关键字作为所述关键字。
7.根据权利要求1所述的书签提取装置,其中
所述提供单元包括相关性确定单元,用于根据在每个书签的所述属性信息中所述关键字被包括的程度,确定在所述关键字和在关于所述多个书签的信息中包括的书签中的所述每个书签之间的相关性的存在。
8.根据权利要求1所述的书签提取装置,其中
所述提供单元包括相关性确定单元,用于根据与关注的所述书签链接的web站点的所述内容中的所述关键字被包括的程度,确定在所述关键字和所述每个书签之间相关性的存在。
9.根据权利要求1所述的书签提取装置,其中
所述提供单元包括相关性确定单元,用于根据在所述每个书签的所述属性信息中的所述关键字被包括的程度以及与关注的所述书签链接的web站点的所述内容中的所述关键字被包括的程度的组合,确定在所述关键字和所述每个书签之间相关性的存在。
10.根据权利要求7所述的书签提取装置,其中
所述提供单源以排序的方式,提供已经由所述相关性确定单元确定为具有相关性的多个书签。
11.根据权利要求7所述的书签提取装置,其中,
基于所述相关性确定单元确定的结果,所述提供单元提供给用户与来自所述书签注册的时间的所述书签对应的web站点的内容改变的可能性的信息,或者到所述web站点的链接失效的信息。
12.一种书签提取方法,包括:
基于web站点至今的浏览历史信息提取关键字;以及
基于所述关键字,从多个提前注册的书签中提供与所述提取的关键字相关的书签。
13.根据权利要求12所述的书签提取方法,其中,
当提取所述关键字时,基于在所述浏览历史信息中包括的、关于当前浏览的web站点的信息,获取所述当前浏览的web站点的内容,从所述内容中提取所述关键字。
14.根据权利要求11所述的书签提取方法,其中,
当提取所述关键字时,作为分析所述浏览历史信息的结果,在当前浏览的web站点被确定为已经从搜索站点进行了转变的情况下,提取在到所述当前浏览的web站点的所述转变之前已经使用的搜索关键字作为所述关键字,并且其中
基于所述搜索关键字,从所述多个书签中提供与所述搜索关键字相关的书签。
15.根据权利要求14所述的书签提取方法,其中,
当提取所述关键字时,在恰好到所述当前浏览的web站点的所述转变之前已经被浏览的web站点是搜索站点的情况下,提取已经在所述搜索站点中使用的搜索关键字作为所述关键字。
16.一种用于控制书签提取装置的操作的计算机程序,所述计算机程序使得计算机实现:
关键字提取功能,用于基于web站点至今的浏览历史信息提取关键字;以及
提供功能,用于基于所述关键字,从多个注册的书签中提供与所述关键字提取功能所提取的所述关键字相关的书签。
17.根据权利要求16所述的计算机程序,其中,
基于在所述浏览历史信息中包括的、关于当前浏览的web站点的信息,所述关键字提取功能获取所述当前浏览的web站点的内容,并且从所述内容中提取所述关键字。
18.根据权利要求16所述的计算机程序,其中,
作为分析所述浏览历史信息的结果,当当前浏览的web站点被确定为已经从搜索站点进行了转变时,所述关键字提取功能提取在到所述当前浏览的web站点的所述转变之前已经使用的搜索关键字作为所述关键字,并且其中
所述提供功能基于所述搜索关键字,从所述多个书签中提供与所述搜索关键字相关的书签。
19.根据权利要求18所述的计算机程序,其中,
当恰好到所述当前浏览的web站点的所述转变之前浏览的web站点是搜索站点的情况下,所述关键字提取功能提取已经在所述搜索站点中使用的搜索关键字作为所述关键字。
20.一种书签提取装置,包括:
关键字提取装置,用于基于web站点至今的浏览历史信息提取关键字;以及
提供装置,用于基于所述关键字,从多个注册的书签中提供与由所述提取装置提取的所述关键字相关的书签。
CN201110424241.5A 2010-12-14 2011-12-13 书签提取装置及方法 Expired - Fee Related CN102662940B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010278012 2010-12-14
JP2010-278012 2010-12-14

Publications (2)

Publication Number Publication Date
CN102662940A true CN102662940A (zh) 2012-09-12
CN102662940B CN102662940B (zh) 2016-03-09

Family

ID=46200417

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110424241.5A Expired - Fee Related CN102662940B (zh) 2010-12-14 2011-12-13 书签提取装置及方法

Country Status (3)

Country Link
US (1) US8645315B2 (zh)
JP (1) JP5891759B2 (zh)
CN (1) CN102662940B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104704495A (zh) * 2014-04-10 2015-06-10 华为终端有限公司 一种信息搜索的方法以及装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5828085B2 (ja) * 2011-12-26 2015-12-02 パナソニックIpマネジメント株式会社 ウェブブラウザ制御装置、ウェブブラウザ制御方法及びテレビジョン受像機
CN102663135B (zh) * 2012-05-03 2014-06-11 中兴通讯股份有限公司 用于嵌入式浏览器的图形化书签实现方法、装置及终端
US20140108901A1 (en) * 2012-10-17 2014-04-17 International Business Machines Corporation Web Browser Bookmark Reconciliation
US20180097137A1 (en) * 2016-10-05 2018-04-05 International Business Machines Corporation High voltage photovoltaics
KR102120749B1 (ko) * 2018-05-17 2020-06-17 주식회사 머니브레인 대화 이해 ai 시스템에 의하여, 키워드 기반 북마크 검색 서비스 제공을 위하여 북마크 정보를 저장하는 방법 및 컴퓨터 판독가능 기록 매체
KR102214990B1 (ko) * 2018-11-26 2021-02-15 김준 북마크관리 및 정보검색 서비스 제공시스템 및 이를 이용한 북마크관리 및 정보검색 서비스 제공방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6212522B1 (en) * 1998-05-15 2001-04-03 International Business Machines Corporation Searching and conditionally serving bookmark sets based on keywords
US6321228B1 (en) * 1999-08-31 2001-11-20 Powercast Media, Inc. Internet search system for retrieving selected results from a previous search
CN1418344A (zh) * 2000-12-06 2003-05-14 索尼公司 信息处理装置
US20040205501A1 (en) * 2001-11-29 2004-10-14 International Business Machines Corporation Apparatus and method of highlighting categorized web pages on a web server
CN1645366A (zh) * 2003-12-30 2005-07-27 微软公司 基于文章历史进行文本广告分配

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004070441A (ja) 2002-08-01 2004-03-04 Fujitsu Ltd ブックマーク設定方法及び装置
JP2007226501A (ja) * 2006-02-23 2007-09-06 Nippon Telegr & Teleph Corp <Ntt> Webページ関連履歴の提示方法および装置
JP4624956B2 (ja) 2006-04-28 2011-02-02 日本電信電話株式会社 情報提供方法およびシステム、プログラム
US20090063265A1 (en) * 2007-09-04 2009-03-05 Yahoo! Inc. Information network for text ads
GB2473155A (en) * 2008-05-26 2011-03-02 Kenshoo Ltd A system for finding website invitation cueing keywords and for attribute-based generation of invitation-cueing instructions
US8738623B2 (en) * 2010-05-21 2014-05-27 Benjamin Henry Woodard Global reverse lookup public opinion directory

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6212522B1 (en) * 1998-05-15 2001-04-03 International Business Machines Corporation Searching and conditionally serving bookmark sets based on keywords
US6321228B1 (en) * 1999-08-31 2001-11-20 Powercast Media, Inc. Internet search system for retrieving selected results from a previous search
CN1418344A (zh) * 2000-12-06 2003-05-14 索尼公司 信息处理装置
US20040205501A1 (en) * 2001-11-29 2004-10-14 International Business Machines Corporation Apparatus and method of highlighting categorized web pages on a web server
CN1645366A (zh) * 2003-12-30 2005-07-27 微软公司 基于文章历史进行文本广告分配

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104704495A (zh) * 2014-04-10 2015-06-10 华为终端有限公司 一种信息搜索的方法以及装置
WO2015154270A1 (zh) * 2014-04-10 2015-10-15 华为终端有限公司 一种信息搜索的方法以及装置
CN104704495B (zh) * 2014-04-10 2018-02-23 华为终端(东莞)有限公司 一种信息搜索的方法以及装置
US10095791B2 (en) 2014-04-10 2018-10-09 Huawei Devices (Dongguan) Co., Ltd. Information search method and apparatus

Also Published As

Publication number Publication date
JP5891759B2 (ja) 2016-03-23
JP2012141963A (ja) 2012-07-26
US8645315B2 (en) 2014-02-04
US20120150857A1 (en) 2012-06-14
CN102662940B (zh) 2016-03-09

Similar Documents

Publication Publication Date Title
Amos et al. Privacy policies over time: Curation and analysis of a million-document dataset
Kopanos et al. VarSome: the human genomic variant search engine
Arndt et al. PHAST, PHASTER and PHASTEST: tools for finding prophage in bacterial genomes
CN102662940A (zh) 书签提取装置、方法以及计算机产品
CN100462972C (zh) 基于文档的信息和统一资源定位符管理方法和设备
US9742723B2 (en) Internet profile service
JP4637969B1 (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
CN102609474B (zh) 一种访问信息提供方法及系统
US8645364B2 (en) Providing definitions that are sensitive to the context of a text
CN101154224B (zh) 一种网址导航方法及系统
CN102722498B (zh) 搜索引擎及其实现方法
US20140074881A1 (en) Tenantization of search result ranking
US20140026082A1 (en) Method and system for predictive browsing
US20110258198A1 (en) Using behavior data to quickly improve search ranking
CN102446255B (zh) 一种检测页面篡改的方法及装置
CN102054015A (zh) 使用有机物件数据模型来组织社群智能信息的系统及方法
JP2009080624A (ja) 情報表示装置、方法及びプログラム
US20200026759A1 (en) Artificial intelligence engine for generating semantic directions for websites for automated entity targeting to mapped identities
US20130159828A1 (en) Method and Apparatus for Building Sales Tools by Mining Data from Websites
JP2023533475A (ja) キーワード推薦のための人工知能
CN103210387A (zh) 关联词登记装置、信息处理装置、关联词登记方法、关联词登记装置用程序、记录介质以及关联词登记系统
CN110032616A (zh) 一种文档阅读情况的采集方法及装置
JP5739500B2 (ja) ウェブ文書履歴情報提供方法およびシステム
CN108280102A (zh) 上网行为记录方法、装置及用户终端
CA2757833C (en) Domain status, purpose and categories

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160309

Termination date: 20181213

CF01 Termination of patent right due to non-payment of annual fee