CN103210387B - 关联词登记装置、信息处理装置、关联词登记方法以及关联词登记系统 - Google Patents

关联词登记装置、信息处理装置、关联词登记方法以及关联词登记系统 Download PDF

Info

Publication number
CN103210387B
CN103210387B CN201180053967.0A CN201180053967A CN103210387B CN 103210387 B CN103210387 B CN 103210387B CN 201180053967 A CN201180053967 A CN 201180053967A CN 103210387 B CN103210387 B CN 103210387B
Authority
CN
China
Prior art keywords
retrieval
inquisition
conjunctive word
moment
determines
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180053967.0A
Other languages
English (en)
Other versions
CN103210387A (zh
Inventor
平手勇宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lotte Group Co.,Ltd.
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Publication of CN103210387A publication Critical patent/CN103210387A/zh
Application granted granted Critical
Publication of CN103210387B publication Critical patent/CN103210387B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

取得包含用户输入的检索字的检索查询(S4),将取得的检索查询与用户识别信息和检索查询的取得时刻对应地存储在检索查询记录DB(12a)中(S5),在检测到规定用户操作的情况下,提取与该用户的用户识别信息对应的检索查询(S6),从提取出的检索查询中确定第1检索查询(S7),从提取出的检索查询中确定取得时刻在第1检索查询的取得时刻之前的第2检索查询(S8、S9),在关联词DB(12b)中登记第1检索查询的检索字和第2检索查询的检索字作为关联词(S10)。

Description

关联词登记装置、信息处理装置、关联词登记方法以及关联词 登记系统
技术领域
本发明涉及登记检索关键字作为关联词的关联词登记装置、信息处理装置、关联词登记方法、关联词登记装置用程序、记录介质以及关联词登记系统的技术领域。
背景技术
在信息检索系统、自然语言处理系统、机械翻译系统等中,为了补充检索关键字并提高翻译等的精度,利用同义词辞典这样集中了关联性较高的单词的单词数据库。研究了自动生成该关联性较高的单词并用于检索等的各种装置。例如,在专利文献1中公开了如下的关键字检索装置:取得输入关键字的字符串,取出包含关键字的备注,进行词素分析处理,仅从单词中提取名词,按照每个单词对日语文章进行分割并与词类一起取出,生成按照使用次数从多到少的顺序整理所取出的单词的单词柱状图,确保使用次数较多的单词作为关联关键字,根据该关联关键字再次检索备注。
现有技术文献
专利文献
专利文献1:日本特开2001-290840号公报
发明内容
发明要解决的课题
但是,在专利文献1所记载的技术中,存储检索关键字和检索结果的页的备注中的使用次数较多的特征字作为关联词,所以,没有考虑在得到该检索结果的过程中途输入的检索关键字(未完成的检索关键字)。因此,即使使用该关联词,用户也无法快速找到目标检索对象,有时用户放弃检索行为,作为关联词的精度不一定很高。
本发明是鉴于这种问题而完成的,其课题的一例的目的在于,提供能够登记高精度的关联词的关联词登记装置等。
用于解决课题的手段
为了解决上述课题,第1方面所记载的发明是一种关联词登记装置,其具有:检索查询取得单元,其取得检索查询,该检索查询包含用户输入的检索字;检索查询存储单元,其与用户识别信息和所述检索查询的取得时刻对应地存储所述取得的检索查询;检索查询提取单元,在检测到规定用户操作的情况下,该检索查询提取单元提取与该用户的所述用户识别信息对应的检索查询;第1检索查询确定单元,其从所述提取出的检索查询中确定第1检索查询;第2检索查询确定单元,其从所述提取出的检索查询中确定第2检索查询,该第2检索查询的取得时刻在所述第1检索查询的取得时刻之前;以及关联词登记单元,其在关联词数据库中登记所述第1检索查询的检索字和所述第2检索查询的检索字作为关联词。
第2方面所记载的发明的特征在于,在第1方面所记载的关联词登记装置中,所述第2检索查询确定单元确定如下的检索查询,作为第2检索查询,该检索查询在所述提取出的检索查询中,并且取得时刻在所述第1检索查询的取得时刻之前且具有基于所述取得时刻的连续性。
第3方面所记载的发明的特征在于,在第2方面所记载的关联词登记装置中,所述第2检索查询确定单元确定如下的检索查询,作为第2检索查询,该检索查询的取得时刻在从第1检索查询的取得时刻起的第1规定时间内。
第4方面所记载的发明的特征在于,在第2或3方面所记载的关联词登记装置中,所述第2检索查询确定单元确定如下的检索查询,作为第2检索查询,该检索查询在所述提取出的检索查询中,且相互的取得时刻的间隔在第2规定时间内。
第5方面所记载的发明的特征在于,在第3或4方面所记载的关联词登记装置中,所述关联词登记装置还具有规定时间设定单元,该规定时间设定单元设定所述第1规定时间或所述第2规定时间。
第6方面所记载的发明的特征在于,在第5方面所记载的关联词登记装置中,规定时间设定单元根据由所述关联词登记单元登记的关联词的登记数,设定所述第1规定时间或所述第2规定时间。
第7方面所记载的发明的特征在于,在第5方面所记载的关联词登记装置中,规定时间设定单元根据所述规定用户操作计算操作时间,根据该操作时间设定所述第1规定时间或所述第2规定时间。
第8方面所记载的发明的特征在于,在第2~7方面中的任意一个方面所记载的关联词登记装置中,所述检索查询取得单元在检索中,与所述检索查询一起取得类别信息,所述第2检索查询确定单元确定如下的检索查询,作为第2检索查询,该检索查询为,所述类别信息一致,并且取得时刻在所述第1检索查询之前且具有基于所述取得时刻的连续性。
第9方面所记载的发明的特征在于,在第2~8方面中的任意一个方面所记载的关联词登记装置中,所述第2检索查询确定单元确定如下的检索查询,作为第2检索查询,该检索查询为,取得时刻在所述第1检索查询的取得时刻之前,且具有基于所述取得时刻的连续性,并且,检索结果数为规定值以下。
第10方面所记载的发明的特征在于,在第1~9方面中的任意一个方面所记载的关联词登记装置中,所述关联词登记装置还具有商品手续单元,该商品手续单元进行与商品有关的手续处理,作为所述规定用户操作,在检测到该用户的与所述商品有关的结算手续的情况下,所述检索查询提取单元提取与所述用户识别信息对应的检索查询。
第11方面所记载的发明的特征在于,在第1~10方面中的任意一个方面所记载的关联词登记装置中,所述关联词登记装置还具有动态图像再现特性值计算单元,该动态图像再现特性值计算单元检测动态图像的再现信息作为所述规定用户操作,根据该再现信息计算动态图像再现特性值,在所述动态图像再现特性值为阈值以上的情况下,所述检索查询提取单元提取与所述用户识别信息对应的检索查询。
第12方面所记载的发明的特征在于,在第1~11方面中的任意一个方面所记载的关联词登记装置中,在基于所述检索查询的检索结果中包含的链接信息中,通过所述规定用户操作而被点击的链接信息的数量为规定数以上的情况下,提取与所述用户识别信息对应的检索查询。
第13方面所记载的发明的特征在于,在第1~12方面中的任意一个方面所记载的关联词登记装置中,所述第1检索查询确定单元确定如下的检索查询,作为第1检索查询,该检索查询的取得时刻最接近检测到所述用户操作的时刻。
第14方面所记载的发明的特征在于,在第1~13方面中的任意一个方面所记载的关联词登记装置中,所述第1检索查询确定单元确定如下的检索查询,作为第1检索查询,该检索查询在提取出的检索查询中,且取得时刻最晚。
第15方面所记载的发明是一种关联词登记装置,其具有:检索查询取得单元,其取得检索查询,该检索查询包含用户输入的检索字;检索查询存储单元,其与用户识别信息和所述检索查询的取得时刻对应地存储所述取得的检索查询;检索查询提取单元,在检测到规定用户操作的情况下,该检索查询提取单元提取与该用户的用户识别信息对应的检索查询;第1检索查询确定单元,其从所述提取出的检索查询中确定第1检索查询;第2检索查询确定单元,其从所述提取出的检索查询中确定与所述第1检索查询不同的检索查询,作为第2检索查询;以及关联词登记单元,其在关联词登记数据库中登记所述第1检索查询的检索字和所述第2检索查询的检索字作为关联词。
第16方面所记载的发明的特征在于,在第15方面所记载的关联词登记装置中,在检测到规定用户操作的情况下,所述检索查询提取单元提取如下的检索查询,该检索查询与该用户的用户识别信息对应,且具有基于所述取得时刻的连续性。
第17方面所记载的发明的特征在于,在第16方面所记载的关联词登记装置中,作为具有基于所述取得时刻的连续性的检索查询,在由所述检索查询存储单元存储的检索查询中,所述检索查询提取单元提取如下的检索查询,该检索查询是从所述取得时刻最晚的检索查询的取得时刻起的第1规定时间内取得的。
第18方面所记载的发明的特征在于,在第15或16方面所记载的关联词登记装置中,作为具有基于所述取得时刻的连续性的检索查询,所述检索查询提取单元提取相互的取得时刻的间隔在第2规定时间内的检索查询。
第19方面所记载的发明的特征在于,在第15~18方面中的任意一个方面所记载的关联词登记装置中,所述检索查询取得单元在检索中,与所述检索查询一起取得类别信息,所述检索查询提取单元提取如下的检索查询,该检索查询为,所述类别信息一致,并且与所述用户的识别信息对应且具有基于所述取得时刻的连续性。
第20方面所记载的发明的特征在于,在第15~19方面中的任意一个方面所记载的关联词登记装置中,所述检索查询提取单元提取如下的检索查询,该检索查询为,与所述用户的识别信息对应,且具有基于所述取得时刻的连续性,并且检索结果数为规定值以下。
第21方面所记载的发明是一种信息处理装置,其参照第1~20方面中的任意一个方面所记载的关联词登记装置的关联词数据库进行信息处理,其特征在于,该信息 处理装置具有:关联词提取单元,其参照所述关联词数据库,提取与所述接收到的检索查询的检索字对应的关联词;以及关联词输出单元,其输出由所述关联词提取单元提取出的关联词。
第22方面所记载的发明是一种关联词登记装置的关联词登记方法,该关联词登记装置登记关联词,该关联词登记方法包括:检索查询取得步骤,取得检索查询,该检索查询包含用户输入的检索字;检索查询存储步骤,与用户识别信息和所述检索查询的取得时刻对应地存储所述取得的检索查询;检索查询提取步骤,在检测到规定用户操作的情况下,提取与该用户的所述用户识别信息对应的检索查询;第1检索查询确定步骤,从所述提取出的检索查询中确定第1检索查询;第2检索查询确定步骤,从所述提取出的检索查询中确定第2检索查询,该第2检索查询的取得时刻在所述第1检索查询的取得时刻之前;以及关联词登记步骤,在关联词数据库中登记所述第1检索查询的检索字和所述第2检索查询的检索字作为关联词。
第23方面所记载的发明是一种关联词登记装置用程序,其使计算机作为以下单元进行工作:检索查询取得单元,其取得检索查询,该检索查询包含用户输入的检索字;检索查询存储单元,其与用户识别信息和所述检索查询的取得时刻对应地存储所述取得的检索查询;检索查询提取单元,在检测到规定用户操作的情况下,该检索查询提取单元提取与该用户的所述用户识别信息对应的检索查询;第1检索查询确定单元,其从所述提取出的检索查询中确定第1检索查询;第2检索查询确定单元,其从所述提取出的检索查询中确定第2检索查询,该第2检索查询的取得时刻在所述第1检索查询的取得时刻之前;以及关联词登记单元,其在关联词数据库中登记所述第1检索查询的检索字和所述第2检索查询的检索字作为关联词。
第24方面所记载的发明是一种计算机可读取的记录介质,其记录了使计算机作为以下单元进行工作的关联词登记装置用程序:检索查询取得单元,其取得检索查询,该检索查询包含用户输入的检索字;检索查询存储单元,其与用户识别信息和所述检索查询的取得时刻对应地存储所述取得的检索查询;检索查询提取单元,在检测到规定用户操作的情况下,该检索查询提取单元提取与该用户的所述用户识别信息对应的检索查询;第1检索查询确定单元,其从所述提取出的检索查询中确定第1检索查询;第2检索查询确定单元,其从所述提取出的检索查询中确定第2检索查询,该第2检索查询的取得时刻在所述第1检索查询的取得时刻之前;以及关联词登记单元,其 在关联词数据库中登记所述第1检索查询的检索字和所述第2检索查询的检索字作为关联词。
第25方面所记载的发明是一种关联词登记系统,其具有终端、关联词登记装置以及关联词数据库,其中,该关联词登记装置经由网络与所述终端连接,接收来自所述终端的关联词,该关联词数据库登记有所述关联词,其特征在于,所述终端具有:检索查询取得单元,其取得用户输入的检索字的检索查询;检索查询存储单元,其与用户识别信息和所述检索查询的取得时刻对应地存储所述取得的检索查询;检索查询提取单元,在检测到规定用户操作的情况下,该检索查询提取单元提取与该用户的所述用户识别信息对应的检索查询;第1检索查询确定单元,其从所述提取出的检索查询中确定第1检索查询;第2检索查询确定单元,其从所述提取出的检索查询中确定第2检索查询,该第2检索查询的取得时刻在所述第1检索查询的取得时刻之前;以及关联词发送单元,其将所述第1检索查询的检索字和所述第2检索查询的检索字作为登记用的关联词而发送到所述关联词登记装置,所述关联词登记装置具有关联词登记单元,该关联词登记单元在所述关联词数据库中登记所述接收到的第1检索查询的检索字和所述第2检索查询的检索字作为关联词。
发明效果
根据本发明,取得包含用户输入的检索字的检索查询,与用户识别信息和检索查询的取得时刻对应地存储取得的检索查询,在检测到规定用户操作的情况下,提取与该用户的用户识别信息对应的检索查询,从提取出的检索查询中确定第1检索查询,从提取出的检索查询中确定取得时刻在第1检索查询的取得时刻之前的第2检索查询,在关联词数据库中登记第1检索查询的检索字和第2检索查询的检索字作为关联词,由此,以规定用户操作为契机,从用户识别信息对应的检索查询中,登记时间前后的检索查询中包含的检索字作为关联词,所以,能够担保用户的关联性,能够登记接近用户的操作时间的第1检索查询中包含的检索字和第2检索查询中包含的检索字,作为高精度的关联词。
附图说明
图1是示出本发明的一个实施方式的关联词登记系统的概要结构例的示意图。
图2是示出图1的关联词登记服务器的概要结构的一例的框图。
图3是示出图1的信息提供服务器的概要结构的一例的框图。
图4是示出图1的终端的概要结构的一例的框图。
图5是示出图1的终端中显示的网页的一例的示意图。
图6是示出图1的关联词登记服务器的动作例的流程图。
图7是示出图1的终端中显示的网页的一例的示意图。
图8是示出图1的终端中显示的网页的一例的示意图。
图9是示出图1的终端中显示的网页的一例的示意图。
图10是示出图1的终端中显示的网页的一例的示意图。
图11是示出用户操作检测时与检索查询的取得时间的关系的一例的示意图。
图12是示出图1的关联词登记服务器的动作的变形例的流程图。
图13是示出用户操作检测时与检索查询的取得时间的关系的一例的示意图。
图14是示出用户操作检测时与检索查询的取得时间的关系的一例的示意图。
图15是示出用户操作检测时与检索查询的取得时间的关系的一例的示意图。
图16是示出用户操作检测时与检索查询的取得时间的关系的一例的示意图。
图17是示出用户操作检测时与检索查询的取得时间的关系的一例的示意图。
图18是示出图1的关联词登记服务器的动作的另一变形例的流程图。
图19是示出根据HTML文档生成的DOM树的一例的示意图。
图20是示出特征字用数据库中记录的内容信息的内容的一例的示意图。
图21是示出特征字提取的子进程的流程图。
具体实施方式
下面,参照附图对本发明的实施方式进行说明。另外,以下说明的实施方式是针对关联词登记系统应用本发明的情况下的实施方式。
[1.关联词登记系统的结构和功能概要]
首先,使用图1对本发明的一个实施方式的关联词登记系统的结构和概要功能进行说明。
图1是示出本实施方式的关联词登记系统1的概要结构例的示意图。
如图1所示,关联词登记系统1具有:关联词登记服务器10(关联词登记装置的一例),其登记关联词;信息提供服务器20,其为了实现用户利用的作为信息提供 网站的一例的购物网站运营而设置,用于对用户提供关联词登记服务器10中登记的信息和商品的信息;以及终端30,其供用户在信息提供服务器20中进行商品等的检索。
关联词登记服务器10和信息提供服务器20通过局域网等连接,能够相互收发数据,构成服务器系统5。而且,服务器系统5和终端30通过网络3连接,能够根据通信协议(例如TCP/IP)收发数据。另外,网络3例如通过因特网、专用通信线路(例如CATV(CommunityAntenna Television)线路)、移动通信网(包含基站等)以及网关等构建。
并且,关联词登记服务器10根据终端30等中的用户的检索行动等构建关联词的数据库,支援终端30等中的用户的检索行动。
信息提供服务器20从终端30接收检索查询并进行检索,对终端30发送检索结果。并且,为了构建关联词的数据库,信息提供服务器20对关联词登记服务器10发送所接收到的检索查询。并且,信息提供服务器20作为购物网站,进行商品的检索、商品信息的提供、广告信息的提供和商品的购入手续等。
用户的终端30存在多个。
[2.各服务器的结构和功能]
(2.1关联词登记服务器10的结构和功能)
接着,使用图2对关联词登记服务器10的结构和功能进行说明。
图2是示出关联词登记服务器10的概要结构的一例的框图。
如图2所示,作为计算机进行工作的关联词登记服务器10具有通信部11、存储部12、输入输出接口部13、系统控制部14。而且,系统控制部14和输入输出接口部13经由系统总线15而连接。
通信部11与网络3连接,对与终端30等的通信状态进行控制,进而,与局域网连接,与局域网上的信息提供服务器20等的其他服务器进行数据收发。
存储部12例如由硬盘驱动等构成,存储操作系统和服务器程序等的各种程序、数据等。另外,各种程序例如可以经由网络3从其他服务器装置等取得,也可以记录在记录介质中并经由驱动装置(未图示)读入。
并且,在存储部12中构建存储有与从终端30接收到的检索查询有关的记录的检索查询记录/数据库12a(以下设为“检索查询记录DB12a”。)、存储根据检索查询而 生成的关联词的关联词数据库12b(以下设为“关联词DB12b”。)、存储从Web页提取特征字时所需要的数据的特征字用数据库12c(以下设为“特征字用DB12c”。)等。另外,检索查询记录DB12a、关联词DB12b、特征字用DB12c可以在服务器系统5内构建在关联词登记服务器10以外的其他服务器中,也可以构建在服务器系统5外部。
在检索查询记录DB12a(检索查询存储单元的一例)中存储有与接收到检索查询的接收时刻、用户ID等的用于区分用户的用户识别信息对应的检索查询。另外,作为用户识别信息,举出购物网站等的用户ID、用户终端或访问点的识别编号、IP地址等。进而,在信息提供服务器20中,在用户进行商品检索的情况下,还与商品所属的商品类别、用户打开的Web页所示的商品类别等的类别信息对应地,将检索查询存储在检索查询记录DB12a中。
在关联词DB12b中存储有由关联词登记服务器10生成的关联词。
在特征字用DB12c中存储有为了提取特征字而从信息提供服务器20的数据库等中提取出的内容信息。
接着,输入输出接口部13进行通信部11和存储部12与系统控制部14之间的接口处理。
系统控制部14由CPU(Central Processing Unit)14a、ROM(Read Only Memory)14b、RAM(Random Access Memory)14c等构成。通过由CPU14a读出ROM14b或存储部12中存储的各种程序并执行,系统控制部14进行关联词的登记处理等。
(2.2信息提供服务器20的结构和功能)
接着,使用图3对信息提供服务器20的结构和功能进行说明。
图3是示出信息提供服务器20的概要结构的一例的框图。
如图3所示,信息提供服务器20具有通信部21、存储部22、输入输出接口部23、系统控制部24,系统控制部24和输入输出接口部23经由系统总线25而连接。另外,信息提供服务器20的结构和功能与关联词登记服务器10的结构和功能大致相同,所以,以关联词登记服务器10的各结构和各功能中的不同之处为中心进行说明。
通信部21通过网络3或局域网等对与终端30或关联词登记服务器10等的通信状态进行控制等。
在存储部22中构建商品数据库22a(以下设为“商品DB22a”。)和会员数据库 22b(以下设为“会员DB22b”。)等。
在商品DB22a中,与用于识别商品的识别符即商品ID相关联地存储有商品名、种类、商品的图像、规格和商品信息、与各商品有关的广告信息等。并且,在商品DB22a中,根据商品的类别信息对商品信息进行分类。并且,在商品DB22a中存储有通过HTML(HyperTextMarkup Language)、XML(Extensible Markup Language)等的标记语言等记述的商品网页的文件等。
进而,在商品DB22a中构建用于检索商品的检索数据库。
在会员DB22b中登记有进行了会员登记的用户(购物网站的利用者)的用户ID、名称、住址、电话号码、邮件地址、职业、兴趣、购买历史、用户关心的主题和种类等的用户信息。并且,在会员DB22b中登记有用户从终端30登录购物网站时所需要的用户ID、登录ID和密码。这里,登录ID和密码是登录处理(用户的认证处理)中使用的登录信息。
系统控制部24由CPU24a、ROM24b、RAM24c等构成。而且,通过由CPU24a读出ROM24b和存储部22中存储的各种程序并执行,系统控制部24进行商品检索处理、用户的商品购入处理等。
(2.3终端30的结构和功能)
接着,使用图4对终端30的结构和功能进行说明。
图4是示出终端30的概要结构的一例的框图。
如图4所示,作为计算机进行工作的终端30例如是个人计算机、包含智能手机的便携型无线电话机、PDA等的便携终端,具有通信部31、存储部32、显示部33、操作部34、输入输出接口部35、系统控制部36。而且,系统控制部36和输入输出接口部35经由系统总线37而连接。
通信部31通过网络3对与信息提供服务器20等的通信进行控制。另外,在终端30为便携终端装置的情况下,通信部31具有无线通信功能,以使得与网络3的移动通信网连接。
存储部32例如由硬盘驱动等构成,存储操作系统、网页浏览器的程序、网页浏览器用工具条的程序等。
显示部33例如由液晶显示元件或EL(Electro Luminescence)元件等构成。在显示部33中,通过网页浏览器显示检索画面的网页、从信息提供服务器20提供的商品 检索的结果的网页。
操作部34例如由键盘和鼠标等构成。用户通过操作部34输入应答。另外,在显示部33为触摸面板这种触摸开关方式的显示面板的情况下,操作部34取得用户接触或接近的显示部33的位置信息。
输入输出接口部35是通信部31和存储部32与系统控制部36之间的接口。
系统控制部36例如具有CPU36a、ROM36b、RAM36c。系统控制部36的CPU36a读出ROM36b、RAM36c、存储部32中存储的各种程序并执行。例如,系统控制部36执行网页浏览器的程序而作为网页浏览器进行工作。
[3.关联词登记系统的动作]
接着,使用图5~图11对本发明的一个实施方式的关联词登记系统1的动作进行说明。
图5、图7~图10是示出终端30中显示的网页的一例的示意图。图6是示出关联词登记服务器10的动作例的流程图。图11是示出用户操作检测时与检索查询的取得时间的关系的一例的示意图。
(3.1用户操作的判定和检索查询记录的生成)
利用图5至图8来说明在到用户登录到购物网站,检索商品并搜索目标商品,购入该搜索到的商品的手续为止的用户的行为中,用户操作间的判定和检索查询记录的生成。
首先,当用户(例如用户A)利用用户A的终端30登录购物网站时,如图5所示,从信息提供服务器20对该终端30发送购物网站的主页即Web页40的信息。然后,在终端30的显示部33中显示Web页40。该Web页40是购物网站的主页,显示有主类别显示45,扩展有针对各商品类别的链接。进而,显示有该购物网站的关联群组企业的商品和服务的类别显示46,扩展有针对各商品类别的链接。并且,在Web页40中显示有表示用户A的信息“A,你好”。
接着,如图5所示,在Web页40中点击“家电”的商品类别的链接,从终端30对信息提供服务器20发送链接目的地的Web页的显示请求的信号。另外,还从终端30发送登录到购物网站的用户A的用户ID、所显示的Web页所属的商品类别的类别信息。
如图6所示,关联词登记服务器10检测用户操作(步骤S1)。具体而言,关联词登记服务器10的系统控制部14检测从终端30针对信息提供服务器20的请求或从终端30发送的其他信号。该请求的种类是用户输入的检索字的检索查询、表示详细的商品内容的链接目的地的Web页的显示请求、针对其他服务的Web页的显示请求、商品购入手续的Web页的显示请求、商品购入确定的信号等。这些请求等的内容从信息提供服务器20发送到关联词登记服务器10。在图5的情况下,作为用户操作,关联词登记服务器10的系统控制部14从信息提供服务器20接收“家电”的商品类别的链接目的地的Web页的显示请求。
接着,关联词登记服务器10判定检测到的用户操作是否是检索(步骤S2)。具体而言,关联词登记服务器10的系统控制部14判定从终端30针对信息提供服务器20的请求是否包含检索查询。在图5的情况下,是链接目的地的Web页的显示请求而不是检索请求(步骤S2:否),所以进入步骤S3。
在检测到的用户操作不是检索的情况下(步骤S2:否),关联词登记服务器10判定检测到的用户操作是否是用户的与商品有关的手续(规定操作的一例)(步骤S3)。具体而言,关联词登记服务器10的系统控制部14判定检测到的用户操作是否是商品购入手续确定(结算)。另外,作为用户的与商品有关的手续,除了商品购入手续确定(结算)以外,还举出商品预约登记、针对购物车的登记、针对收藏夹(书签)的登记等。另外,作为规定操作,只要是得知实现检索目的的操作即可。
在用户操作不是用户的与商品有关的手续的情况下(步骤S3:否),例如,在链接目的地的Web页的显示请求等的情况下,关联词登记服务器10的系统控制部14返回步骤S1,等待检测用户操作。在图5的情况下,是链接目的地的Web页的显示请求而不是商品购入手续确定(结算)的信号,所以返回步骤S1。
如图5所示,当在Web页40中点击“家电”的商品类别的链接时,如图7所示,在显示部33中显示“家电”的Web页50。在该Web页50中显示主类别“家电”的类别显示55的子类别显示56。
接着,当在该Web页50的检索字记入栏51中输入检索字并点击检索按钮52时,终端30的系统控制部36通过通信部31对信息提供服务器20发送检索查询。该检索查询具有所输入的检索字、Web页50的类别信息(表示主类别“家电”的类别显示65的类别识别编号等)、作为用户识别信息的一例的(用户A的) 用户ID等。
接着,信息提供服务器20从终端30接收该检索查询,将其发送到关联词登记服务器10,并且参照商品DB22a进行商品的检索。并且,确定该检索查询的发送方的IP地址,也将该IP地址发送到关联词登记服务器10。该IP地址是用户识别信息的一例,在用户未登录的情况下,代替用户ID而使用。在IP地址中,不一定能够完全确定用户,但是,能够在某种程度上区分用户。该IP地址从由用户A等的终端30发送的检索查询的标题等中取得。
接着,关联词登记服务器10从信息提供服务器20接收包含检索字的检索查询,在步骤S1中检测用户操作,在步骤S2中判定检测到的用户操作是否是检索。在图7的情况下,由于是来自终端30的检索请求(步骤S2:是),所以,如图6所示,关联词登记服务器10取得包含检索字的检索查询(步骤S4)。具体而言,关联词登记服务器10的系统控制部14从信息提供服务器20接收检索查询,将接收到的检索查询和检索查询的接收时刻(取得时刻的一例)对应地存储在检索查询记录DB12a中。进而,关联词登记服务器10的系统控制部14与IP地址对应地将检索查询存储在检索查询记录DB12a中。另外,关联词登记服务器10的系统控制部14也可以使检索查询包含IP地址。
关于该接收时刻,举出信息提供服务器20从终端30接收到检索查询的接收时刻、关联词登记服务器10从信息提供服务器20接收到该检索查询的接收时刻。如果是信息提供服务器20从终端接收到检索查询的时刻,则信息提供服务器20还对关联词登记服务器10发送检索查询的接收时刻。并且,接收时刻可以是在检索查询记录DB12a中存储检索查询时标注的时间戳。
接着,关联词登记服务器10与用户ID和取得时刻对应地存储检索查询(步骤S5)。具体而言,关联词登记服务器10的系统控制部14与类别信息、用户ID(也可以是IP地址)和接收时刻(取得时刻的一例)对应地将检索查询存储在检索查询记录DB12a中。这样,关联词登记服务器10作为与用户识别信息和检索查询的取得时刻对应地存储所取得的检索查询的检索查询存储单元的一例进行工作。
接着,关联词登记服务器10判定步骤S3中检测到的用户操作是否是规定操作。在图7的情况下,由于是来自终端30的检索请求(步骤S3:否),所以,关联词登记服务器10返回步骤S1,等待检测用户操作。
另一方面,在信息提供服务器20进行了商品检索后,作为检索结果,如图8所示,将Web页60的信息发送到终端30。终端30从信息提供服务器20接收Web页60的信息,将其显示在显示部33中。
用户A查看Web页60的检索结果,在存在目标商品的情况下,点击商品显示栏63的商品,但是,在不存在目标商品的情况下,进一步在检索字输入栏61中输入检索字,当点击检索按钮62时,如上所述,终端30对信息提供服务器20发送包含检索字“▲▲O■”和类别信息(“家电”)的检索查询。然后,信息提供服务器20接收该检索查询,发送到关联词登记服务器10,进行检索。如上所述,关联词登记服务器10接收检索查询(步骤S4),与类别信息、用户ID等和接收时刻对应地将下一个检索查询存储在检索查询记录DB12a中(步骤S5)。
用户A在发现目标商品之前继续进行检索,每次,关联词登记服务器10如步骤S4~步骤S5那样,将检索查询存储在检索查询记录DB12a中。
(3.2关联词的登记)
接着,使用图7和图9~图11对关联词的登记进行说明。
用户A进行检索而发现目标商品,如图9所示,在终端30的显示部33中,在Web页70中显示与商品有关的详细信息。然后,点击用于进入购入手续的按钮(未图示),信息提供服务器20开始进行与商品有关的手续处理,如图10所示,将确认购入手续确定的Web页80的信息发送到终端30,在终端30的显示部33中显示Web页80。
然后,点击购入手续确定的按钮81,从终端30对信息提供服务器20发送商品购入确定的信号。然后,从信息提供服务器20对关联词登记服务器10发送商品购入确定的信号。另外,还从终端30发送登录到购物网站的用户A的用户ID、购入的商品的类别信息。
接着,关联词登记服务器10在步骤S1中检测用户操作,由于是作为规定操作的一例的商品购入确定的信号(步骤S3:是),所以进入下一个步骤S6。
如图7所示,关联词登记服务器10提取在用户操作之前取得的检索查询中的与用户ID一致的检索查询(步骤S6)。具体而言,关联词登记服务器10的系统控制部14从检索查询记录DB12a中提取在商品购入确定的信号的接收时取得的与用户ID 一致的检索查询。例如,如图11所示,关联词登记服务器10的系统控制部14提取检索查询群90。在图11中,检索查询群90按照接收时刻顺序示出检索查询Qa~Qg。
另外,在用户未登录等而不知道检索查询的用户ID时,作为用户识别信息的一例,关联词登记服务器10的系统控制部14从检索查询记录DB12a中提取IP地址一致的检索查询。
这样,关联词登记服务器10作为检索查询提取单元的一例进行工作,其在检测到规定用户操作的情况下,提取与该用户的用户识别信息对应的检索查询。并且,关联词登记服务器10作为检索查询提取单元的一例进行工作,作为规定用户操作,在检测到该用户的与商品有关的结算手续的情况下,提取与用户识别信息对应的检索查询。
接着,关联词登记服务器10确定所提取出的检索查询中的、取得时刻最晚的检索查询中第1检索查询(步骤S7)。具体而言,如图11所示,关联词登记服务器10的系统控制部14从检索查询群90中确定取得时间的一例即接收时刻最晚的检索查询91,作为第1检索查询。另外,如图11所示,关联词登记服务器10也可以确定最接近检测到用户操作的时刻的检索查询作为第1检索查询。
这样,关联词登记服务器10作为从提取出的检索查询中确定第1检索查询的第1检索查询确定单元的一例进行工作。并且,关联词登记服务器10作为确定所提取出的检索查询中的取得时刻最晚的检索查询作为第1检索查询的第1检索查询确定单元的一例进行工作。并且,关联词登记服务器10作为确定取得时刻最接近检测到用户操作的时刻的检索查询作为第1检索查询的第1检索查询确定单元的一例进行工作。
接着,关联词登记服务器10提取所提取出的检索查询中的、第1检索查询之前的各检索查询间的取得时刻间隔为规定时间内的候选检索查询(步骤S8)。具体而言,如图11所示,作为相互的接收时刻(取得时刻)间隔为第2规定时间内的一例,关联词登记服务器10的系统控制部14提取第1检索查询91(Qa)之前的各检索查询中、与前一个检索查询之间的接收时刻间隔为规定时间T2内(基于取得时刻的连续性的一例)的候选检索查询92(Qb、Qc)。这是基于接收时刻(取得时刻)的连续性的一例,是在检索查询的接收时刻顺序中与第1检索查询91(Qa)连续的候选检索查询92(Qb、Qc)。
这样,关联词登记服务器10作为第2检索查询确定单元的一例进行工作,其确定提取出的检索查询中的、取得时刻在第1检索查询的取得时刻之前、且具有基于取得时刻的连续性的检索查询,作为第2检索查询。并且,关联词登记服务器10作为第2检索查询确定单元的一例进行工作,其确定相互的取得时刻的间隔为第2规定时间内的检索查询作为第2检索查询。另外,作为基于接收时刻(取得时刻)的连续性的一例,关联词登记服务器10的系统控制部14可以提取相互的接收时刻间隔为规定时间T2内(基于取得时刻的连续性的一例)的候选检索查询92(Qb、Qc、Qe、Qg)。
接着,关联词登记服务器10确定提取出的候选检索查询中的、取得时刻最早的检索查询作为第2检索查询(步骤S9)。具体而言,如图11所示,关联词登记服务器10的系统控制部14确定提取出的候选检索查询92中的、接收时刻最早的检索查询作为第2检索查询93。这样,关联词登记服务器10作为第2检索查询确定单元的一例进行工作,其确定提取出的检索查询中的、取得时刻在第1检索查询的取得时刻之前的检索查询作为第2检索查询。
接着,关联词登记服务器10登记第1检索查询作为第2检索查询的关联词(步骤S10)。具体而言,关联词登记服务器10的系统控制部14将第1检索查询91作为第2检索查询93的关联词登记在关联词DB12b中。这样,关联词登记服务器10作为在关联词DB12b中登记第1检索查询的检索字和第2检索查询的检索字作为关联词的关联词登记单元的一例进行工作。
接着,对所构建的关联词数据库的利用进行说明。
信息提供服务器20在根据从用户的终端30接收到的检索查询进行检索时,作为关联词提取单元的一例,参照关联词登记服务器10的关联词DB12b,提取与检索查询的检索字对应的关联词。例如,信息提供服务器20对关联词登记服务器10发送所接收到的检索查询。关联词登记服务器10从信息提供服务器20接收检索查询,从关联词DB12b中提取与检索查询的检索字对应的登记字符串。然后,关联词登记服务器10作为关联词输出单元的一例,对信息提供服务器20发送所提取出的登记字符串作为关联词。信息提供服务器20对终端30发送所接收到的关联词。然后,如图6所示,终端30如“也许是‘○○▲’”那样在关联词显示栏43中显示所接收到的关联词。
进而,在从终端30接收到的检索查询为未完成的检索查询(例如“△◎”)的 情况下,信息提供服务器20参照关联词登记服务器10的关联词DB12b,提取与完成的检索查询对应的关联词(例如“○○▲”),发送到终端30。例如,在以前由其他用户检索并购入了与“○○▲”相关联的商品的情况下,当现在进行检索的用户输入“△◎”作为检索查询时,为了使用户快速找到目标检索对象并收敛,在Web页40中提示关联词“○○▲”。另外,也可以如“第1关联词、第2关联词”那样显示多个关联词。并且,不限于检索结果的件数为零件或较少的情况、输入未完成的检索查询的情况,也可以显示关联词。
以上,根据本实施方式,接收包含用户输入的检索字的检索查询,将接收到的检索查询与用户ID或IP地址等的用户识别信息和检索查询的接收时刻对应地存储在检索查询记录DB12a中,在检测到商品购入确定等的规定用户操作的情况下,提取与该用户的用户ID等对应的检索查询(检索查询群90),从提取出的检索查询中确定第1检索查询91,从提取出的检索查询中确定接收时刻在第1检索查询的接收时刻之前的第2检索查询93(92),将第1检索查询的检索字和第2检索查询的检索字作为登记用关联词登记在关联词DB12b中,由此,以规定用户操作为契机,从用户识别信息对应的检索查询中,登记时间前后的检索查询中包含的检索字作为关联词,所以,能够担保用户的关联性,能够登记接近用户的操作时间、已完成的第1检索查询91中包含的检索字和得到检索结果的过程中途即未完成的第2检索查询93中包含的检索字,作为高精度的关联词。这里,已完成的检索查询是用户找到目标检索对象时的检索查询。未完成的检索查询是在该检索查询中用户未找到目标检索对象的检索查询。
并且,当根据关联词对用户提示检索字时,能够使用户快速找到目标检索对象。并且,由于是其他用户试行错误、反映了找到检索对象的结果的关联词,所以,通过关联词示出检索收敛的方向的路径,由此,能够节省检索的时间和劳力。
并且,在关联词登记服务器10从提取出的检索查询中确定接收时刻在第1检索查询的接收时刻之前、且具有基于接收时刻的连续性的第2检索查询的情况下,能够将所述提取出的检索查询缩小为具有基于接收时刻的连续性的第2检索查询,所以,能够提高确定第2检索查询的精度,能够提高关联词的精度。
并且,在关联词登记服务器10确定相互的接收时刻的间隔为第2规定时间T2内的检索查询92作为具有基于接收时刻的连续性的第2检索查询的情况下,作为基 于接收时刻的连续性,能够容易地提取相互的接收时刻的间隔为第2规定时间T2内的所述提取出的检索查询,能够缩小为具有基于接收时刻的连续性的第2检索查询,所以,能够提高关联词的精度。
并且,作为规定用户操作,在关联词登记服务器10检测到该用户的与商品有关的结算手续的情况下,提取与用户ID或IP地址等的用户识别信息对应的检索查询,从该提取出的检索查询中确定第1检索查询和第2查询并登记为关联词,由此,与将针对购物车的购物篮登记、书签登记等作为检索查询提取处理的契机的情况相比,与到达该结算的检索结果对应的检索查询是精度更高的完成查询,所以,能够适当设定检索查询提取处理的开始条件,所以,能够提高登记为最终结果的关联词的精度。
并且,在关联词登记服务器10确定接收时刻最接近检测到用户操作的时刻的检索查询作为第1检索查询的情况下、或者在确定所提取出的检索查询中的最晚的接收时刻的检索查询作为第1检索查询的情况下,第1检索查询与用户操作之间的关联较高,所以,能够提高关联词的精度。
并且,在信息提供服务器20参照关联词数据库提取与接收到的检索查询的检索字对应的关联词并输出的情况下,能够对用户提示能够使用户快速找到目标检索对象的高精度的关联词。
(3.3关联词登记系统1的动作的变形例)
接着,使用图12和图13对关联词登记系统1的动作的变形例进行说明。另外,步骤S11~步骤S15对应于步骤S1~步骤S5,所以省略说明。并且,对与所述实施方式相同或对应的部分使用相同标号,仅对不同的结构和作用进行说明。其他变形例也同样。
如图10所示,在Web页80中点击购入手续确定的按钮81,从终端30对信息提供服务器20发送商品购入确定的信号。然后,从信息提供服务器20对关联词登记服务器10发送商品购入确定的信号后,在关联词登记服务器10中进行步骤S11~步骤S13的处理。
接着,关联词登记服务器10提取在用户操作之前取得的检索查询中的、与用户ID一致、且取得时刻最晚的检索查询之前的各检索查询间的取得时刻间隔为规定时间内的检索查询(步骤S16)。如图13所示,具体而言,关联词登记服务器10的系统控制部14从检索查询记录DB12a2提取与最终商品购入确定的信号的接收时取得 的用户ID一致、且取得时刻最晚的检索查询91之前的各检索查询间的取得时刻间隔为规定时间T2内的检索查询92。例如如图13所示,关联词登记服务器10的系统控制部14提取检索查询95群。
这样,关联词登记服务器10作为检索查询提取单元的一例进行工作,其在检测到规定用户操作的情况下,提取与该用户的用户识别信息对应、且具有基于取得时刻的连续性的检索查询。并且,关联词登记服务器10作为检索查询提取单元的一例进行工作,作为具有基于取得时刻的连续性的检索查询,提取相互的取得时刻的间隔为第2规定时间T2内的检索查询。
接着,关联词登记服务器10确定提取出的检索查询中的、取得时刻最晚的检索查询作为第1检索查询(步骤S17)。具体而言,如图13所示,关联词登记服务器10的系统控制部14从检索查询95群中,确定取得时间的一例即接收时刻最晚的检索查询91作为第1检索查询。
接着,关联词登记服务器10确定提取出的检索查询中的与第1检索查询不同的检索查询作为第2检索查询(步骤S18)。具体而言,如图13所示,关联词登记服务器10的系统控制部14确定与第1检索查询91不同的检索查询94作为第2检索查询。这样,关联词登记服务器10作为从提取出的检索查询中确定与第1检索查询不同的检索查询作为第2检索查询的第2检索查询确定单元的一例进行工作。
接着,关联词登记服务器10登记第1检索查询作为第2检索查询的关联词(步骤S19)。具体而言,关联词登记服务器10的系统控制部14将第1检索查询91作为各第2检索查询93、94的关联词登记在关联词DB12b中。关联词登记服务器10的系统控制部14也可以确定检索查询93、94中的接收时刻最早的检索查询作为第2检索查询93,将第1检索查询91作为第2检索查询93的关联词登记在关联词DB12b中。
以上,根据本实施方式的变形例,接收包含用户输入的检索字的检索查询,与用户识别信息和检索查询的接收时刻对应地存储接收到的检索查询,在检测到规定用户操作的情况下,提取与该用户的用户识别信息对应的检索查询,从提取出的检索查询中确定第1检索查询,从提取出的检索查询中确定与第1检索查询不同的检索查询作为第2检索查询,将第1检索查询中包含的检索字和第2检索查询中包含的检索字作为关联词登记在关联词DB12b中,由此,以规定用户操作为契机,从用户识别信息 一致的检索查询中,登记相互不同的检索查询中包含的检索字作为关联词,所以,能够担保用户的关联性,能够登记接近用户的操作时间、已完成的第1检索查询91中包含的检索字和得到检索结果的过程中途即未完成的第2检索查询93中包含的检索字,作为高精度的关联词。
另外,如图14所示,作为具有基于取得时刻的连续性的第2检索查询,关联词登记服务器10也可以确定取得时刻为从第1检索查询91的取得时刻起的第1规定时间T1内(基于取得时刻的连续性的一例)的候选检索查询92。并且,作为具有基于取得时刻的连续性的检索查询,关联词登记服务器10也可以提取从取得时刻最晚的检索查询91的取得时刻起在第1规定时间T1内取得的检索查询91、92。
在这些情况下,确定最接近规定用户操作的检测时刻的从第1检索查询的取得时刻起在规定时间内的所述提取出的检索查询,作为第2检索查询,所以,与规定用户操作之间的关联性高,能够提高确定第2检索查询的精度,能够提高关联词的精度。
并且,在关联词登记服务器10设定第1规定时间T1或第2规定时间T2的情况下,例如,能够结合规定用户操作的种类而使第1规定时间T1或第2规定时间T2变动,所以,能够根据规定用户操作的种类来提取关联词,能够提高关联词的精度。进而,如图15所示,在设定第1规定时间T1和第2规定时间T2的情况下,能够提取与第1规定时间T1和第2规定时间T2的设定对应的候选检索查询92,能够提高确定第2检索查询的精度,能够提高关联词的精度。
并且,关联词登记服务器10也可以根据由关联词登记单元登记的关联词的登记数来设定第1规定时间T1或第2规定时间T2。例如,在关联词DB12b中登记的关联词增加、而不需要增加关联词的情况下,通过缩短规定时间T1、T2,取得时间接近第1检索查询的候选检索查询92减少,所以,能够减少新登记的关联词的件数。进而,由于取得时间接近,所以时间上的关联性较强,能够提高关联词的精度。并且,在关联词DB12b的初始状态、关联词的登记数较少的情况下,延长规定时间T1、T2,能够增加登记数,充实关联词DB12b。
并且,关联词登记服务器10也可以在商品DB22a等中的检索中,与检索查询一起取得类别信息,确定类别信息一致、取得时刻在第1检索查询之前、且具有基于取得时刻的连续性的第2检索查询。例如,如图16所示,关联词登记服务器10在将检索查询存储在检索查询记录DB12a中时,与类别信息(类别C1、C2)等一起存储检 索查询。然后,关联词登记服务器10确定与第1检索查询91的类别C1一致、取得时刻在第1检索查询91之前、且具有基于取得时刻的连续性(例如第1规定时间T1内的情况)的候选检索查询92。
根据类别信息一致的检索查询来确定第2检索查询,所以,能够提高关联词的精度。另外,作为本变形例的检索查询提取单元的一例,关联词登记服务器10也可以提取类别信息一致、与用户的识别信息对应、且具有基于取得时刻的连续性的检索查询。
并且,关联词登记服务器10也可以确定取得时刻在第1检索查询的取得时刻之前、且具有基于取得时刻的连续性的检索查询、即检索结果数为规定值以下的检索查询,作为第2检索查询。例如,如图17所示,确定检索件数为0件的候选检索查询92。另外,关于检索件数为0件的情况,举出输入了类型错误或误解的检索字的情况、在and条件下包含多个检索字的检索查询等。可以认为所述检索查询是未完成的检索查询,能够登记该未完成的检索查询和已完成的第1检索查询的检索字作为关联词,所以,用户容易快速找到目标检索对象,能够提高关联词的精度。
另外,该情况下,关联词登记服务器10从信息提供服务器20取得信息提供服务器20根据检索查询进行检索时的检索结果的件数,与检索查询一起存储在检索查询记录DB12a中。进而,作为本变形例的检索查询提取单元的一例,关联词登记服务器10也可以提取与用户的识别信息对应、且具有基于取得时刻的连续性的检索查询、即检索结果数为规定值以下的检索查询。
进而,关联词登记服务器10也可以根据规定用户操作来计算操作时间,根据该操作时间设定第1规定时间T1或第2规定时间T2。能够根据动态图像的再现时间、临时停止动态图像并开始检索的情况下的Web页的阅览时间和检索时间等的用户的操作模式,设定规定时间T1或第2规定时间T2,能够根据所设定的规定时间T1或第2规定时间T2确定检索查询,所以,能够提高关联词的精度。
并且,关联词登记服务器10也可以检测动态图像的再现信息作为规定用户操作,根据该再现信息,计算动态图像的再现时间、再现次数或动态图像再现时间经过后到操作开始之前的经过时间等的动态图像再现特性值,在动态图像再现特性值为阈值以上的情况下,提取与用户识别信息对应的检索查询。例如,多数情况下,再现时间长的动态图像、再现次数多的动态图像是用户寻求的动态图像或用户没有腻烦的动态图 像,可以说是找到接近用户目标的检索对象的情况,所以,第1检索查询是高精度的已完成的检索查询,能够提高关联词的精度。
并且,也可以在基于检索查询的检索结果中包含的链接信息中的、通过所述规定用户操作而被点击的链接信息的数量为规定数以上的情况下,关联词登记服务器10提取与用户识别信息对应的检索查询。例如,在作为检索结果的Web页中,在该Web页中包含的链接信息中的被点击的链接数为规定数以上的情况下,所述检索结果包含用户关心的大量信息,所以,(相对于与被点击的链接信息数小于规定数的检索结果对应的检索查询)与所述检索结果对应的检索查询成为更符合用户意图的检索查询(正确的检索查询),所以,第1检索查询的精度进一步提高,能够提高关联词的精度。另外,关联词登记服务器10按照每个用户ID、与IP地址对应的每个类别对被点击的链接信息的数量进行合计。
并且,除了检索结果中显示的各记录的链接信息以外,作为通过规定用户操作而被点击的链接信息的其他例子,也可以是显示所显示的检索结果的下一个检索结果的按钮、所谓的“下一页按钮”的信息。该情况下,当点击多个Web页的“下一页按钮”时、即逐一点击多个“下一页按钮”的链接(点击多个链接信息)时,用户深度检查基于检索查询的检索结果,可以说对基于检索查询的检索结果感兴趣。因此,该检索查询是正确的检索查询,所以,第1检索查询的精度进一步提高,关联词登记服务器10能够提高关联词的精度。
另外,本实施方式的以上处理可以在终端30中进行。在终端30中生成关联词,在终端中蓄积规定数的关联词后,发送到关联词登记服务器10。另外,检索查询记录和关联词数据库构建在存储部32中。并且,关联词登记用程序也可以组入从信息提供服务器20等提供的网页浏览器的插件(例如工具条等)中。并且,由于在用户的终端30中进行处理,所以,在检索查询的提取等中不需要进行用户ID的核对。
具体而言,终端30的系统控制部36在步骤S1中检测来自操作部34的用户操作,在步骤S2中判定检测到的用户操作是否是检索。例如,在图7中,在点击了Web页50的检索按钮52的情况下,终端30的系统控制部36中步骤S4中,取得输入到检索字记入栏51的检索字以用于构建检索查询记录。
接着,终端30的系统控制部36在步骤S5中,与取得时刻对应地将检索查询存储在存储部12中。
终端30的系统控制部36在步骤S3中检测到来自操作部34的规定用户操作时,终端30的系统控制部36中步骤S6中提取在用户操作之前取得的检索查询。
接着,终端30的系统控制部36在步骤S7中,确定提取出的检索查询中的取得时刻最晚的检索查询,作为第1检索查询。
接着,终端30的系统控制部36在步骤S8中,提取所提取出的检索查询中的、第1检索查询之前的各检索查询间的取得时刻间隔为规定时间内的候选检索查询。
接着,终端30的系统控制部36在步骤S9中,确定所提取出的候选检索查询中的、取得时刻最早的检索查询,作为第2检索查询。
接着,终端30的系统控制部36在步骤S10中,将第1检索查询作为第2检索查询的关联词而存储在存储部32或RAM36c中。
接着,终端30的系统控制部36在关联词的登记数超过规定阈值以上的情况下、在规定时刻、在对关联词登记服务器10发送关联词后经过了规定时间的情况下等,将关联词发送到关联词登记服务器10。并且,终端30的系统控制部36也可以每当生成关联词时,对关联词登记服务器10发送关联词。这样,终端30作为对关联词登记装置发送第1检索查询的检索字和第2检索查询的检索字作为登记用关联词的关联词发送单元的一例进行工作。
另外,也可以是与网络3连接的外部EC网站,信息提供服务器20不限于商品检索,也可以是一般的检索服务器。
(3.4关联词登记系统1的动作的另一变形例)
接着,使用图10、图11和图18对关联词登记系统1的动作的另一变形例进行说明。
另外,在图18的流程图中,步骤S21~S25对应于步骤S1~S5,所以,省略与步骤S21~S25有关的说明。
如图18所示,在步骤S23中用户操作是商品手续的情况下,关联词登记服务器10提取用户操作的操作对象的Web页中包含的特征字(步骤S26)。具体而言,如图10所示,关联词登记服务器10的系统控制部14从Web页80购入手续的确定按钮81的点击这样的用户操作的操作对象的Web页70中提取并取得特征字。另外,提取特征字的详细情况在特征字的子进程中在后面叙述。这样,关联词登记服务器10作为特征字取得单元的一例进行工作,其在检测到规定用户操作的情况下,取得 用户操作的操作对象的Web页中包含的特征字。
接着,关联词登记服务器10提取在用户操作之前取得的检索查询中的与用户ID一致的检索查询(步骤S27)。具体而言,关联词登记服务器10的系统控制部14从检索查询记录DB12a中提取与商品购入确定的信号的接收时取得的用户ID一致的检索查询。例如,如图11所示,关联词登记服务器10的系统控制部14提取检索查询群90。在图11中,检索查询群90按照接收时刻顺序示出检索查询Qa~Qg。并且,检索查询91是符合目标检索对象的检索查询。
接着,关联词登记服务器10确定所提取出的检索查询中的、取得时刻最早的检索查询,作为检索查询(步骤S28)。具体而言,如图11所示,关联词登记服务器10的系统控制部14从检索查询群90中确定取得时间的一例即接收时刻最早的检索查询93(候选检索查询)。
接着,关联词登记服务器10登记所提取出的特征字作为所确定的检索查询中包含的检索字的关联词(步骤S29)。具体而言,关联词登记服务器10的系统控制部14将提取出的特征字和检索查询93中包含的检索字作为关联词登记在关联词DB12b中。这样,关联词登记服务器10作为关联词登记单元的一例进行工作,其在关联词DB12b中登记所取得的特征字和所确定的检索查询的检索字作为关联词。
(3.5特征字的提取)
接着,使用图9、图18~图21对特征字的子进程进行说明。
在该子进程变形例中,关联词登记服务器10从Web页70等中取得HTML文件并进行分析,以内容块单位提取作为Web素材(文本数据和图像数据等)的内容,计算构成多个Web页的各内容块的出现频度,确定出现频度最小或出现频度为规定值(例如5次)以下的内容作为该Web页特有的内容块,对该确定的内容进行词素分析并提取特征字。另外,关联词登记服务器10也可以根据出现频度的计算对象的内容块的数量来决定出现频度的规定值。
具体而言,预先从信息提供服务器20取得商品DB22a中存储的HTML文档并进行分析,以内容块单位提取作为Web素材的内容。然后,作为其提取结果,按照提取出的每个内容块加工内容块对应信息(内容信息的一例)存储在特征字用DB12c中。基本上,针对商品DB22a中存储并登记的与商品有关的全部HTML文档、即构成购物网站的全部商品说明页,预先提取内容块。
参照该内容块对应信息,计算对象Web页的内容块的出现频度,确定特有的内容块。
这里,使用图9、图19和图20对内容块和内容块对应信息进行说明。
如图9所示,例如,在商品说明页或博客页这样的Web页70上,分别或统一(群组)显示作为Web素材的各内容。该各统一相当于内容块。各内容通过HTML文件中记述的DIV标签和TABLE标签(预先确定的标签的一例)而分别分成内容块。即,各内容通过DIV标签和TABLE标签(以下称为“块化标签”)而块化(群组化)。
在图9中显示内容块71~76。内容块71例如是页的标题部分的内容块,由文本A和图像a构成。
并且,内容块72例如是用于移动到与各种类别的商品有关的Web页的导航部分的内容块,例如由表示针对其他Web页的链接的文本B、文本C和文本D构成。
并且,内容块73例如是与商品说明的显示区域对应的内容块,由表示索引的文本E、内容块74和内容块75构成。这样,内容块有时成为嵌套状、即层级构造。该情况下,内容块73中包含的内容仅为文本E,内容块74和内容块75独立于内容块73。内容块74和75分别是1件商品的说明文。内容块74由表示商品的说明文的标题和正文的文本F和G构成。内容块75由表示商品的说明文的标题和正文的文本H、I和J、商品图像b和c构成。内容块76例如是表示版权显示等的内容块,由文本I构成。
这些内容块中的内容块71、72、73和76在图9所示的Web页70以外的Web页上也比较频繁地出现。另一方面,内容块74和内容块75基本上仅用于Web页70。由此,判断为内容块74或内容块75是Web页70特有的内容块。
在图19中,利用DOM(Document Object Model)树即木构造表示图9的Web页70的HTML文档。
在该DOM树中,表示DIV标签的DIV节点和表示TABLE标签的TABLE节点成为将各内容块化为内容块的节点(以下称为“块化节点”)。
系统控制部14例如通过深度优先搜索对DOM树进行搜索,确定内容块。具体而言,系统控制部14在发现块化节点时,对以该节点为顶点的部分树的各节点所规定的内容进行统一并设为内容块。
但是,层级地规定内容块的结果、或发现块化节点(以下称为“上位的块化节点”)后,当从该块化节点的子节点中进一步发现块化节点(以下称为“下位的块化节点”)时,对内容块进行分割。例如,当设与根节点之间的距离越近的节点为层级的越上位的节点时,将与以上位的块化节点为顶点的部分树(以下称为“上位部分树”)相当的内容块分为与以下位的块化节点为顶点的部分树(以下称为“下位部分树”)相当的内容块、以及与上位部分树中的除了下位部分树以外的部分相当的内容块(例如内容块74と内容块73)。该情况下,设前者的内容块在层级上位于后者的内容块的下位。例如,内容块71、72、73和76的层级为1,内容块74和75的层级为2。即,层级的值越小,在层级上越成为上位。
关联词登记服务器10提取内容块后,将表示提取结果的内容块对应信息存储在特征字用DB12c中。如图20所示,按照每个容块登记内容块对应信息121。内容块对应信息由提取方的HTML文档的URL设定部分122和块结构信息123构成。在块结构信息中设定有所提取出的各内容。这里,针对文本数据设定DOM树中的文本节点的内容。另一方面,针对图像数据,代替图像数据本身,设定作为在DOM树中表示IMG标签的IMG节点的src属性的图像数据的URL。
接着,使用图21对特征字的子进程的动作进行说明。
如图21所示,当调出特征字的子进程时,关联词登记服务器10例如取得Web页70的HTML文件,提取内容块(步骤S31)。具体而言,如图19所示,关联词登记服务器10的系统控制部14生成Web页70的HTML文件(HTML文档)的DOM树。然后,关联词登记服务器10的系统控制部14根据块化节点的种类或树构造中的层级,搜索DOM树(树搜索处理),提取内容块。
接着,关联词登记服务器10参照特征字用DB12c,计算所提取出的各内容块的全部商品详细页中的出现频度(步骤S32)。具体而言,关联词登记服务器10的系统控制部14对在树搜索处理中生成的内容块的块结构信息和特征字用DB12c中存储的各内容块对应信息121的块结构信息123进行比较。
此时,在块结构信息的内容一致的情况下,系统控制部14将出现次数计数为1次。另外,系统控制部14也可以无视块结构信息中的内容的规定顺序。
进而,系统控制部14在对块结构信息中规定的文本数据彼此进行比较的情况下,也可以不判定文本数据所示的文章等本身是否一致,而对由该文章等所表现的实质的内容进行比较。例如,系统控制部14也可以通过进行各个文本数据的词素分析等, 从文本数据中提取单词,对提取出的单词彼此进行比较。然后,系统控制部14可以在全部单词一致的情况下判断为文本数据彼此一致,也可以在规定比例以上的单词一致的情况下判断为文本数据彼此一致。
这样,系统控制部14对内容块的块结构信息和特征字用DB12c中存储的全部内容块对应信息的块结构信息进行比较,计算出现频度。另外,作为计算出的出现频度,可以是出现次数(度数),也可以是出现次数相对于全部商品详细页的全部内容块的比例(相对度数)。
接着,关联词登记服务器10根据出现频度进行特有的内容块的判定(步骤S33)。具体而言,关联词登记服务器10的系统控制部14将出现频度最小的内容块判定为特有的内容块。
接着,关联词登记服务器10的系统控制部14从特有的内容块中提取特征字(步骤S34)。具体而言,关联词登记服务器10的系统控制部14从特有的内容块中进行词素分析,提取出现频度高的单词作为特征字。
这样,关联词登记服务器10作为对Web页进行词素分析并取得特征字的特征字取得单元的一例进行工作。并且,关联词登记服务器10作为特征字取得单元的一例进行工作,其计算构成Web页的各内容的出现频度,根据出现频度确定内容,对该确定的内容进行词素分析,取得特征字。
以上,根据该变形例,取得包含用户输入的检索字的检索查询,与用户识别信息和检索查询的取得时刻对应地存储所取得的检索查询,在检测到规定用户操作的情况下,取得用户操作的操作对象的Web页中包含的特征字,提取与进行了用户操作的用户的用户识别信息对应的检索查询(检索查询群90),从提取出的检索查询中,根据取得时刻确定检索查询93,在关联词DB12b中登记所提取出的特征字和所确定的检索查询的检索字作为关联词,由此,以规定用户操作为契机,登记与用户操作关联较大的特征字和在时间上与用户的操作相关联且与用户识别信息对应的检索查询的检索字作为关联字,所以,能够担保用户的关联性,能够登记与用户找到目标检索对象时的用户操作对应的特征字(从已完成的检索查询的结果中取得的特征字)、和得到检索结果的过程中途即未完成的检索查询中包含的检索字,作为高精度的关联词。
另外,特征字与已完成的检索查询91的检索字之间的关联较大。这里,已完成 的检索查询是用户找到目标检索对象时的检索查询。在检索查询群90中,除了已完成的检索查询91以外,均为未完成的检索查询,在该检索查询中,是用户未找到目标检索对象的检索查询。
并且,在对Web页进行词素分析并取得特征字的情况下,能够高精度地提取与Web页相关联的特有的特征字,所以,能够登记高精度的特征字和检索字作为高精度的关联词。
并且,提取构成所指定的Web页的内容,计算构成所指定的Web页70的各内容的出现频度,在将构成所指定的Web页的内容中的出现频度最小或出现频度为规定值(例如5次)以下的内容判定为Web页70特有的内容的情况下、根据出现频度的计算对象的内容块的数量决定出现频度的规定值并判定为特有的内容的情况下,出现频度越小的内容,越是在所指定的Web页70以外不怎么出现的内容,所以,通过判断出现频度最小或规定值以下的内容,高精度地确定所指定的Web页70特有的内容。由此,能够容易地提取Web页70特有的内容。
而且,在对该特有的内容进行词素分析并取得特征字的情况下,也能够高精度地提取与Web页相关联的特有的特征字,所以,能够登记高精度的特征字和检索字作为高精度的关联词。
进而,本发明不限于上述各实施方式。上述各实施方式是例示,具有实质上与本发明的权利要求范围所记载的技术思想相同的结构、发挥相同作用效果的方式均包含在本发明的技术范围内。
标号说明
1:关联词登记系统;10:关联词登记服务器(关联词登记装置);12a:检索查询记录DB;12b:关联词DB;20:信息提供服务器(信息处理装置);22a:商品DB;30:终端(关联词登记装置);32:存储部(检索查询记录DB、关联词DB)。

Claims (29)

1.一种关联词登记装置,其具有:
检索查询取得单元,其取得检索查询,该检索查询包含用户输入的检索字;
检索查询提取单元,在检测到不同于检索的规定用户操作的情况下,该检索查询提取单元从检索查询存储单元提取与所述用户的用户识别信息对应的检索查询,其中,该检索查询存储单元与所述用户识别信息对应地存储有所述取得的检索查询;
第1检索查询确定单元,其从所述提取出的检索查询中确定第1检索查询;
第2检索查询确定单元,其从所述提取出的检索查询中确定与所述第1检索查询不同的检索查询,作为第2检索查询;以及
关联词登记单元,其在关联词登记数据库中登记所述第1检索查询的检索字和所述第2检索查询的检索字作为关联词。
2.根据权利要求1所述的关联词登记装置,其特征在于还具有商品手续单元,该商品手续单元进行与商品有关的手续处理,
在检测到所述用户的与所述商品有关的结算手续的情况下,所述检索查询提取单元提取所述检索查询。
3.根据权利要求1所述的关联词登记装置,其特征在于还具有动态图像再现特性值计算单元,该动态图像再现特性值计算单元检测动态图像的再现信息作为所述规定用户操作,根据该再现信息计算动态图像再现特性值,
在所述动态图像再现特性值为阈值以上的情况下,所述检索查询提取单元提取所述检索查询。
4.根据权利要求1所述的关联词登记装置,其特征在于,
在基于所述检索查询的检索结果中包含的链接信息中,通过所述规定用户操作而被点击的链接信息的数量为规定数以上的情况下,所述检索查询提取单元提取所述检索查询。
5.根据权利要求1所述的关联词登记装置,其特征在于,
在所述检索查询取得单元中取得的检索查询与所述用户识别信息和所述检索查询的取得时刻对应地被存储在所述检索查询存储单元中,
所述第2检索查询确定单元从所述提取出的检索查询中确定第2检索查询,该第2检索查询的取得时刻在所述第1检索查询的取得时刻之前,
进而,所述第2检索查询确定单元在所述提取出的检索查询中,确定取得时刻在所述第1检索查询的取得时刻之前且具有基于所述取得时刻的连续性的检索查询,作为第2检索查询,
此外,所述第2检索查询确定单元在所述提取出的检索查询中,确定相互的取得时刻的间隔在第2规定时间内的检索查询,作为第2检索查询。
6.根据权利要求5所述的关联词登记装置,其特征在于还具有规定时间设定单元,该规定时间设定单元根据由所述关联词登记单元登记的关联词的登记数,设定所述第2规定时间。
7.根据权利要求5所述的关联词登记装置,其特征在于还具有规定时间设定单元,该规定时间设定单元根据所述规定用户操作计算操作时间,根据该操作时间设定所述第2规定时间。
8.根据权利要求6或7所述的关联词登记装置,其特征在于,
所述检索查询取得单元在检索中,与所述检索查询一起取得类别信息,
所述第2检索查询确定单元确定所述类别信息一致,并且取得时刻在所述第1检索查询之前且具有基于所述取得时刻的连续性的检索查询,作为第2检索查询。
9.根据权利要求6或7所述的关联词登记装置,其特征在于,
所述第1检索查询确定单元确定取得时刻最接近检测到所述用户操作的时刻的检索查询,作为第1检索查询。
10.根据权利要求6或7所述的关联词登记装置,其特征在于,
所述第1检索查询确定单元在提取出的检索查询中,确定取得时刻最晚的检索查询,作为第1检索查询。
11.根据权利要求1所述的关联词登记装置,其特征在于,
在所述检索查询取得单元中取得的检索查询与所述用户识别信息和所述检索查询的取得时刻对应地被存储在所述检索查询存储单元中,
所述第2检索查询确定单元从所述提取出的检索查询中确定第2检索查询,该第2检索查询的取得时刻在所述第1检索查询的取得时刻之前,
进而,所述第2检索查询确定单元在所述提取出的检索查询中,确定取得时刻在所述第1检索查询的取得时刻之前且具有基于所述取得时刻的连续性的检索查询,作为第2检索查询。
12.根据权利要求11所述的关联词登记装置,其特征在于,
所述第2检索查询确定单元确定取得时刻在所述第1检索查询的取得时刻之前,且具有基于所述取得时刻的连续性,并且,检索结果数为规定值以下的检索查询,作为第2检索查询。
13.根据权利要求12所述的关联词登记装置,其特征在于,
所述第1检索查询确定单元确定取得时刻最接近检测到所述用户操作的时刻的检索查询,作为第1检索查询。
14.根据权利要求12所述的关联词登记装置,其特征在于,
所述第1检索查询确定单元在提取出的检索查询中,确定取得时刻最晚的检索查询,作为第1检索查询。
15.一种关联词登记装置的关联词登记方法,该关联词登记装置登记关联词,该关联词登记方法的特征在于包括:
检索查询取得步骤,取得检索查询,该检索查询包含用户输入的检索字;
检索查询提取步骤,在检测到不同于检索的规定用户操作的情况下,从检索查询存储单元提取与所述用户的用户识别信息对应的检索查询,其中,该检索查询存储单元与所述用户识别信息对应地存储有所述取得的检索查询;
第1检索查询确定步骤,从所述提取出的检索查询中确定第1检索查询;
第2检索查询确定步骤,从所述提取出的检索查询中确定与所述第1检索查询不同的检索查询,第2检索查询;以及
关联词登记步骤,在关联词数据库中登记所述第1检索查询的检索字和所述第2检索查询的检索字作为关联词。
16.根据权利要求15所述的关联词登记方法,其特征在于还包括商品手续步骤,在该商品手续步骤中,进行与商品有关的手续处理,
在所述检索查询提取步骤中,在检测到所述用户的与所述商品有关的结算手续的情况下,提取所述检索查询。
17.根据权利要求15所述的关联词登记方法,其特征在于还包括动态图像再现特性值计算步骤,在该动态图像再现特性值计算步骤中,检测动态图像的再现信息作为所述规定用户操作,根据该再现信息计算动态图像再现特性值,
在所述检索查询提取步骤中,在所述动态图像再现特性值为阈值以上的情况下,提取所述检索查询。
18.根据权利要求15所述的关联词登记方法,其特征在于,
在所述检索查询提取步骤中,在基于所述检索查询的检索结果中包含的链接信息中,通过所述规定用户操作而被点击的链接信息的数量为规定数以上的情况下,提取所述检索查询。
19.根据权利要求15所述的关联词登记方法,其特征在于,
在所述第2检索查询确定步骤中,从所述提取出的检索查询中确定第2检索查询,该第2检索查询的取得时刻在所述第1检索查询的取得时刻之前,
进而,在所述第2检索查询确定步骤中,在所述提取出的检索查询中,确定取得时刻在所述第1检索查询的取得时刻之前且具有基于所述取得时刻的连续性的检索查询,作为第2检索查询,
此外,在所述第2检索查询确定步骤中,在所述提取出的检索查询中,确定相互的取得时刻的间隔在第2规定时间内的检索查询,作为第2检索查询,
在所述检索查询取得步骤中取得的检索查询与所述用户识别信息和所述检索查询的取得时刻对应地被存储在所述检索查询存储单元中。
20.根据权利要求19所述的关联词登记方法,其特征在于还包括规定时间设定步骤,在该规定时间设定步骤中,根据在所述关联词登记步骤中登记的关联词的登记数,设定所述第2规定时间。
21.根据权利要求19所述的关联词登记方法,其特征在于还包括规定时间设定步骤,在该规定时间设定步骤中,根据所述规定用户操作计算操作时间,根据该操作时间设定所述第2规定时间。
22.根据权利要求20或21所述的关联词登记方法,其特征在于,
在所述检索查询取得步骤中,在检索中,与所述检索查询一起取得类别信息,
在所述第2检索查询确定步骤中,确定所述类别信息一致,并且取得时刻在所述第1检索查询之前且具有基于所述取得时刻的连续性的检索查询,作为第2检索查询。
23.根据权利要求20或21所述的关联词登记方法,其特征在于,
在所述第1检索查询确定步骤中,确定取得时刻最接近检测到所述用户操作的时刻的检索查询,作为第1检索查询。
24.根据权利要求20或21所述的关联词登记方法,其特征在于,
在所述第1检索查询确定步骤中,在提取出的检索查询中,确定取得时刻最晚的检索查询,作为第1检索查询。
25.根据权利要求15所述的关联词登记方法,其特征在于,
在所述第2检索查询确定步骤中,从所述提取出的检索查询中确定第2检索查询,该第2检索查询的取得时刻在所述第1检索查询的取得时刻之前,
进而,在所述第2检索查询确定步骤中,在所述提取出的检索查询中,确定取得时刻在所述第1检索查询的取得时刻之前且具有基于所述取得时刻的连续性的检索查询,作为第2检索查询,
在所述检索查询取得步骤中取得的检索查询与所述用户识别信息和所述检索查询的取得时刻对应地被存储在所述检索查询存储单元中。
26.根据权利要求25所述的关联词登记方法,其特征在于,
在所述第2检索查询确定步骤中,确定取得时刻在所述第1检索查询的取得时刻之前,且具有基于所述取得时刻的连续性,并且,检索结果数为规定值以下的检索查询,作为第2检索查询。
27.根据权利要求26所述的关联词登记方法,其特征在于,
在所述第1检索查询确定步骤中,确定取得时刻最接近检测到所述用户操作的时刻的检索查询,作为第1检索查询。
28.根据权利要求26所述的关联词登记方法,其特征在于,
在所述第1检索查询确定步骤中,在提取出的检索查询中,确定取得时刻最晚的检索查询,作为第1检索查询。
29.一种关联词登记系统,其具有终端、关联词登记装置以及关联词数据库,其中,该关联词登记装置经由网络与所述终端连接,接收来自所述终端的关联词,该关联词数据库登记所述关联词,该关联词登记系统的特征在于,
所述终端具有:
检索查询取得单元,其取得检索查询,该检索查询包含用户输入的检索字;
检索查询提取单元,在检测到不同于检索的规定用户操作的情况下,该检索查询提取单元从检索查询存储单元提取与所述用户的用户识别信息对应的检索查询,其中,该检索查询存储单元与所述用户识别信息对应地存储有所述取得的检索查询;
第1检索查询确定单元,其从所述提取出的检索查询中确定第1检索查询;
第2检索查询确定单元,其从所述提取出的检索查询中确定与所述第1检索查询不同的检索查询,作为第2检索查询;以及
关联词发送单元,其将所述第1检索查询的检索字和所述第2检索查询的检索字作为登记用的关联词而发送到所述关联词登记装置,
所述关联词登记装置具有关联词登记单元,该关联词登记单元在所述关联词数据库中登记所述接收到的第1检索查询的检索字和所述第2检索查询的检索字作为关联词。
CN201180053967.0A 2010-11-10 2011-11-07 关联词登记装置、信息处理装置、关联词登记方法以及关联词登记系统 Active CN103210387B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010252327 2010-11-10
JP2010-252327 2010-11-10
PCT/JP2011/075574 WO2012063772A1 (ja) 2010-11-10 2011-11-07 関連語登録装置、情報処理装置、関連語登録方法、関連語登録装置用プログラム、記録媒体、および、関連語登録システム

Publications (2)

Publication Number Publication Date
CN103210387A CN103210387A (zh) 2013-07-17
CN103210387B true CN103210387B (zh) 2016-10-26

Family

ID=46050918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180053967.0A Active CN103210387B (zh) 2010-11-10 2011-11-07 关联词登记装置、信息处理装置、关联词登记方法以及关联词登记系统

Country Status (8)

Country Link
US (1) US9442976B2 (zh)
EP (1) EP2639706A4 (zh)
JP (1) JP5340491B2 (zh)
KR (1) KR101523450B1 (zh)
CN (1) CN103210387B (zh)
BR (1) BR112013011570A2 (zh)
CA (1) CA2817136C (zh)
WO (1) WO2012063772A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102598038B (zh) * 2009-10-30 2015-02-18 乐天株式会社 特有内容数据判定装置、特有内容数据判定方法、内容数据生成装置以及关联内容数据插入装置
US10614134B2 (en) 2009-10-30 2020-04-07 Rakuten, Inc. Characteristic content determination device, characteristic content determination method, and recording medium
CN106570699A (zh) * 2015-10-08 2017-04-19 平安科技(深圳)有限公司 客户联系信息挖掘方法及服务器
US10984026B2 (en) * 2017-04-25 2021-04-20 Panasonic Intellectual Property Management Co., Ltd. Search method for performing search based on an obtained search word and an associated search word
WO2020235135A1 (ja) * 2019-05-20 2020-11-26 株式会社Nttドコモ 対話システム
US11010443B1 (en) * 2019-07-17 2021-05-18 Carlos Eduardo Alvidrez Falconer System and method for reading, searching and enhancing socialization and democratization of general literature and diverse types of content from an electronic text repository
CN110795612A (zh) * 2019-10-28 2020-02-14 北京字节跳动网络技术有限公司 搜索词的推荐方法、装置、电子设备和计算机可读存储介质
JP7496712B2 (ja) 2020-05-14 2024-06-07 株式会社トヨタマップマスター 検索データベースの更新方法、その装置及びそのコンピュータプログラム
JP7426302B2 (ja) * 2020-06-30 2024-02-01 日立建機株式会社 同義語生成装置、及び同義語生成プログラム
KR20220122022A (ko) * 2021-02-26 2022-09-02 삼성전자주식회사 검색 서비스를 제공하기 위한 전자 장치 및 그 작동 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6169986B1 (en) * 1998-06-15 2001-01-02 Amazon.Com, Inc. System and method for refining search queries
CN101073080A (zh) * 2004-12-09 2007-11-14 国际商业机器公司 推荐搜索引擎关键词
CN101742170A (zh) * 2008-11-07 2010-06-16 索尼株式会社 信息处理装置、信息处理方法及信息处理程序

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001290840A (ja) 2000-04-04 2001-10-19 Matsushita Electric Ind Co Ltd キーワード検索装置
JP2006085389A (ja) * 2004-09-15 2006-03-30 Kyoto Univ 検索装置
US7636714B1 (en) * 2005-03-31 2009-12-22 Google Inc. Determining query term synonyms within query context
US7840589B1 (en) * 2005-05-09 2010-11-23 Surfwax, Inc. Systems and methods for using lexically-related query elements within a dynamic object for semantic search refinement and navigation
KR100544514B1 (ko) 2005-06-27 2006-01-24 엔에이치엔(주) 검색 쿼리 연관성 판단 방법 및 시스템
KR100754768B1 (ko) * 2006-04-06 2007-09-03 엔에이치엔(주) 사용자별 맞춤 추천어를 제공하는 시스템, 방법 및 상기방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독가능한 기록 매체
KR100898142B1 (ko) * 2007-06-26 2009-05-19 박근섭 컨텐츠에 관련된 정보 키워드/정보 컨텐츠 제공 방법 및검색 방법 그리고 그 시스템
KR100889230B1 (ko) * 2007-07-13 2009-03-16 주식회사 인터파크지마켓 쇼핑몰 상품 검색 서비스 시스템 및 방법
US8051061B2 (en) * 2007-07-20 2011-11-01 Microsoft Corporation Cross-lingual query suggestion
US8694483B2 (en) * 2007-10-19 2014-04-08 Xerox Corporation Real-time query suggestion in a troubleshooting context
US7937383B2 (en) * 2008-02-01 2011-05-03 Microsoft Corporation Generating anonymous log entries
US8321431B2 (en) * 2008-08-28 2012-11-27 Frogzog, Llc Iterative and interactive context based searching
US8041733B2 (en) * 2008-10-14 2011-10-18 Yahoo! Inc. System for automatically categorizing queries
KR101052631B1 (ko) * 2009-01-29 2011-07-28 성균관대학교산학협력단 동시 발생빈도를 이용한 검색어에 대한 연관어 제공 방법 및 이를 이용한 장치
US8275759B2 (en) 2009-02-24 2012-09-25 Microsoft Corporation Contextual query suggestion in result pages
US8316019B1 (en) * 2010-06-23 2012-11-20 Google Inc. Personalized query suggestions from profile trees

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6169986B1 (en) * 1998-06-15 2001-01-02 Amazon.Com, Inc. System and method for refining search queries
CN101073080A (zh) * 2004-12-09 2007-11-14 国际商业机器公司 推荐搜索引擎关键词
CN101742170A (zh) * 2008-11-07 2010-06-16 索尼株式会社 信息处理装置、信息处理方法及信息处理程序

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Extracting Information Demand by Analyzing a WWW Search Log";Masakatsu OKUBO;《Transaction of Information Processing Society of Japan》;19980915;第39卷(第7期);第2250-2258页 *
"Using the Knowledge from Search Log";Takanori Ugai;《Information Processing Society of Japan Kenkyu Hokoku》;20001019;第2000卷(第97期);第61-66页 *

Also Published As

Publication number Publication date
KR101523450B1 (ko) 2015-05-27
CA2817136A1 (en) 2012-05-18
EP2639706A4 (en) 2014-08-27
BR112013011570A2 (pt) 2016-08-09
JP5340491B2 (ja) 2013-11-13
CA2817136C (en) 2018-06-26
KR20130086631A (ko) 2013-08-02
EP2639706A1 (en) 2013-09-18
JPWO2012063772A1 (ja) 2014-05-12
WO2012063772A1 (ja) 2012-05-18
US20130232170A1 (en) 2013-09-05
US9442976B2 (en) 2016-09-13
CN103210387A (zh) 2013-07-17

Similar Documents

Publication Publication Date Title
CN103210387B (zh) 关联词登记装置、信息处理装置、关联词登记方法以及关联词登记系统
CN106682144B (zh) 页面展示方法和装置
US9514202B2 (en) Information processing apparatus, information processing method, program for information processing apparatus and recording medium
CN103279557B (zh) 关联词登记装置、信息处理装置以及关联词登记方法
CN102822815B (zh) 用于利用浏览器历史进行动作建议的方法和系统
CN101534306B (zh) 一种钓鱼网站的检测方法及装置
CN102073725B (zh) 结构化数据的搜索方法和实现该搜索方法的搜索引擎系统
CN1934569B (zh) 集成有用户注释的搜索系统和方法
US20090125529A1 (en) Extracting information based on document structure and characteristics of attributes
EP2778959B1 (en) Information processing device, information processing method, and information processing program
CN107798571A (zh) 恶意地址/恶意订单的识别系统、方法及装置
US8359307B2 (en) Method and apparatus for building sales tools by mining data from websites
JP2013531289A (ja) 検索におけるモデル情報群の使用
CN103455524A (zh) 展现和获取词条信息的方法和装置
KR20080045532A (ko) 상품 정보를 추천하는 방법 및 상기 방법을 수행하는시스템
CN106446115A (zh) 移动上网用户分类方法及装置
US11880401B2 (en) Template generation using directed acyclic word graphs
EP3289487B1 (en) Computer-implemented methods of website analysis
CN102446191A (zh) 一种用于生成网页内容摘要的方法、设备及系统
CN108470289B (zh) 基于电商购物平台的虚拟物品发放方法及设备
CN107291797B (zh) 一种基于页面内容的信息搜索方法
CN106933864A (zh) 一种搜索引擎系统及其搜索方法
JP2013101416A (ja) 検索装置、検索方法、および、検索装置用のプログラム
JP2012103924A (ja) 関連語登録装置、関連語登録方法、関連語登録装置用プログラム、記録媒体、および、関連語登録システム
JP2013101415A (ja) 商品ウェブページ分析装置、商品ウェブページ分析方法、および、商品ウェブページ分析装置用のプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: Tokyo, Japan

Patentee after: Lotte Group Co.,Ltd.

Address before: Tokyo, Japan

Patentee before: Rakuten, Inc.

CP01 Change in the name or title of a patent holder