CN1489087A - 检索关键字分析程序、系统和方法 - Google Patents
检索关键字分析程序、系统和方法 Download PDFInfo
- Publication number
- CN1489087A CN1489087A CNA031551270A CN03155127A CN1489087A CN 1489087 A CN1489087 A CN 1489087A CN A031551270 A CNA031551270 A CN A031551270A CN 03155127 A CN03155127 A CN 03155127A CN 1489087 A CN1489087 A CN 1489087A
- Authority
- CN
- China
- Prior art keywords
- search key
- evaluation value
- access
- data
- qualitative evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
检索关键字分析系统根据使表示访问请求者的第一标识数据和表示要访问内容的第二标识数据相关的Web访问日志,抽取表示相同请求者进行的连续访问的访问顺序。Web访问日志使表示检索系统的第二标识数据和请求者输入检索系统的检索关键字相联系。分析系统从Web访问日志抽取检索关键字,计算访问顺序的定性评价值,并产生检索关键字和定性评价值之间的关系数据。
Description
技术领域
本发明涉及分析Web浏览人员(下面简称为“浏览人员”)输入WWW(万维网)检索系统(下面称为“检索系统”),以便搜索WWW中的目标Web页或Web站点的检索关键字的特征的检索关键字分析程序、系统和方法。
背景技术
因特网中的访问目标的例子是Web页和Web站点。出于各种目的,包括广播、信息提供和定单接收,运转Web页和Web站点。为了有效实现这样的目的,分析和研究Web页和Web站点,以便有效实现这样的目的。
例如,分析员通过了解哪一其它Web站点访问了分析目标Web站点,确定关于横幅广告,目录站点中的发布以及参与一流(prize)站点的策略。分析员通过了解执行了哪一检索,以及是否通过检索引擎访问了分析目标Web站点,确定内容的改进方针。
分析并研究Web页和Web站点的一种方法是使用Web访问日志的Web访问日志分析,Web访问日志保存何时以及如何访问了哪一Web页。Web访问日志主要有两种。第一种Web访问日志是记录在单一或多个Web服务器中的Web访问日志(狭义Web访问日志)。第二种Web访问日志是保存单个或者多个浏览人员对各种Web页或Web站点的访问的Web访问日志。作为第二种Web访问日志,例如存在保存WWW观众研究公司从面板(panel)(监视器)收集的,每个面板对Web页或Web站点的访问的访问日志。下面提及的Web访问日志指的是第一种Web访问日志。
例如,Web访问日志分析研究访问Web页或Web站点的浏览人员(用户、访问者)的数目如何随着时间或工作日而变化。在Web访问日志分析中,可调查浏览器或计算机OS的种类。在Web访问日志分析中,可调查浏览人员如何在单一Web站点内或多个Web站点之间表现其浏览过程。例如,阐明浏览人员已浏览Web页A,随后浏览Web页B的路径分析包含在Web访问日志分析中。
另一方面,为了支持对因特网上的Web页或Web站点的浏览,存在以检索结果页的形式表示Web页(下面称为“关键字相关页”)或Web站点(下面称为“关键字相关站点”)的一系列信息(例如关键字相关页或关键字相关站点的统一资源定位符(URL)、摘要信息、链接信息等)的检索系统。这种检索系统被广泛使用。
图1表示了使用检索系统的典型Web页的转换例子。如果在检索关键字输入屏幕1上通过浏览人员的浏览器输入检索关键字,那么指示检索开始,随后,检索系统抽取关于关键字相关页的链接2a-2c。随后,向浏览人员显示指示关于抽取的关键字相关页的链接2a-2c的检索结果页2。如果点击检索结果页2上的任意链接,那么在浏览人员的浏览器上显示点击的链接的关键字相关页。例如,点击链接2a,显示关键字相关页3。如果采用检索系统,关键字和包括其输入日期和时间的其它信息被记录在Web服务器的Web访问日志中。
于是,能够实现利用Web访问日志,对检索关键字的分析(下面称为“检索关键字分析”)。例如在检索关键字分析中,调查某一检索关键字已被输入多少次。例如,调查在检索结果页上是否实际点击了检索结果。例如,调查对应于某一检索关键字,抽取了多少关键字相关页。日本专利申请KOKAI公开No.2002-123517公开检索关键字分析技术、商业工具、非商业工具和服务。
在Web访问日志分析中,利用参考信息等,在访问分析目标Web站点之前进行Web站点分析,以及进行对应于每个检索关键字的浏览人员数目的分析。
但是,传统的Web站点访问日志分析不能使分析员了解浏览人员是否对分析目标Web站点满意,或者在分析目标Web站点中获得了多大的成功(目的)。例如,假定分析目标Web站点打算提高产品的销量。如果根据检索引擎的检索结果,访问分析目标Web站点,那么传统的Web访问日志能够获得输入检索引擎的每个检索关键字的浏览人员的数目。但是,即使存在许多浏览人员,可能也不会从分析目标Web站点购买任何产品。即使只存在不多的浏览人员,他们中的多数可能会购买该产品。
从而,分析员不能判断输入检索关键字的浏览人员是否对分析目标Web站点满意,以及浏览人员输入的哪个检索关键字实现了该Web站点的目的。例如,传统的Web访问日志分析能够调查对应于某一检索关键字,已抽取了多少关键字相关页。从防止浏览人员所需的一些Web页被遗漏的观点来看,分析员会断定抽取的关键字相关页越多,浏览人员对检索结果就越满意,反之,抽取的关键字相关页越少,浏览人员对检索结果就越不满意。但是,抽取的关键字相关页的数目并不直接表示浏览人员的满意度。实际上,在一些情况下,抽取的关键字相关页的数目越小,浏览人员越容易选择所需链接,从而浏览人员的需要被满足,满意度越高。即,如果以检索结果的形式向浏览人员呈现满足其需要的关键字相关页,那么当抽取的关键字相关页的数目越小时,浏览人员对检索结果越满意。
从而,分析员不能根据传统的Web访问日志分析,判断浏览人员是否对检索结果满意。例如,通过调查检索结果页上关键字相关页的链接是否被实际点击,以及如果点击了任意链接,那么点击的是哪个关键字相关页链接,能够了解浏览人员在检索结果页上选择了哪个关键字相关页。但是,按照传统的Web访问日志分析,分析员极难判断访问的关键字相关页是否包含浏览人员所需的内容,以及浏览人员是否对结果满意(定性评价检索结果)。
发明内容
本发明的目的在于提供充分消除由相关现有技术的局限性和缺陷引起的一个或多个问题的方法和设备。
根据本发明的第一方面,检索关键字分析程序使计算机实现访问顺序检测单元,所述访问顺序检测单元根据使WWW中的访问人员标识数据和受访人员标识数据相联系的Web访问日志,抽取指示同一访问人员的连续访问的访问顺序,并把表示访问顺序抽取结果的访问顺序数据记录在记录介质中;关键字抽取单元,如果在Web访问日志中,指示WWW中的检索系统的访问目的地标识数据和访问人员输入检索系统的检索关键字相关,那么所述关键字抽取单元抽取检索关键字,并记录指示检索关键字抽取结果的关键字数据;评价值计算单元,所述评价值计算单元根据定义用于计算与WWW中的检索系统的检索结果对应的定性评价值的标准的定性评价规则,计算和记录在记录介质中的访问顺序数据指示的访问顺序对应的定性评价值,并记录表示在由记录于记录介质中的关键字数据指示的检索关键字的访问顺序中输入的检索关键字和定性评价值之间的关系的关系数据。
于是,易于掌握检索系统根据输入的检索关键字,得到的检索结果的定性评价值。根据本发明的第一方面,访问顺序抽取单元和关键字抽取单元并行工作。
在本发明的第一方面中,评价值计算单元不仅可计算定性评价值,而且可以根据定义计算关于检索系统的检索结果的定量评价值的标准的定量评价规则,计算和记录介质中记录的访问顺序数据指示访问顺序对应的定量评价值,并记录表示在由记录于记录介质中的关键字数据指示的检索关键字的访问顺序中输入的检索关键字、定性评价值和定量评价值之间的关系的关系数据。
于是,易于掌握和检索系统根据输入的检索关键字,得到的检索结果有关的定性评价值和定量评价值,以及定性评价值和定量评价值之间的关系。
根据本发明的第二方面,检索关键字分析程序使计算机实现访问顺序抽取单元,所述访问顺序抽取单元根据使WWW中的访问人员标识数据和访问目的地标识数据相联系的Web访问日志,抽取指示同一访问人员的连续访问的访问顺序,并把表示访问顺序抽取结果的访问顺序数据记录在记录介质中;关键字抽取单元,当在记录介质记录的访问顺序数据指示的访问顺序中输入一个检索关键字时,同时在Web访问日志中,指示WWW中的检索系统的访问目的地标识数据和访问人员输入检索系统的检索关键字相关,那么所述关键字抽取单元抽取检索关键字,并把指示检索关键字抽取结果的关键字数据记录在记录介质中;以及一个评价值计算单元,所述评价值计算单元根据定义计算与当访问WWW时,检索系统的检索结果相关的定性评价值的标准的定性评价规则,计算和记录在记录介质中的访问顺序数据指示的访问顺序对应的定性评价值,并记录表示在由记录于记录介质中的关键字数据指示的检索关键字和定性评价值之间的关系的关系数据。
虽然本发明的第二方面能够获得和第一方面相同的效果,不过访问顺序抽取单元和关键字抽取单元是逐次被启动的。
在本发明的第二方面中,评价值计算单元根据定义计算关于检索系统的检索结果的定量评价值的标准的定量评价规则,计算和由记录在记录介质中的访问顺序数据指示的访问顺序对应的定性评价值,以及定性评价值,并记录指示由记录在记录介质中的关键字数据指示的关键字数据、定性评价值和定量评价值之间的关系的关系数据。
在本发明的第一和第二方面中,Web访问日志可包含使参考信息和访问目的地标识数据相关的数据,当参考信息指示检索系统时,访问顺序抽取单元抽取包含对由与参考信息相关的访问目的地标识数据指示的访问目的地的访问的访问顺序,当参考信息指示检索系统时,关键字抽取单元抽取包含在参考信息中的检索关键字,在检索关键字被输入访问顺序之后,评价值计算单元计算定性评价值。
于是,利用参考信息,甚至使得能够根据记录在访问目的地的Web访问日志,分析输入位于站点外的检索系统的检索关键字。
根据本发明的第三方面,提供一种检索关键字分析程序,所述检索关键字分析程序使计算机实现子访问顺序抽取单元,当参考信息根据使WWW中的访问人员标识数据、访问目的地标识数据和参考信息相联系的Web访问日志,指示WWW用检索系统时,子访问顺序抽取单元抽取包含对由与参考信息相关的访问目的地标识数据指示的访问目的地的访问,并表示同一访问人员的连续访问的访问顺序;关键字抽取单元,当参考信息指示检索系统时,所述关键字抽取单元包含在参考信息中的检索关键字,并把表示检索关键字抽取结果的关键字数据记录在记录介质中;评价值计算单元,所述评价值计算单元根据定义用于计算和当访问WWW时,检索系统的检索结果相关的定性评价值的标准的定性评价规则,在检索关键字被输入由记录在记录介质中的访问顺序数据指示的访问顺序中之后,计算定性评价值,并把表示和记录在记录介质中的检索关键字的访问顺序对应的检索关键字与对应于该访问顺序的定性评价值的关系的关系数据记录在记录介质中。
在本发明的第三方面中,根据定义用于计算记录在记录介质中的定性评价值的标准的定性评价规则,在对应于由记录在记录介质中的访问顺序数据指示的访问顺序的检索关键字之后,评价值计算单元不仅可以计算定性评价值,而且可以计算定量评价值,并记录表示由记录在记录介质中的关键字数据指示的检索关键字和定量评价值之间的关系的关系数据。
如果按照本发明第一到第三方面的检索关键字分析程序,获得表示检索关键字、定性评价值和定量评价值之间的关系的关系数据,那么可增加使计算机实现绘图单元的程序,所述绘图单元根据定性评价值和定量评价值绘制图形。于是,更易于掌握分析结果。
如果在根据本发明第一到第三方面的检索关键字分析程序中,获得检索关键字、定性评价值和定量评价值,那么定性评价值可以是检索结果的需要值,其数值随着检索关键字输入次数的增大而增大,定量评价规则可以是在其指导下,需要值随着检索关键字输入次数的增大而增大的规则。
在根据本发明第一到第三方面的检索关键字分析程序中,定性评价规则可以是如果分析对象检索关键字被输入访问顺序,根据使分析对象检索关键字和访问目的地标识数据(所述访问目的地标识数据增大输入所述检索关键字之后,产生访问时的成功度)相联系的数据,和记录在记录介质中的关键字数据,增大所述访问顺序的成功度的规则,在所述输入之后,由与分析对象检索关键字相关的访问目的地标识数据指示的访问目的地被访问,定性评价值可以是成功度。
这种情况下,定性评价规则可随着访问次数的增大,增大成功度,直到由在输入分析对象检索关键字之后,与分析对象检索关键字相关的访问目的地标识数据指示的访问目的地减少时为止。
在根据本发明的第一到第三方面的检索关键字分析程序中,Web访问日志访问人员标识数据、访问目的地标识数据和表示每次访问WWW时的访问时间的数据相联系,定性评价规则是随着从把检索关键字输入访问顺序中之后的访问到最后一次访问的时间间隔的增大,增大访问人员的满意度的规则,定性评价值可以是满意度。
根据本发明的第四方面,检索关键字分析程序使计算机实现子访问顺序抽取单元,所述子访问顺序抽取单元按照使WWW中的访问人员标识数据和表示访问人员的访问目的地的访问目的地标识数据相联系的Web访问日志,根据由同一访问人员对连续访问的检索结果页进行的访问确定的起始端,和关于起始端,同一访问人员在连续访问的起始端之后进行的访问确定的终止端,抽取子访问顺序,并把指示子访问顺序抽取结果的子访问顺序数据记录在记录介质中;关键字抽取单元,当在Web访问日志中,使指示WWW中的检索系统的访问目的地标识数据与访问人员输入检索系统的检索关键字相联系时,抽取检索关键字,并把表示检索关键字抽取结果的关键字数据记录在记录介质中;和评价值计算单元,所述评价值计算单元根据定性评价规则,计算和表示记录在记录介质中的子访问顺序数据的子访问顺序对应的定性评价值,并把表示和由记录介质中记录的关键字数据表示的检索关键字的子访问顺序对应的检索关键字与定性评价值之间的关系的关系数据记录在记录介质中,所述定性评价规则定义用于计算当访问WWW时,关于检索系统的检索结果的定性评价值的标准。
根据本发明的第五方面,检索关键字分析程序使计算机实现子访问顺序抽取单元,子访问顺序抽取单元按照使WWW中的访问人员标识数据和指示访问人员产生的访问目的地的访问目的地标识数据联系的Web访问日志,通过获得由对检索结果页的访问确定的起始端和下一起始端,随后根据紧邻所述下一起始端之前的访问,获得对应于所述起始端的终端点,抽取子访问顺序,并把表示子访问顺序抽取结果的子访问顺序数据记录在记录介质中;关键字抽取单元,当在Web访问日志中,使指示WWW中的检索系统的访问目的地标识数据和访问人员输入检索系统的检索关键字联系起来时,关键字抽取单元抽取检索关键字,并把指示检索关键字抽取结果的关键字数据记录在记录介质中;以及评价值计算单元,所述评价值计算单元根据定性评价规则,计算和表示记录介质中记录的子访问顺序数据的子访问顺序对应的定性评价值,并把表示和由记录在记录介质中的关键字数据指示检索关键字的子访问顺序对应的检索关键字和定性评价值之间的关系的关系数据记录在记录介质中,所述定性评价规则定义用于计算当访问WWW时,检索系统的检索结果的定性评价值的标准。
根据本发明的第六方面,检索关键字分析程序使计算机实现子访问顺序抽取单元,所述子访问顺序抽取单元按照使WWW中的访问人员标识数据和表示访问人员产生的访问目的地的访问目的地标识数据相联系的Web访问日志,通过如果获得由同一访问人员对连续访问页的检索结果页进行的访问确定的起始端和下一起始端,那么把紧接下一起始端之前的访问看作终止端,如果获得起始端,但是没有获得任意任一起始端,那么把连续访问的终止端看作对应于所述起始端的终止端,根据起始端和终止端抽取子访问顺序,并把表示子访问顺序抽取结果的子访问顺序数据记录在记录介质中;关键字抽取单元,当在Web访问日志中,使表示WWW中的检索系统的访问目的地标识数据与访问人员输入检索系统的检索关键字相联系时,抽取检索关键字,并把表示检索关键字抽取结果的关键字数据记录在记录介质中;和评价值计算单元,所述评价值计算单元根据定性评价规则,计算和表示记录在记录介质中的子访问顺序数据的子访问顺序对应的定性评价值,并把表示和由记录在记录介质中的关键字数据指示的检索关键字的子访问顺序对应的检索关键字和定性评价值之间的关系的关系数据记录在记录介质中,所述定性评价规则定义用于计算当访问WWW时,检索系统的检索结果的定性评价值的标准。
在根据本发明的第四到第六方面的检索关键字分析程序中,如果获得表示检索关键字、定性评价值和定量评价值之间的关系的关系数据,Web访问日志是使访问人员标识数据、访问目的地标识数据和表示访问时间的时间数据相联系的数据,评价值计算单元根据时间数据,获得多个时段中每个时段的关系数据,并使计算机实现趋势分析单元,所述趋势分析单元根据多个时段中每个时段的关系数据,获得表示关于检索关键字的定性评价值和定量评价值的转变条件的趋势数据,并记录在记录介质中。
于是按照时间顺序,获得将被输入检索系统,以便访问WWW中的一部分分析对象的检索关键字的定性评价值和定量评价值的变化。
在根据本发明的第一到第三方面的检索关键字分析程序中,如果获得表示检索关键字、定性评价值和定量评价值之间的关系的关系数据,Web访问日志是使访问人员标识数据,访问目的地标识数据和表示访问时间的时间数据相联系的数据,评价值计算单元根据时间数据,获得多个时段中每个时段的关系数据,并使计算机实现类别形成单元和趋势分析单元,所述类别形成单元根据使检索关键字和该检索关键字所属类别相关的类别数据,以及多个时段中每个时段的关系数据,计算多个时段中每个时段关于该类别的定性评价值和定量评价值,并记录在记录介质中,所述趋势分析单元获得指示类别的定性评价值和定量评价值的转变条件的趋势数据,并记录在记录介质中。
于是,把检索关键字联系起来,以便分析分析员希望的类别。
上面提及的检索关键字分析程序通过利用其中记录程序的记录介质,能够容易地把这些功能加入不具有相应功能的计算机、计算机系统、服务器和客户机中。
通过向检索关键字分析系统提供实现和本发明所实现的功能相同的操作的装置,获得相同的操作和效果。
通过应用本发明的检索关键字分析程序或者其中记录所述程序的记录介质,在计算机上执行易于根据输入的检索关键字,掌握关于检索系统的检索结果的定量评价值的检索关键字分析方法。
本发明的其它目的和优点将在下面的说明中陈述,并且根据所述说明,将是部分显而易见的,或者可通过实践本发明认识到。
借助下面特别指出的手段和组合,可实现和获得本发明的目的和优点。
附图说明
包含在说明书中并构成说明书一部分的附图图解说明了本发明的实施例,并且和上面给出的一般性说明,以及下面给出的实施例的详细说明一起解释本发明的原理,其中:
图1表示了使用传统的典型检索系统的Web页的转变例子;
图2是表示根据本发明第一实施例的检索关键字分析系统的结构例子的方框图;
图3是表示根据第一实施例的客户站点的结构例子的方框图;
图4表示了包含在Web访问日志7中的信息的例子;
图5表示了日志预处理单元12产生的预处理数据的例子;
图6表示了访问顺序数据的例子;
图7表示了Web访问日志7中对检索系统的请求的例子;
图8表示了关于检索系统的位置和查询模式的信息的例子;
图9根据图7和8,表示了关键字抽取单元14抽取的参数的例子;
图10表示了关键字数据的例子;
图11表示了使检索后浏览时间与满意度相联系的例子;
图12表示了满意度计算单元15产生的满意度数据的例子;
图13表示了满意度数据和关键字数据的联系结果;
图14表示了关系数据的例子;
图15是表示根据第一实施例的检索关键字分析系统的操作例子的流程图;
图16是表示根据第一实施例的关键字抽取单元的操作例子的流程图;
图17是表示根据第一实施例的满意度计算单元的操作例子的流程图;
图18是表示根据本发明第二实施例的检索关键字分析系统的结构例子的方框图;
图19表示了需要值数据的例子;
图20表示了关系数据的例子;
图21是表示根据本发明第三实施例的检索关键字分析系统的结构例子的方框图;
图22表示了根据第三实施例显示的图形的例子;
图23是表示根据本发明第四实施例的检索关键字分析系统的结构例子的方框图;
图24表示了为定性评价规则采用的访问需求页列表的例子;
图25表示了当从检索结果页到访问需求页的链接点击数增大时,降低成功度的成功度加权表的例子;
图26表示了第一中间生成数据;
图27表示了第二中间生成数据;
图28表示了根据本发明第五实施例的客户站点的结构的例子;
图29表示了客户站点61中的Web访问日志的例子;
图30是表示从离站检索系统到客户站点的转变的例子的方框图;
图31表示了使表示离站检索系统的URL模式和抽取检索关键字的查询模式相联系的数据;
图32表示了访问顺序数据的例子;
图33表示了关键字抽取单元14产生的关键字数据的例子;
图34是表示从客户站点内的检索关键字输入屏幕到离站检索系统的检索结果页,随后从检索结果页到客户站点内的关键字相关页的转变的例子的方框图;
图35表示了根据本发明第六实施例的客户站点的结构的例子;
图36表示了访问顺序/关键字数据的具体例子;
图37表示了这一阶段的中间生成数据;
图38是表示根据本发明第七实施例的检索关键字分析系统的结构例子的方框图;
图39是表示根据第七实施例的检索关键字分析系统操作例子的流程图;
图40表示了关于为访问分析对象Web站点而输入的检索关键字的需要值以及满意度的计算结果的例子;
图41表示了每个检索关键字的需要值/满意度和每个类别的需要值/满意度之间的关系的例子;
图42表示了其中把消息附加在检索关键字的转变条件上的状态的例子;
图43表示了其中把消息附加在类别的转变条件上的状态的例子;
图44表示了类别形成单元的数据转换结果的例子;
图45表示了类别形成单元的数据转换结果的例子;
图46是表示根据第七实施例的趋势分析单元的操作例子的流程图;
图47表示了依据需要边界值和满意度边界值确定的区域的命名的例子;
图48表示了根据第七实施例的趋势分析单元产生的趋势数据的例子;
图49表示了根据第七实施例,当区域被移动时,要附加的消息的另一例子;
图50表示了根据第七实施例,由输出处理单元显示的图形的例子;
图51是表示根据本发明第八实施例的趋势分析单元的结构例子的方框图;
图52表示了移动距离阈值的具体例子和趋势分析单元79的操作之间的关系;
图53表示了消息数据82的例子;
图54表示了消息和移动方向之间的关系的具体例子;
图55表示了根据第八实施例,由趋势分析单元产生的趋势数据的例子;
图56是表示根据第八实施例的检索关键字分析系统的操作例子的流程图;
图57表示了根据第八实施例,由输出处理单元输出的趋势数据的例子;
图58表示了在客户站点设置检索站点情况下,访问顺序的状态的例子;
图59表示了在检索系统位于客户站点之外的情况下,访问顺序的状态的例子;
图60表示了在检索系统存在于客户站点之外,而检索结果页存在于客户站点内的访问顺序的半途的情况下,访问顺序的状态的例子;
图61表示了在检索系统存在于客户站点内的情况下,其中在访问顺序中进行多个检索的状态的例子;
图62表示了在检索系统位于客户站点外的情况下,其中在访问顺序中进行多个检索的状态的例子;
图63表示了在既利用客户站点内的检索系统,又利用客户站点内的检索系统的访问顺序的半途,进行检索的状态的例子;
图64表示了根据客户站点内的检索系统输出的检索结果页抽取的子访问顺序和检索后浏览时间之间的关系的例子;
图65表示了根据客户站点内的检索系统输出的检索结果页抽取的子访问顺序和检索后浏览时间之间的关系的例子;
图66是表示根据本发明第九实施例的检索关键字分析系统的结构例子的方框图;
图67是表示根据第九实施例的子访问顺序的具体例子的方框图;
图68表示了访问顺序抽取单元90产生的访问顺序数据;
图69是表示根据第九实施例的子访问顺序确定单元91的具体例子的方框图;
图70是作为处理结果产生的第一临时表;
图71表示了访问顺序的屏幕转变的例子;
图72是作为处理结果产生的第二临时表;
图73是客户站点外的检索系统专用信息95的例子;
图74是作为处理结果产生的第三临时表;
图75是子访问顺序数据的抽取例子;
图76是抽取的满意度数据的例子;
图77是表示在计算机上执行的检索关键字分析系统的操作例子的流程图。
具体实施方式
现在参考附图,说明根据本发明的检索关键字分析系统和方法的实施例。这里提及的Web站点是包括至少一个Web页的一组Web。
第一实施例
本实施例涉及通过根据指示检索系统的检索结果的检索结果页,分析浏览人员的浏览操作(包括在两个或更多页内的转换),根据浏览人员输入的检索关键字,高度准确地获得检索结果的定性评价值的检索关键字分析系统。
如上所述,检索系统对应于浏览人员输入的检索关键字,抽取和确定为与检索关键字相关的关键字相关页有关的信息,并生成其列表,以便呈现给浏览人员。浏览人员根据他或她的意图,向检索系统自由输入检索关键字。从而,各种检索关键字的输入频率不会达到这些各种检索关键字中的具体比率,从而产生一定量的差异。于是,根据每个检索关键字,在依据输入的访问客户站点的检索关键字定性评价检索结果的定性评价值方面存在差异。定性评价值包括关于每个检索关键字的检索结果的需要量、数目和多样性,例如,检索关键字的输入次数被用作需要值。另外,定性评价值的例子包括根据上述检索关键字抽取的关键字相关页的数目,以及检索结果页上的点击次数。
另一方面,根据检索关键字检索的关键字相关页并不总是浏览人员所需的内容。从而,根据输入的访问客户站点的检索关键字,获得定性评价检索结果的定性评价值的含义较广。
定性评价值的一个例子是根据检索关键字功能,指示检索结果多少么有效的效果度。此外,效果度的一个例子是满意度,满意度表示使用检索系统的浏览人员对检索系统针对检索关键字提供的信息服务有多满意。效果度的另一例子是成功度,成功度表示在其自己的站点中,有多少浏览人员访问了Web站点操作员希望被访问的Web页。定性评价值的其它例子包括表示浏览人员依据检索关键字,认为检索结果有多重要的重要度。根据检索系统的性能,列举的关键字相关页的性质,内容等,检索关键字间的定性评价值存在差异。
对于Web页或Web站点的管理员来说,调查定性评价值可有效掌握浏览人员对他管理的Web页、Web站点和检索系统有多满意,并且对Web页、Web站点和检索系统的设计和内容的改进有效。
虽然在本实施例中,将说明获得满意度作为定性评价值的情况,不过获得其它定性值,而不是获得满意度的情况与此是相同的。
图2是表示检索关键字分析系统的结构例子的方框图。存储装置4保存客户站点6的Web访问日志7,客户站点6由客户5管理,客户5是调查目标Web站点的管理员。
图3是表示客户站点6的结构例子的方框图。客户站点6包括在线检索系统6a和一个或多个Web页P1-Pn。在线检索系统6a检索具体站点内的Web页。参见图3,在线检索系统6a检索客户站点6的Web页P1-Pn。
普通浏览人员8中,访问客户站点6的浏览人员被称为客户站点浏览人员8a。
图4表示Web访问日志7的例子。Web访问日志7包括客户站点浏览人员8a每次访问客户站点6的记录,所述记录包括主机名称或IP地址,客户站点浏览人员8a访问客户站点6的日期和时间信息,客户站点浏览人员8a发出的请求(URL),参考信息,进行访问的客户站点浏览人员8a的ID(用户ID)等等。
如果通过超链接访问某一Web页,那么参考信息指的是指示哪一Web页通过链接访问受访问Web页的信息。图4中,省略了和用户ID及客户站点浏览人员8a的参考信息相关的具体值的描述。
检索关键字分析系统9读出记录在记录介质10中的检索关键字分析程序11,并执行所述程序11。
当系统9读取并执行检索关键字分析程序11时,实现日志预处理单元12、访问顺序抽取单元13、关键字抽取单元14和评价值计算单元37。
评价值计算单元37包括满意度计算单元15和满意度/关键字联系单元16。
各个单元12-16产生的数据被记录在存储装置38中。各个单元12-16能够读取记录在存储装置38中的数据。内部存储器等可被用作存储装置38。通过存储装置38,可在各个单元12-16之间实现各种数据的交换。这种情况下,数据发送者把要发送的数据保存在存储装置38中,数据接收者从存储装置38读取数据。
日志预处理单元12根据保存在存储装置4中的Web访问日志7,输入检索关键字分析系统9必需的信息。
日志预处理单元12根据输入信息,为每个页访问提供完全不同的访问标识符(视图ID)。图5表示日志预处理单元12产生的预处理数据的例子。
访问顺序抽取单元13抽取客户站点浏览人员8a访问的序列Web页的顺序(下面称为“访问顺序”),并为每个访问顺序提供一个完全不同的访问顺序标识符,以便产生访问顺序抽取数据。这里提及的访问顺序指的是同一浏览人员或者视为同一人的浏览人员,即同一访问人员所进行的连续访问。
如果主机名称或IP地址和用户代理的组合彼此一致,那么访问顺序抽取单元13处理同一访问人员访问的访问顺序,并向主机名称或IP地址和用户代理的组合分配一个访问人员标识符,随后把同一访问人员连续访问的一个或多个Web页抽取为一个访问顺序。
访问顺序抽取单元13根据预定的访问顺序抽取规则,从连续页访问抽取访问顺序,产生指示访问顺序的抽取结果的访问顺序结果。例如,用于常规Web访问日志分析的抽取对话规则被用作访问顺序抽取规则。更具体地说,如果从浏览人员对某一Web页的访问到对下一Web页的访问(包括不发生转换到下一Web页的情况)所用的时间大于30分钟,那么这些访问之间的时间间隔被记录为一个对话边界(或者对话终点),随后,对话边界之间的时间隔被抽取为一个对话。所述对话被用作访问顺序。
确定访问顺序和访问顺序之间的边界的经过时间并不局限于上面提及的30分钟,而是可以自由设置。即,如果在预定的时间间隔内,同一访问人员产生多个访问,那么可采用确定所述多个访问包含在同一访问顺序内的规则。
当访问顺序被抽取时,可根据记录在Web访问日志7中的浏览人员的ID(用户ID)或Cookie信息,确定访问人员的身份。
图6表示了访问顺序数据的一个例子。图6中所示的访问顺序数据包括一个记录,所述记录包括识别每个访问顺序的访问顺序标识符(访问ID),识别主机名称和用户代理的组合的访问人员标识符(访问者ID)等等。
关键字抽取单元14从日志预处理单元12产生的预处理数据中,抽取客户站点浏览人员8a在在线检索系统6a中输入的检索关键字,产生指示检索关键字抽取结果的关键字数据。
图7表示了包含在Web访问日志7中的对检索系统的请求的例子。例1表示对基本检索系统的包括检索关键字“xxx”的请求。在例2中,请求检索关键字“yyy”及其第10页检索结果。在例3中,在请求中包含指示检索关键字“りんこ”(苹果)”的代码。
和指示检索系统的位置的查询模式表述参数及检索关键字相关的信息被用于从Web访问日志7抽取检索关键字。
图8表示了和检索系统的位置及查询模式相关的信息的例子。即,关键字抽取单元14根据和检索系统的位置有关的信息,从预处理数据抽取通过检索系统的访问。
关键字抽取单元14根据和查询模式相关的信息,抽取检索关键字。图9表示了关键字抽取单元14根据图7和8中所示的例子,抽取的参数的例子1-3。
抽取的参数包括如图9中的例3中编码的参数。
关键字抽取单元14把编码参数解码为可读字符,以便产生关键字数据。
图10表示了关键字数据的例子。图10的关键字数据包括包含访问标识符和依据对应于访问标识符的访问,输入的检索关键字的记录。
满意度计算单元15根据访问顺序抽取单元13产生的访问顺序数据,计算浏览人员的满意度。
为了计算满意度,定义指示如何计算满意度的定性评价规则。
例如,把在将检索关键字输入在线检索系统6a之后,用户站点浏览人员8a在客户站点6中的浏览检索时间(下面称为“检索后浏览时间”)越长,满意度越高的规则定义为定性评价规则。
图11表示了检索后浏览时间和满意度之间的关系的例子。检索后浏览时间是通过从获得满意度的访问顺序中的最后访问时间减去对第一关键字相关页的访问时间,获得的时间间隔。但是,如果在不存在从检索结果页到关键字相关页的任何转换的情况下,终止访问序列,那么检索后访问时间被定义为“无浏览”。如果发生了从检索结果页到关键字相关页的转换,并且在没有浏览另一站点中的任意Web页的情况下结束其访问序列,那么检索后访问时间被定义为“只浏览一页”。
即,满意度计算单元15读取访问顺序数据,计算每个访问顺序的检索后浏览时间。
满意度计算单元15读取图11中所示的检索后浏览时间和满意度之间的对应数据,并计算每个访问顺序的满意度。
图12表示满意度计算单元15计算的满意度数据的例子。
图12的满意度数据包含包括访问标识符和对应于该访问所属访问顺序标识符的满意度的记录。
满意度/关键字联系单元16使满意度计算单元15计算的满意度数据和关键字抽取单元14产生的关键字数据相联系,计算每个检索关键字的满意度,使满意度和检索关键字相联系,并产生关系数据。
满意度/关键字联系单元16读取满意度数据和关键字数据。
满意度/关键字联系单元16根据访问标识符,使满意度数据和关键字数据相联系。
图13表示了满意度数据和关键字数据之间的关系。满意度/关键字联系单元16获得每个检索关键字的满意度的平均值,以便产生关系数据。
图14表示关系数据的一个例子。
图15是表示检索关键字分析系统9的操作例子的流程图。
在步骤S1中,日志预处理单元12根据包含在Web访问日志7中的信息,输入必需的信息,产生预处理数据。
在步骤S2中,访问顺序抽取单元13根据预处理数据和访问顺序抽取规则,抽取访问顺序,产生访问顺序数据。
在步骤S3中,满意度计算单元15根据访问顺序数据和满意度计算规则,计算每个访问顺序的满意度,产生满意度数据。
在步骤S4中,关键字抽取单元14根据预处理数据,抽取输入在线检索系统6a的检索关键字,产生关键字数据。
在步骤S5中,满意度/关键字联系单元16根据满意度数据和关键字数据,计算每个检索关键字的满意度,产生关系数据。
可在步骤S2和步骤S3之前,在这两个步骤之后,或者与这两个步骤并行执行步骤S4。
图16是表示关键字抽取单元14的操作例子的流程图。
在步骤T1中,关键字抽取单元14读取和检索系统的位置及查询模式相关的信息。
在步骤T2中,关键字抽取单元14从日志预处理单元12预先处理的一个Web访问日志7读取记录。
在步骤T3中,关键字抽取单元14确定包含在读取的记录中的请求是否包含检索系统的位置。
当确定请求包括检索系统的位置时,在步骤T4中,关键字抽取单元14根据和检索系统的位置对应的查询模式,从请求中抽取参数。
当确定请求不包括检索系统的位置时,关键字抽取单元14从步骤T2重复处理。
在步骤T5中,关键字抽取单元14确定抽取的参数是否需要解码。
当需要解码时,在步骤T6中,关键字抽取单元14对抽取的参数解码。
在步骤T7中,关键字抽取单元14确定是否从日志预处理单元12预先处理的Web访问日志7读取了位于最后的记录。
如果确定没有读取位于最后的记录,那么关键字抽取单元14从步骤T2重复处理。
当确定读取了位于最后的记录,那么在步骤T8中,在抽取的参数作为检索关键字的情况下,关键字抽取单元14产生关键字数据。
图17是表示满意度计算单元15的操作例子的流程图。
在步骤U1中,满意度计算单元15读取访问顺序抽取单元13产生的访问顺序数据。
在步骤U2中,满意度计算单元15计算各个访问顺序的检索后浏览时间。
在步骤U3中,满意度计算单元15读取与检索后浏览时间和满意度之间的关系相关的数据。
在步骤U4中,满意度计算单元15获得和各个访问顺序的检索后浏览时间对应的满意度。
在步骤U5中,满意度计算单元15产生指示各个访问顺序的满意度的满意度数据。
可在步骤U1和U2之前或者与步骤U1和U2并行执行步骤U3。
在上述实施例中,作为检索关键字的分析结果,调查了客户站点浏览人员8a对其检索关键字的检索结果有多满意,不仅分析了定量评价值,而且还分析了检索关键字的高度准确的定性评价值。
例如,根据本实施例,客户5定量地了解客户站点浏览人员8a对检索结果有多满意。例如,如图14所示,当客户站点浏览人员8a对检索关键字“りんこ”(苹果)”的检索结果的满意度高时,检索关键字“砂糖(sugar)”或者检索关键字“肉野菜(meatvegetable)”的检索结果提供低的客户站点浏览人员8a的满意度。
除了满意度等代表的效果度之外,重要度或方便度也被看作是定性评价值。
重要度指的是表示Web站点浏览人员认为和检索关键字相关的内容有多重要的指标。
方便度指的是Web站点浏览人员浏览和检索关键字相关的内容,或者把所述内容写入Web站点有多容易的指标。
类似于满意度,根据检索后浏览时间,获得重要度和方便度。
根据作为分析对象的Web站点,浏览人员的性格或者分析员的观点,恰当地选择使用检索后浏览时间计算满意度、重要度和方便度中的哪一个。
例如,在销售商品的电子商务(EC)站点中存在若干类似的竞争站点的情况下,如果和检索关键字相关的内容与客户的需要不符,那么客户在相当短的时间内放弃他的浏览,离开该站点,搜索另一站点。这种情况下,最好把检索后浏览时间用作满意度。例如,如果由于对关键字“蜂蜜(honey)”的检索后浏览时间较短,获得“关于蜂蜜(honey)的满意度较低”的分析结果,那么该结果作为确定通过改进和“蜂蜜(honey)”相关的内容,采取措施提高满意度的必要性较高的原因是有效的。
另一方面,如果存在少数其它类似的竞争站点,或者如果由于合理需要,而不是由于内容满足浏览人员的需要的缘故,浏览了所提供的内容,或者如果存在希望从Web站点获得关于检索关键字的信息的许多浏览人员,那么浏览人员长时间停留在该站点中,并且浏览其信息,这取决于浏览人员认为和检索关键字相关的内容有多重要。于是,有时使用检索后浏览时间计算重要度是恰当的。这种情况下,如果获得由于关于某一检索关键字的检索后浏览时间较短,因此该检索关键字的重要度较低的分析结果,那么该结果可用作确定采取措施改进内容的必要性较低的原因。
此外,方便度可用作评价浏览人员理解提供的内容有多容易或者输入信息有多容易的指标。
例如,在根据检索关键字改变问卷内容的Web站点中,如果检索后浏览时间较长,那么认为输入问卷答案既费力又费时,并且其方便度较低。
如果存在方便度较低的内容,那么这可用作确定采取措施提高方便度的必要性较大的原因。
第二实施例
本实施例中,说明根据第一实施例的检索关键字分析系统的变型。虽然在本实施例中,描述了获得满意度作为定性评价值,同时获得需要值作为定量评价值的情况,不过如果打算获得其它定性评价值和定量评价值,那么情况与之相同。
图18是表示根据第二实施例的检索关键字分析系统的结构例子的方框图。
检索关键字分析系统18读取记录在记录介质19中的检索关键字分析程序20,并执行所述程序。
当检索关键字分析程序20被读入系统18中并被执行时,实现日志预处理单元12、访问序列抽取单元13、关键字抽取单元14和评价值计算单元39。
评价值计算单元39包括满意度计算单元15,需要值计算单元21和满意度/需要值联系单元22。
需要值计算单元21和满意度/需要值联系单元22获得的数据被保存在存储装置38中。需要值计算单元21和满意度/需要值联系单元22能够读取保存在存储装置38中的数据。
需要值计算单元21根据关键字抽取单元14产生的关键字数据,计算每个检索关键字的需要值。
为了计算需要值,定义表示如何计算需要值的定量评价规则。
例如,作为定量评价值,用每个检索关键字与检索关键字总数的百分率表示比值的数值被定义为需要值。
需要值计算单元21读取关键字抽取单元14产生的关键字数据,并计数每个检索关键字的输入次数。
需要值计算单元21根据相应检索关键字的输入次数,计算所有检索关键字的总输入次数。
需要值计算单元21根据所有检索关键字的输入次数和相应检索关键字的输入次数,用每个检索关键字与所有检索关键字的百分率表示比值。
需要值计算单元21输出指示每个检索关键字的需要值的需要值数据。
图19表示需要值数据的例子。满意度/需要值联系单元22读取满意度计算单元15产生的满意度数据和需要值计算单元21产生的需要值数据。
满意度/需要值联系单元22使满意度数据和每个检索关键字的需要值相联系,并输出表示每个检索关键字的需要值和满意度的关系数据。
图20表示关系数据的例子。
根据第二实施例,客户5通过参考定性评价值(例如,满意度)和定量评价值(例如,需要值),了解需要快速对策的检索关键字。
例如,参考图20中所示的例子,对于客户5来说,认为检索关键字“砂糖(sugar)”和“肉野菜(meat and vegetable)”表示相似的满意度,所述满意度低于其它检索关键字的满意度,“肉野菜(meat and vegetable)”的需要值高于“砂糖(sugar)”的需要值。
从而,对于客户5来说,虽然检索关键字“砂糖(sugar)”的满意度较低,但是其检索需要较低(在本实施例的情况下,在依据检索关键字“砂糖(sugar)”的检索结果页上的浏览人员的数目较小),于是,认为其影响相当低。
与此相反,对于客户5来说,虽然检索关键字“肉野菜(meatand vegetable)”具有和“砂糖(sugar)”一样低的满意度,但是它具有检索需要(在本实施例的情况下,在依据检索关键字“肉野菜(meat and vegetable)”的检索结果页上的浏览人员的数目较大),认为其影响较大。
从而,客户5确定必须采取对策,例如增加和“肉野菜(meatand vegetable)”相关的内容,以及改变在线检索系统6a及Web页P1-Pn,以便迅速并且准确地满足浏览人员的需要。
通过改变关键字抽取单元14的需要值计算单元21的设置,自由改变需要值计算方法。例如,可根据访问通过输入检索关键字获得的关键字相关页的客户站点浏览人员8a的数目,或者在关键字相关页上产生的访问的数目,计算需要值。例如,可根据按照访问顺序访问的浏览人员的数目,或者按照访问顺序进行的访问的频率(浏览次数),计算需要值。
机会值以及需要值可用作定性评价值。机会值是指示当Web站点实现其目的时,鉴于检索关键字,获得了多少商业机会的指标。例如,对于销售食品的EC站点来说,如果存在通过检索关键字“砂糖(sugar)”访问的许多浏览人员,那么该站点获得相应多的销售蔗糖的商业机会。
可根据用于计算需要值的数量,例如每个检索关键字的输入次数,计算机会值。
每个检索关键字的输入次数是被用作需要值还是计算值,取决于Web站点的浏览人员的特性或者分析员的观点。
例如,对于提供和日常品相关的信息,以了解其反应,而不仅仅是销售日用口的Web站点来说,最好把每个检索关键字的输入次数处理成需要值。
另一方面,对于主要以在线销售日用品本身的Web站点来说,最好把每个检索关键字的输入次数处理成机会值,并把该机会值用作指示销售和每个检索关键字相关的产品的机会数量的指标。
第三实施例
本实施例中,说明根据第二实施例的检索关键字分析系统的变型。
图21是表示检索关键字分析系统的结构的例子的方框图。
检索关键字分析系统24读取记录在记录介质25中的检索关键字分析程序26,并执行所述程序。
当检索关键字分析程序26被读入系统24中并被执行时,除了日志预处理单元12、访问顺序抽取单元13、关键字抽取单元14和评价值计算单元39之外,还实现绘图单元27。
绘图单元27读取满意度/需要值联系单元22产生的关系数据。
绘图单元27产生用图表示每个检索关键字的需要值/满意度的输出数据28。
绘图单元27按照规定的绘图规则和用于绘图程序的参数,画曲线图表示关系数据,所述关系数据中,使每个检索关键字的满意度和需要值相联系。
例如,绘图单元27产生散射图表。这种情况下,在满意度和需要值作为参数的情况下,通过把散射图表的一个轴(X轴)设置成需要值,把另一轴(Y轴)设置成满意度,根据关系数据中的需要值/满意度数值,标绘指示相应检索关键字的点。
图22是表示每个检索关键字的满意度和需要值的图形的例子。
由于在本实施例中,绘图表示了每个检索关键字的满意度和需要值,因此向客户5提供了形象的分析结果。
于是,客户5获得人类本能解析和判断的分析结果。
例如,由于根据图22中所示的图形,检索关键字“りんこ”(苹果)”指示高的需要值和高的满意度,而检索关键字“ス-パ-(超市)”和“肉野菜(meat and vegetable)”指示高的需要值,但是低的满意度,理解为客户5需要迅速改变在线检索系统6a和Web页P1-Pn,以便采取恰当的对策。
通过改变本实施例的绘图单元27的设置,转换图形轴线的数值,改进图形表示效果。例如,绘图单元27可在0和1之间归一化需要值和满意度。可对需要值和满意度进行对数处理,并用图形表示。此外,绘图单元27可用条形图表示需要值和满意度。另外,绘图单元27可向该图形添加恰当的辅助线。
第四实施例
本实施例中,说明根据第一到第三实施例的检索关键字分析系统的变型。虽然下面说明的是第一实施例的变型,不过同样的修改适合于第二和第三实施例。
虽然在本实施例中,说明了以成功度的形式获得定性评价值的情况,不过获得其它定性评价值,而不是成功度的其它情况与此相同。
图23是表示检索关键字分析系统的例子的方框图。
检索关键字分析系统29读取记录在记录介质30中的检索关键字分析程序31,并执行所述程序。
当检索关键字分析程序31被读入系统29中并被执行时,实现日志预处理单元12、访问顺序抽取单元12、关键字抽取单元14和评价值计算单元40。
评价值计算单元40包括成功度计算单元32和成功度/关键字联系单元41。
成功度计算单元32根据访问顺序抽取单元13获得的访问顺序数据,和关键字抽取单元14获得的关键字数据,计算成功度。
具有下述内容的规则被定义为定性评价规则。
客户5产生一个列表(下面称为“访问需求页列表”),其中使和希望被浏览人员访问的Web页(下面称为“希望访问页”)相关的识别信息和典型的检索关键字(分析候选者的检索关键字)相联系。
如果客户站点浏览人员8a通过检索结果页上的链接访问希望访问页,那么增大成功度。
但是,随着从检索结果页对于希望访问页的点击次数的增大,成功度降低。
客户5未规定的检索关键字被分类为“其它”,并且不设置任意成功度,并被排除在评价之外。
图24表示在上述定性评价规则中使用的访问需求页列表的例子。
多个希望访问页可对应于单一检索关键字,多个检索关键字可对应于单一希望访问页。
图25表示了当从检索结果页对于希望访问页的点击次数增大时,降低成功度的成功度加权表的例子。
成功度计算单元32读取访问顺序抽取单元13产生的访问顺序数据,关键字抽取单元14产生的关键字数据,访问需求页列表和成功度加权表。
成功度计算单元32可以只读取关键字数据中的检索关键字和访问标识符的组合,而不是读取所有关键字数据。
成功度计算单元32从关键字数据读取检索关键字及其包含在访问需求页列表中的检索关键字中的访问标识符(视图ID)。
成功度计算单元32在访问顺序数据中读取和上述工作读出的访问标识符相关的访问顺序标识符。
成功度计算单元32从访问顺序数据读取访问标识符和与读取的访问顺序标识符相关的请求,以便读取包含在该请求中的检索关键字。
图26表示了这一阶段的第一中间生成数据。
成功度计算单元32调查在输入检索关键字的访问顺序中是否访问了每个检索关键字的希望访问页。
如果访问了任意希望访问页,那么成功度计算单元32调查在输入检索关键字之后,希望访问页被点击访问了多少次。
如果在输入检索关键字之前访问了希望访问页,那么在计算成功度时,不考虑该访问。
在图26的例子中,和访问标识符“视图22”相关的检索关键字“りんこ”(苹果)”的希望访问页标识符是“/apple/index.html”。希望访问页标识符“/apple/index.html”对应于访问标识符“视图28”,访问标识符“视图28”和访问标识符“视图22”与相同的访问顺序标识符“访问6”相关。
在输入检索关键字“りんこ”(苹果)”之后,点击两次输入希望访问页标识符“/apple/index.html”。
成功度计算单元32根据成功度和自检索结果页的点击次数之间的关系,计算成功度。
如果应用图26和25的例子,那么由访问顺序标识符“访问6”表示的访问顺序中的检索关键字“りんこ”(苹果)”的成功度为“80”。
图27表示了这一阶段的第二中间生成数据。
成功度计算单元32产生成功度计算数据,其中获得每个检索关键字的成功度的平均值。
成功度/关键字联系单元41使成功度计算单元32产生的成功度计算数据和关键字抽取单元14产生的关键字数据相联系,以便计算每个检索关键字的成功度,并使成功度与检索关键字相联系,产生关系数据。
除了用项目“成功度”替换项目“满意度”之外,该关系数据和图14中所示关系数据相同。
利用上述这一实施例的成功度计算方法,能够了解是否对于用户希望访问的和某一检索关键字对应的Web页做出了恰当的引导。
第五实施例
本实施例中,说明根据第一到第四实施例的检索关键字分析系统的变型。
本实施例中,将说明检索系统位于客户站点6之外情况下的检索关键字分析系统。
虽然下面将说明第一实施例的变型,不过可对第二到第四实施例做出相同的修改。
图28表示了客户站点的结构的例子。
客户站点61具有一个或多个Web页P1-Pn。客户站点61中的一些Web页是由除客户5之外的第三管理方操纵的多个离站检索系统341-34n的检索对象。
如果输入了检索关键字,那么离站检索系统341-34n显示包括关于关键字相关页的链接的检索结果页。
由于根据本实施例,客户站点61的操作主体和检索系统341-34n的操作主体不同,因此和第一到第四实施例不同,难以获得检索系统341-34n的Web访问日志。
从而,根据本实施例,不是利用检索系统341-34n的Web访问日志,而是利用包含在客户站点61的Web访问日志中的参考信息,分析检索关键字。
图29表示了客户站点61的Web访问日志的例子。
图30是表示其中浏览人员从离站检索系统341转移到客户站点61进行浏览的例子的方框图。
如果浏览人员把检索关键字输入检索关键字输入屏幕35,那么产生检索结果页36。给出检索结果页36的URL可包含输入检索关键字输入屏幕35的检索关键字。
当浏览人员点击检索结果页36的链接时,如果浏览了客户站点61中的关键字相关页,那么参考信息(所述参考信息是包含检索关键字的检索结果页的URL)和请求(所述请求是被访问的客户站点61中的关键字相关页的URL)联系起来,并被记录在客户站点61的Web访问日志中。
由于检索关键字分析系统具有和图2的检索关键字分析系统相同的结构,因此将参考图2说明本实施例的主要部分。
客户站点61的Web访问日志包含参考信息。
在检索关键字分析系统中,访问顺序抽取单元13、关键字抽取单元14和满意度抽取单元15的操作与第一实施例的检索关键字分析系统9中的相应单元的操作不同。
在访问顺序标识符的请求,访问顺序的分割的确定等中,访问顺序抽取单元13执行和第一实施例的访问顺序抽取单元13相同的处理。
访问顺序抽取单元13根据关于各个访问的参考信息,确定参考信息是否表示离站检索系统。
图31表示其中表述离站检索系统的URL模式与抽取检索关键字的查询模式相联系的数据。
当访问顺序抽取单元13确定某一访问是否是来自离站检索系统的访问时,访问顺序抽取单元13调查各个访问的参考信息是否包含检索系统的任意URL模式。
访问顺序抽取单元13产生被供给访问的参考标记的访问顺序数据,其中参考信息指示离站检索系统。
图32表示访问顺序数据的例子。
图32中的参考标记“0”表示它不是来自离站检索系统的访问。
另一方面,参考标记“1”表示它是来自离站检索系统的访问。
如上所述,即使在访问顺序序列进行检索,也可记录参考标记,从而在检索后调查访问条件,并计算满意度。
关键字抽取单元14根据日志预处理单元12产生的预处理数据,搜索其中参考信息包括检索系统的URL模式的访问。
关键字抽取单元14根据和检索系统中的URL模式对应的查询模式,从包含URL模式的参考信息抽取浏览人员输入离站检索系统的检索关键字。
图33表示了关键字抽取单元14产生的关键字数据的例子。
满意度计算单元15根据访问顺序抽取单元13产生的访问顺序数据,计算满意度。
第一实施例中说明的规则将被用作计算满意度的方法。即,在读取访问顺序抽取单元13产生的访问顺序数据之后,满意度计算单元15计算Web页的各次访问的检索后浏览时间。
通过获得从具有使用检索系统的参考信息的访问(图32中具有标记“1”的访问)直到由相同访问顺序标识符指示的访问中的最后浏览的访问的时间差,计算检索后浏览时间。
在不具有把检索系统作为参考信息的访问的访问顺序中,不记录检索后浏览时间。
满意度计算单元15读取其中如图11中所示,使检索后浏览时间和满意度相联系的数据,并计算各次访问的满意度。
除非存在和检索后浏览时间相关的任意记录,否则不记录满意度。
满意度计算单元15使访问顺序标识符和关于各个访问标识符的满意度相联系,并产生和图12中所示相同的满意度数据。
根据本实施例,即使客户站点61未配备任何检索系统,也可计算检索关键字的满意度。
于是,极大地增大了其中获得检索关键字分析结果的客户站点。
虽然关于检索关键字输入屏幕35存在于离站检索系统341中的情况,说明了本实施例,不过检索关键字输入屏幕也可存在于客户站点61中。这种情况下,包含客户把参加检索服务的应用服务提供者(ASP)服务委托给在客户站点61中进行检索的系统的情况。
图34是表示客户站点61中的检索关键字输入屏幕96被改变到离站检索系统341中的检索结果页97,进一步被改变到客户站点61中的关键字相关页98的例子的方框图。
当在图34中,浏览人员把检索关键字输入检索关键字输入屏幕96中时,离站检索系统341产生检索结果页97。指示检索结果页97的URL有时包含输入客户站点61中的检索关键字输入屏幕96的检索关键字。
当浏览人员点击离站检索系统341的检索结果页97的链接,并且浏览客户站点61中的关键字相关页98时,参考信息(它是包含检索关键字的检索结果页97的URL)和请求(它是受访客户站点61中关键字相关页98的URL)联系起来,并被记录在客户站点61的Web访问日志中。
第六实施例
本实施例中,说明根据第一实施例的检索关键字分析系统的变型。
在第一到第五实施例中,彼此并行地进行访问顺序的抽取或定性计算值的计算和检索关键字的抽取,最后通过联系单元把这些结果彼此联系起来。
与此相反,本实施例串行执行检索关键字的抽取和定性评价值的计算。
虽然本实施例描述分析站点内的检索的情况,不过通过组合本实施例和第五实施例,本发明也可应用于分析站点之外的检索。
图35是表示检索关键字分析系统的结构的例子的方框图。
检索关键字分析系统42读出记录在记录介质43中的检索关键字分析程序44,并执行所述程序。
当检索关键字分析程序被读入系统42并被执行时,实现日志预处理单元12、访问顺序抽取单元13、关键字抽取单元45和评价值计算单元46。
关键字抽取单元45和评价值计算单元46产生的数据保存在存储装置38中。关键字抽取单元45和评价值计算单元46能够读取保存在存储单元38中的数据。
关键字抽取单元45从访问顺序抽取单元13产生的数据中,抽取客户站点浏览人员8a在现场(on-site)检索系统6a内输入的检索关键字。应用和第一实施例相同的方法抽取检索关键字。
即,关键字抽取单元45根据来自预处理数据的和检索系统位置有关的信息,抽取对检索系统的访问。
关键字抽取单元45根据关于查询模式的信息,抽取检索关键字。编码参数被解码成可读的字符串。
关键字抽取单元45产生访问顺序/关键字数据。对于不使用检索系统的访问,在其关键字项目中不记录任何内容。
图36表示了访问顺序/关键字数据的一个具体例子。
评价值计算单元46根据访问顺序/关键字数据,计算定性评价值,例如满意度。定性评价规则使用和第一实施例相同的规则。
即,评价值计算单元46读取访问顺序/关键字数据,以便计算每个访问序列的检索后浏览时间。根据对关键字相关页的访问时间和基于相同访问顺序标识符的访问中的最近访问时间之间的差值,计算检索后浏览时间。
评价值计算单元46读取检索后浏览时间和满意度之间的一致性,并计算各个访问顺序的满意度。
图37表示这一阶段的中间生成数据。
评价值计算单元46获得访问顺序的满意度和检索关键字。未记录其检索关键字的访问顺序不在处理对象之列。
评价值计算单元46获得各个检索关键字的满意度的平均值,并产生其关系数据。
关系数据的具体内容和图14中所示相同。
评价值计算单元46可计算定量评价值,例如需要值。在第二实施例中描述的方法被用作计算需要值的方法。如果借助评价值计算单元46计算了定性评价值和定量评价值,那么可按照和第三实施例中相同的方法,由绘图单元27显示基于关系数据的图形。
在上面提及的各个实施例中,不是并行而是串行地进行有关访问顺序的抽取,检索关键字的抽取,定性评价值的计算,以及定量评价值的计算的相应处理,从而,获得和相应实施例相同的效果。若非在每个访问顺序中,否则本实施例不允许批量处理日志。
虽然在上述各个实施例中,假定为单一访问顺序输入单一检索关键字,即使为单一访问顺序多次输入该检索关键字,也可获得检索关键字的定性评价值和定量评价值。
例如,如果多次把检索关键字输入单一访问顺序,在访问顺序作为检索关键字输入的边界的情况下,可抽取多个访问顺序,并利用抽取的访问顺序,获得定性评价值和定量评价值。
这种情况下,把其中只向单一访问顺序输入一次检索关键字的上述各个实施例的处理方法应用于分割后的访问顺序。
第七实施例
根据本实施例,说明通过执行分析对象Web站点的Web访问日志分析,根据存在于另一Web站点(所述另一Web站点不是分析对象)中的外界内容,分析作为分析对象的Web站点的浏览趋势的检索关键字分析系统。
根据本实施例,外界内容包括检索系统,根据输入检索系统的检索关键字调查浏览趋势。
图38是表示检索关键字分析系统的结构例子的方框图。
检索关键字分析系统47读取记录在记录介质48中的检索关键字分析程序49,并执行所述程序,以便实现日志预处理单元12a、访问顺序抽取单元13a、关键字抽取单元14a、评价值计算单元39a、类别形成单元52、趋势分析单元53和输出处理单元54。检索关键字分析系统47包括输出单元55和存储装置38和58-60。
日志预处理单元12a、访问顺序抽取单元13a、关键字抽取单元14a、评价值计算单元39a、类别形成单元52、趋势分析单元53和输出处理单元54可利用硬件实现。
通过把数据记录到存储装置38/从存储装置38读取数据,可在相应单元12a-14a、39a和52-54之间实现数据的提供和接收。
内部存储器和硬盘可用作存储装置38和58-60。相应的存储装置38和58-60是构成数据库的元件,每条数据可受数据库控制。相应的存储装置38和58-60被自由组合。
当浏览人员根据检索系统的检索结果进行访问时,保存在存储装置4中的Web访问日志7包含指示浏览人员所访问的单元的访问目的地标识数据,表示访问时间的时间数据(例如日期和时间)和与检索关键字相关的数据。
日志预处理单元12a、访问顺序抽取单元13a、关键字抽取单元14a和评价值计算单元39a执行与日志预处理单元12、访问顺序抽取单元13、关键字抽取单元14和评价值计算单元39相同的处理。但是,本实施例的不同之处在于根据每个预定时段的Web访问日志7的时间日志,每个预定时段的实现为访问分析对象Web站点而输入的每个检索关键字和满意度(定性评价值)及需要值(定量评价值)之间对应性的关系数据,实现每个预定时段的数据。
在日志预处理单元12a接受Web访问日志7中每个预定时段的数据之前,禁止借助相应的单元12a-14a和39a执行获得每个预定时段中的关系数据的处理。
评价值计算单元39a获得每个预定时段为访问分析对象Web站点而输入的每个检索关键字的满意度和需要值,并将其提供给类别形成单元52和趋势形成单元53。例如,如果在同一时段中计算同一检索关键字的多个定性评价值或定量评价值,那么评价值计算单元39a可获得该时段内,相同检索关键字的定性评价值或定量评价值的平均值。
类别形成单元52根据保存在存储装置58中的类别数据72,以及每个预定时段中各个检索关键字的满意度和需要值,获得各个检索关键字所属各个类别的满意度和需要值,并把获得的各个类别的满意度和需要值提供给趋势分析单元53。
类别数据72是,例如其中使检索关键字和该检索关键字所属类别联系起来的数据。
类别形成单元52获得每个时段中,属于该类别的检索关键字的需要值的总和或平均值,以便选定每个时段该类别的需要值。
类别形成单元52通过用每个时段中,属于该类别的各个检索关键字的需要值的总和去除用需要值对属于该类别的每个检索关键字加权的加权满意度的总和,得到一个数值,并把该数值用作每个时段该类别的满意度。
趋势分析单元53获得指示每个检索关键字的转变和每个类别的需要值及满意度的趋势数据73,并保存在存储装置59中。
趋势分析单元53具有区域计算单元53a、区域确定单元53b和消息添加单元53c。
区域计算单元53a根据保存在存储装置60中的需要边界值74和满意度边界值75,评价值计算单元39a获得的每个时段的满意度和需要值,以及类别形成单元52获得的每个时段的满意度和需要值,确定每个时段中,检索关键字和类别位于由需要边界值74和满意度边界值75确定的哪个区域中。
需要边界值74和满意度边界值75是表示其中每个需要值和满意度的含义被转换的边界的数值。需要边界值74和满意度边界值75确定为访问分析对象Web站点而输入的检索关键字和类别所处的区域。
区域确定单元53b确定随着时段的过去,检索关键字是否移动到该区域中,或者类别是否移动到该区域中,取决于时段的转变。
消息添加单元53c根据保存在存储单元60中的消息数据76,把和区域对应的消息(例如评论、注释等)添加到随着时间的过去,移动到该区域中的关键字或类别中。
消息数据76包括使检索关键字移动前后的区域、输入以访问分析对象Web站点的检索关键字和消息联系起来的数据。对于消息数据76来说,需要定义添加消息的规则,所述消息意味着在经过一段时间之后,如果区域发生变化,那么检索关键字被转移到该区域。
趋势分析单元53保存趋势数据73,趋势数据73包括每个时段的检索关键字和类别的需要值及满意度,每个时段的检索关键字和类别所处的区域,关于区域是否发生变化的确定结果,添加到跨过该区域移动的检索关键字中的消息,和添加到跨过该区域移动的类别中的消息。
输出处理单元54进行处理,以便通过输出单元55输出保存在存储装置59中的趋势数据73。输出处理单元54以表格、图形、各种图表或者类似形式输出趋势数据73。
图39是表示检索关键字分析系统47的例子的流程图。
在步骤V1中,日志预处理单元12a、访问顺序抽取单元13a、关键字抽取单元14a和评价值计算单元39a每隔预定时段,根据Web访问日志7的时间数据,产生使为访问分析对象Web站点而输入的各个检索关键字与其满意度和需要值相联系的关系数据。
在步骤V2中,类别形成单元52每隔一段时间,获得每个检索关键字所属类别的需要值和满意度。
在步骤V3中,趋势分析单元53的区域计算单元53a每隔一段时间,根据需要值74和满意度75,获得检索关键字和类别所处的区域,检索关键字和类别的需要值及满意度,以及检索关键字和类别所处的区域被包含在趋势数据73中。
在步骤V4中,趋势分析单元53的区域确定单元53b确定随着一段时间的过去,检索关键字所处的区域是否被改变,或者类别所处的区域是否被改变。其判断结果包含在趋势数据73中。
当确定检索关键字所处的区域或者类别所处的区域被改变时,在步骤V5中,趋势分析单元53的消息添加单元53c根据消息数据76,把对应于区域转变的消息添加到其区域被改变的检索关键字或者其区域被改变的类别中,其结果包含在趋势数据73中。
在步骤V6中,输出处理单元54根据和分析员的操作对应的趋势数据73,显示检索关键字和类别的需要值和满意度的转变以及消息。
下面,说明评价值计算单元39a获得的关系数据。
每隔一段时间,评价值计算单元39a把如图40所示,指示关于为访问分析对象Web站点而输入的检索关键字的需要值和满意度的计算结果的关系数据提供给趋势分析单元53的区域计算单元53a和类别形成单元52。
类别形成单元52每隔一段时间,根据如图41中所示的类别数据72和检索关键字的需要值及满意度,由每个检索关键字的需要值和满意度获得每个类别的需要值和满意度,并把该类别的需要值和满意度提供给趋势分析单元53的区域计算单元53a。
如图42中所示,其中按照检索关键字的转移,添加了消息的数据和如图43中所示,其中按照类别的转移,添加了消息的数据由趋势分析单元53包含在趋势数据73中,趋势数据73保存在存储装置59中。
下面详细说明类别形成单元52。
图44是表示类别形成单元52的操作例子的流程图。
在步骤W1中,类别形成单元52每隔一段时间,根据类别数据72识别属于某一类别的检索关键字。
在步骤W2中,类别形成单元52获得属于该类别的每个检索关键字的需要值的总和,如等式1所示,并且每隔一段时间将其用作该类别的需要值。
类别的需要值=∑(类别的第i个检索关键字的需要值)(1)
在步骤W3中,类别形成单元52获得属于该类别的每个检索关键字的满意度的加权平均值,如等式2所示,并且每隔一段时间将其用作该类别的满意度。
类别的满意度=∑{(类别的第i个检索关键字的需要值)×(类别的第i个检索关键字的满意度)}/∑(类别的第i个检索关键字的需 要 值)(2)
按照等式2,通过用属于该类别的检索关键字的需要值的总和去除属于该类别的每个检索关键字的满意度和需要值之间乘积的总和,获得该类别的满意度。
在步骤W4中,类别形成单元52每隔一段时间确定是否获得了所有类别的需要值和满意度,如果没有得到所有类别的需要值和满意度,那么重复步骤W1中及其后的处理。
下面,说明通过用属于该类别的每个检索关键字的需要值的总和去除用每个需要值加权的,属于该类别的每个检索关键字的满意度的总和,获得该类别的满意度的原因。
例如,假定在类别C中,虽然检索关键字C1的需要值极小,但是检索关键字C1的满意度极大。这种情况下,确定虽然利用检索关键字C1访问分析对象Web站点的浏览人员的数目极小,但是只有少数浏览人员被满足。
另一方面,假定在同一类别C中,虽然检索关键字C2的需要值极小,但是检索关键字C2的满意度也极小。这种情况下,确定虽然利用检索关键字C2访问分析对象Web站点的浏览人员的数目极大,但是没有多少浏览人员被满足。
这种情况下,假定类别C的满意度是属于该类别的检索关键字C1、C2的满意度的平均值,在相同的水平上处理具有少数浏览人员的检索关键字C1的满意度和具有许多浏览人员的检索关键字C2的满意度。于是,虽然存在许多未被满足的浏览人员,但是确定该类别具有中等的满意度。
但是,和具有少数浏览人员的检索关键字C1的满意度相比,具有许多浏览人员的检索关键字C2的满意度对类别C的满意度的影响应更大。
因而,用需要值对属于类别C的各个检索关键字C1、C2的满意度加权,并得到它们的总和。
为了不考虑浏览人员的数目,用相同的标准评价类别C和其它类别的满意度,用类别C中所有浏览人员的数目或者用属于类别C的检索关键字的需要值去除类别C中的加权满意度的总和。
图45表示了类别形成单元52的数据转换结果的例子。
类别形成单元52每隔一段时间,接收使检索关键字和该检索关键字所属类别相联系的类别数据72,和指示该检索关键字的需要值和满意度的关系数据77。
类别形成单元52每隔一段时间,获得包括该类别的需要值和满意度的类别数据78。在图45的例子中,5种检索关键字被概括成2种类别。每种类别经历和各个检索关键字相同的分析。
下面详细说明趋势分析单元53。
图46是表示趋势分析单元53的操作例子的流程图。
在步骤X1中,趋势分析单元53的区域计算单元53a根据每个时段的所有检索关键字和类别中每一个的需要值和满意度,以及需要边界值74和满意边界值75,获得每个时段所有检索关键字和类别所处的区域。区域计算单元53a把检索关键字和类别的需要值和满意度,以及检索关键字和类别的区域包含在趋势数据73中。
在步骤X2中,趋势分析单元53的区域确定单元53b通过比较该时段前后,检索关键字和类别所处的区域,确定检索关键字和类别的区域是否发生变化,获得其区域被改变的检索关键字或类别,并将其结果包含在趋势数据73中。
当检索关键字或类别所处的区域被改变时,在步骤X3中,趋势分析单元53的消息添加单元53c根据消息数据76,使对应于该时段前后的区域的消息和其区域被改变的检索关键字或类别相联系,并把这些消息包含在趋势数据73中。
图47表示了依据需要边界值74和满意度边界值75确定的区域的命名的例子。
关于需要值设置需要边界值74,同时关于满意度设置满意度边界值75。平面被分成四个部分,这四个部分被命名。
需要边界值74和满意度边界值75都被设置为100。需要值和满意度较小的区域被命名为“失败区”。需要值较小,而满意度较大的区域被命名为“隐式成功区”。需要值较大,而满意度较小的区域被命名为“机会损失区”。需要值和满意度都较大的区域被命名为“成功区”。
图48表示了趋势分析单元53产生的趋势表73的例子。
例如,时段转变前后,其区域被改变的检索关键字或类别被提供表示该检索关键字或类别被移动到其目的地区域的消息。就趋势数据73来说,向其区域被改变的检索关键字“Viking style”和“Lunch”分别提供消息“转移到成功区”和“转移到失败区”。
就提供消息来说,准备其中使经过一段时间之后的区域和其对应区域相联系消息数据76,并由趋势分析单元53的区域确定单元53b检测随着该段时间的过去,其区域被改变的检索关键字或类别。此外,还可根据消息数据76,借助趋势分析单元53的消息添加单元53c,向其区域被改变的检索关键字或类别提供和在该段时间过去之后,检索关键字或类别预定所处的区域对应的消息。
图49表示了当区域被移动时,要添加的消息的另一例子。
当该段时间过去时,越过其边界被改变的检索关键字或类别被供给指示该检索关键字或类别越过边界的方向的消息。例如,向从“隐式成功区”移动到“成功区”的检索关键字或类别提供消息“需求增加”。其它情况与此相同。
就供给消息来说,准备使该段时间过去之前的区域,该段时间过去之后的区域和消息联系起来的消息数据76,并借助趋势分析单元53的区域确定单元53b,检测当该段时间过去时,其区域被改变的检索关键字或类别。此外,根据消息数据76,趋势分析单元53的消息添加单元53c获得使其区域被改变的检索关键字或类别在该段时间过去之前的区域和在该段时间过去之后,检索关键字或类别预定所处的区域相联系的消息。
下面详细说明输出处理单元54。
输出处理单元54显示如图50所示的图形。
该图形具有表示需要值和满意度的坐标,并表示出需要边界值和满意度边界值。各个区域被命名,根据需要值和满意度标绘表示每个时段的检索关键字或类别的标记,标绘的标记用直线连接。图50表示了用箭头指示每次经过该段时间时的转移的轨迹。
另外,输出处理单元54根据如图42和43中所示的需要值和满意度,如图45中所示的每隔一段时间的类别数据78和如图48中所示的,表示检索关键字的转移及其消息的表格型趋势数据73,在输出单元55上显示每隔一段时间的检索关键字或类别的图形。
根据本实施例,分析员获得分析目标Web站点的客户收集策略和改进内容的方针。
例如,分析员获得下述效果。
首先,分析员搜索和大量浏览人员相关,但是其中浏览人员快速终止分析对象Web站点的浏览的检索关键字和类别。于是,分析员确定根据检索关键字和类别检索的分析对象Web站点是否满足浏览人员请求。分析员检测并调查不能满足浏览人员的请求的一种机会损失状态。从而,分析员通过改善分析对象Web站点中的机会损失,提高分析对象Web站点的质量。
其次,分析员确定是否存在增大访问分析对象Web站点的浏览人员的数目,并满足进行访问的浏览人员的极佳检索关键字和类别。此外,分析员确定检索关键字和类别的极佳状况是临时的还是正在不断衰退,另外,确定是否应考虑新的检索关键字和类别。
第三,分析员不仅以单个检索关键字为单位,而且还以各个检索关键字所属类别为单位,进行静态或动态分析。于是,分析员获得和分析员想要考虑的内容,以及分析员打算考虑的问题对应的分析结果,恰当并且容易地掌握分析对象Web站点的观看趋势,以便提高分析的准确性。
第四,分析员通过图形,获得关于检索关键字和类别的分析结果随时间的变化,易于掌握观看趋势随时间的变化,从而使他的分析工作有效。
第五,分析员利用关于检索关键字和类别的趋势分析的结果,很快从大量的数据获得有效数据,从而提高了分析的准确性,减轻了分析所需的劳动。
第六,分析员易于高度准确地搜索浏览人员的倾向,而不是搜索传统Web访问日志的简单集合。
第七,分析员掌握当单独分析检索关键字时不能被掌握的整个类别的趋势。
第八,分析员可顺其意图,恰当并且容易地获得遵照浏览人员意图,按照不同风格输入的检索关键字的分析结果。下面,参考其具体例子说明第八效果。
由于遵照浏览人员的意图,按照不同的风格输入检索关键字,因此即使根据Web访问日志分析,分析检索关键字,分析员也不能够顺其意图获得分析结果。
例如,假定分析员打算调查在输入关于烹饪的检索关键字之后,目前是如何访问分析对象Web站点的。这种情况下,传统的Web访问日志分析获得关心检索关键字“烹饪”的浏览人员的数目,作为分析结果,但是不会把关于涉及烹饪的其它检索关键字,例如“美食家”和“快餐”的浏览人员的数目包括在分析结果中。
但是,通过如本实施例中所述那样,以类别为单位进行分析,分析员恰当地获得他所希望的分析结果。
第八实施例
本实施例中,说明第七实施例的变型。其检索关键字分析系统和第七实施例的不同之处主要在于趋势分析单元,其它单元都相同。
在不使用需要边界值和满意度边界值的情况下,趋势分析单元获得其中把需要值和满意度设置为坐标的平面上,当该段时间过去时,检索关键字和类别的移动距离和方向。
图51是表示趋势分析单元79的结构例子的方框图。
趋势分析单元91把每个时段的检索关键字和类别的需要值和满意度用作坐标值,获得该段时间前后所有检索关键字和类别中每一个的移动距离,并向具有较大移动距离的检索关键字和类别提供与其移动方向对应的消息。
趋势分析单元79包含移动距离计算单元79a、移动距离确定单元79b、移动方向计算单元79c和消息添加单元79d。趋势分析单元79包括和在第七实施例中描述的趋势分析单元53相同的功能。
移动距离计算单元79a按照等式3,根据评价值计算单元39a获得的每个时段的检索关键字,类别形成单元52获得的每个时段的类别的需要值和满意度,获得该段时间前后,所有检索关键字和类别中每一个的移动距离,将其结果提供给移动距离确定单元79b,并将其结果包含在趋势数据81中。
移动距离确定单元79b确定每个时段的检索关键字或类别是否移动到保存在存储装置60中的移动距离阈值80之外,并把其结果包含在趋势数据81中。
图52表示移动距离阈值的具体例子和趋势分析单元79的操作之间的关系。在图52的例子中,移动距离阈值被设置为120,从而,如果移动距离为120或更大,那么执行移动方向的计算和消息的提供。
移动方向计算单元79c根据其移动距离超过移动距离阈值的检索关键字或类别的需要值和满意度,按照等式4计算随着该段时间的过去的移动距离,将其结果提供给消息添加单元79d,并将其包含在趋势数据81中。
消息添加单元79d根据保存在存储单元60中的对应于其移动方向的消息数据82,提供超过其移动距离阈值的检索关键字或类别。
图53表示了消息数据82的一个例子。指示移动距离的角度和表示需要和满意的增加和降低的消息存在对应关系。
图54表示了消息和移动方向之间的关系的具体例子。在图54中,如果移动方向为0°-30°,那么确定显示消息“需求增加”,如果移动方向为30°-60°,那么确定显示消息“需求和满意度都增加”,如果移动方向为60°-90°,那么确定显示消息“满意度增加”。
不仅定义当移动方向为0°-90°(其中需要值和满意度都增加)时的消息,而且定义当移动方向为90°-360°(其中需要值和满意度中的至少一个降低)时的消息。
图55表示了趋势分析单元79产生的趋势数据81的例子。
向其移动距离较大的检索关键字“Viking style”,“Lunch”提供对应于移动方向的消息。
图56是表示检索关键字分析系统的操作例子的流程图。
由于步骤Y1和Y2与图39中所示的步骤V1和V2相同,因此省略对其的说明。
在步骤Y3中,趋势分析单元79的移动距离计算单元79a获得该段时间过去后,检索关键字和类别的移动距离,将其结果包含在趋势数据81中,并将其提供给移动距离确定单元79b。
在步骤Y4,趋势分析单元79的移动距离确定单元79b根据保存在存储装置60中的移动距离阈值80,确定该段时间过去后,该检索关键字和类别是否超过移动距离阈值80,将其结果包含在趋势数据81中,并将其提供给移动方向计算单元79c。
在步骤Y5中,趋势分析单元79的移动方向计算单元79c计算确定其移动距离超过移动距离阈值的检索关键字或类别的移动方向,将其结果包含在趋势数据81中,并将其提供给消息添加单元79d。
在步骤Y6中,趋势分析单元79的消息添加单元79d根据保存在存储装置60中的消息数据82,把计算其移动方向的检索关键字或类别和对应于移动方向的消息添加在一起,并将其结果包含在趋势数据81中。
在步骤Y7中,输出处理单元54对应于分析员的操作,根据趋势数据81,显示检索关键字或类别的需要值和满意度的转变以及消息。
图57表示了输出处理单元54输出的趋势数据的例子。
图57表示了作为三个时段内的趋势分析结果得到的趋势数据81。在相同平面上,输出处理单元54显示每两个连续时段,趋势分析单元79产生的趋势数据81。图57表示了在第一实施例中描述的趋势数据73和本实施例中描述的趋势数据81的组合。
图57中所示的图形具有指示需要值和满意度的坐标,并显示需要边界值和满意度边界值。相应的区域被赋予区域名称。按照其需要值和满意度,标绘指示每个时段的检索关键字“party”的标记,用直线连接标绘的标记。图57显示用箭头表示每次该段时间过去时的转变的轨迹。在图57中,任意变化,即越过区域边界的情况,或者移动距离较大的情况,都被提供对应的消息。
根据本实施例,每次当该段时间过去时,分析为访问分析对象Web站点而输入的检索关键字,能够分别以移动距离和移动方向的形式,把其改变量和其改变内容提供给分析员。
根据第七实施例和本实施例,说明了分析为访问分析对象Web站点而输入的检索关键字的情况。
但是,第七实施例和本实施例可应用于分析参考Web站点或域,所述参考Web站点或域具有在访问分析对象Web站点之前,被访问的外界内容。
另外,在根据活动邮件访问分析对象Web站点的情况下,可分析活动邮件,并获得关于指示活动类型的ID的分析结果。
从而,分析员分析和检索关键字、参考Web站点和活动相关的需要水平和满意水平,以便通过空间表达掌握结果。
在第七实施例和本实施例中,一直到获得每个时段的关系数据的处理可与上述其它处理交换。即,通过持续预定时段执行各个实施例的前述各种方法,作为获得每个预定时段的关系数据的处理,可获得相同的效果。
虽然根据第七实施例和本实施例,按照等式1和2获得类别的需要值和满意度,不过也可按照利用另一定义的另一方法,获得需要值和满意度。
虽然根据本实施例,按照等式3和4获得检索关键字和类别的移动距离和移动方向,不过也可按照利用另一定义的另一方法,获得检索关键字和类别的移动距离和移动方向。
根据第七实施例和本实施例,就分析单位来说,分析对象可以不是Web站点,而是Web页或者包含多个Web页的Web页组。
虽然根据本实施例,只计算其移动距离超过其移动距离阈值的检索关键字或类别的移动方向,不过也可计算所有检索关键字或类别的移动距离和移动方向,或者可计算满足另一条件的检索关键字或类别的移动距离和移动方向。
根据第七实施例和本实施例,表示浏览人员对分析对象Web站点的期待的需要值,和表示分析对象Web站点向浏览人员提供的满意水平的满意度被用作关于分析对象的观看趋势的分析视点。但是,可随意改变关于观看趋势的分析视点。例如,完成分析对象Web站点的目标的机会数和表示目标完成的数量的完成程度可被用作分析视点。例如,可把以接收定单为目标的Web站点中的浏览人员的数目看作完成目标的机会数,把接收的定单的数量看作完成的水平,把机会数和完成水平用作分析视点。
第九实施例
根据本实施例,说明根据第一到第八实施例的检索关键字分析系统的变型。
根据第一到第八实施例,说明了把单个检索关键字输入抽取的访问序列中的情况。
下面参考图58-60,说明关于其中把单个检索关键字输入抽取的访问序列的访问序列,检索结果页2,客户站点61,客户站点61中的访问序列和检索后浏览时间的关系。
图58表示了在检索系统设置在客户站点61内的情况下的访问顺序的例子。可在第一到第四实施例和第六到第八实施例中处理这种情况。
浏览人员依次浏览Web页Pa1、Pa2,检索结果页SPa,Web页Pa3-Pa5,最后浏览Web页Pa6。Web页Pa2,检索结果页SPa,Web页Pa3-Pa5属于客户站点61。Web页Pa2是允许输入检索关键字的屏幕。
客户站点61内的访问顺序是Pa2→SPa→Pa3→Pa4→Pa5。由于按照第一实施例的定义,检索后浏览时间是通过从访问顺序(即客户站点61中的访问顺序)中的最后访问时间减去对第一关键字相关页(即紧跟在检索结果页SPa之后的Web页)的访问时间而获得的时间间隔,这等于从Web页Pa3到Web页Pa5的访问时间间隔。
图59表示了在检索系统存在于客户站点61之外的情况下的访问顺序。可在第五实施例中处理这种情况。
浏览人员依次浏览Web页Pb1,检索结果页SPb,Web页Pb2-Pb6,最后浏览Web页Pb7。Web页Pb2-Pb6是属于客户站点61的Web页。当浏览人员在离站检索系统341中,把检索关键字输入允许输入检索关键字的屏幕Pb1中时,产生检索结果页SPb。检索结果页SPb包括关于客户站点61的Web页Pb2的链接。
客户站点61内的访问顺序是Pb2→Pb3→Pb4→Pb5→Pb6。由于按照第五实施例的定义,检索后浏览时间是从由相同访问顺序标识符代表的访问中,具有使用检索系统的参考信息的访问到最后浏览的访问的时间差,因此检索后浏览时间是从Web页Pb2到Web页Pb6的访问时间间隔。
图60表示了在检索系统存在于客户站点61之外,而检索结果页存在于客户站点61内的访问序列的中途情况下的访问顺序的例子。可在第五实施例中处理这种情况。
浏览人员依次浏览Web页Pc1-Pc3,检索结果页SPc,Web页Pc4-Pc6,最后浏览Web页Pc7。Web页Pc2-Pc6是属于客户站点61的Web页。Web页Pc3是允许输入检索关键字,并对应于其输入结果的屏幕。离站检索系统341输出检索结果页SPc。
客户站点61内的访问顺序是Pc2→Pc3→Pc4→Pc5→Pc6。由于按照第五实施例的定义,检索后浏览时间是从由相同访问顺序标识符代表的访问中,具有使用检索系统的参考信息的访问到最后浏览的访问的时间差,因此检索后浏览时间是从Web页Pb4到Web页Pb6的访问时间间隔。
在第一到第三,第五到第八实施例中,如图58-60中所示,在抽取的访问序列中输入一次检索关键字,检索后浏览时间(它是从检索结果页到后面的Web页的浏览时间)被看作满意度。
在第四实施例中,在抽取的访问序列中输入一次检索关键字,获得关于该检索关键字的检索结果的成功度。
本实施例改进了第一到第八实施例。在抽取的访问序列中多次输入检索关键字。
下面说明本实施例的客户站点中的访问顺序被分成另外的一个或多个访问顺序(下面称为“子访问顺序”)的例子。根据情况,在客户站点内的访问顺序中可能不存在任何子访问顺序。
对子访问顺序应用和上述各个实施例相同的处理方法。
通过抽取由对检索结果页的访问确定的起始端,同时同一访问人员进行的连续访问的终止端作为起始端之后的抽取起始端,确定子访问顺序。下面说明从客户站点内的访问顺序抽取子访问顺序的子访问顺序抽取规则。
如果检索系统存在于客户站点内,那么按照第一规则抽取子访问顺序的起始端,如果检索系统存在于客户站点之外,那么按照第二规则抽取子访问顺序的起始端。
根据第一规则,如果客户站点中的检索系统在抽取的访问序列中输出检索结果页,那么子访问顺序的起始端是对客户站点中的检索系统输出的检索结果页的访问。
根据第二规则,如果客户站点之外的检索系统在抽取的访问序列中输出检索结果,并且紧跟该检索结果页的访问是对客户站点内的Web页的访问,那么子访问顺序的起始端是对把客户站点外的检索系统输出的检索结果页作为参考信息的客户站点内Web页的访问。
即,当由位于客户站点之外的检索系统进行检索时,子访问顺序的起始端是对在客户站点外的检索系统输出的检索结果页上选择的客户站点内Web页的访问。
紧接在访问Web页“A”之后的访问指的是同一访问人员进行的连续访问中,访问Web页“A”之后进行的访问,另外是就时间来说,和访问Web页“A”最接近的访问。假定在图59中,Web页“A”是检索结果页SPb,对Web页Pb2的访问对应于访问Web页“A”之后的访问。
按照第三规则抽取子访问顺序的终止端。
根据第三规则,子访问顺序的终止端是紧邻下一子访问顺序的起始端之前客户站点内的访问。但是,当不存在下一子访问顺序的起始端时,客户站点内的访问顺序的终止端被看作是子访问顺序的终止端。
紧邻访问Web页“A”之前的访问指的是同一访问人员进行的连续访问中,在访问Web页“A”之间进行的访问,另外是就时间来说,和访问Web页“A”最接近的访问。另外,紧邻对Web页“A”的访问之前客户站点内的访问指的是同一访问人员进行的连续访问中,在访问Web页“A”之间进行的访问,并且是就时间来说,和访问Web页“A”最近的客户站点内的访问。假定Web页“A”是Web页Pc4,Web页Pc3对应于紧邻访问Web页“A”之前客户站点内的访问。
当对客户站点内的检索系统输出的检索结果页的访问指向对把位于客户站点外的检索系统输出的检索结果页作为参考信息的Web页的访问时,采用第四规则获得子访问顺序的起始端。
根据第四规则,如果对客户站点内的检索系统输出的检索结果页的访问对应于对把位于客户站点外的检索系统输出的检索结果页作为参考信息的Web页的访问,那么对客户站点内的检索系统输出的检索结果页的访问是子访问顺序的起始端。
下面参考图61-63,说明在多个检索关键字被输入访问序列情况下的访问顺序,检索结果页,客户站点,客户站点内的访问顺序和子访问顺序的关系。
图61表示了在检索系统位于客户站点61内的情况下,在访问顺序中进行多次检索的例子。图61和图58存在一致性,其中站点内的检索系统只进行一次检索。
浏览人员依次浏览Web页Pd1和Pd2,检索结果页SPd,Web页Pd3-Pd5,检索结果页SPe、SPf,Web页Pd6和Pd7,最后浏览Web页Pd8。Web页Pd2-Pd7和检索结果页SPd-SPf是属于客户站点的Web页。Web页Pd2、Pd5和各个检索结果页SPd-SPf是允许输入检索关键字的屏幕。
根据子访问顺序抽取规则,SPd→Pd3→Pd4→Pd5,从对检索结果页SPd的访问一直到对紧邻访问下一检索结果页SPe之前客户站点内Web页的访问(即,对Web页Pd5的访问)是子访问顺序100。
同样,从对检索结果页SPe的访问一直到对紧邻访问下一检索结果页SPf之前客户站点内Web页的访问(即,对检索结果页SPe的访问)是子访问顺序101。
同样,从对检索结果页SPf一直到对客户站点61内访问顺序的终止端的访问的SPf→Pd6→Pd7是子访问顺序102。
和本例类似,一些检索结果页允许在其中输入检索关键字,或者关键字相关页可能是检索结果页。这些情况下,显示屏幕的转变或多或少与图2中所示不同。
图62表示了在检索系统存在于客户站点的情况下,在访问顺序中进行多次检索的例子。图62和图60存在一致性,其中只通过位于客户站点61外的检索系统341进行一次检索。
浏览人员依次浏览Web页Pe1-Pe4,检索结果页SPg,Web页Pe5-Pe7,检索结果页SPh,Web页Pe8和Pe10,最后浏览Web页Pe11。Web页Pe2-Pe10是属于客户站点的Web页。Web页Pe4和Pe7是允许输入检索关键字,并对应于输入结果的屏幕,离站检索系统341输出检索结果页SPg和SPh。
根据子访问顺序抽取规则,从对把检索结果页SPg作为参考信息的Web页的访问(即对Web页Pe5的访问)一直到紧接访问把下一检索结果页作为参考信息的Web页(即对Web页Pe7的访问)之前,对客户站点61内Web页的访问(即,对Web页Pe8的访问)的Pe5→Pe6→Pe7,用作第一子访问顺序。
同样,从对把检索结果页SPh作为参考信息的Web页的访问(即对Web页Pe8的访问)一直到客户站点61内访问顺序的终止端的访问(即,对Web页10的访问)的Pe8→Pe9→Pe10用作第二子访问顺序。
图63表示了既利用客户站点内的检索系统,又利用位于客户站点外的检索系统,在访问顺序的半途进行检索的例子。图63和图58-60的组合存在一致性。
浏览人员依次浏览Web页Pf1,检索结果页SPi,Web页Pf2,检索结果页SPj,Web页Pf3-Pf5,检索结果页SPk,检索结果页SPl,Web页Pf6,检索结果页SPm、SPn,和Web页Pf7、Pf8,最后浏览Web页Pf9。Web页Pf2-Pf8,和检索结果页SPj、SPl-SPn是属于客户站点61的Web页。Web页Pf1、Pf2、Pf5、Pf6和检索结果页SPi-SPn是允许输入检索关键字的屏幕。对应于Web页Pf1中检索关键字的输入结果,离站检索系统341输出检索结果页SPi,对应于Web页Pf5中的输入,离站检索系统342输出检索结果页SPk。
根据子访问顺序抽取规则,从对把检索结果页SPi作为参考信息的Web页的访问(即对Web页Pf2的访问)一直到紧邻对检索结果页SPj的访问之前,对客户站点61内Web页的访问(即,对Web页Pf2的访问)用作子访问顺序103。
同样地,从对检索结果页SPj的访问一直到紧邻对检索结果页SPk的访问之前,对客户站点61内的Web页的访问(即,对Web页Pf5的访问)用作子访问顺序104。由于对客户站点61内检索系统的检索结果页SPl的访问对应于对把位于客户站点61之外的检索系统342的检索结果页SPk作为参考信息的Web页的访问,因此根据子访问顺序抽取规则,对客户站点61内检索系统的检索结果页SPl的访问作为子访问顺序105的起始端。
同样地,从对检索结果页SPI的访问一直到紧邻访问检索结果页SPm之前,对客户站点61内的Web页的访问(即,对Web页Pf6的访问)的SPl→Sf6用作子访问顺序105。
同样地,检索结果页SPm作为子访问顺序106,SPn→Pf7→Pf8作为子访问顺序107。
下面根据上述子访问顺序,说明从客户站点61内的访问顺序抽取的子访问顺序和检索后浏览时间之间的关系。
如果检索系统存在于客户站点61内,那么客户站点61内访问顺序中的检索后浏览时间指的是通过从访问顺序(即客户站点61内的访问顺序)中的最后访问时间减去对第一关键字相关页(即紧跟在检索结果页之后的Web页)的访问时间,获得的时间间隔。当检索系统存在于客户站点61之外时,它指的是从具有使用该检索系统的参考信息的访问到最后浏览的访问的时间差。这同样适用于子访问顺序。
图64表示了在客户站点61内的检索系统输出检索结果页的情况下,其中对检索结果页的访问作为起始端的子访问顺序和检索后浏览时间之间的关系的例子。在该子访问顺序中,浏览人员依次浏览检索结果页SPo和Web页Pg1-Pg3。这种情况由第一到第四实施例和第六到第八实施例处理。
这种情况下,从访问Web页Pg1(这是访问检索结果页SPo之后的访问)到访问Web页Pg3(这是子访问顺序中的最后访问)的时间间隔是检索后浏览时间。但是,如果子访问顺序只由检索结果页SPo构成,那么检索后浏览时间被设置为0。
图65表示了在位于客户站点61之外的检索系统输出检索结果页的情况下,其中对把位于客户站点61外的检索系统输出的检索结果页作为参考信息的Web页的访问作为起始端的子访问顺序和检索后浏览时间之间的关系的例子。在该子访问顺序中,浏览人员依次浏览Web页Ph1-Ph4。这种情况由第五实施例处理。
这种情况下,从访问Web页Ph1(这是紧接检索结果页的访问(即,把检索结果页作为参考信息的访问))到访问Web页Ph4(这是子访问顺序中的最后访问)的时间间隔作为检索后浏览时间。
如果子访问顺序的起始端是对把位于客户站点61外的检索系统输出的检索结果页作为参考信息的Web页的访问,那么从位于子访问顺序的起始端的访问到该子访问顺序的终止端的浏览时间作为检索后浏览时间。但是,如果子访问顺序的起始等等于该子访问顺序的终止端,那么检索后浏览时间指的是位于该子访问顺序的起始端的访问时间。
虽然利用客户站点61内的检索系统抽取的子访问顺序包括检索结果页,但是利用位于客户站点61外的检索系统抽取的子访问顺序不包括任何检索结果页。但是,即使检索系统位于客户站点61内或者位于客户站点61外,通过根据图64和65中所示的关系,计算检索后浏览时间,也可关于客户站点61中的访问条件,正确计算定性评价值。
下面关于把本实施例的原理应用于第一实施例的情况,说明本实施例的原理。但是,本实施例的原理也可应用于第二到第八实施例。
图66是表示检索关键字分析系统的结构例子的方框图。
检索关键字分析系统83读出记录在记录介质84中的检索关键字分析程序85,并执行所述程序。
当检索关键字分析程序85被系统83读取并执行时,实现日志预处理单元12、子访问顺序抽取单元86、关键字抽取单元87和评价值计算单元88。
评价值计算单元88包括满意度计算单元89和满意度/关键字联系单元16。
各个单元12,和86-88产生的数据保存在存储装置38中。单元12,和86-88能够读取保存在存储装置38中的数据。即,通过存储装置38,可实现单元12,86-88间各种数据的交换。这种情况下,数据提供方把提供的数据记录在存储装置38中,数据接收方从存储装置38读出数据。
图67是表示子访问顺序抽取单元86的具体例子的方框图。
子访问顺序抽取单元86包括访问顺序抽取单元90和子访问顺序确定单元91。
访问顺序抽取单元90具有和访问顺序抽取单元13相同的功能,以及把确定子访问顺序所需的信息添加到作为输出结果的访问顺序数据中的特征。
访问顺序抽取单元90按照预定的访问顺序抽取规则,从一系列的Web页访问抽取访问顺序,并产生表示访问顺序抽取结果的访问顺序数据。
例如,第一实施例中提及的规则被用作访问顺序抽取规则。
图68表示了访问顺序抽取单元90产生的访问顺序数据的例子。
如图68中所示,其中向图6中所示的访问顺序数据添加参考信息的数据变成访问顺序抽取单元90产生的访问顺序数据。在图68中,用“-”表示不存在参考信息的情况。
子访问顺序确定单元91具有从抽取的访问顺序分离出子访问顺序的功能。子访问顺序确定单元92根据图68中所示的访问顺序,抽取子访问顺序。
图69是表示子访问顺序确定单元91的具体例子的方框图。
子访问顺序确定单元91包括确定起始端的子访问顺序起始端确定单元92,和确定终止端的子访问顺序终止端确定单元93。
子访问顺序起始端确定单元92根据子访问顺序抽取规则和图68中所示的访问顺序数据,确定子访问顺序的起始端。
为了确定某一访问是对客户站点61内的检索系统输出的检索结果页2的访问,子访问顺序起始端确定单元92通过利用图8中所示的指定客户站点61内的检索系统的信息94,获得起始端。
为了确定某一访问是把把位于客户站点61外的检索系统输出的检索结果页作为参考信息的Web页的访问,子访问顺序起始端确定单元92通过利用如图31中所示的指定位于客户站点61外的检索系统的信息95,获得起始端。
子访问顺序终止端确定单元93根据上述子访问顺序抽取规则,子访问顺序起始端确定单元确定的起始端数据和图28中所示的访问顺序数据,确定子访问顺序的终止端。
子访问顺序终止端确定单元93把根据确定的起始端和终止端,指示子访问顺序的抽取结果的子访问顺序数据提供给满意度计算单元88。
更具体地说,进行下述操作。首先,子访问顺序起始端确定单元92把图68中所示的访问顺序数据集合成均具有相同访问ID的访问顺序数据,并从较旧的开始,按照日期和时间的顺序重新排列这些访问顺序数据。图70表示了作为处理结果产生的第一临时表。
假定客户站点61的URL始于“http://www.○○○.co.jp/”。图71表示了按照和图58-67相同形式表示的图70中的访问顺序visit1的屏幕转变。在访问顺序visit1中,按照下述顺序对位于客户站点61外的检索系统输出的检索结果页http:/www. □□口.ne.jp/search.cgi?kw=vegitable→客户站点61内的Web页“AAA.html”→“CCC.html”→“EEE.html”→客户站点61内的检索系统输出的检索结果页“search.cgi?q=food”→客户站点内的Web页“FFF.html”→“GGG.html”进行访问。根据子访问顺序抽取规则,“AAA.html”→“CCC.html”→“EEE.html”是第一子访问顺序108,“search.cgi?q=food”→“FFF.html”→“GGG.html”是第二子访问顺序109。下面具体说明如何抽取这些子访问顺序。
在进行上述重新排列之后,按照子访问顺序抽取规则,确定作为起始端的访问是哪一个。向确定为起始端的访问提供起始端标记。图72表示作为处理结果产生的第二临时表。
就起始端标记来说,“1”表示子访问顺序的起始端,而“0”表示其它。采用指定信息94的客户站点内检索系统和指定信息95的客户站点外检索系统。图8表示了指定信息94的客户站点内检索系统的例子,图73表示了指定信息95的客户站点外检索系统的例子。
例如,图72中的view1把和图73中所示的“检索系统的URL”和“查询模式”相符的http://www. □□□.ne.jp/search.cgi?kw=vegitable作为参考信息。从而,这变成对该Web页的访问的起始端,即客户站点61内把位于客户站点外的检索系统输出的检索结果页作为参考信息的子访问顺序的起始端,在图72的view1的起始端标记中记录“1”。在图72中,view6把和在图8中所示的“检索系统的位置”和“查询模式”相符的“/search.cgi?q=banana”作为请求。从而,这变成对客户站点61内的检索系统输出的检索结果页的访问,即子访问顺序的起始端。从而,在图72中,在view6的起始端标记中记录“1”。
根据子访问顺序抽取规则,子访问顺序终止端确定单元93从图72确定作为终止端的访问。向确定为终止端的访问提供终止端标记。图74表示了作为处理结果产生的第三临时表。
就起始端/终止端标记来说,“2”表示子访问顺序的终止端,“1”表示子访问顺序的起始端,“0”表示其它。如果子访问顺序的起始端和终止端彼此重叠,那么设置“3”。例如,在图72中,相对于子访问顺序的起始端,view5是紧邻下一子访问顺序的起始端之前客户站点内的访问。从而,这变成该子访问顺序的终止端,图74的起始端/终止端标记被置为“2”。另外,在图72中,就子访问顺序的起始端来说,view13不具有下一子访问顺序的起始端,是位于客户站点61内访问顺序的终止端的访问。从而,这变成子访问顺序的终止端,图74的起始端/终止端标记被置为“2”。
根据起始端和终止端,抽取子访问顺序。向其起始端始于“1”并且终止端止于“2”,或者起始端始于“3”并且终止端止于“3”的间隔提供非重叠访问标识符(子访问ID)(下面称为子访问顺序标识符)。但是,在相同的间隔中赋予相同的访问标识符。用“-”表示始于“2”并且止于“1”的间隔,即子访问ID不具有任何值的情况。借助viewID进行重新排列。
图75表示了抽取的子访问顺序数据的例子。
这里,再次参见图71。图71中的子访问顺序108对应于图75中的SubVisit1,而子访问顺序109对应于图75中的SubVisit2。在图75中,SubVisit1是“AAA.html”→“CCC.html”→“EEE.html”,而SubVisit2是“search.cgi?q=food”→“FFF.html”→“GGG.html”。这和图71中子访问顺序108和子访问顺序109中的屏幕转变相符。从而,子访问顺序确定单元91显然能够按照子访问顺序抽取规则规定的那样很好发挥作用。
如图75中所示,在子访问顺序数据设置离站检索系统标记。
在根据位于客户站点61之外的检索系统输出的检索结果页确定的子访问顺序中,离站检索系统标记被置为“1”,在根据客户站点61内的检索系统输出的检索结果页确定的Z中,离站检索系统标记被置为“0”,其它情况下置为“-。如图63-65中所述,离站检索系统标记用于根据检索系统是位于客户站点61内还是位于客户站点61外,转换检索后浏览时间的计算方法。
关键字抽取单元87把编码的检索关键字解码为可读字符串,以便产生关键字数据。
虽然关键字抽取单元87具有下述第一和第二特征,不过其它特点和在图2中描述的关键字抽取单元14相同。
首先,关键字抽取单元87抽取位于客户站点61外的检索系统用的检索关键字。按照和第五实施例中描述的关键字抽取方法相同的方法,进行输入位于客户站点61外的检索系统的检索关键字的抽取。
其次,如果对客户站点61内的检索系统输出的检索结果页2的访问对应于对把位于客户站点61外的检索系统输出的检索结果页2作为参考信息的Web页的访问,那么,关键字抽取单元87抽取访问客户站点61内的检索系统输出的检索结果页2的检索关键字。
关键字抽取单元87抽取的关键字数据的输出格式和图10相同。
满意度计算单元89根据子访问顺序抽取单元86产生的子访问顺序数据,计算检索后浏览时间,并计算浏览人员的满意度。
虽然满意度计算单元89具有下述第一和第二特征,但是其它特点和图2中描述的满意度计算单元15相同。
首先,满意度计算单元89根据定量评价规则,不是获得每个访问顺序的检索后浏览时间,而是获得每个子访问顺序的检索后浏览时间,以便计算满意度。
其次,如图63和65中所示,满意度计算单元89根据检索系统是位于客户站点61之内还是位于客户站点61之外,转换检索后浏览时间的计算方法。根据图75中的离站检索系统标记,确定哪个子访问顺序取决于位于客户站点61之内或之外的检索系统。
图76是抽取的满意度数据的例子。
图76包含使每个访问标识符,指示访问所属的子访问顺序的子访问顺序标识符,和对应于该子访问顺序标识符的满意度联系起来的记录。就项目子访问ID来说,不具有子访问顺序标识符的部分不具有任何满意,于是用“-”表示这些部分。
满意度/关键字联系单元16根据关键字抽取单元87产生的关键字数据和图72中所示的满意度数据,使检索关键字和与检索关键字对应的子访问顺序的满意度联系起来,以便计算图14中所示形式的关系数据。
图77是表示检索关键字分析系统83的操作例子的流程图。
在步骤Z1中,日志预处理单元12根据包含在Web访问日志7中的信息,输入产生预处理数据所需的信息。
在步骤Z2中,子访问顺序抽取单元86根据预处理数据和访问顺序抽取规则,抽取访问顺序,并产生访问顺序数据。
在步骤Z3中,子访问顺序抽取单元86根据访问顺序数据和子访问顺序抽取规则,抽取子访问顺序,并产生子访问顺序数据。
在步骤Z4中,满意度计算单元15根据子访问顺序数据和满意度计算规则,计算各个子访问顺序的满意度,并产生满意度数据。
在步骤Z5中,关键字抽取单元14根据预处理数据,抽取输入客户站点6内的检索系统,以及位于客户站点6外的检索系统的检索关键字,并产生关键字数据。
在步骤Z6中,满意度/关键字联系单元16根据满意度数据和关键字数据,计算每个检索关键字的满意度,并产生关系数据。
可在步骤Z2-Z4之前、之后或者并行于步骤Z2-Z4,执行步骤Z5。
根据本实施例,即使在一系列访问序列中输入多个检索关键字(如果执行多个检索操作),也能获得多个检索关键字中每一个的定性评价值,另外能够计算每个检索关键字的定性评价值和定量评价值。
一般来说,站点浏览人员通常使用检索系统,通常他可在一系列访问中数次输入检索关键字。根据本实施例,这种情况下,也能获得每个检索关键字的定性评价值,并且能够足够准确地分析执行基于该检索关键字的检索的检索系统。
虽然根据本实施例,说明了采用满意度作为表示定量评价值的指标的情况,不过也可采用其它指标,例如成功度作为定性评价值。
除了本实施例中定义的方法之外的其它方法被用作检索后浏览时间。例如,可就与Web页的内容的关系确定检索后浏览时间。
虽然根据本实施例,子访问顺序抽取单元86在抽取访问顺序之后,抽取子访问顺序,不过也可在不抽取访问顺序的情况下,直接抽取子访问顺序。
就其排列而论,可修改上述实施例的检索关键字分析系统的每个组件或单元,只要实现相同的操作即可,并且可以自由组合这些组件和单元。
根据上述实施例,检索关键字分析系统由多个计算机构成,检索关键字分析程序可分布在多个计算机中,以便在它们之间的通信的指导下进行处理。
每个实施例的检索关键字分析程序可被写入,例如磁盘(软盘、硬盘等)、光盘(CD-ROM、DVD等)、半导体存储器和其它记录介质,并应用于计算机。另外,检索关键字分析程序可通过通信介质传送,并应用于计算机。计算机读取记录在记录介质中的检索关键字分析程序,计算机的操作由检索关键字分析程序控制,以便实现下列功能。
如上所述,根据本发明,能够快速并且高度准确地获得浏览人员的检索结果的定性评价值,因此能够根据定性评价值,改进Web页或Web站点的设计、内容和检索系统。
Claims (41)
1、一种包括计算机可用介质的产品,所述计算机可用介质具有包含于其中的计算机可读程序代码装置,所述计算机可读程序代码装置包括:
使计算机根据使指示访问请求者的第一标识数据和表示要访问内容的第二标识数据相联系的Web访问日志,抽取表示相同请求者进行的连续访问的访问顺序的计算机可读程序代码装置,Web访问日志使表示检索系统的第二标识数据和请求者输入检索系统的检索关键字相联系;
使计算机从Web访问日志抽取检索关键字的计算机可读程序代码装置;和
使计算机根据定性评价规则,计算访问顺序的定性评价值,并产生表示检索关键字和定性评价值之间关系的第一关系数据的计算机可读程序代码装置,所述定性评价规则根据访问状态,确定检索系统的检索结果的定性评价值。
2、按照权利要求1所述的产品,其特征在于还包括:
使计算机根据定量评价规则,计算访问顺序的定量评价值,并产生表示检索关键字、定性评价值和定量评价值的关系的第二关系数据的计算机可读程序代码装置,所述定量评价规则根据访问状态,确定检索系统的检索结果的定量评价值。
3、一种包括计算机可用介质的产品,所述计算机可用介质具有包含于其中的计算机可读程序代码装置,所述计算机可读程序代码装置包括:
使计算机根据使指示访问请求者的第一标识数据和表示要访问内容的第二标识数据相联系的Web访问日志,抽取表示相同请求者进行的连续访问的访问顺序的计算机可读程序代码装置,Web访问日志使表示检索系统的第二标识数据和请求者输入检索系统的检索关键字相联系,所述检索关键字在访问顺序期间输入;
使计算机从Web访问日志抽取检索关键字的计算机可读程序代码装置;和
使计算机根据定性评价规则,计算访问顺序的定性评价值,并产生表示检索关键字和定性评价值之间关系的第一关系数据的计算机可读程序代码装置,所述定性评价规则根据访问状态,确定检索系统的检索结果的定性评价值。
4、按照权利要求3所述的产品,其特征在于还包括:
使计算机根据定量评价规则,计算访问顺序的定量评价值,并产生表示检索关键字、定性评价值和定量评价值的关系的第二关系数据的计算机可读程序代码装置,所述定量评价规则根据访问状态,确定检索系统的检索结果的定量评价值。
5、按照权利要求1或3所述的产品,其特征在于:
Web访问日志还使第二标识数据和表示检索系统的参考信息相联系,
访问顺序抽取程序代码装置包括使计算机抽取包括对与参考信息相关内容的访问的访问顺序的程序代码装置,
检索关键字抽取程序代码装置包括使计算机抽取包含在参考信息中的检索关键字的程序代码;和
定性评价值计算程序代码装置包括使计算机计算输入检索关键字之后的访问顺序的定性评价值的程序代码装置。
6、一种包括计算机可用介质的产品,所述计算机可用介质具有包含于其中的计算机可读程序代码装置,所述计算机可读程序代码装置包括:
使计算机根据使指示访问请求者的第一标识数据和表示要访问内容的第二标识数据相联系的Web访问日志,抽取表示相同请求者进行的连续访问的访问顺序的计算机可读程序代码装置,Web访问日志使表示检索系统的第二标识数据与请求者输入检索系统的检索关键字及指示检索系统的参考信息相联系;
使计算机抽取包含在参考信息中的检索关键字的计算机可读程序代码装置;和
使计算机根据定性评价规则,计算输入检索关键字之后的访问顺序的定性评价值,并产生表示该访问顺序的检索关键字和定性评价值之间关系的第一关系数据的计算机可读程序代码装置,所述定性评价规则根据访问状态,确定检索系统的检索结果的定性评价值。
7、按照权利要求6所述的产品,其特征在于还包括:
使计算机根据定量评价规则,计算所述访问顺序的定量评价值,并产生表示检索关键字、定性评价值和定量评价值的关系的第二关系数据的计算机可读程序代码装置,所述定量评价规则根据访问状态,确定检索系统的检索结果的定量评价值。
8、按照权利要求2、4或7所述的产品,其特征在于还包括:
使计算机根据第二关系数据,产生表示定性评价值和定量评价值的关系的图形的计算机可读程序代码装置。
9、按照权利要求2、4或7所述的产品,其特征在于:
定量评价值包括随着检索关键字输入次数的增大而增大的检索结果需要值;和
定量评价规则包括一个规则,依照所述规则需要值随着检索关键字的输入次数的增大而增大。
10、按照权利要求1-7之一所述的产品,其特征在于:
在访问顺序中输入要分析的检索关键字,并在输入要分析的检索关键字之后,访问由与要分析的检索关键字相关的第二标识数据指示的内容,
定性评价规则包括这样的规则,所述规则根据抽取的关键字,和要分析的检索关键字与在输入要分析的检索关键字之后,增大访问内容时的成功度的、表示内容的第二标识数据之间的关系数据,增大访问顺序的成功度,和
定性评价值包括成功度。
11、按照权利要求10所述的产品,其特征在于定性评价规则随着访问次数的增大,增大成功度,直到输入要分析的检索关键字之后,由与要分析的检索关键字相关的第二标识数据指示的要访问内容减少时为止。
12、按照权利要求1-7之一所述的产品,其特征在于Web访问日志使第一标识数据和第二标识数据与每次访问的访问时间数据相联系,
定性评价规则包括当从输入检索关键字之后的访问到最后访问的时间间隔增大时,增大访问请求者的满意度的规则,和
定性评价值包括满意度。
13、一种包括计算机可用介质的产品,所述计算机可用介质具有包含于其中的计算机可读程序代码装置,所述计算机可读程序代码装置包括:
使计算机根据使指示访问请求者的第一标识数据和表示要访问内容的第二标识数据相联系的Web访问日志,抽取表示相同请求者进行的连续访问、并且具有在该处访问检索结果内容的起始端和在该处开始下一连续访问的终止端的子访问顺序的计算机可读程序代码装置,Web访问日志使表示检索系统的第二标识数据和请求者输入检索系统的检索关键字相联系;使计算机抽取检索关键字的计算机可读程序代码装置;和
使计算机根据定性评价规则,计算子访问顺序的定性评价值,并产生表示检索关键字和定性评价值之间关系的关系数据的计算机可读程序代码装置,所述定性评价规则根据访问状态,确定检索系统的检索结果的定性评价值。
14、一种包括计算机可用介质的产品,所述计算机可用介质具有包含于其中的计算机可读程序代码装置,所述计算机可读程序代码装置包括:
使计算机根据使指示访问请求者的第一标识数据和表示要访问内容的第二标识数据相联系的Web访问日志,抽取表示相同请求者进行的连续访问、并具有在该处访问检索结果内容的起始端和作为下一起始端之前的最后访问的终止端的子访问顺序的计算机可读程序代码装置,Web访问日志使表示检索系统的第二标识数据和请求者输入检索系统的检索关键字相联系;
使计算机抽取检索关键字的计算机可读程序代码装置;和
使计算机根据定性评价规则,计算子访问顺序的定性评价值,并产生表示检索关键字和定性评价值之间关系的关系数据的计算机可读程序代码装置,所述定性评价规则根据访问状态,确定检索系统的检索结果的定性评价值。
15、一种包括计算机可用介质的产品,所述计算机可用介质具有包含于其中的计算机可读程序代码装置,所述计算机可读程序代码装置包括:
使计算机根据使指示访问请求者的第一标识数据和表示要访问内容的第二标识数据相联系的Web访问日志,抽取表示相同请求者进行的连续访问、并且当找到下一起始端时,具有在该处访问检索结果内容的起始端和作为下一起始端之前的最后访问的终止端,当没有找到下一起始端时,具有所述起始端和连续访问所终止的终止端的子访问顺序的计算机可读程序代码装置,Web访问日志使表示检索系统的第二标识数据和请求者输入检索系统的检索关键字相联系;
使计算机抽取检索关键字的计算机可读程序代码装置;和
使计算机根据定性评价规则,计算子访问顺序的定性评价值,并产生表示检索关键字和定性评价值之间关系的关系数据的计算机可读程序代码装置,所述定性评价规则根据访问状态,确定检索系统的检索结果的定性评价值。
16、按照权利要求2、4或7所述的产品,其特征在于
Web访问日志还使访问时间数据与第一标识数据和第二标识数据相联系;并且
定量评价值计算程序代码装置根据访问时间数据,产生每个时段的第二关系数据,并且还包括:
使计算机根据每个时段的第二关系数据,产生检索关键字的趋势数据的计算机可读程序代码装置,趋势数据表示定性评价值和定量评价值的转变。
17、按照权利要求16所述的产品,其特征在于:
Web访问日志还使访问时间数据与第一标识数据和第二标识数据相联系;并且
定量评价值计算程序代码装置根据访问时间数据,产生每个时段的第二关系数据,并且还包括:
使计算机根据第二关系数据和使检索关键字与该关键字所属类别相联系的类别数据,计算每个时段每个类别的定性评价值和定量评价值的计算机可读程序代码装置;和
使计算机产生检索关键字的趋势数据的计算机可读程序代码装置,趋势数据表示每个时段、每个类别的定性评价值和定量评价值的转变。
18、按照权利要求17所述的产品,其特征在于趋势数据获得程序代码装置包括:
使计算机在每个时段,检测由边界确定的区域中,检索关键字所属区域的计算机可读程序代码装置;
使计算机对应于每个时段的转变,确定检索关键字所属区域是否发生变化的计算机可读程序代码装置;和
使计算机把对应于区域变化的消息添加到区域被改变的检索关键字中的计算机可读程序代码装置,并且
趋势数据包括表示通过把消息添加到区域被改变的检索关键字中所产生结果的数据。
19、按照权利要求16所述的产品,其特征在于趋势数据获得程序代码装置根据每个时段的定性评价值和定量评价值,计算每次转变时段时,检索关键字的移动距离和移动方向,并且
趋势数据包括表示每次转变时段时,检索关键字的移动距离和移动方向的数据。
20、按照权利要求16所述的产品,其特征在于趋势数据获得程序代码装置包括:
使计算机根据每个时段检索关键字的定性评价值和定量评价值,计算每次转变时段时,检索关键字的移动距离的计算机可读程序代码装置;
使计算机确定移动距离是否超过阈值的计算机可读程序代码装置;
当移动距离超过阈值时,使计算机获得检索关键字的移动方向的计算机可读程序代码装置;和
使计算机把对应于移动方向的消息添加到移动距离超过阈值的检索关键字中的计算机可读程序代码装置,并且
趋势数据包括通过把消息添加到移动距离超过阈值的检索关键字中产生的数据。
21、按照权利要求16所述的产品,其特征在于还包括:
使计算机根据趋势数据,在采用定性评价值和定量评价值作为多个轴线的空间上,布置和定性评价值及定量评价值对应的表示每个时段的检索关键字的标记,并通过对应于时段的经过顺序,用线条连接标记,显示图形的计算机可读程序代码装置。
22、按照权利要求2、4或7所述的产品,其特征在于Web访问日志使第一标识数据和第二标识数据与访问时间数据相联系,并且
定量计算值计算程序代码装置根据访问时间数据,产生每个时段的第二关系数据,还包括:
使计算机根据使检索关键字和该检索关键字所属类别相关的类别数据,以及每个时段的关系数据,计算每个时段该类别的定性评价值和定量评价值的计算机可读程序代码装置;和
使计算机产生表示关于该类别的定性评价值和定量评价值的转变的趋势数据的计算机可读程序代码装置。
23、按照权利要求22所述的产品,其特征在于还包括:
使计算机根据趋势数据,在采用定性评价值和定量评价值作为多个轴线的空间上,布置和定性评价值及定量评价值对应的表示每个时段的类别的标记,并通过对应于时段的经过顺序,用线条连接标记,显示图形的计算机可读程序代码装置。
24、一种检索关键字分析系统,包括:
根据使指示访问请求者的第一标识数据和表示要访问内容的第二标识数据相联系的Web访问日志,抽取表示相同请求者进行的连续访问的访问顺序的装置,Web访问日志使表示检索系统的第二标识数据和请求者输入检索系统的检索关键字相联系;
从Web访问日志抽取检索关键字的装置;和
根据定性评价规则,计算访问顺序的定性评价值,并产生表示检索关键字和定性评价值之间关系的第一关系数据的装置,所述定性评价规则根据访问状态,确定检索系统的检索结果的定性评价值。
25、按照权利要求24所述的检索关键字分析系统,其特征在于还包括:
根据定量评价规则,计算访问顺序的定量评价值,并产生表示检索关键字、定性评价值和定量评价值的关系的第二关系数据的装置,所述定量评价规则根据访问状态,确定检索系统的检索结果的定量评价值。
26、一种检索关键字分析系统,包括:
根据使指示访问请求者的第一标识数据和表示要访问内容的第二标识数据相联系的Web访问日志,抽取表示相同请求者进行的连续访问的访问顺序的装置,Web访问日志使表示检索系统的第二标识数据和请求者输入检索系统的检索关键字相联系,所述检索关键字在访问顺序期间输入;
从Web访问日志抽取检索关键字的装置;和
根据定性评价规则,计算访问顺序的定性评价值,并产生表示检索关键字和定性评价值之间关系的第一关系数据的装置,所述定性评价规则根据访问状态,确定检索系统的检索结果的定性评价值。
27、按照权利要求26所述的检索关键字分析系统,其特征在于还包括:
根据定量评价规则,计算访问顺序的定量评价值,并产生表示检索关键字、定性评价值和定量评价值的关系的第二关系数据的装置,所述定量评价规则根据访问状态,确定检索系统的检索结果的定量评价值。
28、一种检索关键字分析系统,包括:
根据使指示访问请求者的第一标识数据和表示要访问内容的第二标识数据相联系的Web访问日志,抽取表示相同请求者进行的连续访问的访问顺序的装置,Web访问日志使表示检索系统的第二标识数据与请求者输入检索系统的检索关键字及指示检索系统的参考信息相联系;
抽取包含在参考信息中的检索关键字的装置;和
根据定性评价规则,计算输入检索关键字后的访问顺序的定性评价值,并产生表示该访问顺序的检索关键字和定性评价值之间关系的第一关系数据的装置,所述定性评价规则根据访问状态,确定检索系统的检索结果的定性评价值。
29、按照权利要求28所述的检索关键字分析系统,其特征在于还包括:
根据定量评价规则,计算所述访问顺序的定量评价值,并产生表示检索关键字、定性评价值和定量评价值的关系的第二关系数据的装置,所述定量评价规则根据访问状态,确定检索系统的检索结果的定量评价值。
30、一种检索关键字分析系统,包括:
根据使指示访问请求者的第一标识数据和表示要访问内容的第二标识数据相联系的Web访问日志,抽取表示相同请求者进行的连续访问、并且具有在该处访问检索结果内容的起始端和在该处开始下一连续访问的终止端的子访问顺序的装置,Web访问日志使表示检索系统的第二标识数据和请求者输入检索系统的检索关键字相联系;
抽取检索关键字的装置;和
根据定性评价规则,计算子访问顺序的定性评价值,并产生表示检索关键字和定性评价值之间关系的关系数据的装置,所述定性评价规则根据访问状态,确定检索系统的检索结果的定性评价值。
31、按照权利要求25、27或29所述的检索关键字分析系统,其特征在于:
Web访问日志还使访问时间数据与第一标识数据和第二标识数据相联系;并且
定量评价值计算装置根据访问时间数据,产生每个时段的第二关系数据,还包括:
根据每个时段的第二关系数据,产生检索关键字的趋势数据的装置,趋势数据表示定性评价值和定量评价值的转变。
32、按照权利要求25、27或29所述的检索关键字分析系统,其特征在于:
Web访问日志还使访问时间数据与第一标识数据和第二标识数据相联系;并且
定量评价值计算装置根据访问时间数据,产生每个时段的第二关系数据,还包括:
根据第二关系数据和使检索关键字与该关键字所属类别相联系的类别数据,计算每个时段,每个类别的定性评价值和定量评价值的装置;和
产生检索关键字的趋势数据的装置,趋势数据表示每个时段,每个类别的定性评价值和定量评价值的转变。
33、一种检索关键字分析方法,包括下述步骤:
根据使指示访问请求者的第一标识数据和表示要访问内容的第二标识数据相联系的Web访问日志,抽取表示相同请求者进行的连续访问的访问顺序的步骤,Web访问日志使表示检索系统的第二标识数据和请求者输入检索系统的检索关键字相联系;
从Web访问日志抽取检索关键字的步骤;和
根据定性评价规则,计算访问顺序的定性评价值,并产生表示检索关键字和定性评价值之间关系的第一关系数据的步骤,所述定性评价规则根据访问状态,确定检索系统的检索结果的定性评价值。
34、按照权利要求33所述的检索关键字分析方法,其特征在于还包括下述步骤:
根据定量评价规则,计算访问顺序的定量评价值,并产生表示检索关键字、定性评价值和定量评价值的关系的第二关系数据的步骤,所述定量评价规则根据访问状态,确定检索系统的检索结果的定量评价值。
35、一种检索关键字分析方法,包括下述步骤:
根据使指示访问请求者的第一标识数据和表示要访问内容的第二标识数据相联系的Web访问日志,抽取表示相同请求者进行的连续访问的访问顺序的步骤,Web访问日志使表示检索系统的第二标识数据和请求者输入检索系统的检索关键字相联系,所述检索关键字在访问顺序期间输入;
从Web访问日志抽取检索关键字的步骤;和
根据定性评价规则,计算访问顺序的定性评价值,并产生表示检索关键字和定性评价值之间关系的第一关系数据的步骤,所述定性评价规则根据访问状态,确定检索系统的检索结果的定性评价值。
36、按照权利要求35所述的检索关键字分析方法,其特征在于还包括下述步骤:
根据定量评价规则,计算访问顺序的定量评价值,并产生表示检索关键字、定性评价值和定量评价值的关系的第二关系数据的步骤,所述定量评价规则根据访问状态,确定检索系统的检索结果的定量评价值。
37、一种检索关键字分析方法,包括下述步骤:
根据使指示访问请求者的第一标识数据和表示要访问内容的第二标识数据相联系的Web访问日志,抽取表示相同请求者进行的连续访问的访问顺序的步骤,Web访问日志使表示检索系统的第二标识数据与请求者输入检索系统的检索关键字及指示检索系统的参考信息相联系;
抽取包含在参考信息中的检索关键字的步骤;和
根据定性评价规则,计算输入检索关键字后的访问顺序的定性评价值,并产生表示该访问顺序的检索关键字和定性评价值之间关系的第一关系数据的步骤,所述定性评价规则根据访问状态,确定检索系统的检索结果的定性评价值。
38、按照权利要求37所述的检索关键字分析方法,其特征在于还包括下述步骤:
根据定量评价规则,计算所述访问顺序的定量评价值,并产生表示检索关键字、定性评价值和定量评价值的关系的第二关系数据的步骤,所述定量评价规则根据访问状态,确定检索系统的检索结果的定量评价值。
39、一种检索关键字分析方法,包括下述步骤:
根据使指示访问请求者的第一标识数据和表示要访问内容的第二标识数据相联系的Web访问日志,抽取表示相同请求者进行的连续访问、并且具有在该处访问检索结果内容的起始端和在该处开始下一连续访问的终止端的子访问顺序的步骤,Web访问日志使表示检索系统的第二标识数据和请求者输入检索系统的检索关键字相联系;
抽取检索关键字的步骤;和
根据定性评价规则,计算子访问顺序的定性评价值,并产生表示检索关键字和定性评价值之间关系的关系数据的步骤,所述定性评价规则根据访问状态,确定检索系统的检索结果的定性评价值。
40、按照权利要求34、36或38所述的检索关键字分析方法,其特征在于:
Web访问日志还使访问时间数据与第一标识数据和第二标识数据相联系;并且
定量评价值计算装置根据访问时间数据,产生每个时段的第二关系数据,还包括下述步骤:
根据每个时段的第二关系数据,产生检索关键字的趋势数据的步骤,趋势数据表示定性评价值和定量评价值的转变。
41、按照权利要求34、36或38所述的检索关键字分析方法,其特征在于:
Web访问日志还使访问时间数据与第一标识数据和第二标识数据相联系;并且
定量评价值计算装置根据访问时间数据,产生每个时段的第二关系数据,还包括下述步骤:
根据第二关系数据和使检索关键字与该关键字所属类别相联系的类别数据,计算每个时段,每个类别的定性评价值和定量评价值的步骤;和
产生检索关键字的趋势数据的步骤,趋势数据表示每个时段,每个类别的定性评价值和定量评价值的转变。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002243466 | 2002-08-23 | ||
JP243466/2002 | 2002-08-23 | ||
JP382396/2002 | 2002-12-27 | ||
JP2002382396 | 2002-12-27 | ||
JP2003070281A JP4363868B2 (ja) | 2002-08-23 | 2003-03-14 | 検索キーワード分析プログラム及びシステム並びに方法 |
JP070281/2003 | 2003-03-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1489087A true CN1489087A (zh) | 2004-04-14 |
CN1279477C CN1279477C (zh) | 2006-10-11 |
Family
ID=32912804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB031551270A Expired - Fee Related CN1279477C (zh) | 2002-08-23 | 2003-08-22 | 检索关键字分析系统和方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7809737B2 (zh) |
JP (1) | JP4363868B2 (zh) |
CN (1) | CN1279477C (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100416569C (zh) * | 2006-01-10 | 2008-09-03 | 西安交通大学 | 一种基于Web页面元数据的用户访问行为形式化描述方法 |
CN100452055C (zh) * | 2007-04-13 | 2009-01-14 | 清华大学 | 一种用于文本或网络内容分析的大规模多关键词匹配方法 |
CN101589380B (zh) * | 2006-01-30 | 2012-07-04 | 微软公司 | 基于上下文的代码分析 |
CN103713987A (zh) * | 2012-10-08 | 2014-04-09 | 尤尼西斯公司 | 基于关键词的日志处理 |
CN108292318A (zh) * | 2015-10-01 | 2018-07-17 | 电子湾有限公司 | 生成概念图 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2463891C (en) * | 2001-10-17 | 2012-07-17 | Npx Technologies Ltd. | Verification of a person identifier received online |
US8046350B1 (en) * | 2003-09-24 | 2011-10-25 | Google Inc. | Systems and methods for detecting commercial queries |
US7657519B2 (en) * | 2004-09-30 | 2010-02-02 | Microsoft Corporation | Forming intent-based clusters and employing same by search |
US20060085401A1 (en) * | 2004-10-20 | 2006-04-20 | Microsoft Corporation | Analyzing operational and other data from search system or the like |
JP4820147B2 (ja) * | 2004-11-12 | 2011-11-24 | ヤフー株式会社 | 属性評価プログラム、属性評価システムおよび属性評価方法 |
JP2007183838A (ja) * | 2006-01-06 | 2007-07-19 | Fujitsu Ltd | クエリーパラメーター出力ページ発見プログラム、クエリーパラメーター出力ページ発見方法およびクエリーパラメーター出力ページ発見装置 |
JP5260969B2 (ja) * | 2008-01-10 | 2013-08-14 | 日本電信電話株式会社 | 集中度監視によるWebサイト推奨装置、集中度監視によるWebサイト推奨方法、集中度監視によるWebサイト推奨プログラムおよびそのプログラムを記録した記録媒体 |
US8171033B2 (en) * | 2008-09-30 | 2012-05-01 | Vmware, Inc. | Methods and systems for the determination of thresholds via weighted quantile analysis |
JP4729089B2 (ja) * | 2008-10-06 | 2011-07-20 | 三菱電機インフォメーションシステムズ株式会社 | ウェブサイト集計装置及びウェブサイト集計プログラム |
JP5155130B2 (ja) * | 2008-12-15 | 2013-02-27 | ヤフー株式会社 | カテゴリ提示装置 |
US8347021B1 (en) | 2010-04-09 | 2013-01-01 | Google Inc. | Storing application messages |
US8768861B2 (en) * | 2010-05-31 | 2014-07-01 | Yahoo! Inc. | Research mission identification |
CN101917456B (zh) * | 2010-07-06 | 2012-10-03 | 杭州热点信息技术有限公司 | 一种内容聚合无线发布系统 |
JP5682480B2 (ja) * | 2011-06-30 | 2015-03-11 | 富士通株式会社 | 情報処理装置、情報処理方法、および情報処理プログラム |
US9521205B1 (en) * | 2011-08-01 | 2016-12-13 | Google Inc. | Analyzing changes in web analytics metrics |
US11202958B2 (en) * | 2012-04-11 | 2021-12-21 | Microsoft Technology Licensing, Llc | Developing implicit metadata for data stores |
CN102902755A (zh) * | 2012-09-21 | 2013-01-30 | 北京百度网讯科技有限公司 | 一种对检索结果项的排序进行调整的方法及装置 |
US10789366B2 (en) | 2013-06-24 | 2020-09-29 | Nippon Telegraph And Telephone Corporation | Security information management system and security information management method |
WO2015016133A1 (ja) * | 2013-07-30 | 2015-02-05 | 日本電信電話株式会社 | 情報管理装置及び情報管理方法 |
JP6504757B2 (ja) * | 2014-07-01 | 2019-04-24 | 株式会社リクルート | ウェブ評価装置、ウェブ評価方法およびウェブ評価プログラム |
CN104579754B (zh) * | 2014-12-18 | 2018-01-26 | 国云科技股份有限公司 | 一种统计Web应用用户访问时间特性的方法 |
JP6669244B2 (ja) * | 2016-03-17 | 2020-03-18 | 富士通株式会社 | 情報処理装置、情報配信システム、情報処理方法、および情報処理プログラム |
JP6723650B2 (ja) * | 2016-08-09 | 2020-07-15 | ヤフー株式会社 | 抽出装置、抽出方法、及び抽出プログラム |
CN106560808A (zh) * | 2016-08-16 | 2017-04-12 | 武汉斗鱼网络科技有限公司 | 一种计算互联网关键词的检索精度的方法及系统 |
US10776798B2 (en) * | 2017-04-25 | 2020-09-15 | Comscore, Inc. | Device identification systems and methods |
US11244013B2 (en) * | 2018-06-01 | 2022-02-08 | International Business Machines Corporation | Tracking the evolution of topic rankings from contextual data |
JP7127080B2 (ja) * | 2020-03-19 | 2022-08-29 | ヤフー株式会社 | 判定装置、判定方法及び判定プログラム |
CN115118582B (zh) * | 2022-06-15 | 2024-04-16 | 合肥移瑞通信技术有限公司 | 日志分析的方法和装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2179315A1 (en) * | 1993-12-17 | 1995-06-22 | Roger S. Cubicciotti | Nucleotide-directed assembly of bimolecular and multimolecular drugs and devices |
JP2001222538A (ja) | 2000-02-07 | 2001-08-17 | Net Beesu:Kk | 情報検索システム |
JP2002123517A (ja) | 2000-10-16 | 2002-04-26 | Noboru Hayakawa | 検索キーワード解析システム |
US20030113714A1 (en) * | 2001-09-28 | 2003-06-19 | Belcher Angela M. | Biological control of nanoparticles |
-
2003
- 2003-03-14 JP JP2003070281A patent/JP4363868B2/ja not_active Expired - Fee Related
- 2003-08-22 CN CNB031551270A patent/CN1279477C/zh not_active Expired - Fee Related
- 2003-08-22 US US10/645,623 patent/US7809737B2/en not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100416569C (zh) * | 2006-01-10 | 2008-09-03 | 西安交通大学 | 一种基于Web页面元数据的用户访问行为形式化描述方法 |
CN101589380B (zh) * | 2006-01-30 | 2012-07-04 | 微软公司 | 基于上下文的代码分析 |
CN100452055C (zh) * | 2007-04-13 | 2009-01-14 | 清华大学 | 一种用于文本或网络内容分析的大规模多关键词匹配方法 |
CN103713987A (zh) * | 2012-10-08 | 2014-04-09 | 尤尼西斯公司 | 基于关键词的日志处理 |
CN108292318A (zh) * | 2015-10-01 | 2018-07-17 | 电子湾有限公司 | 生成概念图 |
CN108292318B (zh) * | 2015-10-01 | 2021-08-10 | 电子湾有限公司 | 用于生成目标页面的系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
US20050050045A1 (en) | 2005-03-03 |
JP2004252911A (ja) | 2004-09-09 |
JP4363868B2 (ja) | 2009-11-11 |
US7809737B2 (en) | 2010-10-05 |
CN1279477C (zh) | 2006-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1279477C (zh) | 检索关键字分析系统和方法 | |
CN1163837C (zh) | 网络访问管理系统和方法 | |
CN1138215C (zh) | 用于归档和访问电子报文的数据处理系统和方法 | |
CN1707506A (zh) | 利用网络提供招募/求职信息及其关联信息的匹配系统 | |
CN1700225A (zh) | 利用网络提供招募/求职信息及其关联信息的匿名信息评价系统 | |
CN1170240C (zh) | 结构化文档检索显示方法和装置 | |
CN1155906C (zh) | 数据处理方法、系统、处理程序及记录媒体 | |
CN1332879A (zh) | 形成全方位服务研究当局与测试中心的方法及装置 | |
CN1750003A (zh) | 信息处理装置,信息处理方法,和程序 | |
CN1766886A (zh) | 用于数据管理和/或转换的数据结构、数据库系统及方法 | |
CN1624696A (zh) | 信息处理设备、方法及其程序、信息处理系统及其方法 | |
CN1299488A (zh) | 改进的搜索引擎 | |
CN101069177A (zh) | 关键字抽取装置 | |
CN1324045A (zh) | 信息推荐装置和信息推荐系统 | |
CN1477573A (zh) | 服务提供设备和服务提供方法 | |
CN1856788A (zh) | 类似率算出装置和类似率算出程序 | |
CN1487450A (zh) | 在数据库搜索系统和方法中的可扩展置标语言的使用 | |
CN1897556A (zh) | 信息处理设备、信息处理方法和信息处理程序 | |
CN1744036A (zh) | 报告软件中支持定制图形表示的系统和方法 | |
CN1402173A (zh) | 成本估计方法及系统 | |
CN1321923A (zh) | 画面程序作成方法、记录媒体 | |
CN1912825A (zh) | 信息处理装置及其控制方法 | |
CN1126053C (zh) | 文件检索方法、文件检索发送方法及装置 | |
CN1855148A (zh) | 趋势-创造-型广告系统及其方法与计算机产品 | |
CN1752963A (zh) | 文档信息处理设备、文档信息处理方法及处理程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20061011 Termination date: 20100822 |