CN102341800B - 检索处理方法以及装置 - Google Patents

检索处理方法以及装置 Download PDF

Info

Publication number
CN102341800B
CN102341800B CN200980157826.6A CN200980157826A CN102341800B CN 102341800 B CN102341800 B CN 102341800B CN 200980157826 A CN200980157826 A CN 200980157826A CN 102341800 B CN102341800 B CN 102341800B
Authority
CN
China
Prior art keywords
query expansion
result
key word
search
retrieval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200980157826.6A
Other languages
English (en)
Other versions
CN102341800A (zh
Inventor
岩仓友哉
冈本青史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN102341800A publication Critical patent/CN102341800A/zh
Application granted granted Critical
Publication of CN102341800B publication Critical patent/CN102341800B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种检索处理方法及装置。其使用由检索者输入的检索关键字进行检索来取得初始检索结果。另一方面,提取与检索关键字相关联的扩展检索关键字,并对初始检索结果中的符合文件件数或者出现频度进行计数。并且,在该符合文件件数或者出现频度为规定值(包括0)以下的情况下,采用该扩展检索关键字,并使用检索关键字和被采用的扩展检索关键字进行检索,来取得扩展检索结果。并且,将初始检索结果和扩展检索结果向检索者提示。由此,可以使埋没在初始检索结果中的文件向检索者提示。

Description

检索处理方法以及装置
技术领域
本技术涉及关键字检索技术。
背景技术
以往,当使用例如“苹果”这一关键字来实施数据库检索时,假设得到如图1所示那样的检索结果。从图1可以看出,在排在前面的1000件的检索结果中,都是包含关于“苹果汁”和“苹果酱”的文件。作为检索结果,检索引擎通常对返回文件的件数进行限制,检索者不能访问例如第1001个以后的文件,例如包含“苹果派”的文件。
另外,还存在如下述那样的以往技术,即,从预先按每一个关键字储存关联词的关联词典中,提取与输入关键字相关联的关联词,并进一步使用提取出的关联词进行检索。关联词是根据预定的优先级等被提取的。然而,在取得了如图1所示那样的检索结果的状况下,即使附加“果汁”或“果酱”这样的关联词并另外进行检索,如图2所示那样,也几乎得到与图1的检索结果相同的结果,因此检索者不能得到有效的附加信息。
另外,还存在一种这样的技术,作为文件的检索结果,在命中件数多的情况下,从检索词的附近(文件内的附近)按照出现频度的顺序提取追加检索词,并将各个单词的相关性层级化显示,将从中选择出的单词追加为检索条件,来进行缩小检索。然而,由于将文件内的附近的单词作为追加检索词提取,所以即使仅利用输入关键字而取得的文件被提取的可能性也较高。
专利文献1:日本特开2001-75981号公报
专利文献2:日本专利第3428554号公报
发明内容
因此,本技术的目的在于,提供一种用于能够自动提示与根据输入检索关键字而取得的检索结果的内容不同的内容的检索结果的新技术。
本检索处理方法具有:接收检索关键字的步骤;使用接收到的检索关键字,使检索引擎对存储与文件相关的数据的数据库进行检索,并从该检索引擎取得包含符合文件的至少一部分的文本数据的初始检索结果,并存储到初始检索结果存储部的步骤;从与各个关键字对应地将扩展检索关键字进行存储的扩展检索关键字存储部,提取与接收到的检索关键字建立了对应的扩展检索关键字的步骤;使用提取出的各个扩展检索关键字对初始检索结果存储部进行检索,并针对提取出的各个扩展检索关键字,对符合文件件数或者出现频度进行计数,与各个扩展检索关键字对应地将符合文件件数或者出现频度存储到汇总结果存储部的步骤;使用存储在汇总结果存储部的扩展检索关键字中的、符合文件件数或者出现频度从多到少的顺序下排在前面的规定数量的扩展检索关键字的每一个、或者符合文件件数或者出现频度在规定值以下的各个扩展检索关键字、与接收到的检索关键字的组合,使检索引擎对数据库进行检索,从该检索引擎取得包含符合文件的至少一部分的文本数据的扩展检索结果,并存储到扩展检索结果存储部的步骤;输出存储在初始检索结果存储部的初始检索结果的至少一部分、和存储在扩展检索结果存储部的扩展检索结果的至少一部分的输出步骤。
附图说明
图1是用于说明以往技术的图。
图2是用于说明以往技术的图。
图3是表示实施方式的系统概要的图。
图4是表示主要处理流程的图。
图5是表示初始检索处理的处理流程的图。
图6是表示检索关键字输入画面的一个例子的图。
图7是表示存储在会话DB中的数据的一个例子的图。
图8是表示存储在初始检索结果DB中的数据的一个例子的图。
图9是表示扩展关键字选择处理的处理流程的图。
图10是表示存储在扩展关键字DB中的数据的一个例子的图。
图11是表示存储在扩展关键字候补DB中的数据的一个例子的图。
图12是表示排序后的扩展关键字候补列表的一个例子的图。
图13是表示扩展检索处理的处理流程的图。
图14是表示存储在扩展检索结果DB中的数据的一个例子的图。
图15是表示检索结果生成处理的处理流程的图。
图16是表示检索结果显示画面的一个例子的图。
图17是计算机的功能框图。
具体实施方式
图3表示本技术的实施方式的系统的概要图。例如,互联网或LAN(Local Area Network:局域网)等计算机网络1与多个用户终端3、实施本实施方式的主要处理的检索处理服务器5、公知的实施数据库检索的检索引擎7连接。
检索引擎7与数据库(DB)71连接,在该DB71中,存在存储文件自身的情况,还存在例如保存了与网络1连接的多个服务器保存的多个文件(网页、数据等)的索引数据等的情况。检索引擎7以及检索引擎7管理的DB71的构成并非本实施方式的主要部分位,而是众所周知的,因此不再详细说明。
另外,检索处理服务器5具有:成为与用户终端3之间的接口的用户接口部51、成为与检索引擎7之间的接口的检索接口部53、控制部55、会话DB56、初始检索结果DB57、扩展关键字DB58、扩展关键字候补DB59、扩展检索结果DB60。控制部55与用户接口部51和检索接口部53协作来进行动作。
另外,控制部55具有:初始检索部551,其使用存储在会话DB56中的数据进行处理,并将初始检索结果存储在初始检索结果DB57;扩展关键字选择部552,其使用存储在初始检索结果DB57以及扩展关键字DB58中的数据进行处理,并将处理结果存储在扩展关键字候补DB59;扩展检索部553,其使用存储在会话DB56以及扩展关键字DB58的数据来进行处理,并将处理结果存储在扩展检索结果DB60。
用户接口部51将从用户终端3接收到的数据登记在会话DB56中,并使用存储在初始检索结果DB57以及扩展检索结果DB60中的数据来生成检索结果显示数据,并向用户终端3发送。
接下来,使用图4至图16对图3所示的系统的动作进行说明。首先,使用图4表示处理的概要。首先,实施初始检索处理(步骤S1)。关于初始检索处理,将在后面进行详细说明,其与通常的检索处理相同。其次,实施扩展关键字选择处理(步骤S3)。关于扩展关键字选择处理,将在下面进行详细说明,其除了输入检索关键字以外还选择使用的扩展关键字候补。其中,还可以将步骤S3与步骤S1并列地实施处理。另外,在串行实施的情况下,还可以在实施步骤S1前实施步骤S3。然后,实施扩展检索处理(步骤S5)。关于扩展检索处理,将在下面进行详细说明,其是对输入检索关键字与扩展关键字候补的组合,实施检索处理的步骤。最后,实施检索结果生成处理(步骤S7)。关于检索结果生成处理,将下后面进行详细说明,其是生成用于将初始检索结果与扩展检索结果例如,在一个画面中上下或左右排列显示的Web页、数据,并将其向用户终端3发送,并进行显示的处理。
接下来,使用图5对初始检索处理进行说明。首先,检索处理服务器5的用户接口部51从用户终端3接收检索关键字(步骤S11)。例如,根据来自用户终端3的访问,用户接口部51将用于显示检索关键字输入画面的Web页、数据向用户终端3发送,用户终端3接收该Web页、数据,并显示图6所示的检索关键字输入画面。图6的画面例子具有输入栏601以及检索按键602。这里被设置成在输入栏601中,输入检索关键字“苹果”后,点击检索按键602的构成。用户终端3将检索关键字作为检索请求向检索处理服务器5发送。
接下来,用户接口部51发放会话ID,并将该会话ID、检索关键字和终端信息(例如,终端ID、IP地址等)登记在会话DB56中(步骤S13)。在会话DB56中,登记有例如图7所示那样的数据。在图7的例子中,登记有会话ID、关键字、终端ID(还有IP地址等的情况)。另外,用户接口部51对控制部55指示处理。
例如当新的记录被登记在会话DB56中时,控制部55的初始检索部551从会话DB56读出新登记的检索关键字,并向检索接口部53发出请求,以使检索引擎7实施基于该检索关键字的检索。检索接口部53响应来自初始检索部551的请求,将包含检索关键字的检索请求向检索引擎7发送。检索引擎7从检索处理服务器5接收到包含检索关键字的检索请求,例如对DB71实施检索处理,并将检索结果的排在前面的M件的量的数据向检索处理服务器5发送。检索处理服务器5的检索接口部53接收检索结果的排在前面的M件的量的数据,并向控制部55的初始检索部551输出。初始检索部551从检索接口部53取得检索结果的排在前面的M件的量的数据(步骤S15)。检索结果例如包含该文件的标题和URL(Uniform ResourceLocator:统一资源定位器)等。
然后,初始检索部551将包含标题以及URL的检索结果的数据与当前会话ID建立对应后,存储在初始检索结果DB57(步骤S17)。在初始检索结果DB57中,登记有例如图8所示的数据。在图8的例子中,登记有检索结果ID、标题和URL。其中,在本例子中,登记有排在前面的100件的量的数据。此外,初始检索结果DB57按每一个会话ID存储了图8所示的表。
这样,能够取得基于按通常输入的检索关键字的检索结果。
接下来,使用图9对扩展关键字选择处理进行说明。扩展关键字选择部552从扩展关键字DB58取得与检索关键字对应的扩展关键字候补(步骤S51)。例如如图10所示那样的数据被存储在扩展关键字DB58中。在图10的例子中,登记有输入关键字、和对应的扩展关键字候补群。例如,对“苹果”这样的输入关键字,登记有“果汁”“果酱”“糖”“派”等扩展关键字候补。
接下来,扩展关键字选择部552确定出一个所取得的扩展关键字候补中的、未处理的扩展关键字候补(步骤S53)。然后,使用所确定的扩展关键字候补对初始检索结果DB57进行检索,并对存储在初始检索结果DB57中的、初始检索结果中的符合的文件的件数进行计数,并存储在扩展关键字候补DB59中(步骤S55)。例如,将初始检索结果DB57中的文件中的、在标题中包含有所确定的扩展关键字候补的文件判断为符合文件,并对其件数进行计数。例如,如图11所示那样的数据被存储在扩展关键字候补DB59中。在图11的例子中,按每一个扩展关键字候补,登记了符合的文件的件数。此外,还可以不登记符合的文件的件数,而对出现次数进行计数并登录。即,例如标题等较长而在1件文件的标题等中,相同的单词出现2次以上的情况下,出现次数变多。此外,若执行了一次步骤S55,则图11的1行被登记。
然后,扩展关键字选择部552判断未处理的扩展关键字候补是否存在(步骤S57)。在未处理的扩展关键字候补存在的情况下,返回步骤S53。另一方面,在处理了全部的扩展关键字候补的情况下,根据计数结果(图11),对扩展关键字候补进行升序排序,并将排序结果存储在扩展关键字候补DB59中(步骤S59)。在图11的例中,“糖”计数值最少,“果汁”计数值最多。因此,得到了图12所示那样的扩展关键字候补列表,其被登记在扩展关键字候补DB59中。然后,将处理返回到原处理。
此外,还可代替步骤S55,而判断计数值是否为“0”,若计数值为“0”,则使其登记在扩展关键字候补DB59中。这样,能够确定完全未被包含在初始检索结果中的扩展关键字候补,因此,通过下面的处理,能够取得与初始检索结果完全不同的内容的检索结果。即使在这样的情况下,也可以将计数值为“0”的扩展关键字候补保存为图12所示的列表。
接下来,使用图13对扩展检索处理进行说明。首先,扩展检索部553将计数器i初始化为1,并且将采用扩展关键字数设定为N(步骤S61)。然后,从扩展关键字候补DB59取得第i个扩展关键字候补(步骤S63)。然后,扩展检索部553从会话DB56读出处理涉及的检索关键字(即,与当前会话ID建立了对应的检索关键字),并向检索接口部53发出请求,以使检索引擎7实施基于“检索关键字&扩展关键字候补”的检索。检索接口部53响应来自扩展检索部553的请求,将包含“检索关键字&扩展关键字候补”的检索请求向检索引擎7发送。检索引擎7从检索处理服务器5接收包含“检索关键字&扩展关键字候补”的检索请求,对例如DB71实施检索处理,将检索结果(即扩展检索结果)的排在前面的M件的量的数据向检索处理服务器5发送。检索处理服务器5的检索接口部53接收扩展检索结果的排在前面的M件的量(可以与初始检索处理时的M相同,还也与其不同)的数据,并向控制部55的扩展检索部553输出。扩展检索部553从检索接口部53取得扩展检索结果的排在前面的M件的量的数据(步骤S65)。扩展检索结果例如包含符合的文件的标题和URL(UniformResource Locator)等。
然后,扩展检索部553将取得的扩展检索结果存储在扩展检索结果DB60中(步骤S67)。将存储在扩展检索结果DB60中的数据的一个例子表示在图14中。在图14的例子中,按每一个每次执行步骤S65时所发放的扩展检索结果ID,登记有作为扩展查询的条件的“检索关键字&扩展关键字候补”、标题及URL。按每一个扩展检索结果ID,登记有M件的量的数据。在本实施方式中,按每一个会话ID,将存储有图14所示那样的数据表存储在扩展检索结果DB60中。
然后,扩展检索部553判断i是否小于N(步骤S69)。在i小于N的情况下,对i加1(步骤S71),并返回步骤S63。另一方面,若i为N以上,则返回原处理。
这样,得到下述那样的扩展检索结果,即,具有初始检索中不怎么包含或者完全没有包含的内容,并应该对检索者提示的扩展检索结果。
接下来,使用图15对检索结果生成处理进行说明。若扩展检索部553的处理结束,则控制部55对用户接口部51输出处理结束的会话ID,使其实施检索结果生成处理。
用户接口部51读出保存的结果显示用格式(步骤S71),将处理结束涉及的检索关键字例如从会话DB56读出,并设定在结果显示用格式中的提示位置(步骤S73)。另外,用户接口部51从初始检索结果DB57读出与处理结束涉及的会话ID对应的初始检索结果,仅对能够显示的件数的量的文件,将各个符合文件的标题超链接化,使得能够访问该URL,并将各个符和的文件的标题设定在结果显示用格式中的提示位置(步骤S75)。另外,将计数器i初始化为1,并且将所采用的扩展关键字数设定为N(步骤S77)。
然后,用户接口部51将扩展检索结果区域的第i个框,确保在结果显示用格式内(步骤S79),并且将第i个扩展查询条件(即,“检索关键字&扩展关键字候补”)与其扩展检索结果从扩展检索结果DB60读出,并将该扩展查询设定在结果显示用格式中的其提示框,并且仅对能够显示的件数的量的文件,将各个符合的文件的标题超链接化,使得能够访问该URL,并设定在结果显示用格式中的提示位置(步骤S81)。
然后,用户接口部51判断i是否比N小(步骤S83)。在i比N小的情况下,对i加1(步骤S85)并返回步骤S79。另一方面,若i为N以上,将基于使用上述处理生成的结果显示用格式的检索结果显示用页、数据向当前会话ID涉及的用户终端3发送(步骤S87)。
与此相对,用户终端3从检索处理服务器5接收检索结果显示用页、数据,使显示装置进行例如图16所示那样的显示。在图16的例中,检索关键字被提示在页面的开头部分1501,其下面的左侧包含有基于检索关键字的初始检索结果的提示框1502,在该提示框1502的右侧设置有扩展检索结果的提示框1510以及1520。在提示框1504中,例举了初始检索结果的各个符号文件(Web页等),并且能够使用超链接来参照各个符合文件(例如Web页)的具体的内容。
同样地,在提示框1511中,提示有扩展查询的条件“苹果&糖”,而具体的扩展检索结果被列举在提示框1512中。同样,在提示框1521中,提示有扩展查询的条件“苹果&派”,而具体的扩展检索结果被例举在提示框1522中。均包含有仅使用“苹果”进行检索时,不被提示或者不易被提示的检索结果。
对于符合文件的提示件数和扩展检索结果的提示框数,虽往往取决于显示区域的大小等的部分,但也可是任意的。还可以分割成多个页面来提示,但优选图16所示的能够比较对比那样的提示方式。此外,存在使用一个窗口提示全部的信息的情况,还存在例如将初始检索结果提示在第1窗口,将扩展检索结果提示在第2窗口来分别提示的情况。并且,还可以按每个扩展关键字来分窗口提示。这样,能够对每个扩展关键字一次显示更多的检索结果。
若如上述那样,实施本实施方式的处理,则仅通过检索者输入的输入检索关键字,就能够将通常不能向检索者提示的内容作为扩展检索结果向用户提示,因此,能够给检索者带来新意识和视点。尤其,在仅输入检索关键字中,就能够使排名在检索结果中靠后而被埋没的文件浮出。
虽然上面说明了本技术的一个实施方式,但本技术并不局限于此。例如,将图3的检索处理服务器5的功能框图作为一个例子,还存在并非一定与实际的程序模块构成一致的情况。并且,对于在图3所示的网络连接关系,作为一个例子,例如还可以将检索引擎7作为在检索处理服务器5的后台进行动作的服务器,从用户终端3观察使其与检索处理服务器5的背后进行网络连接。并且,虽然图示了服务器、客户端构成的例子,但还可是用户终端3与检索处理服务器5呈一体的单机型构成。并且存在检索引擎7也被一体化的情况。
并且,关于处理流程,只要处理结果不被改变,可以交换步骤的顺序或者并列执行。
此外,虽然在上述的例子中,说明了输入检索关键字为一个的情况,但是即使在两个以上的情况下,也基本能够以相同的处理进行应对。即,对多个输入检索关键字分别提取扩展关键字候补,并实施上述的处理即可。
并且,虽然图示了画面构成例子,但只要能够提示相同的信息,还可以采用其他的画面构成。
此外,上述的检索处理服务器5、检索引擎7和用户终端3为计算机装置,并且如图17所示那样,存储器2501、CPU2503、硬盘驱动器(HDD)2505、与显示装置2509连接的显示控制部2507、可移动磁盘2511用的驱动器装置2513、输入装置2515、和用于与网络连接的通信控制部2517通过总线2519连接。操作系统(OS:Operating System)以及用于实施本实施例中的处理的应用程序被存储在HDD2505中,在由CPU2503执行时,被从HDD2505向存储器2501读出。根据需要,CPU2503对显示控制部2507、通信控制部2517、驱动器装置2513进行控制,来进行必要的动作。另外,对于处理中途的数据,其被存储在存储器2501中,若有必要,则被存储在HDD2505中。在本技术的实施例中,用于实施上述的处理的应用程序被存储并被分配在计算机可读取的可移动磁盘2511中,并从驱动器装置2513被安装到HDD2505。还存在经由互联网等网络以及通信控制部2517,被安装到HDD2505的情况。这样的计算机装置通过上述的CPU2503、存储器2501等硬件、OS以及需要的应用程序的有机配合,实现了上述的各种功能。
将上述本实施方式总结如下。
本检索处理方法具有:接收检索关键字的步骤;使用接收到的检索关键字,使检索引擎对存储与文件相关的数据的数据库进行检索,并从该检索引擎取得包含符合文件的至少一部分的文本数据的初始检索结果,并存储到初始检索结果存储部的步骤;从与各个关键字对应地将扩展检索关键字进行存储的扩展检索关键字存储部,提取与接收到的检索关键字建立了对应的扩展检索关键字的步骤;使用提取出的各个扩展检索关键字对初始检索结果存储部进行检索,并针对提取出的各个扩展检索关键字,对符合文件件数或者出现频度进行计数,与各个扩展检索关键字对应地将符合文件件数或者出现频度存储到汇总结果存储部的步骤;使用存储在汇总结果存储部的扩展检索关键字中的、符合文件件数或者出现频度从多到少的顺序下排在前面的规定数量的扩展检索关键字的每一个、或者符合文件件数或者出现频度在规定值以下的各个扩展检索关键字、与接收到的检索关键字的组合,使检索引擎对数据库进行检索,从该检索引擎取得包含符合文件的至少一部分的文本数据的扩展检索结果,并存储到扩展检索结果存储部的步骤;输出存储在初始检索结果存储部的初始检索结果的至少一部分、和存储在扩展检索结果存储部的扩展检索结果的至少一部分的输出步骤。
这样,通过将与输入检索关键字关联的扩展检索关键字中的、在基于输入检索关键字的检索结果(即,初始检索结果)中,不怎么出现(或者完全不出现)的扩展检索关键字用于扩展检索,能够将与仅基于输入检索关键字的检索结果不同的内容及观点的检索结果,向检索者提示。
另外,还可以在上述的输出步骤中,生成用于将初始检索结果的至少一部分、和扩展检索结果的至少一部分显示在不同的画面区域的数据。通过上下或者左右排列显示,检索者能够将不同的检索结果对比而把握,能够找到更接近目的的文件、或者发现检索的新方向。此外,可以在相同窗口中分不同的区域显示,还可以例如使初始检索结果显示在主窗口中,而使扩展检索结果显示在一个或者多个子窗口中。
并且,还可以将上述的规定值设定为“0”。能够提示在基于输入检索关键字的初始检索结果中,完全不能提示的那样的不同内容的检索结果。此外,初始检索结果所包括的范围,仅为排在前面的规定件数的量的文件,在该范围中,不包括扩展检索关键字,在排在前面的规定件数之后的文件中,包含扩展检索关键字。
此外,可以将上述的处理作成用于使硬件实施的程序,该程序被存储在例如软盘、CD-ROM、光磁盘、半导体存储器、硬盘等计算机可读存储介质或者存储装置中。此外,对于处理中途的数据,被暂时存储在计算机的存储器等的存储装置中。

Claims (5)

1.一种计算机执行的检索处理方法,包括以下步骤:
接收检索关键字的步骤;
使用接收到的所述检索关键字,使检索引擎对存储与文件相关的数据的数据库进行检索,从该检索引擎取得包含符合所述检索关键字的第一符合文件的至少一部分的文本数据的初始检索结果,并存储到初始检索结果存储部的步骤;
从与各个关键字对应地将扩展检索关键字进行存储的扩展检索关键字存储部,提取与接收到的所述检索关键字建立了对应的扩展检索关键字的步骤;
使用提取出的各所述扩展检索关键字对所述初始检索结果存储部进行检索,并针对提取出的各所述扩展检索关键字,对符合该扩展检索关键字的第二符合文件件数或者出现频度进行计数,与各所述扩展检索关键字对应地将所述第二符合文件件数或者出现频度存储到汇总结果存储部的步骤;
使用存储在所述汇总结果存储部的所述扩展检索关键字中的、所述第二符合文件件数或者出现频度从少到多的顺序下排在前面的规定数量的各个所述扩展检索关键字与接收到的所述检索关键字的组合,或者使用存储在所述汇总结果存储部的所述扩展检索关键字中的、所述第二符合文件件数或者出现频度在规定值以下的各个所述扩展检索关键字与接收到的所述检索关键字的组合,使所述检索引擎对所述数据库进行检索,从该检索引擎取得包含第二符合文件的至少一部分的文本数据的扩展检索结果,并存储到扩展检索结果存储部的步骤;
输出存储在所述初始检索结果存储部的所述初始检索结果的至少一部分、和存储在所述扩展检索结果存储部的所述扩展检索结果的至少一部分的输出步骤。
2.根据权利要求1所述的检索处理方法,其中,
在所述输出步骤中,生成用于将所述初始检索结果的至少一部分、和所述扩展检索结果的至少一部分显示在不同画面区域的数据。
3.根据权利1或者2所述的检索处理方法,其中,
所述规定值为0。
4.一种检索处理装置,具有:
接收检索关键字,使用接收到的所述检索关键字,使检索引擎对存储与文件相关的数据的数据库进行检索,从该检索引擎取得包含符合所述检索关键字的第一符合文件的至少一部分的文本数据的初始检索结果,并存储到初始检索结果存储部的单元;
从与各个关键字对应地将扩展检索关键字进行存储的扩展检索关键字存储部,提取与接收到的所述检索关键字建立了对应的扩展检索关键字的单元;
使用提取出的各所述扩展检索关键字对所述初始检索结果存储部进行检索,并针对提取出的各所述扩展检索关键字,对符合该扩展检索关键字的第二符合文件件数或者出现频度进行计数,与各所述扩展检索关键字对应地将所述第二符合文件件数或者出现频度存储到汇总结果存储部的单元;
使用存储在所述汇总结果存储部的所述扩展检索关键字中的、第二符合文件件数或者出现频度从少到多的顺序下排在前面的规定数量的各个所述扩展检索关键字与接收到的所述检索关键字的组合,或者使用存储在所述汇总结果存储部的所述扩展检索关键字中的、所述第二符合文件件数或者出现频度在规定值以下的各个所述扩展检索关键字与接收到的所述检索关键字的组合,使所述检索引擎对所述数据库进行检索,从该检索引擎取得包含第二符合文件的至少一部分的文本数据的扩展检索结果,并存储到扩展检索结果存储部的单元;
输出存储在所述初始检索结果存储部的所述初始检索结果的至少一部分、和存储在所述扩展检索结果存储部的所述扩展检索结果的至少一部分的输出单元。
5.根据权利要求4所述的检索处理装置,其中,
所述输出单元生成用于将所述初始检索结果的至少一部分、和所述扩展检索结果的至少一部分显示在不同画面区域的数据。
CN200980157826.6A 2009-03-17 2009-03-17 检索处理方法以及装置 Expired - Fee Related CN102341800B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2009/055177 WO2010106642A1 (ja) 2009-03-17 2009-03-17 検索処理方法及び装置

Publications (2)

Publication Number Publication Date
CN102341800A CN102341800A (zh) 2012-02-01
CN102341800B true CN102341800B (zh) 2014-10-29

Family

ID=42739313

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980157826.6A Expired - Fee Related CN102341800B (zh) 2009-03-17 2009-03-17 检索处理方法以及装置

Country Status (5)

Country Link
US (1) US20120072406A1 (zh)
JP (1) JP5110201B2 (zh)
CN (1) CN102341800B (zh)
GB (1) GB2481333A (zh)
WO (1) WO2010106642A1 (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101741698B1 (ko) 2010-10-18 2017-05-31 삼성전자주식회사 검색 서비스 제공방법 및 이를 적용한 디스플레이 장치
JP5338835B2 (ja) 2011-03-24 2013-11-13 カシオ計算機株式会社 類義語リストの生成方法および生成装置、当該類義語リストを用いた検索方法および検索装置、ならびに、コンピュータプログラム
JP2013003796A (ja) * 2011-06-15 2013-01-07 Navitime Japan Co Ltd 施設情報提供装置、施設情報提供システム、サーバ装置、端末装置、施設情報提供方法、およびプログラム
US11397996B2 (en) * 2011-06-24 2022-07-26 Monster Worldwide, Inc. Social match platform apparatuses, methods and systems
US9558274B2 (en) 2011-11-02 2017-01-31 Microsoft Technology Licensing, Llc Routing query results
US9177022B2 (en) 2011-11-02 2015-11-03 Microsoft Technology Licensing, Llc User pipeline configuration for rule-based query transformation, generation and result display
US20130110816A1 (en) * 2011-11-02 2013-05-02 Microsoft Corporation Default Query Rules
US9189563B2 (en) 2011-11-02 2015-11-17 Microsoft Technology Licensing, Llc Inheritance of rules across hierarchical levels
CN103678362A (zh) * 2012-09-13 2014-03-26 深圳市世纪光速信息技术有限公司 搜索方法及系统
JP5903370B2 (ja) * 2012-11-14 2016-04-13 日本電信電話株式会社 情報検索装置、情報検索方法、及びプログラム
JP5886223B2 (ja) * 2013-02-20 2016-03-16 日本食品製造合資会社 検索装置
US9817899B2 (en) * 2013-08-26 2017-11-14 Globalfoundries Searching for secret data through an untrusted searcher
CN103699619A (zh) * 2013-12-18 2014-04-02 北京百度网讯科技有限公司 一种用于提供搜索结果的方法及装置
US9454621B2 (en) * 2013-12-31 2016-09-27 Google Inc. Surfacing navigational search results
CN103902670B (zh) * 2014-03-17 2016-04-13 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
JP6316642B2 (ja) * 2014-04-21 2018-04-25 アルパイン株式会社 コンテンツ検索装置、方法およびプログラム
KR101606758B1 (ko) * 2014-06-30 2016-03-28 경일대학교산학협력단 연관 키워드를 이용한 이슈 데이터 추출방법 및 시스템
JP2017054232A (ja) * 2015-09-08 2017-03-16 株式会社東芝 情報抽出装置、情報抽出方法及び情報抽出プログラム
WO2018006217A1 (zh) * 2016-07-04 2018-01-11 马岩 基于网络邮件数据的抓取方法及系统
JP6653669B2 (ja) * 2017-01-17 2020-02-26 株式会社LIGHTz 情報提供装置、情報提供システム、情報提供方法及びプログラム
JP6880974B2 (ja) * 2017-04-19 2021-06-02 富士通株式会社 情報出力プログラム、情報出力方法および情報処理装置
JP6435467B1 (ja) * 2018-03-05 2018-12-12 株式会社テンクー 検索システム及び検索システムの動作方法
CN112749258A (zh) * 2021-01-21 2021-05-04 京东数字科技控股股份有限公司 数据搜索的方法和装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004164662A (ja) * 2003-12-24 2004-06-10 Just Syst Corp 検索装置、検索方法、ならびに、情報記録媒体
JP2007133769A (ja) * 2005-11-11 2007-05-31 Ricoh Co Ltd 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体
CN101063975A (zh) * 2007-02-15 2007-10-31 刘二中 电子文本处理与检索的方法和系统
WO2009019860A1 (ja) * 2007-08-09 2009-02-12 Panasonic Corporation コンテンツ検索装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0916607A (ja) * 1995-06-26 1997-01-17 Hitachi Ltd データベース管理システムにおけるインデクス管理方法
JP4073586B2 (ja) * 1999-09-02 2008-04-09 株式会社エヌ・ティ・ティ・データ 検索システム、検索条件受付方法及び記録媒体
JP4265737B2 (ja) * 2002-09-20 2009-05-20 株式会社リコー 文書検索装置、文書検索方法、文書検索プログラム、及び記録媒体
JP2004118262A (ja) * 2002-09-24 2004-04-15 Toshiba Corp 文書検索装置、文書検索方法及び文書検索プログラム
US8266162B2 (en) * 2005-10-31 2012-09-11 Lycos, Inc. Automatic identification of related search keywords
US20090055374A1 (en) * 2007-08-20 2009-02-26 Cisco Technology, Inc. Method and apparatus for generating search keys based on profile information
JP5106045B2 (ja) * 2007-10-30 2012-12-26 株式会社日立製作所 検索エンジン連携ファイル共有システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004164662A (ja) * 2003-12-24 2004-06-10 Just Syst Corp 検索装置、検索方法、ならびに、情報記録媒体
JP2007133769A (ja) * 2005-11-11 2007-05-31 Ricoh Co Ltd 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体
CN101063975A (zh) * 2007-02-15 2007-10-31 刘二中 电子文本处理与检索的方法和系统
WO2009019860A1 (ja) * 2007-08-09 2009-02-12 Panasonic Corporation コンテンツ検索装置

Also Published As

Publication number Publication date
WO2010106642A1 (ja) 2010-09-23
GB201116081D0 (en) 2011-11-02
JPWO2010106642A1 (ja) 2012-09-20
JP5110201B2 (ja) 2012-12-26
US20120072406A1 (en) 2012-03-22
CN102341800A (zh) 2012-02-01
GB2481333A (en) 2011-12-21

Similar Documents

Publication Publication Date Title
CN102341800B (zh) 检索处理方法以及装置
CN102368262B (zh) 一种提供与查询序列相对应的搜索建议的方法与设备
US8352396B2 (en) Systems and methods for improving web site user experience
US8255386B1 (en) Selection of documents to place in search index
RU2632138C2 (ru) Способ (варианты) и сервер ранжирования поисковых результатов на основе параметра полезности
US7747612B2 (en) Indication of exclusive items in a result set
RU2501078C2 (ru) Ранжирование результатов поиска с использованием расстояния редактирования и информации о документе
US7747614B2 (en) Difference control for generating and displaying a difference result set from the result sets of a plurality of search engines
US7636714B1 (en) Determining query term synonyms within query context
US7984000B2 (en) Predicting and using search engine switching behavior
CN103136228A (zh) 一种图片搜索方法以及图片搜索装置
EP3255842A1 (en) Method and device for saving chat record of instant messaging
KR102281186B1 (ko) 검색 결과에 대한 애니메이션 스니핏
RU2718435C2 (ru) Исполняемый на компьютере способ и система для поиска в инвертированном индексе, обладающем множеством списков словопозиций
US7747613B2 (en) Presentation of differences between multiple searches
WO2007001128A1 (en) Method and system for determining relation between search terms in the internet search system
US20160140232A1 (en) System and Method of Expanding a Search Query
KR101672349B1 (ko) 파일 클라우드 서비스 장치 및 방법
JP2010503923A (ja) 検索結果の効率的ナビゲーション
JP2015525929A (ja) 検索品質を改善するための重みベースのステミング
US20160306811A1 (en) Method and system for creating inverted index file of video resource
US8838580B2 (en) Method and system for providing keyword ranking using common affix
CN111552884A (zh) 用于内容推荐的方法和设备
CN111428120B (zh) 一种信息确定方法、装置、电子设备及存储介质
US20230385328A1 (en) Information searching method and device, computer equipment and storage medium

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20141029

Termination date: 20180317

CF01 Termination of patent right due to non-payment of annual fee