CN100419746C - 信息检索方法 - Google Patents

信息检索方法 Download PDF

Info

Publication number
CN100419746C
CN100419746C CNB028205405A CN02820540A CN100419746C CN 100419746 C CN100419746 C CN 100419746C CN B028205405 A CNB028205405 A CN B028205405A CN 02820540 A CN02820540 A CN 02820540A CN 100419746 C CN100419746 C CN 100419746C
Authority
CN
China
Prior art keywords
retrieval
processing unit
inquisition
label
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB028205405A
Other languages
English (en)
Other versions
CN1571966A (zh
Inventor
桥田浩一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
Original Assignee
Japan Science and Technology Agency
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Agency filed Critical Japan Science and Technology Agency
Publication of CN1571966A publication Critical patent/CN1571966A/zh
Application granted granted Critical
Publication of CN100419746C publication Critical patent/CN100419746C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

通过在信息检索过程中向用户提供适当的信息来进行有效的交互,以提高检索的效率和准确度。CPU将包含被删除的候选解的集合G初始设置为空,并且从用户接收检索查询Q的输入(S1)。该CPU通过使用由词库T或词库T的子集R定义的多个标号的相似性,参考数据库存储部分并且创建作为响应于该检索请求Q对数据库进行搜索而得到的结果的候选解集合F(S2)。该CPU向用户显示与这些候选解和检索查询Q相关的信息,作为在显示部分上的交互的帮助(S3)。用户可以检查解是否在这些候选解中。

Description

信息检索方法
技术领域
本发明涉及一种信息检索方法、信息检索程序、以及其上记录有该言息检索程序的计算机可读记录介质。更具体地,本发明涉及一种与标号图(labeled gragh)相关的交互式信息检索方法、信息检索程序、以及其上记录有该信息检索程序的计算机可读记录介质。
背景技术
在传统的信息检索中,查询由与诸如AND和OR的逻辑连接词相结合的关键字和ID编号组成。字符串匹配和统计方法是其中的基本技术。为了与用户进行交互,通过统计方法找到表征侯选解集合的多个子集的关键字/单词和短语,并作为提示显示以让用户选择它们中的一些以加强查询。已经在下列文献中公开了现有技术:
Yoshihiko Hayashi,Yoshitsugu Obashi,“Technical Trend ofRetrieval Service on WWW”,Information Processing,Vol.39,No.9,1998(林良彦、小桥喜嗣,“WWW上的检索服务技术趋势”,信息处理,卷39,1998年第9期),以及
Sumio Fujita,“Approach to Retrieving/ClassifyingInformation by utilizing Natural Language Processing”,Information Processing,Vol.40,1999(藤田澄男,“利用自然语言处理的检索/分类信息的方法”,信息处理,卷40,1999年第4期)。
发明内容
信息检索中的困难通常源于解决检索查询和解之间在表达方面的差异(在根据检索查询预测解的表达方面的困难)。假定对于检索请求“日本商人在海外商务旅行时涉及事故”检测到候选解“田中社长在美国遭车祸”。在这种情况下,需要复杂的推理,但是使这种推理自动化目前在技术上是不可能的。
所以,没有其它的方式来进行这种推理,只能依赖人类用户和机器之间的交互。为了实现交互,机器必须向用户提供关于在交互的各个阶段要做什么的提示。上述根据统计方法给出提示的传统方法可以处理候选解集合的一般特性,但是不能处理对于特定的检索查询所特有的结构。
此外,为了向用户提供交互的有效提示,必须在检索上反映对于检索查询所特有的结构。例如,检索查询“日本商人在海外商务旅行时涉及事故”具有包含“日本人”和“商人”、“商人”和“商务旅行”、“海外”和“商务旅行”、以及“商务旅行”和“事故”之间的关系的语义结构。然而,传统信息检索几乎不采用这种结构。特别地,从未将这种结构系统地用作为交互的提示。
本发明的一个目的是通过在信息检索中向用户给出适当的信息进行有效的交互来提高检索的效率和准确度。
本发明的另一个目的是通过利用检索查询所特有的语义结构,并通过在自动地缩小检索空间的同时交互地修正订检索查询和检索空间,来进行保持高效率和高鉴别精确度的信息检索。
本发明的再一个目的是将要搜索的检索查询和数据库作为没有如同自然语言的语句的正式结构的图来处理,并且使得用户能够以该结构作为提示来操纵检索引擎并进行适当的交互,从而提高检索的效率和准确度。
根据本发明解决方案的第一手段,提供了一种信息检索方法、信息检索程序和其上记录有信息检索程序的计算机可读记录介质,包括以下步骤:
处理单元通过输入单元接收检索查询Q的输入,该检索查询Q包含与多个节点、多个节点的标号和这些节点之间的链接相关的信息;
该处理单元通过参考存储有用于定义多个节点的标号之间的相似性程度的词库T的词库存储单元,使用由词库T的子集R定义的多个标号之间的相似性,并且参考存储有输入的节点和标号的数据库D,找到作为响应于检索查询Q对数据库进行搜索所得结果的候选解集合F;
该处理单元在显示单元上显示找到的候选解集合F;
该处理单元通过该输入单元接收与候选解集合F中的一些元素是否表示解相关的输入信息;
该处理单元根据输入信息从候选解集合F中删除候选解集合F中的一些元素;
该处理单元基于通过该输入单元输入的与删除、增加或更改词库T的子集R和/或检索查询Q相关的输入信息来删除、增加或更改子集R和/或检索查询Q的内容的;以及
如果存在来自用户的再检索请求,则返回到检索步骤,或者如果没有这种请求,则结束该处理。
根据本发明解决方案的第二手段,提供了一种信息检索方法、信息检索程序以及其上记录有该信息检索程序的计算机可读记录介质,包括以下步骤:
处理单元通过输入单元接收检索查询Q的输入,该检索查询Q包含与多个节点、多个节点的标号和这些节点之间的链接相关的信息;
该处理单元通过参考存储有用于定义多个节点的标号之间的相似性程度的词库T的词库存储单元,使用在根据输入的链接而确定为可用的词库T的一部分中定义的多个标号之间的相似性程度,并且参考存储有输入的节点和标号的数据库D,找到作为响应于检索查询Q对数据库进行搜索而得到的结果的候选解集合F;
该处理单元在显示单元上显示找到的候选解集合F;
该处理单元通过输入单元接收与候选解集合F中的一些元素是否表示解相关的输入信息;
该处理单元根据输入信息从候选解集合F中删除候选解集合F中的一些元素;
该处理单元基于通过输入该单元输入的与删除、增加或更改词库T和/或检索查询Q相关的输入信息来删除、增加或更改词库T和/或检索查询Q的内容;以及
如果存在来自用户的再检索请求,则返回到检索步骤以重复该处理,或者如果没有请求,则结束该处理。
在本发明中,该处理单元还可以执行以下步骤:
在显示单元上显示检索查询Q;
通过输入单元接收下面的输入信息,该输入信息在不存在连接检索查询Q的两个节点的链接时指示插入一链接;
根据该输入信息插入该链接;
通过该输入单元接收用于指示删除检索查询Q中的一链接的输入信息;
根据该输入信息删除该链接;
通过该输入单元接收用于指示将一新节点添加到检索查询Q中的输入信息;
根据该输入信息将该节点添加到检索查询Q;
通过该输入单元接收用于指示删除检索查询Q中的一节点的输入信息;以及
根据该输入信息将该节点从检索查询Q中删除。
在本发明中,该处理单元可以执行以下步骤:
在显示单元上显示数据库D中的多个节点的标号M的列表,以通过词库存储单元中的词库T来定义表示M和在检索查询Q中的节点的标号L之间的相似性程度的多个值T(L,M);
通过输入单元接收指示选定或不选定某些标号M的输入信息、指示改变某些标号M的值T(L,M)的输入信息、和用于指定某些任意标号的输入信息;以及
对于选定的标号M,允许在词库T中使用T(L,M)的定义,对于未选定的元素M,禁止使用T(L,M)的定义,对于特定的标号M,将T(L,M)的值改变为规定值,或者对于每一个特定的标号N,在允许使用T(L,N)的定义的同时,将T(L,M)的值设置为1。
在本发明中,该处理单元可执行以下步骤:
对于检索查询Q中的每一个节点x,在该显示单元上显示以下列表
{L|对于节点y和节点z∈F(x),
    L为y的标号,并且
    连接y-z包含在数据库D中。};
通过输入单元接收用于指示选定某些标号的输入信息;以及
根据该输入信息,对于所选定的标号L中的每一个标号,将以L作为标号的节点Y和链接x-y添加到检索查询Q中。
此外,在本发明中,对于以上列表中的每一个标号M,当以下集合的大小小于一预定值时,对于以下集合中的每一个元素y,除了作为以上列表的元素的标号M以外,该处理单元还可以在该显示单元上显示y周围的一些节点的标号。
{y|y的标号为M。
    对于节点z∈F(x),
    链接y-z包含在数据库D中。}。
在本发明中,该处理单元可以执行以下步骤:
对于检索查询Q中的多个链接x-y中的每一个链接,在显示单元上显示节点z的标号列表,对于其值域f(Q)不包括节点z的候选解f,这些节点z包括在连接候选解f的值域内的节点f(x)和节点f(y)的最短路径中;
通过该输入单元接收用于指示选定某些这种标号的输入信息;和
根据该输入信息将以该列表的元素作为标号的节点z、以及链接x-z和z-y添加到检索查询Q中。
附图说明
图1是说明节点、链接和检索查询Q的示意图。
图2是说明包括在检索查询Q中的标号的词库扩充的示意图。
图3是说明检索查询Q的候选解和候选解集合F的示意图。
图4是说明检索系统的体系结构的示意图。
图5是信息检索处理的流程图。
图6是说明显示画面的示意图。
具体实施方式
本实施例将在节点处具有标号的图(网络)作为上述的语义结构。
假设检索查询Q和将要检索的数据库D都是这种图。此外,基于多个图之间的近似符合等,使得能够交互地和有效地对检索查询Q和检索空间进行修改。在检索语句的情况下,例如,这些节点是由多个单词引用的对象,链接是它们之间的语义关系,而标号为单词。
在本实施例中,“检索(retrieve)/检索(retrieval)”是为了找到类似于检索查询Q的数据库D的子图。认为检索查询Q的每个节点与部分图的某些节点相对应。这种对应关系是通过将检索查询Q中的每个节点映射到数据库D中的节点的函数来表示的,该函数被称为候选解。进一步假设定义了候选解的分值(例如相似性程度、相关程度、与概率相关的值)。将多个具有高分值的候选解的集合称为候选解集合F,并且建立以下关系式,
F(x)={f(x)|f∈F}(x是检索查询Q中的一节点,而f(x)是数据库中与该节点x相对应的一节点),以及
f(Q)={f(x)|x是检索查询Q中的一节点}(f∈F)
现将具体地描述检索查询Q、候选解集合F等。
图1是说明节点、链接和检索查询Q的示意图。
*检索查询Q中的节点x及其标号例如是“函数”、“分析”、“含意”和“自动”。
*检索查询Q中的链接是“函数-分析”、“分析-含意”和“分析-自动”。
*如图所示,检索查询Q由节点和标号构成。
图2是说明候选解f中与检索查询Q中的节点x相对应的数据库中的节点f(x),以及与候选解集合F中的节点x相对应的数据库中的节点集合F(x)的示意图。
*例如当x是节点(标号为)“函数”时,f(x)表示为f(函数),(f1(函数、f2(函数)…),将“函数”、“程序”、“函数符”、“关系”、“子程序”、“射影”和“满射”中的一个作为标号。
*例如当x是节点(标号为)“函数”时,F(x)表示为F(函数),并对于所有f∈F,表示f(函数)的集合{“函数”,“程序”,“函数符”,“关系”,“子程序”,射影”和“满射”}。
图3是说明检索查询Q中的候选解f的值域f(Q)以及候选解集合F的示意图。f’(Q)、f”(Q)和f”’(Q)是候选解f’、f”和f”’的值域。
*这些f(Q)分别对应于“使用程序…分析...语言”、“表示…有意的投资的函数”、“希望自动重排...内容”、“假设...含蓄的意向”、“程序…无法理解的…数据的含意”、以及“代表...用于分析的方法”。
*F是表示为集合f(Q)的集合f,表示{“使用程序…分析...语言”,“表示…有意的投资的函数”,“希望自动重排...内容”,“假设...含蓄的意向”,“程序…无法理解的…数据的含意”,“代表...用于分析的方法”}。
此外,在以下描述的实施例中,词库T例如是从图中节点的标号L和标号M的组合到表示这两个标号之间的相似性程度的数值T(L,M)的部分函数,并且用于计算分值。在寻找候选解集合F时,使用词库T的子集R而不是使用整个词库T。例如,词库T包括可以使用的部分R(该部分R由用户通过输入单元或存储单元预先确定)、以及不能使用的其它部分。候选解集合F不是通过使用整个词库T而是通过使用词库T的可用部分R找到的。虽然在这里不详细描述,但是已知多种方法(稍后描述的图5的流程图中的“检索的执行”和与其步骤S2相关的描述)可用于根据分值的定义、图的表示、数据库D、词库T或T的子集R、以及检索查询Q,来找到候选解集合F,并且可以适当地应用这些方法。
例如,通过存储在词库存储单元6中的词库T将表示标号“函数”和“分析”之间的相似性的分值作为数值T(函数,分析)给出。
图4是说明检索设备构成的示意图。
检索系统包括显示单元1、输入单元2、处理单元(CPU)3、主存储单元4、词库存储单元5、数据库(将要检索的对象)6、和总线7。
处理单元3通过总线7与输入单元2、显示单元1、主存储单元4、词库存储单元5和数据库(搜索空间)6相连,并接收和输出各种类型的信息。显示单元1是用于例如在屏幕上显示检索输入、检索输出、检索的中间结果等的显示装置。输入单元2是用于接收例如检索查询、指令和检索条件等所必需的各种类型的数据等的装置,并且可以使用诸如键盘、鼠标、定点设备等的适当设备。输入单元2还可以配备用于将数据发送给其他单元、存储介质等的输出单元。主存储单元4存储各种数据(例如检索程序、初始设置和参数),以及与检索状态相关的数据(例如检索的最终结果和中间结果)。词库存储单元5存储词库T,该词库T包括表示用于检索、关联度或非关联度、相似性程度或差异度、可能性、必然性等所需的节点之间的关系的数据。数据库6存储将要检索的数据(数据库D),即,存储节点、标号、链接等。
图5是说明检索处理的流程图。根据下列过程执行检索。
作为初始输入,首先,预先将数据库D存储在数据库存储单元6中,而将词库T或子集R(即,词库T的一部分)预先存储在词库存储单元5中。
在步骤S1,CPU 3将被删除的候选解集合G初始化为空,并从用户接收包含与节点、节点的标号和节点之间的链接相关的信息的检索查询Q的输入。CPU 3在主存储单元4的适当存储部分中存储与检索查询Q相关的数据,并根据需要从中读取它们。
在步骤S2,当用户点击显示在显示单元1上的“检索执行按钮”时,CPU 3根据用户的请求启动检索(或再检索)。CPU 3根据输入的检索查询Q参照词库存储单元5和数据库存储单元6,并通过使用在词库T的可用部分R中定义的标号之间的相似性程度,找到候选解集合F作为根据检索查询Q搜索数据库D的结果(如上所述,此方法是已知的,在这里不进行描述)。这里,作为被删除的候选解集合G的元素的候选解或包括被删除的候选解集合G的元素的候选解都不包括在候选解集合F中(候选解是一个函数,该函数是有序对的集合,因此,在候选解之间具有包含关系)。
在步骤S3,CPU 3通过显示单元1向用户提供下面的信息(1)到(5)作为交互的提示(列表(2)、(4)和(5)的显示遵照候选解(例如,包括具有作为列表元素的标号的节点)的最大分值递减的顺序)。允许用户检查候选解集合F中的候选解是否为解,或根据下列信息以逐条列举的方式改变候选解集合F、被删除的候选解集合G、词库T或词库T的子集R、和检索查询Q。CPU 3在显示单元1上显示与各情况列表元素(case list element)相关的信息。CPU 3根据由用户通过输入单元2输入的信息删除、添加或改变情况列表元素,将数据存储在主存储单元4中,并适当地从词库存储单元5和数据库6读取与数据相关的词库和与搜索空间相关的数据。
图6是说明显示画面的示意图。该示意图显示了在步骤S3与自然语言的语句检索相关的过程的画面,以及用于支持交互的界面。图中的(1)到(5)与如下所述的(1)到(5)相对应。
(1)候选解集合F
在这里显示的是具有高分值的候选解的列表。在附图中,黑体字符表示与检索查询中的单词的词库扩充相对应的单词。用户可以以如下所述的方式执行画面上的操作。
*检查候选解集合F中的一些元素是否为解。这可以通过例如仅使用在列表上显示的那些数据来完成。当不能仅通过那些数据来检查它们时,点击各个候选解以显示一个更宽的周边范围。
*从候选解集合F中删除候选解集合F的一些元素,并登记为被删除的候选解集合G的元素。这在图6中是从F中(如空心圆圈表示)排除包括在F内的候选解(由附图中的黑色圆圈表示)。
(2)检索查询Q
这里,显示了检索查询。允许用户“添加”或“删除”节点,并如下所述插入或删除链接。
*在检索查询Q中没有连接两个节点的链接的一些情况下,如此插入这样的链接。
*从检索查询Q中删除一些链接。
*把一些新的节点添加到检索查询Q中。
*从检索查询Q中删除一些节点。
(3)这里显示的是通过使用词库展开检索查询Q中的节点的标号(图6中的“函数”,等等。)而获得的具有高分值的结果。更具体而言,这是数据库D的节点的标号M(元素)的列表,其中在与节点x的标号L相关的词库中定义T(L,M)(对检索查询Q的每一个节点x)。用户可以规定元素是(由图6中的黑色圆圈表示)否(由空心圆圈表示)包括在检索范围内。
*对词库T的子集R(该子集R没有为列表的多个元素M定义R(L,M))的定义进行扩展,以使得R(L,M)=T(L,M)。或者,对于列表的一些元素M,在词库T中可以使用T(L,M)的定义。
*对于已对它们的R(L,M)进行了定义的列表的一些元素M,缩小了R的定义并且不定义R(L,M)。相同地,对于列表的一些元素M,禁止使用定义T(L,M)。
(4)这里显示的是可以添加到与检索查询Q的节点(例如图6中的“函数”)直接相连的检索查询中的节点的标号。更详细地,该列表是标号L的列表,对于该标号L存在节点z∈F(x)和节点y,以使得链接y-z包含在数据库D中(对于检索查询Q的多个节点x中的每一个),并且y的标号为L。当与标号L相对应的节点y(存在节点z∈F(x),且链接y-z在数据库D中,并且y的标号为L)数量少的时候,对于每一个这样的y,可以将y周围的一些节点的标号作为列表的元素添加到L中。用户可以按下面所述的方式根据列表的元素来规定是(黑色圆圈)否(空心圆圈)可以扩展检索查询Q。
*将以M作为标号的节点Y和链接x-Y添加到与列表的一些元素M相关的检索查询Q中。即,检索查询Q是由M扩展的。还可以直接输入M而不是从列表中选择。
(5)这里显示的是将要插入到检索查询Q的两个节点之间(图6中的“函数”和“分析”之间)的多个节点的标号。更详细地,这是节点z的标号的列表,这些节点z包括在连接候选解f中的节点f(x)和节点f(y)的最短路径内(对于检索查询Q的链接x-y中的每一个),并且对于一些候选解f来说这些节点z不包含在值域f(Q)内。用户可以以下面所述的方式规定是(由图6中的黑色圆圈表示)否(由空心圆圈表示)将列表的每个元素插入到检索查询Q中。
*将以该列表的特定元素作为标号的节点z、链接x-z和链接z-y添加到检索查询Q中。即,将该元素插入到检索查询Q中。
如果用户通过点击“检索执行按钮”请求再检索,则步骤S4返回到步骤S2。另一方面,如果没有再检索的请求,则处理结束。
可提供本发明的信息检索方法和信息检索装置/系统作为用于使计算机执行这些过程的信息检索程序,作为其上记录有该信息检索程序的计算机可读记录介质,作为包括该信息检索程序并且可以加载到计算机的内存中的程序产品,以及作为诸如包括程序的服务器的计算机。
工业适用性
如上所述,本发明通过在信息检索中向用户提供适当的信息来进行有效的交互,使得可以提高信息检索的效率和准确性。本发明通过利用检索查询所特有的数据库和图结构自动地缩小检索空间,与此同时通过交互式地输入或修正检索查询和检索范围,使得可以保持高效率和高鉴别精确度地进行信息检索。
本发明还使得可以将检索查询和数据库作为具有如同自然语言语句一样的不确定的结构的图来进行处理,并且可以提高检索的效率和准确度,使用户能够与以该结构作为提示的检索引擎进行交互。

Claims (11)

1. 一种信息检索方法,其包括以下步骤:
处理单元通过输入单元接收一检索查询Q的输入,该检索查询Q包含与多个节点、多个节点的标号和这些节点之间的链接相关的信息;
该处理单元通过参考存储有用于定义多个节点的标号之间的相似性程度的词库T的词库存储单元,使用由词库T的子集R根据输入的链接定义的多个标号之间的相似性,并且参考存储有输入的节点和标号的数据库D,找到作为响应于检索查询Q对数据库进行搜索而得到的结果的候选解集合F;
该处理单元在显示单元上显示找到的候选解集合F;
该处理单元通过该输入单元接收与候选解集合F中的一些元素是否表示解相关的输入信息;
该处理单元根据输入信息从候选解集合F中删除候选解集合F中的一些元素;
该处理单元基于通过该输入单元输入的与删除、增加或更改词库T的子集R和/或检索查询Q相关的输入信息来删除、增加或更改子集R和/或查询检索Q的内容;以及
如果存在来自用户的再检索请求,则返回到检索步骤以重复该处理,或如果没有请求,则结束该处理。
2. 根据权利要求1的信息检索方法,进一步包括以下步骤:
该处理单元在该显示单元上显示一检索查询Q;
该处理单元通过该输入单元接收下述的输入信息,该输入信息在不存在连接该检索查询Q的两个节点的链接时指示插入一链接;
该处理单元根据输入信息插入该链接;
该处理单元通过该输入单元接收用于指示删除该检索查询Q中的链接的输入信息;
该处理单元根据输入信息删除该链接;
该处理单元通过该输入单元接收用于指示将一新节点添加到该检索查询Q中的输入信息;
该处理单元根据输入信息将该节点添加到该检索查询Q中;
该处理单元通过该输入单元接收用于指示删除不是该检索查询Q的链接端点的节点的输入信息;
该处理单元根据输入信息从该检索查询Q中删除该节点。
3. 根据权利要求1或2的信息检索方法,进一步包括以下步骤:
对于该检索查询Q的每一个节点x,该处理单元在显示单元上显示数据库D的多个节点的标号M的列表,以在词库存储单元中的词库T中定义值T(L,M),该值T(L,M)表示在节点x的标号L和数据库D中的节点的标号M之间的相似性程度;
该处理单元通过该输入单元接收用于指示选定或不选定每一个这样的标号M的输入信息;以及
该处理单元根据输入信息扩展子集R的定义以包括与在词库T的子集R中没有为其定义R(L,M)的那些M相关的R(L,M)=T(L,M),或者缩小R的定义以不定义与已为其定义了R(L,M)的那些M相关的R(L,M)。
4. 根据权利要求1所述的信息检索方法,进一步包括以下步骤:
该处理单元在显示单元上显示多个节点y的标号的列表,以使得对于检索查询Q中的每一个节点x,存在节点z∈F(x)并且链接y-z为数据库D中的链接;
该处理单元通过该输入单元接收用于指示选定这种标号中的一些的输入信息;以及
该处理单元根据该输入信息,对于所选定的标号L中的每一个,将以L作为标号的节点y和链接x-y添加到检索查询Q中。
5. 根据权利要求1所述的信息检索方法,进一步包括以下步骤:
对于检索查询Q中的每一个链接x-y,该处理单元在显示单元上显示多个节点z的标号的列表,这些节点z包含在连接候选解f的值域中的节点f(x)和节点f(y)的最短路径中,而不包含在某些候选解f的值域f(Q)中;
该处理单元通过输入单元接收用于指示选定这种标号中的一些的输入信息;和
该处理单元根据该输入信息将以该列表的选定元素作为标号的节点z、以及链接x-z和z-y添加到检索查询Q中。
6. 一种信息检索方法,其包括以下步骤:
处理单元通过输入单元接收一检索查询Q的输入,该检索查询Q包含与多个节点、多个节点的标号和这些节点之间的链接相关的信息;
该处理单元通过参考存储有用于定义多个节点的标号之间的相似性程度的词库T的词库存储单元,使用在根据输入的检索查询Q而确定为可用的词库T的一部分中定义的多个标号之间的相似性程度,并且参考存储有所输入的节点和标号的数据库D,找到作为响应于该检索查询Q对数据库进行搜索而得到的结果的候选解集合F;
该处理单元在显示单元上显示找到的候选解集合F;
该处理单元通过该输入单元接收与候选解集合F中的一些元素是否表示解相关的输入信息;
该处理单元根据输入信息从候选解集合F中删除候选解集合F中的一些元素;
该处理单元基于通过该输入单元输入的与删除、增加或更改词库T和/或检索查询Q相关的输入信息来删除、增加或更改词库T和/或检索查询Q的内容;以及
如果存在来自用户的再检索请求,则该处理单元返回到检索步骤以重复该处理,或如果没有请求,则结束该处理。
7. 根据权利要求6所述的信息检索方法,进一步包括以下步骤:
该处理单元在显示单元上显示一检索查询Q;
该处理单元通过输入单元接收下述的输入信息,该输入信息在不存在连接检索查询Q的两个节点的链接时指示插入一链接;
该处理单元根据输入信息插入该链接;
该处理单元通过该输入单元接收用于指示删除检索查询Q中的链接的输入信息;
该处理单元根据输入信息删除该链接;
该处理单元通过输入单元接收用于指示将一新节点添加到检索查询Q中的输入信息;
该处理单元根据输入信息将该节点添加到检索查询Q中;
该处理单元通过该输入单元接收用于指示删除检索查询Q的节点的输入信息;以及
该处理单元根据输入信息从检索查询Q中删除该节点。
8. 根据权利要求6或7所述的信息检索方法,其包括以下步骤:
对于检索查询Q中的每一个节点x,该处理单元在显示单元上显示数据库D的多个节点的标号M的列表,以在词库存储单元中的词库T中定义值T(L,M),该值T(L,M)表示节点x的标号L和数据库D中的节点的标号M之间的相似性程度;
该处理单元通过该输入单元接收指示选定或不选定一些这种标号M的输入信息、指示改变多个这种标号M的值T(L,M)的输入信息、和用于规定多个这种任意新标号N的输入信息的步骤;以及
该处理单元允许对所选定的标号M在词库T中使用T(L,N)的定义,而对未选定的元素M禁止使用T(L,M)的定义,将T(L,M)的值改变为用于规定标号M的规定值,或者在允许对规定标号N使用T(L,N)的定义的同时,将T(L,N)的值设置为1。
9. 根据权利要求6所述的信息检索方法,其包括以下步骤:
对于检索查询Q中的每一个节点x,该处理单元在该显示单元上显示以下列表,
{L|对于节点y和节点z∈F(x),
L为y的标号,并且
链接y-z包含在数据库D中。};
该处理单元通过输入单元接收用于指示选定一些标号的输入信息;以及
该处理单元根据输入信息,对于每个选定的标号L,将以L作为标号的节点Y和链接x-Y添加到检索查询Q中。
10. 根据权利要求6所述的信息检索方法,进一步包括以下步骤:对于上述列表中的每一个标号M,当以下集合的大小小于一预定值时,对于以下集合中的每一个元素,除了作为以上列表的元素的标号M以外,该处理单元还可以在该显示单元上显示y周围的一些节点的标号。
{y|y的标号为M。
对于节点z∈F(x),
链接y-z包含在数据库D中。}
11. 根据权利要求6所述的信息检索方法,进一步包括以下步骤:
对于检索查询Q中的每一个链接x-y,该处理单元在显示单元上显示多个节点z的标号的列表,这些节点z包含在连接候选解f的值域中的节点f(x)和节点f(y)的最短路径中,而不包含在某些候选解f的值域f(Q)中;
该处理单元通过该输入单元接收用于如此指示选定这种标号中的一些的输入信息;以及
该处理单元根据该输入信息将以该列表的选定元素作为标号的节点z、以及链接x-z和z-y添加到检索查询Q中。
CNB028205405A 2001-10-17 2002-05-22 信息检索方法 Expired - Fee Related CN100419746C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2001319290 2001-10-17
JP319290/2001 2001-10-17

Publications (2)

Publication Number Publication Date
CN1571966A CN1571966A (zh) 2005-01-26
CN100419746C true CN100419746C (zh) 2008-09-17

Family

ID=19136863

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028205405A Expired - Fee Related CN100419746C (zh) 2001-10-17 2002-05-22 信息检索方法

Country Status (6)

Country Link
US (1) US7346614B2 (zh)
EP (1) EP1445708A4 (zh)
JP (1) JPWO2003034279A1 (zh)
KR (1) KR100593561B1 (zh)
CN (1) CN100419746C (zh)
WO (1) WO2003034279A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7346614B2 (en) 2001-10-17 2008-03-18 Japan Science And Technology Corporation Information searching method, information searching program, and computer-readable recording medium on which information searching program is recorded
JP4385087B2 (ja) * 2003-03-24 2009-12-16 独立行政法人科学技術振興機構 生活情報支援システム
US20040215608A1 (en) 2003-04-25 2004-10-28 Alastair Gourlay Search engine supplemented with URL's that provide access to the search results from predefined search queries
CN100356352C (zh) * 2003-06-20 2007-12-19 华为技术有限公司 基于人机语言对用户进行在线帮助的方法
US7369677B2 (en) * 2005-04-26 2008-05-06 Verance Corporation System reactions to the detection of embedded watermarks in a digital host content
US8375048B1 (en) * 2004-01-20 2013-02-12 Microsoft Corporation Query augmentation
US8417697B2 (en) * 2005-08-22 2013-04-09 Google Inc. Permitting users to remove documents
US7805425B2 (en) * 2006-04-28 2010-09-28 Microsoft Corporation Efficient database lookup operations
US20090055346A1 (en) * 2007-08-23 2009-02-26 Yahoo! Inc. Scalable Ticket Generation in a Database System
US8943164B2 (en) * 2007-12-24 2015-01-27 Qualcomm Incorporated Apparatus and methods for retrieving/ downloading content on a communication device
JP5526396B2 (ja) * 2008-03-11 2014-06-18 クラリオン株式会社 情報検索装置、情報検索システム及び情報検索方法
CN101593181B (zh) * 2008-05-30 2011-03-23 英业达股份有限公司 跨词库字词翻译查询系统及其方法
US8027973B2 (en) * 2008-08-04 2011-09-27 Microsoft Corporation Searching questions based on topic and focus
US8244310B2 (en) 2010-02-16 2012-08-14 Research In Motion Limited Mobile communication device employing power pack with multiple pairs of taps
CN102682001B (zh) * 2011-03-09 2016-12-28 阿里巴巴集团控股有限公司 一种确定推荐词的方法及设备
JP2021117663A (ja) * 2020-01-24 2021-08-10 富士通株式会社 類似度計算装置、類似度計算方法、及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0977154A2 (en) * 1998-07-29 2000-02-02 Xerox Corporation Presenting node-link structures with modification
JP2001282811A (ja) * 2000-03-29 2001-10-12 Computer Consultant Kk 知識データ検索装置、知識データ検索方法及び知識データを検索するプログラムを記録したコンピュータ読み取り可能な記録媒体

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2786194B2 (ja) 1987-11-27 1998-08-13 株式会社日立製作所 情報検索装置及び情報検索方法
JPH045760A (ja) 1990-04-24 1992-01-09 Hitachi Ltd 自然語処理方法および自然語処理システム
JP2943447B2 (ja) * 1991-01-30 1999-08-30 三菱電機株式会社 テキスト情報抽出装置とテキスト類似照合装置とテキスト検索システムとテキスト情報抽出方法とテキスト類似照合方法、及び、質問解析装置
US5421008A (en) * 1991-11-08 1995-05-30 International Business Machines Corporation System for interactive graphical construction of a data base query and storing of the query object links as an object
US6269368B1 (en) * 1997-10-17 2001-07-31 Textwise Llc Information retrieval using dynamic evidence combination
WO1999021110A1 (en) 1997-10-22 1999-04-29 Glaxo Group Ltd. Computer thesaurus manager
JP3577972B2 (ja) * 1998-10-19 2004-10-20 日本電信電話株式会社 類似度判定方法及び文書検索装置及び文書分類装置及び文書検索プログラムを格納した記憶媒体及び文書分類プログラムを格納した記憶媒体
JP2000123401A (ja) 1998-10-19 2000-04-28 Sony Corp 情報記録再生装置および方法、並びに光学ピックアップ
JP2001195428A (ja) 1999-11-02 2001-07-19 Atr Media Integration & Communications Res Lab 連想的情報探索装置
JP3581074B2 (ja) 2000-03-07 2004-10-27 日本電信電話株式会社 文書ダイジェスト作成方法、文書検索装置および記録媒体
US7346614B2 (en) 2001-10-17 2008-03-18 Japan Science And Technology Corporation Information searching method, information searching program, and computer-readable recording medium on which information searching program is recorded

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0977154A2 (en) * 1998-07-29 2000-02-02 Xerox Corporation Presenting node-link structures with modification
JP2001282811A (ja) * 2000-03-29 2001-10-12 Computer Consultant Kk 知識データ検索装置、知識データ検索方法及び知識データを検索するプログラムを記録したコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
WO2003034279A1 (fr) 2003-04-24
US20060212424A1 (en) 2006-09-21
KR20040101189A (ko) 2004-12-02
JPWO2003034279A1 (ja) 2005-02-03
US7346614B2 (en) 2008-03-18
EP1445708A1 (en) 2004-08-11
CN1571966A (zh) 2005-01-26
KR100593561B1 (ko) 2006-06-28
EP1445708A4 (en) 2006-12-27

Similar Documents

Publication Publication Date Title
CN100419746C (zh) 信息检索方法
US5210868A (en) Database system and matching method between databases
US6665669B2 (en) Methods and system for mining frequent patterns
US7243110B2 (en) Searchable archive
US6199061B1 (en) Method and apparatus for providing dynamic help topic titles to a user
US5893094A (en) Method and apparatus using run length encoding to evaluate a database
JPH11212980A (ja) インデクス作成方法および検索方法
CN111752955A (zh) 数据处理方法、装置、设备及计算机可读存储介质
CN110866018A (zh) 一种基于标签及标识解析的汽摩行业数据录入及检索方法
JP2004030221A (ja) 変更対象テーブル自動検出方法
JP5844824B2 (ja) Sparqlクエリ最適化方法
CN107145538B (zh) 表格数据查询方法、装置与系统
US5649180A (en) Method for generating hierarchical specification information from software
JP2693914B2 (ja) 検索システム
US20010051942A1 (en) Information retrieval user interface method
CN110442593B (zh) 基于用户搜索信息跨应用共享的方法
JP3856388B2 (ja) 類義性計算方法、類義性計算プログラム、類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0584938B2 (zh)
JP3591813B2 (ja) データ検索方法、その装置および記録媒体
KR101105947B1 (ko) 상품모델을 자동으로 매칭시키는 상품 정보 등록 방법 및시스템
JP4247026B2 (ja) キーワード頻度算出方法及びそれを実行するプログラム
JPH04237371A (ja) チェック項目データベース検索システム
JPH10149367A (ja) テキスト蓄積検索装置
RU2266560C1 (ru) Способ поиска информации в политематических массивах неструктурированных текстов
JPH08249346A (ja) 文書検索装置及び文書生成方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080917

Termination date: 20100522