CN1950819A - 检索信息的系统和方法以及储存信息的系统和方法 - Google Patents
检索信息的系统和方法以及储存信息的系统和方法 Download PDFInfo
- Publication number
- CN1950819A CN1950819A CNA2005800141352A CN200580014135A CN1950819A CN 1950819 A CN1950819 A CN 1950819A CN A2005800141352 A CNA2005800141352 A CN A2005800141352A CN 200580014135 A CN200580014135 A CN 200580014135A CN 1950819 A CN1950819 A CN 1950819A
- Authority
- CN
- China
- Prior art keywords
- record
- statement
- information
- language statement
- identifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 34
- 238000004590 computer program Methods 0.000 claims description 4
- 238000007689 inspection Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000008676 import Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 230000037308 hair color Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
一种用于检索信息的系统,该系统包括用来获得语句的输入装置;和处理装置,根据语句的元素选择第一记录;参考第一记录选择第二记录;检查第二记录以识别第三记录;和使用第三记录检索信息。
Description
技术领域
本发明一般涉及一种检索信息的系统和方法,以及涉及一种储存信息的系统和方法。本发明有特定的但决不是唯一的管理存储在计算机系统里的信息的应用。
背景技术
当今的信息管理系统已经设计成能管理基于预定信息结构的信息(例如,检索或存储信息)。预定的信息结构包括用于表示特定的信息类型的许多不同的字段字段。例如,这些字段字段之一字段可用来存储个人的电话号码,同时,另外一个字段字段可以用来存储这个人的地址。使用预定信息结构出现的问题是,除非给字段被分配用来表示特定的信息类型,它很难用预定的信息结构随时存储特定类型的信息。例如,用于管理个人联系信息(如电话号码和地址)的现有系统一般没有能力存储人的医学的细节信息。这主要是因为在系统中所用的管理个人联系信息的预定的信息结构没有分配存储医学记录的字段。
有两种可能的方案用于解决与使用预定信息结构相关的上述问题。第一种方案是修改信息管理系统,从而使预定数据结构包括必要的字段。第二种方案是用具有能够管理要求的信息的新系统代替现有信息管理系统。不幸的是,这两种方案一般是不合希望的,因为他们可能包含很大的费用并且可导致系统故障时间。
发明内容
根据本发明的第一个方面,提供一种用来检索信息的系统,该系统包括:
输入装置,用来获得语句;和
处理装置,根据语句的元素选择第一记录;参考第一记录选择第二记录;检查第二记录来识别第三记录;和使用第三记录检索信息。
优选地,该处理装置用来选择第一记录是通过:定位包括相应于该元素的信息的第四记录;获得第四记录的识别符;和确定第一记录是否包括该识别符,其中如果确定第一记录包含该识别符,那么选择第一记录。
优选地,该处理装置用来检索信息是通过:检查第三记录来识别至少一个第五记录;并从这至少一个第五记录获得信息。
优选地,该输入装置包括:
用于接收自然语言语句的接口;和
基于自然语言语句的分析来创建中间语言语句的分析器,其中该处理装置使用该中间语言语句作为语句。
优选地,第三记录是与第一记录相关。
优选地,第一,第二,第三,第四和第五记录包含在一个表里。
根据本发明的第二方面,提供一种用来存储信息的系统,该系统包括:
用来获得语句的输入装置;和
创建第一记录的处理装置,第一记录基于语句的元素可被识别;参考第一记录创建第二记录,和检查第二记录可识别第三记录;并且安排第三记录使得它可被用来检索信息。
优选地,该处理装置用来创建第一记录是通过:创建包含相应于该元素的信息的第四记录;获得第四记录的识别符;和设置第一记录使它包括该识别符。
优选地,该处理装置安排第三记录,使得它可被检查以识别至少一个第五记录,安排该处理装置用来创建第五记录,使它包含该信息。
优选地,该输入装置包括:
用来接收自然语言语句的接口;和
基于自然语言语句的分析来创建中间语言语句的分析器,其中该处理装置使用中间语言语句作为该语句。
优选地,第三记录是与第一记录相关。
优选地,第一,第二,第三,第四和第五记录包含在一个表里。
根据本发明的第三方面,提供一种检索信息的方法,该方法包括以下步骤:
获得语句;
根据该语句的元素选择第一记录;
参考第一记录选择第二记录;
检查第二记录从而识别第三记录;和
使用第三记录检索信息。
优选地,选择第一记录的步骤包括:
定位包含相应于该元素的信息的第四记录;
获得第四记录的识别符;和
确定第一记录是否包含该识别符,
如果确定第一记录包含该识别符,则选择第一记录。
优选地,检索该信息的步骤包括:检查第三记录来识别至少一个第五记录;和从至少一个第五记录中获得该信息。
优选地,获得语句的步骤包括:
接收自然语言语句;
在自然语言语句分析的基础上创建中间语言语句;和
使用该中间语言语句作为语句。
优选地,第三记录是与第一记录相关。
优选地,第一,第二,第三,第四和第五记录包含在一个表里。
根据本发面的第四方面,提供存储信息的方法,该方法包括以下步骤:
获得语句;
基于语句的元素创建可被识别的第一记录;
参考记录创建第二记录,和检查第二记录来识别第三记录;
安排第三记录,使它能够用于检索信息。
优选地,创建第一记录的步骤包括:
创建包括相应于该元素的信息的第四记录;
获得第四记录的识别符;和
设置第一记录,使它包含该识别符。
优选地,安排第三记录的步骤包括以下步骤:
安排第三记录,使它至少识别一个第五记录;和
安排第五记录,使它包含该信息。
优选地,获得语句的步骤包括:
获得自然语言语句;
在自然语言语句分析的基础上创建中间语言语句;和
使用该中间语言语句作为语句。
优选地,第三记录是与第一记录相关。
优选地,第一,第二,第三,第四和第五记录包含在一个表里。
根据本发明的第五方面,提供包括至少一条指令的计算机程序,用来使计算机设备根据本发明的第三或第四方面执行该方法。
根据本发明的第六方面,提供计算机可读介质,包括根据本发明的第五方面的计算机程序。
附图说明
尽管任何其他实施例可能落入本发明的范围中,下面只是通过举例并参考附图叙述本发明的一个实施例,其中:
图1图解说明本发明的实施例;
图2图解说明用于图1中所示的本发明的实施例的图形用户接口;
图3图解说明图1所示的本发明的实施例所维护的一个表。
图4a至图4c图解说明了通过图1所示的本发明的实施例存储信息的例子。
图5表示当存储信息时,由图1的系统执行的各个步骤的流程图。
图6表示当检索信息时,由图1的系统执行的各步骤的流程图。
图7图解说明由图1的系统存储的信息的安排。
具体实施方式
图1图解说明本发明的实施例。该实施例包括安装微软视窗操作系统的个人计算机1。除了该操作系统以外,该个人计算机1还安装了可由计算机1的用户用来管理信息的信息管理软件。该信息管理软件是可被用来管理不同范围的信息,例如一组人的联系细节或者一组医学记录。
该信息管理软件包括可操作的、以图形用户接口(GUI)的形式表示接口3的第一模块,图形用户接口在图2中表示。接口3包括用户使用键盘7可输入自然语言语句的对话框5,键盘7与计算机1相连。该信息管理软件是能够接收多种语言的自然语言语句。自然语言语句的例子可为“我的汽车注册在2005年4月15日”或“我的汽车什么时候该更新了?”。本发明的实施例的一个独特的方面是用户可使用自然语言语句管理信息,其带来的好处是提供容易使用并且不必为管理信息而去学习特殊的计算机语言的不希望的要求。
信息管理软件包括可操作而起着分析器功能的第二模块,分析器用来分析由接口3接收到的自然语言语句。分析器基本上可操作用于从自然语言语句的分析创建中间语言语句。为了创建中间语言语句,分析器可把自然语言语句分为主语和谓语,识别主语和宾语中名词和限定副词以及动词和其所暗示的关系的种类。
除了能够分析自然语言语句,第二模块具有识别自然语言语句的模式和使用该模式来推导出数据类型的能力,使得该输入(自然语言语句)可准确地转换成中间语言语句。信息管理软件是模式定义存储在知识库(KnowldegeBase)中(在下面的段落中详细描述)。在知识库的模式定义可被加或旧的模式定义被编辑或取消。第二模块是可操作用来处理下面控制模式:
可选的:以下模式是可选的。如果他不在目标中出现(输入是匹配的),不要失去模式匹配。
多次:以下模式可能在目标中发生多次。连续匹配每一次重复直到找到不匹配。除非可选的模式先于多次的模式,否则至少在目标中出现一次多次的模式。
第二模块的模式匹配能力还是可以处理嵌入模式里的模式:父模式可有子模式。例如,如果语句的模式被定义为“主语谓语”(Subject Predicate),第二模块是在该“主语”和“谓语”知识项中寻找另外的模式知识项,直到他定位没有另外的知识项的知识对象为止。知识项和知识对象的概念将会在下面的叙述段落中具体描述。
第二模式的模式匹配能力还是可以处理父模式的多个子模式。比如,如果哪个自然语言语句被认为是一个“句子”,一个句子模式可能有以下子模式:
命令;
语句;
问题。
中间语言包括一组操作符(被用来作为操作符的实际符号只是在用翻译软件的时候才有意义,即,需要解码这些语句)。用在实施例中的一些符号如下所示:
= 是
& 具有非排他的特征(如果他不存在,就创建新的实例)。不要无效这个特征的任何其他的实例。
. 具有排他的特征(如果他不存在,就创建新的实例)。无效这个特征的任何其他的实例
> 动作
() 用于包含属性
: 把在属性中的概念和值分开
, 分开属性。
/ 把路径中的宾语和主语分开。
! 否
* 新实例或概念。如果准确的匹配不存在,创建一个新的知识项。
? 当位于路径末端时,表明询问不是一个语句
-n 用在知识库的值字段中。当一个或多个知识对象识别符(Id)被编码在ASCII数据流中时,位于每一个知识对象识别符前面。‘n’用来表示在知识对象识别符中的数字的数量。这只是举例。在文本或者其他数据流中的用于编码知识对象识别符的一些其他的选项可使用固定长度字段ASCII字段或者固定长度二进制数据字段,用定义的在前面的转移字符识别。
用在中间语言语句中的实际词语可以是来自任意人类语言,或者也可以是符号信息,比如说模式掩码(pattern mask)或数学公式。中间语言语句的例子是:杰克.头发/(颜色:黑,长度:短),这个还在法语中也一样:杰克.头发/(颜色:黑,长度:短)(Jacques.cheveux/(couleur:noir,longueur:court))。这个中间语言语句的例子可从英语的句子“杰克有短的黑头发”进行翻译。
除了第一模块和第二模块,信息管理软件包括负责管理信息的第三模块;例如,存储并检索信息。为了管理信息,第三模块基本上使用由第二模块创建的中间语言语句来管理该信息。在描述第三模块如何利用中间语言语句之前,先表述信息存储的方式是谨慎的做法。
在本实施例中,计算机1加载上微软存取(Microsoft Access)相关的数据库作为根本的工具,用来存储信息。本领域的技术人员懂得,计算机1可安排用于其他的数据库,作为存储信息的根本工具。在查阅知识库以后,第三模块使用表格,表示在图3中。该知识库包括多个记录,以下称为知识项。知识项是表格中有效的行,表示在图3中。相关的知识项的集合表示一个知识对象。如从图3可看到的,每一个知识项包括许多字段。下面描述在每个字段里包含的信息:
识别符(Id):识别每个知识项的唯一的字段。
概念:用来识别这个字段是概念或一条知识的实例的可选字段。这是可选的,因为相同的信息可编码为分离的信息项,但是可以更快、更简洁的纪录在该信息项的字段中。
关系:表示这个知识项和它所属的知识对象之间的关系。关系的例子是:“是”,“有”和“做”。“做”可与所有种类的动作(动词)相关。这个字段还编码该关系的时态:过去时,现在时或将来时。
否定:否定该关系字段,用来建立“不是”,“没有”和“不做”类型的关系。
父识别符(Parent_Id):把知识项链接在一起,形成知识对象。共享相同的父识别符的所有知识项是密切相关的并且包括一个知识对象。
概念识别符(Concept_Id):在该知识库中的另一个知识项的指针。这个字段用来表示当前知识项的概念知识对象。例如,如果一个知识对象之前已经被定义为“颜色”并且当前的知识项是“红色”的部分知识对象。如果该关系是“是”的话,当前知识项将表明“红色是一种颜色”,并且概念识别符指向“颜色”的知识对象。
值识别符(Value_Id):在该知识库中的另一个知识项的指针。这个字段用来表示当前知识项的值知识对象。例如,假设知识对象之前已经被定义为“红色”并且另一个知识对象之前已经被定义为“颜色”。当前的知识项是“杰克的头发”的知识对象的一部分。如果该关系是“有”且概念识别符指向知识对象“颜色”并且值识别符指向知识对象“红”,则当前知识项是“杰克有红色的头发”。
值:包括任何种类的二进制数据。他用来编码不用被单个值识别符字段指示的信息。比如可能是文本,编码的值识别符的模式和其他数据,音频或视频数据。
有效:标记(布尔类型的字段),当存储在知识项中的信息不再有效时可被清除,但是被存储作为历史信息。
为了说明信息管理软件如何能够存储信息,考虑用户想要存储信息的例子:一个名叫杰克的人有短的黑头发。为此,用户可简单的往对话框5中输入“杰克有短的黑头发”。第二模块将这句自然语言语句转换成下面的中间语言语句:杰克.头发/(颜色:黑色,长度:短)。参考图4中所示的表,该中间语言语句将传递到第三模块,第三模块尝试定位包含在值字段中具有“杰克”的知识对象、关系为“是”并且概念识别符为B3(B3是为英语名字的概念的知识对象)的所有知识对象。B1中的知识对象满足这些条件,因此它是英文名杰克的知识对象。定位了词“杰克”的知识对象以后,下一个步骤是为杰克本身查找知识对象。这是通过定位所有知识对象关系为“有”、概念识别符为B3(英语名字)和值识别符为B1来进行查找的。在A1的知识对象满足这些条件,因此可假设这个知识对象“有杰克的英文名”。这是杰克本身的知识对象(Jackko)。如果有一个以上的知识对象符合这个条件,翻译器将在继续之前提示更多的信息。
在唯一(或正确地识别的)的杰克知识对象(A1)定位在知识库中以后,第三模块将存储这个知识对象识别符并且移向中间语言语句中的下一个词“头发”并且重复该搜索过程。这包括定位具有关系为“是”、概念识别符为B2(英语词)和值识别符为“头发”的所有知识对象。C1是结果。然后第三模块进入定位具有关系为“是”、概念识别符为B2(英语词)和值识别符为C1的知识对象。A3是结果。这是头发概念(HairKO)的知识对象。
在从中间语言语句中识别前两个知识对象以后,“杰克.头发”可被“A1.A3”代替。下一步是确定中间语言语句的这部分是否可被解决。操作符“.”意为关系“有”,所以第三模块必须检查知识对象A1是否包含具有关系“有”和概念识别符为A3的知识项。这是在知识对象A1的第三行找到的。这个知识项表明“杰克有头发”的知识。如果它不存在,该知识库以前没有杰克有头发这个信息并且因此用这个数据创建新的知识项。
为了存储有关杰克的头发的更多的信息(颜色和长度),需要一个知识对象。知识项3(A2)的值识别符指向包含这一信息的知识对象。如果知识项3在前面的步骤中不存在,这就意味着知识对象A2也不存在,所以第三模块将需要创建知识对象A2(Jack.HairKO)并将其识别符(A2)放在知识项3的值识别符字段中。在知识对象A3中解决了中间语言语句的第一部分“杰克.头发”之后,第三模块将沿着中间语言语句移动到词对“颜色:黑色”。具有关系“是”,概念识别符为B2(英语词)和值识别符为“颜色”的知识对象则被定位。得到选择C2。
然后,第三模块定位关系为“有”、概念识别符为B2(英语词)和值识别符为C2的知识对象。C3是结果。它是颜色概念的知识对象(ColourKO)。接下来,第三模块尝试定位关系为“是”、概念识别符为B2(英语词)和值识别符为“黑色”的知识对象。C4是结果。最后,第三模块定位关系为“有”、概念识别符为B2(英语词)和值识别符为C4的知识对象。B4是结果。它为黑色概念的知识对象(BlackKO)。
定位这些知识对象以后,第三模块搜索具有关系为“有”、概念识别符为C3(ColourKO)和值识别符为B4(BlackKO)的知识对象的A2(Jack.HairKO)。如果找到这个知识项,它表明该知识库已经知道杰克的头发是黑色的,就不进行动作。如果找到关系为“有”、概念识别符为C3(ColourKO)和值识别符不等于B4(BlackKO)的知识项,这个知识项是无效的(IsVailid设定为假)并且创建具有关系为“有”、概念识别符为C3(ColourKO)和值识别符为B4(BlackKO)的新的知识项。这个过程把杰克的头发的颜色从不管以前是什么颜色变成黑色。然而,如果没找到知识项,则创建具有关系为“有”、概念识别符为C3(ColourKO)和值识别符为B4(BlackKO)的新的知识项。这个过程记录杰克的头发的颜色为黑色的。通过信息管理软件存储的信息的安排表示在图7中。
解决了中间语言语句的颜色的部分,第三模块将沿着该中间语言语句移到词对“长度:短”并且执行类似于上面所列的步骤,以便解决该语句的最后部分。
信息管理软件在存储信息时执行的各步骤表示在图5的流程图中。
为了说明信息管理软件是如何检索信息的,考虑下面的例子。想要找出杰克的头发是什么颜色的用户可输入以下的自然语言语句到对话框5中:“杰克有什么颜色的头发?”。这个语句被传到第二模块可得到该中间语言语句:“杰克.头发.染色?”。第三模块使用这个中间语言语句基本按照前面所表述的步骤来识别知识对象A1.A3。一旦识别了这些知识对象,第三模块进入确定头发(A3)是否有颜色概念。为此,第三模块尝试定位具有关系为“是”、概念识别符为B2(英语词)和值识别符为颜色的知识对象。结果是C2。这时,第三软件模块进入定位具有关系为“有”、概念识别符为B2(英语词)和值识别符为C2的知识对象。这个结果是C3被识别。
这时,第三处理装置知道在A1中包含有关杰克的信息,有关杰克的(A1)头发的信息对应于A3的概念,有关杰克的头发颜色的信息对应于C3的概念。因此,为了检索杰克的头发的颜色,第三模块返回到对应于概念识别符A3的A1的值识别符的字段,结果是A2。然后第三模块检查A2,特别是对应概念识别符C3的A2的值识别符字段,这是B4。因为B4的值识别符字段涉及C4(英语词),第三模块通过检查C4值识别符字段为“黑色”,就得到杰克头发的颜色。
然后在信息字段中的词黑色被传回接口3,在对话框5中表示该词黑色。因此,用户能够检索该信息。
因信息管理软件在检索信息时所执行的各步骤表示在图6的流程图中。
本领域的技术人员懂得,在其他的实施例中接口3可能采用不同的形式。例如,在另一种实施例中,该接口可以是语音接口的形式,替代文本驱动的接口。可替代地,该接口可以是包括该语句的基于软件功能(程序)呼叫的形式。本领域的技术人员也懂得,使用本发明的实施例存储的信息可以是不同的信息范围。比如,该信息可以是用于起动或关闭应用的一行文字。在这样的场景中,不是输出信息给对话框5,该信息可进入自动地处理起动相关的应用。
本领域的技术人员懂得,本发明中的一些组件在另外的实施例中可使用专用的硬件,而不是软件来实现。
在本说明书中,词“记录”是指一个知识项,在表中可以表示为单行或者指由可以表中的行表示的知识项的集合构成的知识对象。
本领域的技术人员懂得,这里描述的发明可被变化和修改,而不是具体叙述的那样。应当明白,本发明包括落于本发明的精神和范围的所有这样的变化和修改。
Claims (26)
1.一种检索信息的系统,该系统包括:
输入装置,用来获得语句;和
处理装置,安排用于:根据该语句的元素选择第一记录;参考第一记录选择第二记录;检查第二记录来识别第三记录;和使用第三记录检索信息。
2.根据权利要求1所述的系统,其特征在于安排该处理装置通过以下步骤选择第一记录:定位含有与该元素对应的信息的第四记录;获得第四记录的识别符;和确定第一记录是否含有该识别符,其中如果确定它含有识别符,则选择第一记录。
3.根据权利要求1或2所述的系统,其特征在于安排该处理装置通过以下步骤检索信息:检查第三记录来识别至少一个第五记录;和从该至少一个第五记录中获得该信息。
4.根据前面任意一个权利要求所述的系统,其特征在于第三记录与第一记录相关。
5.根据前面任意一个权利要求所述的系统,其特征在于该输入装置包括:
用来接收自然语言语句的接口;和
基于自然语言语句的分析来创建中间语言语句的分析器,其中安排该处理装置使用该中间语言语句作为该语句。
6.根据前面任意一个权利要求所述的系统,其特征在于第一、第二、第三、第四条和第五记录包含在一个表里。
7.一种存储信息的系统,该系统包括:
输入装置,用来获得语句;和
处理装置,安排用来:创建第一记录,它可根据中间语言语句的元素被识别;参考第一记录创建第二记录,可检查第二记录来识别第三记录;和安排第三记录使得它可用来检索信息。
8.根据权利要求7所述的系统,其特征在于安排该处理装置通过以下步骤创建第一记录:创建包含对应于该元素的信息的第四记录;获得第四记录的识别符;和设置第一记录,使它包含该识别符。
9.根据权利要求7或8所述的系统,其特征在于安排该处理装置用来安排第三记录,使它可被检查来识别至少一个第五记录,该处理装置能够创建第五记录,使它包含该信息。
10.根据权利要求7至9中任一项权利要求所述的系统,其特征在于该输入装置包括:
用来接收自然语言语句的接口;和
基于该自然语言语句的分析来创建中间语言语句的分析器,其中安排该处理装置使用该中间语言语句作为该语句。
11.根据权利要求7至10中任一项权利要求所述的系统,其特征在于第三记录与第一记录相关。
12.根据权利要求7至11中任一项权利要求所述的系统,其特征在于第一、第二、第三、第四和第五记录包含在一个表里。
13.一种检索信息的方法,该方法包括以下步骤:
获得语句;
根据该语句的元素选择第一记录;
参考第一记录选择第二记录;
检查第二记录来识别第三记录;和
使用第三记录检索信息。
14.根据权利要求13所述的方法,其中选择第一记录的步骤包括以下步骤:
定位包含与该元素对应的信息的第四记录;
获得第四记录的识别符;和
确定第一记录是否含有该识别符,
其中如果确定包含该识别符,则选择第一记录。
15.根据权利要求13或14所述的方法,其中检索该信息的步骤包括以下步骤:
检查第三记录来识别至少一个第五记录;和
从该至少一个第五记录中获得该信息。
16.根据权利要求13至15中任一项权利要求所述的方法,其中获得该语句的步骤包括:
接收自然语言语句;
在根据该自然语言语句的分析创建中间语言语句;和
使用该中间语言语句作为该语句。
17.根据权利要求13至16中任一项权利要求所述的方法,其中第三记录与第一记录相关。
18.根据权利要求13至17中任一项权利要求所述的方法,其中第一、第二、第三、第四和第五记录包含在一个表里。
19.一种存储信息的方法,该方法包括步骤:
获得语句;
创建可根据该语句的元素识别的第一记录;
参考第一记录创建第二记录,可检查第二记录来识别第三记录;和
安排第三记录,使它可用来获得信息。
20.根据权利要求19所述的方法,其中创建第一记录的步骤包括步骤:
创建包括对应该元素的信息的第四记录;
获得第四记录的识别符;和
设置第一记录,使它包含该识别符。
21.根据权利要求19或20所述的方法,其中安排第三记录的步骤包含以下步骤:
安排第三记录,使它识别至少一个第五记录;和
安排第五记录,使它包含该信息。
22.根据权利要求19至21中任一个权利要求所述的方法,其中获得语句的步骤包括:
接收自然语言语句;
根据自然语言语句的分析创建中间语言语句;和
使用该中间语言语句作为该语句。
23.根据权利要求19至22中任一个权利要求所述的方法,其中第三记录与第一记录相关。
24.根据权利要求19至23中任一个权利要求所述的方法,其中第一、第二、第三、第四和第五记录包含在一个表里。
25.一种包括至少一个指令的计算机程序,用来使得计算机设备执行根据权利要求书13至21的任一个权利要求所述的方法。
26.一种计算机可读介质,包括根据权利要求21中所要求的的计算机程序。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AU2004902570 | 2004-05-13 | ||
AU2004902570A AU2004902570A0 (en) | 2004-05-13 | A system and method for retrieving information and a system and method for storing information | |
PCT/AU2005/000695 WO2005111860A1 (en) | 2004-05-13 | 2005-05-13 | A system and method for retrieving information and a system and method for storing information |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1950819A true CN1950819A (zh) | 2007-04-18 |
CN1950819B CN1950819B (zh) | 2012-07-18 |
Family
ID=35394334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2005800141352A Expired - Fee Related CN1950819B (zh) | 2004-05-13 | 2005-05-13 | 检索信息的系统和方法以及储存信息的系统和方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7752196B2 (zh) |
JP (1) | JP2007537515A (zh) |
CN (1) | CN1950819B (zh) |
AU (1) | AU2005243114B2 (zh) |
GB (1) | GB2430058A (zh) |
WO (1) | WO2005111860A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8321914B2 (en) * | 2008-01-21 | 2012-11-27 | International Business Machines Corporation | System and method for verifying an attribute in records for procurement application |
US8224797B2 (en) * | 2008-03-04 | 2012-07-17 | International Business Machines Corporation | System and method for validating data record |
US8600772B2 (en) * | 2009-05-28 | 2013-12-03 | 3M Innovative Properties Company | Systems and methods for interfacing with healthcare organization coding system |
US20100305969A1 (en) * | 2009-05-28 | 2010-12-02 | 3M Innovative Properties Company | Systems and methods for generating subsets of electronic healthcare-related documents |
US10586616B2 (en) | 2009-05-28 | 2020-03-10 | 3M Innovative Properties Company | Systems and methods for generating subsets of electronic healthcare-related documents |
US8510328B1 (en) * | 2011-08-13 | 2013-08-13 | Charles Malcolm Hatton | Implementing symbolic word and synonym English language sentence processing on computers to improve user automation |
US9430793B2 (en) * | 2012-02-15 | 2016-08-30 | Rakuten, Inc. | Dictionary generation device, dictionary generation method, dictionary generation program and computer-readable recording medium storing same program |
US9424257B1 (en) * | 2012-08-31 | 2016-08-23 | Keysight Technologies, Inc. | Compiler and operating system adapted for generating programs for decoding communication packets utilizing a protocol stack |
US10042921B2 (en) * | 2015-09-18 | 2018-08-07 | International Business Machines Corporation | Robust and readily domain-adaptable natural language interface to databases |
US10698978B1 (en) * | 2017-03-27 | 2020-06-30 | Charles Malcolm Hatton | System of english language sentences and words stored in spreadsheet cells that read those cells and use selected sentences that analyze columns of text and compare cell values to read other cells in one or more spreadsheets |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE180336T1 (de) * | 1989-09-01 | 1999-06-15 | Amdahl Corp | Betriebssystem und datenbank mit einer aus mehreren tabellen geformten zugriffsstruktur |
JP2710548B2 (ja) * | 1993-03-17 | 1998-02-10 | インターナショナル・ビジネス・マシーンズ・コーポレイション | データを検索する方法およびブール代数文表現と図形表現を互いに変換する方法 |
US5682539A (en) * | 1994-09-29 | 1997-10-28 | Conrad; Donovan | Anticipated meaning natural language interface |
US6078925A (en) * | 1995-05-01 | 2000-06-20 | International Business Machines Corporation | Computer program product for database relational extenders |
US6026388A (en) * | 1995-08-16 | 2000-02-15 | Textwise, Llc | User interface and other enhancements for natural language information retrieval system and method |
US5717914A (en) * | 1995-09-15 | 1998-02-10 | Infonautics Corporation | Method for categorizing documents into subjects using relevance normalization for documents retrieved from an information retrieval system in response to a query |
US6052693A (en) * | 1996-07-02 | 2000-04-18 | Harlequin Group Plc | System for assembling large databases through information extracted from text sources |
US5933822A (en) * | 1997-07-22 | 1999-08-03 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
EP1025518A2 (en) * | 1998-07-24 | 2000-08-09 | Jarg Corporation | Distributed computer database system and method for performing object search |
GB2341250A (en) * | 1998-09-04 | 2000-03-08 | Balaena Limited | Database structure avoids duplication of stored data |
US6654731B1 (en) * | 1999-03-01 | 2003-11-25 | Oracle Corporation | Automated integration of terminological information into a knowledge base |
US20020010574A1 (en) * | 2000-04-20 | 2002-01-24 | Valery Tsourikov | Natural language processing and query driven information retrieval |
US6741986B2 (en) * | 2000-12-08 | 2004-05-25 | Ingenuity Systems, Inc. | Method and system for performing information extraction and quality control for a knowledgebase |
WO2002001401A1 (en) * | 2000-06-26 | 2002-01-03 | Onerealm Inc. | Method and apparatus for normalizing and converting structured content |
US8396859B2 (en) * | 2000-06-26 | 2013-03-12 | Oracle International Corporation | Subject matter context search engine |
US6732097B1 (en) * | 2000-08-11 | 2004-05-04 | Attensity Corporation | Relational text index creation and searching |
JP3842577B2 (ja) * | 2001-03-30 | 2006-11-08 | 株式会社東芝 | 構造化文書検索方法および構造化文書検索装置およびプログラム |
US6961723B2 (en) * | 2001-05-04 | 2005-11-01 | Sun Microsystems, Inc. | System and method for determining relevancy of query responses in a distributed network search mechanism |
US20030084066A1 (en) * | 2001-10-31 | 2003-05-01 | Waterman Scott A. | Device and method for assisting knowledge engineer in associating intelligence with content |
AU2003253663A1 (en) * | 2002-06-17 | 2003-12-31 | Beingmeta, Inc. | Para-linguistic expansion |
US7305129B2 (en) * | 2003-01-29 | 2007-12-04 | Microsoft Corporation | Methods and apparatus for populating electronic forms from scanned documents |
US20040167875A1 (en) * | 2003-02-20 | 2004-08-26 | Eriks Sneiders | Information processing method and system |
US7364432B2 (en) * | 2004-03-31 | 2008-04-29 | Drb Lit Ltd. | Methods of selecting Lock-In Training courses and sessions |
US8401841B2 (en) * | 2006-08-31 | 2013-03-19 | Orcatec Llc | Retrieval of documents using language models |
-
2005
- 2005-05-13 GB GB0623430A patent/GB2430058A/en not_active Withdrawn
- 2005-05-13 WO PCT/AU2005/000695 patent/WO2005111860A1/en active Application Filing
- 2005-05-13 JP JP2007511779A patent/JP2007537515A/ja active Pending
- 2005-05-13 AU AU2005243114A patent/AU2005243114B2/en active Active
- 2005-05-13 CN CN2005800141352A patent/CN1950819B/zh not_active Expired - Fee Related
- 2005-05-13 US US11/568,607 patent/US7752196B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
GB2430058A (en) | 2007-03-14 |
JP2007537515A (ja) | 2007-12-20 |
US20070233660A1 (en) | 2007-10-04 |
CN1950819B (zh) | 2012-07-18 |
AU2005243114A1 (en) | 2005-11-24 |
GB0623430D0 (en) | 2007-01-03 |
AU2005243114B2 (en) | 2011-02-24 |
US7752196B2 (en) | 2010-07-06 |
WO2005111860A1 (en) | 2005-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1950819A (zh) | 检索信息的系统和方法以及储存信息的系统和方法 | |
US10565533B2 (en) | Systems and methods for similarity and context measures for trademark and service mark analysis and repository searches | |
CN1288581C (zh) | 用缩减大小的索引进行文献检索的设备 | |
CN1297936C (zh) | 用来比较两个计算机文件的方法及系统 | |
CN1834955A (zh) | 多语种翻译存储器、翻译方法以及翻译程序 | |
CN1261867C (zh) | 软件中语言资源本地化的实现方法 | |
CN1492367A (zh) | 询问应答系统及询问应答方法 | |
CN1573753A (zh) | 数据库对象脚本生成方法和系统 | |
CN101065746A (zh) | 文件自动丰富的方法和系统 | |
CN1924858A (zh) | 一种获取新词的方法、装置以及一种输入法系统 | |
CN1149737A (zh) | 信息处理方法和装置及存储实施该方法程序的存储介质 | |
CN1653448A (zh) | 搜索数据源的系统和方法 | |
JP2007094775A (ja) | 意味解析装置、意味解析方法および意味解析プログラム | |
JP4860903B2 (ja) | ドキュメントを自動的にインデックスする方法 | |
CN101030267A (zh) | 自动问答方法及系统 | |
CN1848125A (zh) | 报告检查装置及计算机程序产品 | |
US7853595B2 (en) | Method and apparatus for creating a tool for generating an index for a document | |
CN1601520A (zh) | 识别文本文档中的有机化学名称的系统和方法 | |
CN113672628A (zh) | 数据血缘分析方法、终端设备及介质 | |
CN106569947A (zh) | 一种从单元测试代码中提取api使用示例的方法与工具 | |
CN1786947A (zh) | 基于网页页面布局提取网页核心内容的系统、方法和程序 | |
CN1771494A (zh) | 包括无分隔符的块的文本的自动分块 | |
CN1571966A (zh) | 信息检索方法、信息检索程序、和记录有信息检索程序的计算机可读记录介质 | |
CN1542648A (zh) | 用于词分析的系统和方法 | |
CN106648822A (zh) | 界面字符串筛选方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120718 |