CN1945581A - 计算机辅助域专用实体映射方法及系统 - Google Patents

计算机辅助域专用实体映射方法及系统 Download PDF

Info

Publication number
CN1945581A
CN1945581A CNA2006101412803A CN200610141280A CN1945581A CN 1945581 A CN1945581 A CN 1945581A CN A2006101412803 A CNA2006101412803 A CN A2006101412803A CN 200610141280 A CN200610141280 A CN 200610141280A CN 1945581 A CN1945581 A CN 1945581A
Authority
CN
China
Prior art keywords
data
entity
mark
data entity
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006101412803A
Other languages
English (en)
Inventor
G·B·阿维纳什
S·A·西罗海
A·L·维纳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
General Electric Co
Original Assignee
General Electric Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by General Electric Co filed Critical General Electric Co
Publication of CN1945581A publication Critical patent/CN1945581A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

公开一种识别、分析、结构化、映射和分类(82)数据实体(28,30)的技术。通过具有关注属性(26)的关联列表的域定义(12)来建立一个概念性框架。根据关联列表和实体中出现的属性并根据用于分析、识别以及分类属性的规则和算法来对数据实体进行访问(70)、分析(74)、结构化(如果需要)、映射以及分类。可在分类之后执行多种类型的分析。还可执行数据实体的搜索和选择。可处理复杂数据实体,包括文本文档(430)、图像数据(432)、音频数据(434)、波形数据(438)以及它们的组合。

Description

计算机辅助域专用实体映射方法及系统
技术领域
本发明通常涉及数据分类和映射领域。更特别地,本发明涉及用于相关域计算机辅助定义的技术,并涉及基于这种定义的文档和其它数据实体的自动分类,包括实际上非文本的选择、分析以及分类准则。
背景技术
已有一大批技术被发展并当前用于识别同特定关注领域相关的数据实体。正如在此使用的那样,“数据实体”可包括能够被自动技术识别、分析和分类的任何类型的数字化数据。例如仅提及几个,这种实体可包括文本文档、图像文件、音频文件、波形数据以及它们的组合。
现有数据实体识别、分析和分类技术通常被设计来识别相关文档和其它数据项,并在某种程度上搜集项自身或相关部分。例如,通用搜索引擎考虑字符的逻辑搜索或其它准则。可在文档自身或文档的某些部分、附有索引的文档等上面执行搜索。某些搜索工具为了相似的目的是由相关项目来标记文档。结果通常作为列表返回,有时返回到文档的链接。通用技术还使用文档关联性的排序。
尽管这些工具对许多搜索十分有用,但仍需要能够执行更有用搜索和分类的改进工具。存在对一种工具的特定需要,该工具允许基于相关域及域内分类的(更完全的且用户直接的)定义对数据实体进行广泛的分析、结构化、映射以及分类。此外,还需要一种能够根据准则的组合来搜索和分类文档、图像、文本文件、音频文件等的工具。
发明内容
本发明提供一种被设计来响应这种需要对数据实体进行识别、分析、结构化、映射以及分类的新技术。该技术被称为“域专用(domain-specific)”是由于它方便了用户定义“域”。域可以属于由用户定义的任何概念性的领域,连同其中的概念性子划分或级别。那么,域实质上定义了一种概念性框架,根据这个概念性框架识别、结构化、映射并分类数据实体。
本发明允许对大范围数据实体进行识别、选择和处理,包括定义为文本、图像、波形、音频文件等以及它们的组合的数据。本发明允许通过设置轴(axis)、每个轴的标注(label)以及每个标注的属性的定义来对所关注的多维域(例如主题域)进行定义。轴可以再分域,而标注可再分轴。由此可定义任何数目的连续等级。标注基础的属性通常形成准则的基础,根据这一准则对数据实体进行识别和处理。可随时间改变、改进、扩大或换句话说操作整个域定义。
轴、标注和属性都可以是或包含多种数据定义类型中的任何一种,即文本、图像、波形、音频文件等等。因此,可通过直接应用数据定义,例如通过期望文本、图像、波形、音频文件等的代码表示的直接比较,实现诸如搜索数据实体、它们的结构化、它们到域的映射、它们的分类、它们的分析等操作。从这一框架出发便可建立知识库或集成知识库(IKB:Integrated Knowledge Base)以及后续的搜索、分析、映射和分类,并且可基于IKB或基于执行在不同数据库中的新搜索来利用实体。
还提供一个用户可配置的显示范围,以便促进用户分析,以及同域定义、域改进、数据实体的统计分析或其它分析间的交互作用,或同数据实体自身间的交互作用。
本发明设想一种方法,用于执行这种域定义和数据实体分析、结构化、映射和分类,以及执行这种功能的系统和软件。
附图说明
参考附图阅读下面的详细阐述将会更好地理解本发明的这些和其它特征、方面和优势,附图中相同符号表示相同部件,其中:
图1是根据本技术多个方面的数据实体定义、结构化、映射和分类系统的概观;
图2是可能用在诸如图1所示的系统中的示例性域定义逻辑的流程图;
图3是基于域定义的实体处理逻辑的流程图;
图4是通过图3逻辑执行的示例性数据实体映射的概略表示;
图5是可根据本技术多个方面实现的相关域和域等级的概略表示;
图6是一种多级域定义的概略表示,它被执行来促进数据实体的结构化、映射、分类和分析;
图7是一种示例性域定义模板的表示,它用于同根据本技术多个方面编程的计算机一起使用;
图8是一种对图7模板定义的轴和标注进行定义的示例性模板的表示;
图9是为域的轴和标注定义数据实体属性的示例性界面;
图10是用于数据实体搜索和分类并基于这种搜索和分类建立IKB的示例性逻辑的流程图;
图11是一个对实体集合如何通过根据本技术的域定义和规则映射到IKB中进行说明的概略表示;
图12是可被执行用于分析和分类数据实体的某些处理步骤的概略表示;
图13是一种在诸如IKB的已知领域中识别相关记录或数据实体的示例性过程的概略表示;
图14是一个诸如文本文档的已分析数据实体组的示例性表示,并且基于一个域定义作为概念框架进行高亮显示;
图15是分析的另一种表示,它被执行在一组数据实体上用以识别建立在一组数据实体上的域定义的概念性框架的多个属性或多个部分之间的对应;
图16是一系列数据实体的分析的一种示例性表示,示出具有特定属性的实体间对应关系的重叠或交集;
图17是执行在一个记录或数据实体序列上的分析的另一种示例性表示,用于域定义或分析或概念性框架的一部分;
图18是执行在一个数据序列上的分析的另一种示例性表示,示出由诸如所有权的其它准则做出的分类;
图19是按照记录本身(即数据实体)来分析和分类数据实体的另一种示例性表示;
图20是为数据实体序列分析的数据的另一种示例性表示,指示域定义的概念性框架对实体的累积计数;
图21是同图20相似的数据实体示例性分析的另一种表示,但示出了可基于已分析和已分类数据实体获得的数据的示例性附加显示;
图22是基于域定义及其相关概念性框架的数据实体分析和分类的另一种交互表示的概略表示;
图23是应用到图像数据文件以及相关文本文件用以建立诸如IKB的此类文件数据库的域定义、搜索、分析、映射和分类技术的一种概略表示;
图24是分析、映射和分类图像和文本文件以根据本技术的多个方面分类和映射文件的示例性工作流程的另一种概略表示;
图25是图23和24处理之后的图像和文本文件分析的一系列概要的一个示例性显示的表示;
图26是可在数据实体中定义、查找、定位或映射的示例性特征或特性类型矩阵的一种概略表示;
图27是具有根据图像和图像内的特征定义的标注的示例性轴的一种概略表示;
图28是具有参考波形定义的标注的示例性轴的一种类似的概略表示;以及
图29是具有参考音频特征定义的标注的示例性轴的一种类似的概略表示。
具体实施方式
转向附图并首先参考图1,概略示出数据实体映射系统10,用于建立域定义,并用于根据该定义搜索、分析、结构化、映射和分类数据实体。在图1示出的实施例中,由参考数字12表示域定义。正如下面更详细阐述的那样,域定义可能涉及诸如技术领域的任何相关领域。根据下面阐述的技术建立域定义,并通常考虑相关区域的逻辑子划分部分的概念性框架。每个部分还被子划分为任意数目的概念性等级。这些等级同易于在数据实体中发现的属性相关联,允许它们的识别、分析、结构化、映射和分类。正如下面所阐述的那样,可由文本、图像特征或特性、波形特征或特性、音频文件特征或特性或任何其它信息编码类型定义这些属性。
域定义12链接到处理系统14,处理系统14利用该域定义识别来自一个数据资源范围中任意数据资源16的数据实体。处理系统14通常包括一个或多个编程计算机,它们可位于一个或多个位置。域定义自身可被存储在处理系统14中,或者在请求搜索、分析、结构化、映射或分类数据实体时由处理系统14访问该定义。为了允许用户连接域定义和数据源以及数据实体自身,提供了一系列可编辑界面18。再次地,这些界面可存储在处理系统14中或被该系统在需要时访问。该界面产生一系列视图20,下面将对视图20进行阐述。通常,视图允许域定义、域改进、数据实体分析、观察分析结果以及观察数据实体自身并同数据实体自身交互。
返回到本阐述的域定义12,术语“轴(axis)”、“标注(label)”和“属性(attribute)”用于由域定义表示的概念性框架的不同等级。本领域技术人员能够理解,可使用任何其它术语。通常,定义的轴表示域的概念性子划分。正如下面所阐述的那样,轴不必覆盖整个域,实际上将其战略性结构化,用以允许分析和观察特定等级中数据实体的某些方面。由参考数字22表示的轴由此被标注24子划分。再次地,任何适当术语都可用于概念性子划分的这一附加等级。尽管标注可能没有覆盖可分配给轴的全部概念范围,但标注通常为各个轴的概念性部分。此外,本技术不排除覆盖、冗余,或相反,一个轴同另一个轴的标注之间或实际上轴自身之间的相异。
每个标注随后同属性26相关联。再次地,属性可在标注之间甚或轴之间通用。但是,域的战略性定义以一个用户分类数据实体的方式允许独立数据实体的一对多映射和分类。因此,轴、标注和属性之间的某些区别在考虑数据实体间区别方面是有用的。
此外仅作为示例,正如下面所讨论的那样,本技术可应用于文本文档以及其它数据格式或类型文档的识别,例如图像数据、音频数据、波形数据等。作为进一步示例,本技术可应用于在关注的特定领域或域内识别知识产权,例如专利和专利申请。在这些域中,可设计一个范围的独立分类,其可遵循传统分类或可由用户完全基于特定知识或兴趣定义。那么在每个独立轴中,可实现分类的独立子划分。正如下面更详细阐述的那样,可实现许多这种分类等级。最终,由于文档本质上主要为文本,因此独立属性26可包括特定字符、字符串、短语等。在其它数据实体类型中,属性可包括图像、音频文件的多个部分、波形的多个部分或趋势等中关注的属性。由此,域定义允许通过实体内部或实体之间可识别的特定特征来对独立实体数据进行搜索、分析、结构化、映射以及分类。
但是,正如下面更详细讨论的那样,尽管本技术为文本文档分析提供了新颖的的工具,但是本发明不以任何方式限于应用到文本数据实体。该技术可同诸如图像、音频数据、波形数据的数据实体以及包括或关联另一个具有一种或多种这些数据类型(即,文本和图像、文本和音频、图像和音频、文本和图像和音频等)的数据实体一起使用。此外,通过允许轴、标注和属性自身具有目标数据实体中容易关注的特性(例如,一种图像特征、一种波形特征、一种音频文件特征等),该目标数据实体不服从或服从该特征的文本或字符描述的约束,提供一种远超越文本搜索和分类的强大实体管理工具。
基于域定义,处理系统14访问数据资源16来识别、分析、结构化、映射和分类独立数据实体。大范围的这种数据实体可被该系统访问,且它们可以呈现于任何合适位置或形式。例如,本技术可被用来识别和分析结构化数据实体28或非结构化实体30。结构化数据实体28可将这种结构化数据包括为参考内容、预识别区域、标记等。非结构化数据实体不包括任何此类可识别字段,但相反它们可能是“原始”数据实体,多个或不同的处理可能适宜这种“原始”数据实体。此外,这种结构化和非结构化的数据实体可认为来自“全体”源32,或来自诸如集成知识库(IKB)34的已知或预先建立的数据库。在此使用的术语“全体”源(“atlarge”source)包括任何没有预组织的源(通常没有被用户预组织到IKB中),这种全体源可经由互联网、库、专业组织、用户组或从任何其它源建立。
另一方面,IKB可包括根据域定义的概念性框架预识别、分析、结构化、映射和分类的数据实体。正如下面更详细讨论的那样,IKB的建立利于进一步和更快速的实体分析和重新分类,并对基于用户定义的搜索准则搜索实体有利。但是,应该记住:可使用相同或相似搜索准则识别来自全体源的数据实体,且本技术不限于同一个预定义IKB一起使用。
最后,如图1所示,处理系统14可利用通常由参考数字36表示的任何其它数据实体源。这些其它源可包括建立域和分类之后可用的源,例如新近建立的或新近贡献到资源中的。应该记住:任何时间都可能出现新资源,并且本技术规定将它们合并到分类系统中,并实际上用于提供分类系统自身的改进以容纳此类新数据实体。
本技术提供多种有用的功能,尽管这些功能是相关的,但应该将它们考虑为相互区别的。首先,数据实体的“识别”涉及选择关注或潜在关注的实体。这通常通过参考域定义的属性并参考同这些属性结合使用的任何规则或算法实现。实体的“分析”需要检查数据定义的属性。可再次基于所关注的属性、实体属性以及作为结构化、映射和分类基础的规则和算法来对多种类型执行分析。也可在结构化或已分类数据实体上执行分析,由此识别相似性、差异、趋势甚至在先未加以组织的对应关系。
在此使用的“结构化”指概念性框架或域定义的建立。在数据挖掘领域,有时可使用术语“结构化”和“结构化”数据同“非结构化”数据之间的区别(例如,前面关于图1表示的结构化和非结构化实体)。这种“结构化”可认为是在某些数据实体上或实体内实现一种特定分析系统。因此,一个文档被子划分为一个标题、一个摘要和多个子部分。但在它们的每一个中,数据实质上仍是非结构化的。本技术根据域定义的特定概念性框架允许使用、改变甚至删除这种结构。这种结构化可能需要转换、格式化、标记,换句话说将数据变换到一种已经被搜索、分析、比较和分类的形式。作为示例,这种结构化可包括把数据转换到一种特定文件或格式类型(例如通过诸如XML的置标语言)。
实体的“映射”涉及域定义属性同数据实体特征和属性之间的关系。这种映射可认为是根据域定义属性和所用规则和算法将域定义应用到每个实体数据的过程。尽管是高度相关的,但在本文中将映射同“分类”区分使用。分类是域定义概念性框架的子划分(例如,经由轴和标注的属性)同数据实体之间的关系分配。本文中,引用一对多映射和一对多分类,映射是根据域定义的结构系统达到分类的过程。
所获得的过程可同某些现有技术区分开来,尽管诸如数据挖掘、分类学、置标语言以及简单搜索引擎的现有技术中的某些可用在此处执行的子过程中。例如,典型数据挖掘从数据实体的观点而不是基于域定义建立的结构来识别数据中的关系或模式。数据挖掘通常无法提供一对多的实体映射或分类。分类学通过分解定义分类学的类别来利用唯一的实体分类。尽管置标语言对结构化实体是潜在有用的,但它并不良好适用于一对多映射或分类,并通常基于语言标记或其它特征在实体内部提供“结构化”。类似地,简单搜索技术通常只返回满足某个搜索准则的实体列表,而无法提供这里所提供的实体映射或分类。
处理系统14还利用规则和算法38来分析、结构化、映射和分类数据实体。正如下面更详细讨论的那样,规则和算法38通常适合特殊类型的数据实体,并真正适合数据实体的特殊目的(例如,分析和分类)。例如,规则和算法涉及文本文档分析或数据实体的文本部分分析。该算法可为图像实体或实体的图像部分等提供图像分析。该规则和算法可被存储在处理系统14中,或可被处理系统在需要时访问。例如,某些算法可能专用于不同数据实体类型,例如诊断图像文件。对图像中关注的特征进行分析和识别的高级算法可能存在于这些算法中,且可按数据实体分析的需要利用它们。
用于分析、结构化、映射和分类数据实体的规则和算法通常将被具体调整为域定义使用的数据实体类型和准则实质。例如,胜于以文本术语简单描述或定义关注的特征,该规则和算法可通过参考特征“看起来”像什么,或“听起来”像什么或任何其它类似准则来辅助定位和处理数据实体。如果需要,规则和算法甚至可以在基于轴、标注和属性的比较过程中提供某种程度的自由度或容差。因此,例如,可通过参考一个图像“看起来最像”或一个波形“最类似”或一个声音“听起来最像”的标注或轴进行分类。
数据处理系统14还耦合到一个或多个存储设备40,以便存储搜索结果、分析结果、用户喜好、以及分析、结构化、映射和分类目的所要求的任何其它持久数据或暂时数据。特别地,一旦在一系列被识别的数据实体上完成分析、结构化、映射和分类,存储器40可用来存储IKB 34。再次地,附加数据实体可随时间附加到IKB中,并且可根据域定义中的改变、分析和分类中应用规则等的改变来改进甚至改变IKB中数据实体的分析和分类。
可设想一个范围的可编辑界面,用于同域定义、规则和算法以及实体自身进行交互。仅作为示例,如图1示出的,当前设想多个此类界面。这些可能包括一个域定义界面42,用以建立域的轴、标注和属性。可提供规则定义界面44来定义将要使用的特定规则,或到外部规则和算法的链接。提供搜索定义界面46,用以允许用户对来自全体源或IKB的数据实体进行搜索、分析和分类,且设想不同的结果观察界面48来展示一个或多个数据实体的分析结果。通常由连接到处理系统14的工作站50将这些界面服务给用户。事实上,处理系统14可以是工作站50的一部分,或者完全远离工作站并通过适当网络链接。许多不同视图可作为界面的一部分提供,包括图1中列举的视图,并可指定一个压印视图、形状视图、表格视图、突出视图、基础空间显示(展开)、带重叠的展开、用户定义图解或任何其它视图。应该记住:这些只是分析和分类的示例性回顾,可观察到许多其它视图或这些视图的变型。
应该注意这种界面中的轴、标注或属性构成的表示实际上只是建立一种“简写形式”或图示表示。也就是说,由轴、标注或属性定义一个没有将其自身提供给视觉表示的非文本特性时,在界面上仍然会出现一个视觉表示。需要时,用户可通过图示表示的选择来访问该实际数据特性(以任何适当形式)。因此,例如,可由一个图标表示一个音频特征,且在需要时可播放同这一特征对应的实际声音。可在界面中简化诸如图像、波形等的其它特征,在作出选择时可获得更为详细的版本。但是,在所有情况下都是特征自身而不单单是图示表示作为定义域和处理关注实体的基础。
正如上面指出的那样,本技术提供由域定义表示的概念性框架的用户定义和改进。图2示出定义域的概念性框架时的示例性步骤。总的由参考数字52表示的全局逻辑包括第一阶段54中域的一般描述,紧跟着第二阶段56中的域定义改进。域说明54可包括一列步骤,例如域轴58的定义和每个轴内标注60的定义。正如上面讨论的那样,轴通常表示域被用户定义的任何适当方式所分解成的概念性部分。反之,标注表示独立轴的概念性分解。标注和真正的轴可认为是概念性子分类等级。正如下面更详细讨论的那样,某些等级是冗余的,或者说当允许更高等级在域内“概念性缩放”时低等级也是冗余。也就是说,特定标注也可以作为域的轴列出,允许数据实体特定分类库的分析和可视化。
在域说明之后,在阶段56中进一步改进域。这种改进可包括列出每个轴的独立标注的属性。通常,这些属性是那些可建立在数据实体中且促进其识别、分析、结构化、映射或分类的数据实体的特征。正如图2指示的那样,对于文档,这些实体可包括字符、字符和术语的变型、同义词、相关字符、概念等。正如下面详细讨论的那样,可为每个标注简单列出它们。基于列出的属性,如步骤64所指示的可以产生一个关联列表。这个关联列表有效表示同每个标注和轴相关联的属性集合。在此再次地,关联列表可包括以任何适当方式为图像、波形、音频文件等定义的特征以及同文本结合的此类特征或彼此结合的此类特征。
在域定义之后,在步骤66识别和定义将用于特殊数据实体的搜索、分析、结构化、映射和分类的规则和算法。用户可将这些规则和算法连同域一起定义。这种规则和算法可以非常简单,如是否和如何识别字符和短语(例如,是否搜索整个字符或短语,近似性准则等)。其它情况下,可使用更精心设计的算法。例如,甚至在文本文档分析中,可使用复杂文本分析、索引、分类、标记和其它此类算法。在图像数据实体的情况下,这种算法可包括那些允许识别、分段、分类、比较等图像内所关注的特定区域或特征的算法。例如,在医学诊断环境中,这种算法允许计算机辅助诊断疾病状态,甚或更精细分析图像数据。此外,规则和算法可允许文本同其它数据分开分析,其它数据包括图像数据、音频数据等。再进一步地,规则和算法提供文本同其他数据的结合分析。正如下面更详细讨论的那样,在组合用于文本、图像和实体中包含的其它数据类型的算法的基础上,本技术在可分析数据类型和数据实体分类中提供了新颖的的自由权和宽度。可选地,在步骤68提供到此类规则和算法的链接。例如,当出现特殊数据实体时,这些链接是有用的,但复杂的、进化的、甚或新算法可对其进行分析和分类。在适当时可提供许多此类链接,它们在根据用户输入的搜索准则识别独立数据实体之后促进该独立数据实体的分类。
在步骤70访问数据实体。再次地,数据实体可在任何适当位置找到,包括全体源和已知的甚或预先定义的知识库等。尽管图2示出的处理假定数据实体已经存在,但本技术可扩展到数据实体的获得和产生中。可选地,在步骤72索引和存储数据实体。本领域技术人员应该理解,这种索引允许非常快速的后续数据实体处理。这种索引尤其适合于这样的情况:其中数据实体将被再次访问,且原始实体为非结构化的或半结构化的甚或包含原始数据(即,原始文本)。实施这种索引时,通常在步骤72处存储索引的实体,用于稍后的访问、分析、映射和分类。同样,正如上面指出的那样,甚至对于结构化或部分结构化的实体和实体部分,域定义可利用这个结构(其中,例如实体内的现有结构同域定义结构系统对应),或者可以重新结构化或进一步结构化数据,甚或删除该实体的现有数据结构。
在图2的步骤74,域定义及相关规则和算法被用来访问数据实体。基于域定义及规则和算法,特殊数据实体被识别、分析、结构化、映射和分类。应该注意,正如下面更详细阐述的那样,用户可在步骤74指定或者制定特定搜索。也就是说,用户可经由适当的搜索界面定义全体源和IKB内的源中特定搜索的界面。在本执行中,搜索界面可同所获得的域定义界面基本相同,包括相似的轴和标注,它们将被用户选择出来以便执行搜索。在步骤76存储域定义和规则的应用结果。在步骤78给出表示分析和分类以及真正数据实体本身的界面页。基于这些表示,域定义和属性以及根据域定义应用的规则和算法可被改变,如返回图2所示先前处理步骤的箭头所指示的。
图3概略表示访问和处理数据实体中的特定步骤和阶段。图3中,总的由参考数字80表示的实体处理逻辑开始基于域定义的数据实体分类(或用户定义的搜索准则)以及关联定义的规则和算法。这个分类导致参考数字84处指示的一对多映射和分类。正如本领域技术人员理解的那样,传统搜索引擎和数据挖掘工具通常无法执行这种映射。也就是说,由于许多不同轴、标注和它们的多种等级连同相关联的属性、规则和算法一起包含在该域定义中,因此可将每个数据实体映射到和分类到多个轴和标注中。因此,任何一个数据实体都被映射到域定义概念性框架的许多不同概念性子划分中。这种一对多映射和分类为后续的数据实体分析、比较和考察提供了有利基础。
映射和分类之后,可按图3模块86的指示执行数据实体分析。再次地,这种分析基于用户定义的或访问的规则和算法,并基于统计分析技术。例如,搜索和分类文档时,可分析文档之间的对应关系、重叠和区别。此外,可根据多重准则和分类步骤中执行的多对一映射确定诸如文档计数和关联的简单分析。随后,按模块88的指示输出该分析结果和视图。这种视图可以是实施本技术的软件包的一部分,或者可以是用户定义的。
步骤90处,用户可回顾分析结果和视图。这种回顾可以采取任何适当形式,并且可以是直接的(例如跟在搜索后面),或者可以在任何后续时间发生。再次地,如块92所示,在独立分析视图上执行回顾。基于回顾,用户可改进概念性框架的任何部分,如块94所示。这种改进可包括域定义、域定义任何一部分的替换,所应用的规则和算法的改变,所执行的分析类型和实质的改变等。因此,本技术提供一种高度灵活且交互式的工具,用于识别、分析和分类数据实体。
正如上面注意的那样,在域定义的概念性框架内,可设想许多策略来子划分和定义轴及标注。图4示出一个示例性映射过程,用于改进一对多的数据实体映射和分类。为了这个目的,在示例性域定义98的基础上执行映射(被标注为参考数字96)。域定义包括一系列轴22及其相关联的标注24。图4还示出如何通过域定义自身提供“概念性缩放”。在本示例中,第一轴I和该轴内标注IA的属性26被提供在后续轴A的标注等级100中。也就是说,轴A同轴I的标注IA相同。由于标注IA的属性同轴A标注的属性相同,因此如果用户在一次搜索中按下面阐述的那样选择,返回的搜索结果不仅表示对应标注IA准则的数据实体,还将提供更高的等级或决议或间隔尺寸,用以解释为何参考轴A标注选择、映射和分类这些数据实体。
正如图4中参考数字102指示的那样,认为特定数据实体包括一系列属性。文本实体的情况下,这些属性可能是字符或短语。也就是说,在数据实体中发现由域定义属性定义的某些字符或短语。因此,由参考数字96表示的映射指示将根据同实体中发现的属性相对应的独立轴、标注以及标注属性来分类数据实体。这种情况下,在轴等级104处,根据轴I、II和A分类实体。进一步地,在一个标注等级处,在标注IA、IIB、IIC、AAa和AAc分类实体。再进一步地,由于附加轴A一个“属性”等级处提供的概念性缩放,该实体将同属性IAa和IAc相关联。本实施中,正如下面阐述的那样,不在返回的搜索结果中直接显示这些属性。但是,通过将标注IA的属性放在轴A的标注等级100中,这一附加分类将被执行。
图4说明的映射在本技术上面讨论的分类阶段执行。应该注意这一分类可以是用户选定的。也就是说,正如下面阐述的那样,一旦建立定义,就根据所有轴、标注和属性结构化、映射和分类所有已识别的实体。但是,适当时,用户可以只选择某些轴和标注用于期望分类。但是,一旦执行了分类,则执行搜索来识别同构成域定义概念性框架的某些或所有轴、标注和属性相对应的特定数据实体。由于这一原因,使用所有轴、等级和属性对数据实体进行识别、结构化、映射和分类并允许用户在后面的搜索中选定它们的一个子集是有利的。此外,使用了索引或其它数据处理技术时,所有轴和标注以及关联属性的使用允许索引覆盖它们中的全部,因此大大促进后续搜索和分析。
正如上面提及的那样,域定义表示的概念性框架包括大范围的等级以及等级的任何概念性子划分。图5表示一个示例性域110,本情况下称为“超级域”。在此使用术语超级域来说明可以子划分域本身。也就是说,可在分类的概念性分解中提供许多不同等级。说明的实施例中,在超级域中识别了四个域,包括域112,114,116和118。这些域可以彼此重叠。也就是说,一个域内的某些标注或属性也可以在其它域中发现。但是,在某些情况下,域之间可以没有重叠。如图5指示的那样,可将域自身看作超级域的轴。在另一个概念性等级处,每个域都可被子划分为子域,如域112的子域120所指示的。也就是说,可概念性子划分每个域,以便分类清楚位于该域内的数据实体。最后,通过每个轴的标注和每个标注的属性来定义独立轴。
图6进一步说明用于域定义的概念性框架的多级方法。实际上,图6示出6个独立分类和分析等级。第一等级L1处,定义超级域。这个超级域110通常是在其中发现数据实体的领域自身。实际上,正如本领域技术人员理解的那样,该领域只是用户定义的抽象概念的一个等级。如图6等级L2指示的那样,在超级域内可发现一系列域112-118。再进一步地,如等级L3-L6所示,可在每个域内识别一级子域,其后紧跟着一系列轴,每个轴具有独立标注以及各个标注的最终属性。因此,可以为域定义规定任何数目的概念性等级。这样,基于数据实体的最终属性可完成到相应等级和子级的映射和相应等级和子级中的分类。
正如上面提及的那样,本技术提供用户域定义及其概念性框架。图7示出用于定义域的一个示例性计算机界面页。只作为示例,在本示例中,域只包括域等级、轴等级、标注等级和关联属性。由参考数字22指示的域定义模板可包括一个参考数据部分124、一个主观数据部分126和一个分类数据部分128,其中列出了轴和标注。
只要提供,参考数据部分124便能够在相应区域中提供数据实体的某些识别特征。应该注意:即便对于非文本的数据实体和特征,这种参考信息实质上也通常为文本的。对这些实体,参考信息可涉及通用出处、参考和类似信息。例如,连同唯一识别数据实体的数据实体识别区域132一起提供实体区域130。还提供标题区域134来进一步识别数据实体。可以提供用户定义的附加区域136。还可提供数据实体源和起点的数据表示,如模块138和140所指示的。需要时可提供诸如状态区域142的另外信息。最后,可提供一个通用总结区域144,例如用于接收诸如文档摘要等的信息。可提供选择146或区域标识符,例如用于选择其中的数据实体将被搜索、分析、映射和分类的数据库。本领域技术人员应该理解,参考部分124的示例性区域在此仅为示例之用。这一信息的某些或全部可从结构化数据实体获得,或者这些区域可由用户完成。此外,可以只利用数据实体自身的处理和分析或数据实体的一个部分来填充某些区域。例如,可在文档某些部分中发现这种参考信息,例如专利文档的标题页、书籍和文章的参考列表等中。例如,可在图像文件标题、同音频文件相关联的文本部分、文本中包含的注释、图像和音频文件等中找到其它参考数据。
主观数据部分126可包括通常由一个或多个用户输入的主观数据范围内的任何数据。说明的示例中,主观数据包括一个实体识别或指定区域148和一个用于识别回顾者150的区域。还可提供主观评分区域152。说明的实施例中,可提供另一个区域154来按回顾者、专家或其它合格人士的判断对数据实体的某些质量进行识别。该质量例如包括一个用户输入相关性或其它限定指示。最后,可包含一个备注区156,用以接收回顾者的注释。应该注意:尽管主观数据部分126中的某些或全部可由人类用户或专家完成,但某些或全部这些区域可由包括计算机算法的自动技术完成。
说明的实施例中,分类数据部分128包括不同轴和标注的输入以及用于开展搜索和执行任务的虚拟界面工具(例如,按钮)。说明的实施例中,这些包括一个虚拟按钮158,它用于提交域定义以便根据该定义搜索、分析、结构化、映射和分类数据实体。可以如按钮160表示的那样提供视图选择,所述视图给出不同结果或附加界面页。图7说明的实施中提供了一系列可选块162,它门允许用户在构成域定义的轴中选择一个或全部。类似地,为每个标注提供用户可选块164。尽管没有在图7中清楚示出,但所有轴可包括且通常包括许多不同标注。可在域定义中提供任何数目的轴,并且可以为每个轴提供任何数目的标注。最后,可提供一系列标识符或提示框166,它们被自动观察或者可供用户观察,以便促进收回独立轴或标注的意义和范围,或用于显示各个标注的属性。
可提供一个范围的附加界面来识别和指定轴和标注。例如,图8表示一个用于定义轴、标注以及各个标注的提示文本的示例性界面168。该界面中,用户可在区域170输入轴名称,并在区域172输入该轴的标注名称系列。这个界面168还允许用户输入提示文本,如参考数字174所指示的,该提示文本可用来或显示用来提醒用户每个标注的含义或其标注的范围。当然,每个轴都可包含类似的提示文本。正如上面指出的那样,对于非文本轴、标注和非文本特征和特性的属性,该界面页可包括描述性文本、图示表示(例如,缩略表示)等。类似地,界面页可允许用户定义每个标注的特定属性。图9表示一个用于这一目的的示例性界面。该页面为用户显示各个轴以及属性所指定的轴的标注。说明的示例中,属性为文本文档的属性,由此用户可在诸如区域176的列表中定义字符和短语。提供另一个区域178用于确切字符或短语。依赖于界面的设计,为诸如块180的输入块(允许用户输入特定字符或短语)提供诸如选择182的选择(用于选择它是一个通配符字符或短语还是一个确切字符或短语)。可观察到大范围的其它属性输入界面,尤其是期望在实体中包含的不同数据实体类型和不同数据类型。最后,如通常在图9中参考数字184处指示的那样,可连同其它虚拟工具一起提供,用于添加属性、删除属性、修改属性等的块。
正如上面指出的那样,本技术可用来在多种数据实体上识别、分析、结构化、映射、分类和进一步比较以及执行其它分析功能。此外,它们可从大范围资源中选择,包括全体源。另外,如上所述,可在IKB中处理和存储数据实体。图10表示执行某些上述操作的示例性逻辑。
如参考数字188指示的那样,图10示出的示例性逻辑186开始于访问一个或多个板以选择、分析和分类数据实体。本实施中,对于数据实体的初始选择和分类,在这一步骤中使用域定义的所有轴、标注和属性。但是,如参考数字190指示的那样,只要需要,用户便可从模板中连同轴和标注一起选择一个用于数据实体识别和分类的目标数据库和资源。本上下文中,步骤190中提及的访问是数据实体,且访问目标是可以发现数据实体的或认为数据实体位于其中的一个或多个位置。例如,被访问目标包括已知数据库、公共访问数据库和库、基于预定的数据库和库等。作为示例,搜索知识产权时,这种被访问目标可包括专利局数据库。作为另一个示例,搜索医学诊断图像时,被访问目标可包括此类图像的存储库,例如图片归档和通信系统(PACS)或其它存储库。再次地,任何适当的资源都可用于此目的。
基于步骤190处选择的轴和标注,在步骤192访问选定属性。正如用户和域定义所规定的那样,这些属性通常对应选定的轴和标注。再次地,对于数据实体的初始分类,例如对于IKB中的包含物,可使用所有的轴和标注及其关联属性。但是在后续搜索中,只要初始搜索中要求,则在将轴和/或标注的一个子集用作搜索准则时只使用选定的属性。在步骤194访问选定规则和算法。再次地,例如依赖用户通过搜索模板选择的搜索准则,这些规则和算法可能对所有分析和分类或只对其中一个子集起作用。最后,在步骤196,访问被访问目标区域、数据实体自身或数据实体的某些部分甚或实体的索引版本。这一访问通常借助于网络,例如广域网络特别是通过互联网。作为示例,在步骤196处,只要这种分配可用(例如,从实体中给出的结构),实体的原始数据便被访问,或只有实体的特殊部分被访问。因此,对于诸如专利的知识产权文档,访问仅限于特定子划分,例如首页、摘要、权利要求书等。类似地,对于图像文件,可以只访问参考信息,只访问图像内容或它们的组合。
当在IKB中分类数据实体用于后面的访问、重新分类、分析等时,执行图10中虚线内列出的一系列子步骤。通常,这些可能包括诸如参考数字198指示的数据转换步骤。正如本领域技术人员理解的那样,由于可对广范围的数据实施本工具,而这些数据的格式、内容和结构可能未知,数据的转换处于步骤198是合适的。这种转换可包括重新格式化、分段、分割,换句话说将数据处理成要求格式以便分析和分类。只要需要,可在步骤200索引实体。如本领域技术人员理解的那样,这种索引通常包括将数据实体划分成一系列段落或部分,每个部分都被标记或索引以便后面的分析之用。只要需要,可只在实体的某些部分上执行这种索引。一旦执行,则在步骤202存储该索引以便允许未来搜索对被索引数据实体更加快速的访问和改进。
在需要时可使用“候选列表”来加快速度并促进特定数据实体的分类。只要使用了这种候选列表,通常如图10中的步骤204指示的那样事先产生一个候选列表。候选列表通常包括轴和标注连同目标数据实体中特别关注的相关属性。在实体中发现某个简单准则时(例如字符、短语、图像特征、波形特征等的出现),候选列表被用来快速选择包括在IKB中的数据实体。只要使用这种数据列表,便在步骤206将预定义列表应用到被访问的数据实体。依赖数据实体的本质和将被执行的有用滤波,可通过多种方式执行进一步的滤波和检验。例如,在图10示出的步骤208,该过程可能要求检验冗余并滤波某些文档和其它数据实体。作为示例,只要建立了IKB,步骤208可包括验证某些记录或数据实体是否已包含在IKB中,并包括消除这些数据实体以便在IKB中排除冗余记录。类似地,如果记录基本表现相同的根本信息,则它们将在步骤208被滤波。例如,在知识产权的示例中,会发现特定专利申请已被授予专利权,保留专利权信息而非申请信息,且在步骤208拒绝在先信息。可执行多种检验和验证。
数据实体在步骤210被映射和分类。再次地,映射和分类通常通过轴、标注和属性满足域定义。正如上面指出的那样,在步骤210执行的分类是一对多分类,其中任何单一数据实体都可分类在多于一个的对应轴和标注中。步骤210可包括其它功能,例如主观信息、注释等。可以在后面的阶段中执行这类注释和添加主观回顾或其它主观输入。在步骤210,将数据实体连同索引、分类等一同存储在IKB中。应该理解,尽管在本文本中使用术语“IKB”,但这一知识库包括大范围的形式。IKB的特定形式服从定义IKB的软件或平台的特定命令。本技术不限于IKB的任何特定软件或形式。
应该注意IKB通常包括分类信息,但可包括全部或部分数据实体本身,或包括实体或实体部分的处理版本(例如,索引或结构化版本)。这个分类可采用任何适当形式,且可简单作为域定义的结构系统的制表关联,具有相应数据实体或实体部分。
通常建立IKB之后,或者分类数据实体之后,如步骤214的指示执行不同的搜索。图10中从步骤194到步骤214的箭头旨在说明:步骤214处执行的搜索可对存储在或不存储在IKB中的数据实体执行。也就是说,可在数据实体的全体源上执行搜索,包括外部数据库、结构化数据、非结构化数据等。但是,只要建立IKB,参考数字196处执行的访问步骤直接导致在步骤214访问IKB并搜索IKB的记录。然后在步骤216,基于步骤214定义的搜索及相关规则和算法给出搜索结果。再次地,可采用大范围形式给出这些搜索结果,包括独立数据实体的分析,或者所搜结果可包括原始形式的或一定突出形式的或换句话说操纵形式的数据实体本身。
如图10中参考数字94通常指示的那样,基于任何或所有搜索结果,可修改数据实体选择、数据实体分类,或域定义的其它任何特征或其功能、域定义、规则,或概念性的其它方面以及用来对其进行分析的工具。也就是说,例如,如果发现搜索结果超出包含或处于包含中,则可改变域定义,正如可以改变用于数据实体选择、数据实体分类或实体分析的规则。类似地,如果分析在数据实体之间提供过多的或不充分的区别,则在步骤94改变。此外,随着新概念性区别的识别或新属性的识别,例如由于区域内的改进,它们将导致域定义、所应用规则和算法等的改变。再进一步地,随着用户数据实体分类的新规则和算法被发展或变得可用,它们还会在步骤94导致改变。基于这些改变,可重新进行整个过程。也就是说,可执行附加搜索,可向IKB添加附加数据实体,可产生新的IKB等等。事实上,这种改变会简单地导致对已经在IKB中给出的数据实体进行重新分类。
图11概略表示图10中给出的过程应用到某些文本数据实体以产生IKB。通常由图11中参考数字218表示的IKB产生过程从模板220开始,它通常同定义域的模板相似或相同。正如上面指明的那样,最初优选使产生IKB的搜索包括所有轴、标注以及标注属性。但是,只要需要,如图11的模板220中的扩大检验框224指示的那样,模板可允许用户选择某些轴或标注。基于对某些或所有轴和标注的选择,可使用一个关联列表226。说明的示例中,关联列表226可包括特定标注的独立属性以及用户定义的特殊属性和某些选择准则的识别。例如作为一个示例,在图11的说明中,特定属性为涉及网页或类似技术领域的字符。说明示例中的选择准则包括在数据实体识别中使用整个字符还是使用小于整个字符,是否使用参考数字234指示的近似性评分,以及是否使用参考数字236指示的任何特定阀值。正如本领域技术人员明白的那样,即使在文本搜索和分类领域,也可使用许多此类选择准则。本技术不限于任何此类选择准则。此外,应该认识到,可以使用属性质量形式的选择准则,或者还可将此类准则实现为将被应用到选择和分类过程的规则。
基于域定义或用户选定的域定义部分,并基于诸如候选列表的输入(只要使用),可如图11中参考数字238指示的那样将规则应用于数据实体的选择和分类。在所说明的简单示例中,一个规则标识符240与不同规则242相关联。此外,在说明示例中可为每个规则实施关联准则224。正如上面注意的那样,应该认识到:任何理想规则都可用于数据实体的选择和分类。文本文档的情况下,这些规则十分简单。但是对于更复杂的文档,或者为分类目的分析文本和图像或文本和其它形式数据时,这些规则是用于文本选择和分析以及其它数据部分(例如图像)的选择和分析的组合准则。正如上面还讨论的那样,这些规则可包含在实现选择和分类过程的编码中,或者可以链接到该编码。例如,将复杂算法用于分析和分类时,此类算法可能过于庞大,或者其用来产生到算法的最高效和最大限度的链接时过于保守。最后,如上面还提及的那样,对于非文本文档,通过在涉及轴、标注或属性的基础定义上允许一定的容限或其它灵活性,选择和分类规则和算法可提供特征识别以及它们的分类。
基于域定义、任何候选列表、任何规则等,可访问全体资源32,它包括多种可能数据实体246。由此,如参考数字248指示的那样,域定义、其属性以及规则允许选择这些实体的一个子集包含在IKB中。本实施中,不仅这些数据实体被选择包含在IKB中,而且附加数据(如果执行,例如为索引)、分析、标记等伴随实体来允许并促进它们的进一步分析、表示、选择、搜索等。
基于用户兴趣并基于数据实体实质,可大大改变执行在选定且分类的数据实体上的分析。此外,甚至在分类之前、分类其间和初始分类之后,可执行附加分析和分类。图12示出通用逻辑,用于数据实体中所关注的特征的计算机辅助处理、分析和分类。总的由参考数字250所表示的这一逻辑从获得包含在每个实体的数据开始。正如上面指明的那样,本过程通常假定先验执行这种获取。但是,基于一定的分析和分类,本技术还建议通过获取附加数据产生附加数据实体。在步骤254,如上所述访问数据。正如图12中总的由参考数字256所表示的那样,经由计算机辅助技术的后续处理跟随在数据访问之后。
正如上面指出的那样,本技术在数据实体的计算机辅助搜索、分析和分类中提供高水平的操作集成。这些操作通常由计算机辅助数据操作算法执行,特别用于分析和识别不同类型的数据实体。某些此类算法已经得到发展且在不同领域中得到了相对有限的应用,例如用于疾病的计算机辅助检测或诊断、数据的计算机辅助处理或获取等。但在本技术中,通过分析和分类新近放置数据实体的算法同后续分析和分类已知实体(例如IKB中)的算法之间的交互作用,提供了一种高级集成和互操作性。该技术利用了用于更复杂数据或多媒体数据(诸如文本和图像,音频文件等)的算法的新颖的组合。
图12提供此类算法互操作性的概观,本上下文中通常称为计算机辅助数据操作算法或CAX。本上下文中的这种CAX算法可基于当前使用的算法建立,或者可以在附加数据源和实体、此类数据源和实体的集成的基础上修改或整体结构化,或者为特定数据实体类型的搜索分析和分类修改或整体结构化。例如在图12的概观中,整个CAX系统被示为包括可能包含在一个完全集成系统中的大范围步骤、处理或模块。正如上面指出的,可设想更多限制的实现,其中指给出这些步骤、功能或模块的某些或几个。此外,在本设想实施例中,可在一个IKB环境中实现这种CAX系统,由此可搜集信息以便由算法管理用于数据实体分析和分类的数据对算法本身和数据管理进行调整或优化。可改变独立CAX算法的不同方面,包括算法中实现的规则和过程,或者可在数据实体挖掘、分析和分类过程期间写下和调用特殊规则。
尽管可以设想许多这种计算机辅助数据操作算法,但在图12中示出用于在数据实体上执行特殊功能的某些此类算法,这些过程总的由参考数字256表示。进一步详细考虑图12中总结的数据操作步骤,通常在步骤258处理被访问数据,例如索引、冗余检验、数据的重新格式化、数据变换等。正如本领域技术人员理解的那样,步骤258执行的特定处理基于所分析数据实体的类型和所执行的分析或功能的类型。但是,应该注意,可从任何上述源处理数据实体,包括全体源和IKB。类似地,在步骤258,执行数据实体分析。再次地,这种分析依赖数据实体、实体中数据的实质以及在其上执行分析的算法的实质。例如,这种处理将识别实体之间或实体内的某些相似性或不同点。随后此类数据被制表、计数等,以便表示。类似地,还可在数据实体上执行统计分析,以便确定此类相关关系、相似性程度或实体内或实体之间或之中的任何其它关注特征。
这个处理和分析之后,在步骤260以通用方式分割或限定所关注特征。文本数据中特征的识别包括如同下列般简单的操作:识别特定段落和术语,突出这些段落和术语,文档相关部分的识别等等。一种图像数据,此类特征分割可包括识别特征和目标的界限或轮廓、对比度和亮度识别,或者基于图像的任何数目的分析。例如在医学环境中,分割包括定界或突出特殊组织或病变。但是,更一般地,步骤260执行的分割旨在简单辨别任何类型特征的界限,包括数据间的不同关系、相关程度等。
这种分割之后,如步骤262总结的那样可识别数据中的特征。尽管根据通用的现有技术能够在成像数据上完成特征识别,但应该认识到:步骤262执行的特征识别实际上宽泛得多。也就是说,由于大范围的数据都可以集成到发明系统中,因此特征识别可包括数据相关,例如文本、图像、音频数据,或者这些数据的组合。通常,对于CAX算法所执行的过程来说,特征识别可以包含在所关注的数据之间相关性的任何识别类型。
在步骤266分类这些特征。这种分类通常包括将分段特征中的轮廓同已知条件下的已知轮廓相比较。这个分类通常从属性、参数设置、数值等产生已知全体数据集合中哪一个的轮廓同所考虑数据集合或实体相匹配。本文中的轮廓可对应域定义的轴和标注的属性集合,或它们的一个子集(如需要的话)。此外,分类通常基于前述的理想规则和算法。再次地,这些算法可能是同域定义和搜索、分析和分类软件相同的软件编码的一部分,或者可通过软件中的适当链接按要求调用某些算法。但是,分类还可基于非参数轮廓匹配,例如通过特定数据实体或实体在时间、空间、总数等上的趋势分析。
正如图12指示的那样,分析和分类期间执行的过程可基于全体资源32或存储在参考数字34所表示的IKB中的数据实体。正如图12中还指明的那样,可通过经由上述类型的模板220的输入来驱动这些过程。作为分析和分类的结果,通常如参考数字20指示的那样为用户显示一个表示。
用于数据实体搜索、识别、分析、分类等的本技术尤其旨在促进和强化决策过程。该过程可包括相当大范围的决策,例如销售决策、研究与开发决策、技术开发决策、法律决策、财政和投资决策、临床诊断和治疗决策等。在图12中的参考数字268处总结了这些决策和它们的过程。如上所述,如图12中非强制性块270所示,基于表示20且附加地基于决策过程,对分析和分类算法、数据实体、域定义等的改进是适宜的。正如本领域技术人员理解的那样,这种改进可包括,但不局限于:附加数据的获取、不同条件下的数据获取、数据的特定附加分析、数据的进一步分割或不同分割、属性的交替识别以及数据的交替分类。
正如上面所注意的那样,本技术中提供附加界面,用于对例如来自IKB的数据实体执行搜索和进一步的识别和分类。图15示出执行数据实体(例如存储在IKB中的实体)搜索的概观。会注意到这个概观同图11所示的概观相似,图11概观中搜索和结构化数据实体以形成IKB。在总的由参考数字272表示的图13所示工作流程中,再次使用搜索形式220,它包括域定义的图解说明,包括轴和标注。再次地,属性和(如果适当)关联列表同搜索模板组合,用以定义将被搜索和分类的数据实体的特征。由此,关联列表226可用于自动搜索和分类。因此,用户可经由完整模板220对位于包括IKB的结构化数据实体中的特殊轴和标注进行定义。基于完整模板,搜索关联列表226和通常由参考数字238表示的规则。也就是说,搜索已经选择和分类的实体248,来识别和重新分类(如果适当)同搜索所用准则对应的数据实体(正如模板、任何关联列表,以及可应用规则所定义的那样)。在图13说明的实施例中,以类似搜索模板的格式返回搜索结果。但是,在此指定为“格式视图”274的表示中,只在模板中突出为每个记录或数据实体设置的轴和标注。因此,用户能够快速识别用于在分类过程中执行一对多映射的基础。如上所述,返回多个此类记录276,(如果要求)每个记录指示一个参考数据、主观数据、分类数据等。
在另一个实施中,可突出数据实体在搜索和分析步骤中设置的特殊特征和属性,并将该数据实体分类到结构化数据实体中。图14示出一个此类实施的示例性工作流程。图14的文本突出实施(由参考数字278表示)开始于识别来自候选列表280的候选者的特殊属性。从列表完成候选选择(如参考数字282所表示的),并且可执行高效搜索来突出所关注的独立特征。例如,在图14示出的示例中,在文档ID区284上执行文本搜索,字符被突出,如参考数字286所表示的。由此,会突出单独的字符,其同域定义中标注的独立属性对应,如图14的实体记录视图288中所表示的。本实施中,通过改变字符颜色或字符周围背景颜色来完成突出。参考数字290、292和294所指示的不同突出被用于不同项目,或者例如用于同单个标注或单个轴相关联的项目。在此再次地,用户通过参考突出将明白数据实体分类(和选择)的基础。正如本领域技术人员所理解的那样,尽管说明了相对简单的文本文档示例,类似技术可被用于大范围的数据实体类型。例如,正如下面讨论的那样,可采用类似方式分析和突出图像数据、音频数据或其它数据以及这些数据类型的组合。例如,如果突出了图像数据,便可使用图像技术,例如关注特征周围的模块、指示关注特征的指针光标、指示关注特征的注释等。如果分析包括文本、图像和其它类型数据的数据实体,可使用这些突出方法的组合。
可用来评估所分析和分类的数据实体的其它表示包括不同空间显示,例如图15-22中示出的那些。图16中示出的空间显示(或展开),观察到一系列记录的数据中心视图,这些记录对应搜索准则并根据该搜索准则分类。空间显示296采取数据矩阵和阵列的形式,指示域定义的轴对298和300。制表总结302跟在这些轴和每个轴的独立标注之后。同轴和独立标注的交集对应的多个记录或数据实体或它们的计数由计数或计分数304指示。当然正如下面更详细讨论的那样,可在每个交集模块中显示附加信息。如果需要,如参考数字306指示的那样,例如通过在一个计数上点击鼠标产生一个下拉菜单或列表可显示附加信息。应该认识到:说明的示例只是许多可能中的一种。下面讨论另外的可能性,它们形式上是系统设计者可用的无数选项中的一部分。例如在本实施中,可提供从列表306到独立实体或记录的附加链接,可从列表获得记录本身。从列表选择记录可能导致诸如图13所示格式视图的显示或图14指示的突出视图,或者所有或部分数据实体的任何类似表示。
图16示出空间显示的另一个示例。图16中示出的显示可认为是记录中心空间显示308。记录中心的显示同图15中示出的显示类似,但突出了对应于独立数据实体或记录的属性的标注的交集。也就是说如图16中右侧倾斜阴影线所示,例如为特殊搜索准则(例如特定知识产权的合伙所有者)返回的多个记录可由第一颜色或图形突出。以不同方式指示同为第二合伙者返回的数据实体对应的记录。当然,诸如颜色(如果可用)的其它图形技术更具指示性且更明显。在此再次地,突出可指示每个交集块中至少一个记录是为每个突出特征(例如,一个合伙所有者)设置的。因此,空间显示很容易让人明白:返回数据实体之间存在的交集具有该属性的地方,以及没有返回此类记录的区域。当两个中心块位于交集空间314中时,参考数字310和312指示的特殊记录突出可由此重叠,指示每个此模块中至少一个记录属于另一个或其它突出基础。在此再次地,可使用附加图形或分析技术,例如从其中访问特殊记录或视图的记录列表316。
图17表示一个附加空间显示,它可认为是不同类型的记录中心显示。图17的显示中,再次指示轴298和300,每个轴具有对应的标注。随后提供了示出每个标注交集的模块。但是,在空间显示表示318中,提供每个独立记录或数据实体的独立模块。以参考数字320、322和324指示此类模块。随后,基于结构化数据实体的内容,独立交集块可指示一个记录是否包含轴标注属性。例如,所示出的数据中,数据实体320、322和324没用共享对应标注II A的属性,但实体322和324在标注IC/IIB共享一个交集。在此再次地,数据的表示促进数据实体唯一性或区别性及其相似性的识别。
图18中示出一个多少类似的空间显示。可认为图18中示出的空间显示类型用于所关注的特殊特征,例如特定产权的合伙所有者。当然,任何其它合适特征可用于产生显示。正如说明的那样,再次以制表格式指示轴和标注,但在参考数字320、322和324指示的独立交集模块中调出所关注的特殊特征。作为示例,在合伙者比较的情况下,每个列320、322和324可对应每个合伙者所有的每个交集模块中的财产数。因此,分析对观察者而言是明显的,指示每个合伙所有者相对的强弱情况。作为示例,在说明的示例中,合伙者322在交集空间IC/IIB中多少显得占主导地位,但连同合伙者320一样在交集空间IB/IIB中显得微弱。
图19中示出空间显示的又一个说明性示例。图19可认为是不同类型的记录或数据中心视图。在此再次地,指示轴298和300。还以制表格式指示多个数据实体或记录320、322和324。但是在此,对于轴298、300和任何附加轴330,示出了根据数据实体内容对其进行分类的独立标注,以及所有的此类对应关系,如所指示的。因此,用户已能辨别某些记录如何且为何返回、如何结构化和分类某些记录以及每个数据实体记录的一对多映射的基础。
图20中示出空间显示的另一个示例。图20的表示中,空间显示332以平铺格式示出同域定义的每个轴334对应的图形空间,附带调用每个轴的独立标注336。在块或区域338显示每个标注。说明的示例中,在各个模块中为同每个标注的属性相对应的数据实体个数提供一个计数或累积总数340。如参考数字342所表示的,对背景着色,或者为该背景使用一种特定特性以便指示同独立标注的属性相对应的数据实体等级或数目。此外,在说明的示例中,提供了一个可具有特殊意义的插图344,例如为对应特定属性的数据实体、例如知识产权的一个合伙所有者。在此再次地,任何其它适当意义都可归到背景或插图344中。此外,可使用许多此类插图或其它图形工具来调出所关注的特殊属性。
在说明的示例中为用来强化理解给出数据的特定颜色或图形提供图例346。说明的示例中,例如,可将不同颜色用于对应特殊标注属性的数据实体,在图例插图348中调出覆盖。例如,可如参考数字350所示提供附加图例,用以解释每个标注的背景和插图的含义。因此,结合不同类型图形的高度复杂和完善的数据表示工具可用在分析和决策过程中,这种分析和决策过程基于结构化数据的分类。正如上面指出的那样,如果合适便可提供诸如数据实体记录列表352的附加特征,以允许用户“转”入对应特殊轴、标注、属性或任何其它关注特征的数据实体内部。
图21示出图20的基础空间显示,附带相关联的附加说明性图形。
例如,图21的图例中,示出多个特殊特征的图解表示,例如插图或菜单、图形、链接显示等,以便通过计数(诸如合伙所有者的计数)或任何其它关注特征分类独立数据实体。例如在插图354中,用户可采用对应第一轴I的独立标注的图解格式356显示数据实体。正如说明的那样,例如,将所关注的一个合伙者(“合伙者I”)示为具有同独立标注IA-IF对应的多个数据实体,在一个柱形图中显示独立数据实体或记录的计数,为柱形图中沿轴358示出的每个独立标注指示数据实体的个数或计数。本示例中由柱360表示这个计数。类似地,正如图21中图解显示362指示的那样,对于一个独立标注,可为不同合伙者(例如,“Co1”,“Co2”,“Co3”)显示多个数据实体。由此,可沿轴366指示合伙者名称,由柱368指示计数。这样,图解表示364提供一个指示,表明独立标注的每个合伙者所拥有的财产数目。在此再次地,可为这种分析和显示提供任何其它特征。
图22示出已分析和分类数据表示的一种交互空间显示示例,例如可通过一个交互式计算机界面实现。交互式表示370包括一个顶级视图,说明示例中为超级域374的视图。正如前面指出的那样,这种名称多少是任意的,且简单地指示了为每个数据实体定义的分类等级。如图22所示,超级域包括多个独立域376,每个域包括一系列轴378。正如上面指出的那样,在超级域以及域的定义中,每个轴同所关注的独立属性或特征相关联,通过所述独立属性或特征对结构数据实体进行分析和分类。由此,在由图解说明超级域给出时,用户可“转”入视图380指示的独立域或轴。在说明的实施方式中,通过选择轴IA,产生视图380,其中在扩展插图384中显示选定轴的独立标注。如参考数字386所指示的,插图说明标注和附加信息,例如同显示标注相对应的数据实体的计数或累积数目(图22中未示出)。在此再次地,正如图22中参考数字388所指示的那样,每个标注同属性相关联。可连同或不连同标注显示属性,但属性可作为基础的一个指示到达用户,数据实体的选择和分类形成这个基础。图22的实施方式中,再次地,可如参考数字382指示的,折叠其它域的独立轴。正如上面针对其它空间显示所指出的,可提供诸如记录列表390的其它图形来允许用于观察数据实体、数据实体的部分、数据实体总结等。当然,可提供其它类型的图解表示,例如图形的、制表的或上面总结的突出视图。
正如前面讨论提及的那样,本技术可用来搜索、分类和分析任何适当类型的数据实体。总的来说,给出了多种数据实体类型,包括文本实体、图像实体、音频实体以及它们的组合。也就是说,对于特殊的只有文本的实体,可通过图解信息、主观信息等使用字符选择和分类计数以及基于字符和文本的计数,附带文本指示。对于图像实体,可使用大范围的图像分析技术,包括计算机辅助分析技术、计算机辅助特征识别技术、用于分段、分类的技术等。
在诸如医学诊断成像的特殊域中,这些技术还可允许图像数据的评估,以分析和分类可能的疾病状态、诊断疾病、建议治疗、建议进一步处理或获取图像数据、建议获取其它图像数据等。可在包含文本和图像组合数据的图像中使用本技术,例如在附加参考信息中给出文本信息。正如本领域技术人员明白的那样,在诸如医学成像的某些环境中,附加到图像数据的标题(例如标准DICOM标题)可包括关于图像源和类型、日期、人口统计信息等的基本信息。可根据本技术分析并由此结构化任何和全部这类信息,用于分类和进一步分析。基于这一分析和分类,可采用结构化、半结构化和非结构化格式在一个知识库中存储数据实体,例如在集成知识库和IKB中存储。正如本领域技术人员明白的那样,本技术允许无数的有益使用,包括复杂数据组的集成分析,用于以下目的:例如财政分析、疾病识别、治疗识别、关注的人口统计的识别、目标市场识别、风险识别,或者存在于数据实体间但又复杂或不清楚得难以识别的任何其它相关性。
图23、24和25示出前述技术到图像数据尤其是关联文本数据的图像数据的应用。正如图23所示的那样,图像/文本实体处理系统392通常跟在上述技术列出之后,但从图像和文本文件开始,如参考数字394所指示的。在此再次地,对应这些文件的数据实体可包含在单个文件中或包含在多个文件中,或者提供文件之间的链接,例如基于图像数据的注释,等等。通常,每个实体包括一个文本段396和一个图像段398。文本段396可包括一个或多个文本串400形式的结构化的、非结构化的或主观的数据。图像段398包括参考数据402(例如图像标题中的文本数据)和图像内容数据404。图像内容数据形式通常为图像象素数据、体元数据等。通常,图像数据404足以允许重建可视图像406或系列或图像,以便根据需要的重建技术显示。正如本领域技术人员明白的那样,通常根据图像数据的实质、获取数据的成像系统的类型等来选择特定的重建技术。
将数据实体提供到上述类型的处理系统14中。通常,所有上述处理,尤其是参考图10和12阐述的处理都可在复杂数据实体上执行。根据这些处理技术,根据参考数字38指示的域定义及该域定义规定的规则和算法,可对文本和图像以及文本和图像之间所关注的特殊特性进行分割、识别、滤波、处理、分类等。基于在复杂数据实体上执行的处理,可在任何适当的存储器40上存储所获得的结构化数据,并且可产生集成知识库或IKB,如参考数字34所指示的。正如上面指出的那样,基于对每个数据实体执行的一对多映射,可执行对文本、图像或两者中所关注的独立特征的类似搜索。尽管图23在复杂数据实体中表示了文本和图像,应该注意到数据实体可包括文本和音频数据、音频数据和图像数据、文本和音频和图像数据,甚或附加类型数据,例如波形数据或任何其它类型数据。
在图24中总的示出了在复杂数据实体上执行的特殊图像/文本实体处理408。正如上面注意的那样,根据独立文本规则和算法414和独立图像规则和算法416分析和分类文本数据410(示于图24的突出视图中)和图像数据412。但是,应该注意:用于分类和映射的某些规则和算法可包括基于文本和图像数据的准则。例如,用户对图像数据中可见的特定解剖学特征尤其感兴趣,但只对那些仅能从文本分析辨识的特殊主题组感兴趣。这种组合分析提供一种强有力的工具来增强分析和映射。由此,基于域定义12,如图24中模块210指示的那样执行映射,用以提供可能存储在IKB34中的结果。
除了复杂数据实体的分析和分类之外,所有上述技术可用于复杂数据实体,包括文本、图像、音频和其它类型数据,如图25中一般示出的。图25示出组合文本/图像数据的示例性格式视图,它同上述单文本数据的情况相似。在图25示出的视图420提供的总结中,连同主观信息和分类信息一起提供参考信息,总的由参考数字422示出。但是,在此,如参考数字424所指示的,可连同图像表示一起提供图像数据分析方面的附加信息。当然,只要合适,可提供到实际图像、注释图像或附加主观或参考数据的链接。
正如上面所指出的,本技术可应用到能够分析和分类的任何适当数据实体。在一个示例性实施中,该技术被应用于搜索、分析、结构化、分类专利文档和申请。此类文档(尤其从商业可用集合访问时)包括结构,例如文档到标题(例如,标题,摘要、标题版、权利要求书等)的子划分。对于所关注文档的识别和分类,首先定义相关数据域。轴可能涉及主题或技术领域,例如成像方式、某些类型图像和图像重建技术的临床使用等。由此,每个轴的标注再分轴标题,以形成矩阵的技术性概念。字符、技术术语、短语等随后作为标注的属性同每个标注相关联。建立或选择用于识别类似术语的规则和算法,包括近似性准则,整个或部分字符准则等。可使用任何适当的文本分析规则。
基于域定义和规则,从可用数据库访问专利和专利申请文件。可使用文档中的结构,例如用于识别受让人、发明者等,当此结构实现在域定义中时。可使用域定义没有使用的文档中给出的结构,例如用以完成参考数据文件,或者当认为同域定义无关时可能被忽略。另一方面,例如通过识别通常发现在非结构化区域(例如,段落文本、摘要文本等)的文档片断中的术语可结构化文档中没有结构化的数据。为了便于后面的搜索和分类,还可索引文档。
文档随后被映射到域定义上以便建立一对多分类。这一分类可在多个不同轴/标注关联中放置任何特定文档。由此可在文档上执行丰富类型的分析,例如搜索涉及特定标题组合的文档、分配给特定标题拥有者的文档以及它们的组合。轴和标注的矩阵、以及相关的项目和属性允许通过选择特定搜索中轴和/或标注的适当组合来定义大量文档子集。
另一个示例性实施中,对医学诊断图像文件进行分类。此类文件通常包括图像数据和参考数据。还可包括主观数据、医生注释等。这一示例中,用户定义一个域,该域具有同特定组织、特定疾病状态、治疗、人口统计数据以及所关注的其它相关类型相对应的轴。在此再次地,标注将在逻辑上子划分轴,且给每个标注指定属性。正如在先示例中阐述的那样,对于文本数据,属性可以是术语、字符、短语等。但是对于图像数据,可定义一个范围的复杂和有力的属性,例如仅可通过图像数据的算法分析识别的属性。这些属性中的某些可由计算机辅助诊断(CAD)和类似程序分析。正如上面指出的那样,它们将嵌入在域定义中,或者在分析和分类图像数据时按需要调用。
在这种类型的实施中应该注意:可独立分析文本、图像、音频、波形和其它类型数据,或者可以定义复杂的分类组合。当实体由一对多映射分类时,则执行丰富的分析,例如用以安置这样的群体:展示可从图像数据辨识的特定特征或疾病状态的群体,以及具有一定的仅可通过其它方式从文本或其它数据或从此类数据组合中辨识的相似性或对比度的群体。
在这两个示例中,且在任何一个实施中,上述分析和表示技术可被使用,并可针对特定实体类型进行调整。例如,诸如专利的文本文档可显示在具有一定突出字符或短语的突出视图中。也可例如通过改变某些特征或关注区域的颜色或通过使用诸如指针光标、框等的图解工具来突出图像。
正如上面指出的那样,由域定义表示的概念性框架可包括对多种数据类型、特征类型、实体特性等的引用。图26图解表示多个此类组合。在图26中,总的由参考数字424来表示一个组合矩阵。由此,概念性框架可认为是定义特征和特性之间的交集,将这些特征和特性作为轴22、标注24、(属性的)关联列表26以及一方面数据实体32、246、248和另一方面不同类型数据给出。通常由图26中的参考数字426表示数据类型或实质,而由参考数字428表示在数据实体中查找或给出(依靠域定义)的定义特性。
正如图26中表示的,当前设想的数据类型包括文本数据430、图像数据432、音频数据436、视频数据436以及波形数据438。但是,如参考数字440指示的那样,数据可包括它们的组合以及在此没有表示的其它数据类型。例如,一个图像可包括格式、表面、边缘、纹理、颜色或可以(观察或算法)识别的和服从任何参考类型的任何其它特定特征,以及诸如文本数据的其它数据。例如,在某些环境中,此类文本数据可在图像中观察或检测(例如从注释、日期压印等),而在其它环境中,数据可以不出现在图像中,而是用来再生图像的编码文件的一部分。类似地,可在波形、音频数据、视频数据等中给出特征的特定组合。
因此,注意到以下方面非常重要:在数据类型426和特性428之间会出现对应关系或交集空间444。此外,通过直接参考域定义和数据实体自身当中所关注的特征或特性来丰富这一交集空间。因此,本技术使用户摆脱文本定义的约束,并强化上述搜索、分类和其它功能同它们自身的“类型术语”中查找的实际特征和特性的集成。
图27表示图像中此类特征的定义的一个示例。正如图27中表示的那样,轴22包括多个图像标注446、448、450和452。在说明的示例中,标注446通常具有圆形454的外观。后续标注448、450和452分别具有下列外观:圆458内1个圆、圆462内2个圆,以及圆466内3个圆。
图27还表示了一个关联列表26,该列表26是为将被映射到每个标注的数据实体预期或接受的属性的关联列表。例如,正如参考数字456表示的那样,具有不同格式和通常类似于圆454的外观456的实体可被映射到标注446。类似地,正如通常由不同图像460、464和468分别表示的那样,由标注448、450和452的图像458、462和466定义的其它图像或图像特征的变形可被映射到那些标注。
正如本领域技术人员理解的那样,前面给出的搜索和处理定义图像特性的能力可以组成各种设想的用途。例如,在说明的实施例中,医学图像可被搜索和映射,以便通过位置数目确定肿瘤的出现。在不同环境中,可查找元素、组织、条款以及服从所述定义的任何其它特征。这种可能性可扩展到任何有用特征,只提及几个的话,这种特征例如为武器、面貌、车辆等。还应该注意:关联列表可用来包括或排除标注上的任何期望变化,再次地在图像数据实体的“类型术语”中有效产生一个相应特征的“词汇表”。
图28和29分别表示其它轴、波形和音频文件标注的相似定义。如图28所示,例如,可为波形474和478(例如对应一个规则EKG波形和一个不规则EKG波形)定义标注470和472。正如通常由参考数字476和480表示的那样,对它们中的每一个,关联列表可包括作为所关注目标波形变化的属性。
类似地,如图29所示,可为声音486和490定义音频标注482和484。应该理解,由于声音没有将其自身提供给可视界面,因此可示出波形或任何图示表示,以便促进人类同域和实体之间的交互。事实上,如果在音频数据中查到那些字符,则该表示可简单包括文本术语(例如“癌症”或“史密斯医生”)。但是,应该认识到:音频文件的定义不以任何方式限于同字符对应的声音。相反,可制定服从定义和识别的任何常规声音或声音的组合。由此,作为所关注的音频特征的形式或变化,属性可由属性488和492定义。
一个特定实施中,可为轴、标注和属性参考此类“类型术语”特征的任何组合。例如,在对癌症肿瘤的搜索中,一个轴可包括导致文本实体、图像以及音频或视频文件映射的标注,所述文本实体包含字符“癌症”或任何同源词或相关字符,图像旨在示出癌症的形态,音频或视频文件提及或示出癌症。正如上面所指出的那样,可使用更低等级的集成,例如为相同标注定义内不同的“类型术语”属性,以及一种类型(例如,文本)的属性,所述类型在根本上不同类型的数据实体中查到。
作为说明,下面是如何在一个医学诊断环境中使用此类多重类型域定义的示例。在肺病的评估中,国际劳工局(ILO)于2002年推荐的分类系统包括引导线和两组标准胶片。标准胶片表示不同类型和异常的严重性,并且用来同分类过程期间的主题胶片和图像相比较。该系统定向为描述关联不同肺尘症的特征的实质和程度,包括煤矿工人的肺尘症、硅肺病和棉沉滞症。它处理肝细胞性异常(小的或大的暗斑)、胸膜改变或其它相关特征,或者有时同职业肺病混淆。
在ILO2002系统给出的声明中,首先要读者分级胶片质量。随后让他们根据形状和尺寸分类小暗斑(opacity)。小圆形暗斑的尺寸特征化为p(上至1.5mm)、q(1.5-3mm)或r(3-10mm)。不规则小暗斑按宽度被划分为s、t或u(同小圆形暗斑的尺寸相同)。在4点主类别刻度(0-3)上分类小暗斑的量(频率),每个主类别被划分为3个,结果产生0/-和3/+之间的12点刻度。大暗斑被定义为出现在图像中的任何大于1cm的暗斑。大暗斑被分类为种类A(不超过5cm组合直径的一个或多个大暗斑)、种类B(组合直径大于5cm但不超过右上角区域等价物的大暗斑)或种类C(大于B)。还针对钙化作用的位置、宽度、程度和等级来评估胸膜异常。最后,可评估胸腔X光照片的其它异常特征。
上面讨论的域定义计算,尤其是在图像环境中直接定义标注和属性,特别适用于整理和分类医学图像以便实现ILO2002系统。特别地,可将不同格式、尺寸以及计数或暗斑指定或表示为直接用于分类目的轴、标注或属性。同样,正如上面指出的,可以这样设计这个域:可能首先识别“概念性缩放”并随后分析病症出现的不同类型或类别。
在神经变性疾病的评估中可考虑另一种示例性医学诊断实施。在其初始的早期阶段通常很难检测此类异常。一般经验是在一定成像序列中使用诸如SPECT和PET的示踪剂,用以关于正常主题确定大脑血流中的改变或指示感知能力产生的区域的代谢率中的改变。神经变性异常(NDD)检测中的一个关键要素是年龄隔离的常规数据库的研发。但是,这些常态只能同标准域相比较,例如Taliarch或NMI。因此,必须使用注册技术将数据映射到这一标准域中。
一旦做出比较,便会为用户显示一个组织的统计偏差图像,从所述组织对病症做出诊断。这是一种非常专业的任务并且只能由高水平培训的专家完成。甚至这些专家只能对病症的严重程度做出一种主观确定。例如,对于NDD(Alzheimer的病症),病症严重性的分类是轻微、中等或高等。读者根据偏差图像的判断做出最终的确定。
再次地,前述域定义和映射技术良好适用于自动或半自动读取系统的实施,所述读取系统用于潜在指示NDD的图像。例如,可将专家为主观诊断病症或病症的相对阶段所当前提及的相同标准图像或图像特征实现为轴、标注、属性或它们的组合。此外,域定义和基于后续分析和映射(诊断)的病人图像特征将处于图像自身的环境或术语中。
尽管在此仅对本发明的某些特征进行了说明和阐述,但本领域技术人员将理解许多修改和变化。因此,应该理解附加的权利要求书将涵盖落在本发明真正精神内的所有此类修改和变化。

Claims (6)

1.一种计算机实现的方法,用于映射数据实体(28,30),该方法包括:
定义(54,56)一个域(12),这个域包括多个分类轴(22)和每个轴的多个分类标注(24),以及同轴和标注相关联的属性(26)的关联列表,至少一个轴、标注或属性包括一个图像特征(454)、一个波形特征(474)、一个音频特征(486)、一个视频特征或它们的任意组合;
访问(70)多个潜在具有所关注的属性的数据实体(28,30);
根据关联列表识别(74)具有同轴和标注相对应的属性的数据实体;并且
根据相应属性分类(82)所识别的数据实体。
2.根据权利要求1的方法,其中由一个图像特征(454)、一个波形特征(474)、一个音频特征(486)或一个视频特征定义一个标注(24),并且该标注的属性包括潜在包含在已访问数据实体中的标注特征的变形(456,476,488)。
3.根据权利要求1的方法,其中通过参考一个图像特征(454)、一个波形特征(474)、一个音频特征(486)或一个视频特征来为轴(22)定义多个标注(446,448,450,452)。
4.根据权利要求1的方法,分类包括一个数据实体(28,30)到多个标注或轴的一对多映射(84)。
5.根据权利要求1的方法,其中至少同至少一个标注相关联的属性包括至少两个以下特征的属性:数据实体的文本特征(430)、图像特征(432)、波形特征(438)、音频特征(434)以及视频特征(436)。
6.根据权利要求1的方法,其中属性(26)编码医学图像的特征,且其中分类包括对可从图像数据中检测的疾病状态进行分析。
CNA2006101412803A 2005-09-30 2006-09-30 计算机辅助域专用实体映射方法及系统 Pending CN1945581A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/240,880 US20070078873A1 (en) 2005-09-30 2005-09-30 Computer assisted domain specific entity mapping method and system
US11/240880 2005-09-30

Publications (1)

Publication Number Publication Date
CN1945581A true CN1945581A (zh) 2007-04-11

Family

ID=37451201

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006101412803A Pending CN1945581A (zh) 2005-09-30 2006-09-30 计算机辅助域专用实体映射方法及系统

Country Status (4)

Country Link
US (1) US20070078873A1 (zh)
EP (1) EP1770561A3 (zh)
JP (1) JP2007102770A (zh)
CN (1) CN1945581A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847161A (zh) * 2010-06-02 2010-09-29 苏州搜图网络技术有限公司 搜索网页的方法和建立数据库的方法
CN101923561A (zh) * 2010-05-24 2010-12-22 中国科学技术信息研究所 一种文件自动分类方法
CN103281954A (zh) * 2011-12-27 2013-09-04 株式会社东芝 医用图像显示装置和医用图像保管系统
CN104937587A (zh) * 2012-12-12 2015-09-23 谷歌公司 基于组合查询提供搜索结果
CN109165171A (zh) * 2018-08-10 2019-01-08 电子科技大学 自适应的快速数字波形成像方法

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4690683B2 (ja) * 2004-09-13 2011-06-01 株式会社東芝 超音波診断装置及び医用画像閲覧方法
US7610545B2 (en) * 2005-06-06 2009-10-27 Bea Systems, Inc. Annotations for tracking provenance
JP2007133808A (ja) * 2005-11-14 2007-05-31 Canon Inc 情報処理装置、コンテンツ処理方法、記憶媒体およびプログラム
JP5361174B2 (ja) * 2007-11-30 2013-12-04 キヤノン株式会社 表示制御装置、表示制御方法、およびプログラム
US10210234B2 (en) 2008-03-24 2019-02-19 Jda Software Group, Inc. Linking discrete dimensions to enhance dimensional analysis
KR100930617B1 (ko) * 2008-04-08 2009-12-09 한국과학기술정보연구원 다중 개체 중심적 통합 검색 시스템 및 방법
US8099299B2 (en) * 2008-05-20 2012-01-17 General Electric Company System and method for mapping structural and functional deviations in an anatomical region
US8010381B2 (en) * 2008-05-20 2011-08-30 General Electric Company System and method for disease diagnosis from patient structural deviation data
US8180125B2 (en) * 2008-05-20 2012-05-15 General Electric Company Medical data processing and visualization technique
US8430816B2 (en) * 2008-05-20 2013-04-30 General Electric Company System and method for analysis of multiple diseases and severities
US20090299990A1 (en) * 2008-05-30 2009-12-03 Vidya Setlur Method, apparatus and computer program product for providing correlations between information from heterogenous sources
US20100076952A1 (en) * 2008-09-05 2010-03-25 Xuejun Wang Self contained multi-dimensional traffic data reporting and analysis in a large scale search hosting system
US20100076979A1 (en) * 2008-09-05 2010-03-25 Xuejun Wang Performing search query dimensional analysis on heterogeneous structured data based on relative density
US8290923B2 (en) * 2008-09-05 2012-10-16 Yahoo! Inc. Performing large scale structured search allowing partial schema changes without system downtime
US8786873B2 (en) * 2009-07-20 2014-07-22 General Electric Company Application server for use with a modular imaging system
US20110129131A1 (en) * 2009-11-30 2011-06-02 General Electric Company System and method for integrated quantifiable detection, diagnosis and monitoring of disease using population related time trend data and disease profiles
US20110129130A1 (en) * 2009-11-30 2011-06-02 General Electric Company System and method for integrated quantifiable detection, diagnosis and monitoring of disease using population related time trend data
US20110129129A1 (en) * 2009-11-30 2011-06-02 General Electric Company System and method for integrated quantifiable detection, diagnosis and monitoring of disease using population related data for determining a disease signature
US8243882B2 (en) 2010-05-07 2012-08-14 General Electric Company System and method for indicating association between autonomous detector and imaging subsystem
US8417709B2 (en) * 2010-05-27 2013-04-09 International Business Machines Corporation Automatic refinement of information extraction rules
US8934685B2 (en) 2010-09-21 2015-01-13 General Electric Company System and method for analyzing and visualizing local clinical features
US8903198B2 (en) 2011-06-03 2014-12-02 International Business Machines Corporation Image ranking based on attribute correlation
US10546057B2 (en) * 2011-10-28 2020-01-28 Microsoft Technology Licensing, Llc Spreadsheet program-based data classification for source target mapping
US8538934B2 (en) * 2011-10-28 2013-09-17 Microsoft Corporation Contextual gravitation of datasets and data services
US20130166563A1 (en) * 2011-12-21 2013-06-27 Sap Ag Integration of Text Analysis and Search Functionality
US9342317B2 (en) * 2012-08-09 2016-05-17 International Business Machines Corporation Importing profiles for configuring specific system components into a configuration profile for the system
US9223592B2 (en) 2012-08-09 2015-12-29 International Business Machines Corporation Configuring a system with various system components utilizing a configuration profile
CN105468601A (zh) * 2014-08-21 2016-04-06 富泰华工业(深圳)有限公司 信息处理装置和信息处理系统及其信息处理方法
CN104537089B (zh) * 2015-01-05 2018-03-30 北京数码大方科技股份有限公司 计算机辅助设计中的标注数据可靠性检测方法及装置
US10380486B2 (en) * 2015-01-20 2019-08-13 International Business Machines Corporation Classifying entities by behavior
US10853689B2 (en) * 2017-10-09 2020-12-01 WebFurther, LLC Methods for more effectively moderating one or more images and devices thereof
US10685172B2 (en) 2018-05-24 2020-06-16 International Business Machines Corporation Generating a textual description of an image using domain-independent anomaly analysis
WO2021173826A1 (en) * 2020-02-25 2021-09-02 The Board Of Regents Of The University Of Texas System Systems and methods for screening and staging of pneumoconiosis
CN112598023B (zh) * 2020-12-02 2024-01-26 国网青海省电力公司海东供电公司 一种电网监控告警信息智能识别和自动映射方法和装置

Family Cites Families (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5019976A (en) * 1987-06-08 1991-05-28 New World Down Hole Tools Method and system for retrieving text associated with a reference image correspondence to a selected patient image
US5200993A (en) * 1991-05-10 1993-04-06 Bell Atlantic Network Services, Inc. Public telephone network including a distributed imaging system
US5251131A (en) * 1991-07-31 1993-10-05 Thinking Machines Corporation Classification of data records by comparison of records to a training database using probability weights
US5384862A (en) * 1992-05-29 1995-01-24 Cimpiter Corporation Radiographic image evaluation apparatus and method
US5537485A (en) * 1992-07-21 1996-07-16 Arch Development Corporation Method for computer-aided detection of clustered microcalcifications from digital mammograms
US6283761B1 (en) * 1992-09-08 2001-09-04 Raymond Anthony Joao Apparatus and method for processing and/or for providing healthcare information and/or healthcare-related information
US5359513A (en) * 1992-11-25 1994-10-25 Arch Development Corporation Method and system for detection of interval change in temporally sequential chest images
EP0616290B1 (en) * 1993-03-01 2003-02-05 Kabushiki Kaisha Toshiba Medical information processing system for supporting diagnosis.
US6574357B2 (en) * 1993-09-29 2003-06-03 Shih-Ping Wang Computer-aided diagnosis method and system
US5452367A (en) * 1993-11-29 1995-09-19 Arch Development Corporation Automated method and system for the segmentation of medical images
US6022315A (en) * 1993-12-29 2000-02-08 First Opinion Corporation Computerized medical diagnostic and treatment advice system including network access
US6206829B1 (en) * 1996-07-12 2001-03-27 First Opinion Corporation Computerized medical diagnostic and treatment advice system including network access
US5560005A (en) * 1994-02-25 1996-09-24 Actamed Corp. Methods and systems for object-based relational distributed databases
US5574828A (en) * 1994-04-28 1996-11-12 Tmrc Expert system for generating guideline-based information tools
US5434932A (en) * 1994-07-28 1995-07-18 West Publishing Company Line alignment apparatus and process
US5519786A (en) * 1994-08-09 1996-05-21 Trw Inc. Method and apparatus for implementing a weighted voting scheme for multiple optical character recognition systems
US5786994A (en) * 1994-11-23 1998-07-28 Imation Corp. Performance monitoring system and method for a laser medical imager
US5790690A (en) * 1995-04-25 1998-08-04 Arch Development Corporation Computer-aided method for automated image feature analysis and diagnosis of medical images
US5911132A (en) * 1995-04-26 1999-06-08 Lucent Technologies Inc. Method using central epidemiological database
US6675384B1 (en) * 1995-12-21 2004-01-06 Robert S. Block Method and apparatus for information labeling and control
JP2706645B2 (ja) * 1995-12-27 1998-01-28 株式会社亀田医療情報研究所 医療計画支援システム並びに医療計画支援装置及び方法
US6678669B2 (en) * 1996-02-09 2004-01-13 Adeza Biomedical Corporation Method for selecting medical and biochemical diagnostic tests using neural network-related applications
US6272481B1 (en) * 1996-05-31 2001-08-07 Lucent Technologies Inc. Hospital-based integrated medical computer system for processing medical and patient information using specialized functional modules
US6611630B1 (en) * 1996-07-10 2003-08-26 Washington University Method and apparatus for automatic shape characterization
US5815591A (en) * 1996-07-10 1998-09-29 R2 Technology, Inc. Method and apparatus for fast detection of spiculated lesions in digital mammograms
US6173068B1 (en) * 1996-07-29 2001-01-09 Mikos, Ltd. Method and apparatus for recognizing and classifying individuals based on minutiae
US5987345A (en) * 1996-11-29 1999-11-16 Arch Development Corporation Method and system for displaying medical images
US6301378B1 (en) * 1997-06-03 2001-10-09 R2 Technology, Inc. Method and apparatus for automated detection of masses in digital mammograms
US6058322A (en) * 1997-07-25 2000-05-02 Arch Development Corporation Methods for improving the accuracy in differential diagnosis on radiologic examinations
US5999639A (en) * 1997-09-04 1999-12-07 Qualia Computing, Inc. Method and system for automated detection of clustered microcalcifications from digital mammograms
US6073042A (en) * 1997-09-25 2000-06-06 Siemens Medical Systems, Inc. Display of three-dimensional MRA images in which arteries can be distinguished from veins
US6820094B1 (en) * 1997-10-08 2004-11-16 Scansoft, Inc. Computer-based document management system
CA2233794C (en) * 1998-02-24 2001-02-06 Luc Bessette Method and apparatus for the management of medical files
US6024699A (en) * 1998-03-13 2000-02-15 Healthware Corporation Systems, methods and computer program products for monitoring, diagnosing and treating medical conditions of remotely located patients
US6067373A (en) * 1998-04-02 2000-05-23 Arch Development Corporation Method, system and computer readable medium for iterative image warping prior to temporal subtraction of chest radiographs in the detection of interval changes
US6282531B1 (en) * 1998-06-12 2001-08-28 Cognimed, Llc System for managing applied knowledge and workflow in multiple dimensions and contexts
EP1025518A2 (en) * 1998-07-24 2000-08-09 Jarg Corporation Distributed computer database system and method for performing object search
US6738499B1 (en) * 1998-11-13 2004-05-18 Arch Development Corporation System for detection of malignancy in pulmonary nodules
US6081267A (en) * 1998-11-19 2000-06-27 Columbia Scientific Incorporated Computerized apparatus and method for displaying X-rays and the like for radiological analysis and manipulation and transmission of data
US6424996B1 (en) * 1998-11-25 2002-07-23 Nexsys Electronics, Inc. Medical network system and method for transfer of information
US7450229B2 (en) * 1999-01-25 2008-11-11 Amnis Corporation Methods for analyzing inter-cellular phenomena
US20010034023A1 (en) * 1999-04-26 2001-10-25 Stanton Vincent P. Gene sequence variations with utility in determining the treatment of disease, in genes relating to drug processing
US6801645B1 (en) * 1999-06-23 2004-10-05 Icad, Inc. Computer aided detection of masses and clustered microcalcifications with single and multiple input image context classification strategies
BR0013268A (pt) * 1999-08-09 2002-07-02 Univ Wake Forest Processo implementado por computador para criar um banco de dados que pertence à análise de uma imagem e sistema para criar um banco de dados que pertence à análise de uma imagem
WO2001031502A1 (fr) * 1999-10-27 2001-05-03 Fujitsu Limited Dispositif et procede de classement et de rangement d'informations multimedia
US6440066B1 (en) * 1999-11-16 2002-08-27 Cardiac Intelligence Corporation Automated collection and analysis patient care system and method for ordering and prioritizing multiple health disorders to identify an index disorder
US20020069086A1 (en) * 1999-12-06 2002-06-06 Fracek Stephen P. Web linked database for tracking clinical activities and competencies and evaluation of program resources and program outcomes
US6701314B1 (en) * 2000-01-21 2004-03-02 Science Applications International Corporation System and method for cataloguing digital information for searching and retrieval
AU2001234835A1 (en) * 2000-02-09 2001-08-20 Ernest W. Kinchen Method and system for managing patient medical records
US20010047353A1 (en) * 2000-03-30 2001-11-29 Iqbal Talib Methods and systems for enabling efficient search and retrieval of records from a collection of biological data
US20020016719A1 (en) * 2000-06-19 2002-02-07 Nemeth Louis G. Methods and systems for providing medical data to a third party in accordance with configurable distribution parameters
AU2001268571B2 (en) * 2000-06-20 2006-07-06 Warsaw Orthopedic, Inc. Electronic patient healthcare system and method
US20020016718A1 (en) * 2000-06-22 2002-02-07 Rothschild Peter A. Medical image management system and method
US6678703B2 (en) * 2000-06-22 2004-01-13 Radvault, Inc. Medical image management system and method
TWI222039B (en) * 2000-06-26 2004-10-11 Iwane Lab Ltd Information conversion system
AUPQ842800A0 (en) * 2000-06-28 2000-07-20 Aivision Pty Ltd Flat screen vision testing
AU2001276991A1 (en) * 2000-07-20 2002-02-05 J. Alexander Marchosky Patient-controlled automated medical record, diagnosis, and treatment system andmethod
WO2002019244A2 (en) * 2000-08-30 2002-03-07 Healtheheart, Inc. Patient analysis and risk reduction system and associated methods including the use of patient monitored data
AU2001288902A1 (en) * 2000-09-07 2002-03-22 Healthetech, Inc. Portable computing apparatus particularly useful in a weight management program
US7024398B2 (en) * 2000-11-02 2006-04-04 Scientific Learning Corporation Computer-implemented methods and apparatus for alleviating abnormal behaviors
US7556602B2 (en) * 2000-11-24 2009-07-07 U-Systems, Inc. Breast cancer screening with adjunctive ultrasound mammography
US7103205B2 (en) * 2000-11-24 2006-09-05 U-Systems, Inc. Breast cancer screening with ultrasound image overlays
AU2002245031A1 (en) * 2000-11-27 2002-07-24 Diadexus, Inc. Compositions and methods relating to prostate specific genes and proteins
US6934698B2 (en) * 2000-12-20 2005-08-23 Heart Imaging Technologies Llc Medical image management system
US7024473B2 (en) * 2001-01-05 2006-04-04 Matsushita Electric Works, Ltd. Web server for communicating with one or more electronic devices through a gateway computer
IL157872A0 (en) * 2001-03-12 2004-03-28 Monogen Inc A panel for detecting a generic disease state containing a plurality of probes and using cell-based diagnosis
US7386462B2 (en) * 2001-03-16 2008-06-10 Ge Medical Systems Global Technology Company, Llc Integration of radiology information into an application service provider DICOM image archive and/or web based viewer
WO2002074789A2 (en) * 2001-03-20 2002-09-26 Baylor College Of Medicine Use of monoclonal antibodies and functional assays for prediction of risk of opportunistic infection
AUPR464601A0 (en) * 2001-04-30 2001-05-24 Commonwealth Of Australia, The Shapes vector
US7099871B2 (en) * 2001-05-04 2006-08-29 Sun Microsystems, Inc. System and method for distributed real-time search
US7085693B2 (en) * 2001-06-19 2006-08-01 International Business Machines Corporation Manipulation of electronic media using off-line media
AU2002322360A1 (en) * 2001-06-28 2003-03-03 Mount Sinai School Of Medicine Of New York University Methods for diagnosing and treating a disease mediated by decreased mmp-2 function
US7130457B2 (en) * 2001-07-17 2006-10-31 Accuimage Diagnostics Corp. Systems and graphical user interface for analyzing body images
US6741730B2 (en) * 2001-08-10 2004-05-25 Visiongate, Inc. Method and apparatus for three-dimensional imaging in the fourier domain
US7158692B2 (en) * 2001-10-15 2007-01-02 Insightful Corporation System and method for mining quantitive information from medical images
US7054473B1 (en) * 2001-11-21 2006-05-30 R2 Technology, Inc. Method and apparatus for an improved computer aided diagnosis system
US20050207630A1 (en) * 2002-02-15 2005-09-22 The Regents Of The University Of Michigan Technology Management Office Lung nodule detection and classification
JP2003271665A (ja) * 2002-03-15 2003-09-26 Fuji Photo Film Co Ltd 検索用グラフィカル・ユーザ・インターフェイス
US7260773B2 (en) * 2002-03-28 2007-08-21 Uri Zernik Device system and method for determining document similarities and differences
US7295691B2 (en) * 2002-05-15 2007-11-13 Ge Medical Systems Global Technology Company, Llc Computer aided diagnosis of an image set
US20040078231A1 (en) * 2002-05-31 2004-04-22 Wilkes Gordon J. System and method for facilitating and administering treatment to a patient, including clinical decision making, order workflow and integration of clinical documentation
US7296020B2 (en) * 2002-06-05 2007-11-13 International Business Machines Corp Automatic evaluation of categorization system quality
US7139695B2 (en) * 2002-06-20 2006-11-21 Hewlett-Packard Development Company, L.P. Method for categorizing documents by multilevel feature selection and hierarchical clustering based on parts of speech tagging
US7191182B2 (en) * 2002-07-20 2007-03-13 Microsoft Corporation Containment hierarchy in a database system
US6904118B2 (en) * 2002-07-23 2005-06-07 General Electric Company Method and apparatus for generating a density map using dual-energy CT
US6574304B1 (en) * 2002-09-13 2003-06-03 Ge Medical Systems Global Technology Company, Llc Computer aided acquisition of medical images
US20040087838A1 (en) * 2002-10-31 2004-05-06 Mark Galloway Meridian linking diagnostic and treatment system and method for treatment of manifested and latent maladies using the same
US7244230B2 (en) * 2002-11-08 2007-07-17 Siemens Medical Solutions Usa, Inc. Computer aided diagnostic assistance for medical imaging
US6628743B1 (en) * 2002-11-26 2003-09-30 Ge Medical Systems Global Technology Company, Llc Method and apparatus for acquiring and analyzing cardiac data from a patient
US7406150B2 (en) * 2002-11-29 2008-07-29 Hologic, Inc. Distributed architecture for mammographic image acquisition and processing
CA2507499A1 (en) * 2002-12-03 2004-06-17 Siemens Medical Solutions Usa, Inc. Systems and methods for automated extraction and processing of billing information in patient records
US7320000B2 (en) * 2002-12-04 2008-01-15 International Business Machines Corporation Method and apparatus for populating a predefined concept hierarchy or other hierarchical set of classified data items by minimizing system entrophy
US6765983B2 (en) * 2002-12-13 2004-07-20 General Electric Company Method and apparatus for imaging a region of dynamic tissue
US7333997B2 (en) * 2003-08-12 2008-02-19 Viziant Corporation Knowledge discovery method with utility functions and feedback loops
US7650195B2 (en) * 2005-10-27 2010-01-19 Honeywell Asca Inc. Automated tuning of large-scale multivariable model predictive controllers for spatially-distributed processes

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923561A (zh) * 2010-05-24 2010-12-22 中国科学技术信息研究所 一种文件自动分类方法
CN101847161A (zh) * 2010-06-02 2010-09-29 苏州搜图网络技术有限公司 搜索网页的方法和建立数据库的方法
CN103281954A (zh) * 2011-12-27 2013-09-04 株式会社东芝 医用图像显示装置和医用图像保管系统
CN103281954B (zh) * 2011-12-27 2016-12-14 东芝医疗系统株式会社 医用图像显示装置和医用图像保管系统
CN104937587A (zh) * 2012-12-12 2015-09-23 谷歌公司 基于组合查询提供搜索结果
CN104937587B (zh) * 2012-12-12 2020-08-14 谷歌有限责任公司 基于组合查询提供搜索结果
US11003729B2 (en) 2012-12-12 2021-05-11 Google Llc Providing search results based on a compositional query
US11762933B2 (en) 2012-12-12 2023-09-19 Google Llc Providing search results based on a compositional query
CN109165171A (zh) * 2018-08-10 2019-01-08 电子科技大学 自适应的快速数字波形成像方法

Also Published As

Publication number Publication date
US20070078873A1 (en) 2007-04-05
EP1770561A3 (en) 2009-04-29
EP1770561A2 (en) 2007-04-04
JP2007102770A (ja) 2007-04-19

Similar Documents

Publication Publication Date Title
CN1945581A (zh) 计算机辅助域专用实体映射方法及系统
US9898526B2 (en) Computer-implemented system and method for inclusion-based electronically stored information item cluster visual representation
WO2006065823A1 (en) Computer assisted domain specific entity mapping method and system
WO2006065816A1 (en) Domain-specific data entity mapping method and system
US20060136259A1 (en) Multi-dimensional analysis of medical data
US20040015481A1 (en) Patent data mining
CN1653448A (zh) 搜索数据源的系统和方法
US20060136417A1 (en) Method and system for search, analysis and display of structured data
CN1363069A (zh) 信息管理、检索和显示系统以及相关方法
Yao et al. R-C4. 5 Decision tree model and its applications to health care dataset
CN1527225A (zh) 信息关联性显示方法、程序、存储介质和装置
CN1830004A (zh) 凝胶电泳图像的分割和数据挖掘
CN1848162A (zh) 成分信息的可靠性评价方法、系统及程序
CN1106614C (zh) 数据处理设备
CN1735888A (zh) 用于访问数据库的方法和设备
CN1340174A (zh) 提供逆星形模式数据模型的方法
Reiner Redefining the Practice of Peer Review Through Intelligent Automation—Part 3: Automated Report Analysis and Data Reconciliation
Javier et al. A Bibliometric Horizon Scanning Methodology for Identifying Emerging Topics in the Scientific Literature
Raina et al. Automated segmentation of acute leukemia using blood and bone marrow smear images: a systematic review
CN1655189A (zh) 图像生成系统及方法
Venters Query by Visual Example: Towards a Framework for Visual Query Formulation
Müller (d)(e) RSNA infoRAD space# 9508, invited for submission to radiographics (f) Tel.++ 41 22 372 6175 Fax++ 41 22 372 8680 henning. mueller@ sim. hcuge. ch
Singh et al. A Medical Images Based Retrieval System using Soft Computing Techniques
CN1808442A (zh) 图形化修改电性约束条件集的视窗操作接口及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20070411