CN101416192A - 用于包括禽流感病毒检测的数据分析和特征识别的方法和系统 - Google Patents

用于包括禽流感病毒检测的数据分析和特征识别的方法和系统 Download PDF

Info

Publication number
CN101416192A
CN101416192A CNA2007800121998A CN200780012199A CN101416192A CN 101416192 A CN101416192 A CN 101416192A CN A2007800121998 A CNA2007800121998 A CN A2007800121998A CN 200780012199 A CN200780012199 A CN 200780012199A CN 101416192 A CN101416192 A CN 101416192A
Authority
CN
China
Prior art keywords
algorithm
biological sample
data
data set
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800121998A
Other languages
English (en)
Inventor
R·M·小布林森
N·L·米德尔顿
B·G·唐纳德森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intelliscience Corp
Original Assignee
Intelliscience Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intelliscience Corp filed Critical Intelliscience Corp
Publication of CN101416192A publication Critical patent/CN101416192A/zh
Pending legal-status Critical Current

Links

Images

Abstract

用于对对应于生物样品一方面的数据组中的禽流感病毒进行自动化模式识别和检测的系统和方法。该方法包括接收对应于第一生物样品第一方面的第一数据组,使用在对应于已知包含禽流感病毒的第二生物样品一方面的第二数据组上处理的第一系列算法的结果来分析第一数据组,通过在第一数据组上运行第二系列算法为第一数据组生成算法值高速缓存,通过将该算法值高速缓存与第一系列算法的结果进行比较生成匹配结果,以及基于所生成的匹配结果执行处理动作。

Description

用于包括禽流感病毒检测的数据分析和特征识别的方法和系统
优先权申明
本申请要求分别于2006年3月23日提交和2006年2月14日提交的美国临时专利申请S/N.60/743,711和60/773,377的优先权,其全部内容通过引用纳入于此。
发明领域
本发明在各种实施例中一般涉及数据分析领域,尤其涉及数字数据中的模式和对象识别。
发明背景
随着计算机和计算机化技术的增长使用,数字表示的信息量已变得很庞大。对这些大量数字数据的分析一般涉及已知模式的识别。
在许多情形中,起源于数字形式的信息最终通过人的人工审阅来分析,通常需要大量的训练。例如,医疗图像分析典型地需要高水平的专家。为了使人们与大量数据互动,信息典型地被转换成视觉的、听觉的或人类可觉察到的其它表示形式。然而,在将数字数据从其原始形式转换成方便的输出形式的过程期间,某些信息可能被丢失。数据通常在分析之前被处理和滤波以便展示,导致从原始数据丢失有效信息。例如,超声、地震以及声纳信号等数据最初都是基于声音的。其中每一个的数据被典型地处理成图形形式用于显示,但该处理通常出于人们的可读性而牺牲了基本的意义和细节。
虽然人们可被训练以分析许多不同类型的数据,但人工手动分析一般比自动化系统更昂贵。此外,错误通常由于人类感知和注意广度的限制而被引入。这些数据通常包含比人类感官能辨别的更多的细节,并且重复导致错误是公知的。
为解决这些人力分析缺点,许多自动模式识别系统已被开发出来。然而,这些解决方案中的大多数都是高度因数据而异的。模式识别系统能够处置的输入通常被设计为固定和有限的。在多数系统是根据在具体形态上使用来设计的基础上,许多系统固有地受设计限制。例如,医疗图像分析系统在X光或MR成像上表现良好,但对地震数据表现很差。反之亦然。评价数据的系统紧密地与其被设计成要评价的特定数据源相耦合。因此,对宽范围系统的改进是非常困难的。
在每个系统内,模式和特征识别是处理密集的。例如,图像分析一般使用复杂的算法以找到形状,要求数千个算法被处理。发现、开发以及实现每个算法的时间导致在部署和改进该系统方面增加了延迟。
由此,在自动模式识别系统领域中仍有相当大的改进余地。
此外,大多数专家预测,在常规实践下,禽流感未能被足够快速地检测出来以防止会在今后几年中袭击世界的流感流行。当前,没有对禽、其它动物或人类快速筛选的方法。在流行的情况下,当前方法会要求大量有病理学专长的人力来检查血液或其它流体样本以检测和跟踪禽流感。如此大量的有病理学专长的人力是不能获得的。
因此需要自动的禽流感病毒检测系统和方法。
发明概述
此系统被设计成并不被任何具体形态或被开发该系统的那些人的有限知识所限定。本发明提供一种自动化模式识别和对象检测系统,该系统能为数据内容使用最小数目的算法被快速开发和改进以完全地区别数据中的细节,同时减少对人工分析的需要。本发明包括无需其适应特定应用、环境、或数据内容就能在数据中识别模式和检测对象的数据分析系统。该系统评价天然形式的数据,其独立于表示形式或处理后的数据形式。
在本发明的一方面,该系统分析来自全部数据类型内的任何或所有形态的数据。示例数据形态包括成像、声学、气味、触觉以及尚未发现的形态。在成像范围内,应用在药学、国土安全、自然资源、农业、食品科学、气象学、空间、军事、数字版权管理及其他领域中时存在静止和移动图像。在声学范围内,应用在药学、国土安全、军事、自然资源、地质学、空间、数字版权管理及其他领域中时存在单个和多个信道音频声音、超声波连续流、地震、声纳。其他数字数据流的示例包括雷达、气味、触觉、金融市场和统计数据、机械压力、环境数据、味道、和声学、化学分析、电推动、文本及其他。某些数据形态可以是其他形态的组合,诸如有声音的视频或诸如对同一样品采纳不同类型的多个图像的单个形态的多种形式,例如互相关的MRI和CT成像;组合的SAR、拍照和IR成像。在共同系统中作出的改进使所有形态都受益。
在本发明的其他方面,该系统使用相对较小数目的简单算法,这些算法捕捉数据元素之间更基础的关系以标识数据内的特征和对象。此组有限算法可在每种形态和多种形态中快速实现。
在本发明的再其他方面,该系统提供在天然数据的全分辨率上操作的自动化系统。结果以及时方式产生,减轻了初步人工分析的乏味并且提醒操作员检查需要注意的数据组。
在本发明的其他方面,一种方法包括接收对应于第一生物样品第一方面的第一数据组,使用在对应于已知包含禽流感病毒的第二生物样品一方面的第二数据组上处理的第一系列算法的结果来分析第一数据组,通过在第一数据组上运行第二系列算法为第一数据组生成算法值高速缓存,通过将该算法值高速缓存与第一系列算法的结果进行比较生成匹配结果,以及基于所生成的匹配结果执行处理动作。
在本发明的再其他方面,该系统包括用于对生物样品中的禽流感病毒进行数据分析和检测的系统。
附图说明
以下参照下列附图来详细描述本发明的优选和替换实施例。
图1示出本发明的一个实施例的概览;
图2示出用于执行数据分析和特征识别系统的示例系统;
图3示出用于使用数据分析和特征识别系统的示例方法;
图4示出用于创建数据存储的示例方法;
图5示出用于创建已知特征的示例方法;
图6示出用于通过训练或不训练修改突触网络的示例方法;
图7示出用于生成算法值高速缓存的示例方法;
图8示出用于训练已知特征的示例方法;
图9示出用于从正和负训练值组创建训练路径集合的示例方法;
图10示出用于从训练路径集合移除负训练值组的示例方法;
图11示出用于从训练路径创建突触路径的示例方法;
图12示出用于将突触叶与已知特征相关联的示例方法;
图13示出用于不训练已知特征的示例方法;
图14示出用于使用一组算法值来检索突触网络中的突触叶的示例方法;
图15示出用于将突触叶与已知特征断开关联的示例方法;
图16示出用于标识已知特征的示例方法;
图17示出用于确定是否已找到已知特征的示例方法;
图18示出用于评价群集和阈值检测的示例方法;
图19示出用于评价阈值检测的示例方法;
图20示出用于评价群集检测的示例方法;
图21示出用于处理对某区域标识出的已知特征的示例方法;
图22示出用于执行已知特征动作的示例方法;
图23示出灰度图像数据的示例10 x 10像素阵列;
图24示出包含均值算法的输出的示例10 x 10阵列;
图25示出包含中值算法的输出的示例10 x 10阵列;
图26示出包含值展距算法的输出的示例10 x 10阵列;
图27示出包含标准偏差算法的输出的示例10 x 10阵列;
图28示出包含使用图24-27中计算出的值的单条突触路径的示例突触网络;
图29示出包含使用图24-27中计算出的值的两条突触路径的示例突触网络;
图30示出包含使用图24-27中计算出的值的许多突触路径的示例突触网络;
图31示出来自图30的添加有下一条突触路径的示例突触网络,示出突触网络可如何分支;
图32示出包含所有使用图24-27中计算出的值的突触路径的示例突触网络;
图33示出结果得到具有多个已知特征的突触叶的突触路径;
图34示出一系列用于6 x 6灰度图像的阵列;
图35示出在设置数据存储时的介绍屏幕的屏幕截图;
图36示出输入一组初始值的屏幕截图;
图37示出展开的子形态组合框的屏幕截图;
图38示出一系列用于添加可任选的描述性参数的文本框的屏幕截图;
图39示出选择目标数据区域形状和为该形状选择一组算法的屏幕截图;
图40示出以前选择的数据存储性质的概览的屏幕截图;
图41示出图40中显示的概述的延续;
图42示出完成数据存储的创建之后的示例应用的屏幕截图;
图43示出灰毗邻像素目标数据区域的算法的屏幕截图;
图44示出“创建或编辑已知特征”向导的屏幕截图;
图45示出为已知特征选择名称和检测方法的屏幕截图;
图46示出来自图45的展开的组合框的屏幕截图;
图47示出用于已知特征的训练计数值的屏幕截图;
图48示出用于已知特征的群集范围值的屏幕截图;
图49示出已知特征的动作值的屏幕截图;
图50示出以前选择的已知特征性质的概览的屏幕截图;
图51示出具有所选择的感兴趣地区的森林图像的屏幕截图;
图52示出训练向导介绍屏幕的屏幕截图;
图53示出从数据存储中选择森林作为已知特征的屏幕截图;
图54示出选择区域训练选项的屏幕截图;
图55示出以前选择的训练性质的概览的屏幕截图;
图56示出训练结果的屏幕截图;
图57示出有森林区域的图像的屏幕截图;
图58示出训练图57中的图像的结果的屏幕截图;
图59示出用于已知特征处理的向导的屏幕截图;
图60示出用户可能想处理的已知特征列表的屏幕截图;
图61示出已知特征的有效性值的屏幕截图;
图62示出对于单个处理运行可任选忽略的训练计数值的屏幕截图;
图63示出对于单个处理运行可任选忽略的群集值的屏幕截图;
图64示出以前选择的处理性质的概览的屏幕截图;
图65示出处理结果的屏幕截图;
图66示出用绿色层显示系统标识为森林的像素的图像的屏幕截图;
图67示出有森林层的复合图像的屏幕截图;
图68示出为森林已知特征处理的第二图像的屏幕截图;
图69示出用绿色层显示系统标识为已知特征森林的像素的图像的屏幕截图;
图70示出有森林层的复合图像的屏幕截图;
图71示出选择了水面的图像的屏幕截图;
图72示出使用以前选择的水面的训练结果的屏幕截图;
图73示出有森林和水面两者的图像的屏幕截图;
图74示出以前选择的处理性质的概览的屏幕截图;
图75示出处理结果的屏幕截图;
图76示出水面层的屏幕截图;
图77示出有森林层和水面层两者的复合图像的屏幕截图;
图78是根据本发明实施例形成的对禽流感病毒进行数据分析和检测的系统的框图;以及
图79和80例示说明处理前和处理后的病毒的图像。
优选实施例的详细描述
虽然参考诸如图像数据和音频数据等的具体数据类型来描述数据分析和特征识别系统的下列实施例和示例中的几个,但本发明并非被限定于对这些数据类型的分析。本文中描述的系统和方法可用于识别数据组或可在可量化数据存储中表示的任何其它信息集合中的离散特征。
本文中描述的数据分析和特征识别系统的实施例一般涉及数字数据流的分析和组织以学习和重复识别数据内的模式和对象。数字数据流可以是模拟源到数字形式的转换。在某些实施例中,系统使用的数据组织结构涉及用于描述所定义对象的要素的互连数据字段的网络(本文中称为“突触网络”)。
在例如图1中所示的一个实施例中,数据分析和特征识别系统被配置成接受包含已知和预先标识的特征“X”81(例如,已知模式、形状或对象)的源数据组80。该系统被一般配置成使得用户能够“训练”(82)该系统识别该已知特征“X”。此训练通过执行多个算法以分析(83)表示特征“X”的数据从而标识定义该特征的特性的多组值来完成。定义特征“X”的几组值随后存储(84)在本文中称为“突触网络”85的组织性结构中,其由通过多条“突触路径”互连的多个“突触叶”组成。
一旦对于已知特征该系统已被训练,可向系统展示包含一组未知特征87的新数据组86。该系统可被配置成接受用户请求88以使用相同的多个算法来分析(89)该新数据组的选择部分,并将结果与突触网络85中存储的信息进行比较(90)以标识该新数据组中包含的任何已知特征(诸如特征“X”、或任何以前训练过的其他特征)。一旦在新数据组中找到已知特征,该系统就可通知(91)用户已知特征已被标识的事实和/或该系统就可向用户展示(92)已知特征的表示(例如,以图形图像的形式、可听到的声音、或任何其它形式)。
如本文中所使用的,术语“数据存储”表达其本意,并且在本文中一般用于指至少能够暂时存储数据的任何软件或硬件单元。在几个实施例中,本文所称的数据存储包含由多个突触网络表示的多个已知特征,每个突触网络包含由突触路径联结的多个突触叶,如以下进一步例示说明的。
如本文中所使用的,术语“目标数据元素”(TDE)指被使用算法来评估特性的给定介质中较大数据组的离散部分。目标数据元素可以是适合特定类型的数据的任何尺寸。例如,在一组图形数据中,TDE可由单个像素组成,或其可包括局部化的像素群或任何其它离散像素群。在几个实施例中,不管其大小,TDE是在移动到下一个TDE之前在单个离散步骤中被评价的“点”。
如本文中所使用的,“目标数据区域”(TDA)是紧围着目标数据元素的数据的集合。TDA的尺寸和形状取决于被评价的数据或介质的类型可变化。TDA的尺寸和形状定义可用于算法执行的计算的数据点。
如本文中所使用的,使用术语“已知特征”来指表示在训练期间已知在特定数据组中存在的条目、对象、模式、或其它可离散定义的信息片段的数据元素。在处理时,系统为一个或以上以前定义过的已知特征搜索新数据组。
如本文中所使用的,术语“突触网络”是指在有根的固定深度树的实现中用于存储关于离散特征、模式、对象或其他已知数据组的信息的组织性结构。突触网络有利地允许关于已知特征的信息被很快添加,并允许未知数据组被很快评价以标识其中包含的任何已知特征。
如本文中所使用的,术语“突触叶”一般是指表示由用于到达叶的一组算法值标识出的多个已知特征的突触网络中的终端节点。
如本文中所使用的,术语“突触路径”是指来自所有这些算法的多个值。突触路径被用于基于对目标数据元素的计算到达突触叶。
如本文中所使用的,“训练事件”是通过创建或更新突触路径和突触叶将多个算法值与已知特征相关联的过程。
如本文中所使用的,术语“算法”表达其本意,并且不限于指结果得到离散“值”的任何系列可重复步骤。例如,算法包括任何数学计算。在几个实施例中,对与以前定义的目标数据区域相关的目标数据元素执行各种算法以产生单个有意义的值。
如本文中所使用的,术语“命中检测”是指基于将处理期间遭遇的突触路径与对某已知特征训练过的任何路径相匹配来确定该已知特征是否存在于测试数据组中的方法。
如本文中所使用的,术语“群集检测”是指基于命中检测和对目标数据元素的预定义“群集距离”内指定数目的附加命中的检测两者来确定已知特征是否存在于测试数据组中的方法。
如本文中所使用的,术语“群集距离”是指一个或以上用于评价目标数据元素的用户定义的距离规格。群集距离可指实际物理距离,或可表示离散数据元素之间的数学关系。
如本文中所使用的,术语“阈值检测”是指基于命中检测和命中检测中使用的突触路径作为已知特征已被训练的次数两者来确定该已知特征是否存在于测试数据组中的方法。
如本文中所使用的,术语“正训练值组”是指在被训练成用户定义的已知特征的数据区域中的几组算法值。
如本文中所使用的,术语“负训练值组”是指在被训练为用户定义的已知特征的数据的区域外的几组算法值。
如本文中所使用的,术语“区域训练”是指在训练事件中使用的过程,其中在正训练值组中找到的每组算法值都被用于为该已知特征生成突触路径。
如本文中所使用的,术语“相对调整的训练”是指在训练事件中使用的过程,其中在负训练值组中找到的每组算法值使正训练值组内找到的一组匹配算法值无效。随后可使用其余正训练值组为该已知特征生成突触路径。
如本文中所使用的,术语“绝对调整的训练”是指在训练事件中使用的过程,其中在负训练值组中找到的每组算法值使正训练值组内找到的算法值匹配的所有组无效。随后可使用其余正训练值组为该已知特征生成突触路径。
如本文中所使用的,术语“形态”以其本意使用,并且一般是指可被处理的数字数据的各种不同形式或格式中的一种。例如,图像数据表示一种形态,而音频数据表示另一种形态。除描述符合一种或以上人类感知形态的数据类型外,该术语还旨在涵盖与人类感知可能只有很少或没有关系的数据类型和格式。例如,金融数据、人口统计数据和文学数据在本文中使用时也表示该术语意义内的形态。
如本文中所使用的,术语“子形态”是指形态的子分类。在某些实施例中,子形态是指用于数据的能够影响如何处理该数据的应用或源之一。例如,X光和卫星摄像是成像的子形态。来自不同厂商(诸如通用电气或西门子)的用于产生X光图像的系统在其将被描述成不同子形态的数据格式方面明显不同。
图2示出用于执行数据分析和特征识别系统的示例系统100。在一个实施例中,系统100包括单个计算机101。在替换实施例中,系统100包括与多个其它计算机103通信的计算机101。在替换实施例中,计算机101被连接到多个计算机103、服务器104、数据存储106和/或诸如内联网或因特网等的网络108。在又一替换实施例中,可使用服务器排、无线设备、蜂窝电话和/或另一数据输入设备来代替计算机101。在一个实施例中,数据存储106存储数据分析和特征识别数据存储。该数据存储可本地存储在计算机101上或存储在任何远程位置但可被计算机101检索。在一个实施例中,应用程序由服务器104或计算机101运行,其随后创建该数据存储。计算机101或服务器104可包括训练已知特征的应用程序。例如,计算机101或服务器104可包括标识数字介质中以前定义的已知特征的应用程序。在一个实施例中,该介质是图像数据中的一个或以上像素或声音记录中的一个或以上样本。
图3示出根据本发明的实施例形成的方法。在框112处,创建数据存储,其将在以下图4和5中更详细地描述。在框114中,训练已知特征。以下关于图6-15更详细地描述该训练。在框116处,标识出已知特征,其将在图16-20中更详细地描述。在框118处,执行已知特征动作,其将在图20中进一步例示说明。
图4示出用于创建数据存储的示例方法(框112)。该方法(框112)在框120处通过指派多个数据存储性质开始。在一个实施例中,数据存储性质包括形态和子形态。在每个形态内,有多个子形态。在一个实施例中,在框122处创建已知特征,其将在图5中进一步例示说明。在一个实施例中,在框124处指派目标数据区域。在一个实施例中,选择目标数据区域。对于成像形态的一个示例目标数据区域是围绕目标像素的近邻和远邻像素的模式。在一个实施例中,在框126处选择目标数据区域算法。在框128处,将数据存储106保存到计算机101或网络108。框120、122以及124与126的组合可按任何次序执行。
图5示出用于创建已知特征的示例方法(框122)。在框140处,用户输入已知特征的名称。在一个实施例中,在框142处,用户向该已知特征指派一种用于检测的方法。在一个实施例中,该检测方法可被选择为命中检测。在一个实施例中,可使用群集检测。在一个实施例中,可使用阈值检测。在一个实施例中,可使用群集和阈值检测。在一个实施例中,在框144处,可为通知找到已知特征的方法选取处理动作。在一个实施例中,用户可不选择动作,执行系统声音、或涂抹多个像素。框140、142和144可按任何次序执行。
图6示出用于通过训练或不训练修改突触网络的示例方法(框114)。在一个实施例中,该方法在框150处以生成算法值高速缓存开始,其在图7中进一步描述。在一个实施例中,该方法在框152处当用户选择已知包含要被训练的特征的数据区域时开始。在框153处,检索正训练值组。在一个实施例中,在框154处,作出关于用户是否正在执行经调整的训练的判定。如果是,则在框156处,检索负训练值组。在一个实施例中,在框158处作出关于用户是否正在训练或不训练已知特征的判定。如果在训练,则在框159处训练该已知特征,其将在图8中进一步例示说明。在一个实施例中,在框160处,向用户给出显示被添加和更新的独特突触路径的数目的报告。如果不在训练,则不训练已知特征,其将在图13中进一步解释。在一个实施例中,在框162处,向用户报告被移除的独特突触路径的数目。框150和152可按任何次序执行。框153以及154与156的组合可按任何次序执行。
在某些境况下,用户能够很好地调谐感兴趣地区的限制可能导致某些正训练值组实际上包含用户知晓其不是他/她希望训练的数据部分。这些情形由经调整的训练来处置,其可由用户选择。静止图像中感兴趣地区之外的这一区域经常是用户不想作为已知特征来训练的背景或普通区域。通过标识负训练值组,来自感兴趣地区(正训练值组)内的实际上不是用户希望作为已知特征来训练的特征的那些算法值组可被移除。
图7示出用于生成算法值高速缓存的示例方法(框150)。在一个实施例中,算法值高速缓存由存储以前选择的算法的数字结果的阵列组成。该方法(框150)在框170处以该方法检索数据中的第一个TDE开始。在框176处,在TDE的TDA上计算算法值。在框180处,将该算法值存储在该TDE的算法值高速缓存中。在框174处,作出该数据中是否有更多TDE可用的判定。如果是假,则在框172处,完成该算法高速缓存。如果为真,则在框178处,检索下一个TDE并且处理返回到框176。
图8示出用于训练已知特征的示例方法159。方法159在框190处开始,在此检索已知特征用于训练并且建立训练突触路径阵列。在框192处,从正和负训练值组发展出训练突触路径阵列。在框194处,创建并遵循新突触路径。在框196处,将突触路径与已知特征相关联,其将在图12中进一步解释。在框202处,作出关于训练路径阵列中是否有更多条目的判定。如果是,则返回至框194。如果否,则在一个实施例中,更新训练计数。在一个实施例中,在框200处,分序突触叶。在框204处,该方法(框159)完成。框190和192可按任何次序执行。
图9示出用于从正和负训练值组开发训练突出路径阵列的示例方法(框192)。在框210处,检索训练类型以及正和负训练值组。在框212处,将正训练值组指派给训练阵列。在框214处,作出关于用户是否正在执行经调整的训练的判定。如果是,则在框216处,从训练阵列中移除负训练值组,其将在图10中进一步解释。在框218处,开发训练突触路径完成。
图10示出用于执行调整训练的示例方法(框216)。在一个实施例中,相对和/或绝对调整训练都是可用的。在框220处,从各负训练值组之一中选择突触路径。在框222处,作出训练类型是否是绝对调整训练的判定。如果是,则在框226处,从训练阵列中移除与当前突触路径匹配的所有突触路径。如果否,则在框228处,从训练阵列中移除与当前突触路径匹配的一条突触路径。在框230处,选择下一条突触路径,并且如果不再有突触路径,则在框218处,该方法返回到图9,即框216。
图11示出用于创建和跟随突触路径的示例方法(框194)。在框240处,该过程将当前节点设置到突触网络的根节点。在框242处,选择突触路径中的算法值。在框244处,作出关于当前节点对于当前算法值是否有下一个节点链接的判定。如果是,则在框248处将当前节点设置到该下一个节点。如果否,则在框246处创建新节点;用当前算法值将当前节点链接到该新节点。在框248处,当前节点被设置到该下一个节点。在框250处,选择下一个算法值。在框252处,结果所得突触叶被返回给图8中的框194。
图12示出用于将突触路径与已知特征相关联的示例方法(框196)。在框260处,将当前突触叶设置到从图11返回到图7的框194的突触叶。在框266处,作出关于当前突触叶是否包含被训练的已知特征的索引值的判定。如果是,则在框268处更新当前突触叶命中计数。如果否,则在框270处,作出关于当前突触叶是否具有下一个突触叶的判定。如果是,则在框276处将当前突触叶设置到该下一个突触叶。如果否,则在框272处,创建包含被训练已知特征的索引的新突触叶,并将其链接到当前突触叶。在框280处,该过程返回到图7中的框196。
图13示出用于不训练已知特征的示例方法(框161)。在框320处,检索不训练的已知特征和多个正训练值组。在框322处,选择当前值组。在框324处,跟随该当前正训练值组的突触路径。在框326处,测试该突触路径看其是否存在。如果是,则在框328处将该突触路径与已知特征断开关联。如果否,则在框330处前进到下一组正训练值。一旦所有正训练值组已被评价,则在框332处,返回到图6中的框161。
图14示出用于跟随突触路径以基于一组算法值来标识叶的示例方法(框324)。在框340处,将当前节点设置到突触网络的根节点。在框342处,为用于当前节点的算法从突触路径中选择算法值。在框344处,作出关于当前节点对于当前算法值是否有下一个节点链接的判定。如果是,则在框346处将当前节点设置到该下一个节点。在框348处,选择下一个算法值。如果不再有算法值,则在框350处,在突触路径结束处返回突触叶。如果否,则在框352处,该突触路径不存在。该过程返回至图13的框324。
图15示出用于将突触路径与已知特征断开关联的示例方法(框328)。在框360处,将当前突触叶设置到由图14返回到框324的突触叶。在框362处作出关于当前突触叶是否包含该已知特征的索引值的判定。如果是,则在框364处移除该叶。如果否,则在框365处作出关于当前突触叶是否具有下一个叶的判定。如果是,则将当前突触叶设置到该下一个叶并且该过程被重复。如果否,则该过程在框370处返回到图13中的框328。
图16示出用于标识已知特征的示例方法(框116)。在一个实施例中,在框390处生成算法值高速缓存。(参见图7)在框392处,在当前数据中选择一个区域。在框393处,选择第一个TDE。在框394处,作出该TDE是否在所选择区域中的判定。如果是,则在框398处,如果可用就从算法值高速缓存中检索该TDE的算法值;如果不可用,就为该TDE计算算法值。在框400处,用这些算法值来查询数据存储。(参见图14)在框404处作出对于这些算法值的路径是否存在的判定。如果是,则在框406处确定该匹配是否是已知特征的命中,其在图17中进一步解释。如果否,则在框402处检索下一个TDE。如果从框394为否,则在框396处返回标识出的已知特征。框390和392可按任何次序执行。
图17示出用于确定已知特征是否是叶命中的示例方法(框406)。在框420处,对于为该叶找到的已知特征中的每一个执行下列处理。在框426处,检查该特征看是否有用户选择它用于标识。如果是,则在框428处,检查该特征看命中方法是否被设置为命中检测。如果在框428处为否,则在框434处,检查该特征看命中检测方法是否被设置为阈值。如果在框434处为否,则在框440处,检查该已知特征看已知特征命中方法是否被设置为群集化。如果在框428处为是,则在框430处,将该已知特征添加到为当前一组算法值标识的特征列表中。如果从框434为是,则在框436处针对阈值命中检查该已知特征,其在图19中进一步解释。如果从框400为是,则在框442处执行对群集化命中的检查,其在图20中进一步解释。如果从框440为否,则在框444处系统检查群集化和阈值命中,其在图18中进一步解释。在框436、442和444处,对于命中返回的数据或为真或为假。在框438处,分析该返回值以确定在此位置是否有命中。如果是,则在框430处,将该已知特征添加到当前一组算法值的已标识特征列表中。如果否,则在一个实施例中,在框424处确定该方法是否仅处理最显著的已知特征。如果是,则该方法完成;如果否,则在框422或框426处,检查是否有与当前叶相关联的附加已知特征。如果是,则前进到框420;如果否,则该方法现在完成并且通过框432返回至图16中的框406。
图18示出用于检查群集化和阈值命中的示例方法(框444)。在框450处,该方法执行对阈值命中的检查。在框452处,检查是否找到阈值命中。如果否,则该方法前进到框459。如果是,则该方法前进至框454。在框454处,该方法执行对群集化命中的检查。在框456处,检查是否找到群集化命中。如果否,则该方法前进到框459。如果是,则该方法前进至框458。在框458处,在阈值和群集化处理中检测到命中,且因此将真返回给图17中的框444。在框459处,在阈值或群集化处理之一中未检测到命中,且因此将假返回给图17中的框444。框450和452以及454与456的组合可按任何次序执行。
图19示出用于检查阈值命中的示例方法(框436)。在框460处,系统检测看是否设置了处理阈值。如果是,则在框462处,作出对突触叶的已知特征命中计数是否在处理最小值与最大值之间的判定。如果是,则在框468处返回真;如果否,则在框466处返回假。如果从框460为否,则在框464处检查该已知特征以确定对突触叶的命中计数是否在已知特征最小值与最大值之间。如果是,则在框468处返回真;如果否,则在框466处返回假。
图20示出用于检查群集化命中的示例方法(框442)。在框470处,系统检测看是否设置了处理群集距离。如果否,则在框472处,该方法用已知特征群集距离执行群集化检查。如果是,则在框474处,用处理群集化距离来执行群集化检查。随后在框476处,作出检查看是否找到群集。如果是,则在框478处返回真。如果否,则在框480处返回假。
图21示出用于处理对某区域标识出的已知特征的示例方法(框118)。在框492处,检索在所选择区域中的第一个TDE。在框496处,检查该TDE以确定其是否在该所选择区域之内。如果否,则处理动作完成。如果是,则在框500处检索对该TDE标识出的特征列表。在框501处,对该特征列表执行动作。这一旦完成,就在框502处检索下一个TDE。
图22示出一个实施例中用于对已知特征列表执行动作的示例方法(框501)。该方法(框501)在框503处开始。在框503处,将当前已知特征设置到TDE列表中的第一个已知特征。在框504处,检查已知特征动作以确定该动作是否为声音。设置已知特征动作曾在图5中例示说明。如果是,则在框506处,系统确定该声音以前是否已被播放过至少一次。如果从框506为否,则在框508处播放由已知特征动作数据指定的声音。如果从框504为否,则在框510处检查该已知特征动作以确定其是否为涂抹。如果是,则按照该已知特征动作数据设置该TDE的图像色彩。在框511处,作出检查看TDE列表中是否存在更多已知特征。如果是,则将当前已知特征设置到下一个已知特征(框515),并且该方法在框504处继续。如果否,则该方法在框513处返回。其他实施例需要的附加动作或动作组合是可能的。这些动作可按任何次序来检查和执行。
图23是10 x 10像素图像的示例阵列600。像素的X坐标由诸行604中的数字来表示。像素的Y坐标由诸列602中的数字来表示。在一个实施例中,阵列600内示出的数字是该10 x 10像素图像的原始灰度值。示出的数字是使用包括围绕目标像素的八个像素的毗邻像素TDA使用预先选择的算法来操纵的数字。在此示例中,选取的算法为均值、中值、值展距和标准偏差。进一步,图24-34示出图3中描述的训练已知特征的示例。
图24示出对毗邻像素TDA使用均值算法的10 x 10像素图像的示例阵列605。如阵列605中所示,第一行和最后一行609被打上了阴影,并且第一列和最后一列607被打上了阴影。这些区域被打上阴影是因为它们不包含必要的划界像素。第一个有效像素——所有侧都被另一像素界定的第一个像素——是(2,2),并且该算法结果所得为153。结果153将在图28开始被进一步使用。
图25示出对毗邻像素TDA使用中值算法的该10 x 10像素图像的示例阵列610。该算法为第一个有效像素结果所得为159。结果159将在图28开始被进一步使用。
图26示出对毗邻像素TDA使用值展距算法的该10 x 10像素图像的示例阵列620。该算法为第一个有效像素结果所得为217。结果217将在图28开始被进一步使用。
图27示出使用标准偏差算法的该10x10像素图像的示例阵列630。该算法为第一个有效像素结果所得为64。结果64将在图28开始被进一步使用。
图28示出在一个实施例中包含根据图24-27中计算出的第一有效像素值形成的单条突触路径的示例突触网络640。为153的第一值(642)来自第一算法(缩写为ALG)(图24像素2,2处)。因此,642显示153,计数1。计数1表示在训练期间第一算法具有结果153的次数。第二节点644示出第二算法(图25像素2,2处)为159的结果。因此,644显示159,计数1。第三节点646示出第三算法(图26像素2,2处)为217的结果。因此,646显示217,计数1。第四节点648示出第四算法(图27像素2,2处)为64的结果。因此,648显示64,计数1。随后此突触路径通向包含已知特征(缩写为KF)1的突触叶。这是首次此突触路径已被创建,且因此计数也为1,参见框650。在此示例中,突触叶640是该突触网络中的第一突触叶。
图29示出在一个实施例中包含使用图24-27中计算出的值的两条突触路径的示例突触网络660。突触叶664曾在图28中示出和描述。突触叶666表示来自图24-27中所示每个表的像素(2,3)的算法值。因此,在分析两个像素之后,有两条不同的标识同一已知特征的突触路径。
图30示出在一个实施例中使用图24-27中计算出的值的示例突触网络670。从图24-27中所示各表计算出的值表示像素(2,2)到(3,4)。这些值在各行内从左到右被采纳。在计算中的此时,来自第一算法的值没有重复;因此,对于每个计算的像素,全新的突触路径和新的突触叶被添加到该突触网络。
图31示出在一个实施例中使用图24-27中计算出的值的示例突触网络720。在突触网络720中,有在722处示出的重复值。第一算法值151在(2,8)和(3,5)两处找到,因此将该位置处的计数增大到等于2。在722处,该突触路径分裂,因为从第二算法检索到不同值。对该组值生成新突触路径的一部分和新突触叶。
图32示出在一个实施例中使用图24-27中计算出的值的示例突触网络730。此示例示出在732、734和736处第一算法值重复的更被填充的突触网络730。这些重复显示出在突触网络中的任何节点都可形成新分支并且将形成新突触路径。如节点732中所示,有三个仍得到同一已知特征的分歧结果。图32进一步演示训练已知特征之后被完全填充的突触网络可能看起来像什么的图形表示。
图33示出结果得到具有多个已知特征742的突触叶的突触路径740。当多个已知特征与突触路径相关联时,这些特征被存储在按特征的命中计数来排序的分序列表中。最经常与突触模式相关联的已知特征在该列表中首先出现,后面是按命中计数降序排列的其他已知特征。在平局的情形中,第一个与该突触路径相关联的已知特征将首先出现。
图34示出一系列对于6 x 6黑白图像的阵列。该页面顶部的阵列示出该图像中所有像素的亮度值。下一阵列680示出向顶阵列应用毗邻像素TDA的均值算法的结果。阵列690示出向顶阵列应用毗邻像素TDA之后中值算法的结果。阵列700示出向顶阵列应用毗邻像素TDA之后值展距算法的结果。阵列710示出向顶阵列应用毗邻像素TDA之后标准偏差算法的结果。作为示例,阵列680-710的结果被应用到图32中的突触网络。来自阵列680的(2,2)中所示的结果所得值为164。现在参考图32,在图32中的突触网络732处的第一节点中找到值164。接下来,使用在(2,2)处找到的值——值152,图32中显示跟随164的下一个节点为152。因此,前两个值沿着已知突触路径。沿着此突触路径并且阵列700和710中(2,2)处的值表明在像素(2,2)处,该突触网络中被训练的已知特征存在匹配。
在图35-37中,屏幕截图表示界面的一个示例;存在无限的替换。
图35是在设置数据存储时的介绍屏幕的屏幕截图800。这显示向导802的介绍,其将引导用户通过此应用中的各步骤来创建和/或编辑数据存储。此图中还示出一系列选项卡804。这些选项卡示出用户在该向导内的位置。右上角是提供关闭和退出向导802的能力的按钮。在该屏幕截图的底部是执行取消的选项按钮808、执行回退的选项按钮810、执行到下一步的选项按钮812以及执行完成的选项按钮814。以上描述的一般布局是在大多数屏幕截图中盛行的。
图36是示出输入定义数据存储的初始值的屏幕截图。选择选项卡“必需”804,示出在此应用中必要的一组值。在此阶段,用户正标识将被处理的数字数据的类型。形态组合框820包含一系列指定数字数据流的格式的形态。子形态组合框822包含一系列指定信息的使用或形态的具体应用的子形态。记录由复选框824表示。
图37示出显示展开的子形态组合框822的屏幕截图。子形态组合框822已被展开,以在一个实施例中示出当前已对两维图像形态作了设置的子形态的可配置列表。此组合框822向用户示出之前选择的数字数据形式内的多个子分类,以使得用户能够处理一个形态内数字数据的差别。
图38是示出此应用中一系列用于添加可任选的描述性参数的文本框的屏幕截图。“任选”选项卡已被选中。可使用来自此屏幕截图的信息来分类通过网络接收和存储的数据存储。在文本框830中输入厂商名称。在文本框832中输入机器类型。在文本框834中输入该机器类型的型号。在文本框836中输入训练者的姓名。在文本框838中描述数据存储的使用。
图39是允许选择TDA形状和为该形状选择一组算法的屏幕截图。“目标数据形状”选项卡804被选中。组合框840允许用户选择目标数据形状以确定如何紧围该TDE收集数据。在一个实施例中,选择“灰毗邻像素”。在一个实施例中,选择算法的过程通过选取TDA形状开始。在图39的情形中,选取的TDA形状是中心像素为该TDE的9像素的正方形(此处称为“灰毗邻像素”,因为所有的其余数据元素都接触该TDE)。接下来,选取一组三个算法。在此示例中,使用算法2、算法3和算法4(算法可简单或复杂)来提取将在突触网络内的训练中使用的数据。应注意在此示例中,突触网络用来训练和处理的是这三个算法的结果的组合,而非单个算法。
在此点处,选择该图像中包含其内容将在训练中使用的图像部分的一个区域(如图51中所示)。此区域被称为选择区域。有了该选取的选择区域,系统就使TDA移步到该选择区域上,使TDE在该选择区域中的第一像素处。在此位置,对该TDA运行选取用于训练的该组三个算法。算法2(各TDA值的均值)将TDA中全部像素的值相加并将该总和除以像素数目9,结果得到TDA的均值。此平均值被输入到突触网络中供其在训练会话中使用,如在突触网络节中所描述的。算法3(各TDA值的中值)确定该TDA中全部9个像素的中间值。此中间值被输入到突触网络中供其在训练会话中使用,如在突触网络节中所描述的。算法4(TDA值的展距)确定该TDA中全部9个像素的最低像素值和最高像素值。其随后从最高值中减去最低值,得到该TDA值的展距。此展距被输入到突触网络中供其在训练会话中使用,如在突触网络节中所描述的。在此点,系统使TDA形状移步一个位置,在此TDE现在是下一个具有8个毗邻像素的像素。对此新TDA运行同一组三个算法并且结果输入到突触网络中供其使用。系统将每次使TDA移步一个位置并运行该组算法,直到该选择区域中的全部像素都已成为TDE。以上用于训练的过程类似于标识过程。为标识使用与训练相同的TDA形状和算法。选取选择区域并且TDA在该选择区域中移位,并在每个新点都运行该组算法。在此点,这些算法的结果并不被突触网络用于训练,而是与已知特征进行比较以用于标识。
设计用户可用的算法以分析围绕目标像素的区域的可能特性。某些示例是诸如相加或值展距等的算术算法,或诸如标准偏差等的统计算法。对于某些TDA形状,可开发考虑该形状的几何的其他算法。例如,可实现用于2D成像的算法,当围绕目标像素的特定像素在已知值之上时其将位值设为1,由此创建反映围绕目标像素的相邻像素的从0到255的数字。算法类型和对于给定范围的输入值返回的值范围是用户考虑对于给定过程选取哪些算法来选择时的因素。例如,值的展距和总和几乎在任何应用中都是有用的,而相邻像素算法可能只在期望高对比度并且已知或期望像素的具体定向的图像处理中有用。在大多数实施例中,单个算法一般不足以标识特征;使用算法值的组合来学习和/或标识特征。
图40是示出以前选择的数据存储性质的概览的屏幕截图。概述选项卡804已被选中,表示此屏幕向用户显示他/她的全部设置的概述。该屏幕允许用户通过按下“完成”按钮或通过选择“后退”按钮编辑他/她的特征来确认他/她的全部选择。此表中显示的是形态被设为2D成像851。子形态被设为X光852。记录被选择为真854。图41示出显示图40中向下滚动的表850的屏幕截图。图41中进一步示出的是选择了“灰毗邻像素”TDA的目标数据形状860以及选择了7的算法数目862。
图42示出完成数据存储的创建之后的应用的屏幕截图。作为向导(图35-41)的结论,向用户显示屏幕900。屏幕900包含本领域公知的菜单栏910、一组图标914以及查阅多个数据存储的区域912。打上阴影的区域926可显示用户可用来训练这些数据存储并标识不同特征的一组图片。在区域916中,显示由用户在该点作出的选择的列表。在一个实施例中,有用于2D成像的一个数据存储918。一组已知特征若被定义就存储在已知特征文件夹920中。在924处显示“灰毗邻像素”TDA。
图43是示出TDA924的展开的屏幕截图。如图43中所示,TDA924现在被展开以示出可联合TDA使用的可能算法。在此应用中,被选择的算法具有表示它们已被选择的填满框。
图44是示出“创建或编辑已知特征”向导950的屏幕截图。向导950中是一组选项卡952。“开始”选项卡被选中,表示这是对向导的介绍。此向导将引导用户通过此应用中的步骤来创建和编辑已知特征,参见区域954。
图45是示出“创建或编辑已知特征”向导的“标识”选项卡952的屏幕截图。文本框960包含该已知特征的名称。在一个实施例中,用户输入描述该已知特征的名称;在此示例中输入了“森林”。组合框962示出用户选择的命中检测的方法。复选框964允许用户确定在已找到该特定特征的首次出现后该过程是否应该停止。用户可选择复选框964——如果仅为找出该已知特征的实例,诸如在食物安全应用中食物样品中的杂质。图46是示出来自图45的组合框962的展开的屏幕截图。标识方法组合框962包含用于确定特征将被如何标识的方法。
图47是示出“创建或编辑已知特征”向导的“训练计数”选项卡952的屏幕截图。用户可选择表示已知特征在训练期间必须与突触路径相关联的最少次数的阈值以满足用户需要。通过增大该阈值,用户可确保在处理中只使用具有比该阈值更高数目的实例的循环路径,由此给予该特征的最终标识更高级别的置信度。还可选择极限值并且其包含表示已知特征在训练期间已与该突触路径相关联的最多次数的值。使用滑动标度970来表示阈值数字,并且使用滑动标度974来表示极限数字。
图48是示出“创建或编辑已知特征”向导的“群集范围”选项卡952的屏幕截图。此选项卡允许用户选择系统将在每个维度上离已知特征被标识的TDE多远寻找该相同已知特征的其他出现。在一个实施例中,维度组合框980包含两维的X和Y选择。滑动标度982表示维度值,而滑动标度984表示群集计数。为每个维度指定不同的群集范围允许用户说明数据的特性。例如,如果图像的垂直标度与水平标度不同,则用户可向该范围输入调整值来得到期望的群集区域。
图49是示出“创建或编辑已知特征”向导的“动作”选项卡952的屏幕截图。用户可选择已知特征被标识时要执行的动作。组合框990包含动作列表;在此应用中,可能的动作是播放系统声音、涂抹像素以及无动作。在一个实施例中,用户可选择声音以在数字数据中找到该已知特征时提醒用户。用户可选择涂抹以在选择的数字数据中标识该已知特征被标识的那些区域。
图50是示出“创建或编辑已知特征”向导的“概述”选项卡952的屏幕截图。在此表中,行1000中示出已知特征森林的名称被选择。行1002中示出检测方法是命中检测。在行1004处,阈值被设为1。行1006中示出极限被设为2,147,483,647。行1008中示出群集范围被设为X:0,Y:0,群集计数:1。行1010中示出检测动作被设为涂抹。行1012中示出数据被设为森林绿色。
图51是示出具有所选区域1028的森林的图像1020的屏幕截图。此屏幕的布局曾在图42中描述过。屏幕900还包含加载到系统1030中的其他图片的较小“缩略图”。基于光标定位示出鼠标位置和色彩值1022,这在本领域中是常见的。列出图片1020的各层1026。所选区域1028是用户已设为感兴趣地区的、并且将在图52-56中作为已知特征森林来训练的部分。
图52是示出“已知特征训练”向导的“开始”选项卡1110的屏幕截图。训练向导将引导用户通过各步骤来训练所选择的已知特征。在此点,用户将调用以前设立的已知特征并且在一段数字数据上标识该已知特征以训练系统。
图53是示出“已知特征训练”向导的“已知特征”选项卡1110的屏幕截图。有示出第一数据存储的列表1120。该列表包含已知特征水面1124和已知特征森林1122。水面和森林两者都设立在“创建或编辑已知特征”向导中。在此示例中,选择森林1122。如果打开了多个数据存储,则用户可选取训练多个数据存储中的已知特征。
图54是示出“已知特征训练”向导的“方法”选项卡1110的屏幕截图。训练方法的四个选项旁有一系列单选按钮:区域训练1130、不训练1132、绝对调整训练1134或相对调整训练1136。在此点,用户选择对于所选形态、子形态和样品质量最佳的训练方法。
图55是示出“已知特征训练”向导的“概述”选项卡1110的屏幕截图。该表包含已知特征1140的数目,其在此示例中为1。在此示例中,训练方法为区域训练,参见行1142。
图56是示出训练结果的屏幕截图。在用户选择图55中的完成按钮后,该数据存储根据用户的选择被训练。表1210示出结果。所选数据存储为“SyntelliBase1”(应用指派给数据存储并可由用户修改的默认名称),被训练的已知特征为森林,并且找到的新数据模式的数目为30,150。找到的新数据路径的数目为0。找到的已更新数据模式的数目为0。用户可选择不查看结果概述。
新模式和已更新模式是作为使用以上在图23-33中所示的过程对图51中的图像的所选区域中的像素值执行以上在图39中选择的算法的结果而生成的。对于每个像素的诸算法值都被计算出来并作为集合采纳;那些值生成与该网络中的已知特征相关联的数据模式。在该图像的所选区域内,实际区域可能包含树木、灌木以及其他植被的分类。所找到的30,150个模式反映了来自这些不同材料的算法值,并且所有这些模式都与已知特征“森林”相关联。
图57是示出有森林区域和水面区域的图像的屏幕截图。森林由较亮的阴影区域表示,而水面由较暗的阴影区域表示。图57与图51相关,因为加载了相同的图片。然而,现在选择了不同的图片1252。图片1252示出选择了森林的区域,所选区域用黑色线条示出。这是用户已定义的区域,在此示例中,作为已知将成为已知特征“森林”的区域。
图58是示出训练图57中所选区域的结果的屏幕截图。该训练事件添加了8,273个新数据模式并更新了2,301个数据路径。
对此图像的训练过程使用图23-33中示出的过程对图57中的图像的所选区域生成诸模式。以前有2,301个模式与该已知特征相关联,并且这些关联被更新了。以前有8,273个数据模式未与该已知特征相关联,而这些关联被创建了。
图59是示出“已知特征处理”向导的“开始”选项卡1310的屏幕截图,其引导用户通过此应用中的各步骤来处理所选择的已知特征。该向导允许用户使用以前训练过的已知特征来处理一段新的数字数据以确定该已知特征是否存在。
图60是示出“已知特征处理”向导的“已知特征”选项卡1310的屏幕截图。表1320示出包含训练数据的全部数据存储。在此示例中,行1322中示出的SyntelliBase1是可用的。用户可检查或不检查该特定数据存储内用户想标识的任何或全部列出的已知特征。在此示例中,选择了森林。
图61是示出“已知特征处理”向导的“有效性”选项卡1310的屏幕截图。用户可任选地忽略有效性处理选项。选项按钮1330允许标识对于具体数据点已训练过的任何已知特征,而选项按钮1332标识最经常训练的已知特征。在某些情形中,可在任何给定数据点标识多个已知特征。第一选项允许所有那些已知特征都被标识。第二选项只允许最经常与给定数据模式相关联的特征被标识。
图62是示出“已知特征处理”向导的“训练计数”选项卡1310的屏幕截图。用户可任选地忽略用于处理的训练计数值。示为滑动标度1340的阈值值是已知特征在将被标识的训练期间必须与突触路径相关联的最少次数。示为滑动标度1342的极限值是已知特征在将被标识的训练期间可与突触路径相关联的最多次数。
图63是示出“已知特征处理”向导的“群集范围”选项卡1310的屏幕截图。用户可任选地忽略群集范围值。组合框1350允许用户选择特定维度。在两维图像中,组合框1350可包含X维和Y维。在滑动标度1352上选择维度值。在滑动标度1354上选择群集计数。
图64是示出“已知特征处理”向导的“概述”选项卡1310的屏幕截图。值包括已知特征的数目1360、阈值超控1362、极限超控1364、有效性超控1366以及群集范围超控1368。
图65是示出处理结果概述的屏幕截图。处理结果概述示出遭遇已知特征森林的31,556个模式中有一个或以上发生了131,656次,并且执行了涂抹一个或以上像素涂抹森林绿色的已知特征动作。这些数据模式是使用以上对图34讨论的过程并使用图39中用户选择的算法来生成的。这些算法是,并且必须是在以上图56和58中用于训练的相同算法。当相同的算法组被执行并且返回相同的一组值时,就产生与训练中产生的一样的数据模式,并且与该数据模式相关联的已知特征被标识。在图65的处理中,有131,656个像素被标识为已知特征“森林”,因为产生的31,556个数据模式匹配与该已知特征相关联的数据模式。用于标识出的已知特征森林的层被添加到该图像中。这进一步在图66中示出。
图67是示出处理结果的屏幕截图。图像1420包含131,656个应被涂抹为森林绿色的像素,因为它们在处理中被标识为森林。
图68是示出第二图像的处理的屏幕截图,再次寻找已知特征森林。在该处理中使用的数据存储1402是SyntelliBase1。使用总共17,999个数据模式,已知特征森林1404被找到89,818次。已知特征动作1406会将森林涂抹为“森林绿色”。因为这些图像是黑白的,会被涂抹为森林绿色的像素打印成黑色。
图69是示出有已知特征森林层的图像1430的屏幕截图,该已知特征森林层显示应用已标识为森林的像素。该图像中森林绿色的实心块示出训练在图57中所选区域上发生的区域。该区域完全被标识为森林,因为用户选择了该区域并向应用指示该区域为森林。
图70是示出复合图像的屏幕截图,该复合图像包含原始图像图57和图69中示出的应用标识出森林的层。
图71是示出有所选水面区域的图像1450的屏幕截图。
图72是示出将图71中的选择训练为已知特征水面的结果的屏幕截图。该选择的训练添加了1个数据模式。在图71中,在所选区域中的像素是统一的。当对所选区域中的像素执行以上图34中选择的算法时,单个数据模式就是结果。
图73是示出对于某图像的森林和水面两者已知特征的处理的屏幕截图。通过选择森林和水面两者(1512),用户要求系统在处理期间标识出这两个特征。
图74是示出用户为处理图71中图像已提供或已选择值的概述的屏幕截图。在此示例中,行1522中示出所选择的已知特征的数目为2。行1524中示出阈值超控为0。行1526中示出极限超控为100,000。行1528中示出有效性超控为使用为TDE训练过的任何已知特征。行1530中示出群集范围超控被设为X:0,Y:0,群集计数:0。
图75是示出图74中处理设置的概述的屏幕截图。在此图像中,行1542中示出使用的数据存储为SyntelliBase1。行1544中示出使用被训练成森林的17,999个数据模式,已知特征森林被找到89,818次。行1546中示出已知特征动作会将标识出的像素涂抹为森林绿色。行1548中示出使用被训练成水面的1个数据模式,已知特征水面被找到45,467次。行1550中示出已知特征动作会将标识出的像素涂抹为蓝色。在一个实施例中,系统不会移除以前指定的全部数据,而实际上是其每次处理时都处理“全部”数据。
图76是示出在该图像中找到的水面层的屏幕截图。图像1570示出找出为水面并涂抹为蓝色的像素;然而在这些图像中,水面表示为黑条纹。
图77是示出显示原始图像、水面和森林的复合图像的屏幕截图。图像1580示出水面被标识成蓝色的区域和森林被标识成森林绿色的区域。在此图像中,示出水面、黑色森林区域和未被标识的白色斑点之间的对比。应注意区域1590并未被标记为水面。该区域在原始图像76中出现为水面,但处理系统已检测到指示其不是像该图像的其余部分那样的水面的特性。其很可能是浅水或岸线区域。
在未示出的一个实施例中,任何显示出来的未被标识的反常(以前被训练过的特征)都被涂抹以将它们与已训练特征区别开来。
在再一个实施例中,视觉或听觉警报可以是与已知特征相关联的功能。由此,在数据组的分析期间,如果找到以前已知的特征就会触发警报。
图78是根据本发明实施例形成的对禽流感病毒进行数据分析和检测的系统1700的框图。在一个示例实施例中,系统1700包括存储器1710、存储在存储器1710中的数据存储1712,其包含在对应于已知包含在一个示例实施例中为H5N1菌株的禽流感病毒的第一生物样品一方面的第一数据组上处理的第一系列算法的处理结果。系统1700还包括用户接口1714、与用户接口和存储器1710进行数据通信的处理器1722、以及存储在存储器1710中并可由处理器1722执行的软件模块1724。在示例实施例中,用户接口1714包括显示器1716、键盘1718以及诸如计算机鼠标等的定点设备1720。然而,在其他实施例中,用户接口可包括比图示中那些更少或更多的组件。在一个示例实施例中,系统1700被构成并以与关于图1和2描述的系统类似的方式起作用。
在示例实施例中,软件模块1724包括第一组件,其被配置成在对应于第二生物样品一方面的第二数据组上运行第二系列算法以生成算法值高速缓存。软件模块还包括被配置成将算法值高速缓存与第一系列算法的处理结果进行比较以生成匹配结果的第二组件,以及被配置成基于所生成的匹配结果执行处理动作的第三组件。在示例实施例中,第一系列算法和第二系列算法包括关于与图23-33关联描述的示例提及的诸算法中的至少一个,和/或对禽流感病毒的特征标识以与关于图34描述的示例类似的方式执行。
在示例实施例中,第一和第二数据组分别对应于第一和第二生物样品的数字照片。第一和第二生物样品可包括例如血液样品、泪腺液样品、唾液样品、排泄物样品、口腔液样品、顶泌液样品、汗腺液样品、或粘液样品中的至少一种。在示例实施例中,数字照片是以放大级别拍摄的并且具有允许与禽流感病毒传染相关联的细胞变异被观察到的分辨率。还可在其他放大级别和分辨率——诸如在例如允许禽流感病毒成分被观察到的放大级别和分辨率级别——拍摄其他照片。在示例实施例中,第一和/或第二生物样品来自禽类。在另一示例实施例中,第一和/或第二生物样品来自人类。
系统1700还可任选地包括具有与存储器1710进行数据通信的数字成像组件1726的显微镜1721。在其他实施例中,数字成像组件1726是与处理器1722而非与存储器1710进行数据通信。系统1700还可任选地包括有线网络接口1728和/或无线网络接口1730,用于通过有线或无线网络(未示出)与远程用户或服务器(未示出)进行通信。网络接口1728、1730在某些实施例中用于将测试结果传送给现场技术员、病理学家、和/或专门的政府或政府间机构。在示例实施例中,系统1700是便携式系统。
尽管出于清楚而未示出,但在某些实施例中,处理器1722包括被配置成标识对应于第二生物样品一方面的第二数据组中的禽流感病毒,该组件包括第一、第二、和第三子组件。在示例实施例中,第一子组件被配置成通过在第二数据组上运行第二系列算法为第二数据组生成算法值高速缓存。第二子组件被配置成通过将所生成的算法值高速缓存与在第一数据组上处理的第一系列算法的结果进行比较来生成匹配结果。第三子组件被配置成基于所生成的匹配结果来执行处理动作。
虽然出于清楚而未示出,但在示例实施例中,被配置成生成算法值高速缓存的第一子组件包括第一、第二、第三、和第四子单元。第一子单元被配置成检索第二数据组中的第一目标数据元素。第二子单元被配置成在检索到的第一目标数据元素的目标数据区域上处理第二系列算法。第三子单元被配置成指导第一子单元和第二子单元检索第二数据组中的附加目标数据元素并在检索到的附加目标数据元素的目标数据区域上处理第二系列算法。第四子单元被配置成存储处理过的第二系列算法的结果以生成算法值高速缓存。
在示例实施例中,第一数据组是通过与较早关于图3-15展示的方法类似的方式训练系统1700来创建的。通过使用以某些方式诸如通过放大生物样品并且拍摄经放大样品的数字图像感测到的第一生物样品(未示出)来训练该系统。在示例实施例中,拍摄第一生物样品的数字图像,并且通过使用户将被病毒感染的细胞和/或病毒成分标识为要使用在该数字图像上运行的算法来训练的特征来训练该系统,以生成突触网络。生成的突触网络随后被存储在数据存储1712中。
在突触网络已作为第一数据组被存储在数据存储1712中之后,对应于第二生物样品一方面的第二数据组可被系统1700分析,以确定禽流感病毒是否存在于与第二数据组对应的第二生物样品中。第二数据组可用许多不同方式来生成。在示例实施例中,第二数据组是使用第二生物样品的数字图像数据来生成的。使用在第一数据组上处理的第一系列算法的结果来分析第二数据组。在分析第二数据组中,系统1700通过在第二数据组上运行第二系列算法为第二数据组生成算法值高速缓存,并随后通过将生成的算法值高速缓存与在第一数据组上运行的第一系列算法的结果进行比较来生成匹配结果。在示例实施例中,第二系列算法与第一系列算法相同。该系统随后基于所生成的匹配结果来执行处理动作。在示例实施例中,第二生物样品中的禽流感病毒特征的标识是以类似于关于图16-20描述的方式来执行的。
在某些实施例中,处理动作包括通过使用视觉和/或听觉指示器来通知用户有匹配。在其他实施例中,处理动作包括通过有线或无线网络来通知远程用户和/或服务器该匹配结果。处理动作还包括在某些实施例中将匹配结果存储在存储器1710中。如果有线或无线网络不可用于将匹配结果传输到远程用户,所存储的匹配结果在以后有线或无线网络变得可用时被传送给远程用户。其他实施例包括一个或多个传感器(未示出)用于感测与第二生物样品相关的信息,诸如与第二生物样品相关联的条形码或射频标识(RFID)标签。在示例实施例中,处理动作以类似于关于图21和22描述的方式来执行。
在示例实施例中,系统1700是自动化检测系统,其使第二系列算法被预先编程到系统1700中,使得用户不需要通过用户接口1714来选择它们。用户简单地将包含第二生物样品的载玻片插入到显微镜1721的扫描组件(未示出)中,并且系统1700使用数字成像组件1726执行图像捕捉,接着使用第二系列算法执行数据分析,并通过将第二系列算法的结果与数据存储1712中第一系列算法的结果进行比较以获得匹配结果来执行对禽流感病毒存在的特征检测。在示例实施例中,系统1700是手持式系统,如果需要,其允许分析和检测可发生在远程地点,或更易允许在多个地点检测,诸如到某国家的入口点、从某国家的出口点、以及诸如在医院或农场上等其他地点。在一个实施例中,在三个或以上地点中使用检测技术被用于通过在某国家的全部入口或出口港以及在诸如医院或农场等至少一个其他地点中使用检测器来使禽流感传播最小化。
在某些实施例中,第二生物样品在被系统1700处理之前先用一种或多种方法来制备。例如,第二生物样品在某些实施例中被污染了,并在其他实施例中使用一种或多种化学或生物试剂处理过。在一个实施例中,第二生物样品是使用试验片、载玻片、和/或另一可置换的采样方法获得的。示例实施例还包括下列生物采样和检测方法中的至少一种:离子电渗疗法、红外测量、使用高强度光成像、x光成像、磁共振成像、超声波或其他声学成像、以及激光成像。其他实施例包括下列技术中的至少一种来生成第二数据组:后催化剂反应测量、光谱测量、酶促反应、色谱、荧光成像、细胞振动信息、谐振数据、以及气味传感器。
图79是包括H5N1菌株细胞1802的拍摄图像1800。图80是将图像1800根据以上描述的突触网络生成方法处理后生成的图像1804。也已将图像1804与其他病毒细胞(非H5N1菌株细胞)进行过比较。比较结果包括H5N1菌株细胞独有的特征1808(即不包括在其他病毒细胞中)的信息。在彩色显示中,特征1808用独特色彩显示出来以将它们与其他成分区别开来。对应于特征1808的突触网络部分可分开存储并用于以后与其他原始样品的图像进行比较。
尽管例示说明和描述了本发明的优选实施例,但是如以上所提到的,可作出许多修改而不会脱离本发明的精神和范围。例如,取代包括具有数字成像组件的显微镜,可使用其他感测装置来收集对应于第二生物样品一方面的数据。相应地,本发明的范围并不被优选实施例的公开所限定。而是应代之以完全通过参考所附权利要求来确定本发明。

Claims (18)

1.一种用于对第一生物样品中的禽流感病毒进行数据分析和检测的方法,包括:
接收对应于第一生物样品一方面的第一数据组;
使用在对应于已知包含禽流感病毒的第二生物样品一方面的第二数据组上处理的第一系列算法的结果来分析所述第一数据组,其中分析所述第一数据组包括:
通过对所述第一数据组运行第二系列算法生成所述第一数据组的算法值高速缓存;
通过将所述生成的算法值高速缓存与所述第一系列算法的结果进行比较生成匹配结果;以及
基于所述生成的匹配结果执行处理动作。
2.如权利要求1所述的方法,其特征在于,接收第一数据组包括接收对应于第一生物样品以放大级别拍摄的并且具有允许与禽流感病毒传染相关联的细胞变异被观察到的分辨率的数字照片的第一数据组,并且其中分析所述第一数据组包括使用在对应于已知包含禽流感病毒的第二生物样品的数字照片的第二数据组上处理的第一系列算法的结果,其中所述第二生物样品的数字照片具有允许与禽流感病毒传染相关联的细胞变异被观察到的分辨率。
3.如权利要求1所述的方法,其特征在于,接收第一数据组包括接收对应于第一生物样品以放大级别拍摄的并且具有允许禽流感病毒成分被观察到的分辨率的数字照片的第一数据组,并且其中分析所述第一数据组包括使用在对应于已知包含禽流感病毒的第二生物样品的数字照片的第二数据组上处理的第一系列算法的结果,其中所述第二生物样品的数字照片是以放大级别拍摄的并且具有允许禽流感病毒成分被观察到的分辨率。
4.如权利要求1所述的方法,其特征在于,接收对应于第一生物样品一方面的第一数据组包括接收对应于下列各项中至少一项的第一数据组:所述生物样品的数字照片、所述生物样品已用染色剂处理后的生物样品的数字照片、所述生物样品已被暴露于诸如化学或酶试剂等的试剂后的生物样品的数字照片、所述生物样品的x光、使用MRI技术的生物样品的图像、所述生物样品的超声波图像或与所述生物样品相关的谐振信息。
5.如权利要求1所述的方法,其特征在于,所述第二系列算法包括所述第一系列算法,并且其中生成算法值高速缓存包括:
a)检索所述第一数据组中的第一目标数据元素;
b)在所述检索到的第一目标数据元素的目标数据区域上处理所述第二系列算法;
c)对所述第一数据组中的多个目标数据元素重复a)和b);以及
d)存储所述经处理的第二系列算法的结果以生成所述算法值高速缓存。
6.如权利要求1所述的方法,其特征在于,已知所述第二生物样品包含禽流感病毒的H5N1菌株。
7.如权利要求1所述的方法,其特征在于,所述第一生物样品是来自鸟类的生物样品。
8.如权利要求1所述的方法,其特征在于,所述第一生物样品是来自人类的生物样品。
9.如权利要求1所述的方法,其特征在于,所述第一和第二生物样品包括血液样品、泪腺液样品、唾液样品、排泄物样品、口腔液样品、顶泌液样品、汗腺液样品或粘液样品中的至少一种。
10.一种用于对生物样品中的禽流感病毒进行数据分析和检测的系统,包括:
存储器;
存储在所述存储器中的数据存储,其包含在对应于已知包含禽流感病毒的第一生物样品一方面的第一数据组上处理的第一系列算法的处理结果;
用户接口;
与所述用户接口和所述存储器进行数据通信的处理器;以及
用于存储在所述存储器中可由所述处理器操作的软件模块,所述软件模块包括:
第一组件,其被配置成在对应于第二生物样品一方面的第二数据组上运行第二系列算法以生成算法值高速缓存;
第二组件,其被配置成将所述算法值高速缓存与所述第一系列算法的处理结果进行比较以生成匹配结果;以及
第三组件,其被配置成基于所述生成的匹配结果执行处理动作。
11.如权利要求10所述的系统,其特征在于,所述第一和第二数据组分别对应于所述第一和第二生物样品的数字照片,所述数字照片以放大级别拍摄且具有允许与禽流感病毒传染相关联的细胞变异被观察到的分辨率。
12.如权利要求10所述的系统,其特征在于,所述第一和第二数据组分别对应于所述第一和第二生物样品的数字照片,所述数字照片以放大级别拍摄且具有允许禽流感病毒成分被观察到的分辨率。
13.如权利要求10所述的系统,其特征在于,所述系统是进一步包括用于放大所述第二生物样品的显微镜的便携式系统,所述显微镜具有与所述存储器进行数据通信的数字成像组件,用于生成经放大的第二生物样品的数字图像并将所述生成的数字图像作为所述第二数据组存储在所述存储器中。
14.如权利要求10所述的系统,其特征在于,已知所述第一生物样品包含禽流感病毒的H5N1菌株。
15.如权利要求10所述的系统,其特征在于,所述系统包括有线或无线组网组件中的至少一种,并且其中所述软件模块的第三组件被配置成通过有线或无线网络中的至少一种向远程用户或远程服务器中的至少一者发送基于所述生成的匹配结果的信号。
16.如权利要求10所述的系统,其特征在于,所述第一和第二生物样品包括血液样品、泪腺液样品、唾液样品、排泄物样品、口腔液样品、顶泌液样品、汗腺液样品或粘液样品中的至少一种。
17.一种用于对生物样品中的禽流感病毒进行数据分析和检测的系统,包括:
数据存储,其被配置成包含在对应于已知包含禽流感病毒的第一生物样品一方面的第一数据组上处理的第一系列算法的处理结果;
用户接口;以及
与所述数据存储和所述用户接口进行数据通信的处理器,所述处理器包括:
配置成标识对应于第二生物样品一方面的第二数据组中的禽流感病毒的组件,所述组件包括:
第一子组件,其被配置成通过在所述第二数据组上运行第二系列算法为所述第二数据组生成算法值高速缓存;
第二子组件,其被配置成通过将所述生成的算法值高速缓存与在第一数据组上处理的第一系列算法的结果进行比较来生成匹配结果;以及
第三子组件,其被配置成基于所述生成的匹配结果执行处理动作。
18.如权利要求17所述的系统,其特征在于,所述被配置成生成算法值高速缓存的第一子组件包括:
第一子单元,其被配置成检索第二数据组中的第一目标数据元素;
第二子单元,其被配置成在所述检索到的第一目标数据元素的目标数据区域上处理第二系列算法;
第三子单元,其被配置成指导所述第一子单元和所述第二子单元检索所述第二数据组中的附加目标数据元素,并在所述检索到的附加目标数据元素的目标数据区域上处理第二系列算法;以及
第四子单元,其被配置成存储所述经处理的第二系列算法的结果以生成算法值高速缓存。
CNA2007800121998A 2006-02-14 2007-02-14 用于包括禽流感病毒检测的数据分析和特征识别的方法和系统 Pending CN101416192A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US77337706P 2006-02-14 2006-02-14
US60/773,377 2006-02-14
US60/743,711 2006-03-23
US11/674,997 2007-02-14

Publications (1)

Publication Number Publication Date
CN101416192A true CN101416192A (zh) 2009-04-22

Family

ID=40595639

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800121998A Pending CN101416192A (zh) 2006-02-14 2007-02-14 用于包括禽流感病毒检测的数据分析和特征识别的方法和系统

Country Status (1)

Country Link
CN (1) CN101416192A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112420139A (zh) * 2013-07-25 2021-02-26 赛拉诺斯知识产权有限责任公司 用于分布式临床实验室的系统和方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112420139A (zh) * 2013-07-25 2021-02-26 赛拉诺斯知识产权有限责任公司 用于分布式临床实验室的系统和方法

Similar Documents

Publication Publication Date Title
Kotwal et al. Agricultural plant diseases identification: From traditional approach to deep learning
Wäldchen et al. Automated plant species identification—Trends and future directions
Barré et al. LeafNet: A computer vision system for automatic plant species identification
Hecht et al. Automatic identification of building types based on topographic databases–a comparison of different data sources
Perner et al. Mining knowledge for HEp-2 cell image classification
Reddy et al. Analysis of classification algorithms for plant leaf disease detection
US20070195680A1 (en) Methods and system for aggregating and using physical samples and data in a virtual environment
Ruiz et al. Testing for spatial association of qualitative data using symbolic dynamics
US20040076345A1 (en) Method for referencing image data
US20070244844A1 (en) Methods and systems for data analysis and feature recognition
CN105027165A (zh) 用于数字完整载片的自动化评分的基于组织对象的机器学习系统
Nawaz et al. A robust deep learning approach for tomato plant leaf disease localization and classification
CN109791559A (zh) 促进图像作为搜索查询的使用
Rapacciuolo et al. Deriving indicators of biodiversity change from unstructured community‐contributed data
US7492938B2 (en) Methods and systems for creating data samples for data analysis
Braun More accurate less meaningful? A critical physical geographer’s reflection on interpreting remote sensing land-use analyses
Kays et al. Which mammals can be identified from camera traps and crowdsourced photographs?
Prashanthi et al. Plant disease detection using Convolutional neural networks
Sivanandam et al. Tree Detection and Species Classification in a Mixed Species Forest Using Unoccupied Aircraft System (UAS) RGB and Multispectral Imagery
CN112925470B (zh) 交互式电子白板的触摸控制方法、系统和可读介质
Walter et al. Evaluation and optimisation of crowd-based collection of trees from 3D point clouds
Ramamoorthy et al. Reliable and accurate plant leaf disease detection with treatment suggestions using enhanced deep learning techniques
US7844088B2 (en) Methods and systems for data analysis and feature recognition including detection of avian influenza virus
CN101416192A (zh) 用于包括禽流感病毒检测的数据分析和特征识别的方法和系统
CN101421718A (zh) 聚集和使用物理样本

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication