CN114175178A - 动物健康评估 - Google Patents

动物健康评估 Download PDF

Info

Publication number
CN114175178A
CN114175178A CN202080055184.5A CN202080055184A CN114175178A CN 114175178 A CN114175178 A CN 114175178A CN 202080055184 A CN202080055184 A CN 202080055184A CN 114175178 A CN114175178 A CN 114175178A
Authority
CN
China
Prior art keywords
image
animal
interest
stool sample
stool
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080055184.5A
Other languages
English (en)
Inventor
塔拉·考特尼·泽达科
马修·里希特迈尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digg Laboratories
Original Assignee
Digg Laboratories
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digg Laboratories filed Critical Digg Laboratories
Publication of CN114175178A publication Critical patent/CN114175178A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0002Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network
    • A61B5/0004Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network characterised by the type of physiological signal transmitted
    • A61B5/0013Medical image data
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/42Detecting, measuring or recording for evaluating the gastrointestinal, the endocrine or the exocrine systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4836Diagnosis combined with treatment in closed-loop systems or methods
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/30ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to physical therapies or activities, e.g. physiotherapy, acupressure or exercising
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/60ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to nutrition control, e.g. diets
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/70ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mental therapies, e.g. psychological therapy or autogenous training
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B2503/00Evaluating a particular growth phase or type of persons or animals
    • A61B2503/40Animals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Surgery (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Physiology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Data Mining & Analysis (AREA)
  • Psychiatry (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Endocrinology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Geometry (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Nutrition Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Developmental Disabilities (AREA)
  • Social Psychology (AREA)
  • Psychology (AREA)

Abstract

本教导内容总体包括用于使用(例如粪便样本的)图像分析作为生物标本测序的补充、替代或替换来表征动物的健康(例如胃肠健康)的技术。本教导内容还可以包括或替代地包括用于使健康和保健计划(包括但不限于饮食补充剂,诸如基于健康评估的定制配方)个性化的技术,其中这样的健康和保健计划可以基于本文所述的健康表征技术中的一者或多者。本教导内容还可以包括或替代地包括用于例如通过以循环方式执行健康表征和健康计划技术来对动物进行连续照看的技术或计划。还可以或替代地使用本教导内容来创建个性化补充系统(例如,使用个性化补充剂、个性化投配设备和个性化包装)。

Description

动物健康评估
相关申请的交叉引用
本申请要求2019年7月31日提交的美国临时专利申请62/880,836的优先权,其中前述申请的全部内容以引用方式并入本文。
技术领域
本公开总体涉及用于评估动物健康的技术(例如通过分析生物样本的图像)和用于为动物创建个性化系统的技术。
背景技术
动物有超过70%的免疫力依存于胃肠道。这种免疫的重要调节剂是微生物组,即栖息在动物体内的有益和有害的微生物的独特环境。因为每个动物的生命是独特的,所以每个动物的微生物组也倾向于相当独特。这在评估动物健康和确定对动物的治疗或其他处理方法时提出了重大挑战。此外,大多数动物不具有将其健康和疾病传达给照看者的先进机制。因此,照看者经常被迫依赖于诸如饮食、食欲和排便的线索来推断动物的健康状态。
目前,动物健康评估可以包括提交动物粪便的物理样本或与健康、行为、当前饮食和其他种族信息相关的问卷调查响应,然后分析该信息并与参考数据库比较以提供个性化健康计划。这些技术可能需要复杂而且繁琐的步骤,这些步骤通常需要数周(或数月)来处理,这通常是收集可靠的样本并在足够的时间内进行诊断以提供针对特定动物的可行解决办法的主要障碍。
仍然存在对改进动物健康评估的需求。
发明内容
本教导内容总体包括用于使用(例如粪便样本的)图像分析作为生物标本测序的补充、替代或替换来表征动物的健康(例如胃肠健康)的技术。本教导内容还可以包括或替代地包括用于使健康和保健计划(包括但不限于饮食补充剂,诸如基于健康评估的定制配方)个性化的技术,其中这样的健康和保健计划可以基于本文所述的健康表征技术中的一者或多者。本教导内容还可以包括或替代地包括用于例如通过以循环方式执行健康表征和健康计划技术来对动物进行连续照看的技术或计划。还可以或替代地使用本教导内容来创建个性化补充系统(例如,使用个性化补充剂、个性化投配设备和个性化包装)。
在一个方面,本文所公开的分析粪便样本图像以提供动物的健康评估的方法可以包括:接收从包括粪便样本的图像内的一个或多个感兴趣区域计算的该粪便样本的一个或多个特征;使用通过识别粪便的一个或多个基于图像的特征与粪便中的微生物组特性和代谢组特性中的一者或多者之间的多个关联而创建的模型,将粪便样本的该一个或多个特征应用于该模型中的多个关联,以确定粪便样本中的微生物组和代谢组中的一者或多者的状态的可能性;至少基于微生物组和代谢组中的一者或多者的状态的可能性,预测留存该粪便样本的动物的健康特性;以及根据该健康特性来提供治疗。
具体实施可以包括以下特征中的一个或多个。治疗可以包括用于该动物的定制健康计划。定制健康计划可以包括行为改变和饮食改变中的一者或多者。定制健康计划可以包括关于饮食、睡眠、锻炼和活动中的一者或多者的推荐。治疗可以包括食物、补充剂和药物中的一者或多者。治疗可以包括用于动物的个性化饮食补充剂。个性化饮食补充剂可以包括预定量的益生菌、益生元、消化酶、抗炎剂、天然提取物、维生素、矿物质、氨基酸、短链脂肪酸、油和配制剂中的一者或多者。一个或多个特征可以涉及粪便样本的几何属性、颜色属性和质地属性中的至少一者。一个或多个特征可以涉及粪便样本的几何属性、颜色属性和质地属性,并且几何属性可以包括几何性质和与几何形状相关的导出属性中的一者或多者,颜色属性可以包括颜色和与颜色相关的导出属性中的一者或多者,并且质地属性可以包括质地性质和与质地相关的导出属性中的一者或多者。可以使用卷积神经网络(CNN)模型来计算一个或多个特征。该方法还可以包括:接收图像;识别并提取该图像内的一个或多个感兴趣区域以用于进一步分析,该一个或多个感兴趣区域至少包括其中仅具有粪便样本的第一感兴趣区域;以及计算粪便样本的几何属性、颜色属性和质地属性中的至少一者以识别粪便样本的一个或多个特征。该方法还可以包括提供关于动物的包括健康特性的报告。粪便样本的一个或多个特征可以包括颜色、质地、二进制数的数量、面积、周长、圆度、质量、偏心率、长轴、短轴、粘度、稠度、含水量、硬度、范围、等效直径、镜面反射性、相干性、反射率、扩散性和非粪便物质的存在中的至少一者。粪便样本的一个或多个特征可以包括质量,其中该质量是从粪便样本的几何形状和质地属性计算而来的。粪便样本的一个或多个特征可以包括质量,其中该质量是从粪便样本的颜色和导出的颜色向量中的至少一者计算而来的。健康特性可以包括Bristol粪便评分。包括粪便样本的图像可以包括其上具有标记的搁置表面,该标记包括已知尺寸、已知形状和已知颜色中的一者或多者,其中该标记至少部分地用于计算粪便样本的一个或多个特征。该方法还可以包括接收与该图像相关联的元数据,该元数据包括与动物的健康、行为、当前饮食、补充剂、药物、种族信息、品种、体重、粪便样本的重量和动物的大小中的一者或多者相关的问卷调查回答,并且其中该元数据至少部分地用于预测健康特性。
在一个方面,本文所公开的用于分析粪便样本图像以提供动物的健康评估的计算机程序产品可以包括体现在非暂态计算机可读介质中的计算机可执行代码,当在一个或多个计算设备上执行时,该计算机可执行代码执行以下步骤:接收从包括粪便样本的图像内的一个或多个感兴趣区域计算的该粪便样本的一个或多个特征;使用通过识别粪便的一个或多个基于图像的特征与粪便中的微生物组特性和代谢组特性中的一者或多者之间的多个关联而创建的模型,将粪便样本的该一个或多个特征应用于该模型中的多个关联,以确定粪便样本中的微生物组和代谢组中的一者或多者的状态的可能性;至少基于微生物组和代谢组中的一者或多者的状态的可能性,预测留存该粪便样本的动物的健康特性;以及根据该健康特性来提供治疗。
在一个方面,本文所公开的用于分析粪便样本图像以提供动物的健康评估的系统可以包括数据网络、耦接到该数据网络的用户设备,和耦接到该数据网络并且用户设备能够通过该数据网络访问的远程计算资源,该远程计算资源包括处理器和存储器,该存储器存储可由该处理器执行以执行以下步骤的代码:通过该数据网络从用户设备接收包括粪便样本的图像;接收从该图像内的一个或多个感兴趣区域计算的该粪便样本的一个或多个特征;使用通过识别粪便的一个或多个基于图像的特征与粪便中的微生物组特性和代谢组特性中的一者或多者之间的多个关联而创建的模型,将粪便样本的该一个或多个特征应用于该模型中的多个关联,以确定粪便样本中的微生物组和代谢组中的一者或多者的状态的可能性;至少基于微生物组和代谢组中的一者或多者的状态的可能性,预测留存该粪便样本的动物的健康特性;以及根据该健康特性而通过该数据网络向用户设备发送治疗。
在一个方面,本文所公开的分析粪便样本图像以提供动物的健康评估的方法可以包括:接收图像,该图像包括粪便样本;识别并提取该图像内的一个或多个感兴趣区域以用于进一步分析,该一个或多个感兴趣区域至少包括其中仅具有粪便样本的第一感兴趣区域;计算第一感兴趣区域中的几何属性、质地属性和颜色属性中的一者或多者以识别粪便样本的一个或多个特征;以及将模型应用于粪便样本的该一个或多个特征,该模型预测留存该粪便样本的动物的健康特性。
具体实施可以包括以下特征中的一个或多个。该方法还可以包括根据该健康特性来提供治疗。治疗可以包括用于该动物的定制健康计划。定制健康计划可以包括行为改变和饮食改变中的一者或多者。定制健康计划可以包括关于饮食、睡眠、锻炼和活动中的一者或多者的推荐。治疗可以包括食物、补充剂和药物中的一者或多者。治疗可以包括用于动物的个性化饮食补充剂。个性化饮食补充剂可以包括预定量的益生菌、益生元、消化酶、抗炎剂、天然提取物、维生素、矿物质、氨基酸、短链脂肪酸、油和配制剂中的一者或多者。该方法还可以包括根据参考数据库分析粪便样本的一个或多个特征以确定健康特性或治疗中的一者或多者。该参考数据库可以是包括来自其他粪便样本分析的数据的历史数据库。至少一种其他粪便样本可以来自留存所述粪便样本的动物。其他粪便样本可以来自与留存了所述粪便样本的动物不同的动物。该方法还可以包括根据参考数据库分析健康特性以确定治疗。该参考数据库可以是包括来自其他粪便样本分析的数据的历史数据库。该方法还可以包括提供关于动物的包括健康特性的报告。该模型可以包括机器学习模型和概率模型中的一者或多者。该方法还可以包括使用粪便样本的一个或多个特征来训练该模型。该模型可以是推荐引擎的一部分,该推荐引擎被配置为根据健康特性提供对治疗的一个或多个推荐。提取一个或多个感兴趣区域可以包括至少部分地由该模型执行的图像分割。健康特性可以包括Bristol粪便量表上的分类。该分类可以至少部分基于颜色属性。颜色属性可以至少部分地用于确定与粪便样本的一致性相关的属性。该模型可以将权重和评分中的一者或多者应用于该一个或多个特征以预测健康特性。可以为留存粪便样本的动物定制权重和评分。该方法还可以包括对粪便样本进行微生物组DNA基因测序,以及将微生物组DNA基因测序的结果用作预测该动物的健康特性的因素。该方法还可以包括对粪便样本进行代谢组测序,以及将代谢组测序的结果用作预测该动物的健康特性的因素。该方法还可以包括对粪便样本进行进一步分析,包括质谱、电导和流变学中的一者或多者,以及使用该进一步分析的结果作为预测该动物的健康特性的因素。粪便样本的该一个或多个特征可以包括颜色、质地、二进制数的数量、面积、周长、圆度、质量、偏心率、长轴、短轴、粘度、稠度、含水量、硬度、范围、等效直径、镜面反射性、相干性、反射率、扩散性和非粪便物质的存在中的至少一者。粪便样本的该一个或多个特征可以包括质量,其中该质量是从粪便样本的几何形状和质地属性计算而来的。粪便样本的该一个或多个特征可以包括质量,其中该质量是从粪便样本的颜色和导出的颜色向量中的至少一者计算而来的。粪便样本的该一个或多个特征可以包括非粪便物质的存在,其中该非粪便物质包括外来物。外来物可以包括寄生虫和病原体中的一者或多者。计算几何属性可以包括:将第一感兴趣区域转换成灰度;将第一感兴趣区域转换成二进制;以及将一个或多个形态学操作应用于第一感兴趣区域。计算质地属性可以包括使用灰度共生矩阵(GLCM)。GLCM的使用可以包括绘制多个点以识别其聚类。颜色属性可以是红-绿-蓝颜色模型、红-绿-蓝-α颜色模型、色调-饱和度-值颜色模型和CIELAB颜色模型中的一者。可以使用多维颜色平面来计算颜色属性。该图像可以包括元数据。元数据可以包括时间、日期和地理位置中的一者或多者。该方法还可以包括接收与该图像相关联的元数据。该元数据包括与动物的健康、行为、当前饮食、补充剂、药物、种族信息、品种、体重、粪便样本的重量和动物的大小中的一者或多者相关的问卷调查回答。该元数据可以包括对粪便样本的DNA基因测序。该元数据可以包括地理位置信息和生理信息中的一者或多者。该元数据可以包括基本事实属性。该基本事实属性可以包括粪便样本的重量、Bristol粪便评分和手动分割中的一者或多者。该元数据可以包括历史数据。该图像可以存储在远程数据库中。接收该图像可以包括从远程数据库检索该图像。该图像可以包括不同于粪便样本的背景,其中一个或多个感兴趣区域包括其中具有背景的至少一部分的第二感兴趣区域。提取一个或多个感兴趣区域可以包括在图像的至少一部分内识别粪便样本和背景。该方法还可以包括基于仅粪便样本的识别来创建第一感兴趣区域,以及基于粪便样本的一部分和背景的一部分两者的识别来创建第二感兴趣区域。该方法还可以包括对第一感兴趣区域和第二感兴趣区域进行分类以对它们进行单独分析。提取一个或多个感兴趣区域可以包括图像的手动分割。提取一个或多个感兴趣区域可以包括图像的自动分割。自动分割可以包括利用使用深度学习的一个或多个语义分割模型。可以使用基本事实数据作为该一个或多个语义分割模型中的输入,以训练和验证该一个或多个语义分割模型。该一个或多个语义分割模型可以包括u-net网络。该一个或多个语义分割模型可以与数据扩充、k折叠和数据的附加输入中的至少一者一起使用。提取一个或多个感兴趣区域可以包括图像的手动分割和图像的自动分割的组合。该图像可以包括与粪便样本不同的背景。一个或多个感兴趣区域可以包括其中具有背景的至少一部分的第二感兴趣区域。该方法还可以包括将第一感兴趣区域和第二感兴趣区域中的一者或多者归一化以考虑图像可变性,从而创建归一化图像以用于进一步的标准化分析。识别粪便样本的一个或多个特征可以通过分析归一化图像而发生。将一个或多个感兴趣区域归一化可以包括:从第二感兴趣区域提取粪便样本的颜色属性和维度属性;使用所提取的颜色属性和所提取的维度属性计算用于颜色和宽高比的校正因子;以及将该校正因子应用于第一感兴趣区域。第二感兴趣区域中的背景上的标记可以用于提取颜色属性和维度属性中的一者或多者。该标记可以具有已知尺寸和
已知形状中的一者或多者。该标记可以包括一个或多个字母数字字符。该标记可以包括多种颜色。维度属性可以包括长度。将一个或多个感兴趣区域归一化可以考虑在捕获图像时使用的一个或多个图像采集设置。该一个或多个图像采集设置可以包括焦距、颜色设置、照明设置和放大率中的一者或多者。将一个或多个感兴趣区域归一化可以包括调整一个或多个感兴趣区域的大小。背景可以包括其上具有预定标记的搁置表面。
在一个方面,本文所公开的用于分析粪便样本图像以提供动物的健康评估的计算机程序产品可以包括体现在非暂态计算机可读介质中的计算机可执行代码,当在一个或多个计算设备上执行时,该计算机可执行代码执行以下步骤:接收图像,该图像包括粪便样本;识别并提取该图像内的一个或多个感兴趣区域以用于进一步分析,该一个或多个感兴趣区域至少包括其中仅具有粪便样本的第一感兴趣区域;计算第一感兴趣区域中的几何属性、质地属性和颜色属性中的一者或多者以识别粪便样本的一个或多个特征;以及将模型应用于粪便样本的该一个或多个特征,该模型预测留存该粪便样本的动物的健康特性。
在一个方面,本文所公开的用于分析粪便样本图像以提供动物的健康评估的系统可以包括:数据网络;耦接到该数据网络的用户设备;和耦接到该数据网络并且能够由用户设备通过该数据网络访问的远程计算资源,该远程计算资源包括处理器和存储器。存储器可以存储可由处理器执行以执行以下步骤的代码:通过数据网络从用户接收图像,该图像包括粪便样本;识别并提取该图像内的一个或多个感兴趣区域以用于进一步分析,该一个或多个感兴趣区域至少包括其中仅具有粪便样本的第一感兴趣区域;计算第一感兴趣区域中的几何属性、质地属性和颜色属性中的一者或多者以识别粪便样本的一个或多个特征;以及将模型应用于粪便样本的该一个或多个特征,该模型预测留存该粪便样本的动物的健康特性。该代码还可以执行根据健康特性而通过数据网络向用户设备发送治疗的步骤。
在一个方面,如本文所公开的分析图像以提供动物的健康评估的方法可以包括:接收图像,该图像包括该动物的生物样本;识别并提取该图像内的一个或多个感兴趣区域以用于进一步分析,该一个或多个感兴趣区域至少包括其中仅具有生物样本的第一感兴趣区域;计算第一感兴趣区域中的几何属性、质地属性和颜色属性中的一者或多者以识别生物样本的一个或多个特征;以及将模型应用于生物样本的该一个或多个特征,该模型预测作为该生物样本来源的动物的健康特性。
具体实施可以包括以下特征中的一个或多个。生物样本可以包括动物的皮肤、动物的毛皮、动物的嘴的一部分、动物的耳的一部分、动物的眼的一部分和动物的鼻的一部分中的一者或多者。该方法还可以包括根据该健康特性来提供治疗。该治疗可以包括用于动物的个性化产品。个性化产品可以包括食物、补充剂和药物中的一者或多者。个性化产品可以包括美容产品、洗发剂、护发剂、乳液、乳霜、药物、滴耳剂、滴眼剂、局部用物质、牙膏、口腔冲洗剂和咀嚼物中的一者或多者。
在一个方面,如本文所公开的分析生物样本图像以提供动物的健康评估的方法可以包括:接收从包括生物样本的图像内的一个或多个感兴趣区域计算的该生物样本的一个或多个特征;使用通过识别生物样本的一个或多个基于图像的特征与微生物组特性和代谢组特性中的一者或多者之间的多个关联而创建的模型,将生物样本的该一个或多个特征应用于该模型中的多个关联,以确定生物样本中的微生物组和代谢组中的一者或多者的状态的可能性;至少基于微生物组和代谢组中的一者或多者的状态的可能性,预测作为该生物样本来源的动物的健康特性;以及根据该健康特性来提供治疗。生物样本可以包括粪便样本。
在一个方面,本文所公开的为动物配制个性化产品的方法可以包括:接收其中包括生物样本的图像;将模型应用于该图像以提取生物样本的一个或多个特征;以及至少基于从该模型提取的生物样本的一个或多个特征,选择用于作为生物样本来源的动物的个性化产品的一种或多种成分。
具体实施可以包括以下特征中的一个或多个。该方法还可以包括:组合该一种或多种成分以形成个性化产品;包装该个性化产品;以及将该个性化产品分配给该动物和与该动物相关联的用户中的一者或多者。该方法还可以包括为该动物投配个性化产品。个性化产品可以包括个性化饮食产品。个性化饮食产品可以包括食物、补充剂和药物中的一者或多者。个性化饮食产品可以包括预定量的益生菌、益生元、消化酶、抗炎剂、天然提取物、维生素、矿物质、氨基酸、短链脂肪酸、油和配制剂中的一者或多者。个性化产品可以包括美容产品、洗发剂、护发剂、乳液、乳霜、药物、滴耳剂、滴眼剂、局部用物质、牙膏、口腔冲洗剂和咀嚼物中的一者或多者。
在一个方面,本文所公开的个性化产品可以包括对生物样本的一个或多个特征的基于计算机的分析得出的一种或多种成分,该一个或多个特征从应用于包括该生物样本的图像的模型提取得到。该生物样本可以是粪便,其中该个性化产品包括个性化饮食产品。该一种或多种成分可以包括预定量的益生菌、益生元、消化酶、抗炎剂、天然提取物、维生素、矿物质、氨基酸、短链脂肪酸、油和配制剂中的一者或多者。
参考以下描述、示例和所附权利要求,本教导内容的这些和其他特征、方面和优点将变得更容易理解。
附图说明
根据以下对附图所示的特定实施方案的描述,本文所述的设备、系统和方法的前述和其他目的、特征和优点将显而易见。附图不一定是按比例绘制,而是将重点放在示出本文所述的设备、系统和方法的原理上。在附图中,类似的数字通常标识对应的元件。
图1示出了根据代表性实施方案的用于动物健康评估的系统。
图2是示出根据代表性实施方案的用于至少部分地基于生物样本的图像分析来生成动物的定制健康计划的技术的流程图。
图3是根据代表性实施方案的用于至少部分地基于生物样本的图像分析来评估动物健康的方法的流程图。
图4是根据代表性实施方案的用于微生物组DNA基因测序数据的高维空间中的降维的方法的流程图。
图5是示出根据代表性实施方案的具有反馈回路的动态推荐引擎的流程图。
图6是根据代表性实施方案的用于训练模型的方法的流程图。
图7是根据代表性实施方案的用于使用模型提供推荐的方法的流程图。
图8是根据代表性实施方案的分析图像以提供动物的健康评估的方法的流程图。
图9是根据代表性实施方案的分析图像以提供动物的健康评估的方法的流程图。
图10示出了根据代表性实施方案的图像及其各种颜色平面。
图11示出了根据代表性实施方案的图像及其分割。
图12是为动物配制个性化产品的方法的流程图。
具体实施方式
现在将在下文中参考附图更全面地描述实施方案,在附图中示出了优选实施方案。然而,前述内容可以具体表现为多种不同形式,并且不应将其理解为受限于本文所述的图示实施方案。相反,提供这些图示实施方案是为了使本公开将向本领域技术人员传达范围。
本文所提及的所有文献全文以引用方式并入本文。除非另外明确说明或从文字中清楚可见,否则单数形式的物件应被理解为包括复数形式的物件,反之亦然。语法连接词旨在表达所连接的从句、句子、字词等的任何和所有转折性和连接性组合,除非另有说明或从上下文中清楚可见。因此,术语“或”通常应当被理解为意指“和/或”等。
除非本文另有说明,否则本文中对数值范围的叙述不旨在限制,而是单独地指落入该范围内的任何和所有值,并且这种范围内的每个单独值被并入本说明书中,如同它在本文中被单独地叙述一样。当伴随数值时,词语“约”、“大约”等应被解释为指示本领域普通技术人员将理解的偏差,以便令人满意地用于预期目的。类似地,当参考物理特性使用时,诸如“约”、“大约”或“基本上”的近似词应当被理解为预期本领域普通技术人员将理解的偏差范围,以便令人满意地用于相应的用途、功能、目的等。本文提供的值和/或数值的范围仅作为示例,并不构成对所述实施方案的范围的限制。在提供值范围的情况下,除非明确地相反说明,否则它们还旨在包括该范围内的每个值,如同单独地阐述这些值一样。本文提供的任何和所有示例或示例性语言(“例如”、“诸如”等)的使用仅旨在更好地说明实施方案,而不对实施方案的范围施加限制。说明书中的任何语言都不应理解为表示任何不受权利要求书保护的要素是实践实施方案所必需的。
在以下描述中,应当理解,诸如“第一”、“第二”、“顶部”、“底部”、“上”、“下”等术语是方便的词语,并且不应被解释为限制性术语,除非有相反的具体说明。
一般而言,本文所公开的设备、系统和方法总体涉及评估动物健康,包括但不限于胃肠健康。这可以包括但不限于微生物组和/或代谢组评估,以及采用标本图像评估作为微生物组和/或代谢组评估方法(例如传统微生物组和/或代谢组评估方法)的补充和/或替代。本教导内容还可以包括或替代地包括个性化健康系统,包括但不限于个性化消化补充剂、美容品制剂、投配方法和用于运输该健康系统的包装。
在详述本教导内容之前,与更传统的健康评估技术相关的一些背景可能是有帮助的。例如,用于评估胃肠道微生物组的现有技术可以包括用户提供粪便标本和/或与健康、行为、当前饮食和其他种族信息相关的问卷调查回答,然后分析它们并与参考数据库比较以便提供个性化健康计划。这样的一个示例是提供匹配服务的网站,用户在该网站上填写问卷并且可以进行任选的微生物组评估以便实现营养计划的最佳匹配,包括特定的狗粮供应。另一个示例是美国专利9,633,831,该专利以引用方式并入本文。
此外,粪便视觉评估还可以包括诊断评估,诸如美国专利申请公布2017/0303901描述的诊断评估,该文献以引用方式并入本文,并且似乎设想了设置在马桶座上的粪便颜色检测设备。然而,这种技术实现高普及率可能是相当不切实际的。
个性化健康系统和产品的示例包括美国专利申请公布2017/0148348,该文献以引用方式并入本文,并且似乎设想了用于生成个性化补充剂推荐的方法。此外,以引用方式并入本文的美国专利申请公布2017/0156386似乎设想了用于制备营养组合物的系统,其中营养分配器可操作地连接到控制器并且被配置为制备个性化营养组合物。最后,以引用方式并入本文的美国专利8,762,167似乎设想了用于为个体导出个性化健康和健身计划的系统。遗憾的是,这些健康系统可能需要冗长而且耗时的分析,这通常可能花费数周到数月来处理,并且由于一些健康状况的急性性质,从患者参与和诊断/治疗时间线的角度来看,这可能是不可接受的过程。
个性化补充剂通常可以来源于费力、耗时的方法,这对于动物而言可能不够理想。例如,以引用方式并入本文的美国专利申请公开2011/0014351似乎设想了用于提供每日营养补剂充组分方案的计算机实现的方法、设备、系统和包装,包括一系列每日小包。然而,这种技术不能解决给动物喂食补充剂的障碍。不管计算机产生适当配方的能力如何,投配方法应该对于摄入而言是始终理想的。给动物服用药丸可能是顺从性的一个重要障碍。
因此,现有技术可能基本上不能提供相对快速的周转时间来用于与作为健康或疾病的指示物的科学生物标志物关联的消化健康评估,以及将这样的评估转化成强制遵守的个性化解决方案。因此,本文公开了可以利用生物样本的图像(例如,客户提供的粪便样本的图像)的分析作为形成相关动物的健康评估的基础的系统和方法,例如,除了传统的实验室分析和信息收集(诸如问卷调查等)之外或作为其代替。
应当理解,尽管本教导内容可能强调粪便样本的图像的使用和分析,但是本文所讨论的技术也可以或替代地用于分析其他生物材料和/或生理区域的图像。例如,除了粪便的图像之外或代替粪便的图像,以下是可以使用或修改本公开的技术来分析以基于该分析提供健康评估的其他图像的非排他性列表:尿液、呕吐物、胆汁、血液、其他生物排出物、毛发、皮肤、牙齿、牙龈、舌头、鼻子、耳朵、眼睛、四肢(例如,手臂、腿、脚、爪等)、指甲、咽喉、肛门、性器官和/或生殖器官、动物体的其他部分、它们的组合等。此外,本公开的技术可以用于基于异常(例如,生长物诸如肿瘤、皮疹、感染、疤痕等)、损伤、突变等的图像来提供健康评估。因此,如本文所用,“生物样本”将被理解为包括上述一者或多者,以及类似物。
如本文所用,应当理解,本文所用的术语“动物”应一般地指具有专门的感觉器官和神经系统的任何活的(或先前活的)生物体,例如该活的生物体能够响应刺激的情况。动物的示例包括但不限于伴侣动物(例如狗、猫等)、灵长类、人类、蜥蜴和其他动物。例如,本教导内容的一个方面可以由宠物主人用于至少部分地基于对他们宠物的粪便的图像(或宠物的另一种生物特征或排泄物的图像)的分析来获得他们宠物的健康评估。特别地,在本教导内容的一个方面,可以相对快速地获得该图像分析的至少一部分和/或从该图像分析获取的有用信息,例如,在遛狗时,用户可以拍摄粪便样本的图像,将图像上载到基于web的平台,并且几乎实时地获得图像的至少部分分析。
如本文所用,术语“个性化”及其变化形式通常应指已经针对动物或用户特别定制的结果。
如本文所用,术语“问卷调查”通常指来自用户(例如照看者或患者)的任何信息征求,该信息征求可以电子方式记录、物理书写等。“问卷调查”还可以包括或替代地包括来自如本文所定义的术语“动物”的信息征求。这样,以举例的方式,“问卷调查”可以包括来自除了提交用于分析的图像之外的来源的数据征求,例如,地理位置信息、心率信息或其他生理信息(其可以经由可穿戴设备测量或手动测量,例如经由来自经训练的健康助理的听诊器)、饮食或补充剂信息、活动信息、年龄、性别、体重、粪便重量、健康状况和历史、药物、手术、物种或品种等。因此,“问卷调查”还可以包括或替代地包括例如来自医学检查的医疗信息征求。从这种“问卷调查”得到的信息因此可以包括任何前述类型的信息或类似物。还应当理解,从这样的“问卷调查”得到的信息可以作为如本文所用并且在下文定义的术语“元数据”被包括在内,并且问卷调查本身也可以作为元数据被包括在内。
在本教导内容的上下文中,如本文所用,术语“元数据”通常应指在本教导内容中可用的不同于在图像内容的分析中生成的数据的任何数据,例如,与直接从本文所述的图像处理技术导出的数据不同的任何数据。然而,应当理解,元数据可以包括与图像相关联的不同于对其内容的图像分析的信息,例如,日期、时间、文件名、文件类型、文件目录和/或其他存储相关信息、文件源、文件的创建者、文件大小等。
此外,如上所述,从调查问卷到处的信息可以被认为是元数据。此外或替代地,元数据可以包括从实验室分析接收的数据,例如,来自动物的生物样本的实验室分析或动物本身的实验室分析。通常,从实验室分析接收的这种数据将被理解为包括使用定量工具导出的数据和/或包括标准化输出的数据。因此,还应当理解,本文所包括的健康评估技术可以利用图像分析与元数据的组合,诸如基于实验室的分析,包括但不限于微生物组评估、代谢组评估、血样分析、尿液分析、活检、寄生虫学评估等中的一者或多者。然而,在某些实施方案中,图像分析可以代替基于实验室的分析来使用。此外,在这样的方面,图像分析可以用于进行关于传统上保留用于基于实验室的分析的输出的评估,诸如仅基于粪便样本的图像分析来确定某些微生物和/或代谢物的存在或不存在。而且,虽然本说明书的关注点可以包括微生物组和/或代谢组,但是本领域普通技术人员将认识到使用如本文所述的此类图像分析来预测其他健康特性(例如,饮食的不足),并且因此不偏离本教导内容的实质和范围。
如本文所用,术语“属性”一般应指图像伪影(例如,颜色通道、图像中所示的物质的丰度等)。这可以包括图像的内容的可见方面或特性、图像的内容的可测量方面或特性、图像的内容的计算方面或特性,和/或从上述内容或类似物中的任何一者导出的方面或特性中的一者或多者。因此,通常,“属性”可以包括可测量的(例如,根本上可测量的实体)、可计算的和/或以其他方式可通过图像分析导出的事物。举例来说,可在本教导内容的上下文中有用的特定属性可以包括图像内容的几何属性、质地属性和/或颜色属性中的一者或多者,这些属性可以是可计算的或者换句话说可以通过分析图像来辨别。
如本文所用,术语“特征”通常应指本教导内容的模型使用的输入或数据点,例如,其中特征被特别定制以供该模型使用。这样,特征可以包括如上所述的一个或多个属性。然而,应当理解,模型可能不能以某些属性的原始、未编辑、未转译和/或未转换形式来使用它们,因此为了使此类属性成为特征,可能需要进一步动作,诸如编辑、重新格式化、转换等中的一者或多者。对于元数据同样如此:特征可以包括一些元数据,并且/或者元数据可以被操纵或变换以变成要被本教导内容的模型用作输入的特征。这样,特征可以包括原始属性(例如,图像内的像素强度)和/或元数据(例如,捕捉图像的相机的设置)的导出和/或整理以供模型使用。
如本文所述,术语“特征”可以包括其标准字典定义,诸如(有生命的或无生命的)物品的有区别的性质。这样,如本文所用的特征可以与如本文所述的和上文所定义的属性具有某种重叠,不过尽管属性通常是从图像测量、计算和/或以其他方式导出的,但是如本文所用的特征通常可以包括可以独立于任何图像或图像分析而测量、计算和/或以其他方式导出(或者可以采用其他方式存在或已知)的性质。
现在将针对上下文并通过示例来描述本发明的一个方面的高级工作流。首先,用户将来自动物的生物样本的数字图像(例如照片)上传到数据库管理系统,该数据库管理系统然后准备该图像用于分析,该图像例如来自用户宠物的粪便样本的数字照片,该数字照片是利用用户的智能电话拍摄并且经由移动应用程序、电子邮件和/或网站上传的。因此,可以从用户获取图像,并且从数据库管理系统等检索图像。然后该图像可以被传递到图像分析流水线中,该流水线可以包括分析操作,诸如感兴趣区域提取、图像归一化、特征工程和建模阶段中的一者或多者。一个或多个模型可以基于从该图像导出的一个或多个特征来最终预测一个或多个健康指标。
图1示出了根据代表性实施方案的用于动物健康评估的系统。更具体地,系统100可以用于分析粪便样本图像以提供动物的健康评估。总体上,系统100可以包括联网环境,其中数据网络102将多个参与设备和/或用户101以通信关系互连。参与设备可以例如包括任何数量的用户设备110、远程计算资源120和其他资源130。通常,系统100可以用于本文所述的本教导内容的任何具体实施。例如,系统100可以用于分析生物样本103的图像112以提供动物104的健康评估150。更具体地,在系统100中,用户101可以捕获或以其他方式检索与动物104相关的生物样本103的图像103,通过数据网络102将该图像103传输到远程计算资源120用于处理和分析,其中远程计算资源120然后通过数据网络102向用户101提供该分析的输出(例如,健康评估150,该健康评估可以是报告等的形式)。这整个过程可以相对快速地完成,例如,近实时地完成(诸如小于五分钟、小于一分钟或仅几秒)。现在将描述系统100的某些参与者和方面。
用户101可以与动物104和用户设备110相关联。例如,动物104可以包括宠物(例如,狗、猫等),并且用户101可以是宠物的主人、与宠物相同的家庭的成员,或者换句话说与宠物相关联(例如,照看人员、医务人员等)。在一些示例中,用户101本身可以是动物104,即,动物104是人类。用户101还可以包括或替代地包括医学专业人员(例如,医生、兽医、护士等)、研究人员、科学家、实验室技术人员、学生等。在一些示例中,用户101可以不是人类,而是用户101可以包括计算设备、计算机程序等,例如,用户101是包括在非暂态计算机可读介质中体现的计算机可执行代码的计算机程序产品,当在一个或多个计算设备(例如,用户设备110)上执行时,该计算机可执行代码被配置为捕获、创建、编辑、接收和/或传输图像112以用于如本文所述的处理和分析,从而获得健康评估150等。
动物104可以是如本文所述的任何动物,即,具有专门的感觉器官和神经系统的任何活的(或先前活的)生物体。在某些实施方式中,动物104是伴侣动物,诸如狗、猫等。
生物样本103可以与动物104相关。例如,在一个方面,生物样本103包括由动物104排泄的粪便。在生物样本103包括动物104排泄的粪便的方面,生物样本103还可以包括或替代地包括动物104留存的其他物质(除了粪便之外或替代粪便),诸如外来物(例如,咀嚼玩具的一部分)、血液、寄生虫(例如,绦虫和/或其卵/幼虫)、毛发、微生物、代谢物等。因此,在一个方面,生物样本103可以包括粪便和一种或多种其他物质。
生物样本103还可以包括或替代地包括动物104本身的一部分。例如,生物样本103可以包括动物104的生理区域(内部和/或外部)。这样,生物样本103可以包括动物104的皮肤、动物104的毛皮(和/或动物104的毛发)、动物104的嘴巴(例如,牙齿、牙龈、牙斑、舌头、喉咙通道等中的一者或多者)、动物104的耳朵、动物104的眼睛、动物104的鼻子、动物104的喉咙、动物104的四肢(例如,手臂、腿、脚、爪等)、动物104的指甲、动物104的肛门、动物104的性器官和/或生殖器官、动物104的器官、动物104的血管、动物104的肌肉、动物104的关节、动物104的肌腱、动物身体的其他部分等中的一者或多者的至少一部分。此外,生物样本103还可以包括或替代地包括动物104的异常(例如,生长物诸如肿瘤、皮疹、感染、疤痕等)、损伤、突变等。
生物样本103还可以包括或替代地包括其他分泌物、排出物、内部物质等。例如,生物样本103可以包括尿液、呕吐物、胆汁、血液、其他生物排出物等。
因此,如上所述,应当理解,尽管本教导内容可能强调粪便样本的图像112的使用和分析,但是系统100还可以包括或替代地包括具有其他生物材料和/或生理区域的其他生物样本103。
数据网络102可以是适于在系统100的参与者之间传送数据和信息的任何网络或互联网络。这可以包括公共网络诸如互联网、专用网络、电信网络诸如公共交换电话网络或使用第三代(例如,3G或IMT-2000)、第四代(例如,LTE(E-UTRA)或WiMAX-Advanced(IEEE802.16m))、第五代(例如,5G)和/或其他技术的蜂窝网络,以及各种公司区域网或局域网和可以用于在系统100中的参与者之间携带数据的其他交换机、路由器、集线器、网关等中的任何一者。
数据网络102的每个参与者可以包括适当的网络接口,包括例如网络接口卡,该术语在本文被广泛地使用以包括适合于建立和保持有线和/或无线通信的任何硬件(连同用于控制其操作的软件、固件等)。网络接口卡可以包括但不限于有线以太网网络接口卡(“NIC”)、无线802.11联网卡、无线802.11USB设备,或用于有线或无线局域联网的其他硬件。网络接口还可以包括或替代地包括蜂窝网络硬件、广域无线网络硬件,或用于集中式、自组织、对等或其他可用于连接到网络和携带数据的无线电通信的任何其他硬件。在另一方面,网络接口可以包括用于直接连接到本地计算设备诸如台式计算机的串行或USB端口,该本地计算设备继而提供到数据网络102的更一般的网络连接。
用户设备110可以包括系统100内的由一个或多个用户101操作以用于实践如本文所设想的技术的任何设备。用户设备110因此可以耦接到数据网络102。具体地,用户设备110可以包括用于捕获图像112(例如,照片)或者以其他方式创建、准备、编辑或接收图像112并且(例如,通过数据网络102)传输图像112以用于分析的任何设备。为此,用户设备110可以包括相机114等,或者用户设备110可以采用其他方式与相机114等通信。在优选的具体实施中,用户设备110包括具有内部相机114、处理能力和对数据网络102的接入(所有这些都在一个设备中)的智能电话等。用户设备110还可以包括或替代地包括用于通过数据网络102接收图像112的分析的输出(例如,在其图形用户界面116上显示这样的输出)的任何设备。类似地,用户设备110可以包括用于创建、准备、编辑、接收和/或发送(例如,通过数据网络102)系统100中的其他数据或文件的任何设备,该其他数据或文件诸如与图像112、动物104、用户101等相关的元数据118。用户设备110还可以包括或替代地包括用于管理、监测或以其他方式与包括在本文所设想的系统和技术中的工具、平台和设备交互的任何设备。用户设备110可以耦接到数据网络102,例如用于与系统100中的一个或多个其他参与者交互。还应当理解,本文所述的系统100的功能的全部或部分可以在不连接到数据网络102的情况下在用户设备110(或系统100的另一部件)上执行,例如,可以利用智能电话上的封闭网络原生应用程序,由此功能(例如,本文所述的模型128中的一个或多个)可以在封闭环境中运行。
又如,用户设备110可以包括可以参与如本文所设想的系统100的一个或多个台式计算机、膝上型计算机、网络计算机、平板电脑、移动设备、便携式数字助理、消息传送设备、蜂窝电话、智能电话、便携式媒体或娱乐设备或任何其他计算设备。如上所述,用户设备110可以包括可以用于与联网系统100交互的任何形式的移动设备,诸如任何无线的、电池供电的设备。还应当理解,用户设备110之一可以在相关功能(例如,执行图像112的处理和/或分析等)由诸如远程计算资源120或其他资源130之一的另一实体执行时协调这些功能。
每个用户设备110通常可以提供用户界面116。用户界面116可以由用户设备110之一上的从例如远程计算资源120或其他资源130接收数据的本地执行的应用程序维护。在其他实施方案中,用户界面116可以被远程提供并呈现在用户设备110之一上,诸如在远程计算资源120或其他资源130包括web服务器的情况下,该web服务器通过可以在用户设备110之一上执行的web浏览器或类似客户端内显示的一个或多个网页等来提供信息。用户界面116通常可以在用户设备110之一的显示设备上创建用于用户交互的适当的视觉呈现,并且用于接收任何适当形式的用户输入,包括例如来自键盘、鼠标、触摸板、触摸屏、手势或其他使用输入设备的输入。
远程计算资源120可以包括处理器122和存储器124或者以其他方式与该处理器和存储器通信,其中存储器124存储可由处理器122执行以执行本教导内容的各种技术的代码。更具体地,远程计算资源120可以耦接到数据网络102并且可由用户设备110通过数据网络102访问,其中远程计算资源120包括处理器122和存储器124,其中存储器124存储可由处理器122执行以执行根据本教导内容的方法(诸如本文所述的方法或技术中的任一个)的步骤的代码。
远程计算资源120还可以包括或替代地包括数据存储装置、网络接口和/或其他处理电路。在以下描述中,在描述远程计算资源120的功能或配置的情况下,这旨在包括远程计算资源120的处理器122的或与远程计算资源120通信的对应功能或配置(例如,通过编程)。通常,远程计算资源120(或其处理器122或与其通信的处理器)可以执行与分析生物样本103的图像112相关的各种处理任务,以提供如本文所讨论的与生物样本103相关的动物104的健康评估。例如,远程计算资源120可以管理从用户设备110中的一个或多个接收的信息(例如,图像112、元数据118等),并且提供相关的支持功能,诸如图像112的解析或分割以用于分析,图像112的归一化,执行计算,识别并提取图像112的各种性质和属性,计算图像112的内容的特征,将一个或多个模型128和/或算法应用于图像112和/或元数据118,从数据库140和/或存储器124检索和/或分析信息,提供健康评估150,与系统100中的其他资源130和参与者通信,存储数据等。远程计算资源120还可以包括或替代地包括对用户101在用户设备110中的一个或多个处执行的动作做出反应的后端算法。这些后端算法还可以或替代地位于系统100中的其他位置。
远程计算资源120还可以包括或替代地包括web服务器或类似的前端,其促进用户设备110对系统100的远程计算资源120或其他部件的能力的基于web的访问。远程计算资源120还可以或替代地与其他资源130通信,以便获得用于通过用户设备110上的用户界面116提供给用户101的信息。在用户101指定用于分析或其他的特定标准的情况下,该信息可以由远程计算资源120(以及任何相关联的算法)用来访问其他资源130。在这种情况下,可以有用地执行附加处理,诸如推荐某些分析和处理操作和技术。
远程计算资源120还可以或替代地维护数据142的数据库140,或者以其他方式与该数据库通信,并且可选地与用户设备110处的用户101的接口通信以利用这样的数据库140的数据142。因此,在一个方面,远程计算资源120可以包括数据142的数据库140,并且远程计算资源120可以充当提供用于选择和使用这样的数据142和/或提供与该数据相关的支持服务的平台的服务器。数据库140可以是远程计算资源120的本地数据库,或者是远程计算资源120或系统100中的另一参与者的远程数据库。因此,数据库140可以包括基于云的数据库等。
远程计算资源120还可以或替代地被配置为管理对特定内容(例如,针对特定用户101)的访问。在一个方面中,远程计算资源120可以根据来自用户101的输入来管理用户设备110对系统100的部件的访问。
因此,并且如贯穿本公开所述,耦接到数据网络102并且可由用户设备110通过数据网络102访问的远程计算资源120可以包括处理器122和存储器124,其中存储器124存储可由处理器122执行以执行以下步骤的代码:通过数据网络102从用户101接收图像112,图像112包括可以是粪便样本形式的生物样本103;识别并提取图像112内的一个或多个感兴趣区域以用于进一步分析,该一个或多个感兴趣区域至少包括其中仅具有粪便样本的第一感兴趣区域;计算一个或多个属性,包括但不限于第一感兴趣区域中的几何属性、质地属性和/或颜色属性,以识别粪便样本的一个或多个特征;以及将模型128应用于粪便样本的该一个或多个特征,模型128预测留存该粪便样本的动物104的健康特性152。该代码还可以执行根据健康特性152(例如以报告或健康评估150的另一形式)通过数据网络102向用户设备110发送治疗154的步骤。
存储在系统100的数据库140中的数据142可以包括供远程计算资源120用来提供健康评估150的参考信息。例如,该数据142可以包括历史数据,诸如来自一个或多个生物样本103(例如,来自相同动物104或不同动物)的分析的信息。数据142还可以包括或替代地包括例如用于由远程计算资源120或另一参与者检索和使用以用于处理和分析图像112或其他信息来生成健康评估150的一个或多个模型128。数据142还可以包括或替代地包括多个图像112(例如,相同或不同生物样本103的图像,来自相同动物104或不同动物等)。数据142还可以包括或替代地包括生物样本103的一个或多个基于图像的特征与微生物组存在和/或特征、代谢组存在和/或特征、健康特性、饮食特征等中的一者或多者之间的多个相关性和/或关联。
如本文所讨论的,本教导内容的系统100和技术可以包括和利用被配置和编程为执行某些任务以辅助本文所述的各种分析的一个或多个模型128。作为示例,解析所接收或检索的图像112以进行分析可涉及分割图像112,这可至少部分地由特定分割模型(例如深度学习模型)执行。该分割模型可以读入图像112并且标记图像112中的特定类别(例如,用于生物样本103的类别和用于背景的类别),其中,可以因为正确地识别某些像素来对该分割模型进行加分,并且当分割模型不正确地识别某些像素时对该分割模型进行罚分。因此,分割模型可以被配置为从图像112提取背景,以仅分析包含在图像112内的生物样本103。分割模型还可以或替代地将图像112内的内容的一个或多个属性归一化、将图像112内的内容的一个或多个颜色平面归一化、考虑照明或其他条件等。
模型128还可以包括或替代地包括几何模型(例如模型128),其被专门地配置和编程为识别和确定(例如,计算)图像112内的内容的几何特征,例如,几何特征包括但不限于形态学区域性质,这可以包括连续像素区域、周界、长轴/短轴等中的一者或多者。这种几何模型可以包括诸如随机森林的机器学习模型。这些模型可以可选地使用网格搜索例程、根据优化的超参数来训练,这可以具有有利的准确度。这种几何模型还可以包括或替代地包括其他机器学习模型,包括但不限于k最近邻、支持向量机、逻辑回归、决策树(其可以是梯度提升的和/或在整体架构中组合的)、朴素贝叶斯、多层感知等中的一者或多者。
模型128还可以包括或替代地包括颜色模型(例如模型128),其被专门地配置和编程为识别和确定图像112内的内容的颜色,或其他与颜色相关的属性和/或特征。这种颜色模型可以包括例如具有套索校正等的多线性模型。颜色模型的输出可以包括颜色索引,颜色索引可以是色轮、图像112的一部分内的颜色的列表、顶部颜色平面的总和等的形式。颜色模型的输出还可以包括或替代地包括Bristol粪便评分等的预测,其可以用作用于制定治疗154和/或健康评估150的健康特性152。
此外,或替代地,在本教导内容中可以利用k均值图像分割,其中创建伪颜色平面(例如,具体地用于本教导内容),这可以允许本教导内容识别和确定图像中的前“n”个最丰富的颜色。这还可以允许或替代地允许本教导内容识别和确定图像内的颜色均匀性。
监督机器学习可以找到数据(例如,特征向量X)和对应标签(y,其可以是分类的或连续的标签)之间的关联,使得计算机可以学习将输入映射到输出的算法f(例如,y=f(X))。另外两个子组可以包括分类和回归问题,其中监督机器学习模型被训练以分别预测分类数据(例如,从图像预测Bristol粪便评分)和连续数据(例如,从图像预测质量)。模型的一些示例包括:支持向量机、随机梯度下降、k最近邻、决策树、神经网络等,其中在例如以下网址可以找到更详细的列表:https://scikit-learn.org/stable/supervised_learning.html#supervised-learning。
无监督机器学习可以假定与监督机器学习类似的结构,不同的是可以不使用训练标签y。这些模型可以尝试学习数据的底层结构或分布以学习关于其行为的更多信息。这些任务的一些示例是聚类(例如,微生物组工作的主分量分析(PCA))和关联(例如,关联规则学习的关联算法)。在例如以下网址可以找到更详细的列表:https://scikit-learn.org/stable/unsupervised_learning.html。
当专业人员馈入经标记的训练数据的部分列表时,可以发生半监督方法。这通常由于使用经标记的数据而增加了准确性,但允许专业人员将代价最小化(例如,收集经标记的数据所耗费的时间和金钱)。在例如以下网址可以找到更详细的列表:https://scikit-learn.org/stable/modules/label_propagation.html。
迁移学习可以包括利用已经在显著更多的图像上训练的开源模型的技术。例如,Inception已在1.4M的图像上训练,并且是为人熟知的用于分类任务的网络。根据本教导内容,可以通过在Inception的适当层之后附加自定义深度神经网络来将模型权重朝着自定义分类任务调节来使模型和/或模型权重适配用于自定义任务。
一般而言,模型128可以包括计算机视觉模型(例如,其中这样的计算机视觉模型使用语义分割来检测图像112内的感兴趣区域)、U-Net分割模型、机器学习模型(例如,通过生物样本103的几何特征和颜色特征来预测动物104的健康)、迁移学习模型(例如,其中权重从在现有模型诸如VGG-16模型中训练的网络适配,即,在对一千万个图像进行分类时训练的)、相关模型、深度学习模型等中的一者或多者。
其他资源130可以包括可以在如本文所述的设备、系统和方法中有用地采用的任何资源。例如,这些其他资源130可以包括但不限于其他数据网络、人类参与者(例如,程序员、研究者、注释者、编辑、分析员等)、传感器(例如,音频或视觉传感器)、数据挖掘工具、计算工具、数据监测工具、算法等。其他资源130还可以包括或替代地包括可以在如本文所设想的联网应用中有用地采用的任何其他软件或硬件资源。例如,其他资源130可以包括用于授权针对访问、内容或选项/功能购买等的支付的支付处理服务器或平台。在另一方面,其他资源130可以包括证书服务器或用于身份的第三方验证、数据的加密或解密等的其他安全资源。在另一方面,其他资源130可以包括与用户设备110或远程计算资源120中的一者共处一地(例如,在与之相同的局域网上,或者通过串行或USB电缆直接与其耦接)的台式计算机等。在这种情况下,其他资源110可以为用户设备110和/或远程计算资源120提供补充功能。其他资源130还可以包括或替代地包括补充资源,诸如相机、扫描仪、打印机、输入设备等。
其他资源130还可以包括或替代地包括一个或多个web服务器,这些web服务器提供去往和来自系统100中的任何其他参与者的基于web的访问。虽然被描绘为单独的网络实体,但是将容易地理解,其他资源130(例如,web服务器)还可以或替代地在逻辑上和/或物理上与本文所述的其他设备之一相关联,并且可以例如包括或提供用于以允许用户例如从用户设备110通过数据网络102交互的方式对远程计算资源120或数据库140进行web访问的用户界面。
应当理解,系统100中的参与者可以包括执行如本文所述的各种功能的任何硬件或软件。例如,用户设备110和其他资源130中的一者或多者可以包括存储器124和处理器122。
上述联网系统100的各种部件可以被布置和配置为以各种方式支持本文所述的技术、过程和方法。例如,在一个方面,用户设备110通过数据网络102连接到服务器(例如,该服务器是远程计算资源120或其他资源130中的一者或多者的一部分),该服务器执行与分析图像112以提供与存在于图像112中的生物样本103相关联的动物104的健康评估150相关的各种处理任务。例如,远程计算资源120可以包括托管网站(和/或移动应用程序或应用程序编程接口)的服务器,该网站运行用于分析和/或处理图像112和其他数据的平台。更具体地,与用户设备110相关联并且具有使用系统100的适当权限的用户101可以使用用户设备110来通过数据网络102向远程计算资源120发送图像112和/或元数据118。远程计算资源120可以通过数据网络102从用户101接收图像112以用于对该图像进行处理和分析,其中该处理和分析的输出可以包括健康评估150。
健康评估150可以包括关于动物104的健康特性152的预测。这种健康特性152可以包括Bristol粪便量表(即,设计为将粪便分类到某些组以用于健康确定的标准量表)上的分类、体重、动物104可能患病还是健康、饮食见解等中的一者或多者。健康评估150还可以包括或替代地包括针对动物104的治疗154处方和/或推荐。这样的治疗154推荐可以包括定制的健康计划、食物、补充剂(例如,个性化饮食补充剂)、药物等中的一者或多者。健康评估150可以采用报告等的形式呈现或传输给用户101。应当理解,一般而言并且除非另有说明,本文所述的“报告”可以包括本教导内容中执行的一种或多种分析的结果的任何分配。
例如,作为健康评估150和/或治疗154的一部分,技术可以涉及创建用于动物104的个性化产品156,并且因此系统100可以包括个性化产品156和/或相关部件,诸如包装、容器、投配仪器等。个性化产品156可以包括对生物样本103的一个或多个特征的基于计算机的分析得出的一种或多种成分,该一个或多个特征从应用于包括生物样本103的图像112的模型128提取得到。如本文所述,生物样本103可以包括粪便,并且在此类情况下(和/或在生物样本不是粪便的其他情况下),个性化产品156可以包括个性化饮食产品。这样,个性化产品156的一种或多种成分可以包括预定量的益生菌、益生元、消化酶、抗炎剂、天然提取物、维生素、矿物质、氨基酸、短链脂肪酸、油、配制剂等中的一者或多者。个性化产品156还可以包括或替代地包括如本文另外描述的任何成分。
在一个方面,本教导内容的许多技术由远程计算资源120执行。例如,远程计算资源120可以包括由计算机可执行代码配置为分析图像112和元数据118的分析引擎(或者换句话说处理器122)、由计算机可执行代码配置为提供针对动物104的推荐的推荐引擎(或者换句话说处理器122)等。然而,应当理解,参考远程计算资源120描述的一些特征和功能性还可以或替代地由系统100中的另一参与者执行。
图2是示出根据代表性实施方案的用于至少部分地基于生物样本的图像分析来生成动物的定制健康计划的技术的流程图。如图所示,输入201可以包括但不限于来自动物的生物样本203、生物样本203的图像212和元数据218。例如,这些输入201可以包括粪便样本形式的生物样本203、数字文件形式的粪便样本的图像212,以及实验室数据和/或问卷调查回答形式的元数据218,该问卷调查回答可以与健康、行为、当前饮食、其他种族信息等相关。
然后可以如该图的分析202部分所示分析相应输入201。分析202可以包括实验室分析211(例如,代谢组和/或微生物组分析,其可以包括提取、扩增、测序及其后续分析)、所提供的图像212的图像分析213和/或元数据218的数据分析202等。对于每个输入201,可以将分析数据与参考数据库进行比较。
输出250可以包括但不限于关于动物的健康特性252的预测、结果与最终用户共享的报告251,和治疗254。例如,健康特性252和报告251中的一者或多者可以用于创建治疗254,诸如定制的健康计划,该计划可以包括但不限于包括对个性化饮食补充剂的推荐以及对健康的其他方面的推荐,诸如对动物的饮食、睡眠、锻炼、活动和其他生活方式推荐。因此,输出250可以包括分析/评估的共享结果和从这些结果创建的用于动物的个性化解决方案。
应当理解,图2所示的技术可以包括或不包括提供实际生物样本203用于实验室分析211的步骤。因此,输入201可以仅包括图像212和元数据218以用于图像分析213和数据分析215。
图3是根据代表性实施方案的用于至少部分地基于生物样本的图像分析来评估动物健康的方法的流程图。如步骤302所示,方法300可以包括接收生物样本的图像,例如,数字照片文件形式的粪便样本的原始图像。在该方法300中,可以在预定因素的集合中分析粪便样本的图像,这些预定因素包括但不限于颜色、质地、粘度、稠度、体积、质量等。可以采用受控的方式收集粪便样本,例如使得在图像本身中可获得视觉参考标准。这可以通过使用具有已知颜色、形状和/或诸如文本的其他标记的粪便样本收集袋来实现。
如步骤304所示,方法300可以包括提取图像中所包括的生物样本的特征,并且如步骤306所示,方法300可以包括对这些特征进行评分和/或索引。在某些方面,基于原始图像与参考数据库的比较,可为所提取的每个特征分配评分或索引。每个评分可以单独地和/或聚合地提供与特定症状或生理状况的存在或不存在相关的重要数据,该数据可以用作个性化算法的输入,在报告中提供发现。因此,如步骤308所示,方法300可以包括生成诸如报告的输出。这样的报告可以包括或用于创建个性化健康计划,包括但不限于对个性化饮食补充剂以及健康的其他方面的推荐,包括饮食、睡眠、锻炼、活动和其他生活方式推荐。
可以在方法300中提取的特征可以包括但不限于颜色、质地、粘度、稠度、体积、质量等中的一者或多者。为此,可以被分配的评分可以包括颜色评分、质地评分、粘度评分、稠度评分和质量评分中的一者或多者。然而,应当理解,如本文所公开的从图像提取的特征的示例可以在本文中以方便和简单的方式提供。
图4是根据代表性实施方案的用于微生物组DNA基因测序数据的高维空间中的降维的方法的流程图。具体地,图4示出了生成生物群落标签的方法400,其中在微生物组DNA基因测序数据的高维空间中进行降维。如步骤402所示,方法400可以包括提供DNA测序数据,其中在N维空间中提供该DNA测序数据。如步骤404所示,方法400可以包括执行特定分析,诸如主分量分析(PCA)或非负矩阵分解(NMF),以确保微生物在物理上可实现的门、属和/或物种分类学级别和/或其他分类学级别的非负浓度或相对丰度,可执行该特定分析以减少维度向量的数量n,使得n<N。因此,如步骤406所示,方法400可以包括减少维度向量n,使得n<N。如步骤408所示,可以执行进一步的聚类以确定被称为生物群落标签的生物群落原型(即,出于简单起见,假设存在有限数量的已知类型的生物群落表达)。因此,如步骤410所示,方法400可以包括提供生物群落标签作为输出。
图5是示出根据代表性实施方案的具有反馈回路的动态推荐引擎的流程图。更具体地,图5示出了系统500,其中示出了具有用于进一步细化的反馈回路507的动态推荐引擎505,可以生成该反馈回路以消除对实际生物采样的需要,并且用于确保个性化/定制的推荐509被分配给特定生物群落标签511。换句话讲,一旦识别生物群落标签511,系统500示出了推荐引擎505,其可被形成并被应用以绕过或消除对生物样本的实验室分析的需要,即,在一些方面,通过训练,系统500的推荐引擎505在可以在不需要实验室数据作为输入并且只需要图像作为输入的情况下操作。
可以通过采用元数据518诸如症状数据等(例如,来自问卷调查)和初始推荐503(例如,至少部分地基于元数据518的假设)来形成推荐引擎505,以便递送针对动物的定制推荐509。推荐引擎505可以随着添加更多数据(包括但不限于纵向数据)而动态地更新和优化,以优化生物群落标签511和针对动物的定制推荐509之间的对应关系。
图6是根据代表性实施方案的用于训练模型的方法的流程图。具体地,图6中训练的模型可以是关联模型(例如,学习从生物样本的图像的分析识别的一个或多个基于图像的特征与用于形成健康评估和/或治疗计划的一个或多个健康特性之间的关联的机器学习模型)和/或相关模型(例如,将从生物样本的图像的分析识别的一个或多个基于图像的特征与生物标签或特征(诸如特定微生物的可能存在或不存在;应当理解,Pearson相关系数可用于此目的)相关的模型)。因此,方法600通常可以用于开发新的特征模型,并且更具体地,方法600可以包括用于识别新特征的技术,该新特征可以用于机器学习模型预测健康特性,包括从具有生物标签或特征的生物样本的图像的分析识别的代谢组和微生物组特性,或更一般地健康特性。即,方法600可以涉及使用新的基于计算机视觉的特征,该特征可以将图像与可能的生物特征联系,诸如特定微生物的存在或不存在。应当理解,在一些方面,这些不是相关模型,而是将在未来机器学习模型开发中使用的特征向量。
例如,方法600可以涉及捕捉关联以识别系统可以分辨什么特征,并且这些特征可用于构建机器学习模型,例如,诸如等效直径的特征,其可代表显示与宿主动物的微生物组的类杆菌门的存在相对高度相关的几何区域性质。这样,本发明的教导内容可以包括使用等效直径来创建线性模型以预测类杆菌水平。
如上所述,在某些方面,方法600可以包括用于建立生物群落模型(例如,犬生物群落模型)的训练任务,该生物群落模型进一步用于测试和/或生成健康推荐、预测和/或结论。又如,方法600可以包括用于训练模型的技术,该模型将从粪便样本的图像的分析中提取的特征与特定代谢组的可能存在或不存在相关联。应当理解,从图像提取的特征与特定健康特征和/或生物特征之间存在其他相关性和/或关联性,并且本文所述的技术将包括基于这些相关性和/或关联性来训练和使用模型。
如步骤602所示,方法600可以包括获取生物样本的图像,为了进行示例,该图像可以包括粪便样本的数字照片。因此,该步骤602可以包括具体地定制所接收的图像,使得方法600包括在处理图像时使用基本一致的过程。为此,可以处理所接收的图像,使得它们在接收之后采用具有特定特征的特定格式,和/或可以控制图像的捕获(例如,经由支持web的设备上的用户的数字相机)以使得能够基本上一致地处理此类图像。控制图像的捕获可以包括调整用于捕获的设置以及/或者提供用于基本上一致的图像捕获的手段,诸如通过应用包括预定标记、颜色、形状、文本等的用于生物样本的背景。
如步骤604所示,方法600可以包括获取图像数据。这种图像数据可以包括伴随图像的元数据(或者以其他方式从用户等接收的元数据)。这种图像数据也可以或替代地从图像本身提取。
如步骤606所示,方法600可以包括处理图像。这可以包括信号/图像处理分析等,以识别和/或生成生物样本(例如,粪便)的基于图像的特征,诸如颜色、质地、表观粘度、近似体积和/或质量、稠度等。因此,这样,并且如步骤608所示,方法600可以包括提取图像的特征。信号/图像处理还可以包括或替代地包括利用标记的线性滤波。为此,可以使用滤波器组等,其中滤波器组是一组滤波器(例如,在各种频率和相位调谐的Gabor滤波器),并且可以在本地位于分析引擎等中,和/或可以从远程资源检索以供使用。
如步骤610所示,方法600可以包括接收数据,该数据可以包括如本文所述的元数据和/或基本事实数据、实验室数据等中的一者或多者。例如,该步骤610可以包括接收生物群落数据,例如,来自微生物组DNA基因测序的生物群落标签。因此,该步骤610可以包括分析实际(即,非图像)生物样本(例如,粪便)中些微生物组/代谢组的存在和/或不存在,和/或与其相关的特征。使用该数据和从图像处理提取的特征,可以揭示相关性和/或关联性。并且,如步骤612所示,方法600可以包括识别这些相关性和/或关联性(例如,某些图像特征的存在和/或不存在与某些微生物的存在和/或不存在之间的相关性)。这些参数的进一步处理可以采用深度学习网络(可能是卷积神经网络(CNN))作为创建生物群落模型的模型,该生物群落模型学习将生物群落标签与输入图像相关联。其他处理可以包括用于聚类的降维(例如PCA、非负矩阵分解(NMF)等),其可以进一步用于分析与图像特征的相关性和/或关联性。这样,方法600可以涉及将微生物组/代谢组特征与图像伪影相关联以创建新特征。
因此,如步骤614所示,方法600可以包括训练这种模型。因此,特征可以由生物样本(例如粪便)的外观与生物内容物或物质(例如微生物组特性和/或代谢组特性)的存在或不存在之间的关联来定义。并且如上所述,除了生物物质的存在或不存在之外或作为其补充,其他特征也可以或替代地由在图像中处理的生物样本的外观来定义,诸如健康特性。一个示例是粪便的质地属性可以被归因于留存粪便的动物的水化水平。此外,因为从高级图像处理提取的更细粒度的特征可产生更细粒度的健康特性,所以本技术可以包括此类特征和模型的开发。
图7是根据代表性实施方案的用于使用模型提供推荐的方法的流程图。方法700可以类似于上面参考图6所示和所述的方法,但是其中该模型被用于在没有接收来自动物的物理生物样本的实验室分析的情况下进行预测(并且随后基于相关性和/或关联性对动物进行定制的个性化推荐)。因此,如步骤702所示,方法700可以包括获取生物样本(例如,粪便)的图像;如步骤704所示,方法700可以包括获取图像数据;如步骤706所示,方法700可以包括处理该图像;并且,如步骤708所示,方法700可以包括从该图像中提取一个或多个属性和/或特征。
如步骤710所示,方法700可以包括应用经训练的模型,该模型可以识别图像特征和另一特性之间的关系,诸如微生物组和/或代谢组特性的存在或不存在。
如步骤712所示,方法700可以包括基于相关性和/或关联性来确定健康特性。例如,这可以包括基于与所提取的图像特征的相关性和/或关联性来确定生物群落标签(和/或代谢组标签,或另一标签)。并且,如步骤714所示,方法700可以包括基于所确定的健康特性来提供推荐,例如针对动物的个性化推荐。
方法700还可以包括或替代地包括测试任务,例如,其中保留该模型中的一些数据用于测试该模型。可以采用与图6中的训练任务类似的方式来获取和处理图像,只是犬生物群落模型可能已经被训练并且现在可以用于估计所学习的生物群落标签,并且进一步由推荐引擎用来生成个性化推荐。
令人惊讶地,图像分析算法输出可以与其他输入数据相关联或以其他方式联系,包括但不限于粪便微生物组DNA测序。这种非显而易见的结果可以有益于作为递送个性化健康见解的可行替代手段的排除粪便标本的方法,该个性化健康见解可以采用相对快速的方式体现在个性化健康报告中。因此,本教导内容的非显而易见的有利结果可以涉及图像属性/特征与健康特性(例如,微生物存在/不存在和/或其他特性、Bristol粪便评分等)之间的联系,这可以以高准确度并且比传统的实验室分析快得多地实现。例如,粪便样本的传统分析可能涉及请求标本套件和接收标本套件(可能需要约5天),收集粪便样本(这可能是繁重的、易于污染的并且不卫生的,具体取决于收集技术),将样本邮寄到实验室(可能需要几天),以及等待提取、扩增、测序和分析的结果(可能需要约42天),因此,这种传统分析可能总共需要约53至55天。相反,使用本教导内容的涉及生物样本诸如粪便样本的图像分析的一个方面,用户可以在他们方便时使用智能手机等捕获粪便的照片并且上传该照片(或以其他方式传输数字照片文件)用于分析,然后执行计算机实现的分析并且数据在数秒内为用户准备就绪,整个过程可以花费少于1分钟,例如30秒或更少、15秒或更少,或甚至5秒或更少。在一个实施方案中,用户可以在稍后的时间重复上述技术,以尝试优化先前存在的健康计划和/或先前存在的个性化饮食补充剂,以及/或者根据新健康计划来测量/量化健康结果。
图8是根据代表性实施方案的分析图像以提供动物的健康评估的方法的流程图。方法800可以单独地或组合地使用本文所述的任何系统和技术来执行,例如,图1的系统100。例如,方法800可以包括分析粪便样本的图像以提供排泄粪便样本的动物的健康评估。然而,并且类似于本公开的其他方面,应当进一步理解,虽然方法800可以强调使用粪便样本的图像用于分析,但是方法800可以使用生物样本的另一形式的图像来采用,诸如本文所述的任何生物样本,例如动物的皮肤、动物的毛皮、动物的嘴巴的一部分、动物的耳朵的一部分、动物的眼睛的一部分、动物的鼻子的一部分等中的一者或多者。无论如何,一般而言,方法800可以包括提交生物样本的照片(例如,包含该照片的数字文件),处理和分析该照片,以及根据该分析来提供与健康相关的有用反馈。
如步骤802所示,方法800可以包括接收图像,其中该图像包括动物的生物样本。例如,该图像可以包括动物排泄的粪便样本的数字照片。这样,在优选实施方案中,该图像包括来自智能电话或其他支持web的设备的照片(例如,数字照片),该照片被发送到平台以供分析(例如,通过数据网络被发送到远程计算资源以供处理和分析)。然而,接收图像的其他形式也是可能的或替代地是可能的。例如,该图像可以存储在数据库中,其中接收该图像可以包括从该数据库检索该图像,无论是对于执行图像处理的计算资源是本地的还是远程的。
应当理解,除了接收图像之外或者代替接收图像,方法800(或者更一般地,本教导内容的一个方面)可以包括接收视频、多个图像、三维扫描等中的一者或多者。例如,在这种情况下,视频可以简单地被认为是静止图像的集合,其中这些图像中的一个或多个可以如本文所述地被分析。这可以为本教导内容的一个方面产生更多的输入数据,并且因此产生更细化的结果/推荐。例如,视频等可以提供生物样本的更多角度、视图、颜色、特征等以用于基于图像的分析。因此,如本文所述,被分析的图像将被理解为有可能包括视频、三维图像等中的一者或多者,或其一部分,例如,静止图像或视频、扫描等的其他部分。
如步骤804所示,方法800可以包括接收元数据,例如与图像、用户、动物或其他相关联的元数据。在一些具体实施中,图像本身包括元数据,例如,包含该图像的文件、文件名、文件目录和/或目录结构等。例如,以此方式,元数据可以包括时间、日期、地理位置或其他地理位置信息、通常与数字照片或计算机文件相关联的其他元数据等中的一者或多者。元数据还可以包括或替代地包括其他信息,诸如与动物的一个或多个方面相关的问卷调查回答,例如,健康、行为、当前饮食、补充剂、药物、种族信息、品种、体重、大小、其他生理信息等。元数据还可以包括或替代地包括实验室数据等。例如,元数据可以包括血样分析、对动物的DNA基因测序、对动物粪便的微生物组分析的结果、对动物粪便的代谢组分析的结果等。元数据还可以包括或替代地包括历史数据,例如,来自动物的生物样本的先前分析或与另一动物相关的分析的数据。该历史数据可以包括原始数据和/或导出的数据。
元数据还可以包括或替代地包括可以用于测试和/或加强方法800的模型分析技术中的一些的信息。例如,元数据可以包括基本事实属性,诸如生物样本的重量和/或当生物样本是粪便样本时的Bristol粪便得分。这样的基本事实属性还可以包括或替代地包括语义分割算法中的手动分割的图像。
如步骤806所示,方法800可以包括识别并提取图像内的一个或多个感兴趣区域以用于进一步分析。这些感兴趣区域可以至少包括其中仅具有生物样本的第一感兴趣区域。例如,在生物样本是粪便样本的方面,一个或多个感兴趣区域可以至少包括其中仅具有粪便样本的第一感兴趣区域。在这种情况下,即当感兴趣区域内仅存在生物样本并且感兴趣区域可以被识别和提取以用于处理时,感兴趣区域的归一化可以是不必要的。然而,方法800的一个方面可以包括如下文参考步骤808更详细地说明的归一化。
如本文所述,在某些方面,图像包括与生物样本不同的背景,因此一个或多个感兴趣区域可以包括其中具有背景的至少一部分的第二感兴趣区域。这样,提取一个或多个感兴趣区域可以包括在图像的至少一部分内识别生物样本和背景。方法800还可以包括基于仅对生物样本的识别来创建第一感兴趣区域,以及基于生物样本的一部分和背景的一部分两者的识别来创建第二感兴趣区域。此外,或替代地,方法800可以包括对第一感兴趣区域和第二感兴趣区域进行分类以用于对其进行单独分析。
在某些方面,为本教导内容的系统和技术接收或以其他方式检索的图像可以具有很大变化。例如,照明和背景条件可以在图像之间显著变化。例如,照明和背景条件可以在图像之间显著变化。例如,简单的图像分析(例如,Otsu阈值和分割)可能由于存在变化非常大的背景而不能很好地工作,这就是为什么U-Net网络可能是优选的,即,这是一种经常用于生物医学成像应用的语义分割网络的版本。卷积神经网络可能需要某些预处理作为对图像和/或其区域进行标准化以供分析的方式。因此,在一个方面,在使用U-Net网络的情况下,可以调整图像的大小和/或将图像归一化以实现输入的一致性。此外或替代地,本文中用于这种分割的模型可以利用数据扩充、k折叠、更多数据、其他语义分割网络和训练模式、手动分割的图像、它们的组合等来改进。
提取感兴趣区域因此可以包括分割。例如,提取一个或多个感兴趣区域可以包括至少部分地由模型执行的图像分割,例如,被配置为执行更全面的分析的分割模型或模型的一部分。这些模型中的一个或多个可以包括深度学习模型。以此方式,在一个方面,提取一个或多个感兴趣区域可以包括图像的自动分割,其中这种自动分割包括利用使用深度学习的一个或多个语义分割模型。例如,本文使用的语义分割模型可以包括U-Net网络。此外或替代地,本文使用的语义分割模型可以与数据扩充、k折叠和数据的附加输入中的至少一者一起使用。基本事实数据可以用作语义分割模型中的输入以训练和验证该模型。因此,语义分割网络模型可以在内部(例如,U-Net)被训练和/或使用迁移学习从公共模型适应以执行图像分割。并且可以提供基本事实数据(例如,所有类别都被标记)作为输入以帮助训练/验证该模型以获得最佳准确度。
提取感兴趣区域还可以包括或替代地包括图像的手动分割。这样,在一个方面,提取一个或多个感兴趣区域包括图像的手动分割和图像的自动分割的组合。例如,当数据集相对小时,可以手动地分割图像。手动分割可以帮助提高所提取的特征的信噪比(SNR),因为感兴趣区域理论上应当被良好地定义。无论如何,在一个方面,使用深度学习的语义分割模型来执行自动ROI分割,此类模型可以提供高质量的自主感兴趣区域分割。
来自一个或多个感兴趣区域的提取的输出可以包括被分类为仅生物样本、仅背景、或生物样本和背景的组合中的一者的感兴趣区域。
如步骤808所示,方法800可以包括将图像的一个或多个感兴趣区域归一化。图像可以被归一化以控制不同的图像采集设置(例如,焦距、放大率等)。此外或替代地,可以提取和/或归一化生物样本的颜色和长度特征,例如,使用已知背景上的标记作为校正因子以应用于某些感兴趣区域。例如,图像可以包括与生物样本不同的背景,其中执行归一化以便以有用的方式仅分析生物样本。因此,一个或多个感兴趣区域可以包括其中具有背景的至少一部分的第二感兴趣区域。例如,在生物样本包括粪便样本的方面,背景可以包括一个或多个表面(例如,人造表面如混凝土,或天然表面如草坪),并且/或者背景可以包括保持或以其他方式包含粪便样本的袋、容器等。另外或替代地,并且如下文更详细地说明的,背景可以包括可以帮助归一化、提取和识别感兴趣区域、提取和识别生物样本的特征等中的一者或多者的预定标记或特征。在一些方面,背景可以包括若干类型的背景,例如,专门为图像分析而定制的表面、草、泥土、碎屑、混凝土和/或路面等中的一者或多者的组合。
以此方式,方法800可以包括将仅包括生物样本的第一感兴趣区域和包括一些背景的第二感兴趣区域中的一者或多者归一化以考虑图像可变性,从而创建归一化图像以用于进一步的标准化分析。因此,如本文所说明,识别生物样本的一个或多个特征可以通过分析该归一化图像而发生。
在一个方面,将一个或多个感兴趣区域归一化包括从包括生物样本的至少一部分和背景的至少一部分的第二感兴趣区域提取归一化因子,诸如生物样本的颜色属性和维度属性(例如,长度)。如上所述,可以策略性地将背景设计成帮助该归一化过程,或者用于分析生物样本,例如,在一个方面,背景包括其上具有预定标记的搁置表面。例如,背景可以包括薄片(例如,塑料薄片,其可以是用于收集和/或处理粪便的袋子的形式)或具有可以用于归一化的标记的另一表面。因此,第二感兴趣区域中的背景上的标记可以用于提取颜色属性和维度属性中的一者或多者。标记可以包括具有已知属性的符号、设计或文字。这样,标记可以具有已知尺寸和已知形状中的一者或多者(例如,具有已知尺寸的矩形、三角形、圆形、直线、波浪等)。标记还可以包括或替代地包括一个或多个字母数字字符,例如,字母和/或数字。例如,如果图像内的背景上的标记包括具有已知尺寸的字符,则该字符的纵横比可以用于计算图像内的内容的尺寸。可以从图像分析的角度应用纵横比的使用,例如在方法800可以包括识别多少像素对应于设定距离的情况下,使得该技术可以从以像素为单位的原始计算转换为更有用的形式。标记还可以包括或替代地包括一种或多种颜色,例如多种颜色。这样,标记的颜色可以提供用于确定生物样本内的颜色的基线参考,这可以帮助解决图像采集差异(例如,照明、聚焦、放大率等中的一者或多者)。
将一个或多个感兴趣区域归一化还可以包括使用所提取的颜色属性和所提取的维度属性来计算对于颜色和宽高比的校正因子,以及将该校正因子应用于第一感兴趣区域。将一个或多个感兴趣区域归一化还可以包括或替代地包括调整感兴趣区域的尺寸。
将一个或多个感兴趣区域归一化可以考虑在捕获图像时使用的一个或多个图像采集设置,例如,用户的智能电话上的相机应用程序的设置等。这种图像采集设置可以包括焦距、颜色设置、照明设置、放大率等中的一者或多者。
如步骤810所示,方法800可以包括计算一个或多个属性,包括但不限于第一感兴趣区域中的几何属性、质地属性和/或颜色属性,以识别生物样本的一个或多个特征。例如,在一个方面,方法800可以包括计算第一感兴趣区域中的几何属性、质地属性和颜色属性中的每一者以识别生物样本的一个或多个特征。
在该步骤810中识别的特征可以包括颜色、质地、二进制数的数量、面积(例如,样本占据的像素的数量)、周长(例如,使用8连通性、4连通性等将轮廓近似为经过边界像素的中心的线的样本的周长)、圆度(例如,样本的形状与圆有多相似的度量)、体积、质量、偏心率(例如,纵横比的度量,其被计算为具有与样本区域相同的二阶矩的椭圆的偏心率)、长轴(例如,具有与样本相同的归一化二阶中心矩的椭圆的长轴的长度)、短轴(例如,具有与样本相同的归一化二阶中心矩的椭圆的短轴的长度)、短长轴比(例如,这些轴的纵横比的度量,意指具有与样本区域相同的二阶矩的椭圆的短轴与长轴之比)、粘度、稠度、含水量、密实度(例如,凸度的度量,其被计算为样本中的像素数与其凸包的像素数之比)、范围(例如,样本的面积与其轴对准的边界框之比)、等效直径(例如,具有与样本相同面积的圆的直径)、镜面反射性、相干性、反射率、扩散性、与生物样本不同的物质(例如,当生物样本是粪便样本时,非粪便物质,诸如外来物或生物物质)的存在等。应当理解,在该步骤810中识别的特征可以包括导出的特征。例如,可以在特征工程之前对粘度进行建模然后导出粘度。
例如,在步骤810中可以识别质量。在一个方面,质量是从生物样本的几何形状和质地属性计算而来的。此外或替代地,质量可以从粪便样本的颜色和导出的颜色向量中的至少一者计算而来。在一个方面,可以在方法800中实现质量模型,其中这种模型使用的特征包括但不限于颜色和几何属性向量(x)和来自元数据的作为标签的基本事实权重(y)。在一个方面,相同的测试训练拆分过程可以用于在大约80%的数据上训练该模型,并且利用剩余的约20%的数据来评估该模型的性能。利用训练数据,监督机器学习回归算法(例如,支持向量机、k最近邻、随机森林回归量等)可以用于预测连续输出(其可以被选择以获得权重输出而不是分类的Bristol粪便评分标签等)。然后可以使用超参数搜索例程诸如“gridsearch”、“randomsearch”等中的一者或多者来优化这些模型。
又如,并且如上所述,当生物样本是粪便样本时,粪便样本的一个或多个特征可以包括非粪便物质的存在。这样,非粪便物质可以包括外来物,例如,寄生虫、病原体、无生命对象诸如玩具等中的一者或多者。
如上所述,方法800可以包括计算感兴趣区域(例如,第一感兴趣区域)中的颜色属性以识别生物样本的一个或多个特征。例如,在一个方面,方法800的输出可以包括Bristol粪便量表上的分类形式的健康特性,其中该分类至少部分地基于颜色属性。颜色属性还可以或替代地至少部分地用于确定与稠度相关的属性,其可以特别地应用于粪便样本的背景中。
颜色属性可以从红-绿-蓝颜色模型、红-绿-蓝-α颜色模型、色调-饱和度-值颜色模型和/或CIELAB颜色模型中的一者或多者导出或者以其他方式利用这些颜色模型。此外或替代地,可以使用多维颜色平面来计算颜色属性。可以使用诸如k均值算法的算法来提供这种计算的多维颜色平面。例如,可以使用降维方法(例如,k均值聚类)将相似颜色的区域聚类,从而计算颜色属性。例如,在粪便ROI内分割十个颜色平面可以允许技术查看样本内的色彩均匀性(例如,颜色平面1可以具有30%的丰度并且是占主导地位的颜色聚类)。这些均匀性值还可以用作用于训练若干机器学习模型的特征。
如上所述,方法800可以包括计算感兴趣区域(例如,第一感兴趣区域)中的几何属性以识别生物样本的一个或多个特征。在一个方面,计算几何属性包括将第一感兴趣区域转换成灰度,将第一感兴趣区域转换成二进制,以及将一个或多个形态学操作应用于第一感兴趣区域。
如上所述,方法800可以包括计算感兴趣区域(例如,第一感兴趣区域)中的质地属性以识别生物样本的一个或多个特征。在某些具体实施中,计算质地属性包括使用灰度共生矩阵(GLCM),其中GLCM是测量连续像素的图案之间的空间关系的统计度量。GLCM的使用可以包括绘制多个点以识别其聚类。因此,应当理解,通过计算来自图像的性质而识别的生物样本的一个或多个特征可能不是人类可见的,并且质地属性是GLCM用于提取该属性的一个示例。又如,也可以或替代地使用Gabor滤波器组来计算质地,该Gabor滤波器组包括Gabor小波的不同幅度、方向和频率的排列。每个Gabor小波可以在图像上卷积,并且可以创建经滤波的图像,其中从质地或定向像素捕获的高信号与Gabor滤波器同相。并且这些经滤波的图像可以用于质地的分类。以下是公开提供的脚本,其示出了在本教导内容的上下文中可以如何适配和执行该序列:https://scikit-image.org/docs/stable/auto_examples/features_detection/plot_gabor.html,并且本领域的技术人员将理解在给定本公开内容的情况下如何实现这种技术。
因此,可以从图像计算许多特征集,其中三个示例性特征集包括颜色、质地和区域属性,它们可以在分析流水线中的相应点处计算。这些特征集可用于训练机器学习模型。用于识别这些特征的示例性分析流水线可以包括将图像转换为灰度,并且从灰度计算质地属性。然后可以将该灰度图像转换为二进制,并且利用形态学操作(例如,侵蚀/扩张)来净化其信号以计算区域属性。图像可以具有所计算的全局颜色向量以获得颜色属性和相关特征。这样,该步骤810的输出可以包括颜色、质地、二进制的数量、面积、圆度、偏心率、长轴和短轴、周长等中的一者或多者。
如步骤812所示,方法800可以包括分析生物样本的一个或多个特征,例如,通过计算几何属性、质地属性和颜色属性中的一者或多者来识别特征。例如,该步骤812可以包括根据参考数据库来分析生物样本的特征以确定动物的健康特性或对动物的治疗。参考数据库可以是包括来自其他生物样本的分析数据的历史数据库,例如,来自相同动物的生物样本或来自不同动物的生物样本。
如步骤814所示,方法800可以包括将模型应用于生物样本的一个或多个特征。通常,模型可以是推荐引擎的一部分,该推荐引擎被配置为根据在生物样本的图像分析中确定或识别的健康特性来提供对治疗的一个或多个推荐。即,该模型可以被配置为(例如,被编程为)预测作为生物样本来源的动物的健康特性(例如,在生物样本是粪便样本的情况下,该模型可以预测留存/排泄该粪便样本的动物的健康特性)。应当理解,在本教导内容的上下文中,“模型”可以包括一个或多个算法的输出,该一个或多个算法可以包含模型数据和预测算法。因此,算法可以被认为是编程,并且模型可以被认为是表示程序。这样,在本教导内容的上下文中,本文讨论的模型可以表示由一个或多个机器学习算法学习的内容。模型因此可以表示在对训练数据运行机器学习算法之后保存的输出,并且可以表示进行预测所需的规则、数字和任何其他算法特定的数据结构。因此,模型可以包括数据和用于使用该数据来进行预测的过程(如由一个或多个算法所阐述的)。因此,在本教导的上下文中,模型可以学习输入数据中的模式(例如,颜色、几何形状、质地等),并且该模型可以将这些模式抽象成关系(例如,数学函数),使得当输入新数据时,该“模型”使用其已经学习的这些函数与训练数据来创建预测(例如,用于制定治疗计划的健康特性预测)。
该模型可以包括机器学习模型。通常,机器学习模型可以是在输入数据上运行的一个或多个机器学习算法的输出,例如,输入数据的形式为来自如本文所述的样品的图像处理的生物样本的所识别的特征。机器学习模型可以利用被配置为执行模式识别的算法,诸如上文所述。
该模型可以包括概率模型,例如随机模型等。概率模型可以产生一个实例将发生的随机机会。例如,这可以包括健康数据的时间跟踪(类似于时间序列分析),其中模型(例如,循环神经网络诸如长期短期记忆(LSTM))用于预测健康结果的未来机会。
该模型可以将权重和评分中的一者或多者应用于生物样本的特征以预测健康特性。可以为与生物样本相关联的动物定制该权重和/或评分。应当理解,这些权重和/或评分可以被定制以供特定模型使用,并且/或者它们可以被定制以供多于一个模型使用(例如,在这些模型互连的情况下)。
因此,应当理解,本文所用的一个或多个模型可以在另外的一个或多个模型内互连。例如,若干机器学习模型可以有助于健康预测(例如,一致性模型、颜色模型等)。在一个方面,前述权重可以提供每个个体模型的预测的预期平均值。因此,本文所述的权重可以包括单独的模型权重(例如,颜色模型可以是线性回归y=mx+b,其中权重为“m”和“b”值)和刚刚所述的预期平均值的权重(例如,健康指数=a*一致性预测+b*颜色预测)中的一者或多者。换句话说,在本教导内容中使用的模型可以由若干模型组成(例如,综合模型可以包括颜色模型、一致性模型等中的一者或多者),其中模型权重可以辅助计算预期平均值,而个体模型(例如,颜色模型)中的模型权重可以用于训练/执行该特定模型。
因此,还应当理解,一个或多个模型可以被输入到另外的一个或多个模型中。例如,在一个方面,颜色模型和一致性模型可以各自进行对Bristol粪便评分的预测。在该示例中,这两个值的预期平均值可以用于创建健康指数评分。并且该预测的Bristol粪便评分值然后可以作为输入提供给质量模型,以预测以克为单位的粪便质量或以盎司为单位的重量。
这样,本教导内容可以包括模型的系统,它指的是个体模型的组合和/或集合,例如,用于对导出的度量诸如“总体健康评分”等作出确定。因此,应当理解,这些模型可以包括个体模型和/或集成模型,例如,其中在集成模型中,每个模型的强度被认为提供最终导出结果。即,应当理解,可以使用个体模型作为组件(例如,作为模型的系统的输入)来生成模型的系统。例如,可以定义用于几何属性的单独的支持向量机模型和用于颜色属性的单独的线性回归模型,其中可以训练每个模型以预测健康结果,诸如Bristol粪便评分。可以定义这两个模型的系统,使得两个个体模型一起用于预测健康结果,诸如Bristol粪便评分。此外,当一个个体模型的输出(例如,几何模型的Bristol粪便评分预测)用作单独模型(例如,质量预测模型)的特征时,可以创建额外的模型系统。
本教导内容的一个方面还可以包括或替代地包括训练一个或多个模型,例如,以在方法800的步骤814中使用。在某些方面,训练模型包括使用在图像分析中识别的粪便样本的一个或多个特征。下文给出了在包括粪便的生物样本的上下文中训练模型的几个示例,但是应当理解,其他技术也可以或替代地用于训练本文的模型。
训练模型可以首先进行数据整理来准备实际的训练。例如,在包括粪便的生物样本的背景下,可以检索或以其他方式收集各种粪便健康特征。这可以包括从源提取数据,该源包括电子表格、关系和/或非关系数据库(本地或远程存储,例如,存储在云端)等。这可以包括将数据加载到软件中,以及根据需要转换数据(例如,将数据换算为单位均值和方差等)。在分析之前,数据可以继续被净化(例如,经由字符串格式化、移除空值、转换对象类型等中的一者或多者)。这还可以包括格式化特征矩阵X和标签向量Y,其中特征矩阵X可以具有任何数量的特征,包括区域属性、颜色等,并且其中特征向量y包含真实分类标签(例如,Bristol粪便评分)。
准备数据以用于训练还可以包括语义分割。这样,首先可以创建基本事实标签,其中可以手动创建这些标签。接下来,可以将图像和对应的基本事实标签存储在数据源中(例如,本地或远程地存储,例如,存储在基于云的存储系统上)。可以从源(例如,本地或基于云的存储)提取图像、调整图像的大小到标准大小以及扩充图像。这种扩充可以包括修剪、垂直/水平翻转、剪切、旋转等中的一者或多者。可以完成该操作以将数据集大小增加到原始和基本事实图像两者。应当理解,准备数据以用于训练可以利用软件自动进行。
继续该训练示例,现在将讨论建模。训练模型可以包括训练以识别粪便健康特征等。为此,可以将训练测试拆分以训练模型,例如,使用一部分数据(~70%至80%)来训练模型;保留一部分数据(~20%至30%)来对训练后的数据进行测试;以及将一部分数据(~10%)用于在训练期间验证模型。可以创建模型,例如从包或自定义定义的体系结构加载。然后可以使用训练数据来训练模型。为此,可以可选地馈入验证数据来在训练期间进行验证。可以利用测试数据来评估模型准确度,以将预测与基本事实数据进行比较。可以使用像交叉验证、网格搜索等的例程来优化模型超参数,以提出导致最高准确度、最低偏差和/或最低方差的最佳参数。可以保存模型以在运行时调用,其中模型可以具有在运行时以编程方式调用的应用程序编程接口(API)。
训练模型还可以包括或替代地包括语义分割训练,该训练可以遵循与上述过程类似的过程。因此,可以定义自定义卷积神经网络(CNN)架构或将CNN架构实例化(例如,U-Net)。可以将数据集拆分以训练模型,例如,使用一部分数据(~70%至80%)来训练模型;保留一部分数据(~20%至30%)来对训练后的数据进行测试;以及将一部分数据(~10%)用于在训练期间验证模型。然后可以使用训练数据来训练模型。为此,可以可选地馈入验证数据以在训练期间进行验证,例如,利用测试数据来评估模型准确度,以将预测与基本事实数据(例如,DICE系数)进行比较。可以使用像交叉验证、网格搜索等的例程来优化模型超参数,以提出导致最高准确度、最低偏差和/或最低方差的最佳参数。可以保存模型以在运行时调用,其中模型可以具有在运行时以编程方式调用的API。
训练模型还可以包括或替代地包括训练模型以识别粪便中的特征。为此,可以加载预先训练的开源模型权重(例如,VGG-16),该权重可能先前已经在几百万个图像上训练。然后可以根据本教导内容的上下文来调整权重。
可以传入图像类元数据,该元数据可以按照文件夹名称来组织,和/或作为字典/列表对象来传递,其中每个图像具有对应的类名称。可以将训练测试拆分以训练模型,例如,使用一部分数据(~70%至80%)来训练模型;保留一部分数据(~20%至30%)来对训练后的数据进行测试;以及将一部分数据(~10%)用于在训练期间验证模型。然后可以使用训练数据来训练模型。为此,可以可选地馈入验证数据以在训练期间进行验证,例如,利用测试数据来评估模型准确度,以将预测与基本事实数据(例如,DICE系数,在文件夹结构元数据中传递的标签等)进行比较。可以使用像交叉验证、网格搜索等的例程来优化模型超参数,以提出导致最高准确度、最低偏差和/或最低方差的最佳参数。可以保存模型以在运行时调用,其中模型可以具有在运行时以编程方式调用的API。
如上所述,其他训练技术也可以或替代地用于训练本文所述的模型中的一个或多个。还应当理解,在模型被描述为执行动作或功能的情况下,这可以包括单个模型或多个模型的组合。
如步骤816所示,方法800可以包括预测作为生物样本来源的动物的健康特性。如本文所述的健康特性可以是可用于维持或改善动物的健康和康乐的任何属性,和/或可以识别潜在健康问题的任何特性。例如,如本文所讨论的,在生物样本是粪便样本的方面,健康特性可以包括Bristol粪便量表的分类、粪便质量与动物质量的比率、粪便中血液和/或外来物的检测等。
如步骤818所示,方法800可以包括分析由模型预测的一个或多个健康特性,即与生物样本相关联的动物的健康特性。例如,该步骤818可以包括根据参考数据库来分析健康特性以确定对与生物样本相关联的动物的治疗。参考数据库可以是包括来自其他生物样本的分析数据的历史数据库,例如,来自相同动物的生物样本或来自不同动物的生物样本。
如步骤820所示,方法800可以包括执行实验室分析或与上述图像分析分开的生物样本的另一分析。该分析可以用作预测动物的健康特性的因素。此外,或替代地,该分析可以用于测试上述图像分析技术,和/或用于提供基本事实数据。例如,当生物样本包括粪便样本时,该步骤820可以包括对粪便样本执行微生物组DNA基因测序。为此,方法800还可以包括应用来自微生物组DNA基因测序的结果作为预测动物的健康特性的因素。此外,或替代地,当生物样本包括粪便样本时,该步骤820可以包括对粪便样本执行代谢组测序。为此,方法800还可以包括应用来自代谢物组测序的结果作为预测动物的健康特性的因素。
步骤820还可以包括或替代地包括进一步的分析,例如当生物样本包括粪便样本时,诸如质谱分析、电导和流变学中的一者或多者。同样,该进一步分析的结果可以用作预测动物的健康特性的因素和/或用于训练模型。
如步骤822所示,方法800可以包括例如根据至少部分地由所应用的模型预测的健康属性而为动物提供治疗。治疗可以包括食物、液体、补充剂、行为推荐(例如,睡眠、锻炼、富集等)和/或药物中的一者或多者。例如,治疗可以包括用于动物的个性化饮食补充剂。这种个性化饮食补充剂可以包括预定量的益生菌、益生元、消化酶、抗炎剂、天然提取物、维生素、矿物质、氨基酸、短链脂肪酸、油、配制剂等中的一者或多者。
因此,执行方法800或本文所公开的任何方法的实施方案可以用于获得用于动物的个性化饮食补充剂。个性化饮食补充剂可以包括但不限于有益成分的个性化成分含量,这些成分可以在适用的情况下与配制剂组合。这样,本教导内容可以提供个性化补充剂系统。这种个性化补充剂系统可以包括在结构上被构造用于储存个性化饮食补充剂的耐用容器,其中该容器的尺寸和形状可大致设计成易于再填充。还可以提供再填充杯,其中这些再填充杯可以是可回收的并且在结构上被构造成易于使用和填充。可以使用补充剂勺等,其中这种勺可以是定制设计的以容纳针对动物规格而个性化的剂量。该系统可以确保个性化饮食补充剂的投配的依从性。此外或替代地,个性化补充剂系统可以包括订阅服务等,其中基于预定的基础和/或以预定的剂量将补充剂邮寄或以其他方式递送给最终用户。例如,小纸袋或其他容器可用于储存预定剂量的待添加到动物食物或水中的个性化补充剂,其中基于预定的基础将这些小纸袋中的一个或多个提供给最终用户。
治疗还可以包括或替代地包括用于动物的定制健康计划。定制健康计划可以包括行为改变、饮食改变等中的一者或多者。定制健康计划还可以包括或替代地包括关于饮食、睡眠、锻炼、活动、富集、生活方式改变等中的一者或多者的推荐。
如步骤824所示,方法800可以包括生成并提供关于动物的报告,例如,其中该报告包括关于由模型预测的健康特性的信息。
可以使用一个或多个计算设备来执行上述方法800。为此,本教导内容可以包括用于分析生物样本图像以提供动物的健康评估的计算机程序产品,该计算机程序产品包括体现在非暂态计算机可读介质中的计算机可执行代码,当在一个或多个计算设备上执行时,该计算机可执行代码执行以下步骤:接收图像,该图像包括生物样本;识别并提取该图像内的一个或多个感兴趣区域以用于进一步分析,该一个或多个感兴趣区域至少包括其中仅具有生物样本的第一感兴趣区域;计算第一感兴趣区域中的几何属性、质地属性和颜色属性中的一者或多者以识别生物样本的一个或多个特征;以及将模型应用于生物样本的该一个或多个特征,该模型预测与该生物样本相关联的动物的健康特性。
图9是根据代表性实施方案的分析生物样本的图像以提供动物的健康评估的方法的流程图。一般而言,方法900可以利用模型(例如,相关模型),该模型可以是根据图6的描述训练的相同或类似的模型。因此,图9的方法900可以类似于参考图7所述的技术,其中应当理解,这些技术的步骤可以彼此替代和/或补充。
如步骤902所示,方法900可以包括识别(i)从生物样本的图像分析确定的一个或多个特征和/或其他数据与(ii)与该生物样本相关联的动物的一个或多个属性和/或特性之间的一个或多个关联。
因此,该步骤902还可以包括或替代地包括识别图像中包含的生物样本的一个或多个特征。因此,可以从本文所述的各种图像分析技术中的一个或多个发现、揭示、计算和/或识别从生物样本的图像确定的特征或其他数据,例如,在生物样本的数字照片上执行。例如,此类特征可以包括面积、圆度、偏心率、长轴、短轴、周长、等效直径、范围、短长轴比、密实度等中的一者或多者。
与生物样本相关联的动物的属性和/或特性可以包括物质的存在或不存在(例如,微生物组特性和代谢组特性中的一者或多者)、健康特性、评分(例如,Bristol粪便评分)等,包括它们的组合。例如,这些属性和/或特性可以包括或以其他方式帮助识别饮食指标(例如,碳水化合物摄入、新鲜食物摄入、蛋白质摄入、脂肪摄入、它们的代谢等)、代谢指标、动物体重指标、健康状况或疾病指标(例如,癌症、肠易激综合征(IBS)、肥胖症等)、病原体存在或不存在、寄生虫存在或不存在等中的一者或多者。应当理解,一种物质的存在可以指示另一种物质的存在或不存在,反之亦然,其中这样的推论可以容易地包括在本教导内容中。
例如,现在将在粪便样本的上下文中描述一些可能的关联,即,与图像特征和健康相关属性和/或特性诸如胃肠道微生物组特性的存在或不存在的相关性。粪便样本的等效直径可以与类杆菌门、普雷沃菌属(该菌属的存在或不存在可以导致动物饮食中碳水化合物负荷的进一步指示,这可以有助于饮食推荐)、厚壁菌门特别是瘤胃球菌属(该菌属的存在或不存在可以导致动物蛋白质摄入的进一步指示,这可以有助于饮食推荐;还注意到,厚壁菌的存在或不存在可以与一种或多种类杆菌中的存在或不存在强烈负相关)等中的一者或多者的存在或不存在相关。这样,如果等效直径相对大,这可以指示存在普氏菌门,由此可以推断相对高碳水化合物的饮食,并且导致推荐在动物的饮食中增加更多的蛋白质和减少碳水化合物以优化动物健康。粪便样本的面积可以与以下中的一者或多者的存在或不存在相关:放线菌门(其存在或不存在可以导致动物脂肪摄入的进一步指示,这可有助于饮食推荐)、柯林斯氏菌门(其存在或不存在可以导致解毒和/或其他病原体测试的推荐)等。长轴、短轴和/或周长可以与以下中的一者或多者的存在或不存在相关:布劳特氏菌属(其存在或不存在可以导致推荐有助于IBS等的抗炎化合物)、放线菌门(其存在或不存在可以导致进一步指示动物的脂肪摄入,这可以有助于饮食推荐)、柯林斯氏菌门、类杆菌属(其存在或不存在可以导致推荐预防有害细菌)等。范围和密实度可以与以下中的一者或多者的存在或不存在相关:平野梭菌(其存在或不存在可以导致进一步指示动物的蛋白质和/或碳水化合物摄入,这可以有助于饮食推荐)、巨单胞菌属(其存在或不存在可以导致代谢和/或体重增加的指示)、柯林斯氏菌属等。短长轴比可以与放线菌门、柯林斯氏菌属等中的一者或多者的存在或不存在相关。其他相关性也是可能的或替代可能的。
例如,现在将在粪便样本的上下文中描述其他可能的相关性,即,来自图像特征和健康相关属性和/或特性诸如代谢组子系统的存在或不存在的相关性。偏心度可以与指示碳水化合物摄入、毒力、疾病和防御的一种或多种代谢物的存在或不存在相关。等效直径可以与指示碳水化合物摄入、氨基酸和衍生物、蛋白质代谢、辅因子、维生素、辅基、色素、毒力、疾病和防御的一种或多种代谢组子系统的存在或不存在相关。其他相关性也是可能的或替代可能的。
这样,本教导内容可以用于验证上述相关性中的一种或多种。例如,使用本教导内容的一个方面,类杆菌门和厚壁菌门之间的大致相反关系是经验性捕获的,这在仅使用图像分析和经训练的相关模型的情况下认为是不可能的。
可以使用与可以用于生成微生物组见解的技术相同或相似的技术来生成代谢组见解。例如,代谢组特性可以与从图像计算的特征和/或属性(例如,几何形状、质地、颜色、CNN特征等)直接相关。代谢组特性也可以或替代地经由诸如微生物组特性的次要特征与图像特征和/或属性间接相关(例如,二级关联)。此外,可以切换该过程,其中微生物组特性有可能使用代谢组特性与图像特征间接相关。
微生物组特性和代谢组特性也可以或替代地与分解向量相关,诸如从主分量分析(PCA)得到的特征向量。PCA是用于降维的常见例程,当分析代谢组和微生物组域中的高维数据时,PCA可能是有价值的。图像属性和/或特征可以与这些复合向量相关,并且可以允许微生物组特性或代谢组特性的预测。降维本征向量还可以或替代地用于聚类(例如,各种类型的响应的分类)。
通常应当理解,在该方法900的上下文中并且通常在本公开通篇描述的技术中,“微生物组特性”一般应包括微生物组的分量的可测量性质,例如,分类学上的类群诸如门、组、目、科、属和/或种的具体存在或不存在。类似地,“代谢组特性”一般应包括代谢组的分量和/或子系统和/或代谢功能的可测量性质。这样,从生物样本的图像的感兴趣区域计算的生物样本的特征与微生物组特性和代谢组特性中的一者或多者之间的关联可以用于确定生物样本的微生物组和/或代谢组方面的状态,如以下更详细地说明的。
如步骤904所示,方法900可以包括存储关联(例如,上述相关性)或以其他方式使它们可供模型(例如,相关模型)可用。例如,关联可被存储在模型可访问的参考数据库中。
如步骤906所示,方法900可以包括接收从包括生物样本(例如粪便样本)的图像内的一个或多个感兴趣区域计算的生物样本的一个或多个特征。该特征可以涉及生物样本的几何属性、颜色属性、质地属性等中的至少一者。应当理解,这些属性中的一者或多者可以是导出的属性。例如,在特征涉及颜色属性的情况下,这种颜色属性可以包括颜色和与颜色相关的导出的属性中的一者或多者(例如,使用k均值颜色分割来计算颜色均匀性,其中导出的特征被创建)。在更简单的示例中,某些颜色可以导出饮食属性,诸如特定食物或物质的摄入。
如步骤908所示,方法900可以包括将模型应用于该生物样本的特征和多个关联以确定关于该动物的有用见解。更具体地,在生物样本是粪便的某些方面,方法900可以包括使用通过识别粪便的一个或多个基于图像的特征与粪便中的微生物组特性和/或代谢组特性中的一者或多者之间的多个相关性和/或关联性而创建的模型,将粪便样本的特征应用于该模型中的多个相关性和/或关联性以确定粪便样本中的微生物组和代谢组中的一者或多者的状态的可能性。
应当理解,生物样本(例如粪便样本)中的微生物组和代谢组中的一者或多者的“状态”是指生物样本的动态生态系统的时间快照。例如,生物样本中的微生物组和代谢组中的一者或多者的状态可以包括特定动物的胃肠微生物组和/或代谢组的组成,其中这种组成可以随时间变化并且可以在不同动物之间是独特的。这样,生物样本中的微生物组和代谢组中的一者或多者的状态可以包括微生物组和代谢组中的一者或多者的各种特性,如本文所定义的那些特性。生物样本中的微生物组和代谢组中的一者或多者的状态因此可以包括生物样本中特定微生物组和/或特定代谢组的存在或不存在,和/或与其相关的另一特性。生物样本中的微生物组和代谢组中的一者或多者的状态还可以包括或替代地包括生物样本中的特定微生物组特性和/或代谢组特性的分布,该分布可以包括存在的微生物组特性和代谢组特性中的一者或多者的相对量和/或数量。例如,该分布可以包括特定个体和/或微生物组特性和/或代谢组特性的集合的相对丰度,其可以例如相对于特定预定阈值数量(例如,预期平均值),相对于其他不同微生物组特性和/或代谢组特性的丰度,相对于另一种物质(例如,生物物质和/或非生物物质)的丰度,它们的组合等。此外,因为方法900可以仅基于生物样本的图像来执行以做出微生物组和代谢组中的一者或多者的状态的确定,所以该确定可以是估计和/或假设,因为该确定可以不基于实验室分析。为此,方法900可以包括仅基于图像分析来确定生物样本中的微生物组和代谢组中的一者或多者的状态的可能性。方法900还可以或替代地与实验室分析结合使用,例如用于测试或其他目的。
方法900还可以包括或替代地包括例如使用数百个数据点来训练模型。在模型900已被训练之后,它可被加载以接收诸如本文所述的图像特征的输入。
如步骤910所示,方法900可以包括预测与生物样本相关联的动物的健康特性。例如,在生物样本是粪便的某些方面,方法900可以包括至少基于粪便样本中的微生物组和代谢组中的一者或多者的状态的可能性来预测留存该粪便样本的动物的健康特性,和/或与其相关的另一特性。这可以类似地对非粪便生物样本进行。
如步骤912所示,方法900可以包括根据健康特性来提供治疗(其可包括推荐)。
图10示出了根据代表性实施方案的图像及其各种颜色平面。具体地,图10包括图像1000,其特征在于搁置表面1010,该搁置表面在结构上可被构造用于至少部分地设置在其上的生物样本(例如,粪便样本)的图像分析。为此,搁置表面1010可以包括如本文所述的在其上的一个或多个预定标记,例如,其中此类标记可以用于提取如本文所述的颜色属性和维度属性中的一者或多者。例如,该图示出了使用搁置表面1010的预定标记的示例性颜色平面(即,红色平面1012、绿色平面1014和蓝色平面1016)的归一化。
图11示出了根据代表性实施方案的图像及其分割。具体地,图11包括图像1100,其特征在于设置在搁置表面1104上的粪便样本1102的形式的生物样本,其中图像1100还包括背景部分1106。该图还示出了图像的第一分割1110和图像的第二分割1112,第一分割基本上隔离粪便样本1102,第二分割仅隔离搁置表面1104,其可以用于进一步处理(例如,用于计算宽高比、用于图像归一化等)。
如本文所述,本教导内容的输出可以包括Bristol粪便评分,例如,其中根据本教导内容的一个或多个方面来分析粪便样本的图像。也就是说,在一个方面,经训练的模型可以用于输出预测,例如Bristol粪便评分。为此,颜色模型和几何模型可以各自用于基于不同特征来预测Bristol粪便评分。例如,对于任意图像,颜色模型可以预测Bristol粪便评分为4,而一致性模型可以预测Bristol粪便评分为3。可以包括模型系统的总体健康指数可以被计算为这些个体模型的预期平均值,其中可以根据需要添加权重、按照每种动物来进行修改。例如,可以对颜色和一致性进行均等加权(即,x=y=1),使得平均值=(4*x+3*y)/2。
如本文所述,本教导内容可以包括从生物样本的图像提取特征。从高层面看,可以从输入图像中以数学方式提取特征。例如,对于几何属性,输入图像可以被二值化,其中根据各种性质来计算像素距离。举例来说,对于长轴/短轴比,可以计算椭圆的中心,然后可以计算从中心到对应点的距离。这些单位可以是像素,这就是宽高比可以用于转换回另一形式(诸如英寸或毫米)的原因。
图12是为动物配制个性化产品的方法的流程图。应当理解,类似于本文所示和所述的其他方法,方法1200可以与本文所述的任何其他技术组合、作为其补充和/或替代。这样,应当理解,为动物配制个性化产品的方法1200可以包括使用生物样本的图像分析,例如其中这样的图像分析形成用于配制个性化产品的整个基础。
个性化产品可以包括个性化饮食产品。个性化饮食产品可以包括食物、补充剂、药物等中的一者或多者。为此,个性化饮食产品可以包括预定量的益生菌、益生元、消化酶、抗炎剂、天然提取物、维生素、矿物质、氨基酸、短链脂肪酸、油、配制剂等中的一者或多者。包括个性化饮食产品的个性化产品可以有利地基于对粪便样本形式的生物样本的分析而产生。
个性化产品还可以包括或替代地包括非饮食产品。例如,个性化产品可以包括美容产品、洗发剂、护发剂、乳液、乳霜、药物、滴耳剂、滴眼剂、局部用物质、牙膏、口腔冲洗剂、咀嚼物(例如,咀嚼玩具等,其可以提供健康益处,诸如口腔卫生)等中的一者或多者。包括非饮食产品的个性化产品可以有利地基于非粪便样本形式的生物样本(诸如动物的一部分例如如本文所述的毛皮、耳朵、嘴巴、眼睛等的图像)的分析而产生。
如步骤1202所示,方法1200可以包括接收其中包括生物样本例如粪便样本的图像。
如步骤1204所示,方法1200可以包括将模型应用于该图像以提取生物样本的一个或多个特征。该模型可以是如本文所述的任何模型,并且生物样本的特征的提取可以利用本文所述的任何图像分析技术。
如步骤1206所示,方法1200可以包括至少基于从该模型提取的生物样本的一个或多个特征,选择用于作为生物样本来源的动物的个性化产品的一种或多种成分。因此,方法1200可以包括通过为作为生物样本来源的动物选择一种或多种成分和使用含量来创建用于个性化产品的独特配方。这样,应当理解,个性化产品可以包括个性化配方。
如步骤1208所示,方法1200可以包括制备个性化产品,该制备可以包括组合该一种或多种成分(例如,以定制的使用含量)以形成个性化产品,例如,制备个性化配方。例如,这可以包括将所有成分合并成单一产品(例如,其中这些成分形成粉末、丸剂、糊剂、液体、固体等中的一者或多者)。这还可以包括或替代地包括将这些成分组合到单个容器或外壳中例如用于装运和/或运输,但是其中各个成分可以彼此分离,这对于特定的投配方案可以是有利的。
如步骤1210所示,方法1200可以包括包装个性化产品例如以便分配,诸如装运给用户。换句话说,这可以包括包装个性化配方例如以便分配(诸如装运给用户),从而包括个性化产品。
如步骤1212所示,方法1200可以包括将个性化产品分配给动物和与该动物相关联的用户中的一者或多者(例如,动物的主人、兽医、医生等)。
如步骤1214所示,方法1200可以包括为动物投配个性化产品。这可以包括分离特定剂量的个性化产品以便于最终用户使用。这还可以包括或替代地包括连同提供个性化产品二提供投配部件,诸如勺、匙、小瓶、量杯、注射器、小纸袋(例如泡罩包装、箔纸等)等。该投配方法还可以包括或替代地包括个性化投配部件以帮助确保个性化产品的准确施用。应当理解,个性化投配部件可以针对特定动物或一组动物定制。
下面通过示例描述本教导内容的几个其他方面。
数据整理和数据准备
粪便健康特征:
数据可以从源提取,诸如本地存储的或存储在云上的电子表格和/或关系/非关系数据库。数据可以被加载到软件中,诸如高级通用编程语言。数据可以根据需要进行转换(例如,将数据缩放为单位均值和方差)。在分析(例如,字符串格式化、移除空值、转换对象类型)之前,数据可继续被净化。可以将特征矩阵X格式化,并且可以标记向量y。特征矩阵X可以具有任意数量的属性和/或特征,包括几何属性、颜色属性等。特征向量y可以包含真实类别标签,例如Bristol粪便评分。
语义分割:
图像和对应的基本事实标签可以存储在数据源(例如,本地和/或云)中。可以从源(例如,本地和/或基于云的存储)提取图像。可以将图像的大小调整到标准大小或其他预定大小。可以扩充(例如,裁剪、垂直/水平翻转、剪切、旋转等)图像以将数据集大小增加到原始事实和基本事实两者。应当理解,这些步骤可以用软件自动化。
建模
粪便健康特征:
数据集被分成训练集、测试集和/或验证集,使用数据的一部分(例如,约70%至80%)来训练模型,其中保留一些数据(例如,约20%至30%)来对训练后的数据进行测试,并且一些数据(例如,约10%)用于在训练期间验证模型。然后可以创建模型,例如通过从包或定义的架构加载来创建。可以使用训练数据来训练模型,其中验证数据可选地馈入以在训练期间进行验证。可以利用测试数据来评估模型准确度,例如将预测与基本事实进行比较。可以使用诸如交叉验证、网格搜索等的例程来优化模型超参数,以提出可以导致期望的准确度、偏差和/或方差的参数。可以保存模型以在运行时调用,其中模型可以具有在运行时以编程方式调用的API。应当理解,这些步骤可以用软件自动化。
语义分割:
可以定义自定义卷积神经网络(CNN)架构或将已知的CNN架构(例如,U-Net)实例化。数据集被分成训练集、测试集和/或验证集,使用数据的一部分(例如,约70%至80%)来训练模型,其中保留一些数据(例如,约20%至30%)来对训练后的数据进行测试,并且一些数据(例如,约10%)用于在训练期间验证模型。可以使用训练数据来训练模型,其中验证数据可选地馈入以在训练期间进行验证。可以用测试数据来评估模型准确性,例如,将预测与基本事实(例如,DICE系数)进行比较。可以使用诸如交叉验证、网格搜索等的例程来优化模型超参数,以提出可以导致期望的准确度、偏差和/或方差的参数。可以保存模型以在运行时调用,其中模型可以具有在运行时以编程方式调用的API。
代码示例
应当理解,所公开的用于分析生物样本的图像以提供与其相关的动物的健康评估的技术的特定部分可以利用可以适于执行这些特定部分的预先存在的算法和/或模型。作为示例,现在将在此上下文中讨论特征工程。为了根据一个方面来执行粪便样本图像的特征工程,k均值颜色分割可以涉及从图像中提取前十个连续颜色区域以及计算百分比丰度(例如,颜色平面1可以占粪便的总面积的30%)。为了创建这些特征向量,可以对以大于约10%和约20%的丰度出现的平面进行计数。首先,可以将pandas导入为pd,并且本教导内容的一个方面可以使用groupby方法对高于相对丰度的平面的数量进行计数:
import pandas as pd
df=pd.read_csv('hex_codes_jpg_11june2020.csv')
over10=df.loc[df.Rel_Pct>0.1,:].groupby("Filename").count()['index']
over20=df.loc[df.Rel_Pct>0.2,:].groupby("Filename").count()['index']
#cast these back into original filenames so it can merge back ontothe original dataframe
以下是用于颜色均匀性特征工程的代码的示例:
Figure BDA0003494442030000441
Figure BDA0003494442030000451
以下是可以在一致性模型中使用的机器学习示例,该示例使用数据的变换(特征工程的一个方面)。首先,可以导入适当的库,并且可以使用sklearn train_test_split模块将数据分成测试数据集和训练数据集:
#import data
import pandas as pd
import matplotlib.pyplot as plt
import seaborn
import numpy as np
df=pd.read_excel("../Data/geometries_all.xlsx")
from sklearn.model_selection import train_test_split
x=df[["Area","Circularity","Eccentricity","Major Axis","MinorAxis","Perimeter"]].values
y=df["BSS"].values
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2,random_state=0)
然后可以开发/部署该机器学习模型。例如,以下示出了用于训练线性支持向量机(SVM)分类器并且利用该机器学习模型进行预测的示例性代码:
from sklearn.svm import SVC
from sklearn.preprocessing import StandardScaler
scaler=StandardScaler()
x_scaler=scaler.fit(x_train)
x_train_scaled=x_scaler.transform(x_train)
x_test_scaled=x_scaler.transform(x_test)
svm_model_linear=SVC(kernel='linear',C=1).fit(x_train,y_train)
svm_predictions=svm_model_linear.predict(x_test)
以下示出了用于计算模型准确度的示例性代码:
accuracy=svm_model_linear.score(x_test_scaled,y_test)
应当理解,仅通过示例和理解的方式提供本文所述的代码,并且可以使用其他类似的代码。此外,即使没有这样的代码示例,如何实践本教导内容对于本领域的技术人员也将是显而易见的,例如由于本文提供的关于本文所述的模型等的功能性的充分公开。本领域的技术人员还应当理解,上面提供的代码示例涉及从盘读取文件,例如原始文本文件,并且根据本文所述的本教导内容的重要细节,此类文件和代码可以由技术人员创建以重新创建本教导内容的各方面。
上述系统、设备、方法、过程等可以采用适于特定应用的硬件、软件或软硬件的任何组合来实现。硬件可以包括通用计算机和/或专用计算设备。这包括在一个或多个微处理器、微控制器、嵌入式微控制器、可编程数字信号处理器或其他可编程设备或处理电路中(连同内部和/或外部存储器)实现。这还可以包括或替代地包括一个或多个专用集成电路、可编程门阵列、可编程阵列逻辑组件或可以被配置为处理电子信号的任何其他一种或多种设备。还应当理解,上述过程或设备的实现可以包括使用结构化编程语言诸如C、面向对象的编程语言诸如C++或者可以被存储、编译或解释以在以上设备之一上运行的任何其他高级或低级编程语言(包括汇编语言、硬件描述语言和数据库编程语言和技术)创建的计算机可执行代码,以及处理器、处理器架构的异构组合,或不同硬件和软件的组合。在另一方面,这些方法可以在执行其步骤的系统中实现,并且可以采用多种方式在设备上分布。同时,处理可以在诸如上述各种系统的设备上分布,或者所有功能可以集成到专用的独立设备或其他硬件中。在另一方面,用于执行与上述过程相关联的步骤的装置可以包括上述硬件和/或软件中的任一者。所有这些排列和组合都旨在落入本公开的范围内。
本文所公开的实施方案可以包括计算机程序产品,该计算机程序产品包括当在一个或多个计算设备上执行时执行其任何和/或所有步骤的计算机可执行代码或计算机可用代码。该代码可以采用非暂态方式存储在计算机存储器中,该计算机存储器可以是程序从其执行的存储器(诸如与处理器相关联的随机存取存储器),或者存储设备,诸如盘驱动器、闪存存储器或任何其他光学、电磁、磁、红外或其他设备或设备的组合。在另一方面,上述系统和方法中的任一个可以体现在承载计算机可执行代码和/或该计算机可执行代码的任何输入或输出的任何合适的传输或传播介质中。
出于解释的目的,已经参考特定实施方案描述了前述描述。然而,以上例示性讨论不旨在是穷举的或将本公开限制在所公开的精确形式。根据上述教导内容,许多修改和变化是可能的。
除非上下文明确地要求,否则在整个说明书中,词语“包括”等应被解释为包含性的意义,而不是排他性或穷举性的意义;也就是说,为“包括但不限于”的意义。另外,词语“本文”、“下文”、“上文”、“下文”和类似意思的词语是指本申请的整体,而不是本申请的任何特定部分。
应当理解,上文所述的设备、系统和方法是通过举例的方式而非限制地陈述的。在没有明确的相反指示的情况下,在不脱离本公开的范围的前提下,可以修改、补充、省略和/或重新排序所公开的步骤。对于本领域的普通技术人员来说,许多变化、添加、省略和其他修改将是显而易见的。另外,除非明确要求特定顺序或者从上下文中清楚可见,否则上文的描述和附图中的方法步骤的顺序或呈现不旨在要求执行所叙述的步骤的这种顺序。
本文所述的具体实施的方法步骤旨在包括与所附权利要求的可专利性一致的使得执行此类方法步骤的任何合适的方法,除非明确地提供了不同的含义或者从上下文中清楚地知道不同的含义。因此,例如执行X的步骤包括用于使得另一方诸如远程用户、远程处理资源(例如,服务器或云计算机)或机器执行X的步骤的任何合适方法。类似地,执行步骤X、Y和Z可以包括指导或控制此类其他个体或资源的任何组合执行步骤X、Y和Z以获得此类步骤的益处的任何方法。因此,本文所述的具体实施的方法步骤旨在包括与所附权利要求的可专利性一致的使得一个或多个其他方或实体执行这些步骤的任何合适的方法,除非明确地提供了不同的含义或者从上下文中清楚地知道不同的含义。这些方或实体不需要受到任何其他方或实体的指导或控制,并且不需要位于特定管辖范围内。
还应当理解,上述方法是作为示例提供的。在没有明确的相反指示的情况下,在不脱离本公开的范围的前提下,可以修改、补充、省略和/或重新排序所公开的步骤。
应当理解,上述方法和系统是通过举例的方式而非限制地陈述的。对于本领域的普通技术人员来说,许多变化、添加、省略和其他修改将是显而易见的。另外,除非明确要求特定顺序或者从上下文中清楚可见,否则上文的描述和附图中的方法步骤的顺序或呈现不旨在要求执行所叙述的步骤的这种顺序。因此,虽然已经示出和描述了特定实施方案,但是对于本领域的技术人员来说显而易见的是,在不脱离本公开的实质和范围的情况下,可以在形式和细节上进行各种改变和修改,并且这些改变和修改旨在形成由所附权利要求限定的本发明的一部分,所附权利要求将在法律允许的最广泛的意义上进行解释。

Claims (114)

1.一种分析粪便样本图像以提供动物的健康评估的方法,所述方法包括:
接收从包括粪便样本的图像内的一个或多个感兴趣区域计算的所述粪便样本的一个或多个特征;
使用通过识别粪便的一个或多个基于图像的特征与粪便中的微生物组特性和代谢组特性中的一者或多者之间的多个关联而创建的模型,将所述粪便样本的所述一个或多个特征应用于所述模型中的所述多个关联以确定所述粪便样本中的微生物组和代谢组中的一者或多者的状态的可能性;
至少基于所述微生物组和所述代谢组中的一者或多者的所述状态的所述可能性,预测留存所述粪便样本的动物的健康特性;以及
根据所述健康特性来提供治疗。
2.根据权利要求1所述的方法,其中所述治疗包括用于所述动物的定制健康计划。
3.根据权利要求2所述的方法,其中所述定制健康计划包括行为改变和饮食改变中的一者或多者。
4.根据权利要求2至3中任一项所述的方法,其中所述定制健康计划包括关于饮食、睡眠、锻炼和活动中的一者或多者的推荐。
5.根据前述权利要求中任一项所述的方法,其中所述治疗包括食物、补充剂和药物中的一者或多者。
6.根据前述权利要求中任一项所述的方法,其中所述治疗包括用于所述动物的个性化饮食补充剂。
7.根据权利要求6所述的方法,其中所述个性化饮食补充剂包括预定量的益生菌、益生元、消化酶、抗炎剂、天然提取物、维生素、矿物质、氨基酸、短链脂肪酸、油和配制剂中的一者或多者。
8.根据前述权利要求中任一项所述的方法,其中所述一个或多个特征涉及所述粪便样本的几何属性、颜色属性和质地属性中的至少一者。
9.根据前述权利要求中的任一项所述的方法,其中所述一个或多个特征涉及所述粪便样本的几何属性、颜色属性和质地属性,并且其中所述几何属性包括几何性质和与几何形状相关的导出属性中的一者或多者,所述颜色属性包括颜色和与所述颜色相关的导出属性中的一者或多者,并且所述质地属性包括质地性质和与质地相关的导出属性中的一者或多者。
10.根据前述权利要求中任一项所述的方法,其中使用卷积神经网络(CNN)模型来计算所述一个或多个特征。
11.根据前述权利要求中任一项所述的方法,还包括:
接收所述图像;
识别并提取所述图像内的一个或多个感兴趣区域以用于进一步分析,所述一个或多个感兴趣区域至少包括其中仅具有所述粪便样本的第一感兴趣区域;以及
计算所述粪便样本的几何属性、颜色属性和质地属性中的至少一者以识别所述粪便样本的所述一个或多个特征。
12.根据前述权利要求中任一项的方法,还包括提供关于所述动物的包括所述健康特性的报告。
13.根据前述权利要求中任一项所述的方法,其中所述粪便样本的所述一个或多个特征包括颜色、质地、二进制数的数量、面积、周长、圆度、质量、偏心率、长轴、短轴、粘度、稠度、含水量、硬度、范围、等效直径、镜面反射性、相干性、反射率、扩散性和非粪便物质的存在中的至少一者。
14.根据权利要求13所述的方法,其中所述粪便样本的所述一个或多个特征包括所述质量,并且其中所述质量是从所述粪便样本的几何形状和所述质地属性计算而来的。
15.根据权利要求13至14中任一项所述的方法,其中所述粪便样本的所述一个或多个特征包括所述质量,并且其中所述质量是从所述粪便样本的颜色和导出的颜色向量中的至少一者计算而来的。
16.根据前述权利要求中任一项所述的方法,其中所述健康特性包括Bristol粪便评分。
17.根据前述权利要求中任一项所述的方法,其中包括所述粪便样本的所述图像包括其上具有标记的搁置表面,所述标记包括已知尺寸、已知形状和已知颜色中的一者或多者,其中所述标记至少部分地用于计算所述粪便样本的所述一个或多个特征。
18.根据前述权利要求中任一项所述的方法,还包括接收与所述图像相关联的元数据,所述元数据包括与所述动物的健康、行为、当前饮食、补充剂、药物、种族信息、品种、体重、所述粪便样本的重量和所述动物的大小中的一者或多者有关的问卷调查回答,并且其中所述元数据至少部分地用于预测所述健康特性。
19.一种用于分析粪便样本图像以提供动物的健康评估的计算机程序产品,所述计算机程序产品包括体现在非暂态计算机可读介质中的计算机可执行代码,当在一个或多个计算设备上执行时,所述计算机可执行代码执行以下步骤:
接收从包括粪便样本的图像内的一个或多个感兴趣区域计算的所述粪便样本的一个或多个特征;
使用通过识别粪便的一个或多个基于图像的特征与粪便中的微生物组特性和代谢组特性中的一者或多者之间的多个关联而创建的模型,将所述粪便样本的所述一个或多个特征应用于所述模型中的所述多个关联以确定所述粪便样本中的微生物组和代谢组中的一者或多者的状态的可能性;
至少基于所述微生物组和所述代谢组中的一者或多者的所述状态的所述可能性,预测留存所述粪便样本的动物的健康特性;以及
根据所述健康特性来提供治疗。
20.一种用于分析粪便样本图像以提供动物的健康评估的系统,所述系统包括:
数据网络;
耦接到所述数据网络的用户设备;和
远程计算资源,所述远程计算资源耦接到所述数据网络并且可由所述用户设备通过所述数据网络访问,所述远程计算资源包括处理器和存储器,所述存储器存储可由所述处理器执行以执行以下步骤的代码:
通过所述数据网络从所述用户设备接收包括粪便样本的图像;
接收从所述图像内的一个或多个感兴趣区域计算的所述粪便样本的一个或多个特征;
使用通过识别粪便的一个或多个基于图像的特征与粪便中的微生物组特性和代谢组特性中的一者或多者之间的多个关联而创建的模型,将所述粪便样本的所述一个或多个特征应用于所述模型中的所述多个关联以确定所述粪便样本中的微生物组和代谢组中的一者或多者的状态的可能性;
至少基于所述微生物组和所述代谢组中的一者或多者的所述状态的所述可能性,预测留存所述粪便样本的动物的健康特性;以及
根据所述健康特性而通过所述数据网络向所述用户设备发送治疗。
21.一种分析粪便样本图像以提供动物的健康评估的方法,所述方法包括:
接收图像,所述图像包括粪便样本;
识别并提取所述图像内的一个或多个感兴趣区域以用于进一步分析,所述一个或多个感兴趣区域至少包括其中仅具有所述粪便样本的第一感兴趣区域;
计算所述第一感兴趣区域中的几何属性、质地属性和颜色属性中的一者或多者以识别所述粪便样本的一个或多个特征;以及
将模型应用于所述粪便样本的所述一个或多个特征,所述模型预测留存所述粪便样本的动物的健康特性。
22.根据权利要求21所述的方法,还包括根据所述健康特性来提供治疗。
23.根据权利要求22所述的方法,其中所述治疗包括用于所述动物的定制健康计划。
24.根据权利要求23所述的方法,其中所述定制健康计划包括行为改变和饮食改变中的一者或多者。
25.根据权利要求23至24中任一项所述的方法,其中所述定制健康计划包括关于饮食、睡眠、锻炼和活动中的一者或多者的推荐。
26.根据权利要求22至25中任一项所述的方法,其中所述治疗包括食物、补充剂和药物中的一者或多者。
27.根据权利要求22至26中任一项所述的方法,其中所述治疗包括用于所述动物的个性化饮食补充剂。
28.根据权利要求27所述的方法,其中所述个性化饮食补充剂包括预定量的益生菌、益生元、消化酶、抗炎剂、天然提取物、维生素、矿物质、氨基酸、短链脂肪酸、油和配制剂中的一者或多者。
29.根据权利要求22至28中任一项所述的方法,还包括根据参考数据库分析所述粪便样本的所述一个或多个特征以确定所述健康特性或所述治疗中的一者或多者。
30.根据权利要求29所述的方法,其中所述参考数据库是包括来自其他粪便样本的分析的数据的历史数据库。
31.根据权利要求30的方法,其中至少一种所述其他粪便样本来自留存所述粪便样本的所述动物。
32.根据权利要求30所述的方法,其中所述其他粪便样本来自与留存所述粪便样本的所述动物不同的动物。
33.根据权利要求22至32中任一项所述的方法,还包括根据参考数据库分析所述健康特性以确定所述治疗。
34.根据权利要求33所述的方法,其中所述参考数据库是包括来自其他粪便样本的分析的数据的历史数据库。
35.根据权利要求21至34中任一项的方法,还包括提供关于所述动物的包括所述健康特性的报告。
36.根据权利要求21至35中任一项所述的方法,其中所述模型包括机器学习模型和概率模型中的一者或多者。
37.根据权利要求21至36中任一项所述的方法,还包括使用所述粪便样本的所述一个或多个特征来训练所述模型。
38.根据权利要求21至37中任一项所述的方法,其中所述模型是推荐引擎的一部分,所述推荐引擎被配置为根据所述健康特性提供对治疗的一个或多个推荐。
39.根据权利要求21至38中任一项所述的方法,其中提取所述一个或多个感兴趣区域包括至少部分地由所述模型执行的所述图像的分割。
40.根据权利要求21至39中任一项所述的方法,其中所述健康特性包括Bristol粪便量表上的分类。
41.根据权利要求40所述的方法,其中所述分类至少部分基于所述颜色属性。
42.根据权利要求41所述的方法,其中所述颜色属性至少部分地用于确定与所述粪便样本的一致性相关的属性。
43.根据权利要求21至42中任一项所述的方法,其中所述模型将权重和评分中的一者或多者应用于所述一个或多个特征以预测所述健康特性。
44.根据权利要求43所述的方法,其中所述权重和所述评分是为留存所述粪便样本的所述动物定制的。
45.根据权利要求21至44中任一项所述的方法,还包括对所述粪便样本进行微生物组DNA基因测序,并且应用来自所述微生物组DNA基因测序的结果作为预测所述动物的所述健康特性的因素。
46.根据权利要求21至45中任一项的方法,还包括对所述粪便样本进行代谢物组测序,并将应用来自所述代谢物组测序的结果作为预测所述动物的所述健康特性的因素。
47.根据权利要求21至46中任一项的方法,还包括对所述粪便样本进行进一步分析,包括质谱、电导和流变学中的一者或多者,以及使用所述进一步分析的结果作为预测所述动物的所述健康特性的因素。
48.根据权利要求21至47中任一项所述的方法,其中所述粪便样本的所述一个或多个特征包括颜色、质地、二进制数的数量、面积、周长、圆度、质量、偏心率、长轴、短轴、粘度、稠度、含水量、硬度、范围、等效直径、镜面反射性、相干性、反射率、扩散性和非粪便物质的存在中的至少一者。
49.根据权利要求48所述的方法,其中所述粪便样本的所述一个或多个特征包括所述质量,并且其中所述质量是从所述粪便样本的几何形状和所述质地属性计算而来的。
50.根据权利要求48至49中任一项所述的方法,其中所述粪便样本的所述一个或多个特征包括所述质量,并且其中所述质量是从所述粪便样本的颜色和导出的颜色向量中的至少一者计算而来的。
51.根据权利要求48至50中的任一项所述的方法,其中所述粪便样本的所述一个或多个特征包括所述非粪便物质的存在,其中所述非粪便物质包括外来物。
52.根据权利要求51所述的方法,其中所述外来物包括寄生虫和病原体中的一者或多者。
53.根据权利要求21至52中任一项所述的方法,其中计算所述几何属性包括:
将所述第一感兴趣区域转换成灰度;
将所述第一感兴趣区域转换成二进制;以及
将一个或多个形态学操作应用于所述第一感兴趣区域。
54.根据权利要求21至53中任一项所述的方法,其中计算所述质地属性包括使用灰度共生矩阵(GLCM)。
55.根据权利要求54所述的方法,其中使用所述GLCM包括绘制多个点以识别其聚类。
56.根据权利要求21至55中任一项所述的方法,其中所述颜色属性是红-绿-蓝颜色模型、红-绿-蓝-α颜色模型、色调-饱和度-值颜色模型和CIELAB颜色模型中的一者。
57.根据权利要求21至56中任一项所述的方法,其中使用多维颜色平面来计算所述色彩属性。
58.根据权利要求21至57中任一项所述的方法,其中所述图像包括元数据。
59.根据权利要求58所述的方法,其中所述元数据包括时间、日期和地理位置中的一者或多者。
60.根据权利要求21至59中任一项所述的方法,还包括接收与所述图像相关联的元数据。
61.根据权利要求60所述的方法,其中所述元数据包括与所述动物的健康、行为、当前饮食、补充剂、药物、种族信息、品种、体重、所述粪便样本的重量和所述动物的大小中的一者或多者相关的问卷调查回答。
62.根据权利要求60至61中任一项所述的方法,其中所述元数据包括对所述粪便样本的DNA基因测序。
63.根据权利要求60至62中任一项所述的方法,其中所述元数据包括地理位置信息和生理信息中的一者或多者。
64.根据权利要求60至63中任一项所述的方法,其中所述元数据包括基本事实属性。
65.根据权利要求64所述的方法,其中所述基本事实属性包括所述粪便样本的重量、Bristol粪便评分和手动分割中的一者或多者。
66.根据权利要求60至65中任一项所述的方法,其中所述元数据包括历史数据。
67.根据权利要求21至66中任一项所述的方法,其中所述图像存储在远程数据库中。
68.根据权利要求67所述的方法,其中接收所述图像包括从所述远程数据库检索所述图像。
69.根据权利要求21至68中任一项所述的方法,其中所述图像包括不同于所述粪便样本的背景,并且其中所述一个或多个感兴趣区域包括其中具有所述背景的至少一部分的第二感兴趣区域。
70.根据权利要求69所述的方法,其中提取所述一个或多个感兴趣区域包括在所述图像的至少一部分内识别所述粪便样本和所述背景。
71.根据权利要求70所述的方法,还包括基于仅所述粪便样本的识别来创建所述第一感兴趣区域,以及基于所述粪便样本的一部分和所述背景的一部分的识别来创建所述第二感兴趣区域。
72.根据权利要求69至71中任一项所述的方法,还包括对所述第一感兴趣区域和所述第二感兴趣区域进行分类以对它们进行单独分析。
73.根据权利要求21至72中任一项所述的方法,其中提取所述一个或多个感兴趣区域包括所述图像的手动分割。
74.根据权利要求21至73中任一项所述的方法,其中提取所述一个或多个感兴趣区域包括所述图像的自动分割。
75.根据权利要求74所述的方法,其中所述自动分割包括利用使用深度学习的一个或多个语义分割模型。
76.根据权利要求75所述的方法,其中基本事实数据被用作所述一个或多个语义分割模型中的输入,以训练和验证所述一个或多个语义分割模型。
77.根据权利要求75至76中任一项所述的方法,其中所述一个或多个语义分割模型包括U-Net网络。
78.根据权利要求75至77中任一项所述的方法,其中所述一个或多个语义分割模型与数据扩充、k折叠和数据的附加输入中的至少一者一起使用。
79.根据权利要求21至78中任一项所述的方法,其中提取所述一个或多个感兴趣区域包括所述图像的手动分割和所述图像的自动分割的组合。
80.根据权利要求21至79中任一项所述的方法,其中所述图像包括与所述粪便样本不同的背景。
81.根据权利要求80所述的方法,其中所述一个或多个感兴趣区域包括其中具有所述背景的至少一部分的第二感兴趣区域。
82.根据权利要求81所述的方法,还包括将所述第一感兴趣区域和所述第二感兴趣区域中的一者或多者归一化以考虑图像可变性,从而创建归一化图像以用于进一步的标准化分析。
83.根据权利要求82所述的方法,其中识别所述粪便样本的所述一个或多个特征通过分析所述归一化图像而发生。
84.根据权利要求82至83中任一项所述的方法,其中将所述一个或多个感兴趣区域归一化包括:
从所述第二感兴趣区域提取所述粪便样本的颜色属性和维度属性;
使用所提取的颜色属性和所提取的维度属性计算用于颜色和宽高比的校正因子;以及
将所述校正因子应用于所述第一感兴趣区域。
85.根据权利要求84所述的方法,其中所述第二感兴趣区域中的背景上的标记用于提取所述颜色属性和所述维度属性中的一者或多者。
86.根据权利要求85所述的方法,其中所述标记具有已知大小和已知形状中的一者或多者。
87.根据权利要求85至86中任一项所述的方法,其中所述标记包括一个或多个字母数字字符。
88.根据权利要求85至87中任一项所述的方法,其中所述标记包括多种颜色。
89.根据权利要求84至88中任一项所述的方法,其中所述维度属性包括长度。
90.根据权利要求82至89中任一项所述的方法,其中将所述一个或多个感兴趣区域归一化考虑了在捕获所述图像时使用的一个或多个图像采集设置。
91.根据权利要求90所述的方法,其中所述一个或多个图像采集设置包括焦距、颜色设置、照明设置和放大率中的一者或多者。
92.根据权利要求82至91中任一项所述的方法,其中将所述一个或多个感兴趣区域归一化包括调整所述一个或多个感兴趣区域的大小。
93.根据权利要求92所述的方法,其中所述背景包括其上具有预定标记的搁置表面。
94.一种用于分析粪便样本图像以提供动物的健康评估的计算机程序产品,所述计算机程序产品包括体现在非暂态计算机可读介质中的计算机可执行代码,当在一个或多个计算设备上执行时,所述计算机可执行代码执行以下步骤:
接收图像,所述图像包括粪便样本;
识别并提取所述图像内的一个或多个感兴趣区域以用于进一步分析,所述一个或多个感兴趣区域至少包括其中仅具有所述粪便样本的第一感兴趣区域;
计算所述第一感兴趣区域中的几何属性、质地属性和颜色属性中的一者或多者以识别所述粪便样本的一个或多个特征;以及
将模型应用于所述粪便样本的所述一个或多个特征,所述模型预测留存所述粪便样本的动物的健康特性。
95.一种用于分析粪便样本图像以提供动物的健康评估的系统,所述系统包括:
数据网络;
耦接到所述数据网络的用户设备;和
远程计算资源,所述远程计算资源耦接到所述数据网络并且可由所述用户设备通过所述数据网络访问,所述远程计算资源包括处理器和存储器,所述存储器存储可由所述处理器执行以执行以下步骤的代码:
通过所述数据网络从所述用户设备接收图像,所述图像包括粪便样本;
识别并提取所述图像内的一个或多个感兴趣区域以用于进一步分析,所述一个或多个感兴趣区域至少包括其中仅具有所述粪便样本的第一感兴趣区域;
计算所述第一感兴趣区域中的几何属性、质地属性和颜色属性中的一者或多者以识别所述粪便样本的一个或多个特征;以及
将模型应用于所述粪便样本的所述一个或多个特征,所述模型预测留存所述粪便样本的动物的健康特性。
96.根据权利要求95所述的系统,其中所述代码还执行根据所述健康特性而通过所述数据网络向所述用户设备发送治疗的步骤。
97.一种分析图像以提供动物的健康评估的方法,所述方法包括:
接收图像,所述图像包括所述动物的生物样本;
识别并提取所述图像内的一个或多个感兴趣区域以用于进一步分析,所述一个或多个感兴趣区域至少包括其中仅具有所述生物样本的第一感兴趣区域;
计算所述第一感兴趣区域中的几何属性、质地属性和颜色属性中的一者或多者以识别所述生物样本的一个或多个特征;以及
将模型应用于所述生物样本的所述一个或多个特征,所述模型预测作为所述生物样本来源的动物的健康特性。
98.根据权利要求97所述的方法,其中所述生物样本包括所述动物的皮肤、所述动物的毛皮、所述动物的嘴巴的一部分、所述动物的耳朵的一部分、所述动物的眼睛的一部分和所述动物的鼻子的一部分中的一者或多者。
99.根据权利要求97至98中任一项所述的方法,还包括根据所述健康特性来提供治疗。
100.根据权利要求97至99中任一项所述的方法,其中所述处理包括用于所述动物的个性化产品。
101.根据权利要求100所述的方法,其中所述个性化产品包括食物、补充物和药物中的一者或多者。
102.根据权利要求100至101中任一项所述的方法,其中所述个性化产品包括美容产品、洗发剂、护发剂、乳液、乳霜、药物、滴耳剂、滴眼剂、局部用物质、牙膏、口腔冲洗剂和咀嚼物中的一者或多者。
103.一种分析生物样本图像以提供动物的健康评估的方法,所述方法包括:
接收从包括生物样本的图像内的一个或多个感兴趣区域计算的所述生物样本的一个或多个特征;
使用通过识别生物样本的一个或多个基于图像的特征与微生物组特性和代谢组特性中的一者或多者之间的多个关联而创建的模型,将所述生物样本的所述一个或多个特征应用于所述模型中的所述多个关联以确定所述生物样本中的微生物组和代谢组中的一者或多者的状态的可能性;
至少基于所述微生物组和所述代谢组中的一者或多者的所述状态的所述可能性,预测作为所述生物样本来源的动物的健康特性;以及
根据所述健康特性来提供治疗。
104.根据权利要求103所述的方法,其中所述生物样本包括粪便样本。
105.一种为动物配制个性化产品的方法,所述方法包括:
接收其中包括生物样本的图像;
将模型应用于所述图像以提取所述生物样本的一个或多个特征;以及
至少基于从所述模型提取的所述生物样本的所述一个或多个特征,选择用于作为所述生物样本来源的动物的个性化产品的一种或多种成分。
106.根据权利要求105所述的方法,还包括:
组合所述一种或多种成分以形成所述个性化产品;
包装所述个性化产品;以及
将所述个性化产品分配给所述动物和与所述动物相关联的用户中的一者或多者。
107.根据权利要求106所述的方法,还包括为所述动物投配所述个性化产品。
108.根据权利要求105至107中任一项所述的方法,其中所述个性化产品包括个性化饮食产品。
109.根据权利要求108所述的方法,其中所述个性化饮食产品包括食物、补充物和药物中的一者或多者。
110.根据权利要求108至109中任一项所述的方法,其中所述个性化饮食产品包括预定量的益生菌、益生元、消化酶、抗炎剂、天然提取物、维生素、矿物质、氨基酸、短链脂肪酸、油和配制剂中的一者或多者。
111.根据权利要求105至110中任一项所述的方法,其中所述个性化产品包括美容产品、洗发剂、护发剂、乳液、乳霜、药物、滴耳剂、滴眼剂、局部用物质、牙膏和口腔冲洗剂中的一者或多者。
112.一种个性化产品,所述个性化产品包括从生物样本的一个或多个特征的基于计算机的分析得出的一种或多种成分,所述生物样本的所述一个或多个特征从应用于包括所述生物样本的图像的模型提取得到。
113.根据权利要求112所述的个性化产品,其中所述生物样本是粪便,并且其中所述个性化产品包括个性化饮食产品。
114.根据权利要求113所述的个性化产品,其中所述一种或多种成分包括预定量的益生菌、益生元、消化酶、抗炎剂、天然提取物、维生素、矿物质、氨基酸、短链脂肪酸、油和配制剂中的一者或多者。
CN202080055184.5A 2019-07-31 2020-07-31 动物健康评估 Pending CN114175178A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962880836P 2019-07-31 2019-07-31
US62/880,836 2019-07-31
PCT/US2020/044507 WO2021022162A1 (en) 2019-07-31 2020-07-31 Animal health assessment

Publications (1)

Publication Number Publication Date
CN114175178A true CN114175178A (zh) 2022-03-11

Family

ID=72087317

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202080055184.5A Pending CN114175178A (zh) 2019-07-31 2020-07-31 动物健康评估
CN202180059411.6A Pending CN116686002A (zh) 2019-07-31 2021-01-28 用于动物健康评估的粘液分析

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202180059411.6A Pending CN116686002A (zh) 2019-07-31 2021-01-28 用于动物健康评估的粘液分析

Country Status (9)

Country Link
US (2) US11803962B2 (zh)
EP (2) EP4004938A1 (zh)
KR (2) KR20220038698A (zh)
CN (2) CN114175178A (zh)
AU (2) AU2020322038A1 (zh)
BR (1) BR112022001383A2 (zh)
CA (2) CA3148217A1 (zh)
IL (1) IL300251A (zh)
WO (2) WO2021022162A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11894143B2 (en) * 2013-08-27 2024-02-06 Whiskers Worldwide, LLC System and methods for integrating animal health records
KR20220038698A (ko) 2019-07-31 2022-03-29 디그 랩스 코퍼레이션 동물 건강 평가
US11763920B2 (en) 2019-07-31 2023-09-19 Dig Labs Corporation Mucus analysis for animal health assessments
US11426117B2 (en) * 2020-12-29 2022-08-30 Kpn Innovations, Llc. Methods and systems for dietary communications using intelligent systems regarding endocrinal measurements
EP4044190A1 (fr) * 2021-02-10 2022-08-17 Ceva Santé Animale Système interactif de support à une démarche d' évaluation vétérinaire
CN115211388B (zh) * 2021-04-15 2023-12-05 深圳市中融数字科技有限公司 牲畜健康监控方法、装置、存储介质及电子设备
KR102532554B1 (ko) * 2021-04-26 2023-05-18 주식회사 디랩스 IoT 반려동물 화장실을 이용한 건강 관리 서비스 제공 시스템
WO2023283252A1 (en) * 2021-07-06 2023-01-12 Toi Labs, Inc. System, method and apparatus to detect health abnormality in patients
KR102330858B1 (ko) * 2021-08-03 2021-11-25 주식회사 넘버제로 배변 시트 대변 이미지를 활용한 반려 동물 대변 상태 분석 정보 제공 방법, 장치 및 시스템
WO2023055238A1 (en) * 2021-10-01 2023-04-06 HORAIZON technology B.V. A method and system for analyzing intestinal microflora of a subject
JP7424651B2 (ja) * 2021-10-28 2024-01-30 Necプラットフォームズ株式会社 排泄物分析装置、排泄物分析方法、及びプログラム
CN114383967A (zh) * 2021-12-30 2022-04-22 牧原食品股份有限公司 用于获取禽畜固粪含水率的方法、设备和可读存储介质
CN114299047A (zh) * 2021-12-31 2022-04-08 宁波峰誉科技有限公司 一种基于计算机视觉的排泄物分析与预警系统及智能马桶
WO2023203643A1 (ja) * 2022-04-19 2023-10-26 株式会社Peco 獣医療支援システム、獣医療支援方法及びプログラム
WO2023211736A1 (en) * 2022-04-25 2023-11-02 Mars, Incorporated Systems and methods for recommending a food product based on characteristics of an animal
KR102469755B1 (ko) * 2022-07-14 2022-11-23 블랙썬 주식회사 반려동물 관리시스템
CN116936133B (zh) * 2023-09-18 2023-12-08 四川互慧软件有限公司 一种基于护理晨交班数据的营养状况监测方法和系统
CN117409973B (zh) * 2023-12-13 2024-05-17 成都大熊猫繁育研究基地 一种基于家族数据的大熊猫健康评估方法和系统

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6861053B1 (en) 1999-08-11 2005-03-01 Cedars-Sinai Medical Center Methods of diagnosing or treating irritable bowel syndrome and other disorders caused by small intestinal bacterial overgrowth
PT862863E (pt) 1997-01-09 2002-04-29 Nestle Sa Produto cerealifero contendo probioticos
US20030212574A1 (en) 2002-05-08 2003-11-13 Olivier Pierre D. System and method for online personalized veterinary advice for pets
US7833795B2 (en) * 2004-08-24 2010-11-16 The Trustees Of The University Of Pennsylvania Assessment of cardiovascular risk using isoprostane biomarkers and COX-2 selective inhibitors
US20060099310A1 (en) 2004-11-10 2006-05-11 Ralph Koekkoek Personalized nutritional supplement
US8968806B2 (en) 2005-04-26 2015-03-03 Sean Joseph Delaney Method and system for creating and using a supplement to balance animal diets
US20090006127A1 (en) 2007-06-27 2009-01-01 Mory Bahar Personalized nutrition advisor
MX2012000740A (es) 2009-07-15 2012-05-08 Pharmavite Direct Llc Sistema y metodo para proporcionar un envase diario de complemento nutricional personalizado.
US8762167B2 (en) 2010-07-27 2014-06-24 Segterra Inc. Methods and systems for generation of personalized health plans
US20130052624A1 (en) 2011-08-25 2013-02-28 Miguel Saps Tridimensional stool assessment instrument, methods, and uses thereof
WO2014018805A2 (en) 2012-07-25 2014-01-30 Theranos,Inc. Image analysis and measurement of biological samples
KR101421679B1 (ko) 2012-10-30 2014-07-24 안명구 개인별 맞춤 영양제 조제장치
JP6454321B2 (ja) * 2013-03-15 2019-01-16 ネステク ソシエテ アノニム カスタムペットフードを発注及び製造するためのシステム及び方法
SI3003330T1 (sl) 2013-06-05 2018-11-30 Rebiotix, Inc. Terapija za ponovno vzpostavitev mikrobiote (MRT),sestavki in postopki proizvodnje
US9633831B2 (en) 2013-08-26 2017-04-25 Rohm And Haas Electronic Materials Cmp Holdings, Inc. Chemical mechanical polishing composition for polishing a sapphire surface and methods of using same
US10329628B2 (en) 2014-01-25 2019-06-25 uBiome, Inc. Method and system for microbiome analysis
CA2946937A1 (en) 2014-05-21 2015-11-26 Nestec S.A. System, process and device for producing a nutritional composition with personalized nutrient content
JP5861977B2 (ja) 2014-06-18 2016-02-16 関根 弘一 大便色検知装置
CN104152375B (zh) * 2014-07-18 2016-08-24 齐齐哈尔大学 一株脱氨除臭菌株qdn01及其在生物除臭中的应用
WO2016065075A1 (en) 2014-10-21 2016-04-28 uBiome, Inc. Method and system for microbiome-derived diagnostics and therapeutics
US10332418B2 (en) 2015-11-23 2019-06-25 International Business Machines Corporation Personalized vitamin supplement
CN105574899B (zh) * 2015-12-15 2018-08-07 浙江大学 笼养鸡的粪便监测方法及系统
ES2771223T3 (es) 2016-02-14 2020-07-06 Yeda Res & Dev Diagnóstico, predicción y tratamiento de la obesidad recidivante basados en el microbioma
US20180211380A1 (en) * 2017-01-25 2018-07-26 Athelas Inc. Classifying biological samples using automated image analysis
SG11201908090VA (en) 2017-04-07 2019-10-30 Toi Labs Inc Biomonitoring devices, methods, and systems for use in a bathroom setting
US10255693B2 (en) * 2017-05-02 2019-04-09 Techcyte, Inc. Machine learning classification and training for digital microscopy images
CN107542136A (zh) 2017-09-04 2018-01-05 俞若昕 智能无异味坐便器
WO2019232295A1 (en) 2018-06-01 2019-12-05 Progenity, Inc. Devices and systems for gastrointestinal microbiome detection and manipulation
US11355249B2 (en) 2019-04-29 2022-06-07 Petriage, Inc. Pet evaluation and triage system
KR20220038698A (ko) 2019-07-31 2022-03-29 디그 랩스 코퍼레이션 동물 건강 평가

Also Published As

Publication number Publication date
CN116686002A (zh) 2023-09-01
CA3148217A1 (en) 2021-02-04
US20240161286A1 (en) 2024-05-16
BR112022001383A2 (pt) 2022-03-22
CA3186330A1 (en) 2022-02-03
EP4004938A1 (en) 2022-06-01
AU2021314627A1 (en) 2023-03-09
WO2022025982A1 (en) 2022-02-03
IL300251A (en) 2023-03-01
US11803962B2 (en) 2023-10-31
EP4189640A1 (en) 2023-06-07
AU2020322038A1 (en) 2022-02-17
KR20230048050A (ko) 2023-04-10
KR20220038698A (ko) 2022-03-29
WO2021022162A1 (en) 2021-02-04
US20210035289A1 (en) 2021-02-04

Similar Documents

Publication Publication Date Title
US11803962B2 (en) Animal health assessment
US10482603B1 (en) Medical image segmentation using an integrated edge guidance module and object segmentation network
US11763920B2 (en) Mucus analysis for animal health assessments
US20200303072A1 (en) Method and system for supporting medical decision making
Petrellis A review of image processing techniques common in human and plant disease diagnosis
Li et al. Individual beef cattle identification using muzzle images and deep learning techniques
Anantharaman et al. Oro vision: Deep learning for classifying orofacial diseases
Hansen et al. Towards facial expression recognition for on-farm welfare assessment in pigs
Degu et al. Smartphone based detection and classification of poultry diseases from chicken fecal images using deep learning techniques
Majewski et al. Multipurpose monitoring system for edible insect breeding based on machine learning
Alghamdi et al. Facial expressions based automatic pain assessment system
Geisler et al. A role for artificial intelligence in the classification of craniofacial anomalies
Özdil et al. Automatic body part and pose detection in medical infrared thermal images
Liew et al. Distinctions between Choroidal Neovascularization and Age Macular Degeneration in Ocular Disease Predictions via Multi-Size Kernels ξcho-Weighted Median Patterns
Sumathi et al. Segmenting and classifying MRI multimodal images using cuckoo search optimization and KNN classifier
Wongkhuenkaew et al. Fuzzy K-nearest neighbor based dental fluorosis classification using multi-prototype unsupervised possibilistic fuzzy clustering via cuckoo search algorithm
Lake et al. Application of artificial intelligence algorithm in image processing for cattle disease diagnosis
Hao et al. Skeletal bone age assessment based on deep convolutional neural networks
Balasso et al. Uncovering Patterns in Dairy Cow Behaviour: A Deep Learning Approach with Tri-Axial Accelerometer Data
Himel et al. Vision intelligence for smart sheep farming: applying ensemble learning to detect sheep breeds
Kasab-Bachi et al. The use of large databases to inform the development of an intestinal scoring system for the poultry industry
KR102488264B1 (ko) 반려동물의 상태정보를 이용한 인공지능 기반 급여 관리 서비스 제공 시스템
Çakmakçı et al. Discovering the hidden personality of lambs: Harnessing the power of Deep Convolutional Neural Networks (DCNNs) to predict temperament from facial images
Kim et al. Pet dog disease pre-diagnosis system for caregiver with possibilistic C-Means clustering and disease database
Kim et al. Analysis of Various Facial Expressions of Horses as a Welfare Indicator Using Deep Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination