JP4354977B2 - フローサイトメーター多次元データセット内のデータの離散母集団(例えば、クラスター)を識別する方法 - Google Patents
フローサイトメーター多次元データセット内のデータの離散母集団(例えば、クラスター)を識別する方法 Download PDFInfo
- Publication number
- JP4354977B2 JP4354977B2 JP2006215781A JP2006215781A JP4354977B2 JP 4354977 B2 JP4354977 B2 JP 4354977B2 JP 2006215781 A JP2006215781 A JP 2006215781A JP 2006215781 A JP2006215781 A JP 2006215781A JP 4354977 B2 JP4354977 B2 JP 4354977B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- data set
- population
- event
- expert knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 239000000203 mixture Substances 0.000 claims abstract description 97
- 230000006870 function Effects 0.000 claims abstract description 80
- 230000009466 transformation Effects 0.000 claims abstract description 43
- 238000012545 processing Methods 0.000 claims abstract description 30
- 210000004369 blood Anatomy 0.000 claims abstract description 27
- 239000008280 blood Substances 0.000 claims abstract description 27
- 238000000844 transformation Methods 0.000 claims abstract description 18
- 238000000684 flow cytometry Methods 0.000 claims abstract description 17
- 238000013501 data transformation Methods 0.000 claims abstract description 14
- 238000005457 optimization Methods 0.000 claims description 56
- 238000004422 calculation algorithm Methods 0.000 claims description 27
- 230000008569 process Effects 0.000 claims description 25
- 238000004364 calculation method Methods 0.000 claims description 20
- 241001465754 Metazoa Species 0.000 claims description 8
- 239000012503 blood component Substances 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 5
- 239000004615 ingredient Substances 0.000 claims 1
- 210000000265 leukocyte Anatomy 0.000 abstract description 47
- 210000004027 cell Anatomy 0.000 description 68
- 210000000440 neutrophil Anatomy 0.000 description 37
- 210000003743 erythrocyte Anatomy 0.000 description 36
- 239000013598 vector Substances 0.000 description 32
- 239000000306 component Substances 0.000 description 23
- 210000001616 monocyte Anatomy 0.000 description 20
- 210000003979 eosinophil Anatomy 0.000 description 18
- 210000004698 lymphocyte Anatomy 0.000 description 18
- 239000000523 sample Substances 0.000 description 18
- 238000005259 measurement Methods 0.000 description 15
- 210000001995 reticulocyte Anatomy 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 239000002245 particle Substances 0.000 description 11
- 210000003714 granulocyte Anatomy 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 9
- 238000007635 classification algorithm Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 230000008033 biological extinction Effects 0.000 description 8
- 102000001554 Hemoglobins Human genes 0.000 description 7
- 108010054147 Hemoglobins Proteins 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 210000003651 basophil Anatomy 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000002156 mixing Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000007476 Maximum Likelihood Methods 0.000 description 5
- 210000001744 T-lymphocyte Anatomy 0.000 description 5
- 230000009471 action Effects 0.000 description 5
- 210000000601 blood cell Anatomy 0.000 description 5
- 210000000805 cytoplasm Anatomy 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 210000002540 macrophage Anatomy 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- 238000004159 blood analysis Methods 0.000 description 4
- 238000004820 blood count Methods 0.000 description 4
- 210000001185 bone marrow Anatomy 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 239000008187 granular material Substances 0.000 description 4
- 230000003834 intracellular effect Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 210000005259 peripheral blood Anatomy 0.000 description 4
- 239000011886 peripheral blood Substances 0.000 description 4
- 241000282412 Homo Species 0.000 description 3
- 208000007502 anemia Diseases 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 210000003719 b-lymphocyte Anatomy 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 238000005194 fractionation Methods 0.000 description 3
- 230000028993 immune response Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000031700 light absorption Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 210000005087 mononuclear cell Anatomy 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000010186 staining Methods 0.000 description 3
- 206010061218 Inflammation Diseases 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000000149 argon plasma sintering Methods 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 230000023555 blood coagulation Effects 0.000 description 2
- 210000004204 blood vessel Anatomy 0.000 description 2
- 229910002092 carbon dioxide Inorganic materials 0.000 description 2
- 239000001569 carbon dioxide Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 150000003278 haem Chemical class 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 239000012678 infectious agent Substances 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000004054 inflammatory process Effects 0.000 description 2
- 208000032839 leukemia Diseases 0.000 description 2
- 238000007620 mathematical function Methods 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000004513 sizing Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- OBYNJKLOYWCXEP-UHFFFAOYSA-N 2-[3-(dimethylamino)-6-dimethylazaniumylidenexanthen-9-yl]-4-isothiocyanatobenzoate Chemical compound C=12C=CC(=[N+](C)C)C=C2OC2=CC(N(C)C)=CC=C2C=1C1=CC(N=C=S)=CC=C1C([O-])=O OBYNJKLOYWCXEP-UHFFFAOYSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 206010053567 Coagulopathies Diseases 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- -1 Cy3 Chemical compound 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 206010029379 Neutrophilia Diseases 0.000 description 1
- 208000030852 Parasitic disease Diseases 0.000 description 1
- SJEYSFABYSGQBG-UHFFFAOYSA-M Patent blue Chemical compound [Na+].C1=CC(N(CC)CC)=CC=C1C(C=1C(=CC(=CC=1)S([O-])(=O)=O)S([O-])(=O)=O)=C1C=CC(=[N+](CC)CC)C=C1 SJEYSFABYSGQBG-UHFFFAOYSA-M 0.000 description 1
- 206010057249 Phagocytosis Diseases 0.000 description 1
- 108010004729 Phycoerythrin Proteins 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- DPXHITFUCHFTKR-UHFFFAOYSA-L To-Pro-1 Chemical compound [I-].[I-].S1C2=CC=CC=C2[N+](C)=C1C=C1C2=CC=CC=C2N(CCC[N+](C)(C)C)C=C1 DPXHITFUCHFTKR-UHFFFAOYSA-L 0.000 description 1
- MZZINWWGSYUHGU-UHFFFAOYSA-J ToTo-1 Chemical compound [I-].[I-].[I-].[I-].C12=CC=CC=C2C(C=C2N(C3=CC=CC=C3S2)C)=CC=[N+]1CCC[N+](C)(C)CCC[N+](C)(C)CCC[N+](C1=CC=CC=C11)=CC=C1C=C1N(C)C2=CC=CC=C2S1 MZZINWWGSYUHGU-UHFFFAOYSA-J 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- ULHRKLSNHXXJLO-UHFFFAOYSA-L Yo-Pro-1 Chemical compound [I-].[I-].C1=CC=C2C(C=C3N(C4=CC=CC=C4O3)C)=CC=[N+](CCC[N+](C)(C)C)C2=C1 ULHRKLSNHXXJLO-UHFFFAOYSA-L 0.000 description 1
- GRRMZXFOOGQMFA-UHFFFAOYSA-J YoYo-1 Chemical compound [I-].[I-].[I-].[I-].C12=CC=CC=C2C(C=C2N(C3=CC=CC=C3O2)C)=CC=[N+]1CCC[N+](C)(C)CCC[N+](C)(C)CCC[N+](C1=CC=CC=C11)=CC=C1C=C1N(C)C2=CC=CC=C2O1 GRRMZXFOOGQMFA-UHFFFAOYSA-J 0.000 description 1
- JSBNEYNPYQFYNM-UHFFFAOYSA-J YoYo-3 Chemical compound [I-].[I-].[I-].[I-].C12=CC=CC=C2C(C=CC=C2N(C3=CC=CC=C3O2)C)=CC=[N+]1CCC(=[N+](C)C)CCCC(=[N+](C)C)CC[N+](C1=CC=CC=C11)=CC=C1C=CC=C1N(C)C2=CC=CC=C2O1 JSBNEYNPYQFYNM-UHFFFAOYSA-J 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000000980 acid dye Substances 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 210000002367 agranular leukocyte Anatomy 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000004087 circulation Effects 0.000 description 1
- 230000035602 clotting Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 230000000925 erythroid effect Effects 0.000 description 1
- 230000010437 erythropoiesis Effects 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 210000000224 granular leucocyte Anatomy 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 238000005534 hematocrit Methods 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000037451 immune surveillance Effects 0.000 description 1
- 230000000984 immunochemical effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 210000003712 lysosome Anatomy 0.000 description 1
- 230000001868 lysosomic effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000028161 membrane depolarization Effects 0.000 description 1
- 210000001806 memory b lymphocyte Anatomy 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000000066 myeloid cell Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000008782 phagocytosis Effects 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- XJMOSONTPMZWPB-UHFFFAOYSA-M propidium iodide Chemical compound [I-].[I-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CCC[N+](C)(CC)CC)=C1C1=CC=CC=C1 XJMOSONTPMZWPB-UHFFFAOYSA-M 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000013432 robust analysis Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 208000010110 spontaneous platelet aggregation Diseases 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- COIVODZMVVUETJ-UHFFFAOYSA-N sulforhodamine 101 Chemical compound OS(=O)(=O)C1=CC(S([O-])(=O)=O)=CC=C1C1=C(C=C2C3=C4CCCN3CCC2)C4=[O+]C2=C1C=C1CCCN3CCCC2=C13 COIVODZMVVUETJ-UHFFFAOYSA-N 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- JGVWCANSWKRBCS-UHFFFAOYSA-N tetramethylrhodamine thiocyanate Chemical compound [Cl-].C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=C(SC#N)C=C1C(O)=O JGVWCANSWKRBCS-UHFFFAOYSA-N 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- XJCQPMRCZSJDPA-UHFFFAOYSA-L trimethyl-[3-[4-[(e)-(3-methyl-1,3-benzothiazol-2-ylidene)methyl]pyridin-1-ium-1-yl]propyl]azanium;diiodide Chemical compound [I-].[I-].S1C2=CC=CC=C2N(C)\C1=C\C1=CC=[N+](CCC[N+](C)(C)C)C=C1 XJCQPMRCZSJDPA-UHFFFAOYSA-L 0.000 description 1
- 230000004222 uncontrolled growth Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N15/14—Optical investigation techniques, e.g. flow cytometry
- G01N15/1456—Optical investigation techniques, e.g. flow cytometry without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals
- G01N15/1459—Optical investigation techniques, e.g. flow cytometry without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals the analysis being performed on a sample stream
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/24765—Rule-based classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/698—Matching; Classification
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/01—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials specially adapted for biological cells, e.g. blood cells
- G01N2015/016—White blood cells
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N2015/1006—Investigating individual particles for cytology
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N15/14—Optical investigation techniques, e.g. flow cytometry
- G01N2015/1402—Data analysis by thresholding or gating operations performed on the acquired signals or stored data
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N15/14—Optical investigation techniques, e.g. flow cytometry
- G01N2015/1477—Multiparameters
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Computational Biology (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Dispersion Chemistry (AREA)
- Analytical Chemistry (AREA)
- Multimedia (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Description
この特許文献の開示の一部は、著作権保護の対象となる記述を含んでいる。著作権者は、特許商標庁の特許ファイルまたは記録に忠実なファクシミリ複製に対してはいかなる者が行っても異議を唱えないが、それ以外については、全ての著作権を保持している。
リンパ球は、細胞質内に顆粒を有さず、それらの核は細胞体積の大部分を占めるリンパ球の核外の細胞質の細い領域は、RNAを含有しているため、核酸染色で染色される。多くのリンパ球は、メモリーBまたはT細胞に分化し、それらはかなり長寿命であり、天然BまたはT細胞よりも素早く反応する。
(a)有限混合モデルを表すデータ、ここに、前記モデルは、前記データセットにおいて期待されるイベントの母集団に関連する多次元ガウス確立密度関数の重み付け合計を含む;
(b)(1)1以上のデータ変換および(2)1以上の論理文を含むエキスパート知識セット、ここに、前記変換および論理文は前記データセットにおけるイベントの母集団に関するアプリオリ期待をコードする;および
(c)前記有限混合モデルおよび前記エキスパート知識セットを用いて、前記多次元データを演算し、それによって、当該血液成分に関連する多次元データセットにおけるイベントの母集団を識別するためのインストラクションを含む、前記計算システム用のプログラムコードを記憶する。
そのようなスケーリングを実行して、最尤の有限混合モデルのパラメータを考えて機械−機械間変動についての前記データを調整できる。前記プレ演算モデルは、例えば、ライブラリーに多数のモデルがあり、その一つが所与のサンプルで用いるのに特に適している場合、有限混合モデルのライブラリーから有限混合モデルを選択することもできる。
(a)分析機器、例えば、フローサイトメーターでサンプルを処理し、それにより、多次元データセットを得;
(b)機械読取可能メモリーに前記データセットを記憶し;
(c)有限混合モデルを提供し、ここに、前記モデルは前記データセットにおいて期待されたイベント母集団に関連する多次元ガウス確率密度関数の重み付け合計であり;
(d)前記多次元データおよび前記有限混合モデルを、エキスパート知識セットの支援により演算し、それにより、前記多次元データセットにおけるイベントの母集団を識別し、ここに、前記エキスパート知識セットが前記多次元データセットの演算のための1以上のデータ変換および1以上の論理文を含み、前記変換および論理文が前記データセットにおけるイベントの母集団に関するアプリオリ期待値をコードするステップを含む。
上記したように、血液サンプルをフローサイトメトリーシステムに通過させると、このシステムは多次元でN個のデータポイントを発生する。
本発明の具体例において、フローサイトメーターは七次元でデータを取得する。次元は、ここでは、「チャネル」と称し、すでに上で定義したように、EXT、EXT_Int、RAS、RAS_Int、FSL、FSH、およびTOFと略記する。異なる白血球の物理的特性は、それらを通過する光を異なって散乱させる。例えば、大きな細胞は、大きな光吸収のため、通常、大きなEXTおよびEXT_Int値を有し、一方、高い内部複雑性を有する細胞は、大きな光散乱を生ずる傾向にあり、FSHディテクターで実測される。本発明のフローサイトメトリーアプリケーションにおいて、ここに記載された方法の最終目的は、ノイズの真っ直中のこれらの母集団を発見、すなわち、識別および分類し、各白血球タイプの相対頻度について定量的または定性的推定値を与えることにある。明らかに、本発明の他のアプリケーションにおいて、前記母集団は他の量に対応し、例示的かつ非限定的にフローサイトメトリーの分野のアプリケーションを提供する。
有限混合モデルは、母集団(または分類)につき一つの確率密度関数の有限重み付け合計である。詳しくは、G確率密度関数を含有する有限混合モデルは、下式:
ここに
で表され、ここに、Ωは分類重み付けπiおよび個別密度関数パラメータの双方を含むパラメータのベクトルである。Gは、分類問題における期待母集団の個数に対応する。有限混合モデルは、ベイズパターン認識学会から非常に大きな関心を寄せられた。彼らは、各密度関数fiを所与の分類子Ciすなわち成果型の密度関数特性から生じるデータポイントの条件確率とみなした。これを強調するため、有限混合モデルについて以下の表記:
ここに
を用い、ここに、前記密度関数の条件特性が明確に表現され、(成果型Ciから発生された実測データポイントxjの確率のアプリオリ推定値を考慮して)重み付け値πiがPr(Ci|Ω)に置換されている。重み付け値は実測データポイントxjに調節されていないので、それらは、各分類(Ci)からのイベントの相対頻度に対応する。
ここで、ベイズ規則により、
ゆえに、最適化有限混合モデルを仮定すると、ポイントを分類する自然なやり方がある。分類のための有限混合モデルの使用における技術は、最適化処理自体にある。
実のところ、異なる患者サンプルは異なるタイプの細胞母集団の存在を示す。最も重要な母集団差異の一つはイヌガン患畜の好中球母集団に観察され、何人かの獣医は「左シフト(left-shift)」母集団に言及している。この「左シフト」好中球母集団は、正常患者と比較して、(同一機器で)著しく低いRAS位を有するが、(TOFプロジェクションによるFSH_Peakには何も著しい形状変化はないのに対して)EXT_PeakプロジェクションによりRAS_Peakに顕著な形状変化も示す。これらの様々なタイプの母集団を説明するため、分類アルゴリズムは可能な母集団のライブラリーを許容し、それは、各期待イベント母集団についての異なるガウス密度関数のリストとなる。それゆえ、「左シフト」分類問題において、そのようなライブラリーは、前記好中球母集団について2つの別個のガウシアンを含有するであろう。また、理想的には、「左シフト」サンプルを仮定すると、前記アルゴリズムは、このサンプル条件を認識し、適当な好中球密度関数で、前記有限混合モデル最適化処理を開始するように選択するであろう。
を与えるパラメータΩkを選ぶことによって、ベイズ予測からの問題を解く。そして、Pr(X)は未知であるが、それは所与のデータセットXにつき一定である。また、Xにおける観察間の統計的独立性を仮定して、
を拡張し得る。
それゆえ、有限混合モデルライブラリーによって記述される可能な有限混合モデルの各々の頻度に対するいくつかの期待値を仮定すると、
を見つけることによって、初期FMMに対する最善の候補を認定し得る。
(または、この量の負対数)を用いて、いかに前記モデルがそのデータセットにフィットするかを評価し得る。前記有限混合モデルΩkを固定して、本発明者らは、M×1実数ベクトルs(M=入力チャネル数)について、
を最大化することが有利であることを見出した。得られたベクトルst = (s1,s2,...,sM)がsiによるi番目の入力座標を拡張するかまたは収縮するため、ここでは、この最大化をプレ最適化ステップにおけるスケーリング因子サーチ処理104という(図3、104)。多くの様々なサーチアルゴリズムを用いて、所望のスケーリング因子を見つけることができ、現在の好ましい手段において、一旦見つかれば、上記の有限混合モデル選択基準が用いられている。この追加されたプレ最適化ステップは必要とされるライブラリーの複雑性を大いに低減し、さらに、分類アルゴリズム実行時間を短縮した。
上記したように、本開示のシステムおよび方法は、ここで、エキスパート知識セットとよばれるものを用いる。このセットは2つの要素:エキスパートデータ変換のコレクションおよび、論理文または論理演算の形態をとることができるエキスパート規則のコレクションからなる。名の通り、エキスパートデータ変換は、いくつかのやり方でデータを変更する数学的関数である。数学的な予想から、分析機器によって収集されたデータは七次元ベクトルの長さN(Nはデジタル化イベント数)のリストであると考えられる。しかし、このデータセットを単に7つのN次元ベクトル、各入力チャネルにつき一つのベクトルとみなすことができる。エキスパート変換はこれらのN次元ベクトルに作用し、いずれかの個数の同様ベクトルを出力する。各観察が各出力における値を有するので、これらの出力は誘導座標と考えられる。そのようなエキスパート変換は、後述するように、幾何学的および確率的変換を含むいくつかの種類がある。
前記有限混合モデルおよびエキスパート規則の概念は、すでに、より詳細に説明されているので、本開示は、これらの要素が多次元データセットと組み合わされ、用いられて、イベント分類を発生させる(すなわち、母集団を識別する)処理および方法を記載する。つぎに記載される処理は、好ましくは、ソフトウェアーにコード化され、分析機器、すなわち、図1のデータ処理装置で実行する。メイン処理ループおよびメインサブルーチンのための疑似コードは後述するが、コードによって用いられるデータ構造である。
をコードする。
前記プレ演算モジュール104は、図5に示される多次元データ53および有限混合モデルのライブラリー40にアクセスすることによって開始する。データ52は、この分野の慣例として、二次元プロットとして図示される。有限混合モデルのライブラリー40は七次元重み付きガウス確率密度関数を含み、一つはデータセット52における各期待母集団に対するものである。1より多い確率密度関数が各母集団につき存在するであろう。この実施例のライブラリーは、2つのリンパ球密度関数40Aおよび40B、2つの単球密度関数40Cおよび40D、1つの好酸球密度関数40E、ならびに3つの好中球密度関数40F、40Gおよび40Hからなる。
図3および4のモデル最適化モジュール106、詳しくはサブステップ106A、106Bおよび106Cを、図7〜11とあわせてこれから説明する。
概念的に、モデル最適化モジュール106は、分類すべきデータを最善に適応(モデル化)するように、初期有限混合モデルのパラメータを調整する(図6、確率密度関数40B、40D、40E、40G)。このステップは反復実行される3つのステップからなる。これらは、期待値ステップ106A(図7および8)、エキスパート知識セット適用ステップ106B(変換および論理演算)(図9および10)、および最大化ステップ106C(図11)である。本発明者らは、この最適化処理において隠しデータを調整(バイアス)するので、それは、一般的な期待値−最大化アルゴリズム[Dempster et al., 1967]に見られるものとは異なる。個別にこれらの各々に行く前に、まず、いくつかの一般事項を説明する。
最適化モジュール106における期待値ステップ106の(s+1)st回反復は、文献ではしばしば隠しデータと呼ばれる数字のアレイ(numEvents x numModelComponents)を計算する。詳しくは、このデータは、前記有限混合モデルにおける異なる密度関数の各々からイベントが生じた確率に関連する。本発明者らは、このアレイのエントリーをPr(Ci|xj,Ω(s+1))(あるいは、文献で一般的なzij (s+1))で表し、ここに、
であり、混合係数の以前の反復値Pr(Ci|Ω(s))、および密度関数のパラメータΩ(s)に基づいて計算される。この隠しデータは、EMアルゴリズム(下記アルゴリズムを参照せよ。)および(イベント母集団後の探索間の相互依存性についてのエキスパート知識に基づきこれらの値を優先的に調整する)エキスパート規則の双方に対する中核である。
前記最適化モジュールのモジュール106B(図4)は、前記エキスパート知識セットの前記隠しデータへの適用を考慮し、特に期待値処理から生じた隠しデータについての変換演算および論理文の適用(「エキスパート規則」)を考慮する。前記エキスパート変換演算は、幾何学演算(例えば、極角および遠地点距離変換)すなわち前記有限混合モデルにおける特定の母集団(分類)に基づくマハラノビス距離変換のような確率演算からなる。
と定義され、ここに、
は、入力チャネルおよびエキスパート変換出力の空間(次元=M*)内の(M*-1)次元超平面lsおよび側面インデックスbsの対のコレクション、および
は、期待母集団識別子Pt(例えば、分類名または有限混合モデル成分インデックス)およびスカラー値wtの対のコレクションである。(M*-1)次元超平面は、一つの変換出力によって定義され、ここに、側面インデックスは単純な不等号式をとることを特記する。それゆえ、各ペアリング(ls, bs)と特異的変換出力との間には1対1対応があり、その出力座標のゼロポイントが指定される。よりよい表記法がないので、前記規則は、以下のように表現される。
この規則を適用するために、まず、以下
のように、R(X)をLにおける全ての超平面の指定側面にある一式のデータポイントであると定義する。これは、データセットXのサブセットであり、本発明者らが、規則Rの真ドメインであると呼んでいるものである。この表記を仮定すると、隠しデータに対する規則Rの影響は、
である。因子wiは確率重み付け因子である。
前記EMアルゴリズムの最大化ステップは、エキスパート規則モジュール106Cの適用によって修正されるので、隠しデータに基づき各密度関数のパラメータおよび混合定数をアップデートする。この演算は概略的に図11に示され、40B', 40D', 40E', 40G'に示されるように、前記有限混合モデルを形成する確率密度関数40B, 40D, 40E, 40Gの各々を移動させ、それらの形状を変形する。
各分類のガウス密度関数についての平均推定値
[式中、κiは、初期平均ベクトルのいくつかの量における重み]、および各分類のガウス密度関数の共分散行列
および
[式中、
は直近の完了した期待値ステップからの隠しデータ値であり、ρiは母集団の共分散行列を初期行列
にバイアスする。]である。これらのアップデート式はガウス密度関数の使用に特異的であるが、標準ベイズプライアーに見られる。
前記イベント分類ステップは、前記モデル最適化処理(106C)から戻されたパラメータ推定値と一緒にベイズ規則を用いて、多次元データにおけるイベントを期待母集団のひとつに割り当てる。これに先がけて、(収集イベントの無作為サブセットについて潜在的に計算され、)前記モデル最適化から戻された隠しデータ計算を拡張し、(これらのイベントがモデル最適化の間に隠されたのであれば、対照成分を含み)最適化の間に沈静化されているかもしれない前記有限混合モデルのいずれの成分も再活性化し、いずれのシミュレーションされた擬イベントも除外する。一旦、全データセットについて、隠しデータを計算すれば、開発者は、選択随意のポスト分類ステップ(後述)に対するエキスパート規則の適用のオプションを有する。
で分類に割り当てる。
これらの量は、モデル最適化(EMアップデートおよびエキスパート規則)および最終Eステップの間に各分類の密度関数パラメータになされた変化を内包する。
入力データセットから母集団すなわちクラスターを識別するプログラムコードは、メモリーから検索された入力データセットを演算する。前記入力データセットは、分析機器(例えば、フローサイトメーター)から得られた多次元データ実測ならびに、前記有限混合モデルライブラリーおよび前記エキスパート知識セットを含むパラメータファイルからなる。このセクションは、入力ファイルの内容および構造の一つの可能な具体例を説明するのにあてられる。
であり、ここに、
1.Mは、有限混合モデルライブラリーおよびいくつかの一般スイッチおよび処理制御パラメータを含有する(以下のMVN_Collection構造セクションを参照せよ)、
2.Fは、直近のスケーリングベクトルのFIFOである(以下のスケーリング因子FIFOセクションを参照せよ)、
3.Tは、用いるエキスパート変換を含有する(以下のエキスパート変換定義セクションを参照せよ)、
4.Rは、エキスパート規則構造を含有する(以下のエキスパート規則定義セクションを参照せよ)である。
以下のセクションは、プログラムコードのメインプログラムループおよびサブルーチンを一つの可能な具体例により説明する。
多変量正規、有限混合モデル(FMM)ライブラリー(コレクション)
ASCII(テキスト)ファイルは、有限混合モデルライブラリーを定義する。このファイルは、3つの主要なセクション(またはデータタイプ):ヘッダーデータ(キーネームであり、各レコードとペアになったバリュー)、クラスターデータ、(ガウス密度関数パラメータを定義する。)、および初期モデルリストセクション(前記ライブラリーを、全ての組合せとは対照的に特定の密度関数の組合せに制限する手段を提供する)を有する。前記セクションは、ファイル内で、ヘッダー、クラスター、モデルリストの順番に出現しなければならない。どのセクションにおいても、文字「#」で始まるいずれのレコードもコメントとみなされ、ファイル構文解析またはアルゴリズム実行のいずれでもなんら役割を持たない。これら3つのセクションのフォーマットを次で説明する。
MVN Collectionファイルのヘッダーセクションは、一つのキーネーム、一つのレコードについてのバリューペアを含有する。名前の長さに制限はない。コンマ(およびいずれかの数のスペース)はキーネームをその関連するバリューから分離する。Matlab関数ReadMVN_Collection_ASCIIは、キー/バリューペアをキーネームと同一のフィールドネームの戻された構造内に置く。関連するバリューは、読み出されるバリューのタイプによって、数値、真偽値または文字列の型に転換することができる。ReadMVN_Collection_ASCIIに見られる転換データ構造を調べてどのバリュータイプが戻されるかを決定する。
エキスパート変換は、プログラミング言語MATLABにおける構造リストによって定義される。そのような構造のフィールドは付録Bに記述する。
エキスパート規則は、同じように、構造のMatlabリストによって定義される。各構造のフィールドは付録Cに記述する。
Claims (30)
- フローサイトメーターから得られた多次元データセットにおけるイベントの母集団を識別する計算システムであって、
前記母集団はヒトまたは動物の血液のサンプル中の血液成分に関連し、
前記計算システムで使用する1以上の機械読取可能記憶媒体を含み、ここに、前記機械読取可能記憶媒体は、
(a)有限混合モデルを表すデータ、ここに、前記モデルは、前記データセットにおいて期待されるイベントの母集団に関連する多次元ガウス確率密度関数の重み付け合計を含む;
(b)前記データセットの少なくともサブセットを演算し、隠しデータを作成し、かつ、前記有限混合モデルの密度関数に関連するパラメータをアップデートするように構成された期待値最大化アルゴリズム;
(c)(i)1以上のデータ変換および(ii)1以上の論理文を含むエキスパート知識セット、ここに、前記変換および論理文は前記データセットにおけるイベントの母集団に関するアプリオリ期待値をコードする;および
(d)前記計算システムにより実行されるプログラムコード、ここに、前記プログラムコードは、前記有限混合モデル、前記期待値最大化アルゴリズムおよび前記エキスパート知識セットを用い、それによって、前記血液成分に関連する多次元データセットにおけるイベントの母集団を識別するためのインストラクションを含み、ここに、前記エキスパート知識セットを用いて、前記期待値最大化アルゴリズムによって作成された前記隠しデータを修正する;
を記憶することを特徴とする計算システム。 - 前記エキスパート知識セットが、あるイベントが前記母集団の一つであるとの確率推定値を修正する処理をコードする請求項1の計算システム。
- 前記プログラムコードが、期待値演算、前記エキスパート知識セットの適用および最大化演算を反復して実行し、それによって、有限混合モデルに関連するパラメータを調整する請求項1または2の計算システム。
- 前記エキスパート知識セットが、前記多次元データセットを変換する少なくとも1のジオメトリー変換を含む請求項1、2または3の計算システム。
- 前記プログラムコードが、
前記多次元データセットのスケーリングを行うプレ最適化モジュール;
(i)前記多次元データセットの少なくともサブセットの期待値演算、(ii)前記期待値演算から得られたデータへの前記エキスパート知識セットの適用および(iii)前記エキスパート知識の適用に基づき、前記有限混合モデルの密度関数に関連するパラメータをアップデートする最大化演算、を反復して行う最適化モジュール;ならびに
前記多次元データセットを1以上の母集団に分類する前記最大化演算の出力に応答する分類モジュール、
を含む請求項1〜4いずれかの計算システム。 - 前記プログラムコードが、前記エキスパート知識セットから1以上のエキスパート規則を用いて、前記多次元データセットの分類を修正する分類後モジュールをさらに含む請求項5の計算システム。
- 前記最適化モジュールが、(i)前記イベントデータセットについて真ドメインおよび偽ドメインとする論理条件文を定義するゼロポイントを定義する変換アルゴリズムおよび(ii)イベントが真ドメインにあるとき、そのイベントに一つの値を割り当て、イベントが偽ドメインにあるとき、そのイベントに別の値を割り当てる論理演算を実行する請求項5または6の計算システム。
- 前記最適化モジュールが少なくとも2つのゼロポイントを定義する請求項7の計算システム。
- 前記エキスパート知識セットが、真ドメインに対するイベントの関係に依存して、イベントの確率推定値を修正する少なくとも一つの論理文を含む請求項7または8の計算システム。
- 前記期待値演算が、前記多次元データセットにおける各イベントについて、そのイベントが少なくとも1つの所定の期待母集団に属する確率を計算する請求項5〜9いずれかの計算システム。
- 前記期待値演算が、前記多次元データセットにおける各イベントについて、そのイベントが各期待母集団に属する確率を計算する請求項10の計算システム。
- 前記機械読取可能記憶媒体が、フローサイトメーターに関連するデータ処理装置と連結される請求項1〜11いずれかの計算システム。
- 前記インストラクションが、母集団の識別を人間が認知可能な形態で提示するためのインストラクションをさらに含む請求項1〜12いずれかの計算システム。
- フローサイトメーターから得られた多次元データセットにおけるイベントの母集団を識別する方法であって、
(a)フローサイトメーターでサンプルを処理し、それにより、多次元データセットを得;
(b)機械読取可能メモリーに前記データセットを記憶し;
(c)有限混合モデルを提供し、ここに、前記モデルは前記データセットにおいて期待されたイベント母集団に関連する多次元ガウス確率密度関数の重み付け合計であり;
(d)前記データセットの少なくともサブセットを演算し、隠しデータを作成し、かつ、前記有限混合モデルの密度関数に関連するパラメータをアップデートするように構成された期待値最大化アルゴリズムを提供し、
(e)前記有限混合モデル、前記期待値最大化アルゴリズムおよび前記エキスパート知識セットを用い、それによって、多次元データセットにおけるイベントの母集団を識別する多次元データセットを演算し、ここに、前記エキスパート知識セットは、前記多次元データセットを演算するための1以上のデータ変換および1以上の論理文を含み、ここに、前記変換および論理文は前記データセットにおけるイベントの母集団に関するアプリオリ期待値をコードし、ここに、前記エキスパート知識セットを用いて、前記期待値最大化アルゴリズムによって作成された前記隠しデータを修正する
ステップを含む、方法。 - イベントの母集団の識別の結果を人間が認知可能な形態で提示するステップをさらに含む請求項14の方法。
- 前記フローサイトメーターがヒトまたは動物の血液のサンプルを処理し、前記多次元データが前記サンプルに関連するイベントデータを表す請求項14または15の方法。
- 前記母集団が前記血液サンプル中の血液成分の母集団を含む請求項16の方法。
- 前記エキスパート知識セットが前記多次元データセットを変換する少なくとも1のジオメトリー変換を含む請求項14〜17いずれかの方法。
- ステップ(e)が、
前記多次元データセットのスケーリングを行うプレ最適化ステップ;
(i)前記多次元データセットの少なくともサブセットの期待値演算、(ii)前記期待値演算から得られたデータへの前記エキスパート知識セットの適用および(iii)前記エキスパート知識の適用に基づき、前記有限混合モデルの密度関数に関連するパラメータをアップデートする最大化演算、を反復して行う最適化モジュール;ならびに
前記多次元データセットを1以上の母集団に分類する前記最大化演算の出力に応答する分類モジュール、
を含む請求項14〜18いずれかの方法。 - ステップ(e)が、前記エキスパート知識セットから1以上のエキスパート規則を用いて、前記多次元データセットの分類を修正する分類後ステップをさらに含む請求項14〜19いずれかの方法。
- 前記最適化モジュールが、(i)前記イベントデータセットについて真ドメインおよび偽ドメインとする論理条件文を定義するゼロポイントを定義する変換アルゴリズムおよび(ii)イベントが真ドメインにあるとき、そのイベントに一つの値を割り当て、イベントが偽ドメインにあるとき、そのイベントに別の値を割り当てる論理演算を実行する請求項19の方法。
- 前記最適化モジュールが少なくとも2つのゼロポイントを定義する請求項21の方法。
- 前記エキスパート知識セットが、真ドメインに対するイベントの関係に依存して、イベントの確率推定値を修正する少なくとも一つの論理文を含む請求項21または22の方法。
- 前記期待値演算が、前記多次元データセットにおける各イベントについて、そのイベントが少なくとも1つの所定の期待母集団に属する確率を計算する請求項19、21、22または23の方法。
- 前記期待値演算が、前記多次元データセットにおける各イベントについて、そのイベントが各期待母集団に属する確率を計算する請求項24の方法。
- 有限混合モデルのライブラリーから選択された特定の有限混合モデルから発生したデータの尤度を最大化するように、一式のスケーリング因子を前記データに適用するプレ最適化ステップをさらに行うことを特徴とする請求項14〜25いずれかの方法。
- 前記スケーリング因子が、前記特定の有限混合モデルのパラメータが与えられれば、前記多次元データを発生する機械の機械−機械間変動について前記データを調整する請求項26の方法。
- フローサイトメーター;
前記フローサイトメーターから得られた多次元データセットを処理し、前記多次元データセットにおけるイベントの母集団を識別するデータ処理装置、ここに、前記母集団はヒトまたは動物の血液のサンプル中の血液成分に関連し;および
(a)有限混合モデルを表すデータ、ここに、前記モデルは、前記データセットにおいて期待されるイベントの母集団に関連する多次元ガウス確率密度関数の重み付け合計を含む;
(b)前記データセットの少なくともサブセットを演算し、隠しデータを作成し、かつ、前記有限混合モデルの密度関数に関連するパラメータをアップデートするように構成された期待値最大化アルゴリズム;
(c)(i)1以上のデータ変換および(ii)1以上の論理文を含むエキスパート知識セット、ここに、前記変換および論理文は前記データセットにおけるイベントの母集団に関するアプリオリ期待値をコードする;および
(d)前記データ処理装置により実行されるプログラムコード、ここに、前記プログラムコードは、前記有限混合モデル、前記期待値最大化アルゴリズムおよび前記エキスパート知識セットを用い、それによって、前記血液成分に関連する多次元データセットにおけるイベントの母集団を識別するためのインストラクションを含み、ここに、前記エキスパート知識セットを用いて、前記期待値最大化アルゴリズムによって作成された前記隠しデータを修正する;
を記憶するメモリー;
を含むフローサイトメトリーシステム。 - 前記プログラムコードが、
前記データのスケーリングを行うプレ最適化モジュール;
(i)前記データの少なくともサブセットの期待値演算、(ii)前記期待値演算由来のデータへの前記エキスパート知識セットの適用、および(iii)前記有限混合モデルに関連するパラメータをアップデートする最大化演算を反復して行う最適化モジュール;ならびに
前記データを1以上の母集団に分類する最大化演算の出力に応答する分類モジュールを含む請求項28のシステム。 - データ処理装置で動くとき、前記装置が請求項14の方法にしたがって演算するように構成する情報を含有するコンピュータ読取り可能媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/271,316 US7299135B2 (en) | 2005-11-10 | 2005-11-10 | Methods for identifying discrete populations (e.g., clusters) of data within a flow cytometer multi-dimensional data set |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007132921A JP2007132921A (ja) | 2007-05-31 |
JP4354977B2 true JP4354977B2 (ja) | 2009-10-28 |
Family
ID=37812478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006215781A Expired - Fee Related JP4354977B2 (ja) | 2005-11-10 | 2006-08-08 | フローサイトメーター多次元データセット内のデータの離散母集団(例えば、クラスター)を識別する方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7299135B2 (ja) |
EP (1) | EP1785899B1 (ja) |
JP (1) | JP4354977B2 (ja) |
AT (1) | ATE406620T1 (ja) |
DE (1) | DE602006002470D1 (ja) |
Families Citing this family (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7340441B1 (en) * | 2004-12-17 | 2008-03-04 | The Mathworks, Inc. | Search directions in pattern search via rotation |
ITUD20050118A1 (it) * | 2005-07-13 | 2007-01-14 | Sire Analytical Systems Srl | Procedimento per la taratura di macchine per l' analisi di parametri del sangue connessi alla densita' del sangue, quali la velocita' di eritrosedimentazione e/o di aggregazione dei globuli rossi |
US8040959B2 (en) * | 2006-12-11 | 2011-10-18 | Texas Instruments Incorporated | Dynamic resource allocation to improve MIMO detection performance |
US7653509B2 (en) * | 2007-08-29 | 2010-01-26 | Verity Software House | Probability state models |
JP4509163B2 (ja) * | 2007-10-26 | 2010-07-21 | ソニー株式会社 | 微小粒子の測定方法 |
EP2105863B1 (en) * | 2008-03-28 | 2017-09-13 | Cytognos, S.L. | Method and system for the automatic classification of events acquired by a flow cytometer |
CA2720041C (en) * | 2008-04-17 | 2017-01-17 | Klaus Haberstroh | Fluorescence standards and their use |
WO2009135271A1 (en) * | 2008-05-08 | 2009-11-12 | Inivai Technologies Pty Ltd | A system and method for processing flow cytometry data |
US9183237B2 (en) | 2008-07-10 | 2015-11-10 | Nodality, Inc. | Methods and apparatus related to gate boundaries within a data space |
GB2474613A (en) * | 2008-07-10 | 2011-04-20 | Nodality Inc | Methods and apparatus related to management of experiments |
FR2935802B1 (fr) * | 2008-09-05 | 2012-12-28 | Horiba Abx Sas | Procede et dispositif de classification, de visualisation et d'exploration de donnees biologiques |
US8214323B2 (en) * | 2008-09-16 | 2012-07-03 | Beckman Coulter, Inc. | Extensible data warehouse for flow cytometry data |
CN101685314B (zh) * | 2008-09-23 | 2014-07-09 | 成都芯源系统有限公司 | 自适应电压定位直流稳压器及其控制方法 |
US9034257B2 (en) * | 2008-10-27 | 2015-05-19 | Nodality, Inc. | High throughput flow cytometry system and method |
US20100220315A1 (en) * | 2009-02-27 | 2010-09-02 | Beckman Coulter, Inc. | Stabilized Optical System for Flow Cytometry |
JP5452058B2 (ja) * | 2009-03-31 | 2014-03-26 | シスメックス株式会社 | 血液分析装置 |
JP5453969B2 (ja) * | 2009-07-10 | 2014-03-26 | ヤマハ株式会社 | 磁気データ処理装置、磁気データ処理方法および磁気データ処理プログラム |
US20110129864A1 (en) * | 2009-12-02 | 2011-06-02 | Idexx Laboratories, Inc. | Method for analyzing lymph node aspirate using multi-angle light scatter flow cytometer |
US8738564B2 (en) | 2010-10-05 | 2014-05-27 | Syracuse University | Method for pollen-based geolocation |
US10452746B2 (en) | 2011-01-03 | 2019-10-22 | The Board Of Trustees Of The Leland Stanford Junior University | Quantitative comparison of sample populations using earth mover's distance |
US10503756B2 (en) * | 2011-01-03 | 2019-12-10 | The Board Of Trustees Of The Leland Stanford Junior University | Cluster processing and ranking methods including methods applicable to clusters developed through density based merging |
US20120209880A1 (en) * | 2011-02-15 | 2012-08-16 | General Electric Company | Method of constructing a mixture model |
US8990047B2 (en) | 2011-03-21 | 2015-03-24 | Becton, Dickinson And Company | Neighborhood thresholding in mixed model density gating |
WO2012151105A2 (en) * | 2011-05-04 | 2012-11-08 | Abbott Laboratories | Basophil analysis system and method |
ES2927316T3 (es) | 2011-05-04 | 2022-11-04 | Abbott Lab | Sistema y método de análisis de glóbulos blancos |
US9103759B2 (en) | 2011-05-04 | 2015-08-11 | Abbott Laboratories | Nucleated red blood cell analysis system and method |
US8949271B2 (en) * | 2012-10-23 | 2015-02-03 | Liebherr-Werk Nenzing Gmbh | Method for monitoring a number of machines and monitoring system |
US9965512B2 (en) | 2013-06-25 | 2018-05-08 | Sap Se | Operators for constants in aggregated formulas |
US20150039401A1 (en) * | 2013-08-05 | 2015-02-05 | International Business Machines Corporation | Method and system for implementation of engineered key performance indicators |
CN104749072B (zh) * | 2013-12-31 | 2017-12-08 | 深圳迈瑞生物医疗电子股份有限公司 | 一种自动生成多边形门的方法、装置及相应的粒子分析仪 |
US9202178B2 (en) * | 2014-03-11 | 2015-12-01 | Sas Institute Inc. | Computerized cluster analysis framework for decorrelated cluster identification in datasets |
US10685045B2 (en) | 2016-07-15 | 2020-06-16 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and methods for cluster matching across samples and guided visualization of multidimensional cytometry data |
CN106407657A (zh) * | 2016-08-31 | 2017-02-15 | 无锡雅座在线科技发展有限公司 | 事件捕获方法和装置 |
EP3340107B9 (en) | 2016-12-23 | 2021-07-21 | Cytognos, S.L. | Method of digital information classification |
EP3617691A4 (en) | 2017-04-24 | 2020-05-13 | Sony Corporation | INFORMATION PROCESSING DEVICE, PARTICLE FRACTIONATION SYSTEM, PROGRAM AND PARTICLE FRACTIONATION METHOD |
JP6955385B2 (ja) * | 2017-07-14 | 2021-10-27 | 株式会社堀場製作所 | 粒子分析装置における光照射を調整するためのモニター装置 |
US11002658B2 (en) | 2018-04-26 | 2021-05-11 | Becton, Dickinson And Company | Characterization and sorting for particle analyzers |
US10883912B2 (en) * | 2018-06-04 | 2021-01-05 | Becton, Dickinson And Company | Biexponential transformation for graphics display |
DE102018210937A1 (de) * | 2018-07-03 | 2020-01-09 | Robert Bosch Gmbh | Realistischere Simulation physikalischer Messdaten |
US20200200671A1 (en) * | 2018-12-20 | 2020-06-25 | Sony Corporation | Information processing apparatus, information processing method, and program |
JP2022529196A (ja) | 2019-04-19 | 2022-06-20 | ベクトン・ディキンソン・アンド・カンパニー | フローサイトメトリイベントデータのサブサンプリング |
JP7555732B2 (ja) | 2019-06-13 | 2024-09-25 | 株式会社堀場製作所 | 細胞計測方法及び細胞計測装置 |
WO2021039158A1 (ja) | 2019-08-23 | 2021-03-04 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム及び情報処理システム |
JP7516870B2 (ja) | 2019-08-23 | 2024-07-17 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、プログラム及び情報処理システム |
KR102154335B1 (ko) * | 2019-10-18 | 2020-09-09 | 연세대학교 산학협력단 | 생체 추출 데이터를 전처리하여 질병을 판단하는 방법 및 그를 위한 장치 |
JP2021103139A (ja) | 2019-12-25 | 2021-07-15 | ソニーグループ株式会社 | 情報処理装置、粒子測定装置、粒子測定システム、粒子分取装置、粒子分取システム、情報処理方法、及び情報処理プログラム |
US11636390B2 (en) * | 2020-03-19 | 2023-04-25 | International Business Machines Corporation | Generating quantitatively assessed synthetic training data |
US20210358566A1 (en) * | 2020-05-18 | 2021-11-18 | Becton, Dickinson And Company | Resolution indices for detecting heterogeneity in data and methods of use thereof |
US10984075B1 (en) * | 2020-07-01 | 2021-04-20 | Sas Institute Inc. | High dimensional to low dimensional data transformation and visualization system |
CN114281283B (zh) * | 2020-09-27 | 2023-03-24 | 深圳市帝迈生物技术有限公司 | 散点图像的显示方法及样本分析设备、相关装置 |
CN116724222A (zh) * | 2020-11-19 | 2023-09-08 | 贝克顿·迪金森公司 | 用于机器学习分析的细胞术数据的最佳缩放方法及其系统 |
CN112945808B (zh) * | 2021-01-26 | 2022-03-29 | 中铁南方投资集团有限公司 | 一种渣土多级分离后骨料粒径的分析方法及系统 |
EP4348222A1 (en) * | 2021-06-04 | 2024-04-10 | Becton, Dickinson and Company | Methods and systems for classifying flow cyometer data |
WO2023158803A1 (en) * | 2022-02-18 | 2023-08-24 | Idexx Laboratories Inc. | Flow cytometry systems and methods for presenting two‑dimensional dot plot |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5380663A (en) | 1984-12-24 | 1995-01-10 | Caribbean Microparticles Corporation | Automated system for performance analysis and fluorescence quantitation of samples |
IE76732B1 (en) | 1990-08-07 | 1997-11-05 | Becton Dickinson Co | One step test for absolute counts |
JP3130628B2 (ja) | 1992-01-30 | 2001-01-31 | シスメックス株式会社 | 粒子判定装置 |
US5451525A (en) | 1992-02-14 | 1995-09-19 | Coulter Corporation | Method and materials for determining particle count in a flow cytometer |
US6117708A (en) | 1998-02-05 | 2000-09-12 | Micron Technology, Inc. | Use of residual organic compounds to facilitate gate break on a carrier substrate for a semiconductor device |
US6618143B2 (en) | 2000-02-18 | 2003-09-09 | Idexx Laboratories, Inc. | High numerical aperture flow cytometer and method of using same |
EP1285365A4 (en) * | 2000-03-28 | 2004-01-21 | Dana Farber Cancer Inst Inc | MOLECULAR DATABASE FOR ANTIBODY CHARACTERIZATION |
WO2001085914A2 (en) | 2000-05-11 | 2001-11-15 | Becton, Dickinson And Company | System for identifying clusters in scatter plots using smoothed polygons with optimal boundaries |
US6784981B1 (en) | 2000-06-02 | 2004-08-31 | Idexx Laboratories, Inc. | Flow cytometry-based hematology system |
US7218764B2 (en) * | 2000-12-04 | 2007-05-15 | Cytokinetics, Inc. | Ploidy classification method |
US7043500B2 (en) * | 2001-04-25 | 2006-05-09 | Board Of Regents, The University Of Texas Syxtem | Subtractive clustering for use in analysis of data |
DK2305171T3 (da) * | 2003-03-28 | 2022-03-21 | Inguran Llc | Apparat og fremgangsmåder til tilvejebringelse af kønssorteret dyresæd |
WO2005008254A1 (ja) | 2003-07-18 | 2005-01-27 | A & T Corporation | 臨床検査分析装置、臨床検査分析方法およびその方法をコンピュータに実行させるプログラム |
WO2005050479A1 (ja) | 2003-11-21 | 2005-06-02 | National University Corporation Kochi University | 類似パターン検索装置、類似パターン検索方法、類似パターン検索プログラム、および分画分離装置 |
WO2005085842A2 (en) | 2004-03-09 | 2005-09-15 | Universite Libre De Bruxelles | Method for the simultaneous detection of populations of several different biological entities using flow cytometry, device and computer program therefor |
-
2005
- 2005-11-10 US US11/271,316 patent/US7299135B2/en not_active Expired - Fee Related
-
2006
- 2006-08-08 JP JP2006215781A patent/JP4354977B2/ja not_active Expired - Fee Related
- 2006-11-10 DE DE602006002470T patent/DE602006002470D1/de active Active
- 2006-11-10 EP EP06255789A patent/EP1785899B1/en not_active Not-in-force
- 2006-11-10 AT AT06255789T patent/ATE406620T1/de not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
JP2007132921A (ja) | 2007-05-31 |
US7299135B2 (en) | 2007-11-20 |
EP1785899B1 (en) | 2008-08-27 |
US20070118297A1 (en) | 2007-05-24 |
DE602006002470D1 (de) | 2008-10-09 |
EP1785899A2 (en) | 2007-05-16 |
EP1785899A3 (en) | 2007-05-23 |
ATE406620T1 (de) | 2008-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4354977B2 (ja) | フローサイトメーター多次元データセット内のデータの離散母集団(例えば、クラスター)を識別する方法 | |
CN101981446B (zh) | 用于使用支持向量机分析流式细胞术数据的方法和系统 | |
JP7437393B2 (ja) | 粒子分析器のための適応ソーティング | |
US20160169786A1 (en) | Automated flow cytometry analysis method and system | |
US20240044904A1 (en) | System, method, and article for detecting abnormal cells using multi-dimensional analysis | |
US20120215487A1 (en) | Methods and apparatus related to gate boundaries within a data space | |
Pedreira et al. | From big flow cytometry datasets to smart diagnostic strategies: The EuroFlow approach | |
EP3340107B1 (en) | Method of digital information classification | |
US20160267113A1 (en) | Methods and apparatus related to gate boundaries within a data space | |
EP3230887A1 (en) | Automated flow cytometry analysis method and system | |
Azad et al. | Immunophenotype discovery, hierarchical organization, and template-based classification of flow cytometry samples | |
CN102144153A (zh) | 用于分类、显示并探查生物数据的方法和装置 | |
Bashashati et al. | A pipeline for automated analysis of flow cytometry data: preliminary results on lymphoma sub-type diagnosis | |
Wang et al. | Using Artificial Intelligence to Interpret Clinical Flow Cytometry Datasets for Automated Disease Diagnosis and/or Monitoring | |
WO2024168532A1 (zh) | 一种动物用血液分析装置及方法 | |
US20230338953A1 (en) | Specimen analyzer, specimen analysis method, and program | |
TW202311742A (zh) | 流式細胞儀資料之免疫表型自動分類 | |
MATTON | Automating flow cytometry data analysis using clustering techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081001 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090331 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090714 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090730 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120807 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |