WO2007058001A1 - 易動度の正規化装置、正規化方法、正規化プログラムおよび自己組織化マップ、並びに、物質の検出方法、検出プログラム、検出ルール生成方法およびデータ構造 - Google Patents

易動度の正規化装置、正規化方法、正規化プログラムおよび自己組織化マップ、並びに、物質の検出方法、検出プログラム、検出ルール生成方法およびデータ構造 Download PDF

Info

Publication number
WO2007058001A1
WO2007058001A1 PCT/JP2006/313759 JP2006313759W WO2007058001A1 WO 2007058001 A1 WO2007058001 A1 WO 2007058001A1 JP 2006313759 W JP2006313759 W JP 2006313759W WO 2007058001 A1 WO2007058001 A1 WO 2007058001A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
mobility
substance
function
reference waveform
Prior art date
Application number
PCT/JP2006/313759
Other languages
English (en)
French (fr)
Inventor
Hiromi Kataoka
Original Assignee
Kochi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kochi University filed Critical Kochi University
Priority to US12/084,370 priority Critical patent/US7991569B2/en
Publication of WO2007058001A1 publication Critical patent/WO2007058001A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/416Systems
    • G01N27/447Systems using electrophoresis
    • G01N27/44704Details; Accessories
    • G01N27/44717Arrangements for investigating the separated zones, e.g. localising zones
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8644Data segmentation, e.g. time windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing

Definitions

  • Mobility normalization device normalization method, normalization program and self-organizing map, and substance detection method, detection program, detection rule generation method and data structure
  • the present invention relates to a normality process for mobility, and in particular, a normality device for mobility, a normalization method, and a normalization that can correct mobility without using a marker substance.
  • the present invention relates to a method of detecting a substance, a detection program, a detection rule generation method, and a data structure using a program, a self-woven and woven map, and mobility after normal processing. Background art
  • Patent Document 2 See Patent Document 2 below
  • Patent Document 3 See Patent Document 3 below
  • Patent Document 1 JP 2001-074694 A Patent Document 2: Japanese Patent Laid-Open No. 5-312812
  • Patent Document 3 JP-A-6-96138
  • Non-Patent Document 1 Hiroaki Kataoka, Masahide Sasaki, Masaaki Nishida, Kyoko Takeda, Tetsuro Sugiura: Future Development of Accuracy Assurance, Clinical Pathology, 47 (9), pp823-829, 1999.
  • the present invention can be corrected only by a method of mixing a marker substance into a sample to solve the above-described problems, and cannot correct an analytical method or mobility using a marker substance.
  • the mobility normalizer that can normalize the mobility, the normalization method, the normal key program and the self-weaving / weaving key map, and the mobility after normalization
  • the object is to provide a substance detection method, a detection program, a detection rule generation method and a data structure.
  • a mobility normalization device (1) includes a recording unit and a processing unit that record a plurality of reference waveform data, and the processing unit acquires mobility measurement data acquired from the outside. Is unit time array data, the measurement data is corrected data, and the mobility measurement data acquired from the outside is a plurality of two-dimensional data in which time information and measurement values are associated with each other.
  • the two-dimensional data is interpolated to generate corrected data that is unit time array data, a plurality of the reference waveform data is read from the recording unit, and the corrected data is converted to a plurality of the reference waveform data.
  • a plurality of webbing functions to be converted into each and a DTW distance corresponding to each monobing function are obtained, and a minimum value among the plurality of DTW distances is obtained, and the above-mentioned webbing function corresponding to the obtained minimum DTW distance is obtained. Then, the slope and intercept of a straight line approximating the determined wavebing function are obtained, and the corrected data is corrected using a linear function specified by the slope and intercept.
  • the mobility normalization device (2) is the mobility normalization device (1) described above, wherein the processing unit determines an arbitrary bending of the webbing function determined.
  • the processing unit determines an arbitrary bending of the webbing function determined.
  • the mobility normalization device (3) is the mobility normalization device (2) described above, wherein the processing unit is a center of the inclination between the plurality of bending points. The value is determined as the slope of the straight line approximating the wave function.
  • the mobility normalization device (4) is the mobility normalization device (1) described above, wherein the plurality of reference waveform data includes a marker substance. This is data obtained by correcting the mobility measurement data using the mobility of the marker substance.
  • the mobility normalization device (5) is the mobility normalization device (1) described above, wherein a plurality of the reference waveform data is a plurality of mobility measurements. This is the data that composes the self-organizing map generated using the data.
  • the corrected data which is unit time array data obtained by measuring the mobility, is added to each of a plurality of predetermined reference waveform data.
  • a second step for determining a webbing function, a third step for obtaining a slope and intercept of a straight line approximating the determined webbing function, and a first-order function specified by the slope and intercept are used to calculate the corrected data.
  • the data obtained by measuring the mobility includes time information and Two-dimensional data in which measurement values are associated with each other, and the data to be corrected is unit time array data generated by interpolating a plurality of the two-dimensional data.
  • the mobility normalization method (3) is the mobility normalization method (1), wherein the third step is determined in the second step.
  • a sixth step of obtaining a slope of the straight line approximating the wavebing function from a slope between is the mobility normalization method (1), wherein the third step is determined in the second step.
  • the mobility normalization method (4) is the mobility normalization method (1) described above, wherein the sixth step is the step of determining the inclination between the plurality of bending points. Determining the median as the slope of the straight line approximating the wave function.
  • the mobility normalization method (5) according to the present invention is the mobility normalization method (1) described above, in which the plurality of reference waveform data includes a marker substance containing a marker substance. This is data obtained by correcting the mobility measurement data using the mobility of the marker substance.
  • the mobility normalization method (6) is the mobility normalization method (1) described above, wherein a plurality of the reference waveform data are measured by a plurality of mobility measurements. This is the data that composes the self-organizing map generated using the data.
  • the computer-readable recording medium (1) is an apparatus including a recording unit and a processing unit on which a plurality of reference waveform data is recorded.
  • a plurality of wavebing functions for converting the corrected data which is unit time array data obtained by the measurement, into each of the plurality of reference waveform data, and a first function for obtaining a DTW distance corresponding to each wavebing function
  • a mobility normality program that realizes a third function for obtaining an intercept and a fourth function for correcting the corrected data using a linear function specified by the slope and the intercept is recorded.
  • the computer-readable recording medium (2) has a waveform obtained by visually correcting data to be corrected, which is unit time array data obtained by measuring the mobility of a specimen.
  • Data or data to be corrected which is unit time sequence data obtained by measuring the mobility of a specimen containing a marker substance, is corrected by a computer using waveform data obtained by correcting the data according to the mobility of the marker substance.
  • the self-organization map used as the reference waveform data is recorded.
  • the substance detection method (1) is a substance detection method using a decision tree obtained by learning using teacher data as a detection rule, wherein the decision tree includes a plurality of decision trees.
  • Normalization data obtained by correcting the measurement data of the mobility of the specimen using the mobility normalization method (1) described above, and the presence or absence of a predetermined substance corresponding to the measurement data It is a decision tree obtained by learning using the teacher data including information to be expressed.
  • the substance detection method (2) according to the present invention is the same as the substance detection method (1) described above, wherein the substance is M protein, the mobility of albumin is 400, and the ⁇ region of dimethylformamide is When the regional mobility is 800, the decision tree is described as a combination of the mobility and the determination code shown in FIG.
  • the computer-readable recording medium (3) causes a computer to realize a function of detecting a substance using a decision tree obtained by learning using teacher data as a detection rule.
  • a detection program for a substance wherein the decision tree corrects the mobility measurement data of a plurality of specimens using the mobility normality method (1) described above, and normalization data obtained by the correction tree
  • a substance detection program which is a decision tree obtained by learning using the teacher data including information indicating the presence or absence of a predetermined substance corresponding to the measurement data.
  • the substance detection rule generation method is a detection rule generation method used for substance detection, and uses a computer to measure mobility measurement data of a plurality of specimens. Correction using the mobility normalization method (1) above, a first step for generating normalized data, and a teacher data including information indicating the presence or absence of a predetermined substance corresponding to the measurement data. And a second step of obtaining a decision tree by learning and using the normalized data as a detection rule.
  • the computer-readable recording medium (4) is a data structure used as a substance detection rule, and the measurement data of the mobility of a plurality of specimens is stored in the above-described manner.
  • the teacher data including information indicating the presence or absence of a predetermined substance corresponding to the measurement data Record the data structure (1) that represents the decision tree obtained by learning!
  • the substance is M protein
  • the mobility of albumin is 400
  • the detection rule records the data structure (2) described as a combination of the mobility and the determination code shown in FIG. 14 or FIG.
  • the mobility measurement data can be normalized by using the waveform pattern of the mobility measurement data of the analyte without mixing the marker substance into the sample. This makes it possible to more accurately separate the components of the analyte. For example, if a marker substance is mixed into a sample, adsorption between the sample and the marker substance occurs, and this is effective even when the target substance cannot be measured accurately.
  • the wave ping function by the DTW (Dynamic Time Warping) process is linearly approximated and the measurement data is corrected using the slope, the correction is made by the pattern of the entire waveform. It is possible to correct the mobility with high accuracy without being affected by some irregular measurement data on the measurement waveform.
  • correction can be performed using a waveform pattern clustered in a self-organizing map (Self Organization Map) as a reference, so that the present invention can be applied to measurement data in which a characteristic waveform peak cannot be detected. Is possible.
  • Self Organization Map Self Organization Map
  • a self-organizing map is created using the waveform data analyzed in the reference laboratory of the department, and this can be used to correct the mobility in an analysis method that does not use markers in the general hospital laboratory. Therefore, if the marker substance is expensive, it can be analyzed economically in a general hospital laboratory. At this time, the self-organization map template (reference waveform data) can generate more accurate objects by stacking many cases. It is desirable to provide it.
  • the present invention can be applied to various analyzers such as electrophoresis apparatuses and chromatographs.
  • the present invention can be applied to a serum protein electrophoresis apparatus, a capillary single electrophoresis apparatus, a liquid chromatograph, a gas chromatograph, a capacity chromatograph, and the like.
  • a substance that can be analyzed by mobility such as a specific protein
  • mobility such as a specific protein
  • it is effective for detecting M protein.
  • FIG. 1 is a block diagram showing a schematic configuration of a mobility normalization device according to an embodiment of the present invention.
  • FIG. 2 is a flowchart showing the operation of the mobility regularity device according to the embodiment of the present invention.
  • FIG. 3 (a) and (b) are graphs showing unit time array data and differential peak change data, respectively.
  • FIG. 4 is a conceptual diagram showing DTW processing.
  • FIG. 5 is a conceptual diagram showing processing for obtaining the slope of WF in the regularity method according to the embodiment of the present invention.
  • FIG. 6 is a diagram showing an example of an SOM obtained using measurement data obtained by capillary electrophoresis.
  • FIG. 8 is a graph showing an example of WF obtained by DTW treatment in chromatography and its approximate straight line.
  • FIG. 9 is a graph showing an example of the result of correcting the mobility measured by chromatography.
  • FIG. 10 A graph showing an example of the result of marker correction of measurement data of capillary electrophoresis.
  • FIG. 11 is a graph showing the WF related to the measurement data without marker correction and the closest reference waveform data determined by DTW processing.
  • FIG. 12 is a graph showing measurement data normalized by the normality method of the present invention using the slope and intercept obtained from the WF curve shown in FIG. 11 and corresponding reference waveform data.
  • FIG. 14 is a diagram showing an example of an M protein detection rule used in the substance detection method according to the present invention.
  • FIG. 15 is a diagram showing another example of an M protein detection rule used in the substance detection method according to the present invention.
  • FIG. 16 is a diagram showing detection rules for M protein obtained using conventional technology.
  • FIG. 1 is a block diagram showing a schematic configuration of the mobility normalization apparatus according to the embodiment of the present invention.
  • the normalization apparatus 1 includes an arithmetic processing unit 11, a temporary storage unit 12, a recording unit 13, an operation unit 14 for inputting instructions and data to the arithmetic processing unit 11, and an arithmetic processing unit 11.
  • Display unit 15 for displaying processing results, interface unit (hereinafter referred to as input / output IF unit) 16, communication interface unit for exchanging data with external measuring device 2 (hereinafter referred to as communication IF unit) 17) and an internal bus 18 for exchanging data between the internal parts.
  • the measuring device 2 is a measuring device that can acquire data relating to mobility, such as an electrophoresis device or a chromatographic graph.
  • a CPU, a RAM, and a node disk can be used for the arithmetic processing unit 11, the temporary storage unit 12, and the recording unit 13, respectively.
  • the operation unit 14 can be a keyboard, mouse, touch panel, or the like.
  • a serial or parallel interface corresponding to the operation unit 14 may be adopted for the input / output IF unit 16.
  • the input / output IF unit 16 includes a video memory and DA conversion, and displays an image for presenting information on the display unit 15 by outputting an analog signal corresponding to the video system of the display unit 15.
  • the input / output IF unit 16 only needs to have a function of outputting a predetermined digital signal.
  • the configuration of FIG. 1 may be changed so that a part of the temporary storage unit 12 is used as a video memory.
  • FIG. 2 is a flowchart showing the operation of the normalization apparatus 1 according to the present embodiment.
  • the arithmetic processing unit 11 acquires the data input by operating the operation unit 14 and records it in the recording unit 13, reads the data from the recording unit 13 to the temporary storage unit 12 as appropriate, and performs a predetermined process. A predetermined process is performed by recording the result in the recording unit 13.
  • the arithmetic processing unit 11 also generates screen data for prompting the operation of the operation unit 14 and screen data for displaying processing results.
  • the target of mobility measurement is all components of mammals, microorganisms and plants, such as blood, urine, spinal fluid, lymph, tissue fluid, and culture fluid. Analytes are substances that can be analyzed by mobility, such as proteins, sugars, and lipids.
  • step S 1 measurement device force measurement data is acquired via the communication IF unit 17 and recorded in the recording unit 13.
  • step S2 it is determined whether or not the measurement data force acquired in step S1 is time-series one-dimensional data (hereinafter referred to as unit time array data) measured at a predetermined time interval. If it is not unit time array data, the process proceeds to step S3, and the acquired measurement data unit time array data is generated.
  • the measurement data from which the measurement apparatus force is also output is usually unit time array data, and therefore, the process from step S4 can be performed using the measurement data as it is.
  • the measurement data output from the measuring device is usually differential coefficient peak change point data (two-dimensional data array of peak time and amplitude).
  • step S2 the measurement data received by operating the operation unit 14 by the operator before or after receiving the measurement data from the measuring device is arranged in a unit time array. Information regarding whether or not the data is available may be input, and the input information may be recorded in the recording unit 13 in association with the measurement data.
  • Steps S4 to S8 are steps for determining reference waveform data that approximates the acquired measurement data.
  • step S4 1 is set to the counter k of the iterative process.
  • step S5 one waveform data of the plurality of reference waveform data recorded in advance is read from the recording unit 13.
  • step S6 DTW processing is performed using the reference waveform data and measurement data (unit time array data) read in step S5. That is, a wave function (hereinafter also referred to as WF) that converts measurement data into reference waveform data is obtained, and a DTW distance that is a distance along the WF is obtained. Since DTW processing is well known, a diagram illustrating the concept of DTW processing is shown in FIG. In Fig. 4, positive integer values are assigned to one unit time array data in order. 0 to J are assigned to the reference waveform data, and 0 to I are assigned to the measurement data.
  • WF wave function
  • step S7 the WF and DTW distances obtained in step S6 are recorded in the recording unit 13 in association with the reference waveform data.
  • WF is a polygonal line on the two-dimensional plane as shown in Fig. 4, so the coordinates (i, j) (0 ⁇ i ⁇ I, 0 ⁇ j ⁇ J) of each bending point are recorded. Record in Recorder 13.
  • step S8 whether or not the processing in steps S5 to S7 has been completed for all reference waveform data by determining whether the value of the counter k is smaller than the total number of reference waveform data kmax Judge whether or not. If k ⁇ kmax, since unprocessed reference waveform data remains, the process proceeds to step S9, increments the counter k by 1, and returns to step S5. As a result, the processing of steps S5 to S7 is performed on all reference waveform data.
  • step S10 the minimum value of the DTW distances recorded in the recording unit 13 is determined, the coordinate data of the WF corresponding to this minimum value is read from the recording unit 13, and the WF is linearly approximated. Next, find the slope ⁇ (-order coefficient) and intercept j8 (constant term) of the linear function. Since WF is theoretically a straight line, linear regression or nonparametric linear regression methods (for example, Passing-Bablock method) can be used.
  • the medium force of a plurality of coordinate data representing the inflection point of the WF read from the recording unit 13 is selected, and two arbitrary coordinate data are selected, and the slope of a straight line passing through these two points is obtained.
  • the median of all the slopes is determined as the slope oc of the straight line that approximates WF.
  • the intercepts of all combinations are calculated, and the median of these values is defined as the intercept j8 of a straight line approximating WF. In this way, both the slope a and the intercept j8 can be obtained by the same nonparametric method.
  • FIG. 5 is a diagram schematically showing this process. Fig.
  • the lower right figure is a graph in which slopes between arbitrary coordinate data are arranged in ascending order from the left. This graph is almost flat near the center, but changes rapidly near the left and right ends.
  • the slope of this area is the slope obtained using the coordinate data of the bending point that will deviate greatly from the straight line when the WF is approximated by a straight line among the coordinate data representing the bending point of the WF. Therefore, outliers can be excluded by using the median of the slope distribution.
  • step SI1 the measurement data is corrected using the slope ⁇ and the intercept ⁇ obtained in step S10.
  • i'obtained by i' ⁇ X i + j8 (where 0 ⁇ i ⁇ I)
  • the position of mobility m (i) which is the measurement data, is updated from position i. Shift to the correct position i '. This means that the time axis of the measurement data is scaled (stretched or contracted) and offset.
  • step S 12 the measurement data corrected in step S 11 is recorded in the recording unit 13, and the series of processes ends.
  • mobility measurement data without using a marker substance can be normalized (time axis correction) using reference waveform data prepared in advance. Therefore, using the normality data of the mobility recorded at step S12, it is possible to accurately identify the analysis object.
  • the accuracy of normality in the present invention depends on the accuracy of the reference waveform data.
  • analysis including markers is possible in some reference laboratories, etc., it is possible to prepare reference waveform data by performing normality measurement of the mobility measured in the same way as before using marker information .
  • waveform data determined by a self-organizing map can be used as reference waveform data. Since the SOM and the method of generating it are well known, the detailed description will be omitted below.
  • the unit time sequence data of mobility measured by chromatography, electrophoresis, etc. (in the case of differential peak change point data, convert to unit time sequence data) is the target. .
  • a representative is selected from a plurality of waveform data measured by an analysis method in which a marker cannot be mixed. Select the appropriate waveform data and visually correct this waveform data to obtain the initial reference waveform data. Next, clustering by SOM is performed using this reference waveform data, and typical waveform data is extracted. The extracted waveform data is reference waveform data used in the present embodiment.
  • FIG. 6 shows an example of reference waveform data obtained using measurement data obtained by capillary electrophoresis.
  • the SOM is composed of 100 reference waveform data. If the number of reference waveform data is changed according to the type of waveform data in the target area, the accuracy of correction can be improved.
  • FIG. 2 illustrates the case where DTW processing is performed for each reference waveform data and all the results are recorded in the recording unit.
  • the present invention is not limited to this, and the WF for the closest reference waveform data is obtained. Another process may be performed as long as it is possible. After DTW processing for one reference waveform data, compared with the result of DTW processing for the other previous reference waveform data, only the smaller DT W distance, WF (bending point coordinate data) You can save it!
  • the present invention is not limited to this.
  • the slopes in FIG. 5 are sorted in order of magnitude, one value of a region with little fluctuation may be used, or an average value of a region with little fluctuation may be used. The same applies to the section.
  • SOM reference waveform data As long as there is SOM reference waveform data generated as described above, mobility can be corrected in an analysis method that does not use markers in a general hospital laboratory or the like. At this time, SOM templates (reference waveform data) can generate more accurate objects by accumulating many cases, so new SOMs can be provided to general hospitals as appropriate. desirable.
  • the mobility normalization method according to the above-described embodiment can be applied to a substance detection method.
  • the substance detection method using the normalization method of the present invention is, for example, shown in FIG. It can be executed using an apparatus similar to the regular display apparatus 1 shown in FIG.
  • a protein detection method using the normal protein method according to the present invention will be described with reference to the reference numerals in FIG.
  • a decision tree that is a detection rule is obtained by learning using teacher data.
  • the arithmetic processing unit 11 measures the mobility measured using the specimens obtained from each subject regarding a set of subjects including healthy subjects and patients suffering from a predetermined disease. 2 is received and recorded in the recording unit 13.
  • the arithmetic processing unit 11 reads out the measurement data recorded in the recording unit 13 and corrects it using the normal correction method of the present invention.
  • the arithmetic processing unit 11 reads information (hereinafter referred to as “teacher data”), which is recorded in advance in the recording unit 13 and indicates the presence or absence of each subject's disease, from the recording unit 13 and normalizes the teacher data.
  • a decision tree for classifying proteins related to a predetermined disease is obtained.
  • the decision tree is obtained with respect to the data obtained by correcting the mobility measurement data regarding the general subjects (subjects other than the above-described set) using the normality method of the present invention. Is applied as a detection rule, it can be determined whether or not the subject has a protein related to a predetermined disease.
  • the decision tree and the method for obtaining the decision tree are known, the description thereof is omitted.
  • the decision tree determined in this way can be realized as a computer program. Furthermore, it can be realized as computer data having a data structure corresponding to a decision tree. If the decision tree is realized as computer data, each data contained in this data structure can be executed by a computer program as a detection parameter.
  • the mobility normality processing or protein detection processing can be provided as a service.
  • a server computer configured in the same manner as in FIG. 1 except for the measuring device 2 and connected to a communication network is installed in the service providing organization.
  • the service organization also receives the mobility measurement data from an external organization such as a general hospital, executes the regularity processing of the present invention using the server computer, corrects the measurement data, and requests the corrected data.
  • the service organization shall further perform the protein detection process of the present invention using the corrected data and provide the result to the external organization that is the client. You can also.
  • the analysis target is not limited to this, and the present invention can be applied to any substance that can be analyzed by mobility.
  • the mobility can be corrected with high accuracy, and thus the analysis object can be detected with high accuracy.
  • the detector of the measuring device is changed according to the analysis object, a waveform specific to each substance can be obtained, and this waveform can be corrected with high accuracy.
  • the identification of bacteria and the resistance rate of antibiotics can be performed with high accuracy.
  • FIG. 7 and FIG. 8 are examples of graphs showing the WF obtained by DTW treatment in chromatography and its approximate straight line.
  • Fig. 7 shows the result of comparison with the most similar waveform using the reference waveform data, which is the SOM shown in Fig. 6, and the WF is almost a straight line.
  • Fig. 8 shows the WF when the SOM reference waveform data is used, and the mobility tendency can be grasped, but the linearity is small, and the mobility and mobility are calculated using the slope and intercept obtained from this. It is considered that the error increases when the correction is made.
  • the mobility can be corrected with high accuracy by using the reference waveform data obtained by SOM. Even if an abnormal peak appears in a part of the mobility measurement waveform due to the presence of a special protein in the sample, and the WF is distorted, the mobility can be corrected by linear approximation.
  • FIG. 9 is a graph showing an example of the result of correcting the mobility as described above.
  • the reference waveform data and the result of correcting the measurement data are displayed in an overlapping manner. From FIG. 9, it can be seen that the mobility is corrected with high accuracy by the regularity method of the present invention.
  • Fig. 10 is a graph showing an example of measurement data obtained by performing marker correction with the mobility of albumin being 400 and the mobility of the marker (dimethylformamide) on the heel region side being 800 (mobility). Peaks due to albumin and dimethylformamide can be seen at 400 and 800 degrees respectively). The marker peak on the left side of Fig. 10 was unstable and was not used as a marker correction criterion.
  • FIG. 11 is a graph showing WF related to certain measurement data and the most similar reference waveform data determined by the DTW processing after performing marker correction.
  • Fig. 1 the approximate line of WF is overlaid and drawn.
  • FIG. 12 is a graph (broken line) of measurement data normalized by the normality method of the present invention using the slope a and the intercept 13 obtained by the WF force shown in FIG. As a reference, the reference waveform data (waveform corrected using a marker) is shown by a solid line.
  • the normalization method of the present invention was able to correct the mobility without performing marker correction.
  • the mobility (horizontal axis) in Fig. 12 is the value obtained by subtracting 300 from the mobility in Fig. 10.
  • the average value (Mean) is 361.4 and the standard deviation (SD) is 1. 39.
  • the measurement data on the sample containing M protein waveform data measured 14 times from the same sample that also obtained the patient power of myeloma with M protein, including variations in lot and analysis mechanism
  • the mean value (Mean) was 361.6 and the standard deviation (SD) was 0.93. From this result, it can be seen that the normalization method of the present invention is as accurate as the correction by the marker.
  • FIG. 13 is a graph showing the reference waveform data used in the accuracy verification described above and the waveform data after correction of the M protein.
  • the broken line waveform is one of the 14 waveforms after the M protein measurement data is corrected by the normalization method of the present invention, and the solid line waveform is the reference waveform that most closely approximates the broken line waveform.
  • the peak near 100 represents the mobility of albumin
  • the peak near 360 represents the mobility of M protein.
  • This M protein case is a case of a waveform peak that overlaps with the normal complement peak (solid line of the arrow) and is most easily mistaken for complement, but the normality detection method of the present invention is applied. This clearly shows that the M protein peak can be clearly separated from the complement peak.
  • the detection rule of FIG. 14 has a decision tree structure.
  • the numerical value at the left end of each line represents the mobility
  • the meaning of the judgment mark is the same as the meaning in normal computer programming.
  • the numerical value on the right side of the determination code (for example, 0.00048 in the first row) represents the absorbance.
  • the final detection result is displayed on the right side of the colon (:) in each line.
  • Normal and Mpro indicate that the subject is a healthy subject and an M protein case, respectively, and the numbers in parentheses indicate the number of cases corresponding to each case. To express.
  • the number of data used to determine the detection rule is 608 and 89, respectively.
  • This detection rule can detect 64 cases of M protein without error, as indicated by the ellipse.
  • this detection rule was possible to detect M protein cases with an error rate of 0%.
  • the determination targets of the determination formulas in each row shown in FIG. 14, that is, the mobility and the determination code (inequality sign, equal sign) are set so that the mobility of albumin is 400 and the marker dimethylformamide is As long as the mobility on the ⁇ region side is set to 800, there is almost no change, but absorbance, which is the reference value for judgment, is a value that can change depending on measurement data and learning, and is limited to the values shown in FIG. Not.
  • the mobility is obtained by correcting the measurement data so that the mobility of albumin is 400 and the mobility of the marker dimethylformamide on the ⁇ region side is 800. Value.
  • the absorbance is a relative value and cannot be directly compared with the value in FIG.
  • good results were obtained with 100% sensitivity and specificity.
  • sensitivity is 76% and specificity is 100%. It was.
  • the sensitivity is a value obtained from the number of true positives Z (the number of true positives + the number of false negatives) X loo (%), and is the detection rate of M protein positive that can be detected by this detection rule.
  • the degree of distinction is the number of true negatives z (number of false positives + true negatives) calculated by X ⁇ (%), that is,
  • FIG. 16 shows a decision tree obtained by using the methods according to the conventional patent documents 2 and 3. Specifically, the waveform data after normalization for 608 health examination specimens and 89 M protein cases, as described above, is differentiated, and the waveform position x, height y, left The half-value width lhw and the right half-value width rhw were calculated and used for learning.
  • the target of force judgment using the notation similar to Fig. 14 is the position X of the waveform that does not have mobility, height y, left half width lhw, right half width rhw, and It is different from Fig. 14 in that the number of errors is shown on the right side of the slash (/) in parentheses.
  • the detection rule 16 shows only a part of the detection rule, and the detection rule is composed of 347 lines of judgment formulas as a whole, and it is very complicated.
  • the judgment results on the sixth line (840 correct answers, 35 errors) show that the detection accuracy is insufficient. Therefore, it can be seen that a substance, particularly a protein detection method, to which the normalization method of the present invention is applied is very effective.
  • the mobility normalization device, normalization method, normalization program, and self-organization map according to the present invention analyze waveform information obtained from the electrophoresis method in clinical tests, gene analysis, and the like. In some cases, the mobility can be normalized.
  • the detection method, detection program, detection rule generation method, and data structure according to the present invention can be used for the detection of substances based on mobility in clinical tests and gene analysis.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

 マーカを使用せずに易動度を正規化できる装置、方法、プログラム及び自己組織化マップ、並びに正規化後の易動度を用いた物質の検出方法、プログラム、検出ルール生成方法及びデータ構造を提供することを目的とし、易動度正規化方法は、易動度の測定により得られた単位時間配列データである被補正データを複数の参照波形データの各々に変換する複数のワーピング関数、及び各ワーピング関数に対応するDTW距離を求めるステップと、複数のDTW距離の最小値を求め、求められた最小のDTW距離に対応するワーピング関数を決定するステップと、決定されたワーピング関数を近似する直線の傾き及び切片を求めると、傾き及び切片で指定される一次関数を用いて、被補正データを補正するステップとを含む。

Description

易動度の正規化装置、正規化方法、正規化プログラムおよび自己組織化 マップ、並びに、物質の検出方法、検出プログラム、検出ルール生成方法および データ構造
技術分野
[0001] 本発明は、易動度の正規ィ匕処理に関し、特に、マーカ物質を使用することなく易動 度を補正することができる易動度の正規ィヒ装置、正規化方法、正規化プログラムおよ び自己糸且織ィ匕マップ、並びに、正規ィ匕後の易動度を用いた物質の検出方法、検出 プログラム、検出ルール生成方法およびデータ構造に関する。 背景技術
[0002] 臨床検査や遺伝子解析などに用いられる泳動法から得られた波形情報を解析する 場合、易動度によって分離された物質を特定する方法が用いられている。このとき、 易動度は分析の諸条件によって異なるため、易動度を正規ィ匕することが必要である。 易動度を正規ィ匕する方法には、基準となるマーカ物質 (以下単にマーカとも記す)を 試料に混入させる方法や、特徴的な波形ピークなどを指標として易動度を補正する 方法が用いられてきた。
[0003] たとえば、血清蛋白電気泳動分析の場合には、 1枚のセルロースアセテート膜に数 十本の試料を塗布して同時に複数の試料を分析できるため、本発明者によるシート 内易動度補正法 (下記非特許文献 1参照)では、易動度が検証された管理試料を分 析試料に混在させ、管理試料の易動度で、全体の易動度の補正を行なうことができ る。
[0004] また、キヤビラリ一ゾーン電気泳動法に関しては、理論的易動度を使った推定法が 知られている(下記特許文献 1参照)。
[0005] 一方、易動度の測定データ力 作成した特徴量を用いて、 M蛋白を検出する方法
(下記特許文献 2参照)や病態を判定する方法 (下記特許文献 3参照)が知られて 、 る。
特許文献 1 :特開 2001— 074694号公報 特許文献 2:特開平 5 - 312812号公報
特許文献 3:特開平 6— 96138号公報
非特許文献 1 :片岡浩巳,佐々木匡秀,西田政明,武田京子,杉浦哲朗:精度保証 の今後の展開,臨床病理, 47(9),pp823-829,1999.
発明の開示
発明が解決しょうとする課題
[0006] しかし、マーカ物質を混入できな ヽ分析法や特徴的な波形ピークが得られな ヽ分 析対象物の場合には、従来の方法では易動度の補正を行なうことができな力つた。
[0007] また、キヤビラリ一ゾーン電気泳動法や液体クロマトグラフィーのように、 1回の分析 で 1つの試料しか分析できな!/、分析法の場合には、マーカ物質を試料に混入させる 方法でしか易動度を補正することができず、他の分析結果を用いて易動度を補正す ることができなかった。
[0008] また、上記特許文献 1による易動度の補正方法では、現実的な臨床検査への適用 においては、さまざまなアーチファクトが加わり理論的易動度の補正法として適用す るには無理があった。
[0009] また、上記特許文献 2による M蛋白検出方法や、上記特許文献 3による病態判定 方法では、検出または判定精度が十分では無力つた。
[0010] 本発明は、上記した課題を解決すベぐマーカ物質を試料に混入させる方法でし か補正できな 、分析法や、マーカ物質を用いての易動度の補正ができな 、領域の 分析法において、易動度を正規化することができる易動度の正規化装置、正規化方 法、正規ィ匕プログラムおよび自己糸且織ィ匕マップ、並びに、正規化後の易動度を用い た物質の検出方法、検出プログラム、検出ルール生成方法およびデータ構造を提供 することを目的とする。
課題を解決するための手段
[0011] 本発明に係る易動度正規化装置(1)は、複数の参照波形データを記録した記録部 と処理部とを備え、前記処理部が、外部から取得した易動度の測定データが単位時 間配列データである場合、前記測定データを被補正データとし、外部から取得した 易動度の測定データが時間情報と測定値とを対応させた複数の 2次元データである 場合、これらの 2次元データを補間して単位時間配列データである被補正データを 生成し、前記記録部から複数の前記参照波形データを読み出し、前記被補正デー タを複数の前記参照波形データの各々に変換する複数のヮービング関数、及び各ヮ 一ビング関数に対応する DTW距離を求め、複数の前記 DTW距離のうちの最小値 を求め、求められた最小の DTW距離に対応する前記ヮービング関数を決定し、決 定された前記ヮービング関数を近似する直線の傾き及び切片を求め、前記傾き及び 切片で指定される一次関数を用いて前記被補正データを補正する。
[0012] また、本発明に係る易動度正規化装置 (2)は、上記の易動度正規化装置(1)にお いて、前記処理部が、決定された前記ヮービング関数の任意の屈曲点間の傾きを計 算し、複数の前記屈曲点間の傾きを大きさの順に並べた場合に両端の所定領域に 含まれる傾きを除外して、前記屈曲点間の傾き力も前記ヮービング関数を近似する 前記直線の傾きを求めることを含む。
[0013] また、本発明に係る易動度正規化装置 (3)は、上記の易動度正規化装置 (2)にお いて、前記処理部が、複数の前記屈曲点間の傾きの中央値を、前記ヮービング関数 を近似する前記直線の傾きとして決定する。
[0014] また、本発明に係る易動度正規化装置 (4)は、上記の易動度正規化装置(1)にお いて、複数の前記参照波形データが、マーカ物質を含む検体の易動度の測定デー タを、マーカ物質の易動度を用いて補正したデータである。
[0015] また、本発明に係る易動度正規化装置 (5)は、上記の易動度正規化装置(1)にお いて、複数の前記参照波形データが、複数の易動度の測定データを用いて生成さ れた自己組織化マップを構成するデータである。
[0016] また、本発明に係る易動度正規化方法(1)は、易動度の測定により得られた単位 時間配列データである被補正データを、所定の複数の参照波形データの各々に変 換する複数のヮービング関数、及び各ヮービング関数に対応する DTW距離を求め る第 1ステップと、複数の前記 DTW距離のうちの最小値を求め、求められた最小の D TW距離に対応する前記ヮービング関数を決定する第 2ステップと、決定された前記 ヮービング関数を近似する直線の傾き及び切片を求める第 3ステップと、前記傾き及 び切片で指定される一次関数を用いて前記被補正データを補正する第 4ステップと を含む。
[0017] また、本発明に係る易動度正規化方法 (2)は、上記の易動度正規化方法(1)にお いて、前記易動度の測定によって得られるデータが、時間情報と測定値とを対応させ た 2次元データであり、前記被補正データが、複数の前記 2次元データを補間して生 成された単位時間配列データである。
[0018] また、本発明に係る易動度正規化方法 (3)は、上記の易動度正規化方法(1)にお いて、前記第 3ステップが、前記第 2ステップで決定された前記ヮービング関数の任 意の屈曲点間の傾きを計算する第 5ステップと、前記屈曲点間の傾きを大きさの順に 並べた場合に両端の所定領域に含まれる傾きを除外して、前記屈曲点間の傾きから 前記ヮービング関数を近似する前記直線の傾きを求める第 6ステップとを含む。
[0019] また、本発明に係る易動度正規化方法 (4)は、上記の易動度正規化方法(1)にお いて、前記第 6ステップが、複数の前記屈曲点間の傾きの中央値を、前記ヮービング 関数を近似する前記直線の傾きとして決定するステップである。
[0020] また、本発明に係る易動度正規化方法 (5)は、上記の易動度正規化方法(1)にお いて、複数の前記参照波形データが、マーカ物質を含む検体の易動度の測定デー タを、マーカ物質の易動度を用いて補正したデータである。
[0021] また、本発明に係る易動度正規化方法 (6)は、上記の易動度正規化方法(1)にお いて、複数の前記参照波形データが、複数の易動度の測定データを用いて生成さ れた自己組織化マップを構成するデータである。
[0022] また、本発明に係るコンピュータ読取可能な記録媒体(1)は、複数の参照波形デ ータを記録した記録部と処理部とを備えた装置において、前記処理部に、易動度の 測定により得られた単位時間配列データである被補正データを、複数の前記参照波 形データの各々に変換する複数のヮービング関数、及び各ヮービング関数に対応す る DTW距離を求める第 1の機能と、複数の前記 DTW距離の最小値を求め、求めら れた最小の DTW距離に対応する前記ヮービング関数を決定する第 2の機能と、決 定された前記ヮービング関数を近似する直線の傾き及び切片を求める第 3の機能と、 前記傾き及び切片で指定される一次関数を用いて前記被補正データを補正する第 4の機能とを実現させる易動度正規ィ匕プログラムを記録している。 [0023] また、本発明に係るコンピュータ読取可能な記録媒体 (2)は、検体の易動度の測定 により得られた単位時間配列データである被補正データを、目視によって補正して得 られる波形データ、若しくは、マーカ物質を含む検体の易動度の測定により得られた 単位時間配列データである被補正データを、前記マーカ物質の易動度によって補正 して得られる波形データを用いたコンピュータによる学習処理によって生成され、上 記の易動度正規化方法(1)において、前記参照波形データとして使用される自己組 織ィ匕マップを記録して 、る。
[0024] また、本発明に係る物質検出方法(1)は、教師データを用いた学習によって求めら れる決定木を検出ルールとして用いる物質の検出方法であって、前記決定木が、複 数の検体の易動度の測定データを、上記の易動度正規化方法(1)を用いて補正す ることによって得られた正規化データと、前記測定データに対応した、所定の物質の 有無を表す情報を含む前記教師データとを用いた学習によって求められる決定木で ある。
[0025] また、本発明に係る物質検出方法 (2)は、上記の物質検出方法(1)において、前 記物質が M蛋白であり、アルブミンの易動度を 400とし、ジメチルホルムアミドの γ領 域側の易動度を 800とした場合、前記決定木が、図 14又は図 15に示す易動度及び 判定符号の組み合わせとして記述される。
[0026] また、本発明に係るコンピュータ読取可能な記録媒体(3)は、コンピュータに、教師 データを用いた学習によって求められた決定木を検出ルールとして用いて、物質を 検出する機能を実現させる物質の検出プログラムであって、前記決定木が、複数の 検体の易動度の測定データを、上記の易動度正規ィ匕方法(1)を用いて補正すること によって得られた正規化データと、前記測定データに対応した、所定の物質の有無 を表す情報を含む前記教師データとを用いた学習によって求められる決定木である 物質検出プログラムを記録している。
[0027] また、本発明に係る物質検出ルール生成方法は、物質の検出に使用される検出ル ールの生成方法であって、コンピュータを用い、複数の検体の易動度の測定データ を、上記の易動度正規化方法(1)を用いて補正し、正規化データを生成する第 1ス テツプと、前記測定データに対応した、所定の物質の有無を表す情報を含む教師デ ータ、及び前記正規化データを用い、学習によって決定木を求めて、検出ルールと する第 2ステップとを含む。
[0028] また、本発明に係るコンピュータ読取可能な記録媒体 (4)は、物質の検出ルールと して使用されるデータ構造であって、複数の検体の易動度の測定データを、上記の 易動度正規ィ匕方法(1)を用いて補正することによって得られた正規ィ匕データと、前記 測定データに対応した、所定の物質の有無を表す情報を含む前記教師データとを 用いた学習によって求められた決定木を表すデータ構造(1)を記録して!/、る。
[0029] また、本発明に係るコンピュータ読取可能な記録媒体 (5)は、上記のデータ構造(1 )において、前記物質が M蛋白であり、アルブミンの易動度を 400とし、ジメチルホル ムアミドの γ領域側の易動度を 800とした場合、前記検出ルールが、図 14又は図 15 に示す易動度及び判定符号の組み合わせとして記述されるデータ構造(2)を記録し ている。
発明の効果
[0030] 本発明によれば、マーカ物質を試料に混入させなくても、分析対象物の易動度の 測定データの波形パターンを用いて、易動度の測定データを正規ィ匕することが可能 となり、より正確に分析対象物の成分の分離が可能となる。例えば、マーカ物質を試 料に混入させると、試料とマーカ物質との吸着等が発生して、正確に目的の物質が 計測できな 、場合にも有効である。
[0031] また、本発明では、 DTW(Dynamic Time Warping)処理によるヮービング関数 (War ping Function)を直線近似し、その傾きを用いて測定データを補正するので、波形全 体のパターンによって補正することができ、測定波形上の一部のイレギュラーな測定 データに影響されずに、精度良く易動度を補正することができる。
[0032] また、本発明では、自己組織化マップ(Self Organization Map)でクラスタリングした 波形パターンを基準として用いて補正することができるので、特徴的な波形ピークが 検出できない測定データに対しても適用可能である。
[0033] また、本発明によれば、大量の検体に関する測定データを高速に補正することがで き、自動ィ匕することも可會である。
[0034] また、マーカを使用することができる分析方法を適用することが可能であっても、一 部のリファレンス検査室等で分析した波形データを用いて自己組織化マップを作成 し、これを用いて一般病院の検査室で、マーカを使用しない分析方法において易動 度を補正することができる。従って、マーカ物質が高価な場合には、一般病院の検査 室で経済的に分析を行うことができる。このとき、自己組織ィ匕マップのテンプレート( 参照波形データ)は、多くの症例を積み重ねることによって、より精度の高い物を生成 することができるため、適宜新たな自己組織ィ匕マップを一般病院などに提供すること が望ましい。
[0035] また、マーカを使うことができな 、物質の検査用には、リファレンス検査室等にお!ヽ て自己糸且織ィ匕マップのテンプレートのみを目視で補正すれば、精度の高!、易動度の 補正を行うことができる。
[0036] 本発明は、電気泳動装置やクロマトグラフなどの種々の分析装置に適用することが できる。例えば、血清蛋白電気泳動装置、キヤビラリ一電気泳動装置、液体クロマトグ ラフ、ガスクロマトグラフ、ァフィユティークロマトグラフなどに適用することができる。
[0037] また、本発明によれば、易動度によって分析可能な物質、例えば特定の蛋白質を 精度良く検出することができる。特に、 M蛋白の検出に有効である。
図面の簡単な説明
[0038] [図 1]本発明の実施の形態に係る易動度の正規化装置の概略構成を示すブロック図 である。
[図 2]本発明の実施の形態に係る易動度の正規ィ匕装置の動作を示すフローチャート である。
[図 3] (a)及び (b)は、それぞれ単位時間配列データ及び微分係数ピーク変化点デ ータを示すグラフである。
[図 4]DTW処理を示す概念図である。
[図 5]本発明の実施の形態に係る正規ィ匕方法における WFの傾きを求める処理を示 す概念図である。
[図 6]キヤピラリー電気泳動法による測定データを用いて求めた SOMの一例を示す 図である。
[図 7]クロマトグラフィーにおいて DTW処理によって求めた WFと、その近似直線とを 示す一例のグラフである。
[図 8]クロマトグラフィーにおいて DTW処理によって求めた WFと、その近似直線とを 示す一例のグラフである。
[図 9]クロマトグラフィーによって測定した易動度を補正した結果の一例を示すグラフ である。
[図 10]キヤピラリー電気泳動法の測定データをマーカ補正した結果の一例を示すグ ラフである
[図 11]マーカ補正を行っていない測定データと DTW処理で決定した最も近似する 参照波形データとに関する WFを示すグラフである。
圆 12]図 11に示した WFカゝら得られた傾き及び切片を用いて本発明の正規ィ匕方法で 正規化された測定データ、及び対応する参照波形データを示すグラフである。
圆 13]キヤピラリー電気泳動法における M蛋白の補正後の波形データ及び参照波形 データを示すグラフである。
[図 14]本発明に係る物質検出方法で使用される M蛋白の検出ルールの一例を示す 図である。
[図 15]本発明に係る物質検出方法で使用される M蛋白の検出ルールの別の一例を 示す図である。
[図 16]従来技術を用いて求めた M蛋白の検出ルールを示す図である。
符号の説明
1 易動度の正規化装置
11 演算処理部
12 一時記憶部
13 記録部
14 操作部
15 表示部
16 入出力インタフェース部
17 通信インタフェース咅
18 内部バス 2 測定装置
発明を実施するための最良の形態
[0040] 以下、本発明に係る実施の形態を、添付した図面に基づいて説明する。
[0041] 図 1は、本発明の実施の形態に係る易動度の正規化装置の概略構成を示すブロッ ク図である。本実施の形態に係る正規化装置 1は、演算処理部 11と、一時記憶部 12 と、記録部 13と、演算処理部 11に対する指示やデータ入力を行う操作部 14と、演算 処理部 11による処理結果などを表示する表示部 15と、これらとのインタフェース部( 以下、入出力 IF部と記す) 16と、外部の測定装置 2とデータ交換を行う通信インタフ ース部(以下、通信 IF部と記す) 17と、内部の各部間でデータを交換するための内 部バス 18とを備えて構成されている。ここで測定装置 2は、電気泳動装置、クロマトグ ラフなどの易動度に関するデータを取得することができる測定装置である。
[0042] 例えば、コンピュータを利用して構成する場合、演算処理部 11、一時記憶部 12、 及び記録部 13には、それぞれ CPU、 RAM,及びノヽードディスクを用いることができ る。また、操作部 14には、キーボード、マウス、タツチパネルなどを使用することができ る。入出力 IF部 16には、操作部 14に応じたシリアル若しくはパラレルインタフェース を採用すればよい。また、入出力 IF部 16は、ビデオメモリ及び DA変換を備え、表示 部 15のビデオ方式に応じたアナログ信号を出力することによって、表示部 15に情報 を提示するための画像が表示される。なお、表示部 15がビデオデータの DA変 能を有する場合には、入出力 IF部 16は、所定のディジタル信号を出力する機能を有 していればよい。また、図 1の構成を、一時記憶部 12の一部の領域をビデオメモリと して使用するように変更してもよ 、。
[0043] 図 2は、本実施の形態に係る正規化装置 1の動作を示すフローチャートである。以 下、図 2を参照して、本正規化装置 1の動作を具体的に説明する。以下においては、 特に断らない限り、正規ィ匕装置 1の演算処理部 11が行う処理として説明する。演算 処理部 11は、操作部 14が操作されて入力されたデータを取得して記録部 13に記録 し、適宜記録部 13からデータを一時記憶部 12に読み出し、所定の処理を行った後、 その結果を記録部 13に記録することによって、所定の処理を行う。また、演算処理部 11は、操作部 14の操作を促す画面データや処理結果を表示する画面データを生 成し、入出力 IF部 16のビデオ RAMを介して、これらの画像を表示部 15に表示する 。また、記録部 13には、基準とする複数の参照波形データが、所定の形式でデータ ベース化されて保存されているとする。後述するように、参照波形データは、自己組 織化マップ (以下、 SOMとも記す)として決定されていることができる。また、易動度の 測定対象は、哺乳類や微生物や植物の成分全般であり、血液、尿、髄液、リンパ、組 織液、培養液などである。また、分析対象物は蛋白や糖質や脂質など、易動度によ つて分析可能な物質である。
[0044] ステップ S 1にお 、て、通信 IF部 17を介して、測定装置力 測定データを取得し、 記録 13部に記録する。
[0045] ステップ S2にお 、て、ステップ S1で取得した測定データ力 所定の時間間隔で測 定された時系列の 1次元データ(以下、単位時間配列データと記す)であるか否かを 判断し、単位時間配列データでなければ、ステップ S3に移行して、取得した測定デ 一タカ 単位時間配列データを生成する。例えば、電気泳動装置の場合、測定装置 力も出力される測定データは、通常単位時間配列データであるので、測定データを そのまま用いてステップ S4以降の処理を行うことができる。クロマトグラフィーの場合、 測定装置から出力される測定データは、通常微分係数ピーク変化点データ (ピーク の時刻と振幅の 2次元データ配列)である。したがって、この微分係数ピーク変化点 の 2次元データ配列に対しては、これを用いて単位時間配列データを生成する。図 3 の(a)及び (b)は、それぞれ単位時間配列データ及び微分係数ピーク変化点データ を示すグラフである。このとき、演算処理部 11がステップ S2で判断を行うためには、 例えば、測定データを測定装置力 受信する前または後に、操作者が操作部 14を 操作して受信した測定データが単位時間配列データ力否かの情報を入力し、この入 力情報を、測定データと対応させて記録部 13に記録するようにしておけばよい。
[0046] ステップ S4〜S8では、取得した測定データに関して近似する参照波形データを決 定するステップである。
[0047] ステップ S4において、繰り返し処理のカウンタ kに 1を設定する。
[0048] ステップ S5において、記録部 13から、予め記録された複数の参照波形データのう ちの 1つの波形データを読み出す。 [0049] ステップ S6にお 、て、ステップ S5で読み出した参照波形データと測定データ(単位 時間配列データ)とを用いて、 DTW処理を行う。即ち、測定データを参照波形デー タに変換するヮービング関数 (以下 WFとも記す)を求め、 WFに沿った距離である D TW距離を求める。 DTW処理は周知であるので、図 4に DTW処理の概念を示す図 を示し、詳細説明は省略する。図 4では、 1つの単位時間配列データに、順に正の整 数値を付与している。参照波形データに対しては 0〜Jを、測定データに対しては 0〜 Iを付与している。
[0050] ステップ S7にお!/、て、ステップ S6で求めた WFおよび DTW距離を、参照波形デー タと対応させて記録部 13に記録する。本実施の形態では、 WFは図 4に示したように 2次元平面上の折れ線になるので、各屈曲点の座標 (i, j) (0≤i≤I、 0≤j≤J)を記 録部 13に記録する。
[0051] ステップ S8において、カウンタ kの値が参照波形データの総数 kmaxよりも小さいか 否かを判断することによって、全ての参照波形データに対してステップ S 5〜S7の処 理を終了したか否かを判断する。 k< kmaxである場合、未処理の参照波形データが 残っているので、ステップ S 9に移行してカウンタ kを 1だけ増大させ、ステップ S 5に戻 る。これによつて、全ての参照波形データに対してステップ S 5〜S7の処理が行われ る。
[0052] ステップ S 10において、記録部 13に記録した DTW距離の中の最小値を決定し、こ の最小値に対応する WFの座標データを記録部 13から読み出し、 WFを線形近似す るために、一次関数の傾き α (—次係数)および切片 j8 (定数項)を求める。 WFは、 理論的には直線になるので、直線回帰や、ノンパラメトリックな直線回帰法 (たとえば 、 Passing- Bablock法)を用いることができる。
[0053] 本実施の形態では、記録部 13から読み出した WFの屈曲点を表す複数の座標デ 一タの中力 任意の 2つの座標データを選択し、これら 2点を通る直線の傾きを求め 、それらの傾き全体の中央値を、 WFを近似する直線の傾き ocとして決定する。切片 βに関しても同様に、すべての組み合わせの切片を計算し、それらの値の中央値を 、 WFを近似する直線の切片 j8とする。このように、傾き aも切片 j8も同じノンパラメト リック手法で求めることができる。図 5は、この処理を模式的に示す図である。図 5の 右下の図は、任意の座標データ間の傾きを、左から小さい順に並べたグラフである。 このグラフは、中央付近ではほぼ平坦であるが、左右の両端付近で急激に変化して いる。この領域の傾きは、 WFの屈曲点を表す座標データのうち、 WFを直線近似し た場合に、直線から大きく外れることになる屈曲点の座標データを用いて求められた 傾きである。したがって、傾き分布の中央値を使用することによって、外れ値を除外 することができる。
[0054] ステップ SI 1にお 、て、ステップ S10で求めた傾き α及び切片 βを用いて測定デ ータを補正する。即ち、 i' = α X i+ j8 (ここで 0≤i≤I)によって求められた i'を用い て、測定データである易動度 m (i)のグラフ上の位置を、位置 iから新たな位置 i'にシ フトする。これは、測定データの時間軸をスケーリング (伸張または収縮)およびオフ セットさせることを意味する。
[0055] ステップ S 12にお 、て、ステップ S 11で補正した測定データを記録部 13に記録して 、一連の処理を終了する。
[0056] 以上によって、マーカ物質を使用すること無ぐ易動度の測定データを、予め用意 された参照波形データを用いて正規化(時間軸の補正)することができる。従って、ス テツプ S12で記録された易動度の正規ィ匕データを用いて、分析対象物の同定を精 度よく行うことができる。
[0057] 以上の説明力も分力るように、本発明における正規ィ匕の精度は、参照波形データ の精度に依存する。一部のリファレンス検査室等でマーカを含む分析が可能な場合 には、マーカの情報を用いて従来と同様に測定した易動度の正規ィ匕を行ない、参照 波形データを準備することができる。
[0058] 一方、マーカを混入できな 、分析法の場合には、自己組織化マップ(SOM)によつ て決定した波形データを参照波形データとして用いることができる。 SOM及びこれを 生成する方法は周知であるので詳細説明を省略する力 易動度の測定データに適 用する場合に関して以下に説明する。上記したように、クロマトグラフィーや電気泳動 法などによって測定された易動度の単位時間配列データ (微分係数ピーク変化点デ ータの場合には、単位時間配列データに変換する)が対象である。
[0059] 先ず、マーカを混入できない分析法で測定した複数の波形データの中から、代表 的な波形データを選択し、目視でこの波形データを補正し、初期の参照波形データ とする。次に、この参照波形データを用いて、 SOMによるクラスタリングを行い、典型 的な波形データを抽出する。抽出された波形データが、本実施の形態で使用される 参照波形データである。
[0060] このとき、 SOMによるクラスタリングによって典型的な波形データが抽出されなけれ ば、抽出されるまで、上記の補正操作を繰り返し、精度の高い参照波形データを作 成することもできる。図 6に、キヤピラリー電気泳動法による測定データを用いて求め た参照波形データの一例を示す。図 6では、 100個の参照波形データによって SOM が構成されている。参照波形データの数は、対象領域の波形データの種類に応じて 変更すると、補正の精度を高めることができる。
[0061] 図 2に示したフローチャートは一例であり、これに限定されない。例えば、図 2では 参照波形データ毎に DTW処理を行 ヽ、その結果を全て記録部に記録する場合を説 明したが、これに限定されず、最も近似する参照波形データに関する WFを求めるこ とさえできれば、別の処理であってもよい。 1つの参照波形データに対して DTW処理 を行った後、前回の別の参照波形データに対する DTW処理の結果と比較して、 DT W距離の小さ 、方の WF (屈曲点の座標データ)のみを保存するようにしてもよ!、。
[0062] また、上記ではステップ S10において、傾き及び切片の中央値を採用し、外れ値を 除外して WFを直線近似する場合を説明したが、これに限定されない。例えば、図 5 における傾きを大きさの順にソートしたグラフにおいて、変動が少ない領域の 1つの 値を使用してもよぐ変動が少ない領域の平均値を使用してもよい。切片に関しても 同様である。
[0063] 上記したように生成された SOMの参照波形データさえあれば、一般病院の検査室 などで、マーカを使用しない分析方法において易動度を補正することができる。この とき、 SOMのテンプレート(参照波形データ)は、多くの症例を積み重ねることによつ て、より精度の高い物を生成することができるため、適宜新たな SOMを一般病院など に提供することが望ましい。
[0064] また、上記した実施の形態に係る易動度の正規化方法を物質の検出方法に適用 することができる。本発明の正規化方法を利用した物質の検出方法は、例えば、図 1 に示した正規ィ匕装置 1と同様の装置を用いて実行することができる。以下に、本発明 の正規ィ匕方法を利用した蛋白質の検出方法について、正規ィ匕装置 1と同じ構成の装 置を用いて実行することとして、図 1の符号を参照して説明する。
[0065] 先ず、教師データを用いた学習によって、検出ルールである決定木を求める。具体 的には、演算処理部 11が、健常者と所定の疾患に罹病している患者を含む被験者 の集合に関して、各被験者から取得された検体を用いて測定された易動度を測定装 置 2から受信し、記録部 13に記録する。次に、演算処理部 11は、記録部 13に記録し た測定データを読み出し、本発明の正規ィ匕方法を用いて補正する。次に、演算処理 部 11は、予め記録部 13に記録された、各被検者の疾患の有無を示す情報(以下教 師データと記す)を、記録部 13から読み出し、教師データと正規化された測定データ を用いて学習を行い、所定の疾患に関係する蛋白質を分類する決定木を求める。こ うして決定木が求められた後は、一般の被験者 (上記集合以外の被験者)に関する 易動度の測定データを本発明の正規ィ匕方法を用いて補正したデータに対して、この 決定木を検出ルールとして適用することによって、その被験者が所定の疾患に関係 する蛋白質を有している力否かを判断することができる。ここで、決定木、及び決定 木を求める方法は公知であるので、説明を省略する。
[0066] また、実施例として後述するように、このようにして決定された決定木を、コンビユー タプログラムとして実現することができる。さらには、決定木に該当するデータ構造を 有するコンピュータデータとして実現することもできる。決定木をコンピュータデータと して実現した場合には、このデータ構造に含まれる各データを、検出のパラメータと するコンピュータプログラムで実行すればよ 、。
[0067] また、易動度の正規ィ匕処理または蛋白質の検出処理をサービスとして提供すること もできる。例えば、サービス提供機関に、測定装置 2を除いて図 1と同様に構成され、 通信ネットワークに接続されたサーバコンピュータを設置する。サービス機関は、一般 病院などの外部機関力も易動度の測定データを受け取って、サーバコンピュータを 用いて本発明の正規ィ匕処理を実行して測定データを補正し、補正後のデータを依 頼者である外部機関に提供する。サービス機関は、さらに、補正後のデータを用いて 本発明の蛋白質検出処理を行い、その結果を依頼者である外部機関に提供すること もできる。このとき、易動度の測定データのサーバコンピュータへの供給、および処理 結果のデータの依頼者への提供には、通信ネットワークを介した通信や、フレキシブ ルディスク、 CD-ROM, USBメモリなどの可搬性の記録媒体を用いて行うことがで きる。
[0068] また、上記では一例として蛋白質を検出する場合について説明したが、分析対象 物はこれに限定されず、易動度によって分析可能な物質であれば、本発明を適用す ることによって、精度良く易動度を補正することができ、よって分析対象物を精度良く 検出することができる。例えば、分析対象物に応じて測定装置の検出器を変えれば、 それぞれの物質特有の波形を得ることができ、この波形を精度良く補正することがで きる。例えば、細菌の同定や抗生物質の耐性率なども精度良く行うことができる。 実施例 1
[0069] 以下に実施例を示し、本発明の特徴とするところをより一層明確にする。
[0070] 図 7、図 8は、クロマトグラフィーにおいて DTW処理によって求めた WFと、その近 似直線とを示す一例のグラフである。図 7は、図 6に示した SOMである参照波形デー タを用いて、最も類似した波形と比較した結果であり、 WFはほぼ直線になっている。 一方、図 8は、 SOMの参照波形データを利用しな力つた場合の WFであり、易動度 の傾向は把握できるが、直線部分が少なぐこれから求めた傾き及び切片を用いて 易動度を補正した場合、誤差が大きくなると考えられる。このように、 SOMによって求 めた参照波形データを用いることで、精度良く易動度を補正可能であることが分かる 。検体中の特殊な蛋白質の存在などによって、易動度の測定波形の一部に異常なピ ークが出現し、 WFが歪んだとしても、直線近似で易動度を補正することができる。
[0071] 図 9は、上記したように易動度を補正した結果の一例を示すグラフである。図 9では 、参照波形データと、測定データを補正した結果とを重ねて表示している。図 9から、 本発明の正規ィ匕方法によって、易動度の補正が精度良く行なわれていることが分か る。
実施例 2
[0072] 本発明をキヤピラリー電気泳動法の測定データに適用した例を説明する。本実験 例では、測定装置としてベックマンコールター社製 CZE2000を使用し、同装置から 出力される未補正の測定データを使用した。マーカとしてジメチルホルムアミドを用い て測定を行い、マーカ補正を行って SOMを求め、参照波形データを決定した。
[0073] 図 10は、測定データを、アルブミンの易動度を 400、マーカ(ジメチルホルムアミド) の Ί領域側の易動度を 800としてマーカ補正した測定データの一例を示すグラフで ある(易動度が 400、 800の位置に、それぞれアルブミン、ジメチルホルムアミドによる ピークが見られる)。図 10の左側のマーカのピークは、不安定であったので、マーカ 補正の基準には使用しなかった。
[0074] 図 1 1は、マーカ補正を行って 、な 、ある測定データと DTW処理で決定した最も近 似する参照波形データとに関する WFを示すグラフである。図 1 1には、 WFの近似直 線を重ねて描画して ヽる。 DTW距離 ίま、 4. 81007 X 102であり、傾き α = 2. 371、 切片 j8 =— 54. 529である。
[0075] 図 12は、図 1 1に示した WF力 得られた傾き a、切片 13を用いて本発明の正規ィ匕 方法で正規化された測定データのグラフ (破線)である。参考として、参照波形データ (マーカを用いて補正された波形)を実線で示している。このように、本発明の正規化 方法によって、マーカ補正を行わずに、易動度を補正することができた。なお、図 12 の易動度 (横軸)は、図 10の易動度から 300を減算した値であり、例えば、図 10にお ける易動度 = 400は、図 12では易動度 = 100に対応する。
実施例 3
[0076] 本発明の正規ィ匕方法の精度に関して説明する。ここでは、実施例 2と同様に、マー 力としてジメチルホルムアミドを使用し、アルブミンの易動度をキヤピラリー電気泳動 法で測定し、 2344個の波形 (測定データ)を採取し、これらの測定データをマーカで 補正し、 SOMを求め、参照波形データを決定した。また、アルブミンを含む M蛋白の 検体に関して同様に測定し、 14個の波形 (測定データ)を採取し、各測定データを本 発明の正規化方法で補正した。
[0077] 2344個のマーカ補正した後の波形データに関して、アルブミンの易動度 (易動度 力 S 100付近のピーク位置)を統計処理した結果、平均値 (Mean)が 106. 3、標準偏 差 (SD)が 1. 01であった。一方、 M蛋白を含む検体に関する測定データを本発明 の正規ィ匕方法で補正して得られた 14個の波形データに関して、同様にアルブミンの 易動度を統計処理した結果、平均値 (Mean)が 106. 5、標準偏差 (SD)が 1. 40で あった。従って、本発明によって、マーカを使用した補正方法と同等の精度、若しくは 若干誤算の大きい程度の精度で易動度を補正できることが分力る。
[0078] また、 M蛋白の易動度 (易動度が 360付近のピーク位置)に関して、同様に統計処 理した結果、平均値 (Mean)が 361. 4、標準偏差(SD)が 1. 39であった。比較のた めに、 M蛋白を含む検体に関する測定データ (M蛋白を持つ骨髄腫の患者力も得た 同じ検体を、 14回測定した波形データであり、ロット、分析機構のばらつきを含む)を マーカで補正し、 M蛋白の易動度に関して統計処理した。その結果、 M蛋白の易動 度に関して、平均値 (Mean)が 361. 6、標準偏差(SD)が 0. 93であった。この結果 からも、本発明の正規化方法は、マーカによる補正と同程度の精度であることが分か る。
[0079] 図 13は、上記した精度の検証で使用した参照波形データおよび M蛋白の補正後 の波形データを示すグラフである。破線の波形は、 M蛋白の測定データを本発明の 正規化方法で補正した後の、 14個の波形のひとつであり、実線の波形は、破線の波 形に最も近似する参照波形である。 100付近のピーク(実線および破線)はアルブミ ンの易動度を表し、 360付近のピーク (破線)は M蛋白の易動度を表している。この M蛋白の症例は、正常の補体のピーク (矢印部分の実線)と重なって、目視では補体 と最も間違えやすい波形ピークの症例であるが、本発明の正規ィ匕方法を適用するこ とによって、 M蛋白のピークを補体のピークと明確に分離できることが分かる。
実施例 4
[0080] 本発明の正規化方法を応用した蛋白質の検出方法を、 M蛋白の検出に適用した 例を説明する。ここでは、 608件の健診検体、 89件の M蛋白事例を用いて、上記し たように M蛋白を検出する決定木を求めた。その結果、図 14に示す 20行で記述され る検出ルールが得られた。ここで、アルブミンの易動度を 400、マーカであるジメチル ホルムアミドの γ領域側の易動度を 800として、測定データを補正し、 SOMを求めて 決定した参照波形データを使用した。
[0081] 図 14の検出ルールは、決定木の構造をしている。図 14において、各行の左端の数 値 (例えば、第 1行では 779)は易動度を表し、不等号(くまたは〉)及び等号(=)は 、左辺と右辺の大小関係を指定する判定符合を表す。判定符合の意味は、通常のコ ンピュータプログラミングにおける意味と同じである。判定符号の右辺の数値 (例えば 、第 1行では 0. 00048)は吸光度を表す。また、各行のコロン(:)の右側には最終の 検出結果が表示されており、 Normal, Mproはそれぞれ健常者、 M蛋白事例である ことを表し、括弧内の数値はそれぞれに該当する件数を表す。従って、 Normal, Mp roのそれぞれについて括弧内の数値を加算すると、検出ルールを求めるのに使用し たデータ件数である 608、 89となっている。この検出ルールは、楕円で示したように、 M蛋白の症例をエラー無く 64件検出することができる。また、この検出ルールを、約 8000件の正規ィ匕後の測定データに適用した結果、エラー率 0%で M蛋白事例を検 出することができた。
[0082] なお、図 14に示した各行の判定式の判定対象、即ち易動度と、判定符号 (不等号 、等号)とは、アルブミンの易動度を 400とし、マーカであるジメチルホルムアミドの γ 領域側の易動度を 800とする限り殆ど変化しないが、判断の基準値である吸光度は 、測定データや学習に依存して変化し得る値であって、図 14に示した値に限定され ない。
[0083] また、 1161件の健診検体、 50件の Μ蛋白事例を用いて、上記したように Μ蛋白を 検出する決定木を求めた。その結果、図 15に示す 22行で記述される検出ルールが 得られた。ここで、図 14と同様の表記法を用いている力 括弧内の数値のうち、斜線 (/)の右側の数値は、 Μ蛋白事例を正常と誤って判断した件数である。従って、 Nor malについて、括弧内の数値および斜線の左側の数値をカ卩算し、 Mproについて、 括弧内の数値および斜線の右側の数値を加算すると、検出ルールを求めるのに使 用したデータ件数 1161、 50となっている。また、易動度は、図 14と同様に、アルブミ ンの易動度が 400、マーカであるジメチルホルムアミドの γ領域側の易動度が 800と なるように、測定データを補正して得られた値である。なお、吸光度は、相対的な値 であり、図 14の値と直接比較することはできない。この検出ルールは、エラー率 1. 0 % (= 12/1161)の決定木が導出された。健診検体に Μ蛋白症例を混入させてこ の決定木のルールをテストした結果、感度、特異度とも 100%で良好な結果が得られ た。一方、このルールを一般診療に適用した場合、感度 76%、特異度 100%となつ た。ここで、感度とは、真陽性の件数 Z (真陽性の件数 +偽陰性の件数) X loo (%) で求めた値あり、この検出ルールによって検出できる M蛋白陽性の検出率である。特 異度とは、真陰性の件数 z (偽陽性の件数 +真陰性) X ιοο(%)で求めた値、即ち
、 M蛋白でない群での陰性率である。
[0084] 比較として、図 16に、従来の特許文献 2、 3による方法を用いて求めた決定木を示 す。具体的には、上記と同じ 608件の健診検体、 89件の M蛋白事例に関する正規 化後の各波形データを微分し、各波形の特徴量として、波形の位置 x、高さ y、左半 値幅 lhwおよび右半値幅 rhwを算出し、これらを使用して学習を行った。図 16では、 図 14と同様の表記法を用いている力 判定の対象が易動度では無ぐ波形の位置 X 、高さ y、左半値幅 lhw、右半値幅 rhwである点、及び、括弧の中の斜線 (/)の右側 にエラー件数を示している点が、図 14と異なる。図 16では、検出ルールの一部のみ を示しており、検出ルールは、全体で 347行の判定式によって構成されており、非常 に複雑である。また、例えば第 6行の判定結果 (正解 840件、エラー 35件)から、検出 精度も不十分であることが分かる。従って、本発明の正規化方法を応用した物質、特 に蛋白質の検出方法が非常に有効であることが分かる。
産業上の利用可能性
[0085] 本発明に係る易動度の正規化装置、正規化方法、正規化プログラムおよび自己組 織ィ匕マップは、臨床検査や遺伝子解析などにおいて、泳動法から得られた波形情報 を解析する場合に、易動度を正規ィ匕することができる。また、本発明に係る検出方法 、検出プログラム、検出ルール生成方法およびデータ構造は、臨床検査や遺伝子解 析などにおいて、易動度による物質の検出に用いることができる。

Claims

請求の範囲
[1] 複数の参照波形データを記録した記録部と処理部とを備え、
前記処理部が、
外部力 取得した易動度の測定データが単位時間配列データである場合、前記測 定データを被補正データとし、
外部力 取得した易動度の測定データが時間情報と測定値とを対応させた複数の 2次元データである場合、これらの 2次元データを補間して単位時間配列データであ る被補正データを生成し、
前記記録部から複数の前記参照波形データを読み出し、前記被補正データを複 数の前記参照波形データの各々に変換する複数のヮービング関数、及び各ヮーピン グ関数に対応する DTW距離を求め、
複数の前記 DTW距離のうちの最小値を求め、求められた最小の DTW距離に対 応する前記ヮービング関数を決定し、
決定された前記ヮービング関数を近似する直線の傾き及び切片を求め、 前記傾き及び切片で指定される一次関数を用いて前記被補正データを補正する 易動度正規化装置。
[2] 前記処理部が、
決定された前記ヮービング関数の任意の屈曲点間の傾きを計算し、
複数の前記屈曲点間の傾きを大きさの順に並べた場合に両端の所定領域に含ま れる傾きを除外して、前記屈曲点間の傾き力 前記ヮービング関数を近似する前記 直線の傾きを求める請求項 1に記載の易動度正規化装置。
[3] 前記処理部が、複数の前記屈曲点間の傾きの中央値を、前記ヮービング関数を近 似する前記直線の傾きとして決定する請求項 2に記載の易動度正規化装置。
[4] 複数の前記参照波形データが、マーカ物質を含む検体の易動度の測定データを、 マーカ物質の易動度を用いて補正したデータである請求項 1に記載の易動度正規 化装置。
[5] 複数の前記参照波形データが、複数の易動度の測定データを用いて生成された 自己組織ィ匕マップを構成するデータである請求項 1に記載の易動度正規化装置。
[6] 易動度の測定により得られた単位時間配列データである被補正データを、所定の 複数の参照波形データの各々に変換する複数のヮービング関数、及び各ヮービング 関数に対応する DTW距離を求める第 1ステップと、
複数の前記 DTW距離のうちの最小値を求め、求められた最小の DTW距離に対 応する前記ヮービング関数を決定する第 2ステップと、
決定された前記ヮービング関数を近似する直線の傾き及び切片を求める第 3ステツ プと、
前記傾き及び切片で指定される一次関数を用いて前記被補正データを補正する 第 4ステップとを含む易動度正規化方法。
[7] 前記易動度の測定によって得られるデータが、時間情報と測定値とを対応させた 2 次元データであり、
前記被補正データが、複数の前記 2次元データを補間して生成された単位時間配 列データである請求項 6に記載の易動度正規化方法。
[8] 前記第 3ステップが、
前記第 2ステップで決定された前記ヮービング関数の任意の屈曲点間の傾きを計 算する第 5ステップと、
前記屈曲点間の傾きを大きさの順に並べた場合に両端の所定領域に含まれる傾き を除外して、前記屈曲点間の傾きから前記ヮービング関数を近似する前記直線の傾 きを求める第 6ステップとを含む請求項 6に記載の易動度正規ィ匕方法。
[9] 前記第 6ステップが、複数の前記屈曲点間の傾きの中央値を、前記ヮービング関数 を近似する前記直線の傾きとして決定するステップである請求項 8に記載の易動度 正規化方法。
[10] 複数の前記参照波形データが、マーカ物質を含む検体の易動度の測定データを、 マーカ物質の易動度を用いて補正したデータである請求項 6に記載の易動度正規 化方法。
[11] 複数の前記参照波形データが、複数の易動度の測定データを用いて生成された 自己組織ィ匕マップを構成するデータである請求項 6に記載の易動度正規化方法。
[12] 複数の参照波形データを記録した記録部と処理部とを備えた装置において、前記 処理部に、
易動度の測定により得られた単位時間配列データである被補正データを、複数の 前記参照波形データの各々に変換する複数のヮービング関数、及び各ヮービング関 数に対応する DTW距離を求める第 1の機能と、
複数の前記 DTW距離の最小値を求め、求められた最小の DTW距離に対応する 前記ヮービング関数を決定する第 2の機能と、
決定された前記ヮービング関数を近似する直線の傾き及び切片を求める第 3の機 能と、
前記傾き及び切片で指定される一次関数を用いて前記被補正データを補正する 第 4の機能とを実現させる易動度正規ィ匕プログラムを記録したコンピュータ読取可能 な記録媒体。
[13] 検体の易動度の測定により得られた単位時間配列データである被補正データを、 目視によって補正して得られる波形データ、若しくは、マーカ物質を含む検体の易動 度の測定により得られた単位時間配列データである被補正データを、前記マーカ物 質の易動度によって補正して得られる波形データを用いたコンピュータによる学習処 理によって生成され、
請求項 6に記載の易動度正規ィ匕方法において、前記参照波形データとして使用さ れる自己組織ィ匕マップを記録したコンピュータ読取可能な記録媒体。
[14] 教師データを用いた学習によって求められる決定木を検出ルールとして用いる物 質の検出方法であって、
前記決定木が、
複数の検体の易動度の測定データを、請求項 6に記載の易動度正規化方法を用 いて補正することによって得られた正規化データと、
前記測定データに対応した、所定の物質の有無を表す情報を含む前記教師デー タと
を用いた学習によって求められる決定木である物質検出方法。
[15] 前記物質が M蛋白であり、
アルブミンの易動度を 400とし、ジメチルホルムアミドの γ領域側の易動度を 800と した場合、前記決定木が、図 14又は図 15に示す易動度及び判定符号の組み合わ せとして記述される請求項 14に記載の物質検出方法。
[16] コンピュータに、教師データを用いた学習によって求められた決定木を検出ルール として用いて、物質を検出する機能を実現させる物質の検出プログラムを記録したコ ンピュータ読取可能な記録媒体であって、
前記決定木が、
複数の検体の易動度の測定データを、請求項 6に記載の易動度正規化方法を用 いて補正することによって得られた正規化データと、
前記測定データに対応した、所定の物質の有無を表す情報を含む前記教師デー タと
を用いた学習によって求められる決定木である物質検出プログラムを記録したコン ピュータ読取可能な記録媒体。
[17] 物質の検出に使用される検出ルールの生成方法であって、
コンピュータを用い、複数の検体の易動度の測定データを、請求項 6に記載の易動 度正規化方法を用いて補正し、正規化データを生成する第 1ステップと、
前記測定データに対応した、所定の物質の有無を表す情報を含む教師データ、及 び前記正規化データを用い、学習によって決定木を求めて、検出ルールとする第 2 ステップとを含む物質検出ルール生成方法。
[18] 物質の検出ルールとして使用されるデータ構造を記録したコンピュータ読取可能な 記録媒体であって、
複数の検体の易動度の測定データを、請求項 6に記載の易動度正規化方法を用 いて補正することによって得られた正規ィ匕データと、前記測定データに対応した、所 定の物質の有無を表す情報を含む前記教師データとを用いた学習によって求めら れた決定木を表すデータ構造を記録したコンピュータ読取可能な記録媒体。
[19] 前記物質が M蛋白であり、
アルブミンの易動度を 400とし、ジメチルホルムアミドの γ領域側の易動度を 800と した場合、前記検出ルールが、図 14又は図 15に示す易動度及び判定符号の組み 合わせとして記述されることを特徴とする請求項 18に記載のデータ構造を記録したコ ンピュータ読取可能な記録媒体。
PCT/JP2006/313759 2005-11-17 2006-07-11 易動度の正規化装置、正規化方法、正規化プログラムおよび自己組織化マップ、並びに、物質の検出方法、検出プログラム、検出ルール生成方法およびデータ構造 WO2007058001A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US12/084,370 US7991569B2 (en) 2005-11-17 2006-07-11 Mobility normalizer, normalizing method, normalizing program, self-organized map, substance detecting method, detecting program, detection rule creating method, and data structure

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005-332835 2005-11-17
JP2005332835A JP4951752B2 (ja) 2005-11-17 2005-11-17 易動度の正規化装置、正規化方法、正規化プログラムおよび自己組織化マップ、並びに、物質の検出方法、検出プログラム、検出ルール生成方法およびデータ構造

Publications (1)

Publication Number Publication Date
WO2007058001A1 true WO2007058001A1 (ja) 2007-05-24

Family

ID=38048392

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2006/313759 WO2007058001A1 (ja) 2005-11-17 2006-07-11 易動度の正規化装置、正規化方法、正規化プログラムおよび自己組織化マップ、並びに、物質の検出方法、検出プログラム、検出ルール生成方法およびデータ構造

Country Status (3)

Country Link
US (1) US7991569B2 (ja)
JP (1) JP4951752B2 (ja)
WO (1) WO2007058001A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107871140A (zh) * 2017-11-07 2018-04-03 哈尔滨工程大学 一种基于斜率弹性相似性度量方法
CN110673515A (zh) * 2018-07-03 2020-01-10 西门子股份公司 对工业设施的监控
WO2022176310A1 (ja) * 2021-02-17 2022-08-25 富士フイルム株式会社 情報処理装置、情報処理方法、プログラム、及び薬剤評価方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2533463T3 (es) * 2006-10-12 2015-04-10 Bhi Limited Partnership Métodos, compuestos, composiciones y vehículos para suministrar ácido 3-amino-1-propanosulfónico
US8306939B2 (en) 2007-03-12 2012-11-06 Kochi University Examination value predicting device using electrophoresis waveform, prediction method, and predicting program
JP5728918B2 (ja) * 2010-12-09 2015-06-03 ヤマハ株式会社 情報処理装置
JP5947567B2 (ja) * 2012-03-02 2016-07-06 株式会社日立ハイテクノロジーズ 質量分析システム
US11037070B2 (en) * 2015-04-29 2021-06-15 Siemens Healthcare Gmbh Diagnostic test planning using machine learning techniques
US10996195B2 (en) 2016-08-05 2021-05-04 Shimadzu Corporation Electrophoresis measurement method, data processing device, and recording medium
US11815489B2 (en) * 2018-10-30 2023-11-14 Kyocera Corporation Measurement device and measurement method
CN115516318A (zh) * 2020-03-09 2022-12-23 伯克利之光生命科技公司 用于坞内测定的方法、系统和试剂盒
CN112712853B (zh) * 2020-12-31 2023-11-21 北京优迅医学检验实验室有限公司 一种无创产前检测装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001074694A (ja) * 1999-09-06 2001-03-23 Univ Hiroshima キャピラリーゾーン電気泳動法における仮想的浸透流を用いた電気泳動時間−実効移動度変換法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3390873B2 (ja) 1992-05-14 2003-03-31 株式会社常光 血清蛋白分画のm蛋白検出方法
JP3054273B2 (ja) 1992-09-11 2000-06-19 オリンパス光学工業株式会社 病態型自動判定方法
US6195449B1 (en) * 1997-05-18 2001-02-27 Robert Bogden Method and apparatus for analyzing data files derived from emission spectra from fluorophore tagged nucleotides
US6906320B2 (en) * 2003-04-02 2005-06-14 Merck & Co., Inc. Mass spectrometry data analysis techniques
US7539532B2 (en) * 2006-05-12 2009-05-26 Bao Tran Cuffless blood pressure monitoring appliance

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001074694A (ja) * 1999-09-06 2001-03-23 Univ Hiroshima キャピラリーゾーン電気泳動法における仮想的浸透流を用いた電気泳動時間−実効移動度変換法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
HAGIMOTO K. ET AL.: "Kotonaru Jikeiretsu Microarray Data no Hikaku no Tame no Data Hosei Hoshiki", INFORMATION PROCESSING SOCIETY OF JAPAN KENKYU HOKOKU, INFORMATION PROCESSING SOCIETY OF JAPAN, vol. 2005, no. 99, 7 October 2005 (2005-10-07), pages 25 - 32, XP003009021 *
KATAOKA H. AND KONISHI O.: "Doteki Keikakuho-SOM ni Motozuku Ruiji Hakei Kensaku System", TRANSACTIONS OF INFORMATION PROCESSING SOCIETY OF JAPAN, INFORMATION PROCESSING SOCIETY OF JAPAN, 15 September 2001 (2001-09-15), pages 92 - 99, XP002989332 *
KATAOKA H. AND KONISHI O.: "Ketteigi no RDB Hyogen to Chishiki Tansaku Shien System", IEICE TECHNICAL REPORT, THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS, vol. 101, no. 193, 12 July 2001 (2001-07-12), pages 105 - 112, XP003009019 *
KATAOKA H. AND SUGIURA T.: "Rinsho Kensa Ryoiki ni Okeru Data Mining", JAPANESE JOURNAL OF CLINICAL LABORATORY AUTOMATION, THE JAPAN SOCIETY FOR CLINICAL LABORATORY AUTOMATION, vol. 26, no. 6, 1 December 2001 (2001-12-01), pages 689 - 696, XP003009700 *
KATAOKA H. ET AL.: "Pattern Hakken no Tame no Bonyoteki na Chromatography Ekidodo Seikika Algorithm no Kaihatsu", JAPANESE JOURNAL OF CLINICAL LABORATORY AUTOMATION, DAI 37 KAI TAIKAI SHOROKUSHU, THE JAPAN SOCIETY FOR CLINICAL LABORATORY AUTOMATION, vol. 30, no. 4, 1 September 2005 (2005-09-01), pages 548, XP003009699 *
KATAOKA H. ET AL.: "Seido Hosho no Kongo no Tenkai", THE JAPANESE JOURNAL OF CLINICAL PATHOLOGY, JAPANESE SOCIETY OF LABORATORY MEDICINE, 25 September 1999 (1999-09-25), pages 823 - 829, XP003009020 *
KATAOKA H. ET AL.: "Tanpaku Eido Hakei Joho no Data Mining System", JAPANESE JOURNAL OF CLINICAL LABORATORY AUTOMATION, THE JAPAN SOCIETY FOR CLINICAL LABORATORY AUTOMATION, 1 June 2001 (2001-06-01), pages 170 - 175, XP002985383 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107871140A (zh) * 2017-11-07 2018-04-03 哈尔滨工程大学 一种基于斜率弹性相似性度量方法
CN107871140B (zh) * 2017-11-07 2021-10-01 哈尔滨工程大学 一种基于斜率弹性相似性度量方法
CN110673515A (zh) * 2018-07-03 2020-01-10 西门子股份公司 对工业设施的监控
WO2022176310A1 (ja) * 2021-02-17 2022-08-25 富士フイルム株式会社 情報処理装置、情報処理方法、プログラム、及び薬剤評価方法

Also Published As

Publication number Publication date
JP4951752B2 (ja) 2012-06-13
US20090136139A1 (en) 2009-05-28
US7991569B2 (en) 2011-08-02
JP2007139548A (ja) 2007-06-07

Similar Documents

Publication Publication Date Title
JP4951752B2 (ja) 易動度の正規化装置、正規化方法、正規化プログラムおよび自己組織化マップ、並びに、物質の検出方法、検出プログラム、検出ルール生成方法およびデータ構造
Jones et al. Indirect methods for reference interval determination–review and recommendations
Boots et al. Exhaled molecular fingerprinting in diagnosis and monitoring: validating volatile promises
JP4919236B2 (ja) 泳動波形を用いた検査値予測装置、予測方法および予測プログラム
CN102713620B (zh) 结合内外校准法的分析物定量多重微阵列
Crapo The role of reference values in interpreting lung function tests
Doorn et al. Ion chromatography for the precise analysis of chloride and sodium in sweat for the diagnosis of cystic fibrosis
Bietenbeck et al. External quality assessment schemes for glucose measurements in Germany: factors for successful participation, analytical performance and medical impact
CN115691722A (zh) 医疗数据检测的质控方法、装置、设备、介质及程序产品
US8160818B2 (en) System and method for determining clinical equivalence of test methods
Hornung et al. A measure of the impact of CV incompleteness on prediction error estimation with application to PCA and normalization
CN111406294B (zh) 自动生成用于实验室仪器的规则
MX2010013270A (es) Interfaz de usuario para dispositivo de prueba.
Pereira et al. Evaluation of the measurement uncertainty in screening immunoassays in blood establishments: Computation of diagnostic accuracy models
Jokiniitty et al. Urine headspace analysis with field asymmetric ion mobility spectrometry for detection of chronic kidney disease
Ferraro et al. Definition of analytical quality specifications for serum total folate measurements using a simulation outcome-based model
Yeo et al. Assessing performance of i-STAT at the point of care in the emergency room
US6787361B1 (en) Clinical assay calibration adjustment method
Dillon et al. Analytical validation of a novel multiplex test for detection of advanced adenoma and colorectal cancer in symptomatic patients
CN113990485A (zh) 一种基于常规检验数据与知识图谱联合诊断疾病的方法
Ahmed et al. Performance evaluation of cardiac troponin I assay: a comparison between the point-of-care testing radiometer AQT90 FLEX and the central laboratory siemens advia centaur analyzer
JPH07103972A (ja) 生化学自動分析装置
Pennazza et al. Introduction. Breathprinting: what, why, how
KR102599838B1 (ko) 혼합 표준편차를 활용한 검사실 허용범위 설정 방법
US20230168263A1 (en) Information provision device, information provision system, information provision method, and program

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 12084370

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 06768072

Country of ref document: EP

Kind code of ref document: A1