WO2012164954A1 - 集合データの類似性評価方法、類似性評価プログラム、及び類似性評価装置 - Google Patents

集合データの類似性評価方法、類似性評価プログラム、及び類似性評価装置 Download PDF

Info

Publication number
WO2012164954A1
WO2012164954A1 PCT/JP2012/003612 JP2012003612W WO2012164954A1 WO 2012164954 A1 WO2012164954 A1 WO 2012164954A1 JP 2012003612 W JP2012003612 W JP 2012003612W WO 2012164954 A1 WO2012164954 A1 WO 2012164954A1
Authority
WO
WIPO (PCT)
Prior art keywords
similarity
coincidence
set data
evaluating
target
Prior art date
Application number
PCT/JP2012/003612
Other languages
English (en)
French (fr)
Inventor
芳和 森
桂一 野田
Original Assignee
株式会社ツムラ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ツムラ filed Critical 株式会社ツムラ
Priority to KR1020127032276A priority Critical patent/KR101436534B1/ko
Priority to CN201280001651.1A priority patent/CN102985818B/zh
Priority to EP12792480.1A priority patent/EP2717048B1/en
Priority to JP2012549180A priority patent/JP5910506B2/ja
Priority to US13/806,683 priority patent/US20130197813A1/en
Publication of WO2012164954A1 publication Critical patent/WO2012164954A1/ja
Priority to HK13108444.0A priority patent/HK1181116A1/zh
Priority to US15/269,644 priority patent/US10533979B2/en

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8686Fingerprinting, e.g. without prior knowledge of the sample components
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/15Medicinal preparations ; Physical properties thereof, e.g. dissolubility
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/74Optical detectors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8679Target compound analysis, i.e. whereby a limited number of peaks is analysed
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8693Models, e.g. prediction of retention times, method development and validation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/14Classification; Matching by matching peak patterns
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions

Definitions

  • the present invention relates to an aggregate data similarity evaluation method, a similarity evaluation program, and a similarity evaluation apparatus.
  • multi-component substance for example, there is a natural product-derived drug such as Chinese medicine, which is a drug composed of multiple components (hereinafter referred to as multi-component drug).
  • Chinese medicine which is a drug composed of multiple components (hereinafter referred to as multi-component drug).
  • the quantitative and qualitative profiles of these drugs vary due to the geological factors, ecological factors, collection time, collection location, collection age, growing season weather, etc. of the raw material crude drug used.
  • the criteria for determining the quality of a multi-component drug and the like are generally set based on the content and the like of one or several characteristic components in the multi-component drug.
  • Non-Patent Document 1 when an active ingredient cannot be identified in a multi-component drug, quantitative analysis is possible, it is easily dissolved in water, does not decompose in hot water, does not chemically react with other components, etc. A plurality of components having the above are selected, and the content of those components obtained by chemical analysis is used as a criterion for evaluation.
  • Patent Document 1 a multi-component drug is evaluated by selecting a part of peaks in HPLC chromatogram data (hereinafter referred to as “chromatography”) and bar-coding them.
  • chromatography HPLC chromatogram data
  • the evaluation target is limited to “specific component content” or “chromatographic peak of specific component”, and some of the components contained in the multi-component drug are targeted for evaluation. Not too much. For this reason, since there are many components that are not subject to evaluation for multi-component drugs, they are insufficiently accurate as an evaluation method for multi-component drugs.
  • the problem to be solved is that the existing evaluation method has a limit in efficiently evaluating the quality of multi-component substances with high accuracy.
  • the present invention collects a plurality of data (for example, liquid chromatogram (LC), gas chromatogram (GC), nuclear magnetic resonance (NMR) spectrum). And the like (data obtained by processing such as patterning), and patterning each data of each set data with a selected scale
  • the present invention is a similarity evaluation program for causing a computer to perform mutual similarity evaluation of aggregate data in which a plurality of data is aggregated, and a patterning function for patterning each data of each aggregate data on a selected scale And a computer for realizing a match number extraction function for comparing each pattern data with a brute force to obtain a match number and a match degree determination function for obtaining a match degree using a Tanimoto coefficient based on the obtained match number
  • This is a feature of the similarity evaluation program for aggregate data.
  • the present invention is an apparatus for evaluating the similarity of aggregate data in which a plurality of data is aggregated, wherein a patterning unit that patterns each data of each aggregate data on a selected scale, and each of the patterned data
  • the similarity evaluation device of the collective data is provided with a match number extraction unit that calculates the number of matches by brute force and a match degree determination unit that calculates a match degree using the Tanimoto coefficient based on the obtained match number Features.
  • the method for evaluating similarity of set data according to the present invention has the above-described configuration, it is possible to easily and quickly evaluate the similarity of set data obtained by collecting a plurality of data.
  • a target FP of a multi-component substance to be evaluated with a reference FP of a plurality of evaluation standards a plurality of FPs of multi-component substances suitable for peak assignment of the target FP are pre-processed.
  • selecting from the standard FP it is possible to make a simple and quick selection.
  • the set data similarity evaluation program of the present invention has the above-described configuration, it is possible to make a computer realize the function, evaluate the FP similarity, and easily and quickly select the reference FP and the like.
  • the apparatus for evaluating similarity of set data according to the present invention has the above-described configuration, it is possible to operate each unit and to select the reference FP and the like simply and quickly.
  • Example 1 It is a block diagram of the similarity evaluation apparatus of aggregate data.
  • Example 1 It is process drawing of the similarity evaluation method of aggregate data.
  • Example 1 The FP for each drug is shown, (A) is a drug A, (B) is a drug B, and (C) is a graph showing the drug C.
  • Example 1 It is explanatory drawing which shows the retention time of object FP and reference
  • Example 1 It is explanatory drawing which shows the retention * time * appearance pattern of object FP.
  • Example 1 It is explanatory drawing which shows the retention, time, and appearance pattern of reference
  • Example 1 It is explanatory drawing which shows the coincidence number of the appearance distance of object and reference
  • Example 1 It is explanatory drawing which shows the coincidence number of all the retentions, time, and appearance distance of object FP and reference
  • Example 1 It is explanatory drawing which shows the coincidence degree of all the retention, time, and appearance patterns of object FP and reference
  • Example 1 It is explanatory drawing which shows the peak height ratio pattern of object FP.
  • Example 2 It is a data processing flowchart in FP similarity evaluation processing.
  • Example 1 10 is a flowchart of a retention / time / appearance pattern coincidence calculation process in the FP similarity evaluation process.
  • the purpose of making it possible to contribute to the improvement of the accuracy and efficiency of the evaluation is realized by the patterning unit, the coincidence number extracting unit, and the coincidence degree determining unit.
  • Embodiment 1 of the present invention applies the aggregate data similarity evaluation device as a pre-processing of a multi-component drug evaluation device for evaluating a multi-component substance, for example, a multi-component drug.
  • a multi-component drug is defined as a drug containing a plurality of active chemical ingredients, and includes, but is not limited to, herbal medicines, combinations of herbal medicines, extracts thereof, and herbal medicines.
  • the dosage form is not particularly limited.
  • liquids, extracts, capsules, granules, pills, suspensions / emulsions, powders, spirits, specified in the 15th revised Japanese Pharmacopoeia Tablets, soaking agents, decoction, tinctures, troches, fragrances, fluid extracts and the like are included.
  • Multi-component substances include those other than drugs.
  • Kampo medicines are described in the industry unification and voluntary revision of the 148 prescription “Precautions for use” of Kampo medicines for medical use, and the general Kampo prescription (1978).
  • an evaluation apparatus for multi-component drugs in order to evaluate whether or not an evaluation target drug is equivalent to a plurality of drugs determined as normal products, first, from the three-dimensional chromatogram data (hereinafter referred to as 3D chromatography) of the evaluation target drug A target FP from which information specific to the drug is extracted is created. Next, the FP of the multi-component drug suitable for the peak assignment of the target FP is selected from a plurality of reference FPs. Each peak of the target FP is assigned to the selected peak of the reference FP.
  • each peak of the target FP assigned as described above is assigned to the peak correspondence data (hereinafter referred to as reference group FP) of all the reference FPs created by performing peak assignment processing from all the reference FPs.
  • the equivalence between the peak of the reference group FP and the peak of the target FP assigned (hereinafter referred to as the target FP attributed peak) is evaluated by the MT method.
  • the obtained evaluation value (hereinafter referred to as MD value) is compared with a predetermined determination value (upper limit value of MD value) to determine whether the evaluation target drug is equivalent to a normal product.
  • 3D chromatography is HPLC chromatogram data (hereinafter referred to as “chromatography”) of Chinese medicine as a multi-component drug that is a multi-component substance to be evaluated, and includes a UV spectrum.
  • the FP is a finger composed of a maximum value or an area value (hereinafter referred to as a peak) of a signal intensity (height) at a peak detected at a specific wavelength, and an appearance time (hereinafter referred to as a retention time) of the peak.
  • Print data a maximum value or an area value (hereinafter referred to as a peak) of a signal intensity (height) at a peak detected at a specific wavelength, and an appearance time (hereinafter referred to as a retention time) of the peak.
  • the target FP is obtained by extracting a plurality of peaks at a specific detection wavelength, their retention times, and a UV spectrum from 3D chromatogram, which is three-dimensional chromatogram data of Chinese medicine to be evaluated. Therefore, the target FP is aggregate data in which peaks are aggregated as a plurality of data.
  • the reference FP is a FP of Chinese medicine as a multi-component drug that is a multi-component substance defined as a normal product. Like the target FP, a 3D chromatogram data 3D chromatogram is used to generate a plurality of peaks at a specific detection wavelength. The retention time and UV spectrum are extracted. Therefore, the reference FP is also aggregate data in which peaks are aggregated as a plurality of data.
  • FIG. 1 is a block diagram of an FP similarity evaluation apparatus
  • FIG. 2 is a process diagram of an FP similarity evaluation method.
  • the FP similarity evaluation method performed by the FP similarity evaluation device 1 functions to check the degree of coincidence between the target FP and the reference FP.
  • the FP similarity evaluation apparatus 1 is configured by a computer, and includes a CPU, a ROM, a RAM, and the like (not shown).
  • the FP similarity evaluation apparatus 1 can realize a similarity evaluation program of set data installed in a computer and perform similarity evaluation of a target FP.
  • the similarity evaluation program for the set data uses the set evaluation program recording medium for the set data that records this, and causes the similarity evaluation apparatus 1 of the FP configured by a computer to read it, so that the target FP Similarity evaluation can also be realized.
  • the patterning step S1 performed by the patterning unit 3 functioning, the match number extracting step S2 performed by the match number extraction unit 5 functioning, and the coincidence degree determination unit 7 function. And a coincidence determination step S3.
  • the FP of the multi-component drug suitable for the peak assignment of the target FP is selected from the reference FP as a plurality of set data.
  • the patterning step S1 patterns each peak that is each data of the target FP and the reference FP that are each set data with a selected scale.
  • This scale is the distance between retention times as the peak appearance distance in this embodiment. Specifically, it will be described later.
  • the coincidence number extraction step S ⁇ b> 2 compares the patterned peaks with brute force to obtain the coincidence number between the patterns.
  • This number of matches is the number of matches of the appearance distance in this embodiment. Specifically, it will be described later.
  • the coincidence degree determination step S3 obtains the coincidence degree between the patterns using the Tanimoto coefficient based on the obtained coincidence number.
  • the Tanimoto coefficient is “Number of appearance distance matches / (number of target FP peaks + reference FP peaks ⁇ number of appearance distance matches)” And the degree of coincidence is obtained when (1-Tanimoto coefficient) is close to zero.
  • This (1-Tanimoto coefficient) is weighted by (number of target FP peaks ⁇ number of appearance distance matches + 1), “(1 ⁇ Tanimoto coefficient) ⁇ (number of target FP peaks ⁇ number of appearance distance matches + 1)” It is also good.
  • the FP of the drug A is the target FP and the FP of the drugs B and C is the reference FP
  • a plurality of peaks before assigning each peak of the target FP to the reference group FP created from the drugs B and C The reference FP of any one of the medicines B and C suitable for the assignment of the target FP is selected from the reference FP, and each peak of the target FP is assigned to the peak of the selected reference FP.
  • the degree of coincidence of the peak retention, time, and appearance pattern is calculated between the target FP and the reference FP as shown in FIGS.
  • the reference FP that has the smallest degree of coincidence is selected from all the reference FPs.
  • FIG. 4 to 9 are diagrams for explaining the number of coincidence of retention / time / appearance distance and the degree of coincidence of retention / time / appearance pattern between the target FP and the reference FP.
  • 4 is an explanatory diagram showing the retention time of the target FP and the reference FP
  • FIG. 5 is an explanatory diagram showing the retention time, appearance pattern of the target FP
  • FIG. 6 is a diagram showing the retention time, appearance pattern of the reference FP. It is explanatory drawing shown.
  • FIG. 7 is an explanatory diagram showing the number of matches between the appearance distances of the target and the reference FP
  • FIG. 8 is an explanatory diagram showing the number of matches between the total retention time, the appearance distance of the target FP and the reference FP
  • FIG. 4 shows the retention times of the target FP 15 and the reference FP 17.
  • 5 and 6 show the retention times and appearance patterns in which all the retention time distances are calculated from the retention times of the target FP 15 and the reference FP 17 and the distances are tabulated.
  • the retention, time, and appearance distance calculated by comparing the values of each cell of the retention, time, and appearance pattern of the target FP and the reference FP in each row and counting the number that the difference between the two values is within a certain range. Indicates the number of matches.
  • the degree of coincidence of retention / time / appearance pattern is calculated based on the number of coincidence, and the degree of coincidence of retention / time / occurrence pattern is shown in a table format.
  • each peak of the target FP15 is assigned with a reference FP that is as similar as possible to the target FP15. Selecting a reference FP similar to the target FP 15 from a plurality of reference FPs is an important point in making attribution with high accuracy.
  • the similarity of the FP pattern is evaluated based on the degree of coincidence of the retention time, the appearance pattern.
  • the retention times of the target FP 15 and the reference FP 17 are as shown in FIG. 4, the retention time / appearance patterns of the target FP 15 and the reference FP 17 are as shown in FIGS.
  • the values of each cell are created as tabular patterns in which the distance between retention times is formed for the upper target FP 15 and the reference FP 17.
  • the retention times of the peaks (19, 21, 23, 25, 27, 29, 31, 33, 35, 37) of the target FP 15 are (10.2), (10.5), (10 .8), (11.1), (11.6), (12.1), (12.8), (13.1), (13.6), and (14.0).
  • the retention times of the peaks (39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59) of the reference FP 17 are (10.1), (10.4), (10.7), (11.1), (11.7), (12.3), (12.7), (13.1), (13.6), (14.1), (14 4).
  • the distance between the retention times is the reference FP appearance pattern in the lower chart of FIG.
  • the numbers surrounded by circles match, and the number of matches is seven.
  • the seven coincidence numbers are written in the first line of the target and reference FP retention / time / appearance pattern in FIG. 8.
  • the number of matches is obtained for each comparison.
  • the numerical value 7 at the left end circled is the result of comparing the first row of the target and the reference FP retention / time / appearance pattern, and the numerical value 7 next to the numerical value is the target FP retention.
  • the result is a comparison between the first line of the time / appearance pattern and the second line of the reference FP retention / time / appearance pattern.
  • the range of setting values for determining the coincidence of appearance distances there is no limitation on the range of setting values for determining the coincidence of appearance distances, and it is preferably in the range of 0.05 minutes to 0.2 minutes. In Example 1, it was 0.1 minutes.
  • the degree of coincidence between the retention time is RP
  • a is the number of peaks of the target FP 15 (number of target FP peaks)
  • b is the number of peaks of the reference FP 17 (number of reference FP peaks)
  • m is the number of coincidence of retention time, appearance distance (see FIG. 8).
  • the degree of coincidence (RP) of each retention, time, and appearance pattern was calculated by the above formula (see FIG. 9).
  • RP_min which is the minimum value of these RPs, is defined as the degree of coincidence between the retention time, the appearance pattern of the target FP 15 and the reference FP 17.
  • (0.50) is the degree of coincidence of the target FP 15 with respect to the reference FP.
  • the degree of coincidence is calculated for all the reference FPs, the reference FP having the smallest degree of coincidence is selected, and the peak assignment of the target FP is performed for the reference FP.
  • FIG. 11 is a flowchart showing the steps of the entire process for evaluating the similarity between FPs.
  • the process is started by starting the system, and a patterning function, a coincidence number extracting function, and a coincidence degree determining function are realized in a computer. Then, the similarity of the retention time appearance pattern is evaluated between the plurality of reference FPs that are normal products and the target FP 17, and the reference FP suitable for the attribution of the target FP 17 is selected.
  • FIG. 12 is a flowchart showing details of “subroutine 1” in the “FP similarity evaluation process” of FIG. In this process, the degree of coincidence of the retention, time, and appearance pattern between the FPs (for example, the target FP and the reference FP) is calculated.
  • step S201 the process of “read target FP” is executed.
  • the attribution target FP is read, and the process proceeds to step S202.
  • step S202 the process of “obtain all retention time (R1)” is executed.
  • R1 the retention time information of the target FP read in S201 is acquired, and the process proceeds to step S203.
  • step S203 a process of “listing file names of all reference FPs” is executed.
  • the file names of all the reference FPs are listed in advance, and the process proceeds to step S204.
  • step S204 1 is substituted for n (n ⁇ 1) as the initial value of the counter for sequentially processing all the reference FPs, and the process proceeds to step S205.
  • step S205 a process of “reading the list n-th reference FP (reference FP n )” is executed.
  • the n-th FP of the file name list of all reference FPs listed in S203 is read, and the process proceeds to step S206.
  • step S206 the process of “obtain all retention time (R2)” is executed.
  • R2 the retention time information of the reference FP read in S205 is acquired, and the process proceeds to step S207.
  • step S207 the process of “calculate the degree of coincidence of retention, time, and appearance pattern of R1 and R2 (RP n — min)” is executed.
  • RP n — min is calculated from the retention time of the target FP acquired in S202 and the retention time of the reference FP acquired in S206, and the process proceeds to step S208.
  • the detailed calculation flow of RP n — min will be separately described with reference to subroutine 1 in FIG.
  • step S208 the processing of "Saving RP n _min (RP all _min" is performed.
  • the RP n _min calculated in S207 and stored in the RP all _min the process proceeds to step S209.
  • step S209 the process of “update n (n ⁇ n + 1)” is executed.
  • n + 1 is substituted for n as an update of n, and the process proceeds to step S210.
  • step S210 a determination process of “End all reference FP processes?” Is executed. In this process, it is determined whether or not all the reference FPs have been processed. If the process has been completed (YES), the process proceeds to step S211. If there is an unprocessed reference FP (NO), the process proceeds to S205 to execute the processes of S205 to S210 for the unprocessed FP. The processes of S205 to S210 are repeated until the process of all the reference FPs is completed.
  • step S211 the processing of "selection criteria FP matching degree from RP all _min is minimized" is executed.
  • RP 1 —min to RP n —min calculated for all the reference FPs are compared, and a reference FP that minimizes the degree of coincidence of retention, time, and appearance pattern with the target FP is selected.
  • step S1001 the process of “x ⁇ R1, y ⁇ R2” is executed.
  • R1 and R2 acquired in S202 and S206 of FIG. 80 are substituted for x and y, respectively, and the process proceeds to step S1002.
  • step S1002 the process of “obtaining the number of data of x and y (a, b)” is executed.
  • the numbers of data of x and y are acquired as a and b, respectively, and the process proceeds to step S1003.
  • step S1003 1 is substituted for i (i ⁇ 1) as the initial value of the counter for sequentially calling the retention times of x (i ⁇ 1), and the process proceeds to step S1004.
  • step S1004 the process of “obtain all distance from xi-th retention time (f)” is executed. In this process, the distance between the xith retention time and all subsequent retention times is acquired as f, and the process proceeds to step S1005.
  • step S1005 1 is substituted for j (j ⁇ 1) as the initial value of the counter for sequentially calling the retention times of y, and the process proceeds to step S1006.
  • step S1006 the process of “obtain all distance from yj-th retention time (g)” is executed.
  • the distance between the yj-th retention time and all subsequent retention times is acquired as g, and the process proceeds to step S1007.
  • step S1007 the processing of “"
  • the retention time distances f and g acquired in S1004 and S1006 are compared in a round-robin manner, and the condition of “
  • step S1008 the processing of “calculate the degree of coincidence of retention and time / appearance pattern of f and g (RP fg )” is executed.
  • RP fg is obtained from a and b acquired in S1002 and m acquired in S1007.
  • RP fg (1 ⁇ (m / (a + b ⁇ m))) ⁇ (a ⁇ m + 1)
  • step S1009 the processing of “calculate the degree of coincidence of retention and time / appearance pattern of f and g (RP fg )” is executed.
  • RP fg is obtained from a and b acquired in S1002 and m acquired in S1007.
  • RP fg (1 ⁇ (m / (a + b ⁇ m))) ⁇ (a ⁇ m + 1)
  • step S1009 the processing of “calculate the degree of coincidence of retention and time / appearance pattern of f and g (RP fg )” is executed.
  • RP fg is obtained from a and b
  • step S1009 the process of “save RP fg (RP_all)” is executed.
  • the degree of coincidence calculated in S1008 is stored in RP_all, and the process proceeds to step S1010.
  • step S1010 the process of “update j (j ⁇ j + 1)” is executed.
  • j + 1 is substituted for j as an update of j, and the process proceeds to step S1011.
  • step S1011 a determination process of “Processing complete with all retention times of y?” Is executed. In this process, it is determined whether or not all the retention times for y have been processed. If it has been completed (YES), it is determined that the processing of all retention times of y has been completed, and the process proceeds to step S1012. If not completed (NO), it is determined that an unprocessed retention time remains in y, and the process proceeds to step S1006. That is, the processing from S1006 to S1011 is repeated until all the retention times of y are processed.
  • step S1012 the process of “update i (i ⁇ i + 1)” is executed.
  • i + 1 is substituted for i as an update of i, and the process proceeds to step S1013.
  • step S1013 a determination process of “Processing completed with all retention times of x?” Is executed. In this process, it is determined whether or not all the retention times for x have been processed. If it has been completed (YES), it is determined that all the retention times for x have been processed, and the process proceeds to step S1014. If not completed (NO), it is determined that an unprocessed retention time remains in x, and the process proceeds to step S1004. That is, the processing from S1004 to S1013 is repeated until all the retention times of x are processed.
  • step S1014 the process of “obtain minimum value from RP_all (RP_min)” is executed.
  • the minimum value in RP_all in which the RPs for all combinations of the retention FP, the reference FP, and the retention pattern are stored is acquired as RP_min, and the RP_min is passed to S207 in FIG. -The time / appearance pattern matching degree calculation process ends.
  • Example 1 of the present invention is a FP similarity evaluation that evaluates the similarity between the target FP15 in which a plurality of peaks (19, 21,%), (39, 41,%) Are aggregated and the reference FP17.
  • a patterning step of patterning the peaks (19, 21,%), (39, 41,%) Of the target FP 15 and the reference FP 17 as shown in FIGS. S1 is compared with each pattern that has been patterned, and the match number extraction step S2 for obtaining the number of matches as shown in FIG. 8 and the degree of match as shown in FIG. 9 using the Tanimoto coefficient based on the found number of matches.
  • the similarity between the target FP 15 and the reference FP 17 can be easily and quickly evaluated, and each peak of the target FP 15 can be attributed to the reference FP having an FP pattern that is as similar as possible to the target FP 15.
  • attribution with higher accuracy can be performed.
  • the Tanimoto coefficient is The number of coincidence of appearance distance / (number of target FP peaks + number of reference FP peaks ⁇ number of coincidence of appearance distance) is obtained, and the degree of coincidence is calculated when (1 ⁇ Tanimoto coefficient) is close to zero, (1 ⁇ Tanimoto coefficient) And weighting (number of target FP peaks ⁇ number of appearance distance matches + 1), “(1 ⁇ Tanimoto coefficient) ⁇ (number of target FP peaks ⁇ number of appearance distance matches + 1)” The degree of coincidence is obtained.
  • the group data similarity evaluation program evaluates the similarity of FPs by implementing a patterning function, a matching number extraction function, and a matching degree determination function, and easily and quickly selects a reference FP. Can contribute.
  • the patterning unit 3, the coincidence number extracting unit 5, and the coincidence degree determining unit 7 can realize an FP similarity evaluation method.
  • FIG. 10 is an explanatory diagram showing a peak height ratio pattern of the target FP.
  • the value of each cell is formed into a tabular pattern pattern.
  • each peak height of each peak (19, 21, 23, 25, 27, 29, 31, 33, 35, 37) of the target FP 15 is (5, 9, 2, 30, 2, 21, 32, 4, 4, 11).
  • the patterning step S1 patterns the scale as the peak height ratio.
  • the coincidence number extraction step S2 uses the coincidence number as the coincidence number of the height ratio, compares each peak patterned with the height ratio of the peaks, and calculates the number of coincidence of the height ratios within the set range. To do. By this calculation, the number of matches can be obtained as in FIG.
  • the Tanimoto coefficient is set to “the number of coincidence of height ratio / (number of target FP peaks + number of reference FP peaks ⁇ number of coincidence of height ratio)”, and (1 ⁇ Tanimoto coefficient) is close to zero. Thus, the degree of coincidence can be obtained.
  • (1-Tanimoto coefficient) is weighted by (number of target FP peaks ⁇ number of matching height ratio + 1), and “(1-Tanimoto coefficient) ⁇ (number of target FP peaks ⁇ number of matching height ratio + 1)”. ) ", And the reference FP in which the peaks (19, 21,%) Of the target FP 15 are more matched by weighting can be selected.
  • the examples of the present invention are applied to the evaluation of Chinese medicine as a multi-component drug, but can also be applied to the evaluation of other multi-component substances.
  • the chromatograph is not limited to the 3D chromatograph, and a FP that includes a peak excluding the UV spectrum and its retention time can also be used.
  • the method for evaluating similarity of aggregate data is a similarity evaluation method for examining the degree of coincidence between aggregate data in which a plurality of data are aggregated, and patterning each data of each aggregate data with a selected scale.
  • a patterning step, a match number extraction step for determining the number of matches by comparing each of the patterned data with a brute force, and a match level determination step for determining a match level using a Tanimoto coefficient based on the determined number of matches In addition, it can be widely applied to the evaluation of the similarity between set data.
  • the collective data is not limited to the FP but can be applied to other signal data.
  • the FP which is the aggregate data of the above example, is created based on the peak height and the similarity is evaluated by the above method. However, when the FP is created by the peak area value, it can be evaluated by the same method. .
  • the FP when the FP is created with the peak area, the FP is created by expressing the area value with the height, and therefore, the FP has the same expression as that when creating with the peak height in the above-described embodiment. For this reason, when the FP is created with the peak area, the similarity can be evaluated by the processing of Example 1 or Example 2 as in the case where the FP is created with the peak height of the signal intensity.
  • the patterning unit, the patterning process, and the patterning function are the scale selected for each data of each set data, the peak appearance distance of Example 1, and the peak height ratio of Example 2.
  • it can be made to carry out similarly to Example 2 using the area ratio of a peak area.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

 評価の精度及び効率を向上させることに寄与可能とする。 複数のデータが集合した集合データ相互の類似性を評価する集合データの類似性評価装置1であって、各集合データの各データを選択された尺度でパターン化するパターン化部3と、パターン化した各データを総当たりで比較し一致数を求める一致数抽出部5と、求めた一致数を基にTanimoto係数を用いて一致度を求める一致度判定部7とを備え、集合データの類似性を簡易且つ迅速に評価することを特徴とする。

Description

集合データの類似性評価方法、類似性評価プログラム、及び類似性評価装置
 本発明は、集合データの類似性評価方法、類似性評価プログラム、及び類似性評価装置に関する。
 多成分物質として、例えば多成分で構成される薬剤(以下、多成分薬剤)である漢方薬などの天然物由来の薬剤がある。これら薬剤の定量的、定性的プロフィールは、使用する原料生薬の、地質学的要因、生態学的要因、収集時期、収集場所、収集年代、生育期の天候等が原因で変化する。
 そのため、これら多成分薬剤などについては、その安全性および有効性を担保するための品質として一定の基準を規定し、その基準に基づいて、国家の監督機関、化学的組織、製造業者等が品質評価を行っている。
 しかしながら、多成分薬剤の品質等の判定基準は、多成分薬剤中のある特徴的な1ないしは数成分を選択して、その含有量などに基づいて設定することが一般的であった。
 例えば、非特許文献1では、多成分薬剤において有効成分の同定ができていない場合、定量分析が可能、水に溶けやすい、熱水中で分解しない、他の成分と化学反応をしない等の物性を持った複数の成分を選択し、化学分析により得られるそれら成分の含有量を評価の基準としている。
 また、多成分薬剤にクロマトグラフィーを適用し、保持時間ごとに紫外可視吸収スペクトルを得て、その中の一部の成分情報から評価の基準を設定することも知られている。
 例えば、特許文献1では、HPLCクロマトグラム・データ(以下、クロマト)中の一部のピークを選択し、バーコード化することによって多成分薬剤を評価している。
 しかしながら、これらの方法は、評価の対象が「特定成分の含有量」又は「特定成分のクロマト・ピーク」に限定されており、多成分薬剤が含有する成分の一部を評価対象にしているに過ぎない。このため、多成分薬剤については、評価の対象外となっている成分が多数存在することから、多成分薬剤の評価方法として精度的に不十分である。
 多成分薬剤の品質を正確に評価するには、全ピーク情報或いは数%の細かい情報を除外した全ピーク情報に近いピーク情報を網羅した波形パターンの評価が必要であり、そのため、多成分薬剤間で全ピーク或いはこれに近い個数のピークを対応させる必要がある。
 ところが、複数のピークを高精度で効率的に対応させることが困難であり、このことが多成分薬剤の高精度で効率的な評価の妨げとなっていた。
 さらに説明すると、同じ製品名の多成分薬剤であっても生薬は天然物であるがために構成成分が僅かに異なる場合がある。このため、同じ品質の薬剤であっても構成成分の含量比率が異なったり、ある薬剤に存在する成分が他の薬剤には存在しないこと(以下、薬剤間誤差)がある。さらに、クロマトにおけるピーク強度やピークの溶出時間には厳密な再現性がない(以下、分析誤差)などの要因もある。これらにより、多成分薬剤間の全ピーク或いはこれに近い個数のピークについて同じ成分に由来するピークに対応させること(以下、ピーク帰属)ができないことが原因となって高精度で効率的な評価の妨げとなっていた。
特開2002-214215号公報
月刊薬事 vol.28, No.3, 67-71 (1986)
 解決しようとする問題点は、既存の評価方法では多成分物質の品質等を高精度で効率的に評価することに限界があった点である。
 本発明は、評価の精度及び効率を向上させることに寄与するために、複数のデータが集合した集合データ(例えば、液体クロマトグラム(LC)、ガスクロマトグラム(GC)、核磁気共鳴(NMR)スペクトル等の測定データ(チャート)、またはそれらをパターン化等の加工処理して得られるデータ)の相互の類似性評価方法であって、前記各集合データの各データを選択された尺度でパターン化するパターン化工程と、前記パターン化した各データを総当たりで比較し一致数を求める一致数抽出工程と、求めた一致数を基にTanimoto係数を用いて一致度を求める一致度判定工程とを備えたことを集合データの類似性評価方法の特徴とする。
 本発明は、複数のデータが集合した集合データの相互の類似性評価をコンピュータに実現させる類似性評価プログラムであって、前記各集合データの各データを選択された尺度でパターン化するパターン化機能と、前記パターン化した各データを総当たりで比較し一致数を求める一致数抽出機能と、求めた一致数を基にTanimoto係数を用いて一致度を求める一致度判定機能とをコンピュータに実現させることを集合データの類似性評価プログラムの特徴とする。
 本発明は、複数のデータが集合した集合データの相互の類似性評価装置であって、前記各集合データの各データを選択された尺度でパターン化するパターン化部と、前記パターン化した各データを総当たりで比較し一致数を求める一致数抽出部と、求めた一致数を基にTanimoto係数を用いて一致度を求める一致度判定部とを備えたことを集合データの類似性評価装置の特徴とする。
 本発明の集合データの類似性評価方法は、上記構成であるから、複数のデータが集合した集合データの類似性を簡易且つ迅速に評価することができる。
 したがって、例えば評価対象の多成分物質の対象FPを、評価基準の複数の薬剤の基準FPと比較して評価するとき、その前処理として対象FPのピーク帰属に適した多成分物質のFPを複数の基準FPから選定するに際し、簡易且つ迅速な選定を行わせることができる。
 本発明の集合データの類似性評価プログラムは、上記構成であるから、機能をコンピュータに実現させ、FPの類似性を評価し、前記基準FP等の選定を簡易かつ迅速に行わせることができる。
 本発明の集合データの類似性評価装置は、上記構成であるから、各部を作用させ、前記基準FP等の選定を簡易かつ迅速に行わせることができる。
集合データの類似性評価装置のブロック図である。(実施例1) 集合データの類似性評価方法の工程図である。(実施例1) 薬剤ごとのFPを示し、(A)は薬剤A、(B)は薬剤B、(C)は薬剤Cを示すグラフである。(実施例1) 対象FP及び基準FPのリテンション・タイムを示す説明図である。(実施例1) 対象FPのリテンション・タイム・出現パターンを示す説明図である。(実施例1) 基準FPのリテンション・タイム・出現パターンを示す説明図である。(実施例1) 対象及び基準FPの出現距離の一致数を示す説明図である。(実施例1) 対象FPと基準FPの全リテンション・タイム・出現距離の一致数を示す説明図である。(実施例1) 対象FPと基準FPの全リテンション・タイム・出現パターンの一致度を示す説明図である。(実施例1) 対象FPのピーク高さ比パターンを示す説明図である。(実施例2) FP類似性評価処理におけるデータ処理フローチャートである。(実施例1) FP類似性評価処理におけるリテンション・タイム・出現パターンの一致度計算処理のフローチャートである。(実施例1)
 評価の精度及び効率の向上に寄与可能にするという目的を、パターン化部と、一致数抽出部と、一致度判定部とにより実現した。
 本発明の実施例1は、集合データの類似性評価装置を、多成分物質、例えば多成分薬剤を評価する多成分薬剤の評価装置の前処理として適用するものである。
 多成分薬剤は、複数の有効化学成分を含有する薬剤と定義され、限定はされないが、生薬、生薬の組合せ、それらの抽出物、漢方薬等が含まれる。また剤形も特に限定されず、例えば、第15改正日本薬局方の製剤総則で規定されている液剤、エキス剤、カプセル剤、顆粒剤、丸剤、懸濁剤・乳剤、散剤、酒精剤、錠剤、浸剤・煎剤、チンキ剤、トローチ剤、芳香水剤、流エキス剤等が含まれる。多成分物質としては、薬剤以外のものも含まれる。
 漢方薬の具体例は、医療用漢方製剤148処方「使用上の注意」の業界統一と自主改訂、一般用漢方処方の手引き(1978年)に記載されている。
 多成分薬剤の評価装置では、評価対象薬剤が正常品と定めた複数の薬剤と同等であるかどうかを評価するため、まず、評価対象薬剤の三次元クロマトグラム・データ(以下、3Dクロマト)からその薬剤特有の情報を抽出した対象FPを作成する。次に、対象FPのピーク帰属に適した多成分薬剤のFPを複数の基準FPから選定する。この選定した基準FPのピークに、対象FPの各ピークを帰属させる。
 そして、全基準FPからピーク帰属処理し作成した全基準FPのピーク対応データ(以下、基準群FP)に、前記のように帰属された対象FPの各ピークを帰属する。
 次に、基準群FPのピークと帰属した対象FPのピーク(以下、対象FP帰属ピーク)の同等性をMT法で評価する。最後に、得られた評価値(以下、MD値)と予め設定しておいた判定値(MD値の上限値)を比較し、評価対象薬剤が正常品と同等であるかどうかを判定する。 
 なお、3Dクロマトは、評価対象となる多成分物質である多成分薬剤としての漢方薬のHPLCクロマトグラム・データ(以下、クロマト)であり、UVスペクトルを含んでいる。
 FPとは、特定の波長で検出されたピークにおけるシグナル強度(高さ)の極大値又は面積値(以下、ピーク)とそのピークの出現時間(以下、リテンション・タイム)、とで構成するフィンガー・プリント・データである。
 対象FPは、評価対象である漢方薬の三次元クロマトグラム・データである3Dクロマトから、特定の検出波長における複数のピークとそのリテンション・タイムならびにUVスペクトルを抽出したものである。したがって、対象FPは、複数のデータとしてピークが集合した集合データである。
 基準FPは、正常品と定めた多成分物質である多成分薬剤としての漢方薬のFPであり、対象FP同様、三次元クロマトグラム・データである3Dクロマトから、特定の検出波長における複数のピークとそのリテンション・タイムならびにUVスペクトルを抽出したものである。したがって、基準FPも、複数のデータとしてピークが集合した集合データである。
[FPの類似性評価装置、類似性評価方法]
 図1は、FPの類似性評価装置のブロック図、図2は、FPの類似性評価方法の工程図である。
 図1、図2のように、FPの類似性評価装置1が機能して行われるFPの類似性評価方法は、対象FP及び基準FP相互の一致度を調べるものである。
 FPの類似性評価装置1は、コンピュータで構成され、図示はしないが、CPU、ROM、RAMなどを備えている。FPの類似性評価装置1は、コンピュータにインストールされた集合データの類似性評価プログラムを実現させ、対象FPの類似性評価を行わせることができる。但し、集合データの類似性評価プログラムは、これを記録した集合データの類似性評価プログラム記録媒体を用い、コンピュータで構成されたFPの類似性評価装置1にこれを読み取らせることで、対象FPの類似性評価を実現させることもできる。
 FPの類似性評価方法は、パターン化部3が機能して行われるパターン化工程S1と、一致数抽出部5が機能して行われる一致数抽出工程S2と、一致度判定部7が機能して行われる一致度判定工程S3とを備えている。
 このFPの類似性評価方法で、前記最終的な評価の前処理として、対象FPのピーク帰属に適した多成分薬剤のFPを複数の集合データとしての基準FPから選定することになる。
 パターン化部3の機能により、パターン化工程S1は、各集合データである対象FP及び基準FPの各データである各ピークを選択された尺度でパターン化する。この尺度は、本実施例においてピークの出現距離としてのリテンション・タイム間距離である。具体的には、後述する。
 一致数抽出部5の機能により、一致数抽出工程S2は、パターン化した各ピークを総当たりで比較し各パターン間での一致数を求める。この一致数は、本実施例において出現距離の一致数である。具体的には、後述する。
 一致度判定部7の機能により、一致度判定工程S3は、求めた一致数を基にTanimoto係数を用いて各パターン間での一致度を求める。 
 一致度判定工程S3では、前記Tanimoto係数を、
「出現距離の一致数/(対象FPピーク数+基準FPピーク数-出現距離の一致数)」
 とし、(1-Tanimoto係数)が零に近いことで前記一致度を求める。
 この(1-Tanimoto係数)に、(対象FPピーク数-出現距離の一致数+1)の重み付けをし、
 「(1-Tanimoto係数)×(対象FPピーク数-出現距離の一致数+1)」
 としても良い。
 この重み付けで、対象FPのピークがより多く一致している基準FPを選ぶことができる。
[FPの類似性評価装置、類似性評価方法の動作原理]
 図3(A)は、薬剤A、(B)は、薬剤B、(C)は、薬剤CのFPである。
 例えば薬剤AのFPが対象FPであるとし、薬剤B、CのFPが基準FPであるとすると、薬剤B、Cから作成した基準群FPに、対象FPの各ピークを帰属する前に、複数の基準FPから対象FPの帰属に適した薬剤B、C何れかの基準FPを選定し、この選定した基準FPのピークに、対象FPの各ピークを帰属させることになる。
 すなわち、対象FPの各ピークのピーク帰属を高い精度で行うため、図4~図9のように対象FPと基準FPとの間でピークのリテンション・タイム・出現パターンの一致度を算出し、この一致度が最小となる基準FPを全基準FPから選定する。 
 図4~図9は、対象FPと基準FPとのリテンション・タイム・出現距離の一致数ならびにリテンション・タイム・出現パターンの一致度について説明した図である。図4は、対象FP及び基準FPのリテンション・タイムを示す説明図、図5は、対象FPのリテンション・タイム・出現パターンを示す説明図、図6は、基準FPのリテンション・タイム・出現パターンを示す説明図である。図7は、対象及び基準FPの出現距離の一致数を示す説明図、図8は、対象FPと基準FPの全リテンション・タイム・出現距離の一致数を示す説明図、図9は、対象FPと基準FPの全リテンション・タイム・出現パターンの一致度を示す説明図である。
 図4では、対象FP15及び基準FP17それぞれのリテンション・タイムを示す。図5、図6では、対象FP15及び基準FP17それぞれのリテンション・タイムから全てのリテンション・タイム間距離を算出し、それら距離を表形式にまとめたリテンション・タイム・出現パターンを示す。図7では、対象FP、基準FPのリテンション・タイム・出現パターンの各セルの値をそれぞれの行で比較し2つの値の差が一定以内となる数をカウントし算出したリテンション・タイム・出現距離の一致数を示す。図8では、このリテンション・タイム・出現距離の一致数を対象FPと基準FP間の全ての組み合わせで算出し、それら一致数を表形式にまとめたリテンション・タイム・出現距離の一致数を示す。図9では、この一致数をもとにリテンション・タイム・出現パターンの一致度を算出し、それら一致度を表形式にまとめたリテンション・タイム・出現パターンの一致度を示す。
 対象FP15のピーク帰属処理において、対象FP15とできるだけFPパターンが類似した基準FPで対象FP15の各ピークを帰属する。この対象FP15に類似した基準FPを複数の基準FPから選定することが精度の高い帰属を行う上で重要なポイントである。
 そこで、対象FP15のFPパターンとの類似性を客観的かつ簡易的に評価する方法として、リテンション・タイム・出現パターンの一致度によりFPパターンの類似性を評価する。
 例えば、対象FP15及び基準FP17のリテンション・タイムが図4のような場合、対象FP15及び基準FP17それぞれのリテンション・タイム・出現パターンは、図5、図6のようになる。図5、図6では、上段の対象FP15及び基準FP17に対し、下段の図表のように、各セルの値がリテンション・タイム間距離で構成された表形式のパターンとして作成している。
 図5において、対象FP15の各ピーク(19、21、23、25、27、29、31、33、35、37)のリテンション・タイムは、(10.2)、(10.5)、(10.8)、(11.1)、(11.6)、(12.1)、(12.8)、(13.1)、(13.6)、(14.0)となっている。
 したがって、ピーク19及びピーク21間のリテンション・タイム間距離は、(10.5)-(10.2)=(0.3)となる。同様に、ピーク19及びピーク23間は、(0.6)、ピーク21及びピーク23間は、(0.3)などとなる。以下、同様であり、図5の下段図表の対象FP出現パターンとなる。
 図6において、基準FP17の各ピーク(39、41、43、45、47、49、51、53、55、57、59)のリテンション・タイムは、(10.1)、(10.4)、(10.7)、(11.1)、(11.7)、(12.3)、(12.7)、(13.1)、(13.6)、(14.1)、(14.4)となっている。
 したがって、同様にリテンション・タイム間距離は、図6の下段図表の基準FP出現パターンとなる。
 この図5、図6ようにパターン化した各ピークを総当たりで比較し一致数を求める。例えば、図5下段図表の対象FP出現パターンの各セルの値と図6下段図表の基準FP出現パターンの各セルの値とを図7のように比較し、図8のように一致数を得る。
 図7では、対象FP15と基準FP17のリテンション・タイム・出現パターンの全てのリテンション・タイム間距離によるパターンを行単位で順番に総当たりで比較し、設定した範囲内で距離が一致した数を算出した。
 例えば、図7の対象及び基準FPリテンション・タイム・出現パターンの各1行目のパターンを比較すると、丸で囲まれた数値が一致しており、一致数は7個である。この7個の一致数が、図8の対象及び基準FPリテンション・タイム・出現パターンの1行目にリテンション・タイム・出現距離の一致数が書き込まれる。図7中のその他の行についても同様であり、対象FPリテンション・タイム・出現パターンの1行~9行までと、基準FPリテンション・タイム・出現パターンの1行~10行までとを総当たりで比較し、それぞれ一致数が得られる。
 図8に結果を示した。この図8において、丸で囲まれた左端の7の数値は、対象及び基準FPリテンション・タイム・出現パターンの各1行目を比較した結果であり、その隣の7の数値は、対象FPリテンション・タイム・出現パターンの1行目と基準FPリテンション・タイム・出現パターンの2行目とを比較した結果である。
 また、出現距離の一致を判定するための設定値の範囲に限定はなく、好ましくは0.05分~0.2分の範囲である。実施例1は、0.1分とした。
 リテンション・タイム・出現パターンの一致度をRPとすると、対象FP15のf行目のリテンション・タイム・出現パターンと基準FP17のg行目のリテンション・タイム・出現パターンの一致度(RPfg)は、Tanimoto係数を用いて、
 RPfg = {1-(m/(a+b-m))}×(a-m+1)
として算出する。
 なお、式中aは対象FP15のピーク数(対象FPピーク数)、bは基準FP17のピーク数(基準FPピーク数)、mはリテンション・タイム・出現距離の一致数である(図8参照)。
 図8の一致数をもとに前記式により各リテンション・タイム・出現パターンの一致度(RP)を算出した(図9参照)。
 これらRPの最小値であるRP_minを対象FP15と基準FP17とのリテンション・タイム・出現パターンの一致度とする。図9では、(0.50)が対象FP15の基準FPに対する一致度となる。
 この一致度を全ての基準FPについて算出し、最も小さい一致度の基準FPが選定され、この基準FPに対して対象FPのピーク帰属を行わせる。
 [類似性評価プログラム]
 図11、12は、類似性評価プログラムに係るフローチャートである。
 図11は、FP間の類似性を評価するための処理全体のステップを示すフローチャートであり、システム起動によりスタートし、パターン化機能と、一致数抽出機能と、一致度判定機能とをコンピュータに実現させ、正常品とされた複数の基準FPと対象FP17間でリテンション・タイム出現パターンの類似性を評価し、対象FP17の帰属に適した基準FPを選定する。
 図12は、図11の「FP類似性評価処理」における「サブルーチン1」の詳細を示すフローチャートである。この処理では、FP間(例えば、対象FPと基準FP)のリテンション・タイム・出現パターンの一致度を計算する。
 [FP類似性評価処理]
 ステップS201では、「対象FPを読み込む」の処理が実行される。この処理では、帰属対象のFPを読み込み、ステップS202へ移行する。
 ステップS202では、「全リテンション・タイム(R1)を取得」の処理が実行される。この処理では、S201で読み込んだ対象FPのリテンション・タイム情報を全て取得し、ステップS203へ移行する。
 ステップS203では、「全基準FPのファイル名をリスト化」の処理が実行される。この処理では、後で全基準FPを順番に処理するために予め全基準FPのファイル名をリスト化し、ステップS204へ移行する。
 ステップS204では、全基準FPを順番に処理するためのカウンタの初期値としてnに1を代入(n←1)し、ステップS205へ移行する。
 ステップS205では、「リストn番目の基準FP(基準FP)を読み込む」の処理が実行される。この処理では、S203でリスト化した全基準FPのファイル名リストのn番目のFPを読み込み、ステップS206へ移行する。
 ステップS206では、「全リテンション・タイム(R2)を取得」の処理が実行される。この処理では、S205で読み込んだ基準FPのリテンション・タイム情報を全て取得し、ステップS207へ移行する。 
 ステップS207では、「R1とR2のリテンション・タイム・出現パターンの一致度を算出(RP_min)」の処理が実行される。この処理では、S202で取得した対象FPのリテンション・タイムとS206で取得した基準FPのリテンション・タイムからRP_minを算出し、ステップS208へ移行する。なお、RP_minの詳細な計算フローは、図12のサブルーチン1により別途説明する。
 ステップS208では、「RP_minの保存(RPall_min」の処理が実行される。この処理では、S207で算出したRP_minをRPall_minに保存し、ステップS209へ移行する。
 ステップS209では、「nの更新(n←n+1)」の処理が実行される。この処理では、処理を次のFPへ移行するためnの更新としてnにn+1を代入し、ステップS210へ移行する。
 ステップS210では、「全基準FP処理終了?」の判断処理が実行される。この処理では、基準FP全てが処理されたか否かが判断され、処理済み(YES)の場合は、ステップS211へ移行する。未処理の基準FPがある(NO)場合は、未処理のFPに対してS205~S210の処理を実行するため、S205へ移行する。全基準FPの処理が終了するまでS205~S210の処理を繰り返す。 
 ステップS211では、「RPall_minから一致度が最小となる基準FPを選定」の処理が実行される。この処理では、全基準FPに対して算出したRP_minからRP_minを比較し、対象FPとのリテンション・タイム・出現パターンの一致度が最小となる基準FPを選定する。
 [サブルーチン1]
 ステップS1001では、「x←R1、y←R2」の処理が実行される。この処理では、図80のS202とS206で取得したR1及びR2をそれぞれxとyに代入し、ステップS1002へ移行する。
 ステップS1002では、「x、yのデータ数を取得(a、b)」の処理が実行される。この処理では、x、yのデータ数をそれぞれa、bとして取得し、ステップS1003へ移行する。
 ステップS1003では、xのリテンション・タイムを順番に呼び出すためのカウンタの初期値としてiに1を代入(i←1)し、ステップS1004へ移行する。
 ステップS1004では、「xi番目のリテンション・タイムからの全距離を取得(f)」の処理が実行される。この処理では、xi番目のリテンション・タイムとそれ以降の全リテンション・タイム間距離をfとして取得し、ステップS1005へ移行する。
 ステップS1005では、yのリテンション・タイムを順番に呼び出すためのカウンタの初期値としてjに1を代入(j←1)し、ステップS1006へ移行する。
 ステップS1006では、「yj番目のリテンション・タイムからの全距離を取得(g)」の処理が実行される。この処理では、yj番目のリテンション・タイムとそれ以降の全リテンション・タイム間距離をgとして取得し、ステップS1007へ移行する。
 ステップS1007では「”|fの各リテンション・タイム間距離-gの各リテンション・タイム間距離|<閾値”の条件を満たしたデータ数を取得(m)」の処理が実行される。この処理では、S1004及びS1006で取得したリテンション・タイム間距離fとgを総当りで比較し、”|fの各リテンション・タイム間距離-gの各リテンション・タイム間距離|<閾値”の条件を満たしたデータ数をmとして取得し、ステップS1008へ移行する。
 ステップS1008では、「fとgのリテンション・タイム・出現パターンの一致度を算出(RPfg)」の処理が実行される。この処理では、S1002で取得したa、bとS1007で取得したmからRPfgを、
 RPfg = (1-(m/(a+b-m)))×(a-m+1)
として算出し、ステップS1009へ移行する。
 ステップS1009では、「RPfgを保存(RP_all)」の処理が実行される。この処理では、S1008で算出した一致度をRP_allに保存し、ステップS1010へ移行する。
 ステップS1010では、「jの更新(j←j+1)」の処理が実行される。この処理では、yの処理を次のリテンション・タイムへ移行するためjの更新としてjにj+1を代入し、ステップS1011へ移行する。
 ステップS1011では、「yの全リテンション・タイムで処理終了?」の判断処理が実行される。この処理では、yの全てのリテンション・タイムの処理が終了したか否かが判断される。終了している(YES)場合は、yの全リテンション・タイムの処理が終了したと判断し、ステップS1012へ移行する。終了していない(NO)場合は、y中に未処理のリテンション・タイムが残っていると判断し、ステップS1006へ移行する。つまり、S1006~S1011までの処理はyの全てのリテンション・タイムが処理されるまで繰り返す。
 ステップS1012では、「iの更新(i←i+1)」の処理が実行される。この処理では、xの処理を次のリテンション・タイムへ移行するためiの更新としてiにi+1を代入し、ステップS1013へ移行する。
 ステップS1013では、「xの全リテンション・タイムで処理終了?」の判断処理が実行される。この処理では、xの全てのリテンション・タイムの処理が終了したか否かが判断される。終了している(YES)場合は、xの全リテンション・タイムの処理が終了したと判断し、ステップS1014へ移行する。終了していない(NO)場合は、x中に未処理のリテンション・タイムが残っていると判断し、ステップS1004へ移行する。つまり、S1004~S1013までの処理はxの全てのリテンション・タイムが処理されるまで繰り返す。
 ステップS1014では、「RP_allから最小値を取得(RP_min)」の処理が実行される。この処理では、対象FPと基準FPとのリテンション・タイム・出現パターンの全組み合わせでのRPが保存されたRP_all中の最小値を、RP_minとして取得し、そのRP_minを図11のS207に渡し、リテンション・タイム・出現パターンの一致度計算処理を終了する。
 [実施例1の効果]
 本発明の実施例1は、複数のピーク(19、21、・・・)、(39、41、・・・)が集合した対象FP15と基準FP17との類似性を評価するFPの類似性評価方法であって、対象FP15及び基準FP17の各ピーク(19、21、・・・)、(39、41、・・・)を出現距離で図5、図6のようにパターン化するパターン化工程S1と、パターン化した各パターンを総当たりで比較し、図8のように一致数を求める一致数抽出工程S2と、求めた一致数を基にTanimoto係数を用いて図9のように一致度を求める一致度判定工程S3とを備えた。
 このため、対象FP15と基準FP17との類似性を簡易且つ迅速に評価することができ、対象FP15とできるだけFPパターンが類似した基準FPで対象FP15の各ピークを帰属することが可能となる。この対象FP15に類似した基準FPを複数の基準FPから選定することで、より精度の高い帰属を行うことができる。
 一致度判定工程S3は、Tanimoto係数を、
 「出現距離の一致数/(対象FPピーク数+基準FPピーク数-出現距離の一致数)」とし、(1-Tanimoto係数)が零に近いことで一致度を求め、(1-Tanimoto係数)に、(対象FPピーク数-出現距離の一致数+1)の重み付けをし、
 「(1-Tanimoto係数)×(対象FPピーク数-出現距離の一致数+1」
として一致度を求める。
 このため、重み付けにより対象FP15のピーク(19、21、・・・)がより多く一致している基準FPを選ぶことができる。
 本発明実施例1の集合データの類似性評価プログラムは、パターン化機能、一致数抽出機能、一致度判定機能の実現により、FPの類似性を評価し、基準FPの選定を簡易かつ迅速に行わせることに寄与できる。
 本発明実施例1のFPの類似性評価装置1では、パターン化部3、一致数抽出部5、一致度判定部7により、FPの類似性評価方法を実現することができる。
 図10は、対象FPのピーク高さ比パターンを示す説明図である。
 本実施例2では、図10上段の対象FP15に対し、下段の図表のように、各セルの値がピーク高さ比で構成された表形式のパターン化としている。
 図10において、対象FP15の各ピーク(19、21、23、25、27、29、31、33、35、37)の各ピーク高さは、(5、9、2、30、2、21、32、4、4、11)となっている。
 したがって、ピーク19及びピーク21間の高さ比は、(9÷5)=(1.8)となる。同様に、ピーク19及びピーク23間は、(0.4)、ピーク21及びピーク23間は、(0.2)などとなる。以下、同様であり、図10の下段図表の対象FPのピークの高さ比パターンとなる。
 基準FPについても、同様に基準FPのピークの高さ比パターンが得られる。
 したがって、本実施例2において、パターン化工程S1は、尺度をピークの高さ比としてパターン化する。
 一致数抽出工程S2は、一致数を高さ比の一致数とし、ピークの高さ比でパターン化した各ピークを総当たりで比較し、設定した範囲内で高さ比が一致した数を算出する。この算出により図8と同様に一致数を得ることができる。
 なお、ピークの高さ比でパターン化する本実施例では、図10下段図表で示す1行中に、同じような値が複数存在するケースがあり、これらを複数回カウントしないようにしなければならない。 
 一致度判定工程S2は、Tanimoto係数を、「高さ比の一致数/(対象FPピーク数+基準FPピーク数-高さ比の一致数)」とし、(1-Tanimoto係数)が零に近いことで前記一致度を求めることができる。
 また、(1-Tanimoto係数)に、(対象FPピーク数-高さ比の一致数+1)の重み付けをし、「(1-Tanimoto係数)×(対象FPピーク数-高さ比の一致数+1)」とし、重み付けにより対象FP15のピーク(19、21、・・・)がより多く一致している基準FPを選ぶことができる。
 したがって、本実施例2においても、実施例1と同様の効果を奏することができる。
 [その他]
 本発明実施例は、多成分薬剤として漢方薬の評価について適用したが、その他の多成分物質の評価にも適用することができる。クロマトは、3Dクロマトに限らず、FPとしてUVスペクトルを除いたピークとそのリテンション・タイムとで構成されたものを用いることもできる。
 本発明の集合データの類似性評価方法は、複数のデータが集合した集合データ相互の一致度を調べる類似性評価方法であって、前記各集合データの各データを選択された尺度でパターン化するパターン化工程と、前記パターン化した各データを総当たりで比較し一致数を求める一致数抽出工程と、前記求めた一致数を基にTanimoto係数を用いて一致度を求める一致度判定工程とを備えて、集合データ相互の類似性を評価することに広く適用することができる。集合データとしては、FPに限らず、その他の信号データ等にも適用することができる。
 上記実施例の集合データであるFPは、ピーク高さに基づいて作成し、上記手法により類似性を評価したが、FPをピークの面積値で作成するときも同様の手法により評価することができる。
 すなわち、本発明の集合データの類似性評価方法、類似性評価プログラム、及び類似性評価装置において用いるピークについては、上記のようにシグナル強度(高さ)の極大値を意味する場合と、シグナル強度の面積値(ピーク面積)を高さで表現したものを意味する場合の何れも含めることができる。
 この場合、FPをピーク面積で作成するときも、面積値を高さで表現してFPを作成するため、FPとしては上記実施例のピーク高さで作成する場合と同様の表現となる。このため、FPをピーク面積で作成したときも、FPをシグナル強度のピーク高さで作成した場合と同様に上記実施例1又は実施例2の処理により類似性を評価することができる。
 したがって、本発明において、パターン化部、パターン化工程、パターン化機能は、各集合データの各データを選択された尺度を、実施例1のピークの出現距離、実施例2のピークの高さ比以外に、ピーク面積の面積比を用いて実施例2と同様に行わせることができる。
1 FPの類似性評価装置(集合データの類似性評価装置)
3 パターン化部
5 一致数抽出部
7 一致度判定部
S1 パターン化工程
S2 一致数抽出工程
S3 一致度判定工程

Claims (18)

  1.  複数のデータが集合した集合データ相互の類似性を評価する集合データの類似性評価方法であって、
     前記各集合データの各データを選択された尺度でパターン化するパターン化工程と、
     前記パターン化した各データを総当たりで比較し一致数を求める一致数抽出工程と、
     前記求めた一致数を基にTanimoto係数を用いて一致度を求める一致度判定工程と、
     を備えたことを特徴とする集合データの類似性評価方法。
  2.  請求項1記載の集合データの類似性評価方法であって、
     前記集合データは、ピークとそのリテンション・タイムとからなるFPであり、
     前記パターン化工程は、前記尺度をピークの出現距離、高さ比、面積比の何れかとし、対象FPに最も近い基準FPを複数種の基準FPから前記一致度により選定する場合に、
     前記一致数抽出工程は、前記一致数を前記出現距離、高さ比、面積比の何れかの一致数とし、
     前記一致度判定工程は、前記Tanimoto係数を、
     「出現距離、高さ比、面積比の何れかの一致数/(対象FPピーク数+基準FPピーク数-出現距離、高さ比、面積比の何れかの一致数)」
     とし、(1-Tanimoto係数)が零に近いことで前記一致度を求める、
     ことを特徴とする集合データの類似性評価方法。
  3.  請求項2記載の集合データの類似性評価方法であって、
     前記(1-Tanimoto係数)に、(対象FPピーク数-出現距離、高さ比、面積比の何れかの一致数+1)の重み付けをし、
     「(1-Tanimoto係数)×(対象FPピーク数-出現距離、高さ比、面積比の何れかの一致数+1)」
    とした、
     ことを特徴とする集合データの類似性評価方法。
  4.  請求項2又は3記載の集合データの類似性評価方法であって、
     前記FPは、多成分物質のクロマトから検出された、
     ことを特徴とする集合データの類似性評価方法。
  5.  請求項4記載の集合データの類似性評価方法であって、
     前記多成分物質は、多成分薬剤である、
     ことを特徴とする集合データの類似性評価方法。
  6.  請求項5記載の集合データの類似性評価方法であって、
     前記多成分薬剤は、生薬、生薬の組合せ、それらの抽出物、漢方薬の何れかである、
     ことを特徴とする集合データの類似性評価方法。
  7.  複数のデータが集合した集合データ相互の類似性を評価する集合データの類似性評価プログラムであって、
     前記各集合データの各データを選択された尺度でパターン化するパターン化機能と、
     前記パターン化した各データを総当たりで比較し一致数を求める一致数抽出機能と、
     前記求めた一致数を基にTanimoto係数を用いて一致度を求める一致度判定機能と、
     をコンピュータに実現させることを特徴とする集合データの類似性評価プログラム。
  8.  請求項7記載の集合データの類似性評価プログラムであって、
     前記集合データは、ピークとそのリテンション・タイムとからなるFPであり、
     前記パターン化機能は、前記尺度をピークの出現距離、高さ比、面積比の何れかとし、対象FPに最も近い基準FPを複数種の基準FPから前記一致度により選定する場合に、
     前記一致数抽出機能は、前記一致数を前記出現距離、高さ比、面積比の何れかの一致数とし、
     前記一致度判定機能は、前記Tanimoto係数を、
     「出現距離、高さ比、面積比の何れかの一致数/(対象FPピーク数+基準FPピーク数-出現距離、高さ比、面積比の何れかの一致数)」
     とし、(1-Tanimoto係数)が零に近いことで前記一致度を求める、
     ことを特徴とする集合データの類似性評価プログラム。
  9.  請求項8記載の集合データの類似性評価プログラムであって、
     前記(1-Tanimoto係数)に、(対象FPピーク数-出現距離、高さ比、面積比の何れかの一致数+1)の重み付けをし、
     「(1-Tanimoto係数)×(対象FPピーク数-出現距離、高さ比、面積比の何れかの一致数+1)」
     とした、
     ことを特徴とする集合データの類似性評価プログラム。
  10.  請求項8又は9記載の集合データの類似性評価プログラムであって、
     前記FPは、多成分物質のクロマトから検出された、
     ことを特徴とする集合データの類似性評価プログラム。
  11.  請求項10記載の集合データの類似性評価プログラムであって、
     前記多成分物質は、多成分薬剤である、
     ことを特徴とする集合データの類似性評価プログラム。
  12.  請求項11記載の集合データの類似性評価プログラムであって、
     前記多成分薬剤は、生薬、生薬の組合せ、それらの抽出物、漢方薬の何れかである、
     ことを特徴とする集合データの類似性評価プログラム。
  13.  複数のデータが集合した集合データ相互の類似性を評価する類似性評価装置であって、
     前記各集合データの各データを選択された尺度でパターン化するパターン化部と、
     前記パターン化した各データを総当たりで比較し一致数を求める一致数抽出部と、
     前記求めた一致数を基にTanimoto係数により一致度を求める一致度判定部と、
     を備えたことを特徴とする集合データの類似性評価装置。
  14.  請求項13記載の集合データの類似性評価装置であって、
     前記集合データは、ピークとそのリテンション・タイムとからなるFPであり、対象FPに最も近い基準FPを複数種の基準FPから前記一致度により選定する場合に、
     前記パターン化部は、前記尺度をピークの出現距離、高さ比、面積比の何れかとし、
     前記一致数抽出部は、前記一致数を前記出現距離、高さ比、面積比の何れかの一致数とし、
     前記一致度判定部は、前記Tanimoto係数を、
     「出現距離、高さ比、面積比の何れかの一致数/(対象FPピーク数+基準FPピーク数-出現距離、高さ比、面積比の何れかの一致数)」
     とし、(1-Tanimoto係数)が零に近いことで前記一致度を求める、
     ことを特徴とする集合データの類似性評価装置。
  15.  請求項14記載の集合データの類似性評価装置であって、
     前記(1-Tanimoto係数)に、(対象FPピーク数-出現距離、高さ比、面積比の何れかの一致数+1)の重み付けをし、
     「(1-Tanimoto係数)×(対象FPピーク数-出現距離、高さ比、面積比の何れかの一致数+1)」
     とした、
     ことを特徴とする集合データの類似性評価装置。 
  16.  請求項14又は15記載の集合データの類似性評価装置であって、
     前記FPは、多成分物質のクロマトから検出された、
     ことを特徴とする集合データの類似性評価装置。
  17.  請求項16記載の集合データの類似性評価装置であって、
     前記多成分物質は、多成分薬剤である、
     ことを特徴とする集合データの類似性評価装置。
  18.  請求項17記載の集合データの類似性評価装置であって、
     前記多成分薬剤は、生薬、生薬の組合せ、それらの抽出物、漢方薬の何れかである、
     ことを特徴とする集合データの類似性評価装置。
PCT/JP2012/003612 2011-06-01 2012-05-31 集合データの類似性評価方法、類似性評価プログラム、及び類似性評価装置 WO2012164954A1 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
KR1020127032276A KR101436534B1 (ko) 2011-06-01 2012-05-31 집합데이타의 유사성 평가방법, 유사성 평가프로그램 및 유사성 평가장치
CN201280001651.1A CN102985818B (zh) 2011-06-01 2012-05-31 聚合数据的类似性评价方法以及类似性评价装置
EP12792480.1A EP2717048B1 (en) 2011-06-01 2012-05-31 Method for evaluating similarity of aggregated data, similarity evaluation program, and similarity evaluation device
JP2012549180A JP5910506B2 (ja) 2011-06-01 2012-05-31 集合データの類似性評価方法、類似性評価プログラム、及び類似性評価装置
US13/806,683 US20130197813A1 (en) 2011-06-01 2012-05-31 Similarity evaluating method, similarity evaluating program, and similarity evaluating device for collective data
HK13108444.0A HK1181116A1 (zh) 2011-06-01 2013-07-18 聚合數據的類似性評價方法以及類似性評價裝置
US15/269,644 US10533979B2 (en) 2011-06-01 2016-09-19 Method of and apparatus for formulating multicomponent drug

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011123847 2011-06-01
JP2011-123847 2011-06-01

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US13/806,683 A-371-Of-International US20130197813A1 (en) 2011-06-01 2012-05-31 Similarity evaluating method, similarity evaluating program, and similarity evaluating device for collective data
US15/269,644 Continuation-In-Part US10533979B2 (en) 2011-06-01 2016-09-19 Method of and apparatus for formulating multicomponent drug

Publications (1)

Publication Number Publication Date
WO2012164954A1 true WO2012164954A1 (ja) 2012-12-06

Family

ID=47258823

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/003612 WO2012164954A1 (ja) 2011-06-01 2012-05-31 集合データの類似性評価方法、類似性評価プログラム、及び類似性評価装置

Country Status (8)

Country Link
US (1) US20130197813A1 (ja)
EP (1) EP2717048B1 (ja)
JP (1) JP5910506B2 (ja)
KR (1) KR101436534B1 (ja)
CN (1) CN102985818B (ja)
HK (1) HK1181116A1 (ja)
TW (1) TWI521203B (ja)
WO (1) WO2012164954A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446546B (zh) * 2016-09-23 2019-02-22 西安电子科技大学 基于卷积自动编解码算法的气象数据填补方法
JP7281256B2 (ja) 2018-08-14 2023-05-25 横河電機株式会社 信号入力回路
CN109637672B (zh) * 2018-11-28 2023-11-07 北京工业大学 一种基于药物效用度的方剂相似度计算方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005351669A (ja) * 2004-06-08 2005-12-22 Mcbi:Kk マススペクトル解析装置、マススペクトル解析方法及びマススペクトル解析プログラム
JP2007315941A (ja) * 2006-05-26 2007-12-06 Univ Of Miyazaki 植物品種判定装置、植物品種判定方法及び植物品種判定用プログラム
JP2008100918A (ja) * 2006-10-17 2008-05-01 Nec Corp 類似度計算処理システム、その処理方法及びプログラム
JP2008224235A (ja) * 2007-03-08 2008-09-25 Nec Corp 創薬のマルチターゲットスクリーニング装置
WO2009060975A1 (ja) * 2007-11-08 2009-05-14 Nec Corporation 特徴点配置照合装置及び画像照合装置、その方法及びプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2658344B2 (ja) * 1989-01-26 1997-09-30 株式会社島津製作所 クロマトグラフ用データ処理装置
US6980674B2 (en) * 2000-09-01 2005-12-27 Large Scale Proteomics Corp. Reference database
JP4886933B2 (ja) * 2001-01-12 2012-02-29 カウンセル オブ サイエンティフィック アンド インダストリアル リサーチ クロマトグラフフィンガープリントならびに単一の医薬および処方物の標準化のための新規な方法
US6319679B1 (en) * 2001-01-26 2001-11-20 Board Of Regents, The University Of Texas System PAS kinase
CN100356380C (zh) * 2001-02-13 2007-12-19 科学与工业研究会 一种色谱指纹图谱和单一药物和制剂标准化的新方法
US20040034477A1 (en) * 2002-08-19 2004-02-19 Mcbrien Michael Methods for modeling chromatographic variables
EP1760464B1 (en) * 2004-06-07 2015-08-26 Tsumura & Co. Multi-component medicine evaluation method
WO2008058923A2 (en) * 2006-11-13 2008-05-22 N.V. Organon A system and method to identify the metabolites of a drug
AU2008325608B2 (en) * 2007-11-09 2013-03-14 Eisai R & D Management Co., Ltd. Combination of anti-angiogenic substance and anti-tumor platinum complex
CN101855392A (zh) * 2007-11-12 2010-10-06 电子虚拟生物科技株式会社 虚拟筛选装置及虚拟筛选方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005351669A (ja) * 2004-06-08 2005-12-22 Mcbi:Kk マススペクトル解析装置、マススペクトル解析方法及びマススペクトル解析プログラム
JP2007315941A (ja) * 2006-05-26 2007-12-06 Univ Of Miyazaki 植物品種判定装置、植物品種判定方法及び植物品種判定用プログラム
JP2008100918A (ja) * 2006-10-17 2008-05-01 Nec Corp 類似度計算処理システム、その処理方法及びプログラム
JP2008224235A (ja) * 2007-03-08 2008-09-25 Nec Corp 創薬のマルチターゲットスクリーニング装置
WO2009060975A1 (ja) * 2007-11-08 2009-05-14 Nec Corporation 特徴点配置照合装置及び画像照合装置、その方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2717048A4 *

Also Published As

Publication number Publication date
KR101436534B1 (ko) 2014-09-01
TW201314205A (zh) 2013-04-01
JP5910506B2 (ja) 2016-04-27
EP2717048A4 (en) 2014-12-10
EP2717048A1 (en) 2014-04-09
JPWO2012164954A1 (ja) 2015-02-23
CN102985818A (zh) 2013-03-20
EP2717048B1 (en) 2020-04-01
KR20130029405A (ko) 2013-03-22
TWI521203B (zh) 2016-02-11
HK1181116A1 (zh) 2013-11-01
US20130197813A1 (en) 2013-08-01
CN102985818B (zh) 2016-03-02

Similar Documents

Publication Publication Date Title
Sana et al. A dearth of short-period massive binaries in the young massive star forming region M 17-Evidence for a large orbital separation at birth?
JP5915540B2 (ja) ピーク帰属方法、帰属プログラム、及び帰属装置
JP6132073B2 (ja) 包括的2次元クロマトグラフ用データ処理装置
JP5910506B2 (ja) 集合データの類似性評価方法、類似性評価プログラム、及び類似性評価装置
JP5915539B2 (ja) パターンの評価方法、多成分物質の評価方法、評価プログラム、及び評価装置
JP5912880B2 (ja) パターン又はfpの特徴量作成方法、作成プログラム、及び作成装置
JP5954180B2 (ja) パターンの評価方法、多成分物質の評価方法、評価プログラム、及び評価装置
JP5895847B2 (ja) Fp作成方法、作成プログラム、作成装置、及びfp
Terrettaz-Zufferey et al. Assessment of data mining methods for forensic case data analysis
JP2023063679A (ja) データ処理方法、データ処理システム及びコンピュータプログラム

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201280001651.1

Country of ref document: CN

ENP Entry into the national phase

Ref document number: 2012549180

Country of ref document: JP

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 20127032276

Country of ref document: KR

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12792480

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 13806683

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2012792480

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE