WO2019003262A1 - 判別装置及び判別方法 - Google Patents

判別装置及び判別方法 Download PDF

Info

Publication number
WO2019003262A1
WO2019003262A1 PCT/JP2017/023358 JP2017023358W WO2019003262A1 WO 2019003262 A1 WO2019003262 A1 WO 2019003262A1 JP 2017023358 W JP2017023358 W JP 2017023358W WO 2019003262 A1 WO2019003262 A1 WO 2019003262A1
Authority
WO
WIPO (PCT)
Prior art keywords
waveform data
sample
principal component
unknown sample
analysis
Prior art date
Application number
PCT/JP2017/023358
Other languages
English (en)
French (fr)
Inventor
中西 健
森田 博之
Original Assignee
株式会社ニレコ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ニレコ filed Critical 株式会社ニレコ
Priority to PCT/JP2017/023358 priority Critical patent/WO2019003262A1/ja
Publication of WO2019003262A1 publication Critical patent/WO2019003262A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/66Trinkets, e.g. shirt buttons or jewellery items
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Definitions

  • the present invention is multivariate for m (m is a positive integer) waveform data formed by arranging n (n is a positive integer) sampling voltages obtained by measuring known samples in time series.
  • the present invention relates to a discrimination device and a discrimination method which perform waveform analysis by analysis to create a discrimination model, apply an unknown sump to the discrimination model, and discriminate whether or not the unknown sample is a desired one.
  • a packaging box in the form of an aluminum blister sheet (PTP packaging) sealed in a recess of a hard plastic sheet and sealed with an aluminum film
  • PTP packaging aluminum blister sheet
  • This package also includes a package insert that contains instructions for use.
  • the package insert is included because it is strongly required to use commercially available medicines based on the precautions for use.
  • the attached document 12 causes the aluminum blister sheet 11 to be inclined, so that the output voltage becomes larger than the threshold, or the attached document 12 deviates due to flapping during conveyance.
  • the output voltage becomes higher than the threshold value, and it may be misclassified as a defective product (hereinafter referred to as “NG”) even though the attached document 12 is enclosed, and the medicine 10 may be discarded wastefully .
  • NG defective product
  • the output voltage becomes smaller than the threshold voltage, and it is erroneously judged as a non-defective product (hereinafter referred to as "OK") despite being originally NG. is there.
  • An object of the present invention is to provide a discrimination apparatus and discrimination method capable of performing OK / NG discrimination of an unknown sample with high accuracy.
  • the discriminator of the invention takes in waveform data of m (m is a positive integer) known samples of the same kind whose characteristics are known, and performs multivariate analysis of the waveform data.
  • Discriminant model based on coefficient vectors for n (n is a positive integer) variables, a waveform data analysis unit for obtaining feature amounts of the known samples, and the feature amounts of the known samples obtained by the waveform data analysis unit Calculating a feature amount of the unknown sample using the discriminant model creating unit for creating the waveform data of the unknown sample of the same type as the known sample and of unknown characteristics and using the coefficient vector obtained by the waveform data analysis unit A feature amount calculation unit; and a sump having the desired feature of the unknown sample by comparing the feature amounts of the unknown sample obtained by the feature amount calculation unit with the discrimination model A determination unit for determining whether, characterized in that it comprises a.
  • the invention according to claim 2 is the discrimination apparatus according to claim 1, wherein the known samples include OK known samples whose contents are OK and NG known samples whose contents are NG, and the discrimination model is: It is prepared to be divided into an OK group including the feature amount of the OK known sample and an NG group including the feature amount of the NG known sample, and the determining unit determines that the feature amount of the unknown sample is the OK group and the OK group. It is characterized in that it is determined in which of the NG group it is included.
  • the invention according to claim 3 is the discriminator according to claim 1 or 2, wherein the waveform data is data formed of n sampling voltages sampled in time series at a common time interval and a common number of times.
  • the coefficient vector and the feature amount can be obtained for multivariate data in which the sampling voltage is the variable and the waveform data is an individual.
  • the invention according to claim 4 relates to the discrimination device according to claim 1, 2 or 3, wherein the waveform data analysis unit performs the multivariate analysis by principal component analysis, and in the principal component analysis, the waveform of the known sample
  • the principal component loading as the coefficient vector is determined from the data
  • the principal component score as the feature amount is determined from the principal component loading and the waveform data of the known sample
  • the discriminant model creation unit is acquired by the waveform data analysis unit.
  • the discriminant model is created based on the principal component score of the known sample
  • the feature amount computing unit determines the unknown sample from the principal component loading obtained by the waveform data analysis unit and the waveform data of the unknown sample. It is characterized in that a principal component score is obtained.
  • the invention according to claim 5 is the discrimination apparatus according to claim 2 or 3, wherein the waveform data analysis unit performs the multivariate analysis by principal component regression analysis, and in the principal component regression analysis, as the feature amount
  • the principal component loading and main data determined from the waveform data of the OK known sample and the waveform data of the NG known sample are given different pseudo variables as the feature amount to the waveform data of the OK known sample and the waveform data of the NG known sample
  • a regression vector is obtained as a coefficient vector from the component score and the pseudo variable
  • the discriminant model generation unit generates a discrimination model based on the pseudo variable obtained by the waveform data analysis unit, and the feature amount calculation unit
  • the waveform data of the unknown sample is estimated from the regression vector obtained by the waveform data analysis unit and the waveform data of the unknown sample. Calculated values, the determination unit, and comparing the predicted value of the unknown sample and the discriminative model.
  • the invention according to claim 6 is the discriminator according to claim 2 or 3, wherein the waveform data analysis unit performs the multivariate analysis by PLS regression analysis, and in the PLS regression analysis, the waveform of the OK known sample
  • the data and waveform data of the NG known sample are weighted together with different pseudovariables as feature quantities, and a regression vector is determined using the score obtained from the weight, and the discrimination model creation unit is obtained by the waveform data analysis unit.
  • the discriminant model is created based on the pseudo variable, and the feature amount computing unit calculates the predicted value of the unknown sample waveform data from the regression vector obtained by the waveform data analysis unit and the waveform data of the unknown sample.
  • the determination unit is characterized by comparing the determination model with the predicted value of the unknown sample.
  • a seventh aspect of the present invention is the discriminator according to any one of the first to sixth aspects, wherein the waveform data is corrected by adding in advance data conversion processing such as moving average, differentiation, MSC, SNV, etc. It is characterized by being.
  • the invention according to claim 8 is the discriminator according to any one of claims 1 to 7, wherein the waveform data of the known sample and the unknown sample is a second enclosure different from the first enclosure. It is characterized in that it is waveform data of a voltage obtained by irradiating an AC magnetic field, an ultrasonic wave, an infrared ray, an X-ray or the like to a packaging box to be enclosed by a predetermined number.
  • the discrimination method of the invention takes in waveform data of m similar samples (m is a positive integer) of known characteristics whose characteristic is known, n of the waveform data (n is a positive integer) by multivariate analysis
  • a fourth step of determining whether the unknown sample is a sample having a desired feature by comparing the feature amount of the unknown sample with the discrimination model. And wherein the door.
  • the invention according to claim 10 is the discrimination method according to claim 9, wherein the known samples include OK known samples whose contents are OK and NG known samples whose contents are NG, and the discrimination model is It is created to be divided into an OK group including the feature amount of the OK known sample and an NG group including the feature amount of the NG known sample, and in the fourth step, the feature amount of the unknown sample is the OK group and It is characterized in that it is determined in which of the NG groups it is included.
  • the invention according to claim 11 is the discrimination method according to claim 9 or 10, wherein the waveform data is data formed of n sampling voltages sampled in time series at a common time interval and a common number of times.
  • the coefficient vector and the feature amount can be obtained for multivariate data in which the sampling voltage is the variable and the waveform data is an individual.
  • the invention according to claim 12 is the discrimination method according to claim 10 or 11, wherein in the first step, the multivariate analysis is performed by principal component analysis, and in the principal component analysis, the waveform data of the known sample is used.
  • the principal component loading as a coefficient vector is determined, and a principal component score as the feature amount is determined from the principal component loading and the waveform data of the known sample, and in the second step, the known sample obtained in the first step
  • a discriminant model is created based on the principal component score
  • the third step is to obtain the principal component score of the unknown sample from the principal component loading obtained in the first step and the waveform data of the unknown sample. It features.
  • the invention according to claim 13 is the discrimination method according to claim 10 or 11, wherein in the first step, the multivariate analysis is performed by principal component regression analysis, and in the principal component regression analysis, as the feature amount, Principal components loading and main components determined from waveform data of the OK known sample and waveform data of the NG known sample by giving different pseudo variables as feature quantities to the waveform data of the OK known sample and the waveform data of the NG known sample
  • a regression vector is obtained as a coefficient vector from the score and the pseudo variable
  • the second step creates a discriminant model based on the pseudo variable used in the first step
  • the third step includes the first step.
  • the predicted value of the unknown sample waveform data is obtained from the obtained regression vector and the waveform data of the unknown sample
  • the fourth step is characterized by comparing the predicted value of the unknown sample and the discriminative model.
  • the invention according to claim 14 is the discrimination method according to claim 10 or 11, wherein the first step performs the multivariate analysis by PLS regression analysis, and in the PLS regression analysis, waveform data of the OK known sample And the waveform data of the NG known sample are weighted with different pseudovariables as feature quantities, and a regression vector is determined using the score and loading obtained from the weights and the pseudovariables, wherein the second step is the first step A discriminant model is created based on the pseudo variable obtained in step b), and the third step uses the predicted value of the unknown sample waveform data from the regression vector obtained in the first step and the waveform data of the unknown sample
  • the fourth step is characterized by comparing the discriminant model with the predicted value of the unknown sample.
  • the invention according to claim 15 is the discrimination method according to any one of claims 9 to 14, wherein the waveform data is corrected by adding in advance data conversion processing such as moving average, differentiation, MSC, SNV, etc. It is characterized by being.
  • the invention according to claim 16 is the discrimination method according to any one of claims 9 to 15, wherein the waveform data of the known sample and the unknown sample is a second enclosure different from the first enclosure. It is characterized in that it is waveform data of a voltage obtained by irradiating an AC magnetic field, an ultrasonic wave, an infrared ray, an X-ray or the like to a packaging box to be enclosed by a predetermined number.
  • multivariate analysis is performed on waveform data of m known samples to obtain a coefficient vector of each known sample, and the coefficient vector is applied to waveform data of known samples to obtain a feature amount to obtain a discriminant model Is obtained and the coefficient vector is applied to the waveform data of the unknown sample to obtain the feature quantity of the unknown sample, and the feature quantity of the unknown sample is compared with the discrimination model to determine whether the unknown sample is a desired sample or not Therefore, it is possible to determine an unknown sample with the same or more accuracy as in the case where the maximum value of the waveform data is used as the determination index.
  • A is a list of waveform data
  • (b) is a list of principal component loadings in principal component analysis
  • (c) is a list of principal component scores in principal component analysis
  • (d) is a principal component regression analysis or PLS regression analysis
  • E is an explanatory diagram showing a list of predicted values in principal component regression analysis or PLS regression analysis. It is a wave form diagram of the waveform data of 30 known samples of "Attachment None" and "Attached Document (1 sheet)" respectively.
  • FIG. 6 is an explanatory diagram of a first principal component score, a waveform maximum value, and a statistic of a waveform area of the 60 waveform data of FIG. 5; It is a wave form diagram of the waveform data for 30 each of "Attachment None" and "Attachment existence (one sheet)" as an unknown sample. It is a scatter diagram which shows the discrimination
  • FIG. 14 is a plot diagram of the maximum output voltage of waveform data of 13 known samples of “without attached document” and “with attached document (1 sheet)” of FIG. 13. It is a scatter diagram which shows the discrimination
  • FIG. 19 is a plot diagram of the maximum output voltage of waveform data of 25 known samples of each of 25 known samples of “without attached document” and “with attached document (1 sheet)” in FIG. 18; Twenty-five unknown samples of “without attached document” and “with attached document (one sheet)” were applied to a discriminant model created using principal component regression analysis from the waveform data of known samples in FIG. 18.
  • the medicine 10 In the analysis procedure of waveform data, the medicine 10 will be described as a sample of the test object.
  • This medicine 10 packages an aluminum blister sheet 11 in which the concave portion of a plastic sheet in which a tablet is put in a concave portion is sealed with an aluminum film and an attached document 12 as an instruction manual of the tablet. It was put in the box 13.
  • the medicine 10 is scanned by the magnetic field sensor 30 while being transported by the transport belt 20 in the arrow A direction.
  • FIG. 1 shows the basic configuration of the discrimination apparatus of the present invention.
  • the magnetic field sensor 30 irradiates the medicine 10 with an AC magnetic field of a predetermined frequency with a pulse of a predetermined time width, and measures a secondary magnetic field generated by an eddy current generated in the aluminum blister sheet 11 by the AC magnetic field. Then, the voltages obtained by the measurement are sampled at predetermined time intervals to output n sampling voltages.
  • the waveform data formed by arranging n sampling voltages in time series varies depending on the posture of the aluminum blister sheet 11 placed in the packaging box 13 of the pharmaceutical product 10, the presence or absence of the attached document 12, and the installation position and quantity of the attached document 12. It takes on the shape of
  • the waveform data analysis unit 40A detects waveform data of detection voltages of m medicines 10 (hereinafter referred to as "known samples") for which information (OK / NG) about the attached document obtained by the magnetic field sensor 30 is known. Capture and multivariate analysis are performed to obtain a coefficient vector, thereby obtaining feature quantities for m known samples.
  • the discriminant model creating unit 50 creates a scatter diagram specifying m spots determined from the feature amounts of the m known samples obtained by the waveform data analysis unit 40A, and creates a discriminant model as a discriminant index. .
  • the feature amount calculation unit 40B detects the waveform data of the detection voltage of one medicine 10 (hereinafter referred to as "unknown sample") whose information (OK / NG) about the attached document obtained by the magnetic field sensor 30 is unknown.
  • the feature amount of one unknown sample is calculated using the coefficient vector already acquired by the waveform data analysis unit 40A.
  • the discriminator 60 applies a spot determined from the feature amount of the unknown sample obtained by the feature amount calculator 40B to the discriminant model created by the discriminant model creation unit 50 and compares the information with the unknown sample ( Determine OK / NG).
  • the output unit 70 outputs the determination result (OK / NG) obtained by the determination unit 60 for the unknown sample to a monitor or a printer. If the determination result is NG, an NG signal is output to the sample sorting device or the NG display lamp.
  • FIG. 2 shows a flowchart of the discrimination process of the present invention.
  • A is a flowchart for creating a discrimination model using known samples
  • (b) is a flowchart for discriminating (OK / NG) unknown samples using a discrimination model.
  • step S3 m pieces of waveform data of known samples output from the magnetic field sensor 30 are sequentially taken (steps S1 and S2), and subjected to analysis processing in the waveform data analysis unit 40A (step S3).
  • step S4 m pieces of waveform data of known samples output from the magnetic field sensor 30 are sequentially taken (steps S1 and S2), and subjected to analysis processing in the waveform data analysis unit 40A (step S3).
  • this waveform data analysis after determining coefficient vectors at n respective sampling times based on m pieces of waveform data, feature amounts are obtained for the m pieces of waveform data.
  • a discrimination model is created (step S4). Steps S1, S2, and S3 correspond to the first step, and step S4 corresponds to the second step.
  • the waveform data of one unknown sample is similarly fetched (step S11), and the feature vector is calculated for the one unknown sample by applying the coefficient vector obtained in step S3. (Step S12). Then, the spot determined by the feature amount is applied to the discriminant model obtained in step S4 and compared (step S13). Based on the result of this comparison, information (OK / NG) of the one unknown sample is determined (step S14). Thereafter, the feature amount is similarly obtained for the second and subsequent unknown samples, and the information (OK / NG) is similarly determined according to the discrimination model. Steps S11 and S12 correspond to the third step, and steps S13 and S14 correspond to the fourth step.
  • the sorting is performed according to the determination result. If the sorting device is installed at the rear stage of the transport belt 20, accurate sorting can be performed.
  • FIG. 3A shows a waveform diagram of waveform data 1 having multivariate data obtained by the magnetic field sensor 30.
  • This is, for example, a waveform obtained by sampling the sampling voltages X11, X12, X13,..., X1n obtained by sampling the output voltage of the magnetic field sensor 30 at time t1, t2, t3,.
  • 3 (b) is a similar waveform diagram of n sampling voltages X21, X22, X23,..., X2 n of waveform data 2
  • FIG. 3 (c) is a waveform chart of n sampling voltages X31, X32 of waveform data 3.
  • FIG. 3D is a similar waveform diagram of n sampling voltages Xm1, Xm2, Xm3,.
  • FIG. 4A shows a list of sampling voltages Xmn at times t1, t2, t3,..., Tn of these waveform data 1, 2, 3,.
  • m waveform data 1, 2, 3,..., M are individuals, and sampling voltages X of n sampling times t1, t2, t3,. Perform data analysis.
  • FIG. 4 (b) shows a list of principal component loading Vni at each sampling time obtained by principal component analysis from the m waveform data of FIG. 4 (a), and FIG. 4 (c) shows this principal component loading
  • a list of principal component scores Tmi for each waveform obtained by applying the waveform data of FIG. 4A is shown.
  • FIG. 4 (d) shows a list of regression vectors bn for each sampling time obtained by principal component regression analysis or PLS regression analysis from the m waveform data of FIG. 4 (a), and FIG. A list of predicted values ym for each waveform obtained by applying the regression vector bn to the waveform data of FIG. 4 (a) is shown.
  • Multivariate analysis performed on a plurality of waveform data by the waveform data analysis unit 40A includes principal component analysis, principal component regression analysis, or PLS regression analysis.
  • Principal component analysis is an analysis method for extracting features of multivariate waveform data with a small number of dimensions.
  • principal component loading is determined as a coefficient vector from waveform data of a plurality of known samples, and a principal component score is determined as a feature amount. Then, the obtained principal component loading is applied to the waveform data of the unknown sample to obtain a principal component score which is a feature of the waveform data of the unknown sample.
  • the calculation can be performed using a matrix decomposition with singular value decomposition or an iterative calculation with non-linear iterative partial least squares (NIPALS).
  • NPALS non-linear iterative partial least squares
  • the first principal component is a component for extracting the first information with the largest variation among the m waveform data having n variables
  • the second principal component is m components having n variables It is a component for extracting second information having the largest variation among m pieces of waveform data from the remaining information obtained by subtracting the first main component from the waveform data.
  • the principal component analysis method by NIPALS it may be sufficient to obtain, for example, up to the second principal component, even if not all the principal components are determined.
  • Yoshimura et al. Have shown that it is possible to apply principal component analysis according to the NIPALS algorithm using the basic functions of Microsoft Excel (N. Yoshimura, K. Fukuhara, K. Mitsuki, M. Takayanagi, J Comput. Chem. Jpn., 10, 32-43 (2011)).
  • principal component regression analysis determines principal component loading and principal component scores from waveform data of a plurality of known samples, but they are not coefficient vectors and feature quantities, respectively.
  • different pseudo variables as target variables such as “1” and “2” are given as feature quantities to waveform data of known OK sample and known NG sample, and are obtained from waveform data of those known samples
  • a regression vector is determined as a coefficient vector using the principal component loading, the principal component score and the above-mentioned pseudo variable. Then, the obtained regression vector is applied to the waveform data of the unknown sample to obtain a predicted value for the pseudo variable as a feature of the waveform data of the unknown sample.
  • PLS of PLS regression analysis is Partial Least-Squares (partial least squares), and this PLS regression analysis is different from principal component regression analysis.
  • different pseudo-variables which are objective variables such as “1” and “2” as feature quantities corresponding to waveform data of known samples of OK sample and known NG sample, are given as feature quantities, Apply weights by using least squares method from waveform data and pseudo variables, determine scores from waveform data and weights, apply least squares method from waveform data and scores, and pseudo variables and scores, and determine their loading
  • a regression vector which is an explanatory variable is obtained as a coefficient vector from the weight and the score or the loading.
  • the obtained regression vector is applied to the waveform data of the unknown sample to obtain a predicted value for the pseudo variable as a feature of the waveform data of the unknown sample.
  • Yoshimura et al. Show the calculation procedure of PLS regression analysis using the basic functions of Microsoft Excel (N. Yoshimura, M. Takayanagi, J. Comput. Chem. Jpn., 13, 139-154 (2014)) .
  • FIG. 5 shows waveform data for a commercially available drug in which the aluminum package in which the granular drug is enclosed is replaced with the aluminum blister sheet 11 of FIG.
  • FIG. 5 (a) shows waveform data of 30 known samples (NG known samples) of “without attached document”, and FIG. 5 (b) shows 30 known samples of “with attached document (1 sheet)”. It is waveform data of (OK known sample).
  • the case where the principal component analysis is performed based on the waveform of the known sample shown in FIG. 5 to create a discrimination model will be described.
  • First main component loading, second main component loading for the group of 30 samples “without attached document” of FIG. 5 (a) and the group of 30 samples “with attached document (1 sheet)” of (b) By applying the first principal component loading and the second principal component loading to the sampling voltage of each waveform data of the original known sample, thereby obtaining the first principal component score and the second principal component score for each waveform data.
  • the values of the first principal component score and the second principal component score are determined and mapped as spots, a scatter diagram as shown in FIG. 6 can be created.
  • the first principal component score T11 and the second principal component T12 for the waveform data 1 are thus, the spot of the scatter diagram is a position determined by the first principal component score T11 and the second principal component T12.
  • X11 to X1n are sampling voltages at times t1 to tn of the waveform data 1 described in FIG. 4A
  • V11 to Vn1 are first main component loading at times t1 to tn described in FIG.
  • VVn2 is the second main component loading at time t1 to tn described in FIG. 4 (b).
  • a mark ⁇ indicates a spot of “no attached document”, and a mark ⁇ indicates a spot of “with attached document (one sheet)”.
  • “a” is a central point obtained from the average value of spots in the “Attachment None” group, and “b” is a central point obtained from the average value of the spots in the “Attached Document (1 sheet)”. If a line L1 orthogonal to the center point c on the line connecting the center points a and b of the two groups is created, the line L1 is a group of "with an attached document (one sheet)” It becomes a judgment index (threshold) that divides the groups of “No attached document” and “No attached document”.
  • the discriminant model of FIG. 6 can not discriminate depending on the second principal component score, and it can be seen that the discriminant index is determined solely by the first principal component score.
  • the first principal component score is obtained for waveform data of 60 known samples, and the first principal component score and 60 known samples are obtained.
  • the correlation coefficient with the waveform maximum value and the waveform area was examined.
  • This correlation coefficient R is You can ask for
  • A is a first principal component score
  • B is a statistic of waveform maximum value or a statistic of waveform area
  • ⁇ AB is a covariance of A and B
  • ⁇ A is a standard deviation of A
  • ⁇ B is B Standard deviation of
  • FIGS. 7 (a), (b) and (c) show the first principal component score, the maximum value of the waveform, and the area of the waveform in the form of a bar graph for the example of the above-mentioned 60 known samples. It is also understood that the waveform maximum value shown in (b) and the waveform area shown in (c) have a large correlation with the first principal component score shown in (a).
  • FIG. 8 shows waveform data of a sampling voltage as an unknown sample of the same type as the known sample described above. That is, this unknown sample is a known sample but is used for verification.
  • (A) is waveform data for 30 samples of "no attached document”
  • (b) is waveform data for 30 samples of "with attached document (one sheet)”.
  • the first principal component score is calculated by applying the first principal component loading obtained when creating the discrimination model of FIG. 6 to individual waveform data of an unknown sample, and the second principal component loading is calculated. Apply to calculate a second principal component score.
  • V11 to Vn1 are the first principal component loading from time t1 to tn described in FIG. 4 (b)
  • V12 to Vn2 are the second principal component loading from time t1 to tn described in FIG. 4 (b), Is used when creating the discriminant model.
  • FIG. 9 is an application of the spot identified by the first principal component score and the second principal component score of the waveform data of the unknown sample in this manner to the discriminant model obtained in FIG.
  • waveform data indicated by the crosses are included in the "Attachment None" group.
  • the waveform data indicated by a plus mark is included in the group of “Attached document (1 sheet)”.
  • FIG. 10 shows waveform data of all 75 samples of commercial drugs in which the aluminum package in which the granular drug is enclosed is replaced with the aluminum blister sheet 11 of FIG.
  • This waveform data includes "no attached document” known sample (NG known sample), "attached document (1 sheet)” known sample (OK known sample), "attached document (2 sheets) known sample” (2 sheets) It is the data which measured NG known samples) about 25 samples, respectively.
  • the uniqueness of the shape of the waveform data of the “Attached document (2 sheets)” known sample is considered to be due to the difference in the inclination of the conductor (aluminum package) depending on the installation position of the attached document. As shown in FIG.
  • FIG. 12 is a diagram in which it is plotted, and it may be separated into a group G1 of "without attached document”, a group G2 of "with attached document (1 sheet)” and a group G3 of "with attached document (2 sheets)". did it.
  • the first principal component score can be divided into three groups.
  • each of 12 waveform data as the same kind of unknown sample is fetched, and the first principal component score and the second principal component loading used in creating the discriminant model of FIG.
  • the second principal component score is calculated, waveform data of unknown samples indicated by x in group G1 are collected, waveform data of unknown samples indicated by + in group G2 are collected, and unknowns indicated by * in group G3 Sample waveform data collected.
  • the waveform data shown by the crosses are "without attached document", the waveform data shown by the plus is "with attached document (1 sheet)", and the waveform data shown by * is "with attached document (2 sheets)".
  • known samples are treated as unknown samples.
  • FIG. 13 shows waveform data of all 50 samples of a commercially available drug in which the aluminum blister sheet 11 described in FIG.
  • This waveform data is data measured on 25 known samples (NG known samples) of “without attached document” and 25 known samples (OK known samples) of “with attached document (1 sheet)”.
  • the waveform data has irregularities at the top, which is considered to be due to the depression of the aluminum blister sheet. Since the presence of the attached document 12 makes the convex peak shape gentler, if the inclination of the waveform data can be added to the characteristic information of the waveform data such as the maximum value or the waveform area which changes depending on the presence or absence of the attached document. An improvement in the accuracy of determination regarding the presence or absence of attached documents is expected.
  • the maximum waveform value of 13 samples selected from among NG known samples and OK known samples for creating a discriminant model of these waveform data is, as shown in FIG. It shows larger value than the group with “Attachment (1 sheet)”.
  • FIG. 15 is a diagram in which a point determined by the first principal component score and the second principal component score of the unknown sample is plotted on the discrimination model created by the first principal component score and the second principal component score of the known sample. It was possible to separate the group "without document” and the group "with attached document (1 sheet)". Here, the two groups could be separated by the first principal component score and also by the second principal component score. Therefore, it can be understood that the discrimination is possible only by the second principal component score.
  • the waveform data indicated by the crosses is “without attached document”, and the waveform data indicated by the plus is “with an attached document (1 sheet)”, and all the known samples are treated as unknown samples.
  • the second principal component score is calculated from the slope (first derivative value) of the average waveform data of 13 samples of 13 known samples of “without attached document” and “with attached document (1 sheet)” respectively.
  • the second principal component loading is shown in FIG. P1 is the average waveform data of the waveform data of 13 known samples of “without attached document” and “with attached document (1 sheet)”, P2 is “without attached document”, “with attached document (1 sheet)”
  • the second principal component loading of waveform data of 13 known samples of each, P3 represents the first derivative (slope) of the waveform data P1.
  • the second principal component loading P2 indicates that there is a large correlation with the slope P3 of the average waveform data P1. From this, it is possible to determine the information including the inclination in the maximum value and the waveform area of the waveform data which change depending on the presence or absence of the attached document, and it is considered that the determination accuracy is improved.
  • discrimination is performed by principal component regression analysis.
  • the waveform data analysis unit 40A gives pseudo variables, which are objective variables of “1” and “2”, to the waveform data of the NG known sample and the OK known sample, respectively, as feature quantities, Find a regression vector as a coefficient vector.
  • the regression vector in this principal component regression analysis is determined from the principal component loading, the principal component score, and the pseudo variable obtained from the waveform data of the known sample as described above.
  • principal component regression analysis a predicted value which is a feature amount is calculated by applying the obtained regression vector to each waveform data.
  • regression vectors b1, b2, b3,..., Bn calculated to obtain a predicted value ym from sampling values Xm1, Xm2, Xm3,. 4D is used as the regression vector described in FIG. 4D for obtaining the predicted value ys of the waveform data S of the unknown sample. Therefore, assuming that S1, S2, S3, ..., Sn are sampling values of the waveform data S of unknown samples at time t1, t2, t3, ..., tn, It becomes.
  • FIG. 17 is a diagram showing pseudo variables given when performing principal component regression analysis for the waveform data of FIG.
  • FIG. 18 shows waveform data of all 100 known and unknown samples of a commercial drug in which the aluminum blister sheet 11 described in FIG. No significant difference is seen in the waveform area of the “none” group and the “with annex (1 sheet)” group.
  • FIG. 19 shows maximum values of 25 samples for creating a discriminant model as a known sample of the group of “without attached document” and the group of “with attached document (1 sheet)” of FIG. Also in FIG. 19, there is a high possibility that the waveform maximum values overlap. Therefore, even if the principal component analysis is applied to the waveform data shown in FIG. 18, the group “without attached document” and the group “with attached document (one sheet)” are used as the first principal component score and the second main component It is difficult to separate by ingredient score.
  • principal component regression analysis is applied to the converted waveform data.
  • the waveform data indicated by the crosses is “without attached document”, and the waveform data indicated by the plus is “with an attached document (1 sheet)”, and all the known samples are treated as unknown samples.
  • “Attached document (1 sheet)” is regarded as an OK judgment from among “Attached document absent”, “Attached document (1 sheet)”, “Attached document (2 sheets)”, etc.
  • the determination target to which the present invention can be applied is not limited to this.
  • waveform analysis by principal component regression analysis or PLS regression analysis examples of waveform analysis by principal component regression analysis or PLS regression analysis are shown. However, in the case of using a characteristic shape of waveform data, multiple regression analysis may be used. .

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Algebra (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Investigating Or Analyzing Materials By The Use Of Magnetic Means (AREA)

Abstract

【課題】高い精度で未知サンプルを判別することができるようにする。 【解決手段】特徴が既知の同種のm個の既知サンプルの波形データを取り込み多変量解析により前記波形データのn個の変数についての係数ベクトルと前記既知サンプルの特徴量を求める波形データ分析部40Aと、該波形データ分析部40Aで得られた前記既知サンプルの特徴量に基づいて判別モデルを作成する判別モデル作成部50と、前記既知サンプルと同種で特徴が未知の未知サンプルの波形データを取り込み前記波形データ分析部40Aで得られた前記係数ベクトルを用いて前記未知サンプルの特徴量を演算する特徴量演算部40Bと、該特徴量演算部40Bで得られた前記未知サンプルの特徴量を前記判別モデルと比較することで前記未知サンプルが所望の特徴を持つサンプルか否かを判別する判別部60と、を備えることを特徴とする。

Description

判別装置及び判別方法
 本発明は、既知サンプルを測定して得られたn個(nは正の整数)のサンプリング電圧を時系列に並べて形成されるm個(mは正の整数)の波形データに対して多変量解析により波形分析を行って判別モデルを作成し、その判別モデルに未知サンプを適用して、該未知サンプルが所望のものか否かの判別を行う判別装置及び判別方法に関する。
 例えば、錠剤やカプセル剤等のように市販されている医薬品は、硬質プラスチックシートの凹部に入れてアルミニウムフィルムで封止したアルミブリスターシート(PTP包装)の形で包装箱に入れられているが、この包装箱には使用上の注意を記載した添付文書も同梱されている。添付文書を同梱するのは、市販される医薬品は使用上の注意に基づいて用いることが強く要求されているからである。
 このため、市販される特定の医薬品については、製薬工場において、出荷前の最終工程で、封をした包装箱内に添付文書が入っていることを確認する検査が行われている。この検査として、包装箱の重量を計測する手法があるが、この手法は透明フィルムで完全密封する場合以外では湿度の影響を受けるので、正確な検査は難しかった。また、処方薬のように包装箱に梱包する医薬品が多い場合は、医薬品に比べて添付文書の重量変化は軽微なものとなるため、検査は更に難しくなる。
 そこで従来では、図22に示すように、アルミブリスターシート11と添付文書12とを包装箱13の中に入れた医薬品10を搬送ベルト20によってA方向に搬送する際に、磁界センサ30によって医薬品10に交流磁界を照射することによって、包装箱13内の添付文書12の有無を検査している(例えば、特許文献1)。
 この図22の検査装置は、磁界センサ30からパルス状の交流磁界を発生させて包装箱13に照射すると、アルミブリスターシート11のアルミニウムフィルムに渦電流が発生するので、その渦電流で発生する二次磁界の強度を測定するものである。測定された強度を示す電圧は、添付文書12がある場合はそのレベルが小さくなり、無い場合は大きくなるので、その出力電圧の最大値を予め設定した閾値と比較することによって、添付文書12の有無を判別することができる。
特開2012-163433号公報
 ところが、アルミブリスターシート11が小さいときは、添付文書12によってそのアルミブリスターシート11に傾きが生じて出力電圧が閾値より大きくなったり、あるいは搬送時のバタツキにより添付文書12にズレが発生して同様に出力電圧が閾値より大きくなって、添付文書12が封入されているにも拘わらず不良品(以下、“NG”と称する。)と誤判別され、医薬品10が無駄に廃棄される場合がある。また、添付文書12が2枚以上含まれている場合は出力電圧が閾値電圧より小さくなり、本来はNGであるにも拘わらず良品(以下“OK”と称する。)と誤判別されることがある。
 以上は医薬品10の中の添付文書12の有無の判別を行う場合についてであるが、それ以外の別種サンプルについても検出値を示す出力電圧の波形データに基づいて何らかの判別を行う場合には、波形最大値のみでは正確な判別を行うことができない場合が多い。
 本発明の目的は、高い精度で未知サンプルをOK/NG判別することができるようにした判別装置及び判別方法を提供することである。
 上記目的を達成するために、請求項1にかかる発明の判別装置は、特徴が既知の同種のm個(mは正の整数)の既知サンプルの波形データを取り込み多変量解析により前記波形データのn個(nは正の整数)の変数についての係数ベクトルと前記既知サンプルの特徴量を求める波形データ分析部と、該波形データ分析部で得られた前記既知サンプルの特徴量に基づいて判別モデルを作成する判別モデル作成部と、前記既知サンプルと同種で特徴が未知の未知サンプルの波形データを取り込み前記波形データ分析部で得られた前記係数ベクトルを用いて前記未知サンプルの特徴量を演算する特徴量演算部と、該特徴量演算部で得られた前記未知サンプルの特徴量を前記判別モデルと比較することで前記未知サンプルが所望の特徴を持つサンプルか否かを判別する判別部と、を備えることを特徴とする。
 請求項2にかかる発明は、請求項1に記載の判別装置において、前記既知サンプルには、内容物がOKのOK既知サンプルと内容物がNGのNG既知サンプルが含まれ、前記判別モデルは、前記OK既知サンプルの特徴量が含まれるOKグループと前記NG既知サンプルの特徴量が含まれるNGグループに分けられるように作成され、前記判別部は、前記未知サンプルの特徴量が前記OKグループと前記NGグループのいずれに含まれるかを判別する、ことを特徴とする。
 請求項3にかかる発明は、請求項1又は2に記載の判別装置において、前記波形データは、共通の時間間隔で共通の回数だけ時系列でサンプリングされたn個のサンプリング電圧で形成されたデータであり、前記係数ベクトルと前記特徴量は、前記サンプリング電圧を前記変数とし前記波形データを個体とする多変量データを対象として求められることを特徴とする。
 請求項4にかかる発明は、請求項1、2又は3に記載の判別装置において、前記波形データ分析部は、前記多変量解析を主成分分析で行い、該主成分分析では前記既知サンプルの波形データから前記係数ベクトルとしての主成分ローディングを求め、該主成分ローディングと前記既知サンプルの波形データから前記特徴量としての主成分スコアを求め、前記判別モデル作成部は、前記波形データ分析部で得られた前記既知サンプルの主成分スコアに基づいて判別モデルを作成し、前記特徴量演算部は、前記波形データ分析部で得られた前記主成分ローディングと前記未知サンプルの波形データから前記未知サンプルの主成分スコアを求めることを特徴とする。
 請求項5にかかる発明は、請求項2又は3に記載の判別装置において、前記波形データ分析部は、前記多変量解析を主成分回帰分析で行い、該主成分回帰分析では、前記特徴量として、前記OK既知サンプルの波形データと前記NG既知サンプルの波形データに特徴量として異なった疑似変数を与え、前記OK既知サンプルの波形データと前記NG既知サンプルの波形データから求めた主成分ローディング及び主成分スコアと前記疑似変数から係数ベクトルとして回帰ベクトルを求め、前記判別モデル作成部は、前記波形データ分析部で得られた前記疑似変数に基づいて判別モデルを作成し、前記特徴量演算部は、前記波形データ分析部で得られた前記回帰ベクトルと前記未知サンプルの波形データから前記未知サンプルの波形データの予測値を求め、前記判別部は、前記判別モデルと前記未知サンプルの予測値を比較することを特徴とする。
 請求項6にかかる発明は、請求項2又は3に記載の判別装置において、前記波形データ分析部は、前記多変量解析をPLS回帰分析で行い、該PLS回帰分析では、前記OK既知サンプルの波形データと前記NG既知サンプルの波形データに特徴量として異なった疑似変数とともに重みを与え、該重みから得られるスコアを用いて回帰ベクトルを求め、前記判別モデル作成部は、前記波形データ分析部で得られた前記疑似変数に基づいて判別モデルを作成し、前記特徴量演算部は、前記波形データ分析部で得られた前記回帰ベクトルと前記未知サンプルの波形データから前記未知サンプル波形データの予測値を求め、前記判別部は、前記判別モデルと前記未知サンプルの予測値を比較することを特徴とする。
 請求項7にかかる発明は、請求項1乃至6のいずれか1つに記載の判別装置において、前記波形データは、移動平均、微分、MSC、SNV等のデータ変換処理を予め加えて補正したデータであることを特徴とする。
 請求項8にかかる発明は、請求項1乃至7のいずれか1つに記載の判別装置において、前記既知サンプル及び前記未知サンプルの波形データは、第1封入物とは別種の第2封入物が所定数だけ同封されるべき包装箱に対して、交流磁界、超音波、赤外線、X線等を照射して得られた電圧の波形データであることを特徴とする。
 請求項9にかかる発明の判別方法は、特徴が既知の同種のm個(mは正の整数)の既知サンプルの波形データを取り込み多変量解析により前記波形データのn個(nは正の整数)の変数についての係数ベクトルと前記既知サンプルの特徴量を求める第1ステップと、該第1ステップで得られた前記既知サンプルの特徴量に基づいて判別モデルを作成する第2ステップと、前記既知サンプルと同種で特徴が未知の未知サンプルの波形データを取り込み前記第1ステップで得られた前記係数ベクトルを用いて前記未知サンプルの特徴量を演算する第3ステップと、該第3ステップで得られた前記未知サンプルの特徴量を前記判別モデルと比較することで前記未知サンプルが所望の特徴を持つサンプルか否かを判別する第4ステップと、を備えることを特徴とする。
 請求項10にかかる発明は、請求項9に記載の判別方法において、前記既知サンプルには、内容物がOKのOK既知サンプルと内容物がNGのNG既知サンプルが含まれ、前記判別モデルは、前記OK既知サンプルの特徴量が含まれるOKグループと前記NG既知サンプルの特徴量が含まれるNGグループに分けられるように作成され、前記第4ステップは、前記未知サンプルの特徴量が前記OKグループと前記NGグループのいずれに含まれるかを判別する、ことを特徴とする。
 請求項11にかかる発明は、請求項9又は10に記載の判別方法において、前記波形データは、共通の時間間隔で共通の回数だけ時系列でサンプリングされたn個のサンプリング電圧で形成されたデータであり、前記係数ベクトルと前記特徴量は、前記サンプリング電圧を前記変数とし前記波形データを個体とする多変量データを対象として求められることを特徴とする。
 請求項12にかかる発明は、請求項10又は11に記載の判別方法において、前記第1ステップは、前記多変量解析を主成分分析で行い、該主成分分析では前記既知サンプルの波形データから前記係数ベクトルとしての主成分ローディングを求め、該主成分ローディングと前記既知サンプルの波形データから前記特徴量としての主成分スコアを求め、前記第2ステップは、前記第1ステップで得られた前記既知サンプルの主成分スコアに基づいて判別モデルを作成し、前記第3ステップは、前記第1ステップで得られた前記主成分ローディングと前記未知サンプルの波形データから前記未知サンプルの主成分スコアを求めることを特徴とする。
 請求項13にかかる発明は、請求項10又は11に記載の判別方法において、前記第1ステップは、前記多変量解析を主成分回帰分析で行い、該主成分回帰分析では、前記特徴量として、前記OK既知サンプルの波形データと前記NG既知サンプルの波形データに特徴量として異なった疑似変数を与え、前記OK既知サンプルの波形データと前記NG既知サンプルの波形データから求めた主成分ローディング及び主成分スコアと前記疑似変数から係数ベクトルとして回帰ベクトルを求め、前記第2ステップは、前記第1ステップで用いた前記疑似変数に基づいて判別モデルを作成し、前記第3ステップは、前記第1ステップで得られた前記回帰ベクトルと前記未知サンプルの波形データから前記未知サンプル波形データの予測値を求め、前記第4ステップは、前記判別モデルと前記未知サンプルの予測値を比較することを特徴とする。
 請求項14にかかる発明は、請求項10又は11に記載の判別方法において、前記第1ステップは、前記多変量解析をPLS回帰分析で行い、該PLS回帰分析では、前記OK既知サンプルの波形データと前記NG既知サンプルの波形データに特徴量として異なった疑似変数とともに重み与え、該重みから得られるスコア及びローディングと前記疑似変数を用いて回帰ベクトルを求め、前記第2ステップは、前記第1ステップで得られた前記疑似変数に基づいて判別モデルを作成し、前記第3ステップは、前記第1ステップで得られた前記回帰ベクトルと前記未知サンプルの波形データから前記未知サンプル波形データの予測値を求め、前記第4ステップは、前記判別モデルと前記未知サンプルの予測値を比較することを特徴とする。
 請求項15にかかる発明は、請求項9乃至14のいずれか1つに記載の判別方法において、前記波形データは、移動平均、微分、MSC、SNV等のデータ変換処理を予め加えて補正したデータであることを特徴とする。
 請求項16にかかる発明は、請求項9乃至15のいずれか1つに記載の判別方法において、前記既知サンプル及び前記未知サンプルの波形データは、第1封入物とは別種の第2封入物が所定数だけ同封されるべき包装箱に対して、交流磁界、超音波、赤外線、X線等を照射して得られた電圧の波形データであることを特徴とする。
 本発明によれば、m個の既知サンプルの波形データに多変量解析を行って各既知サンプルの係数ベクトルを求めこの係数ベクトルを既知サンプルの波形データに適用することより特徴量を得て判別モデルを作成し、その係数ベクトルを未知サンプルの波形データに適用することで未知サンプルの特徴量を得て、未知サンプルの特徴量を判別モデルと比較して未知サンプルが所望のサンプルか否かの判別を行うので、波形データの波形最大値を判別指標とする場合と同程度以上の精度で未知サンプルの判別を行うことができる。
本発明の判別装置の機能ブロック図である。 本発明の分析処理のフローチャートである。 本実施例で扱う波形データの例を示す波形図である。 (a)は波形データの一覧、(b)は主成分分析における主成分ローディングの一覧、(c)は主成分分析における主成分スコアの一覧、(d)は主成分回帰分析又はPLS回帰分析における回帰ベクトルの一覧,(e)は主成分回帰分析又はPLS回帰分析における予測値の一覧を示す説明図である。 “添付文書なし”と“添付文書あり(1枚)”のそれぞれ30個分の既知サンプルの波形データの波形図である。 図5の波形データを主成分分析して得られた第1主成分スコアと第2主成分スコアで構成される判別モデルとしての散布図である。 図5の60個の波形データの第1主成分スコア、波形最大値、波形面積の統計量の説明図である。 未知サンプルとしての“添付文書なし”、“添付文書あり(1枚)”のそれぞれ30個分の波形データの波形図である。 図6の判別モデルに対して図8の未知サンプルを適用した場合の判別結果を示す散布図である。 “添付文書なし”、“添付文書あり(1枚)”、“添付文書あり(2枚)”のそれぞれ25個分の既知サンプル及び未知サンプルの全サンプルの波形データの波形図である。 図10の“添付文書なし”、“添付文書あり(1枚)”、“添付文書あり(2枚)”の内のそれぞれ13個分の既知サンプルの波形データの最大出力電圧のプロット図である。 図10の既知サンプルにより主成分分析を用いて作成された判別モデルに未知サンプルを適用した場合の判別結果を示す散布図である。 “添付文書なし”、“添付文書あり(1枚)”のそれぞれ25個分の既知サンプル及び未知サンプルの全サンプルの波形データの波形図である。 図13の“添付文書なし”、“添付文書あり(1枚)”のそれぞれ13個分の既知サンプルの波形データの最大出力電圧のプロット図である。 図13の既知サンプルに対して主成分分析を適用して作成された判別モデルに12個の未知サンプルを適用した場合の判別結果を示す散布図である。 図13の“添付文書なし”、“添付文書あり(1枚)”のそれぞれ13個分の既知サンプルの波形データの平均値P1、第2主成分ローディングP2、平均値P1の一次微分値P3の波形の特性図である。 主成分回帰分析により13個の既知サンプルから作成された判別モデルに12個の未知サンプルを適用した場合の判別結果を示す散布図である。 “添付文書なし”、“添付文書あり(1枚)”のそれぞれ50個分の既知サンプル及び未知サンプルの全サンプルの波形データの波形図である。 図18の“添付文書なし”、“添付文書あり(1枚)”の既知サンプルの内のそれぞれ25個分の既知サンプルの波形データの最大出力電圧のプロット図である。 図18の既知サンプルの波形データから主成分回帰分析を使用して作成された判別モデルに対して“添付文書なし”、“添付文書あり(1枚)”のそれぞれ25個の未知サンプルを適用した場合の判別結果を示す散布図である。 図18の既知サンプルの波形データからPLS回帰分析を使用して作成された判別モデルに対して“添付文書なし”、“添付文書あり(1枚)”のそれぞれ25個の未知サンプルを適用した場合の判別結果を示す散布図である。 従来の検査装置の説明図である。
<分析手順>
 波形データの分析手順について、医薬品10を検査対象物のサンプルとして説明する。この医薬品10は、図22に示したように、錠剤を凹部に入れたプラスチックシートの該凹部をアルミニウムフィルムで封止したアルミブリスターシート11とその錠剤の取扱説明書としての添付文書12とを包装箱13に入れたものである。この医薬品10は、搬送ベルト20で矢印A方向に搬送される途中で磁界センサ30によってスキャンされる。
 図1に本発明の判別装置の基本構成を示す。磁界センサ30は、所定周波数の交流磁界を所定時間幅のパルスで医薬品10に照射し、その交流磁界によってアルミブリスターシート11に発生した渦電流によって発生した二次磁界を測定する。そして、その測定で得られる電圧を所定時間間隔でサンプリングしてn個のサンプリング電圧を出力する。n個のサンプリング電圧を時系列に並べて形成される波形データは、医薬品10の包装箱13内に入れたアルミブリスターシート11の姿勢や添付文書12の有無や添付文書12の設置位置、数量によって異なった形状を呈する。
 波形データ分析部40Aは、磁界センサ30で得られた添付文書についての情報(OK/NG)が既知のm個の医薬品10(以下、“既知サンプル”と称する。)の検出電圧の波形データを取り込み、多変量解析を行って係数ベクトルを求め、これによりm個の既知サンプルについての特徴量を求める。
 判別モデル作成部50は、波形データ分析部40Aにおいて得られたm個の既知サンプルについての特徴量から定まるm個のスポットを特定した散布図を作成して、判別指標としての判別モデルを作成する。
 特徴量演算部40Bは、磁界センサ30で得られた添付文書についての情報(OK/NG)が未知の1個の医薬品10(以下、“未知サンプル”と称する。)の検出電圧の波形データを取り込み、波形データ分析部40Aで既に得られている係数ベクトルを用いて当該1個の未知サンプルについての特徴量を演算する。
 判別部60では、特徴量演算部40Bで得られた未知サンプルの特徴量から定まるスポットを、判別モデル作成部50で作成された判別モデルに適用して比較することで、当該未知サンプルの情報(OK/NG)を判別する。
 出力部70では、未知サンプルについて判別部60で得られた判別結果(OK/NG)をモニタあるいはプリンタに出力する。判別結果がNGの場合は、NG信号をサンプル選別装置あるいはNG表示ランプに出力する。
 図2に本発明の判別処理のフローチャートを示す。(a)は既知サンプルを使用して判別モデルを作成するフローチャート、(b)は判別モデルを使用して未知サンプルを判別(OK/NG)するフローチャートである。
 フローチャート(a)では、磁界センサ30から出力する既知サンプルの波形データを順次m個取り込み(ステップS1、S2)、波形データ分析部40Aにおける分析処理に供する(ステップS3)。この波形データ分析では、m個の波形データに基づいてn個のそれぞれのサンプリング時刻における係数ベクトルを求めてから、m個の波形データについて、特徴量を求める。そして、このm個の波形データのそれぞれの特徴量に基づいてm個の波形データについての散布図を作成すると、判別モデルが作成される(ステップS4)。請求項との関係では、ステップS1、S2、S3が第1ステップに、ステップS4が第2ステップに、それぞれ相当する。
 フローチャート(b)では、1個の未知サンプルの波形データを同様に取り込んで(ステップS11)、ステップS3で求まっている係数ベクトルを適用することで、当該1個の未知サンプルについて特徴量を演算する(ステップS12)。そして、その特徴量で決まるスポットをステップS4で得られている判別モデルに適用して比較する(ステップS13)。この比較の結果によって、当該1個の未知サンプルの情報(OK/NG)を判別する(ステップS14)。以後、2個目以降の未知サンプルについても同様に特徴量を求め、判別モデルによって同様に情報(OK/NG)を判別する。請求項との関係では、ステップS11、S12が第3ステップに、ステップS13、S14が第4ステップに、それぞれ相当する。
 以上により、未知サンプルである医薬品10が図22に示した磁界センサ30の上方を通過するごとに、その医薬品10の情報(OK/NG)が判別されるので、判別結果に応じて選別を行う選別装置を搬送ベルト20の後段に設置しておけば、正確な選別を行うことができる。
 図3(a)に磁界センサ30で得られる多変量データを持つ波形データ1の波形図を示す。これは例えば1ms間隔の時刻t1,t2,t3,・・・,tnで磁界センサ30の出力電圧をサンプリングして得たサンプリング電圧X11、X12,X13,・・・,X1nをなぞった波形である。図3(b)は波形データ2のn個のサンプリング電圧X21、X22,X23,・・・,X2nの同様な波形図、図3(c)は波形データ3のn個のサンプリング電圧X31、X32,X33,・・・,X3nの同様な波形図、図3(d)は波形データmのn個のサンプリング電圧Xm1、Xm2,Xm3,・・・,Xmnの同様な波形図である。
 図4(a)に、これらの波形データ1,2,3,・・・mの各時刻t1,t2,t3,・・・,tnにおけるサンプリング電圧Xmnを一覧で示した。本発明では、m個の波形データ1,2,3,・・・,mを個体とし、n個のサンプリング時刻t1,t2,t3,・・・,tnのサンプリング電圧Xを変数として多変量のデータ分析を行う。
 図4(b)に図4(a)のm個の波形データから主成分分析により得られた各サンプリング時刻毎の主成分ローディングVniの一覧を示し、図4(c)にこの主成分ローディングを図4(a)の波形データに適用して得られた各波形毎の主成分スコアTmiの一覧を示した。
 図4(d)に図4(a)のm個の波形データから主成分回帰分析又はPLS回帰分析により得られた各サンプリング時刻毎の回帰ベクトルbnの一覧を示し、図4(e)にこの回帰ベクトルbnを図4(a)の波形データに適用して得られた各波形毎の予測値ymの一覧を示した。
 波形データ分析部40Aで複数の波形データに行う多変量解析は、主成分分析、主成分回帰分析又はPLS回帰分析がある。
 主成分分析は、多変量波形データの特徴を少ない次元数で抽出する解析手法である。この主成分分析では、複数の既知サンプルの波形データから係数ベクトルとして主成分ローディングを求め、特徴量として主成分スコアを求める。そして、得られた主成分ローディングを未知サンプルの波形データに適用して当該未知サンプルの波形データの特徴量である主成分スコアを求める。その計算は、特異値分解による行列分解、あるいはNIPALS(Nonlinear Iterative Partial Least-Squares)による反復計算を用いて行うことができる。例えば、第1主成分は、変数をn個もつm個の波形データの相互間の最もばらつきの大きい第1情報を抽出する成分であり、第2主成分は、変数をn個もつm個の波形データから第1主成分を差し引いた残りの情報から、m個の波形データの相互間の最もばらつきの大きい第2情報を抽出する成分である。NIPALSによる主成分分析手法としては、全ての主成分を求めなくても、例えば、第2主成分までを求めることで十分な場合がある。また、吉村らにより、Microsoft Excelの基本機能を用い、NIPALSアルゴリズムによる主成分分析の適用が可能であることが示されている(N. Yoshimura, K. Fukuhara, K. Mitsuki, M. Takayanagi, J. Comput. Chem. Jpn., 10, 32-43 (2011))。
 主成分回帰分析は、主成分分析と同様に、複数の既知サンプルの波形データから主成分ローディング及び主成分スコアを求めるが、それぞれは係数ベクトル及び特徴量ではない。主成分回帰分析では、既知のOKサンプルと既知のNGサンプルの波形データに「1」と「2」といった目的変数である異なった疑似変数を特徴量として与え、それら既知サンプルの波形データから求めた主成分ローディングと主成分スコアと上記疑似変数を用いて係数ベクトルとして回帰ベクトルを求める。そして、得られた回帰ベクトルを未知サンプルの波形データに適用して当該未知サンプルの波形データの特徴量として疑似変数に対する予測値を求める。吉村らにより、Microsoft Excelの基本機能を用い、NIPALSアルゴリズムにより得られた主成分スコアによる主成分回帰分析の計算手順が示されている(N. Yoshimura, K. Fukuhara, K. Mitsuki, M. Takayanagi, J. Comput. Chem. Jpn., 10, 32-43 (2011))。
 PLS回帰分析のPLSはPartial Least-Squares(部分最小二乗)であり、このPLS回帰分析は主成分回帰分析とは異なる。PLS回帰分析では、既知のOKサンプルと既知のNGサンプルの各既知サンプルの波形データに対応する特徴量としての「1」と「2」といった目的変数である異なった疑似変数を特徴量として与え、波形データと疑似変数から最小二乗法を適用して重みを求め、波形データと重みからスコアを求め、波形データとスコア及び疑似変数とスコアから最小二乗法を適用してそれぞれのローディングを求め、それら重みとスコア又はローディングから係数ベクトルとして説明変数である回帰ベクトルを求める。そして、得られた回帰ベクトルを未知サンプルの波形データに適用して当該未知サンプルの波形データの特徴量として疑似変数に対する予測値を求める。吉村らにより、Microsoft Excelの基本機能を用いたPLS回帰分析の計算手順が示されている(N. Yoshimura, M. Takayanagi, J. Comput. Chem. Jpn., 13, 139-154 (2014))。
 以上の主成分分析、主成分回帰分析又はPLS回帰分析では、適用する波形データに対して、移動平均処理、微分処理(一次、二次、三次、四次)、MSC(Multiplicative Scatter Correction)処理、SNV(Standard Normal Variate)処理等の波形データ変換処理による補正を予め加えることで、判別精度を向上させることができる場合がある。
<第1実施例(主成分分析)>
 本実施例では、主成分分析について説明する。図5は、顆粒薬を封入したアルミ包装を図22のアルミブリスターシート11に代えて添付文書12とともに包装箱13に同梱した市販薬についての波形データを示す。図5(a)は“添付文書なし”の30個分の既知サンプル(NG既知サンプル)の波形データ、図5(b)は“添付文書あり(1枚)”の30個分の既知のサンプル(OK既知サンプル)の波形データである。この図5の既知サンプルの波形に基づいて主成分分析を行ない、判別モデルを作成する場合について説明する。
 図5(a)の“添付文書なし”30サンプルのグループと(b)の“添付文書あり(1枚)”の30サンプルのグループの全体に対し、第1主成分ローディング、第2主成分ローディングを求めてから、それら第1主成分ローディング、第2主成分ローディングを元の既知サンプルの各波形データのサンプリング電圧に適用することで各波形データについて第1主成分スコア、第2主成分スコアを求め、それら第1主成分スコア、第2主成分スコアの値をスポットとしてマッピングすると、図6に示すような散布図を作成することができる。
 例えば、波形データ1についての第1主成分スコアT11、第2主成分T12は、
Figure JPOXMLDOC01-appb-I000001
となり、散布図のスポットがこの第1主成分スコアT11、第2主成分T12で決まる位置となる。なお、X11~X1nは図4(a)で説明した波形データ1の時刻t1~tnのサンプリング電圧、V11~Vn1は図4(b)で説明した時刻t1~tnの第1主成分ローディング、V12~Vn2は図4(b)で説明した時刻t1~tnの第2主成分ローディングである。
 図6において、●印は“添付文書なし”のスポット、○印は“添付文書あり(1枚)”のスポットを示す。aは“添付文書なし”のグループのスポットの平均値から求めた中心点、bは“添付文書あり(1枚)”のグループのスポットの平均値から求めた中心点である。この2つのグループの中心点a、bを接続するライン上の中央点cを通るように、そのラインに直交するラインL1を作成すると、そのラインL1は“添付文書あり(1枚)”のグループと“添付文書なし”のグループを分ける判別指標(閾値)となる。図6の判別モデルでは、第2主成分スコアによっては判別できず、もっぱら第1主成分スコアによって判別指標が決定されていることがわかる。
 ここで、波形データについて第1主成分スコアがもつ特徴的な情報を調べるため、60個の既知サンプルの波形データについて第1主成分スコアを求め、その第1主成分スコアと60個の既知サンプルの波形最大値や波形面積との相関係数を調べた。この相関係数Rは、
Figure JPOXMLDOC01-appb-I000002
で求めることができる。ここで、Aは第1主成分スコア、Bは波形最大値の統計量あるいは波形面積の統計量であり、σABはA,Bの共分散、σAはAの標準偏差、σBはBの標準偏差である。
 第1主成分スコアと波形最大値の関係については、第1主成スコアの標準偏差がσA=4.9597、波形最大値の標準偏差がσB=0.4937、両者の共分散がσAB=2.3448であったので、それらを式(2)に当てはめると、相関係数はR=0.958となった。
 また、第1主成分スコアと波形面積の関係については、第1主成スコアの標準偏差がσA=4.9597、波形面積の標準偏差がσB=61.1419、両者の共分散がσAB=302.7291であったので、それらの相関係数はR=0.998となった。
 以上の結果、第1主成分スコアの値は、波形最大値や波形面積と大きな相関をもつことが判明した。図7(a)、(b)、(c)は上記した60個の既知サンプルの例についての第1主成分スコア、波形最大値、波形面積を棒グラフで表したものであり、これを見ても、(a)に示す第1主成分スコアに対して(b)に示す波形最大値と(c)に示す波形面積が大きな相関を持つことが分かる。
 このことから、上記の例については、第1主成分スコアのみでも有効な判別指標を設定することができることが判明した。なお、SVM(Support Vector Machine)を用い、既知サンプルの波形データの分布から、2つのグループそれぞれの中心点を用いない直線状(超平面)の閾値や、曲線状の閾値を判別指標にすることもできる。
 図8に前記した既知サンプルと同種の未知サンプルとしてのサンプリング電圧の波形データを示す。つまり、この未知サンプルは既知サンプルであるが検証のために使用する。(a)は“添付文書なし”の30サンプル分の波形データ、(b)は“添付文書あり(1枚)”の30サンプル分の波形データである。ここでは、未知サンプルの個々の波形データに対して、図6の判別モデルを作成する際に求めた第1主成分ローディングを適用して第1主成分スコアを計算し、第2主成分ローディングを適用して第2主成分スコアを計算する。
 Sを未知サンプルの波形データとして、その時刻t1,t2,t3・・・tnのサンプリング電圧をS1,S2,S3,・・・Snとすると、第1主成分スコアTs1と第2主成分スコアTs2は、
Figure JPOXMLDOC01-appb-I000003
となる。なお、V11~Vn1は図4(b)で説明した時刻t1~tnの第1主成分ローディング、V12~Vn2は図4(b)で説明した時刻t1~tnの第2主成分ローディングであり、は判別モデル作成時に使用したものである。
 図9は、このようにして未知サンプルの波形データの第1主成分スコアと第2主成分スコアにより特定されたスポットを、図6で得られた判別モデルに適用したものである。未知サンプルの内の×印で示した波形データは“添付文書なし”のグループに含まれている。また、+印で示した波形データは“添付文書あり(1枚)”のグループに含まれている。このように、図6で得られた判別モデルを判別指標(閾値)として使用することにより、同種の未知サンプルについて、その中の添付文書の有無を判別することができる。
<第2実施例(主成分分析)>
 図10に、顆粒薬を封入したアルミ包装を図22のアルミブリスターシート11に代えて添付文書12とともに包装箱13に同梱した市販薬についての全75サンプルの波形データを示す。この波形データは、“添付文書なし”の既知サンプル(NG既知サンプル)、“添付文書あり(1枚)”の既知サンプル(OK既知サンプル)、“添付文書あり(2枚)の既知サンプル”(NG既知サンプル)を、それぞれ25サンプルについて計測したデータである。“添付文書あり(2枚)”の既知サンプルの波形データの形状が特異なのは、添付文書の設置位置による導電体(アルミ包装)の傾きの違いによるものと思われる。これらの各25個のうちのそれぞれ13個の波形データの最大波形値は、図11に示すように、“添付文書なし”のグループの方が、“添付文書あり(1枚)”や“添付文書あり(2枚)”よりも大きな値を示し、“添付文書あり(1枚)”を“添付文書なし”と“添付文書あり(2枚)”から区別することができない。
 そこで、本実施例では、“添付文書なし”、“添付文書あり(1枚)”、“添付文書あり(2枚)”のそれぞれ13サンプルの波形データを対象として主成分分析を行って、各波形データについて第1主成分スコアと第2主成分スコアを算出して判別モデルを作成した。図12はそれをプロットした図であり、“添付文書なし”のグループG1、“添付文書あり(1枚)”のグループG2、“添付文書あり(2枚)”のグループG3に分離することができた。ここでも第1主成分スコアにより3種にそのグループ分けができている。
 そして、同種の未知サンプルとしてのそれぞれ12個の波形データを取り込んで、図12の判別モデルを作成する際に使用した第1主成分ローディングと第2主成分ローディングを用いて第1主成分スコアと第2主成分スコアを計算すると、グループG1内に×印で示す未知サンプルの波形データが集まり、グループG2内に+印で示す未知サンプルの波形データが集まり、グループG3内に*印で示す未知サンプルの波形データが集まった。×印で示す波形データは“添付文書なし”、+印で示す波形データは“添付文書あり(1枚)”、*印で示す波形データは“添付文書あり(2枚)”であり、いずれも既知サンプルを未知サンプルとして扱ったものである。
<第3実施例(主成分分析)>
 図13に、図22で説明したアルミブリスターシート11を添付文書12とともに包装箱13に同梱した市販薬についての全50サンプルの波形データを示す。この波形データは、“添付文書なし”の25個の既知サンプル(NG既知サンプル)、“添付文書あり(1枚)”の25個の既知サンプル(OK既知サンプル)について計測したデータである。波形データには、頂部に凹凸が生じているが、アルミブリスタシートのへこみによるものと考えられる。添付文書12が存在することによって、凸のピーク形状が緩やかになるため、添付文書の有無によって変化する最大値や波形面積といった波形データの特徴的な情報に、波形データの傾きを加えることができれば、添付文書の有無についての判別精度の向上が見込まれる。これらの波形データの判別モデルを作成するためのNG既知サンプル、OK既知サンプルの内から選んだそれぞれ13サンプルの最大波形値は、図14に示すように、“添付文書なし”のグループは、“添付文書あり(1枚)”のグループよりも大きな値を示している。
 そこで、これら既知サンプルの“添付文書なし”、“添付文書あり(1枚)”の波形データを対象として主成分分析を行って、各波形データについて第1主成分スコアと第2主成分スコアを算出した。図15は既知サンプルの第1主成分スコアと第2主成分スコアで作成した判別モデルに、未知サンプルの第1主成分スコアと第2主成分スコアで決まる点をプロットした図であり、“添付文書なし”のグループ、“添付文書あり(1枚)”のグループを分離することができた。ここでは、2つのグループを第1主成分スコアによっても、また第2主成分スコアによっても分離することができた。したがって、第2主成分スコアのみよっても判別が可能であることが分かる。×印で示す波形データは“添付文書なし”、+印で示す波形データは“添付文書あり(1枚)”であり、いずれも既知サンプルを未知サンプルとして扱ったものである。
 本実施例の波形データについては、第1主成分スコアは、波形最大値との相関係数がR=0.995、波形面積との相関係数がR=0.9999であることがわかった。また、第2主成分スコアは、“添付文書なし”、“添付文書あり(1枚)”のそれぞれ13個分の既知サンプルの13サンプルの平均波形データの傾き(一次微分値)から算出した第2主成分スコアとの相関係数がR=0.995を示した。この第2主成分スコアは、波形最大値との相関係数がR=0.93、波形面積との相関係数もR=0.93であることがわかった。
 図16に第2主成分ローディングについて示す。P1は“添付文書なし”、“添付文書あり(1枚)”のそれぞれ13個分の既知サンプルの波形データの平均波形データ、P2は“添付文書なし”、“添付文書あり(1枚)”のそれぞれ13個分の既知サンプルの波形データの第2主成分ローディング、P3は波形データP1の1次微分値(傾き)を示す。第2主成分ローディングP2は、平均波形データP1の傾きP3と大きな相関があることを示している。このことから、添付文書の有無によって変化する波形データの波形最大値、波形面積に、傾きの情報を含めて判別することが可能になり、判別精度が向上すると考えられる。
<第4実施例(主成分回帰分析)>
 本実施例では、主成分回帰分析により判別を行う。主成分回帰分析では、波形データ分析部40AにおいてNG既知サンプル、OK既知サンプルの波形データに対して特徴量としてぞれぞれ「1」と「2」という目的変数である疑似変数を与えて、係数ベクトルとして回帰ベクトルを求める。この主成分回帰分析における回帰ベクトルは、前記したように既知サンプルの波形データから得られた主成分ローディングと主成分スコアと疑似変数から求められる。主成分回帰分析では、得られた回帰ベクトルを各波形データに適用することにより、特徴量である予測値を演算する。
 主成分回帰分析では、既知サンプルの波形データmのサンプリング値Xm1,Xm2,Xm3,・・・,Xmnから予測値ymを求めるために演算した回帰ベクトルb1、b2,b3,・・・,bnが、未知サンプルの波形データSの予測値ysを求めるための図4(d)で説明した回帰ベクトルとして使用される。よって、S1,S2,S3,・・・,Snを時刻t1,t2,t3,・・・,tnの未知サンプルの波形データSのサンプリング値とすると、
Figure JPOXMLDOC01-appb-I000004
となる。図17は図13の波形データを対象として主成分回帰分析を行う際に与えた疑似変数と主成分回帰分析で得られた予測値を示す図であり、与えた疑似変数「1」と「2」の中心である「1.5」を閾値として、“添付文書なし”のグループ、“添付文書あり(1枚)”のグループを明確に分離できている。×印で示す波形データは“添付文書なし”、+印で示す波形データは“添付文書あり(1枚)”であり、いずれも既知サンプルを未知サンプルとして扱ったものである。
<第5実施例(主成分回帰分析)>
 図18に、図22で説明したアルミブリスタシート11を添付文書12と共に包装箱13に封入した市販薬の全100の既知サンプル及び未知サンプルの波形データを示すが、この波形データでは、“添付文書なし”のグループ、“添付文書あり(1枚)”のグループの波形面積に大きな違いがみられない。図19に、図18の“添付文書なし”のグループ、“添付文書あり(1枚)”のグループの既知サンプルとして判別モデルを作成するための、それぞれ25サンプルの波形最大値を示すが、この図19においても、波形最大値がオーバーラップする可能性が高い。したがって、図18に示した波形データには、主成分分析を適用しても“添付文書なし”のグループ、“添付文書あり(1枚)”のグループを、第1主成分スコアや第2主成分スコアにより分離することが難しい。
 そこで本実施例では、このように主成分分析による分離が難しい波形データに、一次微分処理によるデータ変換を行ってから、変換後の波形データに主成分回帰分析を適用する。NG既知サンプル、OK既知サンプルの変換波形データに対して特徴量としてぞれぞれ「1」と「2」という目的変数である疑似変数を与えて回帰ベクトルを求め、得られた回帰ベクトルを適用して予測値を求めることにより、図20に示すように、“添付文書なし”のグループ、“添付文書あり(1枚)”のグループを分離することができた。×印で示す波形データは“添付文書なし”、+印で示す波形データは“添付文書あり(1枚)”であり、いずれも既知サンプルを未知サンプルとして扱ったものである。
<第6実施例(PLS回帰分析)>
 本実施例では、図18の波形データに一次微分処理を行ってから、NG既知サンプル、OK既知サンプルの変換波形データに対して特徴量としてぞれぞれ「1」と「2」という目的変数である疑似変数を与え、PLS回帰分析を適用した。図21に示すように、主成分回帰分析による判別結果と同様に、“添付文書なし”のグループ、“添付文書あり(1枚)”のグループを分離することができた。×印で示す波形データは“添付文書なし”、+印で示す波形データは“添付文書あり(1枚)”であり、いずれも既知サンプルを未知サンプルとして扱ったものである。係数ベクトルとして回帰ベクト
ルを求める計算手順は、主成分回帰分析における回帰ベクトルを求める計算手順と異なるが、特徴量である予測値は式(4)と同様に求められる。以上から、波形データの波形の形状に起因して主成分分析での判別が難しい場合は、一次微分等の波形変換処理を行ってから主成分回帰分析やPLS回帰分析を用いることが有効であることが分かった。
<その他の実施例>
 以上では、医薬品10について、“添付文書なし”、“添付文書あり(1枚)”、“添付文書あり(2枚)”等の内から“添付文書あり(1枚)”をOK判別とし、それ以外をNG判別とする実施例について説明したが、本発明が適用できる判別対象はこれに限られるものではない。例えば、心電図等の波形データ、その他の波形データについても、同様の処理を行うことにより、それらの波形データから所望の特徴的な情報を取得することができる。また、波形データを生成するセンサとしては、交流磁界を使用する磁界センサの他に、超音波、赤外線、X線等を使用するセンサを使用することもできる。また、第4乃至第6実施例において、主成分回帰分析やPLS回帰分析による波形分析の実施例を示したが、波形データの特徴的な形状を用いる場合は、重回帰分析であってもよい。
 10:医薬品、11:アルミブリスターシート、12:添付文書、13:包装箱
 20:搬送ベルト
 30:磁界センサ
 40A:波形データ分析部、40B:特徴量演算部
 50:判別モデル作成部
 60:判別部
 70:出力部

Claims (16)

  1.  特徴が既知の同種のm個(mは正の整数)の既知サンプルの波形データを取り込み多変量解析により前記波形データのn個(nは正の整数)の変数についての係数ベクトルと前記既知サンプルの特徴量を求める波形データ分析部と、
     該波形データ分析部で得られた前記既知サンプルの特徴量に基づいて判別モデルを作成する判別モデル作成部と、
     前記既知サンプルと同種で特徴が未知の未知サンプルの波形データを取り込み前記波形データ分析部で得られた前記係数ベクトルを用いて前記未知サンプルの特徴量を演算する特徴量演算部と、
     該特徴量演算部で得られた前記未知サンプルの特徴量を前記判別モデルと比較することで前記未知サンプルが所望の特徴を持つサンプルか否かを判別する判別部と、
     を備えることを特徴とする判別装置。
  2.  請求項1に記載の判別装置において、
     前記既知サンプルには、内容物がOKのOK既知サンプルと内容物がNGのNG既知サンプルが含まれ、
     前記判別モデルは、前記OK既知サンプルの特徴量が含まれるOKグループと前記NG既知サンプルの特徴量が含まれるNGグループに分けられるように作成され、
     前記判別部は、前記未知サンプルの特徴量が前記OKグループと前記NGグループのいずれに含まれるかを判別する、
     ことを特徴とする判別装置。
  3.  請求項1又は2に記載の判別装置において、
     前記波形データは、共通の時間間隔で共通の回数だけ時系列でサンプリングされたn個のサンプリング電圧で形成されたデータであり、
     前記係数ベクトルと前記特徴量は、前記サンプリング電圧を前記変数とし前記波形データを個体とする多変量データを対象として求められることを特徴とする判別装置。
  4.  請求項1、2又は3に記載の判別装置において、
     前記波形データ分析部は、前記多変量解析を主成分分析で行い、該主成分分析では前記既知サンプルの波形データから前記係数ベクトルとしての主成分ローディングを求め、該主成分ローディングと前記既知サンプルの波形データから前記特徴量としての主成分スコアを求め、
     前記判別モデル作成部は、前記波形データ分析部で得られた前記既知サンプルの主成分スコアに基づいて判別モデルを作成し、
     前記特徴量演算部は、前記波形データ分析部で得られた前記主成分ローディングと前記未知サンプルの波形データから前記未知サンプルの主成分スコアを求めることを特徴とする判別装置。
  5.  請求項2又は3に記載の判別装置において、
     前記波形データ分析部は、前記多変量解析を主成分回帰分析で行い、該主成分回帰分析では、前記特徴量として、前記OK既知サンプルの波形データと前記NG既知サンプルの波形データに特徴量として異なった疑似変数を与え、前記OK既知サンプルの波形データと前記NG既知サンプルの波形データから求めた主成分ローディング及び主成分スコアと前記疑似変数から係数ベクトルとして回帰ベクトルを求め、
     前記判別モデル作成部は、前記波形データ分析部で得られた前記疑似変数に基づいて判別モデルを作成し、
     前記特徴量演算部は、前記波形データ分析部で得られた前記回帰ベクトルと前記未知サンプルの波形データから前記未知サンプルの波形データの予測値を求め、
     前記判別部は、前記判別モデルと前記未知サンプルの予測値を比較することを特徴とする判別装置。
  6.  請求項2又は3に記載の判別装置において、
     前記波形データ分析部は、前記多変量解析をPLS回帰分析で行い、該PLS回帰分析では、前記OK既知サンプルの波形データと前記NG既知サンプルの波形データに特徴量として異なった疑似変数とともに重み与え、該重みから得られるスコア及びローディングと前記疑似変数を用いて回帰ベクトルを求め、
     前記判別モデル作成部は、前記波形データ分析部で得られた前記疑似変数に基づいて判別モデルを作成し、
     前記特徴量演算部は、前記波形データ分析部で得られた前記回帰ベクトルと前記未知サンプルの波形データから前記未知サンプル波形データの予測値を求め、
     前記判別部は、前記判別モデルと前記未知サンプルの予測値を比較することを特徴とする判別装置。
  7.  請求項1乃至6のいずれか1つに記載の判別装置において、
     前記波形データは、移動平均、微分、MSC、SNV等のデータ変換処理を予め加えて補正したデータであることを特徴とする判別装置。
  8.  請求項1乃至7のいずれか1つに記載の判別装置において、
     前記既知サンプル及び前記未知サンプルの波形データは、第1封入物とは別種の第2封入物が所定数だけ同封されるべき包装箱に対して、交流磁界、超音波、赤外線、X線等を照射して得られた電圧の波形データであることを特徴とする判別装置。
  9.  特徴が既知の同種のm個(mは正の整数)の既知サンプルの波形データを取り込み多変量解析により前記波形データのn個(nは正の整数)の変数についての係数ベクトルと前記既知サンプルの特徴量を求める第1ステップと、
     該第1ステップで得られた前記既知サンプルの特徴量に基づいて判別モデルを作成する第2ステップと、
     前記既知サンプルと同種で特徴が未知の未知サンプルの波形データを取り込み前記第1ステップで得られた前記係数ベクトルを用いて前記未知サンプルの特徴量を演算する第3ステップと、
     該第3ステップで得られた前記未知サンプルの特徴量を前記判別モデルと比較することで前記未知サンプルが所望の特徴を持つサンプルか否かを判別する第4ステップと、
     を備えることを特徴とする判別方法。
  10.  請求項9に記載の判別方法において、
     前記既知サンプルには、内容物がOKのOK既知サンプルと内容物がNGのNG既知サンプルが含まれ、
     前記判別モデルは、前記OK既知サンプルの特徴量が含まれるOKグループと前記NG既知サンプルの特徴量が含まれるNGグループに分けられるように作成され、
     前記第4ステップは、前記未知サンプルの特徴量が前記OKグループと前記NGグループのいずれに含まれるかを判別する、
     ことを特徴とする判別方法。
  11.  請求項9又は10に記載の判別方法において、
     前記波形データは、共通の時間間隔で共通の回数だけ時系列でサンプリングされたn個のサンプリング電圧で形成されたデータであり、
     前記係数ベクトルと前記特徴量は、前記サンプリング電圧を前記変数とし前記波形データを個体とする多変量データを対象として求められることを特徴とする判別方法。
  12.  請求項10又は11に記載の判別方法において、
     前記第1ステップは、前記多変量解析を主成分分析で行い、該主成分分析では前記既知サンプルの波形データから前記係数ベクトルとしての主成分ローディングを求め、該主成分ローディングと前記既知サンプルの波形データから前記特徴量としての主成分スコアを求め、
     前記第2ステップは、前記第1ステップで得られた前記既知サンプルの主成分スコアに基づいて判別モデルを作成し、
     前記第3ステップは、前記第1ステップで得られた前記主成分ローディングと前記未知サンプルの波形データから前記未知サンプルの主成分スコアを求めることを特徴とする判別方法。
  13.  請求項10又は11に記載の判別方法において、
     前記第1ステップは、前記多変量解析を主成分回帰分析で行い、該主成分回帰分析では、前記特徴量として、前記OK既知サンプルの波形データと前記NG既知サンプルの波形データに特徴量として異なった疑似変数を与え、前記OK既知サンプルの波形データと前記NG既知サンプルの波形データから求めた主成分ローディング及び主成分スコアと前記疑似変数から係数ベクトルとして回帰ベクトルを求め、
     前記第2ステップは、前記第1ステップで用いた前記疑似変数に基づいて判別モデルを作成し、
     前記第3ステップは、前記第1ステップで得られた前記回帰ベクトルと前記未知サンプルの波形データから前記未知サンプル波形データの予測値を求め、
     前記第4ステップは、前記判別モデルと前記未知サンプルの予測値を比較することを特徴とする判別方法。
  14.  請求項10又は11に記載の判別方法において、
     前記第1ステップは、前記多変量解析をPLS回帰分析で行い、該PLS回帰分析では、前記OK既知サンプルの波形データと前記NG既知サンプルの波形データに特徴量として異なった疑似変数とともに重み与え、該重みから得られるスコア及びローディングと前記疑似変数を用いて回帰ベクトルを求め、
     前記第2ステップは、前記第1ステップで得られた前記疑似変数に基づいて判別モデルを作成し、
     前記第3ステップは、前記第1ステップで得られた前記回帰ベクトルと前記未知サンプルの波形データから前記未知サンプル波形データの予測値を求め、
     前記第4ステップは、前記判別モデルと前記未知サンプルの予測値を比較することを特徴とする判別方法。
  15.  請求項9乃至14のいずれか1つに記載の判別方法において、
     前記波形データは、移動平均、微分、MSC、SNV等のデータ変換処理を予め加えて補正したデータであることを特徴とする判別方法。
  16.  請求項9乃至15のいずれか1つに記載の判別方法において、
     前記既知サンプル及び前記未知サンプルの波形データは、第1封入物とは別種の第2封入物が所定数だけ同封されるべき包装箱に対して、交流磁界、超音波、赤外線、X線等を照射して得られた電圧の波形データであることを特徴とする判別方法。

     
PCT/JP2017/023358 2017-06-26 2017-06-26 判別装置及び判別方法 WO2019003262A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/023358 WO2019003262A1 (ja) 2017-06-26 2017-06-26 判別装置及び判別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/023358 WO2019003262A1 (ja) 2017-06-26 2017-06-26 判別装置及び判別方法

Publications (1)

Publication Number Publication Date
WO2019003262A1 true WO2019003262A1 (ja) 2019-01-03

Family

ID=64740481

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/023358 WO2019003262A1 (ja) 2017-06-26 2017-06-26 判別装置及び判別方法

Country Status (1)

Country Link
WO (1) WO2019003262A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6725928B1 (ja) * 2020-02-13 2020-07-22 東洋インキScホールディングス株式会社 回帰モデル作成方法、回帰モデル作成装置、及び、回帰モデル作成プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000241368A (ja) * 1999-02-23 2000-09-08 Stabic:Kk X線検査装置
JP2008071270A (ja) * 2006-09-15 2008-03-27 Omron Corp プロセス異常分析装置およびプロセス異常分析方法並びにプログラム
JP2009187175A (ja) * 2008-02-05 2009-08-20 Fuji Electric Systems Co Ltd バッチプロセスデータの解析装置およびそれを用いた異常検出/品質推定装置
JP2010071821A (ja) * 2008-09-18 2010-04-02 Tok Engineering Kk 印刷物の判別装置
JP2012163433A (ja) * 2011-02-07 2012-08-30 Kureyon Co Ltd 磁界反射型センサ、包装箱内の添付書面有無検査装置、および、導電性膜の厚さ測定装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000241368A (ja) * 1999-02-23 2000-09-08 Stabic:Kk X線検査装置
JP2008071270A (ja) * 2006-09-15 2008-03-27 Omron Corp プロセス異常分析装置およびプロセス異常分析方法並びにプログラム
JP2009187175A (ja) * 2008-02-05 2009-08-20 Fuji Electric Systems Co Ltd バッチプロセスデータの解析装置およびそれを用いた異常検出/品質推定装置
JP2010071821A (ja) * 2008-09-18 2010-04-02 Tok Engineering Kk 印刷物の判別装置
JP2012163433A (ja) * 2011-02-07 2012-08-30 Kureyon Co Ltd 磁界反射型センサ、包装箱内の添付書面有無検査装置、および、導電性膜の厚さ測定装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6725928B1 (ja) * 2020-02-13 2020-07-22 東洋インキScホールディングス株式会社 回帰モデル作成方法、回帰モデル作成装置、及び、回帰モデル作成プログラム
WO2021162033A1 (ja) * 2020-02-13 2021-08-19 東洋インキScホールディングス株式会社 回帰モデル作成方法、回帰モデル作成装置、及び、回帰モデル作成プログラム
JP2021128042A (ja) * 2020-02-13 2021-09-02 東洋インキScホールディングス株式会社 回帰モデル作成方法、回帰モデル作成装置、及び、回帰モデル作成プログラム

Similar Documents

Publication Publication Date Title
US7756248B2 (en) X-ray detection in packaging
KR100785136B1 (ko) 육류 성질의 비침습적 측정을 위한 방법
US9945714B1 (en) Method of determining the mass of objects from a plurality of X-ray images taken at different energy level
WO2008001785A1 (en) Specimen inspecting apparatus, and specimen inspecting method
US8447562B2 (en) Inspection apparatus and method using penetrating radiation
US10435192B2 (en) Multiple inspection system and method that inspects different medications
JP2011089920A (ja) X線検査方法、及び該x線検査方法を用いたx線検査装置
AU2001267945A1 (en) A method for the non-invasive measurement of properties of meat
US20080317311A1 (en) Coherent Scatter Imaging
WO2007049305A1 (en) A method and an apparatus for quantifying the material composition of an object
WO2019003262A1 (ja) 判別装置及び判別方法
De Maesschalck et al. Implementation of a simple semi-quantitative near-infrared method for the classification of clinical trial tablets
JP5356184B2 (ja) 物品検査装置
Rao et al. Rapid, non-destructive inspection and classification of inhalation blisters using low-energy x-ray imaging
JP4523958B2 (ja) 蛍光x線分析装置およびそれに用いるプログラム
US20070253532A1 (en) Coherent Scatter Imaging
JPH06300689A (ja) 透過法による青果物の内部品質測定法
US20200386679A1 (en) Method and Device for Determining a Finished Medicinal Product
US20240219327A1 (en) Method for measuring the detection sensitivity of an x-ray device
JP7406220B2 (ja) X線検査装置
WO2020259368A1 (zh) 物品剂量分布检测方法及装置
JP5660831B2 (ja) アルミニウム合金の材質判定方法
JP6878198B2 (ja) 個体識別装置、個体識別方法及びプログラム
Shashishekhar et al. Application of dual-energy x-ray techniques for automated food container inspection
JP2006105716A (ja) 品質検査システム

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

NENP Non-entry into the national phase

Ref country code: JP

122 Ep: pct application non-entry in european phase

Ref document number: 17915564

Country of ref document: EP

Kind code of ref document: A1