TW201314205A - 聚集資料之類似性評價方法、類似性評價程式,以及類似性評價裝置 - Google Patents

聚集資料之類似性評價方法、類似性評價程式,以及類似性評價裝置 Download PDF

Info

Publication number
TW201314205A
TW201314205A TW101119805A TW101119805A TW201314205A TW 201314205 A TW201314205 A TW 201314205A TW 101119805 A TW101119805 A TW 101119805A TW 101119805 A TW101119805 A TW 101119805A TW 201314205 A TW201314205 A TW 201314205A
Authority
TW
Taiwan
Prior art keywords
similarity
aggregated
data
coincidence
peaks
Prior art date
Application number
TW101119805A
Other languages
English (en)
Other versions
TWI521203B (zh
Inventor
Yoshikazu Mori
Keiichi Noda
Original Assignee
Tsumura & Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsumura & Co filed Critical Tsumura & Co
Publication of TW201314205A publication Critical patent/TW201314205A/zh
Application granted granted Critical
Publication of TWI521203B publication Critical patent/TWI521203B/zh

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8686Fingerprinting, e.g. without prior knowledge of the sample components
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/15Medicinal preparations ; Physical properties thereof, e.g. dissolubility
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/74Optical detectors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8679Target compound analysis, i.e. whereby a limited number of peaks is analysed
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8693Models, e.g. prediction of retention times, method development and validation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/14Classification; Matching by matching peak patterns
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Library & Information Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本發明課題在於有助於提升評價的精確度及效率。解決手段為一種評價由複數個聚集資料聚集而成之聚集資料相互的類似性之聚集資料的類似性評價裝置1,其特徵為具備:圖案化部3,將各聚集資料的各資料以選擇的尺度圖案化;一致數抽出部5,以循環方式比較圖案化的各資料而求取一致數;以及一致度判定部7,基於所求取的一致數,利用Tanimoto係數求取一致度,該裝置可簡易且迅速地評價聚集資料的類似性。

Description

聚集資料之類似性評價方法、類似性評價程式,以及類似性評價 裝置
本發明係關於圖案的評價方法、用以進行多成分物質例如屬於多成分藥劑之中藥的品質評價之多成分物質的評價方法、評價程式、以及評價裝置。
作為多成分物質,有例如屬於由多成分構成的藥劑(以下,稱為多成分藥劑)的中藥等來自天然物的藥劑。此等藥劑的定量,定性的概況(profile)會因所使用之原料生藥的地質學的因素、生態學的因素、收集時期、收集場所、收集年代、生育期之天候等的關係而變化。
因此,就針對此等多成分藥劑等用以擔保其安全性及有效性的品質而言,有規定一定的基準,國家的監督機構,化學組織團體,製造業者等係依該基準來進行品質評價。
然而,多成分藥劑之品質等的判定基準,一般是選擇多成分藥劑中具特徴的一種成份或數種成份,並依據其含有量等來設定。
例如,在非專利文獻1中,當無法進行多成分藥劑中有效成份的鑑定時,選擇具有可進行定量分析、易溶於水、在熱水中不會分解、不會與其他成份進行化學反應等物性的複數成份,且以可藉由化學分析獲得之該等成份的含有量作為評價的基準。
又,亦已知有於多成分藥劑適用層析法,按各保持時間獲得紫外可見光吸收光譜,由其中一部分的成份資訊設定評價的基準。
例如,專利文獻1中,選擇HPLC層析圖‧資料中一部分的峰值,藉由條碼化來評價多成分藥劑。
然而,就此等方法而言,其評價的對象受限於「特定成份的含有量」或「特定成份的層析峰值」,僅只是多成分藥劑所含的成份當中的一部分成為評價對象。因此,就多成分藥劑而言,由於其存有多數成為評價的對象以外的成份,故多成分藥劑的評價方法不夠精確。
為了正確地評價多成分藥劑的品質,必須對網羅有全部峰值資訊或接近數%的瑣細資訊經去除之全部峰值資訊的峰值資訊進行評價,因此,在多成分藥劑間必須使全部峰值或接近全部峰值之數量的峰值對應。
然而,使複數峰值以高精確度有效率地對應有其困難性,這會妨礙多成分藥劑的高精確度且有效率的評價。
進一步說明,即便是相同製品名的多成分藥劑,因為生藥為天然物,所以會有構成成份些微不同的情形。因此,即便是相同品質的藥劑,也會有構成成份的含量比例不同或存在於某藥劑的成份不存在於其他藥劑的情形(以下,稱為藥劑間誤差)。再者,亦有層析的峰值強度或峰值的溶出時間無嚴密再現性(以下,稱為分析誤差)等的因素。藉此,由於無法針對多成分藥劑間的全部峰值或接近全部峰值之個數的峰值,使來自相同成份的峰值對應(以下,稱為峰值歸屬),所以會妨礙高精確度且有效率的評價。
【先前技術文獻】
【專利文獻1】
日本特開2002-214215號公報
【非專利文獻1】 月刊藥事vol. 28, No.3,67-71(1986)
欲解決的問題點為,既有的評價方法對於以高精確度有效率地評價多成分物質的品質等有其限制。
本發明為了有助於提高評價的精確度及效率,而為一種聚集資料之類似性評價方法,係聚集複數資料的聚集資料(例如液相層析(LC)、氣相層析(GC)、核磁共振(NMR)光譜等測定資料(圖譜)、或對其等進行圖案化等加工處理所得的資料)相互之類似性評價方法,其特徵為具備:圖案化製程,將前述各聚集資料的各資料以 選擇的尺度圖案化;一致數抽出製程,以循環方式比較前述圖案化的各資料而求取一致數;以及一致度判定製程,基於前述求取的一致數,利用Tanimoto係數求取一致度。
本發明係一種聚集資料之類似性評價程式,係在電腦達成聚集複數資料之聚集資料相互的類似性評價的類似性評價方法程式,其特徵為在電腦達成:圖案化功能,將前述各聚集資料的各資料以選擇的尺度圖案化;一致數抽出功能,以循環方式比較前述圖案化的各資料而求取一致數;以及一致度判定功能,基於前述求取的一致數,利用Tanimoto係數求取一致度。
本發明係一種聚集資料之類似性評價裝置,係聚集複數資料之聚集資料相互的類似性評價裝置,其特徵為具備:圖案化部,將前述各聚集資料的各資料以選擇的尺度圖案化;一致數抽出部,以循環方式比較前述圖案化的各資料而求取一致數;以及一致度判定部,基於所求取的一致數,利用Tanimoto係數求取一致度。
本發明之聚集資料之類似性評價方法由於為上述構成,可簡易且迅速地評價由複數個聚集資料聚集而成之聚集資料的類似性。
因此,將例如評價對象之多成分物質的對象FP與評價基準之複數藥劑的基準FP比較而評價時,在由複數基準FP選定適於對象FP之峰值歸屬的多成分物質之FP作為其前處理之際,可進行簡易且迅速的選定。
本發明之聚集資料的類似性評價方法程式由於為上述構成,可在電腦達成功能、評價FP的類似性,並簡易且迅速地進行前述基準FP等的選定。
本發明之聚集資料的類似性評價裝置由於為上述構成,可使各部發揮作用,而能夠簡易且迅速地進行前述基準FP等的選定。
茲利用圖案化部、一致數抽出部與一致度判定部來達成所謂有助於提升評價的精確度及效率的目的。
【實施例1】
本發明的實施例1係將聚集資料之類似性評價裝置適用於作為評價多成分物質例如多成分藥劑之多成分的藥劑評價裝置之前處理。
多成分藥劑定義為含有複數有效化學成份的藥劑,但未侷限於此,也包含生藥、生藥的組合、其等的萃取物、中藥等。此外,劑型也未特別限定,例如,可包含以第15改正日本藥局方的製劑總則規定的液劑、浸膏劑、膠囊劑、顆粒劑、丸劑、懸濁劑、乳劑、散劑、酒精劑、錠劑、浸劑‧煎劑、酊劑、片劑、芳香水劑、流浸膏劑等。以多成分物質而言,亦可包含藥劑以外的物質。
中藥的具體例記載於醫療用漢方製劑148處方「使用上的注意」的業界統一與主動修訂(事項)及一般用漢方處方的入門(1978年)。
多成分藥劑的評價裝置為了評價評價對象藥劑是否與判定為正常品的複數藥劑同等,首先係由評價對象藥劑的三維層析圖資料(以下為3D層析圖)作成抽出該藥劑特有之資訊的對象FP。其次,由複數基準FP選定適於對象FP之峰值歸屬的多成分藥劑的FP。使對象FP的各峰值歸屬於該選定的基準FP的峰值。
其後,將如前述所歸屬之對象FP的各峰值歸屬於由全部基準FP進行峰值歸屬處理所作成之全部基準FP的峰值對應資料(以下為基準群FP)。
接著,以MT法評價歸屬為基準群FP之峰值的對象FP的峰值(以下為對象FP歸屬峰值)的同等性。最後比較所得的評價值(以下為MD值)與預先設定的判定值(MD值的上限值),判定評價對象藥劑是否與正常品同等。
此外,3D層析圖係為作為評價對象的多成分物質,即多成分藥劑的HPLC層析圖資料(以下為層析圖),包含UV光譜。
FP係指以特定波長檢測出之峰值的訊號強度(高度)的極大值或面積值(以下為峰值)與該峰值的出現時間(以下為保持時間)所構成的指紋資料。
對象FP係由作為評價對象之中藥的三維層析圖資料,即3D層析圖,抽出特定檢測波長下的多個峰值及其保持時間以及UV光譜。因此,對象FP為聚集作為複數資料之峰值的聚集資料。
基準FP係為作為判定為正常品的多成分物質,即多成分藥劑之中藥的FP,與對象FP同樣地由作為三維層析圖資料的3D層析圖抽出特定檢測波長的複數峰值及其保持時間以及UV光譜者。因此,基準FP亦為聚集作為複數資料之峰值的聚集資料。
〔FP的類似性評價裝置、類似性評價方法〕
第1圖為FP之類似性評價裝置的方塊圖,第2圖為FP之類似性評價方法的製程圖。
如第1圖、第2圖所示,FP的類似性評價裝置1發揮功能而進行之FP的類似性評價方法係探討對象FP及基準FP相互的一致度。
FP的類似性評價裝置1由電腦構成,雖未圖示,惟其具備CPU、ROM、RAM等。FP的類似性評價裝置1係完成安裝於電腦之聚集資料的類似性評價方法程式,可進行對象FP的類似性評價。惟,聚集資料的類似性評價方法程式係使用將其所記錄之聚集資料的類似性評價程式記錄媒體,在由電腦構成的FP的類似性評價裝置1將其讀取,由此亦可達成對象FP的類似性評價。
FP的類似性評價方法具備:圖案化製程S1,係圖案化部3發揮功能所進行;一致數抽出製程S2,係一致數抽出部5發揮功能所進行;以及一致度判定製程S3,係一致度判定部7發揮功能所進行。
該FP的類似性評價方法中,作為前述最終之評價的前處理,係由作為複數聚集資料的基準FP選定適於對象FP之峰值歸屬的多成分藥劑的FP。
透過圖案化部3的功能,圖案化製程S1將作為各聚集資料的對象FP及基準FP之各資料的各峰值以選擇的尺度圖案化。該尺度在 本實施例中係作為峰值的出現距離的保持時間間距。具體將於後述之。
透過一致數抽出部5的功能,一致數抽出製程S2以循環方式比較圖案化的各峰值而求取各圖案間的一致數。該一致數在本實施例中係出現距離的一致數。具體將於後述之。
透過一致度判定部7的功能,一致度判定製程S基於求取的一致數,利用Tanimoto係數求取各圖案間的一致度。
一致度判定製程S3中,藉由將前述Tanimoto係數設為「出現距離的一致數/(對象FP峰值數+基準FP峰值數-出現距離的一致數)」,並使(1-Tanimoto係數)趨近於零來求取前述一致度。
可對該(1-Tanimoto係數)進行(對象FP峰值數-出現距離的一致數+1)的加權,而設為「(1-Tanimoto係數)×(對象FP峰值數-出現距離的一致數+1)」。
藉由該加權,可選擇比對象FP之峰值更多一致之基準FP。
〔FP之類似性評價裝置、類似性評價方法之作動原理〕
第3圖(A)為藥劑A、(B)為藥劑B、(C)為藥劑C之FP。
例如設藥劑A之FP為對象FP,設藥劑B、C之FP為基準FP時,在將對象FP之各峰值歸屬於由藥劑B、C作成之基準群FP前,由複數基準FP選定適於對象FP之歸屬的藥劑B、C任一者之基準FP,而將對象FP的各峰值歸屬於該選定之基準FP的峰值。
即,為了以高精確度進行對象FP之各峰值的峰值歸屬,如第4圖~第9圖所示,在對象FP與基準FP之間算出峰值之保持時間出現圖案的一致度,由全部基準FP選定該一致度最小的基準FP。
第4圖~9圖為對對象FP與基準FP之保持時間出現距離的一致數以及保持時間出現圖案的一致度進行說明的圖。第4圖為表示對象FP及基準FP之保持時間的說明圖、第5圖為表示對象FP之保持時間出現圖案的說明圖、第6圖為表示基準FP之保持時間出現圖案的說明圖。第7圖為表示對象及基準FP之出現距離的一致數的說明圖、第8圖為對象FP與基準FP之全部保持時間出現距離的一致數的說 明圖、第9圖為對象FP與基準FP之全部保持時間出現圖案的一致度的說明圖。
第4圖中表示各對象FP15及基準FP17之保持時間。第5圖、第6圖中表示由各對象FP15及基準FP17之保持時間算出所有的保持時間間距,並將此等距離彙整成表形式的保持時間出現圖案。第7圖中表示對對象FP、基準FP之保持時間出現圖案之各單元的值以各個之列進行比較,計算兩值之差為一定以內的數所算出之保持時間出現距離的一致數。第8圖中表示以對象FP與基準FP間之所有組合算出該保持時間出現距離的一致數,並將此等一致數彙整成表形式之保持時間出現距離的一致數。第9圖中表示基於該一致數而算出保持時間出現圖案的一致度,並將此等一致度彙整成表形式之保持時間出現圖案的一致度。
對象FP15之峰值歸屬處理中,係以FP圖案盡量與對象FP15類似之基準FP來歸屬對象FP15之各峰值。由複數基準FP選定與該對象FP15類似之基準FP,在進行高精確度的歸屬上係為重要的點。
因此,作為客觀且簡易地評價與對象FP15之FP圖案的類似性的方法,係利用保持時間出現圖案的一致度來評價FP圖案的類似性。
例如對象FP15及基準FP17的保持時間為如第4圖所示時,對象FP15及基準FP17各者的保持時間出現圖案便如第5圖、第6圖所示。第5圖、第6圖中係對於上層的對象FP15及基準FP17,如下層之圖表所示,作成為各單元之值係以保持時間間距構成之表形式的圖案。
第5圖中,對象FP15的各峰值(19、21、23、25、27、29、31、33、35、37)的保持時間為(10.2)、(10.5)、(10.8)、(11.1)、(11.6)、(12.1)、(12.8)、(13.1)、(13.6)、(14.0)。
因此,峰值19及峰值21間之保持時間間距為(10.5)-(10.2)=(0.3)。同樣地,峰值19及峰值23間為(0.6)、峰值21及峰值23間為(0.3)等。以下,同樣地為第5圖之下層圖表的對象FP出現圖案。
第6圖中,基準FP17之各峰值(39、41、43、45、47、49、51、53、55、57、59)的保持時間為(10.1)、(10.4)、(10.7)、(11.1)、(11.7)、(12.3)、(12.7)、(13.1)、(13.6)、(14.1)、(14.4)。
因此,同樣地保持時間間距為第6圖之下層圖表的基準FP出現圖案。
如第5圖、第6圖所示,係以循環方式比較圖案化之各峰值而求取一致數。例如,如第7圖所示比較第5圖下層圖表之對象FP出現圖案之各單元的值與第6圖下層圖表之基準FP出現圖案之各單元的值,而如第8圖所示得到一致數。
第7圖中係以列單位依序以循環方式比較根據對象FP15與基準FP17之保持時間出現圖案所有的保持時間間距的圖案,並於設定之範圍內算出距離一致的數。
例如,若比較第7圖之對象及基準FP保持時間出現圖案之各第1列的圖案,則以圓圈包圍的數值呈一致,一致數為7個。該7個一致數係於第8圖之對象及基準FP保持時間出現圖案之第1列寫入保持時間出現距離的一致數。對於第7圖中的其他列亦同樣地以循環方式比較對象FP保持時間出現圖案之1列~9列與基準FP保持時間出現圖案之1列~10列,而分別得到一致數。
結果係示於第8圖。第8圖中,以圓圈包圍之左端的7之數值為比較對象及基準FP保持時間出現圖案之各第1列的結果,其相鄰之7之數值則為比較對象FP保持時間出現圖案之第1列與基準FP保持時間出現圖案之第2列的結果。
此外,並未限定於用以判定出現距離之一致之設定值的範圍,較佳為0.05分鐘~0.2分鐘之範圍。實施例1為0.1分鐘。
如設保持時間出現圖案的一致度為RP時,對象FP15之第f列的保持時間出現圖案與基準FP17之第g列的保持時間出現圖案的一致度(RPfg)係利用Tanimoto係數,以RPfg={1-(m/(a+b-m))}×(a-m+1)之形式算出。
此外,式中a為對象FP15之峰值數(對象FP峰值數)、b為基準FP17之峰值數(基準FP峰值數)、m為保持時間出現距離的一致數(參照第8圖)。
基於第8圖的一致數,利用前述式算出各保持時間出現圖案的一致度(RP)(參照第9圖)。
設作為此等RP之最小值的RP_min為對象FP15與基準FP17之保持時間出現圖案的一致度。第9圖中,(0.50)為對於對象FP15之基準FP的一致度。
對所有基準FP算出該一致度,選定一致度最小之基準FP,對該基準FP進行對象FP的峰值歸屬。
〔類似性評價方法程式〕
第11圖、第12圖為類似性評價方法程式的流程圖。
第11圖為表示用以評價FP間的類似性之處理整體的步驟的流程圖,利用系統啟動而起始,在電腦達成圖案化功能、一致數抽出功能與一致度判定功能,於視為正常品之複數基準FP與對象FP 17間評價保持時間出現圖案的類似性,而選定適於對象FP17的歸屬的基準FP。
第12圖為表示第11圖之「FP類似性評價處理」中「次常式1」的詳細情形的流程圖。該處理中,係計算FP間(例如對象FP與基準FP)之保持時間出現圖案的一致度。
〔FP類似性評價處理〕
步驟S201中係執行「讀取對象FP」的處理。該處理中係讀取歸屬對象之FP,並移至步驟S202。
步驟S202中係執行「取得全部保持時間(R1)」的處理。該處理中係取得所有在步驟S201讀取的對象FP之保持時間資訊,並移至步驟S203。
步驟S203中係執行「將全部基準FP之檔案名列表化」的處理。該處理中係預先將全部基準FP之檔案名列表化,以便於隨後對全部基準FP依序進行處理,並移至步驟S204。
步驟S204中,係將1代入(n←1)作為用於對全部基準FP依序進行處理之計數器之初始值的n,並移至步驟S205。
步驟S205中係執行「讀取列表第n號之基準FP(基準FPn)」的處理。該處理中係將在步驟S203列表化之全部基準FP之檔案名列表的第n號的FP,並移至步驟S206。
步驟S206中係執行「取得全部保持時間(R2)」的處理。該處理中係取得所有在步驟S205讀取的基準FP之保持時間資訊,並移至步驟S207。
步驟S207中係執行「算出R1及R2之保持時間出現圖案的一致度(RPn_min)」的處理。該處理中係由在步驟S202取得之對象FP的保持時間及在步驟S206取得之基準FP的保持時間算出RPn_min,並移至步驟S208。此外,RPn_min的詳細計算流程係利用第12圖之次常式1另外進行說明。
步驟S208中係執行「RPn_min之保存(RPall_min」的處理。該處理中係將在步驟S207算出的RPn_min保存於RPall_min,並移至步驟S209。
步驟S209中係執行「n之更新(n←n+1)」的處理。該處理中,為了將處理移至下一個FP,係將n+1代入n以作為n的更新,並移至步驟S210。
步驟S210中係執行「全部基準FP處理結束?」的判斷處理。該處理中係判斷所有基準FP是否經處理,當處理完成(YES)時,移至步驟S211。若有未處理之基準FP(NO)時,為了對未處理之FP執行步驟S205~S210的處理,而移至步驟S205。重複進行步驟S205~S210的處理至全部基準FP的處理結束為止。
步驟S211中係執行「由RPall_min選定一致度最小之基準FP」的處理。該處理中係由針對全部基準FP算出之RP1_min比較RPn_min,而選定與對象FP之保持時間出現圖案的一致度最小的基準FP。
[次常式1]
步驟S1001係執行「x←R1、y←R2」的處理。該處理中係將圖80之在S202及S206取得之R1及R2分別代入x及y,並移至步驟S1002。
步驟S1002中係執行「取得x、y之資料數(a、b)」的處理。該處理中係分別取得x、y之資料數作為a、b,並移至步驟S1003。
步驟S1003係將1代入作為用以依序叫出x之保持時間之計數器之初始值的i(i←1),並移至步驟S1004。
步驟S1004中係執行「取得來自第xi號之保持時間的總距離(f)」的處理。該處理中係取得第xi號之保持時間及其以後之總保持時間間距作為f,並移至步驟S1005。
步驟S1005係將1代入作為用以依序叫出y之保持時間之計數器之初始值的j(j←1),並移至步驟S1006。
步驟S1006中係執行「取得來自第yj號之保持時間的總距離(g)」的處理。該處理中係取得第yj號之保持時間及其以後之總保持時間間距作為g,並移至步驟S1007。
步驟S1007中係執行「取得滿足”| f之各保持時間間距-g之各保持時間間距|<閾值”之條件的資料數(m)」的處理。該處理中係以循環方式比較在步驟S1004及S1006取得的保持時間間距f及g,而取得滿足“| f之各保持時間間距-g之各保持時間間距|<閾值”之條件的資料數作為m,並移至步驟S1008。
步驟S1008中係執行「算出f及g之保持時間出現圖案的一致度(RPfg)」的處理。該處理中係由在步驟S1002取得之a、b及在步驟S1007取得之m,以RPfg=(1-(m/(a+b-m)))×(a-m+1)之形式算出RPfg,並移至步驟S1009。
步驟S1009中係執行「保存RPfg(RP_all)」的處理。該處理中係將在步驟S1008算出的一致度保存於RP_all,並移至步驟S1010。
步驟S1010中係執行「j之更新(j←j+1)」的處理。該處理中,為了將y的處理移至下一個保持時間,係將j+1代入j以作為j的更新,並移至步驟S1011。
步驟S1011中係執行「y之全部保持時間處理結束?」的判斷處理。該處理中係判斷y的所有保持時間的處理是否結束。若結束(YES)時係判斷為y之全部保持時間的處理結束,並移至步驟S1012。若未結束(NO)時,則判斷為y中殘留有未處理之保持時間,並移至步驟S1006。即,重複步驟S1006~S1011的處理至y的所有保持時間已處理。
步驟S1012中係執行「i之更新(i←i+1)」的處理。該處理中,為了將x的處理移至下一個保持時間,係將i+1代入i以作為i的更新,並移至步驟S1013。
步驟S1013中係執行「x之全部保持時間處理結束?」的判斷處理。該處理中係判斷x的所有保持時間的處理是否結束。若結束(YES)時係判斷為x之全部保持時間的處理結束,並移至步驟S1014。若未結束(NO)時,則判斷為x中殘留有未處理之保持時間,並移至步驟S1004。即,重複步驟S1004~S1013的處理至x的所有保持時間已處理。
步驟S1014中係執行「由RP_all取得最小值(RP_min)」的處理。該處理中係取得對象FP與基準FP之保持時間出現圖案的全組合之RP所保存的RP_all中的最小值作為RP_min,將其RP_min轉移至第11圖的步驟S207,而結束保持時間出現圖案的一致度計算處理。
[實施例1之效果]
本發明的實施例1係一種評價聚集複數峰值(19、21、‧‧‧)、(39、41、‧‧‧)的對象FP15及基準FP17的類似性之FP的類似性評價方法,其具備:圖案化製程S1,將對象FP15及基準FP17之各峰值(19、21、‧‧‧)、(39、41、‧‧‧)以出現距離如第5圖、第6圖所示圖案化;一致數抽出製程S2,以循環方式比較圖案 化之各圖案,並如第8圖所示求取一致數;及一致度判定製程S3,係基於求取之一致數利用Tanimoto係數,如第9圖所示求取一致度。
因此,可簡易且迅速地評價對象FP15與基準FP17的類似性,能以FP圖案盡量與對象FP15類似之基準FP來歸屬對象FP15之各峰值。由複數基準FP選定與該對象FP15類似之基準FP,可進行精確度更高的歸屬。
一致度判定製程S3中係藉由將Tanimoto係數設為「出現距離之一致數/(對象FP峰值數+基準FP峰值數-出現距離之一致數)」,使(1-Tanimoto係數)趨近於零來求取一致度,並對該(1-Tanimoto係數)進行(對象FP峰值數-出現距離之一致數+1)的加權,而設為「(1-Tanimoto係數)×(對象FP峰值數-出現距離之一致數+1)」來求取一致度。
因此,透過加權可選擇對象FP15之峰值(19、21、‧‧‧)更多數一致的基準FP。
本發明實施例1之聚集資料的類似性評價方法程式藉由達成圖案化功能、一致數抽出功能、一致度判定功能,能有助於評價FP的類似性,並簡易且迅速地進行基準FP的選定。
本發明實施例1之FP之類似性評價裝置1中可利用圖案化部3、一致數抽出部5、一致度判定部7來達成FP的類似性評價方法。
【實施例2】
第10圖為表示對象FP之峰值高度比圖案之說明圖。
本實施例2中係對第10圖上層之對象FP15,如下層之圖表所示,作成各單元之值以峰值高度比構成之表形式的圖案化。
第10圖中,對象FP15之各峰值(19、21、23、25、27、29、31、33、35、37)的各峰值高度為(5、9、2、30、2、21、32、4、4、11)。
因此,峰值19及峰值21間的高度比為(9÷5)=(1.8)。同樣地,峰值19及峰值23間為(0.4)、峰值21及峰值23間為(0.2)等。以下同樣為第10圖之下層圖表之對象FP的峰值的高度比圖案。
對於基準FP,亦同樣地得到基準FP之峰值的高度比圖案。
因此,本實施例2中,圖案化製程S1係以尺度為峰值的高度比而圖案化。
一致數抽出製程S2係將一致數設為高度比之一致數,並以循環方式比較以峰值的高度比來圖案化之各峰值,而於設定範圍內算出高度比一致的數。由此算出,可與第8圖同樣地得到一致數。
此外,在峰值的高度比中圖案化之本實施例中,第10圖下層圖表所示之1列中有存在複數相同值的案例,必須不計算此等複數次。
一致度判定製程S2係藉由將Tanimoto係數設為「高度比的一致數/(對象FP峰值數+基準FP峰值數-高度比的一致數)」,使(1-Tanimoto係數)趨近於零,而可求得前述一致度。
又,在(1-Tanimoto係數)施以(對象FP峰值數-高度比的一致數+1)的加權,成為「(1-Tanimoto係數)×(對象FP峰值數-高度比的一致數+1」,藉由加權可選擇更多一致的對象FP15的峰值(19、21、‧‧‧)的基準FP。
因此,本實施例2中,亦可發揮與實施例1同樣的效果。
〔其他〕
本發明實施例對於作為多成分藥劑之中藥的評價係適用的,惟亦可適用於其他多成分物質的評價。層析圖則不限於3D層析圖,亦可使用作為FP之UV光譜除外之峰值及其保持時間所構成者。
本發明之聚集資料的類似性評價方法係一種探討聚集複數資料之聚集資料相互的一致度之類似性評價方法,其具備:圖案化製程,將前述各聚集資料的各資料以選擇的尺度圖案化;一致數抽出製程,以循環方式比較前述圖案化的各資料而求取一致數;以及一致度判定製程,基於前述求取的一致數,利用Tanimoto係數求取一致度,可廣泛應用於評價聚集資料相互的類似性。作為聚集資料並不限於FP,亦可應用於其他訊號資料等。
作為上述實施例之聚集資料的FP係基於峰值高度而作成,並利用上述手法來評價類似性,而在以峰值之面積值作成FP時亦可利用同樣的手法來進行評價。
即,對於本發明之聚集資料的類似性評價方法、類似性評價方法程式、及類似性評價裝置中所使用的峰值,如上述皆可包含意指訊號強度(高度)之極大值的情況、與意指以高度表現訊號強度之面積值(峰值面積)者的情況任一者。
此時,以峰值面積作FP時亦以高度表現面積值而作成FP,作為FP係為與以上述實施例之峰值高度作成時同樣的表現。因此,以峰值面積作成FP時亦與以訊號強度之峰值高度作成FP時同樣地可利用上述實施例1或實施例2的處理來評價類似性。
因此,本發明中,圖案化部、圖案化製程、圖案化功能可對各聚集資料的各資料,將選擇的尺度除實施例1之峰值的出現距離、實施例2之峰值的高度比以外,利用峰值面積的面積比與實施例2同樣地進行。
1‧‧‧FP的類似性評價裝置(聚集資料的類似性評價裝置)
3‧‧‧圖案化部
5‧‧‧一致數抽出部
7‧‧‧一致度判定部
S1‧‧‧圖案化製程
S2‧‧‧一致數抽出製程
S3‧‧‧一致度判定製程
第1圖為聚集資料之類似性評價裝置的方塊圖(實施例1);第2圖為聚集資料之類似性評價方法的製程圖(實施例1);第3圖為表示每藥劑的FP:(A)為表示藥劑A、(B)為表示藥劑B、(C)為表示藥劑C的圖表(實施例1);第4圖為表示對象FP及基準FP之保持時間的說明圖(實施例1);第5圖為顯示對象FP之保持時間出現圖案的說明圖(實施例1);第6圖為顯示基準FP之保持時間出現圖案的說明圖(實施例1);第7圖為顯示對象與基準FP之出現距離的一致數的說明圖(實施例1);第8圖為顯示對象FP與基準FP之全部保持時間出現圖案的一致度的說明圖(實施例1);第9圖為顯示對象FP與基準FP之全部保持時間出現圖案的一致度的說明圖(實施例1);第10圖為表示對象FP之峰值高度比圖案的說明圖(實施例2);第11圖為FP類似性評價處理的資料處理流程圖(實施例1);以及 第12圖為FP類似性評價處理之保持時間出現圖案的一致度計算處理的流程圖(實施例1)。
1‧‧‧FP的類似性評價裝置(聚集資料的類似性評價裝置)
3‧‧‧圖案化部
5‧‧‧一致數抽出部
7‧‧‧一致度判定部

Claims (18)

  1. 一種聚集資料的類似性評價方法,係評價由複數個資料聚集而成之聚集資料相互的類似性之聚集資料的類似性評價方法,其特徵在於,具備:圖案化製程,將前述各聚集資料之各資料以選擇的尺度圖案化;一致數抽出製程,以循環方式比較前述圖案化的各資料而求取一致數;以及一致度判定製程,基於前述求取的一致數,利用Tanimoto係數求取一致度。
  2. 如申請專利範圍第1項所述之聚集資料的類似性評價方法,其中前述聚集資料係由波峰以及其保持時間所構成的FP,前述圖案化製程將波峰的出現距離、高度比、面積比中之任一者作為前述尺度,由複數種基準FP根據前述一致度選定最接近之對象FP的基準FP時,前述一致數抽出製程將前述出現距離、高度比、面積比中之任一者的一致數作為前述一致數,以及前述一致度判定製程將前述Tanimoto係數作為「出現距離、高度比、面積比中之任一者的一致數/(對象FP波峰數+基準FP波峰數-出現距離、高度比、面積比之任一者的一致數)」,並藉由使(1-Tanimoto係數)近似零來求取前述一致度。
  3. 如申請專利範圍第2項所述之聚集資料的類似性評價方法,其中對前述(1-Tanimoto係數)進行(對象FP波峰數-出現距離、高度比、面積比之任一者的一致數+1)的加權,而設為「(1-Tanimoto係數)×(對象FP波峰數-出現距離、高度比、面積比之任一者的一致數+1)」。
  4. 如申請專利範圍第2項或第3項所述之聚集資料的類似性評價方法,其中前述FP係由多成分物質的層析圖檢測出。
  5. 如申請專利範圍第4項所述之聚集資料的類似性評價方法,其中前述多成分物質為多成分藥劑。
  6. 如申請專利範圍第5項所述之聚集資料的類似性評價方法,其中前述多成分藥劑為生藥、生藥的組合、其等的萃取物、中藥之任一者。
  7. 一種聚集資料的類似性評價程式,係評價由複數個資料聚集而成之聚集資料相互的類似性之聚集資料的類似性評價程式,其特徵在於,在電腦上達成:圖案化功能,將前述各聚集資料之各資料以選擇的尺度圖案化;一致數抽出功能,以循環方式比較前述圖案化的各資料而求取一致數;以及一致度判定功能,基於前述求取的一致數,利用Tanimoto係數求取一致度。
  8. 如申請專利範圍第7項所述之聚集資料的類似性評價程式,其中前述聚集資料係由波峰以及其保持時間所構成的FP,前述圖案化功能將波峰的出現距離、高度比、面積比中之任一者作為前述尺度,在由複數種基準FP根據前述一致度選定最接近之對象FP的基準FP時,前述一致數抽出功能將前述出現距離、高度比、面積比中之任一者的一致數作為前述一致數,以及 前述一致度判定製程將前述Tanimoto係數作為「出現距離、高度比、面積比之任一者的一致數/(對象FP波峰數+基準FP波峰數-出現距離、高度比、面積比之任一者的一致數)」,並藉由使(1-Tanimoto係數)近似零來求取前述一致度。
  9. 如申請專利範圍第8項所述之聚集資料的類似性評價程式,其中對前述(1-Tanimoto係數)進行(對象FP波峰數-出現距離、高度比、面積比之任一者的一致數+1)的加權,而設為「(1-Tanimoto係數)×(對象FP波峰數-出現距離、高度比、面積比之任一者的一致數+1)」。
  10. 如申請專利範圍第8項或第9項所述之聚集資料的類似性評價程式,其中前述FP係由多成分物質的層析圖檢測出。
  11. 如申請專利範圍第10項所述之聚集資料的類似性評價程式,其中前述多成分物質為多成分藥劑。
  12. 如申請專利範圍第11項所述之聚集資料的類似性評價程式,其中前述多成分藥劑為生藥、生藥的組合、其等的萃取物、中藥之任一者。
  13. 一種聚集資料的類似性評價裝置,係評價由複數個資料聚集而成之聚集資料相互的類似性之類似性評價裝置,其特徵在於,具備:圖案化部,將前述各聚集資料之各資料以選擇的尺度圖案化;一致數抽出部,以循環方式比較前述圖案化的各資料而求取一致數;以及一致度判定部,基於前述求取的一致數,利用Tanimoto係數求取一致度。
  14. 如申請專利範圍第13項所述之聚集資料的類似性評價裝置,其中前述聚集資料係由波峰以及其保持時間所構成的FP,在由複數種基準FP根據前述一致度來選定最接近之對象FP的基準FP時,前述圖案化部將波峰的出現距離、高度比、面積比中之任一者作為前述尺度,前述一致數抽出部將前述出現距離、高度比、面積比中之任一者的一致數作為前述一致數,以及前述一致度判定製程將前述Tanimoto係數作為「出現距離、高度比、面積比之任一者的一致數/(對象FP波峰數+基準FP波峰數-出現距離、高度比、面積比之任一者的一致數)」,並藉由使(1-Tanimoto係數)近似零來求取前述一致度。
  15. 如申請專利範圍第14項所述之聚集資料的類似性評價裝置,其中對前述(1-Tanimoto係數)進行(對象FP波峰數-出現距離、高度比、面積比之任一者的一致數+1)的加權,而設為「(1-Tanimoto係數)×(對象FP波峰數-出現距離、高度比、面積比之任一者的一致數+1)」。
  16. 如申請專利範圍第14項或第15項所述之聚集資料的類似性評價裝置,其中前述FP係由多成分物質的層析圖檢測出。
  17. 如申請專利範圍第16項所述之聚集資料的類似性評價裝置,其中前述多成分物質為多成分藥劑。
  18. 如申請專利範圍第17項所述之聚集資料的類似性評價裝置,其中前述多成分藥劑為生藥、生藥的組合、其等的萃取物、中藥之任一者。
TW101119805A 2011-06-01 2012-06-01 The similarity evaluation method of the aggregated data, the similarity evaluation program, and the similarity evaluation Device TWI521203B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011123847 2011-06-01

Publications (2)

Publication Number Publication Date
TW201314205A true TW201314205A (zh) 2013-04-01
TWI521203B TWI521203B (zh) 2016-02-11

Family

ID=47258823

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101119805A TWI521203B (zh) 2011-06-01 2012-06-01 The similarity evaluation method of the aggregated data, the similarity evaluation program, and the similarity evaluation Device

Country Status (8)

Country Link
US (1) US20130197813A1 (zh)
EP (1) EP2717048B1 (zh)
JP (1) JP5910506B2 (zh)
KR (1) KR101436534B1 (zh)
CN (1) CN102985818B (zh)
HK (1) HK1181116A1 (zh)
TW (1) TWI521203B (zh)
WO (1) WO2012164954A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446546B (zh) * 2016-09-23 2019-02-22 西安电子科技大学 基于卷积自动编解码算法的气象数据填补方法
JP7281256B2 (ja) 2018-08-14 2023-05-25 横河電機株式会社 信号入力回路
CN109637672B (zh) * 2018-11-28 2023-11-07 北京工业大学 一种基于药物效用度的方剂相似度计算方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2658344B2 (ja) * 1989-01-26 1997-09-30 株式会社島津製作所 クロマトグラフ用データ処理装置
US6980674B2 (en) * 2000-09-01 2005-12-27 Large Scale Proteomics Corp. Reference database
JP4886933B2 (ja) * 2001-01-12 2012-02-29 カウンセル オブ サイエンティフィック アンド インダストリアル リサーチ クロマトグラフフィンガープリントならびに単一の医薬および処方物の標準化のための新規な方法
US6319679B1 (en) * 2001-01-26 2001-11-20 Board Of Regents, The University Of Texas System PAS kinase
CN100356380C (zh) * 2001-02-13 2007-12-19 科学与工业研究会 一种色谱指纹图谱和单一药物和制剂标准化的新方法
US20040034477A1 (en) * 2002-08-19 2004-02-19 Mcbrien Michael Methods for modeling chromatographic variables
US8428883B2 (en) * 2004-06-07 2013-04-23 Tsumura & Co. Multi-component medicine evaluation method
JP4191094B2 (ja) * 2004-06-08 2008-12-03 株式会社山武 マススペクトル解析装置、マススペクトル解析方法及びマススペクトル解析プログラム
JP2007315941A (ja) * 2006-05-26 2007-12-06 Univ Of Miyazaki 植物品種判定装置、植物品種判定方法及び植物品種判定用プログラム
JP2008100918A (ja) * 2006-10-17 2008-05-01 Nec Corp 類似度計算処理システム、その処理方法及びプログラム
EP2084638A2 (en) * 2006-11-13 2009-08-05 N.V. Organon A system and method to identify the metabolites of a drug
JP4840597B2 (ja) * 2007-03-08 2011-12-21 日本電気株式会社 創薬のマルチターゲットスクリーニング装置
US8520981B2 (en) * 2007-11-08 2013-08-27 Nec Corporation Document retrieval of feature point groups using a geometrical transformation
US8952035B2 (en) * 2007-11-09 2015-02-10 Eisai R&D Management Co., Ltd. Combination of anti-angiogenic substance and anti-tumor platinum complex
CN101855392A (zh) * 2007-11-12 2010-10-06 电子虚拟生物科技株式会社 虚拟筛选装置及虚拟筛选方法

Also Published As

Publication number Publication date
JP5910506B2 (ja) 2016-04-27
WO2012164954A1 (ja) 2012-12-06
HK1181116A1 (zh) 2013-11-01
CN102985818A (zh) 2013-03-20
KR101436534B1 (ko) 2014-09-01
US20130197813A1 (en) 2013-08-01
TWI521203B (zh) 2016-02-11
CN102985818B (zh) 2016-03-02
EP2717048A1 (en) 2014-04-09
EP2717048A4 (en) 2014-12-10
JPWO2012164954A1 (ja) 2015-02-23
EP2717048B1 (en) 2020-04-01
KR20130029405A (ko) 2013-03-22

Similar Documents

Publication Publication Date Title
TWI550269B (zh) A peak attribution method, a attribution program, and a home device
TWI521203B (zh) The similarity evaluation method of the aggregated data, the similarity evaluation program, and the similarity evaluation Device
TWI528033B (zh) The evaluation method of the pattern, the evaluation method of the multi-component substance, the evaluation program, and the evaluation device
TW201312109A (zh) 圖案或fp之特徵值作成方法、作成程式,以及作成裝置
TWI528032B (zh) The evaluation method of the pattern, the evaluation method of the multi-component substance, the evaluation program, and the evaluation device
TWI609181B (zh) FP creation method, creating program, creating device, and FP
JPWO2005121777A1 (ja) 多成分系薬剤の評価方法