KR102228552B1 - 랜덤 포레스트 모델을 활용한 약물의 다중 표적 예측 방법 - Google Patents
랜덤 포레스트 모델을 활용한 약물의 다중 표적 예측 방법 Download PDFInfo
- Publication number
- KR102228552B1 KR102228552B1 KR1020180109415A KR20180109415A KR102228552B1 KR 102228552 B1 KR102228552 B1 KR 102228552B1 KR 1020180109415 A KR1020180109415 A KR 1020180109415A KR 20180109415 A KR20180109415 A KR 20180109415A KR 102228552 B1 KR102228552 B1 KR 102228552B1
- Authority
- KR
- South Korea
- Prior art keywords
- target
- drug
- targets
- ligands
- random forest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 108
- 239000003814 drug Substances 0.000 title claims abstract description 94
- 229940079593 drug Drugs 0.000 title claims abstract description 94
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 48
- 238000004617 QSAR study Methods 0.000 title description 13
- 239000003596 drug target Substances 0.000 claims abstract description 32
- 238000010801 machine learning Methods 0.000 claims abstract description 15
- 238000011156 evaluation Methods 0.000 claims abstract description 4
- 239000003446 ligand Substances 0.000 claims description 167
- 230000000694 effects Effects 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 20
- 230000003993 interaction Effects 0.000 claims description 19
- 238000010200 validation analysis Methods 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 4
- 210000004185 liver Anatomy 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 abstract description 16
- 238000002790 cross-validation Methods 0.000 description 13
- 238000005070 sampling Methods 0.000 description 12
- 238000012549 training Methods 0.000 description 12
- 238000005556 structure-activity relationship Methods 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 239000002547 new drug Substances 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000000126 in silico method Methods 0.000 description 3
- 102000003839 Human Proteins Human genes 0.000 description 2
- 108090000144 Human Proteins Proteins 0.000 description 2
- 241000289674 Vombatidae Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 102000004310 Ion Channels Human genes 0.000 description 1
- 108090000862 Ion Channels Proteins 0.000 description 1
- 238000001358 Pearson's chi-squared test Methods 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 102000006240 membrane receptors Human genes 0.000 description 1
- 108020004084 membrane receptors Proteins 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000003041 virtual screening Methods 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- Artificial Intelligence (AREA)
- Crystallography & Structural Chemistry (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Bioethics (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
도 2는 1121개의 표적 모델들의 클래스 분포를 나타낸다.
도 3은 모델 점수와 상호작용의 추정 확률 간의 관계를 나타내는 그래프로서, 좌측 그래프는 점수에 따른 추정 확률의 그래프이고, 오른쪽 그래프는 로그 스케일 점수에 따른 추정 확률의 그래프이다.
도 4는 ROC 곡선과 내부 교차 검증에 의해 계산된 영역 하부곡선을 나타낸다.
도 5는 각 표적 모델과 모델 특성에 대한 성능의 산점도(scatter plot)이다.
도 6은 각 표적에 대한 활성 및 비활성 리간드들 간의 평균 점수를 비교한 것을 나타내는 그래프이다.
도 7은 내부 교차 검증에 의해 측정된 다양한 상위 k 값 (k = 1, 4, 8, 11, 33, 66, 88, 110)에 대한 재현율의 변화를 나타낸다.
도 8은 특정 표적들에 가장 가까운 활성 리간드의 타니모토(Tanimoto) 계수 분포를 나타낸다.
도 9는 외부 유효성 검증 집합의 결과를 선별하기 위한 ROC 곡선을 나타낸다.
도 10은 본 발명의 예시적인 실시예에 따른 RF-QSAR 모델 기반 다중 표적 예측 방법이 웹 서버 형태로 구현된 약물표적 예측서버가 사용자의 클라이언트 단말기의 쿼리에 대한 웹서비스를 제공하기 위한 시스템의 구성을 나타낸다.
도 11은 도 10의 약물표적 예측서버가 사용자의 클라이언트 단말기의 쿼리에 대한 응답으로 제공하는 결과 페이지를 예시한다.
| 샘플링 방법 | 음성-언더샘플링 | 양성-오버샘플링 |
| 전체 ROC AUC | 0.975 | 0.956 |
| 상위 1 재현 | 0.534 | 0.549 |
| 상위 4 재현 | 0.81 | 0.822 |
| 상위 8 재현 | 0.849 | 0.855 |
| 상위11 재현 | 0.86 | 0.865 |
| 비 (비활성/활성) | 1 | 10 | 20 | 30 | 40 |
| 전체 ROC AUC | 0.961 | 0.956 | 0.956 | 0.955 | 0.955 |
| 상위 1 재현 | 0.549 | 0.549 | 0.549 | 0.549 | 0.549 |
| 상위 4 재현 | 0.823 | 0.822 | 0.822 | 0.822 | 0.822 |
| 상위 8 재현 | 0.857 | 0.856 | 0.855 | 0.855 | 0.855 |
| 상위11 재현 | 0.868 | 0.866 | 0.865 | 0.865 | 0.865 |
| Tc 컷오프 | 0.3 | 0.5 | 컷오프 없음 |
| 전체 ROC AUC | 0.973 | 0.966 | 0.961 |
| 상위 1 재현 | 0.527 | 0.538 | 0.548 |
| 상위 4 재현 | 0.815 | 0.823 | 0.823 |
| 상위 8 재현 | 0.858 | 0.86 | 0.857 |
| 상위11 재현 | 0.87 | 0.871 | 0.868 |
100: 다중 표적 예측 서버
200: 클라이언트 단말기
Claims (15)
- 컴퓨터 장치에서 실행되는 컴퓨터 프로그램을 이용하여 인체에 존재하는 다수의 표적들에 대한 약물의 결합을 예측하는 방법으로서,
상기 표적들과 결합하는 약물의 구조 정보를 기계 학습하여 각 표적 별로 독립적인 랜덤 포레스트(Random Forest) 예측 모델을 생성하는 단계;
예측대상 약물의 구조 정보를 각 랜덤 포레스트 예측 모델에 입력하는 단계;
각 표적 별 랜덤 포레스트 예측모델에서, 상기 표적들 각각에 대한 구조 정보가 입력된 상기 예측대상 약물의 결합 가능성을 각 표적별 표적 점수로 생성하는 단계;
각 표적 별 랜덤 포레스트 예측 모델이 상기 각 표적별 표적 점수를 약물과 표적이 상호작용할 확률인 약물-표적 결합 확률로 전환하는 단계; 및
상기 약물-표적 결합 확률에 기초하여 소정의 결합 확률값 이상을 갖는 표적들을 선별하여 상기 예측대상 약물의 예상 표적 리스트로 반환하는 단계를 포함하는 것을 특징으로 하는 랜덤 포레스트 예측 모델을 활용한 약물의 다중 표적 예측 방법. - 제1항에 있어서, 상기 '랜덤 포레스트(Random Forest) 예측 모델을 생성하는 단계'는 상기 기계 학습을 하기 전에 학습할 데이터를 최적화하여 각 랜덤 포레스트(Random Forest) 예측 모델의 정확도를 높이고, 표적들 간의 편차(bias)를 줄이는 전처리를 수행하는 단계를 포함하는 것을 특징으로 하는 약물의 다중 표적 예측 방법.
- 제2항에 있어서, 상기 전처리를 수행하는 단계는 비활성 리간드에 대한 활성 리간드의 비가 특정 값에 도달할 때까지 비활성 리간드의 부분 집합만을 무작위로 선택하는 음성-언더 샘플링 방법(negative-undersampling method)을 사용하여 비활성 리간드에 대한 활성 리간드의 비의 과도한 불균형을 해소하는 단계를 포함하는 것을 특징으로 하는 약물의 다중 표적 예측 방법.
- 제2항에 있어서, 상기 전처리를 수행하는 단계는 비활성 리간드에 대한 활성 리간드의 비가 특정 값에 도달할 때까지 활성 리간드에 더 큰 가중치를 부여하여 활성 리간드를 상대적으로 더 많이 선택하는 양성-오버샘플링 방법을 사용하여 비활성 리간드에 대한 활성 리간드의 비의 과도한 불균형을 해소하는 단계를 포함하는 것을 특징으로 하는 약물의 다중 표적 예측 방법.
- 제2항에 있어서, 상기 전처리를 수행하는 단계는 활성 및 비활성 리간드의 확장 연결성 지문(Extended-Connectivity Fingerprints: ECFP)들간의 타니모토 계수(Tanimoto coefficient) Tc 유사성을 계산함으로써, 특정 임계값과 유사한 활성 데이터를 갖는 리간드들은 비활성 리간드에서 제외시키는 처리를 수행하는 단계를 포함하는 것을 특징으로 하는 약물의 다중 표적 예측 방법.
- 제1항에 있어서, 상기 '표적 점수로 생성하는 단계'는 상기 표적들 중에서 특정 표적을 결과에서 제외하는 표적 필터링을 수행하는 단계를 포함하는 것을 특징으로 하는 약물의 다중 표적 예측 방법.
- 제1항에 있어서, 상기 다중 표적 예측 방법의 성능 검증을 위해 외부 테스트 집합을 이용하여 상기 다중 표적 예측 방법의 재현율(Recall rate)을 평가하는 단계를 더 포함하는 것을 특징으로 하는 약물의 다중 표적 예측 방법.
- 제1항에 있어서, 상기 각 표적별 랜덤 포레스트 예측모델은 1,121개의 표적들 각각과 상기 예측대상 약물 간의 결합 가능성을 길이가 1,121인 점수 데이터로 표현하는 것을 특징으로 하는 약물의 다중 표적 예측 방법.
- 제1항에 있어서, 상기 각 표적별 표적 점수는 외부 검증 집합으로부터 획득한 평가 데이터의 점수를 기반으로 하여 상기 약물-표적 결합 확률로 전환되는 것을 특징으로 하는 랜덤 포레스트 예측 모델을 활용한 약물의 다중 표적 예측 방법.
- 제1항에 있어서, 상기 입력하는 단계는 웹서버 컴퓨터를 통해 사용자 인터페이스를 제공하여 사용자로 하여금 클라이언트 단말기에 표시되는 상기 사용자 인터페이스를 통해 예측 대상 약물의 쿼리 리간드의 구조 정보를 입력하게 하는 단계를 포함하는 것을 특징으로 하는 약물의 다중 표적 예측 방법.
- 제10항에 있어서, 상기 웹서버 컴퓨터가 상기 예상 표적 리스트에 관한 정보를 웹 페이지에 담아 상기 클라이언트 단말기로 제공하는 단계를 더 포함하는 것을 특징으로 하는 약물의 다중 표적 예측 방법.
- 제1항에 있어서, 다양한 소스의 약물-표적 상호작용에 관한 생체 활성 데이터(Bioactivity data)로부터 특정 표적들 각각과 결합하는 약물의 구조 정보들을 수집하는 단계를 더 포함하는 것을 특징으로 하는 약물의 다중 표적 예측 방법.
- 제12항에 있어서, 상기 랜덤 포레스트(Random Forest) 예측 모델은 1,121개의 표적에 대한 ChEMBL 데이터베이스의 약물 활성 데이터를 이용하여 구축되는 것을 특징으로 하는 약물의 다중 표적 예측 방법.
- 제1항 내지 제13항 중 어느 한 항에 기재된 약물의 다중 표적 예측 방법을 수행하기 위하여 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 실행가능 프로그램.
- 제1항 내지 제13항 중 어느 한 항에 기재된 약물의 다중 표적 예측 방법을 수행하기 위한 컴퓨터 실행가능 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020180109415A KR102228552B1 (ko) | 2018-09-13 | 2018-09-13 | 랜덤 포레스트 모델을 활용한 약물의 다중 표적 예측 방법 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020180109415A KR102228552B1 (ko) | 2018-09-13 | 2018-09-13 | 랜덤 포레스트 모델을 활용한 약물의 다중 표적 예측 방법 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20200030769A KR20200030769A (ko) | 2020-03-23 |
| KR102228552B1 true KR102228552B1 (ko) | 2021-03-16 |
Family
ID=69998708
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020180109415A Active KR102228552B1 (ko) | 2018-09-13 | 2018-09-13 | 랜덤 포레스트 모델을 활용한 약물의 다중 표적 예측 방법 |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR102228552B1 (ko) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20240048704A (ko) | 2022-10-07 | 2024-04-16 | 가천대학교 산학협력단 | 약물-표적 상호작용 예측 장치 및 이를 이용한 약물-표적 상호작용의 예측 방법 |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111755081B (zh) * | 2020-05-06 | 2024-09-20 | 北京化工大学 | 一种高甲烷吸附率MOFs生成与筛选的方法 |
| CN112133367B (zh) * | 2020-08-17 | 2024-07-12 | 中南大学 | 药物与靶点间的相互作用关系预测方法及装置 |
| CN114171114A (zh) * | 2021-12-06 | 2022-03-11 | 中山大学 | 药物靶点预测模型的构建方法、装置、存储介质及电子设备 |
| CN114550842B (zh) * | 2022-01-13 | 2024-12-10 | 山东师范大学 | 抑制靶标蛋白生物活性的药物化合物分子预测方法及系统 |
| CN115188417A (zh) * | 2022-06-16 | 2022-10-14 | 重庆康洲智通医药科技有限公司 | 药物组合的协同作用分数预测方法、装置及相关设备 |
| CN114999579A (zh) * | 2022-06-27 | 2022-09-02 | 北京理工大学 | 一种筛选化合物分子描述符并确定其取值范围的方法 |
| CN115810397A (zh) * | 2022-12-28 | 2023-03-17 | 中国人民解放军空军军医大学 | 一种藤梨根有效成分靶点分子预测模型的构建方法 |
| CN119541733B (zh) * | 2024-11-21 | 2025-07-11 | 南京工业大学 | 一种基于随机森林算法的乙炔氢氯化反应催化剂配体优劣的预测方法 |
-
2018
- 2018-09-13 KR KR1020180109415A patent/KR102228552B1/ko active Active
Non-Patent Citations (3)
| Title |
|---|
| A.C.A.Nascimento 외, BMC Bioinformatics, 2016, 17:46. |
| A.Ezzat 외, BMC Bioinformatics, 2016, 17(Suppl 19):509, pp.269-509. |
| R.S.Olayan 외, Bioinformatics, 34(7), 2018, pp.1164-1173. |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20240048704A (ko) | 2022-10-07 | 2024-04-16 | 가천대학교 산학협력단 | 약물-표적 상호작용 예측 장치 및 이를 이용한 약물-표적 상호작용의 예측 방법 |
Also Published As
| Publication number | Publication date |
|---|---|
| KR20200030769A (ko) | 2020-03-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102228552B1 (ko) | 랜덤 포레스트 모델을 활용한 약물의 다중 표적 예측 방법 | |
| Rostami et al. | A novel community detection based genetic algorithm for feature selection | |
| Li et al. | MONN: a multi-objective neural network for predicting compound-protein interactions and affinities | |
| Reker et al. | Active learning for computational chemogenomics | |
| Stumpfe et al. | Similarity searching | |
| Broadhurst et al. | Statistical strategies for avoiding false discoveries in metabolomics and related experiments | |
| Lee et al. | Utilizing random Forest QSAR models with optimized parameters for target identification and its application to target-fishing server | |
| Pang et al. | Identifying anti-coronavirus peptides by incorporating different negative datasets and imbalanced learning strategies | |
| Ansari et al. | Performance evaluation of machine learning techniques (MLT) for heart disease prediction | |
| KR102542666B1 (ko) | 유사도 기반의 합성곱 신경망을 이용한 약물-표적 결합 친화도의 예측 방법 및 이를 위한 시스템 | |
| CN113488104B (zh) | 基于局部和全局的网络中心性分析的癌症驱动基因预测方法及系统 | |
| Noor et al. | Deep-m5U: a deep learning-based approach for RNA 5-methyluridine modification prediction using optimized feature integration | |
| Raza et al. | A comprehensive evaluation of machine learning techniques for cancer class prediction based on microarray data | |
| Rajput et al. | Sine cosine algorithm-based feature selection for improved machine learning models in polycystic ovary syndrome diagnosis | |
| Akhter et al. | BPAGS: a web application for bacteriocin prediction via feature evaluation using alternating decision tree, genetic algorithm, and linear support vector classifier | |
| Cao et al. | Prediction of cardiovascular disease based on multiple feature selection and improved PSO-XGBoost model | |
| US11742081B2 (en) | Data model processing in machine learning employing feature selection using sub-population analysis | |
| Bornot et al. | A new prediction strategy for long local protein structures using an original description | |
| Gecili et al. | Bayesian regularization for a nonstationary Gaussian linear mixed effects model | |
| Cui et al. | Gamma distribution based predicting model for breast cancer drug response based on multi-layer feature selection | |
| Srinivas et al. | Implicit-descriptor ligand-based virtual screening by means of collaborative filtering | |
| Verma et al. | Classification of drug molecules for oxidative stress signalling pathway | |
| Chang et al. | CaBind_MCNN: Identifying Potential Calcium Channel Blocker Targets by Predicting Calcium-Binding Sites in Ion Channels and Ion Transporters Using Protein Language Models and Multiscale Feature Extraction | |
| Bonetta Valentino et al. | Machine learning using neural networks for metabolomic pathway analyses | |
| Mondal | Algorithms for data mining and bio-informatics |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20180913 |
|
| PA0201 | Request for examination | ||
| PG1501 | Laying open of application | ||
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20200826 Patent event code: PE09021S01D |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20210223 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20210310 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20210311 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration |