KR20180087069A - 자가 학습을 통한 약물-단백질간 관계 예측을 위한 모델링 기법 - Google Patents

자가 학습을 통한 약물-단백질간 관계 예측을 위한 모델링 기법 Download PDF

Info

Publication number
KR20180087069A
KR20180087069A KR1020170011321A KR20170011321A KR20180087069A KR 20180087069 A KR20180087069 A KR 20180087069A KR 1020170011321 A KR1020170011321 A KR 1020170011321A KR 20170011321 A KR20170011321 A KR 20170011321A KR 20180087069 A KR20180087069 A KR 20180087069A
Authority
KR
South Korea
Prior art keywords
relationship
drug
protein
positive
relationships
Prior art date
Application number
KR1020170011321A
Other languages
English (en)
Inventor
남호정
금종수
Original Assignee
광주과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 광주과학기술원 filed Critical 광주과학기술원
Priority to KR1020170011321A priority Critical patent/KR20180087069A/ko
Publication of KR20180087069A publication Critical patent/KR20180087069A/ko

Links

Images

Classifications

    • G06F19/12
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G06F19/26
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

약물-단백질간 관계 확인을 위한 모델링 방법이 개시된다. 본 발명의 일 실시 예에 따른 모델링 기법은, 약물-단백질간 관계 중 포지티브 관계가 아닌 관계를 네거티브 또는 언노운 관계로 설정하는 단계, 포지티브 관계 수에 대한 언노운 관계 수의 비율을 결정하는 단계; 및 상기 언노운 관계를 포지티브 관계 또는 네거티브 관계 중 적어도 하나로 결정하여 최종 모델을 구성하는 단계를 포함한다.

Description

자가 학습을 통한 약물-단백질간 관계 예측을 위한 모델링 기법{A method for predicting drug-target interactions via self-training}
본 발명은 약물-단백질간 관계를 예측하는 방법에 관한 것이다. 보다 상세하게는 자가 학습을 통해 약물-단백질간의 관계를 예측하는 방법에 관한 것이다.
기계학습을 통한 약물-단백질간의 관계를 예측하는 모델링 기법은 이전에도 많이 존재한다. 하지만 기계학습을 위해선 약물이 어떤 단백질에 반응한다는 양(Positive)의 레이블(Label)과, 반응하지 않는다는 음(Negative)의 레이블(Label)이 모두 필요하다. 하지만 그들이 반응하지 않는다는 데이터는 구하기가 어려워, 아직 밝혀지지 않은 약물-단백질 관계(Unknown interaction)을 음(Negative)의 레이블(Label)로 두고 학습을 진행하여 모델링을 하는 경우가 많았다. 하지만, 아직 밝혀지지 않은 약물-단백질 관계(Unknown interaction)중 많은 경우가 실제로 반응한다고 밝혀지는 경우가 많았기 때문에, 이 관계를 음(Negative)의 레이블(Label)로 두는 것은 문제가 된다.
이를 해결하기 위해, 반 지도학습(Semi-supervised learning) 혹은 랜덤워크(Random walk) 기법 등을 이용하여, 이 문제점을 해결하려 했지만, 성능이 좋지 않고, 해결해야 할 '밝혀지지 않은 약물-단백질 관계(Unknown interaction)중 몇몇은 실제로 반응(Positive)한다.' 라는 점에서도 기존의 모델과 차이가 별로 없음을 확인하였다.
본 발명의 일 실시 예에 따른 모델링 기법은 기존의 방법에 비해 약물-단백질간에 알려지지 않은 관계를 더욱 정확하게 예측할 수 있다.
본 발명의 일 실시 예에 따른 모델링 기법은,
약물-단백질간 관계 중 포지티브 관계가 아닌 관계를 네거티브 또는 언노운 관계로 설정하는 단계, 포지티브 관계 수에 대한 언노운 관계 수의 비율을 결정하는 단계; 및 상기 언노운 관계를 포지티브 관계 또는 네거티브 관계 중 적어도 하나로 결정하여 최종 모델을 구성하는 단계를 포함한다.
본 발명의 일 실시 예에 따른 모델링 기법은 기존의 방법에 비해 약물-단백질간에 알려지지 않은 관계를 더욱 정확하게 예측할 수 있다.
도 1은 본 발명의 일 실시 예에 따른 약물-단백질 반응 예측 모델링 기법에 대한 전체적인 과정을 나타낸다.
도 2는 트레이닝 및 검증에 사용된 단백질 종류별 약물, 단백질, 그들간의 관계 및 업데이트된 그들간의 관계를 나타낸다.
도 3은 각 모델에 대한 단백질 종류별 기존의 데이터 셋과 업데이트된 데이터 셋에 대한 AUC(area under the ROC curve), AUPR(area under the precision recall curve) 값을 나타낸다.
도 4는 각 모델별로 기존의 데이터 셋과 업데이트된 데이터 셋에 대한 AURP 값 순위를 각 단백질 별로 나타낸다.
도 5는 본 발명의 일 실시 예에서 제안하는 모델(SELF-BLM)과 기존의 모델(BLM)간의 예측 방법의 차이를 나타낸다.
도 6은 각 모델별로 포지티브 관계의 개수 비율에 따른 잠재적인 관계의 수를 나타낸다.
도 7은 본 발명의 일 실시 예에 따른 모델링 기법에 관한 흐름도이다.
이하에서는 도면을 참조하여 본 발명의 구체적인 실시예를 상세하게 설명한다. 그러나, 본 발명의 사상은 이하에 제시되는 구체적인 실시예로 제한되지 아니하며, 본 발명의 사상을 이해하는 당업자는 동일한 사상의 범위 내에 포함되는 다른 실시예를 구성요소의 부가, 변경, 삭제, 및 추가 등에 의해서 용이하게 제안할 수 있을 것이나, 이 또한 본 발명의 사상에 포함된다고 할 것이다.
최근, 약물-단백질(drug-target protein)간 관계 확인에 대한 관심이 약물 개발 분야뿐 아니라, 다양한 약물의 메커니즘을 이해하기 위한 분야에까지 급격하게 상승하고 있다. 그러나, 약물-단백질간의 관계를 확인하기 위한 실험과 관련된 시간 및 비용은 무시할 수 없는 수준이다. DrugBank, KEGGBRITE 및 SuperTarget과 같은 많은 약물 데이터베이스들은 비교적 적은 실험적으로 확인된 약물-단백질간 관계 정보를 포함하고 있다. 그러므로, 약물-단백질간 관계를 확인하기 위한 다른 접근이 시간/비용을 절약하기 위해 필요하다. 이와 관련하여, 약물-단백질간 관계를 예측하는 silico 방법은 합리적인 시간내에서 약물 개발에 중요한 정보를 제공할 수 있다.
다양한 slico 스크리닝 방법이 약물-단백질간 관계를 예측하기 위해 개발되었다. 이러한 다양한 방법들 중에서, 유사한 약물들은 유사한 단백질을 타겟한다는 가정에 따른 유사성 기반의 방법들은 유망한 결과를 보여줬다. 분자 도킹 방법도 매우 좋은 예측 성능을 보여주었지만, 단백질의 3D구조는 거의 알려지지 않았기 때문에 렌더링 도킹 방법은 대규모 스크리닝에는 적합하지 않다. 따라서, 화합물과 단백질의 로우-레벨 특징을 이용하여 대규모의 관계 예측을 개발하기 위해서 정확한 유사성 기반 방법을 개발해야만 한다.
BLM(Bipartite Local Models), GIP(Gaussian interaction profile) 및 KBMF2K(kernelized Bayesian matrix factorization with twin kernel)과 같은 이전의 유사성 기반 방법은, 약물-단백질간 관계를 예측하기 위한 효율적인 방법을 제공하였고, 매우 좋은 퍼포먼스를 보여주었다.
Supervised learning approach를 사용하는 BLM은 최근에 각 화합물과 각 단백질간의 유사성만을 kernel function의 형태로 사용하여 유망한 결과를 보여주었다. BLM 방법에서, POI(protein of interest) 또는 COI(compound of interest)를 위한 모델은 로컬 정보로부터 학습된다. 즉, 모델이 COI 또는 POI의 자체 관계를 사용함을 의미한다. 이러한 로컬-접근 컨셉은 GIP, BLM-NII 등과 같은 방법에 이용되었다.
상술한 방법들이 매우 좋은 퍼포먼스를 보여줌에도 불구하고, 문제가 여전히 남아있다. 대부분의 이전 개발 방법들은 예측 모델을 구성할 때 약물과 타겟 단백질간 유효한 관계를 포지티브(positive)로 카테고리화하고, 반면에 알려지지 않은 관계들은 네거티브(negative)로 카테고리화 한다. 그러나 알려지지 않은 관계는 완전히 네거티브 관계는 아니고, 그들은 포지티브 관계로서 아직 확인되지 않은 잠재적인 관계들을 포함한다.
이 문제를 해결하기 위하여 다양한 방법들이 제시되었다. 그러나, 이들 방법은 약물 또는 단백질이 약물-단백질 네트워크 기반의 유사성 스코어를 사용하는 제한된 조건에서 좋은 퍼포먼스를 보여준다. 왜냐하면, 이들 방법은 알려진 단백질이나 약물 정보가 없는 새로운 화합물이나 단백질의 관계를 예측하는데 제한적이기 때문이다. 따라서, 본 발명의 일 실시예를 통해 상술한 문제점을 해결하기 위한 새로운 모델링 기법을 이하에서 설명한다.
도 1은 본 발명의 일 실시 예에 따른 약물-단백질 반응 예측 모델링 기법에 대한 전체적인 과정을 나타낸다.
본 발명의 일 실시 예에 따른 약물-단백질 반응 예측 모델링 기법은 기존의 약물-단백질 관계 모델링 기법에서의 문제점인 밝혀지지 않은 약물-단백질 관계(Unknown interaction)를 네거티브 레이블로 정함으로써 발생할 수 있는 부정확한 학습(learning)을 최소화하여, 아직 밝혀지지 않은 약물-단백질 관계(Unknown interaction) 중 반응하는 관계를 최대한 찾는 모델링 기법을 제안한다.
먼저 도 1에 도시된 바와 같이 밝혀지지 않은 약물-단백질 관계를 전부 네거티브 관계로 학습하지 않기 위해, 약물과 단백질 각각을 군집화(Clustering)한다. 그리고 하나의 단백질에 대하여, 해당 단백질과 반응하는 약물들은 관계를 포지티브(도면에서는 +1로 표시됨)로 정하고, 해당 단백질에 대하여 전혀 반응하지 않는 약물들은 관계를 네거티브로 정하고, 포지티브도 네거티브도 아닌 약물들은 관계를 정하지 않는다(Unlabeled interaction).
그리고, 포지티브와 네거티브의 관계만으로 관계 모델링을 하고, 정해지지 않은 관계들을 해당 모델에 셀프 트레이닝한다. 구체적으로 미리 정해진 임계값(Threshold value)에 따라 정해지지 않은 관계들을 트레이닝한다. 그리고 트레이닝을 반복하여 최종 예측 모델을 확정한다.
본 발명의 일 실시 예에서는 K-medoids 클러스터링 방법을 사용하기 때문에, 다양한 데이터 셋을 트레이닝하기 위해 일정한 수의 클러스터가 필요하다. 알려진 약물-단백질간 포지티브 관계에 대하여 하나의 약물에 하나 또는 두개의 새로운 단백질에 대한 포지티브 관계가 있는 것이 일반적일 수 있다. 그러므로 본 발명의 일 실시 예에서는 라벨링되지 않은 다시 말해서 알려지지 않은 관계 수를 포지티브 관계의 수의 두 배로 설정할 수 있다. 이때, 포지티브 관계 수와 알려지지 않은 관계 수의 비율을 k라고 할 수 있다. 예를 들면 k는 2일 수 있다.
도 2는 트레이닝 및 검증에 사용된 단백질 종류별 약물, 단백질, 그들간의 관계 및 업데이트된 그들간의 관계를 나타낸다.
최초의 약물-단백질 관계 데이터 셋은 2007년에 구축된 것이며, 업데이트된 약물-단백질 관계 데이터 셋은 2015년에 구축된 데이터 셋이다. 본 발명의 일 실시 예에서 제안하는 모델링 기법을 2007년의 데이터 셋에 적용하고, 이를 2015년에 구축된 데이터 셋을 이용하여 검증할 수 있다.
도 3은 각 모델에 대한 단백질 종류별 기존의 데이터 셋과 업데이트된 데이터 셋에 대한 AUC(area under the ROC curve), AUPR(area under the precision recall curve) 값을 나타낸다.
여기에서 AUC 값은 binary classification problem에 대한 일반적인 평가 방법이다. 그러나, 네거티브 및 포지티브 트레이닝 데이터셋들 사이의 큰 편향은 종종 AUC 값들의 힘을 약하게 한다. 한편, 포지티브 라벨들을 높은 정확도로 분류하는 것이 중요하기 때문에 AUPR 값은 AUC 보다 적절한 지표일 수 있다.
도 3은 네 가지 타입의 단백질에 대한 네 가지 방법들의 AUC 및 AUPR 값들을 나타낸다(2007년 데이터셋 및 2015년 데이터셋). 그리고 도 4는 각 모델별로 기존의 데이터셋과 업데이트된 데이터셋에 대한 AURP 값 순위를 각 단백질 별로 나타낸다.
결과가 보여주듯이, BLM_RBF의 AUPR 값은 유효한 이전 데이터셋을 사용하는 경우에 대부분 높다. 그러나, 업데이트 데이터 셋에서, 본 발명의 일 실시 예로 제안되는 SELF-BLM의 AUC 및 AUPR 값은 효소를 제외하고 대부분의 단백질 타입에서 가장 높다.
또한, 도 3에 도시된 바와 같이, 본 발명의 일 실시 예에 따른 모델(SELF-BLM)의 경우, 만은 경우에 대해 기존의 데이터 셋으로 검증한 결과 값 및 순위가 다른 모델에 비해 높지 않으나, 이는 SELF-BLM이 많은 밝혀지지 않은 관계를 포지티브 관계로 예측했지 때문이다. 구체적으로 기존의 모델은 밝혀지지 않은 관계를 모두 네거티브 관계로 예측하는바, 기존의 데이터 셋에서는 순위가 낮을 수 있다. 그러나, SELF-BLM을 업데이트된 데이터 셋에 적용하는 경우 순위가 오르는 것을 도 3 및 도 4에서 확인할 수 있다.
도 5는 본 발명의 일 실시 예에서 제안하는 모델(SELF-BLM)과 기존의 모델(BLM)간의 예측 방법의 차이를 나타낸다.
도 5에 개시된 바와 같이, 기존 모델의 경우, 아직 밝혀지지 않은 약물OLANZAPINE와 단백질 HTR1B, HTR1D, HTR1F간의 관계를 네거티브 관계로 정한다. 그러나, SELF-BLM은 이들간의 관계를 정하지 않는다. 이 경우, 기존 모델에서는 단백질 HTR1E가 단백질 HTR1B, HTR1D, HTR1F와 더욱 비슷하기 때문에 네거티브 관계로 예측된다. 그러나, SELF-BLM에서는 단백질 HTR1B, HTR1D, HTR1F가 먼저 알려지지 않은 관계로 정해지고 수회의 셀프 트레이닝을 통해 포지티브 관계로 예측된다. 그리고 이들간의 실제 관계는 포지티브 관계임이 이후 실험적으로 밝혀졌다. 결과적으로, 본 발명에서 제안하는 모델이 기존의 모델보다 정확하게 약물-단백질간의 관계를 예측할 수 있는 것이다.
도 6은 각 모델별로 포지티브 관계의 개수 비율에 따른 잠재적인 관계의 수를 나타낸다.
구체적으로 도 6은 아직 관계가 밝혀지지 않은 정보(Unknown interaction) 중 실제로 반응하는 관계(Positive interaction)을 잠재적인 관계(Potential interaction)이라고 할 때, 어떠한 모델이 포지티브 관계를 많이 찾는지를 나타낸다.
도 7은 본 발명의 일 실시 예에 따른 모델링 기법에 관한 흐름도이다.
본 발명의 일 실시 예에 따른 모델링 기법을 구현하기 위한 시스템이 있을 수 있다. 이 시스템은 장치 또는 프로그램일 수 있다. 장치는 예를 들면 컴퓨터일 수 있다. 그리고 컴퓨터에 장착된 프로세서에서 본 발명의 실시 예에 따른 모델링 기법 알고리즘을 따르는 프로그램이 구동될 수 있다.
본 발명의 일 실시 예에 따른 모델링 시스템은 약물-단백질 관계에 있어서, 포지티브(positive)가 아닌 관계를 네거티브(negative) 관계 또는 언노운(unknown) 관계로 설정한다. 여기에서 약물-단백질간 관계를 포지티브로 결정하는 방법은 이 분야에서 이미 알려진 방법에 따른다.
본 발명의 일 실시 예에 따른 모델링 시스템은 하나의 포지티브 관계 수에 대한 언노운 관계의 수의 비율(k)을 결정한다(S103). 예를 들면, 하나의 포지티브 관계에 대하여 하나 또는 두개의 다른 포지티브 관계가 있을 수 있다. 이 경우, k는 2로 결정하는 것이 트레이팅 횟수를 최적화하는데 유리할 수 있다.
상기 k 값에 따라 결정된 수의 언노운 관계를 셀프 트레이닝을 통해 포지티브 관계 또는 네거티브 관계로 결정하여 최종 모델을 구성한다(S105). 본 발명의 일 실시 예에 따른 모델링 시스템은 특정 약물과 언노운 관계의 단백질을 셀프 트레이닝하여 포지티브 관계인지 네거티브 관계인지를 결정할 수 있다.
구체적으로 포지티브 관계와 네거티브 관계만으로 구성된 모델에 언노운 관계를 테스트하여 모델을 트레이닝 시킨다. 이 경우, 언노운 관계가 일정 임계값을 넘으면 그 관계 데이터를 포지티브 또는 네거티브로 바꾸고 변화된 데이터를 이용하여 다시 모델을 트레이닝한다. 그리고 이러한 셀프 트레이닝 과정을 어떠한 언노운 관계도 임계값을 넘지 않을 때까지 반복한다. 이때의 모델이 최종 모델일 수 있다.
이상과 같이, 본 발명에서는 구체적인 구성 요소등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해 제공된 것일 뿐, 본 발명은 상기의 실시 예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 설명된 실시 예에 국한되어 정해져서는 안되며, 후술하는 특허청구범위 뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.

Claims (3)

  1. 약물-단백질간 관계를 모델링하는 방법에 있어서,
    약물-단백질간 관계 중 포지티브 관계가 아닌 관계를 네거티브 또는 언노운 관계로 설정하는 단계;
    포지티브 관계 수에 대한 언노운 관계 수의 비율을 결정하는 단계; 및
    상기 언노운 관계를 포지티브 관계 또는 네거티브 관계 중 적어도 하나로 결정하여 최종 모델을 구성하는 단계를 포함하는
    약물-단백질간 관계 모델링 방법.
  2. 제1항에 있어서,
    상기 언노운 관계를 포지티브 관계 또는 네거티브 관계 중 적어도 하나로 결정하는 단계는
    포지티브 관계 및 네거티브 관계만으로 구성된 모델에 언노운 관계를 테스트하여 약물-단백질간 관계 모델을 셀프 트레이닝하는 단계를 포함하는
    약물-단백질간 관계 모델링 방법.
  3. 제2항에 있어서,
    상기 언노운 관계를 포지티브 관계 또는 네거티브 관계로 결정하는 단계는 언노운 관계가 임계값을 넘는지 여부에 따라 결정하는 단계를 포함하는
    약물-단백질간 관계 모델링 방법.
KR1020170011321A 2017-01-24 2017-01-24 자가 학습을 통한 약물-단백질간 관계 예측을 위한 모델링 기법 KR20180087069A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170011321A KR20180087069A (ko) 2017-01-24 2017-01-24 자가 학습을 통한 약물-단백질간 관계 예측을 위한 모델링 기법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170011321A KR20180087069A (ko) 2017-01-24 2017-01-24 자가 학습을 통한 약물-단백질간 관계 예측을 위한 모델링 기법

Publications (1)

Publication Number Publication Date
KR20180087069A true KR20180087069A (ko) 2018-08-01

Family

ID=63227817

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170011321A KR20180087069A (ko) 2017-01-24 2017-01-24 자가 학습을 통한 약물-단백질간 관계 예측을 위한 모델링 기법

Country Status (1)

Country Link
KR (1) KR20180087069A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102454641B1 (ko) 2021-04-12 2022-10-14 주식회사 온코크로스 약물의 조합 정보 예측 방법 및 그 장치
KR20220143486A (ko) 2021-04-16 2022-10-25 주식회사 온코크로스 신경망 기반의 생물학적상태데이터 변환 장치 및 그 방법
KR20220146857A (ko) 2021-04-26 2022-11-02 주식회사 온코크로스 약물 효과 예측 장치 및 그 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102454641B1 (ko) 2021-04-12 2022-10-14 주식회사 온코크로스 약물의 조합 정보 예측 방법 및 그 장치
KR20220143486A (ko) 2021-04-16 2022-10-25 주식회사 온코크로스 신경망 기반의 생물학적상태데이터 변환 장치 및 그 방법
KR20220146857A (ko) 2021-04-26 2022-11-02 주식회사 온코크로스 약물 효과 예측 장치 및 그 방법

Similar Documents

Publication Publication Date Title
Rostami et al. A novel community detection based genetic algorithm for feature selection
Majumder et al. 500+ times faster than deep learning: A case study exploring faster methods for text mining stackoverflow
US20200160212A1 (en) Method and system for transfer learning to random target dataset and model structure based on meta learning
US20190130249A1 (en) Sequence-to-sequence prediction using a neural network model
US10262272B2 (en) Active machine learning
CA3116705A1 (en) Semi-supervised person re-identification using multi-view clustering
Agrawal et al. Global K-means (GKM) clustering algorithm: a survey
CN111127364B (zh) 图像数据增强策略选择方法及人脸识别图像数据增强方法
Zhao et al. Protein-protein interaction interface residue pair prediction based on deep learning architecture
US11455161B2 (en) Utilizing machine learning models for automated software code modification
US20150161232A1 (en) Noise-enhanced clustering and competitive learning
US10929775B2 (en) Statistical self learning archival system
CN113806582B (zh) 图像检索方法、装置、电子设备和存储介质
CN114974397A (zh) 蛋白质结构预测模型的训练方法和蛋白质结构预测方法
KR20180087069A (ko) 자가 학습을 통한 약물-단백질간 관계 예측을 위한 모델링 기법
US20240127575A1 (en) Artificial intelligence system with iterative two-phase active learning
Wan et al. Using deep maxout neural networks to improve the accuracy of function prediction from protein interaction networks
US11599797B2 (en) Optimization of neural network in equivalent class space
Bai et al. Neural maximum common subgraph detection with guided subgraph extraction
CN114420221B (zh) 一种基于知识图谱辅助的多任务药物筛选方法和系统
Kotloff et al. Assessment of the prevalence and risk factors for human immunodeficiency virus type 1 (HIV-1) infection among college students using three survey methods
US11797776B2 (en) Utilizing machine learning models and in-domain and out-of-domain data distribution to predict a causality relationship between events expressed in natural language text
US20220292393A1 (en) Utilizing machine learning models to generate initiative plans
Subair et al. Implementations and applications of machine learning
CN114300036A (zh) 遗传变异致病性预测方法、装置、存储介质及计算机设备

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application