JP2018181290A - 改良した情報測定とgaに基づくフィルター式特徴選択アルゴリズム - Google Patents

改良した情報測定とgaに基づくフィルター式特徴選択アルゴリズム Download PDF

Info

Publication number
JP2018181290A
JP2018181290A JP2017130667A JP2017130667A JP2018181290A JP 2018181290 A JP2018181290 A JP 2018181290A JP 2017130667 A JP2017130667 A JP 2017130667A JP 2017130667 A JP2017130667 A JP 2017130667A JP 2018181290 A JP2018181290 A JP 2018181290A
Authority
JP
Japan
Prior art keywords
genes
gene
algorithm
information
feature selection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017130667A
Other languages
English (en)
Other versions
JP6240804B1 (ja
Inventor
魏小▲鵬▼
xiao peng Wei
▲張強▼
Jiang Chang
周昌▲軍▼
Changjun Zhou
▲韓麗▼君
Lijun Han
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University
Original Assignee
Dalian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University filed Critical Dalian University
Application granted granted Critical
Publication of JP6240804B1 publication Critical patent/JP6240804B1/ja
Publication of JP2018181290A publication Critical patent/JP2018181290A/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

【課題】 本発明は改良した情報測定とGAに基づくフィルター式特徴選択アルゴリズム(IMGA)を設計し、情報測定で遺伝的アルゴリズムの適応度関数を構築して遺伝的アルゴリズムに対し遺伝子発現データの特徴選択に適用できるように改良し、最適な遺伝子サブセットを検索し、SVMを分類器として、選択した特徴サブセットの分類効果を評定する。【解決手段】 従来方法に比べて、提供した方法は効果的な特徴選択方法であり、より優れた分類性能を実現できる。【選択図】 図1

Description

本発明は特徴選択方法に関し、具体的には、情報測定で遺伝的アルゴリズムの適応度関数を構築して遺伝的アルゴリズムに対し遺伝子発現データの特徴選択に適用できるように改良し、最適な遺伝子サブセットを検索するものである。腫瘍遺伝子発現データの分析分野に属する。
腫瘍のタイプを正確に診断することは腫瘍の臨床的治療に対して大切なことであり、マイクロアレイ技術の更なる発展に伴って、大量の腫瘍遺伝子発現データは取得されたが、そのうち、少数の遺伝子だけは本質的にサンプルカテゴリーに関連し、これは腫瘍の分類に利便性をもたらすとともに新しい難問が発生する。如何に腫瘍遺伝子発現プロファイリングデータを効果的に分析して、分類との関連性が強い特徴遺伝子を選択するかは非常に大切なことである。
特徴選択は効果的な方法の一種である。特徴選択(遺伝子選択)は腫瘍分類に対し最も有用な重要な遺伝子を識別して、できるだけ多数の無関係な遺伝子を除去することを目的とする。ノイズ遺伝子を除去して、分類モデルの性能や効率を改善して、オーバーフィッティングを減少させる。過去数十年間、多数の学者は遺伝子選択方法の研究に取り組んで、多数の有効な方法を開発し、分類器の使用方式に応じて、Filter法、wrapper法及びembedded法の三種類に大別される。Filter法はいくつかの判断基準に準じて特徴とカテゴリーの関連性、又は特徴同士の内部関係を評定することで冗長情報を迅速に削除するものであり、M.DashとH.Liuは従来の判断基準として、距離測定、情報測定、依存性測定、一貫性測定及び誤分類率測定の五種類に分ける。その長所は、分類器に依存せず且つ計算速度が高いことにある。代表的な方法としては、SNR、Relief、mRMRが挙げられる。wrapper法は分類器の識別率を指標として、分類器の識別率を最高にする1群の特徴サブセットを検索する方法であり、一般的な検索方法としては、シーケンシャルフォワードセレクション法(SFS)、ヒューリスティック探索、遺伝的アルゴリズムGA等が挙げられる。embedded法は、分類器中の一部の特性を特徴性能の判断基準として、特定の分類器訓練過程において特徴選択を実施する方法である。代表的な方法としては、例えばSVMRFE、ランダムフォレスト(Random Forest)が挙げられる。その中でも、wrapper法とembedded法は取得した分類確率がFilter法より高いが、分類器に依存しなければならず、wrapper法は最適な特徴サブセットを検索する時にNP困難が存在し、且つオーバーフィッティングが発生しやすく、embedded法は特徴によるターゲット関数への影響を向上又は低下させるのに分類器のターゲット関数を把握しなければならず、従って、embedded法は特定の分類器に対応した方法で、且つ時間複雑性が高い。
遺伝的アルゴリズムは生物圏での自然淘汰と自然遺伝メカニズムをシミュレートした知的検索アルゴリズムであり、1975年にHolland教授により始めて提案された以来、シンプルな遺伝的アルゴリズム(SGA)と呼ばれ、グローバルパラレルが可能であり、シンプルで汎用性が高く、ロバスト性が高い等の利点を有するため、コンピュータサイエンス、人工知能、オートコントロール等の分野に幅広く適用される。特徴選択は典型的な組合せ最適化問題であり、遺伝的アルゴリズムはグローバル検索最適化アルゴリズムとして、最適な特徴組合せを検索できる。Sklanskyは1989年に遺伝的アルゴリズムを特徴選択に用いると、高い結果を取得した。しかしながら、従来の遺伝的アルゴリズムは一般的に分類器の確率を特徴サブセット検索用のターゲット関数とすることによって、計算の複雑さが高まる。
腫瘍分類に用いる特徴選択方法は、元の遺伝子のうちから腫瘍のカテゴリーとの関連性が強い遺伝子を選択し、できる限り少ない情報遺伝子でできるだけ高いサンプル分類確率を取得することを目的とする。本発明では、情報測定と遺伝的アルゴリズムに基づくフィルター式特徴選択アルゴリズムを腫瘍分類に用いることを提案する。特徴選択アルゴリズムの検索速度を高めるために、まずBhattacharyya距離を用いて大量の無関係な遺伝子を迅速に削除して、150個の特徴遺伝子を選択した。次に情報測定で遺伝的アルゴリズムのターゲット関数を構築して最適なサブセットを検索し、且つ遺伝的アルゴリズムに対し遺伝子選択に適用できるように改良した。最後にサポートベクターマシンを用いて選択した最適な遺伝子サブセットを分類した。実験によって、開示された三種類の癌症データセットにおいて方法の性能を検証した結果、該方法は少ない情報遺伝子で高い分類確率を実現できることが明らかになる。
特表2011-526783号公報
本発明の目的は、改良した情報測定とGAに基づくフィルター式特徴選択アルゴリズム(IMGAアルゴリズム)を提案することであり、情報測定で遺伝的アルゴリズムの適応度関数を構築して遺伝的アルゴリズムに対し遺伝子発現データの特徴選択に適用できるように改良し、最適な遺伝子サブセットを検索し、最後にサポートベクターマシンを用いてデータを分類することを主旨とする。言い換えれば、改良した情報測定とGAに基づくフィルター式特徴選択アルゴリズムを腫瘍分類に用いると、情報遺伝子を選択でき、且つ、小さい特徴サブセット代で元の遺伝子データに代わり、より高い分類確率を取得できる。
本発明の技術案は、まずBhattacharyya距離を用いて150個の候補遺伝子サブセットをスクリーニングすることによって、カテゴリーとの関連性が強い情報遺伝子を残すとともに大量の無関係な遺伝子を除去し、次に改良した情報測定とGAに基づくフィルター式特徴選択アルゴリズム(IMGAアルゴリズム)を用いてこの150個の候補遺伝子サブセットのうちから関連性が最も強い特徴遺伝子サブセットを選択し、最後にデータ分析を容易にするために特徴サブセットデータに正規化処理を行い、サポートベクターマシンを用いて分類することである。実験によって、開示された腫瘍データセットにおいて方法の性能を検証する。
従来技術に比べて、本発明は以下の利点を有する。
1.分類器の性能によらずに遺伝子とカテゴリーの間の関係を判断するため、得られた情報遺伝子はより信頼でき且つ効果的である。
2.IMGAアルゴリズムで検索した情報遺伝子の個数を自在に制御可能であることは、後続の遺伝子個数による分類正確率への影響を研究することを可能にする。
3.IMGAアルゴリズムは検索性能に優れるとともに、検索速度が高い。
4.IMGAアルゴリズムで検索した情報遺伝子は分類関連性が高いため、小さい遺伝子サブセットで高分類確率を実現できる。
要するに、IMGAアルゴリズムは分類器の性能によらずに遺伝子とカテゴリーの間の関係を判断するため、得られた情報遺伝子がより信頼でき且つ効果的であり、IMGAアルゴリズムで検索した情報遺伝子の個数を自在に制御できることは、後続の遺伝子個数による分類正確率への影響を研究することを可能にする。IMGAアルゴリズムは検索性能に優れるとともに、検索速度が高い。IMGAアルゴリズムで検索した情報遺伝子は分類関連性が強く、小さい遺伝子サブセットで高分類確率を実現できる。
遺伝子発現アレイを示す。 三つのデータセットでのIMGAの適応度の変化曲線を示す。 leukemiaデータセットでの三種類の方法の比較を示す。 lung cancerデータセットでの三種類の方法の比較を示す。 prostate cancerデータセットでの三種類の方法の比較を示す。
以下、本発明の実施の形態について図面を参照して説明する。
改良した情報測定とGAに基づくフィルター式特徴選択アルゴリズムは、遺伝子発現データを対応したフォーマットで対応したドキュメントに記憶して、コンピュータプログラミング言語がこれら情報を識別して処理できるようにし、具体的にステップは以下のとおりである。
ステップ1:まずBhattacharyya距離を用いて150個の候補遺伝子サブセットをスクリーニングすることによって、カテゴリーとの関連性が強い情報遺伝子を残すとともに大量の無関係な遺伝子を除去する。
ステップ2:遺伝子と遺伝子の間の情報エントロピー、及び遺伝子とカテゴリーの間の相互情報量を計算して、適応度関数を構築する。
ステップ3:IMGAアルゴリズムを用いてこの150個の候補遺伝子サブセットのうちから関連性が最も強い特徴遺伝子サブセットを選択する。
ステップ4:サポートベクターマシンを用いて腫瘍遺伝子発現データを分類する。
具体的には、本発明の実施例は本発明の技術案に基づいて実施するものであり、詳細な実施形態や具体的な操作過程を説明したが、本発明の保護範囲は下記実施例に制限されない。
まず、Bhattacharyya距離を用いて150個の候補遺伝子サブセットをスクリーニングする。次に、遺伝子発現データをE(X,Y)={x,x,……x;Y}で示すとし、式中、X={x,x,……x}はm個の遺伝子、Yはカテゴリーを示す。
適応度関数の解を求める過程:遺伝的アルゴリズムができるか限り少なく且つできるだけ高いサンプル分類率を実現できる情報遺伝子サブセットを検索できるように、検索した情報遺伝子サブセットは以下を満たさなければならない。
1、遺伝子自体毎に高情報量を含む。
2、遺伝子とカテゴリーの間の関連性が強い。
3、この情報遺伝子サブセットでは、遺伝子と遺伝子の間の冗長度が小さい。遺伝子自体に含まれる情報量は遺伝子の情報エントロピーH(x)で示され、遺伝子とカテゴリーの間の関連性は遺伝子とカテゴリーの間の相互情報量I(x;y)で示され、遺伝子と遺伝子の間の冗長度の大きさは遺伝子と遺伝子の間の相互情報量I(x;x)で示される。情報測定を有効な判断基準としてもよく、本発明は情報測定で適応度関数を構築する方法を提案し、関数式が最小冗長性最大関連性アルゴリズム(mRMR)に基づくものであり、且つ、遺伝子自体に含まれる情報量による、遺伝的アルゴリズムで検索した遺伝子サブセット及びこれから得られた分類性能への影響を考慮に入れ、従って、ここで適応度関数は式(1)としてもよく、次に、改良した遺伝的アルゴリズムで最適な遺伝子サブセットを検索する。
式(1)
以下は、具体的にIMGAのステップを説明する。
入力:遺伝子の個数k、遺伝子の情報エントロピーH(x)、遺伝子とカテゴリーの間の相互情報量I(x;y)及び遺伝子と遺伝子の間の相互情報量I(x;x)。
出力:k個の遺伝子のインデックス番号。
(1)番号付けは遺伝的アルゴリズムが解決しようとする緊迫な問題であり、選択される遺伝子の個数がkであるため、コードストリングの長さがkとなる。 m個の遺伝子であれば、直接1−mの番号で、番号1−mの遺伝子を代表する。結果として、k個の1− mの整数を出力して、検索した遺伝子の番号を代表する。
(2)ランダムに N個の集団、すなわちN個のコードストリングを生成する。集団の数が多いほど、大域解を見つける可能性が高い。
(3)式(1)により適応度値を計算する。
(4)適応度値の昇順に従って、対応した個体を順位付けする。適応度値が最適な個体を選択して直接次世代の遺伝的操作に供する。適応度値が最適な個体を選択する確率をqとして定義すれば、順位付け後のi番目の個体の確率をPとして定義し、
ルーレット戦略に基づき父親を選択し、検索アルゴリズムのランダム性を強化させるため、ランダムに母親を選択し、なお、適応度が高い個体であれば、父親として選択される可能性が高い。
(5)個体の多様性を向上させて、大域解を検索しやすくために、単に両親を交叉(Parents cross)して2つの後代を発生するのではなく、新しい個体が発生するたびに両親を交叉し、交叉際に、父親個体又は母親個体のi番目の遺伝子をランダムに選択して新しい個体のi番目の遺伝子とする。
(6)極めて小さい変異確率をPとして設定し、条件を満たすと、個体のコード中の対応した遺伝子をほかのものに突然変異する。
(7)数字番号で番号を付けるため、交叉と変異操作をして得た新しい個体に対し、重複番号を付けることが不可避的であり、従って、個体のうち使用されたことのない番号を見付けて、個体の重複番号を置換する。
(8)ステップ(3)、(4)、(5)、(6)、(7)を、最大遺伝世代数に達し又は制約条件を満たすまで繰り返し、アルゴリズムが自動的に終了して、最適な遺伝子サブセットのインデックス番号を出力する。
最後に、サポートベクターマシンを用いて分類して、分類確率を取得する。
以上に示されるステップによって、三種類の実際な腫瘍遺伝子発現データ(leukemia、lung cancer、prostate cancer)について関連操作を行って、IMGAの検索性能とIMGAアルゴリズムで検索した遺伝子サブセットの分類性能の2つの点についてIMGAアルゴリズムの有効性を評定し、IMGAの検索性能については三個のデータセットでのIMGAアルゴリズムの適応度の変化曲線(図2参照)を示し、IMGAアルゴリズムで検索した遺伝子サブセットの分類性能については、2種の従来のフィルター式選択アルゴリズム(mRMR、Relief)の分類性能の比較図(図3、4、5参照)を示す。
以上に述べたとおり、情報エントロピーと相互情報量を用いて適応度関数を構築し、遺伝的アルゴリズムに対し、腫瘍遺伝子発現データの特徴選択に適用できるように改良する情報測定と遺伝的アルゴリズムに基づくフィルター式特徴選択方法IMGAが提供されている。
IMGAの利点は以下のとおりである。
1、分類器の性能によらずに遺伝子とカテゴリーの間の関係を判断するため、得られた情報遺伝子はより信頼でき且つ効果的である。
2、IMGAアルゴリズムで検索した情報遺伝子の個数を自在に制御できることは、後続の遺伝子の個数による分類正確率への影響の研究を可能にする。
3、IMGAアルゴリズムは検索性能に優れるとともに、検索速度が高い。
4、IMGAアルゴリズムで検索した情報遺伝子は分類関連性が強く、小さい遺伝子サブセットで高分類確率を取得できる。
以上は本発明の好適な実施形態に過ぎず、本発明の保護範囲を制限するものではなく、当業者であれば、本発明の開示した技術範囲を脱逸せずに、本発明の技術案及びその発明発想に基づいて行った均等な置換や変化は全て、本発明の保護範囲に含まれるべきである。

Claims (1)

  1. 改良した情報測定とGAに基づくフィルター式特徴選択アルゴリズムであって、
    まずBhattacharyya距離を用いて150個の候補遺伝子サブセットをスクリーニングすることで、カテゴリーとの関連性が強い情報遺伝子を残すとともに大量の無関係な遺伝子を除去するステップ1と、
    遺伝子と遺伝子の間の情報エントロピー、及び遺伝子とカテゴリーの間の相互情報量を計算して、適応度関数を構築するステップ2と、
    IMGAアルゴリズムを用いて上記150個の候補遺伝子サブセットから関連性の最も強い特徴遺伝子サブセットを選択するステップ3と、
    サポートベクターマシンを用いて腫瘍遺伝子発現データを分類するステップ4とを含み、
    前記ステップ2は具体的には、
    遺伝子の周辺確率、及び遺伝子とカテゴリーの同時確率(joint probability)分布を推定するステップ201と、
    遺伝子と遺伝子の情報エントロピー、カテゴリーの情報エントロピー、及び遺伝子とカテゴリーの同時確率を計算するステップ202と、
    遺伝子とカテゴリーの相互情報量を求めるステップ203とを含み、
    前記ステップ3は具体的には、
    数字番号で番号を付けるステップ301と、
    ランダムに集団を生成するステップ302と、
    適応度関数を計算するステップ303と、
    適応度値の昇順に従って、対応した個体を順位付けし、適応度値が最適な個体を選択して直接次世代の遺伝的操作に供し、ルーレット戦略に基づき父親を選択して、ランダムに母親を選択するステップ304と、
    新しい個体を発生するたびに両親交叉(parents cross)を用いるステップ305と、
    個体のコードにおける一部の遺伝子をほかのものに突然変異するステップ306と、
    個体中の重複した番号を置換するステップ307と、
    ステップ303、ステップ304、ステップ305、ステップ306、ステップ307を、最大遺伝世代数に達し、又は制約条件を満たすまで繰り返し、アルゴリズムが自動的に終了して、最適な遺伝子サブセットのインデックス番号を出力するステップ308とを含む
    ことを特徴とするフィルター式特徴選択アルゴリズム。
JP2017130667A 2017-04-13 2017-07-03 改良した情報測定とgaに基づくフィルター式特徴選択アルゴリズム Expired - Fee Related JP6240804B1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201710238132.1 2017-04-13
CN201710238132 2017-04-13

Publications (2)

Publication Number Publication Date
JP6240804B1 JP6240804B1 (ja) 2017-11-29
JP2018181290A true JP2018181290A (ja) 2018-11-15

Family

ID=60477063

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017130667A Expired - Fee Related JP6240804B1 (ja) 2017-04-13 2017-07-03 改良した情報測定とgaに基づくフィルター式特徴選択アルゴリズム

Country Status (1)

Country Link
JP (1) JP6240804B1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020231184A1 (ko) * 2019-05-14 2020-11-19 한양대학교 산학협력단 게놈 모듈 네트워크의 커널 모듈에 기반한 샘플 분석 방법 및 분석장치
KR20200131750A (ko) * 2019-05-14 2020-11-24 한양대학교 산학협력단 게놈 모듈 네트워크의 커널 모듈에 기반한 샘플 분석 방법 및 분석장치

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109144028B (zh) * 2018-07-17 2020-07-28 浙江工业大学 一种精馏塔能效退化检测方法
CN109934286B (zh) * 2019-03-12 2022-11-11 大连海事大学 基于文本特征提取和不平衡处理策略的Bug报告严重程度识别方法
CN109829518A (zh) * 2019-03-15 2019-05-31 南开大学 基于信任度和改进遗传算法应用于无线传感器网络数据融合的一种方法
CN110210552B (zh) * 2019-05-28 2023-03-24 河南师范大学 一种基于容错的基因选择方法与装置
CN111275127B (zh) * 2020-02-13 2024-01-09 河马互联网信息科技(深圳)有限公司 基于条件互信息的动态特征选择方法
CN113160881B (zh) * 2021-05-14 2023-10-20 东北大学 一种基于mRMR和MBFA的高维数据特征选择方法
CN113362920B (zh) * 2021-06-15 2023-04-18 电子科技大学 基于临床数据的特征选择方法及装置
CN114970709A (zh) * 2022-05-20 2022-08-30 武汉理工大学 基于改进ga的数据驱动型ahu多故障诊断特征选择方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002101357A2 (en) * 2001-06-10 2002-12-19 Irm Llc Molecular signatures of commonly fatal carcinomas
JP2004033210A (ja) * 2002-02-20 2004-02-05 Ncc Technology Ventures Pte Ltd 癌診断に関する物および方法
JP2005502097A (ja) * 2001-01-24 2005-01-20 バイオウルフ テクノロジーズ エルエルスィー 生体系のパターンを識別する方法及びその使用
JP2008520324A (ja) * 2004-11-19 2008-06-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コンピュータ支援による肺結節誤検出低減における不均衡なケース数を克服するための層化方法
JP2009529723A (ja) * 2006-03-10 2009-08-20 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スペクトル分析を介したdnaパターンの同定方法及びシステム
WO2009138909A1 (en) * 2008-05-12 2009-11-19 Koninklijke Philips Electronics N.V. A medical analysis system
JP2011526783A (ja) * 2008-07-03 2011-10-20 ナショナル・ユニバーシティー・ホスピタル 化学療法に対する腫瘍応答を予測するための方法および腫瘍治療の選択
EP2402464A1 (en) * 2006-11-13 2012-01-04 Source Precision Medicine, Inc. d/b/a Source MDX. Gene expression profiling for identification, monitoring, and treatment of colorectal cancer
EP2405022A2 (en) * 2008-07-08 2012-01-11 Genomic Health, Inc. Gene expression profiling for predicting the survivability of prostate cancer subjects
WO2012012510A2 (en) * 2010-07-21 2012-01-26 Dxterity Diagnostics Gene expression profiling for the identification of lung cancer

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005502097A (ja) * 2001-01-24 2005-01-20 バイオウルフ テクノロジーズ エルエルスィー 生体系のパターンを識別する方法及びその使用
WO2002101357A2 (en) * 2001-06-10 2002-12-19 Irm Llc Molecular signatures of commonly fatal carcinomas
JP2004033210A (ja) * 2002-02-20 2004-02-05 Ncc Technology Ventures Pte Ltd 癌診断に関する物および方法
JP2008520324A (ja) * 2004-11-19 2008-06-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コンピュータ支援による肺結節誤検出低減における不均衡なケース数を克服するための層化方法
JP2009529723A (ja) * 2006-03-10 2009-08-20 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スペクトル分析を介したdnaパターンの同定方法及びシステム
EP2402464A1 (en) * 2006-11-13 2012-01-04 Source Precision Medicine, Inc. d/b/a Source MDX. Gene expression profiling for identification, monitoring, and treatment of colorectal cancer
WO2009138909A1 (en) * 2008-05-12 2009-11-19 Koninklijke Philips Electronics N.V. A medical analysis system
JP2011526783A (ja) * 2008-07-03 2011-10-20 ナショナル・ユニバーシティー・ホスピタル 化学療法に対する腫瘍応答を予測するための方法および腫瘍治療の選択
EP2405022A2 (en) * 2008-07-08 2012-01-11 Genomic Health, Inc. Gene expression profiling for predicting the survivability of prostate cancer subjects
WO2012012510A2 (en) * 2010-07-21 2012-01-26 Dxterity Diagnostics Gene expression profiling for the identification of lung cancer

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020231184A1 (ko) * 2019-05-14 2020-11-19 한양대학교 산학협력단 게놈 모듈 네트워크의 커널 모듈에 기반한 샘플 분석 방법 및 분석장치
KR20200131750A (ko) * 2019-05-14 2020-11-24 한양대학교 산학협력단 게놈 모듈 네트워크의 커널 모듈에 기반한 샘플 분석 방법 및 분석장치
KR102346561B1 (ko) 2019-05-14 2022-01-03 한양대학교 산학협력단 게놈 모듈 네트워크의 커널 모듈에 기반한 샘플 분석 방법 및 분석장치

Also Published As

Publication number Publication date
JP6240804B1 (ja) 2017-11-29

Similar Documents

Publication Publication Date Title
JP6240804B1 (ja) 改良した情報測定とgaに基づくフィルター式特徴選択アルゴリズム
CN108846259B (zh) 一种基于聚类和随机森林算法的基因分类方法及系统
Sathya et al. Cancer categorization using genetic algorithm to identify biomarker genes
CN110853756B (zh) 基于som神经网络和svm的食管癌风险预测方法
CN110097169A (zh) 一种混合abc和cro的高维特征选择方法
Bhardwaj et al. A genetically optimized neural network for classification of breast cancer disease
CN106951728B (zh) 一种基于粒子群优化和打分准则的肿瘤关键基因识别方法
Costa et al. Demonstrating the Evolution of GANs through t-SNE
CN114153839A (zh) 多源异构数据的集成方法、装置、设备及存储介质
CN112183598A (zh) 一种基于遗传算法的特征选择方法
Maredia Analysis of Google Play Store Data set and predict the popularity of an app on Google Play Store
JP2011257805A (ja) 情報処理装置および方法、並びにプログラム
Poongodi et al. Identification of Bio-Markers for Cancer Classification Using Ensemble Approach and Genetic Algorithm.
El Rahman et al. Machine learning model for breast cancer prediction
Mallenahalli et al. A Tunable particle swarm size optimization algorithm for feature selection
Assiroj et al. Comparing CART and C5. 0 algorithm performance of human development index
JP2017091083A (ja) 情報処理装置、情報処理方法、およびプログラム
Anand et al. Building an intelligent integrated method of gene selection for facioscapulohumeral muscular dystrophy diagnosis
CN117437976B (zh) 基于基因检测的疾病风险筛查方法及系统
Wang et al. Semisupervised Bacterial Heuristic Feature Selection Algorithm for High-Dimensional Classification with Missing Labels
Alzubaidi et al. A new hybrid global optimization approach for selecting clinical and biological features that are relevant to the effective diagnosis of ovarian cancer
CN112465009B (zh) 一种软件崩溃故障位置定位方法
Miranda et al. Multi-Objective Optimization of Sampling Algorithms Pipeline for Unbalanced Problems
López-González et al. Predicting survivability using breast cancer subtype with transcriptomic profiles
CN112802555B (zh) 一种基于mvAUC的互补差异表达基因选取方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171030

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171106

R150 Certificate of patent or registration of utility model

Ref document number: 6240804

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees