JP6941309B2 - 遺伝子変異の評価装置、評価方法、プログラム、および記録媒体 - Google Patents

遺伝子変異の評価装置、評価方法、プログラム、および記録媒体 Download PDF

Info

Publication number
JP6941309B2
JP6941309B2 JP2020507315A JP2020507315A JP6941309B2 JP 6941309 B2 JP6941309 B2 JP 6941309B2 JP 2020507315 A JP2020507315 A JP 2020507315A JP 2020507315 A JP2020507315 A JP 2020507315A JP 6941309 B2 JP6941309 B2 JP 6941309B2
Authority
JP
Japan
Prior art keywords
mutation
score
evaluated
information
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020507315A
Other languages
English (en)
Other versions
JPWO2019181022A1 (ja
Inventor
正隆 菊地
正隆 菊地
明弘 中谷
明弘 中谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Osaka University NUC
Original Assignee
NEC Corp
Osaka University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Osaka University NUC filed Critical NEC Corp
Publication of JPWO2019181022A1 publication Critical patent/JPWO2019181022A1/ja
Application granted granted Critical
Publication of JP6941309B2 publication Critical patent/JP6941309B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M1/00Apparatus for enzymology or microbiology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M1/00Apparatus for enzymology or microbiology
    • C12M1/36Apparatus for enzymology or microbiology including condition or time responsive control, e.g. automatically controlled fermentors
    • C12M1/38Temperature-responsive control
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/20ICT specially adapted for the handling or processing of medical references relating to practices or guidelines

Description

本発明は、遺伝子変異の評価装置、評価方法、プログラム、および記録媒体に関する。
遺伝子変異は、様々な形質に影響を及ぼすことから、遺伝子変異を抽出し、その遺伝子変異が、どのような形質と関連するのかを解析することが重要となっている。前記形質としては、例えば、疾患、薬剤への応答性が一般的であるが、近年では、これらにはとどまらず、さらに、生活習慣を含む環境に関連する形質にも着目されている。
遺伝子変異と形質との関連性の同定は、通常、次世代シーケンサー、マイクロアレイ等を用いた、網羅的な遺伝子変異の解析が利用されている(特許文献1)。しかしながら、解析によって多数の遺伝子変異が候補として見つかるため、各遺伝子変異について、それぞれが、どのような形質と関連するのかを明らかにし、ある形質に対して、関連性の優先度が相対的に高いものを選別することが必要になっている。
特開2018−191716号公報
このように、多数の遺伝子変異が候補として見つかるものの、これらの遺伝子変異群は、遺伝子変異間の関連性が明らかではない。このため、解析においては、単一位置の変異に関して、一つ一つ、形質との関連性を推測していくしかないのが現状である。しかし、1座位変異のみに着目して形質との関連性を分析した場合、例えば、変異の検出エラー、形質の測定誤差等が原因となり、実際には形質に影響がある変異にもかかわらず、関連性があると判定できず(偽陰性)、関連性のある遺伝子変異候補として取りこぼす可能性があった。
そこで、本発明は、例えば、単一位置の変異情報からは、見かけ上、形質との関連性が無いと考えられる場合であっても、形質との関連性を示す遺伝子変異候補としての拾い上げを可能とする、新たな遺伝子変異の評価システムの提供を目的とする。
前記目的を達成するために、本発明の遺伝子変異の評価装置は、
通信部、被評価変異情報取得部、スコア付与部、スコア判定部、領域変異情報取得部、スコア再付与部、および評価スコア決定部を含み、
前記通信部は、
形質に対する遺伝子変異の情報が記憶されたデータベースと通信可能であり、
前記被評価変異情報取得部は、
共通の形質を示すサンプル群において共通する遺伝子変異の変異情報を、被評価変異の変異情報として取得し、
前記変異情報は、変異の位置情報と変異の塩基情報とを含み、
前記スコア付与部は、
前記データベース情報に基づいて、前記被評価変異に対して、前記データベース情報の形質への関連性を示す第1スコアを付与し、
前記スコア判定部は、
前記被評価変異の第1スコアと、関連性の閾値とを照合し、前記第1スコアが前記関連性の閾値に満たない場合、前記被評価変異を再スコア化対象と判定し、
前記領域変異情報取得部は、
前記データベース情報に基づいて、前記再スコア化対象の被評価変異に対する関連領域における遺伝子変異を、領域変異情報として取得し、
前記スコア再付与部は、
前記再スコア化対象の被評価変異について、前記領域変異情報に基づいて、前記第1スコアに重み付けした第2スコアを付与し、
前記評価スコア決定部は、
前記第2スコアを、前記再スコア化対象の被評価変異の評価スコアとして決定する、
ことを特徴とする。
本発明の遺伝子変異の評価方法は、
被評価変異情報取得工程、スコア付与工程、スコア判定工程、領域変異情報取得工程、スコア再付与工程、および評価スコア決定工程を含み、
形質に対する遺伝子変異の情報が記憶されたデータベースと通信可能であり、
前記被評価変異情報取得工程は、
共通の形質を示すサンプル群において共通する遺伝子変異の変異情報を、被評価変異の変異情報として取得し、
前記変異情報は、変異の位置情報と変異の塩基情報とを含み、
前記スコア付与工程は、
前記データベース情報に基づいて、前記被評価変異に対して、前記データベース情報の形質への関連性を示す第1スコアを付与し、
前記スコア判定工程は、
前記被評価変異の第1スコアと、関連性の閾値とを照合し、前記第1スコアが前記関連性の閾値に満たない場合、前記被評価変異を再スコア化対象と判定し、
前記領域変異情報取得工程は、
前記データベース情報に基づいて、前記再スコア化対象の被評価変異に対する関連領域における遺伝子変異を、領域変異情報として取得し、
前記スコア再付与工程は、
前記再スコア化対象の被評価変異について、前記領域変異情報に基づいて、前記第1スコアに重み付けした第2スコアを付与し、
前記評価スコア決定工程は、
前記第2スコアを、前記再スコア化対象の被評価変異の評価スコアとして決定する、
ことを特徴とする。
本発明のプログラムは、前記本発明の遺伝子変異の評価方法をコンピュータに実行させることを特徴とする。
本発明の記録媒体は、前記本発明のプログラムを記録したコンピュータ読み取り可能である。
本発明によれば、例えば、単一位置の遺伝子変異について、見かけ上、形質との関連性があると判定できない場合であっても、さらに、前記遺伝子変異の関連領域の情報を参照することによって、前記形質と関連性を示す可能性がある遺伝子変異を拾い上げることができる。このため、遺伝子変異と形質との関連性について、より効率の良い評価を行うことができる。
図1は、実施形態1の評価装置の一例を示すブロック図である。 図2は、実施形態1の評価装置のハードウエア構成の一例を示すブロック図である。 図3は、実施形態1の評価方法の一例を示すフローチャートである。 図4は、形質に対する関連度と染色体位置との関係を示すシミュレーショングラフである。 図5は、実施形態2において、被評価変異と、形質との関連性を示す評価スコアとの関係を視覚化したグラフである。
本発明の実施形態について説明する。なお、本発明は、以下の実施形態には限定されない。なお、以下の各図において、同一部分には、同一符号を付している。また、各実施形態の説明は、特に言及がない限り、互いの説明を援用できる。さらに、各実施形態の構成は、特に言及がない限り、組合せ可能である。
[実施形態1]
(1)評価装置
図1は、本実施形態の遺伝子変異の評価装置10の一例の構成を示すブロック図である。図1に示すように、評価装置10は、被評価変異情報取得部11、スコア付与部12、スコア判定部13、領域変異情報取得部14、スコア再付与部15、および評価スコア決定部16、通信部19を含む。評価装置10は、例えば、さらに、記憶部17、および出力部18を備えてもよい。評価装置10は、例えば、評価システムともいう。
評価装置10は、例えば、前記各部を含む1つの評価装置でもよいし、前記各部が、通信回線網を介して接続可能な評価装置であってもよい。
評価装置10は、通信部19を有し、データベース30(301、302、303、304)と通信可能である。評価装置10とデータベース30とは、例えば、図1に示すように、通信部19により、通信回線網20を介して接続可能である。通信回線網20は、特に制限されず、公知のネットワークを使用でき、例えば、有線でも無線でもよい。通信回線網20は、例えば、インターネット回線、電話回線、LAN(Local Area Network)、WiFi(Wireless Fidelity)等があげられる。なお、本実施形態1は、一例として、評価装置10とデータベース30とが、通信部19により、通信回線網20を介して接続する形態を示したが、これには制限されず、評価装置10とデータベース30とが、例えば、通信部19により、有線によって電気的に接続されることによって、通信可能であってもよい。前記有線による接続は、例えば、コードによる接続でもよいし、通信回線網を利用するためのケーブル等による接続でもよい。
評価装置10と通信するデータベース30は、例えば、その種類およびその数は制限されない。データベース30は、形質に対する遺伝子変異の情報が記憶されたデータベースであればよい。データベース30は、例えば、公共のデータベースが使用でき、PolyPhen、ExAC、Clinvar、日本人ゲノムデータ(iJGVD)、SIFT、CADD等などのデータベースがあげられる。また、本発明において、前記データベースは、例えば、本願の出願時において存在するデータベースには限られず、出願後の新たなデータベースも利用できる。
データベース30の情報において、前記形質の種類は、特に制限されず、例えば、疾患、薬剤への応答性、生活習慣に関連する形質、身体的特徴の形質、運動能力または学力等の形質等、様々なものがあげられる。前記疾患は、例えば、国際疾病分類表の分類が利用できる。前記形質が疾患の場合、例えば、前記形質に対する遺伝子変異は、前記疾患の患者群と正常者群との間で、有意差のある遺伝子変異である。前記形質が特定疾患の場合、例えば、前記形質に対する遺伝子変異は、前記特定疾患の患者群と、前記特定疾患ではない患者群(例えば、前記特定疾患についての正常者群、または、健常者群)との間で有意差のある遺伝子変異である。
被評価変異情報取得部11は、共通の形質を示すサンプル群において共通する遺伝子変異の変異情報を、被評価変異の変異情報として取得する。前記変異情報の取得方法は、特に制限されない。被評価変異情報取得部11は、例えば、後述する入力装置等を用いたユーザの入力によって、前記変異情報を取得してもよいし、前記通信回線網を介して、データベース等からの受信によって、前記変異情報を取得してもよい。
前記変異情報は、変異の位置情報と変異の塩基情報とを含む。前記位置情報とは、例えば、遺伝子における被評価変異の位置に関する情報であり、前記塩基情報とは、例えば、前記遺伝子における前記位置の塩基の種類に関する情報である。前記変異情報の形式は、特に制限されず、例えば、テキストデータ、VCFファイル等のファイル形式があげられる。
前記サンプル群とは、共通の形質を示すサンプル群である。前記形質の種類は、前述と同様に、何ら制限されず、任意の形質が設定できる。前記形質の種類は、例えば、疾患、薬剤への応答性、生活習慣に関連する形質、身体的特徴の形質、運動能力または学力等の形質等、様々なものがあげられる。前記サンプル群の共通形質が疾患の場合、前記被評価変異は、例えば、前記疾患の患者群と正常者群との間で、有意差のある遺伝子変異である。前記共通する遺伝子変異は、例えば、データベース、論文等の情報から取得してもよいし、形質Xを示すサンプル群Xの変異情報と、形質Xを示さないサンプル群Xの変異情報とから、抽出して取得してもよい。サンプル群の種類は、特に制限されず、例えば、疾患の有無、疾患の重度、コホート、人種、性別、年代等、様々なファクターにより分類されたサンプル群があげられる。
サンプル群において共通する遺伝子変異の数は、特に制限されず、例えば、1つでもよいし、2つ以上の複数でもよい。被評価変異情報取得部11は、例えば、前記サンプル群において共通する複数の遺伝子変異の変異情報を取得してもよい。
スコア付与部12は、前記データベース情報に基づいて、前記被評価変異に対して、前記データベース情報の形質への関連性を示す第1スコアを付与する。形質との関連性を示すスコアは、例えば、関連性を大小の比較により行うことができる相対値が好ましい。前記相対値は、例えば、関連性を示さない場合を、スコア0(ゼロ)とし、最も高い関連性を示す場合を、スコア1と設定することによって、関連性が小さい程、0に近いスコアを付与し、関連性が大きい程、1に近いスコアを付与できる。
評価装置10が、通信部19により複数のデータベースと通信可能な場合、スコア付与部12は、例えば、前記複数のデータベースごとに、前記データベース情報に基づいて、前記被評価変異のスコアを算出し、前記データベースごとのスコアを統合し、統合スコアを、前記被評価変異の第1スコアとしてもよい。前記統合スコアの算出方法は、特に制限されず、例えば、前記データベースごとのスコアを用いた加重線形和により算出できる。前記データベースは、一般に、それぞれで値のスケールが異なっている。このため、例えば、上述のように相対値によるスコア化を行い、統合することで、各データベースのスケールの違いによる影響を回避できる。
また、前記データベースごとのスコアは、例えば、前記データベースの精度に基づいて、重みづけしてもよい。前記データベースの精度は、例えば、任意で設定できる。
スコア判定部13は、前記被評価変異の第1スコアと、関連性の閾値とを照合し、前記第1スコアが前記関連性の閾値に満たない場合、前記被評価変異を再スコア化対象と判定する。閾値は、特に制限されず、任意に設定できる。スコア判定部13は、例えば、前記被評価変異の第1スコアと、関連性の閾値とを照合し、前記第1スコアが前記関連性の閾値を満たす場合、前記被評価変異を、前記データベース情報の形質に関連する変異と判定してもよい。
領域変異情報取得部14は、前記データベース情報に基づいて、前記再スコア化対象の被評価変異に対する関連領域における遺伝子変異を、領域変異情報として取得する。前記関連領域は、特に制限されず、任意に設定できる。前記被評価変異に対する関連領域の情報は、例えば、あらかじめ、記憶部17に記憶してもよい。
前記関連領域の長さは、特に制限されず、任意に設定でき、具体例として、例えば、±1万塩基長、±10万塩基長等があげられる。前記関連領域は、例えば、前記被評価変異の位置を含む連続配列があげられる。また、前記関連領域は、例えば、前記被評価変異の位置に対する連鎖の位置でもよいし、複数の連鎖の位置の組合せでもよいし、前記連鎖の位置を含む領域でもよい。また、前記関連領域は、例えば、前記被評価変異を有する遺伝子に関するコーディング領域、構造ドメイン等があげられる。
スコア再付与部15は、前記再スコア化対象の被評価変異について、前記領域変異情報に基づいて、前記第1スコアに重み付けした第2スコアを付与する。
評価スコア決定部16は、例えば、前記被評価変異の第1スコアが前記閾値を満たす場合、前記第1スコアを、前記被評価変異の評価スコアとして決定し、前記被評価変異の第1スコアが前記閾値を満たさない場合、前記第2スコアを、前記再スコア化対象の被評価変異の評価スコアとして決定する。
評価装置10において、スコア判定部13は、例えば、さらに、関連遺伝子変異判定部を兼ねてもよい。前記関連遺伝子変異判定部は、前記評価スコアと、前記関連性の閾値とを照合し、前記評価スコアが前記関連性の閾値を満たす被評価変異を、前記データベース情報の形質に関連する変異と判定してもよい。
評価装置10が記憶部17を有する場合、記憶部17は、例えば、データベース30からの情報、評価装置10の各部での処理に使用する情報、評価装置10の各部での処理によって得られる情報を、記憶してもよい。また、評価装置10において、記憶部17が、データベース30であってもよい。
評価装置10が出力部18を有する場合、出力部18は、例えば、評価装置10の各部での処理によって得られる情報を出力してもよい。出力部18による出力先は、例えば、評価装置10がディスプレイを有する場合は、ディスプレイでもよいし、また、後述する外部機器への出力でもよい。後者の場合、評価装置10と前記外部機器とは、例えば、通信回線網を介して、接続可能である。
(2)ハードウエア構成
図2に、評価装置10のハードウエア構成のブロック図を例示する。評価装置10は、例えば、CPU(中央処理装置)101、メモリ102、バス103、入力装置104、ディスプレイ105、通信デバイス110、記憶装置107等を有する。評価装置10の各部は、例えば、それぞれのインターフェイス(I/F)により、バス103を介して、相互に接続されている。
CPU101は、評価装置10の全体の制御を担う。評価装置10において、CPU101により、例えば、本発明のプログラムやその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。具体的に、評価装置10は、例えば、CPU101が、被評価変異情報取得部11、スコア付与部12、スコア判定部13、領域変異情報取得部14、スコア再付与部15、および評価スコア決定部16として機能する。
バス103は、例えば、CPU101、メモリ102等のそれぞれの機能部間を接続する。バス103は、例えば、外部機器とも接続できる。前記外部機器は、例えば、前述のデータベース30、ディスプレイ端末等があげられる。評価装置10は、バス103に接続された通信デバイス110により、通信回線網20に接続でき、通信回線網20を介して、前記外部機器と接続することもできる。通信デバイス110は、例えば、通信部19である。
メモリ102は、例えば、メインメモリを含み、前記メインメモリは、主記憶装置ともいう。CPU101が処理を行う際には、例えば、後述する補助記憶装置に記憶されている、本発明のプログラム等の種々の動作プログラム108を、メモリ102が読み込み、CPU101は、メモリ102からデータを受け取って、プログラム108を実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。メモリ102は、例えば、さらに、ROM(読み出し専用メモリ)を含む。
記憶装置107は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。記憶装置107は、例えば、記憶媒体と、前記記憶媒体に読み書きするドライブとを含む。前記記憶媒体は、特に制限されず、例えば、内蔵型でも外付け型でもよく、HD(ハードディスク)、FD(フロッピー(登録商標)ディスク)、CD−ROM、CD−R、CD−RW、MO、DVD、フラッシュメモリー、メモリーカード等があげられ、前記ドライブは、特に制限されない。記憶装置107は、例えば、記憶媒体とドライブとが一体化されたハードディスクドライブ(HDD)も例示できる。記憶装置107には、例えば、前述のように、動作プログラム108が格納される。また、記憶装置107は、例えば、評価装置10の前記記憶部であり、評価装置10に入力された情報、評価装置10で生成された情報等が格納されてもよい。
評価装置10は、例えば、さらに、入力装置104、ディスプレイ105等を有する。入力装置104は、例えば、タッチパネル、キーボード、マウス等である。ディスプレイ105は、例えば、LEDディスプレイ、液晶ディスプレイ等があげられ、例えば、出力部18となる。
(3)遺伝子変異の評価方法
本実施形態の評価方法は、例えば、図1および図2に示す評価装置10を用いて実施できる。なお、本実施形態の評価方法は、これらの図面に示す評価装置10の使用には限定されない。本実施形態の評価方法における記載は、前述した評価装置10に援用できる。
本実施形態の評価方法について、図3を用いて説明する。図3は、前記評価方法の一例を示すフローチャートである。以下の説明においては、一例として、サンプル群において共通する遺伝子変異が複数あり、これらの被評価変異について、1つのデータベース情報に基づいて評価を行う形態を例にあげて説明する。なお、複数の被評価変異は、例えば、それぞれについて、並行して処理を行ってもよいし、順次、処理を行ってもよい。
まず、前記被評価変異情報取得工程として、共通の形質を示すサンプル群において共通する遺伝子変異の変異情報を、被評価変異の変異情報として取得する(S100)。この工程は、例えば、評価装置10の被評価変異情報取得部11により実行できる。
前記サンプル群において共通する遺伝子変異の数(n)は、特に制限されず、1つでもよいし、2つ以上の複数でもよい。本実施形態においては、具体例として、前記サンプル群において共通する遺伝子変異として、下記4種類の遺伝子変異(変異M1、M2、M3、M4)を例示する。
Figure 0006941309
つぎに、前記スコア付与工程として、前記データベース情報に基づいて、前記被評価変異に対して、前記データベース情報の形質への関連性を示す第1スコアを付与する(S101)。この工程は、例えば、評価装置10のスコア付与部12により実行できる。
具体例において、例えば、形質Aに対する遺伝子変異の情報が蓄積されたデータベース1(DB1)を参照したとする。DB1には、形質Aと、各変異M1〜M4との関連性の情報も含まれると考えられる。そこで、前記DB1の情報に基づいて、形質Aに対する変異M1〜M4の関連性を示す第1スコアを付与すると、前記表1に示すように、例えば、変異M1〜M4には、それぞれ、0.9、0.1、0.3、0.1という第1スコアが付与できる。この第1スコアから、形質Aに対する関連性の高さは、変異M1、変異M3、変異M2および変異M4の順であることがわかる。
そして、前記スコア判定工程として、前記被評価変異の第1スコアと、関連性の閾値とを照合し、第1スコアが閾値を満たすか否かを判断する(S102)。そして、前記第1スコアが前記関連性の閾値に満たない場合(NO)、前記被評価変異を再スコア化対象と判定する(S103)。これらの工程は、例えば、評価装置10のスコア判定部13により実行できる。
前記閾値は、前述のように、任意に設定できる。スコアを、関連性が高い程大きく、関連性が低い程小さく設定した場合、例えば、第1スコアが閾値未満(または閾値以下)であれば、前記被評価変異を再スコア化対象と判定できる。一方、スコアを、関連性が高い程小さく、関連性が低い程大きく設定した場合、例えば、第1スコアが閾値を超える(または閾値以上)ならば、前記被評価変異を再スコア化対象と判定できる。
通常の方法であれば、被評価変異について、形質との関連性を示す第1スコアが、判定基準である閾値に満たない場合、前記被評価変異は、前記形質とは関連性がないものとして除外される。しかし、そのような被評価変異の中に、実際には前記形質と関連性を示すものが含まれる場合がある。これに対して、本発明は、閾値に満たない第1スコアの被評価変異について、以下に示すように、さらなるスコアの付与を行うことによって、実際には前記形質と関連性のある可能性の被評価変異を拾い上げることが可能になる。
具体例において、例えば、閾値=0.5とした場合、前記表1に示すように、変異M2、変異M3、および変異M4の第1スコアは、閾値未満であることから、再スコア化対象の被評価変異と判定される。
つぎに、前記領域変異情報取得工程として、前記データベース情報に基づいて、前記再スコア化対象の被評価変異に対する関連領域における遺伝子変異を、領域変異情報として取得する(S104)。この工程は、例えば、評価装置10の領域変異情報取得部14により実行できる。そして、前記スコア再付与工程として、前記再スコア化対象の被評価変異について、前記領域変異情報に基づいて、前記第1スコアに重み付けした第2スコアを付与する(S105)。この工程は、例えば、評価装置10のスコア再付与部15により実行できる。
これらの工程は、本発明者らが得た知見に基づくものである。そこで、本発明者らが得た知見について、図4のシミュレーショングラフを用いて説明する。図4は、本実施形態を説明するためのシミュレーショングラフであり、染色体位置、相対値の数値等は、単なる例示にすぎない。また、本発明は、以下の記載には制限されない。
図4(A)は、サンプル群の配列から検出された複数の被評価変異について、形質Aに対する相対値を示すシミュレーショングラフであり、X軸は、染色体位置であり、Y軸は、データベースにより示される形質Aに対する相対値(白丸)である。前記相対値は、前述のように、変異が形質に与える影響の度合い(有害度または関連度ともいう)を意味する。図4において、前記相対値は、下限を0、上限を1とする範囲で示したが、これには制限されず、例えば、各データベースにおいて示される値であってもよい。具体的には、例えば、関連解析では−log10 p値により表わすこともできる。図4(A)において、矢印で特定した染色体位置の被評価変異Mは、形質Aに対しては、非常に低い相対値しか示していない。このため、単一位置のみを考慮した場合、この変異Mは、形質Aに対しては関連性のないものとしてはじかれる。
つぎに、図4(B)は、図4(A)と同じシミュレーショングラフに対して、サンプル群の配列において検出できなかった、または、検出しなかった変異について、さらに、データベースに登録されている形質に対する相対値をプロットしたグラフである(黒丸)。図4(B)に示すように、変異Mの周辺には、形質に対して極めて高い相対値を示す変異が密集している。そして、遺伝子変異は、一般的に、その変異自体が直接的に形質に影響を与える場合もあれば、その変異自体は直接的に形質に影響しないが、前記変異の周囲または前記変異と連鎖関係にある位置の変異が、形質に影響を与える場合もある。このため、第1スコアにより相対値が低いと判定された場合であっても、変異Mの関連領域における変異情報を参照することによって、変異Mが、実際には形質Aに対する関連性を示す可能性があると考えられる。
そこで、図4(C)に示すように、変異Mの周辺の変異情報のプロット(黒丸)から、例えば、変異の密度曲線(W)を生成する。この密度曲線に基づいて、変異Mの相対値に重み付けを行うことにより、矢印で示すように、変異Mの相対値を、密度曲線上の相対値にまで引き上げることができる。密度曲線(W)は、例えば、カーネル関数を用いた補間等によって行うことができる。また、前記カーネル関数を用いた方法の他に、例えば、染色体上の距離に応じた重み付けにより、第2スコアを付与することもできる。つまり、このように、被評価変異Mの関連領域の領域変異情報を利用することで、第1スコアでは関連性がないと考えられる変異についても、重み付けした第2スコアを付与することで、さらなる評価を行うことも可能となる。
前記関連領域は、任意に設定できる。前記関連領域の設定条件は、例えば、予め、記憶部17に記憶してもよい。この場合、前記関連領域が、前述のように前記被評価変異を含む連続配列の場合、例えば、前記連続配列における前記被評価変異の位置、前記連続配列の長さ等を、設定条件とすることができる。また、前記関連領域が、前述のように前記被評価変異の位置に対する連鎖の位置の場合、例えば、変異ごとに、その位置に対する連鎖の位置を、設定条件とすることができる。前記関連領域における前記領域変異情報は、前記データベース情報から得ることができる。
具体例において、前記再スコア化対象の変異M2、変異M3、および変異M4について、それぞれの関連領域を設定し、各関連領域における遺伝子変異を、領域変異情報として取得する。前記関連領域における遺伝子変異とは、例えば、形質Aに対する遺伝子変異でもよいし、それ以外の形質に対する遺伝子変異でもよい。つまり、例えば、図4(A)において、前記サンプル群の遺伝子変異について、形質A(乳がん)に対する相対値を、白丸でプロットし、さらに、図4(B)において、データベースに登録された様々な染色体位置における遺伝子変異の乳がんに対する相対値を、黒丸でプロットしてもよい。また、例えば、図4(A)において、前記サンプル群の遺伝子変異について、形質A(乳がん)に対する相対値を、白丸でプロットし、さらに、図4(B)において、データベースに登録された様々な染色体位置における遺伝子変異の他の形質B(例えば、胃がん)に対する相対値を、黒丸でプロットしてもよい。そして、前記表1に示すように、それぞれの前記領域変異情報に基づいて、変異M2の第1スコア(0.1)に重み付けして、第2スコア(0.8)とし、変異M3の第1スコア(0.3)に重み付けして、第2スコア(0.9)とし、変異M4の第1スコア(0.1)に重み付けして、第2スコア(0.6)とする。
そして、前記評価スコア決定工程は、前記第2スコアを、前記再スコア化対象の被評価変異の評価スコアとして決定する(S106)。これらの工程は、例えば、評価装置10の評価スコア決定部16により実行できる。
また、前述の工程(S102)において、前記第1スコアが前記関連性の閾値を満たすと判断した場合(YES)、前記第1スコアを、前記被評価変異の評価スコアとして決定する(S107)。これらの工程は、例えば、評価装置10の評価スコア決定部16により実行できる。
また、図4(B)においては、サンプル群の配列において検出できなかった変異について、形質に対する相対値をプロットし(黒丸)、密度曲線(W)を生成したが、これには制限されない。図4(A)に示す、サンプル群配列において検出した変異について、さらに、データベースに登録されている形質に対する相対値をプロットして、密度曲線(W)を生成し、変異Mの第2スコアを付与してもよい。この場合、図4(A)は、形質Aに対する相対値であることから、図4(B)においては、例えば、同じ変異に対して、他の形質Bに対する相対値をプロットして、密度曲線(W)を生成し、変異Mの第2スコアを付与する。
(変形例1)
評価装置10が、図1に示すように、通信部19により、複数のデータベースと通信可能である場合、スコア付与部12は、前記複数のデータベースごとに、前記データベース情報に基づいて、前記被評価変異のスコアを算出し、前記データベースごとのスコアを統合し、統合スコアを、前記被評価変異の第1スコアとしてもよい。
前記統合スコアは、特に制限されず、例えば、前記データベースごとのスコアを用いた加重線形和により、算出できる。前記加重線形和は、例えば、一般化線形モデル、ニューラルネットワーク等の統計手段を利用することもできる。また、スコア付与部12は、前記データベースの精度に基づいて、前記データベースごとのスコアに重み付けしてもよい。
具体例として、前記サンプル群において共通する遺伝子変異として、下記表2に示すように、4種類の遺伝子変異(変異M1、M2、M3、M4)があり、4種類のデータベース(DB1、DB2、DB3、DB4)を使用する形態を例示する。
Figure 0006941309
それぞれの被評価変異(M1、M2、M3、M4)について、各データベース情報に基づいて、スコアを算出し、さらに、4種類のデータベースのスコアを用いて、下記のモデル式により統合スコアを得ることができる。前記統合スコアの算出には、例えば、教師なし学習、教師あり学習等の機械学習が利用できる。前記教師なし学習は、例えば、主成分分析、前記教師あり学習は、例えば、サポートベクターマシン、ナイーブベイズ分類等があげられる。
Figure 0006941309
i:i番目の遺伝子変異
j:j番目のデータベース
n:データベース数
β:切片を表す定数項
i,j:データベースjの遺伝子変異iのスコア
βi,j:データベースjの遺伝子変異iのスコアの重み
[実施形態2]
本実施形態の評価装置は、例えば、さらに、前記評価スコアを出力することができる。前記評価スコアの出力は、例えば、前記評価スコアに基づく可視化データがあげられる。
図5に、複数の被評価変異と、各形質に対する評価スコアとの関係を示す数値行列のグラフを示す。図5において、行方向には、被評価変異を並べ、列方向には、疾患の形質を示す。そして、評価スコアが高い程、濃い色、低い程、薄い色で色分けされている。図5においては、具体的に、神経変性疾患に対する評価スコアと、心疾患に対する評価スコアが、それぞれクラスタリングしている。
図5に示すように、左側の被評価変異群は、神経変性疾患に対して高い評価スコアを示していることから、神経変性疾患との関連性が示唆される。一方、右側の被評価変異群は、心疾患に対して高い評価スコアを示していることから、心疾患との関連性が示唆される。なお、図5の表記には、制限されず、例えば、左側の一群が、神経変性疾患との関連性を示す評価スコアが相対的に高いものであり、右側の一群が、心疾患との関連性を示す評価スコアが相対的に高いものである。一方、縦軸の疾患は、上側の一群が、心疾患であり、上側の一群が、神経変性疾患である。
図5のグラフからわかるように、本発明によれば、相対的な評価スコアの利用によって、関連性の可視化が可能であるため、例えば、膨大な数値の見比べや、データベースごとに異なるスケールの影響を受けることなく、ある遺伝子変異とある形質との関係性、ある形質と複数の遺伝子変異との関係性、ある遺伝子変異と複数の形質との関係性等を、目視でも判断することが可能になる。
本実施形態において、被評価変異および疾患のプロファイルは、例えば、階層的クラスタリング、k−means法等も使用できる。
前記可視化データの形式は、特に制限されず、前述のような数値行列の形式でもよいし、棒グラフ、プロットグラフ等でもよい。
[実施形態3]
本実施形態のプログラムは、前記本発明の評価方法を、コンピュータ上で実行可能なプログラムである。または、本実施形態のプログラムは、例えば、コンピュータ読み取り可能な記録媒体に記録されてもよい。前記記録媒体としては、特に限定されず、例えば、前述のような記憶媒体等があげられる。
以上、実施形態を参照して本願発明を説明したが、本願発明は、上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2018年3月19日に出願された日本出願特願2018―051268を基礎とする優先権を主張し、その開示のすべてをここに取り込む。
上記の実施形態および実施例の一部または全部は、以下の付記のように記載されうるが、以下には限られない。
(付記1)
通信部、被評価変異情報取得部、スコア付与部、スコア判定部、領域変異情報取得部、スコア再付与部、および評価スコア決定部を含み、
前記通信部は、
形質に対する遺伝子変異の情報が記憶されたデータベースと通信可能であり、
前記被評価変異情報取得部は、
共通の形質を示すサンプル群において共通する遺伝子変異の変異情報を、被評価変異の変異情報として取得し、
前記変異情報は、変異の位置情報と変異の塩基情報とを含み、
前記スコア付与部は、
前記データベース情報に基づいて、前記被評価変異に対して、前記データベース情報の形質への関連性を示す第1スコアを付与し、
前記スコア判定部は、
前記被評価変異の第1スコアと、関連性の閾値とを照合し、前記第1スコアが前記関連性の閾値に満たない場合、前記被評価変異を再スコア化対象と判定し、
前記領域変異情報取得部は、
前記データベース情報に基づいて、前記再スコア化対象の被評価変異に対する関連領域における遺伝子変異を、領域変異情報として取得し、
前記スコア再付与部は、
前記再スコア化対象の被評価変異について、前記領域変異情報に基づいて、前記第1スコアに重み付けした第2スコアを付与し、
前記評価スコア決定部は、
前記第2スコアを、前記再スコア化対象の被評価変異の評価スコアとして決定する、
ことを特徴とする遺伝子変異の評価装置。
(付記2)
前記評価スコア決定部は、
前記被評価変異の第1スコアが前記閾値を満たす場合、前記第1スコアを、前記被評価変異の評価スコアとして決定し、
前記被評価変異の第1スコアが前記閾値を満たさない場合、前記第2スコアを、前記再スコア化対象の被評価変異の評価スコアとして決定する、付記1記載の評価装置。
(付記3)
前記被評価変異情報取得部において、前記サンプル群の共通形質が、疾患であり、前記被評価変異が、前記疾患の患者群と正常者群との間で、有意差のある遺伝子変異である、付記1または2記載の評価装置。
(付記4)
前記被評価変異情報取得部は、前記サンプル群において共通する複数の遺伝子変異の変異情報を取得する、付記1から3のいずれかに記載の評価装置。
(付記5)
前記データベース情報の形質が、疾患であり、前記形質に対する遺伝子変異が、前記疾患の患者群と正常者群との間で、有意差のある遺伝子変異である、付記1から4のいずれかに記載の評価装置。
(付記6)
前記データベース情報の形質が、特定疾患であり、前記形質に対する遺伝子変異が、前記特定疾患の患者群と正常者群との間で、有意差のある遺伝子変異である、付記1から5のいずれかに記載の評価装置。
(付記7)
前記領域変異情報取得部において、前記関連領域が、前記被評価変異の位置を含む連続配列である、付記1から6のいずれかに記載の評価装置。
(付記8)
前記領域変異情報取得部において、前記関連領域が、前記被評価変異の位置に対する連鎖の位置を含む、付記1から6のいずれかに記載の評価装置。
(付記9)
前記通信部は、複数のデータベースと通信可能であり、
前記スコア付与部は、前記複数のデータベースごとに、前記データベース情報に基づいて、前記被評価変異のスコアを算出し、前記データベースごとのスコアを統合し、統合スコアを、前記被評価変異の第1スコアとする、付記1から8のいずれかに記載の評価装置。
(付記10)
前記スコア付与部は、前記データベースごとのスコアを用いた加重線形和により、前記統合スコアを算出する、付記9記載の評価装置。
(付記11)
前記スコア付与部は、前記データベースの精度に基づいて、前記データベースごとのスコアに重み付けする、付記9または10記載の評価装置。
(付記12)
前記スコア付与部は、前記形質への関連性が相対的に高い程、相対的に大きいスコアを付与し、前記形質への関連性が相対的に低い程、相対的に小さいスコアを付与する、付記1から11のいずれかに記載の評価装置。
(付記13)
前記スコア判定部は、
前記評価スコアと、前記関連性の閾値とを照合し、前記評価スコアが前記関連性の閾値を満たす被評価変異を、前記データベース情報の形質に関連する変異と判定する、付記1から12のいずれかに記載の評価装置。
(付記14)
さらに、記憶部を有し、
前記記憶部は、前記被評価変異ごとに、前記評価スコアを紐付けて記憶する、付記1から13のいずれかに記載の評価装置。
(付記15)
さらに、出力部を有し、
前記出力部は、前記被評価変異ごとに、前記形質への関連性を示す評価スコアを紐付けて出力する、付記1から14のいずれかに記載の評価装置。
(付記16)
さらに、記憶部を有し、
前記記憶部は、前記データベース情報の形質ごとに、前記被評価変異の評価スコアを紐付けて記憶する、付記1から15のいずれかに記載の評価装置。
(付記17)
さらに、出力部を有し、
前記出力部は、前記データベース情報の形質ごとに、前記被評価変異の評価スコアを紐付けて出力する、付記1から16のいずれかに記載の評価装置。
(付記18)
前記出力部は、前記評価スコアを、可視化データとして出力する、付記15または17記載の評価装置。
(付記19)
被評価変異情報取得工程、スコア付与工程、スコア判定工程、領域変異情報取得工程、スコア再付与工程、および評価スコア決定工程を含み、
形質に対する遺伝子変異の情報が記憶されたデータベースと通信可能であり、
前記被評価変異情報取得工程は、
共通の形質を示すサンプル群において共通する遺伝子変異の変異情報を、被評価変異の変異情報として取得し、
前記変異情報は、変異の位置情報と変異の塩基情報とを含み、
前記スコア付与工程は、
前記データベース情報に基づいて、前記被評価変異に対して、前記データベース情報の形質への関連性を示す第1スコアを付与し、
前記スコア判定工程は、
前記被評価変異の第1スコアと、関連性の閾値とを照合し、前記第1スコアが前記関連性の閾値に満たない場合、前記被評価変異を再スコア化対象と判定し、
前記領域変異情報取得工程は、
前記データベース情報に基づいて、前記再スコア化対象の被評価変異に対する関連領域における遺伝子変異を、領域変異情報として取得し、
前記スコア再付与工程は、
前記再スコア化対象の被評価変異について、前記領域変異情報に基づいて、前記第1スコアに重み付けした第2スコアを付与し、
前記評価スコア決定工程は、
前記第2スコアを、前記再スコア化対象の被評価変異の評価スコアとして決定する、
ことを特徴とする遺伝子変異の評価方法。
(付記20)
前記評価スコア決定工程は、
前記被評価変異の第1スコアが前記閾値を満たす場合、前記第1スコアを、前記被評価変異の評価スコアとして決定し、
前記被評価変異の第1スコアが前記閾値を満たさない場合、前記第2スコアを、前記再スコア化対象の被評価変異の評価スコアとして決定する、
付記19記載の評価方法。
(付記21)
前記被評価変異情報取得工程において、前記サンプル群の共通形質が、疾患であり、前記被評価変異が、前記疾患の患者群と正常者群との間で、有意差のある遺伝子変異である、付記19または20記載の評価方法。
(付記22)
前記被評価変異情報取得工程は、前記サンプル群において共通する複数の遺伝子変異の変異情報を取得する、付記19から21のいずれかに記載の評価方法。
(付記23)
前記データベース情報の形質が、疾患であり、前記形質に対する遺伝子変異が、前記疾患の患者群と正常者群との間で、有意差のある遺伝子変異である、付記19から22のいずれかに記載の評価方法。
(付記24)
前記データベース情報の形質が、特定疾患であり、前記形質に対する遺伝子変異が、前記特定疾患の患者群と正常者群との間で、有意差のある遺伝子変異である、付記19から23のいずれかに記載の評価方法。
(付記25)
前記領域変異情報取得工程において、前記関連領域が、前記被評価変異の位置を含む連続配列である、付記19から24のいずれかに記載の評価方法。
(付記26)
前記領域変異情報取得工程において、前記関連領域が、前記被評価変異の位置に対する連鎖の位置を含む、付記19から25のいずれかに記載の評価方法。
(付記27)
複数のデータベースと通信可能であり、
前記スコア付与工程は、前記複数のデータベースごとに、前記データベース情報に基づいて、前記被評価変異のスコアを算出し、前記データベースごとのスコアを統合し、統合スコアを、前記被評価変異の第1スコアとする、付記19から26のいずれかに記載の評価方法。
(付記28)
前記スコア付与工程は、前記データベースごとのスコアを用いた加重線形和により、前記統合スコアを算出する、付記27記載の評価方法。
(付記29)
前記スコア付与工程は、前記データベースの精度に基づいて、前記データベースごとのスコアに重み付けする、付記27または28記載の評価方法。
(付記30)
前記スコア付与工程は、前記形質への関連性が相対的に高い程、相対的に大きいスコアを付与し、前記形質への関連性が相対的に低い程、相対的に小さいスコアを付与する、付記19から29のいずれかに記載の評価方法。
(付記31)
前記スコア判定工程は、
前記評価スコアと、前記関連性の閾値とを照合し、前記評価スコアが前記関連性の閾値を満たす被評価変異を、前記データベース情報の形質に関連する変異と判定する、付記19から30のいずれかに記載の評価方法。
(付記32)
さらに、記憶工程を有し、
前記記憶工程は、前記被評価変異ごとに、前記評価スコアを紐付けて記憶する、付記19から31のいずれかに記載の評価方法。
(付記33)
さらに、出力工程を有し、
前記出力工程は、前記被評価変異ごとに、前記形質への関連性を示す評価スコアを紐付けて出力する、付記19から32のいずれかに記載の評価方法。
(付記34)
さらに、記憶工程を有し、
前記記憶工程は、前記データベース情報の形質ごとに、前記被評価変異の評価スコアを紐付けて記憶する、付記19から33のいずれかに記載の評価方法。
(付記35)
さらに、出力工程を有し、
前記出力工程は、前記データベース情報の形質ごとに、前記被評価変異の評価スコアを紐付けて出力する、付記19から34のいずれかに記載の評価方法。
(付記36)
前記出力工程は、前記評価スコアを、可視化データとして出力する、付記33または35記載の評価方法。
(付記37)
付記19から36のいずれかに記載の評価方法をコンピュータに実行させることを特徴とするプログラム。
(付記38)
付記37記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
本発明によれば、例えば、単一位置の遺伝子変異について、見かけ上、形質との関連性があると判定できない場合であっても、さらに、前記遺伝子変異の関連領域の情報を参照することによって、前記形質と関連性を示す可能性がある遺伝子変異を拾い上げることができる。このため、遺伝子変異と形質との関連性について、より効率の良い評価を行うことができる。
10 評価装置
11 被評価変異情報取得部
12 スコア付与部
13 スコア判定部
14 領域変異情報取得部
15 スコア再付与部
16 評価スコア決定部
17 記憶部
18 出力部
19 通信部
101 CPU
102 メモリ
103 バス
104 入力装置
105 ディスプレイ
107 記憶装置
108 プログラム
110 通信デバイス
20 通信回線網
30 データベース

Claims (10)

  1. 通信部、被評価変異情報取得部、スコア付与部、スコア判定部、領域変異情報取得部、スコア再付与部、および評価スコア決定部を含み、
    前記通信部は、
    形質に対する遺伝子変異の情報が記憶されたデータベースと通信可能であり、
    前記被評価変異情報取得部は、
    共通の形質を示すサンプル群において共通する遺伝子変異の変異情報を、被評価変異の変異情報として取得し、
    前記変異情報は、変異の位置情報と変異の塩基情報とを含み、
    前記スコア付与部は、
    前記データベース情報に基づいて、前記被評価変異に対して、前記データベース情報の形質への関連性を示す第1スコアを付与し、
    前記スコア判定部は、
    前記被評価変異の第1スコアと、関連性の閾値とを照合し、前記第1スコアが前記関連性の閾値に満たない場合、前記被評価変異を再スコア化対象と判定し、
    前記領域変異情報取得部は、
    前記データベース情報に基づいて、前記再スコア化対象の被評価変異に対する関連領域における遺伝子変異を、領域変異情報として取得し、
    前記スコア再付与部は、
    前記再スコア化対象の被評価変異について、前記領域変異情報に基づいて、前記第1スコアに重み付けした第2スコアを付与し、
    前記評価スコア決定部は、
    前記第2スコアを、前記再スコア化対象の被評価変異の評価スコアとして決定する、
    ことを特徴とする遺伝子変異の評価装置。
  2. 前記評価スコア決定部は、
    前記被評価変異の第1スコアが前記閾値を満たす場合、前記第1スコアを、前記被評価変異の評価スコアとして決定し、
    前記被評価変異の第1スコアが前記閾値を満たさない場合、前記第2スコアを、前記再スコア化対象の被評価変異の評価スコアとして決定する、請求項1記載の評価装置。
  3. 前記被評価変異情報取得部は、前記サンプル群において共通する複数の遺伝子変異の変異情報を取得する、請求項1または2記載の評価装置。
  4. 前記通信部は、複数のデータベースと通信可能であり、
    前記スコア付与部は、前記複数のデータベースごとに、前記データベース情報に基づいて、前記被評価変異のスコアを算出し、前記データベースごとのスコアを統合し、統合スコアを、前記被評価変異の第1スコアとする、請求項1からのいずれか一項に記載の評価装置。
  5. 前記スコア付与部は、前記データベースごとのスコアを用いた加重線形和により、前記統合スコアを算出する、請求項記載の評価装置。
  6. 前記スコア付与部は、前記データベースの精度に基づいて、前記データベースごとのスコアに重み付けする、請求項または記載の評価装置。
  7. 前記スコア付与部は、前記形質への関連性が相対的に高い程、相対的に大きいスコアを付与し、前記形質への関連性が相対的に低い程、相対的に小さいスコアを付与する、請求項1からのいずれか一項に記載の評価装置。
  8. 被評価変異情報取得工程、スコア付与工程、スコア判定工程、領域変異情報取得工程、スコア再付与工程、および評価スコア決定工程を含み、
    形質に対する遺伝子変異の情報が記憶されたデータベースと通信可能であり、
    前記被評価変異情報取得工程は、
    共通の形質を示すサンプル群において共通する遺伝子変異の変異情報を、被評価変異の変異情報として取得し、
    前記変異情報は、変異の位置情報と変異の塩基情報とを含み、
    前記スコア付与工程は、
    前記データベース情報に基づいて、前記被評価変異に対して、前記データベース情報の形質への関連性を示す第1スコアを付与し、
    前記スコア判定工程は、
    前記被評価変異の第1スコアと、関連性の閾値とを照合し、前記第1スコアが前記関連性の閾値に満たない場合、前記被評価変異を再スコア化対象と判定し、
    前記領域変異情報取得工程は、
    前記データベース情報に基づいて、前記再スコア化対象の被評価変異に対する関連領域における遺伝子変異を、領域変異情報として取得し、
    前記スコア再付与工程は、
    前記再スコア化対象の被評価変異について、前記領域変異情報に基づいて、前記第1スコアに重み付けした第2スコアを付与し、
    前記評価スコア決定工程は、
    前記第2スコアを、前記再スコア化対象の被評価変異の評価スコアとして決定する、
    ことを特徴とする遺伝子変異の評価方法。
  9. ンピュータに、被評価変異情報取得工程、スコア付与工程、スコア判定工程、領域変異情報取得工程、スコア再付与工程、および評価スコア決定工程を実行させ
    前記コンピュータは、形質に対する遺伝子変異の情報が記憶されたデータベースと通信可能であり、
    前記被評価変異情報取得工程は、
    共通の形質を示すサンプル群において共通する遺伝子変異の変異情報を、被評価変異の変異情報として取得し、
    前記変異情報は、変異の位置情報と変異の塩基情報とを含み、
    前記スコア付与工程は、
    前記データベース情報に基づいて、前記被評価変異に対して、前記データベース情報の形質への関連性を示す第1スコアを付与し、
    前記スコア判定工程は、
    前記被評価変異の第1スコアと、関連性の閾値とを照合し、前記第1スコアが前記関連性の閾値に満たない場合、前記被評価変異を再スコア化対象と判定し、
    前記領域変異情報取得工程は、
    前記データベース情報に基づいて、前記再スコア化対象の被評価変異に対する関連領域における遺伝子変異を、領域変異情報として取得し、
    前記スコア再付与工程は、
    前記再スコア化対象の被評価変異について、前記領域変異情報に基づいて、前記第1スコアに重み付けした第2スコアを付与し、
    前記評価スコア決定工程は、
    前記第2スコアを、前記再スコア化対象の被評価変異の評価スコアとして決定することを特徴とするプログラム。
  10. 請求項記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2020507315A 2018-03-19 2018-09-28 遺伝子変異の評価装置、評価方法、プログラム、および記録媒体 Active JP6941309B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018051268 2018-03-19
JP2018051268 2018-03-19
PCT/JP2018/036376 WO2019181022A1 (ja) 2018-03-19 2018-09-28 遺伝子変異の評価装置、評価方法、プログラム、および記録媒体

Publications (2)

Publication Number Publication Date
JPWO2019181022A1 JPWO2019181022A1 (ja) 2021-03-11
JP6941309B2 true JP6941309B2 (ja) 2021-09-29

Family

ID=67988362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020507315A Active JP6941309B2 (ja) 2018-03-19 2018-09-28 遺伝子変異の評価装置、評価方法、プログラム、および記録媒体

Country Status (3)

Country Link
US (1) US20210005281A1 (ja)
JP (1) JP6941309B2 (ja)
WO (1) WO2019181022A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022230075A1 (ja) * 2021-04-28 2022-11-03 日本電気株式会社 薬剤推奨装置、制御方法、及びコンピュータ可読媒体
WO2022264189A1 (ja) * 2021-06-14 2022-12-22 日本電気株式会社 遺伝的特徴推定装置、制御方法、及び非一時的なコンピュータ可読媒体
CN113643754B (zh) * 2021-08-11 2023-12-29 苏州赛美科基因科技有限公司 一种错义变异基因的评分处理方法、优化评分方法及装置
CN114596968B (zh) * 2022-05-10 2022-07-29 至本医疗科技(上海)有限公司 多重pcr引物设计方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011050341A1 (en) * 2009-10-22 2011-04-28 National Center For Genome Resources Methods and systems for medical sequencing analysis
US20140296733A1 (en) * 2011-11-02 2014-10-02 Bio-Signal Group Corp. Inter-rater and intra-rater reliability of physiological scan interpretation

Also Published As

Publication number Publication date
WO2019181022A1 (ja) 2019-09-26
US20210005281A1 (en) 2021-01-07
JPWO2019181022A1 (ja) 2021-03-11

Similar Documents

Publication Publication Date Title
JP6941309B2 (ja) 遺伝子変異の評価装置、評価方法、プログラム、および記録媒体
US10354747B1 (en) Deep learning analysis pipeline for next generation sequencing
US7096206B2 (en) Heuristic method of classification
Zheng et al. Application of the time-dependent ROC curves for prognostic accuracy with multiple biomarkers
US20020095260A1 (en) Methods for efficiently mining broad data sets for biological markers
US20230222311A1 (en) Generating machine learning models using genetic data
JP2012514783A (ja) 進化クラスタ化アルゴリズム
KR102351306B1 (ko) 질환 연관 유전자 변이 분석을 통한 질환별 위험 유전자 변이 정보 생성 장치 및 그 방법
CN110268072A (zh) 确定旁系同源基因的方法和系统
US20160203287A1 (en) Methods for predicting prognosis
Adler et al. Bootstrap estimated true and false positive rates and ROC curve
KR102389479B1 (ko) 시간 변동 공변량 기반의 prs 모델을 이용한 질환별 위험 유전자 변이 정보 생성 장치 및 그 방법
US20220148178A1 (en) Methods of assessing diseases using image classifiers
CN117425937A (zh) 用于确定双基因或寡基因变异的组合的致病性的预测方法
JP7364206B2 (ja) 学習装置、学習方法、及び制御プログラム
JP5307996B2 (ja) 判別因子セットを特定する方法、システム及びコンピュータソフトウェアプログラム
JP2021043056A (ja) 分子マーカー探索方法、分子マーカー探索装置、及びプログラム
CN111383717A (zh) 一种构建生物信息分析参照数据集的方法及系统
Chen et al. Gene expression analyses using genetic algorithm based hybrid approaches
JP7444252B2 (ja) 診断支援プログラム、装置、及び方法
KR102485316B1 (ko) 딥러닝을 활용한 개인의 전체 유전체 데이터와 암 발생과의 연관성 예측에 관한 방법
WO2023087277A1 (zh) 序列变异分析方法、系统以及存储介质
Mohamed et al. Predicting The Heart Attack From Accessible Patients Medical Datasets Using Data Mining Technique
Shrivastava et al. Early Risk Prediction of Breast Cancer among Patients using Machine Learning Techniques
Kastrin Item response theory modeling for microarray gene expression data

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200817

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200817

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200909

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210727

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210819

R150 Certificate of patent or registration of utility model

Ref document number: 6941309

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150