JP6702686B2 - 表現型推定システム及び表現型推定プログラム - Google Patents

表現型推定システム及び表現型推定プログラム Download PDF

Info

Publication number
JP6702686B2
JP6702686B2 JP2015200797A JP2015200797A JP6702686B2 JP 6702686 B2 JP6702686 B2 JP 6702686B2 JP 2015200797 A JP2015200797 A JP 2015200797A JP 2015200797 A JP2015200797 A JP 2015200797A JP 6702686 B2 JP6702686 B2 JP 6702686B2
Authority
JP
Japan
Prior art keywords
phenotype
estimation
genotype
qualitative
quantitative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015200797A
Other languages
English (en)
Other versions
JP2017073052A (ja
Inventor
鎌谷 直之
直之 鎌谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MTI Ltd
StaGen Co Ltd
Original Assignee
MTI Ltd
StaGen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MTI Ltd, StaGen Co Ltd filed Critical MTI Ltd
Priority to JP2015200797A priority Critical patent/JP6702686B2/ja
Publication of JP2017073052A publication Critical patent/JP2017073052A/ja
Application granted granted Critical
Publication of JP6702686B2 publication Critical patent/JP6702686B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

この発明は、人や動植物等の遺伝型に基づいて表現型を推定する表現型推定システム及び表現型推定プログラムに関する。
従来、人や動植物等のゲノム配列や遺伝子を解析する技術が開発されている(例えば特許文献1参照。)。かかるゲノム配列や遺伝子解析により形質に関連する座位における遺伝型等の情報が特定されれば、特定された一つの、あるいは複数の座位の遺伝型の情報によりどのような表現型が現れるかを推定可能になると期待されている。ここで形質とは、個体に関する、ゲノム配列や遺伝子以外の任意の属性であり、特定の病気のあるなし、身体的特徴、検査結果など様々な対象を含む。表現型とは特定の形質に属する具体的な属性である。例えば、糖尿病が形質であり、「糖尿病である」「糖尿病でない」はそれぞれが形質に属する表現型である。これらは質的形質であるが、身長などは量的形質である。身長は形質であるが「身長176.3 cm」は表現型である。以下、一般に質的形質については主として、任意の特定の疾患について述べるが、必ずしもそれに限るわけではなく、例えば、眼の色、血液型などの疾患と関係が無い場合も含む。
例えば、特定の疾患について遺伝の影響があるならば、個人の特定の座位(一つであろうと複数であろうと)の遺伝型から発症のリスクを計算して平均の発症率と比較し、発症のリスクが平均よりも高い、あるいは平均よりも低い、といった情報を提供することができる。ここで、ある形質に属する質的表現型が「ある疾患がある・ない」などの場合、「疾患がある」比率を発現率という。また、母集団での発現率を母比率とよぶ。
また、疾患の発症や薬剤の効果や副作用などのような質的表現型に限らず、身長や検査値などの量的表現型についても遺伝型からの推定が期待される。このように、遺伝型から各種表現型を推定することができれば、疾患の予防や治療方針の決定、生活習慣の改善などに非常に有益である。
特開2009−125009号公報
しかしながら、従来の技術では、遺伝型から表現型を精度よく推定することは困難であった。質的表現型では、例えば上述のように「発症のリスクが平均よりも何倍高い、あるいは平均よりも何分の1低い」といった形で推定結果を得ることが望ましいが、平均のリスクを正確に知ること自体が困難なことも多く、実際は対象者のリスクが平均よりも高いにも関わらず誤って平均よりも低いと推定してしまう危険がある。このように、誤った推定結果を導くと、誤った対処により深刻な事態を引き起こしかねない。このため、特に健康管理や医療においては、推定の精度を向上し、その信頼性を高めることが非常に重要な課題となっている。
また、量的表現型については、形質が量的であることから、遺伝型がどの程度の影響を与えているかを判別することが困難であり、推定と結果の開示の手法自体が確立されていないのが実状である。このため、量的表現型に対する推定をいかにしておこなうかが課題となっている。
なお、これらの課題は、人の遺伝型を健康管理や医療に利用する場合に限らず、例えば動植物の遺伝型から表現型を推定する場合にも同様に生ずる課題である。
本発明は、上記従来技術の課題を解決するためになされたものであって、人や動植物等の遺伝型に基づいて表現型を精度よく推定する表現型推定システム及び表現型推定プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するため、本発明は、所定の質的表現型に影響を与える座位における各アレルの比率または各遺伝型の比率と、前記質的表現型と遺伝型に関するオッズ比と、前記質的表現型の母比率の区間推定値とを用い、前記遺伝型の各々について、前記質的表現型の発現率を算定する発現率算定手段と、対象となる遺伝型の入力を受け付ける対象遺伝型受付手段と、前記対象となる遺伝型について前記発現率算定手段で算出された前記母比率の区間における前記質的表現型の発現率の分布を評価し、前記質的表現型の発現傾向を推定する推定手段と、前記推定手段による推定結果を出力する出力手段とを備え、前記推定手段は、前記対象となる遺伝型における前記質的表現型の発現率と前記質的表現型の母比率との大小関係が前記母比率の区間の範囲内で反転しないことを条件に、前記対象となる遺伝型における前記質的表現型の発現傾向を推定することを特徴とする。
また、本発明は、上記発明において、前記所定の質的表現型に複数の座位が影響する場合に、前記発現率算定手段は、それぞれの座位の遺伝型の各々について前記質的表現型の発現率を算定し、前記対象遺伝型受付手段は、前記複数の座位における遺伝型の組合せを対象の遺伝型の組合せとして受け付け、前記推定手段は、前記対象となる遺伝型の組合せについて前記母比率の区間における前記質的表現型の発現率の分布を評価し、前記質的表現型の発現傾向を推定することを特徴とする。
また、本発明は、上記発明において、前記発現率算定手段は、前記遺伝型における特定のアレル頻度と、異なる遺伝型における前記質的表現型に関する遺伝型間のオッズ比と、前記質的表現型の母比率の区間推定値とを用い、前記遺伝型の各々について前記質的表現型の発現率を算定することを特徴とする。
また、本発明は、量的表現型に影響を与える座位の数とアレルの効果の相加性の有無とに基づいて前記量的表現型を分類する分類手段と、対象となる遺伝型の入力を受け付ける対象遺伝型受付手段と、前記分類手段による分類結果を用い、前記対象となる遺伝型を含む場合の前記量的表現型の推定値の分布を評価し、該推定値の分布を母平均と比較して前記量的表現型の発現傾向を推定する推定手段と、前記推定手段による推定結果を出力する出力手段とを備えたことを特徴とする。
また、本発明は、上記発明において、前記分類手段は、前記相加性がない場合に対応する第1の分類、前記座位が単独で前記相加性がある場合に対応する第2の分類、前記座位が複数で前記相加性がある場合に対応する第3の分類のいずれかに前記量的表現型を分類し、前記推定手段は、前記分類結果に応じて異なる演算処理を行って前記推定値の分布を評価することを特徴とする。
また、本発明の表現型推定プログラムは、コンピュータに、対象となる遺伝型の入力を受け付ける対象遺伝型受付ステップと、所定の質的表現型に影響を与える座位における各アレルの比率または各遺伝型の比率と、前記質的表現型と遺伝型に関するオッズ比と、前記質的表現型の母比率の区間推定値とを用い、前記遺伝型の各々について前記質的表現型の発現率を算定する発現率算定ステップと、前記対象となる遺伝型について、前記発現率算定ステップで算出された前記母比率の区間における前記質的表現型の発現率の分布を評価し、前記質的表現型の発現傾向を推定する推定ステップと前記推定ステップによる推定結果を出力する出力ステップとを実行させ、前記推定ステップは、前記対象となる遺伝型における前記質的表現型の発現率と前記質的表現型の母比率との大小関係が前記母比率の区間の範囲内で反転しないことを条件に、前記対象となる遺伝型における前記質的表現型の発現傾向を推定することを特徴とする。
また、本発明の表現型推定プログラムは、コンピュータに、量的表現型に影響を与える座位の数とアレルの効果の相加性の有無とに基づいて前記量的表現型を分類する分類ステップと、対象となる遺伝型の入力を受け付ける対象遺伝型受付ステップと、前記分類ステップによる分類結果を用い、前記対象となる遺伝型を含む場合の前記量的表現型の推定値の分布を評価し、該推定値の分布を母平均と比較して前記量的表現型の発現傾向を推定する推定ステップと、前記推定ステップによる推定結果を出力する出力ステップとを実行させることを特徴とする。
本発明によれば、遺伝型に基づいて質的表現型を精度よく推定することができる。
図1は、本実施例に係る質的表現型の推定についての説明である。 図2は、表現型推定システムのシステム構成を示す図である。 図3は、質的表現型推定部の処理手順を示すフローチャートである。 図4は、図3に示したリスク評価処理の処理手順を示すフローチャートである。 図5は、量的表現型推定部の処理手順を示すフローチャートである。 図6は、i座位の座位による効果の母平均からの偏位とアレル頻度の関係についての説明図である。この場合は単独座位の場合を考えるのでi=1としてよい。 図7は、表現型推定プログラムの実施例である。
以下に、添付図面を参照して、本発明に係る表現型推定システム及び表現型推定プログラムの好適な実施例を詳細に説明する。
図1は、本実施例に係る質的表現型の推定についての説明である。図1では、説明を簡明にするため、単独座位が疾患の発症に影響する場合を例に説明を行い、複数座位が影響する場合については後述する。
まず、疾患の発症に影響する座位の2つのアレルをA,aとする。また、2つのアレルのうち、aを注目するアレルとする。この場合、遺伝型AA,Aa,aaの中に含まれるアレルaの数は、それぞれ0,1,2となる。
本実施例に係る表現型推定システムは、対象の疾患についての遺伝型Aaの遺伝型AAに対するオッズ比r1と、遺伝型aaの遺伝型Aaに対するオッズ比r2と、aアレル頻度pと、リスク(疾患発症リスク)の母平均mとを入力として用いる。
リスクの母平均mは、対象の疾患の有病率や罹患率などから推定する。このリスクの母平均mを一意に特定することは困難なことも多いが、疫学調査やメタ解析により、例えば95%信頼区間など、区間推定値として得ることは比較的容易である。そこで、表現型推定システムは、区間として推定されたリスクの母平均mを用いる。
表現型推定システムは、r1、r2、p、mを用い、各遺伝型のリスクを求める。遺伝型リスクd1は、遺伝型AAである場合のリスク、すなわち発症確率である。同様に、遺伝型リスクd2は、遺伝型Aaである場合の発症確率であり、遺伝型リスクd3は、遺伝型aaである場合の発症確率である。なお、d1〜d3の算定処理については追って詳述する。
さらに、表現型推定システムは、推定の対象とする個人の遺伝型について入力を受け付ける。そして、個人の遺伝型に対応する遺伝型リスクの母平均mに対する比率を相対リスク(疾患発症という表現型の発現率)として算定する。
表現型推定システムは、相対リスクを母平均mの区間の範囲内においてそれぞれ算定し、相対リスクの母平均mに対する分布を示すグラフを生成する。図1に示したグラフは、横軸が母平均mの区間であり、縦軸が相対リスクである。
表現型推定システムは、母平均mの区間内において、常に相対リスクが1以下であれば、個人のリスクは平均よりも低いとの推定結果を出力する。また、母平均mの区間内において、常に相対リスクが1以上であれば、個人のリスクは平均よりも高いとの推定結果を出力する。
しかしながら、母平均mの区間内において、相対リスクが1をまたぐ、すなわち、母平均mの区間内で相対リスクと母平均との大小関係が反転するならば、表現型推定システムは、「個人のリスクの判別が適切に行えない」との推定結果を出力する。
このように相対リスクが1をまたぐことがあることは知られていなかった。しかし、発明者は、プログラムを作成し、シミュレーションを繰り返すことにより相対リスクを計算するという実験を鋭意重ねた結果、複数座位の場合、相対リスクが1をまたぐことが稀に有ることを発見した。
母平均mの区間は、その範囲内に母平均mの実際の値が含まれる可能性が高いことを示すものであり、換言するならば、母平均mの実際の値は区間内のどこに位置するかを特定できない。従って、区間内において相対リスクが1をまたぐ場合には、母平均mの実際の値によって相対リスクが高いか低いか定まり、いずれであるかを識別できないのである。
なお、相対リスクが1となる母平均mの値は特定可能であるので、「母平均mの実際の値がこの範囲であれば個人のリスクは平均よりも低く、この範囲であれば個人のリスクは平均よりも高い」との推定結果を出力することは可能である。
このように、本実施例に係る表現型推定システムは、リスクの母平均mの区間推定値を用い、区間内における個人の相対リスクの分布を評価し、その結果に応じて確実に相対リスクの高低が判別できることを条件に相対リスクの高低を推定結果として出力する。そして、相対リスクの高低が不正確となる場合には、その旨を推定結果として出力するので、個人の相対リスクを精度よく推定し、信頼性を向上することができる。
次に、表現型推定システムのシステム構成について説明する。図2は、表現型推定システムのシステム構成を示す図である。図2に示すように、表現型推定システムは、表現型推定装置20にデータベース10(記憶手段)及び遺伝型分析装置30を接続した構成を有する。表現型推定装置20とデータベース10との間や、表現型推定装置20と遺伝型分析装置30との間には、所定のネットワークを介してもよい。
データベース10は、表現型基礎データ11及び遺伝型データ12を蓄積している。表現型基礎データ11は、各種表現型について、表現型の種別、母比率や母平均、関連座位などを示すデータである。表現型の種別とは、例えば、疾患の名称などであり、表現型を特定するとともに、質的表現型であるか量的表現型であるか、アレルの効果に相加性があるか否かを示す。質的表現型の母比率については区間推定値、量的表現型の母平均については母集団における期待値を用いる。なお、質的表現型の確率、例えば疾患の発症のリスクについては母平均を用いる。この場合の母平均は、発症している状態を「1」、発症していない状態を「0」とした母比率に一致する。関連座位は、表現型に影響を与える座位である。関連座位は、表現型によって単独である場合と複数である場合がある。
遺伝型データ12は、複数の表現型基礎データ11のうち、少なくともいずれか1つで関連座位として示された座位の遺伝型についてのデータである。遺伝型データ12は、座位を特定するデータに加え、注目アレルとその頻度、影響を与える表現型についてのオッズ比など表現型の推定に用いる各種データを含む。なお、複数の質的表現型に影響を与える場合には、それぞれの質的表現型についてのオッズ比を遺伝型データ12に含めておく。
遺伝型分析装置30は、被験者となる個人から提出されたサンプルを用い、被験者の遺伝型を分析する装置である。分析の対象となるのは、表現型の推定に使用する1又は複数の座位である。遺伝型分析装置30は、分析により得られた遺伝型を表現型推定装置20に送信する。複数の座位について分析を行った場合には、複数の遺伝型の組合せが表現型推定装置20に送信されることになる。また、遺伝型分析装置30は、表現型推定装置20から表現型の推定結果を受信し、被験者に対して出力する。遺伝型分析装置30は必ずしも本システムに含まれている必要はなく、外部の信頼できる遺伝型分析装置により得られた遺伝型を入力、あるいは送信する場合もある。
表現型推定装置20は、遺伝型から表現型を推定する装置であり、質的表現型推定部21及び量的表現型推定部22を有する。質的表現型推定部21は、質的表現型の推定を行う処理部であり、遺伝型リスク算定部21a、相対リスク算定部21b及びリスク評価部21cを有する。
遺伝型リスク算定部21aは、対象となる質的表現型に影響を与える座位について、r1、r2、p、mを用い、各遺伝型の遺伝型リスクd1〜d3を算定する処理を行う。r1、r2、p、mは、データベース10から取得する。
相対リスク算定部21bは、遺伝型分析装置30から受信した遺伝型と、遺伝型リスク算定部21aが算定した遺伝型リスクd1〜d3とを用い、個人の遺伝型によって定まるリスクの母平均mに対する比率を相対リスクとして算定する。
リスク評価部21cは、相対リスクの母平均mに対する分布を評価し、質的表現型の発現傾向を推定する処理部である。具体的には、リスク評価部21cは、母平均mの区間内において、常に相対リスクが1以下であれば、「個人のリスクは平均よりも低い」との推定結果を出力する。また、母平均mの区間内において、常に相対リスクが1以上であれば、「個人のリスクは平均よりも高い」との推定結果を出力する。低い、高いだけではなく平均に比較した相対的なリスクを出力してもよい。そして、母平均mの区間内において、相対リスクが1をまたぐ、すなわち、母平均mの区間内で相対リスクと母平均との大小関係が反転するならば、リスク評価部21cは、「個人のリスクの判別が適切に行えない」との推定結果を出力する。あるいは相対リスクが1をまたぐ母平均mの値を出力してもよい。リスク評価部21cは、推定結果を遺伝型分析装置30に送信し、遺伝型分析装置30から被験者に出力させる。
量的表現型推定部22は、量的表現型の推定を行う処理部であり、量的表現型分類部22a、相加性単独座位パターン変量評価部22b、相加性複数座位パターン変量評価部22c及び非相加性パターン変量評価部22dを有する。
量的表現型分類部22aは、対象となる量的表現型を関連座位の数とアレルの効果の相加性の有無とに基づいて分類する処理部である。具体的には、量的表現型分類部22aは、「関連座位が単独で相加性がある」、「関連座位が複数で相加性がある」、「相加性がない」のいずれかに量的表現型を分類する。
量的表現型の分類結果が「関連座位が単独で相加性がある」であるならば、相加性単独座位パターン変量評価部22bが量的表現型の発現傾向を推定する。量的表現型の分類結果が「関連座位が複数で相加性がある」であるならば、相加性複数座位パターン変量評価部22cが量的表現型の発現傾向を推定する。そして、量的表現型の分類結果が「相加性がない」であるならば、非相加性パターン変量評価部22dが量的表現型の発現傾向を推定する。
相加性単独座位パターン変量評価部22b、相加性複数座位パターン変量評価部22c及び非相加性パターン変量評価部22dは、演算の手法はそれぞれ個別であるが、遺伝型分析装置30から受信した遺伝型を含む場合の量的表現型の推定値の分布の標準偏差を計算し、表現型の母平均からの偏位を求め、個人の表現型の推定値と母平均とを比較して大小傾向を判定する。
相加性単独座位パターン変量評価部22b、相加性複数座位パターン変量評価部22c及び非相加性パターン変量評価部22dは、判定した大小傾向を推定結果として遺伝型分析装置30に送信し、遺伝型分析装置30から被験者に出力させる。
次に、質的表現型推定部21の処理手順について説明する。図3は、質的表現型推定部21の処理手順を示すフローチャートである。
まず、遺伝型リスク算定部21aは、対象となる表現型について表現型基礎データ11をデータベース10から読み出す。遺伝型リスク算定部21aは、読み出した表現型基礎データ11の関連座位の数をnとし、母平均mの区間を100の部分区間に分割する。部分区間は区間番号j(1≦j≦100)により識別する。また、n個の関連座位については、座位番号i(1≦i≦n)により識別する。
遺伝型リスク算定部21aは、母平均の区間番号jを「1」に初期化し(ステップS101)、関連座位の座位番号iを「1」に初期化する(ステップS102)。その後、遺伝型リスク算定部21aは、座位番号iの遺伝型について遺伝型データ12をデータベース10から読み出し、注目アレルの頻度pと遺伝型のオッズ比r1,r2を特定する。そして、遺伝型リスク算定部21aは、r1、r2、p、mから、区間番号jにおける座位番号iの遺伝型リスクd1,d2,d3を算定する(ステップS103)。なお、ここで使用するmは、母平均の区間推定値のうち、区間番号jの部分区間に対応する値である。例えば、区間番号jの部分区間における最大の値を用いればよい。
ステップS103の後、遺伝型リスク算定部21aは、座位番号i=nであるか否かを判定する(ステップS104)。座位番号iがn未満であるならば(ステップS104;No)、遺伝型リスク算定部21aは、座位番号iをインクリメントし(ステップS105)、ステップS103に移行する。
座位番号i=nであるならば(ステップS104;Yes)、相対リスク算定部21bは、区間番号jにおける座位番号1〜nの遺伝型リスクを用い、区間番号jにおける相対リスクを算定し(ステップS106)、算定した相対リスクを記憶する(ステップS107)。
ステップS107の後、相対リスク算定部21bは、区間番号j=100であるか否かを判定する(ステップS108)。区間番号jが100未満であるならば(ステップS108;No)、相対リスク算定部21bは、区間番号jをインクリメントし(ステップS109)、ステップS102に移行する。
区間番号j=100であるならば(ステップS108;Yes)、リスク評価部21cは、区間番号1〜100の相対リスクをプロットし、グラフを生成する(ステップS110)。そして、リスク評価部21cは、母平均mの区間推定値に対する相対リスクの分布を評価し、質的表現型の発現傾向を推定するリスク評価処理を行い(ステップS111)、処理を終了する。
次に、図3のステップS103に示した遺伝型リスクの算定について詳細に説明する。遺伝型AA,Aa,aaに対応した遺伝型リスクをd1,d2,d3とすれば、オッズ比r1,r2は次のような関係にある。
Figure 0006702686
Figure 0006702686
また、Hardy-Weinberg平衡を満たすとすれば、次の関係が成立する。
Figure 0006702686
これらの関係から、d1,d3を消去してまとめると、d2についての3次式になり、カルダノ法を用いてd2を求めることができる。
具体的には、遺伝型リスク算定部21aは、あらかじめ次の値を計算する。
Figure 0006702686
Figure 0006702686
Figure 0006702686
Figure 0006702686
2つのオッズ比 r1 、r2 がともに1であるときは、遺伝型リスク算定部21aは、
Figure 0006702686
の値を結果とする。
r1=1かつr2≠1であれば、遺伝型リスク算定部21aは、
Figure 0006702686
を計算し、遺伝型リスク(d1,d2,d3)を次の値とする。
Figure 0006702686
r1≠1かつr2=1であれば、遺伝型リスク算定部21aは、
Figure 0006702686
を計算し、遺伝型リスク(d1,d2,d3)を次の値とする。
Figure 0006702686
残るr1≠1かつr2≠1の場合には、遺伝型リスク算定部21aは、まずd2に関する3次方程式の係数C2、C3、C4を使い、3次方程式
Figure 0006702686
の根を、カルダノ法を用いて計算する。3次方程式を解いた場合、3重根の場合を除いて、解は次の3つのケースが考えられる。
(1)2つの実数根でそのうち1つは重根
(2)1つの実数根と2つの複素数根
(3)3つの異なる実数根
しかし、上述したオッズ比r1,r2の関係と、Hardy-Weinberg平衡に基づく関係とを用いてd2に関する3次方程式を求め、係数C2、C3、C4を定めると、 (1)(2)(3)のどのケースでも少なくとも1つ開区間(0,1)内の根が存在する。その値をd2とする。
カルダノ法で計算された開区間(0,1)の値d2を用い、
Figure 0006702686
Figure 0006702686
から遺伝型リスク(d1,d2,d3)が得られる。
次に、図3のステップS106に示した相対リスクの算定について詳細に説明する。相対リスク算定部21bは、ステップS106において、区間番号jにおける相対リスクPs/mを算定する。ここで、Psは個人のリスクであり、関連座位が複数あるならば、各関連座位の遺伝型リスクを統合したリスクとなる。
相対リスク算定部21bは、座位番号iの遺伝型リスク(d1,d2,d3)の値を用い、個人のリスクをPi=dkとする。dkは、個人の遺伝型(AA,Aa,aa)に応じて遺伝型リスク(d1,d2,d3)から定まる値である。
座位番号i=1,2,…,nを統合した個人リスクPsについては、次のような関係式が得られる。
Figure 0006702686
この式から、個人リスクのオッズ値は
Figure 0006702686
の関係が成り立ち、個人リスクPsは、
Figure 0006702686
により得られる。相対リスク算定部21bは、このPsを区間番号jにおける母平均mの値で除算し、相対リスクとして出力する。
次に、図3のステップS111に示したリスク評価処理について詳細に説明する。図4は、図3に示したリスク評価処理の処理手順を示すフローチャートである。リスク評価部21cは、まず、母平均mの区間内(1≦j≦100)において、相対リスクが1をまたぐ部分があるか否かを判定する(ステップS201)。
母平均mの区間内で、相対リスクが1をまたぐ部分があるならば(ステップS201;Yes)、リスク評価部21cは、相対リスクが1をまたぐときの母平均mの値を二分法で計算して示すが、リスク判別不適と判定し、「個人のリスクの判別が適切に行えない」との推定結果を出力して(ステップS205)、リスク評価処理を終了する。
母平均mの区間内で、相対リスクが1をまたぐ部分がなければ(ステップS201;No)、リスク評価部21cは、母平均mの区間内において、常に相対リスクが1以下であるか否かを判定する(ステップS202)。
母平均mの区間内において、常に相対リスクが1以下であるならば(ステップS202;Yes)、リスク評価部21cはリスク低と判定し、「被験者の個人のリスクは平均よりも低い」との推定結果を出力して(ステップS204)、リスク評価処理を終了する。
母平均mの区間内において、常に相対リスクが1以上であるならば(ステップS202;No)、リスク評価部21cはリスク高と判定し、「被験者の個人のリスクは平均よりも高い」との推定結果を出力して(ステップS203)、リスク評価処理を終了する。
次に、量的表現型推定部22の処理手順について説明する。図5は、量的表現型推定部22の処理手順を示すフローチャートである。まず、量的表現型分類部22aは、対象となる表現型について表現型基礎データ11をデータベース10から読み出す。
量的表現型分類部22aは、対象となる表現型の種別を特定し(ステップS301)、アレルの効果に相加性があるか否かを判定する(ステップS302)。アレルの効果に相加性がなければ(ステップS302;No)、量的表現型分類部22aは、対象の表現型を「相加性がない」に分類し、ステップS306に移行する。
ステップS306では、非相加性パターン変量評価部22dが量的表現型の発現傾向を推定し、推定結果を出力して処理を終了する。
アレルの効果に相加性があるならば(ステップS302;Yes)、量的表現型分類部22aは、対象の表現型の関連座位が単独であるか否かを判定する(ステップS303)。関連座位の数が単独であるならば(ステップS303;Yes)、量的表現型分類部22aは、対象の表現型を「関連座位が単独で相加性がある」に分類し、ステップS304に移行する。一方、関連座位の数が複数であるならば(ステップS303;No)、量的表現型分類部22aは、対象の表現型を「関連座位が複数でアレルに相加性がある」に分類し、ステップS305に移行する。
ステップS304では、相加性単独座位パターン変量評価部22bが量的表現型の発現傾向を推定し、推定結果を出力して処理を終了する。そして、ステップS305では、相加性複数座位パターン変量評価部22cが量的表現型の発現傾向を推定し、推定結果を出力して処理を終了する。
次に、量的表現型の発現傾向の推定について、詳細に説明する。まず、相加性単独座位パターン変量評価部22bによる推定について説明する。相加性単独座位パターン変量評価部22bは、線形モデルの一つの係数β1、aアレル頻度p、単独座位の遺伝型により変化する値Xを用いる。Xは、相加性がある場合には遺伝型(AA,Aa,aa)におけるアレルaの数となり、0,1,2のいずれかをとる。この単独座位によるQへの効果β1Xを座位の効果と呼ぶ。
Xが観察された時のQを変数Q1とする。
1の期待値をE(Q1)とする。相加性単独座位パターン変量評価部22bは、E(Q1)と母集団の平均値(母平均)E(Q)との差E(Q1)−E(Q)を計算する。これは観察された座位の効果の平均からの偏位を表す変数である。
この差(偏位)E(Q1)−E(Q)はこの座位の遺伝型によって異なる。
x=0であれば、
E(Q1)−E(Q)=−2pβ1
x=1であれば、
E(Q1)−E(Q)=β1(1−2p)
x=2であれば、
E(Q1)−E(Q)=2β1(1−p)
で偏位が計算される。
この偏位をE(Q1)−E(Q)の分散2β1 2p(1-p)の平方根(即ち標準偏差)で割った値を、標準化された偏位という。
Figure 0006702686
この値によって、個人の遺伝型から推定された個人の表現型が母平均より大きいか小さいか、およびその程度はどのくらいかを評価することができる。相加性単独座位パターン変量評価部22bは、この評価の結果を推定結果として出力する。
次に、相加性複数座位パターン変量評価部22cによる推定について説明する。複数座位の遺伝型による効果が相加的に量的表現型Qに影響すると仮定し、多変量線形モデル
Q=β0+β11+β22+・・・+βnn+ε
を仮定する。εの平均は0とする。そして、その期待値は
Figure 0006702686
で、これを母平均とする。また、座位番号iのXiが観察値xiの時の表現型をQiとし、
Figure 0006702686
がQiの期待値になる。なお、xiは座位番号iのXiの観察値である。
座位番号iでのQiの期待値の母平均からの偏位は、次のような式で計算できる。ここで、piは座位番号iのaアレル頻度である。
E(Qi)−E(Q)=βi(xi−2pi
全ての座位についてこの偏位を合計した値が、全座位の効果の和の期待値E(Qs)の母平均からの偏位である。すなわち、
Figure 0006702686
となる。
全座位の効果の和に定数項β0を加えた変数Qeの分散V(Qe)(全座位の効果の分散に等しい)は
Figure 0006702686
となる。そこで、標準化された、個人の量的表現型推定値と母平均との偏位は次のように計算できる。
Figure 0006702686
相加性複数座位パターン変量評価部22cは、この値を評価に用い、母平均より大きいか小さいか、またはそれに加え、その程度はどのくらいかを推定結果として出力する。
次に、アレルの効果についての非相加性パターン変量評価部22dによる推定について説明する。非相加性パターン変量評価部22dは、量的表現型Qの多変量線形モデル
Q=β0+β11+β22+・・・+βnn+ε
を用いる。相加性複数座位パターンの場合と同様にi座位の遺伝型を観察した上での量的表現型を変数Qiとし、推定値E(Qi)を、座位番号iの遺伝型(AA,Aa,aa)毎に次の記号で表すこととする。
E(Qi|AA)=μAA
E(Qi|Aa)=μAa
E(Qi|aa)=μaa
ただし、μAA, μAa, μaaは座位により異なるが、ここでは座位を示すiは省略した。相加性がない場合、遺伝型AAの場合、Xiは、相加性がある場合と同様に0とする。また、相加性がない場合、遺伝型aaのXiは、相加性がある場合と同様に2とする。しかし、相加性がない場合、遺伝型Aaの遺伝型値Xiは、
Figure 0006702686
の値をとる。ここで座位を示すiは省略してある。
非相加性パターン変量評価部22d、まず、各座位(座位番号i)の遺伝型を観察した場合の表現型Qiの期待値の母集団の平均からの偏位
E(Qi)−E(Q)
を計算するが、座位番号iの遺伝型によって、計算法が異なる。
遺伝型AAであれば、
E(Qi)−E(Q)=−2D1i−(D1+D2−2D1)pi 2
遺伝型Aaであれば、
E(Qi)−E(Q)=D1−2D1i−(D1+D2−2D1)pi 2
遺伝型aaであれば、
E(Qi)−E(Q)=D1+D2−2D1i−(D1+D2−2D1)pi 2
となる。この時のpiはi座位におけるaアレル頻度、D1,D2は次の値である。
1=μAa−μAA
2=μaa−μAa
ただし、μAA, μAa, μaaは座位により異なるが、ここでは座位を示すiは省略した。即ち、E(Qi)はi座位の遺伝型によって変化するが、その期待値は
Ni=2 pi (1-pi) D1+pi 2 D2である。
この偏位をすべての座位iについて合計すると次のように、すべての座位の遺伝型を観察した場合の表現型の推定値の母平均からの偏位E(Qs)−E(Q)が求まる。
Figure 0006702686
E(Qi)は元々変数ではなく値である。しかし、i座位の観察された遺伝型によって決まるxiが変化することにより異なった値を取る。従って、E(Qi)をXiの変数として見ることが可能である。このようにE(Qi)をXiの変数として見た場の分散は偏位E(Qi)−E(Q)の分散と同じなので、全座位についてこの分散を加えると、
Figure 0006702686
となる。ここでD1i、D2iはi座位におけるD1, D2である。そして、
Figure 0006702686
が標準化された個人の量的表現型推定値と母平均の偏位として得られる。非相加性パターン変量評価部22dは、この偏位を評価に用い、母平均より大きいか小さいか、およびその程度はどのくらいかを推定結果として出力する。
次に、「関連座位が単独で相加性がある」場合を例に、アレル頻度pと座位による効果の母平均からの偏位の関係を説明する。図6は、アレル頻度pと座位による効果の母平均からの偏位の関係についての説明図である。
図6の横軸はアレルaの頻度pである。図のQiは、ここでは単独座位の場合を考えるのでi=1とする。座位による効果の、母平均からの偏位E(Q1)−E(Q)は3つの遺伝型について、次の式で与えられる。
Figure 0006702686
Xへの係数β1=1とすると、遺伝型AA,Aa,aaの場合、それぞれ−2p,1−2p,2(1−p)である。座位の効果の和に定数項β0を加えた変数Qeの分散はV(Qe)=2β1 2p(1−p)の式より2p(1−p)が得られる。縦軸の0,1,2より傾き−2で右に伸びた3つの直線は、β1=1のときそれぞれ遺伝型AA,Aa,aaの場合の偏位E(Q1)−E(Q)を示す。内側の楕円は1SD(推定量の標準偏差の1倍)を、外側の楕円は2SD(標準偏差の2倍)を示している。この図から、特定のpの時の各遺伝型の場合の偏位と標準偏差との関連が変化することがわかる。例えば、p=0.3の時を図に示すが、AA,Aaの遺伝型値の母平均からの偏位は −1SD,+1SDの間に収まり、 aaでは+2SDを超える。
以上の分析により単一座位であっても量的表現型の母平均からの偏位を考えることは有意義であることが示された。
これまでの説明では、表現型推定システムを例示して説明を行ったが、本発明は表現型推定プログラムとして実施することも可能である。図7は、表現型推定プログラムの実施例である。図7に示したコンピュータ40は、CPU41、メモリ42、HDD(Hard Disk Drive)43、インタフェースボード44を有する。
HDD43は、磁気ディスクに質的表現型推定プログラム、量的表現型推定プログラム、表現型基礎データ及び遺伝型データを保持する。コンピュータ40が質的表現型推定プログラムや量的表現型推定プログラムをメモリ42に展開して実行すると、質的表現型推定プロセス42aや量的表現型推定プロセス42bが実行されることとなる。質的表現型推定プロセス42a及び量的表現型推定プロセス42bは、図2に示した質的表現型推定部21及び量的表現型推定部22にそれぞれ対応する処理を行なう。
このように、コンピュータ40は、質的表現型推定プログラムや量的表現型推定プログラムを読み出して実行することで、表現型推定装置として動作することができる。なお、各プロセスが使用するデータはインタフェースボード44を介して外部から取得することができ、また、各プロセスが出力するデータはインタフェースボード44を介して外部に出力することができる。インタフェースボード44には、ディスプレイ、キーボード、カメラなどの各種インタフェースデバイスが接続される。なお、図7ではHDDにプログラムを格納する場合を例に説明したが、CD(Compact Disc)など任意の記録媒体をプログラムの格納先として用いることができる。
上述してきたように、本実施例に係る表現型推定システムは、所定の質的表現型に影響を与える座位における各アレルまたは各遺伝型の比率と、質的表現型の母比率の区間推定値とを用い、遺伝型の各々について質的表現型の発現率を算定し、対象となる遺伝型について母比率の区間における質的表現型の発現率の分布を評価することで質的表現型の発現傾向を推定し、推定結果を出力する。このため、遺伝型に基づいて質的表現型を精度よく推定することができる。
また、本実施例に係る表現型推定システムは、量的表現型に影響を与える座位の数とアレルの効果の相加性の有無とに基づいて量的表現型を分類し、分類結果を用いて対象となる遺伝型を含む場合の量的表現型の推定値の分布を評価し、該推定値の分布を母平均と比較して量的表現型の発現傾向を推定し、推定結果を出力するする。このため、遺伝型に基づいて量的表現型を精度よく推定することができる。
なお、本実施例は発明を限定するものではなく、適宜変形して実施することができる。例えば、データベース10、表現型推定装置20及び遺伝型分析装置30の機能を備えた単一の装置として実施してもよい。
また、疾患のリスクに限らず、各種形質の発現について本発明を適用することができる。さらに、人の遺伝型に限らず、動植物など任意の生体の遺伝型から表現型を推定することができる。
以上のように、本発明に係る表現型推定システム及び表現型推定プログラムは、遺伝型に基づいて表現型を精度よく推定することに適している。
10 データベース
11 表現型基礎データ
12 遺伝型データ
20 表現型推定装置
21 質的表現型推定部
21a 遺伝型リスク算定部
21b 相対リスク算定部
21c リスク評価部
22 量的表現型推定部
22a 量的表現型分類部
22b 相加性単独座位パターン変量評価部
22c 相加性複数座位パターン変量評価部
22d 非相加性パターン変量評価部
30 遺伝型分析装置
40 コンピュータ
41 CPU
42 メモリ
42a 質的表現型推定プロセス
42b 量的表現型推定プロセス
43 HDD
44 インタフェースボード

Claims (7)

  1. 所定の質的表現型に影響を与える座位における各アレルの比率または各遺伝型の比率と、前記質的表現型に関する遺伝型間のオッズ比と、前記質的表現型の母比率の区間推定値とを用い、前記遺伝型の各々について前記質的表現型の発現率を算定する発現率算定手段と、
    対象となる遺伝型の入力を受け付ける対象遺伝型受付手段と、
    前記対象となる遺伝型について、前記発現率算定手段で算出された前記母比率の区間における前記質的表現型の発現率の分布を評価し、前記質的表現型の発現傾向を推定する推定手段と、
    前記推定手段による推定結果を出力する出力手段と
    を備え
    前記推定手段は、前記対象となる遺伝型における前記質的表現型の発現率と前記質的表現型の母比率との大小関係が前記母比率の区間の範囲内で反転しないことを条件に、前記対象となる遺伝型における前記質的表現型の発現傾向を推定する
    とを特徴とする表現型推定システム。
  2. 前記所定の質的表現型に複数の座位が影響する場合に、前記発現率算定手段は、それぞれの座位の遺伝型の各々について前記質的表現型の発現率を算定し、
    前記対象遺伝型受付手段は、前記複数の座位における遺伝型の組合せを対象の遺伝型の組合せとして受け付け、
    前記推定手段は、前記対象となる遺伝型の組合せについて前記母比率の区間における前記質的表現型の発現率の分布を評価し、前記質的表現型の発現傾向を推定する
    ことを特徴とする請求項に記載の表現型推定システム。
  3. 前記発現率算定手段は、前記遺伝型における特定のアレル頻度と、異なる遺伝型における前記質的表現型に関する遺伝型間のオッズ比と、前記質的表現型の母比率の区間推定値とを用い、前記遺伝型の各々について前記質的表現型の発現率を算定することを特徴とする請求項1又は2に記載の表現型推定システム。
  4. 量的表現型に影響を与える座位の数とアレルの効果の相加性の有無とに基づいて前記量的表現型を分類する分類手段と、
    対象となる遺伝型の入力を受け付ける対象遺伝型受付手段と、
    前記分類手段による分類結果を用い、前記対象となる遺伝型を含む場合の前記量的表現型の推定値の分布を評価し、該推定値の分布を母平均と比較して前記量的表現型の発現傾向を推定する推定手段と、
    前記推定手段による推定結果を出力する出力手段と
    を備えたことを特徴とする表現型推定システム。
  5. 前記分類手段は、前記相加性がない場合に対応する第1の分類、前記座位が単独で前記相加性がある場合に対応する第2の分類、前記座位が複数で前記相加性がある場合に対応する第3の分類のいずれかに前記量的表現型を分類し、
    前記推定手段は、前記分類結果に応じて異なる演算処理を行って前記推定値の分布を評価する
    ことを特徴とする請求項に記載の表現型推定システム。
  6. コンピュータに、
    対象となる遺伝型の入力を受け付ける対象遺伝型受付ステップと、
    所定の質的表現型に影響を与える座位における各アレルの比率または各遺伝型の比率と、前記質的表現型に関する遺伝型間のオッズ比と、前記質的表現型の母比率の区間推定値とを用い、前記遺伝型の各々について前記質的表現型の発現率を算定する発現率算定ステップと、
    前記対象となる遺伝型について、前記発現率算定ステップで算出された前記母比率の区間における前記質的表現型の発現率の分布を評価し、前記質的表現型の発現傾向を推定する推定ステップと、
    前記推定ステップによる推定結果を出力する出力ステップと
    を実行させ
    前記推定ステップは、前記対象となる遺伝型における前記質的表現型の発現率と前記質的表現型の母比率との大小関係が前記母比率の区間の範囲内で反転しないことを条件に、前記対象となる遺伝型における前記質的表現型の発現傾向を推定する
    ことを特徴とする表現型推定プログラム。
  7. コンピュータに、
    量的表現型に影響を与える座位の数とアレルの効果の相加性の有無とに基づいて前記量的表現型を分類する分類ステップと、
    対象となる遺伝型の入力を受け付ける対象遺伝型受付ステップと、
    前記分類ステップによる分類結果を用い、前記対象となる遺伝型を含む場合の前記量的表現型の推定値の分布を評価し、該推定値の分布を母平均と比較して前記量的表現型の発現傾向を推定する推定ステップと、
    前記推定ステップによる推定結果を出力する出力ステップと
    を実行させることを特徴とする表現型推定プログラム。
JP2015200797A 2015-10-09 2015-10-09 表現型推定システム及び表現型推定プログラム Active JP6702686B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015200797A JP6702686B2 (ja) 2015-10-09 2015-10-09 表現型推定システム及び表現型推定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015200797A JP6702686B2 (ja) 2015-10-09 2015-10-09 表現型推定システム及び表現型推定プログラム

Publications (2)

Publication Number Publication Date
JP2017073052A JP2017073052A (ja) 2017-04-13
JP6702686B2 true JP6702686B2 (ja) 2020-06-03

Family

ID=58538266

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015200797A Active JP6702686B2 (ja) 2015-10-09 2015-10-09 表現型推定システム及び表現型推定プログラム

Country Status (1)

Country Link
JP (1) JP6702686B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002132749A (ja) * 2000-10-24 2002-05-10 Naoyuki Kamatani サンプリングバイアス評価・減少装置
EP1593084A4 (en) * 2003-02-14 2008-12-10 Intergenetics Inc STATISTICALLY IDENTIFYING AN INCREASED DISEASE RISK
JP4890806B2 (ja) * 2005-07-27 2012-03-07 富士通株式会社 予測プログラムおよび予測装置
JP2012502398A (ja) * 2008-09-12 2012-01-26 ナビジェニクス インコーポレイティド 複数の環境的リスク因子及び遺伝的リスク因子を組み込む方法及びシステム
US20150025861A1 (en) * 2013-07-17 2015-01-22 The Johns Hopkins University Genetic screening computing systems and methods
JP6581117B2 (ja) * 2014-02-24 2019-09-25 チルドレンズ ホスピタル メディカル センター 個別化疼痛管理のための方法及び組成物

Also Published As

Publication number Publication date
JP2017073052A (ja) 2017-04-13

Similar Documents

Publication Publication Date Title
Bromham et al. Bayesian molecular dating: opening up the black box
US20210375392A1 (en) Machine learning platform for generating risk models
US20190139623A1 (en) Display of estimated parental contribution to ancestry
Wang et al. Estimation of parameters of inbreeding and genetic drift in populations with overlapping generations
CN105229649A (zh) 用于疾病关联的人类基因组变异分析和报告的系统及方法
CN108292327A (zh) 下一代测序中检测拷贝数变异的方法
US20200286622A1 (en) Data analysis methods and systems for diagnosis aids
Zintzaras The power of generalized odds ratio in assessing association in genetic studies with known mode of inheritance
KR102380501B1 (ko) 다차원 성격 검사 장치 및 방법
Jewell et al. Net reclassification improvement
TW201248425A (en) Comprehensive glaucoma determination method utilizing glaucoma diagnosis chip and deformed proteomics cluster analysis
Krizan Synthesizer 1.0: a varying-coefficient meta-analytic tool
Shaw et al. Growth models with multilevel regression
Willis et al. Accurate detection of shared genetic architecture from GWAS summary statistics in the small-sample context
JP6702686B2 (ja) 表現型推定システム及び表現型推定プログラム
Pontikos et al. Phenogenon: gene to phenotype associations for rare genetic diseases
TW202324151A (zh) 用於分析基因數據之電腦實施的方法及裝置
US20190087765A1 (en) Method and system for value assessment of a medical care provider
Markus et al. Integration of SNP genotyping confidence scores in IBD inference
Temple et al. Modeling recent positive selection in Americans of European ancestry
Reeder et al. Characterizing quantile-varying covariate effects under the accelerated failure time model
CN118352007B (zh) 一种基于人群队列多组学数据的疾病数据分析方法及系统
Shultz Comparative and population genomics of host-pathogen co-evolution in birds
KR102269208B1 (ko) 다중변이 연관 분석 장치 및 방법
Liu Curating and combining big data from genetic studies

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20151118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20151118

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191203

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200326

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200428

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200507

R150 Certificate of patent or registration of utility model

Ref document number: 6702686

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350