JP2007133476A - 遺伝子解析のためのデータ入力支援システム - Google Patents
遺伝子解析のためのデータ入力支援システム Download PDFInfo
- Publication number
- JP2007133476A JP2007133476A JP2005323401A JP2005323401A JP2007133476A JP 2007133476 A JP2007133476 A JP 2007133476A JP 2005323401 A JP2005323401 A JP 2005323401A JP 2005323401 A JP2005323401 A JP 2005323401A JP 2007133476 A JP2007133476 A JP 2007133476A
- Authority
- JP
- Japan
- Prior art keywords
- data
- error
- input
- locus
- genotype
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/40—Population genetics; Linkage disequilibrium
Landscapes
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Computational Biology (AREA)
- Analytical Chemistry (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】入力データにおいて、遺伝子型データに対する特徴的な制約条件、データセット全体における統計的性質を利用することで、起こり得るエラーを前処理プログラムで検出し、エラーとその原因となる誤記入とを結び付けて指摘し、指摘に対するユーザの入力を受け付けて入力データを修正したものを出力する。
【選択図】図1
Description
米国Rockefeller大学開発。患者を含む大家系の遺伝子型データに対し、連鎖解析を行う。
ftp://linkage.rockefeller.edu/software/linkage/
スイスUniversity of Geneva開発。家系の情報を含まない遺伝子型データに対し、ハーディ・ワインバーグ平衡検定および連鎖不平衡の計算を行う。
Stefan Schneider, David Roessli, and Laurent Excoffier (2000) Arlequin ver. 2.000: A software for population genetics data analysis. Genetics and Biometry Laboratory, University of Geneva, Switzerland.
米Whitehead Institute開発。家系の情報を含まない遺伝子型データに対し、遺伝子座ごとのmissingサンプル数の確認、ハーディ・ワインバーグ平衡(後述)の確認、遺伝子座間の距離の確認、マイナーな対立遺伝子の頻度の確認、ハプロタイプブロックの計算を行う(非特許文献1参照)。
米Silicon Genetics社開発(出願時現在、米Agilent Technologies社から”GeneSpring GT”として同じソフトウェアが提供されている)。家系の情報を含む遺伝子型データや含まない遺伝子型データに対し、ハプロタイプブロックの計算などの解析を行う。
http://www.silicongenetics.com/cgi/SiG.cgi/Products/Varia/features.smf
東京女子医科大学開発。家系の情報を含む遺伝子型データに対し、対立遺伝子の伝達の矛盾を探す。
http://www.genstat.net/checkfam/index.cgi?lang=ja
この場合は、入力ファイルが不十分であるため、解析プログラムを実行させることができない。
この場合は、プログラムが途中で異常終了してしまう可能性や、プログラムを実行させることはできても解析結果が意図したものと異なる可能性がある。さらに、見かけ上プログラムが最後まで実行された場合、研究者は解析結果が意図したものと異なることに気づかない危険性も考えられる。
染色体のゲノム配列のデータが更新された時の数え直し処理や、in/del多型をどのように数えるかのポリシーにより、一貫性が失われて物理位置の重複が生じる危険性がある。
SNPの中には発見時の経緯により複数の遺伝子座名を持つSNPがある。また、遺伝子座名を記述する際、ABI社で開発されたSNPの遺伝子座名の末尾に「(ABI)」を付けたり、JSNPプロジェクトで開発されたSNPの遺伝子座名の末尾に「(JSNP)」を付けたりする場合がある。この場合は、手作業で入力データを作成しているうちにこれらの付加文字列が抜け落ちたり、全角文字になったりする危険性がある。これらの原因により遺伝子座名の不整合が生じると、プログラムの処理上は特定のSNPについて遺伝子型データがまったく指定されていない・物理位置が指定されていないかのように扱われてしまい、原因究明・解決までに時間を要する。
図34に示したIUBコードではmissingデータを「0」で表記することが想定されている。しかし、誤ってmissingデータを「*」(アスタリスク)などの記号で表記してしまったり、AとTのヘテロ接合を「W」ではなく「AT」と2つの対立遺伝子をつなげて表記してしまったりする場合がある。この場合は想定外の文字列が現れたことになるため、プログラムが途中で異常終了してしまう可能性がある。
図33に示した形式では、患者は「Patient」健常者は「Normal」で記述されることが想定されている。しかし、誤って患者を「Case」健常者を「Control」と記述してしまったり、大文字と小文字を間違えて記述してしまったりする場合がある。また、患者の個体識別子は「P」から始まるもの、健常者の個体識別子は「N」から始まるものを指定し、疾患の有無の指定を省略してしまう場合がある。これらの場合は、プログラムが途中で異常終了してしまう可能性がある。
この原因としては次の4つが考えられる。
JSNPなどの公共データベースに登録されている遺伝子座を用いた場合は、データベースでは多型があるとして登録されていても研究者が持っているサンプル内では多型がない(単型である)場合がある。連鎖不平衡解析のアルゴリズムによっては、解析に用いる全ての遺伝子座で多型があることを想定して定義されているものがある。例えば、連鎖不平衡係数のD’は対立遺伝子の頻度での割り算を行うため、頻度が0である対立遺伝子を含む遺伝子座においては定義されていない。このようなプログラムの入力データに多型がない遺伝子座が含まれていると、プログラムが途中で異常終了してしまう可能性や、プログラムを実行させることはできても解析結果が意図したものと異なる可能性がある。
この場合は、プログラムが途中で異常終了してしまう可能性や、プログラムを実行させることはできても解析結果が意図したものと異なる可能性がある。
遺伝子型を調べる実験を行うには、それぞれの遺伝子座ごとにプローブと呼ばれる短い塩基配列を用意することが多い。JSNPやABI社が用意したSNPなどでは、プローブがゲノム上で1箇所だけに反応することが確かめられていると期待できるが、dbSNPなど不特定多数が投稿できる公共データベースに登録されているSNPや研究者が独自に用意したSNPでは、まれに図37の3700に示すように2箇所に反応してしまう場合がある。この場合は、実際には遺伝子座Locus2-1にも遺伝子座Locus2-2にも多型がないにも関わらず、3701に示すように、ほぼ全ての個体がTとCのヘテロ接合である単一の遺伝子座Locus2(点線で囲んだ部分)であるかのような実験結果が得られてしまう。
この原因としては次の2つが考えられる。1つ目は、実際にサンプル集団の多くがホモ接合の場合である。病因となる変異をホモ接合で持つとヘテロ接合で持つ場合より発症リスクが大きくなる疾患においては、患者集団でホモ接合の頻度が高くなる場合がある。原因の2つ目は、サンプル集団が2種類の集団が混ざっているものだった場合である。例えば、人種1は全ての個体がCを持ち、人種2は全ての個体がGを持つ遺伝子座Locus3があったとする。サンプル集団が2つの人種を含む場合は、図38に示すように、それぞれの人種では多型がないにも関わらず、この遺伝子座には多型があるかのように思われてしまう。このような複数の集団が混在したサンプルでは適切な解析ができない。
実験中に他サンプルのDNAが混入してしまう場合がある。図39の3900に示すような状況において個体P01のサンプルに個体P02のDNAが混入してしまったとすると、実際には遺伝子座Locus1では対立遺伝子としてA、Locus2ではGしか持っていないにも関わらず、3901に示すようにAとTおよびGとCを持っているかのように観測される。このため、多くの遺伝子座でヘテロ接合であるとの実験結果が得られてしまう。
図40に示す例では、個体P03は全ての遺伝子座でホモ接合である。このような個体は、特殊な個体(家系内に近親婚があるなど)である可能性がある。連鎖不平衡解析においては、サンプルは患者集団および健常者集団からランダムに選ばれたと仮定しているため、この個体を除外して解析した方が良い場合が多い。
図41に示すように、特定の個体(ここではP01)において実験を高頻度で失敗し、missingデータが多くなってしまう場合がある。このような場合は、ハプロタイプ推定精度が低くなってしまったり、信頼区間の幅が広がってしまったりする可能性がある。したがって、個体P01を含めた場合と除いた場合で2通り解析してみることが望ましい。
図42に示すように、特定の遺伝子座(ここではLocus2)において実験を高頻度で失敗し、missingデータが多くなってしまう場合がある。また、2つ以上の研究機関で得られた遺伝子型データを合わせて解析する際、Locus2は片方の研究機関でしか実験をしなかったとすると、もう片方の研究機関から得られたデータではLocus2のデータは全てmissingデータとして扱われる。このような場合は、エラー14の場合と同様に、Locus2を含めた場合と除いた場合で2通り解析してみることが望ましい。
集団に十分な個体数があり、他集団への個体の移動がなく、集団内での任意婚が成立し、突然変異や自然淘汰がない場合は、その集団はハーディ・ワインバーグ平衡にあると言う。解析に用いたサンプル集団がハーディ・ワインバーグ平衡からずれていた場合は、ランダムサンプリングできなかったのではないかと疑われ、適切な解析ができない可能性がある。
遺伝子座間の距離が極端に離れている場合は、その遺伝子座間が連鎖不平衡にある(祖先から一塊として受け継がれている)とは考えにくい。したがって、連鎖不平衡解析を行う際、このような遺伝子座を1度に解析するべきではない。
遺伝統計解析による病因遺伝子探索においては、通常、マイナーな対立遺伝子の頻度が5%以上である遺伝子座のみを解析に用い、望ましくは10%〜30%を下限とした方が良いとされている。これは、対立遺伝子頻度が極端に低い遺伝子座を用いることにより統計的検定の検出力が下がってしまうのを防ぐためである。したがって、この遺伝子座を含めた場合と除いた場合で2通り解析してみることが望ましい。
1)2種類以上の異なる空白文字が入力データの区切り文字として使用されている。
2)複数の空白文字が連続して現れる。
3)連鎖不平衡解析プログラムの種類によって、空白文字及び遺伝子型データのいずれにも解釈され得る文字が使用されている。
これは、上記機能7を実現したものである。
遺伝子型データにおいて対立遺伝子を3つ以上持つ遺伝子座がある場合において、前記エラー指摘表示部は、以下の2つの条件が全て満たされる場合には、入力された遺伝子型データにおいて、前記3つ以上の対立遺伝子のうちの頻度が高い2つの対立遺伝子のヘテロ接合の遺伝子型が誤記入されている可能性がある旨の指摘を表示する。
1)入力された遺伝子型データにおいて、前記3つ以上の対立遺伝子のうちの頻度が高い2つの対立遺伝子のヘテロ接合を含む個体が存在しない。
2)入力された遺伝子型データにおいて、前記3つ以上の対立遺伝子のうちの頻度の高さが3番目以降の対立遺伝子のホモ接合を含む個体が存在しない。
1)入力された遺伝子型データにおいて、前記対立遺伝子を3つ以上持つ遺伝子座に後続して対立遺伝子を3つ以上持つ遺伝子座が一定数以上存在する。
2)入力された遺伝子型データにおいて、同一の個体が複数の遺伝子座において3つ以上の対立遺伝子のうち頻度の高さが3番目以降の対立遺伝子を含んでいる。
3)入力された遺伝子型データにおいて、上記2)に該当する個体は、終端の遺伝子座における遺伝子型が指定されていない。
4)入力された遺伝子型データにおいて、3つ以上の対立遺伝子を持つ遺伝子座における頻度の高さが3番目以降の対立遺伝子は、当該遺伝子座の後隣の遺伝子座において頻度の高さが1番目又は2番目の対立遺伝子である。
1)入力された遺伝子型データにおいて、前記対立遺伝子を3つ以上持つ遺伝子座に後続して対立遺伝子を3つ以上持つ遺伝子座が一定数以上存在する。
2)入力された遺伝子型データにおいて、同一の個体が複数の遺伝子座において3つ以上の対立遺伝子のうち頻度の高さが3番目以降の対立遺伝子を含んでいる。
3)入力された遺伝子型データにおいて、上記2)に該当する個体は、終端の遺伝子座における遺伝子型が指定されている。
4)入力された遺伝子型データにおいて、3つ以上の対立遺伝子を持つ遺伝子座における頻度の高さが3番目以降の対立遺伝子は、当該遺伝子座の前隣の遺伝子座において頻度の高さが1番目又は2番目の対立遺伝子である。
図1は、本発明の一実施形態として構築される、遺伝子型データ入力支援システムの内部構成を概略的に示す機能ブロック図である。この遺伝子型データ入力支援システムは、遺伝統計解析で用いられる各種プログラムの特徴を保存したプログラムDB100、入力データとその解釈支援結果を表示するための表示装置101、表示されたデータに対して個体や遺伝子座を選択するなどの操作を行うためのキーボード102とマウスなどのポインティングデバイス103、必要な演算処理、制御処理等を行う中央処理装置104、中央処理装置104での処理に必要なプログラムを格納するプログラムメモリ105、中央処理装置104での処理に必要なデータを格納するデータメモリ106を備えている。
次に、上記のように構成された本実施形態の遺伝子型データ入力支援システムにおいて行われる処理について説明する。図4は、遺伝子型データ入力支援システムによる処理の流れを概略的に示すフローチャートである。図4において、まず、プログラムDB100からユーザが指定したプログラムに対応するデータを読み込む(ステップ400)。ここで読み込まれたデータはデータメモリ106のプログラムデータ133として保持する。次に、プログラムへの入力データとして用いられる入力データ及びそれぞれの遺伝子座における実験手法を読み込む(ステップ401)。ここで読み込まれたデータはデータメモリ106の入力データ134として保持する。その後、入力データのエラーを確認して指摘し、ユーザ入力を受け付け、修正版入力データを作成する(ステップ402)。この処理はプログラムメモリ105に含まれる処理部107〜132を用いて行うものであり、図5で詳細に説明する。
101 表示装置
102 キーボード
103 ポインティングデバイス
104 中央処理装置
105 プログラムメモリ
106 データメモリ
107 物理位置指定指摘処理部
108 物理位置順序指摘処理部
109 物理位置重複指摘処理部
110 類似遺伝子座名指摘処理部
111 遺伝子型指摘処理部
112 集団名指摘処理部
113 対立遺伝子数指摘処理部
114 単型指摘処理部
115 in/del指摘処理部
116 2箇所反応指摘処理部
117 複数集団指摘処理部
118 サンプル混入指摘処理部
119 特殊な個体指摘処理部
120 missing個体指摘処理部
121 指摘・修正項目表示処理部
122 記号遺伝子型指摘処理部
123 文字列遺伝子型指摘処理部
124 想定外遺伝子型指摘処理部
125 集団名指定指摘処理部
126 集団名誤記入指摘処理部
127 想定外集団名指摘処理部
128 多対立遺伝子指摘処理部
129 ヘテロ接合誤記入指摘処理部
130 missing空白指摘処理部
131 ヘテロ接合空白指摘処理部
132 不規則空白文字指摘処理部
133 プログラムデータ
134 入力データ
Claims (20)
- 連鎖不平衡解析プログラムに入力される遺伝子型データの検査を行うデータ入力支援システムであって、
前記連鎖不平衡解析プログラムに対応する遺伝子型データのエラーの類型を保持する記憶部と、
入力された遺伝子型データを前記エラーの類型に照合し、エラーを検出するエラー検出部と、
前記検出されたエラーを指摘する表示を行うエラー指摘表示部とを備えていることを特徴とするデータ入力支援システム。 - 前記エラーの類型は、遺伝子座の物理位置に関する遺伝子型データを必要とする連鎖不平衡解析プログラムに対して、入力された遺伝子型データが遺伝子座の物理位置に関するデータを有していないというエラーを含んでいることを特徴とする請求項1に記載のデータ入力支援システム。
- 前記エラーの類型は、遺伝子座が物理位置の順に並んでいる遺伝子型データにのみ対応した連鎖不平衡解析プログラムに対して、入力された遺伝子型データにおいて遺伝子座が物理位置の順に並んでいないというエラーを含んでいることを特徴とする請求項1に記載のデータ入力支援システム。
- 前記エラーの類型は、入力された遺伝子型データにおいて遺伝子座の物理位置に重複があるというエラーを含んでいることを特徴とする請求項1に記載のデータ入力支援システム。
- 前記エラーの類型は、入力された遺伝子型データにおいて遺伝子型が指定されていない遺伝子座と物理位置が指定されていない遺伝子座とがあるエラーを含んでいることを特徴とする請求項1に記載のデータ入力支援システム。
- 前記エラーの類型は、入力された遺伝子型データにおいて、ホモ接合体、ヘテロ接合体又はmissingデータを示す記号として、前記連鎖不平衡解析プログラムにおける規定とは異なる記号が含まれているというエラーを含んでいることを特徴とする請求項1に記載のデータ入力支援システム。
- 前記エラーの類型は、患者及び健常者両方の遺伝子型データを必要とする連鎖不平衡解析プログラムに対して、入力された遺伝子型データにおいて、前記連鎖不平衡解析プログラムにおける規定に従って患者及び健常者それぞれの集団が特定されていないというエラーを含んでいることを特徴とする請求項1に記載のデータ入力支援システム。
- 前記エラーの類型は、1つの遺伝子座について多くとも2種類の対立遺伝子しか存在しないと規定している連鎖不平衡解析プログラムに対して、入力された遺伝子型データにおいて3種類以上の対立遺伝子を持つ遺伝子座が含まれているというエラーを含んでいることを特徴とする請求項1に記載のデータ入力支援システム。
- 前記エラーの類型は、入力された遺伝子型データにおいて下記のいずれかの表記が含まれているというエラーを含んでいることを特徴とする請求項1に記載のデータ入力支援システム。
1)2種類以上の異なる空白文字が入力データの区切り文字として使用されている。
2)複数の空白文字が連続して現れる。
3)連鎖不平衡解析プログラムの種類によって、空白文字及び遺伝子型データのいずれにも解釈され得る文字が使用されている。 - 前記エラーの類型は、全ての遺伝子座で多型があると規定している連鎖不平衡解析プログラムに対して、入力された遺伝子型データにおいて単型の遺伝子座が含まれているというエラーを含んでいることを特徴とする請求項1に記載のデータ入力支援システム。
- 前記エラーの類型は、対立遺伝子としてA・T・G・Cしか現れないと規定している連鎖不平衡解析プログラムに対して、入力された遺伝子型データにおいてin/del多型である遺伝子座が含まれているというエラーを含んでいることを特徴とする請求項1に記載のデータ入力支援システム。
- 前記エラーの類型は、入力された遺伝子型データにおいて、ヘテロ接合の個体が所定基準より多い遺伝子座、又はホモ接合の個体が所定基準より多い遺伝子座が含まれているというエラーを含んでいることを特徴とする請求項1に記載のデータ入力支援システム。
- 前記エラーの類型は、入力された遺伝子型データにおいて、ヘテロ接合の遺伝子座を所定基準より多く有する個体、又はホモ接合の遺伝子座を所定基準より多く有する個体が含まれているというエラーを含んでいることを特徴とする請求項1に記載のデータ入力支援システム。
- 前記エラーの類型は、入力された遺伝子型データにおいて、missingデータが所定基準より多い個体が含まれているというエラーを含んでいることを特徴とする請求項1に記載のデータ入力支援システム。
- 遺伝子型データにおいて対立遺伝子を3つ以上持つ遺伝子座がある場合において、
前記エラー指摘表示部は、
以下の2つの条件が全て満たされる場合には、入力された遺伝子型データにおいて、前記3つ以上の対立遺伝子のうちの頻度が高い2つの対立遺伝子のヘテロ接合の遺伝子型が誤記入されている可能性がある旨の指摘を表示することを特徴とする請求項8に記載のデータ入力支援システム。
1)入力された遺伝子型データにおいて、前記3つ以上の対立遺伝子のうちの頻度が高い2つの対立遺伝子のヘテロ接合を含む個体が存在しない。
2)入力された遺伝子型データにおいて、前記3つ以上の対立遺伝子のうちの頻度の高さが3番目以降の対立遺伝子のホモ接合を含む個体が存在しない。 - 遺伝子型データにおいて対立遺伝子を3つ以上持つ遺伝子座がある場合において、
前記エラー指摘表示部は、
以下の4つの条件が全て満たされる場合には、入力された遺伝子型データにおいてmissingデータの表記形式が誤記入されている可能性がある旨の指摘を表示することを特徴とする請求項8に記載のデータ入力支援システム。
1)入力された遺伝子型データにおいて、前記対立遺伝子を3つ以上持つ遺伝子座に後続して対立遺伝子を3つ以上持つ遺伝子座が一定数以上存在する。
2)入力された遺伝子型データにおいて、同一の個体が複数の遺伝子座において3つ以上の対立遺伝子のうち頻度の高さが3番目以降の対立遺伝子を含んでいる。
3)入力された遺伝子型データにおいて、上記2)に該当する個体は、終端の遺伝子座における遺伝子型が指定されていない。
4)入力された遺伝子型データにおいて、3つ以上の対立遺伝子を持つ遺伝子座における頻度の高さが3番目以降の対立遺伝子は、当該遺伝子座の後隣の遺伝子座において頻度の高さが1番目又は2番目の対立遺伝子である。 - 遺伝子型データにおいて対立遺伝子を3つ以上持つ遺伝子座がある場合において、
前記エラー指摘表示部は、以下の4つの条件が全て満たされる場合には、入力された遺伝子型データにおいてヘテロ接合の遺伝子型が誤記入されている可能性がある旨の指摘を表示することを特徴とする請求項8に記載のデータ入力支援システム。
1)入力された遺伝子型データにおいて、前記対立遺伝子を3つ以上持つ遺伝子座に後続して対立遺伝子を3つ以上持つ遺伝子座が一定数以上存在する。
2)入力された遺伝子型データにおいて、同一の個体が複数の遺伝子座において3つ以上の対立遺伝子のうち頻度の高さが3番目以降の対立遺伝子を含んでいる。
3)入力された遺伝子型データにおいて、上記2)に該当する個体は、終端の遺伝子座における遺伝子型が指定されている。
4)入力された遺伝子型データにおいて、3つ以上の対立遺伝子を持つ遺伝子座における頻度の高さが3番目以降の対立遺伝子は、当該遺伝子座の前隣の遺伝子座において頻度の高さが1番目又は2番目の対立遺伝子である。 - 前記入力された遺伝子型データについて、前記指摘されたエラーを訂正する入力を受け付け、当該入力に基づいて前記遺伝子型データを訂正するエラー訂正手段をさらに備えていることを特徴とする請求項1から17のいずれか1項に記載のデータ入力支援システム。
- 前記エラー訂正手段は、前記対立遺伝子を3つ以上持つ遺伝子座について、当該3つ以上の対立遺伝子のうち頻度の高さが3番目以降の対立遺伝子を頻度の高さが1番目以降の対立遺伝子に書き換える訂正入力を受け付け、そのように前記遺伝子型データを訂正することを特徴とする請求項8に記載のデータ入力支援システム。
- 前記エラー指摘表示部によるエラー指摘内容と、前記エラー訂正手段による前記遺伝子型データの訂正内容とを一覧表示する手段をさらに備えていることを特徴とする請求項1から19のいずれか1項に記載のデータ入力支援システム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005323401A JP5144891B2 (ja) | 2005-11-08 | 2005-11-08 | 遺伝子解析のためのデータ入力支援システム |
EP06022934A EP1783646A1 (en) | 2005-11-08 | 2006-11-03 | System for detection and correction of errors in input data for genotype analysis |
US11/593,171 US20070106481A1 (en) | 2005-11-08 | 2006-11-06 | Data input support system for gene analysis |
US12/458,222 US20100023271A1 (en) | 2005-11-08 | 2009-07-06 | Data input support system for gene analysis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005323401A JP5144891B2 (ja) | 2005-11-08 | 2005-11-08 | 遺伝子解析のためのデータ入力支援システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007133476A true JP2007133476A (ja) | 2007-05-31 |
JP5144891B2 JP5144891B2 (ja) | 2013-02-13 |
Family
ID=37654782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005323401A Expired - Fee Related JP5144891B2 (ja) | 2005-11-08 | 2005-11-08 | 遺伝子解析のためのデータ入力支援システム |
Country Status (3)
Country | Link |
---|---|
US (2) | US20070106481A1 (ja) |
EP (1) | EP1783646A1 (ja) |
JP (1) | JP5144891B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013008215A (ja) * | 2011-06-24 | 2013-01-10 | Nec Corp | 情報処理装置、情報処理方法および情報処理プログラム |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7617221B2 (en) * | 2007-02-16 | 2009-11-10 | Microsoft Corporation | Rendering database queries with blank space |
CN105368923B (zh) * | 2014-08-27 | 2018-09-14 | 深圳华大基因科技服务有限公司 | 遗传图谱的构建方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001060240A (ja) * | 1999-08-24 | 2001-03-06 | Hitachi Ltd | フォーマット修正方法およびデータ変換方法 |
JP2007523600A (ja) * | 2003-02-27 | 2007-08-23 | メセクシス ゲノミクス エヌ.ヴイ. | 多重配列変異体解析を用いる遺伝子診断 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060257888A1 (en) * | 2003-02-27 | 2006-11-16 | Methexis Genomics, N.V. | Genetic diagnosis using multiple sequence variant analysis |
-
2005
- 2005-11-08 JP JP2005323401A patent/JP5144891B2/ja not_active Expired - Fee Related
-
2006
- 2006-11-03 EP EP06022934A patent/EP1783646A1/en not_active Withdrawn
- 2006-11-06 US US11/593,171 patent/US20070106481A1/en not_active Abandoned
-
2009
- 2009-07-06 US US12/458,222 patent/US20100023271A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001060240A (ja) * | 1999-08-24 | 2001-03-06 | Hitachi Ltd | フォーマット修正方法およびデータ変換方法 |
JP2007523600A (ja) * | 2003-02-27 | 2007-08-23 | メセクシス ゲノミクス エヌ.ヴイ. | 多重配列変異体解析を用いる遺伝子診断 |
Non-Patent Citations (3)
Title |
---|
JPN6011041279; O'Connell, J. R.: 'PedCheck: A Program for Identification of Genotype Incompatibilities in Linkage Analysis' The American Journal of Human Genetics Vol.63, No.1, 19980701, p.259-266 * |
JPN6011041281; Oosterhout, C.: 'Micro-Checker: Software for Identifying and Correcting Genotyping Errors in Microsatellite Data' Molecular Ecology Notes Vol.4, 2004, p.535-538 * |
JPN6011041283; Saito, M.: 'Web-based detection of genotype errors in pedigree data' Journal of human genetics Vol.47, 2002, p.377-379 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013008215A (ja) * | 2011-06-24 | 2013-01-10 | Nec Corp | 情報処理装置、情報処理方法および情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5144891B2 (ja) | 2013-02-13 |
US20070106481A1 (en) | 2007-05-10 |
US20100023271A1 (en) | 2010-01-28 |
EP1783646A1 (en) | 2007-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA3018186C (en) | Genetic variant-phenotype analysis system and methods of use | |
US7996157B2 (en) | Genetic diagnosis using multiple sequence variant analysis | |
Ziegler et al. | Biostatistical aspects of genome‐wide association studies | |
Kurtz et al. | REPuter: the manifold applications of repeat analysis on a genomic scale | |
EP1869605B1 (en) | Genetic diagnosis using multiple sequence variant analysis | |
Suzuki et al. | Rapid and ongoing evolution of repetitive sequence structures in human centromeres | |
Watson et al. | Rapid detection of rare deleterious variants by next generation sequencing with optional microarray SNP genotype data | |
Kockum et al. | Overview of genotyping technologies and methods | |
WO2013103759A2 (en) | Haplotype based pipeline for snp discovery and/or classification | |
JP5144891B2 (ja) | 遺伝子解析のためのデータ入力支援システム | |
Kothiyal et al. | Mendelian inconsistent signatures from 1314 ancestrally diverse family trios distinguish biological variation from sequencing error | |
Qian et al. | PopAlu: population-scale detection of Alu polymorphisms | |
Barnes | Genetic variation analysis for biomedical researchers: a primer | |
Gymrek et al. | Profiling short tandem repeats from short reads | |
Carr et al. | DominantMapper: Rule‐based analysis of SNP data for rapid mapping of dominant diseases in related nuclear families | |
Al-Chalabi | Genome-wide association studies | |
Speer | Use of LINKAGE programs for linkage analysis | |
Gunasekaran et al. | SNP‐SVant: A Computational Workflow to Predict and Annotate Genomic Variants in Organisms Lacking Benchmarked Variants | |
Sood | Bioinformatic analysis of human Next Generation Sequencing data; extracting additional information, optimising mapping and variant calling, and application in a rare disease | |
Saxena et al. | Asian Journal of Biological and Life Sciences Original Research | |
Dubchak | SNP-VISTA: An Interactive SNPs Visualization Tool |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080701 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110809 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110930 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120403 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121120 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121126 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151130 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |