JP2010157231A - 個人ゲノム統合管理方法及び装置 - Google Patents

個人ゲノム統合管理方法及び装置 Download PDF

Info

Publication number
JP2010157231A
JP2010157231A JP2009293065A JP2009293065A JP2010157231A JP 2010157231 A JP2010157231 A JP 2010157231A JP 2009293065 A JP2009293065 A JP 2009293065A JP 2009293065 A JP2009293065 A JP 2009293065A JP 2010157231 A JP2010157231 A JP 2010157231A
Authority
JP
Japan
Prior art keywords
data
information
genome
individual
integrated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009293065A
Other languages
English (en)
Other versions
JP5687834B2 (ja
Inventor
Tae-Jin Ahn
兌 臻 安
Kyu-Sang Lee
圭 祥 李
Dae-Soon Son
大 淳 孫
Kyung-Hee Park
卿 希 朴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2010157231A publication Critical patent/JP2010157231A/ja
Application granted granted Critical
Publication of JP5687834B2 publication Critical patent/JP5687834B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/454Multi-language systems; Localisation; Internationalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

【課題】個人のゲノム情報を表すデータを管理する装置及び方法を提供する。
【解決手段】データ分析部11がある個人のゲノム情報を表す第1データを分析して第1データの特性情報を獲得し、個人のゲノム情報を表す第2データの存否を決定し、統合データ生成部12が獲得された特性情報に基づいて、第1データと個人のゲノム情報を表す第2データとを統合したデータを生成する、個人ゲノム統合管理装置及び方法。
【選択図】図1

Description

本発明は、個人のゲノム情報を表すデータを管理する個人ゲノム統合管理方法とそのためのプログラムを記録したコンピュータで読み取り可能な記録媒体、個人ゲノム統合管理装置、および個人ゲノム比較方法とそのためのプログラムを記録したコンピュータで読み取り可能な記録媒体、個人ゲノム比較装置、ならびに個人ゲノムサービス提供方法とそのためのプログラムを記録したコンピュータで読み取り可能な記録媒体に関する。
ゲノムとは、ある生物が持つあらゆる遺伝情報を指す。いずれか1つのゲノムを配列化する技術はまだ発展段階にある。次世代配列化技術、次次世代配列化技術など個人ゲノムを分析するいろいろな技術が開発されているが、まだ商用化ステップには到達していない。生物の遺伝情報として、SNP(Single Nucleotide Polymorphism)、CNV(Copy Number Variation)などを検出するDNAチップなどのゲノム検出媒体10(例えば、ジェネチップ(Genechip)(登録商標))が商用化しただけである。したがって、個人のゲノム情報を表すデータは、ゲノム配列化技術の発展、ゲノム検出媒体の発展によってその内容が変わりうる。関連分野の先行技術文献には特許文献1ないし3がある。
大韓民国公開特許2000−072098号公報 特開平07−093370号公報 米国特許第5706498号明細書
本発明が解決しようとする技術的課題は、ゲノム配列化技術、ゲノム検出媒体の発展による個人ゲノムデータの多様な構造に従属されず、個人ゲノムデータを一貫して管理できる装置及び方法を提供するところにある。また、その方法をコンピュータに実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供することにある。 本発明が解決しようとする他の技術的課題は、前記のような技術的課題を解決するための個人ゲノム比較方法、そのためのプログラムを記録したコンピュータで読み取り可能な記録媒体、個人ゲノム比較装置、個人ゲノムサービス提供方法とそのためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供することである。
前記技術的課題を解決するための個人ゲノム統合管理方法は、ある個人のゲノム情報を表す第1データを分析することによって前記第1データの特性情報を獲得するステップと、前記個人のゲノム情報を表す第2データの存否を決定するステップと、前記獲得された特性情報に基づいて、前記第1データと前記個人のゲノム情報を表す第2データとを統合したデータを生成するステップと、を含む。
前記他の技術的課題を解決するための一実施形態は、前記の個人ゲノム統合管理方法をコンピュータに実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
前記さらに他の技術的課題を解決するための個人ゲノム統合管理装置は、ある個人のゲノム情報を表す第1データを分析することによって、前記第1データの特性情報を獲得する分析部と、前記分析部により獲得された特性情報に基づいて、前記第1データと前記個人のゲノム情報を表す第2データとを統合したデータを生成する生成部と、を備える。
前記さらに他の技術的課題を解決するための個人ゲノム比較方法は、ある個人のゲノム情報を表す第1データを分析することによって前記第1データの特性情報を獲得するステップと、前記分析部により獲得された特性情報に基づいて、前記第1データと前記個人のゲノム情報を表す第2データとを統合したデータを生成するステップと、前記統合データと、前記統合データと同じ構造を持つ他のデータとを比較するステップと、を含む。
前記さらに他の技術的課題を解決するための前記の個人ゲノム比較方法をコンピュータに実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
前記さらに他の技術的課題を解決するための個人ゲノム比較装置は、ある個人のゲノム情報を表す第1データを分析することによって前記第1データの特性情報を獲得する分析部と、前記分析部により獲得された特性情報に基づいて、前記第1データと前記個人のゲノム情報を表す第2データとを統合したデータを生成する生成部と、前記統合データと、前記統合データと同じ構造を持つ他のデータとを比較する比較部と、を備える。
前記さらに他の技術的課題を解決するための個人ゲノムサービス提供方法は、個人のゲノム情報を利用して、前記個人についての医療的分析を提供するサービスそれぞれを表すコンテンツをユーザー端末に伝送するステップと、前記ユーザー端末から、前記サービスのコンテンツのうち、少なくとも一つについての選択情報を受信するステップと、前記個人のゲノム情報を表す第1データと、前記個人のゲノム情報を表す第2データとが統合されたデータを利用して、前記受信された選択情報が表すサービスを実行するステップと、前記サービス実行の結果物を前記ユーザー端末に伝送するステップと、を含む。
前記さらに他の技術的課題を解決するための前記の個人ゲノム提供方法をコンピュータに実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
本発明によれば、ゲノム配列化技術、ゲノム検出媒体の発展による、個人ゲノムデータの多様な構造に従属されない一つの統一された構造を持つ統合データを提示することによって、個人ゲノムデータを一貫して管理できる。
本発明の一実施形態による個人ゲノム統合管理装置の構成図である。 本発明の一実施形態による個人ゲノム統合管理方法のフローチャートである。 図2に図示されたステップ21の詳細フローチャートである。 図1に図示されたデータ分析部に入力される個人ゲノムデータの一例を示した図面である。 図1に図示された統合データ生成部により生成されたPGFの構造を示した図面である。 図5に図示された遺伝子型情報のエンコーディング例を示した図面である。 図2に図示されたステップ22の詳細フローチャートである。 図5に図示されたPGF内の遺伝子型情報の整列形態を示した図面である。 図2に図示されたステップ24及び25の詳細フローチャートである。 図9のステップ97で生成されたサービス使用履歴情報の一例を示した図面である。 図1に図示されたインデックス選定部でのインデックス選定形態を示した図面である。 図1に図示された保存部でのインデックス保存形態を示した図面である。 図2に図示されたステップ27の詳細フローチャートである。 図1に図示されたデータ比較部でのデータ比較の一例を示した図面である。 図1に図示されたデータ比較部でのデータ比較の他の例を示した図面である。
以下、図面を参照して本発明の実施形態を詳細に説明する。
図1は、本発明の一実施形態による個人ゲノム統合管理装置の構成図である。図1を参照すれば、本実施形態による個人ゲノム統合管理装置は、データ分析部11、統合データ生成部12、保存部13、サービス管理部14、インデックス選定部15、データ比較部16、PGF(個人ゲノムファイル(Personal Genome File))データベース17及びリンクデータベース18で構成される。また、前記のような構成要素を取捨選択して組み合わせることで、個人ゲノム比較装置や他の装置も容易に具現できるということを、当業者ならば理解できるであろう。
図2は、本発明の一実施形態による個人ゲノム統合管理方法のフローチャートである。図2を参照すれば、本実施形態による個人ゲノム統合管理方法は、図1に図示された個人ゲノム統合管理装置で時系列的に処理される次のようなステップで構成される。また、下記のステップを取捨選択して組み合わせることで、個人ゲノム比較方法、個人ゲノムサービス提供方法と他の方法も容易に具現できるということを、当業者ならば理解できるであろう。
ステップ21で、個人ゲノム統合管理装置は、ゲノム検出媒体10(例えばGenechip(登録商標))から、ある個人のゲノム情報を表すデータ(以下、“個人ゲノムデータ”という)を入力され、これを分析することによって個人ゲノムデータの特性情報と個人の遺伝子多型情報を獲得する。
ステップ22で、個人ゲノム統合管理装置は、ステップ21で獲得された特性情報に基づいて、PGFデータベース17に既に保存されている個人ゲノムデータとデータ分析部11に入力された個人ゲノムデータとを統合した統合データを生成する。
ステップ23で、個人ゲノム統合管理装置は、ステップ22で生成された統合データ(個人ゲノムファイル)、すなわち、バイナリー形態のPGFをPGFデータベース17に保存する。
ステップ24で、個人ゲノム統合管理装置は、この個人ゲノム統合管理装置が提供するサービスのうち、ユーザーにより選択された少なくとも一つのサービスを実行する。
ステップ25で、個人ゲノム統合管理装置は、ステップ24での実行結果に基づいてユーザーのサービス使用履歴情報を生成する。ステップ26で、個人ゲノム統合管理装置は、ステップ25で生成されたサービス使用履歴情報をリンクデータベース18に保存する。
ステップ27で、個人ゲノム統合管理装置は、リンクデータベース18に保存されたサービス使用履歴情報に基づいて、PGFデータベース17に保存された統合データ、すなわち、PGF内の遺伝子型情報それぞれのインデックスを選定する。
ステップ28で、個人ゲノム統合管理装置は、ステップ27で選定されたインデックスを、このインデックスそれぞれに該当する遺伝型情報、すなわち、SNP(Single Nucleotide Polymorphism)のIDとマッピングしてリンクデータベース18に保存する。
ステップ29で、個人ゲノム統合管理装置は、リンクデータベース18に保存されたリンクデータを参照して、PGFデータベース17に保存されたPGFのうち、サービス管理部14でのサービス実行に要求される個人ゲノムデータを含んでいるPGFを検索し、このように検索されたPGF内の個人ゲノムデータに対する比較作業を実行する。
ステップ30で、個人ゲノム統合管理装置は、ステップ28での比較作業の実行結果を利用してサービスの実行結果物を作成し、サービスの実行結果物をユーザー端末20に伝送する。
データ分析部11は、ゲノム記録媒体10からある個人のゲノム情報を表すデータ(以下、“個人ゲノムデータ”という)を入力され、これを分析することによって、個人ゲノムデータの特性情報と個人の遺伝子多型情報とを獲得する。個人ゲノムデータの特性情報は、個人ゲノムデータを生成したゲノム検出媒体10の製造社情報、ゲノム検出媒体10のバージョン情報、ゲノム検出媒体10が個人ゲノムデータを生成するのに使われたアルゴリズムのバージョン情報などを意味する。また、個人の遺伝子多型情報は、個人と個人間の遺伝情報が異なる部分に関する情報を意味し、その例として、SNP、CNV(Copy Number Variation)などを挙げることができる。
図3は、図2に図示されたステップ21の詳細フローチャートである。図3を参照すれば、図2に図示されたステップ21は、図1に図示されたデータ分析部11で時系列的に処理される次のようなステップで構成される。
ステップ31で、データ分析部11は、ゲノム検出媒体10から個人ゲノムデータを入力される。
ステップ32で、データ分析部11は、ステップ31で入力された個人ゲノムデータを構文解析(パージング(parsing))することによって、この個人ゲノムデータのヘッダから個人ゲノムデータの特性情報を抽出し、ヘッダ以外の部分から個人の遺伝子多型情報を抽出する。一般的に、ゲノム検出媒体10の製造社ごとに固有のデータ構造が定められているため、データ分析部11は、その構造に合う方式によって個人ゲノムデータの特性情報と個人の遺伝子多型情報を抽出する。
図4は、図1に図示されたデータ分析部11に入力される個人ゲノムデータの一例を示した図面である。図4を参照すれば、データ分析部11は、個人ゲノムデータをパージングすることで、この個人ゲノムデータのヘッダから個人ゲノムデータを生成したゲノム検出媒体10、すなわち、DNAチップの製造社はアフィメトリックス(Affymetrix)であり、このゲノム検出媒体10のバージョンはSNP 5.0であり、この個人ゲノムデータの生成に使われたアルゴリズムのバージョンは、brlmn−pであることを表す特性情報を獲得し、そのヘッダ以外の部分から個人の遺伝子多型情報、すなわち、SNP情報を抽出する。
ステップ33(図3)で、データ分析部11は、ステップ32で抽出された特性情報に基づいて、ステップ31で入力された個人ゲノムデータの統合管理が可能かどうかを決定する。さらに詳細に説明すれば、データ分析部11は、ステップ32で抽出された特性情報に基づいて、ステップ31で入力された個人ゲノムデータの統合管理の可能な個人ゲノムデータの特性情報が並んでいる個人ゲノムデータ特性目録に登録されているかどうかを確認することによって、個人ゲノムデータの統合管理が可能かどうかを決定する。その結果、ステップ32で抽出された特性情報が個人ゲノムデータ特性目録に登録されていれば、すなわち、ステップ31で入力された個人ゲノムデータの統合管理が可能ならば、ステップ34に進み、そうでなければ、ステップ35に進む。
特に、このような登録確認過程を効率的に行うために、個人ゲノムデータの特性情報に、これを代表する値を割り当ててもよい。この場合、個人ゲノムデータ特性目録には、個人ゲノムデータの特性情報の代わりに、これに割り当てられた代表値が記録され、ステップ33で、データ分析部11は、ステップ32で抽出された特性情報の代表値と、個人ゲノムデータ特性目録の代表値とを比較することによって、ステップ32で抽出された特性情報が個人ゲノムデータ特性目録に登録されているかどうかを確認することができる。すなわち、ステップ33で、データ分析部11は、ステップ32で抽出された特性情報の代表値が、個人ゲノムデータ特性目録の代表値のうちいずれか一つと一致すれば、ステップ32で抽出された特性情報が個人ゲノムデータ特性目録に登録されていると確認する。もし、ステップ33で、データ分析部11は、ステップ32で抽出された特性情報の代表値が個人ゲノムデータ特性目録の代表値のうちいずれか一つとも一致しなければ、ステップ32で抽出された特性情報が、個人ゲノムデータ特性目録に登録されていないと確認する。
ステップ34で、データ分析部11は、ステップ32で抽出された特性情報と遺伝子多型情報とを出力する。ステップ35で、データ分析部11は、ゲノム検出媒体10から入力された個人ゲノムデータの統合管理が不可能なことを表すエラーメッセージを出力する。このエラーメッセージには、ゲノム検出媒体10から入力された個人ゲノムデータの統合管理を可能にするために、個人ゲノムデータ特性目録を更新することを要請する内容が含まれていてもよい。
統合データ生成部12は、データ分析部11により獲得された特性情報に基づいて、PGFデータベース17に既に保存されている個人ゲノムデータと、データ分析部11に入力された個人ゲノムデータとを統合した統合データを生成する。このようなゲノムデータは、相異なるデータ構造を持つことができるが、本実施形態での統合データは、一つの統一されたデータ構造を持つバイナリー形態のPGFで具現される。複数のゲノムデータが相異なるデータ構造を持つということは、このゲノムデータそれぞれの特性情報を構成する要素、すなわち、個人ゲノムデータを生成したゲノム検出媒体10の製造社情報、ゲノム検出媒体10のバージョン情報、ゲノム検出媒体10が個人ゲノムデータを生成するのに使われたアルゴリズムのバージョン情報のうち、少なくとも一つが相異なることを意味する。例えば、ゲノム検出媒体10のバージョンによって、一人の個人がいろいろなバージョンのゲノムデータを持つことができるが、統合データ生成部12は、データ分析部11により獲得された特性情報に基づいて、PGFデータベース17に既に保存されている旧バージョンの個人ゲノムデータと、データ分析部11に入力された新バージョンの個人ゲノムデータとを統合した統合データを生成する。
このように、本実施形態は、個人ゲノムデータを生成したゲノム検出媒体10の製造社、ゲノム検出媒体10のバージョン、ゲノム検出媒体10が個人ゲノムデータを生成するのに使われたアルゴリズムのバージョンに従属されていない一つの統一された構造を持つPGFを提示することによって、ゲノム配列化技術、ゲノム検出媒体の発展によってその内容が変わりうる個人ゲノムデータを一貫して管理できる。また、同じ遺伝子型に対して、ゲノム検出媒体10の製造社、ゲノム検出媒体10のバージョン、アルゴリズムのバージョンがそれぞれ異なるいろいろな遺伝子型情報を保存する必要なく、本実施形態の構造による一つの遺伝子型情報のみを保存すればよいため、個人ゲノムデータの保存空間を縮小させることができる。
図5は、図1に図示された統合データ生成部12により生成されたPGFの一例を示した図面である。図5を参照すれば、PGFは、PGFに関する情報が記録されるヘッダと個人の遺伝子多型情報が記録される部分とで構成される。ヘッダは、PGFの構造を表すIDが記録されるフィールド(File format ID)、PGFヘッダのバージョンが記録されるフィールド(File header version)、PGFヘッダのサイズが記録されるフィールド(File header size)、PGFが作成された時間が記録されるフィールド(Timestamp(file creation)、PGFの最後に更新された時間が記録されるフィールド(Timestamp(last update)、遺伝子型エントリーの数が記録されるフィールド(Number of genotype entry) 、rs(reference snp)ナンバーを持つ遺伝子型の数が記録されるフィールド(Number of genotype with rs umber)、データが欠損する遺伝子型の数が記録されるフィールド(Number of genotype with missing data)、rsナンバーを持たない遺伝子型の数が記録されるフィールド(Number of genotype without rs umber)、ゲノム検出媒体10の情報が記録されるフィールド(Platform)、ゲノムデータを生成するのに使われたアルゴリズムのバージョンが記録されるフィールド(Version)で構成される。
一方、個人の遺伝子多型情報が記録される部分は、個人の遺伝子多型情報を構成する複数の遺伝子型(genotype)それぞれを表すIDが記録される複数のフィールドと、そのそれぞれのIDに対応する遺伝子型情報が記録される複数のフィールドとで構成される。特に、本実施形態では、いろいろなバージョンのゲノムデータを一つに統合させるために、図4に図示されたSNP ID(すなわち、rsナンバー)と、このIDに対応する遺伝子型情報を意味する遺伝子型コール(genotype call)とを、図5に図示された形態のSNP IDWA遺伝子型コールに変換する。例えば、図4に図示されたSNP ID“SNP_A−1780520”と遺伝子型コール“BB”とを、“PGF−0000001”と“BB”とに変換する。
図6は、図5に図示された遺伝子型情報のエンコーディング例を示した図面である。図5に示したように、SNPを利用した遺伝子型情報、すなわち、遺伝子型コールの種類はAA、AB、BBの3つであり、“No Call”は、いずれかの遺伝子型についての情報がゲノム検出媒体10により検出されていないことを表す。個人が父母から受け継いだ2種の対立形質のうち一つをAと表現すれば、他の一つをBと表現する。ある集団内で特定位置の対立形質を持つ人にはAA、AB、BBの3種があり、ゲノム検出媒体10のエラーに起因して遺伝情報獲得に失敗したことを表すNN(“No call”、これは遺伝子型が分からないことを意味する。)の一つが追加されて、総4種で表現できる。したがって、図6に示したように、SNPを利用した遺伝子型情報は、2ビットのデータにエンコーディングされうる。また、本実施形態が適用されるシステムの特性上、1バイト単位のエンコーディングが効率的な場合には、図6に示したように、SNPを利用した遺伝子型情報は、8ビットのデータにエンコーディングされうる。
図7は、図2に図示されたステップ22の詳細フローチャートである。図7を参照すれば、図2に図示されたステップ22は、図1に図示された統合データ生成部12で時系列的に処理される次のようなステップで構成される。
ステップ71で、統合データ生成部12は、データ分析部11により獲得された特性情報に基づいて、データ分析部11に入力された個人ゲノムデータに対応するPGFの存否を確認する。すなわち、このPGFがPGFデータベース17に保存されているかどうかを確認する。その結果、データ分析部11に入力された個人ゲノムデータに対応するPGFが存在すれば、ステップ73に進み、存在していなければ、ステップ72に進む。ここで、データ分析部11に入力された個人ゲノムデータに対応するPGFとは、ある個人の他のバージョンの個人ゲノムデータが記録されたPGFを意味する。
ステップ72で、統合データ生成部12は、データ分析部11に入力された個人ゲノムデータをPGFの形態に変換する。ステップ73で、統合データ生成部12は、データ分析部11に入力された個人ゲノムデータに対応するPGFを、PGFデータベース17からロードする。
ステップ74で、統合データ生成部12は、データ分析部11に入力された個人ゲノムデータの遺伝子多型情報を構成する複数の遺伝子型のうち、かかる情報が存在していなければ、すなわち、’’No Call’’であれば、ステップ75に進み、そうでなければ、ステップ76に進む。ステップ75で、統合データ生成部12は、所定の’’No Call’’処理規則を適用して’’No Call’’対象の遺伝子型を処理する。例えば、’’No Call’’対象の遺伝子型を’’No Call’’と表示してもよく、スキップしてもよい。
ステップ76で、統合データ生成部12は、データ分析部11に入力された新バージョンの個人ゲノムデータと、ステップ73でロードされたPGF内の旧バージョンの個人ゲノムデータとを比較する。その結果、個人ゲノムデータの遺伝子多型情報を構成する複数の遺伝子型のうち、旧バージョンのみに存在する遺伝子型については、ステップ77に進み、新バージョンのみに存在する遺伝子型については、ステップ78に進み、旧バージョン及び新バージョン両方に存在する遺伝子型については、ステップ79に進む。
ステップ77で、統合データ生成部12は、旧バージョンのみに存在する遺伝子型についての情報をPGF内に維持する。ステップ78で、統合データ生成部12は、新バージョンのみに存在する遺伝子型についての情報を、PGFの形態に変換してPGFに追加する。ステップ79で、統合データ生成部12は、旧バージョン及び新バージョン両方に存在する遺伝子型について、旧バージョンの遺伝子型情報と新バージョンの遺伝子型情報とを比較する。その結果、旧バージョンの遺伝子型情報と新バージョンの遺伝子型情報とが一致すれば、ステップ710に進み、一致しなければ、ステップ711に進む。
ステップ710で、統合データ生成部12は、旧バージョンと新バージョンとが一致する遺伝子型情報をPGF内に維持する。ステップ711で、統合データ生成部12は、所定の遺伝子型変換規則を適用して、旧バージョン及び新バージョン両方に存在する遺伝子型についての情報を決定する。本実施形態では、遺伝子型変換規則として、次のような3つの規則を提示する。ただし、この規則は一例に過ぎず、ユーザーが指定した特定規則など他の規則が適用されうる。第1の遺伝子型変換規則は、互いに一致しない遺伝子型情報を廃棄するものである。第2の遺伝子型変換規則は、ユーザーにその遺伝子型の原本データを要請することによって、所定の参照サンプルからその遺伝子型についての情報を再び獲得する。もし、元来の遺伝子型情報と新たに獲得された遺伝子型情報との検出率(call rate)と一致率とが一定レベル以上ならば、新たに獲得された遺伝子型情報を採択する。第3の遺伝子型変換規則は、旧バージョン及び新バージョン両方に存在する遺伝子型についての情報を欠損(missing)と見なしてデータ補完(imputation)するものである。これについては、’’Genet Epidemiol.2006 Dec;30(8):690−702’’に記載された論文“Imputation methods to improve inference in SNP association studies(by James Y.Dai,Ingo Ruczinski,Y Michael Leblanc,Charles Kooperberg)”に詳細に説明されている。
ステップ712で、統合データ生成部12は、データ分析部11に入力された個人ゲノムデータの遺伝子多型情報を構成する複数の遺伝子型全てについて、前記ステップ74からステップ711までの過程が完了した場合には、図2に図示されたステップ23に進み、完了していない場合には、ステップ74に戻る。前記ステップ74からステップ711までの過程は、データ分析部11に入力された個人ゲノムデータの遺伝子多型情報を構成する複数の遺伝子型それぞれに対して順次行われる。
保存部13は、統合データ生成部12により生成された統合データ、すなわち、バイナリー形態のPGFをPGFデータベース17に保存する。さらに詳細に説明すれば、保存部13は、統合データ生成部12により生成された統合データ、すなわち、PGF内の遺伝子型情報をこの遺伝子型情報のバージョンによって整列し、このように整列されたPGFをPGFデータベース17に保存する。
図8は、図5に図示されたPGF内の遺伝子型情報の整列形態を示した図面である。図8を参照すれば、保存部13は、PGF内の遺伝子型情報を遺伝子型情報のバージョンによって分類した後、同じバージョンの遺伝型情報が連続的に並ぶように遺伝子型情報を配置する。このように整列すれば、個人ゲノムデータ間の比較回数が最小化する。特に、個人ゲノムデータ間の特性情報が同じ場合、例えば、ゲノム検出媒体10のバージョンが同じ場合に、その比較回数は個人ゲノムデータの遺伝子多型情報を構成する複数の遺伝子型それぞれのIDの数であるnに近接する。すなわち、nは、遺伝子多型位置の数を意味する。ゲノム検出媒体10が総10万個のSNPを検出できるならば、nは10万になる。また、個人ゲノムデータ間の特性情報が同一でない場合には、最大比較回数はnxlg(n)を超えられない。このような比較回数の減少によって、個人ゲノムデータの管理が非常に効率的に行われうる。
サービス管理部14は、図1に図示された個人ゲノム統合管理装置が提供するサービスのうち、ユーザーにより選択された少なくとも一つのサービスを実行し、その実行結果に基づいてユーザーのサービス使用履歴情報を生成する。保存部13は、サービス管理部14により生成されたサービス使用履歴情報をリンクデータベース18に保存する。ここで、図1に図示された個人ゲノム統合管理装置が提供するサービスとは、個人のゲノム情報を利用して個人についての医療的分析を提供するサービスを意味する。これらのサービスの例としては、個人の血統(lineage)に関する分析サービス、個人の特定疾病感染危険(disease risk)に関する分析サービス、個人の特異的薬物反応(Personalized Drug)に関する分析サービス、個人のMHC(Major Histocompatibility Complex)に関する分析サービスなどを挙げることができる。特に、サービス管理部14は、保存部13、インデックス選定部15、データ比較部16などと連動してサービスを行い、サービスの実行結果物をユーザー端末20に伝送する。例えば、サービス管理部14は、データ比較部16から出力された個人ゲノムデータの比較分析結果を利用して、個人の医療的分析に関する報告書を作成し、これをユーザー端末20に伝送する。これにより、ユーザーは自分に関する医療的分析報告書を見ることができる。
図9は、図2に図示されたステップ24及び25の詳細フローチャートである。図9を参照すれば、図2に図示されたステップ24及び25は、図1に図示されたサービス管理部14で、時系列的に処理される次のようなステップで構成される。特に、以下では、クライアントに該当するユーザー端末20と、サーバーに該当する個人ゲノム統合管理装置との関係の側面で、図2に図示されたステップ24及び25を説明する。クライアントとサーバーとの通信は、有線ネットワーク、無線ネットワークまたはその他の通信媒体を通じて行われうる。ただし、以下で記述された過程は、一つの装置内でも行われうるということを、当業者ならば理解できるであろう。
ステップ91で、ユーザー端末20は、ユーザーのログイン情報を入力され、これを図1に図示された個人ゲノム統合管理装置に伝送する。ステップ92で、サービス管理部14は、ユーザー端末20から伝送されたログイン情報に基づいて、ユーザーについての認証を行う。その結果、ユーザー認証が成功すれば、ステップ93に進み、失敗すれば終了する。一般的に、ユーザー認証は、ユーザーアカウントと暗証番号とを確認することによって具現できる。個人ゲノムデータは個人の私的情報に該当するため、これらのユーザー認証が要求される。
ステップ93で、サービス管理部14は、ステップ92で認証されたユーザーに対して、図1に図示された個人ゲノム統合管理装置が提供する、サービスに対する接近権限を付与する。ステップ94で、サービス管理部14は、図1に図示された個人ゲノム統合管理装置が提供するサービスそれぞれを表すコンテンツを、サービス接近権限を付与されたユーザーの端末20に伝送する。ステップ95で、ユーザー端末20は、図1に図示された個人ゲノム統合管理装置から伝送されたサービスコンテンツを表示する。ステップ96で、ユーザー端末20は、前記表示されたコンテンツを認知したユーザーから、ステップ95で表示されたコンテンツのうち、少なくとも一つについての選択情報を入力され、これを、図1に図示された個人ゲノム統合管理装置に伝送する。ステップ97で、サービス管理部14は、ユーザー端末20から伝送された選択情報が表す少なくとも一つのコンテンツに該当するサービスを実行する。ステップ98で、サービス管理部14は、ステップ97でのサービス実行結果に基づいてユーザーのサービス使用履歴情報を生成する。
図10は、図9のステップ98で生成されたサービス使用履歴情報の一例を示した図面である。図10を参照すれば、サービス使用履歴情報は、リンクデータベース18に、ユーザーを表すユーザーアカウント及び暗証番号にマッピングされて保存される。サービス使用履歴情報は、図1に図示された個人ゲノム統合管理装置が提供するサービス別に区切られて保存され、いずれか一つのサービスの使用履歴情報には、このサービスの名称、ユーザーがこのサービスを利用するためにコンテンツ検索に使用した検索語の目録、このサービスについての説明、このサービスに関連したゲノムデータが記録される。ゲノムデータがPGFデータベース17とリンクデータベース18とに重なって保存されることを防止するために、このゲノムデータの代わりに、このゲノムデータがPGFデータベース17内に保存されている位置などを表すリンクが保存されてもよい。このように、リンクデータベース18には、PGFデータベース17に保存されたゲノムデータと関連(link)したデータが保存される。
インデックス選定部15は、リンクデータベース18に保存されたサービス使用履歴情報に基づいて、PGFデータベース17に保存された統合データ、すなわち、PGF内の遺伝子型情報それぞれのインデックスを選定する。さらに詳細に説明すれば、インデックス選定部15は、リンクデータベース18に保存されたサービス使用履歴情報から各遺伝型情報の検索回数をカウントして、遺伝型情報間の優先順位を定め、このような優先順位を表すインデックスを該当遺伝型情報に割り当てる。これらのインデックスは、PGFデータベース17に保存されたPGF内の遺伝子型情報全てに割り当てられる必要はなく、使用頻度の高い遺伝型情報のみに割り当てられてもよい。
図11は、図1に図示されたインデックス選定部15でのインデックス選定形態を示した図面である。図11を参照すれば、インデックス選定部15が各遺伝型情報の検索回数をカウントした結果、そのIDが’’PGF−00000001’’である遺伝型情報の優先順位が1位になったことが分かる。インデックス選定部15は、その優先順位が1位であることを表すインデックスを、’’PGF−00000001’’の遺伝型情報に割り当てる。
図12は、図1に図示された保存部13でのインデックス保存形態を示した図面である。図12を参照すれば、保存部13はインデックス選定部15により選定されたインデックスを、このインデックスそれぞれに該当する遺伝型情報、すなわち、SNP等のIDとマッピングしてリンクデータベース18に保存する。このようにして、使用頻度の高い遺伝型情報、すなわち、SNPに対する検索ないし比較回数を大幅減少させることができる。非常に使用頻度の高い遺伝型情報に対する検索ないし比較回数をさらに減少させるために、保存部13は、PGF内の遺伝型情報のうち、非常に使用頻度の高い遺伝型情報のIDとその遺伝型情報とを、サービス別に別途に集めたデータ構造体として保存してもよい。
データ比較部16は、リンクデータベース18に保存されたリンクデータを参照して、PGFデータベース17に保存されたPGFのうち、サービス管理部14でのサービス実行に要求される個人ゲノムデータを含んでいるPGFを検索し、このように検索されたPGF内の個人ゲノムデータに対する比較作業を実行する。これらの比較作業は、一つのPGF内の個人ゲノムデータと、PGFと同じ構造を持つ他のデータとを比較する作業である。例えば、一つのPGF内の個人ゲノムデータと、他のPGF内の個人ゲノムデータとを比較する作業でもあり、リンクデータベース18に保存された特定ファイル内のデータと、PGF内の個人ゲノムデータとを比較する作業でもありうる。リンクデータベース18に保存された特定ファイルとは、図1に図示された個人ゲノム統合管理装置が提供するサービスのタイプによって要求されるファイルである。例えば、そのサービスが、個人の特定疾病感染危険に関する分析サービスである場合、特定疾病に関する遺伝子型情報が記録されたファイルが要求される。これらのファイルは、図1に図示された個人ゲノム統合管理装置の内部に保存されていてもよく、外部から入力されてもよい。
特に、個人ゲノムデータの検索ないし比較を効率的に速かにするために、データ比較部16は、非常に使用頻度の高い遺伝型情報をサービス別に集めたデータ構造体に対して、サービス管理部14で実行中のサービスに関連した遺伝型情報のみを優先的に検索ないし比較する。もし、このデータ構造体で、サービス管理部14でのサービス実行に要求される個人ゲノムデータいずれも見つけられていない場合、データ比較部16は、リンクデータベース18に保存されたインデックスを参照して、その優先順位の高い順に、すなわち、その使用頻度の高い順にPGFデータベース17に保存されたPGF内の遺伝型情報を検索ないし比較する。もし、データ比較部16は、リンクデータベース18に保存されたインデックスで、サービス管理部14でのサービス実行に要求される個人ゲノムデータいずれも見つけられていない場合、PGFデータベース17に保存されたPGF内の遺伝型情報いずれも検索ないし比較する。
図13は、図2に図示されたステップ27の詳細フローチャートである。図13を参照すれば、図2に図示されたステップ27は、図1に図示されたデータ比較部16で時系列的に処理される次のようなステップで構成される。以下では、PGFデータベース17に保存されたPGFに対する検索ないし比較を中心に記述したが、前記のようなサービス別データ構造体に対しても同一に適用されうる。
ステップ131で、データ比較部16は、PGFデータベース17に保存されたPGFのうち、サービス管理部14でのサービス実行に要求される個人ゲノムデータを含んでいるPGFにアクセスする。ステップ132で、データ比較部16は、リンクデータベース18に保存されたリンクデータのうち、サービス管理部14で実行中のサービスの使用履歴情報、インデックスなどを参照して、ステップ131でアクセスしたPGF内の遺伝型情報を検索する。ステップ133で、データ比較部16は、ステップ132で検索された遺伝型情報を比較する。すなわち、ステップ133で、データ比較部16は、あるPGFの遺伝型情報とこれに対応する他のPGFの遺伝型情報とを比較することによって、この2つの遺伝型情報が互いに一致するかどうかを確認する。
ステップ134で、データ比較部16は、リンクデータベース18に保存されたリンクデータのうち、サービス管理部14で実行中のサービスと関連したファイル、例えば、個人の血統ファイルなどを参照して、サービス管理部14で実行中のサービスのタイプによってステップ133での比較結果を分析する。この過程は、サービス管理部14で行われてもよい。ステップ135で、データ比較部16は、サービス管理部14で実行中のサービスと関連した遺伝型情報全てに対して、前記のステップ132からステップ134までの過程が完了した場合には、ステップ136に進み、完了していない場合には、ステップ132に戻る。ステップ136で、データ比較部16は、ステップ134の分析結果をサービス管理部14に出力する。
図14は、図1に図示されたデータ比較部16でのデータ比較の一例を示した図面である。図14を参照すれば、データ比較部16は、いずれか一つのPGF内の遺伝子型情報と、他のPGF内の遺伝子型情報とを比較する。その結果、遺伝子型情報のIDが“PGF−00000003”である遺伝子型情報と、“PGF−00000005”である遺伝子型情報とが互いに一致しないことを見つけた。この結果は、サービスのタイプによって再加工されて、サービス実行結果物が生成されうる。例えば、この比較結果を利用して、個人間の血統関係などを確認する報告書などが作成されうる。
図15は、図1に図示されたデータ比較部16でのデータ比較の他の例を示した図面である。図15を参照すれば、データ比較部16は、リンクデータベース18に保存されたファイルが表す特定疾病に関する遺伝子型情報と、ある個人のPGF内の遺伝子型情報とを比較する。すなわち、データ比較部16は、老齢による視力減退に関する遺伝子型情報と、ある個人の遺伝子型情報とを比較することによって、この個人の視力減退危険度を予測できる。この結果は、サービスのタイプによって再加工されてサービス実行結果物が生成されうる。
一方、前述した本発明の実施形態は、コンピュータに実行できるプログラムで作成可能であり、コンピュータで読み取り可能な記録媒体を利用して、前記プログラムを動作させる汎用ディジタルコンピューターで具現できる。また、前述した本発明の実施形態で使われたデータの構造は、コンピュータで読み取り可能な記録媒体にいろいろな手段を通じて記録できる。前記コンピュータで読み取り可能な記録媒体は、マグネチック記録媒体(例えば、ROM、フロッピーディスク、ハードディスクなど)、光学的判読媒体(例えば、CD−ROM、DVDなど)などの記録媒体を含む。
これまで本発明についてその望ましい実施形態を中心に説明した。当業者ならば、本発明が本発明の本質的な特性から逸脱しない範囲で変形された形態に具現できるということを理解できるであろう。したがって、開示された実施形態は限定的な観点ではなく説明的な観点で考慮されねばならない。本発明の範囲は前述した説明ではなく特許請求の範囲に表れており、それと同等な範囲内にあるあらゆる差異点は本発明に含まれていると解釈されねばならない。
本発明は、個人のゲノム情報を表すデータを管理する装置に適用できる。
10 ゲノム検出媒体、
11 データ分析部、
12 統合データ生成部、
13 保存部、
14 サービス管理部、
15 インデックス選定部、
16 データ比較部、
17 PGFデータベース、
18 リンクデータベース、
20 ユーザー端末。

Claims (20)

  1. ある個人のゲノム情報を表す第1データを分析することによって、前記第1データの特性情報を獲得するステップと、
    前記個人のゲノム情報を表す第2データの存否を決定するステップと、
    前記獲得された特性情報に基づいて、前記第1データと前記個人のゲノム情報を表す第2データとを統合したデータを生成するステップと、を含むことを特徴とする個人ゲノム統合管理方法。
  2. 前記第1データと前記第2データとは相異なるデータ構造を持ち、前記統合データは、一つの統一されたデータ構造を持つことを特徴とする請求項1に記載の個人ゲノム統合管理方法。
  3. 前記相異なるデータ構造は、前記第1データと前記第2データそれぞれの特性情報を構成する要素のうち、少なくとも一つが相異なることを含むことを特徴とする請求項2に記載の個人ゲノム統合管理方法。
  4. 前記特性情報は、前記第1データを生成したゲノム測定装備の製造社情報、前記ゲノム測定装備のバージョン情報、及び前記ゲノム測定装備が前記第1データを生成するのに使われたアルゴリズムのバージョン情報のうち、少なくとも一つを含むことを特徴とする請求項1に記載の個人ゲノム統合管理方法。
  5. 前記生成するステップは、
    前記第1データと前記第2データとを比較するステップと、
    前記比較結果によって、前記第1データに存在する遺伝子型情報を前記統合データの形態に変換するか、前記第2データに存在する遺伝子型情報を前記統合データ内に維持するステップと、を含むことを特徴とする請求項1に記載の個人ゲノム統合管理方法。
  6. 前記生成するステップは、
    前記比較結果によって、前記第1データ及び前記第2データ両方に存在する遺伝子型に対して、前記第1データの遺伝子型情報と前記第2データの遺伝子型との一致如何によって前記遺伝子型の情報を決定するステップをさらに含むことを特徴とする請求項5に記載の個人ゲノム統合管理方法。
  7. 前記獲得するステップは、
    前記第1データをパージングすることで前記特性情報を抽出するステップと、
    前記抽出された特性情報に基づいて、前記第1データの統合管理が可能かどうかを決定するステップと、
    前記決定結果によって選択的に前記特性情報を出力するステップと、を含むことを特徴とする請求項1に記載の個人ゲノム統合管理方法。
  8. ある個人のゲノム情報を表す第1データを分析することによって、前記第1データの特性情報を獲得するステップと、
    前記個人のゲノム情報を表す第2データの存否を決定するステップと、
    前記獲得された特性情報に基づいて、前記第1データと前記個人のゲノム情報を表す第2データとを統合したデータを生成するステップと、をコンピュータに実行させるための個人ゲノム統合管理プログラムを記録したコンピュータで読み取り可能な記録媒体。
  9. ある個人のゲノム情報を表す第1データを分析することによって、前記第1データの特性情報を獲得する分析部と、
    前記分析部により獲得された特性情報に基づいて、前記第1データと前記個人のゲノム情報を表す第2データとを統合したデータを生成する生成部と、を備えることを特徴とする個人ゲノム統合管理装置。
  10. ある個人のゲノム情報を表す第1データを分析することによって前記第1データの特性情報を獲得するステップと、
    前記分析部により獲得された特性情報に基づいて、前記第1データと前記個人のゲノム情報を表す第2データとを統合したデータを生成するステップと、
    前記統合データと、前記統合データと同じ構造を持つ他のデータとを比較するステップと、を含むことを特徴とする個人ゲノム比較方法。
  11. 前記第1データと前記第2データとは相異なるデータ構造を持ち、前記統合データは一つの統一されたデータ構造を持つことを特徴とする請求項10に記載の個人ゲノム比較方法。
  12. 前記統合データ内の遺伝子型情報の使用頻度に基づいて、前記統合データ内の遺伝子型情報それぞれのインデックスを選定するステップをさらに含み、
    前記比較するステップは、前記インデックスを参照して前記統合データ内の遺伝子型情報と前記他の統合データ内の遺伝子型情報とを比較することを特徴とする請求項11に記載の個人ゲノム比較方法。
  13. 前記統合データを利用して、前記個人についての医療的分析を提供するサービスのうち、ユーザーにより選択された少なくとも一つのサービスを実行するステップと、
    前記サービス実行結果に基づいて、前記ユーザーのサービス使用履歴情報を生成するステップと、をさらに含み、
    前記選定するステップは、前記サービス使用履歴情報に基づいて前記統合データ内の遺伝子型情報それぞれのインデックスを選定することを特徴とする請求項12に記載の個人ゲノム比較方法。
  14. 前記統合データ内の遺伝型情報の使用頻度に基づいて、前記遺伝型情報のうち一部を別途に保存するステップをさらに含み、
    前記比較するステップは、前記別途に保存された遺伝型情報について、優先的に前記他の統合データ内の遺伝子型情報と比較することを特徴とする請求項10に記載の個人ゲノム比較方法。
  15. ある個人のゲノム情報を表す第1データを分析することによって、前記第1データの特性情報を獲得するステップと、
    前記分析部により獲得された特性情報に基づいて、前記第1データと前記個人のゲノム情報を表す第2データとを統合したデータを生成するステップと、
    前記統合データと、前記統合データと同じ構造を持つ他のデータとを比較するステップと、をコンピュータに実行させるための個人ゲノム比較プログラムを記録したコンピュータで読み取り可能な記録媒体。
  16. ある個人のゲノム情報を表す第1データを分析することによって、前記第1データの特性情報を獲得する分析部と、
    前記分析部により獲得された特性情報に基づいて、前記第1データと前記個人のゲノム情報を表す第2データとを統合したデータを生成する生成部と、
    前記統合データと、前記統合データと同じ構造を持つ他のデータとを比較する比較部と、を備えることを特徴とする個人ゲノム比較装置。
  17. 個人のゲノム情報を利用して、前記個人についての医療的分析を提供するサービスそれぞれを表すコンテンツをユーザー端末に伝送するステップと、
    前記ユーザー端末から、前記サービスのコンテンツのうち、少なくとも一つについての選択情報を受信するステップと、
    前記個人のゲノム情報を表す第1データと、前記個人のゲノム情報を表す第2データとが統合されたデータを利用して、前記受信された選択情報が表すサービスを実行するステップと、
    前記サービス実行の結果物を前記ユーザー端末に伝送するステップと、を含むことを特徴とする個人ゲノムサービス提供方法。
  18. 前記サービス実行の結果に基づいて、ユーザーのサービス使用履歴情報を生成するステップをさらに含むことを特徴とする請求項17に記載の個人ゲノムサービス提供方法。
  19. ユーザー端末から伝送されたログイン情報に基づいて、ユーザーに対する認証を実行するステップと、
    前記認証実行結果によって、選択的にサービスに対する接近権限を付与するステップと、をさらに含み、
    前記コンテンツを伝送するステップは、前記サービスそれぞれを表すコンテンツを、前記サービス接近権限を付与されたユーザーに対してユーザー端末に伝送することを特徴とする請求項17に記載の個人ゲノムサービス提供方法。
  20. 個人のゲノム情報を利用して、前記個人についての医療的分析を提供するサービスそれぞれを表すコンテンツをユーザー端末に伝送するステップと、
    前記ユーザー端末から、前記サービスのコンテンツのうち、少なくとも一つについての選択情報を受信するステップと、
    前記個人のゲノム情報を表す第1データと、前記個人のゲノム情報を表す第2データとが統合されたデータを利用して、前記受信された選択情報が表すサービスを実行するステップと、
    前記サービス実行の結果物を前記ユーザー端末に伝送するステップと、をコンピュータに実行させるための個人ゲノムサービス提供プログラムを記録したコンピュータで読み取り可能な記録媒体。
JP2009293065A 2008-12-30 2009-12-24 個人ゲノム統合管理方法及び装置 Expired - Fee Related JP5687834B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020080137164A KR101025848B1 (ko) 2008-12-30 2008-12-30 개인 유전체 통합 관리 방법 및 장치
KR10-2008-0137164 2008-12-30

Publications (2)

Publication Number Publication Date
JP2010157231A true JP2010157231A (ja) 2010-07-15
JP5687834B2 JP5687834B2 (ja) 2015-03-25

Family

ID=42285995

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009293065A Expired - Fee Related JP5687834B2 (ja) 2008-12-30 2009-12-24 個人ゲノム統合管理方法及び装置

Country Status (4)

Country Link
US (1) US20100169107A1 (ja)
JP (1) JP5687834B2 (ja)
KR (1) KR101025848B1 (ja)
CN (1) CN101770546A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015502588A (ja) * 2011-10-17 2015-01-22 インタートラスト テクノロジーズ コーポレイション ゲノム及び他の情報を保護及び管理するシステム及び方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012031029A2 (en) 2010-08-31 2012-03-08 Lawrence Ganeshalingam Method and systems for processing polymeric sequence data and related information
CN102546334B (zh) * 2010-12-31 2014-06-18 上海欣能信息科技发展有限公司 一种基于企业服务总线的数据资源唯一性合并处理方法
US20120236861A1 (en) 2011-03-09 2012-09-20 Annai Systems, Inc. Biological data networks and methods therefor
EP2864896A4 (en) 2012-06-22 2016-07-20 Dan Maltbie SYSTEM AND METHOD FOR THE SAFE HIGH-SPEED TRANSMISSION OF HUGE FILES
US20140143188A1 (en) * 2012-11-16 2014-05-22 Genformatic, Llc Method of machine learning, employing bayesian latent class inference: combining multiple genomic feature detection algorithms to produce an integrated genomic feature set with specificity, sensitivity and accuracy
CN104699998A (zh) 2013-12-06 2015-06-10 国际商业机器公司 用于对基因组进行压缩和解压缩的方法和装置
CN107391964A (zh) * 2017-07-24 2017-11-24 扬州医联生物科技有限公司 一种与临床信息相结合的基因序列数据管理方法
US11030324B2 (en) * 2017-11-30 2021-06-08 Koninklijke Philips N.V. Proactive resistance to re-identification of genomic data

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001125959A (ja) * 1999-10-25 2001-05-11 Industrial Bank Of Japan Ltd 電子取引システムおよび電子取引方法
JP2002108903A (ja) * 2000-09-29 2002-04-12 Toshiba Corp データ収集システムおよびデータ収集方法およびプログラムを記録した媒体およびプログラム製品
JP2004005319A (ja) * 2002-04-24 2004-01-08 Japan Science & Technology Corp 遺伝子データベース作成方法、遺伝子データベース作成装置、遺伝子データベース作成プログラム、および遺伝子データベース作成プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004288095A (ja) * 2003-03-25 2004-10-14 Ntt Data Corp オンデマンドタイピング管理装置、オンデマンドタイピング管理方法、および、プログラム
WO2004109551A1 (ja) * 2003-06-05 2004-12-16 Hitachi High-Technologies Corporation 塩基配列関連情報を用いた情報提供システム及びプログラム
US20050074795A1 (en) * 2003-10-06 2005-04-07 Hoffman Mark A. Computerized method and system for automated correlation of genetic test results
JP2005100389A (ja) * 1997-07-25 2005-04-14 Affymetrix Inc 多型性データベースを提供するためのシステム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0793370A (ja) * 1993-09-27 1995-04-07 Hitachi Device Eng Co Ltd 遺伝子データベース検索システム
US7251642B1 (en) * 2001-08-06 2007-07-31 Gene Logic Inc. Analysis engine and work space manager for use with gene expression data
JP2004086568A (ja) * 2002-08-27 2004-03-18 Hitachi Ltd 新規遺伝子の作製方法及びプログラム
WO2005024648A1 (en) * 2003-09-05 2005-03-17 Agency For Science, Technology And Research Methods of processing biological data
US20070178501A1 (en) * 2005-12-06 2007-08-02 Matthew Rabinowitz System and method for integrating and validating genotypic, phenotypic and medical information into a database according to a standardized ontology
KR20080013484A (ko) * 2006-08-09 2008-02-13 에스케이 텔레콤주식회사 디엔에이 분석이 가능한 이동통신 단말기 및 그 단말기를이용한 디엔에이 응용 서비스 시스템 및 그 방법

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005100389A (ja) * 1997-07-25 2005-04-14 Affymetrix Inc 多型性データベースを提供するためのシステム
JP2001125959A (ja) * 1999-10-25 2001-05-11 Industrial Bank Of Japan Ltd 電子取引システムおよび電子取引方法
JP2002108903A (ja) * 2000-09-29 2002-04-12 Toshiba Corp データ収集システムおよびデータ収集方法およびプログラムを記録した媒体およびプログラム製品
JP2004005319A (ja) * 2002-04-24 2004-01-08 Japan Science & Technology Corp 遺伝子データベース作成方法、遺伝子データベース作成装置、遺伝子データベース作成プログラム、および遺伝子データベース作成プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004288095A (ja) * 2003-03-25 2004-10-14 Ntt Data Corp オンデマンドタイピング管理装置、オンデマンドタイピング管理方法、および、プログラム
WO2004109551A1 (ja) * 2003-06-05 2004-12-16 Hitachi High-Technologies Corporation 塩基配列関連情報を用いた情報提供システム及びプログラム
US20050074795A1 (en) * 2003-10-06 2005-04-07 Hoffman Mark A. Computerized method and system for automated correlation of genetic test results

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015502588A (ja) * 2011-10-17 2015-01-22 インタートラスト テクノロジーズ コーポレイション ゲノム及び他の情報を保護及び管理するシステム及び方法
US10621550B2 (en) 2011-10-17 2020-04-14 Intertrust Technologies Corporation Systems and methods for protecting and governing genomic and other information
US11481729B2 (en) 2011-10-17 2022-10-25 Intertrust Technologies Corporation Systems and methods for protecting and governing genomic and other information

Also Published As

Publication number Publication date
KR101025848B1 (ko) 2011-03-30
US20100169107A1 (en) 2010-07-01
JP5687834B2 (ja) 2015-03-25
CN101770546A (zh) 2010-07-07
KR20100078803A (ko) 2010-07-08

Similar Documents

Publication Publication Date Title
JP5687834B2 (ja) 個人ゲノム統合管理方法及び装置
Chin et al. A diploid assembly-based benchmark for variants in the major histocompatibility complex
US20190198135A1 (en) Systems and methods for genomic variant annotation
Wu et al. Prediction of deleterious nonsynonymous single‐nucleotide polymorphism for human diseases
Schaafsma et al. V ari SNP, a benchmark database for variations from db SNP
AU2018304109B2 (en) Genomic services platform supporting multiple application providers
US20190206512A1 (en) Genomic services platform supporting multiple application providers
Hakenberg et al. Integrating 400 million variants from 80,000 human samples with extensive annotations: towards a knowledge base to analyze disease cohorts
CA3070585C (en) Genomic services platform supporting multiple application providers
US20210074379A1 (en) Methods for detecting variants in next-generation sequencing genomic data
US20170076047A1 (en) Systems and methods for genetic testing
Lebo et al. Bioinformatics in clinical genomic sequencing
US20200104285A1 (en) Signature-hash for multi-sequence files
Jobin et al. IMPUTOR: phylogenetically aware software for imputation of errors in next-generation sequencing
WO2020259847A1 (en) A computer implemented method for privacy preserving storage of raw genome data
AU2018303577A1 (en) Genomic services platform supporting multiple application providers
WO2017085459A1 (en) A method for matching with known variants in a database
Dilthey et al. High-accuracy HLA type inference from whole-genome sequencing data
Chu et al. ntsm: an alignment-free, ultra-low-coverage, sequencing technology agnostic, intraspecies sample comparison tool for sample swap detection
WO2017085458A1 (en) A method for determining an alignment of segments of a genome
Regier A flexible comparative genomics framework for integrating heterogeneous sequence data
JP2004046696A (ja) 塩基配列関連情報を用いた情報処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121102

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131029

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140128

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140226

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141016

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20141024

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150123

R150 Certificate of patent or registration of utility model

Ref document number: 5687834

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees