JP2021510435A - 生ゲノムデータに基づく構成可能テキスト文字列の生成 - Google Patents
生ゲノムデータに基づく構成可能テキスト文字列の生成 Download PDFInfo
- Publication number
- JP2021510435A JP2021510435A JP2020537765A JP2020537765A JP2021510435A JP 2021510435 A JP2021510435 A JP 2021510435A JP 2020537765 A JP2020537765 A JP 2020537765A JP 2020537765 A JP2020537765 A JP 2020537765A JP 2021510435 A JP2021510435 A JP 2021510435A
- Authority
- JP
- Japan
- Prior art keywords
- text
- gene
- configurable
- group
- sequencer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B10/00—ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Data Mining & Analysis (AREA)
- Animal Behavior & Ethology (AREA)
- Physiology (AREA)
- User Interface Of Digital Computer (AREA)
- Information Transfer Between Computers (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本出願は、参照により本明細書に全体が組み込まれている、2018年1月10に出願された米国仮特許出願第62/615,743号の優先権を主張する。
本解決策の特定の実施形態について述べる前に、本明細書に記載の方法およびシステムに関連する動作環境および関連システム部品(例えば、ハードウェア要素)の態様を説明することが有用であり得る。図1Aを参照すると、ネットワーク環境の実施形態が示される。簡単に言うと、ネットワーク環境は、1つまたは複数のネットワーク104を介して1つまたは複数のサーバ106a〜106n(一般に、サーバ106、ノード106、またはリモートマシン106とも呼ばれる)と通信する、1つまたは複数のクライアント102a〜102n(一般に、ローカルマシン102、クライアント102、クライアントノード102、クライアントマシン102、クライアントコンピュータ102、クライアントデバイス102、エンドポイント102、またはエンドポイントノード102とも呼ばれる)を含む。一部の実施形態において、クライアント102は、サーバによって提供されるリソースへのアクセスを求めるクライアントノードと、他のクライアント102a〜102nにホストリソースへのアクセスを与えるサーバとの両方として機能する能力を有する。
図2は、図1Cに示すゲノムデータ翻訳システム120と同様のゲノムデータ翻訳システム200を示す。以下で説明するように、ゲノムデータ翻訳システム200は、(例えば、スプレッドシートまたはコンマ区切りのテキストファイルの)生ゲノムデータを受信し、生ゲノムデータにおいて特定された遺伝子および染色体レベルの異常を示すデータを生成することができる。ゲノムデータ翻訳システム200は、翻訳エンジン202、グラフィカルユーザインターフェース(GUI)エンジン204、およびデータストレージ218を含む。データストレージ218は、遺伝子リスト206、翻訳規則208、再構成可能テキストストレージ210、およびヒト参照ゲノムリスト212を格納することができる。GUIエンジン204は、モニタまたは他のディスプレイデバイスに表示するGUIを提供することができる。GUIエンジン204は、キーボード、マウス、タッチスクリーン、ジェスチャ検出器、または他の入力デバイスなどの1つまたは複数の入力デバイスから、ユーザ入力を受けることもできる。GUIエンジン204は、ユーザがゲノムデータ翻訳システム200の動作を制御するために入力できるようにする対話型インターフェースを提供することができる。ゲノムデータ翻訳システム200を、1つまたは複数の有線または無線ネットワーク、例えば、イーサネット、インターネット、WiFiネットワーク、ブルートゥース(登録商標)ネットワークなどを含み得るコンピュータネットワーク214に接続することもできる。ゲノムデータ翻訳システム200を、図1A〜1Dに関して前述したコンピューティングシステムを使用して実施することができる。
Claims (20)
- 次世代配列決定情報を処理するシステムであって、
1つまたは複数のプロセッサと、
命令を含む1つまたは複数のメモリ素子とを備え、前記命令が、実行されると、前記1つまたは複数のプロセッサに、
次世代シーケンサによって生成された出力ファイルを、ユーザインターフェースを介して受信させ、
前記出力ファイル内の、染色体数、サイトバンド情報、ヌクレオチド範囲、およびコピー数群を含む少なくとも1つのセグメントを判定させ、
ヒト参照ゲノムリストに含まれる、前記ヌクレオチド範囲内の第1の遺伝子群を判定させ、
前記第1の遺伝子群のサブセットに一致する遺伝子リストに現れる少なくとも1つの遺伝子を含む一致遺伝子群を判定させ、
構成不能テキスト領域、第1の構成可能テキスト領域、第2の構成可能テキスト領域、および第3の構成可能テキスト領域を含む構成可能テキスト文字列を生成させ、
前記染色体数に基づく前記第1の構成可能テキスト領域の第1のテキスト、前記コピー数群に基づく前記第2の構成可能テキスト領域の第2のテキスト、および前記一致遺伝子群に基づく前記第3の構成可能テキスト領域の第3のテキストを含ませ、
前記構成可能テキスト文字列を出力インターフェースに提供させる、システム。 - 前記次世代シーケンサが、Illuminaシーケンサ、Ion Torrentシーケンサ、または454パイロシーケンサのうちの少なくとも1つを含む、請求項1に記載のシステム。
- 前記1つまたは複数のメモリ素子が命令を含み、前記命令が、実行されると、前記1つまたは複数のプロセッサに、
前記少なくとも1つのセグメントの開始位置および終了位置を判定させ、前記開始位置が前記染色体数を含み、前記終了位置が前記コピー数群を示す、請求項1に記載のシステム。 - 前記少なくとも1つのセグメントが、前記染色体数によって特定された染色体の短腕(p)、長腕(q)、または短腕および長腕の組合せのうちの少なくとも1つに対応する、請求項3に記載のシステム。
- 前記1つまたは複数のメモリ素子が命令を含み、前記命令が、実行されると、前記1つまたは複数のプロセッサに、
前記コピー数群に基づく前記第2の構成可能テキスト領域の前記第2のテキストと、メモリに格納された遺伝子喪失−獲得規則とを含ませ、前記コピー数群が2より小さい数を含むときに、前記遺伝子喪失−獲得規則が前記第2のテキストを「喪失」と規定する、請求項1に記載のシステム。 - 前記ヒト参照ゲノムリストが、GRCh38、GRCh37、NCBIビルド36.1、NCBIビルド35、NCBIビルド34、hg38、hg19、hg18、hg17、およびhg16のうちの少なくとも1つを含む、請求項1に記載のシステム。
- 前記遺伝子リストが少なくとも1つのがん関連遺伝子を含む、請求項1に記載のシステム。
- 次世代配列決定情報を処理する方法であって、
1つまたは複数のプロセッサにおいて、次世代シーケンサによって生成された出力ファイルを、ユーザインターフェースを介して受信するステップと、
前記1つまたは複数のプロセッサにおいて、前記出力ファイル内の、染色体数、サイトバンド情報、ヌクレオチド範囲、およびコピー数群を含む少なくとも1つのセグメントを判定するステップと、
前記1つまたは複数のプロセッサにおいて、ヒト参照ゲノムリストに含まれる、前記ヌクレオチド範囲内の第1の遺伝子群を判定するステップと、
前記1つまたは複数のプロセッサにおいて、前記第1の遺伝子群のサブセットに一致する遺伝子リストに現れる少なくとも1つの遺伝子を含む一致遺伝子群を判定するステップと、
前記1つまたは複数のプロセッサにおいて、構成不能テキスト領域、第1の構成可能テキスト領域、第2の構成可能テキスト領域、および第3の構成可能テキスト領域を含む構成可能テキスト文字列を生成するステップと、
前記染色体数に基づく前記第1の構成可能テキスト領域の第1のテキスト、前記コピー数群に基づく前記第2の構成可能テキスト領域の第2のテキスト、および前記一致遺伝子群に基づく前記第3の構成可能テキスト領域の第3のテキストを含むステップと、
前記1つまたは複数のプロセッサによって、前記構成可能テキスト文字列を出力インターフェースに提供するステップとを含む方法。 - 前記次世代シーケンサが、Illuminaシーケンサ、Ion Torrentシーケンサ、または454パイロシーケンサのうちの少なくとも1つを含む、請求項8に記載の方法。
- 前記1つまたは複数のプロセッサにおいて、前記少なくとも1つのセグメントの開始位置および終了位置を判定するステップをさらに含み、前記開始位置が前記染色体数を含み、前記終了位置が前記コピー数群を示す、請求項8に記載の方法。
- 前記少なくとも1つのセグメントが、前記染色体数によって特定された染色体の短腕(p)、長腕(q)、または短腕および長腕の組合せのうちの少なくとも1つに対応する、請求項10に記載の方法。
- 前記コピー数群に基づく前記第2の構成可能テキスト領域の前記第2のテキストと、メモリに格納された遺伝子喪失−獲得規則とを含むステップをさらに含み、前記コピー数群が2より小さい数を含むときに、前記遺伝子喪失−獲得規則が前記第2のテキストを「喪失」と規定する、請求項8に記載の方法。
- 前記ヒト参照ゲノムリストが、GRCh38、GRCh37、NCBIビルド36.1、NCBIビルド35、NCBIビルド34、hg38、hg19、hg18、hg17、およびhg16のうちの少なくとも1つを含む、請求項8に記載の方法。
- 前記遺伝子リストが少なくとも1つのがん関連遺伝子を含む、請求項8に記載の方法。
- プロセッサが実行可能な命令を格納するコンピュータ可読記憶媒体であって、
前記命令が、少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに、
次世代シーケンサによって生成された出力ファイルを、ユーザインターフェースを介して受信させ、
前記出力ファイル内の、染色体数、サイトバンド情報、ヌクレオチド範囲、およびコピー数群を含む少なくとも1つのセグメントを判定させ、
ヒト参照ゲノムリストに含まれる、前記ヌクレオチド範囲内の第1の遺伝子群を判定させ、
前記第1の遺伝子群のサブセットに一致する遺伝子リストに現れる少なくとも1つの遺伝子を含む一致遺伝子群を判定させ、
構成不能テキスト領域、第1の構成可能テキスト領域、第2の構成可能テキスト領域、および第3の構成可能テキスト領域を含む構成可能テキスト文字列を生成させ、
前記染色体数に基づく前記第1の構成可能テキスト領域の第1のテキスト、前記コピー数群に基づく前記第2の構成可能テキスト領域の第2のテキスト、および前記一致遺伝子群に基づく前記第3の構成可能テキスト領域の第3のテキストを含ませ、
前記構成可能テキスト文字列を出力インターフェースに提供させる、コンピュータ可読記憶媒体。 - 前記次世代シーケンサが、Illuminaシーケンサ、Ion Torrentシーケンサ、または454パイロシーケンサのうちの少なくとも1つを含む、請求項15に記載のコンピュータ可読記憶媒体。
- 命令をさらに含み、前記命令が、少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに、
前記少なくとも1つのセグメントの開始位置および終了位置を判定させ、前記開始位置が前記染色体数を含み、前記終了位置が前記コピー数群を示す、請求項15に記載のコンピュータ可読記憶媒体。 - 前記少なくとも1つのセグメントが、前記染色体数によって特定された染色体の短腕(p)、長腕(q)、または短腕および長腕の組合せのうちの少なくとも1つに対応する、請求項15に記載のコンピュータ可読記憶媒体。
- 命令をさらに含み、前記命令が、少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに、
前記コピー数群に基づく前記第2の構成可能テキスト領域の前記第2のテキストと、メモリに格納された遺伝子喪失−獲得規則とを含ませ、前記コピー数群が2より小さい数を含むときに、前記遺伝子喪失−獲得規則が前記第2のテキストを「喪失」と規定する、請求項15に記載のコンピュータ可読記憶媒体。 - 前記ヒト参照ゲノムリストが、GRCh38、GRCh37、NCBIビルド36.1、NCBIビルド35、NCBIビルド34、hg38、hg19、hg18、hg17、およびhg16のうちの少なくとも1つを含む、請求項15に記載のコンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862615743P | 2018-01-10 | 2018-01-10 | |
US62/615,743 | 2018-01-10 | ||
PCT/US2019/012913 WO2019139994A1 (en) | 2018-01-10 | 2019-01-09 | Generating configurable text strings based on raw genomic data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021510435A true JP2021510435A (ja) | 2021-04-22 |
JP7074861B2 JP7074861B2 (ja) | 2022-05-24 |
Family
ID=67218744
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020537765A Active JP7074861B2 (ja) | 2018-01-10 | 2019-01-09 | 生ゲノムデータに基づく構成可能テキスト文字列の生成 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11264119B2 (ja) |
EP (1) | EP3738123A4 (ja) |
JP (1) | JP7074861B2 (ja) |
CN (1) | CN111566741B (ja) |
CA (1) | CA3088012A1 (ja) |
WO (1) | WO2019139994A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006114037A (ja) * | 2004-10-12 | 2006-04-27 | Agilent Technol Inc | 比較ゲノムハイブリダイゼーション(cgh)データの見かけ上の異常を統計的に分析しプロットするためのシステムおよび方法 |
JP2014529109A (ja) * | 2011-06-06 | 2014-10-30 | コーニンクレッカ フィリップス エヌ ヴェ | 核酸配列データのアセンブリに関する方法 |
JP2016516237A (ja) * | 2013-03-15 | 2016-06-02 | バセトラ メディカル テクノロジー カンパニー リミテッド | 疾患関連ヒトゲノム変異体の解析とレポート作成のシステムと方法 |
US9798855B2 (en) * | 2010-01-07 | 2017-10-24 | Affymetrix, Inc. | Differential filtering of genetic data |
WO2017220508A1 (en) * | 2016-06-22 | 2017-12-28 | Sophia Genetics S.A. | Methods for processing next-generation sequencing genomic data |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6005566A (en) * | 1994-05-19 | 1999-12-21 | Apple Computer, Inc. | Aspect and style elements of an improved graphical user interface |
EP2912587A4 (en) * | 2012-10-24 | 2016-12-07 | Complete Genomics Inc | GENOME EXPLORATION SYSTEM FOR TREATING AND PRESENTING NUCLEOTIDE VARIATIONS IN GENOMIC SEQUENCE DATA |
SG10202009015SA (en) | 2012-12-10 | 2020-10-29 | Resolution Bioscience Inc | Methods for targeted genomic analysis |
US9734284B2 (en) | 2013-03-15 | 2017-08-15 | Micron Technology, Inc. | Hardware acceleration of short read mapping for genomic and other types of analyses |
CA2961563C (en) * | 2014-09-17 | 2023-04-04 | Battelle Memorial Institute | Methods of analyzing massively parallel sequencing data |
US10734117B2 (en) * | 2015-03-02 | 2020-08-04 | Strand Life Sciences Private Limited | Apparatuses and methods for determining a patient's response to multiple cancer drugs |
EP3636777A1 (en) * | 2015-07-13 | 2020-04-15 | Agilent Technologies Belgium NV | System and methodology for the analysis of genomic data obtained from a subject |
-
2019
- 2019-01-09 CA CA3088012A patent/CA3088012A1/en active Pending
- 2019-01-09 EP EP19738315.1A patent/EP3738123A4/en active Pending
- 2019-01-09 WO PCT/US2019/012913 patent/WO2019139994A1/en unknown
- 2019-01-09 JP JP2020537765A patent/JP7074861B2/ja active Active
- 2019-01-09 CN CN201980007894.8A patent/CN111566741B/zh active Active
- 2019-01-09 US US16/960,005 patent/US11264119B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006114037A (ja) * | 2004-10-12 | 2006-04-27 | Agilent Technol Inc | 比較ゲノムハイブリダイゼーション(cgh)データの見かけ上の異常を統計的に分析しプロットするためのシステムおよび方法 |
US9798855B2 (en) * | 2010-01-07 | 2017-10-24 | Affymetrix, Inc. | Differential filtering of genetic data |
JP2014529109A (ja) * | 2011-06-06 | 2014-10-30 | コーニンクレッカ フィリップス エヌ ヴェ | 核酸配列データのアセンブリに関する方法 |
JP2016516237A (ja) * | 2013-03-15 | 2016-06-02 | バセトラ メディカル テクノロジー カンパニー リミテッド | 疾患関連ヒトゲノム変異体の解析とレポート作成のシステムと方法 |
WO2017220508A1 (en) * | 2016-06-22 | 2017-12-28 | Sophia Genetics S.A. | Methods for processing next-generation sequencing genomic data |
Also Published As
Publication number | Publication date |
---|---|
JP7074861B2 (ja) | 2022-05-24 |
EP3738123A4 (en) | 2021-10-13 |
CN111566741A (zh) | 2020-08-21 |
CA3088012A1 (en) | 2019-07-18 |
WO2019139994A1 (en) | 2019-07-18 |
US20200388352A1 (en) | 2020-12-10 |
US11264119B2 (en) | 2022-03-01 |
CN111566741B (zh) | 2023-06-23 |
EP3738123A1 (en) | 2020-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111417961B (zh) | 弱监督的图像分类器 | |
EP3217270B1 (en) | A scalable pooled nvme storage box | |
CN102272726A (zh) | 便于异构处理器池虚拟化的系统和方法 | |
US11552991B2 (en) | Systems and methods for performing a simulated phishing attack | |
US11683365B2 (en) | Service correlation across hybrid cloud architecture to support container hybridization | |
EP3256953B1 (en) | Multi-mode system on a chip | |
US20240160549A1 (en) | Systems and methods for identifying and monitoring solution stacks | |
US20170339223A1 (en) | Adding and removing virtual disks remotely to a streaming machine | |
US11683165B2 (en) | Quantum key distribution networking as a service | |
US11582287B2 (en) | Hidden desktop session for remote access | |
JP7074861B2 (ja) | 生ゲノムデータに基づく構成可能テキスト文字列の生成 | |
US20220107965A1 (en) | Systems and methods for asset fingerprinting | |
AU2021355460A1 (en) | System and method for assessing operational states of a computer environment | |
US11249804B2 (en) | Affinity based optimization of virtual persistent memory volumes | |
US10152266B1 (en) | Systems and methods for providing data backup services in a virtual environment | |
US20230229474A1 (en) | Plug-in management in virtualized computing environment | |
US20230195757A1 (en) | Systems and methods for data abstraction for transmission | |
US20200385806A1 (en) | System and methods for primer extraction and clonality detection | |
US20160182455A1 (en) | Method and apparatus for threat isolation and remote resolution for computer systems | |
WO2022072770A1 (en) | System and method for reconnaissance of a computer environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220105 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220413 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220512 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7074861 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |