JP3875171B2 - 遺伝子発現データの正規化方法 - Google Patents

遺伝子発現データの正規化方法 Download PDF

Info

Publication number
JP3875171B2
JP3875171B2 JP2002285201A JP2002285201A JP3875171B2 JP 3875171 B2 JP3875171 B2 JP 3875171B2 JP 2002285201 A JP2002285201 A JP 2002285201A JP 2002285201 A JP2002285201 A JP 2002285201A JP 3875171 B2 JP3875171 B2 JP 3875171B2
Authority
JP
Japan
Prior art keywords
sample
expression level
data
expression
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002285201A
Other languages
English (en)
Other versions
JP2004117326A (ja
Inventor
真人 染
信彦 小倉
Original Assignee
富士フイルムホールディングス株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士フイルムホールディングス株式会社 filed Critical 富士フイルムホールディングス株式会社
Priority to JP2002285201A priority Critical patent/JP3875171B2/ja
Publication of JP2004117326A publication Critical patent/JP2004117326A/ja
Application granted granted Critical
Publication of JP3875171B2 publication Critical patent/JP3875171B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、複数の遺伝子とハイブリダイズさせることによって得られた2つのサンプルについての遺伝子発現データの比較において、一方のサンプルについての遺伝子発現データを正規化する方法に関する。
【0002】
【従来の技術】
生体内の遺伝情報はDNA塩基配列として保存されており、遺伝子の発現を解析することは各種疾病の予防、早期診断治療、オーダーメイド医療などに有効である。生物学、医学分野での遺伝子解析においては、遺伝子の発現を解析する方法として、マイクロアレイ法が用いられている。マイクロアレイ法は、スライドガラス上に数千個のDNAスポットを作成したDNAチップやDNAマイクロアレイにサンプルをハイブリダイゼーションさせ、ハイブリッド形成の強度を指標にして各遺伝子の発現量を測定する方法である。
【0003】
近年、マイクロアレイ法を使用して遺伝子発現をモニタリングする技術が開発されている。多くの疾病状態は、特定の遺伝子の遺伝的DNAのコピー数の変化または転写レベルの変化によって、様々な遺伝子の発現レベルの違いにより特徴付けられる。例えば、遺伝物質の欠失および獲得は、癌化および癌の進行において重要な役割を担う。また、特定の遺伝子の発現レベルの変化は、様々な癌の存在および進行の指標として機能する。したがって、遺伝子発現の解析においては、疾病を有する細胞と正常な細胞との間で、複数の遺伝子の発現レベルを比較しなければならない。
【0004】
マイクロアレイ法を使用して遺伝子発現の定量を行う際には、検体からの遺伝子抽出量が実験ごとに変化すること等から、基準となる測定値を用いて遺伝子発現データを正規化することが行われている。従来、2つのサンプルにおける複数の遺伝子に対する発現量を比較する方法では、2つのサンプルから必ず発現するある遺伝子を基準プローブとしてマイクロアレイ上に置き、この遺伝子についての発現量が同じであると仮定して、2つのサンプルにおいてこの発現量が一致するようにいずれかのサンプルについての遺伝子発現データを正規化している。また、2つのサンプルにおいてすべての遺伝子についての発現量の総和が等しいと仮定して、遺伝子発現量の総和が一致するようにいずれかのサンプルについての遺伝子発現データを正規化しているものもある。
【0005】
【発明が解決しようとする課題】
しかしながら、基準プローブを用いた正規化では、サンプルから必ず発現する遺伝子が全体の遺伝子の発現量を代表しているとは限らず、基準プローブについての発現量を一致させても他の遺伝子についての発現量が一定にならないという原理的な問題があり、精度が悪かった。また、遺伝子発現量の総和が等しいと仮定して正規化する方法では、高い発現量を持つ遺伝子についてのデータが支配的となりこのデータの影響を大きく受けるという問題があり、さらにこの方法ではノイズレベルの遺伝子発現量も加算してしまうため、遺伝子発現量は微量であり多くの遺伝子はノイズレベルの発現量であることから誤差が大きくなるという問題もあった。
【0006】
本発明は上記のような従来技術の問題点に鑑みてなされたものであり、2つのサンプルにおける複数の遺伝子に対する発現量を比較する方法において、一方のサンプルについてのデータを適切に正規化する方法を提供することを目的とするものである。
【0007】
【課題を解決するための手段】
本発明の遺伝子発現データの正規化方法は、第一および第二のサンプルにおける複数の遺伝子に対する発現量を比較する方法において、前記第二のサンプルにおける発現量のデータを正規化する方法であって、前記第一のサンプルにおける発現量の対数を横軸に、前記第二のサンプルにおける発現量の対数を縦軸にとった対数座標上に、前記第一および第二のサンプルから得られた発現量のデータをプロットにより表示し、該プロットを傾き1の直線により近似して得られる近似直線の前記縦軸における切片の値から係数を求め、該係数で前記第二のサンプルにおける前記複数の遺伝子に対する発現量のデータを割ることにより該第二のサンプルにおける発現量のデータを正規化する、各工程を含むことを特徴とするものである。
【0008】
また本発明の遺伝子発現データの正規化方法は、第一および第二のサンプルにおける複数の遺伝子に対する発現量を比較する方法において、前記第二のサンプルにおける発現量のデータを正規化する方法であって、前記第一のサンプルにおける発現量を横軸に、前記第二のサンプルにおける発現量を縦軸にとった座標上に、前記第一および第二のサンプルから得られた発現量のデータをプロットにより表示し、該プロットを前記座標の原点を通る直線により近似して得られる近似直線の傾きを求め、該傾きで前記第二のサンプルにおける前記複数の遺伝子に対する発現量のデータを割ることにより該第二のサンプルにおける発現量のデータを正規化する、各工程を含むようにしてもよい。
【0009】
サンプルとしては、例えば細胞や組織から抽出したDNA、ゲノム等の核酸を用いることができる。第一のサンプルを正常な細胞からのサンプルとし、第二のサンプルを例えば疾病状態などの異常な細胞からのサンプルとすることが好ましいが、これに限定されず、第一のサンプルを異常な細胞からのサンプルとし第二のサンプルを正常な細胞からのサンプルとしてもよく、また第一および第二のサンプルのいずれも異常な細胞からのサンプルとしてもよい。
【0010】
【発明の効果】
本発明の遺伝子発現データの正規化方法によれば、第一および第二のサンプルにおける複数の遺伝子に対する発現量を比較する場合において、第一のサンプルにおける発現量の対数を横軸に、第二のサンプルにおける発現量の対数を縦軸にとった対数座標上にそれぞれのサンプルにおける発現量のデータをプロットにより表示し、プロットを傾き1の直線により近似して得られる近似直線の縦軸における切片の値から係数を求め、この係数で第二のサンプルにおける発現量のデータを割ることにより正規化することとしたので、必ずしも全体の遺伝子の発現量を代表しているとは言えない遺伝子についての発現データを基準とすることにより解析の精度が悪くなることなく、また、高い発現量を持つ遺伝子についての発現データの影響を大きく受けることなく、マイクロアレイ法で得た2つのサンプルにおける遺伝子発現データを精密に比較し解析することができ、病気の診断や予防、罹病の可能性等を正確に判断することができる。また、複数の遺伝子についての発現量を同時に精密に比較することができるため、2つのサンプルにおいて発現レベルの異なる遺伝子を発見し、例えば病気に冒されているが感染していない個人からのサンプルと感染している個人からのサンプルとの発現結果を比較することにより、その病気に対する抵抗性を与える遺伝子を同定し得る。また、同一の疾病の連続的な段階または進行レベルの組織サンプル間、疾病の最終結果が異なったことが知られている組織サンプル間において発現レベルを比較することにより、例えば癌の場合に、悪性細胞と良性細胞との間での発現レベルを比較することができる。
【0011】
また、本発明の遺伝子発現データの正規化方法において、第一および第二のサンプルにおける複数の遺伝子に対する発現量を比較する場合に、第一のサンプルにおける発現量を横軸に、第二のサンプルにおける発現量を縦軸にとった座標上にそれぞれのサンプルにおける発現量のデータをプロットにより表示し、プロットを座標の原点を通る直線により近似して得られる近似直線の傾きを求め、この傾きで第二のサンプルにおける発現量のデータを割ることにより正規化することとした場合も、上記と同様の効果が得られる。
【0012】
【発明の実施の形態】
以下、図面を参照して本発明による遺伝子発現データの正規化方法の実施形態について説明する。
【0013】
図1は、本発明による遺伝子発現データの正規化方法の一実施の形態において、第一および第二のサンプルにおける複数の遺伝子に対する発現量を示すグラフである。図1に示される横軸1は第一のサンプルにおける遺伝子発現量の対数を表し、縦軸2は第二のサンプルにおける遺伝子発現量の対数を表す。マイクロアレイ法により第一および第二のサンプルの両方で発現が測定された遺伝子について、第一および第二のサンプルにおける遺伝子発現量がそれぞれx、yと測定されると、それらの対数であるlogx、logyが横軸1および縦軸2からなる対数座標上にプロット3により表示される。
【0014】
図1において、複数のプロット3を傾き1の直線により近似して得られる近似直線4を引き、近似直線4の縦軸2における切片の値をaとすると、近似直線4は以下の数式(1)により表される。
【0015】
logy=logx+a…(1)
第一および第二のサンプルにおける遺伝子発現データを適切に比較するためには、図1に示す近似直線4を図2に示すように対数座標上の原点を通る直線に補正することが好ましい。この直線は以下の数式(2)により表される。
【0016】
logy’=logx…(2)
数式(2)においてlogy’=logy−aであるから、以下の数式(3)が成り立つ。
【0017】
y’=y/10a…(3)
したがって、第二のサンプルにおける複数の遺伝子に対する発現量のデータを10aという係数で割ることにより、第二のサンプルにおける発現量のデータを適切に正規化することができ、第一および第二のサンプルにおける複数の遺伝子に対する発現量のデータを適切に比較することによって病気の診断や予防、罹病の可能性等を正確に判断することができる。
【0018】
本実施の形態における遺伝子発現データの正規化方法においては、プロット3を傾き1の直線により近似することとしているが、1以外の傾きの直線により近似してもよく、また曲線等で近似することとしてもよい。
【0019】
図3は、本発明による遺伝子発現データの正規化方法の第二の実施の形態において、第一および第二のサンプルにおける複数の遺伝子に対する発現量を示すグラフである。図3に示される横軸6は第一のサンプルにおける遺伝子発現量を表し、縦軸7は第二のサンプルにおける遺伝子発現量を表す。マイクロアレイ法により第一および第二のサンプルの両方で発現が測定された遺伝子について、第一および第二のサンプルにおける遺伝子発現量がそれぞれx、yと測定されると、それらが横軸6および縦軸7からなる座標上にプロット9により表示される。
【0020】
図3において、複数のプロット9を座標の原点を通る直線により近似して得られる近似直線10を引き、近似直線10の傾きをbとすると、近似直線10は以下の数式(4)により表される。
【0021】
y=bx…(4)
第一および第二のサンプルにおける遺伝子発現データを適切に比較するためには、図3に示す近似直線10を図4に示すように座標上の原点を通る傾き1の直線11に補正することが好ましい。この直線は以下の数式(5)により表される。
【0022】
y’=x…(5)
数式(5)において、以下の数式(6)が成り立つ。
【0023】
y’=y/b…(6)
したがって、第二のサンプルにおける複数の遺伝子に対する発現量のデータをbという係数で割ることにより、第二のサンプルにおける発現量のデータを適切に正規化することができ、上記と同様の効果を得ることができる。
【0024】
図1および図3において、プロットの分布にばらつきがある場合には分布の多いところの影響を受けて適切な近似直線が引けない場合があるが、この場合には座標をいくつかのブロックに分け、それぞれのブロック内でプロットの数が同じになるようにランダムにプロットを選択するようにしてもよい。この場合には、選択されたプロットを用いて近似直線を作成することで、発現量の多いデータ、発現量の低いデータをすべて考慮した近似直線を作成することができる。
【0025】
また、上記の実施の形態においては、第二のサンプルにおける遺伝子発現データを正規化することとしているが、第一のサンプルにおける遺伝子発現データを正規化するようにしてもよく、また第一および第二のサンプルにおける遺伝子発現データのいずれをも正規化するようにしてもよい。
【図面の簡単な説明】
【図1】本発明による遺伝子発現データの正規化方法の一実施の形態において、第一および第二のサンプルにおける複数の遺伝子に対する発現量の対数を示すグラフ
【図2】 図1におけるグラフを補正したグラフ
【図3】本発明による遺伝子発現データの正規化方法の第二の実施の形態において、第一および第二のサンプルにおける複数の遺伝子に対する発現量を示すグラフ
【図4】図3におけるグラフを補正したグラフ
【符号の説明】
1、6 横軸
2、7 縦軸
3、9 プロット
4、10 近似直線

Claims (2)

  1. 第一および第二のサンプルにおける複数の遺伝子に対する発現量を比較する方法において、前記第二のサンプルにおける発現量のデータを正規化する方法であって、
    前記第一のサンプルにおける発現量の対数を横軸に、前記第二のサンプルにおける発現量の対数を縦軸にとった対数座標上に、前記第一および第二のサンプルから得られた発現量のデータをプロットにより表示し、
    該プロットを傾き1の直線により近似して得られる近似直線の前記縦軸における切片の値から係数を求め、
    該係数で前記第二のサンプルにおける前記複数の遺伝子に対する発現量のデータを割ることにより該第二のサンプルにおける発現量のデータを正規化する、
    各工程を含み、
    前記第一および第二のサンプルが、同一部位から採取した細胞または組織に由来するものである、
    ことを特徴とする遺伝子発現データの正規化方法。
  2. 第一および第二のサンプルにおける複数の遺伝子に対する発現量を比較する方法において、前記第二のサンプルにおける発現量のデータを正規化する方法であって、
    前記第一のサンプルにおける発現量を横軸に、前記第二のサンプルにおける発現量を縦軸にとった座標上に、前記第一および第二のサンプルから得られた発現量のデータをプロットにより表示し、
    該プロットを前記座標の原点を通る直線により近似して得られる近似直線の傾きを求め、
    該傾きで前記第二のサンプルにおける前記複数の遺伝子に対する発現量のデータを割ることにより該第二のサンプルにおける発現量のデータを正規化する、
    各工程を含み、
    前記第一および第二のサンプルが、同一部位から採取した細胞または組織に由来するものである、
    ことを特徴とする遺伝子発現データの正規化方法。
JP2002285201A 2002-09-30 2002-09-30 遺伝子発現データの正規化方法 Expired - Fee Related JP3875171B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002285201A JP3875171B2 (ja) 2002-09-30 2002-09-30 遺伝子発現データの正規化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002285201A JP3875171B2 (ja) 2002-09-30 2002-09-30 遺伝子発現データの正規化方法

Publications (2)

Publication Number Publication Date
JP2004117326A JP2004117326A (ja) 2004-04-15
JP3875171B2 true JP3875171B2 (ja) 2007-01-31

Family

ID=32278566

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002285201A Expired - Fee Related JP3875171B2 (ja) 2002-09-30 2002-09-30 遺伝子発現データの正規化方法

Country Status (1)

Country Link
JP (1) JP3875171B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2006126292A1 (ja) * 2005-05-25 2008-12-25 国立大学法人 奈良先端科学技術大学院大学 マイクロアレイデータ変換装置

Also Published As

Publication number Publication date
JP2004117326A (ja) 2004-04-15

Similar Documents

Publication Publication Date Title
CN109880910A (zh) 一种肿瘤突变负荷的检测位点组合、检测方法、检测试剂盒及系统
JP2019531700A5 (ja)
ES2573484T3 (es) Análisis automatizado de patrones de interacción sonda-diana multiplexados: coincidencia de patrones e identificación de alelos
TWI670495B (zh) 一種鑑定樣本中腫瘤負荷的方法和系統
Kim et al. rSW-seq: algorithm for detection of copy number alterations in deep sequencing data
KR102067607B1 (ko) Y 염색체 메틸화 사이트의 전립선암 진단 마커로써의 응용
CN105986008A (zh) Cnv检测方法和装置
CN108256292A (zh) 一种拷贝数变异检测装置
US10274459B2 (en) Gene mutation analyzer, gene mutation analysis system, and gene mutation analysis method
JP2017070240A (ja) 稀少突然変異の検出方法、検出装置及びコンピュータプログラム
Men et al. A prognostic 11 genes expression model for ovarian cancer
JP3875171B2 (ja) 遺伝子発現データの正規化方法
EP1798651B1 (en) Gene information display method and apparatus
CN109762881A (zh) 一种用于检测肿瘤患者血液ctDNA中的超低频突变位点的生物信息方法
CN116356001A (zh) 一种基于血液循环肿瘤dna的双重背景噪声突变去除方法
CN113257353B (zh) 基于reads深度进行目的基因外显子水平缺失检测的方法及装置
Campbell et al. Applying gene expression microarrays to pulmonary disease
CN111968702B (zh) 一种基于循环肿瘤dna的恶性肿瘤早期筛查系统
CN107723370A (zh) 一种用于鼻咽癌基因筛查的荧光定量pcr检测系统及其应用
CN111383713B (zh) ctDNA检测分析装置及方法
US20150347674A1 (en) System and method for analyzing biological sample
Ben-Dor et al. Framework for identifying common aberrations in DNA copy number data
US20200286583A1 (en) Copy number measurement device, computer readable medium, copy number measurement method and gene panel
KR20150043790A (ko) 담도암 진단용 바이오마커의 추출 방법, 이를 위한 컴퓨팅 장치, 담도암 진단용 바이오마커 및 이를 포함하는 담도암 진단 장치
KR102491322B1 (ko) 암 진단을 위한 다중 분석 예측 모델의 제조 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060612

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060620

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060821

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061024

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061025

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091102

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091102

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091102

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101102

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111102

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121102

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121102

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131102

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees