JP2023057038A - 遺伝子発現量のデータ処理方法、データ処理装置、およびデータ処理プログラム - Google Patents

遺伝子発現量のデータ処理方法、データ処理装置、およびデータ処理プログラム Download PDF

Info

Publication number
JP2023057038A
JP2023057038A JP2022150637A JP2022150637A JP2023057038A JP 2023057038 A JP2023057038 A JP 2023057038A JP 2022150637 A JP2022150637 A JP 2022150637A JP 2022150637 A JP2022150637 A JP 2022150637A JP 2023057038 A JP2023057038 A JP 2023057038A
Authority
JP
Japan
Prior art keywords
data
expression level
calibration curve
marker
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022150637A
Other languages
English (en)
Inventor
千絵 岩▲崎▼
Chie Iwasaki
敦子 溝口
Atsuko Mizoguchi
裕子 須藤
Yuko Sudo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toray Industries Inc
Original Assignee
Toray Industries Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toray Industries Inc filed Critical Toray Industries Inc
Publication of JP2023057038A publication Critical patent/JP2023057038A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

【課題】遺伝子発現量のより適切な補正を実現する。【解決手段】本発明に係るデータ処理方法は、複数の生体から採取した試料自体から標準遺伝子およびマーカーの発現量のデータを含む検量線作成用データを取得する、検量線作成用データ取得工程と、上記検量線作成用データを用いて検量線を作成する、検量線作成工程と、上記検量線を用いて、注目生体から採取した注目試料中のマーカーの発現量の補正を行って補正後マーカーデータを取得する、補正工程と、を含む。【選択図】なし

Description

本発明は遺伝子発現量のデータ処理方法、データ処理装置、およびデータ処理プログラムに関する。
DNAマイクロアレイ、PCRまたはシーケンシングによって生体由来の試料の遺伝子発現量を測定する場合には、試料の状態および実験者などの実験条件により、得られるデータに誤差が生じる可能性があることが知られている。そのため、誤差を補正するためのデータ補正方法が考案されている。
このような補正方法として、特許文献1には内部標準遺伝子発現量に対する相対値に変換する方法である内因性補正法が開示されている。
また、非特許文献1には、解析対象とする遺伝子と内部標準遺伝子との増幅効率の違いを考慮して解析対象とする遺伝子の発現量を補正する方法が開示されている。
国際公開WO2016/043170号
Michael W. Pfaffl,Nucleic Acids Res.,2001, vol.29, No9, e45
しかしながら、特許文献1および非特許文献1のような補正法は、内部標準遺伝子と検出効率とが異なる遺伝子を適切に補正できず、同じ検体を用いた場合であっても得られたデータのばらつきが大きいという問題がある。
また、非特許文献1のような補正法は、解析対象とする遺伝子と内部標準遺伝子との検出効率の違いを算出するために、別途に希釈系列試料を作製して補正のための検量線を取得する、煩雑な作業が必要という問題がある。
本発明は上記の問題点に鑑みてなされたものであり、その目的は、遺伝子発現量のより適切な補正を実現すること、および遺伝子発現量を適切に補正する検量線を簡便に取得する方法を提供することにある。
本発明の態様1に係るデータ処理方法は、複数の生体由来の試料自体を用いて測定した各試料中のマーカーおよび標準遺伝子の各発現量のデータを含む検量線作成用データを取得する、検量線作成用データ取得工程と、上記検量線作成用データに含まれる上記各発現量のデータを用いて検量線を作成する、検量線作成工程と、上記検量線を用いて、注目試料から採取した注目試料中の上記マーカーの発現量の補正を行って補正後マーカーデータを取得する、補正工程と、を含むデータ処理方法である。
本発明の態様2に係るデータ処理方法は、態様1において、上記検量線は、上記検量線作成用データに含まれる上記マーカーの発現量を目的変数とし、上記標準遺伝子の発現量を説明変数とした回帰分析により取得される検量線である、データ処理方法である。
本発明の態様3に係るデータ処理方法は、態様2において、上記補正工程において、下記式(1)または(2)によって上記補正後マーカーデータを取得する。
R=Etar×(K/Erefa・・・(1)
R=Logtar+a(K-Logref)・・・(2)
式(1)および(2)中、Rは上記補正後マーカーデータであり、
tarは上記注目試料中の上記マーカーの発現量であり、
Kは任意に設定された標準遺伝子発現量の基準値であり、
refは上記注目試料中の上記標準遺伝子の発現量であり、
aは上記検量線の傾きである。
本発明の態様4に係るデータ処理方法は、態様1~3のいずれかにおいて、上記複数の生体由来の試料および上記注目試料は、同等の処理および条件によって取得されたものである。
本発明の態様5に係るデータ処理方法は、態様1~4のいずれかにおいて、上記マーカーがmiRNAまたはmRNAである。
本発明の態様6に係るデータ処理方法は、態様5において、上記マーカーがmiRNAである。
本発明の態様7に係るデータ処理方法は、態様1~6のいずれかにおいて、各遺伝子発現量のデータは、マイクロアレイ、PCRまたはシーケンシングから得られたデータである。
本発明の態様8に係るデータ処理装置は、マーカーの発現量を処理するデータ処理装置であって、複数の生体から採取した試料自体を用いて測定した各試料中の上記マーカーおよび内部標準遺伝子の各発現量のデータを含む検量線作成用データを取得する、検量線作成用データ取得部と、上記検量線作成用データに含まれる上記各発現量のデータを用いて検量線を作成して取得する、検量線取得部と、上記検量線を用いて、注目生体から採取した注目試料中の上記マーカーの発現量の補正を行って補正後マーカーデータを取得する、補正部と、を備えるデータ処理装置である。
本発明の態様9に係るデータ処理プログラムは、態様8のデータ処理装置としてコンピュータを機能させるためのデータ処理プログラムであって、上記検量線作成用データ取得部、上記検量線取得部、および上記補正部としてコンピュータを機能させるためのデータ処理プログラムである。
本発明の一態様によれば、遺伝子発現量のより適切な補正を実現すること、および遺伝子発現量を適切に補正する検量線を簡便に取得する方法を提供することができる。
本発明の一実施形態に係るデータ処理方法の概略を示すフローチャート図である。 本発明の一実施形態に係るデータ処理装置および端末装置の概略構成を示す機能ブロック図である。 実施例1において作成した内部標準遺伝子発現量とmiR-663bの発現量との対応を示す検量線1である。 実施例1において本発明の一実施形態に係るデータ処理方法を用いた結果を示す図である。 検量線法において作成した希釈系列の希釈倍率と希釈系列における内部遺伝子発現量との対応を示す検量線である。 検量線法によって作成した、希釈系列の希釈倍率とmiR-663bの発現量との対応を示す検量線である。 検量線法によって注目試料のmiR-663bの発現量に対して補正を行った結果を示す図である。 実施例3において作成した内部標準遺伝子発現量(Ct値)とmiR-18bの発現量(Ct値)との対応を示す検量線2である。 実施例4において本発明の一実施形態に係るデータ処理方法を用いた結果を示す図である。
本発明の一実施形態について説明する。本実施形態におけるデータ処理方法は、複数の生体から採取した試料中のマーカーおよび標準遺伝子の各発現量のデータを含む検量線作成用データを取得する検量線作成用データ取得工程と、上記検量線作成用データを用いて検量線を取得する検量線作成工程と、上記検量線を用いて注目生体から採取した注目試料のマーカーの発現量の補正を行う補正工程と、を含むデータ処理方法である。
〔用語〕
本明細書において、「マーカー」とは、任意の方法でその存在量が測定できる生体分子であれば特に制限はない。例えば、DNA、RNAおよびタンパク質等が挙げられる。これらの中でもRNAが好適に用いられ、ノンコーディングRNA(ncRNA)がより好適に用いられる。ncRNAは、20塩基長から200塩基長程度の小分子ncRNAと全長が数百塩基長から数十万塩基長の長鎖ncRNAとに大別される。ncRNAとしては、転移RNA、リボソームRNA、核内低分子RNA、核小体低分子RNA、シグナル認識複合体RNA、miRNA、piRNA、長鎖ノンコーディングRNA、環状RNA、およびmRNAの非翻訳領域等が挙げられる。マーカーは細胞および組織等に由来するものであってもよい。たとえば、マーカーはその存在または存在量が特定の疾患との間で関係性のある生体分子、すなわち疾患マーカーであってもよい。疾患は、疾患マーカーの存在が知られている疾患であれば特に制限されず、癌、認知症、高血圧、心臓疾患、脳疾患、肝炎、感染症、およびアレルギー等が挙げられる。
本明細書において、「標準遺伝子」とは、生体において発現量の変動が少ない、または変動の態様が既知である遺伝子のことを指す。標準遺伝子は1種類であっても、複数の遺伝子の平均値であってもよい。「内部標準遺伝子」とは、これらの遺伝子の内、内因性の遺伝子のことを指す。内部標準遺伝子には、特に制限はなく、マーカーとなる生体分子の種類によって、適宜好ましいものを選択してもよい。たとえば、mRNAおよびmiRNAをマーカーとする場合、内部標準遺伝子として、GAPDH、ACTB、B2M、GUS、HPRT、TBP、rRNA、RNU44、RNU48、U6 snRNA、miR-6085、miR-1227-5p、miR-149-3p、miR-2861、miR-4463、miR-4508、miR-6090、miR-6775-5p、miR-6803-5p、およびmiR-5787等が挙げられる。特に、miRNAをマーカーとする場合、内部標準遺伝子としては、miR-6085、miR-1227-5p、miR-149-3p、miR-2861、miR-4463、miR-4508、miR-6090、miR-6775-5p、miR-6803-5p、およびmiR-5787の少なくとも1つが特に好適に用いられる。
本明細書において、「生体」とは、ヒトおよびチンパンジーを含む霊長類、イヌおよびネコ等の愛玩動物、ウシ、ウマ、ヒツジおよびヤギ等の家畜動物、マウスおよびラット等の齧歯類、ならびに動物園で飼育される動物等の哺乳動物を意味する。好ましい生体は、ヒトである。「注目生体」とは、本発明を用いて解析される対象となる生体のことを指す。たとえば、疾患または状態を診断される対象であってもよい。「複数の生体」として用いられる生体は、注目生体と同一種の個体であればよく、少なくとも解析対象のマーカーの発現が変動する要因の影響を受けていない個体である。複数の生体の数は特に制限はなく、2例以上であればよく、10例以上であることが好ましく、50例以上であることがより好ましく、多ければ多いほど、後述する補正工程における補正の精度が上がるため好ましい。
本明細書において、「試料自体」とは、濃縮または希釈等の試料に対する処理を行わないで、遺伝子発現量測定に供される試料を指す。ここで、「試料に対する処理」には遺伝子発現量測定に供するときに必要な試薬の添加等は含まれない。すなわち、試料自体を希釈して希釈系列とした試料は「試料自体」には含まれないが、試料自体を遺伝子発現量測定に供する目的で必要な試薬を添加したことにより、必要な試薬の添加前と比べ希釈された状態となっている試料は試料自体に含まれる。遺伝子発現量測定に供する目的で試料自体を希釈する際には、測定手法、使用機器および使用キット等によって異なり得るが、最終的に測定に供する試料と任意の試薬との混合溶液を100%(v/v)としたときに、試料自体の割合は例えば1%(v/v)以上、2%(v/v)以上または3%(v/v)以上であり得る。また、当該混合溶液を100%(v/v)としたときに、試料自体の割合は例えば10%(v/v)以下または5%(v/v)以下であり得る。特に言及しない限りは、単に「試料」としていても、「試料自体」を指す。本明細書において、「注目試料」とは、注目生体から得られた試料自体のことを指す。なお、試料自体ではなく、試料自体を処理して得られた試料については「処理した試料」等と称し、例えば、試料を希釈して得られた試料は「希釈試料」と称する。試料は、マーカーの発現量の測定に使用可能なものであれば特に制限はなく、例えば、体液、組織、および細胞等であってもよい。体液であれば、一例として、血液、血清、血漿、髄液、尿、唾液、涙、組織液またはリンパ液が挙げられ、これらの中でも、血液、血清および血漿が好適に用いられる。
本明細書において、「検量線作成用データ」とは、複数の生体から採取した試料自体を用いて測定した各試料中のマーカーおよび内部標準遺伝子の各発現量のデータを含むデータを指す。ここで、同一の試料から得られたマーカーおよび内部標準遺伝子の発現量は、同一の試料から得られたという情報と共に検量線作成用データとして記憶される。検量線作成用データに含まれる発現量のデータを得る際の条件、処理および測定方法等は特に制限はないが、各試料の間で同一であることが好ましい。特定の一つのマーカーを測定して得られた結果に限らず、複数のマーカーを測定して得られた、各マーカーに対応した複数の測定結果または数値データを含むものでもよい。複数のマーカーの測定結果は、各マーカーを同時に測定した結果であってもよいし、独立に測定を行った結果であってもよい。複数のマーカーを用いる場合、その数は限定されず、例えば、2以上、3以上、4以上、5以上、10以上、15以上、20以上、30以上または40以上であり得る。検量線作成用データおよびマーカーデータを得るための測定手段としては、生体分子および必要なデータに応じて適宜選択することができる。測定手段の一例としては、電気化学的検出を含む各種DNAマイクロアレイ、qRT-PCRを含む各種PCR、次世代シーケンシングを含む各種シーケンシング、蛍光分子バーコードをもつ配列特異的なプローブを用いた遺伝子発現解析法(nCounter Analysis System)(登録商標)、NASBA(Nucleic Acid Sequence-Based Amplification)法、ICAN(Isothermal and Chimeric primer-initiated Amplification of Nucleic acids)法(等温遺伝子増幅法)、LAMP(Loop-Mediated Isothermal Amplification)(登録商標)法、およびELISA等が挙げられる。次世代シーケンシングは、第2世代のシーケンシング又は第3世代のシーケンシングであってもよい。第2世代のシーケンシングの例としては、パイロシーケンシング法、合成シーケンシング法、ライゲーションシーケンシング法、及びイオン半導体シーケンシング法が挙げられる。第3世代のシーケンシングの例としては、1分子シーケンサー又はナノポアシークエンサーを用いるシーケンシング法が挙げられる。なかでも、複数のマーカーを同時に測定でき、複数のマーカーを用いることで精度の高いデータ処理を行える観点から、マイクロアレイを用いること、または、データ取得時間の短縮及び定量性の観点から各種PCRを用いることが好ましい。測定結果を数値データへ変換する場合、変換方法は、測定結果と数値データとの間に相関関係がみられるものであれば、特に制限されない。
本明細書において、「検量線」とは、複数の生体由来の各試料における標準遺伝子の発現量とマーカーの発現量とを対応させることによって作成される検量線を指す。1つの検量線作成用データから同時に作成される検量線の数は限定されず、例えば、2以上、3以上、4以上、5以上、10以上、15以上、20以上、30以上または40以上であり得る。また、「検量線を用いる」とは、作成した検量線の任意のデータを用いることを指し、例えば検量線の傾きを用いることを指す。
本明細書において、「補正後マーカーデータ」とは、補正工程によって注目試料のマーカーの発現量を補正して得られたデータのことを指す。
〔データ処理方法〕
本実施形態におけるデータ処理方法は、図1に示す通り、複数の生体由来の試料から採取した試料自体を用いて測定した各試料中の上記マーカーおよび標準遺伝子の各発現量のデータを含む検量線作成用データを取得する、検量線作成用データ取得工程S1と、上記検量線作成用データに含まれる上記各発現量のデータを用いて検量線を作成する、検量線作成工程S2と、上記検量線を用いて、注目生体から採取した注目試料中の上記マーカーの発現量の補正を行って補正後マーカーデータを取得する補正工程S3と、を含むデータ処理方法である。このようなデータ処理方法は、例えば従来公知の補正法の一つである検量線法と比較して、遺伝子発現量の補正を行うための検量線を簡便に作成することができるため、好適である。また、このようなデータ処理方法は、同時に多数の検量線を簡便に作成できるため、特に大規模なデータを扱う場合に有効である。さらに、このようなデータ処理方法は、マーカーの発現量の誤差を適正に補正することができ、得られたデータのばらつきを低減させることができる。このため、このようなデータ処理方法は、例えば遺伝子発現データを用いた疾患判別、任意の薬剤の薬効評価、および有用遺伝子の探索等において、任意のマーカーの発現量を評価する際に有用である。
(検量線作成用データ取得工程S1)
検量線作成用データ取得工程S1は、任意の方法によって測定された各遺伝子発現量を検量線作成用データとして取得する工程である。検量線作成用データは、その取得方法に制限はなく、複数の生体から新たに検量線作成用データを作成する場合に限らず、既に作成済みの検量線作成用データを準備するものであってもよい。例えば、複数の生体を対象とした任意の遺伝子発現解析によって網羅的に得られた複数の遺伝子の発現量に関するデータの内、マーカーおよび内部標準遺伝子として適切な遺伝子を選択して、検量線作成用データとして取得する工程であってもよい。このとき、検量線作成用データには、新たに解析した生体由来のデータのみならず、既に解析された生体由来のデータも含まれてもよい。
(検量線作成工程S2)
検量線作成工程S2は、検量線作成用データから任意の解析によって検量線を作成して、取得する工程である。検量線作成工程S2は、後述する補正工程S3においてマーカーの発現量を適切に補正できるものであれば、特に制限はない。典型的には、本実施形態に係るデータ処理方法において、上記検量線は、上記検量線作成用データに含まれる上記マーカーの発現量を目的変数とし、上記標準遺伝子の発現量を説明変数とした回帰分析により取得される係数であってもよい。回帰分析は典型的には線形回帰分析であり、単回帰分析および重回帰分析の何れでもよく、好適には単回帰分析である。なお、回帰式の利用は、得られた回帰式そのものを利用する場合に限らず、回帰式を作成することにより得られる係数などの数値を利用する場合が挙げられる。
(補正工程S3)
補正工程S3は、検量線を用いた所定の計算により、注目試料のマーカーの発現量を補正する工程である。補正は検量線を用いたものであり、かつ適切な補正ができるものであれば、特に制限はない。例えば、本実施形態に係るデータ処理方法は、補正工程S3において、検量線の傾きを用いてマーカー発現量を補正してもよい。具体的には、下記式(1)によって上記補正後マーカーデータRを取得してもよい。
R=Etar×(K/Erefa・・・(1)
式(1)中、Rは上記補正後マーカーデータであり、
tarは上記注目試料中の上記マーカーの発現量であり、
Kは任意に設定された内部標準遺伝子発現量の基準値であり、
refは上記注目試料中の上記内部標準遺伝子の発現量であり、
aは上記検量線の傾きである。
また、補正工程S3において、上記式(1)のEtarおよびErefの値を底が2の対数値に変換して、下記式(2)によって上記補正後マーカーデータR’を取得してもよい。
R’=Logtar+a(K-Logref)・・・(2)
式(2)中、Etar、ErefおよびKは式(1)と同様の数値である。
マーカー発現量Etarおよび内部標準遺伝子発現量Erefは注目試料中の遺伝子発現量を任意の方法で測定した結果得られた発現量であってもよい。典型的には、検量線作成用データを得る際に使用した測定方法によって測定された注目試料中の遺伝子発現量である。Kは任意に設定された、内部標準遺伝子発現量の基準値である。具体的には、Kは複数の試料中の内部標準遺伝子発現量の平均値を算出することによって設定され得る。aは検量線作成工程で得られた検量線である。
(判別工程)
また、図示しないが、本実施形態のデータ処理方法において、補正後マーカーデータに基づき、上記注目生体のマーカーの発現量の高低を判別する判別工程を含んでもよい。たとえば、マーカーの発現量について閾値を設定し、閾値と比較して、マーカーの発現量が閾値よりも高いか、またが閾値よりも低いか、を判別してもよい。本実施形態においては補正が適切に行われているため、判別工程においても発現量に関して精度の高い判定が行うことができる。
(データの取得)
本実施形態に係るデータ処理方法において、複数の試料および注目試料中のマーカーおよび標準遺伝子の発現量は、試料自体に対して遺伝子発現量の測定のために必要な試薬の添加以外による希釈を行わずに、測定に供される。すなわち、本実施形態に係るデータ処理方法では希釈系列は作製されず、試料自体が遺伝子発現量の測定のために用いられる。
上述の補正によれば、複数の試料および注目試料の処理および条件が異なる場合であっても処理および条件の差によるマーカーの発現量の差を補正することが可能である。一方、本実施形態のデータ処理方法において、複数の試料および注目試料は、同等の処理および条件によって取得されたものであってもよい。試料ごとの取得時の処理および条件を合わせることにより、マーカーの発現量に対してより正確な判定をすることができる。「同等の処理および条件」とは、試料の取得から発現量の測定時までに生じた処理および条件を同一のものとすることを指し、特にマーカーの発現量の測定値に影響を与えうる要因を同一のものとすることを指す。例えば、試料の取得方法および保存方法を同一にすることを指す。一例として、試料の取得に用いた機材およびキット、生体の状態、保存時の温度および時間、保存に用いた機材、ならびに試料の調製方法などを同一にすることを指すが、実際に同一にする処理および条件は、マーカーの発現量の測定への影響の程度を当業者が考慮して、適宜に決定してもよい。
本実施形態に係るデータ処理方法において、マーカーは任意の方法で測定可能な生体分子であれば、特に制限はない。たとえばマーカーはmiRNAまたはmRNAであってもよい。特に、マーカーはmiRNAであってもよい。
本実施形態に係るデータ処理方法において、各遺伝子発現量のデータを得る方法は特に限定されない。たとえば、各遺伝子発現量のデータは、マイクロアレイ、PCRまたはシーケンシングから得られたデータであってもよい。
本実施形態に係るデータ処理方法において、試料および注目試料には、生体および注目生体の一部から採取された任意の試料を用いてもよい。たとえば、試料および注目試料は、体液試料であってもよい。体液試料は採取が容易なため、好ましく遺伝子発現解析に用いることができる。
本実施形態に係るデータ処理方法の実行主体は、特に制限はない。たとえば、1または複数の情報処理装置を実行主体としてもよい。
〔データ処理方法〕
本実施形態に係るデータ処理方法は、複数の生体由来の試料自体を用いて測定した各試料中のマーカーおよび標準遺伝子の各発現量のデータを含む検量線作成用データを取得する、検量線作成用データ取得工程と、検量線作成用データに含まれる上記各発現量のデータを用いて検量線を取得する、検量線作成工程と、検量線を用いて、注目試料から採取した注目試料中の上記遺伝子の発現量の補正を行って補正後データを取得する、補正工程と、を含むデータ処理方法である。当該データ処理方法によれば、遺伝子の発現量の評価を行う際に好適な補正を行うことができる。
〔データ処理装置〕
本実施形態に係るデータ処理装置は、マーカーの発現量を処理するデータ処理装置であって、複数の生体から採取した試料自体を用いて測定した各試料中の上記マーカーおよび内部標準遺伝子の各発現量のデータを含む検量線作成用データを取得する、検量線作成用データ取得部と、上記検量線作成用データに含まれる上記各発現量のデータを用いて検量線を作成して取得する、検量線取得部と、上記検量線を用いて、注目生体から採取した注目試料中の上記マーカーの発現量の補正を行って補正後マーカーデータを取得する、補正部と、を備えるデータ処理装置である。
すなわち、本実施形態に係るデータ処理装置は図1に示す各工程を実行する部材を含むデータ処理装置である。検量線作成用データ取得工程S1は検量線作成用データ取得部において実行され、検量線作成工程S2は検量線取得部において実行され、補正工程S3は補正部において実行される。
また、本実施形態に係るデータ処理装置は、検量線作成用データ取得部と、検量線取得部と、補正部と、に加えて、補正後マーカーデータに基づき、注目生体におけるマーカーの発現量の高低を判別する判別部を備えていてもよい。
図2に基づいて、本実施形態に係るデータ処理装置の1つの具体例について説明する。図2は、本実施形態に係るデータ処理装置および端末装置の概略構成を示す機能ブロック図である。図2に示されるように、データ処理装置100は、表示部および入力デバイス等を備えた端末装置200と通信する構成である。ただし、データ処理装置100は本実施形態の構成に限定されず、例えば、データ処理装置100は、端末装置200と通信せずに、自ら表示部および入力デバイス等を備えていてもよい。
データ処理装置100は、制御部110、記憶部150および通信部160を備えている。制御部110は、取得部120、補正部130および判別部140を備えている。また、取得部120は、検量線作成用データ取得部121および検量線取得部122を備えている。
制御部110は、データ処理装置100を統括的に制御するものである。
記憶部150は、データ処理装置100の処理に必要なデータを記憶する記憶装置である。また、記憶部150は、検量線作成用データ151および検量線152を記憶する。なお、記憶部150は、データ処理装置100の外部装置であってもよい。例えば、記憶部150は、データ処理装置100と通信可能に接続されたサーバ等の記憶装置であってもよい。また、検量線作成用データ151および検量線152は同一または異なる記憶部150に記憶されてもよい。
検量線作成用データ取得部121は、複数の生体から採取した試料自体を用いて測定した各試料中の上記マーカーおよび標準遺伝子の各発現量のデータを含む検量線作成用データを取得する。検量線作成用データ取得部121によって取得された検量線作成用データは記憶部150によって記憶される。検量線取得部122は、検量線作成用データ151から検量線152を算出して取得する。取得された検量線152は記憶部150に記憶される。
補正部130は、記憶部150に記憶された検量線152を用いて、注目生体から採取した注目試料中のマーカーの発現量の補正を行い、補正後マーカーデータを算出する。
判別部140は、補正部130により算出された補正後マーカーデータを用いて、注目生体におけるマーカーの発現量の高低を判別する。具体的には、補正後マーカーデータが示す数値が、予め指定された閾値を超えていれば、判別部140は判別対象となった試料においてマーカーの発現量が高いと判別する。一方、閾値以下であれば当該試料において、マーカーの発現量が低いと判別する。そして、判別部140はその結果を端末装置200に送信する。予め指定された閾値は段階的に複数設けられてもよい。また、データ処理装置100に判別部140を設ける構成でなくてもよい。この場合、補正部130により算出された補正後マーカーデータをそのまま端末装置200に送信し、ユーザが、所定の基準に基づき試料におけるマーカーの発現量の高低を判別するものであってもよい。
通信部160は、補正部130で得られた補正後マーカーデータまたは判別部で得られた判別結果をデータ処理装置100とは異なる端末等に出力する。通信部160は有線または無線でデータを通信する。例えば図2に示す通り、通信部160は端末装置200にデータを出力する。
なお、本実施形態では、制御部110に補正部130を備えているデータ処理装置100について説明している。しかしながら、データ処理装置100に補正部130を設ける構成でなくてもよい。すなわち、データ処理装置100とは独立に存在する、検量線作成用データ取得部121および検量線取得部122を備えた取得部120と、補正部130とを少なくとも含む装置により、上述の検量線152を構築するものであってもよい。当該装置がデータ処理装置100とは独立に存在する場合には、データ処理装置100は、記憶媒体に記憶された検量線152を読み込むことで、検量線152が利用可能となる。または、データ処理装置100は、有線または無線のネットワークを介して他の装置から検量線152を受信することで、データ処理装置100において検量線152が利用可能となる。
端末装置200は、通信部210、制御部220、入力デバイス230および表示部240を備えている。通信部210は、データ処理装置100との間で、有線または無線でデータの送受信を行う通信インターフェースである。制御部220は、端末装置200を統括的に制御する。表示部240は、画像、文字等を表示可能なディスプレイである。入力デバイス230は、ユーザの入力を受け付けるものであり、例えばタッチパネル、マウスおよびキーボード等によって実現される。入力デバイス230がタッチパネルの場合、表示部240に当該タッチパネルが設けられる。ユーザは、端末装置200を介して、データ処理装置100の機能を利用することができる。
図2に示すデータ処理装置100は、上述の本実施形態に係るデータ処理方法の実施に適した装置である。
〔ソフトウェアによる実現例〕
本実施形態に係るデータ処理プログラムは、データ処理装置100としてコンピュータを機能させるためのデータ処理プログラムであって、上記検量線作成用データ取得部および上記補正部としてコンピュータを機能させるためのデータ処理プログラムである。データ処理装置100の各制御ブロック(特に制御部110、取得部120、補正部130および判別部140)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
ソフトウェアによってプログラムを実施する場合、データ処理装置100は、プログラムを実行するためのハードウェアとして、コンピュータを備えている。このコンピュータは例えば少なくとも1つの制御装置(例えばプロセッサ)と少なくとも1つの記憶装置(例えばメモリ)を備えている。この制御装置と記憶装置により上記プログラムを実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばCPU(Central Processing Unit)またはGPU(Graphics Processing Unit)を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ROM(Read Only Memory)等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するRAM(Random Access Memory)などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
[実施例1]
<内部標準遺伝子の発現量とマーカーの発現量との回帰分析>
(試料の採取)
健康成人5例より、それぞれの尿を採取し、得られた各尿300μLを試料とした。
(total RNAの抽出)
3D-Gene(登録商標)RNA extraction reagent from liquid sample kit(東レ株式会社(日本))中のRNA抽出用試薬を用いて、同社の定めるプロトコールに従って、各試料からtotal RNAを得た。
(miRNA発現量の測定)
上記の5例の各試料のそれぞれから得たtotal RNAに対して3D-Gene(登録商標)miRNA Labeling kit(東レ株式会社)を用いて、同社が定めるプロトコールに基づいてtotal RNA中のmiRNAを蛍光標識した。オリゴDNAチップとして、miRBase release 21に登録されているmiRNAと相補的な配列を有するプローブを搭載した3D-Gene(登録商標)Human miRNA Oligo chip(東レ株式会社)を用い、同社が定めるプロトコールに基づいてストリンジェントな条件でハイブリダイゼーションおよびハイブリダイゼーション後の洗浄を行った。DNAチップを3D-Gene(登録商標)スキャナー(東レ株式会社)を用いてスキャンし、画像を取得して3D-Gene(登録商標)Extraction(東レ株式会社)にて蛍光強度を数値化した。
(測定値の対数化)
数値化された蛍光強度を用いて以下のように検出されたmiRNAの発現量を計算した。まず、複数あるネガティブコントロールスポットのシグナル強度の最大順位および最小順位各々5%を除き、その[平均値+2×標準偏差]を計算し、この値より大きいシグナル強度を示した遺伝子は検出されたとみなした。また、検出された遺伝子のシグナル強度から、最大順位および最小順位各々5%を除いたネガティブコントロールスポットのシグナル強度の平均値を減算し、減算後の値を底が2の対数値に変換して遺伝子発現量とした。
数値化されたmiRNAの遺伝子発現量を用いた計算および統計解析は、「エクセル統計(Bellcurve(登録商標) for Excel)」(株式会社社会情報サービス)を用いて実施した。
(検量線の取得)
本実施例では、検量線を取得するための回帰分析の一例として線形回帰分析を実施した。線形回帰分析は、マーカーの発現量をy(目的変数)、内部標準遺伝子発現量をx(説明変数)として実施した。ここで本実施例では、内部標準遺伝子発現量は、miR-2861の発現量であり、マーカーは、測定値が取得できた433種のmiRNAであった。miR-2861の発現量は、上記試料5例の平均値が0となるように、各試料のmiR-2861の発現量から13.5を差し引くことで調整した。例として図3に、各試料の内部標準遺伝子発現量に対するmiR-663bの遺伝子発現量のプロット図および各発現量に基づく回帰分析によって得られた検量線を示す。
図3に示す通り、解析対象のマーカーがmiR-663bであったとき、回帰式y=1.05x+7.87の検量線を取得した。以下、miR-663bの検量線を検量線1と称する。検量線1より、miR-663bの遺伝子発現量の変化係数(検量線の傾き)は1.05であることが示された。同様にしてmiR-663bを含む上記433種のマーカーの検量線を取得した。取得した433種のマーカーの検量線のそれぞれの変化係数(係数)および切片を表1に示す。
Figure 2023057038000001
Figure 2023057038000002
Figure 2023057038000003
Figure 2023057038000004
Figure 2023057038000005
Figure 2023057038000006
Figure 2023057038000007
[実施例2]
<同一サンプルに対する補正効果の検証>
(測定)
健常成人1例から、実施例1と同様にして尿を採取することを3回繰り返した。すなわち、同一サンプルより3例の検体を得た。得られた3例の注目検体に対し、実施例1と同様にして内部標準遺伝子およびマーカーのmiRNA発現量の測定および測定値の対数化を行った。なお、本実施例においてマーカーとしてmiR-663bを用いた。
以下、本実施例において、各遺伝子の「発現量」は対数化した測定値を指す。たとえば、マーカーの発現量をEtarと示している場合においても、Etarは対数化した測定値を指す。
(補正)
各検体のmiR-663bの発現量を上述の実施形態に基づく補正(以下、「新規補正」という)によって補正した。新規補正としては下記式(I)による補正を行った。
R=Etar-1.05×(Eref-13.5)・・・(I)
式中、Rは補正後マーカーデータであり、Etarはマーカーの発現量であり、13.5は任意に設定された内部標準遺伝子発現量の基準値であり、Erefは注目検体中の内部標準遺伝子の発現量であり、1.05は検量線1より得られた検量線の傾きである。
(結果)
同一サンプルより得られた3例の検体間の測定ばらつきを補正前と新規補正後とで比較するため、SDを算出した。補正前および新規補正後のmiR-663bの遺伝子発現量を図4に示す。図4に示す通り、補正前ではmiR-663bの遺伝子発現量のSDは、0.21であった。一方、新規補正後ではmiR-663bの遺伝子発現量のSDは、0.11であった。すなわち、新規補正により同一サンプルの測定ばらつきが低減された。
[比較例1]
<同一サンプルに対する補正効果の検証>
(検量線法補正)
健康成人1例より実施例1と同様にして尿を採取し、total RNAを抽出し、RNA溶液を得た。得られたRNA溶液より、4倍、2倍、1倍(等倍)、および0.5倍の希釈系列を調製した。各希釈系列を実施例1と同様にしてmiRNA発現量を測定し、測定値を対数化した。
説明変数を対数化した希釈倍率、目的変数を任意のmiRNAの遺伝子発現量とし、線形回帰分析を実施して、検量線を取得した。結果を図5および図6に示す。図5に示す通り、目的変数を内部標準遺伝子発現量としたときの検量線はy=0.75x+14.03であった。なお、内部標準遺伝子発現量は実施例1と同様にmiR-2861の発現量を用いた。図6に示す通り、目的変数をmiR-663bとしたときの検量線はy=0.52x+7.79であった。
回帰分析によって得られた各遺伝子の検量線の変数および切片を用いて、実施例2で得た同一サンプル由来の3検体それぞれのmiR-663bの発現量を補正した。補正としては、下記式(II)の補正を行った。
Ra=(Etar-7.79)/0.52-(Eref-14.03)/0.75・・・(II)
式中、Raは補正後マーカーデータであり、EtarはmiR-663bの発現量であり、Erefは注目検体中の内部標準遺伝子の発現量である。
(結果)
同一サンプルより得られた3例の検体間の測定ばらつきを評価するため、SDを算出した。検量線法による補正後のmiR-663bの遺伝子発現量を図7に示す。図7に示す通り、検量線法による補正ではmiR-663bの遺伝子発現量のSDは、0.24であった。これは、実施例2に示した新規補正のSDと比較して大きかった。以上より、新規補正の方が従来法である検量線法補正よりも、同一サンプル由来の検体間の遺伝子発現量のばらつきを適切に補正可能であることが示された。
[実施例3]
<内部標準遺伝子の発現量とマーカーの発現量との回帰分析>
(検体の採取)
健康成人3例より、それぞれの血液を採取し、遠心分離により血漿を取得した。上記の3例のそれぞれから得られた各血漿200μLを検体とした。
(total RNAの抽出)
miRNeasy(登録商標)Serum/Plasma Advanved Kit(QIAGEN)中のRNA抽出用試薬を用いて、同社の定めるプロトコールに従って、各検体からtotal RNAを得た。
(miRNA発現量の測定)
上記の3例の各検体のそれぞれから得たtotal RNAに対してTaqMan(登録商標)MicroRNA Reverse Transcription Kit(Thermo Fisher SCIENTIFIC,Inc.)を用いて、同社が定めるプロトコールに基づいてtotal RNA中のmiRNAを逆転写し、cDNAを取得した。得られたcDNAに対して、TaqMan(登録商標)PreAmp Master Mix(Thermo Fisher SCIENTIFIC,Inc.)を用いて、同社が定めるプロトコールに基づいて増幅反応を行った。増幅されたcDNAに対して、TaqMan(登録商標)Universal Master Mix II,no UNG(Thermo Fisher SCIENTIFIC,Inc.)およびTaqMan(登録商標)Array Human MicroRNA A(Thermo Fisher SCIENTIFIC,Inc.)を用い、同社が定めるプロトコールに基づいて、リアルタイムPCRシステム(7900HT、Life Technologies,Inc.)によるリアルタイムPCRを実施した。リアルタイムPCR反応終了後、解析ソフトウェアABIPRISM SDS2.4(Thermo Fisher SCIENTIFIC,Inc.)を使用してCt値を算出した。
数値化されたmiRNAの遺伝子発現量を用いた計算および統計解析は、「エクセル統計(Bellcurve(登録商標) for Excel)」(株式会社社会情報サービス)を用いて実施した。
(内部標準遺伝子の発現量とマーカーの発現量との回帰分析)
本実施例では、回帰分析の一例として線形回帰分析を実施した。線形回帰分析は、Ct値を発現量と見なし、マーカーの発現量(Ct値)をy(目的変数)、内部標準遺伝子の発現量(Ct値)をx(説明変数)として実施した。ここで本実施例では、内部標準遺伝子は、U6 snRNAであり、マーカーは測定値が取得できた206種のmiRNAであった。U6 snRNAの発現量は、上記試料3例の平均値が0となるように、各試料のU6 snRNAのCt値から22.2を差し引くことで調整した。例として図8に、各試料の内部標準遺伝子発現量に対するmiR-18bの発現量のプロット図および各発現量に基づく回帰分析によって得られた検量線を示す。
図8に示す通り、解析対象のマーカーがmiR-18bであったとき、回帰式y=1.14x+29.55を取得した。以下、miR-18bの検量線を検量線2と称する。検量線2より、miR-18bの遺伝子発現量の変化係数(検量線の傾き)は1.14であることが示された。同様にしてmiR-18bを含む上記206種のマーカーの検量線を取得した。取得した206種のマーカーの検量線のそれぞれの変化係数(係数)および切片を表2に示す。
Figure 2023057038000008
Figure 2023057038000009
Figure 2023057038000010
Figure 2023057038000011
[実施例4]
<同一サンプルに対する補正効果の検証>
(測定)
健常成人1例から、実施例3と同様にして血漿を採取することを3回繰り返した。すなわち、同一サンプルより3例の検体を得た。得られた3例の注目検体に対し、実施例3と同様にして各注目検体の内部標準遺伝子およびマーカーのmiRNAのCt値を取得した。なお、本実施例においてマーカーとしてmiR-18bを用いた。
以下、本実施例において、各遺伝子の「発現量」はCt値を指す。
(補正)
各検体のmiR-18bの発現量を新規補正によって補正した。新規補正としては下記式(III)による補正を行った。
R=Etar-1.14×(Eref-22.2)・・・(III)
式中、Rは補正後マーカーデータであり、Etarはマーカーの発現量であり、22.2は任意に設定された内部標準遺伝子発現量の基準値であり、Erefは注目検体中の内部標準遺伝子の発現量であり、1.14は検量線2より得られた検量線の傾きである。
(結果)
同一サンプルより得られた3例の検体間の測定ばらつきを補正前と新規補正後とで比較するため、SDを算出した。補正前および新規補正後のmiR-18bの遺伝子発現量を図9に示す。図9に示す通り、補正前ではmiR-18bの遺伝子発現量のSDは、0.69であった。一方、新規補正後ではmiR-18bの遺伝子発現量のSDは、0.09であった。すなわち、新規補正により同一サンプルの測定ばらつきが低減された。
本発明は、遺伝子発現の測定に利用することができる。
100 データ処理装置
110 制御部
120 取得部
121 検量線作成用データ取得部
122 検量線取得部
130 補正部
140 判別部
150 記憶部
151 検量線作成用データ
152 検量線
160 通信部
200 端末装置
210 通信部
220 制御部
230 入力デバイス
240 表示部

Claims (9)

  1. 複数の生体由来の試料自体を用いて測定した各試料中のマーカーおよび標準遺伝子の各発現量のデータを含む検量線作成用データを取得する、検量線作成用データ取得工程と、
    上記検量線作成用データに含まれる上記各発現量のデータを用いて検量線を作成する、検量線作成工程と、
    上記検量線を用いて、注目試料から採取した注目試料中の上記マーカーの発現量の補正を行って補正後マーカーデータを取得する、補正工程と、
    を含むデータ処理方法。
  2. 上記検量線は、上記検量線作成用データに含まれる上記マーカーの発現量を目的変数とし、上記標準遺伝子の発現量を説明変数とした回帰分析により取得される検量線である、請求項1に記載のデータ処理方法。
  3. 上記補正工程において、下記式(1)または(2)によって上記補正後マーカーデータを取得する、請求項2に記載のデータ処理方法。
    R=Etar×(K/Erefa・・・(1)
    R=Logtar+a(K-Logref)・・・(2)
    式(1)および(2)中、Rは上記補正後マーカーデータであり、
    tarは上記注目試料中の上記マーカーの発現量であり、
    Kは任意に設定された標準遺伝子発現量の基準値であり、
    refは上記注目試料中の上記標準遺伝子の発現量であり、
    aは上記検量線の傾きである。
  4. 上記複数の生体由来の試料および上記注目試料は、同等の処理および条件によって取得されたものである、請求項1~3の何れか1項に記載のデータ処理方法。
  5. 上記マーカーがmiRNAまたはmRNAである、請求項1~3の何れか1項に記載のデータ処理方法。
  6. 上記マーカーがmiRNAである、請求項5に記載のデータ処理方法。
  7. 各遺伝子発現量のデータは、マイクロアレイ、PCRまたはシーケンシングから得られたデータである、請求項1~3の何れか1項に記載のデータ処理方法。
  8. マーカーの発現量を処理するデータ処理装置であって、
    複数の生体から採取した試料自体を用いて測定した各試料中の上記マーカーおよび内部標準遺伝子の各発現量のデータを含む検量線作成用データを取得する、検量線作成用データ取得部と、
    上記検量線作成用データに含まれる上記各発現量のデータを用いて検量線を作成して取得する、検量線取得部と、
    上記検量線を用いて、注目生体から採取した注目試料中の上記マーカーの発現量の補正を行って補正後マーカーデータを取得する、補正部と、を備えるデータ処理装置。
  9. 請求項8に記載のデータ処理装置としてコンピュータを機能させるためのデータ処理プログラムであって、上記検量線作成用データ取得部、上記検量線取得部、および上記補正部としてコンピュータを機能させるためのデータ処理プログラム。
JP2022150637A 2021-10-08 2022-09-21 遺伝子発現量のデータ処理方法、データ処理装置、およびデータ処理プログラム Pending JP2023057038A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021166246 2021-10-08
JP2021166246 2021-10-08

Publications (1)

Publication Number Publication Date
JP2023057038A true JP2023057038A (ja) 2023-04-20

Family

ID=86004783

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022150637A Pending JP2023057038A (ja) 2021-10-08 2022-09-21 遺伝子発現量のデータ処理方法、データ処理装置、およびデータ処理プログラム

Country Status (1)

Country Link
JP (1) JP2023057038A (ja)

Similar Documents

Publication Publication Date Title
JP7119014B2 (ja) まれな変異およびコピー数多型を検出するためのシステムおよび方法
US11111541B2 (en) Diagnostic MiRNA markers for Parkinson's disease
Wilson et al. Amplification protocols introduce systematic but reproducible errors into gene expression studies
EP3304093B1 (en) Validating biomarker measurement
CN106047991B (zh) 用于检测川崎病的方法及试剂盒
CN114574581A (zh) 检测稀有突变和拷贝数变异的系统和方法
CN111662982B (zh) 用于脑胶质瘤早期诊断和/或复发监测的生物标志物及其应用
KR102068272B1 (ko) Rna 완전성을 결정하는 방법
JP2024507536A (ja) 複数の臓器の移植レシピエントにおけるドナー由来無細胞dnaの検出方法
JP2017033046A (ja) 変異判定方法、変異判定プログラムおよび記録媒体
Yen et al. Technical considerations and protocol optimization for neonatal salivary biomarker discovery and analysis
CN113862351A (zh) 体液样本中鉴定胞外rna生物标志物的试剂盒及方法
JP2023057038A (ja) 遺伝子発現量のデータ処理方法、データ処理装置、およびデータ処理プログラム
CN105603104A (zh) 一种检测血清中循环microRNA的方法
CN107723343B (zh) 一种基因定量分析的方法
CN115772524A (zh) 一种标志物组合及其在制备诊断甲状腺癌的试剂中的应用
JP5787517B2 (ja) ポリメラーゼ連鎖反応を使用して出発試薬の量を決定するためのシステムおよび方法
Bergbower et al. Multi-gene technical assessment of qPCR and NanoString n-Counter analysis platforms in cynomolgus monkey cardiac allograft recipients
CN111763742A (zh) 甲基化标志物及确定个体年龄的方法和应用
CN105779579A (zh) 评估罹患结肠直肠癌风险的方法及标志物
US20200040380A1 (en) Dilution tagging for quantification of biological targets
CN116555402A (zh) 端粒检测试剂盒和非疾病诊断目的的端粒长度检测方法
CN113416778A (zh) 基因组合作为诊断阿尔茨海默病的分子标志物
CN113345580A (zh) 一种阿尔茨海默病检测试剂、诊断装置及应用
EP2733634A1 (en) Method for obtaining gene signature scores

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221005