WO2017150677A1

WO2017150677A1 - 標的遺伝子の塩基配列を決定する方法

Info

Publication number: WO2017150677A1
Application number: PCT/JP2017/008320
Authority: WO
Inventors: 恭行大川; 一満前原; 木村　宏; 優子佐藤
Original assignee: 国立大学法人九州大学
Priority date: 2016-03-02
Filing date: 2017-03-02
Publication date: 2017-09-08
Also published as: JPWO2017150677A1; JP6869550B2; EP3425057A4; EP3425057A1; US20190048414A1

Abstract

対象細胞が発現する標的遺伝子の塩基配列を決定する方法であって、前記対象細胞中のｍＲＮＡの塩基配列を網羅的に決定する工程と、決定された前記ｍＲＮＡの塩基配列のうち、前記標的遺伝子の一部の塩基配列を有する塩基配列を特定する工程と、を含み、特定された前記塩基配列が標的遺伝子の塩基配列である、方法。

Description

標的遺伝子の塩基配列を決定する方法

　本発明は、標的遺伝子の塩基配列を決定する方法に関する。本願は、２０１６年３月２日に、米国に仮出願された仮出願第６２／３０２，１９６号に基づき優先権を主張し、その内容をここに援用する。

　例えば、ハイブリドーマ作製技術は、モノクローナル抗体を大量に製造し、研究や医薬に応用する手段として広く受け入れられている。しかしながら、ハイブリドーマの培養を続けると、体細胞変異により産生する抗体の反応性が変わる恐れがある。このため、有用な抗体を保存したり、組換え抗体を製造したりする場合には、ハイブリドーマが産生する抗体の遺伝子の塩基配列を決定することが必要である。

　従来、抗体遺伝子の塩基配列の決定には、５’Ｒａｐｉｄ　Ａｍｐｌｉｆｉｃａｔｉｏｎ　ｏｆ　ｃＤＮＡ　Ｅｎｄｓ（５’ＲＡＣＥ）法、縮重ＰＣＲ法等が用いられてきた（例えば、非特許文献１を参照）。

Zhou, H., et al., Optimization of primer sequences for mouse scFv repertoire display library construction., Nucleic Acids Research, 22 (5), 888-889, 1994.

　しかしながら、５’ＲＡＣＥ法は大量の全ＲＮＡを必要とし、実施が困難な場合がある。また、縮重ＰＣＲ法では縮重プライマーのミスハイブリダイゼーション等により、本来の塩基配列が失われてしまう場合がある。

　本発明は、対象細胞が発現する標的遺伝子の塩基配列を簡便かつ正確に決定することができる新たな技術を提供することを目的とする。

　本発明は以下の態様を含む。
［１］対象細胞が発現する標的遺伝子の塩基配列を決定する方法であって、前記対象細胞中のｍＲＮＡの塩基配列を網羅的に決定する工程と、決定された前記ｍＲＮＡの塩基配列のうち、前記標的遺伝子の一部の塩基配列を有する塩基配列を特定する工程と、を含み、特定された前記塩基配列が標的遺伝子の塩基配列である、方法。
［２］前記標的遺伝子は、前記対象細胞が発現する全遺伝子をｍＲＮＡの分子数が多いものから順に順位付けした場合の順位が１～１０位である、［１］に記載の方法。
［３］前記対象細胞が抗体産生細胞であり、前記標的遺伝子が抗体重鎖遺伝子であり、前記標的遺伝子の一部の塩基配列が抗体重鎖遺伝子の定常領域の一部の塩基配列であるか、又は、前記標的遺伝子が抗体軽鎖遺伝子であり、前記標的遺伝子の一部の塩基配列が抗体軽鎖遺伝子の定常領域の一部の塩基配列である、［１］又は［２］に記載の方法。
［４］ｍＲＮＡの塩基配列を網羅的に決定する前記工程が、次世代シーケンシングにより行われる、［１］～［３］のいずれかに記載の方法。
［５］次世代シーケンシングにおける塩基配列のリード数が５０，０００リード以下である、［４］に記載の方法。

　本発明によれば、対象細胞が発現する標的遺伝子の塩基配列を簡便かつ正確に決定することができる新たな技術を提供することができる。

実験例１において、トランスクリプトームを発現レベルが高い順に並べたグラフである。（ａ）は、実験例２において、ハイブリドーマクローンＨＤ１のＩｇｈの塩基配列（配列番号２８）及び推定されるアミノ酸配列（配列番号２９）を示す図である。（ｂ）は、実験例２において塩基配列を決定したクローンＨＤ１のＩｇＨタンパク質のアミノ酸配列と、既知のラットＩｇＨ（ＩｇＧ２ｂ）の定常領域のアミノ酸配列（アクセッション番号：ＡＡＡ６０７８、配列番号３０）とをアラインメントした図である。（ａ）は、実験例２において、ハイブリドーマクローンＨＤ１のＩｇｋの塩基配列（配列番号３１）及び推定されるアミノ酸配列（配列番号３２）を示す図である。（ｂ）は、実験例２において塩基配列を決定したクローンＨＤ１のＩｇＫタンパク質のアミノ酸配列と、既知のラットＩｇＫの定常領域のアミノ酸配列（アクセッション番号：ＣＡＡ２４５５８、配列番号３３）とをアラインメントした図である。（ａ）は、実験例４において、各リード数のリードからデノボ・アセンブリした場合のＩｇｈの再構成率を算出した結果を示すグラフである。（ｂ）は、実験例４において、各リード数のリードからデノボ・アセンブリした場合のＩｇｋの再構成率を算出した結果を示すグラフである。（ａ）～（ｄ）は、実施形態に係る塩基配列決定方法をまとめた図である。

　１実施形態において、本発明は、対象細胞が発現する標的遺伝子の塩基配列を決定する方法であって、前記対象細胞中のｍＲＮＡの塩基配列を網羅的に決定する工程と、決定された前記ｍＲＮＡの塩基配列のうち、前記標的遺伝子の一部の塩基配列を有する塩基配列を特定する工程とを含み、特定された前記塩基配列が標的遺伝子の塩基配列である方法を提供する。

　本実施形態の方法によれば、簡便かつ正確に標的遺伝子の塩基配列を決定することができる。また、本実施形態の方法は、わずか約０．１μｇの全ＲＮＡを用いて実施することもできる。このため、例えば１個の対象細胞を試料として、１細胞レベルで標的遺伝子の塩基配列を決定することもできる。

　本実施形態の方法において、ｍＲＮＡの塩基配列を網羅的に決定する工程は、次世代シーケンシングにより行われることが好ましい。より具体的には、次世代シーケンシングでｍＲＮＡの塩基配列を網羅的に決定するｍＲＮＡ－ｓｅｑにより、本実施形態の方法を効果的に実施することができる。

　次世代シーケンシング（Ｎｅｘｔ　Ｇｅｎｅｒａｔｉｏｎ　Ｓｅｑｕｅｎｃｉｎｇ、ＮＧＳ）とは、サンガー法によるシークエンシング法を利用した蛍光キャピラリーシークエンサーに代表される第１世代シークエンサーと対比させて使われる用語である。次世代シーケンシングは、実際には多様な機器や技術を含み、今後も様々な形態のものが考案されると考えられる。

　第１世代シークエンサーでは、１度に処理できる検体数が最大９６個程度に限られていた。また、配列決定を行うための試料となるＤＮＡ分子は、予め個別にクローニングしたりＰＣＲ法で増幅したりして用意しておく必要があり、その段階に多大な労力が必要であった。

　これに対し、次世代シークエンサーを用いた次世代シーケンシングでは、多様な配列を含むＤＮＡ断片を、エマルジョンＰＣＲやブリッジＰＣＲ等の増幅技術や１分子観察等の高感度検出技術を応用して並列的に配列解析する。このため、簡便により大規模な塩基配列決定が可能となっている。

　具体的な次世代シークエンサーとしては、例えば、ＭｉＳｅｑ、ＨｉＳｅｑ、ＮｏｖａＳｅｑ（イルミナ社）；Ｇｅｎｅｔｉｃ　Ａｎａｌｙｚｅｒ　Ｖ２．０、Ｉｏｎ　Ｐｒｏｔｏｎ（サーモフィッシャーサイエンティフィック社）；ＭｉｎＩＯＮ、ＰｒｏｍｅｔｈＩＯＮ（ナノポア社）等が挙げられる。

　対象細胞中のｍＲＮＡの塩基配列を網羅的に決定する工程では、使用する次世代シークエンサーの方式に応じたライブラリー調製を行い、例えば、平均リード長５０～１００ｂｐ、リード数３０，０００～５０，０００でシーケンシングを行えばよい。すなわち、次世代シーケンシングによる塩基配列のリード数は５０，０００リード以下であってもよい。実施例において後述するように、本実施形態の方法によれば、リード数がこの程度に少なくても標的遺伝子の塩基配列を決定することができる。

　シーケンシングにより得られた塩基配列データは、任意の手法によりアセンブル（貼り合わせ）してコンティグを得る。本明細書において、コンティグとは、短いリードを貼り合わせて得られた、より長い塩基配列を意味し、例えばアセンブルした完全長のｍＲＮＡの塩基配列を意味する。この結果、対象細胞中のｍＲＮＡの塩基配列が決定される。例えば、参照配列を必要としないデノボ・アセンブリ等の手法によりアセンブルすることができる。

　続いて、決定された前記ｍＲＮＡの塩基配列（コンティグ）のうち、標的遺伝子の一部の塩基配列を有する塩基配列を特定する。このようにして特定された塩基配列が、標的遺伝子の塩基配列である。

　例えば、標的遺伝子が抗体遺伝子である場合、抗体重鎖（Ｉｇｈ）の定常領域の塩基配列、抗体λ軽鎖（Ｉｇｌ）又は抗体κ軽鎖（Ｉｇｋ）の定常領域の塩基配列を、標的遺伝子の一部の塩基配列として利用することができる。より具体的には、例えば、配列番号１１～１４に記載の塩基配列をラットＩｇｈの定常領域の一部の塩基配列として利用することができる。また、例えば、配列番号１５～１６に記載の塩基配列をラットＩｇｌの定常領域の一部の塩基配列として利用することができる。また、例えば、配列番号１７に記載の塩基配列をラットＩｇｋの定常領域の一部の塩基配列として利用することができる。また、例えば、配列番号１８～２２に記載の塩基配列をマウスＩｇｈの定常領域の一部の塩基配列として利用することができる。また、例えば、配列番号２３～２６に記載の塩基配列をマウスＩｇｌの定常領域の一部の塩基配列として利用することができる。また、例えば、配列番号２７に記載の塩基配列をマウスＩｇｋの定常領域の一部の塩基配列として利用することができる。

　また、標的遺伝子の一部の塩基配列を有するとともに、全長が標的遺伝子の全長以上の長さを有するコンティグを特定することにより、更に効率よく標的遺伝子の塩基配列を抽出することができる。

　例えば、標的遺伝子がＩｇｈである場合、Ｉｇｈのアミノ酸配列は４００以上のアミノ酸残基を含む。そこで、このアミノ酸配列をコードするのに必要な１２００ｂｐ以上の長さの塩基配列を有するコンティグを特定すればよい。これにより、完全長の標的遺伝子のコンティグを効率よく抽出することができる。

　本実施形態の方法において、塩基配列を決定する標的遺伝子は、対象細胞が発現する全遺伝子をｍＲＮＡの分子数が多いものから順に順位付けした場合の順位が１～１０位である遺伝子であることが好ましい。ｍＲＮＡの分子数が多く、上記の範囲にある標的遺伝子は、容易に塩基配列を決定することができる。

　あるいは、標的遺伝子の発現量は、５，０００ＦＰＫＭ（ｆｒａｇｍｅｎｔｓ　ｐｅｒ　ｋｉｌｏｂａｓｅ　ｏｆ　ｅｘｏｎ　ｐｅｒ　ｍｉｌｌｉｏｎ　ｍａｐｐｅｄ　ｆｒａｇｍｅｎｔｓ）以上であることが好ましい。この程度の発現量である標的遺伝子は、容易に塩基配列を決定することができる。標的遺伝子の発現量の上限に特に制限はないが、一般的に、３０，０００ＦＰＫＭ程度が上限である場合が多い。

　標的遺伝子としては、例えば、抗体遺伝子、Ｔ細胞受容体遺伝子、Ｂ細胞受容体遺伝子等が挙げられるがこれらに限定されない。

（抗体遺伝子）
　例えば、対象細胞が抗体産生細胞であり、標的遺伝子が抗体重鎖遺伝子であり、標的遺伝子の一部の塩基配列が抗体重鎖遺伝子の定常領域の一部の塩基配列であってもよい。あるいは、対象細胞が抗体産生細胞であり、標的遺伝子が抗体軽鎖遺伝子であり、標的遺伝子の一部の塩基配列が抗体軽鎖遺伝子の定常領域の一部の塩基配列であってもよい。

　近年、例えばスカンク等の、ゲノムの塩基配列が明らかにされていない動物を用いて抗体が作製される場合がある。このような場合、ゲノムの塩基配列を塩基配列決定の参照配列に用いることができない場合がある。本実施形態の方法によれば、参照配列が存在しない場合においても塩基配列を決定することができるため、このような場合においても抗体遺伝子の塩基配列を決定することができる。

　また、従来の抗体遺伝子の塩基配列の決定方法では、可変領域の塩基配列のみしか特定することができなかった。これに対し、本実施形態の方法によれば、定常領域も含めて標的遺伝子の塩基配列の全長を決定することができる。このため、実施例において後述するように、標的遺伝子が抗体遺伝子である場合、抗体のアイソタイプやサブクラスまで特定することができる。また、例えば、抗体遺伝子の体細胞突然変異による少数の変異体を検出すること等も可能である。

（Ｔ細胞受容体遺伝子）
　例えば、癌の養子免疫療法等において、Ｔ細胞受容体の塩基配列を決定する需要がある。そこで、例えば、対象細胞がＴ細胞であり、標的遺伝子がＴ細胞受容体遺伝子であり、標的遺伝子の一部の塩基配列がＴ細胞受容体遺伝子の定常領域の一部の塩基配列であってもよい。

（Ｂ細胞受容体遺伝子）
　例えば、対象細胞が未成熟なＢ細胞であり、標的遺伝子がＢ細胞受容体重鎖遺伝子であり、標的遺伝子の一部の塩基配列がＢ細胞受容体重鎖遺伝子の定常領域の一部の塩基配列であってもよい。あるいは、対象細胞が未成熟なＢ細胞であり、標的遺伝子がＢ細胞受容体軽鎖遺伝子であり、標的遺伝子の一部の塩基配列がＢ細胞受容体軽鎖遺伝子の定常領域の一部の塩基配列であってもよい。

（その他の標的遺伝子）
　標的遺伝子は、上記の遺伝子に限られず、任意の遺伝子であってもよい。本実施形態の方法により、例えば、任意の標的遺伝子について、ｓｉｎｇｌｅ　ｎｕｃｌｅｏｔｉｄｅ　ｖａｒｉａｎｔｓ（ＳＮＶｓ）、ｓｉｎｇｌｅ　ｎｕｃｌｅｏｔｉｄｅ　ｐｏｌｙｍｏｒｐｈｙｓｍｓ（ＳＮＰｓ）、ｉｎｓｅｒｔｉｏｎ／ｄｅｌｅｔｉｏｎ（Ｉｎｄｅｌ）、スプライシングバリアント等を容易に解析することができる。

　次に実施例を示して本発明を更に詳細に説明するが、本発明は以下の実施例に限定されるものではない。

［方法及び材料］
（細胞株）
　発明者らが樹立したハイブリドーマ細胞株（クローンＨＤ１、ＨＤ２、ＨＤ３及びＨＤ４）を実験に用いた。各ハイブリドーマは、１０％ウシ胎児血清（ＦＢＳ）、１．２％ペニシリン－ストレプトマイシン－グルタミン（ギブコ社）、１ｎｇ／ｍＬ　インターロイキン（ＩＬ）－６を添加したハイブリドーマ無血清培地（ギブコ社）、又は、１ｎｇ／ｍＬ　ＩＬ－６を添加したＧＩＴ培地（和光純薬）を使用して培養した。

（ｍＲＮＡ－ｓｅｑ）
　各ハイブリドーマ細胞株から、市販のキット（型式「ＡｌｌＰｒｅｐ　ＤＮＡ／ＲＮＡ　Ｍｉｎｉ　Ｋｉｔ」、キアゲン社）を使用して全ＲＮＡを調製した。１μｇの全ＲＮＡを使用し、市販のキット（型式「ＮＥＢＮｅｘｔ　Ｕｌｔｒａ　Ｄｉｒｅｃｔｉｏｎａｌ　ＲＮＡ　Ｌｉｂｒａｒｙ　Ｐｒｅｐ　Ｋｉｔ」、ニュー・イングランド・バイオラボ社）を用いてライブラリーを作製した。なお、このキットは、使用する全ＲＮＡを約０．１μｇにまで減らしてライブラリーを作製することができる。

　続いて、次世代シーケンサー（型式「ＨｉＳｅｑ１５００」、イルミナ社）を用いて、平均リード長５０ｂｐでペアードエンドシーケンシングによりｍＲＮＡ－ｓｅｑを行った。各ハイブリドーマ細胞株につき、それぞれ４０×１０^６リード以上のリード数の塩基配列データが得られた。

（ｍＲＮＡ－ｓｅｑデータ解析）
　取得されたリードは、発明者らのカスタムトランスクリプトーム参照配列に対してマッピングした。カスタムトランスクリプトーム参照配列は、マウストランスクリプト、ラットトランスクリプト、ラットイムノグロブリン重鎖（Ｉｇｈ）定常領域、イムノグロブリンλ軽鎖（Ｉｇｌ）定常領域及びイムノグロブリンκ軽鎖（Ｉｇｋ）定常領域の塩基配列を含んでいた。

　マッピングプログラムであるＢＷＡ－ＭＥＭを使用し、－ｔ　８　－Ｐ　－Ｌ　１００００のパラメータでリードをマッピングした。ＴＩＧＡＲ２プログラムはデフォルト設定で使用した。各遺伝子の発現レベルはＦＰＫＭ（ｆｒａｇｍｅｎｔｓ　ｐｅｒ　ｋｉｌｏｂａｓｅ　ｏｆ　ｅｘｏｎ　ｐｅｒ　ｍｉｌｌｉｏｎ　ｍａｐｐｅｄ　ｆｒａｇｍｅｎｔｓ）で定量した。

（デノボ・トランスクリプトーム・アセンブリ）
　全リード又は「ｆａｓｔｑ－ｓａｍｐｌｅ」プログラム（http://homes.cs.washington.edu/~dcjones/fastq-tools）によりサブサンプリングしたリードを、「Ｔｒｉｎｉｔｙ」プログラムを用いてデノボ・アセンブリした。ＣＰＵ及びｍａｘ－ｍｅｍｏｒｙパラメータはリード数に応じて変更した。例えば、４０×１０^６リードの場合、ＣＰＵパラメータは８、ｍａｘ－ｍｅｍｏｒｙパラメータは５２Ｇに設定した。また、例えば、１×１０^６リードの場合、ＣＰＵパラメータは２、ｍａｘ－ｍｅｍｏｒｙパラメータは１２Ｇに設定した。

　Ｉｇｈ及びＩｇｌ／Ｉｇｋをコードした塩基配列（ＣＤＳ）は、フィルタリング処理により、コンティグ（アセンブルした塩基配列）が、２０～３０ｂｐのＩｇｈ又はＩｇｌ／Ｉｇｋの定常領域に特徴的な塩基配列を含んでおり、かつ適切な長さ（Ｉｇｈの場合１２００ｂｐ超、Ｉｇｌ／Ｉｇｋの場合６００ｂｐ超）を有していた場合に抽出した。

（ＲＴ－ＰＣＲ）
　各ハイブリドーマのＲＮＡをフェノール／クロロホルム抽出により精製した。市販のキット（型式「ＰｒｉｍｅＳｃｒｉｐｔ（商標）ＩＩ　１ｓｔ　ｓｔｒａｎｄ　ｃＤＮＡ　Ｓｙｎｔｈｅｓｉｓ　Ｋｉｔ」、タカラバイオ社）を用いて逆転写反応を行った。酵素（型式「ＫＯＤ　Ｐｌｕｓ」、東洋紡社）及びサーマルサイクラーを用いてＰＣＲを行った。ＰＣＲ産物はゲル抽出により精製し、非特異的な増幅産物を除去した。その後サンガー法により塩基配列を決定した。ＰＣＲ使用したプライマーの塩基配列の配列番号を下記表１に示す。

［実験例１］
（ハイブリドーマのｍＲＮＡ－ｓｅｑ解析）
　ラットＢリンパ球とマウスミエローマ細胞株ＳＰ２との細胞融合により樹立したハイブリドーマ細胞株である、クローンＨＤ１、ＨＤ２、ＨＤ３及びＨＤ４のｍＲＮＡ－ｓｅｑをそれぞれ行った。平均リード長５０ｂｐでペアードエンドシーケンシングを行った。

　続いて、各トランスクリプトームの発現レベルをＢＷＡ－ＴＩＧＡＲ２プログラムにより定量し、発現レベルに応じて並べた。図１は、トランスクリプトームを発現レベルが高い順に並べたグラフである。

　その結果、全てのハイブリドーマクローンにおいて、Ｉｇｈ及びＩｇｌ／Ｉｇｋをコードした塩基配列は、発現量が１０，０００ＦＰＫＭ超であり、最も発現レベルが高いトランスクリプトに順位づけられることが明らかとなった。

　この結果は、ハイブリドーマのｍＲＮＡ－ｓｅｑデータが、Ｉｇｈ及びＩｇｌ／Ｉｇｋをコードした塩基配列を再構成するのに十分な数のリード数を有していることを示す。

［実験例２］
（ラットハイブリドーマのＩｇｈ及びＩｇｌ／Ｉｇｋの塩基配列のアセンブリ）
　実験例１で得られたｍＲＮＡ－ｓｅｑデータのデノボ・トランスクリプトーム・アセンブリにより、Ｉｇｈ及びＩｇｌ／Ｉｇｋの塩基配列の再構成を試みた。

　まず、Ｔｒｉｎｉｔｙプログラムを用いて、クローンＨＤ１のｍＲＮＡ－ｓｅｑデータから完全長トランスクリプトームの再構成を行った。ここで、リードのフィルタリングは行わなかった。リード数は４５，４０６，０４８リードであり、得られたコンティグ数は５８，８２２個であった。

　続いて、Ｉｇｈをコードする塩基配列をフィルタリングにより抽出した。フィルタリングでは、Ｉｇｈの定常領域に特徴的な２０～３０ｂｐの塩基配列を有するコンティグを抽出した。フィルタリングに用いた塩基配列の配列番号を下記表２に示す。

　完全長のＩｇＨは４００残基以上のアミノ酸を有している。そこで、１，２００ｂｐ以上の長さを有し、Ｉｇｈｇ２ｂに特徴的な２４ｂｐの塩基配列を含むＩｇｈの塩基配列として１，３９５ｂｐの塩基配列を特定した。同定されたＩｇｈの塩基配列は、サンガー法により塩基配列を決定したクローンＨＤ１のＩｇｈの塩基配列と同一であった。

　図２（ａ）は、デノボ・トランスクリプトーム・アセンブリにより塩基配列を決定したクローンＨＤ１のＩｇｈの塩基配列（配列番号２８）及び推定されるアミノ酸配列（配列番号２９）を示す図である。図２（ｂ）は、デノボ・トランスクリプトーム・アセンブリにより塩基配列を決定したクローンＨＤ１のＩｇＨタンパク質のアミノ酸配列と、既知のラットＩｇＨ（ＩｇＧ２ｂ）の定常領域のアミノ酸配列（アクセッション番号：ＡＡＡ６０７８、配列番号３０）とをアラインメントした図である。その結果、クローンＨＤ１が産生するＩｇＨのアミノ酸配列のうち第１３３～４６４番目が、既知のラットＩｇＨの定常領域のアミノ酸配列と一致することが明らかとなった。

　続いて、Ｉｇｌ／Ｉｇｋをコードする塩基配列をフィルタリングにより抽出した。フィルタリングでは、Ｉｇｌ／Ｉｇｋの定常領域に特徴的な２０～３０ｂｐの塩基配列を有するコンティグを抽出した。フィルタリングに用いた塩基配列の配列番号を下記表３に示す。

　完全長のＩｇＫは２００残基以上のアミノ酸を有している。そこで、６００ｂｐ以上の長さを有し、Ｉｇｋに特徴的な塩基配列を含むＩｇｋの塩基配列として７０５ｂｐの塩基配列を特定した。同定されたＩｇｋの塩基配列は、サンガー法により塩基配列を決定したクローンＨＤ１のＩｇｋの塩基配列と同一であった。

　図３（ａ）は、デノボ・トランスクリプトーム・アセンブリにより塩基配列を決定したクローンＨＤ１のＩｇｋの塩基配列（配列番号３１）及び推定されるアミノ酸配列（配列番号３２）を示す図である。図３（ｂ）は、デノボ・トランスクリプトーム・アセンブリにより塩基配列を決定したクローンＨＤ１のＩｇＫタンパク質のアミノ酸配列と、既知のラットＩｇＫの定常領域のアミノ酸配列（アクセッション番号：ＣＡＡ２４５５８、配列番号３３）とをアラインメントした図である。その結果、クローンＨＤ１が産生するＩｇＫのアミノ酸配列のうち第１２９～２３４番目が、既知のラットＩｇＫの定常領域のアミノ酸配列と一致することが明らかとなった。

　発明者らは、同様に、クローンＨＤ２（Ｉｇｈｇ２ａ／Ｉｇｋ）、クローンＨＤ３（Ｉｇｈｇ２ａ／Ｉｇｋ）、クローンＨＤ４（Ｉｇｈｇ２ａ／Ｉｇｋ）が産生する抗体の遺伝子の塩基配列も同定した。

　また、クローンＨＤ１～ＨＤ４が産生する抗体のアイソタイプは、ＥＬＩＳＡによるアイソタイピングアッセイの結果と一致することが確認された。以上の結果は、ｍＲＮＡ－ｓｅｑデータのデノボ・アセンブリにより、Ｉｇｈ遺伝子及びＩｇｌ／Ｉｇｋ遺伝子の塩基配列を簡便かつ正確に決定できることを示す。

［実験例３］
（マウスハイブリドーマのＩｇｈ及びＩｇｌ／Ｉｇｋの塩基配列のアセンブリ）
　実験例２と同様にして、マウスハイブリドーマであるクローン８Ａ２及び１３Ｃ７のＩｇｈ及びＩｇｋの塩基配列を決定した。マウスＩｇｈ及びＩｇｌ／Ｉｇｋのフィルタリングに用いた塩基配列の配列番号を下記表４に示す。

　その結果、縮重プライマーにコードされる領域を除いて、サンガー法により決定された、これらのモノクローナル抗体の塩基配列と一致することが確認された。この結果は、ｍＲＮＡ－ｓｅｑデータのデノボ・アセンブリにより、Ｉｇｈ遺伝子及びＩｇｌ／Ｉｇｋ遺伝子の塩基配列を簡便かつ正確に決定できることを更に支持するものである。また、縮重プライマーを用いた方法では、縮重プライマーのミスハイブリダイゼーションにより、本来の塩基配列が失われてしまう場合があることが確認された。

［実験例４］
（抗体遺伝子の塩基配列決定のためのデノボ・アセンブリ条件の最適化）
　ハイブリドーマのｍＲＮＡ－ｓｅｑデータを用いてＩｇｈ及びＩｇｌ／Ｉｇｋ遺伝子の塩基配列を決定する条件の最適化を試みた。まず、抗体遺伝子の塩基配列の決定に必要なリード数を検討した。

　具体的には、クローンＨＤ１～４のｍＲＮＡ－ｓｅｑの全リードから、それぞれ、５×１０^３リード、１０×１０^３リード、３０×１０^３リード、５０×１０^３リード、１００×１０^３リード、５００×１０^３リード、１０００×１０^３リードのリードをランダムにサブサンプリングした。

　続いて、これらのリードを用いてデノボ・アセンブリを２５回繰り返し実施した。続いて、全リードを用いて同定したＩｇｈ及びＩｇｌ／Ｉｇｋの塩基配列を正しい塩基配列であると定義し、完全な塩基配列を得ることができた成功率（再構成率）を算出した。

　図４（ａ）は、各リード数のリードからデノボ・アセンブリした場合のＩｇｈの再構成率を算出した結果を示すグラフである。その結果、４クローン全てにおいて、Ｉｇｈの塩基配列は３０×１０^３リード超のリード数で完全に同定することができることが明らかとなった。また、図４（ｂ）は、各リード数のリードからデノボ・アセンブリした場合のＩｇｋの再構成率を算出した結果を示すグラフである。その結果、４クローン全てにおいて、Ｉｇｋの塩基配列は１０×１０^３リード超のリード数で完全に同定することができることが明らかとなった。

　この結果は、今回の手法により限られた数のリード数のｍＲＮＡ－ｓｅｑデータから抗体遺伝子の塩基配列を正確に特定することができることを示す。図５は、今回の手法をまとめた図である。まず図５（ａ）及び（ｂ）に示すように、細胞からｍＲＮＡを抽出し、次世代シークエンシング（ＮＧＳ）により塩基配列を決定する。続いて、図５（ｃ）に示すように、ｍＲＮＡ－ｓｅｑにより得られたデータをデノボ・アセンブリしてコンティグを作成する。続いて、図５（ｄ）に示すように、特定の塩基配列を有するコンティグをフィルタリングして特定し、標的遺伝子の塩基配列を得る。

［実験例５］
（他のハイブリドーマが産生する抗体の遺伝子の塩基配列の決定）
　今回の塩基配列決定方法を、更に多数のハイブリドーマに適用し、抗体遺伝子の塩基配列を決定した。その結果、９６種類以上のハイブリドーマについて、１サンプルあたり２００×１０^３リードでｍＲＮＡ－ｓｅｑを行い、抗体遺伝子の塩基配列を正確に決定することができた。

Claims

　対象細胞が発現する標的遺伝子の塩基配列を決定する方法であって、
　前記対象細胞中のｍＲＮＡの塩基配列を網羅的に決定する工程と、
　決定された前記ｍＲＮＡの塩基配列のうち、前記標的遺伝子の一部の塩基配列を有する塩基配列を特定する工程と、
　を含み、特定された前記塩基配列が標的遺伝子の塩基配列である、方法。
　前記標的遺伝子は、前記対象細胞が発現する全遺伝子をｍＲＮＡの分子数が多いものから順に順位付けした場合の順位が１～１０位である、請求項１に記載の方法。
　前記対象細胞が抗体産生細胞であり、
　前記標的遺伝子が抗体重鎖遺伝子であり、前記標的遺伝子の一部の塩基配列が抗体重鎖遺伝子の定常領域の一部の塩基配列であるか、又は
　前記標的遺伝子が抗体軽鎖遺伝子であり、前記標的遺伝子の一部の塩基配列が抗体軽鎖遺伝子の定常領域の一部の塩基配列である、
　請求項１又は２に記載の方法。
　ｍＲＮＡの塩基配列を網羅的に決定する前記工程が、次世代シーケンシングにより行われる、請求項１～３のいずれか一項に記載の方法。
　次世代シーケンシングにおける塩基配列のリード数が５０，０００リード以下である、請求項４に記載の方法。