JP7030312B2 - 鋳型dna-プライマー関係性解析装置、鋳型dna-プライマー関係性解析方法、鋳型dna-プライマー関係性解析プログラム、鋳型dna-プライマー関係性評価装置、鋳型dna-プライマー関係性評価方法及び鋳型dna-プライマー関係性評価プログラム - Google Patents

鋳型dna-プライマー関係性解析装置、鋳型dna-プライマー関係性解析方法、鋳型dna-プライマー関係性解析プログラム、鋳型dna-プライマー関係性評価装置、鋳型dna-プライマー関係性評価方法及び鋳型dna-プライマー関係性評価プログラム Download PDF

Info

Publication number
JP7030312B2
JP7030312B2 JP2020504642A JP2020504642A JP7030312B2 JP 7030312 B2 JP7030312 B2 JP 7030312B2 JP 2020504642 A JP2020504642 A JP 2020504642A JP 2020504642 A JP2020504642 A JP 2020504642A JP 7030312 B2 JP7030312 B2 JP 7030312B2
Authority
JP
Japan
Prior art keywords
primer
template dna
collation
relationship
bases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020504642A
Other languages
English (en)
Other versions
JPWO2019171601A1 (ja
Inventor
大二 遠藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EDUCATIONAL CORPORATION RAKUNO GAKUEN
Original Assignee
EDUCATIONAL CORPORATION RAKUNO GAKUEN
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EDUCATIONAL CORPORATION RAKUNO GAKUEN filed Critical EDUCATIONAL CORPORATION RAKUNO GAKUEN
Publication of JPWO2019171601A1 publication Critical patent/JPWO2019171601A1/ja
Application granted granted Critical
Publication of JP7030312B2 publication Critical patent/JP7030312B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M1/00Apparatus for enzymology or microbiology

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Sustainable Development (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

本発明は、鋳型DNAに対するプライマーの増幅可能性を解析する技術に関する。
従来、DNAを増幅するための原理として、PCR(Polymerase Chain Reaction:ポリメラーゼ連鎖反応)が存在する。PCRは少量のDNAであっても適切なプライマーが用いられていれば大量に増幅することができる増幅方法である。
図11は、PCRの手順を示した説明図である。図11(a)は、増幅を行いたい二本鎖鋳型DNAのうち増幅を行いたい領域(プライミング領域)を設定する段階を表している。そして、二本鎖鋳型DNAを2本の一本鎖鋳型DNAへと変化させた場合に、設定したプライミング領域の端点において一方の一本鎖鋳型DNAの端点に結合させたいプライマー(これをフォワードプライマー(fプライマー)という)と、他方の一本鎖鋳型DNAの端点に結合させたいプライマー(これをリバースプライマー(rプライマー)という)の2つのプライマーを用意する。
図11(b)は、実際のPCRの手順を表しており、二本鎖鋳型DNAに熱を加えて熱変性させることで、二重らせん構造の塩基間の水素結合が切断されて2本の一本鎖鋳型DNAを得るプロセスを表している。
図11(c)は、2本の一本鎖鋳型DNAを得た後、温度を下げていくと、反応液に含まれるfプライマーとrプライマーがそれぞれ一本鎖鋳型DNAに結合する。fプライマー及びrプライマーは、一本鎖鋳型DNAよりも塩基数が少なく数も多いことから、一本鎖鋳型DNAが再び二本鎖鋳型DNAに戻るよりも早く一本鎖鋳型DNAに対して結合することになる。一本鎖鋳型DNAにfプライマー又はrプライマーが結合した状態で、温度をDNAポリメラーゼの活性が至適となる温度帯まで上昇させると、DNAポリメラーゼによる合成反応によって、fプライマー又はrプライマーが結合した部分を起点として一本鎖DNA部分と相補的なDNAが合成される。DNAがDNAポリメラーゼにより複製される際、デオキシリボースの3’位の水酸基にヌクレオチドのリン酸基を結合させることでDNAを伸長させていく。すなわち、デオキシリボースの5’位から3’位の方向に方向性を持って伸長していく性質を持っているため、fプライマー又はrプライマーが結合した位置から5’位から3’位の方向に順次相補鎖が形成されていくことになる。
図11(b)のステップ及び図11(c)のステップを終えると、元の二本鎖鋳型DNAのうちプライミング領域部分が2倍となって2つの二本鎖鋳型DNAとなり、増殖が成功する。この処理をn回繰り返すと、プライミング領域部分を2倍に増幅することができる。図11(d)は、処理を3回繰り返すことで元の二本鎖鋳型DNAのうちプライミング領域部分を2倍の8倍に増幅した状態を表している。
PCRについて記載されたものとしては、例えば、特許文献1が存在する。この特許文献1には、PCR法によってDNAの塩基配列を増幅させるために用いるプライマーセットを、増幅対象生物のDNAにおける増幅対象領域を増幅させるためのフォワードプライマー及びリバースプライマーの少なくとも一方の塩基配列が、非増幅対象生物のDNAの塩基配列と、12塩基以上連続で重ならないように作製することを特徴とするプライマーの作製方法が開示されている。
特開2013-017416号公報
PCRを行う場合、増幅を行いたい領域のみを増幅させ、他の領域に結合する可能性のないfプライマー及びrプライマーを選定することが最も望まれる状態であるが、現実には、プライミング領域以外の箇所で鋳型DNAとプライマーが結合してしまったり、プライマー自身又はプライマー間で結合が生じてしまったり、DNA断片であるマイクロRNAなどと結合してしまったりなど、意図しない結合が生じて、プライミング領域の増幅が上手くいかない状況が発生することがある。複数種類のDNAが存在する状況においては一層意図しない結合の可能性は高まる。前記特許文献1は、非増幅対象生物のDNAの塩基配列と12塩基以上連続で重ならないことを条件として挙げているが、非増幅対象生物のDNAの塩基配列の全ての箇所に対してこの条件を満たすことは容易ではない。
本発明は、上記問題点に鑑みなされたものであり、鋳型DNAに対するプライマーの増幅可能性を解析又は評価するための鋳型DNA-プライマー関係性解析装置、鋳型DNA-プライマー関係性解析方法、鋳型DNA-プライマー関係性解析プログラム、鋳型DNA-プライマー関係性評価装置、鋳型DNA-プライマー関係性評価方法及び鋳型DNA-プライマー関係性評価プログラムを提供することを課題とする。
本発明に係る鋳型DNA-プライマー関係性解析装置は、鋳型DNAの塩基配列情報を取得する鋳型DNA塩基配列取得部と、プライマーの塩基配列情報を取得するプライマー塩基配列取得部と、鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマー(以下、照合対象という)に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列(以下、単語という)として生成する結合可能位置コード化処理部と、前記結合可能位置コード化処理部において生成された全ての単語についてトピックモデルを用いて複数のトピックに分類する処理を行う単語分類処理部とを備えることを特徴とする。
また、本発明に係る鋳型DNA-プライマー関係性解析装置は、前記照合単位所定数塩基は、3個~8個の塩基としたことを特徴とする。
また、本発明に係る鋳型DNA-プライマー関係性解析装置は、前記所定のコードは、鋳型DNAのプライミング領域と、プライミング領域以外の鋳型DNAの領域と、プライマー自身又はプライマー間での結合の場合の領域とで、異なるコードを用いるようにしたことを特徴とする。
本発明に係る鋳型DNA-プライマー関係性解析方法は、鋳型DNAの塩基配列情報を取得する鋳型DNA塩基配列取得手順と、プライマーの塩基配列情報を取得するプライマー塩基配列取得手順と、鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマー(以下、照合対象という)に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列(以下、単語という)として生成する結合可能位置コード化処理手順と、前記結合可能位置コード化処理手順において生成された全ての単語に対してトピックモデルを用いた分類処理を行う単語分類処理手順とを含むことを特徴とする。
本発明に係る鋳型DNA-プライマー関係性解析プログラムは、鋳型DNAとプライマーの関係性を解析する処理をコンピュータに実現させるための鋳型DNA-プライマー関係性解析プログラムであって、前記コンピュータに、鋳型DNAの塩基配列情報を取得する鋳型DNA塩基配列取得機能と、プライマーの塩基配列情報を取得するプライマー塩基配列取得機能と、鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマー(以下、照合対象という)に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列(以下、単語という)として生成する結合可能位置コード化処理機能と、前記結合可能位置コード化処理機能において生成された全ての単語に対してトピックモデルを用いた分類処理を行う単語分類処理機能とを実現させることを特徴とする。
本発明に係る鋳型DNA-プライマー関係性評価装置は、評価対象の鋳型DNAの塩基配列情報を取得する鋳型DNA塩基配列取得部と、評価対象のプライマーの塩基配列情報を取得するプライマー塩基配列取得部と、前記鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマー(以下、照合対象という)に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列(以下、単語という)として生成する結合可能位置コード化処理部と、前記結合可能位置コード化処理部において生成された単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率として出力する処理を行う単語分類処理部と、前記評価対象の鋳型DNAと既知のプライマーとの間で予め行われた少なくとも1以上のPCR実験によって得られた各プライマーの増幅成功率情報を、当該PCR実験に用いた前記鋳型DNAとプライマーに対して結合可能位置コード化処理及び単語分類処理を行うことで得られた複数トピックへの分類結果に対して反映させることで、各トピックの増幅成功率を表した増幅成功率反映済分類データを作成して予め記憶手段に記憶させておき、前記評価対象の鋳型DNAと前記評価対象のプライマーに関して前記単語分類処理部において出力されたトピック毎の所属可能性を表す確率を前記記憶手段に記憶された当該鋳型DNAに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型DNAに対する増幅成功率を予測して評価するプライマー評価処理部とを備えることを特徴とする。
本発明に係る鋳型DNA-プライマー関係性評価方法は、評価対象の鋳型DNAの塩基配列情報を取得する鋳型DNA塩基配列取得手順と、評価対象のプライマーの塩基配列情報を取得するプライマー塩基配列取得手順と、前記鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマー(以下、照合対象という)に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列(以下、単語という)として生成する結合可能位置コード化処理手順と、前記結合可能位置コード化処理手順において生成された単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率として出力する処理を行う単語分類処理手順と、前記評価対象の鋳型DNAと既知のプライマーとの間で予め行われた少なくとも1以上のPCR実験によって得られた各プライマーの増幅成功率情報を、当該PCR実験に用いた前記鋳型DNAとプライマーに対して結合可能位置コード化処理及び単語分類処理を行うことで得られた複数トピックへの分類結果に対して反映させることで、各トピックの増幅成功率を表した増幅成功率反映済分類データを作成して予め記憶手段に記憶させておき、前記評価対象の鋳型DNAと前記評価対象のプライマーに関して前記単語分類処理手順において出力されたトピック毎の所属可能性を表す確率を前記記憶手段に記憶された当該鋳型DNAに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型DNAに対する増幅成功率を予測して評価するプライマー評価処理手順とを含むことを特徴とする。
本発明に係る鋳型DNA-プライマー関係性評価プログラムは、鋳型DNAとプライマーの関係性を評価する処理をコンピュータに実現させるための鋳型DNA-プライマー関係性評価プログラムであって、前記コンピュータに、評価対象の鋳型DNAの塩基配列情報を取得する鋳型DNA塩基配列取得機能と、評価対象のプライマーの塩基配列情報を取得するプライマー塩基配列取得機能と、前記鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマー(以下、照合対象という)に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列(以下、単語という)として生成する結合可能位置コード化処理機能と、前記結合可能位置コード化処理機能において生成された単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率として出力する処理を行う単語分類処理機能と、前記評価対象の鋳型DNAと既知のプライマーとの間で予め行われた少なくとも1以上のPCR実験によって得られた各プライマーの増幅成功率情報を、当該PCR実験に用いた前記鋳型DNAとプライマーに対して結合可能位置コード化処理及び単語分類処理を行うことで得られた複数トピックへの分類結果に対して反映させることで、各トピックの増幅成功率を表した増幅成功率反映済分類データを作成して予め記憶手段に記憶させておき、前記評価対象の鋳型DNAと前記評価対象のプライマーに関して前記単語分類処理機能において出力されたトピック毎の所属可能性を表す確率を前記記憶手段に記憶された当該鋳型DNAに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型DNAに対する増幅成功率を予測して評価するプライマー評価処理機能とを実現させることを特徴とする。
本発明によれば、鋳型DNAの塩基配列情報を取得し、プライマーの塩基配列情報を取得し、鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマーに対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列からなる単語を生成し、生成された全ての単語についてトピックモデルを用いて複数のトピックに分類する処理を行うようにしたので、単語の内容と単語の分類結果に基づいて、鋳型DNAのプライミング領域に対するプライマーの結合可能性の解析の他、プライミング領域以外の領域において意図しない結合が生じる可能性についても解析することができ、実際のPCRの実験を行う前に、鋳型DNAに対するプライマーの適合性を検証するための材料を得ることが可能となる。
また、本発明によれば、評価対象のプライマーに関する単語分類結果から生成したトピックは、増幅成功率反映済分類データが存在しない場合においては、予備的にPCRプライマーを選定するために使用可能である。すなわち、鋳型DNAに対して増幅可能性が未知である多数のプライマーセットについて、本発明に係る鋳型DNA-プライマー関係性解析装置によって、各プライマーセットと鋳型DNAから単語群を生成して、トピックモデルを用いてそれらの単語群を複数のトピックに分類するとともに、当該プライマーセットから生成した単語群が所属する可能性が最も高いトピックを決定する作業を行うようにする。これらの作業を実行すると、各プライマーセットからそれぞれ生成された単語群が複数トピックに分類され、かつ、各プライマーセットのそれぞれが所属する可能性の最も高いトピックが決定される。このように、多数のプライマーセットを分類してから、増幅可能性の高そうなトピックに所属するプライマーセットから優先して実際のPCR実験を行うようにする。このような手順を踏むことで、増幅に成功するプライマーセットを発見するまでの時間及び費用を削減することが可能となる。これにより、未実施のプライマーについて実際のPCR実験を行う前に増幅可能性を知ることができるため、増幅成功率反映済分類データが存在しない場合においても、PCR実験を行わない段階において有効なプライマーを絞り込むことが可能となる。
また、本発明によれば、評価対象のプライマーに関する単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率を増幅成功率反映済分類データと照合することで、鋳型DNAに対する評価対象のプライマーの増幅可能性に関する評価を出力することが可能となる。これにより、未実施のプライマーについて実際のPCR実験を行う前に増幅可能性を知ることができるため、PCR実験を行わない段階において有効なプライマーを絞り込むことが可能となる。
本発明に係る鋳型DNA-プライマー関係性解析装置10の構成を表したブロック図である。 鋳型DNA-プライマー関係性解析装置10を実現するために必要とされるハードウェア構成を表したブロック図である。 鋳型DNA-プライマー関係性解析装置10における結合可能位置コード化処理の概念を説明するための説明図である。 結合可能位置コード化処理において、結合関係が成立する位置に対して適用する変換コードの一例を表した表である。 鋳型DNA-プライマー関係性解析装置10における結合可能位置コード化処理の流れを表したフローチャート図である。 本発明に係る鋳型DNA-プライマー関係性評価装置20の構成を表したブロック図である。 同一の鋳型DNAと様々なプライマーセットとから生成された複数の単語と、鋳型DNAとプライマーセットの各組合せのPCR実験の結果を示した一例としての説明図である。 増幅成功率反映済分類データの一例を表した説明図である。 鋳型DNA-プライマー関係性評価装置20における関係性評価処理の流れを表したフローチャート図である。 OE-PCRの手順を示した説明図である。 PCRの手順を示した説明図である。
[第1の実施の形態]
以下、図面を参照しながら、第1の実施の形態に係る鋳型DNA-プライマー関係性解析装置の例について説明する。図1は、本発明に係る鋳型DNA-プライマー関係性解析装置10の構成を表したブロック図である。
なお、鋳型DNA-プライマー関係性解析装置10は、専用マシンとして設計した装置であってもよいが、一般的なコンピュータによって実現可能なものであるものとする。図2は、鋳型DNA-プライマー関係性解析装置10を実現するために必要とされるハードウェア構成を表したブロック図である。この図2に示すように、鋳型DNA-プライマー関係性解析装置10は、一般的なコンピュータが通常備えているであろうCPU(Central Processing Unit:中央演算処理装置)51と、GPU(Graphics Processing Unit:画像処理装置)52と、メモリ53と、ハードディスクドライブ、SSD(solid state drive)等のストレージ54とを備えており、また、マウス、キーボード等の入力装置55と、ディスプレイ、プリンタ等の出力装置56と、通信ネットワークと接続するための通信装置57とを備えており、これらがバス58を介して接続されているものとする。本発明に係る鋳型DNA-プライマー関係性解析装置10は、図2に示すCPUを含む各種ハードウェアと同等の構成によって鋳型DNA-プライマー関係性解析装置10の各部の構成における処理を実現するものとする。
また、以下に説明する鋳型DNA-プライマー関係性解析装置10の構成要素を全て鋳型DNA-プライマー関係性解析装置10自身が備えている必要はなく、一部構成を他の装置に備えさせる、例えば、通信ネットワークを介して接続可能なサーバ装置に一部の構成を備えさせるようにして、鋳型DNA-プライマー関係性解析装置10が通信を行いながらサーバ装置に備えられた構成を利用するものであってもよい。
図1に示すように、鋳型DNA-プライマー関係性解析装置10は、鋳型DNA塩基配列取得部11と、プライマー塩基配列取得部12と、結合可能位置コード化処理部13と、単語分類処理部14と、記憶部15とを少なくとも備えている。
鋳型DNA塩基配列取得部11は、PCRによって増幅を行いたい領域(プライミング領域)を含む鋳型DNAの塩基配列情報を取得する機能を有する。この鋳型DNA塩基配列取得部11では、鋳型DNAの全体の塩基配列情報を取得するとともに、増幅を行いたい領域が何塩基目から何塩基目までであるのかを指定する情報も併せて取得する。
プライマー塩基配列取得部12は、PCRを行う際に用いるプライマーの塩基配列情報を取得する機能を有する。ここで取得するプライマーの塩基配列情報は、鋳型DNAを熱処理して2つの一本鎖鋳型DNAとした場合の一方の一本鎖鋳型DNAに結合させるfプライマーと、他方の一本鎖鋳型DNAに結合させるrプライマーとの両方についての塩基配列情報が含まれる。
結合可能位置コード化処理部13は、鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマー(以下、照合対象という)に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列(以下、単語ともいう)として生成する機能を有する。この結合可能位置コード化処理部13においては、プライミング領域での増幅を狙って使用される2つのプライマーが結合する可能性のある位置を照合によって探索して、結合可能性のある位置における関係性を所定のコードに変換する処理である。
図3は、鋳型DNA-プライマー関係性解析装置10における結合可能位置コード化処理の概念を説明するための説明図である。図3(a)は、鋳型DNAとプライマーの理想的結合位置の例を表した説明図である。二本鎖の間が水素結合して二重らせん構造をとっている鋳型DNAは、例えば、図3(a)において(1)及び(2)として示したように、PCRの熱処理の過程で2つの一本鎖鋳型DNAに分離される。なお、2つの一本鎖鋳型DNAの塩基数を60としているが、簡易的に説明するためであり、これに限定されるものではない。鋳型DNAにはプライミング領域が設定してあり、一方の一本鎖鋳型DNAにおけるプライミング領域の端部に結合するように設定されるプライマーであるfプライマーと、他方の一本鎖鋳型DNAにおけるプライミング領域の端部に結合するように設定されるプライマーであるrプライマーとが選択される。fプライマーとrプライマーの塩基数を10としているが、簡易的に説明するためであり、これに限定されるものではない。図3(a)の例では、fプライマーの10塩基とrプライマーの10塩基は、それぞれが相対する一本鎖鋳型DNAとの理想的結合位置において全10塩基が結合する関係性にある。ここで、結合する関係性とは、DNAを構成する塩基であるアデニン(A)、グアニン(G)、チミン(T)、シトシン(C)の4つのうち、塩基AとT、GとCがそれぞれ水素結合によって相補的結合をする関係にあることをいう。
図3(b)は、プライマーから照合単位所定数塩基を抽出例として、照合単位5塩基を抽出する場合を例に挙げた説明図である。対象のプライマーをfプライマーの「gcaacttctc」とすると、最初に先頭の塩基から5塩基を抽出して、照合単位5塩基として[1]gcaacを抽出する。その後、順次1塩基ずつずらしながら照合単位5塩基を抽出する。すると、図3(b)に示すように、10塩基からなるfプライマーからは6パターンの照合単位5塩基が抽出されることが分かる。図3(b)の例は10塩基のプライマーについての例であるが、20塩基のプライマーから照合単位5塩基を抽出する場合には16パターンの照合単位5塩基が抽出され、プライマーの塩基数に応じて変化する。
図3(c)は、鋳型DNAに対する照合単位5塩基の照合の例を表した説明図である。一例として、(1)の一本鎖鋳型DNAに対して照合単位5塩基の[1]gcaacを照合する例を挙げている。先ず、一本鎖鋳型DNAの3’側の1塩基目に[1]gcaacの5’側の1塩基目が相対する位置関係において照合を行う。一本鎖鋳型DNAの3’側の1塩基目から5塩基目まではプライミング領域から外れた領域であるが、プライミング領域以外の箇所に対しても照合処理を行う。すると、1塩基目はgとcであるため結合する関係性となっているが、残りの4塩基については結合する関係性となっていない。結合可能位置コード化処理部13では、所定数のうち過半数以上の位置で結合関係が成立する場合に所定のコードに変換する、すなわち、5塩基中3塩基以上において結合関係が成立する場合にコード化するので、この1塩基目についてはコードを生成しないことになる。次に、一本鎖鋳型DNAの3’側の2塩基目に[1]gcaacの1塩基目が相対する位置関係において照合を行うというように、一本鎖鋳型DNAの5’側に順次1塩基ずつずらしながら照合を行っていき、5塩基中3塩基以上において結合関係が成立する場合にコードを生成する。図3(c)の例では、一本鎖鋳型DNAの3’側の6塩基目に[1]gcaacの5’側の1塩基目が相対する位置関係において、プライミング領域での照合処理となり、5塩基全てで結合関係が成立するため、予め定められた所定のコード変換規則に基づいて、この相対する5塩基の関係性についてコードを生成する。このようにして、一本鎖鋳型DNAの最後の塩基まで(一本鎖鋳型DNAの5’側端部と[1]gcaacの3’側端部が照合される位置関係まで)照合処理を行って、コード生成可能な結合可能位置においてコードを生成する。他の[2]~[6]の照合単位5塩基についても同様に結合可能位置コード化処理を実行する。
図3は、一方の一本鎖鋳型DNAに対してfプライマーから抽出された6パターンの照合単位5塩基を照合する場合をしめしたが、他方の一本鎖鋳型DNAに対しても照合処理を行い、また、2つのfプライマーとrプライマーに対しても同様に照合処理を行う。そして、もう一方のrプライマーからも照合単位5塩基を抽出して、同様の結合可能位置コード化処理を実行する。
図4は、結合可能位置コード化処理において、結合関係が成立する位置に対して適用する変換コードの一例を表した表である。先ず、変換コードは、照合単位5塩基が相対する領域によって適用するコードを区別している。具体的には、鋳型DNAのプライミング領域と、プライミング領域以外の鋳型DNAの領域と、プライマー自身又はプライマー間での結合の場合の領域とに分けている。鋳型DNAのプライミング領域における結合関係に対しては大文字のアルファベットをコードとして使用し、プライミング領域以外の鋳型DNAの領域における結合関係に対しては小文字のアルファベットをコードとして使用し、プライマー自身又はプライマー間での結合の場合の領域における結合関係に対しては数字及び上記で未使用の小文字のアルファベットをコードとして使用している。全ての領域において、AとTの結合する関係性に対しては、照合対象と照合単位5塩基の何れの側にAとTのどちらの塩基が存在するかに関わらず同じコードを使用し、GとCの結合する関係性に対しては、照合対象と照合単位5塩基の何れの側にGとCのどちらの塩基が存在するかに関わらず同じコードを使用している。他の関係性については、それぞれオリジナルのコードを使用している。
図4の変換コードを用いると、図3(c)の6塩基目に照合した例では、「BBAAB」というコードが生成される。このとき、プライミング領域において生成されたコードについては所定倍の数だけ、例えば3倍の数だけコードを生成するようにする。これは、プライミング領域での結合関係を他の領域の結合関係よりも評価を高くするための工夫である。また、プライマー自身又はプライマー間での結合は即座に避けたい結合関係であるため、これを発見し易いように、プライマー自身又はプライマー間での結合に対するコードについても所定倍の数だけ、例えば3倍の数だけコードを生成するようにする。ここで挙げた倍数はあくまで例示であり、他の倍率であってもよい。なお、照合単位所定数塩基の塩基数と同数のコードで表現された結合関係を表す文字列を、以下、単語と表現するものとする。図3(c)で生成された5つのコードで表された文字列「BBAAB」は単語である。この他にも、例えば、プライミング領域以外の鋳型DNAの領域における結合関係については、「babba」といった単語が生成される可能性があり、プライマー自身又はプライマー間での結合関係については、「12142」といった単語が生成される可能性がある。
単語分類処理部14は、結合可能位置コード化処理部13において生成された全ての単語についてトピックモデルを用いて複数のトピックに分類する処理を行う機能を有する。トピックモデルは、確率モデルの一種であり、文章中の単語を複数トピックに分類することで当該文章がどのような内容のトピックを含むかを分析することに用いられるモデルである。本例では、結合可能位置コード化処理部13において生成された全ての単語(コードで表された文字列)を複数のトピックに分類する処理についてトピックモデルを用いて実行する。トピックモデルは、例えば、LDA(Latent Dirichlet Allocation)を用いることができ、実装するためのプログラムとしては、例えば、gensimなどの様々な既存のソフトウェアを利用することができる。分類の際のトピック数については、使用者が任意のトピック数を指定できる構成としてもよい。また、最適なトピック数についてパープレキシティ(perplexity)やカバレージ(coverage)などの指標を用いて評価を行って決定するようにしてもよい。この単語分類処理部14によって分類することにより、結合可能位置コード化処理部13において生成された全ての単語は、確率的に何れかのトピックに分類されることになる。また、トピックモデルは、単語の分類機能に加えて、分類対象の単語群が何れのトピックに該当する可能性が最も高いかを出力する機能を備える。単語群が所属するトピックの可能性について、トピック毎の該当可能性の割合(%)を出力することができる。
記憶部15は、各部の処理に必要な各種データや、各部における処理の結果として得られたデータを記憶させる機能を有する。例えば、鋳型DNA塩基配列取得部11で取得した鋳型DNAの塩基配列情報、プライマー塩基配列取得部12で取得したプライマーの塩基配列情報などをこの記憶部16に記憶させるようにし、また、結合可能位置コード化処理部13において生成したコードで表現された文字列である単語や、単語分類処理部14における分類結果などについて記憶部16に記憶させるようにしてもよい。
次に、鋳型DNA-プライマー関係性解析装置10における結合可能位置コード化処理の流れについて説明を行う。図5は、鋳型DNA-プライマー関係性解析装置10における結合可能位置コード化処理の流れを表したフローチャート図である。この図5において、先ず、鋳型DNA-プライマー関係性解析装置10は、鋳型DNAの塩基配列情報の取得を行う(S101)。また、鋳型DNA-プライマー関係性解析装置10は、プライマーの塩基配列情報の取得についても行う(S102)。ここで塩基配列情報を取得するプライマーは、fプライマーとrプライマーの2つである。
次に、鋳型DNA-プライマー関係性解析装置10は、塩基配列情報を取得したプライマーの1つについて照合単位5塩基に分割して最初の照合単位5塩基を選択する(S103)。選択された照合単位5塩基を照合する照合対象として、鋳型DNAから得られる2つの一本鎖DNA及び2つのプライマーのうち未選択の1つを選択する(S104)。鋳型DNA-プライマー関係性解析装置10は、選択された照合対象の先頭の塩基から順次1塩基ずつずらしながら照合単位5塩基を照合し、照合位置にて5塩基中3塩基以上で結合関係が成立する場合には、当該照合位置での相対する5塩基の関係性を所定のコードに変換する(S105)。そして、鋳型DNA-プライマー関係性解析装置10は、選択中の照合対象の最後まで現在の照合単位5塩基との照合が完了したかを判定する(S106)。照合対象の最後まで照合が完了していない場合(S106-N)には、S105及びS106のステップを繰り返す。照合対象の最後まで照合が完了した場合(S106-Y)には、S107のステップに移行する。
S107のステップでは、最後の照合単位5塩基について照合完了したか否かを判定する(S107)。最後の照合単位5塩基について照合完了していない場合(S107-N)には、照合単位5塩基を次の選択肢に切り替えてから(S108)、ステップS105、S106の処理を繰り返す。そして、ステップS105~S108を繰り返して、最後の照合単位5塩基についての照合が完了した場合(S107-Y)には、次のS109のステップに移行する。
S109のステップでは、全ての照合対象について照合が完了したかを判定する(S109)。全ての照合対象について照合が完了していない場合(S109-N)には、ステップS103に戻り、ステップS104において処理対象を変更してから、ステップS105~S108の処理を繰り返す。そして、ステップS105~S108を繰り返して、全ての照合対象について照合が完了した場合(S109-Y)には、全てのプライマーについて照合単位5塩基に分割しての照合処理を完了したか否かを判定する(S110)。全てのプライマーについて照合単位5塩基に分割しての照合処理を完了していない場合(S110-N)には、未処理のプライマーを選択(S111)した上で、ステップS103に戻る。ステップS103~S109の処理を繰り返して、未処理のプライマーについて照合単位5塩基に分割しての照合処理を完了した場合(S110-Y)には、コード化で生成された全ての単語を記憶部に記憶させて(S112)、処理を終了する。
以上のように、本発明に係る鋳型DNA-プライマー関係性解析装置10によれば、鋳型DNAの塩基配列情報を取得し、プライマーの塩基配列情報を取得し、鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマーに対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列からなる単語を生成し、生成された全ての単語についてトピックモデルを用いて複数のトピックに分類する処理を行うようにしたので、単語の内容と単語の分類結果に基づいて、鋳型DNAのプライミング領域に対するプライマーの結合可能性の解析の他、プライミング領域以外の領域において意図しない結合が生じる可能性についても解析することができ、実際のPCRの実験を行う前に、鋳型DNAに対するプライマーの適合性を検証するための材料を得ることが可能となる。
また、鋳型DNAに対して増幅可能性が未知である多数のプライマーセット、例えば、100種類のプライマーセットから最適な候補を選択したいような場合に、100種類全てについてPCR実験を行うことは大変な労力である。そこで、本発明に係る鋳型DNA-プライマー関係性解析装置10によって、各プライマーセットと鋳型DNAから単語群を生成して、トピックモデルを用いてそれらの単語群を複数のトピックに分類するとともに、当該プライマーセットから生成した単語群が所属する可能性が最も高いトピックを決定する作業を行うようにする。これらの作業を実行すると、100種類のプライマーセットからそれぞれ生成された単語群が複数トピックに分類され、かつ、100種類のプライマーセットのそれぞれが所属する可能性の最も高いトピックが決定される。このように100種類のプライマーセットを分類してから、増幅可能性の高そうなトピックに所属するプライマーセットから優先して実際のPCR実験を行うようにする。このような手順を踏むことで、増幅に成功するプライマーセットを発見するまでの時間及び費用を削減することが可能となる。
[第2の実施の形態]
以下、図面を参照しながら、第2の実施の形態に係る鋳型DNA-プライマー関係性評価装置の例について説明する。図6は、本発明に係る鋳型DNA-プライマー関係性評価装置20の構成を表したブロック図である。なお、鋳型DNA-プライマー関係性評価装置20は、専用マシンとして設計した装置であってもよいが、一般的なコンピュータによって実現可能なものであるものとし、その場合、第1の実施の形態と同様、図2に示すハードウェア構成と同等の構成に基づいて実現することができる。
図6に示すように、鋳型DNA-プライマー関係性評価装置20は、鋳型DNA塩基配列取得部11と、プライマー塩基配列取得部12と、結合可能位置コード化処理部13と、単語分類処理部14と、プライマー評価処理部21と、記憶部22とを少なくとも備えている。なお、第1の実施の形態と同一符号を付した構成については、第1の実施の形態と同様の機能を持った構成であるので、説明を省略する。
なお、第1の実施の形態においては、単語分類処理部14の機能として、結合可能位置コード化処理部13において生成された全ての単語についてトピックモデルを用いて複数のトピックに分類する処理を行う機能と、分類対象の単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、各トピック毎の所属可能性を表す確率として出力する機能との2つの機能を備えることを説明したが、この第2の実施の形態においては、後者の機能を用いるものとし、単語群が所属するトピックの可能性についてトピック毎の所属可能性の割合(%)を出力する機能を用いるものとする。
プライマー評価処理部21は、評価対象の鋳型DNAと評価対象のプライマーに関して単語分類処理部14において出力されたトピック毎の所属可能性を表す確率を、記憶手段に記憶された当該鋳型DNAに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型DNAに対する増幅成功率を予測して評価する機能を有する。ここで、増幅成功率反映済分類データとは、評価対象の鋳型DNAと既知のプライマーとの間で予め行われた少なくとも1以上のPCR実験によって得られた各プライマーの増幅成功率情報を、トピックモデルによって分類する際の複数トピックのうちの何れかのトピックに対して反映させることで、各トピックの増幅成功率を表したデータのことをいう。この増幅成功率反映済分類データは、同じ鋳型DNAに対する複数のプライマーセットによる分類結果及びPCR実験での増幅成功率情報を同じ増幅成功率反映済分類データとして記録することもできるし、複数の鋳型DNAに対する複数のプライマーセットによる分類結果及びPCR実験での増幅成功率情報を同じ増幅成功率反映済分類データとして記録することもできる。複数のプライマーセットについての増幅成功率情報が分類結果に反映されることで、精度の高い増幅成功率の予測が可能となる。この増幅成功率反映済分類データは、予め記憶部22に記憶させておく。
記憶部22は、第1の実施の形態における記憶部16と同様の対象を記憶する機能を有することに加えて、増幅成功率反映済分類データを記憶させておく機能を有する。増幅成功率反映済分類データは、複数の鋳型DNAそれぞれについて予め作成して記憶させておき、プライマー評価処理部21における照合処理において、評価対象の鋳型DNAが指定された段階で対応する増幅成功率反映済分類データを読み出して照合に利用する。また、増幅成功率反映済分類データは、鋳型DNAごとに保持する場合に限らず、様々な鋳型DNAと様々なプライマーセットとの関係性についての評価情報を1つの増幅成功率反映済分類データに反映させたものを記憶させておくようにしてもよい。
図7は、同一の鋳型DNAと様々なプライマーセットとから生成された複数の単語と、鋳型DNAとプライマーセットの各組合せのPCR実験の結果を示した一例としての説明図である。この図7は、一つの鋳型DNAに対して複数のプライマーセット(それぞれがfプライマーとrプライマーとからなるセット)それぞれとの間で結合可能位置コード化処理部13における単語を生成する処理を実行して得られた単語を表すとともに、そのプライマーセットを当該鋳型DNAに適用したPCR実験での増幅成功率を表している。図7に示すように、15種類のプライマーセット(1)~(15)と一つの鋳型DNAとのそれぞれの組み合わせごとに、複数の単語がそれぞれ生成されたものとする。また、増幅成功率は、実際のPCR実験において鋳型DNAのプライミング領域の増幅に成功したか否かを表すものであり、図7に示すように、増幅に成功した場合を〇と表し、増幅に失敗した場合を×と表すといったように、2値で増幅成功率を表すようにしてもよいし、増幅に失敗した場合は0~1の範囲の何れかの値を与え、増幅に失敗した場合は1~3の範囲の何れかの値を与えて、0~3のうち値が大きいほど増幅成功率が高いことを表すパラメータで表現するようにしてもよいし、パーセント表示によって増幅成功率を表すようにしてもよい。
図8は、増幅成功率反映済分類データの一例を表した説明図である。この図8は、図7に示す(1)~(15)の各プライマーセットから生成された単語群が所属する確率の最も高いトピックを決定し、増幅成功可否の情報を与えて割り振った増幅成功率反映済分類データであり、割り振られた増幅成功可否の情報に基づいて、各トピックの増幅成功率を算出している。増幅成功率情報を各トピックに反映させる処理は、例えば、(1)のプライマーセットについて、トピックモデルを用いて(1)のプライマーセットから生成された単語群が何れのトピックに分類される可能性が最も高いかを決定するようにし、決定されたトピックに対して増幅成功可否の情報を付した上で割り振る。図8に示すように、(1)のプライマーセットは増幅が成功する例であるので、トピック1に対して「(1)(〇)」を割り振っている。これらの処理を、(1)~(15)の各プライマーセットと鋳型DNAとの組み合わせについて実行することにより、各トピックに対して増幅成功可否の情報である〇と×が複数割り振られるので、割り振られた増幅成功可否の情報に基づいてトピック毎の増幅成功率を算出する。なお、この図7及び図8の例では〇か×の2値で表したために、単語に割り振る値も2値の何れかを割り振るようにしているが、これに限定されるものではなく、値が大きいほど増幅成功率が高いことを表すパラメータであってもよいし、パーセント表示で表された増幅成功率をそのまま割り振ってもよい。
図8に示す増幅成功率反映済分類データの例では、(1)~(15)のプライマーセットと鋳型DNAとの組み合わせについてのPCR実験の増幅成功可否の情報を割り振った結果として、4つのトピックそれぞれの増幅成功率が算出されている。トピック番号1は増幅成功率100%であり、トピック番号2は増幅成功率50%であり、トピック番号3及び4はともに増幅成功率0%である。
この図8に示す増幅成功率反映済分類データと、鋳型DNA及び評価対象のプライマーセットから生成された単語群のトピック毎の所属可能性を表す確率とを照合する場合を考える。例えば、評価対象のプライマーセットと鋳型DNAの組み合わせから結合可能位置コード化処理部13よって生成された単語群を、単語分類処理部14において用いるトピックモデルによって所属可能性を表す確率を求める。これは、例えば、トピック番号と所属可能性(%)の複数の組み合わせで表示される。例えば、プライマーセット(1)と鋳型DNAの組み合わせに基づいて生成された単語群についてトピックモデルを適用することで、何れのトピックに所属する可能性が高いかを表す割合を得る。例えば、トピック1に所属する確率が90%、トピック3に所属する確率が10%とトピックモデルによって判定された場合、評価対象のプライマーセットの増幅可能性は90%と評価できる。その増幅可能性については、最も可能性が高いトピックの増幅確率を設定しても良い。トピック1に所属する確率が90%、トピック3に所属する確率が10%である場合、評価対象のプライマーセット(1)と鋳型DNAとの組み合わせの増幅可能性は、トピック1の増幅可能性を採用して100%と予測することもできる。このように、増幅成功率反映済分類データと評価対象のプライマーセットとを照合することで、増幅の可能性を評価することができる。
次に、鋳型DNA-プライマー関係性評価装置20における関係性評価処理の流れについて説明を行う。図9は、鋳型DNA-プライマー関係性評価装置20における関係性評価処理の流れを表したフローチャート図である。この図9において、先ず、鋳型DNA-プライマー関係性評価装置20は、図5に示すステップS101~S112の処理を実行することによって、評価対象のプライマーと鋳型DNAとの間で生成された複数の単語の取得を行う(S201)。次に、鋳型DNA-プライマー関係性評価装置20は、単語群についてトピックモデルを用いてトピック毎の所属可能性を表す確率を出力する(S202)。ここでの確率は、単語群の所属する可能性について、トピック番号と所属可能性(%)の複数の組み合わせで出力される。
また、鋳型DNA-プライマー関係性評価装置20は、同一鋳型DNAについて予め記憶された増幅成功率反映済分類データを読み出す(S203)。そして、鋳型DNA-プライマー関係性評価装置20は、評価対象のプライマーに関するトピック毎の所属可能性を表す確率を増幅成功率反映済分類データと照合する処理を実行する(S204)。最後に、鋳型DNA-プライマー関係性評価装置20は、照合で得られた評価対象プライマーについての増幅可能性に関する評価を出力して(S205)、処理を終了する。
以上のように、本発明に係る鋳型DNA-プライマー関係性評価装置20によれば、評価対象の鋳型DNAの塩基配列情報を取得し、評価対象のプライマーの塩基配列情報を取得し、鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマー(以下、照合対象という)に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列(以下、単語という)として生成する結合可能位置コード化処理を実行し、結合可能位置コード化処理において生成された単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率として出力する処理を実行し、評価対象の鋳型DNAと既知のプライマーとの間で予め行われた少なくとも1以上のPCR実験によって得られた各プライマーの増幅成功率情報を、当該PCR実験に用いた鋳型DNAとプライマーに対して結合可能位置コード化処理及び単語分類処理を行うことで得られた複数トピックへの分類結果に対して反映させることで、各トピックの増幅成功率を表した増幅成功率反映済分類データを作成して予め記憶手段に記憶させておき、評価対象の鋳型DNAと評価対象のプライマーに関する単語群についてのトピック毎の所属可能性を表す確率を記憶手段に記憶された当該鋳型DNAに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型DNAに対する増幅成功率を予測して評価するようにしたので、評価対象のプライマーに関する単語分類結果を増幅成功率反映済分類データと照合することで、評価対象のプライマーの増幅可能性に関する評価を出力することが可能となる。これにより、未実施のプライマーについて実際のPCR実験を行う前に増幅可能性を知ることができるため、PCR実験を行わない段階において有効なプライマーを絞り込むことが可能となる。
なお、第2の実施の形態について説明する際に、図7及び図8の例では、一つの鋳型DNAと複数のプライマーセットとの関係性を用いて説明を行ったが、これは説明を簡略化するために行ったものであり、これに限定されるものではない。複数の鋳型DNAと複数のプライマーセットとの関係性について、増幅成功率反映済分類データの生成やトピックモデルによる分類処理を一緒に扱って処理するようにしてもよい。
[第3の実施の形態]
前記第1及び第2の実施の形態においては、PCR実験によって鋳型DNAを増殖する場合の最適プライマーの選定に用いる技術として説明を行ったが、OE-PCR(Overlap extension Polymerase Chain Reaction:オーバーラップエクステンションポリメラーゼ連鎖反応)に対しても本発明を適用することができる。
図10は、OE-PCRの手順を示した説明図である。図10(a)に示すように、それぞれが60塩基程度からなる複数のオリゴマー(図10(a)の例では4つのオリゴマー)について、隣り合うオリゴマー同士がそれぞれの端部についてオーバーラップした箇所で結合した状態において、図10(b)に示すように、DNAポリメラーゼによる合成反応を起こさせて相補的なDNA合成を促進させると、図10(c)に示すように、合成鎖は二重鎖の末端まで到達し、最終的には完全な二重鎖が形成される。この技術を用いることにより、100~数千塩基のDNAを鋳型を準備せずに合成することが可能となる。
OE-PCRについて、本発明を適用する場合には、対象としての鋳型DNAの代わりに、合成したいDNAの塩基配列情報を取得し、OE-PCRの処理に用いるオリゴマーについてオーバーラップさせたい領域の塩基配列箇所をプライミング領域に設定して、合成したいDNA及び全てのオリゴマーの全ての間の関係性について、結合可能位置コード化処理部13において所定のコードに基づいて単語を生成するようにし、生成した単語について単語分類処理部14においてトピックモデルを用いた分類処理を実行する。
このようにして、合成したいDNA及び全てのオリゴマーの全ての間の関係性について解析することで、本発明に係る鋳型DNA-プライマー関係性解析装置10、鋳型DNA-プライマー関係性評価装置20と同様に、OE-PCRにおけるオリゴマーの選定について、実際のOE-PCR実験を行う前に有効なオリゴマーを絞り込むことが可能となる。
前記第1及び第2の実施の形態において説明した技術は、腫瘍の悪性度の判断など、疾病に関係する遺伝子変異の迅速診断用PCRの開発を可能にする。この用途に本発明を利用する場合には、本発明での分類を試行結果で向上させる性質を用い、試行を効率的に繰り返すことにより、正常遺伝子ではPCRが起きず、変異遺伝子で特異的にPCRを起こすプライマーを設計することが可能になる。
10 鋳型DNA-プライマー関係性解析装置
11 鋳型DNA塩基配列取得部
12 プライマー塩基配列取得部
13 結合可能位置コード化処理部
14 単語分類処理部
15 記憶部
20 鋳型DNA-プライマー関係性評価装置
21 プライマー評価処理部
22 記憶部

Claims (10)

  1. 鋳型DNAの塩基配列情報を取得する鋳型DNA塩基配列取得部と、
    プライマーの塩基配列情報を取得するプライマー塩基配列取得部と、
    鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマー(以下、照合対象という)に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列(以下、単語という)として生成する結合可能位置コード化処理部と、
    前記結合可能位置コード化処理部において生成された全ての単語についてトピックモデルを用いて複数のトピックに分類する処理を行う単語分類処理部と
    を備える鋳型DNA-プライマー関係性解析装置。
  2. 前記照合単位所定数塩基は、3個~8個の塩基とした
    請求項1記載の鋳型DNA-プライマー関係性解析装置。
  3. 前記所定のコードは、鋳型DNAのプライミング領域と、プライミング領域以外の鋳型DNAの領域と、プライマー自身又はプライマー間での結合の場合の領域とで、異なるコードを用いるようにした
    請求項1又は請求項2に記載の鋳型DNA-プライマー関係性解析装置。
  4. 鋳型DNAの塩基配列情報を取得する鋳型DNA塩基配列取得手順と、
    プライマーの塩基配列情報を取得するプライマー塩基配列取得手順と、
    鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマー(以下、照合対象という)に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列(以下、単語という)として生成する結合可能位置コード化処理手順と、
    前記結合可能位置コード化処理手順において生成された全ての単語に対してトピックモデルを用いた分類処理を行う単語分類処理手順と
    を含む鋳型DNA-プライマー関係性解析方法。
  5. 鋳型DNAとプライマーの関係性を解析する処理をコンピュータに実現させるための鋳型DNA-プライマー関係性解析プログラムであって、
    前記コンピュータに、
    鋳型DNAの塩基配列情報を取得する鋳型DNA塩基配列取得機能と、
    プライマーの塩基配列情報を取得するプライマー塩基配列取得機能と、
    鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマー(以下、照合対象という)に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列(以下、単語という)として生成する結合可能位置コード化処理機能と、
    前記結合可能位置コード化処理機能において生成された全ての単語に対してトピックモデルを用いた分類処理を行う単語分類処理機能と
    を実現させる鋳型DNA-プライマー関係性解析プログラム。
  6. 評価対象の鋳型DNAの塩基配列情報を取得する鋳型DNA塩基配列取得部と、
    評価対象のプライマーの塩基配列情報を取得するプライマー塩基配列取得部と、
    前記鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマー(以下、照合対象という)に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列(以下、単語という)として生成する結合可能位置コード化処理部と、
    前記結合可能位置コード化処理部において生成された単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率として出力する処理を行う単語分類処理部と、
    前記評価対象の鋳型DNAと既知のプライマーとの間で予め行われた少なくとも1以上のPCR実験によって得られた各プライマーの増幅成功率情報を、当該PCR実験に用いた前記鋳型DNAとプライマーに対して結合可能位置コード化処理及び単語分類処理を行うことで得られた複数トピックへの分類結果に対して反映させることで、各トピックの増幅成功率を表した増幅成功率反映済分類データを作成して予め記憶手段に記憶させておき、前記評価対象の鋳型DNAと前記評価対象のプライマーに関して前記単語分類処理部において出力されたトピック毎の所属可能性を表す確率を前記記憶手段に記憶された当該鋳型DNAに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型DNAに対する増幅成功率を予測して評価するプライマー評価処理部と
    を備える鋳型DNA-プライマー関係性評価装置。
  7. 前記照合単位所定数塩基は、3個~8個の塩基とした
    請求項6記載の鋳型DNA-プライマー関係性評価装置。
  8. 前記所定のコードは、鋳型DNAのプライミング領域と、プライミング領域以外の鋳型DNAの領域と、プライマー自身又はプライマー間での結合の場合の領域とで、異なるコードを用いるようにした
    請求項6又は請求項7に記載の鋳型DNA-プライマー関係性評価装置。
  9. 評価対象の鋳型DNAの塩基配列情報を取得する鋳型DNA塩基配列取得手順と、
    評価対象のプライマーの塩基配列情報を取得するプライマー塩基配列取得手順と、
    前記鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマー(以下、照合対象という)に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列(以下、単語という)として生成する結合可能位置コード化処理手順と、
    前記結合可能位置コード化処理手順において生成された単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率として出力する処理を行う単語分類処理手順と、
    前記評価対象の鋳型DNAと既知のプライマーとの間で予め行われた少なくとも1以上のPCR実験によって得られた各プライマーの増幅成功率情報を、当該PCR実験に用いた前記鋳型DNAとプライマーに対して結合可能位置コード化処理及び単語分類処理を行うことで得られた複数トピックへの分類結果に対して反映させることで、各トピックの増幅成功率を表した増幅成功率反映済分類データを作成して予め記憶手段に記憶させておき、前記評価対象の鋳型DNAと前記評価対象のプライマーに関して前記単語分類処理手順において出力されたトピック毎の所属可能性を表す確率を前記記憶手段に記憶された当該鋳型DNAに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型DNAに対する増幅成功率を予測して評価するプライマー評価処理手順と
    を含む鋳型DNA-プライマー関係性評価方法。
  10. 鋳型DNAとプライマーの関係性を評価する処理をコンピュータに実現させるための鋳型DNA-プライマー関係性評価プログラムであって、
    前記コンピュータに、
    評価対象の鋳型DNAの塩基配列情報を取得する鋳型DNA塩基配列取得機能と、
    評価対象のプライマーの塩基配列情報を取得するプライマー塩基配列取得機能と、
    前記鋳型DNAから得られる2つの一本鎖鋳型DNA及び2つのプライマー(以下、照合対象という)に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次1塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列(以下、単語という)として生成する結合可能位置コード化処理機能と、
    前記結合可能位置コード化処理機能において生成された単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率として出力する処理を行う単語分類処理機能と、
    前記評価対象の鋳型DNAと既知のプライマーとの間で予め行われた少なくとも1以上のPCR実験によって得られた各プライマーの増幅成功率情報を、当該PCR実験に用いた前記鋳型DNAとプライマーに対して結合可能位置コード化処理及び単語分類処理を行うことで得られた複数トピックへの分類結果に対して反映させることで、各トピックの増幅成功率を表した増幅成功率反映済分類データを作成して予め記憶手段に記憶させておき、前記評価対象の鋳型DNAと前記評価対象のプライマーに関して前記単語分類処理機能において出力されたトピック毎の所属可能性を表す確率を前記記憶手段に記憶された当該鋳型DNAに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型DNAに対する増幅成功率を予測して評価するプライマー評価処理機能と
    を実現させる鋳型DNA-プライマー関係性評価プログラム。
JP2020504642A 2018-03-09 2018-03-09 鋳型dna-プライマー関係性解析装置、鋳型dna-プライマー関係性解析方法、鋳型dna-プライマー関係性解析プログラム、鋳型dna-プライマー関係性評価装置、鋳型dna-プライマー関係性評価方法及び鋳型dna-プライマー関係性評価プログラム Active JP7030312B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/009343 WO2019171601A1 (ja) 2018-03-09 2018-03-09 鋳型dna-プライマー関係性解析装置、鋳型dna-プライマー関係性解析方法、鋳型dna-プライマー関係性解析プログラム、鋳型dna-プライマー関係性評価装置、鋳型dna-プライマー関係性評価方法及び鋳型dna-プライマー関係性評価プログラム

Publications (2)

Publication Number Publication Date
JPWO2019171601A1 JPWO2019171601A1 (ja) 2021-03-04
JP7030312B2 true JP7030312B2 (ja) 2022-03-07

Family

ID=67845691

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020504642A Active JP7030312B2 (ja) 2018-03-09 2018-03-09 鋳型dna-プライマー関係性解析装置、鋳型dna-プライマー関係性解析方法、鋳型dna-プライマー関係性解析プログラム、鋳型dna-プライマー関係性評価装置、鋳型dna-プライマー関係性評価方法及び鋳型dna-プライマー関係性評価プログラム

Country Status (2)

Country Link
JP (1) JP7030312B2 (ja)
WO (1) WO2019171601A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015183173A1 (en) 2014-05-28 2015-12-03 Grafström Roland In vitro toxicogenomics for toxicity prediction

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015183173A1 (en) 2014-05-28 2015-12-03 Grafström Roland In vitro toxicogenomics for toxicity prediction

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
岩山 幸治 外1名,遺伝子発現データ解析のためのトピックモデル,電子情報通信学会技術研究報告,日本,一般社団法人電子情報通信学会,2017年02月27日,Vol.116 No.500,pp.77-82

Also Published As

Publication number Publication date
WO2019171601A1 (ja) 2019-09-12
JPWO2019171601A1 (ja) 2021-03-04

Similar Documents

Publication Publication Date Title
US11817180B2 (en) Systems and methods for analyzing nucleic acid sequences
Griffin et al. Prediction of RNA secondary structure by energy minimization
WO2018061699A1 (ja) マルチプレックスpcrに供するプライマーの設計方法
Ponomarenko et al. Conformational and physicochemical DNA features specific for transcription factor binding sites.
US20230402128A1 (en) Methods and systems for designing gene panels
Blank Next-generation analysis of deep sequencing data: bringing light into the black box of SELEX experiments
US20070143031A1 (en) Method of analyzing a bio chip
US20140114584A1 (en) Methods and systems for identifying, from read symbol sequences, variations with respect to a reference symbol sequence
Shiga et al. A variational bayesian framework for clustering with multiple graphs
JP7030312B2 (ja) 鋳型dna-プライマー関係性解析装置、鋳型dna-プライマー関係性解析方法、鋳型dna-プライマー関係性解析プログラム、鋳型dna-プライマー関係性評価装置、鋳型dna-プライマー関係性評価方法及び鋳型dna-プライマー関係性評価プログラム
Ruben et al. PUNCH: An evolutionary algorithm for optimizing bit set selection
WO2005096208A1 (ja) 塩基配列検索装置及び塩基配列検索方法
US8014955B2 (en) Method of identifying unique target sequence
US20050112577A1 (en) Rna sequence analyzer, and rna sequence analysis method, program and recording medium
Xu et al. Learn from the information contained in the false splice sites as well as in the true splice sites using SVM
Damasevicius Analysis of binary feature mapping rules for promoter recognition in imbalanced DNA sequence datasets using support vector machine
WO2014160736A1 (en) Systems, algorithms, and software for molecular inversion probe (mip) design
Kaderali Primer design for multiplexed genotyping
US20220284986A1 (en) Systems and methods for identifying exon junctions from single reads
Murugan et al. Sequence similarity between genetic codes using improved longest common subsequence algorithm
Andreson et al. Fast masking of repeated primer binding sites in eukaryotic genomes
Andreson et al. Fast masking of repeated primer binding sites in eukaryotic genomes
Meneses et al. Asynchronous Teams for probe selection problems
JP4198707B2 (ja) 複数個のポリヌクレオチドからなる群からプローブを選択する方法
JP2005135154A (ja) 配列類似性に基づく遺伝子オントロジーターム予測方法

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20200910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20200910

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220125

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220214

R150 Certificate of patent or registration of utility model

Ref document number: 7030312

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150