WO2019171601A1

WO2019171601A1 - 鋳型ｄｎａ－プライマー関係性解析装置、鋳型ｄｎａ－プライマー関係性解析方法、鋳型ｄｎａ－プライマー関係性解析プログラム、鋳型ｄｎａ－プライマー関係性評価装置、鋳型ｄｎａ－プライマー関係性評価方法及び鋳型ｄｎａ－プライマー関係性評価プログラム

Info

Publication number: WO2019171601A1
Application number: PCT/JP2018/009343
Authority: WO
Inventors: 遠藤　大二
Original assignee: 学校法人酪農学園; 株式会社Ｌａｇｒａｎｇｅ
Priority date: 2018-03-09
Filing date: 2018-03-09
Publication date: 2019-09-12
Also published as: JP7030312B2; JPWO2019171601A1

Abstract

鋳型ＤＮＡに対するプライマーの増幅可能性を解析するために、鋳型ＤＮＡの塩基配列情報を取得する鋳型ＤＮＡ塩基配列取得部と、プライマーの塩基配列情報を取得するプライマー塩基配列取得部と、鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマー（以下、照合対象という）に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列（以下、単語という）として生成する結合可能位置コード化処理部と、前記結合可能位置コード化処理部において生成された全ての単語についてトピックモデルを用いて複数のトピックに分類する処理を行う単語分類処理部とを備えるようにした。

Description

鋳型ＤＮＡ－プライマー関係性解析装置、鋳型ＤＮＡ－プライマー関係性解析方法、鋳型ＤＮＡ－プライマー関係性解析プログラム、鋳型ＤＮＡ－プライマー関係性評価装置、鋳型ＤＮＡ－プライマー関係性評価方法及び鋳型ＤＮＡ－プライマー関係性評価プログラム

　本発明は、鋳型ＤＮＡに対するプライマーの増幅可能性を解析する技術に関する。

　従来、ＤＮＡを増幅するための原理として、ＰＣＲ（Polymerase Chain Reaction：ポリメラーゼ連鎖反応）が存在する。ＰＣＲは少量のＤＮＡであっても適切なプライマーが用いられていれば大量に増幅することができる増幅方法である。

　図１１は、ＰＣＲの手順を示した説明図である。図１１（ａ）は、増幅を行いたい二本鎖鋳型ＤＮＡのうち増幅を行いたい領域（プライミング領域）を設定する段階を表している。そして、二本鎖鋳型ＤＮＡを２本の一本鎖鋳型ＤＮＡへと変化させた場合に、設定したプライミング領域の端点において一方の一本鎖鋳型ＤＮＡの端点に結合させたいプライマー（これをフォワードプライマー（ｆプライマー）という）と、他方の一本鎖鋳型ＤＮＡの端点に結合させたいプライマー（これをリバースプライマー（ｒプライマー）という）の２つのプライマーを用意する。

　図１１（ｂ）は、実際のＰＣＲの手順を表しており、二本鎖鋳型ＤＮＡに熱を加えて熱変性させることで、二重らせん構造の塩基間の水素結合が切断されて２本の一本鎖鋳型ＤＮＡを得るプロセスを表している。

　図１１（ｃ）は、２本の一本鎖鋳型ＤＮＡを得た後、温度を下げていくと、反応液に含まれるｆプライマーとｒプライマーがそれぞれ一本鎖鋳型ＤＮＡに結合する。ｆプライマー及びｒプライマーは、一本鎖鋳型ＤＮＡよりも塩基数が少なく数も多いことから、一本鎖鋳型ＤＮＡが再び二本鎖鋳型ＤＮＡに戻るよりも早く一本鎖鋳型ＤＮＡに対して結合することになる。一本鎖鋳型ＤＮＡにｆプライマー又はｒプライマーが結合した状態で、温度をＤＮＡポリメラーゼの活性が至適となる温度帯まで上昇させると、ＤＮＡポリメラーゼによる合成反応によって、ｆプライマー又はｒプライマーが結合した部分を起点として一本鎖ＤＮＡ部分と相補的なＤＮＡが合成される。ＤＮＡがＤＮＡポリメラーゼにより複製される際、デオキシリボースの３’位の水酸基にヌクレオチドのリン酸基を結合させることでＤＮＡを伸長させていく。すなわち、デオキシリボースの５’位から３’位の方向に方向性を持って伸長していく性質を持っているため、ｆプライマー又はｒプライマーが結合した位置から５’位から３’位の方向に順次相補鎖が形成されていくことになる。

　図１１（ｂ）のステップ及び図１１（ｃ）のステップを終えると、元の二本鎖鋳型ＤＮＡのうちプライミング領域部分が２倍となって２つの二本鎖鋳型ＤＮＡとなり、増殖が成功する。この処理をｎ回繰り返すと、プライミング領域部分を２^ｎ倍に増幅することができる。図１１（ｄ）は、処理を３回繰り返すことで元の二本鎖鋳型ＤＮＡのうちプライミング領域部分を２^３倍の８倍に増幅した状態を表している。

　ＰＣＲについて記載されたものとしては、例えば、特許文献１が存在する。この特許文献１には、ＰＣＲ法によってＤＮＡの塩基配列を増幅させるために用いるプライマーセットを、増幅対象生物のＤＮＡにおける増幅対象領域を増幅させるためのフォワードプライマー及びリバースプライマーの少なくとも一方の塩基配列が、非増幅対象生物のＤＮＡの塩基配列と、１２塩基以上連続で重ならないように作製することを特徴とするプライマーの作製方法が開示されている。

特開２０１３-０１７４１６号公報

　ＰＣＲを行う場合、増幅を行いたい領域のみを増幅させ、他の領域に結合する可能性のないｆプライマー及びｒプライマーを選定することが最も望まれる状態であるが、現実には、プライミング領域以外の箇所で鋳型ＤＮＡとプライマーが結合してしまったり、プライマー自身又はプライマー間で結合が生じてしまったり、ＤＮＡ断片であるマイクロＲＮＡなどと結合してしまったりなど、意図しない結合が生じて、プライミング領域の増幅が上手くいかない状況が発生することがある。複数種類のＤＮＡが存在する状況においては一層意図しない結合の可能性は高まる。前記特許文献１は、非増幅対象生物のＤＮＡの塩基配列と１２塩基以上連続で重ならないことを条件として挙げているが、非増幅対象生物のＤＮＡの塩基配列の全ての箇所に対してこの条件を満たすことは容易ではない。

　本発明は、上記問題点に鑑みなされたものであり、鋳型ＤＮＡに対するプライマーの増幅可能性を解析又は評価するための鋳型ＤＮＡ－プライマー関係性解析装置、鋳型ＤＮＡ－プライマー関係性解析方法、鋳型ＤＮＡ－プライマー関係性解析プログラム、鋳型ＤＮＡ－プライマー関係性評価装置、鋳型ＤＮＡ－プライマー関係性評価方法及び鋳型ＤＮＡ－プライマー関係性評価プログラムを提供することを課題とする。

　本発明に係る鋳型ＤＮＡ－プライマー関係性解析装置は、鋳型ＤＮＡの塩基配列情報を取得する鋳型ＤＮＡ塩基配列取得部と、プライマーの塩基配列情報を取得するプライマー塩基配列取得部と、鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマー（以下、照合対象という）に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列（以下、単語という）として生成する結合可能位置コード化処理部と、前記結合可能位置コード化処理部において生成された全ての単語についてトピックモデルを用いて複数のトピックに分類する処理を行う単語分類処理部とを備えることを特徴とする。

　また、本発明に係る鋳型ＤＮＡ－プライマー関係性解析装置は、前記照合単位所定数塩基は、３個～８個の塩基としたことを特徴とする。

　また、本発明に係る鋳型ＤＮＡ－プライマー関係性解析装置は、前記所定のコードは、鋳型ＤＮＡのプライミング領域と、プライミング領域以外の鋳型ＤＮＡの領域と、プライマー自身又はプライマー間での結合の場合の領域とで、異なるコードを用いるようにしたことを特徴とする。

　本発明に係る鋳型ＤＮＡ－プライマー関係性解析方法は、鋳型ＤＮＡの塩基配列情報を取得する鋳型ＤＮＡ塩基配列取得手順と、プライマーの塩基配列情報を取得するプライマー塩基配列取得手順と、鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマー（以下、照合対象という）に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列（以下、単語という）として生成する結合可能位置コード化処理手順と、前記結合可能位置コード化処理手順において生成された全ての単語に対してトピックモデルを用いた分類処理を行う単語分類処理手順とを含むことを特徴とする。

　本発明に係る鋳型ＤＮＡ－プライマー関係性解析プログラムは、鋳型ＤＮＡとプライマーの関係性を解析する処理をコンピュータに実現させるための鋳型ＤＮＡ－プライマー関係性解析プログラムであって、前記コンピュータに、鋳型ＤＮＡの塩基配列情報を取得する鋳型ＤＮＡ塩基配列取得機能と、プライマーの塩基配列情報を取得するプライマー塩基配列取得機能と、鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマー（以下、照合対象という）に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列（以下、単語という）として生成する結合可能位置コード化処理機能と、前記結合可能位置コード化処理機能において生成された全ての単語に対してトピックモデルを用いた分類処理を行う単語分類処理機能とを実現させることを特徴とする。

　本発明に係る鋳型ＤＮＡ－プライマー関係性評価装置は、評価対象の鋳型ＤＮＡの塩基配列情報を取得する鋳型ＤＮＡ塩基配列取得部と、評価対象のプライマーの塩基配列情報を取得するプライマー塩基配列取得部と、前記鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマー（以下、照合対象という）に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列（以下、単語という）として生成する結合可能位置コード化処理部と、前記結合可能位置コード化処理部において生成された単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率として出力する処理を行う単語分類処理部と、前記評価対象の鋳型ＤＮＡと既知のプライマーとの間で予め行われた少なくとも１以上のＰＣＲ実験によって得られた各プライマーの増幅成功率情報を、当該ＰＣＲ実験に用いた前記鋳型ＤＮＡとプライマーに対して結合可能位置コード化処理及び単語分類処理を行うことで得られた複数トピックへの分類結果に対して反映させることで、各トピックの増幅成功率を表した増幅成功率反映済分類データを作成して予め記憶手段に記憶させておき、前記評価対象の鋳型ＤＮＡと前記評価対象のプライマーに関して前記単語分類処理部において出力されたトピック毎の所属可能性を表す確率を前記記憶手段に記憶された当該鋳型ＤＮＡに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型ＤＮＡに対する増幅成功率を予測して評価するプライマー評価処理部とを備えることを特徴とする。

　本発明に係る鋳型ＤＮＡ－プライマー関係性評価方法は、評価対象の鋳型ＤＮＡの塩基配列情報を取得する鋳型ＤＮＡ塩基配列取得手順と、評価対象のプライマーの塩基配列情報を取得するプライマー塩基配列取得手順と、前記鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマー（以下、照合対象という）に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列（以下、単語という）として生成する結合可能位置コード化処理手順と、前記結合可能位置コード化処理手順において生成された単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率として出力する処理を行う単語分類処理手順と、前記評価対象の鋳型ＤＮＡと既知のプライマーとの間で予め行われた少なくとも１以上のＰＣＲ実験によって得られた各プライマーの増幅成功率情報を、当該ＰＣＲ実験に用いた前記鋳型ＤＮＡとプライマーに対して結合可能位置コード化処理及び単語分類処理を行うことで得られた複数トピックへの分類結果に対して反映させることで、各トピックの増幅成功率を表した増幅成功率反映済分類データを作成して予め記憶手段に記憶させておき、前記評価対象の鋳型ＤＮＡと前記評価対象のプライマーに関して前記単語分類処理手順において出力されたトピック毎の所属可能性を表す確率を前記記憶手段に記憶された当該鋳型ＤＮＡに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型ＤＮＡに対する増幅成功率を予測して評価するプライマー評価処理手順とを含むことを特徴とする。

　本発明に係る鋳型ＤＮＡ－プライマー関係性評価プログラムは、鋳型ＤＮＡとプライマーの関係性を評価する処理をコンピュータに実現させるための鋳型ＤＮＡ－プライマー関係性解析プログラムであって、前記コンピュータに、評価対象の鋳型ＤＮＡの塩基配列情報を取得する鋳型ＤＮＡ塩基配列取得機能と、評価対象のプライマーの塩基配列情報を取得するプライマー塩基配列取得機能と、前記鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマー（以下、照合対象という）に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列（以下、単語という）として生成する結合可能位置コード化処理機能と、前記結合可能位置コード化処理機能において生成された単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率として出力する処理を行う単語分類処理機能と、前記評価対象の鋳型ＤＮＡと既知のプライマーとの間で予め行われた少なくとも１以上のＰＣＲ実験によって得られた各プライマーの増幅成功率情報を、当該ＰＣＲ実験に用いた前記鋳型ＤＮＡとプライマーに対して結合可能位置コード化処理及び単語分類処理を行うことで得られた複数トピックへの分類結果に対して反映させることで、各トピックの増幅成功率を表した増幅成功率反映済分類データを作成して予め記憶手段に記憶させておき、前記評価対象の鋳型ＤＮＡと前記評価対象のプライマーに関して前記単語分類処理機能において出力されたトピック毎の所属可能性を表す確率を前記記憶手段に記憶された当該鋳型ＤＮＡに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型ＤＮＡに対する増幅成功率を予測して評価するプライマー評価処理機能とを実現させることを特徴とする。

　本発明によれば、鋳型ＤＮＡの塩基配列情報を取得し、プライマーの塩基配列情報を取得し、鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマーに対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列からなる単語を生成し、生成された全ての単語についてトピックモデルを用いて複数のトピックに分類する処理を行うようにしたので、単語の内容と単語の分類結果に基づいて、鋳型ＤＮＡのプライミング領域に対するプライマーの結合可能性の解析の他、プライミング領域以外の領域において意図しない結合が生じる可能性についても解析することができ、実際のＰＣＲの実験を行う前に、鋳型ＤＮＡに対するプライマーの適合性を検証するための材料を得ることが可能となる。

　また、本発明によれば、評価対象のプライマーに関する単語分類結果から生成したトピックは、増幅成功率反映済分類データが存在しない場合においては、予備的にＰＣＲプライマーを選定するために使用可能である。すなわち、鋳型ＤＮＡに対して増幅可能性が未知である多数のプライマーセットについて、本発明に係る鋳型ＤＮＡ－プライマー関係性解析装置によって、各プライマーセットと鋳型ＤＮＡから単語群を生成して、トピックモデルを用いてそれらの単語群を複数のトピックに分類するとともに、当該プライマーセットから生成した単語群が所属する可能性が最も高いトピックを決定する作業を行うようにする。これらの作業を実行すると、各プライマーセットからそれぞれ生成された単語群が複数トピックに分類され、かつ、各プライマーセットのそれぞれが所属する可能性の最も高いトピックが決定される。このように、多数のプライマーセットを分類してから、増幅可能性の高そうなトピックに所属するプライマーセットから優先して実際のＰＣＲ実験を行うようにする。このような手順を踏むことで、増幅に成功するプライマーセットを発見するまでの時間及び費用を削減することが可能となる。これにより、未実施のプライマーについて実際のＰＣＲ実験を行う前に増幅可能性を知ることができるため、増幅成功率反映済分類データが存在しない場合においても、ＰＣＲ実験を行わない段階において有効なプライマーを絞り込むことが可能となる。

　また、本発明によれば、評価対象のプライマーに関する単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率を増幅成功率反映済分類データと照合することで、鋳型ＤＮＡに対する評価対象のプライマーの増幅可能性に関する評価を出力することが可能となる。これにより、未実施のプライマーについて実際のＰＣＲ実験を行う前に増幅可能性を知ることができるため、ＰＣＲ実験を行わない段階において有効なプライマーを絞り込むことが可能となる。

本発明に係る鋳型ＤＮＡ－プライマー関係性解析装置１０の構成を表したブロック図である。鋳型ＤＮＡ－プライマー関係性解析装置１０を実現するために必要とされるハードウェア構成を表したブロック図である。鋳型ＤＮＡ－プライマー関係性解析装置１０における結合可能位置コード化処理の概念を説明するための説明図である。結合可能位置コード化処理において、結合関係が成立する位置に対して適用する変換コードの一例を表した表である。鋳型ＤＮＡ－プライマー関係性解析装置１０における結合可能位置コード化処理の流れを表したフローチャート図である。本発明に係る鋳型ＤＮＡ－プライマー関係性評価装置２０の構成を表したブロック図である。同一の鋳型ＤＮＡと様々なプライマーセットとから生成された複数の単語と、鋳型ＤＮＡとプライマーセットの各組合せのＰＣＲ実験の結果を示した一例としての説明図である。増幅成功率反映済分類データの一例を表した説明図である。鋳型ＤＮＡ－プライマー関係性評価装置２０における関係性評価処理の流れを表したフローチャート図である。ＯＥ－ＰＣＲの手順を示した説明図である。ＰＣＲの手順を示した説明図である。

［第１の実施の形態］
　以下、図面を参照しながら、第１の実施の形態に係る鋳型ＤＮＡ－プライマー関係性解析装置の例について説明する。図１は、本発明に係る鋳型ＤＮＡ－プライマー関係性解析装置１０の構成を表したブロック図である。

　なお、鋳型ＤＮＡ－プライマー関係性解析装置１０は、専用マシンとして設計した装置であってもよいが、一般的なコンピュータによって実現可能なものであるものとする。図２は、鋳型ＤＮＡ－プライマー関係性解析装置１０を実現するために必要とされるハードウェア構成を表したブロック図である。この図２に示すように、鋳型ＤＮＡ－プライマー関係性解析装置１０は、一般的なコンピュータが通常備えているであろうＣＰＵ（Central Processing Unit：中央演算処理装置）５１と、ＧＰＵ（Graphics Processing Unit：画像処理装置）５２と、メモリ５３と、ハードディスクドライブ、ＳＳＤ（solid state drive）等のストレージ５４とを備えており、また、マウス、キーボード等の入力装置５５と、ディスプレイ、プリンタ等の出力装置５６と、通信ネットワークと接続するための通信装置５７とを備えており、これらがバス５８を介して接続されているものとする。本発明に係る鋳型ＤＮＡ－プライマー関係性解析装置１０は、図２に示すＣＰＵを含む各種ハードウェアと同等の構成によって鋳型ＤＮＡ－プライマー関係性解析装置１０の各部の構成における処理を実現するものとする。

　また、以下に説明する鋳型ＤＮＡ－プライマー関係性解析装置１０の構成要素を全て鋳型ＤＮＡ－プライマー関係性解析装置１０自身が備えている必要はなく、一部構成を他の装置に備えさせる、例えば、通信ネットワークを介して接続可能なサーバ装置に一部の構成を備えさせるようにして、鋳型ＤＮＡ－プライマー関係性解析装置１０が通信を行いながらサーバ装置に備えられた構成を利用するものであってもよい。

　図１に示すように、鋳型ＤＮＡ－プライマー関係性解析装置１０は、鋳型ＤＮＡ塩基配列取得部１１と、プライマー塩基配列取得部１２と、結合可能位置コード化処理部１３と、単語分類処理部１４と、記憶部１５とを少なくとも備えている。

　鋳型ＤＮＡ塩基配列取得部１１は、ＰＣＲによって増幅を行いたい領域（プライミング領域）を含む鋳型ＤＮＡの塩基配列情報を取得する機能を有する。この鋳型ＤＮＡ塩基配列取得部１１では、鋳型ＤＮＡの全体の塩基配列情報を取得するとともに、増幅を行いたい領域が何塩基目から何塩基目までであるのかを指定する情報も併せて取得する。

　プライマー塩基配列取得部１２は、ＰＣＲを行う際に用いるプライマーの塩基配列情報を取得する機能を有する。ここで取得するプライマーの塩基配列情報は、鋳型ＤＮＡを熱処理して２つの一本鎖鋳型ＤＮＡとした場合の一方の一本鎖鋳型ＤＮＡに結合させるｆプライマーと、他方の一本鎖鋳型ＤＮＡに結合させるｒプライマーとの両方についての塩基配列情報が含まれる。

　結合可能位置コード化処理部１３は、鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマー（以下、照合対象という）に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列（以下、単語ともいう）として生成する機能を有する。この結合可能位置コード化処理部１３においては、プライミング領域での増幅を狙って使用される２つのプライマーが結合する可能性のある位置を照合によって探索して、結合可能性のある位置における関係性を所定のコードに変換する処理である。

　図３は、鋳型ＤＮＡ－プライマー関係性解析装置１０における結合可能位置コード化処理の概念を説明するための説明図である。図３（ａ）は、鋳型ＤＮＡとプライマーの理想的結合位置の例を表した説明図である。二本鎖の間が水素結合して二重らせん構造をとっている鋳型ＤＮＡは、例えば、図３（ａ）において（１）及び（２）として示したように、ＰＣＲの熱処理の過程で２つの一本鎖鋳型ＤＮＡに分離される。なお、２つの一本鎖鋳型ＤＮＡの塩基数を６０としているが、簡易的に説明するためであり、これに限定されるものではない。鋳型ＤＮＡにはプライミング領域が設定してあり、一方の一本鎖鋳型ＤＮＡにおけるプライミング領域の端部に結合するように設定されるプライマーであるｆプライマーと、他方の一本鎖鋳型ＤＮＡにおけるプライミング領域の端部に結合するように設定されるプライマーであるｒプライマーとが選択される。ｆプライマーとｒプライマーの塩基数を１０としているが、簡易的に説明するためであり、これに限定されるものではない。図３（ａ）の例では、ｆプライマーの１０塩基とｒプライマーの１０塩基は、それぞれが相対する一本鎖鋳型ＤＮＡとの理想的結合位置において全１０塩基が結合する関係性にある。ここで、結合する関係性とは、ＤＮＡを構成する塩基であるアデニン（Ａ）、グアニン（Ｇ）、チミン（Ｔ）、シトシン（Ｃ）の４つのうち、塩基ＡとＴ、ＧとＣがそれぞれ水素結合によって相補的結合をする関係にあることをいう。

　図３（ｂ）は、プライマーから照合単位所定数塩基を抽出例として、照合単位５塩基を抽出する場合を例に挙げた説明図である。対象のプライマーをｆプライマーの「gcaacttctc」とすると、最初に先頭の塩基から５塩基を抽出して、照合単位５塩基として［１］gcaacを抽出する。その後、順次１塩基ずつずらしながら照合単位５塩基を抽出する。すると、図３（ｂ）に示すように、１０塩基からなるｆプライマーからは６パターンの照合単位５塩基が抽出されることが分かる。図３（ｂ）の例は１０塩基のプライマーについての例であるが、２０塩基のプライマーから照合単位５塩基を抽出する場合には１６パターンの照合単位５塩基が抽出され、プライマーの塩基数に応じて変化する。

　図３（ｃ）は、鋳型ＤＮＡに対する照合単位５塩基の照合の例を表した説明図である。一例として、（１）の一本鎖鋳型ＤＮＡに対して照合単位５塩基の［１］gcaacを照合する例を挙げている。先ず、一本鎖鋳型ＤＮＡの３’側の１塩基目に［１］gcaacの５’側の１塩基目が相対する位置関係において照合を行う。一本鎖鋳型ＤＮＡの３’側の１塩基目から５塩基目まではプライミング領域から外れた領域であるが、プライミング領域以外の箇所に対しても照合処理を行う。すると、１塩基目はgとcであるため結合する関係性となっているが、残りの４塩基については結合する関係性となっていない。結合可能位置コード化処理部１３では、所定数のうち過半数以上の位置で結合関係が成立する場合に所定のコードに変換する、すなわち、５塩基中３塩基以上において結合関係が成立する場合にコード化するので、この１塩基目についてはコードを生成しないことになる。次に、一本鎖鋳型ＤＮＡの３’側の２塩基目に［１］gcaacの１塩基目が相対する位置関係において照合を行うというように、一本鎖鋳型ＤＮＡの５’側に順次１塩基ずつずらしながら照合を行っていき、５塩基中３塩基以上において結合関係が成立する場合にコードを生成する。図３（ｃ）の例では、一本鎖鋳型ＤＮＡの３’側の６塩基目に［１］gcaacの５’側の１塩基目が相対する位置関係において、プライミング領域での照合処理となり、５塩基全てで結合関係が成立するため、予め定められた所定のコード変換規則に基づいて、この相対する５塩基の関係性についてコードを生成する。このようにして、一本鎖鋳型ＤＮＡの最後の塩基まで（一本鎖鋳型ＤＮＡの５’側端部と［１］gcaacの３’側端部が照合される位置関係まで）照合処理を行って、コード生成可能な結合可能位置においてコードを生成する。他の［２］～［６］の照合単位５塩基についても同様に結合可能位置コード化処理を実行する。

　図３は、一方の一本鎖鋳型ＤＮＡに対してｆプライマーから抽出された６パターンの照合単位５塩基を照合する場合をしめしたが、他方の一本鎖鋳型ＤＮＡに対しても照合処理を行い、また、２つのｆプライマーとｒプライマーに対しても同様に照合処理を行う。そして、もう一方のｒプライマーからも照合単位５塩基を抽出して、同様の結合可能位置コード化処理を実行する。

　図４は、結合可能位置コード化処理において、結合関係が成立する位置に対して適用する変換コードの一例を表した表である。先ず、変換コードは、照合単位５塩基が相対する領域によって適用するコードを区別している。具体的には、鋳型ＤＮＡのプライミング領域と、プライミング領域以外の鋳型ＤＮＡの領域と、プライマー自身又はプライマー間での結合の場合の領域とに分けている。鋳型ＤＮＡのプライミング領域における結合関係に対しては大文字のアルファベットをコードとして使用し、プライミング領域以外の鋳型ＤＮＡの領域における結合関係に対しては小文字のアルファベットをコードとして使用し、プライマー自身又はプライマー間での結合の場合の領域における結合関係に対しては数字及び上記で未使用の小文字のアルファベットをコードとして使用している。全ての領域において、ＡとＴの結合する関係性に対しては、照合対象と照合単位５塩基の何れの側にＡとＴのどちらの塩基が存在するかに関わらず同じコードを使用し、ＧとＣの結合する関係性に対しては、照合対象と照合単位５塩基の何れの側にＧとＣのどちらの塩基が存在するかに関わらず同じコードを使用している。他の関係性については、それぞれオリジナルのコードを使用している。

　図４の変換コードを用いると、図３（ｃ）の６塩基目に照合した例では、「ＢＢＡＡＢ」というコードが生成される。このとき、プライミング領域において生成されたコードについては所定倍の数だけ、例えば３倍の数だけコードを生成するようにする。これは、プライミング領域での結合関係を他の領域の結合関係よりも評価を高くするための工夫である。また、プライマー自身又はプライマー間での結合は即座に避けたい結合関係であるため、これを発見し易いように、プライマー自身又はプライマー間での結合に対するコードについても所定倍の数だけ、例えば３倍の数だけコードを生成するようにする。ここで挙げた倍数はあくまで例示であり、他の倍率であってもよい。なお、照合単位所定数塩基の塩基数と同数のコードで表現された結合関係を表す文字列を、以下、単語と表現するものとする。図３（ｃ）で生成された５つのコードで表された文字列「ＢＢＡＡＢ」は単語である。この他にも、例えば、プライミング領域以外の鋳型ＤＮＡの領域における結合関係については、「ｂａｂｂａ」といった単語が生成される可能性があり、プライマー自身又はプライマー間での結合関係については、「１２１４２」といった単語が生成される可能性がある。

　単語分類処理部１４は、結合可能位置コード化処理部１３において生成された全ての単語についてトピックモデルを用いて複数のトピックに分類する処理を行う機能を有する。トピックモデルは、確率モデルの一種であり、文章中の単語を複数トピックに分類することで当該文章がどのような内容のトピックを含むかを分析することに用いられるモデルである。本例では、結合可能位置コード化処理部１３において生成された全ての単語（コードで表された文字列）を複数のトピックに分類する処理についてトピックモデルを用いて実行する。トピックモデルは、例えば、LDA（Latent Dirichlet Allocation）を用いることができ、実装するためのプログラムとしては、例えば、gensimなどの様々な既存のソフトウェアを利用することができる。分類の際のトピック数については、使用者が任意のトピック数を指定できる構成としてもよい。また、最適なトピック数についてパープレキシティ（perplexity）やカバレージ（coverage）などの指標を用いて評価を行って決定するようにしてもよい。この単語分類処理部１４によって分類することにより、結合可能位置コード化処理部１３において生成された全ての単語は、確率的に何れかのトピックに分類されることになる。また、トピックモデルは、単語の分類機能に加えて、分類対象の単語群が何れのトピックに該当する可能性が最も高いかを出力する機能を備える。単語群が所属するトピックの可能性について、トピック毎の該当可能性の割合（％）を出力することができる。

　記憶部１５は、各部の処理に必要な各種データや、各部における処理の結果として得られたデータを記憶させる機能を有する。例えば、鋳型ＤＮＡ塩基配列取得部１１で取得した鋳型ＤＮＡの塩基配列情報、プライマー塩基配列取得部１２で取得したプライマーの塩基配列情報などをこの記憶部１６に記憶させるようにし、また、結合可能位置コード化処理部１３において生成したコードで表現された文字列である単語や、単語分類処理部１４における分類結果などについて記憶部１６に記憶させるようにしてもよい。

　次に、鋳型ＤＮＡ－プライマー関係性解析装置１０における結合可能位置コード化処理の流れについて説明を行う。図５は、鋳型ＤＮＡ－プライマー関係性解析装置１０における結合可能位置コード化処理の流れを表したフローチャート図である。この図５において、先ず、鋳型ＤＮＡ－プライマー関係性解析装置１０は、鋳型ＤＮＡの塩基配列情報の取得を行う（Ｓ１０１）。また、鋳型ＤＮＡ－プライマー関係性解析装置１０は、プライマーの塩基配列情報の取得についても行う（Ｓ１０２）。ここで塩基配列情報を取得するプライマーは、ｆプライマーとｒプライマーの２つである。

　次に、鋳型ＤＮＡ－プライマー関係性解析装置１０は、塩基配列情報を取得したプライマーの１つについて照合単位５塩基に分割して最初の照合単位５塩基を選択する（Ｓ１０３）。選択された照合単位５塩基を照合する照合対象として、鋳型ＤＮＡから得られる２つの一本鎖ＤＮＡ及び２つのプライマーのうち未選択の１つを選択する（Ｓ１０４）。鋳型ＤＮＡ－プライマー関係性解析装置１０は、選択された照合対象の先頭の塩基から順次１塩基ずつずらしながら照合単位５塩基を照合し、照合位置にて５塩基中３塩基以上で結合関係が成立する場合には、当該照合位置での相対する５塩基の関係性を所定のコードに変換する（Ｓ１０５）。そして、鋳型ＤＮＡ－プライマー関係性解析装置１０は、選択中の照合対象の最後まで現在の照合単位５塩基との照合が完了したかを判定する（Ｓ１０６）。照合対象の最後まで照合が完了していない場合（Ｓ１０６－Ｎ）には、Ｓ１０５及びＳ１０６のステップを繰り返す。照合対象の最後まで照合が完了した場合（Ｓ１０６－Ｙ）には、Ｓ１０７のステップに移行する。

　Ｓ１０７のステップでは、最後の照合単位５塩基について照合完了したか否かを判定する（Ｓ１０７）。最後の照合単位５塩基について照合完了していない場合（Ｓ１０７－Ｎ）には、照合単位５塩基を次の選択肢に切り替えてから（Ｓ１０８）、ステップＳ１０５、Ｓ１０６の処理を繰り返す。そして、ステップＳ１０５～Ｓ１０８を繰り返して、最後の照合単位５塩基についての照合が完了した場合（Ｓ１０７－Ｙ）には、次のＳ１０９のステップに移行する。

　Ｓ１０９のステップでは、全ての照合対象について照合が完了したかを判定する（Ｓ１０９）。全ての照合対象について照合が完了していない場合（Ｓ１０９－Ｎ）には、ステップＳ１０３に戻り、ステップＳ１０４において処理対象を変更してから、ステップＳ１０５～Ｓ１０８の処理を繰り返す。そして、ステップＳ１０５～Ｓ１０８を繰り返して、全ての照合対象について照合が完了した場合（Ｓ１０９－Ｙ）には、全てのプライマーについて照合単位５塩基に分割しての照合処理を完了したか否かを判定する（Ｓ１１０）。全てのプライマーについて照合単位５塩基に分割しての照合処理を完了していない場合（Ｓ１１０－Ｎ）には、未処理のプライマーを選択（Ｓ１１１）した上で、ステップＳ１０３に戻る。ステップＳ１０３～Ｓ１０９の処理を繰り返して、未処理のプライマーについて照合単位５塩基に分割しての照合処理を完了した場合（Ｓ１１０－Ｙ）には、コード化で生成された全ての単語を記憶部に記憶させて（Ｓ１１２）、処理を終了する。

　以上のように、本発明に係る鋳型ＤＮＡ－プライマー関係性解析装置１０によれば、鋳型ＤＮＡの塩基配列情報を取得し、プライマーの塩基配列情報を取得し、鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマーに対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列からなる単語を生成し、生成された全ての単語についてトピックモデルを用いて複数のトピックに分類する処理を行うようにしたので、単語の内容と単語の分類結果に基づいて、鋳型ＤＮＡのプライミング領域に対するプライマーの結合可能性の解析の他、プライミング領域以外の領域において意図しない結合が生じる可能性についても解析することができ、実際のＰＣＲの実験を行う前に、鋳型ＤＮＡに対するプライマーの適合性を検証するための材料を得ることが可能となる。

　また、鋳型ＤＮＡに対して増幅可能性が未知である多数のプライマーセット、例えば、１００種類のプライマーセットから最適な候補を選択したいような場合に、１００種類全てについてＰＣＲ実験を行うことは大変な労力である。そこで、本発明に係る鋳型ＤＮＡ－プライマー関係性解析装置１０によって、各プライマーセットと鋳型ＤＮＡから単語群を生成して、トピックモデルを用いてそれらの単語群を複数のトピックに分類するとともに、当該プライマーセットから生成した単語群が所属する可能性が最も高いトピックを決定する作業を行うようにする。これらの作業を実行すると、１００種類のプライマーセットからそれぞれ生成された単語群が複数トピックに分類され、かつ、１００種類のプライマーセットのそれぞれが所属する可能性の最も高いトピックが決定される。このように１００種類のプライマーセットを分類してから、増幅可能性の高そうなトピックに所属するプライマーセットから優先して実際のＰＣＲ実験を行うようにする。このような手順を踏むことで、増幅に成功するプライマーセットを発見するまでの時間及び費用を削減することが可能となる。

［第２の実施の形態］
　以下、図面を参照しながら、第２の実施の形態に係る鋳型ＤＮＡ－プライマー関係性評価装置の例について説明する。図６は、本発明に係る鋳型ＤＮＡ－プライマー関係性評価装置２０の構成を表したブロック図である。なお、鋳型ＤＮＡ－プライマー関係性評価装置２０は、専用マシンとして設計した装置であってもよいが、一般的なコンピュータによって実現可能なものであるものとし、その場合、第１の実施の形態と同様、図２に示すハードウェア構成と同等の構成に基づいて実現することができる。

　図６に示すように、鋳型ＤＮＡ－プライマー関係性評価装置２０は、鋳型ＤＮＡ塩基配列取得部１１と、プライマー塩基配列取得部１２と、結合可能位置コード化処理部１３と、単語分類処理部１４と、プライマー評価処理部２１と、記憶部２２とを少なくとも備えている。なお、第１の実施の形態と同一符号を付した構成については、第１の実施の形態と同様の機能を持った構成であるので、説明を省略する。

　なお、第１の実施の形態においては、単語分類処理部１４の機能として、結合可能位置コード化処理部１３において生成された全ての単語についてトピックモデルを用いて複数のトピックに分類する処理を行う機能と、分類対象の単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、各トピック毎の所属可能性を表す確率として出力する機能との２つの機能を備えることを説明したが、この第２の実施の形態においては、後者の機能を用いるものとし、単語群が所属するトピックの可能性についてトピック毎の所属可能性の割合（％）を出力する機能を用いるものとする。

　プライマー評価処理部２１は、評価対象の鋳型ＤＮＡと評価対象のプライマーに関して単語分類処理部１４において出力されたトピック毎の所属可能性を表す確率を、記憶手段に記憶された当該鋳型ＤＮＡに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型ＤＮＡに対する増幅成功率を予測して評価する機能を有する。ここで、増幅成功率反映済分類データとは、評価対象の鋳型ＤＮＡと既知のプライマーとの間で予め行われた少なくとも１以上のＰＣＲ実験によって得られた各プライマーの増幅成功率情報を、トピックモデルによって分類する際の複数トピックのうちの何れかのトピックに対して反映させることで、各トピックの増幅成功率を表したデータのことをいう。この増幅成功率反映済分類データは、同じ鋳型ＤＮＡに対する複数のプライマーセットによる分類結果及びＰＣＲ実験での増幅成功率情報を同じ増幅成功率反映済分類データとして記録することもできるし、複数の鋳型ＤＮＡに対する複数のプライマーセットによる分類結果及びＰＣＲ実験での増幅成功率情報を同じ増幅成功率反映済分類データとして記録することもできる。複数のプライマーセットについての増幅成功率情報が分類結果に反映されることで、精度の高い増幅成功率の予測が可能となる。この増幅成功率反映済分類データは、予め記憶部２２に記憶させておく。

　記憶部２２は、第1の実施の形態における記憶部１６と同様の対象を記憶する機能を有することに加えて、増幅成功率反映済分類データを記憶させておく機能を有する。増幅成功率反映済分類データは、複数の鋳型ＤＮＡそれぞれについて予め作成して記憶させておき、プライマー評価処理部２１における照合処理において、評価対象の鋳型ＤＮＡが指定された段階で対応する増幅成功率反映済分類データを読み出して照合に利用する。また、増幅成功率反映済分類データは、鋳型ＤＮＡごとに保持する場合に限らず、様々な鋳型ＤＮＡと様々なプライマーセットとの関係性についての評価情報を１つの増幅成功率反映済分類データに反映させたものを記憶させておくようにしてもよい。

　図７は、同一の鋳型ＤＮＡと様々なプライマーセットとから生成された複数の単語と、鋳型ＤＮＡとプライマーセットの各組合せのＰＣＲ実験の結果を示した一例としての説明図である。この図７は、一つの鋳型ＤＮＡに対して複数のプライマーセット（それぞれがｆプライマーとｒプライマーとからなるセット）それぞれとの間で結合可能位置コード化処理部１３における単語を生成する処理を実行して得られた単語を表すとともに、そのプライマーセットを当該鋳型ＤＮＡに適用したＰＣＲ実験での増幅成功率を表している。図７に示すように、１５種類のプライマーセット（１）～（１５）と一つの鋳型ＤＮＡとのそれぞれの組み合わせごとに、複数の単語がそれぞれ生成されたものとする。また、増幅成功率は、実際のＰＣＲ実験において鋳型ＤＮＡのプライミング領域の増幅に成功したか否かを表すものであり、図７に示すように、増幅に成功した場合を〇と表し、増幅に失敗した場合を×と表すといったように、２値で増幅成功率を表すようにしてもよいし、増幅に失敗した場合は０～１の範囲の何れかの値を与え、増幅に失敗した場合は１～３の範囲の何れかの値を与えて、０～３のうち値が大きいほど増幅成功率が高いことを表すパラメータで表現するようにしてもよいし、パーセント表示によって増幅成功率を表すようにしてもよい。

　図８は、増幅成功率反映済分類データの一例を表した説明図である。この図８は、図７に示す（１）～（１５）の各プライマーセットから生成された単語群が所属する確率の最も高いトピックを決定し、増幅成功可否の情報を与えて割り振った増幅成功率反映済分類データであり、割り振られた増幅成功可否の情報に基づいて、各トピックの増幅成功率を算出している。増幅成功率情報を各トピックに反映させる処理は、例えば、（１）のプライマーセットについて、トピックモデルを用いて（１）のプライマーセットから生成された単語群が何れのトピックに分類される可能性が最も高いかを決定するようにし、決定されたトピックに対して増幅成功可否の情報を付した上で割り振る。図８に示すように、（１）のプライマーセットは増幅が成功する例であるので、トピック１に対して「（１）（〇）」を割り振っている。これらの処理を、（１）～（１５）の各プライマーセットと鋳型ＤＮＡとの組み合わせについて実行することにより、各トピックに対して増幅成功可否の情報である〇と×が複数割り振られるので、割り振られた増幅成功可否の情報に基づいてトピック毎の増幅成功率を算出する。なお、この図７及び図８の例では〇か×の２値で表したために、単語に割り振る値も２値の何れかを割り振るようにしているが、これに限定されるものではなく、値が大きいほど増幅成功率が高いことを表すパラメータであってもよいし、パーセント表示で表された増幅成功率をそのまま割り振ってもよい。

　図８に示す増幅成功率反映済分類データの例では、（１）～（１５）のプライマーセットと鋳型ＤＮＡとの組み合わせについてのＰＣＲ実験の増幅成功可否の情報を割り振った結果として、４つのトピックそれぞれの増幅成功率が算出されている。トピック番号１は増幅成功率１００％であり、トピック番号２は増幅成功率５０％であり、トピック番号３及び４はともに増幅成功率０％である。

　この図８に示す増幅成功率反映済分類データと、鋳型ＤＮＡ及び評価対象のプライマーセットから生成された単語群のトピック毎の所属可能性を表す確率とを照合する場合を考える。例えば、評価対象のプライマーセットと鋳型ＤＮＡの組み合わせから結合可能位置コード化処理部１３よって生成された単語群を、単語分類処理部１４において用いるトピックモデルによって所属可能性を表す確率を求める。これは、例えば、トピック番号と所属可能性（％）の複数の組み合わせで表示される。例えば、プライマーセット（１）と鋳型ＤＮＡの組み合わせに基づいて生成された単語群についてトピックモデルを適用することで、何れのトピックに所属する可能性が高いかを表す割合を得る。例えば、トピック１に所属する確率が９０％、トピック３に所属する確率が１０％とトピックモデルによって判定された場合、評価対象のプライマーセットの増幅可能性は９０％と評価できる。その増幅可能性については、最も可能性が高いトピックの増幅確率を設定しても良い。トピック１に所属する確率が９０％、トピック３に所属する確率が１０％である場合、評価対象のプライマーセット（１）と鋳型ＤＮＡとの組み合わせの増幅可能性は、トピック１の増幅可能性を採用して１００％と予測することもできる。このように、増幅成功率反映済分類データと評価対象のプライマーセットとを照合することで、増幅の可能性を評価することができる。

　次に、鋳型ＤＮＡ－プライマー関係性評価装置２０における関係性評価処理の流れについて説明を行う。図９は、鋳型ＤＮＡ－プライマー関係性評価装置２０における関係性評価処理の流れを表したフローチャート図である。この図９において、先ず、鋳型ＤＮＡ－プライマー関係性評価装置２０は、図５に示すステップＳ１０１～Ｓ１１２の処理を実行することによって、評価対象のプライマーと鋳型ＤＮＡとの間で生成された複数の単語の取得を行う（Ｓ２０１）。次に、鋳型ＤＮＡ－プライマー関係性評価装置２０は、単語群についてトピックモデルを用いてトピック毎の所属可能性を表す確率を出力する（Ｓ２０２）。ここでの確率は、単語群の所属する可能性について、トピック番号と所属可能性（％）の複数の組み合わせで出力される。

　また、鋳型ＤＮＡ－プライマー関係性評価装置２０は、同一鋳型ＤＮＡについて予め記憶された増幅成功率反映済分類データを読み出す（Ｓ２０３）。そして、鋳型ＤＮＡ－プライマー関係性評価装置２０は、評価対象のプライマーに関するトピック毎の所属可能性を表す確率を増幅成功率反映済分類データと照合する処理を実行する（Ｓ２０４）。最後に、鋳型ＤＮＡ－プライマー関係性評価装置２０は、照合で得られた評価対象プライマーについての増幅可能性に関する評価を出力して（Ｓ２０５）、処理を終了する。

　以上のように、本発明に係る鋳型ＤＮＡ－プライマー関係性評価装置２０によれば、評価対象の鋳型ＤＮＡの塩基配列情報を取得し、評価対象のプライマーの塩基配列情報を取得し、鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマー（以下、照合対象という）に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列（以下、単語という）として生成する結合可能位置コード化処理を実行し、結合可能位置コード化処理において生成された単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率として出力する処理を実行し、評価対象の鋳型ＤＮＡと既知のプライマーとの間で予め行われた少なくとも１以上のＰＣＲ実験によって得られた各プライマーの増幅成功率情報を、当該ＰＣＲ実験に用いた鋳型ＤＮＡとプライマーに対して結合可能位置コード化処理及び単語分類処理を行うことで得られた複数トピックへの分類結果に対して反映させることで、各トピックの増幅成功率を表した増幅成功率反映済分類データを作成して予め記憶手段に記憶させておき、評価対象の鋳型ＤＮＡと評価対象のプライマーに関する単語群についてのトピック毎の所属可能性を表す確率を記憶手段に記憶された当該鋳型ＤＮＡに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型ＤＮＡに対する増幅成功率を予測して評価するようにしたので、評価対象のプライマーに関する単語分類結果を増幅成功率反映済分類データと照合することで、評価対象のプライマーの増幅可能性に関する評価を出力することが可能となる。これにより、未実施のプライマーについて実際のＰＣＲ実験を行う前に増幅可能性を知ることができるため、ＰＣＲ実験を行わない段階において有効なプライマーを絞り込むことが可能となる。

　なお、第２の実施の形態について説明する際に、図７及び図８の例では、一つの鋳型ＤＮＡと複数のプライマーセットとの関係性を用いて説明を行ったが、これは説明を簡略化するために行ったものであり、これに限定されるものではない。複数の鋳型ＤＮＡと複数のプライマーセットとの関係性について、増幅成功率反映済分類データの生成やトピックモデルによる分類処理を一緒に扱って処理するようにしてもよい。

［第３の実施の形態］
　前記第１及び第２の実施の形態においては、ＰＣＲ実験によって鋳型ＤＮＡを増殖する場合の最適プライマーの選定に用いる技術として説明を行ったが、ＯＥ－ＰＣＲ（Overlap extension Polymerase Chain Reaction：オーバーラップエクステンションポリメラーゼ連鎖反応）に対しても本発明を適用することができる。

　図１０は、ＯＥ－ＰＣＲの手順を示した説明図である。図１０（ａ）に示すように、それぞれが６０塩基程度からなる複数のオリゴマー（図１０（ａ）の例では４つのオリゴマー）について、隣り合うオリゴマー同士がそれぞれの端部についてオーバーラップした箇所で結合した状態において、図１０（ｂ）に示すように、ＤＮＡポリメラーゼによる合成反応を起こさせて相補的なＤＮＡ合成を促進させると、図１０（ｃ）に示すように、合成鎖は二重鎖の末端まで到達し、最終的には完全な二重鎖が形成される。この技術を用いることにより、１００～数千塩基のＤＮＡを鋳型を準備せずに合成することが可能となる。

　ＯＥ－ＰＣＲについて、本発明を適用する場合には、対象としての鋳型ＤＮＡの代わりに、合成したいＤＮＡの塩基配列情報を取得し、ＯＥ－ＰＣＲの処理に用いるオリゴマーについてオーバーラップさせたい領域の塩基配列箇所をプライミング領域に設定して、合成したいＤＮＡ及び全てのオリゴマーの全ての間の関係性について、結合可能位置コード化処理部１３において所定のコードに基づいて単語を生成するようにし、生成した単語について単語分類処理部１４においてトピックモデルを用いた分類処理を実行する。

　このようにして、合成したいＤＮＡ及び全てのオリゴマーの全ての間の関係性について解析することで、本発明に係る鋳型ＤＮＡ－プライマー関係性解析装置１０、鋳型ＤＮＡ－プライマー関係性評価装置２０と同様に、ＯＥ－ＰＣＲにおけるオリゴマーの選定について、実際のＯＥ－ＰＣＲ実験を行う前に有効なオリゴマーを絞り込むことが可能となる。

　前記第１及び第２の実施の形態において説明した技術は、腫瘍の悪性度の判断など、疾病に関係する遺伝子変異の迅速診断用ＰＣＲの開発を可能にする。この用途に本発明を利用する場合には、本発明での分類を試行結果で向上させる性質を用い、試行を効率的に繰り返すことにより、正常遺伝子ではＰＣＲが起きず、変異遺伝子で特異的にＰＣＲを起こすプライマーを設計することが可能になる。

　　１０　鋳型ＤＮＡ－プライマー関係性解析装置
　　１１　鋳型ＤＮＡ塩基配列取得部
　　１２　プライマー塩基配列取得部
　　１３　結合可能位置コード化処理部
　　１４　単語分類処理部
　　１５　記憶部
　　２０　鋳型ＤＮＡ－プライマー関係性評価装置
　　２１　プライマー評価処理部
　　２２　記憶部

Claims

　鋳型ＤＮＡの塩基配列情報を取得する鋳型ＤＮＡ塩基配列取得部と、
　プライマーの塩基配列情報を取得するプライマー塩基配列取得部と、
　鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマー（以下、照合対象という）に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列（以下、単語という）として生成する結合可能位置コード化処理部と、
　前記結合可能位置コード化処理部において生成された全ての単語についてトピックモデルを用いて複数のトピックに分類する処理を行う単語分類処理部と
　を備える鋳型ＤＮＡ－プライマー関係性解析装置。
　前記照合単位所定数塩基は、３個～８個の塩基とした
　請求項１記載の鋳型ＤＮＡ－プライマー関係性解析装置。
　前記所定のコードは、鋳型ＤＮＡのプライミング領域と、プライミング領域以外の鋳型ＤＮＡの領域と、プライマー自身又はプライマー間での結合の場合の領域とで、異なるコードを用いるようにした
　請求項１又は請求項２に記載の鋳型ＤＮＡ－プライマー関係性解析装置。
　鋳型ＤＮＡの塩基配列情報を取得する鋳型ＤＮＡ塩基配列取得手順と、
　プライマーの塩基配列情報を取得するプライマー塩基配列取得手順と、
　鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマー（以下、照合対象という）に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列（以下、単語という）として生成する結合可能位置コード化処理手順と、
　前記結合可能位置コード化処理手順において生成された全ての単語に対してトピックモデルを用いた分類処理を行う単語分類処理手順と
　を含む鋳型ＤＮＡ－プライマー関係性解析方法。
　鋳型ＤＮＡとプライマーの関係性を解析する処理をコンピュータに実現させるための鋳型ＤＮＡ－プライマー関係性解析プログラムであって、
　前記コンピュータに、
　鋳型ＤＮＡの塩基配列情報を取得する鋳型ＤＮＡ塩基配列取得機能と、
　プライマーの塩基配列情報を取得するプライマー塩基配列取得機能と、
　鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマー（以下、照合対象という）に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列（以下、単語という）として生成する結合可能位置コード化処理機能と、
　前記結合可能位置コード化処理機能において生成された全ての単語に対してトピックモデルを用いた分類処理を行う単語分類処理機能と
　を実現させる鋳型ＤＮＡ－プライマー関係性解析プログラム。
　評価対象の鋳型ＤＮＡの塩基配列情報を取得する鋳型ＤＮＡ塩基配列取得部と、
　評価対象のプライマーの塩基配列情報を取得するプライマー塩基配列取得部と、
　前記鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマー（以下、照合対象という）に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列（以下、単語という）として生成する結合可能位置コード化処理部と、
　前記結合可能位置コード化処理部において生成された単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率として出力する処理を行う単語分類処理部と、
　前記評価対象の鋳型ＤＮＡと既知のプライマーとの間で予め行われた少なくとも１以上のＰＣＲ実験によって得られた各プライマーの増幅成功率情報を、当該ＰＣＲ実験に用いた前記鋳型ＤＮＡとプライマーに対して結合可能位置コード化処理及び単語分類処理を行うことで得られた複数トピックへの分類結果に対して反映させることで、各トピックの増幅成功率を表した増幅成功率反映済分類データを作成して予め記憶手段に記憶させておき、前記評価対象の鋳型ＤＮＡと前記評価対象のプライマーに関して前記単語分類処理部において出力されたトピック毎の所属可能性を表す確率を前記記憶手段に記憶された当該鋳型ＤＮＡに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型ＤＮＡに対する増幅成功率を予測して評価するプライマー評価処理部と
　を備える鋳型ＤＮＡ－プライマー関係性評価装置。
　前記照合単位所定数塩基は、３個～８個の塩基とした
　請求項６記載の鋳型ＤＮＡ－プライマー関係性評価装置。
　前記所定のコードは、鋳型ＤＮＡのプライミング領域と、プライミング領域以外の鋳型ＤＮＡの領域と、プライマー自身又はプライマー間での結合の場合の領域とで、異なるコードを用いるようにした
　請求項６又は請求項７に記載の鋳型ＤＮＡ－プライマー関係性評価装置。
　評価対象の鋳型ＤＮＡの塩基配列情報を取得する鋳型ＤＮＡ塩基配列取得手順と、
　評価対象のプライマーの塩基配列情報を取得するプライマー塩基配列取得手順と、
　前記鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマー（以下、照合対象という）に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列（以下、単語という）として生成する結合可能位置コード化処理手順と、
　前記結合可能位置コード化処理手順において生成された単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率として出力する処理を行う単語分類処理手順と、
　前記評価対象の鋳型ＤＮＡと既知のプライマーとの間で予め行われた少なくとも１以上のＰＣＲ実験によって得られた各プライマーの増幅成功率情報を、当該ＰＣＲ実験に用いた前記鋳型ＤＮＡとプライマーに対して結合可能位置コード化処理及び単語分類処理を行うことで得られた複数トピックへの分類結果に対して反映させることで、各トピックの増幅成功率を表した増幅成功率反映済分類データを作成して予め記憶手段に記憶させておき、前記評価対象の鋳型ＤＮＡと前記評価対象のプライマーに関して前記単語分類処理手順において出力されたトピック毎の所属可能性を表す確率を前記記憶手段に記憶された当該鋳型ＤＮＡに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型ＤＮＡに対する増幅成功率を予測して評価するプライマー評価処理手順と
　を含む鋳型ＤＮＡ－プライマー関係性評価方法。
　鋳型ＤＮＡとプライマーの関係性を評価する処理をコンピュータに実現させるための鋳型ＤＮＡ－プライマー関係性解析プログラムであって、
　前記コンピュータに、
　評価対象の鋳型ＤＮＡの塩基配列情報を取得する鋳型ＤＮＡ塩基配列取得機能と、
　評価対象のプライマーの塩基配列情報を取得するプライマー塩基配列取得機能と、
　前記鋳型ＤＮＡから得られる２つの一本鎖鋳型ＤＮＡ及び２つのプライマー（以下、照合対象という）に対して、プライマーを所定数の塩基毎に分割して抽出した照合単位所定数塩基を、照合対象の結合可能方向の先頭の塩基から順次１塩基ずつずらした位置においてその都度照合処理を行って、所定数のうち過半数以上の位置で結合関係が成立する場合に、照合位置での相対する所定数の塩基の関係性を所定のコードで表現した文字列（以下、単語という）として生成する結合可能位置コード化処理機能と、
　前記結合可能位置コード化処理機能において生成された単語群についてトピックモデルを用いて当該単語群が複数のトピックのうち何れのトピックに所属する可能性が高いかを表す確率を求め、トピック毎の所属可能性を表す確率として出力する処理を行う単語分類処理機能と、
　前記評価対象の鋳型ＤＮＡと既知のプライマーとの間で予め行われた少なくとも１以上のＰＣＲ実験によって得られた各プライマーの増幅成功率情報を、当該ＰＣＲ実験に用いた前記鋳型ＤＮＡとプライマーに対して結合可能位置コード化処理及び単語分類処理を行うことで得られた複数トピックへの分類結果に対して反映させることで、各トピックの増幅成功率を表した増幅成功率反映済分類データを作成して予め記憶手段に記憶させておき、前記評価対象の鋳型ＤＮＡと前記評価対象のプライマーに関して前記単語分類処理機能において出力されたトピック毎の所属可能性を表す確率を前記記憶手段に記憶された当該鋳型ＤＮＡに関する増幅成功率反映済分類データと照合することで、当該評価対象のプライマーについて当該鋳型ＤＮＡに対する増幅成功率を予測して評価するプライマー評価処理機能と
　を実現させる鋳型ＤＮＡ－プライマー関係性評価プログラム。