JP5587197B2 - Dna証拠の考察に関する改善 - Google Patents

Dna証拠の考察に関する改善 Download PDF

Info

Publication number
JP5587197B2
JP5587197B2 JP2010533661A JP2010533661A JP5587197B2 JP 5587197 B2 JP5587197 B2 JP 5587197B2 JP 2010533661 A JP2010533661 A JP 2010533661A JP 2010533661 A JP2010533661 A JP 2010533661A JP 5587197 B2 JP5587197 B2 JP 5587197B2
Authority
JP
Japan
Prior art keywords
pdf
dna
given
probability distribution
likelihood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010533661A
Other languages
English (en)
Other versions
JP2011504359A (ja
Inventor
プフ−ソリス,ロベルト
Original Assignee
フォレンジック サイエンス サービス リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GB0722649A external-priority patent/GB0722649D0/en
Priority claimed from GB0804665A external-priority patent/GB0804665D0/en
Priority claimed from GB0810624A external-priority patent/GB0810624D0/en
Priority claimed from GB0815300A external-priority patent/GB0815300D0/en
Application filed by フォレンジック サイエンス サービス リミテッド filed Critical フォレンジック サイエンス サービス リミテッド
Publication of JP2011504359A publication Critical patent/JP2011504359A/ja
Application granted granted Critical
Publication of JP5587197B2 publication Critical patent/JP5587197B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

本発明は、証拠、特にこれに限られないがDNA証拠の考察における、またこれに関する改善に係るものである。
多くの状況において、特に法科学において、一つの証拠を一つまたは複数の他の証拠と突き合わせて考察する必要がある。
たとえば、犯行現場から収集された試料を、ある人物から収集された試料と比較することが望ましいことがありうる。それらのDNAの特徴を比較することによって両者を結び付けることを視野に入れてのことである。これは証拠考察(evidential consideration)である。結果は、刑事または民事の法的手続において直接使用されることがありうる。そのような状況は、犯行現場からの試料が二人以上の人物によって寄与されている事例を含む。
他の例では、データベースに記憶されたDNA試料の特徴の例とさらなる試料との間の最も確からしい一致を確立することが望ましいことがありうる。示唆される最も確からしい一致またはリンク〔結び付き〕は、さらなる捜査のガイドとなりうる。これはインテリジェンス考察(intelligence consideration)である。
これら両方の例において、なされた比較の強さまたは確からしさ、いわゆる尤度比(likelihood ratio)を表現できることが望ましい。
D. J. Balding, M. Greenhalgh, R. A. Nichols (1996), Population genetics of STR loci in Caucasians, 108:300-305 D. J. Balding (2005), Weight-of-evidence for forensic DNA profiles, John Wiley & Sons Ltd. J. Buckleton, C. M. Triggs, S. J. Walsh (2005), "Forensic DNA evidence interpretation", CRC press A. Dempster, N. Laird, and D. Rubin (1977) "Maximum likelihood from incomplete data via the EM algorithm", Journal of the Royal Statistical Society, Series B, 39(1): 1-38 G. Casella & R. L. Berger (1990) "Statistical Inference", Wadsworth & Brooks/Cole Advanced Books Software, Pacific Grove, California, USA, p.148 G. Mclachlan, D. Peel (2000), "Finite mixture models", John Wiley & Sons, Inc.
本発明の可能なねらいのうちに、尤度比を確立することがある。本発明の可能なねらいのうちに、尤度比を確立するためのより精確なまたはより堅牢な方法を提供することがある。本発明の可能なねらいのうちに、尤度比を確立する際に使うための確率分布関数を与えることがある。ここで、確率分布関数は実験データから導出される。
本発明の第一の側面によれば、試験試料結果セットを別の試料結果セットと比較する方法であって:
DNAの可変特徴について検出された一つまたは複数の素性について第一の結果セットについての情報を提供し;
DNAの可変特徴について検出された一つまたは複数の素性について第二の結果セットについての情報を提供することを含む、
方法を提供する。
前記比較方法は、たとえば民事または刑事上の法的手続において考察される証拠に対して使用されうる。比較は、ある仮設の他の仮設に対する相対的な尤度、たとえば尤度比についてであってもよい。比較は、ある仮設を他の仮設に関係付ける証拠の相対的な尤度についてであってもよい。特に、これは法的手続における起訴者側によって提出される仮設および法的手続において弁護側によって提出される別の仮設であってもよい。尤度比(likelihood ratio)は、
Figure 0005587197
の形であってもよい。ここで、
・Cは第一の結果セットすなわち試験試料からの試験結果セット、より具体的には、犯罪に結び付けられた人物または場所から回収された試料から取られた第一の結果セットであり、可能性としてはピーク位置および/または高さを用いて表される;
・Sは第二の結果セットすなわち別の結果セット、より具体的には、ある人物から収集された試料から取られた第二の結果セットであり、特に被疑者の遺伝子型として表される;
・Hpは一つの仮設、より具体的には、「被疑者が犯行現場にその試料を残した」ことを述べる、法的手続における起訴者側(prosecution)仮設である;
・Hdは代替仮設、より具体的には、「誰か別の者が犯行現場にその試料を残した」ことを述べる、法的手続における弁護側(defence)仮設である。
尤度比は:
Figure 0005587197
として定義されうる。ここで、UiはHdにおいて述べられている想定されるソース〔出所〕の一つである。
尤度比は:
Figure 0005587197
として定義されうる。ここで、f項は尤度である因子である。
因子Pr(Ui|S,Hd)は、さまざまな方法を使って計算されうる。そうした方法には、被疑者と未知の寄与者との間の関係性(relatedness)の考察を含みうるものならびに/または非特許文献2および/または非特許文献3に記載されるものが含まれる。
因子f(C|S,Hp)および/またはf(C|Ui,S,Hd)は同じ型の計算の陳述として解釈されうる。これらの因子は、想定される提供者〔ドナー〕が与えられたときにC内のピーク高さのセットを観察する尤度の定義として解釈されうる。
比較は、項:
f(C|G)
の考察を含みうる。ここで、Gは想定される提供者の遺伝子型を表す。比較は、この項の、尤度比の分母としてまたは分母の要素としての考察および/またはこの項の、尤度比の分子としてまたは分子の要素としての考察を含みうる。
項f(C|G)は推定でありうる。項f(C|G)は実験データから導出されうる。項f(C|G)は実験データから導出される推定でありうる。項f(C|G)は一つまたは複数の確率分布関数であってもよいし、あるいは一つまたは複数の確率分布関数を含んでいてもよい。項f(C|G)は、本発明の第七の側面に基づいて与えられる一つまたは複数の確率分布関数であってもよいし、あるいはそのような一つまたは複数の確率分布関数を含んでいてもよい。項f(C|G)は本発明の第二の側面において定義され、あるいはさらに定義されてもよい。
前記比較方法は、第一および/または第二の試料におけるDNAの量を条件としない尤度比に関わってもよい。
前記比較方法は、第一および/または第二の試料におけるDNAの量を条件とする尤度比に関わってもよい。
前記比較方法は、項f(C|G)を:
f(C|G)=Σj f(C|G,χj)Pr(χj|I(h))
によって定義されるものとして定義することを含んでもよい。ここで、Pr(χj|I(h))は、好ましくは実験的に導出されるピーク高さ情報I(h)が与えられたときのDNA量の確率分布である。
項f(C|G)は、このようにして試験試料におけるDNA量を条件としてもよい。項f(C|G)および/またはf(C|G,χj)は、本発明の第三の側面において定義され、あるいはさらに定義されてもよい。
項f(C|G,χj)は推定でありうる。項f(C|G,χj)は実験データから導出されうる。項f(C|G,χj)は実験データから導出される推定でありうる。項f(C|G,χj)は一つまたは複数の確率分布関数であってもよいし、あるいは一つまたは複数の確率分布関数を含んでいてもよい。項f(C|G,χj)は、本発明の第七の側面に基づいて与えられる一つまたは複数の確率分布関数であってもよいし、あるいはそのような一つまたは複数の確率分布関数を含んでいてもよい。項f(C|G,χj)は本発明の第三の側面において定義され、あるいはさらに定義されてもよい。
前記比較方法は、さらなる捜査または法的手続を支援するために情報を集めるために使用されうる。前記比較方法は、ある状況についてのインテリジェンスを提供しうる。前記比較方法は、第二のまたは別の試料結果の情報を与えられたときの、第一のまたは試験試料結果の情報の尤度についてでありうる。前記比較方法は、理想的には尤度に従って順位付けされた、可能な他の試料結果のリスト化を提供しうる。前記比較方法は、犯行現場試料からのDNAプロファイルとデータベースに記憶されている一つまたは複数のDNAプロファイルとの間の結び付きを確立しようとしうる。
前記比較方法は、尤度比を考察しうる。好ましくは尤度比、より好ましくは事後確率が:
Figure 0005587197
として定義される。ここで:
Cは第一の結果セットすなわち試験試料からの試験結果セット、より具体的には、犯罪に結び付けられた人物または場所から回収された試料から取られた第一の結果セットであり、可能性としてはピーク位置および/または高さを用いて表される;
Giは第二の結果セットすなわち別の結果セット、より具体的には、潜在的な提供者遺伝子型の網羅的なリストのさまざまなメンバーである;
Pr(Gi)は遺伝子型Giについての事前分布であり、好ましくはある人口集団、特に考察対象の試験試料が由来する人口集団について計算される。これは、非特許文献1によって導入された公式を使って計算されることができる。
比較は、項f(C|Gi)の考察を含みうる。前記方法は、f(C|G)について提案された特徴、オプションまたは可能性の任意のものがf(C|Gi)に適用されることを含みうる。
前記比較方法は、第一および/または第二の試料におけるDNAの量を条件としない尤度比に関わってもよい。
前記比較方法は、第一および/または第二の試料におけるDNAの量を条件とする尤度比に関わってもよい。
前記比較方法は、項Pr(Gi|C)を:
Figure 0005587197
によって定義されるものとして定義することを含んでもよい。ここで、Pr(χj|I(h))は、ピーク高さについての情報が与えられたときのDNA量の確率分布である。
項Pr(χj|I(h))は本発明の第四の側面において定義され、あるいはさらに定義されてもよい。
項f(C|G1,G2)は本発明の第五の側面において定義され、あるいはさらに定義されてもよい。
前記比較方法は、次のような状況のうちの一つまたは複数において使用されうる:
1)証拠コンテキストにおいて、単一ソース試料について、DNA量を条件とすることなしに;
2)証拠コンテキストにおいて、単一ソース試料について、DNA量を条件として;
3)インテリジェンス・コンテキストにおいて、単一ソース試料について、DNA量を条件とすることなしに;
4)インテリジェンス・コンテキストにおいて、単一ソース試料について、DNA量を条件として;
5)証拠コンテキストにおいて、混合ソース試料について、DNA量を条件とすることなしに;
6)証拠コンテキストにおいて、混合ソース試料について、DNA量を条件として;
7)インテリジェンス・コンテキストにおいて、混合ソース試料について、DNA量を条件とすることなしに;
8)インテリジェンス・コンテキストにおいて、混合ソース試料について、DNA量を条件として。
本発明の第二の側面によれば、第一の、潜在的には試験試料結果セットを第二の、潜在的には別の試料結果セットと比較する方法であって:
DNAの可変特徴について検出された一つまたは複数の素性について第一の結果セットについての情報を提供し;
DNAの可変特徴について検出された一つまたは複数の素性について第二の結果セットについての情報を提供することを含み、
当該方法が、因子f(C|G)またはその因子を組み込む因子を使用し、fは尤度の表現であり、Cは第一の結果セットの情報であり、Gは第二の結果セットの情報である、
方法を提供する。
因子f(C|G)は、第二の結果セットの情報が与えられたときの第一の結果セットの情報を観察する尤度の表現でありうる。因子f(C|G)は、所与の遺伝子型、特に被疑者および/または別の人物の遺伝子型における情報が与えられたときの犯行現場から採取された試料からの情報を観察する尤度の表現でありうる。
比較は、この項の、尤度比の分母としてまたは分母の要素としての考察および/またはこの項の、尤度比の分子としてまたは分子の要素としての考察を含みうる。尤度比は:
Figure 0005587197
の形であってもよい。ここで、
・Cは試験試料からの第一の結果セット、より具体的には、犯罪に結び付けられた人物または場所から回収された試料から取られた第一の結果セットであり、可能性としてはピーク位置および/または高さを用いて表される;
・Sは第二の結果セット、より具体的には、ある人物から収集された試料から取られた第二の結果セットであり、特に被疑者の遺伝子型として表される;
・Hpは一つの仮設、より具体的には、「被疑者が犯行現場にその試料を残した」ことを述べる、法的手続における起訴者側(prosecution)仮設である;
Hdは代替仮設、より具体的には、「誰か別の者が犯行現場にその試料を残した」ことを述べる、法的手続における弁護側(defence)仮設である。
項f(C|G)は推定でありうる。項f(C|G)は実験データから導出されうる。項f(C|G)は実験データから導出される推定でありうる。項f(C|G)は一つまたは複数の確率分布関数であってもよいし、あるいは一つまたは複数の確率分布関数を含んでいてもよい。項f(C|G)の推定は、希釈データ(dilution data)、具体的にはヘテロ接合の(heterozygous)ソースからおよび/または、好ましくは別個に、ヘテロ接合のソースから収集されるデータの考察によって提供されうる。f(C|G)の推定は、一つまたは複数の関心のある座位(loci)からの対照試料(control sample)解析データを一緒にグループ化することによって与えられうる。あるデータベースに情報が記憶されている、および/またはある解析方法を使って解析される、および/または多重増幅(multiplex amplification)製品を使って解析される全座位をカバーするf(C|G)の単一の推定が提供されうる。各座位についてf(C|G)の別個の推定が提供されうる。f(C|G)の推定は、二次元密度推定および/または二次元確率分布関数を使って生成されうる。
項f(C|G)は、本発明の第七の側面に基づいて与えられる一つまたは複数の確率分布関数であってもよいし、あるいはそのような一つまたは複数の確率分布関数を含んでいてもよいし、および/またはそのような一つまたは複数の確率分布関数を使って計算されてもよい。
項f(C|G)は、項f(C|S,Hp)および/または項f(C|Ui,S,Hd)を計算するために使用されうる。
Figure 0005587197
の形の尤度比は、
Figure 0005587197
として定義されてもよい。ここで、UiはHdにおいて述べられている想定されるソースの一である。
Figure 0005587197
の形の尤度比は、
Figure 0005587197
として定義されてもよい。ここで、f項は尤度である因子である。
因子Pr(Ui|S)は、非特許文献2および/または非特許文献3に記載される部分人工集団構造方程式(subpopulation structure equation)のような部分人工集団構造方程式を使って計算されうる。
前記比較方法は、被疑者および/または解析において観察される情報についての次のようなシナリオの一つまたは複数を考察しうる:
a)被疑者はヘテロ接合で、犯罪プロファイルは一つのピークをもつ;
b)被疑者はヘテロ接合で、犯罪プロファイルは二つのピークをもつ;
c)被疑者はヘテロ接合で、犯罪プロファイルはピークを含まない;
d)被疑者はホモ接合で、犯罪プロファイルは一つのピークを含む;
e)被疑者はホモ接合で、犯罪プロファイルはピークを含まない。
被疑者がヘテロ接合であり(S={a,b}と述べられる)、試験試料または第一の試料が一つのピークをもつ(C={hb}と述べられる)場合、尤度比は:
Figure 0005587197
として定義されうる。
好ましくは、この尤度比における分子は:
Figure 0005587197
として定義される。ここで、haは、検出閾値より小さいピーク高さまたはピーク面積またはピーク・ウェイトであり、よって結果においては観察されない。
好ましくは、この尤度比における分母は:
f(C={hb}|Hd)= f(C={hb}|U={b,b},Hd)Pr(U={b,b}|S={a,b}Hd)
+f(C={hb}|U={b,Q},Hd)Pr(U={b,Q}|S={a,b}Hd)
として定義される。ここで、Qはa以外の他の任意の対立形質(allele)素性である。
因子Pr(U={b,b}|S={a,b}Hd)およびPr(U={b,Q}|S={a,b}Hd)は、非特許文献1に記載される人口集団部分構造計算(population substructure calculations)を使って計算されうる。
前記因子は:
Pr(C={hb}|U={b,b},Hd)=fhet(0.5hb,0.5hb)
を考察しうる。ここで、fhetは、ヘテロ接合の提供者に由来する高さの対に対する二次元pdfである。
前記因子は、前記位置を、第8頁下部で後述する解に関係するまたは等しいものとして考察しうる。
前記因子は、前記位置を、fhomとして考察し、解の記述を、たとえば:
Pr(C={hb}|U={b,b},Hd)=fhom(hb)
としてポイントしてもよい。
前記因子は
Figure 0005587197
を考察してもよい。ここで、hQは、閾値tより小さい。
被疑者がヘテロ接合であり(S={a,b}と述べられる)、第一のまたは試験試料が二つのピークをもつ(C={ha,hb}と述べられる)場合、LRは:
Figure 0005587197
として定義されうる。
このLRにおける分子は:
f(C={ha,hb}|S={a,b},Hd)=fhet(ha,hb)
によって定義される。
分母は:
f(C={ha,hb}|S={a,b},Hd)=fhet(ha,hb)Pr(U={a,b}|S={a,b}Hd)
によって与えられる。
LRは
Figure 0005587197
として定義されうる。
被疑者がヘテロ接合であり(S={b,b}と述べられる)、第一のまたは試験試料が一つの対立形質を含むプロファイルを与える(C={hb}と述べられる)場合、LRは:
Figure 0005587197
として定義されうる。
分子は:
f(C={hb}|S={b,b},Hp)=fhom(hb)
によって与えられうる。これは、ホモ接合型寄与者について推定された密度関数でありうる。
分母は:
f(C={hb}|S={b,b},Hd)
= f(C={hb}|U={b,b},Hd)Pr(U={b,b}|S={b,b})
+f(C={hb,hQ<Td}|U={b,Q},Hd)Pr(U={b,Q}|S={b,b})
によって与えられうる。
項f(C={hb}|U={b,b},S={b,b},Hd)=fhom(hb)は分子と同じである。
Figure 0005587197
は、ピーク高さについてのpdfを推定することによって得ることができる。
被疑者がホモ接合であり(C={hb}と述べられる)、試験試料または第一の試料が一つの対立形質hbを含むプロファイルを与える場合、ホモ接合型提供者についての尤度は:
f(C={hb}|G={b,b})=fhom(hb)
によって与えられうる。ここで、fhomはいくつかの方法によって計算できる。たとえば、本稿の別の箇所に記載される回転の方法によって、および/または方法
Figure 0005587197
によってである。ここで、fhet(αhb,(1−α)hb)はヘテロ接合体について計算される二次元確率密度関数であり、f(α)はαについての確率密度関数であり、αはそのホモ接合体の対立形質の一つによって与えられるそのホモ接合体の割合であり、1−αはそのホモ接合体の他方の対立形質による割合である。
前記関数は、0.5に近いαについて:
fhom(hb)=fhet(αhb,(1−α)hb)
によって近似されうる。
前記比較方法は、さらなる捜査または法的手続を支援するための情報を集めるために使用されうる。前記比較方法は、ある状況についてのインテリジェンスを提供しうる。前記比較方法は、第二のまたは別の試料結果の情報を与えられたときの、第一のまたは試験試料結果の情報の尤度についてでありうる。前記比較方法は、理想的には尤度に従って順位付けされた、可能な他の試料結果のリスト化を提供しうる。前記比較方法は、犯行現場試料からのDNAプロファイルとデータベースに記憶されている一つまたは複数のDNAプロファイルとの間の結び付きを確立しようとしうる。
前記方法は、犯行現場DNAプロファイルCを採取し、被疑者のプロファイルの順序付けられたリストを決定することを含みうる。ここで、前記リスト中の最初のプロファイルは最も確からしい提供者の遺伝子型である。前記方法は、遺伝子型のリスト{G1,G2,...,Gm}を提案し、次いでそれらの遺伝子型を、犯行現場プロファイルCが与えられたときの遺伝子型の事後確率に従って順位付けしうる。
前記比較方法は、尤度比、あるいはより好ましくは事後確率を考察しうる。好ましくは、尤度比、より好ましくは事後確率は:
Figure 0005587197
として定義される。ここで:
Cは第一の結果セットすなわち試験試料からの試験結果セット、より具体的には、犯罪に結び付けられた人物または場所から回収された試料から取られた第一の結果セットであり、可能性としてはピーク位置および/または高さを用いて表される;
Giは第二の結果セットすなわち別の結果セット、より具体的には、潜在的な提供者遺伝子型の網羅的なリストのさまざまなメンバーである;
Pr(Gi)は遺伝子型Giについての事前分布であり、好ましくはある人口集団、特に考察対象の試験試料が由来する人口集団について計算される。これは、一様分布であることができ、あるいは非特許文献1および非特許文献2に記載された遺伝子型確率公式を使って計算されることができる。
比較は、項f(C|Gi)の考察を含みうる。前記方法は、f(C|G)について提案された特徴、オプションまたは可能性の任意のものがf(C|Gi)に適用されることを含みうる。
本発明の第三の側面によれば、第一の、潜在的には試験試料結果セットを第二の、潜在的には別の試料結果セットと比較する方法であって:
DNAの可変特徴について検出された一つまたは複数の素性について第一の結果セットについての情報を提供し;
DNAの可変特徴について検出された一つまたは複数の素性について第二の結果セットについての情報を提供することを含み、
当該方法が、因子f(C|G)またはその因子を組み込む因子を使用し、
f(C|G)=Σj f(C|G,χj)Pr(χj|I(h))
であり、fはこれが尤度の表現であることを意味し、Cは第一の結果セットの情報であり、Gは第二の結果セットの情報であり、Pr(χj|I(h))は、第一の結果セットおよび/または第二の結果セットにおいて考察される一つまたは複数の素性のある定量的指標I(h)が与えられたときのDNA量χjの確率分布である、
方法を提供する。
好ましくは、Pr(χj|I(h))は、ピーク高さおよび/またはピーク面積および/またはピーク・ウェイトについてのDNA量の確率分布である。
好ましくは、項f(C|G,χi)は、DNA量を条件とすることによって計算される。
因子f(C|G,χi)は、第二の結果セットの情報が与えられたときの第一の結果セットの情報を観察する尤度の表現でありうる。因子f(C|G,χi)は、所与の遺伝子型、特に被疑者および/または別の人物の遺伝子型における情報が与えられたときの犯行現場から採取された試料からの情報を観察する尤度の表現でありうる。
項f(C|G,χi)は推定でありうる。項f(C|G,χi)は実験データから導出されうる。項f(C|G,χi)は実験データから導出される推定でありうる。項f(C|G,χi)は一つまたは複数の確率分布関数であってもよいし、あるいは一つまたは複数の確率分布関数を含んでいてもよい。項f(C|G,χi)の推定は、希釈データ(dilution data)、具体的にはヘテロ接合の(heterozygous)ソースからおよび/または、好ましくは別個に、ヘテロ接合のソースから収集されるデータの考察によって提供されうる。
f(C|G,χi)の推定は、同じ量のDNAについての対照試料(control sample)解析データを一緒にグループ化することによって与えられうる。各DNA量についてf(C|G,χi)の別個の推定が与えられてもよい。因子f(C|G,χi)が推定されるDNA量はある範囲にわたって、好ましくは均等に、離間されていてもよい。
f(C|G,χi)の推定は、関心のある一つまたは複数の座位からの対照試料(control sample)解析データを一緒にグループ化することによって与えられうる。あるデータベースに情報が記憶されている、および/またはある解析方法を使って解析される、および/または多重増幅(multiplex amplification)製品を使って解析される全座位をカバーするf(C|G,χi)の単一の推定が提供されうる。各座位についてf(C|G,χi)の別個の推定が提供されうる。f(C|G,χi)の推定は、二次元密度推定および/または二次元確率分布関数を使って生成されうる。
項f(C|G,χi)は、本発明の第七の側面に基づいて与えられる一つまたは複数の確率分布関数であってもよいし、あるいはそのような一つまたは複数の確率分布関数を含んでいてもよいし、および/またはそのような一つまたは複数の確率分布関数を使って計算されてもよい。
前記比較方法は、さらなる捜査または法的手続を支援するために情報を集めるために使用されうる。前記比較方法は、ある状況についてのインテリジェンスを提供しうる。前記比較方法は、第二のまたは別の試料結果の情報を与えられたときの、第一のまたは試験試料結果の情報の尤度についてでありうる。前記比較方法は、理想的には尤度に従って順位付けされた、可能な他の試料結果のリスト化を提供しうる。前記比較方法は、犯行現場試料からのDNAプロファイルとデータベースに記憶されている一つまたは複数のDNAプロファイルとの間の結び付きを確立しようとしうる。
前記方法は、犯行現場DNAプロファイルCを採取し、被疑者のプロファイルの順序付けられたリストを決定することを含みうる。ここで、前記リスト中の最初のプロファイルは最も確からしい提供者の遺伝子型である。前記方法は、遺伝子型のリスト{G1,G2,...,Gm}を提案し、その際それらの遺伝子型を、犯行現場プロファイルCが与えられたときの遺伝子型の事後確率に従って順位付けしうる。
前記比較方法は、尤度比を考察しうる。好ましくは、尤度比は、
Figure 0005587197
として定義される。ここで、Pr(χj|I(h))は、第一の結果セットおよび/または第二の結果セットにおいて考察される一つまたは複数の素性のある定量的指標I(h)が与えられたときのDNA量χjの確率分布である。Pr(χj|I(h))は好ましくは、ピーク高さについての情報が与えられたときのDNA量の確率分布である。
本発明の第四の側面によれば、第一の、潜在的には試験試料結果セットを第二の、潜在的には別の試料結果セットと比較する方法であって:
DNAの可変特徴について検出された一つまたは複数の素性について第一の結果セットについての情報を提供し;
DNAの可変特徴について検出された一つまたは複数の素性について第二の結果セットについての情報を提供することを含み、
当該方法が、因子Pr(χj|I(h))またはその因子を組み込む因子を使用し、因子Pr(χj|I(h))は、第一の結果セットおよび/または第二の結果セットにおいて考察される一つまたは複数の素性のある定量的指標I(h)が与えられたときのDNA量χjの確率分布である、
方法を提供する。
好ましくは、Pr(χj|I(h))は、ピーク高さおよび/またはピーク面積および/またはピーク・ウェイトについてのDNA量の確率分布である。
好ましくは、Pr(χj|I(h))についての前記確率分布は、χ1からχjについての離散的確率のリストに関係し、ここで、ΣiPr(χi)=1である。好ましくは、分布は、対照試料の解析から得られる観察された分布を考察することによって得られる。
前記定量的指標は、あらゆる座位にわたるすべての観察された値についての平均値であってもよい。前記定量的指標は、単一の座位についてのあらゆる値の平均であってもよい。前記定量的指標は、所与のDNA量についてあらゆる座位についてのあらゆる観察される値の平均値であってもよい。前記定量的指標は、所与のDNA量について単一の座位についてのあらゆる観察される値についての平均値であってもよい。
前記定量的指標は、ピーク高さおよび/またはピーク面積および/またはピーク・ウェイトであってもよい。
分布は推定されてもよい。分布は、好ましくは
Figure 0005587197
の形であってもよい。ここで、バー付きのhはあるDNA量χjを条件とする平均である。
ある座位についてのPr(X=χi|I(h))の計算は、座位(loci)の順序付けL1,L2,...,Lnに基づく逐次的な仕方で実行されてもよい。計算は、L1についてのPr(X=χi|I(h))を一様分布に設定することによって始まりうる。次の座位L2についてのPr(X=χi|I(h))の計算は、L1からのI(h)についての想定に基づきうる。その後の座位についてのその後の計算は、計算において先行する全座位についてのI(h)についての想定に基づきうる。たとえば、LnについてのPr(X=χi|I(h))はL1,L2,...,Ln-1からのI(h)に基づいて計算される。
項Pr(X=χi|I(h))は推定でありうる。項Pr(X=χi|I(h))は実験データから導出されうる。項Pr(X=χi|I(h))は実験データから導出される推定でありうる。項Pr(X=χi|I(h))は一つまたは複数の確率分布関数であってもよいし、あるいは一つまたは複数の確率分布関数を含んでいてもよい。項Pr(X=χi|I(h))の推定は、希釈データ(dilution data)、具体的にはヘテロ接合の(heterozygous)ソースからおよび/または、好ましくは別個に、ヘテロ接合のソースから収集されるデータの考察によって提供されうる。
Pr(X=χi|I(h))の推定は、同じ量のDNAについての対照試料(control sample)解析データを一緒にグループ化することによって与えられうる。Pr(X=χi|I(h))の別個の推定が、各DNA量について与えられてもよい。因子Pr(X=χi|I(h))が推定されるDNA量はある範囲にわたって、好ましくは均等に、離間されていてもよい。
Pr(X=χi|I(h))の推定は、関心のある一つまたは複数の座位からの対照試料(control sample)解析データを一緒にグループ化することによって与えられうる。あるデータベースに情報が記憶されている、および/またはある解析方法を使って解析される、および/または多重増幅(multiplex amplification)製品を使って解析される全座位をカバーするPr(X=χi|I(h))の単一の推定が提供されうる。各座位についてPr(X=χi|I(h))の別個の推定が提供されうる。Pr(X=χi|I(h))の推定は、二次元密度推定および/または二次元確率分布関数を使って生成されうる。
項Pr(X=χi|I(h))は、本発明の第七の側面に基づいて与えられる一つまたは複数の確率分布関数であってもよいし、あるいはそのような一つまたは複数の確率分布関数を含んでいてもよいし、および/またはそのような一つまたは複数の確率分布関数を使って計算されてもよい。
本発明の第五の側面によれば、第一の、潜在的には試験試料結果セットを第二の、潜在的には別の試料結果セットと比較する方法であって:
DNAの可変特徴について検出された一つまたは複数の素性について第一の結果セットについての情報を提供し;
DNAの可変特徴について検出された一つまたは複数の素性について第二の結果セットについての情報を提供することを含み、
当該方法が、因子f(C|G1,G2)またはその因子を組み込む因子を使用し、好ましくはfはこれが尤度の表現であることを意味し、Cは第一の結果セットの情報であり、G1およびG2は第二の結果セットの情報である、
方法を提供する。
因子f(C|G1,G2)は、因子f(C|S,Ui,Hp)およびf(C|Uj,Uk,S,Hd)を計算するために使用されうる。因子f(C|S,Ui,Hp)およびf(C|Uj,Uk,S,Hd)は、二つの想定されるソースまたは提供者が与えられたときの犯罪プロファイルCの尤度の表現であり得、潜在的には弁護側の仮設Hdおよび/または起訴者側の仮設Hpに基づきうる。G1およびG2は想定される提供者またはソースの遺伝子型でありうる。
本方法は、特に証拠コンテキストにおいて、特に二の寄与者から生じる混合ソース試料について、起訴者側仮設および弁護側仮設の考察に関わりうる。それらの仮設は:被疑者および別の誰かが、潜在的には犯行現場にあった血痕である第一の結果セットへの提供者であるという起訴者側仮設Hpおよび/または二人の未知の人が、潜在的には犯行現場にあった血痕である第一の結果セットへの提供者であるという弁護側仮設Hdであってもよい。それらの仮設は:被疑者および犠牲者が第一の結果セットへの提供者であるという起訴者側仮設Hpおよび/または犠牲者および未知の人が第一の結果セットへの提供者であるという弁護側仮設Hdであってもよい。それらの仮設は:二人の被疑者が第一の結果セットへの提供者であるという起訴者側仮設Hpおよび/または二人の未知の人が第一の結果セットへの提供者であるという弁護側仮設Hdであってもよい。一方または両方の仮設が、可能な寄与者のうちの関係性(relatedness)の陳述を含んでいてもよい。
LRは公式:
Figure 0005587197
によって与えられうる。ここで、
・Cは試験試料からの第一の結果セット、より具体的には、犯罪に結び付けられた人物または場所から回収された試料から取られた第一の結果セットであり、可能性としてはピーク位置および/または高さを用いて表される;
・Sは第二の結果セット、より具体的には、ある人物から収集された試料から取られた第二の結果セットであり、特に被疑者の遺伝子型として表される;
・Hpは一つの仮設、より具体的には、「被疑者が犯行現場にその試料を残した」ことを述べる、法的手続における起訴者側(prosecution)仮設である;
Hdは代替仮設、より具体的には、「誰か別の者が犯行現場にその試料を残した」ことを述べる、法的手続における弁護側(defence)仮設である。
LR公式は:
Figure 0005587197
と書ける。ここで、f(C|S,Ui,Hp)はSおよびUiが与えられたときのCの密度関数であり、f(C|Uj,Uk,S,Hd)はUj、UkおよびSが与えられたときのCの密度関数である。
因子Pr(Ui|S,Hp)およびPr(Uj,Uk|S,Hd)は、上述した非特許文献2および非特許文献3に記載される公式を使って計算されうる。それらは、未知の寄与者と被疑者の間の関係性の考察を含みうる。
因子f(C|G1,G2)は、第二の結果セットの情報が与えられたときの第一の結果セットの情報を観察する尤度の表現でありうる。因子f(C|G1,G2)は、所与の遺伝子型、特に被疑者および/または別の人物の遺伝子型の情報が与えられたときの犯行現場から採取された試料からの情報を観察する尤度の表現でありうる。
項f(C|G1,G2)は推定でありうる。項f(C|G1,G2)は実験データから導出されうる。項f(C|G1,G2)は実験データから導出される推定でありうる。項f(C|G1,G2)は一つまたは複数の確率分布関数であってもよいし、あるいは一つまたは複数の確率分布関数を含んでいてもよい。項f(C|G1,G2)の推定は、希釈データ(dilution data)、具体的にはヘテロ接合の(heterozygous)ソースからおよび/または、好ましくは別個に、ヘテロ接合のソースから収集されるデータの考察によって提供されうる。
f(C|G1,G2)の推定は、同じ量のDNAについての対照試料解析データを一緒にグループ化することによって与えられうる。各DNA量について、f(C|G1,G2)の別個の推定が与えられうる。因子f(C|G1,G2)が推定されるDNA量は、ある範囲にわたって、好ましくは均等に、離間されていてもよい。
f(C|G1,G2)の推定は、一つまたは複数の関心のある座位(loci)からの対照試料(control sample)解析データを一緒にグループ化することによって与えられうる。あるデータベースに情報が記憶されている、および/またはある解析方法を使って解析される、および/または多重増幅(multiplex amplification)製品を使って解析される全座位をカバーするf(C|G1,G2)の単一の推定が提供されうる。各座位についてf(C|G1,G2)の別個の推定が提供されうる。f(C|G1,G2)の推定は、二次元密度推定および/または二次元確率分布関数を使って生成されうる。
項f(C|G1,G2)は、本発明の第七の側面に基づいて与えられる一つまたは複数の確率分布関数であってもよいし、あるいはそのような一つまたは複数の確率分布関数を含んでいてもよいし、および/またはそのような一つまたは複数の確率分布関数を使って計算されてもよい。
本方法は、特に証拠コンテキストにおいて、次のようなシナリオの一つまたは複数の考察に関わりうる:
a)被疑者と犠牲者がヘテロ接合型であり、両者の間に重なり合う対立形質がなく、犯罪プロファイルに三つのピークしかない;
b)被疑者と犠牲者がヘテロ接合型であり、両者の間に重なり合う対立形質が一つあり、犯罪プロファイルに三つのピークしかない。
いずれのシナリオにおいても、二つのソースからの試料に関して一つの座位についての尤度比を考えており、考察されうる二つの基本的仮設がある:
Hp:被疑者(S: suspect)および犠牲者(V: victim)が犯罪プロファイルの発生者であるという検察側仮設;および
Hd:犠牲者(V)と未知の人物(U: unknown)が犯罪プロファイルの発生者であるという弁護側仮設。
ヘテロ接合型の被疑者および犠牲者があり、重なり合う対立性質がなく、犯罪プロファイルにおいて三つのピークがある場合、HpはV+Sであり得、HdはV+Uでありうる。C={ha,hb,hc}、V={a,b}、S={c,d}。LRは:
Figure 0005587197
によって与えられうる。
この関数の分子は:
f(C={ha,hb,hc}|V={a,b},S={c,d},Hp)=fhet(ha,hb)×fhet(hc,hd)
によって与えられうる。
分母についての未知の寄与者は{a,c}、{b,c}、{c,Q}であることができる。分母は:
f(C={ha,hb,hc}|V={a,b},S={c,d},Hd)
=f(C={ha,hb,hc}|V={a,b},S={c,d},U={a,c},Hd)Pr(U={a,c}|S={a,b})
+f(C={ha,hb,hc}|V={a,b},S={c,d},U={b,c},Hd)Pr(U={b,c}|S={a,b})
+f(C={ha,hb,hc}|V={a,b},S={c,d},U={c,Q},Hd)Pr(U={a,c}|S={a,b})
によって与えられうる。
U={a,c}についての因子は公式:
f(C={ha,hb,hc}|V={a,b},U={a,c},Hd)=fhet(mxha,hb)×fhet((1−mx)ha,hc)
を用いて計算されうる。
U={b,c}についての因子は公式:
f(C={ha,hb,hc}|V={a,b},U={b,c},Hd)=fhet(ha, mxhb)×fhet(ha,(1−mx)hc)
を用いて計算されうる。
U={c,Q}についての因子は公式:
f(C={ha,hb,hc}|V={a,b},U={c,Q},Hd)=fhet(ha,hb)×fhet(hc,hQ)
を用いて計算されうる。
ヘテロ接合型の被疑者と犠牲者が一つの重なる対立形質をもち、犯罪プロファイル中に三つのピークがある場合、HpはV+Sであり得、HdはV+Uでありうる。C={ha,hb,hc}、V={a,b}、S={b,c}。尤度比は:
Figure 0005587197
によって与えられうる。
分子は:
Pr(C={ha,hb,hc}|V={a,b},S={b,c},Hp)=fhet(ha, mxhb)fhet((1−mx)hb,hc)
によって与えられうる。
分母は潜在的な未知寄与者:
U∈{{a,c},{b,c},{c,c},{c,Q}}
を考慮しうる。
U={a,c}の場合、上記関数は:
Pr(C={ha,hb,hc}|V={a,b},S={b,c},U={a,c},Hd)=fhet(mxha,hb)fhet((1−mx)ha,hc)π( )
を使って計算されうる。
U={b,c}の場合、上記関数は:
f(C={ha,hb,hc}|V={a,b},U={b,c},Hd)=fhet(ha, mxhb)fhet((1−mx)hb,hc)
を使って計算されうる。
U={c,c}の場合、上記関数は:
f(C={ha,hb,hc}|V={a,b},U={c,c},Hd)=fhet(ha,hb)fhet(0.5hc,0.5hc)
を使って計算されうる。
U={c,Q}の場合、上記関数は:
f(C={ha,hb,hc}|V={a,b},U={c,Q},Hd)=fhet(ha,hb)fhet(hc,hQ)
を使って計算されうる。
前記比較方法は、さらなる捜査または法的手続を支援するために情報を集めるために使用されうる。前記比較方法は、ある状況についてのインテリジェンスを提供しうる。前記比較方法は、第二のまたは別の試料結果の情報を与えられたときの、第一のまたは試験試料結果の情報の尤度についてでありうる。前記比較方法は、理想的には尤度に従って順位付けされた、可能な他の試料結果のリスト化を提供しうる。前記比較方法は、犯行現場試料からのDNAプロファイルとデータベースに記憶されている一つまたは複数のDNAプロファイルとの間の結び付きを確立しようとしうる。
前記方法は、犯行現場DNAプロファイルCを採取し、被疑者のプロファイルの順序付けられたリストを決定することを含みうる。ここで、前記リスト中の第一のプロファイルは最も確からしい提供者の遺伝子型である。前記方法は、遺伝子型のリスト{G1,G2,...,Gm}を提案し、次いでそれらの遺伝子型を、犯行現場プロファイルCが与えられたときの遺伝子型の事後確率に従って順位付けしうる。
前記比較方法は、事後確率を考察しうる。好ましくは、事後確率は:
Figure 0005587197
として定義される。
本方法は、座位ごとに遺伝子型G1およびG2の諸対の順序付けられたリストを提案しうる。好ましくは、リスト中の最初の対は犯罪痕の最もありそうな提供者であるようにされる。
本方法は、第一の結果のセット、たとえば犯罪血痕プロファイルCをもって始まりうる。本方法は次いで、リストを提供しうる。潜在的には、潜在的な提供者の諸対の網羅的なリスト{G1,i,G2,i}が生成される。好ましくは、これらの対のそれぞれについて、遺伝子型についての確率分布が公式:
Figure 0005587197
を使って計算される。ここで、Pr(G1,i,G2,i)は、括弧内の遺伝子型の対についての事前分布である。これは、一様分布に設定されることもでき、あるいは上述した非特許文献2および非特許文献3に記載される遺伝子型の確率を使って計算できる。
本発明の第六の側面によれば、第一の、潜在的には試験試料結果セットを第二の、潜在的には別の試料結果セットと比較する方法であって:
DNAの可変特徴について検出された一つまたは複数の素性について第一の結果セットについての情報を提供し;
DNAの可変特徴について検出された一つまたは複数の素性について第二の結果セットについての情報を提供することを含み、
当該方法が、因子f(C|G1,G2i)またはその因子を組み込む因子を使用し、好ましくはfはこれが尤度の表現であることを意味し、Cは第一の結果セットの情報であり、G1およびG2は第二の結果セットの情報であり、χiは第一の結果セットおよび/または第二の結果セットにおいて考察される一つまたは複数の素性の定量的指標である、
方法を提供する。
因子f(C|G1,G2i)は、因子f(C|S,Ui,Hp)およびf(C|Uj,Uk,S,Hd)を計算するために使用されうる。因子f(C|S,Ui,Hp)およびf(C|Uj,Uk,S,Hd)は、二つの想定されるソースまたは提供者が与えられたときの犯罪プロファイルCの尤度の表現であり得、潜在的には弁護側の仮設Hdおよび/または起訴者側の仮設Hpに基づきうる。G1およびG2は想定される提供者またはソースの遺伝子型でありうる。
本方法は、特に証拠コンテキストにおいて、特に二人の寄与者から生じる混合ソース試料について、起訴者側仮設および弁護側仮設の考察に関わりうる。それらの仮設は:被疑者および別の誰かが、潜在的には犯行現場にあった血痕である第一の結果セットへの提供者であるという起訴者側仮設Hpおよび/または二人の未知の人が、潜在的には犯行現場にあった血痕である第一の結果セットへの提供者であるという弁護側仮設Hdであってもよい。
LRは公式:
Figure 0005587197
によって与えられうる。ここで、
・Cは試験試料からの第一の結果セット、より具体的には、犯罪に結び付けられた人物または場所から回収された試料から取られた第一の結果セットであり、可能性としてはピーク位置および/または高さを用いて表される;
・Sは第二の結果セット、より具体的には、ある人物から収集された試料から取られた第二の結果セットであり、特に被疑者の遺伝子型として表される;
・Hpは一つの仮設、より具体的には、「被疑者が得られた犯罪血痕の寄与者の一人である」ことを述べる、法的手続における起訴者側仮設である;
Hdは代替仮設、より具体的には、「二人の未知の人物が犯罪血痕の提供者である」ことを述べる、法的手続における弁護側仮設である。
LR公式は:
Figure 0005587197
と書ける。ここで、f(C|S,Ui,Hp)はSおよびUiが与えられたときのCの密度関数であり、f(C|Uj,Uk,S,Hd)はUj、UkおよびSが与えられたときのCの密度関数である。
因子Pr(Ui|S,Hp)およびPr(Uj,Uk|S,Hd)は、上述した非特許文献2および非特許文献3に記載される公式を使って計算されうる。それらは、関係性の考察を含みうる。
因子f(C|G1,G2i)は、第二の結果セットの情報が与えられたときの第一の結果セットの情報を観察する尤度の表現でありうる。因子f(C|G1,G2i)は、所与の遺伝子型、特に被疑者および/または別の人物の遺伝子型における情報が与えられたときの犯行現場から採取された試料からの情報を観察する尤度の表現でありうる。
項f(C|G1,G2i)は推定でありうる。項f(C|G1,G2i)は実験データから導出されうる。項f(C|G1,G2i)は実験データから導出される推定でありうる。項f(C|G1,G2i)は一つまたは複数の確率分布関数であってもよいし、あるいは一つまたは複数の確率分布関数を含んでいてもよい。項f(C|G1,G2i)の推定は、希釈データ(dilution data)、具体的にはヘテロ接合の(heterozygous)ソースからおよび/または、好ましくは別個に、ヘテロ接合のソースから収集されるデータの考察によって提供されうる。
f(C|G1,G2i)の推定は、同じ量のDNAについての対照試料解析データを一緒にグループ化することによって与えられうる。各DNA量について、f(C|G1,G2i)の別個の推定が与えられうる。因子f(C|G1,G2i)が推定されるDNA量は、ある範囲にわたって、好ましくは均等に、離間されていてもよい。
f(C|G1,G2i)の推定は、一つまたは複数の関心のある座位(loci)からの対照試料(control sample)解析データを一緒にグループ化することによって与えられうる。あるデータベースに情報が記憶されている、および/またはある解析方法を使って解析される、および/または多重増幅(multiplex amplification)製品を使って解析される全座位をカバーするf(C|G1,G2i)の単一の推定が提供されうる。各座位についてf(C|G1,G2i)の別個の推定が提供されうる。f(C|G1,G2i)の推定は、二次元密度推定および/または二次元確率分布関数を使って生成されうる。
項f(C|G1,G2i)は、本発明の第七の側面に基づいて与えられる一つまたは複数の確率分布関数であってもよいし、あるいはそのような一つまたは複数の確率分布関数を含んでいてもよいし、および/またはそのような一つまたは複数の確率分布関数を使って計算されてもよい。
本発明の第七の側面によれば、DNAの可変特徴について検出されたレベルに関係する一つまたは複数の確率分布関数を生成する方法であって:
a)DNAの対照試料を提供する段階と;
b)DNAの前記少なくとも一つの可変特徴について検出されたレベルを確立するよう対照試料を解析する段階と;
c)複数の対照試料について段階a)およびb)を繰り返して、検出されたレベルのデータ・セットを形成する段階と;
d)検出されたレベルの前記データ・セットの少なくとも一部について確率分布関数を定義する段階とを含む、
方法を提供する。
本方法は、ヘテロ接合型の人からの対照試料についての検出レベルについての確率分布関数を提供するために使用されうる。
本方法は、ホモ接合型の人からの対照試料についての検出レベルについての確率分布関数を提供するために使用されうる。
好ましくは、本方法は、ヘテロ接合型の人からの対照試料についての検出レベルについての確率分布関数を提供し、ホモ接合型の人からの対照試料についての検出レベルについての確率分布関数を提供するために使用される。好ましくは、ヘテロ接合型の人についての確率分布関数を提供する方法の実行は、ホモ接合型の人についての確率分布関数を提供するために使われる実行とは別個の実行である。
可変特徴についての検出レベルは、ピーク高さであってもよい。検出レベルはピーク面積であってもよい。可変特徴についての検出レベルはピーク・ウェイトであってもよい。ピーク・ウェイト(peak weight)は、対立形質の分子量(molecular weight)にその対立形質のピーク高さまたはピーク面積を乗算したものとして定義されうる。
前記特徴(characteristic)は、可変な短い縦列反復対立形質(tandem repeat alleles)をもつと知られている座位における単数または複数の対立形質素性(allele identity)でありうる。
確率密度関数は、二次元確率密度関数であってもよい。確率密度関数は、二次元確率密度関数であってもよく、あるいは、たとえば一次元確率密度関数からまたは三次元確率密度関数から二次元確率密度関数に変換されてもよい。
段階a)およびb)は、一人の人物、好ましくは複数の異なる人物、理想的には少なくとも四人の異なる人物からの対照試料に対して実行されてよい。
段階a)およびb)は、少なくとも20の対照試料に対して、好ましくは少なくとも100の対照試料について、より好ましくは少なくとも200の対照試料について、理想的には少なくとも500の対照試料について実行されてもよい。対照試料のこれらの数は、延べ数、あるいは考察される対照試料のもとになるそれぞれの異なる人についての数でありうる。
段階a)およびb)は、各対照試料の一つの例について実行されうる。段階a)およびb)は、各対照試料の複数の例に対して、たとえば各対照試料の少なくとも20の例に対して実行されうる。対照試料のこれらの数は、延べ数、あるいは考察される対照試料のもとになるそれぞれの異なる人についての数でありうる。
対照試料のソースである人たちは、特にヘテロ接合体についての確率分布関数を生成するために、可変特徴についてヘテロ型であるよう選択されうる。
対照試料のソースである人たちは、特にホモ接合体についての確率分布関数を生成するために、可変特徴についてホモ型であるよう選択されうる。
本方法は、DNAの種々の量を含む一つまたは複数の対照試料に適用されうる。DNAの量は、ある範囲のさまざまな量にわたって、たとえばその範囲にわたり規則的な間隔で、提供されうる。範囲は、下限10pg、より好ましくは50pgをもちうる。範囲は、上限1000pg、より好ましくは500pgをもちうる。間隔は、10ないし50pg毎、あるいは潜在的には25pg毎であってもよい。
可変特徴についての検出レベルの解析は、好ましくは、二つ以上の可変特徴に関して設けられる。可変特徴(単数または複数)は好ましくは、ある座位に存在する単数または複数の対立形質素性である。好ましくは、対照試料は、一つまたは複数の座位、好ましくは少なくとも8個の座位に関して考察される。
確率分布関数(probability distribution function)pdfは、一つまたは複数の確率分布関数から形成されうる。確率分布関数は、対照試料の群について提供されうる。ここで、対照試料は二つ以上の群の対照試料に分けられる。確率分布関数は、特に二人の異なる人物からの試験試料の考察のコンテキストでは、四つの確率分布関数から形成されうる。
特徴の検出レベルは、二つ以上の群に分けられうる。一つの群は、検出レベルがある閾値および/またはそれ以上である対照試料でありうる。一つの群は、検出レベルがある閾値および/またはそれ未満である対照試料でありうる。
対照試料がホモ接合型の人からである場合には、検出レベルは好ましくは二つの群に、最も好ましくはある閾値に関して、分けられる。検出レベルの二つの群への分割は、一次元確率分布関数を与えうる。その一次元pdfが二次元pdfに変換されることが好ましい。
一次元pdfを二次元pdfに変換するために使用される方法は、ホモ接合型の試料についての高さh1をもつpdfを、高さ0.5h1および0.5h2をもつヘテロ接合型試料についてのpdfによって定義されているとして扱うことを含みうる。
あるいはまた、一次元pdfは、ある角度、特に90°数学的に回転させることによって二次元pdfに変換されうる。この方法は、二つの成分による一次元pdf推定の使用を含みうる。成分の一つは、その高さ区間についての一様な分布でありうる。成分の一つは、その高さ区間範囲内で正の値を取る確率分布、たとえば指数分布でありうる。一次元pdfは公式
Figure 0005587197
によって定義されうる。ここで、
・p0はその範囲内にある諸高さの割合;
・p1はその範囲より上にある諸高さの割合;
・tは検出閾値、たとえば30rfuである。
回転によって得られる分布の表面は、表面より下の体積が1になるよう規格化されうる。
尤度比計算のためのホモ接合体ピーク高さhについてのpdf値の計算は:
(1/V)×fH (2)
によって与えられうる。ここで、Vは一次元pdfの回転によって得られる表面の下の体積である。
一つの群は、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ以上であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ以上である対照試料でありうる。一つの群は、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ未満であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ未満である対照試料でありうる。一つの群は、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ以上であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ未満である対照試料でありうる。一つの群は、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ未満であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ以上である対照試料でありうる。
対照試料がヘテロ接合型の人からである場合には、特に考察されるべき試験試料が二つのソースからである場合、検出レベルは四つの群に分けられる。
閾値は、ノイズ信号の検出に対する特徴の検出が可能でないまたは損なわれる検出レベルでありうる。閾値は、10ランダム蛍光単位と70rfuの間でありうる。より好ましくは60rfu未満、一層好ましくは50rfu未満さらには40rfu未満でありうる。
閾値は、ある座位における異なる可変特徴について異なっていてもよいが、好ましくは同じである。閾値は、異なる座位については異なっていても同じであってもよい。
前記一つの群が、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ以上であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ以上である対照試料である場合、各可変量についての検出レベルが、定義された確率分布関数に寄与する値でありうる。
前記一つの群が、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ未満であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ未満である対照試料である場合には、第一の特徴についての検出レベルおよび第二の特徴についての0の値が、確率分布関数に寄与する値でありうる。
前記一つの群が、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ以上であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ未満である対照試料である場合には、第二の特徴についての検出レベルおよび第一の特徴についての0の値が、確率分布関数に寄与する値でありうる。
前記一つの群が、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ未満であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ以上である対照試料である場合には、第一の特徴についての0の値および第二の特徴についての0の値が、確率分布関数に寄与する値でありうる。
特にヘテロ接合型のソースについての確率分布関数は、四つの確率関数によって与えられうる。
確率分布関数は、
p1,1×(1/t2
に関係するまたはこれである関数である確率分布関数であってもよく、より好ましくはそのような確率分布関数を含んでいてもよい。ここで、p1,1はh1<tおよびh2<tであるデータの割合であり、tは検出閾値である。特に、前記一つの群が、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ以上であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ以上である対照試料である場合、各可変量についての検出レベルが、定義された確率分布関数に寄与する値でありうる。
確率分布関数は、
p1,2×g1,2(h1,h2)
に関係するまたはこれである関数である確率分布関数であってもよく、より好ましくはそのような確率分布関数を含んでいてもよい。ここで、p1,2はh1≧tおよびh2<tである点の割合であり、g1,2はh1≧tおよびh2<tである領域についての二次元確率密度関数であり、h1は低分子対立形質の高さであり、h2は高分子対立形質の高さであり、特に、前記一つの群が、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ未満であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ未満である対照試料である場合、第一の特徴についての検出レベルおよび第二の特徴についての0の値が、確率分布関数に寄与する値でありうる。確率分布関数は、
g1,2(h1,h2)=g1,2(h1|h2)g1,2(h2)
に関係するまたはこれである関数である確率分布関数であってもよく、より好ましくはそのような確率分布関数を含んでいてもよい。ここで、g1,2(h1|h2)はh1≧tおよびh2<tである実験データから推定され:
g1,2(h2)=1/t
である。確率分布関数は、特にこの群については、指数分布であるまたは指数分布を含んでいてもよい。
確率分布関数は、
p2,1・g2,1(h1,h2)
に関係するまたはこれである関数である確率分布関数であってもよく、より好ましくはそのような確率分布関数を含んでいてもよい。ここで、p2,1はh1<tおよびh2≧tである領域における高さの対の割合であり、g2,1はh1<tおよびh2≧tである領域についての二次元確率密度関数であり、h1は低分子対立形質の高さであり、h2は高分子対立形質の高さである。特に、前記一つの群が、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ以上であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ未満である対照試料である場合には、第二の特徴についての検出レベルおよび第一の特徴についての0の値が、確率分布関数に寄与する値でありうる。確率分布関数は、
g2,1(h1,h2)=g2,1(h2|h1)g2,1(h1) (A.5)
に関係するまたはこれである関数である確率分布関数であってもよく、より好ましくはそのような確率分布関数を含んでいてもよい。ここで、g2,1(h2|h1)はh1<tおよびh2>tである実験データから推定され:
g2,1(h1)=1/t (A.6)
である。確率分布関数は、特にこの群については、指数分布であるまたは指数分布を含んでいてもよい。
確率分布関数は、
p2,2×g2,2(h1,h2)
に関係するまたはこれである関数である確率分布関数であってもよく、より好ましくはそのような確率分布関数を含んでいてもよい。ここで、p2,2はh1≧tおよびh2≧tである領域にはいる高さの対(h1,h2)の割合であり、g2,2はh1≧tおよびh2≧tである領域についての二次元確率密度関数であり、h1は低分子量対立形質の高さであり、h2は高分子量対立形質の高さである。特に、前記一つの群が、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ未満であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ以上である対照試料である場合には、第一の特徴についての0の値および第二の特徴についての0の値が、確率分布関数に寄与する値でありうる。
上記確率分布関数の一つまたは複数は一様分布であってもよい。上記分布関数の一つまたは複数は三角分布であってもよい。上記分布関数の一つまたは複数は指数分布であってもよい。
特にヘテロ接合型のソースについての確率分布関数は
Figure 0005587197
として定義されうる。ここで、k1,2は指数関数型確率密度関数、k2,1は指数関数型確率密度関数、l1,2およびl2,1は指数分布のパラメータであり、好ましくは:
Figure 0005587197
はパラメータl1,2をもつ指数分布のpdfであり、ここで、xはh1−tを表す変数であり、好ましくは:
Figure 0005587197
であり、k2,2は好ましくは二次元正規分布の混合
Figure 0005587197
によって与えられ、ここでpiは混合割合であり、nは正規分布するランダム変数の二次元確率密度関数であり、好ましくは:
Figure 0005587197
であり、好ましくは
Figure 0005587197
であり、ここで相関係数ρ=0である。
前記一つの群が、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ以上であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ以上である対照試料である場合、確率分布関数は、対照試料について観察された検出レベルについて当てはめ〔フィッティング〕されうる。
前記一つの群が、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ未満であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ未満である対照試料である場合には、確率分布関数は、二次元平面分布を前記群および/またはある分布関数に当てはめることによって与えられうる。ある分布関数とは、その形が、隣接する群との接合部での値からの遷移を表すおよび/またはその形が、第一および第二の特徴の両方についての検出レベルについての値0において確率値0を与える分布関数である。
前記一つの群が、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ以上であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ未満である対照試料である場合には、確率分布関数は、二次元平面分布を前記群および/またはある分布関数に当てはめることによって与えられうる。ある分布関数とは、その形が、隣接する群との接合部での値からの遷移を表す分布関数である。
前記一つの群が、検出レベルが、より高ウェイトの特徴などの第一の可変特徴に関する閾値および/またはそれ未満であり、より低ウェイトの特徴などの第二の可変特徴に関する閾値および/またはそれ以上である対照試料である場合には、確率分布関数は、二次元平面分布を前記群および/またはある分布関数に当てはめることによって与えられうる。ある分布関数とは、その形が、隣接する群との接合部での値からの遷移を表す分布関数である。
特にヘテロ接合型のソースについての確率分布関数は、たとえば平均高さmおよびヘテロ接合体不均衡rによって定義される空間において、一対の高さh1およびh2についての二次元pdfを推定することによって与えられうる。本方法は、
Figure 0005587197
によって変換される高さの各対を含みうる。
pdf fM,Rを与えられると、高さの対の空間におけるpdfは公式
Figure 0005587197
を用いて得られうる。ここで、第一の因子は変換のヤコビアンであり、非特許文献5、第二の因子は実験データから推定できる。推定は、平均高さを与えられたときのヘテロ接合型不均衡の条件付き分布を得ることによって与えられうる:
Figure 0005587197
本方法はこのアプローチ、特にこの関数を、たとえば図2に示されるような四つ全部の領域についての一つのpdf fR|Mを与えるために使用しうる。本方法は、四つの領域のそれぞれについて一つのマージナル(marginal)、たとえば各領域についてのマージナルpdf fMがあることを提供しうる。
本方法は、条件付きpdf fR|Mが、領域(1,2)からのデータを使って得ることができ、すべての領域についてのpdf fR|Mに外挿できることを提供しうる。本方法は、これら三つのゾーンのそれぞれにおいて欠けている材料についてシミュレーションが提供されることを提供しうる。本方法は、可変量ln(M)およびln(R)についての同時pdf fln(M),ln(R)がまず得られることを含みうる。本方法は、条件付きpdf fR|Mがfln(M),ln(R)から計算されることを含みうる。本方法は、閾値、たとえば30rfuによって導入されるバイアスによるpdf fR|Mのバイアスを補正することを含みうる。本方法は、バイアスが、各fR|MをLog正規pdfで置き換え、平均μおよび分散σの空間においてLog正規pdfの補正をすることによって除去されることを提供しうる。
本方法は、各ガウシアンが0の相関をもつEMアルゴリズムを使って可変量ln(M)およびln(R)について二次元pdf fln(M),ln(R)を推定することを含みうる。非特許文献4、非特許文献6。
本方法は、Mが与えられたときのRの条件付き分布が、推定されたfln(M),ln(R)から公式
Figure 0005587197
を使って計算されることを含みうる。
本方法は、pdf fln(M)が、fln(M),ln(R)と同じ混合割合および対応する平均および分散によって与えられる平均および分散をもつ一次元ガウス分布の混合であることを含みうる。本方法は、いくつかの条件付きpdfが計算されることを含みうる。本方法は、Mが与えられたときのRについての条件付きpdfをシミュレートするために対数正規分布を提供することを含みうる。本方法は、対数正規分布のpdfが
Figure 0005587197
によって与えられることを含みうる。
本方法は、対数正規pdfのパラメータ(μ,σ)の空間においてバイアスを補正することを含みうる。本方法は、μおよび/またはσについての値についてのいくつかの逐次反復を含みうる。特に、本方法は、μについての値の二回以上の逐次反復およびσについての推定手順を含みうる。
Mの値についてのpdfは、Mの二つ以上の値によって定義される傾向〔トレンド〕をMのより低い値に外挿することによって得られうる。一つまたは複数の、好ましくはいくつかの、多項式が、より高いMの値、たとえば80ないし200rfuの領域においてσの諸値に当てはめられうる。傾向は線、スプラインまたは直線でありうる。
本方法は、
Figure 0005587197
によって定義される対数正規分布のファミリーを得ることを含みうる。
本方法は、ピーク高さについての提案される二次元分布におけるもう一つの成分を、四つの領域のそれぞれにおける平均についてのpdfとして定義することを含みうる。
領域(0,0)については、一様分布が定義されうる。平均高さについてのpdfは
Figure 0005587197
でありうる。ここで、p(0,0)は領域(0,0)にはいる高さの対の割合であり、tは閾値であり、30rfuであることができ、あるいは所望される別のrfu値によって置き換えられることができる。
領域(1,0)については、本方法は、この領域におけるピーク高さ(h1,h2)についての分布を得ることを含みうる。本方法は、次いで、平均高さについての分布を計算しうる。本方法は、平均高さについてのpdfを抽出し、外挿された分布を使い、(h1,h2)の空間に変換し戻すことを含みうる。本方法は、変数h1とh2が独立であると想定することによって、この領域における同時分布を定義することを含みうる。(h1,h2)について一様分布が想定されてもよい。領域(1,0)についてのpdfは
Figure 0005587197
によって与えられうる。ここで、p(0,0)は領域(0,0)にはいる高さの対の割合であり、30は所望される別のrfu値によって置き換えられることができる。
本方法は、平均高さMについてのpdfを、まず変換
Figure 0005587197
を使って得ることを含みうる。次いでこの変換のヤコビアンを使って(M,N)についての二次元pdfを得る。本方法は、積分を通じてmについての周辺pdfを得ることを含みうる。(M,N)についての二次元pdfは
Figure 0005587197
によって与えられうる。
(M,N)についての二次元pdfは
Figure 0005587197
によって与えられうる。
本方法は、Mについてのpdfが
Figure 0005587197
によって与えられることを提供する。ここで、15はより低い量の割合であり、別の値によって置き換えられることができ、30はより高いピーク量割合であり、別の値によって置き換えられることができる。本方法は、Mについてのpdfが
Figure 0005587197
によって与えられることを含みうる。ここで、15はより低い量の割合であり、別の値によって置き換えられることができ、30はより高いピーク量割合であり、別の値によって置き換えられることができる。
本方法は、領域(1,0)について、領域(0,2)における平均高さについてのpdfを得るために、上記と同じ方法論または上記のような方法論を使用しうる。本方法は、(H1,H2)についてのpdfが
Figure 0005587197
によって与えられることを提供しうる。ここで、p(0,2)は領域(0,2)にはいる高さ対の割合であり、30は所望される別のrfu値によって置き換えられることができ、定数λ(0,2)はh2の値から推定された指数pdfのパラメータである。
領域(0,2)におけるMについてのマージナルを計算する方法は、領域(1,0)についてと同じであってもよいし、あるいは領域(1,0)についての可能性に従って提供されうる。pdfは、m∈[15,30)であれば、
Figure 0005587197
によって、m≧30であれば、
Figure 0005587197
によって与えられうる。ここで、15はより低い量の割合であり、別の値によって置き換えられることができ、30はより高いピーク量割合であり、別の値によって置き換えられることができる。
本方法は、領域(1,2)についてのpdf fMが(ln(M),ln(R))について推定された二次元pdfから得られることを提供する。結果は、一次元ガウシアンの混合でありうる。本方法は、領域(1,2)におけるMについてのpdfが
Figure 0005587197
によって与えられることを提供しうる。ここで、p(1,2)は領域(1,2)にはいる高さ対の割合であり、piはガウス成分の混合割合であり、f(m|μii)はガウシアンpdfである。
本方法は、所与の座位について確率分布関数の生成を提供しうる。本方法は、複数の座位のそれぞれについての確率分布関数の生成を提供しうる。本方法は、座位の組み合わせについての確率分布関数の生成を提供しうる。座位の組み合わせは、SGMplusのようなPCR増幅多重物(amplification multiplex)を使って解析されるものに対応しうる。複数の異なる確率分布関数が座位の種々の組み合わせについて提供されうる。確率分布関数は、種々のPCR増幅多重物において解析される座位の組み合わせに対応するいくつかの組み合わせについて生成されうる。
本方法は、所与のDNA量について確率分布関数の生成を提供しうる。本方法は、いくつかの異なるDNA量のそれぞれについて、確率分布関数の生成を提供しうる。確率分布関数は、ある範囲のDNA量にわたって設けられるDNA量の種々の値について提供されうる。種々の値は、前記範囲を通じて均等に離間されていてもよい。
本方法は、一つの座位に関しておよび/または座位の組み合わせについて所与のDNA量について確率分布関数の生成を提供しうる。本方法は、一つの座位についておよび/または座位の組み合わせについていくつかの異なるDNA量のそれぞれについて確率分布関数の生成を提供しうる。
一つまたは複数の生成された確率分布関数は、たとえばコンピュータ実装されるデータベースにおいてのちの使用のために記憶されてもよい。一つまたは複数の生成された確率分布関数は、電子メモリまたは半導体メモリに記憶されてもよい。本方法は、一つまたは複数の確率分布関数をコンピュータ実装されるデータベースおよび/または電子メモリデバイスおよび/または半導体メモリデバイスにおいて提供することを含みうる。一つまたは複数の確率分布関数は、使用位置および/または該一つまたは複数の確率分布関数を使う装置の位置から遠隔の位置に記憶されてもよい。それは、たとえばインターネットを介してアクセス可能なリモート・アクセス・ユニット上に記憶することなどによる。
一つまたは複数の確率分布関数ののちの使用は、本発明の前記第一の側面に基づく方法またはその特徴または可能性においてであってもよい。前記メモリは、本発明の前記第二の側面に基づく装置またはそのために設けられる可能性の任意のものの一部として設けられてもよいし、恒久的に接続されて設けられてもよいし、一時的に接続して設けられてもよい。
一つまたは複数の記憶された確率分布関数は、本発明の前記第一の側面の方法ステップのようなその後の方法ステップにおいて一回または複数回使用されてもよい。
本発明の上記の諸側面のいずれも、以下の特徴、オプションもしくは可能性または本稿の別の場所に記載されるものを含みうる。
本方法は、コンピュータ実装される方法であってもよい。
本方法は、たとえば電子的な形またはハードコピーの形での、ユーザーに対する情報の表示を含んでいてもよい。
試験試料は、未知のソースからの試料であってもよい。試験試料は、既知のソース、特に既知の人物からの試料であってもよい。試験試料は、該試験試料のDNAの一つまたは複数の可変部分に関して存在する素性を確立するために解析されてもよい。一つまたは複数の可変部分は、ある座位に存在する単数または複数の対立形質であってもよい。解析は、一つまたは複数の座位に存在する一つまたは複数の可変部分を確立してもよい。
試験試料は、単一のソースによって寄与されてもよい。試験試料は、未知の数のソースによって寄与されてもよい。試験試料は、二つ以上のソースによって寄与されてもよい。二つ以上のソースの一つまたは複数が既知、たとえば犯罪の犠牲者であってもよい。
試験試料は、たとえば民事または刑事訴訟における証拠として考察されうる。証拠は、ある仮設の別の仮設に対する相対的な尤度、尤度比に関してでありうる。特に、これは訴訟の起訴者側によって提出される仮設および訴訟における弁護側によって提出される別の仮設であってもよい。
試験試料は、インテリジェンス収集方法において、たとえば証拠収集のようなさらなる捜査プロセスに対して情報を提供するために、考察されうる。試験試料は、一つまたは複数の以前の試料または保存されている解析結果と比較されてもよい。試験試料の比較は、それと最も確からしい一致である保存されている解析結果のリストを確立するために行われてもよい。
試験試料および/または対照試料は、一つまたは複数の素性を示す一つまたは複数のピークについて存在する単数または複数のピーク高さを決定するために解析されてもよい。試験試料および/または対照試料は、一つまたは複数の素性を示す一つまたは複数のピークについて存在する単数または複数のピーク面積を決定するために解析されてもよい。試験試料および/または対照試料は、一つまたは複数の素性を示す一つまたは複数のピークについて存在する単数または複数のピーク・ウェイトを決定するために解析されてもよい。試験試料および/または対照試料は、一つまたは複数の素性のレベル・インジケータを決定するために解析されてもよい。
ここで、本発明のさまざまな実施形態について、あくまでも例として、付属の図面を参照しつつ述べる。
一連の対照試料について、低分子量対立形質についてのピーク高さを高分子量対立形質についてのピーク高さに対してプロットしたものを示す図である。 図1のデータに基づくピーク高さの試料空間のグラフィックな表現を示す図である。 指数分布に基づくピーク高さの統計的なヒストグラムである。 例としての確率分布関数を示す図である。 図4の例から得られる二次元pdfを示す図である。 ある閾値に対するピーク高さの図解である。 検出閾値を含む、対立形質ピーク高さについての頻度分布の図解である。 図7aの検出閾値より下のデータに対するある分布型の当てはめの図解である。 図7aの検出閾値より下のデータに対する代替的な分布型の当てはめの図解である。 自然対数スケールでの平均高さおよびヘテロ接合体均衡の散布図である。 50rfuの値をもつrfu閾値を用いて平均高さについての、推定されたpdfおよび対数正規pdfを示す図である。 100rfuの値をもつrfu閾値を用いて平均高さについての、推定されたpdfおよび対数正規pdfを示す図である。 500rfuの値をもつrfu閾値を用いて平均高さについての、推定されたpdfおよび対数正規pdfを示す図である。 1000rfuの値をもつrfu閾値を用いて平均高さについての、推定されたpdfおよび対数正規pdfを示す図である。 aおよびbは、平均高さが与えられたときの、ヘテロ接合体均衡についての推定されたpdfから計算された対数正規パラメータを示す図である。 aおよびbは、μ=0.1069と設定する際の、平均高さが与えられたときの、ヘテロ接合体均衡についての推定されたpdfから計算された対数正規パラメータを示す図である。 推定される線形傾向を通じての修正されたσを示す図である。 領域(1,0)におけるH1についての確率分布を示す図である。推定されるパラメータλ(1,0)=26.24;推定は高さ値に対する減算29によってなされた。 (M,N)の状態空間が長方形内部の領域になることを示す図である。 領域(1,0)におけるH1についての確率分布を示す図である。推定されるパラメータλ(0,2)=25.30;推定は高さ値に対する減算30によってなされた。 残りの対立形質のピーク高さの関数としての、ドロップアウトの確率の図解である。 容疑者がヘテロ接合型であり、犯罪血痕に一つのピークしかない場合の座位D2についてのLRの変動を、ピーク高さに関して示す図である。
本発明は、DNA解析の解釈を改善することに関する。基本的には、そのような解析は、DNAの試料を採取し、いくつかの座位(loci)において存在する変形(variation)を解析することを含む。変形の素性は、プロファイルを生じさせ、それが次いで解釈される。要求される解釈の程度は、包括的であることができ、および/または不確かさを導入することができる。これは、DNA試料が二人以上の人物からのDNAを含む混合物である場合に特にそうである。
しばしば、そのDNAの原因である人物の素性(identity)についてのさまざまな仮設を考察し、それらの仮設の確からしさを評価する必要がある。証拠としての使用である。
しばしば、解析遺伝子型を、遺伝子型のデータベースと突き合わせて考察する必要がある。解析遺伝子型との確からしい一致である記憶されている遺伝子型のリストを確立するためである。インテリジェンス用の使用である。
本発明は、そのようなDNA解析から取られたピーク高さを使う、尤度比(LR)を計算するためのモデルの数学的な明細を提供する。
本発明のアプローチは、対照試料の解析後に観察されるピークの高さまたは面積から推定される二次元(2D)確率密度関数(probability density function)pdfの推定を利用する。そのようなpdfは、ヘテロ接合型の提供者から、そして別個にホモ接合型の提供者から生成されうる。
本発明は、前記アプローチを、ドロップアウトの確率を計算し、他の恩恵を達成するために使用し続ける。
説明の最初の部分として、pdfを生成する例示的な方法が論じられる。
ヘテロ接合型の提供者についての2D確率分布関数の生成――方法1
本発明のキーとなる部分は、ピーク高さに関係する2D確率分布関数pdfの生成、そして使用である。これは、多数の対照試料の解析を通じて得られる。
本願のアプローチを支持するために使われる対照試料の解析は、諸対照試料内の多様なレベルのDNAの存在を考察することを必要とする。というのも、関心のある未知ソース試料においては、それらのさまざまなレベルその他に遭遇するからである。未知ソース試料がDNA解析のために収集されるとき、所与の量のDNAを収集しようとするねらいがある。しかしながら、未知ソース試料中に実際に存在する量は、多様な要因のため、その量のまわりに変動する。
これに対処するため、いくつかのヘテロ接合型提供者からの対照事前試料が得られ、次いでそれらにおける異なるDNA量をもつ多様な対照試料がこれらの事前対照試料から生成された。次いで対照試料が解析され、存在する対立形質およびピーク高さを確立した。この対照試料調査プロセスは、前記DNA解析または本発明によって改善されるべき比較プロセスにおいて、関心のある各座位について反復された。こうして、異なる座位が、種々の解析アプローチについておよび/または種々の座位についての情報を記憶しているデータベースについて、考察される必要があることになる。
ヘテロ接合型の状況とホモ接合型の状況について別個のpdfが生成されることが有益である。
対照試料調査プロセスの一例として、四人のヘテロ接合型提供者が使用されうる。その際、存在するDNAの異なる量をもつ対照試料が、50pgから500pgの範囲にわたって25pgきざみで生成される。事前対照試料の200反復(200 repeats)が各提供者から提供され、対照試料セットを形成するために使われた。
これらの対照試料の解析の結果は:
一方の軸に、観察される座位におけるより低分子量の対立形質についてのピーク高h1さとして表される、解析において検出されたDNAの量を;
他方の軸に、観察される座位におけるより高分子量の対立形質についてのピーク高h2さとして表される、解析において検出されたDNAの量を、
プロットすることによって考察できる。
このアプローチを使った結果のセットが図1に概略的に示されている。一般的な観察として、h1およびh2レベルは等価なレベル(45°の一点鎖線)のまわりに分布され、ピーク高さは試料中のDNA量が増すにつれて増大する。
ピーク高さを考察する際、解析におけるノイズ信号に対する高さの検出は、ある閾値レベルより下では難しくなる。結果として、所定の閾値tより低いピーク高さは、さらに考察するには信頼できないものとして割り引くのが通常である。対照試料は問題の座位についてヘテロ接合型の人からのものであるとわかっているので、これらの観察されないピークは解析結果からのその対立形質のドロップアウト〔脱落〕に対応するとわかる。その対立形質は、DNA中には存在しているが、そのDNAについての解析結果には存在していないのである。
これらの閾値tの使用は、図1のプロットにおいて実装されている。値h1またはh2の一方についての値が閾値より低いと、その点は当該軸上で値0としてプロットされる。両方とも閾値より低いと、その点は両軸の接合部にプロットされる:両方の軸について値0なのである。
図1の分布は、図2において概略的な形でさらに考察できる。これは、対照試料の解析の結果を、両軸および閾値t1およびt2によって定義される四つのブロックに分割する。領域(1,1)は、h1もh2も閾値tを超えないブロックを定義する。領域(1,2)は、より高分子量の対立形質h2は閾値tより下に観察されるが、より低分子量の対立形質h1は閾値tより上に観察されるブロックを定義する。領域(2,1)は、より低分子量の対立形質h1は閾値tより下に観察されるが、より高分子量の対立形質h2は閾値tより上に観察されるブロックを定義する。領域(2,2)は、対立形質h1およびh2の両方がいずれもそれぞれの閾値t1、t2を超えるブロックを定義する。
さらなる考察においては、t1とt2は同じ値をもちtと表されるが、より低ウェイトの対立形質とより高ウェイトの対立形質についておよび/または座位の間で、異なる値が使われることもできる。閾値は50ランダム蛍光単位rfuであることができ、あるいは20rfuほど低くてもよい。
ピーク高さについての二次元pdf fhet(h1,h2)の関数は高さ値h1およびh2をもつヘテロ接合型の対立形質の確率密度関数であるが、これは上に同定した四つの異なる領域に従って区分的に定義できる。領域(1,1)についてはp1,1、領域(1,2)についてはp1,2、領域(2,1)についてはp2,1、領域(2,2)についてはp2,2である。
このアプローチは、図2の四つの領域について次の定義を与える。
Figure 0005587197
これらの定義の形についてここでさらに考察する。

g 1,2 (h 1 ,h 2 )の定義
これは、図2の領域(1,2)におけるh1およびh2の同時分布である。g1,2(h1,h2)の定義は、分布を次のように因子分解することを通じて与えられる:
g1,2(h1,h2)=g1,2(h1|h2)g1,2(h2) (A.2)
ここで、g1,2(h1|h2)はh1>tおよびh2<tである実験データから推定され、
g1,2(h2)=1/t (A.3)
である。
g1,2のこの定義の背後にある論理付けは、計算
Figure 0005587197
から出てくる。
その解釈は、わかっているのはピーク高さh2が閾値tより下であるということだけなので、区間(0,t)において均等な確率をもつということである。

g 2,1 (h 1 ,h 2 )の定義
これは、領域(2,1)におけるh1およびh2の同時分布であって、先の定義と一致する形に従う。よって、これは、分布を同様にして次のように因子分解することを通じて与えられる:
g2,1(h1,h2)=g2,1(h2|h1)g2,1(h1) (A.5)
ここで、g2,1(h2|h1)はh1<tおよびh2>tである実験データから推定され、
g2,1(h1)=1/t (A.6)
である。

g 2,2 (h 1 ,h 2 )の定義
これは、領域(2,2)におけるh1およびh2の同時分布である。これは、h1>tおよびh2>tである実験データからの2D pdfの推定によって与えられる。

これら三つの領域およびそれらの分布について、以下の分布が、適用されるものとして目下推定される:
g1,2(h1,h2)……一次推定として、指数分布を使う
g2,1(h1,h2)……一次推定として、指数分布を使う
g2,2(h1,h2)……データの変換、次いで2D推定を使う。
これらの定義の全体的な結果は、ピーク高さについての2D pdf fhet(h1,h2)は
Figure 0005587197
によって与えられるということである。ここで、k1,2;k2,1;l12;l21は上述してあり、
Figure 0005587197
はパラメータl1,2をもつ指数分布のpdfであり、xは混合割合であり、
Figure 0005587197
であり、k2,2は前述のとおりであり、関数k2,2は二次元正規分布の混合
Figure 0005587197
によって与えられ、ここでyおよびnは前述のとおりであり、
Figure 0005587197
であり、
Figure 0005587197
であり、ここでρ=0である。
ひとたび決定されると、ピーク高さについての2D pdf fhet(h1,h2)は記憶され、尤度比の多数のその後の考察において利用されることができる。前述したように、そのようなpdfは、考察対象または潜在的な考察対象の各座位について生成されてもよい。場合によっては、解析プロセスの一部として、特定の状況についてピーク高さについての特定の2D pdf fhet(h1,h2)を決定することが必要であることがありうる。
ホモ接合型の提供者についての2D確率分布関数の生成――方法1
前節では、ソースがヘテロ接合体である場合について2D pdfを推定するための例示的な方法を与えた。本節では、ソースがホモ接合体である状況を扱う。
この場合、確率分布関数pdfは1Dプロットとして始まる。一つのピークしか観察されないのでh1についての値しかない。こうして、閾値tより上でこれは値をもち、閾値tの下では値0によって表される。
尤度が(前節で展開したpdfおよび後続の節で論じられる尤度評価に基づいて)2Dで考察される状況の間での互換性を可能にするために、ホモ接合状況についてのpdfも2Dで定義される必要がある。さもなければ、2Dヘテロ接合アプローチにおける尤度は、1Dホモ接合アプローチにおけるよりも本来的に確率が低くなるであろう。
1Dのpdfを2Dのpdfに変換するいくつかの方法が存在しており、使用可能である。
この方法の基礎は、高さh1をもつホモ接合型の試料は、およその高さ0.5h1および0.5h1をもつヘテロ接合型の試料を観察するのと同様であるという観察である。
ホモ接合型の提供者についての2D確率分布関数の生成――方法2――アプローチa
1Dのpdfの2Dのpdfへの変換を、分布をたとえば90°数学的に回転させることによって行うことも可能である。その結果は、ホモ接合型の提供者について後述される仕方で使用できる2Dのpdfであり、ホモ接合型の提供者についての方法1に対する代替となる。
一次元pdfの推定は二つの成分をもつ。たとえば範囲0ないし30の範囲内での高さ値の区間についての一様分布と、その範囲内で正の値を取る確率分布、たとえば図3の指数分布である。図3は、ピーク高さの統計的なヒストグラムを示している。プロット線は、一例としてのデータから推定された指数関数型pdfを表している。
一次元pdfは公式
Figure 0005587197
によって与えられる。ここで、
・p0は(0,30]内の高さの割合であり;
・p1は(30,∞)内の高さの割合である。
たとえば、fH|H>30が指数pdfであれば、
Figure 0005587197
ここで、λは既知の推定方法、たとえば統計学パッケージにおいて簡単に利用可能な最大尤度推定方法を使った指数分布についての推定されるパラメータである。fH|H>30が指数分布である場合についての例の全体的なpdfは図4にプロットされている。
発想は、上記の一次元pdfを回転させてR+×R+において0でない値を取るようにするということである。このようにして得られた表面は、表面の下の体積が1になるよう規格化する必要がある。図5は、指数分布を使った例から得られた二次元pdfを示している。
尤度比計算のためのホモ接合体ピーク高さhについてのpdf値の計算は
(1/V)×fH (22)
によって与えられる。ここで、Vは一次元pdfの回転によって得られる表面の下の体積である。
ホモ接合型の提供者についての2D確率分布関数の生成――方法2――アプローチb
アプローチaでは、分布のうち、rfu閾値tにより左側打ち切りされた(left-censored)データに関係する部分を論じた。アプローチbはその代替を提供する。
このアプローチでは、分布のファミリーf(h|θ)が選ばれる。ここで、θは分布を決定するパラメータを表し、θでエンコードされるパラメータは一次元または多次元のいずれでもありうる。選ばれる分布の型は、指数、ワイブル(Weibull)、ガンマまたは正の台(support)Hをもつ他の分布のような数多くの可能性の一つでありうる。たとえば、指数分布が選ばれ:
f(h|θ)=θe-θh
となりうる。ここで、θは種々の値、たとえば0.1,0.11等をもつことができ、それによりファミリーが提供される。
打ち切りされたデータの尤度は次いで関数
L(θ|{hi:i=1,2,...,n})=n1×F(t|θ)×Πm i=1f(hi|θ)
によって確立できる。ここで、左側打ち切りのために0として記録されたn1個の高さがあり、Fは累積確率分布であり、fは指数分布の確率密度関数であり、tは検出閾値である。
尤度の最大値を与えるθ、すなわち、θについての最尤推定値(MLE: maximum likelihood estimate)についてのファミリー構成員が選ばれる。
ヘテロ接合型の提供者についての2D確率分布関数の生成――方法2――アプローチa
ヘテロ接合型の提供者のコンテキストにおいて2Dのpdfを確立するための代替的方法をここで述べる。1Dの類推を使うことによる説明から始め、その後その2Dでの仕組みを詳述するためにそのアプローチを拡張する。
対照試料についてのヘテロ接合型解析結果の考察において、二つの対立形質は異なる高さのピークに帰結しうる。先述したように、一方または両方のピークが、ピークが安全に同定できるあるいはそもそもピークが同定できる閾値レベルtより下でありうる可能性がある。図6は、完全な解析信号Aを示しており、実際に存在する二つのピークPK1およびPK2の表現を含む。PK2の場合、そのピークを見分け、「観察された」と呼ぶのに十分な信号が検出される。しかしながら、ピークPK1の場合には、信号はノイズ信号にあまりに近く、ノイズ信号中に混ざっており、ピークは見分けられない。これは上述した20ないし30rfuにおける自然なカットオフである。見分けられるかもしれないがノイズから絶対的に区別することはできないピークを除外するために、しばしば50rfuのカットオフが提供される。
結果は、閾値tより上のデータの分布が確立されるが、閾値tより下の分布の形はわからないというものである。図7aの頻度分布のポジションが当てはまる。
上記の方法1の場合、閾値より下の未知の部分には分布についての一様頻度が適用される。図7b参照。
この代替的なアプローチでは、非一様分布が閾値tより下の領域に適用される。図4cの図示した例において、三角形の分布が用いられる。他の分布型もこの領域に適用できる。
このアプローチは、今や、図2のコンテキストにおいて述べた四つの領域に、よって2Dに拡張できる。
領域(2,2)は、対照試料についての解析結果から完全にわかっている分布をもつ。領域(1,1)については、h1=t, h2=tにおける領域(2,2)の分布から両軸の接合部での0までの遷移を表し、また領域(1,2)のh1=t, h2=0ないしtの接合部に沿っての値からおよび領域(2,1)のh2=t, h1=0ないしtの接合部に沿っての値からの遷移を与える2D平面または他の分布形を使うことが可能である。領域(1,2)および(2,1)自身は、領域(2,2)において適用される分布と領域(1,1)において適用される分布との組み合わせを表すさらなる分布であることができる。
ヘテロ接合型の提供者についての2D確率分布関数の生成――方法2――アプローチb
上述したように、ある座位におけるヘテロ接合型の提供者からのプロファイルは典型的には二つのピークからなる。しかしながら、プロファイルが少量のDNAから得られる場合、そのプロファイルは観察された結果に一つのピークを含むまたはピークを含まないことがありうる。これは、低くてベースラインに近いとピークが検出できないからである。この例では、30rfuを最小検出限界として使っているが、観察される結果に他の検出限界を適用することもできる。
二次元pdfの台は、R+∪{0}×R+∪{0}である。高さの対(h1,h2)は実際上、台を四つの領域に分割する閾値t、たとえば30rfuによって打ち切りされる。図2参照。低分子量対立形質のピーク高さh1はx軸にプロットされ、高分子量対立形質のピーク高さh2はy軸にプロットされる。領域(0,0)では、両方のピークはt、たとえば30rfuより下である。領域(1,0)ではh1はt、たとえば30rfu以上であり、その一方h2はt、たとえば30rfu未満である。領域(0,2)ではそれが逆になる。領域(1,2)では両方のピークがt、たとえば30rfu以上である。
二次元pdfの推定は平均高さmおよびヘテロ接合体不均衡rによって定義される空間において行われる。高さの各対は、
Figure 0005587197
によって変換される。
pdf fM,Rが与えられたとき、高さの対の空間におけるpdfは公式
Figure 0005587197
を用いて得ることができる。ここで、第一の因子は変換のヤコビアンであり、非特許文献5、第二の因子は実験データから推定できる。推定は、平均高さを与えられたときのヘテロ接合型不均衡の条件付き分布を得ることを通じてなされる:
Figure 0005587197
これは、すべての領域について一つのpdf fR|Mを与えるが、各領域について一つのマージナルがあるであろう。本節の残りの部分では、条件付きpdf fR|Mの推定、次いで各領域についての周辺(marginal)pdf fMの推定を例解する。
条件付き(conditional)pdf fR|Mは、領域(1,2)からのデータを使って、すべての領域についてのpdf fR|Mに外挿することによって得ることができる。実際上、これら三つのゾーンのそれぞれにおいて欠けている材料についてシミュレーションが提供される。変数ln(M)およびln(R)についての同時pdf fln(M),ln(R)がまず得られる。条件付きpdf fR|Mがfln(M),ln(R)から計算される。pdf fR|Mは、30rfuの閾値によって導入されるバイアスにより影響されている。このバイアスが、各fR|MをLog正規pdfで置き換え、Log正規pdfの平均μおよび分散σというパラメータの空間において補正をすることによって除去される。
各ガウシアンpdfが0の相関をもつEMアルゴリズムを使って変数ln(M)およびln(R)について二次元pdf fln(M),ln(R)が推定される。非特許文献4、非特許文献6。自然対数スケールでの平均高さおよびヘテロ接合均衡の散布図が図8に示されている。ガウシアンの推定される混合の成分は表1に与えられる。
Figure 0005587197
当てはめの良好さは、データが推定されたpdfのありそうな試料であることを確かめることによって評価される。データと同じサイズの1000個のサンプルを計算し、各サンプルについて対数尤度に負号を付けたものを計算し、また推定されたpdf中のデータの対数尤度に負号を付けたものを計算することによって、検証が提供できる。データの対数尤度に負号を付けたものは、データと同じサイズのサンプルの対数尤度に負号を付けたものの値の範囲内にはいるはずである。そのことは、その混合がデータによく当てはまることを示す。
Mが与えられたときのRの条件付き分布は、推定されたfln(M),ln(R)から公式
Figure 0005587197
を使って計算できる。
pdf fln(M)は実際は、fln(M),ln(R)と同じ混合割合および対応する平均および分散によって与えられる平均および分散をもつ一次元ガウス分布の混合物である。これらは上記の表1に報告されている。
いくつかの条件付きpdfが上記の公式を使って計算される。推定される対数正規分布が図9a、9b、9c、9dに示される。当面、推定されたpdfに焦点を当てる。50rfuの平均高さを与えられたときのヘテロ接合体不均衡pdf、図9aは、100rfuを条件とするpdf、図9bよりも、分散性が小さいように見える。これは、ドロップアウト領域によって導入されるバイアスの効果である。また、平均高さ500についてのpdf、図9cが1000rfuについてのpdf、図9dと非常に似通っていることも留意されたい。これは、平均高さ500rfu以降では分散性は著しくは減少しないことを示唆している。
図9a〜9dでは、Mが与えられたときのRについての条件付きpdfによく似た対数正規分布をプロットした。対数正規分布のpdfは
Figure 0005587197
によって与えられる。
対数正規分布が良好な当てはめであることに留意されたい。したがって、これらは、対数正規pdfのパラメータ(μ,σ)の空間においてバイアスを補正できる。図10aおよび10bは、M=mの各値についてfR|Mによく当てはまる対数正規分布についての推定されたパラメータのプロットを示している。閾値の効果が存在しないM≧100の領域ではμの値は一定であり、一方σはmが増大するにつれて減少することに留意されたい。
第二の反復工程において、ヘテロ接合体不均衡R=1.11に対応するμ=0.1069に設定する。実際は、この数値は、低分子量対立形質の高さは高分子量対立形質の高さよりも大きい傾向があるので、期待される。次いで、σについての推定手順を再び実行する。図11は、mの各値についてσの推定される値を示している。
増加傾向をMのより小さな値に外挿するために、いくつかの多項式が80ないし200rfuの領域においてσの諸値に当てはめられた。ある線が最良当てはめであり、それが領域(0,80)においてσを外挿するために選ばれた。図12は、推定された線と外挿された値を表示する。
これらの例において、対数正規分布が使われているが、ガンマ分布のような他の外挿可能な分布を使ってもよい。
これから、対数正規分布のファミリーが得られたことになる:
Figure 0005587197
ここで、μ=0.1069であり、σ(m)は図12における補正されたσ値によって与えられる。
ピーク高さについての提案される二次元分布における他の成分は、四つの領域のそれぞれにおける平均についてのpdfである。領域(0,0)については、両方のピーク高さが不明であり、よって区間[0,30]における一様分布に従う。したがって、平均高さについてのpdfもこの区間における一様分布、すなわち
Figure 0005587197
である。ここで、p(0,0)は領域(0,0)にはいる高さの対の割合であり、値0.1012を取る。もちろん、閾値tについての30rfu以外の値を用いることもできる。
領域(1,0)についてpdfを得ることは、さらなる努力を要する。まず、この領域におけるピーク高さ(h1,h2)についての分布が得られ、次いで、平均高さについての分布を計算するために使われる。目標は(h1,h2)についてのpdfを得ることであるが、この分布は平均高さが与えられたときのヘテロ接合体不均衡についての外挿されたpdfをもたない。したがって、平均高さについてのpdfが抽出され、外挿された分布を使い、(h1,h2)の空間に変換し戻される。
変数h1とh2が独立であると想定することによって、この領域における同時分布を定義できる。h2の値はわからないことを考えれば、それは区間(0,30)における一様分布に従うと想定できる。変数h2が従う値は指数分布である。図13参照。当てはめの良好さは、コルモゴロフ・スミルノフの判定法を用いてさらに確証された。
領域(1,0)についてのpdfは
Figure 0005587197
によって与えられる。ここで、p(1,0)は領域(1,0)にはいる高さの対の割合であり、0.0448の値を取る。
平均高さMについてのpdfは、まず変換
Figure 0005587197
を使って得ることができる。次いでこの変換のヤコビアンを使って(M,N)についての二次元pdfが得られる。積分を通じてmについての周辺pdfを得ることができる。(M,N)についての二次元pdfは
Figure 0005587197
によって与えられる。
これは
Figure 0005587197
と書き直すことができる。
Mについてのpdfを得るためにNを積分する前に、(M,N)についてのサンプル空間について述べておく必要がある。それは長方形内の領域である。
Mについての結果として得られるpdfは、m∈[15,30)であれば、
Figure 0005587197
によって、m≧30であれば、
Figure 0005587197
によって与えられる。
領域(0,2)における平均高さについてのpdfを得る方法論は、領域(1,0)についてと同じである。(H1,H2)についてのpdfは
Figure 0005587197
によって与えられる。ここで、p(0,2)は領域(0,2)にはいる高さの対の割合であり、0.0325に等しい。定数λ(0,2)は、30だけ並進されたh2の値から推定された指数pdfのパラメータである。図14参照。当てはめの良好さは、コルモゴロフ・スミルノフの判定法を用いてさらに確証された。
領域(0,2)におけるMについてのマージナル〔周辺分布〕を計算する方法は、領域(1,0)についてと同じである。結果として得られるpdfは、m∈[15,30)であれば、
Figure 0005587197
によって、m≧30であれば、
Figure 0005587197
によって与えられる。
最後に、領域(1,2)についてのpdf fMが(ln(M),ln(R))について推定された二次元pdfから得られる。結果として得られるのは、一次元ガウシアンの混合である。ここで、混合割合は表1に報告したのと同じである。平均は、「平均1」という見出しをもつ列に与えられており、分散は「分散1」という見出しをもつ列に与えられている(原注:Matlab:fitMeanHeightPDF.m)。領域(1,2)におけるMについてのpdfは
Figure 0005587197
によって与えられる。ここで、p(1,2)は領域(1,2)にはいる高さ対の割合であり、piは諸ガウス成分の混合割合であり、f(m|μii)はガウシアンpdfである。
これで式(25)において定義されるすべての領域についての高さの対について二次元pdfのすべての成分を定義したことになる。条件付きpdf fR|Mは、μの固定値および図12に与えられるσ(m)の諸値をもつ対数正規pdfのファミリーによって与えられる。周辺分布fMは上記のすべての領域について与えられた。このpdfの形は、今後の節におけるLRの計算における基礎の一つとなる。
ヘテロ接合型の提供者についての2D確率分布関数の生成――方法2――アプローチc
上記のアプローチbでは、課されるrfu限界によるピークの打ち切りを扱うアプローチを論じた。このアプローチは、左側打ち切りされたピークを扱う仕方に対するさらなる変形を与える。
アプローチbでは、高さの対の空間におけるpdfであるpdf fM,Rが公式
Figure 0005587197
を用いて得られるものとして記述された。ここで、第一の因子は変換のヤコビアンであり、第二の因子は実験データから推定された。推定は、まず平均高さが与えられたときのヘテロ接合不均衡の条件付き分布を得ることを通じてなされた。
Figure 0005587197
これはすべての領域についての一つのpdf fR|Mを与えたが、各領域について一つのマージナルと一緒にであった。アプローチbは次いで、条件付きpdf fR|Mの推定を、次いで図示された各領域についての周辺pdf fMの推定を記述した。
アプローチcでは、公式
Figure 0005587197
の使用および条件付きfR|Mの推定においては、アプローチbと同じアプローチが取られる。変更は、周辺pdf fMの推定を与える仕方である。このさらなるアプローチでは、0として記録されているものさえも含めてピーク高さの値についての可能な範囲の考察が考慮に入れられる。
第一のステップは、確率分布のファミリーf(m|θ)の選択である。ここで、θは分布のファミリーを指定するパラメータの集合である。変数mは平均高さ(h1+h2)/2である。h1およびh2の値は閾値tによって影響され、よってh1はt以上であるか、あるいはtより小さければ0として記録されていることができる。mの値はh1およびh2の左側打ち切りによって影響され、Mについての観察が与えられたときのθの尤度の定義もしかるべく影響される。
h1<tかつh2<tであれば、m<tである。この場合、mが左側打ち切りされ、これらのmについての尤度関数はF(t|θ)である。ここで、Fは以前に選ばれた分布のファミリーの累積確率分布(CDF: cumulative probability distribution)である。h1<tかつh2≧tであれば、mは区間打ち切りされる。すなわち、0.5tから0.5(t+h2)までの区間内にはいる。mについての尤度はF(0.5(t+h2)|θ)−F(0.5t|θ)である。逆にh2<tかつh1≧tである場合についても同様に、mの尤度はF(0.5(t+h1)|θ)−F(0.5t|θ)である。h1≧tかつh2≧tであれば、打ち切りはなく、尤度はf(m|θ)によって与えられる。全体としての尤度は、閾値tを下回り0として記録されるものも含めて高さh1およびh2の各対についての尤度をかけ合わせることによって与えられる。
Figure 0005587197
θでエンコードされるパラメータは上に与えた尤度を最大にするよう選ばれる。
〈尤度比の確立〉
ヘテロ接合の場合についてのピーク高さについての基礎になる2D pdf、fhet(h1,h2)およびホモ接合の場合のピーク高さについての2D pdf、fhom(h1)を確立したので、関心のあるさまざまな状況における尤度比を確立することに進むことができる。
順に詳細に考察されるこれらの状況は、特に法科学のコンテキストにおいて遭遇される、多様な状況である。
その多様な状況は:
1)証拠コンテキストにおいて、単一ソース試料について、DNA量を条件とすることなしに;
2)証拠コンテキストにおいて、単一ソース試料について、DNA量を条件として;
3)インテリジェンス・コンテキストにおいて、単一ソース試料について、DNA量を条件とすることなしに;
4)インテリジェンス・コンテキストにおいて、単一ソース試料について、DNA量を条件として;
5)証拠コンテキストにおいて、混合ソース試料について、DNA量を条件とすることなしに;
6)証拠コンテキストにおいて、混合ソース試料について、DNA量を条件として;
7)インテリジェンス・コンテキストにおいて、混合ソース試料について、DNA量を条件とすることなしに;
8)インテリジェンス・コンテキストにおいて、混合ソース試料について、DNA量を条件として。
状況1――証拠コンテキスト――単一ソース試料――DNA量を条件とすることなし
証拠コンテキストにおいては、二つの仮設の相対的な確からしさが通常は考察される。一般に、これらは起訴者側仮設と弁護側仮設であろう。考察、尤度比は、一般に
Figure 0005587197
として表せる。ここで、
・Cはピーク高さからなる犯罪プロファイルであり、たとえばC={h1,h2}またはC={h1}であり、h={h1,h2<t}、h={h1<t}である。
・Sは被疑者の遺伝子型であり、たとえばS={1,2}またはS={1,1}である。
・Hpは「被疑者が犯行現場にその血痕を残した」ことを述べる起訴者側仮設である;
・Hdは「誰か別の者が犯行現場にその血痕を残した」ことを述べる弁護側仮設である。これは、推定上の提供者、すなわち被疑者に関係する(related)または関係しない(unrelated)および同じ民族または異なる民族の出身である推定上の提供者の弁護側仮設を含む。
LRは:
Figure 0005587197
として展開できる。ここで、UiはHdにおいて述べられている想定される提供者の一である。LRは:
Figure 0005587197
と書ける。ここで、fはこれらの因子が尤度(likelihood)であって、確率(probability)ではないということを意味している。
第二の因子Pr(Ui|S)を計算できるいくつかの方法があり、未知の寄与者と被疑者との間の関係性(relatedness)の考察を含みうる上記した非特許文献2および/または非特許文献3によって与えられる方法を使う。
因子f(C|S,Hp)およびf(C|Ui,S,Hd)は同じ型の計算を述べている:仮定される提供者〔ドナー〕が与えられたときにC内のピーク高さのセットを観察する尤度である。したがって、その計算の議論は
f(C|G) (43)
と単純化される。ここで、Gは仮定される提供者の遺伝子型(genotype)を表す。
尤度のこの一般的な形は、本発明の動作およびその利点の鍵となるものである。
上で論じたpdf形成方法において与えられるような、実験データからのf(C|G)の推定は、以前に構想されたこともなければ提供されたこともない。
推定は、ヘテロ接合型ソースの希釈データ・アプローチに由来することができる。特に方法1。ホモ接合の状況についてはホモ接合型ソース方法を使うことができる。
f(C|G)の推定に関する限り、これはあらゆる座位からのデータを、考察されるすべての座位をカバーする、f(C|G)の一般的な単一の推定にグループ化することによってできる。各座位についてのf(C|G)の別個の推定を与えることも等しく可能である。二次元密度推定を使ってf(C|G)の推定を生成する多様な方法が適用される。
以下の節では、証拠コンテキストへのアプローチのより詳細な適用を、四つのシナリオについて与える:
a)被疑者はヘテロ接合で、犯罪プロファイルは一つのピークをもつ;
b)被疑者はヘテロ接合で、犯罪プロファイルは二つのピークをもつ;
c)被疑者はヘテロ接合で、犯罪プロファイルはピークを含まない;
d)被疑者はホモ接合で、犯罪プロファイルは一つのピークを含む;
e)被疑者はホモ接合で、犯罪プロファイルは一つのピークを含む。
〈被疑者がヘテロ接合であり犯罪プロファイルが一つのピークをもつ〉
この状況では、C={hb}であり、S={a,b}である。尤度比は、上記の式1と整合して:
Figure 0005587197
によって与えられる。
その際、分子は:
Figure 0005587197
となる。ここで、haは、閾値より小さいピーク高さであり、よって結果において観察されない。これは図17において図示した型の状況であり、haはPK1についての状況に対応する。
式(1.2)の右辺の項は、ヘテロ接合体についてのpdfの節で上述した型の二次元のpdfである。
式(1.1)の分母は:
f(hb|Hd)= f(hb|U={b,b},Hd)Pr(U={b,b}|S={a,b}),Hd
+f(ha<t,hb|U={b,Q},Hd)Pr(U={b,Q}|S={a,b})Hd (1.3)
によって与えられる。ここで、Qはa以外の他の任意の対立形質(allele)素性である。
式(1.3)における右辺の二番目の因子Pr(U={b,b}|S={a,b})HdおよびPr(U={b,Q}|S={a,b})Hdは、非特許文献2および非特許文献3に記載される方法を使って計算できる。これは、被疑者と未知の寄与者が同じ民族集団および異なる民族集団の出身である場合、および被疑者と未知の寄与者が血縁関係がある場合を含む。
ここで、式(1.3)の右辺の最初の因子についてより詳細に述べる。
二番目の因子は:
f(hb|U={b,b},Hd)=fhom(hb) (1.4)
として計算される。ここで、fhomは上で論じた一次元pdfである。第三の因子は公式
Figure 0005587197
を用いて計算される。ここで、fQは閾値より小さい。
これが、被疑者がヘテロ接合型で犯罪プロファイルが一つのピークをもつ状況についての尤度比についての決定可能な値を与える。
〈被疑者がヘテロ接合であり、犯罪プロファイルが二つのピークをもつ〉
この状況では、C={ha,hb}であり、S={a,b}である。LRは:
Figure 0005587197
によって与えられる。
分子は:
f(C={ha,hb}|S={a,b},Hd)=fhet(ha,hb) (2.2)
によって与えられる。
分母は:
f(C={ha,hb}|S={a,b},Hd)=fhet(ha,hb)Pr(U={a,b}|S={a,b},Hd) (2.3)
によって与えられる。
式(2.3)における右辺の第二の項は、非特許文献2および非特許文献3に記載される方法を使って計算できる。これは、被疑者と未知の寄与者が同じ民族集団および異なる民族集団の出身である場合、および被疑者と未知の寄与者が血縁関係がある場合を含む。第一の項はピーク高さについての二次元pdfから計算される。
するとLRは
Figure 0005587197
によって与えられる。
これが、被疑者がヘテロ接合型で犯罪プロファイルが二つのピークをもつ状況についての尤度比についての決定可能な値を与える。これは、同じ遺伝子型をもつ異なる寄与者は同じピーク高さ分布をもつであろうことを前提としている。
〈被疑者がホモ接合であり犯罪プロファイルが一つの対立形質を含む〉
この状況では、C={hb}であり、S={b,b}である。LRは:
Figure 0005587197
によって与えられる。
分子は:
f(hb|S={b,b},Hp)=fhom(hb) (3.2)
によって与えられる。ホモ接合型寄与者について推定された密度関数である。
分母は:
f(hb|S={b,b},Hd)
= f(hb|U={b,b},Hd)Pr(U={b,b}|S={b,b},Hd)
+f(hb,ha<t|U={b,Q},Hd)Pr(U={b,Q}|S={b,b}Hd) (3.3)
によって与えられる。
項f(hb|U={b,b},S={b,b},Hd)=fhom(hb) (3.4)
は分子と同じである。項
Figure 0005587197
は、ピーク高さについてのpdfを推定することによって得ることができる。
これが、被疑者がヘテロ接合型で犯罪プロファイルが一つの対立形質をもつ状況についての尤度比についての決定可能な値を与える。

先述したように、ホモ接合の状況は1D pdfに関係して出発し、アプローチにおける互換性のために2D pdfに変換される必要がある。この2Dアプローチは尤度計算にも拡張される。このアプローチは、高さh1をもつホモ接合型の試料がおよその高さ0.5h1および0.5h1をもつヘテロ接合型の試料を観察するのと同様であるという観察から発している。
その際、ホモ接合型の提供者についての尤度は
Figure 0005587197
によって与えられる。ここで、f(C={αh1,(1−α)h1}|G={1,1})はヘテロ接合体についての二次元尤度において計算された尤度関数であり、f(α)はαについての確率密度関数であり、αはその試料の割合である。あるいはまた、この量を、0.5に近いαについて:
f(C={h1}|G={1,1}) = f(C={αh1,(1−α)h1}|G={1,1}) (45)
で近似することができる。
本節では、このアプローチは、関与するDNA量についての考察なしに与えた。次節はDNA量を条件とする。しかしながら、提示の簡単のため、ここで上述したアプローチをDNA量χを条件とするときに拡張したものに言及しておく。上記の諸公式は有効なままであり、それらは
Figure 0005587197
となる。ここで、f(C={αh1,(1−α)h1}|G={1,1},χi)は、目標とされるDNA量χiに関して得られたデータから推定される、ヘテロ接合体の寄与者についての尤度関数である。
あるいはまた、0.5に近いαについては:
f(C={h1}|G={1,1},χi) = f(C={αh1,(1−α)h1}|G={1,1},χi) (47)
となる。
状況2――証拠コンテキスト――単一ソース試料――DNA量を条件とすることあり
上記の状況1では、計算が
f(C|G) (48)
と単純化される様子を論じた。ここで、Gは想定される提供者を表し、尤度のこの一般的な形が本発明の動作およびその利点に対する鍵である。
ここで述べるアプローチの拡張では、尤度は、DNA量を条件とすることによっても
f(C|G)=Σj f(C|G,χj)Pr(χj|I(h)) (49)
によって計算できる。ここで、Pr(χj|I(h))は、ピーク高さ情報I(h)が与えられたときのDNA量の確率分布である。
f(C|G)の計算は、対照試料を通じて考察されるそれぞれの異なるDNA量について行うことができる。実際上、DNAの各量について、先述した一般的なアプローチを使ってデータ・セットが生成される。このデータは将来の使用のために保存される。次いで、解析状況におけるDNA量にとって有意な分布がこれらのうちから選択され、使われる。
確率分布Pr(χj|I(h))は、χ1からχjについての離散的確率のリストに関わる。ここで、ΣiPr(χi)=1である。この分布は、対照試料からの観察された分布を考察することによって得ることができる。対照試料の結果を組み合わせてこれを達成するさまざまな方法がある。
ある対照試料中の各座位について観察されるあらゆる高さhを考察することが可能である。これは、ある対照試料についてそのすべての座位にわたる平均hを与える。次いで、同じ量χにおける諸反復(repeats)についての諸平均hが複数の対照試料にまたがって一緒にグループ化されることができる。よって
Figure 0005587197
である。これは、分布
Figure 0005587197
の推定およびそれにある分布を当てはめることを許容する。推定は、1Dでの確率分布を推定するためのさまざまなアプローチによって与えられることができる。たとえば、この分布は、EMアルゴリズムを使って1D正規分布の混合を使って推定できる。たとえば非特許文献4参照。
他のアプローチは、位置を座位ごとに考察することができ、各χにおける平均高さを得、分布を与えるプロセスは異なる座位については別個に実行される。
式5(どの式)についての情報の両方のセットを一つまたは複数の座位について得ることができる。それには好ましくは当該アプローチが使われている座位が含まれるが、これは必須ではない。
ある座位についてのPr(X=χi|I(h))の計算は、座位(loci)の順序付けL1,L2,...,Lnに基づく逐次的な仕方で実行されることが可能である。その例では、プロセスは、L1についてのPr(X=χi|I(h))を一様分布に設定することによって始まる。これは、部分的には、I(h)について入手可能な情報がないからである。次いで、L2についてのPr(X=χi|I(h))の計算を、L1からのI(h)についての想定に基づいて行うことが可能である。L1についてのI(h)の事前の知識は有益である。次いでプロセスは、L3についてのPr(X=χi|I(h))の計算を、L1およびL2からのI(h)に基づいて行う。プロセスは、このようにして続けられ、しまいにはLnについてのPr(X=χi|I(h))はL1,L2,...,Ln-1からのI(h)に基づいて計算される。これは、さまざまなPrを計算するために事前の知識を最善に、だが処理における循環性問題(circularity issue)を生じることなく、利用することを提供する。
Pr(X=χi|I(h))を計算するために、その関数は
Figure 0005587197
に等値できる。ここで、
Figure 0005587197
は、χ=χiのみのDNAについてのデータについて計算された1D分布である。
尤度f(C|Gi)およびそのDNA量を条件とするバージョンf(C|Gij)は、本発明の鍵である。実験的に導出されたデータからのf(C|G,χi)の推定は以前に構想されたことも提供されたこともなかった。ここでもまた:
これは希釈データから提供されることができる;
f(C|G,χi)の推定は、すべての座位からのデータをグループ化することによって行うことができ、潜在的には該推定はすべての座位についての一つのf(C|G,χi)を与えるが、それぞれのDNA量χiについて別個のf(C|G,χi)を与える;
f(C|G,χi)の推定は、座位ごとに行うことができ、潜在的には該推定は各座位についてそれぞれのDNA量χiについて一つのf(C|G,χi)を与える;
f(C|G,χi)の推定は、二次元密度推定を推定するための任意の方法を使って行うことができる;
f(C|G,χi)の推定は、ヘテロ接合型提供者において述べた方法、方法1および/またはホモ接合型提供者方法1の諸アプローチを使って行うことができる。
同様に、実験的に導出されたデータからのPr(X=χi|I(h))の推定は以前に提供されたことも構想されたこともなかった。ここでも、これは:
希釈データからのPr(X=χi|I(h))の推定;
ピーク高さ情報I(h)がピーク高さの任意の関数、たとえば二つのピーク高さの平均または諸高さの合計であること;
ある座位についてのPr(X=χi|I(h))の、同じ座位からのまたは一つまたは複数の他の座位からのI(h)に基づく推定
を含むことができる。
状況3――インテリジェンス・コンテキスト――単一ソース試料――DNA量を条件とすることなし
インテリジェンス・コンテキストでは、証拠コンテキストで試みられたのとは異なる問題が考察対象となる。インテリジェンス・コンテキストは、犯罪現場試料からのDNAプロファイルと、英国で使われる国立DNAデータベース(The National DNA Database(登録商標))のようなデータベースに記憶されている諸プロファイルとの間の結び付けを見出そうとする。このプロセスは、収集されたプロファイルが与えられたときの遺伝子型に関心をもつ。
よって、このコンテキストでは、プロセスは犯罪プロファイルCで始まり、被疑者のプロファイルの順序付けられたリストであって、リスト中の最初のプロファイルが最も尤度の高い提供者の遺伝子型であるものを提案することに関心がある。このタスクは通例、犯罪血痕を与えられたときの遺伝子型の事後確率に従ってランクする遺伝子型のリスト{G1,G2,...,Gm}を提案することによってなされる。
遺伝子型のリストは犯行現場Cから生成される。たとえば、h1およびh2の両方がドロップアウト閾値tより大きいとしてC={h1,h2}である場合、唯一の潜在的な提供者遺伝子型はG={1,2}である。C={h1}である場合は、潜在的な提供者はG1={1,1}およびG2={1,Q}である。ここで、Qは、DNA中に存在するが犯罪プロファイルCについての結果においては観察されない、対立形質1と異なる他の任意の対立形質を表す。
犯罪プロファイルが与えられたときの想定される遺伝子型の事後確率は、公式
Figure 0005587197
によって与えられる。ここで、Giは潜在的な提供者遺伝子型の網羅的なリストのさまざまな構成員であると想定され、π(Gi)は問題の人口集団から計算される遺伝子型Giについての事前分布である。
証拠コンテキストおよび上記の式4と同様の仕方で、項
f(C|Gi)
はプロセスの鍵である。この項は、上で論じたpdfを定量化するためのさまざまなアプローチを使ってうまく推定できる。
一般に、推定は、本稿の他所で論じる証拠評価と同じである。
状況4――インテリジェンス・コンテキスト――単一ソース試料――DNA量を条件とすることあり
状況1を状況2に拡張したのと同様の仕方で、状況3におけるアプローチを、関与するDNA量を考慮するよう拡張することが可能である。
この状況における事後確率は、公式
Figure 0005587197
を使って計算される。ここで、Pr(χj|I(h))は、ピーク高さについての情報が与えられたときのDNA量の確率分布である。同じ座位に関しておよび/または一つまたは複数の他の座位にまたがっての、可能性としては前記公式が実際上適用される座位を含むこの確率分布を確立する諸可能性が存在する。
状況5――証拠コンテキスト――混合ソース試料――DNA量を条件とすることなし
多様な状況において、遭遇されるDNA試料は単一のソースからのものではなく、混合ソースからのものである。混合ソースは、二人、三人またはそれ以上の寄与者から生じる。このアプローチは、一つのそのような混合ソース状況に関して詳述するが、このアプローチは他の型の混合ソース試料についても有効である。
二人の寄与者から生じる混合ソース試料についての証拠コンテキストでは、起訴者側および弁護側はいずれも仮設をもつであろう。それらの仮設は、たとえば:
i)起訴者側仮設Hp:被疑者および誰か別の者が犯行現場における血痕への提供者である;
ii)弁護側仮設Hd:二人の未知の人が犯行現場における血痕への提供者である。
LRは公式:
Figure 0005587197
によって与えられる。
犯罪プロファイルは、上記二つのソースによって寄与される対立形質およびそれらが解析結果に反映される度合いに依存して0ないし4通りの高さを含むことができる。LR公式は:
Figure 0005587197
と書ける。ここで、f(C|S,Ui,Hp)はSおよびUiが与えられたときのCの密度関数であり、f(C|Uj,Uk,S,Hd)はUj、UkおよびSが与えられたときのCの密度関数である。
式10は尤度の比であり、したがって、Prはfに変わっている。
因子Pr(Ui|S)およびPr(Uj,Uk|S)は、非特許文献1によって導入され、血縁性の考察を含みうる非特許文献2および非特許文献3にも記載される公式を使って計算されうる。
因子f(C|S,Ui,Hp)およびf(C|Uj,Uk,S,Hd)は同じ型の計算を述べている:二人の想定される提供者が与えられたときの犯罪プロファイルCの尤度である。この計算を項
f(C|G1,G2) (54)
によって表す。ここで、G1およびG2は想定される提供者の遺伝子型である。よって、状況は、前記の諸状況と等価な一般的な性質の因子に帰着される。これは、前述した対照試料アプローチを使って評価できる。
以下の節では、証拠コンテキストへのこのアプローチのより詳細な適用を次の二つのシナリオについて与える:
a)被疑者と犠牲者がヘテロ接合型であり、両者の間に重なり合う対立形質がなく、犯罪プロファイルに三つのピークしかない;
b)被疑者と犠牲者がヘテロ接合型であり、両者の間に重なり合う対立形質が一つあり、犯罪プロファイルに三つのピークしかない。
いずれのシナリオにおいても、二つのソースからの試料に関して一つの座位についてのLRを考えており、考察すべき二つの基本的仮設がある:
Hp:被疑者(S: suspect)および犠牲者(V: victim)が犯罪プロファイルの発生者であるという検察側仮設;および
Hd:犠牲者(V)と未知の人物(U: unknown)が犯罪プロファイルの発生者であるという弁護側仮設。
ヘテロ接合型の被疑者および犠牲者、重なる対立性質なし、犯罪プロファイルに三つのピーク
この状況Hp:V+S、Hd:V+Uでは、C={ha,hb,hc}、V={a,b}、S={c,d}である。LRは:
Figure 0005587197
によって与えられうる。
分子は:
f(C={ha,hb,hc}|V={a,b},S={c,d},Hp)=fhet(ha,hb)×fhet(hc,hd) (4.2)
によって与えられる。
式2.2における独立の想定はシミュレーション方法についてもなされる。
分母についての未知の寄与者は{a,c}、{b,c}、{c,Q}であることができる。分母は:
f(C={ha,hb,hc}|V={a,b},S={c,d},Hd)
=f(C={ha,hb,hc}|V={a,b},S={c,d},U={a,c},Hd)Pr(U={a,c}|S={a,b})
+f(C={ha,hb,hc}|V={a,b},S={c,d},U={b,c},Hd)Pr(U={b,c}|S={a,b})
+f(C={ha,hb,hc}|V={a,b},S={c,d},U={c,Q},Hd)Pr(U={a,c}|S={a,b})
(4.3)
によって与えられる。
U={a,c}についての因子は公式:
f(C={ha,hb,hc}|V={a,b},U={a,c},Hd)=fhet(mxha,hb)×fhet((1−mx)ha,hc)
(4.4)
を用いて計算される。
U={b,c}についての因子は公式:
f(C={ha,hb,hc}|V={a,b},U={b,c},Hd)=fhet(ha, mxhb)×fhet(ha,(1−mx)hc)
(4.5)
を用いて計算されうる。
U={c,Q}についての因子は公式:
f(C={ha,hb,hc}|V={a,b},U={c,Q},Hd)=fhet(ha,hb)×fhet(hc,hQ)
(4.6)
を用いて計算されうる。
ヘテロ接合型の被疑者および犠牲者、一つの重なる対立形質、犯罪プロファイル中に三つのピーク
この状況では、Hp:V+S、Hd:V+U、C={ha,hb,hc}、V={a,b}、S={b,c}である。尤度比は:
Figure 0005587197
によって与えられる。
分子について:
f(C={ha,hb,hc}|V={a,b},S={b,c},Hp)=fhet(ha, mxhb)fhet((1−mx)hb,hc)
(5.2)
となる。
分母については、次の潜在的な未知の寄与者:
U∈{{a,c},{b,c},{c,c},{c,Q}}
を考察する。
未知の寄与者ごとに諸公式を見ておく。手始めにU={a,c}については:
f(C={ha,hb,hc}|V={a,b},S={b,c},U={a,c},Hd)=fhet(mxha,hb)fhet((1−mx)ha,hc)
(5.3)
U={b,c}については:
f(C={ha,hb,hc}|V={a,b},U={b,c},Hd)=fhet(ha, mxhb)fhet((1−mx)hb,hc)
(5.4)
U={c,c}については:
f(C={ha,hb,hc}|V={a,b},U={c,c},Hd)=fhet(ha,hb)fhet(0.5hc,0.5hc)
(5.5)
U={c,Q}については:
f(C={ha,hb,hc}|V={a,b},U={c,Q},Hd)=fhet(ha,hb)fhet(hc,hQ)
(5.6)
となる。
証拠状況についての、またのちに論じるインテリジェンス状況における核心には尤度f(C|G1,G2)の計算がある。
状況6――証拠コンテキスト――混合ソース試料――DNA量を条件とすることあり
この状況は、状況5について上述したのと等価な仕方で扱われる。諸公式は、DNA量を条件とすることを使うよう修正できる。
状況7――インテリジェンス・コンテキスト――混合ソース試料――DNA量を条件とすることなし
インテリジェンス・コンテキストでは、タスクは、座位ごとに、遺伝子型G1およびG2の対の順序付けられたリストを、リスト中の最初の対が犯罪血痕の最も尤度の高い提供者であるように、提案することである。
出発点は、犯罪血痕プロファイルCである。たとえば、C={h1,h2,h3}である。これから、潜在的な提供者の対の網羅的なリスト{G1,i,G2,i}が生成される。これらの対のそれぞれについて、遺伝子型についての確率分布が公式
Figure 0005587197
を使って計算される。ここで、Pr(G1,i,G2,i)は、括弧内の遺伝子型の対についての事前分布であり、一様分布に設定される、あるいは非特許文献1によって導入された公式を使って計算されることができる。
先行する節の状況5および状況6と同様、証拠評価およびインテリジェンスのための核心には、尤度f(C|G1,G2)の計算がある。
状況8――インテリジェンス・コンテキスト――混合ソース試料――DNA量を条件とすることあり
状況8は、状況7のアプローチを使って扱える。ただし、項fhetはDNA量を条件とすることになる。

混合試料状況についての追加情報
先述したように、証拠、インテリジェンス・コンテキストについての混合ソース・アプローチの核心には、尤度f(C|G1,G2)の計算がある。以下の記述は、因子分解を通じたf(C|G1,G2)の計算を与える。因子分解はその計算を、単一プロファイルについての尤度の計算に帰着させる。そのアプローチは、DNA量を条件とすることを許容するよう、f(C|G1,G2i)にも拡張される。さらに、これらの公式に関して、実験データからのPr(χi|I(h))の推定およびその使用が詳述される。
これらの項が計算される仕方は、それらの遺伝子型が共有する対立形質に依存する。それらについて場合ごとに記述する。尤度の因子分解が混合割合を条件とすることに基づく方法から始め、次いで混合割合mxを条件とするほかDNA量χを条件とする方法を与える。
m x を条件とすることを通じた尤度の計算
シナリオ1――提供者が対立形質を全く共有しない
この場合、二人の混合物の尤度を二つの単一プロファイルの尤度に因子分解するために混合比mxの助けは必要ない。たとえば、二人の提供者がヘテロ接合型であれば:
f(C={h1,h2,h3,h4}|G1={1,2},G2={3,4})
=f(C={h1,h2}|G1={1,2})f(C={h3,h4}|G2={3,4}) (56)
一方の提供者がホモ接合型であれば:
f(C={h1,h2,h3}|G1={1,2},G2={3,3})
=f(C={h1,h2}|G1={1,2})f(C={h3}|G2={3,3}) (57)
両方の提供者がホモ接合体であれば:
f(C={h1,h2}|G1={1,1},G2={2,2})
=f(C={h1}|G1={1,1})f(C={h2}|G2={2,2}) (58)
となる。
シナリオ2――提供者が一つの対立形質を共有する
提供者が一つの対立形質を共有する場合、共通のピーク高さ、最大のピークは混合割合mxに従って分割される。両方の提供者がヘテロ接合型であれば:
Figure 0005587197
となる。ここで、Pr(mx)は混合割合についての離散的な確率分布である。
一方の提供者がホモ接合体であれば:
Figure 0005587197
となる。
シナリオ3――提供者が二つの対立形質を共有する
シナリオ2の場合と同様、二人混合物尤度を二つの単一プロファイル尤度に因子分解するために混合割合が使われる。両方のピークが分割される。より具体的には、
Figure 0005587197
となる。
DNA量χおよびmxを条件とすることを通じた尤度の計算
シナリオ1――提供者が対立形質を全く共有しない
二人の提供者がヘテロ接合体であれば:
Figure 0005587197
ここで、mxχiは提供者1に割り当てられたDNA量の割合であり、(1−mxiは提供者2に割り当てられたDNA量である。Pr(χi|I(h))はピーク高さ情報に基づくDNA量に対する確率分布である。
一方の提供者がホモ接合型であれば:
Figure 0005587197
両方の提供者がホモ接合体であれば:
Figure 0005587197
となる。
シナリオ2――提供者が一つの対立形質を共有する
提供者が一つの対立形質を共有する場合、共通のピーク高さが混合割合mxに従って分割される。両方の提供者がヘテロ接合型であれば:
Figure 0005587197
となる。ここで、Pr(mx)は混合割合についての離散的な確率分布であり、Pr(χi|I(h))は、可能性としては当該公式が使われる座位を含む一つまたは複数の座位からのピーク情報が与えられたときのDNA量の確率分布である。
一方の提供者がホモ接合型であれば:
Figure 0005587197
となる。
シナリオ3――提供者が二つの対立形質を共有する
前記の場合と同様、二人混合物尤度を二つの単一プロファイル尤度に因子分解するために混合割合が使われる。より具体的には、
Figure 0005587197
となる。

一般的な観察
2D pdfを利用することにより、本発明はいくつかの利点を提供し、多様な状況および仮設を考察することを許容する。
たとえば、図16の状況は、試料ソースがホモ接合型であることに起因して、あるいはヘテロ接合型であり対立形質ドロップアウトが起こることに起因して生じうる。これらの可能性の両方が本発明において十全に考察される。
混合物考察のコンテキストでは、同じ数の次元をもつpdfどうしを比較する原則も使われる。この場合、2D pdf(式4.6、5.5、5.6のような)と比較すべきいくつかの3D pdf(式4.4、4.5、5.3、5.4のような)がある。3D pdfは、混合割合を考慮に入れて各対立形質についてデコンボルーションすることによって2D pdfに移される。
本発明に基づくモデル化はいくつかの利点をもたらす:
1)本モデルは、対立形質ドロップアウトを扱える。ドロップアウト事象は2D pdfの推定において考察されるからである。
2)本モデルは、優先的な増幅(preferential amplification)を自動的に、かつ平均ピーク高さの関数として扱える。現在のところ、解析プロセスに関与する報告担当者が、優先的増幅閾値に基づいて提供者のどの組み合わせを選ぶかを選択する必要がある。
3)本モデルは劣化(degradation)に対処できる。2D pdf中に暗黙的な優先的増幅分布は、平均ピーク高さに従って変化する。
4)本モデルは、より多数の場合についてより大きな尤度比を与えるシステムを与えることになり、データベース検索から得られるランキング・プロファイルを助けることができる。
5)上述のアプローチは、混合物解析の結果に対するスコア付けを与えるよう拡張できる。
6)前記アプローチは、データベースに対する検索を優先度付けすることを許容し、よって必要とされる検索回数を減らす。減少した検索回数は、検索スピードの増加を与える。
引用文献1〜4およびその内容は、ここに参照により組み込まれるものであり、特にこれらの文書内の特定の位置における教示が参照として強調される。
いくつかの態様を記載しておく。
〔態様1〕
試験試料結果セットを別の試料結果セットと比較する、コンピュータ実装される方法であって:
DNAの可変特徴について検出された一つまたは複数の素性について前記試験試料結果セットについての情報を提供する段階と;
DNAの可変特徴について検出された一つまたは複数の素性について前記別の試料結果セットについての情報を提供する段階と、
ある仮設の、代替仮設に対する
〔数117〕

Figure 0005587197


として定義される尤度比を確立する段階とを有しており、
ここで、Cは試験試料からの前記試験結果セットであり、Sは前記別の試料結果セットであり、H p は一つの仮設であり、H d は代替仮設であり、U i はH d において述べられている想定されるソースの一つであり、
前記尤度比は、前記試験試料結果セットおよび/または別の試料結果セット内のDNA量を条件としている、
方法。
〔態様2〕
前記尤度比が、想定されるソースを与えられたときのにC内のピーク高さのセットを観察する尤度の定義を含む、態様1記載の方法。
〔態様3〕
前記尤度比が
〔数118〕
Figure 0005587197
として定義され、ここで、f項は尤度である因子である、態様2記載の方法。
〔態様4〕
態様3記載の方法であって、因子f(C|S,H p )および/またはf(C|U i ,S,H d )は想定されるソースが与えられたときにC内のピーク高さのセットを観察する尤度の定義である、方法。
〔態様5〕
前記比較が項f(C|G)の考察を含み、ここで、Gは想定されるソース遺伝子型を表す、態様1記載の方法。
〔態様6〕
態様5記載の方法であって、前記尤度が
f(C|G)=Σ j f(C|G,χ j )Pr(χ j |I(h))
の形でDNA量を条件とすることによって計算され、ここで、Pr(χ j |I(h))はピーク高さ情報I(h)が与えられたときのDNA量の確率分布である、方法。
〔態様7〕
前記項f(C|G)が推定である、態様5記載の方法。
〔態様8〕
前記項f(C|G)が実験データから導出される、態様5記載の方法。
〔態様9〕
前記項f(C|G)が一つまたは複数の確率分布関数を含む、態様8記載の方法。
〔態様10〕
Pr(χ j |I(h))についての確率分布がχ 1 からχ j についての離散的確率のリストに関係し、ここで、Σ i Pr(χ i |I(h))=1である、態様9記載の方法。
〔態様11〕
前記確率分布が、DNAの対照試料の解析からの観察された分布を考察することによって得られる、態様10記載の方法。
〔態様12〕
前記確率分布関数は、平均高さmおよびヘテロ接合体不均衡rによって定義される空間における高さh 1 およびh 2 の対についての二次元pdfを推定することによって与えられる、態様9記載の方法。
〔態様13〕
高さの各対が
〔数119〕

Figure 0005587197
によって変換される、態様12記載の方法。
〔態様14〕
あるpdf f M,R が与えられたとき、高さの対の空間におけるpdfが公式
〔数120〕

Figure 0005587197


を用いて得られる、態様13記載の方法。
〔態様15〕
因子
〔数121〕
Figure 0005587197
が変換のヤコビアンである、態様14記載の方法。
〔態様16〕
因子f M,R (m,r)が実験データから推定される、態様14記載の方法。

Claims (14)

  1. 試験試料結果セットを別の試料結果セットと比較する、コンピュータ実装される方法であって:
    DNAの可変特徴について検出された一つまたは複数の素性について試験試料結果セットについての情報を、受領手段によって受領する段階と;
    DNAの可変特徴について検出された一つまたは複数の素性について別の試料結果セットについての情報を、受領手段によって受領する段階であって、前記別の試料結果セットは別の試験試料から解析によって得られたものである、段階と、
    ある仮の、代替仮に対する
    Figure 0005587197



    として定義される尤度比を、確立手段によって確立する段階と
    出力手段によて前記尤度比を出力する段階とを有しており、
    ここで、Cは試験試料からの前記試験試料結果セットであり、Sは前記別の試料結果セットであり、Hpは一つの仮であり、Hdは代替仮であり、UiはHdにおいて述べられている想定されるソースの一つであり、
    前記尤度比は、前記試験試料結果セットおよび/または前記別の試験結果セット内のDNA量を条件としており
    前記比較が項f(C|G)の考察を含み、ここで、Gは想定されるソース遺伝子型を表し、前記一つの仮説H p で使われる前記別の試料結果セットでは遺伝子型Sであり、前記代替仮説で使われる前記想定されるソースの一つでは遺伝子型U i であり、
    前記尤度が
    f(C|G)=Σ j f(C|G,χ j )Pr(χ j |I(h))
    の形でDNA量を条件としており、ここで、Pr(χ j |I(h))はピーク高さ情報I(h)が与えられたときのDNA量の確率分布である、
    方法。
  2. 前記尤度比が、想定されるソースを与えられたときのにC内のピーク高さのセットを観察する尤度の定義を含む、請求項1記載の方法。
  3. 前記尤度比が
    Figure 0005587197

    として定義され、ここで、f項は尤度である因子である、請求項2記載の方法。
  4. 請求項3記載の方法であって、因子f(C|S,Hp)および/またはf(C|Ui,S,Hd)は想定されるソースが与えられたときにC内のピーク高さのセットを観察する尤度の定義である、方法。
  5. 前記項f(C|G)が推定である、請求項記載の方法。
  6. 前記項f(C|G)が実験データから導出される、請求項記載の方法。
  7. 前記項f(C|G)が一つまたは複数の確率分布関数を含む、請求項記載の方法。
  8. Pr(χj|I(h))についての確率分布がχ1からχjについての離散的確率のリストに関係し、ここで、ΣiPr(χi|I(h))=1である、請求項記載の方法。
  9. 前記確率分布が、DNAの対照試料の解析からの観察された分布を考察することによって得られる、請求項記載の方法。
  10. 前記確率分布関数は、平均高さmおよびヘテロ接合体不均衡rによって定義される空間における高さh1およびh2の対についての二次元pdfを推定することによって与えられる、請求項記載の方法。
  11. 高さの各対が
    Figure 0005587197

    によって変換される、請求項10記載の方法。
  12. あるpdf fM,Rが与えられたとき、高さの対の空間におけるpdfが公式
    Figure 0005587197

    を用いて得られる、請求項11記載の方法。
  13. 因子
    Figure 0005587197
    が変換のヤコビアンである、請求項12記載の方法。
  14. 因子fM,R(m,r)が実験データから推定される、請求項12記載の方法。
JP2010533661A 2007-11-19 2008-11-19 Dna証拠の考察に関する改善 Expired - Fee Related JP5587197B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
GB0722649.1 2007-11-19
GB0722649A GB0722649D0 (en) 2007-11-19 2007-11-19 Improvements in and relating to the consideration of evidence
GB0804665.8 2008-03-13
GB0804665A GB0804665D0 (en) 2008-03-13 2008-03-13 Improvements in and relating to the consideration of evidence
GB0810624A GB0810624D0 (en) 2008-06-11 2008-06-11 Improvements in and relating to the consideration of evidence
GB0810624.7 2008-06-11
GB0815300.9 2008-08-21
GB0815300A GB0815300D0 (en) 2008-08-21 2008-08-21 Improvements in and relating to the consideration of evidence
PCT/GB2008/003882 WO2009066067A1 (en) 2007-11-19 2008-11-19 Improvement in and relating to the consideration of dna evidence

Publications (2)

Publication Number Publication Date
JP2011504359A JP2011504359A (ja) 2011-02-10
JP5587197B2 true JP5587197B2 (ja) 2014-09-10

Family

ID=40459600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010533661A Expired - Fee Related JP5587197B2 (ja) 2007-11-19 2008-11-19 Dna証拠の考察に関する改善

Country Status (7)

Country Link
US (1) US8121795B2 (ja)
EP (1) EP2212818A1 (ja)
JP (1) JP5587197B2 (ja)
AU (1) AU2008327704B2 (ja)
CA (1) CA2705280C (ja)
NZ (1) NZ585147A (ja)
WO (1) WO2009066067A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120046874A1 (en) * 2009-04-09 2012-02-23 Forensic Science Service Limited Consideration of evidence
US20120270226A1 (en) 2009-11-10 2012-10-25 Forensic Science Service Limited matching of forensic results
GB201004004D0 (en) * 2010-03-10 2010-04-21 Forensic Science Service Ltd Improvements in and relating to the consideration of evidence
GB201108587D0 (en) * 2011-05-23 2011-07-06 Forensic Science Service Ltd Improvements in and relating to the matching of forensic results
GB201110302D0 (en) * 2011-06-17 2011-08-03 Forensic Science Service Ltd Improvements in and relating to the consideration of evidence
JP2014523580A (ja) * 2011-06-22 2014-09-11 ブイオーアール データ システムズ インコーポレイテッド 複数の寄与体を有するdna試料に基づいて寄与体のstr遺伝子型を識別するためのシステムおよび方法
US11952622B2 (en) * 2013-07-18 2024-04-09 The Johns Hopkins University Analysis of DNA-containing samples and resolution of mixed contributor DNA samples
DE102014008537A1 (de) 2014-06-04 2015-12-17 Friedrich-Schiller-Universität Jena Wasserlösliche manganbasierte Kohlenstoffmonoxid freisetzende Moleküle, deren Verwendung und Verfahren zu deren Herstellung
CN107622183B (zh) * 2017-08-15 2021-04-09 上海派森诺生物科技股份有限公司 一种基于多重指标的胎儿染色体倍性检测分析方法
WO2021251834A1 (en) * 2020-06-10 2021-12-16 Institute Of Environmental Science And Research Limited Methods and systems for identifying nucleic acids

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0009294D0 (en) * 2000-04-15 2000-05-31 Sec Dep For The Home Departmen Improvements in and relating to analysis of DNA samples

Also Published As

Publication number Publication date
AU2008327704B2 (en) 2014-06-26
JP2011504359A (ja) 2011-02-10
AU2008327704A1 (en) 2009-05-28
CA2705280A1 (en) 2009-05-28
US8121795B2 (en) 2012-02-21
CA2705280C (en) 2018-08-21
US20090132173A1 (en) 2009-05-21
NZ585147A (en) 2012-08-31
EP2212818A1 (en) 2010-08-04
WO2009066067A1 (en) 2009-05-28

Similar Documents

Publication Publication Date Title
JP5587197B2 (ja) Dna証拠の考察に関する改善
Balding et al. Weight-of-evidence for Forensic DNA Profiles
Bright et al. Developmental validation of STRmix™, expert software for the interpretation of forensic DNA profiles
Steele et al. Statistical evaluation of forensic DNA profile evidence
Setodji et al. The right tool for the job: choosing between covariate-balancing and generalized boosted model propensity scores
Wilberg et al. Genecap: a program for analysis of multilocus genotype data for non‐invasive sampling and capture‐recapture population estimation
Bondarchik et al. Improving the objectivity of sustainability indices by a novel approach for combining contrasting effects: Happy Planet Index revisited
CN107004066B (zh) 性状预测模型制作方法和性状预测方法
Clay et al. Galaxy formation in the Planck cosmology–III. The high-redshift universe
Puch-Solis et al. Evidential evaluation of DNA profiles using a discrete statistical model implemented in the DNA LiRa software
Cooper et al. Investigating a common approach to DNA profile interpretation using probabilistic software
Moosbrugger et al. Factor analysis in personality research: Some artefacts and their consequences for psychological assessment
Paulose et al. Spatial soft sweeps: patterns of adaptation in populations with long-range dispersal
McMillan et al. Visualizations for genetic assignment analyses using the saddlepoint approximation method
Kruijver et al. Exploring the probative value of mixed DNA profiles
Nieto‐Barajas et al. A Bayesian Non‐Parametric Dynamic AR Model for Multiple Time Series Analysis
EP1280933A2 (en) Improvements in and relating to analysis of dna samples
Slooten Familial searching on DNA mixtures with dropout
US20090326830A1 (en) Interpreting dna
Waaijenborg et al. Correlating multiple SNPs and multiple disease phenotypes: penalized non-linear canonical correlation analysis
Lucassen et al. Evaluating Mixture Solution™—rapid and non-MCMC probabilistic mixture analysis
US20120046874A1 (en) Consideration of evidence
Lockwood et al. Smoothing across time in repeated cross‐sectional data
EP1456412B1 (en) Improvements in and relating to interpreting dna
Mutshinda et al. Swift block-updating EM and pseudo-EM procedures for Bayesian shrinkage analysis of quantitative trait loci

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130910

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131127

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140624

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140723

R150 Certificate of patent or registration of utility model

Ref document number: 5587197

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees