JP2007535766A - アミノ酸の複雑なパターンを同定するためのシステム及び方法 - Google Patents

アミノ酸の複雑なパターンを同定するためのシステム及び方法 Download PDF

Info

Publication number
JP2007535766A
JP2007535766A JP2007510929A JP2007510929A JP2007535766A JP 2007535766 A JP2007535766 A JP 2007535766A JP 2007510929 A JP2007510929 A JP 2007510929A JP 2007510929 A JP2007510929 A JP 2007510929A JP 2007535766 A JP2007535766 A JP 2007535766A
Authority
JP
Japan
Prior art keywords
amino acid
sequence
replikin
protein
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007510929A
Other languages
English (en)
Other versions
JP2007535766A5 (ja
Inventor
ボゴーク,サミュエル
エス. ボゴーク,エレノア
Original Assignee
ボゴーク,サミュエル
エス. ボゴーク,エレノア
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/860,050 external-priority patent/US7442761B2/en
Application filed by ボゴーク,サミュエル, エス. ボゴーク,エレノア filed Critical ボゴーク,サミュエル
Publication of JP2007535766A publication Critical patent/JP2007535766A/ja
Publication of JP2007535766A5 publication Critical patent/JP2007535766A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/08Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses
    • C07K16/10Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses from RNA viruses
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Abstract

コンピュータファイル又はデータベース中に記憶されたアミノ酸配列中の複雑なパターンを同定し及び/又は位置決めするための方法及びシステムが開示される。本発明の側面によれば、タンパク質データべースに問い合わせることを促進するための技術が提供される。問い合わせへの応答として受容されたタンパク質の記述について、本発明の実施態様は、受容されたタンパク質の記述をスキャンして、レプリキンパターンを同定し、位置決めすることができる。レプリキンパターンは、それぞれが本発明の実施態様によって認識されることができる以下の3つの(3)特徴:(1)該配列は、第二のリジン残基から6〜10アミノ酸残基の位置に位置する少なくとも1つのリジン残基を有し;(2)該配列は、少なくとも1つのヒスチジン残基を有し;そして(3)該配列中の少なくとも6%のアミノ酸はリジン残基である、を含む、7〜約50のアミノ酸であると定義される。

Description

関連出願
本願は2004年4月28日に出願された、「アミノ酸の複雑なパターンを同定するためのシステム及び方法」と題する米国仮特許出願第60/565,847号に基づく、米国特許法第119条(e)項の優先権を主張する。この出願はまた、2005年2月16日に出願された「アミノ酸の複雑なパターンを同定するためのシステム及び方法」と題する米国仮特許出願第60/653,083号に基づく、米国特許法第119条(e)項の優先権も主張する。これらの仮出願はどちらもそれらの全体が、そしてすべての目的のために、参考文献として本願明細書中に援用されている。
さらに、本願は2002年7月8日に出願された、「レプリキンペプチド及びそれらの用途」と題する米国非仮特許出願第10/189,437号に基づく優先権の利益を主張し、かつ、その部分継続出願であり、該非仮特許出願は、2002年3月26日に出願された「グリア細胞の急速な複製及びインフルエンザ伝染におけるレプリキンペプチド」と題する米国非仮特許出願第10/105,232号の部分継続出願であり、該非仮特許出願は、2001年10月26日に出願された「レプリキン及びレプリキン含有配列の同定方法」と題する米国非仮特許出願第09/984,057号の部分継続出願である。さらに、本願は、2004年6月4日に出願された「レプリキンペプチド及びそれらの用途」と題する米国非仮特許出願第10/860,050号に基づく優先権を主張し、かつその部分継続出願である。これらすべての非仮出願は、それらの全体が、そしてすべての目的のために、参考文献として本願明細書中に援用されている。
本発明は、一般的に、バイオインフォマティックスの分野に関する。より具体的には、本発明はヌクレオチド又はアミノ酸配列の複雑なパターンの同定を促進する技術に関する。
よく知られているように、アミノ酸はタンパク質の構築ブロックである。タンパク質は、細胞構造の大部分を作り、そしていくつかのタンパク質は細胞反応を促進するための酵素として働く。20個の異なるアミノ酸がタンパク質中に存在することが知られている。各タンパク質の性質は、構成要素であるアミノ酸の詳細な配列によって部分的に支配される。
アミノ酸及びタンパク質のデータベースは、U.S. National Library of Medicine におけるNational Center for Biotechnology Information(NCBI)及びLos Alamos National LaboratoryにおけるInfluenza Sequence Databaseなどの様々な研究機関によって保持されている。これらのデータベースは、典型的には、研究者にとって特定のタンパク質を検索し、入手する能力を提供するウエブページを通じたインターネットを介してアクセス可能である。これらのデータベースはまた、地域的な及び広域的なネットワークを介して研究者がアクセス可能である。さらに、研究者は、磁気ディスク、光ディスク、スタティックメモリ装置、及び本分野で知られた様々な他のデジタル記憶媒体などの末端装置に記憶されたアミノ酸及びタンパク質データベースに直接アクセスすることもできる。
アミノ酸及びタンパク質データベースにおいては、アミノ酸は典型的にアルファベット文字でコードされる。図1は、タンパク質中に存在することが知られている各アミノ酸を列挙し、それによってデータベースにおいて該アミノ酸が表されることのできる、International Union of Pure and Applied Chemistry(IUPAC)によって供給された基準にしたがって、3文字の略語及び1文字のコードを提供する。
所与のタンパク質は、そのアミノ酸配列によって記述されることができる。例えば、図1に示される1文字のコードを用いて、文字列「crvpsgvdla」は、以下のアミノ酸配列:システイン、アルギニン、バリン、プロリン、セリン、グリシン、バリン、アスパラギン酸、ロイシン及びアラニンによって定義されるタンパク質に相当する。
(ヒトにおける癌に関係するタンパク質などの)一定の基準を満たすタンパク質についてデータベースが検索された場合、タンパク質データベース検索エンジンは、何百又は何千もの適合するタンパク質を同定することによって応答する。この適合タンパク質の組は、さらなる検索基準を与えることによって狭められることができる。検索過程のいつの時点においても、特定のタンパク質が選択され、そして再調査されることができる。図2において、プリントアウトされたものは、ヒトの癌に関係するタンパク質についてNCBI検索から同定された特定のタンパク質を記述する。
図2に見られるように、タンパク質の記述は、同定因子のなかでも、タンパク質の表題(「頭部及び頚部の扁平上皮癌における新規なセリンプロテアーゼ相同体の発現差異」(Differential expression of a novel serine protease homologue in squamous cell carcinoma of head and neck))、タンパク質の記述者(「Lang, J.C. 及びSchuller, D.E.」)、及び該タンパク質がそこから単離された生物体(「ヒト」(Homo sapiens))のような情報などの詳細な情報を含んでよい。
タンパク質の記述は、該タンパク質を定義するアミノ酸の特異的な配列を含んでよい。例えば、図2において、「ORIGIN」という用語によって前置きされたプリントアウトの部分に、アミノ酸配列データがタンパク質の記述の最後に見出される。この例において、最初のいくつかのアミノ酸は「myrpdvvrar」であり、これは、メチオニン、チロシン、アルギニン、プロリン、アスパラギン酸、バリン、バリン、アルギニン、アラニン及びアルギニンに対応する。
いくつかのタンパク質の記述は、アミノ酸配列よりも該タンパク質を定義する核酸塩基の配列を含むことができる。知られているように、3つの核酸塩基の配列(すなわち、核酸塩基トリプレット)は、図3に見出される表によって提供されるマッピングに従うアミノ酸に対応することができる。表中に認められる各核酸塩基トリプレットは、特異的なアミノ酸を表すか又は対応する。例えば、核酸トリプレットGCT(グアニン−シトシン−チミン)は、アミノ酸アラニンに対応する。同様に、核酸トリプレットGCA(グアニン−シトシン−アデニン)も、アミノ酸アラニンに対応する。他の例として、核酸トリプレットAAA及びAAG(それぞれ、アデニン−アデニン−アデニン及びアデニン−アデニン−グアニン)はそれぞれアミノ酸リジンに対応する。
レプリキンパターン
先の特許出願において、発明者らは、「レプリキンパターン」又は単に「レプリキン」と名づけられたアミノ酸のパターンを同定し、そして記載した。レプリキンパターンは、約7〜約50の隣接したアミノ酸の配列であって、以下の3つの特徴を含むものを含む。
(1)該配列は、第2のリジン残基から6〜10アミノ酸残基の位置にある少なくとも1つのリジン残基を有し;
(2)該配列は、少なくとも1つのヒスチジン残基を有し;そして
(3)該配列は、少なくとも6%のリジン残基を有する。
レプリキンは、真菌、酵母、ウイルス、細菌、藻類、及び癌細胞における急速な複製と関連することが示された。この関連に基づいて、レプリキンは、病気の指標であることができると考えられる。さらに、時間に伴うレプリキン濃度の増加は、切迫した病気の発生の指標であることができる。例えば、(H1N1、H2N2及びH3N2として同定された)20世紀における3種のインフルエンザそれぞれの世界的流行の前には、対応するインフルエンザウイルスにおけるレプリキン濃度の顕著な増加があった。H5N1インフルエンザに関して、図4は、1997年(E1として示される)、2001年(E2として示される)及び2004年(E3として示される)における流行の直前に100アミノ酸あたりのレプリキンの濃度の急速な増加を示している。レプリキンパターンは、肺、脳、肝臓、柔組織、唾液腺、鼻咽腔、食道、胃、結腸、直腸、胆嚢、乳房、前立腺、子宮、子宮頚部、膀胱、眼の癌、メラノーマ、リンパ腫、白血病の形態及び腎臓の癌を含む、多様な病気に関連したタンパク質において見出されている。重要なことは、レプリキンパターンは正常な健康なヒトゲノムにはないと見られることである。図5は、多様な生物体において発見されたレプリキンパターンの選ばれた例を列挙する。
例えば、(図5の腫瘍ウイルスカテゴリーにおいて最後にエントリーした)C型肝炎において発生する13残基のパターン「hyppkpgcivpak」は、レプリキンパターンである。なぜなら、(1)それは、8残基離れた2つのリジン残基を含み;(2)それは、ヒスチジン残基を含み、そして(3)リジン残基のパーセンテージは、15.4%である2/13であるからである。
アミノ酸検索ツール
本分野で知られているとおり、タンパク質及びアミノ酸のデータベースは、多様なデータベースツール及び検索エンジンを用いて検索されることができる。これらの公的に利用可能なツールを用いて、アミノ酸パターンは記述され、そして多くの異なる生物体に対応する多くの異なるタンパク質において位置決めされることができる。いくつかの方法及び技術が利用可能であり、それによってアミノ酸パターンが記述されることができる。1つの一般的なフォーマットはPROSITEパターンである。PROSITEパターンの記述は以下の規則にしたがって構築されることができる。
(1)アミノ酸のための標準的なInternational Union of Pure and Applied Chemistry(IUPAC)の1文字コードが使用される(図1を参照のこと)。
(2)シンボル「x」は任意のアミノ酸が受容される位置のために使用される。
(3)あいまいさは、所与の位置についての許容可能なアミノ酸を四角括弧「[]」の間に列挙することによって示される。例えば、[ALT]は、アラニン又はロイシン又はトレオニンをさす。
(4)あいまいさはまた、中括弧の対「{}」の間に所与の位置において許容されないアミノ酸を列挙することによっても示される。例えば、{AM}は、アラニン及びメチオニン以外のいずれかのアミノ酸をさす。
(5)パターン中の各要素は、その隣のものと「−」によって分けられる。
(6)パターンの要素の反復は、その要素に続く括弧の間の数値又は数字の範囲によって示されることができる。例:x(3)は、x−x−xに対応し、x(2,4)は、x−x又はx−x−x又はx−x−x−xに対応する。
(7)パターンが配列のN−又はC−末端のいずれかに限定される場合、そのパターンは、それぞれシンボル「<」で始まるか又はシンボル「>」で終わる。
(8)ピリオドは、パターンを終了する。
PROSITEパターンの例は、以下のものを含む:
PA[AC]−x−V−x(4)−{ED}。このパターンは、[アラニン又はシステイン]−任意−バリン−任意−任意−任意−任意−{任意であるが、グルタミン酸又はアスパラギン酸ではない}と翻訳される。
PA<A−x−[ST](2)−x(0,1)−V。配列のN-末端になければならない(「<」)このパターンは、以下のように翻訳される:アラニン−任意−「セリン又はトレオニン」−「セリン又はトレオニン」−(任意又はなし)−バリン。
アミノ酸パターンを記述するための他の一般的なフォーマットは、コンピュータ科学者によく知られた正規表現フォーマットである。コンピュータ科学においては、正規表現は、そのために有限のオートマタが自動的に構築されて言語におけるトークンを認識する、特徴のパターンを記述するために典型的に使用される。おそらく、最も注目すべき正規表現検索ツールは、Unix(登録商標)ユーティリティgrepである。
アミノ酸配列パターンを記述することに関しては、単純化された一組の正規表現機能が典型的に採用される。これらの単純な正規表現ルールによって定義されたアミノ酸配列パターンは、外観および結果の両方においてPROSITE パターンにかなり類似することとなる。アミノ酸配列についての正規表現による記述は、以下のルールにしたがって作られる:
(1)アミノ酸残基については大文字を用い、そして(必要ではないが)「−」を2つのアミノ酸の間に置く。
(2)特定の位置における複数のアミノ酸の選択肢については「[]」を使用する。[LIVM]は、L、I、V又はMの任意の1つのアミノ酸がその位置にあることができることを意味する。
(3)アミノ酸を除外するためには「{}」を使用する。したがって、{CF}は、CおよびFがその特定の位置にあってはならないことを意味する。いくつかのシステムにおいては、除外機能は、「^」記号で特定されることができる。例えば、^Gは、グリシン以外のすべてのアミノ酸を意味し、そして[^ILMV]は、I、L、MおよびV以外のすべてのアミノ酸を表す。
(4)任意のアミノ酸であることのできる位置については、「x」又は「X」を使用する。
(5)複数の位置については、nが数字である「(n)」を使用する。例えば、x(3)は、「xxx」と同じである。
(6)複数又は可変の位置については、「(n1,n2)」を使用する。したがって、x(1,4)は、「x」又は「xx」又は「xxx」又は「xxxx」を表す。
(7)パターンがN又はC末端にマッチすることを要求するためには、「>」というシンボルを該パターンの最初又は最後に使用する。例えば、「>MDEL」は、MDELで始まる配列のみを見出す。「DEL>」はDELで終わる配列のみを見出す。
正規表現、「[LIVM]−[VIC]−x(2)−G−[DENQTA]−x−[GAC]−x(2)−[LIVMFY](4)−x(2)−G」は、以下の:L、I、VまたはMを1位に有し;V、I、またはCを2位に;任意の残基を3および4位に;Gを5位に・・・を有する17個のアミノ酸を表す。
他の類似のフォーマットも使用される。例えば、Basic Local Alignment Search Tool (BLAST)は、インターネット上で利用可能な周知のシステムであり、ヌクレオチドおよびタンパク質データベースの迅速な検索のためのツールを提供する。BLASTは、3つのフォーマット:FASTA配列フォーマット、NCBI寄託番号、又はGenBank配列番号で入力された配列を受け入れる。しかしながら、これらのフォーマットは、正規表現又はPROSITEパターンよりも構造がより単純である。FASTAフォーマットの配列の例は以下の:
Figure 2007535766
である。
BLASTシステムの特徴は、類似する領域を共有する配列間の関係を検出するために局所的な整列の領域についての配列データベースを検索するために使用される配列比較アルゴリズムを含む。しかしながら、BLASTツールは、発見されそして位置決めされることのできるアミノ酸配列の構造に関しては制限される。例えば、BLASTは、レプリキンパターンが必要とする「第二のリジン残基から6〜10アミノ酸残基の位置にある少なくとも1つのリジン残基」を有する配列を検索することができない。BLASTは、「少なくとも6%のリジン残基」を有する配列のような、特別なアミノ酸の特定のパーセンテージ又は濃度を含むアミノ酸配列を検索することもできない。
レプリキン検索ツールの必要性
その定義からわかるように、レプリキンパターンの記述は、アミノ酸の単一の直線的配列として表されることはできない。したがって、否定、結合および鎖状体形成などの論理的な組を構築することのできるオペレーションにしたがって得られる順序付けられた配列を記述するためによく適合されている、PROSITEパターンおよび正規表現のどちらもが、レプリキンパターンを記述するのに適していない。
アミノ酸の直線的配列とは対照的に、レプリキンパターンは、単純な連続する順番を超越したアミノ酸の属性に特徴を有する。特に、レプリキンパターンが少なくとも6%のリジン残基を含むという要求だけでは、レプリキンパターン中のリジン残基の実際の配置が比較的制限されないことを意味する。したがって、一般に、単一のPROSITEパターン又は単一の正規表現を用いてレプリキンパターンの記述を表すことは不可能である。
したがって、本分野では、所与のアミノ酸配列をスキャンし、そしてレプリキンパターンのすべての場合を同定するためのシステムおよび方法が必要とされる。同様に、レプリキンパターンにマッチするアミノ酸配列について、タンパク質データベースおよびアミノ酸データベースを検索するためのシステムおよび方法が必要とされる。さらに、研究者が以下の特徴のいかなる所望の組み合わせも含む任意の特定された長さのアミノ酸配列を位置決めすることを可能とする、一般化された検索ツールが本分野で必要とされている:(1)N位置超かつM位置未満、第二のアミノ酸残基から離れて位置する第一のアミノ酸残基;(2)配列の任意の場所に位置する第三のアミノ酸残基;および(3)該配列は少なくともRパーセントの第四のアミノ酸残基を含む。最後に、従来技術の欠点は病気の予測および治療に関する研究分野においてより明らかである。(菌株特異的なインフルエンザの流行などの)病気の発生を前もって予測するため、そして同様に、経時的に保存されることが発見され、タンパク質およびアミノ酸配列の検索のための従来方法ではこれまで検出されなかった、アミノ酸配列又はアミノ酸モチーフに基づいて設計される合成ワクチンを可能とするためのシステムが本分野で非常に必要とされている。
詳細な説明
本発明の実施態様は、アミノ酸配列の複雑なパターンを同定し及び/又は位置決めするためのシステム及び方法に向けられている。本発明の側面によれば、タンパク質データベースの問い合わせを促進するための技術が提供される。該問い合わせに対する応答として受け取られたタンパク質の記述については、本発明の実施態様は、受け取られたタンパク質の記述をスキャンして、レプリキンパターンを同定しかつ位置決めすることができる。ある実施態様によれば、レプリキンパターンは、それぞれが本発明の実施態様によって認識されることのできる以下の3つの(3)特徴を含む、7〜約50アミノ酸の配列である。(1)該配列は、第二のリジン残基から6〜10アミノ酸残基の位置に位置する少なくとも1つのリジン残基を有し;(2)該配列は、少なくとも1つのヒスチジン残基を有し;そして(3)該配列中の少なくとも6%のアミノ酸はリジン残基である。本発明の他の実施態様は、特定された長さの制約を有する複雑なアミノ酸配列を同定し及び/又は位置決めすることができ、該配列はさらに、以下の特徴の任意の組み合わせを含む:(1)N位置超かつM位置未満、第二のアミノ酸残基から離れて位置する第一のアミノ酸残基;(2)配列の任意の場所に位置する第三のアミノ酸残基;および(3)少なくともRパーセントの第四のアミノ酸残基。さらに他の実施態様によれば、本発明は同定されたアミノ酸配列の発生を計数し、そして計数された発生数を生の絶対値又は該タンパク質中のNアミノ酸あたりの同定されたアミノ酸配列の数の比率のいずれかとして報告することができる。本発明のさらに他の実施態様は、所与のタンパク質の変異体中における同定されたアミノ酸配列パターンの進化を経時的に分析することができ、そしてまた、複数の異なるタンパク質にわたって同定されたアミノ酸配列パターン例の間の類似性及び相違を経時的に分析することもできる。分析の結果として、本発明のさらに他の実施態様が、同定されたアミノ酸配列パターンの構成要素が突然変異及び/又は発生するときに、経時的にかつ異なるタンパク質間で保存されていると見られる潜在的なアミノ酸足場構造を同定することができる。
本発明の実施態様は、全体を通して同様の部分が同様の参照番号をつけられ、そして各参照番号の一番左の数字が参照された部分が最初に現れる図の番号を指す、添付の図面を参照しつつ記載されるであろう。
図6は、本発明の実施態様による、アミノ酸配列中のレプリキンパターンを同定するためのシステム及び方法を組み込んだコンピュータシステムの高度なブロック図である。図6に示すように、コンピュータワークステーション610は、研究者がタンパク質データベースを検索し、そして選択されたアミノ酸パターンのためのタンパク質記述をスキャンすることを可能とするように構成されたプロセッサ及びメモリを含んでもよい。これらの機能を達成するために、コンピュータワークステーション610は、タンパク質及びアミノ酸リサーチシステム630を含んでよく、これはユーザー/研究者からの指示を受けてタンパク質検索及びアミノ酸スキャニング操作を行うことができる。ある実施態様によれば、タンパク質及びアミノ酸リサーチシステム630は、レプリキンパターンを含む特定のアミノ酸パターンについて、検索されたタンパク質及びアミノ酸配列を検索し及びスキャンするアミノ酸配列スキャナー640をさらにふくんでもよい。タンパク質及びアミノ酸リサーチシステム630は、ネットワークインターフェース620と連絡して、インターネットを含むことができるネットワーク660上の供給源からタンパク質配列及びアミノ酸配列を取得することができる。或いは、タンパク質及びアミノ酸リサーチシステム630は、ローカルなタンパク質データベース650からタンパク質配列及びアミノ酸配列を得ることができる。さらに、タンパク質及びアミノ酸リサーチシステム630は、キーボード入力などの他の入力手段から直接的にタンパク質配列及びアミノ酸配列を取得してもよい。タンパク質及びアミノ酸リサーチシステム630はまた、ネットワークインターフェース620と連絡して、ネットワーク660上の他のコンピュータに結果を伝送することができる。
レプリキンパターンについてのスキャニング
本発明の実施態様は、タンパク質内のアミノ酸の複雑なパターンを同定するための一般化された方法及び系を含んでもよい。タンパク質及びアミノ酸リサーチシステム630によって同定されるか又は選択されるいかなるタンパク質の定義にいついても、ユーザーは、アミノ酸のさまざまな複雑なパターンについて検索することに本発明の実施態様をむけさせることができる。アミノ酸の1つのパターンの例として、本発明は、レプリキンパターンを含むヌクレオチド又はアミノ酸配列を同定する方法を提供する。図7は、本発明の実施態様にしたがってアミノ酸の配列中のレプリキンパターンを位置決めするための一般的な方法を図示する単純なフローチャートである。方法700は、アミノ酸配列が得られた後に開始することができる。典型的には、アミノ酸配列は、図1に与えられたコードにしたがってアルファベット文字によって表されることができる。しかしながら、他のコード化方法も同様に本発明の範囲内である。
図7を参照すると、アミノ酸配列がいったん得られれば、該配列はレプリキンパターンについて検索され(710)、これは、以下の特徴:(1)該列は、7〜約50のアミノ酸を含み;(2)該列は、第二のリジン残基から6〜10位置に位置する、少なくとも1つのリジン残基を含み;(3)該列は、少なくとも1つのヒスチジン残基を含み;そして(4)該列は、少なくとも6%のリジン残基を含む、を有するアミノ酸の配列(又は列)を含む。
アミノ酸の列がレプリキンパターンとマッチすることが発見されたら、該列はそれに応じて同定されるか又は標識されることができる(720)。
所与のアミノ酸配列は、レプリキンパターンにマッチする多くのサブ配列又は列を含むことができる。さらに、レプリキンパターンはお互いに重複するかもしれない。したがって、アミノ酸配列中ですべての可能なレプリキンパターンを位置決めし、そして同定するためには、方法700はアミノ酸のもとの配列内に含まれるアミノ酸の各サブ配列について反復して起動されることができる。
アミノ酸配列中のすべての可能性のあるレプリキンパターンを同定し、そして位置決めするために方法700が反復して起動される場合、本発明の実施態様は得られたレプリキンパターンの数を計数することができる。レプリキンの計測数は絶対値として報告されることができる。さらに、本発明の実施態様はまた、該配列中のNアミノ酸当たりのレプリキンの数の比率を決定することもできる。例えば、ある実施態様は、所与のタンパク質が100アミノ酸あたり6の比率のレプリキンを含むと決定することができる。レプリキンの比率は、実験室での実験及び疫学的証拠によって示されて、所与のタンパク質が複製する速度に直接的に関係づけられた。タンパク質の急速な複製は、病気の指標であることができる。例えば、レプリキンパターンの比較的高い比率の存在は、インフルエンザの流行と関係付けられた。同様に、タンパク質中で経時的に観察されたレプリキンパターンの計測数の増加は、該タンパク質がそこから得られた生物体によって引き起こされる将来の病気の指標であることもできる(例えば、図4を参照のこと)。したがって、アミノ酸配列内でレプリキンパターンを検出しそして計数する能力は、本発明の顕著な利益である。
なお図7を参照すると、本発明の実施態様は、レプリキンパターンに類似した特徴を示す、アミノ酸の他の複雑なパターンを同定しそして位置決めするために、方法700を利用してもよい。すなわち、本発明のいくつかの実施態様が以下の:(1)アミノ酸間の距離、(2)認識されたアミノ酸配列の許容可能な長さ、及び(3)特定のアミノ酸のパーセンテージ又は濃度、の正確な値を特定することができるにもかかわらず、これらの正確な値は変数として表現されてもよい。したがって、研究者は、本発明の実施態様を採用して、以下の特徴:(1)該配列は、rmin〜rmaxのアミノ酸を含み;(2)該配列は、第二のリジン残基からkmin〜kmaxアミノ酸残基に位置する、少なくとも1つのリジン残基を含み;(3)該配列は、少なくとも1つのヒスチジン残基を含み;そして(4)該配列は、少なくともkパーセントのリジン残基を含む、を有する、タンパク質中のアミノ酸配列を同定することができる。
図8は、本発明の実施態様によって、所与のアミノ酸配列中の複数のレプリキンパターンを位置決めするための、一般化された方法800を図示するフローチャートである。方法800は、所与の配列中の第一のリジン残基を位置決めすることによって開始する(810)。そして、方法800は、第二のリジン残基が第一のリジン残基の位置kmin〜kmax内にあるか否かを決定することができる(820)。図8に示すように、kminとkmaxは、第一及び第二のリジン残基の間の距離の限界を定義する。典型的なレプリキンパターンについては、kminは6に等しく、kmaxは10に等しくなるであろう。しかしながら、これらの値は、他の類似のパターンを発見することに興味のある研究者によって変更されるかもしれない。
方法800がお互いに十分に近い2つのリジン残基を同定したら(820)、方法800は、第一及び第二リジン残基両方のrmax位置以内にあるそれぞれのヒスチジン残基を調べることができる(830)。典型的なレプリキンパターンを同定しそして位置決めするために方法800が採用される場合、通常、rmaxは50に等しく設定されるであろう。ステップ(810)及び(820)において同定された2つのリジン残基のrmax位置以内にある各ヒスチジン残基について、方法800が第一のリジン残基、第二のリジン残基及び同定されたヒスチジン残基を含む、最も短いアミノ酸残基の列を構築するであろう(840)。そして、方法800は、その最短の列の長さが所望の範囲内にあるか否か、すなわち、それが少なくともrminのアミノ酸残基、かつrmax以下のアミノ酸残基を含むか否か、を決定するであろう(850)。最後に、同定されたアミノ酸の列が少なくともkパーセントのリジン残基も含む場合(860)、該列は所望のレプリキン様パターンに適合すると同定されるであろう(870)。
なお、図8を参照すると、方法800が単一の所与のアミノ酸配列からいくつかのレプリキン様パターンを同定することができることは明らかである。これは、方法800が2つの同定されたリジン残基のrmax位置以内にある1つ超のヒスチジン残基を調べることができるために、起こるかもしれない。同定された各ヒスチジン残基は、2つのリジン残基と一緒になって、所望のレプリキン様パターンにマッチしてもよい。
図8によって図示された方法の1つの実施態様が図9に示され、これは、本発明の実施態様によって、所与のアミノ酸配列中に存在するすべてのレプリキンパターンを発見するための手順を含む、ソースコードリストである。図9に示される「マッチ(match)」手順は、「Tcl」と呼ばれるインタプリト型シェル言語でプログラムされ、直接的な様式でレプリキンを認識する。本分野で知られているとおり、「ツールコマンドランゲージ(Tool Command Language)」又はTcl(「ティクル」と発音する)は、そのルーツをUnix(登録商標)コマンドシェルに有する、インタプリト型のスクリプト言語であるが、ネットワークコミュニケーション、インターネット機能及びグラフィカルユーザーインターフェースの急速な発達によく適合したさらなる能力を有する。
レプリキンパターンを認識する他の方法も、本発明の教示に含まれる。例えば、図9に示されるマッチ手順は、Java(登録商標)又はC又はC++などの他のプログラミング言語に実装されることができた。さらに、レプリキン認識アルゴリズムの他の実施態様は、任意の順番でレプリキンパターンの特徴を同定することができ、そしてまた、再帰的手順、反復手順、パラレル処理法、分割統治法、又はその任意の組み合わせを用いてアミノ酸配列及びサブ配列の構成要素を全検索することもできる。
タンパク質検索エンジン
図6に戻って、本発明は、タンパク質の定義を検索するために、ローカルに又はインターネットなどのネットワーク全体にわたってアミノ酸及びタンパク質データベースにアクセスしそして対話する検索エンジンを含むことができる。例えば、タンパク質及びアミノ酸リサーチシステム630は、ユーザーからタンパク質検索基準を受容することができ、そして、供給された検索基準にマッチするタンパク質の定義を検索するための、複数のオンラインのアミノ酸及びタンパク質データベース検索エンジンにアクセスすることができる。タンパク質データベース検索基準は、任意のオンラインタンパク質又はアミノ酸検索エンジンにおける有効な検索タームを形成することのできる任意のテキスト列を含むことができる。典型的には、これらの検索基準は、各特定のタンパク質を記述するプリントアウトにおいて見出されることのできるテキストに関連する。例えば、ユーザーが検索基準「A型インフルエンザ」を与えた場合、本発明の実施態様は、このテキスト列を複数のインターネットタンパク質及びアミノ酸検索エンジンに転送することができ、上記検索エンジンはそれぞれ、ターム「A型インフルエンザ」を含むそのデータベース中に発見された任意のタンパク質記述をリターンすることができる。アミノ酸配列スキャナー640を使用して、リターンされたタンパク質の記述のそれぞれは、レプリキンパターンの存在についてスキャンされることができる。
本発明のさらなる実施態様は、ユーザーに、複数のインターネットタンパク質検索エンジンを取捨選択すること、及び選択されたオンラインタンパク質検索エンジンのそれぞれのための本発明の検索基準とタンパク質検索能力をカスタマイズすることを可能とする。さらに、本発明の実施態様はまた、ユーザーがローカルなタンパク質データベース650にアクセスし、又は、例えば、タンパク質の定義を含むローカルファイルネームを供給するか、又はコンピュータソフトウエアにパラメータを供給するための本分野で知られた他の方法によって特定のタンパク質の定義を直接的に供給することを可能とする。
レプリキン分析
本発明の実施態様は、アミノ酸配列中のレプリキンパターンを同定し、そして位置決めするためだけに採用されることができるわけではない。実施例は、異なるタンパク質中に発生するレプリキンパターンの構造における類似性を発見して分析するため、又は同じタンパク質中に経時的に発生する異なるレプリキンパターンを分析するためにも使用されることができる。例えば、図10は、「トリインフルエンザ(Bird Flu)」インフルエンザウイルス中に1917年〜2004年の87年間にわたって保存されてきた、レプリキン「固定足場」構造を示す表である。本発明の実施態様は、同じタンパク質の変異体中に発見されたレプリキンパターンを含む、タンパク質中に発見された多数のレプリキンパターンを集めることができる。各レプリキンパターンとともに、本発明の実施態様は各タンパク質が最初に同定された日付も付随させてもよい。研究者によって指導される場合、ある実施態様は、レプリキンパターン中に経時的に保存され、そして異なるタンパク質並びに同じタンパク質の変異体中に存在することのできる実質的に固定されたアミノ酸構造を明らかにするために、複数の選択されたレプリキンパターンを、内容、日付又は他の基準によってソーティングし及びディスプレイすることができる。さらに、研究者によって指導される場合、かかる固定されたアミノ酸構造を自動的に同定するために、ある実施態様は複数の選択されたレプリキンパターンを比較するための既知のパターン分析方法を採用してもよい。例として、図10においては、例解されたレプリキンパターンは−この場合−アミノ末端において一対のリジン残基(kk)で始り、カルボキシル末端において一対のヒスチジン残基(hh)で終わり、そしてリジン残基を8、10又は11位のいずれかに含む、(通常)29アミノ酸の比較的固定された足場構造を示しているようである。何十年にもわたるこの足場構造の保存は、合成ワクチンが迅速かつ安価に調製されることを可能とする。レプリキン足場構造が同定された後、かかるワクチンを合成するために、研究者は経時的に保存され、そしてタンパク質の現在の変異体中にも存在するその足場構造の構成要素を選択することができる。その後、ワクチンは足場構造から選択された構成要素に基づいて調製されることができる。かかるワクチンは保存された足場構造に基づくため、それらは何年もの間有効であり、かつ予想される大流行よりも充分前に開発されることができる。
レプリキン自体の発見並びにレプリキンパターンの同定及び位置決めのための本発明の実施態様は、病原体の同定のための標的を提供し、並びにワクチンを含む抗病原体療法を促進する。一般に、ペプチドのレプリキンファミリーについての知識及び同定は、レプリキンを有する任意の生物のための有効な治療及びワクチンの開発を可能とする。特に、レプリキンの同定は、インフルエンザウイルスを含むウイルスの検出及びウイルスワクチンの開発に備える。さらに、レプリキンの同定は、レプリキン構造を標的とする治療及びワクチンの開発を可能とすることに加えて、マラリア、炭疽、及び天然痘ウイルスなどの他の病原体の検出にも備える。感染性疾患のレプリキン、癌免疫レプリキン、及び構造タンパク質レプリキンの検出を含むレプリキンの同定によってさらなる例が提供される。
本発明の実施態様は、従来技術では見いだされなかったやり方で、アミノ酸の重要なレプリキンパターンが認識され、位置決めされ、そして分析されることを可能とする。従来技術の能力を用いて、研究者らはアミノ酸の配列を記述するための現存する技術に限定されてきた。実際に、従来技術の限界は、この分野における研究の勢いを何らかの方法で弱めるものであり、それは、非直線の属性を含むアミノ酸の配列を特定することがこれまでできなかったからである。本発明の方法及び実施態様が開発されるまで、アミノ酸配列の記述は、せいぜい反復するサブ配列及びサブ配列成分に対する論理的制約を含むものであった。本発明の実施態様は、従来技術において見出されないツールを用いて、アミノ酸の新たなクラスが発見され、位置決めされ、そして分析されることを可能とする。このアミノ酸の新たなクラスは、特定のアミノ酸濃度及び特定のアミノ酸間の距離関係などの属性に特徴を有する。これらの属性は、単純な隣接する順番を超越し、そしてしたがって、本分野で知られた現存の方法では容易に記述され、発見されまたは位置決めされない。
上記実施態様の機能は、プログラムの命令を実行する多様なコンピュータプラットフォームに提供されることができる。そのような1つのプラットフォーム1100が図11の単純化されたブロックダイアグラム中に例解される。そこでは、プラットフォーム1100は、プロセッサ1600によって仮定されたように示され、これは、バスサブシステム1150を介して多数の周辺デバイスと連絡する。これらの周辺デバイスは、典型的に、メモリサブシステム1110、ネットワークインターフェースサブシステム1170、及び入力/出力(I/O)ユニット1180を含む。プロセッサ1160は、マイクロプロセッサ、デジタルシグナルプロセッサ及びフィールドプログラマブル論理アレイを含む、複数の慣用のプロセシングシステムのいずれであることもできる。いくつかのアプリケーションにおいては、プラットフォーム1100に複数のプロセッサ(示さない)を提供することが有利であることができる。プロセッサ1160は、メモリサブシステム1110中に記録されたプログラムの命令を実行する。メモリサブシステム1110は、電気的、磁気的、又は光学的メモリシステムを含む慣用のメモリサーキットの任意の組み合わせを含むことができる。図11に示すように、メモリシステムは、リードオンリーメモリ1120、ランダムアクセスメモリ1130及びバルク記憶装置1140を含むことができる。メモリサブシステム1110は、本明細書に記載の様々な方法を表すプログラムの命令を記憶するのみでなく、これらの方法が実行されるデータアイテムを記憶することもできる。ネットワークインターフェースサブシステム1170は、外部ネットワークに、インターネットなどを含むネットワーク1190と連絡するインターフェースを含むインターフェースを提供することができる。I/Oユニット1180は、外部デバイス(示していない)との連絡を可能とするであろう。
本発明のいくつかの実施態様を、本明細書に特別に例解し、記載した。しかしながら、本発明の改変及び変更が、本発明の精神及び意図した範囲を離れることなく、本発明の教示に包含されることは理解されるであろう。さらに、本発明の教示は、これまで限定された連続的な直線分析を用いて特異的な配列の構成要素の同定にこれまで取り組んできた他の配列認識に関する問題に適合されることができる。
図1は、International Union of Pure and Applied Chemistry(IUPAC)によって供給された基準に従って、アミノ酸を単一のアルファベット文字としてコード化する変換表である。 図2は、National Center for Biotechnology Information (NCBI)によって保持されているタンパク質データベースを検索することによって得られたヒト癌タンパク質のプリントアウトである。 図3は、核酸塩基トリプレットとアミノ酸の間の対応を示す変換表である。 図4は、3つの「トリインフルエンザ」の大流行に先立つ、ヘマグルチニンの選択された系統中のレプリキンパターン濃度の急速な増加を示すグラフである。 図5は、さまざまな生物体中に発見されたレプリキンパターンの選択された例を示す表である。 図6は、本発明の実施態様によって、アミノ酸配列中のレプリキンパターンを同定するためのシステム及び方法を組み込んだコンピュータシステムの高レベルのブロック図である。 図7は、本発明の実施態様によって、アミノ酸配列中のレプリキンパターンを位置決めするための一般的な方法を示す単純なフローチャートである。 図8は、本発明の実施態様によって、アミノ酸配列中の複数のレプリキン様パターンを位置決めするための一般化された方法を示すフローチャートである。 図9は、本発明の実施態様によって、アミノ酸配列中のレプリキンパターンを発見するための手順を含むソースコードリストである。 図10は、異なるタンパク質中の、実質的に固定されたアミノ酸位置において発生するレプリキン足場を示す表である。 図11は、本発明において有用なコンピュータシステムプラットフォームの単純化されたブロック図である。

Claims (16)

  1. 以下のステップ:
    アミノ酸残基のサブ配列中において、第一のリジン残基が第二のリジン残基から6〜10位置以内に存在するか否かを決定し;
    もし存在するなら、上記アミノ酸残基のサブ配列中に7〜50の連続的なアミノ酸残基の列を同定し、ここで、該列は上記第一のリジン残基、上記第二のリジン残基及びヒスチジン残基を含み;
    該列中のリジン残基のパーセンテージを計算し;そして
    上記リジン残基のパーセンテージが少なくとも6パーセントである場合、上記列をレプリキンパターンとして認識する、
    を含む、レプリキンパターンの認識方法。
  2. タンパク質中のレプリキンパターンの濃度を決定するための方法であって、以下のステップ:
    請求項1に記載の方法によって認識された異なるレプリキンパターンを含む上記タンパク質を定義するアミノ酸残基の配列中のサブ配列の数を計数する、
    を含む前記方法。
  3. さらに、以下のステップ:
    上記計数されたサブ配列の数対前記配列中のアミノ酸残基の総数の比率を報告すること、
    を含む、請求項2に記載の方法。
  4. 上記タンパク質を定義する上記アミノ酸残基の配列がコンピュータファイルから検索される、請求項2に記載の方法。
  5. 上記タンパク質を定義する上記アミノ酸残基の配列がデータベースから検索される、請求項2に記載の方法。
  6. 上記データベースがネットワークを通じてアクセスされる、請求項5に記載の方法。
  7. プロセッサによって実行された場合、請求項1に記載の方法によって該プロセッサにレプリキンパターンを認識させる、実行可能な命令を記憶した、機械読み取り式の媒体。
  8. 以下の:
    ネットワークに連結されたプロセッサ;
    該プロセッサに連結されたメモリ、ここで、該メモリは請求項1に記載の方法によってレプリキンパターンを認識する複数の命令を含む、
    を含む、コンピュータシステム。
  9. アミノ酸のパターンを認識する方法であって、以下のステップ:
    アミノ酸残基のコード化配列中でお互いの所定の第一の距離内に、少なくとも一対の第一のアミノ酸残基を位置決めし;
    第一のアミノ酸残基の上記対の各メンバーの所定の第二の距離内に、第二のアミノ酸残基を位置決めし;
    アミノ酸残基の列を同定し、ここで、前記列は、第一のアミノ酸残基の上記対と第二のアミノ酸残基を含み;
    上記列中の第一のアミノ酸残基のパーセンテージを決定し;そして
    上記列中の第一のアミノ酸残基の上記パーセンテージが少なくとも所定のパーセンテージである場合、上記列をアミノ酸の上記パターンであると認識する、
    を含む、前記方法。
  10. アミノ酸のパターンを認識する方法であって、以下のステップ:
    タンパク質を定義するアミノ酸残基の配列のコード化された表現内にアミノ酸の列を位置決めし、ここで、該列は、少なくとも第一のアミノ酸及び第二のアミノ酸を含む、正規表現に適合しており;
    上記列中の第二のアミノ酸の対の存在の間の距離が、所定の第一の範囲外である場合、上記アミノ酸の列を、上記パターンに適合しないとして捨て;
    上記第一のアミノ酸の存在及び上記第二のアミノ酸の存在の間の距離が、所定の第二の範囲外である場合、上記アミノ酸の列を、上記パターンに適合しないとして捨て;そして
    上記列中の第二のアミノ酸のパーセンテージが少なくとも所定のパーセンテージである場合、上記アミノ酸のパターンとして上記列を認識すること、
    を含む、前記方法。
  11. アミノ酸の足場構造を認識する方法であって、以下のステップ:
    複数のタンパク質中に発生するレプリキンパターンのリストを構築し;そして、
    上記足場構造を、上記リスト中の各レプリキンパターン中に発生する実質的に固定されたアミノ酸残基のパターンとして同定すること、
    を含む、前記方法。
  12. 上記複数のタンパク質が、同じタンパク質の変異体を含む、請求項11に記載の方法。
  13. 上記複数のタンパク質が、異なるタンパク質を含む、請求項11に記載の方法。
  14. 病気の発生を予測する方法であって、以下のステップ:
    最初の時点でタンパク質中に発生するレプリキンパターンの最初の計測数を決定し;
    第二の時点で上記タンパク質中に発生するレプリキンパターンの第二の計測数を決定し;そして
    上記第二の計測数が上記第一の計測数よりも大きい場合、上記タンパク質を有する生物体によって引き起こされる将来の病気の増加した確率を報告する、
    を含む、前記方法。
  15. ワクチンを合成する方法であって、以下のステップ:
    病気を引き起こす生物体に関連するタンパク質の変異体中に発生するレプリキンパターンのリストを構築し;
    アミノ酸の足場構造を、上記リスト中の各レプリキンパターン中に発生する実質的に固定されたアミノ酸残基のパターンとして同定し;
    上記足場構造の構成要素を選択し、ここで、前記構成要素は経時的に保存され、かつ、ここで、前記構成要素は上記タンパク質の現在の変異体中に表現され;そして、
    上記選択された構成要素に基づいてワクチンを合成する、
    を含む、前記方法。
  16. 上記病気を引き起こす生物体がインフルエンザである、請求項15に記載の方法。
JP2007510929A 2004-04-28 2005-04-28 アミノ酸の複雑なパターンを同定するためのシステム及び方法 Pending JP2007535766A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US56584704P 2004-04-28 2004-04-28
US10/860,050 US7442761B2 (en) 2003-06-06 2004-06-04 Replikin peptides and uses thereof
US65308305P 2005-02-16 2005-02-16
PCT/US2005/014443 WO2005104754A2 (en) 2004-04-28 2005-04-28 System and method for identifying complex patterns of amino acids

Publications (2)

Publication Number Publication Date
JP2007535766A true JP2007535766A (ja) 2007-12-06
JP2007535766A5 JP2007535766A5 (ja) 2008-03-13

Family

ID=35063033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007510929A Pending JP2007535766A (ja) 2004-04-28 2005-04-28 アミノ酸の複雑なパターンを同定するためのシステム及び方法

Country Status (11)

Country Link
EP (2) EP2390804A3 (ja)
JP (1) JP2007535766A (ja)
KR (2) KR101398851B1 (ja)
CN (1) CN1947122B (ja)
AU (1) AU2005237587A1 (ja)
CA (1) CA2565006A1 (ja)
HK (1) HK1100414A1 (ja)
IL (1) IL178469A0 (ja)
NZ (1) NZ550512A (ja)
SG (2) SG196773A1 (ja)
WO (1) WO2005104754A2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2300493A2 (en) * 2008-04-23 2011-03-30 Samuel Bogoch Methods and compounds for mitigating pathogenic outbreaks using replikin count cycles
US20110097536A1 (en) 2008-06-09 2011-04-28 Basf Se Multilayer composite materials which comprise a plastics foil permeable to water vapour, method for production of the same and use of the same
WO2013151662A2 (en) 2012-03-09 2013-10-10 Samuel Bogoch Therapies, vaccines, and predictive methods for infectious salmon anemia virus

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08287088A (ja) * 1995-04-17 1996-11-01 Canon Inc 情報検索方法及びその装置
JP2000222421A (ja) * 1999-01-29 2000-08-11 Fujitsu Ltd タンパク質解析支援装置及びその装置での処理をコンピュータに行わせるためのプログラムを格納した記憶媒体
US20020151677A1 (en) * 2001-03-27 2002-10-17 Samuel Bogoch Replikins and methods of identifying replikin-containing sequences
WO2002085093A2 (en) * 2001-03-27 2002-10-31 Samuel Bogoch Replikin peptides and uses thereof
WO2003005880A2 (en) * 2001-07-09 2003-01-23 Samuel Bogoch Replikin peptides and uses thereof
JP2003308333A (ja) * 2002-04-16 2003-10-31 Fujitsu Ltd 繰り返しを含む順序パターンを用いた検索装置および方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990008052A (ko) * 1995-04-25 1999-01-25 마이클 피 노바 기억 장치를 갖는 원격적으로 프로그램 가능한 매트릭스 및 이의 용도
NZ592340A (en) * 2001-03-27 2012-12-21 Elenore S Bogoch A method for making a virus vaccine compising Replikin peptides
US7189800B2 (en) * 2001-03-27 2007-03-13 Samuel Bogoch Replikin peptides in rapid replication of glioma cells and in influenza epidemics
SG10201403662QA (en) * 2001-07-09 2014-09-26 Samuel Bogoch Replikin peptides and uses thereof
WO2012075468A1 (en) 2010-12-02 2012-06-07 Mark Olsson Magnetically sensed user interface apparatus and devices

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08287088A (ja) * 1995-04-17 1996-11-01 Canon Inc 情報検索方法及びその装置
JP2000222421A (ja) * 1999-01-29 2000-08-11 Fujitsu Ltd タンパク質解析支援装置及びその装置での処理をコンピュータに行わせるためのプログラムを格納した記憶媒体
US20020151677A1 (en) * 2001-03-27 2002-10-17 Samuel Bogoch Replikins and methods of identifying replikin-containing sequences
WO2002085093A2 (en) * 2001-03-27 2002-10-31 Samuel Bogoch Replikin peptides and uses thereof
WO2003005880A2 (en) * 2001-07-09 2003-01-23 Samuel Bogoch Replikin peptides and uses thereof
JP2003308333A (ja) * 2002-04-16 2003-10-31 Fujitsu Ltd 繰り返しを含む順序パターンを用いた検索装置および方法

Also Published As

Publication number Publication date
SG163553A1 (en) 2010-08-30
IL178469A0 (en) 2007-02-11
EP2390804A2 (en) 2011-11-30
SG196773A1 (en) 2014-02-13
EP1745401A2 (en) 2007-01-24
KR101398851B1 (ko) 2014-05-27
EP1745401B1 (en) 2014-12-24
CN1947122B (zh) 2012-09-05
NZ550512A (en) 2008-08-29
CN1947122A (zh) 2007-04-11
KR20130023378A (ko) 2013-03-07
WO2005104754A3 (en) 2006-07-13
AU2005237587A1 (en) 2005-11-10
HK1100414A1 (en) 2007-09-21
CA2565006A1 (en) 2005-11-10
KR101270934B1 (ko) 2013-06-21
KR20060127253A (ko) 2006-12-11
EP2390804A3 (en) 2012-02-29
WO2005104754A2 (en) 2005-11-10

Similar Documents

Publication Publication Date Title
US7774144B2 (en) System and method for identifying complex patterns of amino acids
US11702708B2 (en) Systems and methods for analyzing viral nucleic acids
Kent BLAT—the BLAST-like alignment tool
Morrison Multiple sequence alignment for phylogenetic purposes
Ismail et al. Genomic analysis of a large set of currently—and historically—important human adenovirus pathogens
Zhao et al. Genetic grouping of SARS-CoV-2 coronavirus sequences using informative subtype markers for pandemic spread visualization
Anselmetti et al. Comparative methods for reconstructing ancient genome organization
Tang et al. Kinn: An alignment-free accurate phylogeny reconstruction method based on inner distance distributions of k-mer pairs in biological sequences
JP2007535766A (ja) アミノ酸の複雑なパターンを同定するためのシステム及び方法
Park et al. Metaviromic identification of discriminative genomic features in SARS-CoV-2 using machine learning
Alam et al. Antigenic heterogeneity of capsid protein VP1 in foot-and-mouth disease virus (FMDV) serotype Asia 1
Vlachakis et al. Advanced protein alignments based on sequence, structure and hydropathy profiles; the paradigm of the viral polymerase enzyme
Kriventseva et al. AnoEST: toward A. gambiae functional genomics
Pasha et al. Revisiting myosin families through large-scale sequence searches leads to the discovery of new myosins
EP2390807A2 (en) System and method for identifying complex replikin patterns of amino acids
WO2022244089A1 (ja) 情報処理プログラム、情報処理方法および情報処理装置
Park et al. Metaviromic identification of genetic hotspots of coronavirus pathogenicity using machine learning
JP2022519786A (ja) 生物学的配列情報の取り扱い
Mendes et al. DEN-IM: Dengue Virus identification from shotgun and targeted metagenomics
il Han et al. CLAGen: A tool for clustering and annotating gene sequences using a suffix tree algorithm
Dutia A method for analysis of mutations in HIVs and SARS viruses and for homologous proteins structure characterisation
Wyman et al. Annotating animal mitochondrial tRNAs: A new scoring scheme and an empirical evaluation of four methods
Han et al. A gene clustering method with masking cross-matching fragments using modified suffix tree clustering method
Newman Computational Methods for Exploring the Tandem Repeat Protein Universe
Haubold et al. Fast Alignment: Genome Comparison and Database Searching

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080123

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090409

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110228

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110830