JP7065772B2

JP7065772B2 - 低反復性ヌクレオチド配列を有する、プロリンおよびアラニン残基が豊富な反復性アミノ酸配列をコードする核酸

Info

Publication number: JP7065772B2
Application number: JP2018532638A
Authority: JP
Inventors: ビンダー，ウリ; アチャッツ，ステファン; スケラ，アルネ
Original assignee: TECHNICAL UNIVERSITY MUNICH
Current assignee: TECHNICAL UNIVERSITY MUNICH
Priority date: 2015-12-22
Filing date: 2016-12-22
Publication date: 2022-05-12
Anticipated expiration: 2036-12-22
Also published as: US20190010192A1; PL3394266T3; ES2877539T3; WO2017109087A1; US11401305B2; BR112018012784A2; AU2016378646B2; LT3394266T; EP3394266B1; SG11201803958WA; IL259352B; MX2018007680A; IL259352A; JP2019508020A; HUE055267T2; DK3394266T3; EP3919623A1; KR102654180B1; NZ742902A; CN109153996A

Description

本発明は、プロリン／アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列を含む核酸分子に関する。コードされたポリペプチドは、ランダムコイルを形成する反復性アミノ酸配列を含む。前記低反復性ヌクレオチド配列を含む核酸分子は、生理活性または薬理活性タンパク質をコードするヌクレオチド配列をさらに含むことができる。さらに、本発明は、前記低反復性ヌクレオチド配列を含む前記核酸分子を特定するための選択手段および方法を提供する。本発明は、前記核酸分子を調製するための方法にも関する。本明細書では、本明細書で提供される核酸分子を使用して、コードされたポリペプチドまたはコードされたポリペプチドとの薬物コンジュゲートを調製するための方法も提供される。薬物コンジュゲートは、生理活性または薬理活性タンパク質または低分子薬物を含んでもよい。本明細書では、そのような核酸分子を含むベクターおよび宿主も提供される。

ランダムコイルを形成するポリペプチドは、従来技術で公知である。例えば、国際公開第２００８／１５５１３４号パンフレットは、少なくとも約１００個のアミノ酸残基のアミノ酸配列を含み、プロリン、アラニン、およびセリン（ＰＡＳ）残基からなるタンパク質を開示している。ランダムコイルコンフォメーションを形成するアミノ酸配列は、複数のアミノ酸反復を含んでもよい。これら反復は、少なくとも３～３０個またはそれよりも多くのアミノ酸残基からなっていてもよい。国際公開第２０１１／１４４７５６号パンフレットは、プロリンおよびアラニン（ＰＡ）残基のみからなる反復性アミノ酸配列を含むポリペプチドを開示している。これらポリペプチドも、ランダムコイルを形成し、少なくとも５０個のプロリンおよびアラニン残基からなる。国際公開第２０１５／１３２００４号パンフレットは、ＰＡＳからなるランダムコイルドメインを含む組換えクロストリジウム神経毒を開示している。米国特許出願公開第２００６／０２５２１２０号明細書は、アミノ酸配列モチーフ［（ＡＰ）_５］_ｎを有するプロリンリッチ糖モジュールとしてコードされているセグメントを含む、ヒドロキシプロリンリッチ糖タンパク質を開示している。天然ポリペプチドも、遺伝子バンク受託番号（ＡＡＰ４１４５４．１）として公開されているマカクヘルペスウイルス（Macacine herpesvirus）１遺伝子の超大型テグメントタンパク質等の、プロリンおよびアラニンが豊富な配列を包含する。コドン最適化の方法は、国際公開第２００７／１４２９５４号パンフレットに開示されている。

ＰＡＳまたはＰＡ配列のような、反復性の従来技術のポリペプチドは、典型的には、対応する反復性核酸によりコードされる。そのため、従来技術の核酸は、それらのヌクレオチド配列にもコードされているアミノ酸配列の反復構造を反映する。したがって、従来技術の核酸は、配列レベルで高度に反復性である。従来技術の核酸が反復性であることは、特に、長いＰＡＳまたはＰＡ配列、例えば３００残基以上がコードされる場合、部分的な遺伝子不安定性等の懸念に結び付く場合がある。

したがって、本発明の根底にある技術的課題は、アミノ酸反復を含むポリペプチド、特に、プロリン、アラニン、および任意選択でセリンからなるアミノ酸反復を含むポリペプチドの便利で信頼性の高い調製のための手段および方法の提供である。

この技術的課題は、本明細書の下記に提供されている実施形態を提供することにより、および添付の特許請求の範囲で特徴付けられているように解決される。

本発明は、以下の項目に関する。

１．プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含む核酸分子であって、
前記核酸のヌクレオチド配列が、少なくとも３００個のヌクレオチドの長さを有し、
前記ヌクレオチド配列が、５０，０００未満のヌクレオチド反復スコア（ＮＲＳ）を有し、
前記ヌクレオチド反復スコア（ＮＲＳ）が、数式：

により決定され、式中、
Ｎ_ｔｏｔは、前記ヌクレオチド配列の長さであり、
ｎは、前記ヌクレオチド配列内の反復の長さであり、
ｆ_ｉ（ｎ）は、前記長さｎの反復の頻度であり、
１つよりも多くの長さｎの反復が存在する場合、ｋ（ｎ）は、前記長さｎの反復の前記異なる配列の数であり、そうでなければ、前記長さｎの反復のｋ（ｎ）は１である、核酸分子。

２．前記コードされたポリペプチドが、プロリンおよびアラニンからなる、項目１に記載の核酸分子。

３．前記プロリン残基が、前記コードされたポリペプチドの約１０％超および約７５％未満を構成する、項目２に記載の核酸分子。

４．前記コードされたポリペプチドが、プロリン、アラニン、およびセリンからなる、項目１に記載の核酸分子。

５．前記プロリン残基が、前記コードされたポリペプチドの４％超および４０％未満を構成する、項目４に記載の核酸分子。

６．前記ヌクレオチド反復スコア（ＮＲＳ）が、１００未満である、項目１～５のいずれか一項に記載の核酸分子。

７．増強された遺伝子安定性を有する、項目１～６のいずれか一項に記載の核酸分子。

８．前記ヌクレオチド配列が、前記反復を含み、前記反復が、最大長ｎ_ｍａｘを有し、ｎ_ｍａｘが、数式：

により決定され、式中、Ｎ_ｔｏｔが、前記ヌクレオチド配列の長さである、項目１～７のいずれか一項に記載の核酸分子。

９．前記反復が、約１４、１５、１６、または１７個のヌクレオチドから約５５個のヌクレオチドまでの最大長を有する、項目１～８のいずれか一項に記載の核酸分子。

１０．前記反復が、前記ヌクレオチド配列の長さの５０％に対応する最大長を有する、項目１～９のいずれか一項に記載の核酸分子。

１１．前記コードされたポリペプチドが、複数のアミノ酸反復を有する反復性アミノ酸配列を含み、９個以下の連続アミノ酸残基が同一であり、前記ポリペプチドがランダムコイルを形成する、項目１～１０のいずれか一項に記載の核酸分子。

１２．（ａ）配列番号１９、配列番号２０、配列番号２１、配列番号２２、配列番号２３、配列番号２４、配列番号２５、配列番号２６、および配列番号２７からなる群から選択される少なくとも１つのヌクレオチド配列を含む核酸分子；
（ｂ）配列番号２８、配列番号２９、配列番号３０、配列番号３１、配列番号３２、配列番号３３、配列番号３４、配列番号３５、配列番号３６、および配列番号３７からなる群から選択される少なくとも１つのヌクレオチド配列を含む核酸分子；
（ｃ）配列番号３８、配列番号３９、配列番号４０、および配列番号４１からなる群から選択されるヌクレオチド配列を含む核酸分子；
（ｄ）配列番号４２、配列番号４３、配列番号４４、および／または配列番号４５からなるヌクレオチド配列を含む核酸分子；
（ｅ）（ａ）または（ｂ）で規定されるヌクレオチド配列の相補鎖にストリンジェントな条件下でハイブリダイズする核酸分子；
（ｆ）（ａ）、（ｃ）、および（ｅ）のいずれか１つで規定されるヌクレオチド配列と少なくとも５６％の同一性を有するヌクレオチド配列を含む核酸分子；
（ｇ）（ｂ）、（ｄ）、および（ｅ）のいずれか１つで規定されるヌクレオチド配列と少なくとも６６．７％の同一性を有するヌクレオチド配列を含む核酸分子、ならびに
（ｈ）（ａ）～（ｄ）のいずれか１つで規定されるヌクレオチド配列に対する遺伝子コードの結果として縮重している核酸分子
からなる群から選択される、項目１～１１のいずれか一項に記載の核酸分子。

１３．前記核酸分子が、２つの相補的５’－突出を含み、コード鎖の５’－突出が５’－ＧＣＣであり、非コード鎖の５’－突出が５’－ＧＧＣである、項目１～１２のいずれか１項に記載の核酸分子。

１４．生理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結された、項目１～１３のいずれか一項に記載の核酸分子。

１５．前記生理活性タンパク質が、治療上有効なタンパク質である、項目１４に記載の核酸分子。

１６．前記生理活性タンパク質が、結合タンパク質、抗体断片、サイトカイン、成長因子、ホルモン、酵素、タンパク質ワクチン、ペプチドワクチン、最大５０個のアミノ酸残基からなるペプチド、またはペプチド模倣体からなる群から選択される、項目１４または１５に記載の核酸分子。

１７．前記結合タンパク質が、抗体、Ｆａｂ断片、Ｆａｂ’断片、Ｆ（ａｂ’）_２断片、単鎖可変断片（ｓｃＦｖ）、（単一）ドメイン抗体、抗体の単離された可変領域（ＶＬおよび／またはＶＨ領域）、ＣＤＲ、免疫グロブリンドメイン、ＣＤＲ由来ペプチド模倣体、レクチン、タンパク質スキャフォールド、フィブロネクチンドメイン、テネイシンドメイン、プロテインＡドメイン、ＳＨ３ドメイン、アンキリン反復ドメイン、およびリポカリンからなる群から選択される、項目１６に記載の核酸分子。

１８．前記生理活性タンパク質が、インターロイキン１受容体アンタゴニスト、レプチン、酸性スフィンゴミエリナーゼ、アデノシンデアミナーゼ、アガルシダーゼアルファ、アルファ－１アンチトリプシン、アルファ心房性ナトリウム利尿ペプチド、アルファ－ガラクトシダーゼ、アルファ－グルコシダーゼ、アルファ－Ｎ－アセチルグルコサミニダーゼ、アルテプラーゼ、アメジプラーゼ（amediplase）、アミリン、アミリン類似体、抗ＨＩＶペプチド融合阻害剤、アルギニンデイミナーゼ、アスパラギナーゼ、Ｂドメイン欠損第ＶＩＩＩ因子、骨形態形成タンパク質、ブラジキニンアンタゴニスト、Ｂ型ナトリウム利尿ペプチド、ブーガニン（bouganin）、成長ホルモン、絨毛性ゴナドトロピン、ＣＤ３受容体アンタゴニスト、ＣＤ１９アンタゴニスト、ＣＤ２０アンタゴニスト、ＣＤ４０アンタゴニスト、ＣＤ４０Ｌアンタゴニスト、セレブロシドスルファターゼ、凝固第ＶＩＩａ因子、凝固第ＸＩＩＩ因子、凝固第ＩＸ因子、凝固第Ｘ因子、補体成分Ｃ３阻害剤、補体成分５ａアンタゴニスト、Ｃ－ペプチド、ＣＴＬＡ－４アンタゴニスト、Ｃ型ナトリウム利尿ペプチド、ディフェンシン、デオキシリボヌクレアーゼＩ、ＥＧＦＲ受容体アンタゴニスト、上皮成長因子、エリスロポエチン、エキセンディン－４、エズリンペプチド１、ＦｃγＩＩＢ受容体アンタゴニスト、線維芽細胞成長因子２１、卵胞刺激ホルモン、胃抑制ポリペプチド（ＧＩＰ）、ＧＩＰ類似体、グルカゴン、グルカゴン受容体アゴニスト、グルカゴン様ペプチド１（ＧＬＰ－１）、ＧＬＰ－１類似体、グルカゴン様ペプチド２（ＧＬＰ－２）、ＧＬＰ－２類似体、ゴナドレリン、ゴナドトロピン放出ホルモンアゴニスト、ゴナドトロピン放出ホルモンアンタゴニスト、ｇｐ１２０、ｇｐ１６０、顆粒球コロニー刺激因子（Ｇ－ＣＳＦ）、顆粒球マクロファージコロニー刺激因子（ＧＭ－ＣＳＦ）、グレリン、グレリン類似体、成長ホルモン、成長ホルモン放出ホルモン、ヘマタイド、肝細胞成長因子、肝細胞成長因子受容体（ＨＧＦＲ）アンタゴニスト、ヘプシジンアンタゴニスト、ヘプシジン模倣体、Ｈｅｒ２／ｎｅｕ受容体アンタゴニスト、ヒストレリン、ヒルジン、ｈｓｐ７０アンタゴニスト、ヒューマニン、ヒアルロニダーゼ、加水分解性リソソームグルコセレブロシド特異的酵素、イズロネート－２－スルファターゼ、ＩｇＥアンタゴニスト、インスリン、インスリン類似体、インスリン様成長因子１、インスリン様成長因子２、インターフェロン－アルファ、インターフェロン－アルファアンタゴニスト、インターフェロン－アルファスーパーアゴニスト、インターフェロン－アルファ－ｎ３、インターフェロン－ベータ、インターフェロン－ガンマ、インターフェロン－ラムダ、インターフェロンタウ、インターロイキン、インターロイキン２融合タンパク質、インターロイキン－２２受容体サブユニットアルファ（ＩＬ－２２ｒａ）アンタゴニスト、イリシン、島ネオゲネシス関連タンパク質、ケラチノサイト成長因子、Ｋｖ１．３イオンチャネルアンタゴニスト、ランチペプチド、リパーゼ、黄体形成ホルモン、ルトロピンアルファ、リソスタフィン、マンノシダーゼ、Ｎ－アセチルガラクトサミン－６－スルファターゼ、Ｎ－アセチルグルコサミニダーゼ、好中球ゼラチナーゼ関連リポカリン、オクトレオチド、ω－コノトキシン、オルニトドロス・モウバタ（Ornithodoros moubata）補体阻害剤、骨形成タンパク質－１、オステオプロテゲリン、シュウ酸デカルボキシラーゼ、Ｐ１２８、副甲状腺ホルモン、フィロマー（Phylomer）、ＰＤ－１アンタゴニスト、ＰＤＧＦアンタゴニスト、フェニルアラニンアンモニアリアーゼ、血小板由来成長因子、プロインスリン、プロテインＣ、リラキシン、リラキシン類似体、セクレチン、ＲＧＤペプチド、リボヌクレアーゼ、センレボターゼ（senrebotase）、セリンプロテアーゼ阻害剤、可溶性１型補体受容体、可溶性ＤＣＣ受容体、可溶性ＴＡＣＩ受容体、可溶性腫瘍壊死因子Ｉ受容体（ｓＴＮＦ－ＲＩ）、可溶性腫瘍壊死因子ＩＩ受容体（ｓＴＮＦ－ＲＩＩ）、可溶性ＶＥＧＦ受容体Ｆｌｔ－１、可溶性ＦｃγＩＩＢ受容体、ソマトスタチン、ソマトスタチン類似体、ストレプトキナーゼ、Ｔ細胞受容体リガンド、テネクテプラーゼ、テリパラチド、トロンボモジュリンアルファ、チモシンアルファ１、ｔｏｌｌ様受容体阻害剤、腫瘍壊死因子（ＴＮＦα）、腫瘍壊死因子αアンタゴニスト、ウリカーゼ、血管作用性腸ペプチド、バソプレッシン、バソプレッシン類似体、ＶＥＧＦアンタゴニスト、フォンビルブラント因子からなる群から選択される、項目１４～１７のいずれか一項に記載の核酸分子。

１９．項目１～１８のいずれか一項に記載の核酸分子を含むベクター。

２０．前記ベクターが、エンドヌクレアーゼ制限酵素により認識される上流認識配列、およびエンドヌクレアーゼ制限酵素により認識される下流認識配列を含み、前記上流認識配列および前記下流認識配列が、逆相補的に配向されている、項目１９に記載のベクター。

２１．前記下流認識配列を認識する前記エンドヌクレアーゼ制限酵素が、上流認識配列を認識するエンドヌクレアーゼ制限酵素とは異なる、項目２０に記載のベクター。

２２．前記上流認識配列が、２つの異なる制限酵素の２つの認識配列を含む、項目２０または２１に記載のベクター。

２３．前記下流認識配列が、上流認識配列に含まれている、項目２０～２２のいずれか一項に記載のベクター。

２４．前記上流認識配列および／または前記下流認識配列が、ヌクレオチド突出を生成する制限酵素の認識配列である、項目２０～２３のいずれか一項に記載のベクター。

２５．前記上流認識配列および／または前記下流認識配列が、認識配列の外側を切断する制限酵素の認識部位である、項目２０～２４のいずれか一項に記載のベクター。

２６．前記制限酵素が、ＩＩＳ型制限酵素である、項目２０～２５のいずれか一項に記載のベクター。

２７．前記上流認識配列がヌクレオチド配列「５’－ＧＣＴＣＴＴＣ－３’」を有し、および／または前記下流認識配列がヌクレオチド配列「５’－ＣＴＣＴＴＣ－３’」を有する、項目２０～２６のいずれか一項に記載のベクター。

２８．前記上流認識配列がＳａｐＩおよびＥａｒＩにより認識され、ならびに／または前記下流認識配列がＥａｒＩにより認識される、項目２０～２７のいずれか一項に記載のベクター。

２９．前記ベクターが、配列番号４８または配列番号５５に示されている配列を有する、項目２０～２８のいずれか一項に記載のベクター。

３０．項目１～１８のいずれか一項に記載の核酸分子を含むか、または項目１９～２９のいずれか一項に記載のベクターで形質転換された宿主。

３１．細菌、哺乳動物細胞、昆虫細胞、藻細胞、繊毛虫、酵母、および植物細胞からなる群から選択される、項目３０に記載の宿主。

３２．細菌が、エシェリキア属（Escherichia）、コリネバクテリウム属（Corynebacterium）、シュードモナス属（Pseudomonas）、またはバチルス属（Bacillus）に属する、項目３０または３１に記載の宿主。

３３．前記細菌が、大腸菌（Escherichia coli）、コリネバクテリウム・グルタミカム（Corynebacterium glutamicum）、シュードモナス・フルオレッセンス（Pseudomonas fluorescens）、またはバチルス・メガテリウム（Bacillus megaterium）である、項目３２に記載の宿主。

３４．前記哺乳動物細胞が、ハムスター細胞である、項目３１に記載の宿主。

３５．前記哺乳動物細胞が、ＣＨＯ細胞である、項目３４に記載の宿主。

３６．前記酵母が、サッカロマイセス属（Saccharomyces）、ピキア属（Pichia）、ハンゼヌラ属（Hansenula）、またはクリベロマイセス属（Kluyveromyces）に属する、項目３１に記載の宿主。

３７．前記酵母が、サッカロマイセス・セレビシエ（Saccharomyces cerevisiae）、シゾサッカロミセス・ポンベ（Schizosaccharomyces pombe）、ピキア・パストリス（Pichia pastoris）、ピキア・メタノリカ（Pichia methanolica）、ハンゼヌラ・ポリモルファ（Hansenula polymorpha）、またはクリベロマイセス・ラクティス（Kluyveromyces lactis）である、項目３６に記載の宿主。

３８．項目１～１８のいずれか一項に記載の前記核酸分子、または項目１９～２９のいずれか一項に記載の前記ベクターを調製するための方法であって、項目３０～３７のいずれか一項に記載の宿主を培養／成長させること；ならびに任意選択で、産生された核酸分子および／またはベクターを単離することを含む方法。

３９．項目１～１８のいずれか一項に記載の核酸分子によりコードされるポリペプチドを調製するための方法であって、項目１～１８のいずれか一項に記載の核酸分子を含む、項目３０～３７のいずれか一項に記載の宿主を培養／成長させること；および任意選択で、産生されたポリペプチドを単離することを含む方法。

４０．薬物コンジュゲートを調製するための方法であって、前記薬物コンジュゲートが、項目１～１８のいずれか一項に記載の核酸分子によりコードされるポリペプチドを含み、（ｉ）生理活性タンパク質および／または（ｉｉ）低分子および／または（ｉｉｉ）炭水化物をさらに含む、方法。

４１．前記核酸分子が、増強された遺伝子安定性を有する、項目４０に記載の薬物コンジュゲートを調製するための方法。

４２．前記生理活性タンパク質が、治療上有効なタンパク質である、項目４０または４１に記載の薬物コンジュゲートを調製するための方法。

４３．前記ポリペプチドが、前記薬物コンジュゲートの増強されたｉｎｖｉｖｏおよび／またはｉｎｖｉｔｒｏ安定性を媒介する、項目４０～４２のいずれか一項に記載の薬物コンジュゲートを調製するための方法。

４４．前記生理活性タンパク質が、結合タンパク質、抗体断片、サイトカイン、成長因子、ホルモン、酵素、タンパク質ワクチン、ペプチドワクチン、最大５０個のアミノ酸残基からなるペプチド、またはペプチド模倣体からなる群から選択される、項目４０～４３のいずれか一項に記載の薬物コンジュゲートを調製するための方法。

４５．前記結合タンパク質が、抗体、Ｆａｂ断片、Ｆａｂ’断片、Ｆ（ａｂ’）_２断片、単鎖可変断片（ｓｃＦｖ）、（単一）ドメイン抗体、抗体の単離された可変領域（ＶＬおよび／またはＶＨ領域）、ＣＤＲ、免疫グロブリンドメイン、ＣＤＲ由来ペプチド模倣体、レクチン、タンパク質スキャフォールド、フィブロネクチンドメイン、テネイシンドメイン、プロテインＡドメイン、ＳＨ３ドメイン、アンキリン反復ドメイン、およびリポカリンからなる群から選択される、項目４０～４４のいずれか一項に記載の薬物コンジュゲートを調製するための方法。

４６．前記生理活性タンパク質が、インターロイキン１受容体アンタゴニスト、レプチン、酸性スフィンゴミエリナーゼ、アデノシンデアミナーゼ、アガルシダーゼアルファ、アルファ－１アンチトリプシン、アルファ心房性ナトリウム利尿ペプチド、アルファ－ガラクトシダーゼ、アルファ－グルコシダーゼ、アルファ－Ｎ－アセチルグルコサミニダーゼ、アルテプラーゼ、アメジプラーゼ、アミリン、アミリン類似体、抗ＨＩＶペプチド融合阻害剤、アルギニンデイミナーゼ、アスパラギナーゼ、Ｂドメイン欠損第ＶＩＩＩ因子、骨形態形成タンパク質、ブラジキニンアンタゴニスト、Ｂ型ナトリウム利尿ペプチド、ブーガニン、成長ホルモン、絨毛性ゴナドトロピン、ＣＤ３受容体アンタゴニスト、ＣＤ１９アンタゴニスト、ＣＤ２０アンタゴニスト、ＣＤ４０アンタゴニスト、ＣＤ４０Ｌアンタゴニスト、セレブロシドスルファターゼ、凝固第ＶＩＩａ因子、凝固第ＸＩＩＩ因子、凝固第ＩＸ因子、凝固第Ｘ因子、補体成分Ｃ３阻害剤、補体成分５ａアンタゴニスト、Ｃ－ペプチド、ＣＴＬＡ－４アンタゴニスト、Ｃ型ナトリウム利尿ペプチド、ディフェンシン、デオキシリボヌクレアーゼＩ、ＥＧＦＲ受容体アンタゴニスト、上皮成長因子、エリスロポエチン、エキセンディン－４、エズリンペプチド１、ＦｃγＩＩＢ受容体アンタゴニスト、線維芽細胞成長因子２１、卵胞刺激ホルモン、胃抑制ポリペプチド（ＧＩＰ）、ＧＩＰ類似体、グルカゴン、グルカゴン受容体アゴニスト、グルカゴン様ペプチド１（ＧＬＰ－１）、ＧＬＰ－１類似体、グルカゴン様ペプチド２（ＧＬＰ－２）、ＧＬＰ－２類似体、ゴナドレリン、ゴナドトロピン放出ホルモンアゴニスト、ゴナドトロピン放出ホルモンアンタゴニスト、ｇｐ１２０、ｇｐ１６０、顆粒球コロニー刺激因子（Ｇ－ＣＳＦ）、顆粒球マクロファージコロニー刺激因子（ＧＭ－ＣＳＦ）、グレリン、グレリン類似体、成長ホルモン、成長ホルモン放出ホルモン、ヘマタイド、肝細胞成長因子、肝細胞成長因子受容体（ＨＧＦＲ）アンタゴニスト、ヘプシジンアンタゴニスト、ヘプシジン模倣体、Ｈｅｒ２／ｎｅｕ受容体アンタゴニスト、ヒストレリン、ヒルジン、ｈｓｐ７０アンタゴニスト、ヒューマニン、ヒアルロニダーゼ、加水分解性リソソームグルコセレブロシド特異的酵素、イズロネート－２－スルファターゼ、ＩｇＥアンタゴニスト、インスリン、インスリン類似体、インスリン様成長因子１、インスリン様成長因子２、インターフェロン－アルファ、インターフェロン－アルファアンタゴニスト、インターフェロン－アルファスーパーアゴニスト、インターフェロン－アルファ－ｎ３、インターフェロン－ベータ、インターフェロン－ガンマ、インターフェロン－ラムダ、インターフェロンタウ、インターロイキン、インターロイキン２融合タンパク質、インターロイキン－２２受容体サブユニットアルファ（ＩＬ－２２ｒａ）アンタゴニスト、イリシン、島ネオゲネシス関連タンパク質、ケラチノサイト成長因子、Ｋｖ１．３イオンチャネルアンタゴニスト、ランチペプチド、リパーゼ、黄体形成ホルモン、ルトロピンアルファ、リソスタフィン、マンノシダーゼ、Ｎ－アセチルガラクトサミン－６－スルファターゼ、Ｎ－アセチルグルコサミニダーゼ、好中球ゼラチナーゼ関連リポカリン、オクトレオチド、ω－コノトキシン、オルニトドロス・モウバタ（Ornithodoros moubata）補体阻害剤、骨形成タンパク質－１、オステオプロテゲリン、シュウ酸デカルボキシラーゼ、Ｐ１２８、副甲状腺ホルモン、フィロマー（Phylomer）、ＰＤ－１アンタゴニスト、ＰＤＧＦアンタゴニスト、フェニルアラニンアンモニアリアーゼ、血小板由来成長因子、プロインスリン、プロテインＣ、リラキシン、リラキシン類似体、セクレチン、ＲＧＤペプチド、リボヌクレアーゼ、センレボターゼ、セリンプロテアーゼ阻害剤、可溶性１型補体受容体、可溶性ＤＣＣ受容体、可溶性ＴＡＣＩ受容体、可溶性腫瘍壊死因子Ｉ受容体（ｓＴＮＦ－ＲＩ）、可溶性腫瘍壊死因子ＩＩ受容体（ｓＴＮＦ－ＲＩＩ）、可溶性ＶＥＧＦ受容体Ｆｌｔ－１、可溶性ＦｃγＩＩＢ受容体、ソマトスタチン、ソマトスタチン類似体、ストレプトキナーゼ、Ｔ細胞受容体リガンド、テネクテプラーゼ、テリパラチド、トロンボモジュリンアルファ、チモシンアルファ１、ｔｏｌｌ様受容体阻害剤、腫瘍壊死因子（ＴＮＦα）、腫瘍壊死因子αアンタゴニスト、ウリカーゼ、血管作用性腸ペプチド、バソプレッシン、バソプレッシン類似体、ＶＥＧＦアンタゴニスト、フォンビルブラント因子からなる群から選択される、項目４０～４５のいずれか一項に記載の薬物コンジュゲートを調製するための方法。

４７．前記低分子が、血管新生阻害剤、抗アレルギー薬、制吐薬、抗うつ薬、抗高血圧薬、抗炎症薬、抗感染症薬、抗精神病薬、抗増殖（細胞毒性および細胞増殖抑制）薬、カルシウムアンタゴニストおよび他の循環器薬、コリン作動性アゴニスト、中枢神経系に作用する薬物、呼吸器系に作用する薬物、ホルモン、ステロイド、ポリケチド、炭水化物、オリゴ糖、核酸、核酸誘導体、アンチセンス核酸、低分子干渉ＲＮＡ（ｓｉＲＮＡ）、マイクロＲＮＡ（ｍｉＲ）阻害剤、マイクロＲＮＡ模倣体、ＤＮＡアプタマー、およびＲＮＡアプタマーからなる群から選択される、項目４０～４６のいずれか一項に記載の薬物コンジュゲートを調製するための方法。

４８．項目３９に記載の方法により得られるかまたは得ることができるポリペプチド、項目４０～４７のいずれか一項に記載の方法により得られる薬物コンジュゲート。

４９．項目１～１８のいずれか一項に記載の核酸分子を配列決定するための方法。

５０．項目１～１８のいずれか一項に記載の核酸分子を増幅するための方法。

５１．項目１～１８のいずれか一項に記載の核酸分子をクローニングするための方法。

５２．遺伝子的に安定な核酸分子を選択するための方法であって、前記核酸分子が、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、前記ヌクレオチド配列が、少なくとも３００個のヌクレオチドの長さを有し、
前記方法が、５０，０００未満のヌクレオチド反復スコア（ＮＲＳ）を有するヌクレオチド配列を含む核酸分子を選択するステップを含み、
前記ヌクレオチド反復スコア（ＮＲＳ）が、数式：

により決定され、式中、
Ｎ_ｔｏｔが、前記ヌクレオチド配列の長さであり、
ｎが、前記ヌクレオチド配列内の反復の長さであり、
ｆ_ｉ（ｎ）が、前記長さｎの反復の頻度であり、
１つよりも多くの長さｎの反復が存在する場合、ｋ（ｎ）は、前記長さｎの反復の前記異なる配列の数であり、そうでなければ、前記長さｎの反復のｋ（ｎ）は１である、方法。

ある特定の態様では、本出願は、以下の項目に関する。

２．前記コードされたポリペプチドがプロリンおよびアラニンからなり、前記プロリン残基が、前記コードされたポリペプチドの約１０％超および約７５％未満を構成する、項目１に記載の核酸分子。

３．前記コードされたポリペプチドがプロリン、アラニン、およびセリンからなり、前記プロリン残基が、前記コードされたポリペプチドの４％超および４０％未満を構成する、項目１に記載の核酸分子。

４．前記ヌクレオチド反復スコア（ＮＲＳ）が、１００未満である、項目１～３のいずれか一項に記載の核酸分子。

５．増強された遺伝子安定性を有する、項目１～４のいずれか一項に記載の核酸分子。

６．前記ヌクレオチド配列が、前記反復を含み、前記反復が、最大長ｎ_ｍａｘを有し、ｎ_ｍａｘが、数式：

により決定され、式中、Ｎ_ｔｏｔが、前記ヌクレオチド配列の長さである、項目１～５のいずれか一項に記載の核酸分子。

７．前記反復が、約１４、１５、１６、または１７個のヌクレオチドから約５５個のヌクレオチドまでの最大長を有する、項目１～６のいずれか一項に記載の核酸分子。

８．前記コードされたポリペプチドが、複数のアミノ酸反復を有する反復性アミノ酸配列を含み、９個以下の連続アミノ酸残基が同一であり、前記ポリペプチドがランダムコイルを形成する、項目１～７のいずれか一項に記載の核酸分子。

９．（ａ）配列番号１９、配列番号２０、配列番号２１、配列番号２２、配列番号２３、配列番号２４、配列番号２５、配列番号２６、および配列番号２７からなる群から選択される少なくとも１つのヌクレオチド配列を含む核酸分子；
（ｂ）配列番号２８、配列番号２９、配列番号３０、配列番号３１、配列番号３２、配列番号３３、配列番号３４、配列番号３５、配列番号３６、および配列番号３７からなる群から選択される少なくとも１つのヌクレオチド配列を含む核酸分子；
（ｃ）配列番号３８、配列番号３９、配列番号４０、および配列番号４１からなる群から選択されるヌクレオチド配列を含む核酸分子；
（ｄ）配列番号４２、配列番号４３、配列番号４４、および／または配列番号４５からなるヌクレオチド配列を含む核酸分子；
（ｅ）（ａ）または（ｂ）で規定されるヌクレオチド配列の相補鎖にストリンジェントな条件下でハイブリダイズする核酸分子；
（ｆ）（ａ）、（ｃ）、および（ｅ）のいずれか１つで規定されるヌクレオチド配列と少なくとも５６％の同一性を有するヌクレオチド配列を含む核酸分子；
（ｇ）（ｂ）、（ｄ）、および（ｅ）のいずれか１つで規定されるヌクレオチド配列と少なくとも６６．７％の同一性を有するヌクレオチド配列を含む核酸分子；ならびに
（ｈ）（ａ）～（ｄ）のいずれか１つで規定されるヌクレオチド配列に対する遺伝子コードの結果として縮重している核酸分子
からなる群から選択される、項目１～８のいずれか一項に記載の核酸分子。

１０．生理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結された、項目１～９のいずれか一項に記載の核酸分子。

１１．前記生理活性タンパク質が、結合タンパク質、抗体断片、サイトカイン、成長因子、ホルモン、酵素、タンパク質ワクチン、ペプチドワクチン、最大５０個のアミノ酸残基からなるペプチド、またはペプチド模倣体からなる群から選択され、前記結合タンパク質が、抗体、Ｆａｂ断片、Ｆａｂ’断片、Ｆ（ａｂ’）_２断片、単鎖可変断片（ｓｃＦｖ）、（単一）ドメイン抗体、抗体の単離された可変領域（ＶＬおよび／またはＶＨ領域）、ＣＤＲ、免疫グロブリンドメイン、ＣＤＲ由来ペプチド模倣体、レクチン、タンパク質スキャフォールド、フィブロネクチンドメイン、テネイシンドメイン、プロテインＡドメイン、ＳＨ３ドメイン、アンキリン反復ドメイン、およびリポカリンからなる群から選択される、項目１０に記載の核酸分子。

１２．前記生理活性タンパク質が、酸性スフィンゴミエリナーゼ、アデノシンデアミナーゼ、アガルシダーゼアルファ、アルファ－１アンチトリプシン、アルファ心房性ナトリウム利尿ペプチド、アルファ－ガラクトシダーゼ、アルファ－グルコシダーゼ、アルファ－Ｎ－アセチルグルコサミニダーゼ、アルテプラーゼ、アメジプラーゼ、アミリン、アミリン類似体、抗ＨＩＶペプチド融合阻害剤、アルギニンデイミナーゼ、アスパラギナーゼ、Ｂドメイン欠損第ＶＩＩＩ因子、骨形態形成タンパク質、ブラジキニンアンタゴニスト、Ｂ型ナトリウム利尿ペプチド、ブーガニン、成長ホルモン、絨毛性ゴナドトロピン、ＣＤ３受容体アンタゴニスト、ＣＤ１９アンタゴニスト、ＣＤ２０アンタゴニスト、ＣＤ４０アンタゴニスト、ＣＤ４０Ｌアンタゴニスト、セレブロシドスルファターゼ、凝固第ＶＩＩａ因子、凝固第ＸＩＩＩ因子、凝固第ＩＸ因子、凝固第Ｘ因子、補体成分Ｃ３阻害剤、補体成分５ａアンタゴニスト、Ｃペプチド、ＣＴＬＡ－４アンタゴニスト、Ｃ型ナトリウム利尿ペプチド、ディフェンシン、デオキシリボヌクレアーゼＩ、ＥＧＦＲ受容体アンタゴニスト、上皮成長因子、エリスロポエチン、エキセンディン－４、エズリンペプチド１、ＦｃγＩＩＢ受容体アンタゴニスト、線維芽細胞成長因子２１、卵胞刺激ホルモン、胃抑制ポリペプチド（ＧＩＰ）、ＧＩＰ類似体、グルカゴン、グルカゴン受容体アゴニスト、グルカゴン様ペプチド（ＧＬＰ－１）、ＧＬＰ－１類似体、グルカゴン様ペプチド２（ＧＬＰ－２）、ＧＬＰ－２類似体、ゴナドレリン、ゴナドトロピン放出ホルモンアゴニスト、ゴナドトロピン放出ホルモンアンタゴニスト、ｇｐ１２０、ｇｐ１６０、顆粒球コロニー刺激因子（Ｇ－ＣＳＦ）、顆粒球マクロファージコロニー刺激因子（ＧＭ－ＣＳＦ）、グレリン、グレリン類似体、成長ホルモン、成長ホルモン放出ホルモン、ヘマタイド、肝細胞成長因子、肝細胞成長因子受容体（ＨＧＦＲ）アンタゴニスト、ヘプシジンアンタゴニスト、ヘプシジン模倣体、Ｈｅｒ２／ｎｅｕ受容体アンタゴニスト、ヒストレリン、ヒルジン、ｈｓｐ７０アンタゴニスト、ヒューマニン、ヒアルロニダーゼ、加水分解性リソソームグルコセレブロシド特異的酵素、イズロネート－２－スルファターゼ、ＩｇＥアンタゴニスト、インスリン、インスリン類似体、インスリン様成長因子１、インスリン様成長因子２、インターフェロン－アルファ、インターフェロン－アルファアンタゴニスト、インターフェロン－アルファスーパーアゴニスト、インターフェロン－アルファ－ｎ３、インターフェロン－ベータ、インターフェロン－ガンマ、インターフェロン－ラムダ、インターフェロンタウ、インターロイキン、インターロイキン１受容体アンタゴニスト、インターロイキン２融合タンパク質、インターロイキン－２２受容体サブユニットアルファ（ＩＬ－２２ｒａ）アンタゴニスト、イリシン、島ネオゲネシス関連タンパク質、ケラチノサイト成長因子、Ｋｖ１．３イオンチャネルアンタゴニスト、ランチペプチド、レプチン、リパーゼ、黄体形成ホルモン、ルトロピンアルファ、リソフスタフィン、マンノシダーゼ、Ｎ－アセチルガラクトサミン－６－スルファターゼ、Ｎ－アセチルグルコサミニダーゼ、好中球ゼラチナーゼ関連リポカリン、オクトレオチド、ω－コノトキシン、オルニトドロス・モウバタ（Ornithodoros moubata）補体阻害剤、骨形成タンパク質－１、オステオプロテゲリン、シュウ酸デカルボキシラーゼ、Ｐ１２８、副甲状腺ホルモン、フィロマー（Phylomer）、ＰＤ－１アンタゴニスト、ＰＤＧＦアンタゴニスト、フェニルアラニンアンモニアリアーゼ、血小板由来成長因子、プロインスリン、プロテインＣ、リラキシン、リラキシン類似体、セクレチン、ＲＧＤペプチド、リボヌクレアーゼ、センレボターゼ、セリンプロテアーゼ阻害剤、可溶性１型補体受容体、可溶性ＤＣＣ受容体、可溶性ＴＡＣＩ受容体、可溶性腫瘍壊死因子Ｉ受容体（ｓＴＮＦ－ＲＩ）、可溶性腫瘍壊死因子ＩＩ受容体（ｓＴＮＦ－ＲＩＩ）、可溶性ＶＥＧＦ受容体Ｆｌｔ－１、可溶性ＦｃγＩＩＢ受容体、ソマトスタチン、ソマトスタチン類似体、ストレプトキナーゼ、Ｔ細胞受容体リガンド、テネクテプラーゼ、テリパラチド、トロンボモジュリンアルファ、チモシンアルファ１、ｔｏｌｌ様受容体阻害剤、腫瘍壊死因子（ＴＮＦα）、腫瘍壊死因子αアンタゴニスト、ウリカーゼ、血管作用性腸ペプチド、バソプレッシン、バソプレッシン類似体、ＶＥＧＦアンタゴニスト、フォンビルブラント因子からなる群から選択される、項目１０または１１に記載の核酸分子。

１３．項目１～１２のいずれか一項に記載の核酸分子を含むか、または項目１～１２のいずれか一項に記載の核酸分子を含むベクターで形質転換された宿主。

１４．項目１～１２のいずれか一項に記載の核酸分子によりコードされるポリペプチドを調製するための方法であって、項目１３に記載の宿主を培養／成長させること；および任意選択で、産生されたポリペプチドを単離することを含む方法。

１５．薬物コンジュゲートを調製するための方法であって、前記薬物コンジュゲートが、項目１～１２のいずれか一項に記載の核酸分子によりコードされるポリペプチドを含み、（ｉ）生理活性タンパク質および／または（ｉｉ）低分子および／または（ｉｉｉ）炭水化物をさらに含む、方法。

本発明は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする低反復性ヌクレオチド配列を有する核酸分子に関する。そのようなポリペプチドは、本明細書では、ＰＡリッチまたはプロリン／アラニンリッチポリペプチドとも称される。本明細書で提供される本発明の核酸分子は、１ヌクレオチド反復配列当たり約１４、１５、１６、または１７ヌクレオチドの最大長等の、ある最大長のヌクレオチド反復をほとんど有していないかまたは有していない。さらに、ＰＡリッチコードヌクレオチド配列は、少なくとも３００ヌクレオチドの全長を有し、このコード配列内の個々のヌクレオチド反復は、１４、１５、１６、１７、約２０、約２５、約３０、約３５、約４０、約４５、約５０、または約５５ヌクレオチドの個々の最長長を有する。

１つの態様では、本発明の核酸分子は、反復性アミノ酸配列（例えば、ＰＡリッチポリペプチド）をコードするヌクレオチド配列を含み、前記核酸分子の前記ヌクレオチド配列は、少なくとも３００ヌクレオチドの長さを有し、前記ヌクレオチド配列は、５０，０００未満のヌクレオチド反復スコア（ＮＲＳ）を有し、前記ヌクレオチド反復スコア（ＮＲＳ）は、数式：

により決定される。

この数式中、Ｎ_ｔｏｔは、前記ヌクレオチド配列の長さであり、ｎは、前記ヌクレオチド配列内の反復の長さであり、ｆ_ｉ（ｎ）は、前記長さｎの反復の頻度であり、１つよりも多くの長さｎの反復が存在する場合、ｋ（ｎ）は、前記長さｎの反復の前記異なる配列の数であり、そうでなければ、前記長さｎの反復のｋ（ｎ）は、１である。定義は以下の通りである。

ある特定の態様では、本発明の核酸分子は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードしており、前記核酸分子のヌクレオチド配列内に繰り返して出現するヌクレオチド配列伸長（すなわち、「反復」）は、最大で、１４、１５、１６、１７、約２０、約２５、約３０、約３５、約４０、約４５、約５０、または約５５ヌクレオチドの長さを有する。言い換えれば、核酸分子は、ＰＡリッチポリペプチドをコードするヌクレオチド配列を含み、前記コードヌクレオチド配列は、１４、１５、１６、１７、約２０、約２５、約３０、約３５、約４０、約４５、約５０、または約５５ヌクレオチドの最大長を有するヌクレオチド反復を含む。また、本発明の核酸分子／配列は、特に生理活性または薬理活性タンパク質のような、追加のコード配列を含んでもよい。

添付の例では、本発明の低反復性核酸分子は、従来技術の高度に反復性の核酸分子と比較して有利であることが実証されている。特に、本明細書で提供される低反復性核酸分子の遺伝子安定性は、本明細書に記載されているように、および添付の例に示されているように向上されている。ＰＡリッチポリペプチドをコードする従来技術の反復性核酸分子の遺伝子安定性を評価するために、国際公開第２００８／１５５１３４号パンフレットに開示されている複数の６０量体ヌクレオチド配列ユニットで構成されている反復性プロリン／アラニンリッチ配列をコードする従来技術の反復性核酸分子（ＰＡＳ＃１ａ（６００）、配列番号１２、実施例６、図２Ｂ）を含むベクターを構築した。このベクターは、本明細書では、「ｐＡＳＫ７５－ＰＡＳ＃１ａ（６００）－ＩＬ１Ｒａ」（配列番号５１）と称される。宿主（大腸菌（E. coli））を、このベクターで形質転換し、数日間、例えば７日間培養した。７日目、およそ７０世代にわたって連続的に増殖させた後、細胞をＬＢ／Ａｍｐ寒天にプレーティングし、クローンをピッキングし、プラスミド調製を実施した。プラスミドは、制限酵素を使用し、その後アガロースゲル電気泳動法を使用して分析した（図５）。ｐＡＳＫ７５－ＰＡＳ＃１ａ（６００）－ＩＬ１Ｒａの５つの分析したクローンのうちの４つは、プロリン／アラニンリッチ配列をコードする短縮核酸断片を示した（図５、レーン１～５）。

したがって、反復性プロリン／アラニンリッチ配列をコードする従来技術の反復性核酸分子は、遺伝子的に不安定である。言い換えれば、従来技術の核酸分子は、低ｉｎｖｉｖｏ安定性を有する。理論により束縛されないが、遺伝子不安定性は、相同組換えの結果であり得る。遺伝子不安定性および遺伝子カセットの短縮化により、その結果生じるプロリン／アラニンリッチアミノ酸配列も変更されることになる。したがって、長期培養中の不安定なプラスミドによりコードされたプロリン／アラニンリッチアミノ酸配列は、元のプラスミドによりコードされたものとは異なるものになるだろう。したがって、従来技術の反復性核酸分子を使用して長期培養中に得られるポリペプチドが所望のポリペプチドでなくなってしまうというリスクは、かなり高い。

さらに、その結果生じるポリペプチド組成物が、様々な異なるポリペプチド（例えば、種々のサイズ、長さ、および／または配列のプロリン／アラニンリッチポリペプチド）を含み得るというリスクが存在する。これは、特に生物学的製品に使用するための生物学的産物に求められる画一性に反する。したがって、プロリン／アラニンリッチポリペプチドをコードする従来技術の反復性核酸分子の遺伝子不安定性は、生物学的最終産物の品質低下に結び付き、特に治療応用の規制面で、その産生を不都合で信頼性の低いものにする場合がある。

本発明では、遺伝子不安定性の問題は、低内部ヌクレオチド反復を有する核酸分子を設計することにより解決される。しかしながら、プロリン／アラニンリッチアミノ酸配列をコードするために利用可能なヌクレオチドトリプレットコドンの数が少ないことを考慮すると、これはささいな課題ではない。

添付の非限定的な例に示されているように、本発明の核酸分子は、上述の欠点を回避する。例えば、実施例５および６、ならびに図４および図５レーン６～１０を参照されたい。それにも関わらず、本発明の核酸分子は、従来技術の核酸分子のように、複数のプロリン／アラニンリッチ反復を含むプロリン／アラニンリッチポリペプチドをコードする。しかしながら、従来技術の核酸分子とは非常に対照的に、本発明の核酸分子は、低反復性ヌクレオチド配列を有する（すなわち、少数のおよび／または短いヌクレオチド反復しか含まない）。

例示的な実施例５は、プロリン／アラニンリッチポリペプチドをコードする低反復性ヌクレオチド配列を含む、本発明の例示的なベクターの調製を示している。例示的なベクターで使用されている「ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）」と称する低反復性ヌクレオチド配列は、配列番号３８に示されている。その結果生じたプラスミドを、「ｐＡＳＫ７５－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａ」（配列番号５０）と命名した。それは、図４に示されている。

本発明のプラスミド「ｐＡＳＫ７５－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａ」を、ベクター「ｐＡＳＫ７５－ＰＡＳ＃１ａ（６００）－ＩＬ１Ｒａ」に関して上述されている同じ培養に供した。後者のベクターは、国際公開第２００８／１５５１３４号パンフレットに開示されている複数の６０量体ヌクレオチド配列ユニットで構成されている反復性プロリン／アラニンリッチ配列（ＰＡＳ＃１ａ（６００）；配列番号１２）をコードする従来技術の反復性核酸分子を含む（図１Ａ）。「ｐＡＳＫ７５－ＰＡＳ＃１ａ（６００）－ＩＬ１Ｒａ」とは対照的に、本発明のプラスミド「ｐＡＳＫ７５－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａ」は、高い遺伝子安定性を示した。「ｐＡＳＫ７５－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）」の全ての分析したクローンのみが、３０９３ｂｐおよび２３７７ｂｐに予想通りのバンドを示した（図５、レーン６～１０）。これは、１８００塩基対を含み、プロリン／アラニンリッチ配列ＰＡＳ＃１をコードする低反復性ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）遺伝子カセットの高い遺伝子安定性を示す。この高い遺伝子安定性により、従来技術の核酸分子の欠点が回避される。これは、低反復性ヌクレオチド配列を含む本発明の核酸分子が、プロリン／アラニンリッチポリペプチドおよび／または対応する融合タンパク質の便利で信頼性の高い生合成に有用であることを明らかに示す。

例示的な実施例４は、本発明により提供される核酸分子のさらなる利点を示している。ここでは、本発明の低反復性ヌクレオチド配列を含む例示的な核酸分子（ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）カセットと称される；配列番号３８；例えば、実施例１を参照）を、自動ＤＮＡ配列決定に供した。その結果、９００個よりも多くの塩基対を含む、明確に画定されたエラーフリー電気泳動図（図３）が得られた。これは、非特異的プライマー結合の徴候を示していなかった。したがって、対応するクローニングされた遺伝子カセットの上流または下流にハイブリダイズするプライマーでしか信頼性の高い配列決定ができない反復性ヌクレオチド配列とは対照的に、プロリン／アラニンリッチ配列をコードする長い低反復性ＤＮＡ断片は、容易な様式で完全に配列決定することができる。この場合、内部に結合するプライマーを適用し、したがって、必要に応じて複数のオーバーラップ配列リードを生成することもできる。特筆すべきことに、そのような内部にハイブリダイズするプライマーを使用すると、反復性ヌクレオチド配列の場合に特有な配列決定パターンに帰結しない。したがって、低反復性ヌクレオチド配列を含む本発明の核酸分子は、これらの配列決定問題を回避する。

要約すると、本発明は、特に、高度に反復性の配列を含む従来技術の核酸分子に対して、以下の利点を有する。本発明の有利な低反復性ヌクレオチド配列は、従来技術の核酸分子とは対照的に、さらなる労苦を伴うことなく完全に配列決定することができる。本発明の核酸分子のさらなる利点は、本発明の核酸分子は、反復性が低いため、増幅特性（例えば、ポリメラーゼ連鎖反応ＰＣＲによる）が向上されていることである。さらに、本発明の核酸分子は、繰り返し／反復性配列を含むヌクレオチド配列と比較して、クローニング手順を向上させる。本明細書で提供される核酸分子の特定の利点は、従来技術の高度に反復性の核酸分子と比較して、遺伝子安定性が向上されているということである。これは、プロリン／アラニンリッチポリペプチドおよび／またはそれらの融合タンパク質の信頼性の高い産生を可能にする。

本発明の核酸分子を特徴付ける特徴は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列が、上述の有利な技術的効果を付与する「低反復性ヌクレオチド配列」であることである。添付の実施例には、核酸分子が、本発明による低反復性ヌクレオチド配列を含むか否かを分析するために使用することができる方法が示されている。特に、添付の実施例は、本明細書では「ヌクレオチド反復スコア（ＮＲＳ）」と称されるスコアを提供している。このヌクレオチド反復スコア（ＮＲＳ）は、本明細書では、上記で論じられている数式：

により決定され、式中、Ｎ_ｔｏｔは、前記ヌクレオチド配列の長さであり、ｎは、前記ヌクレオチド配列内の反復の長さであり、ｆ_ｉ（ｎ）は、前記長さｎの反復の頻度であり、１つよりも多くの長さｎの反復が存在する場合、ｋ（ｎ）は、前記長さｎの反復の前記異なる配列の数であり、そうでなければ、前記長さｎの反復のｋ（ｎ）は、１である。このスコアは、下記に詳細に記載されており、添付の例に示されている。

ＮＲＳは、当業者が、本発明で使用するための低反復性ヌクレオチド配列を選択することを可能にする。言い換えれば、ＮＲＳは、ヌクレオチド配列の反復性の度合いを決定するためのツールを提供する。反復を自動的に特定し、ＮＲＳを算出するために、本明細書で提供されるＮＲＳカリキュレータと称するアルゴリズムを使用することができる。

添付の例示的な実施例、例えば実施例１３に示されているように、プロリン／アラニンリッチ配列をコードするいくつかの従来技術の核酸を、実施例１４に記載のＮＲＳカリキュレータを使用して、本発明によるプロリン／アラニンリッチ配列をコードする低反復性核酸と比較した。例えば、以下の従来技術の配列のＮＲＳを決定した：国際公開第２００８／１５５１３４号パンフレットに開示されているＰＡＳ＃１ａ（２００）、国際公開第２０１１１４４７５６号パンフレットに開示されているＰＡ＃１ａ（２００）、米国特許出願公開第２００６０２５２１２０号明細書に開示されている［（ＡＰ）_５］_２０ＡＰＡ、ＧｅｎＢａｎｋ受託番号ＤＱ３９９４１１ａとして公開されている［ＡＡＰＡＰＡＰＡＰ］_１０ＡＳ、ＧｅｎＢａｎｋ受託番号ＮＰ＿８５１８９６として公開されているマカクヘルペスウイルス（macacine herpesvirus）１の大型テグメントタンパク質。加えて、それぞれの長さに対してプロットしたヌクレオチド反復の頻度を示すヒストグラムを、これら従来技術のヌクレオチド配列、およびＰＡＳ＃１ｂ（２００）（配列番号１９）またはＰＡ＃１ｅ／１ｄ／１ｃ／１ｂ（８００）（配列番号４４）等の本発明の低反復性ヌクレオチド配列について決定した（図９）。従来技術のヌクレオチド配列のヒストグラムは、高度に反復性の性質を明らかにした。対照的に、本発明の低反復性ヌクレオチド配列、例えば、ＰＡＳ＃１ｂ（２００）およびＰＡ＃１ｅ／１ｄ／１ｃ／１ｂ（８００）のヒストグラムは、１４ヌクレオチドの最大長を有するほんの少数の反復を示している。例えば、図９Ｆ～Ｉを参照されたい。

従来技術のヌクレオチド配列と本発明のヌクレオチド配列との間の反復性の差異は、それらのヌクレオチド反復スコアを比較すると、さらにより明白になる。本明細書で分析した従来技術の配列は、８００００を超えるＮＲＳを明らかにしている（表２）。対照的に、例示的な本発明のヌクレオチド配列は、低いヌクレオチド反復スコア、例えば３４未満を示している。表１を参照されたい。したがって、本明細書では、本発明のプロリン／アラニンリッチ配列をコードするヌクレオチド配列の反復品質が、従来技術の配列と比較してはるかに高く、ヌクレオチド配列反復は、より少数であり、かつより短いことが、明らかに証明されている。したがって、本発明の核酸分子は、低反復性配列を有する。

上記に示されているように、当業者であれば、核酸分子の反復性の度合いを分析するための、いくつかの選択肢を認識している。添付の例には、本発明の核酸分子および従来技術の核酸分子の反復性が、ドットプロット分析でも分析されたことが示されている。例えば、実施例３を参照されたい。ドットプロット分析は、国際公開第２０１１／１４４７５６号パンフレットに開示されている反復性プロリン／アラニンリッチ配列ＰＡ＃３ａ（配列番号１５；図２Ａ）、国際公開第２００８／１５５１３４号パンフレットに開示されているＰＡＳ＃１（配列番号１１；図２Ｂ）、米国特許出願公開第２００６／０２５２１２０号明細書に開示されているコードされた［（ＡＰ）_５］_ｎ多量体（配列番号１６）、およびＧｅｎＢａｎｋ受託番号ＡＡＰ４１４５４．１として公開されている、マカクヘルペスウイルス（Macacine herpesvirus）１遺伝子の超大型テグメントタンパク質の反復性プロリン／アラニンリッチ領域（配列番号１８；図２Ｃ）をコードする核酸について実施した。添付の実施例では、Ｇｅｎｅｉｏｕｓソフトウェアパッケージバージョン８．１（Ｂｉｏｍａｔｔｅｒｓ、オークランド、ニュージーランド）の「ｄｏｔｔｕｐ」ツールを使用した。このアルゴリズムは、それぞれの配列をそれ自体にアラインし、例えば、１４または１５ヌクレオチドの反復ウィンドウを適用する。従来技術のヌクレオチド配列のドットプロットを、本発明の低反復性ヌクレオチド配列、例えば、ユニットＰＡ＃３ｂ（２００）（配列番号３６）、ＰＡ＃１ｂ（配列番号２８）、または構築された低反復性ヌクレオチド配列ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）（配列番号３８）およびＰＡＳ＃１ｄ／１ｆ／１ｃ／１ｂ（８００）（配列番号３９）のドットプロットと比較した。分析した従来技術の配列は全て、黒色の並行対角線により示されているように、ヌクレオチド配列レベルで高度に反復性の性質を明らかにしたが（図２Ａ～Ｃ）、本発明による例示的なヌクレオチド配列のドットプロットは、それぞれ、６００ヌクレオチド（図２Ａ、Ｃ）、１８００ヌクレオチド、または２４００ヌクレオチド（図２Ｂ）のヌクレオチド配列全体内に、最長長が１４ヌクレオチドの反復（黒色線）が存在しないかまたはほんの少数しか散在していないことを示している。したがって、本明細書では、本明細書で提供されるヌクレオチド配列が、反復を含まないかまたはほんの少数の短い反復しか含まない低反復性ヌクレオチド配列であることが証明されている。

要約すると、添付の例は、本発明の核酸分子が、プロリン／アラニンリッチアミノ酸反復配列をコードしつつ、低反復性ヌクレオチド配列を有することを明らかに示している。本明細書では、本明細書で提供される核酸分子の「低繰り返し性」または「低反復性」は、代替戦略、例えば、本明細書で提供されるヌクレオチド反復スコア、またはドットプロット分析等の当業者に公知の方法により、容易に評価することができることが、さらに示されている。あるいは、当業者であれば、ヌクレオチド配列反復、したがってヌクレオチド配列の反復性の度合いを、手作業で、またはＶｉｓｕａｌＧｅｎｅＤｅｖｅｌｏｐｅｒ（Jung (2011) BMC Bioinformatics 12:340）もしくはＲｅｐｆｉｎｄツール（Betley (2002) Curr Biol 12:1756-1761）等の一般ソフトウェアプログラムの支援を受けてのいずれかで特定することができる。それにより、予期しない有利な特性を有する本発明の核酸分子を、これらの特徴を欠く従来技術の核酸分子と容易に区別することができる。

上述されているように、本発明の低反復性ヌクレオチド配列は、５０，０００未満のＮＲＳを有し得るか、または約１７、約２０、約２５、約３０、約３５、約４０、約４５、約５０、もしくは約５５ヌクレオチドの最大長を有する反復を有し得る。本発明の低反復性ヌクレオチド配列は、少なくとも１００ヌクレオチド、好ましくは少なくとも１５０個の、より好ましくは少なくとも２００個の、さらにより好ましくは少なくとも３００ヌクレオチド、さらにより好ましくは少なくとも３５０ヌクレオチドの、さらにより好ましくは少なくとも６００ヌクレオチドの、さらにより好ましくは少なくとも９００個の、さらにより好ましくは少なくとも１２００個の、さらにより好ましくは少なくとも１５００ヌクレオチドの、または最も好ましくは少なくとも１８００ヌクレオチドの長さを有する。言い換えれば、本発明の核酸分子は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含むかまたはそれからなり、前記核酸のヌクレオチド配列は、少なくとも１００ヌクレオチドの、好ましくは少なくとも１５０個の、より好ましくは少なくとも２００個の、さらにより好ましくは少なくとも３００ヌクレオチドの、さらにより好ましくは少なくとも３５０ヌクレオチドの、さらにより好ましくは少なくとも４００個もしくは５００ヌクレオチド、さらにより好ましくは少なくとも６００ヌクレオチドの、さらにより好ましくは少なくとも７００個もしくは８００ヌクレオチドの、さらにより好ましくは少なくとも９００ヌクレオチドの、さらにより好ましくは少なくとも１０００個もしくは１１００個の、さらにより好ましくは少なくとも１２００ヌクレオチド（例えば、１２０３ヌクレオチド）の、さらにより好ましくは少なくとも１３００個もしくは１４００ヌクレオチドの、さらにより好ましくは少なくとも１５００ヌクレオチドの、さらにより好ましくは少なくとも１６００個もしくは１７００ヌクレオチドの、または最も好ましくは少なくとも１８００ヌクレオチドの長さを有する。

本発明の核酸分子は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含んでもよく、またはそれからなっていてもよく、前記核酸のヌクレオチド配列は、最大で５０００ヌクレオチド、好ましくは最大で４８００ヌクレオチド、３６００ヌクレオチド、または２４００ヌクレオチドの長さを有する。本発明の核酸分子は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含んでもよく、またはそれからなっていてもよく、前記核酸のヌクレオチド配列は、最大で５０００ヌクレオチド、４９００ヌクレオチド、４８００ヌクレオチド、４７００ヌクレオチド、４６００ヌクレオチド、４５００ヌクレオチド、４４００ヌクレオチド、４３００ヌクレオチド、４２００ヌクレオチド、４１００ヌクレオチド、４０００ヌクレオチド、３９００ヌクレオチド、３８００ヌクレオチド、３７００ヌクレオチド、３６００ヌクレオチド、３５００ヌクレオチド、３４００ヌクレオチド、３３００ヌクレオチド、３２００ヌクレオチド、３１００ヌクレオチド、３０００ヌクレオチド、２９００ヌクレオチド、２８００ヌクレオチド、２７００ヌクレオチド、２６００ヌクレオチド、２５００ヌクレオチド、２４００ヌクレオチド、２３００ヌクレオチド、２２００ヌクレオチド、２１００ヌクレオチド、２０００ヌクレオチド、または最大で１９００ヌクレオチドの長さを有する。

特に好ましい態様では、本発明の核酸分子は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含んでもよく、またはそれからなっていてもよく、前記核酸のヌクレオチド配列は、１２００～３６００ヌクレオチドの長さを有する。

さらに、低反復性ヌクレオチド配列は、５０，０００未満、好ましくは４０，０００未満、より好ましくは３０，０００未満、より好ましくは２０，０００未満、より好ましくは１０，０００未満、より好ましくは１０００未満、より好ましくは５００未満、さらにより好ましくは１００未満のヌクレオチド反復スコア（ＮＲＳ）を有する。５０未満、より好ましくは４８未満、より好ましくは４５未満、より好ましくは４３未満、より好ましくは４０未満、より好ましくは３８未満、または最も好ましくは３５未満のヌクレオチド反復スコア（ＮＲＳ）を有する低反復性ヌクレオチド配列が、特に好ましい。言い換えれば、本発明の核酸分子は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、前記ヌクレオチド配列は、５０，０００未満、好ましくは４０，０００未満、より好ましくは３０，０００未満、より好ましくは２０，０００未満、より好ましくは１０，０００未満、より好ましくは１０００未満、より好ましくは５００未満、さらにより好ましくは４００、３００、２００未満、さらにより好ましくは１００未満のヌクレオチド反復スコア（ＮＲＳ）を有する。プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、前記ヌクレオチド配列が、９０、８０、７０、６０未満、より好ましくは５０未満、より好ましくは４８未満のヌクレオチド反復スコア（ＮＲＳ）、より好ましくは４５または４５未満、より好ましくは４３未満、より好ましくは４０未満のＮＲＳスコア、より好ましくは３９、３８、３７、もしくは３６、または３９、３８、３７、もしくは３６未満のＮＲＳスコア、あるいは最も好ましくは３５または３５未満のＮＲＳスコアを有する核酸分子が特に好ましい。プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、前記ヌクレオチド配列が、３４、３２、３１、３０、２９、２８、２７、２６、２５、２４、２３、２２、２１、２０、１９、１８、１７、１６、１５、１４、１３、１２、１１、１０、９、もしくは８のヌクレオチド反復スコア（ＮＲＳ）、または３４、３２、３１、３０、２９、２８、２７、２６、２５、２４、２３、２２、２１、２０、１９、１８、１７、１６、１５、１４、１３、１２、１１、１０、９、もしくは８未満のＮＲＳを有する核酸分子がさらにより特に好ましい。

上記で論じられているように、「ヌクレオチド反復スコア」または「ＮＲＳ」は、以下の数式により決定することができる。

したがって、ＮＲＳは、全ての考え得る反復長にわたって（ｎ＝４からＮ_ｔｏｔ－１まで）、各反復長（ｎ）の二乗の和にその全体頻度の平方根を掛けたものを、分析したヌクレオチド配列の全長（Ｎ_ｔｏｔ）で除算したものと定義される。言い換えれば、ＮＲＳは、前記長さｎの反復の頻度（ｆ_ｉ（ｎ））の和の平方根を掛けた、前記ヌクレオチド配列内の反復の長さの二乗の和であり、１つよりも多くの長さｎの反復が存在する場合、ｋ（ｎ）は、前記長さｎの反復の前記異なる配列の数であり、そうでなければ、前記長さｎの反復のｋ（ｎ）は１であり、前記和は、前記ヌクレオチド配列の全長で除算される。

本明細書で使用される場合、「Ｎ_ｔｏｔ」は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする前記ヌクレオチド配列の全長である。また、長さＮ_ｔｏｔは、前記ヌクレオチド配列のヌクレオチドの数である。したがって、Ｎ_ｔｏｔは、分析されるヌクレオチド配列の全長である。

本明細書で使用される場合、「ｎ」は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする前記ヌクレオチド配列内の反復の長さである。また、長さｎは、前記反復のヌクレオチドの数である。したがって、ｎは、分析されるヌクレオチド配列内の反復の長さである。定義では、最も長い考え得る反復は、分析されるヌクレオチド配列の全長（Ｎ_ｔｏｔ）よりもヌクレオチドが１個分だけ短い、すなわちｎ＝Ｎ_ｔｏｔ－１の長さを有していてもよい。その一方で、ＮＲＳ分析のために考慮される反復の最も短い長さは、ｎ＝４であり、これは、アミノ酸の単一トリプレットコドンよりも長いヌクレオチドの最短伸長に相当する。そのようなコドンは、単にコードされるアミノ酸配列の結果として複数回出現するに過ぎないため、解決しようとする技術的課題に関するヌクレオチド配列反復とみなされるべきではない。

用語「反復」は、本明細書で使用される場合、ヌクレオチド配列が、１回を超える、長さｎのヌクレオチドの同一連続配列（すなわち、反復）を含むことを意味する。言い換えれば、ヌクレオチド配列は、少なくとも２つのまたは複数のコピーの、ある長さのヌクレオチドの連続部分／伸長／配列を含む。言い換えれば、用語「反復」は、ヌクレオチド配列中に１回よりも多く存在する、長さｎのヌクレオチドの配列を指す。本明細書では、分析されるヌクレオチド配列の全長内に、１つのタイプの長さｎの反復しか存在しなくてもよく、または同じ長さｎの１つよりも多くの異なる反復が存在していてもよいことが企図される。したがって、ヌクレオチド配列は、例えば、その出現が全て同じ配列を有する、長さｎの反復を有していてもよく、前記反復は、分析されるヌクレオチド配列の全長内に、少なくとも２回出現するが、複数回出現してもよいことが理解される。あるいは、異なる配列を有し、長さｎが同じである反復、すなわち同じ長さ（ｎ）を共有するが、配列レベルでは同一でない反復が存在する。この場合、各々の異なる反復性配列は、別のタイプの反復を構成する。

本明細書で使用される場合、「ｆ_ｉ（ｎ）」は、長さｎの反復の頻度である。言い換えれば、ｆ_ｉ（ｎ）は、長さｎの反復の出現数である。１つのタイプの長さｎの反復しか存在しない場合、ｋ（ｎ）は、１である。あるいは、長さｎの１つよりも多くの異なる反復が存在する場合、ｋ（ｎ）は、前記長さｎの反復の異なる配列の数である。言い換えれば、異なる配列を有する１つより多くの長さｎの反復が存在する場合、ｋ（ｎ）は、前記長さｎの反復の前記異なる配列の数である。したがって、２つまたはそれよりも多くの異なるタイプの長さｎの反復が存在する場合、ｋ（ｎ）は、前記長さｎの反復の前記異なる配列の数である。そうでなければ、長さｎの反復全てが、同じ（すなわち、同一の）配列を有する場合、前記長さｎの反復のｋ（ｎ）は、１である。

例えば、ヌクレオチド配列（長さＮ_ｔｏｔの）内の、１４ヌクレオチド（ｎ＝１４）の長さの反復の頻度は、５であってもよい。これは、１４ヌクレオチドの長さを有する５つの反復が全て同一の配列を有する（同じタイプに属する）、すなわちその反復の配列が、ヌクレオチド配列内に５回出現することを意味し得る。この場合、ｋ（ｎ）は１であり、ｆ_１（ｎ）＝５である。別のシナリオでは、１４ヌクレオチドの長さの５つ反復は、異なる配列を有している場合がある。このシナリオでは、５つの反復のうちの２つが、同一の配列を共有し（１つのタイプを構成する）、５つの反復のうちの３つが、別の同一配列を共有し（第２のタイプを構成する）、それにより１つの配列を共有する前者２つの反復の配列および別の配列を共有する後者３つの反復の配列は互いと異なることが想定される。したがって、このシナリオでは、前記長さｎの異なる配列の数は２であり、すなわち、ｋ（ｎ）は２であり、ｆ_１（ｎ）＝２およびｆ_２（ｎ）＝３である。用語ｆ_ｉ（ｎ）のインデックス「ｉ」は、同じ長さｎを有する一組の異なる反復内の反復のタイプを表すと理解することができる。

ＮＲＳを決定するための数式は、反復の長さの二乗（ｎ^２）の和を含み、式中、ｎは、総和のインデックスであり、４は総和の下限であり、Ｎ_ｔｏｔ－１は総和の上限である。したがって、最小で考慮される反復の長さは、４である。４ヌクレオチドの長さの反復は、１つのアミノ酸コドントリプレットよりも長い全て配列を含む。インデックスｎは、各逐次項毎に１だけ増加され、ｎ＝Ｎ_ｔｏｔ－１のとき中止される。

さらに、ＮＲＳを決定するための数式は、前記長さｎの反復の頻度（ｆ_ｉ（ｎ））の和の平方根を含み、式中、ｉは総和のインデックスであり、ｆ_ｉ（ｎ）は、系列の各逐次項を表すインデックス変数であり、１は総和の下限であり、ｋ（ｎ）は総和の上限である。インデックスｉは、各逐次項毎に１だけ増加され、ｉ＝ｋ（ｎ）のとき中止される。したがって、１つのタイプの長さｎの反復しか存在しない場合、すなわち長さｎの全ての反復が同一の配列を有する場合、前記長さｎの反復のｋ（ｎ）は１であり、ヌクレオチド配列の全長（Ｎ_ｔｏｔ）内の、この長さｎの反復の和ではなく、頻度ｆ_１（ｎ）のみが分析される。

例えば、以下のＮＲＳカリキュレータスクリプトを、本発明に従って使用して、ＮＲＳを決定することができる。

さらに、本発明は、最大長ｎ_ｍａｘを有するヌクレオチド反復を含むヌクレオチド配列にも関し、ｎ_ｍａｘは、数式

により決定され、式中、Ｎ_ｔｏｔは、前記ヌクレオチド配列の全長である。用語「最大長」または「最長長」または「ｎ_ｍａｘ」は、本明細書で使用される場合、前記ヌクレオチド配列または核酸分子内に少なくとも２つのコピーが存在するヌクレオチドの最長連続部分／伸長／配列のヌクレオチドの個数を規定する。言い換えれば、用語「最大長」または「最長長」または「ｎ_ｍａｘ」は、本明細書で使用される場合、本発明による核酸分子のヌクレオチド配列が、この長さよりも長い反復を有していないことを意味する。

添付の例では、本発明の例示的な核酸分子が、例えば１４ヌクレオチドの長さの反復をほんの少数しか含んでいないことが示されている。例えば、添付の実施例２を参照されたい。上記で説明されているように、反復分析は、本明細書で提供されるＮＲＳ分析等の任意の好適なツールを用いて、手作業で、または例えば、ＶｉｓｕａｌＧｅｎｅＤｅｖｅｌｏｐｅｒ（Jung (2011) loc. cit）もしくはＲｅｐｆｉｎｄツール（Betley (2002) loc. cit）を使用したドットプロット分析等の一般ソフトウェアプログラムの支援を受けて実施することができる。ドットプロットは、２つの配列間の類似性の視覚的な提示である。

添付の例では、本明細書で提供されるヌクレオチド配列を、それら自体とアラインした。矩形配置の各軸は、比較されている２つの（全体的に同一の）ヌクレオチド配列の一方を表す。第１の入力配列の全ての位置を、第２の入力配列の全ての位置と比較し、指定されている置換行列を使用してスコア化する。これにより、類似性／同一性の局所領域（ドットプロットの対角線に対応する）が特定されるスコアリングマトリックスが生成される。ユーザが指定する長さの反復ウィンドウ／閾値を、全ての考え得る対角線に沿って移動させる。反復ウィンドウ／閾値の各位置は、スコア行列の対スコアに相当する。ウィンドウ全体のスコアは、その内にある個々の位置のスコアの合計である。ウィンドウスコアが、ユーザが定義する閾値を超える場合、そのウィンドウに対応するドットプロットに線がプロットされる（例えば、ｈｔｔｐ：／／ｅｍｂｏｓｓ．ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔ／ａｐｐｓ／ｃｖｓ／ｅｍｂｏｓｓ／ａｐｐｓ／ｄｏｔｍａｔｃｈｅｒ．ｈｔｍｌを参照）。

添付の例、例えば実施例３では、核酸分子のヌクレオチド配列の反復性を分析するために、ドットプロット分析が使用されている。本発明の核酸分子、例えば、配列番号３６（本明細書ではＰＡ＃３ｂ（２００）と称する）または配列番号２８（本明細書ではＰＡ＃１ｂと称する）が、１４の反復ウィンドウ／閾値を適用した場合、６００ヌクレオチドの長さ全体内にほんの少数の散在性の１４ヌクレオチド反復しか有していないことが証明されている。１４の反復ウィンドウ／閾値を１ヌクレオチドだけ増加させると、すなわち１５ヌクレオチドの反復ウィンドウ／閾値は、分析されるヌクレオチド配列全体内にさらなる反復を明らかにしない（図２および実施例３を参照）。これは、調査した核酸配列全体内の反復の最長長が、１４ヌクレオチドの長さを有する（それよりも短い反復も含む）ことを意味する。一般的に、そのようなヌクレオチド反復は、短ければ短いほど、遺伝子安定性に有害な役割を果たさないと仮定することができる。

しかしながら、従来技術に開示されているプロリン／アラニンリッチ配列をコードする核酸分子は、例えば、添付の実施例（実施例３を参照）で使用されているように１４個または１５ヌクレオチドの反復ウィンドウ／閾値を適用すると、より長いおよび／またはより多くの反復配列を示す。例えば、国際公開第２０１１／１４４７５６号パンフレットに開示されているプロリン／アラニンリッチ配列（配列番号１５；本明細書ではＰＡ＃３ａ（２００）と称する）は、長さ６０の複数のヌクレオチド反復を有する。それらは、連続しており、オーバーラップさえしており、したがって、多数の長い平行線を生じさせる。配列番号１２に示されており、国際公開第２００８／１５５１３４号パンフレットに開示されているＰＡＳ＃１ａ（６００）；配列番号１６に示されており、米国特許出願公開第２００６／０２５２１２０号明細書に開示されている［（ＡＰ）_５］_ｎ多量体；または配列番号１８に示されており、ＧｅｎＢａｎｋエントリーＡＡＰ４１４５４．１において開示されているマカクヘルペスウイルス（Macacine herpesvirus）１の大型テグメントタンパク質等の従来技術に開示されているさらなる核酸分子も、これらヌクレオチド配列の高度に反復性の性質を実証している。

これは、ヌクレオチド配列レベルでの低反復性を示している本発明の核酸分子とは著しく対照的である。例えば、従来技術の配列ＰＡ＃３ａ（２００）（配列番号１５）の反復の数を、１４ヌクレオチドの反復ウィンドウ／閾値を使用して、本発明の低反復性ヌクレオチド配列ＰＡ＃３ｂ（２００）（配列番号３６）の反復の数と比較すると、従来技術の配列の１００個を超える多く反復に対して（６００ヌクレオチド残基当たり）、本発明の配列は、２９個の反復（６００ヌクレオチド残基当たり）を有することを観察することができる。１５ヌクレオチドのウィンドウを適用すると、本発明の例示的な分析された核酸分子またはヌクレオチド配列は、一切の反復を含まない。対照的に、従来技術の核酸分子では、１５個またはそれを超えるヌクレオチドの長さを有する多数の反復が明らかになる。添付の例で証明されているように、本発明の核酸分子が、低反復性ヌクレオチド配列を有することを確認するためには、１４～２０個、例えば１４、１５、１６、１７、１８、１９、または２０ヌクレオチドの反復ウィンドウ／閾値が、特に好適である。反復ウィンドウ／閾値の長さは、特定のヌクレオチド配列で特定されることになる反復の数と逆相関すると理解される。例えば、反復ウィンドウ／閾値が「１」である場合、反復の数は、ヌクレオチド配列中にある全てのヌクレオチド残基（Ａ、Ｔ、Ｇ、および／またはＣ）の数と等しい場合がある（ただし、分析される配列に出現する各タイプのヌクレオチドが、少なくとも２つのコピーで存在する）。反復ウィンドウ／閾値の長さが増加すると、分析されるヌクレオチド配列中の反復の数は、配列特異的な様式で減少することになる。したがって、本発明の「低反復性」ヌクレオチド配列も、反復を有していてもよいが、同じパラメータを分析に適用した場合、反復は、従来技術の配列と比較してより短く、より少数である。

したがって、本明細書で提供される核酸分子は、１４、１５、１６、１７、約１８、約１９、約２０、約２１、約２５、約３０、約３５、約４０、約４５、約５０、または約５５ヌクレオチドの最大長の反復を含む。さらに、本明細書で提供される核酸分子は、約１７ヌクレオチドの最大長～約５５ヌクレオチドの最大長の反復を含む。反復の最大長の状況では、用語「約」は、最長反復長が、示されている反復長の＋／－４ヌクレオチドであることを意味する。言い換えれば、この状況では、「約」は、反復の長さが、示されている反復長よりも、４ヌクレオチドだけより長くともよく、または短くともよい範囲を指す。例えば、約５５ヌクレオチドの最大反復長は、５１～５９ヌクレオチドの最大長の反復を含むヌクレオチド配列を指す。さらに、約１７ヌクレオチドの最大反復長は、１３～２１ヌクレオチドの最大長の反復を含むヌクレオチド配列を指す。

さらに、本発明は、５９ヌクレオチド、好ましくは５４ヌクレオチド、より好ましくは５０ヌクレオチド、より好ましくは４８ヌクレオチド、より好ましくは４０ヌクレオチド、より好ましくは３６ヌクレオチド、より好ましくは３５ヌクレオチド、より好ましくは３０ヌクレオチド、より好ましくは２５ヌクレオチド、より好ましくは２４ヌクレオチド、より好ましくは２１ヌクレオチド、より好ましくは２０ヌクレオチド、より好ましくは１９ヌクレオチド、より好ましくは１８ヌクレオチド、より好ましくは１６ヌクレオチド、より好ましくは１５ヌクレオチド、より好ましくは１４ヌクレオチド、または最も好ましくは１７ヌクレオチドの最大長の反復を含む核酸分子に関する。

本明細書で使用される場合、例えば、１７ヌクレオチドの最大長の反復を含む核酸分子は、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、または１７ヌクレオチドの長さを有する反復配列を含む核酸分子に関する。同様に、１４ヌクレオチドの最大長の反復を含む核酸分子は、最大１４ヌクレオチドの、すなわち、「≦１４ヌクレオチド」または「１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、もしくは１４ヌクレオチド」の反復を含む核酸分子に関する。言い換えれば、１４ヌクレオチドの最大長の反復を含む核酸分子は、１４ヌクレオチドよりも長い、すなわち「＞１４ヌクレオチド」の反復を含んでいない。

本発明は、低反復性核酸分子にさらに関し、低反復性は、反復性アミノ酸配列をコードするより長いヌクレオチド配列内に反復して出現するヌクレオチド配列伸長が、その繰り返しアミノ酸配列伸長をコードするヌクレオチド配列の長さの、最大で０．０５％、好ましくは０．１％、より好ましくは０．５％、より好ましくは１％、より好ましくは２％、より好ましくは３％、より好ましくは４％、より好ましくは５％、より好ましくは６％、より好ましくは７％、より好ましくは８％、より好ましくは９％、より好ましくは１０％、より好ましくは１５％、より好ましくは２０％、より好ましくは２５％、より好ましくは３０％、より好ましくは４０％、または最も好ましくは５０％に相当することを意味する。言い換えれば、本発明の核酸は反復を含み、前記反復は、プロリン、アラニン、および任意選択でセリンからなるポリペプチド中のアミノ酸配列反復をコードする前記ヌクレオチド配列の長さの、０．０５％、好ましくは０．１％、より好ましくは０．５％、より好ましくは１％、より好ましくは２％、より好ましくは３％、より好ましくは４％、より好ましくは５％、より好ましくは６％、より好ましくは７％、より好ましくは８％、より好ましくは９％、より好ましくは１０％、より好ましくは１５％、より好ましくは２０％、より好ましくは２５％、より好ましくは３０％、より好ましくは４０％、または最も好ましくは５０％に相当する最大長を有する。

本発明は、ＰＡリッチ配列をコードし、少なくとも３００ヌクレオチド（１００個のアミノ酸残基に相当する）の長さを有する新規で進歩性のあるヌクレオチド配列を提供するだけでなく、本発明は、遺伝子的に安定な配列に結び付き、ならびに／または便利なクローニング、配列決定、および／もしくは増幅を可能にする組換えおよび／または合成核酸分子の選択手段および方法も提供することは明白である。この選択方法は、本明細書で提供されるＮＲＳおよび／または本明細書に記載されている最長反復長に基づく。したがって、本発明は、遺伝子的に安定な核酸分子を選択するための方法であって、前記核酸分子が、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、前記ヌクレオチド配列が、少なくとも３００ヌクレオチドの長さを有し、方法が、５０，０００未満のヌクレオチド反復スコア（ＮＲＳ）を有するヌクレオチド配列を含む核酸分子を選択するステップを含み、前記ヌクレオチド反復スコア（ＮＲＳ）が、本明細書の上記に提供されている数式により決定される、方法に関する。さらに、本発明は、遺伝子的に安定な核酸分子を選択するための方法であって、前記核酸分子が、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、方法が、ｎ_ｍａｘの最大長を有する反復を含む前記ヌクレオチド配列を選択するステップを含む方法に関する。さらに、本発明は、遺伝子的に安定な核酸分子を選択するための方法であって、前記核酸分子が、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、方法が、約１７ヌクレオチドの最大長～約５５ヌクレオチドの最大長の反復を含む前記ヌクレオチド配列を選択するステップを含む方法に関する。ＰＡリッチ配列をコードする本発明の核酸の状況における、本明細書の上記で提供されているＮＲＳ数式および低反復性ヌクレオチド配列の実施形態およびパラメータは、必要な変更を加えれば、本明細書で提供および例示されている、ＰＡリッチ配列をコードする遺伝子的に安定な核酸分子の選択方法、ならびにさらなる実施形態に当てはまる。

本明細書では、驚くべきことに、本発明の核酸分子が、増強されたｉｎｖｉｖｏ安定性を有することが見出され、実証された。添付の実例、例えば実施例６に示されているように、本明細書で提供される核酸分子は、より反復性のヌクレオチド配列を含む核酸分子よりも安定している。実施例６では、ヌクレオチド配列の反復性が異なる、プロリン、アラニン、およびセリンからなるポリペプチドをコードする核酸分子が比較されている。例えば、配列番号５０に示されているような、本明細書で提供される低反復性ヌクレオチド配列を含む本発明の核酸分子（図２Ｂも参照）は、従来技術で示されているもの、例えば、配列番号５１等の、高度に反復性のヌクレオチド配列と比較して、より高い遺伝子安定性を有する。したがって、用語「ｉｎｖｉｖｏ安定性」は、本明細書で使用される場合、特に「遺伝子安定性」を指す。用語「遺伝子安定性」は、本明細書で使用される場合、核酸が、宿主細胞内で安定的に維持され、配列が、例えば、突然変異、挿入、または欠失により、遺伝子的に修飾されないことを意味する。本明細書で使用される場合、突然変異は、ヌクレオチド配列の変化、例えば、置換、欠失、挿入、または延長を指す。高度に反復性のヌクレオチド配列を含む核酸分子は、欠失または短縮を受けやすいことが、添付の例に示されている。例えば、実施例６を参照されたい。したがって、高度に反復性のヌクレオチド配列／反復性の遺伝子カセットを含む核酸分子は、遺伝子安定性が劣っており、それは、例えば、細胞分裂中の組換え事象に起因する場合がある。本明細書で定義されているパラメータＮＲＳまたはｎ_ｍａｘは、従来技術に由来するもの等の、高い値のＮＲＳおよび／またはｎ_ｍａｘを有する高度に反復性のヌクレオチド配列を、低い値のＮＲＳおよび／またはｎ_ｍａｘを有する本発明の低反復性ヌクレオチド配列と区別するための客観的手段を提供する。

本明細書で提供される核酸分子は、反復性アミノ酸配列を含むポリペプチドをコードする。特筆すべきことには、コードされた反復性アミノ酸配列は、融合タンパク質の一部／断片であってもよい。例えば、本明細書で開示されている核酸分子は、プロリン／アラニンリッチ反復、例えば、プロリン、アラニン、および任意選択でセリンからなる反復からなるポリペプチドをコードしていてもよい。プロリン／アラニンリッチポリペプチドは、ランダムコイルを形成する場合がある。ある特定の態様では、本明細書で開示されている核酸分子は、プロリン、アラニン、およびセリンからなるポリペプチドをコードし、上記ポリペプチドは、ランダムコイルを形成する。ある特定の態様では、本明細書で開示されている核酸分子は、プロリンおよびアラニンからなるポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。

特に、ヌクレオチド配列は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする。このコードされたポリペプチドは、ランダムコイルを形成する。ヌクレオチド配列は、本明細書で提供される核酸分子に含まれる。したがって、ある特定の態様では、本明細書で開示されている核酸分子は、反復性アミノ酸配列を含み、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。ある特定の態様では、本明細書で開示されている核酸分子は、反復性アミノ酸配列を含み、プロリン、アラニン、およびセリンからなるポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。ある特定の態様では、本明細書で開示されている核酸分子は、反復性アミノ酸配列を含み、プロリンおよびアラニンからなるポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。

本明細書で使用される場合、用語「ランダムコイル」は、アミノ酸ポリマー、特にＬアミノ酸で作られているポリペプチドを含むポリマー分子の任意のコンフォメーションに関し、前記ポリマー構造を形成する個々の単量体要素が、化学的に連結したまま、１つまたは複数の隣接単量体要素に対して本質的にランダムに配向されている。特に、「ランダムコイルコンフォメーション」を取る／有する／形成する、コードされたポリペプチドまたはアミノ酸ポリマーは、明確な二次および三次構造を実質的に欠く。コードされたポリペプチドランダムコイルの性質、およびそれらを実験的に特定するための方法は、当業者に公知であり、科学文献（Cantor (1980) Biophysical Chemistry, 2nd ed., W. H. Freeman and Company, New York；Creighton (1993) Proteins - Structures and Molecular Properties, 2nd ed., W. H. Freeman and Company, New York；Smith (1996) Fold. Des. 1:R95-R106）、ならびに特許文献、例えば国際公開第２０１１／１４４７５６号パンフレットおよび国際公開第２００８／１５５１３４号パンフレットに記載されている。

本発明のコードされたランダムコイルポリペプチドは、例えば、水溶液中でおよび／または生理学的条件で、ランダムコイルコンフォメーションを取る／形成する。用語「生理学的条件」は、当技術分野で公知であり、タンパク質が、通常それらの天然折り畳みコンフォメーションを取る条件に関する。より詳しくは、用語「生理学的条件」は、典型的には、高等生物、特に哺乳動物、最も好ましくはヒトに有効であるような環境的生物物理学的パラメータに関する。用語「生理学的条件」は、哺乳動物、特にヒトの体内に、特に体液中に通常見出されるような生化学的および生物物理学的パラメータに関する場合がある。前記「生理学的条件」は、健常体内に見出される対応するパラメータ、ならびに疾患状態下でまたはヒト患者に見出されるパラメータに関する場合がある。例えば、哺乳動物またはヒトが発熱を患っている場合、前記病気の哺乳動物または前記ヒト患者は、より高温であるものの「生理学的な」体温（すなわち、温度条件）を有する場合がある。タンパク質がそれらの天然コンフォメーション／状態を取る「生理学的条件」に関して、最も重要なパラメータは、温度（健常ヒト体内では、３７℃）、ｐＨ（ヒト血液では、７．３５～７．４５）、浸透圧モル濃度（２８０～３００ｍｍｏｌ／ｋｇＨ_２Ｏ）、および必要に応じて、一般的タンパク質含有量（６６～８５ｇ／ｌ血清）である。

しかしながら、当業者であれば、生理学的条件では、これらパラメータは様々であり得、例えば、温度、ｐＨ、浸透圧モル濃度、およびタンパク質含有量は、所与の体内、または血液、脳脊髄液、腹水、およびリンパ液等の組織液で異なっている場合があることを認識している（Klinke (2005) Physiologie, 4th edition., Georg Thieme Verlag, Stuttgart）。例えば、脳脊髄液では、浸透圧モル濃度は、２９０ｍｍｏｌ／ｋｇＨ_２Ｏ付近であってもよく、タンパク濃度は、０．１５ｇ／ｌ～０．４５ｇ／ｌであってもよく、リンパ液のｐＨは、７．４付近であってもよく、タンパク質含有量は、３ｇ／ｌ～５ｇ／ｌであってもよい。コードされたポリペプチド／アミノ酸配列が、実験条件下でランダムコイルコンフォメーションを形成するか／取るか否かを決定する場合、温度、ｐＨ、浸透圧モル濃度、およびタンパク質含有量等の生物物理学的パラメータは、ｉｎｖｉｖｏで通常見出される生理学的条件とは異なっていてもよい。１℃～４２℃または好ましくは４℃～２５℃の温度を、ｉｎｖｉｔｒｏの生理学的条件下でタンパク質の生物物理学的特性および生理活性を試験および／または検証するために有用であるとみなすことができる。

ｉｎｖｉｔｒｏ、特に実験の設定では、例えば、当業者がタンパク質／アミノ酸配列の構造特性を決定することを可能にするＣＤ測定または他の方法の状況では、医薬組成物用の溶媒および／または賦形剤を含んでもよいいくつかの緩衝液が、「生理学的溶液」／「生理学的条件」であるとみなされる。そのような緩衝液の例は、例えば、リン酸緩衝生理食塩水（ＰＢＳ、例えば：１１５ｍＭＮａＣｌ、４ｍＭＫＨ_２ＰＯ_４、１６ｍＭＮａ_２ＨＰＯ_４ｐＨ７．４）、Ｔｒｉｓ緩衝液、酢酸緩衝液、クエン酸緩衝液、または類似の緩衝液である。一般的に、「生理学的溶液条件」を表す緩衝液のｐＨは、６．５から８．５までの範囲、好ましくは７．０から８．０までの範囲、最も好ましくは７．２から７．７までの範囲に入るべきであり、浸透圧モル濃度は、１０から１０００ｍｍｏｌ／ｋｇＨ_２Ｏまでの範囲、より好ましくは５０から５００ｍｍｏｌ／ｋｇＨ_２Ｏまでの範囲、および最も好ましくは２００から３５０ｍｍｏｌ／ｋｇＨ_２Ｏまでの範囲に入るべきである。任意選択で、生理学的溶液のタンパク質含有量は、ランダムコイルコンフォメーションを取る調査対象のタンパク質自体を除き、０から１００ｇ／ｌまでの範囲に入っていてもよく、さらに、典型的な安定化タンパク質、例えば、ヒトまたはウシ血清アルブミンが存在してもよい。

本発明の核酸分子によりコードされるポリペプチドは、生理学的条件下でランダムコイルコンフォメーションを形成するだけでなく、より一般的には、水溶液中でもランダムコイルコンフォメーションを形成する。例えば、国際公開第２０１１／１４４７５６号パンフレットを参照されたい。用語「水溶液」は、当技術分野で周知である。「水溶液」は、少なくとも約２０％の、少なくとも約３０％の、少なくとも約４０％の、少なくとも約５０％の、少なくとも約６０％の、少なくとも約７０％の、少なくとも約８０％の、または少なくとも約９０％のＨ_２Ｏ（重量／重量）の水（Ｈ_２Ｏ）含有量を有する溶液であってもよい。したがって、本発明で提供されるコードされたポリペプチドは、恐らくは他の混和性溶媒を含む水溶液中で、または広範囲の温度、ｐＨ値、浸透圧モル濃度、もしくはタンパク質含有量を有する水性分散液中でランダムコイルコンフォメーションを形成することができる。これは、医学的療法またはｉｎｖｉｖｏ診断以外の、例えば、化粧品、栄養、または食品技術における、ランダムコイルポリペプチドの応用に特に関連する。

また、本発明の状況では、コードされたポリペプチドのランダムコイルコンフォメーションは、液体医薬品／生物学的製剤または凍結乾燥医薬組成物のような医薬組成物中で維持されることが想定される。これは、特にランダムコイルポリペプチドを含む、本明細書で提供されるコードされた生理活性タンパク質または薬物コンジュゲートの状況では特に重要である。好ましくは、「生理学的条件」は、対応する緩衝液系、溶媒、および／または賦形剤に使用されることになる。しかしながら、例えば、凍結乾燥または乾燥させた組成物（例えば、医薬組成物／生物学的製剤のような）では、本明細書で提供されるコードされたランダムコイルポリペプチドのランダムコイルコンフォメーションは、一時的に存在していなくてもよく、および／または検出することができないことが想定される。しかしながら、前記コードされたランダムコイルポリペプチドは、対応する緩衝液／溶液／賦形剤／溶媒に再構成した後、または患者もしくは動物の体に投与された後で、そのランダムコイルを再び取る／形成することになる。

本発明のある特定の態様では、本明細書で開示されている核酸分子は、プロリン、アラニン、および任意選択でセリンから（主にまたは排他的に）なるポリペプチドをコードし、９個以下の連続アミノ酸残基が同一である。そのようなコードされたポリペプチドは、ランダムコイルを形成する。ある特定の態様では、ランダムコイルコンフォメーションを取るコードされたアミノ酸配列／ポリペプチドは、複数のアミノ酸反復を含んでもよく、前記「アミノ酸反復」は、プロリン、アラニン、および任意選択でセリンアミノ酸残基から主にまたは排他的になり、９個以下の連続アミノ酸残基が同一である。ある特定の態様では、ランダムコイルコンフォメーションを取るコードされたアミノ酸配列／ポリペプチド（本明細書で定義されるランダムコイルポリペプチド）は、複数のアミノ酸反復を含んでもよく、前記「アミノ酸反復」は、プロリン、アラニン、およびセリンアミノ酸残基から主にまたは排他的になり、９個以下の連続アミノ酸残基が同一である。ある特定の態様では、ランダムコイルコンフォメーションを取るコードされたアミノ酸配列／ポリペプチドは、複数のアミノ酸反復を含んでもよく、前記「アミノ酸反復」は、プロリンおよびアラニンアミノ酸残基から主にまたは排他的になり、９個以下の連続アミノ酸残基が同一である。

好ましい態様では、本明細書で開示されている核酸分子は、８個以下の連続アミノ酸残基が同一である複数のアミノ酸反復を有する反復性アミノ酸配列を含むポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。好ましくは、本明細書で開示されている核酸分子は、７個以下の連続アミノ酸残基が同一である複数のアミノ酸反復を有する反復性アミノ酸配列を含むポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。より好ましくは、本明細書で開示されている核酸分子は、６個以下の連続アミノ酸残基が同一である複数のアミノ酸反復を有する反復性アミノ酸配列を含むポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。特に好ましくは、本明細書で開示されている核酸分子は、５個以下の連続アミノ酸残基が同一である複数のアミノ酸反復を有する反復性アミノ酸配列を含むポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。より特に好ましくは、本明細書で開示されている核酸分子は、４個以下の連続アミノ酸残基が同一である複数のアミノ酸反復を有する反復性アミノ酸配列を含むポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。最も好ましくは、本明細書で開示されている核酸分子は、３個以下の連続アミノ酸残基が同一である複数のアミノ酸反復を有する反復性アミノ酸配列を含むポリペプチドをコードし、前記ポリペプチドは、ランダムコイルを形成する。

プロリン、アラニン、およびセリン残基から排他的になるアミノ酸反復の非限定的な例は、本明細書の下記で提供されている。例えば、配列番号６を参照されたい。プロリンおよびアラニン残基から排他的になるコードされたアミノ酸反復の非限定的な例は、本明細書の下記で提供されている。例えば、配列番号８を参照されたい。コードされたポリペプチドは、同じ配列または異なる配列の複数のコピーを含んでもよい。

本明細書で開示されている核酸分子は、３種類のアミノ酸残基：プロリン（Ｐｒｏ、Ｐ）、アラニン（Ａｌａ、Ａ）、および任意選択でセリン（Ｓｅｒ、Ｓ）から主にまたは排他的になるポリペプチドをコードする。用語「任意選択で」は、本明細書で使用される場合、本発明のコードされたポリペプチドが、プロリン、アラニン、およびセリンから主にもしくは排他的になっているか、またはプロリンおよびアラニンから主にもしくは排他的になっているかのいずれかであることを意味する。３種類のアミノ酸残基：プロリン、アラニン、およびセリンから主にまたは排他的になるコードされたポリペプチドは、本明細書では「ＰＡＳ」ポリペプチドと呼ばれる。２種類のアミノ酸残基：プロリンおよびアラニンから主にまたは排他的になるコードされたポリペプチドは、本明細書では「ＰＡ」ポリペプチドと呼ばれる。プロリンおよびアラニンからなるコードされたポリペプチドの非限定的な例は、配列番号８に示されている。プロリン、アラニン、およびセリンからなるコードされたポリペプチドの非限定的な例は、配列番号６に示されている。用語「主に」は、本明細書で使用される場合、コードされたアミノ酸の好ましくは少なくとも約９０％または少なくとも約９５％が、プロリン、アラニン、および任意選択でセリンであり、そのため、プロリン、アラニン、およびセリンが合わさると、大多数を構成するが、それらだけがアミノ酸残基ではなくともよく、したがって、コードされたアミノ酸配列は、必ずしも１００％がプロリン、アラニン、および任意選択のセリンではないことを意味する。したがって、コードされたポリペプチド／アミノ酸配列は、アミノ酸配列がランダムコイルコンフォメーションを形成する／取る／有する限り、プロリン、アラニン、および任意選択でセリン以外の他のアミノ酸も、微量成分として含んでもよい。そのようなランダムコイルコンフォメーションは、本明細書に記載の手段および方法により、容易に決定することができる。したがって、本発明は、一実施形態では、ランダムコイルポリペプチドをコードし、そのためアミノ酸配列がプロリン、アラニン、および任意選択でセリンから主になる核酸分子に関する。

コードされたポリペプチドがプロリンおよびアラニンからなる場合、前記プロリン残基は、前記コードされたアミノ酸配列の約１０％超および約７５％未満を構成する。したがって、コードされたランダムコイルポリペプチドは、プロリンおよびアラニンから主になり、プロリン残基は、アミノ酸配列の約１０％超および７５％未満を構成する。アラニン残基は、前記アミノ酸配列の残り少なくとも２５％～９０％を構成する。

好ましくは、コードされたアミノ酸配列は、約１０％を超える、好ましくは約１２％を超える、より好ましくは約１４％、１８％、２０％を超える、より好ましくは約２２％、２３％、２４％、または２５％を超える、より好ましくは約２７％、２９％、または３０％を超える、より好ましくは約３２％、３３％、または３４％を超える、および最も好ましくは約３５％を超えるプロリン残基を含む。アミノ酸配列は、好ましくは、約７５％未満、より好ましくは７０％未満、より好ましくは６５％未満、より好ましくは６０％未満、より好ましくは５５％未満、より好ましくは５０％未満のプロリン残基を含み、より低い値が好ましい。さらにより好ましくは、アミノ酸配列は、約４８％、４６％、４４％、４２％未満のプロリン残基を含む。約４１％、４０％、３９％、３８％、３７％、または３６％未満のプロリン残基を含むアミノ酸配列がより好ましく、より低い値が好ましい。約３４％、３２％、または３０％未満を含むアミノ酸配列がより好ましい。約２８％、２６％、または２５％未満を含むアミノ酸配列がより好ましい。より好ましくは、アミノ酸配列は、約３５％未満のプロリン残基を含む。

逆も同様に、アミノ酸配列は、好ましくは約９０％未満、より好ましくは８８％、８６％、８４％、８２％、または８０％未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、アミノ酸配列は、約７９％、７８％、７７％、７６％未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、アミノ酸配列は、約７４％、７２％、または７０％未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、アミノ酸配列は、約６９％、６７％、または６５％未満のアラニン残基を含み、より低い値が好ましい。最も好ましくは、アミノ酸配列は、約７５％未満のアラニン残基を含む。本明細書では、約２５％を超える、好ましくは約３０％を超える、より好ましくは約３５％を超える、より好ましくは約４０％を超える、より好ましくは約４５％を超える、より好ましくは約５０％を超える、より好ましくは約５２％、５４％、５６％、５８％、または５９％を超えるアラニン残基を含むアミノ酸配列も好ましく、より高い値が好ましい。さらにより好ましくは、アミノ酸配列は、約６０％、６１％、６２％、６３％、または６４％を超えるアラニン残基を含む。より好ましくは、アミノ酸配列は、約６６％、６７％、６９％、または７０％を超えるアラニン残基を含む。より好ましくは、アミノ酸配列は、約７２％、７４％、または７５％を超えるアラニン残基を含む。より好ましくは、アミノ酸配列は、約６５％を超えるアラニン残基を含む。

したがって、ランダムコイルポリペプチドは、それぞれ、約２５％または３０％のプロリン残基および約７５％または７０％のアラニン残基からなるアミノ酸配列を含んでもよい。あるいは、ランダムコイルポリペプチドは、約３５％のプロリン残基および約６５％のアラニン残基からなるアミノ酸配列を含んでもよい。本明細書の上記で使用されているような用語「約Ｘ％」は、パーセンテージの簡潔な数に限定されず、それよりも１０％～２０％多いまたは１０％～２０％少ない残基の値も含む。例えば、用語１０％は、それぞれ、１１％または１２％および９％または８％にも関し得る。

コードされたポリペプチドがプロリン、アラニン、およびセリンからなる場合、前記プロリン残基は、前記コードされたアミノ酸配列の約４％超および約４０％未満を構成する。アラニンおよびセリン残基は、前記アミノ酸配列の残りの量を構成する。

好ましくは、コードされたアミノ酸配列は、約４％を超える、好ましくは約６％を超える、より好ましくは約１０％を超える、より好ましくは約１５％を超える、より好ましくは約２０％を超える、より好ましくは約２２％、２３％、または２４％を超える、より好ましくは約２６％、２９％、または３０％を超える、より好ましくは約３１％、３２％、３３％、３４％、または３５％を超える、および最も好ましくは約２５％を超えるプロリン残基を含む。コードされたアミノ酸配列は、好ましくは約４０％未満、より好ましくは３８％、３５％、３０％、２６％未満のプロリン残基を含み、より低い値が好ましい。

コードされたアミノ酸配列は、好ましくは約９５％未満、より好ましくは９０％、８６％、８４％、８２％、または８０％未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、コードされたアミノ酸配列は、約７９％、７８％、７７％、７６％未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、コードされたアミノ酸配列は、約７５％、７３％、７１％、または７０％未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、コードされたアミノ酸配列は、約６９％、６７％、６６％、または６５％未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、コードされたアミノ酸配列は、約６４％、６３％、６２％、または６０％未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、コードされたアミノ酸配列は、約５９％、５７％、５６％、または５５％未満のアラニン残基を含み、より低い値が好ましい。より好ましくは、コードされたアミノ酸配列は、約５４％、５３％、または５１％未満のアラニン残基を含み、より低い値が好ましい。最も好ましくは、コードされたアミノ酸配列は、約５０％未満のアラニン残基を含む。

本明細書では、約１０％を超える、好ましくは約１５％、１７％、１９％、または２０％を超える、より好ましくは約２２％、２４％、または２５％を超える、より好ましくは約２７％、２９％、または３０％を超える、より好ましくは約３２％、３４％、または３５％を超える、より好ましくは約３７％、３９％、または４０％を超える、より好ましくは約４２％、４４％、または４５％を超える、より好ましくは約４６％、４７％、または４９％を超えるアラニン残基を含むコードされたアミノ酸配列も好ましく、より高い値が好ましい。最も好ましくは、コードされたアミノ酸配列は、約５０％を超えるアラニン残基を含む。上記で言及されているように、セリン残基は、前記アミノ酸配列の残りの量を構成する。

したがって、コードされたランダムコイルポリペプチドは、約３５％のプロリン残基、約５０％のアラニン、および１５％のセリン残基からなるアミノ酸配列を含んでもよい。例示的なヌクレオチド配列およびそのコードされたポリペプチドは、表１に見出すことができる。本明細書の上記で使用されているような用語「約Ｘ％」は、パーセンテージの簡潔な数に限定されず、それよりも１０％～２０％多いまたは１０％～２０％少ない残基の値も含む。例えば、用語１０％は、それぞれ、１１％または１２％または９％および８％にも関し得る。

しかしながら、上記で言及されているように、および本明細書の下記でさらに詳述されているように、前記コードされたランダムコイルポリペプチド、および特にアミノ酸配列は、プロリン、アラニン、および任意選択でセリンとは異なる追加のアミノ酸も微量成分として含むことができる。本明細書の上記で既に論じられているように、前記微量成分、すなわちプロリン、アラニン、または任意選択でセリンとは異なるアミノ酸は、本発明のコードされたランダムコイルポリペプチドの約１０％未満または約５％未満を構成していてもよい。

当業者であれば、プロリン、アラニン、および任意選択でセリン以外の他の残基が、前記アミノ酸配列／ポリペプチド（ポリペプチド断片）に微量成分として含まれている場合、コードされたアミノ酸配列／ポリペプチドも、ランダムコイルコンフォメーションを形成することができることを認識する。用語「微量成分」は、本明細書で使用される場合、本発明のコードされたランダムコイルポリペプチド中、最大で５％、または最大で１０％のアミノ酸残基が、プロリン、アラニン、またはセリンとは異なることを意味する。これは、１００個のアミノ酸のうち最大で１０個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよく、好ましくは、最大で８％、すなわち１００個のアミノ酸のうち最大で８個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよく、より好ましくは、最大で６％、すなわち１００個のアミノ酸のうち最大で６個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよく、さらにより好ましくは、最大で５％、すなわち１００個のアミノ酸のうち最大で５個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよく、特に好ましくは、最大で４％、すなわち１００個のアミノ酸のうち最大で４個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよく、より特に好ましくは、最大で３％、すなわち１００個のアミノ酸のうち最大で３個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよく、さらにより特に好ましくは、最大で２％、すなわち１００個のアミノ酸のうち最大で２個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよく、最も好ましくは、最大で１％、すなわちランダムコイルポリペプチドに含まれる１００個のアミノ酸のうち最大で１個が、プロリン、アラニン、および任意選択でセリンと異なっていてもよいことを意味する。プロリン、アラニン、および任意選択でセリンと異なる前記アミノ酸は、翻訳後に修飾されたアミノ酸または非天然アミノ酸を含む、Ａｒｇ、Ａｓｎ、Ａｓｐ、Ｃｙｓ、Ｇｌｎ、Ｇｌｕ、Ｇｌｙ、Ｈｉｓ、Ｉｌｅ、Ｌｅｕ、Ｌｙｓ、Ｍｅｔ、Ｐｈｅ、Ｔｈｒ、Ｔｒｐ、Ｔｙｒ、およびＶａｌからなる群から選択することができる（例えば、Budisa (2004) Angew Chem Int Ed Engl 43: 6426-6463；Young (2010) J Biol Chem 285:11039-11044；Liu (2010) Annu Rev Biochem 79:413-444；Wagner (1983) AngewChem Int Ed Engl 22:816-828；Walsh (2010) Drug Discov Today 15: 773-780を参照）。ある特定の場合では、ＰＡリッチ配列は、微量成分としてＳｅｒも含むことができる。例えば、コードされたランダムコイルポリペプチドが、プロリンおよびアラニンからなる場合、セリンも微量成分とみなすことができる。

一般的に、本明細書では、これら「微量」アミノ酸（プロリン、アラニン、および任意選択でセリン以外の）は、本明細書に記載のコードされたランダムコイルポリペプチド、または融合タンパク質の一部／断片としてのコードされたランダムコイルポリペプチドに存在しないことが好ましい。本発明によると、コードされたランダムコイルポリペプチド／アミノ酸配列は、特に、プロリン、アラニン、および任意選択でセリン残基から排他的になっていてもよい（すなわち、コードされたランダムコイルポリペプチドまたはアミノ酸配列に、他のアミノ酸残基が存在しない）。

本発明の状況では、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸分子、またはプロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列は、少なくとも３００ヌクレオチドからなっていてもよい。しかしながら、本明細書で提供されるヌクレオチド配列の長さは、コードされたポリペプチドがランダムコイルを形成する限り、限定されないことは、当業者であれば明白である。添付の例は、低反復性ヌクレオチド配列を含む、本明細書で提供される核酸分子は、驚くべきことに、それらの長さに関わらず合成することができることを実証している。例えば、約６００ヌクレオチドの長さを有するヌクレオチド配列を合成することができることが、本明細書で証明されている。そのようなヌクレオチド配列は、さらにより長いヌクレオチド配列を構築するために使用することができる。言い換えれば、これらヌクレオチド配列は、本発明の核酸分子に包含されるより長いヌクレオチド配列を組み合わせる／構築するためのユニット／モジュール／構成単位として使用することができる。一実施形態では、単一のヌクレオチド配列ユニット／モジュール／構成単位も、本発明の核酸分子に相当する。

本発明によると、構築されたヌクレオチド配列が、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする限り、同一または非同一のヌクレオチド配列ユニット／モジュール／構成単位を、互いに組み合わせることができる。さらに、本発明によると、反復性アミノ酸配列を有するポリペプチドをコードする構築されたヌクレオチド配列がランダムコイルを形成する限り、同一または非同一のヌクレオチド配列ユニット／モジュール／構成単位を、互いに組み合わせることができる。上記で言及されているように、これらユニット／モジュール／構成単位を使用することにより、低反復性ヌクレオチド配列を含む本明細書で提供される核酸分子を構築することが、特に有利である。少なくとも２４００ヌクレオチドの長さを有する長いヌクレオチド配列を構築することができることが、本明細書で実証されている。本発明のヌクレオチド配列は、互いに、または追加の非同一ヌクレオチド配列と組み合わせることができる。したがって、本明細書で提供される核酸分子は、同一または非同一のヌクレオチド配列から構築することができ、前記ヌクレオチド配列は、低反復性ヌクレオチド配列である。ある特定の態様では、本明細書で提供される核酸分子は、配列番号１９、配列番号２０、配列番号２１、配列番号２２、配列番号２３、配列番号２４、配列番号２５、配列番号２６、配列番号２７、配列番号２８、配列番号２９、配列番号３０、配列番号３１、配列番号３２、配列番号３３、配列番号３４、配列番号３５、配列番号３６、配列番号３７、配列番号８７、配列番号８８、配列番号８９、配列番号９０、配列番号９１、配列番号９２、配列番号９３、配列番号９４、配列番号９５、配列番号９６、配列番号９７、配列番号９８、配列番号９９、配列番号１００、配列番号１０１、配列番号１０２、配列番号１０３、配列番号１０４、配列番号１０５、配列番号１０６、配列番号１０７、配列番号１０８、配列番号１０９、配列番号１１０、配列番号１１１、配列番号１１２、配列番号１１３、配列番号１１４、配列番号１１５、配列番号１１６、配列番号１１７、配列番号１１８、配列番号１１９、配列番号１２０、配列番号１２１、配列番号１２２、配列番号１２３、配列番号１２４、配列番号１２５、配列番号１２６、配列番号１２７、配列番号１２８、配列番号１２９、配列番号１３０、配列番号１３１、配列番号１３２、配列番号１３３、配列番号１３４、配列番号１３５、配列番号１３６、配列番号１３７、配列番号１３８、配列番号１３９、配列番号１４０、配列番号１４１、配列番号１４２、配列番号１４３、配列番号１４４、配列番号１４５、配列番号１４６、配列番号１４７、配列番号１４８、配列番号１４９、配列番号１５０、配列番号１５１、配列番号１５２、配列番号１９２、配列番号１９３、配列番号１９４および配列番号１９５からなる群から選択される少なくとも１つのヌクレオチド配列を含む。これら例示的なヌクレオチド配列を使用して、より長いヌクレオチド配列を構築することができるため、これらヌクレオチド配列を、ユニットまたはモジュールまたは構成単位と称する場合がある。したがって、本明細書では、本発明の核酸分子は、より長いヌクレオチド配列へと構築される複数のこれらのヌクレオチドモジュールまたはヌクレオチド配列を含むことができ、前記より長いヌクレオチド配列それ自体が、本明細書の上記に記載されている低反復性ヌクレオチド配列であることが理解される。当業者であれば、本発明の核酸分子は、所与のヌクレオチド配列モジュールの断片も含み得ることを理解する。言い換えれば、本明細書で提供される核酸分子は、配列番号１９、配列番号２０、配列番号２１、配列番号２２、配列番号２３、配列番号２４、配列番号２５、配列番号２６、配列番号２７、配列番号２８、配列番号２９、配列番号３０、配列番号３１、配列番号３２、配列番号３３、配列番号３４、配列番号３５、配列番号３６、配列番号３７、配列番号８７、配列番号８８、配列番号８９、配列番号９０、配列番号９１、配列番号９２、配列番号９３、配列番号９４、配列番号９５、配列番号９６、配列番号９７、配列番号９８、配列番号９９、配列番号１００、配列番号１０１、配列番号１０２、配列番号１０３、配列番号１０４、配列番号１０５、配列番号１０６、配列番号１０７、配列番号１０８、配列番号１０９、配列番号１１０、配列番号１１１、配列番号１１２、配列番号１１３、配列番号１１４、配列番号１１５、配列番号１１６、配列番号１１７、配列番号１１８、配列番号１１９、配列番号１２０、配列番号１２１、配列番号１２２、配列番号１２３、配列番号１２４、配列番号１２５、配列番号１２６、配列番号１２７、配列番号１２８、配列番号１２９、配列番号１３０、配列番号１３１、配列番号１３２、配列番号１３３、配列番号１３４、配列番号１３５、配列番号１３６、配列番号１３７、配列番号１３８、配列番号１３９、配列番号１４０、配列番号１４１、配列番号１４２、配列番号１４３、配列番号１４４、配列番号１４５、配列番号１４６、配列番号１４７、配列番号１４８、配列番号１４９、配列番号１５０、配列番号１５１、配列番号１５２、配列番号１９２、配列番号１９３、配列番号１９４および配列番号１９５からなる群から選択される少なくとも１つのヌクレオチド配列またはその断片を含むかまたはそれである。

本明細書では、本明細書で提供される低反復性ヌクレオチド配列またはユニットもしくはモジュールもしくは構成単位は、構築されたヌクレオチド配列が、本発明による低反復性ヌクレオチド配列を含む限り、互いに任意の組合せで並び替えまたは組み合わせることができることが理解される。例示的な構築されたヌクレオチド配列は、本明細書の下記に提示されており、例えば、配列番号３８または本明細書ではＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）として表示されており、配列番号３９または本明細書ではＰＡＳ＃１ｄ／１ｆ／１ｃ／１ｂ（８００）として表示されており、配列番号４０または本明細書ではＰＡＳ＃１ｈ／１ｅ／１ｉ（６００）として表示されており、配列番号４１または本明細書ではＰＡＳ＃１ｊ／１ｈ／１ｅ／１ｉ（８００）として表示されており、本明細書ではＰＡ＃１ｄ／１ｃ／１ｂ（６００）として表示されている配列番号４２、配列番号４３または本明細書ではＰＡ＃１ｉ／１ｈ／１ｇ／１ｆ（８００）として表示されており、配列番号４４または本明細書ではＰＡ＃１ｅ／１ｄ／１ｃ／１ｂ（８００）として表示されており、配列番号４５または本明細書ではＰＡ＃１ｉ／１ｈ／１ｇ／１ｆ／１ｅ／１ｄ／１ｃ／１ｂ（１６００）として表示されており、配列番号１５３、配列番号１５４、配列番号１５５、配列番号１５６、配列番号１５７、配列番号１５８、配列番号１５９、配列番号１６０、配列番号１６１、配列番号１６２、配列番号１６３、配列番号１６４、配列番号１６５、配列番号１６６、配列番号１６７、配列番号１６８、配列番号１６９、配列番号１７０、配列番号１７１、配列番号１７２、配列番号１７３；配列番号１７４、配列番号１７５、配列番号１７６、配列番号１７７、配列番号１７８、配列番号１７９、配列番号１８０、配列番号１８１、配列番号１８２、配列番号１８４、配列番号１８５、配列番号１８６、配列番号１８７、配列番号１８８、配列番号１８９、配列番号１９０、および／または配列番号１９１である。

したがって、本明細書で提供される核酸分子は、本発明の好ましい態様では、前記構築されたヌクレオチド配列を有するか、含むか、またはそれである。

添付の例（実施例１を参照）で実証されているように、本発明による長いヌクレオチド配列は、段階的な様式で構築することができる。構築されたヌクレオチド配列は、低反復性を維持する。添付の例には、配列番号３９に示されているか、または本明細書ではＰＡＳ＃１ｄ／１ｆ／１ｃ／１ｂ（８００）として表示されている、２４００ヌクレオチドを含み、８００個のアミノ酸をコードする例示的なヌクレオチド配列の構築方法が示されている。

本明細書では、これら構築されたヌクレオチド配列は、低反復性ヌクレオチド配列であると理解される。例えば、添付の例は、配列番号３９に示されているか、または本明細書ではＰＡＳ＃１ｄ／１ｆ／１ｃ／１ｂ（８００）配列として表示されている例示的なヌクレオチド配列は、１５の反復ウィンドウの場合、２４００ヌクレオチドのヌクレオチド配列全体内に、反復を示さないか、または単一の１４ヌクレオチドの反復しか示さないことを実証している。図２Ｂを参照されたい。比較のため、従来技術に開示されている長いヌクレオチド配列は、本明細書では配列番号１２として示されているＰＡＳ＃１ａ（６００）の場合、例示的に実証されているように、反復性ヌクレオチド配列を含む。したがって、本発明による長い核酸分子は、低反復性ヌクレオチド配列を有しており、したがって、上記で言及されているような繰り返しヌクレオチド伸長に伴う技術的課題を克服する。

核酸分子および関連核酸分子（プロリンおよびアラニンからなるポリペプチドをコードする特定のヌクレオチド配列と少なくとも６６％、例えば少なくとも６６．６％の同一性を有するバリアント、断片、核酸分子のような；または本明細書で提供および規定されている、プロリン、アラニン、およびセリンからなるポリペプチドをコードする特定のヌクレオチド配列と少なくとも５６％、例えば少なくとも５６．６％の同一性を有するバリアント、断片、核酸分子等のような）は、ｉｎｖｉｖｏ／ｖｉｔｒｏ安定性を増加させるランダムコイルコンフォメーションを形成するポリペプチドをコードする低反復性ヌクレオチド配列を含むかまたはそれらである。

核酸分子および関連核酸分子は、ランダムコイルコンフォメーションを形成し、生理活性または薬理活性タンパク質または薬物のｉｎｖｉｖｏ／ｖｉｔｒｏ安定性を増加させるポリペプチドをコードする低反復性ヌクレオチド配列を有するか、含むか、またはそれらである。前記関連核酸分子は、前記核酸分子のバリアントおよび断片を含むかまたはそれらである。前記関連核酸分子は、プロリンおよびアラニンからなるポリペプチドをコードする特定のヌクレオチド配列と、少なくとも６６％、例えば少なくとも６６．６％の同一性を有するか、または本明細書で提供および規定されている、プロリン、アラニン、およびセリンからなるポリペプチドをコードする特定のヌクレオチド配列と、少なくとも５６％、例えば少なくとも５６．６％の同一性を有する等である。

ある特定の態様では、プロリンおよびアラニンからなるポリペプチドをコードするオルソロガスな／相同性の／同一の／類似の（したがって、関連する）ヌクレオチド配列を含む核酸分子は、特に、配列番号２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、４２、４３、４４、４５、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００、１０１、１０２、１０３、１０４、１０５、１０６、１０７、１０８、１０９、１１０、１１１、１１２、１１３、１１４、１１５、１１６、１１７、１１８、１１９、１２０、１２１、１２２、１５３、１５４、１５５、１５６、１５７、１５８、１５９、１６０、１６１、１６２、１６３、１６４、１６５、１６６、１６７、１６８、１６９、１７０、１７１、１７２、１７３、１９２および１９３に示されているヌクレオチド配列と、少なくとも６６％、例えば少なくとも６６．６％相同性／同一である。より好ましくは、プロリンおよびアラニンからなるポリペプチドをコードするオルソロガスな／相同性の／同一の／類似の（したがって、関連する）ヌクレオチド配列を含む核酸分子は、特に、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、４２、４３、４４、４５、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００、１０１、１０２、１０３、１０４、１０５、１０６、１０７、１０８、１０９、１１０、１１１、１１２、１１３、１１４、１１５、１１６、１１７、１１８、１１９、１２０、１２１、１２２、１５３、１５４、１５５、１５６、１５７、１５８、１５９、１６０、１６１、１６２、１６３、１６４、１６５、１６６、１６７、１６８、１６９、１７０、１７１、１７２、１７３、１９２および１９３に示されているヌクレオチド配列と、少なくとも６８％、７０％、７５％、８０％、８５％、９０％、９２％、９３％、９４％、９５％、９６％、９７％、または９８％相同性／同一であり、より高い値が好ましい。最も好ましくは、プロリンおよびアラニンからなるポリペプチドをコードするオルソロガスな／相同性の／同一の／類似の（したがって、関連する）ヌクレオチド配列を含む核酸分子は、特に、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、４２、４３、４４、４５、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００、１０１、１０２、１０３、１０４、１０５、１０６、１０７、１０８、１０９、１１０、１１１、１１２、１１３、１１４、１１５、１１６、１１７、１１８、１１９、１２０、１２１、１２２、１５３、１５４、１５５、１５６、１５７、１５８、１５９、１６０、１６１、１６２、１６３、１６４、１６５、１６６、１６７、１６８、１６９、１７０、１７１、１７２、１７３、１９２および１９３に示されているヌクレオチド配列と、少なくとも９９％相同性であり／同一であり／類似している。

さらなる態様では、プロリン、アラニン、およびセリンからなるポリペプチドをコードするオルソロガスな／相同性の／同一の／類似の（したがって、関連する）ヌクレオチド配列を含む核酸分子は、特に、配列番号１９、２０、２１、２２、２３、２４、２５、２６、２７、３８、３９、４０、４１、１２３、１２４、１２５、１２６、１２７、１２８、１２９、１３０、１３１、１３２、１３３、１３４、１３５、１３６、１３７、１３８、１３９、１４０、１４１、１４２、１４３、１４４、１４５、１４６、１４７、１４８、１４９、１５０、１５１、１５２、１７４、１７５、１７６、１７７、１７８、１７９、１８０、１８１、１８２、１８４、１８５、１８６、１８７、１８８、１８９、１９０、１９１、１９４および１９５に示されているヌクレオチド配列と、少なくとも５６％、例えば少なくとも５６．６％相同性であり／同一であり／類似している。より好ましくは、プロリン、アラニン、およびセリンからなるポリペプチドをコードするオルソロガスな／相同性の／同一の／類似の（したがって、関連する）ヌクレオチド配列を含む核酸分子は、特に、１９、２０、２１、２２、２３、２４、２５、２６、２７、３８３９、４０、４１、１２３、１２４、１２５、１２６、１２７、１２８、１２９、１３０、１３１、１３２、１３３、１３４、１３５、１３６、１３７、１３８、１３９、１４０、１４１、１４２、１４３、１４４、１４５、１４６、１４７、１４８、１４９、１５０、１５１、１５２、１７４、１７５、１７６、１７７、１７８、１７９、１８０、１８１、１８２、１８４、１８５、１８６、１８７、１８８、１８９、１９０、１９１、１９４および１９５に示されているヌクレオチド配列と、少なくとも５８％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、または９８％相同性／同一である。最も好ましくは、プロリン、アラニン、およびセリンからなるポリペプチドをコードするオルソロガスな／相同性の／同一の／類似の（したがって、関連する）ヌクレオチド配列を含む核酸分子は、特に、配列番号１９、２０、２１、２２、２３、２４、２５、２６、２７、３８、３９、４０、４１、１２３、１２４、１２５、１２６、１２７、１２８、１２９、１３０、１３１、１３２、１３３、１３４、１３５、１３６、１３７、１３８、１３９、１４０、１４１、１４２、１４３、１４４、１４５、１４６、１４７、１４８、１４９、１５０、１５１、１５２、１７４、１７５、１７６、１７７、１７８、１７９、１８０、１８１、１８２、１８４、１８５、１８６、１８７、１８８、１８９、１９０、１９１、１９４および１９５に示されているヌクレオチド配列と、少なくとも９９％相同性であり／同一であり／類似している。上記で規定されている関連ヌクレオチド配列も、より長いかまたはより短いアイソフォーム、スプライストバリアント、または融合構築物に包含され得る。

ある特定の態様では、本明細書で提供される核酸分子は、特に、配列番号１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００、１０１、１０２、１０３、１０４、１０５、１０６、１０７、１０８、１０９、１１０、１１１、１１２、１１３、１１４、１１５、１１６、１１７、１１８、１１９、１２０、１２１、１２２、１２３、１２４、１２５、１２６、１２７、１２８、１２９、１３０、１３１、１３２、１３３、１３４、１３５、１３６、１３７、１３８、１３９、１４０、１４１、１４２、１４３、１４４、１４５、１４６、１４７、１４８、１４９、１５０、１５１、１５２、１５３、１５４、１５５、１５６、１５７、１５８、１５９、１６０、１６１、１６２、１６３、１６４、１６５、１６６、１６７、１６８、１６９、１７０、１７１、１７２、１７３、１７４、１７５、１７６、１７７、１７８、１７９、１８０、１８１、１８２、１８４、１８５、１８６、１８７、１８８、１８９、１９０、１９１、１９２、１９３、１９４および１９５に示されているヌクレオチド配列の相補鎖にストリンジェントな条件下でハイブリダイズすることができる。用語「ハイブリダイゼーション」または「ハイブリダイズする」は、本明細書で使用される場合、ストリンジェントなまたは非ストリンジェントな条件下でのハイブリダイゼーションに関していてもよい。さらに指定されない場合、条件は、好ましくはストリンジェントである。前記ハイブリダイゼーション条件は、例えば、Sambrook (2001) Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 3rd ed., New York；Ausubel (1989) Current Protocols in Molecular Biology, Green Publishing Associates and Wiley Interscience, New York、またはHiggins(1985)Nucleic acid hybridization, a practical approach, IRL Press Oxford, Washington DCに記載されている従来のプロトコールに従って確立することができる。好適な条件の設定は、十分に当業者の技術範囲内にあり、当技術分野に記載されているプロトコールにより決定することができる。したがって、特異的にハイブリダイズする配列のみの検出は、通常、例えば、６５℃での０．１×クエン酸ナトリウム生理食塩水緩衝液（ＳＳＣ）、０．１ｗ／ｖ％ＳＤＳ、または６０℃での２×ＳＳＣ、０．１ｗ／ｖ％ＳＤＳ等の、ストリンジェントなハイブリダイゼーションおよび洗浄条件を必要とするだろう。相同性のまたは厳密には相補性ではない配列を検出するための低ストリンジェントなハイブリダイゼーション条件は、例えば、６５℃での６×ＳＣＣ、１ｗ／ｖ％ＳＤＳに設定してもよい。周知のように、核酸プローブの長さ、および決定しようとする核酸の組成は、ハイブリダイゼーション条件のさらなるパラメータを構成する。

本発明によると、２つまたはそれよりも多くのヌクレオチド配列の状況での、用語「相同性」または「相同性パーセント」または「同一」または「同一性パーセント」または「同一性パーセンテージ」または「配列同一性」は、当技術分野で知られている配列比較アルゴリズムを使用して、または手作業によるアラインメントおよび目視検査により測定し、比較のウィンドウにわたって（好ましくは全長にわたって）または指定領域にわたって、最大限に対応するように比較およびアラインした場合に、同じであるか、または同じであるヌクレオチドの指定パーセンテージ（プロリンおよびアラニンからなるポリペプチドをコードする核酸分子の場合は、好ましくは少なくとも６６％、例えば少なくとも６６．６％の同一性、より好ましくは少なくとも６８％、７０％、７５％、８０％、８５％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、もしくは９８％の同一性、最も好ましくは少なくとも９９％の同一性；またはプロリン、アラニン、およびセリンをコードする核酸分子の場合は、好ましくは少なくとも５６％、例えば少なくとも５６．６％の同一性、より好ましくは少なくとも５８％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、もしくは９８％の同一性、最も好ましくは少なくとも９９％の同一性）を有する２つまたはそれよりも多くの配列または部分配列を指す。

例えば、７０％～９０％またはそれを超える配列同一性を有する配列は、実質的に同一または類似しているとみなすことができる。そのような定義は、試験核酸配列の相補体にも当てはまる。好ましくは、記載されている同一性は、長さが少なくとも約１５～２５ヌクレオチドである領域にわたって、より好ましくは長さが少なくとも約５０～１００ヌクレオチドである領域にわたって、より好ましくは長さが少なくとも約１２５～２００ヌクレオチドである領域にわたって、より好ましくは長さが少なくとも約２２５～３００ヌクレオチドである領域にわたって、さらにより好ましくは長さが少なくとも約３２５～６００ヌクレオチドである領域にわたって、さらにより好ましくは長さが少なくとも約６２５～８００ヌクレオチドである領域にわたって、および最も好ましくは長さが少なくとも約８２５～１２００ヌクレオチドである領域にわたって存在する。当業者であれば、例えば、ＣＬＵＳＴＡＬＷコンピュータプログラム（Thompson (1994) Nucl. Acids Res. 2:4673-4680）、ＣＬＵＳＴＡＬＯｍｅｇａ（Sievers (2014) Curr. Protoc. Bioinformatics 48:3.13.1-3.13.16）、またはＦＡＳＴＤＢ（Brutlag (1990) Comp App Biosci 6: 237-245）に基づくもの等のアルゴリズムを使用して、配列間／配列内の同一性パーセントを決定する方法を知っているだろう。ＢａｓｉｃＬｏｃａｌＡｌｉｇｎｍｅｎｔＳｅａｒｃｈＴｏｏｌの略であるＢＬＡＳＴおよびＢＬＡＳＴ２．０アルゴリズムも、当業者であれば利用可能である（Altschul, (1997) Nucl. Acids Res. 25:3389-3402；Altschul (1990) J. Mol. Biol. 215:403-410）。核酸配列用のＢＬＡＳＴＮプログラムは、ワード長（Ｗ）１１、期待値（Ｅ）１０、Ｍ＝５、Ｎ＝４、および両鎖比較を使用する。ＢＬＯＳＵＭ６２スコアリングマトリックス（Henikoff (1992) Proc. Natl. Acad. Sci. U.S.A. 89:10915-10919）は、アラインメント（Ｂ）５０、期待値（Ｅ）１０、Ｍ＝５、Ｎ＝４、および両鎖比較を使用する。

所与のヌクレオチド配列のヌクレオチド残基が、例えば、それぞれ、配列番号１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００、１０１、１０２、１０３、１０４、１０５、１０６、１０７、１０８、１０９、１１０、１１１、１１２、１１３、１１４、１１５、１１６、１１７、１１８、１１９、１２０、１２１、１２２、１２３、１２４、１２５、１２６、１２７、１２８、１２９、１３０、１３１、１３２、１３３、１３４、１３５、１３６、１３７、１３８、１３９、１４０、１４１、１４２、１４３、１４４、１４５、１４６、１４７、１４８、１４９、１５０、１５１、１５２、１５３、１５４、１５５、１５６、１５７、１５８、１５９、１６０、１６１、１６２、１６３、１６４、１６５、１６６、１６７、１６８、１６９、１７０、１７１、１７２、１７３、１７４、１７５、１７６、１７７、１７８、１７９、１８０、１８１、１８２、１８４、１８５、１８６、１８７、１８８、１８９、１９０、１９１、１９２、１９３、１９４および１９５のヌクレオチド配列のある位置に対応するか否かを決定するために、当業者であれば、当技術分野で周知の手段および方法、例えばアラインメントを、手作業で、または本明細書で言及されているもの等のコンピュータプログラムを使用することによってのいずれかで使用することができる。例えば、ＢＬＡＳＴ２．０を使用して、局所的な配列アラインメントを探索することができる。上記で論じられているようなＢＬＡＳＴまたはＢＬＡＳＴ２．０は、ヌクレオチド配列のアラインメントを生成して、配列類似性を決定する。アラインメントの局所的性質のため、ＢＬＡＳＴまたはＢＬＡＳＴ２．０は、完全一致を決定するのに、または類似もしくは同一配列を特定するのに特に有用である。

添付の例に示されているように、本明細書では、前記ヌクレオチド配列を含む長い低反復性ヌクレオチド配列または長い低反復性核酸分子を迅速および容易にクローニングするための手段および方法が提供される。例えば、実施例１、２、５、７、および１０を参照されたい。添付の例に示されているように、本明細書では、本発明のヌクレオチド配列をより長い構築物へと構築するのに特に好適な例示的なベクターが提供される。上記で言及されているように、本明細書で提供される核酸分子またはヌクレオチド配列は、段階的な様式で構築され、長い核酸分子または長いヌクレオチド配列を組み立てることができる。本明細書では、構築された核酸分子もしくはヌクレオチド配列のサイズは限定されないか、またはプラスミドサイズもしくは形質転換／形質移入効率等の実際的な状況により制限されるに過ぎないことが想定される。

プロリン、アラニン、およびセリンの反復性アミノ酸配列をコードする、約２４００ヌクレオチドの長さ（８００個アミノ酸残基の長さを有するポリペプチドをコードする）の低反復性ヌクレオチド配列または核酸分子を含む核酸分子の例示的な構築は、添付の実施例２に示されている。そこでは、最初に、配列番号１９に示されているヌクレオチド配列ユニット（構成単位）ＰＡＳ＃１ｂ（２００）、次に、配列番号２０に示されているヌクレオチド配列ユニットＰＡＳ＃１ｃ（２００）、その後、配列番号２３に示されているヌクレオチド配列ユニットＰＡＳ＃１ｆ（２００）、および最後に、配列番号２１に示されているヌクレオチド配列ユニットＰＡＳ＃１ｄ（２００）を、例示的なｐＸＬ２ベクターにクローニングおよび構築することが示されている。この例示的な構築された核酸分子または構築されたヌクレオチド配列は、本明細書では、ＰＡＳ＃１ｄ／１ｆ／１ｃ／１ｂ（８００）として表示されており、配列番号３９に示されている。加えて、本明細書では、これら構築された本発明の核酸分子は、低反復性ヌクレオチド配列を有するかまたは含むことが証明されている。特に、実施例２には、配列番号３９に示されているこの例示的な構築されたヌクレオチド配列は、１４ヌクレオチドの最大長の反復配列しか有していないことが示されている。

本発明は、本発明の核酸分子を提供するための方法にも関する。例えば、より長いヌクレオチド配列を構築するための例示的な手順を示している図１Ｅを参照されたい。さらに、本発明は、ＰＡリッチポリペプチドをコードする低反復性核酸分子を構築するための特に好適なベクターに関する。

上記によると、本明細書で提供される核酸分子は、プロリンおよびアラニンからなるポリペプチドをコードすることができる。

したがって、本明細書で提供される核酸分子は、
（ａ）配列番号２８、配列番号２９、配列番号３０、配列番号３１、配列番号３２、配列番号３３、配列番号３４、配列番号３５、配列番号３６、配列番号３７、配列番号８７、配列番号８８、配列番号８９、配列番号９０、配列番号９１、配列番号９２、配列番号９３、配列番号９４、配列番号９５、配列番号９６、配列番号９７、配列番号９８、配列番号９９、配列番号１００、配列番号１０１、配列番号１０２、配列番号１０３、配列番号１０４、配列番号１０５、配列番号１０６、配列番号１０７、配列番号１０８、配列番号１０９、配列番号１１０、配列番号１１１、配列番号１１２、配列番号１１３、配列番号１１４、配列番号１１５、配列番号１１６、配列番号１１７、配列番号１１８、配列番号１１９、配列番号１２０、配列番号１２１、配列番号１２２、配列番号１９２および配列番号１９３からなる群から選択される少なくとも１つのヌクレオチド配列を含む核酸分子；
（ｂ）配列番号４２、配列番号４３、配列番号４４、配列番号４５、配列番号１５３、配列番号１５４、配列番号１５５、配列番号１５６、配列番号１５７、配列番号１５８、配列番号１５９、配列番号１６０、配列番号１６１、配列番号１６２、配列番号１６３、配列番号１６４、配列番号１６５、配列番号１６６、配列番号１６７、配列番号１６８、配列番号１６９、配列番号１７０、配列番号１７１、配列番号１７２、および／または配列番号１７３からなるヌクレオチド配列を含む核酸分子；
（ｃ）（ａ）または（ｂ）で規定されるヌクレオチド配列の相補鎖にストリンジェントな条件下でハイブリダイズする核酸分子；
（ｄ）（ａ）、（ｂ）、および（ｃ）のいずれか１つで規定されるヌクレオチド配列と少なくとも６６．７％の同一性を有するヌクレオチド配列を含む核酸分子；ならびに
（ｅ）（ａ）または（ｂ）で規定されるヌクレオチド配列に対する遺伝子コードの結果として縮重している核酸分子
からなる群から選択することができる。

上記によると、本明細書で提供される核酸分子は、プロリン、アラニン、およびセリンからなるポリペプチドをコードすることができる。

したがって、本明細書で提供される核酸分子は、
（ａ）配列番号１９、配列番号２０、配列番号２１、配列番号２２、配列番号２３、配列番号２４、配列番号２５、配列番号２６、配列番号２７、配列番号１２３、配列番号１２４、配列番号１２５、配列番号１２６、配列番号１２７、配列番号１２８、配列番号１２９、配列番号１３０、配列番号１３１、配列番号１３２、配列番号１３３、配列番号１３４、配列番号１３５、配列番号１３６、配列番号１３７、配列番号１３８、配列番号１３９、配列番号１４０、配列番号１４１、配列番号１４２、配列番号１４３、配列番号１４４、配列番号１４５、配列番号１４６、配列番号１４７、配列番号１４８、配列番号１４９、配列番号１５０、配列番号１５１、配列番号１５２；配列番号１９４および配列番号１９５からなる群から選択される少なくとも１つのヌクレオチド配列を含む核酸分子；
（ｂ）配列番号３８、配列番号３９、配列番号４０、配列番号４１、配列番号１７４、配列番号１７５、配列番号１７６、配列番号１７７、配列番号１７８、配列番号１７９、配列番号１８０、配列番号１８１、配列番号１８２、配列番号１８４、配列番号１８５、配列番号１８６、配列番号１８７、配列番号１８８、配列番号１８９、配列番号１９０、および配列番号１９１からなる群から選択されるヌクレオチド配列を含む核酸分子；
（ｃ）（ａ）または（ｂ）で規定されるヌクレオチド配列の相補鎖にストリンジェントな条件下でハイブリダイズする核酸分子；
（ｄ）（ａ）、（ｂ）、および（ｃ）のいずれか１つで規定されるヌクレオチド配列と少なくとも５６％の同一性を有するヌクレオチド配列を含む核酸分子；ならびに
（ｅ）（ａ）または（ｂ）で規定されるヌクレオチド配列に対する遺伝子コードの結果として縮重している核酸分子
からなる群から選択することができる。

ある特定の態様では、本発明は、本発明の低反復性ヌクレオチド配列を含む核酸分子を調製するための方法であって、
（ａ）エンドヌクレアーゼ制限酵素により認識される上流認識配列、およびエンドヌクレアーゼ制限酵素により認識される下流認識配列を含むベクターを準備するステップであり、
任意選択で、前記下流認識配列を認識する前記エンドヌクレアーゼ制限酵素が、上流認識配列を認識するエンドヌクレアーゼ制限酵素とは異なり、
前記上流認識配列および前記下流認識配列が、逆相補的に配向されており、
前記上流認識配列が、２つの異なる制限酵素の２つの認識配列を含み、
前記下流認識配列が、上流認識配列に含まれており、ならびに／または
前記上流認識配列および／もしくは前記下流認識配列が、認識配列の外側を切断する制限酵素の認識部位である、ステップ；
（ｂ）前記上流および／または前記下流認識配列を認識する制限酵素で（ａ）の前記ベクターを切断するステップ；
（ｃ）任意選択で、（ｂ）の前記ベクターを脱リン酸化して、相補性粘着末端のハイブリダイゼーションを防止するステップ；
（ｄ）プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸分子を準備するステップであり、ヌクレオチド配列の末端が、（ｂ）または（ｃ）のベクターの切断末端にハイブリダイズする、ステップ；ならびに
（ｅ）（ｄ）の前記核酸分子を、ＤＮＡリガーゼの存在下で、前記切断されたベクターに挿入するステップを含む方法に関する。

本発明のある特定の態様では、本明細書で提供される方法は、より長い核酸分子を調製するために使用することができ、核酸分子は、構築された低反復性ヌクレオチド配列を含み、上述されている、核酸分子を調製するための方法は、
（ｆ）前記上流または前記下流認識配列のいずれかを認識する制限酵素で（ｅ）の前記ベクターを切断するステップ；
（ｇ）任意選択で、（ｆ）の前記ベクターを脱リン酸化して、相補性粘着末端のハイブリダイゼーションを防止するステップ；
（ｈ）プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸分子を準備するステップであり、ヌクレオチド配列の末端が、（ｆ）または（ｇ）のベクターの切断末端にハイブリダイズする、ステップ；
（ｉ）（ｈ）の前記ヌクレオチド配列を、ＤＮＡリガーゼの存在下で、前記切断されたベクターに挿入するステップ；
（ｊ）ヌクレオチド配列の所望の長さに到達するまで、ステップ（ｆ）～（ｉ）を繰り返すステップをさらに含む。

当業者であれば、ＰＡリッチポリペプチドをコードする構築されたヌクレオチド配列または構築された核酸分子の所望の長さが得られるまで、この方法のステップを反復して繰り返すことができることを理解する。

本明細書で提供される核酸分子を有利にクローニングにするための手段および方法を提供するためには、好適なクローニングベクターは、エンドヌクレアーゼ制限酵素により認識される上流認識配列、およびエンドヌクレアーゼ制限酵素により認識される下流認識配列を含み、任意選択で、前記下流認識配列を認識する前記エンドヌクレアーゼ制限酵素は、前記上流認識配列を認識する前記エンドヌクレアーゼ制限酵素とは異なり、前記上流認識配列および前記下流認識配列は、逆相補的に配向されている。さらに、前記上流認識配列は、２つの異なる制限酵素の２つの認識配列を含んでもよい。さらに、前記下流認識配列は、上流認識配列に含まれていてもよい。したがって、前記下流認識配列は、上流認識配列の１つに含まれていてもよい。添付の実例、特に図１、４、６、および８は、例示的なベクターおよび核酸分子ならびにそれらを準備するための方法を示している。

添付の例では、下流認識配列が上流認識配列に含まれていることが特に有益であることが実証されている。そのような戦略を使用することにより、上流認識部位を使用して、さらなるヌクレオチド配列を、本明細書で提供されるベクターに構築することができる。無論、そのようなベクターの上流および下流制限部位の位置は交換可能である。本発明のヌクレオチド配列が挿入される例示的なクローニング領域は、図１Ｄに示されている。この場合、下流認識配列を認識する制限酵素は、上流認識配列も認識および切断する。したがって、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする本発明のヌクレオチド配列または核酸分子を、下流および上流認識配列を認識する制限酵素を使用することにより、本明細書で提供されるベクターから切り出すことができ、したがって、他の核酸またはベクターとのライゲーションに使用して、例えば、遺伝子発現を可能にするか、または融合タンパク質のコード領域を生成することが可能になる。長い低反復性ヌクレオチド配列の構築を達成するための、このクローニング戦略の例は、本明細書の下記に示されている。例えば、図１Ｅを参照されたい。

ある特定の態様では、第１の突出は、アラニンをコードするヌクレオチドトリプレット／コドンを含んでもよく、それは、特にＧＣＣだが、ＧＣＴ、ＧＣＡ、またはＧＣＧであってもよい。好ましい態様では、本発明の核酸分子は、２つの相補的５’－突出を含む、すなわち、一方の５’－突出はコード鎖にあり、他方の５’－突出は非コード鎖にある。特に好ましい実施形態では、コード鎖にある５’－突出はＧＣＣであり、非コード鎖にある５’－突出はＧＧＣである。

ある特定のさらなる態様では、第１の突出は、プロリンまたはセリンをコードするヌクレオチドトリプレット／コドン、例えば、ＣＣＴ、ＣＣＣ、ＣＣＡ、ＣＣＧ、ＴＣＴ、ＴＣＣ、ＴＣＡ、ＴＣＧ、ＡＧＴ、またはＡＧＣも含んでもよい。しかしながら、当業者であれば、本明細書で提供される核酸分子を調製するための方法は、突出に限定されず、核酸分子またはヌクレオチド配列は、例えば、平滑末端を介してライゲーションすることができることを知っている。本明細書で使用される場合、用語「突出」は、相補体が結合されていない二本鎖ＤＮＡ分子の一部としての核酸鎖の末端部分に関し、粘着末端としても知られている。本明細書で使用される場合、用語「平滑末端」は、突出を有していないＤＮＡ鎖の末端部分に関する。突出の長さは限定されないことが想定されているが、１～１０ヌクレオチドを含む突出が、特に好適であると考えられる。添付の例では、アミノ酸アラニンをコードする３ヌクレオチドの突出を使用した。この種のトリプレット突出は、本発明による核酸分子をアミノ酸翻訳するためのリーディングフレームとそのままで適合するという利点を提供する。

特筆すべきことに、突出は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列または核酸分子に、１つの追加のトリプレットを導入する。したがって、本発明のクローニング戦略は、１つの追加のアミノ酸、例えばアラニンを導入する。この追加アミノ酸または対応するトリプレット／コドンは、それぞれ、プロリン、アラニン、および任意選択でセリンからなるポリペプチドまたはコードする核酸の一部とみなすことができる。結果的に、当業者であれば認識するように、例えば３００ヌクレオチドを含むヌクレオチド配列に、上述のクローニング戦略を使用する場合、切り出される核酸分子は、３ヌクレオチドの５’－突出も一緒に数えると、３０３ヌクレオチドを含む。本明細書では、このクローニング手順により、本明細書で使用される突出の長さに応じて、さらに多くのトリプレット／コドン、またはしたがってより多くのアミノ酸残基を導入することができることが想定される。

さらに、ベクターにクローニングされると、またはより長い合成ＤＮＡ断片（例えば、ストリング）の一部として、本明細書で提供される核酸分子またはヌクレオチド配列は、前記上流認識配列および／または前記下流認識配列を含み、前記上流認識配列および／または前記下流認識配列は、認識配列の外側を切断する制限酵素の認識部位である。本明細書で使用される制限酵素、例えばＩＩＳ型クラスの制限酵素は、好ましくは、一方の側ではそれらの認識配列の外側を切断し、それにより、非対称的認識配列の適切な配向に応じて、認識部位を含まない切断された核酸分子またはヌクレオチド配列がもたらされる。

また、本明細書で提供されるベクターでは、そのような制限酵素による切断により、制限酵素の認識配列が維持される。例示的なベクターｐＸＬ２のクローニング部位は、図１Ｃに示されている。このベクターから切り出される核酸分子またはヌクレオチド配列は、そのクローニングまたは切り出しに使用された制限酵素の認識部位を欠く。これは、例えば、発現ベクターにクローニングするための、または融合タンパク質のコード領域を生成するための、本明細書に記載されている手順に従って、より長い核酸分子またはより長いヌクレオチド配列を構築するために特に有利である。

さらなる実施形態では、例示的なベクターｐＸＬ１が提供されており（配列番号５５）、図１Ｂに示されている。この場合、本発明によるクローニング／挿入された核酸分子またはヌクレオチド配列は、２つのＳａｐＩ制限部位により隣接されている。したがって、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸分子は、単一の制限酵素、すなわちＳａｐＩ（またはＥａｒＩも）を用いた消化／切断により、このベクターから簡単に切り出すことができる。これは、その後の発現ベクターへのクローニングおよび／または融合タンパク質のコード領域の生成に特に有利である。

添付の例に示されているように、本明細書で提供される核酸分子またはヌクレオチド配列は、ベクターｐＸＬ２（配列番号４８）に反復的な様式で構築されている；例えば、実施例２を参照されたい。したがって、ベクター内の認識部位の一方または両方を使用して、さらなるヌクレオチド配列をベクターに（存在するインサートの一方の側に）挿入してもよく、または代わりに（構築された）ヌクレオチド配列もしくは核酸分子全体をベクターから切り出してもよい。

さらなる利点として、本明細書で提供される本発明の核酸分子を産生するための方法では、本発明による核酸分子内に制限酵素の認識部位が存在しないことにより、（ｉ）本明細書で提供される構築されたより長いヌクレオチド配列が、内部的に、例えば、構築されたヌクレオチド配列のユニット／モジュール間で切断されることが防止され、（ｉｉ）構築されたヌクレオチド配列の隣接するユニット／モジュールにあるコードされたアミノ酸配列間、または本発明のヌクレオチド配列および生理活性タンパク質のヌクレオチド配列にあるコードされたアミノ酸配列間での不偏性移行がもたらされる。この戦略は、「トレースレス」または「シームレス」構築またはクローニングと称される場合がある。

添付の例では、ＩＩＳ型の制限酵素を使用することができることが示されている。例えば、実施例１および２を参照されたい。このクラスの制限酵素は、認識部位が切断部位から離れており、それらのいくつか、例えば、ＳａｐＩおよびＥａｒＩは、一方の側では認識配列の外側を切断する。本明細書の下記では、ｐＸＬ２の前記上流認識配列は、ＳａｐＩおよびＥａｒＩにより認識され、前記下流認識配列は、ＥａｒＩにより認識されることが示されている。したがって、前記上流認識配列は、ヌクレオチド配列５’－ＧＣＴＣＴＴＣ－３’を有し、前記下流認識配列は、ヌクレオチド配列５’－ＣＴＣＴＴＣ－３’を有する。当業者であれば、本明細書で規定されている目的または限定を満たす限り、制限酵素は、本明細書では特に限定されないことを知っている。

本明細書で使用される場合、用語「エンドヌクレアーゼ制限酵素」は、核酸分子またはヌクレオチド配列、例えばＤＮＡ内の、一続きのヌクレオチドを含む特定の認識配列のまたは付近の、あるヌクレオチドを接続しているリン酸ジエステル結合でオリゴ／ポリヌクレオチドをカット／切断／加水分解するエンドヌクレアーゼ酵素に関する。したがって、制限酵素は、ヌクレオチド配列または核酸分子内のリン酸ジエステル結合の加水分解を触媒する。制限酵素は、一般的に、構造の差異、および認識配列で基質をカット／切断するかまたは別の部位で基質をカット／切断するかで、３つのタイプに分類される。二本鎖ＤＮＡをカット／切断するために、制限酵素は、通常、２つのリン酸ジエステル結合、ＤＮＡ二重らせんの各糖－リン酸主鎖（すなわち、各鎖）の１つずつを切断する。

本明細書で使用される場合、用語「認識配列」は、制限酵素により認識される、ヌクレオチドの特定の配列、例えば、長さが４～８個の特定の塩基対に関する。

本明細書で使用される場合、用語「切断」は、核酸分子および／またはベクターが、制限酵素によりカット／消化／加水分解されることを意味する。上記で言及されているように、制限酵素は、ポリヌクレオチド鎖内のリン酸ジエステル結合を切断する。

本明細書で使用される場合、用語「挿入」は、酵素の作用により、核酸分子をベクターにライゲーションすることを指す。それにより、１つのポリヌクレオチドの末端の３’－ヒドロキシル基と、別の５’－ホスホリル基との間にリン酸ジエステル結合が形成されることにより、ポリヌクレオチドの末端が一緒に接合される。プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸分子またはヌクレオチド配列は、ベクターの切断末端にハイブリダイズすることができる末端を有する。本発明の好ましい態様では、そのような末端は、切断されたベクターのそれぞれの突出にハイブリダイズすることができる突出である。

核酸分子をベクターに挿入する場合、ベクターを脱リン酸化して、インサートを有していない再環化ベクターＤＮＡのバックグラウンドが高くなることを回避することが好ましい。脱リン酸化用の例示的な酵素は、子ウシ腸アルカリホスファターゼ（ＣＩＰまたはＣＩＡＰ）またはエビアルカリホスファターゼであってもよく、これらは両方とも、消化されたポリヌクレオチドの５’末端からリン酸基を除去する。

本明細書で使用される場合、用語「上流」および「下流」は両方とも、核酸分子またはヌクレオチド配列の相対的位置を指す。核酸分子またはヌクレオチド配列の各鎖は、５’末端および３’末端を有し、それらは、デオキシリボース（またはリボース）糖の炭素原子がそう呼ばれている。一般的に、上流および下流は、ＲＮＡ転写が生じるコード鎖の５’から３’方向に関する。二本鎖ＤＮＡを考慮すると、上流は、検討中の遺伝子またはリーディングフレームのコード鎖の５’末端に向かい、下流は、３’末端に向かう。二本鎖ＤＮＡには逆平行の性質があるため、これは、非コード鎖の３’末端が、遺伝子の上流であり、その５’末端が下流であることを意味する。

本明細書で使用される場合、用語「核酸分子」または「ヌクレオチド配列」は、ＤＮＡ分子およびＲＮＡ分子等の核酸分子を含むことが意図される。本明細書では、用語「ヌクレオチド配列」は、用語「核酸配列」と等しく、これら用語は、本明細書では同義的に使用することができると理解される。前記核酸分子または前記ヌクレオチド配列は、一本鎖であってもよく、または二本鎖であってもよいが、好ましくは、二本鎖ＤＮＡである。当業者であれば、二本鎖ＤＮＡは、実際には、大部分が相補的なヌクレオチド配列を有する（粘着末端が存在する場合は、それを除く）２つの異なる核酸分子を含み、それらが非共有結合で会合／ハイブリダイズされて二本鎖が形成されていることを知っている。

本発明の一態様では、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列または核酸分子は、生理活性または薬理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結されている。本発明の好ましい態様では、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列または核酸分子は、生理活性または薬理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結されている。したがって、核酸分子は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドならびに生理活性または薬理活性タンパク質を含む異種性薬物コンジュゲートをコードする。本明細書で使用される場合、異種性は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドならびに生理活性または薬理活性タンパク質をコードする核酸分子が、自然界には見出されないことを意味する。

本明細書で使用される場合、用語「作動可能に連結される」は、検討中の成分が、両方とも意図されている様式で機能することが可能な関係性にある並置を指す。

プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列は、生理活性または薬理活性タンパク質をコードするヌクレオチド配列と、シームレスに、すなわちそれら２つの配列間にリンカーを介在させることなく、コンジュゲートすることができる。あるいは、リンカーまたはスペーサー構造が、ランダムコイルポリペプチドと生理活性または薬理活性タンパク質との間に含まれている。したがって、本発明のある特定の態様では、アミノ酸リンカーをコードするヌクレオチド配列が、プロリン／アラニンリッチポリペプチドをコードするヌクレオチド配列と、生理活性または薬理活性タンパク質をコードするヌクレオチド配列との間に挿入されている。例示的なリンカーは、プロテアーゼ感受性切断部位、セリン／グリシンリンカー、Ｈｉｓ_６－タグまたはＳｔｒｅｐ－タグＩＩ等の親和性タグ、シグナルペプチド、保持ペプチド、膜輸送ペプチドまたは追加のエフェクタードメインのような標的指向性ペプチド、例えば、抗腫瘍トキシンまたはプロドラッグ活性用酵素等と関連する、腫瘍標的化用の抗体断片であってもよい。リンカー／スペーサーを含むポリペプチドは、前記生理活性タンパク質の制御放出を可能にする血漿プロテアーゼ切断部位を有していてもよい。特定のタンパク質の最適な生理活性を得るための異なるタイプまたは長さのリンカー／スペーサーは、過度の負担なく特定することができる。

リンカー／スペーサーは、リンカーまたはスペーサー構造を担持する融合タンパク質を受容する対象において免疫応答を引き起こす場合がある。したがって、本発明の好ましい態様では、プロリン／アラニンリッチポリペプチドをコードするヌクレオチド配列は、生理活性または薬理活性タンパク質をコードするヌクレオチド配列とシームレスにコンジュゲートされている。本明細書で使用される場合、「シームレス」は、ランダムコイルポリペプチドをコードするヌクレオチド配列を、生理活性または薬理活性タンパク質をコードするヌクレオチド配列と直接的にコンジュゲートすることを意味する。したがって、プロリン、アラニン、または任意選択でセリン以外のアミノ酸残基をコードする追加のヌクレオチドは導入されない。添付の例に示されているように、シームレスクローニングは、アミノ酸残基アラニンをコードする突出を使用することにより達成された。例えば、実施例７を参照されたい。したがって、本発明は、核酸分子を調製するための方法であって、前記核酸分子が、プロリン、アラニン、および任意選択でセリンをコードするヌクレオチド配列、ならびに生理活性または薬理活性タンパク質またはペプチドをコードするヌクレオチド配列を含み、前記ヌクレオチド配列が、生理活性または薬理活性タンパク質をコードする前記ヌクレオチド配列とシームレスにコンジュゲートされる、方法にさらに関する。また、添付の例および本明細書の上記では、シームレスクローニングを使用して、ＰＡリッチポリペプチドをコードするより長いヌクレオチド配列を構築することができることが示されている。したがって、シームレスクローニング法が適用される場合、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするその結果生じたヌクレオチド配列は、本明細書に記載のような低反復性ヌクレオチド配列である。

本明細書で使用される場合、用語「生理活性」は、生体、例えば生物に対する物質の生物学的作用を記述する。したがって、用語「生理活性タンパク質」または「生理活性ペプチド」は、本明細書で使用される場合、前記タンパク質またはポリペプチドまたはペプチドに曝露した生細胞／生物において生物学的効果を誘導することが可能なタンパク質またはペプチドに関する。本発明の状況では、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列または核酸分子は、生理活性タンパク質をコードする異種性核酸と同じリーディングフレームに作動可能に連結される。

本明細書では、コードされた生理活性タンパク質またはペプチドは、「生理活性を有するおよび／または媒介するアミノ酸配列」であるか、または「生理活性を有するアミノ酸配列」であり、ならびに／または薬理活性を有するおよび／もしくは媒介するアミノ酸配列であることが理解される。用語「生理活性タンパク質」、「生理活性を有するおよび／または媒介するアミノ酸配列」、もしくは「生理活性を有するアミノ酸配列」、および／または「薬理活性を有するおよび／または媒介するアミノ酸配列」には、ｉｎｖｉｖｏまたはｉｎｖｉｔｒｏいずれかでの半減期の延長が有益である任意の目的のタンパク質またはペプチド（ならびに、抗体断片、膜受容体の細胞外または細胞内ドメインを含む断片、成長因子またはサイトカインの短縮形態等の、それらの機能性断片）も含まれる。当業者であれば、プロリン、アラニン、および任意選択でセリンからなるポリペプチドのランダムコイルコンフォメーションは、生理活性／薬理活性（「機能性」）タンパク質またはペプチドに、ｉｎｖｉｖｏおよび／またはｉｎｖｉｔｒｏ安定性の増加、特に血漿内半減期の増加を媒介することを知っている。

本発明の一実施形態では、本発明による、生理活性を有するおよび／または媒介するコードされたアミノ酸配列は、任意の「目的タンパク質」、すなわち薬学的もしくは生物学的目的の任意のタンパク質、または治療上有効なタンパク質として有用な任意のタンパク質から推定することができる。したがって、前記生理活性タンパク質またはペプチドは、薬理学的に活性な、または治療上有効なタンパク質またはペプチドであってもよい。薬理学的に活性であるかまたは治療上有効なタンパク質またはペプチドは、所望の薬理学的、薬学的、および／または生理学的効果を有する任意のタンパク質またはペプチドである。効果は、（ｉ）疾患／医学的状態／障害またはそれらの症状を完全にまたは部分的に予防および／または緩和する点で予防的であってもよく、ならびに／あるいは（ｉｉ）疾患／医学的状態／障害を部分的にもしくは完全に阻害する、すなわちその進行を停止させる点で、または疾患／医学的状態／障害を軽減する、すなわち疾患／医学的状態／障害の退縮を引き起こす点で、治療的であってもよい。最も好ましくは、前記生理活性タンパク質は、例えばワクチンとして使用するための治療上有効なタンパク質である。したがって、前記生理活性タンパク質は、ワクチン接種にも使用することができる。

さらに、前記生理活性タンパク質は、診断関連タンパク質であってもよい。本明細書で使用される場合、「診断関連タンパク質」は、診断に使用されるタンパク質またはポリペプチドに関する。本発明の状況では、診断は、対象の疾患、例えば、がんおよび腫瘍、または臨床症状の認識および（早期）検出に関する。診断は、鑑別診断も含んでもよい。疾患または臨床状態の重症度の評価も、ある特定の実施形態では、用語「診断」に包含される場合がある。特に、本発明の核酸分子によりコードされるポリペプチドおよび／または薬物コンジュゲートは、ｉｎｖｉｔｒｏまたはｉｎｖｉｖｏ診断に使用することができる。例えば、コードされたポリペプチドおよび／または薬物コンジュゲートは、医用画像法に使用することができる。コードされたＰＡリッチポリペプチドおよび／または薬物コンジュゲートは、腫瘍細胞内への取り込みが向上しているため、これらの方法に特に好適である。さらに、コードされたＰＡリッチポリペプチドおよび／または薬物コンジュゲートは、腫瘍細胞と血液または健常細胞／組織との間で高いコントラストを示す。

コードされた生理活性タンパク質は、結合タンパク質、抗体断片、サイトカイン、成長因子、ホルモン、酵素、タンパク質ワクチン、ペプチドワクチン、またはペプチドもしくはペプチド模倣体からなる群から選択される。本明細書で使用される場合、「ペプチド」は、好ましくは、最大５０個のアミノ酸残基を含む／からなり、「タンパク質」は、好ましくは、５０個またはそれよりも多くのアミノ酸残基を含む／からなる。

本明細書で使用される場合、用語「結合タンパク質」は、（ａ）潜在的結合パートナーを、前記潜在的結合パートナーとは異なる複数の分子と区別することができるように、潜在的結合パートナーとしての複数の異なる分子の貯留から、前記潜在的結合パートナーのみが結合するか、または著しく結合する程度に、潜在的結合パートナーと特異的に相互作用することができる分子に関する。結合タンパク質と潜在的結合パートナーとの間の結合活性を測定するための方法は、当技術分野で公知であり、例えば、酵素結合免疫吸着測定法（ＥＬＩＳＡ）、等温滴定熱量測定法（ＩＴＣ）、平衡透析法、プルダウンアッセイ法、マイクロスケール熱泳動法、蛍光滴定法、または例えばＢｉａｃｏｒｅ機器を使用する表面プラズモン共鳴（ＳＰＲ）分光法を使用することにより、日常的に実施することができる。

本発明の状況で有用な例示的な結合タンパク質／結合分子として、これらに限定されないが、抗体；Ｆａｂ断片、Ｆａｂ’断片、Ｆ（ａｂ’）_２断片、単鎖可変断片（ｓｃＦｖ）（単一）ドメイン抗体等の抗体断片、特にラクダ、ラマ、またはサメに由来するもの；抗体の単離された可変領域（ＶＬおよび／またはＶＨ領域）、特にヒトまたは霊長類に由来するもの；ＣＤＲ；免疫グロブリンドメイン；ＣＤＲ由来ペプチド模倣体；レクチン；フィブロネクチンドメイン；テネイシンドメイン；プロテインＡドメイン；ＳＨ３ドメイン；アンキリン反復ドメイン；およびリポカリン；または例えばSkerra (2000) J. Mol. Recognit. 13:167-187、Gebauer (2009) Curr. Opin. Chem. Biol. 13:245-255、またはBinz (2005) Nat. Biotechnol. 23:1257-1268に記載されている種々のタイプのスキャフォールド由来結合タンパク質が挙げられる。

本発明の状況で有用な、他の例示的なコードされた生理活性、薬理活性タンパク質または治療上有効な目的タンパク質としては、これらに限定されないが、インターロイキン受容体アンタゴニスト、ＥＢＩ－００５またはアナキンラのようなインターロイキン－１受容体アンタゴニスト、レプチン、アセチルコリンエステラーゼ、活性化プロテインＣ（ドロトレコギン）、アクチビン受容体ＩＩＢアンタゴニスト、アデノシンデアミナーゼ、アガルシダーゼアルファ、エントリモド（entolimod）のようなトール様受容体５のアゴニスト、アルファ－１アンチトリプシン、アルファ－１プロティナーゼ阻害剤、アルファ－ガラクトシダーゼ、アルファ－ヒト心房性ナトリウム利尿ペプチド、アルファ－Ｎ－アセチルグルコサミニダーゼ、アルテプラーゼ、アメジプラーゼ、アミリン、アミリン類似体、ＡＮＦ－Ｒｈｏ、アンギオテンシン（１～７）、アンギオテンシンＩＩ、アンギオテンシン転換酵素２、抗上皮細胞接着分子単鎖抗体断片、抗トロンビンアルファ、抗トロンビンＩＩＩ、アポトーシス誘導性酵素ｍｉ－ＡＰＯ、アルギニンデイミナーゼ、カラスパルガーゼ（calaspargase）、ペグアスパルガーゼ、クリサンタスパーゼのようなアスパラギナーゼ、ベロクトコグ（beroctocog）アルファまたはオクトファクター（octofactor）のようなＢドメイン欠損第ＶＩＩＩ因子、ベクツモマブ（bectumomab）（Ｌｙｍｐｈｏｓｃａｎ）、ブセリパーゼ（bucelipase）アルファのような胆汁酸塩刺激性リパーゼ、パブリズマブ（pavlizumab）のようなＲＳウイルスに対する結合タンパク質、ＢＭＰ－２（ジボテルミンアルファ）またはＢＭＰ－６のような骨形態形成タンパク質、ブーガニン、ウシカルボキシヘモグロビン、ウシ成長ホルモン、Ｃ１－エステラーゼ阻害剤、Ｃ３細胞外酵素タンパク質、カルボキシヘモグロビン、ＣＤ１９アンタゴニスト、リツキサンのようなＣＤ２０アンタゴニスト、ＣＤ３受容体アンタゴニスト、ＣＤ４０アンタゴニスト、ダピロリズマブ（dapirolizumab）またはＡｎｔｏｖａのようなＣＤ４０Ｌアンタゴニスト、セレブロシドスルファターゼ、ＶＧＸ－２１０のようなセトリン、コンドロイチンリアーゼ、コナコグ（conacog）ガンマ、コナコグベータ、アルブトレペノナコグアルファのような凝固第ＩＸ因子、エプタコグアルファ、マルゼプタコグアルファ（marzeptacog alfa）、バトレプタコグアルファ、オレプタコグアルファ（oreptacog alfa）のような凝固第ＶＩＩａ因子、スソクトコグアルファ（susoctocog alfa）、ダモクトコグアルファ、ツロクトコグアルファ、ルリオクトコグアルファ、エフモロクトコグアルファ、エフラロクトコグアルファ、シモクトコグアルファ（simoctocog alfa）のような凝固第ＶＩＩＩ因子、凝固第Ｘ因子、カトリデカコグのような凝固第ＸＩＩＩ因子、クロストリジウム・ヒストリチクム（clostridium histolyticum）のコラゲナーゼ、補体因子Ｃ３阻害剤、補体受容体５ａアンタゴニスト、副腎皮質刺激ホルモン放出因子、ＦＰＡ００８のようなＣＳＦ１受容体アンタゴニスト、ＣＳＦ１Ｒアンタゴニスト、イピリムマブのようなＣＴＬＡ－４アンタゴニスト、シアノビリン－Ｎ、ドルナーゼアルファのようなデオキシリボヌクレアーゼＩ、ＥＧＦＲ受容体アンタゴニスト、ボナパニターゼのようなヒトＩ型膵臓エラスターゼのようなエラスターゼ、エンドスタチン、エンカスチム（enkastim）、上皮成長因子、エリスロポエチンアルファ、エリスロポエチンゼータ、ＦｃγＩＩＢ受容体アンタゴニスト、フィブリノゲナーゼ、ブリナーゼのような線維素溶解酵素、線維芽細胞成長因子１（ヒト酸性線維芽細胞成長因子）、線維芽細胞成長因子１８、線維芽細胞成長因子２（ヒト塩基性線維芽細胞成長因子）、線維芽細胞成長因子２１、ＦＰＡ１４４のような線維芽細胞成長因子受容体２アンタゴニスト、Ｆｍｓ様チロシンキナーゼ３リガンド、フォリトロピンアルファまたはフォリトロピンベータのような卵胞刺激ホルモン、ヒト殺菌性／透過性増強タンパク質２１（オペバカン／ｒＢＰＩ２１）の断片、ゲロニン、グルカゴン受容体アゴニスト、アブシキシマブのような糖タンパク質ＩＩｂ／ＩＩＩａアンタゴニスト、コンドリアーゼのようなグリコサミノグリカン分解酵素、ｇｐ１２０／ｇｐ１６０、顆粒球コロニー刺激因子（Ｇ－ＣＳＦ）、顆粒球マクロファージコロニー刺激因子（ＧＭ－ＣＳＦ）、転写因子Ｅ７（ベルパセプカルテスペン（verpasep caltespen））と融合されているミコバクテリウムＢＣＧに由来する熱ショックタンパク質ｈｓｐ６５、肝細胞成長因子、肝細胞成長因子受容体（ＨＧＦＲ）アンタゴニスト、ヘプシジンアンタゴニスト、ハーセプチンのようなＨｅｒ２／ｎｅｕ受容体アンタゴニスト、ヘテロ二量体１５：ＩＬ－１５Ｒａ（ｈｅｔＩＬ－１５）、ヒルジン、ｈｓｐ７０アンタゴニスト、ヒト酸性スフィンゴミエリナーゼ、コリオゴナドトロピンアルファのようなヒト絨毛性ゴナドトロピン、レベグルコシダーゼアルファ（reveglucosidase alfa）またはアルグルコシダーゼアルファのようなヒト酵素酸性α－グルコシダーゼ、ヒト成長ホルモン、ヒトケラチノサイト成長因子（ＫＧＦ）、ヒトマトリックスメタロプロテイナーゼ、ヒトミエリン塩基性タンパク質断片、ヒト骨形成タンパク質１、ヒト骨形成タンパク質－１、ヒト副甲状腺ホルモン、ヒトトロンボモジュリンアルファ、ｒＨｕＰＨ２０のようなヒアルロニダーゼ、ヒトヒアルロニダーゼＰＨ－２０（ボルヒアルロニダーゼアルファ（vorhyaluronidase alfa））、ヒアロシダーゼ、またはボブヒアルロニダーゼ（bovhyaluronidase）のようなヒアルロニダーゼ、グルコセレブロシダーゼ、ベラグルセラーゼアルファ、またはタリグルセラーゼアルファのような加水分解性リソソームグルコセレブロシド特異的酵素、イズロネート－２－スルファターゼ、オマリズマブのようなＩｇＥアンタゴニスト、イロコイ（iIroquois）ホメオボックスタンパク質２（ＩＲＸ－２）、インスリン、インスリン類似体、インテグリンα４β１アンタゴニスト、インターフェロンタウ、インターフェロン－アルファ、インターフェロン－アルファアンタゴニスト、インターフェロン－アルファスーパーアゴニスト、インターフェロン－アルファ－ｎ３（ＡｌｆｅｒｏｎＮ注射剤）、インターフェロン－ベータ、インターフェロン－ガンマ、インターフェロン－ラムダ、ＤＡＢ（３８９）ＩＬ－２のようなインターロイキン２融合タンパク質、オプレレブキン（oprelevkin）のようなインターロイキン－１１、インターロイキン－１２、インターロイキン－１７受容体アンタゴニスト、インターロイキン－１８結合タンパク質、インターロイキン－２、インターロイキン－２２、ピトラキンラのようなインターロイキン－４、インターロイキン－４ムテイン、インターロイキン－６受容体アンタゴニスト、インターロイキン－７、インターロイキン－２２受容体サブユニットアルファ（ＩＬ－２２ｒａ）アンタゴニスト、イリシン、島ネオゲネシス関連タンパク質、カリジノゲナーゼ、ラクトフェリン、ラクトフェリン断片、ラノテプラーゼ、ブルルリパーゼ（burlulipase）、リゾリパーゼ（rizolipase）、エパフィパーゼ（epafipase）、またはセベリパーゼアルファのようなリパーゼ酵素、黄体形成ホルモン、ルトロピンアルファ、リンパ球膨張分子（lymphocyte expansion molecule）、リソスタフィン、哺乳動物胃リパーゼ酵素（メリスペース（merispace））、ベルマナーゼアルファ（velmanase alfa）のようなマンノシダーゼ、メラノコルチン－４受容体アゴニスト、ＭＥＰＥ由来２３アミノ酸ペプチド、メチオニルヒト幹細胞因子（アンセスチム）、マイクロプラスミン、エロスルファーゼアルファのようなＮ－アセチルガラクトサミン－６－スルファターゼ、Ｎ－アセチルグルコサミニダーゼ、ナサルプラーゼベータ、神経成長因子、ニューレグリン－１、神経毒（例えば、クロストリジウム・ボツリヌム（Clostridium botulinum）神経毒（クロストリジウム・ボツリヌム（Clostridium botulinum）神経毒セロタイプＡ、Ｂ、Ｃ、Ｄ、Ｅ、Ｆ、またはＧ、特にクロストリジウム・ボツリヌム（Clostridium botulinum）神経毒セロタイプＡ等）のようなクロストリジウム神経毒）、好中球ゼラチナーゼ関連リポカリン、オクリプラスミン、オルニトドロス・モウバタ（Ornithodoros moubata）補体阻害剤（ＯｍＣＩ／Ｃｏｖｅｒｓｉｎ）、オステオプロテゲリン、Ｐ１２８（ＳｔａｐｈＴＡＭＥ）、パミテプラーゼ、パラトルモン（ＰＴＨ）、ＰＤ－１アンタゴニスト、ＰＤＧＦアンタゴニスト、ペントラキシン－２タンパク質、ＨＹ１３３のようなファージリシン、バリアーゼ（valiase）のようなフェニルアラニンアンモニアリアーゼ、組織非特異性アルカリホスファターゼまたはアスホターゼアルファのようなホスファターゼ、プラスミノーゲン、Ｖ１０１５３のようなプラスミノーゲンバリアント、血小板由来成長因子－ＢＢ、ブタ成長ホルモン、プロヒビチン標的指向性ペプチド１、プロインスリン、プロテインＡ、ドロトレコグニン（drotrecognin）のようなプロテインＣ、ＦＰ－１０３９のようなタンパク結合線維芽細胞成長因子受容体リガンド、組換え組織因子経路阻害剤（チファコギン）、リラキシン、セレラキシンのようなリラキシン類似体、レテプラーゼ、ｒｈＰＤＧＦ－ＢＢ、オンコナーゼまたはアンフィナーゼのようなリボヌクレアーゼ、センレボターゼ、コネスタットアルファのようなセリンプロテアーゼ阻害剤、スフェリカーゼ、シアリダーゼ、可溶性補体受容体１型、可溶性ＤＣＣ（結腸直腸がんにおいて欠失）受容体、可溶性ＴＡＣＩ受容体（アタシセプト）、可溶性腫瘍壊死因子Ｉ受容体（ｓＴＮＦ－ＲＩ）、可溶性腫瘍壊死因子ＩＩ受容体（ｓＴＮＦ－ＲＩＩ）、可溶性ＶＥＧＦ受容体Ｆｌｔ－１、可溶性ヒトＦｃγＩＩＢ受容体、スタフィロキナーゼ、ストレプトキナーゼ、スルファミダーゼ、Ｔ細胞受容体リガンド、テネクテプラーゼ、血小板新生刺激タンパク質（ＡＭＧ－５３１）、トロンボポエチン、トロンボスポンジン－１、甲状腺ホルモン、タルチレリンのような甲状腺刺激ホルモン放出ホルモン（ＴＲＨ）類似体、組織プラスミノーゲン活性化因子、パミテプラーゼのような組織型プラスミノーゲン活性化因子、トリペプチジルペプチダーゼＩ、腫瘍壊死因子（ＴＮＦアルファ）、腫瘍壊死因子αアンタゴニスト、ラスブリカーゼまたはペガドリカーゼ（pegadricase）のようなウリカーゼ、ウロジラチン、ウロフォリトロピン、ウロキナーゼ、ウテログロビン、ランビズマブ（ranbizumab）またはベバシズマブのようなＶＥＧＦアンタゴニスト、ＶＥＧＦ／ＰＤＧＦアンタゴニスト、マルチＶＥＧＦ／ＰＤＧＦＤＡＲＰｉｎまたは融合タンパク質のようなＶＥＧＦ／ＰＤＧＦアンタゴニスト、ビスキュミン、ボニコグアルファ（vonicog alfa）のようなフォンビルブラント因子が挙げられる。本明細書では、インターロイキン受容体アンタゴニスト、特に、ＥＢＩ－００５またはアナキンラのようなインターロイキン－１受容体アンタゴニスト、およびレプチン、特にヒトレプチンまたは突然変異体ヒトレプチン（ｈｕＬｅｐｔｉｎ（Ｗ１００Ｑ）、成熟ポリペプチド鎖の１００位に、トリプトファンからグルタミンへの置換を有するヒトレプチン突然変異体）が好ましい。ヒトレプチンのアミノ酸配列は、例えば、ＵｎｉＰｒｏｔＫＢ受託コードＰ４１１５９に開示されている。突然変異体ｈｕＬｅｐｔｉｎ（Ｗ１００Ｑ）は、Murphy (ed.) Misbehaving proteins: protein (mis)folding, aggregation, and stability, Springer, 1st edition, New YorkのRicci(2006) Mutational approach to improve physical stability of protein therapeutics susceptible to aggregationにより記載されている。

例示的ペプチドおよびペプチド模倣体としては、これらに限定されないが、副腎皮質刺激ホルモン（ＡＣＴＨ）、アファメラノチド、アラレリン、アルファ４インテグリン阻害剤、抗ＨＩＶ融合阻害剤（エンフルビチド（enfurvitide）、Ｖ２ｏ、ＳＣ３４ＥＫ、ＳＣ３５ＥＫ、ＩＱＮ１７、またはＩＺＮ１７のような）、アンギオテンシンＩＩ２型（ＡＴ２）受容体アゴニスト（ＬＴ２のような）、抗イディオタイプｐ５３ペプチド、アミリン、アミリン類似体、アストレシン、アトシバン、抗がんおよび抗ＨＩＶ活性を有する細菌ペプチド断片（ＡＴＰ－０１のような）、二環式ペプチド（ＴＧ－７５８のような）、ビバリルジン、ブラジキニンアンタゴニスト（イカチバントのような）、ブレメラノチド、Ｂ型ナトリウム利尿ペプチド、カルシトニン、カルベトシン、カルフィルゾミブ、クリサリン（chrysalin）、シレンギチド、Ｃ型ナトリウム利尿ペプチド、コロストリニン（colostrinin）、副腎皮質刺激ホルモン放出因子（Ｘｅｒｅｃｅｐｔ、コイスントロピン（coysnthropin）のような）、ＣＮＧＲＣＧ腫瘍ホーミングペプチド、ω－コノトキシンペプチド（ジコノチドのような）、Ｃ－ペプチド、ダネガプチド（danegaptide）、ディフェンシン、エカランチド、エルカトニン、エレドイシン、エキセンディン－４、エキセンディン－４類似体（エキセンディン９～３９のような）、エズリンペプチド１、ヒトマトリックス細胞外リン糖タンパク質由来断片（ＡＣ－１００のような）、ガラニン、胃抑制ポリペプチド（ＧＩＰ）、ＧＩＰ類似体、グラチラマー、グルカゴン、グルカゴン類似体、グルカゴン様ペプチド１（ＧＬＰ－１）、ＧＬＰ－１類似体（リキシセナチド、リラグルチド、またはセミグルチド（semiglutide）のような）、グルカゴン様ペプチド２（ＧＬＰ－２）、ＧＬＰ－２類似体（テデュグルチドのような）、ゴナドレリン、ゴナドトロピン放出ホルモンアゴニスト（ゴセレリン、ブセレリン、トリプトレリン、ロイプロリド、プロチレリン、レシレリン、フェルチレリン、またはデシオレリン（desiorelin）のような）、ゴナドトロピン放出ホルモンアンタゴニスト（アバレリクス、セトロレリクス、デガレリクス、ガニレリクス、またはテベレリクスのような）、グレリン、グレリン類似体（ＡＺＰ－５３１のような）、成長ホルモン放出ホルモン、成長ホルモン放出ホルモン類似体（セルモレリンまたはテサモレリンのような）、ヘマタイド、ヘプシジン模倣体ペプチド、ヒストレリン、インドリシジン、インドリシジン類似体（オミガナンのような）、ＩｇＥ下方調節ペプチド（ＳＣ－０１のような）、ＩＮＧＡＰペプチド（エキスリン（exsulin））、インスリン様成長因子１、インスリン様成長因子２、Ｋｖ１．３イオンチャネルアンタゴニスト（ｃｇｔｘＡ、ｃｇｔｘＥ、またはｃｇｔｘＦのような）、ランレオチド、レクチン結合ペプチド（ｓｖ６Ｂ、ｓｖ６Ｄ、ｓｖＣ２、ｓｖＨ１Ｃ、ｓｖＨ１Ｄ、またはｓｖＬ４のような）、ランチペプチド、ララゾチド、リナクロチド、ルスプルチド（lusupultide）、メラノコルチン－４受容体アゴニスト（ＡＺＤ２８２０のような）、ＭＥＰＥ由来２３アミノ酸ペプチド、ミトコンドリア由来ペプチド（ＭＯＴＳ－ｃ、ヒューマニン、ＳＨＬＰ－６、またはＳＨＬＰ－２のような）、インスリン様成長因子結合タンパク質－２の突然変異体（Ｉ－ＨＢＤ１のような）、Ｎａｖイオンチャネルモジュレーター（ＧＴｘ１－１５またはＶＳＴｘ３のような）、オクトレオチド、プロタンパク質転換酵素サブチリシン／ケキシン９型（ＰＣＳＫ９）阻害性ペプチド、アズリンのペプチド断片、フィロマー（Phylomer）、ＭＨＣクラスＩＩ関連インバリアントペプチド（ＣＬＩＰ）のペプチドアンタゴニスト（ＶＧ１１７７のような）、熱ショックタンパク質に由来するペプチド（エンカスチム（enkastim）のような）、ペキシガナン、プロバマー（plovamer）、プラムリンチド、プロヒビチン標的指向性ペプチド１、プロ膵島ペプチド、ペプチドチロシンチロシン（ＰＹＹ３－３６）、ＲＧＤペプチドまたはペプチド模倣体、ラモプラニン、セクレチン、シナプルチド（sinapultide）、ソマトスタチン、ソマトスタチン類似体（パシレオチドまたはＣＡＰ－２３２のような）、特異的標的化抗菌ペプチド（ＳＴＡＭＰ）（Ｃ１６Ｇ２のような）、骨形態形成タンパク質の受容体アゴニスト（ＴＨＲ－１８４またはＴＨＲ－５７５のような）、ストレスコピン（stresscopin）、サーファクシン（surfaxin）、Ｔｃ９９ｍアプシチド、テリパラチド（ＰＴＨ１－３４）、テトラコサクチド、チモシンアルファ１、ＴＬＲ２阻害性ペプチド、ＴＬＲ３阻害性ペプチド、ＴＬＲ４阻害性ペプチド、チモシンＢ４、チモシンＢ１５、血管作用性腸ペプチド、バソプレッシン、バソプレッシン類似体（例えばデスモプレシン、フェリプレシン、またはテルリプレシン）が挙げられる。

ワクチン接種の状況で有用な例示的な目的の生理活性タンパク質としては、これらに限定されないが、ＡＥ３７ペプチド、ボンベシン－ガストリン放出ペプチド、がん胎児性抗原（ＣＥＡ）、Ｅ型肝炎ウイルスのカプシドタンパク質オープンリーディングフレーム２（ＯＲＦ２）タンパク質、コレラ毒素Ｂ、黄色ブドウ球菌（staphylococcus aureus）のクランピング因子Ａ、ジフテリア毒素、ジフテリア毒素突然変異体（ＣＲＭ１９７のような）、大腸菌（E. coli）熱不安定性エンテロトキシン、シュードモナス・エルギノーサ（pseudomonas aeruginosa）の菌体外毒素Ａ、麻疹ウイルスのＦタンパク質、日本脳炎（ＪＥ）ウイルスの糖タンパク質Ｅ、ＧＰＣ３由来ペプチド、Ａ型肝炎ポリタンパク質、ＨＥＲ２由来ペプチドＧＰ２、ヘレグリン、Ｈｅｒ２ｎｅｕペプチド、Ｂ型肝炎ウイルス表面抗原（ＨｂＳＡｇ）、ヒトグルタミン酸デカルボキシラーゼタンパク質アイソフォーム６５ｋＤａ（ｒｈＧＡＤ６５）、インフルエンザ赤血球凝集素抗原（ＨＡ）、インフルエンザノイラミニダーゼ（ＮＡ）、ヒトパピローマウイルスのＬ１タンパク質、ｌｉ－Ｋｅｙ／ＨＥＲ２／ｎｅｕハイブリッドペプチド、ボレリア・ブルグドルフェリ（borrelia burgdorferi）の細胞表層リポタンパク質（ＯｓｐＡ）、ロタウイルスの主要外側カプシドタンパク質、ムチン－１（ＭＵＣ－１）ペプチド、ノーウォークウイルス（ｒＮＶＰ）カプシドタンパク質、パルボウイルスＢ１９ＶＬＰ、顆粒球マクロファージコロニー刺激因子由来ペプチド、ブタサーコウイルス２カプシド（ＰＣＶ２ＯＲＦ２）タンパク質、ダニ媒介性脳炎ウイルスのＣタンパク質、ダニ媒介性脳炎ウイルスのＥタンパク質、黄熱病ウイルスのＥタンパク質、風疹ウイルスのＥ－１タンパク質、ラブドウイルス科（rhabdoviridae）のＧタンパク質、麻疹ウイルスのＨタンパク質、パラミクソウイルス科（paramyxoviridae）のＨタンパク質、黄熱病ウイルスのＮＳタンパク質、パラミクソウイルス科（paramyxoviridae）のＮタンパク質、ブタコレラウイルスの前立腺特異抗原Ｅ２タンパク質、ロタウイルスのＶＰ６タンパク質、ロタウイルスのＶＰ７タンパク質、ＳＡＲＳウイルス由来スパイクタンパク質（Ｄ３２５２）、ポリオウイルスのＶＰ１タンパク質、ポリオウイルスのＶＰ４タンパク質、Ｒａｓ腫瘍性タンパク質、精子由来ペプチド（ＹＬＰ１２、Ｐ１０Ｇ、Ａ９Ｄ、ｍＦＡ－１２－１９、ＳＰ５６、および／またはｍＦＡ－１１１７－１３６のような）、破傷風毒素、ツベルクリン、腫瘍関連ペプチド（ＴＵＭＡＰ）（ＩＭＡ９０１、ＩＭＡ９１０、またはＩＭＡ９５０のような）が挙げられる。

一態様では、本発明は、本明細書で開示されている核酸分子、例えば、プロリン、アラニン、およびセリンからなるポリペプチドをコードするヌクレオチド配列を含む核酸分子であって、前記核酸のヌクレオチド配列が、少なくとも３００ヌクレオチドの長さを有する、核酸分子に関するか、または
本発明は、一態様では、生理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結された、本明細書で開示されている核酸分子、例えば、プロリン、アラニン、およびセリンからなるポリペプチドをコードするヌクレオチド配列を含む核酸分子であって、前記核酸のヌクレオチド配列が、少なくとも３００ヌクレオチドの長さを有し、核酸分子が、生理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結されており、
前記ヌクレオチド配列が、

ではない、核酸分子に関する。

ではない、核酸分子に関する。

一態様では、本発明は、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列からなる核酸分子であって、
前記核酸のヌクレオチド配列が、少なくとも３００ヌクレオチドの長さを有し、
前記ヌクレオチド配列が、５０，０００未満のヌクレオチド反復スコア（ＮＲＳ）を有し、
前記ヌクレオチド反復スコア（ＮＲＳ）が、数式：

により決定され、式中、
Ｎ_ｔｏｔは、前記ヌクレオチド配列の長さであり、
ｎは、前記ヌクレオチド配列内の反復の長さであり、
ｆ_ｉ（ｎ）は、前記長さｎの反復の頻度であり、
１つよりも多くの長さｎの反復が存在する場合、ｋ（ｎ）は、前記長さｎの反復の前記異なる配列の数であり、そうでなければ、前記長さｎの反復のｋ（ｎ）は１である、核酸分子に関する。

さらに、本発明は、本発明の核酸分子またはヌクレオチド配列を含むベクターにも関する。また、ベクターは、（ｉ）アラニン、プロリン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列、ならびに（ｉｉ）生理活性タンパク質をコードするヌクレオチド配列を含む核酸分子を提供するために使用することができる。例えば、図４および実施例７を参照されたい。

そのようなベクターは、コードされたランダムコイルポリペプチドおよび生理活性タンパク質を含む融合タンパク質を発現するために、発現ベクターとして使用することができる。したがって、コードされた融合タンパク質は、（ｉｉ）生理活性タンパク質とカップリングされた、（ｉ）低反復性ヌクレオチド配列によりコードされているランダムコイルポリペプチドを包含する。好ましくは、ランダムコイルポリペプチドは、アラニン、プロリン、および任意選択でセリンからなる。例示的なベクターは、配列番号５６に示されている。添付の例には、そのようなベクターまたは核酸分子を提供するための例示的な方法が示されている。例えば、図６および実施例７を参照されたい。

本発明の方法では、本明細書で提供されるベクターは、生理活性タンパク質をコードするヌクレオチド配列を含み、第２のステップにて、ＰＡリッチポリペプチドをコードするヌクレオチド配列がベクターに導入される。生理活性タンパク質をコードするヌクレオチド配列を含むベクターに、プロリン／アラニンリッチ配列をコードするヌクレオチド配列を導入するためには、例えば、アラニン、プロリン、および／または任意選択でセリンをコードする少なくとも１つのヌクレオチドトリプレット／コドンを含む突出を使用することができる。上記を参照されたい。したがって、そのようなトリプレットまたはコドンは、プロリン／アラニンリッチ配列の一部とみなされるアミノ酸、特にアラニンをコードすることができる。

結果的に、本明細書で提供される方法およびベクターは、従来の制限部位を使用することにより導入される場合がある追加のアミノ酸リンカーの導入を回避する。したがって、本明細書で提供される手段および方法は、（ｉ）アラニン、プロリン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列、および（ｉｉ）生理活性タンパク質をコードするヌクレオチド配列を含む本発明の核酸分子のシームレスクローニングを可能にする。

多くの好適なベクターが、分子生物学分野の当業者に知られている。プラスミド、コスミド、ウイルス、バクテリオファージ、および遺伝子工学で従来使用される他のベクターを含む好適なベクターの選択は、所望の機能に依存する。

好ましくは、ベクターは、プラスミドであり、より好ましくは、一般的な大腸菌（E. coli）発現ベクターｐＡＳＫ３７、ｐＡＳＫ７５、またはｐＸＬ２に基づくプラスミドである。

当業者に周知である方法を使用して、種々のプラスミドを構築することができる。例えば、Sambrook(2001) loc. cit.およびAusubel(1989) loc. cit.に記載されている技法を参照されたい。典型的なプラスミドベクターとしては、例えば、ｐＱＥ－１２、ｐＵＣ系列のプラスミド、ｐＢｌｕｅｓｃｒｉｐｔ（Ｓｔｒａｔａｇｅｎｅ）、ｐＥＴ系列の発現ベクター（Ｎｏｖａｇｅｎ）またはｐＣＲＴＯＰＯ（Ｉｎｖｉｔｒｏｇｅｎ）、ｌａｍｂｄａｇｔ１１、ｐＪＯＥ、ｐＢＢＲ１－ＭＣＳ系列、ｐＪＢ８６１、ｐＢＳＭｕＬ、ｐＢＣ２、ｐＵＣＰＫＳ、ｐＴＡＣＴ１が挙げられる。哺乳動物細胞での発現に適合する典型的なベクターとしては、Ｅ－０２７ｐＣＡＧＫｏｓａｋ－Ｃｈｅｒｒｙ（Ｌ４５ａ）ベクター系、ｐＲＥＰ（Ｉｎｖｉｔｒｏｇｅｎ）、ｐＣＥＰ４（Ｉｎｖｉｔｒｏｇｅｎ）、ｐＭＣ１ｎｅｏ（Ｓｔｒａｔａｇｅｎｅ）、ｐＸＴ１（Ｓｔｒａｔａｇｅｎｅ）、ｐＳＧ５（Ｓｔｒａｔａｇｅｎｅ）、ＥＢＯ－ｐＳＶ２ｎｅｏ、ｐＢＰＶ－１、ｐｄＢＰＶＭＭＴｎｅｏ、ｐＲＳＶｇｐｔ、ｐＲＳＶｎｅｏ、ｐＳＶ２－ｄｈｆｒ、ｐＩＺＤ３５、Ｏｋａｙａｍａ－ＢｅｒｇｃＤＮＡ発現ベクターｐｃＤＶ１（Ｐｈａｒｍａｃｉａ）、ｐＲｃ／ＣＭＶ、ｐｃＤＮＡ１、ｐｃＤＮＡ３（Ｉｎｖｉｔｒｏｇｅｎ）、ｐｃＤＮＡ３．１、ｐＳＰＯＲＴ１（ＧＩＢＣＯＢＲＬ）、ｐＧＥＭＨＥ（Ｐｒｏｍｅｇａ）、ｐＬＸＩＮ、ｐＳＩＲ（Ｃｌｏｎｔｅｃｈ）、ｐＩＲＥＳ－ＥＧＦＰ（Ｃｌｏｎｔｅｃｈ）、ｐＥＡＫ－１０（ＥｄｇｅＢｉｏｓｙｓｔｅｍｓ）ｐＴｒｉＥｘ－Ｈｙｇｒｏ（Ｎｏｖａｇｅｎ）、およびｐＣＩＮｅｏ（Ｐｒｏｍｅｇａ）が挙げられる。ピキア・パストリス（Pichia pastoris）に好適なプラスミドベクターの非限定的な例は、例えば、プラスミドｐＡＯ８１５、ｐＰＩＣ９Ｋ、およびｐＰＩＣ３．５Ｋ（全てＩｎｖｉｔｒｏｇｅｎ）を含む。

一般的に、ベクターは、クローニングまたは発現用の１つまたは複数の複製開始点（ｏｒｉ）および遺伝系、宿主での選択用の１つまたは複数のマーカー、例えば、抗生物質耐性、ならびに１つまたは複数の発現カセットを含んでもよい。好適な複製開始点の例としては、例えば、全長ＣｏｌＥ１、ｐＵＣプラスミドに存在するもの等のその短縮型、ＳＶ４０ウイルスおよびＭ１３ファージ複製開始点が挙げられる。選択可能なマーカーの非限定的な例としては、アンピシリン、クロラムフェニコール、テトラサイクリン、カナマイシン、ｄｈｆｒ、ｇｐｔ、ネオマイシン、ヒグロマイシン、ブラストサイジン、またはジェネテシンが挙げられる。

さらに、前記ベクターは、本明細書で規定されている前記ヌクレオチド配列または核酸分子に作動可能に連結された調節配列を含む。

コード配列、例えば、ベクターに含まれる、ＰＡリッチポリペプチドをコードする前記ヌクレオチド配列は、確立されている方法を使用して、（ａ）転写調節エレメントおよび／または他のアミノ酸コード配列に連結することができる。そのような調節配列は当業者に周知であり、限定ではないが、転写の開始を保証する調節配列、内部リボソーム進入部位（ＩＲＥＳ）、ならびに任意選択で、転写の終結および転写物の安定化を保証する調節エレメントが挙げられる。転写の開始を保証するそのような調節配列の非限定的な例は、プロモーター、翻訳開始コドン、エンハンサー、インスレーター、および／または転写終結を保証する調節エレメントを含む。さらに、例としては、ＲＮＡスプライシングの供与および受容部位により隣接されているコザック配列および介在配列、分泌シグナルをコードする核酸配列、または、使用される発現系に応じて、発現されたタンパク質を細胞区画または培養培地へと方向付けることが可能なシグナル配列が挙げられる。

好適なプロモーターの例としては、限定ではないが、サイトメガロウイルス（ＣＭＶ）プロモーター、ＳＶ４０プロモーター、ＲＳＶ（ラウス肉腫ウイルス）プロモーター、ｌａｃＺプロモーター、ニワトリβ－アクチンプロモーター、ＣＡＧプロモーター（ニワトリβ－アクチンプロモーターおよびサイトメガロウイルス最初期エンハンサーの組合せ）、ヒト伸長因子１αプロモーター、ＡＯＸ１プロモーター、ＧＡＬ１プロモーター、ＣａＭ－キナーゼプロモーター、ｌａｃ、ｔｒｐ、またはｔａｃプロモーター、ｌａｃＵＶ５プロモーター、Ｔ７またはＴ５プロモーター、オートグラファ・カリフォルニカ（Autographa californica）多核多角体病ウイルス（ＡｃＭＮＰＶ）多角体プロモーター、または哺乳動物および他の動物細胞のグロビンイントロンが挙げられる。エンハンサーの一例は、例えばＳＶ４０エンハンサーである。転写終結を保証する調節エレメント／配列の非限定的な追加の例としては、ＳＶ４０ポリＡ部位、ｔｋポリＡ部位、またはＡｃＭＮＰＶ多角体ポリアデニル化シグナルが挙げられる。

さらに、発現系に応じて、ポリペプチドを細胞区画へと方向付けることが可能であるか、またはそれを培地内に分泌させることが可能であるリーダー配列を、本明細書で提供される核酸分子のコード配列に追加してもよい。リーダー配列は、翻訳、開始、および終結配列とインフレームで構築されており、好ましくは、リーダー配列は、翻訳されたタンパク質またはその部分の分泌を、細胞周辺腔へとまたは細胞外培地へと方向付けることが可能である。好適なリーダー配列は、例えば、大腸菌（E. coli）では、ＢＡＰ（細菌アルカリホスファターゼ）、ＣＴＢ（コレラ毒素サブユニットＢ）、ＤｓｂＡ、ＥＮＸ、ＯｍｐＡ、ＰｈｏＡ、ｓｔＩＩ、ＯｍｐＴ、ＰｅｌＢ、Ｔａｔ（ツインアルギニン透過系）のシグナル配列、ならびに真核細胞では、ウシ成長ホルモン、ヒトキモトリプシノーゲン、ヒト第ＶＩＩＩ因子、ヒトｉｇ－カッパ、ヒトインスリン、ヒトインターロイキン－２、メトリダ（Metrida）またはバルグラ（Vargula）に由来するルシフェラーゼ、ヒトトリプシノーゲン－２、クリベロマイセス・マルキシアヌス（Kluyveromyces marxianus）に由来するイヌリナーゼ、サッカロマイセス・セレビシエ（Saccharomyces cerevisiae）に由来する交尾因子アルファ－１、メリチン、およびヒトアズロシジン等のシグナル配列である。

また、ベクターは、タンパク質の正しい折り畳みを促進するための１つまたは複数のシャペロンをコードする追加の発現可能な核酸配列を含んでもよい。

好ましくは、本発明のベクターは、発現ベクターである。本発明による発現ベクターは、本発明の核酸分子、例えば、プロリン／アラニンリッチポリペプチドをコードするヌクレオチド配列および生理活性タンパク質をコードするヌクレオチド配列を含む核酸分子の複製および発現を方向付けることが可能である。添付の例では、（ｉ）プロリン、アラニン、およびセリンからなるポリペプチドをコードするヌクレオチド配列、ならびに（ｉｉ）ＩＬ－１Ｒａ等の生理活性タンパク質を含む発現ベクターを構築した。実施例６を参照されたい。プロリンおよびアラニンからなるポリペプチドをコードする核酸分子を含む例示的な発現ベクターは、実施例１０に示されている。

好適な細菌発現宿主は、例えば、大腸菌（Escherichia coli）に由来する菌株ＪＭ８３、Ｗ３１１０、ＫＳ２７２、ＴＧ１、ＢＬ２１（ＢＬ２１（ＤＥ３）、ＢＬ２１（ＤＥ３）ＰｌｙｓＳ、ＢＬ２１（ＤＥ３）ＲＩＬ、ＢＬ２１（ＤＥ３）ＰＲＡＲＥ等）、Ｏｒｉｇａｍｉ（Ｋ－１２）、ＯｒｉｇａｍｉＢ、またはＲｏｓｅｔｔａを含む。ベクター修飾、ＰＣＲ増幅、およびライゲーション技法については、Sambrook(2001) loc. cit. に記載されている方法を参照されたい。

加えて、バキュロウイルス系も、真核生物発現系で本発明の核酸分子を発現するためのベクターとして使用することができる。これらの態様では、ｐＦＢＤＭベクターを、発現ベクターとして使用することができる。ＭｕｌｔｉＢａｃバキュロウイルスＤＮＡへの挿入は、ＤＨ１０ＭｕｌｔｉＢａｃ大腸菌（E. coli）細胞の形質転換時に、Ｔｎ７転位配列により媒介される（Berger (2013) J. Vis. Exp. 77:50159, Fitzgerald (2006) Nat. Methods. 2006 3:1021-1032.）。ウイルス増幅および発現は、Ｓｆ２１（スポドプテラ・フルギペルダ（Spodoptera frugiperda））またはＨｉｇｈＦｉｖｅ（イラクサギンウワバ（Trichoplusia ni））細胞で実施することができる。

本明細書の上記に記載されている本発明の核酸分子および／またはベクターは、例えば、非化学的な方法（エレクトロポレーション、ソノポレーション、光学形質移入、遺伝子電気泳動転写、流体力学的送達、または細胞を本発明の核酸分子と接触させる際に自然に生じる形質転換）、化学薬品に基づく方法（リン酸カルシウム、ＤＭＳＯ、ＰＥＧ、リポソーム、ＤＥＡＥ－デキストラン、ポリエチレンイミン、ヌクレオフェクション等）、粒子に基づく方法（遺伝子ガン、マグネトフェクション、インパルフェクション（impalefection））、ファージまたはファージミドベクターに基づく方法およびウイルス方法により細胞内に導入するために設計することができる。例えば、核酸分子を標的細胞集団に送達するために、レトロウイルス、ワクシニアウイルス、アデノ随伴ウイルス、ヘルペスウイルス、セムリキ森林ウイルス、またはウシパピローマウイルス等のウイルスに由来する発現ベクターを使用することができる

好ましくは、本発明の核酸分子および／またはベクターは、エレクトロポレーションによるエレクトロコンピテント大腸菌（E. coli）の形質転換用に、またはリン酸カルシウム、ポリエチレンイミン、もしくはリポフェクタミン形質移入によるＣＨＯ細胞の安定形質移入用に設計されている（Pham (2006) Mol. Biotechnol. 34:225-237；Geisse(2012) Methods Mol. Biol. 899:203-219；Hacker (2013) Protein Expr. Purif. 92:67-76）。

本発明は、本発明のベクターまたは核酸分子で形質転換された宿主細胞または非ヒト宿主にも関する。本発明によると、用語「本発明のベクターで形質転換された宿主細胞または非ヒト宿主」は、本発明のベクターまたは核酸分子を含む宿主細胞または非ヒト宿主に関することが理解されるだろう。ポリペプチドを発現するための宿主細胞は、当技術分野で周知であり、原核細胞ならびに真核細胞を含む。したがって、宿主は、細菌、哺乳動物細胞、藻細胞、繊毛虫、酵母、および植物細胞からなる群から選択することができる。

典型的な細菌としては、エシェリキア属（Escherichia）、コリネバクテリウム属（Corynebacterium）（グルタミカム（glutamicum））、シュードモナス属（Pseudomonas）（フルオレッセンス（fluorescens））、ラクトバチルス属（Lactobacillus）、ストレプトミセス属（Streptomyces）、サルモネラ属（Salmonella）、バチルス属（Bacillus）（バチルス・メガテリウム（Bacillus megaterium）またはバチルス・スブチリス（Bacillus subtilis）等）、またはコリネバクテリウム属（Corynebacterium）（コリネバクテリウム・グルタミカム（Corynebacterium glutamicum）のような）が挙げられる。本明細書では、最も好ましい細菌宿主は、大腸菌（E. coli）である。本明細書で使用される例示的な繊毛虫は、テトラヒメナ属（Tetrahymena）、例えばテトラヒメナ・サーモフィラ（Tetrahymena thermophila）である。

典型的な哺乳動物細胞としては、Ｈｅｌａ、ＨＥＫ２９３、ＨＥＫ２９３Ｔ、Ｈ９、Ｐｅｒ．Ｃ６、およびジャーカット細胞、マウスＮＩＨ３Ｔ３、ＮＳ０、およびＣ１２７細胞、ＣＯＳ１、ＣＯＳ７、およびＣＶ１、ウズラＱＣ１－３細胞、マウスＬ細胞、マウス肉腫細胞、Ｂｏｗｅｓメラノーマ細胞、ならびにチャイニーズハムスター卵巣（ＣＨＯ）細胞が挙げられる。本発明による最も好ましい哺乳動物宿主細胞は、ＣＨＯ細胞である。本明細書で使用される例示的な宿主は、モンゴルキヌゲネズミ属（Cricetulus）、例えばモンゴルキヌゲネズミ（Cricetulus griseus）（チャイニーズハムスター）である。ヒト胚腎臓（ＨＥＫ）細胞も好ましい。

他の好適な真核宿主細胞は、例えば、ピキア・パストリス（Pichia pastoris）、クリベロマイセス・ラクティス（Kluyveromyces lactis）、サッカロマイセス・セレビシエ（Saccharomyces cerevisiae）、およびシゾサッカロミセス・ポンベ（Schizosaccharomyces pombe）等の酵母、または例えばＤＴ４０細胞等のニワトリ細胞である。発現に好適な昆虫細胞は、例えば、ショウジョウバエ（Drosophila）Ｓ２、ショウジョウバエ（Drosophila）Ｋｃ、スポドプテラ（Spodoptera）Ｓｆ９およびＳｆ２１、またはトリコプルシア（Trichoplusia）Ｈｉ５細胞である。好ましい藻細胞は、コナミドリムシ（Chlamydomonas reinhardtii）またはシネココッカス・エロンガツス（Synechococcus elongatus）細胞等である。例示的な植物は、ニセツリガネゴケ属（Physcomitrella）、例えばヒメツリガネゴケ（Physcomitrella patens）である。例示的な植物細胞は、ニセツリガネゴケ属（Physcomitrella）植物細胞、例えばヒメツリガネゴケ（Physcomitrella patens）植物細胞である。

初代哺乳動物細胞または細胞株も、本発明の範囲内にある。初代細胞とは、生物から直接得られる細胞である。好適な初代細胞は、例えば、マウス胚線維芽細胞（ＭＥＦ）、マウス初代肝細胞、心筋細胞、およびニューロン細胞、ならびにマウス筋肉幹細胞（衛星細胞）、ヒト皮膚および肺線維芽細胞、ヒト上皮細胞（鼻、気管、腎、胎盤、腸、気管支の上皮細胞）、ヒト分泌細胞（唾液腺、皮脂腺、および汗腺からの）、ヒト内分泌細胞（甲状腺細胞）、ヒト脂肪細胞、ヒト平滑筋細胞、ヒト骨格筋細胞、Ｂ細胞、Ｔ細胞、ＮＫ細胞、または樹状細胞等のヒト白血球、およびそれらに由来する安定不死化細胞株（例えば、ｈＴＥＲＴまたはオンコジーン不死化細胞）である。上述の宿主細胞の適切な培養培地および条件は、当技術分野で公知である。

宿主細胞を使用して、例えば、本明細書で提供される核酸分子、本明細書で提供されるコードされたポリペプチド、および／または本明細書で提供される前記薬物コンジュゲートを大量に産生することができる。したがって、宿主細胞を使用して、本明細書で提供される核酸分子、ＰＡリッチポリペプチドをコードするヌクレオチド配列を含む核酸分子によりコードされるポリペプチド、ならびに／またはＰＡリッチポリペプチドおよび生理活性タンパク質をコードするヌクレオチド配列を含む核酸分子によりコードされるポリペプチドを大量に産生することができる。

したがって、本発明は、本明細書で提供される核酸分子またはベクターを調製するための方法であって、本発明の宿主または宿主細胞を好適な条件下で培養すること、ならびに任意選択で、産生された核酸分子および／またはベクターを単離することを含む方法にも関する。

さらに、本発明は、本明細書で提供される核酸分子またはヌクレオチド配列によりコードされるポリペプチドを調製するための方法であって、本発明の宿主または宿主細胞を好適な条件下で培養すること、および任意選択で、産生されたポリペプチドを単離することを含む方法に関する。

さらに、本発明は、薬物コンジュゲートを調製するための方法であって、本発明の宿主細胞を好適な条件下で培養すること、および任意選択で、産生された前記薬物コンジュゲートを単離することを含む方法に関する。好ましくは、本発明は、薬物コンジュゲートを調製するための方法であって、前記薬物コンジュゲートが、プロリン、アラニン、および任意選択でセリンからなるポリペプチドならびに生理活性タンパク質をコードするヌクレオチド配列を含む核酸分子によりコードされている、方法に関する。

したがって、本発明は、一態様では、薬物コンジュゲートを調製するための方法であって、前記薬物コンジュゲートが、本明細書で規定されている核酸分子によりコードされたポリペプチドを含み、（ｉ）生理活性タンパク質および／または（ｉｉ）低分子および／または（ｉｉｉ）炭水化物をさらに含み、方法が、本明細書で提供される宿主または宿主細胞を培養すること、ならびに任意選択で、産生されたポリペプチドおよび／または薬物コンジュゲートを単離することをさらに含む方法に関する。例えば、薬物コンジュゲートが、本明細書で規定されている核酸分子によりコードされたポリペプチドを含み、生理活性タンパク質をさらに含む融合タンパク質である場合、本方法は、本明細書で提供される宿主または宿主細胞（すなわち、本明細書で提供される、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸、ならびに本明細書で規定されている生理活性タンパク質、特に治療的活性タンパク質をコードする核酸を含む宿主または宿主細胞）を培養すること、および任意選択で、産生された融合タンパク質（薬物コンジュゲート）を単離することをさらに含んでもよい。無論、薬物コンジュゲートがタンパク質である場合、本方法は、本明細書で提供される宿主または宿主細胞（すなわち、本明細書で提供される、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸を含む宿主または宿主細胞）を培養すること、および／または本明細書で規定されている生理活性タンパク質、特に治療的活性タンパク質をコードする核酸を含む宿主もしくは宿主細胞を培養すること、ならびに任意選択で、プロリン、アラニン、および任意選択でセリンからなる産生されたポリペプチドを単離すること、ならびに／または産生された生理活性タンパク質を単離すること、ならびにさらに任意選択で、ポリペプチドおよび生理活性タンパク質をコンジュゲートして（例えば、化学的カップリングにより）、薬物コンジュゲート産生することも含んでもよい。

例えば、薬物コンジュゲートが、本明細書で規定される核酸分子によりコードされたポリペプチド（すなわち、本明細書で提供される、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸）の、ならびに低分子のおよび／または炭水化物のコンジュゲートである場合、本方法は、本明細書で提供される宿主または宿主細胞（すなわち、本明細書で提供されるプロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードする核酸を含む宿主または宿主細胞）を培養すること、ならびに任意選択で、産生されたポリペプチドを単離すること、ならびにさらに任意選択で、ポリペプチドを、低分子および／または炭水化物とコンジュゲートすること（例えば、化学的カップリングにより）をさらに含んでもよい。

「宿主または宿主細胞を培養する」ことは、この状況では、宿主または宿主細胞中で、本明細書で規定されているポリペプチドおよび／または生理活性タンパク質を発現させることを含む。

添付の例には、（ｉ）プロリン、アラニン、およびセリンからなるポリペプチドをコードするヌクレオチド配列、ならびに（ｉｉ）ＩＬ－１Ｒａ等の生理活性タンパク質を含むそのような核酸分子を、細菌で発現させ、その後精製することができることが示されている。実施例８および図７を参照されたい。さらに、本明細書には、本明細書で提供される核酸分子によりコードされた、プロリンおよびアラニンからなるポリペプチドを発現させ、精製することができることが示されている。例えば、実施例１１および図８を参照されたい。プロリン、アラニン、および任意選択でセリンからなるコードされたポリペプチドを、低分子薬物、炭水化物、および／または生理活性タンパク質とコンジュゲートすることにより、低分子／低分子薬物および／または生理活性タンパク質の血漿内半減期および／または溶解度を増加させ、非特異的毒性を減少させることができ、標的細胞または構造に対する活性薬物の体内での曝露を延長させることにより、薬物動力学の増強をもたらすことができる。

本発明の宿主に存在するベクターは、発現ベクター、またはタンパク質の発現が保証されるような様式で、宿主細胞のゲノムへの本発明の核酸分子の安定した組み込みを媒介するベクターのいずれかである。タンパク質の発現が保証されるように本発明の核酸分子を導入することに成功した宿主細胞を選択するための手段および方法は、当技術分野で周知であり、記載されている（Browne (2007) Trends Biotechnol. 25:425-432；Matasci (2008) Drug Discov. Today: Technol. 5:e37-e42；Wurm (2004) Nat. Biotechnol. 22:1393-1398）。

原核または真核宿主細胞の培養に好適な条件は、当業者に周知である。例えば、例えば大腸菌（E. coli）等の細菌は、ルリアベルターニ（ＬＢ）培地中で通気しながら、典型的には４から約３７℃までの温度で培養することができる。発現産物の収量および溶解度を増加させるために、培地を緩衝化してもよく、またはこれらを両方とも増強または促進することが知られている好適な添加剤で補完してもよい。誘導可能なプロモーターが、宿主細胞に存在するベクター内の本発明の核酸分子を制御する場合、ポリペプチドの発現は、例えば、添付の例で使用されているようなイソプロピル－β－Ｄ－チオガラクトピラノシド（ＩＰＴＧ）またはアンヒドロテトラサイクリン（ａＴｃ）等の適切な誘導剤を添加することにより誘導することができる。好適な発現プロトコールおよび戦略は、当技術分野に、例えば、Sambrook (2001) loc. cit.、（Gebauer (2012) Meth. Enzymol. 503:157-188）に記載されており、必要に応じて、特定の宿主細胞の必要性および発現させようとするタンパク質の必要条件に適合させることができる。

細胞タイプおよびその特定の必要条件に応じて、哺乳動物細胞培養は、例えば、１０％（ｖ／ｖ）ＦＣＳ、２ｍＭＬ－グルタミン、および１００Ｕ／ｍｌペニシリン／ストレプトマイシンを含む、ＲＰＭＩ、Ｗｉｌｌｉａｍｓ’Ｅ、またはＤＭＥＭ培地で実施することができる。ＤＴ４０ニワトリ細胞の場合、細胞は、例えば、３７℃または４１℃にて、５％ＣＯ_２の水飽和大気中で維持することができる。昆虫細胞培養用の好適な培地は、例えば、ＴＮＭ＋１０％ＦＣＳ、ＳＦ９００、またはＨｙＣｌｏｎｅＳＦＸ昆虫培地である。昆虫細胞は、通常、接着または懸濁培養として２７℃で増殖させる。真核生物または脊椎動物細胞の好適な発現プロトコールは、当業者に周知であり、例えば、Sambrook (2001) (loc. cit)に見出すことができる。

好ましくは、本発明の核酸分子、ベクター、ポリペプチド、および／または薬物コンジュゲートを調製するための方法は、例えば大腸菌（E. coli）細胞等の細菌細胞、または例えばＣＨＯ細胞等の哺乳動物細胞のいずれかを使用して実施される。より好ましくは、本方法は、大腸菌（E. coli）細胞またはＣＨＯ細胞を使用して実施され、最も好ましくは、本方法は、大腸菌（E. coli）細胞を使用して実施される。

産生されたコードされたポリペプチドを単離するための方法は、限定ではないが、親和性クロマトグラフィー（好ましくは、ＳｔｒｅｐタグＩＩまたはＨｉｓ_６タグ等の融合タグを使用して）、ゲル濾過（サイズ排除クロマトグラフィー）、陰イオン交換クロマトグラフィー、陽イオン交換クロマトグラフィー、疎水性相互作用クロマトグラフィー、高圧液体クロマトグラフィー（ＨＰＬＣ）、逆相ＨＰＬＣ、硫安沈殿、または免疫沈降等の精製ステップを含む。これら方法は、当技術分野で周知であり、例えば、Sambrook (2001) loc. cit.に一般的に記載されており、添付の例にも記載されている。例えば、実施例８および１１を参照されたい。そのような方法は、実質的に純粋なポリペプチドを提供する。前記純粋なポリペプチドは、好ましくは少なくとも約９０～９５％（タンパク質レベルで）、より好ましくは少なくとも約９８～９９％の均質性を有する。最も好ましくは、これらの純粋なポリペプチドは、薬学的使用／応用に好適である。また、本明細書では、食品または化粧品産業での応用が想定される。産生手順で使用される宿主細胞／生物に応じて、本発明のコードされたポリペプチドは、グリコシル化されていてもよく、またはグリコシル化されていなくともよい。好ましくは、本発明の核酸分子によりコードされた、プロリン、アラニン、および任意選択でセリンからなるポリペプチドは、グリコシル化されていない。最も好ましくは、本発明の核酸分子によりコードされた、プロリン、アラニン、および任意選択でセリンからなるポリペプチドは、例えばプロリンヒドロキシル化等により、その側鎖が翻訳後修飾されていない。

コードされたランダムコイルポリペプチドは、アラニン、プロリン、および任意選択でセリン残基から主になり、Ｏ－グリコシル化またはＮ－グリコシル化に必要なセリン、トレオニン、またはアスパラギンは、好ましくは存在しない。したがって、ポリペプチド自体の、またはコードされたランダムコイルポリペプチドを含む生理活性タンパク質の産生は、好ましくは、Ｐｒｏ／Ａｌａ／ＳｅｒまたはＰｒｏ／Ａｌａ配列内に翻訳後修飾を欠如する単分散性産物をもたらすことができる。これは、複雑なタンパク質の生合成に選択されることが多い、チャイニーズハムスター卵巣細胞（ＣＨＯ）、ＨＥＫ細胞、または酵母のような、真核細胞で組換えタンパク質を産生する利点である。

本発明は、薬物コンジュゲートを調製するための方法であって、前記薬物コンジュゲートが、本明細書で提供される本発明の核酸分子によりコードされたポリペプチドを含み、（ｉ）生理活性タンパク質および／または（ｉｉ）低分子および／または（ｉｉｉ）炭水化物をさらに含む、方法にも関する。そのような炭水化物コンジュゲートは、ワクチンとして特に有用であり得る。

上述のように、ＰＡリッチポリペプチドおよび生理活性タンパク質を含む薬物コンジュゲートは、ＰＡリッチポリペプチドをコードするヌクレオチド配列および生理活性タンパク質をコードする核酸配列を含む核酸分子を発現させることより調製することができる。発現された薬物コンジュゲートは単離してもよい。あるいは、薬物コンジュゲートは、プロリン、アラニン、および任意選択でセリンからなる前記ポリペプチドをコードするヌクレオチド配列または核酸分子を含む宿主を培養／成長させることにより調製することができる。したがって、核酸分子は、宿主中で発現される。任意選択で、前記産生されたポリペプチドを単離する。プロリン、アラニン、および任意選択でセリンからなる産生されたポリペプチドを、例えばペプチド結合または非ペプチド結合により、生理活性タンパク質にコンジュゲートすることができる。

実例には、本明細書で提供される核酸分子によりコードされたＰＡリッチポリペプチドは、細菌で発現させることができ、それらから精製することができることが示されている。例えば、実施例１１および図８を参照されたい。特に、驚くべきことに、調製されたポリペプチドの開始メチオニン（Ｎ末端メチオニン）は、切断されており、したがって、産生されたポリペプチドには欠如していることが示された。例えば、実施例１２および図８Ｄを参照されたい。調製されたポリペプチドに開始メチオニンが欠如することにより、生理活性タンパク質、低分子、および／または炭水化物のＮ末端を、次のアミノ酸（開始メチオニンの後）の一級アミノ基にシームレスにコンジュゲートすることが可能になる。したがって、本発明の核酸分子およびそれらの調製されたポリペプチドは、例えば、生理活性タンパク質とのコンジュゲーションに特に有利である。

特に、生理活性タンパク質は、例えば、Ｎ－（３－ジメチルアミノプロピル）－Ｎ’－エチルカルボジイミド（ＥＤＣ）またはＮ－ヒドロキシサクシニミド（ＮＨＳ）エステル等の活性化剤の存在下で（Hermanson (1996) Bioconjugate Techniques, 1st edition, Academic Press, San Diego, CA）、産生されたランダムコイルポリペプチドのＮ末端と、部位特異的にコンジュゲートしてもよい。あるいは、生理活性タンパク質は、例えば、ＥＤＣ等の活性化剤の存在下で、または活性化後のＮＨＳエステルとして、プロリン、アラニン、および任意選択でセリンからなる産生されたランダムコイルポリペプチドのＣ末端と、部位特異的にコンジュゲートしてもよい。

さらに、プロリン、アラニン、および任意選択でセリンからなる産生されたポリペプチドは、非ペプチド結合を介して、低分子および／または炭水化物にコンジュゲートすることができる。タンパク質の架橋に有用な非ペプチド結合は、当技術分野で公知であり、例えば２つのＣｙｓ側鎖および／またはチオール基間のジスルフィド結合、チオエーテル結合、ならびにカルボキシル基とアミノ基とのアミド結合を含み得る。非ペプチド共有結合は、スベリン酸ジサクシンイミジル（ＤＳＳ）、Ｎ－β－マレイミドプロピル－オキシスクシンイミドエステル（ＢＭＰＳ）、またはスルホサクシニミジル４－［ｐ－マレイミドフェニル］ブチレート（スルホ－ＳＭＰＢ）等の化学的架橋剤、金属キレート／錯体形成基、ならびに非共有結合性のタンパク質－タンパク質またはタンパク質－ペプチド相互作用により提供することもできる。

さらに、低分子薬物を、ランダムコイルを形成するポリペプチドと、部位特異的にコンジュゲートすることができる。任意選択で、ポリペプチドのＮ末端は、好適な保護基、例えばアセチル基またはピログルタミル基で修飾することができ、例えば、一般的な試薬ＥＤＣおよびＮＨＳを使用して、Ｃ末端カルボキシレート基を活性化した後で（Hermanson (1996) loc. cit.）、ランダムコイルポリペプチドのＣ末端と薬物との部位特異的カップリングを達成することができる。このようにして、均一な薬物コンジュゲートを容易に得ることができる。

単一の部位特異的コンジュゲーションの代わりに、プロリン、アラニン、および任意選択でセリンからなるランダムコイルポリペプチドは、ε－アミノ基を有するリジン残基、チオール基を有するシステイン残基、またはさらに非天然アミノ酸等の化学的修飾に好適な追加の側鎖を、Ｎ－もしくはＣ－末端にまたは内部に備え、例えばＮＨＳまたはマレイミド活性基を使用して、１つ、２つ、または複数の低分子のコンジュゲーションを可能にしてもよい。

安定コンジュゲーションとは別に、プロドラッグが、ランダムコイルポリペプチドと一時的に連結されていてもよい。連結は、予測可能な様式で、酵素機序、または例えば難溶性抗腫瘍剤カンプトテシンをＰＥＧポリマーにコンジュゲートした場合と同様の生理学的ｐＨで開始される遅延加水分解のいずれかにより、ｉｎｖｉｖｏで切断されるように設計することができ、したがって、生体内分布の増加、毒性の減少、効力の増強、および腫瘍蓄積を達成することができる（Conover (1998) Cancer Chemother. Pharmacol. 42:407-414）。さらなるプロドラッグの例は、ドセタキセル（Liu (2008) J. Pharm. Sci. 97:3274-3290）、ドキソルビシン（Veronese (2005) Bioconjugate Chem. 16: 775-784）、またはパクリタキセル（Greenwald (2001) J. Control Release 74:159-171）のような化学療法剤である。

本明細書では、低分子を、融合タンパク質、例えば、標的指向性ドメイン、例えば抗体断片と遺伝子的に融合されている、プロリン、アラニン、任意選択でセリンからなり、ランダムコイルを形成するポリペプチドとカップリングさせ、したがって、低分子薬物の特異的送達をもたらすことができることも想定されている。細胞毒性低分子とのコンジュゲーションにより後者の場合に生成される免疫毒素は、標的指向性ドメインが、例えば内部移行を起こす細胞表面受容体に向けられている場合、特に有用である。

本明細書で使用される場合、用語「薬物」は、低分子、生理活性タンパク質、ペプチド、または炭水化物を指す。本明細書で使用される場合、用語「低分子」は、（有機）低分子量（＜９００ダルトン）化合物を指す場合がある。低分子は、生物学的プロセスの調節を支援することができ、通常、ナノメートル程度のサイズを有する。本明細書では、低分子は、治療法、診断法で使用されるか、または食品もしくは化粧品産業で使用されることが想定されている。例えば、本明細書で提供されるヌクレオチド配列または核酸分子によりコードされる産生されたポリペプチドとの薬物コンジュゲートは、（ａ）血管新生阻害剤、抗アレルギー薬、制吐薬、抗うつ薬、抗高血圧薬、抗炎症薬、抗感染症薬、抗精神病薬、抗増殖（細胞毒性および細胞増殖抑制）薬、カルシウムアンタゴニストおよび他の循環器薬、コリン作動性アゴニスト、中枢神経系に作用する薬物、呼吸器系に作用する薬物、ステロイド、アンチセンス核酸、低分子干渉ＲＮＡ（ｓｉＲＮＡ）、マイクロＲＮＡ（ｍｉＲ）阻害剤、マイクロＲＮＡ模倣体、ＤＮＡアプタマー、およびＲＮＡアプタマーからなる群から選択される低分子を含んでもよい。

例示的な血管新生阻害剤としては、これらに限定されないが、ＭｅｔＡＰ２阻害剤（フマギリン、フマギリン誘導体、２－｛３－［３，５－ビス［４－ニトロベンジリデン］－４－オキソピペリジン－１－イル］－３－オキソプロピルスルファニル｝エタンスルホン酸のような）、ＶＧＦＲ阻害剤（アキシチニブ、ブリバニブ、カボザンチニブ、チボザニブ、およびモテサニブのような）、胎盤成長因子（ＰＩＧＦ）阻害剤、および血小板由来成長因子受容体阻害剤（ＡＣ７１０、ソラフェニブ、スニチニブ、およびバタラニブのような）等が挙げられる。

例示的な抗アレルギー薬としては、これらに限定されないが、抗ヒスタミン剤（ジフェンヒドラミン（ベナドリル）、ジメンヒドリナート（ドラマミン、ドリミナート（driminate））、塩酸ヒドロキシジン（レストール（restall）、ビスタコート（vistacot））、およびプロメタジン（フェネルガン）のような）等が挙げられる。

例示的な抗うつ薬としては、これらに限定されないが、グラニセトロンおよびパロノセトロン等が挙げられる。

例示的な抗うつ薬としては、これらに限定されないが、ｃｉｓ－フルペンチキソール、塩酸イミプラミン、およびミアンセリン等が挙げられる。

例示的な抗高血圧薬としては、これらに限定されないが、アルプロスタジル、ジアゾキシド、およびニカルジビン等が挙げられる。

例示的な抗炎症薬としては、これらに限定されないが、コルチゾン、ヒアルロン酸、およびケトロラク等が挙げられる。

例示的な抗感染症薬としては、これらに限定されないが、アミノグリコシド、アマドビル（amadovir）、アモキシシリン、アンピシリン、ベンジルペニシリン、カルバペネム、セファロスポリン、セフチオフル、クロラムフェニコール、セフェピム、セフタジジム、セフトビプロール、クリンダマイシン、ドラクシン、ダルババンシン、ダプトマイシン、ジヒドロストレプトマイシン、エリスロマイシン、フロルフェニコール、フルオロキノロン、フルニキシンメグルミン、リネゾリド、マルボフロキサシン、ミカファンギン、ニトロフラゾン、オリタバンシン、オキシテトラサイクリン、ペニシリン、ピペラシリン、プロカイン（procain）、ルピントリビル（rupintrivir）、スピラマイシン、ストレプトグラミン、スルファジメトキシン（sulfadimethoxin）、スルファメタジン、テジゾリド、テラバンシン、チカルシリン、チルミコシン、チゲサイクリン、チルジピロシン、チロシン、およびバンコマイシン等が挙げられる。

例示的な抗精神病薬としては、これらに限定されないが、アミスルプリド（amisulprid）、アリプラゾール（ariprazole）、ベンペリドール、ブロムペリドール、クロルプロマジン（clorpromazin）、クロルプロチキセン（chlorprothixen）、クロペンチキソール、クロザピン、フルペンチキソール、フルフェナジン（fluphenazin）、フルスピリレン（fluspirilen）、ハロペリドール、レボメプロマジン（levomepromazin）、メルペロン（melperon）、オランザピン、ペラジン（perazin）、ペルフェナジン（perphenazin）、ピモジド（pimozid）、ピパンペロン（pipamperon）、プロマジン（promazin）、プロメタジン、プロチペンジル、クエチアピン、リスペリド（risperido）、スルピリド（sulpirid）、チオリダジン（thioridazin）、トリフルオペラジン（trifluoperazin）、トリフルプロマジン（triflupromazin）、およびズクロペンチキソール等が挙げられる。

例示的な抗腫瘍薬としては、これらに限定されないが、アントラサイクリン（ドキソルビシン、エピルビシン、イダルビシン、およびダウノルビシンのような）、アルキル化剤（カリチアマイシン、ダクチノマイシン、ミトロマイシン（mitromycine）、およびピロロベンゾジアゼピンのような）、ＡＫＴ阻害剤（ＡＴ７８６７のような）、アマトキシン（ａｘ－アマニチン、Ｐ－アマニチン、ｙ－アマニチン、ｃ－アマニチン、アマヌリン、アマヌリン酸、アマニンアミド、アマニン、およびプロアマヌリン、ＳＮ－３８、ならびにカンプトテシンのような）、ＡＴＭ阻害剤、オーリスタチン（オーリスタチンＥＢ（ＡＥＢ）、オーリスタチンＥＦＰ（ＡＥＦＰ）、モノメチルオーリスタチンＥ（ＭＭＡＥ）、モノメチルオーリスタチンＦ（ＭＭＡＦ）、オーリスタチンＦ、およびドラスタチンのような）、クリプトフィシン、サイクリン依存性キナーゼ阻害剤（ＢＭＳ－３８７０３２、ＰＤ０３３２９９１、ＧＳＫ４２９２８６、ＡＺＤ７７６２；ＡＺＤ１１５２、ＭＬＮ８０５４、およびＭＬＮ８２３７；ＢＩ２５３６、Ｂ１６７２７、ＧＳＫ４６１３６４、ＯＮ－０１９１０、ＳＢ７４３９２１、ＳＢ７１５９９２、ＭＫ－０７３１、ＡＺＤ８４７７、ＡＺ３１４６、およびＡＲＲＹ－５２０のような）、デュオカルマイシン、ＤＮＡ－ＰＫ阻害剤、エポチロン（エポチロンＡ、Ｂ、Ｃ、Ｄ、Ｅ、またはＦ、および誘導体のような）、ＧＳＫ－３阻害剤、ＨＤＡＣ阻害剤（ベリノスタット、ＣＵＤＣ－１０１、ドロキシノスタット、ＩＴＦ２３５７、ＪＮＪ－２６４８１５８５、ＬＡＱ８２４、およびパノビノスタットＭＣ１５６８、モセチノスタット、エンチノスタット、ＰＣＩ－２４７８１、ピロキサミド、トリコスタチンＡ、およびボリノスタットのような）、ｈｓｐ７０阻害剤、ｈｓｐ９０阻害剤（１７ＡＡＧ誘導体、Ｂ１１Ｂ０２１、Ｂ１１Ｂ０２８、ＳＮＸ－５４２２、ＮＶＰ－ＡＵＹ－９２２、ＫＷ－２４７８、およびゲルダナマイシンのような）、ＭＡＰＫシグナル伝達経路阻害剤（ＭＥＫ、Ｒａｃｓ、ＪＮＫ、Ｂ－Ｒａｆのような）、マイタンシノイド、マイタンシノイド類似体（マイタンシノール、マイタンシノール類似体、マイタンシン、ＤＭ－１、およびＤＭ－４のような）、ｐ３８ＭＡＰＫ阻害剤（ＧＤＣ－０９７３、ＧＳＫ１１２０２１２、ＭＳＣ１９３６３６９Ｂ、ＡＳ７０３０２６、Ｒ０５１２６７６６、およびＲ０４９８７６５５、ＰＤ０３２５９０１、ＡＺＤ６２４４、ＡＺＤ８３３０、ＧＤＣ－０９７３、ＣＤＣ－０８７９、ＰＬＸ－４０３２、ＳＢ５９０８８５、ＢＩＲＢ７９６、ＬＹ２２２８８２０、ＳＢ２０２１９０、ＡＥＥ７８８、ＢＩＢＷ２９９２、アファチニブ、ラパチニブ、エルロチニブ、およびゲフィチニブのような）、ＰＡＲＰ阻害剤（イニパリブ、オラパリブ、ベリパリブ、ＡＧ０１４６９９、ＣＥＰ９７２２、ＭＫ４８２７、ＫＵ－００５９４３６、ＬＴ－６７３、３アミノベンズアミド、Ａ－９６６４９２、およびＡＺＤ２４６１のような）、ＰＤＫ－１阻害剤、白金化合物（シスプラチン、カルボプラチン、オキサリプラチン、イプロプラチン、オルマプラチン、またはテトラプラチンのような）、タキサン（taxan）（パクリタキセルおよび／またはドセタキセルのような）、チューブリシン（チューブリシンＡ、チューブリシンＢ、およびチューブリシン誘導体のような）、ビンカアルカロイド（ビンブラスチン、ビンデシン、およびナベルビンのような）、およびＷｎｔ／ヘッジホッグシグナル伝達経路阻害剤（例えばビスモデギブ、ＧＤＣ－０４４９、シクロパミン、およびＸＡＶ－９３９）等が挙げられる。

中枢神経系に作用する例示的な薬物としては、これらに限定されないが、ブプレノルフィン（buprenorphin）、クリオスタチン（cryostatin）、ナルトロキスレキソン（naltroxrexone）、およびナロキソン等が挙げられる。

例示的なビタミンとしては、これらに限定されないが、ビタミンＢ－１２（シアノコバラミン）およびビタミンＡ等が挙げられる。

例示的なステロイドとしては、これらに限定されないが、アンドロゲン性ステロイド（steriod）（フルオキシメステロン、メチルテストステロン、テストステロン、トレンボロンのような）、エストロゲン（ベータ－エストラジオール、ジエチルスチルベストロール、エストロン、エストリオール、エキリン、エストロピペート、エキリン、メストラノールのような）、およびプロゲステロン化合物（１９－ノルプロゲステロン、アルファプロストール、クロルマジノン、デメゲストン、ジドロゲステロン、ジメチステロン、エチステロン、二酢酸エチノジオール、ノルエチンドロン、酢酸ノルエチンドロン、メドロキシプロゲステロン、メレンゲストロールプロゲステロン、ノルゲストレル、プロメゲストン、ゼラノールのような）等が挙げられる。

例示的なアンチセンス核酸としては、これらに限定されないが、アンドロゲン受容体（ＩＳＩＳ－ＡＲ、ＡＺＤ５３１２のような）、アンギオポエチン様３タンパク質（ＩＳＩＳ－ＡＮＧＰＴＬ３のような）、アポリポタンパク質Ｂ１００（ミポメルセンのような）、アポリポタンパク質ＣＩＩＩ（ＩＳＩＳ－ＡＰＯＣＩＩＩ、ボランソルセンのような）、結合組織成長因子（ＣＴＧＦ）（ＥＸＣ００１、ＰＦ－０６４７３８７１のような）、クラステリン（クスチルセン、ＯＧＸ－０１１のような）、Ｃ－反応性タンパク質（ＩＳＩＳ－ＣＲＰのような）、ジアシルグリセロールアシルトランスフェラーゼ（ＩＳＩＳ－ＤＧＡＴ２のような）、第ＶＩＩ因子（ＩＳＩＳ－ＦＶＩＩのような）、線維芽細胞成長因子受容体４（ＩＳＩＳ－ＦＧＦＲ４のような）、ヘプシジン（ＸＥＮ７０１のような）、Ｈｓｐ２７（アパトルセン、ＯＧＸ－４２７のような）、ＨＴＴ遺伝子（ＩＳＩＳ－ＨＴＴのような）、ＩＣＡＭ－１（アリカホルセンのような）、プレカリクレン（prekallikren）（ＩＳＩＳ－ＰＫＫのような）、ＳＭＮ２（ＩＳＩＳ－ＳＭＮのような）、ＳＴＡＴ３（ＩＳＩＳ－ＳＴＡＴ３－２．５、ＡＺＤ９１５０のような）、およびトランスサイレチン遺伝子（ＩＳＩＳ－ＴＴＲのような）等を標的とするアンチセンス核酸が挙げられる。

例示的な低分子干渉ＲＮＡ（ｓｉＲＮＡ）としては、これらに限定されないが、アルファ－１－アンチトリプシン突然変異体Ｚ－ＡＡＴ（ＡＬＮ－ＡＡＴのような）、アミノレブリン酸シンターゼ１（ＡＬＡＳ－１）（ＡＬＮ－ＡＳ１、ＡＬＮ－ＡＳ２のような）、抗トロンビンＩＩＩ（ＡＬＮ－ＡＴ３のような）、補体成分Ｃ５（ＡＬＮ－ＣＣ５のような）、補体成分Ｃ６（ＡＬＮ－ＣＣ６のような）、結合組織成長因子（ＲＸＩ－１０９のような）、ジストロフィン遺伝子のエクソン８（ＳＲＰ－４００８のような）、ジストロフィン遺伝子のエクソン４４（ＳＲＰ－４０４４のような）、ジストロフィン遺伝子のエクソン４５（ＳＲＰ－４０４５のような）、ジストロフィン遺伝子のエクソン５０（ＳＲＰ－４０５０のような）、エボラウイルス（ＡＶＩ－７５３７のような）、ジストロフィン遺伝子のエクソン５１（エテプリルセン、ＡＶＩ－４６５８のような）、ジストロフィン遺伝子のエクソン５２（ＳＲＰ－４０５２のような）、ジストロフィン遺伝子のエクソン５３（ＳＲＰ－４０５３のような）、インフルエンザウイルス（ＡＶＩ－７１００のような）、キネシンスピンドルタンパク質（ＫＳＰ）、肺疾患（Ａｔｕ１１１のような）、マールブルグウイルス（ＡＶＩ－７２８８のような）、多標的低分子干渉ＲＮＡ（ｓｉＲＮＡ）カクテル（ＳＴＰ５０３、ＳＴＰ５２３、ＳＴＰ６０１、ＳＴＰ７０２、ＳＴＰ７０５、ＳＴＰ８０１、ＳＴＰ８０５、ＳＴＰ９００、ＳＴＰ９０２、ＳＴＰ９１１、ＳＴＰ９１６、ｓｉＰＯＯＬのような）、ウイルスゲノムのヌクレオカプシドＮ（ＡＬＮ－ＲＳＶ０１のような）、ＰＣＳＫ９（ＡＬＮ－ＰＣＳ０１、ＡＬＮ－ＰＣＳｓｃのような）、アポトーシス促進性タンパク質カスパーゼ２（ＱＰＩ－１００７のような）、アポトーシス促進性タンパク質ｐ５３（ＱＰＩ－１００２のような）、ＲＴＰ８０１（ＰＦ－６５５のような）、ＳＥＲＰＩＮＣ１（ＡＬＮ－ＡＴ４のような）、膜貫通プロテアーゼセリン６（Ｔｍｐｒｓｓ６）（ＡＬＮ－ＴＭＰのような）、トランスサイレチン（ＡＬＮ－ＴＴＲｓｃ、ＡＬＮ－ＴＴＲ０２のような）、ＰＣＳＫ１０（ＡＬＮ－ＰＣＳ０２のような）、ＰＫＮ３（Ａｔｕ０２７のような）、および血管内皮成長因子（ＶＥＧＦ）（ＡＬＮ－ＶＳＰのような）等を標的とするｓｉＲＮＡが挙げられる。

例示的なマイクロＲＮＡ阻害剤としては、これらに限定されないが、ｍｉＲ－１０ｂ、ｍｉＲ－１５、ｍｉＲ－２１、ｍｉＲ－２９、ｍｉＲ－３３、ｍｉＲ－９２、ｍｉＲ－１４５、ｍｉＲ１９５、ｍｉＲ－２０８、ｍｉＲ－２２１、ｍｉＲ－４５１、およびｍｉＲ－４９９等の阻害剤が挙げられる。

例示的なマイクロＲＮＡ模倣体としては、これらに限定されないが、ｍｉＲ－３４（ＭＲＸ３４のような）、ｍｉＲ－Ｒｘ０６、ｍｉＲ－Ｒｘ０７、ｍｉＲ－Ｒｘ１６の類似体、およびｌｅｔ７（ｍｉＲ－Ｒｘｌｅｔ－７のような）の類似体等が挙げられる。

例示的なＤＮＡアプタマーとしては、これらに限定されないが、ヌクレオリン阻害剤（ＡＳ１４１１のような）、ｐＧＤＦ阻害剤（Ｅ１００３０のような）、トロンビン阻害剤（ＮＵ１７２のような）、およびｖＷＦ阻害剤（ＡＲＣ１７７９のような）等が挙げられる。

例示的なＲＮＡアプタマーとしては、これらに限定されないが、Ｃ５ａ阻害剤（ＮＯＸ－Ｄ２１またはＡＲＣ１９０５のような）、カルシトニン遺伝子関連ペプチド阻害剤（ＮＯＸ－Ｌ４１のような）、Ｃ－Ｃケモカインリガンド２阻害剤（ＮＯＸ－Ｅ３６のような）、ＣＸＣＬ１２阻害剤（ＮＯＸ－Ａ１２のような）、グルカゴン阻害剤（ＮＯＸ－Ｇ１６のような）、ヘプシジンアンタゴニスト（ＮＯＸ－Ｈ９４のような）、病原体認識受容体アゴニスト（ＲＩＧ－Ｉアゴニストのような）、スフィンゴシン－１－リン酸阻害剤（ＮＯＸ－Ｓ９３のような）、およびＶＥＧＦアンタゴニスト（ＮＸ１８３８のような）等が挙げられる。

ワクチンの調製に潜在的に有用な例示的な炭水化物としては、限定ではないが、レクチン、大腸菌（E. coli）Ｏ１２１Ｏ－抗原、大腸菌（E. coli）Ｏ１２１Ｏ－抗原誘導体、ＨＩＶ－Ｉｇｐｌ２０由来のＭａｎ９、シゲラ・フレックスネリ（shigella flexneri）２ａＯ－ポリサッカライド、黄色ブドウ球菌（staphylococcus aureus）ポリサッカライド莢膜ポリサッカライド５、黄色ブドウ球菌（staphylococcus aureus）ポリサッカライド莢膜ポリサッカライド８、腫瘍関連炭水化物抗原（ＴＡＣＡ）（Ｔｎ抗原（例えば、α－ＧａｌＮＡｃ－Ｏ－Ｓｅｒ／Ｔｈｒ）、シアリルＴｎ抗原（例えば、ＮｅｕＡｃα（２，６）－ＧａｌＮＡｃα－Ｏ－Ｓｅｒ／Ｔｈｒ）、Ｔｈｏｍｓｅｎ－Ｆｒｉｅｄｅｎｒｅｉｃｈ抗原（Ｇａｌβ１－３ＧａｌＮＡｃα１）、ＬｅｗｉｓＹ（例えば、Ｆｕｃα（１，２）－Ｇａｌβ（１，４）－［Ｆｕｃα（１，３）］－ＧａｌＮＡｃ）、シアリルＬｅｗｉｓＸ、およびシアリルＬｅｗｉｓＡ、ＬｅｗｉｓＸ（ステージ特異的胎児抗原－１／ＳＳＥＡ－１）、ＧｌｏｂｏＨ抗原（例えば、Ｆｕｃα（１，２）－Ｇａｌβ（１，３）－ＧａｌＮＡｃβ（１，３）－Ｇａｌα（１，４）－Ｇａｌβ（１，４）－Ｇｌｃ）、Ｔ抗原（例えば、Ｇａｌβ（１，３）－ＧａｌＮＡｃα－Ｏ－Ｓｅｒ／Ｔｈｒ）、スフィンゴ糖脂質ステージ特異的胎児抗原－３（ＳＳＥＡ－３）、シアル酸含有スフィンゴ糖脂質、ガングリオシドＧＤ２、ＧＤ３、ガングリオシドＧＭ２、ガングリオシドフコシルＧＭ、およびガングリオシドＮｅｕ５ＧｃＧＭ３のような）等と特異的に結合する炭水化物エピトープが挙げられる。

本明細書で提供される本発明の核酸分子によりコードされたポリペプチドを含み、生理活性タンパク質および／または低分子および／または炭水化物を含む薬物コンジュゲートは、炎症性疾患、感染性疾患、呼吸器疾患、内分泌障害、中枢神経系の疾患、筋骨格疾患、心血管疾患、腫瘍学的疾患、泌尿生殖器疾患、および代謝疾患の治療に使用することができる。

例示的な炎症性疾患としては、これらに限定されないが、強直性脊椎炎、関節炎、アテローム性動脈硬化症、非典型溶血性尿毒症症候群（ａＨＵＳ）、線維筋痛、ギランバレー症候群（ＧＢＳ）、過敏性腸症候群（ＩＢＳ）、クローン病、大腸炎、皮膚炎、憩室炎、骨関節炎、乾癬性関節炎、ランバート－イートン筋無力症症候群、全身性紅斑性狼瘡（ＳＬＥ）、腎炎、パーキンソン病、多発性硬化症、発作性夜間血色素尿症（ＰＮＨ）、関節リウマチ（ＲＡ）、シェーグレン症候群、および潰瘍性大腸炎等が挙げられる。

例示的な感染症としては、これらに限定されないが、アフリカトリパノソーマ症、ボレリア症、コレラ、クリプトスポリジウム症、デング熱、Ａ型肝炎、Ｂ型肝炎、Ｃ型肝炎、ＨＩＶ／ＡＩＤＳ、インフルエンザ、日本脳炎、リーシュマニア症、マラリア、麻疹、脳膜炎、回旋糸状虫症、肺炎、ロタウイルス感染症、住血吸虫症、敗血症、細菌性赤痢、連鎖球菌性扁桃炎、結核、腸チフス、および黄熱病等が挙げられる。

例示的な呼吸器疾患としては、これらに限定されないが、喘息、慢性閉塞性肺疾患（ＣＯＰＤ）、および嚢胞性線維症等が挙げられる。

例示的な内分泌障害としては、これらに限定されないが、先端巨大症、Ｉ型糖尿病、ＩＩ型糖尿病、妊娠性糖尿病、グレーブス病、成長ホルモン欠損症、高血糖症、副甲状腺機能亢進症、甲状腺機能亢進症、低血糖症、不妊、肥満、副甲状腺疾患、モルキオＡ症候群、およびムコ多糖症等が挙げられる。

中枢神経系の例示的な疾患としては、これらに限定されないが、アルツハイマー病、カタレプシー、ハンチントン病、およびパーキンソン病等が挙げられる。

例示的な筋骨格疾患としては、これらに限定されないが、骨粗鬆症および筋ジストロフィー等が挙げられる。

例示的な心血管疾患としては、これらに限定されないが、急性心不全、脳血管疾患（脳卒中）、および虚血性心疾患等が挙げられる。

例示的な腫瘍学的疾患としては、これらに限定されないが、副腎がん、膀胱がん、乳がん、結腸および直腸がん、子宮内膜がん、腎臓がん、急性リンパ芽球性白血病（ＡＬＬ）、他のタイプの白血病、肺がん、黒色腫、非ホジキンリンパ腫、膵臓がん、前立腺がん、ならびに甲状腺がん等が挙げられる。

例示的な泌尿生殖器疾患としては、これらに限定されないが、良性前立腺過形成（ＢＰＨ）、血尿症、過敏膀胱、およびペーロニー病等が挙げられる。

例示的な代謝疾患としては、これらに限定されないが、ゴーシェ病、ファブリ病、成長ホルモン欠損症、ハーラー症候群、ハンター症候群、高シュウ酸尿症、神経セロイドリポフスチン症、マロトー・ラミー症候群、モルキオ症候群、ヌーナン症候群、ＳＨＯＸ遺伝子ハプロ不全、ターナー症候群、プラダー・ウィリー症候群、フェニルケトン尿症、およびサンフィリッポ症候群等が挙げられる。

上述のように、本明細書で提供される核酸分子は、単独で、または遺伝子治療目的用のベクターの一部としても使用することができる。遺伝子治療は、ｅｘｖｉｖｏまたはｉｎｖｉｖｏ技法により、治療用遺伝子を細胞内に導入することに基づくものであり、遺伝子移入の最も重要な応用の１つである。ｉｎｖｉｖｏ遺伝子治療に好適なベクター、方法、または遺伝子送達系は、文献に記載されており、当業者に公知である。例えば、Giordano (1996) Nat. Med. 2:534-539；Schaper (1996) Circ. Res. 79:911-919；Anderson (1992) Science 256:808-813；Verma (1997) Nature 389:239-249；Isner (1996) Lancet 348:370-374；Muhlhauser (1995) Circ. Res. 77:1077-1086；Onodera (1998) Blood 91:30-36；Verma (1998) Gene Ther. 5:692-699；Nabel (1997) Ann. N.Y. Acad. Sci. 811:289-292；Verzeletti (1998) Hum. Gene Ther. 9:2243-2251；Wang (1996) Nat. Med. 2:714-716；国際公開第９４／２９４６９号パンフレット；国際公開第９７／００９５７号パンフレット、米国特許第５，５８０，８５９号明細書；米国特許第５，５８９，４６６号明細書；またはSchaper (1996) Curr. Opin. Biotechnol. 7:635-640を参照されたい。本明細書で提供される核酸分子およびベクターは、細胞内に直接導入するように、またはリポソームもしくはウイルスベクター（例えば、アデノウイルス、レトロウイルス）により導入するように設計することができる。例えば、ベクターは、アデノ随伴ウイルス（ＡＡＶ）ベクター、特にＡＡＶ８ベクターであってもよい。ＡＡＶベクターは、遺伝子治療に魅力的である。ＡＡＶ系は、長期的な遺伝子発現、ヘルパーウイルスなしでは自己複製できないこと、分裂および非分裂細胞の形質導入、ならびに野生型感染による病原性の欠如を含む、いくつかの利点を有する。好ましくは、核酸分子またはベクターが導入される前記細胞は、生殖系列細胞、胚細胞、もしくは卵細胞、またはそれらに由来するものであり、最も好ましくは、前記細胞は、幹細胞である。胚幹細胞の例は、特に、Nagy (1993) Proc. Natl. Acad. Sci. USA 90:8424-8428に記載の幹細胞であってもよい。

用語「ポリペプチド」、「ペプチド」、および「タンパク質」は、本明細書では同義的に使用され、１つのアミノ酸のアミノ基と別のアミノ酸のカルボキシル基との間で形成されるアミドまたはペプチド結合により連結されている２つまたはそれよりも多くのアミノ酸のポリマーを指す。好ましくは、ペプチド結合は、１つのアミノ酸のα－アミノ基と別のアミノ酸のα－カルボキシル基との間で形成される。ペプチドまたはタンパク質に含まれるアミノ酸は、アミノ酸残基とも呼ばれ、２０種の標準タンパク質新生α－アミノ酸（すなわち、Ａｌａ、Ａｒｇ、Ａｓｎ、Ａｓｐ、Ｃｙｓ、Ｇｌｕ、Ｇｌｎ、Ｇｌｙ、Ｈｉｓ、Ｉｌｅ、Ｌｅｕ、Ｌｙｓ、Ｍｅｔ、Ｐｈｅ、Ｐｒｏ、Ｓｅｒ、Ｔｈｒ、Ｔｒｐ、Ｔｙｒ、およびＶａｌ）から選択してもよいが、非タンパク質新生および／または非標準α－アミノ酸（例えば、オルニチン、シトルリン、ホモリジン、ピロリジン、または４－ヒドロキシプロリン）ならびにβ－アミノ酸（例えば、β－アラニン）、γ－アミノ酸、およびδ－アミノ酸から選択してもよい。好ましくは、ペプチドまたはタンパク質に含まれるアミノ酸残基は、α－アミノ酸から選択され、より好ましくは２０種の標準タンパク質新生α－アミノ酸（それらは、Ｌ－異性体またはＤ－異性体として存在することができ、好ましくは、Ｇｌｙを除いて全てがＬ－異性体として存在する）から選択される。

コードされたポリペプチドまたはタンパク質は、未修飾であってもよく、または例えば、そのＮ末端が、そのＣ末端が、および／またはそのアミノ酸残基のいずれかの側鎖が（特に、１つまたは複数のＬｙｓ、Ｈｉｓ、Ｓｅｒ、Ｔｈｒ、Ｔｙｒ、Ｃｙｓ、Ａｓｐ、Ｇｌｕ、および／またはＡｒｇ残基の側鎖官能基が）修飾されていてもよい。そのような修飾としては、例えば、Wuts (2006) Greene's protective groups in organic synthesis, John Wiley & Sons, 4^th edition, Hoboken, N.J.において、対応する官能基について記載されている保護基のいずれかを結合させることが挙げられ得る。そのような修飾としては、１つまたは複数の脂肪酸（例えば、１つまたは複数のＣ_８～３０アルカン酸またはアルケン酸；脂肪酸アシル化ペプチドまたはタンパク質を形成）によるグリコシル化および／またはアシル化も挙げることができる。コードされたポリペプチドは、好ましくはヒドロキシル化されておらず、特に、ヒドロキシプロリンを含んでいない。

コードされたペプチドまたはタンパク質に含まれるアミノ酸残基は、例えば、直鎖分子鎖（直鎖ペプチドまたはタンパク質を形成する）として存在してもよく、あるいは例えばペプチドもしくはイソペプチド結合またはジスルフィド架橋により環化されている１つまたは複数の環（環状ペプチドまたはタンパク質に対応する）を形成していてもよい。ペプチドまたはタンパク質は、２つまたはそれよりも多くの同一のまたは異なる分子からなるオリゴマーも形成してもよい。本明細書で使用される場合、用語「ドメイン」は、特定の構造および／または機能を自律的に取ることが可能なアミノ酸配列の任意の領域／部分に関する。したがって、本発明の状況では、「ドメイン」は、機能的ドメインまたは構造ドメインであってもよく、それらは、例えば、より大きなポリペプチドの一部を形成していてもよい。

本明細書で使用される場合、用語「含む（ｃｏｍｐｒｉｓｉｎｇ）」および「含む（ｉｎｃｌｕｄｉｎｇ）」またはそれらの文法的異型は、記載されている特徴、整数、ステップ、または成分を指定すると理解されるべきであるが、１つまたは複数の追加の特徴、整数、ステップ、成分、またはそれらのグループの付加を排除しない。これら用語は、用語「～からなる」および「～から本質的になる」を包含する。

したがって、用語「含む（ｃｏｍｐｒｉｓｉｎｇ）」／「含む（ｉｎｃｌｕｄｉｎｇ）」／「有する（ｈａｖｉｎｇ）」は、任意のさらなる成分（または類似の特徴、整数、およびステップ等）が存在することができる／存在していてもよいことを意味する。したがって、用語「含む（ｃｏｍｐｒｉｓｉｎｇ）」／「含む（ｉｎｃｌｕｄｉｎｇ）」／「有する（ｈａｖｉｎｇ）」が本明細書で使用される場合はいつでも、「～から本質的になる」に、または好ましくは「～からなる」に置き換えることができる。

用語「～からなる」は、さらなる成分（または類似の特徴、整数、およびステップ等）が存在しないことを意味する。

用語「～から本質的になる」またはその文法的異型は、本明細書で使用される場合、記載されている特徴、整数、ステップ、または成分を指定すると理解されるべきであるが、１つまたは複数の追加の特徴、整数、ステップ、成分、またはそれらのグループの付加は、追加の特徴、整数、ステップ、成分、またはそれらのグループが、特許請求されている組成物、デバイス、または方法の基本的および新規な特徴を実質的に変更しない場合にのみ排除されない。

したがって、用語「～から本質的になる」は、特定のさらなる成分（または類似の特徴、整数、およびステップ等）、すなわち組成物、デバイス、または方法の本質的な特徴に実質的な影響を及ぼさないものが存在し得ることを意味する。言い換えれば、用語「～から本質的になる」（本明細書では、用語「実質的に含む」と同義的に使用することができる）は、デバイスまたは方法の本質的な特徴が他の成分の存在により実質的に影響を受けない限り、必須成分（または類似の特徴、整数、およびステップ等）に加えて、組成物、デバイス、または方法に他の成分が存在することを許容する。

用語「方法」は、所与の作業を達成するための様式、手段、技法、および手順を指し、そのようなものとしては、化学、生物学、および生物物理学分野の実務者に知られているか、または既知の様式、手段、技法、および手順から容易に開発されるかのいずれかである様式、手段、技法、および手順が挙げられるが、それらに限定されない。

本明細書で使用される場合、別様の指示がない限り、用語「約」は、好ましくは、示されている数値の±１０％、より好ましくは、示されている数値の±５％、および特に、示されている数値そのものを指す。

以下の非限定的な図および例を参照することにより、本発明をさらに説明する。別様の指定がない限り、例えば、その全体が参照により本明細書に組み込まれるSambrook (2001) loc. cit.に記載されている組換え遺伝子技術の確立されている方法を使用した。

以下の非限定的な図および例を参照することにより、本発明をさらに説明する。図は、以下の通りである。

プラスミドｐＸＬ２を使用した、プロリン／アラニンリッチ配列をコードする低反復性核酸の構築。（Ａ）ｐＸＬ２（配列番号４８）のプラスミドマップ。ＳａｐＩ認識部位（５’－ＧＣＴＣＴＴＣ－３’）およびＥａｒＩ認識部位（５’－ＣＴＣＴＴＣ－３’」）が、ｌａｃプロモーター／オペレーター（ｌａｃ^ｐ／ｏ）の転写制御下にある選択可能なマーカー遺伝子ｌａｃＺに挿入されている。ＳａｐＩ制限部位は、プロリン／アラニンリッチ配列をコードする低反復性核酸分子の１つまたは複数のユニット（構成単位）の連続挿入を可能にする。ＥａｒＩ、その認識配列がＳａｐＩ認識配列とオーバーラップする／ＳａｐＩ認識配列のサブセットである制限酵素による切断は、プロリン／アラニンリッチ配列をコードする構築された低反復性核酸分子（遺伝子カセット）の切り出しおよび／または単離を可能にする。プラスミド骨格は、サイレント突然変異による追加のＳａｐＩおよびＥａｒＩ制限部位の欠失を除いて、汎用クローニングベクターｐＵＣ１９（Yanisch-Perron (1985) Gene 33:103-119）の骨格と同一である。（Ｂ）ｐＸＬ１（配列番号５５）のプラスミドマップ。反対向きの２つのＳａｐＩ認識部位（５’－ＧＣＴＣＴＴＣ－３’）が、ｌａｃプロモーター／オペレーター（ｌａｃ^ｐ／ｏ）の転写制御下にある選択可能なマーカー遺伝子ｌａｃＺに挿入されている。ＳａｐＩ制限部位は、プロリン／アラニンリッチ配列をコードする低反復性核酸分子（遺伝子カセット）の挿入／クローニング、ならびに増殖／増幅ならびにその後の切り出しおよび／または単離を可能にする。プラスミド骨格は、サイレント突然変異による追加のＳａｐＩ制限部位の欠失を除いて、ｐＵＣ１９の骨格と同一である。なお、挿入された遺伝子カセットは、ｐＸＬ２と比較して逆向きである。（Ｃ）低反復性核酸分子のクローニングおよび構築に有用な、ｐＸＬ２のクローニング部位のおよびその周辺のヌクレオチド配列伸長。ヌクレオチド配列は、逆向きのＳａｐＩ制限部位およびＥａｒＩ制限部位を含む。ＥａｒＩ認識配列は、ＳａｐＩ認識配列の一部でもあるため、ＥａｒＩは、両認識部位を切断する。ＳａｐＩまたはＥａｒＩのいずれの制限酵素が使用されるかに関わらず、消化により、ＧＣＣ／ＣＧＧ末端（Ａｌａをコードする）の突出がもたらされ、それらは、プロリン／アラニンリッチ配列をコードする低反復性核酸分子のＧＣＣ／ＣＧＧ突出と適合するため、効率的なライゲーションが可能になる。認識配列には、下線が引かれている。（Ｄ）１つの低反復性核酸ユニット／構成単位ＰＡＳ＃１ｂ（２００）（配列番号１９）を挿入した後の、ｐＸＬ２のクローニング部位のヌクレオチド配列およびコードされたアミノ酸配列。クローニングされた低反復性核酸ユニット／構成単位に隣接するＳａｐＩおよびＥａｒＩ制限部位には、名称が表示されている（認識配列には下線が引かれている）。（Ｅ）プロリン／アラニンリッチアミノ酸反復配列をコードする、より長いクローニングされたヌクレオチド配列（核酸分子）を得るための、低反復性核酸配列ユニットの構築。第１のステップでは、ｐＸＬ２をＳａｐＩで消化し、脱リン酸化し、第１の配列ユニットＰＡＳ＃１ｂ（２００）とライゲーションする。第２のステップでは、その結果生じたプラスミドを、唯一のＳａｐＩ制限消化により、クローニングされた配列ユニットの上流で開環／線形化し、その後脱リン酸化し、第２のヌクレオチド配列ユニットＰＡＳ＃１ｃ（２００）とライゲーションする。その結果生じたプラスミドｐＸＬ２－ＰＡＳ＃１ｃ／１ｂ（４００）は、合計で長さが１２００個の塩基対を含む、挿入された遺伝子／ＤＮＡカセットを含む。全体として、プロリン／アラニンリッチアミノ酸反復配列をコードするその結果生じたクローニングされた低反復性ヌクレオチド配列は、１４ヌクレオチドの最大長を有するヌクレオチド反復のみを含む（配列番号５２）。構築された遺伝子カセット／核酸分子全体を、ＥａｒＩによる消化で容易に切り出すことができ、その後、例えば、生理活性タンパク質をコードするヌクレオチド配列と同じリーディングフレームで、発現ベクターにサブクローニングするため等に使用することができる。特筆すべきことには、第２のステップを繰り返すことにより、連続して増加する長さを有する遺伝子カセットを、系統的な様式でｐＸＬ２に構築およびクローニングすることができる。異なる好適なヌクレオチド配列ユニットを使用すると、プロリン／アラニンリッチアミノ酸反復配列をコードするその結果生じる長い低反復性核酸分子は、ほんの少数のまたは短いヌクレオチド反復しか含まない。プロリン／アラニンリッチ配列の反復分析。（Ａ）従来技術のプロリン／アラニンリッチ配列ＰＡ＃３ａ（２００）（配列番号１５）のドットプロットが、本発明による低反復性ヌクレオチド配列ＰＡ＃３ｂ（２００）（配列番号３６）のドットプロットと比較されている。これらは両方とも、ＧｅｎｅｉｏｕｓＶ８．１ソフトウェアパッケージ（Ｂｉｏｍａｔｔｅｒｓ、オークランド、ニュージーランド）に含まれているドットプロットツール「ｄｏｔｔｕｐ」を使用し、１４または１５の反復ウィンドウを適用して生成した。分析されるヌクレオチド配列を、それぞれ二次元グラフのｘ軸およびｙ軸でそれ自体と比較することにより、「ｄｏｔｔｕｐ」ツールは、指定の長さ（反復ウィンドウ）の同一の配列が出現する全ての領域を特定して対角線を引き、したがって、ｘ軸およびｙ軸に反復配列の位置を示す（中央の対角線と異なる対角線により示される場合、中央の対角線は、自己同一性を示す）。連続する反復は、対角線を延長する。ここで分析されたＰＡ＃３ａ（２００）ヌクレオチド配列は、多くのおよび／または長い対角線により示されているように、高度に反復性の性質を明らかにしている。この場合、ヌクレオチド配列は、各々６０塩基対の多数の反復を示している。１４の反復ウィンドウを適用することにより、６０ｂｐ反復内に、より短い１４ｂｐ反復さえ現れる。対照的に、ＰＡ＃３ｂ（２００）ヌクレオチド配列は、６００ｂｐの分析されたヌクレオチド配列全体内に、ほんの少数の散在性の１４ｂｐ反復しか示さないが、分析のためにわずかにより大きな１５の反復ウィンドウを適用すると、反復は検出可能ではない。（Ｂ）プロリン／アラニンリッチ配列をコードする、国際公開第２００８１５５１３４号パンフレットに開示されている核酸ＰＡＳ＃１ａ（６００）（配列番号１２）のドットプロットが、本発明によるプロリン／アラニンリッチアミノ酸反復配列をコードする構築された低反復性ヌクレオチド配列ＰＡＳ＃１ｄ／１ｆ／１ｃ／１ｂ（８００）（配列番号３９）およびＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）（配列番号３８）のドットプロットと、１４および１５塩基対の反復ウィンドウを使用して比較されている。ヌクレオチド配列ＰＡＳ＃１ａ（６００）は、６０塩基対反復の組成を明らかにするが、ＰＡＳ＃１ｄ／１ｆ／１ｃ／１ｂ（８００）およびＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）ヌクレオチド配列は、それぞれ２４００または１８００ｂｐの分析されたヌクレオチド配列全体内に、反復が存在しないか、または１４個ヌクレオチド反復ウィンドウの場合、たった１つの単一１４個ヌクレオチド反復（対角線）しかないことを示している。（図２－２の続き）（Ｃ）米国特許出願公開第２００６／０２５２１２０号明細書に開示されている［（ＡＰ）_５］_ｎ多量体をコードする合成ＤＮＡ配列（配列番号１６）およびマカクヘルペスウイルス（Macacine herpesvirus）１の超大型テグメントタンパク質の反復性プロリン／アラニンリッチ領域をコードする天然ＤＮＡ配列（ＧｅｎＢａｎｋＡＡＰ４１４５４．１）（配列番号１８）のドットプロット分析が、１４および１５ヌクレオチドの反復ウィンドウを適用して、本発明による低反復性ヌクレオチド配列ＰＡ＃３ａ（２００）（配列番号１５）と比較されている。［（ＡＰ）_５］_ｎ多量体およびマカクヘルペスウイルス（Macacine herpesvirus）１の超大型テグメントタンパク質のプロリン／アラニンリッチ領域をコードするＤＮＡ配列のドットプロットは、これらヌクレオチド配列の、高度に反復性の性質を示している。対照的に、ＰＡ＃１ｂ（２００）ヌクレオチド配列のドットプロットは、６００ｂｐの分析されたヌクレオチド配列全体内に、ほんの少数の散在性の１４ヌクレオチド反復しかない（１４個ヌクレオチド反復ウィンドウ）ことを示すか、または反復が全くない（１５個ヌクレオチド反復ウィンドウ）ことを示している。（図２－４の続き）プロリン／アラニンリッチアミノ酸配列をコードする低反復性核酸分子のＤＮＡ配列決定の電気泳動図。本発明によるプロリン／アラニンリッチ配列をコードする低反復性ヌクレオチド配列を有するｐＸＬ２－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）（配列番号３８）のＤＮＡ配列決定の電気泳動図。二本鎖プラスミドＤＮＡを、ＰＡＳ＃１ｂ（２００）ヌクレオチド配列ユニット（配列番号１９）のコード領域内と特異的にハイブリダイズするプライマーＸＬＰ－１（配列番号３）を使用して配列決定した。この電気泳動図では、９００個よりも多くの塩基が判読可能であり、ｐＸＬ２－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）の既知ヌクレオチド配列に対応する。特筆すべきことには、この電気泳動図は、非特異的または多重プライマーハイブリダイゼーションの徴候を示していない。ｐＡＳＫ７５ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａ、治療関連性を有するＰＡＳ＃１（６００）－ＩＬ１Ｒａ融合タンパク質の細菌産生用の遺伝子的に安定な発現ベクター（Ａ）ｐＡＳＫ７５－ＩＬ１Ｒａ（配列番号４９）のプラスミドマップ、および（Ｂ）ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）遺伝子カセット挿入後の、その誘導体ｐＡＳＫ７５－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａ（配列番号５０）。６０１個のアミノ酸残基を有するＰＡＳ＃１ポリペプチドをコードする低反復性ヌクレオチド配列、およびヒトＩＬ－１Ｒａの構造遺伝子、ならびに細菌性ＯｍｐＡシグナル配列およびＨｉｓ_６タグのコード領域を含む、生理活性／薬理活性（プレ）タンパク質ＰＡＳ＃１（６００）－ＩＬ１Ｒａの構造遺伝子が、ｔｅｔプロモーター／オペレーター（ｔｅｔ^ｐ／ｏ）の転写制御下にクローニングされている。ＸｂａＩおよびＨｉｎｄＩＩＩ制限部位により隣接されている発現カセットの外側のプラスミド骨格は、汎用発現ベクターｐＡＳＫ７５（Skerra (1994) Gene 151:131-135）の骨格と同一である。本発明によるプロリン／アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子を挿入した後の保持された唯一のＳａｐＩ制限部位が示されている。従来技術のヌクレオチド配列ＰＡＳ＃１ａ（６００）と比較した、プロリン／アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）の遺伝子安定性の分析ｐＡＳＫ７５－ＰＡＳ＃１ａ（６００）－ＩＬ１Ｒａ（レーン１～５）（配列番号５１）またはｐＡＳＫ７５－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａ（レーン１～１０）（配列番号５０）で形質転換し、細菌細胞分裂のおよそ７０世代に相当する７日間にわたって培養した大腸菌（E. coli）ＪＭ８３クローンの１０個のプラスミド調製物を、ＸｂａＩ／ＨｉｎｄＩＩＩ制限分析した後のアガロースゲル電気泳動。ｐＡＳＫ７５－ＰＡＳ＃１ａ（６００）－ＩＬ１Ｒａの分析された５つのクローンのうちの４つは、プロリン／アラニンリッチアミノ酸反復配列をコードする核酸インサートを含む短縮ＤＮＡ断片を明らかにした（図５Ａ）。これは、遺伝子不安定性を明らかに示す。対照的に、ｐＡＳＫ７５－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａの５つのクローンは全て、それぞれ３０９３ｂｐおよび２３７７ｂｐに対応する予想通りのバンドのみを示した。これは、プロリン／アラニンリッチアミノ酸反復配列をコードする核酸インサートが完全であること、および遺伝子プラスミド安定性が高いことを示す。したがって、本発明によるプロリン／アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列は、従来技術の反復性ヌクレオチド配列よりも、明らかに有利である。生理活性タンパク質ＩＬ－１Ｒａをコードする発現プラスミドへの、プロリン／アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列のシームレスクローニング。（Ａ）ＯｍｐＡシグナル配列遺伝子を含む融合タンパク質のコード領域の概要図であり、ＯｍｐＡシグナル配列遺伝子の後には、ＧＣＣアラニンコドン、非コード鎖の第１のＳａｐＩ認識配列ＧＣＴＣＴＴＣ、ＧＣジヌクレオチドスペーサー、およびコード鎖でのその認識配列はＧＣＴＣＴＴＣである、逆向きの第２のＳａｐＩ認識配列があり、その後最後にはＧＣＣアラニンコドン、および成熟ＩＬ－１Ｒａのコード配列（ＵｎｉＰｒｏｔＩＤＰ１８５１０）がある。示されている配列全体を、汎用発現ベクターｐＡＳＫ７５のＸｂａＩ／ＨｉｎｄＩＩＩ制限部位によりクローニングした。（Ｂ）ＳａｐＩで切断し、２つのＳａｐＩ制限部位により隣接されている短い２４ｂｐインサートを切り出した後の、（Ａ）に記載されているＤＮＡカセットの概要図。なお、２つの５’－突出があるため、中間の１８ヌクレオチドのみが、ＤＮＡ二本鎖を形成し、したがって真の意味での塩基対を含む。（Ｃ）例えば、ＥａｒＩ制限消化により生成された適合する粘着ＧＣＣ／ＣＧＧ末端により（図１を参照）ｐＸＬ２－ＰＡ＃１ｂ（２００）（配列番号５４）から切り出された、低反復性ヌクレオチド配列ＰＡ＃１ｂ（２００）を含むＤＮＡ断片の一方向様式でのシームレス挿入。本発明によるプロリン／アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列を含むその結果生じた発現カセットは、配列番号４７として本明細書のさらに下記に示されている。遺伝子的に安定な発現ベクターｐＡＳＫ７５－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａを使用して大腸菌（E. coli）で産生されたＰＡＳ＃１（６００）－ＩＬ１Ｒａ融合タンパク質の特徴付け（Ａ）ＩＭＡＣ、ＡＥＸ、ＣＥＸ、および１０％ＳＤＳ－ＰＡＧＥによるＳＥＣで精製したＰＡＳ＃１（６００）－ＩＬ１Ｒａ融合タンパク質の分析。ゲルは、２－メルカプトエタノールで還元したＰＡＳ＃１（６００）－ＩＬ１Ｒａの２μｇ試料（レーン１）を示しており、還元しなかったもの（レーン２）も示している。タンパク質マーカータンパク質（Ｍ）のサイズは、左側に示されている。ＰＡＳ＃１（６００）－ＩＬ１Ｒａ融合タンパク質は、１１６ｋＤａを超える見掛けの分子サイズを有する単一均質バンドとして出現する。ＰＡＳ融合タンパク質は、ＳＤＳ結合が不良であるため、一般的に、例えばＰＡＳ＃１（６００）－ＩＬ１Ｒａの計算質量である６８ｋＤａよりも著しくより大きなサイズを示す（Schlapschy (2013) Protein Eng Des Sel. 26:489-501）。（Ｂ）エレクトロスプレーイオン化質量分析（ＥＳＩ－ＭＳ）によるＰＡＳ＃１（６００）融合タンパク質の特徴付け。精製したＰＡＳ＃１（６００）－ＩＬ１Ｒａ融合タンパク質のデコンボリューションＥＳＩ－ＭＳスペクトルは、６７９９４．８Ｄａの測定質量を明らかにしている。これは、計算質量である６７９９４．９Ｄａとほとんど完全に一致する。遺伝子的に安定な発現ベクターｐＡＳＫ３７－ＭＰ－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）を使用して、大腸菌（E. coli）で産生された純粋なＰＡ＃１（６００／）ポリペプチドの特徴付け（Ａ）ｐＡＳＫ３７－ＭＰ－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）（配列番号５３）のプラスミドマップ。ＰＡ＃１（６００）ポリペプチドをコードする低反復性ヌクレオチド配列を、開始Ｍｅｔ残基およびＰｒｏ残基のコドンがその前にあるｌａｃＵＶ５プロモーター／オペレーター（ｌａｃＵＶ５^ｐ／ｏ）の転写制御下にクローニングした。ＸｂａＩおよびＨｉｎｄＩＩＩ制限部位により隣接されている発現カセットの外側のプラスミド骨格は、汎用発現ベクターｐＡＳＫ３７（Skerra (1991) Protein Eng. 4:971-979）の骨格と同一である。（Ｂ）１０％ＳＤＳ－ＰＡＧＥ後にヨウ化バリウムで染色した組換えＰＡ＃１（６００）ポリペプチドの分析。ロードした試料は、３時間の発現後の溶解細胞（レーン１）、２０ｗ／ｖ％（ＮＨ_４）_２ＳＯ_４で析出させたタンパク質（レーン２）、１７，０００ｒｐｍで２０分間遠心分離し、その後１ｖ／ｖ％ＡｃＯＨで処理した後の、２０ｍＭＴｒｉｓ／ＨＣｌに溶解した（ＮＨ_４）_２ＳＯ_４析出物の上清（レーン３）、およびＰＡ＃１（６００）ポリペプチド処理物をその後にサブトラクティブ陽イオン交換クロマトグラフィーにかけた際の通過画分（レーン４）である。ＰＡ＃１（６００）ポリペプチドは、ＳＤＳとの結合が不良であり、したがって、ＰＡ＃１（６００）ポリペプチドは、スタッキングゲル内に赤色／黄色のヨウ素染色バンドとして出現し、組成が均質であることを示す。（Ｃ）水で脱染色し、クーマシーブリリアントブルーで染色した後の（Ｂ）に示されているゲル。ＰＡ＃１（６００）ポリペプチドは、ＳＤＳとの結合が不良であり、クーマシー染料により染色されず、したがって不純物（宿主細胞タンパク質）のみが、クーマシー染色ゲルで視覚化されている。（Ｄ）エレクトロスプレーイオン化質量分析（ＥＳＩ－ＭＳ）による、純粋なＰＡ＃１（６００）ポリペプチドの特徴付け。デコンボリューションスペクトルは、４８３０１．７８Ｄａの測定質量を明らかにし、これは、ＳａｐＩ制限部位を遺伝子クローニングに使用したため、上記で説明されているように、Ｎ末端に追加のＰｒｏ残基およびＣ末端に追加のＡｌａ残基を担持する組換えＰＡ＃１（６００）ポリペプチドの計算質量（４８３０１．４Ｄａ）とほとんど完全に一致する。なお、この組換えポリペプチドは、もはや開始Ｍｅｔ残基を担持せず、これは、メチオニンアミノペプチダーゼの細胞内作用に起因する可能性が最も高い（Giglione (2015) Biochimie 114:134-46）。プロリン／アラニンリッチアミノ酸配列をコードするヌクレオチド配列の自動化反復分析。従来技術のプロリン／アラニンリッチアミノ酸配列をコードする天然ならびに合成ヌクレオチド配列の反復を、ＰｙｔｈｏｎスクリプトＮＲＳカリキュレータ（実施例１４を参照）を使用して、実施例１３に記載のように分析し、ここでは、本発明による低反復性ヌクレオチド配列ＰＡＳ＃１ｂ（２００）およびＰＡ＃１ｅ／１ｄ／１ｃ／１ｂ（８００）と比較した。分析されたヌクレオチド配列内の、ある長さの全ての反復の頻度（出現数）を、反復の長さに対してプロットした。（Ａ）従来技術のヌクレオチド配列ＰＡＳ＃１ａ（２００）（配列番号１１）のヒストグラム。（Ｂ）ヌクレオチド配列ＰＡ＃１ａ（２００）（配列番号１４）のヒストグラム。（Ｃ）糖モジュール［（ＡｌａＰｒｏ）_５］_２０ＡＰＡをコードするヌクレオチド配列（配列番号１６）のヒストグラム。（Ｄ）糖モジュール［ＡＡＰＡＰＡＰＡＰ］_１０ＡＳをコードするヌクレオチド配列（配列番号１７）のヒストグラム。（Ｅ）マカクヘルペスウイルス（macacine herpesvirus）１の大型テグメントタンパク質内のプロリン／アラニンリッチ伸長をコードするヌクレオチド配列（配列番号１８）のヒストグラム。（Ｆ）低反復性ヌクレオチド配列ＰＡＳ＃１ｂ（２００）（配列番号１９）のヒストグラム。（Ｇ）（Ｆ）に示されているＰＡＳ＃１ｂ（２００）データの拡大図。（Ｈ）本発明による低反復性ヌクレオチド配列ＰＡ＃１ｅ／１ｄ／１ｃ／１ｂ（８００）（配列番号４４）のヒストグラム。（Ｉ）（Ｈ）に示されているＰＡ＃１ｅ／１ｄ／１ｃ／１ｂ（８００）データの拡大図。分析されたヌクレオチド配列の全長（Ｎ_ｔｏｔ）およびそのヌクレオチド反復スコア（ＮＲＳ）は、プロリン／アラニンリッチアミノ酸配列をコードする核酸分子の品質を、反復の頻度および長さに関して評価するため尺度であり、様々なヌクレオチド配列について表１および２に要約されている。ｐＡＳＫ７５－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａ、治療関連性を有するＰＡ＃１（６００）－ＩＬ１Ｒａ融合タンパク質の細菌産生用の遺伝子的に安定な発現ベクターｐＡＳＫ７５－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａ（配列番号７７）のプラスミドマップ。６０１個のアミノ酸残基を有するＰＡ＃１ポリペプチドをコードする低反復性ヌクレオチド配列、およびヒトＩＬ－１Ｒａの構造遺伝子、ならびに細菌性ＯｍｐＡシグナル配列およびＨｉｓ６タグのコード領域を含む、生理活性／薬理活性（プレ）タンパク質ＰＡ＃１（６００）－ＩＬ１Ｒａの構造遺伝子が、ｔｅｔプロモーター／オペレーター（ｔｅｔ^ｐ／ｏ）の転写制御下にクローニングされている。ＸｂａＩおよびＨｉｎｄＩＩＩ制限部位により隣接されている発現カセットの外側のプラスミド骨格は、汎用発現ベクターｐＡＳＫ７５（Skerra (1994) Gene 151:131-135）の骨格と同一である。本発明によるプロリン／アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子を挿入した後の保持された唯一のＳａｐＩ制限部位が示されている。従来技術のヌクレオチド配列ＰＡ＃１ａ（６００）と比較した、プロリン／アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子ＰＡ＃１ｄ／１ｃ／１ｂ（６００）の遺伝子安定性の分析細菌細胞分裂のおよそ７０世代に相当する７日間にわたって培養した、ｐＡＳＫ７５－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａ（図１０）（配列番号７７）で形質転換した大腸菌（E. coli）ＪＭ８３クローンの１０個のプラスミド調製物、またはｐＡＳＫ７５－ＰＡ＃１ａ（６００）－ＩＬ１Ｒａ（配列番号７８）の１０個のプラスミド調製物をＸｂａＩ／ＨｉｎｄＩＩＩ制限分析した後のアガロースゲル電気泳動。レーン：Ｍは、分子サイズ標準物質（ＧｅｎｅＲｕｌｅｒ１ｋｂＤＮＡラダー：５００、７５０、１０００、１５００、２０００、２５００、３０００、３５００、４０００、５０００、６０００、８０００、および１００００ｂｐ）；１～１０は、制限消化後の個々のクローンに由来するプラスミド試料。ｐＡＳＫ７５－ＰＡ＃１ａ（６００）－ＩＬ１Ｒａの分析した１０個のクローンのうちの少なくとも４個は、プロリン／アラニンリッチアミノ酸反復配列をコードする核酸インサートを含む短縮ＤＮＡ断片を明らかにした（図１１Ａ）。これは、遺伝子不安定性を明らかに示す。対照的に、ｐＡＳＫ７５－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａ（図１１Ｂ）の１０個のクローンは全て、それぞれ３０９３ｂｐおよび２３７７ｂｐに対応する予想通りのバンドのみを示した。これは、プロリン／アラニンリッチアミノ酸反復配列をコードする核酸インサートが完全であること、および遺伝子プラスミド安定性が高いことを示す。したがって、本発明によるプロリン／アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列は、従来技術の反復ヌクレオチド配列よりも、明らかに有利である。プロリン／アラニンリッチアミノ酸配列と融合されたヒトレプチンを細菌で産生するための遺伝子的に安定な発現ベクターの構築（Ａ）プロリン／アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列を、ヒトレプチンの構造遺伝子とインフレームでシームレスにおよび定方向にクローニングすることを可能にするための、ＳａｐＩ制限部位により隣接されているシームレスクローニングカセットを含むｐＡＳＫ３７－ＭＰ－ｈｕＬｅｐｔｉｎ（配列番号８１）のプラスミドマップ。（Ｂ）ＰＡ＃１ｄ／１ｃ／１ｂ（６００）遺伝子カセット（配列番号４２）の挿入を有するｐＡＳＫ３７－ＭＰ－ｈｕＬｅｐｔｉｎの誘導体である、ｐＡＳＫ３７－ＭＰ－ｈｕＬｅｐｔｉｎ－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）（配列番号８２）のプラスミドマップ。（Ｃ）ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）遺伝子カセット（配列番号３８）の挿入を有するｐＡＳＫ３７－ＭＰ－ｈｕＬｅｐｔｉｎの誘導体である、ｐＡＳＫ３７－ＭＰ－ｈｕＬｅｐｔｉｎ－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）（配列番号８３）のプラスミドマップ。生理活性／薬理活性ヒトタンパク質レプチンの構造遺伝子、ＰＡ＃１（６００）をコードする低反復性ヌクレオチド配列に融合されたヒトレプチン、およびＰＡＳ＃１（６００）ポリペプチドをコードする低反復性ヌクレオチド配列に融合されたヒトレプチンを、全ての場合で開始Ｍｅｔ残基およびＰｒｏ残基のコドンがその前にあるｌａｃＵＶ５プロモーター／オペレーター（ｌａｃＵＶ５^ｐ／ｏ）の転写制御下にクローニングした。ＸｂａＩおよびＨｉｎｄＩＩＩ制限部位により隣接されている発現カセットの外側のプラスミド骨格は、汎用発現ベクターｐＡＳＫ３７（Skerra (1991) Protein Eng. 4:971-979）の骨格と同一である。ＰＡ＃１（６００）ポリペプチドに融合されており、遺伝子的に安定な発現ベクターｐＡＳＫ３７－ＭＰ－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）－ｈｕＬｅｐｔｉｎ（Ｗ１００Ｑ）を使用して大腸菌（E. coli）で産生されたヒトレプチン変異体の特徴付け（Ａ）１０％ポリアクリルアミドゲルを使用した後、クーマシーブリリアントブルーＲ－２５０で染色したＰＡ＃１（６００）－ｈｕＬｅｐｔｉｎ（Ｗ１００Ｑ）融合タンパク質のＳＤＳ－ＰＡＧＥ分析。ゲルは、タンパク質分子量（ＭＷ）マーカー（レーンＭ；ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、ウォルサム、マサチューセッツ州）、還元試料条件下で１９時間発現させた後の大腸菌（E. coli）全細胞抽出物（レーン１）、１Ｍ（ＮＨ_４）_２ＳＯ_４で析出した還元タンパク質（レーン２）および非還元タンパク質（レーン５）、陰イオン交換クロマトグラフィー後の還元タンパク質（レーン３）および非還元タンパク質（レーン６）、ならびにサイズ排除クロマトグラフィー後の還元タンパク質（レーン４）および非還元タンパク質（レーン７）を示している。ＰＡ＃１（６００）－ｈｕＬｅｐｔｉｎ（Ｗ１００Ｑ）は、単一のバンドとして出現している。これは組成が均質であることを示す。（Ｂ）エレクトロスプレーイオン化質量分析（ＥＳＩ－ＭＳ）によるＰＡ＃１（６００）－ｈｕＬｅｐｔｉｎ（Ｗ１００Ｑ）融合タンパク質の特徴付け。デコンボリューションスペクトルは、６４２４９．５Ｄａの測定質量を明らかにしている。これは、組換え融合タンパク質の計算質量（６４２４９．８Ｄａ）と一致し、細菌メチオニンアミノペプチダーゼによる開始Ｍｅｔ残基の切断が成功したことを示す。

本発明およびその多くの利点についてのより良好な理解を提供する以下の例示的な非限定的な例により、本発明をさらに説明する。

［実施例１］
プロリン／アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列ユニットの合成
各々が２００個の残基のプロリン／アラニンリッチアミノ酸反復配列をコードする１セットの異なるヌクレオチド配列を最適化した。最適化には、ヌクレオチドレベルでの低反復性、低ＧＣ含量、低ＲＮＡ二次構造、大腸菌（E. coli）での発現に好ましいコドン使用頻度、および抗ウイルスモチーフの回避、ならびにＣＩＳ作用性エレメントに関する、手作業による調整が含まれていた。この目的を達成するために、条件特異的コドン最適化手法（Lanza (2014) BMC Syst Biol 8:33）またはＧｅｎｅＯｐｔｉｍｉｚｅｒアルゴリズム（Raab (2010) Syst Synth Biol 4:215-225）等の、確立されているアルゴリズムを適用した。それらの得られた初期配列を、以下の様式で手作業により調整した。

所与の閾値（例えば、１４ヌクレオチド）よりも長い反復を、ｈｔｔｐ：／／ｖｉｓｕａｌｇｅｎｅｄｅｖｅｌｏｐｅｒ．ｎｅｔにて自由に利用可能であるＶｉｓｕａｌＧｅｎｅＤｅｖｅｌｏｐｅｒソフトウェアバージョン１．２を使用して特定した。その後、特定された反復内のコドンを、段階的に置換した。特に、特定された反復内のＧＣリッチコドンを、選択した宿主生物（例えば大腸菌（E. coli）、Ｐ．パストリス（P. pastoris）、またはＣＨＯ）で高度に発現される遺伝子に多くみられるＡＴリッチコドンに置き換えた。各置換後、ヌクレオチド配列全体を、反復について再び分析した。置換が、所与の閾値よりも長い新しい反復に結び付いた場合、ヌクレオチド交換を却下し、以前に特定された反復内の異なるコドンを置換した。この手法が失敗した場合、特定された長い反復内の２つのコドンを、同時に置換した。このようにして、所与の閾値を超える全ての特定された反復を、コードされたプロリン／アラニンリッチアミノ酸配列を維持しつつ、反復的に除去した。

第２のステップでは、最適化されたヌクレオチド配列のコドン適応インデックス（ＣＡＩ）、ＧＣ含量、および安定なｍＲＮＡ構造を、ＶｉｓｕａｌＧｅｎｅＤｅｖｅｌｏｐｅｒソフトウェアを使用して分析し、開始配列と比較した。最適化されたヌクレオチド配列が、開始配列と等しいかまたはより良好なＣＡＩ、ＧＣ含量、またはｍＲＮＡ構造に到達するまで、この場合もコドン置換／サイレント突然変異により、追加の手作業による調整を実施した。ステップ１の反復分析を再び実施し、必要に応じて、目標を満たすために他のコドンを交換した。目標は、反復閾値、ＣＡＩ、ＧＣ含量、およびｍＲＮＡ構造（二次構造）であった。

第３のステップでは、各々が同じ２００残基のプロリン／アラニンリッチアミノ酸反復配列をコードする異なる個々に最適化されたヌクレオチド配列を組み合わせた、すなわち互いに付け加えた。その結果生じたより長いヌクレオチド配列を、ステップ１および２と同じ様式で最適化した。最後に、その結果生じた長い酸配列を、より短い、例えば６００ヌクレオチド長のＤＮＡカセットに分割した。例えば、２４００ヌクレオチドの配列ＰＡＳ＃１ｄ／１ｆ／１ｃ／１ｂ（配列番号３９）を、４つのより短いカセット（配列番号１９、２０、２１、２３）に分割した。同様に、２４００ヌクレオチドの配列ＰＡ＃１ｅ／１ｄ／１ｃ／１ｂ（配列番号４４）を、各々が６００ヌクレオチドを含む、４つのより短いカセット（配列番号２８、２９、３０、３１）に分割した。

これら最適化されたヌクレオチド配列ユニットは、逆相補的に配向されている２つのＳａｐＩ認識部位（５’－ＧＣＴＣＴＴＣ－３’）により隣接され、制限酵素消化後に５’－ＧＣＣ／５’－ＧＧＣヌクレオチド突出がもたらされるように、異なる商業的供給業者が個々に合成した。なお、２つのＧＣＣ／ＧＧＣヌクレオチド突出が存在するため、中間の５９７ヌクレオチドのみが、切り出し後にＤＮＡ二本鎖を形成し、したがって塩基対（ｂｐ）を含む。また、最適化された６００個ヌクレオチド配列は、第２のＳａｐＩ制限部位が存在するため、追加のＡｌａコドンで延長されており、したがって、プロリン／アラニンリッチアミノ酸配列をコードする全体として６０３ヌクレオチドの、クローニングされたＤＮＡカセットに結び付く。２つの隣接するＳａｐＩ制限部位の存在は、例えば本発明のＤＮＡカセット全体の正確な切り出し、およびｐＸＬ２へのサブクローニングを可能にする。

大腸菌（Escherichia coli）、ピキア・パストリス（Pichia pastoris）、ヒト胚腎臓（ＨＥＫ）細胞、シュードモナス・フルオレッセンス（Pseudomonas fluorescens）、コリネバクテリウム・グルタミカム（Corynebacterium glutamicum）、バチルス・スブチリス（Bacillus subtilis）、テトラヒメナ・サーモフィラ（Tetrahymena thermophila）、サッカロマイセス・セレビシエ（Saccharomyces cerevisiae）、クリベロマイセス・ラクティス（Kluyveromyces lactis）、ヒメツリガネゴケ（Physcomitrella patens）、またはモンゴルキヌゲネズミ（Cricetulus griseus）での発現用にコドンが最適化された、プロリン／アラニンリッチアミノ酸反復配列をコードするヌクレオチド配列ユニットのさらなるセットを、同じ様式で設計および合成した。これら生物用のコドン選択表は、ｈｔｔｐ：／／ｗｗｗ．ｋａｚｕｓａ．ｏｒ．ｊｐ／ｃｏｄｏｎからダウンロードして入手可能である。本発明による合成された核酸分子およびそれらのヌクレオチド配列特徴は、表１に要約されている。

［実施例２］
低反復性ヌクレオチド配列ユニットの、プロリン／アラニンリッチアミノ酸反復配列をコードするより長いヌクレオチド配列への構築
各々がクローニングされた合成ＤＮＡ断片を担持する商業的供給業者から得たプラスミドを、ＳａｐＩで消化し、その結果生じた６００ヌクレオチドのＤＮＡ断片を、標準的な手順（Sambrook (2001) loc. cit.）によるアガロースゲル電気泳動法で精製した。個々のヌクレオチド配列ユニットを、図１Ａに示されている、ｐＵＣ１９（Yanisch-Perron (1985). Gene. 33, 103-119）の誘導体であるプラスミドｐＸＬ２（配列番号４８）を使用して、より長いヌクレオチド配列へと構築した。ｐＸＬ２は、単一のＳａｐＩ制限部位を含み、このＩＩＳ型制限酵素による消化は、アラニンをコードする５’－ＧＣＣ／５’－ＧＧＣ突出を生成し、これは、合成され精製されたＤＮＡ断片の粘着末端と適合する（図１Ｃ）。１つのヌクレオチド配列ユニットを挿入／ライゲーションした後、別のＳａｐＩ制限消化により、クローニングされた配列ユニットの一方の末端、ここでは上流の末端で、プラスミドを開環することができる（図１Ｄ）。このベクター設計は、同一のまたは異なる低反復性ヌクレオチド配列ユニットの段階的な挿入を可能にし、プロリン／アラニンリッチアミノ酸反復配列をコードするより長いクローニングされた遺伝子カセットを産出する（図１Ｅ）。

一例として、まず、ヌクレオチド配列ユニットＰＡＳ＃１ｂ（２００）（配列番号１９）、次に、配列ユニットＰＡＳ＃１ｃ（２００）（配列番号２０）、およびその後配列ユニットＰＡＳ＃１ｆ（２００）（配列番号２３）を、記載されている様式でＳａｐＩ制限部位によりｐＸＬ２に挿入して、プラスミドｐＸＬ２－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）（配列番号３８）がもたらされた。その後のステップで、配列ユニットＰＡＳ＃１ｄ（２００）（配列番号１９）を、ＳａｐＩ制限部位を使用して、同じ様式でさらに挿入した。その結果生じたプラスミドは、全体で、１４ヌクレオチドの最大長を有するヌクレオチド配列反復を明らかにした、構築された２４００ｂｐＤＮＡカセットＰＡＳ＃１ｄ／１ｆ／１ｃ／１ｂ（８００）（配列番号３９）を含んでいた。ｐＸＬ２にクローニングされた低反復性ＤＮＡカセットの下流にあるＥａｒＩ（５’－ＣＴＣＴＴＣ－３’）の認識配列は、ＳａｐＩの認識配列の一部でもあるため、構築されたＤＮＡカセット全体を、ＥａｒＩで制限消化して、したがって２回切断して、容易に切り出すことができ、さらなるサブクローニングのために後で使用することが可能である。

同じ様式で、低反復性ヌクレオチド配列ＰＡ＃１ｅ／１ｄ／１ｃ／１ｂ（８００）（配列番号４４）を、ヌクレオチド配列ユニットＰＡ＃１ｂ（２００）（配列番号２８）、ＰＡ＃１ｃ（２００）（配列番号２９）、ＰＡ＃１ｄ（２００）（配列番号３０）、およびＰＡ＃１ｅ（２００）（配列番号３１）から、記載されている順序で構築した。大腸菌（E. coli）とは異なる宿主生物用にコドン使用頻度も最適化されている、記載されている構築されたヌクレオチド配列ならびに本発明によるプロリン／アラニンリッチアミノ酸反復配列をコードするさらなる例示的な低反復の核酸分子は、表１に要約されている。開示されているクローニング戦略は、一般的な遺伝子合成法では直接得ることができない、プロリン／アラニンリッチアミノ酸反復配列をコードする長い低反復性核酸分子を含む複雑な遺伝子カセットの単純で段階的な構築を提供する。

［実施例３］
プロリン／アラニンリッチアミノ酸反復配列をコードするヌクレオチド配列の反復性分析
ドットプロット分析を、国際公開第２０１１１４４７５６号パンフレットに開示されているプロリン／アラニンリッチアミノ酸反復配列ＰＡ＃３（配列番号１５）（図２Ａ）、国際公開第２００８１５５１３４号パンフレットに開示されているＰＡＳ＃１（配列番号１１）（図２Ｂ）、国際公開第２００４０９４５９０号パンフレットに開示されている［（ＡＰ）_５］_ｎ多量体（配列番号１６）、およびＧｅｎＢａｎｋ受託番号ＡＡＰ４１４５４．１として公開されている、マカクヘルペスウイルス（Macacine herpesvirus）１遺伝子の超大型テグメントタンパク質の反復性プロリン／アラニンリッチアミノ酸配列領域（配列番号１８）（図２Ｃ）をコードする異なるヌクレオチド配列について実施した。分析は、Ｇｅｎｅｉｏｕｓソフトウェアパッケージバージョン８．１（Ｂｉｏｍａｔｔｅｒｓ、オークランド、ニュージーランド）のドットプロットツール「ｄｏｔｔｕｐ」を使用し、１４または１５ヌクレオチドの反復ウィンドウを適用して、各ヌクレオチド配列をそれ自体に対してアラインすることにより実施した。このソフトウェアのアルゴリズムは、自由に利用可能なＥＭＢＯＳＳ６．５．７ツール「ｄｏｔｔｕｐ」（ＳａｎｇｅｒＩｎｓｔｉｔｕｔｅ、ケンブリッジ、英国）に基づいている。従来技術のヌクレオチド配列について得られたその結果生じた二次元ドットプロットグラフを、低反復性ヌクレオチド配列ユニットＰＡ＃３ｂ（２００）（配列番号３６）、ＰＡ＃１ｂ（２００）（配列番号２８）、ならびにより長いプロリン／アラニンリッチアミノ酸反復配列をコードする構築されたヌクレオチド配列ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）（配列番号３８）およびＰＡＳ＃１ｄ／１ｆ／１ｃ／１ｂ（８００）（配列番号３９）のドットプロットと比較した。黒色対角線によって示されているように（図２Ａ、Ｂ、Ｃ）、分析した従来技術のヌクレオチド配列は全て、ヌクレオチド配列レベルで高度に反復性の性質を明らかにしたが、本発明によるプロリン／アラニンリッチアミノ酸反復配列をコードする最適化されたヌクレオチド配列のドットプロットは、６００ヌクレオチドのＰＡ＃３ｂ（２００）およびＰＡ＃１ｂ（２００）カセット（図２Ａ、Ｃ）、１８００ヌクレオチドのＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）カセット（図２Ｂ）、または２４００ヌクレオチドのＰＡＳ＃１ｄ／１ｆ／１ｃ／１ｂ（８００）カセット（図２Ｂ）の分析したヌクレオチド配列全体内に、ほんの少数の散在性のまたは短い１４ヌクレオチド反復（黒色線）しか示さなかった。

［実施例４］
長いプロリン／アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子のＤＮＡ配列決定
プラスミドｐＸＬ２にクローニングした実施例２に記載されている低反復性ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）ＤＮＡカセット（配列番号３８）は、ＤＮＡ配列決定サービス提供業者（ＥｕｒｏｆｉｎｓＧｅｎｏｍｉｃｓ、エーバースベルク、ドイツ）が、サンガーサイクル配列決定法を使用して、ＡＢＩ３７３０ＸＬ機器（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、ウォルサム、マサチューセッツ州）で配列決定した。この目的を達成するため、形質転換された大腸菌（E. coli）ＸＬ１－ｂｌｕｅ細胞から、ＱＩＡｐｒｅｐスピンミニプレップキット（Ｑｉａｇｅｎ、ヒルデン、ドイツ）を使用して単離した８μｌ（１５０ｎｇ／μｌ）のｐＸＬ２－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）プラスミドＤＮＡを、５μｌの二重蒸留Ｈ_２Ｏ、およびＰＡＳ＃１ｂ（２００）ヌクレオチド配列ユニットのコード領域内にハイブリダイズする２μｌのプライマーＸＬＰ－１（１０μＭ）（配列番号３）と混合し、ＤＮＡ配列決定サービス提供業者に提出した。その結果、９００個よりも多くの帰属可能なヌクレオチドを含むエラーフリー電気泳動図（図３）が得られた。これは、非特異的または多重プライマー結合の徴候を示していなかった。したがって、クローニングされたＤＮＡの上流または下流にあるベクターヌクレオチド配列にハイブリダイズするプライマーの使用では、部分的にしか配列決定することができない長い反復ヌクレオチド配列とは対照的に、プロリン／アラニンリッチアミノ酸反復配列をコードする本発明による長い低反復性核酸分子は、クローニングされたヌクレオチド配列内で内部的に特異的ハイブリダイズするプライマーも使用して、容易に配列決定することができる。これは、異なる好適なプライマーを使用して、複数のオーバーラップ配列リードを可能にし、したがって本発明による非常に長い核酸分子の配列決定でさえ、全配列範囲を網羅することが可能になる。

［実施例５］
治療用のＰＡＳ＃１（６００）－ＩＬ１Ｒａ融合タンパク質を細菌で産生するための遺伝子的に安定な発現ベクターであるｐＡＳＫ７５－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）の構築
インターロイキン－１受容体アンタゴニスト（ＩＬ－１Ｒａ）を、６００残基ＰＡＳ＃１アミノ酸反復配列（配列番号３８）との融合体としてコードする発現プラスミドを構築する場合、ベクターｐＡＳＫ７５－ＩＬ１Ｒａ（図４Ａ）（配列番号４９）を、ＳａｐＩで切断し、エビアルカリホスファターゼ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、ウォルサム、マサチューセッツ州）で脱リン酸化し、６００残基ＰＡＳ＃１ポリペプチドをコードする低反復性ヌクレオチド配列カセットに対応するＤＮＡ断片とライゲーションし、それを、ＥａｒＩによる制限消化でプラスミドｐＸＬ２－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）から切り出した。大腸菌（E. coli）ＸＬ１－Ｂｌｕｅ（Bullock (1987) Biotechniques 5:376-378）を形質転換した後、プラスミドＤＮＡを調製し、挿入したＤＮＡ断片の存在を、制限分析およびＤＮＡ配列決定により確認した。その結果生じたプラスミドを、ｐＡＳＫ７５－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａ（配列番号５０）と命名した。これは、図４Ｂに示されている。

［実施例６］
プロリン／アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子を内包するプラスミドの長期遺伝子安定性試験
プラスミドｐＡＳＫ７５－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａ（配列番号５０）の遺伝子安定性を、ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）ＤＮＡカセットが、反復性核酸ＰＡＳ＃１ａ（６００）（配列番号１２）により置換された誘導体であるｐＡＳＫ７５－ＰＡＳ＃１ａ（６００）－ＩＬ１Ｒａ（配列番号５１）の遺伝子安定性と比較した。この目的を達成するため、大腸菌（E. coli）ＫＳ２７２（Strauch (1988) Proc. Natl. Acad. Sci. USA 85:1576-1580）を、塩化カルシウム法（Sambrook (2001) loc. cit.）を使用して、それぞれのプラスミドで形質転換し、遺伝子発現を誘導せずに、１００ｍＬ振盪フラスコ中の、１００ｍｇ／ｍＬアンピシリンで補完した５０ｍｌルリアベルターニ（ＬＢ）培地で、３７℃、１７０ｒｐｍにて７日間培養した。この期間中、細菌細胞を、１日２回（朝および夕）、１：１０００稀釈を使用して新しい培地に移した。７日目、およそ７０世代にわたって連続的に増殖させた後、培養物を最終的には定常期まで増殖させ、細胞をＬＢ／Ａｍｐ寒天にプレーティングした。次いで、個々のクローンをピッキングし、ＬＢ培地の５０ｍＬ培養の接種に使用し、定常期まで一晩増殖させた後、Ｑｉａｇｅｎミニプレップキット（Ｑｉａｇｅｎ、ヒルデン、ドイツ）を使用して、２つのプラスミドの各々につき５つのクローンから、プラスミドＤＮＡを調製し、ＸｂａＩ／ＨｉｎｄＩＩＩ制限消化により分析した（図５）。

ｐＡＳＫ７５－ＰＡＳ＃１ａ（６００）－ＩＬ１Ｒａの５つの分析したクローンのうち１つのクローンのみが、３０９３ｂｐおよび２３７７ｂｐに対応する予想通りのバンドを示した（図５、レーン１）。２つのクローン（図５、レーン３および５）は、ＯｍｐＡおよびＩＬ１Ｒａをコードする遺伝子配列の組合せのおよそのサイズである５７３ｂｐのバンドを明らかにした。これは、恐らくは組換えにより、反復性ＰＡＳ＃１ａ（６００）配列カセットがほぼ完全に喪失したことを示す。他の２つのクローンは、著しく短縮されたＤＮＡ断片を示した（図５、レーン２および４）。これも、反復性ＰＡＳ＃１ａ（６００）配列カセット内の欠失事象、したがって遺伝子不安定性を示す。対照的に、ｐＡＳＫ７５－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａの５つの分析したクローンは全て、３０９３ｂｐおよび２３７７ｂｐに予想通りのバンドを明らかにした（図５、レーン６～１０）。これは、プロリン／アラニンリッチアミノ酸反復配列をコードする遺伝子カセットが完全であること、したがって、本発明による低反復性核酸分子の遺伝子プラスミド安定性が高いことを示す。

［実施例７］
生理活性タンパク質ＩＬ－１Ｒａをコードする発現プラスミドへの、プロリン／アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列のシームレスおよび定方向クローニング。
薬学的応用を目標として、生理活性タンパク質およびプロリン／アラニンリッチアミノ酸反復配列のみを含む融合タンパク質が望まれている。例えば、クローニング用の制限部位を提供または使用するために導入される追加のアミノ酸リンカーが存在しないことにより、臨床使用中の潜在的な免疫応答を防止することができ、および／またはタンパク質レベルでの意図しない相互作用を回避することができる。したがって、ここではＰＡ＃１ｂ（２００）（配列番号２８）を含むＤＮＡ断片で例示される低反復性ヌクレオチド配列を、生理活性タンパク質ＩＬ１－Ｒａ（Molto (2010) Joint Bone Spine. 77:102-107）をコードする、汎用発現プラスミドｐＡＳＫ７５（Skerra (1994) loc. cit.）の誘導体に定方向挿入するためのシームレスクローニング戦略を開発した（図６）。

最初に、ＩＬ１－Ｒａの成熟アミノ酸配列（ＵｎｉＰｒｏｔＩＤＰ１８５１０）をコードする合成ＤＮＡ断片を、遺伝子合成提供業者（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、レーゲンスブルク、ドイツ）から得た。この遺伝子断片（配列番号４６）は、ＸｂａＩ制限部位、その次にリボソーム結合部位、ＯｍｐＡシグナルペプチドをコードするヌクレオチド配列、その次にＧＣＣアラニンコドン、非コード鎖にある第１のＳａｐＩ認識配列ＧＣＴＣＴＴＣ、ＧＣジヌクレオチドスペーサー、および逆相補的に配向されており、コード鎖でのその認識配列がＧＣＴＣＴＴＣである第２のＳａｐＩ制限配列、その次に成熟ＩＬ１Ｒａ（ＵｎｉＰｒｏｔＩＤＰ１８５１０）のコード配列に直接連結されているＧＣＣアラニンコドンを含み、最後にＨｉｎｄＩＩＩ制限部位がその次に続いていた。

この遺伝子断片を、標準的手順（Sambrook (2001) loc. cit.）に従って、隣接する制限部位ＸｂａＩおよびＨｉｎｄＩＩＩによりｐＡＳｋ７５にクローニングした。その結果生じたプラスミド（図６Ａを参照）をＳａｐＩで消化した。それにより、両ＳａｐＩ認識部位を含む小型（２４ｂｐ）ＤＮＡインサートの放出、およびプロリン／アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子の挿入に理想的に適している、ＩＬ－１Ｒａのコードされた成熟Ｎ末端の直前の位置に、適合する５’－ＧＣＣ／５’－ＧＧＣ粘着末端を有する切断されたベクター骨格がもたらされた（図６Ｂ）。いずれも製造業者の説明書に従って、ＱＩＡｑｕｉｃｋゲル抽出キット（Ｑｉａｇｅｎ、ヒルデン、ドイツ）を使用してベクター断片を単離し、温度感受性アルカリホスファターゼＦａｓｔＡＰ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、ウォルサム、マサチューセッツ州）で脱リン酸化した後、それを、ＥａｒＩ制限消化により、ｐＸＬ２－ＰＡ＃１ｂ（２００）（配列番号５４）から切り出したＰＡ＃１ｂ（２００）遺伝子カセットとライゲーションした（図６Ｃ）。その結果生じたプラスミド（配列番号５６）は、生理活性タンパク質ＩＬ－１Ｒａと融合されたプロリン／アラニンリッチアミノ酸反復配列のみからなる融合タンパク質（配列番号１０）の細菌での発現を可能にする（大腸菌（E. coli）の周辺質分泌時のＯｍｐＡシグナルペプチドのｉｎｖｉｖｏプロセシング後）。

［実施例８］
遺伝子的に安定なプラスミドｐＡＳＫ７５－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａにコードされた、ＰＡＳ＃１（６００）配列とＩＬ－１Ｒａとの融合タンパク質の細菌での産生および精製
８Ｌ卓上型発酵槽を使用し、公開されている手順（Schiweck (1995) Proteins 23:561-565）に従って、１００ｍｇ／Ｌアンピシリンおよび３０ｍｇ／Ｌクロラムフェニコールで補完した合成グルコースミネラル培地を用いて、ＰＡＳ＃１（６００）－ＩＬ１－Ｒａ融合タンパク質（計算質量：６８ｋＤａ）を、２５℃にて、実施例６の遺伝子的に安定な発現プラスミドｐＡＳＫ７５－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａおよび折り畳みヘルパープラスミドｐＴＵＭ４（Schlapschy (2006) Protein Eng. Des. Sel. 20:273-284）を内包する大腸菌（E. coli）ＫＳ２７２で産生した。組換え遺伝子発現は、培養がＯＤ_５５０＝２８に達したら直ちに、５００μｇ／Ｌアンヒドロテトラサイクリンを添加することにより誘導した（Skerra (1994) loc. cit.）。２．５時間の誘導期間後、遠心分離により細胞を回収し、氷冷の周辺質分画緩衝液（５００ｍＭスクロース、１ｍＭＥＤＴＡ、１００ｍＭＴｒｉｓ／ＨＣｌｐＨ８．０；１ＬおよびＯＤ_５５０当たり２ｍｌ）に１０分間再懸濁した。１５ｍＭＥＤＴＡおよび２５０μｇ／ｍＬリゾチームを添加した後、細胞懸濁物を、氷上で２０分間インキュベートし、数回遠心分離し、組換えタンパク質を含む清浄上清を回収した。

周辺質抽出物を、４℃にて４回、それぞれ５Ｌの４０ｍＭリン酸ＮａｐＨ７．５、５００ｍＭＮａＣｌで透析し、８０ｍｌのＨｉｓＴｒａｐＨＰカラム（ＧＥＨｅａｌｔｈｃａｒｅ、フライブルク、ドイツ）を使用して、Ｈｉｓ_６タグにより精製した。タンパク質は、４０ｍＭリン酸Ｎａ、ｐＨ７．５、０．５ＭＮａＣｌ中０から２００ｍＭまでのイミダゾール／ＨＣｌｐＨ７．５濃度勾配で溶出した。精製したタンパク質を貯留し、５Ｌの２０ｍＭＴｒｉｓ／ＨＣｌｐＨ８．０、１ｍＭＥＤＴＡで、それぞれ少なくとも６時間４℃にて２回透析した。２０ｍＭＴｒｉｓ／ＨＣｌｐＨ８．０、１ｍＭＥＤＴＡをランニング緩衝液として使用し、Ｓｏｕｒｃｅ１５Ｑレジンを充填した６０ｍｌＸＫカラム（ＧＥＨｅａｌｔｈｃａｒｅ、フライブルク、ドイツ）をＡｋｔａｐｕｒｉｆｉｅｒシステム（ＧＥＨｅａｌｔｈｃａｒｅ、フライブルク、ドイツ）に接続して使用て、透析したタンパク質溶液を、陰イオン交換クロマトグラフィーにかけた。タンパク質は、ランニング緩衝液中０から２００ｍＭまでのＮａＣｌ濃度勾配を使用して溶出した。

溶出画分を、１０ｍＭＭＥＳ／ＨＣｌｐＨ６．０、１ｍＭＥＤＴＡで、それぞれ少なくとも６時間４℃にて２回透析し、その後、３６ｍｌのＳｏｕｒｃｅ１５Ｓレジン（ＧＥＨｅａｌｔｈｃａｒｅ、フライブルク、ドイツ）を充填したＸＫカラムを使用して、陽イオン交換クロマトグラフィーにかけた。陽イオン交換クロマトグラフィーは、１０ｍＭＭＥＳ／ＨＣｌｐＨ６．０、１ｍＭＥＤＴＡをランニング緩衝液として使用して、Ａｋｔａｐｕｒｉｆｉｅｒシステムで実施し、４カラム体積にわたってランニング緩衝液中０から５００ｍＭまでのＮａＣｌ濃度勾配を使用して、タンパク質を溶出した。ＰＡＳ＃１（６００）－ＩＬ１－Ｒａを含む溶出タンパク質画分を再び貯留し、５Ｌリン酸緩衝生理食塩水（ＰＢＳ：１１５ｍＭＮａＣｌ、４ｍＭＫＨ_２ＰＯ_４、および１６ｍＭＮａ_２ＨＰＯ_４ｐＨ７．４）で一晩４℃にて透析し、ＡｍｉｃｏｎＵｌｔｒａ遠心濾過デバイス（３００００ＭＷＣＯ；１５ｍＬ；Ｍｉｌｌｉｐｏｒｅ、ビルリカ、マサチューセッツ州）を使用して、５ｍｇ／ｍｌに濃縮し、ＰＢＳで平衡化したＨｉＬｏａｄ２６／６０Ｓｕｐｅｒｄｅｘ２００調製用カラム（ＧＥＨｅａｌｔｈｃａｒｅ、フライブルク、ドイツ）を使用したサイズ排除クロマトグラフィーでさらに精製した。

凝集の徴候がない均質なタンパク質調製物が、１つの８Ｌ発酵槽から７０ｍｇの最終収量で得られた。タンパク濃度は、１５７２０Ｍ^－１ｃｍ^－１の計算吸光係数（Gill (1989) Anal. Biochem. 182:319-326）を使用し、２８０ｎｍの吸収を測定することにより決定した。高モル濃度Ｔｒｉｓ緩衝液系（Fling (1986) Anal. Biochem. 155:83-88）を使用してＳＤＳ－ＰＡＧＥを実施した（図７Ａ）。

［実施例９］
ＰＡＳ＃１（６００）－ＩＬ１Ｒａ融合タンパク質のＥＳＩ－ＭＳ分析
実施例８に記載のように産生および精製したＰＡＳ＃１（６００）－ＩＬ１Ｒａを、１０００倍容積の１０ｍＭ酢酸アンモニウムｐＨ６．８で２回透析し、陽イオンモードを使用してＱ－ＴｏｆＵｌｔｉｍａ機器（Ｗａｔｅｒｓ、エッシュブロン、ドイツ）で、ＥＳＩ質量分析法により分析した。ＰＡ＃１（６００）－ＩＬ１Ｒａ融合タンパク質のデコンボリューションスペクトルは、６７９９４．８Ｄａの質量を明らかにした。これは、６７９９４．８Ｄａの計算質量と本質的に一致する（図７Ｂ）。これは、遺伝子的に安定な発現プラスミドｐＡＳＫ７５－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａを使用して、大腸菌（E. coli）にて、ＰＡ＃１（６００）－ＩＬ１Ｒａ融合タンパク質全体を効率的に産生することができることを明らかに示す。

［実施例１０］
プロリン／アラニンリッチアミノ酸反復ポリペプチドを大腸菌（E. coli）で産生するための遺伝子的に安定なプラスミドであるｐＡＳＫ３７－ＭＰ－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）の構築
純粋なＰＡ＃１（６００）ポリペプチドをコードする安定な発現プラスミドを構築するため、１００ｐｍｏｌのプライマーＮｄｅＩ－ＭＰ－ＳａｐＩ－ＨｉｎｄＩＩＩｆｗ（配列番号４）およびＮｄｅＩ－ＭＰ－ＳａｐＩ－ＨｉｎｄＩＩＩｒｅｖ（配列番号５）をリン酸化し、混合し、８０℃まで１０分間加熱し、ゆっくりと一晩かけて室温に冷却して、ハイブリダイゼーションを可能にした。その結果生じた二本鎖ＤＮＡ断片は、ＮｄｅＩおよびＨｉｎｄＩＩＩ突出に適合する粘着末端を示した。プラスミドｐＡＳＫ３７（Skerra (1991) loc. cit）を、ＮｄｅＩおよびＨｉｎｄＩＩＩで切断し、骨格断片を、ハイブリダイズされたプライマーとライゲーションした。

その結果生じたプラスミドをＳａｐＩで消化した。それにより、２つのＳａｐＩ認識部位を含む小型（２４ｂｐ）インサートの放出、および適合する粘着５’－ＧＣＣ／５’－ＧＧＣ末端を有する切断されたベクター骨格がもたらされた。これら粘着末端は、プロリンコドンＣＣＡがその後にあるＮ末端開始メチオニンコドン（ＡＴＧ）のすぐ下流の位置に、プロリン／アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列を挿入するのに理想的に適しており、それにより効率的な翻訳開始が可能になることを見出した。製造業者の説明書に従って、ＱＩＡｑｕｉｃｋゲル抽出キットを使用してベクター断片を単離し、温度感受性アルカリホスファターゼＦａｓｔＡＰで脱リン酸化した後、それを、ＥａｒＩ制限消化によりｐＸＬ２－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）から切り出した低反復性遺伝子カセットＰＡ＃１ｄ／１ｃ／１ｂ（６００）（配列番号４２）とライゲーションした。その結果生じたプラスミド（配列番号５３）は、プロリン／アラニンリッチアミノ酸反復配列を含むポリペプチドの発現を可能にする（図８Ａ）。

［実施例１１］
遺伝子的に安定なプラスミドｐＡＳＫ３７－ＭＰ－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）にコードされたＰＡ＃１（６００）ポリペプチドの細菌発現および精製
Ｎ末端に追加のＰｒｏ残基およびＣ末端に追加のＡｌａ残基を有するＰＡ＃１（６００）ポリペプチド（計算質量：４８３０２Ｄａ）を、実施例１０に記載の発現プラスミドｐＡＳＫ３７－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）を内包する大腸菌（E. coli）ＫＳ２７２の細胞質中で産生した。ｐＡＳＫ３７－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）で形質転換された大腸菌（E. coli）ＫＳ２７２のコロニーを、１ｗ／ｖ％グルコースおよび１００ｍｇ／Ｌアンピシリンで置換された、無菌１３ｍＬポリプロピレンチューブ（Ｓａｒｓｔｅｄｔ、ニュームブレヒト、ドイツ）中の４ｍｌＬＢ培地に接種し、３７℃、１７０ｒｐｍで一晩増殖させた。細菌でのタンパク質産生は、２．５ｇ／ＬのＤ－グルコースおよび１００ｍｇ／Ｌのアンピシリンで補完された２Ｌテリフィックブロス（ＴＢ）培地（Sambrook (2001) loc. cit.）を有する５Ｌ振盪フラスコで３０℃にて実施した。

大腸菌（E. coli）培養に２ｍｌの一晩培養物を接種し、細胞を一晩増殖させ、ＯＤ_５５０＝５になったら、イソプロピル－β－Ｄ－チオガラクトピラノシド（ＩＰＴＧ）を、０．５ｍＭの終濃度になるまで添加することにより、組換え遺伝子発現を誘導した。誘導３時間後に細菌を回収し、２０ｍｌの４０ｍＭリン酸ＮａｐＨ７．２、１ｍＭＥＤＴＡに再懸濁し、フレンチプレスセル（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、ウォルサム、マサチューセッツ州）を使用して溶菌した。溶菌物を遠心分離（１７，０００ｒｐｍ、１時間、４℃）した後、封入体は観察されなかった。可溶性ＰＡ＃１（６００）ポリペプチドを含む上清を、室温で連続撹拌しながら２０ｗ／ｖ％の終濃度になるまで固体（ＮＨ_４）_２ＳＯ_４を段階的に添加することによる硫酸アンモニウム析出法にかけた。上清を、室温で２０分間、１７，０００ｒｐｍで遠心分離した。析出したＰＡ＃１（６００）ポリペプチドを含む沈殿物を、２０ｍＭＴｒｉｓ／ＨＣｌｐＨ８．０に溶解し、溶液を遠心分離し（１３，０００ｒｐｍ、１０分間、室温）、不溶性狭雑物を除去した。

純粋な酢酸（Ｓｉｇｍａ－Ａｌｄｒｉｃｈ、シュタインハイム、ドイツ）を、１ｖ／ｖ％の終濃度になるまで添加し、１３，０００ｒｐｍで１０分間遠心分離することにより不純物を沈殿させた。ほとんど純粋なＰＡ＃１（６００）ポリペプチドを含む上清を、１００倍容積の１ｖ／ｖ％酢酸で４℃にて一晩透析した。残留不純物を除去するため、１ｖ／ｖ％酢酸をランニング緩衝液として使用し、１ｍｌのＳｏｕｒｃｅ１５Ｓカラム（ＧＥＨｅａｌｔｈｃａｒｅ、フライブルク、ドイツ）をＡｋｔａｐｕｒｉｆｉｅｒシステムに接続して使用して、透析したタンパク質を、サブトラクティブ陽イオン交換クロマトグラフィーにかけた。

各精製ステップの試料を、高モル濃度Ｔｒｉｓ緩衝液系（Fling (1986) loc. cit.）を使用して、ＳＤＳ－ＰＡＧＥにより分析した。ＳＤＳ－ＰＡＧＥ後に、ゲルを、まず、ＰＥＧの分析について記載されているように（Kurfurst (1992) Anal. Biochem. 200:244-248）ヨウ化バリウムで染色した。手短に言えば、ポリアクリルアミドゲルを水ですすいだ後、２．５ｗ／ｖ％のＢａＩ_２（ヨウ化バリウム二水和物；Ｓｉｇｍａ－Ａｌｄｒｉｃｈ、シュタインハイム、ドイツ）水溶液中で５分間インキュベートした。水ですすいだ後、ゲルを、ルゴール溶液（水中の、１０ｗ／ｖ％のｐ．ａ．等級ＫＩ（ＡｐｐｌｉＣｈｅｍ、ダルムシュタット、ドイツ５％のｐ．ａ．等級Ｉ_２（ＲｉｅｄｅｌｄｅＨａｅｎＡＧ、ゼールツェ、ドイツ））に５分間移した。１０ｖ／ｖ％酢酸で脱染色した後、オレンジ色のＰＡ＃１（６００）ポリペプチドバンドが視覚化された（図８Ｂ）。その後、ゲルを水で脱染色し、１０％酢酸（ＨｏｎｅｙｗｅｌｌＳｐｅｃｉａｌｔｙＣｈｅｍｉｃａｌｓ、ゼールツェ、ドイツ）、６５％Ｈ_２Ｏ、および２５％イソプロパノール（ＣＬＮ、ニーダーフンメル、ドイツ）に溶解したクーマシーブリリアントブルーＲ２５０（Ａｐｐｌｉｃｈｅｍ）による第２の染色にかけた。１０ｖ／ｖ％酢酸で脱染色した後、青色タンパク質バンド（宿主細胞タンパク質の）が視覚化された（図８Ｃ）。

［実施例１２］
純粋なＰＡ＃１（６００）ポリペプチドのＥＳＩ－ＭＳ分析
５ｍｇ／ｍＬ濃度の実施例１１の単離されたＰＡ＃１（６００）ポリペプチドの２００μｌを、２ｖ／ｖ％アセトニトリル、１ｖ／ｖ％ギ酸をランニング緩衝液として使用して、Ａｋｔａｐｕｒｉｆｉｅｒシステムに接続された１ｍＬＲｅｓｏｕｒｃｅＲＰＣカラム（ＧＥＨｅａｌｔｈｃａｒｅ、フライブルク、ドイツ）にアプライした。タンパク質は、２０カラム体積にわたって２ｖ／ｖ％アセトニトリル、０．１ｖ／ｖ％ギ酸から８０ｖ／ｖ％アセトニトリル、０．１ｖ／ｖ％ギ酸までのアセトニトリル勾配を使用して溶出した。溶出したタンパク質は、そのまま、陽イオンモードを使用してＱ－ＴｏｆＵｌｔｉｍａ機器でＥＳＩ質量分析により分析した。ＰＡ＃１（６００）ポリペプチドのデコンボリューションスペクトルは、４８３０１．７８Ｄａの質量を明らかにした。これは、Ｎ末端に追加のＰｒｏ残基およびＣ末端に追加のＡｌａ残基を有するが、開始メチオニンを欠如するＰＡ＃１（６００）ポリペプチドの計算質量（４８３０１．４Ｄａ）と本質的に一致する（図８Ｄ）。これは、遺伝子的に安定なヌクレオチド配列によりコードされた純粋なＰＡ＃１（６００）ポリペプチド（親和性タグを有していない）を、その完全な形態で大腸菌（E. coli）において産生させることができることを明らかに示す。

［実施例１３］
プロリン／アラニンリッチアミノ酸配列をコードするヌクレオチド配列の反復分析
プロリン／アラニンリッチ配列をコードする核酸分子の品質を、ヌクレオチド配列反復の頻度（出現）に関して評価するための尺度として、本発明者らは、以下の数式により算出されるヌクレオチド反復スコア（ＮＲＳ）を考案した。

この数式中、Ｎ_ｔｏｔは、分析するヌクレオチド配列の全長さであり、ｎは、分析するヌクレオチド配列内の配列反復の長さであり、頻度ｆ_ｉ（ｎ）は、この配列反復の出現数である。同じ長さｎを有するいくつかの異なる配列反復が存在する場合、これらの異なる配列反復は、インデックスｉにより区別され、同じ長さｎを有する異なる配列反復の数は、ｋ（ｎ）である。１つのタイプの長さｎを有する配列反復しか存在しない場合、ｋ（ｎ）は１と等しい。ＮＲＳは、反復長の二乗の和に、それぞれの全体頻度の平方根をかけ、それを、分析するヌクレオチド配列の全長で除算したものと定義される。ＮＲＳの算出に考慮される最小反復長は、４つのヌクレオチドを含み、１つのコドントリプレットよりも長い全てのヌクレオチド配列を含み、最大で、Ｎ_ｔｏｔ－１までの範囲であり、つまり、分析するヌクレオチド配列に１回よりも多く出現し得る最も長いヌクレオチド配列反復の長さである。

この状況では、用語「反復」は、ヌクレオチド配列が、分析するヌクレオチド配列内に少なくとも２回出現することを意味する。頻度を計数する場合、本発明者らは、少なくとも２回出現する同一配列を有するヌクレオチド伸長、ならびに各々がまた少なくとも２回出現する同じ長さの異なる配列を有するヌクレオチド伸長を両方とも考慮した。例えば、１４量体反復の全体頻度が５である場合、これは、同じ１４量体ヌクレオチド伸長が５回出現するか、または１つの１４量体ヌクレオチド配列が、分析するヌクレオチド配列に２回出現し、１つの異なる１４個ヌクレオチド配列が３回出現するかのいずれかを意味する。

さらに、より長いヌクレオチド配列反復内に含まれているより短い反復は、各々が別々に計数される。例えば、分析するヌクレオチド配列が、２つのＧＣＡＣＣヌクレオチド伸長（すなわち、反復）を含む場合、ＧＣＡＣおよびＣＡＣＣ反復も、それらが前記ＧＣＡＣＣヌクレオチド伸長内に、または恐らくは加えて、分析するヌクレオチド配列内の他所に出現するか否かに関わらず、個々に数えられる。なお、核酸分子のコード鎖の反復のみが考慮される。

当業者であれば、手作業で、またはｈｔｔｐ：／／ｗｗｗ．ｖｉｓｕａｌｇｅｎｅｄｅｖｅｌｏｐｅｒ．ｎｅｔでダウンロードで入手可能なＶｉｓｕａｌＧｅｎｅＤｅｖｅｌｏｐｅｒ（Jung (2011) loc. cit.）、もしくはｈｔｔｐ：／／ｚｌａｂ．ｂｕ．ｅｄｕ／ｒｅｐｆｉｎｄで利用可能なＲｅｐｆｉｎｄツール等（Betley (2002) loc. cit）の一般ソフトウェアプログラムの支援を受けてのいずれかで、ヌクレオチド配列反復を特定することができる。しかしながら、全てのアルゴリズムが、各種の反復を検出するとは限らず、例えば、ＶｉｓｕａｌＧｅｎｅＤｅｖｅｌｏｐｅｒの結果は、オーバーラップ反復を含まない。したがって、ソフトウェアツールの結果を点検し、必要に応じて、手作業で修正しなければならない。あるいは、実施例１４に記載のＮＲＳカリキュレータと称するアルゴリズムを使用して、ヌクレオチド配列反復を明確に特定し、自動的にＮＲＳを算出してもよい。

当技術分野では、プロリン／アラニンリッチアミノ酸配列をコードする天然核酸ならびにある合成核酸が知られている。しかしながら、それらの配列は全て、下記に記載されているＮＲＳ分析で明らかに明白になるように、遺伝子レベルで高度に反復性であり、したがって、それらの生物工学的および／または生物薬学的な応用への使用には制限がある。

プロリン／アラニンリッチアミノ酸配列をコードするいくつかの従来技術のヌクレオチド配列を、実施例１４に記載のＮＲＳカリキュレータを使用して、本発明によるプロリン／アラニンリッチアミノ酸反復配列をコードする低反復性核酸分子と比較した：国際公開第２００８／１５５１３４号パンレットに開示されているヌクレオチド配列ＰＡＳ＃１ａ（２００）（配列番号１１）（図９Ａ）、国際公開第２０１１１４４７５６号パンフレットに開示されているヌクレオチド配列ＰＡ＃１ａ（２００）（配列番号１４）（図９Ｂ）、米国特許出願公開第２００６０２５２１２０号明細書に開示されている［（ＡＰ）_５］_２０ＡＰＡ糖モジュール（配列番号１６）をコードするヌクレオチド配列（図９Ｃ）、ＧｅｎＢａｎｋ受託番号ＤＱ３９９４１１．１として公開されている糖モジュール［ＡＡＰＡＰＡＰＡＰ］_１０ＡＳ（配列番号１７）をコードする合成遺伝子構築物のヌクレオチド配列（図９Ｄ）、ＧｅｎＢａｎｋ受託番号ＮＰ＿８５１８９６として公開されている、マカクヘルペスウイルス（macacine herpesvirus）１の大型テグメントタンパク質内のプロリン／アラニンリッチ配列をコードする２２５ヌクレオチド配列（配列番号１８）（図９Ｅ）、本発明による低反復性ヌクレオチド配列ＰＡＳ＃１ｂ（２００）（配列番号１９）（図９Ｆ、Ｇ）、および本発明による低反復性ヌクレオチド配列ＰＡ＃１ｅ／１ｄ／１ｃ／１ｂ（８００）（配列番号４４）（図９Ｈ、Ｉ）。

算出された反復頻度を、ＫａｌｅｉｄａｇｒａｐｈＶ３．６ソフトウェア（ＳｙｎｅｒｇｙＳｏｆｔｗａｒｅ、レディング、ペンシルベニア州）を使用して、それぞれの反復長に対してプロットした（図９）。従来技術のヌクレオチド配列の全てのヒストグラムは、高度に反復性の性質を明らかにするが、これは、高頻度を示すバーが多数あり、反復長は、非常に長い反復まで幅広い分布を有することにより示されている。特筆すべきことには、これらの場合では、反復頻度は、反復長が長くなると共にゆっくりとしか減少しない（図９Ａ～Ｅ）。対照的に、本発明による低反復性ヌクレオチド配列ＰＡＳ＃１ｂ（２００）およびＰＡ＃１ｅ／１ｄ／１ｃ／１ｂ（８００）のヒストグラムは、ほんの少数の反復しか示さず、最大長は１４ヌクレオチドであり、それらの頻度は、より短い反復からより長い反復に移行するときに、急激に減少してゼロになる（図９Ｆ、Ｇ、Ｈ、Ｉ）。

従来技術のヌクレオチド配列と本発明の低反復性ヌクレオチド配列との間の反復性の差異は、それらのヌクレオチド反復スコアを比較すると、さらにより明白になる。従来技術の配列は全て、８００００を超えるＮＲＳを明らかにするが（表２）、６００ヌクレオチド配列ＰＡＳ＃１ｂ（２００）および２４００ヌクレオチド配列ＰＡ＃１ｅ／１ｄ／１ｃ／１ｂ（８００）は、それぞれ、わずか１３および１４のＮＲＳ値を示す（表１）。これは、本発明によるプロリン／アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列の反復品質が、従来技術の配列と比較してはるかにより高く、ヌクレオチド配列反復が、より少数であり、かつより短いことを明らかに示す。

［実施例１４］
ヌクレオチド配列反復を明確に特定し、ヌクレオチド反復スコアを算出するためのアルゴリズムであるＮＲＳカリキュレータ
ＶｉｓｕａｌＧｅｎｅＤｅｖｅｌｏｐｅｒ（Jung (2011) loc. cit）またはＲｅｐｆｉｎｄツール（Betley (2002) loc. cit）等の一般的に利用可能なソフトウェアプログラムは、必ずしも信頼性高く作動するとは限らず、分析するヌクレオチド配列内にある全ての配列反復を正確に算出するためには、手作業による修正が必要となる場合がある。加えて、反復は、手作業で計数しなければならず、ＮＲＳは、実施例１３に記載の数式により別々に算出しなければならない。明確な結果を産出するアルゴリズムを提供するための、およびＮＲＳの算出を容易にするための、ＮＲＳカリキュレータと称する簡単なＰｙｔｈｏｎスクリプトをここに記載する。このスクリプトは、ランタイム環境Ｐｙｔｈｏｎ２．７．１０（ｈｔｔｐ：／／ｗｗｗ．ｐｙｔｈｏｎ．ｏｒｇ）で実行され、ドットマトリックス配列比較に基づき、潜在的に長いヌクレオチド配列内にある、オーバーラップ反復を含む全ての順方向反復を、ギャップを考慮せずに特定する。ドットマトリックス配列比較は、当業者に周知の方法であり、例えば、Mount (2004) Bioinformatics: Sequence and Genome Analysis, Cold Spring Harbor Laboratory Press, 2^nd edition, New York等の一般的なバイオインフォマティクスの教科書に記載されている。

ＮＲＳカリキュレータは、各反復長の頻度を計数し、実施例１３に記載の数式に従ってＮＲＳを自動的に算出する。ＮＲＳカリキュレータスクリプトを実行するために、ランタイム環境Ｐｙｔｈｏｎバージョン２．７．１０を、ｈｔｔｐｓ：／／ｗｗｗ．ｐｙｔｈｏｎ．ｏｒｇ／ｄｏｗｎｌｏａｄｓからダウンロードし、Ｗｉｎｄｏｗｓ７オペレーティングシステムを実行するＴｈｉｎｋＰａｄＬ５３０ノートブック（Ｌｅｎｏｖｏ、シュツットガルト、ドイツ）にインストールした。ＭｉｃｒｏｓｏｆｔＷｉｎｄｏｗｓＥｄｉｔｏｒバージョン６．１を使用して、下記に記載されているＮＲＳカリキュレータスクリプトを、ＮＲＳｃａｌｃｕｌａｔｏｒ．ｐｙと命名したプレーンテキストファイルとして保存した。分析しようとするヌクレオチド配列を、ｓｅｑｕｅｎｃｅ．ｆａｓという名前のＦＡＳＴＡファイルとして、同じフォルダー内に保存した。その後、コマンドラインシェルを開き、ＮＲＳｃａｌｃｕｌａｔｏｒ．ｐｙおよびｓｅｑｕｅｎｃｅ．ｆａｓファイルを両方とも含むディレクトリーを選択した。計算を開始させるために、以下のコマンドラインを実行した。
ｃ：＼ｕｓｅｒ＼ａｄｍｉｎ＼ＮＲＳｆｏｌｄｅｒ＞ｃ：＼Ｐｙｔｈｏｎ２７＼ｐｙｔｈｏｎ．ｅｘｅＮＲＳｃａｌｃｕｌａｔｏｒ．ｐｙｓｅｑｕｅｎｃｅ．ｆａｓ

このコマンドは、２列のスクリーン出力をもたらした。左側の列は、反復長（長さ）を示し、右側の（第２の）列は、それぞれの反復頻度（頻度）を示す。加えて、Ｎ_ｔｏｔおよびＮＲＳ（端数のない整数）は、それぞれ、出力の始めおよび終わりに記載されていた。

ＮＲＳカリキュレータスクリプト：

ＮＲＳカリキュレータの例示的な出力：

［実施例１５］
治療用のＰＡ＃１（６００）－ＩＬ１Ｒａ融合タンパク質を細菌で産生するための遺伝子的に安定な発現ベクターであるｐＡＳＫ７５－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａの構築
インターロイキン－１受容体アンタゴニスト（ＩＬ－１Ｒａ）を、６００残基ＰＡ＃１アミノ酸反復配列との融合体としてコードする発現プラスミドを構築するために、ベクターｐＡＳＫ７５－ＩＬ１Ｒａ（図４Ａ）（配列番号４９）を、ＳａｐＩで切断し、エビアルカリホスファターゼ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、ウォルサム、マサチューセッツ州）で脱リン酸化し、６００残基ＰＡ＃１ポリペプチドをコードする低反復性ヌクレオチド配列カセットに対応するＤＮＡ断片とライゲーションし、それを、ＳａｐＩでの制限消化によりプラスミドｐＸＬ１－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）（配列番号７９）から切り出した。大腸菌（E. coli）ＸＬ１－Ｂｌｕｅ（Bullock (1987) loc. cit.）を形質転換した後、プラスミドＤＮＡを調製し、挿入したＤＮＡ断片の存在を、制限分析およびＤＮＡ配列決定により確認した。その結果生じたプラスミドを、ｐＡＳＫ７５－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａ（配列番号７７）と命名した。それは図１０に示されている。

［実施例１６］
プロリン／アラニンリッチアミノ酸反復配列をコードする低反復の核酸分子ＰＡ＃１ｄ／１ｃ／１ｂ（６００）を内包するプラスミドｐＡＳＫ７５－ＰＡ＃１ｂ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａの長期遺伝子安定性試験
プラスミドｐＡＳＫ７５－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａ（配列番号７７）の遺伝子安定性を、ＰＡ＃１ｄ／１ｃ／１ｂ（６００）ＤＮＡカセットが、反復性核酸ＰＡ＃１ａ（６００）（配列番号８０）により置き換えられた誘導体であるｐＡＳＫ７５－ＰＡ＃１ａ（６００）－ＩＬ１Ｒａ（配列番号７８）の遺伝子安定性と比較した。この目的を達成するため、大腸菌（E. coli）ＪＭ８３（Yanisch-Perron C. (1985) loc. cit.）を、塩化カルシウム法（Sambrook (2001) loc. cit.）を使用して、それぞれのプラスミドで形質転換し、遺伝子発現を誘導せずに、１００ｍＬ振盪フラスコ中の、１００ｍｇ／Ｌアンピシリンで補完した５０ｍｌルリアベルターニ（ＬＢ）培地で、３７℃、１７０ｒｐｍにて７日間培養した。この期間中、細菌細胞を、１日２回（朝および夕）、１：１０００稀釈を使用して新しい培地に移した。７日目、およそ７０世代にわたって連続的に増殖させた後、培養物を最終的には定常期まで増殖させ、細胞をＬＢ／Ａｍｐ寒天にプレーティングした。その後、２つのプラスミドの各々の１０個の個々のクローンをピッキングし、各々を、ＬＢ／Ａｍｐ培地の５０ｍＬ培養の接種に使用し、定常期まで一晩増殖させた後、Ｑｉａｇｅｎミニプレップキット（Ｑｉａｇｅｎ、ヒルデン、ドイツ）を使用して、プラスミドＤＮＡを調製し、ＸｂａＩ／ＨｉｎｄＩＩＩ制限消化により分析した（図１１）。

ｐＡＳＫ７５－ＰＡ＃１ａ（６００）－ＩＬ１Ｒａの１０個の分析したクローンのうち６つのみが、３０９３ｂｐおよび２３７７ｂｐに対応する予想通りのバンドを示した（図１１Ａ、レーン１、３、４、５、７、および８）。４つのクローンは、著しく短縮されたＤＮＡ断片を示した（図１１Ａ、レーン２、６、９、および１０）。これは、反復性ＰＡ＃１ａ（６００）配列カセット内の欠失、したがって遺伝子不安定性を示す。対照的に、ｐＡＳＫ７５－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）－ＩＬ１Ｒａの１０個の分析したクローンは全て、３０９３ｂｐおよび２３７７ｂｐに予想通りのバンドを明らかにした（図１１Ｂ、レーン１～１０）。これは、プロリン／アラニンリッチアミノ酸反復配列をコードする遺伝子カセットが完全であること、したがって、本発明による低反復性核酸分子の遺伝子プラスミド安定性が高いことを示す。

［実施例１７］
プロリン／アラニンリッチアミノ酸反復配列と融合されたヒトレプチンを細菌で産生するための遺伝子的に安定な発現ベクターの構築。
６００残基ＰＡ＃１アミノ酸反復配列（配列番号８２）とＮ末端で融合されたヒトレプチン（ｈｕＬｅｐｔｉｎ）をコードする発現プラスミドを構築するために、ベクターｐＡＳＫ３７－ＭＰ－ｈｕＬｅｐｔｉｎ（図１２Ａ）（配列番号８１）を、ＳａｐＩで切断した。それにより、両ＳａｐＩ認識部位を含む小型（２４ｂｐ）ＤＮＡインサートの切除、およびヒトレプチンのコードされた成熟Ｎ末端のすぐ上流の位置に、適合する５’－ＧＣＣ／５’－ＧＧＣ粘着末端を有する切断されたベクター骨格がもたらされた。これら粘着末端は、プロリンコドンＣＣＡがその後にあるＮ末端開始メチオニンコドン（ＡＴＧ）のすぐ下流の位置に、プロリン／アラニンリッチアミノ酸反復配列をコードする低反復性ヌクレオチド配列を挿入するのに理想的に適しており、それにより効率的な翻訳開始が可能になることを見出した。いずれも製造業者の説明書に従って、ＱＩＡｑｕｉｃｋゲル抽出キット（Ｑｉａｇｅｎ、ヒルデン、ドイツ）を使用してベクター断片を単離し、温度感受性アルカリホスファターゼＦａｓｔＡＰ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、ウォルサム、マサチューセッツ州）で脱リン酸化した後、プラスミドを、ＳａｐＩでの制限消化によりプラスミドｐＸＬ１－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）（配列番号７９）から切り出した、６００残基ＰＡ＃１ｂポリペプチドをコードする低反復性ヌクレオチド配列カセットに対応するＤＮＡ断片とライゲーションした。大腸菌（E. coli）ＸＬ１－Ｂｌｕｅ（Bullock (1987) loc. cit.）を形質転換した後、プラスミドＤＮＡを調製し、挿入したＤＮＡ断片の存在を、制限分析およびＤＮＡ配列決定により確認した。その結果生じたプラスミドを、ｐＡＳＫ３７－ＭＰ－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）－ｈｕＬｅｐｔｉｎ（配列番号８２）と命名した。それは図１２Ｂに示されている。同じ様式で、図１２Ｃに示されている６００残基ＰＡＳ＃１アミノ酸反復配列とＮ末端で融合されたヒトレプチン（ｈｕＬｅｐｔｉｎ）をコードする発現プラスミドである、ｐＡＳＫ３７－ＭＰ－ＰＡＳ＃１ｆ／１ｃ／１ｂ（６００）－ｈｕＬｅｐｔｉｎ（配列番号８３）を、プラスミドｐＡＳＫ３７－ＭＰ－ｈｕＬｅｐｔｉｎ（図１２Ａ）（配列番号８１）に、ｐＸＬ１－ＰＡＳ＃１ｆ／１ｃ／１ｂ（配列番号８４）から切り出した低反復性ヌクレオチド配列ＰＡＳ＃１ｆ／１ｃ／１ｂ（配列番号３８）を挿入することにより構築した。同様のクローニング戦略を適用して、プロリン／アラニンリッチアミノ酸反復配列とＣ末端で融合された型のレプチンを構築することができる。

［実施例１８］
遺伝子的に安定なプラスミドｐＡＳＫ３７－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）ｈｕ－Ｌｅｐｔｉｎ（Ｗ１００Ｑ）にコードされた、プロリン／アラニンリッチアミノ酸反復配列とヒトレプチン突然変異との融合タンパク質の細菌での産生、精製、および特徴付け
成熟アミノ酸配列の１００位にトリプトファンからグルタミンへの置換を有するヒトレプチン突然変異体（ＵｎｉＰｒｏｔＫＢ受託コードＰ４１１５９）とプロリン／アラニンリッチアミノ酸反復配列ＰＡ＃１（６００）（配列番号８５）との融合タンパク質であるＰＡ＃１（６００）－ｈｕＬｅｐｔｉｎ（Ｗ１００Ｑ）（計算質量：６４．２５ｋＤａ）を、ｔｒｘＢ、ｇｏｒ、およびａｈｐＣ突然変異により酸化性細胞質を有する大腸菌（E. coli）菌株（Bessette (1999) Proc. Natl. Acad. Sci. USA 96:13703-13708）であるＯｒｉｇａｍｉＢ（Ｎｏｖａｇｅｎｅ／ＭｅｒｃｋＭｉｌｌｉｐｏｒｅ、ビルリカ、マサチューセッツ州）の細胞質において３０℃で産生した。この目的を達成するため、１ｗ／ｖ％のＤ－グルコースおよび１００ｍｇ／Ｌのアンピシリンで補完した、無菌１３ｍＬポリプロピレンチューブ（Ｓａｒｓｔｅｄｔ、ニュームブレヒト、ドイツ）中の４ｍｌＬＢ培地に、遺伝子的に安定な発現プラスミドｐＡＳＫ３７－ＭＰ－ＰＡ＃１ｄ／１ｃ／１ｂ（６００）－ｈｕＬｅｐ（Ｗ１００Ｑ）（配列番号８６）で形質転換した大腸菌（E. coli）ＯｒｉｇａｍｉＢのコロニーを接種した。細菌細胞を、３０℃にて１７０ｒｐｍの振盪器で一晩増殖させた。

細菌でのタンパク質産生は、２ｍｌの大腸菌（E. coli）一晩培養物を接種した、２．５ｇ／ＬのＤ－グルコースおよび１００ｍｇ／Ｌのアンピシリンで補完された２Ｌテリフィックブロス（ＴＢ）培地（Sambrook (2001) loc. cit.）を有する５Ｌバッフルフラスコで３０℃にて実施した。細菌細胞を３０℃で増殖させ、ＯＤ_５５０＝０．８５になったら、イソプロピル－β－Ｄ－チオガラクトピラノシド（ＩＰＴＧ）を、０．５ｍＭの終濃度になるまで添加することにより、組換え遺伝子発現を誘導した。誘導の１９時間後に細菌を回収し、細菌細胞湿重量１ｇ当たり３ｍｌのＰＢＳ／Ｅ（１０ｍＭＥＤＴＡで補完されたＰＢＳ）に再懸濁し、Ｐａｎｄａ細胞破砕器（ＧＥＡ、パルマ、イタリア）を使用して溶菌した。溶菌物を遠心分離（２０，０００ｒｐｍ、３０分間、４℃）した後、封入体は観察されなかった。１ｍＭの２，２’－ジチオジピリジンを上清に添加して、組換えレプチンのジスルフィド架橋形成を促進させた。可溶性レプチン融合タンパク質を含む上清を、１００倍容積のＰＢＳで一晩４℃にて透析した。その後、１Ｍの（ＮＨ_４）_２ＳＯ_４の終濃度に到達するまで連続的に撹拌しながら４Ｍの（ＮＨ_４）_２ＳＯ_４（水に溶解した）を滴加することにより、融合タンパク質を、室温で析出させた。室温にて２０分間１７，０００ｒｐｍで遠心分離した後、析出したＰＡ＃１（６００）－ｈｕ－Ｌｅｐｔｉｎ（Ｗ１００／Ｑ）融合タンパク質を含む沈殿物を、ＰＢＳに溶解し、溶液を遠心分離（１３，０００ｒｐｍ、１０分間、室温）して、不溶性狭雑物を除去した。

ＰＡ＃１（６００）－ｈｕ－Ｌｅｐｔｉｎ（Ｗ１００Ｑ）融合タンパク質を、５Ｌの２０ｍＭＴｒｉｓ／ＨＣｌｐＨ８．５で２回、各々少なくとも６時間４℃にて透析した。次いで、ランニング緩衝液として２０ｍＭＴｒｉｓ／ＨＣｌｐＨ８．５を使用し、６ｍｌのＲｅｓｏｕｒｃｅＱカラム（ＧＥＨｅａｌｔｈｃａｒｅ、フライブルク、ドイツ）をＡｋｔａｐｕｒｉｆｉｅｒシステム（ＧＥＨｅａｌｔｈｃａｒｅ、フライブルク、ドイツ）に接続して使用して、タンパク質溶液を、陰イオン交換クロマトグラフィーにかけた。その後、融合タンパク質を、ＮａＣｌ濃度勾配を使用して溶出した。溶出画分を収集し、ＰＢＳで平衡化したＳｕｐｅｒｄｅｘ２００ＨＲ１０／３００カラム（ＧＥＨｅａｌｔｈｃａｒｅ、フライブルク、ドイツ）を使用して、サイズ排除クロマトグラフィーでさらに精製した。

この手順により、凝集の徴候がない均質なタンパク質調製物が、０．８ｍｇ／Ｌ細菌培
養の最終収量で得られた。タンパク濃度は、８６０５Ｍ^－１ｃｍ^－１の計算吸光係数（Gi
ll (1989) loc. cit.）を使用して、２８０ｎｍの吸光を測定することにより決定した。
１０％高モル濃度Ｔｒｉｓ緩衝液系（Fling (1986) loc. cit.）を使用してＳＤＳ－ＰＡ
ＧＥを実施した（図１３Ａ）。溶出したタンパク質を、１００００倍容積の１０ｍＭ酢酸
アンモニウムｐＨ５．５で２回透析し、陽イオンモードを使用してｍａＸｉｓＱ－ＴＯ
Ｆ機器（ＢｒｕｋｅｒＤａｌｔｏｎｉｃｓ、ブレーメン、ドイツ）で、ＥＳＩ質量分析
により分析した。ＰＡ＃１（６００）－ｈｕ－Ｌｅｐｔｉｎ（Ｗ１００Ｑ）のデコンボリ
ューションスペクトルは、６４２４９．５３Ｄａの質量を明らかにした（図１３Ｂ）。こ
れは、この融合タンパク質の計算質量（６４２４９．８０Ｄａ）と本質的に一致する。こ
れは、本発明による遺伝子的に安定な低反復性核酸分子によりコードされたＰＡ＃１（６
００）－ｈｕ－Ｌｅｐｔｉｎ（Ｗ１００Ｑ）融合タンパク質を、その完全な形態で大腸菌
（E. coli）にて産生させることができることを明らかに示す。

本発明は以下の態様を含む。
＜１＞
プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌク
レオチド配列を含む核酸分子であって、
前記核酸の前記ヌクレオチド配列が、少なくとも３００ヌクレオチドの長さを有し、
前記ヌクレオチド配列が、５０，０００未満のヌクレオチド反復スコア（ＮＲＳ）を有
し、
前記ヌクレオチド反復スコア（ＮＲＳ）が、数式：

により決定され、式中、
Ｎ _ｔｏｔは、前記ヌクレオチド配列の長さであり、
ｎは、前記ヌクレオチド配列内の反復の長さであり、
ｆ _ｉ（ｎ）は、前記長さｎの反復の頻度であり、
１つよりも多くの長さｎの反復が存在する場合、ｋ（ｎ）は、前記長さｎの反復の前記
異なる配列の数であり、そうでなければ、前記長さｎの反復についてｋ（ｎ）は１である
、核酸分子。
＜２＞
前記コードされたポリペプチドが、プロリンおよびアラニンからなる、＜１＞に記載の核酸分子。
＜３＞
前記プロリン残基が、前記コードされたポリペプチドの約１０％超および約７５％未満を構成する、＜２＞に記載の核酸分子。
＜４＞
前記コードされたポリペプチドが、プロリン、アラニン、およびセリンからなる、＜１＞に記載の核酸分子。
＜５＞
前記プロリン残基が、前記コードされたポリペプチドの４％超および４０％未満を構成する、＜４＞に記載の核酸分子。
＜６＞
前記ヌクレオチド反復スコア（ＮＲＳ）が、１００未満である、＜１＞～＜５＞のいずれかに記載の核酸分子。
＜７＞
前記ヌクレオチド反復スコア（ＮＲＳ）が、５０未満である、＜１＞～＜６＞のいずれかに記載の核酸分子。
＜８＞
前記ヌクレオチド反復スコア（ＮＲＳ）が、３５未満である、＜１＞～＜７＞のいずれかに記載の核酸分子。
＜９＞
前記核酸の前記ヌクレオチド配列が、少なくとも９００ヌクレオチドの長さを有する、＜１＞～＜８＞のいずれかに記載の核酸分子。
＜１０＞
増強された遺伝子安定性を有する、＜１＞～＜９＞のいずれかに記載の核酸分子。
＜１１＞
前記ヌクレオチド配列が、前記反復を含み、前記反復が、最大長ｎ _ｍａｘを有し、ｎ _ｍａｘが、数式：

により決定され、式中、Ｎ _ｔｏｔが、前記ヌクレオチド配列の長さである、＜１＞～＜１０＞のいずれかに記載の核酸分子。
＜１２＞
前記反復が、約１４、１５、１６、または１７ヌクレオチドから約５５ヌクレオチドまでの最大長を有する、＜１＞～＜１１＞のいずれかに記載の核酸分子。
＜１３＞
前記コードされたポリペプチドが、複数のアミノ酸反復を有する反復性アミノ酸配列を
含み、９個以下の連続アミノ酸残基が同一であり、前記ポリペプチドがランダムコイルを
形成する、＜１＞～＜１２＞のいずれかに記載の核酸分子。
＜１４＞
（ａ）配列番号２８、配列番号２９、配列番号３０、配列番号３１、配列番号３２、配
列番号３３、配列番号３４、配列番号３５、配列番号３６、配列番号３７、配列番号８７
、配列番号８８、配列番号８９、配列番号９０、配列番号９１、配列番号９２、配列番号
９３、配列番号９４、配列番号９５、配列番号９６、配列番号９７、配列番号９８、配列
番号９９、配列番号１００、配列番号１０１、配列番号１０２、配列番号１０３、配列番
号１０４、配列番号１０５、配列番号１０６、配列番号１０７、配列番号１０８、配列番
号１０９、配列番号１１０、配列番号１１１、配列番号１１２、配列番号１１３、配列番
号１１４、配列番号１１５、配列番号１１６、配列番号１１７、配列番号１１８、配列番
号１１９、配列番号１２０、配列番号１２１、配列番号１２２、配列番号１９２、および
配列番号１９３からなる群から選択される少なくとも１つのヌクレオチド配列を含む核酸
分子；
（ｂ）配列番号４２、配列番号４３、配列番号４４、配列番号４５、配列番号１５３、
配列番号１５４、配列番号１５５、配列番号１５６、配列番号１５７、配列番号１５８、
配列番号１５９、配列番号１６０、配列番号１６１、配列番号１６２、配列番号１６３、
配列番号１６４、配列番号１６５、配列番号１６６、配列番号１６７、配列番号１６８、
配列番号１６９、配列番号１７０、配列番号１７１、配列番号１７２、および／または配
列番号１７３からなるヌクレオチド配列を含む核酸分子；
（ｃ）（ａ）または（ｂ）で規定されるヌクレオチド配列の相補鎖にストリンジェント
な条件下でハイブリダイズする核酸分子；
（ｄ）（ａ）、（ｂ）、および（ｃ）のいずれか１つで規定されるヌクレオチド配列と
少なくとも６６．７％の同一性を有するヌクレオチド配列を含む核酸分子；ならびに
（ｅ）（ａ）または（ｂ）で規定されるヌクレオチド配列に対する遺伝子コードの結果
として縮重している核酸分子
からなる群から選択される、＜１＞～＜３＞および＜６＞～＜１３＞のいずれかに記載の核酸分子。
＜１５＞
（ａ）配列番号１９、配列番号２０、配列番号２１、配列番号２２、配列番号２３、配
列番号２４、配列番号２５、配列番号２６、配列番号２７、配列番号１２３、配列番号１
２４、配列番号１２５、配列番号１２６、配列番号１２７、配列番号１２８、配列番号１
２９、配列番号１３０、配列番号１３１、配列番号１３２、配列番号１３３、配列番号１
３４、配列番号１３５、配列番号１３６、配列番号１３７、配列番号１３８、配列番号１
３９、配列番号１４０、配列番号１４１、配列番号１４２、配列番号１４３、配列番号１
４４、配列番号１４５、配列番号１４６、配列番号１４７、配列番号１４８、配列番号１
４９、配列番号１５０、配列番号１５１、配列番号１５２、配列番号１９４、および配列
番号１９５からなる群から選択される少なくとも１つのヌクレオチド配列を含む核酸分子
；
（ｂ）配列番号３８、配列番号３９、配列番号４０、配列番号４１、配列番号１７４、
配列番号１７５、配列番号１７６、配列番号１７７、配列番号１７８、配列番号１７９、
配列番号１８０、配列番号１８１、配列番号１８２、配列番号１８４、配列番号１８５、
配列番号１８６、配列番号１８７、配列番号１８８、配列番号１８９、配列番号１９０、
および配列番号１９１からなる群から選択されるヌクレオチド配列を含む核酸分子；
（ｃ）（ａ）または（ｂ）で規定されるヌクレオチド配列の相補鎖にストリンジェント
な条件下でハイブリダイズする核酸分子；
（ｄ）（ａ）、（ｂ）、および（ｃ）のいずれか１つで規定されるヌクレオチド配列と
少なくとも５６％の同一性を有するヌクレオチド配列を含む核酸分子；
（ｅ）（ａ）または（ｂ）で規定されるヌクレオチド配列に対する遺伝子コードの結果
として縮重している核酸分子
からなる群から選択される、＜１＞および＜４＞～＜１３＞のいずれかに記載の核酸分子。
＜１６＞
生理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結さ
れた、＜１＞～＜１５＞のいずれかに記載の核酸分子。
＜１７＞
前記生理活性タンパク質が、治療上有効なタンパク質である、＜１６＞に記載の核酸分子。
＜１８＞
前記生理活性タンパク質が、結合タンパク質、抗体断片、サイトカイン、成長因子、ホ
ルモン、酵素、タンパク質ワクチン、ペプチドワクチン、最大５０個のアミノ酸残基から
なるペプチド、またはペプチド模倣体からなる群から選択される、＜１６＞または＜１７＞に記載の核酸分子。
＜１９＞
前記結合タンパク質が、抗体、Ｆａｂ断片、Ｆａｂ’断片、Ｆ（ａｂ’） _２断片、単鎖
可変断片（ｓｃＦｖ）、（単一）ドメイン抗体、抗体の単離された可変領域（ＶＬ領域お
よび／またはＶＨ領域）、ＣＤＲ、免疫グロブリンドメイン、ＣＤＲ由来ペプチド模倣体
、レクチン、タンパク質スキャフォールド、フィブロネクチンドメイン、テネイシンドメ
イン、プロテインＡドメイン、ＳＨ３ドメイン、アンキリン反復ドメイン、およびリポカ
リンからなる群から選択される、＜１８＞に記載の核酸分子。
＜２０＞
前記生理活性タンパク質が、インターロイキン１受容体アンタゴニスト、レプチン、酸
性スフィンゴミエリナーゼ、アデノシンデアミナーゼ、アガルシダーゼアルファ、アルフ
ァ－１アンチトリプシン、アルファ心房性ナトリウム利尿ペプチド、アルファ－ガラクト
シダーゼ、アルファ－グルコシダーゼ、アルファ－Ｎ－アセチルグルコサミニダーゼ、ア
ルテプラーゼ、アメジプラーゼ、アミリン、アミリン類似体、抗ＨＩＶペプチド融合阻害
剤、アルギニンデイミナーゼ、アスパラギナーゼ、Ｂドメイン欠損第ＶＩＩＩ因子、骨形
態形成タンパク質、ブラジキニンアンタゴニスト、Ｂ型ナトリウム利尿ペプチド、ブーガ
ニン、成長ホルモン、絨毛性ゴナドトロピン、ＣＤ３受容体アンタゴニスト、ＣＤ１９ア
ンタゴニスト、ＣＤ２０アンタゴニスト、ＣＤ４０アンタゴニスト、ＣＤ４０Ｌアンタゴ
ニスト、セレブロシドスルファターゼ、凝固第ＶＩＩａ因子、凝固第ＸＩＩＩ因子、凝固
第ＩＸ因子、凝固第Ｘ因子、補体成分Ｃ３阻害剤、補体成分５ａアンタゴニスト、Ｃ－ペ
プチド、ＣＴＬＡ－４アンタゴニスト、Ｃ型ナトリウム利尿ペプチド、ディフェンシン、
デオキシリボヌクレアーゼＩ、ＥＧＦＲ受容体アンタゴニスト、上皮成長因子、エリスロ
ポエチン、エキセンディン－４、エズリンペプチド１、ＦｃγＩＩＢ受容体アンタゴニス
ト、線維芽細胞成長因子２１、卵胞刺激ホルモン、胃抑制ポリペプチド（ＧＩＰ）、ＧＩ
Ｐ類似体、グルカゴン、グルカゴン受容体アゴニスト、グルカゴン様ペプチド１（ＧＬＰ
－１）、ＧＬＰ－１類似体、グルカゴン様ペプチド２（ＧＬＰ－２）、ＧＬＰ－２類似体
、ゴナドレリン、ゴナドトロピン放出ホルモンアゴニスト、ゴナドトロピン放出ホルモン
アンタゴニスト、ｇｐ１２０、ｇｐ１６０、顆粒球コロニー刺激因子（Ｇ－ＣＳＦ）、顆
粒球マクロファージコロニー刺激因子（ＧＭ－ＣＳＦ）、グレリン、グレリン類似体、成
長ホルモン、成長ホルモン放出ホルモン、ヘマタイド、肝細胞成長因子、肝細胞成長因子
受容体（ＨＧＦＲ）アンタゴニスト、ヘプシジンアンタゴニスト、ヘプシジン模倣体、Ｈ
ｅｒ２／ｎｅｕ受容体アンタゴニスト、ヒストレリン、ヒルジン、ｈｓｐ７０アンタゴニ
スト、ヒューマニン、ヒアルロニダーゼ、加水分解性リソソームグルコセレブロシド特異
的酵素、イズロネート－２－スルファターゼ、ＩｇＥアンタゴニスト、インスリン、イン
スリン類似体、インスリン様成長因子１、インスリン様成長因子２、インターフェロン－
アルファ、インターフェロン－アルファアンタゴニスト、インターフェロン－アルファス
ーパーアゴニスト、インターフェロン－アルファ－ｎ３、インターフェロン－ベータ、イ
ンターフェロン－ガンマ、インターフェロン－ラムダ、インターフェロンタウ、インター
ロイキン、インターロイキン２融合タンパク質、インターロイキン－２２受容体サブユニ
ットアルファ（ＩＬ－２２ｒａ）アンタゴニスト、イリシン、島ネオゲネシス関連タンパ
ク質、ケラチノサイト成長因子、Ｋｖ１．３イオンチャネルアンタゴニスト、ランチペプ
チド、リパーゼ、黄体形成ホルモン、ルトロピンアルファ、リソスタフィン、マンノシダ
ーゼ、Ｎ－アセチルガラクトサミン－６－スルファターゼ、Ｎ－アセチルグルコサミニダ
ーゼ、好中球ゼラチナーゼ関連リポカリン、オクトレオチド、ω－コノトキシン、オルニ
トドロス・モウバタ（Ornithodoros moubata）補体阻害剤、骨形成タンパク質－１、オス
テオプロテゲリン、シュウ酸デカルボキシラーゼ、Ｐ１２８、副甲状腺ホルモン、フィロ
マー（Phylomer）、ＰＤ－１アンタゴニスト、ＰＤＧＦアンタゴニスト、フェニルアラニ
ンアンモニアリアーゼ、血小板由来成長因子、プロインスリン、プロテインＣ、リラキシ
ン、リラキシン類似体、セクレチン、ＲＧＤペプチド、リボヌクレアーゼ、センレボター
ゼ、セリンプロテアーゼ阻害剤、可溶性１型補体受容体、可溶性ＤＣＣ受容体、可溶性Ｔ
ＡＣＩ受容体、可溶性腫瘍壊死因子Ｉ受容体（ｓＴＮＦ－ＲＩ）、可溶性腫瘍壊死因子Ｉ
Ｉ受容体（ｓＴＮＦ－ＲＩＩ）、可溶性ＶＥＧＦ受容体Ｆｌｔ－１、可溶性ＦｃγＩＩＢ
受容体、ソマトスタチン、ソマトスタチン類似体、ストレプトキナーゼ、Ｔ細胞受容体リ
ガンド、テネクテプラーゼ、テリパラチド、トロンボモジュリンアルファ、チモシンアル
ファ１、ｔｏｌｌ様受容体阻害剤、腫瘍壊死因子（ＴＮＦα）、腫瘍壊死因子αアンタゴ
ニスト、ウリカーゼ、血管作用性腸ペプチド、バソプレッシン、バソプレッシン類似体、
ＶＥＧＦアンタゴニスト、フォンビルブラント因子からなる群から選択される、＜１６＞～＜１８＞のいずれかに記載の核酸分子。
＜２１＞
＜１＞～＜２０＞のいずれかに記載の核酸分子を含むベクター。
＜２２＞
＜１＞～＜２０＞のいずれかに記載の核酸分子を含む宿主もしくは宿主細胞、＜２１＞に記載のベクターを含む宿主もしくは宿主細胞、または＜２１＞に記載のベクターで形質転換された宿主もしくは宿主細胞。
＜２３＞
＜１＞～＜２０＞のいずれかに記載の核酸分子を調製するための方法であって、＜２２＞に記載の宿主または宿主細胞を培養すること、および任意選択で、産生された核酸分子を単離することを含む方法。
＜２４＞
＜２１＞に記載のベクターを調製するための方法であって、＜２２＞に記載の宿主または宿主細胞を培養すること、および任意選択で、産生されたベクターを単離することを含む方法。
＜２５＞
＜１＞～＜２０＞のいずれかに記載の核酸分子によりコードされるポリペプチドを調製するための方法であって、＜２２＞に記載の宿主または宿主細胞を培養／成長させること、および任意選択で、産生されたポリペプチドを単離することを含む方法。
＜２６＞
薬物コンジュゲートを調製するための方法であって、
前記薬物コンジュゲートが、＜１＞～＜１５＞のいずれかに記載の核酸分子によりコードされるポリペプチドを含み、
（ｉ）生理活性タンパク質および／または（ｉｉ）低分子および／または（ｉｉｉ）炭
水化物をさらに含み、
前記方法が、＜２２＞に記載の宿主または宿主細胞を培養すること、および任意選択で、産生されたポリペプチドおよび／または薬物コンジュゲートを単離することをさらに含む方法。
＜２７＞
前記生理活性タンパク質が、治療上有効なタンパク質である、＜２６＞に記載の薬物コンジュゲートを調製するための方法。
＜２８＞
前記生理活性タンパク質が、結合タンパク質、抗体断片、サイトカイン、成長因子、ホ
ルモン、酵素、タンパク質ワクチン、ペプチドワクチン、最大５０個のアミノ酸残基から
なるペプチド、またはペプチド模倣体からなる群から選択される、＜２６＞または＜２７＞に記載の薬物コンジュゲートを調製するための方法。
＜２９＞
前記結合タンパク質が、抗体、Ｆａｂ断片、Ｆａｂ’断片、Ｆ（ａｂ’） _２断片、単鎖
可変断片（ｓｃＦｖ）、（単一）ドメイン抗体、抗体の単離された可変領域（ＶＬ領域お
よび／またはＶＨ領域）、ＣＤＲ、免疫グロブリンドメイン、ＣＤＲ由来ペプチド模倣体
、レクチン、タンパク質スキャフォールド、フィブロネクチンドメイン、テネイシンドメ
イン、プロテインＡドメイン、ＳＨ３ドメイン、アンキリン反復ドメイン、およびリポカ
リンからなる群から選択される、＜２８＞に記載の薬物コンジュゲートを調製するための方法。
＜３０＞
前記生理活性タンパク質が、インターロイキン１受容体アンタゴニスト、レプチン、酸
性スフィンゴミエリナーゼ、アデノシンデアミナーゼ、アガルシダーゼアルファ、アルフ
ァ－１アンチトリプシン、アルファ心房性ナトリウム利尿ペプチド、アルファ－ガラクト
シダーゼ、アルファ－グルコシダーゼ、アルファ－Ｎ－アセチルグルコサミニダーゼ、ア
ルテプラーゼ、アメジプラーゼ、アミリン、アミリン類似体、抗ＨＩＶペプチド融合阻害
剤、アルギニンデイミナーゼ、アスパラギナーゼ、Ｂドメイン欠損第ＶＩＩＩ因子、骨形
態形成タンパク質、ブラジキニンアンタゴニスト、Ｂ型ナトリウム利尿ペプチド、ブーガ
ニン、成長ホルモン、絨毛性ゴナドトロピン、ＣＤ３受容体アンタゴニスト、ＣＤ１９ア
ンタゴニスト、ＣＤ２０アンタゴニスト、ＣＤ４０アンタゴニスト、ＣＤ４０Ｌアンタゴ
ニスト、セレブロシドスルファターゼ、凝固第ＶＩＩａ因子、凝固第ＸＩＩＩ因子、凝固
第ＩＸ因子、凝固第Ｘ因子、補体成分Ｃ３阻害剤、補体成分５ａアンタゴニスト、Ｃ－ペ
プチド、ＣＴＬＡ－４アンタゴニスト、Ｃ型ナトリウム利尿ペプチド、ディフェンシン、
デオキシリボヌクレアーゼＩ、ＥＧＦＲ受容体アンタゴニスト、上皮成長因子、エリスロ
ポエチン、エキセンディン－４、エズリンペプチド１、ＦｃγＩＩＢ受容体アンタゴニス
ト、線維芽細胞成長因子２１、卵胞刺激ホルモン、胃抑制ポリペプチド（ＧＩＰ）、ＧＩ
Ｐ類似体、グルカゴン、グルカゴン受容体アゴニスト、グルカゴン様ペプチド１（ＧＬＰ
－１）、ＧＬＰ－１類似体、グルカゴン様ペプチド２（ＧＬＰ－２）、ＧＬＰ－２類似体
、ゴナドレリン、ゴナドトロピン放出ホルモンアゴニスト、ゴナドトロピン放出ホルモン
アンタゴニスト、ｇｐ１２０、ｇｐ１６０、顆粒球コロニー刺激因子（Ｇ－ＣＳＦ）、顆
粒球マクロファージコロニー刺激因子（ＧＭ－ＣＳＦ）、グレリン、グレリン類似体、成
長ホルモン、成長ホルモン放出ホルモン、ヘマタイド、肝細胞成長因子、肝細胞成長因子
受容体（ＨＧＦＲ）アンタゴニスト、ヘプシジンアンタゴニスト、ヘプシジン模倣体、Ｈ
ｅｒ２／ｎｅｕ受容体アンタゴニスト、ヒストレリン、ヒルジン、ｈｓｐ７０アンタゴニ
スト、ヒューマニン、ヒアルロニダーゼ、加水分解性リソソームグルコセレブロシド特異
的酵素、イズロネート－２－スルファターゼ、ＩｇＥアンタゴニスト、インスリン、イン
スリン類似体、インスリン様成長因子１、インスリン様成長因子２、インターフェロン－
アルファ、インターフェロン－アルファアンタゴニスト、インターフェロン－アルファス
ーパーアゴニスト、インターフェロン－アルファ－ｎ３、インターフェロン－ベータ、イ
ンターフェロン－ガンマ、インターフェロン－ラムダ、インターフェロンタウ、インター
ロイキン、インターロイキン２融合タンパク質、インターロイキン－２２受容体サブユニ
ットアルファ（ＩＬ－２２ｒａ）アンタゴニスト、イリシン、島ネオゲネシス関連タンパ
ク質、ケラチノサイト成長因子、Ｋｖ１．３イオンチャネルアンタゴニスト、ランチペプ
チド、リパーゼ、黄体形成ホルモン、ルトロピンアルファ、リソスタフィン、マンノシダ
ーゼ、Ｎ－アセチルガラクトサミン－６－スルファターゼ、Ｎ－アセチルグルコサミニダ
ーゼ、好中球ゼラチナーゼ関連リポカリン、オクトレオチド、ω－コノトキシン、オルニ
トドロス・モウバタ（Ornithodoros moubata）補体阻害剤、骨形成タンパク質－１、オス
テオプロテゲリン、シュウ酸デカルボキシラーゼ、Ｐ１２８、副甲状腺ホルモン、フィロ
マー（Phylomer）、ＰＤ－１アンタゴニスト、ＰＤＧＦアンタゴニスト、フェニルアラニ
ンアンモニアリアーゼ、血小板由来成長因子、プロインスリン、プロテインＣ、リラキシ
ン、リラキシン類似体、セクレチン、ＲＧＤペプチド、リボヌクレアーゼ、センレボター
ゼ、セリンプロテアーゼ阻害剤、可溶性１型補体受容体、可溶性ＤＣＣ受容体、可溶性Ｔ
ＡＣＩ受容体、可溶性腫瘍壊死因子Ｉ受容体（ｓＴＮＦ－ＲＩ）、可溶性腫瘍壊死因子Ｉ
Ｉ受容体（ｓＴＮＦ－ＲＩＩ）、可溶性ＶＥＧＦ受容体Ｆｌｔ－１、可溶性ＦｃγＩＩＢ
受容体、ソマトスタチン、ソマトスタチン類似体、ストレプトキナーゼ、Ｔ細胞受容体リ
ガンド、テネクテプラーゼ、テリパラチド、トロンボモジュリンアルファ、チモシンアル
ファ１、ｔｏｌｌ様受容体阻害剤、腫瘍壊死因子（ＴＮＦα）、腫瘍壊死因子αアンタゴ
ニスト、ウリカーゼ、血管作用性腸ペプチド、バソプレッシン、バソプレッシン類似体、
ＶＥＧＦアンタゴニスト、フォンビルブラント因子からなる群から選択される、＜２６＞～＜２８＞のいずれかに記載の薬物コンジュゲートを調製するための方法。
＜３１＞
前記低分子が、血管新生阻害剤、抗アレルギー薬、制吐薬、抗うつ薬、抗高血圧薬、抗
炎症薬、抗感染症薬、抗精神病薬、抗増殖（細胞毒性および細胞増殖抑制）薬、カルシウ
ムアンタゴニストおよび他の循環器薬、コリン作動性アゴニスト、中枢神経系に作用する
薬物、呼吸器系に作用する薬物、ホルモン、ステロイド、ポリケチド、炭水化物、オリゴ
糖、核酸、核酸誘導体、アンチセンス核酸、低分子干渉ＲＮＡ（ｓｉＲＮＡ）、マイクロ
ＲＮＡ（ｍｉＲ）阻害剤、マイクロＲＮＡ模倣体、ＤＮＡアプタマー、およびＲＮＡアプ
タマーからなる群から選択される、＜２６＞～＜３０＞に記載の薬物コンジュゲートを調製するための方法。
＜３２＞
＜１＞～＜２０＞のいずれかに記載の核酸分子を配列決定するための方法。
＜３３＞
＜１＞～＜２０＞のいずれかに記載の核酸分子を増幅するための方法。
＜３４＞
＜１＞～＜２０＞のいずれかに記載の核酸分子をクローニングするための方法。
＜３５＞
遺伝子的に安定な核酸分子を選択するための方法であって、前記核酸分子が、プロリン
、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配
列を含み、前記ヌクレオチド配列が、少なくとも３００ヌクレオチドの長さを有し、
前記方法が、５０，０００未満のヌクレオチド反復スコア（ＮＲＳ）を有するヌクレオ
チド配列を含む核酸分子を選択するステップを含み、
前記ヌクレオチド反復スコア（ＮＲＳ）が、数式：

により決定され、式中、
Ｎ _ｔｏｔは、前記ヌクレオチド配列の長さであり、
ｎは、前記ヌクレオチド配列内の反復の長さであり、
ｆ _ｉ（ｎ）は、前記長さｎの反復の頻度であり、
１つよりも多くの長さｎの反復が存在する場合、ｋ（ｎ）は、前記長さｎの反復の前記
異なる配列の数であり、そうでなければ、前記長さｎの反復についてｋ（ｎ）は１である
、方法。

Claims

プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含む核酸分子であって、
前記ポリペプチドが、ランダムコイルを形成し、
前記核酸の前記ヌクレオチド配列が、少なくとも３００ヌクレオチドの長さを有し、
前記ヌクレオチド配列が、５０，０００未満のヌクレオチド反復スコア（ＮＲＳ）を有し、
前記ヌクレオチド反復スコア（ＮＲＳ）が、数式：

により決定され、式中、
Ｎ_ｔｏｔは、前記ヌクレオチド配列の長さであり、
ｎは、前記ヌクレオチド配列内の反復の長さであり、
ｆ_ｉ（ｎ）は、前記長さｎの反復の頻度であり、
１つよりも多くの長さｎの反復が存在する場合、ｋ（ｎ）は、前記長さｎの反復の異なる配列の数であり、そうでなければ、前記長さｎの反復についてｋ（ｎ）は１である、核酸分子。
前記コードされたポリペプチドが、プロリンおよびアラニンからなる、請求項１に記載の核酸分子。
前記プロリン残基が、前記コードされたポリペプチドの約１０％超および約７５％未満を構成する、請求項２に記載の核酸分子。
前記コードされたポリペプチドが、プロリン、アラニン、およびセリンからなる、請求項１に記載の核酸分子。
前記プロリン残基が、前記コードされたポリペプチドの４％超および４０％未満を構成する、請求項４に記載の核酸分子。
前記ヌクレオチド反復スコア（ＮＲＳ）が、１０００未満、１００未満、５０未満、または３５未満である、請求項１～５のいずれか一項に記載の核酸分子。
前記核酸の前記ヌクレオチド配列が、少なくとも９００ヌクレオチドの長さを有する、請求項１～６のいずれか一項に記載の核酸分子。
増強された遺伝子安定性を有する、請求項１～７のいずれか一項に記載の核酸分子。
前記ヌクレオチド配列が、前記反復を含み、前記反復が、最大長ｎ_ｍａｘを有し、ｎ_ｍａｘが、数式：

により決定され、式中、Ｎ_ｔｏｔが、前記ヌクレオチド配列の長さである、請求項１～８のいずれか一項に記載の核酸分子。
前記反復が、約１４、１５、１６、または１７ヌクレオチドから約５５ヌクレオチドまでの最大長を有する、請求項１～９のいずれか一項に記載の核酸分子。
前記コードされたポリペプチドが、複数のアミノ酸反復を有する反復性アミノ酸配列を含み、９個以下の連続アミノ酸残基が同一であり、前記ポリペプチドがランダムコイルを形成する、請求項１～１０のいずれか一項に記載の核酸分子。
（ａ）配列番号２８、配列番号２９、配列番号３０、配列番号３１、配列番号３２、配列番号３３、配列番号３４、配列番号３５、配列番号３６、配列番号３７、配列番号８７、配列番号８８、配列番号８９、配列番号９０、配列番号９１、配列番号９２、配列番号９３、配列番号９４、配列番号９５、配列番号９６、配列番号９７、配列番号９８、配列番号９９、配列番号１００、配列番号１０１、配列番号１０２、配列番号１０３、配列番号１０４、配列番号１０５、配列番号１０６、配列番号１０７、配列番号１０８、配列番号１０９、配列番号１１０、配列番号１１１、配列番号１１２、配列番号１１３、配列番号１１４、配列番号１１５、配列番号１１６、配列番号１１７、配列番号１１８、配列番号１１９、配列番号１２０、配列番号１２１、配列番号１２２、配列番号１９２、および配列番号１９３からなる群から選択される少なくとも１つのヌクレオチド配列を含む核酸分子；
（ｂ）配列番号４２、配列番号４３、配列番号４４、配列番号４５、配列番号１５３、配列番号１５４、配列番号１５５、配列番号１５６、配列番号１５７、配列番号１５８、配列番号１５９、配列番号１６０、配列番号１６１、配列番号１６２、配列番号１６３、配列番号１６４、配列番号１６５、配列番号１６６、配列番号１６７、配列番号１６８、配列番号１６９、配列番号１７０、配列番号１７１、配列番号１７２、および／または配列番号１７３からなるヌクレオチド配列を含む核酸分子；
（ｃ）（ａ）または（ｂ）で規定されるヌクレオチド配列の相補鎖にストリンジェントな条件下でハイブリダイズする核酸分子；
（ｄ）（ａ）、（ｂ）、および（ｃ）のいずれか１つで規定されるヌクレオチド配列と少なくとも６６．７％の同一性を有するヌクレオチド配列を含む核酸分子；ならびに
（ｅ）（ａ）または（ｂ）で規定されるヌクレオチド配列に対する遺伝子コードの結果として縮重している核酸分子
からなる群から選択される、請求項１～３および６～１１のいずれか一項に記載の核酸分子。
（ａ）配列番号１９、配列番号２０、配列番号２１、配列番号２２、配列番号２３、配列番号２４、配列番号２５、配列番号２６、配列番号２７、配列番号１２３、配列番号１２４、配列番号１２５、配列番号１２６、配列番号１２７、配列番号１２８、配列番号１２９、配列番号１３０、配列番号１３１、配列番号１３２、配列番号１３３、配列番号１３４、配列番号１３５、配列番号１３６、配列番号１３７、配列番号１３８、配列番号１３９、配列番号１４０、配列番号１４１、配列番号１４２、配列番号１４３、配列番号１４４、配列番号１４５、配列番号１４６、配列番号１４７、配列番号１４８、配列番号１４９、配列番号１５０、配列番号１５１、配列番号１５２、配列番号１９４、および配列番号１９５からなる群から選択される少なくとも１つのヌクレオチド配列を含む核酸分子；
（ｂ）配列番号３８、配列番号３９、配列番号４０、配列番号４１、配列番号１７４、配列番号１７５、配列番号１７６、配列番号１７７、配列番号１７８、配列番号１７９、配列番号１８０、配列番号１８１、配列番号１８２、配列番号１８４、配列番号１８５、配列番号１８６、配列番号１８７、配列番号１８８、配列番号１８９、配列番号１９０、および配列番号１９１からなる群から選択されるヌクレオチド配列を含む核酸分子；
（ｃ）（ａ）または（ｂ）で規定されるヌクレオチド配列の相補鎖にストリンジェントな条件下でハイブリダイズする核酸分子；
（ｄ）（ａ）、（ｂ）、および（ｃ）のいずれか１つで規定されるヌクレオチド配列と少なくとも５６％の同一性を有するヌクレオチド配列を含む核酸分子；
（ｅ）（ａ）または（ｂ）で規定されるヌクレオチド配列に対する遺伝子コードの結果として縮重している核酸分子
からなる群から選択される、請求項１および４～１１のいずれか一項に記載の核酸分子。
生理活性タンパク質をコードする核酸と同じリーディングフレームに作動可能に連結された、請求項１～１３のいずれか一項に記載の核酸分子。
前記生理活性タンパク質が、治療上有効なタンパク質である、請求項１４に記載の核酸分子。
請求項１～１５のいずれか一項に記載の核酸分子を含むベクター。
請求項１～１５のいずれか一項に記載の核酸分子を含む宿主もしくは宿主細胞、または請求項１６に記載のベクターを含む宿主もしくは宿主細胞。
請求項１～１５のいずれか一項に記載の核酸分子を調製するための方法であって、請求項１７に記載の宿主または宿主細胞を培養すること、および任意選択で、産生された核酸分子を単離することを含む方法。
請求項１６に記載のベクターを調製するための方法であって、請求項１７に記載の宿主または宿主細胞を培養すること、および任意選択で、産生されたベクターを単離することを含む方法。
請求項１～１５のいずれか一項に記載の核酸分子によりコードされるポリペプチドを調製するための方法であって、請求項１７に記載の宿主または宿主細胞を培養／成長させること、および任意選択で、産生されたポリペプチドを単離することを含む方法。
薬物コンジュゲートを調製するための方法であって、
前記薬物コンジュゲートが、請求項１～１３のいずれか一項に記載の核酸分子によりコードされるポリペプチドを含み、
（ｉ）生理活性タンパク質および／または（ｉｉ）低分子および／または（ｉｉｉ）炭水化物をさらに含み、
前記方法が、請求項１７に記載の宿主または宿主細胞を培養すること、および任意選択で、産生されたポリペプチドおよび／または薬物コンジュゲートを単離することをさらに含む方法。
前記生理活性タンパク質が、治療上有効なタンパク質である、請求項２１に記載の薬物コンジュゲートを調製するための方法。
遺伝子的に安定な核酸分子を選択するための方法であって、
前記核酸分子が、プロリン、アラニン、および任意選択でセリンからなるポリペプチドをコードするヌクレオチド配列を含み、
前記ポリペプチドが、ランダムコイルを形成し、
前記ヌクレオチド配列が、少なくとも３００ヌクレオチドの長さを有し、
前記方法が、５０，０００未満のヌクレオチド反復スコア（ＮＲＳ）を有するヌクレオチド配列を含む核酸分子を選択するステップを含み、
前記ヌクレオチド反復スコア（ＮＲＳ）が、数式：

により決定され、式中、
Ｎ_ｔｏｔは、前記ヌクレオチド配列の長さであり、
ｎは、前記ヌクレオチド配列内の反復の長さであり、
ｆ_ｉ（ｎ）は、前記長さｎの反復の頻度であり、
１つよりも多くの長さｎの反復が存在する場合、ｋ（ｎ）は、前記長さｎの反復の異なる配列の数であり、そうでなければ、前記長さｎの反復についてｋ（ｎ）は１である、方法。