JP4102157B2 - 生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ - Google Patents

生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ Download PDF

Info

Publication number
JP4102157B2
JP4102157B2 JP2002302455A JP2002302455A JP4102157B2 JP 4102157 B2 JP4102157 B2 JP 4102157B2 JP 2002302455 A JP2002302455 A JP 2002302455A JP 2002302455 A JP2002302455 A JP 2002302455A JP 4102157 B2 JP4102157 B2 JP 4102157B2
Authority
JP
Japan
Prior art keywords
information
data
sequence
synthesizer
polymer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002302455A
Other languages
English (en)
Other versions
JP2003101485A (ja
Inventor
正幸 園部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2002302455A priority Critical patent/JP4102157B2/ja
Publication of JP2003101485A publication Critical patent/JP2003101485A/ja
Application granted granted Critical
Publication of JP4102157B2 publication Critical patent/JP4102157B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明が属する技術分野】
【0002】
本発明は、生体高分子を通信媒体もしくは記録媒体とした、情報記録方法、情報通信方法、エンコーダおよびデコーダに関するものである。
【0003】
【従来の技術】
まず、通信には搬送と記録の二面があることを確認する。
【0004】
現在、通信といえば、送信機器から受信機器に電流あるいは電磁波を用いてデータをリアルタイムに伝送できる電気通信がすぐ頭に浮かぶ。
【0005】
たしかに、電気通信、光通信は、通信媒体を電気、光に変えたことによって搬送時間を著しく短かくすることができた。
【0006】
しかし、狼煙(のろし)のような例外を除けば、送信者の送信時間に受信者が受信できるとは限らない。
【0007】
送受信の時間差を埋めるために、情報を書き込んでおいてあとで読み出すための記録媒体が必要なこともたしかである。
【0008】
たとえば、電報は郵便局間で伝送されたあと、紙に印刷される。
【0009】
電子メールも受信者が読むまで、通常、磁気ディスクやICメモリに記録される。
【0010】
マスメディアのテレビでさえ、録画から放送までの間、ビデオテープ、あるいはハードディスクに記録される。
【0011】
このように、通信には、搬送系とともに、記録系が重要である。
【0012】
最近、搬送系を電子化する通信は大きく発展して、携帯電話とパソコンを使った電子メールが非常に普及した。
【0013】
一方、搬送系を電子化しないで紙などの記録媒体を物理的に搬送する通信では、郵便が依然として広く使われている。
【0014】
が、この分野でも、送信者の入力から搬送までを電子化して、郵便局で紙に印刷して配達する「ハイブリッドめ〜る(郵政事業庁サービス名)」が実用化されている。
(参考文献「郵政事業庁:ハイブリッドめ〜る」 http://www1.hybridmail.jp/cgi-bin/a50709101d.cgi)。
【0015】
将来は、公衆自動搬送システム(CATS)によるドア・ツー・ドアの搬送が登場して、物理的搬送が一層高速化することも期待される(特許公開2000-357194「公衆自動搬送システム」(発明者=園部正幸)。
(参考文献「園部 正幸:21世紀情報化社会の新基盤となる、公衆自動搬送システム CATS」http://sonobe.s5.xrea.com/invention/cats/shibuya_paper/index.html
および、
「園部 正幸:CATS特許出願 1」http://sonobe.s5.xrea.com/invention/cats/catspat2000_1/index.html)。
【0016】
以上、通信には搬送と記録の二面があることを確認した。
【0017】
通信に搬送と記録の二面があることから、通信方法の改良には、上記のような搬送系の改良だけでなく、記録系の改良も必要であることが分かる。
【0018】
本願発明は、記録系の改良を行う。
【0019】
即時ではなく時間差をもってデータを未来の人や未来の自分自身に受け渡す必要があるときには、情報記録媒体を用いて通信することになる。
【0020】
印刷物よりも安定し高密度な情報記録媒体として、たとえば、コンパクトディスク(CD)、光磁気ディスク(MO)、デジタルビデオディスク(DVD)が現在よく使われているがそのほかにも種々存在する。
【0021】
たとえば、DVDを読み書きが可能にする規格にしても、DVD−R、DVD−RW、DVD+R、DVD+RW、DVD−RAMなど多数が林立している。
(参考文献「DVD - Wikipedia」 http://ja.wikipedia.org/wiki/DVD)。
【0022】
規格が多いだけにそれぞれの生き残りは難しくなってくる。
【0023】
また、こうした記録媒体には、媒体寿命が百年以上と宣伝されているものもあるが、本当にそれほど耐久性があるのかという疑問の声もあり、寿命推定方法の改善やバラツキのない長寿命化の推進が課題になっている。
(参考文献「財団法人デジタルコンテンツ協会:長期保存のための光ディスク媒体の開発に関するフィージビリティスタディ 報告書 7.1.1 加速試験による光ディスクの寿命評価」 http://www.dcaj.org/h17opt/17opt_youshi.pdf)。
【0024】
しかも、記録密度を向上する技術進歩が早いため、メジャーをとった規格も年々時代遅れとなり、新しく登場する規格に取って代わられることになる。
【0025】
以上が、従来の技術の概観である。
【0026】
【発明が解決しようとする課題】
長い時間がかかってもよい通信、あるいは、長い時間がかかってしまう超長時間通信においては、
第一に、情報通信、情報記録に関する規格の不安定性が問題になる。
【0027】
たとえば、子孫の世代に自分達の日記をはじめ、写真、映像、プログラムなど著作物の情報を伝えようとする人は、今後増えていくと思われる。
【0028】
しかし、現在用いられているCD、MO、DVDの規格が何十年、何百年、何千年にもわたって安定して使用されるかどうかは疑わしい。
【0029】
現在の規格を維持する企業・機関が存続している保証もない。
【0030】
したがって、年月を経て、記録媒体を読む装置が存在しなくなり、記録媒体を読む装置を再現しようにも、装置の設計仕様の情報も散逸して製作できない、という事態が予想される。
【0031】
第二に、媒体の物理的および化学的な不安定性にも問題がある。
【0032】
年月が経てば、無生物の記録媒体は自然に劣化、変形、変性、あるいは情報消滅してしまうのがふつうである。
【0033】
このため、たとえば磁気テープの場合、数年ごとに情報を読み直して別の媒体に書き直す作業が必要とされている。
【0034】
経年変化に強い材料と、年月を経て自然に戻る、地球に優しい材料とは、両立が難しい。
【0035】
記録媒体を宇宙空間で搬送する場合にも、地球上には降り注がない強い宇宙線を直接浴びるために、媒体が劣化してしまう。
【0036】
散逸、消滅、あるいは劣化に備えて、媒体のコピーを何部も作成して保管し渡す方法もあるが、長期間に渡ってコピーを繰り返し行うのは、媒体の調達とコピー作業の実施が煩雑である。
【0037】
第三に、短時間に通信する場合でも、インターネット経由で標準的な規格で情報を伝送するようなことをすれば、媒体も通信方式も広く普及しているものであるために、第三者に比較的容易に傍受・解読されてしまう。
【0038】
本発明の目的は、以上述べたような、規格の不安定性、媒体の劣化、傍受の危険性の三項目の問題点を克服して、より安定性に優れた情報通信方法と情報記録方法とエンコーダとデコーダを提供することである。
【0039】
本明細書における生物学上の用語、塩基符号、およびアミノ酸符号は、次の文献に基づいている:
Benjamin Lewin: Genes VI, Oxford University Press and Cell Press (1977) =[邦訳] 菊池 韶彦ら訳:遺伝子 第6版、東京化学同人(1999)。
【0040】
【課題を解決するための手段】
本発明は、安定性に優れた通信と記録を実現するため、データを生体高分子の配列かつ/または結合様式に置き直して記録することを、主要な特徴とする。
【0041】
生物の細胞に含まれている大きな分子すなわち高分子は、小さい分子すなわち低分子がつながっているものである。
生体高分子には、
(ア) t、c、a、gもしくはu、c、a、gの4種類のヌクレオチドからなるDNAもしくはRNAもしくはポリヌクレオチドと、
(イ) A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Yの20種類のアミノ酸からなる蛋白質もしくはポリペプチドと、
(ウ) 高等生物でMan、Glc、Gal、Xyl、GlcA、GlcNAc、GalNAc、Fuc、SAの9種類の単糖からなる多糖もしくは糖鎖と、
(エ) 脂肪酸からなる脂質
がある。
(糖鎖の参考文献「庄司 真理子ほか:特集:第三の生命鎖糖鎖とポストゲノム解析」http://www.nistep.go.jp/achiev/ftx/jpn/stfc/stt010j/feature2.html 、
「成松 久:細胞内で糖鎖はどのように合成されるのか?」
http://www.aist.go.jp/aist_j/aistinfo/aist_today/vol01_05/vol01_5_p18_24.pdf)
【0042】
こうした低分子を要素とするコード(code)は、生物がきわめて長期間採用してきたもので、今後数千年程度で自然に変化するものではないと考えられる。
【0043】
配列情報を与えて生体高分子を合成、解読する方法はすでに知られていて、それぞれ自動装置が市販されている。
【0044】
たとえば、
(ア) DNAの合成に関しては、特許出願平4-65839「DNA等自動合成装置」(出願人=島津製作所)の実施例で、ホスホトリエステル法によりDNAを自動合成する。
【0045】
(イ) DNAの解読に関しては、特許第2559621号「DNAパターン読み取り装置及びDNAパターン読み取り方法」(出願人=日立ソフトウェアエンジニアリング)で、DNAからA、C、G、Tの符号を読み取る。
【0046】
(ウ) ポリペプチドの合成に関しては、特許出願平4-69640「自動化ポリペプチド合成装置」(出願人=アプライド バイオシステムズ インコーポレーテッド)で、保護されたアミノ酸を1種類ずつ受取って活性化し、所望の順序に配列されたポリペプチドを作る。
【0047】
(エ) ポリペプチドの解読に関しては、特許公開平08-304375「タンパク質のアミノ酸配列決定装置」(出願人=島津製作所)で、エドマン法により得られたデータから蛋白質もしくはポリペプチドのアミノ酸配列を決定する。
【0048】
以上のように、配列と生体高分子の相互変換は既に可能である。
【0049】
本発明では、任意のデータを高分子のコードに変換するエンコーダと、高分子のコードから元のデータに復元するデコーダを新規作成することにより、生体高分子を情報通信媒体もしくは情報記録媒体として用いることを可能とする。
【0050】
【発明の実施の形態】
図1は、請求項1に対応する実施例1の構成ブロック図である。
【0051】
同図は、生体高分子を通信媒体にした情報通信方法の原理構成を示すブロック図である。
【0052】
以下、図1の構成を説明する。
【0053】
図1において、全体システムは、送信者の用いる送信者側サブシステム1と受信者の用いる受信者側サブシステム2を含んでいる。
ふたつのサブシステムの間に、情報通信媒体として、合成高分子9または合成高分子9を内包する人間以外の生物もしくは細胞もしくは生体高分子10がある。
【0054】
送信者側サブシステム1と受信者側サブシステム2はきわめて対称的な内部構造をしている。
【0055】
人もしくは情報システムとデータをやりとりする送信データ入力部3と受信データ出力部15がそれぞれある。
【0056】
送信するデータ4を高分子の、配列情報または結合様式情報6に変換するエンコーダ5と、解読した配列/結合様式情報12に逆変換するデコーダ13がそれぞれある。
【0057】
合成装置7と配列読み取り装置11がそれぞれある。
【0058】
合成装置7には生体高分子の材料8が容器から供給される。
【0059】
以上、図1の構成を説明した。
【0060】
図2は、請求項2に対応する実施例2の構成ブロック図である。
【0061】
同図は、生体高分子を記録媒体にした、情報記録方法の原理構成を示すブロック図である。
【0062】
図2は目的は図1とやや異なるが、構成は図1と類似している。
同一でないが対応する構成要素は、符号の末尾に「a」を付して示す。
【0063】
以下、図2の構成を説明する。
【0064】
図2において、全体システムは、書き込み側サブシステム1aと読み出し側サブシステム2aを含んでいる。
ふたつのサブシステムの間に、情報記録媒体として、合成高分子9または合成高分子9を内包する、人間以外の生物もしくは細胞もしくは生体高分子10がある。
【0065】
書き込み側サブシステム1aと読み出し側サブシステム2aはきわめて対称的な内部構造をしている。
【0066】
人もしくは情報システムとデータをやりとりするデータ入力部3aとデータ出力部15aがそれぞれある。
【0067】
書き込むデータ4aを高分子の、配列情報または結合様式情報6に変換するエンコーダ5と、解読した配列/結合様式情報12に逆変換するデコーダ13がそれぞれある。
【0068】
合成装置7と配列読み取り装置11がそれぞれある。
【0069】
合成装置7には生体高分子の材料8が容器から供給される。
【0070】
以上、図2の構成を説明した。
【0071】
以下に、請求項1に対応する実施例1の作用を順に説明し、構成要素間の有機的関係を示す。
【0072】
前半は、送信者側サブシステム1における作用である。
【0073】
ステップ1として、送信データ入力部3が、送信するデータ4を、人または情報システムから入力する。
【0074】
送信データ入力部3の例は、キーボード、受信装置、音声入力装置、画像入力装置、A/Dコンバータ、アプリケーションプログラムからの伝達、または、別の記録媒体からの読み取り装置を含む。
【0075】
ステップ1につづき、図にないデータ圧縮手段が、該送信するデータ4をより少ないビット数に圧縮してもよい。
【0076】
ステップ1につづき、図にない暗号化手段が、キーを知らない第三者による傍受・解読を防ぐために、人または情報システムが入力したキーを用いて、該送信するデータ4を暗号化してもよい。
【0077】
ステップ1につづき、図にない冗長化手段が、通信あるいは記録におけるデータの誤りを検出もしくは訂正できるように、該送信するデータ4を冗長化してもよい。
【0078】
冗長化の例として、
(ア) パリティあるいは誤り訂正符号 (Error Correcting Code, ECC) を付してもよい。
また、RAID(Redundant Arrays of Inexpensive Disks)技術を応用して、複数の媒体すなわち合成高分子にわたる情報の間でパリティを形成させてもよい。
(RAIDの参考文献「RAID - Wikipedia」 http://ja.wikipedia.org/wiki/RAID)
【0079】
(イ) 読み出しのときに同期をとるためのプリアンブル(preamble)と呼ばれるビット列を付してもよい。
【0080】
(ウ) ブロックの抜けまたは重複または順序の入れ替わりを検出するために、ブロック一連番号を振ってもよい。
【0081】
(エ) ブロックの長さを決まった形式で付してもよい。
【0082】
(オ) ブロックより大きな塊の単位をさらにブロックのように扱ってもよい。
【0083】
(カ) 可読性を向上するために、改行、キャリッジリターン、タブ、空白、引用符、または、先頭からのバイト単位等のロケーションを付してもよい。これらのチェックは誤りの検出に役立つ。
【0084】
(キ) データ全体もしくはブロック等の部分に、エンコードした時刻を付してもよい。時刻のチェックは誤りの検出に役立つ。
【0085】
これらはいずれも冗長化を起こす。
【0086】
ステップ2として、エンコーダ5が、送信するデータ4を、合成する高分子を構成する低分子の、配列情報または結合様式情報6に変換する。
【0087】
配列情報または結合様式情報6は、
合成高分子が核酸系の場合は、塩基配列であり、
合成高分子がペプチド系の場合は、アミノ酸配列であり、
合成高分子が多糖系の場合は、単糖配列および結合様式情報である。
【0088】
ステップ2につづき、図にない高分子配列変換手段が、生物学的機能を付加するために、または、安定性を付加するために、該配列情報または結合様式情報6に置換または挿入を加える変換を行ってもよい。
【0089】
高分子配列変換の例として、次のものがある:
(ア) 突然変異あるいは生殖あるいは増幅によって変異しやすい配列を避けて他のコードに変換すること、
(イ) テロメア配列など生体で特定の機能が生じるなどの意味をもつ配列を避けて他のコードに変換すること、
(ウ) プロモータ配列など遺伝子先頭配列を付加すること、
(エ) プロモータ配列など遺伝子先頭配列を避けて他のコードに変換すること、
(オ) 翻訳終了、poly(A)など遺伝子末端配列を付加すること、
(カ) 翻訳終了、poly(A)など遺伝子末端配列を避けて他のコードに変換すること、
(キ) 生物の3文字の塩基(codon)では、cgu、 cgc、cga、cggがすべてアルギニンである例のように、最後の1文字が変異しても意味が変わらないことが多いことに習い、3文字のコドンの先頭2文字のみに、送信データをエンコードし、最後の1文字は冗長な値にすること、
(ク) 生物化学的検出を容易にするため標識コードをつけること。
【0090】
ステップ3として、合成装置7が、低分子を含有している生体高分子の材料8を原料にして、該配列情報または結合様式情報(6)どおりの合成高分子9を合成する。
【0091】
合成装置7は、
合成高分子がペプチド系の場合は、ペプチド合成装置もしくはペプチドシンセサイザもしくは蛋白質合成装置であり、
合成高分子が核酸系の場合は、DNA合成装置もしくはDNAシンセサイザもしくは核酸合成装置である。
【0092】
それぞれすでに市販の装置があるが、さらにエンコーダ5とオンライン接続させることにより、効率が向上する。
【0093】
ステップ4として、該合成高分子9を、そのまま、受信者の用いる受信者側サブシステム2に渡すか、
または、該合成高分子9を、人間以外の生物もしくは細胞もしくは生体高分子10の一部として組み込んでから、受信者側サブシステム2に渡す。
【0094】
人間以外の生物もしくは細胞もしくは生体高分子10を、送信側サブシステム1から受信側サブシステム2に渡す態様としては、大別して次の2種類がある。
(ア)受信の意図、時間および場所が明確に予定されて受信側サブシステム2に渡される態様。
(イ)受信の意図、時間または場所が必ずしも明確でないため、いったん作られた人間以外の生物もしくは細胞もしくは生体高分子10は、そのまま、あるいは何か生物、製品もしくは物体等に、包含されもしくは塗布されもしくは付随されられて、どこかの場所にいったん置かれもしくは放たれ、後日必要なときに確保されて受信側サブシステム2に渡される態様。
【0095】
ここで、高分子を人間以外の生物もしくは細胞もしくは他の高分子に組み込む公知技術は多く、今後も大きな発展が予想されている:
【0096】
(ア) 単一鎖のDNAを合成したあと、塩基を相補的に結合させることで二重鎖DNAにして安定化させることができる。
【0097】
(イ) RNAを合成したあと、相補的な塩基からなるDNAに変換することができる。
【0098】
(ウ) DNAを合成して、環状DNAに組み込むことができる。
【0099】
(エ) 進化、変異の影響を受けにくいように、情報を、健全な生命維持もしくは生殖に必要な遺伝子のコードの一部に、該遺伝子の機能を損なわないように組み入れることにより、変異すると個体が致死となるようにする、という戦略も考えられる。
【0100】
これら生体高分子は、品質をほとんど損なわずに冷凍保存することが可能である。
【0101】
これら生体高分子は、生物、細胞、DNA、RNA、あるいは、遺伝子に組み込んで、生物を生かしたままもしくは死体でもしくは冷凍してもしくは樹脂、琥珀(こはく=樹脂の化石)、プラスチック、ガラス、その他の物質に封入して、安定した環境で保存することができる。
【0102】
高分子を組み込んだ生物が生命・種族を保存しようと自律的に生きてくれることは、従来の通信媒体や記録媒体と違って、媒体保存の手間が省ける面があって有利である。
【0103】
生体高分子を増幅させ、あるいは生物を繁殖させ、あるいはクローン生物を作り、あるいはDNA組み換え生物に蛋白質を生産させることによって、情報のコピーを増やして通信の確実性を上げることができる。
【0104】
後半は、受信者側サブシステム2における作用である。
【0105】
受信者は、該人間以外の生物もしくは細胞もしくは生体高分子10を入手する。
【0106】
受信者は送信者自身であってもよい。
【0107】
もし、受信者が該人間以外の生物もしくは細胞もしくは生体高分子10を入手する前に、該合成高分子9が生体高分子相互間の生物学的な変換を受けたために、同一もしくはほぼ同一の情報を包含したまま、情報媒体としての生体高分子が入れかわった場合は、変化後の人間以外の生物もしくは細胞もしくは生体高分子を受信者が入手し、以後記載される合成高分子9として扱う。
【0108】
たとえば生殖の際におこる染色体の交差により、DNAに埋め込んだ情報が変わってしまうことがある。
【0109】
また、染色体の複製に伴うエラー、放射線、化学物質の影響で突然変異が起こることがある。
【0110】
こうした情報の変化は、解読時に処理する。
【0111】
特に、情報が、多くの高分子もしくは細胞もしくは生物に伝播してそれぞれが変異した可能性をもった場合には、複数のサンプルから得た情報を比較することで、送信データを推定する。
【0112】
たとえば、多数のサンプルが変異を含む場合、それらのサンプルから共通部分を取り出してつなぎ合わせ、再構成すればよい。
【0113】
前記再構成を容易にするためには、冗長化で述べたブロック化とブロック一連番号の付加が有効である。
【0114】
なぜなら、解読された多数のサンプルの情報を、ブロックに切って、ブロック番号の一致するものを比較することにより、変異のビット位置まで正確に比較できるからである。
【0115】
また、各ブロックにパリティなどのエラー検出コードを付けておけば、変異のあったブロックを判定して捨てることができる。
【0116】
ステップ5として、合成高分子9が人間以外の生物もしくは細胞もしくは生体高分子10に組み込まれている場合は該合成高分子9を取り出す。
【0117】
いずれの場合も、ステップ6として、配列読み取り装置11が、セットされた該合成高分子9を分析して、構成分子の、解読した配列/結合様式情報12を出力する。
【0118】
配列読み取り装置11は、
合成高分子がペプチド系の場合は、ペプチドシーケンサもしくはプロテインシーケンサもしくはアミノ酸分析装置である、
合成高分子が核酸系の場合は、DNAシーケンサもしくは核酸シーケンサもしくは核酸分析装置である、
【0119】
それぞれすでに市販の装置があるが、さらにデコーダ13とオンライン接続させることにより、効率が向上する。
【0120】
送信時に高分子配列変換が行われていた場合には、ステップ6につづき、図にない高分子配列逆変換手段が、解読した配列/結合様式情報12から、生物学的機能を付加するため、または、安定性を付加するために行われた置換もしくは挿入を元に戻す高分子配列逆変換処理を実行する。
【0121】
ステップ7として、デコーダ13が、解読した配列/結合様式情報12を解析して受信データ14を生成し、受信データ出力部15から出力する
【0122】
送信時に冗長化が行われていた場合は、ステップ7につづき、図にない冗長化復号化手段が、キーを用いて、該受信データ14から余計なデータを除き、あるいはエラーを検出しあるいはエラーを訂正して元のデータに戻す冗長化逆変換処理を実行する。
【0123】
送信時に暗号化が行われていた場合は、ステップ7につづき、図にない復号化手段が、キーを用いて、該受信データ14を元のデータに戻す復号化を実行する。
【0124】
送信時にデータ圧縮が行われていた場合は、ステップ7につづき、図にないデータ伸長手段が、該受信データ14を元のデータに戻すデータ伸長を実行する。
【0125】
受信データ出力部15の例は、ディスプレイ、プリンタ、送信装置、音声出力装置、D/Aコンバータ、アプリケーションプログラムへの伝達、または、別の記録媒体への書き込み装置である。
【0126】
以上、実施例1の作用を順に説明し、構成要素間の有機的関係を示した。
【0127】
次に、請求項2に対応する実施例2の作用に関して触れる。
【0128】
実施例2は実施例1と構成が対称的に対応している。
【0129】
そこで、実施例2の各符号の末尾にaがあるものは取って読み替えることにより、前記の実施例1の作用をもとに実施例2の作用が理解できる。
【0130】
本願発明を、ポリペプチドを利用して実施する場合は、
前記合成高分子9が蛋白質もしくはポリペプチド(polipeptide)であり、
前記低分子がグルタミン(Glutamine、符号G)などアミノ酸(amino acid)であり、
前記配列情報または結合様式情報6がアミノ酸配列(amino acid sequence)であり、
前記合成装置7がペプチド合成装置もしくはペプチドシンセサイザもしくは蛋白質合成装置であり、
前記配列読み取り装置11がペプチドシーケンサもしくはプロテインシーケンサもしくはアミノ酸分析装置である(請求項3)。
【0131】
また、本願発明を、核酸を利用して実施する場合は、
前記合成高分子9がDNAもしくはRNAもしくはポリヌクレオチド(polinucleotide)であり、
前記低分子が、アデニン(adenine、符号a)などヌクレオチド(nucleotide)であり、
前記配列情報または結合様式情報6がヌクレオチドの塩基配列(base sequence または nucleotide sequence)であり、
前記合成装置7がDNA合成装置もしくはDNAシンセサイザもしくは核酸合成装置であり、
前記配列読み取り装置11がDNAシーケンサもしくは核酸シーケンサもしくは核酸分析装置である(請求項4)。
【0132】
前記エンコーダ5は、
請求項1の発明においては送信するデータ(4)を、請求項2の発明においては書き込むデータ(4a)を、先頭から順に最後まで2ビットごとに切ってサブデータ群に分割し、半端な1ビットが出れば0の値をもつダミーな1ビットを連結して2ビットとし、各サブデータのとりうる10進数で表現して0〜3である4種類の値をt、c、a、gもしくはu、c、a、gの4種類の塩基のいずれかとに1対1で対応させる変換規則に基づいて、逐次変換することによって塩基配列情報を得ることができる。
また、エンコーダ5は、請求項1の発明においては送信するデータ(4)を、請求項2の発明においては書き込むデータ(4a)を、先頭から順に最後まで4ビットごとに切ってサブデータ群に分割し、半端な4ビット未満のデータが出れば0の値をもつダミーなビット列を連結して4ビットとし、各サブデータのとりうる10進数で表現して0〜15である16種類の値をA、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Yの20種類のうちの16種類のアミノ酸のいずれかとに1対1で対応させる変換規則に基づいて、逐次変換することによってアミノ酸配列情報を得ることができる。
一方、エンコーダ5は、請求項1の発明においては送信するデータ(4)を、請求項2の発明においては書き込むデータ(4a)を、先頭から順に最後まで一定数ビットごとに切ってサブデータ群に分割し、半端な該一定数ビット未満のサブデータが出れば0の値をもつダミーなビット列を連結して該一定数ビットとし、各サブデータを20進数表現による一定桁数の数字列に変換し、各数字のとりうる10進数で表現して0〜19である20種類の値をA、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Yの20種類のアミノ酸のいずれかとに1対1で対応させる変換規則に基づいて、逐次変換することによってアミノ酸配列情報を得ることもできる(請求項5)。一定数ビットは、たとえばコンピュータの処理しやすい16ビットや32ビットでもよい。
【0133】
送信するデータを1ビット、2ビットまたは3ビットずつに分割して、アミノ酸のうちのそれぞれ2種類、4種類、8種類だけに対応付けることもできるが、記録効率の上では前記の4ビットに対応づける方が明らかに有利である。
【0134】
また、送信するデータを2〜19進数と見なし、アミノ酸のうちのそれぞれ2〜19種類だけに対応付けることもできるが、記録効率の上では前記の20進数のほうが明らかに有利である。
【0135】
以下に,エンコーダの処理手順を,自然言語を入れた構造化プログラム記述法である擬似コード(pseudo code)で記す。
【0136】
凡例/ リストとは,0, 1, 2, …という添字で指定して読み書きできるデータ構造である.
リスト内のデータは,添字の若い順に左から並んでいるとする.
変数名直後でない'{'と'}'は,囲まれた部分が処理の範囲であると明示する.
【0137】
a. エンコーダのメインプログラム
a.0 開始.
a.1 塩基配列への変換を行うなら,{
塩基配列変換ルーチン(plain2bp)を実行してくる.
}
a.2 アミノ酸配列への変換を行うなら,{
アミノ酸配列変換ルーチン(plain2aa)を実行してくる.
}
a.3 停止する.
a.4 記述終了.
【0138】
b. 塩基配列変換ルーチン(plain2bp)
b.0 開始.
b.1 リストbin2bpに ('a', 'g', 'c', 't') をセットしておく.
すなわち,たとえば,bin2bp[0]なら値'a', bin2bp[3]なら値't'を
得られる.
b.2 入力ファイルから1行ずつ入力して各行について {
b.3 行の中を1文字ずつに分解して,リストcharsにセットする.
b.4 リストcharsの中の各文字について {
b.5 変数bit76に,該文字と16進c0の論理積をとり16進40で除した値を入
れる.
なお,値は,0〜3となる.
b.6 変数seq0に,bin2bp[bit76]を入れる.
なお,値は,bit76が0だったときは'a',また,3だったときは't'など
となる.
b.7 変数bit54に,該文字と16進30の論理積をとり16進10で除した値を入
れる.
b.8 変数seq1に,bin2bp[bit54]を入れる.
b.9 変数bit32に,該文字と16進0cの論理積をとり16進04で除した値を入
れる.
b.10 変数seq2に,bin2bp[bit32]を入れる.
b.11 変数bit10に,該文字と16進03の論理積をとり16進01で除した値を入
れる.
なお,01で除さなくてもよい.
b.12 変数seq3に,bin2bp[bit10]を入れる.
b.13 変数seq0と変数seq1と変数seq2と変数seq3をこの順序に並べたもの
を出力する.
なお,出力は,8ビットの1文字の入力に対して,4文字の'atcg'など
となる.
b.14 }
b.15 }
b.16 戻る.
b.17 記述終了.
【0139】
c. アミノ酸配列変換ルーチン(plain2aa)
c.0 開始.
c.1 リストbin2aaに ('A', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'K', 'L',
'M', 'N', 'P', 'Q', 'R', 'S', ) をセットしておく.
すなわち,たとえば,bin2aa[0]なら値'A', bin2bp[15]なら値'S'を得ら
れる.
c.2 入力ファイルから1行ずつ入力して各行について {
c.3 行の中を1文字ずつに分解して,リストcharsにセットする.
c.4 リストcharsの中の各文字について {
c.5 変数bit7654に,該文字と16進f0の論理積をとり16進10で除した値を
入れる.
なお,値は,0〜10進15となる.
c.6 変数seq0に,bin2aa[bit7654]を入れる.
なお,値は,bit7654が0だったときは'A',また,15だったときは'S'
などとなる.
c.7 変数bit3210に,該文字と16進0fの論理積をとり16進01で除した値を
入れる.
なお,01で除さなくてもよい.
c.8 変数seq1に,bin2aa[bit3210]を入れる.
c.9 変数seq0と変数seq1をこの順序に並べたものを出力する.
なお,出力は,8ビットの1文字の入力に対して,2文字の'AS'などと
なる.
c.10 }
c.11 }
c.12 戻る.
c.13 記述終了.
【0140】
以上、エンコーダの処理手順を記した。
【0141】
以下に、デコーダの処理手順を,擬似コードで記す。
【0142】
凡例/ 連想リストとは,キー文字列で検索できるデータ構造である.
【0143】
d. デコーダのメインプログラム
d.0 開始.
d.1 塩基配列を入力する変換を行うなら,{
塩基配列逆変換ルーチン(bp2plain)を実行してくる.
}
d.2 アミノ酸配列を入力する変換を行うなら,{
アミノ酸配列逆変換ルーチン(aa2plain)を実行してくる.
}
d.3 停止する.
d.4 記述終了.
【0144】
e. 塩基配列逆変換ルーチン(bp2plain)
e.0 開始.
e.1 連想リストbp2binに('a', 0, 'g', 1, 'c', 2, 't', 3)をセットして
おく.
すなわち,たとえば,bp2bin{'a'}なら値0を,bp2bin{'t'}なら値3
を得られる.
e.2 入力ファイルの全文字を入力し,
e.3 その中を1文字ずつに分解して,リストcharsにセットする.
e.4 リストcharsの中の各文字について変数the_charにセットし {
e.5 変数the_binに,変数the_charをキーで連想リストbp2binを検索した結
果をセットする.
すなわち,たとえば,the_charが't'ならthe_binは値3となる.
e.6 変数the_binを引数として渡して,push_bitルーチンを実行してくる.
e.7 }
e.8 戻る.
e.9 記述終了.
【0145】
f. push_bitルーチン
f.0 開始.
f.1 変数push_counterに1を加える.
f.2 もし変数push_counterを4で割った余りが0なら {
f.3 変数decimalに,
stack[0]×16進40+stack[1]×16進10+stack[2]×16進04+the_binをセットする.
f.4 変数decimalを符号付きの1バイトのバイナリデータに変換(packという)して出力する.
f.5 リストstackをクリアする.
f.6 } さもなければ {
f.7 引数として受け取ったthe_binを,リストのいちばん右に追加するとともに,その前に,リストにセットされていたデータ要素をひとつずつ左にシフトする.
f.8 }
f.9 戻る.
f.10 記述終了.
【0146】
g. アミノ酸配列逆変換ルーチン(aa2plain)
g.0 開始.
g.1 連想リストaa2binに
('A', 0, 'C', 1, 'D', 2, 'E', 3, 'F', 4,
'G', 5, 'H', 6, 'I', 7, 'K', 8, 'L', 9,
'M', 10, 'N', 11, 'P', 12, 'Q', 13, 'R', 14,
'S', 15)
をセットしておく.
すなわち,たとえば,aa2bin{'A'}なら値0を,aa2bin{'S'}なら値15を
得られる. g.2 入力ファイルの全文字を入力し,
g.3 その中を1文字ずつに分解して,リストcharsにセットする.
g.4 リストcharsの中の各文字について変数the_charにセットし {
g.5 変数the_binに,変数the_charをキーで連想リストaa2binを検索した結
果をセットする.
すなわち,たとえば,the_charが'S'ならthe_binは値10進15とな
る.
g.6 変数the_binを引数として渡して,push_bitBルーチンを実行してくる.
g.7 }
g.8 戻る.
g.9 記述終了.
【0147】
h. push_bitBルーチン
h.0 開始.
h.1 変数push_counterに1を加える.
h.2 もし変数push_counterを2で割った余りが0なら {
h.3 変数decimalに,
stack[0]×16進10+the_bin
をセットする.
h.4 変数decimalを符号付きの1バイトのバイナリデータに変換(packという) して出力する.
h.5 リストstackをクリアする.
h.6 } さもなければ {
h.7 引数として受け取ったthe_binを,リストのいちばん右に追加するとともに,その前に,リストにセットされていたデータ要素をひとつずつ左にシフトする.
h.8 }
h.9 戻る.
h.10 記述終了.
【0148】
以上、デコーダの処理手順を記した。
【0149】
以下に、20進数に対応づける処理(請求項5に記載)を説明する。
【0150】
まず、10進数は,数すなわちデータを、0,1,2,3,4,5,6,7,8,9の9種の数字で表現している。
【0151】
16進数は、数を、0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,Fの16種の拡張された数字で表現している。
【0152】
これらと同様に、20進数は、数を20種の拡張された数字を用いて表現できる。
【0153】
いま、地球生命のアミノ酸の種類A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Yと対応づけるとする。
【0154】
すると、任意のデータは、20で除する演算により、20進表現に変換できるので,アミノ酸配列に変換できる。
【0155】
逆に、アミノ酸配列は、これを20進数とみなして20を乗ずる演算により、データに戻すことができる。
【0156】
上記20進数の変換処理と逆変換処理は、広く行われている16進数の処理と同様であるので詳述しない。
【0157】
いま、送信するデータを64ビットで区切るとする。
【0158】
もし4ビットをアミノ酸1文字に対応づける方式を採用すれば、64/4=16個のアミノ酸が必要になってしまう。
【0159】
ところが、264 ≒ 1.84×1019 は,2015 ≒ 3.28×1019よりも小さいので、20進数の数字に対応づける方式を採用すれば、64ビットを表現するのに15個のアミノ酸しか要らず、4ビット方式より1個少なくて済む。
【0160】
たとえば,64ビットの2進数
0000000000 0000000000 0000000000 0000000000 0000000000 0000000000 0001
は,4ビット方式では,
AAAAAAAAAA AAAAAC
であるが,20進数方式では,
AAAAAAAAAA AAAAC
となる.
ここに,各データの中で,空白は,読解性を助けるだけのものである.
【0161】
このように、20種類のアミノ酸を全部活用することにより、演算はより複雑となるが、高分子の長さをより小さくすることができる。
【0162】
以上、20進数に対応づける処理を説明した。
【0163】
ここで、以下に、処理例を二例示す。
【0164】
図3は、エンコーダとデコーダの処理例1であり、前記エンコーダ5とデコーダ13を作成して実験した結果を示す。
【0165】
図3の各データの中で、空白は、読解性を助けるだけのものである。
【0166】
図3の各データの中で、斜体文字で示した部分は、理解を助けるために、元の「ll」(エル・エル)の2文字がどう変形していくか、対応部分を追跡して表示したものである。
【0167】
エンコーダに、送信するデータ4として、図3(a)のデータを与えた。
【0168】
該データをASCIIコード文字、16進数、2進数の3通りで表現したものが、それぞれ、図3の(a)、(b)および(c)である。
【0169】
エンコーダ5に該データを入力して塩基配列情報を出力させると、図3(d)が得られた。
【0170】
本塩基配列情報はt、c、a、gだけからなるので、合成装置7が読み取ることができる形式である。
【0171】
合成装置7がこの塩基配列をもつDNAなどの合成高分子9を作り、該合成高分子9を配列読み取り装置11が読み取ると、解読した配列/結合様式情報12がデコーダ13に渡る。もし情報が誤りなく伝わるならば、該解読した配列/結合様式情報12は、図3(d)の塩基配列そのものである。
【0172】
そこで、実験では、図3(d)をデコーダ13に入力した。その結果は、図3(f)または(g)または(h)で表現されるものであり、それぞれ、図3(c)、(b)、(a)に一致した。
【0173】
したがって、本実験データで、情報通信あるいは情報記録は正しく行われる。
【0174】
上の説明は塩基配列の場合であったが、アミノ酸配列によっても実験を行った。
【0175】
図3の(a)または(b)または(c)で表現されるデータをエンコーダ5に入力してアミノ酸配列情報を出力させると、図3(e)が得られた。
【0176】
本アミノ酸配列情報はA、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Yだけからなるので、合成装置7が読み取ることができる形式である。
【0177】
合成装置7がこのアミノ配列をもつポリペプチドなどの合成高分子9を作り、該合成高分子9を配列読み取り装置11が読み取ると、解読した配列/結合様式情報12がデコーダ13に渡る。もし情報が誤りなく伝わるならば、該解読した配列/結合様式情報12は、図3(d)のアミノ酸配列そのものである。
【0178】
そこで、実験では、図3(e)をデコーダ13に入力した。その結果は、図3(f)または(g)または(h)で表現されるものであり、それぞれ、図3(c)、(b)、(a)に一致した。
【0179】
したがって、本実験データで、情報通信あるいは情報記録は正しく行われる。
【0180】
図4は、エンコーダとデコーダの処理例2であり、処理例1と同一のエンコーダ5とデコーダ13を用い、日本語のデータを使って実験した結果を示している。
【0181】
図4の各データの中で、空白は、読解性を助けるだけのものである。
【0182】
図4の各データの中で、斜体文字で示した部分は、理解を助けるために、元の「シ」という1文字のカタカナがどう変形していくか、対応部分を追跡して表示したものである。
【0183】
エンコーダに、送信するデータ4として、図4(a)のデータを与えた。
【0184】
該データをEUCコード文字、16進数、2進数の3通りで表現したものが、それぞれ、図4の(a)、(b)および(c)である。
【0185】
エンコーダ5に該データを入力して塩基配列情報を出力させると、図4(d)が得られた。
【0186】
本塩基配列情報はt、c、a、gだけからなるので、合成装置7が読み取ることができる形式である。
【0187】
合成装置7がこの塩基配列をもつDNAなどの合成高分子9を作り、該合成高分子9を配列読み取り装置11が読み取ると、解読した配列/結合様式情報12がデコーダ13に渡る。もし情報が誤りなく伝わるならば、該解読した配列/結合様式情報12は、図4(d)の塩基配列そのものである。
【0188】
そこで、実験では、図4(d)をデコーダ13に入力した。その結果は、図4(f)または(g)または(h)で表現されるものであり、それぞれ、図4(c)、(b)、(a)に一致した。
【0189】
したがって、本実験データで、情報通信あるいは情報記録は正しく行われる。
【0190】
上の説明は塩基配列の場合であったが、アミノ酸配列によっても実験を行った。
【0191】
図4の(a)または(b)または(c)で表現されるデータをエンコーダ5に入力してアミノ酸配列情報を出力させると、図4(e)が得られた。
【0192】
本アミノ酸配列情報はA、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Yだけからなるので、合成装置7が読み取ることができる形式である。
【0193】
合成装置7がこのアミノ酸配列をもつポリペプチドなどの合成高分子9を作り、該合成高分子9を配列読み取り装置11が読み取ると、解読した配列/結合様式情報12がデコーダ13に渡る。もし情報が誤りなく伝わるならば、該解読した配列/結合様式情報12は、図4(d)のアミノ酸配列そのものである。
【0194】
そこで、実験では、図4(e)をデコーダ13に入力した。その結果は、図4(f)または(g)または(h)で表現されるものであり、それぞれ、図4(c)、(b)、(a)に一致した。
【0195】
したがって、本実験データで、情報通信あるいは情報記録は正しく行われる。
【0196】
以上、処理例を二例示した。
【0197】
本願発明はまた、前記エンコーダ5をクレームする(請求項6)。
【0198】
本願発明はまた、前記デコーダ13をクレームする(請求項7)。
【0199】
本願発明はまた、前記エンコーダ5のプログラムを記録した記録媒体をクレームする(請求項8)。
【0200】
ここで記録媒体とは、CD、MO、DVD、ハードディスク、半導体メモリ、半導体チップ、磁気テープを含む電気的もしくは磁気的もしくは光学的手段を用いた記録媒体もしくは記憶装置、そして、本願発明による高分子記録媒体を含む。
【0201】
本願発明はまた、前記エンコーダ5のプログラムを伝送する情報伝送媒体をクレームする(請求項9)。
【0202】
ここで情報伝送媒体とは、ネットワーク、電話、ケーブルテレビ、そして、放送を含む。
【0203】
本願発明はまた、前記デコーダ13のプログラムを記録した記録媒体をクレームする(請求項10)。
【0204】
本願発明はまた、前記デコーダ13のプログラムを伝送する情報伝送媒体をクレームする(請求項11)。
【0205】
本願発明はまた、
請求項1に記載の情報通信方法または請求項2に記載の情報記録方法
によってデータが記録された
ことを特徴とする人間以外の生物もしくは細胞もしくは生体高分子もしくは合成高分子をクレームする(請求項12)。
【0206】
これらの人間以外の生物もしくは細胞もしくは生体高分子の用途の例は:
(ア) ドキュメント、トランザクションデータ、マルチメディアデータ、大容量データベース、プログラム、スクリプト、ログ、放送記録、あるいはWebドキュメントの記録、画面コピーなどの、格納、
(イ) 実験データ、観測データ、バイオデータ、あるいは、シミュレーション結果の、記録、
(ウ) 極秘通信、
(エ) 遺伝子組み換え生物等の人間以外の生物につける標識もしくは識別番号もしくは実験関連情報、
(オ) タイムカプセル、
(カ) 地球外生命との通信、
である。
【0207】
(地球外生命の参考文献:
「前野 昌弘:SETI計画とは何か」http://homepage3.nifty.com/iromono/kougi/ningen/node35.html、 「SETI@home」
http://setiathome.ssl.berkeley.edu/)
【0208】
バイオデータの保存に用いる例として、現在の一人のヒトのゲノム情報を、本システムに入力して、保存性や解読容易性などの特徴をもった別の生物のDNAもしくはRNAに組み込んで保存することが考えられる。
【0209】
実施例では、送信データに他の情報を付加せずに送っているが、送信データを記述している自然言語もしくはプログラミング言語もしくは構造化データの知識のない受信者のために、
文法情報、辞書情報、メタ情報、フォント情報、発音情報、文書タイプ定義、あるいは、関連文書
を添付してもよい。
この場合受信者は、添付情報をもとに言語知識を組み立てて、受信データを理解する。
【0210】
画像情報、音楽情報は、背景知識が少なくても理解しやすいので、比較的安心して送ることができる。
【0211】
実施例では、地球生命にほぼ共通の高分子と低分子の組合せを用いたが、化学的に安定であれば、地球生命に共通ではない高分子あるいは低分子を採用してもよい。
【0212】
本願発明の技術は現在のところ、合成と配列読み取りが遅いという点で性能上不利としても、近いうちに改善されることが期待される。
【0213】
たとえば、ヒトゲノムの最初の解読には数年を要したが、配列読み取り装置11の速度が年々高速化している。
解読時間はじきに月単位あるいは週単位に短縮すると予想されている。
【0214】
現在、合成装置7が合成できる高分子の長さが短いという問題もある。
【0215】
この点は、合成技術の進歩で次第に解決され、次第に長いデータを記録できることになるであろう。
【0216】
また、現在合成できる一本の高分子の鎖は短くとも、多数の高分子を合成することは問題ない。
【0217】
そこで、複数のDVDにデータを書き込むのと同様、多数の高分子にまたがってデータを記録することができる。
【0218】
それぞれの高分子もしくはブロックに一連番号を振っておけば、受信者がそれら多数の高分子を集めてデータを再構成することは容易である。
【発明の効果】
第一に、生物の高分子のアーキテクチャは天然の安定した規格であって、数百年、数千年後にも変わらないことが期待できる。
【0219】
第二に、生物はそれ自身生き延びる能力があるので、媒体の劣化の問題を回避しやすい。
【0220】
媒体が早く劣化する場合は、別媒体を調達して情報をコピーするコストがかかるが、本願発明によれば、高分子を冷凍したり、生物を生かしておくことで、情報が保存される。
【0221】
第三に、傍受に対して、配列読み取り装置のように通常のネットワークユーザには入手も製作もしにくい構成部品を採用しているので、強靱といえる。
【0222】
以上説明したように本発明は、規格の不安定性、媒体の劣化、傍受の危険性の三項目の問題点を克服して、より安定性に優れた通信方法と記録方法を提供できる。
【0223】
さらに、以下のような利点もある。
【0224】
第四に、情報の記録密度を飛躍的に高めることができる。
【0225】
いま、高分子の記録している情報の密度のオーダーを、従来の記録手段と比較してみる。
【0226】
世界で2億巻以上使われていて企業が取引ログや元帳を記録している、2,400 feet長の磁気テープは、180 MB = 180×106×8 bitのデータが記録でき、直径10.5 inch = 267 mm、厚み0.5 inch = 13 mmの円柱、質量1.5 kgとして、
約 109 bit/kg、
約 1012 bit/m3
【0227】
DVDは、容量9.4 GB = 9.4×109×8 bitのデータが記録でき、直径120 mm、厚み1.2 mmの円柱,質量80 gとして、
約 1012 bit/kg (=磁気テープの一千倍)、
約 1015 bit/m3 (=磁気テープの一千倍)。
【0228】
バクテリアは、核酸情報量5×106×2 bitで、直径0.5 μmの球、質量7×10-13 gとして、
約 1019 bit/kg (=DVDの一千万倍=磁気テープの百億倍)、
約 1026 bit/m3 (=DVDの一千億倍=磁気テープの百兆倍)。
【0229】
一辺がわずか 1 mm程度の立方体に詰めたバクテリアの核酸が含む情報が、世界中の2,400 feet磁気テープの情報の総量(3×1017 bit)に匹敵するのである。
【0230】
このように、生体高分子を媒体に用いれば、実際の装置は理論値までは出ないとしてもなお、非常に高い密度の情報記録が可能である。
【0231】
言い換えれば、密度には余裕が十分がある。
【0232】
したがって、データ誤りを防ぎ長期間情報を維持できるように、ひとつのデータのコピーをバイオテクノロジーの増幅技術または生物自身の増殖機能によって大量に増やし、それぞれを生かしておくこともできる。
【0233】
たとえば、蚕のDNAに遺伝子を組み込むと、該遺伝子のコードする蛋白質が繭の中に大量に吐き出される、という最近の技術も利用できる。
【0234】
第五に、請求項5に記載したエンコード方法を採用すれば、高密度にデータを記録することができる。
【0235】
特に、20種類のアミノ酸を20進数で用いる方法を採用すれば、16種だけのアミノ酸を使う方法よりも、格納効率の点で有利である。
【0236】
第六に、生物が自然環境で生きる場合は、受信者に媒体を渡すための作業も不要になる点が有利である。
【0237】
ただし、本願発明の実施にあたっては、その態様に応じ安全面と倫理面の問題を十分に検討し、慎重が上にも慎重に望む必要があることを、特記事項として明記しておく。
【図面の簡単な説明】
【図1】実施例1の構成ブロック図である。
【図2】実施例2の構成ブロック図である。
【図3】エンコーダとデコーダの処理例1を示した説明図である。
【図4】エンコーダとデコーダの処理例2を示した説明図である。
【符号の説明】
1 送信者側サブシステム
1a 書き込み側サブシステム
2 受信者側サブシステム
2a 読み出し側サブシステム
3 送信データ入力部
3a データ入力部
4 送信するデータ
4a 書き込むデータ
5 エンコーダ
6 配列情報または結合様式情報
7 合成装置
8 生体高分子の材料
9 合成高分子
10 人間以外の生物もしくは細胞もしくは生体高分子
11 配列読み取り装置
12 解読した配列/結合様式情報
13 デコーダ
14 受信データ
14a 読み出しデータ
15 受信データ出力部
15a データ出力部

Claims (12)

  1. 送信者側サブシステム(1)と受信者側サブシステム(2)があり、
    送信者側サブシステム(1)において、
    ステップ1として、送信データ入力部(3)が、送信するデータ(4)を入力し、あるいはさらに暗号化手段が暗号化を実行し、あるいはさらに冗長化手段が冗長化を実行し、
    ステップ2として、エンコーダ(5)が、送信するデータ(4)を、
    合成する高分子を構成する低分子の、配列情報または結合様式情報(6)に変換し、あるいはさらに高分子配列変換手段が高分子配列変換を実行し、
    ステップ3として、合成装置(7)が、低分子を含有している生体高分子の材料(8)を原料にして、該配列情報または結合様式情報(6)どおりの合成高分子(9)を合成し、
    ステップ4として、該合成高分子(9)を、そのまま、または、人間以外の生物もしくは細胞もしくは生体高分子(10)の一部として組み込んで受信者側サブシステム(2)に渡し、
    さらに、受信者側サブシステム(2)において、
    ステップ5として、合成高分子(9)が人間以外の生物もしくは細胞もしくは生体高分子(10)に組み込まれている場合は該合成高分子(9)を取り出し、
    いずれにしても、
    ステップ6として、配列読み取り装置(11)が、セットされた該合成高分子(9)を分析して、解読した配列/結合様式情報(12)を出力し、あるいはさらに高分子配列逆変換手段が高分子配列逆変換処理を実行し、
    ステップ7として、デコーダ(13)が、解読した配列/結合様式情報(12)を解析して受信データ(14)を生成し、あるいはさらに冗長化逆変換手段が冗長化逆変換処理を実行し、あるいはさらに復号化手段が復号化を実行し、
    受信データ出力部(15)から出力する
    ことを特徴とする情報通信方法。
  2. 書き込み側サブシステム(1a)と読み出し側サブシステム(2a)があり、
    書き込み側サブシステム(1a)において、
    ステップ1として、データ入力部(3a)が、書き込むデータ(4a)を入力し、あるいはさらに暗号化手段が暗号化を実行し、あるいはさらに冗長化手段が冗長化を実行し、
    ステップ2として、エンコーダ(5)が、書き込むデータ(4a)を、
    合成する高分子を構成する低分子の配列情報または結合様式情報(6)に変換し、あるいはさらに高分子配列変換手段が高分子配列変換を実行し、
    ステップ3として、合成装置(7)が、低分子を含有している生体高分子の材料(8)を原料にして、該配列情報または結合様式情報(6)どおりの合成高分子(9)を合成し、
    ステップ4として、該合成高分子(9)を、そのまま、または、人間以外の生物もしくは細胞もしくは生体高分子(10)の一部として組み込んで読み出し側サブシステム(2a)に渡し、
    さらに、読み出し側サブシステム(2a)において、
    ステップ5として、合成高分子(9)が人間以外の生物もしくは細胞もしくは生体高分子(10)に組み込まれている場合は該合成高分子(9)を取り出し、
    いずれの場合も、
    ステップ6として、配列読み取り装置(11)が、セットされた該合成高分子(9)を分析して、解読した配列/結合様式情報(12)を出力し、あるいはさらに高分子配列逆変換手段が高分子配列逆変換処理を実行し、
    ステップ7として、デコーダ(13)が、解読した配列/結合様式情報(12)を解析して読み出しデータ(14a)を生成し、あるいはさらに冗長化逆変換手段が冗長化逆変換処理を実行し、あるいはさらに復号化手段が復号化を実行し、データ出力部(15a)から出力する
    ことを特徴とする情報記録方法。
  3. 前記合成高分子(9)が蛋白質もしくはポリペプチド(polipeptide)であり、
    前記低分子がアミノ酸(amino acid)であり、
    前記配列情報または結合様式情報(6)がアミノ酸配列(amino acid sequence)であり、
    前記合成装置(7)がペプチド合成装置もしくはペプチドシンセサイザもしくは蛋白質合成装置であり、
    前記配列読み取り装置(11)がペプチドシーケンサもしくはプロテインシーケンサもしくはアミノ酸分析装置である、
    ことを特徴とする、
    請求項1に記載の情報通信方法、または、
    請求項2に記載の情報記録方法。
  4. 前記合成高分子(9)がDNAもしくはRNAもしくはポリヌクレオチド(polinucleotide)であり、
    前記低分子がヌクレオチド(nucleotide)であり、
    前記配列情報または結合様式情報(6)が塩基配列(base sequence または nucleotide sequence)であり、
    前記合成装置(7)がDNA合成装置もしくはDNAシンセサイザもしくは核酸合成装置であり、
    前記配列読み取り装置(11)がDNAシーケンサもしくは核酸シーケンサもしくは核酸分析装置である、
    ことを特徴とする、
    請求項1に記載の情報通信方法、または、
    請求項2に記載の情報記録方法。
  5. 請求項1に記載の情報通信方法または請求項2に記載の情報記録方法において、
    前記エンコーダ(5)は、
    請求項1においては送信するデータ(4)を、請求項2においては書き込むデータ(4a)を、先頭から順に最後まで2ビットごとに切ってサブデータ群に分割し、半端な1ビットが出れば0の値をもつダミーな1ビットを連結して2ビットとし、各サブデータのとりうる10進数で表現して0〜3である4種類の値をt、c、a、gもしくはu、c、a、gの4種類の塩基のいずれかとに1対1で対応させる変換規則に基づいて、逐次変換することによって塩基配列情報を得る、
    または、
    請求項1においては送信するデータ(4)を、請求項2においては書き込むデータ(4a)を、先頭から順に最後まで4ビットごとに切ってサブデータ群に分割し、半端な4ビット未満のデータが出れば0の値をもつダミーなビット列を連結して4ビットとし、各サブデータのとりうる10進数で表現して0〜15である16種類の値をA、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Yの20種類のうちの16種類のアミノ酸のいずれかとに1対1で対応させる変換規則に基づいて、逐次変換することによってアミノ酸配列情報を得る、
    または、
    請求項1においては送信するデータ(4)を、請求項2においては書き込むデータ(4a)を、先頭から順に最後まで一定数ビットごとに切ってサブデータ群に分割し、半端な該一定数ビット未満のサブデータが出れば0の値をもつダミーなビット列を連結して該一定数ビットとし、各サブデータを20進数表現による一定桁数の数字列に変換し、各数字のとりうる10進数で表現して0〜19である20種類の値をA、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Yの20種類のアミノ酸のいずれかとに1対1で対応させる変換規則に基づいて、逐次変換することによってアミノ酸配列情報を得る、
    ことを特徴とする情報通信方法もしくは情報記録方法。
  6. 請求項1に記載の情報通信方法または請求項2に記載の情報記録方法を実施するために、
    請求項1においては送信するデータ(4)を、請求項2においては書き込むデータ(4a)を、生体高分子の合成装置(7)への配列情報または結合様式情報(6)に変換するエンコーダ(5)。
  7. 請求項1に記載の情報通信方法または請求項2に記載の情報記録方法を実施するために、
    配列読み取り装置(11)の出力である、解読した配列/結合様式情報(12)を解析し、請求項1においては受信データ(14)を、請求項2においては読み出しデータ(14a)を出力するデコーダ(13)。
  8. コンピュータによって
    請求項1に記載の情報通信方法または請求項2に記載の情報記録方法を実施する
    ためのプログラムを記録した
    コンピュータ読み取り可能な媒体であって、
    該プログラムは、
    請求項1においては送信するデータ(4)を、請求項2においては書き込むデータ(4a)を、生体高分子の合成装置(7)への配列情報または結合様式情報(6)に変換させる
    ことを特徴とするエンコーダプログラムを記録した記録媒体。
  9. 情報処理システムで使用される情報伝送媒体であって、
    請求項1に記載の情報通信方法または請求項2に記載の情報記録方法を実施するために、
    請求項1においては送信するデータ(4)を、請求項2においては書き込むデータ(4a)を、生体高分子の合成装置(7)への配列情報または結合様式情報(6)に変換させるエンコーダプログラムを伝送する
    ことを特徴とする情報伝送媒体。
  10. コンピュータによって
    請求項1に記載の情報通信方法または請求項2に記載の情報記録方法を実施する
    ためのプログラムを記録した
    コンピュータ読み取り可能な媒体であって、
    該プログラムは、
    配列読み取り装置(11)の出力である、解読した配列/結合様式情報(12)を、解析させ、請求項1においては受信データ(14)を、請求項2においては読み出しデータ(14a)を出力させる
    ことを特徴とするデコーダプログラムを記録した記録媒体。
  11. 情報処理システムで使用される情報伝送媒体であって、
    請求項1に記載の情報通信方法または請求項2に記載の情報記録方法を実施するために、
    配列読み取り装置(11)の出力である、解読した配列/結合様式情報(12)を、解析させ、請求項1においては受信データ(14)を、請求項2においては読み出しデータ(14a)を出力させるデコーダプログラムを伝送する
    ことを特徴とする情報伝送媒体。
  12. 請求項1に記載の情報通信方法または請求項2に記載の情報記録方法
    によってデータが記録された
    ことを特徴とする人間以外の生物もしくは細胞もしくは生体高分子もしくは合成高分子。
JP2002302455A 2002-10-17 2002-10-17 生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ Expired - Lifetime JP4102157B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002302455A JP4102157B2 (ja) 2002-10-17 2002-10-17 生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002302455A JP4102157B2 (ja) 2002-10-17 2002-10-17 生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ

Publications (2)

Publication Number Publication Date
JP2003101485A JP2003101485A (ja) 2003-04-04
JP4102157B2 true JP4102157B2 (ja) 2008-06-18

Family

ID=19197350

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002302455A Expired - Lifetime JP4102157B2 (ja) 2002-10-17 2002-10-17 生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ

Country Status (1)

Country Link
JP (1) JP4102157B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100863266B1 (ko) * 2005-03-07 2008-10-15 가부시키가이샤 엔티티 도코모 분자통신시스템
WO2009013910A1 (ja) * 2007-07-24 2009-01-29 Keio University 符号化装置、復号化装置、及び情報記録媒体
WO2010086990A1 (ja) * 2009-01-29 2010-08-05 スパイバー株式会社 Dnaタグの構築方法
AU2013292709B2 (en) 2012-07-19 2017-04-13 President And Fellows Of Harvard College Methods of storing information using nucleic acids
JP6920275B2 (ja) * 2015-07-13 2021-08-18 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸を用いた回収可能な情報記憶のための方法

Also Published As

Publication number Publication date
JP2003101485A (ja) 2003-04-04

Similar Documents

Publication Publication Date Title
Anavy et al. Data storage in DNA with fewer synthesis cycles using composite DNA letters
Chen et al. An artificial chromosome for data storage
Erlich et al. DNA Fountain enables a robust and efficient storage architecture
Yazdi et al. Portable and error-free DNA-based data storage
Wang et al. High capacity DNA data storage with variable-length Oligonucleotides using repeat accumulate code and hybrid mapping
Ping et al. Carbon-based archiving: current progress and future prospects of DNA-based data storage
Organick et al. Scaling up DNA data storage and random access retrieval
Shomorony et al. Information-theoretic foundations of DNA data storage
TW201905691A (zh) 信息編碼和信息解碼的方法
Pan et al. Rewritable two-dimensional DNA-based data storage with machine learning reconstruction
Wang et al. Hidden addressing encoding for DNA storage
Ezekannagha et al. Design considerations for advancing data storage with synthetic DNA for long-term archiving
Akhmetov et al. A highly parallel strategy for storage of digital information in living cells
Mishra et al. Compressed DNA coding using minimum variance Huffman tree
JP4102157B2 (ja) 生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ
Wang et al. Oligo design with single primer binding site for high capacity DNA-based data storage
Zhang et al. A high storage density strategy for digital information based on synthetic DNA
WO2023240950A1 (zh) 基于dna分子介质的数据信息存储方法
Dimopoulou et al. Data and image storage on synthetic DNA: existing solutions and challenges
Gervasio et al. How close are we to storing data in DNA?
Wang et al. Mainstream encoding–decoding methods of DNA data storage
Sun et al. DNA and the digital data storage
Erlich et al. Capacity-approaching DNA storage
Wu et al. HD-code: End-to-end high density code for DNA storage
Wei et al. Dna storage: A promising large scale archival storage?

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050822

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080321

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4102157

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140328

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140328

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term