JP2003101485A - 生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ - Google Patents

生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ

Info

Publication number
JP2003101485A
JP2003101485A JP2002302455A JP2002302455A JP2003101485A JP 2003101485 A JP2003101485 A JP 2003101485A JP 2002302455 A JP2002302455 A JP 2002302455A JP 2002302455 A JP2002302455 A JP 2002302455A JP 2003101485 A JP2003101485 A JP 2003101485A
Authority
JP
Japan
Prior art keywords
information
sequence
data
synthesizer
polymer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002302455A
Other languages
English (en)
Other versions
JP4102157B2 (ja
Inventor
Masayuki Sonobe
正幸 園部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2002302455A priority Critical patent/JP4102157B2/ja
Publication of JP2003101485A publication Critical patent/JP2003101485A/ja
Application granted granted Critical
Publication of JP4102157B2 publication Critical patent/JP4102157B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】従来の情報通信方法と情報記録方法における、
規格の不安定性、媒体の劣化、そして、傍受の危険性の
三項目の問題点を解決し、従来にない超高密度な記録媒
体を実現する。 【解決手段】生体高分子を通信媒体もしくは記録媒体に
採用する。入力した送信するデータ4もしくは「書き込
むデータ」を、エンコーダ5が配列情報または結合様式
情報6に変換し、合成装置7が生体高分子の材料8を用
いて合成高分子9を作製する。配列読み取り装置11
が、該合成高分子9から解読した配列/結合様式情報1
2を出力し、デコーダ13が受信データ14もしくは
「読み出しデータ」に復元して出力する。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】
【0002】本発明は、生体高分子を通信媒体もしくは
記録媒体とした、情報記録方法、情報通信方法、エンコ
ーダおよびデコーダに関するものである。
【0003】
【従来の技術】まず、通信には「搬送」と「記録」の二
面があることを確認する。
【0004】現在「通信」といえば、送信機器から受信
機器に電流あるいは電磁波を用いてデータをリアルタイ
ムに伝送できる電気通信がすぐ頭に浮かぶ。
【0005】たしかに、電気通信、光通信は、通信媒体
を電気、光に変えたことによって「搬送」時間を著しく
短かくすることができた。
【0006】しかし、狼煙(のろし)のような例外を除
けば、送信者の送信時間に受信者が受信できるとは限ら
ない。
【0007】送受信の時間差を埋めるために、情報を書
き込んでおいてあとで読み出すための「記録」媒体が必
要なこともたしかである。
【0008】たとえば、電報は郵便局間で伝送されたあ
と、紙に印刷される。
【0009】電子メールも受信者が読むまで、通常、磁
気ディスクやICメモリに記録される。
【0010】マスメディアのテレビでさえ、録画から放
送までの間、ビデオテープ、あるいはハードディスクに
記録される。
【0011】このように、通信には、搬送系とともに、
記録系が重要である。
【0012】最近、搬送系を電子化する通信は大きく発
展して、携帯電話とパソコンを使った電子メールが非常
に普及した。
【0013】一方、搬送系を電子化しないで紙などの記
録媒体を物理的に搬送する通信では、郵便が依然として
広く使われている。
【0014】が、この分野でも、送信者の入力から搬送
までを電子化して、郵便局で紙に印刷して配達する「ハ
イブリッドめ〜る(郵政事業庁サービス名)」が実用化
されている。 (参考文献「郵政事業庁:ハイブリッドめ〜る」http:/
/www1.hybridmail.go.jp/cgi-bin/a50709101d.cgi)。
【0015】将来は、公衆自動搬送システム(CAT
S)によるドア・ツー・ドアの搬送が登場して、物理的
搬送が一層高速化することも期待される(特許公開2000
-357194「公衆自動搬送システム」(発明者=園部正
幸)。 (参考文献「園部 正幸:21世紀情報化社会の新基盤
となる、公衆自動搬送システム CATS」http://sono
be.s5.xrea.com/invention/cats/shibuya_paper/index.
htmlおよび、「園部 正幸:CATS特許出願 1」htt
p://sonobe.s5.xrea.com/invention/cats/catspat2000_
1/index.html)。
【0016】以上、通信には搬送と記録の二面があるこ
とを確認した。
【0017】通信に搬送と記録の二面があることから、
通信方法の改良には、上記のような搬送系の改良だけで
なく、記録系の改良も必要であることが分かる。
【0018】本願発明は、記録系の改良を行う。
【0019】即時ではなく時間差をもってデータを未来
の人や未来の自分自身に受け渡す必要があるときには、
情報記録媒体を用いて通信することになる。
【0020】印刷物よりも安定し高密度な情報記録媒体
として、たとえば、コンパクトディスク(CD)、光磁
気ディスク(MO)、デジタルビデオディスク(DV
D)が現在よく使われているがそのほかにも種々存在す
る。
【0021】たとえば、DVDを読み書きが可能にする
規格にしても、DVD−R、DVD−RW、DVD+
R、DVD+RW、DVD−RAMなど多数が林立して
いる。 (参考文献「@nifty:DVD+RWアライアンス
高速DVD記録規格を発表」http://newsflash.nift
y.com/news/td/new/2002081906.htm)。
【0022】規格が多いだけにそれぞれの生き残りは難
しくなってくる。
【0023】また、こうした記録媒体には、媒体寿命が
数百年と宣伝されているものもあるが、本当にそれほど
耐久性があるのかという疑問の声もある。 (参考文献「梅原 敦:これからのイメージを中心とす
る電子記録媒体の方向を探る」http://www.ndf.co.jp/w
hatsnew/tips2/tips2.html)。
【0024】しかも、記録密度を向上する技術進歩が早
いため、メジャーをとった規格も年々時代遅れとなり、
新しく登場する規格に取って代わられることになる。
【0025】以上が、従来の技術の概観である。
【0026】
【発明が解決しようとする課題】長い時間がかかっても
よい通信、あるいは、長い時間がかかってしまう超長時
間通信においては、第一に、情報通信、情報記録に関す
る規格の不安定性が問題になる。
【0027】たとえば、子孫の世代に自分達の日記をは
じめ、写真、映像、プログラムなど著作物の情報を伝え
ようとする人は、今後増えていくと思われる。
【0028】しかし、現在用いられているCD、MO、
DVDの規格が何十年、何百年、何千年にもわたって安
定して使用されるかどうかは疑わしい。
【0029】現在の規格を維持する企業・機関が存続し
ている保証もない。
【0030】したがって、年月を経て、記録媒体を読む
装置が存在しなくなり、記録媒体を読む装置を再現しよ
うにも、装置の設計仕様の情報も散逸して製作できな
い、という事態が予想される。
【0031】第二に、媒体の物理的および化学的な不安
定性にも問題がある。
【0032】年月が経てば、無生物の記録媒体は自然に
劣化、変形、変性、あるいは情報消滅してしまうのがふ
つうである。
【0033】このため、たとえば磁気テープの場合、数
年ごとに情報を読み直して別の媒体に書き直す作業が必
要とされている。
【0034】経年変化に強い材料と、年月を経て自然に
戻る「地球に優しい」材料とは、両立が難しい。
【0035】記録媒体を宇宙空間で搬送する場合にも、
地球上には降り注がない強い宇宙線を直接浴びるため
に、媒体が劣化してしまう。
【0036】散逸、消滅、あるいは劣化に備えて、媒体
のコピーを何部も作成して保管し渡す方法もあるが、長
期間に渡ってコピーを繰り返し行うのは、媒体の調達と
コピー作業の実施が煩雑である。
【0037】第三に、短時間に通信する場合でも、イン
ターネット経由で標準的な規格で情報を伝送するような
ことをすれば、媒体も通信方式も広く普及しているもの
であるために、第三者に比較的容易に傍受・解読されて
しまう。
【0038】本発明の目的は、以上述べたような、規格
の不安定性、媒体の劣化、傍受の危険性の三項目の問題
点を克服して、より安定性に優れた情報通信方法と情報
記録方法とエンコーダとデコーダを提供することであ
る。
【0039】本明細書における生物学上の用語、塩基符
号、およびアミノ酸符号は、次の文献に基づいている: Benjamin Lewin: Genes VI, Oxford University Press
and Cell Press (1977)=[邦訳] 菊池 韶彦ら訳:遺
伝子 第6版、東京化学同人(1999)。
【0040】
【課題を解決するための手段】本発明は、安定性に優れ
た通信と記録を実現するため、データを生体高分子の配
列かつ/または結合様式に置き直して記録することを、
主要な特徴とする。
【0041】生物の細胞に含まれている大きな分子すな
わち高分子は、小さい分子すなわち低分子がつながって
いるものである。生体高分子には、(ア) 「t、c、
a、g」もしくは「u、c、a、g」の4種類のヌクレ
オチドからなるDNAもしくはRNAもしくはポリヌク
レオチドと、(イ) 「A、C、D、E、F、G、H、
I、K、L、M、N、P、Q、R、S、T、V、W、
Y」の20種類のアミノ酸からなる蛋白質もしくはポリ
ペプチドと、(ウ) (高等生物で「Man、Glc、
Gal、Xyl、GlcA、GlcNAc、GalNA
c、Fuc、SA」の9種類の)単糖からなる多糖もし
くは糖鎖と、(エ) 脂肪酸からなる脂質がある。 (糖鎖の参考文献「庄司 真理子ほか:特集:第三の生
命鎖糖鎖とポストゲノム解析」http://www.nistep.go.j
p/achiev/ftx/jpn/stfc/stt010j/feature2.html、「成
松 久:細胞内で糖鎖はどのように合成されるのか?」h
ttp://www.aist.go.jp/aist_j/aistinfo/aist_today/vo
l01_05/vol01_5_p18_24.pdf)
【0042】こうした低分子を要素とするコード(cod
e)は、生物がきわめて長期間採用してきたもので、今
後数千年程度で自然に変化するものではないと考えられ
る。
【0043】配列情報を与えて生体高分子を合成、解読
する方法はすでに知られていて、それぞれ自動装置が市
販されている。
【0044】たとえば、 (ア) DNAの合成に関しては、特許出願平4-65839
「DNA等自動合成装置」(出願人=島津製作所)の実
施例で、ホスホトリエステル法によりDNAを自動合成
する。
【0045】(イ) DNAの解読に関しては、特許第
2559621号「DNAパターン読み取り装置及びDNAパ
ターン読み取り方法」(出願人=日立ソフトウェアエン
ジニアリング)で、DNAから「A、C、G、T」の符
号を読み取る。
【0046】(ウ) ポリペプチドの合成に関しては、
特許出願平4-69640「自動化ポリペプチド合成装置」
(出願人=アプライド バイオシステムズ インコーポ
レーテッド)で、保護されたアミノ酸を1種類ずつ受取
って活性化し、所望の順序に配列されたポリペプチドを
作る。
【0047】(エ) ポリペプチドの解読に関しては、
特許公開平08-304375「タンパク質のアミノ酸配列決定
装置」(出願人=島津製作所)で、エドマン法により得
られたデータから蛋白質もしくはポリペプチドのアミノ
酸配列を決定する。
【0048】以上のように、配列と生体高分子の相互変
換は既に可能である。
【0049】本発明では、任意のデータを高分子のコー
ドに変換するエンコーダと、高分子のコードから元のデ
ータに復元するデコーダを新規作成することにより、生
体高分子を情報通信媒体もしくは情報記録媒体として用
いることを可能とする。
【0050】
【発明の実施の形態】図1は、請求項1に対応する実施
例1の構成ブロック図である。
【0051】同図は、生体高分子を通信媒体にした情報
通信方法の原理構成を示すブロック図である。
【0052】以下、図1の構成を説明する。
【0053】図1において、全体システムは、送信者の
用いる送信者側サブシステム1と受信者の用いる受信者
側サブシステム2を含んでいる。ふたつのサブシステム
の間に、情報通信媒体として、合成高分子9または合成
高分子9を内包する「生物もしくは細胞もしくは生体高
分子10」がある。
【0054】送信者側サブシステム1と受信者側サブシ
ステム2はきわめて対称的な内部構造をしている。
【0055】人もしくは情報システムとデータをやりと
りする送信データ入力部3と受信データ出力部15がそ
れぞれある。
【0056】送信するデータ4を高分子の「配列情報ま
たは結合様式情報6」に変換するエンコーダ5と、「解
読した配列/結合様式情報12」に逆変換するデコーダ
13がそれぞれある。
【0057】合成装置7と配列読み取り装置11がそれ
ぞれある。
【0058】合成装置7には生体高分子の材料8が容器
から供給される。
【0059】以上、図1の構成を説明した。
【0060】図2は、請求項2に対応する実施例2の構
成ブロック図である。
【0061】同図は、生体高分子を記録媒体にした、情
報記録方法の原理構成を示すブロック図である。
【0062】図2は目的は図1とやや異なるが、構成は
図1と類似している。同一でないが対応する構成要素
は、符号の末尾に「a」を付して示す。
【0063】以下、図2の構成を説明する。
【0064】図2において、全体システムは、書き込み
側サブシステム1aと読み出し側サブシステム2aを含
んでいる。ふたつのサブシステムの間に、情報記録媒体
として、合成高分子9または合成高分子9を内包する
「生物もしくは細胞もしくは生体高分子10」がある。
【0065】書き込み側サブシステム1aと読み出し側
サブシステム2aはきわめて対称的な内部構造をしてい
る。
【0066】人もしくは情報システムとデータをやりと
りするデータ入力部3aとデータ出力部15aがそれぞ
れある。
【0067】書き込むデータ4aを高分子の「配列情報
または結合様式情報6」に変換するエンコーダ5と、
「解読した配列/結合様式情報12」に逆変換するデコ
ーダ13がそれぞれある。
【0068】合成装置7と配列読み取り装置11がそれ
ぞれある。
【0069】合成装置7には生体高分子の材料8が容器
から供給される。
【0070】以上、図2の構成を説明した。
【0071】以下に、請求項1に対応する実施例1の作
用を順に説明し、構成要素間の有機的関係を示す。
【0072】前半は、送信者側サブシステム1における
作用である。
【0073】ステップ1として、送信データ入力部3
が、送信するデータ4を、人または情報システムから入
力する。
【0074】送信データ入力部3の例は、キーボード、
受信装置、音声入力装置、画像入力装置、A/Dコンバ
ータ、アプリケーションプログラムからの伝達、また
は、別の記録媒体からの読み取り装置を含む。
【0075】ステップ1につづき、図にない「データ圧
縮手段」が、該送信するデータ4をより少ないビット数
に圧縮してもよい。
【0076】ステップ1につづき、図にない「暗号化手
段」が、キーを知らない第三者による傍受・解読を防ぐ
ために、人または情報システムが入力したキーを用い
て、該送信するデータ4を暗号化してもよい。
【0077】ステップ1につづき、図にない「冗長化手
段」が、通信あるいは記録におけるデータの誤りを検出
もしくは訂正できるように、該送信するデータ4を冗長
化してもよい。
【0078】冗長化の例として、 (ア) パリティあるいは誤り訂正符号 (Error Corre
cting Code, ECC) を付してもよい。また、RAID
(Redundant Arrays of Inexpensive Disks)技術を応
用して、複数の媒体すなわち合成高分子にわたる情報の
間でパリティを形成させてもよい。(RAIDの参考文
献「株式会社バイオス:RAIDとは?」http://www.b
ios.co.jp/TechInfo/TechInfo_1.htm)
【0079】(イ) 読み出しのときに同期をとるため
のプリアンブル(preamble)と呼ばれるビット列を付し
てもよい。
【0080】(ウ) ブロックの抜けまたは重複または
順序の入れ替わりを検出するために、ブロック一連番号
を振ってもよい。
【0081】(エ) ブロックの長さを決まった形式で
付してもよい。
【0082】(オ) ブロックより大きな塊の単位をさ
らにブロックのように扱ってもよい。
【0083】(カ) 可読性を向上するために、改行、
キャリッジリターン、タブ、空白、引用符、または、先
頭からのバイト単位等のロケーションを付してもよい。
これらのチェックは誤りの検出に役立つ。
【0084】(キ) データ全体もしくはブロック等の
部分に、エンコードした時刻を付してもよい。時刻のチ
ェックは誤りの検出に役立つ。
【0085】これらはいずれも冗長化を起こす。
【0086】ステップ2として、エンコーダ5が、送信
するデータ4を、合成する高分子を構成する「低分子」
の「配列情報または結合様式情報6」に変換する。
【0087】配列情報または結合様式情報6は、合成高
分子が核酸系の場合は、塩基配列であり、合成高分子が
ペプチド系の場合は、アミノ酸配列であり、合成高分子
が多糖系の場合は、単糖配列および結合様式情報であ
る。
【0088】ステップ2につづき、図にない「高分子配
列変換手段」が、生物学的機能を付加するために、また
は、安定性を付加するために、該配列情報または結合様
式情報6に置換または挿入を加える変換を行ってもよ
い。
【0089】高分子配列変換の例として、次のものがあ
る: (ア) 突然変異あるいは生殖あるいは増幅によって
変異しやすい配列を避けて他のコードに変換すること、
(イ) テロメア配列など生体で特定の機能が生じるな
どの意味をもつ配列を避けて他のコードに変換するこ
と、(ウ) プロモータ配列など遺伝子先頭配列を付加
すること、(エ) プロモータ配列など遺伝子先頭配列
を避けて他のコードに変換すること、(オ) 翻訳終
了、poly(A)など遺伝子末端配列を付加するこ
と、(カ) 翻訳終了、poly(A)など遺伝子末端
配列を避けて他のコードに変換すること、(キ) 生物
の3文字の塩基(codon)では、cgu、 cgc、cg
a、cggがすべてアルギニンである例のように、最後
の1文字が変異しても意味が変わらないことが多いこと
に習い、3文字のコドンの先頭2文字のみに、送信デー
タをエンコードし、最後の1文字は冗長な値にするこ
と、(ク) 生物化学的検出を容易にするため標識コー
ドをつけること。
【0090】ステップ3として、合成装置7が、「低分
子」を含有している「生体高分子の材料8」を原料にし
て、該配列または該結合様式をもつ合成高分子9を合成
する。
【0091】合成装置7は、合成高分子がペプチド系の
場合は、ペプチド合成装置もしくはペプチドシンセサイ
ザもしくは蛋白質合成装置であり、合成高分子が核酸系
の場合は、DNA合成装置もしくはDNAシンセサイザ
もしくは核酸合成装置である。
【0092】それぞれすでに市販の装置があるが、さら
にエンコーダ5とオンライン接続させることにより、効
率が向上する。
【0093】ステップ4として、該合成高分子9を、そ
のまま、受信者の用いる受信者側サブシステム2に渡す
か、または、該合成高分子9を、「生物もしくは細胞も
しくは生体高分子10」の一部として組み込んでから、
受信者側サブシステム2に渡す。
【0094】渡し方は、直接も環境経由もありうる。
【0095】ここで、高分子を生物もしくは細胞もしく
は他の高分子に組み込む公知技術は多く、今後も大きな
発展が予想されている:
【0096】(ア) 単一鎖のDNAを合成したあと、
塩基を相補的に結合させることで二重鎖DNAにして安
定化させることができる。
【0097】(イ) RNAを合成したあと、相補的な
塩基からなるDNAに変換することができる。
【0098】(ウ) DNAを合成して、環状DNAに
組み込むことができる。
【0099】(エ) 進化、変異の影響を受けにくいよ
うに、情報を、健全な生命維持もしくは生殖に必要な遺
伝子のコードの一部に、該遺伝子の機能を損なわないよ
うに組み入れることにより、変異すると個体が致死とな
るようにする、という戦略も考えられる。
【0100】これら生体高分子は、品質をほとんど損な
わずに冷凍保存することが可能である。
【0101】これら生体高分子は、生物、細胞、DN
A、RNA、あるいは、遺伝子に組み込んで、生物を生
かしたままもしくは死体でもしくは冷凍してもしくは樹
脂、琥珀(こはく=樹脂の化石)、プラスチック、ガラ
ス、その他の物質に封入して、安定した環境で保存する
ことができる。
【0102】高分子を組み込んだ生物が生命・種族を保
存しようと自律的に生きてくれることは、従来の通信媒
体や記録媒体と違って、媒体保存の手間が省ける面があ
って有利である。
【0103】生体高分子を増幅させ、あるいは生物を繁
殖させ、あるいはクローン生物を作り、あるいはDNA
組み換え生物に蛋白質を生産させることによって、情報
のコピーを増やして通信の確実性を上げることができ
る。
【0104】後半は、受信者側サブシステム2における
作用である。
【0105】受信者は、該生物もしくは細胞もしくは生
体高分子10を入手する。
【0106】受信者は送信者自身であってもよい。
【0107】もし、受信者が該生物もしくは細胞もしく
は生体高分子10を入手する前に、該合成高分子9が生
体高分子相互間の生物学的な変換を受けたために、同一
もしくはほぼ同一の情報を包含したまま、情報媒体とし
ての生体高分子が入れかわった場合は、変化後の生物も
しくは細胞もしくは生体高分子を受信者が入手し、以後
記載される「合成高分子9」として扱う。
【0108】たとえば生殖の際におこる染色体の交差に
より、DNAに埋め込んだ情報が変わってしまうことが
ある。
【0109】また、染色体の複製に伴うエラー、放射
線、化学物質の影響で突然変異が起こることがある。
【0110】こうした情報の変化は、解読時に処理す
る。
【0111】特に、情報が、多くの高分子もしくは細胞
もしくは生物に伝播してそれぞれが変異した可能性をも
った場合には、複数のサンプルから得た情報を比較する
ことで、送信データを推定する。
【0112】たとえば、多数のサンプルが変異を含む場
合、それらのサンプルから共通部分を取り出してつなぎ
合わせ、再構成すればよい。
【0113】前記再構成を容易にするためには、冗長化
で述べたブロック化とブロック一連番号の付加が有効で
ある。
【0114】なぜなら、解読された多数のサンプルの情
報を、ブロックに切って、ブロック番号の一致するもの
を比較することにより、変異のビット位置まで正確に比
較できるからである。
【0115】また、各ブロックにパリティなどのエラー
検出コードを付けておけば、変異のあったブロックを判
定して捨てることができる。
【0116】ステップ5として、合成高分子9が生物も
しくは細胞もしくは生体高分子10に組み込まれている
場合は該合成高分子9を取り出す。
【0117】いずれの場合も、ステップ6として、配列
読み取り装置11が、セットされた該合成高分子9を分
析して、構成分子の、「解読した配列/結合様式情報1
2」を出力する。
【0118】配列読み取り装置11は、合成高分子がペ
プチド系の場合は、ペプチドシーケンサもしくはプロテ
インシーケンサもしくはアミノ酸分析装置である、合成
高分子が核酸系の場合は、DNAシーケンサもしくは核
酸シーケンサもしくは核酸分析装置である、
【0119】それぞれすでに市販の装置があるが、さら
にデコーダ13とオンライン接続させることにより、効
率が向上する。
【0120】送信時に高分子配列変換が行われていた場
合には、ステップ6につづき、図にない「高分子配列逆
変換手段」が、該「配列情報または結合様式情報6」か
ら、生物学的機能を付加するため、または、安定性を付
加するために行われた置換もしくは挿入を元に戻す高分
子配列逆変換処理を実行する。
【0121】ステップ7として、デコーダ13が、該配
列情報または結合様式情報6を解析して受信データ14
を生成し、受信データ出力部15から出力する
【0122】送信時に冗長化が行われていた場合は、ス
テップ7につづき、図にない「冗長化復号化手段」が、
キーを用いて、該受信データ14から余計なデータを除
き、あるいはエラーを検出しあるいはエラーを訂正して
元のデータに戻す冗長化逆変換処理を実行する。
【0123】送信時に暗号化が行われていた場合は、ス
テップ7につづき、図にない「復号化手段」が、キーを
用いて、該受信データ14を元のデータに戻す復号化を
実行する。
【0124】送信時にデータ圧縮が行われていた場合
は、ステップ7につづき、図にない「データ伸長手段」
が、該受信データ14を元のデータに戻すデータ伸長を
実行する。
【0125】受信データ出力部15の例は、ディスプレ
イ、プリンタ、送信装置、音声出力装置、D/Aコンバ
ータ、アプリケーションプログラムへの伝達、または、
別の記録媒体への書き込み装置である。
【0126】以上、実施例1の作用を順に説明し、構成
要素間の有機的関係を示した。
【0127】次に、請求項2に対応する実施例2の作用
に関して触れる。
【0128】実施例2は実施例1と構成が対称的に対応
している。
【0129】そこで、実施例2の各符号の末尾に「a」
があるものは取って読み替えることにより、前記の実施
例1の作用をもとに実施例2の作用が理解できる。
【0130】本願発明を、ポリペプチドを利用して実施
する場合は、前記合成高分子9が「蛋白質もしくはポリ
ペプチド(polipeptide)」であり、前記「低分子」が
グルタミン(Glutamine、符号G)などアミノ酸(amino
acid)であり、前記「配列情報または結合様式情報
6」がアミノ酸配列(amino acid sequence)であり、
前記合成装置7がペプチド合成装置もしくはペプチドシ
ンセサイザもしくは蛋白質合成装置であり、前記配列読
み取り装置11がペプチドシーケンサもしくはプロテイ
ンシーケンサもしくはアミノ酸分析装置である(請求項
3)。
【0131】また、本願発明を、核酸を利用して実施す
る場合は、前記合成高分子9が「DNAもしくはRNA
もしくはポリヌクレオチド(polinucleotide)」であ
り、前記「低分子」が、アデニン(adenine、符号a)
などヌクレオチド(nucleotide)であり、前記「配列情
報または結合様式情報6」がヌクレオチドの塩基配列
(base sequence または nucleotide sequence)であ
り、前記合成装置7がDNA合成装置もしくはDNAシ
ンセサイザもしくは核酸合成装置であり、前記配列読み
取り装置11がDNAシーケンサもしくは核酸シーケン
サもしくは核酸分析装置である(請求項4)。
【0132】前記エンコーダ5は、送信するデータを2
ビットずつ分割した、各2ビットからなる0〜3の値を
「t、c、a、g」もしくは「u、c、a、g」の4種
類の塩基に対応付けることができる。また、エンコーダ
5は、送信するデータを4ビットずつ分割した、各4ビ
ットからなる0〜(10進数表現で)15の値を「A、
C、D、E、F、G、H、I、K、L、M、N、P、
Q、R、S、T、V、W、Y」の20種類のうちの16
種類のアミノ酸に対応付けることができる。一方、エン
コーダ5は、送信する送信するデータを一定の長さずつ
分割した各分割結果を一定桁数の20進数と見なすこと
により各桁の「数字」になる各0〜(10進数表現で)
19の値を「A、C、D、E、F、G、H、I、K、
L、M、N、P、Q、R、S、T、V、W、Y」の20
種類のアミノ酸に対応付けることもできる(請求項
5)。
【0133】送信するデータを1ビット、2ビットまた
は3ビットずつに分割して、アミノ酸のうちのそれぞれ
2種類、4種類、8種類だけに対応付けることもできる
が、記録効率の上では前記の4ビットに対応づける方が
明らかに有利である。
【0134】また、送信するデータを2〜19進数と見
なし、アミノ酸のうちのそれぞれ2〜19種類だけに対
応付けることもできるが、記録効率の上では前記の20
進数のほうが明らかに有利である。
【0135】以下に,エンコーダの処理手順を,自然言
語を入れた構造化プログラム記述法である「擬似コード
(pseudo code)」で記す。
【0136】凡例/ リストとは,0, 1, 2, …という添
字で指定して読み書きできるデータ構造である.リスト
内のデータは,添字の若い順に左から並んでいるとす
る.変数名直後でない'{'と'}'は,囲まれた部分が処理
の範囲であると明示する.
【0137】a. エンコーダのメインプログラム a.0 開始. a.1 塩基配列への変換を行うなら,{ 塩基配列変換ルーチン(plain2bp)を実行してくる. } a.2 アミノ酸配列への変換を行うなら,{ アミノ酸配列変換ルーチン(plain2aa)を実行してくる. } a.3 停止する. a.4 記述終了.
【0138】b. 塩基配列変換ルーチン(plain2bp) b.0 開始. b.1 リストbin2bpに ('a', 'g', 'c', 't') をセットし
ておく. (すなわち,たとえば,bin2bp[0]なら値'a', bin2bp
[3]なら値't'を得られる.) b.2 入力ファイルから1行ずつ入力して各行について { b.3 行の中を1文字ずつに分解して,リストcharsにセッ
トする. b.4 リストcharsの中の各文字について { b.5 変数bit76に,該文字と16進c0の論理積をとり16進4
0で除した値を入れる. なお,値は,0〜3となる. b.6 変数seq0に,bin2bp[bit76]を入れる. なお,値は,bit76が0だったときは'a',また,3だった
ときは't'などとなる. b.7 変数bit54に,該文字と16進30の論理積をとり16進1
0で除した値を入れる. b.8 変数seq1に,bin2bp[bit54]を入れる. b.9 変数bit32に,該文字と16進0cの論理積をとり16進0
4で除した値を入れる. b.10 変数seq2に,bin2bp[bit32]を入れる. b.11 変数bit10に,該文字と16進03の論理積をとり16進
01で除した値を入れる. なお,01で除さなくてもよい. b.12 変数seq3に,bin2bp[bit10]を入れる. b.13 変数seq0と変数seq1と変数seq2と変数seq3をこの
順序に並べたものを出力する. なお,出力は,8ビットの1文字の入力に対して,4文字
の'atcg'などとなる. b.14 } b.15 } b.16 戻る. b.17 記述終了.
【0139】c. アミノ酸配列変換ルーチン(plain2aa) c.0 開始. c.1 リストbin2aaに ('A', 'C', 'D', 'E', 'F', 'G',
'H', 'I', 'K', 'L','M', 'N', 'P', 'Q', 'R', 'S',
) をセットしておく. (すなわち,たとえば,bin2aa[0]なら値'A', bin2bp[1
5]なら値'S'を得られる.) c.2 入力ファイルから1行ずつ入力して各行について { c.3 行の中を1文字ずつに分解して,リストcharsにセッ
トする. c.4 リストcharsの中の各文字について { c.5 変数bit7654に,該文字と16進f0の論理積をとり16
進10で除した値を入れる. なお,値は,0〜10進15となる. c.6 変数seq0に,bin2aa[bit7654]を入れる. なお,値は,bit7654が0だったときは'A',また,15だっ
たときは'S'などとなる. c.7 変数bit3210に,該文字と16進0fの論理積をとり16
進01で除した値を入れる. なお,01で除さなくてもよい. c.8 変数seq1に,bin2aa[bit3210]を入れる. c.9 変数seq0と変数seq1をこの順序に並べたものを出力
する. なお,出力は,8ビットの1文字の入力に対して,2文字
の'AS'などとなる. c.10 } c.11 } c.12 戻る. c.13 記述終了.
【0140】以上、エンコーダの処理手順を記した。
【0141】以下に、デコーダの処理手順を,擬似コー
ドで記す。
【0142】凡例/ 連想リストとは,キー文字列で検
索できるデータ構造である.
【0143】d. デコーダのメインプログラム d.0 開始. d.1 塩基配列を入力する変換を行うなら,{ 塩基配列逆変換ルーチン(bp2plain)を実行してくる. } d.2 アミノ酸配列を入力する変換を行うなら,{ アミノ酸配列逆変換ルーチン(aa2plain)を実行してく
る. } d.3 停止する. d.4 記述終了.
【0144】e. 塩基配列逆変換ルーチン(bp2plain) e.0 開始. e.1 連想リストbp2binに('a', 0, 'g', 1, 'c', 2, '
t', 3)をセットしておく. (すなわち,たとえば,bp2bin{'a'}なら値0を,bp2bi
n{'t'}なら値3を得られる.) e.2 入力ファイルの全文字を入力し, e.3 その中を1文字ずつに分解して,リストcharsにセッ
トする. e.4 リストcharsの中の各文字について変数the_charに
セットし { e.5 変数the_binに,変数the_charをキーで連想リストb
p2binを検索した結果をセットする. (すなわち,たとえば,the_charが't'ならthe_binは値
3となる.) e.6 変数the_binを引数として渡して,push_bitルーチ
ンを実行してくる. e.7 } e.8 戻る. e.9 記述終了.
【0145】f. push_bitルーチン f.0 開始. f.1 変数push_counterに1を加える. f.2 もし変数push_counterを4で割った余りが0なら { f.3 変数decimalに, stack[0]×16進40+stack[1]×16進10+stack[2]×16進
04+the_binをセットする. f.4 変数decimalを符号付きの1バイトのバイナリデータ
に変換(packという)して出力する. f.5 リストstackをクリアする. f.6 } さもなければ { f.7 引数として受け取ったthe_binを,リストのいちば
ん右に追加するとともに,その前に,リストにセットさ
れていたデータ要素をひとつずつ左にシフトする. f.8 } f.9 戻る. f.10 記述終了.
【0146】g. アミノ酸配列逆変換ルーチン(aa2plai
n) g.0 開始. g.1 連想リストaa2binに ('A', 0, 'C', 1, 'D', 2, 'E', 3, 'F', 4,'G',
5, 'H', 6, 'I', 7, 'K', 8, 'L', 9,'M', 10, '
N', 11, 'P', 12, 'Q', 13, 'R', 14,'S', 15) をセットしておく. (すなわち,たとえば,aa2bin{'A'}なら値0を,aa2bin
{'S'}なら値15を得られる.) g.2 入力ファイルの全文字を入力し, g.3 その中を1文字ずつに分解して,リストcharsにセッ
トする. g.4 リストcharsの中の各文字について変数the_charに
セットし { g.5 変数the_binに,変数the_charをキーで連想リストa
a2binを検索した結果をセットする. (すなわち,たとえば,the_charが'S'ならthe_binは値
10進15となる.) g.6 変数the_binを引数として渡して,push_bitBルーチ
ンを実行してくる. g.7 } g.8 戻る. g.9 記述終了.
【0147】h. push_bitBルーチン h.0 開始. h.1 変数push_counterに1を加える. h.2 もし変数push_counterを2で割った余りが0なら { h.3 変数decimalに, stack[0]×16進10+the_bin をセットする. h.4 変数decimalを符号付きの1バイトのバイナリデータ
に変換(packという) して出力する. h.5 リストstackをクリアする. h.6 } さもなければ { h.7 引数として受け取ったthe_binを,リストのいちば
ん右に追加するとともに,その前に,リストにセットさ
れていたデータ要素をひとつずつ左にシフトする. h.8 } h.9 戻る. h.10 記述終了.
【0148】以上、デコーダの処理手順を記した。
【0149】以下に、20進数に対応づける処理(請求項
5に記載)を説明する。
【0150】まず、10進数は,数すなわちデータを「0,
1,2,3,4,5,6,7,8,9」の9種の数字で表現している。
【0151】16進数は、数を「0,1,2,3,4,5,6,7,8,9,A,
B,C,D,E,F」の16種の「拡張された数字」で表現してい
る。
【0152】これらと同様に、20進数は、数を20種の
「拡張された数字」を用いて表現できる。
【0153】いま、地球生命のアミノ酸の種類「A,C,D,
E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y」と対応づけると
する。
【0154】すると、任意のデータは、20で除する演算
により、20進表現に変換できるので,アミノ酸配列に変
換できる。
【0155】逆に、アミノ酸配列は、これを20進数とみ
なして20を乗ずる演算により、データに戻すことができ
る。
【0156】上記20進数の変換処理と逆変換処理は、広
く行われている16進数の処理と同様であるので詳述しな
い。
【0157】いま、送信するデータを64ビットで区切る
とする。
【0158】もし4ビットをアミノ酸1文字に対応づける
方式を採用すれば、64/4=16個のアミノ酸が必要になっ
てしまう。
【0159】ところが、264 ≒ 1.84×1019 は,2015
≒ 3.28×1019よりも小さいので、20進数の「数字」に
対応づける方式を採用すれば、64ビットを表現するのに
15個のアミノ酸しか要らず、4ビット方式より1個少なく
て済む。
【0160】 たとえば,64ビットの2進数 0000000000 0000000000 0000000000 0000000000 0000000000 0000000000 0001 は,4ビット方式では, AAAAAAAAAA AAAAAC であるが,20進数方式では, AAAAAAAAAA AAAAC となる.ここに,各データの中で,空白は,読解性を助
けるだけのものである.
【0161】このように、20種類のアミノ酸を全部活用
することにより、演算はより複雑となるが、高分子の長
さをより小さくすることができる。
【0162】以上、20進数に対応づける処理を説明し
た。
【0163】ここで、以下に、処理例を二例示す。
【0164】図3は、エンコーダとデコーダの処理例1
であり、前記エンコーダ5とデコーダ13を作成して実
験した結果を示す。
【0165】図3の各データの中で、空白は、読解性を
助けるだけのものである。
【0166】図3の各データの中で、斜体文字で示した
部分は、理解を助けるために、元の「ll」(エル・エ
ル)の2文字がどう変形していくか、対応部分を追跡し
て表示したものである。
【0167】エンコーダに、送信するデータ4として、
図3(a)のデータを与えた。
【0168】該データをASCIIコード文字、16進
数、2進数の3通りで表現したものが、それぞれ、図3
の(a)、(b)および(c)である。
【0169】エンコーダ5に該データを入力して塩基配
列情報を出力させると、図3(d)が得られた。
【0170】本塩基配列情報は「t、c、a、g」だけ
からなるので、合成装置7が読み取ることができる形式
である。
【0171】合成装置7がこの塩基配列をもつDNAな
どの合成高分子9を作り、該合成高分子9を配列読み取
り装置11が読み取ると、解読した配列/結合様式情報
12がデコーダ13に渡る。もし情報が誤りなく伝わる
ならば、該解読した配列/結合様式情報12は、図3
(d)の塩基配列そのものである。
【0172】そこで、実験では、図3(d)をデコーダ
13に入力した。その結果は、図3(f)または(g)
または(h)で表現されるものであり、それぞれ、図3
(c)、(b)、(a)に一致した。
【0173】したがって、本実験データで、情報通信あ
るいは情報記録は正しく行われる。
【0174】上の説明は塩基配列の場合であったが、ア
ミノ酸配列によっても実験を行った。
【0175】図3の(a)または(b)または(c)で
表現されるデータをエンコーダ5に入力してアミノ酸配
列情報を出力させると、図3(e)が得られた。
【0176】本アミノ酸配列情報は「A、C、D、E、
F、G、H、I、K、L、M、N、P、Q、R、S、
T、V、W、Y」だけからなるので、合成装置7が読み
取ることができる形式である。
【0177】合成装置7がこのアミノ配列をもつポリペ
プチドなどの合成高分子9を作り、該合成高分子9を配
列読み取り装置11が読み取ると、解読した配列/結合
様式情報12がデコーダ13に渡る。もし情報が誤りな
く伝わるならば、該解読した配列/結合様式情報12
は、図3(d)のアミノ酸配列そのものである。
【0178】そこで、実験では、図3(e)をデコーダ
13に入力した。その結果は、図3(f)または(g)
または(h)で表現されるものであり、それぞれ、図3
(c)、(b)、(a)に一致した。
【0179】したがって、本実験データで、情報通信あ
るいは情報記録は正しく行われる。
【0180】図4は、エンコーダとデコーダの処理例2
であり、処理例1と同一のエンコーダ5とデコーダ13
を用い、日本語のデータを使って実験した結果を示して
いる。
【0181】図4の各データの中で、空白は、読解性を
助けるだけのものである。
【0182】図4の各データの中で、斜体文字で示した
部分は、理解を助けるために、元の「シ」という1文字
のカタカナがどう変形していくか、対応部分を追跡して
表示したものである。
【0183】エンコーダに、送信するデータ4として、
図4(a)のデータを与えた。
【0184】該データをEUCコード文字、16進数、
2進数の3通りで表現したものが、それぞれ、図4の
(a)、(b)および(c)である。
【0185】エンコーダ5に該データを入力して塩基配
列情報を出力させると、図4(d)が得られた。
【0186】本塩基配列情報は「t、c、a、g」だけ
からなるので、合成装置7が読み取ることができる形式
である。
【0187】合成装置7がこの塩基配列をもつDNAな
どの合成高分子9を作り、該合成高分子9を配列読み取
り装置11が読み取ると、解読した配列/結合様式情報
12がデコーダ13に渡る。もし情報が誤りなく伝わる
ならば、該解読した配列/結合様式情報12は、図4
(d)の塩基配列そのものである。
【0188】そこで、実験では、図4(d)をデコーダ
13に入力した。その結果は、図4(f)または(g)
または(h)で表現されるものであり、それぞれ、図4
(c)、(b)、(a)に一致した。
【0189】したがって、本実験データで、情報通信あ
るいは情報記録は正しく行われる。
【0190】上の説明は塩基配列の場合であったが、ア
ミノ酸配列によっても実験を行った。
【0191】図4の(a)または(b)または(c)で
表現されるデータをエンコーダ5に入力してアミノ酸配
列情報を出力させると、図4(e)が得られた。
【0192】本アミノ酸配列情報は「A、C、D、E、
F、G、H、I、K、L、M、N、P、Q、R、S、
T、V、W、Y」だけからなるので、合成装置7が読み
取ることができる形式である。
【0193】合成装置7がこのアミノ酸配列をもつポリ
ペプチドなどの合成高分子9を作り、該合成高分子9を
配列読み取り装置11が読み取ると、解読した配列/結
合様式情報12がデコーダ13に渡る。もし情報が誤り
なく伝わるならば、該解読した配列/結合様式情報12
は、図4(d)のアミノ酸配列そのものである。
【0194】そこで、実験では、図4(e)をデコーダ
13に入力した。その結果は、図4(f)または(g)
または(h)で表現されるものであり、それぞれ、図4
(c)、(b)、(a)に一致した。
【0195】したがって、本実験データで、情報通信あ
るいは情報記録は正しく行われる。
【0196】以上、処理例を二例示した。
【0197】本願発明はまた、前記エンコーダ5をクレ
ームする(請求項6)。
【0198】本願発明はまた、前記デコーダ13をクレ
ームする(請求項7)。
【0199】本願発明はまた、前記エンコーダ5のプロ
グラムを記録した記録媒体をクレームする(請求項
8)。
【0200】ここで記録媒体とは、CD、MO、DV
D、ハードディスク、半導体メモリ、半導体チップ、磁
気テープを含む電気的もしくは磁気的もしくは光学的手
段を用いた記録媒体もしくは記憶装置、そして、本願発
明による高分子記録媒体を含む。
【0201】本願発明はまた、前記エンコーダ5のプロ
グラムを伝送する情報伝送媒体をクレームする(請求項
9)。
【0202】ここで情報伝送媒体とは、ネットワーク、
電話、ケーブルテレビ、そして、放送を含む。
【0203】本願発明はまた、前記デコーダ13のプロ
グラムを記録した記録媒体をクレームする(請求項1
0)。
【0204】本願発明はまた、前記デコーダ13のプロ
グラムを伝送する情報伝送媒体をクレームする(請求項
11)。
【0205】本願発明はまた、請求項1に記載の情報通
信方法または請求項2に記載の情報記録方法によってデ
ータが記録されたことを特徴とする生物もしくは細胞も
しくは生体高分子もしくは合成高分子をクレームする
(請求項12)。
【0206】これらの生物もしくは細胞もしくは生体高
分子の用途の例は: (ア) ドキュメント、トランザクションデータ、マル
チメディアデータ、大容量データベース、プログラム、
スクリプト、ログ、放送記録、あるいはWebドキュメ
ントの記録、画面コピーなどの、格納、(イ) 実験デ
ータ、観測データ、バイオデータ、あるいは、シミュレ
ーション結果の、記録、(ウ) 極秘通信、(エ) 遺
伝子組み換え生物等の生物につける標識もしくは識別番
号もしくは実験関連情報、(オ) タイムカプセル、
(カ) 地球外生命との通信、である。
【0207】(地球外知性の参考文献: 「前野 昌弘:SETI計画とは何か」http://homepage
3.nifty.com/iromono/kougi/ningen/node35.html、 「kamiken:知的生命体を調査せよ−」http://w
ww25.cds.ne.jp/~kamiken/projectg/project3/project
3.html、 SETI@home http://setiathome.ssl.berkeley.
edu/)
【0208】バイオデータの保存に用いる例として、現
在の一人のヒトのゲノム情報を、本システムに入力し
て、保存性や解読容易性などの特徴をもった別の生物の
DNAもしくはRNAに組み込んで保存することが考え
られる。
【0209】実施例では、送信データに他の情報を付加
せずに送っているが、送信データを記述している自然言
語もしくはプログラミング言語もしくは構造化データの
知識のない受信者のために、文法情報、辞書情報、メタ
情報、フォント情報、発音情報、文書タイプ定義、ある
いは、関連文書を添付してもよい。この場合受信者は、
添付情報をもとに言語知識を組み立てて、受信データを
理解する。
【0210】画像情報、音楽情報は、背景知識が少なく
ても理解しやすいので、比較的安心して送ることができ
る。
【0211】実施例では、地球生命にほぼ共通の高分子
と低分子の組合せを用いたが、化学的に安定であれば、
地球生命に共通ではない高分子あるいは低分子を採用し
てもよい。
【0212】本願発明の技術は現在のところ、合成と配
列読み取りが遅いという点で性能上不利としても、近い
うちに改善されることが期待される。
【0213】たとえば、ヒトゲノムの最初の解読には数
年を要したが、配列読み取り装置11の速度が年々高速
化している。解読時間はじきに月単位あるいは週単位に
短縮すると予想されている。
【0214】現在、合成装置7が合成できる高分子の長
さが短いという問題もある。
【0215】この点は、合成技術の進歩で次第に解決さ
れ、次第に長いデータを記録できることになるであろ
う。
【0216】また、現在合成できる一本の高分子の鎖は
短くとも、多数の高分子を合成することは問題ない。
【0217】そこで、複数のDVDにデータを書き込む
のと同様、多数の高分子にまたがってデータを記録する
ことができる。
【0218】それぞれの高分子もしくはブロックに一連
番号を振っておけば、受信者がそれら多数の高分子を集
めてデータを再構成することは容易である。
【発明の効果】第一に、生物の高分子のアーキテクチャ
は天然の安定した規格であって、数百年、数千年後にも
変わらないことが期待できる。
【0219】第二に、生物はそれ自身生き延びる能力が
あるので、媒体の劣化の問題を回避しやすい。
【0220】媒体が早く劣化する場合は、別媒体を調達
して情報をコピーするコストがかかるが、本願発明によ
れば、高分子を冷凍したり、生物を生かしておくこと
で、情報が保存される。
【0221】第三に、傍受に対して、配列読み取り装置
のように通常のネットワークユーザには入手も製作もし
にくい構成部品を採用しているので、強靱といえる。
【0222】以上説明したように本発明は、規格の不安
定性、媒体の劣化、傍受の危険性の三項目の問題点を克
服して、より安定性に優れた通信方法と記録方法を提供
できる。
【0223】さらに、以下のような利点もある。
【0224】第四に、情報の記録密度を飛躍的に高める
ことができる。
【0225】いま、高分子の記録している情報の密度の
オーダーを、従来の記録手段と比較してみる。
【0226】世界で2億巻以上使われていて企業が取引
ログや元帳を記録している、2,400 feet長の磁気テープ
は、180 MB = 180×106×8 bitのデータが記録でき、直
径10.5 inch = 267 mm、厚み0.5 inch = 13 mmの円柱、
質量1.5 kgとして、 約 109 bit/kg、 約 1012 bit/m3
【0227】DVDは、容量9.4 GB = 9.4×109×8 bit
のデータが記録でき、直径120 mm、厚み1.2 mmの円柱,
質量80 gとして、 約 1012 bit/kg (=磁気テープの一千倍)、 約 1015 bit/m3 (=磁気テープの一千倍)。
【0228】バクテリアは、核酸情報量5×106×2 bit
で、直径0.5 μmの球、質量7×10-13gとして、 約 1019 bit/kg (=DVDの一千万倍=磁気テープの
百億倍)、 約 1026 bit/m3 (=DVDの一千億倍=磁気テープの
百兆倍)。
【0229】一辺がわずか 1 mm程度の立方体に詰めた
バクテリアの核酸が含む情報が、世界中の2,400 feet磁
気テープの情報の総量(3×1017 bit)に匹敵するので
ある。
【0230】このように、生体高分子を媒体に用いれ
ば、実際の装置は理論値までは出ないとしてもなお、非
常に高い密度の情報記録が可能である。
【0231】言い換えれば、密度には余裕が十分があ
る。
【0232】したがって、データ誤りを防ぎ長期間情報
を維持できるように、ひとつのデータのコピーをバイオ
テクノロジーの増幅技術または生物自身の増殖機能によ
って大量に増やし、それぞれを「生かして」おくことも
できる。
【0233】たとえば、蚕のDNAに遺伝子を組み込む
と、該遺伝子のコードする蛋白質が繭の中に大量に吐き
出される、という最近の技術も利用できる。
【0234】第五に、請求項5に記載したエンコード方
法を採用すれば、高密度にデータを記録することができ
る。
【0235】特に、20種類のアミノ酸を20進数で用
いる方法を採用すれば、16種だけのアミノ酸を使う方
法よりも、格納効率の点で有利である。
【0236】第六に、生物が自然環境で生きる場合は、
受信者に媒体を渡すための作業も不要になる点が有利で
ある。
【0237】ただし、本願発明の実施にあたっては、そ
の態様に応じ安全面と倫理面の問題を十分に検討し、慎
重が上にも慎重に望む必要があることを、特記事項とし
て銘記しておく。
【図面の簡単な説明】
【図1】実施例1の構成ブロック図である。
【図2】実施例2の構成ブロック図である。
【図3】エンコーダとデコーダの処理例1を示した説明
図である。
【図4】エンコーダとデコーダの処理例2を示した説明
図である。
【符号の説明】
1 送信者側サブシステム 1a 書き込み側サブシステム 2 受信者側サブシステム 2a 読み出し側サブシステム 3 送信データ入力部 3a データ入力部 4 送信するデータ 4a 書き込むデータ 5 エンコーダ 6 配列情報または結合様式情報 7 合成装置 8 生体高分子の材料 9 合成高分子 10 生物もしくは細胞もしくは生体高分子 11 配列読み取り装置 12 解読した配列/結合様式情報 13 デコーダ 14 受信データ 14a 読み出しデータ 15 受信データ出力部 15a データ出力部

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】送信者側サブシステム(1)と受信者側サ
    ブシステム(2)があり、 送信者側サブシステム(1)において、 ステップ1として、送信データ入力部(3)が、送信す
    るデータ(4)を入力し、 (あるいはさらに、暗号化手段が暗号化を実行し、)
    (あるいはさらに、冗長化手段が冗長化を実行し、)ス
    テップ2として、エンコーダ(5)が、送信するデータ
    (4)を、 合成する高分子を構成する「低分子」の「配列情報また
    は結合様式情報(6)」に変換し、 (あるいはさらに、高分子配列変換手段が高分子配列変
    換を実行し、)ステップ3として、合成装置(7)が、
    「低分子」を含有している「生体高分子の材料(8)」
    を原料にして、該配列または該結合様式をもつ合成高分
    子(9)を合成し、 ステップ4として、該合成高分子(9)を、そのまま、
    または、「生物もしくは細胞もしくは生体高分子(1
    0)」の一部として組み込んで、直接または環境経由で
    受信者側サブシステム(2)に渡し、 さらに、受信者側サブシステム(2)において、 ステップ5として、合成高分子(9)が生物もしくは細
    胞もしくは生体高分子(10)に組み込まれている場合
    は該合成高分子(9)を取り出し、 いずれにしても、 ステップ6として、配列読み取り装置(11)が、セッ
    トされた該合成高分子(9)を分析して、「解読した配
    列/結合様式情報(12)」を出力し、(あるいはさら
    に、高分子配列逆変換手段が高分子配列逆変換処理を実
    行し、)ステップ7として、デコーダ(13)が、該
    「配列情報または結合様式情報(6)」を解析して受信
    データ(14)を生成し、(あるいはさらに、冗長化逆
    変換手段が冗長化逆変換処理を実行し、)(あるいはさ
    らに、復号化手段が復号化を実行し、)受信データ出力
    部(15)から出力することを特徴とする情報通信方
    法。
  2. 【請求項2】書き込み側サブシステム(1a)と読み出
    し側サブシステム(2a)があり、 書き込み側サブシステム(1a)において、 ステップ1として、データ入力部(3a)が、書き込む
    データ(4a)を入力し、(あるいはさらに、暗号化手
    段が暗号化を実行し、)(あるいはさらに、冗長化手段
    が冗長化を実行し、)ステップ2として、エンコーダ
    (5)が、書き込むデータ(4a)を、合成する高分子
    を構成する「低分子」の「配列情報または結合様式情報
    (6)」に変換し、(あるいはさらに、高分子配列変換
    手段が高分子配列変換を実行し、)ステップ3として、
    合成装置(7)が、「低分子」を含有している「生体高
    分子の材料(8)」を原料にして、該配列または該結合
    様式をもつ合成高分子(9)を合成し、 ステップ4として、該合成高分子(9)を、そのまま、
    または、「生物もしくは細胞もしくは生体高分子(1
    0)」の一部として組み込んで、直接または環境経由で
    読み出し側サブシステム(2a)に渡し、 さらに、読み出し側サブシステム(2a)において、 ステップ5として、合成高分子(9)が生物もしくは細
    胞もしくは生体高分子(10)に組み込まれている場合
    は該合成高分子(9)を取り出し、いずれの場合も、 ステップ6として、配列読み取り装置(11)が、セッ
    トされた該合成高分子(9)を分析して、「解読した配
    列/結合様式情報(12)」を出力し、(あるいはさら
    に、高分子配列逆変換手段が高分子配列逆変換処理を実
    行し、)ステップ7として、デコーダ(13)が、該
    「配列情報または結合様式情報(6)」を解析して読み
    出しデータ(14a)を生成し、(あるいはさらに、冗
    長化逆変換手段が冗長化逆変換処理を実行し、)(ある
    いはさらに、復号化手段が復号化を実行し、)データ出
    力部(15a)から出力することを特徴とする情報記録
    方法。
  3. 【請求項3】前記合成高分子(9)が「蛋白質もしくは
    ポリペプチド(polipeptide)」であり、 前記「低分子」がアミノ酸(amino acid)であり、 前記「配列情報または結合様式情報(6)」がアミノ酸
    配列(amino acid sequence)であり、 前記合成装置(7)がペプチド合成装置もしくはペプチ
    ドシンセサイザもしくは蛋白質合成装置であり、 前記配列読み取り装置(11)がペプチドシーケンサも
    しくはプロテインシーケンサもしくはアミノ酸分析装置
    である、 ことを特徴とする、 請求項1に記載の情報通信方法、または、 請求項2に記載の情報記録方法。
  4. 【請求項4】前記合成高分子(9)が「DNAもしくは
    RNAもしくはポリヌクレオチド(polinucleotide)」
    であり、 前記「低分子」がヌクレオチド(nucleotide)であり、 前記「配列情報または結合様式情報(6)」が塩基配列
    (base sequence または nucleotide sequence)であ
    り、 前記合成装置(7)がDNA合成装置もしくはDNAシ
    ンセサイザもしくは核酸合成装置であり、 前記配列読み取り装置(11)がDNAシーケンサもし
    くは核酸シーケンサもしくは核酸分析装置である、 ことを特徴とする、 請求項1に記載の情報通信方法、または、 請求項2に記載の情報記録方法。
  5. 【請求項5】請求項1に記載の情報通信方法または請求
    項2に記載の情報記録方法において、 前記エンコーダ(5)は、 送信するデータを2ビットずつ分割した、各2ビットか
    らなる0〜3の値を「t、c、a、g」もしくは「u、
    c、a、g」の4種類の塩基に対応付け、 または、 送信するデータを4ビットずつ分割した、各4ビットか
    らなる0〜(10進数表現で)15の値を「A、C、
    D、E、F、G、H、I、K、L、M、N、P、Q、
    R、S、T、V、W、Y」の20種類のうちの16種類
    のアミノ酸に対応付け、 または、 送信する送信するデータを一定の長さずつ分割した各分
    割結果を一定桁数の20進数と見なすことにより各桁の
    「数字」になる各0〜(10進数表現で)19の値を
    「A、C、D、E、F、G、H、I、K、L、M、N、
    P、Q、R、S、T、V、W、Y」の20種類のアミノ
    酸に対応付けることを特徴とする情報通信方法もしくは
    情報記録方法。
  6. 【請求項6】請求項1に記載の情報通信方法または請求
    項2に記載の情報記録方法を実施するために、 送信するデータ(4)を、生体高分子の合成装置(7)
    への配列情報または結合様式情報(6)に変換するエン
    コーダ(5)。
  7. 【請求項7】請求項1に記載の情報通信方法または請求
    項2に記載の情報記録方法を実施するために、 配列読み取り装置(11)が読み取った該配列情報また
    は結合様式情報(6)を解析し、受信データ(14)を
    出力するデコーダ(13)。
  8. 【請求項8】コンピュータによって請求項1に記載の情
    報通信方法または請求項2に記載の情報記録方法を実施
    するためのプログラムを記録したコンピュータ読み取り
    可能な媒体であって、 該プログラムは、 送信するデータ(4)を、生体高分子の合成装置(7)
    への配列情報または結合様式情報(6)に変換させるこ
    とを特徴とするエンコーダプログラムを記録した記録媒
    体。
  9. 【請求項9】情報処理システムで使用される情報伝送媒
    体であって、 請求項1に記載の情報通信方法または請求項2に記載の
    情報記録方法を実施するために、 送信するデータ(4)を、生体高分子の合成装置(7)
    への配列情報または結合様式情報(6)に変換させるエ
    ンコーダプログラムを伝送することを特徴とする情報伝
    送媒体。
  10. 【請求項10】コンピュータによって請求項1に記載の
    情報通信方法または請求項2に記載の情報記録方法を実
    施するためのプログラムを記録したコンピュータ読み取
    り可能な媒体であって、 該プログラムは、 配列読み取り装置(11)が読み取った該配列情報また
    は結合様式情報(6)を、解析させ、受信データ(1
    4)を出力させることを特徴とするデコーダプログラム
    を記録した記録媒体。
  11. 【請求項11】情報処理システムで使用される情報伝送
    媒体であって、 請求項1に記載の情報通信方法または請求項2に記載の
    情報記録方法を実施するために、 配列読み取り装置(11)が読み取った該配列情報また
    は結合様式情報(6)を、解析させ、受信データ(1
    4)を出力させるデコーダプログラムを伝送することを
    特徴とする情報伝送媒体。
  12. 【請求項12】請求項1に記載の情報通信方法または請
    求項2に記載の情報記録方法によってデータが記録され
    たことを特徴とする生物もしくは細胞もしくは生体高分
    子もしくは合成高分子。
JP2002302455A 2002-10-17 2002-10-17 生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ Expired - Lifetime JP4102157B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002302455A JP4102157B2 (ja) 2002-10-17 2002-10-17 生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002302455A JP4102157B2 (ja) 2002-10-17 2002-10-17 生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ

Publications (2)

Publication Number Publication Date
JP2003101485A true JP2003101485A (ja) 2003-04-04
JP4102157B2 JP4102157B2 (ja) 2008-06-18

Family

ID=19197350

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002302455A Expired - Lifetime JP4102157B2 (ja) 2002-10-17 2002-10-17 生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ

Country Status (1)

Country Link
JP (1) JP4102157B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006095651A1 (ja) * 2005-03-07 2006-09-14 Ntt Docomo, Inc. 分子通信システム
WO2009013910A1 (ja) * 2007-07-24 2009-01-29 Keio University 符号化装置、復号化装置、及び情報記録媒体
WO2010086990A1 (ja) * 2009-01-29 2010-08-05 スパイバー株式会社 Dnaタグの構築方法
JP2021058216A (ja) * 2015-07-13 2021-04-15 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸を用いた回収可能な情報記憶のための方法
US11900191B2 (en) 2012-07-19 2024-02-13 President And Fellows Of Harvard College Methods of storing information using nucleic acids

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101031501B (zh) * 2005-03-07 2010-08-18 株式会社Ntt都科摩 分子通信系统
EP1857408A1 (en) * 2005-03-07 2007-11-21 NTT DoCoMo Inc. Molecular communication system
KR100863266B1 (ko) * 2005-03-07 2008-10-15 가부시키가이샤 엔티티 도코모 분자통신시스템
WO2006095651A1 (ja) * 2005-03-07 2006-09-14 Ntt Docomo, Inc. 分子通信システム
EP1857408A4 (en) * 2005-03-07 2010-01-27 Ntt Docomo Inc MOLECULAR COMMUNICATION SYSTEM
EP2182661A1 (en) 2005-03-07 2010-05-05 NTT DoCoMo, Inc. Molecular communication system
US8315807B2 (en) 2005-03-07 2012-11-20 Ntt Docomo, Inc. Molecular communication system
WO2009013910A1 (ja) * 2007-07-24 2009-01-29 Keio University 符号化装置、復号化装置、及び情報記録媒体
JP4547522B1 (ja) * 2009-01-29 2010-09-22 スパイバー株式会社 Dnaタグの構築方法
WO2010086990A1 (ja) * 2009-01-29 2010-08-05 スパイバー株式会社 Dnaタグの構築方法
US8691581B2 (en) 2009-01-29 2014-04-08 Spiber Inc. Method of making DNA tag
US11900191B2 (en) 2012-07-19 2024-02-13 President And Fellows Of Harvard College Methods of storing information using nucleic acids
US12067434B2 (en) 2012-07-19 2024-08-20 President And Fellows Of Harvard College Methods of storing information using nucleic acids
JP2021058216A (ja) * 2015-07-13 2021-04-15 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸を用いた回収可能な情報記憶のための方法
US11532380B2 (en) 2015-07-13 2022-12-20 President And Fellows Of Harvard College Methods for using nucleic acids to store, retrieve and access information comprising a text, image, video or audio format

Also Published As

Publication number Publication date
JP4102157B2 (ja) 2008-06-18

Similar Documents

Publication Publication Date Title
Chen et al. An artificial chromosome for data storage
Ping et al. Carbon-based archiving: current progress and future prospects of DNA-based data storage
Lopez et al. DNA assembly for nanopore data storage readout
CN109300508B (zh) 一种dna数据存储编码解码方法
De Silva et al. New trends of digital data storage in DNA
Wang et al. High capacity DNA data storage with variable-length Oligonucleotides using repeat accumulate code and hybrid mapping
Shomorony et al. Information-theoretic foundations of DNA data storage
Cao et al. Adaptive coding for DNA storage with high storage density and low coverage
Organick et al. Scaling up DNA data storage and random access retrieval
Welzel et al. DNA-Aeon provides flexible arithmetic coding for constraint adherence and error correction in DNA storage
Ezekannagha et al. Design considerations for advancing data storage with synthetic DNA for long-term archiving
Cevallos et al. A brief review on DNA storage, compression, and digitalization
Akhmetov et al. A highly parallel strategy for storage of digital information in living cells
Wang et al. Hidden addressing encoding for DNA storage
Wang et al. Oligo design with single primer binding site for high capacity DNA-based data storage
Gervasio et al. How close are we to storing data in DNA?
Dimopoulou et al. Data and image storage on synthetic DNA: existing solutions and challenges
Wu et al. HD-code: End-to-end high density code for DNA storage
Mu et al. RBS: a rotational coding based on blocking strategy for DNA storage
Wang et al. Mainstream encoding–decoding methods of DNA data storage
El-Shaikh et al. Content-based filter queries on DNA data storage systems
JP2003101485A (ja) 生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ
Cevallos et al. On the efficient digital code representation in DNA-based data storage
Erlich et al. Capacity-approaching DNA storage
Beck et al. Finding data in DNA: computer forensic investigations of living organisms

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050822

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080321

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4102157

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140328

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140328

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term