JP2008097320A - Genetic information management system - Google Patents
Genetic information management system Download PDFInfo
- Publication number
- JP2008097320A JP2008097320A JP2006278268A JP2006278268A JP2008097320A JP 2008097320 A JP2008097320 A JP 2008097320A JP 2006278268 A JP2006278268 A JP 2006278268A JP 2006278268 A JP2006278268 A JP 2006278268A JP 2008097320 A JP2008097320 A JP 2008097320A
- Authority
- JP
- Japan
- Prior art keywords
- sequence information
- user
- information data
- terminal device
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002068 genetic effect Effects 0.000 title 1
- 108090000623 proteins and genes Proteins 0.000 claims description 22
- 125000003275 alpha amino acid group Chemical group 0.000 abstract description 7
- 230000000694 effects Effects 0.000 abstract description 2
- 238000012795 verification Methods 0.000 abstract 1
- 108020004414 DNA Proteins 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 101150012579 ADSL gene Proteins 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 101150008921 Brca2 gene Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、コンピュータ端末上でのDNA/RNA/アミノ酸配列・アノテーションデータの管理、表示の仕組みに関するものである。 The present invention relates to a mechanism for managing and displaying DNA / RNA / amino acid sequence / annotation data on a computer terminal.
DNA、RNAのアミノ酸配列情報に関する種類は、塩基やアミノ酸の配列情報のみならず、遺伝子情報、マーカー情報、その配列に関する論文や研究者の情報など多岐にわたる。
遺伝子の配列情報は、GenBank(The National Center for Biotechnology Information)やDDBJ(DNA Data Bank of Japan)、EMBL(European Molecular Biology
Laboratory)等の公共データベースで提供される配列情報、公共データベース中の配列情報に対して研究者が解析結果などを独自に付加したもの、研究者自身が配列の決定を行って当該配列に対するコメント等をアノテーション(遺伝子配列の注釈付け)したものなどに分別される。
The types of DNA and RNA amino acid sequence information include not only base and amino acid sequence information, but also gene information, marker information, papers on the sequence, and researcher information.
Gene sequence information includes GenBank (The National Center for Biotechnology Information), DDBJ (DNA Data Bank of Japan), and EMBL (European Molecular Biology).
Sequence information provided in public databases such as Laboratory), researchers added their own analysis results to the sequence information in the public database, researchers themselves made sequence determinations, comments on the sequences, etc. Are annotated (annotated with gene sequences).
近年の研究施設においては、LAN(Local Area Network)による相互通信が可能なコンピュータシステムが導入されている。そして、共同研究者同士のデータ共有は当該LAN等のネットワーク上で共有されていることが多い。また、コンピュータ端末のOS(Operating System)において設定されるアクセス権限によりデータへのアクセスを制限する方法が一般的である。 In recent research facilities, computer systems capable of mutual communication via a LAN (Local Area Network) have been introduced. Data sharing among collaborators is often shared on a network such as the LAN. Further, a method of restricting access to data by an access right set in an OS (Operating System) of a computer terminal is common.
このように、共同研究者間で配列情報を共有しつつ作業を進める場合、インターネットやイントラネットなどのネットワークに接続されたコンピュータ端末を利用して、データの共有を行うケースが多くなってきているが、共同研究作業の形態は様々である。したがって、これらの様々な作業形態に対して柔軟に対応できるような、配列情報へのアノテーション付与作業環境システムが求められている。 In this way, when working while sharing sequence information among collaborators, there are many cases where data is shared using computer terminals connected to a network such as the Internet or an intranet. There are various forms of joint research work. Therefore, there is a need for a work environment system for annotating sequence information that can flexibly cope with these various work modes.
例えば、遺伝子情報管理システムを利用する研究者等のユーザは、ネットワーク上のコンピュータ端末における共有フォルダ内に格納された配列情報に関するデータファイルに対して編集作業を行うことができるが、どのユーザがどの時点で編集作業を行ったという情報までは記録されない。また、後々遺伝子情報データを公開する予定ではあるものの、それまでは当該遺伝子情報データを公開したくない場合など、ユーザ間で共同作業をする際に要求されるデータファイルへの細かなアクセス権限は提供されていない。更には、複数の研究者間では、期せずして、同じ配列情報に注目することがあり、研究対象が重複するといった可能性もある。 For example, a user such as a researcher who uses a gene information management system can edit a data file related to sequence information stored in a shared folder in a computer terminal on a network. The information that the editing work was performed at the time is not recorded. In addition, if you plan to publish gene information data later, but you do not want to publish the gene information data until then, detailed access authority to the data file required when collaborating between users is Not provided. Furthermore, among the plurality of researchers, the same sequence information may be noticed unexpectedly, and there is a possibility that research objects overlap.
本発明の目的は、どの配列情報に対して、どのようなアノテーションを付与したり解析作業を行ったりしているかを明確にすることで、複数のユーザ間における共同作業時の様々な要求に即した配列情報へのアノテーション付与作業環境の提供を行うことにある。 It is an object of the present invention to clarify which annotations are assigned to which sequence information and analysis work is performed, so as to meet various requirements at the time of collaborative work among a plurality of users. It is to provide an annotating work environment for the sequence information.
上記目的を達成するために、本発明の遺伝子情報管理システムは、記憶手段を備えたデータベースサーバと、ユーザに使用される端末装置とがネットワークに通信可能に接続されているコンピュータシステムを用いた遺伝子情報管理システムであって、前記記憶手段には遺伝子の配列に関する配列情報データが登録されている配列情報データベースが記憶されており、前記配列情報データ毎にアクセス権限の有無が設定されているとともに、ユーザによって前記端末装置から前記配列情報データが検索された場合、前記データベースサーバは、前記アクセス権限に基づいて前記配列情報データを公開するか否か判断することを特徴とする。 In order to achieve the above object, the gene information management system of the present invention is a gene using a computer system in which a database server having a storage means and a terminal device used by a user are connected to be able to communicate with a network. In the information management system, the storage means stores a sequence information database in which sequence information data related to gene sequences is registered, and whether or not access authority is set for each sequence information data, When the sequence information data is retrieved from the terminal device by a user, the database server determines whether to disclose the sequence information data based on the access authority.
本発明の遺伝子情報管理システムによれば、DNA/RNA/アミノ酸配列を扱う分子生物学などの研究分野において、複数のユーザ間における共同作業時の様々な要求に即した、配列情報へのアノテーション付与作業環境の提供を行うことができる。 According to the gene information management system of the present invention, in the field of research such as molecular biology dealing with DNA / RNA / amino acid sequences, annotating sequence information in accordance with various demands when collaborating among multiple users. A working environment can be provided.
以下、本発明である遺伝子情報管理システムの一実施の形態について説明する。
図1に示すように、本実施形態における遺伝子情報管理システムは、データベースサーバ11と、複数の端末装置12とで構成されている。これらデータベースサーバ11及び端末装置12は、ネットワークとしてのインターネット13に公衆電話回線を用いたADSL、光ファイバ等により接続されている。そして、データベースサーバ11をサーバコンピュータとして、インターネット13に接続された端末装置12をクライアントコンピュータとして、クライアントサーバーシステムが構築されている。
Hereinafter, an embodiment of a gene information management system according to the present invention will be described.
As shown in FIG. 1, the gene information management system in the present embodiment includes a
データベースサーバ11には、相互にバスにより接続された図示しないCPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)等が備えられている。また、端末装置12等とデータの入出力を行う図示しないインターフェイスも設けられている。更には、記憶手段としての内部記憶装置であるハードディスク14が接続されている。
The
ハードディスク14には、ユーザによって構築された遺伝子の配列情報に関するデータベースや、OS(Operating System)等が記憶されている。OSは、例えば、NetWare(登録商標)といったネットワークOSである。当該OSによって、データベースサーバ11全体の制御とともに、インターネット13に対する制御も実行される。
The
次に、遺伝子の配列に関する情報が記憶されている配列情報データベースに登録されている配列情報データについて説明する。
図2に示すように、配列情報データベースのテーブル要素としては、UniqueID15、アクセス権限16、データ作成者17、配列タイプ18、配列定義19、配列20、アノテーション情報21がある。これらの各テーブル要素で1つの配列情報データが構成されており、配列情報データベースは当該配列情報データが複数登録されているもので構成されている。
Next, sequence information data registered in a sequence information database in which information related to gene sequences is stored will be described.
As shown in FIG. 2, the table elements of the array information database include
UniqueID15の欄には、ユーザによって配列情報データベースに追加された配列情報データの順に連続する番号が記述される。
また、アクセス権限16の欄には、当該配列情報データを公開するか、非公開とするか、あるいは公開するための準備中であるかについての情報が記述される。たとえば、配列情報データを公開する場合には1が、非公開とする場合には2が、そして、公開するための準備中である場合には3が、それぞれアクセス権限16の欄にユーザによって記述される。
In the column of UniqueID15, consecutive numbers in the order of sequence information data added to the sequence information database by the user are described.
In the column of
アクセス権限16の欄に1が記述されている場合(公開)には、当該配列情報データは、配列情報データベースを閲覧するすべてのユーザによって自由に閲覧可能である。一方、アクセス権限16の欄に2が記述されている場合(非公開)には、当該配列情報データは、データ作成者以外のユーザが自由に閲覧することはできない。そして、アクセス権限16の欄に3が記述されている場合(準備中)には、当該配列情報データのうち、データ作成者、配列タイプ、配列定義についてのみ、データ作成者以外のユーザが自由に閲覧することができる。
When 1 is described in the column of the access authority 16 (public), the sequence information data can be freely browsed by all users who browse the sequence information database. On the other hand, when 2 is described in the column of the access authority 16 (not disclosed), the sequence information data cannot be freely viewed by a user other than the data creator. When 3 is described in the
データ作成者17の欄には、配列情報データを作成したユーザの氏名が記述される。また、配列タイプ18の欄には、核酸の場合は、mRNA(messenger RNA)、cDNA(complementary DNA)、cRNA(complementary RNA)等、アミノ酸配列の場合は、アミノ酸配列と、配列情報のタイプが記述される。配列定義19の欄には、Brca1遺伝子、Brca2遺伝子等の遺伝子の種類に関する情報が記述される。配列20の欄には、遺伝子の具体的な配列が記述される。
In the column of
そして、アノテーション情報21の欄には、遺伝子配列の注釈が作成者等によって記述される。アノテーション情報21の欄には、遺伝子の機能や関連画像に関する情報等、複数の情報が記述されるため、アノテーション情報については、配列情報データ毎に図3に示すようなアノテーションテーブル22が作成される。
アノテーションテーブル22のテーブル要素としては、ID23、アノテーション内容24、アノテーション付与者25、作成日時26、更新日時27がある。
In the
Table elements of the annotation table 22 include ID 23,
ID23の欄には、アノテーション毎に異なる文字や数字からなる番号が記述される。アノテーション内容24の欄には、具体的なアノテーションの内容に関する情報が記述される。アノテーション付与者25の欄には、当該アノテーションを付与した者の氏名が記述される。作成日時26の欄には、アノテーション情報が初めて作成された日時が記述される。そして、更新日時27の欄には、作成された後に更新された最新の日時が記述される。
In the column of ID23, a number consisting of different characters and numbers for each annotation is described. In the
次に、配列情報データベースの編集方法及び配列情報データベースへのアクセス方法について説明する。
なお、以下の処理はデータベースサーバ11のROM等に記憶されているプログラムに基づいて、CPU等の制御手段による制御のもとで実行される。
図4に示すように、まず端末装置12からユーザによって配列情報データベースにログインするためのユーザID及びパスワードが入力される(ステップS1)。ログインに成功すれば、ユーザは配列情報データベースへのアクセス等が可能となる。
Next, a method for editing the sequence information database and a method for accessing the sequence information database will be described.
The following processing is executed under the control of a control means such as a CPU based on a program stored in the ROM or the like of the
As shown in FIG. 4, first, a user ID and a password for logging in to the array information database are input by the user from the terminal device 12 (step S1). If the login is successful, the user can access the sequence information database.
次に、ユーザに対して、配列情報データベースを編集するのか否かについての確認が求められる(ステップS2)。ユーザが、配列情報データベースの編集を希望した場合、データベースサーバ11から端末装置12に対して、配列情報データの作成・更新画面が送信される。ユーザは、当該画面に表示された内容に基づいて当該配列情報データの作成・更新を行う(ステップS3)。
Next, the user is asked to confirm whether or not to edit the sequence information database (step S2). When the user wishes to edit the sequence information database, a sequence information data creation / update screen is transmitted from the
配列情報データの作成・更新の際に、ユーザは、データベースサーバ11から配列情報データベースのテーブル要素であるアクセス権限16の設定を促される。ユーザは、作成・更新する配列情報データについて、他のユーザへの公開、非公開、公開準備中アクセス権限を設定する。ここで、配列情報データの更新が実行される場合であって、今までのアクセス権限が他のアクセス権限へ変更された場合、データベースサーバ11から他のユーザに対してその旨がメール等で通知される。
ユーザによる配列情報データの作成・更新作業が終了すると、データベースサーバ11によって、配列情報データベースの更新が実行される(ステップS4)。
When creating / updating array information data, the user is prompted by the
When the creation / updating of the sequence information data by the user is completed, the sequence information database is updated by the database server 11 (step S4).
一方、ステップS2において、ユーザが、配列情報データベースの編集を希望しなかった場合、データベースサーバ11によって、端末装置12に対して、配列情報データの検索であるか否かを確認するための確認画面が送信される(ステップS5)。ユーザが、配列情報の検索を希望して配列情報の検索を実行した場合、データベースサーバ11によって、ユーザIDに基づいて検索対象である配列情報データについてユーザにアクセス権限があるか否かについての確認が実行される(ステップS6)。
On the other hand, in step S2, if the user does not wish to edit the sequence information database, the
ユーザにアクセス権限があると判断された場合、データベースサーバ11によって、当該ユーザの使用している端末装置12へ、検索対象である配列情報データが送信されるとともに(ステップS7)、当該配列情報データが端末装置12のディスプレイ等に表示される(ステップS8)。ユーザにアクセス権限がないと判断された場合、データベースサーバ11によって、当該ユーザの使用している端末装置12へ、その旨のメッセージデータが送信されるとともに、当該メッセージデータが端末装置12のディスプレイ等に表示される。
When it is determined that the user has access authority, the
なお、上記実施の形態は、以下のように変更して実施してもよい。
・データベースサーバ11及び端末装置12は、LANにより接続してもよい。
・配列情報データベースの構成は、図2に示すような形態に限られることはなく、適宜必要な情報項目を追加したり、不必要な情報項目を削除したりしてもよい。
The embodiment described above may be modified as follows.
The
The configuration of the sequence information database is not limited to the form shown in FIG. 2, and necessary information items may be appropriately added or unnecessary information items may be deleted.
11…データベースサーバ、
12…端末装置、
13…ネットワークとしてのインターネット、
14…記憶手段としてのハードディスク。
11 ... Database server,
12 ... a terminal device,
13 ... Internet as a network,
14: Hard disk as storage means.
Claims (1)
前記記憶手段には遺伝子の配列に関する配列情報データが登録されている配列情報データベースが記憶されており、
前記配列情報データ毎にアクセス権限の有無が設定されているとともに、ユーザによって前記端末装置から前記配列情報データが検索された場合、前記データベースサーバは、前記アクセス権限に基づいて前記配列情報データを公開するか否か判断することを特徴とする遺伝子情報管理システム。 A gene information management system using a computer system in which a database server provided with a storage means and a terminal device used by a user are connected to be able to communicate with a network,
The storage means stores a sequence information database in which sequence information data relating to gene sequences is registered,
Whether or not access authority is set for each array information data, and when the array information data is retrieved from the terminal device by a user, the database server publishes the array information data based on the access authority A gene information management system characterized by determining whether or not to perform.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006278268A JP2008097320A (en) | 2006-10-12 | 2006-10-12 | Genetic information management system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006278268A JP2008097320A (en) | 2006-10-12 | 2006-10-12 | Genetic information management system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008097320A true JP2008097320A (en) | 2008-04-24 |
Family
ID=39380101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006278268A Pending JP2008097320A (en) | 2006-10-12 | 2006-10-12 | Genetic information management system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008097320A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012094149A (en) * | 2010-10-28 | 2012-05-17 | Samsung Sds Co Ltd | Cooperation-based method of managing, displaying, and updating base sequence data |
-
2006
- 2006-10-12 JP JP2006278268A patent/JP2008097320A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012094149A (en) * | 2010-10-28 | 2012-05-17 | Samsung Sds Co Ltd | Cooperation-based method of managing, displaying, and updating base sequence data |
US8990231B2 (en) | 2010-10-28 | 2015-03-24 | Samsung Sds Co., Ltd. | Cooperation-based method of managing, displaying, and updating DNA sequence data |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zweig et al. | UCSC genome browser tutorial | |
Kurowski et al. | GeneSilico protein structure prediction meta-server | |
JP6701241B2 (en) | Integrated Consumer Genome Service | |
Kanehisa et al. | KEGG as a reference resource for gene and protein annotation | |
Harris et al. | WormBase: a comprehensive resource for nematode research | |
Holm et al. | Dali/FSSP classification of three-dimensional protein folds | |
Delcher et al. | Fast algorithms for large-scale genome alignment and comparison | |
Stoesser et al. | The EMBL nucleotide sequence database | |
Winsor et al. | Pseudomonas aeruginosa Genome Database and PseudoCAP: facilitating community-based, continually updated, genome annotation | |
Maglott et al. | Entrez Gene: gene-centered information at NCBI | |
Akagi et al. | RTCGD: retroviral tagged cancer gene database | |
Lo Conte et al. | SCOP database in 2002: refinements accommodate structural genomics | |
Birney et al. | Ensembl 2006 | |
Yan et al. | PatMatch: a program for finding patterns in peptide and nucleotide sequences | |
Joshi et al. | Soybean knowledge base (SoyKB): a web resource for integration of soybean translational genomics and molecular breeding | |
Czaplewski et al. | UNRES server for physics-based coarse-grained simulations and prediction of protein structure, dynamics and thermodynamics | |
Kent et al. | The human genome browser at UCSC | |
Brookes et al. | HGBASE: a database of SNPs and other variations in and around human genes | |
Bowes et al. | Xenbase: a Xenopus biology and genomics resource | |
TWI229807B (en) | Method and apparatus for deriving the genome of an individual | |
Le Novère et al. | LGICdb: the ligand-gated ion channel database | |
Fredman et al. | HGVbase: a curated resource describing human DNA variation and phenotype relationships | |
Uchiyama | MBGD: a platform for microbial comparative genomics based on the automated construction of orthologous groups | |
TW200905475A (en) | Integrated sharing of electronic documents | |
CN108537008A (en) | High-throughput gene sequencing big data analysis cloud platform system |