JP3340424B2 - 遺伝子配列表現システム及び記録媒体 - Google Patents

遺伝子配列表現システム及び記録媒体

Info

Publication number
JP3340424B2
JP3340424B2 JP2000325354A JP2000325354A JP3340424B2 JP 3340424 B2 JP3340424 B2 JP 3340424B2 JP 2000325354 A JP2000325354 A JP 2000325354A JP 2000325354 A JP2000325354 A JP 2000325354A JP 3340424 B2 JP3340424 B2 JP 3340424B2
Authority
JP
Japan
Prior art keywords
word
similarity
gene sequence
gene
profile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000325354A
Other languages
English (en)
Other versions
JP2002132780A (ja
Inventor
哲夫 西川
勝彦 村上
直之 原田
隆夫 磯貝
紀夫 太田
友康 杉山
啓一 永井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2000325354A priority Critical patent/JP3340424B2/ja
Publication of JP2002132780A publication Critical patent/JP2002132780A/ja
Application granted granted Critical
Publication of JP3340424B2 publication Critical patent/JP3340424B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は遺伝子配列の情報解
析に係わり、配列類似性検索結果から遺伝子機能を推定
することができる遺伝子配列表現システム及び記録媒体
に関する。
【0002】
【従来の技術】従来、遺伝子配列の特徴を抽出する方法
としては、遺伝子配列が持つ機能モチーフを抽出する方
法と共に、遺伝子配列データベース中の配列との間の配
列類似性検索を行い、その結果から配列特徴を抽出する
方法があった。配列類似性検索においては、配列類似
度、類似箇所の情報、及び類似配列に関するデータベー
ス中の記述から、従来はマニュアルで配列特徴の抽出を
行う必要があった。また、自動的に配列特徴の抽出を行
う方法として最近開発された方法に、GeneQuizが知られ
ている(バイオインフォーマティクス, 15巻, 391〜412
頁, 1999年/Bioinformatics. 1999, Vol.15, pp391〜4
12, URL: http://jura.ebi.ac.uk:8765/ext-genequiz//
genequiz.html)。この方法では、遺伝子の機能を配列
類似性検索の結果から推定する際において、類似性の高
いデータベースエントリーから遺伝子機能に関する記述
とキーワードを抽出し、そのままGeneQuizによる機能ア
ノテーションとして利用している。この方法では、類似
性が非常に高いデータベースエントリーが存在する場合
には信頼性の高い結果が得られるが、類似性が比較的高
くないデータベースエントリーしか存在しない場合に
は、ひとつのデータベースエントリーに記載された機能
情報だけでは、信頼性の高い結果が得られない。これ
は、そのような場合には複数の異なる機能を有する遺伝
子に同時に類似性が存在する可能性があるからである。
【0003】
【発明が解決しようとする課題】本発明が解決しようと
する課題は、遺伝子配列の持つ特徴を配列類似性検索の
結果から抽出し、その遺伝子機能を推定する際におい
て、類似性が比較的高くないデータベースエントリーし
か存在しない場合にも、信頼性の高い結果が得られる遺
伝子配列表現システム及び記録媒体を提供することであ
る。
【0004】
【課題を解決するための手段】本発明では、着目する遺
伝子配列に対して、以下の処理ステップ (1)遺伝子配列データベースとの類似性検索を行い、
類似性が見られたデータベース配列との間で類似性指標
を計算するステップ (2)(1)で計算した類似性指標を、遺伝子配列のデ
ータベースに記載された文章中に出現したワードの全
て、あるいはその部分集合を考え、それぞれのワード毎
に収集するステップ (3)(2)でワード毎に収集された類似性指標に対し
て、その分布、あるいは分布の特徴を表す指標をワード
毎に計算するステップ (4)(3)でよって得られたワード毎の類似性指標の
分布、あるいは分布の特徴を表す指標の全てのワードに
ついての集合を、「類似性指標分布のワードに渡るプロ
ファイル」として得るステップ から構成される方法によって、着目する遺伝子配列の特
徴を表現するためのものであり、本発明は、塩基配列を
入力する入力手段と、該入力された塩基配列と遺伝子配
列データベース中の遺伝子の塩基配列との類似性指標
を、該遺伝子配列データベースの情報中に出現したワー
ドの全て又はその部分集合のそれぞれのワード毎に収集
し、該ワード毎に収集した類似性指標の分布、該類似性
指標分布のワードプロファイル、又は複数の前記入力さ
れた塩基配列についてのワードプロファイル間の類似性
を計算する計算手段と、該類似性指標の分布、該ワード
プロファイル、又は該ワードプロファイル間の類似性の
少なくともいずれか1つを出力する出力手段とを備える
ことを特徴とする遺伝子配列表現システムによって実現
される。
【0005】また、上記ワードプロファイルを複数の遺
伝子配列について算出しデータベースとして記録してお
くことで、任意のワードプロファイルに関する条件を満
たす配列についてのワードプロファイルを得ることがで
きる。さらに、本発明は、コンピュータを、塩基配列を
入力する入力手段と、該入力された塩基配列と遺伝子配
列データベース中の遺伝子の塩基配列との類似性指標
を、該遺伝子配列データベースの情報中に出現したワー
ドの全て又はその部分集合のそれぞれのワード毎に収集
し、該ワード毎に収集した類似性指標の分布、該類似性
指標分布のワードプロファイル、又は複数の前記入力さ
れた塩基配列についてのワードプロファイル間の類似性
を計算する計算手段と、該類似性指標の分布、該ワード
プロファイル、又は該ワードプロファイル間の類似性の
少なくともいずれか1つを出力する出力手段とを備える
遺伝子配列表現システム、として機能させるためのプロ
グラムを記録したことを特徴とするコンピュータ読み取
り可能な記録媒体である。
【0006】
【発明の実施の形態】以下、添付図面を参照しながら本
発明の好適な実施の形態について詳細に説明する。図1
は、本発明の一実施の形態による遺伝子配列表現システ
ムの構成を示す図である。本実施の形態はディスプレイ
1、キーボード2、中央演算装置CPU3、フロッピー
(登録商標)ディスク5が挿入されるフロッピーディス
クドライブ4、主メモリ6、及び遺伝子配列データベー
ス7から構成される。主メモリ6には、遺伝子配列表現
システムを実現する遺伝子配列表現プログラムが格納さ
れ、その遺伝子配列表現プログラムは、入力手段11、
計算手段12、出力手段13、記録手段14、選択手段
15、及び表示手段16の各手段に相当する機能を有す
る。このプログラムはディスプレイ1、キーボード2、
フロッピーディスクドライブ4、主メモリ6、及び遺伝
子配列データベース7などと共同して、CPU3で実行
される。
【0007】本発明における遺伝子配列の持つ特徴を配
列類似性検索の結果から抽出する実施の形態を説明す
る。本実施の形態においては、着目する遺伝子配列とし
て全長cDNA配列を考え、遺伝子配列データベースと
して、アミノ酸配列データベースであるSWISS-PROT(Tr
ademarkは、Swiss Institute of Bioinfomatics and/or
the SIB partnersが所有)を用いた場合の説明を行う。
まず、図2に示すようにステップ101で、着目する遺
伝子配列について、遺伝子配列データベースとの類似性
検索を行う。類似性検索のプログラムとして、米国ナシ
ョナル・センター・フォー・バイオテクノロジー・イン
フォメーション(NCBI)がインターネット上で一般公開
しているBLASTX、あるいは類似のプログラムを用いる。
【0008】次に、ステップ102で類似性検索の結果
から、類似性指標の計算を行う。類似性指標としては、
BLASTXのアラインメントから得られる変数、あるいは変
数の関数を用いる。BLASTXのアラインメントから得られ
る変数としては、アラインメントの長さであるコンセン
サス長、アラインメント中の一致した文字の割合である
identity、類似性検索の指標であるP-value、スコア等
がある。ここで用いる類似性指標としては、類似性の低
い領域から高い領域まで広く類似性を表現可能な指標が
望ましい。P-valueやスコアは、類似性の低い場合の有
意なしきい値を与えるためには適しているが、類似性の
高い場合、例えば完全に一致している場合の値が配列の
長さによって異なるため、類似性の高さを一律に表現す
ることが不可能である。同様な理由で、類似性の高い場
合は、類似性指標としてコンセンサス長とidentityの併
用が望ましい。そこでここでは、図3に示すように類似
性の高い場合はコンセンサス長とidentityを用い、類似
性の低い場合はP-valueを用いる方法を適用し、類似性
の高い順に4種類の類似性指標A、B、C、Nを定義し
た。また、もうひとつの類似性指標として、identityと
コンセンサス長を併用した指標を定義する。この場合
は、コンセンサス長が50アミノ酸より短い場合は、類
似性がないとする。コンセンサス長が50アミノ酸以上
の場合は、identityを類似性指標とする。
【0009】次に、ステップ103でデータベース配列
とのアラインメントから得られた類似性指標を、アライ
ンメントされたデータベースエントリー中に出現するワ
ード毎に収集する。ここでは、データベース中の蛋白質
の機能を表現するためのワードとして、SWISS-PROT中の
KEYWORD項目に記載されているワード(キーワード)を
用いる例を説明する。また、類似性指標として、図3で
定義された指標を用いた場合を説明する。例えば、ある
データベースエントリーとのアラインメントから得られ
る類似性指標がAであり、そのエントリーのKEYWORD項
目に記載されているキーワードが、KINASEであった場合
は、KINASEに類似性指標Aをひとつカウントする。ワー
ドの具体例としては、この他に、KEYWORD項目に記載さ
れているキーワードとして、Keywords(KW)のBrain; N
eurone; Phosphorylation; Acetylation; Multigene fa
mily; RNA-binding; Transferase; Nucleotidyltransfe
rase; Interferon inductionなどがあり、TAXONOMY項目
に記載されているキーワードとして、Organism source
(OS)のHomo sapiens (Human); Mus musculus (Mouse)
などがあり、また、E.C.Noとして、EC 2.7.7.-など
がある。
【0010】次に、ステップ104で上記で収集された
キーワード毎の類似性指標をもとに、キーワード毎の類
似性指標分布を計算する。図4にその結果を示す。図4
は、キーワード(KEYWORD)1、キーワード2、キーワ
ード3のそれぞれに対して、類似性指標A、B、Cにそ
れぞれ属するアラインメント数を表わす図である。この
例では、キーワード1とキーワード2に類似性指標分布
が存在することがわかる。これは、キーワード1とキー
ワード2が着目する遺伝子の機能に関係することを示し
ている。キーワード1では、類似性指標の最大値がAで
あり、キーワード2では、類似性指標の最大値がBであ
る。これは、キーワード1のほうが着目する遺伝子の機
能により関係し、キーワード2は関係が少ないことがわ
かる。従って、ステップ105で示すように、類似性指
標分布の指標(ワードプロファイル)として類似性指標
分布の最大値を各キーワードについて計算し、キーワー
ドプロファイルを求めれば、着目する遺伝子機能の推定
に有効であると考えられる。ステップ106で示すよう
に、図5に複数の遺伝子cDNAに対して求めた、類似
性指標分布の最大値であるキーワードプロファイルを示
す。このように、予め複数の遺伝子cDNAに対して、
キーワードプロファイルとして類似性指標分布の最大値
を計算し、データベースに登録しておけば、このキーワ
ードプロファイルをキーにして、登録しておいたデータ
ベース中のcDNAを検索することが可能である。例え
ば、図5のcDNAに対して、キーワード1の類似性指
標の最大値がA以上、キーワード2の類似性指標の最大
値がB以上という条件で検索すれば、cDNA1とcD
NAが条件に合致し選択できることがわかる。このよ
うに本方法を用いれば、ユーザーが求める機能を有する
遺伝子をデータベース中から選別することが可能にな
る。
【0011】特定の機能を表す検索条件を、遺伝子ファ
ミリーの持つ情報から求めることも可能である。まず、
遺伝子ファミリーに属する各遺伝子について、類似性指
標分布のワードプロファイルを計算する。この場合の類
似性指標としては、identityとコンセンサス長を併用し
た指標を用いる。上記プロファイルから、遺伝子ファミ
リーを代表する類似性指標分布のワードプロファイルを
計算する。遺伝子ファミリーを代表する類似性指標分布
のワードプロファイルは、例えば、式1で示すように、
遺伝子ファミリーfについての平均ワードプロファイル
μfkとして計算することができる。平均ワードプロファ
イルは、キーワードk毎に平均をとったもののプロファ
ルとして計算できる。また、遺伝子ファミリーfについ
ての、キーワードkにおけるワードプロファイルの分散
σfkを式2で定義する。
【0012】
【数1】
【0013】
【数2】 ここに、 Pik;遺伝子ファミリーf内のi番目の遺伝子について
の類似性ワードプロファイルにおけるk番目ワード成分 m;遺伝子ファミリーf内の遺伝子の数
【0014】次に、cDNAデータベース中の各cDN
Aに対して、類似性指標分布のワードプロファイルを計
算する。上記cDNAデータベースから検索条件に合致
するcDNAを検索するための条件を、上記μfkとσfk
から式3に示すように、各キーワード毎の類似性指標分
布最大値の下限しきい値Tfkとして定義できる。
【0015】
【数3】 ここに、 Tfk;遺伝子ファミリーfの機能を持つ遺伝子を検索す
る場合の類似性プロファイルにおける、k番目のワード
成分の閾値
【0016】本条件を検索条件として用いる場合には、
各キーワード毎の類似性指標分布最大値に対して、式3
のしきい値以上の条件を満たすcDNAを選別する。こ
のようにして、cDNAを検索することにより、着目す
る遺伝子ファミリーの機能に近いcDNAを選別するこ
とが可能である。選別された遺伝子については、図6に
示すように、各類似性指標に属するデータベースエント
リー名と、データベース内容へのリンクを同時に表示す
ることで、着目する遺伝子の機能推定を効率良く行うこ
とができる。ここでは、キーワード(KEYWORD)1、キー
ワード2、キーワード3のそれぞれに対して、各類似性
指標A、B、Cに属するデータベースエントリー名を表
示している。また、エントリー名からデータベース内容
へのリンクを張っている。
【0017】次に、キーワード類似性プロファイルを、
二つの遺伝子配列間の機能の類似性の表現に用いる例を
示す。上述したように、キーワード類似性プロファイル
は、遺伝子機能の推定に有効に用いることができる。そ
こで、二つの遺伝子配列のキーワード類似性プロファイ
ル間の類似性を定義すれば、二つの遺伝子配列間機能の
類似性を表現できると考えられる。この場合の類似性指
標としては、identityとコンセンサス長を併用した指標
を用いる。二つの遺伝子配列のキーワード類似性プロフ
ァイル間類似性Rijを式4のように定義する。
【0018】
【数4】 ここに、 Rij;遺伝子iと遺伝子j間の類似性ワードプロファイ
ルに基づいた類似度
【0019】Rijは、キーワード類似性プロファイル間
の重なりに比例し、同一のプロファイルの場合に1の値
になるように規格化されている。Rijを類似性指標に用
いて、データベース中の遺伝子配列を検索することが可
能である。また、Rijを用いてデータベース中の遺伝子
配列のクラスタリングを行うことも可能である。
【0020】なお、本発明は上記実施の形態に限定され
るものではない。本発明は、コンピュータを上記遺伝子
配列表現システムとして機能させるためのプログラムを
記録したコンピュータ読み取り可能な記録媒体であって
もよく、例えば、磁気テープ、CD−ROM、ICカー
ド、RAMカード等のいかなるタイプの記録媒体であっ
てもよい。
【0021】
【発明の効果】本発明によれば、遺伝子配列の持つ特徴
を配列類似性検索の結果から抽出し、その遺伝子機能を
推定する際において、類似性が比較的高くないデータベ
ースエントリーしか存在しない場合にも、信頼性の高い
結果を得ることが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施の形態による遺伝子配列表現シ
ステムの構成を示す図。
【図2】本発明の一実施の形態における、ワードプロフ
ァイル計算処理の流れを示す図。
【図3】類似性指標A、B、C、Nを定義する図。
【図4】類似性指標分布のキーワードプロファイルを表
す図。
【図5】複数の遺伝子cDNAに対して求めた、類似性
指標分布の最大値であるキーワードプロファイルを示す
図。
【図6】類似性指標分布のキーワードプロファイルの表
示方法を示す図。
【符号の説明】
1 ディスプレイ 2 キーボード 3 CPU 4 フロッピーディスクドライブ 5 フロッピーディスク 6 主メモリ 7 遺伝子配列データベース 101 遺伝子配列データベースとの類似性検索を行う
ステップ 102 類似性指標の計算を行うステップ 103 類似性指標をワード毎に収集するステップ 104 キーワード毎の類似性指標分布を計算するステ
ップ 105 類似性指標分布の指標を計算するステップ 106 キーワード毎の類似性指標分布を出力するステ
ップ
フロントページの続き (72)発明者 原田 直之 東京都国分寺市東恋ヶ窪一丁目280番地 株式会社 日立製作所 中央研究所内 (72)発明者 磯貝 隆夫 茨城県稲敷郡阿見町大室511−12 (72)発明者 太田 紀夫 神奈川県藤沢市辻堂新町1−2−7− 105 (72)発明者 杉山 友康 千葉県木更津市清見台2−6−23−102 (72)発明者 永井 啓一 東京都東大和市桜が丘3−44−14−9− 204 (56)参考文献 佐藤賢二,タンパク質立体構造データ の検索とデータマイニング,bit,日 本,共立出版株式会社,1999年10月1 日,Vol.31,No.10,p.76−83 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 C12N 15/00 JICSTファイル(JOIS)

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 塩基配列を入力する入力手段と、該入力
    された塩基配列と遺伝子配列データベース中の遺伝子の
    塩基配列との類似性指標を、該遺伝子配列データベース
    の情報中に出現したワードの全て又はその部分集合のそ
    れぞれのワード毎に収集し、該ワード毎に収集した類似
    性指標の分布、該類似性指標分布のワードプロファイ
    ル、又は複数の前記入力された塩基配列についてのワー
    ドプロファイル間の類似性を計算する計算手段と、該類
    似性指標の分布、該ワードプロファイル、又は該ワード
    プロファイル間の類似性の少なくともいずれか1つを出
    力する出力手段とを備えることを特徴とする遺伝子配列
    表現システム。
  2. 【請求項2】 前記入力手段は、ワードプロファイルに
    関する検索条件を入力するものであり、前記入力された
    塩基配列と前記ワードプロファイルとを関連づけて複数
    の塩基配列について予め記録しておく記録手段と、前記
    入力手段によって入力された検索条件に合致するワード
    プロファイルに関連づけられている塩基配列を前記記録
    手段によって記録されている複数の塩基配列の中から選
    択する選択手段と、該選択された塩基配列に関連づけら
    れているワードプロファイルを表示する表示手段とを備
    えることを特徴とする請求項1記載の遺伝子配列表現シ
    ステム。
  3. 【請求項3】 前記計算手段は、前記ワードの部分集合
    としてKEYWORD項目又はTAXONOMY項目に記載されている
    ワード若しくはE.C.Noの少なくともいずれか1つを
    用いることを特徴とする請求項1又は2記載の遺伝子配
    列表現システム。
  4. 【請求項4】 前記計算手段は、前記類似性指標とし
    て、配列間アラインメントから得られる変数の関数を用
    いることを特徴とする請求項1乃至3いずれかに記載の
    遺伝子配列表現システム。
  5. 【請求項5】 前記計算手段は、前記ワードプロファイ
    ルとして、類似性指標分布の最大値又は平均値を用いる
    ことを特徴とする請求項1乃至4いずれかに記載の遺伝
    子配列表現システム。
  6. 【請求項6】 前記計算手段は、前記ワードプロファイ
    ル間の類似性として、前記ワードプロファイル間の差の
    二乗をワード毎に計算し、ワードにわたって和をとるこ
    とによって得られる数値を用いることを特徴とする請求
    項1乃至5いずれかに記載の遺伝子配列表現システム。
  7. 【請求項7】 コンピュータを、塩基配列を入力する入
    力手段と、該入力された塩基配列と遺伝子配列データベ
    ース中の遺伝子の塩基配列との類似性指標を、該遺伝子
    配列データベースの情報中に出現したワードの全て又は
    その部分集合のそれぞれのワード毎に収集し、該ワード
    毎に収集した類似性指標の分布、該類似性指標分布のワ
    ードプロファイル、又は複数の前記入力された塩基配列
    についてのワードプロファイル間の類似性を計算する計
    算手段と、該類似性指標の分布、該ワードプロファイ
    ル、又は該ワードプロファイル間の類似性の少なくとも
    いずれか1つを出力する出力手段とを備える遺伝子配列
    表現システム、として機能させるためのプログラムを記
    録したことを特徴とするコンピュータ読み取り可能な記
    録媒体。
JP2000325354A 2000-10-25 2000-10-25 遺伝子配列表現システム及び記録媒体 Expired - Fee Related JP3340424B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000325354A JP3340424B2 (ja) 2000-10-25 2000-10-25 遺伝子配列表現システム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000325354A JP3340424B2 (ja) 2000-10-25 2000-10-25 遺伝子配列表現システム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2002132780A JP2002132780A (ja) 2002-05-10
JP3340424B2 true JP3340424B2 (ja) 2002-11-05

Family

ID=18802733

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000325354A Expired - Fee Related JP3340424B2 (ja) 2000-10-25 2000-10-25 遺伝子配列表現システム及び記録媒体

Country Status (1)

Country Link
JP (1) JP3340424B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6222202B2 (ja) * 2010-07-05 2017-11-01 ソニー株式会社 生体情報処理方法および装置、並びに記録媒体
JP5838557B2 (ja) 2010-07-05 2016-01-06 ソニー株式会社 生体情報処理方法および装置、並びに記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
佐藤賢二,タンパク質立体構造データの検索とデータマイニング,bit,日本,共立出版株式会社,1999年10月1日,Vol.31,No.10,p.76−83

Also Published As

Publication number Publication date
JP2002132780A (ja) 2002-05-10

Similar Documents

Publication Publication Date Title
JP5075291B2 (ja) 情報処理装置、情報処理方法、情報処理プログラムを記録した記録媒体
US8073865B2 (en) System and method for content extraction from unstructured sources
CN112817914A (zh) 基于注意力的深度跨模态哈希检索方法、装置及相关设备
JP6033697B2 (ja) 画像評価装置
KR101955244B1 (ko) 논문 평가 방법 및 전문가 추천 방법
Wu et al. Optimal word sizes for dissimilarity measures and estimation of the degree of dissimilarity between DNA sequences
CN108874755B (zh) 基于MeSH的医学文献集相似性度量方法
CN110569349A (zh) 基于大数据的患教文章推送方法、系统、设备及存储介质
Alvarez et al. A graph-based semantic similarity measure for the gene ontology
JP2011513810A (ja) 用語識別方法および装置
KR102402466B1 (ko) 키워드 클러스터링을 이용한 문서 요약 방법 및 장치
JP3820878B2 (ja) 情報検索装置,スコア決定装置,情報検索方法,スコア決定方法及びプログラム記録媒体
Liu et al. A semi-automated genome annotation comparison and integration scheme
CN111339778B (zh) 文本处理方法、装置、存储介质和处理器
JP3340424B2 (ja) 遺伝子配列表現システム及び記録媒体
JP5869948B2 (ja) パッセージ分割方法、装置、及びプログラム
WO2014027999A1 (en) Dynamic content preview
Ebrahimi et al. Analysis of Persian Bioinformatics Research with Topic Modeling
JP2008234618A (ja) 知識抽出装置、知識抽出方法およびコンピュータプログラム
JP7117168B2 (ja) 情報処理装置および情報処理方法
JP5411802B2 (ja) 代表語抽出装置、代表語抽出方法および代表語抽出プログラム
US7933853B2 (en) Computer-readable recording medium, apparatus and method for calculating scale-parameter
JPWO2004104859A1 (ja) テーマ分析装置、テーマ分析方法およびその方法をコンピュータに実行させるテーマ分析プログラム
CN112185573B (zh) 一种基于lcs和tf-idf的相似字符串确定方法及装置
JP7441982B2 (ja) クエリ整形システム、クエリ整形方法、及びプログラム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070816

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080816

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees