JP2006099388A - テキストマイニングサーバ及びテキストマイニングシステム - Google Patents
テキストマイニングサーバ及びテキストマイニングシステム Download PDFInfo
- Publication number
- JP2006099388A JP2006099388A JP2004284291A JP2004284291A JP2006099388A JP 2006099388 A JP2006099388 A JP 2006099388A JP 2004284291 A JP2004284291 A JP 2004284291A JP 2004284291 A JP2004284291 A JP 2004284291A JP 2006099388 A JP2006099388 A JP 2006099388A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- list
- text mining
- feature list
- keyid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005065 mining Methods 0.000 title claims abstract description 35
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 19
- 238000004040 coloring Methods 0.000 claims description 10
- 230000005540 biological transmission Effects 0.000 claims description 6
- 238000000034 method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 3
- 238000002493 microarray Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
- G06F16/337—Profile generation, learning or modification
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioethics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】 複数の遺伝子からなる遺伝子群全体の特徴を簡単に把握したい。
【解決手段】 クライアントから複数の検索キーを受け付け(102A)検索キーと文献群の対応関係が記録されているテーブルを参照し、受け付けた複数の検索キーにそれぞれ対応する文献群のセットを取得する(102B)。次に、検索キーのそれぞれについて相対重要度を持つ特徴語リストを作成し(102C)、それらを基に特徴一覧表を作成する(102D)。最終的に特徴一覧表をソートし(103B)、彩色を行い表示する(103C)。
【選択図】 図11
【解決手段】 クライアントから複数の検索キーを受け付け(102A)検索キーと文献群の対応関係が記録されているテーブルを参照し、受け付けた複数の検索キーにそれぞれ対応する文献群のセットを取得する(102B)。次に、検索キーのそれぞれについて相対重要度を持つ特徴語リストを作成し(102C)、それらを基に特徴一覧表を作成する(102D)。最終的に特徴一覧表をソートし(103B)、彩色を行い表示する(103C)。
【選択図】 図11
Description
本発明は、ライフサイエンス分野で実験結果の解析を行うテキストマイニングサーバ及びテキストマイニングシステムに関する。
ライフサイエンス分野においては情報の多くがテキスト形式の文書で保存され、その量の多さ故にユーザが本当に必要とする情報まで辿り着くことが困難になっている。近年、テキストマイニング技術が向上してきたことから、それらテキスト形式の文書に対しテキストマイニングを行い有益な情報を得る手段が広く使われるようになった。その応用として、マイクロアレイの実験結果の解析がある。マイクロアレイの実験結果の解析とは、数十から数百にも及ぶ遺伝子の特徴を何らかの形で把握することである。その実現のために遺伝子毎に関連する文献情報を取得し、得られた文献群全体に対してテキストマイニングを行うという手法がある。既知の遺伝子は公共のデータベースにユニークなIDが振られて登録されており、文献情報の取得には遺伝子毎に振られているこのKeyIDにより検索を行う。
従来のテキストマイニングは例えば、「クライアントコンピュータからサーバコンピュータにKeyIDを送信し、サーバコンピュータは受信したKeyIDをKeyID・文献リンクテーブルと比較してKeyIDに関連する文献のリストを取得する。次に、取得した文献リストに挙げられている文献のテキストから特徴語抽出プログラムを用いて特徴語リストを取得する。」といった方法1や「遺伝子・特徴語を縦軸・横軸として持ち、また要素としてその特徴語の重要度を計算し表として表示する」といった方法2があった。なお、テキストマイニングに関連する文献としては下記特許文献1がある。
特開2003−099427号公報
テキストマイニングで望まれることは、入力した遺伝子(KeyID)群の「多く」に「強く」出てくる特徴を「簡単」に把握することである。
しかし、方法1では「多く」の(つまり複数の)遺伝子に出てくる特徴を一度に把握することが困難であるし、方法2では表の要素が数字であるため「簡単」に把握することが困難である(すなわち特徴を把握するために更に作業を行う必要がある)。また方法2において重要度に応じて色付けを行っている例もあるが、表全体の中で最も高い値を示すものが強調されるなど「多く」の遺伝子に共通して「強く」出ている特徴であるかどうかを判定することができない(すなわち値がKeyID毎の相対尺度ではなく、表全体で統一された絶対尺度で評価されていることが問題である)。
本発明は、入力された遺伝子群の多くに共通して強く出てくる特徴を簡単に把握する手段を提供することを目的とする。
上記目的を達成するため、本発明のテキストマイニングサーバは、複数の検索キーを受け付ける検索キー受付手段と、検索キーと文献群の対応関係が記録されているデータベースを検索し、受け付けた複数の検索キーにそれぞれ対応する文献群のセットを取得する手段と、受け付けた複数の検索キーのそれぞれについて、取得した文献群から特徴語を抽出し相対重要度を計算し特徴語リストを作成する特徴語リスト作成手段と、検索キー毎の特徴語リストをまとめて特徴一覧表を作成する特徴一覧表作成手段と、マイニング結果として前記特徴一覧表を出力する出力手段とを備える。またクライアントコンピュータはテキストマイニングサーバ上で作成された特徴一覧表を受信する特徴一覧表受信手段と受信した特徴一覧表をソート・色付けし表示する手段とを備える。
このテキストマイニングサーバ及びクライアントコンピュータの機能は、コンピュータプログラムによって実現される。
本発明によれば各遺伝子の特徴が相対重要度を使って表されるため、遺伝子毎に重要な特徴語が何であるかを把握でき、結果的に多くの遺伝子に共通して強く出てくる特徴を把握することができる。更にソート・色付けを行うことにより、多くの遺伝子に共通して強く出てくる特徴を視覚的に捉えることが可能となる。
以下、本発明を実施する場合の一形態を、図面を参照して具体的に説明する。
図1は、本発明によるテキストマイニングシステムの概念図である。ここに示すシステムは、KeyIDの入力・送信及び特徴一覧表の受信・彩色を行うクライアントコンピュータ(以下、単にクライアントという)1、テキストマイニングを行うテキストマイニングサーバコンピュータ(以下、単にサーバという)3、文献情報を保持する文献情報データベース4及びKeyIDと文献情報の関連テーブル(もしくはその作成元となる情報)を保持しているKeyIDデータベース5を備え、それぞれはネットワーク2によって接続されている。
図1は、本発明によるテキストマイニングシステムの概念図である。ここに示すシステムは、KeyIDの入力・送信及び特徴一覧表の受信・彩色を行うクライアントコンピュータ(以下、単にクライアントという)1、テキストマイニングを行うテキストマイニングサーバコンピュータ(以下、単にサーバという)3、文献情報を保持する文献情報データベース4及びKeyIDと文献情報の関連テーブル(もしくはその作成元となる情報)を保持しているKeyIDデータベース5を備え、それぞれはネットワーク2によって接続されている。
クライアント1は、CPU211A及びメモリ211Bを備えた端末装置211、KeyID送信プログラム212A、特徴一覧表受信プログラム212B、特徴一覧表彩色プログラム212C及び特徴一覧表ソートプログラム212Dが格納されているハードディスク装置212、並びにネットワーク接続のための通信ポート213を備えている。サーバ3は、CPU231A及びメモリ231Bを備えた端末装置231、クライアント1から送信されるKeyIDを受信するKeyID受信プログラム232A、文献情報データベース4から後述の文献情報232Cを取得する文献情報取得プログラム232B、KeyIDデータベース5から後述のKeyID・文献リンクテーブル232Eを取得するKeyID・文献リンクテーブル取得プログラム232D、文献情報232Cから特徴語を抽出する特徴語リスト作成プログラム232F、KeyID群の特徴をまとめた特徴一覧表を作成する特徴一覧表作成プログラム232G、マイニング結果である特徴一覧表を送信する特徴一覧表送信プログラム232Hを格納したハードディスク装置232、並びにネットワーク接続のための通信ポート233を備えている。
なお、文献情報232Cは、文献情報データベース4の情報から必要な部分をサーバ内のハードディスク装置232に保持したもの、KeyID・文献リンクテーブル232Eは、KeyIDと文献情報の関連テーブル(もしくはその作成元となる情報)を保持しているKeyIDデータベース5から作成しサーバ内のハードディスク装置232に保持したものである。実際には、このようにネットワークに接続されたデータベースからテキストマイニングに使用する情報はローカルに持つようにする。
図2は、サーバ3上のハードディスク装置232に格納されているKeyID・文献リンクテーブル232Eの例である。KeyID31と各KeyIDに関連する文献ID32の組が格納されている。このテーブルでは例えば、KeyIDが「AA0000」の遺伝子については、これに関連する文献として「Text1」、「Text2」、「Text3」、「Text4」の4件の文献が登録されており、KeyIDが「AB1111」の遺伝子の関連文献としては「Text2」と「Text5」の2件の文献が登録されている。
図3は、サーバ3上のハードディスク装置232に格納されている文献情報232Cの一例を示した図である。文献情報232Cには文献ID41と各文献IDに対する作者42、題名43、本文(テキスト)44の組が格納されている。文献ID41は図3の文献ID32に対応している。この例では作者、題名、本文を文献情報として格納しているが、この他にアブストラクト、出版年などを文献情報として格納してもよい。
図4は、クライアント1上で稼動するKeyID送信プログラム212Aの画面例である。画面上にはメニュー51、KeyID入力フィールド52、送信ボタン54がある。KeyID入力フィールド52にKeyIDを入力(例えば53のように入力する。複数入力されてもかまわない。)し送信ボタン54を押下することにより、入力されたKeyID53がテキストマイニングサーバ3に送信される。
図5はサーバ3上で稼動する特徴語リスト作成プログラム232Fのフローチャートの一例である。特徴語リストの作成はまず、KeyID受信プログラム232Aが受信したKeyIDの1つを受け取り(ステップ61A)KeyID・文献リンクテーブル232E(図2)と比較することにより関連文献を取得する(ステップ61B)ことから始まる。次に取得した関連文献から語を抽出しその重要度を計算する(ステップ61C)。重要度の計算方法は任意とするが、例としてはテキストマイニングの分野で広く使用されているtf (Term Frequency)・idf(Inverse Document Frequency)を使用する方法がある。tf・idfとは、T(W):単語Wを含む文献の総数、N:全文献数、F(W, Q):単語Wの文献Qでの出現頻度としたとき、単語Wの文献Qでの重要度を"F(W, Q)*Log[ N / T(W) ]"で定義する方法である。F(W, Q)がtfに相当し、Log[ N / T(W) ]がidfに相当する。なお、抽出する特徴語に関しては例えば重要度の高いものから10個を抽出するものとする。次に、各特徴語の相対重要度を算出する(ステップ61D)。
図6は、特徴語リスト作成プログラム232Fによって作成された特徴語リストの一例である。このリストにはKeyID71とそのKeyIDの特徴語72とその特徴語の相対重要度73が格納されている。ここで相対重要度とは算出された各単語の重要度(tf・idf値等)を、最も高い重要度で割った値のことである。したがって各特徴語リストには相対重要度が1となる単語が必ず存在し、また相対重要度の値は1以下となる。特徴語リストは最終的に特徴一覧表作成プログラム232Gに渡される。
図7はサーバ3上で稼動する特徴一覧表作成プログラム232Gのフローチャートの一例である。特徴一覧表作成プログラム232GはKeyID受信プログラム232Aが受信したKeyIDの数だけ作成される特徴語リストから特徴一覧表を作成する。作成の手順はまず、特徴語リスト作成プログラム232Fにより作成された特徴語リスト群を受け取る(ステップ11A)。次に各KeyIDの特徴語をマージしたリストXを取得し(ステップ11B)、縦軸・横軸にそれぞれKeyID・リストXを持つ表Yを作成する(ステップ11C)。そして各特徴語リストを基に作成した表Yの要素として相対重要度を挿入する(ステップ11D)。
図8は特徴一覧表作成プログラム232Gにより作成された特徴一覧表の一例である。特徴一覧表は縦軸としてKeyID受信プログラム232Aが受信したKeyID81、横軸として特徴語82を持ち、要素として相対重要度83を持つ。KeyID81は図6の71に、特徴語82は図6の72に、相対重要度83は図6の73に対応している。
図9は特徴一覧表ソートプログラム212Dによってソートされた特徴一覧表の一例である。縦軸にKeyID91、横軸に特徴語92を持ち、要素として相対重要度93を持つ。ソートの対象は特徴一覧表受信プログラム212Bが受信した特徴一覧表の列であり、ソート基準は例えば次のとおりである。
(i) 各列ごとに相対重要度の合計を算出し合計値の高いものが表の左側に配置される列とする。
(ii) 上記(i)において合計値が同じ場合は各列の0より大きい重要度を持つKeyIDの個数を比較し個数が多い列が表の左側に配置されるものとする。
(iii) 上記(ii)においてKeyIDの個数が同じ場合は各列の最高値を比較し、値が高い列が表の左側に配置されるものとする。
(iv) 上記(i)〜(iii)の全てが同じであった場合はアルファベット順等とする。
(i) 各列ごとに相対重要度の合計を算出し合計値の高いものが表の左側に配置される列とする。
(ii) 上記(i)において合計値が同じ場合は各列の0より大きい重要度を持つKeyIDの個数を比較し個数が多い列が表の左側に配置されるものとする。
(iii) 上記(ii)においてKeyIDの個数が同じ場合は各列の最高値を比較し、値が高い列が表の左側に配置されるものとする。
(iv) 上記(i)〜(iii)の全てが同じであった場合はアルファベット順等とする。
このことにより、入力されたKeyID群に対し強い特徴を示す単語群が特徴一覧表の左側に集められ、特徴の把握を容易にする。
図10は特徴一覧表彩色プログラム212Cによって彩色された特徴一覧表の一例である。縦軸にKeyID111、横軸に特徴語112を持ち、要素として色付けされたセル113を持つ。図10は図9に対応しておりセル113は図9の相対重要度93を基に色付けされている。色付けの方法は任意とするが、例えばマイクロアレイの発現解析の際に使用されるヒートマップなどを使う方法が考えられる。この色付けにより、特徴一覧表の列単位で特徴の強弱を視覚的に把握でき、また1つの列の中でも強く特徴を示しているKeyIDが何であるかを容易に把握することが可能となる。
図11は本システムを用いたKeyIDを入力してから彩色された特徴一覧表を取得するまでの手順の例を示したフローチャートである。特徴一覧表の作成はまず、クライアント1において複数のKeyIDを入力し(ステップ101A)、入力された複数のKeyIDをサーバ3に送信する(ステップ101B)ことにより開始される。サーバ3は送信されたKeyIDを受信し(ステップ102A)、受信したKeyIDをKeyID・文献リンクテーブル232E(図2)と比較することによりKeyID毎に関連文献を取得する(ステップ102B)。続くステップ102Cでは、特徴語リスト作成プログラム232Fを各KeyIDの関連文献に対して実行し、KeyID毎に特徴語リスト(図6)を作成する。更に作成した特徴語リスト群から特徴一覧作成プログラム232Gを用いて特徴一覧表を作成(ステップ102D)し、特徴一覧表送信プログラム232Hによってクライアント1に送信する(ステップ102E)。クライアント1は送信された特徴一覧表を受信し(ステップ103A)、特徴一覧表ソートプログラム212Dを用いて彩色・表示を行い(ステップ103B)、特徴一覧表彩色プログラム212Cを用いて彩色・表示を行い(ステップ103C)、一連の流れが終了する。
1…クライアントコンピュータ、2…ネットワーク、3…テキストマイニングサーバコンピュータ、4…文献情報データベース、5…KeyIDデータベース
Claims (6)
- 複数の検索キーを受け付ける検索キー受付手段と、
検索キーと文献群の対応関係が記録されているデータベースを検索し、前記受け付けた複数の検索キーにそれぞれ対応する文献群のセットを取得する手段と、
前記受け付けた検索キー毎に、当該検索キーに対応する文献群のセットから特徴語と特徴語の相対重要度を抽出し特徴語リストを作成する特徴語リスト作成手段と、
前記検索キーの数だけ作成された特徴語リストから特徴語をマージした特徴一覧表を作成する特徴一覧表作成手段と、
マイニング結果として前記特徴一覧表を出力する出力手段と、
を備えることを特徴とするテキストマイニングサーバ。 - 請求項1記載のテキストマイニングサーバにおいて、前記検索キー受付手段はクライアントコンピュータから複数の検索キーを受信し、前記出力手段は前記マイニング結果を前記クライアントコンピュータに送信することを特徴とするテキストマイニングサーバ。
- 請求項1又は2記載のテキストマイニングサーバにおいて、前記検索キーは遺伝子を特定する識別記号であることを特徴とするテキストマイニングサーバ。
- コンピュータを請求項1〜3のいずれか1項記載のテキストマイニングサーバとして動作させるためのプログラム。
- 請求項2記載のテキストマイニングサーバとクライアントコンピュータを含み、
前記クライアントコンピュータは、
前記テキストマイニングサーバへ複数の検索キーを送信する検索キー送信手段と、
前記テキストマイニングサーバから前記特徴一覧表を受信する特徴一覧表受信手段と、
前記受信した特徴一覧表をソートする特徴一覧ソート手段と
前記ソートした特徴一覧表を彩色する特徴一覧表彩色手段と、
を備えることを特徴とするテキストマイニングシステム。 - 請求項5記載のテキストマイニングシステムにおいて、前記検索キーは遺伝子を特定する識別記号であることを特徴とするテキストマイニングシステム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004284291A JP2006099388A (ja) | 2004-09-29 | 2004-09-29 | テキストマイニングサーバ及びテキストマイニングシステム |
US11/189,047 US20060080296A1 (en) | 2004-09-29 | 2005-07-26 | Text mining server and text mining system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004284291A JP2006099388A (ja) | 2004-09-29 | 2004-09-29 | テキストマイニングサーバ及びテキストマイニングシステム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006099388A true JP2006099388A (ja) | 2006-04-13 |
Family
ID=36146612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004284291A Pending JP2006099388A (ja) | 2004-09-29 | 2004-09-29 | テキストマイニングサーバ及びテキストマイニングシステム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20060080296A1 (ja) |
JP (1) | JP2006099388A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5180822B2 (ja) * | 2006-04-28 | 2013-04-10 | 独立行政法人理化学研究所 | バイオアイテム検索装置、バイオアイテム検索端末装置、バイオアイテム検索方法、および、プログラム |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4524640B2 (ja) * | 2005-03-31 | 2010-08-18 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
WO2009030246A1 (de) * | 2007-09-03 | 2009-03-12 | Iqser Ip Ag | Erfassung von zusammenhängen zwischen informationen repräsentierenden daten |
EP2193456A1 (de) * | 2007-09-03 | 2010-06-09 | IQser IP AG | Erfassung von zusammenhängen zwischen informationen repräsentierenden daten |
EP2193455A1 (de) * | 2007-09-03 | 2010-06-09 | IQser IP AG | Erfassung von zusammenhängen zwischen informationen repräsentierenden daten |
EP2193457A1 (de) * | 2007-09-03 | 2010-06-09 | IQser IP AG | Erfassung von zusammenhängen zwischen informationen repräsentierenden daten |
CN104991968B (zh) * | 2015-07-24 | 2018-04-20 | 成都云堆移动信息技术有限公司 | 基于文本挖掘的互联网媒体用户属性分析方法 |
DE102015216722A1 (de) * | 2015-09-01 | 2017-03-02 | upday GmbH & Co. KG | Datenverarbeitungssystem |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6457004B1 (en) * | 1997-07-03 | 2002-09-24 | Hitachi, Ltd. | Document retrieval assisting method, system and service using closely displayed areas for titles and topics |
JP3944102B2 (ja) * | 2003-03-13 | 2007-07-11 | 株式会社日立製作所 | 語義関連ネットワークを用いた文書検索システム |
-
2004
- 2004-09-29 JP JP2004284291A patent/JP2006099388A/ja active Pending
-
2005
- 2005-07-26 US US11/189,047 patent/US20060080296A1/en not_active Abandoned
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5180822B2 (ja) * | 2006-04-28 | 2013-04-10 | 独立行政法人理化学研究所 | バイオアイテム検索装置、バイオアイテム検索端末装置、バイオアイテム検索方法、および、プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20060080296A1 (en) | 2006-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20040133566A1 (en) | Data searching apparatus capable of searching with improved accuracy | |
EP1102181A1 (en) | Information sorting method, information sorter, recorded medium on which information sorting program is recorded | |
JP2005092271A (ja) | 質問応答方法及び質問応答装置 | |
US20050278293A1 (en) | Document retrieval system, search server, and search client | |
CN108038165B (zh) | 一种信息搜索方法、搜索装置、终端设备和服务器设备 | |
US20060080296A1 (en) | Text mining server and text mining system | |
CN101739407A (zh) | 自动构建用于相关信息浏览的信息组织结构的方法和系统 | |
US7302427B2 (en) | Text mining server and program | |
CN1928860B (zh) | 用于校正按键错误的方法、搜索装置和搜索系统 | |
JP4369104B2 (ja) | コミュニティ形成支援システム、その端末、サーバ及びプログラム | |
CN107870935A (zh) | 一种搜索方法及装置 | |
JP2005503615A (ja) | リアルネームを利用した検索システム及びその方法 | |
CN101119339B (zh) | 即时通信系统中建立多用户讨论组的方法及装置 | |
KR100869545B1 (ko) | 검색 히스토리를 생성하는 되풀이 검색시스템 | |
JP6152711B2 (ja) | 情報検索装置および情報検索方法 | |
JP4348357B2 (ja) | 関連文書表示装置 | |
JP2012069059A (ja) | 特定文字列除き文字列検索支援システムおよび検索支援方法、ならびにそのためのプログラム | |
KR20000073523A (ko) | 기존의 번호 체계를 이용하여 웹사이트에 연결하는 방법. | |
JP2007148741A (ja) | Web検索支援サーバ | |
US20050289135A1 (en) | Text mining server and program | |
JP2010134552A (ja) | コンテンツ管理システム、コンテンツ管理方法及びコンテンツ管理プログラム | |
JP4247026B2 (ja) | キーワード頻度算出方法及びそれを実行するプログラム | |
KR100921770B1 (ko) | 주소 입력 장치 및 그 방법 | |
JP2752864B2 (ja) | テキストベース情報検索装置 | |
JP6752705B2 (ja) | サーバ装置、情報処理装置、情報処理方法、およびプログラム |