JP2003345811A - 文書情報表示システム、文書情報表示方法及び文書検索方法 - Google Patents

文書情報表示システム、文書情報表示方法及び文書検索方法

Info

Publication number
JP2003345811A
JP2003345811A JP2002152594A JP2002152594A JP2003345811A JP 2003345811 A JP2003345811 A JP 2003345811A JP 2002152594 A JP2002152594 A JP 2002152594A JP 2002152594 A JP2002152594 A JP 2002152594A JP 2003345811 A JP2003345811 A JP 2003345811A
Authority
JP
Japan
Prior art keywords
document
axis
documents
information display
document information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002152594A
Other languages
English (en)
Other versions
JP4116329B2 (ja
Inventor
Osamu Konichi
修 今一
Tetsuo Nishikawa
哲夫 西川
Toru Hisamitsu
徹 久光
Makoto Iwayama
真 岩山
Masakazu Fujio
正和 藤尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2002152594A priority Critical patent/JP4116329B2/ja
Priority to US10/374,091 priority patent/US7047255B2/en
Publication of JP2003345811A publication Critical patent/JP2003345811A/ja
Application granted granted Critical
Publication of JP4116329B2 publication Critical patent/JP4116329B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99948Application of database or data structure, e.g. distributed, multimedia, or image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 複数文書の内容を一覧性を損なうことなく可
視化する。 【解決手段】 文書データベースから取り出された2つ
の文書ユニットの集合に対し、それぞれの要素間の関連
度を計算し、その結果を2次元座標上に関連度の強さに
応じて表示する。サーバは、関連度計算部、クラスタリ
ング部、単語抽出部を備える。関連度結果は、クライア
ントの表示部に表示される。関連度計算、クラスタリン
グの方法は、公知の技術を用いている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数の文書の内容
を概観表示する文書情報表示システム、文書情報表示方
法及び文書検索方法に関する。
【0002】
【従来の技術】コンピュータやインターネットの普及に
伴い、文書情報の電子化が急速に進んでいる。入手可能
な文書情報が増加するにつれ、その中から必要な情報を
探し出すことが重要な課題となってくる。情報検索技術
はこのような課題を解決するための技術であり、最近で
は、情報検索技術を応用した検索エンジン(サーチエン
ジンともいう)を利用して必要とする情報を検索するこ
とが一般的に行なわれている。
【0003】インターネット上で利用可能な代表的な検
索エンジンである Google(http://www.google.com)や
goo(http://www.goo.ne.jp)では、利用者が検索要求
を入力すると、それに関連するウェブページがインター
ネット上から検索され、結果が関連度順にリスト形式で
表示される。利用者はそこから自分に必要な情報を入手
するわけであるが、検索結果の中には利用者の検索要求
とは無関係なものが含まれることがある。しかし、検索
結果が単なるリスト形式で表示されているだけでは、検
索結果の内容を個々に判断しながら取捨選択する必要が
あり面倒である。したがって、検索結果として得られた
文書集合がどのようなものであるかを利用者が容易に判
断できる仕組みが必要となってくる。
【0004】これに対する一つのアプローチとして、ク
ラスタリング技術を利用して検索結果を分類表示する技
術がある。ここで、クラスタリングとは、文書集合を類
似度に応じてグループ分けすることであり、その手法は
階層型クラスタリングと非階層型クラスタリングに分け
られる。階層型クラスタリングの結果は木構造となり、
非階層型クラスタリングの結果は単にグループ分けされ
ただけの平坦な構造となる。クラスタリングの手法とし
ては、例えば、特開平9−62693号公報「確率モデ
ルによる文書分類方法」に記載されている方法を用いる
ことができる。Lycosサーチ(http://www.lycos.co.j
p)が採用しているWiseNutサーチ(http://www.wisenu
t.com)では、検索結果のウェブページを分類し、類似
したウェブページをフォルダにまとめて表示している。
一方、Vivisimo(http://www.vivisimo.com)では、階
層型クラスタリング技術を利用することで、検索結果を
木構造状に分類して表示している。どちらの技術も検索
結果を単にリスト形式で羅列するのではなく、検索結果
をその内容に応じて分類することで利用者の情報アクセ
スに対する利便性の向上をはかっている。
【0005】
【発明が解決しようとする課題】しかし、分類結果をフ
ォルダ表示すると、一度に一つのフォルダの内容しか参
照できないため、文書集合全体に対する一覧性が欠如す
る。また、木構造状に表示する場合でも、個々の木のノ
ードを展開して順に参照していく必要があるため、フォ
ルダ表示の場合と同様に一覧性が欠如してしまう。本発
明は、上記現状を鑑み、一覧性を損なうことなく文書集
合全体の特徴を可視化することのできる文書情報表示シ
ステム、文書情報表示方法及び文書検索方法を提供する
ことを目的とする。
【0006】
【課題を解決するための手段】本発明では、文書集合の
特徴を2次元座標上に表示することによって文書集合全
体の特徴を一目で概観できるようにする。すなわち、複
数の文書に関する情報を画面表示する本発明の文書情報
表示システムは、一方の軸に要素として文書又は文を配
置し、他方の軸に要素として文書の集合、文書、文又は
単語を配置した2次元座標を表示し、該2次元座標上の
各座標点に、対応する一方の軸の要素と他方の軸の要素
の関連度を表示することを特徴とする。この文書情報表
示システムは、データベース検索によって得られた複数
の文書の特徴を概観するのに利用することができる。
【0007】2つの軸の要素間の関連度は、2次元座標
の座標点に、関連度の強さに応じた明度又は彩度を有す
る色あるいは関連度の強さに応じたサイズを有する図形
を表示することによって示すことができる。一方の軸の
要素及び/又は他方の軸の要素の並び順を、要素の類似
度を反映したものにすると、類似した要素同士が隣接し
て表示されるため、要素間の関連をより明確に捉えるこ
とが出来る。
【0008】複数の文書に関する情報を画面表示する本
発明の文書情報表示方法は、文書の集合又は文書中の文
の集合からなる第1の集合の各要素と、文書集合の集
合、文書の集合、文の集合又は単語の集合からなる第2
の集合の各要素の間の関連度を計算するステップと、一
方の軸に第1の集合の要素を配置し、他方の軸に第2の
集合の要素を配置した2次元座標上の各座標点に、対応
する一方の軸の要素と他方の軸の要素の関連度を表示す
るステップとを含むことを特徴とする。
【0009】典型的には、第1の集合は文書の集合、第
2の集合は単語の集合であり、文書の集合から単語の集
合を抽出するステップを有する。また、一方の軸の要素
の類似度及び/又は他方の軸の要素の類似度を計算する
ステップと、一方の軸の要素及び/又は他方の軸の要素
を類似度に応じて並べ替えるステップとを更に有するこ
とも出来る。
【0010】本発明による文書検索方法は、文書データ
ベースの検索要求を受信するステップと、検索要求に応
じて前記文書データベースを検索し、複数の文書情報を
取得するステップと、検索によって得られた複数の文書
から複数の単語を抽出するステップと、各文書と各単語
の間の関連度を計算するステップと、複数の文書、複数
の単語、及び各文書と各単語の間の関連度に関する情報
を送信するステップとを含むことを特徴とする。この文
書検索方法は、複数の文書の間の類似度及び/又は前記
複数の単語の間の類似度を計算するステップと、計算し
た複数の文書の間の類似度及び/又は複数の単語の間の
類似度を送信するステップとを更に有していてもよい。
【0011】
【発明の実施の形態】本発明の代表的な態様には、以下
のものがある。 (1)文書集合が一つある場合、一方の軸に文書集合、
もう一方の軸にその文書集合に含まれる単語集合をと
り、単語iと文書jの関連度をその強さに応じた表示状
態で座標(i,j)に表示するようにする。文書と単語
の関係を2次元座標上に表示することで、ある文書にど
のような単語が含まれているのか、ある単語がどのよう
な文書に含まれているのかなど、文書集合の特徴を一見
して把握できるようになる。
【0012】(2)2つの文書集合(文書集合A、文書
集合Bとする)がある場合、一方の軸に文書集合A、も
う一方の軸に文書集合Bをとり、文書集合Aの文書iと
文書集合Bの文書jの関連度をその強さに応じた表示状
態で座標(i,j)に表示する。文書間の関係を2次元
座標上に表示することで、文書集合全体としての関係、
個々の文書間の関係など、文書集合の特徴を一見して把
握できるようになる。
【0013】文書集合Aと文書集合Bが同一の文書集合
の場合に、この表示をすると、一つの文書集合内におけ
る文書間の関係を容易に把握できる。但し、その場合、
縦軸と横軸に同一の文書がきたときの関連度は情報とし
ての意味がないため、表示しないようにする。
【0014】(3)前記(1)(2)において、縦軸方
向、横軸方向のどちらか一方、あるいは両方について、
クラスタリングして並べ替えを行った結果を2次元座標
上に表示すると、クラスタリングを行った軸方向に関し
て、関連度の高い文書、あるいは単語が近くにまとまっ
て配置される。その結果、縦軸と横軸の要素間の関連度
が、クラスタリングを行わない場合に比べて、より明確
に2次元座標上に可視化されるようになり、文書集合の
特徴の把握が更に容易に行えるようになる。
【0015】(4)前記(1)(2)(3)において、
縦軸方向、横軸方向の要素数が多い場合、座標軸上にそ
れぞれの要素名(単語、記事のタイトルなど)を表示せ
ず、2次元座標上の任意の領域を範囲指定したとき、そ
の部分を拡大表示するようにする。全体表示画面で全体
の様子を把握し、注目する領域を拡大表示すると縦軸、
横軸、それぞれの要素名を知ることができる。
【0016】(5)2つの文集合(文集合A、文集合B
とする)がある場合、一方の軸に文集合A、もう一方の
軸に文集合Bをとり、文集合Aの要素iと文集合Bの要
素jの関連度をその強さに応じた表示状態で座標(i,
j)に表示するようにする。文集合A,Bが一つの文書
に含まれる場合(例えば、論文の概要とその本文、特許
の請求項とその実施例など)、文書内における文集合の
対応関係を2次元座標上に表示することで、文書の内部
構造を把握することができる。文集合A,Bが別の文書
の場合、2つの文書内における文集合の対応関係を2次
元座標上に表示することで、2つの文書間のどの部分が
関連しているかなど、文書の内部構造を分析しながら文
集合A,Bを比較検討することができる。
【0017】(6)前記(5)の2次元座標表示を画面
上部、画面下部に文集合A,Bを表示する。2次元座標
上の任意の領域を範囲指定すると、その範囲に対応する
文集合A,Bの該当範囲が識別表示されるようにする。
また、表示されている文集合のうち、どちらか一方の文
集合中の文を範囲選択すると、それに対応する2次元座
標上の領域が識別表示され、更に、もう一方の文集合中
において、選択された文集合に関連する文に該当する部
分が識別表示されるようにする。これにより、各文集合
間の関連を視覚的に捉えることができ、文書内容の概観
把握、比較、分析を容易に行うことができる。以下、図
面を参照して本発明の実施の形態を説明する。
【0018】図1は、本発明を実現するためのシステム
の構成例を示す概略図である。このシステムはクライア
ント20、サーバ30、文書データベース40,50か
ら構成され、クライアント20とサーバ30は通信ネッ
トワーク10で接続されている。図に示した例では、2
つの文書データベースがサーバ30に接続されている
が、サーバに接続される文書データベースの数は任意で
よい。クライアントの数も任意である。
【0019】クライアント20は、表示部201、検索
要求入力部202、文書データベース選択部203を備
える。サーバ30は関連度計算部301、クラスタリン
グ部302、単語抽出部303、検索部304を備え
る。上記のうち、最低限、2次元座標を表示する表示部
201と文書ユニット間の関連度を計算する関連度計算
部301とが本発明の実施には必要である。文書ユニッ
トとは、単語、単語の集合、文、文の集合、文書、文書
の集合のいずれかであり、2次元座標の縦軸あるいは横
軸に配列される要素となるものである。
【0020】サーバ30の備える関連度計算部301
は、入力として文書データベースから取り出した2つの
文書ユニットの集合を受け取る。2つの文書ユニット集
合は異なる文書データベースから取り出しても良いし、
同じ文書データベースから取り出しても良い。以下の説
明では、文書データベースから取り出した2つの文書ユ
ニットの集合を、それぞれ文書ユニットAi(i=1〜
M)、文書ユニットBj(j=1〜N)として説明を行
う。
【0021】サーバ30の関連度計算部301は、文書
ユニットAiと文書ユニットBjの間の関連度を計算す
る。関連度の計算方法は任意でよい。例えば、文書ユニ
ットA i(i=1〜M)が単語、文書ユニットBj(j=
1〜N)が文書の場合、公知技術である tf*idf法で単
語と文書の間の関連度を計算できる。ここでtf*idf法と
は、ある文書d中に出現する単語tの頻度(term frequ
ency)であるtf(t,d)と、ある単語tが全文書中でどれ
くらいの文書に出現するかを表わすIDF(inversedocume
nt frequency)と呼ばれる尺度
【0022】
【数1】
【0023】との積であるtf(t,d)×idf(t)を重みとす
る方法である。ここでTは全文書数、df(t)は単語tが
出現する文書数である。また、tf*idf法を改良したSMAR
T尺度(Singhal, A., Duckley, C. and Mitra, M., "Pi
voted Document Length Normalization", in Proceedin
gs of SIGIR'96, pp.21-29, 1996)を用いることもでき
る。
【0024】また、文書ユニットAi(i=1〜M)と
文書ユニットBj(j=1〜N)がともに文書の場合、
各文書に含まれる単語を用いて文書をベクトル表現し、
公知技術であるベクトル空間法を用いて文書間の関連度
を計算できる。ベクトル空間法については、文献"Autom
atic Text Processing"(Salton, G., ADDISON-WESLEYP
UBLISHING COMPANY)の10章に詳しい。関連度の計算
結果は行列形式のデータ構造として表現され、クライア
ント20に送られる。図2はそのデータ構造の例であ
り、文書ユニットAiと文書ユニットBj間の関連度がx
ijとして表現されている。
【0025】クライアント20の表示部201は、関連
度計算部301から受け取ったデータを利用して、文書
ユニット間の関係を2次元座標上に表示する。どちらを
どの軸にとるかは任意でよいが、ここでは説明のため
に、文書ユニットAを縦軸、文書ユニットBを横軸にと
る。文書ユニットAの要素がM個、文書ユニットBの要
素がN個あるとする。文書ユニットAのj番目の要素と
文書ユニットBのi番目の要素の関連度の強さを座標
(i,j)に表示する。ここで、関連度の強さは、ある
オブジェクト(円や四角など)の大きさ、色の明度、彩
度の差異などで表現すればよい。関連度の値を連続的に
表示することもできるが、値をある範囲に区切って離散
化し、段階的に関連度の強さを表示する方が見やすく便
利である。図3は、関連度の強さを3段階の円の大きさ
で表現した例を示している。
【0026】このような可視化を行うことで、文書ユニ
ット間の関連を視覚的に把握することができる。例え
ば、文書ユニットAが文書、文書ユニットBが単語とす
ると、どの文書にどの単語が含まれているのか、どの単
語がどの文書に含まれているのかが、一覧性を失うこと
なく把握できる。
【0027】サーバ30が備えるクラスタリング部30
2は、関連度計算部301が出力したデータをもとに、
文書ユニットA、文書ユニットBのどちらか一方、ある
いは両方をクラスタリングして並べ替えを行い、その結
果をクライアント20の表示部201に送る。表示部2
01は、受け取った結果を先述の方法で表示する。図4
は、文書ユニットA、文書ユニットBの両方をクラスタ
リングして並べ替えた例を示す。クラスタリングした結
果を2次元座標上に可視化することで、類似した文書ユ
ニットどうしが隣接して表示されるため、クラスタリン
グを行わない場合と比較して、より明確に文書ユニット
間の関連を捉えることができる。
【0028】ここで、クラスタリング手法について、文
書集合をクラスタリングする場合を例にとって説明す
る。文書集合を類似度に応じてグループ分けすることを
クラスタリングと呼び、その手法は階層型クラスタリン
グと非階層型クラスタリングに分けられる。階層型クラ
スタリングの結果は木構造となり、非階層型クラスタリ
ングの結果は単にグループ分けされただけの平坦な構造
となる。階層型クラスタリングの結果として得られる木
構造はデンドログラムと呼ばれる。図5はデンドログラ
ムの例である。デンドログラムにおいて、中間節点の集
合を選ぶと非階層型クラスタリングのような平坦なクラ
スタを得ることができる。
【0029】階層型クラスタリングのアルゴリズムは基
本的に以下の手順からなる。 (1)各要素だけからなるクラスタを作る。 (2)すべてのクラスタ間の距離(類似度)を計算す
る。 (3)最も距離の近いクラスタの組を併合する。 (4)併合によってできたクラスタと他のクラスタの距
離を計算する。 (5)上記(3)(4)をクラスタが一つになるまで繰
り返す。
【0030】上記(4)の手順における距離計算の方法
として様々な手法があるが、一般に、単一リンク法、完
全リンク法、Ward法などがよく用いられる。各手法の詳
細については、例えば"Information Retrieval"(Frake
s, W. and Baeza-Yates, R.eds, Prentice Hall)の1
6章に記述されている。
【0031】本発明で用いるクラスタリング手法は任意
であるが、上記以外の方法として、ある文書があるクラ
スタに入る確率をモデル化することによってクラスタリ
ングを行う特開平9−62693号公報「確率モデルに
よる文書分類方法」に記載されている方法を用いてもよ
い。
【0032】クラスタリングに必要な類似度は、関連度
計算部301が出力したデータから計算できる。図2の
各行をベクトルとみなすと、文書ユニットAの各要素を
文書ユニットBの各要素の重みベクトルとして表現する
ことができ、公知技術であるベクトル空間法を用いて文
書ユニットAの各要素間の類似度が計算できる。同様
に、図2の各列をベクトルとみなすと、文書ユニットB
の各要素間の類似度が計算できる。類似度計算はすべて
の要素間で行う必要がある(上記、階層型クラスタリン
グの手順(2))。
【0033】このように計算された類似度を用いて階層
型クラスタリングを行い、デンドログラムを構成するこ
とで文書ユニットの並べ替えを行うことができる。図5
は、文書d1〜d10からなる文書集合をクラスタリング
した例を示している。最初のクラスタ併合によって文書
1とd6、d8とd5、d10とd2、d3とd9が併合さ
れ、次にクラスタ(d1,d6)と(d8,d5)、クラス
タ(d10,d2)とd7、クラスタ(d3,d9)とd4
併合され…と順にクラスタを併合し、図示するようなデ
ンドログラムが得られている。このクラスタリングの結
果、例えば横軸上にd1,d2,d3,…,d10のように
並んでいた文書集合は、d1,d6,d8,…,d9のよう
に並べ替えて配列される。縦軸方向、横軸方向それぞれ
に対して、各要素間の類似度を計算し、デンドログラム
を構成することで、図4のような表示が得られる。
【0034】検索結果を可視化する場合、入力としては
検索結果の文書集合しか得ることができない。そのよう
な場合の処理について、図6から図9を用いて説明す
る。ここでは簡単のためキーワード検索によって文書集
合を得る例によって説明する。しかし、キーワード検索
に限らず、連想検索(例えば、特開2000−1557
58号公報参照)など任意の方法で取得した文書集合に
対しても本発明が適用できるのは勿論である。
【0035】図6は、クライアント20の備えるモニタ
ーの初期画面例を示す図である。モニター画面は、検索
された文書集合についての情報を表示する表示部20
1、検索キーワードを入力する検索要求入力部202、
所望のデータベースを選択するための文書データベース
選択部203を備える。
【0036】図7は、クライアントからのコマンド送信
とサーバからのデータ返信の処理の流れを示すシーケン
ス図である。いま、ユーザが検索要求入力部202に検
索要求として例えばキーワード「virus」を入力し、文
書データベース選択部203における文書データベース
選択ボタン2031によりDB1を選択し、「search」
ボタン2021を押すと、選択されたデータベースの情
報とキーワードがサーバに送られる(T11)。
【0037】サーバ30では、検索部304により指定
された文書データベースをキーワード検索し、その結果
の文書集合を得る。次に、単語抽出部303によって、
取得した文書集合から単語集合を抽出する。単語抽出の
方法は任意でよいが、例えば、前述の tf*idf法などを
利用して文書中の単語の重要度を計算し、重要度の高い
順に抽出すればよい。得られた文書集合と単語集合を入
力として関連度計算部301が単語と文書の間の関連度
の計算を行い、結果をクライアントに返す(T12)。
クライアント20は、先述した方法と同様にして、表示
部201に、2次元座標によって単語集合と文書集合の
関連を可視化する。
【0038】図8は、2次元座標による表示例を示す図
である。図8の2次元座標表示部2011には、横軸に
単語を配置し、縦軸に文書の表題を配置した相互の関連
度が2次元表示されている。縦軸と横軸の交点に配置さ
れている四角形のオブジェクトは、縦軸の文書と横軸の
単語の関連度を表し、両者の関連度が高いほど濃い色の
オブジェクトが配置される。関連度自体は連続数で表さ
れるが、ここでは関連度をその値に応じて数段階(例え
ば5段階)に等級分けし、各等級に異なる明度を割り当
てて表示している。オブジェクトが表示されていない交
点は、縦軸の文書と横軸の単語の間に関連が無いか、関
連度が表示のための閾値以下であることを示している。
この2次元表示により、検索された文書全体を概観しな
がら各文書の内容をある程度推測することができる。し
かし、高い関連度を表す濃い色のオブジェクトが2次元
座標上に分散しているため、文書間に何らかの関連があ
るのか等の情報は把握しにくい。
【0039】そこで、ユーザが図8の表示部201に表
示されている「clustering」ボタン2012を押すと、
クラスタリング実行の指示がサーバに送信される(T1
3)。サーバ30のクラスタリング部302では、記事
方向のクラスタリングで記事が分類され、また、単語方
向のクラスタリングで単語が分類され、その結果のデー
タがクライアント20に返される(T14)。クラスタ
リングを行った2次元座標データを受け、クライアント
の表示部201には、クラスタリングによって縦軸及び
横軸の要素の並び替えが行われた単語と文書の2次元座
標が表示される。それによってユーザは、記事集合に含
まれる話題を2次元座標上で視覚的に捉えることができ
る。
【0040】図9は、クラスタリング処理をした後の単
語と文書の関連度の2次元座標表示例を示す図である。
図9の例では、右下部分と左上部分に特徴的なまとまり
があり、文書集合に2つの話題(コンピュータウイルス
に関する話題と生物学のウイルスに関する話題)が含ま
れていると推測される。更に、縦軸の単語を参照するこ
とで、記事タイトルだけでは読み取ることのできない情
報を得ることができ、それぞれの話題をより深く理解で
きるようになる。以下、本発明による文書ユニット間の
関連度の2次元座標表示の他の例について説明する。
【0041】図10は文書ユニットAとして記事集合
A、文書ユニットBとして記事集合Bとし、クラスタリ
ング部302でクラスタリングして両方の軸について並
べ替えを行った例を示す図である。2つの記事集合A,
Bを得る方法は任意でよいが、例えば、2つのデータベ
ースに対して、同じキーワードで同時に検索を行い、そ
れぞれのデータベースから得られた検索結果を文書集合
A,Bとすればよい。得られた文書集合A,Bに対し、
関連度計算部301が文書集合Aの要素と文書集合Bの
要素の間の関連度を計算する。その結果をクラスタリン
グ部302でクラスタリングして両方の軸に沿って並べ
替えを行うことで図10が得られる。
【0042】2つの記事集合がある場合、それらの間の
関連を知ることは難しいが、図10のように可視化を行
うことによって、2つの記事集合の中で、どの記事とど
の記事に関連があるのかを視覚的に理解できるようにな
る。記事集合A,Bが同一の記事集合の場合でも記事集
合内部の構造を把握するのに利用することができる。
【0043】文書ユニットAとして単語、文書ユニット
Bとして時間順に並んだ新聞記事とし、それらの関係を
2次元座標上に可視化することもできる。図11はある
新聞社から発行された新聞を一ヶ月単位で2次元座標上
に可視化するためのインタフェースの初期画面の例を示
した図である。文書データベース選択部203で「News
paper A (2002/02/01-28)」を選択し、「Search」ボタ
ン2021を押すと、横軸に新聞一ヶ月分の記事の集合
を時間順にとり、縦軸にそれらの記事から抽出した単語
が配置したものが表示される。その画面が図12であ
る。時間順に並んだ新聞記事とそれらに含まれる単語を
2次元座標上に可視化することで、時系列に沿った話題
の推移を視覚的に見ることができる。
【0044】図13は、2次元座標の拡大表示機能を有
するインタフェースの例を示す図である。2次元座標に
表示する文書ユニットの数が増えると、座標軸上にそれ
ぞれの要素名(単語、記事タイトルなど)を全て表示す
ることができない。このような場合は、拡大表示するこ
とで、それぞれの要素名を知ることができる。
【0045】図13において、2次元座標表示部201
1内に表示された2次元座標上で、高い関連度を示すオ
ブジェクトが集中している興味のある任意の範囲を範囲
指定部分21として選択すると、拡大表示部2013に
その部分の2次元座標が拡大表示され、縦軸、横軸の要
素名を知ることができる。範囲指定は、マウスのドラッ
グで矩形領域の対角線上の2点を指定することで行うこ
とができる。
【0046】2つの文集合(文集合A、文集合Bとす
る)がある場合、一方の軸に文集合Aを、もう一方の軸
に文集合Bをとり、文集合Aの要素iと文集合Bの要素
jの関連度を座標(i,j)に表示してもよい。関連度
の強さは、座標(i,j)に表示するオブジェクトの色
や形状によって表現することができる。文集合A,Bが
一つの文書に属する場合(例えば、論文の概要とその本
文、特許公報の請求項とその実施例の説明など)、文書
内における文集合の対応関係を2次元座標上に表示する
ことで、文書の内部構造を把握することができる。文集
合A,Bが別の文書の場合、2つの文書内における文集
合の対応関係を2次元座標上に表示することで、2つの
文書間のどの部分が関連しているかなど、文書の内部構
造を分析しながら文集合A,Bを比較検討することがで
きる。
【0047】図14は、文書ユニットの2次元座標表示
と文書ユニットの内容表示を同時に行うことで文集合間
を関連づける機能を有するインタフェースの例を示す図
である。文書ユニットAとして特許公報の請求項(CLAI
M)、文書ユニットBとして特許公報の実施例や段落(D
ESCRIPTION)をとり、2次元座標表示部2011内の2
次元座標に表示されている。
【0048】本文表示部2014には特許公報の請求
項、特許公報の実施例の本文がそれぞれ表示されてい
る。ここで、マウスのドラッグ等によって2次元座標上
の任意の範囲21を選択すると、本文表示部2014
に、その範囲に対応する請求項、実施例の文が識別表示
される。図14では斜体太字で識別表示してあるが、識
別表示の仕方は任意でよい。
【0049】この場合、本文表示部2014に表示され
た特定の文を選択すると、それに対応する2次元座標上
の領域が識別表示されるようにしてもよい。図15に、
その例を示す。図15において、本文表示部2014に
表示されているCLAIM内の任意の文22をマウス等でク
リックして範囲指定すると、それに対応する2次元座標
上の領域23が識別表示され、更に、実施例において、
請求項で選択した文に関連する文が斜体太字等で識別表
示される。実施例内の任意の文を範囲選択した場合も同
様に識別表示が行なわれる。図15では2次元座標上の
識別表示を矩形で囲むことによって行っているが、識別
表示の仕方は任意でよい。このインタフェースを用いる
ことで、各文集合間の対応関係を視覚的に捉えることが
でき、内容の概観把握、比較、分析などを容易に行うこ
とができるようになる。
【0050】
【発明の効果】本発明によると、2次元座標上に表示さ
れた文書ユニット間の関連を見ることで、一覧性を失う
ことなく文書内容の概観を得ることができる。
【図面の簡単な説明】
【図1】本発明を実現するためのシステムの構成例を示
す概略図。
【図2】文書ユニット間の関連度を表現するデータ構造
の例を示す図。
【図3】文書ユニット間の関連度を2次元座標に可視化
した例を示す図。
【図4】クラスタリング処理をした表示例を示す図。
【図5】階層的クラスタリングの例を示す図。
【図6】クライアントの備えるモニターの初期画面例を
示す図。
【図7】クライアントとサーバ間におけるコマンドとデ
ータの流れを示すシーケンス図。
【図8】2次元座標による表示例を示す図。
【図9】クラスタリング処理をした後の2次元座標表示
例を示す図。
【図10】2つの記事集合間の関係を2次元座標表示し
た例を示す図。
【図11】単語と時系列に並んだ記事の関係を2次元座
標表示する場合の初期画面の例を示す図。
【図12】単語と時系列に並んだ記事の関係を2次元座
標表示した例を示す図。
【図13】2次元座標の拡大表示機能を有するインタフ
ェースの例を示す図。
【図14】2次元座標表示と文書表示を同時に行うこと
で文集合間を関連づける機能を有するインタフェースの
例を示す図。
【図15】2次元座標表示と文書表示を同時に行うこと
で文集合間を関連づける機能を有するインタフェースの
例を示す図。
【符号の説明】
10:通信ネットワーク 20:クライアント 201:表示部 2011:2次元座標表示部 2013:拡大表示部 2014:本文表示部 202:検索要求入力部 203:文書データベース選択部 2031:文書データベース選択ボタン 2032:文書データベース名表示ボックス 21、22:範囲指定部分 23:識別表示部分 30:サーバ 301:関連度計算部 302:クラスタリング部 303:単語抽出部 304:検索部 40,50:文書データベース
【手続補正書】
【提出日】平成14年11月27日(2002.11.
27)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
【請求項】複数の文書に関する情報を画面表示する文
書情報表示方法において、 文書の集合又は文書中の文の集合からなる第1の集合の
各要素と、文書集合の集合、文書の集合、文の集合又は
単語の集合からなる第2の集合の各要素の間の関連度を
計算するステップと、 一方の軸に第1の集合の要素を配置し、他方の軸に第2
の集合の要素を配置した2次元座標上の各座標点に、対
応する一方の軸の要素と他方の軸の要素の関連度を表示
するステップとを含むことを特徴とする文書情報表示方
法。
【請求項】請求項記載の文書情報表示方法におい
て、前記座標点に、前記関連度の強さに応じた明度又は
彩度の色あるいは前記関連度の強さに応じたサイズの図
形を表示することを特徴とする文書情報表示方法。
【請求項】請求項記載の文書情報表示方法におい
て、 前記一方の軸の要素の類似度及び/又は他方の軸の要素
の類似度を計算するステップと、 前記一方の軸の要素及び/又は他方の軸の要素を前記類
似度に応じて並べ替えるステップとを更に有することを
特徴とする文書情報表示方法。
【請求項】文書データベースの検索要求を受信するス
テップと、 前記検索要求に応じて前記文書データベースを検索し、
複数の文書情報を取得するステップと、 検索によって得られた複数の文書から複数の単語を抽出
するステップと、 各文書と各単語の間の関連度を計算するステップと、 前記複数の文書、複数の単語、及び各文書と各単語の間
の関連度に関する情報を送信するステップとを含むこと
を特徴とする文書検索方法。
【請求項10】請求項記載の文書検索方法において、 前記複数の文書の間の類似度及び/又は前記複数の単語
の間の類似度を計算するステップと、 計算した前記複数の文書の間の類似度及び/又は前記複
数の単語の間の類似度を送信するステップとを更に有す
ることを特徴とする文書検索方法。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 久光 徹 東京都国分寺市東恋ヶ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 岩山 真 東京都国分寺市東恋ヶ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 藤尾 正和 東京都国分寺市東恋ヶ窪一丁目280番地 株式会社日立製作所中央研究所内 Fターム(参考) 5B075 ND03 NS10 PQ02 PQ14 PQ22

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】複数の文書に関する情報を画面表示する文
    書情報表示システムにおいて、 一方の軸に要素として文書又は文を配置し、他方の軸に
    要素として文書の集合、文書、文又は単語を配置した2
    次元座標を表示し、該2次元座標上の各座標点に、対応
    する一方の軸の要素と他方の軸の要素の関連度を表示す
    ることを特徴とする文書情報表示システム。
  2. 【請求項2】請求項1記載の文書情報表示システムにお
    いて、前記複数の文書は、データベース検索によって得
    られたものであることを特徴とする文書情報表示システ
    ム。
  3. 【請求項3】請求項1記載の文書情報表示システムにお
    いて、前記座標点に、前記関連度の強さに応じた明度又
    は彩度を有する色あるいは前記関連度の強さに応じたサ
    イズを有する図形を表示することを特徴とする文書情報
    表示システム。
  4. 【請求項4】請求項1記載の文書情報表示システムにお
    いて、前記一方の軸の要素及び/又は他方の軸の要素の
    並び順は、要素の類似度を反映したものになっているこ
    とを特徴とする文書情報表示システム。
  5. 【請求項5】請求項1記載の文書情報表示システムにお
    いて、前記2次元座標上の指定範囲を拡大表示する機能
    を有することを特徴とする文書情報表示システム。
  6. 【請求項6】請求項1記載の文書情報表示システムにお
    いて、一方の軸の要素はデータベース検索によって得ら
    れた文書であり、他方の軸の要素はデータベース検索に
    よって得られた文書に含まれている単語であることを特
    徴とする文書情報表示システム。
  7. 【請求項7】請求項1記載の文書情報表示システムにお
    いて、一方の軸の要素も他方の軸の要素もともに文書で
    あることを特徴とする文書情報表示システム。
  8. 【請求項8】請求項1記載の文書情報表示システムにお
    いて、一方の軸の要素は所定の期間に発行された文書の
    集合であり、他方の軸は単語であることを特徴とする文
    書情報表示システム。
  9. 【請求項9】複数の文書に関する情報を画面表示する文
    書情報表示方法において、 文書の集合又は文書中の文の集合からなる第1の集合の
    各要素と、文書集合の集合、文書の集合、文の集合又は
    単語の集合からなる第2の集合の各要素の間の関連度を
    計算するステップと、 一方の軸に第1の集合の要素を配置し、他方の軸に第2
    の集合の要素を配置した2次元座標上の各座標点に、対
    応する一方の軸の要素と他方の軸の要素の関連度を表示
    するステップとを含むことを特徴とする文書情報表示方
    法。
  10. 【請求項10】請求項9記載の文書情報表示方法におい
    て、前記第1の集合は文書の集合、前記第2の集合は単
    語の集合であり、前記文書の集合から前記単語の集合を
    抽出するステップを有することを特徴とする文書情報表
    示方法。
  11. 【請求項11】請求項10記載の文書情報表示方法にお
    いて、文書データベースから前記文書の集合を検索する
    ステップを有することを特徴とする文書情報表示方法。
  12. 【請求項12】請求項9記載の文書情報表示方法におい
    て、前記座標点に、前記関連度の強さに応じた明度又は
    彩度の色あるいは前記関連度の強さに応じたサイズの図
    形を表示することを特徴とする文書情報表示方法。
  13. 【請求項13】請求項9記載の文書情報表示方法におい
    て、 前記一方の軸の要素の類似度及び/又は他方の軸の要素
    の類似度を計算するステップと、 前記一方の軸の要素及び/又は他方の軸の要素を前記類
    似度に応じて並べ替えるステップとを更に有することを
    特徴とする文書情報表示方法。
  14. 【請求項14】請求項9記載の文書情報表示方法におい
    て、 前記2次元座標上の範囲を指定するステップと、 前記指定された範囲を拡大表示するステップとを更に有
    することを特徴とする文書情報表示方法。
  15. 【請求項15】文書データベースの検索要求を受信する
    ステップと、 前記検索要求に応じて前記文書データベースを検索し、
    複数の文書情報を取得するステップと、 検索によって得られた複数の文書から複数の単語を抽出
    するステップと、 各文書と各単語の間の関連度を計算するステップと、 前記複数の文書、複数の単語、及び各文書と各単語の間
    の関連度に関する情報を送信するステップとを含むこと
    を特徴とする文書検索方法。
  16. 【請求項16】請求項15記載の文書検索方法におい
    て、 前記複数の文書の間の類似度及び/又は前記複数の単語
    の間の類似度を計算するステップと、 計算した前記複数の文書の間の類似度及び/又は前記複
    数の単語の間の類似度を送信するステップとを更に有す
    ることを特徴とする文書検索方法。
JP2002152594A 2002-05-27 2002-05-27 文書情報表示システム、文書情報表示方法及び文書検索方法 Expired - Fee Related JP4116329B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002152594A JP4116329B2 (ja) 2002-05-27 2002-05-27 文書情報表示システム、文書情報表示方法及び文書検索方法
US10/374,091 US7047255B2 (en) 2002-05-27 2003-02-27 Document information display system and method, and document search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002152594A JP4116329B2 (ja) 2002-05-27 2002-05-27 文書情報表示システム、文書情報表示方法及び文書検索方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005312942A Division JP2006127523A (ja) 2005-10-27 2005-10-27 文書情報表示システム

Publications (2)

Publication Number Publication Date
JP2003345811A true JP2003345811A (ja) 2003-12-05
JP4116329B2 JP4116329B2 (ja) 2008-07-09

Family

ID=29545406

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002152594A Expired - Fee Related JP4116329B2 (ja) 2002-05-27 2002-05-27 文書情報表示システム、文書情報表示方法及び文書検索方法

Country Status (2)

Country Link
US (1) US7047255B2 (ja)
JP (1) JP4116329B2 (ja)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005259088A (ja) * 2004-03-15 2005-09-22 Kousaku Ookubo 注目する情報を知識集積物との関係で可視的に処理するためのシステム及びそのためのコンピュータソフトウエアプログラム製品
JP2007108867A (ja) * 2005-10-11 2007-04-26 Toshiba Corp 文献調査方法、文献調査システムおよび文献調査プログラム
WO2007069408A1 (ja) * 2005-12-13 2007-06-21 Intellectual Property Bank Corp. 技術文書属性の関連性分析支援装置
WO2007069663A1 (ja) * 2005-12-13 2007-06-21 Intellectual Property Bank Corp. 技術文書属性の関連性分析支援装置
JP2008059442A (ja) * 2006-09-01 2008-03-13 Nippon Telegr & Teleph Corp <Ntt> 文書集合分析装置,文書集合分析方法,その方法を実装したプログラム及びそのプログラムを格納した記録媒体
JP2009176041A (ja) * 2008-01-24 2009-08-06 Toshiba Sumiden Medical Information Systems Corp 電子カルテシステム、カルテボリュームインジケータ制御方法、インジケータバーの検索表示方法およびカルテボリュームインジケータプログラム
US7584189B2 (en) 2005-06-21 2009-09-01 Yamatake Corporation Sentence classification device and method
JP2009230648A (ja) * 2008-03-25 2009-10-08 Hitachi East Japan Solutions Ltd 文書群分析支援装置
JP2009252185A (ja) * 2008-04-10 2009-10-29 Ricoh Co Ltd 情報検索装置、情報検索方法、制御プログラム及び記録媒体
WO2010061537A1 (ja) * 2008-11-26 2010-06-03 日本電気株式会社 検索装置、検索方法、及びプログラムが格納された記録媒体
JP2011128705A (ja) * 2009-12-15 2011-06-30 Toshiba Corp 情報処理装置およびプログラム
JP2011198111A (ja) * 2010-03-19 2011-10-06 Toshiba Corp 特徴語抽出装置及びプログラム
JP2012524313A (ja) * 2009-04-17 2012-10-11 フラウンホファー‐ゲゼルシャフト・ツア・フェルデルング・デア・アンゲヴァンテン・フォルシュング・エー・ファウ データベース内のオブジェクトを探索する方法
US8818979B2 (en) 2007-05-17 2014-08-26 Valuenex Consulting Inc. Document retrieving apparatus and document retrieving method
JP6403850B1 (ja) * 2017-08-30 2018-10-10 Nsフィナンシャルマネジメントコンサルティング株式会社 情報処理装置、情報処理方法及びプログラム
KR102669258B1 (ko) * 2021-02-25 2024-05-24 덕성여자대학교 산학협력단 대규모 시계열 데이터를 시각화하는 사용자 인터페이스 제공 방법 및 이를 지원하는 전자 장치

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4025517B2 (ja) * 2001-05-31 2007-12-19 株式会社日立製作所 文書検索システムおよびサーバ
US20030004996A1 (en) * 2001-06-29 2003-01-02 International Business Machines Corporation Method and system for spatial information retrieval for hyperlinked documents
US7904453B2 (en) * 2002-10-17 2011-03-08 Poltorak Alexander I Apparatus and method for analyzing patent claim validity
US7296015B2 (en) * 2002-10-17 2007-11-13 Poltorak Alexander I Apparatus and method for identifying and/or for analyzing potential patent infringement
US7801909B2 (en) * 2002-10-17 2010-09-21 Poltorak Alexander I Apparatus and method for identifying and/or for analyzing potential patent infringement
US7792832B2 (en) * 2002-10-17 2010-09-07 Poltorak Alexander I Apparatus and method for identifying potential patent infringement
JP4014160B2 (ja) * 2003-05-30 2007-11-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、プログラム、及び記録媒体
GB2403636A (en) * 2003-07-02 2005-01-05 Sony Uk Ltd Information retrieval using an array of nodes
US7475087B1 (en) * 2003-08-29 2009-01-06 The United States Of America As Represented By The Secretary Of Agriculture Computer display tool for visualizing relationships between and among data
JPWO2005038672A1 (ja) * 2003-10-21 2007-01-25 株式会社アイ・ピー・ビー 調査対象文書の索引語抽出装置、性格表現図、及び文書特徴分析装置
US20050114169A1 (en) * 2003-11-24 2005-05-26 Hazim Ansari Systems and methods for evaluating information to identify, and act upon, intellectual property issues
US20050160080A1 (en) * 2004-01-16 2005-07-21 The Regents Of The University Of California System and method of context-specific searching in an electronic database
JP4639734B2 (ja) * 2004-09-30 2011-02-23 富士ゼロックス株式会社 スライドコンテンツ処理装置およびプログラム
US20060106760A1 (en) * 2004-10-29 2006-05-18 Netzer Moriya Method and apparatus of inter-document data retrieval
US20070028189A1 (en) * 2005-07-27 2007-02-01 Microsoft Corporation Hierarchy highlighting
US7636884B2 (en) * 2005-12-06 2009-12-22 Yueh Heng Goffin Visually enhanced text and method of preparation
CN100524307C (zh) * 2006-06-27 2009-08-05 国际商业机器公司 一种建立文档间关联关系的方法和装置
JP2008107867A (ja) * 2006-10-23 2008-05-08 Hitachi Ltd コミュニティ抽出方法、コミュニティ抽出処理装置
TW201013426A (en) * 2008-09-19 2010-04-01 Esobi Inc Combination method for document clusters
US11062615B1 (en) 2011-03-01 2021-07-13 Intelligibility Training LLC Methods and systems for remote language learning in a pandemic-aware world
US10019995B1 (en) 2011-03-01 2018-07-10 Alice J. Stiebel Methods and systems for language learning based on a series of pitch patterns
US9830620B2 (en) * 2013-03-14 2017-11-28 Igor Gershteyn Method and system for data structure creation, organization and searching using basic atomic units of information
US9223769B2 (en) 2011-09-21 2015-12-29 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
WO2013125201A1 (ja) * 2012-02-21 2013-08-29 パナソニック株式会社 レシピ提示装置、及び、レシピ提示方法
US9348846B2 (en) 2012-07-02 2016-05-24 Google Inc. User-navigable resource representations
JP6372165B2 (ja) * 2014-05-26 2018-08-15 富士ゼロックス株式会社 デザイン管理装置及びプログラム
CN106776659B (zh) * 2015-11-25 2021-06-11 腾讯科技(深圳)有限公司 基于景点成分识别的检索结果排序方法、装置、用户终端
US11689507B2 (en) * 2019-11-26 2023-06-27 Adobe Inc. Privacy preserving document analysis

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0736922A (ja) * 1993-07-19 1995-02-07 Sumitomo Metal Mining Co Ltd 情報の検索処理システム
JPH08320881A (ja) * 1995-05-25 1996-12-03 Tokyo Gas Co Ltd 文書検索システム
JP2000011078A (ja) * 1998-06-25 2000-01-14 Gijutsu Transfer Service:Kk 電子データ集計方法およびデータのグラフ化方法並びに電子データ集計とデータのグラフ化のプログラムを記録したコンピュータ読取可能な記録媒体
JP2000148760A (ja) * 1998-11-05 2000-05-30 Inpatekku Kk 情報分析方法及び情報分析装置
JP2001092825A (ja) * 1999-09-17 2001-04-06 Nec Corp 情報処理装置および情報処理方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6081804A (en) * 1994-03-09 2000-06-27 Novell, Inc. Method and apparatus for performing rapid and multi-dimensional word searches
US5625767A (en) * 1995-03-13 1997-04-29 Bartell; Brian Method and system for two-dimensional visualization of an information taxonomy and of text documents based on topical content of the documents
US5675710A (en) * 1995-06-07 1997-10-07 Lucent Technologies, Inc. Method and apparatus for training a text classifier
JPH0962693A (ja) 1995-08-24 1997-03-07 Hitachi Ltd 確率モデルによる文書分類方法
US6457004B1 (en) * 1997-07-03 2002-09-24 Hitachi, Ltd. Document retrieval assisting method, system and service using closely displayed areas for titles and topics
US6298174B1 (en) * 1996-08-12 2001-10-02 Battelle Memorial Institute Three-dimensional display of document set
US6038561A (en) * 1996-10-15 2000-03-14 Manning & Napier Information Services Management and analysis of document information text
US20030069873A1 (en) * 1998-11-18 2003-04-10 Kevin L. Fox Multiple engine information retrieval and visualization system
US6738518B1 (en) * 2000-05-12 2004-05-18 Xerox Corporation Document image decoding using text line column-based heuristic scoring
JP2002245070A (ja) * 2001-02-20 2002-08-30 Hitachi Ltd データ表示方法及び装置並びにその処理プログラムを記憶した媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0736922A (ja) * 1993-07-19 1995-02-07 Sumitomo Metal Mining Co Ltd 情報の検索処理システム
JPH08320881A (ja) * 1995-05-25 1996-12-03 Tokyo Gas Co Ltd 文書検索システム
JP2000011078A (ja) * 1998-06-25 2000-01-14 Gijutsu Transfer Service:Kk 電子データ集計方法およびデータのグラフ化方法並びに電子データ集計とデータのグラフ化のプログラムを記録したコンピュータ読取可能な記録媒体
JP2000148760A (ja) * 1998-11-05 2000-05-30 Inpatekku Kk 情報分析方法及び情報分析装置
JP2001092825A (ja) * 1999-09-17 2001-04-06 Nec Corp 情報処理装置および情報処理方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005259088A (ja) * 2004-03-15 2005-09-22 Kousaku Ookubo 注目する情報を知識集積物との関係で可視的に処理するためのシステム及びそのためのコンピュータソフトウエアプログラム製品
US7584189B2 (en) 2005-06-21 2009-09-01 Yamatake Corporation Sentence classification device and method
JP2007108867A (ja) * 2005-10-11 2007-04-26 Toshiba Corp 文献調査方法、文献調査システムおよび文献調査プログラム
WO2007069663A1 (ja) * 2005-12-13 2007-06-21 Intellectual Property Bank Corp. 技術文書属性の関連性分析支援装置
WO2007069408A1 (ja) * 2005-12-13 2007-06-21 Intellectual Property Bank Corp. 技術文書属性の関連性分析支援装置
JP2008059442A (ja) * 2006-09-01 2008-03-13 Nippon Telegr & Teleph Corp <Ntt> 文書集合分析装置,文書集合分析方法,その方法を実装したプログラム及びそのプログラムを格納した記録媒体
US8818979B2 (en) 2007-05-17 2014-08-26 Valuenex Consulting Inc. Document retrieving apparatus and document retrieving method
JP2009176041A (ja) * 2008-01-24 2009-08-06 Toshiba Sumiden Medical Information Systems Corp 電子カルテシステム、カルテボリュームインジケータ制御方法、インジケータバーの検索表示方法およびカルテボリュームインジケータプログラム
JP2009230648A (ja) * 2008-03-25 2009-10-08 Hitachi East Japan Solutions Ltd 文書群分析支援装置
JP2009252185A (ja) * 2008-04-10 2009-10-29 Ricoh Co Ltd 情報検索装置、情報検索方法、制御プログラム及び記録媒体
WO2010061537A1 (ja) * 2008-11-26 2010-06-03 日本電気株式会社 検索装置、検索方法、及びプログラムが格納された記録媒体
US8892574B2 (en) 2008-11-26 2014-11-18 Nec Corporation Search apparatus, search method, and non-transitory computer readable medium storing program that input a query representing a subset of a document set stored to a document database and output a keyword that often appears in the subset
JP5594145B2 (ja) * 2008-11-26 2014-09-24 日本電気株式会社 検索装置、検索方法、及びプログラム
US8886652B2 (en) 2009-04-17 2014-11-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method for searching objects in a database
JP2012524313A (ja) * 2009-04-17 2012-10-11 フラウンホファー‐ゲゼルシャフト・ツア・フェルデルング・デア・アンゲヴァンテン・フォルシュング・エー・ファウ データベース内のオブジェクトを探索する方法
JP2011128705A (ja) * 2009-12-15 2011-06-30 Toshiba Corp 情報処理装置およびプログラム
JP2011198111A (ja) * 2010-03-19 2011-10-06 Toshiba Corp 特徴語抽出装置及びプログラム
JP6403850B1 (ja) * 2017-08-30 2018-10-10 Nsフィナンシャルマネジメントコンサルティング株式会社 情報処理装置、情報処理方法及びプログラム
JP2019045956A (ja) * 2017-08-30 2019-03-22 Nsフィナンシャルマネジメントコンサルティング株式会社 情報処理装置、情報処理方法及びプログラム
KR102669258B1 (ko) * 2021-02-25 2024-05-24 덕성여자대학교 산학협력단 대규모 시계열 데이터를 시각화하는 사용자 인터페이스 제공 방법 및 이를 지원하는 전자 장치

Also Published As

Publication number Publication date
US20030220916A1 (en) 2003-11-27
JP4116329B2 (ja) 2008-07-09
US7047255B2 (en) 2006-05-16

Similar Documents

Publication Publication Date Title
JP4116329B2 (ja) 文書情報表示システム、文書情報表示方法及び文書検索方法
US10997678B2 (en) Systems and methods for image searching of patent-related documents
US7840524B2 (en) Method and apparatus for indexing, searching and displaying data
US6415282B1 (en) Method and apparatus for query refinement
US5787422A (en) Method and apparatus for information accesss employing overlapping clusters
JP3577819B2 (ja) 情報探索装置及び情報探索方法
US20020091678A1 (en) Multi-query data visualization processes, data visualization apparatus, computer-readable media and computer data signals embodied in a transmission medium
US20020091679A1 (en) System for searching collections of linked objects
Paulovich et al. Text map explorer: a tool to create and explore document maps
Hoeber et al. The visual exploration ofweb search results using hotmap
US20060155662A1 (en) Sentence classification device and method
JP2003167914A (ja) マルチメディア情報検索方法、プログラム、記録媒体及びシステム
AU2005201771A1 (en) Method and system for identifying image relatedness using link and page layout analysis
JP2004287725A (ja) 検索処理方法及びプログラム
JP2006127523A (ja) 文書情報表示システム
EP1212697A1 (en) Method and apparatus for building a user-defined technical thesaurus using on-line databases
JP3577822B2 (ja) 情報提示装置及び情報提示方法
EP1154355B1 (en) Document processing method, system and computer readable storage medium
Al_Janabi et al. Multi-level network construction based on intelligent big data analysis
JPH09231238A (ja) テキスト検索結果表示方法及び装置
JP3385297B2 (ja) 文書の自動分類方法、および情報空間の可視化方法、ならびに情報検索システム
Plant et al. Visualising image databases
JP2000020538A (ja) 情報検索方法、情報検索装置および情報検索プログラム記憶媒体
JP2001337971A (ja) 文書分類装置、文書分類方法及び文書分類方法のプログラムを記録した記憶媒体
van Hoek et al. Assessing visualization techniques for the search process in digital libraries

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050725

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080417

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4116329

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120425

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120425

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130425

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130425

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140425

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees