JPH0589173A - 構造化文書分類装置 - Google Patents

構造化文書分類装置

Info

Publication number
JPH0589173A
JPH0589173A JP3249580A JP24958091A JPH0589173A JP H0589173 A JPH0589173 A JP H0589173A JP 3249580 A JP3249580 A JP 3249580A JP 24958091 A JP24958091 A JP 24958091A JP H0589173 A JPH0589173 A JP H0589173A
Authority
JP
Japan
Prior art keywords
classification
document
search
structured document
folder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3249580A
Other languages
English (en)
Other versions
JP3303926B2 (ja
Inventor
Toshiaki Mori
俊明 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP24958091A priority Critical patent/JP3303926B2/ja
Priority to US07/951,216 priority patent/US5418946A/en
Publication of JPH0589173A publication Critical patent/JPH0589173A/ja
Application granted granted Critical
Publication of JP3303926B2 publication Critical patent/JP3303926B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】構造化文書を、利用者の目的に応じて容易に分
類することのできる構造化文書分類装置を提供するこ
と。 【構成】検索条件指定手段120によって文書の検索に
関する情報としての構造要素情報を指定し、また分類属
性指定手段140によって文書の分類に関する情報とし
ての構造要素情報を指定する。構造化文書検索手段13
0は、構造化文書格納手段110に格納されている複数
の構造化文書の中から、文書の検索に関する情報として
の構造要素情報に基づく構造化文書群を検索して、構造
化文書分類手段150に転送する。構造化文書分類手段
150では、その転送された構造化文書群を、文書の分
類に関する情報としての構造要素情報に基づいて分類す
る。その分類結果は、文書表示手段160に表示され
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は構造化文書を検索し分
類する構造化文書分類装置に関する。
【0002】
【従来の技術】大量の電子文書を格納/分類/整理する
ための装置として、現在ではファイルシステムや文書デ
ータベースが知られており、実際に多くのオフィスで利
用されている。例えば、図18に示すように、大分類を
「文書の種類」、小分類を「作成日」として、分類基準
を決めて文書を整理する。
【0003】すると、「作成日」毎に分類して見たいと
きには「文書の種類」毎に全ての文書を見ていく必要が
ある。つまり、図18に示すように、「91年1月分」
の文書をまとめて調べるためには「月報」「報告書」
「依頼書」の3箇所の「91年1月分」を調べなければ
ならない。さらに、今までなかった分類基準である「作
成者」毎に分類したいときには、初めから全ての文書を
調べて分類し直す必要がある。
【0004】また文書データベース、電子ファイリング
システムでは、文書に対して、キーワードや属性を書き
込める領域が用意されている。これらを利用することに
よって、文書を検索するという機能が付加された。この
検索機能を利用すると、検索式を使って、必要な文書だ
けを取ってくることができるようになった。
【0005】上記装置以外の装置としては、特開昭63
−157229号公報や特開平1−189721号公報
に記載されたものが知られている。
【0006】特開昭63−157229号公報に記載さ
れたものは、予め幾つかの分類をしておき、属性やキー
ワードを利用して分類を切り替えることによって、あた
かも再分類したように再表示するものである。一方、特
開平1−189721号公報に記載されたものでは、分
類軸を予め複数用意して、1度に複数の分類軸を選択し
て多次元表示で文書の位置を表示するようにしている。
【0007】
【発明が解決しようとする課題】しかしながら、上記特
開昭63−157229号公報や特開平1−18972
1号に記載されたものや、上記従来の文書データベー
ス、電子ファイリングシステムには、次のような問題が
ある。
【0008】(1)文書に属性やキーワードを付与しな
ければならない。
【0009】多量の文書に属性やキーワードを付与する
ために大幅な手間がかかる。また属性やキーワードを付
与しなければ再分類できない。
【0010】(2)文書の更新に対して、属性やキーワ
ードの更新が伴わない。
【0011】文書の内容と属性とを別々に管理している
ためである。これを回避する技術として文書の全文検索
やキーワードの抽出などが一般に知られている。しか
し、それでは検索対象として、目的に合わない無駄な文
書(余計な部分の文書)を検索したり、検索時間がかか
ったりする。無駄な文書が多いほど、目的の文書を探す
ために手間がかかる。
【0012】(3)検索式を何度も書き直して検索しな
ければならない。
【0013】一般に、条件検索は属性値やキーワードが
ハッキリしているときには都合が良い。しかし、目的と
する文書が属性やキーワードでは特定できないときや、
初めて検索するときには、検索式の属性値やその範囲を
変更し試行錯誤することになる。従って、何度も検索式
を書き直さなければならず、大変な作業量/時間にな
る。
【0014】(4)分類項目どおりの分類を保守する手
間がかかる。
【0015】文書を分類/整理するための分類項目の保
守はユーザ任せである。例えば図19に示す例では、
「91年1月分の報告書」を探すときに「91年1月
分」「報告書」のどちらを探したら良いかは、文書を格
納した人にしか分からない。またある文書をその文書と
は全く関係のないところに置くこともできてしまう。そ
れらを保守するための作業量は大きなものである。
【0016】(5)文書を予め分類する手間がかかる。
【0017】特開昭63−157229号公報や特開平
1−189721号公報に記載されたものでは、分類項
目を”分類の種類”や”作成日”と変えて見ることがで
きるが、そのためには予め必要とする分類項目で全ての
文書を分類しておく必要がある。
【0018】そこで、本発明は、構造化文書を、利用者
の目的に応じて容易に分類することのできる構造化文書
分類装置を提供することを目的とする。
【0019】
【課題を解決するための手段】上記目的を達成するた
め、この発明では、文書の検索及び分類に関する情報と
して構造化文書を構成する構造要素に対応する構造要素
情報を指定する指定手段と、複数の構造化文書の中か
ら、文書の検索に関する情報としての前記構造要素情報
に基づく構造化文書群を検索する構造化文書検索手段
と、この構造化文書検索手段により検索された構造化文
書群を、文書の分類に関する情報としての前記構造要素
情報に基づいて分類する構造化文書分類手段とを具えて
いる。
【0020】
【作用】この発明によれば、指定手段によって、文書の
検索に関する情報としての構造要素情報と、文書の分類
に関する情報としての構造要素情報とを指定すると、構
造化文書検索手段は、複数の構造化文書の中から、文書
の検索に関する情報としての構造要素情報に基づく構造
化文書群を検索する。更に、その検索された構造化文書
群を、構造化文書分類手段が、文書の分類に関する情報
としての構造要素情報に基づいて分類する。
【0021】従って、構造化文書を構成する構造要素
を、構造要素名を用いて指定することにより、リアルタ
イムで、複数の構造化文書を検索し、かつ、分類するこ
とができる。
【0022】
【実施例】以下、本発明の実施例を添付図面を参照して
説明する。
【0023】最初に、本発明に係る構造化文書分類装置
の構成の説明に先立って、本発明に係る構造化文書の検
索のモデルを説明する。
【0024】図2は、本発明に係る構造化文書の検索の
モデルを図示化したものであり、同図において、検索フ
ォルダ210は検索式を持つフォルダであり、その検索
式は「検索対象」、「検索条件」、「分類属性」の組み
から構成されている。「検索対象」はフォルダ名であ
り、フォルダ内の全ての文書を検索対象としていること
を意味する。「検索条件」は論理式であり、「構造要素
名 演算子 値」を用いて記述する。「分類属性」は構
造要素名であり、対応する構造化文書の構造要素の内容
別に分類する。
【0025】例えば、検索対象220で表されるフォル
ダ名が「検索対象」という検索対象フォルダ230に存
在する文書集合中、この場合は、検索対象フォルダ23
0内に存在する文書集合231、検索フォルダ230に
存在するフォルダ232の下位に存在する文書集合23
3、234の各文書集合中、検索条件240に適合して
いる文書だけが検索(選択)され、更に検索された文書
は、分類属性250で表される構造要素の内容に応じて
部分集合260、270に分類される。この分類された
部分集合はそれぞれ仮想フォルダ280、290内に表
示される。仮想フォルダ280、290はフォルダの実
体が存在せず、検索/分類結果をフォルダの形で表現し
たビューである。
【0026】すなわち、この実施例では、検索フォルダ
210の検索式を評価することで、検索フォルダ210
の下位に、検索及び分類結果としての部分集合(文書集
合)260、270を見せるためのビューである仮想フ
ォルダ280、290が生成される。このため、検索及
び分類結果をユーザに提示するためのデータ構造は、図
2に示すように、根(ルート)である検索フォルダの下
位に仮想フォルダが位置し、その仮想フォルダの下位に
文書が位置している構造(以下、この実施例では分類構
造という)になっている。なお、検索フォルダ、仮想フ
ォルダはそれぞれ文書を分類して表示するためのオブジ
ェクトである。このため、表示方式が変更されれば他の
オブジェクトを導入することになる。
【0027】ここで、検索フォルダと仮想フォルダとの
違いは、前者はユーザが定義/作成する実態であり、後
者は検索毎に更新されるビューである。また前者は分類
構造の根であり、後者は分類構造の中間位置に存在する
(分類構造の末端は文書である)。
【0028】なお、従来のファイルシステムとのインタ
フェースを同じにするために、ここでは分類の道具とし
て「仮想フォルダ」を導入している。この「仮想フォル
ダ」とは、検索式を持ち、その検索条件に合う文書集合
があたかもその仮想フォルダの中にあるように見せるも
のである。仮想フォルダを生成することによって、ユー
ザの目的に合わせた一定の条件に合う文書の分類を実現
することができる。このように本発明では、従来の階層
ファイルシステム上にユーザの目的に合わせて多量の文
書を自動的に分類してユーザに見せることができるよう
にしたものである。
【0029】図1は発明に係る構造化文書分類装置の第
1の実施例を機能ブロック図で示したものである。
【0030】同図において、構造化文書格納手段110
には文書(構造化文書)や複数の文書を所有するフォル
ダが格納される。構造化文書格納手段110からは、格
納された文書やフォルダを識別子や名前で取り出すこと
ができる。
【0031】検索条件指定手段120は、検索時に必要
な情報、具体的には、構造化文書格納手段110に格納
された複数の構造化文書やフォルダ(検索対象)と検索
条件とを指定する(上記検索式内の「検索対象」と「検
索条件」とを指定する)。その指定され情報は、構造化
文書検索手段130に入力される。
【0032】構造化文書検索手段130は、構造化文書
格納手段110内から、検索条件指定手段120で指定
された文書の内容を検索して、検索条件に合う文書を検
索する。例えば図2においては、検索対象220で指定
された検索対象フォルダ230内に存在する文書集合2
31、233、234から、検索条件240に適合する
部分集合260、270を有する部分集合群(この場合
は、図2に示す部分集合260、270のように分類さ
れておらず、ランダムな文書の集合になっている)を検
索する。
【0033】分類属性指定手段140は、分類に必要な
情報である構造要素名(分類属性)を指定する(上記検
索式内の「分類属性」を指定する)。その指定された情
報は構造化文書分類手段150に入力される。なお、分
類属性の指定は1つであっても良いし、複数であっても
良い。
【0034】ここで1つの分類属性が指定された場合
は、1つの構造要素に注目して、それを分類属性とし
て、検索時に文書集合を分類して、分類構造を生成す
る。
【0035】また複数の分類属性が指定された場合は、
複数の構造要素名に対応する構造要素に対応付けられた
文書の内容による分類を繰り返し、階層的な部分構造を
生成する。つまり、複数存在する分類属性を順に1つず
つ評価して再帰的に分類を続けて、分類構造を階層化し
て生成する。
【0036】なお、分類構造を生成しなければ、分類さ
れた文書を表示できないというものではないので、分類
構造を生成しなくても良い。しかし、この実施例では、
分類構造を生成するものとして説明する。なお分類構造
を生成しない場合の表示については後述する。
【0037】構造化文書分類手段150は、構造化文書
検索手段130によって検索された文書を、分類属性指
定手段140で指定された構造要素名に対応付けられた
文書の内容別に分類するとともに、その分類された文書
を基に分類構造を生成する。例えば図2においては、分
類属性250に従って、部分集合群を、部分集合260
と、部分集合270とに分類するとともに、仮想フォル
ダ280、290を生成して分類構造を生成する。
【0038】文書表示手段160は、構造化文書分類手
段150によって生成された分類構造、構造化文書検索
手段130によって検索された文書の一部又は全部を表
示する。
【0039】次に上述した各構成要素を具体的に説明す
る。構造化文書格納手段110は、構造化文書を格納す
るためのファイルシステムやファイルサーバ、データベ
ースの機能を有する磁気ディスク装置や光磁気ディスク
装置など記憶装置で実現される。検索条件指定手段12
0および分類属性指定手段140は、マウスなどのポイ
ンティングデバイスやキーボードで実現される。文書表
示手段160はディスプレイ装置や印字装置など出力装
置で実現される。
【0040】構造化文書検索手段130は、上述した当
該検索手段130の機能を遂行させるためのプログラ
ム、即ち、格納された構造化文書を構成する各構造要素
を、指定された構造要素名で識別し、その構造要素名に
対応する文書内容を検索するためのプログラムを、プロ
セッサや中央処理装置等の制御手段(図示せず)が実行
することにより実現される。構造化文書分類手段150
は、上述した当該分類手段150の機能を遂行させるた
めのプログラム、即ち、構造化文書検索手段130によ
る検索結果としての、文書構造と文書内容とを参照し
て、その文書内容によって文書を分類するためのプログ
ラムを、上記制御手段が実行することにより実現され
る。
【0041】なお、図示しない上記制御手段は、構造化
文書格納手段110に対するアクセス制御、検索条件指
定手段120および分類属性指定手段140に対する入
力制御、文書表示手段160に対する出力制御を行って
いる。
【0042】この実施例では、検索/分類に関する操作
はデスクトップ環境で行えるようになっており、アイコ
ン表示されたフォルダ(フォルダアイコン)をマウスボ
タンでダブル・クリックすると、そのフォルダアイコン
に対応するフォルダ内の文書や他のフォルダ(例えば仮
想フォルダ)を見ることができる。
【0043】検索フォルダには、予めプロパティ・キー
を押下してプロパティ・シートを開き、そのプロパティ
・シートで検索式を設定しておく。その検索式を設定す
るのが、検索条件指定手段120、分類属性指定手段1
40である。このとき、ダブル・クリックすると、条件
選択された文書や生成された仮想フォルダを見ることが
できる。なお、検索フォルダに予め検索式が設定されて
いないときは、検索直前にプロパティ・シートが開くだ
けであり、検索は行われない。従ってシステムはユーザ
に対して検索式の入力を要求することとなる。
【0044】上述した構成において、構造化文書分類装
置の処理動作を図3のフローチャートを参照して説明す
る。
【0045】最初に、検索条件指定手段110によっ
て、文書集合(検索対象)および検索条件を入力すると
ともに、分類属性指定手段140によって、構造要素名
(分類属性)を入力することにより、検索/分類に必要
な検索式を入力する(ステップ301)。その検索対象
及び検索条件は構造化文書検索手段130に入力され、
構造要素名(分類属性)は構造化文書分類手段15に入
力される。
【0046】すると、構造化文書検索手段130は、得
られた検索対象及び検索条件を評価し実行する。すなわ
ち構造化文書格納手段110に格納されている検索対象
の文書集合から、検索条件に適合する文書を検索して
(ステップ302)、その検索結果としての文書を構造
化文書分類手段150に渡す。
【0047】一方、構造化文書分類手段150は、検索
式に分類属性が指定されているか否かを判断する(ステ
ップ303)。ここで、分類属性(構造要素名)が指定
されていれば、その分類属性と、検索された文書集合中
の当該分類属性に対応する文書内容とに基づいて、その
文書集合を分類し(ステップ304)、その後、分類構
造を生成する(ステップ305)。更に、分類された文
書集合を分類構造として文書表示手段160に出力する
(ステップ306)。なお、ステップ303において分
類属性が指定されていない場合は、検索された文書を文
書表示手段160に出力する。
【0048】次に上述した構造化文書の検索/分類処理
を、図4乃至図15を用いて具体的に説明する。
【0049】図4は構造化文書格納手段110に格納さ
れている構造化文書の一例を示したものであり、この構
造化文書は、文書の論理的な構造を形成する各構造要素
と、該構造要素に対応付けられた文書の内容及び構造要
素名と、該構造要素から構成される論理オブジェクトと
から構成されている。図4において401〜406は文
書の論理的な構造を形成する各構造要素であり、特に4
01は「文書論理根」である。また402A〜405A
は文書の内容(内容部)である。さらに「出願人」、
「公開年」、「国際特許分類」、「タイトル」、「本
文」は、それぞれ構造要素に対応付けられた構造要素名
である。なお、「本文」の構造要素406以下の構造は
複雑になっているので、ここではその構造を省略してい
る。
【0050】ここで、「出願人」という構造要素名に対
応付けられる文書内容としては、例えば「AA会社」、
「BB会社」など出願人の名称であり、また「公開年」
という構造要素名に対応付けられる文書内容としては、
例えば「1987年」、「1988年」など出願公開年
であり、更に「国際特許分類」という構造要素名に対応
付けられる文書内容としては、例えば「G06F 15/20」、
「G06F 7/00 」など国際特許分類(IPC)である。
【0051】この実施例では、少なくとも、「出願
人」、「公開年」、「国際特許分類」の各構造要素を含
んでいる構造化文書が、例えば「日米特許フォルダ」
(実際にはファイルである)内に複数格納されているも
のとする。勿論、他の構造化文書も格納されていても良
い。
【0052】図5は、「検索対象」、「検索条件」、
「分類属性」からなる検索式を指定するための検索フォ
ルダのプロパティ・シート500を示したものであり、
プロパティ・シート500には、構造化文書を検索する
ために必要な「検索対象」および「検索条件(式)」を
指定するための各フィールド510、520と、文書を
自動的に分類するたの分類項目として「分類属性」を指
定するためのフィールド53とが設けられており、更に
「検索条件」に対応して、複数の条件式が指定された場
合に、その複数の条件式の「論理和」かあるいは「論理
積」のいずれかを選択するボタン520Aが設けられて
いる(これは、条件式は複雑な式を許しても良いが、ユ
ーザ・インタフェースを簡単にするために簡単な表現形
式にしている。)ここで、「検索対象」の指定に際して
は、フォルダ名をフィールド510に指定する。これ
は、指定されたフォルダ名に対応するフォルダ内にある
全ての文書を要素とする文書集合が検索対象となること
を意味している。また「検索条件」の指定に際しては、
「検索対象」で示された文書集合のうち、目的の文書に
必要な条件式を、フィールド520に記述する。複数の
条件式を設定した場合には、ボタン520A内の「AN
D」あるいは「OR」のいずれかの領域上にカーソルを
移動してマウスボタンをクリックすることにより、「論
理和」かあるいは「論理積」のいずれかを選択する。
【0053】上記条件式のフォーマットは「(構造要素
名 演算子 値)」である。条件式の評価は、「条件式
の構造要素名」に文書の構造要素の内容が代入されて演
算子が評価される。条件式は論理式であり、真となった
文書が選択される。
【0054】最後に「分類属性」の指定に際しては、
「検索対象」と「検索条件」とを指定することにより得
られた文書集合を分類するために必要な分類項目、つま
り分類属性を、フィールド530に記述する。「分類属
性」で指定される構造要素の内容別に文書が分類され、
部分集合に分けられる。更にその部分集合に対応する仮
想フォルダが自動的に作成される。
【0055】ここで、ユーザが、図5に示すように、フ
ィールド510内にフォルダ名として「日米特許フォル
ダ」を指定し、フィールド520内に条件式として(国
際特許分類=G06F 15/20)を記述し、またボタン520
Aの「OR」を指示し、更にフィールド530内に構造
要素名(分類属性)として「出願人」を記述したとす
る。
【0056】このようにして検索式が指定されると、構
造化文書検索手段130は、フィールド510内に指定
されたフォルダ名に対応する「日米特許フォルダ」を構
造化文書格納手段110から検索するとともに、その
「日米特許フォルダ」内の構造化文書集合から、フィー
ルド520内に指定された条件式「国際特許分類=G06F
15/20」に適合する文書を検索する。このとき、指定さ
れた条件式「国際特許分類=G06F 15/20」と同一の構造
要素名に対応する構造要素を有している構造化文書のみ
が検索される。例えば、図4に示す構造化文書の構造要
素404に対応する文書内容404Aを参照すること
で、当該文書が、検索対象の文書であるか否かを判定す
ることができる。ここでは複数の文書が検索されるもの
とする。その検索された各構造化文書は構造化文書分類
手段150に伝送される。
【0057】すると、構造化文書分類手段150は、フ
ィールド530に指定された「出願人」という分類属性
に従って渡された各構造化文書を分類して、各部分毎に
部分集合にする。このとき、指定された「出願人」と同
一の構造要素名で表された構造要素に対応する文書内容
に従って分類することになる。例えば、図4に示す構造
化文書の構造要素402に対応する文書内容402Aを
参照することにより、細分類することができる。又、分
類された各部分集合に対応して仮想フォルダを生成し、
その後、部分集合と仮想フォルダとに基づいて分類構造
を生成する。その分類構造の一例を図6に示す。
【0058】図6に示す例では、ルートである検索フォ
ルダ610の下位に「AA会社」、「BB会社」、「C
C会社」の各出願人毎にそれぞれ対応して分類された各
部分集合620A、630A、640Aを表示すべくビ
ューとしての各仮想フォルダ620、630、640が
生成されている。
【0059】この図に示した状態が内部状態であって、
検索/分類処理が終了した状態でもある。このとき、文
書表示手段160には、例えば、検索フォルダ610に
対応するウィンドウ内に、例えば、仮想フォルダ62
0、630、640をそれぞれ示す各仮想フォルダアイ
コンと、対応する出願人「AA会社」、「BB会社」、
「CC会社」とが表示されることとなる。
【0060】そして、ユーザが、例えば出願人「CC会
社」に対応する仮想フォルダアイコンをマウスボタンを
クリックして、仮想フォルダのプロパティ・シートを表
示すべき指示をすることにより、出願人「CC会社」に
対応して分類された部分集合が得られるための、検索対
象と検索条件とが記述された仮想フォルダのプロパティ
・シートが文書表示手段160に表示される。その表示
状態の一例を図7に示す。
【0061】この図では、検索/分類した文書集合から
作成された仮想フォルダ(ここでは検索フォルダ(/動
的分類フォルダ)の下位に、仮想フォルダ(/動的分類
フォルダ/CC会社)が生成された仮想フォルダ)のプ
ロパティ・シート(検索式)700を示している。検索
対象が検索フォルダ(/動的分類フォルダ)になり、検
索条件が「出願人=CC会社」となる。
【0062】上述した例では分類属性指定手段140に
よる分類属性の指定が1つであったが、複数の分類属性
を指定することもできる。
【0063】これには、例えば検索フォルダと仮想フォ
ルダの区別なく、検索式中に「分類属性」を書けるよう
にすると、複数の分類属性が書けるようになり、分類し
たものを更に細分類することができる。このようにする
と、分類の階層を動的に生成して、分類構造を実現でき
る。次に複数の分類属性を指定した場合の検索/分類に
ついて説明する。
【0064】図8は、複数の分類属性を指定した場合の
検索フォルダのプロパティ・シートの一例を示したもの
である。プロパティ・シート800は、図5に示したプ
ロパティ・シート500と同一の構成になっている。図
8に示した例では、分類属性に対応するフィールド53
0内には、分類属性として「出願人」、「公開年」がそ
れぞれ指定されている。
【0065】この検索式が指定されると、構造化文書検
索手段130は、上述したように構造化文書格納手段1
10内に格納されている「日米特許フォルダ」内の構造
化文書集合から、フィールド520内に指定された条件
式「国際特許分類=G06F 15/20」に適合する文書集合を
検索する。その文書集合は構造化文書分類手段150に
通知される。
【0066】すると、構造化文書分類手段150は、フ
ィールド530に指定された「出願人」及び「公開年」
という分類属性に従って、渡された各構造化文書を分類
して各部分集合にする。
【0067】このとき、検索された構造化文書群が、指
定された「出願人」と同一の構造要素名で表された構造
要素に対応する文書内容に従って分類され、更に、その
出願人毎に分類された文書集合が、指定された「公開
年」と同一の構造要素名で表された構造要素に対応する
文書内容に従って分類されることとなる。最終的に分類
された文書集合が部分集合となる。
【0068】次に、構造化文書分類手段150は、分類
された各部分集合に対応して、出願人毎に分類した内容
を表示するための仮想フォルダと、公開年毎に分類した
内容を表示するための仮想フォルダとを生成し、その
後、部分集合と各仮想フォルダとに基づいて分類構造を
生成する。その分類構造の一例を図9に示す。
【0069】図9に示す例では、ルートである検索フォ
ルダ910の下位に仮想フォルダ920、930、94
0が生成されている。仮想フォルダ920の下位に、部
分集合921A及び部分集合922Aをそれぞれ表示す
べくビューとしての、仮想フォルダ621及び仮想フォ
ルダ622が生成されている。また仮想フォルダ930
の下位に、部分集合931A及び部分集合932Aをそ
れぞれ表示すべくビューとしての、仮想フォルダ631
及び仮想フォルダ632が生成されている。更に、仮想
フォルダ940の下位に、部分集合941A〜944A
をそれぞれ表示すべくビューとしての、仮想フォルダ9
41〜944が生成されている。
【0070】このようにして検索/分類が終了すると、
文書表示手段160には、上述したように仮想フォルダ
920、930、940をそれぞれ示す各仮想フォルダ
アイコンが表示され、更に、それらの仮想フォルダアイ
コンの中から所望のアイコン例えば、仮想フォルダ94
0に対応するアイコンを指示すると、今度は仮想フォル
ダ941〜944の各仮想フォルダにそれぞれ対応する
仮想フォルダアイコンが表示されることとなる。
【0071】ここで、もう少し具体的に説明すると、検
索フォルダ(/動的分類フォルダ)をダブル・クリック
すると、ウインドウが開いて、出願人毎に分類された部
分集合を表示すべく仮想フォルダに対応する仮想フォル
ダアイコンが表示される。その表示状態の一例を図10
に示す。
【0072】更に、例えば出願人「CC会社」に対応す
る仮想フォルダ(/動的分類フォルダ/CC会社)に対
応する仮想フォルダアイコン1000をダブル・クリッ
クすると、公開年毎に分類された部分集合を表示すべく
仮想フォルダに対応する仮想フォルダアイコンが表示さ
れる。その表示状態の一例を図11に示す。
【0073】そして、例えば「1987年」に対応する
仮想フォルダアイコン1100をダブルクリックする
と、出願人が「CC会社」であって、公開年が「198
7年」である部分集合(つまり構造化文書)のリストが
文書表示手段160の表示画面上に表示される。そのリ
ストの中から所望の構造化文書の項目を指定することに
より、その文書の内容が表示されることとなる。
【0074】また構造化文書がどのようにして分類され
たかを知るためには、仮想フォルダアイコンをダブル・
クリックして、仮想フォルダのプロパティ・シートをオ
ープンすべき旨の指示をすれば良い。例えば図10に示
す「CC会社」の仮想フォルダアイコン1000をダブ
ル・クリックして、仮想フォルダのプロパティ・シート
をオープンすべき旨の指示をすることにより、細分類可
能な仮想フォルダのプロパティ・シートが表示される。
その表示状態を図12に示す。プロパティ・シート12
00からは、検索対象として「検索フォルダ(動的分類
フォルダ)」が、検索条件として「出願人=CC会社」
が、分類属性として「公開年」がそれぞれ指定されてい
ることが分かる。
【0075】また、図11に示す「1987年」の仮想
フォルダアイコン1100をダブルクリックして、仮想
フォルダのプロパティ・シートをオープンすべき指示を
することにより、もう分類しない仮想フォルダのプロパ
ティ・シートが表示される。その表示状態の一例を図1
3に示す。プロパティ・シート1300からは、検索対
象として「仮想フォルダ(/動的分類フォルダ/CC会
社)」が、検索条件として「公開年=1987年」がそ
れぞれ指定されていることが分かる。
【0076】上述したように階層的な関係になっている
仮想フォルダを順次指示してオープンすることにより、
目的とする文書の内容を見ることができる。
【0077】しかしこれでは仮想フォルダの末端までい
かなければ、目的の文書を見ることができない。そこ
で、表示の形式を変えて、検索フォルダに対応する検索
フォルダアイコンをダブル・クリックすることにより、
下部に文書集合をリストして、上部にフォルダの階層構
造(分類構造)を表示できるようなウィンドウを表示す
る。その表示状態の一例を図14に示す。この図では、
ウィンドウ1400のリスト表示領域1401内に、動
的分類フォルダアイコン1402に対応する動的分類フ
ォルダ(検索フォルダ)内に存在する文書のリストが表
示されている。
【0078】この表示状態から、分類/検索結果を表示
すべく指示をすると、図15のようになる。この図で
は、ウィンドウ1400の階層構造表示領域1501内
に、階層構造(分類構造)が表示されている。
【0079】例えば、フォルダアイコン1402は図9
に示す検索フォルダ910に、フォルダアイコン150
2は図9に示す仮想フォルダ930に、フォルダアイコ
ン1503は図9に示す仮想フォルダ940に、フォル
ダアイコン1504、1505は図9に示す仮想フォル
ダ931、932に、フォルダアイコン1506、15
07は図9に示す仮想フォルダ941、942に、それ
ぞれ対応するものである。
【0080】次に、分類構造を生成せずに、検索フォル
ダ(動的分類フォルダ)用のウィンドウ内に、分類され
た文書を表示し、かつ、分類に併せて仕切りを表示する
ようにした表示例を図16に示す。この図の例に示すよ
うに、ウィンドウ1600内には、「AA会社」、「B
B会社」、「CC会社」の各出願人にそれぞれ対応し
て、出願人毎に分類された文書のリストが表示されてい
る。
【0081】図17は、発明に係る構造化文書分類装置
の第2の実施例を機能ブロック図で示したものである。
【0082】この機能ブロック図は、図1に示した第1
の実施例の機能ブロック図の構成に文書分類構造管理手
段1700を追加した構成になっている。なお、同図に
おいて、図1に示した構成要素と同一の機能を果たす部
分には同一の符号を付している。
【0083】この第2の実施例の装置は、基本的には第
1の実施例の装置と同様の機能を有している。
【0084】文書分類構造管理手段1700には、最低
文書数が記述されている。文書分類構造管理手段170
0は、実際には、構造化文書分類手段150が必要とす
る細かな設定や暗黙の設定を記述したデータファイルで
ある。そこには例えばソートの条件や検索/分類の実行
タイミングなどが記述される。
【0085】これによって、例えば、文書が既に少なく
なっているために分類する必要がない場合は、文書が少
なくなり選択した文書の数が最低文書数以下のときは、
分類を停止して、これ以上、階層の末端には仮想フォル
ダを生成しない。という指定ができる。またフォルダ内
の文書の見易さを考慮して、ある項目(構造要素名)を
指定して、それに対応する文書内容に応じて文書集合を
ソートすることも挙げられる。これによって目的の文書
を素早く得ることができる。
【0086】次に、文書分類構造管理手段1700内に
記述される記述内容の具体例を幾つか挙げて説明する。
【0087】(1)「そのほか」の指定(その1) ある数より小さいときに、「そのほか」のフォルダを生
成して、そこにまとめて分類する。その数を指定する。
【0088】文書分類構造管理手段1700に、例えば
「そのほか:出願人:5」と指定すると、構造化文書分
類手段150は、出願人で分類するとき、例えばXX会
社は4件しかなかったら「そのほか」に分類し、また例
えばAA会社が7件あったならば仮想フォルダ「AA会
社」に分類する。
【0089】(2)「そのほか」の指定(その2) ある属性値だけに注目して分類し、該当しない値はすべ
て「そのほか」に入れる。
【0090】文書分類構造管理手段1700に、例えば
「そのほか:出願人:(AA会社、BB会社、CC会
社)」と指定すると、構造化文書分類手段150は、出
願人については、「AA会社」、「BB会社」、「CC
会社」、「そのほか」の4つのどれかに分類する。
【0091】(3)複数を1つにまとめる指定 複数の値を指定して同じフォルダに分類する。
【0092】文書分類構造管理手段1700に、例えば
「出願人:FXグループ:FXXXX,FXIII」と
指定すると、構造化文書分類手段150は、FXXX
X、FXIIIのどちらの特許も「FXグループ」にあ
るように分類する。
【0093】(4)範囲を指定 条件式で記述できる範囲を指定して同じフォルダに分類
する。
【0094】文書分類構造管理手段1700に、例えば
「公開年:89年以前:公開年<=89年」と指定する
と、構造化文書分類手段150は、公開年で分類する際
に、条件式「公開年<=89年」に合うものは優先的に
フォルダ「89年以前」に分類する。また文書分類構造
管理手段1700に、例えば「公開年:90年から91
年:公開年=90年/公開年=91年」と指定すると、
構造化文書分類手段150は、公開年で分類する際に、
条件式「公開年=90年/公開年=91年」に合うもの
は優先的に「90年から91年」に分類する。このよう
に条件式を複数指定することもできる。
【0095】次に第1及び第2の実施例における変形例
(応用例)を説明する。
【0096】(1)検索式の再利用 一度指定された検索式を構造化文書格納手段110に格
納しておき、その検索式を、指定手段(検索条件指定手
段120、分類属性指定手段140)により呼び出すこ
とにより、同一の検索式を再度入力しなくても良いよう
にする。これによりユーザが検索式を入力する手間が軽
減される。
【0097】(2)指定手段の改善 「検索対象」の選択は、フォルダ名を指定するのではな
く、フォルダアイコンをコピーする。また「検索条件」
や「分類属性」の選択はメニューにすると、よりユーザ
・インタフェースが良くなる。
【0098】(3)実行速度の短縮 文書が変更されていないときには、一度検索した分類に
ついては情報を格納して検索せずに再利用することによ
って、実行速度を短縮する。具体的には、検索式と分類
構造と分類した時間とを格納して、文書かフォルダの変
更時間と分類した時間とを比べて、文書に変更がなけれ
ば格納した分類構造を表示する。変更されているときに
は検索して分類し直す。
【0099】以上説明したように、本実施例によれば次
のような利点がある。
【0100】(1)文書に属性やキーワードを付与しな
くても分類できる。
【0101】構造化文書の構造要素を文書の属性のよう
に扱うことで、キーワードをつけたり、属性を入力する
必要がなく、文書を検索/分類することができる。
【0102】(2)検索に必要な属性と文書の一貫性が
維持できる。
【0103】構造化文書の構造要素を文書の属性のよう
に扱うことで、文書内容の更新に合わせて、検索/分類
属性との一貫性が維持できる。
【0104】(3)検索式の更新が最小限で済む。
【0105】本発明は単なる検索で目的の文書集合を選
択するだけでなく、選択された文書集合を細かく分類す
るようにしたものである。そこで、検索条件で大まかな
文書集合を選択して、これを分類項目で分類する検索式
を設定しておく。すると、検索式をいちいち書いたり、
書き直したりしないで、多目的に検索式を使うことがで
きる。
【0106】(4)文書集合を分類項目に沿って多段に
細分類できる。
【0107】分類項目を多数指定することによって、単
なる分類だけでなく、多段に分類することで、細分類が
できる。多段に分類することによって、ユーザ自身の分
類構造を持つことができる。とくに複数のユーザが共有
している文書を探し出すときには、他のユーザが利用し
ている分類構造/分類基準にとらわれずに、同じ文書集
合を自分の分類構造で分類してみることができる。
【0108】(5)文書の分類はその場で自動的に行
う。
【0109】特開昭63−157229号公報や特開平
1−189721号公報に記載されたもののように予め
文書を分類する必要がなく、ユーザは「分類属性」の指
定だけで、本実施例の装置が全て自動的に分類する。
【0110】最後に、本発明の特徴(新規の技術)を箇
条書きにしてまとめる。
【0111】(1)その場で複数の分類構造を生成でき
る。
【0112】(2)複数の分類をその場で重ねて階層的
な1つの構造として見せること。
【0113】(3)文書の構造要素そのものが属性とな
ること。
【0114】(4)検索式を利用して、漠然とした文書
集合を取り出して分類すること。
【0115】
【発明の効果】以上説明したように本発明によれば、構
造化文書の検索及び分類に必要な情報として、構造化文
書を構成する構成要素を指定することにり、検索条件と
して指定された構成要素を有している構造化文書群が検
索され、更に、その検索された構造化文書群が、分類属
性として指定された構成要素を有している構造化文書毎
に分類されることとなり、従来の如く、複数の構造で文
書を予め分類しておく必要はなく、文書の検索/分類操
作指示により、リアルタイムで複数の分類構造を生成で
き、かつ、表示することができる。
【図面の簡単な説明】
【図1】本発明に係る構造化文書分類装置の第1の実施
例を示す機能ブロック図。
【図2】本発明に係る構造化文書の検索及び分類のモデ
ルを図示化した図。
【図3】本実施例における検索及び分類の処理動作を示
すフローチャート。
【図4】本実施例における構造化文書格納手段に格納さ
れる構造化文書の一例を示す図。
【図5】本実施例における検索式を指定するための検索
フォルダのプロパティ・シートの一例を示す図。
【図6】図5に示した検索式に基づいて生成された分類
構造の一例を示す図。
【図7】本実施例におけるビューとしての仮想フォルダ
のプロパティ・シートの一例を示す図。
【図8】本実施例における複数の分類属性を有する検索
式を指定するための検索フォルダのプロパティ・シート
の一例を示す図。
【図9】図8に示した検索式に基づいて生成された分類
構造の一例を示す図。
【図10】本実施例における検索フォルダのビューの一
例を示す図。
【図11】本実施例における仮想フォルダのビューの一
例を示す図。
【図12】本実施例における細分類可能な仮想フォルダ
のプロパティ・シートの一例を示す図。
【図13】本実施例における分類しない仮想フォルダの
プロパティ・シートの一例を示す図。
【図14】本実施例における検索/分類前の検索フォル
ダの表示状態の一例を示す図。
【図15】本実施例における検索/分類後の検索フォル
ダの表示状態の一例を示す図。
【図16】本実施例における仮想フォルダの無い検索フ
ォルダを示す図。
【図17】本発明に係る構造化文書分類装置の第2の実
施例を示す機能ブロック図。
【図18】複数の文書の分類の一例を示す図。
【図19】複数の文書の分類の一例を示す図。
【符号の説明】
110…構造化文書格納手段、120…検索条件指定手
段、130…構造化文書検索手段、140…分類属性指
定手段、150…構造化文書分類手段、160…文書表
示手段、1700…文書分類構造管理手段。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】文書の検索及び分類に関する情報として構
    造化文書を構成する構造要素に対応する構造要素情報を
    指定する指定手段と、 複数の構造化文書の中から、文書の検索に関する情報と
    しての前記構造要素情報に基づく構造化文書群を検索す
    る構造化文書検索手段と、 この構造化文書検索手段により検索された構造化文書群
    を、文書の分類に関する情報としての前記構造要素情報
    に基づいて分類する構造化文書分類手段とを具えたこと
    を特徴とする構造化文書分類装置。
  2. 【請求項2】前記構造化文書分類手段は、前記構造化文
    書検索手段により検索された構造化文書群を分類した分
    類状態を表現している分類構造を生成することを特徴と
    する請求項1記載の構造化文書分類装置。
JP24958091A 1991-09-27 1991-09-27 構造化文書分類装置及び方法 Expired - Lifetime JP3303926B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP24958091A JP3303926B2 (ja) 1991-09-27 1991-09-27 構造化文書分類装置及び方法
US07/951,216 US5418946A (en) 1991-09-27 1992-09-25 Structured data classification device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24958091A JP3303926B2 (ja) 1991-09-27 1991-09-27 構造化文書分類装置及び方法

Publications (2)

Publication Number Publication Date
JPH0589173A true JPH0589173A (ja) 1993-04-09
JP3303926B2 JP3303926B2 (ja) 2002-07-22

Family

ID=17195124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24958091A Expired - Lifetime JP3303926B2 (ja) 1991-09-27 1991-09-27 構造化文書分類装置及び方法

Country Status (2)

Country Link
US (1) US5418946A (ja)
JP (1) JP3303926B2 (ja)

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0744568A (ja) * 1993-07-30 1995-02-14 Mitsubishi Electric Corp 検索インタフェース装置
JPH0778186A (ja) * 1993-05-17 1995-03-20 Ricoh Co Ltd 文書処理装置
JPH07110814A (ja) * 1993-10-12 1995-04-25 Fuji Xerox Co Ltd 電子文書記憶装置
JPH07121552A (ja) * 1993-10-27 1995-05-12 Fuji Xerox Co Ltd 文書群分析装置
JPH07129448A (ja) * 1993-11-01 1995-05-19 Just Syst Corp ファイル選択システム
JPH07282087A (ja) * 1994-04-07 1995-10-27 Fuji Xerox Co Ltd 情報構造化表示装置
JPH08106471A (ja) * 1994-10-03 1996-04-23 Toshiba Corp 情報記憶検索装置
JPH0922414A (ja) * 1995-07-06 1997-01-21 Hitachi Ltd 文書分類支援方法および装置
JPH0981585A (ja) * 1995-09-14 1997-03-28 Ricoh Co Ltd 電子ファイリング装置
JPH0991299A (ja) * 1994-07-28 1997-04-04 Xerox Corp 階層的に関連した情報の生成方法及びコンピュータ制御ディスプレイシステム
JPH10116290A (ja) * 1996-10-11 1998-05-06 Mitsubishi Electric Corp 文書分類管理方法及び文書検索方法
JPH10143517A (ja) * 1996-11-13 1998-05-29 Fuji Xerox Co Ltd 文書作成装置
JPH10154157A (ja) * 1996-11-22 1998-06-09 Nec Corp 電子ファイリングシステム
JPH10187762A (ja) * 1996-10-22 1998-07-21 Fujitsu Ltd 検索論理式入力装置
US5819295A (en) * 1995-10-30 1998-10-06 Matsushita Electric Industrial Co., Ltd. Document storing and managing system
JPH10301941A (ja) * 1997-04-23 1998-11-13 Mitsubishi Electric Corp 文書情報共有化システム
JPH1145197A (ja) * 1997-07-25 1999-02-16 Fuji Xerox Co Ltd 階層構造提示装置及び階層構造提示方法
JPH11102373A (ja) * 1997-09-29 1999-04-13 Nec Corp 情報アクセス装置および方法とプログラムを記録する記 録媒体
JP2001297022A (ja) * 2000-03-09 2001-10-26 Internatl Business Mach Corp <Ibm> オブジェクトを管理し、情報をコミュニティの間で共有する方法及びシステム
JP2001306593A (ja) * 2000-04-17 2001-11-02 Kuniichi Okada 表示方法、表示処理装置、及び記録媒体
JP2002116933A (ja) * 2000-10-12 2002-04-19 Sony Corp 情報処理装置および情報処理方法、並びにプログラム格納媒体
JP2004280849A (ja) * 2004-04-30 2004-10-07 Canon Inc データ表示方法及びそのシステム
WO2004111876A1 (ja) * 2003-06-11 2004-12-23 Fujitsu Limited 検索条件を再利用する検索システムおよび方法
JPWO2004088519A1 (ja) * 2003-03-31 2006-07-06 富士通株式会社 ファイル分類装置、ファイル分類方法およびファイル分類プログラム
JP2006521592A (ja) * 2003-03-27 2006-09-21 マイクロソフト コーポレーション 様々なタイプおよび様々な物理位置からのアイテムを表示するためのファイルシステム
JP2007058792A (ja) * 2005-08-26 2007-03-08 Fujifilm Holdings Corp 画像処理装置、画像処理方法及び画像処理プログラム
JP2007128416A (ja) * 2005-11-07 2007-05-24 Fuji Xerox Co Ltd オブジェクト管理プログラム、装置および方法
JP2007287178A (ja) * 2001-09-28 2007-11-01 Emc Corp コンピュータシステム環境内の資源を表示するための方法及び装置
JP2008276575A (ja) * 2007-04-27 2008-11-13 Kokuyo Co Ltd データ管理装置及びそのプログラム
JP2009032296A (ja) * 2008-11-10 2009-02-12 Ko Owada 特許管理プログラム
JP2009053958A (ja) * 2007-08-27 2009-03-12 Canon Inc 情報処理装置及びその制御方法
JP2009205207A (ja) * 2008-02-26 2009-09-10 Nec Corp タグ情報に基づく情報分類表示システム
JP2009289042A (ja) * 2008-05-29 2009-12-10 Canon Inc 検索装置の制御方法、検索装置
US7757254B2 (en) 1996-03-29 2010-07-13 Microsoft Corporation Interactive entertainment system for presenting supplemental interactive content together with continuous video programs
JP2011170600A (ja) * 2010-02-18 2011-09-01 Fuji Xerox Co Ltd 情報管理装置及びプログラム
US8051450B2 (en) 1997-03-31 2011-11-01 Microsoft Corporation Query-based electronic program guide
JP2012064234A (ja) * 2005-03-31 2012-03-29 Barclays Capital Inc ドキュメントシリーズを使用したドキュメントからなる集合のグループ化のシステム
US9361312B2 (en) 2003-03-27 2016-06-07 Microsoft Technology Licensing, Llc System and method for filtering and organizing items based on metadata
US9910569B2 (en) 2003-04-17 2018-03-06 Microsoft Technology Licensing, Llc Address bar user interface control
US10489044B2 (en) 2005-07-13 2019-11-26 Microsoft Technology Licensing, Llc Rich drag drop user interface
WO2023176011A1 (ja) * 2022-03-14 2023-09-21 Necプラットフォームズ株式会社 サーバ装置、サーバ装置の制御方法、及びプログラム

Families Citing this family (90)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05307499A (ja) * 1992-04-30 1993-11-19 Matsushita Electric Ind Co Ltd 情報検索装置
JPH06176081A (ja) * 1992-12-02 1994-06-24 Hitachi Ltd 階層構造ブラウジング方法およびその装置
JP2770715B2 (ja) * 1993-08-25 1998-07-02 富士ゼロックス株式会社 構造化文書検索装置
JP3053153B2 (ja) * 1993-09-20 2000-06-19 株式会社日立製作所 文書管理システムのアプリケーション起動方法
US5812995A (en) * 1993-10-14 1998-09-22 Matsushita Electric Industrial Co., Ltd. Electronic document filing system for registering and retrieving a plurality of documents
JPH07319918A (ja) * 1994-05-24 1995-12-08 Fuji Xerox Co Ltd 文書検索対象指示装置
US5745745A (en) * 1994-06-29 1998-04-28 Hitachi, Ltd. Text search method and apparatus for structured documents
JP2687882B2 (ja) * 1994-07-05 1997-12-08 日本電気株式会社 検索条件統合装置
JPH0869367A (ja) * 1994-08-29 1996-03-12 Casio Comput Co Ltd メニュー表示装置
JP3143345B2 (ja) * 1994-12-02 2001-03-07 富士通株式会社 文字列検索装置
US5717940A (en) * 1995-04-28 1998-02-10 Ricoh Company, Ltd. Method of selecting a target document using features of an example page
US5903904A (en) * 1995-04-28 1999-05-11 Ricoh Company Iconic paper for alphabetic, japanese and graphic documents
JPH08314973A (ja) * 1995-05-17 1996-11-29 Fuji Xerox Co Ltd 情報単位群操作装置
US5675710A (en) * 1995-06-07 1997-10-07 Lucent Technologies, Inc. Method and apparatus for training a text classifier
US5721914A (en) * 1995-09-14 1998-02-24 Mci Corporation System and method for hierarchical data distribution
US5745893A (en) * 1995-11-30 1998-04-28 Electronic Data Systems Corporation Process and system for arrangement of documents
JPH09160821A (ja) * 1995-12-01 1997-06-20 Matsushita Electric Ind Co Ltd ハイパーテキスト文書作成装置
US5799311A (en) * 1996-05-08 1998-08-25 International Business Machines Corporation Method and system for generating a decision-tree classifier independent of system memory size
AU4495597A (en) 1996-09-23 1998-04-14 Lowrie Mcintosh Defining a uniform subject classification system incorporating document management/records retention functions
US6480194B1 (en) 1996-11-12 2002-11-12 Silicon Graphics, Inc. Computer-related method, system, and program product for controlling data visualization in external dimension(s)
US6096096A (en) * 1996-12-13 2000-08-01 Silicon Graphics, Inc. Web-site delivery
US6373483B1 (en) 1997-01-13 2002-04-16 Silicon Graphics, Inc. Method, system and computer program product for visually approximating scattered data using color to represent values of a categorical variable
US6182058B1 (en) 1997-02-28 2001-01-30 Silicon Graphics, Inc. Bayes rule based and decision tree hybrid classifier
JPH10307846A (ja) * 1997-03-03 1998-11-17 Toshiba Corp ドキュメント情報管理システム、ドキュメント情報管理方法、及びドキュメント検索方法
US6278464B1 (en) 1997-03-07 2001-08-21 Silicon Graphics, Inc. Method, system, and computer program product for visualizing a decision-tree classifier
US6137499A (en) * 1997-03-07 2000-10-24 Silicon Graphics, Inc. Method, system, and computer program product for visualizing data using partial hierarchies
US5930801A (en) * 1997-03-07 1999-07-27 Xerox Corporation Shared-data environment in which each file has independent security properties
US5960435A (en) * 1997-03-11 1999-09-28 Silicon Graphics, Inc. Method, system, and computer program product for computing histogram aggregations
US5930803A (en) * 1997-04-30 1999-07-27 Silicon Graphics, Inc. Method, system, and computer program product for visualizing an evidence classifier
US5940821A (en) * 1997-05-21 1999-08-17 Oracle Corporation Information presentation in a knowledge base search and retrieval system
US6026399A (en) * 1997-05-30 2000-02-15 Silicon Graphics, Inc. System and method for selection of important attributes
US6185550B1 (en) * 1997-06-13 2001-02-06 Sun Microsystems, Inc. Method and apparatus for classifying documents within a class hierarchy creating term vector, term file and relevance ranking
US6098066A (en) * 1997-06-13 2000-08-01 Sun Microsystems, Inc. Method and apparatus for searching for documents stored within a document directory hierarchy
US6233575B1 (en) 1997-06-24 2001-05-15 International Business Machines Corporation Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values
US6820094B1 (en) * 1997-10-08 2004-11-16 Scansoft, Inc. Computer-based document management system
US6269188B1 (en) 1998-03-12 2001-07-31 Canon Kabushiki Kaisha Word grouping accuracy value generation
US6199063B1 (en) * 1998-03-27 2001-03-06 Red Brick Systems, Inc. System and method for rewriting relational database queries
US6044375A (en) * 1998-04-30 2000-03-28 Hewlett-Packard Company Automatic extraction of metadata using a neural network
US6243501B1 (en) * 1998-05-20 2001-06-05 Canon Kabushiki Kaisha Adaptive recognition of documents using layout attributes
US20030061243A1 (en) * 1998-05-21 2003-03-27 Kim Jeong Jung Information auto classification method and information search and analysis method
US20070233659A1 (en) * 1998-05-23 2007-10-04 Lg Electronics Inc. Information auto classification method and information search and analysis method
US7039856B2 (en) * 1998-09-30 2006-05-02 Ricoh Co., Ltd. Automatic document classification using text and images
US6301579B1 (en) 1998-10-20 2001-10-09 Silicon Graphics, Inc. Method, system, and computer program product for visualizing a data structure
EP1006462A3 (en) 1998-12-01 2005-03-30 Lucent Technologies Inc. A method and apparatus for persistent storage of web resources
US6460049B1 (en) 1998-12-22 2002-10-01 Silicon Graphics, Inc. Method system and computer program product for visualizing an evidence classifier
JP2000285140A (ja) * 1998-12-24 2000-10-13 Ricoh Co Ltd 文書処理装置、文書分類装置、文書処理方法、文書分類方法およびそれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US6345272B1 (en) * 1999-07-27 2002-02-05 Oracle Corporation Rewriting queries to access materialized views that group along an ordered dimension
US7082567B1 (en) * 1999-10-18 2006-07-25 Rose Blush Software Llc Enhanced human computer user interface system for searching and browsing documents
WO2001035277A1 (en) * 1999-11-12 2001-05-17 Mindmatters Technologies, Inc. System for automating and managing an enterprise ip environment
JP2001175528A (ja) * 1999-12-21 2001-06-29 Tokyo Kikai Seisakusho Ltd 情報提供システム及び情報提供方法
US6879990B1 (en) 2000-04-28 2005-04-12 Institute For Scientific Information, Inc. System for identifying potential licensees of a source patent portfolio
CA2307404A1 (en) * 2000-05-02 2001-11-02 Provenance Systems Inc. Computer readable electronic records automated classification system
JP3870666B2 (ja) * 2000-06-02 2007-01-24 株式会社日立製作所 文書検索方法および装置並びにその処理プログラムを記録した記録媒体
US7376635B1 (en) * 2000-07-21 2008-05-20 Ford Global Technologies, Llc Theme-based system and method for classifying documents
EP1182580A1 (en) * 2000-08-23 2002-02-27 Matsushita Electric Industrial Co., Ltd. Document retrieval and classification method and apparatus
US20030164844A1 (en) * 2000-09-25 2003-09-04 Kravitz Dean Todd System and method for processing multimedia content, stored in a computer-accessible storage medium, based on various user-specified parameters related to the content
KR100467638B1 (ko) * 2001-08-01 2005-01-24 (주) 위즈도메인 특허 데이터베이스로부터 관련 특허들의 인용관계를 빠른시간내에 검색하여 분석하기 위한 방법
US7158994B1 (en) 2001-09-28 2007-01-02 Oracle International Corporation Object-oriented materialized views
WO2003034283A1 (en) * 2001-10-16 2003-04-24 Kimbrough Steven O Process and system for matching products and markets
US7111020B1 (en) * 2002-03-26 2006-09-19 Oracle International Corporation Incremental refresh of materialized views containing rank function, and rewrite of queries containing rank or rownumber or min/max aggregate functions using such a materialized view
US20040004638A1 (en) * 2002-07-02 2004-01-08 Ketan Babaria Method and apparatus for multiple-window multiple-selection operations in graphical-user-interface environments
US20080068401A1 (en) * 2006-09-14 2008-03-20 Technology Enabling Company, Llc Browser creation of graphic depicting relationships
AU2004208274B2 (en) * 2003-01-28 2007-09-06 Samsung Electronics Co., Ltd. Method and system for managing media file database
US7823077B2 (en) 2003-03-24 2010-10-26 Microsoft Corporation System and method for user modification of metadata in a shell browser
US7769794B2 (en) 2003-03-24 2010-08-03 Microsoft Corporation User interface for a file system shell
US7421438B2 (en) 2004-04-29 2008-09-02 Microsoft Corporation Metadata editing control
US7925682B2 (en) * 2003-03-27 2011-04-12 Microsoft Corporation System and method utilizing virtual folders
US8024335B2 (en) 2004-05-03 2011-09-20 Microsoft Corporation System and method for dynamically generating a selectable search extension
US7707210B2 (en) * 2003-12-18 2010-04-27 Xerox Corporation System and method for multi-dimensional foraging and retrieval of documents
JP4041080B2 (ja) * 2004-03-23 2008-01-30 東芝ソリューション株式会社 データ検索装置及びデータ検索プログラム
US7890497B2 (en) 2004-04-14 2011-02-15 Oracle International Corporation Using estimated cost to schedule an order for refreshing a set of materialized views (MVS)
US8478742B2 (en) * 2004-04-14 2013-07-02 Oracle Corporation Using estimated cost to refresh a set of materialized views (MVS)
US7734602B2 (en) 2004-04-14 2010-06-08 Oracle International Corporation Choosing whether to use a delayed index maintenance depending on the portion of the materialized view (MV) changed
US7694236B2 (en) 2004-04-23 2010-04-06 Microsoft Corporation Stack icons representing multiple objects
US7370273B2 (en) * 2004-06-30 2008-05-06 International Business Machines Corporation System and method for creating dynamic folder hierarchies
US9268780B2 (en) 2004-07-01 2016-02-23 Emc Corporation Content-driven information lifecycle management
CN100462961C (zh) * 2004-11-09 2009-02-18 国际商业机器公司 组织多个文档的方法以及显示多个文档的设备
US8522154B2 (en) 2005-04-22 2013-08-27 Microsoft Corporation Scenario specialization of file browser
US8195646B2 (en) 2005-04-22 2012-06-05 Microsoft Corporation Systems, methods, and user interfaces for storing, searching, navigating, and retrieving electronic information
US20070094118A1 (en) * 2005-10-21 2007-04-26 Elke Becker Exposure management system and method
US8176004B2 (en) * 2005-10-24 2012-05-08 Capsilon Corporation Systems and methods for intelligent paperless document management
US7747495B2 (en) * 2005-10-24 2010-06-29 Capsilon Corporation Business method using the automated processing of paper and unstructured electronic documents
CN100573520C (zh) * 2006-08-29 2009-12-23 国际商业机器公司 为检索对多个文档进行预处理的方法和装置
JP4811287B2 (ja) * 2007-01-31 2011-11-09 ブラザー工業株式会社 階層構造表示装置および階層構造表示プログラム
US20100114745A1 (en) * 2008-10-30 2010-05-06 Sap Ag System and method for calculating and applying market data change rate sets
US8661033B2 (en) * 2009-03-31 2014-02-25 Innography, Inc. System to provide search results via a user-configurable table
US20110295861A1 (en) * 2010-05-26 2011-12-01 Cpa Global Patent Research Limited Searching using taxonomy
US8583539B2 (en) 2011-08-31 2013-11-12 Sap Ag Enablement of exposure management to handle priced exposure
US11449218B2 (en) 2015-07-17 2022-09-20 Thomson Reuters Enterprise Centre Gmbh Systems and methods for data evaluation and classification
AU2016408336B2 (en) * 2016-05-23 2019-09-26 Thomson Reuters Enterprise Centre Gmbh Systems and methods for data evaluation and classification

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63157229A (ja) * 1986-12-22 1988-06-30 Nec Corp 多次元ブラウジング方式
JPH01258147A (ja) * 1988-04-08 1989-10-16 Nec Corp 電子ファイリングシステムにおける文書の階層間移動/複写方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4319337A (en) * 1979-10-12 1982-03-09 Dictaphone Corporation Apparatus for displaying the status of individual dictated messages in a central dictation system
US4468728A (en) * 1981-06-25 1984-08-28 At&T Bell Laboratories Data structure and search method for a data base management system
US4601021A (en) * 1982-04-12 1986-07-15 Tektronix, Inc. Highlighting and classifying segments on a CRT display
JPS603056A (ja) * 1983-06-21 1985-01-09 Toshiba Corp 情報整理装置
US5060277A (en) * 1985-10-10 1991-10-22 Palantir Corporation Pattern classification means using feature vector regions preconstructed from reference data
JP2516387Y2 (ja) * 1987-08-19 1996-11-06 三洋電機株式会社 情報ファイル装置
JP3105895B2 (ja) * 1989-04-12 2000-11-06 キヤノン株式会社 文書処理装置
JP2909491B2 (ja) * 1990-01-19 1999-06-23 株式会社山武 設備管理装置
US5247666A (en) * 1991-05-28 1993-09-21 Fawnwood, Inc. Data management method for representing hierarchical functional dependencies

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63157229A (ja) * 1986-12-22 1988-06-30 Nec Corp 多次元ブラウジング方式
JPH01258147A (ja) * 1988-04-08 1989-10-16 Nec Corp 電子ファイリングシステムにおける文書の階層間移動/複写方法

Cited By (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0778186A (ja) * 1993-05-17 1995-03-20 Ricoh Co Ltd 文書処理装置
JPH0744568A (ja) * 1993-07-30 1995-02-14 Mitsubishi Electric Corp 検索インタフェース装置
JPH07110814A (ja) * 1993-10-12 1995-04-25 Fuji Xerox Co Ltd 電子文書記憶装置
JPH07121552A (ja) * 1993-10-27 1995-05-12 Fuji Xerox Co Ltd 文書群分析装置
JPH07129448A (ja) * 1993-11-01 1995-05-19 Just Syst Corp ファイル選択システム
JPH07282087A (ja) * 1994-04-07 1995-10-27 Fuji Xerox Co Ltd 情報構造化表示装置
JPH0991299A (ja) * 1994-07-28 1997-04-04 Xerox Corp 階層的に関連した情報の生成方法及びコンピュータ制御ディスプレイシステム
JPH08106471A (ja) * 1994-10-03 1996-04-23 Toshiba Corp 情報記憶検索装置
JPH0922414A (ja) * 1995-07-06 1997-01-21 Hitachi Ltd 文書分類支援方法および装置
JPH0981585A (ja) * 1995-09-14 1997-03-28 Ricoh Co Ltd 電子ファイリング装置
US5819295A (en) * 1995-10-30 1998-10-06 Matsushita Electric Industrial Co., Ltd. Document storing and managing system
US7757254B2 (en) 1996-03-29 2010-07-13 Microsoft Corporation Interactive entertainment system for presenting supplemental interactive content together with continuous video programs
US8108899B2 (en) 1996-03-29 2012-01-31 Microsoft Corporation Interactive entertainment system for presenting supplemental interactive content together with continuous video programs
JPH10116290A (ja) * 1996-10-11 1998-05-06 Mitsubishi Electric Corp 文書分類管理方法及び文書検索方法
JPH10187762A (ja) * 1996-10-22 1998-07-21 Fujitsu Ltd 検索論理式入力装置
JPH10143517A (ja) * 1996-11-13 1998-05-29 Fuji Xerox Co Ltd 文書作成装置
JPH10154157A (ja) * 1996-11-22 1998-06-09 Nec Corp 電子ファイリングシステム
US8051450B2 (en) 1997-03-31 2011-11-01 Microsoft Corporation Query-based electronic program guide
JPH10301941A (ja) * 1997-04-23 1998-11-13 Mitsubishi Electric Corp 文書情報共有化システム
JPH1145197A (ja) * 1997-07-25 1999-02-16 Fuji Xerox Co Ltd 階層構造提示装置及び階層構造提示方法
JPH11102373A (ja) * 1997-09-29 1999-04-13 Nec Corp 情報アクセス装置および方法とプログラムを記録する記 録媒体
JP2001297022A (ja) * 2000-03-09 2001-10-26 Internatl Business Mach Corp <Ibm> オブジェクトを管理し、情報をコミュニティの間で共有する方法及びシステム
JP2001306593A (ja) * 2000-04-17 2001-11-02 Kuniichi Okada 表示方法、表示処理装置、及び記録媒体
JP4644925B2 (ja) * 2000-10-12 2011-03-09 ソニー株式会社 情報処理装置および情報処理方法
JP2002116933A (ja) * 2000-10-12 2002-04-19 Sony Corp 情報処理装置および情報処理方法、並びにプログラム格納媒体
JP2007287178A (ja) * 2001-09-28 2007-11-01 Emc Corp コンピュータシステム環境内の資源を表示するための方法及び装置
JP4512620B2 (ja) * 2001-09-28 2010-07-28 イーエムシー コーポレイション コンピュータシステム環境内の資源を表示するための方法及び装置
US9361313B2 (en) 2003-03-27 2016-06-07 Microsoft Technology Licensing, Llc System and method for filtering and organizing items based on common elements
US9361312B2 (en) 2003-03-27 2016-06-07 Microsoft Technology Licensing, Llc System and method for filtering and organizing items based on metadata
JP4685186B2 (ja) * 2003-03-27 2011-05-18 マイクロソフト コーポレーション 様々なタイプおよび様々な物理位置からのアイテムを表示するためのファイルシステム
JP2006521592A (ja) * 2003-03-27 2006-09-21 マイクロソフト コーポレーション 様々なタイプおよび様々な物理位置からのアイテムを表示するためのファイルシステム
JP2010033606A (ja) * 2003-03-27 2010-02-12 Microsoft Corp 様々なタイプおよび様々な物理位置からのアイテムを表示するためのファイルシステム
JPWO2004088519A1 (ja) * 2003-03-31 2006-07-06 富士通株式会社 ファイル分類装置、ファイル分類方法およびファイル分類プログラム
US9910569B2 (en) 2003-04-17 2018-03-06 Microsoft Technology Licensing, Llc Address bar user interface control
WO2004111876A1 (ja) * 2003-06-11 2004-12-23 Fujitsu Limited 検索条件を再利用する検索システムおよび方法
JP2004280849A (ja) * 2004-04-30 2004-10-07 Canon Inc データ表示方法及びそのシステム
JP2012064234A (ja) * 2005-03-31 2012-03-29 Barclays Capital Inc ドキュメントシリーズを使用したドキュメントからなる集合のグループ化のシステム
US10489044B2 (en) 2005-07-13 2019-11-26 Microsoft Technology Licensing, Llc Rich drag drop user interface
JP2007058792A (ja) * 2005-08-26 2007-03-08 Fujifilm Holdings Corp 画像処理装置、画像処理方法及び画像処理プログラム
JP2007128416A (ja) * 2005-11-07 2007-05-24 Fuji Xerox Co Ltd オブジェクト管理プログラム、装置および方法
JP2008276575A (ja) * 2007-04-27 2008-11-13 Kokuyo Co Ltd データ管理装置及びそのプログラム
JP2009053958A (ja) * 2007-08-27 2009-03-12 Canon Inc 情報処理装置及びその制御方法
JP2009205207A (ja) * 2008-02-26 2009-09-10 Nec Corp タグ情報に基づく情報分類表示システム
JP2009289042A (ja) * 2008-05-29 2009-12-10 Canon Inc 検索装置の制御方法、検索装置
JP2009032296A (ja) * 2008-11-10 2009-02-12 Ko Owada 特許管理プログラム
JP2011170600A (ja) * 2010-02-18 2011-09-01 Fuji Xerox Co Ltd 情報管理装置及びプログラム
WO2023176011A1 (ja) * 2022-03-14 2023-09-21 Necプラットフォームズ株式会社 サーバ装置、サーバ装置の制御方法、及びプログラム
JP2023134044A (ja) * 2022-03-14 2023-09-27 Necプラットフォームズ株式会社 サーバ装置、サーバ装置の制御方法、及びプログラム

Also Published As

Publication number Publication date
JP3303926B2 (ja) 2002-07-22
US5418946A (en) 1995-05-23

Similar Documents

Publication Publication Date Title
JP3303926B2 (ja) 構造化文書分類装置及び方法
JP2720908B2 (ja) 情報目録生成及び変更システム並びに情報目録データベース・システム
USRE44652E1 (en) Computer-readable data product for managing sales information
US6321229B1 (en) Method and apparatus for using an information model to organize an information repository into a hierarchy of information
US6078924A (en) Method and apparatus for performing data collection, interpretation and analysis, in an information platform
Rao et al. Rich interaction in the digital library
US6178382B1 (en) Methods for analysis of large sets of multiparameter data
US7689572B2 (en) Model repository
US6308179B1 (en) User level controlled mechanism inter-positioned in a read/write path of a property-based document management system
US20060225000A1 (en) Graphical application interface using browser
US7627583B2 (en) Methods, apparatus and computer programs for visualization and management of data organisation within a data processing system
US20080134060A1 (en) System for creating a graphical visualization of data with a browser
US20060224983A1 (en) Graphical visualization of data using browser
US20060224999A1 (en) Graphical visualization of data product using browser
US20060224974A1 (en) Method of creating graphical application interface with a browser
US20060224972A1 (en) Graphical application interface with a browser
US20060224984A1 (en) Apparatus for creating graphical visualization of data with a browser
US20060224982A1 (en) Graphical application interface product using a browser
JPH0991314A (ja) 情報探索装置
MXPA04006410A (es) Interprete de sistema de archivo.
US20020087579A1 (en) Object universe
US20060224980A1 (en) Method of creating graphical visualizations of data with a browser
US20060224975A1 (en) System for creating a graphical application interface with a browser
JPH07129448A (ja) ファイル選択システム
US6345277B1 (en) Method and apparatus for using an information model to organize an information repository into an extensible hierarchy of information

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080510

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090510

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100510

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110510

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120510

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120510

Year of fee payment: 10