JP2001195426A - 文書クラス検索方法及び装置及び文書クラス検索プログラムを格納した記憶媒体 - Google Patents

文書クラス検索方法及び装置及び文書クラス検索プログラムを格納した記憶媒体

Info

Publication number
JP2001195426A
JP2001195426A JP2000008186A JP2000008186A JP2001195426A JP 2001195426 A JP2001195426 A JP 2001195426A JP 2000008186 A JP2000008186 A JP 2000008186A JP 2000008186 A JP2000008186 A JP 2000008186A JP 2001195426 A JP2001195426 A JP 2001195426A
Authority
JP
Japan
Prior art keywords
segment
attribute
document
search
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000008186A
Other languages
English (en)
Inventor
Kaori Inoue
香織 井上
Seiji Yokomichi
誠司 横路
Katsumi Takahashi
克己 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000008186A priority Critical patent/JP2001195426A/ja
Publication of JP2001195426A publication Critical patent/JP2001195426A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 属性を文書毎ではなく、文脈に依存したセグ
メント単位で格納することで、視点が一定ではなく、検
索者個々の文脈に応じた柔軟な属性指定検索を実現し、
また、文書の意味構造を様々な文脈で的確に表現できる
ように構造化文書をデータを格納し、属性間の関係の格
納コストも小さく抑えることが可能な文書クラス検索方
法及び装置及び文書クラス検索プログラムを格納した記
憶媒体を提供する。 【解決手段】 本発明は、文脈の概念であるクラス情報
と、当該クラスに基づいて分割され、階層化されたセグ
メント情報が付加された文書の意味的構造化結果を入力
し、構造化結果である属性の集合中の各属性に対し、文
書の固有IDと、クラス情報と、当該クラスに応じた分
割結果であるセグメント情報を付与し、データベースに
格納する。そして、属性間の意味的な関係を指定してデ
ータベースを検索する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書クラス検索方
法及び装置及び文書クラス検索プログラムを格納した記
憶媒体に係り、特に、意味的に構造化されたテキストデ
ータを、その属性間の意味的な関係を指定して検索する
ための文書クラス検索方法及び装置及び文書クラス検索
プログラムを格納した記憶媒体に関する。
【0002】
【従来の技術】文書検索において、属性指定検索を行う
時は、データベースに文書IDと、属性名とそれに対応
する属性値が格納されている。検索者は属性名を指定し
て、文字列を入力し、データベースから該当する属性名
と属性値をもつ文書を検索する。例えば、検索者が「製
品」属性を指定し、『冷蔵庫』と入力すると、冷蔵庫の
製品情報が検索できる。属性間の関係を考慮して、特定
の値をもつ上位属性を指定した検索を可能とする検索シ
ステムにおいては、予め、各属性の階層関係を格納して
おく。例えば、検索者は、「メーカー」属性の値「○○
社」の「製品」属性の値「冷蔵庫」の製品情報を検索す
ることができる。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の技術のように、文書ごとに属性を格納すると、ある
文書内の各情報同士の関係は構造化する者の一つの視点
で固定される。例えば、木構造であれば、最初に設定し
た属性をルートに、すべての属性がある一つの形の木構
造中に格納される。ここで、ある属性からある属性まで
のパスの深さや長さは固定である。しかし、文書の意味
属性においては、その文脈によって、属性間の関係が異
なるため、関係の格納形式が可変でなくてはならない。
【0004】本発明は、上記の点に鑑みなされたもの
で、属性を文書毎ではなく、文脈に依存したセグメント
単位で格納することで、視点が一定ではなく、検索者個
々の文脈に応じた柔軟な属性指定検索を実現し、また、
文書の意味構造を様々な文脈で的確に表現できるように
構造化文書をデータとして格納し、属性間の関係の格納
コストも小さく抑えることが可能な文書クラス検索方法
及び装置及び文書クラス検索プログラムを格納した記憶
媒体を提供することを目的とする。
【0005】
【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。
【0006】本発明(請求項1)は、意味的に構造化さ
れたテキストデータを、その属性間の意味的な関係を指
定して検索するための文書クラス検索方法において、文
脈の概念であるクラス情報と、当該クラスに基づいて分
割され、階層化されたセグメント情報が付加された文書
の意味的構造化結果を入力し(ステップ1)、構造化結
果である属性の集合中の各属性に対し、文書の固有ID
と、クラス情報と、当該クラスに応じた分割結果である
セグメント情報を付与し(ステップ2)、データベース
に格納する(ステップ3)。
【0007】本発明(請求項2)は、各セグメントに対
し、文書内のセグメント固有IDを付与し、該セグメン
ト固有IDで識別したセグメント相互の階層関係をデー
タベースに格納する。
【0008】本発明(請求項3)は、データベースを検
索する際に、検索者が検索命令として、複数の属性が指
定されたAND検索をする際に、データベースのセグメ
ント間の関係を参照して、指定された複数の属性が、同
一セグメントまたは、上位下位の関係を持つ複数のセグ
メント内にそれぞれに現れる場合、該当するセグメント
固有IDを返却し(ステップ11)、セグメント固有I
Dを出力する(ステップ15)。
【0009】本発明(請求項4)は、データベースを検
索する際に、検索者が検索命令として、複数の属性が指
定され、ある特定の属性が他の特定の属性と共起しない
ことを指定した検索である排他検索をする際に、データ
ベースのセグメント間の関係を参照して、指定された複
数の属性が、同一セグメントまたは、上位下位の関係を
持つ複数のセグメント内にそれぞれ現れない場合に、該
当するセグメント固有IDを返却し(ステップ12)、
セグメント固有IDを出力する(ステップ15)。
【0010】本発明(請求項5)は、データベースを検
索する際に、検索者がある属性の値を知りたい時に、該
属性の属性名と、関係する属性及び属性値が指定された
場合において、データベースのセグメント間の関係を参
照して、指定された属性と関係する属性及び該属性の値
が、同一セグメントまたは、上位下位の関係を持つ複数
のセグメント内にそれぞれ現れる場合、指定された属性
に対応する値を返却し(ステップ13)、指定された属
性に対応する値を出力する(ステップ15)。
【0011】本発明(請求項6)は、データベースを検
索する際に、検索者が文脈を指定すると、クラスIDを
キーに追加してデータベースを検索する(ステップ1
4)。図2は、本発明の原理構成図である。
【0012】本発明(請求項7)は、意味的に構造化さ
れたテキストデータを、その属性間の意味的な関係を指
定して検索するための文書クラス検索装置であって、文
脈の概念であるクラス情報と、当該クラスに基づいて分
割され、階層化されたセグメント情報が付加された文書
の意味的構造化結果を入力する文書構造化結果解析手段
11と、構造化結果である属性の集合中の各属性に対
し、文書の固有IDと、クラス情報と、当該クラスに応
じた分割結果であるセグメント情報を付与し、文書デー
タベース21に格納するデータベース投入手段12とを
有する。
【0013】本発明(請求項8)は、データベース投入
手段12は、各セグメントに対し、文書内のセグメント
固有IDを付与し、該セグメント固有IDで識別したセ
グメント相互の階層関係をセグメント階層データベース
に格納する手段を含む。
【0014】本発明(請求項9)は、データベースを検
索する際に、検索者が検索命令として、複数の属性が指
定された、AND検索命令が入力される第1のユーザ検
索入力手段13と、セグメント階層データベースのセグ
メント間の関係を参照して、指定された複数の属性が、
同一セグメントまたは、上位下位の関係を持つ複数のセ
グメント内にそれぞれに現れる場合、該当するセグメン
ト固有IDを返却する第1の階層関係検索手段15と、
セグメント固有IDを出力する第1の検索結果出力手段
16とを有する。
【0015】本発明(請求項10)は、データベースを
検索する際に、検索者が検索命令として、複数の属性が
指定された、ある特定の属性が他の特定の属性と共起し
ないことを指定した検索である排他検索命令が入力され
る第2のユーザ検索入力手段13と、セグメント階層デ
ータベースのセグメント間の関係を参照して、指定され
た複数の属性が、同一セグメントまたは、上位下位の関
係を持つ複数のセグメント内にそれぞれ現れない場合
に、該当するセグメント固有IDを返却する第2の階層
関係検索手段15と、セグメント固有IDを出力する第
2の検索結果出力手段16とを有する。
【0016】本発明(請求項11)は、データベースを
検索する際に、検索者がある属性の値を知りたい時に、
該属性の属性名と、関係する属性及び属性値が入力され
る第3のユーザ検索入力手段13と、セグメント階層デ
ータベースのセグメント間の関係を参照して、指定され
た属性と関係する属性及び該属性の値が、同一セグメン
トまたは、上位下位の関係を持つ複数のセグメント内に
それぞれ現れる場合、指定された属性に対応する値を返
却する第3の階層関係検索手段15と、指定された属性
に対応する値を出力する第3の検索結果出力手段16と
を有する。
【0017】本発明(請求項12)は、データベースを
検索する際に、検索者により文脈が入力される第4のユ
ーザ検索入力手段13と、クラスIDをキーに追加して
文書データベースを検索する文書データベース検索手段
とを有する。
【0018】本発明(請求項13)は、意味的に構造化
されたテキストデータを、その属性間の意味的な関係を
指定して検索するための文書クラス検索プログラムを格
納した記憶媒体であって、文脈の概念であるクラス情報
と、当該クラスに基づいて分割され、階層化されたセグ
メント情報が付加された文書の意味的構造化結果を入力
する文書構造化結果解析プロセスと、構造化結果である
属性の集合中の各属性に対し、文書の固有IDと、クラ
ス情報と、当該クラスに応じた分割結果であるセグメン
ト情報を付与し、文書データベースに格納するデータベ
ース投入プロセスとを有する。
【0019】本発明(請求項14)は、データベース投
入プロセスは、各セグメントに対し、文書内のセグメン
ト固有IDを付与し、該セグメント固有IDで識別した
セグメント相互の階層関係をセグメント階層データベー
スに格納するプロセスを含む。
【0020】本発明(請求項15)は、データベースを
検索する際に、検索者からの検索命令を入力させるユー
ザ検索入力プロセスと、検索者から複数の属性が指定さ
れた、AND検索命令が入力された場合に、セグメント
階層データベースのセグメント間の関係を参照して、指
定された複数の属性が、同一セグメントまたは、上位下
位の関係を持つ複数のセグメント内にそれぞれに現れる
場合、該当するセグメント固有IDを返却し、検索者か
ら複数の属性が指定された、ある特定の属性が他の特定
の属性と共起しないことを指定した検索である排他検索
命令が入力された場合に、セグメント階層データベース
のセグメント間の関係を参照して、指定された複数の属
性が、同一セグメントまたは、上位下位の関係を持つ複
数のセグメント内にそれぞれ現れない場合に、該当する
セグメント固有IDを返却し、検索者がある属性の値を
知りたい時に、該属性の属性名と、関係する属性及び属
性値が入力された場合に、セグメント階層データベース
のセグメント間の関係を参照して、指定された属性と関
係する属性及び該属性の値が、同一セグメントまたは、
上位下位の関係を持つ複数のセグメント内にそれぞれ現
れる場合、指定された属性に対応する値を返却し、検索
者から文脈が入力された場合に、クラスIDをキーに追
加して文書データベースを検索する検索プロセスと、検
索プロセスにおいて検索されたセグメント固有ID、ま
たは、属性に対応する値、または、文書データベースの
検索結果を出力させる検索結果出力プロセスとを有す
る。
【0021】これにより、本発明では、意味的な構造化
検索のために、文脈に応じた文書の構造化データを用い
て、文脈を考慮した検索を可能とする。
【0022】また、本発明では、文書の意味構造を様々
な文脈で的確に表現できるように構造化文書データを格
納することが可能となる。
【0023】
【発明の実施の形態】文書の意味構造の表現形式とし
て、文書内情報のタグ付けしたデータを、文脈の概念で
あるクラスに基づいて、複数セグメントに分割した形式
を採用する。この形式ではセグメント間の階層関係も記
述してある。この形式で予め意味的に構造化されている
文書データをデータベースに格納する。データベースの
格納形式として、各属性に関しては、文書IDと、クラ
スIDと文書内のセグメントIDから、グローバルな
(文書に依存しない)セグメント固有IDを生成する。
【0024】更に、セグメント固有IDと、属性名と、
属性値を対応付けたテーブルに格納する。また、セグメ
ント固有IDを用いて、各セグメント間の階層関係を格
納する。ここで、セグメント間の階層構造とは、上位セ
グメントが下位セグメントを包含することをいう。例え
ば、ある文書にA社とB社の企業情報が含まれていると
する。A社では、いくつかの支社をもっているため、そ
の文書内に支社の情報が並んでいるとする。この場合、
上位セグメントが、クラス「企業情報」でセグメントI
Dが「1」、下位セグメントがクラス「支社情報」で、
セグメントIDが「1」、のように表される。
【0025】各文書データは、文書単位ではなく、文脈
の概念であるクラスに依存したセグメント単位で格納さ
れるため、各文書データに対し、複数のクラスに応じて
異なった属性を付与したり、異なった属性間の関係を格
納することが可能である。よって、検索システムは複数
の文脈に応じた検索をすることが可能となる。
【0026】検索時には、検索者が検索したい属性を指
定した上で文字列を入力または、選択すると、検索シス
テムは、セグメント固有IDを返す。
【0027】以下に、種々の検索処理を示す。
【0028】・ 検索者が複数の属性を指定した「AN
D検索」をした場合は、検索システムはセグメント間の
関係を参照して、指定された複数の属性が、同一セグメ
ントまたは、上位下位関係にあるセグメントにそれぞれ
に現れる場合、該当するセグメント固有IDを返す。
【0029】・ また、検索者が複数の属性を指定した
「排他検索」(ある特定の属性が他の特定の属性と共起
しないものを検索)をした場合には、検索システムは、
セグメント間の関係を参照して、指定された複数の属性
が、同一セグメントまたは、上位下位関係にあるセグメ
ントにそれぞれ現れない場合、該当するセグメント固有
IDを返す。
【0030】・ セグメント検索に対し、属性値検索も
可能とする。検索者がある属性の値を知りたい時に、そ
の属性名と関係する属性及び属性値を指定する。例え
ば、「製品」属性とそれに関連する属性として、属性
「メーカー」、値「○○社」を指定した場合、属性「メ
ーカ」、値「○○社」の「製品」属性の値が検索でき
る。この際、検索システムはセグメント間の関係を参照
して、指定された属性と、関係する属性及びその値が、
同一セグメントまたは、上位下位関係にあるセグメント
にそれぞれ現れる場合、指定された属性に対応する値を
返す。
【0031】・ また、検索者は、特定のクラスを指定
することもできる。この場合、検索システムは、クラス
IDをキーに追加してデータベースを検索する。
【0032】
【実施例】以下、図面と共に本発明の実施例を説明す
る。
【0033】図3は、本発明の一実施例の文書クラス検
索装置の構成を示す。
【0034】同図に示す文書クラス検索装置1は、文書
構造化結果解析部11、データベース投入部12、ユー
ザ検索入力部13、基本検索部14、階層関係検索部1
5、検索結果出力部16、文書データベース21、及び
セグメント階層データベース22から構成される。
【0035】文書構造化結果解析部11は、入力された
文書の意味的構造化データを解析し、文書ID、クラ
ス、セグメント、属性、属性値、また、セグメント間の
関係を識別する部分である。
【0036】データベース投入部12は、文書構造化結
果解析部11の解析結果のうち、文書ID、クラスI
D、セグメントID、属性、属性値の情報を文書データ
ベース21に格納し、セグメント間の関係をセグメント
階層データベース22に格納する。
【0037】文書データベース21は、文書ID、クラ
スID、セグメントID、属性、属性値の情報が対応付
けられて格納されているデータベースである。
【0038】セグメント階層データベース22は、各セ
グメントの階層関係を格納するデータベースである。
【0039】ユーザ検索入力部13は、ユーザが属性を
指定した検索(基本検索と階層関係検索)命令を入力す
る。
【0040】基本検索部14は、属性を指定して検索文
字列を入力もしくは、選択する部分であり、文書データ
ベース21を検索する。
【0041】階層関係検索部15は、複数属性が指定さ
れた場合にセグメント階層データベース22を参照し
て、複数の属性が上位下位の関係を持つセグメントにそ
れぞれに出現するかどうかを判別する部分であり、文書
データベース21及びセグメント階層データベース22
を検索する。
【0042】検索結果出力部16は、基本検索の場合
は、クラス、文書ID、セグメントIDを出力し、階層
関係検索の場合は、文書ID、セグメントID、及び指
定された属性の値を出力することができる。
【0043】次に、上記の構成における動作を説明す
る。
【0044】図4は、本発明の一実施例の動作のフロー
チャートであり、図5は、本発明の一実施例の入力情報
の例であり、図6は、本発明の一実施例のデータベース
格納例を示す。
【0045】図5において、(A),(B)は、文書構
造化結果解析部11に入力される構造化データの例であ
り、同図(C)は、当該構造化データに含まれるセグメ
ント間の階層関係を示す。なお、同図において(A),
(B)は、同じ文書IDを有する。つまり、同じ文書が
元になっているが、構造化の結果が異なる。これは、文
脈を表すクラス情報が異なっているためである。構造化
結果は、クラス情報に応じて変化するため、(A),
(B)に示すように異なった入力情報が生成される。ま
た、同図(C)は、(A)のセグメント間の関係を表し
たものである。
【0046】図6に示すデータベースの例において、
(A)は、文書データベース21の例を示し、(B)
は、セグメント階層データベース22の例を示す。文書
データベース21には、一つの固有セグメントIDに対
し、そのセグメント内に現れる各属性情報を格納してい
る。セグメント階層データベース22には、一つのセグ
メントIDに対し、その子固有セグメントIDと親固有
セグメントIDを格納する。
【0047】以下、図4のフローチャートに沿って動作
を説明する。
【0048】ステップ101) 文書の意味的な構造化
データを文書構造化結果解析部11に入力する。当該構
造化データには、文書ID、クラス情報、クラスに基づ
いたセグメント情報、属性名情報、属性値情報が含まれ
る。また、セグメント間の階層関係も記述されている。
【0049】ステップ102) 文書構造化結果解析部
11は、構造化結果を解析し、文書ID、クラス情報、
クラスに基づいたセグメント情報、属性名情報、属性値
情報を対応付ける。また、クラス情報とセグメント情報
を結び付けることで、セグメント固有のIDを生成し、
各セグメント間の階層関係を表す。例えば、セグメント
A,Bは、セグメントCの下位セグメントである、とい
う関係である。例えば、ある文書に、A社とB社の企業
情報が含まれるているとする。A社は、いくつかの支社
を持っているため、その文書内に支社の情報が並んでい
るとする。この場合、上位セグメントが、クラス「企業
情報」でセグメントIDが「1」、下位セグメントが、
クラス「支社情報」で、セグメントIDが「1」のよう
に表される。
【0050】ステップ103) データベース投入部1
2は、各属性とその値に、文書ID、クラス情報、セグ
メントID情報を対応させた情報を、文書データベース
21に格納する。また、セグメントの階層関係をセグメ
ント階層データベース22に格納する。
【0051】ステップ104) ユーザ検索入力部13
に検索者が検索命令を入力する。検索方式は、以下のス
テップ105〜ステップ108のいずれかになる。
【0052】ステップ105) 検索者が検索したい属
性を指定した上で文字列を入力、または、選択すると、
基本検索部14は、文書データベース21を検索してセ
グメント固有IDを返す。
【0053】ステップ106) 検索者が複数の属性を
指定したAND検索を指定した場合は、まず、基本検索
部14が文書データベース21から各属性が含まれるセ
グメントを抽出し、階層関係検索部15がセグメント階
層データベース22内のセグメント間の関係を参照し
て、指定された複数の属性が、同一セグメントまたは、
上位下位関係を持つ複数のセグメント内にそれぞれに現
れる場合、該当するセグメント固有IDを返す。
【0054】例えば、ある文書内が「企業情報」につい
て書かれていた時に、その中に「支社情報」が含まれて
いたとする。この場合「企業情報」のセグメント間の関
係がセグメント階層データベース22に格納されてい
る。検索者が、「業種」属性「通信」と「電話番号」属
性「00XX」を指定した場合、基本検索部14が、そ
れぞれの属性にマッチするセグメント固有IDを文書デ
ータベース21から検索する。その結果が、同一セグメ
ント内にあれば、そのセグメント固有IDを返す。次
に、階層関係検索部14がセグメント階層データベース
22を参照し、「業種」属性「通信」が、上位セグメン
ト(企業情報セグメント)に含まれ、「電話番号」属性
「00XX」が下位セグメント(支社情報セグメント)
に含まれていれば、上位セグメントの固有IDを返す。
【0055】ステップ107) 検索者が複数の属性を
指定したOR検索をした場合は、基本検索部14が、文
書データベース21から各属性が含まれるセグメントを
抽出し、該当する固有IDを返す。
【0056】ステップ108) 検索者が複数の属性を
指定した排他検索をした場合は、まず、基本検索部14
が、文書データベース21から各属性が含まれるセグメ
ントを抽出し、階層関係検索部15が、セグメント階層
データベース22内のセグメント間の関係を参照して、
指定された複数の属性が、同一セグメントまたは、上位
下位関係を持つセグメント内にそれぞれに現れない場
合、該当するセグメント固有IDを返す。
【0057】ステップ109) セグメント検索に対
し、属性値検索も可能とする。検索者が、ある属性の値
を知りたいときに、その属性名と、関係する属性及び属
性値を指定する。例えば、「製品」属性とそれに関連す
る属性として、属性「メーカー」、値「○○社」を指定
した場合、属性「メーカー」、値「○○社」の「製品」
の値が検索できる。この際、階層関係検索部15は、セ
グメント階層データベース22内のセグメント間の関係
を参照して、指定された属性と、関係する属性及びその
値が、同一セグメントまたは、上位下位関係を持つセグ
メント内にそれぞれ現れる場合、指定された属性に対応
する値を返す。
【0058】ステップ110) また、検索者は、特定
のクラスを指定することもできる。この場合、基本検索
部14は、クラスIDをキーに追加して文書データベー
ス21を検索する。
【0059】ステップ111) 検索結果出力部16
は、基本検索部14及び階層関係検索部15により検索
された、文書ID、セグメントIDを出力する。
【0060】また、上記の実施例は、図3の構成及び図
4の動作のフローチャートに基づいて説明したが、図4
の動作をプログラムとして構築し、文書クラス検索装置
として利用されるコンピュータに接続されるディスク装
置や、フロッピーディスク、CD−ROM等の可搬記憶
媒体に格納しておき、本発明を実施する際にインストー
ルすることにより容易に本発明を実現できる。
【0061】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内において種々変更・応用
が可能である。
【0062】
【発明の効果】上述のように、本発明によれば、文書の
意味構造をさまざまな文脈で的確に表現できる構造化文
書データを格納しておくことにより、意味的に構造化さ
れたテキストデータを、その属性間の意味的な関係を指
定して検索することができる。また、文脈に応じた文書
の構造化データを用いて文脈を考慮した検索ができる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の一実施例の文書クラス検索装置の構成
図である。
【図4】本発明の一実施例の動作のフローチャートであ
る。
【図5】本発明の一実施例の入力情報の例である。
【図6】本発明の一実施例のデータベースの格納例であ
る。
【符号の説明】
1 文書クラス検索装置 11 文書構造化結果解析手段、文書構造化結果解析部 12 データベース投入手段、データベース投入部 13 ユーザ検索入力手段、ユーザ検索入力部 14 基本検索手段、基本検索部 15 階層関係検索手段、階層関係検索部 16 検索結果出力手段、検索結果出力部 21 文書データベース 22 セグメント階層データベース
───────────────────────────────────────────────────── フロントページの続き (72)発明者 高橋 克己 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B009 QA09 SA12 VA02 5B075 ND03 NK10 NK43 NK46 NR02 NR12 PP23 QS20 UU06

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 意味的に構造化されたテキストデータ
    を、その属性間の意味的な関係を指定して検索するため
    の文書クラス検索方法において、 文脈の概念であるクラス情報と、当該クラスに基づいて
    分割され、階層化されたセグメント情報が付加された文
    書の意味的構造化結果を入力し、 前記意味的構造化結果である属性の集合中の各属性に対
    し、文書の固有IDと、クラス情報と、当該クラスに応
    じた分割結果であるセグメント情報を付与し、 データベースに格納することを特徴とする文書クラス検
    索方法。
  2. 【請求項2】 各セグメントに対し、文書内のセグメン
    ト固有IDを付与し、該セグメント固有IDで識別した
    セグメント相互の階層関係をデータベースに格納する請
    求項1記載の文書クラス検索方法。
  3. 【請求項3】 前記データベースを検索する際に、検索
    者が検索命令として、複数の属性が指定された、AND
    検索をする際に、 前記データベースのセグメント間の関係を参照して、指
    定された前記複数の属性が、同一セグメントまたは、上
    位下位の関係を持つ複数のセグメント内にそれぞれに現
    れる場合、該当するセグメント固有IDを返却し、 前記セグメント固有IDを出力する請求項2記載の文書
    クラス検索方法。
  4. 【請求項4】 前記データベースを検索する際に、検索
    者が検索命令として、複数の属性が指定された、特定の
    属性が他の特定の属性と共起しないことを指定した検索
    である排他検索をする際に、 前記データベースのセグメント間の関係を参照して、指
    定された前記複数の属性が、同一セグメントまたは、上
    位下位の関係を持つ複数のセグメント内にそれぞれ現れ
    ない場合に、該当するセグメント固有IDを返却し、 前記セグメント固有IDを出力する請求項2記載の文書
    クラス検索方法。
  5. 【請求項5】 前記データベースを検索する際に、検索
    者がある属性の値を知りたい時に、該属性の属性名と、
    関係する属性及び属性値が指定された場合において、前
    記データベースのセグメント間の関係を参照して、指定
    された属性と関係する属性及び該属性の値が、同一セグ
    メントまたは、上位下位の関係を持つ複数のセグメント
    内にそれぞれ現れる場合、指定された前記属性に対応す
    る値を返却し、 前記指定された属性に対応する値を出力する請求項2記
    載の文書クラス検索方法。
  6. 【請求項6】 前記データベースを検索する際に、検索
    者が文脈を指定すると、クラスIDをキーに追加して前
    記データベースを検索する請求項1記載の文書クラス検
    索方法。
  7. 【請求項7】 意味的に構造化されたテキストデータ
    を、その属性間の意味的な関係を指定して検索するため
    の文書クラス検索装置であって、 文脈の概念であるクラス情報と、当該クラスに基づいて
    分割され、階層化されたセグメント情報が付加された文
    書の意味的構造化結果を入力する文書構造化結果解析手
    段と、 構造化結果である属性の集合中の各属性に対し、文書の
    固有IDと、クラス情報と、当該クラスに応じた分割結
    果であるセグメント情報を付与し、文書データベースに
    格納するデータベース投入手段とを有することを特徴と
    する文書クラス検索装置。
  8. 【請求項8】 前記データベース投入手段は、 各セグメントに対し、文書内のセグメント固有IDを付
    与し、該セグメント固有IDで識別したセグメント相互
    の階層関係をセグメント階層データベースに格納する手
    段を含む請求項7記載の文書クラス検索装置。
  9. 【請求項9】 前記データベースを検索する際に、検索
    者が検索命令として、複数の属性が指定されAND検索
    命令が入力される第1のユーザ検索入力手段と、 前記セグメント階層データベースのセグメント間の関係
    を参照して、指定された前記複数の属性が、同一セグメ
    ントまたは、上位下位の関係を持つ複数のセグメント内
    にそれぞれに現れる場合、該当するセグメント固有ID
    を返却する第1の階層関係検索手段と、 前記セグメント固有IDを出力する第1の検索結果出力
    手段とを有する請求項8記載の文書クラス検索装置。
  10. 【請求項10】 前記データベースを検索する際に、検
    索者が検索命令として、複数の属性を指定して、ある特
    定の属性が他の特定の属性と共起しないことを指定した
    検索である排他検索命令が入力される第2のユーザ検索
    入力手段と、 前記セグメント階層データベースのセグメント間の関係
    を参照して、指定された前記複数の属性が、同一セグメ
    ントまたは、上位下位の関係を持つ複数のセグメント内
    にそれぞれ現れない場合に、該当するセグメント固有I
    Dを返却する第2の階層関係検索手段と、 前記セグメント固有IDを出力する第2の検索結果出力
    手段とを有する請求項8記載の文書クラス検索装置。
  11. 【請求項11】 前記データベースを検索する際に、検
    索者がある属性の値を知りたい時に、該属性の属性名
    と、関係する属性及び属性値が入力される第3のユーザ
    検索入力手段と、 前記セグメント階層データベースのセグメント間の関係
    を参照して、指定された属性と関係する属性及び該属性
    の値が、同一セグメントまたは、上位下位の関係を持つ
    複数のセグメント内にそれぞれ現れる場合、指定された
    前記属性に対応する値を返却する第3の階層関係検索手
    段と、 前記指定された属性に対応する値を出力する第3の検索
    結果出力手段とを有する請求項8記載の文書クラス検索
    装置。
  12. 【請求項12】 前記データベースを検索する際に、検
    索者により文脈が入力される第4のユーザ検索入力手段
    と、 クラスIDをキーに追加して前記文書データベースを検
    索する文書データベース検索手段とを有する請求項7記
    載の文書クラス検索装置。
  13. 【請求項13】 意味的に構造化されたテキストデータ
    を、その属性間の意味的な関係を指定して検索するため
    の文書クラス検索プログラムを格納した記憶媒体であっ
    て、 文脈の概念であるクラス情報と、当該クラスに基づいて
    分割され、階層化されたセグメント情報が付加された文
    書の意味的構造化結果を入力する文書構造化結果解析プ
    ロセスと、 構造化結果である属性の集合中の各属性に対し、文書の
    固有IDと、クラス情報と、当該クラスに応じた分割結
    果であるセグメント情報を付与し、文書データベースに
    格納するデータベース投入プロセスとを有することを特
    徴とする文書クラス検索プログラムを格納した記憶媒
    体。
  14. 【請求項14】 前記データベース投入プロセスは、 各セグメントに対し、文書内のセグメント固有IDを付
    与し、該セグメント固有IDで識別したセグメント相互
    の階層関係をセグメント階層データベースに格納するプ
    ロセスを含む請求項13記載の文書クラス検索プログラ
    ムを格納した記憶媒体。
  15. 【請求項15】 前記データベースを検索する際に、検
    索者からの検索命令を入力させるユーザ検索入力プロセ
    スと、 前記検索者から複数の属性が指定されたAND検索命令
    が入力された場合に、前記セグメント階層データベース
    のセグメント間の関係を参照して、指定された前記複数
    の属性が、同一セグメントまたは、上位下位の関係を持
    つ複数のセグメント内にそれぞれに現れる場合、該当す
    るセグメント固有IDを返却し、 前記検索者から複数の属性が指定された、ある特定の属
    性が他の特定の属性と共起しないことを指定した検索で
    ある排他検索命令が入力された場合に、前記セグメント
    階層データベースのセグメント間の関係を参照して、指
    定された前記複数の属性が、同一セグメントまたは、上
    位下位の関係を持つ複数のセグメント内にそれぞれ現れ
    ない場合に、該当するセグメント固有IDを返却し、 検索者がある属性の値を知りたい時に、該属性の属性名
    と、関係する属性及び属性値が入力された場合に、前記
    セグメント階層データベースのセグメント間の関係を参
    照して、指定された属性と関係する属性及び該属性の値
    が、同一セグメントまたは、上位下位の関係を持つ複数
    のセグメント内にそれぞれ現れる場合、指定された前記
    属性に対応する値を返却し、 検索者から文脈が入力された場合に、クラスIDをキー
    に追加して前記文書データベースを検索する検索プロセ
    スと、 前記検索プロセスにおいて検索された前記セグメント固
    有ID、または、前記属性に対応する値、または、前記
    文書データベースの検索結果を出力させる検索結果出力
    プロセスとを有する請求項13または、14記載の文書
    クラス検索プログラムを格納した記憶媒体。
JP2000008186A 2000-01-17 2000-01-17 文書クラス検索方法及び装置及び文書クラス検索プログラムを格納した記憶媒体 Pending JP2001195426A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000008186A JP2001195426A (ja) 2000-01-17 2000-01-17 文書クラス検索方法及び装置及び文書クラス検索プログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000008186A JP2001195426A (ja) 2000-01-17 2000-01-17 文書クラス検索方法及び装置及び文書クラス検索プログラムを格納した記憶媒体

Publications (1)

Publication Number Publication Date
JP2001195426A true JP2001195426A (ja) 2001-07-19

Family

ID=18536500

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000008186A Pending JP2001195426A (ja) 2000-01-17 2000-01-17 文書クラス検索方法及び装置及び文書クラス検索プログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JP2001195426A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006137530A1 (ja) * 2005-06-24 2006-12-28 Justsystems Corporation 文書処理装置
WO2009045039A2 (en) * 2007-10-01 2009-04-09 Ki-Mi Kim Contents relationship management system by multiple internet domain
CN111814027A (zh) * 2020-08-26 2020-10-23 电子科技大学 基于搜索引擎的多源人物属性融合方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10198706A (ja) * 1996-11-15 1998-07-31 Digital Vision Lab:Kk 情報検索装置及びその方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10198706A (ja) * 1996-11-15 1998-07-31 Digital Vision Lab:Kk 情報検索装置及びその方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006137530A1 (ja) * 2005-06-24 2006-12-28 Justsystems Corporation 文書処理装置
JP5020075B2 (ja) * 2005-06-24 2012-09-05 株式会社ジャストシステム 文書処理装置
WO2009045039A2 (en) * 2007-10-01 2009-04-09 Ki-Mi Kim Contents relationship management system by multiple internet domain
WO2009045039A3 (en) * 2007-10-01 2009-05-22 Ki-Mi Kim Contents relationship management system by multiple internet domain
CN111814027A (zh) * 2020-08-26 2020-10-23 电子科技大学 基于搜索引擎的多源人物属性融合方法
CN111814027B (zh) * 2020-08-26 2023-03-21 电子科技大学 基于搜索引擎的多源人物属性融合方法

Similar Documents

Publication Publication Date Title
US9201923B2 (en) Method and apparatus for organizing and optimizing content in dialog systems
KR101088983B1 (ko) 데이터 탐색 시스템 및 방법과, 데이터 탐색 방법을수행하는 장치
JP2006004274A (ja) 対話処理装置、対話処理方法及び対話処理プログラム
US9286362B2 (en) System and method to customize metadata for different users running on the same infrastructure
US20070038647A1 (en) Management of media sources in memory constrained devices
JP2008234357A (ja) 構造化文書検索システム、プログラム及び索引のデータ構造
EP1315103B1 (en) File search method and apparatus, and index file creation method and device
JPH11110413A (ja) データベース検索結果を生成するための方法および装置
JP3687118B2 (ja) 関連語辞書作成装置および関連語辞書作成方法
US11106739B2 (en) Document structures for searching within and across messages
JP2009098811A (ja) 文書分類装置およびプログラム
JP2001195426A (ja) 文書クラス検索方法及び装置及び文書クラス検索プログラムを格納した記憶媒体
CN100456285C (zh) 用于访问数据库的方法和设备
KR100722513B1 (ko) 검색 엔진 및 검색 서비스에서 제공하는 첫소리말 색인 및검색 방법, 시스템
JPH0581326A (ja) データベース検索装置
JPH11338873A (ja) 再検索方法及び装置及び再検索プログラムを格納した記憶媒体及び追加検索語候補提示方法及び装置及び追加検索語候補提示プログラムを格納した記憶媒体
JP2001101184A (ja) 構造化文書生成方法及び装置及び構造化文書生成プログラムを格納した記憶媒体
JP3387172B2 (ja) 情報管理装置
WO2016206546A1 (zh) 一种在网络设备上实现命令查找的方法及装置
JP2000231561A (ja) 検索方法ならびに装置及び同方法がプログラムされ記録された記録媒体
JP3194691B2 (ja) マルチメディア複合文書管理システム
JPH09305619A (ja) 階層インデックス検索装置、及び文書検索方法
JP2010218459A (ja) 情報処理装置、情報処理方法及びプログラム
JP2006120169A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2006163723A (ja) ドキュメント検索方法