JP2002123545A - 文書検索装置、文書検索方法、及び、記録媒体 - Google Patents

文書検索装置、文書検索方法、及び、記録媒体

Info

Publication number
JP2002123545A
JP2002123545A JP2000317005A JP2000317005A JP2002123545A JP 2002123545 A JP2002123545 A JP 2002123545A JP 2000317005 A JP2000317005 A JP 2000317005A JP 2000317005 A JP2000317005 A JP 2000317005A JP 2002123545 A JP2002123545 A JP 2002123545A
Authority
JP
Japan
Prior art keywords
word
document
independent
feature information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000317005A
Other languages
English (en)
Other versions
JP2002123545A5 (ja
Inventor
Koji Maekawa
浩司 前川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000317005A priority Critical patent/JP2002123545A/ja
Publication of JP2002123545A publication Critical patent/JP2002123545A/ja
Publication of JP2002123545A5 publication Critical patent/JP2002123545A5/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 接尾語や接頭語を含む場合にも、好適な検索
を行うこと。 【解決手段】 複数の文書の中から、与えられた文字列
に関連する文書を検索する文書検索装置であって、前記
文書毎に、前記文書に含まれる自立語の接頭語又は接尾
語に関する情報を含む第1の単語特徴情報(図8)を格
納する手段と、前記文字列に含まれる自立語を抽出する
抽出手段と、前記抽出手段により抽出された前記自立語
の接頭語又は接尾語に関する情報を含む第2の単語特徴
情報を作成する手段と、前記文書の中から、前記抽出手
段により抽出された前記自立語を全て含む文書を検索す
る手段と、検索された文書に含まれる自立語のうち、前
記抽出手段により抽出された前記自立語に対応する自立
語の前記第1の単語特徴情報と、前記第2の単語特徴情
報と、に基づいて、検索された文書の順位付けを行う手
段と、を備えたことを特徴とする文書検索装置。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書の検索技術に
関する。
【0002】
【従来の技術】文書データベースで管理される文書の検
索方法として、種々の方法が提案されている。図9は、
従来の文書検索方法の一例を示したフローチャートであ
る。
【0003】ステップS201では、検索条件を設定
し、ステップS202では検索条件を解析し、その単語
間の関係を取得する。例えば、ステップS201で検索
条件として「豊富な経験」という文字列が設定された場
合、ステップS202では、「豊富な」と「経験」との
単語を抽出し、これらの単語間の関係を取得する。
【0004】ステップS203では、検索対象となる文
書をステップS202で行ったクエリと同様に解析処理
を行う。図10のように、管理されている全ての文書1
〜nが検索対象文書とされ、各文書に対して順次文書解
析と、検索条件とのマッチングが行われる。
【0005】文書解析の一例として、例えば、図11に
示す文書A〜文書Dが検索対象文書であった場合を想定
すると、文書Aにおける「A社は豊富な経験を持つ企業
と提携する。」および、「この提携により、情報関連分
野進出の足がかりとする。」という文は、図12のよう
に解析される。
【0006】ステップS204では、検索対象の文書と
検索条件として設定された文字列との関係を比較して順
序付けを行う。ここでは、順序付けの結果は、文書A
> 文書B> 文書C> 文書Dとなり、検索結果とし
て、検索条件に対して関連性の高い文書から順に提示す
ることが可能である。
【0007】また、従来の文書検索方法の他の方法とし
て、図13のフローチャートに示すような方法がある。
【0008】ステップS301では検索条件を設定す
る。ここでは、「豊富な経験」という文字列が設定され
たと想定する。ステップS302では、検索条件を解析
する。ここでは、「豊富な」と「経験」という単語の関
係と、全文検索のキーワードとして「豊富」と「経験」
とを抽出する。
【0009】ステップS303では、ステップS302
で抽出したキーワードに基づいて全文検索処理を実行
し、「豊富」と「経験」とを全て含む文書を検索する。
【0010】ステップS304では全文検索結果を取得
する。ステップS305では検索結果となった文書の解
析を行い、文の構造などを解析する。ステップS306
では検索条件の構造と文の構造とを比較して、検索した
文書に優先順位を付加する。
【0011】ステップS307では、ステップS305
からステップS306までの処理を全文検索の結果取得
した全ての文書に対して実行する。
【0012】この結果、例えば、図11に例示した文書
A〜文書Dの順位は、文書A > 文書B> 文書Cとな
り、文書Dは検索結果から除外される。その後、検索結
果として、上記順位順に各文書が提示等される。
【0013】このように、従来の検索技術の中には、単
なる全文検索と比較して、検索条件をより反映した検索
結果を得ることもできる。
【0014】
【発明が解決しようとする課題】しかしながら、「社会
的」や「非生産性」のように自立語に接尾語あるいは接
頭語が付加されている場合、好適な検索結果を得られな
いという問題があった。
【0015】例えば、「社会的な問題」という文字列が
検索条件として与えられた場合、検索キーワードを「社
会的」と「問題」とすると、「社会問題」、「社会の問
題」や「反社会的な問題」という文字列を含む文書がヒ
ットしない場合があった。
【0016】一方、検索キーワードを「社会」と「的」
として検索を行った場合、「反社会的な問題」といった
文字列を含む文書はヒットするが、「社会問題」や「社
会の問題」といった文字列を含む文書は検索の対象から
漏れることとなり、逆に「社会が効果的に」などといっ
た関係のない文字列を含む文書を検索する場合があっ
た。
【0017】このように、接尾語や接頭語に関しては、
一つの単語とした場合、二つの単語とした場合、接頭
語、接尾語を無視した場合が考えられていたが、どの例
においても、満足の行く検索結果を得ることはできなか
った。
【0018】従って、本発明の目的は、接尾語や接頭語
を含む場合にも、好適な検索を行うことのできる文書検
索装置、文書検索方法、及び、記録媒体を提供すること
にある。
【0019】
【課題を解決するための手段】本発明によれば、複数の
文書の中から、与えられた文字列に関連する文書を検索
する文書検索装置であって、前記文書毎に、前記文書に
含まれる自立語の接頭語又は接尾語に関する情報を含む
第1の単語特徴情報を格納する手段と、前記文字列に含
まれる自立語を抽出する抽出手段と、前記抽出手段によ
り抽出された前記自立語の接頭語又は接尾語に関する情
報を含む第2の単語特徴情報を作成する手段と、前記文
書の中から、前記抽出手段により抽出された前記自立語
を全て含む文書を検索する手段と、検索された文書に含
まれる自立語のうち、前記抽出手段により抽出された前
記自立語に対応する自立語の前記第1の単語特徴情報
と、前記第2の単語特徴情報と、に基づいて、検索され
た文書の順位付けを行う手段と、を備えたことを特徴と
する文書検索装置が提供される。
【0020】また、本発明によれば、複数の文書の中か
ら、与えられた文字列に関連する文書を検索する文書検
索方法であって、前記文書毎に、前記文書に含まれる自
立語の接頭語又は接尾語に関する情報を含む第1の単語
特徴情報を作成する工程と、前記文字列に含まれる自立
語を抽出する抽出工程と、前記抽出工程において抽出さ
れた前記自立語の接頭語又は接尾語に関する情報を含む
第2の単語特徴情報を作成する工程と、前記文書の中か
ら、前記抽出工程において抽出された前記自立語を全て
含む文書を検索する工程と、検索された文書に含まれる
自立語のうち、前記抽出工程において抽出された前記自
立語に対応する自立語の前記第1の単語特徴情報と、前
記第2の単語特徴情報と、に基づいて、検索された文書
の順位付けを行う工程と、を含むことを特徴とする文書
検索方法が提供される。
【0021】また、本発明によれば、複数の文書の中か
ら、与えられた文字列に関連する文書を検索するため
に、コンピュータを、前記文書毎に、前記文書に含まれ
る自立語の接頭語又は接尾語に関する情報を含む第1の
単語特徴情報を格納する手段、前記文字列に含まれる自
立語を抽出する抽出手段、前記抽出手段により抽出され
た前記自立語の接頭語又は接尾語に関する情報を含む第
2の単語特徴情報を作成する手段、前記文書の中から、
前記抽出手段により抽出された前記自立語を全て含む文
書を検索する手段、検索された文書に含まれる自立語の
うち、前記抽出手段により抽出された前記自立語に対応
する自立語の前記第1の単語特徴情報と、前記第2の単
語特徴情報と、に基づいて、検索された文書の順位付け
を行う手段、として機能させるプログラムを記録した記
録媒体が提供される。
【0022】
【発明の実施の形態】以下、本発明の好適な実施の形態
について図面を参照して説明する。
【0023】図1は、本発明の一実施形態に係る文書検
索装置の構成を表すブロック図である。該装置は、入力
装置1と、CPU2と、出力装置3と、記憶装置4と、
を備える汎用のコンピュータ上で実現される。入力装置
1は、例えばキーボード等からなり、検索条件を入力等
するためのものである。CPU2は、記憶装置4に格納
された処理プログラム41に従って、後述する文書検索
処理を実行する。出力装置3は、ディスプレイ等であ
り、検索結果等を表示する。記憶装置4は、例えば、ハ
ードディスク、RAM、若しくは、これらの組合せ等で
あり、CPU2が実行する処理プログラム41の他、単
語特徴データ42や、検索対象となる文書等を格納す
る。
【0024】なお、本発明の文書検索装置は、図1に示
すような単体のコンピュータ以外にも、図2に示すロー
カルネットワーク環境や、図3に示すインターネット環
境上においても実現可能であり、この場合、個々のクラ
イアントコンピュータにおいて検索条件の設定、検索結
果の表示等を行い、サーバにおいて、検索処理が行われ
ることとなる。
【0025】次に、文書検索処理について説明する。図
4は、文書検索処理を示すフローチャートである。
【0026】ステップS101では、入力装置1から検
索条件の入力を受け付ける。検索条件の入力は、複数の
キーワード(論理式を含む)、若しくは、自然文等とい
った文字列を入力することにより行う。ステップS10
2では、検索条件から自立語を抽出して、全文検索を実
行するための論理式を作り出す。
【0027】例えば、検索条件として入力された文字列
が、「社会的な問題」であった場合、「社会」と「問
題」という自立語が抽出され、「社会」∩「問題」が全
文検索を実行する条件式とされる。
【0028】ステップS103では、ステップS102
で作成された条件式によって全文検索処理を実行し、文
書中に「社会」と「問題」との双方を含む全ての文書が
検索される。全文検索の方式は問われない。ここでは、
全文検索の対象として、図6に示す5つの文書A乃至E
が全文検索されたものとする。
【0029】ステップS104乃至ステップS106
は、検索された文書の順位付けを行うためのループであ
り、検索された各文書について、ステップS105乃至
ステップS106の処理が実行される。
【0030】ここで、本実施形態の文書検索装置では、
検索対象となる文書毎に、当該文書に含まれる自立語に
関する単語特徴データを記憶装置4に格納している。こ
の単語特徴データは、文書の登録時に作成し、記憶装置
4に格納されたものであるが、検索時に作成するように
してもよい。
【0031】単語特徴データは、まず、図7に示すよう
に、各文書に含まれる自立語に関する情報をテーブル形
式で有している。各自立語は、文単位で区分けされてい
る(文番号)。更に、各自立語には、その自立語の文中
における位置情報、その自立語の活用情報、その自立語
に付されている助詞等の付属語情報、及び、その自立語
の接頭語又は接尾語等の付着語情報がテーブル形式で付
されている。図8は、文書Aに含まれる各自立語の情報
を示した図である。複合語の場合、その複合語を構成す
る各自立語を、それぞれ一つの自立語としてもよいし、
いずれか一つを自立語として扱い、他の自立語を付着語
情報に付加してもよい。
【0032】ステップS105では、検索条件として与
えられた文字列について、上述した単語特徴データを作
成すると共に、検索された文書中に含まれる自立語のう
ち、検索条件に含まれる自立語に対応する自立語につい
ての単語特徴データを記憶装置4から取得する。
【0033】ステップS106では、検索条件中の自立
語と検索された文書中の自立語との一致度を計算して、
検索された各文書の順位を付する。
【0034】本実施形態では、以下のような関係で順位
付けをする。
【0035】自立語の特徴が一致 > 同一文に自立語が
出現 > 同一文書に自立語出現 このため、ステップS106での単語特徴一致度計算処
理は、単語特徴データの取得は、まず、同一文内に単語
が出現する文のみについて行うこととなる。
【0036】従って、文書A〜文書Eのうち、文書Cは
同一文に自立語「社会」及び「問題」が出現せず、最下
位の順位となり、文書Eは自立語の特徴の観点から次に
低い順位が付される。
【0037】一致度は下記の計算式で計算される。 一致度 = 位置関係の一致度 × 修飾関係の一致度 ×
付属語関係の一致度 検索条件「社会的な問題」は、 係り側 単語:社会、位置:1、活用形:語幹、付属語
情報:なし 接続語情報 単語:的、位置:3、活用形:連体 受け側 単語:問題、位置:3、活用形:語幹、付属語
情報:なし と解析され、この単語特徴データと、検索された文書の
単語特徴データの一致度を計算する。一例として、文書
Aとの一致度を検討する。
【0038】文書Aでは、「社会」および、「問題」の
(相対的)位置関係、活用、付属語情報などの単語特徴
データは全て一致するために、一致度は最大となる。
【0039】更に、付着語情報の一致度計算を行う。図
5は、付着語情報の一致度計算処理を示すフローチャー
トである。ステップS106で求められた一致度に対し
て、付着語の一致度を付加した値が最終的な一致度とな
る。
【0040】ステップS401では、検索条件に含まれ
る自立語「社会」や「問題」が、文書Aの単語特徴デー
タ上の自立語(図7)に存在するか否かを判断する。今
回の例の場合、存在しているので、ステップS403の
処理を行う。
【0041】自立語「社会」には接尾語「的」が付着し
ているので、さらに付着語の一致度を文の一致度に考慮
する必要がある。検索条件の付着語情報(的、連体)
は、文書Aの単語特徴データに格納されている「社会」
の付着語情報(的、連体)と一致するので、文書Aはト
ータル的に最大の一致度が付加される。
【0042】このような処理を同様に、文書Bについて
も行う。文書Bの場合、「社会」「問題」は複合語であ
るために、単語特徴データの位置関係が異なり、連体修
飾形が複合語になるため、一致度が下がる。さらに、付
着語情報に関しても、文書Bではそれらの自立語に付着
語がついていないために、さらに一致度が下がる。
【0043】文書Dは「社会」「現象」が複合語であ
り、社会と問題は位置関係の違いがあるために、一致度
は下がる。しかし、本実施形態では「社会現象的」の
「的」は「社会−的」あるいは「現象−的」どちらの単
語にも付着されるデータであるとしている。したがっ
て、付着語情報の一致度としては最大値がつけられる。
【0044】このようにして、文書A〜Eまでの文の一
致度を計算する。ステップS107では、文書A乃至E
を一致度の高い順に順位付けをして出力する。上記例で
は、A > D > B > E> C の順に出力されること
となる。
【0045】次に、検索条件の自立語に対応する自立語
が、検索対象である文書の単語特徴データに掲げられた
自立語として存在しなかった場合について説明する。
【0046】検索条件が「船で運ぶ」であるとすると、
自立語「船」と「運ぶ」とが抽出されて全文検索が行わ
れる。全文検索によって、例えば、「貨物船で運ぶ」の
ような文書が検索されたとする。そして、文書「貨物船
で運ぶ」の単語特徴データが、以下に示すものであった
とする。
【0047】
【表1】
【0048】この場合、「貨物船」という複合語は、
「貨物」を自立語として扱い、「船」を付着語として扱
っていることがわかる。従って、この文書の単語特徴デ
ータには、検索条件の自立語「船」が存在していない。
この場合は、図5の一致度計算処理において、ステップ
S402へ進み、付着語をキーワードとした一致度計算
を行う。単語特徴データの自立語「貨物」の付着語情報
には「船」が存在し、「船」をキーワードとして処理を
行う。そうすると、「船」の付属語情報が「で(手段・
連用)」であり、検索条件と完全に一致する。
【0049】このようにすると、「船で運ぶ」と「貨物
船で運ぶ」の一致度は高いと判断することができる。以
上のように、計算することで、下記の文の一致度は、B
>A > C > D となる。 A)貨物船で運ぶ。 B)貨物を船で運ぶ。 C)旅客船で人を運ぶ。 D)貨物車で運ぶ。
【0050】なお、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納されたプログ
ラムコードを読み出し実行することによっても、達成さ
れることは言うまでもない。この場合、記憶媒体から読
み出されたプログラムコード自体が前述した実施形態の
機能を実現することになり、そのプログラムコードを記
憶した記憶媒体は本発明を構成することになる。また、
コンピュータが読み出したプログラムコードを実行する
ことにより、前述した実施形態の機能が実現されるだけ
でなく、そのプログラムコードの指示に基づき、コンピ
ュータ上で稼働しているオペレーティングシステム(OS)
などが実際の処理の一部または全部を行い、その処理に
よって前述した実施形態の機能が実現される場合も含ま
れることは言うまでもない。
【0051】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0052】
【発明の効果】以上説明したとおり、本発明によれば、
接尾語や接頭語を含む場合にも、好適な検索を行うこと
のできる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る文書検索装置の構成
を示すブロック図である。
【0053】
【図2】本発明の文書検索装置が実現される他の構成例
を示した図である。
【0054】
【図3】本発明の文書検索装置が実現される他の構成例
を示した図である。
【0055】
【図4】本発明の一実施形態に係る文書検索処理を示す
フローチャートである。
【0056】
【図5】付着語情報の一致度計算処理を示すフローチャ
ートである。
【図6】全文検索により検索された文書の一例を示す図
である。
【0057】
【図7】単語特徴データを示す図である。
【0058】
【図8】単語特徴データを示す図である。
【0059】
【図9】従来の文書検索方法の一例を示したフローチャ
ートである。
【0060】
【図10】従来の文書検索方法における、検索対象とな
る各文書に対する処理を示した図である。
【0061】
【図11】検索対象の一例を示した図である。
【0062】
【図12】図11の文書Aの解析結果を示す図である。
【0063】
【図13】従来の文書検索方法の他の例を示したフロー
チャートである。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 複数の文書の中から、与えられた文字列
    に関連する文書を検索する文書検索装置であって、 前記文書毎に、前記文書に含まれる自立語の接頭語又は
    接尾語に関する情報を含む第1の単語特徴情報を格納す
    る手段と、 前記文字列に含まれる自立語を抽出する抽出手段と、 前記抽出手段により抽出された前記自立語の接頭語又は
    接尾語に関する情報を含む第2の単語特徴情報を作成す
    る手段と、 前記文書の中から、前記抽出手段により抽出された前記
    自立語を全て含む文書を検索する手段と、 検索された文書に含まれる自立語のうち、前記抽出手段
    により抽出された前記自立語に対応する自立語の前記第
    1の単語特徴情報と、前記第2の単語特徴情報と、に基
    づいて、検索された文書の順位付けを行う手段と、を備
    えたことを特徴とする文書検索装置。
  2. 【請求項2】 前記第1の単語特徴情報には、前記自立
    語の前記文書中における位置を示す情報が含まれ、前記
    第2の単語特徴情報には、前記自立語の前記検索文字列
    中における位置を示す情報が含まれることを特徴とする
    請求項1に記載の文書検索装置。
  3. 【請求項3】 前記第1の単語特徴情報及び前記第2の
    単語特徴情報には、それぞれ前記自立語に対する付属語
    の情報が含まれることを特徴とする請求項1に記載の文
    書検索装置。
  4. 【請求項4】 前記第1の単語特徴情報及び前記第2の
    単語特徴情報には、それぞれ前記自立語の活用に関する
    情報が含まれることを特徴とする請求項1に記載の文書
    検索装置。
  5. 【請求項5】 前記第1の単語特徴情報及び前記第2の
    単語特徴情報には、それぞれ前記自立語が複合語の一部
    であるか否かを示す情報が含まれることを特徴とする請
    求項1に記載の文書検索装置。
  6. 【請求項6】 複数の文書の中から、与えられた文字列
    に関連する文書を検索する文書検索方法であって、 前記文書毎に、前記文書に含まれる自立語の接頭語又は
    接尾語に関する情報を含む第1の単語特徴情報を作成す
    る工程と、 前記文字列に含まれる自立語を抽出する抽出工程と、 前記抽出工程において抽出された前記自立語の接頭語又
    は接尾語に関する情報を含む第2の単語特徴情報を作成
    する工程と、 前記文書の中から、前記抽出工程において抽出された前
    記自立語を全て含む文書を検索する工程と、 検索された文書に含まれる自立語のうち、前記抽出工程
    において抽出された前記自立語に対応する自立語の前記
    第1の単語特徴情報と、前記第2の単語特徴情報と、に
    基づいて、検索された文書の順位付けを行う工程と、を
    含むことを特徴とする文書検索方法。
  7. 【請求項7】 複数の文書の中から、与えられた文字列
    に関連する文書を検索するために、コンピュータを、 前記文書毎に、前記文書に含まれる自立語の接頭語又は
    接尾語に関する情報を含む第1の単語特徴情報を格納す
    る手段、 前記文字列に含まれる自立語を抽出する抽出手段、 前記抽出手段により抽出された前記自立語の接頭語又は
    接尾語に関する情報を含む第2の単語特徴情報を作成す
    る手段、 前記文書の中から、前記抽出手段により抽出された前記
    自立語を全て含む文書を検索する手段、 検索された文書に含まれる自立語のうち、前記抽出手段
    により抽出された前記自立語に対応する自立語の前記第
    1の単語特徴情報と、前記第2の単語特徴情報と、に基
    づいて、検索された文書の順位付けを行う手段、として
    機能させるプログラムを記録した記録媒体。
JP2000317005A 2000-10-17 2000-10-17 文書検索装置、文書検索方法、及び、記録媒体 Pending JP2002123545A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000317005A JP2002123545A (ja) 2000-10-17 2000-10-17 文書検索装置、文書検索方法、及び、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000317005A JP2002123545A (ja) 2000-10-17 2000-10-17 文書検索装置、文書検索方法、及び、記録媒体

Publications (2)

Publication Number Publication Date
JP2002123545A true JP2002123545A (ja) 2002-04-26
JP2002123545A5 JP2002123545A5 (ja) 2007-11-29

Family

ID=18795869

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000317005A Pending JP2002123545A (ja) 2000-10-17 2000-10-17 文書検索装置、文書検索方法、及び、記録媒体

Country Status (1)

Country Link
JP (1) JP2002123545A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217398A (ja) * 2007-03-05 2008-09-18 Hidetsugu Nanba 専門用語分類装置、専門用語分類方法、及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217398A (ja) * 2007-03-05 2008-09-18 Hidetsugu Nanba 専門用語分類装置、専門用語分類方法、及びプログラム

Similar Documents

Publication Publication Date Title
JP4173774B2 (ja) 重み付き編集距離に基づく例文の自動検索用システムおよび方法
JP5437557B2 (ja) 検索処理方法及び検索システム
JP2006523344A (ja) 対話形サーチクエリー改良のためのシステム及び方法
JP2006099428A (ja) 文書要約作成システム、方法、及びプログラム
JP4237813B2 (ja) 構造化文書管理システム
JP3784060B2 (ja) データベース検索システム、その検索方法及びプログラム
JP4227797B2 (ja) 類義語検索装置、それによる類義語検索方法、類義語検索プログラム及び記憶媒体
JP2011133928A (ja) 記憶装置に記憶してある文書ファイルを検索する検索装置、検索システム、検索方法及びコンピュータプログラム
JP5285491B2 (ja) 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、
JP3558267B2 (ja) 文書検索装置
JP2006190060A (ja) データベース検索方法、データベース検索プログラムおよび原稿処理機
JP2002123545A (ja) 文書検索装置、文書検索方法、及び、記録媒体
JP4091586B2 (ja) 構造化文書管理システム、索引構築方法及びプログラム
JPH10307835A (ja) 情報処理装置及びその方法
JP2002132789A (ja) 文書検索方法
US20110022591A1 (en) Pre-computed ranking using proximity terms
JP3287307B2 (ja) 構造化文書検索システム、構造化文書検索方法および構造化文書検索用プログラムを記録した記録媒体
JP7272540B2 (ja) 情報提供システム、情報提供方法、及びデータ構造
US20050102278A1 (en) Expanded search keywords
JP2001134584A (ja) 類似データの検索方法,検索装置および類似データ検索プログラム記録媒体
JP4304226B2 (ja) 構造化文書管理システム、構造化文書管理方法及びプログラム
JP4160627B2 (ja) 構造化文書管理システム及びプログラム
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
JP2002123546A (ja) 文書検索装置、文書検索方法、及び、記録媒体
JP2001092831A (ja) 文書検索装置及び文書検索方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071017

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071017

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071017

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100409

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100607

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100809