JP2001052022A - データ集計・参照型検索システム - Google Patents

データ集計・参照型検索システム

Info

Publication number
JP2001052022A
JP2001052022A JP11228918A JP22891899A JP2001052022A JP 2001052022 A JP2001052022 A JP 2001052022A JP 11228918 A JP11228918 A JP 11228918A JP 22891899 A JP22891899 A JP 22891899A JP 2001052022 A JP2001052022 A JP 2001052022A
Authority
JP
Japan
Prior art keywords
search
term
displayed
classification
terms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11228918A
Other languages
English (en)
Inventor
Kenichi Tamaoki
研一 玉置
Munehisa Saito
宗寿 齋藤
Hirosuke Someya
弘祐 染谷
Yoichi Nakatani
洋一 中谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JAPAN PATENT INFORMATION ORGAN
JAPAN PATENT INFORMATION ORGANIZATION
Original Assignee
JAPAN PATENT INFORMATION ORGAN
JAPAN PATENT INFORMATION ORGANIZATION
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JAPAN PATENT INFORMATION ORGAN, JAPAN PATENT INFORMATION ORGANIZATION filed Critical JAPAN PATENT INFORMATION ORGAN
Priority to JP11228918A priority Critical patent/JP2001052022A/ja
Publication of JP2001052022A publication Critical patent/JP2001052022A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】検索結果から、例えば、より良い検索タームを
選択できるような情報を利用者に示すことができるシス
テムの提供 【解決手段】ユーザはまず、検索内容に即した技術用語
を用いて、キーワードによる検索を行う(S202)。
指定されたキーワードが付与された文献の集合を作成し
て、結果を表示する。この文献の集合に対して、ランク
処理を行う(S204)。ランク処理は、検索結果の集
合に対して、指定項目の検索タームを頻度順に表示する
(S206)ことである。これにより、検索結果の文献
集合に対して、どの様なタームが、どの程度の頻度で付
与されているかの情報を利用者に提供することができ
る。タームが分類である場合、その説明も同時に提供
し、理解しやすいものとする。また、相関表示も行うこ
とができる。この相関表示とは、例えば、最大の頻度の
タームを指定して相関表示の指示を行い(S208)、
指定した項目のタームを説明文つきで頻度順で表示でき
る(S210)ことである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コンピュータを用
いた検索に関することであり、特に、検索結果から、さ
らに必要な情報を得ることができる処理に関することで
ある。
【0002】
【技術背景】キーワード等を用いて、コンピュータによ
り大量の情報を検索することは、現在よく行われている
ことである。代表的な検索対象として、特許文献があ
る。さて、検索には、使用する項目により、分類検索と
キーワード検索とがある。分類検索による検索集合体
は、産業別、あるいは機能別等の分類体系によって区分
された分類を基に整理された文献の集合体で、言わば一
つの概念の基に集められた文献の検索集合体であり、目
的とする検索対象と分類の概念が一致または近似してい
る場合には極めて精緻な検索が可能であると言われてい
る。しかし、分類による検索においては、検索対象であ
る文献が存在すると想定される分類個所を見つけ出すた
めに、分類体系についての充分な知識が必要である。
【0003】これに対し、キーワード検索は、比較的な
じみやすい技術用語の組合せによる検索が可能であるこ
と、また、分類体系に沿わない異なった観点での検索が
可能であるということもあって、利用が多い。しかし、
キーワード検索による検索集合は、単純に指定されたワ
ード群を全て保有する文献の集合体であるために、漏
れ、ノイズが多く効率的でないと言われている。分類に
よる検索は、目的とする検索対象が分類の概念と一致若
しくは近似している場合には、極めて精緻な検索が可能
であるが、分類の概念と検索対象が一致しない場合、す
なわち、分類の切り口と全く異なった観点でサーチしな
ければならないようなケース、言い換えれば、文献が、
広範囲の分類タームにまたがっているような場合、関係
があると想定される分類タームを確たる目当てもなく調
査することになり極めて不経済である。この様な場合に
は特に、キーワード検索は有効なサーチ手段として活用
されている。このように、分類検索、キーワード検索は
それぞれ一長一短があり、実際、熟練したサーチャー
は、自己の知識、経験より、これらの特徴を活かしてキ
ーワード検索、分類検索あるいは、これらを適宜組み合
わせた検索により、目的とする特許文献の調査を行って
いる。実際にサーチャーが調査を開始するに際しては、
キーワード検索、分類検索あるいは、これらの組合せ検
索の何れの検索方式が、自己の検索対象に適した検索方
式であるかを見定める必要があり、その準備段階として
検索対象のキーワードとそれに深く関わりのある分類タ
ームを探す作業から始めなければならない。キーワード
から分類タームを探す方法として、例えばキャッチワー
ド・インデックス方式があるが、主として、分類ターム
の一覧である分類表より抽出した用語を検索に用いる関
係上、分類ターム調査用としては充分とは言えず、あま
り利用されていない。
【0004】膨大な数の特許文献を検索する場合、分類
検索のためのツールとしては、例えば、Fタームがよく
知られている。このFタームは、特許文献の内容を解析
して付与されているため、検索には有効である。これま
でに公開されたFタームは2176テーマで、タームは
数十万に展開されている。このように細分化されている
ため、どのテーマまたはどのタームが利用者の調査目的
に適合するかを調べるのは、大変困難な状況となってい
る。これは、多くのテーマおよびタームの中から適した
ものを探すための第一段階の資料としてテーマ名称とそ
のカバーFI(ファイル・インデックス)を示した一覧
表のみしかなく、そこからは具体的な分類内容まで知る
ことができないこと、および分類自体は単に英数字の連
なりであり、そこから技術内容を知ることは不可能で、
出力時にその分類内容までの表示がないと内容が吟味で
きないことが挙げられる。
【0005】こういった状況の中、利用者はFターム以
外の検索項目を使った検索で回答を作成し、その中で付
与されているFタームの個々のタームの出現頻度を手作
業で集計し、その後ガイダンス・データやFターム・リ
スト表等で分類内容を確認し、自己の調査に利用できる
Fタームを探している。また、上述の作業により選択し
たFタームが他の検索項目のタームとどのような関係に
あるのかを確認することにより、論理積演算や論理否定
演算の候補となるタームを見つけだし、Fターム単独の
場合よりノイズと漏れの少ない検索を行うための準備性
を高めることができるが、そういった調査についても利
用者は手作業で行っている。
【0006】
【発明が解決しようとする課題】このように、大量の情
報の中から、検索で用いたキーワード以外の、より良い
と思われる検索ターム(例えばFターム)を探すことが
できることが求められている。本発明は、検索結果か
ら、例えば、より良い検索タームを選択できるような情
報を利用者に示すことができるシステムを提供すること
である。さらに、例えば、キーワード検索による検索集
合をベースにして、検索集合より得た検索ターム情報を
用いて、前記ベースに対し検索タームによる検索集合を
追加したり、削除したりすることにより、調査目的に合
致した検索集合を得ることができるシステムを提供する
ことである。これにより、熟練したサーチャーが調査目
的に応じて、キーワード検索、分類検索等を組合せて作
成した検索式による検索集合と同等の検索集合を容易に
得ることができる。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、ある検索結果の集合に対して、検索項目
を指定し、前記集合に付与されている前記指定された検
索項目のタームを頻度を付して表示し、表示されたター
ムを、検索に使用すること、そして、検索結果の集合
と、表示されたタームによる検索による集合との論理演
算を行うこともできる。これにより、頻度順に表示され
た各タームの集合の論理演算等も可能となり、再度の検
索が容易となるとともに、検索集合を拡大、縮小して調
査の目的に応じた検索集合の作成が容易に行うことがで
きる。
【0008】また、検索システムにおいて、ある検索結
果の集合に対して、検索項目を指定し、前記集合に付与
されている前記指定された検索項目のタームを頻度を付
して表示し、表示されているタームに対して、さらに項
目を指定して、付与されているタームを頻度を付して表
示することを特徴とする。これにより、検索結果から、
再度検索を行うべき項目との相関を見ることができ、タ
ームの選択を容易に行うことができる。
【0009】前記指定項目のタームを表示するとき、タ
ームの説明を付加して表示することができ、前記指定項
目のタームは階層構造を有している場合は、階層の上位
から順に説明を表示することもできる。さらに、前記表
示するタームの説明に対して、もととなる検索結果を得
るのに用いられたタームを区別して表示することもでき
る。これらにより、タームの理解が容易となり、再度の
検索に使用するべきタームの選択を行うことが容易であ
る。これらのことをコンピュータ・システムに実現する
ことができるプログラムを格納した記録媒体も本発明で
ある。
【0010】
【発明の実施の形態】本発明の実施形態を、図面を参照
して詳細に説明する。本発明を日本の特許文献の検索を
例に説明する。この検索システムの構成例を図1に示
す。図1は、ホスト側のシステム130とユーザ側のシ
ステム100,110とを公衆回線等のデータ通信12
0により結合したオンライン・システムを示している。
ホスト・システム130は、ホスト・コンピュータ13
3,ファクシミリ装置131,通信制御装置132,お
よび特許文献等のデータ・ファイル134で構成されて
いる。また、ユーザ・システム100は、パソコン等の
端末機102,モデム106、およびファクシミリ10
4等で構成されている。なお、端末機には、例えばプリ
ンタ108等の他の周辺機器を含むことができる。端末
機102は、モデム106およびデータ通信120を介
して、ホスト・システム130と結合されている。ユー
ザは端末機を用いることにより、ホスト・システム13
0内のデータ・ファイル134中の例えば特許ファイル
のデータを、ホスト・コンピュータ133に対してコマ
ンド等を送ることにより検索して、検索結果を受け取る
ことができる。その検索結果の公報等をファクシミリ1
04で受け取ることもできる。
【0011】さて、このような検索システムにおいて、
本発明の検索処理を図2の操作フローおよび図3〜図9
に示すような、例えばWebのブラウザを用いたGUI
(Graphical User Interface)による表示画面の例を用
いて説明する。なお、このシステムは、コマンド入力方
式でもGUIでも同様に動作する。図2において、ユー
ザはまず、検索内容に即した技術用語を用いて、キーワ
ードによる検索を行う(S202)。例えば、「電動モ
ータ付き自転車」について検索する場合、図3に示され
ているように、端末機102に表示されている検索画面
に対して、キーワード検索を指示するために、検索のた
めの論理式「電動*モータ*自転車」と入力して、これ
をホスト・システム130へ送信する。
【0012】ホスト・システム130は検索処理を行
い、特許ファイルから指定されたキーワードが付与され
た文献の集合(S1)を作成して、結果を端末機102
に表示する。これを示したのが図4である。この文献の
集合(S1)に対して、本発明の処理である頻度順の並
べ替え、すなわちランク処理を行うのである。その処理
を行うためには、例えばコマンド(RANK)を打ち込
むか、画面上のメニュー(図示せず)を選択することに
より行う(S204)。メニューを選択して、ランク処
理の指定したときの画面表示例が図5に示されている。
【0013】ランク処理は、検索結果の集合(S1)の
特許文献に付けられている、例えば Fターム(テーマまで,観点まで,タームコードま
で) FI(メイングループまで,展開記号まで,全桁) IPC(メイングループまで,全桁) 固定キーワード(他の特許分類では検索しにくい特定
の技術テーマについて検索効率を高める目的で設定した
コード) 広域分類(機能分類的なIPCとは異なる観点を創出
するため、産業分類と社会的に関心を集めている大型技
術の分類を併合した分類) 出願人(コード,名称) 発明者 のような検索項目のタームを頻度を付して表示すること
である。このタームを頻度順に並べ替えて表示すること
もできる。これにより、検索結果の文献集合に対して、
どの様なタームが、どの程度の頻度で付与されているか
の情報を利用者に提供することができる。なお、このと
き、対象の検索結果の集合の文献数は、例えば1万件を
限度として、これ以上の数の集合に対してランク処理の
指示がされたときは、ランク処理ができない旨の表示を
出すようにしてもよい。
【0014】ランク処理を行うことが指示されると、図
5に示されているように、ランク処理の指示は検索結果
の集合S1を指定し、次に、ランク処理対象とする項目
等を指定して、「ランク処理実行」のボタンをクリック
することにより、指定された母集団に対してランク処理
が行われる。このときに、表示されるタームの最大件数
やタームの表示順序も指定することができる。なお、タ
ーム表示の最大は、この実施形態では100件までであ
る。各指定項目は、図5(b)に示されているように、
プルダウン・メニューから指定することができる。ラン
ク処理対象とする項目としてFタームを指定するとき
は、その対象とするレベルとして、Fタームのテーマコ
ードまで、各テーマ内の観点まで、そして、タームコー
ドまでと指定することができる。また、FIを指定する
ときは、メイングループまで対象とするか、展開記号ま
で対象とするか、全桁を対象とするかを選択することが
できる。出願人や発明者でもランク処理を行うことがで
きる。表示順序も高頻度順、低頻度順、文字コード順を
選択することができる。図5で指定が終了し、「ランク
処理実行」のボタンがクリックされると、これらの指定
をホスト・システムへ送信することで、ランク処理の指
示を行う。
【0015】図6は、ホスト・システム130で行われ
たランク処理の結果の端末機102における表示(S2
06)の例である。図6は、Fタームのテーマコードの
頻度順の表示を示している。図6において、例えばテー
マコード「5H115」の頻度(文献数および%)の数
字と棒グラフ、説明としてテーマ名を表示する。以下、
「3D011」,「3D035」,「5G003」,
「5H020」,「5H111」,「5H570」,
「5H623」,「5H030」,「3D012」と、
指定した頻度の高い上位10のテーマコードを、頻度と
ともに表示している。なお、頻度の表示は件数、全体に
対する%、棒グラフで表示しているが、これらの少なく
とも1つが表示されていればよい。また、相関表示も行
うことができる。この相関表示とは、例えば、最大の頻
度である「5H115」の50件の特許文献に対して、
例えば上述のからに示した項目の1つを指定して指
示を行い(S208)、その項目におけるタームを表示
できる(S210)ことである。頻度を付し、その頻度
順に並べ替えて表示することもできる。これは図6にお
いて、「さらにランク処理を行う」のボタン602をク
リックすると、図7[I]に示したような入力のための
ウインドウが現れて、ランク処理対象のターム(番号で
指定)の相関表示を行う項目、打ち切り件数(文字指定
しない場合は100)、タームの表示順序(高頻度順:
T,低頻度順:B,文字コード順:C)等を指定するこ
とで行う。この相関表示の指示はサブコマンド(CO
R)で指定してもよい。
【0016】図6におけるテーマコード「5H115」
(50件)に対して、FIの展開記号までに関して相関
表示を行った場合の表示を示したのが、図8である。こ
の相関表示の指定は、相関表示されたタームに対して、
何重にも行うこともできる。したがって、相関表示を行
っている図8においても、「さらにランク処理を行う」
ことが指定できるボタン802が表示されている。図8
において、例えばFIのように、階層的に分類が定義さ
れている場合、単にFI自体の説明ばかりでなく、その
上位階層の説明を階層の順に表示しないと理解できない
ことが多い。図8において、例えば「B62M23/0
2N」のFIを理解するためには、そのサブクラスであ
る「B62M」の説明、その中のメイングループである
「B62M23/00」の説明、次の階層であるサブグ
ループ「B62M23/02」の説明、その次の階層で
ある「B62M23/02H」、そして、最終的に「B
62M23/02N」を順に表示して、初めて「B62
M23/02N」の意味を理解することができる。この
ように階層的に定義されている分類等を表示するための
処理は、後で詳しく説明する。さて、図6において、キ
ーワード検索で用いたワード(この場合、「電動」,
「モータ」,「自転車」)が説明の文章に現れたら、そ
のタームを、例えば色を変える等でそれに注目できるよ
うに表示することもできる。この様に、キーワード検索
で用いられているワードを区別できるように表示するこ
とは、図8に示したFIの表示においても適用すること
ができる。
【0017】図6に示したランク表示された結果を後で
用いるために、回答集合(例えば図4で、S1と名付け
られた集合と同じもの)を作成することができる(S2
12)。これは、図6において、「回答集合を作成す
る」のボタン604をクリックすると、図7[II]
(a)に示す入力のウインドウが開いて、回答集合を作
成するタームを番号で入力することで行われる。このと
き、ターム同士の論理演算も指定することもできる。次
に開かれる図7[II](b)において「回答集合作成」
のボタンをクリックすると、指定されたタームが付与さ
れている特許文献に対して指定された論理演算を行って
集合を作成し、その集合に対して一連の集合に対する番
号を付与する(S214)。そして、出力・検索・登録
保存作業が行える状態(S216)となる。これらは、
サブコマンド(SET)により行っても同じ処理が行わ
れる。また、各処理のところでEND(処理中止のサブ
コマンド:図示せず)しても、出力・検索・登録保存作
業を行うコマンド待ちの状態(S216)となる。この
回答集合を作成する処理は、相関表示を行ったときにも
行うことができる。このため、相関表示を示している図
8において、「回答集合を作成する」のボタン804が
表示されている。このボタン804をクリックすると、
図7[II](a)と同様のウインドウが開く。
【0018】回答集合を作成する際に、検索対象を拡大
縮小するような演算を指定することができる。この処理
を、図7[II](b)において「検索対象拡縮」を指示
したときに開かれるウインドウである、図7[II]
(c)に示す入力画面を用いて説明する。さて、ユーザ
には、 ノイズは許容できるが漏れは極力少なくしたいという
ニーズ スバリ同一のものがあれば調査を打ち切り、無い場合
には蓋然性の高い集合の順にサーチ範囲を広げていくと
いうニーズ があると思われる。特許文献における検索では、は、
例えば研究開発テーマの特許マップを作成するような場
合に必要とされる。また、は、例えば特許異議や無効
の申立の証拠を探すような場合に必要とされる。この検
索システムでは、ランク処理の結果も有効に用いて、こ
れらのニーズを満たすために検索対象の拡縮を行えるよ
うにしている。すなわち、のようなニーズに対して
は、異なる検索結果で得られる文献全てをあわせた集合
とする。また、のような場合は、複数の検索結果のオ
ーバラップ部分(蓋然性が一番高いと思われる部分)か
ら集合を作成することによりニーズに対応する。図7
[II](c)は、これらの処理を指定するための入力画
面である。
【0019】図7[II](c)において、集合A+Bは
最初に指定した検索式による母集合(例えば図4の集合
S1の408件)を示している。集合B+Cはランク処
理を行う様に指定した検索タームによる集合(例えば、
図5で指定したFタームテーマの上位10テーマ中に含
まれる文献数)を示している。集合Bは、母集合のうち
指定されたタームも付与されている集合(例えば、図6
で示される文献)である。このような意味を有する各領
域A,B,Cを以下に示す組合せで指定できるようにし
て、上述のニーズに合わせて検索対象の拡張縮小の処理
を行い、これに対して回答集合の指定を行えるようにす
る。 Aのみ指定(母集団から指定したタームを論理否定演
算) Bのみ指定(母集団と指定したタームとを論理積演
算) BおよびCを指定(指定したタームでデータベース全
体を検索) Cのみ指定(指定したタームでデータベース全体を検
索した結果から母集合を論理否定演算) A,B,C全てを指定(指定したタームでデータベー
ス全体を検索した結果と母集合とを論理和演算) なお、上記以外の組合せは選択できないようにすること
もできる。このようにして、ランク処理で得られたター
ムを用いて、拡張縮小して検索を行えるようにしてい
る。
【0020】図9は、図3〜図5で説明したキーワード
検索「電動*モータ*自転車」の集合S1に対して、他
のランク処理(Fタームのタームコードまでを指定)を
行った場合を示している。Fタームも、階層的に分類が
定義されているので、その説明の表示は階層の上位から
順次行っている。例えば、Fターム「3D011AG0
2」は、「3D011自動自転車,自転車一般」(テー
マコード),「AG00車種」(観点),「・補助原動
機付自転車」(タームコード)として表示される。図9
のFタームの説明を表示する場合も、最初のキーワード
検索に用いたターム(電動,モータ,自転車)を区別し
て表示することができる。
【0021】図10は、ランク処理の1例を示したフロ
ーチャートである。図4〜図7に示した、キーワードで
特定した集合S1に対して、Fタームのテーマコードに
関するランク処理を指定した場合を例に、図10のフロ
ーチャートに示した処理を説明する。図10において、
ランク処理が開始されると、集合S1内の文献番号を用
いて、特許のファイル(データベース)にアクセスし
て、指定されたFタームのテーマコードを取りに行く
(S302)。各文献に対して、Fタームは10桁でデ
ータベースに格納されており、テーマを取りに行く場
合、その上位5桁を読み出し、バッファに格納する。1
文献に同一のテーマコードのFタームが複数ついている
ことが多いので、1文献について同じテーマコードは1
つとしてバッファに格納する(S304)。これは、同
一文献について同じテーマコードを複数回カウントする
ことのないようにするためである。これを集合S1に含
まれる文献全てに対して行う(S306)。これで、バ
ッファには、各文献に対して付与されているテーマコー
ドが格納されていることになる。このバッファ内のテー
マコード(ターム)をソートする(S308)と、同一
のテーマコードの数が文献数となる。この同一のテーマ
コード(ターム)の個数を数えながら、同一のテーマコ
ードは1つとしてまとめる(S310)。そして、ター
ムを個数で、指定された順(頻度の高い順)にソートし
て(S312)、表示する(S314)。なお、さらに
ランク処理を行う場合は、図10のフローチャートにお
いて、対象とする集合を、さらにランク処理するターム
に対応するものとして、同様の処理を行っている。
【0022】さて、図8および図9に示したように、階
層的に定義されている分類タームの説明を上位の階層の
説明から順次に表示する処理を、図11〜図13を用い
て説明する。図11は、説明の例としたテーマコード5
H115のFタームの説明文に関するデータ(分類テー
ブル)を示している。図12は、このような階層構造の
分類の説明を上位の階層の説明から順次表示するための
処理を示すフローチャートである。図13は、図11に
示した5H115のFターム「5H115BC07」を
図12に示したフローチャートによる処理により、どの
様にして上位の階層の説明から順次表示できるようにし
ているかを説明するための表である。
【0023】図11により、Fタームの階層構造につい
て説明する。Fタームは、各テーマコード(5H11
5:電気的推進車輌の制御)ごとに、ドットの数で示さ
れている階層構造を有している。例えば、「5H115
BC00車輌への電力供給」は、ドット数は0で、階層
は、テーマコード(5H115)中では最上位である。
次の階層としては、ドットの数1の「5H115BC0
1・車輌の外部から電力が供給されるもの」や「5H1
15BC05・車輌の内部に電力供給源があるもの」等
がある。各ドット1の階層の下には、ドット2の階層が
展開されている。このように、Fタームでは、ドットの
数で階層構造が示されている。
【0024】このように、例えばドットの数で階層構造
を示している場合の説明文の表示処理を、具体的なドッ
トの数3の「5H115BC07」を例に、図12のフ
ローチャートおよび処理過程の示した図13の表を用い
て説明する。表示処理を開始すると、表示する分類ター
ム(5H115BC07)を受け取り、分類テーブル
(図11)を参照するテーブル参照キーに設定する(S
402)。図13の表では「テーブル参照キー」の欄に
「5H115BC07」がセットされている。この参照
キー(5H115BC07)で分類テーブルをサーチし
て(S404)、説明文「・・・二次電池を用いるも
の」を読み出す。この説明文のドットの数を読み取り、
「0」でない(S406で偽)ならば読み出した説明文
を作業領域の先頭に格納している(S408)。図13
の表では、「ドット」の欄に「5H115BC07」の
説明文のドット数から「3」を格納し、ドットの数が0
でないと判断して(S406)、「出力用説明文の作業
領域」に読み出した「5H115BC07」の説明文を
格納している様子を示している(S408)。この「ド
ット」の欄に格納されているドットの数(階層の深さを
示す)により、以後の処理を行う。
【0025】次に、テーブル参照キーを用いて、このテ
ーブル参照キーに最も近い位置にある、1つ上位の分類
タームをサーチし、その分類タームを新たなテーブル参
照キーに設定(S410)する。そのテーブル参照キー
で分類テーブルをサーチして(S404)、説明文を読
み出し、その説明文のドットの数を読み取り、「0」で
ない(S406で偽)ならばその説明文を作業領域の先
頭に追加(S408)する。このようにして、階層の深
さを示しているドットの数が「0」(S406で真)と
なるまで、取り出したテーブル参照キーを用いて、その
上位階層に対応する説明文を取り出して、取り出した説
明文を追加する(S408)処理を行う。その処理過程
を図13で詳しく説明する。図13において、テーブル
参照キー「5H115BC07」の1つ上の階層の「5
H115BC06」を設定し(S410)、対応する説
明文「・・電池によるもの」を読み出して、その説明文
のドットの数が0ではないので(S406)、作業領域
の先頭に追加している(S408)。同様に、参照キー
「5H115BC05」を設定し(S410)、対応す
る説明文「・車輌の内部に電力供給源があるもの」を読
み出し、ドットの数が0ではないので(S406)、作
業領域の先頭に追加している(S408)。図12のフ
ローチャートで、参照した説明文の階層が「0」(S4
06で真)となり、アクセスして読み出した説明文を先
頭に追加して編集(S412)後、編集した説明文を出
力(S414)して、この分類タームに関する処理を終
了する。図13における表では、参照キー「5H115
BC00」を設定して(S410)、参照キー「5H1
15BC00」に対応する説明文「車輌への電力供給」
を読み出し、ドットの数が0であるので(S406)、
作業領域で編集後(S412)に、作業領域の説明文を
出力する(S414)ことに対応する。なお、図6,図
8,および図9においてはタームの説明を付けて表示し
ているが、タームの説明を付加せずにランク処理の結果
を表示させることも可能である。
【0026】上述で説明したデータ集計・参照型検索
は、通常のキーワード検索により検索集合を形成し、検
索集合中の各文献に付与されている分類項目(IPC,
FIおよび Fターム)等を調査することにより、目的
とする分類タームを探し出そうとするものである。キー
ワードによる検索集合には、ノイズ文献と正しい文献と
が混在している。それらの文献には分類が付与されてお
り、これらの文献を分類項目別に整理すると、正しい文
献の分類タームとノイズ文献の分類タームよりなる分類
ターム群として捕えることができる。正しい文献の分類
タームとノイズ文献の分類タームの識別は、分類ターム
の説明文および、分類タームの文献分布から識別するこ
とができる。実際には、分類タームの調査は、分類ター
ム別の説明文一覧および分類タームの文献分布より、目
的とする文献が含まれている蓋然性の高い分類タームを
定め、分類タームが付与された個々の文献によりその正
当性を評価・検証している。これで、正確に定義された
分類によるタームで検索することができ、より漏れやノ
イズの少ない検索ができることになる。また、統計処理
もランク処理を用いて行うことができる。また、上述の
ように、階層的に定義された分類タームを、上位階層の
説明文から順次表示することにより、正確な分類の定義
を理解することができる。
【0027】本発明は、図1に示したオンライン・検索
システムばかりではなく、例えば、CD−ROM等に格
納されたデータベースに対する検索に使用されるスタン
ド・アローンのコンピュータ・システムにも適用するこ
とができる。また、複数のシステムから構成される、例
えばクライアント・サーバ・システム等に適用してもよ
い。本発明に関するプログラムを格納した記憶媒体か
ら、プログラムをシステムで読み出して実行することに
より、本発明の構成を実現することができる。この記録
媒体には、磁気ディスク、フロッピー・ディスク、CD
−ROM、磁気テープ、ROMカセット等がある。
【0028】
【発明の効果】上述したように、本発明を用いることに
より、特定の回答を対象にして、例えば検索に用いたキ
ーワードとは異なる分類によるタームを、頻度を付して
表示しているので、利用者が分類タームの選択のために
行う集計作業の精度を向上させ、労力および時間を大幅
に軽減できる。また、選択した分類によるタームを基
に、それ以外の分類項目(または検索項目)についてタ
ームの付与状況を確認する方法を提供することにより、
迅速に他の分類との関係が把握できる。出力時に分類タ
ームの説明文を一緒に表示することにより、調査対象と
その分類タームの関係およびその分類タームの持つ影響
範囲を迅速かつ的確に把握できる。内容説明付きで表示
される分類タームから回答集合が作成できるようにする
ことにより、その後の出力・検索・登録保存の作業を連
続して行うことができる。上述の処理を一連で行えるよ
うにすることで、ある分類体系により定義されたターム
検索の作業に必要な労力および時間を大幅に削減し、分
類によるタームを用いた検索を容易に行うことができ
る。タームの説明に用いられている文章に対して、検索
に用いたキーワードを、他の単語と区別して表示してい
るので、関連があるタームを見つけやすい。
【図面の簡単な説明】
【図1】本発明が実施される検索システムの構成例を示
す図である。
【図2】本発明の実施形態の操作の手順を示すフローチ
ャートである。
【図3】検索式を入力するために端末に表示される画面
の例を示す図である。
【図4】ランク処理対象のワードを入力し、回答が得ら
れた画面の例を示す図である。
【図5】ランク処理を指定する画面の例を示す図であ
る。
【図6】ランク処理結果を表示した画面の例を示す図で
ある。
【図7】さらにランク処理を行う場合および回答集合作
成を行う場合の入力画面の例を示す図である。
【図8】さらなるランク処理を行った結果を表示した画
面の例を示す図である。
【図9】他のランク処理結果を表示した画面の例を示す
図である。
【図10】ランク処理を説明するフローチャートであ
る。
【図11】階層をもった分類体系(Fターム)の例を示
す図である。
【図12】階層を有する分類タームの説明を順に表示す
るための処理を示すフローチャートである。
【図13】階層を有する分類タームの説明を表示する処
理を説明するための表である。
フロントページの続き (72)発明者 染谷 弘祐 東京都江東区東陽4丁目1番7号 佐藤ダ イヤビルディング 財団法人 日本特許情 報機構内 (72)発明者 中谷 洋一 東京都江東区東陽4丁目1番7号 佐藤ダ イヤビルディング 財団法人 日本特許情 報機構内 Fターム(参考) 5B075 ND03 NR05 NR15 PP26 PQ02 PQ34 PQ40

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 データ集計・参照型検索システムであっ
    て、 ある検索結果の集合に対して、検索項目を指定される
    と、前記集合に付与されている前記指定された項目のタ
    ームを、頻度を付して表示し、 前記表示された各タームを用いて、検索に使用すること
    ができる集合を作成することを特徴とするデータ集計・
    参照型検索システム。
  2. 【請求項2】 請求項1記載のデータ集計・参照型検索
    システムにおいて、前記検索に使用することができる集
    合を作成するとき、前記検索結果の集合と、前記表示さ
    れたタームによる検索による集合との論理演算を行うこ
    とを特徴とするデータ集計・参照型検索システム。
  3. 【請求項3】 データ集計・参照型検索システムであっ
    て、 ある検索結果の集合に対して、検索項目を指定される
    と、前記集合に付与されている前記指定された項目のタ
    ームを、頻度を付して表示し、 表示されているタームに対して、さらに検索項目を指定
    して、付与されているタームを頻度を付して表示するこ
    とを特徴とするデータ集計・参照型検索システム。
  4. 【請求項4】 請求項1〜3いずれか記載のデータ集計
    ・参照型検索システムにおいて、 前記指定項目のタームを表示するとき、タームの説明を
    付加して表示することを特徴とするデータ集計・参照型
    検索システム。
  5. 【請求項5】 請求項4記載のデータ集計・参照型検索
    システムにおいて、 前記指定項目のタームは階層構造を有し、前記付加され
    て表示する説明は、階層の上位から順に表示することを
    特徴とするデータ集計・参照型検索システム。
  6. 【請求項6】 請求項1〜5いずれか記載のデータ集計
    ・参照型検索システムにおいて、 前記表示するタームの説明に対して、もととなる検索結
    果を得るのに用いられたタームを区別して表示すること
    を特徴とするデータ集計・参照型検索システム。
  7. 【請求項7】 請求項1〜6記載の検索システムをコン
    ピュータ・システムに実現することができるプログラム
    を格納した記録媒体。
JP11228918A 1999-08-12 1999-08-12 データ集計・参照型検索システム Pending JP2001052022A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11228918A JP2001052022A (ja) 1999-08-12 1999-08-12 データ集計・参照型検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11228918A JP2001052022A (ja) 1999-08-12 1999-08-12 データ集計・参照型検索システム

Publications (1)

Publication Number Publication Date
JP2001052022A true JP2001052022A (ja) 2001-02-23

Family

ID=16883904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11228918A Pending JP2001052022A (ja) 1999-08-12 1999-08-12 データ集計・参照型検索システム

Country Status (1)

Country Link
JP (1) JP2001052022A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009169927A (ja) * 2008-03-31 2009-07-30 Ricoh Co Ltd 情報検索装置、情報検索方法、制御プログラム
JP2010237848A (ja) * 2009-03-30 2010-10-21 Nomura Research Institute Ltd アイデア整理支援装置、アイデア支援方法およびコンピュータプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009169927A (ja) * 2008-03-31 2009-07-30 Ricoh Co Ltd 情報検索装置、情報検索方法、制御プログラム
JP2010237848A (ja) * 2009-03-30 2010-10-21 Nomura Research Institute Ltd アイデア整理支援装置、アイデア支援方法およびコンピュータプログラム

Similar Documents

Publication Publication Date Title
US7096218B2 (en) Search refinement graphical user interface
JPH11110414A (ja) データベースからテキストを検索するための方法および装置
JPH0424869A (ja) 文書処理システム
JPH11110413A (ja) データベース検索結果を生成するための方法および装置
JP2000010986A (ja) ドキュメントデータベースの検索支援方法とそのプログラムを記憶した記憶媒体
JPH0581326A (ja) データベース検索装置
JP3531344B2 (ja) 情報検索装置
JP2001052022A (ja) データ集計・参照型検索システム
JPH11338873A (ja) 再検索方法及び装置及び再検索プログラムを格納した記憶媒体及び追加検索語候補提示方法及び装置及び追加検索語候補提示プログラムを格納した記憶媒体
JP2001005830A (ja) 情報処理装置及びその方法、コンピュータ可読メモリ
JP2962287B2 (ja) 構造化文書検索装置及びプログラムを記録した機械読み取り可能な記録媒体
JPH03286371A (ja) 文書情報検索装置
JPH05314181A (ja) 情報検索装置
JPH08212230A (ja) 文書検索方法及び文書検索装置
JPH10260981A (ja) 情報処理装置および情報処理方法
JPH07296005A (ja) 日本語テキスト登録・検索装置
JPH09146968A (ja) 文書検索方法
JP4248828B2 (ja) 文書処理装置、文書処理方法及び記録媒体
JPH09269952A (ja) 文書検索装置及びその方法
JP2005092824A (ja) 文書検索装置、文書検索方法、文書検索プログラム、および記録媒体
JP2601139B2 (ja) 文字列検索装置
JP2004178180A (ja) 全文検索情報の登録及び検索方式
JPH07129554A (ja) 文書処理装置
JPH10307849A (ja) 検索用のキーワードの決定方法及び装置、文書検索装置、記録媒体
JP2000348055A (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体