JP4817585B2 - 属性情報検索装置、属性情報検索方法およびその方法をコンピュータに実行させるプログラム - Google Patents
属性情報検索装置、属性情報検索方法およびその方法をコンピュータに実行させるプログラム Download PDFInfo
- Publication number
- JP4817585B2 JP4817585B2 JP2002181951A JP2002181951A JP4817585B2 JP 4817585 B2 JP4817585 B2 JP 4817585B2 JP 2002181951 A JP2002181951 A JP 2002181951A JP 2002181951 A JP2002181951 A JP 2002181951A JP 4817585 B2 JP4817585 B2 JP 4817585B2
- Authority
- JP
- Japan
- Prior art keywords
- bibliographic
- records
- bibliography
- attribute information
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
この発明は、対象物の属性情報からなる複数のレコードを保持するデータベースから任意のレコードを検索する属性情報検索装置、属性情報検索方法およびその方法をコンピュータに実行させるプログラムに関する。
【0002】
【従来の技術】
公立図書館や大学図書館などで従来から運用されている文献検索システムでは、一つの図書館だけでなく、たとえば同一県内や同一区内の他の図書館、提携している他大学の図書館などの所蔵文献も検索できるのが普通である。
【0003】
相互に蔵書を検索可能な図書館は、それぞれ自館の蔵書に関する属性情報、具体的には書名や著者名などからなる書誌データを、複数館で共用される総合目録データベースに登録している。このデータベースは、通常は中核となるいずれか一つの図書館(「○○県立中央図書館」など)に設置され、他館の利用者は当該他館に設置された専用端末から、専用線を通じて上記データベースにアクセスし、キーワードによる文献検索などをおこなうことができる。
【0004】
【発明が解決しようとする課題】
ただ、総合目録データベースは各図書館の職員が各館の端末からそれぞれ更新してゆくので、必ずしも個々のレコードの表現形式が統一されているとは限らない。
【0005】
明らかな入力ミスや入力漏れはもちろんであるが、場合によっては図書館ごとに書誌データのフォーマットが異なっていることもある。国内の図書館で広く採用されているデータフォーマットには、「国立国会図書館ジャパン・マーク審議会」による「JAPAN/MARC」のほか、民間の「(株)図書館流通センター」により独自に拡張された「TRC MARC」などがあり、それぞれの中でもバージョンによる微妙な差異がある。そのため同一の表記で入力したデータでも、各図書館の採用するシステムによって異なるデータに変換されてしまうことがある。
【0006】
そしてこうしたばらつきがあると、総合目録データベースの検索結果中には各館がそれぞれ所蔵する同一の書籍のうち、レコードの表現形式が検索条件に完全に一致した一部のもののみが含まれることになり、検索に漏れが生じてしまう。また、たとえば書名中のキーワードで検索をかけた場合に、同一書籍の様々な版(第一版、第二版など)のレコードや、当該書籍の版数の明示されていないレコードなどが個別にリストアップされ、検索結果が見にくくなってしまうという問題点があった。
【0007】
この発明は上記従来技術による問題を解決するため、同一の対象物について類似する複数のレコードが存在するようなデータベースの検索においても、漏れなくかつ見やすい検索結果を得ることが可能な属性情報検索装置、属性情報検索方法およびその方法をコンピュータに実行させるプログラムを提供することを目的とする。
【0008】
【課題を解決するための手段】
上述した課題を解決し、目的を達成するため、また、この発明にかかる属性情報検索装置は、対象物の属性情報からなる複数のレコードを保持するデータベースから任意のレコードを検索する属性情報検索装置において、入力された検索条件に合致するレコードを前記データベースから検索する検索手段と、前記検索手段により検索されたレコード間の類似度を算出する算出手段と、前記算出手段により算出された類似度が所定の閾値を超えた複数のレコードを一グループとして抽出する抽出手段と、前記抽出手段により抽出されたグループ内のレコードのうち、指定された複数のレコードを関連づけて登録する登録手段と、を備えたことを特徴とする。
【0009】
この発明によれば、対象物を同一とする複数の類似したレコードは一つのグループにまとめられるとともに、以後のキーワード検索などにおいて単一のレコードに準じた扱いをなされることになる。
【0010】
また、この発明にかかる属性情報検索装置は、上記の発明において、前記登録手段が、前記抽出手段により抽出されたグループ内のレコードのうち、指定された複数のレコードを関連づけて登録するとともに、当該複数のレコードのうちいずれか一つを代表として登録することを特徴とする。
【0011】
この発明によれば、対象物を同一とする複数の類似したレコードは、そのうち一つを代表とする一つのグループにまとめられるとともに、以後のキーワード検索などにおいて単一のレコードに準じた扱いをなされることになる。
【0012】
また、この発明にかかる属性情報検索装置は、上記の発明において、さらに、前記登録手段により関連づけて登録された複数のレコードのうち、指定された複数のレコード以外のレコードを関連づけて登録する再登録手段を備えたことを特徴とする。
【0013】
この発明によれば、グループの広狭すなわち当該グループにどのレコードを含ませるかは任意に調整することができる。
【0014】
また、この発明にかかる属性情報検索方法は、対象物の属性情報からなる複数のレコードを保持するデータベースから任意のレコードを検索する属性情報検索方法において、入力された検索条件に合致するレコードを前記データベースから検索する検索工程と、前記検索工程で検索されたレコード間の類似度を算出する算出工程と、前記算出工程で算出された類似度が所定の閾値を超えた複数のレコードを一グループとして抽出する抽出工程と、前記抽出工程で抽出されたグループ内のレコードのうち、指定された複数のレコードを関連づけて登録する登録工程と、を含んだことを特徴とする。
【0015】
この発明によれば、対象物を同一とする複数の類似したレコードは一つのグループにまとめられるとともに、以後のキーワード検索などにおいて単一のレコードに準じた扱いをなされることになる。
【0016】
また、この発明にかかる属性情報検索方法は、上記の発明において、前記登録工程では、前記抽出工程で抽出されたグループ内のレコードのうち、指定された複数のレコードを関連づけて登録するとともに、当該複数のレコードのうちいずれか一つを代表として登録することを特徴とする。
【0017】
この発明によれば、対象物を同一とする複数の類似したレコードは、そのうち一つを代表とする一つのグループにまとめられるとともに、以後のキーワード検索などにおいて単一のレコードに準じた扱いをなされることになる。
【0018】
また、この発明にかかる属性情報検索方法は、上記の発明において、さらに、前記登録工程で関連づけて登録された複数のレコードのうち、指定された複数のレコード以外のレコードを関連づけて登録する再登録工程を含んだことを特徴とする。
【0019】
この発明によれば、グループの広狭すなわち当該グループにどのレコードを含ませるかは任意に調整することができる。
【0020】
また、この発明にかかるプログラムによれば、上記のいずれか一つに記載された方法がコンピュータによって実行される。
【0021】
【発明の実施の形態】
以下に添付図面を参照して、この発明による属性情報検索装置、属性情報検索方法およびその方法をコンピュータに実行させるプログラムの好適な実施の形態を詳細に説明する。
【0022】
(ハードウエア構成)
まず、図1はこの発明の実施の形態による属性情報検索装置のハードウエア構成を示す説明図である。なお、上記装置は通常は、相互に検索可能な複数の図書館のうち中核となる図書館に設置される。
【0023】
図1において、101は装置全体を制御するCPUを、102は基本入出力プログラムを記憶したROMを、103はCPU101のワークエリアとして使用されるRAMを、それぞれ示している。
【0024】
また、104はCPU101の制御にしたがってHD(ハードディスク)105に対するデータのリード/ライトを制御するHDD(ハードディスクドライブ)を、105はHDD104の制御にしたがって書き込まれたデータを記憶するHDを、それぞれ示している。また、106はCPU101の制御にしたがってFD(フレキシブルディスク)107に対するデータのリード/ライトを制御するFDD(フレキシブルディスクドライブ)を、107はFDD106の制御にしたがって書き込まれたデータを記憶する着脱自在のFDを、それぞれ示している。
【0025】
また、108はカーソル、メニュー、ウィンドウ、あるいは文字や画像などの各種データを表示するディスプレイを、109は通信ケーブル110を介してLANやWANなどのネットワークに接続され、当該ネットワークとCPU101とのインターフェースとして機能するネットワークI/Fを、それぞれ示している。
【0026】
また、111は文字、数値、各種指示などの入力のための複数のキーを備えたキーボードを、112は各種指示の選択や実行、処理対象の選択、マウスポインタの移動などをおこなうマウスを、それぞれ示している。また、113は着脱可能な記録媒体であるCD−RWを、114はCD−RW113に対するデータのリード/ライトを制御するCD−RWドライブを、100は上記各部を接続するためのバスまたはケーブルを、それぞれ示している。
【0027】
(機能的構成)
つぎに、図2はこの発明の実施の形態による属性情報検索装置の構成を機能的に示す説明図である。なお、各部の機能の詳細は主に後述するフローチャートで説明することとし、ここではその概略を述べるにとどめる。
【0028】
図中、200は入力部であり、後述する書誌同定処理や書誌同定解除処理の開始の指示、あるいは当該処理に必要な検索条件の入力などを受け付ける機能部である。
【0029】
また、201は上述の総合目録データベースであり、本装置により検索可能な各図書館の蔵書に関する「書誌データ」と「所蔵データ」とを保持している。「書誌データ」とは図書・雑誌などの資料の詳細情報であって、具体的には書名、著者名、定価、ページ数などである。また、「所蔵データ」とは資料の保管先の詳細情報であって、具体的には各資料を保管する図書館名、開架/書庫の区別などである。なお、「書誌データ」と「所蔵データ」とをまとめて「蔵書データ」と呼ぶ。
【0030】
202は同定候補検索部であり、入力部200から入力した書誌同定処理の開始指示を受けて、同定(同定の意義については後述)の対象となる候補資料のレコードを総合目録データベース201から検索する機能部である。
【0031】
また、203は重みファイルであり、同定候補検索部202が書誌データ間の類似度を算出する際に参照する、書誌データ内の各項目の重みを保持するファイルである。ファイル内に保持された各項目の重みは、入力部200から任意に変更することができる。
【0032】
204は同定解除候補検索部であり、入力部200から入力した書誌同定解除処理の開始指示を受けて、同定解除の対象となる候補資料のレコードを総合目録データベース201から検索する機能部である。
【0033】
205は同定関係ファイルであり、同定候補検索部202が総合目録データベース201から同定すべき一群のレコードを抽出する際、あるいは同定解除候補検索部204が当該データベースからすでに同定された一群のレコードを抽出する際に参照する、レコード間の同定関係の有無を保持するファイルである。この同定関係ファイル205には、同定された複数のレコードからなるグループ、各グループを構成する複数のレコード、および当該複数のレコード中の、グループを代表する一つのレコードが関連づけて保持されている。
【0034】
206はキーワード検索部であり、同定候補検索部202あるいは同定解除候補検索部204からの指示を受けて、指定された項目に指定されたキーワードを含むレコードを総合目録データベース201から抽出する機能部である。
【0035】
207は表示部であり、同定候補検索部202あるいは同定解除候補検索部204による検索結果をディスプレイ108に表示する機能部である。
【0036】
なお、上述した入力部200、同定候補検索部202、同定解除候補検索部204、キーワード検索部206および表示部207の各機能部は、それぞれHD105などからRAM103に読み出されたプログラムの命令にしたがってCPU101が命令処理を実行することにより実現されるものである。このプログラムはHD105のほか、FD107、CD−RW113、CD−ROMあるいはMOなどの各種記録媒体に格納して配布することができ、あるいはネットワークを介して配布することもできる。
【0037】
また、総合目録データベース201はHD105に、重みファイル203と同定関係ファイル205とはHD105から読み出されてRAM103に、それぞれ保持されている。
【0038】
(書誌同定処理)
つぎに、図3はこの発明の実施の形態による属性情報検索装置における、書誌データの同定処理の手順を示すフローチャートである。同定とは、表現形式は異なるが実際には同一の資料を指す複数のレコードを、それぞれ一つのグループにまとめ、各グループの中で代表となるレコードを一つ選出する作業である。なお、以下ではグループの代表として選出されたレコードを「代表書誌」、それ以外のレコードを「非採用書誌」という。
【0039】
入力部200が、操作者による書誌同定処理の開始指示、たとえばディスプレイ108上に表示されたメインメニュー上で「書誌同定」がマウスクリックされたことを検知すると、入力部200からその通知を受けた表示部207は、図4に示すような同定条件入力画面を表示する(ステップS301)。
【0040】
同図に示す画面では、書誌同定の対象となるレコードを絞り込むための諸条件(もしあれば)を入力する。そして、条件を定めたときは総合目録データベース201内のレコードのうち、当該条件に適合するレコードのみ、また特に条件を定めなければ総合目録データベース201内の全レコードが、それぞれ以下に説明する書誌同定の対象となる。
【0041】
すなわち、たとえば図中「書名」の左横のチェックボックス400にチェックを入れ、右横のテキストボックス401に何らかのキーワードを入力し、一致条件を定めた上で「検索」ボタン402をクリックすると(ステップS302:Yes)、入力部200からの通知を受けた同定候補検索部202は、まずキーワード検索部206に指示して、総合目録データベース201から上記条件に適合するレコードを検索させる(ステップS303)。
【0042】
その後、キーワード検索部206により検索されたレコード間の類似度を、重みファイル203に保持された各項目の重みを参照しつつ総当たりで算出する(ステップS304)。
【0043】
たとえば、レコードAとレコードBの類似度は、(AとBの書名間の類似度×書名の重み)+(AとBの著者名間の類似度×著者名の重み)+(AとBの定価間の類似度×定価の重み)+・・・というように、各項目における類似度と当該項目の重みとの積を全項目について加算した値となる。なお、このとき表現形式の異なるレコード同士は、一方の形式をもう一方の形式に合わせる、あるいは双方を共通の形式に変換するなどして、形式上の差異を吸収してから類似度を計算する。
【0044】
もっとも、過去に本フローチャートの処理によって同定されているレコード間の類似度は、改めて算出する必要はない。そのため同定候補検索部202は、類似度の算出に先立って同定関係ファイル205を参照し、類似度を算出しようとする二つのレコードがすでに同定関係にあるかどうかを調べる。そして、まだこれらのレコード間に同定関係がなければ、当該レコードにつき上述の類似度の算出をおこなう。
【0045】
なお、図4の画面で特に条件を入力せずに「検索」ボタン402をクリックすると(ステップS302:No)、同定候補検索部202は総合目録データベース201内の全レコードについて、上記と同様に類似度の算出をおこなう(ステップS304)。
【0046】
次に同定候補検索部202は、類似度が所定の閾値を超えた複数のレコードと、当該複数のレコードのいずれかとすでに同定関係にあるレコード(もしあれば)とからなる、すべてのグループを抽出し(ステップS305)、各グループと当該グループを構成するレコードとを表示部207に引き渡す。表示部207はこれらの情報から、図5に示すような同定候補一覧画面を作成して表示する(ステップS306)。
【0047】
図示する画面では、ステップS305で抽出されたすべてのグループが一覧表示され、いずれかのグループの番号、たとえば図中500がクリックされたことを入力部200から通知されると、次に表示部207は図6に示すような、同定候補詳細画面を表示する(ステップS307)。
【0048】
図示する画面では、指定されたグループを構成する複数のレコードが画面上部に列挙され、そのうち上位二件(候補番号1および2)のレコードの詳細が画面下部に表示される。なお、これは初期状態であって、ドロップダウンリスト600から所望のレコードの候補番号を選択して「表示」ボタン601をクリックすることで、詳細の表示されるレコードを切り替えることができる。
【0049】
図示する画面は、類似度が所定の閾値以上である一群のレコード、すなわち、同一の資料についての重複するレコードである可能性が高い複数のレコードについて、どれが本当に同一の資料のレコードであるかを人手で決定するとともに、そのうち一つを代表書誌として選択するためのものである。
【0050】
操作者は個々の同定候補の詳細を参照して、各レコードの対象物の異同を判断し、同定されるべき候補番号のレコードの「代表書誌」チェックボックスか「非採用書誌」チェックボックスのいずれかにチェックを入れる。
【0051】
なお、グループ内の複数のレコードについて、「代表書誌」チェックボックスに同時にチェックを入れることはできない。また、一つのレコードについて、「代表書誌」チェックボックスと「非採用書誌」チェックボックスとの双方を同時にチェックすることもできない。いずれの場合も「代表書誌は一つだけ選択してください」などのエラーメッセージが表示される。
【0052】
その後、図6の画面で「書誌同定実行」ボタン602をクリックすると、入力部200からの通知を受けた表示部207は、図7に示すような同定確認画面を表示する(ステップS308)。
【0053】
そして、図示する画面で「書誌同定実行」ボタン700がクリックされると、入力部200からその事実を通知された同定候補検索部202は、代表書誌あるいは非採用書誌として選択されたレコードを同定された一群のレコードとして同定関係ファイル205に書き込むとともに、これらのレコードから構成されるグループの代表書誌として、代表書誌に選択されたいずれか一つのレコードを設定する(ステップS309)。
【0054】
そして、同定関係ファイル205の更新が完了すると、同定候補検索部202からの通知を受けた表示部207は、書誌同定処理が正常終了したことを示す「完了しました」などのメッセージを画面表示する(ステップS310)。
【0055】
なお、同定成立後も総合目録データベース201内の所蔵データはそのままとし、書誌データを代表書誌の書誌データに統一する。
【0056】
(書誌同定解除処理)
つぎに、図8はこの発明の実施の形態による属性情報検索装置における、書誌データの同定解除処理の手順を示すフローチャートである。入力部200が、操作者による書誌同定解除処理の開始指示、たとえばディスプレイ108上に表示されたメインメニュー上で「書誌同定解除」がマウスクリックされたことを検知すると、表示部207は図9に示すような同定解除条件入力画面を表示する(ステップS801)。
【0057】
同図に示す画面では、書誌同定解除の対象となるレコードを絞り込むための諸条件(もしあれば)を入力する。そして、条件を定めたときは同定関係ファイル205内に登録されたグループのうち、当該条件に適合するレコードを含むグループ、また特に条件を定めなければ同定関係ファイル205内のすべてのグループが、それぞれ以下に説明する書誌同定解除の対象となる。
【0058】
条件を定めて「検索」ボタン900がクリックされた場合(ステップS802:Yes)、入力部200からの通知を受けた同定解除候補検索部204は、まずキーワード検索部206に指示して、総合目録データベース201から上記条件に適合するレコードを検索させる(ステップS803)。次に、同定関係ファイル205を参照して、キーワード検索部206により検索されたレコードを含むすべてのグループを抽出する(ステップS804)。
【0059】
また、条件を定めずに「検索」ボタン900がクリックされた場合(ステップS802:No)、同定解除候補検索部204は同定関係ファイル205から、そこに登録されているすべてのグループを抽出する(ステップS805)。
【0060】
ステップS804あるいはステップS805で抽出されたグループと、各グループを構成するレコードとは表示部207に引き渡され、表示部207はこれらの情報から、図10に示すような同定解除候補一覧画面を作成・表示する(ステップS806)。そして、いずれかのグループの番号、たとえば図中1000がクリックされたことを入力部200から通知されると、次に表示部207は図11に示すような、同定解除候補詳細画面を表示する(ステップS807)。
【0061】
操作者は個々の同定解除候補の詳細を参照して、各レコードの対象物の異同を判断し、同定を解除されるべき(このグループから外れるべき)候補番号のレコードの「解除指定」チェックボックスにチェックを入れる。その後、「書誌同定解除実行」ボタン1100をクリックすると、入力部200からの通知を受けた表示部207は、図12に示すような同定解除確認画面を表示する(ステップS808)。
【0062】
そして、図示する画面で「書誌同定解除実行」ボタン1200がクリックされると、入力部200からその事実を通知された同定解除候補検索部204は、同定関係ファイル205に登録されたグループから解除が指定されたレコードを削除する(ステップS809)。あるいは、いったん上記グループを削除した後、解除を指定されたレコード以外のレコードからなる新たなグループを再登録するとみることもできる。
【0063】
なお、図12は図11の画面に表示された代表書誌および非採用書誌1〜4のすべてにチェックが入れられた場合の例である。この場合、同一グループを構成するすべてのレコードが当該グループを外れることになり、結果的に当該グループそのものが同定関係ファイル205から消滅する(一部のレコードがグループを外れる場合は、グループそのものは存続する)。
【0064】
そして、同定関係ファイル205の更新が完了すると、同定解除候補検索部204からの通知を受けた表示部207は、書誌同定解除処理が正常終了したことを示す「完了しました」などのメッセージを画面表示する(ステップS810)。なお、上述のように同定成立後は総合目録データベース201内の書誌データが代表書誌の書誌データに統一されている。したがって、同定解除成立後は統一された書誌データを元に戻す処理が必要である。
【0065】
以上説明した実施の形態によれば、同一の資料を対象とする、表現形式の異なる複数のレコードは同定処理により一つにまとめられ、いったん一つにまとめられたレコードでも、同定解除処理により当該グループから任意に除外することができる。
【0066】
そして、ローカルあるいはリモートの操作者がキーワードによる文献検索をかけた場合には、まず当該キーワードで総合目録データベース201が検索された後、同定関係ファイル205が参照されて、検索結果中に含まれる非採用書誌の書誌データは当該非採用書誌が属するグループの代表書誌の書誌データに統一される。
【0067】
したがって、たとえば同一資料の第一版や第二版や第三版が別個に表示されて、検索結果が不必要に見づらくなるようなことがない。しかも、代表書誌に上記キーワードが含まれていなくても、同一グループ内の非採用書誌の一つにでも当該キーワードが含まれていれば、芋ずる式に代表書誌が引き出されるので、表現形式の差異などにともなって検索に漏れが生ずることもない。
【0068】
なお、上述した実施の形態では、一グループを形成するのは類似度の高いレコードに限られ、当該グループからの任意のレコードの除外が認められているのみであるので、類似度の低いレコードを一グループに含めることはできない。そこで、たとえば図13のような画面により、二つのレコードを直接指定して同定関係を設定できるようにしてもよい。同様に、二つのレコードを指定して同定解除をおこなえるようにしてもよい。
【0069】
なお、上述した実施の形態では、すでに総合目録データベース201に蓄積されている書誌データについて同定処理をおこなったが、あるいは当該データベースに新規のレコードが追加される都度、すでに同定されているグループの各代表書誌との類似度を自動計算し、その類似度によって既存のレコードとの対象物の異同をチェックするようにしてもよい。
【0070】
また、上述した実施の形態では、重複するレコードである可能性の高いものを機械的に抽出し、現実にどれが重複するのかの最終判断は操作者に任せるようにしたが、実用上十分な精度が得られるのであれば、操作者の確認を待たずに類似レコードをグルーピングしてしまうのでもよい。
【0071】
ただその場合、一グループを構成するレコードは単純に類似度から特定できるが、そのいずれを代表書誌とするかについては、あらかじめ何らかの基準を定めておかなければならない。
【0072】
たとえば、比較的信頼性の高い図書館(データ入力のための専門スタッフが常勤しているなど)により登録されたレコードを、そうでない図書館のレコードより一律に重視して、代表書誌とすることなどが考えられる。図14は、各図書館の優先度を設定するための画面の一例である。優先度の高い図書館により登録されたレコードほど、代表書誌に選出される可能性が高い。
【0073】
あるいは、あるフォーマットによるレコード(通常は、より詳細な項目を有するフォーマット)を、それ以外のフォーマットによるレコードより優先して代表書誌とするようにしてもよい。図15は、MARCの各フォーマットの優先度を設定するための画面の一例である。
【0074】
なお、上述した実施の形態では、データベース内の各レコードの対象物は図書館が所蔵する各種資料としたが、対象物はこれに限るものではなく、たとえば有形物に限らず無形物であってもよい。また、物でなく人や出来事などであってもよい。いずれにせよ、同一の事物などについて複数のレコードが存在する可能性のある場合に、本発明を応用して類似レコードをグルーピングすることができる。
【0075】
なお、上述した同定候補検索部202が請求項にいう「算出手段」「抽出手段」および「登録手段」を兼ね、そのおこなう処理の中に請求項にいう「算出工程」「抽出工程」および「登録工程」が含まれる。また、同定解除候補検索部204が請求項にいう「再登録手段」に相当し、そのおこなう処理の中に請求項にいう「再登録工程」が含まれる。また、キーワード検索部206が請求項にいう「検索手段」に、そのおこなう処理が請求項にいう「検索工程」に、それぞれ相当する。
【0076】
【発明の効果】
以上説明したように上記の発明は、対象物の属性情報からなる複数のレコードを保持するデータベースから任意のレコードを検索する属性情報検索装置において、入力された検索条件に合致するレコードを前記データベースから検索する検索手段と、前記検索手段により検索されたレコード間の類似度を算出する算出手段と、前記算出手段により算出された類似度が所定の閾値を超えた複数のレコードを一グループとして抽出する抽出手段と、前記抽出手段により抽出されたグループ内のレコードのうち、指定された複数のレコードを関連づけて登録する登録手段と、を備えたので、対象物を同一とする複数の類似したレコードは一つのグループにまとめられるとともに、以後のキーワード検索などにおいて単一のレコードに準じた扱いをなされることになり、これによって、同一の対象物について類似する複数のレコードが存在するようなデータベースの検索においても、漏れなくかつ見やすい検索結果を得ることが可能な属性情報検索装置が得られるという効果を奏する。
【0077】
また、この発明は、上記の発明において、前記登録手段が、前記抽出手段により抽出されたグループ内のレコードのうち、指定された複数のレコードを関連づけて登録するとともに、当該複数のレコードのうちいずれか一つを代表として登録するので、対象物を同一とする複数の類似したレコードは、そのうち一つを代表とする一つのグループにまとめられるとともに、以後のキーワード検索などにおいて単一のレコードに準じた扱いをなされることになり、これによって、同一の対象物について類似する複数のレコードが存在するようなデータベースの検索においても、漏れなくかつ見やすい検索結果を得ることが可能な属性情報検索装置が得られるという効果を奏する。
【0078】
また、この発明は、上記の発明において、さらに、前記登録手段により関連づけて登録された複数のレコードのうち、指定された複数のレコード以外のレコードを関連づけて登録する再登録手段を備えたので、グループの広狭すなわち当該グループにどのレコードを含ませるかは任意に調整することができ、これによって、同一の対象物について類似する複数のレコードが存在するようなデータベースの検索においても、漏れなくかつ見やすい検索結果を得ることが可能な属性情報検索装置が得られるという効果を奏する。
【0079】
また、この発明は、対象物の属性情報からなる複数のレコードを保持するデータベースから任意のレコードを検索する属性情報検索方法において、入力された検索条件に合致するレコードを前記データベースから検索する検索工程と、前記検索工程で検索されたレコード間の類似度を算出する算出工程と、前記算出工程で算出された類似度が所定の閾値を超えた複数のレコードを一グループとして抽出する抽出工程と、前記抽出工程で抽出されたグループ内のレコードのうち、指定された複数のレコードを関連づけて登録する登録工程と、を含んだので、対象物を同一とする複数の類似したレコードは一つのグループにまとめられるとともに、以後のキーワード検索などにおいて単一のレコードに準じた扱いをなされることになり、これによって、同一の対象物について類似する複数のレコードが存在するようなデータベースの検索においても、漏れなくかつ見やすい検索結果を得ることが可能な属性情報検索方法が得られるという効果を奏する。
【0080】
また、この発明は、上記の発明において、前記登録工程では、前記抽出工程で抽出されたグループ内のレコードのうち、指定された複数のレコードを関連づけて登録するとともに、当該複数のレコードのうちいずれか一つを代表として登録するので、対象物を同一とする複数の類似したレコードは、そのうち一つを代表とする一つのグループにまとめられるとともに、以後のキーワード検索などにおいて単一のレコードに準じた扱いをなされることになり、これによって、同一の対象物について類似する複数のレコードが存在するようなデータベースの検索においても、漏れなくかつ見やすい検索結果を得ることが可能な属性情報検索方法が得られるという効果を奏する。
【0081】
また、この発明は、上記の発明において、さらに、前記登録工程で関連づけて登録された複数のレコードのうち、指定された複数のレコード以外のレコードを関連づけて登録する再登録工程を含んだので、グループの広狭すなわち当該グループにどのレコードを含ませるかは任意に調整することができ、これによって、同一の対象物について類似する複数のレコードが存在するようなデータベースの検索においても、漏れなくかつ見やすい検索結果を得ることが可能な属性情報検索方法が得られるという効果を奏する。
【0082】
また、この発明によれば、上記のいずれか一つに記載された方法をコンピュータに実行させることが可能なプログラムが得られるという効果を奏する。
【図面の簡単な説明】
【図1】この発明の実施の形態による属性情報検索装置のハードウエア構成を示す説明図である。
【図2】この発明の実施の形態による属性情報検索装置の構成を機能的に示す説明図である。
【図3】この発明の実施の形態による属性情報検索装置における、書誌データの同定処理の手順を示すフローチャートである。
【図4】この発明の実施の形態による同定条件入力画面の一例を示す説明図である。
【図5】この発明の実施の形態による同定候補一覧画面の一例を示す説明図である。
【図6】この発明の実施の形態による同定候補詳細画面の一例を示す説明図である。
【図7】この発明の実施の形態による同定確認画面の一例を示す説明図である。
【図8】この発明の実施の形態による属性情報検索装置における、書誌データの同定解除処理の手順を示すフローチャートである。
【図9】この発明の実施の形態による同定解除条件入力画面の一例を示す説明図である。
【図10】この発明の実施の形態による同定解除候補一覧画面の一例を示す説明図である。
【図11】この発明の実施の形態による同定解除候補詳細画面の一例を示す説明図である。
【図12】この発明の実施の形態による同定解除確認画面の一例を示す説明図である。
【図13】この発明の実施の形態による直接同定画面の一例を示す説明図である。
【図14】各図書館の優先度を設定するための画面の一例である。
【図15】MARCの各フォーマットの優先度を設定するための画面の一例である。
【符号の説明】
100 バスまたはケーブル
101 CPU
102 ROM
103 RAM
104 HDD
105 HD
106 FDD
107 FD
108 ディスプレイ
109 ネットワークI/F
110 通信ケーブル
111 キーボード
112 マウス
113 CD−RW
114 CD−RWドライブ
200 入力部
201 総合目録データベース
202 同定候補検索部
203 重みファイル
204 同定解除候補検索部
205 同定関係ファイル
206 キーワード検索部
207 表示部
Claims (3)
- 図書館の書誌について、表現形式は異なるが実際には同一の資料を指す書誌の複数のレコードをそれぞれ一つのグループにまとめる書誌同定処理をおこなう属性情報検索装置であって、
入力された検索条件に合致する書誌のレコードを、図書館の書誌の属性情報からなる複数のレコードを保持する総合目録データベースから検索する検索手段と、
前記検索手段により検索された書誌のレコード間の類似度を算出する算出手段と、
前記算出手段により算出された類似度が所定の閾値を超えた複数の書誌のレコードを一グループとして抽出する抽出手段と、
前記抽出手段により抽出されたグループ内の書誌のレコードを表示する表示手段と、
前記表示手段によって表示された書誌のレコードの中から、表現形式は異なるが実際には同一の資料を指す書誌のレコードの指定を受け付けるとともに、指定された書誌のレコードのうちのいずれか一つについて代表書誌としての指定を受け付ける指定手段と、
前記指定手段によって指定された複数の書誌のレコードを関連づけて登録するとともに、当該指定された複数の書誌のうち前記指定手段によって代表書誌としての指定された書誌以外の書誌の書誌データを当該代表書誌の書誌データに統一する登録手段と、
を備えたことを特徴とする属性情報検索装置。 - 検索手段と、算出手段と、抽出手段と、表示手段と、指定手段と、登録手段と、を備えたコンピュータを用いて、図書館の書誌について、表現形式は異なるが実際には同一の資料を指す書誌の複数のレコードをそれぞれ一つのグループにまとめる書誌同定処理をおこなう属性情報検索方法であって、
前記検索手段が、入力された検索条件に合致する書誌のレコードを、図書館の書誌の属性情報からなる複数のレコードを保持する総合目録データベースから検索する検索工程と、
前記算出手段が、前記検索工程で検索された書誌のレコード間の類似度を算出する算出工程と、
前記抽出手段が、前記算出工程で算出された類似度が所定の閾値を超えた複数の書誌のレコードを一グループとして抽出する抽出工程と、
前記表示手段が、前記抽出工程で抽出されたグループ内の書誌のレコードを表示する表示工程と、
前記指定手段が、前記表示工程によって表示された書誌のレコードの中から、表現形式は異なるが実際には同一の資料を指す書誌のレコードの指定を受け付けるとともに、指定された書誌のレコードのうちのいずれか一つについて代表書誌としての指定を受け付ける指定工程と、
前記登録手段が、前記指定工程によって指定された複数の書誌のレコードを関連づけて登録するとともに、当該指定された複数の書誌のうち前記指定工程によって代表書誌としての指定された書誌以外の書誌データを当該代表書誌の書誌データに統一する登録工程と、
を前記コンピュータに実行させることを特徴とする属性情報検索方法。 - 図書館の書誌について、表現形式は異なるが実際には同一の資料を指す書誌の複数のレコードをそれぞれ一つのグループにまとめる書誌同定処理をコンピュータに実行させる属性情報検索プログラムであって、
入力された検索条件に合致する書誌のレコードを、図書館の書誌の属性情報からなる複数のレコードを保持する総合目録データベースから検索する検索工程と、
前記検索工程により検索された書誌のレコード間の類似度を算出する算出工程と、
前記算出工程により算出された類似度が所定の閾値を超えた複数の書誌のレコードを一グループとして抽出する抽出工程と、
前記抽出工程により抽出されたグループ内の書誌のレコードを表示する表示工程と、
前記表示工程によって表示された書誌のレコードの中から、表現形式は異なるが実際には同一の資料を指す書誌のレコードの指定を受け付けるとともに、指定された書誌のレコードのうちのいずれか一つについて代表書誌としての指定を受け付ける指定工程と、
前記指定工程によって指定された複数の書誌のレコードを関連づけて登録するとともに、当該指定された複数の書誌のうち前記指定工程によって代表書誌としての指定された書誌以外の書誌データを当該代表書誌の書誌データに統一する登録工程と、
を含んだことを特徴とする属性情報検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002181951A JP4817585B2 (ja) | 2002-06-21 | 2002-06-21 | 属性情報検索装置、属性情報検索方法およびその方法をコンピュータに実行させるプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002181951A JP4817585B2 (ja) | 2002-06-21 | 2002-06-21 | 属性情報検索装置、属性情報検索方法およびその方法をコンピュータに実行させるプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004029969A JP2004029969A (ja) | 2004-01-29 |
JP4817585B2 true JP4817585B2 (ja) | 2011-11-16 |
Family
ID=31178659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002181951A Expired - Fee Related JP4817585B2 (ja) | 2002-06-21 | 2002-06-21 | 属性情報検索装置、属性情報検索方法およびその方法をコンピュータに実行させるプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4817585B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8285739B2 (en) | 2005-07-28 | 2012-10-09 | International Business Machines Corporation | System and method for identifying qualifying data records from underlying databases |
US7827179B2 (en) | 2005-09-02 | 2010-11-02 | Nec Corporation | Data clustering system, data clustering method, and data clustering program |
CN103729369B (zh) * | 2012-10-15 | 2017-06-13 | 金蝶软件(中国)有限公司 | 自动处理撞单的方法及装置 |
JP2014174637A (ja) * | 2013-03-06 | 2014-09-22 | Ricoh Co Ltd | 情報閲覧システム及び情報閲覧方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3603392B2 (ja) * | 1995-07-06 | 2004-12-22 | 株式会社日立製作所 | 文書分類支援方法および装置 |
US5995978A (en) * | 1997-09-24 | 1999-11-30 | Ricoh Company, Ltd. | Navigation system for document image database |
JP2001331529A (ja) * | 2000-03-17 | 2001-11-30 | Fujitsu Ltd | ニュース情報提示装置および提示方法 |
JP3625054B2 (ja) * | 2000-11-29 | 2005-03-02 | 松下電器産業株式会社 | 技術文書検索装置 |
-
2002
- 2002-06-21 JP JP2002181951A patent/JP4817585B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004029969A (ja) | 2004-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20130095171A (ko) | 포렌식 시스템과 포렌식 방법 및 포렌식 프로그램 | |
CN101814089A (zh) | 关联内容显示装置和系统 | |
JP5424798B2 (ja) | メタデータ設定方法及びメタデータ設定システム、並びにプログラム | |
US20080140608A1 (en) | Information Managing Apparatus, Method, and Program | |
JP2006004298A (ja) | 文書処理装置、文書処理方法及び文書処理プログラム | |
JP6003263B2 (ja) | 議事録作成支援装置、議事録作成支援システム、議事録作成支援方法、及びプログラム | |
JP4817585B2 (ja) | 属性情報検索装置、属性情報検索方法およびその方法をコンピュータに実行させるプログラム | |
JP6586050B2 (ja) | 管理装置、管理方法および管理プログラム | |
JP2022041859A (ja) | プログラム、方法、情報処理装置、及びシステム | |
JP2010102593A (ja) | 情報処理装置およびその方法、プログラム、記録媒体 | |
JP4101045B2 (ja) | 支援方法、支援装置及びコンピュータプログラム | |
JP2007334412A (ja) | 検索プログラムおよび検索装置 | |
KR101153534B1 (ko) | 웹 데이터 및 로컬 데이터에 대한 데이터 자동 태깅 방법및 데이터 자동 태깅 시스템 | |
JPH10240760A (ja) | 関連データの管理方法 | |
JP2010009412A (ja) | 情報処理装置、電子帳票管理システムおよびその帳票検索方法、並びにプログラム | |
JP2001056809A (ja) | 文書管理システム | |
JP6017055B2 (ja) | データ連携支援装置及びデータ連携支援方法 | |
JP2001075954A (ja) | 電子ファイリングシステムおよびデータ登録方法 | |
JP4617608B2 (ja) | 代替キーワードのフリー設定による検索システム | |
JP2009265902A (ja) | 文書管理装置、文書管理方法、情報処理プログラム及び記録媒体 | |
JP4805491B2 (ja) | 辞書管理プログラム及びコンピュータシステム | |
JP2001075847A (ja) | 電子ファイリングシステム及びファイル管理方法 | |
JP2006350585A (ja) | 医療情報入力システム | |
JP2005327023A (ja) | ヒット数予想を利用した全文検索の検索方式 | |
JP2008003670A (ja) | 図面管理システム及び管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071023 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080129 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080328 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080415 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080616 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080701 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20080801 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110509 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110729 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110830 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140909 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |