JP2011170778A - Document search device and document search program - Google Patents

Document search device and document search program Download PDF

Info

Publication number
JP2011170778A
JP2011170778A JP2010036333A JP2010036333A JP2011170778A JP 2011170778 A JP2011170778 A JP 2011170778A JP 2010036333 A JP2010036333 A JP 2010036333A JP 2010036333 A JP2010036333 A JP 2010036333A JP 2011170778 A JP2011170778 A JP 2011170778A
Authority
JP
Japan
Prior art keywords
search
document
key information
similarity
search key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010036333A
Other languages
Japanese (ja)
Inventor
Koichi Fujii
晃一 藤井
Kagenori Nagao
景則 長尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2010036333A priority Critical patent/JP2011170778A/en
Publication of JP2011170778A publication Critical patent/JP2011170778A/en
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To perform a document search, while objectively reflecting a user's confidence in storage, with respect to a document to be searched. <P>SOLUTION: A device includes an attribute information storage unit 24, which stores attribute information defining a hierarchical relation of attributes settable to a component disposed on a displayed sheet and finely classifiable in different particle sizes; a search key information generation unit 21, which generates search key information, by arranging the component on a displayed virtual sheet at a predetermined position and in a predetermined size corresponding to the designated attribute; a weighting information storage unit 25, in which a weighting is set according to the similarity of each component in the key information and in a document image of a comparison object; and a document search unit 22, which specifies a similar document in the document search, by calculating the similarity of the components included respectively in the search key information and the document image of the comparison object, with reference to the weighting. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、文書検索装置及び文書検索プログラムに関する。   The present invention relates to a document search apparatus and a document search program.

特許文献1には、入力された問い合わせ画像の各領域に対して利用者の確信度または重要度に基づく形状情報および色情報を問い合わせ画像に付加し、検索の際、問い合わせ画像と概略画像の各領域の確信度または重要度との整合度を導出することが記載されている。   Patent Document 1 adds shape information and color information based on a user's certainty or importance to each region of an input inquiry image to the inquiry image. Described is deriving the degree of consistency with the certainty or importance of a region.

特開平6−309377号公報JP-A-6-309377

本発明は、ユーザの検索したい文書に対する記憶の確信度を客観的に反映させた文書検索を行うことを目的とする。   It is an object of the present invention to perform a document search that objectively reflects the certainty of storage for a document that a user wants to search.

本発明に係る文書検索装置は、用紙を表示する表示手段と、表示された用紙上に配置される構成要素に設定可能な属性の階層関係が定義された属性情報を記憶する記憶手段と、 ユーザに、表示された用紙上に1又は複数の構成要素を配置させると共に、配置された各構成要素に、前記属性情報に定義された属性の中からユーザに選択された属性を設定することによって検索キー情報を生成する生成手段と、文書検索を行う際に、検索キー情報に含まれる構成要素に設定された属性が前記属性情報において定義された階層関係において最下位層に近いほど算出する類似度が大きくなるように設定された重みを用いて、検索キー情報と検索対象文書との類似度を算出し、その類似度を参照して検索キー情報に類似する文書を特定する検索手段と、を有することを特徴とする。   The document search apparatus according to the present invention includes a display unit that displays a sheet, a storage unit that stores attribute information in which a hierarchical relationship of attributes that can be set to components arranged on the displayed sheet is defined, and a user In addition, one or a plurality of components are arranged on the displayed paper, and a search is performed by setting an attribute selected by the user from among the attributes defined in the attribute information for each of the arranged components. The generation means for generating key information and the similarity calculated when the attribute set in the component included in the search key information is closer to the lowest layer in the hierarchical relationship defined in the attribute information when performing document search Search means for calculating the similarity between the search key information and the search target document using a weight set so as to increase, and referring to the similarity and identifying a document similar to the search key information; Characterized in that it has a.

また、前記検索手段は、検索キー情報に含まれる構成要素の紙面上における位置が、当該構成要素に対応する検索対象文書に含まれる構成要素と近いほど算出する類似度が大きくなるように設定された重みを用いて、検索キー情報と検索対象文書との類似度を算出することを特徴とする。   In addition, the search means is set so that the similarity degree to be calculated increases as the position on the paper of the component included in the search key information is closer to the component included in the search target document corresponding to the component. The similarity between the search key information and the search target document is calculated using the weights.

また、前記検索手段は、検索キー情報に含まれる構成要素の大きさが、当該構成要素に対応する検索対象文書に含まれる構成要素と近いほど算出する類似度が大きくなるように設定された重みを用いて、検索キー情報と検索対象文書との類似度を算出することを特徴とする。   In addition, the search means sets a weight that is set so that the similarity calculated increases as the size of the component included in the search key information is closer to the component included in the search target document corresponding to the component. Is used to calculate the similarity between the search key information and the search target document.

また、前記検索手段は、検索キー情報に含まれる構成要素と、当該構成要素に対応する検索対象文書に含まれる構成要素とが、前記階層関係上近い親等にあるほど算出する類似度が大きくなるように設定された重みを用いて、検索キー情報と検索対象文書との類似度を算出することを特徴とする。   In addition, the degree of similarity calculated by the search unit increases as the component included in the search key information and the component included in the search target document corresponding to the component are closer to each other in the hierarchical relationship. The similarity between the search key information and the search target document is calculated using the weight set as described above.

本発明に係る文書検索プログラムは、コンピュータを、用紙を表示する表示手段、表示された用紙上に配置される構成要素に設定可能な属性の階層関係が定義された属性情報を記憶する記憶手段、ユーザに、表示された用紙上に1又は複数の構成要素を配置させると共に、配置された各構成要素に、前記属性情報に定義された属性の中からユーザに選択された属性を設定することによって検索キー情報を生成する生成手段、文書検索を行う際に、検索キー情報に含まれる構成要素に設定された属性が前記属性情報において定義された階層関係において最下位層に近いほど算出する類似度が大きくなるように設定された重みを用いて、検索キー情報と検索対象文書との類似度を算出し、その類似度を参照して検索キー情報に類似する文書を特定する検索手段、として機能させる。   The document search program according to the present invention includes a computer that displays display means for displaying paper, storage means for storing attribute information in which hierarchical relationships of attributes that can be set for components arranged on the displayed paper are defined, By causing the user to arrange one or a plurality of components on the displayed paper, and setting an attribute selected by the user from among the attributes defined in the attribute information for each of the arranged components A generation unit that generates search key information, a similarity that is calculated when an attribute set in a component included in the search key information is closer to the lowest layer in the hierarchical relationship defined in the attribute information when performing a document search Calculates the similarity between the search key information and the search target document using the weights set so as to be large, and refers to the similarity to identify a document similar to the search key information That the search means, to function as.

請求項1,5記載の発明によれば、ユーザの検索したい文書に対する記憶の確信度を客観的に反映させた文書検索を行うことができる。   According to the first and fifth aspects of the invention, it is possible to perform a document search that objectively reflects the certainty of storage for a document that the user wants to search.

請求項2記載の発明によれば、ユーザの検索したい文書に含まれる構成要素の位置に関する記憶違いの程度を考慮した文書検索を行うことができる。   According to the second aspect of the present invention, it is possible to perform a document search in consideration of the degree of memory difference regarding the position of the component included in the document that the user wants to search.

請求項3記載の発明によれば、ユーザの検索したい文書に含まれる構成要素の大きさに関する記憶違いの程度を考慮した文書検索を行うことができる。   According to the third aspect of the present invention, it is possible to perform a document search in consideration of the degree of memory difference regarding the size of the component included in the document that the user wants to search.

請求項4記載の発明によれば、ユーザの検索したい文書に含まれる構成要素の属性に関する記憶違いがあった場合でも、その記憶違いの程度を考慮した文書検索を行うことができる。   According to the fourth aspect of the present invention, even when there is a memory difference regarding the attribute of the component included in the document that the user wants to search, a document search can be performed in consideration of the degree of the memory difference.

本発明に係る文書検索装置の一実施の形態を示したブロック構成図である。It is the block block diagram which showed one Embodiment of the document search device concerning this invention. 本実施の形態における文書検索装置を形成するコンピュータのハードウェア構成図である。It is a hardware block diagram of the computer which forms the document search apparatus in this Embodiment. 本実施の形態において検索キー情報生成処理の過程における検索キー情報生成画面の表示状態の遷移の一例を示した図である。It is the figure which showed an example of the display state transition of the search key information generation screen in the process of the search key information generation process in this Embodiment. 本実施の形態における属性情報記憶部に記憶される属性情報の一例を示した図である。It is the figure which showed an example of the attribute information memorize | stored in the attribute information storage part in this Embodiment. 本実施の形態における重み情報記憶部に記憶される階層関係に関する重み情報の一例を示した図である。It is the figure which showed an example of the weight information regarding the hierarchical relationship memorize | stored in the weight information storage part in this Embodiment. 本実施の形態における重み情報記憶部に記憶される位置に関する重み情報の一例を示した図である。It is the figure which showed an example of the weight information regarding the position memorize | stored in the weight information storage part in this Embodiment. 本実施の形態における重み情報記憶部に記憶されるサイズに関する重み情報の一例を示した図である。It is the figure which showed an example of the weight information regarding the size memorize | stored in the weight information storage part in this Embodiment. 本実施の形態における重み情報記憶部に記憶される親等に関する重み情報の一例を示した図である。It is the figure which showed an example of the weight information regarding a parent etc. which are memorize | stored in the weight information storage part in this Embodiment. 本実施の形態における検索キー情報生成処理において生成された検索キー情報の一例を示した図である。It is the figure which showed an example of the search key information produced | generated in the search key information production | generation process in this Embodiment. 本実施の形態における文書検索処理において検索キー情報と比較される文書画像の例と各文書画像との類似度の算出結果とを示した図である。It is the figure which showed the example of the document image compared with search key information in the document search process in this Embodiment, and the calculation result of the similarity degree of each document image.

以下、図面に基づいて、本発明の好適な実施の形態について説明する。   Hereinafter, preferred embodiments of the present invention will be described with reference to the drawings.

図1は、本発明に係る文書検索装置の一実施の形態を示したブロック構成図である。また、図2は、本実施の形態における文書検索装置20を形成するコンピュータのハードウェア構成図である。   FIG. 1 is a block diagram showing an embodiment of a document search apparatus according to the present invention. FIG. 2 is a hardware configuration diagram of a computer forming the document search apparatus 20 according to the present embodiment.

図2において、コンピュータは、従前から存在する汎用的なハードウェア構成で実現できる。すなわち、文書検索装置20を形成するコンピュータは、図2に示したようにCPU1、ROM2、RAM3、ハードディスクドライブ(HDD)4を接続したHDDコントローラ5、入力手段として設けられたマウス6とキーボード7、及び表示装置として設けられたディスプレイ8をそれぞれ接続する入出力コントローラ9、通信手段として設けられたネットワークコントローラ10を内部バス11に接続して構成される。   In FIG. 2, the computer can be realized by a general-purpose hardware configuration that has existed before. That is, the computer forming the document search device 20 includes a CPU 1, a ROM 2, a RAM 3, an HDD controller 5 connected to a hard disk drive (HDD) 4, a mouse 6 and a keyboard 7 provided as input means, as shown in FIG. An input / output controller 9 for connecting a display 8 provided as a display device and a network controller 10 provided as a communication means are connected to an internal bus 11.

図1に戻り、本実施の形態における文書検索装置20は、検索キー情報生成部21、文書検索部22、検索結果表示部23、属性情報記憶部24及び重み情報記憶部25を有している。   Returning to FIG. 1, the document search apparatus 20 in the present embodiment includes a search key information generation unit 21, a document search unit 22, a search result display unit 23, an attribute information storage unit 24, and a weight information storage unit 25. .

検索キー情報生成部21は、所定の検索キー情報生成画面に対するユーザ操作に応じて検索キー情報を生成する。文書検索部22は、生成された検索キー情報をキーにして文書検索を行うことで、検索キー情報に類似した文書を抽出する。検索結果表示部23は、文書検索部22による文書検索処理の結果をディスプレイ8に表示する。属性情報記憶部24及び重み情報記憶部25に登録される情報については追って説明する。   The search key information generation unit 21 generates search key information in response to a user operation on a predetermined search key information generation screen. The document search unit 22 performs a document search using the generated search key information as a key, thereby extracting a document similar to the search key information. The search result display unit 23 displays the result of the document search process by the document search unit 22 on the display 8. Information registered in the attribute information storage unit 24 and the weight information storage unit 25 will be described later.

文書検索装置20における各構成要素21〜23は、文書検索装置20を形成するコンピュータと、コンピュータに搭載されたCPU1で動作するプログラムとの協調動作により実現される。また、各記憶部24,25は、文書検索装置20に搭載されたHDD4にて実現される。あるいは、記憶手段を有する外部のコンピュータ上に設け、文書検索装置20は、そのコンピュータから直接若しくはネットワーク経由で必要な情報を取得するように構成してもよい。   Each component 21 to 23 in the document search apparatus 20 is realized by a cooperative operation of a computer that forms the document search apparatus 20 and a program that operates on the CPU 1 mounted on the computer. The storage units 24 and 25 are realized by the HDD 4 mounted on the document search device 20. Alternatively, it may be provided on an external computer having a storage means, and the document search apparatus 20 may be configured to acquire necessary information directly from the computer or via a network.

また、本実施の形態で用いるプログラムは、通信手段により提供することはもちろん、CD−ROMやDVD−ROM等のコンピュータ読み取り可能な記録媒体に格納して提供することも可能である。通信手段や記録媒体から提供されたプログラムはコンピュータにインストールされ、コンピュータのCPUがインストールプログラムを順次実行することで各種処理が実現される。   Further, the program used in this embodiment can be provided not only by communication means but also by storing it in a computer-readable recording medium such as a CD-ROM or DVD-ROM. The program provided from the communication means or the recording medium is installed in the computer, and various processes are realized by the CPU of the computer sequentially executing the installation program.

図3は、本実施の形態における検索キー情報生成画面の表示状態の遷移の一例を示した図である。検索キー情報生成画面は、検索キー情報を生成するための仮想紙面31の表示領域と、仮想紙面31上に配置する構成要素ボックス32を収納する領域とが設けられている。   FIG. 3 is a diagram showing an example of the transition of the display state of the search key information generation screen in the present embodiment. The search key information generation screen is provided with a display area of the virtual paper surface 31 for generating search key information and an area for storing the component box 32 arranged on the virtual paper surface 31.

ところで、以下に詳述するように、本実施の形態では、構成要素ボックス32を仮想紙面31上に配置して、配置した構成要素ボックス32それぞれに属性を設定することによって検索キー情報を生成していく。構成要素ボックス32に設定される属性としては、必ずしも画像を示す属性ばかりとは限らず、画像データそのものではなく、文字情報の属性として本文や要約などを示す画像以外の属性も存在する。本実施の形態では、仮想紙面上において文字情報が占める領域を、文字情報であることを示すアイコンを配置することによって特定する。アイコンは、ディスプレイ8に表示される画像の一形態であり、コンピュータが作成する記号表現の画像であるけれども、文書画像から抽出されたオブジェクト画像とは性質を異にする。このため、本発明では、文書画像の検索に用いるキー情報として「検索キー画像」ではなく「検索キー情報」という用語を用いることにした。   By the way, as will be described in detail below, in this embodiment, the search key information is generated by arranging the component box 32 on the virtual paper surface 31 and setting the attribute for each of the arranged component box 32. To go. The attributes set in the component box 32 are not necessarily limited to attributes indicating images, but include attributes other than images indicating text and summaries as attributes of character information as well as image data itself. In the present embodiment, the area occupied by the character information on the virtual paper surface is specified by arranging an icon indicating the character information. The icon is a form of an image displayed on the display 8 and is a symbol representation image created by a computer, but has a different property from an object image extracted from a document image. Therefore, in the present invention, the term “search key information” is used instead of “search key image” as key information used for searching for a document image.

以下、図3を用いて検索キー情報生成部21における検索キー情報生成処理について説明する。検索キー情報生成処理は、検索キー情報生成画面を利用して検索キー情報を生成したいユーザによる操作指示に従い所定のアプリケーションが起動され、検索キー情報生成画面がディスプレイ8に表示される。   Hereinafter, the search key information generation process in the search key information generation unit 21 will be described with reference to FIG. In the search key information generation process, a predetermined application is started in accordance with an operation instruction by a user who wants to generate search key information using the search key information generation screen, and the search key information generation screen is displayed on the display 8.

まず、ユーザは、マウスカーソル33を用いて構成要素ボックス32をドラッグ&ドロップして仮想紙面31上にコピーする(図3(a),(b))。そして、ユーザは、マウス6を操作することにより構成要素(オブジェクト)が検索キー情報において存在する位置及び大きさに調整する(図3(b),(c))。この位置及び大きさの設定は、ユーザの記憶に委ねられる。   First, the user uses the mouse cursor 33 to drag and drop the component box 32 and copy it onto the virtual paper surface 31 (FIGS. 3A and 3B). The user operates the mouse 6 to adjust the position and size of the component (object) in the search key information (FIGS. 3B and 3C). The setting of this position and size is left to the user's memory.

構成要素が仮想紙面31上に配置されると、ユーザは、例えば、構成要素を右クリックなどして属性選択用のプルダウンメニュー34を表示させ(図3(d))、その構成要素に属性を設定する。例えばユーザがプルダウンメニュー34の中から「絵柄」を選択すると、検索キー情報生成部21は、「絵柄」が細分類された属性である「図表」、「線画」及び「写真」をプルダウンメニュー34に表示する(図3(e))。続いて、ユーザによりプルダウンメニュー34の中から「図表」が選択されると、検索キー情報生成部21は、「図表」が細分類された属性である「グラフ」、「表」及び「その他図」をプルダウンメニュー34に表示する(図3(f))。更に、ユーザによりプルダウンメニュー34の中から「グラフ」が選択されると、検索キー情報生成部21は、「グラフ」が細分類された属性である「円グラフ」、「棒グラフ」、「折線グラフ」及び「その他グラフ」をプルダウンメニュー34に表示する(図3(g))。そして、ユーザによりプルダウンメニュー34の中から「円グラフ」が選択されると、検索キー情報生成部21は、構成要素の属性として「円グラフ」を設定する。   When the component is arranged on the virtual paper surface 31, the user displays a pull-down menu 34 for selecting an attribute by right-clicking the component, for example (FIG. 3D), and assigns an attribute to the component. Set. For example, when the user selects “Picture” from the pull-down menu 34, the search key information generation unit 21 selects “Chart”, “Line Drawing”, and “Photo”, which are attributes into which “Picture” is subdivided, from the pull-down menu 34. (FIG. 3E). Subsequently, when “Chart” is selected from the pull-down menu 34 by the user, the search key information generation unit 21 sets “Chart”, “Table”, and “Other Diagrams” as attributes in which “Chart” is subdivided. "Is displayed in the pull-down menu 34 (FIG. 3F). Furthermore, when “graph” is selected from the pull-down menu 34 by the user, the search key information generation unit 21 displays “pie graph”, “bar graph”, “line graph”, which are attributes into which “graph” is subdivided. And “other graph” are displayed in the pull-down menu 34 (FIG. 3G). When the user selects “pie graph” from the pull-down menu 34, the search key information generation unit 21 sets “pie graph” as the attribute of the component.

ユーザが、構成要素に設定すべき属性は「円グラフ」であると鮮明に記憶しているとすると、上述のように「円グラフ」を選択することになるが、「円グラフ」とまでは明確に記憶しておらずグラフとまでしか記憶していなければ、図3(f)で表示された「グラフ」を選択することになる。また、ユーザは、構成要素に設定すべき属性として表やグラフとまでは明確に記憶しておらず図表とまでしか記憶していなければ、図3(e)で表示された「図表」を選択することになる。また、構成要素に設定すべき属性として図表とまでは明確に記憶しておらず絵柄とまでしか記憶していなければ、図3(d)で表示された「絵柄」を選択することになる。このように、ユーザは、記憶の確信度に応じたレベルの属性を選択することによって構成要素に属性を設定することになる。なお、「確信度」というのは、ユーザが検索したい文書又はその文書に含まれる構成要素をどれだけ確信して覚えているかという度合いを示す用語である。鮮明に記憶していればいるほど確信度は高くなる。その反面、記憶が曖昧であれば確信度は低くなる。 If the user clearly remembers that the attribute to be set in the component is “pie chart”, the user selects “pie chart” as described above. If it is not clearly stored and only the graph is stored, the “graph” displayed in FIG. 3F is selected. In addition, the user selects “Chart” displayed in FIG. 3E if the table or graph is not clearly stored as an attribute to be set in the component but only the table is stored. Will do. In addition, if an attribute to be set for a component is not clearly stored up to a chart but only a pattern is stored, the “picture” displayed in FIG. 3D is selected. In this way, the user sets an attribute to the component by selecting an attribute at a level corresponding to the certainty of storage. The “confidence level” is a term indicating the degree to which the user remembers the document that the user wants to search or the components included in the document with certainty. The more clearly you remember, the higher your confidence. On the other hand, if the memory is ambiguous, the certainty level is low.

ところで、検索キー情報生成部21は、属性情報記憶部24に登録された属性情報の設定内容に従いプルダウンメニュー34を形成し表示させている。ここで、本実施の形態における属性情報記憶部24に記憶される属性情報の一例を図4を用いて説明する。   By the way, the search key information generating unit 21 forms and displays a pull-down menu 34 according to the setting contents of the attribute information registered in the attribute information storage unit 24. Here, an example of attribute information stored in the attribute information storage unit 24 in the present embodiment will be described with reference to FIG.

属性情報は、本実施の形態を利用して検索キー情報を生成する処理が実施される前に作成されて、属性情報記憶部24に予め登録され、上記のように構成要素の生成の際に参照される。つまり、構成要素に設定可能な属性は、属性情報記憶部24に事前に登録されていることになる。属性は、細分類化されることによって階層関係を成している。図4に示した例によれば、最上位の属性として「絵柄」又は「文字」が設定されている。「絵柄」は、「図表」、「線画」及び「写真」に細分類されている。そして、「図表」は、「グラフ」、「表」及び「その他図」に細分類されている。このうち、「グラフ」は、更に「円グラフ」、「棒グラフ」、「折線グラフ」及び「その他グラフ」に細分類されている。図3に示した属性情報の例は、図4に示した属性情報の設定例に従ったものであるので、ユーザは、この属性情報の中に設定されたいずれかの属性を構成要素に設定することになる。   The attribute information is created before the process for generating the search key information using this embodiment is performed, is registered in advance in the attribute information storage unit 24, and when the component is generated as described above. Referenced. That is, the attributes that can be set for the component are registered in the attribute information storage unit 24 in advance. Attributes have a hierarchical relationship by being subdivided. According to the example shown in FIG. 4, “picture” or “character” is set as the highest attribute. "Picture" is subdivided into "Chart", "Line drawing" and "Photograph". The “chart” is subdivided into “graph”, “table”, and “other diagram”. Among these, the “graph” is further subdivided into “pie graph”, “bar graph”, “line graph”, and “other graph”. The example of the attribute information shown in FIG. 3 is based on the setting example of the attribute information shown in FIG. 4, so that the user sets any attribute set in the attribute information as a component. Will do.

以上のようにして検索キー情報が生成されると、文書検索部22は、検索キー情報に基づき、図示しない文書データベース等に格納されている文書画像を検索することによって検索キー情報に類似する文書を特定する。類似性の判断として、本実施の形態では、類似度を算出するが、ここで、この算出の際に参照する重み情報について説明する。   When the search key information is generated as described above, the document search unit 22 searches a document image stored in a document database or the like (not shown) based on the search key information, and thus similar to the search key information. Is identified. In this embodiment, the similarity is calculated as the similarity determination. Here, weight information referred to in the calculation will be described.

図5乃至図8は、それぞれ重み情報記憶部25に登録された階層関係、位置、サイズ及び親等に関する重み情報の一例を示した図である。各項目につき、各レベルにより重み(値)を予め設定することで客観性を持たせている。   FIGS. 5 to 8 are diagrams showing examples of weight information related to the hierarchical relationship, position, size, parent, etc., registered in the weight information storage unit 25, respectively. Each item has objectivity by setting a weight (value) in advance for each level.

階層関係に関する重み情報は、最下位に位置する属性には重み1.0を、その直上位の階層に位置する属性には重み0.8を、というように最下位から上位に向けて値が小さくなるように重みが設定される。なお、階層の数は図4の例に限定されるものではなく、文書の種類等に含まれる構成要素を考慮して増減させてよい。   The weight information related to the hierarchical relationship has a value of 1.0 for the attribute located at the lowest level, 0.8 for the attribute located immediately above the hierarchy, and so on. The weight is set to be smaller. Note that the number of hierarchies is not limited to the example of FIG. 4 and may be increased or decreased in consideration of components included in the document type and the like.

位置に関する重み情報には、検索キー情報に配置された構成要素の位置と、当該構成要素に対応する、比較対象となる文書画像に含まれる構成要素の位置との差に対する重みが設定される。つまり、±2cm以内のずれであれば、ユーザは、仮想紙面上に構成要素を、検索したい文書に含まれる構成要素と同じ位置に配置したとみなして、最も大きい重み1.0を設定する。つまり、2cm以下のずれを許容範囲としている。次の「≦±5cm」というのは、正確には2cmより大きく5cm以下のずれということを意味しているが、このずれは、記憶が曖昧なことに基づくものであることから、0.8と、より小さい値の重みが設定される。なお、構成要素の位置は、例えば、文書紙面の左上の角を原点座標とし、矩形形状の構成要素の左上角の座標データを得て、この座標データを比較することによって位置の比較を行ってもよい。   In the weight information regarding the position, a weight is set for the difference between the position of the component arranged in the search key information and the position of the component included in the document image to be compared corresponding to the component. That is, if the deviation is within ± 2 cm, the user sets the largest weight 1.0 on the assumption that the component is placed on the virtual paper at the same position as the component included in the document to be searched. That is, an allowable range is a deviation of 2 cm or less. The next “≦ ± 5 cm” means that the deviation is more than 2 cm and not more than 5 cm, but this deviation is based on the fact that the memory is ambiguous. And a smaller weight is set. For example, the position of the constituent element is obtained by comparing the position by obtaining the coordinate data of the upper left corner of the rectangular-shaped constituent element using the upper left corner of the document paper as the origin coordinate and comparing the coordinate data. Also good.

サイズに関する重み情報には、検索キー情報に配置された構成要素の大きさと、当該構成要素に対応する、比較対象となる文書画像に含まれる構成要素の大きさとの差に対する重みが設定される。つまり、面積が±1cm以内のずれであれば、ユーザは、仮想紙面上に構成要素を、検索したい文書に含まれる構成要素と同じ大きさで配置したとみなして、最も大きい重み1.0を設定する。次の「≦±3cm」というのは、正確には1cmより大きく3cm以下のずれということを意味しているが、このずれは、記憶が曖昧なことに基づくものであることから、0.8と、より小さい値の重みが設定される。なお、構成要素の大きさは、例えば、仮想紙面の左上の角を原点座標とし、矩形形状の構成要素の左上角及び右下角の各座標データを得ることで面積を算出し、この面積を比較することによって大きさの比較を行ってもよい。また、本実施の形態では、サイズを表す指標として面積を用いたが、例えば矩形形状の構成要素の縦の辺と横の辺の和を用いてもよい。 In the weight information regarding the size, a weight is set for a difference between the size of the component arranged in the search key information and the size of the component included in the document image to be compared corresponding to the component. That is, if the area is within ± 1 cm 2 , the user considers that the component is arranged on the virtual paper with the same size as the component included in the document to be searched, and the largest weight is 1.0. Set. Next By "≦ ± 3 cm 2", since it precisely which means that large 3 cm 2 or less displacement than 1 cm 2, this shift is to store is based on that ambiguous, A smaller value of 0.8 is set. The size of the component is calculated by, for example, calculating the area by obtaining the coordinate data of the upper left corner and the lower right corner of the rectangular component, using the upper left corner of the virtual paper as the origin coordinate, and comparing this area The size may be compared by doing so. In the present embodiment, the area is used as an index indicating the size. However, for example, the sum of the vertical side and the horizontal side of a rectangular component may be used.

以上の重みの設定値の例から明らかなように、重みの各値は、検索対象となる文書画像の属性、紙面上における位置及び大きさに対する記憶が鮮明であるほど重たくし、つまり、大きい値を設定し、算出される類似度が大きくなるようにしている。換言すると、このような重みを設定することで、検索結果への影響度を大きくしている。   As is clear from the example of the weight setting values described above, each weight value is made heavier as the memory for the attribute of the document image to be searched, the position and size on the paper is clearer, that is, a larger value. Is set to increase the calculated similarity. In other words, setting such weights increases the degree of influence on search results.

なお、位置に関する重み情報は、「≦±2cm」や「≦±5cm」などの刻みで位置ずれの量を4分割したが、±2cmや±5cmなどの刻みや分割数は、検索対象とする文書の種類や、用紙サイズ等に応じて適切な値を設定すればよい。また、重みの値は、図に例示した値に限定されるものではなく、検索対象とする文書の種類や、用紙サイズ等に応じて適切な値を設定すればよい。   In addition, as for the weight information regarding the position, the amount of positional deviation is divided into four in increments such as “≦ ± 2 cm” and “≦ ± 5 cm”, but the increment and the number of divisions such as ± 2 cm and ± 5 cm are the search targets. An appropriate value may be set according to the document type, paper size, and the like. The weight value is not limited to the values illustrated in the figure, and an appropriate value may be set according to the type of document to be searched, the paper size, and the like.

最後に、親等に関する重み情報に関して説明する。例えば、本実施の形態では、属性の階層関係において「絵柄」の直下位には「図表」「線画」「写真」という属性が設定されているが、この場合、「絵柄」と「図表」「線画」「写真」とを親子関係(直系)にあると考える。また、同階層にある「図表」「線画」「写真」を兄弟関係(傍系)にあると考える。前述した階層関係に関する重み情報が親・子・孫といった直系の関係にある属性間、すなわち階層関係上、上下関係に位置する属性間に反映される重み情報であるのに対し、この親等に関する重み情報は、直系の関係にない(傍系の関係にある)属性に対して付与する重みが設定されている。例えば、検索キー情報に階層3の「カラー」(以下、「カラー線画」とも称する)と設定されたものの、実際に検索して見つけたい文書画像は階層3の「白黒」(以下、「白黒線画」とも称する)であった場合、これは2親等に相当するが、階層関係に関する重みでは0となってしまう。このように遠くない関係にある属性が設定された場合には、ユーザの属性のわずかな記憶違いを救済するために、階層関係に関する重みと比して低い重みを付与する親等に関する重み情報を設けるようにしてもよい。比較対象となる文書画像に含まれる構成要素と検索キー情報に配置された構成要素とが1親等の関係にある場合は、直系に相当するため、階層関係に関する重みを採用するものとし、比較対象となる文書画像に含まれる構成要素とが直系ではないが2親等の関係にある場合に重み0.4を、3親等の関係にある場合に重み0.2をそれぞれ設定する。   Finally, the weight information related to the parent will be described. For example, in the present embodiment, attributes such as “chart”, “line drawing”, and “photograph” are set immediately below “picture” in the hierarchical relationship of attributes, but in this case, “picture” and “chart” “ Think of line art and photography as having a parent-child relationship (direct line). In addition, “chart”, “line drawing”, and “photograph” in the same hierarchy are considered to be in a sibling relationship (sideline). The weight information related to the hierarchical relationship described above is weight information reflected between attributes having a direct relationship such as parent / child / grandchild, that is, between attributes positioned in a hierarchical relationship in the hierarchical relationship. In the information, a weight to be given to an attribute that is not in a direct relationship (in a side relationship) is set. For example, although the search key information is set to “Color” of level 3 (hereinafter also referred to as “color line drawing”), the document image that is actually searched and found is “black and white” (hereinafter referred to as “black and white line drawing” of level 3). ”), This corresponds to a second-degree parent, but the weight related to the hierarchical relationship is zero. When attributes that are not far from each other are set in this way, weight information related to a parent or the like that gives a lower weight than the weight related to the hierarchical relationship is provided in order to relieve a slight memory difference of the user attributes. You may do it. When the component included in the document image to be compared and the component arranged in the search key information are in a first-degree relationship, since it corresponds to a direct line, the weight related to the hierarchical relationship is adopted, and the comparison target A weight of 0.4 is set when the component included in the document image is not a direct line but is in a relationship of two parents, and a weight of 0.2 is set in a relationship of three parents.

図9は、前述した検索キー情報生成処理において生成された検索キー情報の一例を示した図である。図9には、階層4の属性「棒グラフ」が紙面右上に、階層2の属性「写真」が紙面左下に、それぞれ図示された大きさで配置された検索キー情報の例が示されている。また、図10(a)〜(d)にはそれぞれ、その上段に検索キー情報と比較される文書画像(以下、「比較画像」とも称する)の一例と、その下段に当該文書画像から算出される類似度が示されている。以下、これらの図を用いて、文書検索部22が文書を検索する際に行う類似度の算出について説明する。なお、比較対象となる文書画像に関する構成要素の属性は、最下位に位置する属性が設定されているものとする。   FIG. 9 is a diagram showing an example of search key information generated in the search key information generation process described above. FIG. 9 shows an example of search key information in which the attribute “bar graph” of the hierarchy 4 is arranged in the illustrated size on the upper right side of the page and the attribute “photo” of the hierarchy 2 is arranged on the lower left side of the page. 10A to 10D each show an example of a document image (hereinafter also referred to as “comparison image”) to be compared with the search key information in the upper row and calculated from the document image in the lower row. Similarity is shown. Hereinafter, the calculation of similarity when the document search unit 22 searches for a document will be described with reference to these drawings. It is assumed that the attribute of the constituent element related to the document image to be compared is set to the attribute positioned at the lowest level.

まず、図10(a)の上段に例示された文書画像が比較対象として選択されたとする。この比較画像は、階層4の属性「棒グラフ」が紙面右上に、階層3の属性「人物」(以下、「人物写真」と称する)が紙面左下に、それぞれ図示された大きさで配置された文書画像の例であり、検索キー情報と比較画像の各構成要素の位置及び大きさは一致しているものとする。この場合、まず「棒グラフ」に着目すると、属性は一致しているため、図5に示した属性情報を参照することにより階層関係に関する重みは1.0である。そして、前述したように位置及び大きさは一致するので、図6,7に示した属性情報を参照することにより位置及び大きさの重みはそれぞれ1.0となる。なお、属性が一致する場合、親等は同一であるため考慮しない。それぞれの項目についての重みが決定すると、これらを乗算することで「棒グラフ」との類似度は1.0×1.0×1.0=1.0と算出される。   First, it is assumed that the document image illustrated in the upper part of FIG. 10A is selected as a comparison target. This comparison image is a document in which the attribute “bar graph” of the layer 4 is arranged at the upper right side of the page and the attribute “person” (hereinafter referred to as “person photograph”) of the layer 3 is arranged in the illustrated size on the lower left side of the page. It is an example of an image, and it is assumed that the position and size of each component of the search key information and the comparison image are the same. In this case, first, focusing on the “bar graph”, since the attributes match, the weight related to the hierarchical relationship is 1.0 by referring to the attribute information shown in FIG. Since the position and size match as described above, the weight of the position and size becomes 1.0 by referring to the attribute information shown in FIGS. If the attributes match, the parents are the same and are not considered. When the weight for each item is determined, the similarity with the “bar graph” is calculated as 1.0 × 1.0 × 1.0 = 1.0 by multiplying these items.

続いて、「人物写真」に着目すると、検索キー情報の「写真」は1階層上位なので、この場合階層関係に関する重みは図5に示した属性情報を参照すると0.8であることがわかる。そして、前述したように位置及び大きさは一致するので、図6,7に示した属性情報を参照することにより位置及び大きさの重みはそれぞれ1.0となる。なお、検索キー情報に配置された構成要素と比較画像の構成要素の属性の関係が直系の場合、親等は考慮しない。それぞれの項目についての重みが決定すると、これらを乗算することで「人物写真」との類似度は0.8×1.0×1.0=0.8と算出される。この結果、図10(a)の比較画像との類似度は1.0+0.8=1.8と算出される。   Subsequently, focusing on “person photograph”, “photograph” in the search key information is one layer higher, and in this case, it can be seen that the weight related to the layer relationship is 0.8 when referring to the attribute information shown in FIG. Since the position and size match as described above, the weight of the position and size becomes 1.0 by referring to the attribute information shown in FIGS. In addition, when the relationship between the attributes of the constituent elements arranged in the search key information and the constituent elements of the comparative image is direct, the parent is not considered. When the weight for each item is determined, the similarity with “person photograph” is calculated as 0.8 × 1.0 × 1.0 = 0.8 by multiplying them. As a result, the similarity with the comparative image in FIG. 10A is calculated as 1.0 + 0.8 = 1.8.

次に、図10(b)の上段に例示された文書画像が比較対象として選択されたとする。この比較画像は、階層4の属性「棒グラフ」が紙面右上に、階層3の属性「白黒」(以下、「白黒線画」と称する)が紙面左下に、それぞれ図示された大きさで配置された文書画像の例であり、検索キー情報と比較画像の各構成要素の位置及び大きさは一致しているものとする。この場合、「棒グラフ」に関しては、図10(a)と同じなので、説明を省略する。なお、「棒グラフ」との類似度は1.0である。   Next, it is assumed that the document image illustrated in the upper part of FIG. 10B is selected as a comparison target. This comparison image is a document in which the level 4 attribute “bar graph” is arranged in the upper right of the page and the level 3 attribute “black and white” (hereinafter referred to as “black and white line drawing”) is arranged in the size shown in the figure. It is an example of an image, and it is assumed that the position and size of each component of the search key information and the comparison image are the same. In this case, the “bar graph” is the same as FIG. The similarity with the “bar graph” is 1.0.

続いて、「白黒線画」に着目すると、検索キー情報の「写真」とは直系ではないが3親等の関係にあるので、親等の重みは、図8に示した属性情報を参照すると0.2であることがわかる。直系でない場合は、階層関係に関する重みにかえて親等の重みを採用して類似度を算出する。そして、前述したように位置及び大きさは一致するので、図6,7に示した属性情報を参照することにより位置及び大きさの重みはそれぞれ1.0となる。すなわち、「白黒線画」との類似度は0.2×1.0×1.0=0.2と算出される。この結果、図10(b)の比較画像との類似度は1.0+0.2=1.2と算出される。   Next, focusing on “black and white line drawing”, the search key information “photo” is not directly related, but has a relationship of three parents, so that the weight of the parent is 0.2 when referring to the attribute information shown in FIG. It can be seen that it is. If it is not a direct system, the similarity is calculated by adopting the weight of the parent in place of the weight related to the hierarchical relationship. Since the position and size match as described above, the weight of the position and size becomes 1.0 by referring to the attribute information shown in FIGS. That is, the similarity to “monochrome line drawing” is calculated as 0.2 × 1.0 × 1.0 = 0.2. As a result, the similarity with the comparative image in FIG. 10B is calculated as 1.0 + 0.2 = 1.2.

次に、図10(c)の上段に例示された文書画像が比較対象として選択されたとする。この比較画像は、階層3の属性「カラー線画」が紙面右上に、階層3の属性人物写真が紙面左下に、それぞれ図示された大きさで配置された文書画像の例であり、検索キー画像と比較画像の各構成要素の位置及び大きさは一致しているものとする。この場合、まず「カラー線画」に着目すると、検索キー情報の「写真」とは直系ではないが5親等の位置関係にあるので、親等の重みを参照すると、親等の重みは0となる。そして、前述したように位置及び大きさは一致するので、図6,7に示した属性情報を参照することにより位置及び大きさの重みはそれぞれ1.0となる。よって、「カラー線画」との類似度は0×1.0×1.0+0=0と算出される。   Next, it is assumed that the document image illustrated in the upper part of FIG. 10C is selected as a comparison target. This comparison image is an example of a document image in which the attribute “color line drawing” of the hierarchy 3 is arranged in the size shown in the figure on the upper right side of the page and the attribute personal photograph of the hierarchy 3 is arranged on the lower left side of the page. It is assumed that the position and size of each component of the comparison image are the same. In this case, paying attention to the “color line drawing”, since it is not directly related to the “photograph” of the search key information but is in a positional relationship of five parents, the weight of the parent is 0 when the weight of the parent is referred. Since the position and size match as described above, the weight of the position and size becomes 1.0 by referring to the attribute information shown in FIGS. Therefore, the similarity with “color line drawing” is calculated as 0 × 1.0 × 1.0 + 0 = 0.

続いて、「人物写真」に関しては、図10(a)と同じなので、説明を省略する。なお、「人物写真」との類似度は0.8である。この結果、図10(c)の比較画像との類似度は0+0.8=0.8と算出される。   Subsequently, since “person photograph” is the same as FIG. 10A, description thereof is omitted. Note that the degree of similarity with the “person photograph” is 0.8. As a result, the similarity with the comparative image in FIG. 10C is calculated as 0 + 0.8 = 0.8.

最後に、図10(d)の上段に例示された文書画像が比較対象として選択されたとする。この比較画像は、階層4の属性「棒グラフ」が紙面左下に、階層3の属性「風景」(以下、「風景写真」とも称する)が紙面右下に、それぞれ図示された大きさで配置された文書画像の例である。この場合、まず「棒グラフ」に着目すると、属性は一致しているため、図5に示した属性情報を参照することにより階層関係に関する重みは1.0である。そして、位置に関しては、10cmより大きくずれているとすると、位置の重みは図6に示した属性情報を参照することにより0.2と求まる。大きさに関しては、1cmより大きいが3cm以内の差があるものとすると、大きさの重みは、図7に示した属性情報を参照することにより0.8と求まる。なお、属性は一致するので親等は考慮しない。よって、「棒グラフ」との類似度は1.0×0.2×0.8=0.16と算出される。 Finally, it is assumed that the document image illustrated in the upper part of FIG. 10D is selected as a comparison target. In this comparative image, the level 4 attribute “bar graph” is arranged at the lower left of the page, and the level 3 attribute “landscape” (hereinafter also referred to as “landscape photograph”) is arranged at the size shown in the figure. It is an example of a document image. In this case, first, focusing on the “bar graph”, since the attributes match, the weight related to the hierarchical relationship is 1.0 by referring to the attribute information shown in FIG. Assuming that the position is shifted more than 10 cm, the position weight is found to be 0.2 by referring to the attribute information shown in FIG. Assuming that the size is larger than 1 cm 2 but within 3 cm 2 , the size weight can be obtained as 0.8 by referring to the attribute information shown in FIG. In addition, since the attribute matches, the parent is not considered. Therefore, the similarity with the “bar graph” is calculated as 1.0 × 0.2 × 0.8 = 0.16.

続いて、「風景写真」に着目すると、検索キー情報の「写真」は1階層上位なので、この場合の階層関係に関する重みは図5に示した属性情報を参照すると0.8であることがわかる。そして、位置に関しては、2cmより大きく5cm以内のずれがあるとすると、位置の重みは図6に示した属性情報を参照することにより0.8と求まる。大きさに関しては、1cmより大きいが3cm以内の差があるものとすると、大きさの重みは、図7に示した属性情報を参照することにより0.8と求まる。なお、属性は直系の関係にあるので親等は考慮しない。よって、「風景写真」との類似度は0.8×0.8×0.8=0.512と算出される。この結果、図10(d)の比較画像との類似度は0.16+0.512=0.672と算出される。 Next, focusing on “landscape photos”, the “photo” of the search key information is one level higher, and it can be seen that the weight related to the hierarchical relationship in this case is 0.8 when referring to the attribute information shown in FIG. . Then, regarding the position, if there is a deviation larger than 2 cm and within 5 cm, the weight of the position can be obtained as 0.8 by referring to the attribute information shown in FIG. Assuming that the size is larger than 1 cm 2 but within 3 cm 2 , the size weight can be obtained as 0.8 by referring to the attribute information shown in FIG. In addition, since the attribute has a direct relationship, the relatives are not considered. Therefore, the similarity with “landscape photograph” is calculated as 0.8 × 0.8 × 0.8 = 0.512. As a result, the similarity to the comparative image in FIG. 10D is calculated as 0.16 + 0.512 = 0.672.

以上の処理の結果、図10の中で検索キー情報に類似している順番は、(a),(b),(c),(d)となる。   As a result of the above processing, the order similar to the search key information in FIG. 10 is (a), (b), (c), (d).

以上のようにして検索キー情報に類似している文書画像を特定すると、検索結果表示部23は、所定の表示規則に従い、文書画像を類似している順番に所定数並べて表示したり、最も類似している文書画像のみを表示したり、所定の閾値以上の類似度の文書画像を表示する。あるいは、文書画像そのものではなく、格納先等文書画像に関連する情報を表示するようにしてもよい。   When a document image similar to the search key information is specified as described above, the search result display unit 23 displays a predetermined number of document images in a similar order according to a predetermined display rule, or displays the most similar image. Only the document image being displayed is displayed, or a document image having a similarity equal to or higher than a predetermined threshold is displayed. Alternatively, information related to the document image such as a storage destination may be displayed instead of the document image itself.

1 CPU、2 ROM、3 RAM、4 ハードディスクドライブ(HDD)、5 HDDコントローラ、6 マウス、7 キーボード、8 ディスプレイ、9 入出力コントローラ、10 ネットワークコントローラ、11 内部バス、20 文書検索装置、21 検索キー情報生成部、22 文書検索部、23 検索結果表示部、24 属性情報記憶部、25 重み情報記憶部。
1 CPU, 2 ROM, 3 RAM, 4 hard disk drive (HDD), 5 HDD controller, 6 mouse, 7 keyboard, 8 display, 9 I / O controller, 10 network controller, 11 internal bus, 20 document search device, 21 search key Information generation unit, 22 Document search unit, 23 Search result display unit, 24 Attribute information storage unit, 25 Weight information storage unit.

Claims (5)

用紙を表示する表示手段と、
表示された用紙上に配置される構成要素に設定可能な属性の階層関係が定義された属性情報を記憶する記憶手段と、
ユーザに、表示された用紙上に1又は複数の構成要素を配置させると共に、配置された各構成要素に、前記属性情報に定義された属性の中からユーザに選択された属性を設定することによって検索キー情報を生成する生成手段と、
文書検索を行う際に、検索キー情報に含まれる構成要素に設定された属性が前記属性情報において定義された階層関係において最下位層に近いほど算出する類似度が大きくなるように設定された重みを用いて、検索キー情報と検索対象文書との類似度を算出し、その類似度を参照して検索キー情報に類似する文書を特定する検索手段と、
を有することを特徴とする文書検索装置。
Display means for displaying paper;
Storage means for storing attribute information in which a hierarchical relationship of attributes that can be set for the components arranged on the displayed paper is defined;
By causing the user to arrange one or a plurality of components on the displayed paper, and setting an attribute selected by the user from among the attributes defined in the attribute information for each of the arranged components Generating means for generating search key information;
Weight set so that the similarity calculated when the attribute set in the constituent elements included in the search key information is closer to the lowest layer in the hierarchical relationship defined in the attribute information when performing a document search A search means for calculating a similarity between the search key information and the search target document, and specifying a document similar to the search key information with reference to the similarity;
A document search apparatus characterized by comprising:
前記検索手段は、検索キー情報に含まれる構成要素の紙面上における位置が、当該構成要素に対応する検索対象文書に含まれる構成要素と近いほど算出する類似度が大きくなるように設定された重みを用いて、検索キー情報と検索対象文書との類似度を算出することを特徴とする請求項1に記載の文書検索装置。   The search means sets a weight that is set so that the degree of similarity to be calculated increases as the position of the component included in the search key information on the paper is closer to the component included in the search target document corresponding to the component. The document search apparatus according to claim 1, wherein the similarity between the search key information and the search target document is calculated by using. 前記検索手段は、検索キー情報に含まれる構成要素の大きさが、当該構成要素に対応する検索対象文書に含まれる構成要素と近いほど算出する類似度が大きくなるように設定された重みを用いて、検索キー情報と検索対象文書との類似度を算出することを特徴とする請求項1または2に記載の文書検索装置。   The search means uses a weight set so that the degree of similarity to be calculated increases as the size of the component included in the search key information is closer to the component included in the search target document corresponding to the component. The document search apparatus according to claim 1, wherein the similarity between the search key information and the search target document is calculated. 前記検索手段は、検索キー情報に含まれる構成要素と、当該構成要素に対応する検索対象文書に含まれる構成要素とが、前記階層関係上近い親等にあるほど算出する類似度が大きくなるように設定された重みを用いて、検索キー情報と検索対象文書との類似度を算出することを特徴とする請求項1から3のいずれか1項に記載の文書検索装置。   The search means increases the degree of similarity calculated as the component included in the search key information and the component included in the search target document corresponding to the component are closer to each other in the hierarchical relationship. 4. The document search apparatus according to claim 1, wherein a similarity between the search key information and the search target document is calculated using the set weight. 5. コンピュータを、
用紙を表示する表示手段、
表示された用紙上に配置される構成要素に設定可能な属性の階層関係が定義された属性情報を記憶する記憶手段、
ユーザに、表示された用紙上に1又は複数の構成要素を配置させると共に、配置された各構成要素に、前記属性情報に定義された属性の中からユーザに選択された属性を設定することによって検索キー情報を生成する生成手段、
文書検索を行う際に、検索キー情報に含まれる構成要素に設定された属性が前記属性情報において定義された階層関係において最下位層に近いほど算出する類似度が大きくなるように設定された重みを用いて、検索キー情報と検索対象文書との類似度を算出し、その類似度を参照して検索キー情報に類似する文書を特定する検索手段、
として機能させる文書検索プログラム。
Computer
Display means for displaying paper,
Storage means for storing attribute information in which a hierarchical relationship of attributes that can be set for the components arranged on the displayed paper is defined;
By causing the user to arrange one or a plurality of components on the displayed paper, and setting an attribute selected by the user from among the attributes defined in the attribute information for each of the arranged components Generating means for generating search key information;
Weight set so that the similarity calculated when the attribute set in the constituent elements included in the search key information is closer to the lowest layer in the hierarchical relationship defined in the attribute information when performing a document search A search means for calculating the similarity between the search key information and the search target document and identifying a document similar to the search key information with reference to the similarity;
Document search program to function as.
JP2010036333A 2010-02-22 2010-02-22 Document search device and document search program Pending JP2011170778A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010036333A JP2011170778A (en) 2010-02-22 2010-02-22 Document search device and document search program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010036333A JP2011170778A (en) 2010-02-22 2010-02-22 Document search device and document search program

Publications (1)

Publication Number Publication Date
JP2011170778A true JP2011170778A (en) 2011-09-01

Family

ID=44684809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010036333A Pending JP2011170778A (en) 2010-02-22 2010-02-22 Document search device and document search program

Country Status (1)

Country Link
JP (1) JP2011170778A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013190973A (en) * 2012-03-13 2013-09-26 Nec Corp System and method for retrieving similar document using diagram information in document
JP2016536674A (en) * 2013-10-07 2016-11-24 オラクル・インターナショナル・コーポレイション Removing attribute redundancy

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013190973A (en) * 2012-03-13 2013-09-26 Nec Corp System and method for retrieving similar document using diagram information in document
US9378248B2 (en) 2012-03-13 2016-06-28 Nec Corporation Retrieval apparatus, retrieval method, and computer-readable recording medium
JP2016536674A (en) * 2013-10-07 2016-11-24 オラクル・インターナショナル・コーポレイション Removing attribute redundancy
US10579602B2 (en) 2013-10-07 2020-03-03 Oracle International Corporation Attribute redundancy removal

Similar Documents

Publication Publication Date Title
RU2583727C2 (en) Dynamic image presentation
JP4902499B2 (en) Image display device, image display method, and image display system
JP5062884B2 (en) Image search apparatus, image search method and program
JP4413844B2 (en) Image display control device
JP2011028749A (en) Scalable indexing for layout based document retrieval and ranking
JP2006504150A (en) Apparatus and method for distributing representation images to partitioned regions of a three-dimensional graphic environment
US9791971B2 (en) Registration of electronic displays
JP2007317034A (en) Image processing apparatus, image processing method, program, and recording medium
US20150220647A1 (en) Interactive GUI for clustered search results
EP3918486A1 (en) Search and ranking of records across different databases
JP4478454B2 (en) Layout design apparatus and design method for 3D graphic environment
JP2009245162A (en) Display control device, display control method, and display control program
JP2011170778A (en) Document search device and document search program
US20100250631A1 (en) Information processor, electronic file managing device, electronic file managing system, and computer readable medium
JP2014075106A (en) Information processor and program
JP6441142B2 (en) Search device, method and program
JP5298616B2 (en) Information presenting apparatus, information presenting method, and information presenting program
JP2010073194A (en) Image processing device, image processing method, and program
JP2012014486A (en) Information processing device, information processing method and program
AU2010282211B2 (en) Method, system and controller for searching a database
JP2011145796A (en) Device and program for supporting generation of retrieval key information
US8645864B1 (en) Multidimensional data input interface
CA2850738A1 (en) Graphical user interface that presents selectable items in a user-traversable passageway
JP2012181701A (en) Information display device and information display method
JP2011253443A (en) Data processor