JP2008234226A - Retrieval device and retrieval method - Google Patents
Retrieval device and retrieval method Download PDFInfo
- Publication number
- JP2008234226A JP2008234226A JP2007071625A JP2007071625A JP2008234226A JP 2008234226 A JP2008234226 A JP 2008234226A JP 2007071625 A JP2007071625 A JP 2007071625A JP 2007071625 A JP2007071625 A JP 2007071625A JP 2008234226 A JP2008234226 A JP 2008234226A
- Authority
- JP
- Japan
- Prior art keywords
- search
- behavior
- shape
- object defined
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、形状と挙動を検索キーとして検索する技術に関する。 The present invention relates to a technique for searching using a shape and behavior as a search key.
従来、文書を検索する際に、その文書に含まれる単語を検索キーとして検索するシステムがあった。また、画像検索として、テンプレートや色、その色の占める割合等を判定して類似の画像を検索するシステムがあった。 Conventionally, when searching for a document, there has been a system for searching for a word contained in the document as a search key. In addition, as an image search, there has been a system for searching for a similar image by determining a template, a color, a ratio occupied by the color, and the like.
さらに、画像中のテキストを抽出し、検索することができる技術が開示されている(例えば、特許文献1参照)。 Furthermore, a technique capable of extracting and searching for text in an image is disclosed (for example, see Patent Document 1).
なお、ズーミング操作に伴ってコンテンツがズーミングする技術が開示されている(例えば、特許文献2参照)。
しかしながら、視覚的効果の向上を図るべく、形状の挙動で表現する場合もある。例えば、マイクロソフト社のPowerPoint(登録商標)のような文書において適用されている。 However, in order to improve the visual effect, it may be expressed by the behavior of the shape. For example, it is applied to documents such as Microsoft's PowerPoint (registered trademark).
この場合、従来技術による検索では、挙動という概念を扱っていないため有効性が少ない。また、検索対象数が増加するため、処理時間が長くなるという課題があった。 In this case, the search by the prior art is not effective because it does not deal with the concept of behavior. Further, since the number of search objects increases, there is a problem that the processing time becomes long.
そこで、本発明では、形状と挙動で規定されるオブジェクトの検索を有効に行うことを目的とする。 Accordingly, an object of the present invention is to effectively search for an object defined by a shape and a behavior.
請求項1記載の発明は、検索キーとして取得した形状と挙動に基づいて記憶装置に記憶されている形状と挙動で規定されるオブジェクトを検索し、検索キーに合致する形状と挙動で規定されるオブジェクトを抽出することを特徴とする検索装置である。
The invention described in
請求項2記載の発明は、請求項1記載の検索装置において、さらに検索キーとしてキーワードを取得し、そのキーワードを用いて前記抽出されたオブジェクトを検索し、前記キーワードに合致するテキストが付された形状と挙動で規定されるオブジェクトを抽出することを特徴とする。 According to a second aspect of the present invention, in the search device according to the first aspect, a keyword is further acquired as a search key, the extracted object is searched using the keyword, and a text that matches the keyword is attached. It is characterized by extracting objects defined by shape and behavior.
請求項3記載の発明は、請求項1または2記載の検索装置において、形状と挙動で規定されるオブジェクトを再生した際の各フレーム間の差分から、異なる媒体を含む場合でも各媒体に対して統一的な検索をするための特徴情報を抽出し、検索することを特徴とする。
The invention according to
請求項4記載の発明は、検索装置が、検索キーとして取得した形状と挙動に基づいて記憶装置に記憶されている形状と挙動で規定されるオブジェクトを検索し、検索キーに合致する形状と挙動で規定されるオブジェクトを抽出することを特徴とする検索方法である。
In the invention according to
請求項5記載の発明は、請求項4記載の検索方法において、検索装置が、さらに検索キーとしてキーワードを取得し、そのキーワードを用いて前記抽出されたオブジェクトを検索し、前記キーワードに合致するテキストが付された形状と挙動で規定されるオブジェクトを抽出することを特徴とする。
The invention according to
請求項6記載の発明は、請求項4または5記載の検索方法において、検索装置が、形状と挙動で規定されるオブジェクトを再生した際の各フレーム間の差分から、異なる媒体を含む場合でも各媒体に対して統一的な検索をするための特徴情報を抽出し、検索することを特徴とする。
The invention according to
本発明によれば、形状と挙動で規定されるオブジェクトの検索を有効に行うことができる。 According to the present invention, it is possible to effectively search for an object defined by shape and behavior.
図1は本発明の第1の実施形態における検索装置1の装置構成を説明する図である。インデックス作成部は、形状と挙動で規定されるオブジェクトを含む文書等から形状と挙動で規定されるオブジェクトの特徴を抽出し、検索のための情報を作成する機能を有している。文書等から形状と挙動で規定されるオブジェクトを抽出する部分と、抽出した形状と挙動で規定されるオブジェクトから特徴を抽出する部分と、抽出した情報から検索用インデックスを作成する部分から構成される。
FIG. 1 is a diagram illustrating a device configuration of a
検索・閲覧部は、インデックス作成部により作成された情報を利用し、形状と挙動で規定されるオブジェクトの特徴を記述したキーワード等により、ネットワーク上等の任意の記憶装置や自装置である検索装置1の記憶部等に記憶されている形状と挙動で規定されるオブジェクトを検索し、抽出した形状と挙動で規定されるオブジェクトを含む文書等を閲覧・表示する機能を有している。検索クエリからキーワードを抽出する部分と、キーワードからインデックスにより検索する部分と、検索結果を表示する部分から構成される。
The search / browsing unit uses the information created by the index creation unit, and uses a keyword describing the characteristics of the object defined by the shape and behavior, etc., on the network, etc. It has a function of searching for an object defined by the shape and behavior stored in the
形状の取り込みはスキャナやネットワーク回線等を介して行う。 The shape is taken in via a scanner or a network line.
図2は、検索装置1の構成を示すブロック図である。CPU(Central Processing Unit)2と、ROM(Read Only Memory)3と、RAM(Random Access Memory)4と、HDD(Hard Disk Drive)5と、ネットワークインタフェース6と、キーボード7やマウス8等の入力部と、ディスプレイ9とから構成され、これらの間のデータ通信をバスコントローラが調停して動作している。
FIG. 2 is a block diagram showing the configuration of the
HDD5には、検索キーとなり得る形状と挙動についての情報が所定のテーブルに格納されている。例えば、挙動を示す"ディゾルブ"、"フェードイン" や、形状を示す"四角形"、"矢印"等である。これにより、例えば、"赤い四角形の箱がフェードィンする"といったクエリで文書等の検索ができる。なお、上述の所定のテーブルの保存場所はHDD5に限定されなくネットワーク上等であってもよい。
The
次に、本実施の形態の動作を図面を参照して詳細に説明する。 Next, the operation of the present embodiment will be described in detail with reference to the drawings.
図3のフローチャートを参照すると、まず、検索装置1はクエリの抽出を行う(S31)。その際に、例えば、図4に示すような画面がディスプレイ9に表示され、ユーザからのクエリの指定を受け付ける。なお、手書きによる形状と挙動の一方あるいは両者の指定が可能であっても良い。
Referring to the flowchart of FIG. 3, first, the
次に、検索装置1は抽出したクエリが、HDD5の所定のテーブルに格納されている、検索キーとなり得る形状と挙動についての情報と合致するか否かを判定する(S32)。
Next, the
合致する場合(S32/Yes)、検索キーとなる形状と挙動に基づいて文書等の検索を実行する(S33、34)。すなわち、検索キーとなる形状と挙動に基づいて、ネットワーク上等の任意の記憶装置や自装置である検索装置1の記憶部等に記憶されている形状と挙動で規定されるオブジェクトを検索し、検索キーに合致する形状と挙動で規定されるオブジェクトを抽出する。なお、形状と挙動で規定されるオブジェクトが格納されている記憶装置、記憶部は上記の例に限定されなく、すべての記憶手段を含む。一例として、図5には検索キーが「箱、左、スライドイン」の場合を示す。この場合には、検索結果として図5に示すような形状と挙動で規定されるオブジェクトが抽出される。
If they match (S32 / Yes), a search for a document or the like is executed based on the shape and behavior as a search key (S33, 34). That is, based on the shape and behavior as a search key, search for an object defined by the shape and behavior stored in an arbitrary storage device on the network or the storage unit of the
また、他の例として、図6には検索クエリが、形状と挙動の両者について手書きによる場合を示す。まず、挙動を示すデータを取得して、差分で形状のデータを取得する。なお、挙動を示すデータのテーブルは予め保持しているものとする。ここでは、挙動が「左、スライドイン」であり、形状が「箱」であるとして解釈され、検索結果として図6に示すような形状と挙動で規定されるオブジェクトが抽出される。 As another example, FIG. 6 shows a case where the search query is handwritten for both shape and behavior. First, data indicating behavior is acquired, and shape data is acquired using a difference. It is assumed that a data table indicating behavior is stored in advance. Here, the behavior is interpreted as “left, slide-in” and the shape is “box”, and an object defined by the shape and behavior as shown in FIG. 6 is extracted as a search result.
そして、検索装置1は検索結果を表示する(S35)。例えば、図7に示すような画面をディスプレイ9に表示する。また、例えば、図8に示すような形状と挙動を併記した態様の画面をディスプレイ9に表示することであってもよい。
Then, the
なお、検索結果を表示する際には、既知のズーミングに関する技術を適用し、例えば、図9に示すような態様で表示してもよい。 When displaying the search result, a known zooming technique may be applied, and for example, the search result may be displayed as shown in FIG.
上述の本実施の形態によれば、形状と挙動で規定されるオブジェクトを含む大量の文書を検索する際に、文書中のテキスト部分の検索だけでなく、形状と挙動で規定されるオブジェクトの動きも検索のキーワードとして利用することで、形状と挙動で規定されるオブジェクトを含む文書に対する新しい検索手段の提供を通して利用者の利便性を増し、また、検索結果の精度向上を図ることができる。 According to the above-described embodiment, when searching a large number of documents including objects defined by the shape and behavior, not only the text portion in the document but also the movement of the object defined by the shape and behavior. Also as a search keyword, it is possible to increase convenience for the user through provision of a new search means for a document including an object defined by shape and behavior, and to improve the accuracy of the search result.
以下では、本発明の第2の実施形態について説明する。基本的な装置構成、処理動作は上記の第1の実施の形態と同様であるので重複する説明は省略する。 Hereinafter, a second embodiment of the present invention will be described. Since the basic apparatus configuration and processing operation are the same as those in the first embodiment, a duplicate description is omitted.
本実施の形態では、挙動で規定されるオブジェクトに含まれるテキストも検索のキーワードとして利用する点が上記の第1の実施の形態と相違する。 This embodiment is different from the first embodiment in that text included in an object defined by behavior is also used as a search keyword.
本実施の形態の動作を図面を参照して詳細に説明する。 The operation of the present embodiment will be described in detail with reference to the drawings.
図10のフローチャートを参照すると、まず、検索装置1はクエリの抽出を行う(S101)。その際、ユーザが検索を所望するキーワードの入力も受け付ける。
Referring to the flowchart of FIG. 10, first, the
次に、検索装置1は抽出したクエリが、HDD5の所定のテーブルに格納されている、検索キーとなり得る形状と挙動についての情報と合致するか否かを判定する(S102)。
Next, the
合致する場合(S102/Yes)、検索キーとなる形状と挙動に基づいて文書等の検索を実行する(S103、104)。そして、上記の第1の実施の形態と同様に形状と挙動で規定されるオブジェクトが抽出される。一例として、図11には検索キーが「Hello、上、スライド」の場合を示す。この場合には、検索結果として図11に示すようなHelloというキーワードを含む形状と挙動で規定されるオブジェクトが抽出される。 If they match (S102 / Yes), a document or the like is searched based on the shape and behavior as a search key (S103, 104). Then, an object defined by the shape and behavior is extracted as in the first embodiment. As an example, FIG. 11 shows a case where the search key is “Hello, Up, Slide”. In this case, an object defined by the shape and behavior including the keyword “Hello” as shown in FIG. 11 is extracted as a search result.
次に、検索装置1は上記のステップS102、103で抽出された形状と挙動で規定されるオブジェクトの中のテキストをOCR処理等でデータとして取得し、上記のステップS101で受け付けたキーワードの検索を実行する(S105、106)。
Next, the
そして、検索装置1は検索結果を表示する(S107)。表示の態様は、上記の第1の実施の形態と同様のものが適用できる。
Then, the
上述の本実施の形態によれば、形状と挙動で規定されるオブジェクトを含む大量の文書を検索する際に、文書中のテキスト部分の検索だけでなく、形状と挙動で規定されるオブジェクトの動きや形状と挙動で規定されるオブジェクトに含まれるテキストも検索のキーワードとして利用することで、形状と挙動で規定されるオブジェクトを含む文書に対する新しい検索手段の提供を通して利用者の利便性を増し、また、検索結果の精度向上を図ることができる。 According to the above-described embodiment, when searching a large number of documents including objects defined by the shape and behavior, not only the text portion in the document but also the movement of the object defined by the shape and behavior. By using text included in objects defined by shape and behavior as search keywords, the convenience of users can be increased by providing a new search means for documents containing objects defined by shape and behavior. The accuracy of search results can be improved.
以下では、本発明の第3の実施形態について説明する。基本的な装置構成、処理動作は上記の第1、第2の実施の形態と同様であるので重複する説明は省略する。 Hereinafter, a third embodiment of the present invention will be described. Since the basic apparatus configuration and processing operation are the same as those in the first and second embodiments described above, redundant description will be omitted.
本実施の形態では、異なる媒体を含む場合でも各媒体に対して統一的な検索をするための特徴情報を抽出し、検索する点が上記の第1、第2の実施の形態と相違する。 The present embodiment is different from the first and second embodiments in that feature information for performing a unified search for each medium is extracted and searched even when different media are included.
まず、検索装置1の関連付け部は、異なる媒体の統合インデックスを生成してデータベース(統合インデックスDB)に格納する統合インデックシング部を備えている。
First, the associating unit of the
統合インデックシング部は、既存の自然言語処理技術(例えば、形態素解析)を用い、異なる媒体の両方から形状と挙動を抽出する抽出部と、抽出部で抽出した形状と挙動に基づいて、既存の検索技術(例えば、ベクトル空間モデル)を用い、異なる媒体の統合インデックスを生成するインデックス生成部とを備えている。抽出部では、形状と挙動を抽出する際に、自動的な方法(自然言語処理技術)以外に、手動的な方法、又は、半自動的な手法も使用できる。インデックス生成部は、抽出した形状と挙動を用い、異なる媒体の両方を同じ形式に変換し、お互いの相対類似度を計算できるようにする。統合類似度計算部は、統合インデックスで扱われているクエリ又は異なる媒体の表現形式(例えば、クエリ・ベクトルやドキュメント・ベクトル)を用い、ユーザのクエリに対し、それぞれの異なる媒体の類似度(0と100%の間の値)を計算する。計算式は既存のテキスト検索技術における「ベクトル空間モデル」で扱われている、標準の計算式等であってもよい。 The integrated indexing unit uses an existing natural language processing technology (for example, morphological analysis) to extract the shape and behavior from both different media, and based on the shape and behavior extracted by the extraction unit, And an index generation unit that generates an integrated index of different media using a search technique (for example, a vector space model). The extraction unit can use a manual method or a semi-automatic method in addition to an automatic method (natural language processing technology) when extracting the shape and behavior. The index generation unit uses the extracted shape and behavior to convert both different media into the same format and calculate the relative similarity between them. The integrated similarity calculation unit uses a query handled by the integrated index or a representation format of different media (for example, a query vector or a document vector), and uses the similarity (0 And a value between 100%). The calculation formula may be a standard calculation formula or the like that is handled by the “vector space model” in the existing text search technology.
上述の本実施の形態によれば、異なる方式・媒体(PowerPoint(登録商標)、ビデオ、Flashh等)が複数埋め込まれたページ等に対してにも統一的な検索のための特徴情報を抽出することができる。 According to the above-described embodiment, feature information for uniform search is extracted even for a page or the like in which a plurality of different methods / mediums (PowerPoint (registered trademark), video, Flash, etc.) are embedded. be able to.
なお、上述する各実施の形態は、本発明の好適な実施の形態であり、本発明の要旨を逸脱しない範囲内において種々変更実施が可能である。例えば、検索装置、インデックス作成装置の機能を実現するためのプログラムを各装置に実行させることにより各装置の機能を実現する処理を行ってもよい。さらに、そのプログラムは、コンピュータ読み取り可能な記録媒体であるCD−ROMまたは光磁気ディスクなどを介して、または伝送媒体であるインターネット、電話回線などを介して伝送波により他のコンピュータシステムに伝送されてもよい。 Each of the above-described embodiments is a preferred embodiment of the present invention, and various modifications can be made without departing from the scope of the present invention. For example, you may perform the process which implement | achieves the function of each apparatus by making each apparatus run the program for implement | achieving the function of a search device and an index creation apparatus. Further, the program is transmitted to another computer system by a transmission wave via a computer-readable recording medium such as a CD-ROM or a magneto-optical disk, or via a transmission medium such as the Internet or a telephone line. Also good.
上述する各実施の形態は、インデックス作成部および検索・閲覧部が1つのコンピュータ装置として実現されている構成について説明したが、機能毎に複数の装置などが追加されたシステム構成にも適用可能である。 Each of the above-described embodiments has described the configuration in which the index creation unit and the search / browsing unit are realized as one computer device. However, the embodiments can be applied to a system configuration in which a plurality of devices are added for each function. is there.
Claims (6)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007071625A JP2008234226A (en) | 2007-03-19 | 2007-03-19 | Retrieval device and retrieval method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007071625A JP2008234226A (en) | 2007-03-19 | 2007-03-19 | Retrieval device and retrieval method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008234226A true JP2008234226A (en) | 2008-10-02 |
Family
ID=39906927
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007071625A Withdrawn JP2008234226A (en) | 2007-03-19 | 2007-03-19 | Retrieval device and retrieval method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008234226A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017049968A (en) * | 2015-08-31 | 2017-03-09 | 富士ゼロックス株式会社 | Method, system, and program for detecting, classifying, and visualizing user interactions |
-
2007
- 2007-03-19 JP JP2007071625A patent/JP2008234226A/en not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017049968A (en) * | 2015-08-31 | 2017-03-09 | 富士ゼロックス株式会社 | Method, system, and program for detecting, classifying, and visualizing user interactions |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8577882B2 (en) | Method and system for searching multilingual documents | |
JP5353148B2 (en) | Image information retrieving apparatus, image information retrieving method and computer program therefor | |
JP4893243B2 (en) | Image summarization method, image display device, k-tree display system, k-tree display program, and k-tree display method | |
US9582486B2 (en) | Apparatus and method for classifying and analyzing documents including text | |
US20080215548A1 (en) | Information search method and system | |
JP2010073114A6 (en) | Image information retrieving apparatus, image information retrieving method and computer program therefor | |
Li et al. | Interactive multimodal visual search on mobile device | |
CN103136228A (en) | Image search method and image search device | |
CN108763244B (en) | Searching and annotating within images | |
US20140379719A1 (en) | System and method for tagging and searching documents | |
WO2020056977A1 (en) | Knowledge point pushing method and device, and computer readable storage medium | |
US10152540B2 (en) | Linking thumbnail of image to web page | |
JP5516918B2 (en) | Image element search | |
JP7395377B2 (en) | Content search methods, devices, equipment, and storage media | |
JP2014056503A (en) | Computer packaging method, program, and system for specifying non-text element matching communication in multilingual environment | |
CN109933702B (en) | Retrieval display method, device, equipment and storage medium | |
JP4904920B2 (en) | Template document creation program, template document creation method, and template document creation device | |
CN114297143A (en) | File searching method, file displaying device and mobile terminal | |
JP2005107931A (en) | Image search apparatus | |
JP2007279978A (en) | Document retrieval device and document retrieval method | |
JP2007011973A (en) | Information retrieval device and information retrieval program | |
JP2004334341A (en) | Document retrieval system, document retrieval method, and recording medium | |
KR100933269B1 (en) | Search method and system using color keyword | |
JP5384315B2 (en) | SEARCH DEVICE, METHOD, AND PROGRAM | |
CN114238689A (en) | Video generation method, video generation device, electronic device, storage medium, and program product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20100601 |