JP2002132796A - 画像特徴量対キーワード辞書を記録したコンピュータ読み取り可能な記録媒体、画像特徴量対キーワード辞書構築装置及びその方法並びに画像データベース構築補助装置及びその方法 - Google Patents

画像特徴量対キーワード辞書を記録したコンピュータ読み取り可能な記録媒体、画像特徴量対キーワード辞書構築装置及びその方法並びに画像データベース構築補助装置及びその方法

Info

Publication number
JP2002132796A
JP2002132796A JP2000324309A JP2000324309A JP2002132796A JP 2002132796 A JP2002132796 A JP 2002132796A JP 2000324309 A JP2000324309 A JP 2000324309A JP 2000324309 A JP2000324309 A JP 2000324309A JP 2002132796 A JP2002132796 A JP 2002132796A
Authority
JP
Japan
Prior art keywords
keyword
image
feature amount
keyword candidate
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000324309A
Other languages
English (en)
Inventor
Hiroyuki Moriya
博之 守屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyodo Printing Co Ltd
Original Assignee
Kyodo Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyodo Printing Co Ltd filed Critical Kyodo Printing Co Ltd
Priority to JP2000324309A priority Critical patent/JP2002132796A/ja
Publication of JP2002132796A publication Critical patent/JP2002132796A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 画像データベースにおいて画像に対応付けら
れるキーワードの人的な要因によるばらつきを軽減する
ための画像特徴量対キーワード辞書構築装置を提供す
る。 【解決手段】 電子文書ファイル及び電子文書ファイル
に挿入されている画像ファイルを入力する手段102
と、画像ファイルを解析して、画像ファイルに含まれる
物体の特徴量を抽出する手段103と、電子文書ファイ
ルを解析して、電子文書ファイルから物体に対するキー
ワード候補を抽出して、キーワード候補に対する得点を
算出する手段104と、特徴量とキーワード候補と得点
を対応付けて画像特徴量対キーワード辞書に登録する手
段105、106と、を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像の有する画像
特徴量とその画像についての1又は2以上のキーワード
等を対応付けて保持する画像特徴量対キーワード辞書を
記録したコンピュータ読み取り可能な記録媒体、その辞
書を構築する画像特徴量対キーワード辞書構築装置及び
その方法並びにその辞書を用いた画像データベース構築
補助装置及びその方法に関する。
【0002】
【従来の技術】大量の画像を蓄積する画像データベース
においては、ユーザが必要とする画像を画像データベー
スから検索するために、各画像に1又は2以上のキーワ
ードを付加して、そのキーワードを画像に対応付けて画
像データベースに蓄積しておく。このような画像データ
ベースから画像を検索する際には、ユーザは、検索した
い画像について思いつくキーワードを入力する。する
と、画像データベースからは、そのキーワードに対応付
けられている1又は2以上の画像が出力される。複数の
キーワードを入力した場合には、全てのキーワードが対
応付けられている1又は2以上の画像が画像データベー
スから出力される。
【0003】上記の各画像に対して1又は2以上のキー
ワードを対応付けて大量の画像及びそれらに対応するキ
ーワードを蓄積する画像データベースの構築は、従来、
人手により行われていた。すなわち、画像データベース
に登録するべき画像をコンピュータの画面に表示し、そ
の画面を見た作業者がその画像から思いつくキーワード
をコンピュータの画面に表示されている所定のキーワー
ド入力欄に入力し、それからコンピュータ画面の所定の
キーを押すなどして画像とキーワードを対応付けて画像
データベースに登録していた。
【0004】
【発明が解決しようとする課題】しかしながら、上記の
画像データベースの構築方法では、同一の画像を対象と
した場合であっても、作業者毎に画像に対応付けるキー
ワードが異なってしまうことがあるという問題があっ
た。大量の画像を画像データベースに蓄積するために
は、複数の作業者が分担して画像を画像データベースに
追加する必要があるので、上記の問題は避けられないも
のであった。また、この大量の入力作業自体も作業者に
とっては大変なことであった。
【0005】本発明は、画像データベースにおいて画像
に対応付けられるキーワードの人的な要因によるばらつ
きを軽減するための画像特徴量対キーワード辞書を記録
したコンピュータ読み取り可能な記録媒体、その辞書を
構築する画像特徴量対キーワード辞書構築装置及びその
方法並びに画像データベース構築補助装置及びその方法
を提供することを目的とする。
【0006】また、本発明は、画像データベースを構築
するための人手による作業を軽減するための画像特徴量
対キーワード辞書を記録したコンピュータ読み取り可能
な記録媒体、その辞書を構築する画像特徴量対キーワー
ド辞書構築装置及びその方法並びに画像データベース構
築補助装置及びその方法を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明によるコンピュー
タ読み取り可能な記録媒体は、識別番号と不定数の画像
特徴量が1対n(nは自然数)の関係で対応付けられ、
前記識別番号と不定数のキーワード候補が1対m(mは
自然数)の関係で対応付けられ、各キーワード候補に得
点が1対1の関係で対応付けられており、前記画像特徴
量は画像から抽出された画像の特徴を表す量であり、前
記キーワード候補は前記画像に対応付けられている単語
であり、前記得点は該得点に対応する前記キーワード候
補の前記画像特徴量に対する調和度を表す、画像特徴量
対キーワード辞書を記録したことを特徴とする。
【0008】本発明による画像特徴量対キーワード辞書
構築装置は、電子文書ファイル及び前記電子文書ファイ
ルに挿入されている画像ファイルを入力する手段と、前
記画像ファイルを解析して、前記画像ファイルに含まれ
る物体の特徴量を抽出する手段と、前記電子文書ファイ
ルを解析して、前記電子文書ファイルから前記物体に対
するキーワード候補を抽出して、該キーワード候補に対
する得点を算出する手段と、前記特徴量と前記キーワー
ド候補と前記得点を対応付けて画像特徴量対キーワード
辞書に登録する手段と、を備えることを特徴とする。
【0009】また、本発明による画像特徴量対キーワー
ド辞書構築装置は、上記の画像特徴量対キーワード辞書
構築装置において、相互に近似する特徴量を前記画像特
徴量対キーワード辞書から検索する手段と、検索された
前記特徴量との間で共通するキーワード候補があるか否
かを調べる手段と、検索された前記特徴量に対する前記
共通するキーワード候補の得点を増加させる手段と、を
備えることを特徴とする。
【0010】更に、本発明による画像特徴量対キーワー
ド辞書構築装置は、上記の画像特徴量対キーワード辞書
構築装置において、得点が低いキーワード候補を前記画
像特徴量対キーワード辞書から削除する手段を備えるこ
とを特徴とする。
【0011】本発明による画像データベース構築補助装
置は、画像ファイルを入力する手段と、前記画像ファイ
ルを解析して、前記画像ファイルに含まれる物体の特徴
量を抽出する手段と、前記特徴量に近似する近似特徴量
と、該近似特徴量に対応付けられているキーワード候補
と、該キーワード候補に対応付けられている得点を画像
特徴量対キーワード辞書から検索する手段と、前記キー
ワード候補を表示装置に表示させる手段と、表示された
前記キーワード候補のうちから選択された選択キーワー
ド候補を入力する手段と、を備えることを特徴とする。
【0012】また、本発明による画像データベース構築
補助装置は、上記の画像データベース構築補助装置にお
いて、前記画像特徴量対キーワード辞書における選択キ
ーワード候補の得点を増加させる手段を備えることを特
徴とする。
【0013】更に、本発明による画像データベース構築
補助装置は、上記の画像データベース構築補助装置にお
いて、表示された前記キーワード候補のうちから選択さ
れなかったキーワード候補の得点を減少させる手段を備
えることを特徴とする。
【0014】更に、本発明による画像データベース構築
補助装置は、上記の画像データベース構築補助装置にお
いて、前記画像ファイルに対する新たなキーワード候補
を入力する手段と、前記新たなキーワード候補を前記近
似特徴量に対応付けて前記画像特徴量対キーワード辞書
に登録する手段と、を備えることを特徴とする。
【0015】更に、本発明による画像データベース構築
補助装置は、上記の画像データベース構築補助装置にお
いて、前記選択キーワード候補を出力する手段を備える
ことを特徴とする。
【0016】更に、本発明による画像データベース構築
補助装置は、上記の画像データベース構築補助装置にお
いて、前記選択キーワード候補と前記新たなキーワード
候補を出力する手段を備えることを特徴とする。
【0017】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態について詳細に説明する。
【0018】本実施形態で生成される画像特徴量対キー
ワード辞書は、画像の有する画像特徴量に、その画像に
ついての1又は2以上のキーワードとそのキーワードに
与えられた得点を対応付けて保持するものである。
【0019】図1を参照すると、本実施形態による辞書
構築装置101は、インターネット120、画像特徴量
対キーワード辞書121と接続されており、HTML(H
ypertext Markup Language)ファイル、画像ファイル取
得部102、画像ファイル解析、特徴量抽出部103、
HTMLファイル解析、キーワード候補抽出部104、
画像特徴量、キーワード候補対応付け部105、画像特
徴量対キーワード辞書登録部106、キーワード候補切
捨部107を備える。
【0020】HTMLファイル、画像ファイル取得部1
02は、インターネット201と接続されており、物理
層、データリンク層、IP(Internet Protocol)層、T
CP(Transmission Control Protocol)層の上で、HT
TP(Hypertext Transfer Protocol)又はFTP(File T
ransfer Protocol)により、WWW(World Wide Web)サ
ーバからWWWサーバに蓄積されているHTMLファイ
ル及びHTMLファイルに挿入されている画像ファイル
を取得する。この際、例えばサーチエンジン構築システ
ムで用いられているWWWロボットの方式、HTMLフ
ァイルのハイパーリンクを次から次へと辿っていく方
式、IPアドレスを虱潰しに調べる方式等により、多数
のWWWサーバから多数のHTMLファイル及び画像フ
ァイルを取得する。
【0021】画像ファイル解析、特徴量抽出部103
は、取得部102が取得した各画像ファイルを解析し
て、その画像ファイルが表示されると現れる物体を抽出
し、抽出された物体の特徴量を更に抽出する。
【0022】図2を参照して、抽出部103による各画
像ファイルから物体の特徴量を抽出する動作を説明す
る。
【0023】まず、取得部102から直接又はハードデ
ィスク等の記憶装置(不図示)を介して画像ファイルを
読み込む(ステップS201)。次に、読み込んだ画像
ファイルに対して、雑音除去、歪み補正、シャープネス
補正等の前処理を施す(ステップS202)。次に、前
処理が施された画像ファイルに対して、エッジ検出、領
域分割等の物体抽出処理を施し、物体を抽出する(ステ
ップS203)。最後に、抽出された物体を更に分割し
て色情報、形、面積比、外形輪郭軌跡、物体内領域輪郭
軌跡等の特徴量を抽出する(ステップS204)。輪郭
軌跡は、例えば、パラメトリック曲線(ベジェ曲線、B
スプライン曲線、NURBS曲線等)で近似表現しても
良い。
【0024】HTMLファイル解析、キーワード候補抽
出部104は、取得部102が取得した各HTMLファ
イルを解析し、HTMLファイルに記載されている単語
であってHTMLファイルに挿入されている画像ファイ
ルに関するキーワードになりそうな単語をキーワード候
補として抽出する。
【0025】図3を参照して、抽出部104によるHT
MLファイルからキーワード候補を抽出する動作を説明
する。
【0026】まず、取得部102から直接又はハードデ
ィスク等の記憶装置(不図示)を介してHTMLファイ
ルを読み込む(ステップS301)。次に、HTMLフ
ァイルに対して形態素解析を行い、HTMLファイルか
ら単語をキーワード候補として抽出する(ステップS3
2)。次に、抽出されたキーワード候補の文字サイズ、
文字修飾、画像(画像ファイルを基にHTML文書に表
示される画像)からのHTML文書上での距離等をHT
MLファイルのタグ、HTMLファイル中でのキーワー
ド候補の位置、画像ファイルの位置等により取得する
(ステップS303)。次に、画像からの距離が短いキ
ーワード候補に例えば40点を与え(ステップS30
4)、文字サイズが大きいキーワード候補に例えば30
点を与え(ステップS305)、出現頻度が高いキーワ
ード候補に例えば20点を与え(ステップS306)、
それ以外のキーワード候補に10点を与える(ステップ
S307)。従って、得点は、キーワード候補の画像特
徴量に対する調和度を表すものである。
【0027】画像特徴量、キーワード候補対応付け部1
05は、抽出部103で抽出された特徴量と抽出部10
4で抽出されたキーワード候補とそのキーワード候補に
与えられた得点を対応付ける。
【0028】画像特徴量対キーワード辞書登録部106
は、画像特徴量とその画像特徴量に対応付けられたキー
ワード候補とそのキーワードに対する特典を辞書121
に登録する。辞書121をオブジェクト・リレーショナ
ル・データベースにより構成することにより、幾つある
かが不定である画像特徴量、キーワード候補、得点を、
可変配列を持つ項目やネストされたテーブルを用いて柔
軟に辞書121に登録することができる。
【0029】例えば、第1のテーブルに画像特徴量のユ
ニークな識別番号を記録し、第2のテーブルにユニーク
でない識別番号及び画像特徴量を記録し、第3のテーブ
ルにユニークでない識別番号、キーワード候補及び得点
を記録し、第1のテーブルに第2のテーブルを識別番号
をキーとして1対n(nは自然数)の関係でネストさ
せ、第1のテーブルに第3のテーブルを識別番号をキー
として1対m(mは自然数)の関係でネストさせればよ
い。
【0030】また、辞書121に登録を行う際、登録対
象の特徴量に近似する特徴量が辞書121に既に登録さ
れているか否かを調べる。そのような特徴量が既に辞書
121に既に登録されている場合には、両者の特徴量の
間で共通するキーワード候補(「共通キーワード候補」
という。)があるか否かを調べる。共通キーワード候補
がある場合には、登録しようとする特徴量に対応付けら
れている共通キーワード候補の得点を増加させ、登録し
ようとする特徴量に近似する特徴量に対応付けられてい
る共通キーワード候補の得点も増加させる。このように
して、共通キーワード候補の得点を増加することによ
り、辞書121の精度を高めることができる。
【0031】キーワード候補切捨部107は、ある程度
の量の特徴量が辞書121に蓄積された時点で、得点が
低いキーワード候補を辞書121から削除する。キーワ
ード候補切捨部107により、辞書121が不要に大き
くなることを防止することができる。
【0032】図4を参照すると、画像データベース構築
補助装置401は、画像特徴量対キーワード辞書12
1、画像ファイル420、ディスプレイ421、画像デ
ータベース422に接続されており、画像ファイル入力
部402、画像ファイル解析、特徴量抽出部403、画
像特徴量対キーワード辞書404、画像特徴量対キーワ
ード辞書へのフィードバック部405、キーワード候補
表示、選択部406、画像、キーワード登録部407を
備える。
【0033】画像ファイル入力部402は、画像ファイ
ル420を読み込む。
【0034】画像ファイル解析、特徴量抽出部403
は、画像ファイル解析、特徴量抽出部読み取り103と
同一であるので、これについての重複した説明は省略す
る。
【0035】画像特徴量対キーワード辞書検索部404
は、抽出部403から入力する特徴量をキーとして、そ
の特徴量に最も近似している特徴量であって辞書に登録
されている特徴量(「近似特徴量」という。)並びに近
似特徴量に対応付けられているキーワード候補及びその
キーワード候補に与えられている得点を辞書121から
検索する。
【0036】キーワード候補表示、選択部406は、検
索部404が検索したキーワード候補及び得点と入力部
402が入力した画像ファイルの画像等を含む画面をデ
ィスプレイ421に表示させる。
【0037】選択部406がディスプレイ421に表示
させる画面の例を図5に示す。その画面には、キーワー
ド候補501、得点502、画像503の他に、キーワ
ード候補を選択するチェックボックス504、新たなキ
ーワード候補を入力する入力欄505、登録ボタン50
6がある。
【0038】作業者は、表示されたキーワード候補のう
ち適切であると判断する1又は2以上のキーワード候補
についてのチェックボックスをチェックすることにより
そのようなキーワードを選択する。また、作業者は、表
示されたキーワード候補の他に適切なキーワードを想起
した場合には、そのキーワードを新規キーワード候補と
して入力欄505に入力する。作業者は、最後に、登録
ボタン506を押す。
【0039】登録ボタン406が押されると、選択部4
06は、選択されたキーワード候補(「選択キーワード
候補」という。)及び新規キーワード候補を画像、キー
ワード登録部407及び画像特徴量対キーワード辞書へ
のフィードバック部405に出力する。
【0040】フィードバック部405は、検索部404
から近似特徴量並びに近似特徴量に対応付けられたキー
ワード候補及び得点を入力し、選択部406から選択キ
ーワード候補及び新規キーワード候補を入力する。次
に、フィードバック部405は、近似特徴量に対応付け
られたキーワード候補のうち選択キーワード候補となっ
たキーワード候補の得点を増加させて、増加後の得点に
より辞書121に既存の得点を上書きする。また、フィ
ードバック部405は、近似特徴量に対応付けられたキ
ーワード候補のうち選択キーワード候補とならなかった
キーワード候補の得点を減少させて、減少後の得点によ
り辞書121に既存の得点を上書きする。更に、フィー
ドバック部405は、新規キーワード候補に例えば選択
キーワード候補と同程度の得点を与えて、新規キーワー
ド候補とそれに与えられた得点を当該特徴量に対応させ
て辞書121に登録する。
【0041】画像、キーワード登録部407は、画像フ
ァイル入力部402から入力した画像ファイルに、選択
部406から入力した選択キーワード候補及び新規キー
ワード候補を関連付けて、それらを画像データベース4
22に登録する。
【0042】本発明の画像特徴量対キーワード辞書12
1の応用例として、デジタルコンテンツ販売の検索シス
テムの一部として画像特徴量対キーワード辞書を用いる
ことができる。画像特徴量対キーワード辞書とは別個に
画像特徴量対画像データベースを構築しておく。画像特
徴量対画像データベースは、デジタルコンテンツに蓄積
されている画像ファイルを画像ファイル解析、特徴量抽
出部103に与えて、画像ファイル解析、特徴量抽出部
103から得られた特徴量を用いて構築することができ
る。
【0043】購買者は、所望の画像を購買するために検
索システムにその画像に相応しいと思うキーワードを入
力する。検索システムでは、まず、キーワードをキーと
して、画像特徴量対キーワード辞書からそのキーワード
に対応付けられている1又は2以上の特徴量を検索す
る。次に、検索された特徴量をキーとして、画像特徴量
対画像データベースから1又は2以上の画像を検索し、
検索された画像を表示する。表示された画像が多すぎる
場合には、更に、それらの画像の集合と他のキーワード
に対応して得られた画像の集合との論理積集合をとっ
て、論理積集合に含まれる画像を表示する。
【0044】なお、画像特徴量対キーワード辞書121
は、コンピュータ読み取り可能な記録媒体に記録され
る。
【0045】また、辞書構築装置101、画像データベ
ース構築補助装置401の機能は、コンピュータをこれ
らの装置として機能させるためのプログラムを記録した
コンピュータ読み取り可能な記録媒体からそのプログラ
ムをコンピュータが読み込んで実行することにより実現
することもできる。
【0046】また、上記の実施形態では、取得部102
は、インターネット120に接続されるとしたが、本発
明はこれに限られず、取得部102がHTMLファイル
とHTMLファイルに挿入された画像ファイルを取得で
きるものであれば、取得部102が何と接続されていて
も良い。例えば、取得部102をイントラネット、LA
N(Local Area Network)、コンピュータ読み取り可能な
記録媒体に接続しても良い。
【0047】上記の記録媒体としては、例えば、フロッ
ピー(登録商標)ディスク、ハードディスク、CD−R
OM(Compact Disc Read Only Memory)、光磁気ディス
ク、DVD(Digital Versatile Disk)をあげることがで
きる。
【0048】また、上記の実施形態では、登録部106
が新たな画像特徴量とキーワード候補を登録するとき
に、得点を増加する処理を行うとしたが、本発明はこれ
に限られず、既に登録済みの画像特徴量とキーワード候
補と得点に基づいて、得点を増加する処理を行っても良
い。すなわち、既に登録済みの画像特徴量から相互に近
似する画像特徴量を検索して、検索された画像特徴量間
で共通するキーワード候補を探して、共通するキーワー
ド候補が探せたならば、検索された画像特徴量について
の共通するキーワード候補の得点を増加させるようにし
ても良い。
【0049】また、上記の実施形態では、HTMLファ
イルに画像が挿入され、HTMLファイルからキーワー
ド候補を抜き出すとしたが、本発明はこれに限られず、
画像が挿入され且つその画像についてのキーワード候補
を抜き出せる電子文書ファイルであればいかなる電子文
書ファイルもHTMLファイルの代わりに使用すること
ができる。例えば、XML(Extensible Markup Languag
e)ファイル、SGML(Standard Generalized Markup
Language)ファイル、ワープロファイルも、HTMLフ
ァイルの代わりに使用することができる。
【0050】
【発明の効果】以上説明したように、本発明によれば、
画像特徴量対キーワード辞書並びにその辞書を構築する
辞書構築装置及びその辞書を用いて画像データベースを
構築する画像データベース構築補助装置を導入したの
で、画像データベースを構築する際の作業者間のキーワ
ードのバラツキを抑えることができ、作業者の負担も軽
減することができる。
【図面の簡単な説明】
【図1】本発明の実施形態による辞書構築装置の構成を
示すブロック図である。
【図2】図1に示す画像ファイル解析、特徴量抽出部の
動作を示すフローチャートである。
【図3】図1に示すHTMLファイル解析、キーワード
候補抽出部の動作を示すフローチャートである。
【図4】本発明の実施形態による画像データベース構築
補助装置の構成を示すブロック図である。
【図5】図4に示す画像データベース構築補助装置がデ
ィスプレイに表示させる画面の例を示す図である。
【符号の説明】
101 辞書構築装置 102 HTMLファイル、画像ファイル取得部 103 画像ファイル解析、特徴量抽出部 104 HTMLファイル解析、キーワード候補抽出部 105 画像特徴量、キーワード候補対応付け部 106 画像特徴量対キーワード辞書登録部 107 キーワード候補切捨部 120 インターネット 121 画像特徴量対キーワード辞書 401 画像データベース構築補助装置 402 画像ファイル入力部 403 画像ファイル解析、特徴量抽出部 404 画像特徴量対キーワード辞書検索部 405 画像特徴量対キーワード辞書へのフィードバッ
ク部 406 キーワード候補表示、選択部 407 画像、キーワード登録部 420 画像ファイル 421 ディスプレイ 422 画像データベース

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 識別番号と不定数の画像特徴量が1対n
    (nは自然数)の関係で対応付けられ、前記識別番号と
    不定数のキーワード候補が1対m(mは自然数)の関係
    で対応付けられ、各キーワード候補に得点が1対1の関
    係で対応付けられており、 前記画像特徴量は画像から抽出された画像の特徴を表す
    量であり、 前記キーワード候補は前記画像に対応付けられている単
    語であり、 前記得点は該得点に対応する前記キーワード候補の前記
    画像特徴量に対する調和度を表す、画像特徴量対キーワ
    ード辞書を記録したことを特徴とするコンピュータ読み
    取り可能な記録媒体。
  2. 【請求項2】 電子文書ファイル及び前記電子文書ファ
    イルに挿入されている画像ファイルを入力する手段と、 前記画像ファイルを解析して、前記画像ファイルに含ま
    れる物体の特徴量を抽出する手段と、 前記電子文書ファイルを解析して、前記電子文書ファイ
    ルから前記物体に対するキーワード候補を抽出して、該
    キーワード候補に対する得点を算出する手段と、 前記特徴量と前記キーワード候補と前記得点を対応付け
    て画像特徴量対キーワード辞書に登録する手段と、 を備えることを特徴とする画像特徴量対キーワード辞書
    構築装置。
  3. 【請求項3】 請求項2に記載の画像特徴量対キーワー
    ド辞書構築装置において、 相互に近似する特徴量を前記画像特徴量対キーワード辞
    書から検索する手段と、 検索された前記特徴量との間で共通するキーワード候補
    があるか否かを調べる手段と、 検索された前記特徴量に対する前記共通するキーワード
    候補の得点を増加させる手段と、 を備えることを特徴とする画像特徴量対キーワード辞書
    構築装置。
  4. 【請求項4】 請求項2又は3に記載の画像特徴量対キ
    ーワード辞書構築装置において、 得点が低いキーワード候補を前記画像特徴量対キーワー
    ド辞書から削除する手段を備えることを特徴とする画像
    特徴量対キーワード辞書構築装置。
  5. 【請求項5】 画像ファイルを入力する手段と、 前記画像ファイルを解析して、前記画像ファイルに含ま
    れる物体の特徴量を抽出する手段と、 前記特徴量に近似する近似特徴量と、該近似特徴量に対
    応付けられているキーワード候補と、該キーワード候補
    に対応付けられている得点を画像特徴量対キーワード辞
    書から検索する手段と、 前記キーワード候補を表示装置に表示させる手段と、 表示された前記キーワード候補のうちから選択された選
    択キーワード候補を入力する手段と、 を備えることを特徴とする画像データベース構築補助装
    置。
  6. 【請求項6】 請求項5に記載の画像データベース構築
    補助装置において、 前記画像特徴量対キーワード辞書における選択キーワー
    ド候補の得点を増加させる手段を備えることを特徴とす
    る画像データベース構築補助装置。
  7. 【請求項7】 請求項5又は6に記載の画像データベー
    ス構築補助装置において、 表示された前記キーワード候補のうちから選択されなか
    ったキーワード候補の得点を減少させる手段を備えるこ
    とを特徴とする画像データベース構築補助装置。
  8. 【請求項8】 請求項5乃至7のいずれか1項に記載の
    画像データベース構築補助装置において、 前記画像ファイルに対する新たなキーワード候補を入力
    する手段と、 前記新たなキーワード候補を前記近似特徴量に対応付け
    て前記画像特徴量対キーワード辞書に登録する手段と、 を備えることを特徴とする画像データベース構築補助装
    置。
  9. 【請求項9】 請求項5乃至7に記載の画像データベー
    ス構築補助装置において、 前記選択キーワード候補を出力する手段を備えることを
    特徴とする画像データベース構築補助装置。
  10. 【請求項10】 請求項8に記載の画像データベース構
    築補助装置において、 前記選択キーワード候補と前記新たなキーワード候補を
    出力する手段を備えることを特徴とする画像データベー
    ス構築補助装置。
  11. 【請求項11】 電子文書ファイル及び前記電子文書フ
    ァイルに挿入されている画像ファイルを入力するステッ
    プと、 前記画像ファイルを解析して、前記画像ファイルに含ま
    れる物体の特徴量を抽出するステップと、 前記電子文書ファイルを解析して、前記電子文書ファイ
    ルから前記物体に対するキーワード候補を抽出して、該
    キーワード候補に対する得点を算出するステップと、 前記特徴量と前記キーワード候補と前記得点を対応付け
    て画像特徴量対キーワード辞書に登録するステップと、 を有することを特徴とする画像特徴量対キーワード辞書
    構築方法。
  12. 【請求項12】 請求項10に記載の画像特徴量対キー
    ワード辞書構築方法において、 相互に近似する特徴量を前記画像特徴量対キーワード辞
    書から検索するステップと、 検索された前記特徴量との間で共通するキーワード候補
    があるか否かを調べるステップと、 検索された前記特徴量に対する前記共通するキーワード
    候補の得点を増加させるステップと、 を有することを特徴とする画像特徴量対キーワード辞書
    構築方法。
  13. 【請求項13】 請求項11又は12に記載の画像特徴
    量対キーワード辞書構築方法において、 得点が低いキーワード候補を前記画像特徴量対キーワー
    ド辞書から削除するステップを有することを特徴とする
    画像特徴量対キーワード辞書構築方法。
  14. 【請求項14】 画像ファイルを入力するステップと、 前記画像ファイルを解析して、前記画像ファイルに含ま
    れる物体の特徴量を抽出するステップと、 前記特徴量に近似する近似特徴量と、該近似特徴量に対
    応付けられているキーワード候補と、該キーワード候補
    に対応付けられている得点を画像特徴量対キーワード辞
    書から検索するステップと、 前記キーワード候補を表示装置に表示させるステップ
    と、 表示された前記キーワード候補のうちから選択された選
    択キーワード候補を入力するステップと、 を有することを特徴とする画像データベース構築補助方
    法。
  15. 【請求項15】 請求項14に記載の画像データベース
    構築補助方法において、 前記画像特徴量対キーワード辞書における選択キーワー
    ド候補の得点を増加させるステップを有することを特徴
    とする画像データベース構築補助方法。
  16. 【請求項16】 請求項14又は15に記載の画像デー
    タベース構築補助方法において、 表示された前記キーワード候補のうちから選択されなか
    ったキーワード候補の得点を減少させるステップを有す
    ることを特徴とする画像データベース構築補助方法。
  17. 【請求項17】 請求項14乃至16のいずれか1項に
    記載の画像データベース構築補助方法において、 前記画像ファイルに対する新たなキーワード候補を入力
    するステップと、 前記新たなキーワード候補を前記近似特徴量に対応付け
    て前記画像特徴量対キーワード辞書に登録するステップ
    と、 を有することを特徴とする画像データベース構築補助方
    法。
  18. 【請求項18】 請求項14乃至16のいずれか1項に
    記載の画像データベース構築補助方法において、 前記選択キーワード候補を出力するステップを有するこ
    とを特徴とする画像データベース構築補助方法。
  19. 【請求項19】 請求項17に記載の画像データベース
    構築補助方法において、 前記選択キーワード候補と前記新たなキーワード候補を
    出力するステップを有することを特徴とする画像データ
    ベース構築補助方法。
  20. 【請求項20】 コンピュータを請求項2乃至4のいず
    れか1項に記載の画像特徴量対キーワード辞書構築装置
    として機能させるためのプログラムを記録したことを特
    徴とするコンピュータ読み取り可能な記録媒体。
  21. 【請求項21】 コンピュータを請求項5乃至10のい
    ずれか1項に記載の画像データベース構築補助装置とし
    て機能させるためのプログラムを記録したことを特徴と
    するコンピュータ読み取り可能な記録媒体。
JP2000324309A 2000-10-24 2000-10-24 画像特徴量対キーワード辞書を記録したコンピュータ読み取り可能な記録媒体、画像特徴量対キーワード辞書構築装置及びその方法並びに画像データベース構築補助装置及びその方法 Pending JP2002132796A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000324309A JP2002132796A (ja) 2000-10-24 2000-10-24 画像特徴量対キーワード辞書を記録したコンピュータ読み取り可能な記録媒体、画像特徴量対キーワード辞書構築装置及びその方法並びに画像データベース構築補助装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000324309A JP2002132796A (ja) 2000-10-24 2000-10-24 画像特徴量対キーワード辞書を記録したコンピュータ読み取り可能な記録媒体、画像特徴量対キーワード辞書構築装置及びその方法並びに画像データベース構築補助装置及びその方法

Publications (1)

Publication Number Publication Date
JP2002132796A true JP2002132796A (ja) 2002-05-10

Family

ID=18801865

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000324309A Pending JP2002132796A (ja) 2000-10-24 2000-10-24 画像特徴量対キーワード辞書を記録したコンピュータ読み取り可能な記録媒体、画像特徴量対キーワード辞書構築装置及びその方法並びに画像データベース構築補助装置及びその方法

Country Status (1)

Country Link
JP (1) JP2002132796A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007334445A (ja) * 2006-06-12 2007-12-27 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2008226061A (ja) * 2007-03-15 2008-09-25 Fujifilm Corp 画像のタグ指定装置および画像検索装置ならびにそれらの動作制御方法およびそれらのコンピュータを制御するプログラム
JP2010218372A (ja) * 2009-03-18 2010-09-30 Olympus Corp サーバシステム、端末装置、プログラム、情報記憶媒体及び画像検索方法
JP2010271903A (ja) * 2009-05-21 2010-12-02 Seiko Epson Corp 画像処理方法及び装置、並びに、そのためのコンピュータープログラム
WO2011065236A1 (ja) * 2009-11-25 2011-06-03 Kddi株式会社 2次コンテンツ提供システムおよび方法
US20110252062A1 (en) * 2007-11-05 2011-10-13 Naoto Hanatani Electronic device for searching for entry word in dictionary data, control method thereof and program product
JP2011227825A (ja) * 2010-04-22 2011-11-10 Kddi Corp タグ付与装置、変換規則生成装置およびタグ付与プログラム
JP2012159871A (ja) * 2011-01-28 2012-08-23 Nippon Telegr & Teleph Corp <Ntt> コンテンツ認識モデル学習装置、コンテンツ認識モデル学習方法及びコンテンツ認識モデル学習プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007334445A (ja) * 2006-06-12 2007-12-27 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2008226061A (ja) * 2007-03-15 2008-09-25 Fujifilm Corp 画像のタグ指定装置および画像検索装置ならびにそれらの動作制御方法およびそれらのコンピュータを制御するプログラム
US20110252062A1 (en) * 2007-11-05 2011-10-13 Naoto Hanatani Electronic device for searching for entry word in dictionary data, control method thereof and program product
JP2010218372A (ja) * 2009-03-18 2010-09-30 Olympus Corp サーバシステム、端末装置、プログラム、情報記憶媒体及び画像検索方法
JP2010271903A (ja) * 2009-05-21 2010-12-02 Seiko Epson Corp 画像処理方法及び装置、並びに、そのためのコンピュータープログラム
WO2011065236A1 (ja) * 2009-11-25 2011-06-03 Kddi株式会社 2次コンテンツ提供システムおよび方法
JP2011227825A (ja) * 2010-04-22 2011-11-10 Kddi Corp タグ付与装置、変換規則生成装置およびタグ付与プログラム
JP2012159871A (ja) * 2011-01-28 2012-08-23 Nippon Telegr & Teleph Corp <Ntt> コンテンツ認識モデル学習装置、コンテンツ認識モデル学習方法及びコンテンツ認識モデル学習プログラム

Similar Documents

Publication Publication Date Title
US7730104B2 (en) Extraction of information from structured documents
JP2770715B2 (ja) 構造化文書検索装置
US20050165642A1 (en) Method and system for processing classified advertisements
US20010049700A1 (en) Information processing apparatus, information processing method and storage medium
US20080155411A1 (en) Method for ensuring internet content compliance
US20150169525A1 (en) Augmented reality image annotation
US20020023076A1 (en) Search method in a used car search support system
KR101523450B1 (ko) 관련어 등록 장치, 관련어 등록 방법, 기록 매체 및, 관련어 등록 시스템
JP4042830B2 (ja) コンテンツ属性情報正規化方法、情報収集・サービス提供システム、並びにプログラム格納記録媒体
US20020178192A1 (en) Data integrate system and data integrate method
JP3832693B2 (ja) 構造化文書検索表示方法及び装置
JP2002132796A (ja) 画像特徴量対キーワード辞書を記録したコンピュータ読み取り可能な記録媒体、画像特徴量対キーワード辞書構築装置及びその方法並びに画像データベース構築補助装置及びその方法
JP3583631B2 (ja) 情報マイニング方法、情報マイニング装置、および情報マイニングプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2009199302A (ja) ドキュメントを解析するためのプログラム,装置および方法
JP2005107931A (ja) 画像検索装置
KR20080030196A (ko) 인터넷 웹페이지의 태그 방법 및 태그 검색 시스템
JP2006023968A (ja) 固有表現抽出方法および装置並びにそれらに用いるプログラム
KR101068073B1 (ko) 웹을 기반으로 한 번역 용어구축과 감수에 관한 협업 시스템
JPH10228488A (ja) 情報検索収集方法およびそのシステム
KR20020015100A (ko) 웹 브라우저를 이용한 정보 검색 시스템
WO2003096219A1 (en) Method and system for processing classified advertisements
JP4352840B2 (ja) プログラム、データ処理方法およびデータ処理システム
JP4384736B2 (ja) 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000207459A (ja) 作業支援方法および作業支援装置
JP2008217170A (ja) 情報処理装置およびプログラム