JP2011227825A - タグ付与装置、変換規則生成装置およびタグ付与プログラム - Google Patents
タグ付与装置、変換規則生成装置およびタグ付与プログラム Download PDFInfo
- Publication number
- JP2011227825A JP2011227825A JP2010099032A JP2010099032A JP2011227825A JP 2011227825 A JP2011227825 A JP 2011227825A JP 2010099032 A JP2010099032 A JP 2010099032A JP 2010099032 A JP2010099032 A JP 2010099032A JP 2011227825 A JP2011227825 A JP 2011227825A
- Authority
- JP
- Japan
- Prior art keywords
- tag
- language
- major
- conversion rule
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】、Web上での使用度の低いマイナー言語によるタグをコンテンツに対して付与するタグ付与装置120であって、コンテンツの特徴量とメジャー言語によるタグとを対応付けたタグ選択用データを参照して、対象コンテンツから検出された特徴量に応じて、対象コンテンツに適したメジャー言語によるタグを選択するタグ選択部121と、所定の変換規則により選択されたメジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換するタグ変換部122とを備える。
【選択図】図1
Description
図1は、タグ付与システム100の構成を示すブロック図である。図1に示すように、タグ付与システム100は、変換規則生成装置110と、タグ付与装置120とを備えている。なお、以下で説明するタグ付与システム100では、変換規則生成装置110と、タグ付与装置120とはネットワークで接続されているが、一つの装置であってもよい。
変換規則生成装置110は、コンテンツ取得部111、データベース112、タグ付与モデル構築部113および変換規則生成部114を備え、メジャー言語による語句からマイナー言語による語句への変換規則を生成する。これにより、メジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換する変換規則を生成することができる。
タグ付与装置120は、タグ選択部121およびタグ変換部122を備え、Web上での使用度の低いマイナー言語によるタグをコンテンツに対して付与する。これにより、日本語などのマイナーな言語においても、英語などのメジャーな言語に変換することでメジャーな言語を学習データとした場合と同等に自動タグ付与の精度を向上させることができる。タグ付与モデル構築部113によって得られたタグ付与モデルを利用して、未知の入力画像データに対し、自動でメジャー言語によるタグを付与することができる。
次に、変換規則生成装置110の動作を説明する。図2は、変換規則生成装置110の動作の一例を示すフローチャートである。まず、メジャー言語およびマイナー言語による検索キーワードを設定する(ステップS1)。メジャー言語を英語、マイナー言語を日本語とした場合には、「car, dog, fireworks, flower, food, hanami, ski, sumo, tokyotower, sea, bird, bike」、「車、犬、花火、花、食べ物、花見、スキー、相撲、東京タワー、海、鳥、自転車」など、それぞれの言語において、対応するキーワードを設定する。言語は、例えばそのほかにも、中国語や、スペイン語など、様々なものを利用することが可能である。
次に、タグ付与装置120の動作を説明する。図3は、タグ付与装置120の動作を示すフローチャートである。まず、変換規則生成装置110からタグ付与モデルを取得する(ステップT1)。また、同様に変換規則を変換規則生成装置110から取得する(ステップT2)。
図4は、タグ付与処理の一例を示す図である。たとえば、データベース112に画像データ群211およびそのそれぞれに対して付与されている英語と日本語によるタグ212が格納されている。図4に示す例では、海辺の写真には英語の「sea, beach, japan」と日本語の「日本、海」のタグが付与され、魚が泳ぐ水中の写真には英語の「fish, blue, japan」と日本語の「日本、青」のタグが付与されている。また、海岸の写真には英語の「sea, blue, beach, rocks」と日本語の「青、海、岩」のタグが付与され、地上に突き出た岩の写真には、英語の「rocks」と日本語の「岩」のタグが付与されている。
上記のタグ付与システム100を用いて実験を行った。本実験では、英語を学習データとしてタグ付与モデルを構築し、変換規則生成部114として共起変換および辞書変換を用いた実施例のシステム(共起変換システム、辞書変換システム)を用いた。辞書変換システムには、Google(登録商標)翻訳のAPIを利用した。また、比較例のシステムとして、変換規則生成部114に代えて学習データに日本語学習データを用いて構築したタグ付与モデルを利用した。したがって、合計3システムを構築した。
テストデータは表1に記載の項目からそれぞれ5枚の画像データをランダムに選択し、合計60枚の画像データを実験に用いた。全ての画像データに対してシステムから得られたタグの上位10位までのタグを付与した。(合計30タグ)12名の被験者は全ての画像データと3手法の結果を閲覧しながら各タグについて画像データに適しているか評価を付与した。評価基準は、correct,incorrect,unknownの三項目で、各項目の評価基準は以下の表のように設定した。
110 変換規則生成装置
111 コンテンツ取得部
112 データベース
112a メジャー言語学習DB
112b マイナー言語学習DB
113 タグ付与モデル構築部
114 変換規則生成部
120 タグ付与装置
121 タグ選択部
122 タグ変換部
211 画像データ群
212 タグ
221 行
222 列
223 変換マトリクス
Claims (7)
- Web上での使用度の低いマイナー言語によるタグをコンテンツに対して付与するタグ付与装置であって、
コンテンツの特徴量とメジャー言語によるタグとを対応付けたタグ選択用データを参照して、対象コンテンツから検出された特徴量に応じて、前記対象コンテンツに適したメジャー言語によるタグを選択するタグ選択部と、
所定の変換規則により前記選択されたメジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換するタグ変換部とを備えることを特徴とするタグ付与装置。 - 前記タグ変換部は、前記所定の変換規則としてWeb上の情報を用いて動的に更新される規則を用いることを特徴とする請求項1記載のタグ付与装置。
- 前記タグ変換部は、メジャー言語のタグとマイナー言語のタグとが同一のコンテンツに付与される共起頻度を反映した変換規則を用いることを特徴とする請求項1または請求項2記載のタグ付与装置。
- 前記タグ変換部は、前記変換規則として変換マトリクスを用いることを特徴とする請求項1から請求項3のいずれかに記載のタグ付与装置。
- メジャー言語による語句からマイナー言語による語句への変換規則を生成する変換規則生成装置であって、
不特定のユーザによりメジャー言語およびメジャー言語よりWeb上での使用度の低いマイナー言語のタグが付けられたコンテンツをWeb上から取得するコンテンツ取得部と、
前記取得されたコンテンツおよびタグを格納するデータベースと、
前記格納されたコンテンツおよびタグを用いて、メジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換する変換規則を動的に生成する変換規則生成部とを備えることを特徴とする変換規則生成装置。 - 請求項2から請求項4のいずれかに記載のタグ付与装置と、
請求項5記載の変換規則生成装置とを備えることを特徴とするタグ付与システム。 - Web上での使用度の低いマイナー言語によるタグをコンテンツに対して付与するためにコンピュータに実行させるタグ付与プログラムであって、
コンテンツの特徴量とメジャー言語によるタグとを対応付けたタグ選択用データを参照して、対象コンテンツから検出された特徴量に応じて、前記対象コンテンツに適したメジャー言語によるタグを選択する処理と、
所定の変換規則により前記選択されたメジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換する処理とを含むことを特徴とするタグ付与プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010099032A JP5444106B2 (ja) | 2010-04-22 | 2010-04-22 | タグ付与装置、変換規則生成装置およびタグ付与プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010099032A JP5444106B2 (ja) | 2010-04-22 | 2010-04-22 | タグ付与装置、変換規則生成装置およびタグ付与プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011227825A true JP2011227825A (ja) | 2011-11-10 |
JP5444106B2 JP5444106B2 (ja) | 2014-03-19 |
Family
ID=45043070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010099032A Expired - Fee Related JP5444106B2 (ja) | 2010-04-22 | 2010-04-22 | タグ付与装置、変換規則生成装置およびタグ付与プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5444106B2 (ja) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000163441A (ja) * | 1998-11-30 | 2000-06-16 | Nippon Telegr & Teleph Corp <Ntt> | 辞書作成方法及び装置及び辞書作成プログラムを格納した記憶媒体及び検索要求作成方法及び装置及び検索要求作成プログラムを格納した記憶媒体及び多言語対応情報検索システム |
JP2002132796A (ja) * | 2000-10-24 | 2002-05-10 | Kyodo Printing Co Ltd | 画像特徴量対キーワード辞書を記録したコンピュータ読み取り可能な記録媒体、画像特徴量対キーワード辞書構築装置及びその方法並びに画像データベース構築補助装置及びその方法 |
JP2004280259A (ja) * | 2003-03-13 | 2004-10-07 | National Institute Of Information & Communication Technology | 検索装置 |
US20040225686A1 (en) * | 2003-04-08 | 2004-11-11 | Jia Li | System and method for automatic linguistic indexing of images by a statistical modeling approach |
JP2008191936A (ja) * | 2007-02-05 | 2008-08-21 | Fujifilm Corp | コンテンツ登録・検索システムの構築支援方法、およびコンテンツ登録・検索システムの構築支援装置 |
US20090006342A1 (en) * | 2007-06-26 | 2009-01-01 | Nokia Corporation | Method, Apparatus and Computer Program Product for Providing Internationalization of Content Tagging |
US20090248394A1 (en) * | 2008-03-25 | 2009-10-01 | Ruhi Sarikaya | Machine translation in continuous space |
US20090254540A1 (en) * | 2007-11-01 | 2009-10-08 | Textdigger, Inc. | Method and apparatus for automated tag generation for digital content |
US20090287674A1 (en) * | 2008-05-15 | 2009-11-19 | International Business Machines Corporation | Method for Enhancing Search and Browsing in Collaborative Tagging Systems Through Learned Tag Hierachies |
-
2010
- 2010-04-22 JP JP2010099032A patent/JP5444106B2/ja not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000163441A (ja) * | 1998-11-30 | 2000-06-16 | Nippon Telegr & Teleph Corp <Ntt> | 辞書作成方法及び装置及び辞書作成プログラムを格納した記憶媒体及び検索要求作成方法及び装置及び検索要求作成プログラムを格納した記憶媒体及び多言語対応情報検索システム |
JP2002132796A (ja) * | 2000-10-24 | 2002-05-10 | Kyodo Printing Co Ltd | 画像特徴量対キーワード辞書を記録したコンピュータ読み取り可能な記録媒体、画像特徴量対キーワード辞書構築装置及びその方法並びに画像データベース構築補助装置及びその方法 |
JP2004280259A (ja) * | 2003-03-13 | 2004-10-07 | National Institute Of Information & Communication Technology | 検索装置 |
US20040225686A1 (en) * | 2003-04-08 | 2004-11-11 | Jia Li | System and method for automatic linguistic indexing of images by a statistical modeling approach |
JP2008191936A (ja) * | 2007-02-05 | 2008-08-21 | Fujifilm Corp | コンテンツ登録・検索システムの構築支援方法、およびコンテンツ登録・検索システムの構築支援装置 |
US20090006342A1 (en) * | 2007-06-26 | 2009-01-01 | Nokia Corporation | Method, Apparatus and Computer Program Product for Providing Internationalization of Content Tagging |
US20090254540A1 (en) * | 2007-11-01 | 2009-10-08 | Textdigger, Inc. | Method and apparatus for automated tag generation for digital content |
US20090248394A1 (en) * | 2008-03-25 | 2009-10-01 | Ruhi Sarikaya | Machine translation in continuous space |
US20090287674A1 (en) * | 2008-05-15 | 2009-11-19 | International Business Machines Corporation | Method for Enhancing Search and Browsing in Collaborative Tagging Systems Through Learned Tag Hierachies |
Non-Patent Citations (2)
Title |
---|
CSNG200900266212; 加藤誠、外3名: 'Web画像の「らしさ」検索:語の典型的特徴を表す語集合のソーシャルタギング情報からの取得によるWeb' 電子情報通信学会 第19回データ工学ワークショップ論文集 [online] , 20080407, p.1-8, 電子情報通信学会データ工学研究専門委員会 * |
JPN6013061152; 加藤誠、外3名: 'Web画像の「らしさ」検索:語の典型的特徴を表す語集合のソーシャルタギング情報からの取得によるWeb' 電子情報通信学会 第19回データ工学ワークショップ論文集 [online] , 20080407, p.1-8, 電子情報通信学会データ工学研究専門委員会 * |
Also Published As
Publication number | Publication date |
---|---|
JP5444106B2 (ja) | 2014-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7028858B2 (ja) | 電子記録の文脈検索のためのシステム及び方法 | |
US9489401B1 (en) | Methods and systems for object recognition | |
US8037051B2 (en) | Matching and recommending relevant videos and media to individual search engine results | |
US20110191336A1 (en) | Contextual image search | |
TW201220099A (en) | Multi-modal approach to search query input | |
CN110083729B (zh) | 一种图像搜索的方法及系统 | |
US20180046721A1 (en) | Systems and Methods for Automatic Customization of Content Filtering | |
CN111694965A (zh) | 一种基于多模态知识图谱的图像场景检索系统及方法 | |
CN109271542A (zh) | 封面确定方法、装置、设备及可读存储介质 | |
CN106980664B (zh) | 一种双语可比较语料挖掘方法及装置 | |
CN105868177A (zh) | 一种通用公式搜索方法 | |
US20120162244A1 (en) | Image search color sketch filtering | |
US20160283564A1 (en) | Predictive visual search enginge | |
CN108509521A (zh) | 一种自动生成文本索引的图像检索方法 | |
CN106874397B (zh) | 一种面向物联网设备的自动语义标注方法 | |
CN104008180A (zh) | 结构化数据与图片的关联方法与关联装置 | |
US20190294705A1 (en) | Image annotation | |
CN103744887A (zh) | 一种用于人物搜索的方法、装置和计算机设备 | |
CN103440262A (zh) | 基于相关反馈和Bag-of-Features的图像检索系统及方法 | |
Spitz et al. | EVELIN: Exploration of event and entity links in implicit networks | |
CN103942274A (zh) | 一种基于lda的生物医疗图像的标注系统及方法 | |
Barz et al. | Wikichurches: A fine-grained dataset of architectural styles with real-world challenges | |
EP3905060A1 (en) | Artificial intelligence for content discovery | |
CN101213539A (zh) | 交叉描述符学习系统、方法及其程序产品 | |
JP6607691B2 (ja) | 評価値演算装置、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5444106 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |