JP5444106B2 - Tag assignment device, conversion rule generation device, and tag assignment program - Google Patents

Tag assignment device, conversion rule generation device, and tag assignment program Download PDF

Info

Publication number
JP5444106B2
JP5444106B2 JP2010099032A JP2010099032A JP5444106B2 JP 5444106 B2 JP5444106 B2 JP 5444106B2 JP 2010099032 A JP2010099032 A JP 2010099032A JP 2010099032 A JP2010099032 A JP 2010099032A JP 5444106 B2 JP5444106 B2 JP 5444106B2
Authority
JP
Japan
Prior art keywords
tag
language
conversion rule
conversion
major
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010099032A
Other languages
Japanese (ja)
Other versions
JP2011227825A (en
Inventor
広海 石先
啓一郎 帆足
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2010099032A priority Critical patent/JP5444106B2/en
Publication of JP2011227825A publication Critical patent/JP2011227825A/en
Application granted granted Critical
Publication of JP5444106B2 publication Critical patent/JP5444106B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、Web上での使用度の低いマイナー言語によるタグをコンテンツに対して付与するタグ付与装置、変換規則生成装置およびタグ付与プログラムに関する。   The present invention relates to a tag assignment device, a conversion rule generation device, and a tag assignment program for attaching a tag in a minor language with low usage on the Web to content.

従来、コンテンツのメタデータを生成したり、タグ付けしたりする方法が知られている。特許文献1では、文書に適切なタグを付与して文書の整理を行うために、閲覧者を支援することができ、また、タグを精度良く付与できる自動タグ付与装置を提供している。タグ付きの文書をインターネットから収集し、タグ付き文書から、そのタグが設定された文書集合中の特徴的な語句を基に、同一の意味を示すタグ同士を統合し、各タグに対して、特徴的な語句を基に、そのタグが特定の話題を示すかどうかを判定する。さらに、タグの重要性判断と、統合結果との判断結果に基づいて自動で文書にタグを付与する方法に関して記述されている。   Conventionally, methods for generating or tagging metadata of content are known. Patent Document 1 provides an automatic tagging device that can assist a viewer in order to organize a document by assigning an appropriate tag to the document, and can assign a tag with high accuracy. Tagged documents are collected from the Internet, and tags that have the same meaning are integrated from tagged documents based on the characteristic words in the document set in which the tags are set. Whether or not the tag indicates a specific topic is determined based on the characteristic words. Further, it describes a method for automatically assigning a tag to a document based on the determination result of the importance of the tag and the integration result.

非特許文献1では、事前に正解タグ情報が付与された画像と単語の学習データセットを利用する方法が開示されている。その方法では、pLSA( probabilistic Latent Semantic Analysis )と呼ばれる共起確率モデルを利用し、学習データセットから、未知の入力画像testを入力する際に最適なトピックを算出することで、未知入力画像に対して自動でタグを付与させている。   Non-Patent Document 1 discloses a method of using an image and word learning data set to which correct tag information is assigned in advance. The method uses a co-occurrence probability model called pLSA (probabilistic Latent Semantic Analysis) and calculates the optimal topic when inputting the unknown input image test from the training data set. And automatically add tags.

非特許文献2では、あらかじめカテゴリ情報が付与された画像を学習データとして、2DMHMM(2次元多段階解像度隠れマルコフモデル)と呼ばれる、画像と特徴の関連付けモデルを利用して画像に対する索引情報を付与させる方法が開示されている。   In Non-Patent Document 2, index information is assigned to an image by using an image-feature association model called 2DMHMM (two-dimensional multi-level hidden Markov model), using an image with category information added in advance as learning data. A method is disclosed.

非特許文献3では、学習データとして、Flickrから画像およびタグ情報を用いて、pLSAモデルを利用した自動タグ付与技術が提案されている。非特許文献4では、非特許文献1などで利用されているpLSAについて記述されている。なお、Flickrとは、不特定多数が写真や動画を投稿・共有し、自由にタグ付けすることができる外部写真共有サイトの一種である。   Non-Patent Document 3 proposes an automatic tagging technique using a pLSA model using image and tag information from Flickr as learning data. Non-Patent Document 4 describes pLSA used in Non-Patent Document 1 and the like. Flickr is a type of external photo sharing site where an unspecified number of people can post and share photos and videos and tag them freely.

非特許文献5では、非特許文献1、2などで利用されている、SIFT特徴量について記載されている。SIFT特徴量とは、局所的な画像パターンを表現することが可能であり、例えば、学習画像データ群の特徴量をk-meansクラスタリングし、C種類のコードブックを作成する。各画像はこのC種類のコードブックの集合として表現される。   Non-Patent Document 5 describes SIFT feature values used in Non-Patent Documents 1 and 2 and the like. The SIFT feature amount can represent a local image pattern. For example, the feature amount of the learning image data group is k-means clustered to create a C type codebook. Each image is expressed as a set of C types of codebooks.

特開2008−310626号公報JP 2008-310626 A

Florent Monay and Daniel Gatica-Perez, “PLSA-based image auto-annotation: constraining the latent space “, Proc. of ACM Multimedia, pp. 348-351, 2004.Florent Monay and Daniel Gatica-Perez, “PLSA-based image auto-annotation: constraining the latent space“, Proc. Of ACM Multimedia, pp. 348-351, 2004. Jia Li and James Ze Wang. Automatic linguistic indexing of pictures by a statistical modeling approach. IEEE Trans. Pattern Anal. Mach. Intell, 25(10):1075_1088, 2003.Jia Li and James Ze Wang. Automatic linguistic indexing of pictures by a statistical modeling approach.IEEE Trans. Pattern Anal. Mach. Intell, 25 (10): 1075_1088, 2003. Stefan Romberg, Eva Horster, Rainer Lienhart, Multimodal pLSA on visual features and tags, Proc. of ICME 2009, pp 414-417, 2009Stefan Romberg, Eva Horster, Rainer Lienhart, Multimodal pLSA on visual features and tags, Proc. Of ICME 2009, pp 414-417, 2009 T. Hofmann, “Unsupervised Learning by Probabilistic Latent Semantic Analysis”, Machine Leaning, vol.42, pp.177-196 (2001).T. Hofmann, “Unsupervised Learning by Probabilistic Latent Semantic Analysis”, Machine Leaning, vol.42, pp.177-196 (2001). David G. Lowe, "Object Recognition from Local Scale-Invariant Features," iccv, vol. 2, pp.1150, Seventh International Conference on Computer Vision (ICCV'99) - Volume 2, 1999David G. Lowe, "Object Recognition from Local Scale-Invariant Features," iccv, vol. 2, pp.1150, Seventh International Conference on Computer Vision (ICCV'99)-Volume 2, 1999

特許文献1では、インターネットに存在する文書などから、特徴的かつ類似するタグ情報を未知文書に自動で付与することができる。しかし、学習データが十分でない場合には付与精度に関しては保証されていない。例えば、膨大な学習データに基づいて付与されたタグ情報と、少量学習データに基づいて付与されたタグ情報の精度に差が出る可能性がある。   In Patent Document 1, characteristic and similar tag information can be automatically assigned to an unknown document from a document existing on the Internet. However, when the learning data is not sufficient, the accuracy of grant is not guaranteed. For example, there is a possibility that there is a difference in accuracy between tag information assigned based on a large amount of learning data and tag information assigned based on a small amount of learning data.

非特許文献1、2では、事前に正解情報(タグ)が付与された学習データを利用している。これは正解情報が付与された学習データが多く存在していることが前提となっており、文献中では手動で付与されたデータが利用されている。   In Non-Patent Documents 1 and 2, learning data to which correct information (tag) is assigned in advance is used. This is based on the premise that there is a lot of learning data to which correct information is assigned, and data that is manually assigned is used in the literature.

このように、手動で正解情報が付与された学習データを多く収集することは困難であり、非特許文献3などでは、学習データとして、Flickrの画像情報と、タグ情報を利用して自動タグ付与システムを構築している。   As described above, it is difficult to collect a large amount of learning data to which correct information is manually added. In Non-Patent Document 3, automatic tagging is performed using Flickr image information and tag information as learning data. A system is being built.

一方で、これら技術では対象となる言語情報は英語などのメジャーな言語(メジャー言語システム)を対象としており、日本語などのマイナーな言語を利用してシステム(マイナー言語システム)を構築した場合には、メジャー言語システムの精度に比べて、精度が劣化する可能性がある。   On the other hand, the target language information for these technologies is for major languages such as English (major language system), and when a system (minor language system) is constructed using minor languages such as Japanese. May be less accurate than major language systems.

実際に、英語のタグとして、「car, dog, fireworks, flower, food, hanami, ski, sumo, tokyotower, sea, bird, bike」、日本語のタグとして、「車、犬、花火、花、食べ物、花見、スキー、相撲、東京タワー、海、鳥、自転車」として入力した場合のFlickrでの検索結果の違いを下表に示す。検索の際、skiとskiing、食べ物と食物、スキーとスキー場は、それぞれ別クエリとして入力した。また、全ての英語のクエリに対して、japanとjapaneseを組み合わせて検索した。さらに、収集した画像に付与されているタグはストップワードの削除などを経て、下表の数値を得た。なお、検索対象期間は2005年10月1日から、2009年10月1日までとした。タグ数は、全ての画像データに付与されたタグ数の総数で、ユニークタグ数とは、重複するタグを削除したものである。

Figure 0005444106
Actually, as an English tag, "car, dog, fireworks, flower, food, hanami, ski, sumo, tokyotower, sea, bird, bike", as a Japanese tag, "car, dog, fireworks, flowers, food , Hanami, Skiing, Sumo, Tokyo Tower, Sea, Birds, Bicycle "and the search results in Flickr are shown in the table below. In the search, ski and skiing, food and food, ski and ski area were entered as separate queries. We also searched for all English queries using a combination of japan and japanese. Furthermore, the tags attached to the collected images were obtained by deleting the stop words, etc., and obtaining the numerical values shown in the table below. The search period was from October 1, 2005 to October 1, 2009. The number of tags is the total number of tags assigned to all image data. The number of unique tags is obtained by deleting duplicate tags.
Figure 0005444106

このように、メジャー言語とマイナー言語間においてタグの数や、画像データの数などに差が大きくあり、これらを学習データとして自動タグ付与システムを構築した場合には、精度が大きく異なる可能性がある。   In this way, there is a large difference in the number of tags and the number of image data between major languages and minor languages. If an automatic tagging system is constructed using these as learning data, the accuracy may differ greatly. is there.

本発明は、このような事情に鑑みてなされたものであり、マイナーな言語において自動タグ付与の精度を向上させることができるタグ付与装置、変換規則生成装置およびタグ付与プログラムを提供することを目的とする。   The present invention has been made in view of such circumstances, and it is an object of the present invention to provide a tag assignment device, a conversion rule generation device, and a tag assignment program that can improve the accuracy of automatic tag assignment in a minor language. And

(1)上記の目的を達成するため、本発明のタグ付与装置は、Web上での使用度の低いマイナー言語によるタグをコンテンツに対して付与するタグ付与装置であって、コンテンツの特徴量とメジャー言語によるタグとを対応付けたタグ選択用データを参照して、対象コンテンツから検出された特徴量に応じて、前記対象コンテンツに適したメジャー言語によるタグを選択するタグ選択部と、所定の変換規則により前記選択されたメジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換するタグ変換部とを備えることを特徴としている。   (1) In order to achieve the above object, a tag assigning device according to the present invention is a tag assigning device that assigns a tag in a minor language with low usage on the Web to the content, A tag selection unit that selects a tag in a major language suitable for the target content in accordance with a feature amount detected from the target content with reference to tag selection data in which a tag in the major language is associated; And a tag conversion unit that converts the tag in the selected major language according to the conversion rule into a tag in a minor language that is easily given at the same time.

このように本発明のタグ付与装置では、特徴量に応じて付与されたメジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換する。その結果、日本語などのマイナーな言語においても、英語などのメジャーな言語を学習データとした場合と同等に自動タグ付与の精度を向上させることができる。   As described above, in the tag assigning device of the present invention, the major language tag assigned according to the feature amount is converted into a minor language tag that is easily given at the same time. As a result, even in a minor language such as Japanese, the accuracy of automatic tagging can be improved as in the case where a major language such as English is used as learning data.

(2)また、本発明のタグ付与装置は、前記タグ変換部が、前記所定の変換規則としてWeb上の情報を用いて動的に更新される規則を用いることを特徴としている。これにより、Web上の情報に基づいて動的に変換規則を更新できるため、比較的新しい語句や辞書に載っていない俗語などについても適切に変換できる。たとえば、Flickrなどが提供している画像検索APIなどを利用することでキーワードに該当する画像データおよびタグ情報を取得することができる。   (2) In the tag assigning device of the present invention, the tag conversion unit uses a rule that is dynamically updated using information on the Web as the predetermined conversion rule. Thereby, since the conversion rule can be dynamically updated based on information on the Web, relatively new words and slang words not included in the dictionary can be appropriately converted. For example, image data and tag information corresponding to a keyword can be acquired by using an image search API provided by Flickr or the like.

(3)また、本発明のタグ付与装置は、前記タグ変換部が、メジャー言語のタグとマイナー言語のタグとが同一のコンテンツに付与される共起頻度を反映した変換規則を用いることを特徴としている。これにより、共起頻度を利用してメジャー言語のタグと関連の強いマイナー言語のタグに変換することができる。   (3) Further, in the tag assigning device of the present invention, the tag conversion unit uses a conversion rule reflecting a co-occurrence frequency in which a major language tag and a minor language tag are assigned to the same content. It is said. Thus, the co-occurrence frequency can be used to convert the tag into a minor language tag strongly related to the major language tag.

(4)また、本発明のタグ付与装置は、前記タグ変換部が、前記変換規則として変換マトリクスを用いることを特徴としている。これにより、容易に変換規則を生成することができ、生成された変換マトリクスだけ取得してタグをメジャー言語からマイナー言語に変換できる。   (4) Moreover, the tag provision apparatus of this invention is characterized by the said tag conversion part using a conversion matrix as said conversion rule. As a result, conversion rules can be easily generated, and only the generated conversion matrix can be acquired to convert a tag from a major language to a minor language.

(5)また、本発明の変換規則生成装置は、メジャー言語による語句からマイナー言語による語句への変換規則を生成する変換規則生成装置であって、不特定のユーザによりメジャー言語およびメジャー言語よりWeb上での使用度の低いマイナー言語のタグが付けられたコンテンツをWeb上から取得するコンテンツ取得部と、前記取得されたコンテンツおよびタグを格納するデータベースと、前記格納されたコンテンツおよびタグを用いて、メジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換する変換規則を動的に生成する変換規則生成部とを備えることを特徴としている。これにより、メジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換する変換規則を動的に生成することができる。その結果、手動による労力を要することなく、自動でタグを付与するシステムを構築することが可能になる。   (5) The conversion rule generation apparatus of the present invention is a conversion rule generation apparatus that generates a conversion rule from a phrase in a major language to a phrase in a minor language. Using a content acquisition unit for acquiring content tagged with a minor language tag with low usage on the Web, a database for storing the acquired content and tag, and the stored content and tag And a conversion rule generation unit that dynamically generates a conversion rule for converting a tag in a major language into a tag in a minor language that is easily given at the same time. Accordingly, it is possible to dynamically generate a conversion rule for converting a tag in a major language into a tag in a minor language that is easily given at the same time. As a result, it is possible to construct a system for automatically attaching tags without requiring manual labor.

(6)また、本発明のタグ付与システムは、上記のタグ付与装置と、上記の変換規則生成装置とを備えることを特徴としている。これにより、変換規則生成装置が生成した変換規則を用いて、タグ付与装置はメジャー言語のタグをマイナー言語のタグに変換することができる。   (6) Moreover, the tag provision system of this invention is provided with said tag provision apparatus and said conversion rule production | generation apparatus, It is characterized by the above-mentioned. Accordingly, the tagging device can convert the major language tag into the minor language tag using the conversion rule generated by the conversion rule generation device.

(7)また、本発明のタグ付与プログラムは、Web上での使用度の低いマイナー言語によるタグをコンテンツに対して付与するためにコンピュータに実行させるタグ付与プログラムであって、コンテンツの特徴量とメジャー言語によるタグとを対応付けたタグ選択用データを参照して、対象コンテンツから検出された特徴量に応じて、前記対象コンテンツに適したメジャー言語によるタグを選択する処理と、所定の変換規則により前記選択されたメジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換する処理とを含むことを特徴としている。   (7) The tagging program of the present invention is a tagging program that causes a computer to execute a tag in a minor language with low usage on the Web, to the content. A process of selecting a tag in a major language suitable for the target content according to a feature amount detected from the target content with reference to tag selection data in which a tag in the major language is associated, and a predetermined conversion rule And a process of converting a tag in the selected major language into a tag in a minor language that is easily given at the same time.

本発明によれば、マイナーな言語において自動タグ付与の精度を向上させることができる。また、変換規則を用いることから、手動による労力を要することなく、自動でタグ付与できる。   According to the present invention, it is possible to improve the accuracy of automatic tagging in a minor language. In addition, since conversion rules are used, tags can be automatically assigned without requiring manual labor.

本発明に係るタグ付与システムの構成を示すブロック図である。It is a block diagram which shows the structure of the tag provision system which concerns on this invention. 本発明に係る変換規則生成装置の動作の一例を示すフローチャートである。It is a flowchart which shows an example of operation | movement of the conversion rule production | generation apparatus which concerns on this invention. 本発明に係るタグ付与装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the tag provision apparatus which concerns on this invention. タグ付与処理の一例を示す図である。It is a figure which shows an example of a tag provision process. 各タグ付与方法に対する精度平均および標準偏差を示すグラフである。It is a graph which shows the precision average and standard deviation with respect to each tag provision method. 各タグ付与方法に対するランキング評価結果平均および標準偏差である。It is the ranking evaluation result average and standard deviation for each tag assignment method. 変換マトリクスと辞書システムのそれぞれの変換結果例を示す図である。It is a figure which shows the example of each conversion result of a conversion matrix and a dictionary system.

以下に、本発明の実施の形態について、図面を参照しながら説明する。説明の理解を容易にするため、各図面において同一の構成要素に対しては同一の参照番号を付し、重複する説明は省略する。   Embodiments of the present invention will be described below with reference to the drawings. In order to facilitate understanding of the description, the same reference numerals are given to the same components in the respective drawings, and duplicate descriptions are omitted.

(タグ付与システムの構成)
図1は、タグ付与システム100の構成を示すブロック図である。図1に示すように、タグ付与システム100は、変換規則生成装置110と、タグ付与装置120とを備えている。なお、以下で説明するタグ付与システム100では、変換規則生成装置110と、タグ付与装置120とはネットワークで接続されているが、一つの装置であってもよい。
(Configuration of tagging system)
FIG. 1 is a block diagram showing the configuration of the tag assignment system 100. As shown in FIG. 1, the tag assignment system 100 includes a conversion rule generation device 110 and a tag assignment device 120. In the tag assignment system 100 described below, the conversion rule generation device 110 and the tag assignment device 120 are connected via a network, but may be a single device.

(変換規則生成装置の構成)
変換規則生成装置110は、コンテンツ取得部111、データベース112、タグ付与モデル構築部113および変換規則生成部114を備え、メジャー言語による語句からマイナー言語による語句への変換規則を生成する。これにより、メジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換する変換規則を生成することができる。
(Configuration of conversion rule generator)
The conversion rule generation device 110 includes a content acquisition unit 111, a database 112, a tagging model construction unit 113, and a conversion rule generation unit 114, and generates a conversion rule from words in major languages to words in minor languages. Thereby, it is possible to generate a conversion rule for converting a tag in a major language into a tag in a minor language that is easily given at the same time.

その結果、手動による労力を要することなく、自動でタグを付与するシステムを構築することが可能になる。変換規則生成装置110は、たとえばサーバとしてタグ付与装置120とは別個に設けられてもよいし、タグ付与装置120と一体にPCとして設けられてもよい。   As a result, it is possible to construct a system for automatically attaching tags without requiring manual labor. The conversion rule generation device 110 may be provided as a server separately from the tag assignment device 120, or may be provided as a PC integrally with the tag assignment device 120, for example.

コンテンツ取得部111は、不特定のユーザによりメジャー言語およびメジャー言語よりWeb上での使用度の低いマイナー言語のタグが付けられたコンテンツをWeb上から取得する。たとえば、写真共有サイト180からタグ付きのコンテンツを取得する。コンテンツには、画像データに限らず、音楽データ、動画データ、テキストデータ等も含まれる。たとえば、学習データとなる画像データ群および画像データ群に対応するタグ情報を外部API190などから収集する。また、収集された画像データ群およびタグ情報をデータベース112に格納する。   The content acquisition unit 111 acquires, from the Web, content that has been tagged by a non-specific user with a major language and a minor language tag that is less used on the Web than the major language. For example, content with a tag is acquired from the photo sharing site 180. The content includes not only image data but also music data, moving image data, text data, and the like. For example, image data groups serving as learning data and tag information corresponding to the image data groups are collected from the external API 190 or the like. Further, the collected image data group and tag information are stored in the database 112.

データベース112は、メジャー言語学習データベース(メジャー言語学習DB)112aおよびマイナー言語学習データベース(マイナー言語学習DB)112bを備え、取得されたコンテンツおよびタグを格納する。なお、データベース112をネットワークを介して外部に設けることも可能である。また、データベース112は、必ずしもメジャー言語学習DB112aとマイナー言語学習DB112bとに区分されて構成されている必要は無い。   The database 112 includes a major language learning database (major language learning DB) 112a and a minor language learning database (minor language learning DB) 112b, and stores acquired contents and tags. The database 112 can also be provided outside via a network. Further, the database 112 does not necessarily need to be divided into the major language learning DB 112a and the minor language learning DB 112b.

メジャー言語学習DB112aは、メジャー言語によってタグが付与された画像データ群と、画像データ群に対応するタグ情報を格納する。画像データ群のファイル形式は、Jpeg形式や、PNG形式などを利用できるが、これらに限られない。また、タグ情報とは、ユーザが付与したテキスト情報や、撮影日時、GPS情報等を表している。   The major language learning DB 112a stores an image data group to which a tag is assigned according to the major language and tag information corresponding to the image data group. As a file format of the image data group, a JPEG format, a PNG format, or the like can be used, but is not limited thereto. The tag information represents text information provided by the user, shooting date and time, GPS information, and the like.

マイナー言語学習DB112bは、メジャー言語学習DB112aと同様、マイナー言語によってタグが付与された画像データ群と、画像データ群に対応するタグ情報を格納する。ただし、格納するデータについて、マイナー言語学習DB112bよりもデータ量(画像数、タグ数、ユニークタグ数)が多いか、もしくはクオリティが高いものをメジャー言語学習DB112aとする。したがって、例えば、データ数が少ないデータベースを自動的にマイナー言語学習DB112bとして選択し、メジャー言語、マイナー言語を切り替えることなども可能である。   Similar to the major language learning DB 112a, the minor language learning DB 112b stores an image data group to which a tag is assigned by a minor language and tag information corresponding to the image data group. However, regarding the data to be stored, data having a larger amount of data (number of images, number of tags, number of unique tags) or higher quality than the minor language learning DB 112b is defined as the major language learning DB 112a. Therefore, for example, it is possible to automatically select a database having a small number of data as the minor language learning DB 112b and switch between the major language and the minor language.

タグ付与モデル構築部113は、メジャー言語学習データベース112aに格納されたコンテンツおよびタグを用いてタグ付与モデルを構築する。タグ付与モデル構築部113は、メジャー言語学習DB112aに格納された画像データ・タグ情報群に基づいて、自動タグ付与に必要なタグ付与モデルを構築する。例えば、事前にタグが付与された学習データを利用し、特徴量とタグとの対応関係を構築する。また、その他にも、学習データに基づいて構築されるモデルであれば、タグ付与モデル構築部113として利用することが可能である。   The tagging model construction unit 113 constructs a tagging model using content and tags stored in the major language learning database 112a. The tagging model construction unit 113 constructs a tagging model necessary for automatic tagging based on the image data / tag information group stored in the major language learning DB 112a. For example, the correspondence between the feature quantity and the tag is constructed using learning data to which a tag has been assigned in advance. In addition, any model constructed based on learning data can be used as the tagging model construction unit 113.

変換規則生成部114は、格納されたコンテンツおよびタグを用いて、メジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換する変換規則を動的に生成する。これにより、Web上の情報に基づいて動的に変換規則を更新できるため、比較的新しい語句や辞書に載っていない俗語などについても適切に変換できる。たとえば、Flickrなどが提供している画像検索APIなどを利用することでキーワードに該当する画像データおよびタグ情報を取得することができる。   The conversion rule generation unit 114 dynamically generates a conversion rule for converting a tag in a major language into a tag in a minor language that is easily given at the same time, using the stored content and tag. Thereby, since the conversion rule can be dynamically updated based on information on the Web, relatively new words and slang words not included in the dictionary can be appropriately converted. For example, image data and tag information corresponding to a keyword can be acquired by using an image search API provided by Flickr or the like.

変換規則生成部114は、データベース112から、メジャー言語をマイナー言語に変換するための変換規則を生成する。例えば、両者の言語によるタグを含む画像データを抽出し、共起頻度を計算することで、変換マトリクスを計算する。これにより、共起頻度を利用してメジャー言語のタグと関連の強いマイナー言語のタグに変換することができる。なお、以下で説明する例では変換規則として変換マトリクスを用いるが、既存の辞書変換システムの対応関係を用いてもよい。また、変換マトリクスの生成と辞書システムの利用とを互いに補完的に行なってもよい。   The conversion rule generation unit 114 generates a conversion rule for converting a major language into a minor language from the database 112. For example, the conversion matrix is calculated by extracting image data including tags in both languages and calculating the co-occurrence frequency. Thus, the co-occurrence frequency can be used to convert the tag into a minor language tag strongly related to the major language tag. In the example described below, a conversion matrix is used as a conversion rule, but a correspondence relationship of an existing dictionary conversion system may be used. Further, the generation of the conversion matrix and the use of the dictionary system may be performed complementarily.

メジャー言語をL_{A}、マイナー言語をL_{B}と表すと、言語L_{A}およびL_{B}におけるボキャブラリは以下の式(1)、(2)のように表せる。

Figure 0005444106
Figure 0005444106
If the major language is represented by L_ {A} and the minor language is represented by L_ {B}, the vocabulary in the languages L_ {A} and L_ {B} can be represented by the following equations (1) and (2).
Figure 0005444106
Figure 0005444106

ここで、M、Nはそれぞれの言語におけるボキャブラリのサイズを表しており、w_{mA}、w_{nB}は各ボキャブラリ内でのタグを表現している。W_{A}、W_{B}に基づいて変換マトリクスT_{L_{A}→L_{B}}を表現すると、M×Nのマトリクスとして式(3)のようにあらわせる。

Figure 0005444106
Here, M and N represent vocabulary sizes in the respective languages, and w_ {mA} and w_ {nB} represent tags in each vocabulary. When the transformation matrix T_ {L_ {A} → L_ {B}} is expressed on the basis of W_ {A} and W_ {B}, it is expressed as Equation (3) as an M × N matrix.
Figure 0005444106

ここで、要素t_{(m,n)}は、タグw_{mA}とw_{nB}がどの程度共起してタグとして付与されているかを表しており、タグw_{mA}とw_{nB}の共起回数cnt(w_{mA},w_{nB})などにより表せる。また、共起確率として表現してもよい。   Here, the element t _ {(m, n)} represents how much the tags w_ {mA} and w_ {nB} co-occur and are attached as tags, and the tags w_ {mA} and w_ { nB} co-occurrence count cnt (w_ {mA}, w_ {nB}). Moreover, you may express as a co-occurrence probability.

(タグ付与装置の構成)
タグ付与装置120は、タグ選択部121およびタグ変換部122を備え、Web上での使用度の低いマイナー言語によるタグをコンテンツに対して付与する。これにより、日本語などのマイナーな言語においても、英語などのメジャーな言語に変換することでメジャーな言語を学習データとした場合と同等に自動タグ付与の精度を向上させることができる。タグ付与モデル構築部113によって得られたタグ付与モデルを利用して、未知の入力画像データに対し、自動でメジャー言語によるタグを付与することができる。
(Configuration of tagging device)
The tag assigning device 120 includes a tag selection unit 121 and a tag conversion unit 122, and assigns a tag in a minor language with low usage on the Web to content. Thereby, even in a minor language such as Japanese, the accuracy of automatic tagging can be improved by converting it into a major language such as English as in the case where the major language is used as learning data. A tag in a major language can be automatically assigned to unknown input image data using the tag assignment model obtained by the tag assignment model construction unit 113.

タグ付与装置120は、たとえば携帯端末やPCとして変換規則生成装置110とは別個に設けられてもよいし、変換規則生成装置110と一体にPCとして設けられてもよい。たとえば、携帯端末でタグ付与を行う場合には、変換規則の生成をサーバ等の別個の装置で行なった方が効率的である。ただし、携帯端末を用いる場合には、頻度により上位の所定件数のみ用いる等のパラメータによる制限が可能である。   The tag assignment device 120 may be provided separately from the conversion rule generation device 110 as a mobile terminal or a PC, for example, or may be provided as a PC integrally with the conversion rule generation device 110. For example, when tagging is performed with a portable terminal, it is more efficient to generate the conversion rule with a separate device such as a server. However, in the case of using a portable terminal, it is possible to limit by parameters such as using only the upper predetermined number depending on the frequency.

タグ選択部121は、コンテンツの特徴量とメジャー言語によるタグとを対応付けたタグ選択用データを参照して、対象コンテンツから検出された特徴量に応じて、対象コンテンツに適したメジャー言語によるタグを選択する。これにより、画像データの特徴に応じた適切なタグを付与することができる。タグ選択部121は、タグ付与モデル構築部113によって得られたタグ付与モデルを利用して、未知の入力画像データに対し、自動でメジャー言語によるタグを付与する。   The tag selection unit 121 refers to the tag selection data in which the feature amount of the content and the tag in the major language are associated, and the tag in the major language suitable for the target content according to the feature amount detected from the target content Select. Thereby, a suitable tag according to the feature of image data can be given. The tag selection unit 121 uses the tag addition model obtained by the tag addition model construction unit 113 to automatically add a tag in a major language to unknown input image data.

タグ変換部122は、所定の変換規則により選択されたメジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換する。タグ変換部122は、Web上の情報を用いて動的に更新される所定の変換規則を用いる。タグ変換部122は、メジャー言語のタグとマイナー言語のタグとが同一のコンテンツに付与される共起頻度を反映した変換規則を用いる。タグ変換部122は、変換規則として変換マトリクスを用いる。これにより、容易に変換規則を生成することができ、生成された変換マトリクスだけ取得してタグをメジャー言語からマイナー言語に変換できる。   The tag conversion unit 122 converts a tag in a major language selected according to a predetermined conversion rule into a tag in a minor language that is easily given at the same time. The tag conversion unit 122 uses a predetermined conversion rule that is dynamically updated using information on the Web. The tag conversion unit 122 uses a conversion rule reflecting the co-occurrence frequency assigned to the same content in the major language tag and the minor language tag. The tag conversion unit 122 uses a conversion matrix as a conversion rule. As a result, conversion rules can be easily generated, and only the generated conversion matrix can be acquired to convert a tag from a major language to a minor language.

タグ変換部122は、タグ選択部121によって付与された未知画像データに対するメジャー言語のタグ情報を、変換規則生成部114によって得られた変換マトリクスに基づいて、マイナー言語に変換する。w_{mA}をマイナー言語w_{nB}に変換するためには、式(3)に記載されている変換マトリクスを利用して、cnt(w_{mA},w_{nB})が最大となるw_{m_{max}A}に変換する。また、タグ変換部122は、複数の同じ変換結果が得られた場合には、cnt{w_{mA},w_{nB}}の高い値を保持するものを変換結果として利用できる。   The tag conversion unit 122 converts the major language tag information for the unknown image data provided by the tag selection unit 121 into a minor language based on the conversion matrix obtained by the conversion rule generation unit 114. To convert w_ {mA} to minor language w_ {nB}, cnt (w_ {mA}, w_ {nB}) is maximized using the conversion matrix described in Equation (3) Convert to w_ {m_ {max} A}. Further, when a plurality of the same conversion results are obtained, the tag conversion unit 122 can use the one holding a high value of cnt {w_ {mA}, w_ {nB}} as the conversion result.

さらに、タグ変換部122は、外部WEBAPIなどを利用して、メジャー言語のタグを、単純に辞書変換などを適用した結果と統合して最終結果とすることもできる。例えば、参考情報に記載のサイトを利用して、変換結果を利用することなどが可能である。   Furthermore, the tag conversion unit 122 can also use the external WEBAPI or the like to integrate the major language tag with the result of simply applying dictionary conversion or the like to obtain the final result. For example, it is possible to use the conversion result by using the site described in the reference information.

なお、タグ変換部122は、タグ付与モデル構築部113において、音楽やブログなど、画像以外のタグ付与モデルを適用することで、その他のメディアに対する自動タグ付与方式において同様の処理を実現することができる。   The tag conversion unit 122 can realize the same processing in the automatic tag addition method for other media by applying a tag addition model other than an image such as music or a blog in the tag addition model construction unit 113. it can.

(変換規則生成装置の動作)
次に、変換規則生成装置110の動作を説明する。図2は、変換規則生成装置110の動作の一例を示すフローチャートである。まず、メジャー言語およびマイナー言語による検索キーワードを設定する(ステップS1)。メジャー言語を英語、マイナー言語を日本語とした場合には、「car, dog, fireworks, flower, food, hanami, ski, sumo, tokyotower, sea, bird, bike」、「車、犬、花火、花、食べ物、花見、スキー、相撲、東京タワー、海、鳥、自転車」など、それぞれの言語において、対応するキーワードを設定する。言語は、例えばそのほかにも、中国語や、スペイン語など、様々なものを利用することが可能である。
(Operation of conversion rule generator)
Next, the operation of the conversion rule generation device 110 will be described. FIG. 2 is a flowchart illustrating an example of the operation of the conversion rule generation device 110. First, search keywords in major and minor languages are set (step S1). If the major language is English and the minor language is Japanese, `` car, dog, fireworks, flower, food, hanami, ski, sumo, tokyotower, sea, bird, bike '', `` car, dog, fireworks, flowers , Food, cherry blossom viewing, skiing, sumo, Tokyo Tower, sea, birds, bicycles, etc., and corresponding keywords are set. In addition, for example, various languages such as Chinese and Spanish can be used.

次に、メジャー言語で設定したキーワード群に基づいて外部写真共有サイトなどから画像データおよびタグ情報を取得する(ステップS2)。例えば、Flickrなどが提供している画像検索APIなどを利用することでキーワードに該当する画像データおよびタグ情報を取得することができる。取得した画像データおよびタグ情報は、メジャー言語学習DB112aへと格納する(ステップS3)。   Next, image data and tag information are acquired from an external photo sharing site or the like based on the keyword group set in the major language (step S2). For example, image data and tag information corresponding to a keyword can be acquired by using an image search API provided by Flickr or the like. The acquired image data and tag information are stored in the major language learning DB 112a (step S3).

次に、マイナー言語で設定したキーワード群に基づいて外部写真共有サイトなどから画像データおよびタグ情報を取得する(ステップS4)。そして、取得した画像データおよびタグ情報は、マイナー言語学習DB112bへと格納する(ステップS5)。次に、メジャー言語学習DB112aに格納されたデータをもとにしてタグ付与モデルを生成する(ステップS6)。最後に、データベース112に格納されたデータをもとにして変換規則を作成して(ステップS7)、動作を終了する。   Next, image data and tag information are acquired from an external photo sharing site or the like based on the keyword group set in the minor language (step S4). The acquired image data and tag information are stored in the minor language learning DB 112b (step S5). Next, a tagging model is generated based on the data stored in the major language learning DB 112a (step S6). Finally, a conversion rule is created based on the data stored in the database 112 (step S7), and the operation ends.

(タグ付与装置の動作)
次に、タグ付与装置120の動作を説明する。図3は、タグ付与装置120の動作を示すフローチャートである。まず、変換規則生成装置110からタグ付与モデルを取得する(ステップT1)。また、同様に変換規則を変換規則生成装置110から取得する(ステップT2)。
(Operation of tagging device)
Next, the operation of the tag assignment device 120 will be described. FIG. 3 is a flowchart showing the operation of the tag assigning device 120. First, a tagging model is acquired from the conversion rule generation device 110 (step T1). Similarly, a conversion rule is acquired from the conversion rule generation device 110 (step T2).

次に、タグ付与の対象となる対象コンテンツについて取得したタグ付与モデルを用いてメジャー言語によるタグを選択する(ステップT3)。そして、選択されたメジャー言語によるタグを、変換規則を用いてマイナー言語のタグに変換する(ステップT4)。そして、対象コンテンツとマイナー言語のタグを対応付けて記憶して(ステップT5)、動作を終了する。以上の各動作は、プログラムをコンピュータに実行させることで実現可能である。   Next, a tag in a major language is selected using the tagging model acquired for the target content to be tagged (step T3). And the tag by the selected major language is converted into the tag of a minor language using a conversion rule (step T4). Then, the target content and the minor language tag are stored in association with each other (step T5), and the operation ends. Each of the above operations can be realized by causing a computer to execute a program.

(タグ付与処理の一例)
図4は、タグ付与処理の一例を示す図である。たとえば、データベース112に画像データ群211およびそのそれぞれに対して付与されている英語と日本語によるタグ212が格納されている。図4に示す例では、海辺の写真には英語の「sea, beach, japan」と日本語の「日本、海」のタグが付与され、魚が泳ぐ水中の写真には英語の「fish, blue, japan」と日本語の「日本、青」のタグが付与されている。また、海岸の写真には英語の「sea, blue, beach, rocks」と日本語の「青、海、岩」のタグが付与され、地上に突き出た岩の写真には、英語の「rocks」と日本語の「岩」のタグが付与されている。
(Example of tagging process)
FIG. 4 is a diagram illustrating an example of a tag assignment process. For example, the image data group 211 and English and Japanese tags 212 assigned to the image data group 211 are stored in the database 112. In the example shown in Fig. 4, the seaside photo is tagged with the English "sea, beach, japan" and the Japanese "Japan, sea", and the underwater photo where fish swims is English "fish, blue" , japan "and Japanese" Japan, blue "tags. The coastal photos are tagged with English "sea, blue, beach, rocks" and Japanese "blue, sea, rocks", and the rocks protruding above the ground are English "rocks". And the Japanese “rock” tag.

このような場合に、「sea, beach, japan, blue, rocks」の行221と「海、日本、青、岩」の列222との変換マトリクス223を、共起頻度を用いて作成できる。たとえば、「sea」行の「海」列に該当するマトリクスの要素は、上記の海辺の写真および海岸の写真の2つで共起しているため、2である。同様に各要素を共起頻度で表すことで変換マトリクス223を作成できる。この変換マトリクス223を用いてもっとも頻度の高い語句を選択することで、英語のタグから日本語のタグへの変換230が可能になる。   In such a case, a transformation matrix 223 between the row 221 of “sea, beach, japan, blue, rocks” and the column 222 of “sea, Japan, blue, rocks” can be created using the co-occurrence frequency. For example, the number of elements of the matrix corresponding to the “sea” column of the “sea” row is 2 because it co-occurs in the above-mentioned seaside photograph and coastal photograph. Similarly, the conversion matrix 223 can be created by expressing each element with the co-occurrence frequency. By selecting the most frequently used phrase using this conversion matrix 223, conversion 230 from English tags to Japanese tags becomes possible.

上記のようなタグ付与システム100を用いて、ユーザは携帯電話機で撮った大量の写真の画像データをPCに取り込み、自動で最適なタグを付与することができる。このとき、自分でタグを考えて打ち込むという煩雑な作業を省くことができる。そして、検索機能を用いて、撮った場所や状況に応じてフィルタリングすることができる。たとえば、海で撮影したあの写真にアクセスしたいという場合に「海」というキーワードを用いることで「海」の写った写真の候補を絞ることができる。なお、上記の例では、メジャー言語として英語を選び、マイナー言語として日本語を選択しているが、メジャー言語としてスペイン語を選択したり、マイナー言語としてアラビア語を選択することもできる。   Using the tag assignment system 100 as described above, the user can take in a large amount of image data taken with a mobile phone into a PC and automatically assign an optimum tag. At this time, it is possible to omit the troublesome work of thinking and tagging by yourself. Then, the search function can be used to filter according to the place and situation where the image was taken. For example, if you want to access that photo taken at the sea, you can use the keyword “sea” to narrow down the candidates for the photo that contains “the sea”. In the above example, English is selected as the major language and Japanese is selected as the minor language. However, it is also possible to select Spanish as the major language or Arabic as the minor language.

(用いられるタグ付与システム)
上記のタグ付与システム100を用いて実験を行った。本実験では、英語を学習データとしてタグ付与モデルを構築し、変換規則生成部114として共起変換および辞書変換を用いた実施例のシステム(共起変換システム、辞書変換システム)を用いた。辞書変換システムには、Google(登録商標)翻訳のAPIを利用した。また、比較例のシステムとして、変換規則生成部114に代えて学習データに日本語学習データを用いて構築したタグ付与モデルを利用した。したがって、合計3システムを構築した。
(Tagging system used)
Experiments were performed using the tagging system 100 described above. In this experiment, the system of the embodiment (co-occurrence conversion system, dictionary conversion system) using a co-occurrence conversion and a dictionary conversion as the conversion rule generation unit 114 was constructed using English as learning data. For the dictionary conversion system, Google (registered trademark) translation API was used. In addition, as a comparative example system, a tagging model constructed using Japanese learning data as learning data instead of the conversion rule generation unit 114 was used. Therefore, a total of 3 systems were constructed.

実験データは、両言語が同時に付与されている画像データ群(116,273枚)を利用し、全ての収集した画像データにおいて、BoVW特徴量300次元、色相特徴量150次元、LBP250次元、エッジ方向ヒストグラム73次元の合計773次元の特徴量を抽出した。そして、BoVW特徴量は実験データからランダムに10%の画像データを選択し、SIFT特徴量を抽出したのち、k-means 法によりコードブックを作成した。各言語において90%の画像データを学習データとし、10%のデータをテストデータとして利用した。   The experimental data uses an image data group (116,273 images) to which both languages are assigned at the same time, and in all collected image data, BoVW feature amount 300 dimensions, hue feature amount 150 dimensions, LBP 250 dimensions, edge direction histogram 73 A total of 773 dimension features were extracted. For BoVW feature values, 10% of image data was randomly selected from the experimental data, and after extracting SIFT feature values, a codebook was created by the k-means method. In each language, 90% of image data was used as learning data, and 10% of data was used as test data.

(実験方法)
テストデータは表1に記載の項目からそれぞれ5枚の画像データをランダムに選択し、合計60枚の画像データを実験に用いた。全ての画像データに対してシステムから得られたタグの上位10位までのタグを付与した。(合計30タグ)12名の被験者は全ての画像データと3手法の結果を閲覧しながら各タグについて画像データに適しているか評価を付与した。評価基準は、correct,incorrect,unknownの三項目で、各項目の評価基準は以下の表のように設定した。

Figure 0005444106
(experimental method)
As test data, five pieces of image data were selected at random from the items shown in Table 1, and a total of 60 pieces of image data were used in the experiment. The top ten tags of the tags obtained from the system were assigned to all image data. (Total 30 tags) Twelve subjects gave an evaluation as to whether each tag is suitable for image data while browsing all image data and the results of the three methods. The evaluation criteria were three items, correct, incorrect, and unknown, and the evaluation criteria for each item were set as shown in the following table.
Figure 0005444106

そして、全てのシステムに対して、順位を付与することでランキング評価を行った。まず、システムによって付与された個々のタグにおける精度について説明する。付与されたタグに対する被験者の評価から、画像毎にcorrect評価平均を計算した。   And ranking evaluation was performed by assigning ranks to all systems. First, the accuracy of each tag assigned by the system will be described. A correct evaluation average was calculated for each image from the subject's evaluation of the assigned tag.

さらに、全体に対する平均を求めた結果を図5、図6に示す。図5は、各タグ付与方法に対する精度平均および標準偏差を示すグラフである。図6は、各タグ付与方法に対するランキング評価結果平均および標準偏差である。日本語システムでは平均11.1%(標準偏差:7.98)、辞書変換および共起変換システムの平均はそれぞれ19.8%、17.5%(標準偏差:11.8、9.58)となった。   Furthermore, the result of calculating | requiring the average with respect to the whole is shown in FIG. 5, FIG. FIG. 5 is a graph showing the average accuracy and standard deviation for each tagging method. FIG. 6 shows a ranking evaluation result average and standard deviation for each tag assigning method. The average for the Japanese system is 11.1% (standard deviation: 7.98), and the average for the dictionary conversion and co-occurrence conversion systems is 19.8% and 17.5% (standard deviation: 11.8, 9.58), respectively. It became.

さらに各システムに対するランキング評価結果の平均は、日本語タグ付与システムが2.3(標準偏差:0.36)、辞書変換システムおよび共起変換システムでは、それぞれ1.9、1.8(標準偏差:0.20、0.33)となった。また、t検定により、日本語システムのタグ精度およびランキング評価結果に対し、辞書変換および共起変換システムの評価結果の平均の差は統計的に有意であることを確認した(α=0.05、p<0.01)。   Furthermore, the average ranking evaluation results for each system are 2.3 (standard deviation: 0.36) for the Japanese tagging system, and 1.9 and 1.8 (standard deviation) for the dictionary conversion system and the co-occurrence conversion system, respectively. : 0.20, 0.33). Also, the t-test confirmed that the average difference between the dictionary conversion and co-occurrence conversion system evaluation results was statistically significant for the tag accuracy and ranking evaluation results of the Japanese system (α = 0.05). , P <0.01).

これら結果により、英語を学習データとした翻訳システムの主観評価値は、日本語タグ付与システムの結果よりも高くなることが確認され、学習データとしてタグ情報量の多い英語学習データを利用し、日本語タグへと変換することで主観評価値が上がることが確認できた。   From these results, it was confirmed that the subjective evaluation value of the translation system using English as learning data was higher than the result of the Japanese tagging system, and English learning data with a large amount of tag information was used as learning data. It was confirmed that the subjective evaluation value increased by converting to the word tag.

また、辞書変換と共起変換システムの精度は統計的な差は確認されなかった。ただし、辞書変換システムに比べて共起変換システムでは、辞書に登録されていない単語へ変換することが可能であり、より人間の感覚に近い変換ができた例も存在する。タグの学習データが多くなればさらに精度も向上することが期待できる。図7は、変換マトリクスと辞書システムのそれぞれの変換結果例を示す図である。図7では、英語のタグ310に対して、変換マトリクスにより変換されたタグ320と辞書変換システムにより変換されたタグ330が表示されている。辞書変換と共起変換結果をうまく統合させることでより高い精度が期待できる。   There was no statistical difference between the accuracy of dictionary conversion and co-occurrence conversion system. However, compared to the dictionary conversion system, the co-occurrence conversion system can convert words that are not registered in the dictionary, and there is an example in which conversion closer to a human sense is possible. It can be expected that the accuracy will be further improved if the learning data of the tag increases. FIG. 7 is a diagram illustrating conversion result examples of the conversion matrix and the dictionary system. In FIG. 7, for an English tag 310, a tag 320 converted by a conversion matrix and a tag 330 converted by a dictionary conversion system are displayed. Higher accuracy can be expected by successfully integrating the dictionary transformation and co-occurrence transformation results.

100 タグ付与システム
110 変換規則生成装置
111 コンテンツ取得部
112 データベース
112a メジャー言語学習DB
112b マイナー言語学習DB
113 タグ付与モデル構築部
114 変換規則生成部
120 タグ付与装置
121 タグ選択部
122 タグ変換部
211 画像データ群
212 タグ
221 行
222 列
223 変換マトリクス
DESCRIPTION OF SYMBOLS 100 Tag assignment system 110 Conversion rule production | generation apparatus 111 Content acquisition part 112 Database 112a Major language learning DB
112b Minor language learning DB
113 Tag addition model construction unit 114 Conversion rule generation unit 120 Tag assignment device 121 Tag selection unit 122 Tag conversion unit 211 Image data group 212 Tag 221 row 222 column 223 conversion matrix

Claims (7)

Web上での使用度の低いマイナー言語によるタグをコンテンツに対して付与するタグ付与装置であって、
コンテンツの特徴量とメジャー言語によるタグとを対応付けたタグ選択用データを参照して、対象コンテンツから検出された特徴量に応じて、前記対象コンテンツに適したメジャー言語によるタグを選択するタグ選択部と、
所定の変換規則により前記選択されたメジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換するタグ変換部とを備えることを特徴とするタグ付与装置。
A tag granting device that grants a tag in a minor language with low usage on the Web to content,
Tag selection for selecting a tag in a major language suitable for the target content according to the feature amount detected from the target content with reference to tag selection data in which the feature amount of the content is associated with a tag in the major language And
A tag assigning device, comprising: a tag conversion unit that converts a tag in the selected major language into a tag in a minor language that is easily attached at the same time according to a predetermined conversion rule.
前記タグ変換部は、前記所定の変換規則としてWeb上の情報を用いて動的に更新される規則を用いることを特徴とする請求項1記載のタグ付与装置。   The tag adding apparatus according to claim 1, wherein the tag conversion unit uses a rule that is dynamically updated using information on the Web as the predetermined conversion rule. 前記タグ変換部は、メジャー言語のタグとマイナー言語のタグとが同一のコンテンツに付与される共起頻度を反映した変換規則を用いることを特徴とする請求項1または請求項2記載のタグ付与装置。   3. The tag assignment according to claim 1, wherein the tag conversion unit uses a conversion rule reflecting a co-occurrence frequency in which a major language tag and a minor language tag are assigned to the same content. apparatus. 前記タグ変換部は、前記変換規則として変換マトリクスを用いることを特徴とする請求項1から請求項3のいずれかに記載のタグ付与装置。   4. The tag assigning device according to claim 1, wherein the tag conversion unit uses a conversion matrix as the conversion rule. メジャー言語による語句からマイナー言語による語句への変換規則を生成する変換規則生成装置であって、
不特定のユーザによりメジャー言語およびメジャー言語よりWeb上での使用度の低いマイナー言語のタグが付けられたコンテンツをWeb上から取得するコンテンツ取得部と、
前記取得されたコンテンツおよびタグを格納するデータベースと、
前記格納されたコンテンツおよびタグを用いて、メジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換する変換規則を動的に生成する変換規則生成部とを備えることを特徴とする変換規則生成装置。
A conversion rule generation device that generates a conversion rule from a phrase in a major language to a phrase in a minor language,
A content acquisition unit that acquires, from the web, content tagged with a minor language that is less used on the web than the major language and the major language by an unspecified user;
A database for storing the acquired content and tags;
A conversion rule generating unit that dynamically generates a conversion rule for converting a tag in a major language into a tag in a minor language that is easily given at the same time using the stored content and tag; Rule generator.
請求項2から請求項4のいずれかに記載のタグ付与装置と、
請求項5記載の変換規則生成装置とを備えることを特徴とするタグ付与システム。
The tag attachment device according to any one of claims 2 to 4,
A tagging system comprising: the conversion rule generation device according to claim 5.
Web上での使用度の低いマイナー言語によるタグをコンテンツに対して付与するためにコンピュータに実行させるタグ付与プログラムであって、
コンテンツの特徴量とメジャー言語によるタグとを対応付けたタグ選択用データを参照して、対象コンテンツから検出された特徴量に応じて、前記対象コンテンツに適したメジャー言語によるタグを選択する処理と、
所定の変換規則により前記選択されたメジャー言語によるタグをこれと同時に付与されやすいマイナー言語によるタグに変換する処理とを含むことを特徴とするタグ付与プログラム。
A tag granting program that causes a computer to execute a tag in a minor language with low usage on the web to grant content,
Processing for selecting a tag in a major language suitable for the target content according to a feature amount detected from the target content with reference to tag selection data in which the feature amount of the content is associated with a tag in the major language; ,
And a process for converting a tag in the selected major language into a tag in a minor language that is easily added at the same time according to a predetermined conversion rule.
JP2010099032A 2010-04-22 2010-04-22 Tag assignment device, conversion rule generation device, and tag assignment program Expired - Fee Related JP5444106B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010099032A JP5444106B2 (en) 2010-04-22 2010-04-22 Tag assignment device, conversion rule generation device, and tag assignment program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010099032A JP5444106B2 (en) 2010-04-22 2010-04-22 Tag assignment device, conversion rule generation device, and tag assignment program

Publications (2)

Publication Number Publication Date
JP2011227825A JP2011227825A (en) 2011-11-10
JP5444106B2 true JP5444106B2 (en) 2014-03-19

Family

ID=45043070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010099032A Expired - Fee Related JP5444106B2 (en) 2010-04-22 2010-04-22 Tag assignment device, conversion rule generation device, and tag assignment program

Country Status (1)

Country Link
JP (1) JP5444106B2 (en)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000163441A (en) * 1998-11-30 2000-06-16 Nippon Telegr & Teleph Corp <Ntt> Method and device for preparing dictionary, storage medium storing dictionary preparation program, method and device for preparing retrieval request, storage medium storing retrieval request preparation program and multi-language correspondence information retrieval system
JP2002132796A (en) * 2000-10-24 2002-05-10 Kyodo Printing Co Ltd Computer readable recording medium with image feature amount vs keyword dictionary recorded thereon, device and method for constructing image feature amount vs keyword dictionary, device and method for supporting image database construction
JP2004280259A (en) * 2003-03-13 2004-10-07 National Institute Of Information & Communication Technology Search device
US7394947B2 (en) * 2003-04-08 2008-07-01 The Penn State Research Foundation System and method for automatic linguistic indexing of images by a statistical modeling approach
JP2008191936A (en) * 2007-02-05 2008-08-21 Fujifilm Corp Method for supporting construction of content registration/search system, and apparatus for supporting construction of content registration/search system
US20090006342A1 (en) * 2007-06-26 2009-01-01 Nokia Corporation Method, Apparatus and Computer Program Product for Providing Internationalization of Content Tagging
WO2009059297A1 (en) * 2007-11-01 2009-05-07 Textdigger, Inc. Method and apparatus for automated tag generation for digital content
US8229729B2 (en) * 2008-03-25 2012-07-24 International Business Machines Corporation Machine translation in continuous space
US8799294B2 (en) * 2008-05-15 2014-08-05 International Business Machines Corporation Method for enhancing search and browsing in collaborative tagging systems through learned tag hierarchies

Also Published As

Publication number Publication date
JP2011227825A (en) 2011-11-10

Similar Documents

Publication Publication Date Title
JP7028858B2 (en) Systems and methods for contextual search of electronic records
US9489401B1 (en) Methods and systems for object recognition
US20110191336A1 (en) Contextual image search
TW201220099A (en) Multi-modal approach to search query input
US10482146B2 (en) Systems and methods for automatic customization of content filtering
CN110083729B (en) Image searching method and system
CN105868177A (en) Universal formula search method
US20120162244A1 (en) Image search color sketch filtering
CN106980664B (en) Bilingual comparable corpus mining method and device
CN110083683B (en) Entity semantic annotation method based on random walk
US20160283564A1 (en) Predictive visual search enginge
CN108509521A (en) A kind of image search method automatically generating text index
CN106874397B (en) Automatic semantic annotation method for Internet of things equipment
CN104008180A (en) Association method of structural data with picture, association device thereof
CN103744887A (en) Method and device for people search and computer equipment
CN103440262A (en) Image searching system and image searching method basing on relevance feedback and Bag-of-Features
US20190294705A1 (en) Image annotation
CN103942274A (en) Labeling system and method for biological medical treatment image on basis of LDA
Spitz et al. EVELIN: Exploration of event and entity links in implicit networks
CN108446378B (en) Method, system and computer storage medium based on user search
CN111368125A (en) Distance measurement method for image retrieval
CN101213539A (en) Cross descriptor learning system, method and program product therefor
Barz et al. Wikichurches: A fine-grained dataset of architectural styles with real-world challenges
CN110704654A (en) Picture searching method and device
JP4544047B2 (en) Web image search result classification presentation method and apparatus, program, and storage medium storing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131220

R150 Certificate of patent or registration of utility model

Ref document number: 5444106

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees