JP4714710B2 - 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体 - Google Patents
自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP4714710B2 JP4714710B2 JP2007158422A JP2007158422A JP4714710B2 JP 4714710 B2 JP4714710 B2 JP 4714710B2 JP 2007158422 A JP2007158422 A JP 2007158422A JP 2007158422 A JP2007158422 A JP 2007158422A JP 4714710 B2 JP4714710 B2 JP 4714710B2
- Authority
- JP
- Japan
- Prior art keywords
- tag
- document
- tags
- database
- automatic tagging
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(2)また請求項2に記載の発明によれば、文書に関係のないタグが付与されていた文書を前記データベースから除くことができ、付与されるタグの精度を向上させることが可能となる。
2…インターネット
3…タグ付文書データベース
4…タグ統合手段
5…タグ情報データベース
6…タグ重要性判定手段
7…タグ付与手段
8…データ精選手段
Claims (7)
- タグ付き文書集合を基に文書に適切なタグを自動付与する装置において、
既にタグづけがされている文書を捕捉収集し、タグ付き文書データベースに格納する文書収集手段と、
前記データベース中の各タグに対して、そのタグが設定された文書集合中の特徴的な語句を基に、各タグ間の意味的な類似度を測定し、同一の意味を示すタグが存在する場合には、そのタグ同士を統合するタグ統合手段と、
前記データベースに対して、入力文書と関連する文書を検索する関連文書検索を行い、得られた関連文書群中の各文書のタグを、前記タグ統合手段による統合後のタグで集計し、各タグが設定されている前記データベース内の文書数と確率的に関連文書群中に当該タグが含まれうる確率を基にした有意差検定を行い、有意に多いと判定された当該タグを入力文書に付与するタグ付与手段と、
を有することを特徴とする自動タグ付与装置。 - 前記データベース中の各文書を自動タグ付与装置の入力文書とし、付与されたタグと当該文書に設定されているタグとの類似度を算出し、該類似度が所定の値より低い前記入力文書を前記データベースから除くデータ精選手段をさらに有する、
ことを特徴とする請求項1に記載の自動タグ付与装置。 - 前記データベース中の各タグに対して、前記特徴的な語句を基に、そのタグが特定の話題を示すかどうかを判定するタグ重要性判定手段をさらに具備し、
前記タグ付与手段は、前記データベースに対して、入力文書と関連する文書を検索する関連文書検索を行い、得られた関連文書群中の各文書のタグを、前記タグ統合手段による統合後のタグで集計し、前記重要性判定手段で特定の話題を示すと判定されたタグについて、各タグが設定されている前記データベース内の文書数と確率的に関連文書群中に当該タグが含まれうる確率を基にした有意差検定を行い、有意に多いと判定された当該タグを入力文書に付与する、
ことを特徴とする請求項1または2に記載の自動タグ付与装置。 - 前記タグ重要性判定手段は、特徴的な語句とその特徴性を表したスコアの対を要素としたタグ特徴ベクトルのベクトル長に基づいて重要性を判定することを特徴とする請求項3に記載の自動タグ付与装置。
- タグ付き文書集合を基に文書に適切なタグを自動付与する方法において、
文書収集手段が、既にタグづけがされている文書を捕捉収集し、タグ付き文書データベースに格納する文書収集ステップと、
タグ統合手段が、前記データベース中の各タグに対して、そのタグが設定された文書集合中の特徴的な語句を基に、各タグ間の意味的な類似度を測定し、同一の意味を示すタグが存在する場合には、そのタグ同士を統合するタグ統合ステップと、
タグ付与手段が、前記データベースに対して、入力文書と関連する文書を検索する関連文書検索を行い、得られた関連文書群中の各文書のタグを、前記タグ統合手段による統合後のタグで集計し、各タグが設定されている前記データベース内の文書数と確率的に関連文書群中に当該タグが含まれうる確率を基にした有意差検定を行い、有意に多いと判定された当該タグを入力文書に付与するタグ付与ステップと、
を有することを特徴とする自動タグ付与方法。 - コンピュータを、請求項1ないし4のいずれか1項に記載の各手段として機能させるための自動タグ付与プログラム。
- 請求項6に記載の自動タグ付与プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007158422A JP4714710B2 (ja) | 2007-06-15 | 2007-06-15 | 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007158422A JP4714710B2 (ja) | 2007-06-15 | 2007-06-15 | 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008310626A JP2008310626A (ja) | 2008-12-25 |
JP4714710B2 true JP4714710B2 (ja) | 2011-06-29 |
Family
ID=40238163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007158422A Active JP4714710B2 (ja) | 2007-06-15 | 2007-06-15 | 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4714710B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8176072B2 (en) * | 2009-07-28 | 2012-05-08 | Vulcan Technologies Llc | Method and system for tag suggestion in a tag-associated data-object storage system |
JP4637969B1 (ja) | 2009-12-31 | 2011-02-23 | 株式会社Taggy | ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法 |
JP5477635B2 (ja) * | 2010-02-15 | 2014-04-23 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP5252593B2 (ja) * | 2010-08-12 | 2013-07-31 | Necビッグローブ株式会社 | 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム |
JP5696106B2 (ja) * | 2012-09-05 | 2015-04-08 | 日本電信電話株式会社 | 同義タグ抽出装置及び方法及びプログラム |
US20140201208A1 (en) * | 2013-01-15 | 2014-07-17 | Corporation Symantec | Classifying Samples Using Clustering |
JP6100741B2 (ja) * | 2014-08-28 | 2017-03-22 | ヤフー株式会社 | 抽出装置、抽出方法および抽出プログラム |
JP6788637B2 (ja) * | 2018-02-27 | 2020-11-25 | 株式会社 ミックウェア | 情報検索装置及び情報検索システム |
-
2007
- 2007-06-15 JP JP2007158422A patent/JP4714710B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008310626A (ja) | 2008-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4714710B2 (ja) | 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体 | |
US9589208B2 (en) | Retrieval of similar images to a query image | |
CN110874530B (zh) | 关键词提取方法、装置、终端设备及存储介质 | |
US10515133B1 (en) | Systems and methods for automatically suggesting metadata for media content | |
US8380697B2 (en) | Search and retrieval methods and systems of short messages utilizing messaging context and keyword frequency | |
US20160188633A1 (en) | A method and apparatus for tracking microblog messages for relevancy to an entity identifiable by an associated text and an image | |
WO2014056397A1 (zh) | 兴趣标签推荐方法、系统及计算机可读介质 | |
US20140214835A1 (en) | System and method for automatically classifying documents | |
WO2016000555A1 (zh) | 基于社交网络的内容、新闻推荐方法和系统 | |
US20090307213A1 (en) | Suffix Tree Similarity Measure for Document Clustering | |
CN101727454A (zh) | 用于对象自动分类的方法和系统 | |
CN105183897A (zh) | 一种视频搜索排序的方法和系统 | |
CN106547864B (zh) | 一种基于查询扩展的个性化信息检索方法 | |
CN111460251A (zh) | 数据内容个性化推送冷启动方法、装置、设备和存储介质 | |
CN102428467A (zh) | 用于分类的基于相似度的特征集补充 | |
CN103678422A (zh) | 网页分类方法和装置、网页分类器的训练方法和装置 | |
Liu et al. | Event analysis in social multimedia: a survey | |
Amato et al. | Searching and annotating 100M Images with YFCC100M-HNfc6 and MI-File | |
Domeniconi et al. | A novel method for unsupervised and supervised conversational message thread detection | |
US20130346385A1 (en) | System and method for a purposeful sharing environment | |
CN111737567A (zh) | 一种网络文学新书推荐的方法 | |
CN103942274B (zh) | 一种基于lda的生物医疗图像的标注系统及方法 | |
CN114461783A (zh) | 关键词生成方法、装置、计算机设备、存储介质和产品 | |
JP5199768B2 (ja) | タグ付け支援方法とその装置、プログラム及び記録媒体 | |
Trevisiol et al. | How INRIA/IRISA identifies geographic location of a video |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090616 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100527 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101026 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110322 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110328 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4714710 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |