JP2008310626A - 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体 - Google Patents
自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP2008310626A JP2008310626A JP2007158422A JP2007158422A JP2008310626A JP 2008310626 A JP2008310626 A JP 2008310626A JP 2007158422 A JP2007158422 A JP 2007158422A JP 2007158422 A JP2007158422 A JP 2007158422A JP 2008310626 A JP2008310626 A JP 2008310626A
- Authority
- JP
- Japan
- Prior art keywords
- tag
- document
- integration
- tags
- automatic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】タグ付きの文書をインターネット2から収集し、タグ付き文書DB3に格納する文書収集手段1と、前記DB3中の各タグに対して、そのタグが設定された文書集合中の特徴的な語句を基に、同一の意味を示すタグ同士を統合し、タグ情報DB5に格納するタグ統合手段4と、前記DB3中の各タグに対して、前記特徴的な語句を基に、そのタグが特定の話題を示すかどうかを判定し、タグ情報DB5に格納するタグ重要性判定手段6と、前記タグ統合手段4の統合結果および前記タグ重要性判定手段6の判定結果に基づいて入力文書にタグを付与するタグ付与手段7と、前記DB3中の各文書を入力とし、文書に関係の無いタグが付与されていた文書を前記DB3から除くデータ精選手段8とを備える。
【選択図】図1
Description
(2)また請求項4,5,8に記載の発明によれば、文書に関係のないタグが付与されていた文書を前記データベースから除くことができ、付与されるタグの精度を向上させることが可能となる。
2…インターネット
3…タグ付文書データベース
4…タグ統合手段
5…タグ情報データベース
6…タグ重要性判定手段
7…タグ付与手段
8…データ精選手段
Claims (9)
- タグ付き文書集合を基に文書に適切なタグを自動付与する装置において、
既にタグづけがされている文書を捕捉収集し、タグ付き文書データベースに格納する文書収集手段と、
前記データベース中の各タグに対して、そのタグが設定された文書集合中の特徴的な語句を基に、各タグ間の意味的な類似度を測定し、同一の意味を示すタグが存在する場合には、そのタグ同士を統合するタグ統合手段と、
前記データベース中の各タグに対して、前記特徴的な語句を基に、そのタグが特定の話題を示すかどうかを判定するタグ重要性判定手段と、
前記タグ統合手段の統合結果および前記タグ重要性判定手段の判定結果に基づいて入力文書にタグを付与するタグ付与手段と、
を有することを特徴とする自動タグ付与装置。 - 前記タグ統合手段は、
前記特徴的な語句とその特徴性を表したスコアの対を要素としたタグ特徴ベクトル間の類似性に基づいてタグの統合を決定し、
前記語句の特徴性を表すスコアとして、ある語句の対象のタグがつけられた文書集合中での文書頻度とポアソン分布モデルに基づいた推定文書頻度との差の値を用いることを特徴とする請求項1に記載の自動タグ付与装置。 - 前記タグ重要性判定手段は、前記タグ特徴ベクトルのベクトル長に基づいて重要性を判定することを特徴とする請求項2に記載の自動タグ付与装置。
- 前記データベース中の各文書を自動タグ付与装置の入力文書とし、付与されたタグと当該文書に設定されているタグとの類似度を基にして、文書に関係の無いタグが付与されていた文書を前記データベースから除くデータ精選手段をさらに有する、
ことを特徴とする請求項1ないし3のいずれか1項に記載の自動タグ付与装置。 - 前記タグ付与手段は、
前記データベースに対して、入力文書と関連する文書を検索する関連文書検索を行い、得られた関連文書群中の各文書のタグの集計を行い、各タグが設定されている実際の文書数と確率的に関連文書群中に当該タグが含まれうる確率を基にした有為性検定を行うことによって、入力文書に付与するタグを決定する、
ことを特徴とする請求項1ないし4のいずれか1項に記載の自動タグ付与装置。 - タグ付き文書集合を基に文書に適切なタグを自動付与する方法において、
文書収集手段が、既にタグづけがされている文書を捕捉収集し、タグ付き文書データベースに格納する文書収集ステップと、
タグ統合手段が、前記データベース中の各タグに対して、そのタグが設定された文書集合中の特徴的な語句を基に、各タグ間の意味的な類似度を測定し、同一の意味を示すタグが存在する場合には、そのタグ同士を統合するタグ統合ステップと、
タグ重要性判定手段が、前記データベース中の各タグに対して、前記特徴的な語句を基に、そのタグが特定の話題を示すかどうかを判定するタグ重要性判定ステップと、
タグ付与手段が、前記タグ統合ステップの統合結果および前記タグ重要性判定ステップの判定結果に基づいて入力文書にタグを付与するタグ付与ステップと、
を有することを特徴とする自動タグ付与方法。 - コンピュータを、請求項1ないし3のいずれか1項に記載の文書収集手段、タグ統合手段、タグ重要性判定手段およびタグ付与手段として機能させるための自動タグ付与プログラム。
- コンピュータを、請求項4叉は5に記載の文書収集手段、タグ統合手段、タグ重要性判定手段、タグ付与手段およびデータ精選手段として機能させるための自動タグ付与プログラム。
- 請求項7叉は8に記載の自動タグ付与プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007158422A JP4714710B2 (ja) | 2007-06-15 | 2007-06-15 | 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007158422A JP4714710B2 (ja) | 2007-06-15 | 2007-06-15 | 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008310626A true JP2008310626A (ja) | 2008-12-25 |
JP4714710B2 JP4714710B2 (ja) | 2011-06-29 |
Family
ID=40238163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007158422A Active JP4714710B2 (ja) | 2007-06-15 | 2007-06-15 | 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4714710B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011017088A2 (en) * | 2009-07-28 | 2011-02-10 | Vulcan Technologies Llc | Method and system for tag suggestion in a tag-associated data-object storage system |
WO2011080899A1 (ja) | 2009-12-31 | 2011-07-07 | 株式会社Taggy | 情報推薦方法 |
JP2011165131A (ja) * | 2010-02-15 | 2011-08-25 | Sony Corp | 情報処理装置および方法、並びにプログラム |
JP2012042998A (ja) * | 2010-08-12 | 2012-03-01 | Nec Biglobe Ltd | 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム |
JP2014052694A (ja) * | 2012-09-05 | 2014-03-20 | Nippon Telegr & Teleph Corp <Ntt> | 同義タグ抽出装置及び方法及びプログラム |
JP2016508274A (ja) * | 2013-01-15 | 2016-03-17 | シマンテック コーポレーションSymantec Corporation | クラスタ化を用いたサンプルの分類 |
JP2016048526A (ja) * | 2014-08-28 | 2016-04-07 | ヤフー株式会社 | 抽出装置、抽出方法および抽出プログラム |
JP2021009720A (ja) * | 2018-02-27 | 2021-01-28 | 株式会社 ミックウェア | 情報検索装置及び情報検索システム |
-
2007
- 2007-06-15 JP JP2007158422A patent/JP4714710B2/ja active Active
Non-Patent Citations (2)
Title |
---|
CSNG200701219009, 藤村 滋, "Blogのタグ間類似度のスコアリング", 日本データベース学会Letters, 20070322, Vol.5 No.4, 第33頁乃至第36頁, JP, 日本データベース学会 * |
JPN6010061263, 藤村 滋, "Blogのタグ間類似度のスコアリング", 日本データベース学会Letters, 20070322, Vol.5 No.4, 第33頁乃至第36頁, JP, 日本データベース学会 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011017088A2 (en) * | 2009-07-28 | 2011-02-10 | Vulcan Technologies Llc | Method and system for tag suggestion in a tag-associated data-object storage system |
WO2011017088A3 (en) * | 2009-07-28 | 2011-06-23 | Vulcan Technologies Llc | Method and system for tag suggestion in a tag-associated data-object storage system |
WO2011080899A1 (ja) | 2009-12-31 | 2011-07-07 | 株式会社Taggy | 情報推薦方法 |
US8812505B2 (en) | 2009-12-31 | 2014-08-19 | Taggy, Inc. | Method for recommending best information in real time by appropriately obtaining gist of web page and user's preference |
JP2011165131A (ja) * | 2010-02-15 | 2011-08-25 | Sony Corp | 情報処理装置および方法、並びにプログラム |
JP2012042998A (ja) * | 2010-08-12 | 2012-03-01 | Nec Biglobe Ltd | 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム |
JP2014052694A (ja) * | 2012-09-05 | 2014-03-20 | Nippon Telegr & Teleph Corp <Ntt> | 同義タグ抽出装置及び方法及びプログラム |
JP2016508274A (ja) * | 2013-01-15 | 2016-03-17 | シマンテック コーポレーションSymantec Corporation | クラスタ化を用いたサンプルの分類 |
JP2016048526A (ja) * | 2014-08-28 | 2016-04-07 | ヤフー株式会社 | 抽出装置、抽出方法および抽出プログラム |
JP2021009720A (ja) * | 2018-02-27 | 2021-01-28 | 株式会社 ミックウェア | 情報検索装置及び情報検索システム |
JP7182585B2 (ja) | 2018-02-27 | 2022-12-02 | 株式会社 ミックウェア | プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4714710B2 (ja) | 2011-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4714710B2 (ja) | 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体 | |
US9589208B2 (en) | Retrieval of similar images to a query image | |
Zhao et al. | Topical keyphrase extraction from twitter | |
US20150186503A1 (en) | Method, system, and computer readable medium for interest tag recommendation | |
US10997256B2 (en) | Webpage classification method and apparatus, calculation device and machine readable storage medium | |
US10565233B2 (en) | Suffix tree similarity measure for document clustering | |
US8380697B2 (en) | Search and retrieval methods and systems of short messages utilizing messaging context and keyword frequency | |
WO2016000555A1 (zh) | 基于社交网络的内容、新闻推荐方法和系统 | |
US20140214835A1 (en) | System and method for automatically classifying documents | |
US20160188633A1 (en) | A method and apparatus for tracking microblog messages for relevancy to an entity identifiable by an associated text and an image | |
US10318543B1 (en) | Obtaining and enhancing metadata for content items | |
CN105183897A (zh) | 一种视频搜索排序的方法和系统 | |
JP5012078B2 (ja) | カテゴリ作成方法、カテゴリ作成装置、およびプログラム | |
Lipczak et al. | The impact of resource title on tags in collaborative tagging systems | |
CN102428467A (zh) | 用于分类的基于相似度的特征集补充 | |
CN110737821B (zh) | 相似事件查询的方法、装置、存储介质和终端设备 | |
Liu et al. | Event analysis in social multimedia: a survey | |
CN108228612B (zh) | 一种提取网络事件关键词以及情绪倾向的方法及装置 | |
US20130346385A1 (en) | System and method for a purposeful sharing environment | |
Domeniconi et al. | A novel method for unsupervised and supervised conversational message thread detection | |
KR20150008342A (ko) | 멀티미디어 컨텐츠를 인리칭하기 위한 방법 및 대응하는 디바이스 | |
Vandic et al. | A semantic clustering-based approach for searching and browsing tag spaces | |
JP5199768B2 (ja) | タグ付け支援方法とその装置、プログラム及び記録媒体 | |
CN106372123B (zh) | 一种基于标签的相关内容推荐方法和系统 | |
Liu et al. | Cross domain search by exploiting wikipedia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090616 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100527 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101026 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110322 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110328 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4714710 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |