JP2012042998A - 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム - Google Patents

最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム Download PDF

Info

Publication number
JP2012042998A
JP2012042998A JP2010180917A JP2010180917A JP2012042998A JP 2012042998 A JP2012042998 A JP 2012042998A JP 2010180917 A JP2010180917 A JP 2010180917A JP 2010180917 A JP2010180917 A JP 2010180917A JP 2012042998 A JP2012042998 A JP 2012042998A
Authority
JP
Japan
Prior art keywords
tag
content
optimum
tags
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010180917A
Other languages
English (en)
Other versions
JP5252593B2 (ja
Inventor
Katsushi Matsuda
勝志 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biglobe Inc
Original Assignee
NEC Biglobe Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Biglobe Ltd filed Critical NEC Biglobe Ltd
Priority to JP2010180917A priority Critical patent/JP5252593B2/ja
Publication of JP2012042998A publication Critical patent/JP2012042998A/ja
Application granted granted Critical
Publication of JP5252593B2 publication Critical patent/JP5252593B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】発信者が発信するコンテンツに挿入する最適なタグを提案すること。
【解決手段】本発明の最適タグ提案装置は、特定の単語が出現するコンテンツ毎に、当該コンテンツに挿入されているタグを収集し、前記特定の単語毎に、当該特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの収集数に応じて代表タグを決定し、前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、当該特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する。
【選択図】図2

Description

本発明は、発信装置が発信するコンテンツに挿入するタグを提案する技術に関する。
従来から、ネットワーク上のコンテンツを検索するのにキーワードが用いられており、そのための技術も提案されている(特許文献1)。
ネットワーク上のコンテンツは、企業等が提供するものが主流であったが、最近は、一般ユーザ自身が発信者となって、Webのホームページ、ブログ、ミニブログ(ツイッター等)等を、コンテンツとして発信するケースが増えている。
この種のコンテンツの特徴の1つに、発信者自身がタグ呼ばれる文字列をコンテンツに挿入できる点が挙げられる。タグとは、コンテンツのカテゴリやトピックを表す文字列であり、具体的には、Webのホームページのメタタグ、ブログの記事テーマ、ミニブログのハッシュタグ等である。
近年、コンテンツの収集者は、キーワード以外でコンテンツを検索したり収集したりするために、タグを使用することが増えている。
また、発信者には、一般的に、商業上の理由や個人のネームバリューの向上という観点から、自身が発信したコンテンツを多くの人に伝えたいという要求がある。
したがって、発信者にとっては、多くの収集者に検索・収集され得る最適なタグをコンテンツに挿入することが、自身の要求を満たすことに繋がると考えられる。
国際公開第99/14690号
しかし、従来は、コンテンツの発信者が自由にタグを作成し、コンテンツに挿入していたため、発信者によってタグが異なったり、同じ発信者であっても発信する時間によってタグが異なったりしていた。このように発信者が作成するタグに一貫性がないと、そのようなタグを収集者が使用する可能性は低くなり、その結果、発信者がせっかく発信したコンテンツが多くの人に伝わらなくなってしまう。
また、発信者によるタグの作成に自由度がありすぎるため、コンテンツの発信に不慣れな初心者などはコンテンツにタグを挿入すること自体をあきらめてしまうことが多い。
そこで、本発明の目的は、上述の課題を解決し、発信者が発信するコンテンツに挿入する最適なタグを提案することができる最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラムを提供することにある。
本発明の最適タグ提案装置は、
発信装置が発信するコンテンツに挿入するタグを提案する最適タグ提案装置であって、
特定の単語が出現するコンテンツ毎に、当該コンテンツに挿入されているタグを収集し、
前記特定の単語毎に、当該特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの収集数に応じて代表タグを決定し、
前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、当該特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する。
本発明の最適タグ提案システムは、
コンテンツを発信する発信装置と、前記発信装置が発信するコンテンツに挿入するタグを提案する最適タグ提案装置と、を有してなる最適タグ提案システムであって、
前記最適タグ提案装置は、
特定の単語が出現するコンテンツ毎に、当該コンテンツに挿入されているタグを収集し、
前記特定の単語毎に、当該特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの収集数に応じて代表タグを決定し、
前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、当該特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する。
本発明の最適タグ提案方法は、
発信装置が発信するコンテンツに挿入するタグを提案する最適タグ提案装置による最適タグ提案方法であって、
特定の単語が出現するコンテンツ毎に、当該コンテンツに挿入されているタグを収集し、
前記特定の単語毎に、当該特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの収集数に応じて代表タグを決定し、
前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、当該特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する。
本発明のプログラムは、
前記最適タグ提案方法をコンピュータに実行させるためのプログラムである。
本発明によれば、最適タグ提案装置は、特定の単語毎に、その特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、各タグの収集数に応じて代表タグを決定し、発信装置からタグ挿入要求を受けた場合、そのコンテンツに特定の単語が出現する度に、その特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、発信装置に返却する。
すなわち、最適タグ提案装置は、発信装置が発信しようとしているコンテンツと同じ単語が出現する他のコンテンツにおいて実際に挿入されている数が多いタグを提案することになる。
よって、発信装置の発信者は、コンテンツの発信に不慣れな初心者であったり、初めてのカテゴリやトピックでコンテンツを発信したりする場合でも、最適タグ提案装置から提案された、広く使用されているタグを選択してコンテンツに挿入することができるため、自身が発信したコンテンツを多くの人に伝えることができるという効果が得られる。
本発明の一実施形態の最適タグ提案システムの構成を示す図である。 図1に示した最適タグ提案装置の構成を示すブロック図である。 図1および図2に示した最適タグ提案装置におけるタグリストの作成動作を説明する図である。 図1および図2に示した最適タグ提案装置における最適タグリストの作成動作を説明する図である。 図1および図2に示した最適タグ提案装置における最適タグの返却動作のイメージを説明する図である。 図1および図2に示した最適タグ提案装置における最適タグの返却動作の動作例1を説明する図である。 図1および図2に示した最適タグ提案装置における最適タグの返却動作の動作例2を説明する図である。
以下に、本発明を実施するための形態について図面を参照して説明する。
図1を参照すると、本実施形態の最適タグ提案システムは、発信装置10−1〜10−S(Sは2以上の自然数)と、最適タグ提案装置20と、を有している。
発信装置10−1〜10−S(以下、どの発信装置であるか特定しないときは発信装置10と称す)は、コンテンツ(Webのホームページ、ブログ、ミニブログ等)を発信する。なお、発信装置10が発信したコンテンツは、最適タグ提案装置20またはコンテンツ管理サーバ(不図示)で管理され、ネットワーク上に公開されるものとする。
最適タグ提案装置20は、発信装置10から、その発信装置10が発信するコンテンツへのタグ(Webのホームページのメタタグ、ブログの記事テーマ、ミニブログのハッシュタグ等)の挿入要求を受けると、その発信装置10にタグを提案する。
なお、図1においては、発信装置10は、複数設けられていることを想定しているが、1つであっても良い。
図2を参照すると、本実施形態の最適タグ提案装置20は、タグ収集部21と、タグリストDB(Data Base)22と、最適タグ作成部23と、最適タグリストDB24と、最適タグ返却部25と、を有している。
なお、図2においては、単語DB30およびコンテンツDB40は、最適タグ提案装置20の外部に設けられていることを想定しているが、最適タグ提案装置20の内部に設けられていても良い。
単語DB30は、発信装置10が発信するコンテンツに高頻度で出現する単語(特定の単語)が登録されるDBである。この単語は、コンテンツの検索履歴等に基づき、システム管理者により予め単語DB30に登録されているものとする。
コンテンツDB40は、発信装置10が過去に発信したコンテンツが登録されるDBである。
タグ収集部21は、単語DB30に登録された単語毎に、コンテンツDB40から、その単語が出現するコンテンツおよびそのコンテンツに挿入されているタグを収集する。そして、収集したコンテンツ毎に、その単語と、収集したタグとを対応付けたタグリストを作成し、タグリストDB22に登録する。
最適タグ作成部23は、タグリストDB22に登録された単語毎に、タグリストDB22内にその単語と対応付けられて出現するタグをクラスタリングし、クラスタ毎に、そのクラスタに属するタグの中から、各タグの出現数に応じて代表タグを決定する。そして、その単語と、クラスタリングした各クラスタと、各クラスタの決定した代表タグと、を対応付けた最適タグリストを作成し、最適タグリストDB24に登録する。
最適タグ返却部25は、発信装置10から、コンテンツへのタグの挿入要求を受けた場合、そのコンテンツに最適タグリストDB24に登録された単語が出現する度に、最適タグリストDB24内にその単語に対応付けられて出現するクラスタを収集し、収集したクラスタに対応付けられている代表タグの中から、各クラスタの収集数に応じて候補タグを決定する。そして、決定した候補タグを、要求元の発信装置10に返却する。
以下、本実施形態の動作について、具体例を挙げて詳細に説明する。以下では、発信装置10が発信するコンテンツがミニブログであり、ミニブログに挿入するハッシュタグをタグとして提案するものとする。
(1)タグリストの作成動作
最初に、タグ収集部21によるタグリストの作成動作について、図3を参照して説明する。図3は、単語DB30に登録された単語「ゴルフ」についてタグリストを作成する場合の動作を示している。
図3を参照すると、タグ収集部21は、「ゴルフ」でコンテンツDB40を検索し(ステップS31)、コンテンツDB40から、「ゴルフ」が出現するコンテンツおよびそのコンテンツに挿入されているタグを収集する(ステップS32)。ここでは、3つのコンテンツが収集されたとする。
このうち、図3中の一番上のコンテンツには、「#JLPGA」、「#yokomine」という2つのタグが挿入されている。そのため、タグ収集部21は、タグリストDB22において、図3中の一番上のコンテンツについては、単語「ゴルフ」と、2つのタグ「#JLPGA」、「#yokomine」と、を対応付けする。その他のコンテンツについても同様の処理を行う。
(2)最適タグリストの作成動作
続いて、最適タグ作成部23による最適タグリストの作成動作について、図4を参照して説明する。図4は、タグリストDB22が図3の状態にある時に、タグリストDB22に登録された単語「ゴルフ」について最適タグリストを作成する場合の動作を示している。
まず、最適タグ作成部23は、「ゴルフ」でタグリストDB22を検索し、「ゴルフ」に対応付けられたタグとして出現する数が多い上位N(Nは2以上の自然数)個(図4では10個)の頻出タグを抽出する(ステップS41)。
次に、最適タグ作成部23は、単語を指定せずに全ての単語に対してタグリストDB22を検索し、タグリストDB22に出現する数が多い上位M(Mは2以上の自然数)個(図4では10個)の一般的な頻出タグを抽出する(ステップS42)。
次に、最適タグ作成部23は、ステップS41で抽出した「ゴルフ」の頻出タグの中から、ステップS42で抽出した一般的な頻出タグを除去する(ステップS43)。ここでは、2つのタグ「#followmejp」、「#ohayo」が除去されている。
次に、最適タグ作成部23は、ステップS43の処理の後に残った「ゴルフ」の頻出タグについて、同一コンテンツに挿入されているタグ同士を接続することでネットワーク化する(ステップS44)。例えば、図3中の一番上のコンテンツには、2つのタグ「#JLPGA」、「#yokomine」が挿入されているため、これら2つのタグ同士を接続する。なお、図4のタグ間の線は、接続数が多くなるにしたがって太くなっている。
次に、最適タグ作成部23は、ステップS44の処理結果を基にクラスタリングを行う(ステップS45)。具体的には、ステップS44の処理により得られた各ネットワークをそれぞれクラスタとする。ここでは、2つのクラスタC1,C2が得られている。
次に、最適タグ作成部23は、クラスタ毎に、そのクラスタに属するタグの中から、各タグの出現数に応じて代表タグを決定する(ステップS46)。代表タグの数は、1つに限らず複数であっても良く、クラスタに属するタグの数に応じて代表タグの数を決めても良い。ここでは、5つ以上のタグが属するクラスタの代表タグは2つとし、その他の場合は1つとする条件を採用する。クラスタC1の場合は、6つのタグが属していることから、出現数が多い上位2つのタグ「#golferJP」、「#golfJP」を代表タグとする。一方、クラスタC2の場合は、4つのタグのみが属していることから、出現数が最も多い1つのタグ「#volkswagen」のみを代表タグとする。
上述のように、同一コンテンツに挿入されているタグ同士を接続しネットワーク化することでクラスタリングを行うことにより、「ゴルフ」のような多義語(スポーツの「ゴルフ」と車の「ゴルフ」)の場合も、それぞれの意味の代表タグを得ることができる。
また、タグリストDB22内で「ゴルフ」に対応付けられている全てのタグを対象にするのではなく、頻出タグのみを対象としたり、さらには、頻出タグから一般的な頻出タグを除去した残りのタグを対象としたりするため、どのような文脈でも使われる一般的なタグを提案することを抑制したり、クラスタリングや各クラスタの代表タグの決定に要する時間の短縮化を図ることができる。
その後、最適タグ作成部23は、最適タグリストDB24において、単語「ゴルフ」と、2つのクラスタC1,C2と、2つのクラスタC1,C2の各々の代表タグと、を対応付けする。
(3)最適タグの返却動作
続いて、最適タグ返却部25による最適タグの返却動作について説明する。
(3−1)最適タグの返却動作のイメージ
最初に、最適タグの返却動作の概略的なイメージについて、図5を参照して説明する。
図5を参照すると、まず、発信者は、発信装置10上で発信するコンテンツを入力し(ステップS51)、タグを挿入する場合は「タグ」ボタンをクリックする(ステップS52)。
次に、発信装置10は、発信者のコンテンツを添付したタグ挿入要求を最適タグ提案装置20に送信する(ステップS53)。これを受けて、最適タグ提案装置20の最適タグ返却部25は、コンテンツに挿入するタグの候補となる候補タグを発信装置10に返却する(ステップS54)。ここでは、3つの候補タグ「#golferJP」、「#golfJP」、「#volkswagen」が提案されているが、候補タグの選定方法については後述する。
次に、発信者は、候補タグのいずれかを選択し(ステップS55)、「OK」ボタンをクリックすると、発信装置10は、発信者に選択されたタグをコンテンツに挿入する。ここでは、タグ「#golfJP」が挿入されている。
その後、発信者は、コンテンツを発信する際に、「発信」ボタンをクリックすると(ステップS56)、発信装置10は、タグが挿入されたコンテンツを発信する。
(3−2)最適タグの返却動作の動作例1
続いて、最適タグの返却動作の具体的な動作例1について、図6を参照して説明する。図6は、図5のコンテンツへのタグの挿入要求を受けた場合の動作を示している。また、図6は、この時の最適タグリストDB24の状態も併せて示している。
図6を参照すると、まず、最適タグ返却部25は、発信装置10からタグ挿入要求を受けたコンテンツの形態素解析を行い、コンテンツからストップワードを除去する(ステップS61)。図6では、助詞や助動詞等の一般的な品詞だけをストップワードとしているが、一般名詞や固有名詞以外の品詞を全てストップワードとしても良い。
次に、最適タグ返却部25は、最適タグリストDB24から、ステップS61の処理の後に残った単語のクラスタを収集する(ステップS62)。このとき、最適タグリストDB24に登録されていない単語については無視する。したがって、結果的には、最適タグ返却部25は、コンテンツに出現する単語のうち、最適タグリストDB24に登録されている単語についてのみ、クラスタを収集することになる。
次に、最適タグ返却部25は、最適タグリストDB24から収集した各クラスタの収集数を列挙したリストを作成する(ステップS63)。
その後、最適タグ返却部25は、収集数が多い上位P(Pは2以上の自然数)個(図6では2個)のクラスタを抽出し、抽出した各クラスタの代表タグを候補タグとして決定し、発信装置10に返却する(ステップS64)。ここでは、P=2とし、収集数が最も多い2個のクラスタC1,C2について、クラスタC1の2つの代表タグ「#golferJP」、「#golfJP」と、クラスタC2の1つの代表タグ「#volkswagen」と、が返却されている。
上述のように、最適タグリストDB24からの収集数が多い複数のクラスタの代表タグを返却することにより、「ゴルフ」のような多義語(スポーツの「ゴルフ」と車の「ゴルフ」)の場合も、それぞれの意味の代表タグを返却することができる。
(3−3)最適タグの返却動作の動作例2
続いて、最適タグの返却動作の具体的な動作例2について、図7を参照して説明する。図7は、図5のコンテンツへのタグの挿入要求を受けた場合の動作を示している。また、図7は、この時の最適タグリストDB24の状態も併せて示している。
図7を参照すると、まず、最適タグ返却部25は、図6と同様に、ステップS61〜S63の処理を行う。
最適タグ返却部25は、最適タグリストDB24からクラスタを収集する度に、そのクラスタに対応付けられている代表タグを収集するものとして、続いて、各代表タグの収集数を列挙したリストを作成する(ステップS71)。例えば、代表タグ「#golferJP」は、クラスタC1で2回、クラスタC3で1回、クラスタC65で1回、クラスタC301で1回収集されるため、収集数は計5個となる。
その後、最適タグ返却部25は、収集数が多い上位Q(Qは2以上の自然数)個(図7では3個)の代表タグを候補タグとして決定し、発信装置10に返却する(ステップS72)。ここでは、Q=3とし、収集数が多い上位3個の代表タグ「#golferJP」、「#golfJP」、「#volkswagen」が返却されている。すなわち、結果的には、本動作例でも、図6の動作例1と同様の候補タグが返却されることになる。
なお、本動作例においては、ステップS62において、ステップS61の処理の後に残った単語のクラスタを収集する処理を行う代わりに、ステップS61の処理の後に残った単語の代表タグを収集する処理を行っても良い。この処理により、ステップS71で得られるリストをすぐに作成することができ、その結果、ステップS63,S71の処理を省略できる。
上述したように本実施形態の最適タグ提案装置20は、単語DB30内の特定の単語毎に、その特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、各タグの収集数に応じて代表タグを決定し、発信装置10からコンテンツへのタグ挿入要求を受けた場合、そのコンテンツに特定の単語が出現する度に、その特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、発信装置10に返却する。
すなわち、最適タグ提案装置20は、発信装置10が発信しようとしているコンテンツと同じ単語が出現する他のコンテンツにおいて実際に挿入されている数が多いタグを提案することになる。
よって、発信装置10の発信者は、コンテンツの発信に不慣れな初心者であったり、初めてのカテゴリやトピックでコンテンツを発信したりする場合でも、最適タグ提案装置20から提案された、広く使用されているタグを選択してコンテンツに挿入することができるため、自身が発信したコンテンツを多くの人に伝えることができるようになる。
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されものでない。本発明の構成や詳細には、本発明の範囲内で当業者が理解し得る様々な変更をすることができる。
例えば、本実施形態においては、最適タグリストを1つだけ作成することを想定していたが、発信者属性(年齢、性別、生活圏)毎や日時属性(季節、時間帯)毎に最適タグリストを作成し、発信者や発信日時に応じて最適タグリストを切り替えても良い。
具体的には、発信者属性毎に最適タグリストを作成する場合、タグ収集部21は、発信者属性毎に、コンテンツDB40内のコンテンツのうち、その発信者属性を満たす発信者が使用する発信装置10が発信したコンテンツのみを用いてタグリストを作成する。また、最適タグ作成部23は、発信者属性毎に、その発信者属性に応じて作成されたタグリストを用いて最適タグリストを作成する。また、最適タグ返却部25は、発信装置10からタグ挿入要求を受けた場合、その発信装置を使用する発信者の発信者属性に応じて作成された最適タグリストを用いて、候補タグを決定する。
一方、日時属性毎に最適タグリストを作成する場合、タグ収集部21は、日時属性毎に、コンテンツDB40内のコンテンツのうち、その日時属性を満たす日時に発信装置10が発信したコンテンツのみを用いてタグリストを作成する。また、最適タグ作成部23は、日時属性毎に、その日時属性に応じて作成されたタグリストを用いて最適タグリストを作成する。また、最適タグ返却部25は、発信装置10からタグ挿入要求を受けた場合、タグ挿入要求を受けた日時の日時属性に応じて作成された最適タグリストを用いて、候補タグを決定する。
また、本発明の最適タグ提案装置20にて行われる方法は、コンピュータに実行させるためのプログラムに適用してもよい。また、そのプログラムを記憶媒体に格納することも可能である。
10−1〜10−S 発信装置
20 最適タグ提案装置
21 タグ収集部
22 タグリストDB
23 最適タグ作成部
24 最適タグリストDB
25 最適タグ返却部
30 単語DB
40 コンテンツDB

Claims (25)

  1. 発信装置が発信するコンテンツに挿入するタグを提案する最適タグ提案装置であって、
    特定の単語が出現するコンテンツ毎に、当該コンテンツに挿入されているタグを収集し、
    前記特定の単語毎に、当該特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの収集数に応じて代表タグを決定し、
    前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、当該特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する最適タグ提案装置。
  2. 請求項1に記載の最適タグ提案装置であって、
    前記特定の単語毎に、所定のコンテンツDBから、当該特定の単語が出現するコンテンツおよび当該コンテンツに挿入されているタグを収集し、収集したコンテンツ毎に、当該特定の単語と前記収集したタグとを対応付けたタグリストを作成するタグ収集部と、
    前記特定の単語毎に、前記タグリスト内に当該特定の単語と対応付けられて出現するタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの出現数に応じて代表タグを決定し、当該特定の単語と、前記クラスタリングした各クラスタと、前記決定した各クラスタの代表タグと、を対応付けた最適タグリストを作成する最適タグ作成部と、
    前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、前記最適タグリスト内に当該特定の単語に対応付けられて出現するクラスタを収集し、収集したクラスタに対応付けられている代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する最適タグ返却部と、を有する最適タグ提案装置。
  3. 請求項2に記載の最適タグ提案装置であって、
    前記最適タグ作成部は、
    クラスタリングの際に、同一コンテンツに挿入されているタグ同士を接続することでネットワーク化し、各ネットワークをそれぞれクラスタとする、最適タグ提案装置。
  4. 請求項3に記載の最適タグ提案装置であって、
    前記最適タグ作成部は、
    クラスタリングの際に、前記タグリスト内に前記特定の用語に対応付けられて出現する数が多い上位N(Nは2以上の自然数)個のタグから、前記タグリスト内に出現する数が多い上位M(Mは2以上の自然数)個のタグを除き、残余のタグを対象にしてクラスタリングを行う、最適タグ提案装置。
  5. 請求項2から4のいずれか1項に記載の最適タグ提案装置であって、
    前記最適タグ返却部は、
    前記最適タグリストから収集したクラスタの中から、収集数が多い上位P(Pは2以上の自然数)個のクラスタを抽出し、
    前記抽出したクラスタの代表タグを前記候補タグとして決定する、最適タグ提案装置。
  6. 請求項2から4のいずれか1項に記載の最適タグ提案装置であって、
    前記最適タグ返却部は、
    前記最適タグリストからクラスタを収集する度に、収集したクラスタに対応付けられている代表タグも収集し、収集数が多い上位Q(Qは2以上の自然数)個の代表タグを前記候補タグとして決定する、最適タグ提案装置。
  7. 請求項2から6のいずれか1項に記載の最適タグ提案装置であって、
    前記タグ収集部は、
    発信者属性毎に、前記コンテンツDB内のコンテンツのうち、当該発信者属性を満たす発信者が使用する発信装置が発信したコンテンツを用いて、前記タグリストを作成し、
    前記最適タグ作成部は、
    前記発信者属性毎に、当該発信者属性に応じて作成された前記タグリストを用いて、前記最適タグリストを作成し、
    前記最適タグ返却部は、
    前記発信装置から、コンテンツへのタグの挿入要求を受けた場合、当該発信装置を使用する発信者の発信者属性に応じて作成された最適タグリストを用いて、前記候補タグを決定する、最適タグ提案装置。
  8. 請求項2から6のいずれか1項に記載の最適タグ提案装置であって、
    前記タグ収集部は、
    日時属性毎に、前記コンテンツDB内のコンテンツのうち、当該日時属性を満たす日時に前記発信装置が発信したコンテンツを用いて、前記タグリストを作成し、
    前記最適タグ作成部は、
    前記日時属性毎に、当該日時属性に応じて作成された前記タグリストを用いて、前記最適タグリストを作成し、
    前記最適タグ返却部は、
    前記発信装置から、コンテンツへのタグの挿入要求を受けた場合、当該挿入要求を受けた日時の日時属性に応じて作成された最適タグリストを用いて、前記候補タグを決定する、最適タグ提案装置。
  9. コンテンツを発信する発信装置と、前記発信装置が発信するコンテンツに挿入するタグを提案する最適タグ提案装置と、を有してなる最適タグ提案システムであって、
    前記最適タグ提案装置は、
    特定の単語が出現するコンテンツ毎に、当該コンテンツに挿入されているタグを収集し、
    前記特定の単語毎に、当該特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの収集数に応じて代表タグを決定し、
    前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、当該特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する最適タグ提案システム。
  10. 請求項9に記載の最適タグ提案システムであって、
    前記最適タグ提案装置は、
    前記特定の単語毎に、所定のコンテンツDBから、当該特定の単語が出現するコンテンツおよび当該コンテンツに挿入されているタグを収集し、収集したコンテンツ毎に、当該特定の単語と前記収集したタグとを対応付けたタグリストを作成するタグ収集部と、
    前記特定の単語毎に、前記タグリスト内に当該特定の単語と対応付けられて出現するタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの出現数に応じて代表タグを決定し、当該特定の単語と、前記クラスタリングした各クラスタと、前記決定した各クラスタの代表タグと、を対応付けた最適タグリストを作成する最適タグ作成部と、
    前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、前記最適タグリスト内に当該特定の単語に対応付けられて出現するクラスタを収集し、収集したクラスタに対応付けられている代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する最適タグ返却部と、を有する最適タグ提案システム。
  11. 請求項10に記載の最適タグ提案システムであって、
    前記最適タグ作成部は、
    クラスタリングの際に、同一コンテンツに挿入されているタグ同士を接続することでネットワーク化し、各ネットワークをそれぞれクラスタとする、最適タグ提案システム。
  12. 請求項11に記載の最適タグ提案システムであって、
    前記最適タグ作成部は、
    クラスタリングの際に、前記タグリスト内に前記特定の用語に対応付けられて出現する数が多い上位N(Nは2以上の自然数)個のタグから、前記タグリスト内に出現する数が多い上位M(Mは2以上の自然数)個のタグを除き、残余のタグを対象にしてクラスタリングを行う、最適タグ提案システム。
  13. 請求項10から12のいずれか1項に記載の最適タグ提案システムであって、
    前記最適タグ返却部は、
    前記最適タグリストから収集したクラスタの中から、収集数が多い上位P(Pは2以上の自然数)個のクラスタを抽出し、
    前記抽出したクラスタの代表タグを前記候補タグとして決定する、最適タグ提案システム。
  14. 請求項10から12のいずれか1項に記載の最適タグ提案システムであって、
    前記最適タグ返却部は、
    前記最適タグリストからクラスタを収集する度に、収集したクラスタに対応付けられている代表タグも収集し、収集数が多い上位Q(Qは2以上の自然数)個の代表タグを前記候補タグとして決定する、最適タグ提案システム。
  15. 請求項10から14のいずれか1項に記載の最適タグ提案システムであって、
    前記タグ収集部は、
    発信者属性毎に、前記コンテンツDB内のコンテンツのうち、当該発信者属性を満たす発信者が使用する発信装置が発信したコンテンツを用いて、前記タグリストを作成し、
    前記最適タグ作成部は、
    前記発信者属性毎に、当該発信者属性に応じて作成された前記タグリストを用いて、前記最適タグリストを作成し、
    前記最適タグ返却部は、
    前記発信装置から、コンテンツへのタグの挿入要求を受けた場合、当該発信装置を使用する発信者の発信者属性に応じて作成された最適タグリストを用いて、前記候補タグを決定する、最適タグ提案システム。
  16. 請求項10から14のいずれか1項に記載の最適タグ提案システムであって、
    前記タグ収集部は、
    日時属性毎に、前記コンテンツDB内のコンテンツのうち、当該日時属性を満たす日時に前記発信装置が発信したコンテンツを用いて、前記タグリストを作成し、
    前記最適タグ作成部は、
    前記日時属性毎に、当該日時属性に応じて作成された前記タグリストを用いて、前記最適タグリストを作成し、
    前記最適タグ返却部は、
    前記発信装置から、コンテンツへのタグの挿入要求を受けた場合、当該挿入要求を受けた日時の日時属性に応じて作成された最適タグリストを用いて、前記候補タグを決定する、最適タグ提案システム。
  17. 発信装置が発信するコンテンツに挿入するタグを提案する最適タグ提案装置による最適タグ提案方法であって、
    特定の単語が出現するコンテンツ毎に、当該コンテンツに挿入されているタグを収集し、
    前記特定の単語毎に、当該特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの収集数に応じて代表タグを決定し、
    前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、当該特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する最適タグ提案方法。
  18. 請求項17に記載の最適タグ提案方法であって、
    前記特定の単語毎に、所定のコンテンツDBから、当該特定の単語が出現するコンテンツおよび当該コンテンツに挿入されているタグを収集し、収集したコンテンツ毎に、当該特定の単語と前記収集したタグとを対応付けたタグリストを作成するタグ収集ステップと、
    前記特定の単語毎に、前記タグリスト内に当該特定の単語と対応付けられて出現するタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの出現数に応じて代表タグを決定し、当該特定の単語と、前記クラスタリングした各クラスタと、前記決定した各クラスタの代表タグと、を対応付けた最適タグリストを作成する最適タグ作成ステップと、
    前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、前記最適タグリスト内に当該特定の単語に対応付けられて出現するクラスタを収集し、収集したクラスタに対応付けられている代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する最適タグ返却ステップと、を有する最適タグ提案方法。
  19. 請求項18に記載の最適タグ提案方法であって、
    前記最適タグ作成ステップでは、
    クラスタリングの際に、同一コンテンツに挿入されているタグ同士を接続することでネットワーク化し、各ネットワークをそれぞれクラスタとする、最適タグ提案方法。
  20. 請求項19に記載の最適タグ提案方法であって、
    前記最適タグ作成ステップでは、
    クラスタリングの際に、前記タグリスト内に前記特定の用語に対応付けられて出現する数が多い上位N(Nは2以上の自然数)個のタグから、前記タグリスト内に出現する数が多い上位M(Mは2以上の自然数)個のタグを除き、残余のタグを対象にしてクラスタリングを行う、最適タグ提案方法。
  21. 請求項18から20のいずれか1項に記載の最適タグ提案方法であって、
    前記最適タグ返却ステップでは、
    前記最適タグリストから収集したクラスタの中から、収集数が多い上位P(Pは2以上の自然数)個のクラスタを抽出し、
    前記抽出したクラスタの代表タグを前記候補タグとして決定する、最適タグ提案方法。
  22. 請求項18から20のいずれか1項に記載の最適タグ提案方法であって、
    前記最適タグ返却ステップでは、
    前記最適タグリストからクラスタを収集する度に、収集したクラスタに対応付けられている代表タグも収集し、収集数が多い上位Q(Qは2以上の自然数)個の代表タグを前記候補タグとして決定する、最適タグ提案方法。
  23. 請求項18から22のいずれか1項に記載の最適タグ提案方法であって、
    前記タグ収集ステップでは、
    発信者属性毎に、前記コンテンツDB内のコンテンツのうち、当該発信者属性を満たす発信者が使用する発信装置が発信したコンテンツを用いて、前記タグリストを作成し、
    前記最適タグ作成ステップでは、
    前記発信者属性毎に、当該発信者属性に応じて作成された前記タグリストを用いて、前記最適タグリストを作成し、
    前記最適タグ返却ステップでは、
    前記発信装置から、コンテンツへのタグの挿入要求を受けた場合、当該発信装置を使用する発信者の発信者属性に応じて作成された最適タグリストを用いて、前記候補タグを決定する、最適タグ提案方法。
  24. 請求項18から22のいずれか1項に記載の最適タグ提案方法であって、
    前記タグ収集ステップでは、
    日時属性毎に、前記コンテンツDB内のコンテンツのうち、当該日時属性を満たす日時に前記発信装置が発信したコンテンツを用いて、前記タグリストを作成し、
    前記最適タグ作成ステップでは、
    前記日時属性毎に、当該日時属性に応じて作成された前記タグリストを用いて、前記最適タグリストを作成し、
    前記最適タグ返却ステップでは、
    前記発信装置から、コンテンツへのタグの挿入要求を受けた場合、当該挿入要求を受けた日時の日時属性に応じて作成された最適タグリストを用いて、前記候補タグを決定する、最適タグ提案方法。
  25. 請求項18から24のいずれか1項に記載の最適タグ提案方法をコンピュータに実行させるためのプログラム。
JP2010180917A 2010-08-12 2010-08-12 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム Active JP5252593B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010180917A JP5252593B2 (ja) 2010-08-12 2010-08-12 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010180917A JP5252593B2 (ja) 2010-08-12 2010-08-12 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2012042998A true JP2012042998A (ja) 2012-03-01
JP5252593B2 JP5252593B2 (ja) 2013-07-31

Family

ID=45899275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010180917A Active JP5252593B2 (ja) 2010-08-12 2010-08-12 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5252593B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013133108A1 (ja) * 2012-03-08 2013-09-12 Necカシオモバイルコミュニケーションズ株式会社 コンテンツ及び投稿情報連携方法、並びに情報処理端末
WO2016151692A1 (ja) * 2015-03-20 2016-09-29 株式会社 東芝 タグ付与支援装置、方法およびプログラム
JP2019023884A (ja) * 2018-09-14 2019-02-14 株式会社東芝 タグ付与支援装置、方法およびプログラム
JP2019046017A (ja) * 2017-08-31 2019-03-22 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP2021518027A (ja) * 2018-12-27 2021-07-29 チャイナ ユニオンペイ カンパニー リミテッド セマンティックテキストデータをタグとマッチングさせる方法、装置、及び命令を格納するコンピュータ読み取り可能な記憶媒体

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217157A (ja) * 2007-02-28 2008-09-18 Nippon Telegr & Teleph Corp <Ntt> 操作履歴を利用した自動情報整理装置、方法、およびプログラム
JP2008310626A (ja) * 2007-06-15 2008-12-25 Nippon Telegr & Teleph Corp <Ntt> 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体
JP2009069937A (ja) * 2007-09-11 2009-04-02 Tokyo Metropolitan Univ タグ付与支援システム及びプログラム
JP2010026996A (ja) * 2008-07-24 2010-02-04 Nippon Telegr & Teleph Corp <Ntt> タグ付け支援方法とその装置、プログラム及び記録媒体
JP2010224622A (ja) * 2009-03-19 2010-10-07 Nomura Research Institute Ltd タグ付与方法およびタグ付与プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217157A (ja) * 2007-02-28 2008-09-18 Nippon Telegr & Teleph Corp <Ntt> 操作履歴を利用した自動情報整理装置、方法、およびプログラム
JP2008310626A (ja) * 2007-06-15 2008-12-25 Nippon Telegr & Teleph Corp <Ntt> 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体
JP2009069937A (ja) * 2007-09-11 2009-04-02 Tokyo Metropolitan Univ タグ付与支援システム及びプログラム
JP2010026996A (ja) * 2008-07-24 2010-02-04 Nippon Telegr & Teleph Corp <Ntt> タグ付け支援方法とその装置、プログラム及び記録媒体
JP2010224622A (ja) * 2009-03-19 2010-10-07 Nomura Research Institute Ltd タグ付与方法およびタグ付与プログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013133108A1 (ja) * 2012-03-08 2013-09-12 Necカシオモバイルコミュニケーションズ株式会社 コンテンツ及び投稿情報連携方法、並びに情報処理端末
US9787767B2 (en) 2012-03-08 2017-10-10 Nec Corporation Content and posted-information link method, and information processing terminal
WO2016151692A1 (ja) * 2015-03-20 2016-09-29 株式会社 東芝 タグ付与支援装置、方法およびプログラム
JPWO2016151692A1 (ja) * 2015-03-20 2017-06-15 株式会社東芝 タグ付与支援装置、方法およびプログラム
US10311867B2 (en) 2015-03-20 2019-06-04 Kabushiki Kaisha Toshiba Tagging support apparatus and method
JP2019046017A (ja) * 2017-08-31 2019-03-22 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP2019023884A (ja) * 2018-09-14 2019-02-14 株式会社東芝 タグ付与支援装置、方法およびプログラム
JP2021518027A (ja) * 2018-12-27 2021-07-29 チャイナ ユニオンペイ カンパニー リミテッド セマンティックテキストデータをタグとマッチングさせる方法、装置、及び命令を格納するコンピュータ読み取り可能な記憶媒体
JP7164701B2 (ja) 2018-12-27 2022-11-01 チャイナ ユニオンペイ カンパニー リミテッド セマンティックテキストデータをタグとマッチングさせる方法、装置、及び命令を格納するコンピュータ読み取り可能な記憶媒体
US11586658B2 (en) 2018-12-27 2023-02-21 China Unionpay Co., Ltd. Method and device for matching semantic text data with a tag, and computer-readable storage medium having stored instructions

Also Published As

Publication number Publication date
JP5252593B2 (ja) 2013-07-31

Similar Documents

Publication Publication Date Title
CN105068661B (zh) 基于人工智能的人机交互方法和系统
US8051080B2 (en) Contextual ranking of keywords using click data
US9684713B2 (en) Methods and systems for retrieval of experts based on user customizable search and ranking parameters
US8626768B2 (en) Automated discovery aggregation and organization of subject area discussions
CN102163198B (zh) 提供新词或热词的方法及系统
US20110078140A1 (en) Method and system for user guided search navigation
US8554854B2 (en) Systems and methods for identifying terms relevant to web pages using social network messages
EP1396799A1 (en) Content management system
US20110093455A1 (en) Search and retrieval methods and systems of short messages utilizing messaging context and keyword frequency
CN103440243B (zh) 一种教学资源推荐方法及其装置
US10152478B2 (en) Apparatus, system and method for string disambiguation and entity ranking
CN103620604A (zh) 按类别暴露搜索历史
US9684908B2 (en) Automatically generated comparison polls
JP5252593B2 (ja) 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム
CN105243149B (zh) 一种基于语义的查询推荐方法和系统
AU2009257386A1 (en) Searching using patterns of usage
US9087130B2 (en) Generating snippets for prominent users for information retrieval queries
JP5556711B2 (ja) カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム
JP5430960B2 (ja) コンテンツ分類装置、方法及びプログラム
Zhao et al. Towards events detection from microblog messages
WO2010131013A1 (en) Collaborative search engine optimisation
Jin et al. Extracting a social network among entities by web mining
JP2007213564A5 (ja)
KR102279125B1 (ko) 취향필터에 기반한 추천 정보 제공 단말 및 장치
Olariu Clustering to improve microblog stream summarization

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130301

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130411

R150 Certificate of patent or registration of utility model

Ref document number: 5252593

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250