JP2008257351A - 属性判定装置、属性判定方法及びコンピュータプログラム - Google Patents

属性判定装置、属性判定方法及びコンピュータプログラム Download PDF

Info

Publication number
JP2008257351A
JP2008257351A JP2007096700A JP2007096700A JP2008257351A JP 2008257351 A JP2008257351 A JP 2008257351A JP 2007096700 A JP2007096700 A JP 2007096700A JP 2007096700 A JP2007096700 A JP 2007096700A JP 2008257351 A JP2008257351 A JP 2008257351A
Authority
JP
Japan
Prior art keywords
attribute
data
determination
attribute determination
content data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007096700A
Other languages
English (en)
Other versions
JP5028128B2 (ja
Inventor
Hideaki Yasukawa
英明 安川
Hironori Katsura
宏徳 桂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2007096700A priority Critical patent/JP5028128B2/ja
Publication of JP2008257351A publication Critical patent/JP2008257351A/ja
Application granted granted Critical
Publication of JP5028128B2 publication Critical patent/JP5028128B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】本発明の属性判定装置は、コンテンツデータの内容を解析することにより、コンテンツデータを作成したユーザの属性を判定する。
【解決手段】データ処理部11は、各CGMサイト20からコンテンツデータ21をそれぞれ収集する。前処理部12は、コンテンツデータ21から不要なデータを除去する。属性判定部13は、複数の解析対象項目に基づいて、コンテンツデータ21から要素データを抽出する。属性判定部13は、属性リンクマスタ14を用いることにより、各属性判定項目に予め対応付けられている各解析対象項目毎に、それぞれの判定結果を求め、各判定結果から総合的な判定結果を求めて属性判定データ200を生成する。異常検出部16によって判定結果に異常が検出されると、マスタ補正部17は、属性リンクマスタ14の記憶内容を補正する。
【選択図】図1

Description

本発明は、属性判定装置、属性判定方法及びコンピュータプログラムに関する。
インターネット等の大規模通信網及びパーソナルコンピュータの普及に伴って、インターネットを用いた情報伝達の形態が急速に変化しつつある。即ち、マスメディアによる一方的な情報伝達に代えて、一般消費者が生の情報をリアルタイムに生産して自由に流通させるという、いわゆるCGM(Consumer Generated Media)が注目を集めている。
CGMとしては、例えば、ソーシャル・ネットワーキングサービス(SNS)、ウェブログ(Blog)、いわゆる口コミサイト、テキストや画像あるいは画像に対するコメント等を投稿する投稿サイト、好みの記事や画像に投票する人気投票サイト、特定の関心事項について意見を交換するコミュニティ等のような、各種ウェブサイトが知られている。
CGMでは、一般消費者が消費者の立場から客観的に商品やサービス(以下、商品等)に関する情報を自由に生産し、編集し、流通させることができる。例えば、ブログを有するユーザ(ブロガー)は、購入した商品等に満足すれば、その商品等に関する満足感を伝える記事(エントリ)を作成する。この記事に賛成または反対する他のユーザは、その記事に直接コメントを付けることにより、あるいは、自分自身のブログで新たな記事を作成することにより、意見を述べることができる。また、例えば、商品等の使い勝手等に関する情報を集積する口コミサイトでは、より直接的に、その商品等に関する自由な評価が生成される。
このようにCGMでは、一般消費者によって、商品等の直接的な評価が日常的に行われるため、商品等を提供する企業にとって無視できない存在となっている。そこで、消費者による商品等の満足度をネットワークから収集して解析することにより、市場調査等を支援する技術も提案されている(特許文献1)。
特開2004−185572号公報
前記文献に記載の技術によれば、商品等の評価を含む投稿の回数や投稿者数等に基づいて、市場調査のための資料を得ることができる。しかし、従来技術では、その商品等に関する市場の全体的な動向を把握可能であったとしても、各消費者がどのような年代、性別、地域に属するのかまでは判断することができない。即ち、商品等の評価を生成する消費者の個人属性までは検出できないため、どのようなカテゴリに属する消費者が商品等を購入しているのか、購入した商品等に満足しているのか等を判断することはできない。
例えば、商品等の評価を投稿する消費者に対して、事前にユーザ登録を求めたり、投稿時に年齢や性別等の記入を求めたりすることも考えられる。また、ブログサイトに公表されたプロフィールとエントリの内容とを対応付けて解析することも考えられる。しかし、ユーザ登録の内容や公表されたプロフィールが正しい情報であるとの保証はない。誰に見られているかわからないネットワーク上では、個人を特定されない程度で年齢や性別をぼかして、あるいは偽って開示する場合が多いと考えられる。従って、例えば、公表された明示的な情報(年齢や性別等)を素直に信じて市場調査用の資料を作成しても、利用価値に乏しいという問題がある。
そこで、本発明の目的は、コンテンツデータの内容を解析することにより、コンテンツデータの作成者の属性を判定できるようにした属性判定装置、属性判定方法及びコンピュータプログラムを提供することにある。本発明の他の目的は、消費者の嗜好や言葉の変化に応じて、コンテンツデータの内容を解析し、コンテンツデータの作成者の属性を判定することができるようにした属性判定装置、属性判定方法及びコンピュータプログラムを提供することにある。本発明のさらなる目的は、後述する実施形態の記載から明らかになるであろう。
上記課題を解決すべく、本発明の一つの観点に従う属性判定装置は、コンテンツデータを収集するデータ収集部と、コンテンツデータの作成者の属性解析に使用される解析用データベースと、収集されたコンテンツデータを解析用データベースを用いて解析することにより、作成者の属性を各コンテンツデータ毎にそれぞれ判定し、その判定結果を第1の属性判定データとして出力する属性判定部と、第1の属性判定データを記憶する記憶部と、属性判定部による判定結果に基づいて、解析用データベースの記憶内容を補正する補正部と、を備える。
本発明の実施形態では、解析用データベースは、複数の属性判定項目と複数の解析対象項目とを所定の対応関係で対応付けて管理する。
本発明の実施形態では、解析用データベースは、所定の対応関係に従って、各解析対象項目のうちの所定の解析対象項目と各属性判定項目のうちの所定の属性判定項目とを予め対応付けて構成される複数のサブデータベースを備えており、かつ、各サブデータベースは、所定の解析対象項目に基づいてコンテンツデータから抽出される要素データと該要素データに予め設定される判定値とを対応付けて管理する。
本発明の実施形態では、属性判定部は、各サブデータベースからそれぞれ取得される判定値に基づいて、作成者の属性を属性判定項目毎にそれぞれ判定する。
本発明の実施形態では、所定の対応関係では、各解析対象項目間に重み付けが設定される。
本発明の実施形態では、補正部は、属性判定部による判定結果に基づいて、重み付けに使用するための係数を補正する。
本発明の実施形態では、補正部は、属性判定部による判定結果が予め設定される許容値を超えた場合に、解析用データベースの記憶内容を補正する。
本発明の実施形態では、解析対象項目には、コンテンツデータに関連づけられている画像データの管理用データ、または、コンテンツデータの更新時刻の少なくともいずれか一方が含まれている。
本発明の実施形態では、記憶部に記憶された各第1の属性判定データに基づいて各作成者毎の属性を示す第2の属性判定データを生成する。
本発明の他の観点に従う、ネットワーク上の記憶装置に蓄積されたコンテンツデータの作成者の属性を解析するための方法は、コンテンツデータを収集するステップと、コンテンツデータから、予め設定される解析対象項目毎に要素データをそれぞれ抽出するステップと、各要素データと解析用データベースとに基づいて、作成者の属性を予め設定される複数の属性判定項目毎にそれぞれ判定し、その判定結果を第1の属性判定データとして出力するステップと、第1の属性判定データが予め設定される許容値を外れた場合には、第1属性判定データに基づいて解析用データベースの記憶内容を補正するステップと、を含む。
本発明のさらに別の観点に従う、ネットワーク上の記憶装置に蓄積されたコンテンツデータの作成者の属性を解析するためのコンピュータプログラムは、コンテンツデータを収集する機能と、コンテンツデータの作成者の属性解析に使用される解析用データベースを用いてコンテンツデータを解析することにより、作成者の属性を各コンテンツデータ毎にそれぞれ判定し、その判定結果を第1の属性判定データとして出力させる機能と、第1の属性判定データを記憶部に記憶させる機能と、属性判定部による判定結果に基づいて、解析用データベースの記憶内容を補正する機能と、をコンピュータ上に実現させる。
以下、図面に基づき、本発明の実施の形態を説明する。図1は、本実施形態に係る属性判定装置10の全体構成を示す説明図である。後述のように、属性判定装置10は、CGMサイト20に掲載されている各種コンテンツデータ21を収集し、収集したコンテンツデータの内容を属性リンクマスタ14を用いて判定する。属性判定装置10は、各コンテンツデータ単位の属性判定データ200を属性データ蓄積部15に記憶させる。記憶された属性判定データ200をそのままで、あるいは適宜加工することにより、市場調査等に役立たせることができる。属性判定部13による判定結果に異常が検出された場合、属性判定装置10は、属性リンクマスタ14の記憶内容を補正する。以下、本実施形態を詳細に説明する。
属性判定システムは、少なくとも1つの属性判定装置10及びCGMサイト20とを通信ネットワークCNで通信可能に接続することによって構成される。先にCGMサイト20について説明する。各CGMサイト20は、「ネットワーク上の記憶装置」に該当し、それぞれ複数のコンテンツデータ21を記憶している。ここで、CGMサイト20としては、例えば、ソーシャル・ネットワーキングサービス、ブログ、口コミサイト、投稿サイト、人気投票サイト、コミュニティサイト等を挙げることができる。コンテンツデータ21としては、例えば、テキストデータ、グラフィックスデータ、画像データあるいは音楽データ等を挙げることができる。各CGMサイト20は、図外のユーザコンピュータとインターネットのような通信ネットワークを介して接続されている。ユーザは、CGMサイト20にアクセスして、コンテンツデータ21を新たに生成したり、既存のコンテンツデータ21を修正等することができる。
属性判定装置10の構成を説明する。属性判定装置10は、例えば、データ収集部11と、前処理部12と、属性判定部13と、属性リンクマスタ14と、属性データ蓄積部15と、異常検出部16と、マスタ補正部17と、単語等データベース18とを備えて構成することができる。さらに、属性判定装置10は、市場分析部30を備えてもよい。
データ収集部11は、各CGMサイト20に記憶されている各コンテンツデータ21を収集するものである。前処理部12は、収集された各コンテンツデータ21から不要な情報を除去するためのものである。不要な情報とは、コンテンツデータ21の作成者に関する属性解析に使用しない情報を意味し、例えば、ブログに設定された広告ページへのリンク情報等が該当する。前処理部12は、単語等のデータベース18を用いて、コンテンツデータ21から不要な情報を取り除くことができる。
属性判定部13は、前処理されたコンテンツデータ21の内容に基づいて、そのコンテンツデータ21を作成したユーザの属性を判定するものである。ユーザ属性を判定する方法については、さらに後述するが、属性判定部13は、コンテンツデータ21から抽出される複数の要素データと属性リンクマスタ14とを用いることにより、各コンテンツデータ21単位でユーザの属性をそれぞれ判定する。
判定結果は、属性判定データ200(コンテンツ別属性判定データ200)として、属性データ蓄積部15に記憶される。属性データ蓄積部15は「記憶部」に該当する。属性判定データ200は、「第1の属性判定データ」に該当する。なお、後述のユーザ別属性判定データ210は、「第2の属性判定データ」に該当する。
「解析用データベース」としての属性リンクマスタ14は、予め設定される複数の属性判定項目について判定結果を得るための、複数の「サブデータベース」としてのサブマスタ310〜380(図5参照)をそれぞれ備える。属性リンクマスタ14の詳細はさらに後述する。
異常検出部16は、属性判定部13による各属性判定項目の判定結果に基づいて、異常が示されたか否かを判定する。異常検出部16と共に「補正部」を構成するマスタ補正部17は、属性リンクマスタ14の記憶内容を補正するものである。補正方法については、さらに後述する。
単語等データベース18は、テキストマイニング等に利用するための単語データベースや、属性判定に利用するためのリンク情報データベース等を含んで構成される。リンク情報データベースには、例えば、広告サイトのURL(Uniform Resource Locator)を検出するための情報等を記憶させることができる。
市場分析部30は、属性判定装置10内に設けることもできるし、属性判定装置10の外部に設けることもできる。市場分析部30は、コンテンツ別の属性判定データ200から得られるユーザ別の属性判定データ210に基づいて、各コンテンツデータ21における評価を解析する。即ち、市場分析部30は、どのような年代、性別、地域のユーザによってどのような評価がされているかを解析する。
なお、図1中では、便宜上、属性判定装置10を単一のコンピュータ装置であるかのように示している。しかし、これに限らず、複数のコンピュータ装置を用いて、属性判定装置10を構成することもできる。
図2は、コンテンツデータ21から解析対象項目別に要素データを抽出する様子を示す説明図である。ここでは、コンテンツデータ21としてブログのエントリを例に挙げて説明する。解析対象項目とは、コンテンツデータ21から抽出すべき情報の種類を意味し、例えば、URL101A、単語101B、表現101C、ドメイン101D、デザイン101E、フォント101F、ユーザ名101G、画像情報101H及び更新時刻101Iを挙げることができる。このほかに、そのエントリにコメントを付けたユーザの名前や、そのエントリのトラックバック等の他の情報を解析対象項目に加えることもできる。
URL101Aとは、コンテンツデータとしてのブログエントリの所在を一意に特定するための情報である。図13で述べるように、URLは一定の規則に従った構造を有するため、各コンテンツデータ21のURLを解析することにより、同一ユーザに関する各コンテンツデータ21を抽出することができる。
単語101Bとは、コンテンツデータ21に含まれるテキストデータから抽出される単語を意味する。通常の場合、一つのコンテンツデータ21には複数の単語が含まれているため、解析対象項目の単語100Bについて、複数の単語が要素データとしてそれぞれ検出されることになる。本実施例では、説明の便宜上、要素データとして一つの単語のみを示してある。コンテンツデータ21内に出現する単語には、例えば、ユーザの興味の対象や生活の様子、知的レベル等が反映される。従って、コンテンツデータ21中の単語に基づいて、ユーザの属性の少なくとも一部を判定することができる。
表現101Cとは、コンテンツデータ21に含まれるテキストデータか抽出される表現を意味する。解析対象項目の表現101Cについて、例えば、言い回し、方言、語尾、顔文字等が要素データとしてそれぞれ検出される。コンテンツデータ21内の文章表現には、例えば、ユーザの居住地域、知的レベル、仕事、性格等が反映される。例えば、丁寧な言葉遣いで文章が表現されている場合、そのユーザは所定水準以上の知的レベルを有すると判断することができる。また、青少年の好む若者言葉が多用されている場合、そのユーザの年齢をある程度推測可能である。さらに、特定の地域で使用される方言が含まれている場合、そのユーザの居住地または出生地を推測可能である。従って、コンテンツデータ21内の表現に基づいて、ユーザの属性の少なくとも一部を判定可能である。
ドメイン101Dとは、コンテンツデータ21の属するSNS等を識別するための解析対象項目である。例えば、働く女性専用のSNS、特定地域に居住するメンバー専用のSNS等のように、メンバーの属性に応じてSNSが構築されることがある。従って、どのSNSに属するコンテンツデータ21であるかを知ることは、その作成者であるユーザの属性解析に役立つ。
デザイン101Eとは、コンテンツデータ21のデザイン構成を意味する。解析対象項目のデザイン101Eについて、例えば、壁紙の色(背景色)、アイコン等の画像素材の種類、テンプレートの種類等の要素データを抽出可能である。ユーザは、性格や心理状態や嗜好に応じて、多数の色彩の中から所望の色彩を選択する。従って、コンテンツデータ21のデザイン(背景色)に基づいて、ユーザの属性の少なくとも一部を判定することができる。
フォント101Fとは、コンテンツデータ21に含まれるテキストデータのフォントを意味する。例えば、明朝体やゴシック体等の種々のフォントの中から、ユーザは、自分の好みに応じたフォントを選択する。フォントの選択には、ユーザの年齢や知的レベル、あるいは性格等が反映される。従って、コンテンツデータ21で使用されているフォントを解析することにより、ユーザの属性の少なくとも一部を判定可能である。
ユーザ名101Gとは、コンテンツデータ21を作成したユーザの名称である。ユーザは、ユーザ名として、本名を使用することもできるし、本名の一部を使用することもできるし、ハンドルネームやニックネームを用いることもできる。本名以外の名称を用いる場合は、アルファベット、記号、ひらがな、カタカナ、漢字、ロシア文字、ギリシア文字、数字等を適宜組み合わせることもできる。どのような文字や記号を用いてユーザ名が構成されているかを知ることは、そのユーザの年齢や性格等を知ることに役立つ。
画像情報101Hとは、コンテンツデータ21に含まれる画像から得られる情報を意味する。画像情報としては、例えば、画像の撮影された日時、画像の撮影された場所の緯度経度、画像を撮影した機器の種類等を挙げることができる。例えば、デジタルカメラで撮影される画像データは、Exif(Exchangeable Image File Format )として知られる統一フォーマットを備える。Exifでは、例えば、撮影日、使用したカメラの種類、カメラのメーカー名、シャッター速度等の撮影条件が含まれている。また、Exif形式の画像データに、GPS(Global Positioning System)で取得した位置情報を対応付けて保存することも可能である。例えば、ユーザは、デジタルカメラ及びGPSを内蔵した携帯電話のような情報処理装置を用いて、画像を撮影し、撮影した画像をブログに掲載できる。この場合、その画像に含まれる付属情報(撮影条件や位置情報等)には、ユーザの生活圏や行動範囲等の属性が含まれる。従って、画像情報に基づいて、ユーザの属性の少なくとも一部を判定することができる。
更新時刻101Iとは、そのコンテンツデータ21が作成された、または修正された時刻を意味する。解析対象項目の更新時刻101Iでは、例えば、「2006-12-20 20:25:00」のような時刻情報が要素データとして抽出される。予め作成しておいたエントリを予め指定された時刻に掲載する機能をブログサイトが備える場合もあるが、通常の場合、ユーザは、エントリを作成した直後に掲載する。従って、更新時刻には、ユーザの行動時間帯が反映されている。例えば、コンテンツデータ21の更新時刻が平日の深夜である場合、そのユーザは、平日の昼間は職場や学校等で過ごしていると考えることができる。そこで、更新時刻に基づいてユーザの属性の少なくとも一部を判定することができる。
図3は、ユーザ属性を判定するために使用されるプロファイリングシート100の例を示す説明図である。プロファイリングシート100には、上述の単語や表現あるいはユーザ名等の各解析対象項目毎に、各コンテンツデータ21からそれぞれ抽出された要素データが登録されている。図3中の解析対象項目の「その他」101Jとしては、例えば、そのコンテンツデータ21を引用しているサイトのURL等を挙げることができる。
プロファイリングシート100には、各コンテンツデータ21毎に、それぞれ1つずつのレコードが登録される。各レコードには、各解析対象項目101A〜101Jで抽出される要素データがそれぞれ記憶される。なお、単語や表現の解析対象項目では、それぞれ複数ずつの要素データを抽出可能であるが、紙面の都合上、それぞれ1つずつ抽出されるかのように示してある。
図4は、プロファイリングシート100と属性リンクマスタ14とに基づいて、コンテンツ別の属性判定データ200を生成する様子を示す説明図である。属性判定データ200には、各コンテンツデータ21毎にそれぞれ1つずつのレコードが登録される。各レコードには、例えば、URL201A、性別(図4中では便宜上、女性度と示す)201B、生活圏201C、第1の生活パターン201D、第2の生活パターン201E、職業201F、性質201G及びその他201Hの各属性判定項目毎に、その判定結果が記憶されている。そして、各属性判定項目は、その判定しようとする属性の性質に応じて、少なくとも一つ以上の解析対象項目と対応付けられている。
URL201Aは、そのコンテンツデータ21を一意に特定するための項目であり、解析対象項目のURL101Aに対応付けられている。URL201には、URL101Aで抽出されるデータが登録される。
性別201Bは、そのコンテンツデータ21を作成したユーザの性別を判定するための項目であり、例えば、解析対象項目の単語101B、表現101C、デザイン101E、ユーザ名101Gと対応付けられている。これらの予め対応付けられている各解析対象項目毎にそれぞれユーザの性別が判定され、各判定結果を総合的に考慮して得られる性別が性別201Bに登録される。
生活圏201Cは、そのコンテンツデータ21を作成したユーザの居住または活動する地域を判定するための項目であり、例えば、解析対象項目の単語101B、表現101C、画像情報101Hと対応付けられている。前記同様に、これらの予め対応付けられている各解析対象項目毎にそれぞれユーザの生活圏が判定され、各判定結果を総合的に考慮して得られる生活圏が生活圏201Cに登録される。
第1の生活パターン201Dは、そのユーザの一つの生活パターンを判定するための項目であり、例えば、解析対象項目の単語101B及び更新時刻101Iと対応付けられている。第1の生活パターン201Dは、そのユーザの行動時間帯を推測するための項目である。前記同様に、予め対応付けられている各解析対象項目毎にそれぞれユーザの行動時間帯が判定され、各判定結果を総合的に考慮して得られる行動時間帯が第1の生活パターン201Dに登録される。
以下同様に、第2の生活パターン201Eは、そのユーザの他の生活パターンを判定するための項目であり、例えば、解析対象項目の更新時刻101Iに対応付けられている。第2の生活パターン201Eは、そのユーザの休日を判定するためのものである。
職業201Fは、そのユーザの職業を判定するための項目であり、例えば、解析対象項目の単語101Aに対応付けられている。性質201Gは、そのユーザの性質、性格を判定するための項目であり、例えば、解析対象項目の表現101C、デザイン101Eに対応付けられている。
その他201Hとしては、例えば、そのユーザの購買力、そのユーザの趣味等を挙げることができる。これらの属性を判定するための項目は、予め所定の解析対象項目に対応付けられる。なお、上述した解析対象項目と属性判定項目との対応関係は、一例であって、本発明は上述の例に限定されない。
図5は、属性リンクマスタ14の構成例を示す説明図である。属性リンクマスタ14は、例えば、各解析対象項目毎のサブマスタ310〜380と、重み付けマスタ390とを含んで構成される。
単語判定マスタ310は、単語の出現頻度を管理するテーブル311と、各属性判定項目毎のテーブル312〜317を備えている。上述の通り、本実施例では、解析対象項目の単語は幾つかの属性判定項目に予め対応付けられているが、全ての解析対象項目に対応付けられるわけではない。従って、本実施例では、単語と対応付けられている属性判定項目についてのテーブルのみを用意すれば足りる。しかし、図5中では、説明の便宜上、コンテンツデータ21から抽出された単語と各属性判定項目との関係を示す全てのテーブル312〜317を図示してある。なお、単語と対応付けられてない属性判定項目についても、値を設定しないか、あるいは、仮定の初期値を設定したテーブルを予め用意しておく構成としてもよい。
同様に、表現判定マスタ320も、表現の出現頻度を管理するテーブル321と、各属性判定項目毎のテーブル322〜327とを備えている。その他の解析対象項目についても、それぞれ判定マスタ330〜380が用意されており、これら各判定マスタ330〜380も、同様に、各属性判定項目毎のテーブルを備えることができる。なお、出現頻度を管理するためのテーブルを、全ての判定マスタが備える必要はなく、出現頻度を管理すべき解析対象項目に関する判定マスタのみが備えればよい。重み付けマスタ390については、さらに後述する。
各判定マスタ310〜380は、若干の相違はあるものの基本的に同様の、または類似の構成を備える。従って、以下の説明では、単語判定マスタ310を例に挙げて説明することとする。
図6は、単語の出現頻度を管理するためのテーブル311と、単語と性別の関連を管理するテーブル312との構成例を示す説明図である。先にテーブル311を説明する。テーブル311では、例えば、コンテンツデータ21から抽出された要素データとしての単語と、各単語の出現回数と、各期間毎の出現頻度等を管理する。このテーブル311によって、単語の使用回数の変化や季節変化、他の単語との関係を推測できる。
単語と性別の関係を管理するテーブル312では、要素データとして抽出される各単語毎に、性別の判定値が予め設定されている。ユーザの性別によって、各単語の使用頻度は相違すると考えられる。例えば、紳士用品に関する単語等は、男性ユーザに使用される確率の方が女性ユーザに使用される確率よりも低いと考えられる。各単語に設定される性別の判定値は、属性判定装置10がコンテンツデータ21を解析するにつれて、自動的に補正することができる。
図7は、単語と年齢の関係を示すテーブル313と、単語と地域(以下、上述の生活圏のことを地域と示す場合がある)の関係を示すテーブル314との構成例を示す説明図である。
単語と年齢の関係を示すテーブル313では、各単語毎に、その単語を使用するユーザの年齢区分の確率値が設定される。例えば、時代の変遷につれて言葉は変化するため、単語から年齢を推測可能である。なお、テーブル313では、10代、20代、30代、40代等のように、10歳を初期値として10年単位で年齢を区切っているが、これに限らず、例えば、青少年、中年、老年等のような区分でもよい。
単語と地域の関係を示すテーブル314では、各単語毎に、その単語を使用するユーザの活動地域区分の確率値が設定される。例えば、特定地域の名産、特定地域のみで活動している企業名等のように、ユーザの使用する単語に、ユーザの活動する地域の情報が反映される可能性がある。なお、テーブル314では、関東、関西、東海、東北及び北海道、四国及び中国、九州及び沖縄のように地域を区切っているが、これに限らず、例えば、東日本と西日本のように範囲を広げたり、あるいは、東京都や大阪府のように範囲を狭めたりすることも可能である。
図8は、重み付けマスタ390の例を示す説明図である。重み付けマスタ390は、各属性判定項目毎に、各解析対象項目の重み付け係数が予め設定される。重み付け係数に「0」が設定される解析対象項目については、その属性の判定に際して利用されない。重み付け係数の値が大きい解析対象項目は、その属性の判定に際して重視される。つまり、重み付けマスタ390は、各属性の判定に際してどの解析対象項目をどの程度重視するかを管理している。重み付け係数の初期値は、属性判定装置10がコンテンツデータ21の解析を進めるにつれて自動的に補正することができる。
図9〜図12に基づいて、属性判定方法を説明する。なお、以下に示す各フローチャートは、本発明の理解及び実施に必要な範囲で各処理の概要を示しており、実際のコンピュータプログラムとは相違する。いわゆる当業者であれば、フローチャート中のステップの実行順序を入れ替えたり、ステップを削除したり、新たなステップを追加したり、他のステップに入れ替えたりすることができる場合もあろう。
図9は、属性判定方法の全体を示す概略フローチャートである。属性判定装置10は、通信ネットワークCN上の各CGMサイト20から各コンテンツデータ21をそれぞれ収集し(S10)、収集したコンテンツデータ21から不要なデータを除去し(S11)、プロファイリングシート100を生成する(S12)。
属性判定装置10は、プロファイリングシート100と属性リンクマスタ14とに基づいて、各コンテンツデータ単位でユーザの属性を判定する(S13)。そして、属性判定装置10は、属性リンクマスタ14を補正し(S14)、属性判定データ200を生成して属性データ蓄積部15に保存する(S15)。
図10は、図9中にS13で示す属性判定処理の詳細を示すフローチャートである。属性判定装置10(以下、装置10)は、上述した性別や年齢等の各属性判定項目のうち、判定対象の属性判定項目をいずれか1つ選択する(S20)。
装置10は、例えば、選択された属性判定項目について重み付けマスタ390を参照することにより、判定対象の属性判定項目に対応づけられている解析対象項目を1つ選択する(S21)。
装置10は、選択された解析対象項目について属性を判定し(S22)、その判定結果を記憶する(S23)。装置10は、対象の属性判定項目に対応付けられている全ての解析対象項目に関する判定結果を得たか否かを判定する(S24)。対象の属性判定項目に対応付けられている解析対象項目には、重み付けマスタ390において「0」以外の値が設定されている。装置10は、対象の属性判定項目に対応する全ての解析対象項目についての判定結果を得るまで(S24:NO)、S22及びS23を繰り返す。
対象の属性判定項目に対応する全ての解析対象項目についての判定結果を得た場合(S24:YES)、装置10は、各解析対象項目で得られた判定結果に基づいて総合的な判定を行う(S26)。即ち、装置10は、各解析対象項目における判定結果に重み付け係数を乗じた値を積算等することにより、最終的な判定結果を得る。
装置10は、対象の属性判定項目についての総合判定の結果をコンテンツ別の属性判定データ200に記憶させる(S27)。装置10は、全ての属性判定項目について判定を終えたか否かを判断する(S28)。未判定の属性判定項目が残っている場合(S28:NO)、装置10は、次の属性判定項目を1つ選択し(S29)、S21に戻る。
図11は、図10中にS22で示す解析対象項目による判定処理を示すフローチャートである。装置10は、その解析対象項目で抽出された要素データ(以下、対象データと呼ぶ場合がある)が複数存在する場合、処理対象のデータを一つ選択する(S40)。
装置10は、属性リンクマスタ14内の所定のテーブルを参照し(S41)、対象データ(例えば、単語「WEB2.0」)が属性リンクマスタ14内の所定のテーブルに登録されているか否かを判定する(S42)。所定のテーブルとは、例えば、解析対象項目が単語であって、かつ、対象の属性判定項目が性別である場合、単語判定マスタ310内のテーブル312である。
対象データが属性リンクマスタ14内の所定のテーブルに登録されている場合(S42:YES)、装置10は、対象データに関して予め設定されている判定値(確率値)を取得する(S43)。
これに対し、対象データが属性リンクマスタ14内の所定のテーブルに登録されていない場合(S42:NO)、装置10は、他の解析対象項目における判定結果が既に得られているか否かを判定する(S44)。
他の解析対象項目における判定結果が得られている場合(S44:YES)、装置10は、その未登録の対象データを登録するためのマスタレコードを所定のテーブル内に生成し(S45)、他の解析対象項目で得られた判定結果に応じた判定値を、その未登録の対象データの判定結果として設定する(S46)。
具体例を挙げて説明する。現在処理中の属性判定項目が性別、処理中の解析対象項目が単語、対象データが「WEB2.0」であると仮定する。この単語「WEB2.0」は、比較的新しい単語であるため、テーブル312には登録されていないと仮定する。
この場合、装置10は、性別に関連づけられている他の解析対象項目(例えば、表現、ドメイン、デザイン、ユーザ名等)について、性別の確率値が得られているか否かを判定する。例えば、女性専用のSNSから収集されたコンテンツデータ21の場合、その作成者であるユーザは、ほぼ女性であると推測可能である。また、例えば、コンテンツデータ21に使用されている背景色がピンク色であり、コンテンツデータ21に草花のアイコン画像等が表示されている場合、そのユーザは女性である確率が高いと判定できる。従って、装置10は、未登録単語「WEB2.0」を使用するユーザが女性である確率を、例えば、70%程度の高い値に設定することができる。
このように、本実施例では、一つの属性判定項目に複数の解析対象項目が対応付けられている場合、各解析対象項目毎にそれぞれ独立した判定結果を得ることができ、ある解析対象項目で得られた判定値を、他の解析対象項目に登録されていないデータの判定値を設定するために利用することができる。従って、最新のデータであっても、比較的信頼性の高い初期値(初期設定される確率値)を設定して対応することができる。
装置10は、解析対象項目について抽出されて全ての要素データについて判定を終えたか否かを判定し(S47)、未判定の要素データが残っている場合(S47:NO)、次の判定対象のデータを選択してS41に戻る(S48)。全ての要素データについて判定を終えた場合(S47:YES)、本処理は終了し、図10中のS23に移る。
図12は、図9中にS14で示す属性リンクマスタ14を補正するための処理を示すフローチャートである。装置10は、各属性判定項目毎に、以下に述べるS51〜S54をそれぞれ実行する(S50)。
装置10は、ある属性判定項目に対応付けられている各解析対象項目のうち、例外的な値を示す判定値の得られた解析対象項目が存在するか否かを判定する(S51)。例外的な値、即ち異常な値が検出されなかった場合(S51:NO)、本処理は終了する。
例外的な値が検出された場合(S51:YES)、装置10は、同一の対象データについて、所定期間内に所定値以上の例外的値が発生したか否かを判定する(S52)。即ち、装置10は、例外的な判定値を示す対象データが、比較的短い所定期間内に比較的多く発生しているか否かを判定する。
例外的判定値を示す対象データが、所定期間内に所定値以上発生していると判定された場合(S52:YES)、装置10は、補正率を増加させる(S53)。S52で「NO」と判定された場合、装置10は、初期設定されている通常の補正率を選択する。そして、装置10は、初期設定された、または増加された補正率を用いて、例外的な判定値を修正する(S54)。
具体例を挙げて説明する。例えば、属性判定項目が「地域」であり、地域に予め関連づけられている各解析対象項目「単語」について単語「日本橋」が関西を示す確率(判定値)が8%、「表現」において関西である確率(判定値)が60%、「画像情報(位置情報)」において「関西」である確率(判定値)が80%であったと仮定する。そして、各解析対象項目の重み付け係数を考慮した総合的判定値が67%になったと仮定する。
装置10は、「単語」、「表現」及び「画像情報(位置情報)」の各判定値から標準偏差及び加重平均をそれぞれ算出し、確率密度を演算する。そして、確率密度が所定値(例えば20%程度)以下の判定値を、例外的な判定値であるとして検出する。この例では、単語「日本橋」が関西を示す判定値(8%)が例外的な値であるとして検出される。そこで、装置10は、解析対象項目の「単語」における「日本橋」という単語の判定値を修正し、8%から例えば10%程度の値に増加させる。
もしも、所定の短期間内に、日本橋という単語が多数のコンテンツデータ21内に登場している場合(S52:YES)、装置10は、補正率を増大させて、「日本橋」という単語が関西を示す確率をさらに増加させる。これにより、流行に速やかに対応できる。例えば、大阪の日本橋で注目度の高いイベントが発生した場合、そのイベント開催期間及び前後の期間において、大阪の「日本橋」を意味する単語が多数のコンテンツデータ21に出現すると考えられる。従って、このように所定期間内に例外的な判定値を示す対象データが所定値以上発生する場合には、補正率を通常の値よりも増加させることにより、世間の動向や流行に対応することができる。
本実施例は上述の構成を採用するため、以下の効果を奏する。本実施例では、コンテンツデータ毎に、その作成者であるユーザの属性を判定することができるため、市場調査に有用な基礎資料を比較的簡単に得ることができる。即ち、コンテンツデータに含まれる商品等に対する評価とコンテンツデータの作成者の属性とを対応付けて考察することで、どのようなユーザ層がどのような商品等を購入しているのかを分析できる。
本実施例では、コンテンツデータ毎の属性判定結果に基づいて、属性リンクマスタ14の記憶内容を補正することができる。従って、属性リンクマスタ14の記憶内容を流行の変化等に追従させることができ、判定精度を高めることができる。
本実施例では、複数の属性判定項目に複数の解析対象項目をそれぞれ対応付けることが可能である。従って、ある項目の属性について複数の観点から判定することができ、属性判定の精度が向上する。例えば、ユーザがブログのプロフィール欄で性別や年齢、あるいは生活圏を偽っている場合でも、ブログのエントリに出現する単語や表現あるいは画像情報中の位置情報等から、真の性別や年齢あるいは生活圏を推測可能である。
本実施例では、属性判定項目に対応付けられる各解析対象項目に重みを付けて総合的に判定する構成である。従って、例えば、属性判定結果に応じて重み付け係数の値を適宜調整することにより、判定精度を常に改善することができる。
本実施例では、例外的な判定値を示す対象データを検出した場合に、その判定値を他の解析対象項目の判定値に基づいて補正する。これにより、流行の変化等に応じて属性リンクマスタ14を改良することができる。
図13,図14に基づいて、本発明の第2実施例を説明する。本実施例を含む下記の実施例は、前記第1実施例の変形例に該当する。本実施例では、コンテンツデータ別の属性判定データ200から、ユーザ別の属性判定データ210を生成することにより、市場分析に役立たせる。
図13は、ユーザ別の属性判定データ210を生成する様子を示す説明図である。各コンテンツデータ21は、そのURLによって一意に特定される。そして、通常の場合、同一のCGMサイト20において同一ユーザには、同一のユーザIDが設定される。ユーザIDは、そのユーザにより生成されるコンテンツデータ21のURLの一部として使用される。従って、図13中に示すように、コンテンツ別の属性判定データ200をユーザ毎に分類するための機能19は、同一のユーザIDを含むコンテンツデータ21を、同一ユーザによって生成されたものであると判断してグループ化する。これにより、各ユーザ毎の属性判定データ210を得ることができる。ユーザ別の属性判定データ210は、属性データ蓄積部15に保存することができる。
図14は、市場分析処理を示すフローチャートである。市場分析部30は、通信ネットワーク上の各コンテンツデータ21の中から検索対象の商品名(サービス名でもよい)を含むコンテンツデータ21を抽出する(S60)。この抽出には、一般的な検索エンジンを利用することができる。
市場分析部30は、対象商品名を含む各コンテンツデータ21をテキスト分析し、評価算出テーブル220を用いて、各コンテンツデータ21における対象商品の評価を数値化する(S61)。評価算出テーブル220は、例えば、肯定的評価を算出するためのテーブルと、否定的評価を示すためのテーブルとを備えて構成される。肯定的な表現には、その強度に応じた正の値が設定される。否定的な表現には、その強度に応じた負の値が設定される。そして、肯定的評価の値と否定的評価の値との合計値を、そのコンテンツデータ21における対象商品の評価値として使用する。なお、上記の方法は、対象表品の評価を数値化するための単純な例であり、本発明は上記方法に限定されない。
市場分析部30は、ユーザ別の属性判定データ210を参照し(S62)、S60で抽出された各コンテンツデータ21における評価と、そのコンテンツデータ21の作成者であるユーザの属性とを対応付ける(S63)。市場分析部30は、対象商品に対して、どのようなユーザ層がどのように評価しているのか等を解析し、その解析結果を出力する(S64)。
なお、S60で抽出されたコンテンツデータ21を作成したユーザの属性が、S62の時点で不明である場合、装置10は、ユーザ属性が不明なコンテンツデータ21について、第1実施例で述べたような方法で属性を判定することができる。
このように構成される本実施例も第1実施例と同様の効果を奏する。これに加えて、本実施例では、コンテンツデータ21における対象商品の評価と、その評価を与えたユーザの属性とを対応付けて解析できるため、より有用な資料を作成することができる。
図15に基づいて第3実施例を説明する。本実施例では、図15のフローチャートに示すように、例外的な判定値を示す対象データが所定期間内に所定値以上発生した場合(S52:YES)、トレンドを検出するための処理を起動させる。
トレンド検出処理では、補正率が増加された対象データを、最近のトレンドの一つであるとして出力する(S70)。例えば、前記の例で言えば、大阪の「日本橋」を意味する「日本橋」が短期間で多数のブログに登場した場合、トレンド検出処理は、流行の言葉または流行の地域として「日本橋」を出力する。
なお、本発明は、上述した実施の形態に限定されない。当業者であれば、本発明の範囲内で、種々の追加や変更等を行うことができる。例えば、当業者であれば、前記各実施例を適宜組み合わせることができる。
本発明の実施形態に係る属性判定装置を含む情報処理システムの全体構成を示す説明図である。 コンテンツデータから解析対象項目毎にデータを抽出する様子を示す説明図である。 属性判定に使用されるプロファイリングシートの例を示す説明図である。 プロファイリングシートに属性リンクマスタを適用することにより、コンテンツ別の属性判定データを生成する様子を示す説明図である。 属性リンクマスタの構成を示す説明図である。 単語と出現頻度の関係を管理するテーブル及び単語と性別の関係を管理するテーブルを示す説明図である。 単語と年齢の関係を管理するテーブル及び単語と地域の関係を管理するテーブルを示す説明図である。 重み付け係数を管理するマスタを示す説明図である。 属性判定処理の全体を示すフローチャートである。 図9中のS13の詳細を示すフローチャートである。 図10中のS22の詳細を示すフローチャートである。 図9中のS14の詳細を示すフローチャートである。 第2実施例に係り、コンテンツ別の属性判定データからユーザ別の属性判定データを生成する様子を示す説明図である。 コンテンツデータにおける対象商品等の評価とそのコンテンツデータを作成したユーザの属性とを対応付けて解析するための処理を示すフローチャートである。 第3実施例に係り、属性リンクマスタを補正する処理を示すフローチャートである。
符号の説明
10…属性判定装置、11…データ収集部、12…前処理部、13…属性判定部、14…属性リンクマスタ、15…属性データ蓄積部、16…異常検出部、17…マスタ補正部、18…単語等データベース、19…ユーザ別属性判定データを生成する機能、20…CGMサイト、21…コンテンツデータ、30…市場分析部、100…プロファイリングシート、200…コンテンツ別属性判定データ、210…ユーザ別属性判定データ
220 評価算出テーブル、310〜380…各解析対象項目毎の判定マスタ、312〜317…テーブル

Claims (11)

  1. コンテンツデータを収集するデータ収集部と、
    前記コンテンツデータの作成者の属性解析に使用される解析用データベースと、
    収集された前記コンテンツデータを前記解析用データベースを用いて解析することにより、前記作成者の属性を前記各コンテンツデータ毎にそれぞれ判定し、その判定結果を第1の属性判定データとして出力する属性判定部と、
    前記第1の属性判定データを記憶する記憶部と、
    前記属性判定部による判定結果に基づいて、前記解析用データベースの記憶内容を補正する補正部と、
    を備える属性判定装置。
  2. 前記解析用データベースは、複数の属性判定項目と複数の解析対象項目とを所定の対応関係で対応付けて管理する請求項1に記載の属性判定装置。
  3. 前記解析用データベースは、前記所定の対応関係に従って、前記各解析対象項目のうちの所定の解析対象項目と前記各属性判定項目のうちの所定の属性判定項目とを予め対応付けて構成される複数のサブデータベースを備えており、かつ、
    前記各サブデータベースは、前記所定の解析対象項目に基づいて前記コンテンツデータから抽出される要素データと該要素データに予め設定される判定値とを対応付けて管理する請求項2に記載の属性判定装置。
  4. 前記属性判定部は、前記各サブデータベースからそれぞれ取得される前記判定値に基づいて、前記作成者の属性を前記属性判定項目毎にそれぞれ判定する請求項3に記載の属性判定装置。
  5. 前記所定の対応関係では、前記各解析対象項目間に重み付けが設定される請求項2に記載の属性判定装置。
  6. 前記補正部は、前記属性判定部による判定結果に基づいて、前記重み付けに使用するための係数を補正する請求項5に記載の属性判定装置。
  7. 前記補正部は、前記属性判定部による判定結果が予め設定される許容値を超えた場合に、前記解析用データベースの記憶内容を補正する請求項1に記載の属性判定装置。
  8. 前記解析対象項目には、前記コンテンツデータに関連づけられている画像データの管理用データ、または、前記コンテンツデータの更新時刻の少なくともいずれか一方が含まれている請求項2に記載の属性判定装置。
  9. 前記記憶部に記憶された前記各第1の属性判定データに基づいて前記各作成者毎の属性を示す第2の属性判定データを生成する請求項1に記載の属性判定装置。
  10. ネットワーク上の記憶装置に蓄積されたコンテンツデータの作成者の属性を解析するための方法であって、
    前記コンテンツデータを収集するステップと、
    前記コンテンツデータから、予め設定される解析対象項目毎に要素データをそれぞれ抽出するステップと、
    前記各要素データと解析用データベースとに基づいて、前記作成者の属性を予め設定される複数の属性判定項目毎にそれぞれ判定し、その判定結果を第1の属性判定データとして出力するステップと、
    前記第1の属性判定データが予め設定される許容値を外れた場合には、前記第1属性判定データに基づいて前記解析用データベースの記憶内容を補正するステップと、
    を含む属性判定方法。
  11. ネットワーク上の記憶装置に蓄積されたコンテンツデータの作成者の属性を解析するためのコンピュータプログラムであって、
    前記コンテンツデータを収集する機能と、
    前記コンテンツデータの作成者の属性解析に使用される解析用データベースを用いて前記コンテンツデータを解析することにより、前記作成者の属性を前記各コンテンツデータ毎にそれぞれ判定し、その判定結果を第1の属性判定データとして出力させる機能と、
    前記第1の属性判定データを記憶部に記憶させる機能と、
    前記属性判定部による判定結果に基づいて、前記解析用データベースの記憶内容を補正する機能と、
    をコンピュータ上に実現させるコンピュータプログラム。
JP2007096700A 2007-04-02 2007-04-02 属性判定装置、属性判定方法及びコンピュータプログラム Expired - Fee Related JP5028128B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007096700A JP5028128B2 (ja) 2007-04-02 2007-04-02 属性判定装置、属性判定方法及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007096700A JP5028128B2 (ja) 2007-04-02 2007-04-02 属性判定装置、属性判定方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2008257351A true JP2008257351A (ja) 2008-10-23
JP5028128B2 JP5028128B2 (ja) 2012-09-19

Family

ID=39980884

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007096700A Expired - Fee Related JP5028128B2 (ja) 2007-04-02 2007-04-02 属性判定装置、属性判定方法及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP5028128B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013190847A (ja) * 2012-03-12 2013-09-26 Internatl Business Mach Corp <Ibm> ソーシャル・メデイアにおける悪評を検出する方法、コンピュータ・プログラム、コンピュータ。
JP2014116023A (ja) * 2014-01-16 2014-06-26 Zenrin Datacom Co Ltd 属性特定システム、属性特定方法、および、コンピュータプログラム
JP2014137757A (ja) * 2013-01-17 2014-07-28 Ntt Comware Corp 情報処理システム、情報処理装置、情報処理方法及びプログラム
JP2017016692A (ja) * 2016-09-23 2017-01-19 株式会社ゼンリンデータコム 属性特定システム、属性特定方法、および、プログラム
JP2019067067A (ja) * 2017-09-29 2019-04-25 Kddi株式会社 判定装置、判定方法及び情報提供システム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006164256A (ja) * 2004-11-12 2006-06-22 Yafoo Japan Corp 属性評価プログラム、属性評価システムおよび属性評価方法
WO2006116196A2 (en) * 2005-04-21 2006-11-02 Yahoo! Inc. Media object metadata association and ranking

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006164256A (ja) * 2004-11-12 2006-06-22 Yafoo Japan Corp 属性評価プログラム、属性評価システムおよび属性評価方法
WO2006116196A2 (en) * 2005-04-21 2006-11-02 Yahoo! Inc. Media object metadata association and ranking

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013190847A (ja) * 2012-03-12 2013-09-26 Internatl Business Mach Corp <Ibm> ソーシャル・メデイアにおける悪評を検出する方法、コンピュータ・プログラム、コンピュータ。
JP2014137757A (ja) * 2013-01-17 2014-07-28 Ntt Comware Corp 情報処理システム、情報処理装置、情報処理方法及びプログラム
JP2014116023A (ja) * 2014-01-16 2014-06-26 Zenrin Datacom Co Ltd 属性特定システム、属性特定方法、および、コンピュータプログラム
JP2017016692A (ja) * 2016-09-23 2017-01-19 株式会社ゼンリンデータコム 属性特定システム、属性特定方法、および、プログラム
JP2019067067A (ja) * 2017-09-29 2019-04-25 Kddi株式会社 判定装置、判定方法及び情報提供システム

Also Published As

Publication number Publication date
JP5028128B2 (ja) 2012-09-19

Similar Documents

Publication Publication Date Title
US20230306052A1 (en) Method and system for entity extraction and disambiguation
US9002894B2 (en) Objective and subjective ranking of comments
US20170109763A1 (en) System and methods for analyzing and improving online engagement
TWI549079B (zh) 用於導引內容至一社群網路引擎之使用者的系統及方法
US9582503B2 (en) Interactive addition of semantic concepts to a document
JP6415619B2 (ja) 解析装置、解析方法、およびプログラム
US20150006570A1 (en) Search apparatus, search method, search program, and recording medium
JP2005196469A (ja) データ表示サーバ,データ表示方法,およびそのプログラム
JP5541049B2 (ja) データ生成装置、データの生成方法及びデータ生成プログラム
US20190332605A1 (en) Methods, systems and techniques for ranking blended content retrieved from multiple disparate content sources
CN102779114A (zh) 利用自动规则生成的非结构化数据支持
JP5028128B2 (ja) 属性判定装置、属性判定方法及びコンピュータプログラム
JP2022128268A (ja) 商標使用検知装置、商標使用検知方法及び商標使用検知プログラム
TWI512509B (zh) Association authoring device, association grant method, and association grant program product
JP6270085B1 (ja) 情報処理装置、情報処理システム、情報処理方法、及びプログラム
US20140012853A1 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
JP2017068547A (ja) 情報提供装置、プログラム及び情報提供方法
JP2007233584A (ja) 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム
US10402449B2 (en) Information processing system, information processing method, and information processing program
JP6295577B2 (ja) サーバ装置、プログラム、及び、情報提供方法
JP2016177621A (ja) 広告審査支援装置、広告審査支援方法および広告審査支援プログラム
US11514481B2 (en) Sales support marketing system
KR101990502B1 (ko) 범용화된 정보 추출 방법 및 이를 적용한 디바이스
KR101132431B1 (ko) 관심 정보 제공 시스템 및 방법
JP7249316B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120619

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120625

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150629

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees