JP2005070864A - 情報推薦装置、情報推薦方法、コンピュータ、及び記録媒体 - Google Patents

情報推薦装置、情報推薦方法、コンピュータ、及び記録媒体 Download PDF

Info

Publication number
JP2005070864A
JP2005070864A JP2003209038A JP2003209038A JP2005070864A JP 2005070864 A JP2005070864 A JP 2005070864A JP 2003209038 A JP2003209038 A JP 2003209038A JP 2003209038 A JP2003209038 A JP 2003209038A JP 2005070864 A JP2005070864 A JP 2005070864A
Authority
JP
Japan
Prior art keywords
information
analysis
map
word
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003209038A
Other languages
English (en)
Inventor
Seiji Matsumoto
征二 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2003209038A priority Critical patent/JP2005070864A/ja
Publication of JP2005070864A publication Critical patent/JP2005070864A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】マッピングされた情報とユーザプロファイルを用いて高精度な情報推薦を行う情報推薦装置を提供する。
【解決手段】情報推薦装置1は、言語資料であるコーパスDB29を2次元単語マップ、2次元構文マップに変換する。更に顧客の興味・嗜好情報であるユーザプロファイルDB35を前記2次元単語マップ、2次元構文マップにプロットしプロファイル付き2次元単語マップ、プロファイル付き2次元構文マップとする。キャンペーンのキーワードとなるキャンペーンデータ41の単語解析、構文解析を行って、プロファイル付き2次元単語マップ、プロファイル付き2次元構文マップと照合して、キャンペーンに興味や嗜好を持つ顧客を抽出する。
【選択図】 図4

Description

【0001】
【発明の属する技術分野】
本発明は、興味を持つ可能性のあるユーザに対して、情報を推薦する情報推薦装置に関する。
【0002】
【従来の技術】
情報フィルタリング方式には、Content−based Filtering方式がある。この方式は、ユーザがWebページの閲覧などの行動を取ることにより、閲覧された対象文書を解析し、文書に含まれている単語を抽出する。そして、これらの単語を、ユーザごとに、ユーザプロファイルといわれる興味・嗜好情報に記録する。ユーザプロファイルに、1つの興味の概念が表現され、これを利用してユーザに情報を推薦する方法である。
【0003】
ユーザプロファイルを利用して、情報提供者が広告商品等を表現するキーワードなどを入力すると、宣伝したい商品に興味を持つ可能性のあるユーザグループが抽出される。また抽出ユーザを、中心からの距離で表すというシステムが知られている(特許文献1)。
【0004】
このContent−based Filtering方式は、コンテンツに含まれている単語を基に推薦や分析を行うため、コンテンツの単語の集合以外の情報を導き出すことができない。特に、マーケティングにおいて新規分野の開拓や発案、及びキャンペーンの企画などをする場合において既知の情報のみでは効果の確認や流行の変動を見るための情報としては十分ではない。流行予測支援方法に関する特許として、特許文献2、特許文献3がある。これは、「現代用語の基礎知識」をコーパス(言語資料)として用い、毎年の流行語も同時に登録していくことで、社会的背景などを概念レベルで取り出すものである。
【0005】
【特許文献1】
特開2001−75972号公報
【特許文献2】
特開2001−273381号公報
【特許文献3】
特開2001−27993号公報
【0006】
【発明が解決しようとする課題】
しかしながら、従来技術では、単語情報を基にユーザ選定を行っているので、情報のジャンルの断定が困難であり、分析がしにくいという問題点があった。
【0007】
また、単語情報と他の単語情報との関連性が不明であるため、ユーザにとって的確な情報を推薦できる可能性はあまり高くない。
【0008】
また、単語を基に情報を推薦する場合、単語が正しく収集され、分類されていることが必要である。単語の収集の結果として正しく概念が形成されないと、概念の重複や合成が生じ、正しい概念の表現ができない。
【0009】
また、単語情報に対する関連単語、すなわちその単語に関する動作・状況・言い換え・性質などについては、ユーザ抽出時には考慮されていない。
【0010】
本発明は、このような問題に鑑みてなされたもので、その目的とするところは、マッピングされた情報とユーザプロファイルを用いて高精度な情報推薦を行う情報推薦装置を提供することにある。
【0011】
【課題を解決するための手段】
前述した目的を達成するために第1の発明は、記憶部と、制御部と、を具備し、前記記憶部は、文書情報とユーザ嗜好情報と推薦情報とを保持し、前記制御部は、前記記憶部から前記文書情報を読み出し、この文書情報を解析する第1の解析手段と、前記解析された文書情報を2次元マップに配置する第1の配置手段と、前記記憶部から前記ユーザ嗜好情報を読み出し、このユーザ嗜好情報を解析する第2の解析手段と、前記解析されたユーザ嗜好情報を、前記2次元マップに配置する第2の配置手段と、前記記憶部から前記推薦情報を読み出し、この推薦情報を解析する第3の解析手段と、前記解析された推薦情報を前記2次元マップと照合して対象ユーザを抽出する抽出手段とを、具備することを特徴とする情報推薦装置である。
【0012】
前記第1の解析手段は、前記文書情報に含まれる単語に着目して単語解析を行う単語解析手段と、前記文書情報に含まれる構文に着目して構文解析を行う構文解析手段である。
【0013】
前記第1の配置手段は、前記単語解析の結果を2次元の単語マップに配置する配置手段と、前記構文解析の結果を2次元の構文マップに配置する配置手段である。
【0014】
前記第2の解析手段は、前記ユーザ嗜好情報に含まれる単語に着目して単語解析を行う単語解析手段と、前記ユーザ嗜好情報に含まれる構文に着目して構文解析を行う構文解析手段である。
【0015】
前記第2の配置手段は、前記単語解析の結果を2次元の単語マップに配置する配置手段と、前記構文解析の結果を2次元の構文マップに配置する配置手段である。
【0016】
前記第3の解析手段は、前記推薦情報に含まれる単語に着目して単語解析を行う単語解析手段と、前記推薦情報に含まれる構文に着目して構文解析を行う構文解析手段である。
【0017】
また、情報推薦装置は、前記抽出されたユーザに、広告を提供する広告提供手段を、更に備える。広告提供手段は、メール配信手段、郵送手段等である。
【0018】
文書情報とは、言語資料(コーパス)であり、例えば様々な辞書(百科事典、国語辞典、用語辞典、類義語辞典、流行語辞典・・・)等の言葉の定義が書かれた電子化された情報である。外部メディアを介して入手してもよいし、ネットワーク経由で入手してもよい。
【0019】
ユーザ嗜好情報とは、ユーザが閲覧したWebページ履歴、アンケート結果、検索履歴等に関連する単語情報や文書情報が解析された結果である、ユーザの興味・嗜好情報である。ユーザプロファイルとも言う。
【0020】
推薦情報とは、広告事業者が広告を配信する際、配信対象となるユーザを絞り込むために提示する単語或いは文章情報である。例えば「カメラ付き携帯電話が欲しい人」の文章を推薦情報として解析し、配信対象となるユーザを抽出する。
【0021】
2次元マップとは、複数の属性(多次元ベクトル)を有するデータを2次元に写像し出力したものである。Kohnenによって提案されたニューラルネットの一種である自己組織化マップの手法を用いる。多次元データの関係が2次元平面上の距離として表され、この2次元平面上の距離が短い程類似度が高いと判定される。
【0022】
単語解析とは、対象文書から単語を形態素解析を行って抽出し、TF/IDFの手法を用いて重要度計算を行うことである。形態素解析とは、文章を最小の単語に区切ることである。TF−IDFは、TF(Term Frequency)文書に高頻度で現れること、IDF(Inverse Document Frequency)少数の文書にしか現れないことが、単語の重要度が高いとする手法である。
【0023】
構文解析とは、対象文書を、係り受け関係や5W1H関係で解析し、関係ネットワーク(単語の関連性)を作成することである。係り受けとは、2つの文節間における文節の対応関係のことである。5W1H関係は、対象文書をWho、When、Where、What、Why、Howの関係に基づいて解析することである。
【0024】
第1の発明の情報推薦装置は、記憶部が文書情報とユーザ嗜好情報と推薦情報とを保持し、制御部が記憶部から文書情報を読み出し、解析して2次元マップに配置し、更に記憶部からユーザ嗜好情報を読み出し、解析して2次元マップに配置し、記憶部から推薦情報を読み出し、解析して2次元マップと照合し、対象ユーザを抽出する。
【0025】
第2の発明は、文書情報とユーザ嗜好情報と推薦情報とを、記憶部に保持する工程と、前記記憶部から前記文書情報を読み出し、この文書情報を解析する第1の解析工程と、前記解析された文書情報を2次元マップに配置する第1の配置工程と、前記記憶部から前記ユーザ嗜好情報を読み出し、このユーザ嗜好情報を解析する第2の解析工程と、前記解析されたユーザ嗜好情報を、前記2次元マップに配置する第2の配置工程と、前記記憶部から前記推薦情報を読み出し、この推薦情報を解析する第3の解析工程と、前記解析された推薦情報を前記2次元マップと照合して対象ユーザを抽出する抽出工程とを、具備することを特徴とする情報推薦方法である。
【0026】
第2の発明の情報推薦方法は、文書情報とユーザ嗜好情報と推薦情報とを、記憶部に保持し、記憶部から文書情報を読み出し、解析して2次元マップに配置し、更に記憶部からユーザ嗜好情報を読み出し、解析して2次元マップに配置し、記憶部から推薦情報を読み出し、解析して2次元マップと照合し、対象ユーザを抽出する。
【0027】
第3の発明は、コンピュータを、請求項1から請求項7記載のいずれかの情報推薦装置として機能させるためのプログラムである。
【0028】
第3の発明のプログラムは、コンピュータを、請求項1から請求項7記載のいずれかの情報推薦装置として機能させるものであり、このプログラムをネットワークを介して流通させることもできる。
【0029】
第4の発明は、コンピュータを、請求項1から請求項7記載のいずれかの情報推薦装置として機能させるためのプログラムを記録した記録媒体である。
【0030】
第4の発明の記録媒体は、コンピュータを、請求項1から請求項7記載のいずれかの情報推薦装置として機能させるためのプログラムを記憶しており、この記録媒体を流通させることもでき、またこのプログラムをネットワークを介して流通させることもできる。
【0031】
【発明の実施の形態】
以下、図面に基づいて本発明の実施の形態を詳細に説明する。
【0032】
(1.構成)
図1は、本発明の実施の形態に係る情報推薦装置1とネットワーク3の関連を示す図である。情報推薦装置1と、広告事業者端末装置5と、複数の顧客端末装置7がネットワーク3に接続されている。広告事業者は、広告事業者端末装置5から情報推薦装置1に接続して、広告(キャンペーン)を配信する対象顧客を抽出し、抽出された顧客の顧客端末装置7に対し広告を配信する。
【0033】
ネットワーク3はインターネット等のコンピュータネットワークであり、図1には図示していないが、各種コーパス(辞書情報や言語資料)のデータベースに接続することもできる。
【0034】
また、情報推薦装置1は、顧客が顧客端末装置7からWebに接続した履歴、アンケート結果、検索履歴等の情報を保持している。
【0035】
図2は、本発明の実施の形態に係る情報推薦装置1の構造を示す図である。情報推薦装置1は、制御部であるCPU(中央処理装置)9、ハードディスク等の記憶装置11、CD−ROMドライブ等のメディア入出力部13、ネットワーク3と接続するモデム等の通信部15、キーボードやマウス等の入力部19、プリンタ等の印刷部21、ディスプレイ等の表示部23等からなり、それぞれバス17で接続される。
【0036】
図3は、情報推薦装置1の記憶装置11を示す図である。記憶装置11はハードディスクであり、情報処理装置1を動作させる基本ソフトであるOS25、制御部であるCPU9を情報処理装置1として動作させるための実行プログラム27を保持する。
【0037】
また、記憶装置11には、コーパスDB29が登録されており、コーパスDB29が解析されて単語マップDB31、及び構文マップDB33が作成され登録される。また、ユーザプロファイルDB35が登録されており、ユーザプロファイルDB35が解析されてユーザプロファイル付き単語マップDB37、及びユーザプロファイル付き構文マップDB39が作成され登録される。また、キャンペーンデータ41が登録されており、キャンペーンデータ41が解析されてキャンペーンデータ単語解析DB43、及びキャンペーンデータ構文解析DB45が作成され登録される。更にキャンペーン対象顧客DB47が作成され登録される。詳細については後述する。
【0038】
尚、コーパスDB29とは、言語資料データベースのことであり、例えば電子化された百科事典、流行語辞典等のデータベースである。記憶装置11への登録方法は、ネットワーク3を介して入手してもよいし、メディア(CD−ROM)等から入手してもよい。また、ネットワーク3やメディアにアクセスできれば特に記憶装置11に登録しておく必要はない。
【0039】
ユーザプロファイルDB35とは、図1に示す顧客端末装置7を備える各顧客のWeb利用状況、アンケート記録、検索履歴、その他の履歴等から作成されたユーザプロファイル(ユーザ嗜好情報)である。ユーザプロファイルには、ユーザ毎の興味・嗜好情報が登録されており、後述する図11に示す形式で記憶される。
【0040】
キャンペーンデータ41とは、図1の広告事業者端末装置5を有する広告事業者が、広告(キャンペーン)配信対象の顧客を抽出するための絞込みキーワード(或いは文章)である。例えば「携帯電話」、「税金」等の単語、或いは「カメラ付き携帯電話が欲しい人」、「税金を多く払ってしまったので還付したい。税金の支払額を少なくしたい。」等の文章をキャンペーンデータ41として登録する。
【0041】
(2.情報推薦装置1の動作のフローチャート)
次に、本実施の形態の情報推薦装置1の動作の詳細について説明する。図4に情報推薦装置1の動作のフローチャートを示す。尚、図4には、記憶装置11の入出力をフローチャートに沿って示す。
【0042】
(2−1 コーパス処理)
CPU9は、コーパスDB29を単語レベル、構文レベルでそれぞれ処理を行い、それぞれの2次元マップを作成する(ステップ1000)。即ち、単語マップDB31の作成(ステップ1001)、構文マップDB33の作成(ステップ1002)を行い、記憶装置11に登録する。また、2次元マップ(単語マップ、構文マップ)を表示部23に表示する(ステップ1003)。続いて、それぞれのステップの詳細を説明する。
【0043】
(2−1−1 単語マップDB31の作成)
コーパス処理の単語マップDB31の作成(ステップ1001)の詳細を図5に示す。情報推薦装置1の制御部であるCPU9は、記憶装置11に登録されているコーパスDB29を読み出す。
【0044】
コーパスDB29は、電子化された百科事典のような言語資料データベースであり、その登録内容49は、文書番号51、見出し53、本文55等の形式で登録されている。例えば文書番号51「001」は、見出し53は「税金」、本文55は「国などが徴収するお金」という形式で登録されている。
【0045】
CPU9は、コーパスDB29の各文書に対し、形態素解析を行い、形態素解析済みDB57を作成する(ステップ501)。即ち、各文書を最小の単語に区切り、単語61と品詞63に分析して形態素解析済みDB57を作成する。形態素解析済みDB57の登録内容59は、文書番号51ごとに単語61が抽出され品詞63が登録される。尚、CPU9は、形態素解析済みDB57を、処理過程のデータベースとして、記憶装置11に登録してもよい。
【0046】
次にCPU9は、形態素解析済みDB57から、単語61の重要度計算処理を行い、重要度計算済みDB65を作成する(ステップ502)。重要度計算処理方法としては、TF/IDFの手法を用いる。TF−IDFは、TF(TermFrequency)文書に高頻度で現れること、IDF(Inverse Document Frequency)少数の文書にしか現れないことを重要度が高いとする手法である。
【0047】
重要度計算済みDB65の登録内容67は、文書番号51と、その文書に含まれる単語61ごとの出現頻度69と重要度71である。例えば文書番号51「001」の単語61「税金」は、出現頻度69が「1」、重要度71が「0.9」と解析される。尚、重要度計算済みDB65は、処理過程のデータベースでとして、記憶装置11に登録しても良い。
【0048】
次にCPU9は、重要度計算済みDB65から、文書番号別単語の頻度計算を行い、文書と単語出現頻度の対応表73を作成する(ステップ503)。文書と単語出現頻度の対応表73は、文書番号51ごとに単語1(税金)、単語2(国)、単語3(徴収)、・・・の出現頻度を対応させたものである。
【0049】
即ち各文書番号51は、複数の属性(ここでは単語の種類)を有する多次元ベクトルとして表される。例えば文書番号51「001」は、多次元ベクトル{1、1、1、1、0、0、・・・}として表される。
【0050】
次にCPU9は、文書と単語出現頻度の対応表73を基に、コーパスDB29に含まれる単語を2次元マップ75にクラスタリングし、単語マップDB31を作成する(ステップ504)。クラスタリングとは、分類することでありここでは単語を2次元マップ75にマッピングすることをいう。コーパスDB29に含まれる単語を、自己組織化マップの手法を用いて2次元マップ75に出力し、この2次元平面上の距離が短い単語同士は、類似度が高いと判定される。単語マップDB31は、記憶装置11に登録される。
【0051】
(2−1−2 構文マップDB33の作成)
コーパス処理の構文マップDB33の作成(ステップ1002)の詳細を図6、図7に示す。情報推薦装置1の制御部であるCPU9は、記憶装置11に登録されているコーパスDB29を読み出す。コーパスDB29については、単語マップDB31の作成(図5)で既に説明したので説明を省略する。
【0052】
CPU9は、コーパスDB29の各文書に対し、構文解析処理を行い、構文解析済みDB77を作成する(ステップ601)。即ち、各文書を構成する文毎に、構文解析を行う。例えば図8を用いて、文105「携帯電話は、無線を用いた、小型で持ち運びができる電話」を構文解析する例を示す。
【0053】
文105を係り受け関係を用いて解析し、係り関係を決定木109として表す。係り受けとは、文節間の係り関係を調べて文を解析することである。
【0054】
また、図9には図8の係り受け解析を基にした文105の関係ネットワークを示す。関係ネットワークで必要になる「性質」「手段」などの属性は、係り受け解析エンジンなどにより抽出されるものとする。即ち、文105を構文解析した結果、「携帯電話」に関係のある単語が関係ネットワークとなる。また、「携帯電話」に関連する情報を、単語マップDB31から抽出して、更に別の関係ネットワーク(図10に示す)を作成してもよい。即ち、単語マップDB31から、「携帯電話」と距離の近い単語「カメラ」、「ストラップ」・・・を抽出し関係ネットワークを作成する。
【0055】
これら、関係ネットワーク(図9、図10)は、後述するが単語マップDB31と同様に構文に関する2次元マップのクラスタリングに利用され構文マップとなる。構文マップは単語の連結とは異なり、単語の意味で連結されたマップである。
【0056】
図6のステップ601にもどり、構文解析処理されたコーパスの構文解析内容79を示す。構文解析内容79は、文書番号51、単語番号81、単語61、品詞63、係る番号83の項目が表示される。例えば、文書番号51「001」の本文55「税金は国や自治体が徴収するお金」は、単語61(文節)に分けられて文頭から順に、単語番号81が付与される。単語61ごとに、品詞63が表示され、また、係り受け解析の結果、単語61の係る番号83(単語番号のこと)が表示される。
【0057】
CPU9は、構文解析済みDB77を、処理過程のデータベースとして、記憶装置11に登録してもよい。
【0058】
次にCPU9は、構文解析済みDB77を、5W1Hに変換し、5W1H表85を作成する(ステップ602)。即ち、ステップ601で構文解析された文毎に5W1Hの解析を行い、項目87(いつ、どこで、だれが、何を・・)とそれに対する値89の表を作成する。5W1Hの解析方法は、別途エンジンで行われるものとする。また、5W1Hは一例であり、次の要素でも良い。「日時」、「場所」、「人」、「物」、「行動」、「性質」、「方法」など。
【0059】
さらに、5W1H表85の値89の重複部分をカットして、再度、5W1H表91を作成する(ステップ603)。図6の例では、項目87「誰が」の「国や自治体が」の部分の重複をカットして、「国」に変更している。
【0060】
次にCPU9は、重複部分をカットした5W1H表91を、文番号99ごとに保存する(ステップ604)。この文番号99ごとの5W1H表91は、処理過程のデータベースとして記憶装置11に登録してもよい。
【0061】
次にCPU9は、文番号99の重要度計算処理を行う(図7のステップ605)。即ち、文書番号51ごとの文番号99の出現頻度101を計算する。出現頻度表95において、1つの文書番号51「003」に対して、文番号99が「003」「004」のように複数存在するのは、文書番号51「003」が複数の文で構成されており、異なる種類の文、例えば「確定申告について」の文と、「脱税について」の文で構成されていることを示す。
【0062】
次にCPU9は、文書番号51と文番号99との出現頻度対応表97を作成する(ステップ606)。即ち、文書番号51ごとに、文(文番号99で示す)の出現頻度を表示させる。
【0063】
次にCPU9は、文書番号51と文番号99との出現頻度対応表97、及び関係ネットワーク(図9、図10)の関係を2次元マップ103にクラスタリングして、構文マップDB33を作成する(ステップ607)。構文マップDB33は、記憶装置11に保存する。
【0064】
ここで作成される2次元マップ103は、コーパスDB29に含まれる文を、その文に含まれる単語の意味や関連性を含めて2次元マップ103に自己組織化マップの手法を用いてマッピングしたものである。「税金徴収について」306の文、「税金金額について」307の文、「脱税について」308の文、等が関連の深いものほど近くにマッピングされる。また、図9、図10の関連ネットワークで説明したように、同じ単語に関して複数の関連ネットワークが作成されるように、同じ「税金徴収について」306の文に関して、別の関連ネットワークを基にして複数の別の2次元マップを作成することもできる。
【0065】
(2−2 ユーザプロファイル処理)
以上で、図4のコーパスの処理(ステップ1000)が終了し、ステップ1004に進む。CPU9は、ユーザプロファイルDB35を前述の単語マップ上、及び構文マップ上にそれぞれプロットし、それぞれの2次元マップを作成する(ステップ1004)。即ち、プロファイル付き単語マップDB37の作成(ステップ1005)、プロファイル付き構文マップDB39の作成(ステップ1006)を行い、記憶装置11に登録する。また、作成されたプロファイル付きの2次元マップ(単語マップ、構文マップ)を表示部23に表示する(ステップ1007)。続いて、それぞれのステップの詳細を説明する。
【0066】
ユーザプロファイル111を図11に示す。ユーザプロファイルとは、図1に示す顧客端末装置7を備える各顧客のWeb利用履歴、アンケート記録、検索履歴、その他の履歴等から作成されたユーザのプロファイル(ユーザの興味嗜好情報)である。図11には、ある特定のユーザのユーザプロファイル111が表示されており、単語113、品詞115、重要度117、5W1H情報119、係り受け情報121等が登録されている。
【0067】
(2−2−1 プロファイル付き単語マップDB37の作成)
CPU9は、記憶装置11に登録されているユーザプロファイルDB35、及び単語マップDB31を読み出す。図11に示すユーザプロファイル111を持つユーザの興味・嗜好傾向である、「経済」、「ビジネス」、「失業率」・・に関する単語に関する単語マップ上に○印をプロットしていく。図12は、単語マップ上に、あるユーザのプロファイルをマッピングした、プロファイル付き単語マップ123である。例えば図12において、「自己資本」303に関する興味・嗜好傾向を示すコンテンツは、○印で示される。また、マップにはあるユーザ1人のみではなく、同時に複数のユーザをマッピングしてもよい。
【0068】
CPU9は、ユーザプロファイルDB35を単語マップDB31上にプロットしたマップを、プロファイル付き単語マップDB37として、記憶装置11に登録する。
【0069】
(2−2−2 プロファイル付き構文マップDB39の作成)
CPU9は、記憶装置11に登録されているユーザプロファイルDB35、及び構文マップDB33を読み出す。次に、図11に示すユーザプロファイル111の5W1H情報119や係り受け情報121等を参照して、単語マップと同様に構文マップ上に○印をプロットして、プロファイル付き構文マップDB39を作成する。
【0070】
CPU9は、ユーザプロファイルDB35を構文マップDB33上にプロットしたマップを、プロファイル付き構文マップDB39として、記憶装置11に登録する。
【0071】
構文マップDB33は、前述のように複数の関係ネットワークが存在すると、リンクの張られた複数の階層を成すこともあるので、プロファイル付き構文マップDB39も複数階層で構成される場合もある。
【0072】
(2−3 キャンペーンデータ41の解析処理)
以上で、図4のユーザプロファイル処理(ステップ1004)が終了し、ステップ1008に進む。CPU9は、キャンペーンデータ41を単語レベル、構文レベルでそれぞれ解析処理を行う(ステップ1008)。即ち、キャンペーンデータの単語解析データ作成(ステップ1009)、キャンペーンデータの構文解析データ作成(ステップ1010)を行い、記憶装置11に登録する。続いて、それぞれのステップの詳細を説明する。
【0073】
キャンペーンデータ41とは、広告(キャンペーン)配信対象の顧客を抽出するための絞込みキーワード(或いは文章)である。例えば「携帯電話」、「税金」等の単語、或いは「カメラ付き携帯電話が欲しい人」、「税金を多く払ってしまったので還付したい。税金の支払額を少なくしたい。」等の文章であり、キャンペーンデータ41としてキーボード等の入力部19から入力して登録する。
【0074】
キャンペーンデータ41の解析に関して、図13のステップ703、ステップ704までを説明する。
【0075】
CPU9は、記憶装置11に登録しているキャンペーンデータ41、或いは作業者が直接入力部19から入力するキャンペーンデータ139(単語、或いは文章)を取得する(ステップ701)。
【0076】
キャンペーンデータ139は、フリーの文章135であってもよいし、辞書137の単語を指定して入力してもよい。
【0077】
次にCPU9は、入力されたキャンペーンデータ139をデータベースとして記憶装置11に登録する(ステップ702)。登録内容は、キャンペーンデータ139ごとに登録番号141を付与し、文章143を登録する。
【0078】
ここでは、フリーで入力された登録番号141「001」のキャンペーンデータ139「税金を多く払ってしまったので、還付したい。税金の支払額を少なくしたい。」について、単語解析と構文解析を行う例を説明する。
【0079】
CPU9は、登録番号141「001」の文章を単語マップDB31作成時と同様に、形態素解析及びTF/IDFの手法により、単語解析レベルのコーパス処理を行う(ステップ703)。即ち文書番号51ごとの単語61、出現頻度101、重要度145を解析し、キャンペーンデータ単語解析DB43として記憶装置11に登録する。
【0080】
また、CPU9は、登録番号141「001」の文章を、係り受け解析及び5W1H解析を行い、構文解析レベルのコーパス処理を行う(ステップ704)。キャンペーンデータは、5W1Hの項目87ごとに値89を抽出し、解析結果を、キャンペーンデータ構文解析DB45として記憶装置11に登録する。
【0081】
(2−4 キャンペーン対象顧客の抽出処理)
以上で、図4のキャンペーン解析処理(ステップ1008)が終了し、ステップ1011に進む。CPU9は、キャンペーン解析で作成し記憶装置11に登録した、キャンペーンデータ単語解析DB43、及びキャンペーンデータ構文解析DB45を用いて、それぞれプロファイル付き単語マップDB37、プロファイル付き構文マップDB39から、キャンペーンの対象となる顧客を抽出する(ステップ1011)。また、抽出したキャンペーン対象顧客を、キャンペーン対象顧客DB47として記憶装置11に登録する。
【0082】
キャンペーン対象顧客抽出の手順を、図13のステップ705、ステップ706、及び図14を用いて説明する。
【0083】
(2−4−1 単語解析レベルによるキャンペーン対象分類の抽出)
CPU9は、キャンペーンデータ単語解析DB43と、プロファイル付き単語マップDB37とを照合し、キャンペーンデータの単語61が該当する確率の高い分類(クラスタ)を抽出する(ステップ705)。例えば2次元マップ125上の「税金」302に該当する重要度(スコア)は0.8と高いので、この「税金」302の分類を、該当候補として抽出する。
【0084】
(2−4−2 構文解析レベルによるキャンペーン対象分類の抽出)
CPU9は、キャンペーンデータ構文解析DB45と、プロファイル付き構文マップDB39とを照合し、構文解析の結果、該当する確率の高い分類(クラスタ)を抽出する(ステップ706)。例えば2次元マップ127上の「年末調整について」309に該当する重要度(スコア)は0.9と高いので、この分類309が、該当候補として抽出される。
【0085】
尚、重要度(スコア)は、5W1Hのマッチ数や、関係ネットワークのマッチ数によってスコアリングする。単純に、5W1Hの関係が一致すれば点を加算していってもよいし、関係ネットワークの間に重み付けをして重みの合計をスコアとしてもよい。
【0086】
(2−4−3 キャンペーン対象顧客の抽出)
次に、上記ステップ705及びステップ706により抽出された分類に該当するキャンペーン対象顧客の抽出を行う(図14)。
【0087】
まず、単語解析レベルで抽出された分類302「税金」に該当するプロファイルをもつ顧客のグループ311(Aグループ)を抽出する(図14の2次元マップ129参照)。Aグループ311を構成する、顧客数120名、顧客番号「001、003、010、・・・」を抽出する。
【0088】
また、構文解析レベルで抽出された分類309「年末調整について」に該当するプロファイルをもつ顧客のグループ313(Bグループ)を抽出し、同様に2次元マップ131から顧客データ(顧客数、顧客番号)を抽出する。
【0089】
以上、抽出したキャンペーン対象顧客のデータを、キャンペーン対象顧客DB47として記憶装置11に登録する(図4)。
【0090】
尚、図15に示すように、単語解析レベルの第1階層147の1つのクラスタ(単語)151にリンクして、構文解析レベルの第2階層149のクラスタ(文)153、155が選定される。リンクのレベルが高いもののみを選定してもよいし、リンクされるすべての第2階層149のクラスタを選定する方法もある。
【0091】
即ち、図14の単語解析レベルの2次元マップ125で抽出された分類302「税金」にリンクする、リンクレベルの最も高い構文解析レベルの2次元マップ127の分類307をCグループ312として抽出し、対象顧客を抽出してもよい。また、一定以上のリンクレベルの高い分類306、307、310をまとめてDグループ314として抽出し、対象顧客を抽出してもよい。
【0092】
尚、キャンペーン対象顧客抽出方法として、広告事業者が、表示された2次元マップ(単語レベル、構文レベル)の分類を単純にクリックして、その分類に対応するプロファイル付き2次元マップと照合して、対象顧客を抽出してもよい。
【0093】
また、自然文をキャンペーンデータ41として入力し、該当する2次元マップの候補領域を表示させた上で、該当領域をマウスなどで指示して絞り込んで、対象顧客を抽出してもよい。
【0094】
(2−5 キャンペーンの実行)
CPU9は、キャンペーン対象顧客DB47を記憶装置11から読み出し、対象顧客に対し、メール配信等の手段を用いてキャンペーン(広告)を配信する(ステップ1012)。
【0095】
(3.効果)
本実施の形態により、広告事業者は、顧客に興味・関心のあるキャンペーン(広告)を実施することで、効果の高い広告配信を行うことができる。
【0096】
また、キャンペーン対象を抽出する2次元マップにおいて、クラスタ(分類)同士の関連やカテゴリが明確になり、キャンペーンの効果分析や効果予測の信頼性が向上する。
【0097】
また、キャンペーン対象抽出過程において、対象となるクラスタ(分類)を抽出する過程で、該クラスタに関連のある情報や知識を、キャンペーンに利用することが可能になる。
【0098】
尚、本発明の技術的範囲は、前述した実施の形態に限られるものではない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【0099】
【発明の効果】
以上、詳細に説明したように本発明によれば、マッピングされた情報とユーザプロファイルを用いて高精度な情報推薦を行う情報推薦装置を提供することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る情報推薦装置1の構成を示す図
【図2】情報推薦装置1の構成を示す図
【図3】記憶装置11の構成を示す図
【図4】情報推薦装置1の動作のフローチャート
【図5】単語マップDB作成1001の手順を示す図
【図6】構文マップDB作成1002の手順を示す図
【図7】構文マップDB作成1002の手順を示す図
【図8】構文解析を示す図
【図9】関係ネットワークを示す図
【図10】関係ネットワークを示す図
【図11】ユーザプロファイル111を示す図
【図12】プロファイル付き単語マップ123を示す図
【図13】キャンペーンデータのデータ解析を示す図
【図14】2次元マップの該当候補抽出を示す図
【図15】2次元マップの階層構造(係り受け)を示す図
【符号の説明】
1・・・ 情報推薦装置
3・・・ ネットワーク
5・・・ 広告事業者端末装置
7・・・ 顧客端末装置
9・・・ CPU
11・・・ 記憶装置
13・・・ メディア入出力部
15・・・ 通信部
17・・・ バス
19・・・ 入力部
21・・・ 印刷部
23・・・ 表示部
25・・・ OS
27・・・ 実行プログラム
29・・・ コーパスDB
31・・・ 単語マップDB
33・・・ 構文マップDB
35・・・ ユーザプロファイルDB
37・・・ プロファイル付き単語マップDB
39・・・ プロファイル付き構文マップDB
41・・・ キャンペーンデータ
43・・・ キャンペーンデータ単語解析DB
45・・・ キャンペーンデータ構文解析DB
47・・・ キャンペーンデータ対象顧客DB
49、59、67・・・ 登録内容
51・・・ 文書番号
53・・・ 見出し
55・・・ 本文
57・・・ 形態素解析済みDB
61、113・・・ 単語
63、115・・・ 品詞
65・・・ 重要度計算済みDB
69、101・・・ 出現頻度
71、117、145・・・ 重要度
73・・・ 文書と単語出現頻度の対応表
75、103・・・ 2次元マップ
77、79・・・ 構文解析済みDB
81・・・ 単語番号
83・・・ 係る番号
85、91・・・ 5W1H表
93・・・ 文番号ごとの5W1H表
95・・・ 文番号ごとの出現頻度表
97・・・ 文書と単語出現頻度の対応表
99・・・ 文番号
105・・・ 文
109・・・ 係り受け解析
111・・・ ユーザプロファイル
119・・・ 5W1H
121・・・ 係り受け情報
123・・・ プロファイル付き単語マップ
125・・・ 単語解析レベルの2次元マップ
127・・・ 構文解析レベルの2次元マップ
129・・・ プロファイル付き2次元マップ(単語解析レベル)
131・・・ プロファイル付き2次元マップ(構文解析レベル)
135・・・ フリー入力文
137・・・ 辞書入力文
139・・・ キャンペーンデータ(入力文)
141・・・ 登録番号
143・・・ 文章
147・・・ 第1階層(単語解析レベル)マップ
149・・・ 第2階層(構文解析レベル)マップ
151、153、155・・・ クラスタ

Claims (10)

  1. 記憶部と、制御部と、を具備し、
    前記記憶部は、文書情報とユーザ嗜好情報と推薦情報とを保持し、
    前記制御部は、
    前記記憶部から前記文書情報を読み出し、この文書情報を解析する第1の解析手段と、
    前記解析された文書情報を2次元マップに配置する第1の配置手段と、
    前記記憶部から前記ユーザ嗜好情報を読み出し、このユーザ嗜好情報を解析する第2の解析手段と、
    前記解析されたユーザ嗜好情報を、前記2次元マップに配置する第2の配置手段と、
    前記記憶部から前記推薦情報を読み出し、この推薦情報を解析する第3の解析手段と、
    前記解析された推薦情報を前記2次元マップと照合して対象ユーザを抽出する抽出手段と、
    を、具備することを特徴とする情報推薦装置。
  2. 前記第1の解析手段は、
    前記文書情報に含まれる単語に着目して単語解析を行う単語解析手段と、
    前記文書情報に含まれる構文に着目して構文解析を行う構文解析手段と、
    で、あることを特徴とする請求項1記載の情報推薦装置。
  3. 前記第1の配置手段は、
    前記単語解析の結果を2次元の単語マップに配置する配置手段と、
    前記構文解析の結果を2次元の構文マップに配置する配置手段と、
    で、あることを特徴とする請求項2記載の情報推薦装置。
  4. 前記第2の解析手段は、
    前記ユーザ嗜好情報に含まれる単語に着目して単語解析を行う単語解析手段と、
    前記ユーザ嗜好情報に含まれる構文に着目して構文解析を行う構文解析手段と、
    で、あることを特徴とする請求項1記載の情報推薦装置。
  5. 前記第2の配置手段は、
    前記単語解析の結果を2次元の単語マップに配置する配置手段と、
    前記構文解析の結果を2次元の構文マップに配置する配置手段と、
    で、あることを特徴とする請求項4記載の情報推薦装置。
  6. 前記第3の解析手段は、
    前記推薦情報に含まれる単語に着目して単語解析を行う単語解析手段と、
    前記推薦情報に含まれる構文に着目して構文解析を行う構文解析手段と、
    で、あることを特徴とする請求項1記載の情報推薦装置。
  7. 前記抽出されたユーザに、広告を提供する広告提供手段を、更に備えることを特徴とする請求項1記載の情報推薦装置。
  8. 文書情報とユーザ嗜好情報と推薦情報とを、記憶部に保持する工程と、
    前記記憶部から前記文書情報を読み出し、この文書情報を解析する第1の解析工程と、
    前記解析された文書情報を2次元マップに配置する第1の配置工程と、
    前記記憶部から前記ユーザ嗜好情報を読み出し、このユーザ嗜好情報を解析する第2の解析工程と、
    前記解析されたユーザ嗜好情報を、前記2次元マップに配置する第2の配置工程と、
    前記記憶部から前記推薦情報を読み出し、この推薦情報を解析する第3の解析工程と、
    前記解析された推薦情報を前記2次元マップと照合して対象ユーザを抽出する抽出工程と、
    を、具備することを特徴とする情報推薦方法。
  9. コンピュータを、請求項1から請求項7記載のいずれかの情報推薦装置として機能させるためのプログラム。
  10. コンピュータを、請求項1から請求項7記載のいずれかの情報推薦装置として機能させるためのプログラムを記録した記録媒体。
JP2003209038A 2003-08-27 2003-08-27 情報推薦装置、情報推薦方法、コンピュータ、及び記録媒体 Pending JP2005070864A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003209038A JP2005070864A (ja) 2003-08-27 2003-08-27 情報推薦装置、情報推薦方法、コンピュータ、及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003209038A JP2005070864A (ja) 2003-08-27 2003-08-27 情報推薦装置、情報推薦方法、コンピュータ、及び記録媒体

Publications (1)

Publication Number Publication Date
JP2005070864A true JP2005070864A (ja) 2005-03-17

Family

ID=34402105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003209038A Pending JP2005070864A (ja) 2003-08-27 2003-08-27 情報推薦装置、情報推薦方法、コンピュータ、及び記録媒体

Country Status (1)

Country Link
JP (1) JP2005070864A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100412870C (zh) * 2006-07-17 2008-08-20 北京航空航天大学 采用元推荐引擎的门户个性化推荐服务方法和系统
JP2009537891A (ja) * 2006-05-16 2009-10-29 ケィティ、コーポレーション コンテキスト広告/情報のマッピングのヒット率の向上のための広告/情報露出方法及びそれを用いたコンテキスト広告/情報推薦サービスシステム
JP2012099057A (ja) * 2010-11-05 2012-05-24 Nec Corp 情報提供装置、方法およびプログラム
JP2019053429A (ja) * 2017-09-13 2019-04-04 カシオ計算機株式会社 電子機器、情報提供方法及び情報提供プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009537891A (ja) * 2006-05-16 2009-10-29 ケィティ、コーポレーション コンテキスト広告/情報のマッピングのヒット率の向上のための広告/情報露出方法及びそれを用いたコンテキスト広告/情報推薦サービスシステム
JP4959788B2 (ja) * 2006-05-16 2012-06-27 ケィティ、コーポレーション コンテキスト広告/情報のマッピングのヒット率の向上のための広告/情報露出方法及びそれを用いたコンテキスト広告/情報推薦サービスシステム
CN100412870C (zh) * 2006-07-17 2008-08-20 北京航空航天大学 采用元推荐引擎的门户个性化推荐服务方法和系统
JP2012099057A (ja) * 2010-11-05 2012-05-24 Nec Corp 情報提供装置、方法およびプログラム
JP2019053429A (ja) * 2017-09-13 2019-04-04 カシオ計算機株式会社 電子機器、情報提供方法及び情報提供プログラム

Similar Documents

Publication Publication Date Title
US20210117617A1 (en) Methods and systems for summarization of multiple documents using a machine learning approach
US9501476B2 (en) Personalization engine for characterizing a document
Najmi et al. CAPRA: a comprehensive approach to product ranking using customer reviews
KR102158352B1 (ko) 정책정보 문서의 요지 정보 제공 방법, 정책정보 제공 시스템, 이를 위한 컴퓨터 프로그램
US9268843B2 (en) Personalization engine for building a user profile
US20110225152A1 (en) Constructing a search-result caption
US20070174255A1 (en) Analyzing content to determine context and serving relevant content based on the context
US20050165642A1 (en) Method and system for processing classified advertisements
JP4347226B2 (ja) 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
JP4796664B1 (ja) 感性分析システム及びプログラム
WO2007105202A2 (en) Automatic reusable definitions identification (rdi) method
EP2384476A1 (en) Personalization engine for building a user profile
Wang et al. Extracting fine-grained service value features and distributions for accurate service recommendation
JP2005070864A (ja) 情報推薦装置、情報推薦方法、コンピュータ、及び記録媒体
Sariki et al. A book recommendation system based on named entities
KR20050045650A (ko) 인포박스를 이용한 정보제공 시스템 및 방법
Tanawongsuwan Part-of-speech approach to evaluation of textbook reviews
JP4934819B2 (ja) 情報抽出装置、その方法及びプログラム
JP5664842B2 (ja) システム開発における要求獲得支援手法、要求獲得支援システムおよびプログラム
Maignant et al. Text Zoning of Theater Reviews: How Different are Journalistic from Blogger Reviews?
KR100926125B1 (ko) 상표 정보 제공 방법
KR20050103836A (ko) 유사성 판단을 포함하는 상표 검색 방법 및 이를 이용한상표 정보 시스템
KR20240021616A (ko) 지식재산권 데이터 플랫폼
Vasavi et al. Web Mining System in a Natural Language Processing Based for Social Media Analysis
WO2024074760A1 (en) Content management arrangement

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090602

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091110