しかしながら、各ユーザの属性情報をあらかじめ登録しておくコンテンツの評価方法においては、属性情報を登録したユーザの数が十分多くない場合には、評価結果の信頼性が低くなるという問題があった。
評価結果の信頼性を高めるためには、属性情報を登録するユーザの数を増加させることが必要となるが、属性情報を登録するようユーザに要請することには自ずと限界が生じる。
また、属性情報を登録したとしてもそのユーザがユーザIDを入力するなどしてウェブサイトにログインしない場合には、ユーザの属性情報を取得することができないまたは精度が下がるので、コンテンツの評価に用いることができるユーザの属性情報の数が減少する。
そのため、コンテンツにアクセスするユーザの属性情報に依存することなく、いかに動的に、自動的に、客観的にコンテンツの属性の評価、または、当該コンテンツにアクセスするユーザの属性を精度よく推定することができるかが重要な問題となってくる。
ここで、改めてインターネットに代表されるインタラクティブなメディアにおけるユーザのトラフィックについて、原点に立ち戻って考えてみることが許されてもいいであろう。一見無秩序に思えるような膨大なトラフィックも、単一のコンテンツに着目した場合、そのコンテンツに接触するユーザが辿る過程は、(1)ハイパーリンクやトラックバック構造を辿ってくる、(2)検索結果から辿ってくる、(3)何らかの方法で直接アクセスしてくる、という3つのパターンに分けられる。
このうち、(1)ハイパーリンクやトラックバック構造を辿ってくる、および(2)検索結果から辿ってくる割合が大部分を占めることは言うまでもないが、そのようなハイパーリンクやトラックバックや検索キーワードの情報を有効に活かすことができればコンテンツやコンテンツの視聴者であるユーザの評価精度を高めることができる。
本発明は、上記に鑑みてなされたものであって、コンテンツに係る属性または当該コンテンツにアクセスするユーザに係る属性を動的に、自動的に、客観的に評価することにより、評価精度を高めることができる属性評価プログラム、属性評価システムおよび属性評価方法を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、第1のコンテンツにリンクされた第2のコンテンツに係る情報を記憶するコンテンツ情報記憶手順と、前記コンテンツ情報記憶手順により記憶された第2のコンテンツに係る情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価する属性評価手順と、をコンピュータに実行させることを特徴とする。
また、本発明は、上記発明において、前記コンテンツ情報記憶手順は、第1のコンテンツに係る情報をさらに記憶し、前記属性評価手順は、前記コンテンツ情報記憶手順により記憶された第1のコンテンツに係る情報および第2のコンテンツに係る情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、前記コンテンツ情報記憶手順は、各コンテンツに係る重みの情報をさらに記憶し、前記属性評価手順は、前記コンテンツ情報記憶手順により記憶されたコンテンツに係る情報およびコンテンツに係る重みの情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、前記コンテンツ情報記憶手順は、第1のコンテンツに係る重みの情報、および、第1のコンテンツに係る重みよりも小さく設定された第2のコンテンツに係る重みの情報をさらに記憶し、前記属性評価手順は、前記コンテンツ情報記憶手順により記憶されたコンテンツに係る情報およびコンテンツに係る重みの情報に基づいて、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、前記コンテンツに係る重みを他のコンテンツによりリンクされた被リンク数、前記コンテンツにリンクされた他のコンテンツに係る重み、コンテンツがユーザにより閲覧された閲覧数、コンテンツに対応するドメイン名、または、コンテンツの更新頻度に基づいて決定する重み決定手順をさらにコンピュータに実行させ、前記コンテンツ情報記憶手順は、前記重み決定手順により決定された重みの情報を記憶することを特徴とする。
また、本発明は、上記発明において、前記コンテンツ情報記憶手順は、ユーザにより過去の所定の時間内に入力されたコンテンツの検索キーワードに係る情報をさらに記憶し、前記属性評価手順は、前記コンテンツ情報記憶手順により記憶された第2のコンテンツに係る情報および検索キーワードに係る情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、第1のコンテンツと第2のコンテンツとの間に設定されたリンクは、ハイパーリンク、または、コンテンツに対してトラックバックが実行されることにより設定されたリンクであることを特徴とする。
また、本発明は、上記発明において、コンテンツまたはコンテンツに対応するメタデータに含まれる情報に基づいて当該コンテンツに係る属性を判定する属性判定手順をさらにコンピュータに実行させ、前記コンテンツ情報記憶手順は、前記属性判定手順により判定された属性に係る情報をコンテンツに係る情報として記憶することを特徴とする。
また、本発明は、上記発明において、前記属性判定手順は、単語をカテゴリーに分類した情報を記憶したデータベースを参照し、コンテンツまたはコンテンツに対応するメタデータに含まれる単語を分類したカテゴリーに係る情報に基づいてコンテンツに係る属性を判定することを特徴とする。
また、本発明は、上記発明において、前記属性判定手順は、カテゴリーに分類した単語を階層化した情報を記憶したデータベースを参照し、各階層に属する単語に階層ごとにあらかじめ割り当てられた重みの情報に基づいてコンテンツに係る属性を判定することを特徴とする。
また、本発明は、上記発明において、前記データベースは、単語間の意味の包括関係に基づいて階層化した単語の情報を記憶したことを特徴とする。
また、本発明は、上記発明において、各階層に属する単語に階層ごとにあらかじめ割り当てられた重みは、前記包括関係の上位にある単語ほど大きいことを特徴とする。
また、本発明は、上記発明において、前記データベースにおけるカテゴリーのインデックスとなる単語が他のカテゴリーに属さないことを特徴とする。
また、本発明は、上記発明において、前記属性判定手順は、地域のカテゴリーに地域に係る単語または地域に係る単語以外の単語を分類した情報を記憶したデータベースを参照し、コンテンツまたはコンテンツに対応するメタデータに含まれる単語を地域のカテゴリーに分類した分類情報に基づいてコンテンツに係る地域の属性を判定することを特徴とする。
また、本発明は、上記発明において、前記属性判定手順は、コンテンツまたはコンテンツに対応するメタデータに含まれる緯度経度情報に基づいて当該コンテンツに係る地域の属性を判定し、前記コンテンツ情報記憶手順は、前記属性判定手順により判定された属性に係る情報をコンテンツに係る情報として記憶することを特徴とする。
また、本発明は、上記発明において、前記属性判定手順は、コンテンツに係る地域の属性と当該コンテンツの内容を分類したカテゴリーの属性とを判定することを特徴とする。
また、本発明は、上記発明において、前記属性判定手順は、単語を感情、感覚または情緒に係るカテゴリーに分類した情報を記憶したデータベースを参照し、コンテンツまたはコンテンツに対応するメタデータに含まれる単語を分類することにより得られた感情、感覚または情緒に係るカテゴリーに係る情報に基づいて感情、感覚または情緒に係るコンテンツの属性を判定することを特徴とする。
また、本発明は、上記発明において、前記コンテンツ情報記憶手順により記憶される第2のコンテンツに係る情報は、第n(n=2,3,・・・,m:mは2以上の自然数)のコンテンツにリンクされた第n+1のコンテンツに係る情報に基づいて決定された情報であることを特徴とする。
また、本発明は、上記発明において、前記nの値はユーザにより任意に設定されることを特徴とする。
また、本発明は、上記発明において、前記属性評価手順は、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価する場合に、所定の条件に合致するコンテンツに係る情報を評価に用いる情報から除外することを特徴とする。
また、本発明は、上記発明において、前記属性評価手順は、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価したのち、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性をコンテンツに対応するメタデータとして記憶することを特徴とする。
また、本発明は、上記発明において、前記属性評価手順により評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性と、第1のコンテンツにアクセスするユーザに係る情報または第1のコンテンツの出力をおこなうウェブブラウザに係る情報とを対応付けて記憶する情報記憶手順をさらにコンピュータに実行させることを特徴とする。
また、本発明は、上記発明において、前記属性評価手順により評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性、および、第2のコンテンツまたは第2のコンテンツに対応するメタデータに含まれる単語に基づいて、単語をカテゴリーに分類した情報を記憶したデータベースを構築するデータベース構築手順をさらにコンピュータに実行させることを特徴とする。
また、本発明は、上記発明において、前記属性評価手順により評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性、および、第n(n=2,3,・・・,m:mは2以上の自然数)のコンテンツまたは第nのコンテンツに対応するメタデータに含まれる単語に基づいて、単語をカテゴリーに分類した情報を記憶したデータベースを構築するデータベース構築手順をさらにコンピュータに実行させることを特徴とする。
また、本発明は、上記発明において、コンテンツの検索要求を検索キーワードとなる単語とともに受け付けた場合に、前記データベース構築手順により構築されたデータベースを参照して検索キーワードとなる単語が属するカテゴリーを抽出し、抽出したカテゴリーに属する単語を検索キーワードに追加することによりコンテンツの検索をおこなうコンテンツ検索手順をさらにコンピュータに実行させることを特徴とする。
また、本発明は、上記発明において、コンテンツの検索要求を検索キーワードとなる単語および前記データベースにおけるカテゴリーの指定とともに受け付けた場合に、指定されたカテゴリーに属する単語を検索キーワードに追加することによりコンテンツの検索をおこなうコンテンツ検索手順をさらにコンピュータに実行させることを特徴とする。
また、本発明は、上記発明において、コンテンツの検索要求を検索キーワードとなる単語とともに受け付けた場合に、前記属性評価手順により評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の情報を取得し、取得した属性および検索キーワードとなる単語を検索キーワードとして検索をおこなうコンテンツ検索手順をさらにコンピュータに実行させることを特徴とする。
また、本発明は、上記発明において、前記属性評価手順は、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価結果をデータベースに記憶し、コンテンツのメタデータに記述された名前空間に基づく第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の参照要求を受信した場合に、参照要求がなされた第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を出力することを特徴とする。
また、本発明は、上記発明において、前記属性評価手順は、コンテンツのメタデータに記述された名前空間に基づく第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の参照要求を受信したのを契機として、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、前記属性評価手順は、ユーザにより入力されたコンテンツの検索キーワードに基づいて評価した第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価結果をさらにデータベースに記憶し、コンテンツのメタデータに記述された名前空間に基づく第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の参照要求を受信した場合に、参照要求がなされた第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を出力することを特徴とする。
また、本発明は、上記発明において、前記属性評価手順により評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性に基づいて所定のコンテンツを配信するコンテンツ配信手順をさらにコンピュータに実行させることを特徴とする。
また、本発明は、上記発明において、前記コンテンツ配信手順によりコンテンツが配信された場合に、配信されたコンテンツにアクセスするユーザに係る情報と配信されたコンテンツの属性または当該コンテンツにアクセスするユーザの属性とを対応付けて記憶する属性記憶手順をさらにコンピュータに実行させることを特徴とする。
また、本発明は、上記発明において、前記属性記憶手順は、同一のユーザまたは同一のウェブブラウザに対して配信したコンテンツの属性または当該コンテンツにアクセスするユーザの属性の頻度をさらに記憶することを特徴とする。
また、本発明は、上記発明において、前記コンテンツ配信手順によりコンテンツが配信された場合に、配信されたコンテンツにアクセスしたユーザの当該コンテンツに対する反応状況に係る情報を記憶する反応状況記憶手順をさらにコンピュータに実行させることを特徴とする。
また、本発明は、コンテンツに係る属性または当該コンテンツにアクセスするユーザに係る属性を評価する属性評価システムであって、第1のコンテンツにリンクされた第2のコンテンツに係る情報を記憶するコンテンツ情報記憶手段と、前記コンテンツ情報記憶手段により記憶された第2のコンテンツに係る情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価する属性評価手段と、を備えたことを特徴とする。
また、本発明は、上記発明において、前記コンテンツ情報記憶手段は、第1のコンテンツに係る情報をさらに記憶し、前記属性評価手段は、前記コンテンツ情報記憶手段により記憶された第1のコンテンツに係る情報および第2のコンテンツに係る情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、前記コンテンツ情報記憶手段は、各コンテンツに係る重みの情報をさらに記憶し、前記属性評価手段は、前記コンテンツ情報記憶手段により記憶されたコンテンツに係る情報およびコンテンツに係る重みの情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、前記コンテンツ情報記憶手段は、第1のコンテンツに係る重みの情報、および、第1のコンテンツに係る重みよりも小さく設定された第2のコンテンツに係る重みの情報をさらに記憶し、前記属性評価手段は、前記コンテンツ情報記憶手段により記憶されたコンテンツに係る情報およびコンテンツに係る重みの情報に基づいて、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、前記コンテンツに係る重みを他のコンテンツによりリンクされた被リンク数、前記コンテンツにリンクされた他のコンテンツに係る重み、コンテンツがユーザにより閲覧された閲覧数、コンテンツに対応するドメイン名、または、コンテンツの更新頻度に基づいて決定する重み決定手段をさらにコンピュータに実行させ、前記コンテンツ情報記憶手段は、前記重み決定手段により決定された重みの情報を記憶することを特徴とする。
また、本発明は、上記発明において、前記コンテンツ情報記憶手段は、ユーザにより過去の所定の時間内に入力されたコンテンツの検索キーワードに係る情報をさらに記憶し、前記属性評価手段は、前記コンテンツ情報記憶手段により記憶された第2のコンテンツに係る情報および検索キーワードに係る情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、第1のコンテンツと第2のコンテンツとの間に設定されたリンクは、ハイパーリンク、または、コンテンツに対してトラックバックが実行されることにより設定されたリンクであることを特徴とする。
また、本発明は、上記発明において、コンテンツまたはコンテンツに対応するメタデータに含まれる情報に基づいて当該コンテンツに係る属性を判定する属性判定手段をさらに備え、前記コンテンツ情報記憶手段は、前記属性判定手段により判定された属性に係る情報をコンテンツに係る情報として記憶することを特徴とする。
また、本発明は、上記発明において、前記属性判定手段は、単語をカテゴリーに分類した情報を記憶したデータベースを参照し、コンテンツまたはコンテンツに対応するメタデータに含まれる単語を分類したカテゴリーに係る情報に基づいてコンテンツに係る属性を判定することを特徴とする。
また、本発明は、上記発明において、前記属性判定手段は、カテゴリーに分類した単語を階層化した情報を記憶したデータベースを参照し、各階層に属する単語に階層ごとにあらかじめ割り当てられた重みの情報に基づいてコンテンツに係る属性を判定することを特徴とする。
また、本発明は、上記発明において、前記データベースは、単語間の意味の包括関係に基づいて階層化した単語の情報を記憶したことを特徴とする。
また、本発明は、上記発明において、各階層に属する単語に階層ごとにあらかじめ割り当てられた重みは、前記包括関係の上位にある単語ほど大きいことを特徴とする。
また、本発明は、上記発明において、前記データベースにおけるカテゴリーのインデックスとなる単語が他のカテゴリーに属さないことを特徴とする。
また、本発明は、上記発明において、前記属性判定手段は、地域のカテゴリーに地域に係る単語または地域に係る単語以外の単語を分類した情報を記憶したデータベースを参照し、コンテンツまたはコンテンツに対応するメタデータに含まれる単語を地域のカテゴリーに分類した分類情報に基づいてコンテンツに係る地域の属性を判定することを特徴とする。
また、本発明は、上記発明において、前記属性判定手段は、コンテンツまたはコンテンツに対応するメタデータに含まれる緯度経度情報に基づいて当該コンテンツに係る地域の属性を判定し、前記コンテンツ情報記憶手段は、前記属性判定手段により判定された属性に係る情報をコンテンツに係る情報として記憶することを特徴とする。
また、本発明は、上記発明において、前記属性判定手段は、コンテンツに係る地域の属性と当該コンテンツの内容を分類したカテゴリーの属性とを判定することを特徴とする。
また、本発明は、上記発明において、前記属性判定手段は、単語を感情、感覚または情緒に係るカテゴリーに分類した情報を記憶したデータベースを参照し、コンテンツまたはコンテンツに対応するメタデータに含まれる単語を分類することにより得られた感情、感覚または情緒に係るカテゴリーに係る情報に基づいて感情、感覚または情緒に係るコンテンツの属性を判定することを特徴とする。
また、本発明は、上記発明において、前記コンテンツ情報記憶手段により記憶される第2のコンテンツに係る情報は、第n(n=2,3,・・・,m:mは2以上の自然数)のコンテンツにリンクされた第n+1のコンテンツに係る情報に基づいて決定された情報であることを特徴とする。
また、本発明は、上記発明において、前記nの値はユーザにより任意に設定されることを特徴とする。
また、本発明は、上記発明において、前記属性評価手段は、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価する場合に、所定の条件に合致するコンテンツに係る情報を評価に用いる情報から除外することを特徴とする。
また、本発明は、上記発明において、前記属性評価手段は、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価したのち、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性をコンテンツに対応するメタデータとして記憶することを特徴とする。
また、本発明は、上記発明において、前記属性評価手段により評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性と、第1のコンテンツにアクセスするユーザに係る情報または第1のコンテンツの出力をおこなうウェブブラウザに係る情報とを対応付けて記憶する情報記憶手段をさらに備えたことを特徴とする。
また、本発明は、上記発明において、前記属性評価手段により評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性、および、第2のコンテンツまたは第2のコンテンツに対応するメタデータに含まれる単語に基づいて、単語をカテゴリーに分類した情報を記憶したデータベースを構築するデータベース構築手段をさらに備えたことを特徴とする。
また、本発明は、上記発明において、前記属性評価手段により評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性、および、第n(n=2,3,・・・,m:mは2以上の自然数)のコンテンツまたは第nのコンテンツに対応するメタデータに含まれる単語に基づいて、単語をカテゴリーに分類した情報を記憶したデータベースを構築するデータベース構築手段をさらに備えたことを特徴とする。
また、本発明は、上記発明において、コンテンツの検索要求を検索キーワードとなる単語とともに受け付けた場合に、前記データベース構築手段により構築されたデータベースを参照して検索キーワードとなる単語が属するカテゴリーを抽出し、抽出したカテゴリーに属する単語を検索キーワードに追加することによりコンテンツの検索をおこなうコンテンツ検索手段をさらに備えたことを特徴とする。
また、本発明は、上記発明において、コンテンツの検索要求を検索キーワードとなる単語および前記データベースにおけるカテゴリーの指定とともに受け付けた場合に、指定されたカテゴリーに属する単語を検索キーワードに追加することによりコンテンツの検索をおこなうコンテンツ検索手段をさらに備えたことを特徴とする。
また、本発明は、上記発明において、コンテンツの検索要求を検索キーワードとなる単語とともに受け付けた場合に、前記属性評価手段により評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の情報を取得し、取得した属性および検索キーワードとなる単語を検索キーワードとして検索をおこなうコンテンツ検索手段をさらに備えたことを特徴とする。
また、本発明は、上記発明において、前記属性評価手段は、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価結果をデータベースに記憶し、コンテンツのメタデータに記述された名前空間に基づく第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の参照要求を受信した場合に、参照要求がなされた第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を出力することを特徴とする。
また、本発明は、上記発明において、前記属性評価手段は、コンテンツのメタデータに記述された名前空間に基づく第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の参照要求を受信したのを契機として、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、前記属性評価手段は、ユーザにより入力されたコンテンツの検索キーワードに基づいて評価した第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価結果をさらにデータベースに記憶し、コンテンツのメタデータに記述された名前空間に基づく第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の参照要求を受信した場合に、参照要求がなされた第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を出力することを特徴とする。
また、本発明は、上記発明において、前記属性評価手段により評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性に基づいて所定のコンテンツを配信するコンテンツ配信手段をさらに備えたことを特徴とする。
また、本発明は、上記発明において、前記コンテンツ配信手順によりコンテンツが配信された場合に、配信されたコンテンツにアクセスするユーザに係る情報と配信されたコンテンツの属性または当該コンテンツにアクセスするユーザの属性とを対応付けて記憶する属性記憶手段をさらに備えたことを特徴とする。
また、本発明は、上記発明において、前記属性記憶手段は、同一のユーザまたは同一のウェブブラウザに対して配信したコンテンツの属性または当該コンテンツにアクセスするユーザの属性の頻度をさらに記憶することを特徴とする。
また、本発明は、上記発明において、前記コンテンツ配信手段によりコンテンツが配信された場合に、配信されたコンテンツにアクセスしたユーザの当該コンテンツに対する反応状況に係る情報を記憶する反応状況記憶手段をさらに備えたことを特徴とする。
また、本発明は、コンテンツに係る属性または当該コンテンツにアクセスするユーザに係る属性を評価する属性評価方法であって、第1のコンテンツにリンクされた第2のコンテンツに係る情報を記憶するコンテンツ情報記憶工程と、前記コンテンツ情報記憶工程により記憶された第2のコンテンツに係る情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価する属性評価工程と、を含んだことを特徴とする。
また、本発明は、上記発明において、前記コンテンツ情報記憶工程は、第1のコンテンツに係る情報をさらに記憶し、前記属性評価工程は、前記コンテンツ情報記憶工程により記憶された第1のコンテンツに係る情報および第2のコンテンツに係る情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、前記コンテンツ情報記憶工程は、各コンテンツに係る重みの情報をさらに記憶し、前記属性評価工程は、前記コンテンツ情報記憶工程により記憶されたコンテンツに係る情報およびコンテンツに係る重みの情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、前記コンテンツ情報記憶工程は、第1のコンテンツに係る重みの情報、および、第1のコンテンツに係る重みよりも小さく設定された第2のコンテンツに係る重みの情報をさらに記憶し、前記属性評価工程は、前記コンテンツ情報記憶工程により記憶されたコンテンツに係る情報およびコンテンツに係る重みの情報に基づいて、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、前記コンテンツに係る重みを他のコンテンツによりリンクされた被リンク数、前記コンテンツにリンクされた他のコンテンツに係る重み、コンテンツがユーザにより閲覧された閲覧数、コンテンツに対応するドメイン名、または、コンテンツの更新頻度に基づいて決定する重み決定工程をさらに含み、前記コンテンツ情報記憶工程は、前記重み決定工程により決定された重みの情報を記憶することを特徴とする。
また、本発明は、上記発明において、前記コンテンツ情報記憶工程は、ユーザにより過去の所定の時間内に入力されたコンテンツの検索キーワードに係る情報をさらに記憶し、前記属性評価工程は、前記コンテンツ情報記憶工程により記憶された第2のコンテンツに係る情報および検索キーワードに係る情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、第1のコンテンツと第2のコンテンツとの間に設定されたリンクは、ハイパーリンク、または、コンテンツに対してトラックバックが実行されることにより設定されたリンクであることを特徴とする。
また、本発明は、上記発明において、コンテンツまたはコンテンツに対応するメタデータに含まれる情報に基づいて当該コンテンツに係る属性を判定する属性判定工程をさらに含み、前記コンテンツ情報記憶工程は、前記属性判定工程により判定された属性に係る情報をコンテンツに係る情報として記憶することを特徴とする。
また、本発明は、上記発明において、前記属性判定工程は、単語をカテゴリーに分類した情報を記憶したデータベースを参照し、コンテンツまたはコンテンツに対応するメタデータに含まれる単語を分類したカテゴリーに係る情報に基づいてコンテンツに係る属性を判定することを特徴とする。
また、本発明は、上記発明において、前記属性判定工程は、カテゴリーに分類した単語を階層化した情報を記憶したデータベースを参照し、各階層に属する単語に階層ごとにあらかじめ割り当てられた重みの情報に基づいてコンテンツに係る属性を判定することを特徴とする。
また、本発明は、上記発明において、前記データベースは、単語間の意味の包括関係に基づいて階層化した単語の情報を記憶したことを特徴とする。
また、本発明は、上記発明において、各階層に属する単語に階層ごとにあらかじめ割り当てられた重みは、前記包括関係の上位にある単語ほど大きいことを特徴とする。
また、本発明は、上記発明において、前記データベースにおけるカテゴリーのインデックスとなる単語が他のカテゴリーに属さないことを特徴とする。
また、本発明は、上記発明において、前記属性判定工程は、地域のカテゴリーに地域に係る単語または地域に係る単語以外の単語を分類した情報を記憶したデータベースを参照し、コンテンツまたはコンテンツに対応するメタデータに含まれる単語を地域のカテゴリーに分類した分類情報に基づいてコンテンツに係る地域の属性を判定することを特徴とする。
また、本発明は、上記発明において、前記属性判定工程は、コンテンツまたはコンテンツに対応するメタデータに含まれる緯度経度情報に基づいて当該コンテンツに係る地域の属性を判定し、前記コンテンツ情報記憶工程は、前記属性判定工程により判定された属性に係る情報をコンテンツに係る情報として記憶することを特徴とする。
また、本発明は、上記発明において、前記属性判定工程は、コンテンツに係る地域の属性と当該コンテンツの内容を分類したカテゴリーの属性とを判定することを特徴とする。
また、本発明は、上記発明において、前記属性判定工程は、単語を感情、感覚または情緒に係るカテゴリーに分類した情報を記憶したデータベースを参照し、コンテンツまたはコンテンツに対応するメタデータに含まれる単語を分類することにより得られた感情、感覚または情緒に係るカテゴリーに係る情報に基づいて感情、感覚または情緒に係るコンテンツの属性を判定することを特徴とする。
また、本発明は、上記発明において、前記コンテンツ情報記憶工程により記憶される第2のコンテンツに係る情報は、第n(n=2,3,・・・,m:mは2以上の自然数)のコンテンツにリンクされた第n+1のコンテンツに係る情報に基づいて決定された情報であることを特徴とする。
また、本発明は、上記発明において、前記nの値はユーザにより任意に設定されることを特徴とする。
また、本発明は、上記発明において、前記属性評価工程は、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価する場合に、所定の条件に合致するコンテンツに係る情報を評価に用いる情報から除外することを特徴とする。
また、本発明は、上記発明において、前記属性評価工程は、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価したのち、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性をコンテンツに対応するメタデータとして記憶することを特徴とする。
また、本発明は、上記発明において、前記属性評価工程により評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性と、第1のコンテンツにアクセスするユーザに係る情報または第1のコンテンツの出力をおこなうウェブブラウザに係る情報とを対応付けて記憶する情報記憶工程をさらに含んだことを特徴とする。
また、本発明は、上記発明において、前記属性評価工程により評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性、および、第2のコンテンツまたは第2のコンテンツに対応するメタデータに含まれる単語に基づいて、単語をカテゴリーに分類した情報を記憶したデータベースを構築するデータベース構築工程をさらに含んだことを特徴とする。
また、本発明は、上記発明において、前記属性評価工程により評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性、および、第n(n=2,3,・・・,m:mは2以上の自然数)のコンテンツまたは第nのコンテンツに対応するメタデータに含まれる単語に基づいて、単語をカテゴリーに分類した情報を記憶したデータベースを構築するデータベース構築工程をさらに含んだことを特徴とする。
また、本発明は、上記発明において、コンテンツの検索要求を検索キーワードとなる単語とともに受け付けた場合に、前記データベース構築工程により構築されたデータベースを参照して検索キーワードとなる単語が属するカテゴリーを抽出し、抽出したカテゴリーに属する単語を検索キーワードに追加することによりコンテンツの検索をおこなうコンテンツ検索工程をさらに含んだことを特徴とする。
また、本発明は、上記発明において、コンテンツの検索要求を検索キーワードとなる単語および前記データベースにおけるカテゴリーの指定とともに受け付けた場合に、指定されたカテゴリーに属する単語を検索キーワードに追加することによりコンテンツの検索をおこなうコンテンツ検索工程をさらに含んだことを特徴とする。
また、本発明は、上記発明において、コンテンツの検索要求を検索キーワードとなる単語とともに受け付けた場合に、前記属性評価工程により評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の情報を取得し、取得した属性および検索キーワードとなる単語を検索キーワードとして検索をおこなうコンテンツ検索工程をさらに含んだことを特徴とする。
また、本発明は、上記発明において、前記属性評価工程は、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価結果をデータベースに記憶し、コンテンツのメタデータに記述された名前空間に基づく第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の参照要求を受信した場合に、参照要求がなされた第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を出力することを特徴とする。
また、本発明は、上記発明において、前記属性評価工程は、コンテンツのメタデータに記述された名前空間に基づく第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の参照要求を受信したのを契機として、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することを特徴とする。
また、本発明は、上記発明において、前記属性評価工程は、ユーザにより入力されたコンテンツの検索キーワードに基づいて評価した第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価結果をさらにデータベースに記憶し、コンテンツのメタデータに記述された名前空間に基づく第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の参照要求を受信した場合に、参照要求がなされた第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を出力することを特徴とする。
また、本発明は、上記発明において、前記属性評価工程により評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性に基づいて所定のコンテンツを配信するコンテンツ配信工程をさらに含んだことを特徴とする。
また、本発明は、上記発明において、前記コンテンツ配信工程によりコンテンツが配信された場合に、配信されたコンテンツにアクセスするユーザに係る情報と配信されたコンテンツの属性または当該コンテンツにアクセスするユーザの属性とを対応付けて記憶する属性記憶工程をさらに含んだことを特徴とする。
また、本発明は、上記発明において、前記属性記憶工程は、同一のユーザまたは同一のウェブブラウザに対して配信したコンテンツの属性または当該コンテンツにアクセスするユーザの属性の頻度をさらに記憶することを特徴とする。
また、本発明は、上記発明において、前記コンテンツ配信工程によりコンテンツが配信された場合に、配信されたコンテンツにアクセスしたユーザの当該コンテンツに対する反応状況に係る情報を記憶する反応状況記憶工程をさらに含んだことを特徴とする。
また、本発明は、コンテンツに係る属性または当該コンテンツにアクセスするユーザに係る属性を評価する属性評価プログラムであって、ユーザにより過去の所定の時間内に入力されたコンテンツの検索キーワードに係る情報を記憶するコンテンツ情報記憶手順と、前記コンテンツ情報記憶手順により記憶されたコンテンツの検索キーワードに係る情報に基づいてコンテンツに係る属性またはコンテンツにアクセスするユーザに係る属性を評価する属性評価手順と、をコンピュータに実行させることを特徴とする。
また、本発明は、コンテンツに係る属性または当該コンテンツにアクセスするユーザに係る属性を評価する属性評価システムであって、ユーザにより過去の所定の時間内に入力されたコンテンツの検索キーワードに係る情報を記憶するコンテンツ情報記憶手段と、前記コンテンツ情報記憶手段により記憶されたコンテンツの検索キーワードに係る情報に基づいてコンテンツに係る属性またはコンテンツにアクセスするユーザに係る属性を評価する属性評価手段と、を備えたことを特徴とする。
また、本発明は、コンテンツに係る属性または当該コンテンツにアクセスするユーザに係る属性を評価する属性評価方法であって、ユーザにより過去の所定の時間内に入力されたコンテンツの検索キーワードに係る情報を記憶するコンテンツ情報記憶工程と、前記コンテンツ情報記憶工程により記憶されたコンテンツの検索キーワードに係る情報に基づいてコンテンツに係る属性またはコンテンツにアクセスするユーザに係る属性を評価する属性評価工程と、を含んだことを特徴とする。
本発明によれば、コンテンツ評価の要求があったときにいつでも、コンピュータ処理によって、第1のコンテンツにリンクされた第2のコンテンツに係る情報を記憶し、記憶した第2のコンテンツに係る情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することとしたので、コンテンツに係る属性または当該コンテンツにアクセスするユーザに係る属性を動的に、自動的に、客観的に評価することにより、評価精度を高めることができるという効果を奏する。
また、本発明によれば、第1のコンテンツに係る情報をさらに記憶し、記憶した第1のコンテンツに係る情報および第2のコンテンツに係る情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することとしたので、第2のコンテンツに係る情報に加えて第1のコンテンツに係る情報をさらに考慮することにより、コンテンツに係る属性または当該コンテンツにアクセスするユーザに係る属性を精度よく評価することができるという効果を奏する。
また、本発明によれば、ユーザにより過去の所定の時間内に入力されたコンテンツの検索キーワードに係る情報をさらに記憶し、記憶した第2のコンテンツに係る情報および検索キーワードに係る情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することとしたので、ユーザが入力した検索キーワードの情報をさらに加味することにより、コンテンツに係る属性および当該コンテンツにアクセスするユーザに係る属性を精度よく評価することができるという効果を奏する。
また、本発明によれば、各コンテンツに係る重みの情報をさらに記憶し、記憶したコンテンツに係る情報およびコンテンツに係る重みの情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することとしたので、各コンテンツに係る重みを設定することにより、コンテンツに係る情報の重視度をコンテンツごとに変化させ、コンテンツに係る属性および当該コンテンツにアクセスするユーザに係る属性を精度よく評価することができるという効果を奏する。
また、本発明によれば、第1のコンテンツに係る重みの情報、および、第1のコンテンツに係る重みよりも小さく設定された第2のコンテンツに係る重みの情報をさらに記憶し、記憶したコンテンツに係る情報およびコンテンツに係る重みの情報に基づいて、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することとしたので、評価対象である第1のコンテンツに係る情報を第2のコンテンツに係る情報よりも重視することにより、コンテンツに係る属性および当該コンテンツにアクセスするユーザに係る属性を精度よく評価することができるという効果を奏する。
また、本発明によれば、コンテンツに係る重みを他のコンテンツによりリンクされた被リンク数、コンテンツにリンクされた他のコンテンツに係る重み、コンテンツがユーザにより閲覧された閲覧数、コンテンツに対応するドメイン名、または、コンテンツの更新頻度に基づいて決定し、決定した重みの情報を記憶することとしたので、コンテンツに係る重みを効果的に決定することができるという効果を奏する。
また、本発明によれば、第1のコンテンツと第2のコンテンツとの間に設定されたリンクは、ハイパーリンク、または、コンテンツに対してトラックバックが実行されることにより設定されたリンクであることとしたので、ハイパーリンクまたはトラックバック処理によりリンクが設定されたコンテンツの属性および当該コンテンツにアクセスする直接性が高いユーザに係る属性を精度よく評価することができるという効果を奏する。
また、本発明によれば、コンテンツまたはコンテンツに対応するメタデータに含まれる情報に基づいて当該コンテンツに係る属性を判定し、判定した属性に係る情報をコンテンツに係る情報として記憶することとしたので、各コンテンツに係る属性を効果的に判定することができ、特に、XML(Extensible Markup Language)フォーマットなどにより統一的、汎用的に記述されているメタデータを参照する場合には、書式が定められているので効率的かつ効果的に各コンテンツに係る属性を判定することができるという効果を奏する。また、メタデータはコンテンツごとに持つことができるという特徴、および、トラックバックはコンテンツ単位で実行できるという特徴により、リンクされているコンテンツの全ページを評価する必要がなくなり、インターネットにおけるユーザエージェント(ロボット)の巡回コストを著しく低減できるという効果を奏する。
また、本発明によれば、単語をカテゴリーに分類した情報を記憶したデータベースを参照し、コンテンツまたはコンテンツに対応するメタデータに含まれる単語を分類したカテゴリーに係る情報に基づいてコンテンツに係る属性を判定することとしたので、コンテンツまたはコンテンツに対応するメタデータに含まれる単語をカテゴリーに分類することにより、コンテンツに係る属性を効果的に判定することができ、特に、メタデータに含まれる単語を分類したカテゴリーに係る情報に基づいてコンテンツに係る属性を判定する場合には、画像や動画など文字テキスト以外のコンテンツに係る情報も扱うことができるという効果を奏する。
また、本発明によれば、カテゴリーに分類した単語を階層化した情報を記憶したデータベースを参照し、各階層に属する単語に階層ごとにあらかじめ割り当てられた重みの情報に基づいてコンテンツに係る属性を判定することとしたので、各単語に重みを設定することにより各単語の重視度を変更し、コンテンツに係る属性を精度よく判定することができるとともに、属性の評価結果に基づいてコンテンツに適したインターネット広告などを配信する場合に、カテゴリーごとに重みを変化させることにより配信者のニーズに柔軟かつ効率的に対応することができるという効果を奏する。
また、本発明によれば、データベースは、単語間の意味の包括関係に基づいて階層化した単語の情報を記憶したこととしたので、単語間の意味の包括関係に基づいて各単語の重みを適切に設定でき、コンテンツに係る属性を精度よく判定することができるという効果を奏する。
また、本発明によれば、各階層に属する単語に階層ごとにあらかじめ割り当てられた重みは、前記包括関係の上位にある単語ほど大きいこととしたので、上位概念の単語を含んだカテゴリーを下位概念の単語を含んだカテゴリーよりも重視して、コンテンツに係る属性を効果的に判定することができるという効果を奏する。
また、本発明によれば、データベースにおけるカテゴリーのインデックスとなる単語が他のカテゴリーに属さないこととしたので、カテゴリーの判定ができなくなるのを防ぎ、コンテンツに係る属性を効果的に判定することができるという効果を奏する。
また、本発明によれば、地域のカテゴリーに地域に係る単語または地域に係る単語以外の単語を分類した情報を記憶したデータベースを参照し、コンテンツまたはコンテンツに対応するメタデータに含まれる単語を地域のカテゴリーに分類した分類情報に基づいてコンテンツに係る地域の属性を判定することとしたので、コンテンツに係る地域の属性を効果的に判定することができ、特に、メタデータに含まれる単語を地域のカテゴリーに分類した分類情報に基づいてコンテンツに係る地域の属性を判定する場合には、画像や動画など文字テキスト以外のコンテンツに係る情報も扱うことができるという効果を奏する。
また、本発明によれば、コンテンツまたはコンテンツに対応するメタデータに含まれる緯度経度情報に基づいて当該コンテンツに係る地域の属性を判定し、判定した属性に係る情報をコンテンツに係る情報として記憶することとしたので、緯度経度情報に基づいてコンテンツに係る地域の属性を効率的に判定することができるという効果を奏する。
また、本発明によれば、コンテンツに係る地域の属性と当該コンテンツの内容を分類したカテゴリーの属性とを判定することとしたので、コンテンツの属性を異なる側面から判定することができ、属性情報の利用範囲を拡大することができるという効果を奏する。
また、本発明によれば、単語を感情、感覚または情緒に係るカテゴリーに分類した情報を記憶したデータベースを参照し、コンテンツまたはコンテンツに対応するメタデータに含まれる単語を分類することにより得られた感情、感覚または情緒に係るカテゴリーに係る情報に基づいて感情、感覚または情緒に係るコンテンツの属性を判定することとしたので、コンテンツの属性またはコンテンツにアクセスするユーザの属性の判定結果に基づいてインターネット広告などを配信する場合に、「ぬくもり」や「やすらぎ」などといったユーザの世界観、生活シーン、テイストなどに対応するインターネット広告を配信できるよう広告主がカスタマイズすることができるという効果を奏する。
また、本発明によれば、記憶される第2のコンテンツに係る情報は、第n(n=2,3,・・・,m:mは2以上の自然数)のコンテンツにリンクされた第n+1のコンテンツに係る情報に基づいて決定された情報であることとしたので、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価の精度を制御することができるという効果を奏する。
また、本発明によれば、nの値はユーザにより任意に設定されることとしたので、要求される属性の評価精度をユーザが任意に設定することができるという効果を奏する。
また、本発明によれば、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価する場合に、所定の条件に合致するコンテンツに係る情報を評価に用いる情報から除外することとしたので、更新頻度の低いコンテンツやコンテンツの内容が他のコンテンツとは大きく異なるコンテンツ、あるいは、特定のドメインに属するコンテンツの属性などをコンテンツの属性評価に用いないことにより、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価に対するリンクスパムやトラックバックスパムの影響を除去し、評価精度を高めることができるという効果を奏する。
また、本発明によれば、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価したのち、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性をコンテンツに対応するメタデータとして記憶することとしたので、新たに評価された属性をメタデータとして記憶することにより、いつでも精度よく評価された属性を参照することができるようになるという効果を奏する。
また、本発明によれば、評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性と、第1のコンテンツにアクセスするユーザに係る情報または第1のコンテンツの出力をおこなうウェブブラウザに係る情報とを対応付けて記憶することとしたので、記憶した情報を属性が評価された第1のコンテンツにアクセスするユーザ層の分析に役立てることができるという効果を奏する。
また、本発明によれば、評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性、および、第2のコンテンツまたは第2のコンテンツに対応するメタデータに含まれる単語に基づいて、単語をカテゴリーに分類した情報を記憶したデータベースを構築することとしたので、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価結果に基づいて、コンテンツ間のリンクにより対応付けられたカテゴリーと単語とからなるデータベースを作成することができ、作成したデータベースをそれ以降の属性の評価に利用することができるという効果を奏する。
また、本発明によれば、評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性、および、第n(n=2,3,・・・,m:mは2以上の自然数)のコンテンツまたは第nのコンテンツに対応するメタデータに含まれる単語に基づいて、単語をカテゴリーに分類した情報を記憶したデータベースを構築することとしたので、何段階にもリンクされたコンテンツまたはコンテンツに対応するメタデータに含まれる単語から、コンテンツ間のリンクにより対応付けられたカテゴリーと単語とからなるデータベースを作成することができ、作成したデータベースをそれ以降の属性の評価に利用することができるという効果を奏する。
また、本発明によれば、コンテンツの検索要求を検索キーワードとなる単語とともに受け付けた場合に、構築されたデータベースを参照して検索キーワードとなる単語が属するカテゴリーを抽出し、抽出したカテゴリーに属する単語を検索キーワードに追加することによりコンテンツの検索をおこなうこととしたので、精度よく評価された属性に基づいてコンテンツの検索を効果的におこなうことができるという効果を奏する。
また、本発明によれば、コンテンツの検索要求を検索キーワードとなる単語および前記データベースにおけるカテゴリーの指定とともに受け付けた場合に、指定されたカテゴリーに属する単語を検索キーワードに追加することによりコンテンツの検索をおこなうこととしたので、精度よく評価された属性およびカテゴリーの情報に基づいてコンテンツの検索を効果的におこなうことができるという効果を奏する。
また、本発明によれば、コンテンツの検索要求を検索キーワードとなる単語とともに受け付けた場合に、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価結果を取得し、取得した属性および検索キーワードとなる単語を検索キーワードとして検索をおこなうこととしたので、コンテンツを巡回したりコンテンツの検索をおこなったりしてコンテンツの属性を収集することなく、精度よく評価された属性に基づいてコンテンツの検索を効果的におこなうことができるという効果を奏する。
また、本発明によれば、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価結果をデータベースに記憶し、コンテンツのメタデータに記述された名前空間に基づく第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の参照要求を受信した場合に、参照要求がなされた第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を出力することとしたので、メタデータに記述された名前空間を利用することにより、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の情報を効率的に取得することができるという効果を奏する。
また、本発明によれば、コンテンツのメタデータに記述された名前空間に基づく第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の参照要求を受信したのを契機として、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することとしたので、メタデータに記述された名前空間を利用して、リアルタイムで評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の情報を取得することができるという効果を奏する。
また、本発明によれば、ユーザにより入力されたコンテンツの検索キーワードに基づいて評価した第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価結果をさらにデータベースに記憶し、コンテンツのメタデータに記述された名前空間に基づく第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の参照要求を受信した場合に、参照要求がなされた第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を出力することとしたので、メタデータに記述された名前空間を利用して、ユーザが入力した検索キーワードの情報をさらに加味することにより精度よく評価されたコンテンツに係る属性および当該コンテンツにアクセスするユーザに係る属性を効率的に取得することができるという効果を奏する。
また、本発明によれば、評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性に基づいて所定のコンテンツを配信することとしたので、インターネット広告などを効果的に配信することができるという効果を奏する。
また、本発明によれば、コンテンツが配信された場合に、配信されたコンテンツにアクセスするユーザに係る情報と配信されたコンテンツの属性または当該コンテンツにアクセスするユーザの属性とを対応付けて記憶することとしたので、記憶した情報を配信されたコンテンツにアクセスするユーザ層の分析に役立てることができるという効果を奏する。
また、本発明によれば、同一のユーザまたは同一のウェブブラウザに対して配信したコンテンツの属性または当該コンテンツにアクセスするユーザの属性の頻度をさらに記憶することとしたので、記憶した情報をユーザによりアクセスされるコンテンツの属性または当該コンテンツにアクセスするユーザの属性の分析に役立てることができるという効果を奏する。
また、本発明によれば、コンテンツが配信された場合に、配信されたコンテンツにアクセスしたユーザの当該コンテンツに対する反応状況に係る情報を記憶することとしたので、記憶した情報を配信されたコンテンツに対するユーザの反応の分析に役立てることができるという効果を奏する。
また、本発明によれば、ユーザにより過去の所定の時間内に入力されたコンテンツの検索キーワードに係る情報を記憶し、記憶したコンテンツの検索キーワードに係る情報に基づいてコンテンツに係る属性またはコンテンツにアクセスするユーザに係る属性を評価することとしたので、検索キーワードを用いてコンテンツに係る属性または当該コンテンツにアクセスするユーザに係る属性を動的に、自動的に、客観的に評価することにより、評価精度を高めることができるという効果を奏する。
まず、本発明に係る属性評価処理の概念について説明する。図1は、本発明に係る属性評価処理の概念を説明する図である。この属性評価処理においては、評価対象となるウェブサイト内のコンテンツの属性および当該コンテンツにアクセスするユーザの属性を、当該コンテンツにリンクされたコンテンツの属性に基づいて評価する処理をおこなう。
ここで、コンテンツの属性とは、たとえば、コンテンツの内容に基づいてコンテンツがカテゴリーに分類された場合のコンテンツが属するカテゴリーのことである。また、ユーザの属性とは、たとえば、コンテンツにアクセスするユーザの興味のことである。
図1には、属性の評価対象となるウェブサイト10の評価対象コンテンツに、6つのウェブサイト11〜16のコンテンツがリンクされている場合が示されている。ここで、ウェブサイト10の評価対象コンテンツと6つのウェブサイト11〜16のコンテンツとの間のリンクは、ハイパーリンク、または、コンテンツにおいてトラックバックが実行されることにより張られたリンクである。
そして、ウェブサイト10の評価対象コンテンツおよび各ウェブサイト11〜16のコンテンツには、属性および属性に対する重みが割り当てられている。属性は、ウェブサイトのコンテンツまたはメタデータを解析することにより評価されたコンテンツが属するカテゴリーである。
また、メタデータとは、ウェブサイト内のコンテンツに係る情報を記述したデータである。たとえば、ウェブログにおいては、ウェブサイトに掲載された記事に対して作成されるRSS(RDF Site Summary)のことである。
図2は、ウェブサイトに掲載されたエントリ(記事)に対して作成されたRSSの一例を示す図である。図2には、あるウェブサイトに掲載されたエントリ(記事)のメタデータであるRSS20と、そのエントリ(記事)にトラックバックしたウェブサイトに掲載されたエントリ(記事)のメタデータであるRSS21a〜21cとが示されている。
RSS20では、はじめにXML名前空間を宣言しており、XML名前空間を利用した拡張性がRSSの重要な特徴である。また、独自の要素型を追加することにより、画像コンテンツやコンテンツが関連する地域の情報などをコンテンツの属性情報としてメタデータに含め、それらの情報を利用することができるようになる。本発明において、さまざまな属性によりコンテンツを定義することができるのもこの特徴による。
また、トラックバックとは、あるウェブサイトに掲載された記事に関連した記事をウェブサイトに掲載した場合に、そのことを元の記事を掲載しているウェブサイトのサーバに通知する処理である。具体的には、リンク元のURI(Uniform Resource Identifier)や記事の内容の要約などを元の記事を掲載しているウェブサイトのサーバに通知する。これにより、リンク先のサーバは、自らが提供しているウェブサイトの記事にリンクされたウェブサイトの記事の存在を把握することができる。
図2において、「trackback:ping」により指定されるURIは、自エントリ(記事)にトラックバックするときのために参照されるURIであり、「trackback:about」により指定されるURIは、自エントリ(記事)からトラックバックした場合の相手エントリのURIである。ここで、「trackback:about」によるURIの指定は複数おこなうことができる。
このように、本発明は、トラックバックの仕組みを有効に活用できることが特徴であり、トラックバックの仕組みを利用することにより、トラックバックによりリンクされたエントリを容易に発見することができる。
また、エントリ単位でRSSを有するので、ウェブサイト全体の情報を収集するのではなく、トラックバックによりリンクされたエントリの情報のみを収集すればよいので、情報収集コストを低減できる。
図1の説明に戻ると、本例の場合、ウェブサイト10の評価対象コンテンツの属性に対する重み、および、各ウェブサイト11〜16のコンテンツの属性に対する重みは、それぞれのウェブサイトのコンテンツの被リンク数により決定される。たとえば、ウェブサイト10の評価対象コンテンツは6つのウェブサイト11〜16のコンテンツにリンクされているので重みは「6」となる。
そして、この属性評価処理においては、ウェブサイト10の評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性を、ウェブサイト10の評価対象コンテンツにリンクされたウェブサイト11〜16のコンテンツの属性、および、コンテンツの属性の重みに基づいて評価する。
図3は、ウェブサイト10の評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性を評価するために用いられる属性評価表30の一例を示す図である。図3に示すように、この属性評価表30は、属性、計算式、計算結果および属性評価結果の各項目を有する。
属性は、ウェブサイト10の評価対象コンテンツおよびウェブサイト11〜16のコンテンツのそれぞれについて属性評価をおこなった結果得られた属性の情報である。計算式は、属性ごとにウェブサイト10〜16のコンテンツの属性に係る重みの和をとった計算式である。
計算結果は、計算式により計算された重みの和の計算結果である。属性評価結果は、ウェブサイト10の評価対象コンテンツの属性または評価対象コンテンツにアクセスするユーザの属性を評価した結果であり、評価結果の数字が最も大きい属性がウェブサイト10の評価対象コンテンツの属性または評価対象コンテンツにアクセスするユーザの属性として選択される。
このように、ウェブサイト10の評価対象コンテンツにリンクされたウェブサイト11〜16のコンテンツに係る属性情報に基づいて、ウェブサイト10の評価対象コンテンツに係る属性または評価対象コンテンツにアクセスするユーザに係る属性を評価することとしたので、ウェブサイト10の評価対象コンテンツに係る属性または評価対象コンテンツにアクセスするユーザに係る属性を精度よく評価することができる。
また、この属性評価処理の大きな特徴として、評価対象コンテンツに係る属性または評価対象コンテンツにアクセスするユーザに係る属性の評価をウェブサイト単位ではなくコンテンツ単位でおこなうことができる点がある。
すなわち、トラックバック処理は、さまざまな記事や画像、動画などが含まれたウェブサイト単位ではなく、個々の記事や画像、動画単位で実行することができるため、ウェブサイト全体の情報を収集するのではなく、トラックバック処理によりリンクされたコンテンツの情報のみを収集すればよいので、情報収集コストやインターネットトラフィック、情報の解析時間、情報を収集するサーバあるいは情報を解析するサーバに係る負荷などを低減することができる。
また、コンテンツの属性をメタデータを解析することにより評価する場合には、記事や画像、動画などのメタデータの情報のみを収集すればよいため、上述した効果がさらに顕著に現れるようになる。
つぎに、本実施例に係る属性評価処理の処理手順の概略について説明する。図4は、本実施例に係る属性評価処理の処理手順の概略について説明する図である。図4に示すように、この属性評価処理の処理手順は、「ウェブサイトからのデータ取得」、「ウェブサイトのデータ解析」、「ウェブサイトのデータ分類」、「ウェブサイトの自己属性評価」、および、「ウェブサイトの重み決定」の5つの基本プロセスを含む。ここでは、これらを基本処理フローと呼ぶこととする。
まず、「ウェブサイトからのデータ取得」プロセスでは、評価対象とするウェブサイト(1)のメタデータ、コンテンツ、被リンク情報、ドメインなどの情報を情報収集をおこなうエージェントなどが取得する。ここで、ドメインの情報とは、対象としているウェブサイトが属するネットワークドメインのことである。
「ウェブサイトのデータ解析」プロセスでは、「ウェブサイトからのデータ取得」プロセスにおいて取得されたコンテンツの情報(3)に対してテキスト構造解析やテキスト処理などのコンテンツ解析(7)がおこなわれ、コンテンツの属性が抽出される。コンテンツの情報(3)とは、属性の評価対象とするウェブサイトの中身そのものである。
また、取得されたメタデータ(4)には、属性の評価対象とするウェブサイトのコンテンツの属性、地域属性、内容の要約などの情報が含まれている。メタデータが、RDF(Resource Description Framework)のように、リソース表現の枠組みが標準化されている場合、メタデータ(8)の解析や以下で説明する属性分類(10)は、データの受け渡し程度に簡素化することができるが、標準化されていない場合には、テキスト構造解析やテキスト処理などのメタデータ解析過程(8)を経て、コンテンツの属性が抽出される。
「ウェブサイトのデータ分類」プロセスでは、「ウェブサイトのデータ解析」プロセスにおいて抽出されたコンテンツの属性が、語彙を分類したシソーラスデータに基づいて所定のカテゴリーに分類される(9)。同様に、メタデータの属性も、シソーラスデータを参照して所定のカテゴリーに分類される(10)。
「ウェブサイトの自己属性評価」プロセスでは、コンテンツの属性を分類した結果(9)と、メタデータの属性を分類した結果(10)とから、属性の評価対象とするウェブサイトのカテゴリー属性や地域属性の自己分類が決定される(12)。なお、地域属性の自己分類の決定については変形例1で詳しく説明する。
「ウェブサイトの重み決定」プロセスでは、属性の評価対象とするウェブサイトの重みの評価をおこなう(11)。具体的には、図1で説明したように、ウェブサイトのコンテンツの被リンク数を基にして重み(13)を決定する。重みの評価段階は、10段階、100段階など任意に決定することができる。
ただし、重みの決定方法は、これに限定されず、「ウェブサイトからのデータ取得」プロセスで取得されるドメインやURIなどに対応付けてあらかじめ設定された重みの指標を参照することにより決定することとしてもよい。
また、調査や測定により得られたウェブサイトのPV(Page View)数の大小などに基づいて重みを決定することとしてもよい。また、被リンク数に加えて、リンク元のウェブサイトの重みを考慮して属性の評価対象とするウェブサイトの重みを決定することとしてもよい。また、第三者などにより提供されるウェブサイトのランク情報を用いてランクに応じて重みを決定することとしてもよい。
一方、情報収集をおこなうエージェントなどにより取得された被リンク情報には、リンク元のウェブサイトのURIの情報が含まれる。ここで、このURIにより特定されるウェブサイトの全部あるいは代表的なウェブサイトに対して、あるいは、処理時間に係る制約から限定された数のウェブサイトに対して上記基本処理をおこなうことにより、リンク元のウェブサイトのカテゴリー属性や地域属性の自己分類(15)および重み(16)を決定することができる。
このような処理により、「属性の評価対象とするウェブサイトの自己分類属性」、「属性の評価対象とするウェブサイトの重み」、「リンク元のウェブサイトの自己分類属性」、「リンク元のウェブサイトの重み」の情報が得られる。そして、リンク情報とリンク元のウェブサイトの情報とを用いて対象としているウェブサイトの属性を評価することにより、客観的で公正な評価が可能になる。
つぎに、本実施例に係る属性評価システム50の機能構成について説明する。図5は、本実施例に係る属性評価システム50の機能構成を示す図である。図5に示すように、この属性評価システム50は、外部ウェブサーバ40a〜40cとインターネット60を介して接続されている。
外部ウェブサーバ40a〜40cは、属性評価システム50の外部でウェブサイトの閲覧サービスを提供しているサーバである。属性評価システム50は、ウェブサイトにおけるコンテンツの閲覧サービスを提供するとともに、閲覧サービスを提供するコンテンツおよび当該コンテンツにアクセスするユーザの属性を評価するシステムである。
この属性評価システム50は、ウェブサーバ70a〜70c、情報収集サーバ80、データ解析サーバ90、属性評価サーバ100および広告サーバ110がLAN(Local Area Network)120を介して接続された構成となっている。また、ウェブサーバ70a〜70cおよび情報収集サーバ80は、外部ウェブサーバ40a〜40cとインターネット60を介して接続されている。
ウェブサーバ70a〜70cは、ウェブサイト内のコンテンツの閲覧サービスを提供するサーバである。このウェブサーバ70a〜70cは、ウェブサイトを構築するHTMLデータおよびウェブサイトに対するユーザのアクセス履歴であるアクセスログを記憶している。
情報収集サーバ80は、他のサーバにアクセスし、ウェブサイトのコンテンツ間に設定されたリンクの情報や、ウェブサイト内のコンテンツのメタデータの情報、ウェブサイト内のコンテンツの情報などを収集するサーバである。この情報収集サーバ80は、データ送受信部800、情報収集部801、記憶部802および制御部803を有する。
データ送受信部800は、他のサーバとの間でインターネット60またはLAN120を介してさまざまなデータの授受をおこなうネットワークインターフェースである。情報収集部801は、インターネット60に接続された外部ウェブサーバ40a〜40cやウェブサーバ70a〜70cにアクセスし、ウェブサイトのコンテンツ間に設定されたリンクの情報や、ウェブサイト内のコンテンツのメタデータの情報、ウェブサイト内のコンテンツの情報などを収集し、収集した情報を記憶部802に記憶する。
記憶部802は、ハードディスク装置などの記憶デバイスである。この記憶部802は、シソーラスデータ802a、リンク情報802b、メタデータ情報802c、コンテンツ情報802d、属性/重み解析情報802eを記憶している。
シソーラスデータ802aは、データ解析サーバ90がウェブサイト内のコンテンツまたはコンテンツのメタデータに対して形態素解析を実行し、コンテンツの属性を評価する際にデータ解析サーバ90により参照されるデータである。図6は、図5に示したシソーラスデータ802aの一例を示す図である。
図6に示すように、このシソーラスデータ802aは、単語が「音楽」や「自然」などのカテゴリーに分類され、さらに、各カテゴリーに属する単語が単語の意味の包括関係に基づいて各階層に分けられている。そして、各階層には、各階層に属する単語に割り当てられる重みの情報が記憶される。
具体的には、上位の階層には、より広い意味範囲を有する単語が登録され、下位の階層にはより狭い意味範囲を有する単語が登録される。ここで、最上位の階層には、単語が1つだけ登録される。この最上位の単語は、各カテゴリーのインデックスとなる単語であり、この単語を以降「インデックス語」と呼ぶことにする。このインデックス語は、他のカテゴリーに属することがないように登録されている。
たとえば、図6の例では、最上位階層である階層1に「音楽」というインデックス語が登録されている。そして、階層2には、「音楽」というインデックス語の狭義語である「ロック」という単語が登録され、階層3には、「ロック」という単語の狭義語である「ハードロック」という単語が登録され、階層4には、「ハードロック」という単語の狭義語である「ヘビメタ」という単語が登録されている。また、階層1、階層2、階層3及び階層4には、重み「6」、「4」、「2」および「1」がそれぞれ割り当てられている。
なお、ここでは、階層の数が4つである場合を示しているが、階層の数は任意に設定することができる。また、インデックス語以外の単語は複数のグループに分類されることもある。これは、たとえば、「メモリ」という単語が、「コンピュータ」をインデックス語とするカテゴリーと、「心理」をインデックス語とするカテゴリーとの2つに分類されるような場合である。
図5の説明に戻ると、リンク情報802bは、コンテンツ間に設定されたリンクの情報を記憶したものである。このリンクの情報は、情報収集部801により収集されたものである。図7は、図5に示したリンク情報802bの一例を示す図である。
図7に示すように、このリンク情報802bは、リンク識別番号、リンク元コンテンツURI、リンク先コンテンツURIの情報を記憶している。リンク識別番号は、コンテンツ間に設定された各リンクを識別する番号の情報である。リンク元コンテンツURIは、リンク元のコンテンツのURIの情報である。リンク先コンテンツURIは、リンク先のコンテンツのURIの情報である。
図7の例では、URIが「www.xxx.co.jp」であるコンテンツに、URIが「www.aaa.com」、「www.bbb.co.jp」、・・・、などのURIを有するコンテンツがリンクされた場合が示されている。
図5の説明に戻ると、メタデータ情報802cは、ウェブサイト内のコンテンツのメタデータの情報を記憶したものである。このメタデータの情報は、情報収集部801により収集されたものである。図8は、図5に示したメタデータ情報802cの一例を示す図である。
図8に示すように、このメタデータ情報802cは、コンテンツ名、URI、メタデータの情報を記憶している。コンテンツ名は、メタデータの情報に対応するコンテンツの名称である。URIは、収集されたメタデータに対応するコンテンツのURIの情報である。メタデータは、収集されたメタデータの情報である。
なお、ここでは、ウェブログで利用されるRSSの情報をメタデータの情報として記憶した場合を示しているが、HTML文書に対するRSSなどの情報をメタデータとして収集して記憶することとしてもよい。
図5の説明に戻ると、コンテンツ情報802dは、ウェブサイト内のコンテンツの情報を記憶したものである。このコンテンツの情報は、情報収集部801により収集されたものである。図9は、図5に示したコンテンツ情報802dの一例を示す図である。
図9に示すように、このコンテンツ情報802dは、コンテンツ名、URIおよびコンテンツの情報を記憶している。コンテンツ名は、収集されたウェブサイト内のコンテンツの名称である。URIは、コンテンツのURIの情報である。メタデータは、収集されたコンテンツの情報である。
図5の説明に戻ると、属性/重み解析情報802eは、データ解析サーバ90がウェブサイト内のコンテンツおよびメタデータを解析することにより評価したコンテンツの属性、および、コンテンツの被リンク数により決定されたコンテンツの重みの情報などを記憶したものである。
図10は、図5に示した属性/重み解析情報802eの一例を示す図である。図10に示すように、この属性/重み解析情報802eは、コンテンツ名、リンク識別番号、重みおよび属性の情報を記憶している。
コンテンツ名は、属性を解析するコンテンツの名称である。リンク識別番号は、コンテンツ間に設定された各リンクを識別する番号の情報である。重みは、コンテンツの被リンク数により決定されたコンテンツの属性の重みの情報である。属性は、コンテンツおよびメタデータを解析することにより評価されたコンテンツの属性の情報である。
なお、本実施例では、コンテンツの属性の重みをコンテンツの被リンク数により決定することとしたが、対象としているコンテンツにリンクされたコンテンツの属性の重みを加味して、対象としているコンテンツの属性の重みを決定してもよい。たとえば、対象としているコンテンツにリンクされたコンテンツの属性の重みの和を、対象としているコンテンツの属性の重みとして決定することとしてもよい。
また、対象としているコンテンツのPV(Page View)の大小や、対象としているコンテンツが属するネットワークドメインのドメイン名、コンテンツの更新頻度、あるいは、第三者により評価されたコンテンツのページランクの情報に基づいてコンテンツの属性の重みを決定してもよい。
具体的には、PV、ドメイン名、更新頻度、あるいは、ページランクと重みとの対応関係を記憶したデータベースを参照し、対象としているコンテンツのPV、ドメイン名、更新頻度、あるいは、ページランクの情報を収集して重みを決定する処理をおこなう。さらには、各コンテンツの属性の重みを手作業で任意に設定することとしてもよい。
図5の説明に戻ると、制御部803は、情報収集サーバ80を全体制御する制御部であり、各機能部間のデータの授受などを司る。
データ解析サーバ90は、コンテンツの属性および属性の重み、また、コンテンツにリンクされているコンテンツの属性および属性の重みをコンテンツおよびコンテンツに対応するメタデータに基づいて評価するサーバである。このデータ解析サーバ90は、データ送受信部900、属性/重み解析部901、記憶部902および制御部903を有する。
データ送受信部900は、他のサーバとの間でLAN120を介してさまざまなデータの授受をおこなうネットワークインターフェースである。属性/重み解析部901は、コンテンツおよびメタデータを解析することにより各コンテンツの属性およびコンテンツの属性の重みを設定する処理をおこなう。
具体的には、属性/重み解析部901は、情報収集サーバ80からシソーラスデータ802a、リンク情報802b、メタデータ情報802c、コンテンツ情報802dを取得する。そして、属性/重み解析部901は、メタデータおよびコンテンツに対して形態素解析をおこなう。
これを具体的に説明すると、たとえば、メタデータあるいはコンテンツに「僕は今ブログにはまっています。」、「パソコンのメモリを増設しました。」、「先日、ウェブサイトを立ち上げました。」という文が含まれていた場合を考える。この場合、属性/重み解析部901は、それらの文に形態素解析を適用し、各文を以下に示すように形態素に分割する。
「僕(名詞−代名詞−一般)/は(助詞−係助詞)/今(名詞−副詞可能)/ブログ(名詞−一般)/に(助詞−格助詞−一般)/はまっ(動詞−自立)/て(助詞−接続助詞)/い(動詞−非自立)/ます(助動詞)/。(記号−句点)」
「パソコン(名詞−一般)/の(助詞−連体化)/メモリ(名詞−一般)/を(助詞−格助詞−一般)/増設(名詞−サ変接続)/し(動詞−自立)/まし(助動詞)/た(助動詞)/。(記号−句点)」
「先日(名詞−副詞可能)/、(記号−読点)/ウェブサイト(名詞−一般)/を(助詞−格助詞−一般)/立ち(動詞−自立)/上げ(動詞−自立)/まし(助動詞)/た(助動詞)/。(記号−句点)」
そして、属性/重み解析部901は、形態素の中から、一般名詞(名詞−一般)のみを抽出する。すなわち、この例では、属性/重み解析部901は、「ブログ」、「パソコン」、「メモリ」および「ウェブサイト」を抽出する。
その後、属性/重み解析部901は、シソーラスデータ802aから、抽出した各単語が属するカテゴリーのインデックス語を検索する処理をおこなう。また、属性/重み解析部901は、シソーラスデータ802aから、各単語に対応する重みの情報を取得し、各単語に重みを割り当てる。
たとえば、「ブログ」、「パソコン」、「メモリ」および「ウェブサイト」の各単語が「IT」というインデックス語を有するカテゴリーに属し、各単語の重みがそれぞれ「1」、「8」、「3」、「4」であるものとする。また、「メモリ」という単語は「心理」というインデックス語を有するカテゴリーにも属し、その単語の重みが「3」であるものとする。
この場合、属性/重み解析部901は、「IT」というインデックス語を有するカテゴリーの重みの和(上記例では、1+8+3+4=16)と、「心理」というインデックス語を有するカテゴリーの重みの和(上記例では、3)を算出する。そして、この和の大きいカテゴリーのインデックス語(上記例では、「IT」)をコンテンツの属性として設定する処理をおこなう。
なお、ここでは「メモリ」という単語が「IT」というインデックス語を有するカテゴリーおよび「心理」というインデックス語を有するカテゴリーの双方に属するものとして各カテゴリーでそれぞれ重みの和を算出しているが、形態素解析を実行して「メモリ」という単語の前後の文章から単語が属するカテゴリーを推定し、推定したカテゴリーに単語「メモリ」を分類することとしてもよい。
また、ここでは、シソーラスデータ802aにおいて、単語が属する各階層にそれぞれ「6」、「4」、「2」、「1」などの値が割り当てられているが、たとえば、階層1を「100%」とした場合に階層2、階層3、階層4には、75%、50%、25%の重みを割り当てるなど、重みを各階層に相対的に割り当てることとしてもよい。
また、属性/重み解析部901は、リンク情報802bを参照して各コンテンツの被リンク数を算出し、被リンク数をコンテンツの属性の重みとして設定する処理をおこなう。
なお、ここでは、被リンク数をそのままコンテンツの属性の重みとして利用しているが、評価対象コンテンツの属性をより重視するために、評価対象コンテンツの属性の重みが評価対象コンテンツにリンクされたコンテンツの属性の重みよりも大きくなるように重みを調整することとしてもよい。
その後、属性/重み解析部901は、コンテンツおよびメタデータを解析することにより設定した各コンテンツの属性およびコンテンツの属性の重みの情報を情報収集サーバ80に送信して、属性/重み解析情報802eとして記憶させる処理をおこなう。
記憶部902は、ハードディスク装置などの記憶デバイスである。この記憶部902は、属性/重み解析部901などが扱うデータを記憶する処理をおこなう。制御部903は、データ解析サーバ90を全体制御する制御部であり、各機能部間のデータの授受などを司る。
属性評価サーバ100は、情報収集サーバ80により収集されたリンク情報802b、および、データ解析サーバ90によりコンテンツおよびメタデータの解析が実行されることにより得られた属性/重み解析情報802eを取得し、評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性を評価対象コンテンツにリンクされたコンテンツの属性および重みの情報に基づいて評価する処理をおこなう。
この属性評価サーバ100は、データ送受信部1000、リンク検出部1001、属性評価部1002、記憶部1003および制御部1004を有する。
データ送受信部1000は、他のサーバとの間でLAN120を介してさまざまなデータの授受をおこなうネットワークインターフェースである。リンク検出部1001は、情報収集サーバ80からリンク情報802bを取得して、コンテンツ間のリンクの状態を検出する処理をおこなう。具体的には、リンク検出部1001は、あるコンテンツに対してリンクされているコンテンツを検出する。
属性評価部1002は、コンテンツの属性および当該コンテンツにアクセスするユーザの属性を、当該コンテンツにリンクされたコンテンツの属性および重みの情報に基づいて評価する処理をおこなう。
具体的には、属性評価部1002は、評価対象コンテンツおよび評価対象コンテンツにリンクされたコンテンツの属性および重みの情報である属性/重み解析情報802eを情報収集サーバ80から取得し、図3で説明したような方法にしたがって、重みの和が最大となる属性を抽出し、抽出された属性を評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性として設定する。
記憶部1003は、ハードディスク装置などの記憶デバイスである。この記憶部1003は、属性評価情報1003aを記憶している。属性評価情報1003aは、属性評価部1002により評価されたコンテンツの属性および当該コンテンツにアクセスするユーザの属性に係る情報を記憶したものである。
図11は、図5に示した属性評価情報1003aの一例を示す図である。図11に示すように、この属性評価情報1003aは、コンテンツ名、URI、属性および重みの情報を記憶している。
コンテンツ名は、評価対象コンテンツの名称である。URIは、評価対象コンテンツのURIの情報である。属性は、属性評価部1002により評価されたコンテンツの属性および当該コンテンツにアクセスするユーザの属性(興味)の情報である。重みは、コンテンツの被リンク数から算出された重みの情報である。
なお、ここでは、属性評価部1002が、評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性を属性評価情報1003aとして記憶部1003に記憶することとしたが、さらに、評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性に係る記述を評価対象コンテンツのメタデータに追加して記憶することとしてもよい。すでにメタデータに属性が記述されている場合には、その属性を新たに評価された属性で書き換えて、その属性を記憶することとしてもよい。
図5の説明に戻ると、制御部1004は、属性評価サーバ100を全体制御する制御部であり、各機能部間のデータの授受などを司る。
広告サーバ110は、属性評価サーバ100により評価されたコンテンツの属性およびユーザの属性に基づいて、各コンテンツに適した広告を配信するサーバである。この広告サーバ110は、データ送受信部1100、記憶部1101、広告配信処理部1102および制御部1103を有する。
データ送受信部1100は、他の装置との間でLAN120を介してさまざまなデータの授受をおこなうネットワークインターフェースである。記憶部1101は、ハードディスク装置などの記憶デバイスである。この記憶部1101は、広告データ1101aおよび配信条件データ1101bを記憶している。
広告データ1101aは、ウェブサーバ70a〜70cが閲覧サービスを提供しているコンテンツに配信するインターネット広告のデータを記憶したものである。配信条件データ1101bは、インターネット広告を配信するコンテンツのURIや配信期間などのインターネット広告の配信条件を記憶したデータである。
広告配信処理部1102は、記憶部1101に記憶された配信条件データ1101bに基づいて、コンテンツに広告データ1101aに記憶されたインターネット広告を配信する処理をおこなう。制御部1103は、広告サーバ110を全体制御する制御部であり、各機能部間のデータの授受などを司る。
つぎに、本実施例に係る属性評価処理の処理手順について説明する。図12は、本実施例に係る属性評価処理の一例の処理手順を示すフローチャートである。
図12に示すように、まず、情報収集サーバ80の情報収集部801は、属性を評価する評価対象コンテンツにリンクされたコンテンツのリンクに係る情報を収集する(ステップS101)。続いて、情報収集部801は、リンク元およびリンク先のコンテンツおよびメタデータの情報を収集する(ステップS102)。
その後、データ解析サーバ90の属性/重み解析部901は、収集したコンテンツおよびメタデータに基づいて評価対象コンテンツの属性を判定する判定処理をおこなう(ステップS103)。
具体的には、属性/重み解析部901は、評価対象コンテンツおよびメタデータに対して形態素解析をおこなうことにより単語を抽出し、抽出した単語に対応するインデックス語および単語の重みをシソーラスデータ802aを参照して取得し、単語の重みの合計が最も大きくなるインデックス語を評価対象コンテンツの属性として設定する。
そして、属性/重み解析部901は、評価対象コンテンツにリンクされたコンテンツの数を評価対象コンテンツの属性の重みとして設定する処理をおこなう(ステップS104)。
続いて、属性/重み解析部901は、収集したコンテンツおよびメタデータに基づいて評価対象コンテンツにリンクが設定されたリンク元コンテンツの属性を判定する判定処理をおこなう(ステップS105)。
具体的には、属性/重み解析部901は、リンク元コンテンツおよびメタデータに対して形態素解析をおこなうことにより単語を抽出し、抽出した単語に対応するインデックス語および単語の重みをシソーラスデータ802aを参照して取得し、単語の重みの合計が最も大きくなるインデックス語をリンク元コンテンツの属性として設定する。
そして、属性/重み解析部901は、リンク元コンテンツにリンクされたコンテンツの数をリンク元コンテンツの属性の重みとして設定する処理をおこなう(ステップS106)。
その後、属性評価サーバ100の属性評価部1002は、リンク元コンテンツの属性情報を利用した評価対象ウェブサイトの属性評価処理をおこない(ステップS107)、この属性評価処理を終了する。
具体的には、属性評価部1002は、コンテンツおよびメタデータを解析することにより得られた評価対象コンテンツの属性および重みの情報と、評価対象コンテンツにリンクが設定されたリンク元コンテンツの属性および重みの情報とから、図3を用いて説明したように、評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性を評価する処理をおこなう。
つぎに、図12のステップS103で説明した評価対象コンテンツの属性判定処理の処理手順について詳細に説明する。図13は、評価対象コンテンツの属性判定処理の処理手順を詳細に説明するフローチャートである。
図13に示すように、まず、データ解析サーバ90の属性/重み解析部901は、情報収集サーバ80にコンテンツ情報802dとして記憶されたコンテンツの形態素解析を実行し(ステップS201)、その結果得られた形態素から一般名詞を抽出する(ステップS202)。
続いて、属性/重み解析部901は、情報収集サーバ80にメタデータ情報802cとして記憶されたメタデータの形態素解析を実行し(ステップS203)、その結果得られた形態素から一般名詞を抽出する(ステップS204)。
その後、属性/重み解析部901は、抽出した一般名詞が属するカテゴリーのインデックス語の情報、および、一般名詞が属する階層に割り当てられた重みの情報を取得する(ステップS205)。
そして、属性/重み解析部901は、一般名詞が属する階層に割り当てられた重みの合計値をカテゴリーごとに算出し(ステップS206)、合計値が最大となるカテゴリーのインデックス語を抽出する(ステップS207)。
その後、属性/重み解析部901は、抽出したインデックス語をコンテンツの属性として設定する処理をおこない(ステップS208)、この属性判定処理を終了する。
なお、ここでは、図12のステップS103で実行される評価対象コンテンツの属性判定処理の詳細について説明したが、図12のステップS105で実行されるリンク元コンテンツの属性判定処理も図13で説明した処理と同様にして実行される。
上述してきたように、本実施例では、情報収集サーバ80の記憶部802が、評価対象コンテンツにリンクが設定されたリンク元コンテンツに係る属性情報を記憶し、属性評価サーバ100の属性評価部1002が、記憶部802に記憶されたコンテンツに係る属性情報に基づいて、評価対象コンテンツに係る属性または評価対象コンテンツにアクセスするユーザに係る属性を評価することとしたので、評価対象コンテンツに係る属性および評価対象コンテンツにアクセスするユーザに係る属性を精度よく評価することができる。
また、本実施例では、情報収集サーバ80の記憶部802が、コンテンツおよびメタデータの解析により得られた評価対象コンテンツに係る属性の情報をさらに記憶し、属性評価サーバ100の属性評価部1002が、記憶部802に記憶された評価対象コンテンツに係る属性の情報、および、リンク元コンテンツに係る属性情報に基づいて、評価対象コンテンツに係る属性または評価対象コンテンツにアクセスするユーザに係る属性を評価することとしたので、リンク元コンテンツに係る属性情報に加えて評価対象コンテンツに係る属性の情報をさらに考慮することにより、評価対象コンテンツに係る属性または評価対象コンテンツにアクセスするユーザに係る属性を精度よく評価することができる。
また、本実施例では、情報収集サーバ80の記憶部802が、評価対象コンテンツ、および、リンク元コンテンツに係る属性の重みの情報をさらに記憶し、属性評価サーバ100の属性評価部1002が、記憶部802に記憶された属性情報および属性の重みの情報に基づいて、評価対象コンテンツに係る属性または評価対象コンテンツにアクセスするユーザに係る属性を評価することとしたので、各コンテンツの属性の重みを設定することにより、コンテンツの属性の重視度をコンテンツごとに変化させ、評価対象コンテンツに係る属性および評価対象コンテンツにアクセスするユーザに係る属性を精度よく評価することができる。
また、本実施例では、情報収集サーバ80の記憶部802が、評価対象コンテンツに係る属性の重みの情報、および、評価対象コンテンツに係る属性の重みよりも小さく設定されたリンク元コンテンツに係る属性の重みの情報をさらに記憶し、属性評価サーバ100の属性評価部1002が、記憶部802に記憶された属性情報および属性の重みの情報に基づいて、評価対象コンテンツに係る属性または評価対象コンテンツにアクセスするユーザに係る属性を評価することとしたので、評価対象コンテンツに係る属性をリンク元コンテンツに係る属性よりも重視することにより、評価対象コンテンツに係る属性および評価対象コンテンツにアクセスするユーザに係る属性を精度よく評価することができる。
また、本実施例では、データ解析サーバ90の属性/重み解析部901が、コンテンツに係る属性の重みを他のコンテンツによりリンクされた被リンク数、コンテンツにリンクされた他のコンテンツに係る重み、コンテンツのページビュー数、コンテンツに対応するドメイン名、または、コンテンツの更新頻度に基づいて決定し、情報収集サーバ80の記憶部802が、決定された重みの情報を記憶することとしたので、コンテンツに係る属性の重みを効果的に決定することができる。
また、本実施例では、評価対象コンテンツとリンク元コンテンツとの間に設定されたリンクは、ハイパーリンク、または、コンテンツに対してトラックバックが実行されることにより設定されたリンクであることとしたので、ハイパーリンクまたはトラックバック処理によりリンクが設定された評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザに係る属性を精度よく評価することができる。
また、本実施例では、データ解析サーバ90の属性/重み解析部901が、コンテンツまたはコンテンツに対応するメタデータに含まれる単語に基づいてコンテンツに係る属性を判定し、情報収集サーバ80の記憶部802が、判定された属性に係る情報を属性情報として記憶することとしたので、各コンテンツに係る属性を効果的に判定することができる。また、メタデータはコンテンツごとに持つことができるという特徴、および、トラックバックはコンテンツ単位で実行できるという特徴により、リンクされているコンテンツの全ページを評価する必要がなくなり、インターネットにおけるユーザエージェント(ロボット)の巡回コストを著しく低減できる。
また、本実施例では、データ解析サーバ90の属性/重み解析部901が、単語をカテゴリーに分類した情報を記憶したシソーラスデータ802aを参照し、コンテンツまたはメタデータに含まれる単語を分類したカテゴリーに係る情報に基づいて、コンテンツに係る属性を判定することとしたので、コンテンツまたはコンテンツに対応するメタデータに含まれる単語をカテゴリーに分類することにより、コンテンツに係る属性を効果的に判定することができる。
また、本実施例では、データ解析サーバ90の属性/重み解析部901が、カテゴリーに分類した単語を階層化した情報を記憶したシソーラスデータ802aを参照し、各階層に属する単語に階層ごとにあらかじめ割り当てられた重みの情報に基づいてコンテンツに係る属性を判定することとしたので、各単語に重みを設定することにより各単語の重視度を変更し、コンテンツに係る属性を精度よく判定することができる。
また、本実施例では、シソーラスデータ802aは、単語間の意味の包括関係に基づいて階層化した単語の情報を記憶したこととしたので、単語間の意味の包括関係に基づいて各単語の重みを適切に設定でき、コンテンツに係る属性を精度よく判定することができる。
また、本実施例では、シソーラスデータ802aにおいて各階層に属する単語に階層ごとにあらかじめ割り当てられた重みは、包括関係の上位にある単語ほど大きいこととしたので、上位概念の単語を含んだカテゴリーを下位概念の単語を含んだカテゴリーよりも重視して、コンテンツに係る属性を効果的に判定することができる。
また、本実施例では、シソーラスデータ802aにおける各カテゴリーのインデックス語は他のカテゴリーに属さないこととしたので、カテゴリーの判定ができなくなるのを防ぎ、コンテンツに係る属性を効果的に判定することができる。
また、本実施例では、属性評価サーバ100の属性評価部1002が、評価対象コンテンツに係る属性または評価対象コンテンツにアクセスするユーザに係る属性を評価したのち、評価対象コンテンツに係る属性または評価対象コンテンツにアクセスするユーザに係る属性をコンテンツに対応するメタデータとして記憶することとしたので、新たに評価された属性をメタデータとして記憶することにより、いつでも精度よく評価された属性を参照することができる。
また、本実施例では、属性評価サーバ100の属性評価部1002により評価された評価対象コンテンツに係る属性または評価対象コンテンツにアクセスするユーザに係る属性に基づいて、広告サーバ110の広告配信処理部1102が、インターネット広告のコンテンツを配信することとしたので、インターネット広告を効果的に配信することができる。
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施例にて実施されてもよいものである。以下に、上記実施例の種々の変形例について説明する。
(変形例1)
上記実施例では、コンテンツの属性がコンテンツの内容から判断されるカテゴリーである場合、および、ユーザの属性がユーザの興味である場合について説明してきたが、コンテンツを閲覧するユーザの地域をコンテンツの属性およびユーザの属性として判定することとしてもよい。
これにより、コンテンツにインターネット広告を配信するような場合に、コンテンツを閲覧するユーザの地域に適合したインターネット広告を配信することができるようになる。
具体的には、データ解析サーバ90の属性/重み解析部901が、評価対象コンテンツにリンクされたコンテンツおよびそのコンテンツのメタデータに含まれる地域名などの情報を抽出し、地域名などの単語と地域のカテゴリーに単語を分類した情報とを記憶したデータベースを参照して評価対象コンテンツにリンクされたコンテンツの地域のカテゴリーを評価し、属性評価サーバ100の属性評価部1002が、最も多かった地域のカテゴリーを評価対象コンテンツの地域の属性および評価対象コンテンツにアクセスするユーザの地域の属性として判定することとする。
また、属性評価部1002は、上記実施例で説明したように、単語の重みを加味して評価対象コンテンツの地域の属性および評価対象コンテンツにアクセスするユーザの地域の属性を判定することとしてもよい。
また、住所や建物名、レストラン名、あるいは、イベント名などの単語と、それらに関連する国や都道府県などの地域とを対応付けて記憶したデータベース(図示せず)を参照し、コンテンツやメタデータに含まれる単語から評価対象コンテンツの地域の属性および評価対象コンテンツにアクセスするユーザの地域の属性を判定することとしてもよい。
さらには、コンテンツが写真や動画などの画像であり、コンテンツのメタデータに画像が撮影された緯度や経度などの位置情報が含まれている場合に、データ解析サーバ90の属性/重み解析部901が、その位置情報を基にして評価対象コンテンツにリンクされたコンテンツの地域のカテゴリーを評価して情報収集サーバ80に記憶し、属性評価サーバ100の属性評価部1002が、情報収集サーバ80から地域のカテゴリーの情報を取得して最も多かった地域のカテゴリーを評価対象コンテンツの地域の属性および評価対象コンテンツにアクセスするユーザの地域の属性を判定することとしてもよい。
ここで、上記位置情報は、GPSが搭載されたデジタルカメラやカメラ付き携帯電話機などにより、撮影された画像のメタデータに登録されるものである。
また、属性評価サーバ100の属性評価部1002は、評価対象コンテンツの地域の属性および評価対象コンテンツにアクセスするユーザの地域の属性を判定するのに加えて、上記実施例で説明したように、コンテンツが属するカテゴリーをコンテンツの内容に基づいて判定することとしてもよい。
さらには、属性評価サーバ100の属性評価部1002が、上記処理の結果得られた地域の属性を基にして、地域と地域に関連する単語とを対応付けて記憶したデータベースを情報収集サーバ80に構築することとしてもよい。
具体的には、評価されたコンテンツの地域の属性およびコンテンツにアクセスするユーザの地域の属性をインデックス語とし、そのコンテンツにリンクされたコンテンツまたはそのコンテンツのメタデータから抽出された単語をインデックス語に属する単語としてデータベースに登録することとする。
また、評価された第1のコンテンツにリンクされた第2のコンテンツまたは第2のコンテンツのメタデータから抽出された単語だけでなく、さらに、第2のコンテンツにリンクされた第3のコンテンツまたは第3のコンテンツのメタデータから抽出された単語をインデックス語に属する単語としてデータベースに登録することとしてもよい。
以下同様に、第n(n=2,3,・・・,m:mは2以上の自然数)のコンテンツにリンクされた第n+1のコンテンツまたは第n+1のコンテンツに対応するメタデータに含まれる単語をインデックス語に属する単語としてデータベースに登録することとしてもよい。
このようにして構築されたデータベースは、上記実施例にて説明したように、データ解析サーバ90の属性/重み解析部901が、次回コンテンツの地域の属性およびコンテンツにアクセスするユーザの地域の属性を評価する際に利用される。また、データベースの構築は、属性が地域の属性である場合に限らず、その他の属性である場合にもデータベースの構築をおこなうこととしてもよい。
上述したように、本変形例1においては、データ解析サーバ90の属性/重み解析部901が、地域のカテゴリーに地域に係る単語または地域に係る単語以外の単語を分類した情報を記憶したデータベースを参照し、コンテンツまたはコンテンツに対応するメタデータに含まれる単語を地域のカテゴリーに分類した分類情報に基づいてコンテンツに係る地域の属性を判定することとしたので、コンテンツに係る地域の属性を効果的に判定することができ、特に、メタデータに含まれる単語を地域のカテゴリーに分類した分類情報に基づいてコンテンツに係る地域の属性を判定する場合には、画像や動画など文字テキスト以外のコンテンツに係る情報も扱うことができる。
また、本変形例1においては、データ解析サーバ90の属性/重み解析部901が、コンテンツまたはコンテンツに対応するメタデータに含まれる緯度経度情報に基づいて当該コンテンツに係る地域の属性を判定し、判定した属性に係る情報をコンテンツに係る情報として記憶することとしたので、緯度経度情報に基づいてコンテンツに係る地域の属性を効率的に判定することができる。
また、本変形例1においては、属性評価サーバ100の属性評価部1002が、コンテンツに係る地域の属性と当該コンテンツの内容を分類したカテゴリーの属性とを判定することとしたので、コンテンツの属性を異なる側面から判定することができ、属性情報の利用範囲を拡大することができる。
また、本変形例1においては、属性評価サーバ100の属性評価部1002が、評価された評価対象コンテンツに係る属性または評価対象コンテンツにアクセスするユーザに係る属性、および、評価対象コンテンツにリンクされたコンテンツまたは評価対象コンテンツにリンクされたコンテンツに対応するメタデータに含まれる単語に基づいて、単語をカテゴリーに分類した情報を記憶したデータベースを構築することとしたので、評価対象コンテンツに係る属性または評価対象コンテンツにアクセスするユーザに係る属性の評価結果に基づいて、コンテンツ間のリンクにより対応付けられたカテゴリーと単語とからなるデータベースを作成することができ、作成したデータベースをそれ以降の属性の評価に利用することができる。
また、本変形例1においては、属性評価サーバ100の属性評価部1002が、評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性、および、第n(n=2,3,・・・,m:mは2以上の自然数)のコンテンツまたは第nのコンテンツに対応するメタデータに含まれる単語に基づいて、単語をカテゴリーに分類した情報を記憶したデータベースを構築することとしたので、何段階にもリンクされたコンテンツまたはコンテンツに対応するメタデータに含まれる単語から、コンテンツ間のリンクにより対応付けられたカテゴリーと単語とからなるデータベースを作成することができ、作成したデータベースをそれ以降の属性の評価に利用することができる。
(変形例2)
また、上記実施例および変形例1では、コンテンツの属性またはコンテンツにアクセスするユーザの属性として、コンテンツの内容を分類したカテゴリーや、コンテンツが関連する地域を設定することとしているが、「ぬくもり」や「やすらぎ」などの人間の感覚や感情、情緒をコンテンツの属性またはコンテンツにアクセスするユーザの属性として設定することとしてもよい。
図14は、コンテンツの属性またはコンテンツにアクセスするユーザの属性として人間の感覚・感情・情緒を設定する処理を説明する図である。図14に示すように、この処理では、データ解析サーバ90の属性/重み解析部901が、コンテンツに対して形態素解析を実行することにより単語を抽出する。
そして、属性/重み解析部901は、人間の感覚・感情・情緒を表す単語(インデックス語)と一般名詞である単語とを対応付けて記憶したデータベース(図示せず)を参照し、抽出した単語に対応する感覚・感情・情緒を表す単語を検索し、検索された感覚・感情・情緒を表す単語をコンテンツの属性として設定する。
たとえば、上記データベースには、感覚・感情・情緒を表す単語である「ぬくもり」には、「郷土」、「家庭料理」、「くちびる」、「旅館」、「布団」、「手作り」などの一般名詞である単語が対応付けて記憶され、感覚・感情・情緒を表す単語である「やすらぎ」には、「介護」、「まんが」、「音楽」、「霊園」、「宿」、「居酒屋」などの一般名詞である単語が対応付けて記憶される。
また、人間の感覚・感情・情緒を表す単語としては、「ぬくもり」や「やすらぎ」以外にも、「あたたかみ」や「かわき」、「みえっぱり」、「派手な色」、「暖かい色」、「シャープ」、「クール」、「ファミリー」などの単語がデータベースに登録される。
ここで、コンテンツから抽出された単語から「ぬくもり」や「やすらぎ」などの複数の感覚・感情・情緒を表す単語が検索された場合には、コンテンツから抽出された単語がより多い方の感覚・感情・情緒を表す単語を選択するなどして、コンテンツの属性として決定する。あるいは、上記実施例に示したように、コンテンツから抽出された各単語に重みを設定し、その重みに基づいてコンテンツの属性を設定することとしてもよい。
そして、属性評価サーバ100の属性評価部1002が、データ解析サーバ90の属性/重み解析部901により評価されたコンテンツの属性の情報を取得して、上記実施例にて説明したような方法により評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性を判定する。
上述したように、本変形例2においては、データ解析サーバ90の属性/重み解析部901が、単語を感情、感覚または情緒に係るカテゴリーに分類した情報を記憶したデータベースを参照し、コンテンツまたはコンテンツに対応するメタデータに含まれる単語を分類することにより得られた感情、感覚または情緒に係るカテゴリーに係る情報に基づいて感情、感覚または情緒に係るコンテンツの属性を判定することとしたので、コンテンツの属性またはコンテンツにアクセスするユーザの属性の判定結果に基づいてインターネット広告などを配信する場合に、「ぬくもり」や「やすらぎ」などといったユーザの世界観、生活シーン、テイストなどに対応するインターネット広告を配信できるよう広告主がカスタマイズすることができる。
(変形例3)
また、上記実施例では、評価対象となる第1のコンテンツにリンクされた第2のコンテンツの属性を、第2のコンテンツまたは第2のコンテンツのメタデータに含まれる単語から決定することとしたが、属性評価サーバ100の属性評価部1002が、第1のコンテンツにリンクされた第2のコンテンツの属性を、さらに第2のコンテンツにリンクされた第3のコンテンツの属性から決定することとしてもよい。
また、第3のコンテンツの属性を第3のコンテンツにリンクされた第4のコンテンツの属性から決定することとしてもよい。このように、あるコンテンツにリンクされたコンテンツの属性をさらにそのコンテンツにリンクされたコンテンツの属性から決定する処理は任意の回数おこなうことができ、第1のコンテンツの属性評価の精度を制御することができる。ここで、第n(n=1,2,・・・)のコンテンツの属性を決定するための第n+1のコンテンツの情報は、情報収集サーバ80により収集され、記憶部802に記憶される。
その際、属性評価サーバ100の属性評価部1002が、更新頻度の低いコンテンツやコンテンツの内容が他のコンテンツとは大きく異なるコンテンツ、あるいは、特定のドメインに属するコンテンツの属性を、リンク先のコンテンツの属性評価に用いないこととしてもよい。これにより、リンク先のコンテンツの属性評価に対するリンクスパムやトラックバックスパムの影響を除去し、評価精度を高めることができる。
具体的には、コンテンツの更新頻度が所定値よりも小さい場合に、そのコンテンツに対して決定された属性をリンク先のコンテンツの属性評価に考慮しないこととする。または、他のリンク元のコンテンツの属性がすべて一致しているにもかかわらず、あるリンク元のコンテンツの属性だけが異なっているような場合には、そのリンク元の属性をリンク先のコンテンツの属性評価に考慮しないこととする。
あるいは、コンテンツの属性評価から除外するコンテンツのドメイン名をあらかじめ記憶しておき、そのドメイン名に対応するコンテンツをリンク先のコンテンツの属性評価に考慮しないこととする。
上述したように、本変形例3においては、情報収集サーバ80に記憶される第2のコンテンツに係る情報は、第n(n=2,3,・・・,m:mは2以上の自然数)のコンテンツにリンクされた第n+1のコンテンツに係る情報に基づいて決定された情報であることとしたので、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価の精度を制御することができる。
また、本変形例3では、nの値はユーザにより任意に設定されることとしたので、要求される属性の評価精度をユーザが任意に設定することができる。ここで、ユーザとは、属性評価システムの管理者や、コンテンツにアクセスする一般ユーザなどである。
また、本変形例3においては、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価する場合に、属性評価サーバ100の属性評価部1002が、所定の条件に合致するコンテンツに係る情報を評価に用いる情報から除外することとしたので、更新頻度の低いコンテンツやコンテンツの内容が他のコンテンツとは大きく異なるコンテンツ、あるいは、特定のドメインに属するコンテンツの属性などをコンテンツの属性評価に用いないことにより、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価に対するリンクスパムやトラックバックスパムの影響を除去し、評価精度を高めることができる。
(変形例4)
また、本実施例では、コンテンツのメタデータ内に記述されている単語を基にしてコンテンツの属性およびコンテンツにアクセスするユーザの属性を決定することとしたが、コンテンツの属性を記憶したデータベースを参照するための情報をメタデータ内に記述しておき、そのデータベースを参照することによりコンテンツの属性およびコンテンツにアクセスするユーザの属性を決定することとしてもよい。
図15は、メタデータ130内に記述されたデータベースの参照情報に基づいてデータベースを参照する処理を説明する図である。図15には、属性の評価をおこなうコンテンツのXML形式のメタデータ130が示されている。
XML形式のメタデータ130では、独自のマークアップ言語を自由に設計できるという特徴がある。この独自のマークアップ言語により記述された情報がWWWにおいて共有または交換される場合に、その意味を正確に示し、コンピュータに理解可能とするため、XML名前空間140の規格がW3Cにより勧告されている(World Wide Web Consortium、”Namespaces in XML”、[online]、[平成16年11月4日検索]、インターネット<URL: http://www.w3.org/TR/REC-xml-names/>を参照)。
XML名前空間140とは、XMLにおける属性名をURIと組み合わせて参照させる仕組みである。このXML名前空間140では、複数の属性名を混在させて運用することができる。
たとえば、図15に示したメタデータ内のXML名前空間140においては、「xmlns:yp="http://www.△△△.co.jp/ns/modules/property/?=20100311_01」という属性コンテナを記述している。
ここで、「xmlns:yp="http://www.△△△.co.jp/ns/modules/property/」の部分が評価対象となるコンテンツの属性情報を記憶した参照先データベース150のURIを示しており、「20100311_01」の部分が評価対象となるコンテンツを識別するための引数となっている。また、「yp」というタグは、独自に定義されたXML名前空間140であり、参照先データベース150を参照することにより得られたコンテンツの属性情報を返すタグである。
そして、広告サーバが広告を配信するような場合に、参照先データベース150を管理するサーバ装置にこの引数が送信され、その引数を受信したサーバ装置が属性評価サーバ100に上記実施例にて説明したような方法でコンテンツの属性およびコンテンツにアクセスするユーザの属性を評価する処理をリアルタイムで実行するよう要求し、その結果得られた属性を取得して参照先データベース150に記憶する。
広告サーバは、このような参照先データベース150を参照することにより、コンテンツの属性またはコンテンツにアクセスするユーザの属性に適合したインターネット広告を評価対象コンテンツが掲載されているウェブサイトなどに配信することができるようになる。
また、コンテンツの属性情報を記憶した参照先データベース150は、誰もがアクセスできるように開放しておくこととしてもよい。これにより、属性評価システム50を管理しているバナー広告配信業者だけでなく、他のバナー広告配信業者やコンテンツの分類をおこなう業者などがその情報を有効に利用することができるようになる。また、参照先データベース150に対するアクセスを有料で開放することとすれば、属性評価システム50を管理しているバナー広告配信業者はアクセスに対する対価を受け取ることができる。
また、ここでは、サーバ装置が引数を受信した場合に、属性評価サーバ100にコンテンツの属性およびコンテンツにアクセスするユーザの属性をリアルタイムで評価するよう要求することとしているが、属性評価サーバ100があらかじめ各コンテンツの属性およびコンテンツにアクセスするユーザの属性を評価して、評価結果を参照先データベース150に記憶しておくこととしてもよい。
この場合、評価対象となるコンテンツが掲載されているウェブサイトに当該コンテンツの属性および当該コンテンツにアクセスするユーザの属性を出力するよう要求するボタンなどを設け、そのボタンがクリックされた場合に参照先データベース150から属性の情報を取得し、ウェブサイト上に出力するようにすることもできる。
上述したように、本変形例4においては、データベースを管理するサーバ装置が、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価結果をデータベースに記憶し、コンテンツのメタデータに記述された名前空間に基づく第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の参照要求を受信した場合に、参照要求がなされた第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を出力することとしたので、メタデータに記述された名前空間を利用することにより、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の情報を効率的に取得することができる。
また、本変形例4においては、データベースを管理するサーバ装置が、コンテンツのメタデータに記述された名前空間に基づく第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の参照要求を受信したのを契機として、属性評価サーバ100が、第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することとしたので、メタデータに記述された名前空間を利用して、リアルタイムで評価された第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の情報を取得することができる。
(変形例5)
また、上記実施例では、評価されたコンテンツの属性およびコンテンツにアクセスするユーザの属性をインターネット広告の配信に利用することとしたが、それらをコンテンツの検索に利用することとしてもよい。
図16は、評価属性に基づくコンテンツの検索処理について説明する図である。図16に示すように、この検索処理においては、検索クエリを発信したウェブサーバが提供しているコンテンツの属性およびコンテンツにアクセスするユーザの属性を、属性評価サーバ100の属性評価部1002が、上記実施例で説明したような方法で評価し、評価された属性と検索キーワードの両方に該当するコンテンツを検索エンジン160が検索し、検索クエリを発信したウェブサーバに検索結果を出力する。
ここで、検索エンジン160は、図5に示したLAN120に接続された検索サーバ(図示せず)に搭載される機能部であり、検索クエリおよびコンテンツの属性の情報を受け付けて、検索キーワードおよびコンテンツの属性の情報に対応するコンテンツを検索し、検索クエリを発信した装置に検索したコンテンツを出力する処理をおこなう。
たとえば、図16の例では、「フルーツ」という検索キーワードの検索クエリを発信したウェブサーバが提供しているコンテンツの属性およびコンテンツにアクセスするユーザの属性が「スペイン」であると判定された場合に、検索エンジン160は、「フルーツ」という検索キーワードおよび「スペイン」という属性の情報を取得し、「スペイン」および「フルーツ」の両方に該当するコンテンツをウェブサーバに出力する。
なお、ここでは、コンテンツの属性およびコンテンツにアクセスするユーザの属性の評価をウェブサーバが検索クエリを発信した場合におこなうこととしたが、あらかじめ属性を評価しておくこととしてもよい。
また、変形例1では、評価されたコンテンツの属性およびコンテンツにアクセスするユーザの属性をインデックス語とし、そのコンテンツにリンクされたコンテンツまたはそのコンテンツのメタデータから抽出された単語をインデックス語に属する単語としてデータベースに登録することとしたが、ある単語を検索キーワードとする検索クエリを受け付けた場合に、検索エンジン160が、上記データベースを参照し、検索キーワードが属するインデックス語と同じインデックス語に属する単語をさらに検索キーワードとして設定し、それらの検索キーワードに該当するコンテンツを検索結果として出力することとしてもよい。
図17は、インデックス語に属する単語を検索キーワードとして用いる処理を説明する図である。図17に示すように、たとえば、シソーラスにおいて、インデックス語に「ぬくもり」が登録されており、そのインデックス語に「郷土」、「家庭料理」、「くちびる」、「旅館」、「布団」、「手作り」という単語が登録されているものとする。
この場合、たとえば、「郷土」という検索キーワードの検索クエリが発信された場合には、データベースが参照され、「郷土」という単語のインデックス語である「ぬくもり」が検索される。
そして、「ぬくもり」というインデックス語に属する単語「家庭料理」、「くちびる」、「旅館」、「布団」、「手作り」が検索され、それらの単語がさらに検索キーワードとして追加されて、単語「郷土」、「家庭料理」、「くちびる」、「旅館」、「布団」、「手作り」に該当するコンテンツが検索される。
また、ある単語を検索キーワードとする検索クエリを受け付ける場合に、インデックス語の指定をさらに受け付け、インデックス語に属する単語をさらに検索キーワードに設定し、それらの検索キーワードに該当するコンテンツを検索結果として出力することとしてもよい。
たとえば、図17の例を用いて説明すると、「郷土」という検索キーワードの検索クエリが発信され、さらに、「ぬくもり」というインデックス語が指定された場合に、「ぬくもり」というインデックス語に属する単語「郷土」、「家庭料理」、「くちびる」、「旅館」、「布団」、「手作り」に該当するコンテンツが検索される。
上述したように、本変形例5においては、コンテンツの検索要求を検索キーワードとなる単語とともに受け付けた場合に、検索エンジン160が、コンテンツに係る属性またはコンテンツにアクセスするユーザに係る属性の評価結果を取得し、取得した属性および検索キーワードとなる単語を検索キーワードとして検索をおこなうこととしたので、コンテンツを巡回したりコンテンツの検索をおこなったりしてコンテンツの属性を収集することなく、精度よく評価された属性に基づいてコンテンツの検索を効果的におこなうことができる。
また、本変形例5においては、コンテンツの検索要求を検索キーワードとなる単語とともに受け付けた場合に、検索エンジン160が、変形例1の方法により構築されたデータベースを参照して検索キーワードとなる単語が属するカテゴリーを抽出し、抽出したカテゴリーに属する単語を検索キーワードに追加することによりコンテンツの検索をおこなうこととしたので、精度よく評価された属性に基づいてコンテンツの検索を効果的におこなうことができる。
また、本変形例5においては、コンテンツの検索要求を検索キーワードとなる単語および前記データベースにおけるカテゴリーの指定とともに受け付けた場合に、検索エンジン160が、指定されたカテゴリーに属する単語を検索キーワードに追加することによりコンテンツの検索をおこなうこととしたので、精度よく評価された属性およびカテゴリーの情報に基づいてコンテンツの検索を効果的におこなうことができる。
(変形例6)
また、変形例5では、ユーザにより入力された検索キーワードとコンテンツの属性である単語とを検索キーワードとしてコンテンツの検索をおこなうこととしたが、HTMLやXML、RDF、RSSなどのマークアップ言語のタグをコンテンツの属性として設定し、設定されたタグを用いて記述されたテキスト内に検索キーワードがあるコンテンツを検索することとしてもよい。
たとえば、図2に示したようなRSSでは、<title>、<link>、<description>などのタグが含まれているが、それらのタグのうち特定のタグをコンテンツの属性として設定する。
特定のタグは、たとえば、シソーラスデータ802aを用いることにより決定することができる。具体的には、データ解析サーバ90の属性/重み解析部901は、タグにより埋め込まれた文字列に対して形態素分析をおこない、一般名詞を抽出する。
そして、属性/重み解析部901は、シソーラスデータ802aを参照し、抽出された一般名詞の重みの平均値をタグごとに算出する。そして、属性/重み解析部901は、平均値が最も大きいタグをそのコンテンツのタグ属性として選択し、選択した結果を情報収集サーバ80の記憶部802に記憶する。すなわち、より広い意味範囲を有する一般名詞を多く含んだテキストに対応するタグがコンテンツのタグ属性として選択される。
また、属性評価サーバ100の属性評価部1002は、図16に示したような検索キーワードの検索クエリを発信するウェブサーバが提供しているコンテンツのタグ属性を、当該コンテンツにリンクされたコンテンツのタグ属性、および、コンテンツの被リンク数などにより決定されるコンテンツの重みの情報に基づいて評価する。
具体的には、属性評価部1002は、図3で説明したようにして、リンクされたコンテンツのタグ属性ごとにコンテンツの重みの合計値を算出し、合計値が最も大きいタグ属性を検索クエリを発信するウェブサーバが提供しているコンテンツのタグ属性として設定する。図3の場合との違いは、図3では単語が属性となるのに対し、ここではタグが属性となることである。
そして、コンテンツの検索をおこなう場合に検索クエリを発信するウェブサーバがユーザから「フルーツ」といったような検索キーワードの入力を受け付けると、ウェブサーバは、検索キーワードと提供しているコンテンツのタグ属性の情報とを含んだ検索クエリを検索エンジン160に対して発信する。
それらの情報を受信した検索エンジン160は、タグ属性として指定されたタグを用いて記述されたテキスト内に検索キーワードが含まれるコンテンツを検索し、検索結果を検索クエリを発信したウェブサーバに出力する。
たとえば、タグ属性として指定されたタグが<title>であり、検索キーワードが「フルーツ」である場合には、<title>および</title>で挟まれるテキスト中に「フルーツ」という単語が含まれているコンテンツが検索される。
上述したように、本変形例6においては、コンテンツの検索要求を検索キーワードとなる単語とともに受け付けた場合に、検索エンジン160が、コンテンツのタグ属性として指定されたタグの情報を取得し、当該タグを用いて記述されたテキスト内に検索キーワードとなる単語が含まれるコンテンツを検索することとしたので、検索されるコンテンツをタグを利用することにより効率的に絞り込むことができる。
なお、ここでは、データ解析サーバ90の属性/重み解析部901が、シソーラスデータ802aを用いることによりコンテンツのタグ属性を動的に決定することとしているが、コンテンツごとにあらかじめタグ属性を設定しておくこととしてもよい。また、ここで利用されるタグは、あらかじめ標準化機関などにより標準化されているタグに限らず、ユーザが独自に設定したタグでもよい。
(変形例7)
また、本実施例では、評価対象コンテンツにリンクされたコンテンツの属性情報を基にして評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性を評価することとしたが、さらに、評価対象コンテンツまたは評価対象コンテンツにリンクされたコンテンツが掲載されたウェブサイトにコンテンツの検索機能が付加されている場合に、ユーザにより過去の所定の時間内に入力された検索キーワードを記憶し、検索キーワードと評価対象コンテンツにリンクされたコンテンツの属性情報とを基にして評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性を評価することとしてもよい。
具体的には、過去の一定期間内にユーザにより入力された検索キーワードを検索キーワードの入力を受け付けたウェブサイトを提供しているサーバにクッキー技術を利用して記憶するか、あるいは、検索キーワードを蓄積する外部のサーバに記憶する。
そして、データ解析サーバ90の属性/重み解析部901は、蓄積された検索キーワードの情報を取得して、シソーラスデータ802aを参照し、検索キーワードに対応するインデックス語および重みを検索する。
その後、属性/重み解析部901は、検索キーワードをコンテンツおよびメタデータから抽出した単語と同様に扱って、上記実施例と同様に評価対象コンテンツの属性および評価対象コンテンツにリンクされたコンテンツの属性を判定し、属性評価サーバ100の属性評価部1002は、その判定結果を基にして評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性を評価する。
また、変形例4で説明したように、コンテンツの属性を記憶したデータベースを参照するための情報をメタデータ内に記述しておき、そのデータベースを参照することによりコンテンツの属性およびコンテンツにアクセスするユーザの属性を決定する場合に、属性評価サーバ100の属性評価部1002が、過去の一定期間内にユーザにより入力された検索キーワードに基づいて、評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性を評価した結果をデータベースに記憶しておき、その評価結果を参照元に出力することとしてもよい。
また、ここでは、検索キーワードと評価対象コンテンツにリンクされたコンテンツの属性情報とを基にして評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性を評価することとしているが、検索キーワードの情報のみから評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性を評価することとしてもよい。
上述したように、本変形例7においては、検索キーワードの入力を受け付けたウェブサイトを提供しているサーバ、あるいは、検索キーワードを蓄積する外部のサーバが、ユーザにより過去の所定の時間内に入力されたコンテンツの検索キーワードに係る情報を記憶し、属性評価サーバ100の属性評価部1002が、記憶された第2のコンテンツに係る情報および検索キーワードに係る情報に基づいて第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を評価することとしたので、ユーザが入力した検索キーワードの情報をさらに加味することにより、コンテンツに係る属性および当該コンテンツにアクセスするユーザに係る属性を精度よく評価することができる。
また、本変形例7においては、属性評価サーバ100の属性評価部1002が、ユーザにより入力されたコンテンツの検索キーワードに基づいて評価した第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の評価結果をさらにデータベースに記憶し、コンテンツのメタデータに記述された名前空間に基づく第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性の参照要求を受信した場合に、参照要求がなされた第1のコンテンツに係る属性または第1のコンテンツにアクセスするユーザに係る属性を出力することとしたので、メタデータに記述された名前空間を利用して、ユーザが入力した検索キーワードの情報をさらに加味することにより精度よく評価されたコンテンツに係る属性および当該コンテンツにアクセスするユーザに係る属性を効率的に取得することができる。
また、本変形例7においては、属性評価サーバ100の属性評価部1002が、ユーザにより過去の所定の時間内に入力されたコンテンツの検索キーワードに係る情報を記憶し、記憶したコンテンツの検索キーワードに係る情報に基づいてコンテンツに係る属性またはコンテンツにアクセスするユーザに係る属性を評価することとしたので、検索キーワードを用いてコンテンツに係る属性または当該コンテンツにアクセスするユーザに係る属性を動的に、自動的に、客観的に評価することにより、評価精度を高めることができる。
(変形例8)
また、本実施例では、広告サーバ110が、実施例にて説明したような方法で評価されたコンテンツの属性またはコンテンツにアクセスするユーザの属性に対応する広告コンテンツを配信することとしたが、広告コンテンツを含むさまざまなコンテンツを配信し、コンテンツの配信に係るさまざまな情報を記憶して、そのようなコンテンツの配信に係る統計的な分析に役立てることとしてもよい。
図18は、コンテンツの配信システムについて説明する説明図である。図18に示すように、このコンテンツの配信システムは、クライアント装置170、ウェブサーバ171、コンテンツ配信サーバ172、コンテンツ属性管理サーバ173、コンテンツ属性情報DB(Database)174、ユーザ属性情報DB(Database)175、配信コンテンツ抽出サーバ176、ユーザ配信実績DB(Database)177およびユーザ反応実績DB(Database)178を有する。
なお、クライアント装置170とウェブサーバ171とはインターネットを介して接続され、ウェブサーバ171、コンテンツ配信サーバ172、コンテンツ属性管理サーバ173、コンテンツ属性情報DB(Database)174、ユーザ属性情報DB(Database)175、配信コンテンツ抽出サーバ176、ユーザ配信実績DB(Database)177およびユーザ反応実績DB(Database)178は互いにLANを介して接続される。
クライアント装置170には、ユーザがウェブサイトに掲載されたコンテンツにアクセスするブラウザソフトウェアが導入されている。そして、クライアント装置170は、ユーザから特定のウェブサイトのコンテンツの表示要求を受け付けた場合に、ウェブサーバに対してコンテンツデータを送信するよう要求する(S1)。
ここで、クライアント装置170は、ウェブサーバ171にコンテンツデータを送信するよう要求する場合に、ユーザを特定するユーザ情報およびブラウザを特定するブラウザ情報をウェブサーバ171に送信する。
コンテンツデータの送信要求を受け付けたウェブサーバ171は、コンテンツ配信サーバ172にウェブサイトの配信用コンテンツを生成するよう要求する(S2)。コンテンツ配信サーバ172は、コンテンツの生成要求を受け付けて、コンテンツ属性情報管理サーバ173に、ユーザにより表示要求を受け付けたコンテンツの属性、当該コンテンツにアクセスするユーザの属性、コンテンツの地域属性を問い合わせる(S3)。
コンテンツ情報管理サーバ173は、コンテンツ属性情報DB174を参照して、コンテンツ属性情報管理サーバ173により問い合わせがあったコンテンツの属性、コンテンツにアクセスするユーザの属性、コンテンツの地域属性を送信する(S4)。ここで、コンテンツの属性、コンテンツにアクセスするユーザの属性およびコンテンツの地域属性は、上記実施例および変形例にて説明したような方法で評価したものである。
その後、コンテンツ配信サーバ172は、配信コンテンツ抽出サーバ176に対して、ユーザにより表示要求を受け付けたコンテンツに加えて、ウェブサイトに追加表示するコンテンツを抽出するよう要求する(S5)。
そして、配信コンテンツ抽出サーバ176は、クライアント装置170を操作しているユーザのユーザ情報またはユーザが利用しているブラウザの情報と、コンテンツ属性情報DB174から取得したコンテンツの属性、コンテンツにアクセスするユーザの属性、または、コンテンツの地域属性とを基にして、配信すべきコンテンツを抽出し、抽出したコンテンツの情報をコンテンツ配信サーバ172に送信する(S6)。
具体的には、配信コンテンツ抽出サーバ176は、ユーザ情報またはブラウザ情報と、ユーザの興味関心や年齢、性別などの個人情報とを対応付けて記憶したデータベース(図示せず)を参照してユーザの個人情報を取得し、取得した個人情報に適合する属性を有するコンテンツを抽出する。
続いて、コンテンツ配信サーバ172は、ユーザにより表示要求を受け付けたコンテンツと、配信コンテンツ抽出サーバにより抽出されたコンテンツとの組を生成し、ウェブサーバにそれを送信する(S7)。そして、ウェブサーバ171は、コンテンツの表示要求をおこなったクライアント装置にそれらのコンテンツを送信し、ウェブサイト上に表示させる(S8)。
図19は、コンテンツが表示されるウェブサイトの一例を示す図である。図19に示すように、既存のコンテンツ181a,181bに加えて、配信コンテンツ抽出サーバ176により抽出されたコンテンツがコンテンツ配信場所182に埋め込まれて表示される。
また、ユーザ情報およびブラウザ情報は、ウェブサーバ171により、コンテンツ配信サーバ172を介してコンテンツ属性管理サーバ173に送信され、コンテンツ属性管理サーバ173は、属性の問い合わせがあったコンテンツに対応付けて、ユーザ情報およびブラウザ情報をユーザ属性情報DB175に記憶する。
また、配信コンテンツ抽出サーバ176は、コンテンツ配信サーバ172からユーザ情報およびブラウザ情報を受け付け、配信用に抽出し、実際にクライアント装置170に送信されたコンテンツに対応付けてユーザ情報およびブラウザ情報をユーザ配信実績DB177に記憶する。
また、配信コンテンツ抽出サーバ176は、同一のユーザまたはブラウザに配信したコンテンツの属性または当該コンテンツにアクセスするユーザの属性の頻度をユーザ配信実績DB177に記憶する。
また、ユーザ反応実績DB178は、クライアント装置170に配信されたコンテンツに対するユーザの反応状況に係る情報をコンテンツに対応付けて記憶する。ここで、ユーザの反応状況に係る情報とは、コンテンツがバナー広告であれば、そのバナー広告がクリックされたか否かの情報、また、コンテンツがQ&Aなどであれば、ユーザに対しておこなったコンテンツの有益性に対するアンケート調査の結果の情報などである。
さらに、ユーザの反応状況を取得するのに、コンテンツが掲載された双方向媒体が表示される装置とは別の装置を介して反応パラメータを測定することとしてもよい。例えば、コンテンツが広告である場合は、デジタルテレビ等の広告を見て、携帯電話端末で反応状況を取得する場合などにも適用することができる。
上述したように、本変形例8では、ユーザ属性情報DB175が、評価されたコンテンツに係る属性またはコンテンツにアクセスするユーザに係る属性と、コンテンツにアクセスするユーザに係る情報またはコンテンツの出力をおこなうウェブブラウザに係る情報とを対応付けて記憶することとしたので、記憶した情報を属性が評価された第1のコンテンツにアクセスするユーザ層の分析に役立てることができる。
また、本変形例8では、ユーザ配信実績DB177が、コンテンツが配信された場合に、配信されたコンテンツにアクセスするユーザに係る情報と配信されたコンテンツの属性または当該コンテンツにアクセスするユーザの属性とを対応付けて記憶することとしたので、記憶した情報を配信されたコンテンツにアクセスするユーザ層の分析に役立てることができる。
また、本変形例8では、ユーザ配信実績DB177が、同一のユーザまたは同一のウェブブラウザに対して配信したコンテンツの属性または当該コンテンツにアクセスするユーザの属性の頻度をさらに記憶することとしたので、記憶した情報をユーザによりアクセスされるコンテンツの属性または当該コンテンツにアクセスするユーザの属性の分析に役立てることができる。
また、本変形例8では、ユーザ反応実績DB178が、コンテンツが配信された場合に、配信されたコンテンツにアクセスしたユーザの当該コンテンツに対する反応状況に係る情報を記憶することとしたので、記憶した情報を配信されたコンテンツに対するユーザの反応の分析に役立てることができる。
(変形例9)
また、本実施例では、コンテンツおよびメタデータに含まれる単語を評価対象コンテンツとリンク元コンテンツとで別々に集め、評価対象コンテンツおよびリンク元コンテンツの属性を別に判定した後、評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性を評価することとしているが、本発明はこれに限定されるものではなく、コンテンツおよびメタデータに含まれる単語を評価対象コンテンツとリンク元コンテンツとで区別せずに一括して集めて記憶し、集めた単語から評価対象コンテンツの属性および評価対象コンテンツにアクセスするユーザの属性を直接評価することとしてもよい。
(変形例10)
また、本実施例では、図6に示したような階層構造を有するシソーラスデータ802aを用いてコンテンツの属性を評価することとしたが、シソーラスデータのデータ構造は図6に示したものに限定されず、他の構造を有するシソーラスデータを利用することとしてもよい。
図20は、意味的に関連する単語間の連結関係が定義されたシソーラスデータ190の一例を示す図である。このシソーラスデータ190は、情報収集サーバ80の記憶部802に記憶され(図示せず)、図20に示すように、連結類義語および距離の情報が登録されている。
連結類義語は、意味的に関連のある2つの単語(類義語)を登録したものである。ここに登録された2つの単語の間には、図6で説明したような包括関係は無く、並列的に連結されている。距離は、連結類義語に登録された2つの単語の意味的な近さを定義したものである。この数値が小さいほど2つの単語が意味的に近いことを示している。
図6で説明したシソーラスデータ802aは、各単語間に階層構造を定義する必要がある。一方、図20に示したシソーラスデータ190は、距離を定義する必要があるものの階層構造の定義は不要である。そのため、階層構造の定義が困難な場合には、シソーラスデータ190を利用することが有効となる。
図21は、図20に示したシソーラスデータ190を2次元的に表現した図である。図21には、シソーラスデータ190に登録された各単語と、各単語間の距離dと、各単語の重みwとが示されている。ここで、各単語間の距離dは、シソーラスデータ190に登録された単語間の距離である。
重みwは、単語の連結数に基づいて決定される重みである。この重みは、ウェブサイトの属性を評価する場合に参照される。具体的には、データ解析サーバ90の属性/重み解析部901は、ウェブサイトのメタデータおよびコンテンツに対して形態素解析を適用し、それによって得られた形態素の中から一般名詞を抽出する。
そして、属性/重み解析部901は、抽出された一般名詞に対する重みを重みの設定条件を基にして算出する処理をおこなう。図22は、重みの設定条件を記憶した重みデータ191の一例を示す図である。この重みデータ191は、情報収集サーバ80の記憶部802に記憶される(図示せず)。
図22に示すように、この重みデータ191は、連結数の情報と重みの情報とが登録されている。連結数の情報は、シソーラスデータ190において注目している単語に連結された単語の総数である。たとえば、注目している単語が「融資」である場合には、「融資」に連結された「保証人」、「審査」、「契約」などの単語の総数である。
重みは、連結数に対応する重みである。すなわち、ここでは、連結数の大小に基づいて重みが決定される。そして、属性/重み解析部901は、メタデータおよびコンテンツから抽出された一般名詞のうち、重みが最大であるものを選択する。
その後、属性/重み解析部901は、重みが最大である一般名詞を中心として、距離が所定の値以内にある一般名詞を抽出し、抽出した一般名詞と重みが最大である一般名詞とを1つのカテゴリーとして分類し、そのカテゴリーに含まれる一般名詞を当該コンテンツの属性として決定する処理をおこなう。
図21には、重みが最大である一般名詞が「融資」であった場合に、一般名詞「融資」からの距離が所定の値以内となる領域が円で示されている。この円内にある複数の一般名詞がコンテンツの属性として設定される。
そして、属性/重み解析部901は、属性および重みを解析した情報を情報収集サーバ80の記憶部802に記憶する。具体的には、各コンテンツに対応付けて、コンテンツの属性として抽出された複数の一般名詞と各一般名詞の重みとを記憶する。
そして、属性評価サーバ100の属性評価部1002が、あるコンテンツの属性および当該コンテンツにアクセスするユーザの属性を評価する場合には、情報収集サーバ80から評価対象とするコンテンツ、および、評価対象とするコンテンツにリンクされた各コンテンツから複数抽出された一般名詞と重みの情報とを取得する。
そして、属性評価部1002は、同じ一般名詞ごとに重みを足し合わせ、重みの合計値が所定の値以上の一般名詞を評価対象とするコンテンツの属性および当該コンテンツにアクセスするユーザの属性として決定する処理をおこなう。ここで、属性として決定される一般名詞は1つであってもよいし、複数であってもよい。
なお、ここでは、各一般名詞の重みを連結数に基づいて決定しているが、重みの決定方法はこれに限定されず、他の方法を用いてもよい。同様に、評価対象とするコンテンツの属性および当該コンテンツにアクセスするユーザの属性の決定方法も、重みの合計値による決定方法に限定されず、他の方法を用いてもよい。
また、上述した方法では、図21に示したように、重みが最大である一般名詞から所定の距離内にある一般名詞をコンテンツの属性として設定しているが、その距離を適切に設定することにより、所定の属性を有するコンテンツへのバナー広告の配信などを効率的におこなうことができるようになる。
具体的には、上記距離を大きくすると、コンテンツの属性としてより多くの一般名詞が設定されることになる。したがって、広告主などからコンテンツの属性の指定を受け付けてバナー広告を配信するような場合には、より多くのバナー広告がコンテンツに配信されるようになり、バナー広告の配信数を増やすことができる。
一方、上記距離を小さくすると、コンテンツの属性としてより少ない一般名詞が設定されることになる。この場合、コンテンツと属性との間の関連性が高まるので、特定のユーザに対して正確にバナー広告の配信をおこなうことができるようになる。
この距離の設定は、データ解析サーバ90が、バナー広告配信の管理者により入力された設定情報を受け付けておこなうこととしてもよいし、広告主などからバナー広告ごとに距離の設定情報を受け付けておこなうこととしてもよい。
また、ここでは、シソーラスデータ190はあらかじめ与えられたものとしてきたが、シソーラスデータ190を動的に生成することとしてもよい。たとえば、広告主より入稿された広告のテキストデータを解析し、そこに含まれる一般名詞を連結し、連結類義語としてシソーラスデータ190に登録することとしてもよい。
例を挙げると、「4月の誕生石であるジュエリーの王様ダイヤモンドを・・・」という広告文章があったとすると、「4月」、「誕生石」、「ジュエリー」、「王様」、「ダイヤモンド」、・・・、という一般名詞が互いに連結され、連結類義語としてシソーラスデータ190に登録される。
各連結類義語の距離は、一般名詞が出現する位置などに基づいて設定される。すなわち、「王様」と「ダイヤモンド」とは隣り合わせで出現するため、意味的に近いものであるとして距離は小さく設定される(たとえば、10など)。
「4月」と「ダイヤモンド」とは、間に「誕生石」、「ジュエリー」、「王様」という3つの一般名詞を挟むため、意味的に遠いものであるとして距離は大きく設定される(たとえば、40など)。このようにして、各一般名詞間の距離を定義し、シソーラスデータ190に登録することとする。距離の設定方法はこれに限定されず、他の方法で設定することとしてもよい。
広告において用いられる単語には広告に効果的なものが使われているものと考えられるので、それに基づいてシソーラスデータ190を作成し、コンテンツの属性評価をおこなうことにより、広告を配信する対象の数を調節したり、広告に適したコンテンツの属性を設定することができる。
また、広告主ごとに異なるシソーラスデータ190を作成することとしてもよい。たとえば、ジュエリー業界と自動車業界とでは単語の連結関係が異なり、それぞれについてシソーラスデータ190を作成し、利用した方が適切にコンテンツの属性を設定することができると考えられる。
このように、本変形例10では、データ解析サーバ90の属性/重み解析部901が、意味的に関連する単語間の連結関係が包括関係を有することなく定義されたシソーラスデータ190を参照し、コンテンツに含まれる単語を距離を用いて1つのカテゴリーとして分類して記憶し、属性評価サーバ100の属性評価部1002が、記憶された情報に基づいてコンテンツの属性を判定することとしたので、単語間の階層構造の定義が困難な場合でも、シソーラスデータ190を用いてコンテンツに係る属性を効率よく判定することができる。
以上、上記実施例において、属性判定処理をコンピュータ上で実現する場合について説明してきたが、属性判定処理を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませ、実行することにより属性判定処理を実現してもよい。
図23は、属性判定処理を実現するコンピュータ200のハードウェア構成を示すブロック図である。図23に示すように、このコンピュータ200は、上記プログラムを実行するCPU210と、データを入力する入力装置220と、各種データを記憶するROM230と、演算パラメータ等を記憶するRAM240と、属性判定処理を実現するためのプログラムを記録した記録媒体300からプログラムを読み取る読取装置250と、ディスプレイ等の出力装置260と、ネットワーク400を介して他のコンピュータとの間でデータの授受をおこなうネットワークインターフェース270とが、バス280で接続された構成となっている。
CPU210は、読取装置250を経由して記録媒体300に記録されているプログラムを読み込んだ後、プログラムを実行することにより、属性判定処理を実現する。なお、記録媒体300としては、光ディスク、フレキシブルディスク、CD−ROM、ハードディスク等が挙げられる。また、このプログラムは、ネットワーク400を介してコンピュータ200に導入することとしてもよい。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。
この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
さらに、各装置にて行なわれる処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。