JP4637969B1 - ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法 - Google Patents

ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法 Download PDF

Info

Publication number
JP4637969B1
JP4637969B1 JP2010102013A JP2010102013A JP4637969B1 JP 4637969 B1 JP4637969 B1 JP 4637969B1 JP 2010102013 A JP2010102013 A JP 2010102013A JP 2010102013 A JP2010102013 A JP 2010102013A JP 4637969 B1 JP4637969 B1 JP 4637969B1
Authority
JP
Japan
Prior art keywords
word
classification
website
web page
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010102013A
Other languages
English (en)
Other versions
JP2011154668A (ja
Inventor
裕 石上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TAGGY Inc
Original Assignee
TAGGY Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TAGGY Inc filed Critical TAGGY Inc
Priority to JP2010102013A priority Critical patent/JP4637969B1/ja
Priority to PCT/JP2010/007477 priority patent/WO2011080899A1/ja
Priority to EP10840759.4A priority patent/EP2521044A4/en
Priority to US13/518,065 priority patent/US8812505B2/en
Application granted granted Critical
Publication of JP4637969B1 publication Critical patent/JP4637969B1/ja
Publication of JP2011154668A publication Critical patent/JP2011154668A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

【課題】 本発明は,言葉同士の関連性の変化に迅速に対応できる分類語データベースの構築方法を提供することを目的とする。
【解決手段】 本発明は,基本的には,ある分類語を有するウェブサイトにおけるある単語の出現頻度情報をリアルタイムに解析して,その分類語とある単語とのリアルタイムな類似度を求めることで,言葉同士の関係の変化に敏感に対応したデータベースを構築できるという知見に基づく。本発明は,ウェブページに含まれる文章の主意を示す分類語を抽出し,分類語を集積してリアルタイムなタグデータベースを構築する方法,そのタグデータベースを用いてウェブページの主意をリアルタイムに反映した情報推奨方法,そのタグデータベースを用いてウェブページの主意,およびユーザの嗜好をリアルタイムに反映した広告等の情報マッチング方法に関する。
【選択図】図1

Description

本発明は,ウェブページに含まれる文章の主意を示す最適語であるタグなどの分類語を抽出し,分類語を集積してリアルタイムなタグデータベースを構築する方法,そのタグデータベースを用いてウェブページの主意をリアルタイムに反映した情報推奨方法,及びそのタグデータベースを用いてウェブページの主意,およびユーザの嗜好をリアルタイムに反映した広告等の情報マッチング方法に関する。
特開2009−259248号公報には,ウェブページに含まれるイメージに対してタグ付けを実行し,その結果を利用してウェブ検索サービスを提供する方法が開示されている。
また,特開2009−259248号公報には,ウェブコンテンツごとにタグを予めつけておき,与えられたタグリストとして目録化した後,ユーザが選択したタグと関連したウェブコンテンツを提供する方法が開示されている(段落[0006])。
特開2008−310626号公報には,文章にタグを付与した文章の整理をする方法や,タグを精度良く付与できる自動タグ付与装置が開示されている。この自動タグ付与装置は,既にタグづけがされている文書を収集し,タグ付き文書データベースに格納する。そして,データベース中の各タグに対して,そのタグが設定された文書集合中の特徴的な語句を基に,各タグ間の意味的な類似度を測定し,同一の意味を示すタグが存在する場合には,そのタグ同士を統合する。そして,データベース中の各タグに対して,特徴的な語句を基に,そのタグが特定の話題を示すかどうかを判定する。タグ統合手段の統合結果およびタグ重要性の判定結果に基づいて入力文書にタグを付与する。
特開2009−259248号公報 特開2008−310626号公報
従来のタグ付与方法は,基本的にはあらかじめ定められた類似度などに応じて特徴語を集約するものである。一方,ある語に関連する語は時とともに変化するものである。このため,従来のタグ付与方法では,ある語と関連するとされる語が固定されてしまい,変化に敏感に対応することができない。
そこで,本発明は,言葉同士の関連性の変化に迅速に対応できる分類語データベースの構築方法を提供することを目的とする。
また,本発明は,上記の分類語データベースを用いた,言葉の変化やウェブページの意味の移ろいに適切に応じた情報推奨方法をリアルタイムに提供することを目的とする。
さらに,本発明は,上記の分類語データベースを用いた,ウェブページの意味の移ろい,およびユーザの興味の移ろいに適切に応じた広告等の情報マッチング方法をリアルタイムに提供することを目的とする。
本発明は,基本的には,ある分類語を有するウェブサイトにおけるある単語の出現頻度情報をリアルタイムに解析して,その分類語とある単語とのリアルタイムな類似度を求めることで,言葉同士の関係の変化に敏感に対応したデータベースを構築できるという知見に基づく。
本発明の第1の側面は,ウェブサイトにタグ又はカテゴリーとして表示されるある分類語とその分類語をタグ又はカテゴリーとして含むウェブサイトに含まれる単語群の関係性をスコア化するためのデータベースの構築方法に関する。この方法は,以下のようにしてデータベースを構築する。
コンピュータが,当該コンピュータと電子通信回線で接続されたウェブサイトから,ある分類語を有する複数のウェブサイトを選定する(ウェブサイト選定工程)。
コンピュータが,前記ウェブサイト選定工程で選定されたウェブサイトにおける文章に含まれる単語群を抽出する(単語群抽出工程)。
コンピュータが,前記単語群抽出工程で抽出した単語群に含まれるそれぞれの単語について,前記ウェブサイト選定工程で選定されたウェブサイトにおける頻度を計測し,前記ある分類語と単語それぞれの関連性を数値化する(数値化工程)。
コンピュータが,前記ある分類語と関連して,前記ウェブサイト選定工程で選定されたウェブサイトにおける文章に含まれる単語群のそれぞれの単語及び前記単語群に含まれるそれぞれの単語について前記数値化工程で得られた数値とをデータベースに記憶させる(記憶工程)。
このように,本発明の第1の側面によれば,分類語を有するウェブサイトと当該分類語を含むウェブサイトに含まれる単語群の関係性とをリアルタイムに関連付けて記憶したデータベースを構築することができる。
本発明の第一の側面の好ましい態様における,タグは,ウェブサイトにおける文章に含まれる単語群の主意を示すものとしてウェブページ上に表示されているテキスト情報である。また,タグは,ウェブサイトにおける文章に含まれる単語群に関連するものとしてウェブページ上に表示されるテキスト情報であるともいえる。また,タグは,ウェブサイトにおける文章に含まれる単語群の意味を分類するものとしてリンクとともにウェブページ上に表示されるテキスト情報であるともいえる。
本発明の第一の側面の好ましい態様における,タグは,他のウェブサイトへのリンク情報が付されている。
本発明の第一の側面の好ましい態様における,カテゴリーは,ツリー構造のウェブサイトのディレクトリを表すテキスト情報でありウェブページ上に表示される。また,カテゴリーは,ウェブサイトのコンテンツをあらかじめ分類した索引を表すテキスト情報でありウェブページ上に表示される。
本発明の第一の側面の好ましい態様における,カテゴリーには,他のウェブサイトへのリンク情報が付されている。
タグやカテゴリーは,ウェブサイトにおける文章の内容を端的に表現するために,ウェブサイトの運営者又は文章等の投稿者によって付されるものである。すなわち,文章の内容やその文章に含まれる単語の意味は,時と共に移ろいゆくものであるが,タグやカテゴリーは,ウェブサイトの運営者等によって,その時代の移ろいに対応して付されるものである。従って,タグやカテゴリーは,文章や単語の意味をリアルタイムに反映していると言える。
本発明の第一の側面の好ましい態様における,ウェブサイト選定工程は,コンピュータが,ウェブサイトに振られている識別タグに基づいて,ある分類語を有する複数のウェブサイトを抽出する。
本発明の第一の側面の好ましい態様においては,コンピュータが,前記ウェブサイト選定工程で選定されたウェブサイトを,識別タグを解析することにより,複数の区分に分割する区分分割工程を,さらに有する。これにより,単語群抽出工程においては,コンピュータが,区分分割工程で分割されたウェブサイトの区分における文章のうち,ある分類語が含まれる区分における文章から単語群を抽出する。
これにより,分類語と,その分類語と関連性のない又は関連性の低い単語と関連づけて記憶することを防止することができる。また,特定の文章のみ解析するため,処理の迅速化を図ることができる。
本発明の第一の側面の好ましい態様においては,コンピュータが,コンピュータと電子通信回線で接続された複数のウェブサイトから,ウェブサイト上に表示されるタグ又はカテゴリーとしての分類語群を抽出する分類語群抽出工程をさらに有する。これにより,ウェブサイト選定工程は,コンピュータと電子通信回線で接続されたウェブサイトから,分類語群抽出工程で抽出された分類語群に含まれる,ある分類語を有する複数のウェブサイトを選定する。
本発明の第2の側面は,データベースを用いたコンピュータによる情報推奨方法に関する。このデータベースは,基本的には第1の側面のデータベースを構築する方法により構築されたデータベースである。すなわち,このデータベースは,複数の分類語と,複数の分類語のそれぞれの分類語について関連する1又は複数の単語と,1又は複数の単語のそれぞれの分類語についての関連性の数値とを関連付けて記憶したデータベースである。
この方法は,以下のようにして情報を推奨する。あるウェブページに含まれる単語を抽出する(単語抽出工程)。
単語抽出工程で抽出した単語を用いて,前記データベースにアクセスし,前記データベースから分類語を抽出する(分類語抽出工程)。
分類語抽出工程で抽出された,分類語を用いて関連するウェブページを検索する(ウェブページ検索工程)。
ウェブページ検索工程で検索されたウェブページへのリンクを表示する(リンク表示工程)。
このようにすることで,あるウェブページに関連のある情報を自動的にリンク表示することができる。しかも,あるウェブページに含まれる単語を用いて関連するウェブページを検索するのではなく,あるウェブページと関連する分類語を用いて関連するウェブページを検索することで,そのウェブページの文意を適切に把握して,嗜好性などをリアルタイムに反映した関連ページを効果的に表示することができる。
本発明の第3の側面は,データベースを用いたコンピュータによる広告等の情報マッチング方法に関する。このデータベースは,基本的には第1の側面のデータベースを構築する方法により構築されたデータベースである。すなわち,このデータベースは,複数の分類語と,複数の分類語のそれぞれの分類語について関連する1又は複数の単語と,1又は複数の単語のそれぞれの分類語についての関連性の数値とを関連付けて記憶したデータベースである。
このマッチング方法は,以下のようにしてマッチングを行う。すなわち,まず複数のウェブページについてそれらの分類語を決定する。この複数のウェブページは広告を媒介とした広告リンク先ウェブページでもよい。
なお,このマッチング方法は,広告に関する情報のマッチングに限定されるものではなく,種々の情報のマッチングに用いることができる。
まず,複数のウェブページのそれぞれのウェブページに含まれる単語を抽出する(第1の単語抽出工程)。そして,第1の単語抽出工程で抽出した単語を用いて,データベースにアクセスし,データベースから分類語を抽出し,これによりそれぞれのウェブページに関連する分類語を抽出する(第1の分類語抽出工程)。それぞれのウェブページへのアクセス情報と,第1の分類語抽出工程で抽出したそれぞれのウェブページに関連する分類語とを関連付けて記憶する(関連分類語記憶工程)。
次に,あるクライアントを使用するユーザの嗜好を分析する。
あるクライアントのアクション情報に含まれる単語を抽出する(第2の単語抽出工程)。第2の単語抽出工程で抽出した単語を用いて,前記データベースにアクセスし,前記データベースから分類語を抽出し,これによりそれぞれのクライアントに関連する分類語を抽出する(第2の分類語抽出工程)。
その上で,各ウェブページとユーザの嗜好とのマッチングを行う。
すなわち,第2の分類語抽出工程で抽出した分類語と,第1の分類語抽出工程で抽出した分類語とを用いて,第2の分類語抽出工程で抽出した分類語と関連のある分類語を有するウェブページを求める(ウェブページ選択工程)。
その上で,関連分類語記憶工程で記憶したウェブページへのアクセス情報を,前記クライアントに表示させる(アクセス情報表示工程)。
これにより,あるクライアントから読み取れるクライアントのユーザの嗜好と,その嗜好にふさわしいウェブページ,特に広告を媒介とした広告リンク先ウェブページとをリアルタイムにマッチングさせることができる。
本発明によれば,ある分類語とともに出現する語の頻度を求めて分類語と関連語の関連性を常に更新することで,言葉同士の関連性の変化に迅速に対応できる分類語データベースの構築方法を提供することができる。
また,本発明によれば,上記の分類語データベースを用いた,言葉の変化やウェブページの意味の移ろいに応じた情報推奨方法をリアルタイムに提供することができる。
さらに,本発明によれば,上記の分類語データベースを用いた,ウェブページの意味の移ろい,およびユーザの興味の移ろいに適切に応じた広告等の情報マッチング方法をリアルタイムに提供することができる。
図1は,本発明のデータベースの構築方法を説明するためのフローチャートである。 図2は,本発明の方法を実現するためのシステムのブロック図である。 図3は,本発明のデータベースの構築方法に用いられるコンピュータの基本構成を示す機能ブロック図である。 図4は,関連ウェブページの例を示す図である。 図5は,あるウェブサイトを区分に分割した例を示す図である。 図6は,本発明のデータベースを用いたコンピュータによる情報推奨方法を説明するためのフローチャートである。 図7は,この情報推奨方法を実現するコンピュータのブロック図である。 図8は,本発明のマッチング方法を説明するためのフローチャートである。 図9は,本発明のマッチング方法を実現するためのコンピュータのブロック図である。 図10は,コンピュータにあるウェブページのテキストが入力された様子を示す概念図である。 図11は,リンク表示が行われたウェブサイトの例である。 図12は,ある検索サイトの表示画面である。 図13は,お勧め機能つき検索サイトのお勧め領域に,ユーザの嗜好にマッチしたウェブページの情報が表示された例を示す。 図14は,タグが表示されたあるウェブサイト(ニュースサイト)の例である。 図15は,タグが表示されたあるウェブサイト(ブログサイト)の例である。 図16は,カテゴリーが表示されたあるウェブサイト(情報ポータルサイト)の例である。 図17は,カテゴリーが表示されたあるウェブサイト(動画共有サイト)の例である。 図18は,タグ及びカテゴリーが表示されたあるウェブサイト(情報ポータルサイト)の例である。 図19は,ウェブサイト選定工程で選定の対象となるウェブサイトを説明するための図である。 図20は,分類語群抽出工程及び区分分割工程をさらに有する,本発明のデータベースの構築方法を説明するためのフローチャートである。 図21は,分類語群抽出手段及び区分分割工程をさらに有する,本発明の方法を実現するためシステムのブロック図である。
以下,本発明を実施するための形態について説明する。本発明は,以下に説明する実施態様に限定されるものではない。本発明は,以下に説明する実施態様から当業者に自明な範囲で適宜修正される範囲を含む。
本発明の第1の側面は,分類語を有するウェブサイトと当該分類語を含むウェブサイトに含まれる単語群の関係性をスコア化するためのデータベースの構築方法に関する。図1は,本発明のデータベースの構築方法を説明するためのフローチャートである。図中Sは,ステップを示す。図1に示されるように,本発明のデータベースの構築方法は,ウェブサイト選定工程(ステップ101),単語群抽出工程(ステップ102),数値化工程(ステップ103),及び記憶工程(ステップ104)を含む。
図20に示すように,本発明はデータベースの構築方法は,さらに,分類語群抽出工程100及び区分分割工程105を含むこととしても良い。
図2は,本発明の方法を実現するためのシステムのブロック図である。図2に示されるとおり,本発明のシステム1は,コンピュータ2を含む。コンピュータ2は,複数のウェブサイト3およびクライアント4とインターネットなどの通信回線を介して接続されている。なお,通常,ウェブサイト3およびクライアント4は複数である。
そして,コンピュータ2は,入出力部11,制御部12,演算部13,記憶部14を有しており,それらの要素はバス15などで接続されており,情報の授受を行うことができるようにされている。すなわち,入出力部11から所定の情報が入力されると,制御部12は,記憶部14のメインメモリに格納されている制御プログラムを読み出す。そして,制御部12は,制御プログラムの指令に従って,適宜記憶部14に記憶されたデータを読み出し,演算部13にて所定の演算を行う。そして,演算結果を記憶部14に一時的に記憶して,入出力部11から出力する。
図3は,本発明のデータベースの構築方法に用いられるコンピュータの基本構成を示す機能ブロック図である。図3に示されるとおり,コンピュータ2は,ウェブサイト選定手段21,単語群抽出手段22,数値化手段23,記憶手段24,及びデータベース25を有する。
また,本発明のシステムは,図21に示すように,区分分割手段26及び分類語群抽出手段27を有していても良い。
ウェブサイト選定手段21は,コンピュータ2と電子通信回線で接続されたウェブサイト3から,ある分類語をウェブサイト上に表示されるタグ又はカテゴリーとして有する複数のウェブサイトを選定するための手段である。
コンピュータ2は,データベースを有している。そして,そのデータベース25は,複数の分類語を格納している。分類語の例はタグ,カテゴリーである。この分類語は手入力により追加されてもよい。コンピュータ2は,あらかじめ複数のウェブサイトのURLを格納し,そのURLを用いて,ウェブサイトを選定してもよい。また,コンピュータ2は,データベース25に格納した分類語を用いて,インターネット検索を自動で行い,それぞれの分類語を含むウェブサイトを見出して,分類語を有する複数のウェブサイトを選定してもよい。ある用語を用いたインターネット検索は既に知られている。このため,分類語を有する複数のウェブサイトを選定する処理は,既に知られた方法を用いて容易に行うことができる。
タグは,ガイド記事に1又は複数設定されている関連キーワードとしてウェブサイトに表示されるものである。通常,同じタグが振られているウェブページを複数表示できるように,リンクが貼られている。そして,そのタグを選択すると,そのタグをタグとして含む複数のウェブページへのリンクを表示したサイトへと移動することができる。このタグは,記事を投稿したユーザ又は管理者のクライアントから直接入力されてもよいし,記事を解析することで自動的に振られたタグであってもよい。データベース25に格納した分類語AAAを用いて,インターネット検索を行い,その分類語AAAを有するウェブサイトを選定する場合,AAAが文章にのみ含まれるウェブサイトは選定しない(図19(a)参照)。すなわち,AAAという単語が分類語(タグ又はカテゴリ)として用いられているウェブサイトのみを選定する(図19(b)参照)。AAAという単語が,分類語として用いられているか否かは,ウェブサイトを構成するソースコードを解析して判断すればよい。例えば,文章であることを示すHTMLタグなどの識別タグに,単語AAAが含まれていても,これは選定の対象とはしない。また,通常のテキストを示す識別タグで区別される区分に単語AAAが存在しても,それはテキストとして単語AAAが含まれることになるので,選定の対象としない。一方,分類語であることを示す識別タグに,単語AAAが含まれていた場合には,このウェブサイトを選定する。また,例えば,他のウェブサイトへのリンク情報が付されていることを示す識別タグに,単語AAAが含まれている場合に,これを分類語であると認定し,この分類語を含むウェブサイトを選定してもよい。また,フォントの色や大きさを変更することを示す識別タグに,単語AAAが含まれている場合に,これを分類語であると認定し,この分類語を含むウェブサイトを選定しても良い。
分類語の一例は,タグである。タグは,ウェブサイトにおける文章に含まれる単語群に関連する単語であり,ウェブページ上に表示されている。また,タグは,ウェブサイトにおける文章に含まれる単語群の主意を示すものとしてウェブページ上に表示されているテキスト情報であるともいえる。また,タグは,ウェブサイトにおける文章に含まれる単語群の意味を分類するものとしてウェブページ上に表示されるテキスト情報であるともいえる。例えば,HTMLなどの識別タグを用いて,「〈A Href=“URL”〉かわいい〈/A〉」と表現すると,ウェブページ上には,「かわいい」という単語にURLのリンク情報が張られて表示される。ここでは,「かわいい」という単語をタグ,「〈A Href=“URL”〉〈/A〉」を識別タグと呼び,区別する。すなわち,本発明は,タグ「かわいい」を抽出する。
例えば,このタグは,ウェブページに表示される記事文章などに対して,その記事の意味を分類する単語として,ウェブサイト運営者によって,一又は複数個付与される。そして,タグは,その記事文章と同一ページ内に表示されている。また,タグは,ブログサイトや動画共有サイト等の投稿サイトにおいては,投稿情報の意味を分類する単語として,投稿者自身によって,一又は複数個付与される。そして,この場合も,タグは,その投稿情報と同一ページ内に表示されている。また,本発明は,動画共有サイトのような,文章を主とするウェブサイトでなくても,コンピュータにより,その動画共有サイトにおけるタグなどの分類語と関連している文章から単語を抽出し,その分類語とその単語の関連性を数値化することができる。
分類語の他の例は,カテゴリーである。カテゴリーは,ツリー構造となっているウェブサイトのディレクトリを示す単語であり,ウェブページ上に表示される。また,カテゴリーは,ウェブサイトのコンテンツをあらかじめ分類した索引を表すテキスト情報であるとも言える。また。カテゴリーは,ウェブページ上の記事文書や投稿情報の当てはまる適切な分野や領域を表す単語である。例えば,カテゴリーは,「国内(大カテゴリー)>関東(中カテゴリー)>東京(小カテゴリー)」等のように階層化されていてもよい。カテゴリーには,他のウェブページへのリンク情報が張られており,このカテゴリーをクリックすることで,他のウェブページへリンクすることができるようになっていてもよい。
このようにして,コンピュータ2が,コンピュータ2と電子通信回線で接続されたウェブサイト3から,ある分類語を有する複数のウェブサイトを選定する(ステップ101)。
単語群抽出手段22は,ウェブサイト選定手段により選定されたウェブサイトにおける文章に含まれる単語群を抽出するための手段である。
ウェブサイトから単語群を抽出する方法は既に知られている。本発明は既に知られた方法を用いて単語群を抽出すればよい。単語群を抽出する方法の例は,コンピュータがあらかじめ複数の単語を記憶した単語データベース(コーパス)を有するものである。単語データベースの好ましい例は名詞データベースである。そして,ウェブサイトからテキストを抽出し,そのテキストに含まれる単語を抽出すればよい。ウェブサイトは,通常HTMLタグなどの識別タグが振られているので,それを解析することでテキストを容易に読み出すことができる。
このようにして,コンピュータ2が,ウェブサイト選定工程で選定されたウェブサイトにおける文章に含まれるある分類語と関連した単語群を抽出する(ステップ102)。
数値化手段23は,単語群抽出手段が抽出した単語群に含まれるそれぞれの単語について,ウェブサイト選定手段が選定したウェブサイトにおける頻度を計測し,ある分類語と単語の関連性を数値化するための手段である。
すなわち,ある分類語が登場するウェブページに含まれている語は,その分類語と関連がある可能性が高い。特に,ある分類語が登場するウェブページに必ず含まれている語があれば,近い将来もその分類語が登場するウェブページにその語が含まれている可能性が高い。このように,それぞれの単語について,それぞれのウェブサイトにおける頻度を求めることで,ある分類語と単語の関連性を数値化することができる。
また,ウェブページは,通常HTMLタグなどの識別タグが振られているので,それをコンピュータ2が解析することで,ウェブページを識別タグが含まれている部分に区分して,分類語が含まれる区分における単語群を抽出し,その区分における単語の頻度を求めても良い。このように区分に分類して共起関係を分類することで,より効果的かつ適切に関連語を抽出することができる。
このような,HTMLなどの識別タグを解析し,ウェブページを複数の区分に分割する工程である区分分割工程(ステップ105)は,コンピュータ2の区分分割手段26より実行される。
図4は,関連ウェブページの例を示す図である。通常,ウェブページは,ウェブページを作成するための言語により作成されている。そして,テキスト及び画像については,異なる識別タグが振られている。このため,例えば,識別タグの出現位置を把握することで,ウェブページ内のコンテンツをテキスト,及び画像に分類することができ,しかも関連ウェブページのテキスト及び画像の配置を把握することができる。ウェブページに振られた識別タグを用いて,ウェブページを構成するコンテンツをテキスト,及び画像に分類する。これにより,ウェブページのテキスト及び画像の配置を把握する。画像にはその付近の位置に画像を説明する文章が付されている。よって,画像がどのような属性のものであるか把握するためにウェブページを複数の区分に分割する。また,タイトルと本文とでは,フォントの大きさが異なっていたり,フォントの色が異なる場合がある。たとえば,フォントの大きさやフォントの色は,ウェブページを作成する言語における識別タグにより区別される。このため,識別タグを解析することで,フォントの相違を把握することができる。このようにして,ウェブページを複数の区分に分割することができる。またこの区分情報は手入力によって修正されてもよい。図5は,あるウェブサイトを区分に分割した例を示す図である。図中符号31は,分割された区分を示す。
コンピュータ2の区分分割手段26により分割されたウェブサイトの区分31に含まれる文章や動画を含むコンテンツと,タグやカテゴリーとしての分類語との関連づけを判断する例は,以下のものである。なお,ここでは,例として,A,B,Cの3つの分類語がウェブサイト上に表示されているものとする。まず,コンピュータ2のウェブサイト選定手段21は,Aが分類語として存在するウェブサイトを選定する。区分分割手段26は,そのウェブサイトを複数の区分に分割する。単語群抽出手段22は,分割された区分における文章が分類語Aと同じ単語を含むか否かを判断し,同じ単語を含む場合には,その区分おける文章から単語群を抽出する。そして,数値化手段23は,それぞれの単語について,分類語Aとの関連性を数値化する。同様のコンピュータによる処理を分類語B及びCについても行う。
また,ウェブサイトの区分における文章の中に分類語A,B,Cと同一の単語を含むものがない場合であっても,ウェブサイトのソースコードを解析することにより,分類語が区分と関連づけられているものと判断することができる。まず,コンピュータ2のウェブサイト選定手段21は,Aが分類語として存在するウェブサイトを選定する。区分分割手段26は,そのウェブサイトを複数の区分に分割する。単語群抽出手段22は,識別タグを解析し,分類語Aと,ある区分における文章が関連づけられていると判断した場合には,その区分に含まれる文章における単語群を抽出する。数値化手段23は,それぞれの単語について,分類語Aついての関連性を数値化する。同様のコンピュータによる処理を分類語B及びCについても行う。
なお,区分には,動画や音楽などの文章以外のコンテンツが含まれていても良い。この場合には,区分に含まれる文章のみとの関連性を数値化することとしても良い。また,区分に含まれる動画や音楽を解析し,その動画や音楽からテキスト情報を抽出し,そのテキスト情報との関連性を数値化しても良い。
頻度を求める方法は,たとえば,ある単語が出現した数を単語群に含まれる単語数で除したものがあげられる。すなわち,コンピュータ2が,あるウェブページ又はある区分に含まれる単語数を計算し,記憶部に記憶する。また,コンピュータ2がある単語が出現した数を計算し,記憶部に記憶する。そして,コンピュータ2の制御部は,記憶部から単語が出現した数nと,単語群に含まれる単語数mを読み出して,ある単語が出現した数を単語群に含まれる単語数で除する演算を行う。このようにして頻度(n/m)を求めることができる。
関連性を数値化するためには,たとえば,先に説明した頻度とともに,ある分類語が登場したウェブページ又は区分の数をM個として,ある単語がそれらのM個のウェブページ又は区分のうちN個に登場した場合に,N/Mを用いる方法があげられる。この場合の関連性の数値の例は,nN/mMである。これらの演算は,除乗演算を行うことで容易に求めることができる。なお,関連性を数値化する方法の例は,上記に限定されず,新たな統計理論を用いて,評価方法を適宜修正することができる。
このようにして,コンピュータ2が,単語群抽出工程で抽出した単語群に含まれるそれぞれの単語について,ウェブサイト選定工程で選定されたウェブサイトにおける頻度を計測し,ある分類語とそれぞれの単語の関連性を数値化する(ステップ103)。
記憶手段24は,ある分類語と関連して,ウェブサイト選定手段が選定したウェブサイトにおける文章に含まれる単語群のそれぞれの単語及び単語群に含まれるそれぞれの単語について数値化手段が求めた数値とをデータベース25に記憶させるための手段である。
コンピュータ2は,データベース25を有している。そして,そのコンピュータ2に含まれる記憶手段24は,そのデータベース25に各種情報を記憶させる。具体的には,コンピュータ2は,ある分類語を記憶するとともに,先に説明した単語群,単語群に含まれるそれぞれの単語についての関連性の数値を記憶している。そこで,コンピュータ2は,これらの情報を読み出して,それらを関連付けてデータベース25に格納する。
このようにすることでコンピュータ2が,ある分類語と関連して,ウェブサイト選定工程で選定されたウェブサイトにおける文章に含まれる単語群及び前記単語群に含まれるそれぞれの単語について前記数値化工程で得られた数値とをデータベース25に記憶させる(ステップ104)。この作業を複数の分類語について行う。このようにして,複数の分類語と,複数の分類語のそれぞれの分類語について関連する1又は複数の単語と,1又は複数の単語の分類語についての関連性の数値と,を関連付けて記憶したデータベースを得ることができる。
本発明の第一の側面の好ましい態様は,コンピュータと電子通信回線で接続された複数のウェブサイトから,ウェブサイト上に表示されるタグ又はカテゴリーとしての分類語群を抽出する分類語群抽出工程(ステップ100)をさらに有する,データベースの構築方法に関する。
図20は,分類語群抽出工程100をさらに有する,本発明の第一の側面の好ましい態様のデータベース構築方法のフローチャートである。本発明の第一の側面の好ましい態様は,分類語群抽出工程(ステップ100),ウェブサイト選定工程(ステップ101),単語群抽出工程(ステップ102),数値化工程(ステップ103),記憶工程(ステップ104)を含む。さらに,区分分割工程(ステップ105)を有していても良い。
図21は,分類語群抽出手段27をさらに有する,本発明の第一の側面の好ましい態様のデータベース構築方法を実現するためのシステムブロック図である。図21に示すように,本発明の第一の側面の好ましい態様においては,分類語群抽出手段27,ウェブサイト選定手段21,単語群抽出手段22,数値化手段23,記憶手段24を含む。さらに,区分分割手段26を有していても良い。
分類語群抽出手段27は,コンピュータと電子通信回線で接続された複数のウェブサイトから,ウェブサイト上に表示されるタグ又はカテゴリーとしての分類語群を抽出する手段である。
コンピュータのデータベース25には複数の分類語が格納されている。このデータベース25に格納されている分類語を用いて,ウェブサイトから分類語群を抽出してもよい。また。あらかじめ,分類語であることを識別する識別タグを定めておき,ウェブページを構成するソースコードの識別タグ(HTML等)を解析することで,ウェブページの中から分類語群を抽出することとしてもよい。また,例えば,ソースコードにおいて,ある単語とともに他のウェブサイトへのリンク情報(URL)が付されていた場合,そのリンク情報が付された単語を,分類語として特定し,抽出することができる。また,例えば,ある単語のフォントの色,フォントの大きさ等が他の単語と区別されている場合,その色等が区別された単語を,分類語として特定し,抽出することができる。また,ツリー構造となっているウェブサイトのソースコードを解析し,ディレクトリを特定することで,分類語としてのカテゴリーを抽出することができる。なお,分類語を抽出する方法は,これらの限定されるものではなく,当業者が想到しうる種々の方法を採用することができる。
このようにして,コンピュータ2が,複数のウェブサイト3の中から分類語群を抽出する。(ステップ100)
そして,ウェブサイト選定手段21は,コンピュータ2と電子通信回線で接続されたウェブサイトから,分類語群抽出手段27により抽出された分類語群に含まれる,ある分類語を有する複数のウェブサイトを選定する。(ステップ101)
ウェブサイト選定手段21は,ある分類語を有する複数のウェブサイトを選定する手段である。このウェブサイト選定手段21が,ウェブサイトを選定する際に参照するある分類語は,分類語群抽出手段27により,複数のウェブサイトから抽出された分類語群に含まれるものである。これにより,ウェブサイト選定手段21が,ウェブサイト選定の際に参照するある分類語についても,自動的かつリアルタイムに,複数のウェブサイトから抽出することができる。
このようにして,コンピュータ2は,ウェブサイト選定手段21が選定したウェブサイトにおける文章に含まれる単語群を抽出する(ステップ102)。
数値化手段23は,単語群抽出手段22が抽出した単語群に含まれるそれぞれの単語について,ウェブサイト選定手段21が選定したウェブサイトに含まれる文章における頻度を計測し,前記ある分類語とそれぞれの単語の関連性を数値化する(ステップ103)。
記憶手段は,前記ある分類語と関連して,ウェブサイト選定手段21が選定したウェブサイトにおける文章に含まれる単語群のそれぞれの単語及び単語群に含まれるそれぞれの単語について数値化手段23により得られた数値とをコンピュータのデータベース25に記憶させる(ステップ104)。
区分分割手段26は,ウェブページ選定手段21が選定したウェブページに振られているHTMLタグなどの識別タグを解析し,ウェブページを識別タグが含まれている区分に分割する(ステップ105)。これにより,単語群抽出手段22は,前記ある分類語が含まれる区分における単語群を抽出する(ステップ102)。そして,数値化手段23は,単語群抽出手段が抽出した単語群に含まれる単語の頻度を求め,前記ある分類語とそれぞれの単語の関連性を数値化することとしても良い(ステップ103)。
本発明の第2の側面は,データベースを用いたコンピュータによる情報推奨方法に関する。このデータベースは,基本的には第1の側面のデータベースを構築する方法により構築されたデータベースである。すなわち,このデータベースは,複数の分類語と,複数の分類語のそれぞれの分類語について関連する1又は複数の単語と,1又は複数の単語のそれぞれの分類語についての関連性の数値とを関連付けて記憶したデータベースである。
この方法は,以下のようにして情報を推奨する。図6は,本発明のデータベースを用いたコンピュータによる情報推奨方法を説明するためのフローチャートである。図6に示されるように,この方法は,単語抽出工程(ステップ201),分類語抽出工程(ステップ202),ウェブページ検索工程(ステップ203),及びリンク表示工程(ステップ204)を含む。
図7は,この情報推奨方法を実現するコンピュータのブロック図である。図7に示されるようにこのコンピュータ2は,単語抽出手段41,分類語抽出手段42,ウェブページ検索手段43,リンク表示手段44及びデータベース45を含む。
単語抽出手段41は,あるウェブページに含まれる単語を抽出するための手段である。
コンピュータ2に,あるウェブページのテキストが入力される。すると,コンピュータ2の単語抽出手段41は,そのウェブページに含まれる単語を抽出する。単語は,1語又は複数の語である。単語を抽出する方法は先に説明したとおりである。すなわち,ウェブページを区分に分解して,適宜単語データベースにアクセスし,ウェブページに含まれる単語を抽出すればよい。
このようにして,コンピュータ2は,あるウェブページに含まれる単語を抽出する(ステップ201)。
分類語抽出手段42は,単語抽出手段が抽出した単語を用いて,データベースにアクセスし,データベースから分類語を抽出する。すなわち,単語抽出手段が抽出した単語はコンピュータ2の記憶部に記憶される。そして,記憶された単語を読み出して,データベースにアクセスし,その単語と関連性の数値が高い分類語を抽出する。そして,複数の分類語が抽出された場合は,複数の単語について関連性が高いとされた分類語を1つ又は2つ以上抽出する。また,たとえば,ウェブページに複数の単語が含まれている場合,それら複数の単語に対応する分類語をそれぞれ求める。そして,最も出現頻度の高い分類語を1つ又は2つ以上抽出してもよい。このようにして,あるウェブページに関連する分類語を抽出することで,ウェブページの主意を適切に把握することができる。
このようにして,コンピュータ2は,単語抽出工程で抽出した単語を用いて,前記データベースにアクセスし,前記データベースから分類語を抽出する(ステップ202)。
ウェブページ検索手段43は,分類語抽出手段が抽出した分類語を用いて関連するウェブページを検索するための手段である。
関連するウェブページの例は,先に説明したあるウェブページと同じウェブサイトに含まれるウェブページである。すなわち,コンピュータ2は,あるウェブサイト内のウェブページを記憶している。そして,分類語を読み出すとともに,ウェブサイトを1つずつ読み出して,この分類語が含まれるウェブページを検索する。すると,この分類語を含むウェブページを抽出できる。また,後に説明するように,コンピュータ2は,あらかじめウェブページに分類語を割り振っておき,その上で,分類語抽出手段が抽出した分類語と同じ又は類似度の高い分類語を有するウェブページを抽出するようにしてもよい。
勿論,コンピュータ2がインターネットに接続されていれば,分類語抽出手段が抽出した分類語を含むかその分類語と関連の高いウェブページを,インターネットを介して検索してもよい。
このようにして,コンピュータ2は,分類語抽出工程で抽出された分類語を用いて関連するウェブページを検索する(ステップ203)。
リンク表示手段44は,ウェブページ検索手段が検索し抽出したウェブページへのリンクを表示するための手段である。たとえば,あるウェブサイト内のウェブページへのリンクを表示する場合,コンピュータ2はそれぞれのウェブページを表示するためのリンク情報を記憶している。よって,リンク表示手段44は,検索したウェブページへのリンク情報を記憶部から読み出して,単語を抽出したウェブページにこれらのリンク情報が表示されるようにすればよい。すると,コンピュータ2は,単語を抽出したウェブページとともに,リンク情報をも表示できるようになる。
また,ウェブページ検索手段43がコンピュータ2とインターネットで接続されたサーバが提供するウェブページを検索した場合,検索することによって得られたウェブページへのアクセス情報(たとえば,URL)をコンピュータ2が記憶する。そして,記憶したアクセス情報をリンク情報として用いて,上記と同様に表示に用いればよい。
このようにして,コンピュータ2は,ウェブページ検索工程で検索されたウェブページへのリンクを表示することができる(ステップ204)。
このようにすることで,あるウェブページに関連のある情報を自動的にリンク表示することができる。しかも,あるウェブページに含まれる単語を用いて関連するウェブページを検索するのではなく,あるウェブページと関連する分類語を用いて関連するウェブページを検索することで,そのウェブページの文意を適切に把握して,嗜好性などを反映した関連ページを効果的に表示することができる。
すなわち,あるウェブページに陽には出現しないが,そのウェブページの文意や嗜好性を適切に表現している単語(分類語)を用いて関連するウェブページの検索を行うことができる。ウェブページの文意は,時とともに移ろいゆくものであるが,これにより,その時にあった文意を適切に把握して検索を行うことができる。従って,本発明は,その文意や嗜好性をリアルタイムに反映した関連ページを効果的に推奨することができる。
本発明の第3の側面は,データベースを用いたコンピュータによる広告等の情報マッチング方法に関する。このデータベースは,基本的には第1の側面のデータベースを構築する方法により構築されたデータベースである。すなわち,このデータベースは,複数の分類語と,複数の分類語のそれぞれの分類語について関連する1又は複数の単語と,1又は複数の単語のそれぞれの分類語についての関連性の数値とを関連付けて記憶したデータベースである。
なお,本発明の第3の側面が,広告に関する情報マッチングに限定されないことは先に述べた通りである。
図8は,本発明のマッチング方法を説明するためのフローチャートである。図8に示されるように,このマッチング方法は,以下のようにしてマッチングを行う。
第1の単語抽出工程(ステップ301),第1の分類語抽出工程(ステップ302),及び関連分類語記憶工程(ステップ303)により,複数のウェブページについてそれらの分類語を決定する。この複数のウェブページは広告を媒介とした広告リンク先ウェブページでもよい。
それと,並行して,第2の単語抽出工程(ステップ311),第2の分類語抽出工程(ステップ312)により,あるクライアントを使用するユーザの嗜好を分析する。
そして,ウェブページ選択工程(ステップ321),及びアクセス情報表示工程(ステップ322)により,各ウェブページ,あるいは広告を媒介とした広告リンク先ウェブページとユーザの嗜好とのマッチングを行う。
図9は,本発明のマッチング方法を実現するためのコンピュータのブロック図である。図9に示されるように,このコンピュータ2は,第1の単語抽出手段51,第1の分類語抽出手段52,関連分類語記憶手段53,第2の単語抽出手段54,第2の分類語抽出手段55,ウェブページ選択手段56,アクセス情報表示手段57,及びデータベース58を有する。
第1の単語抽出手段51は,複数のウェブページのそれぞれのウェブページに含まれる単語を抽出するための手段である。複数のウェブページはあるウェブサイトに内包されるウェブページ群であっても良いし,コンピュータ2とインターネットで接続されたサーバにより提供されるウェブページであってもよい。また広告を媒介とした広告リンク先ウェブページでもよい。ウェブページから単語を抽出する方法は先に説明したとおりである。先に説明したと同様にして,コンピュータ2は,複数のウェブページのそれぞれのウェブページに含まれる単語を抽出する(ステップ301)
第1の分類語抽出手段52は,第1の単語抽出手段が抽出した単語を用いて,データベースにアクセスし,データベースから分類語を抽出し,これによりそれぞれのウェブページに関連する分類語を抽出するための手段である。第1の分類語抽出手段52は,先に説明した分類語抽出手段と同様にして分類語を抽出する。よって,先に説明したと同様にして,コンピュータ2は,第1の単語抽出工程で抽出した単語を用いて,データベースにアクセスし,データベースから分類語を抽出し,これによりそれぞれのウェブページに関連する分類語を抽出する(ステップ302)。
関連分類語記憶手段53は,先に説明したそれぞれのウェブページへのアクセス情報と,分類語抽出工程で抽出したそれぞれのウェブページに関連する分類語とを関連付けて記憶するための手段である。関連分類語記憶手段53は,これらの情報をデータベース58に記憶させるようにしてもよい。この際の処理も先に説明した処理を適宜用いればよい。これにより,先に説明したそれぞれのウェブページへのアクセス情報と,分類語抽出工程で抽出したそれぞれのウェブページに関連する分類語とを関連付けて記憶する(ステップ303)。
第2の単語抽出手段54は,あるクライアントのアクション情報に含まれる単語を抽出するための手段である。あるクライアントには,ユーザによるアクションの履歴が残っている。アクションの履歴の例は,インターネット検索に用いた語,閲覧したウェブページ,インターネットログ,及びクッキーに蓄積されたサイト情報である。
アクション情報に含まれる単語とは,例えば,クライアントが,閲覧したウェブページに含まれる単語であってもよい。また,クライアントが,閲覧したウェブページに含まれる単語群を用いて,データベースにアクセスし,抽出された分類語であってもよい。これにより,真にクライアントの嗜好や興味を反映した,情報のマッチングを行うことができる。
第2の単語抽出手段54は,クライアント4の記憶部に記憶されたこれらの情報のいずれか又は2種以上を読み出す。そして,第2の単語抽出手段54は,読み出したこれらの情報に含まれる単語を抽出する。単語の抽出処理は先に説明したと同様にして行うことができる。このようにして,コンピュータ2は,あるクライアントのアクション情報に含まれる単語を抽出する(ステップ311)。コンピュータ2とあるクライアントとは同一の端末であってもよいし,コンピュータ2とあるクライアントとはインターネットを介して接続された別の端末であってもよい。
第2の分類語抽出手段55は,第2の単語抽出手段が抽出した単語を用いて,データベースにアクセスし,データベースから分類語を抽出し,これによりそれぞれのクライアントに関連する分類語を抽出するための手段である。第2の分類語抽出手段55による処理は先に説明したと同様である。このようにして,第2の単語抽出工程で抽出した単語を用いて,前記データベースにアクセスし,前記データベースから分類語を抽出し,これによりそれぞれのクライアントに関連する分類語を抽出する(ステップ312)。
ウェブページ選択手段56は,第2の分類語抽出手段が抽出した分類語と,第1の分類語抽出手段が抽出した分類語とを用いて,第2の分類語抽出手段が抽出した分類語と関連のある分類語を有するウェブページを求めるための手段である。第2の分類語抽出手段が抽出した分類語はユーザの嗜好を反映したものである。そして,第1の分類語抽出手段が抽出した分類語は,それぞれのウェブページの主意を反映したものである。これらをマッチングさせることで,ユーザの嗜好にマッチしたウェブページ,あるいは広告を媒介とした広告リンク先ウェブページを選択することができる。分類語同士のマッチング処理は,たとえば,特開2009−259258号公報に開示されたタグの類似度を求める方法により実現できる。このようにして,第2の分類語抽出工程で抽出した分類語と,第1の分類語抽出工程抽出した分類語とを用いて,第2の分類語抽出工程で抽出した分類語と関連のある分類語を有するウェブページを求める(ステップ321)。
また,例えば,広告を媒介とした広告リンク先ウェブページの場合,広告素材(テキスト,画像等)の入稿時に人手によって分類語が割り当てられるケースがある。この場合には,第一の分類語抽出工程(ステップ302)で抽出された分類語の代わりに,この人手によって割り当てられた分類語を用いて,分類語同士のマッチング処理を行うこととしてもよい。
アクセス情報表示手段57は,関連分類語記憶工程で記憶したウェブページへのアクセス情報を,クライアント4に表示させるための手段である。これにより,コンピュータ2は,関連分類語記憶工程で記憶したウェブページ,あるいは広告を媒介とした広告リンク先ウェブページへのアクセス情報を,前記クライアント4に表示させる(ステップ322)。
実施例1は,分類語を有するウェブサイトと当該分類語を含むウェブサイトに含まれる単語群の関係性をスコア化するためのデータベースの構築方法に関する。
この例では,コンピュータ2が,データベースを有している。たとえば,データベースに分類語として「かわいい」が格納されているとする。このデータベースには,分類語「かわいい」に関連した単語群「ペット」,「ねこ」,単語群を含むウェブページのURL,分類語の「かわいい」との関連性を示す値が格納されている。そして,コンピュータ2は,コンピュータ2と電子通信回線で接続されたウェブサイトから,分類語「かわいい」を有する複数のウェブサイトを選定する(ステップ101)。
そして,コンピュータ2は,選定したウェブサイトからテキストを適宜抽出して,ウェブサイトにおける文章に含まれる単語群を抽出する(ステップ102)。
コンピュータ2は,抽出された単語群の文字数を算出する。そして,たとえば,「ペット」という語の出現回数も算出する。また,コンピュータ2は,選定したウェブサイトの数を算定するとともに,選定したウェブサイトのうちいくつのサイトに「ペット」という語が出現したか算定する。そして,これらの情報を用いて,コンピュータ2は,単語群抽出工程で抽出した単語群に含まれるそれぞれの単語について,ウェブサイト選定工程で選定されたウェブサイトにおける頻度を計測し,ある分類語「かわいい」と単語「ペット」の関連性を数値化する(ステップ103)。
そののち,コンピュータ2は,ある分類語「かわいい」と関連して,データベースに記憶されている単語「ペット」についての関連性の数値を更新する(ステップ104)。分類語「かわいい」について「ねこ」も同様にして関連性の数値を更新することができる。この作業をすべての分類語について繰り返し行い続けることで,ある分類語と関連のある単語を常にアップデートすることができる。
実施例2は,データベースを用いたコンピュータによる情報推奨方法に関する。コンピュータに,あるウェブページのテキストが入力される。図10は,コンピュータにあるウェブページのテキストが入力された様子を示す概念図である。
すると,本発明のコンピュータ2は,そのウェブページ61に含まれる単語を抽出する(ステップ201)。
コンピュータ2は,抽出した単語を用いて,データベースにアクセスし,データベースから分類語を抽出する(ステップ202)。この際の分類語の例は,たとえば,国内旅行,熱海,及び高級旅館である。なお,抽出した単語には,たとえば,「国内旅行」,「熱海」の語が含まれているが,「高級旅館」という単語が含まれていなくてもよい。たとえば,ウェブページ61に含まれる「1泊10万円」,「離れ」,及び「海鮮料理」などの言葉から分類語「高級旅館」が抽出されればよい。
コンピュータ2は,分類語「国内旅行」,「熱海」,及び「高級旅館」を用いて関連するウェブページを検索する(ステップ203)。この検索は,ウェブページ61が格納されているサーバと同じサーバに格納されているウェブページについて行ってもよい。
コンピュータ2は,ウェブページ検索工程で検索されたウェブページへのリンク62を表示する(ステップ204)。図11は,リンク表示が行われたウェブサイトの例である。図11に示されるように,コンピュータ2は,上記の分類語と関連度が高いウェブページに含まれる画像をも把握し,これらを合わせて表示するようにしてもよい。
この実施例は,新聞記事がウェブページのテキストとしてクライアントに入力された場合に,その新聞記事に関連するウェブページのリンクを自動的に表示できるようにしてもよい。たとえば,芸能ニュースの記事を作成した場合,その記事がクライアントに入力されると,芸能人に関連した過去の記事が自動的にリンクされて,記事の下方部分に表示されるようにしてもよい。
実施例3は,データベースを用いたコンピュータによる広告等の情報マッチング方法に関する。コンピュータ2は,複数のウェブページのそれぞれのウェブページに含まれる単語を抽出する(ステップ301)。そして,それぞれのウェブページに関連する分類語を抽出する(ステップ302)。それぞれのウェブページへのアクセス情報と,それぞれのウェブページに関連する分類語(ウェブページの主意を示す分類語)とを関連付けて記憶する(ステップ303)。
図12は,ある検索サイトの表示画面である。この検索サイトはサーチバー71を含む。サーチバー71に検索語が入力される。すると,クライアントは,サーチバーに入力された単語を記憶部に記憶する。この作業を,繰り返すと,クライアントにより入力された単語が複数記憶されることとなる。
そして,コンピュータ2は,クライアントの記憶部に記憶されたサーチバーに入力された単語を読み出す(ステップ311)。ここで読み出す情報はサーチバーに入力された単語に限定されず,ユーザによるアクション履歴のうち,いずれか又は2種以上でもよい。コンピュータ2は,この単語を用いて,分類語(ユーザの嗜好を示す分類語)を抽出する(ステップ312)。
アクション情報に含まれる単語としては,例えば,クライアントが,閲覧したウェブページに含まれる単語を用いる。また,クライアントが,閲覧したウェブページに含まれる単語群を用いて,データベースにアクセスし,抽出された分類語を用いる。
その後,コンピュータ2は,ウェブサイトの主意を示す分類語と,ユーザの嗜好を示す分類語とのマッチングを行う。これにより,ユーザの嗜好にマッチしたウェブページ,あるいは広告を媒介とした広告リンク先ウェブページを求める(ステップ321)。その後,コンピュータ2は,ユーザの嗜好にマッチしたウェブページへのリンク情報を含めたウェブページへのアクセス情報に表示させる(ステップ322)。図13は,お薦め機能つき検索サイトのお薦め領域に,ユーザの嗜好にマッチしたウェブページの情報が表示された例を示す。またこれはユーザの嗜好にマッチした広告を媒介とした広告リンク先ウェブページであってもよい。図13において,符号72は,検索サイトのお薦め領域である。
実施例4は,本発明の第1の側面(データベースの構築方法),本発明の第2の側面(情報推奨方法)及び本発明の第3の側面(情報のマッチング方法)において用いられる分類語に関する。実施例4は,特に,あるウェブサイトの運営者によって付された分類語としてのタグに関する。
図14は,あるニュースサイトの表示画面である。このニュースサイトはタグ81を含む。このタグ81は,ニュースサイトの運営者により付されたものである。タグ81は,ウェブページ(「今日のニュース」)に含まれる文章に関連している。例えば,記事73に記載されているニュースに登場した用語が,専門的である等の理由により,一般的な閲覧者では理解することが困難であると考えられる場合,このニュースサイトの運営者は,その用語をタグ81とする。そして,運営者は,このタグに81に,その用語を説明するサイトへのリンク情報を付しておく。これにより,ニュースサイトの閲覧者は,そのタグ81を介して,その用語を説明するサイトへリンクすることができる。
例えば,本発明の第1の側面(データベースの構築方法)においては,単語群抽出手段により,このタグ81と関連している記事73から単語群を抽出する。(ステップ103)その後,数値化手段により,記事73から抽出した単語群に含まれるそれぞれの単語について,記事73における出現頻度を計測し,タグ81(用語)とその単語の関連性を数値化する。(ステップ104)そして,タグ81(用語)と,記事73含まれる単語群及び単語群に含まれる単語について得られた関連性の数値を,コンピュータのデータベースに記憶する。(ステップ105)
実施例5は,本発明の第1の側面(データベースの構築方法),本発明の第2の側面(情報推奨方法)及び本発明の第3の側面(情報のマッチング方法)において用いられる分類語に関する。実施例5は,特に,ある投稿サイトの投稿者によって付された分類語としてのタグに関する。
図15は,ある投稿サイト(いわゆるブログサイト)の表示画面である。このブログサイトはタグ81を含む。このタグ81は,投稿サイトの投稿者によって付されたものである。タグ81は,ウェブページ(「今日の出来事」)に含まれる文章の内容を端的に表すために付されたものである。例えば,ブログ74を作成した投稿者が,このブログ74に記載された「今日の出来事」の内容を端的に表現したいと思った場合,そのブログを端的に表す単語をタグ81とする。例えば,「今日の出来事」が,花見に行ったことや,団子を食べたことに関するブログである場合,タグ81は,「花見」「団子」等とすることができる。また,ブログ74に直接的に記載されていない単語であっても,「楽しい」「きれい」「×月×日」(日付)等をタグ81とすることができる。またこのタグ81には,他のウェブページへのリンク情報を付すことができる。この場合,例えば,投稿サイトの閲覧者が,「花見」のタグ81をクリックすると,「花見」に関するブログを集めカテゴリー化したサイトへリンクすることができるようになっている。ウェブページの閲覧者は,このタグ81を辿れば,タグに関する記事やブログがカテゴリー化されたサイトへリンクすることができる。また,このタグ81の種類が,投稿サイトの運営者によって,予め作成されたものである場合,投稿者はその中から選択して用いることができる。
実施例6は,本発明の第1の側面(データベースの構築方法),本発明の第2の側面(情報推奨方法)及び本発明の第3の側面(情報のマッチング方法)において用いられる分類語に関する。実施例6は,特に,あるウェブサイトの運営者によって設けられた分類語としてのカテゴリーに関する。
図16は,ある情報ポータルサイトの表示画面である。この情報ポータルサイトは,カテゴリー82を含む。このカテゴリー82は,情報ポータルサイトの運営者によって設けられたものである。また,このウェブサイトは,ツリー構造となっており,カテゴリー82は,ツリー構造のディレクトリを表している。また,カテゴリー82は,あらかじめウェブサイトの運営者が,ウェブページに表示される記事や文章などを,分野や領域別にまとめた索引情報である。例えば,情報ポータルサイトが,飲食店の検索に関するものである場合,ウェブページに付されたカテゴリー82は,「全国>関東>東京」のように表示されている。これにより,現在開いているウェブページは,「東京」のカテゴリーに属し,このウェブページに表示されている単語群は,「東京」の飲食店に関連するものであることがわかる。また,このカテゴリー82には,他のウェブページへのリンク情報を付すことができる。この場合,例えば,情報ポータルサイトの閲覧者が,「関東」のカテゴリー82をクリックすると,「関東」の飲食店に関連する情報をカテゴリー化して集めたサイトへリンクすることができる。
例えば,本発明の第1の側面(データベースの構築方法)においては,単語群抽出手段により,このカテゴリー82が含まれるウェブページから単語群を抽出する。(ステップ103)その後,数値化手段により,ウェブページから抽出した単語群に含まれるそれぞれの単語について,ウェブページにおける出現頻度を計測し,カテゴリーとその単語の関連性を数値化する。(ステップ104)そして,カテゴリー82と,ウェブページ含まれる単語群及び単語群に含まれる単語について得られた関連性の数値を,コンピュータのデータベースに記憶する。(ステップ105)
実施例7は,本発明の第1の側面(データベースの構築方法),本発明の第2の側面(情報推奨方法)及び本発明の第3の側面(情報のマッチング方法)において用いられる分類語に関する。実施例7は,特に,ある投稿サイトの投稿者が選択した分類語としてのカテゴリーに関する。
図17は,ある動画共有サイトの表示画面である。この動画共有サイトは,カテゴリー82を含む。このウェブサイトは,ツリー構造となっており,カテゴリー82は,ツリー構造のディレクトリを表している。このカテゴリー82は,あらかじめ投稿サイトの運営者が用意した複数の分野や領域の中から投稿者自身が選択することによって割り当てられた索引情報である。例えば,ウェブページに付されたカテゴリー82は,動画共有サイトにおいて閲覧できる「映画」「ドラマ」「アニメ」等のように表示されている。動画の投稿者は,このカテゴリー82の中から,自らが投稿する動画に最も適していると考えるカテゴリーを選択して,投稿を行う。例えば,現在開いているウェブページは,「アニメ」のカテゴリーに属するため,このウェブページに表示されている単語群は,「アニメ」に関連するものであることがわかる。また,このカテゴリー82には,他のウェブページへのリンク情報を付すことができる。この場合,例えば,動画共有サイトの閲覧者が,「ドラマ」のカテゴリー82をクリックすると,「ドラマ」の動画に関連する情報をカテゴリー化して集めたサイトへリンクすることができる。
実施例8は,本発明の第1の側面(データベースの構築方法),本発明の第2の側面(情報推奨方法)及び本発明の第3の側面(情報のマッチング方法)において用いられる分類語に関する。実施例8は,分類語としてのタグ及びカテゴリーの両方が付されたウェブサイトに関する。
図18は,ある情報ポータルサイトの表示画面である。この情報ポータルサイトは,タグ81及びカテゴリー82を含む。タグ81は,投稿者によって付されたものであり,コメント75の内容を端的に表示している。また,このカテゴリー82は,情報ポータルサイトの運営者によって付されたものであり,分野や領域別にまとめられた索引情報となっている。
実施例9は,ウェブサイトに含まれる分類語と当該分類語を含むウェブサイトに含まれる単語群の関係性をスコア化するためのデータベースの構築方法に関する。特に,実施例9は,分類語群抽出工程を含むデータベースの構築方法に関する。
この例では,コンピュータ2が,複数のウェブページから,タグとしてウェブページ上に表示されている分類語群を抽出する。たとえば,ウェブページ上にタグとして「かわいい」が表示されていたとする。このウェブページには,タグ「かわいい」と関連した文章の中に「ペット」「ねこ」などの単語が含まれている。また,他のウェブページにはタグとして「きれい」や「かっこいい」が表示されていたとする。コンピュータ2は,このコンピュータ2と電子通信回線を介して接続されているこれらのウェブサイトから,分類語タグとしての「かわいい」,「きれい」及び「かっこいい」を抽出する(ステップ100)。
そして,コンピュータ2は,ウェブサイトから抽出した,タグ「かわいい」,「きれい」,「かっこいい」うち,例えば「かわいい」を有する複数のウェブサイトを,電子通信回線を介して接続されているウェブサイトから,選定する(ステップ101)。
コンピュータ2は,選定したウェブサイトからテキストを適宜抽出して,ウェブサイトにおける文章に含まれる単語群を抽出する(ステップ102)。
コンピュータ2は,抽出された単語群の文字数を算出する。そして,たとえば,「ペット」という語の出現回数も算出する。また,コンピュータ2は,選定したウェブサイトの数を算定するとともに,選定したウェブサイトのうちいくつのサイトに「ペット」という語が出現したか算定する。そして,これらの情報を用いて,コンピュータ2は,単語群抽出工程で抽出した単語群に含まれるそれぞれの単語について,ウェブサイト選定工程で選定されたウェブサイトにおける頻度を計測し,ある分類語「かわいい」と単語「ペット」の関連性を数値化する(ステップ103)。
その後,コンピュータ2は,ある分類語「かわいい」と関連して,データベースに記憶されている単語「ペット」についての関連性の数値を更新する(ステップ104)。分類語「かわいい」について「ねこ」も同様にして関連性の数値を更新することができる。
この作業を,前記コンピュータ2がウェブサイトから抽出したタグである分類語「きれい」「かっこいい」についても繰り返し行うことで,ある分類語と関連のある単語及びその関連性の数値を記憶したデータベースを構築することができる。また,コンピュータ2に対し,ウェブサイトから分類語を抽出する処理を,定期的に行うように,プログラミングしておくことで,自動的かつリアルタイムにデータベースをアップデートすることができる。
本発明は情報通信技術に関するため,情報通信関連の分野において利用されうる。
2 コンピュータ
21 ウェブサイト選定手段
22 単語群抽出手段
23 数値化手段
24 記憶手段
25 データベース
26 区分分割手段
27 分類語群抽出手段

Claims (10)

  1. ウェブサイトにタグ又はカテゴリーとして表示される複数の分類語と,前記複数の分類語のそれぞれの分類語について関連する1又は複数の単語と,前記1又は複数の単語の前記それぞれの分類語についての関連性の数値と,を関連付けて記憶したデータベースを用いたコンピュータによる情報マッチング方法であって,
    コンピュータが,前記コンピュータと電子通信回線で接続されたサーバが提供するウェブサイトから,前記ある分類語を有する複数のウェブサイトを選定するウェブサイト選定工程と,
    前記コンピュータが,前記ウェブサイト選定工程で選定されたウェブサイトにおける文章に含まれる単語群を抽出する単語群抽出工程と,
    前記コンピュータが,前記単語群抽出工程で抽出した単語群に含まれるそれぞれの単語について,前記ウェブサイト選定工程で選定されたウェブサイトに含まれる文章における頻度を計測し,前記ある分類語と前記それぞれの単語の関連性を数値化する数値化工程と,
    前記コンピュータが,前記ある分類語と関連して,前記ウェブサイト選定工程で選定されたウェブサイトにおける文章に含まれる単語群のそれぞれの単語及び前記単語群に含まれるそれぞれの単語について前記数値化工程で得られた数値とを前記コンピュータのデータベースに記憶させる記憶工程と,により,
    前記データベースを構築する工程と,
    複数のウェブページのそれぞれのウェブページに含まれる単語を抽出する第1の単語抽出工程と,
    前記第1の単語抽出工程で抽出した単語を用いて,前記データベースにアクセスし,前記データベースから分類語を抽出し,これによりそれぞれのウェブページに関連する分類語を抽出する,第1の分類語抽出工程と,
    前記それぞれのウェブページへのアクセス情報と,前記分類語抽出工程で抽出したそれぞれのウェブページに関連する分類語とを関連付けて記憶する関連分類語記憶工程と,
    あるクライアントがインターネット検索に用いた単語,又は前記あるクライアントが閲覧したウェブページに含まれる単語を抽出する第2の単語抽出工程と,
    前記第2の単語抽出工程で抽出した単語を用いて,前記データベースにアクセスし,前記データベースから分類語を抽出し,これによりそれぞれのクライアントに関連する分類語を抽出する,第2の分類語抽出工程と,
    前記第2の分類語抽出工程で抽出した分類語と,前記第1の分類語抽出工程で抽出した分類語とを用いて,前記第2の分類語抽出工程で抽出した分類語と関連のある分類語を有するウェブページを求めるウェブページ選択工程と,
    前記関連分類語記憶工程で記憶したウェブページへのアクセス情報から,前記ウェブページ選択工程により選択したウェブページへのアクセス情報を読み出して,前記クライアントに表示させるアクセス情報表示工程と,
    を含み,
    これにより,あるクライアントから読み取れるクライアントのユーザの嗜好と,その嗜好にふさわしいウェブページとをマッチングさせることができる,コンピュータによる情報マッチング方法。
  2. 前記タグは,ウェブサイトにおける文章に含まれる単語群の主意を示すものとして当該ウェブサイトに表示されるテキスト情報である
    請求項1に記載の情報マッチング方法。
  3. 前記タグは,ウェブサイトにおける文章に含まれる単語群に関連するものとして当該ウェブサイトに表示されるテキスト情報である
    請求項1に記載の情報マッチング方法。
  4. 前記タグは,ウェブサイトにおける文章に含まれる単語群の意味を分類するものとして当該ウェブサイトにリンクとともに表示されるテキスト情報である
    請求項1に記載の情報マッチング方法。
  5. 前記カテゴリーは,ツリー構造のウェブサイトのディレクトリを表すものとして当該ウェブサイトに表示されるテキスト情報である
    請求項1に記載の情報マッチング方法。
  6. 前記カテゴリーは,ウェブサイトのコンテンツをあらかじめ分類した索引を表すものとして当該ウェブサイトに表示されるテキスト情報である
    請求項1に記載の情報マッチング方法。
  7. 前記分類語は,他のウェブサイトへのリンク情報が付されている
    請求項1に記載の情報マッチング方法。
  8. 前記ウェブサイト選定工程では,前記コンピュータが,ウェブサイトに振られている識別タグに基づいて,前記ある分類語を有する複数のウェブサイトを抽出する
    請求項1に記載の情報マッチング方法。
  9. 前記コンピュータが,前記ウェブサイト選定工程で選定されたウェブサイトを,識別タグを解析することにより,複数の区分に分割する区分分割工程を,さらに有し,
    前記単語群抽出工程において,前記コンピュータが,前記区分割工程で分割されたウェブサイトの区分における文章のうち,前記ある分類語が含まれる区分における文章から単語群を抽出する,
    請求項1に記載の情報マッチング方法。
  10. 前記コンピュータが,前記コンピュータと電子通信回線で接続された複数のウェブサイトから,ウェブサイト上に表示されるタグ又はカテゴリーとしての分類語群を抽出する分類語群抽出工程を,さらに有し
    前記ウェブサイト選定工程において,前記コンピュータが,前記コンピュータと電子通信回線で接続されたウェブサイトから,前記分類語群抽出工程で抽出された分類語群に含まれる,ある分類語を有する複数のウェブサイトを選定する,
    請求項1に記載の情報マッチング方法。
JP2010102013A 2009-12-31 2010-04-27 ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法 Active JP4637969B1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2010102013A JP4637969B1 (ja) 2009-12-31 2010-04-27 ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
PCT/JP2010/007477 WO2011080899A1 (ja) 2009-12-31 2010-12-24 情報推薦方法
EP10840759.4A EP2521044A4 (en) 2009-12-31 2010-12-24 INFORMATION RECOMMENDATION METHOD
US13/518,065 US8812505B2 (en) 2009-12-31 2010-12-24 Method for recommending best information in real time by appropriately obtaining gist of web page and user's preference

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2009299305 2009-12-31
JP2009299305 2009-12-31
JP2010102013A JP4637969B1 (ja) 2009-12-31 2010-04-27 ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法

Publications (2)

Publication Number Publication Date
JP4637969B1 true JP4637969B1 (ja) 2011-02-23
JP2011154668A JP2011154668A (ja) 2011-08-11

Family

ID=43768692

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010102013A Active JP4637969B1 (ja) 2009-12-31 2010-04-27 ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法

Country Status (4)

Country Link
US (1) US8812505B2 (ja)
EP (1) EP2521044A4 (ja)
JP (1) JP4637969B1 (ja)
WO (1) WO2011080899A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015204006A (ja) * 2014-04-15 2015-11-16 ピコもん株式会社 コンテンツ提供サーバ及びコンテンツ提供方法
JP2018156421A (ja) * 2017-03-17 2018-10-04 ヤフー株式会社 表示プログラム、表示方法、端末装置、生成装置、生成方法、及び生成プログラム
JP2019067433A (ja) * 2012-12-28 2019-04-25 株式会社ユニバーサルエンターテインメント 話題提供システム
CN112417269A (zh) * 2020-10-30 2021-02-26 南京湛杰信息科技有限公司 一种智能在线培训服务信息推送算法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8914388B2 (en) * 2011-02-18 2014-12-16 International Business Machines Corporation Centralized URL commenting service enabling metadata aggregation
JP2013065271A (ja) * 2011-08-27 2013-04-11 Keiko Takeda インターネットによる情報伝達・共有システム
US20130132209A1 (en) * 2011-11-11 2013-05-23 Google Inc. Generating an advertising campaign
JP5648008B2 (ja) * 2012-03-19 2015-01-07 日本電信電話株式会社 文書分類方法、装置、及びプログラム
KR101409386B1 (ko) 2012-09-21 2014-06-20 한양대학교 에리카산학협력단 웹 페이지 분석 장치 및 방법
US9621662B1 (en) * 2013-03-04 2017-04-11 Yelp Inc. Surfacing relevant reviews
US9898167B2 (en) * 2013-03-15 2018-02-20 Palantir Technologies Inc. Systems and methods for providing a tagging interface for external content
CN104102639B (zh) * 2013-04-02 2018-07-27 腾讯科技(深圳)有限公司 基于文本分类的推广触发方法和装置
JP5841108B2 (ja) * 2013-09-24 2016-01-13 ビッグローブ株式会社 情報処理装置、記事情報生成方法およびプログラム
DE102014207741A1 (de) * 2014-04-24 2015-10-29 BSH Hausgeräte GmbH System und Vorrichtung für die Interaktion mit vernetzten Hausgeräten und damit verbundenen Funktionen und Dienstleistungen
CN105069148A (zh) * 2015-08-21 2015-11-18 成都秋雷科技有限责任公司 一种相关网页检索的方法
CN107194769A (zh) * 2017-05-17 2017-09-22 东莞市华睿电子科技有限公司 一种基于用户搜索内容的商品推荐方法
CN107704500B (zh) * 2017-08-28 2021-05-14 昆明理工大学 一种基于语义分析与多重余弦定理的新闻分类方法
US11112927B2 (en) * 2018-04-25 2021-09-07 Adobe Inc. Digital content automated layout system
CN108629010B (zh) * 2018-05-07 2022-03-18 南京大学 一种基于主题和服务组合信息的web服务推荐方法
US11218506B2 (en) * 2018-12-17 2022-01-04 Microsoft Technology Licensing, Llc Session maturity model with trusted sources
CN112100443B (zh) * 2020-08-03 2024-06-04 咪咕文化科技有限公司 视频标签的获取方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003345824A (ja) * 2002-05-30 2003-12-05 Toshiba Corp 文書検索装置及び文書検索方法、文書検索プログラム
JP2004054882A (ja) * 2002-05-27 2004-02-19 Ricoh Co Ltd 類義語検索装置、方法、プログラム及び記憶媒体

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2769109B1 (fr) 1997-09-26 1999-11-19 Gemplus Sca Dispositif electronique a puce jetable et procede de fabrication
US7725487B2 (en) * 2003-12-01 2010-05-25 National Institute Of Information And Communications Technology Content synchronization system and method of similar web pages
US20070174255A1 (en) * 2005-12-22 2007-07-26 Entrieva, Inc. Analyzing content to determine context and serving relevant content based on the context
US20080059486A1 (en) * 2006-08-24 2008-03-06 Derek Edwin Pappas Intelligent data search engine
JP4714710B2 (ja) 2007-06-15 2011-06-29 日本電信電話株式会社 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体
US7996390B2 (en) * 2008-02-15 2011-08-09 The University Of Utah Research Foundation Method and system for clustering identified forms
WO2009120906A1 (en) * 2008-03-26 2009-10-01 Linkshare Corporation Systems and methods for customizing an advertisement
KR100940365B1 (ko) 2008-04-11 2010-02-04 엔에이치엔(주) 웹 페이지에 포함되는 이미지에 대하여 태깅을 수행하고 그결과를 이용하여 웹 검색 서비스를 제공하기 위한 방법,장치 및 컴퓨터 판독 가능한 기록 매체
US20100057577A1 (en) * 2008-08-28 2010-03-04 Palo Alto Research Center Incorporated System And Method For Providing Topic-Guided Broadening Of Advertising Targets In Social Indexing
US8010545B2 (en) * 2008-08-28 2011-08-30 Palo Alto Research Center Incorporated System and method for providing a topic-directed search

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004054882A (ja) * 2002-05-27 2004-02-19 Ricoh Co Ltd 類義語検索装置、方法、プログラム及び記憶媒体
JP2003345824A (ja) * 2002-05-30 2003-12-05 Toshiba Corp 文書検索装置及び文書検索方法、文書検索プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019067433A (ja) * 2012-12-28 2019-04-25 株式会社ユニバーサルエンターテインメント 話題提供システム
JP2015204006A (ja) * 2014-04-15 2015-11-16 ピコもん株式会社 コンテンツ提供サーバ及びコンテンツ提供方法
JP2018156421A (ja) * 2017-03-17 2018-10-04 ヤフー株式会社 表示プログラム、表示方法、端末装置、生成装置、生成方法、及び生成プログラム
CN112417269A (zh) * 2020-10-30 2021-02-26 南京湛杰信息科技有限公司 一种智能在线培训服务信息推送算法

Also Published As

Publication number Publication date
EP2521044A4 (en) 2016-06-08
EP2521044A1 (en) 2012-11-07
US8812505B2 (en) 2014-08-19
JP2011154668A (ja) 2011-08-11
US20120259859A1 (en) 2012-10-11
WO2011080899A1 (ja) 2011-07-07

Similar Documents

Publication Publication Date Title
JP4637969B1 (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
US9235646B2 (en) Method and system for a search engine for user generated content (UGC)
JP5431727B2 (ja) 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム
US8209616B2 (en) System and method for interfacing a web browser widget with social indexing
US8484179B2 (en) On-demand search result details
US9798820B1 (en) Classification of keywords
CN107862553A (zh) 广告实时推荐方法、装置、终端设备及存储介质
KR101566616B1 (ko) 빅데이터 처리를 통한 광고의사결정시스템 및 방법
JP2010066870A (ja) 情報推薦装置および情報推薦方法
JP2010086343A (ja) ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム
JP2006268201A (ja) 記事又は話題を管理するためのプログラム
JP2013531289A (ja) 検索におけるモデル情報群の使用
KR20080111822A (ko) 사용자 검색어를 연동하여 가이드 정보, 랭킹 정보를제공하는 검색지원 정보 시스템.
CN103577490A (zh) 一种网页浏览历史展现方法及装置
US20160299951A1 (en) Processing a search query and retrieving targeted records from a networked database system
KR20070089898A (ko) 사용자 피드백을 이용하여 검색된 컨텐츠를 평가하고 평가결과를 이용하여 검색 결과를 제공하는 방법 및 장치
JP5313295B2 (ja) 文書探索サービス提供方法及びシステム
KR20160091756A (ko) 키워드 검색을 통한 웹 페이지의 상대적 품질 지수 평가 장치
US20130332440A1 (en) Refinements in Document Analysis
KR101850853B1 (ko) 빅데이터를 이용한 검색 방법 및 장치
KR20020028044A (ko) 데이터베이스 링크 키워드 포털서비스 방법
Kolli et al. A Novel Nlp And Machine Learning Based Text Extraction Approach From Online News Feed
Grüblbauer et al. Social media monitoring tools as instruments of strategic issues management
Fung et al. Discover information and knowledge from websites using an integrated summarization and visualization framework
KR101440385B1 (ko) 인디케이터를 이용한 정보 관리 장치

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101116

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20161203

Year of fee payment: 6

R150 Certificate of patent or registration of utility model

Ref document number: 4637969

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250