JP2003208442A - 情報提供装置、情報提供方法及びプログラム - Google Patents

情報提供装置、情報提供方法及びプログラム

Info

Publication number
JP2003208442A
JP2003208442A JP2002006559A JP2002006559A JP2003208442A JP 2003208442 A JP2003208442 A JP 2003208442A JP 2002006559 A JP2002006559 A JP 2002006559A JP 2002006559 A JP2002006559 A JP 2002006559A JP 2003208442 A JP2003208442 A JP 2003208442A
Authority
JP
Japan
Prior art keywords
content
keyword
location
database
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002006559A
Other languages
English (en)
Inventor
Koichi Inoue
浩一 井上
Hideaki Yamagata
秀明 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002006559A priority Critical patent/JP2003208442A/ja
Publication of JP2003208442A publication Critical patent/JP2003208442A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】 文章中でキーワードとして適当な単語にアン
カーを付与できる可能性を向上させて、公開コンテンツ
として提供する情報のバラエティを高め、広告等の情報
提供の効果を充分に発揮させる。 【解決手段】 1次コンテンツの本文中で、名詞となる
各単語に対し、次の〜のスコアを求める(ステップ
S302)。.当該単語の品詞の種類に対応したスコ
ア。.当該単語の後に続く助詞の種類に関するスコ
ア。.当該単語の長さに関するスコア。.当該単語
につき通常文中での出現頻度に関するスコア。そして、
これらの〜の各スコアを、一定の係数をかけてから
加算し、これにより、当該単語に対するスコアを求める
(ステップS303)。これが各単語について終了する
と(ステップS304のY)、各単語をスコアに関して
ソートし(ステップS305)、その上位から順に一定
数をキーワード122aであるとする(ステップS30
6)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ネットワーク上か
らアクセス可能な公開コンテンツに関する情報を提供
し、その公開コンテンツに対するアクセスを提供する情
報提供装置、情報提供方法及びプログラムに関する。
【0002】
【従来の技術】インターネットは、その爆発的な普及に
伴い、情報流通のための手段として重要度を増してきて
いる。
【0003】インターネットが情報流通のための手段と
して有効に機能するためには、情報検索機能の充実が不
可欠である。このような情報検索機能については、検索
エンジンと呼ばれる技術が開発され、広く普及してい
る。このような情報検索エンジンは、一般的には、ある
特定のキーワードを入力すると、そのキーワードを含む
公開コンテンツ(ホームページ)の検索を実行するよう
になっている。
【0004】一方、インターネットの普及によって生じ
た情報流通革命に着目し、インターネットを利用した各
種の広告が急速な普及を遂げている。このような広告
は、多くの場合、公開コンテンツの中に広告領域を設
け、この広告領域に広告を添付するのが一般的である。
つまり、インターネット上で公開されている公開コンテ
ンツは、それが特定の会員等の特定人にだけ提供される
ものであるか広く一般の不特定人に提供されるものであ
るかを問わず、一般的には、HTML言語で記述されて
いるハイパーテキストであり、ここに広告を添付するの
は容易である。そして、こうして広告が添付された公開
コンテンツは、WWW(World Wide Web)技術によって
配信され、ユーザーはブラウザを用いて公開コンテンツ
を閲覧することが可能である。そして、このような広告
にはアンカーが付され、ユーザーが広告領域に添付され
たテキストや画像である広告をマウスディバイス等によ
ってその広告をクリックすることで、広告されているサ
ービスが存在するインターネット上のロケーションをア
クセスすることができるような仕組みになっている。こ
のような仕組みは、一般的に、リンクが張られていると
呼ばれている。つまり、その広告とその広告主のウエブ
サイトとがリンク付けられているわけである。
【0005】また、インターネット上での広告に関して
は、ホームページと呼ばれている公開コンテンツばかり
でなく、電子メールのコンテンツにも添付されるような
仕組みが普及しつつある。一例として、ユーザーがある
プロバイダとの間でインターネット接続に関する契約を
交わした場合、そのプロバイダ経由で送信される電子メ
ールに広告が添付されるという仕組みが実用化されてい
る。このような契約では、たとえばインターネットの接
続料金等について、ユーザーは利益を享受し得るように
なっている。
【0006】図16は、何らかのコンテンツに添付され
た広告の一例を模式的に示している。つまり、このコン
テンツは、紀行文である読み物1001を本来的な内容
としているが、その周囲に広告領域1002が設けら
れ、ここに2つの広告1003、1004が添付されて
いる。これらの広告1003、1004には、それぞ
れ、広告主のウエブサイト1003a、1004aに対
するアンカーが付されている。そこで、このコンテンツ
を閲覧した者がその広告1003又は1004をマウス
ディバイス等によってクリックすると、クリックした広
告にリンクするウエブサイト1003a又は1004a
の閲覧画面となる。
【0007】
【発明が解決しようとする課題】ところで、広告主にと
っては、自らが提供するサービスにできるだけ多くのユ
ーザーを呼び込むことができるような広告が望ましい。
そのためには、 ・コンテンツを閲覧したユーザーに好感を持ってもらう ・できるだけ多くのコンテンツに広告を出す ・自らのサービスに興味を持ちそうなユーザー層に広告
を見てもらう という面を向上させたい。
【0008】ところが、特開平11−175628号公
報に示されている例も含む従来のインターネット上での
広告方法では、コンテンツに添付された広告のために、
本来の内容が妨げられ、広告がかえって逆効果となって
しまうという問題がある。
【0009】以下、図17に基づいて、この問題を考え
る。図17は、電子メールに広告が添付された画面表示
例を示す模式図である。
【0010】図17(a)に示すように、このコンテン
ツでは、メール本文2001が本来的な内容を構成す
る。そして、その周囲に広告領域2002が設けられ、
この広告領域2002に画像データによる複数個の広告
2003〜2007が添付されている。このようなコン
テンツは、インターネット上で一般的に見ることができ
るコンテンツである。
【0011】ところが、一見しても分かるように、画面
中を示す広告の割合が極めて大きい。このため、本来の
コンテンツに集中しにくくなり、場合によっては、その
コンテンツの本来的な内容をなすメール本文2001が
どこにあるのかが分からない場合も生ずる。このため、
広告主の印象が悪くなってしまうことが予想される。
【0012】これは、数値的にも、図17(b)に示す
ように、コンテンツ全体の面積は800×600=48
0000画素であるのに対して、コンテンツの本来的な
内容をなすメール本文2001は400×200=80
000画素しかなく、よって、広告領域2002の面積
は、480000−8000=400000画素もある
ことになる。これは、広告面積比として見ると、400
000/480000=0.83ということになり、コ
ンテンツ全体の83パーセントもの領域を広告2003
〜2007が占めていることになる。
【0013】さらに問題なのは、その場合のデータ内容
やデータサイズである。つまり、図17(c)に示すよ
うに、テキストデータであるメール本文2001のデー
タサイズは200バイトであるのに対し、広告2003
〜2007のデータサイズは一つが4000バイトとし
ても、4000×5=20000バイトものデータサイ
ズとなってしまう。これは、広告2003〜2007に
は画像データが用いられるのが普通だからである。そこ
で、データサイズ比として見ると、20000/200
=100、つまり、広告2003〜2007がメール本
文2001の100倍ものデータサイズとなっている。
このため、ユーザーが使用するコンピュータにおいてコ
ンテンツの読み込みに時間がかかり、肝心のメール本文
2001をなかなか見ることができないという煩わしさ
が生ずる。これは、通信回線の品質が低くデータ転送速
度が遅い環境では深刻な問題である。このため、ユーザ
ーはコンテンツが開くまで待たなければならず、これに
よって、広告主に対する印象が悪くなる可能性がある。
【0014】このような問題を解決するため、本出願人
は、特願2000−360442(平成12年11月2
8日出願(本出願時において未出願公開))において、
次のような技術を提案している。すなわち、情報仲介者
はインターネットなどのネットワーク上で情報仲介サー
バーを運用する。そして、まず、コンテンツ作成者が送
信した文字情報を含む電子メールなどの1次コンテンツ
を解析し、インターネット上の公開コンテンツのロケー
ションをキーワードに対応付けて登録するデータベース
を参照して、1次コンテンツからデータベースに登録さ
れたキーワードを抽出する。次に、抽出したキーワード
をキーとしてデータベースを検索し、抽出したキーワー
ドに対応付けられた公開コンテンツのロケーションを獲
得する。そして、1次コンテンツ中のキーワードに対し
て、獲得したロケーションにアクセスするためのアンカ
ーを付与し、これによって電子メールなどの2次コンテ
ンツを作成する。そして、この2次コンテンツを1次コ
ンテンツの代わりに宛先に送信する。
【0015】かかる技術によれば、1次コンテンツ中の
キーワードに対応した広告のアンカーが付与された2次
コンテンツを受信することができ、受信者は当該アンカ
ーが示すロケーションの広告を閲覧することができるの
で、コンテンツに添付された広告のために、本来の内容
が妨げられ、広告がかえって逆効果となってしまうとい
う不具合が生じないようにすることができる。
【0016】しかしながら、かかる技術を用いた場合で
あっても、1次コンテンツからのキーワードの抽出を適
切に行なわないと、公開コンテンツとして提供する広告
情報のバラエティという点で物足りなくなる場合があ
り、そうすると広告の効果も充分に発揮できなくなると
いう不具合がある。
【0017】この発明の目的は、文章中でキーワードと
して適当な単語にアンカーを付与できる可能性を向上さ
せて、公開コンテンツとして提供する情報のバラエティ
を高め、広告等の情報提供の効果を充分に発揮させるこ
とである。
【0018】この発明の別の目的は、変化にとんだ広告
内容等を提供できるようにして、2次コンテンツ受信者
の関心を得やすくすることである。
【0019】この発明の目的は、公開コンテンツのロケ
ーションの履歴の情報を、ユーザニーズの把握、アクセ
ス状況の把握、キーワードの人気確認などに活用し、あ
るいは、2次コンテンツ受信者にはアンカーの本体が見
えないため、どこのページに飛ぶか分からないことを利
用した意外なリンクを混入して、懸賞やエンターテイン
メントに利用することを可能とすることである。
【0020】
【課題を解決するための手段】請求項1に記載の発明
は、文字情報を含む1次コンテンツであってネットワー
クを経由するものを解析し、公開コンテンツのロケーシ
ョンをキーワードに対応付けて登録するデータベースを
参照して前記1次コンテンツから前記データベースに登
録されたキーワードを抽出するキーワード抽出手段と、
抽出したキーワードをキーとして前記データベースを検
索し、抽出したキーワードに対応付けられた公開コンテ
ンツのロケーションを獲得するロケーション獲得手段
と、前記1次コンテンツ中のキーワードに対して、獲得
したロケーションにアクセスするためのアンカーを付与
し、これによって2次コンテンツを作成する2次コンテ
ンツ作成手段と、を具備し、前記キーワード抽出手段
は、前記1次コンテンツから所定の条件で単語を抽出
し、その各単語に対してスコアを割り当て、このスコア
が所定程度に高い又は低い単語を前記キーワードとして
抽出するものであり、前記スコアの付与は、対象となる
単語の品詞の種類、当該単語の後に接続する助詞の種
類、当該単語の長さ、当該単語の通常文中での出現頻
度、及び、予め登録されている当該単語と前記公開コン
テンツとの関連度、のうち少なくとも1つを用いて行な
う、情報提供装置である。
【0021】したがって、対象となる単語の品詞の種類
等を用いて各単語にスコアを割り当ててキーワードを抽
出するようにするので、文章中でキーワードとして適当
な単語にアンカーを付与できる可能性を向上させ、公開
コンテンツとして提供する情報のバラエティを高め、広
告等の情報提供の効果を充分に発揮させることができ
る。
【0022】請求項2に記載の発明は、文字情報を含む
1次コンテンツであってネットワークを経由するものを
解析し、公開コンテンツのロケーションをキーワードに
対応付けて登録するデータベースを参照して前記1次コ
ンテンツから前記データベースに登録されたキーワード
を抽出するキーワード抽出手段と、抽出したキーワード
をキーとして前記データベースを検索し、抽出したキー
ワードに対応付けられた公開コンテンツのロケーション
を獲得するロケーション獲得手段と、前記1次コンテン
ツ中のキーワードに対して、獲得したロケーションにア
クセスするためのアンカーを付与し、これによって2次
コンテンツを作成する2次コンテンツ作成手段と、を具
備し、前記ロケーション獲得手段は、前記キーワードに
対応付けられた前記公開コンテンツのロケーションを獲
得する際に、予め登録されている前記キーワードと前記
公開コンテンツとの関連度の情報を用いる、情報提供装
置である。
【0023】したがって、同一のキーワードが2次コン
テンツ中に複数回出現しても、それぞれ別の公開コンテ
ンツへのリンクが付与される可能性が高まるので、変化
にとんだ広告内容等を提供でき、2次コンテンツ受信者
の関心を得やすくすることができる。
【0024】請求項3に記載の発明は、請求項2に記載
の情報提供装置において、前記ロケーション獲得手段
は、当該公開コンテンツのキーワードに対する前記関連
度が、前記データベースで当該キーワードに対応付けら
れたすべての公開コンテンツの前記関連度に対する割合
に比例する確率で選択して、この選択した公開コンテン
ツについて前記ロケーションの獲得を行なう。
【0025】したがって、同一のキーワードが2次コン
テンツ中に複数回出現しても、それぞれ別の公開コンテ
ンツへのリンクが付与される可能性が高まるので、変化
にとんだ広告内容等を提供でき、2次コンテンツ受信者
の関心を得やすくすることができる。
【0026】請求項4に記載の発明は、文字情報を含む
1次コンテンツであってネットワークを経由するものを
解析し、公開コンテンツのロケーションをキーワードに
対応付けて登録する第1のデータベースを参照して前記
1次コンテンツから前記第1のデータベースに登録され
たキーワードを抽出するキーワード抽出手段と、抽出し
たキーワードをキーとして前記データベースを検索し、
抽出したキーワードに対応付けられた公開コンテンツの
ロケーションを獲得するロケーション獲得手段と、前記
1次コンテンツ中のキーワードに対して所定のロケーシ
ョンのアンカーを付与し、これによって2次コンテンツ
を作成する2次コンテンツ作成手段と、前記2次コンテ
ンツの作成の際に、当該2次コンテンツを識別するコン
テンツ識別情報、当該2次コンテンツに付与される各ア
ンカーが先頭から数えていくつ目であるかを示す情報で
あるアンカー順番情報、及び、宛先である2次コンテン
ツ受信者のユーザー情報をキーとして、前記ロケーショ
ン獲得手段で獲得したロケーションを第2のデータベー
スに登録するデータベース登録手段と、前記2次コンテ
ンツ受信者が前記所定のロケーションのアンカーを選択
したときは、前記第2のデータベースを参照して当該第
2のデータベースに登録されているロケーションの公開
コンテンツへ前記2次コンテンツ受信者を導く公開コン
テンツ付与手段と、を具備する情報提供装置である。
【0027】したがって、2次コンテンツ受信者が公開
コンテンツにアクセスする際に、キーワードに付与され
た公開コンテンツのロケーションの履歴を取得すること
ができるので、この情報を、ユーザニーズの把握、アク
セス状況の把握、キーワードの人気確認などに活用する
ことができ、また、2次コンテンツ受信者にはアンカー
の本体が見えないため、どこのページに飛ぶか分からな
いことを利用した意外なリンクを混入して、懸賞やエン
ターテインメントに利用することが可能となる。
【0028】請求項5に記載の発明は、文字情報を含む
1次コンテンツであってネットワークを経由するものを
解析し、公開コンテンツのロケーションをキーワードに
対応付けて登録するデータベースを参照して前記1次コ
ンテンツから前記データベースに登録されたキーワード
を抽出するステップと、抽出したキーワードをキーとし
て前記データベースを検索し、抽出したキーワードに対
応付けられた公開コンテンツのロケーションを獲得する
ステップと、前記1次コンテンツ中のキーワードに対し
て、獲得したロケーションにアクセスするためのアンカ
ーを付与し、これによって2次コンテンツを作成するス
テップと、を含んでなり、前記キーワードを抽出するス
テップは、前記1次コンテンツから所定の条件で単語を
抽出し、その各単語に対してスコアを割り当て、このス
コアが所定程度に高い又は低い単語を前記キーワードと
して抽出するものであり、前記スコアの付与は、対象と
なる単語の品詞の種類、当該単語の後に接続する助詞の
種類、当該単語の長さ、当該単語の通常文中での出現頻
度、及び、予め登録されている当該単語と前記公開コン
テンツとの関連度、のうち少なくとも1つを用いて行な
う、情報提供方法である。
【0029】したがって、対象となる単語の品詞の種類
等を用いて各単語にスコアを割り当ててキーワードを抽
出するようにするので、文章中でキーワードとして適当
な単語にアンカーを付与できる可能性を向上させ、公開
コンテンツとして提供する情報のバラエティを高め、広
告等の情報提供の効果を充分に発揮させることができ
る。
【0030】請求項6に記載の発明は、文字情報を含む
1次コンテンツであってネットワークを経由するものを
解析し、公開コンテンツのロケーションをキーワードに
対応付けて登録するデータベースを参照して前記1次コ
ンテンツから前記データベースに登録されたキーワード
を抽出するステップと、抽出したキーワードをキーとし
て前記データベースを検索し、抽出したキーワードに対
応付けられた公開コンテンツのロケーションを獲得する
ステップと、前記1次コンテンツ中のキーワードに対し
て、獲得したロケーションにアクセスするためのアンカ
ーを付与し、これによって2次コンテンツを作成するス
テップと、を含んでなり、前記ロケーションを獲得する
ステップは、前記キーワードに対応付けられた前記公開
コンテンツのロケーションを獲得する際に、予め登録さ
れている前記キーワードと前記公開コンテンツとの関連
度の情報を用いる、情報提供方法である。
【0031】したがって、同一のキーワードが2次コン
テンツ中に複数回出現しても、それぞれ別の公開コンテ
ンツへのリンクが付与される可能性が高まるので、変化
にとんだ広告内容等を提供でき、2次コンテンツ受信者
の関心を得やすくすることができる。
【0032】請求項7に記載の発明は、請求項6に記載
の情報提供方法において、前記ロケーションの獲得のス
テップは、当該公開コンテンツのキーワードに対する前
記関連度が、前記データベースで当該キーワードに対応
付けられたすべての公開コンテンツの前記関連度に対す
る割合に比例する確率で選択して、この選択した公開コ
ンテンツについて前記ロケーションの獲得を行なう。
【0033】したがって、同一のキーワードが2次コン
テンツ中に複数回出現しても、それぞれ別の公開コンテ
ンツへのリンクが付与される可能性が高まるので、変化
にとんだ広告内容等を提供でき、2次コンテンツ受信者
の関心を得やすくすることができる。
【0034】請求項8に記載の発明は、文字情報を含む
1次コンテンツであってネットワークを経由するものを
解析し、公開コンテンツのロケーションをキーワードに
対応付けて登録する第1のデータベースを参照して前記
1次コンテンツから前記第1のデータベースに登録され
たキーワードを抽出するステップと、抽出したキーワー
ドをキーとして前記データベースを検索し、抽出したキ
ーワードに対応付けられた公開コンテンツのロケーショ
ンを獲得するステップと、前記1次コンテンツ中のキー
ワードに対して所定のロケーションのアンカーを付与
し、これによって2次コンテンツを作成するステップ
と、前記2次コンテンツの作成の際に、当該2次コンテ
ンツを識別するコンテンツ識別情報、当該2次コンテン
ツに付与される各アンカーが先頭から数えていくつ目で
あるかを示す情報であるアンカー順番情報、及び、宛先
である2次コンテンツ受信者のユーザー情報をキーとし
て、前記ロケーション獲得手段で獲得したロケーション
を第2のデータベースに登録するステップと、前記2次
コンテンツ受信者が前記所定のロケーションのアンカー
を選択したときは、前記第2のデータベースを参照して
当該第2のデータベースに登録されているロケーション
の公開コンテンツへ前記2次コンテンツ受信者を導くス
テップと、を含んでなる情報提供方法である。
【0035】したがって、2次コンテンツ受信者が公開
コンテンツにアクセスする際に、キーワードに付与され
た公開コンテンツのロケーションの履歴を取得すること
ができるので、この情報を、ユーザニーズの把握、アク
セス状況の把握、キーワードの人気確認などに活用する
ことができ、また、2次コンテンツ受信者にはアンカー
の本体が見えないため、どこのページに飛ぶか分からな
いことを利用した意外なリンクを混入して、懸賞やエン
ターテインメントに利用することが可能となる。
【0036】請求項9に記載の発明は、文字情報を含む
1次コンテンツであってネットワークを経由するものを
解析し、公開コンテンツのロケーションをキーワードに
対応付けて登録するデータベースを参照して前記1次コ
ンテンツから前記データベースに登録されたキーワード
を抽出するキーワード抽出処理と、抽出したキーワード
をキーとして前記データベースを検索し、抽出したキー
ワードに対応付けられた公開コンテンツのロケーション
を獲得するロケーション獲得処理と、前記1次コンテン
ツ中のキーワードに対して、獲得したロケーションにア
クセスするためのアンカーを付与し、これによって2次
コンテンツを作成する2次コンテンツ作成処理と、をコ
ンピュータに実行させ、前記キーワード抽出処理は、前
記1次コンテンツから所定の条件で単語を抽出し、その
各単語に対してスコアを割り当て、このスコアが所定程
度に高い又は低い単語を前記キーワードとして抽出する
ものであり、前記スコアの付与は、対象となる単語の品
詞の種類、当該単語の後に接続する助詞の種類、当該単
語の長さ、当該単語の通常文中での出現頻度、及び、予
め登録されている当該単語と前記公開コンテンツとの関
連度、のうち少なくとも1つを用いて行なう、コンピュ
ータに読み取り可能なプログラムである。
【0037】したがって、対象となる単語の品詞の種類
等を用いて各単語にスコアを割り当ててキーワードを抽
出するようにするので、文章中でキーワードとして適当
な単語にアンカーを付与できる可能性を向上させ、公開
コンテンツとして提供する情報のバラエティを高め、広
告等の情報提供の効果を充分に発揮させることができ
る。
【0038】
【発明の実施の形態】〔全体の概略構成〕本発明の実施
の形態を図面に基づいて説明する。本基本システム構成
例は、インターネットを利用した構成例である。
【0039】図1は、全体の概略構成を示す模式図であ
る。図1中、電子データの通信網であるネットワークと
して機能するインターネット101が仮想的に示されて
おり、インターネット101を経由して、コンテンツ送
信クライアント102、2次コンテンツ受信クライアン
ト103、情報仲介サーバー104、情報提供サイト1
05及びサービス提供サイト106が接続可能となって
いる。
【0040】ここで、コンテンツ送信クライアント10
2は、コンテンツの作成者が利用するクライアント端末
である。情報仲介サーバー104は、情報仲介者が運営
する情報仲介用のサーバーであり、コンテンツ送信クラ
イアント102からインターネット101を経由して送
信された電子メール等の1次コンテンツ201を加工し
て2次コンテンツ202を作成するのに用いる(図6〜
図8参照)。2次コンテンツ受信クライアント103
は、情報仲介サーバー104で作成されたコンテンツが
配信されるクライアント端末であり、システム構成によ
っては、コンテンツ送信クライアント102と2次コン
テンツ受信クライアント103とが同一のクライアント
端末であることがあり得る。情報提供サイト105及び
サービス提供サイト106は、公開コンテンツ203
(図8参照)を提供するインターネット101上で公開
されている情報提供者及びサービス提供者が運営するウ
エブサイトである。公開コンテンツ203は、会員向に
クローズされたものであっても、広く一般に公開された
ものであっても、インターネット101上で閲覧可能な
ものであれば、その種類を問わない。
【0041】ここで、情報仲介サーバー104は、コン
テンツ送信クライアント102からインターネット10
1を経由して送信された電子メール等のコンテンツを受
信し、それを加工して2次コンテンツを作成し、その加
工後の2次コンテンツを宛先に送信する。このような処
理を実行するために、情報仲介サーバー104は、デー
タベースとしてのキーワードデータベース108に接続
されており、このキーワードデータベース108から必
要なデータを得る。情報仲介サーバー104における2
次コンテンツ202の作成処理については後述するが、
図1には、その処理を実行するための機能ブロック図が
示されている。つまり、情報仲介サーバー104は、キ
ーワード抽出部109及び2次コンテンツ作成部110
を有し、キーワードデータベース108はキーワード検
索部111、データ保存部112及びデータ登録部11
3を有する。
【0042】図2は、各部で用いられるコンピュータの
基本構成を示すブロック図である。前述したコンテンツ
送信クライアント102、2次コンテンツ受信クライア
ント103、情報仲介サーバー104、キーワードデー
タベース108、情報提供サイト105及びサービス提
供サイト106は、すべてコンピュータである。その概
略構造としては、図2に示すように、各種演算処理を実
行して各部を集中制御するCPU114及びメモリ11
5を基本構成とするマイクロコンピュータを主体とし
て、このマイクロコンピュータに、通信装置116、ハ
ードディスク117、表示装置118、入力装置11
9、及びCD−ROMドライブ120がバス接続された
構成となっている。そして、ハードディスク117に
は、CPU114及びメモリ115を基本構成とするマ
イクロコンピュータに所定の処理を実行させるためのデ
ータコードを記述するプログラム121がインストール
されている。このプログラム121は、一般的にはCD
−ROM等に格納された形態でパッケージングされてお
り、CD−ROMドライブ120でのリード動作によっ
てハードディスク117にインストールされる。もっと
も、CD−ROMというのは一例であり、プログラムを
格納する記憶媒体としては、フレキシブル・ディスク等
の磁気的な記録媒体でも、CD−RやDVD−ROM、
DVD−RAM等の光学的な記憶媒体でも、どのような
ものであっても良い。更には、プログラム121は、イ
ンターネット101等のネットワークを経由して通信装
置116を介して取り込まれ、ハードディスク117に
インストールされたものであっても良い。プログラム1
21を記憶するものは、如何なるものであってもプログ
ラムを格納する記憶媒体になり得る。
【0043】図3は、データベースの一例を示す模式図
である。このデータベース122は、キーワードデータ
ベース108中のデータ保存部112に保存されてお
り、キーワード122aに対応させて公開コンテンツ2
03のロケーションとしてのURL122bが格納され
ている。ここで、キーワード122aとURL122b
との対応関係は、本システムの使用用途に応じて適宜規
定し得る。例えば、検索用の情報提供システムとして構
築する場合には、キーワード122aのメタファとなり
得る情報を含む公開コンテンツ203のURL122b
が格納される。一例として、「タンチョウ」というキー
ワード122aに対しては、「WEB動物図鑑」のUR
L122bが格納されるという具合である(図3及び図
8参照)。これに対して、広告用の情報提供システムと
して構築する場合には、キーワード122aに対して広
告に関する公開コンテンツ203のURL122bが格
納される。この場合、キーワード122aと公開コンテ
ンツ203との関係は、公開コンテンツ203がキーワ
ード122aのメタファをなすような関係であっても、
広告主が所望のキーワード122aを購入したというよ
うな動機付けで関連付けられるような関係であっても、
どのような関係であっても良い。例えば、「ツアー」と
いうキーワード122aに対しては「ABC観光
(株)」の公開コンテンツ203、「スキー」というキ
ーワード122aに対しては「新潟スキー場」の公開コ
ンテンツ203、「夜行バス」というキーワード122
aに対しては「XYZ交通」の公開コンテンツ203が
それぞれメタファを構成する(図12参照)。
【0044】図9は、データベース122の別の一例を
示す模式図である。このデータベース122では、キー
ワード122aにURL122b及び地域情報122c
が対応付けられて格納されている。例えば、「野鳥」と
いうキーワード122aに対して、「鎌倉/湘南」とい
う地域情報122cが格納されている場合には、公開コ
ンテンツ203として、「鎌倉野鳥愛好会」の公開コン
テンツ203のURL122bが格納されている。
【0045】ここで、図1中に、情報仲介サーバー10
4において2次コンテンツ202の作成処理を実行する
ための機能ブロック図を示したが、この機能ブロック図
に示されている機能は、実際には、図2に示すハードウ
エア構成によって実現される。具体的には、キーワード
抽出部109は、コンテンツ送信クライアント102か
ら送信された1次コンテンツ201であるメール本文か
らキーワードを抽出する(キーワード抽出手段、キーワ
ード抽出処理)。この際、情報仲介サーバー104のハ
ードディスク117にインストールされたプログラム1
21に従い情報処理を行なうCPU114及びメモリ1
15は、メール本文に対して形態素解析を施し、キーワ
ードを抽出する。そして、キーワードデータベース10
8も、そのハードディスク117にインストールされた
プログラム121に従い情報処理を行なうCPU114
及びメモリ115が所定の処理を実行する。つまり、キ
ーワードデータベース108は、そのデータ保存部11
2に、データ登録部113を経て登録された図3又は図
9に示すようなデータベース122を保存している。そ
こで、キーワードデータベース108は、キーワードを
抽出した情報仲介サーバー104からの指示によって、
キーワード検索部111がデータ保存部112に格納さ
れたデータベース122から情報仲介サーバー104に
おいて抽出されたキーワード122aを検索し、そのキ
ーワード122aに対応付けられたURL122bを獲
得する(ロケーション獲得手段、ロケーション獲得処
理)。そして、キーワードデータベース108は、獲得
したURL122bを情報仲介サーバー104に送信す
る。情報仲介サーバー104は、その2次コンテンツ作
成部110において、コンテンツ送信クライアント10
2から送信された1次コンテンツ201であるメール本
文に対して、受信したURL122bを付与する。ここ
での処理は、メール本文をHTMLテキストに変換し、
その中にアンカーとしてURL122bを付与するとい
う処理を実行する(図7参照)。こうして、2次コンテ
ンツ202が作成される(2次コンテンツ作成手段、2
次コンテンツ作成処理)。
【0046】情報仲介サーバー104は、作成した2次
コンテンツ202をインターネット101上で公開する
こともできるし、インターネット101を介してコンテ
ンツ送信クライアント102に返送することも、インタ
ーネット101を介して2次コンテンツ受信クライアン
ト103に配信することもできる。これらの公開、返送
及び配信の各機能は、周知技術によって実現されるた
め、その説明は省略する。
【0047】〔第1の基本システム構成例〕前記の技術
を用いた第1の基本システム構成例について図1ないし
図8に基づいて説明する。
【0048】図4は、データ及び貨幣の交換を伴うビジ
ネス方法を示す模式図である。本例は、コンテンツ送信
クライアント102を用いて1次コンテンツを作成する
コンテンツ作成者に対して、情報仲介サーバー104が
検索情報を提供する情報提供システムとして構築されて
いる。つまり、本例では、コンテンツ作成者は2次コン
テンツの受信者であり、この者は、情報仲介サーバー1
04を用いたビジネスを行なう情報仲介者に会費を支払
う。ここでの会費の支払いは、情報処理を利用した銀行
からの振込み処理、情報処理を利用したデポジット金額
の引き落とし処理等、データ処理によって実現すること
もできる。情報仲介者は、情報提供サイト105を用い
たビジネスを行なう情報提供者に対して、報償金を支払
い、情報提供者によるその者のウエブサイトの維持と質
の向上を支援する。そして、情報仲介者は、コンテンツ
作成者から送信された1次コンテンツに基づいて2次コ
ンテンツを作成し、これをコンテンツ作成者でもあるコ
ンテンツ受信者に返信する。
【0049】これにより、コンテンツ作成者兼コンテン
ツ受信者は、自分が作成した1次コンテンツ201であ
るメール本文に対して、そのメール本文からキーワード
として抽出された名詞にURLにアクセスすることがで
きるアンカーが付与された2次コンテンツ202を受け
取ることができ、この2次コンテンツ202のキーワー
ドを、入力装置119である例えばマウスディバイスに
よってクリックすることで、そのキーワードに付与され
たアンカーが指定するURLにアクセス可能となる。
【0050】このようなシステム構成上、情報仲介サー
バー104と組で使用されるキーワードデータベース1
08のデータ保存部112には、情報提供サイト105
のURL122bがキーワード122aと対応付けられ
たデータベース122が格納される(図3参照)。この
場合、情報提供を目的としているため、キーワード12
2aとURL122bによってロケーション指定される
公開コンテンツ203とは、公開コンテンツ203がキ
ーワード122aに対してメタファの関係を構成するよ
うに選択される。例えば、「北海道」というキーワード
122aに対しては「北海道振興協会のページ」のUR
L122bが対応付けられ、「釧路湿原」というキーワ
ード122aに対しては「道東観光情報」のURL12
2bが対応付けられ、「タンチョウ」というキーワード
122aに対しては「WEB動物図鑑」のURL122
bが対応付けられている。
【0051】図5は2次コンテンツの作成処理の流れを
示すフローチャート、図6はキーワード抽出処理の流れ
を示す模式図、図7は2次コンテンツの作成時における
HTML文書作成手順を示す模式図、図8は完成した2
次コンテンツの一例を示す模式図である。
【0052】ここで、図5を参照しながら情報仲介サー
バー104がそのハードディスク117にインストール
されたプログラム121に従い実行する処理の流れを説
明する。まず、情報仲介サーバー104は、インターネ
ット101を経由してコンテンツ送信クライアント10
2から送信された原文、つまり、1次コンテンツ201
(図6(a)参照)を受信し、これをメモリ115に保
存する(ステップS101)。この原文は、例えば、
「今度の休みは北海道を旅行したい。特に釧路湿原を回
って、タンチョウを見たい。」というようなテキスト文
である。そして、その原文に対して公知の形態素解析を
施し(ステップS102)、テキストデータを分割して
品詞情報を持つ小さな語句とする。つまり、上記のテキ
スト文であれば、「今度/の/休み/は/北海道/を/
旅行/し/たい/。/特に/釧路湿原/を/回っ/て
/、/タンチョウ/を/見/たい/。」という語句が得
られる(図6(b)参照)。そこで、これらの語句から
キーワード候補を抽出するために(図6(c)参照)、
分割された語句から最初の語句を取り出し(ステップS
103)、その語句が名詞であるかどうかを判定する
(ステップS104)。その語句が名詞であるとの判定
は、その後句がキーワード候補であることの判定を意味
する。そこで、その語句がキーワード候補であると判定
されたら(ステップS104のY)、次に、それがキー
ワード122aであるかどうかの判定処理を行なう(ス
テップS105)。ここでのキーワード122aかどう
かの判定は、そのキーワード候補である語句が図3に示
すデータベース122に登録されているかどうかを判定
することを意味する。そこで、このステップS105で
の処理は、キーワードデータベース108のキーワード
検索部111に対して検索指示をかけることによる。情
報仲介サーバー104は、キーワードデータベース10
8からの返答によってその語句がキーワード122aで
あるかどうかを認識する。キーワードデータベース10
8からの返答には、そのキーワード122aに対応付け
られたURL122bが含まれている。そこで、キーワ
ード122aであった場合には(ステップS105の
Y)、その語句をHTMLのアンカータグで挟み、その
アンカータグにキーワード122aと共にキーワードデ
ータベース108から送信されたURL122bを挿入
し、これをメモリ115中のバッファ領域に出力する
(ステップS107)。これに対して、ステップS10
4でキーワード候補が名詞では無いと判定された場合
(ステップS104のN)、又は、ステップS105で
キーワード候補がキーワード122aではないと判定さ
れた場合(ステップS105のN)には、その語句をそ
のままメモリ115中のバッファ領域に出力する(ステ
ップS106)。その後、キーワード候補中における次
の語句の有無が判定され(ステップS108)、次の語
句がある場合には次の語句を取り出して(ステップS1
09)、ステップS104の判定処理にリターンする。
【0053】ここで、ステップS106及びステップS
107の実行によってメモリ115中のバッファ領域に
出力された語句及びアンカータグで挟まれたキーワード
122aは、図7に示すように、HTML文書を構成す
る。そこで、図5に示す処理が終了した場合には、メモ
リ115中のバッファ領域に図7に例示するようなHT
ML文書が完成し、これによって、1次コンテンツ20
1に基づいて2次コンテンツ202が作成される。
【0054】情報仲介サーバー104は、こうして作成
した2次コンテンツ202をインターネット101経由
で2次コンテンツ受信クライアント103に配信する。
本基本システム構成例では、2次コンテンツ受信クライ
アント103は、コンテンツ送信クライアント102で
ある。もっとも、2次コンテンツ受信クライアント10
3とコンテンツ送信クライアント102とは別のコンピ
ュータであっても良い。これは、コンテンツ送信クライ
アント102から情報仲介サーバー104への1次コン
テンツ201の送信に際し、2次コンテンツ202の配
信先を指示する配信先指示情報を送信情報に含ませてお
けば容易に実現される。
【0055】2次コンテンツ受信クライアント103で
は、配信された2次コンテンツ202をブラウザで表示
した場合、2次コンテンツ202中のアンカータグで挟
まれたキーワード122aがアンダーラインや別色表示
等の手法で強調表示される(図8参照)。そして、これ
らのキーワード122aをマウスディバイス等でクリッ
クすると、アンカータグで挟まれたURL122bがイ
ンターネット101を経由してインターネットプロバイ
ダに送信され、そのURL122bを持つ公開コンテン
ツ203にアクセスすることができ、その公開コンテン
ツ203の内容を2次コンテンツ受信クライアント10
3においてブラウズすることが可能となる。こうして、
コンテンツ作成者兼2次コンテンツ受信者に情報の提供
がなされる。
【0056】ここで、図8より明らかなように、2次コ
ンテンツ202は、図6(a)に示す1次コンテンツ2
01に対して外見上大きく変化しない。このため、コン
テンツの表示内容が見易いものとなる。また、2次コン
テンツ202は、1次コンテンツ201に対してURL
122bを指定するアンカーが付加されているに過ぎな
いため、1次コンテンツ201と比較してデータサイズ
が激増するようなことがない。したがって、見易さ及び
データサイズの両面から、2次コンテンツ202の閲覧
者であるコンテンツ作成者兼2次コンテンツ受信者に、
不愉快な思いをさせることを防止することができる。
【0057】また、情報検索という側面からは、単純な
キーワード検索と異なり、自然言語中のキーワードにU
RLが付加されるという検索手法が採用されるため、情
報検索希望者により希望に沿う情報を提供することが可
能となる。
【0058】〔第2の基本システム構成例〕前記の技術
を用いて行なう第2の基本システム構成例を図9及び図
10に基づいて説明する。図9はデータベース122の
一例を示す模式図、図10は1次コンテンツ201と完
成した2次コンテンツ202との一例を示す模式図であ
る。なお、第1の基本システム構成例と同一部分は同一
符号で示し説明も省略する。
【0059】本例では、前述した地域情報122cを含
むデータベース122が用いられる。そこで、キーワー
ド122aに基づくURL122bの検索に当たり、地
域情報122cが考慮される。
【0060】つまり、コンテンツ送信クライアント10
2から情報仲介サーバー104に送信する1次コンテン
ツ201としての送信テキストには、「local:」
に続けて地域の名称を書き込む。すると、情報仲介サー
バー104においては、キーワード122aにURL1
22b及び地域情報122cを対応付けられて格納する
図9に例示するデータベース122を検索し、キーワー
ド122aと地域情報122cとの両面からキーワード
122aを検索する。例えば、図9中、「野鳥」という
キーワード122aには、「新横浜/港北」という地域
情報122cと「鎌倉/湘南」という地域情報122c
とが含まれている。そこで、1次コンテンツ201中に
「local:新横浜」という地域指定名称が含まれて
いるとすると、情報仲介サーバー104は、「新横浜/
港北」という地域情報122cを含んでいる「野鳥」と
いうキーワード122aのみを検索する。これにより、
情報仲介サーバー104は、1次コンテンツ201中の
「野鳥」というキーワード122aに、「新横浜/港
北」という地域情報122cを含んでいる「野鳥」とい
うキーワード122aに対応付けられたURL122b
のみのアンカーを付与して2次コンテンツ202を作成
する(図10参照)。その結果、本基本システム構成例
では、2次コンテンツ202の閲覧者がより興味を持ち
そうな公開コンテンツ203のアンカーをキーワードに
付加することができ、したがって、公開コンテンツ20
3の利用価値をより一層高めることができる。
【0061】〔第3の基本システム構成例〕前記の技術
を用いて行なう第3の基本システム構成例について図1
1及び図12に基づいて説明する。図11はデータ及び
貨幣の交換を伴うビジネス方法を示す模式図、図12は
1次コンテンツと完成した2次コンテンツとの一例を示
す模式図である。なお、第1〜第2の基本システム構成
例と同一部分は同一符号で示し説明も省略する。
【0062】図11に示すように、本例では、情報仲介
者は、例えばインターネットプロバイダである。コンテ
ンツ作成者は、インターネットプロバイダである情報仲
介者とインターネット接続契約を結ぶ。この契約として
は、インターネット接続料を無料にする等の特典をコン
テンツ作成者に付与する代わりに、その者の電子メール
に広告を付するという契約である。この場合、情報仲介
サーバー104がデータ処理による課金システムを備え
ているとすると、ここでは、情報仲介サーバー104
は、コンテンツ作成者の接続料を無料とするようなデー
タ処理を実行することになる。広告は、情報仲介者に広
告料を支払っているサービス提供者の広告である。つま
り、情報仲介者はサービス提供者から広告料を受け取
り、その代わりにコンテンツ作成者と無料のインターネ
ット接続契約を結び、このコンテンツ作成者の電子メー
ルを必ず情報仲介者経由で2次コンテンツ受信者に配信
されるようにする、というシステム構成である。ここで
の広告料の支払いは、情報処理を利用した銀行からの振
込み処理、情報処理を利用したデポジット金額の引き落
とし処理等、データ処理によって実現することもでき
る。したがって、情報仲介者は、コンテンツ作成者から
送信された電子メールという1次コンテンツにサービス
提供者の広告を付与し、2次コンテンツ受信者に配信す
るという処理が行なわれる。この場合、コンテンツ作成
者と2次コンテンツ受信者とは、基本的には異なる人で
ある。
【0063】より具体的な例としては、図12に示すよ
うに、コンテンツ作成者が、「スキーへいく件ですが、
良いツアーは見つかりましたか?夜行バスを利用すれ
ば、安くあがりそうですね。」というメール本文を作成
し、これを1次コンテンツとしてコンテンツ送信クライ
アント102から情報仲介サーバー104に送信した場
合を想定する。この場合、図5に示すステップS105
において、「スキー」、「ツアー」及び「夜行バス」が
キーワード122aとして検索された場合、情報仲介サ
ーバー104では、それぞれのキーワード122aに対
応付けられた「新潟スキー場」、「ABC観光(株)」
及び「XYZ交通」という公開コンテンツ203にアク
セスするためのURL122bがそれらのキーワード1
22aにそれぞれアンカーとして付与された2次コンテ
ンツ202が作成され、これが2次コンテンツ受信者の
2次コンテンツ受信クライアント103にインターネッ
ト101経由で送信される。この場合、コンテンツ送信
クライアント102と2次コンテンツ受信クライアント
103とは、基本的に異なる所有者に所有されたコンピ
ュータである。
【0064】そこで、そのような2次コンテンツ202
を受信した2次コンテンツ受信クライアント103の表
示装置118では、図12に広告付きメールとして示す
ような表示をブラウズすることが可能となる。そして、
2次コンテンツ受信クライアント103では、「スキ
ー」、「ツアー」及び「夜行バス」のそれぞれのキーワ
ードをクリックすることで、それぞれにアンカーとして
付与されたURL122bによって指定される公開コン
テンツ203をブラウズできる。
【0065】以上の処理がハードウエア上でどのように
実行されるかについては、前記した第1、第2の基本シ
ステム構成例で説明したとおりなので、その説明は省略
する。
【0066】〔キーワードの抽出等〕前記したように、
第1〜第3の基本システム構成例において、1次コンテ
ンツ201の本文は形態素解析し(ステップS10
2)、キーワードデータベース108を参照してキーワ
ード122aを抽出している(ステップS105)。
【0067】しかしながら、この場合に1次コンテンツ
201からのキーワード122aの抽出を適切に行なわ
ないと、公開コンテンツ203として提供する情報のバ
ラエティという点で物足りなくなる場合があり、そうす
ると広告等の情報提供の効果も充分に発揮できなくなる
という不具合がある。
【0068】そこで、1次コンテンツ201の本文は形
態素解析し(ステップS102)、助詞や1文字の単語
などを取り除いて名詞だけを抽出(ステップS104の
Y)した後、キーワード122aを抽出する処理(ステ
ップS105)は、具体的には以下のように行なう。
【0069】図13は、キーワード122aを抽出する
処理(ステップS105)の詳細について説明するフロ
ーチャートである。すなわち、名詞として残った各々の
単語に対し(ステップS301)、以下に示すような
〜のスコアを求めて、記録する(ステップS30
2)。スコアの求め方については後述する。
【0070】 .当該単語の品詞の種類に対応したスコア .当該単語の後に続く助詞の種類に関するスコア .当該単語の長さに関するスコア .当該単語につき通常文中での出現頻度に関するスコ
ア そして、これらの〜の各スコアを、一定の係数をか
けてから加算し、これにより、当該単語に対するスコア
を求める(ステップS303)。このステップS302
〜S303を各単語について繰り返す(ステップS30
4)。
【0071】これが終了すると(ステップS304の
Y)、各単語をスコアに関してソートし(ステップS3
05)、その上位から順に一定数をキーワード122a
であるとする(ステップS306)。キーワード122
aと認定するための一定数は、1次コンテンツ201の
長さによって変動してもよいし、サービスが定義されて
いるアンカー122bの数が一定数を超えるように調整
してもよい。
【0072】単語の品詞の種類に関するスコア()
は、サービスの関連づけがなされやすい固有名詞では比
較的高く、代名詞や感動詞など、多く出現はするがサー
ビスを関連づけることの難しい品詞については比較的低
くなるように、あらかじめ定義しておく。この場合、キ
ーワードデータベース108内のキーワード122aに
形容詞が増えたなどの状況の変化に適応して変更を行っ
てもよい。
【0073】単語の後に続く助詞の種類に関するスコア
()は、主格を表しやすい助詞(「は」、「が」)、強
調を表しやすい助詞(「こそ」、「だけ」)には、他の助
詞より高いスコアを割り当てる。
【0074】単語の長さに関するスコア()は、長い
単語ほど重要性が高い可能性があることから用いるもの
である。具体的には、一定(たとえば3文字)の長さま
では定数とし、それから1文字増えるごとに定数を加算
する方法、実データに基づいて文字数をキーとするテー
ブルを作っておき、参照する方法などが考えられる。
【0075】単語につき通常文中での出現頻度に関する
スコア()は、通常文中で出現頻度の低い単語が出現
している場合、それはこのコンテンツで意識的に用いら
れており、注目を引きたい言葉である可能性が高いこと
に基づく。そこで、一般の文章中での単語出現頻度を測
定しておき、その頻度が高くない単語には高いスコアを
与えるものである。
【0076】これらのスコアを統合して一つの単語に対
する単一のスコアにするための計数(ステップS30
3)は、ヒューリスティックに決めるか、実データから
キーワード122aとなることが望ましい単語を抽出し
て,その特徴から回帰分析等により算出することができ
る。
【0077】以上のようにしてキーワード122aを抽
出するようにすれば、文章中でキーワード122aとし
て適当な単語にアンカー122bを付与できる可能性が
向上する。よって、公開コンテンツ203として提供す
る情報のバラエティを高め、広告等の情報提供の効果を
充分に発揮させることができる。
【0078】前記の例では、単語に対するスコアを求め
る処理において(ステップS303)、.当該単語の
品詞の種類に対応したスコア、.当該単語の後に続く
助詞の種類に関するスコア、.当該単語の長さに関す
るスコア、.当該単語につき通常文中での出現頻度に
関するスコアの4つを用いた。
【0079】これに対し、5番目のスコアとして、
“.キーワードデータベース108に登録されたキー
ワード122aと公開コンテンツ203との関連度の総
和”もスコアとして用いるようにしてもよい。この関連
度の総和の値が大きい単語とは、その関連づけられてい
る公開コンテンツ203の数が多く、情報仲介業者とし
てはアンカー122bを付与したい、すなわち、キーワ
ード122aとして抽出したいものである。公開コンテ
ンツ203とキーワード122aとの関連度を求めるた
めには、予めキーワードデータベース108にキーワー
ド122aと公開コンテンツ203との関連度を示す情
報を登録しておき、この情報を用いる。よって、かかる
点でコストが増大するが、そのコストが問題となる場合
には、前記の〜のスコアのみを用いればよい。
【0080】ところで、キーワード122aの抽出(ス
テップS105)の後、2次コンテンツ作成部110
は、キーワード122aにアンカー122bを付与して
(ステップS107)、2次コンテンツ202を作成す
る。このとき、アンカー122bを付与する公開コンテ
ンツ203を選択するためには、前記の例では、データ
ベース122において、キーワード122aに関連付け
られているロケーション122bを単純に選択するだけ
であったが、この選択を、キーワード122aと公開コ
ンテンツ203との関連度を用いて行ってもよい。
【0081】すなわち、このキーワード122aと公開
コンテンツ203との関連度としては、情報仲介者が予
め広告主であるサービス提供者から当該提供者が提供す
る公開コンテンツ203を情報仲介サーバー104が提
供するサービスで取り扱うように依頼を受ける段階で、
情報仲介者とサービス提供者とで話し合い、この話し合
いで決定した値を用いる。
【0082】そして、キーワードデータベース108で
は、2次コンテンツ作成部110からの指示により、キ
ーワード122aに関連づけられた公開コンテンツ20
3(のアンカー122b)を適当な数だけ選択する。そ
して、公開コンテンツ203の選択は、当該キーワード
122aと当該公開コンテンツ203との間に与えられ
た関連度をr(w,s)、当該キーワード122aに関
連づけられた公開コンテンツ203の各関連度r(w,
s)の総和をR0(w)としたときに、確率“r(w,
s)/R0(w)”で発生するようにして行なう。その
具体的な選択方法は自明なのでここでは割愛する。
【0083】このような選択を行なうことで、特定のキ
ーワード122aに対する公開コンテンツ203の採用
されやすさを表す値として、関連度r(w,s)を位置
づけることができる。そして、同一のキーワード122
aが2次コンテンツ202中に複数回出現しても、それ
ぞれ別の公開コンテンツ203へのリンクが付与される
可能性が高まるので、変化にとんだ広告内容等を提供で
き、2次コンテンツ受信者の関心を得やすくすることが
できる。
【0084】また、2次コンテンツ作成部110では、
サービス提供者のサービス提供サイト106等の公開コ
ンテンツ203へのロケーション情報をアンカー122
bとして直接付与するのに代えて、インターネット10
1に接続されている情報仲介者の管理する所定のリダイ
レクトサーバー301(図14参照)のURL、当該2
次コンテンツ202を識別するコンテンツ識別情報(Me
ssage-Idや、2次コンテンツ受信者に届いた2次コンテ
ンツ202の通算番号等)311(図15参照)、及
び、当該2次コンテンツ202の中で付与されている各
アンカー122bが先頭から数えていくつ目であるかを
示す情報(アンカー順番情報312(図15参照))
を、ブラウザが解釈可能なURLの形で2次コンテンツ
202に付与するようにしてもよい。
【0085】この場合、この2次コンテンツ202の送
信に際し、情報仲介サーバー104は、図15に示すよ
うに、当該コンテンツ識別情報311、アンカー順番情
報312、宛先である2次コンテンツ受信者のユーザー
情報313をまとめて、これらの情報をキーに参照でき
るリダイレクトデータベース302(図14参照)のデ
ータベース314(図15参照)のデータベース項目と
して格納する(データベース登録手段)。そして、この
フィールドの値には、本来、2次コンテンツ202に付
与することになっていたサービス提供者の2次コンテン
ツ202のURL122bを格納する。
【0086】2次コンテンツ受信者が2次コンテンツ2
02を受信し、興味のあるアンカー122bをクリック
すると、2次コンテンツ受信クライアント103のブラ
ウザは、直接、公開コンテンツ203にアクセスするの
ではなく、まず、アンカー122bとして付与されてい
るリダイレクトサーバー301にアクセスする。
【0087】リダイレクトサーバー301では、2次コ
ンテンツ受信クライアント103のブラウザによって告
げられたコンテンツ識別情報311、アンカー順番情報
312、ユーザー情報313からデータベース314を
検索して、対応するURL122bを選び、2次コンテ
ンツ受信クライアント103のブラウザに対してHTT
Pのリダイレクト要求を返信する。これによって、2次
コンテンツ受信者は該当するサービス提供者の提供する
サービス提供サイト106にアクセスして、キーワード
122aに対応した内容の公開コンテンツ203にアク
セスすることができる(公開コンテンツ付与手段)。
【0088】このように、コンテンツ識別情報311、
アンカー順番情報312、ユーザー情報313を、2次
コンテンツ202に記録し、また、情報仲介者の管理す
るリダイレクトデータベース302にも登録し、2次コ
ンテンツ202に付与されたアンカー122bのクリッ
クによる2次コンテンツ受信者のブラウザのリクエスト
要求を、一度情報仲介者のリダイレクトサーバー301
で受信するようにして、リクエスト要求に含まれるコン
テンツ識別情報311、アンカー順番情報312、ユー
ザー情報313をデータベース314と照合するように
すれば、情報仲介者は、特定の2次コンテンツ受信者が
クリックしたキーワード122aと、そのキーワード1
22aに付与された公開コンテンツ203のURL12
2bの履歴を取得することができ、この情報を、ユーザ
ニーズの把握、アクセス状況の把握、キーワード122
aの人気確認などに活用することができる。
【0089】また、2次コンテンツ受信者にはURL1
22bの本体が見えないため、どこのページに飛ぶか分
からないことを利用した意外なリンクを混入して、懸賞
やエンターテインメントに利用することが可能となる。
【0090】
【発明の効果】請求項1,5,9に記載の発明は、文章
中でキーワードとして適当な単語にアンカーを付与でき
る可能性を向上させ、公開コンテンツとして提供する情
報のバラエティを高め、広告等の情報提供の効果を充分
に発揮させることができる。
【0091】請求項2,3,6、7に記載の発明は、変
化にとんだ広告内容等を提供でき、2次コンテンツ受信
者の関心を得やすくすることができる。
【0092】請求項4,8に記載の発明は、公開コンテ
ンツのロケーションの履歴の情報を、ユーザニーズの把
握、アクセス状況の把握、キーワードの人気確認などに
活用することができ、また、2次コンテンツ受信者には
アンカーの本体が見えないため、どこのページに飛ぶか
分からないことを利用した意外なリンクを混入して、懸
賞やエンターテインメントに利用することが可能とな
る。
【図面の簡単な説明】
【図1】この発明の実施の形態の全体の概略構成を示す
模式図である。
【図2】各部で用いられるコンピュータの基本構成を示
すブロック図である。
【図3】第1の基本システム構成例として、データベー
スの一例を示す模式図である。
【図4】データ及び貨幣の交換を伴うビジネス方法を示
す模式図である。
【図5】2次コンテンツの作成処理の流れを示すフロー
チャートである。
【図6】キーワード抽出処理の流れを示す模式図であ
る。
【図7】2次コンテンツの作成時におけるHTML文書
作成手順を示す模式図である。
【図8】完成した2次コンテンツの一例を示す模式図で
ある。
【図9】第2の基本システム構成例で用いるデータベー
スの一例を示す模式図である。
【図10】1次コンテンツと完成した2次コンテンツと
の一例を示す模式図である。
【図11】第3の基本システム構成例として、データ及
び貨幣の交換を伴うビジネス方法を示す模式図である。
【図12】1次コンテンツと完成した2次コンテンツと
の一例を示す模式図である。
【図13】キーワード抽出処理の流れを示すフローチャ
ートである。
【図14】この発明の実施の形態の全体の概略構成を示
す模式図である。
【図15】2次コンテンツ作成の際にURLを登録する
テーブルの模式図である。
【図16】従来の一例として、広告が添付されたコンテ
ンツ例を示す模式図である。
【図17】従来の一例として、電子メールに広告が添付
された画面表示例を示す模式図である。
【符号の説明】
106 情報提供装置 121 プログラム 122 (第1の)データベース 122a キーワード 122b ロケーション(URL) 201 1次コンテンツ 202 2次コンテンツ 203 公開コンテンツ 301 情報提供装置 311 コンテンツ識別情報 312 アンカー順番情報 313 ユーザー情報 314 (第2の)データベース
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/60 326 G06F 17/60 326 502 502 ZEC ZEC Fターム(参考) 5B075 KK33 KK37 ND20 NK32 PP24 PQ32 5B085 BA06 BG03 BG07

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 文字情報を含む1次コンテンツであって
    ネットワークを経由するものを解析し、公開コンテンツ
    のロケーションをキーワードに対応付けて登録するデー
    タベースを参照して前記1次コンテンツから前記データ
    ベースに登録されたキーワードを抽出するキーワード抽
    出手段と、 抽出したキーワードをキーとして前記データベースを検
    索し、抽出したキーワードに対応付けられた公開コンテ
    ンツのロケーションを獲得するロケーション獲得手段
    と、 前記1次コンテンツ中のキーワードに対して、獲得した
    ロケーションにアクセスするためのアンカーを付与し、
    これによって2次コンテンツを作成する2次コンテンツ
    作成手段と、を具備し、 前記キーワード抽出手段は、前記1次コンテンツから所
    定の条件で単語を抽出し、その各単語に対してスコアを
    割り当て、このスコアが所定程度に高い又は低い単語を
    前記キーワードとして抽出するものであり、前記スコア
    の付与は、対象となる単語の品詞の種類、当該単語の後
    に接続する助詞の種類、当該単語の長さ、当該単語の通
    常文中での出現頻度、及び、予め登録されている当該単
    語と前記公開コンテンツとの関連度、のうち少なくとも
    1つを用いて行なう、情報提供装置。
  2. 【請求項2】 文字情報を含む1次コンテンツであって
    ネットワークを経由するものを解析し、公開コンテンツ
    のロケーションをキーワードに対応付けて登録するデー
    タベースを参照して前記1次コンテンツから前記データ
    ベースに登録されたキーワードを抽出するキーワード抽
    出手段と、 抽出したキーワードをキーとして前記データベースを検
    索し、抽出したキーワードに対応付けられた公開コンテ
    ンツのロケーションを獲得するロケーション獲得手段
    と、 前記1次コンテンツ中のキーワードに対して、獲得した
    ロケーションにアクセスするためのアンカーを付与し、
    これによって2次コンテンツを作成する2次コンテンツ
    作成手段と、を具備し、 前記ロケーション獲得手段は、前記キーワードに対応付
    けられた前記公開コンテンツのロケーションを獲得する
    際に、予め登録されている前記キーワードと前記公開コ
    ンテンツとの関連度の情報を用いる、情報提供装置。
  3. 【請求項3】 前記ロケーション獲得手段は、当該公開
    コンテンツのキーワードに対する前記関連度が、前記デ
    ータベースで当該キーワードに対応付けられたすべての
    公開コンテンツの前記関連度に対する割合に比例する確
    率で選択して、この選択した公開コンテンツについて前
    記ロケーションの獲得を行なう、請求項2に記載の情報
    提供装置。
  4. 【請求項4】 文字情報を含む1次コンテンツであって
    ネットワークを経由するものを解析し、公開コンテンツ
    のロケーションをキーワードに対応付けて登録する第1
    のデータベースを参照して前記1次コンテンツから前記
    第1のデータベースに登録されたキーワードを抽出する
    キーワード抽出手段と、 抽出したキーワードをキーとして前記データベースを検
    索し、抽出したキーワードに対応付けられた公開コンテ
    ンツのロケーションを獲得するロケーション獲得手段
    と、 前記1次コンテンツ中のキーワードに対して所定のロケ
    ーションのアンカーを付与し、これによって2次コンテ
    ンツを作成する2次コンテンツ作成手段と、 前記2次コンテンツの作成の際に、当該2次コンテンツ
    を識別するコンテンツ識別情報、当該2次コンテンツに
    付与される各アンカーが先頭から数えていくつ目である
    かを示す情報であるアンカー順番情報、及び、宛先であ
    る2次コンテンツ受信者のユーザー情報をキーとして、
    前記ロケーション獲得手段で獲得したロケーションを第
    2のデータベースに登録するデータベース登録手段と、 前記2次コンテンツ受信者が前記所定のロケーションの
    アンカーを選択したときは、前記第2のデータベースを
    参照して当該第2のデータベースに登録されているロケ
    ーションの公開コンテンツへ前記2次コンテンツ受信者
    を導く公開コンテンツ付与手段と、を具備する情報提供
    装置。
  5. 【請求項5】 文字情報を含む1次コンテンツであって
    ネットワークを経由するものを解析し、公開コンテンツ
    のロケーションをキーワードに対応付けて登録するデー
    タベースを参照して前記1次コンテンツから前記データ
    ベースに登録されたキーワードを抽出するステップと、 抽出したキーワードをキーとして前記データベースを検
    索し、抽出したキーワードに対応付けられた公開コンテ
    ンツのロケーションを獲得するステップと、 前記1次コンテンツ中のキーワードに対して、獲得した
    ロケーションにアクセスするためのアンカーを付与し、
    これによって2次コンテンツを作成するステップと、を
    含んでなり、 前記キーワードを抽出するステップは、前記1次コンテ
    ンツから所定の条件で単語を抽出し、その各単語に対し
    てスコアを割り当て、このスコアが所定程度に高い又は
    低い単語を前記キーワードとして抽出するものであり、
    前記スコアの付与は、対象となる単語の品詞の種類、当
    該単語の後に接続する助詞の種類、当該単語の長さ、当
    該単語の通常文中での出現頻度、及び、予め登録されて
    いる当該単語と前記公開コンテンツとの関連度、のうち
    少なくとも1つを用いて行なう、情報提供方法。
  6. 【請求項6】 文字情報を含む1次コンテンツであって
    ネットワークを経由するものを解析し、公開コンテンツ
    のロケーションをキーワードに対応付けて登録するデー
    タベースを参照して前記1次コンテンツから前記データ
    ベースに登録されたキーワードを抽出するステップと、 抽出したキーワードをキーとして前記データベースを検
    索し、抽出したキーワードに対応付けられた公開コンテ
    ンツのロケーションを獲得するステップと、 前記1次コンテンツ中のキーワードに対して、獲得した
    ロケーションにアクセスするためのアンカーを付与し、
    これによって2次コンテンツを作成するステップと、を
    含んでなり、 前記ロケーションを獲得するステップは、前記キーワー
    ドに対応付けられた前記公開コンテンツのロケーション
    を獲得する際に、予め登録されている前記キーワードと
    前記公開コンテンツとの関連度の情報を用いる、情報提
    供方法。
  7. 【請求項7】 前記ロケーションの獲得のステップは、
    当該公開コンテンツのキーワードに対する前記関連度
    が、前記データベースで当該キーワードに対応付けられ
    たすべての公開コンテンツの前記関連度に対する割合に
    比例する確率で選択して、この選択した公開コンテンツ
    について前記ロケーションの獲得を行なう、請求項6に
    記載の情報提供方法。
  8. 【請求項8】 文字情報を含む1次コンテンツであって
    ネットワークを経由するものを解析し、公開コンテンツ
    のロケーションをキーワードに対応付けて登録する第1
    のデータベースを参照して前記1次コンテンツから前記
    第1のデータベースに登録されたキーワードを抽出する
    ステップと、 抽出したキーワードをキーとして前記データベースを検
    索し、抽出したキーワードに対応付けられた公開コンテ
    ンツのロケーションを獲得するステップと、 前記1次コンテンツ中のキーワードに対して所定のロケ
    ーションのアンカーを付与し、これによって2次コンテ
    ンツを作成するステップと、 前記2次コンテンツの作成の際に、当該2次コンテンツ
    を識別するコンテンツ識別情報、当該2次コンテンツに
    付与される各アンカーが先頭から数えていくつ目である
    かを示す情報であるアンカー順番情報、及び、宛先であ
    る2次コンテンツ受信者のユーザー情報をキーとして、
    前記ロケーション獲得手段で獲得したロケーションを第
    2のデータベースに登録するステップと、 前記2次コンテンツ受信者が前記所定のロケーションの
    アンカーを選択したときは、前記第2のデータベースを
    参照して当該第2のデータベースに登録されているロケ
    ーションの公開コンテンツへ前記2次コンテンツ受信者
    を導くステップと、を含んでなる情報提供方法。
  9. 【請求項9】 文字情報を含む1次コンテンツであって
    ネットワークを経由するものを解析し、公開コンテンツ
    のロケーションをキーワードに対応付けて登録するデー
    タベースを参照して前記1次コンテンツから前記データ
    ベースに登録されたキーワードを抽出するキーワード抽
    出処理と、 抽出したキーワードをキーとして前記データベースを検
    索し、抽出したキーワードに対応付けられた公開コンテ
    ンツのロケーションを獲得するロケーション獲得処理
    と、 前記1次コンテンツ中のキーワードに対して、獲得した
    ロケーションにアクセスするためのアンカーを付与し、
    これによって2次コンテンツを作成する2次コンテンツ
    作成処理と、をコンピュータに実行させ、 前記キーワード抽出処理は、前記1次コンテンツから所
    定の条件で単語を抽出し、その各単語に対してスコアを
    割り当て、このスコアが所定程度に高い又は低い単語を
    前記キーワードとして抽出するものであり、前記スコア
    の付与は、対象となる単語の品詞の種類、当該単語の後
    に接続する助詞の種類、当該単語の長さ、当該単語の通
    常文中での出現頻度、及び、予め登録されている当該単
    語と前記公開コンテンツとの関連度、のうち少なくとも
    1つを用いて行なう、コンピュータに読み取り可能なプ
    ログラム。
JP2002006559A 2002-01-15 2002-01-15 情報提供装置、情報提供方法及びプログラム Pending JP2003208442A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002006559A JP2003208442A (ja) 2002-01-15 2002-01-15 情報提供装置、情報提供方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002006559A JP2003208442A (ja) 2002-01-15 2002-01-15 情報提供装置、情報提供方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2003208442A true JP2003208442A (ja) 2003-07-25

Family

ID=27645294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002006559A Pending JP2003208442A (ja) 2002-01-15 2002-01-15 情報提供装置、情報提供方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2003208442A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009080806A (ja) * 2007-09-04 2009-04-16 Yahoo Japan Corp Webページにリンクを挿入する方法
JP2011013969A (ja) * 2009-07-02 2011-01-20 Kddi Corp リンク作成支援装置、リンク作成支援方法およびプログラム
JP2011076202A (ja) * 2009-09-29 2011-04-14 Faith Inc 情報提供システム
US8041718B2 (en) 2006-02-13 2011-10-18 Sony Corporation Processing apparatus and associated methodology for keyword extraction and matching

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8041718B2 (en) 2006-02-13 2011-10-18 Sony Corporation Processing apparatus and associated methodology for keyword extraction and matching
JP2009080806A (ja) * 2007-09-04 2009-04-16 Yahoo Japan Corp Webページにリンクを挿入する方法
JP2011013969A (ja) * 2009-07-02 2011-01-20 Kddi Corp リンク作成支援装置、リンク作成支援方法およびプログラム
JP2011076202A (ja) * 2009-09-29 2011-04-14 Faith Inc 情報提供システム

Similar Documents

Publication Publication Date Title
US10733250B2 (en) Methods and apparatus for matching relevant content to user intention
TW466423B (en) Method and apparatus for providing reduced cost online service and adaptive targeting of advertisements
US9323848B2 (en) Search system using search subdomain and hints to subdomains in search query statements and sponsored results on a subdomain-by-subdomain basis
US7007014B2 (en) Canonicalization of terms in a keyword-based presentation system
CN100517304C (zh) 结果页分类方法
KR101105173B1 (ko) 카테고리화를 통해 호스트 투 게스트 콘텐츠를 자동으로 매칭하기 위한 메커니즘
US6925456B2 (en) Information searching apparatus and method for online award entry
US7058944B1 (en) Event driven system and method for retrieving and displaying information
US8140438B2 (en) Method, apparatus, and program product for processing product evaluations
US7421416B2 (en) Method of managing web sites registered in search engine and a system thereof
US20100036827A1 (en) Interconnected, universal search experience across multiple verticals
JP2007233584A (ja) 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム
JP4141099B2 (ja) 情報提供装置及び情報提供プログラムを格納する記憶媒体
US20080091658A1 (en) Online Distribution Of Time-Sensitive Content
JP2003208384A (ja) 情報提供方法及び情報提供装置
JP2003208442A (ja) 情報提供装置、情報提供方法及びプログラム
JP3461159B2 (ja) ウェブページ属性管理装置およびウェブページ属性管理方法
KR20050045650A (ko) 인포박스를 이용한 정보제공 시스템 및 방법
KR100903505B1 (ko) 검색자의 검색 요청에 응답하여 검색 목록을 생성하고검색어 광고를 제공하는 방법 및 시스템
KR20050032076A (ko) 온라인 컨텐츠의 광고 방법
JP2003228589A (ja) 情報提供装置
JP2003208391A (ja) 情報提供方法及び情報提供装置
JP2003223585A (ja) 情報提供装置及びプログラム
JP2003208544A (ja) 情報提供方法、情報提供装置及び情報提供プログラム
JP2004234290A (ja) Webページ検索システム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041005