JP2006350864A - メッセージ生成支援方法及び装置及びプログラム及びプログラムを格納した記憶媒体 - Google Patents

メッセージ生成支援方法及び装置及びプログラム及びプログラムを格納した記憶媒体 Download PDF

Info

Publication number
JP2006350864A
JP2006350864A JP2005178477A JP2005178477A JP2006350864A JP 2006350864 A JP2006350864 A JP 2006350864A JP 2005178477 A JP2005178477 A JP 2005178477A JP 2005178477 A JP2005178477 A JP 2005178477A JP 2006350864 A JP2006350864 A JP 2006350864A
Authority
JP
Japan
Prior art keywords
website
word
expression
accident
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005178477A
Other languages
English (en)
Inventor
Fusami Ichii
亮美 市井
Masashi Morimoto
正志 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005178477A priority Critical patent/JP2006350864A/ja
Publication of JP2006350864A publication Critical patent/JP2006350864A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 Webサイトの閲覧者とWebサイトの得意コンテンツを提供するWebサイト側との信頼関係を構築できるようメッセージ生成を支援する
【解決手段】 本発明は、Webサイトに書き込まれた利用者の意見や感想であるクチコミ情報をクチコミ処理手順を用いて処理して、特徴語や時間情報を含むクチコミ処理結果を出力し、アクシデント検出手順を用いて、クチコミ処理結果からWebサイトの利用を阻害しうるアクシデントに関するアクシデント表現を検出し、素材収集手順を用いて、アクシデント表現に関連する得意コンテンツ表現を含むメッセージを生成する素材を収集する。
【選択図】 図1

Description

本発明は、メッセージ生成支援方法及び装置及びプログラム及びプログラムを格納した記憶媒体に係り、特に、検索キーを入力して検索された目的とするWebサイトの閲覧を行う際に、そのWebサイトにおける特徴的な得意コンテンツを閲覧する際に、Webサイトの得意コンテンツに付随するメッセージを生成する素材を自動的に収集するためのメッセージ生成支援方法及び装置及びプログラム及びプログラムを格納した記憶媒体に関する。
利用者がWebサイトを閲覧するときに、Webページ上にあるたくさんのアンカーからリンク先の内容を推測しながらクリックし、閲覧し、そして元に戻ることによるやり直しを繰り返す。本発明は、そのようなWebサイトを閲覧するときに、利用者とWebサイトの得意コンテンツを提供するWebサイト側との信頼関係を構築できるように、メッセージの生成を支援するためのメッセージ生成支援方法及び装置及びプログラム及びプログラムを格納した記憶媒体に関する。
サイバースペースに多くのWebサイトが存在し、一つのWebサイトに大量のWebページが明確な目的によって構築されている。
ここでのWebサイトは、トップページ(代表ページ)とそれからリンクを辿って到達可能なページ群のうち、トップページと同一のサーバに属し、トップページとの関連が高いページを意味する。個々のWebサイトがそれぞれの意図によってWebページがデザインされ、構築され、利用者に対してコンテンツを提供すると考えられる。例えば、旅行の内容を紹介するコンテンツを利用者に提供する各WebサイトのWebページはそれぞれの提供者意図によってデザインされ、構築され、利用者に対してコンテンツを提供すると考えられる。
このようなサイバースペースに対し、利用者のニーズや目的によって検索を行い、検索結果をWebサイト単位で出力する、いわゆるポータルサイトがある。この方法を利用した装置では、Webページ検索システムへの検索要求にヒットしたWebページ単位の検索結果を、検索要求に適合している順番にサイト単位で出力する(例えば、特許文献1参照)。
また、サイバースペース上のWebサイトは、利用者が自主的に自分の意見や感想をWebサイトに書き込み、同時に他の利用者がその内容を閲覧できる掲示板機能を持つことがある。つまり、Webサイトに書き込まれた利用者の意見や感想という「クチコミ」情報が大量文書としてWebサイトに蓄積され、利用者が目当てのWebサイトを閲覧する場合、Webサイト側が提供したいコンテンツを利用者に閲覧させると同時に、Webサイトに書き込まれた利用者の意見や感想という「クチコミ」情報も利用者に閲覧させることが多いと考えられる。なお、このような「クチコミ」情報はWebサイト内にあるとは限らず、外部サイトに存在する場合もある。
「クチコミ」情報のような大量文書に対して、話題発生時の正確な時間情報を得て、時間情報毎に特徴的な固有表現(例えば、人名や場所など)を特徴語として付与することにより、大量文書を効率的に閲覧する方法がある(例えば、特許文献2参照)。
当該技術では、ある話題語(検索キー)を含む文書を検索し、話題語を含む文書に対して、予定情報や過去情報が記述された文書を削除し、残った文書の作成日などから話題発生時の時間情報を得る。さらに、時間情報から得た月や日を1単位とし、単位毎に出現する文書群(話題の規模を示すと見做す)などに対して、特徴語なる固有表現(例えば、人名や場所など)に注目し、単位毎に出現した文書数などから特徴語となる固有表現とそのタイプを可視化し、時系列で表示することにより、大量文書をより効率的に閲覧することが可能となる。この技術を利用することにより、「クチコミ」のような大量文書から利用者の「声」を効率よく把握することができる。
特開2003−186901「Webサイト検索方法とシステム、並びに、この方法の実行プログラムとこの方法の実行プログラムを記録した記録媒体」 特開2004−86534号公報「時系列情報からの固有情報抽出方法及び装置、並びに、時系列情報からの固有情報抽出プログラムを記録した記録媒体」
Webサイトに書き込まれた利用者の意見や感想のような大量文書がクチコミ情報としてWebサイトに多く蓄積され、利用者が目当てのWebサイトを閲覧する場合、Webサイトに提供されたコンテンツを閲覧すると同時に、そのクチコミ情報を閲覧することも多い。大量文書として蓄積されたクチコミ情報の内容が様々な話題に及び、Webサイトに提供されたコンテンツと関係する話題もあれば、まったく関係のない話題もある。例えば、ある旅行関係のWebサイトの場合、利用者に書き込まれたクチコミ情報が旅に関する感想や思い出の内容もあれば、宿泊施設の良し悪しに関する内容もある。最も多いのが旅行関係のWebサイトに提供されたコンテンツと全く関係がない友人同士の雑談内容である。この雑談部分の量がWebサイトによって異なりクチコミ情報の全体量の8割か9割まで占める場合もある。
ところが、そのWebサイトの得意コンテンツと関係する話題が極少量であってもクチコミ情報の内容によっては利用者がWebサイトに提供されたコンテンツに対して心理的な動揺や不信を招き、信頼して或いは安心してそのWebサイトに提供されたコンテンツを閲覧することができなくなり、Webサイトに提供された得意コンテンツを敬遠してしまうかもしれないという厄介な問題に遭遇する。このような問題を、ここでは、「Webサイトの得意コンテンツに関わるアクシデント」と定義する。
例えば、ある旅行関係のWebサイトの場合、Webサイトの得意コンテンツが複数のアンカーによってリンクされる。複数のアンカーによって同じリンク先のコンテンツをリンクすることがよくあり、アンカーであるキーワードに相当するものは、それぞれの単語や語句によって表現されたり、画像のサムネイルによって表現され、さらに、Webサイトの得意コンテンツの具体的な内容がWebサイトのWebページに書かれたテキストによって表現される。このように、Webサイトの得意コンテンツにリンクする複数のアンカー、Webサイトの得意コンテンツの具体的な内容が書かれたウェブページのテキストのことを「Webサイトの得意コンテンツに関わる表現」と呼ぶ。
この旅行関係のWebサイトの得意コンテンツを閲覧する場合、Webサイトの得意コンテンツが例えば、発明を実施するための最良の形態の欄で後述する図8のような画像のサムネイルによるアンカーと、「A地方の温泉ツアー」という語句によるアンカーによって表現され、さらに、Webサイトの得意コンテンツの具体的な内容が、図8の「Webサイト得意コンテンツの文書例」のようなテキストによって表現されるとする。
ここで、図20で示すように、Webサイトに書き込まれた大量のクチコミ情報の中に「A地方のAA旅館が温泉の表示に関する温泉疑惑がある」という文書の内容が出現したとする。このとき、「A地方」というキーワードは、該当するWebサイトの得意コンテンツをリンクするアンカーのキーワードである「A地方の温泉ツアー」の中の「A地方」と一致するために関係付けが行われ、その上で「温泉疑惑」というアクシデントに関わるインパクトのあるキーワードの出現により、Webサイトの閲覧者はこのWebサイトの得意コンテンツにマイナスのイメージを持つ可能性が発生する。この場合は、「A地方」の「AA旅館」の問題だけに収まらず、A地方のイメージを悪く思ってしまい、つまりマイナスのイメージを実際より過大視することが考えられる。その結果により該当するWebサイトの得意コンテンツの「A地方の温泉ツアー」に対して、A地方の「AA旅館」と関係のない「BB旅館」に対しても、利用者の心理的な動揺や不信を招き、信頼して、あるいは、安心してそのWebサイトに提供されたコンテンツの内容を閲覧することができず、Webサイトに提供された得意コンテンツを敬遠するという厄介な問題(アクシデント)に遭遇する。
Webサイトの得意コンテンツは、Webサイト側にとっても、最も力をいれ、最も利用者に閲覧されたいコンテンツ、利用されたいコンテンツと考えられ、アクシデントや不慮の出来事による損害をなるべく避けたいと思われる。「クチコミ」の大量の文書の中にアクシデントに関わるインパクトのある表現が、Webサイトの閲覧者にマイナスなイメージを強く与える可能性が高い、そのマイナスなイメージを実際より過大視することがよくある。
本発明は、上記の点に鑑みなされたもので、Webサイトの閲覧者とWebサイトの得意コンテンツを提供するWebサイト側との信頼関係を構築できるようメッセージ生成を支援するためのメッセージ生成支援方法及び装置及びプログラム及びプログラムを格納した記憶媒体を提供することを目的とする。
図1は、本発明の原理を説明するための図である。
本発明(請求項1)は、検索キーを入力して検索された目的とするWebサイトの閲覧を行う際に、特に、そのWebサイトにおける特徴的な得意コンテンツを閲覧する際に、Webサイトの得意コンテンツに付随するメッセージを生成する素材を収集するための、クチコミ処理手段、アクシデント検出手段、素材収集手段と、を有する装置における、メッセージ生成支援方法であって、
クチコミ処理手段が、Webサイトに書き込まれた利用者の意見や感想であるクチコミ情報を、クチコミ処理手順を用いて処理し、特徴語や時間情報を含むクチコミ処理結果を出力するクチコミ処理ステップ(ステップ1)と、
アクシデント検出手段が、アクシデント検出手順を用いて、クチコミ処理結果からWebサイトの利用を阻害しうるアクシデントに関するアクシデント表現を検出するアクシデント検出ステップ(ステップ2)と、
素材収集手段が、素材収集手順を用いて、アクシデント表現に関連する得意コンテンツ表現を含むメッセージを生成する素材を収集する素材収集ステップ(ステップ3)と、を行う。
また、本発明(請求項2)は、アクシデント検出ステップにおいて、
アクシデント表現とWebサイトの得意コンテンツに関わる表現との連結表現パターンを用いてアクシデント表現を検出するステップを行う。
また、本発明(請求項3)は、素材収集ステップにおいて、
アクシデント検出ステップで検出されたアクシデント表現と、Webサイト検索結果として与えられたWebサイトの得意コンテンツに関わる表現との連結表現パターンが含まれるクチコミ情報の発生時間から、該発生時間からのクチコミ情報の時系列毎に出現した特徴語となる固有表現に対して、該当するクチコミ情報の発生時間から該Webサイトの得意コンテンツにリンクする複数のアンカーの時系列定常変化パターンのずれを検出することにより、検索サービスを利用するための派生検索キーを生成するステップと、
Webサイトの得意コンテンツに付随するメッセージを生成する素材を収集するステップと、を行う。
図2は、本発明の原理構成図である。
本発明(請求項4)は、検索キーを入力して検索された目的とするWebサイトの閲覧を行う際に、特に、そのWebサイトにおける特徴的な得意コンテンツを閲覧する際に、Webサイトの得意コンテンツに付随するメッセージを生成する素材を収集するためのメッセージ生成支援装置であって、
クチコミ処理手順を格納するクチコミ処理手順記憶手段311と、
アクシデント検出手順を格納するアクシデント検出手順記憶手段321と、
素材収集手順を格納する素材収集手順記憶手段331と、
Webサイトに書き込まれた利用者の意見や感想であるクチコミ情報を、クチコミ処理手順を用いて処理し、特徴語や時間情報を含むクチコミ処理結果を出力するクチコミ処理手段31と、
アクシデント検出手順を用いて、Webサイトの利用を阻害しうるアクシデントに関するアクシデント表現を検出するアクシデント検出手段32と、
素材収集手順を用いて、アクシデント表現に関連する得意コンテンツ表現を含むメッセージを生成する素材を収集する素材収集手段33と、を有する。
また、本発明(請求項5)は、アクシデント検出手段32において、
アクシデント表現とWebサイトの得意コンテンツに関わる表現との連結表現パターンを用いてアクシデント表現を検出する手段を含む。
また、本発明(請求項6)は、素材収集手段33において、
アクシデント検出手段32で検出されたアクシデント表現と、Webサイト検索結果として与えられたWebサイトの得意コンテンツに関わる表現との連結表現パターンが含まれるクチコミ情報の発生時間から、該発生時間からのクチコミ情報の時系列毎に出現した特徴語となる固有表現に対して、該当するクチコミ情報の発生時間から該Webサイトの得意コンテンツにリンクする複数のアンカーの時系列定常変化パターンのずれを検出することにより、検索サービスを利用するための派生検索キーを生成する手段と、
Webサイトの得意コンテンツに付随するメッセージを生成する素材を収集する手段と、
を含む。
本発明(請求項7)は、請求項1乃至3に記載されたメッセージ生成支援方法の各ステップをコンピュータに実行させるプログラムである。
本発明(請求項8)は、請求項1乃至3に記載されたメッセージ生成支援方法の各ステップをコンピュータに実行させるプログラムを格納した記憶媒体である。
本発明は、Webサイトを閲覧する際に、Webサイトの閲覧者とWebサイトの得意コンテンツを提供するWebサイト側との信頼関係を構築することにより、安心してWebサイトを閲覧できるようになる。
以下、図面と共に本発明の実施の形態を説明する。
最初に、本発明の前提となる技術として、検索結果としてのWebサイトの中で、得意とするコンテンツ或いは、自慢できるコンテンツを自動的に指摘することにより、Webサイト提供側が最も利用者に推薦したいコンテンツ(これをWebサイトの得意コンテンツと定義する)を素早く閲覧する技術について説明する。
当該技術では、Webページのアンカーであるキーワードに相当するものに対して、複数のアンカーによって同じリンク先のコンテンツをリンクするアンカーの表現パターン、時系列の変化パターンを用いて、Webサイトの得意コンテンツを推定することにより、Webサイトの閲覧を支援する。この技術を利用することにより、ポータルサイトへ検索のクエリを出すだけで、検索目的に適合したWebサイトを選択でき、かつ、Webサイトの得意コンテンツあるいは、自慢できるコンテンツを逸早く閲覧することができる。
図3は、本発明の一実施の形態におけるシステム構成図である。
同図に示すシステムは、ユーザ側のWebサイト検索閲覧装置2とメッセージ生成支援装置3から構成される。
Webサイト検索閲覧装置2は、Webサイト検索部21とWebサイト得意コンテンツ取得部22から構成される。
メッセージ生成支援装置3は、クチコミ処理部31、アクシデント検出部32、素材収集部33から構成される。
以下、上記の構成における動作を詳細に説明する。
図4は、本発明の一実施の形態における構成及び全体の動作を説明するための図である。
図4において、Webサイト検索閲覧装置2には、Webサイト検索エンジン211と、Webサイト得意コンテンツ結果ファイル221が接続されている。当該Webサイト得意コンテンツ結果ファイル221は、上記の本発明の前提となる技術を用いてWebサイト検索エンジン211で取得した得意コンテンツが格納されている。
また、メッセージ生成支援装置3のクチコミ処理部31には、クチコミ処理手順311、クチコミ処理結果ファイル312が接続され、また、アクシデント検出部32には、アクシデント検出手順321、アクシデント検出結果ファイル322が接続され、素材収集部33には、素材収集規則331、素材収集結果ファイル332が接続されている。
なお、上記のクチコミ処理手順311、アクシデント検出手順321、素材収集規則331は、それぞれハードディスク装置等の記憶手段に格納されている。
図5に、以下に説明する各々の処理で得られる結果を示す。なお、以下のa〜dについては図4中の記載に対応している。
図5(a)は、Webサイト検索閲覧装置2のWebサイト得意コンテンツ取得部22で取得したWebサイト得意コンテンツ検索閲覧結果例(図8参照)である。
図5(b)は、メッセージ生成支援装置3のクチコミ処理部31でクチコミ情報を処理し、特徴語や時間情報を取得して作成されたクチコミ処理結果(図10参照)である。
図5(c)は、メッセージ生成支援装置3の素材収集部33で上記の(a1)と(b)から生成された検索サービスを利用するための検索キーの生成結果(図17参照)である。
図5(d)は、メッセージ生成支援装置3の素材収集部33で検索キーに基づいて検索され、収集された素材収集結果(図16参照)である。
なお、図4に示されるWebサイト検索部21から出力されるa1は、図7に示すようなWebサイト検索結果である。
以下では、入力部1から入力された検索キー“国内旅行”により得られる、例えば、Webサイト検索閲覧装置2のWebサイト得意コンテンツ取得部22から得られるWebサイト得意コンテンツ検索閲覧結果例を対象として、メッセージ生成支援装置3において、Webサイトの得意コンテンツに付随するメッセージを生成する素材の収集について説明する。
入力部1から検索キーとして、例えば、“国内旅行”が入力されると、文字コードで表記され、Webサイト閲覧検索装置2に転送される。
Webサイト閲覧検索装置2の動作を図6に示す。
まず、Webサイト検索部21は、Webサイト検索エンジン211を用いて、入力された検索キー“国内旅行”を対象に、検索目的に適合したWebサイトの選択を行い、
・Webサイト名
・WebサイトID
・Webサイト得点
・WebサイトTOPページURL、
即ち、図7に示すようなWebサイト検索結果を作成する(ステップ101)。なお、これらのWebサイト検索結果は図4の「a1」に対応する。当該結果は、メッセージ生成支援装置3のクチコミ処理部31に転送される(ステップ102)。また、当該Webサイト検索結果は、Webサイト得意コンテンツ取得部22に転送され、上記のWebサイト名、WebサイトID、Webサイト得点、WebサイトTOPページURLに加え、Webサイトの得意コンテンツに関わる表現として、
・Webサイトの得意コンテンツにおけるアンカーを表現するキーワード
・アンカーのリンク先URL
・Webサイトの得意コンテンツの文書
を作成し、図8に示すようなWebサイト得意コンテンツ検索閲覧結果を、Webサイト得意コンテンツ結果ファイル221に格納する(ステップ104)。なお、これらのWebサイト得意コンテンツ検索閲覧結果は、図4の「a」に対応する。当該結果は、メッセージ生成支援装置3のアクシデント検出部32に転送される(ステップ105)。
次に、メッセージ生成支援装置3のクチコミ処理部31の動作を説明する。
図9は、本発明の一実施の形態におけるクチコミ処理部の動作のフローチャートである。
クチコミ処理部31は、クチコミ処理手順311を読み出して、Webサイト検索閲覧装置2から転送されたWebサイト名、WebサイトID、Webサイト得点、WebサイトTOPページURL、即ち、図7に示すようなWebサイト検索結果を対象に
・クチコミ情報に関するアンカーを表現するキーワード
・アンカーのリンク先のURL
・クチコミ情報に関する文書の処理結果
を作成し、その結果をクチコミ処理結果ファイル312に格納し(ステップ201)、アクシデント検出部32に転送する(ステップ202)。
例えば、図5(a)で入力された検索キー“国内旅行”に対して、図20のようなWebサイト「aa旅行」のクチコミ情報の文書例が得られる。クチコミ処理手順311を用いて、図10のようなクチコミ処理結果として、
・アンカーを表現するキーワード
・アンカーのリンク先のURL
・クチコミ情報に関する文書の処理結果
を作成し、その結果をクチコミ処理結果ファイル312に格納し、アクシデント検出部32に転送する。なお、これらのクチコミ処理結果は図4の「b」に対応する。
上記のクチコミ処理手順311は、例えば、Webサイト検索結果における各Web内のクチコミ情報を探す一般的な検索エンジンの利用手順であってもよい。また、図10のような情報を従来技術で記載したような固有表現抽出手順を用いて取得することができる。
上記のクチコミ情報に関する文書の処理結果は、図10の例では、日単位毎に、時間情報、固有表現、テキストの三部分の内容に分けられ、格納される。
図7の「aa旅行」サイト以外のWebサイトに対しても同様な処理を行う。例えば、順次、「bb旅行」サイトに対して、同様の処理を行う。
次に、メッセージ生成支援装置3のアクシデント検出部32の動作を説明する。
図11は、本発明の一実施の形態におけるアクシデント検出部の動作のフローチャートである。また、図12は、本発明の一実施の形態におけるアクシデント検出手順の記述例である。アクシデント検出手順321は、アクシデントに関するインパクトのある表現の表記、読み、品詞、及び分野種別からなるターゲットと、アクシデントに関するインパクトのある表現と得意コンテンツに関わる表現との連結表現条件からなる。
アクシデント検出部32は、ステップ202において、クチコミ処理部31から転送されたクチコミ処理結果ファイル312の内容と、ステップ105において、Webサイト検索閲覧装置2から転送されたWebサイト得意コンテンツ結果ファイル221を対象に、アクシデント検出手順321を読み出して、アクシデントに関わるインパクトのある表現とWebサイトの得意コンテンツに関わる表現との連結表現パターンを含むクチコミ情報の文書を検出し、その結果を、アクシデント検出結果ファイル322に格納し(ステップ301)、Webサイト得意コンテンツ結果ファイル221、クチコミ処理結果ファイル312の各内容と一緒に、素材収集部33に転送する(ステップ302)。なお、アクシデント検出結果は、図4の「c」に対応する。
ステップ301におけるアクシデント検出結果ファイル322の例を図13に示す。
なお、アクシデント検出手順321は、その連結表現パターンを人手によって作成しても、出現頻度によって自動的に生成するものであってもよい。
次に、メッセージ生成支援装置3の素材収集部33の動作を説明する。
図14は、本発明の一実施の形態における素材収集部の動作のフローチャートである。
図15は、本発明の一実施の形態における素材収集規則の記述例である。素材収集規則331は、コア検索キー(表現パターン)と、分野種別、得意コンテンツにおけるアンカーの時系列定常変化パターン、アクシデントに対するアンカーの時系列定常変化パターンのズレに関するルール、からなる派生する検索キーとを有する。
例えば、アクシデント検出部32から転送された図10のような情報(クチコミに関する、アンカーを表現するキーワード、アンカーのリンク先のURL、クチコミ情報に関する文書の処理結果(時間情報、固有表現、テキスト))を対象に、図12に示すアクシデント検出手順321の記述例を用いて、アクシデントに関わるインパクトのある表現とWebサイトの得意コンテンツに関わる表現との連結表現パターンを含むクチコミ情報の文書を検出し、その結果を、図13のアクシデント検出結果ファイル322の記述例に示すような情報(アンカーを表現するキーワード、アンカーのリンクのURL、検出されたクチコミ情報の時間情報、固有表現、テキスト、表現パターン)が格納される。
この場合、図10のようなクチコミ処理結果ファイル312の記述例を対象に、図12のアクシデント検出手順321の記述例を用いて、図10のクチコミ処理結果ファイル312の記述例の固有表現の「A地方」(品詞:地名)、「AA旅館」(品詞:固有名詞)、「温泉疑惑」(品詞:名詞)と固有表現の「パラグライダー」(品詞:名詞)と固有表現の「交通事故」(品詞:名詞)をもって、図12のアクシデント検出手順321の記述例と照合する。その結果、「温泉疑惑」(品詞:名詞)という固有表現の表記とマッチングされ、更に固有表現の「温泉疑惑」(品詞:名詞)の品詞も図12のアクシデント検出手順321の記述例の項番“1”の「品詞」の項目内容ともマッチングされることにより、この固有表現の「温泉疑惑」(品詞:名詞)がアクシデントに関わる表現の一つと判断される。
次に、「A地方」(品詞:地名)という固有表現の品詞が名詞で、図12のアクシデント検出手順321の記述例の項番「1」の「アクシデントに関わるインパクトのある表現と得意コンテンツに関わる表現との条件」とマッチングされ、この固有表現の「A地方」(品詞:地名)の表記をもって、アクシデント検出部32から転送されたWebサイト得意コンテンツ結果ファイル221の内容と照合し、Webサイト得意コンテンツ結果ファイル221の得意コンテンツの文書中に、あるいは、この得意コンテンツにリンクするアンカーを表現するキーワードに「A地方」という表記が存在し、固有表現の「A地方」(品詞:名詞)もアクシデントに関わる表現であると断定される。
この固有表現の「温泉疑惑」(品詞:名詞)と「A地方」(品詞:地名)を用いて、図10のようなクチコミ処理結果ファイル312の記述例の“テキスト”と照合し、“文3”に「温泉疑惑」と「A地方」が含まれ、この“文3”をアクシデントに関わる表現を含むクチコミ情報の文書として検出し、その結果が図13のアクシデント検出結果ファイル322の記述例のように格納される。
素材収集部33は、素材収集規則331を用いて、転送されたアクシデント検出結果ファイル322と、Webサイト得意コンテンツ結果ファイル221、クチコミ処理結果ファイル312の各内容を対象に、検出されたアクシデントに関わるインパクトのある表現とWebサイトの得意コンテンツに関わる表現との表現パターンが含まれるクチコミ文書の発生時間から、その発生時間からのクチコミ文書の時系列毎に出現された特徴語となる固有表現に対して、該当するクチコミ文書の発生以降で、Webサイトの得意コンテンツにリンクする複数のアンカーの時系列定常変化パターンのずれを検出することにより、検索サービスを利用するための派生検索キーを生成し、収集結果を素材収集結果ファイル332に格納し(ステップ401)、出力部4に転送する(ステップ402)。なお、当該収集結果は図4の「d」に対応する。
図15の素材収集規則331の記述例を用いて、転送された図13のアクシデント検出結果ファイル322の記述例のような情報と、Webサイト得意コンテンツ結果ファイル221と図10のようなクチコミ処理結果ファイル312の記述例のような情報を対象に、図5のステップ50、即ち、図16に示す素材収集結果例のような結果を素材収集結果ファイル332に格納し、出力部4に転送する。
例えば、転送された図13のアクシデント検出結果ファイル322の記述例の固有表現を対象に、固有表現の「A地方」(品詞:地名)と「温泉疑惑」(品詞:名詞)の組み合わせが、図15の素材収集規則331の記述例の項番“1”の“コア検索キー”項目の“表現パターン”と適合し、「A地方」と「温泉疑惑」が図17の検索キーの生成結果例のようなコア検索キーとして生成される。
次に、図15の素材収集規則331の記述例の項番“1”の「派生する検索キー」項目の「得意コンテンツにおけるアンカーの時系列定常変化パターンのずれに関するルール」と照合し、「A地方」と新たに組み合わせる派生検索キーを検索サービスに利用することにより、結果を素材収集結果ファイル332に格納し、出力部4に転送する。
例えば、図8のWebサイト得意コンテンツ結果例により、得意コンテンツのアンカーを表現するキーワード1とキーワード2の「A地方の温泉ツアー」から図18の得意コンテンツにおけるアンカーの時系列定常変化パターンの項番“1”と適合し、図19に示すように、キーワード1の変化の周期が25日で、キーワード2の変化の周期が5日であり、更に検出された表現パターンが含まれるクチコミ文書の発生時間(10月1日)以降、得意コンテンツにおけるアンカーの時系列定常変化の期間が3日とずれたことにより(図15の「素材収集規則331」の記述例により)、図15の素材収集規則331の記述例の項番“1”の「派生する検索キー」の項目の「得意コンテンツにおけるアンカーの時系列定常変化パターンのずれに関するルール」に従い、図8に示されるアンカーと図10のクチコミ処理結果例に示された固有表現の中の「パラグライダー」と「交通事故」が派生検索キーとして生成される。例えば、一般的な検索サービスを利用することにより、これら派生検索キーとコア検索キーを用いて、図16の素材収集結果例のような素材を収集し、それを素材収集結果ファイル332に格納し、出力部4に転送する。
出力部4では、図16の素材収集結果例のような情報を画面に表示する。
なお、本発明は、上記の図6、図9、図11、図14に示す動作をプログラムとして構築し、コンピュータにインストールして実行する、または、ネットワークを介して流通させることが可能である。
また、構築されたプログラムをハードディスク装置や、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納しておき、コンピュータにインストールして実行させる、または、配布することが可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
本発明は、Webサイトを閲覧するための技術に適用可能である。
本発明の原理を説明するための図である。 本発明の原理構成図である。 本発明の一実施の形態におけるシステム構成図である。 本発明の一実施の形態における構成及び動作を説明するための図である。 本発明の一実施の形態における処理する結果例である。 本発明の一実施の形態におけるWebサイト検索閲覧部の動作のフローチャートである。 本発明の一実施の形態におけるWebサイト検索結果例である。 本発明の一実施の形態におけるWebサイト得意コンテンツ検索閲覧結果例である。 本発明の一実施の形態におけるメッセージ生成支援装置のクチコミ処理部の動作のフローチャートである。 本発明の一実施の形態におけるクチコミ処理結果例である。 本発明の一実施の形態におけるアクシデント検出部の動作のフローチャートである。 本発明の一実施の形態におけるアクシデント検出手順の記述例である。 本発明の一実施の形態におけるアクシデント検出結果ファイルの記述例である。 本発明の一実施の形態における素材収集部の動作のフローチャートである。 本発明の一実施の形態における素材収集規則の記述例である。 本発明の一実施の形態における素材収集結果例である。 本発明の一実施の形態における検索キーの生成結果例である。 本発明の一実施の形態における得意コンテンツにおけるアンカーの時系列定常変化パターンである。 本発明の一実施の形態における得意コンテンツにおけるアンカーの時系列定常変化パターン(Keyの記述例)である。 クチコミ文書例である。
符号の説明
1 入力部
2 Webサイト検索閲覧装置
3 メッセージ生成支援装置
4 出力部
21 Webサイト検索部
22 Webサイト得意コンテンツ取得部
31 クチコミ処理手段、クチコミ処理部
32 アクシデント検出手段、アクシデント検出部
33 素材収集手段、素材収集部

Claims (8)

  1. 検索キーを入力して検索された目的とするWebサイトの閲覧を行う際に、特に、そのWebサイトにおける特徴的な得意コンテンツを閲覧する際に、Webサイトの得意コンテンツに付随するメッセージを生成する素材を収集するための、クチコミ処理手段、アクシデント検出手段、素材収集手段と、を有する装置における、メッセージ生成支援方法であって、
    前記クチコミ処理手段が、Webサイトに書き込まれた利用者の意見や感想であるクチコミ情報を、クチコミ処理手順を用いて処理し、特徴語や時間情報を含むクチコミ処理結果を出力するクチコミ処理ステップと、
    前記アクシデント検出手段が、アクシデント検出手順を用いて、前記クチコミ処理結果から前記Webサイトの利用を阻害しうるアクシデントに関するアクシデント表現を検出するアクシデント検出ステップと、
    前記素材収集手段が、素材収集手順を用いて、前記アクシデント表現に関連する得意コンテンツ表現を含むメッセージを生成する素材を収集する素材収集ステップと、
    を行うことを特徴とするメッセージ生成支援方法。
  2. 前記アクシデント検出ステップにおいて、
    前記アクシデント表現とWebサイトの得意コンテンツに関わる表現との連結表現パターンを用いて前記アクシデント表現を検出するステップを行う、請求項1記載のメッセージ生成支援方法。
  3. 前記素材収集ステップにおいて、
    前記アクシデント検出ステップで検出された前記アクシデント表現と、Webサイト検索結果として与えられたWebサイトの得意コンテンツに関わる表現との連結表現パターンが含まれるクチコミ情報の発生時間から、該発生時間からのクチコミ情報の時系列毎に出現した特徴語となる固有表現に対して、該当するクチコミ情報の発生時間から該Webサイトの得意コンテンツにリンクする複数のアンカーの時系列定常変化パターンのずれを検出することにより、検索サービスを利用するための派生検索キーを生成するステップと、
    前記Webサイトの得意コンテンツに付随するメッセージを生成する素材を収集するステップと、
    を行う、請求項1または、2記載のメッセージ生成支援方法。
  4. 検索キーを入力して検索された目的とするWebサイトの閲覧を行う際に、特に、そのWebサイトにおける特徴的な得意コンテンツを閲覧する際に、Webサイトの得意コンテンツに付随するメッセージを生成する素材を収集するためのメッセージ生成支援装置であって、
    クチコミ処理手順を格納するクチコミ処理手順記憶手段と、
    アクシデント検出手順を格納するアクシデント検出手順記憶手段と、
    素材収集手順を格納する素材収集手順記憶手段と、
    Webサイトに書き込まれた利用者の意見や感想であるクチコミ情報を、前記クチコミ処理手順を用いて処理し、特徴語や時間情報を含むクチコミ処理結果を出力するクチコミ処理手段と、
    前記アクシデント検出手順を用いて、前記クチコミ処理結果から前記Webサイトの利用を阻害しうるアクシデントに関するアクシデント表現を検出するアクシデント検出手段と、
    前記素材収集手順を用いて、前記アクシデント表現に関連する得意コンテンツ表現を含むメッセージを生成する素材を収集する素材収集手段と、
    を有することを特徴とするメッセージ生成支援装置。
  5. 前記アクシデント検出手段は、
    前記アクシデント表現とWebサイトの得意コンテンツに関わる表現との連結表現パターンを用いて前記アクシデント表現を検出する手段を含む請求項4記載のメッセージ生成支援装置。
  6. 前記素材収集手段は、
    前記アクシデント検出手段で検出された前記アクシデント表現と、Webサイト検索結果として与えられたWebサイトの得意コンテンツに関わる表現との連結表現パターンが含まれるクチコミ情報の発生時間から、該発生時間からのクチコミ情報の時系列毎に出現した特徴語となる固有表現に対して、該当するクチコミ情報の発生時間から該Webサイトの得意コンテンツにリンクする複数のアンカーの時系列定常変化パターンのずれを検出することにより、検索サービスを利用するための派生検索キーを生成する手段と、
    前記Webサイトの得意コンテンツに付随するメッセージを生成する素材を収集する手段と、
    を含む、請求項4または、5記載のメッセージ生成支援装置。
  7. 前記請求項1乃至3に記載されたメッセージ生成支援方法の各ステップをコンピュータに実行させることを特徴とするメッセージ生成支援プログラム。
  8. 前記請求項1乃至3に記載されたメッセージ生成支援方法の各ステップをコンピュータに実行させるプログラムを格納したことを特徴とするメッセージ生成支援プログラムを格納した記憶媒体。
JP2005178477A 2005-06-17 2005-06-17 メッセージ生成支援方法及び装置及びプログラム及びプログラムを格納した記憶媒体 Pending JP2006350864A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005178477A JP2006350864A (ja) 2005-06-17 2005-06-17 メッセージ生成支援方法及び装置及びプログラム及びプログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005178477A JP2006350864A (ja) 2005-06-17 2005-06-17 メッセージ生成支援方法及び装置及びプログラム及びプログラムを格納した記憶媒体

Publications (1)

Publication Number Publication Date
JP2006350864A true JP2006350864A (ja) 2006-12-28

Family

ID=37646600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005178477A Pending JP2006350864A (ja) 2005-06-17 2005-06-17 メッセージ生成支援方法及び装置及びプログラム及びプログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JP2006350864A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011059886A (ja) * 2009-09-08 2011-03-24 Paradigm Shift Inc 口コミ情報管理システム、口コミ情報管理方法、および口コミ情報管理プログラム
JP2014038647A (ja) * 2013-10-03 2014-02-27 Paradigm Shift Inc 口コミ情報管理システム、口コミ情報管理方法、および口コミ情報管理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011059886A (ja) * 2009-09-08 2011-03-24 Paradigm Shift Inc 口コミ情報管理システム、口コミ情報管理方法、および口コミ情報管理プログラム
JP2014038647A (ja) * 2013-10-03 2014-02-27 Paradigm Shift Inc 口コミ情報管理システム、口コミ情報管理方法、および口コミ情報管理プログラム

Similar Documents

Publication Publication Date Title
US11341180B2 (en) Displaying search results on a one or two dimensional graph
US9069867B2 (en) Resource management system, method and program for selecting candidate tag
US20080059897A1 (en) Method and system of social networking through a cloud
JP2010506335A (ja) 場所に関するサイトの識別
US8572118B2 (en) Computer method and apparatus of information management and navigation
US20100192055A1 (en) Apparatus, method and article to interact with source files in networked environment
JP4200933B2 (ja) 情報検索装置
JP2008269069A (ja) 情報処理システム及び情報処理方法
JP5416253B2 (ja) 関連コンテンツ検索装置及び関連コンテンツ検索方法
JP2009015589A (ja) 関連文書提示システム及びプログラム
JP2006350864A (ja) メッセージ生成支援方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP2006164086A (ja) オンライン知識検索支援装置、およびオンライン知識検索支援方法
JP2007148741A (ja) Web検索支援サーバ
JP2010282403A (ja) 文書検索方法
JP2014222448A (ja) 書籍抽出装置、書籍抽出方法及び書籍抽出用プログラム
JP5155130B2 (ja) カテゴリ提示装置
JP2009098829A (ja) 漫画のコマ検索装置
JP4715031B2 (ja) 構造化文書変換システム及び構造化文書変換プログラム
JP5870036B2 (ja) ページの遷移管理システム、遷移管理用サーバ装置および遷移管理用プログラム
JP2005208901A (ja) 情報検索システム、およびプログラム
Agrawal Journal indexing: Myths and facts
Parrott et al. Politics & elections resources
Chakoli et al. Evaluation Criteria for Online Specialized indexes
JP2002063170A (ja) Web検索の規制方法
JP4934572B2 (ja) Spam特徴情報生成装置、spam情報フィルタリング装置および情報検索装置およびその方法