JP2007527558A - ウェブサイトなどの情報源によるナビゲーション - Google Patents

ウェブサイトなどの情報源によるナビゲーション Download PDF

Info

Publication number
JP2007527558A
JP2007527558A JP2006506172A JP2006506172A JP2007527558A JP 2007527558 A JP2007527558 A JP 2007527558A JP 2006506172 A JP2006506172 A JP 2006506172A JP 2006506172 A JP2006506172 A JP 2006506172A JP 2007527558 A JP2007527558 A JP 2007527558A
Authority
JP
Japan
Prior art keywords
topic
group
topics
key
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006506172A
Other languages
English (en)
Inventor
デイビッド ワット スティーブンソン
Original Assignee
デイビッド ワット スティーブンソン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by デイビッド ワット スティーブンソン filed Critical デイビッド ワット スティーブンソン
Publication of JP2007527558A publication Critical patent/JP2007527558A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

インターネットまたはイントラネットサイトのような電子文書グループをナビゲーションための対話式/電子ガイド(10)であって、サイト内で識別したトピックの重要度の表示(16)とともに、複数のトピック識別子(14)を自動的に表示する。各トピック(14、16)はユーザが任意に選択できる。任意のトピック(14、16)を選択することでトピック情報へアクセスできる。好ましくは、ガイド(10)は、コンテンツに潜在的相関性のある複数のサイトに関する情報を、それら複数サイト間のコンテンツの類似度表示と共に提供する。

Description

本発明は、ウェブサイトやこれに類似する情報源のように、ワールドワイドウェブ上にある情報集団から所望の情報を検索し、ナビゲーションするための改良されたシステムおよび方法に関する。本発明はまた、情報のナビゲーションを容易にする対話方式ガイドを作り出すためのシステムおよび方法に関する。
法人組織においては、上級管理者や研究者が、今起こっていることに関して正確な情報を詳細なレベルで取得するのは、時として困難である。その一方で、法人組織のウェブサイトには、多くの情報が、例えば、会社の製品、スタッフ、組織などに関する多彩な情報が含まれている。こうした情報に容易にアクセスできれば、価値ある情報源となり得る。しかし、現行のウェブサイトロケーションや閲覧技術は、効率が悪くため、膨大な量の情報から重要なトピックスを識別することが難しいため、関連するウェブサイトを特定し、情報を見つけ出すことが現在は困難である。
現在、ウェブサイトの所在検出およびナビゲーションを行うために、様々な検索技術と閲覧技術が利用可能である。これらのうち、最初に挙げられるのは、従来型のサーチエンジンである。これはサーチエンジンボックスに入力した特定の単語またはフレーズを含むウエページを特定する。この技術は、検索者がウェブサイトで使用されている単語またはフレーズを正確に知っていることが必須条件となる。これは商品名などの実際的な情報を検索するには有効である。しかし、抽象的な概念や、同一または関連する情報を表現するのに異なる単語やフレーズが使用されている場合には、あまり有効とはいえない。例えば、"教師"という単語を含むページ上に、必要とする情報がすべて載っている場合には、サーチエンジンまたはウェブサイトで"教師"という単語を検索することは効果的である。しかし、関連する情報が"教師"という単語を含まない頁に、例えば、"教育"、"学校"、"子供"、"教室"などの単語を含む頁にある場合には、"教師"だけをキーワードにしたサーチエンジンでは、当該関連情報に辿り着けない。この手法のさらなる問題点は、特定のビジネスの形態を検索する場合(例えば、合併や買収の可能性を有する対象、市場や販売の有望な候補、ビジネスパートナーなどを検索する場合)、個々のウェブページを検出するので、その企業の組織体のほんの一部の情報しか反映されない。任意の企業のウェブサイトには何万というウェブページがあり、従って、一般的に、単一の頁に企業の組織活動全体を反映させることは不可能で、組織の活動範囲に基づく企業の識別作業を困難なものとしている。
ウェブサイトにおいてユーザのナビゲーションを補助するのに、従来、サイトマップあるいはリンク集が利用されている。これらは、典型的には、主題となるトピックとサブトピックを含むウェブサイトの個々の頁にリンクする長い目録を備えている。サイトマップは、相対的にハイレベルではあるが、通常、手作業で作成されている。従って、往々にして重要な詳細情報を欠き、編成や構成が比較的平坦に陥りやすい。すなわち、一つのレベルを超えての情報の "掘り下げ"が一般的に不可能であり、別の主題に関する情報の閲覧を希望する度に、ユーザはその都度、サイトマップに戻らなければならので、情報入手が極めて不便である。
ウェブサイトを検索するためのその他の従来技術は、手動によるブラウジング(閲覧)である。一般的にウェブは、何百万以上のページから成り、各ページ間は多重経路によって連結されている。ユーザが特定のページに含まれるリンクを選択することで、関連テキストや関連図形で特定される情報を含むリンクページへ移動することができる。しかし、手動でブラウジングする場合は、関連情報を含むページを見落とし易い。さらに、一般的なウェブサイトで採用されているテキスト形式のリンクは、スペース上の制限からそこに表示できる単語数が少なく、その数ではリンクを頼って辿り着ける多くの主題を、十分には記述できない。手動によるブラウジングのさらなる問題は、ユーザが各ウェブページを流し読みする傾向があるため、頁上の見出しテキストや視覚的に強調したい項目を、必然的により目立つようにしなけばならないことである。これは、強調されたテキストに目当てのキーワードが含まれていないと、ユーザがページを流し読みした時に、主要情報を効率的に取得することができないことを意味ずる。
本発明の目的の一つは、ワールドワイドウェブ上またはこれに類似する情報源上の情報集団の所在を検出するための改良されたシステムおよび方法を提供することにある。こうした情報集団は、典型的には、www. google. com.またはwww. uspto.gov.などの如く、URLで特定されるウェブサイト内に含まれる。
本発明の別の目的は、ワールドワイドウェブまたはその他の情報源の情報集団間あるいは情報集団内をナビゲーションするための改良された方法を提供することにある。こうした情報集団は、典型的には、単一のウェブサイト領域、またはコンテンツによって関連付けられた複数のウェブサイトに含まれる。
本発明のさまざまな実施態様は、独立形式の請求項に記載する。幾つかの好ましい特徴は従属形式の請求項に記載する。
本発明の一実施態様によれば、一群のテキストベースの電子文書をプロファイリングする方法が提供され、その方法は、重要な話題(キートピック)を特定するためにグループ内の全ての電子文書を分析する工程と、特定されたキートピックに重要性の尺度(重要度)を割り当てる工程と、その重要度を利用してトピックプロファイルの作成する工程からなり、前記のトピックプロファイルは、複数のトピック識別子と、グループ全体として特定されたトピックの重要度の表示とを含む。
好ましくは、電子文書の一群はウェブサイトのページから成る。この場合、上記の方法は、分析工程を実行するために、ウェブサイトの各ページをダウンロードする工程を含んでも構わない。
文書の分析工程は、特定の単語の検索を含むことができる。これに加えて、あるいは、代替的に、分析工程は、重要なキーワードに無関係なトピックを検索してこれを排除する工程を含むことができる。さらに、分析工程は、グループ内で特定された複数のキートピックのそれぞれに関連する単語リストを確定する工程と、各キートピックがグループ内のその他のキートピックの関連単語リスト内にあるか否かを判断する工程と、、キートピックがその他のキートピックの関連単語リストに含まれていない場合は、これを廃棄する工程を、付加的に又は代替的に含むことができる。
本発明の別の実施態様によれば、一群のテキストベースの電子文書をプロファイリングするシステムが提供され、そのシステムは、キートピックを識別するためにグループ内の全ての文書を分析する手段と、識別したキートピックに重要度を割り当てる手段と、その重要度を利用してトピックプロファイルを生成する手段とからなり、前記のトピックプロファイルは、複数のトピック識別子と、特定したトピックのグループ全体としての重要度の表示を包含する。
本発明のさらに別の実施態様によれば、例えば、インターネットやイントラネットのサイトのようなワールドワイドウェブのサブセットの如き、電子文書のグループ内をナビゲーションする方法が提供され、その方法は、スクリーンまたはディスプレイ上に複数のトピック識別子を、ユーザが任意に選択可能であり、グループ全体として特定されたトピックの相対的重度と共に自動的に表示する工程と、ユーザが選択した任意のトピックを受け取る工程と、ユーザの選択に応答して選択されたトピックに関する情報へアクセスできるようにする工程を含む。
ユーザがキーワード検索を開始しなくても、トピック識別子をその相対的な重要度と共に自動的に表示することにより、ユーザは、興味ある情報を簡単にナビゲーションすることができる。
本発明のさらに別の実施態様によれば、例えば、インターネットまたはイントラネットサイトのような電子文書グループ内をナビゲーションする対話式/電子ガイドが提供され、そのガイドは、複数のトピック識別子を、ユーザが任意に選択できる特定されたトピックの重要度の表示と共に自動的に表示し、任意のトピックを選択することで、選択したトピックについての情報にアクセスできるものである。
本発明のさらに別の実施態様によれば、ワールドワイドウェブまたはその他の情報源nにある情報のグループの所在を検出する方法が提供され、その方法は、情報の複数の候補グループを特定する工程と、各候補グループについてコンテンツのプロファイルを導き出す工程と、第1候補グループのプロファイルを、前記複数の候補グループの別の候補グループのプロファイル1つ1つと比較する工程と、第1候補グループとその他の候補グループとの間のトピックプロファイルにおける相違を測定して特定する工程を包含する。
複数の異なるウェブサイトのコンテンツのプロファイルを比較することで、類似または関連するコンテンツを持つサイトの特定または所望のコンテンツのプロファイルに一致するサイトの特定が簡単になる。
本発明のさらに別の実施態様によれば、ワールドワイドウェブまたはその他の情報源にある情報グループ間または情報グループ内をナビゲーションする方法が提供され、その方法は、スクリーンまたはディスプレイ上に複数のグループ識別子を、ユーザの意に応じて選択できる所望のコンテンツのプロファイルに関連すると特定されたグループの類似性と共に、表示する工程と、ユーザが選択した任意のグループ識別子を受け取る工程と、ユーザの選択に応じて選択したグループの情報にアクセスできるようにする工程を包含する。
本発明のさらに別の実施態様によれば、例えば、ワールドワイドウェブ上のウェブサイトのような文書グループの所在を検出する対話式/電子ガイドが提供され、そのガイドは、ユーザが任意に選択可能な複数のグループ識別子を、コンテンツの目標プロファイルに対する各グループの類似性表示と共に提示することができ、一つのグループ識別子を選択することで、選択したグループの情報にアクセスすることができる。
本発明の実施例を添付の図面を参照しながら、以下に詳述する。
図1は、ウェブサイト用電子ガイド12のメインビューページ10を示し、このページでは、ユーザが検索を開始するためのトピック(主題)やキーワードを入力しなくても、ユーザの意に応じて選択できるキートピック識別子14が自動的に表示される。事実、ビューアには、リモートサーバからダウンロードされるウェブサイトのページに先立って、ガイド12が提示される。ウェブサイトの制作やダウンロードのメカニズムは、よく知られていることであるので、これをここで詳述することは省略する。典型的には、キートピックのリストは、幾つかのサイトページに及んでいる。これらのページ間のナビゲーションに対応するため、"第1"、"次へ"、"前へ"、"最後へ"の各ボタンを含む一連のナビゲーションボタンが用意されている。これらのボタンの何れかをクリックすることで、所望する一連のキートピックがリストアップされる。連続する一連のキートピックをクリックスルーすることで、ユーザは、最も重要なものから降順に一連のキートピックを取り込むことができる。
図1に示すメインビュー10のキートピック識別子14は、所定の順序で提供され、最も重要なトピックが最初に提示されている。このために、検索者はウェブサイト内の実際のテキストを予め知る必要がなく、ピックのリストから最も興味あるものを選択できる。例えば、教師のウェブサイトが、"教師"、"教育者"、"学校"、"子供"、"教室"などの全てのトピックを、サイトの最も重要なトピックとして特定し、これらを重要なトピックのリストのトップに表示していれば、ユーザはこのうちの何れかをクリックして関連コンテンツをナビゲーションできる。もし、教師に関するウェブサイトへの訪問者が、これらのトピックすべてに関心を持っているとすれば、検索ボックスに入力したときだけ、単一のトピック"教師"に関するコンテンツに戻れることは、従来のサーチエンジンを凌駕する本発明の長所である。例えば、航空工学製品製造会社(X)のような会社のウェブサイトの場合は、図1に示すように、トピックは"電子工学"、"航空機"、"会社"などである。
図1に示すメインビューページは、最重要トピックをリストの最初に表示しているだけでなく、多様なトピックの相対的な重要度を視覚的に明確に表示するビジュアルトピックのプロファイルを提供している。ちなみに、図1は、キートピックのリストと共に、これらトピックの重要度のグラフ表示16で示しており、サイトの最も重要なトピックがトップに表示されている。殊に、図1のガイドでは、各トピックについて、その重要度を図解したバー16が用意されている。このため、たとえ重要なコンテンツがウェブサイトのホームページに明確に表示されずに、サイト内の奥深くに隠れていても、これを際立たせることができる。キートピックのリストは、各キートピックを単一句または複数句として表示可能である。
キートピックのプロファイルにおける各トピック識別子14あるいは各バー16は、選択可能である。識別子及び/又はバーをクリックすると、別のトピックリストを含む次のビュー18が提示される。この後続ビュー18では、そこでの情報を、メインビュー10で選択されたキートピックに関連するコンテンツを含むページに、特に関係つけることができる。
図1のトピック14またはバー16の1つを選択したときに表示される後続ビュー18の一例を図2に示す。これはフレーム内にライブウェブページ20を含む。この例では、ユーザはライブウェブページ20そのものをクリックできるほか、"最初へ"、"次へ"、"前へ"、"最後へ"などのボタンを使用して選択したトピックにとって重要な別の後続ビューページへクリックで進め、また、当該後続ビューにリストされた別のキートピック24に関する情報を含むさらに別の後続ビューページにクリックで進めるようになっている。これらの別のキートピック24は、ウェブサイト全体について重要ではないが、このページでは重要なキートピックであり、重要度の高い順に上から下へに表示されている。こうすることで、関連トピックへのアクセスが容易になる。何故なら、相互に関係のあるトピックは、しばしば同じページに集まり、これらの関連キートピックの何れかをクリックすることで、ユーザはそのキートピックのトップページへ直ぐに移動できるため、閲覧が容易になるからである。例えば、"スミス博士の化学授業"に関するページの後続ビューは、このページのみに関連する"スミス博士"、"化学"、"ブンゼンバーナー"、"エレメント"、"化学学部"といった次のキートピックをリスト表示でき、これらのキートピックの各々についてトップページにはワンクリックでアクセスできる。このようにクリックスルーができる性能は、ドリルダウン/ドリルスルー能によって、キーコンテンツへのアクセスを容易にするので、サイト内で別の重要なトピックをナビゲーションしたい場合でも、サイトマップページまたはメインビューに戻る必要がない。
図2に示す後続ビュー18にもトピックの評点が提示されている。この評点は、当該トピックが他のトピックと比較してどれだけ評価が高いかを、このページだけでなく、サイト全体の両方から示している。具体的には、インジケータ26は、2つの目盛りと、2個のポインタを持ち、第1目盛りのポインタ28は、サイト全体における選択したキートピックの重要度を表示する。第2目盛りのポインタ30は、後続ビューリストにおいて、選択したキートピックの別のトピックに対比しての重要度を表示する。"次へ"などのナビゲーションボタンを利用して、選択したトピックについてキーページの連続する後続ビューをクリックすることで、ユーザは当該トピックについて、最も重要度の高いキーページから低いキーページへ順番に閲覧できる。図3は、図1と図2の各ページがどのようにリンクするかを示す。
ウェブサイトをナビゲーションするメカニズムに加えて、図1に示すガイドは、類似トピックのプロファイルを持つウェブサイトにリンクするための手段もユーザに提供し、そのため、ユーザはサイト内のアクセスメカニズムに加えて、各サイト間のアクセスメカニズムも手中にできる。この目的を達成するために、ガイドは一つまたはそれ以上の関連ビューページ32を含む。関連ビューページ32へのアクセスは、メインビュー及び後続ビューのそれぞれに表示されている"関連ビュー"リンク33をクリックすることで行われる。図4は、関連ウェブサイトをナビゲーションするための関連ビューページ32の一例を示し、そこでにはユーザが選択できるウェブサイト識別子34が提示されている。目標トピックプロファイルに最も類似のトピックファイルを有するウェブサイトを最初に提示しながら、図4に示す関連ビュー32の関連ウェブサイト識別子34は、所定の順序で表示され、そこでは目標トピックのプロファイルに最も類似するトピックプロファイルを持つウェブサイトが最初に提示される。好ましくは、関連ビューページ32は、ウェブサイトの目標プロファイルとの類似性を視覚的に明確に表示する視覚的プロファイルを提示する。ちなみに、図4は、目標プロファイルとのウェブサイトの類似性を示すグラフ表示36を備え、そこでは、最も類似するウェブサイトが最初に表示されている。つまり、図4のページでは、各ウェブサイトについて、目標プロファイルとの類似性を表示するバー36が提示されている。このため、ユーザは、例えば、吸収合併の標的を特定する場合や潜在的取得者と取得物の両方の目標プロファイルが類似している場合に役立つ、類似ウェブサイトの所在検索を行うことができる。
典型的には、図4に示すウェブサイトのリストは、幾つかのサイトページに及ぶ。前述したように、これに便宜を図るために、一連のナビゲーションボタン38が用意されており、これらのボタンには、"最初へ"、"次へ"、"前へ"、"最後へ"などのボタンが含まれる。これらのボタンをクリックすることで、ユーザは所望のウェブサイトをリストアップすることができる。そして、連続するウェブサイトを通してクリックすることで、ユーザは関連性の最も高いウェブサイト群から最も低いウェブサイト群の順に情報を得ることができる。さらに、ウェブサイトリストにおけるそれぞれのウェブサイト識別子34またはバー36は、選択することができる。好ましくは、識別子34またはバー36の何れかをクリックすることにより、それぞれのトピックプロファイルの重複および相違に関するより多くの情報が、関連ビューページに提示されるようになっている。
図1〜図3に示すガイドは、図5に示すように、無制限の深さに掘り下げ可能なリンク性を有する。これは従来のサイトマップでは不可能である。このドリルダウン能力は、相互に関連する複数のトピックが、ページ上のテキストにしばしば互いに寄り集まるという事実に依存している。例えば、 "教育"、"学校"、"子供"、"教室"などの関連トピックは、多くの場合、ウェブページの"教師"という言葉の周辺に集まっている。これにより、メインビュー10から第1の後続ビュー18にかけて、"教師"というトピックについてクリックした検索者は、そのページで関連性の高いものを含むその他のキートピックを吟味し、そのページのその他のキートピックの何れかについて第1後続ビューまで移動することができる。つまり、メインビューまたはサイトマップに戻らなくても、トピック間またはページ間をクリックするだけで、そのサイトを無限に掘り下げることができるので、サイト周辺をナビゲーションするのに有効な改良技術を手に入れることができる。これとは対照的に、従来のサイトマップでは、同一サイトの他のトピックを掲載したページに移動する場合に、ユーザはサイトマップに戻らなければならない。本発明ではその必要がないことに加えて、関連ビューページを設けることにより、ユーザは有利にサイト間の検索およびナビゲーションを実施することができる。
図6は、上記したのとは別のナビゲーションルートを示し、このルートは図1、図2、図3に示すナビゲーションページの間を、ナビゲーションする場合に使用できる。好ましくは最初のメインビューから最重要トピックを検索する場合、 "最初へ"、"次へ"、"前へ"及び"最後へ"の各ボタンが、メインビューのキートピックリストをナビゲートするのに使用できる。メインビューのトピック識別子を選択することで、後続ビューページが表示され、"メインビューで予め選択したトピックについてのキーページを、重要度が低下する順にナビゲーションするために、最初へ"、"次へ"、"前へ"、"最後へ"の各ボタンを使用して、別の後続ビューページをナビゲーションすることができる。後続ビューの"メインビュー"ボタンを選択すれば、当該サイトのメインビューに戻る。任意の後続ビューまたはメインビューにある"関連ビュー"ボタン33を選択することで、関連ビューページをナビゲーションすることができ、そのページから、"最初へ"、"次へ"、"前へ"、"最後へ"のボタンを使用して、関連サイトリストを、好ましくは、類似性が低下する順にナビゲーションすることできる。関連ビューにおける関連ウェブサイト識別子(通常、URL)のどれかを選択すると、当該関連サイトに関するメインビューをナビゲーションでき、一方、メインビューにおける"関連ビュー"を選択すると、類似サイトの関連ビューを、好ましくは、類似性の高い順にナビゲーションできる。
図7は、図1、図2、図3に示したガイドを構成するステップを示す。実際は、これらのステップは、適当なプロセッサ(図示省略)内で作動するガイド作成/分析ソフトウェアによって実行される。第1ステップは、キーとなる主題のトピックを特定するために、対象となるウェブサイトを完全に、かつ包括的に分析する。そうするために、各目標ウェブサイトのアクセス可能なページの一部またはすべてが、分析ソフトウェアを備えるプロセッサに最初にダウンロードされる(図7の符号40参照)。次に、各ページが分析され、キートピックが特定される(図7の符号42参照)。次に各キートピックの重要度が決定され(符号44参照)、トピックのプロファイルが比較される。最後に、この情報を利用して、ガイドを作成する(符号46参照)。より具体的には、当該サイトの各ページが、重要なトピックを抽出するために1回だけ処理される。これにより、各ページ上のキートピックが、各ページに1度だけ、確実に特定されてロギングされる。相互に排他的で、かつ、相互に網羅的な処理が、ウェブサイト上の全てのアクセス可能なコンテンツに適応される。この処理は、コンテンツフォーマットの違いを区別しない。それ故、見出しとしてフォーマットされたテキストは、ユーザがページを流し読みする時に起こる先入見を取り除くために、本文テキストと同様に処理される。
キートピックを特定するために使用される基本的な技術は、サイト上の一つ一つの単語を処理し、単語コンテンツ全体から潜在的トピックの数を、取り扱い可能なレベルまで連続的に減少させてキートピックを際立たせることである。図8は、キートピックの特定する方法で一つで採用されるステップを示している。この方法は、単一キーワードの最初の削減リストを特定する工程(符号48参照)と、複数の語からなる語句が含まれるように削減リストを修正する工程(符号50参照)と、削減リストから選択した単語以外の単語を排除する工程(符号52参照)と、サイト内でのトピックの出現頻度に従って重要度を評価する工程(符号54参照)と、重要度の評価に従ってランクを割り当てる工程(符号56参照)と包含する。図9は、最初の削減リストを特定する工程を、さらに詳しく示すものである。すなわち、この工程は、サイト内での各単語の出現数を数える工程(符号58参照)と、その数をウェブサイト全体における特定の言語(例えば、英語)による単語それぞれの平均出現頻度と比較する工程(符号60参照)と、平均出現頻度より多く出現する単語を選択する工程(符号62参照)を包含する。
最初の削減リストが決定すると、いくつかの技術を使用して、そこに含まれるキートピック数が削減される。従来のサーチエンジン技術は、正確さと関連性に限界があり、削減リストの中に、ウェブサイトの特定のコンテンツにとって実際には重要でないフレーズがしばしば含まれるため、キートピック数の削減は不可欠である。キートピックを削減する技術の一つは、複数の単語から成るフレーズを検索し、これを盛り込むことにある。この操作は、図10に示すように、サイトの最初の削減リストで単語が出現する毎にこれを検出し、後に続く単語を抽出して付加することにより、各キーワードについてキーフレーズを作成することで実行され(符号64参照)、次に、これらのキーフレーズが出現するたびにそれがカウントされ(符号66参照)、最も出現頻度の高いフレーズを選択してこれをリストに盛り込むことで遂行される(符号68参照)。
複数の単語から成るフレーズを分析し、リストに加えた後は、リストに載っている単語トピックのいくつかを除外する。そうする理由は、複数単語のトピックに比較して、単語のトピックは、伝達する情報量が一般に少なく、特定の情報を迅速に特定したいユーザには、余り役立たないからできる。例えば、単一の語に説明的な単語を付加すると、その意味する内容は分かり易くなる。ちなみに、"化学教師"は、単なる"教師"と比べて教師に関するより多くの情報を伝えている。つまり、化学教師は単なる教師より、情報の特定に有利であるので、トピックとしてこれを残す。しかし、単一の語も、例外的に残す。例えば、人名、地名、製品名などの固有名詞のトピックは、頭文字で特定してリストに含める。CEOなどの重要人物の名前や商品名は、商品の所有者や個人情報を表示する場合が多く、取締役や研究者が重要なトピックを見つけるのに役立つからである。標準的な辞書に含まれない単語もリストに含めることができる。一般辞書にない単語は、極めて専門的で特殊であり、ウェブサイトの特定のコンテンツにかかわりなく、このウェブサイトに関連している可能性が高いからである。
図11に示すように、ウェブサイトを分析することで、削減リスト内の別のトピックの何れとも関連していないトピックも除外される。これを行うために、ウェブサイトで識別(特定)された複数のキートピックのそれぞれに関連する単語リストを割り出し、各キートピックが、ウェブサイト内の別のキートピックの何れかと関連する単語リストに、載っているかどうかが判定される。そして、別のキートピックの何れかと関連する単語リストに載っていないキートピックは、廃棄される。関連単語の決定には、辞書または類義語辞典、その他の方法が使用できる。一例として、"教師"に関するサイト上で"輸送"のトピックは、教師に関する別のキートピックの何れとも明確な関連性がないので、除外できる。しかし、削減リストにおける"授業"のトピックは、"教師"と関連し、おそらく、削減リストのその他のトピックとも関連すると識別されよう。同様に、"教育"と大まかには関連するが、"教師"と関連するようには見えない幾つかの単語も、リストに含ませることができる。削減リストを検討しつつ、関連性に鑑み徐々にキートピックを削減したリストを構築し、無関係なトピックを大幅に除外する。
関連キーワードを試験することの利点は、無関係なトピックを除去することによって、検索結果の正確性が向上することであって、従来は、その他全てと関係する最初のキーワードの選択するために、サイトのコンテントを分析する予備知識を必要としたが、本発明ではこれを必要としない。何故なら、削減リスト中の全ての潜在的トピック単語が、本発明では、サイトコンテンツの予備知識によって選択されるキーワードとの関連性で、試験されるのでは無くて、標準的な分類語彙辞典を使用して削減リスト中の全ての単語との関連性で試験されるからである。別法として、削減トピックリストの部分集合(サブセット)を試験して、必要とされる処理を減少させることもできる。
本発明では、ページ上またはページ内の有界ボックス(隠し又は可視)のようなフォーマット要素に関して位置が大きく異なるトピックが選択される。その理由は、本当のトピックでないたくさんの単語が、多くのまたは全てのページの同じ場所に、例えば、各ページの同じ場所に繰り返し出現するバナーやボタンバーに、現れるからである。出現頻度にのみ依存する従来式の検索では、これらの単語は、エラーとして出現する。しかし、本当のトピックは、文書の特定の1箇所でなく本文テキスト中に分散するのが特徴である。結果として、一般にバナーやボタンバーを取り巻いているフォーマット要素に関して、トピックの位置の相違をチェックすることは、固定的に設置されたこれらの素子のいくつかを削減リストから除外することに役立つ。
或るサイトの全てのページについてキートピックの削減リストが一旦決定されると、既に記録されている各ページのコンテンツがページごとに再分析され、最終削減リスト中でトピックについて最高位にランクされたページが特定される。同時に、各ページも処理され、各ページ上のキートピックについて、ページ毎のトピックリストが作成される。この削減リストは、全てのメインビューの作成に利用され、ページごとのトピックリストは、全ての後続ビューの作成に使用される。トピックの格付けには、各トピックの出現率が利用され、各トピックの重要度が評価される。この評価は、特定のトピックが当該サイト全体で言及された回数を、カウントすることで行われる。好ましくは、重要度の尺度は、ウェブサイト全体における単語の総数の百分率で、もしくは、全てのキートピック語の事例総数の百分率で表示される。
各トピックの重要度の尺度が決まると、その尺度を使用してガイドまたはマップのメインビュー10が構築される。一般に、最も重要なトピックは、図1に示すように、キートピックリストのトップに表示される。このようにして、本発明に係るガイドは、ユーザがウェブサイトをナビゲーションする上で、極めてシンプルで効率的なメカニズムを提供する。理想的には、ユーザがウェブサイトにアクセスすると、キーワード検索を行わなくても、本発明に係るガイドまたはマップは、ユーザに自動的に提示される。マップを最新の状態に保つためには、ウェブサイトを定期的に分析すべきである。
サイト分析の全体的方策を要約すれば、次のとおりである。
すなわち、サイト内の全単語の出現回数をカウントすることで、単一キーワードの当初削減リストを、まず識別(特定)する。次に、各単語の出現回数をサイトの言語での各単語の出現頻度と比較する。次いで、平均頻度と比較して最も頻度の高い単語を選択する。これを実行したら、削減リストに多数語フレーズが含まれるように、削減リストを次のように修正する。すなわち、サイト上の削減リストにおける各単語の所在を突き止め、サイト上の後続単語を抜粋してこれを付け加えることで、各キーワードについてキーフレーズを形成させ、サイトにおける各キーフレーズの出現回数をカウントし、そして、サイトで最も出現率の高いフレーズを選択する。次に、固有名詞、辞書に載っていない単語、削減リスト内の他の単語と関連性のある単語などを例外として、単語群を削減リストから除外する。次いで、サイトでの出現率に応じてフレーズをランク付けし、最も高位にランクされたフレーズを選択し、これをサイト全体の最終キートピックリストに含ませる。しかる後、予め記録された情報から各ページのコンテンツがページごとに再分析され、各トピックについて最重要ページが最終削減リストに特定される。ページの削減リストに含まれるその他全てのキートピックも、ページ毎のキートピックリストに記録され、そのリストは、爾後、後続ビューの作成に使用される。これを実行することで、ガイドのメインビューと後続ビューが作成される。
トピックプロファイルを決定するための上記技術は、複数の異なるウェブサイトに適用可能で、これらのプロファイルを利用して類似性の程度ないしは度合いを特定することができる。2つ以上のサイト上の各キートピックについて重要度の尺度が決まれば、一連のペア(目標ウェブサイト、候補ウェブサイト)を形成させるために、各ウェブサイトを順番に選択し、次に他のウェブサイト全てを順番に選択ることで、得られたトピックプロファイル群が比較される。これらペアのそれぞれのトピックプロファイルは、目標プロファイルの各トピックを選択することで比較され、このトピックの重要度は、候補ウェブサイトに同一または類似のトピックがあれば、その重要度と比較される。この状況は、図12に示されている。好ましい実施態様では、上述したプロファイル作成プロセスの一環として重要度が標準化でき、この重要度が所定の指標の割合または百分率として表示できるので、図12に示すプロセスは比較的容易に実行できる。重要度の集合体がコンピュータで計算されるが、これが、上記両サイトに共通する全トピックの比較値の集合体である。さらに付け加えると、前述のように作成したトピックプロファイルを使用する代わりに、目標プロファイルを2つ以上のトピックを含み、目標ウェブサイト全体のトピックの重要度をも含ませることができるマニュアルプロファイルとすることができる。
トピックプロファイルを比較するための第1の方法は、両方のプロファイルに共通するトピックをカウントすることである。もしかするとより正確な第2の方法は、図13に示される。この方法は、目標プロファイルを選択する工程70と、第1の候補ウェブサイトプロファイルを選択する工程72を含む。好ましくは、目標プロファイルの最重要トピックから始めて、候補プロファイルと共通する目標プロファイルの各トピックを選択し(符号74参照)、これを候補サイトにある同一または類似のトピックと比較する。特に、両プロファイルにおけるトピックの重要度(例えば、トピック単語の出現頻度が、図12に示すように、比較される。これにより、比較すべき2つのサイトのプロファイルにおける当該トピックの類似性に関する比較値を、得ることができる。目標プロファイルの全てのキートピックについて、この工程を繰り返す(符号76参照)。比較される2つのサイトに共通する全トピックについて、比較値を合計することで比較値の総計を求めることができる。全ての候補ウェブサイトについてこれを繰り返す(符号78参照)。
キートピックが特定されると、ガイド用のメインビュー、後続ビューおよび関連ビューが作成される。この工程は、図14、図15及び図16に示されている。これを実行するには、まず、3つのページテンプレートが作成されなければならず、メインビューには図1に示すようなページテンプレートが、後続ビューには図2に示すようなページテンプレートが、そして関連ビューには図3に示すようなページテンプレートがそれぞれ作成される。これらのテンプレートは、任意の形式、レイアウトまたはデザインとすることができる。
テンプレートが完成すると、これを使ってガイドが作成される。メインビューページを作成するには、図14に示すように、図1のメインビューページレイアウト(HTMLコード)用のページテンプレート構造がまず選択される(符号80参照)。次に、好ましくはキートピックリストの最重要トピックから始めて、各トピックとランクが、HTMLコードでテンプレートに挿入され(符号82参照)、そのページがウェブサイトに公開される(符号84参照)。全てのキートピックがテンプレートに挿入されるまで、この操作は繰り返えされる(符号86参照)。図15は、後続ビューページを作成する工程を示す。後続ビューページの作成は、メインビューページの作成後に行われ、最初に、図2のページレイアウト(HTMLコード)用のページテンプレート構造が選択される(符号88参照)。次に、好ましくは各トピックの最重要ページから始めて、ページ毎のキートピックリストからのキートピックと、その対応するランクが、HTMLコードでテンプレートに挿入される(符号90参照)。当該ページはウェブサイトに公開される(符号92参照)。この操作は、キートピックに関する全てのページが、テンプレートに挿入されるまで繰り返えされる(符号94参照)。そして、削減リストにある別のキートピック全てについて、上記の操作が繰り返えされる(符号96参照)。最後に、図3に示すような関連ビューページが作成され、そこでは、図16に示すように、適当なページテンプレート構造が選択され、次いで、好ましくは関連ウェブサイトリストの目標プロファイルに最も類似するウェブサイトから始めて、各ウェブサイトと類似性が、HTMLコードでテンプレートに挿入される。このページは、次にウェブサイトに公表される。この操作は、全ての関連ウェブサイトがテンプレートに挿入されるまで繰り返えされる。
ガイドが作成されると、そのガイドは、関連ウェブサイトに組み込まれるか、あるいは、リンクした別のウェブサイトとしてホストになることが可能で、ユーザがそれらのサイトを選択した時、または閲覧を希望した時に、そのガイドは表示される。この技術は当業界でもちろん公知である。
本発明の骨子から逸脱しない範囲で、上に記載した技術に若干の変更を加えることが可能なことは、当業者であれば理解できよう。例えば、ホームページや会社の財務情報を、図1のキートピックリストと共に、メインビューに表示しても構わない。これは、典型的には、サイトのホームページプレビューを示すものであり、これによって、ユーザが正しいサイトを閲覧しているかを、瞬時に視覚的に表示することができる。第2の変更例は、後続ページにトピックリストが参照するページのページプレビューを表示することであって、これにより、ユーザは当該ページをさらに調査すべきかどうか素早く評価できる。さらに別の例をあげると、本発明は、主に、ウェブサイトおよびインターネットに関係する技術として説明されているが、この技術は、テキストベースの電子文書の集りをナビゲーションするシステムにも応用できる。ちなみに、このシステムをウインドウズベースのシステムに応用すれば、フォーマットの種類に関係なくローカルPCに記憶した全てのテキストベース文書のトピックプロファイルを提供できる。従って、先に述べた特定の実施態様は、単なる例示に過ぎず、本発明を限定するものではない。当業者であれば、記載した操作に有意な変更を加えることなく実施態様を改修できることは明らかである。
キーサイトトピックのリストを備えたウェブサイトをナビゲーションするための電子ガイドのメインビューを示す図。 図1のリストからキートピックを選択した際にユーザに提示される後続ビューを示す図。 図1及び図2が示すページ間のリンクの階層図。 図1が示すような目標トピックプロファイルに関連するウェブサイトを、ナビゲーションするための電子ガイドの関連ビューを示す図。 ガイドの無制限は掘り下げ能力を示す図。 図1〜図3に示すガイドを介してユーザがナビゲーションする方法を示す図。 図1〜図3のガイドを作成するためのステップの高レベルなフローチャート。 図1〜図3のガイドを作成するためのさらに詳細なフローチャート。 キートピックの初期リストを考案する操作のフローチャート。 図9のステップを実行して得られる初期のキートピックリストを縮小する操作のフローチャート。 全体として情報の部分集合に無関係なトピックを排除するのに使用する関連単語の用例を示す図。 2つの情報グループ間のトピックプロファイルを比較するための操作を示す図。 2つのウェブサイトのプロファイルを比較するのに必要な工程のフローチャート。 キートピック情報を用いて図1のメインビューページを作成するための工程のフローチャート。 図2の後続ビューページを作成するための工程のフローチャート。 図3の関連ビューページを作成するための工程のフローチャート。

Claims (50)

  1. インターネットまたはイントラネットサイトのような電子文書グループをナビゲーションための対話式/電子ガイドであって、各トピックはユーザが任意に選択可能であり、グループ全体または一部で識別したトピックの重要度の表示とともに、複数のトピック識別子を自動的に表示し、ユーザがキーワード検索を実行しなくてもトピック識別子が表示され、任意のトピックを選択することでグループ内の選択したトピック情報へアクセスできるようにしたガイド。
  2. トピックを所定の順番で表示し、それによりグループ全体または一部におけるトピックの重要度を示す請求項1に記載のガイド。
  3. 最重要トピックをリストの初めに表示し、最も重要度の低いトピックをリストの終わりに表示するようにして降順にトピックを表示する請求項2に記載のガイド。
  4. トピック識別子が一つまたは複数のキーワードまたはキーフレーズ識別子である請求項1〜3の何れかに記載のガイド。
  5. グラフィック表示を備えてグループ全体または一部におけるトピックの重要度を視覚的に示すようにした請求項1〜4の何れかに記載のガイド。
  6. グラフィック識別子にバーを使用し、その長さがグループ全体または一部における関連トピックの重要性を示す請求項5に記載のガイド。
  7. グラフィック識別子を選択可能にして、ユーザが関連トピックを選択できるようにした請求項5または6に記載のガイド。
  8. 任意のトピックを選択すると一つまたは複数の付加的ガイドページが表示される請求項1〜7の何れかに記載のガイド。
  9. トピックまたはトピック識別子の何れかを選択することで、付加的なトピック識別子の類似リストあるいは希望するトピックに関連するコンテンツを含むライブウェブページを表示するようにした請求項8に記載のガイド。
  10. インターネットまたはイントラネットサイトなどの電子文書の一つまたは複数の関連グループを識別するための関連グループ識別子を、第1グループと各関連グループのキートピックプロファイルの類似性あるいは類似度と共に表示するようにした前記請求項の何れかに記載のガイド。
  11. 例えばインターネットまたはイントラネットサイトのようなワールドワイドウェブの部分集合などの電子文書のグループ内部をナビゲーションする方法であって、
    各トピックはユーザが任意に選択可能で、グループ全体または一部として識別したトピックの相対的重要性とともに、スクリーンまたはディスプレイ上に複数のトピック識別子を自動的に表示し;
    ユーザが選択した任意のトピックを受け取り;
    ユーザの選択に反応して、選択したトピック情報へのアクセスを提供するステップから成る方法。
  12. インターネットまたはイントラネットサイトなどの電子文書の一つまたは複数の関連グループを識別するための関連グループ識別子を、第1グループと各関連グループのキートピックプロファイルの類似性あるいは類似度と共に表示するようにした請求項11に記載の方法。
  13. 例えばインターネットまたはイントラネットサイトのようなワールドワイドウェブの部分集合などの電子文書のグループ内部をナビゲーションするためのシステムであって、
    各トピックはユーザが任意に選択可能で、グループ全体または一部として識別したトピックの相対的重要性とともに、スクリーンまたはディスプレイ上に複数のトピック識別子を自動的に表示する手段と;
    ユーザが選択した任意のトピックを受け取る手段と;
    ユーザの選択に反応して、選択したトピック情報へのアクセスを提供する手段と、からなるシステム。
  14. インターネットまたはイントラネットサイトなどの電子文書の一つまたは複数の関連グループを識別するための関連グループ識別子を、第1グループと各関連グループのキートピックプロファイルの類似性あるいは類似度と共に表示するようにした請求項13に記載のシステム。
  15. インターネットまたはイントラネットサイトで使用する対話式/電子ガイドを作成するようにしたデータ媒体またはその他のコンピュータ可読媒体のコンピュータプログラムであって、
    各トピックはユーザが任意に選択可能で、グループ全体または一部として識別したトピックの相対的重要性とともに、スクリーンまたはディスプレイ上に複数のトピック識別子を自動的に表示し;
    ユーザが選択した任意のトピックを受け取り;
    トピック選択に反応して、選択したトピック情報へのアクセスを提供するように構成したコードまたは命令を備えるコンピュータプログラム。
  16. インターネットまたはイントラネットサイトなどの電子文書の一つまたは複数の関連グループを識別するための関連グループ識別子を、第1グループと各関連グループのキートピックプロファイルの類似性あるいは類似度と共に表示するようにした請求項15に記載のコンピュータプログラム。
  17. ワールドワイドウェブまたはその他の情報源において情報グループを検出する方法であって、
    複数の候補グループの情報を識別し;
    各候補グループのコンテンツプロファイルを引き出し;
    第1候補グループと前記複数の候補グループのその他の候補グループのプロファイルにおける相違を識別するために第1候補グループとその他の候補グループ各々のプロファイルとを全て比較するステップから成る方法。
  18. 前記プロファイルが複数のトピックから構成される請求項17に記載の方法。
  19. 前記トピックの各々についてグループ全体または一部のコンテンツに重要度を割り当てる請求項17または18に記載の方法。
  20. 前記比較のステップが第1候補グループとその他の候補グループに共通するトピックの数をカウントすることから成る請求項19に記載の方法。
  21. 前記比較のステップが第1候補グループの各キートピックの重要度とその他の候補グループの同一または類似トピックの重要度との比較を含む請求項17〜20の何れかに記載の方法。
  22. 前記比較のステップが第1候補グループとその他の候補グループに共通する全てのトピックの総比較の計算を含んで成る請求項17に記載の方法。
  23. 各トピックはユーザが任意に選択可能であり、1つまたは複数の候補グループについて識別したトピックの重要度の表示とともに、複数のトピック識別子を自動的に表示し、ユーザがキーワード検索を実行しなくてもトピック識別子が表示され、任意のトピックを選択することで選択したトピック情報へアクセスできるようにした請求項17〜22の何れかに記載の方法。
  24. ワールドワイドウェブまたはその他の情報源において情報グループを検出するシステムであって、
    複数の候補グループの情報を識別する手段と;
    各候補グループのコンテンツプロファイルを引き出す手段と;
    第1候補グループと前記複数の候補グループのその他の第2候補グループの各々とを全て比較する手段とを含んでなるシステム。
  25. 前記比較手段は、候補グループそれぞれのトピックプロファイルにおける相違をコンピュータ計算するようにした請求項23に記載のシステム。
  26. 前記トピックプロファイルの引き出し手段は、前記グループの複数のキートピックを識別する手段を備える請求項23または24に記載のシステム。
  27. 前記トピックプロファイルの引き出し手段は、トピックの各々について前記複数の候補グループ全体または一部のコンテンツに重要度を割り当てる手段を備える請求項23〜25の何れかに記載のシステム。
  28. 前記比較手段は、第1候補グループのキートピックの重要度と第2候補グループの同一または類似キートピックの重要度の差異を比較する手段を備える請求項23〜26の何れかに記載のシステム。
  29. 前記比較手段は、トピックプロファイルの各々のトピックについて個々の差を合計することで第1候補グループとその他の候補グループのプロファイルの総合的な差異をコンピュータ計算する集計手段を備える請求項23〜27の何れかに記載のシステム。
  30. ワールドワイドウェブやその他の情報源の情報グループ内または相互間をナビゲーションするための方法であって、
    各トピックはユーザが任意に選択可能で、希望するトピックプロファイルに関して識別したグループの類似性の表示とともに、スクリーンまたはディスプレイ上に複数のグループ識別子を表示し;
    ユーザが選択した任意のグループ識別子を受け取り;
    ユーザの選択に反応して、選択したグループの情報へのアクセスを提供するステップから成る方法。
  31. ワールドワイドウェブやその他の情報源の情報グループ内または相互間をナビゲーションするためのシステムであって、
    各トピックはユーザが任意に選択可能で、目標トピックプロファイルに関して識別したグループの類似性の表示とともに、スクリーンまたはディスプレイ上に複数のグループ識別子を表示する手段と;
    ユーザが選択した任意のグループ識別子を受け取る手段と;
    ユーザの選択に反応して、選択したグループの情報へのアクセスを提供する手段を含んで成るシステム。
  32. ワールドワイドウェブのウェブサイトまたはその他の情報グループを検出する対話式/電子ガイドであって、
    各グループ識別子はユーザが任意に選択可能で、各グループのコンテンツトピックの目標プロファイルとの類似性の表示とともに、複数のグループ識別子を表示し、任意のグループ識別子を選択することで選択したグループの情報にアクセスできるようにしたガイド。
  33. グループ識別子を所定の順番で表示することによりグループの目標プロファイルとの類似性を表示する請求項31に記載のガイド。
  34. 目標プロファイルに最も類似するグループをリストの初めに表示し、最も類似性の低いグループをリストの終わりに表示するようにして降順に類似性を表示する請求項33に記載のガイド。
  35. グループの目標プロファイルとの類似性を視覚的に表示するためのグラフィック表示を備える請求項31〜33の何れかに記載のガイド。
  36. グラフィック識別子を選択可能にすることでユーザが関連グループを選択できるようにした請求項34に記載のガイド。
  37. 任意のグループを選択すると、複数の付加的ロケーションページの1つを表示し、好ましくは、該ロケーションページは複数のトピック識別子を含み、かつ、選択したグループ内で識別したトピックの重要性の高い順に表示され、好ましくは各トピックはユーザが選択可能で、任意のトピックを選択することで選択したトピックに関する情報にアクセスできるようにした請求項31に記載のガイド。
  38. インターネットまたはイントラネットサイトで使用するシステムを作成するようにした、好ましくはデータ媒体またはその他のコンピュータ可読媒体のコンピュータプログラムであって、
    各グループはユーザが任意に選択可能で、希望のトピックプロファイルに関して識別したグループの類似性の表示とともに、複数のグループ識別子を表示し;
    選択された任意のグループを受け取り;
    グループ選択に反応して、選択したグループ情報または関連情報へのアクセスを提供するように構成したコードまたは命令を備えるコンピュータプログラム。
  39. グループまたは一群のテキストベースの電子文書をプロファイリングする方法であって、
    キートピックを識別するためにグループ内の全ての文書を分析し;
    識別したキートピックに重要度を割り当て;
    複数のトピック識別子とグループ全体または一部として識別した各々のトピックの重要度の表示を含むトピックプロファイルを作成するために前記重要度を利用することから成る方法。
  40. 前記電子文書グループがウエブサイトページから構成される請求項38に記載の方法。
  41. 分析ステップを実行するためにサイトの各ページをダウンロードすることを更に含む請求項39に記載の方法。
  42. 文書分析ステップが特定単語の検索を含む請求項38または39に記載の方法。
  43. 分析ステップが重要キーワードと無関係のトピックを検索し、これを排除することを含む請求項38〜41の何れかに記載の方法。
  44. グループ内で識別した複数のキートピックのそれぞれに関連する単語リストを決定し;
    グループ内のその他のキートピックの何れかと関連する単語リストに各キートピックが載っているかどうかを決定し;
    その他のキートピックの関連単語リストに載っていないキートピックを任意に廃棄することを含む請求項42に記載の方法。
  45. グループまたは一群のテキストベースの電子文書をプロファイリングするためのシステムであって、
    キートピックを識別するためにグループ内の全ての文書を分析する手段と;
    識別したキートピックに重要度を割り当てる手段と;
    複数のトピック識別子とグループ全体または一部として識別した各々のトピックの重要度の表示を含むトピックプロファイルを作成するために前記重要度を利用する手段とから成るシステム。
  46. 前記電子文書グループがウエブサイトページから構成される請求項44に記載のシステム。
  47. 分析を実行するためにサイトの各ページをダウンロードすることを更に含む請求項45に記載のシステム。
  48. 分析手段がサイトオーナーにとって重要な特定単語を検索するようにした請求項45または46に記載のシステム。
  49. 分析手段が重要キーワードと無関係のトピックを検索し、これを排除するようにした請求項44〜47の何れかに記載のシステム。
  50. グループ内で識別した複数のキートピックのそれぞれに関連する単語リストを決定する手段と;
    グループ内のその他のキートピックの何れかと関連する単語リストに各キートピックが載っているかどうかを決定する手段と;
    その他のキートピックの関連単語リストに載っていないキートピックを任意に廃棄する手段を含む請求項48に記載のシステム。
JP2006506172A 2003-04-23 2004-04-23 ウェブサイトなどの情報源によるナビゲーション Pending JP2007527558A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0309174.1 2003-04-23
GBGB0309174.1A GB0309174D0 (en) 2003-04-23 2003-04-23 System and method for navigating a web site
PCT/GB2004/001749 WO2004095314A2 (en) 2003-04-23 2004-04-23 System and method for navigating through websites and like information sources

Publications (1)

Publication Number Publication Date
JP2007527558A true JP2007527558A (ja) 2007-09-27

Family

ID=9957132

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006506172A Pending JP2007527558A (ja) 2003-04-23 2004-04-23 ウェブサイトなどの情報源によるナビゲーション

Country Status (6)

Country Link
US (1) US20070067317A1 (ja)
EP (1) EP1616276A2 (ja)
JP (1) JP2007527558A (ja)
CN (1) CN1777892A (ja)
GB (1) GB0309174D0 (ja)
WO (1) WO2004095314A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011076606A (ja) * 2009-09-30 2011-04-14 Palo Alto Research Center Inc コンテキスト依存サイドバーウインドウ表示システム及び方法
US8972842B2 (en) 2011-05-18 2015-03-03 Kabushiki Kaisha Toshiba Method of processing data for an information processing apparatus

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7707265B2 (en) * 2004-05-15 2010-04-27 International Business Machines Corporation System, method, and service for interactively presenting a summary of a web site
EP1669896A3 (en) * 2004-12-03 2007-03-28 Panscient Pty Ltd. A machine learning system for extracting structured records from web pages and other text sources
US7991755B2 (en) * 2004-12-17 2011-08-02 International Business Machines Corporation Dynamically ranking nodes and labels in a hyperlinked database
US8131736B1 (en) * 2005-03-01 2012-03-06 Google Inc. System and method for navigating documents
US20070094267A1 (en) * 2005-10-20 2007-04-26 Glogood Inc. Method and system for website navigation
US7783622B1 (en) 2006-07-21 2010-08-24 Aol Inc. Identification of electronic content significant to a user
US8583419B2 (en) * 2007-04-02 2013-11-12 Syed Yasin Latent metonymical analysis and indexing (LMAI)
JP4808181B2 (ja) * 2007-04-23 2011-11-02 ヤフー株式会社 ウェブページ情報処理装置、ウェブページ情報処理方法、及びウェブページ情報処理プログラム
US9953651B2 (en) * 2008-07-28 2018-04-24 International Business Machines Corporation Speed podcasting
US8812500B2 (en) * 2009-04-24 2014-08-19 Google Inc. System and method of displaying related sites
US8620929B2 (en) * 2009-08-14 2013-12-31 Google Inc. Context based resource relevance
CN102043777B (zh) * 2009-10-24 2014-12-31 温州职业技术学院 一种面向移动终端的三维标签云可视化方法
US8434001B2 (en) 2010-06-03 2013-04-30 Rhonda Enterprises, Llc Systems and methods for presenting a content summary of a media item to a user based on a position within the media item
US9326116B2 (en) 2010-08-24 2016-04-26 Rhonda Enterprises, Llc Systems and methods for suggesting a pause position within electronic text
US9069754B2 (en) 2010-09-29 2015-06-30 Rhonda Enterprises, Llc Method, system, and computer readable medium for detecting related subgroups of text in an electronic document
US20120173565A1 (en) * 2010-12-30 2012-07-05 Verisign, Inc. Systems and Methods for Creating and Using Keyword Navigation on the Internet
US8478278B1 (en) 2011-08-12 2013-07-02 Amazon Technologies, Inc. Location based call routing to subject matter specialist
US8787540B1 (en) 2011-08-25 2014-07-22 Amazon Technologies, Inc. Call routing to subject matter specialist for network page
FR2989189B1 (fr) * 2012-04-04 2017-10-13 Qwant Procede et dispositif de fourniture rapide d'information
US20140156627A1 (en) * 2012-11-30 2014-06-05 Microsoft Corporation Mapping of topic summaries to search results
US9430561B2 (en) * 2012-12-19 2016-08-30 Facebook, Inc. Formation of topic profiles for prediction of topic interest groups
US9298778B2 (en) 2013-05-14 2016-03-29 Google Inc. Presenting related content in a stream of content
US9537811B2 (en) 2014-10-02 2017-01-03 Snap Inc. Ephemeral gallery of ephemeral messages
US9396354B1 (en) 2014-05-28 2016-07-19 Snapchat, Inc. Apparatus and method for automated privacy protection in distributed images
US9113301B1 (en) 2014-06-13 2015-08-18 Snapchat, Inc. Geo-location based event gallery
US10824654B2 (en) 2014-09-18 2020-11-03 Snap Inc. Geolocation-based pictographs
US10311916B2 (en) 2014-12-19 2019-06-04 Snap Inc. Gallery of videos set to an audio time line
US9385983B1 (en) 2014-12-19 2016-07-05 Snapchat, Inc. Gallery of messages from individuals with a shared interest
EP3272078B1 (en) 2015-03-18 2022-01-19 Snap Inc. Geo-fence authorization provisioning
US10354425B2 (en) 2015-12-18 2019-07-16 Snap Inc. Method and system for providing context relevant media augmentation
US10582277B2 (en) 2017-03-27 2020-03-03 Snap Inc. Generating a stitched data stream
US10796698B2 (en) 2017-08-10 2020-10-06 Microsoft Technology Licensing, Llc Hands-free multi-site web navigation and consumption
US11675873B1 (en) * 2022-06-28 2023-06-13 Lemon Inc. Website similarity determination

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001155467A (ja) * 1999-11-29 2001-06-08 Just Syst Corp 編集処理装置、及び編集処理プログラムが記憶された記憶媒体
JP2002189742A (ja) * 2000-12-21 2002-07-05 Music Gate Inc ウェブサイト検索方法
JP2002222210A (ja) * 2001-01-25 2002-08-09 Hitachi Ltd 文書検索システム、文書検索方法及び検索サーバ

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US5911140A (en) * 1995-12-14 1999-06-08 Xerox Corporation Method of ordering document clusters given some knowledge of user interests
US5886698A (en) * 1997-04-21 1999-03-23 Sony Corporation Method for filtering search results with a graphical squeegee
US5991140A (en) * 1997-12-19 1999-11-23 Lucent Technologies Inc. Technique for effectively re-arranging circuitry to realize a communications service
US6421675B1 (en) * 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US6334131B2 (en) * 1998-08-29 2001-12-25 International Business Machines Corporation Method for cataloging, filtering, and relevance ranking frame-based hierarchical information structures
US7000194B1 (en) * 1999-09-22 2006-02-14 International Business Machines Corporation Method and system for profiling users based on their relationships with content topics
US20020059395A1 (en) * 2000-07-19 2002-05-16 Shih-Ping Liou User interface for online product configuration and exploration
AUPQ915600A0 (en) * 2000-08-03 2000-08-24 Ltdnetwork Pty Ltd Online network and associated methods
US7047229B2 (en) * 2000-08-08 2006-05-16 America Online, Inc. Searching content on web pages
US20020123904A1 (en) * 2001-02-22 2002-09-05 Juan Amengual Internet shopping assistance technology and e-mail place
US6920448B2 (en) * 2001-05-09 2005-07-19 Agilent Technologies, Inc. Domain specific knowledge-based metasearch system and methods of using
US6920459B2 (en) * 2002-05-07 2005-07-19 Zycus Infotech Pvt Ltd. System and method for context based searching of electronic catalog database, aided with graphical feedback to the user
US6983273B2 (en) * 2002-06-27 2006-01-03 International Business Machines Corporation Iconic representation of linked site characteristics

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001155467A (ja) * 1999-11-29 2001-06-08 Just Syst Corp 編集処理装置、及び編集処理プログラムが記憶された記憶媒体
JP2002189742A (ja) * 2000-12-21 2002-07-05 Music Gate Inc ウェブサイト検索方法
JP2002222210A (ja) * 2001-01-25 2002-08-09 Hitachi Ltd 文書検索システム、文書検索方法及び検索サーバ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011076606A (ja) * 2009-09-30 2011-04-14 Palo Alto Research Center Inc コンテキスト依存サイドバーウインドウ表示システム及び方法
US8972842B2 (en) 2011-05-18 2015-03-03 Kabushiki Kaisha Toshiba Method of processing data for an information processing apparatus

Also Published As

Publication number Publication date
GB0309174D0 (en) 2003-05-28
WO2004095314A3 (en) 2005-04-07
US20070067317A1 (en) 2007-03-22
CN1777892A (zh) 2006-05-24
EP1616276A2 (en) 2006-01-18
WO2004095314A2 (en) 2004-11-04

Similar Documents

Publication Publication Date Title
JP2007527558A (ja) ウェブサイトなどの情報源によるナビゲーション
US9348871B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US8978033B2 (en) Automatic method and system for formulating and transforming representations of context used by information services
EP2315135A1 (en) Document search system
US20080071738A1 (en) Method and apparatus of visual representations of search results
US20050081146A1 (en) Relation chart-creating program, relation chart-creating method, and relation chart-creating apparatus
KR101103766B1 (ko) 태그 정보를 이용하여 사용자 취향정보를 수집하는 단말기기, 그 방법 및 기록매체
KR20070089898A (ko) 사용자 피드백을 이용하여 검색된 컨텐츠를 평가하고 평가결과를 이용하여 검색 결과를 제공하는 방법 및 장치
Tietz et al. Semantic Annotation and Information Visualization for Blogposts with refer.
JP4084647B2 (ja) 情報検索システム、情報検索方法及び情報検索プログラム
JP2017117021A (ja) キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム
KR101850853B1 (ko) 빅데이터를 이용한 검색 방법 및 장치
Hsieh et al. The Influence of Gender Difference on the Information-Seeking Behaviors for the Graphical Interface of Children's Digital Library.
JP2014102625A (ja) 情報検索システム、プログラム、および方法
JP4726683B2 (ja) 体験情報抽出方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
KR101440385B1 (ko) 인디케이터를 이용한 정보 관리 장치
KR100494113B1 (ko) 웹 브라우저를 이용한 정보 검색 시스템
Börner et al. Replicable Science of Science Studies
US20080228725A1 (en) Problem/function-oriented searching method for a patent database system
KR20240021387A (ko) 구인구직 매칭 방법 및 시스템
JP2004206608A (ja) 文書検索方法及び装置並びにプログラム
Escudero et al. Obtaining knowledge from the web using fusion and summarization techniques
JP2006164044A (ja) コンテンツ情報表示支援方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP2005135139A (ja) 構造解析システム
Reid et al. Evaluation of a prototype interface for structured document retrieval

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20071031

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20071031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100303

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101005