JP2004504654A - ウェブに基づく情報の変換に使用されるルールのプログラミングによらない開発システムおよび方法 - Google Patents

ウェブに基づく情報の変換に使用されるルールのプログラミングによらない開発システムおよび方法 Download PDF

Info

Publication number
JP2004504654A
JP2004504654A JP2001569657A JP2001569657A JP2004504654A JP 2004504654 A JP2004504654 A JP 2004504654A JP 2001569657 A JP2001569657 A JP 2001569657A JP 2001569657 A JP2001569657 A JP 2001569657A JP 2004504654 A JP2004504654 A JP 2004504654A
Authority
JP
Japan
Prior art keywords
information
user
block
data
web page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001569657A
Other languages
English (en)
Inventor
カリエレ スティーブン ジェロミー
ウッズ スティーブン グレゴリー
セリンク マーティン ピー エイ
Original Assignee
クアック.コム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by クアック.コム filed Critical クアック.コム
Publication of JP2004504654A publication Critical patent/JP2004504654A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Stored Programmes (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】インターネットからの情報への迅速で正確な音声アクセスを無料で取得し得るシステムおよび方法を提供すること。
【解決手段】プログラミングによらない手段がウェブページから情報を得ることを可能にするために、識別されるものの属性に対応するルールを確立する方法は、所望のものに関する情報に対応するウェブページを発見するステップと、発見されたウェブページにかぶせる形式を選択するステップと、この形式に基づいて発見されたウェブページから情報を抽出するステップとを有する。この形式は、所望のものの属性に対応するルールにより規定される。
【選択図】図10

Description

【0001】
【発明が属する技術分野】
本発明は、インターネットおよび電子商取引、つまり、「e−コマース」に関し、特に、ウェブに基づく情報の変換に使用されるルールのプログラムによらない開発ステムおよび方法に関する。
【0002】
【従来の技術】
インターネットは、インターネットに接続されたコンピュータを使用する人が大量の情報にアクセスできる媒体へと発展した。インターネットを介して情報にアクセスする能力は、様々な種類の方法で提供できる。インターネット検索エンジンによって情報が提供される場合もある。インターネット検索エンジンは、通常、キーワードまたは語句でインターネットを検索し、テキストまたは組み込み識別子(例えば、メタタグ)等としてWebページに検索ワードまたは語句が含まれるWebサイトのリストを提供する。個別のWebサイトにより、インターネットを介して情報にアクセスすることもできる。個別のWebサイトでは、広範な情報およびサービスが提供されている。これには時間が重要なものと時間に依存しないものの両方がある。
【0003】
インターネットは、特に、電子商取引に役立つ。ベンダが自分の製品またはサービスを広告および販売することを可能にする多くのインターネットサーバが、開発されている。こうした製品およびサービスには、購入者に、インターネット上で電子的に届けられる品目(音楽等)と、従来の流通チャネル(運送業者等)を通じて届けられる品目(書籍等)とがある。サービスとしては、インターネット上で入手可能な情報(天気、交通、映画、原価比較等)と、インターネット上で実行されるトランザクション(株式取引、レストラン予約等)とを提供することが出来る。
【0004】
残念なことに、インターネットは膨大な量の情報にアクセスする潜在能力をユーザに提供するが、有益なインターネットベースの情報を見つけることは、時間がかかり面倒であることが多い。更に、多数の個別Webサイトから入手可能な同じ情報同士を発見して比較するのは、困難である。これは、同じ情報が多数の異なる態様で編成され、多数の異なる形態で記述され、多数の異なる時点で変更されるためである。こうしたインターネットに内在する難点に加え、コンピュータ、またはインターネットサービスプロバイダ(ISP)を介してインターネットに接続する他の電子デバイスによらなければ、インターネットから入手可能な情報にアクセスすることができないという単純な事実も存在する。更に、希望するインターネットからの情報を効果的に発見するためには、インターネットにより情報を検索する方法を修得しなければならない。そのため、コンピュータを所有していない人、ISPに接続すことができない人、およびインターネットの使用に関する経験または訓練が乏しい人は、インターネットからの情報にアクセスすることは、制限される。こうした要素は、業界の専門家が1999年の終わりに、インターネットにアクセスした経験、または「ネットサーフィン」した経験のある人が米国の人口のわずか30%であると推定した理由の一部となっている(1999年10月、フォレスター リサーチ社の統計)。
【0005】
したがって、コンピュータを直接使用すること、個人的なISP接続を有すること、またはインターネットの使用に関して経験または訓練したことが、無くても、人々がインターネットからの情報にアクセスすることができるシステムおよび方法が提供されることが望ましい。加えて、公衆電話の経由等、便利で容易に利用可能な手段を使用して、人々がインターネットからの情報を取得できるシステムおよび方法が、提供されることが望ましい。更に、データを、インターネットソースおよび声のようなユーザインターフェースプラットホームに、およびそれらからデータを転送出来るように意味的に構造化されたデータの変換および標準構造化(canonicalization)のさいに使用されるルールのプログラムによらない開発を提供するシステムおよび方法も、提供されることが望ましい。
【0006】
多くの課題により、これまで、こうしたシステムおよび方法は、実現不可能だった。例えば、こうしたシステムおよび方法を使用する人は、情報を迅速に、または少なくとも、受容可能な程度の時間内に入手したいと考える。こうした速度は、実現困難である。従来の高速コンピュータと高速通信接続を使用した場合でも、インターネットにアクセスするには必ず遅延時間が存在する(これを「ワールドワイドウェイト」と呼ぶ人も多い)。こうしたシステムおよび方法における別の課題は、音声通信の認識である。従来の音声認識技術は、速度が遅く不正確である。インターネットからの情報に対する音声による便利で意味のあるアクセスには、シンプルで、素早く、正確な音声認識が必要になる。にもかかわらず、既知のプロセッサおよびメモリデバイスでは、人間対人間の対話で行われるような音声認識に必要な大量の語彙への迅速なアクセスおよび処理速度は実現不可能である。
【0007】
こうしたシステムおよび方法における更に別の課題は、サービスを財政的にサポートしつつ、インターネットからの情報への無料アクセスを提供する方法である。インターネット上の従来の広告では、「バナー」等の広告情報を確認し、バナーの「クリック」等、何らかの手動選択を行い、広告の製品またはサービスに関する詳しい情報を入手する能力が必要となる。
【0008】
このため、上で述べた能力に加え、インターネットからの情報への迅速で正確な音声アクセスを無料で取得し得るシステムおよび方法が提供されることが望ましい。更に、インターネットソースからデータを得ることが出来、かつ他のインターネットソースからの他のデータと比較し、かつスピーチおよび無線アクセスプロトコール(WAP)を含む、様々なプラットホームのユーザに与えることが出来るシステムおよび方法が、提供されることが望ましい。
【0009】
【課題を解決するための手段】
本発明の実施形態の一態様は、プログラミングによらない手段がウェブページから情報を得ることを可能にするために、識別されるものの属性に対応するルールを確立する方法である。この方法は、所望のものに関する情報に対応するウェブページを発見し、かつフォームに基づいて見出されたウェブページから情報を抽出することを含む。このフォームは、所望のものの属性に対応するルールによって規定される。
【0010】
簡単に言えば、本発明の実施形態の別の態様は、ウェブに基づく情報を共通データ構造に変換するさいに使用されるルールのプログラムによらない開発のシステムに関する。このシステムは、所望のものに関連する情報に対応するウェブページを発見する手段、この発見されたウェブページをオーバーレイするフォームを選択する手段、およびこのフォームに基づいて発見されたウェブページから情報を抽出する手段を含む。このフォームは、所望のものの属性に対応するルールによって規定される。
【0011】
簡単に言えば、本発明の実施形態の別の態様は、ウェブに基づく情報を共通データ構造に変換するさいに使用されるルールのプログラムによらない開発の方法に関する。この方法は、関連情報を含む領域を有する情報のページを発見すること、関連情報を含む領域を分離するパターンを含むフォームを認識すること、関連領域を含む領域を含むページのセット内で情報のより多くのページに対するリンクを発見すること、および関連情報を含む領域を分離させる同様なパターンによりページのセットに対して拡大ファイルを形成することを含む。
【0012】
簡単に言えば、本発明の一実施形態の別の態様は、ウェブに基づく情報を共通データ構造に変換するさいに使用されるルールのプログラムによらない開発のシステムに関する。このシステムは、関連情報を含む領域を有する情報のページを発見する手段、関連情報を含む領域を分離するパターンを含むフォームを認識する手段、関連領域を含む領域を含むページのセット内で情報のより多くのページに対するリンクを発見する手段、および関連情報を含む領域を分離させる同様なパターンによりページのセットに対して拡大ファイルを形成する手段を含む。
【0013】
簡単に言えば、本発明の実施形態の別の態様は、ウェブに基づく情報の変換に使用されるルールを開発するシステムである。このシステムは、データベースとデータ編成ツールを含む。このデータベースは、複数のフォームから一フォームを使用してウェブページから抽出された情報を格納する。複数のフォームは、ウェブページから求められた関連情報に関するルールを含む。データ編成ツールは、専門家でないルール作成者が、複数のフォームからそのフォームを選択することを可能にする。選択されたフォームは、ウェブページ上の情報の配置と内容を近似するように選択される。
【0014】
簡単に言えば、本発明の実施形態の別の態様は、ウェブに基づく情報を共通データ構造に変換するさいに使用されるルールのプログラミングによらない開発のためのコンピュータ可読プログラムコードを含むコンピュータプログラム製品である。コンピュータプログラム製品内のプログラムコードは、ウェブページを発見する第一のコンピュータ可読コンピュータプログラムコードと、関連情報を含む領域を孤立させるパターンを含むフォームを識別する第二のコンピュータ可読プログラムコードとを含む。
【0015】
本発明のその他の原則的な特徴および利点は、以下の図面と、詳細な説明と、前記特許請求の範囲とを検討することにより当業者には明らかとなろう。
【発明を実施するための形態】
【0016】
ウェブに基づく情報の変換に使用されるルールのプログラミングによらない開発システムおよび方法について説明する。以下の説明においては、説明の目的から、本発明の完全な理解を提供するために多数の特定の詳細について述べる。しかしながら、本発明は、こうした特定の詳細なしに実施し得ることは当業者には明白であろう。また、本発明の好ましい一実施形態の説明を容易にするために、周知の構造およびデバイスはブロック図の形態で表示されている。
【0017】
本発明の例示的実施形態の一態様は、プログラミングによらない手段が、ウェブページから情報を得ることを可能にするために、識別されるものの属性に対応するルールを確立する方法を含む。この方法は、所望のものに関する情報に対応するウェブページを発見すること、この発見されたページをオーバーレイする、この所望のものの属性に対応するルールにより規定されている、フォームを選択すること、フォームに基づいて発見されたウェブページから情報を抽出することを含む。
【0018】
本発明の実施形態の別の態様は、インターネットからの情報およびサービスへの音声アクセスを提供するシステムに関する。本発明の実施形態の別の態様は、インターネット上でのアクセス、処理、およびトランザクションの実行のために電話上で音声を使用するシステムおよび方法に関する。本発明の実施形態の更に別の態様は、あるWebサイトが他のWebサイトと同じ情報を有するか否かを判断するシステムおよび方法に関する。本発明の実施形態の更に又別の態様は、インターネットボイスポータルを使用する宣伝システムおよび方法に関する。本発明の実施形態の別の態様は、所望の項目を決定するために、インターネットボイスポータルシステムにおけるユーザの応答をファンネリング(funneling)するシステムおよび方法に関する。本発明の実施形態の別の態様は、体系的構造化データの変換およびカノニカル化(canonicalization)に関するシステムおよび方法に関する。
【0019】
一実施形態の場合は、メモリに含まれる命令シーケンスを実行する中央演算処理装置(CPU)を有するコンピュータシステムが使用される。更に詳しくは、命令シーケンスの実行により、CPUは、ステップを実行する(これについては以下で説明する)。この命令は、実行のために、CPUにより、読み出し専用メモリ(ROM)、大容量記憶装置、または他の何らかの固定記憶装置から、ランダムアクセスメモリ(RAM)にロードすることができる。他の実施形態の場合は、本発明を実施するソフトウェア命令の代わりに、またはこれと組み合わせて、ハードウェア回路を使用することができる。したがって、本明細書で説明する実施形態は、ハードウェア回路とソフトウェアとの任意の特定の組み合わせには制限されず、コンピュータシステムによって実行される命令に関する任意の特定のソースにも制限されない。
【0020】
図1は、ボイスポータル10とネットワーク20との間の接続を表している。例示的な一実施形態の場合、ネットワーク20は、インターネット、つまりデータの送信と交換を円滑に行うためにTCP/IPネットワークプロトコルを使用する、コンピュータネットワークによる世界規模のネットワークである。代替実施形態の場合、ネットワーク20は、仮想プライベートネットワーク(VPN)のような任意のタイプのネットワークである。ネットワーク20は、好ましくは、ハイパーテキストマークアップ言語(HTML)Webページ30および40との通信を提供する。Webページ30および40は、様々なWebサーバ上の様々なデータを有する。ネットワーク20は、コンピュータ52および54と、データベース58を有するサービス56とをネットワーク20に結合する非ボイスポータル50との通信を提供する。サービス56は、ネットワーク20に接続している任意のタイプの企業、コンテンツ、またはサービスプロバイダである。データベース58は、データの記憶媒体であり、光学、磁気、または他の任意の適切な記憶媒体とすることができる。
【0021】
一般に、ボイスポータル10は、サーバのネットワークとして実施される。サーバは、ソフトウェアによって構成できる。好ましくは、サーバは、ハードディスクなどの記憶装置を有する大量の読み取り書き込みメモリを有する。一般に、ユーザは、電話とボイスポータル10との通信を開始する電話番号をダイヤルすることにより、携帯電話12または標準の電話14のような電話を介して(一般電話サービス(POTS)を使用して)ボイスポータル10にアクセスする。または、他のタイプの電話サービスを使用し、音声または音声データをポータル10に通信することができる。ポータル10は、様々なライン、ネットワーク、ステーションを介して、電話12および14に接続することができる。有利なことに、ボイスポータル10は、ユーザに音声通信を提供する。ボイスポータル10により、ユーザは、Webページ30および40とネットワーク20を介して利用可能な他のソースとからの情報およびサービスにアクセスできる。こうしたアクセスは、様々なWebサイトおよびインターネットサービスから継続的に情報を検索、編成、および格納するボイスポータル10によって、迅速で効率的な形で提供される。ボイスポータルを使用するために、他のユーザインタフェースプラットフォームを提供することもできる。こうしたユーザインタフェースプラットフォームには、例えば、WAP(ワイヤレスアプリケーションプロトコル)およびWebインタフェースが含まれる。
【0022】
図2は、ボイスポータルによって実行される例示的な機能的動作を表している。こうした機能は、任意の数の物理構造を含め、任意の様々な方法で実行することができる。例示的な一実施形態の場合、ボイスポータル10は、ユーザインタフェース110と、広告サブシステム120と、顧客管理サブシステム130と、イグジスタントサブシステム140と、融合エンジン150と、更新エンジン160と、データベース170とを有する。
【0023】
ユーザインタフェース110は、ボイスポータル10とユーザとの間での音声通信を調整する。ユーザインタフェース110は、発話、インターネットまたは「ワールドワイドウェブ」(WWW)、ワイヤレスアプリケーションプロトコル(WAP)インタフェース、または他の任意のプロットフォームインタフェースを介したもののいずれかとすることができる。例示的な一実施形態の場合、ユーザインタフェースは、発話指向のものである。こうした発話指向の実施形態の場合、ユーザインタフェース110は、可能な限り、ユーザ入力を受け入れるワードベースの自動言語認識(ASR)を使用する。ユーザインタフェース110には、マサチューセッツ州ボストン所在のスピーチワークスインターナショナル社が提供するSpeech Works等の言語認識ソフトウェアパッケージを使用することができる。高い確率で言語認識を行うために、ユーザインタフェース110は、ユーザの応答を認識可能な回答のセットに集中させるファンネリングプロセスを利用することが有利である。ファンネリングについては、図34を参照して詳細に説明される。ユーザインタフェース110は、ワードベースのASRが不可能である時に、ユーザの入力を受け入れるためにスペリングベースのASRも使用する。最後に、ユーザインタフェース110は、ユーザにとって有利である時のみ、ユーザ入力の入力用としてキーパッド入力を使用する。このキー入力の場合、電話12および14のキーを利用する(図4)。
【0024】
例示的な一実施形態の場合、ユーザインタフェース110は、以下のタスクの一つまたはそれ以上を実行する。(1)電話番号および他のユーザ固有情報によりユーザを識別する。(2)一定のプラットフォーム上で一定のユーザのために新しいセッションを開始する。(3)一定のプラットフォーム上で一定のユーザのために新しい対話を追加する。(4)ボイスポータル10において利用可能な垂直的関心ドメインのセット内でユーザの嗜好を更新する。(5)垂直的関心ドメインに関するユーザの嗜好を有効化または無効化する。(6)ユーザの専門知識レベルを全般的にまたは特定の垂直領域内で更新する。(7)ユーザの人口学的情報または個人情報(およびクレジットカード情報)を更新する。(8)ユーザインタフェース固有情報によりユーザのセッション状態を更新する。(9)新しいクレジットカードをデータベースに追加する。(10)既存のクレジットカードを新しい情報により更新する。(11)クレジットカードの種類および番号によりクレジットカードを識別し、既にデータベースに含まれる場合はチェックする。(12)ユーザが利用可能な垂直的ドメインのリストとその順序とを設定する。(13)ユーザのセッションを通常通り終了させる。(14)ユーザのセッションが異常終了し、何らかの定義済み状態(コールドロップ、セッションタイムアウト等)になったことを顧客管理サブシステム130に通知する。(15)セッションが異常終了(ドロップコール、セッションタイムアウト等)した場合にセッションを再開できるように、特定のプラットフォームが与えられたユーザの最近のセッションを決定し、格納されたセッション状態に復帰させる。ユーザインタフェース110は、識別、セッション、ユーザ、および支払プロトコルに関する追加機能を実行することができる。
【0025】
広告サブシステム120は、通信セッション中にユーザに提示する広告に関する活動を調整する。例示的な一実施形態の場合、広告サブシステム120は、スポンサ広告と、特定のユーザをターゲットとする広告と、ユーザからの肯定的要求の後でのみ提示される許可ベース広告等との広告を有する。例示的な一実施形態の場合、広告サブシステム120は、次のうちの一つ以上の機能を提供する。(1)ユーザ、セッション、場所、コンテンツ、および検討中の項目に基づいて、再生する広告を選択する。(2)広告が再生され、かつ再生が完了したか否かを記録する。(3)スピークスルー(以下で説明するように、広告対象について詳しく聞くことをユーザが選択的に選んだ広告)が行われたことを記録する。(4)データベースを繰り返し呼び出す必要がないように、ビーン内に顧客およびセッション情報を格納する。(5)広告を提供した企業の記録を作成し、これを識別可能にする。(6)データベースに格納する広告および広告の契約を作成する(広告は、システムでの使用に関して異なる契約を有する場合がある)。(7)広告販売の目的で新しい販売担当社員または雇用主の連絡先を作成する。(8)広告および/または広告の契約を更新する。(9)連絡先情報および所在地情報を変更するために広告企業を更新する。(10)販売担当社員および雇用主の連絡先を更新する。(11)アクティブリストで広告を追加/削除する。(12)外部情報に基づいて、完了するまたは完了しない広告契約に印を付ける。(13)広告のタイプに基づいて、アクティブな広告のリストを表示する。(14)非アクティブ、アクティブ、未完了、完了、または単純に全広告のいずれかの基準に基づいて、企業に関する広告のリストを表示する。(15)上の基準に基づいて、広告に関する契約のリストを表示する。(16)上記基準に基づいて、販売担当社員に関する契約のリストを表示する。(17)単純に固有の識別子を送ることにより、社員、企業、広告、または広告契約の完全なリストを検索する。(18)社員、企業、広告、および広告契約のイグジスタントの近似文字列一致に関して、データベースを検索する。(19)特定の契約に関して、企業のために行った配信を追跡し、その企業の残高を更新できるようにする。(20)データの完全性のエラーが存在しないことを確認するために更新ログを検索する。(21)特定のジャンルの広告を格納するために必要なプレイリストを作成および修正する。
【0026】
こうした動作のそれぞれを実行するために、様々な種類の方法を使用することができる。広告の動作については、図36を参照して詳細に説明される。広告サブシステム120は、識別、セッション、ユーザ、および支払プロトコルに関する追加機能を実行することができる。本明細書で開示する広告技術は、従来のパーソナルコンピュータ(PC)インタフェースWeb接続によって使用することもできる。
【0027】
顧客管理サブシステム130は、ユーザと、ユーザによるボイスポータル10の使用とに関する情報の管理を調整する。例示的な一実施形態の場合、顧客管理サブシステム130は、ユーザインタフェース110と、広告サブシステム120と、その他のボイスポータル10の機能とによって選択的に使用される、嗜好および人口統計データのようなユーザに関する情報を取得する。顧客管理サブシステム120は、識別、セッション、支払プロトコルに関する追加機能を実行することができる。サブシステム110、120、および130を別個に説明したが、それぞれの動作は、本発明の原理から逸脱することなく、単一のユニットに統合することができる。
【0028】
ユーザインタフェース(UI)110および顧客管理サブシステムは、垂直的ドメインから選択したものと、インターネットからの情報のアクセスとを提供するために対話する。垂直的ドメインは、ボイスポータル10内でユーザが選択可能な様々なフィールドまたはエリアを分類する。UI 110がユーザと効果的に通信するためには、特定の嗜好およびユーザデータを、受動的または能動的に確認および理解する必要がある。顧客管理サブシステム130は、こうした情報をデータベース170に格納する。または、別個の顧客データベースにより、こうした情報を維持することができる。
【0029】
顧客管理サブシステム130は、顧客の嗜好およびデータを判断するために必要な情報をUI 110から取得する。UI 110は顧客管理サブシステム130にデータを渡し、顧客管理サブシステム130は、このデータを処理し、少なくとも一つのデータベースに中継する。更に、更なる解析のためにイグジスタントサブシステム140には嗜好の更新も存在する。その後、イグジスタントサブシステム140は、ユーザの嗜好およびデータ等の情報をUI 110に戻す。
【0030】
顧客管理サブシステム130が、応答時間を感知できるほど長くすることなく、修正および拡張することが可能であることは、有利である。このため、ボイスポータル110に新しい垂直的ドメインを追加するプロセスは、迅速で一貫性がある。顧客データおよび人口統計データのタイプは、決して完全に定義することができず、新しい垂直的ドメインは常に追加可能である。
【0031】
顧客管理サブシステム130は、データベースを介して登録済みのユーザおよび未登録のユーザが行ったすべてのトランザクションを記録する。顧客管理サブシステム130は、更に、形成済み履歴リストにユーザが見つけた項目を記録し、ユーザが(Webサイト上でおよびWAPデバイスを通じて)調べたコレクションを追跡する。
【0032】
顧客管理サブシステム130は、可能な時は常に、できる限り受動的に、登録済み顧客を識別する。したがって、顧客の認識は、好ましくは、例えば、システムに入る時の電話番号およびID(「PIN」)のような何らかの種類の識別キーを介して行われる。この識別は、顧客に関連する特性の嗜好と、嗜好の各セット内での顧客の経験レベルとに結びつくことが好ましい。加えて、このシステムでは、格納されたクレジットカード情報に対する購入の認証を行う前に、識別のレベルを追加すること(例えば、パスワードによる識別)も可能である。
【0033】
顧客管理サブシステム130は、それぞれの垂直的ドメイン内で、ボイスポータル10を介したユーザの対話を円滑にする嗜好のセットを維持する。例えば、例示的な一実施形態の場合、顧客管理サブシステム130は、顧客に与える広告のタイプおよび顧客のサービスを向上させる方法を判断するのを更に支援するために、顧客から情報を収集する。顧客管理サブシステム130は、サポートする各ドメインに応じた顧客の嗜好を維持し、データソースからの顧客データを動的に更新する。例えば、オークションの関心ドメインでは、ユーザの要求に応じて現在の入札状態が交信される。ボイスポータル10は、有利なことに、ドメインに応じた現在性によりユーザデータを提供する。例えば、オークションの関心ドメインでは、入札は常に数秒以内に最新のものになり、e−コマースの関心ドメインでは、価格状態は購入価格が提示された時に最新のものになる。
【0034】
顧客管理サブシステム130が、どのユーザがどのサービスにアクセスしたかの判断を可能にする報告および分析を提供することは、有利である。更に、顧客管理サブシステム130は、例えば、特定の所得階層、性別、または年齢層のユーザがどのサービスにアクセスしたかを判断すること等、異なる人口統計セグメント別にセッションおよびトランザクション履歴の報告を提供する。顧客管理サブシステム130は、更に、実際の使用に基づく相関性の報告を提供する(例えば、映画に関心のあるユーザが他のどのようなサービスにアクセスしたかを報告する能力)。
【0035】
継続的に価値を付加し、あるプラットフォームから別のプラットフォームへのユーザの移行(例えば、電話からWeb、または電話からWAP)を追加するために、顧客管理サブシステム130は、有利なことに、サービスにおける顧客の体験を向上させる個人化機能をサポートする。個人化に加え、その他の「固着性」(競合の観点における顧客のサービスへの「固着」)のソースには、友人または共通の関心を持つ人々のネットワークのようなコミュニティ機能のサポートが含まれる。したがって、顧客管理サブシステム130に個人化機能およびコミュニティ機能が含まれる場合、顧客が特定のサービスプロバイダに愛着を持つ傾向が強くなる。
【0036】
顧客の行動に対し如何なるサービス(または広告)も適合化させることをサポートするために、顧客管理サブシステム130は、有利なことに、サービスの使用を追跡する。更に、インタフェース評価の分野においては、代表的なユーザによるインタフェース階層の調査パターンは、問題のあるエリアまたは非常に有効なエリア、または単一のセッションにおいて相関する下位機能のセットを特定するのに役立つ場合がある。ボイスポータル10のサービスにおいて重要な属性の別の例は、タイミングである。例えば、(リストまたはプロンプトが完了する前に、ユーザが回答によって割り込み可能である)「バージイン」の使用は、上級ユーザを意味する可能性があり、かつ特定のユーザが単一のサブツリーに対して繰り返し行ったバージインの文字列の選択内容は、有利なことに、顧客管理サブシステム130によって検出することが可能であり、かつこれは全般的なショートカットまたはおそらくは顧客固有のショートカットへの機会をもたらすことが出来る。
【0037】
「固着性」の態様は、顧客の嗜好に対するサービスの適合化である。これは反復されない「サインアップ」または「購入」データ入力要件のサポートにおける顧客情報の保持のような相対的に単純な機能を有するが、更に、様々なフロントエンドにおける対話での特定のサブツリーのナビゲーションに関する嗜好と、サービス/ベンダの順序付けまたは選択に関する嗜好を有することもできる。ベンダの嗜好または順序付けの例として、ユーザは「好適なベンダ」を選択することが可能であり、これによりボイスポータル10は、発見した製品に関するベンダのリストを、最も安いものと、好適なものとの二つに限定することができる。
【0038】
垂直的嗜好は、ユーザの行動に基づいて受動的に設定されるべきである。つまり、特定の属性が二度以上要求されると、受動的嗜好が、設定されることになる。または、嗜好は、動的であり、ユーザの行動に基づいて変化する。ユーザが、音声またはWebインタフェースを介して設定またはリセットすることにより、すべての受動的嗜好を無効にすることができることが、好ましい。
【0039】
顧客管理サブシステム130は、株式情報、選択した天気のようなユーザの嗜好を、My yahooおよびMy Exciteのような個人化されたWebページから引き出すことができる。この個人化されたWebページは、ユーザが従来のインターネット接続を介して事前に作成することができる。または、個人化されたWebページは、顧客管理サブシステム130がユーザの音声コマンドに反応して構築することができる。こうしたページは、ボイスポータル10で使用するために変換することができる。全般的な嗜好は、特定の垂直的嗜好または現行の通話での嗜好が存在しない場合、有利なことに、デフォルトの嗜好として使用することができる。
【0040】
以下では、例示的な垂直的嗜好要件およびその説明が列挙されている。各嗜好は、各インタフェースの全体に渡って異なる形で使用される。例示的な一実施形態の場合、天気に関する唯一の嗜好は、顧客が要求した場所の天気である。デフォルトでは、ユーザの場所は、その郵便番号である。最も一般的に使用される場所(Most Commonly Used Location)は、可能な場合、現行の通話の場所によって無効にすることができる。
【0041】
スポーツの関心ドメインにおいて、調査する嗜好は、数種類存在する。第一に、好きなスポーツが、選択肢となる。特定のスポーツのスコア、スケジュール、および順位をユーザに送信することもできる。Webサイトでは、排他性を使用して、特定のスポーツの広告および情報を送信しないことができる。例えば、あるユーザは、ホッケの試合に関する情報は望んでおらず、野球の情報を求めている場合がある。第二に、他のチームより贔屓にしている特定のチームについては、嗜好の細かさを増加させることができる。こうしたそれぞれの細かさに関し、限定的な選択の直前に使用された(MRU)リストを使用して、嗜好リストを決定することが可能である。スポーツの種類およびチームの嗜好の他に、好ましいイベントを使用することができる。
【0042】
映画の関心ドメインにおいて、必要な嗜好には、顧客の地域および劇場の地域と、映画のタイプ(スリラ、ホラー、アクション等)と、映画の観客指定(AA、G、R等)と、顧客の好きな俳優/女優が出演している映画とが含まれる。こうしたそれぞれの嗜好は、限定的な選択のMRUリストに列挙することができる。
【0043】
交通に関する関心領域の場合、使用される主な嗜好は、時間の属性を有する(現在がデフォルトである)、ユーザが目的地に到達するために使用した特定のルートである。したがって、限定的なルートのMRUリストが、顧客の嗜好リストを構成する。
【0044】
例示的な一実施形態の場合、株式の関心ドメインにはニ段階の嗜好階層が存在する。第一に、市場リストの嗜好が存在し、第二に、各市場内で、どの株式および指数を調査するかの嗜好が存在する。ここでも、市場および株式が決定されていない選択用MRUリストを表にすることができる。他の垂直的関心ドメインには、レストラン、コンサートおよびライブイベント、タクシおよび飛行機の予約がある。
【0045】
更に図2を参照すると、イグジスタントサブシステム140は、ユーザインタフェース110と、広告サブシステム120と、顧客管理サブシステム130と、融合エンジン150と、更新エンジン160とによるデータベース170へのアクセスを調整する。イグジスタントサブシステム140は、データベース170に含まれるデータ構造の作成、適合化、および操作を管理する。データベース170に含まれるデータは、更新エンジン160によって、インターネットのソースから収集される。例示的な一実施形態の場合、データベース190において使用されるデータ構造は、「イグジスタント」または事物とその互いの関係および連関との階層に基づいている。データベース170はイグジスタントサブシステム140とのみ対話するため、データベース170内の情報を複製および修正する能力は、より容易に実行されることは、有利である。イグジスタンおよびその作成については、図4乃至10を参照してさらに説明される。特に、イグジスタントに関する例示的なデータ構造モデルについては、図4乃至6を参照して説明されるが、イグジスタントに関する他の多数の構造を利用することも可能である。イグジスタントの作成および更新については、図7乃至10を参照して説明される。
【0046】
融合エンジン150は、二つのイグジスタントが同じであるか否かを判断し、同じである場合、イグジスタントを融合し、第三のカノニカルなイグジスタントを形成する。これにより、融合エンジン150は、あるソースから収集した情報が別のソースから収集した情報と関連しているかまたは同じであるかを確証する。融合エンジン150の機能については、図25、26、および27を参照して説明される。
【0047】
更新エンジン160は、インターネットから情報を検索し、データベース170に含まれる情報および属性を更新する。例示的な一実施形態の場合、更新エンジン160は、データベース170の情報を更新するために、インターネットから情報を検索する「スパイダ」を利用する。更新エンジン160の動作については、図7および8を参照して説明される。
【0048】
データベース170は、顧客データと、広告情報と、製品およびサービス情報等とのボイスポータル10で使用される情報を格納する。データベース170内の情報は、イグジスタントと、イグジスタント属性と、イグジスタント関係と、イグジスタント連関とに格納される。イグジスタントとは何か、どのように形成されるか、互いにどのように関連するか、およびボイスポータル10の機能とどのように関連するかについては、以下に詳しく説明する。代替実施形態の場合、顧客データ、広告情報、および動作記録等、特定のタイプの情報については、多重データベースを使用することができる。
【0049】
図3は、ボイスポータル10の例示的な物理的レイアウトを表している。こうした物理的構造は、例としてのみ表示されている。表示のものと組み合わせて、または表示のものの代わりに、他の構造を使用することもできる。例示的な一実施形態の場合、ボイスポータル10は、フロントエンドサーバ210と、フロントトゥバック(front−to−back)ネットワーク220と、バックエンドサーバ230と、バックエンドネットワーク240とを有する。ユーザは、電話を介して、フロントトゥバックネットワーク220によってバックエンドサーバ230に結合されているフロントエンドサーバ210の一つと通信する。
【0050】
例示的な一実施形態の場合、バックエンドサーバ230は、プロキシマネージャ245と、プロキシ250と、ビーン260と、データベース270とを有する。プロキシマネージャ245は、フロントエンドサーバ210の一つから、フロントトゥバックネットワーク220を介して、情報の要求を受領する。プロキシマネージャ245は、バックエンドネットワーク240を介して通信し、それぞれのプロキシマネージャ245での仕事負荷レベルを判断する。適切なプロキシマネージャ245が決定されると、適切なプロキシマネージャ245は、フリープロキシ250のプールからフリープロキシを引き出し、そのプロキシをビーン260に割り当てる。ビーン260は、情報を検索するため、情報を挿入するため、イグジスタントまたはイグジスタント関係を検索するため、またはデータベース270によって可能な他の任意の機能を実行するために、データベース270に関連している。
【0051】
図3を参照して説明される仮想データベース構造は、インターネット20から集められた情報を、時宜に適った非常に実用的な形でボイスポータル10のユーザに配信するように設計されている。人々は様々な場面および形で情報を必要とし、これを使用するが、有利なことに、ボイスポータル10は、電話(例えば、音声、WAP、および両方)と、Webと、携帯接続コンピューティングデバイス(例えば、Palm(登録商標)OSデバイス、WinCE(登録商標)デバイス、RIMページャ)とを一部として有する様々なプラットフォーム上で、これをサポートする。
【0052】
バックエンドサーバ230は、データ収集および融合を有する、様々な機能を有するデータベースサービスサポートを有する。データ収集は、図7および8を参照して説明するように、特定の項目の種類および/またはサイトに関してスケジュール化されている定期的な間隔で、インターネットソースからデータを蓄積する。ボイスポータル10は、図9および10を参照して説明されるように、データソースサイトの変更を検出し、適切なサイトルールマネージャに通知する。ボイスポータル10は、同じく図9および10を参照して説明されるように、データソースからのデータ抽出の非エキスパート定義をサポートする。
【0053】
「融合」のプロセスにおいて、ボイスポータル10は、異なるインターネットベンダから同一の項目を特定する。融合プロセス中、ボイスポータル10は、すべての情報のソースに関するメタデータを保持する。メタデータは、データに関するデータを有する。例えば、メタデータは、データ要素または属性に関するデータ(名前、サイズ、データタイプ、その他)と、記録またはデータ構造に関するデータ(長さ、フィール否かラム、その他)と、データに関するデータ(どこに位置するか、どのように関連するか、所有者、その他)とを記録することができる。更に、ボイスポータル10は、確実性を自動的に決定できない場合に、非エキスパートによる融合の決定または非決定の対話式分類をサポートする。ボイスポータル10は、更に、コードを変更することなく、新しいデータタイプおよびデータ要素の追加をサポートする。更に又、ボイスポータル10は、市場調査と、市場試験と、市場機会とを通じて特定される相関性のドメイン固有概念をサポートする。例えば、e−コマースの関心ドメインにおいては、より安価と、より良質と、一緒に購入されることが多いと、最も人気が高いとが、重要な相関性概念になる。映画の関心ドメインにおいては、関連する映画および製品と、カテゴリで最高の映画と、最も人気が高いと、最高の批評と、キャストとが、重要な相関性概念になる。ボイスポータル10は、項目に関する追加的詳細を提供するために必要な関連情報を収集および保持する(製品説明等)。融合の動作および機能については、図25乃至27を参照して更に説明される。
【0054】
図4は、ボイスポータル10のデータベース170によって使用される例示的なデータ構造モデル300を表す。ここで、「イグジスタント」(または事物)には属性、連関、および関係が与えられている。イグジスタント間の「継承」関係は、先端に三角形が付いた実線で表されている。イグジスタント間の「連関」関係は、先端に開いた矢印が付いた点線で表されている。継承関係の例として、データ構造モデル300において、ブロック310は、「イベント」である。「イベント」は、「イグジスタント」または事物であり、これはブロック320への三角形の矢印315によって表される。同様に、「映画上映」(ブロック330)は、三角形の矢印335によって表されるように、「イベント」(ブロック310)である。連関関係の例として、イベントは、ブロック340への開いた矢印345によって表されるように、「会場」に関連する。同様に、映画上映(ブロック330)は、開いた矢印355によって示されるように、「映画パッケージ」(ブロック350)に関連している。スポーツイベント、ドラマ、コンサート、コメディショー、花火大会、ダンスパフォーマンス、または他の如何なる活動も、イベントとすることが出来る。
【0055】
データ構造モデル300は、図4に例示される更に多くのイグジスタント、連関、および関係を有するが、ここでは説明しない。更に、データ構造モデル300は、例図に含まれない更に多くのイグジスタント、連関、および関係を有することができる。図4の目的は、例示のみである。
【0056】
次に図5には、ユーザまたは顧客オブジェクトと様々な垂直的クラスとの間のオブジェクト指向関係を示すために、例示的なデータ構造モデル400が表示されている。継承および連関関係の表示は、図4を参照して説明したデータ構造モデル300の表示と同じである。例示的な一実施形態の場合、データ構造モデル400に配置されるユーザ情報は、データベース170に含まれる。しかしながら、代替実施形態の場合、こうしたユーザ情報は、別個の顧客データベースに含まれる場合もある。
【0057】
顧客は、Existant(顧客イグジスタントブロック402)であり、階層内の最上レベルの直系、または「Existant」イグジスタントであるため、すべての特定およびメソッドを継承する。この構造の理由は、データベース170およびそのメソッドが既に作成されており、この構造によりコードの再使用が可能となるためである。
【0058】
顧客オブジェクトは、様々な情報の断片を有する。全般的な嗜好クラスは、「交通」、「天気」、および「映画」のような嗜好に関する情報を有する。顧客が新しい種類の垂直的関心ドメインに入る度に、挿入された嗜好データにより、垂直的ドメインの名前に対する嗜好オブジェクトのインスタンスが作成される。垂直的ドメインが既に存在する場合、オブジェクトは、更新された情報により修正される。
【0059】
セッションクラスは、ユーザのセッションに関する情報を直接的に記録する(セッションブロック404)。このセッションは、通話、Webサイトを通じた検索、またはWAPを使用した呼び出しとすることができる。日時および継続時間のようなデータは、全般的な属性だが、ユーザが通話に使用したのが電話線か携帯電話かの分析は、電話セッションに固有となる。このタイプのデータは、ボイスポータル10が(広告の目的で)誰に対してマーケティングするかを決定すること、およびパフォーマンスおよびサービスの両方を向上させることにおいて有益である。同様に、顧客オブジェクトは、(ユーザがセッションを中断し、特定の時間に再接続したい場合に)そのプラットフォームでの最後のセッションがどれであるかを決定するために、こうしたセッションオブジェクトのそれぞれとのリンクを有している。
【0060】
電話セッションブロック408は、ポータル10との通信に電話が使用された場合の通信セッションに関する情報を記録する。電話セッションブロック408は、現在の対話レベルと、現在の関心ドメインと、インタフェースプラットフォームのタイプ(WWW、WAP、ASR等)と、前回の訪問レベル等との情報を有する。有利なことに、電話セッションブロック408により、ユーザは、前回のセッションを中止した場所、またはセッションが中断された場所から、セッションに再び参加することができる。クレジットカード情報イグジスタント、場所イグジスタント、および嗜好イグジスタントのような他のイグジスタントブロックは、必要に応じて関連する属性および記録情報を有する。
【0061】
専門知識クラス(専門知識ブロック406)は、様々なプラットフォーム(電話、WAP、WWW)での(全般的、および様々な嗜好に関する)使いやすさの様々なレベルを維持する目的を果たす。顧客は、こうしたクラスインスタンスそれぞれに対するリンクを有する。嗜好はクロスプラットフォームにすることができるが、ユーザの能力はできないため、これは、嗜好クラスには含まれない。
【0062】
図6は、広告に関する情報についてボイスポータル110のデータベース170によって使用される例示的なデータ構造モデル450を表している。継承および連関関係の表示は、図4のデータ構造モデル300の表示と同じである。例示的な一実施形態の場合、データ構造モデル450に配置される広告情報は、データベース170に含まれる。しかしながら、代替実施形態の場合、こうした広告情報は、別個の広告データベースに含まれる場合もある。
【0063】
データ構造モデル300、400、および450が、イグジスタント、連関、および関係に関する情報の継続的に拡張する配列を提供することは、有利である。更に、モデル300、400、および450は、以前に入力された情報を変化させることなく、新しい垂直的関心ドメインを迅速に作成することを可能とする。例えば、モデル300は、映画およびコンサートのようなイベントと、書籍、玩具、および電子機器のような商品とに関連する情報を有する。バレエのような如何なるイベントも、「イベント」との継承関係と、適切な連関関係とを有するイグジスタントとして、容易に追加することができる。同様に、車のような如何なる商品も、「製造品目」との継承関係と、適切な連関関係とを有するイグジスタントとして、容易に追加することができる。データ構造モデル300、400、および450の動的な性質および拡張能力から、ボイスポータル10は、広範なインターネットからの情報およびサービスに対する単一のボイスポータルとなる利点を有することができる。
【0064】
図7は、例示的なデータ構造モデル300(図4)、データ構造モデル400(図5)、および例示的なデータ構造モデル450(図6)に示されるイグジスタントのようなイグジスタントの例示的な作成プロセスのフロー図700を表している。ステップ710において、インターネット上のWebページが発見される。例示的な一実施形態の場合、事前に定められた項目のカテゴリに関連する特定のWebページを見つけるために、スパイダが、使用される。スパイダは、ドキュメントを検索し、その中で参照されるドキュメントの一部または全部を再帰的に検索することによりワールドワイドウェブ(WWW)を自動的に探索する、従来から知られているプログラムである。対照的に、人間が操作するWebブラウザは、インライン画像およびURLリディレクション以外のリンクを自動的に進むことはない。ステップ710が実行された後、ステップ720が実行され、特定の情報を抜き出すためにページにオーバレイする選択フォームを使用して、発見されたWebページ上で情報が識別される。ステップ720の後、ステップ730が実行され、ステップ720でのフォームオーバレイによって検索された情報から特性情報または属性を識別するためにルールが使用される。特性情報または属性は、イグジスタントが何であるかを定義する。ルールは、イグジスタント属性の編成を定義する。例えば、映画イグジスタントは、タイトル、監督、キャスト、公開年、およびシノプシスの属性を有することができる。
【0065】
ステップ730が実行された後、ステップ740が実行され、属性がイグジスタント内で編成され、イグジスタントはデータベース170に格納される。イグジスタント内での属性の編成および配列は、事前に定められたルールによって構造化されることが、好ましい。
【0066】
図8は、図7を参照して説明したイグジスタントの例示的な作成プロセスを表している。スパイダ810は、広範な種類のWebページに格納される情報のためにインターネット20をトラバースする。スパイダ810によって検索された情報は、情報をデータ構造830内に置くために、ルール820にしたがって編成および配列される。例示的な一実施形態の場合、スパイダ810は、映画に関するインターネット20からの情報を検索する。例えば、スパイダ810は、IMDB Webサイトをトラバースし、特定の映画のタイトル、監督、キャスト、公開年、および上映時間に関する情報を検索することができる。映画の情報がデータ構造830内に格納されると、データ構造830は、語彙テーブル840に加えられる。語彙テーブル840は、データ構造830に含まれる属性を編成し、情報を三つのカラムに配置する。例示的な一実施形態の場合、語彙テーブル840の第一のカラムは、オリジナルデータを含み、第二のカラムは、標準化されたタグ付きのフォーマットでオリジナルデータを含み、第三のカラムは、検索可能なマッシュされたフォーマットでデータを有する。語彙テーブル840およびデータ構造830は、データベース170のメモリ構造に含まれる。
【0067】
一例として、スパイダ810が映画「レイダース失われた聖櫃(Raiders of the Lost Ark)」に関連する情報についてインターネット20をトラバースする場合、インターネット20から検索されるデータには、映画に対応するルールが適用され、このデータはデータ構造830に置かれる。こうした映画に関するルールは、タイトル、監督、キャスト、および公開年を有することが可能であり、そのすべてが映画の属性である。この例において、タイトルは「レイダース失われた聖櫃」となり、監督は「スティーブン・スピルバーグ」となり、キャストは「ハリソン・フォードおよびカレン・アレン」となり、封切り年は「1981」となり、上映時間は「115分」となる。このため、語彙テーブル840は、オリジナルフォーマットのタイトル「Raiders of the Lost Ark」と、標準化されたタグ付きフォーマットのデータ<title>Raiders of the Lost Ark</title>と、検索可能なマッシュされたフォーマットRaidersLostArkとを、スペースまたは同定の冠詞(the, a, an等)を付けずに有する。
【0068】
図9は、ノンプログラミング手段を使用してインターネットからの情報を収集する例示的なプロセスを示すフロー図900を表している。ステップ910において、検索ページが発見され、関連情報を有するページのエリアを分離するためにパターンが使用される。ステップ910が実行された後、ステップ920が実行され、適切なフォームが発見され、実際のデータおよび情報を抽出するために特別なルーチンが呼び出される。ステップ920の後、ステップ930が実行され、関連情報を有する多数のページが、特定のページが与えられた状態で発見される。データ固有パターン以外に、特定のページにおいてデータ固有パターンが作用する場所を定義するエリアパターンが存在する。ステップ930が実行された後、ステップ940が実行され、多数のページ上の製品またはサービスの更なるリストが発見される。例示的な一実施形態の場合、コードサンプルから実際の製品リストのパターンを計算するために、予測ルーチンが使用される。
【0069】
一般に、予測ルーチンは、ルールライタによって与えられた望ましい出力からパターンを計算する。ルールライタが抽出したいテキストの断片をHTMLコードからペーストするのみで良いことは、これを行うためのパターンを作成する必要がないため、パターン予測ルーチンが、生産の速度を上げるので、有利である。パターンを記述するために現在使用されている入力フィールドは、このデータを挿入するために使用される。
【0070】
一例として、最初にルールライタがWebページ上の著者名のサンプルを著者フィールドにコピーすることにより、予測ルーチンは、書籍に関するデータを提供するWebページの著者データに関するパターンを策定する。このアルゴリズムは、その後、サンプルデータをWebページ上の位置に一致させる。一致データの近くにある文字またはタグは、「接頭辞(prefix)」および「接尾辞(suffix)」として識別される。接頭辞は、一致データの前にある文字であり、接尾辞は、一致データの後ろにある文字である。接頭辞および接尾辞は、パターンを構築するために使用される。
【0071】
構築されたパターンは、他のデータと一致させるためにWebページに適用される。構築されたパターンが、望ましい結果と等しくないデータを拾い上げた場合、パターンの策定に使用された接頭辞および接尾辞に追加が行われ、更に完全で正確なパターンとなる。この手順が反復され、パターンは改良される。
【0072】
この例を更に明確にするために、書籍に関する製品データを提供するWebページからの以下のHTMLコードを取り上げる。
【0073】
【プログラム1】
Figure 2004504654
【0074】
ルールライタは「Larry Wall」を著者フィールドにダンプし、これが著者として抽出するデータであることを示す。
【0075】
パターン予測アルゴリズムは、大まかに以下のように機能する。
【0076】
【プログラム2】
Figure 2004504654
【0077】
第一のページのn = 1から開始し、このアルゴリズムは、$prefixが値「>」を取り、$suffixが値「<」を取ることを意味する「>Larry Wall<」と一致する。次に、パターン予測アルゴリズムは、第一のステップから得た値$1および$2を使用して、パターン「>(.?)<」を構築する。このパターンをWebページと一致させることにより、望ましい結果「Larry Wall」とは等しくない「>Programming Perl<」が生じる。そのため、nはn = 2に増分され、接頭辞および接尾辞に別の文字を有するためにパターンは精緻化される。「({.}2)Larry\s+Wall({.}2)」を有するWebページとの一致により、「b>Larry Wall</」が生じ、これは$prefixが値「b>」を取り、$suffixが値「</」を取ることを意味する。次に、このパターン予測アルゴリズムは、第一のステップから得た値$1および$2を使用して、パターン「b>(.*?)</」を構築する。このパターンをWebページに一致させることにより、望ましい出力である「Larry Wall」が生じる。
【0078】
次に、ルールライタは、Webページを進んで、同じパターンを異なるページに適用し、パターン一致として、書籍「Lerning Perl」に関するページ上の「2nd edition」を発見する。ここでルールライタは、望ましい結果の第二の例を与えることにより、アルゴリズムを改良し(つまり、GUIの入力フィールドに「RandalSchwartz」をダンプする)、これによりパターン予測アルゴリズムは、<b>の前に「y」を付けるパターンが作成されるまで、nを更に増分する。このアルゴリズムは、Webデータのデータおよび必要なパターンの複雑性に応じて、何度かの反復を実行することができる。
【0079】
ステップ940が実行された後、ステップ950が実行され、ベンダ固有データ抽出ファイルが生成される。例示的な一実施形態の場合、コードサンプルから関連するURLを計算するルーチンが使用される。または、URLを計算するルーチンは、フォームとして渡すことができる。ステップ950が実行された後、ステップ960が実行され、キャッシュが作成される。ステップ960が実行された後、ステップ970が実行され、製品データの抽出に関するパターンが作成される。好適な実施形態の場合は、回帰試験メカニズムが、特別なルーチンの編集をサポートする。
【0080】
図10は、ボイスポータル10に関連するルールのノンプログラミング策定の例示的なプロセスを表している。この例示的なプロセスにおいて、ルールライタ1010のセットからのルールライタは、データソース1030、データソース1035、データソース1040、またはWWW 1020に接続する他の任意のデータソースのうち、いずれか一つからの情報にアクセスするために、ワールドワイドウェブ(「WWW」)1020にアクセスする。データソースから検索したデータは、データ編成ツール1025を利用してデータ構造内に置かれる。ルールライタ1010は、データ編成ツール1025を使用して、多数の可能なフォームの一つを、WWW 1020を介して利用可能な情報の「ページ」に適用する。こうしたフォームは、ページ上で、何らかの示差的なタグにより標識付けされた関連情報の場所に関する表示を提供する。例えば、WWW 1020上で提供されるページは、ページの左上角にデータ入力ボックスを有する可能性がある。更に、部分またはサービスに関する情報は、書籍のタイトルの「<title>」のように、HTMLタグの後に位置する可能性がある。
【0081】
注意すべき点として、本明細書で使用される「ページ」という用語は、ユーザインタフェーススクリーン、または診断システムのユーザが閲覧可能な同様の配列、例えば、データ、メッセージ、方向、およびその他のグラフィックまたはテキストによる表示を提供するスクリーンを有する。更に、こうしたページは、マークアップ言語、またはJava(登録商標)、Javaスクリプト、または他の任意の適切な言語等のプログラミング言語によって定義することができる。
【0082】
ルールライタ1010によってデータ編成ツール1025から選択されたフォームを使用することにより、データソースからのデータは、データ構造1045、データ構造1050、データ構造1055、または情報を維持する同様の如何なる構造にも編成される。データ構造1045、1050、および1055は、統一データ構造1060の形成において、比較、融合、または利用することができる。統一データ構造1060は、データベース1070に格納される。
【0083】
図10に示す例示的なプロセスにより、非エキスパートルールライタ1010が、WWW 1020を介して利用可能な特定のWebサイトからの情報の検索に使用するために、データ編成ツール1025によって提供される様々なフォームからの選択を可能にすることは、有利である。これにより、データソース1030、1035、および1040からのWebページに含まれるデータが、データ編成ツール1025を使用してルールライタ1010によって選択されたフォームにより、データベース1070で継続的に更新することができる。データ構造1045、1050、1055に含まれ情報が精度に関して比較されるので、データ編成ツール1025は、Webページが、対応するWebページ上のデータのフォーマットまたは配列を変化させた時期を検出する。
【0084】
図11乃至24は、新しいルールを作成する例示的なプロセスを表している。更に、図11乃至図24は、ルールライタとデータ編成ツール1025(図10)との間の可能な対話を表している。例示的な一ルールは、既存のルール、Amazon.comの書籍製品に基づいている。このルールを構築する際に利用するステップは、他の任意のルールを構築する際に利用するステップと同様である。
【0085】
図11は、ルール820(図8)の作成を開始するために使用されるグラフィカルユーザインタフェース(GUI)1110を表している。GUI 1110は、ベンダウィンドウ1120と、スパイダ選択ウィンドウ1130と、クエリウィンドウ1140と、ステータスウィンドウ1150と、検索ボックスエリア1160と、コードウィンドウ1197とを有する。検索ボックスエリア1160は、スライダバー1170と、右矢印セット1180と、左矢印セット1190と、検索ウィンドウ1195とを有する。
【0086】
新しいデータソースを開始するために、ルールライタは、データソース(例えば、Amazon Book)をベンダウィンドウ1120に入力する。ルールライタは、「Enter」を押し、「New」ボタンをクリックする。この行動が実行された後、図12に例示されるグラフィカルユーザインタフェース(GUI)1200が表示される。ルールライタは、「Done」ボタンをクリックし、記載されたデータソースが正しいことを確認する。次に、図13に例示されるグラフィカルユーザインタフェース(GUI)1300が表示される。URLは、選択されたベンダ名に対応して表示される。ルールライタは、正しいURLを確認するように求められる。Amazon Bookの例において、URLとしてhttp://www.AmazonBook.comが、GUI1300のウィンドウに現れる。しかしながら、URLリンクは、http://www.Amazon.comを読むべきである。ルールライタは、URLを訂正し、「Done」ボタンをクリックする。
【0087】
ここで再び図11を参照すると、ルールライタは望まれるクエリのタイプを選択する。第一に、ルールライタは、クエリウィンドウ1140を選択し、可能なクエリのリストから選択を行う。例えば、「書籍パッケージ」は、書籍の垂直的関心ドメインに関するクエリとして可能である場合がある。この検索は、ルールライタがクエリウィンドウ1140の「SDE」(検索データエディタ)ボタンをクリックした時に開始される。SDEボタンは、検索データエディタを呼び出し、検索データエディタは図14に例示されるグラフィカルユーザインタフェース(GUI)1400を提供する。GUI 1400は、特定の関心項目に関する検索において、使用可能な属性のリストを表示する。例えば、書籍が検索されている場合、ISBNまたはUPCのような属性が、表示される。検索が他の項目に関する場合、その項目に対応する属性が列挙される。「映画上映」に関する検索では、映画パッケージ、時間、および上映日のような属性が列挙される(図4を参照して説明したブロック330を参照)。
【0088】
ルールライタは、ISBN番号を対応するデータボックスに打ち込み、「Done」をクリックする。GUI 1400のボタン1430により、有利なことに、ルールライタは、様々な検索中の様々な検索基準をセーブすることができる。検索基準が入力された後、ルールライタは、「Done」をクリックし、特定のデータソース(つまりAmazon Book)に関してルールが定義されていないため、図15に例示されるグラフィカルユーザインタフェース(GUI)1500が現れる。GUI 1500は、ルールライタが新しいルールを追加したいか、または検索データを変更したいかをたずねる。この例において、ルールライタは、「add」ボタンをクリックし、GUI 1500は、図16に例示されるグラフィカルユーザインタフェース(GUI)1600へと拡張する。
【0089】
つぎに図16を参照すると、ルールライタは、正しいタイプのクエリが強調表示されていることを確認する。この例においては、ISBNが強調表示され、ルールライタは、「yes」ボタンをクリックする。Amazon Bookのホームページがネットスケープブラウザにロードされたことをルールライタに知らせるために、図17に例示されるグラフィカルユーザインタフェース(GUI)1700が現れる。ルールライタは、ISBNルールに関連するWebページをブラウズするように指示される。検索ページがインターネットブラウザにロードされた後、ルールライタは、「done」ボタンをクリックする。
【0090】
図18に例示されるグラフィカルユーザインタフェース(GUI)1800は、ルールライタが選択するフォームオプションを表示する。フォームが正しい場合、ルールライタは「done」ボタンをクリックする。記載のフォームがルールライタにとって必要な選択肢ではない場合、ルールライタは、「next」ボタンをクリックし、ページ上で他のフォームを確認する。一致するページが見つかると、図19に例示されるグラフィカルユーザインタフェース(GUI)1900が表示される。
【0091】
データ編成ツール1025(図10)は、インターネットブラウザで結果として生じたページを表示する。このページが正しい場合、ルールライタは、GUI 1900上の「okay」をクリックする。図20に例示されるグラフィカルユーザインタフェース(GUI)2000が現れ、検索で多数の項目が一致した場合に、ページ上の単一の項目をどのように検出するかをたずねる。GUI 2000は、クエリされた項目に関する詳細を得るために、どこでURLを見つけるかを示すことにも使用される。単一の項目が発見された場合、正規表現を構築するのに十分な情報が存在しないため、ルールライタは、「defer」ボタンをクリックする。多数の項目が発見された場合、正規表現が、データウィンドウ2010に入力される。例えば、一人の著者がいくつかの書籍を執筆している可能性があるため、著者検索では、多数の項目が戻る場合がある。別の場合では、クエリが一つの項目と一致した場合でも、情報を得るために追加のURLリンクを辿る必要がある場合もある。
【0092】
図21に例示するグラフィカルユーザインタフェース(GUI)2100が、次に現れ、多数の製品ページを検出するために使用される。ルールライタが検索するアイテムに直接進む場合、正規表現を構築するための情報は必要ない。再び図11を参照すると、コードウィンドウ1197には、検索したページからのHTMLコードが記入される。この時点において、ルールライタは、属性を指定する準備ができている。属性は、名前の隣のボックスに正規表現を入力することにより指定される。正規表現は、その中で一つのサブストリングを表現の結果として指定する必要がある(丸括弧を使用する)。例えば、正規表現「this(all)matches」は、その結果として「all」を戻すことになる(正規表現が一致可能であると仮定した場合)。例えば、書籍のタイトルを見つけるのに使用されるパターンを決定するには、ルールライタは、検索ウィンドウ1195に書籍のタイトルを打ち込む必要がある。様々なHTML信号を使用することができる。「\s」は、ワード間で可能なブランクスペースを示すために必要である。検索ウィンドウ1195に入力された検索ストリングの第一の一致により、HTMLコードで発見された第一の一致が強調表示される。例えば、タイトルは、何らかの追加情報と共に<title>タグのペアの中で発見される場合がある。書籍のタイトルの例示的な属性は、「<title>([^<])</title>」にすることができる。属性が入力された後、その属性に対するすべての一致が見出される。
【0093】
再び図14を参照すると、検索データエディタ1400は、タイプ依存属性に値を割り当てるために使用可能なフォームで構成される。ステータスウィンドウは、データ編成ツール1025が何を行っているかを示す。例示的な一実施形態の場合、ステータス状態はアイドルであり、インターネット上でクエリを実行し、キャッシュを使用している。クエリウィンドウ1140により、ルールライタは、問題のデータソースに関して望ましいクエリのタイプを設定し、SDEボタンを使用して検索基準を設定することができる。
【0094】
スパイダ選択ウィンドウ1130により、ルールライタは、クエリ検索を行っていない場合に使用するスパイダを設定することができる。例示的な一実施形態の場合、可能なスパイダタイプは、フルと、増分と、特別と、参照とである。フルスパイダは、選択したタイプと一致するすべての項目を取り出す。増分スパイダは、通常、インターネットデータソースからのデータの更新を拾い出すために使用される。特別スパイダは、通常、書籍のベストセラー等、サイトが有している特別な何かを拾い出すために使用される。参照スパイダは、通常、サイトが依然として稼働しており、ルールが機能していることを確認するために使用される。
【0095】
ベンダウィンドウ1120により、ルールライタは、作業対象のデータソースを設定することができる。検索ウィンドウ1195により、ルールライタは、HTMLコードにおいて検索するテキストを保持することができる。コードウィンドウ1197には、テキスト入力の位置を示すカーソルが存在する。左矢印セット1190は、第一の数を含み、これはキャッシュから実行する時に検索を実行する場所の開始点となる。第二の数は、キャッシュ内のページの合計数を示す。このウィンドウの矢印セットは、ルールライタがキャッシュから実行する時に開始するページを制御する。右矢印セット1180は、検索したページをスクロールする矢印を有する。
【0096】
スパイダは、クエリと似ているが、他のルールが適用できない時に呼び出される。スパイダは、指定されたタイプと一致するWebサイト内のすべてのオブジェクトに関する情報を収集する。スパイダは、いくつかのネスト化したループで構成され、各ループは階層の一レベル下へと進むように設計されている。次に図22を参照する。ここには、書籍スパイダに関する例示的なスパイダ階層2200が表示されている。レベル2210は開始ページであり、レベル2220は書籍カテゴリページを表し、レベル2230は書籍サブカテゴリページを表し、レベル2240は書籍ページを示す。
【0097】
図23を参照すると、グラフィカルユーザインタフェース(GUI)2300は、スパイダルールに関連するページのURLを検索するために使用される。スパイダ深度スライドルールにより、ルールライタは、実際の製品ページに到達するまでに下る必要があるリンクの数をデータ編成ツール1025に伝えることができる。上限スライドルールにより、ルールライタは、スパイダを使う項目数の制限を指定することができる。URLが選択され、スパイダ深度および上限が選択された後、ルールライタは、「done」ボタンをクリックする。図24に例示されるグラフィカルユーザインタフェース(GUI)2400が表示される。ルールライタは、使用するスパイダに関する検索パターンを、図11を参照して説明したクエリに関して入力した検索パターンと同じ方法で入力する。パターンが入力された後、ルールライタは、「build」ボタンをクリックし、スパイダは稼働し始める。
【0098】
図11乃至24を参照して表示および説明したグラフィカルユーザインタフェースにより、非エキスパートルールライタが、データ検索を実行し、情報検索に関するルールのフォームを作成することができることは、有利である。フォームが作成された後は、このフォームを何度も利用して、更新情報を収集することができる。更に、フォームは、ベンダによるWebサイト上の情報の配列および表示に対応した共通のフォームを使用して、ベンダのWebサイトで利用可能な大量の情報を検索するのに役立つ。非エキスパートによるルール作成のフォームが、Webサイトで利用可能な更新情報のコストを低減させることは、有利である。更に、このフォームが、インターネットからの情報の正確な検索を自動化することも有利である。
【0099】
図25は、データベース内の情報を融合する例示的なプロセスを表している。図25に示される例示的な一実施形態の場合、フローチャート2500は、誘導エンジン150(図2)によって実行される単純化した融合プロセス、または「クイックフュージョン」を表している。ステップ2510において、更新エンジン160は、ネットワーク20から情報を受領し、イグジスタントサブシステム140を介して、この情報をデータベース170内のイグジスタントデータ構造に置く。融合エンジン150は、データベース170にアクセスするイグジスタントサブシステム140を介して、更新エンジン160からイグジスタントへのアクセスを有する。ステップ2510が実行された後、ステップ2515が実行され、融合エンジン150は、ステップ2510において検索されたイグジスタントに対応する属性定義テーブルから正確な融合属性を収集する。ステップ2515が実行された後、ステップ2512が実行され、融合エンジン150は、データベース170で検索されたイグジスタントからの各融合属性の「マッシュ」を実行し、容易に比較可能なフォームにする。例示的な一実施形態の場合、「マッシュ」フォームでは、スペース、前置詞、およびその他の重要でないワードは取り除かれる。「マッシュされた」フォーマットが、迅速な検索能力をもたらすことは、有利である。
【0100】
ステップ2520が実行された後、ステップ2525が実行され、融合エンジン150は、データベースクエリを策定し、この中でデータソースは「同一」に設定され、ステータスは「カノニカル」に設定される。このクエリは、現在の情報と一致する同一のデータソースから、既に存在するカノニカルなイグジスタントを発見することを意図している。ステップ2525が実行された後、ステップ2530が実行され、データベース170内での一致が発見されたか否かが判断される。ステップ2525のクエリにより、データベース170内での一致が発見された場合、ステップ2535が実行され、データベース170に含まれるイグジスタントが更新される。
【0101】
ステップ2525のクエリからデータベース170内での一致が発見されなかった場合、ステップ2540が実行され、ステップ2525のクエリが、再策定され、データソースは「同一」に設定され、ステータスは「非カノニカル」に設定される。このクエリは、現在の情報と一致する同一のデータソースから、既に存在するイグジスタントを発見することを意図している。ステップ2540の後、ステップ2545が実行され、ステップ2540の再策定クエリからデータベース170内で一致が発見されたか否かが判断される。一致が発見された場合、ステップ2550が実行され、データベース170内のイグジスタントが更新される。
【0102】
データベース170内で一致が発見されなかった場合、ステップ2555が実行され、データソースが「任意」に設定され、ステータスが「カノニカル」に設定されたクエリが、再策定される。このクエリは、現在の情報と一致する任意のデータソースから、既に存在するカノニカルなイグジスタントを発見することを意図している。ステップ2555の後、ステップ2560が実行され、データベース170内での一致が発見されたか否かが判断される。データベース内での一致が発見されない場合、ステップ2565が実行され、データベース170にイグジスタントが追加される。
【0103】
データベース17内での一致が発見された場合、またはステップ2550が実行された後、ステップ2570が実行され、一致がシステムイグジスタントであるか否かが判断される。一致がシステムイグジスタントである場合、ステップ2575が実行され、このシステムイグジスタントが更新される。一致がシステムイグジスタントではない場合、ステップ2580が実行され、カノニカルなシステムイグジスタントが形成される。ステップ2580が実行された後、ステップ2585が実行され、データベース170にイグジスタントが追加される。ステップ2585の後、ステップ2590が実行され、融合テーブルが更新される。
【0104】
図25に例示されたデータベース内の情報を融合する例示的なプロセスが、多数のWebサイト上にある情報の比較を提供することは、有利である。このため、あるWebサイトが別のWebサイトと同じ情報を含んでいるか否かを判断することができる。更に、ボイスポータル10のデータベース170に含まれる情報には、インターネットベースソースからの情報、情報の関係、および情報の連関を継続的に追加可能であり、これはデータソースから検索された情報の有用性を大きくする。
【0105】
図26は、融合の例示的なプロセスに含まれるステップを示すフローチャート2600を表している。図26を参照して説明するこの例示的なプロセスにおいては、図25を参照して説明したフローチャート2500に示す融合プロセスよりも包括的な融合プロセスが表示されている。ステップ2610において、融合エンジン150は、データベース170から属性定義テーブルを読み出す。ステップ2610が実行された後、ステップ2615が実行され、融合エンジン150は、高度な融合を必要とする各イグジスタントタイプに関して融合制御言語を読み出す。ステップ2615が実行された後、ステップ2620が実行され、融合エンジン150が、融合ファイルを中間コンピュータコードにコンパイルする。ステップ2620が実行された後、ステップ2625が実行され、融合エンジン150が、以前に融合されたイグジスタントをメモリに保持する。ステップ2625の後、ステップ2630が実行され、融合エンジンは、属性を収集し、等価のセットにする。ステップ2630の後、ステップ2635が実行され、属性がテキストであるか否かの判断が行われる。融合エンジン150が、属性はテキストではないと判断した場合、ステップ2640が実行され、値が、インデックス化される。融合エンジン150が、属性はテキストであると判断した場合、ステップ2645が実行され、融合エンジン150は、属性の中に存在するサブストリングをインデックス化する。
【0106】
ステップ2645の後、ステップ2650が実行され、融合エンジン150は、テキストが構造化されているか否かを判断する。テキストが構造化されていないと判断された場合、ステップ2670が実行される。テキストが構造化されていると判断された場合、融合エンジン150は、ステップ2655において、テキストの構造セグメントの位置を特定し、これを分離する。ステップ2655の後、ステップ2660が実行され、融合エンジン150は、分離されたパートを解析し、意味情報を識別する。ステップ2660の後、ステップ2665が実行され、融合エンジンは、意味情報をインデックス化する。ステップ2665の後、ステップ2670が実行され、融合エンジン150は、妥当性チェックを実行し、データベース170の完全性を検証する。ステップ2670の後、ステップ2675が実行され、融合エンジン150は、融合するイグジスタントを検索する。
【0107】
ステップ2675の後、ステップ2680が実行され、融合エンジン150は、対応するイグジスタントタイプに関する融合基準およびマッチングプログラムを起動する。融合基準およびマッチングプログラムには、図10を参照して説明したように確立されたイグジスタントルールの使用が関係する。ステップ2680の後、ステップ2685が実行され、融合エンジン150は、融合基準およびマッチングプログラムから第一の融合ルールを実行し、すべての一致を戻す。ステップ2685の後、ステップ2690が実行され、許容できる一致が発見されたか否かの判断が行われる。例示的な一実施形態の場合、許容できる一致は、属性の所定のパーセンテージ(例えば、70%)が共通なものである。代替実施形態の場合、許容できる一致は、すべての属性が同じ値を有するものである。許容できる一致が発見された場合、ステップ2697が実行され、融合エンジン150は、イグジスタントを融合する。許容できる一致が発見されなかった場合、ステップ2691が実行され、次の融合ルールが実行され、すべての一致が戻される。
【0108】
ステップ2691の後、ステップ2692が実行され、許容できる一致が発見されたか否かの判断が行われる。許容できる一致が発見された場合、ステップ2697が実行され、融合エンジン150は、イグジスタントを融合する。イグジスタントの融合には、融合されるイグジスタントに関連し、かつその中にすべての情報を包含する新しいイグジスタントの作成が、含まれる。許容できる一致が発見されなかった場合、ステップ2693が実行され、最後のルールがテストされたか否かの判断が行われる。最後のルールがテストされた場合、ステップ2691が再度実行される。最後のルールがテストされていない場合、ステップ2694が実行され、融合エンジン150は、強い部分一致が存在するか否かを判断する。例示的な一実施形態の場合、強い部分一致とは、一致が特定のパーセンテージ、例えば、70%以内のものである。強い部分一致が存在する場合、ステップ2698が実行され、人間による検査が行われる。部分一致が発見されない場合、ステップ2695が実行され、融合エンジン150は、融合作成を拒否し、ステップ2699が実行され、新しいイグジスタントが作成される。
【0109】
図26に例示されるデータベース内の情報を融合する例示的なプロセスが、同一または異なるデータソースからの情報の自動比較を提供することは、有利である。このため、データベース170に含まれる情報は、継続的に更新し、他のデータソースからの情報との付加的相関性を与えることができる。更に、融合によって、インターネットで個別に利用可能な無数のデータベースより完全で堅牢な統一データベースの編纂が可能となる。
【0110】
図27は、二つのデータ構造からカノニカルなデータ構造を作成する例示的なプロセスを表している。データファイル2700は、固有の識別番号によって識別され、第一のデータファイル2710と、第二のデータファイル2720と、カノニカルデータファイル2730とを有する。例示的な一実施形態の場合、第一のデータファイル2710は、IMDB(「Interner Movie Data Base」)Webサイト(http://www.IMDB.com)から検索した特定の映画に関する情報を有する。第二のデータファイル2720は、Reel.com Webサイトから取得した特定の映画に関する情報を有する。図27に例示された例において、データファイル2710は、タイトル「Boys of Arizona」と、監督「Wiltz」と、公開年「1997」と、シノプシス「great movie」とを有する。同様に、データファイル2720は、タイトル「the Boys of Arizona」と、監督「Bob Wilts」と、公開年「1998」と、ブランクであるシノプシスとを有する。
【0111】
カノニカルデータファイルを作成するプロセス中には、特定のタイプの情報に関するルールを有するルールファイル2740が導入される。図27に示す例において、ルールファイル2740は、映画の属性に関する情報を含む。ルール2740の適用により、データファイル2710とデータファイル2720とから最も完全なタイトル、この場合はデータファイル2720からのタイトル「the Boys of Arizona」を取り出すことにより、クロニクルデータファイル2730が作成される。それが、監督のファーストネームおよびラストネームを含むのでデータファイル2710よりも完全であると言う理由から、監督情報は、データファイル2720から取得される。データファイル2710に記載の公開年とデータファイル2720に記載のものとに、不一致が存在する場合がある。事前の情報に基づいて、この不一致は解消され、データファイル2720がより正確な公開年を有することが示される。データファイル2720のシノプシスはブランクであるため、クロニクルデータファイル2730は、データファイル2710のシノプシスを含む。
【0112】
図27を参照して説明したクロニクルデータファイルを作成するプロセスにより、より完全で正確な情報を有するデータが作成されることは、有利である。更に、このプロセスによって、多数のWebサイト間での情報の比較が可能となる。更に又、クロニクルデータファイルを作成するプロセスによって、データファイル間の相関性および連関関係が増加する。
【0113】
図28は、Webから取得したデータを分離し、かつデータベースでの保存のためにそのデータを変換する間に実行される動作の機能図2800を表している。この例示的なプロセスには、ネットワーク20からのデータをデータが配列および編成されるデータ構造2810に抽出することが含まれる。例えば、交通情報に関するデータは、説明と、幹線道路と、交差路と、時間と、日付と、重大性の評価とに関する情報を有するように、インターネットから抽出することができる。データ構造2810は、データの配列および編成によりデータ構造2810にすることが可能なテキストパターンおよび記述を有するルール2815の使用によって、作成および編成される。データ構造2810は、データベース上のデータファイルに格納される。データ構造2810のデータには、データ構造2820を作成するために第一の用語置換フォームが適用される変換処理が行われる。ルール2825は、変換テーブルの語彙登録項を含め、データ構造2820を作成するために用語置換中に適用される。交通情報の例では、「Rd」は「road」に変換され、「I.」は「interstate」に変換され、「Rt.」は「route」に変換される。
【0114】
データ構造2820に含まれるデータは、その後、転送データに関する属性語句文法を適用するルール2835に従って、データ構造2830内の解析フォームの中に置かれる。交通情報の例において、北、西、南、および東のような「方角」が識別され、「interstate」または「highway」のような「道路識別子」が決定される。データ構造2830内のデータは、その後、用語配列ルール2845を適用することにより、データ構造2840内の再配列フォームに配置される。データ構造2840内のデータは、第二の用語置換フォームによって操作され、語彙変換テーブルからのルール2855を適用することにより、データ構造2850内に配置される。例えば、用語「St.」は、語彙変換テーブルにおいて、位置識別子<street st.>または<city st.>に基づいて、「street」または「saint」のいずれかに決定される。
【0115】
語彙変換が実行された後、データは、未融合の標準化されたタグ付きフォーマットで、データ構造2860に配置される。データ構造2860は、データベース2850に常駐することが、好ましい。標準化されたタグ付きフォーマットとは、データを容易に検索および比較可能な均一の編成とHTMLタグとを有するフォーマットを指す。多くの場合、HTMLタグは、データのタイプ、位置、および長さに関する情報を提供する。未融合とは、データが、図25および26を参照して説明した融合プロセスを通過していないことを意味する。
【0116】
図28を参照して説明したデータ分離プロセスが、Webからデータを取り出し、データベース内の標準化されたタグ付きフォーマットに変換することは、有利である。標準化されたタグ付きデータは、編成、操作、および融合のために作成される。このデータ分離プロセスが、均一であり、広範なデータソースからのデータで機能することは有利である。したがって、一般的には、このプロセスには、インターネットソースからデータを取得することと、取得したデータにより第一のフォーマットで第一のデータファイルを作成することと、語句が特定のインタフェースに関連する第二のフォーマットになるように、取得データから語句を生成することとが、含まれる。取得データを第一および第二のフォーマットに変換するためには、広範なアプリケーションを使用することができる。例えば、テキストパターンと、語彙変換テーブルと、属性語句文法と、用語配列ルールとを使用して、取得データを、データベース内のデータファイルにセーブされる均一で検索可能なフォーマットに変換し、その後、セーブデータをインタフェース固有フォーマットに変換することが可能である。代替実施形態の場合は、その他のパターン、テーブル、ルール、およびデータ操作アプリケーションを使用することができる。
【0117】
図29は、何らかのユーザインタフェースプラットフォーム(WAP、Web、電話、ASR、TTF等)を介した、データベース170からボイスポータル10のユーザに対するデータの変換を示す機能図2900である。(図29にも表示される)データ構造2860に含まれるデータは、標準化されたタグ付きデータに関する属性語句文法を有するルール2915を適用することにより、データ構造2910内の解析フォームの中に置かれる。属性語句文法は、標準化されたタグ付きデータを取り出し、識別された属性を有する知覚可能な語句を作成する。データ構造2910からのデータは、その後、語彙登録項変換テーブルを有するルール2920を使用して、用語置換フォームを適用することにより、データ構造2920内に配置される。例示的な一実施形態の場合、ルール2920の語彙登録項変換テーブルは、特定のインタフェースに対応するデータ出力構造を列挙する。例えば、用語「route」は、WAPアプリケーションに関しては「Rt.」に変換され、発話を使用した電話アプリケーションに関しては「Route」に変換される。同様に、用語「U.S.」は、WAPアプリケーションに関しては「U.S.」に変換され、発話を使用した電話アプリケーションに関しては「you ess」に変換される。
【0118】
データ構造2920からのデータは、ルール2935を適用することにより、データ構造2930内の再配列フォームに配置され、使用される出力デバイスに応じて用語交換ルールが適用される。用語再配置ルールは、様々なユーザインタフェースに最も適合する配列に用語を移動させる。データ構造2930内のデータは、その後、データ構造2940内に配置され、語句生成文法を有するルール2945を適用することにより、文が生成される。例えば、「<幹線道路>の<交差点>と<交差点>との間で<重大性>の交通事故が発生」という文を生成することができる。データがデータ構造2940のフォーマットになった後、WAP、Web、電話、およびASRのような様々な出力インタフェース向けに準備が行われる。
【0119】
図29を参照して説明したデータ変換プロセスが、データを取り出して、広範なユーザインタフェース向けに準備を行う均一なプロセスであることは、有利である。例えば、このプロセスでは、Webソースからデータを抽出し、意味的に識別し、発話インタフェースを介した発話伝送向けに準備することができる。同時に、このプロセスでは、同じデータをWAPデバイスまたはWebアプリケーションへの伝送向けに準備することができる。
【0120】
図30乃至33は、ユーザとボイスポータル10との間の例示的な対話を具体的に示すいくつかの動作経路を表している。ユーザインタフェース110は、図32乃至33を参照して説明されるように、ユーザに適切な発声をさせるために、明示的な指示を使用することが好ましい。
【0121】
図30は、ボイスポータル10の様々な機能を示すプロセスブロックを有する、例示的なシステムの概要を示すフロー図3000である。例示的な実行経路において、ブロック3010では、ボイスポータル10は「Quackへようこそ、アメリカンエキスプレスが提供します」と話すことによりユーザを迎える。ボイスポータル10は、ユーザを識別する手段として発信者IDを使用することが好ましい。好適な実施形態の場合、電話番号は、データベース170内の顧客属性として格納される。または、電話番号は、顧客データベースに格納される。ボイスポータル10は、続いて、「こんにちは、スティーブ・ウッズ。PINを発声するか、テンキーを使ってそれを入力してください。あなたがスティーブではない場合は、あなたの電話番号を発声するか、それを入力してください」と述べる。ユーザは、口頭で「5082」と応答し、自分のPINを伝える。認証が行われた後、ボイスポータル10は、ブロック3020へ進む。ブロック3020では、ボイスポータル10は、「あなたはQuackのランウェイにいます。次のリストの中で関心のあるカテゴリの名前を言ってください。映画、天気、交通、株式、スポーツ」と知らせる。ユーザは、カテゴリ名または別れの言葉で応答する。カテゴリ名が提供された場合、ボイスポータル10は、ブロック3030へ進む。別れの言葉が与えられた場合、ボイスポータル10は、ボイスポータル10を正常に終了させる。例示的な応答において、ユーザは「天気」と言い、ボイスポータル10はブロック3030へ進む。ブロック3030では、ボイスポータル10は、「Weatherへようこそ、Weather Channelが提供します」と言い、ブロック3040へ進む。ブロック3040では、識別固有イグジスタントサブシステムが実行される。
【0122】
ブロック3040の後、ブロック3050が実行され、ブロック3040の識別固有イグジスタントサブシステムにおいて、イグジスタントが発見されたか否かに関して判断が行われる。イグジスタントが発見されない場合、制御は、ブロック3030に戻る。イグジスタントが発見された場合、ブロック3060が実行され、(図33を参照して説明される)発見されたイグジスタントサブシステムが実行される。
【0123】
次に図31を参照すると、ブロック3040(図30)において実行される識別固有イグジスタントサブシステムは、データベース170が現在の垂直的ドメイン(例えば、天気、交通、映画)に関する属性依存グラフからの属性を提供するブロック3110を含む。属性依存グラフに属性がなくなった場合、制御はブロック3115に移行し、ここでイグジスタント検索が失敗したことが記録される。ブロック3115の後、制御はブロック3030(図30)に移行する。ブロック3110(図31)の後、ブロック3120が実行され、データベース170によって提供された属性値セットから、属性語彙が構築される。ブロック3120が実行された後、ブロック3130が実行され、ボイスポータル10は、属性値プロンプトに対するユーザの応答を得るために、方法Nに続いて自動言語認識(ASR)技術を使用する。例えば、ボイスポータル10は、例示的な方法Nの例として、郵便番号によってユーザの場所を要求することが可能である。ユーザは、「53045」等、自分の郵便番号を伝えることにより応答できる。
【0124】
ブロック3140では、音声認識が成功したか否かについて判断が行われる。成功していない場合、予備方法N+1に続くASR技術により、ブロック3130が実行される。例えば、天気の垂直的ドメインにおいて、予備方法N+1は、ユーザの居場所である州と都市をたずねることにできる。好適な実施形態の場合、予備方法は、リストから属性を選択することと、属性値セットを区切りスペースで制約すること(例えば、州を取得した後、都市名を取得する)と、属性値のスペリングを行うこととが含まれる。音声認識が成功すると、ボイスポータル10は、取得された属性によりデータベース170を検索するブロック3150が実行される。ブロック3150が実行された後、フローチャート3200(図32)が実行される。
【0125】
図32を参照すると、フローチャート3200は、識別固有イグジスタントサブシステムの一部を表している。ブロック3150が実行された後(図31)、データベース170の検索により一致したイグジスタントの数を決定するためにブロック3210が実行される。製品データベースの検索において発見された一致の数に応じて、様々な行動が行われる。一致が発見されなかった場合、ブロック3220が実行され、複合固有キーを探すか否かについて判断が行われる。データベース170には含まれないが、インターネット上で望ましい項目を発見するのに使用することが可能な一つ以上の固有キーまたは識別子がある場合、複合固有キーが存在する可能性がある。
【0126】
一致が一つ発見された場合、ブロック3230が実行され、ボイスポータル10は、一致が正しいイグジスタントであるかを検証する。一致の数が1より大きいが、リストの最大数より少ない場合、ブロック3240が実行され、ユーザは、一致のリストからイグジスタントを特定するように要求される。リスト内で可能な登録項の最大数より多くの一致が発見された場合、ブロック3250が実行され、その属性が「拡張可能」であるか否かが判断される。言い換えれば、その属性について更に多くの情報を提供可能であるか否かについて判断が行われる。情報を更に提供できない場合、制御はブロック3110(図31)に戻り、属性依存グラフから別の属性が取得される。属性が拡張可能である場合、ブロック3260が実行され、属性の拡張が試みられる。属性を拡張できる場合、制御はブロック3120(図31)に移行し、語彙セットが構築され、属性値を取得するためにASR技術および方法が使用される。属性を拡張できない場合、制御はブロック3110(図31)に移行し、属性依存グラフから別の属性が取得される。属性の拡張により項目のリストが生じた場合、制御はブロック3240に移行する。
【0127】
次にブロック3220で実行されるクエリを参照すると、WWW検索に使用する複合固有キーが存在しないと判断された場合、制御は、ブロック3110(図31)に移行する。複合固有キーが存在する可能性があると判断された場合、制御は、ブロック3270に移行し、WWWを検索するか否かの判断が行われる。WWWを検索しない場合、制御は、現在の垂直的ドメインの最上レベルであるブロック3030(図30)に移行する。WWWを検索する場合、制御はブロック3280に移行する。次にブロック3230およびブロック3240を参照すると、正しいイグジスタントが発見された場合、または正しいイグジスタントがリストから発見された場合、制御は、ブロック3280に移行する。ブロック3230およびブロック3240において正しいイグジスタントが発見されなかった場合、制御はブロック3220に移行し、項目を発見するために検索を継続することが可能な複合固有キーが存在するか否かが判断される。ブロック3280では、Webルックアップが実行される。この時点で、顧客には、様々な長さのターゲット広告を提示することができる。広告については、図36を参照して更に詳しく説明される。ブロック3280中、ブロック3060が実行され、発見されたイグジスタントサブシステムが実行される。
【0128】
図33を参照すると、発見されたイグジスタントサブシステムは、発見された項目の顧客データベースにログが作成されるブロック3310を含む。好適な実施形態の場合、顧客データベースは、データベース170に含まれる。ブロック3310の後、ブロック3320が実行され、データベース170の情報から、垂直的ドメインに適した提示のために、情報が準備される。ブロック3320の後、ブロック3330が実行され、関連情報およびコマンド文法が構築される。例えば、映画の垂直的ドメインにおいて、特定の劇場での映画上映のリストが再生される場合、文法には、ユーザが特定の映画に関する詳しい情報を要求できるように映画のタイトルが含まれることになる。
【0129】
ブロック3340では、ユーザから情報が戻される。好適な実施形態の場合、受け入れ可能なコマンドとして可能なものには、更に詳しい情報を聞くためのコマンドと、特定のソースからの情報を聞くためのコマンドと、関連情報(例えば、より安価、より良質)を聞くためのコマンドと、垂直的ドメインに適した行動(例えば、入札額の増加、場所の変更)を行うためのコマンドとが含まれる。ブロック3340の後、ブロック3350が実行され、次の活動が取得される。新しい垂直的ドメインが望まれる場合、制御は、ブロック3020(図30)に移行する。現在の垂直的ドメインの最上部から新たに選択することが望まれる場合、制御は、ブロック3030(図30)に移行する。新しいイグジスタントが望まれる場合、制御は、ブロック3040(図30)に移行する。
【0130】
再び図32を参照すると、ブロック3280が実行された後、ブロック3290が実行され、データベース170を更新することによりWebルックアップの結果が調整される。ブロック3290でのWeb結果の調整中、ブロック3295でスマート遅延処理を実行することが可能である。ここでは、広告、または遅延を処理するその他の形態が、実行される。ブロック3295でのスマート遅延処理は、顧客データベースおよび広告データベースからの情報を使用する。好適な実施形態の場合、顧客データベースおよび広告データベースは、データベース170のサブセットである。代替実施形態の場合、顧客データベースおよび広告データベースは、物理的に別個のデータベースである。
【0131】
動作において、本明細書で説明するインターネットからの情報への音声アクセスに関するシステムおよび方法は、顧客が関心のある垂直的ドメイン(映画、ショッピング等)を特定し、その後、垂直的ドメインにおいて可能なあらゆる事柄の範囲からのユーザの応答を、消費者がもとめる事柄の一つまたはセットへと「ファンネリング」することは、有利である。この垂直的ドメイン内でのファンネリングは、特定の項目へのファンネリングを行うために事前に定義された「経路」に従った、製品またはサービスの属性に関するユーザへのシステムの指示による質問に関係する。経路は、確認および具体化する製品に関する制約の順序付けに関して定義される。
【0132】
図34は、ボイスポータル10がユーザの応答をファンネリングすること、およびユーザの応答の音声認識において非常に高い精度を達成することを可能にするファンネリングプロセスのフロー図3400である。ステップ3410において、ユーザは、ボイスポータル10に電話をする。ステップ3410の後、ステップ3415が実行され、上で説明した可能である様々な方法を使用して、発信者が識別される。ステップ3415の後、ステップ3420が実行され、ユーザは、垂直的関心ドメインを選択する。次に、ステップ3425が実行され、選択した垂直的関心ドメインに対する属性ファンネリング特性が開始される。ステップ3425の後、ステップ3430が実行され、ボイスポータル10は、この垂直的関心ドメインにおいてユーザが嗜好を有するか否かを判断する。嗜好が存在し、ユーザがこれを無効にすることを望まない場合、制御はステップ3460に移行し、品目またはサービスが、ユーザの嗜好に基づいて発見されたものとして示される。
【0133】
利用可能な嗜好がない場合、またはユーザが自分の嗜好を無効にした場合、ステップ3435が実行され、属性語彙セットが構築される。語彙セットにより、ボイスポータル10が、限られた数の可能な応答を有し、この中のものを垂直的関心ドメインにおけるこの時点でのユーザの応答の音声認識に使用することができることは、有利である。定義済みの語彙セットにより、ボイスポータル10が、高い認識率で従来の音声認識技術を達成することは、有利である。例えば、ユーザがメジャーリーグベースボール(MLB)チームを選択し、MLBチームに関して考えられる要求の語彙セットが構築された後、「Brewers」という用語は認識が容易になる。こうした語彙セットは、同じ情報に関する様々な異なるタイプのユーザ入力を有することができる。例えば、MLBチームの例において、語彙セットは、MLBチームに関連するすべての都市または州名と、MLBチームのマスコットとを有することができる。したがって、「Milwaukee」および「Brewers」は、両方ともMLBチームの語彙セットの一部となる。
【0134】
適切な語彙セットが構築された後、ステップ3440が実行され、ボイスポータル10は、属性に関するクエリを行う。例えば、「どのメジャーリーグベースボールチームについて聞きたいですか?」等である。ステップ3440の後、ステップ3445が実行され、属性が特定される。属性が特定されない場合、ステップ3447を実行し、属性の特定に関する予備手順を実施することができる。ステップ3450において、ボイスポータル10は、「最終状態」つまり項目又サービスが発見されたポイントに達したか否かについて判断する。「最終状態」に達していない場合、ステップ3455が実行され、次の属性がアクセスを受け、制御はステップ3430に戻る。上の野球の例では、チーム名のみでは最終状態に到達しない。最近の試合結果、選手の統計データ、チームの順位、またはその他の関連情報のような、その他の「更に狭い」属性が要求される必要がある。ステップ3460が実行された後、ステップ3465が実行され、発見された項目またはサービスが、ユーザに報告される。
【0135】
例示的な一実施形態の場合、ユーザは、以下の方法で項目を選択する。ユーザは、第一に、関心ドメイン(例えば、e−コマース、交通情報、天気情報、映画、その他)を指定する。ユーザは、次に、項目の属性を指定することにより、項目(例えば、書籍、玩具、交通情報について関心のある路線、天気情報について関心のある都市、その他)を選択する。その後、ユーザは、項目のドメイン(例えば、製品、交通、天気、映画、その他)に応じて、特定項目に関する詳細な情報が提供される。例えば、e−コマースの関心ドメインのレビューにおいては、価格、運賃、および可用性を有するベンダ情報が利用可能である。映画の関心ドメインにおいては、監督、プロデューサ、およびキャストが提供される。オークションの関心ドメインでは、未決定の入札が利用可能となる。
【0136】
ユーザが、現場を特定する多数の方法(例えば、郵便番号、町名、都市エリア「ボストン北部、西部」、その他)を用い、現場によって情報を要求することができることは、有利である。例示的な一実施形態の場合、郵便番号の周囲で位置を特定する戦略が使用され、これには、近郊の名前をたずねることと、都市、更には州へと後退することと、その後、再びズームインすることとが含まれる。例示的な一実施形態の場合、ユーザには、要求に応じて、情報が前回更新された日付と時間が、提供される。ユーザに提示されるすべてのデータは、そのドメインに適した現在性のものであることが、好ましい。ユーザには、「純粋な」ソースの情報または単独のソースからの情報について、情報のソースが通知される(「XXXXX提供」)。好適な実施形態では、あらゆる選択ポイントにおいて、「ヘルプ」または「使用説明」のオプションを利用することができる。
【0137】
ユーザは、そのドメインに応じて、項目属性に基づいた項目の比較を要求することができる。ユーザは、そのドメインに応じて、「より安価」な項目、「より良質」な項目、および「関連」する項目の特定を要求することができる。ユーザが、その関心ドメインに応じて、多数のユーザ定義リストに、項目を明示的に記録することができることは、有利である。ユーザは、自分のリストから項目を再調査することができる。ユーザは、自分のリストの項目に関して、(そのドメインに応じて)情報の変化を電話または電子メールで通知することを要求できる。
【0138】
図35は、ボイスポータル10を使用してトランザクションを実行する例示的なプロセスのフロー図3500を表している。ステップ3510において、ユーザは、ボイスポータル10にアクセス(電話または発信)する。ステップ3510の後、ステップ3515が実行され、ユーザが望んでいる品目またはサービスを特定するために、ファンネリングプロセスが実行される。こうしたファンネリングプロセスは、図34を参照して説明した、フロー図3400に例示する動作を実行する。
【0139】
ステップ3515の後、ステップ3520が実行され、ボイスポータル10は、ユーザに対して、特定した品目またはサービスに関連する希望のトランザクションを指定するように求める。ステップ3520が実行された後、ステップ3525が実行され、ボイスポータル10は、指定されたトランザクションを実行するために、適切なボイスポータルルールを特定する。ステップ3525の後、ステップ3530が実行され、指定されたトランザクションを実行するために、このルールが実行される。トランザクションには、品目またはサービスを購入すること、オークションに入札すること、または他の任意のインターネット上で可能なタイプのトランザクションを含めることができる。ステップ3530の後、ステップ3535が実行され、ボイスポータル10は、トランザクションの結果を記録する。好ましくは、この結果は、データベース170に記録される。ステップ3535の後、ステップ3540が実行され、トランザクションは、ユーザに報告される。
【0140】
様々なトランザクション(入札、鑑賞、購入、追跡)が、様々なドメインに対し適切となる。例えば、e−コマースの関心領域において、ユーザは、選択したベンダから特定した製品を注文することができる。更に、ユーザは、後の時点で購入するために、品目をショッピングカートに追加することができる。ユーザは、注文時、請求するクレジットカードおよび届け先住所を(ユーザプロフィールから、または手動で)指定することができる。ユーザは、更に、以前に注文した製品に関するステータス情報を要求することもできる。別の例として、オークションの関心ドメインでは、ユーザは、既存の入札を増額することが可能であり、またはユーザは、新しいオークションに入札することができる。
【0141】
ボイスポータル10を使用してトランザクションを実行するプロセスでは、ユーザが、コンピュータ上での手動作業を行う必要が、全くないことは、有利である。ユーザは、マウスをクリックすること、コンピュータキーボードのキーを押すこと、または他の任意のコンピュータインタフェースによる手動作業(マウスクリック、キーボード入力等)を行うことなく、品目を購入し、入札を行い、または他の任意のインターネットトランザクションを行うことができる。したがって、図35を参照して説明したプロセスは、「ノークリック」インターネットトランザクションプロセスにすることができる。ユーザは、電話のタッチパッドを利用することが可能であり、更に「ノークリック」インターネットトランザクションを実行することもできる。
【0142】
図36Aは、ボイスポータル10を使用して広告する例示的なプロセスのフロー図3600Aを表している。広告サブシステム120が、特定のユーザにどの広告を再生するかを決定する方法を有することは、有利である。一般に、この方法は、ユーザの人口統計データ、場所の人口統計データ、および現在の垂直的関心ドメイン等、コンテクストに基づいた選択制約の設定に関係する。選択制約が設定された後、この方法では、この制約に基づいて広告データベースをクエリし、可能な広告のリストを検索する。可能な広告のリストは、各広告の販売基準に基づいて再順序化される。広告は、この再順序化リストから選択され、ユーザに提示される。
【0143】
フロー図3600Aを参照すると、ステップ3610Aにおいて、ボイスポータル10の広告サブシステム120は、ユーザに提示する広告に関する選択制約を設定する。一実施形態の場合、この選択制約は、ユーザの人口統計データ、場所の人口統計データ、および現在選択されている垂直的関心ドメイン(存在する場合)のようなユーザ中心情報と、広告の販売基準、反復の欠如、およびその他の広告有効性要素のような広告中心情報とに基づく。こうした制約または基準は、紹介用スポンサシップ広告、垂直的スポンサシップ広告、およびコマーシャル広告のような、様々なタイプの異なる広告からの選択において使用される。ステップ3610Aの後、ステップ3615Aが実行され、データベース170は、ステップ3610Aにおいて選択された制約に基づく可能な広告のリストに関してクエリされる。
【0144】
ステップ3615Aの後、ステップ3620Aが実行され、可能な広告のリストは、販売基準要素に基づいて、再順序化される。一実施形態の場合、販売基準は、 (1)この広告に関して、広告配信率は達成されたか? (2)この広告に関して、ターゲット配信最低限度は達成されたか? を判断するために使用される。販売基準が、各広告顧客が配信に関する要件を満足させる状態を確保するために使用されることは、有利である。一実施形態の場合、どれを最初に配信するべきかと言う広告の優先順位を定めるために、比率が計算される。
【0145】
以下に、広告をどのように順序化するかの決定要素として比率を使用する例が、提供される。広告Xは、その契約において、100,000回の配信が必要である。ボイスポータル10は、既に広告Xを7,000回、配信している。契約の開始日は5月10日で、終了日は6月7日である。現在の日付は、5月15日とする。したがって、例示的な比率は、以下のように決定される。
・契約開始からの経過日数 = 5日。
・契約の長さ = 27日間。
・広告を再生する必要がある日数 = 22日。
・再生された広告のパーセント = 7,000/100,000〜 = 7%。
・既に再生した日数のパーセント = 5/27〜 = 18.5%
このため、この例示的な最終比率は、次のようになる。
(既に再生した日数の%−再生された広告の%)/契約の残り日数
この比率が、早く再生するべき広告を明らかにし(小さい分母→高い比率)、既に再生された広告の差異が、低い比率により押し戻されることは、有利である。
【0146】
可能な広告のリストが再順序化されるステップ3620Aの後、ステップ3625Aが実行され、広告が選択される。一実施形態の場合、広告は、可能な広告のリストで得られる最高の比率に基づいて選択される。ステップ3625Aの後、提示される広告のタイプに応じて、様々な行動が行われる。ステップ3630Aにおいて、利用可能な広告が存在せず、広告タイプが紹介用スポンサシップ広告である場合、ステップ3635Aにおいて例外が生じる。これ以外の場合には、ステップ3640Aが実行され、広告が利用可能か否かについて、判断が行われる。利用可能な広告が存在する場合、ステップ3645Aが実行され、広告が再生される。利用可能な広告が存在しない場合、ステップ3640Aが実行され、選択制約がリセットされ、制御はステップ3620Aに戻る。
【0147】
各タイプの広告には、プロセスステップに違いがある。これには、紹介用スポンサシップ広告と、垂直的スポンサシップ広告と、コマーシャル広告との三タイプが存在する。以下は、紹介用スポンサシップ広告を選択する例示的プロセスである。
1. 紹介用スポンサシップ広告タイプに関して、場所に基づいた選択制約を設定する(垂直領域は適用されないため、垂直領域は使用しない)。
2. 制約に基づいてデータベースをクエリし、結果は、再生が可能な広告のリストに変換される。
3. 販売基準に基づいてリストを再順序化する。
4. リストから最高の比率を有する広告を選択する。広告はデータベースに存在する必要があり、そうでない場合には例外を発生させる。
【0148】
以下は、垂直的スポンサシップ広告を選択する例示的なプロセスである。
1. 垂直的スポンサシップ広告タイプに関して、ユーザの人口統計データ、場所の人口統計データ、および垂直タイプに基づいて制約を設定する。
2. 制約に基づいてデータベースをクエリし、結果は、再生が可能な広告のリストに変換される。
3. 販売基準に基づいてリストを再順序化する。
4. 利用可能である場合、リストから最高の比率を有する広告を選択し、ユーザインタフェースに戻す。
5. 利用可能なものがない場合、垂直タイプのみに基づく選択制約をリセットし、Quackのプロモーションのみに関するものとなるように垂直スポンサシップのタイプを設定する。
6. 販売基準に基づいてリストを再順序化する。
7. 利用可能である場合、リストから最高の比率を有する広告を選択し、ユーザインタフェースに戻す。
8. ユーザがリストからのすべての広告を聞いた場合、ユーザに対して最後に再生された広告に戻る。何らかの理由でリストが空であり、利用可能な広告がない場合、例外を発生させる。
【0149】
以下は、コマーシャル広告を選択する例示的なプロセスである。
1. コマーシャル広告タイプに関して、場所の人口統計データ、顧客の人口統計データ、および垂直タイプに基づいて選択制約を設定する。
2. この制約に基づいてデータベースをクエリし、結果は、再生が可能な広告のリストに変換される。
3. 販売基準に基づいてリストを再順序化する。
4. 利用可能である場合、リストから最高の比率を有する広告を選択し、ユーザインタフェースに戻す。
5. 利用可能なものがない場合、垂直タイプのみに基づく選択制約をリセットし、Quack(つまり、ボイスポータルシステム)コマーシャルまたは(入力されたタイプに関係なく)有料コマーシャルのいずれかに関するものとなるようにコマーシャルのタイプを設定する。
6. 販売基準に基づいてリストを再順序化する。
7. 利用可能である場合、リストから最高の比率を有する広告を選択し、ユーザインタフェースに戻す。
8. ユーザがリストからのすべての広告を聞いた場合、最後の広告に戻る。何らかの理由でリストが空であり、利用可能な広告がない場合、例外を発生させる。
【0150】
次に図36Bを参照すると、フローチャート3600Bは、ボイスポータル10を使用して広告する第二の例示的なプロセスを表している。ステップ3610Bにおいて、ユーザは、ボイスポータル10にアクセス(電話または発信)する。ステップ3610Bの後、ステップ3615Bが実行され、ユーザを識別するためにユーザルックアップが実行される。発信者の識別は、様々な方法で実行可能であり、その一部については、図2および30を参照して既に説明した。ステップ3615Bの後、ステップ3620Bにおいて、ユーザがボイスポータル10にとって既知であるか否かについて判断が行われる。ユーザが既知でない場合、ステップ3625Bが実行され、そのユーザにデフォルトのプロフィールが使用される。例示的な一実施形態の場合、デフォルトのプロフィールは、特定の広告に関するユーザ制約または制限を含まない。デフォルトプロフィールは、例えば、ユーザの市外局番、発信の日時、曜日、およびその他のような、その発信に関して既知である特定のパラメータに合わせることができる。ユーザが既知である場合、またはステップ3625Bが実行された後、ステップ3630Bが実行され、広告サブシステム120は、現在のユーザに特有のユーザ制約を含め、インタフェース(例えば、発話、WAP、WWW)のタイプに基づく広告セット「S」を生成する。
【0151】
現在の動作コンテクスト(例えば、特定のユーザ、垂直的関心ドメイン)受けて、ステップ3635Bにおいて、広告サブシステム120は、広告コンテクストに基づく広告セットSの加重を生成する。ステップ3635Bの後、ユーザが最も求めているものを正確に知る上でコンテクストが十分か否かを判断するために、ステップ3640Bが実行される。コンテクストが十分ではない場合、ステップ3645Bが実行され、取得された部分的なコンテクストに基づいて広告が選ばれる。コンテクストが十分である場合、ステップ3650Bが実行され、最も適合する広告が再生される。
【0152】
広告サブシステム120が、すべての発信者に初期一般広告またはスポンサシップメッセージを提供することは、有利である。広告サブシステム120は、更に、ドメインに適した効用関数に基づいて、ユーザにターゲット音声広告を提供する。例示的な一実施形態の場合、この効用関数は、広告される製品またはサービスの可用性と、現在の品目の相関性(例えば、DVDはテレビに関係する)と、(例えば、人口統計データによる)ユーザとの関与度と、広告主にとってのユーザの望ましさと、(例えば、コスト/収益に基づく)サービスプロバイダにとっての価値とに関する。広告サブシステム120が、特定の時間枠の中で特定の数の広告をユーザに配信することができることは、有利である。更に、広告サブシステム120は、ワイヤレスアプリケーションプロトコル(WAP)、WWW、および発話インタフェースのような様々なプラットフォーム上で広告を配信することができる。
【0153】
発話インタフェースプラットフォームを例として取り上げると、最初の1分以内に、一つのスポンサシップ広告と一つのターゲット広告とがユーザに配信される。その後の各40秒間以内に、第二のターゲット広告が配信される。一実施形態の場合、スポンサシップメッセージは、3乃至5秒間で処理され、その後、ターゲット広告には10乃至20秒間を要する。
【0154】
この構造の実施は、システムに入った時点で紹介用スポンサシップ広告が提示される事実に基づいている。ユーザが垂直領域に入るたびに、ユーザには「垂直的スポンサシップ」が知らされる。ユーザが要求したデータを受領しようとする時点で、完全なコマーシャルがユーザに提示される。このモデルが、情報の断片を受領する前にユーザが40秒間に渡って検索し続けると予測されるため、以前に記載したスケジュールに近いものとなることは、有利である。
【0155】
広告コンテクストにおいては、広告の提示時に更に詳細な情報を配信するために、「スピークスルー」が要求される。スピークスルーが、発話インタフェースだけでなく、WAPおよびWWWの両方にも適用されることは、有利である。WAPでは、発話およびテキストをスピークスルーとみなすことが可能であり、一方、広告に関する詳細を見つけるためにバナーをクリックすることが、WWWでのスピークスルーとなる。音声対話でのスピークスルーの一実施形態は、顧客にWebサイトのアドレスまたは電話番号を示すことによりある。代替実施形態の場合、スピークスルーでは、電子メールアドレスまたは顧客の電話番号を取得し、広告主に提供し、詳細な関連情報を顧客に送る。WWWインタフェースにより、スピークスルーは、顧客情報を管理および検査するためにことを含むことができる。広告サブシステム120が、ドメイン(例えば、WWWインタフェース)に適した効用関数に基づいて選択したターゲット「バナー」広告をユーザに提供することもできることは、有利である。
【0156】
広告サブシステム120の広告配信の管理は、いくつかの要素の組み合わせに基づく。例示的な一実施形態の場合、広告は、三種類の箇所のいずれかで配信される。第一に、広告は、ユーザが新しいセッションを開始するためにシステムに入る準備をしている時に配信することができる。このスポンサメッセージは、ユーザインタフェース110の音声または「システムボイス」となり、いくつかの代替可能な広告スポンサで回転させるべきである。例えば、スポンサメッセージは、「Quackは、Webの通貨、Visaが提供します」または「Quackは、携帯電話サービスの確かな未来、SprintPCSが提供します」とすることができる。
【0157】
第二に、別のスポンサシップ広告(「垂直的スポンサシップ広告」)は、映画、交通、または天気のようなシステムの特定の垂直領域にユーザがアクセスする直前に配信することができる。例えば、こうした広告は、「映画情報の世界的権威、IMDBが提供します」および「LCE Sony Metreon:ボストンで映画ならここしかありません」とすることができる。
【0158】
第三に、広告は、ユーザが精緻化された要求を受領する直前に配信することができる。このタイプの広告は、「コマーシャル」として定義される。こうした広告は、時宜に適っているが(つまり、選ばれたポイントで配信されるが)2分毎のような頻度で時折配信されるのみである。有利なことに、システムボイスは、役に立つ可能性がある、ユーザにとって付加価値のある状況を示すことができる。例えば、ユーザが特定の劇場での映画を選択した時、近くのレストランを提案することができる。ここでは、好ましくは、スピークスルー広告が使用され、ただし、非スピークスルー広告も可能である。広告コンテンツ自体は、好ましくは、約7秒の長さである。スピークスルー広告は、好ましくは、可能な最高品質のもの(つまり、プロが制作したもの)であり、好ましくは約15乃至20秒の長さである。例えば、ユーザがLCE Sony Metreonでの映画としてアメリカンビューティーを選択した場合、システムボイスは「Sony Metreonの上映リストを調べてしています...Sony Metreonから僅か5分のボストンで一番のイタリア料理店’Tony’s Matriciana’について聞きたい場合は、「Tony’s!」と言ってください。または、リストをお待ちください」と言う。ユーザは、その後、自動的に予約を入れることができる。その他の相関性属性を、ターゲット広告に使用することもできる。広告が、垂直指定要求を行う際には広告を配信するだけの時間量が必要になるという現在の仮定により、こうした様々なスポットで配信されることは、有利である。
【0159】
こうした問題と共に、ユーザにどの広告を配信するかについて判断が行われる。この判断に組み込まれる要素には、通話の長さと、どのタイプの垂直的コンテンツが要求されたかと、コンテンツおよびユーザプロフィール(および/または場所)の組み合わせ(つまり、レストランの広告は顧客の地元で行うべきである)と、潜在的な収入と、特定の情報を要求する発信者と、その広告をユーザが既に聞いているかとが含まれる。例示的な一実施形態の場合、広告は、以下の要素、つまり、この広告が最後に再生されたのはいつか? ユーザが、今回の通話の前に、この広告を最後に聞いたのはいつか? ユーザが、この広告を今回の通話で既に聞いているか? この広告に関して、広告配信率は達成されているか? この広告に関して、ターゲット配信最低限度は達成されているか? に基づいて回転する。
【0160】
広告が、提示が特定の顧客に適したものとなり、請求料率に応じて追跡されるような形で配信されることは、有利である。したがって、各広告を管理するために、その広告が再生された回数および個々のユーザがその広告を聞いた回数のような特定の基本データが収集される。
【0161】
その上、この基本データを与えることにより、以下の更に複雑なクエリが利用可能となる。例えば、クエリは、名前、人口統計情報、場所、および相関性情報(そのユーザが他に何を要求したか)のような様々な定義グループの中で広告を聞いたすべてのユーザの報告を作成する能力を有することができる。クエリは、更に、スピークスルー情報を要求したすべてのユーザの報告を作成する能力を有することができる。
【0162】
ボイスポータル10の他の動作モード中に可能となるバージイン(つまり、広告を再生中に停止すること)の能力は、広告の提示している間には、無効にすることができる。広告主が、ボイスポータル10を通じて与えられ広告に関して取得されたデータについて確信を持てることが必要であるという点において、バージインを阻止する能力は、重要である。一実施形態の場合、この広告データの収集は、第三者の監査人によって行われる。
【0163】
広告サブシステム120は、成功した(完全な)配信と失敗した(不完全な配信)とを含め、ユーザに供給したすべての広告の記録を維持する。この記録は、データベース170に格納されることが好ましい。広告が、垂直的関心ドメイン、または発信者の場所またはユーザ、またはユーザ嗜好、またはユーザの過去の関心、または広告主の関心とユーザ収集情報との他の何らかの組み合わせとによって、ターゲットを定めることができることは、好ましい。
【0164】
ユーザに対する広告のターゲットの幅を狭くするために、コンテクストセンシティブ情報の使用を用いることができることは、好ましい。ボイスポータル10におけるコンテクストセンシティブ広告ターゲット化では、広告コマーシャルを、ほぼ正確にユーザがどの情報を受領するかに関連させる。この機能を正確にするために、広告が再生される直前に、選択アルゴリズムに適切なポインタを伝える。一実施形態の場合は、垂直タイプが、コンテクストポイントとなる。
【0165】
一実施形態の場合、イグジスタントは、更に具体的なターゲット化を可能にするコンテクストポインタとなる。このコンテクストポインタは、その属性の基準を、市場調査基準と一致させ、特定のカテゴリにおける加重を決定する。こうしたカテゴリ加重は、初期リストにおいて広告の販売基準と結合され、最適な広告を選択するために、ここからコンテクスト加重の順序を定義する。この初期リストは、人口統計データおよび垂直タイプから作成され、コンテクスト加重の基盤を形成する。この問題をアルゴリズムへと一般化するために、数学的表記が導入され、これについては以下の例において例示する。
【0166】
第一に、関与するパラメータに関して、変数を定義する。アルゴリズムに伝えられるイグジスタントの属性リストは、セット{e, e, ..., e}によって定義されるものとし、ここでmはイグジスタント内の属性の数である。例えば、映画イグジスタントでは、サンプル属性は、ジャンルと、場所と、上映時間とになる。関連する広告で利用可能なカテゴリのリストは、セット{C, C, ..., C}によって定義されるものとし、ここでnはカテゴリの合計数である。システム内のサンプルカテゴリの一部は、ファミリと、レストランと、ナイトライフと、映画と、娯楽とになる。各カテゴリCに関してコンテクストカテゴリ加重Wが存在するものとし、ここでi∈{1, ..., n}である。コンテクストカテゴリ加重を有する目的は、広告のカテゴリ加重と比較したコンテクストの強さを決定することによりあり、これについては以下で説明する。
【0167】
すべてのイグジスタントに関する市場調査基準は、P = {p, p, ..., p}で表され、ここでtはデータベース内のすべての基準の合計である。各基準pは、関連する加重wを有し、ここでj∈{1, ...,t}であり、各属性eは、すべてのi, jに関して、pを満足させることを試み、ここでi∈{1, ..., m}、j∈{1, ...,t}である。したがって、eがpを満足させ、pがカテゴリCに属する場合、W = W + wとなり、ここでi∈{1, ..., m}、j∈{1, ...,t}、k∈{1, ...,n}である。この繰り返しは、前述した各カテゴリのコンテクスト加重を定義するために使用される。
【0168】
各カテゴリに関する合計コンテクスト加重Wが定義された後、関連する強度比率Rを計算する必要がある。カテゴリの強度比率は、イグジスタントのコンテクストが広告の選択に値するほど強いか否かを判断するのに使用される。例えば、ファミリカテゴリが多くの基準Pを有する場合は、イグジスタントのコンテクストに対応する加重が、許容可能な比率となる状態を確保する必要がある。このため、R = W/Tとなり、ここでTは、カテゴリkに関連するpにおけるすべての基準の合計加重である。
【0169】
人口統計的なクエリによって生成される広告のリストは、セットA = {A1, 2, ... }によって定義され、ここでrはリスト内の広告の合計数である。各広告Aは、独自のカテゴリ加重xを有し、ここでi∈{1, ...,r}、k∈{1, ...,n}であり、これはアルゴリズムの対応するコンテクストカテゴリ加重Rと併せて使用される。
【0170】
したがって、データベース上の人口統計データおよび広告タイプをフィルタリングすることにより広告Aの初期リストが作成された後、アルゴリズム内でのステップは、次のようになる。
【0171】
1. 各カテゴリCに関して、以下のようにカテゴリ加重Wを設定する。
・各W = 0に初期化し、ここでk∈{1, ...,n}である。
・各i∈{1, ...,m}および各j∈{1, ...,t}に関して、イグジスタントの現在の属性{e1, ...,e}に基づいて、eがpを満足させ、pがカテゴリCに関連する場合、W   + wとなり、ここでk∈{1, ...,n}となる。
2. 次に、イグジスタントの属性から独立したカテゴリの合計加重を表にする。こうした合計加重から、各カテゴリのコンテクスト比率を確定する。
・各k∈{1, ...,n}および各j∈{1, ...,t}に関して、pがカテゴリCに関連する場合、T  + wとなる。コンテクストカテゴリのコンテクスト比率をR = W/Tに設定する。
3. 各カテゴリkに関して、各Rに各広告Aのカテゴリ加重xを乗じ、その後、その合計に広告の販売基準比率Sを乗じて、コンテクスト合計Gを得る。
・各i∈{1, ...,r}に関して、以下のようにGを計算する。
= S・(R + ...+ R
4. 広告Aを選択し、ここでiはmax(G)、i∈{1, ...,r}により定義される。
【0172】
上のアルゴリズムは、単純な例によって例示することができる。ユーザが、映画の垂直的関心ドメインにおいて、ボイスポータル10のサービスを使用している例を考える。垂直的スポンサシップ広告は再生済みであり、ユーザは、映画上映に関する情報を受領しようとしている。したがって、コンテクストとして、選択には、再生される特定のイグジスタントに対するポインタが含まれる。ここでは議論のため、このイグジスタントを「水星へのミッション(Mission to Mars)」とする。映画上映イグジスタントの属性の一部は、観客指定(例えば、R)と、ジャンル(例えば、スリラ)と、上映時刻(例えば、4:00pm)とであり、これは{e, e, e}で示すことができる。したがって、要素P{p, p, ...,p}を含んだ一致するコンテクスト基準要素のリストが存在する必要がある。基準のサンプルリストは、データベース内で次のように表される可能性がある。
【表1】
Figure 2004504654
【0173】
このテーブルから、カテゴリは、C = {娯楽,ファミリ,ナイトライフ,ティーン,アダルト}として推論することが可能であり、k = 5となる。そのためステップ1から、W = 10、W = 0、W = 50、W = 80、およびW = 0となる。ステップ2から、R = 1、R = 0、R = 1、R = 0.4、およびR = 0となる(ここではPが8つの要素のみを有すると仮定しており、実際にはこうなる可能性は低く、約200以上の要素となる。)。ここで、広告リストAが、三種類の広告を有すると仮定する。広告の五カテゴリの加重は、以下の通りであると仮定する。
【表2】
Figure 2004504654
【0174】
そのため、これらの加重{x1, 2, 3, 4, }から、広告Aに関するGの値を得るために、以下のように計算を行うことが可能であり、ここでi∈{1, 2, 3}となる。
【式1】
Figure 2004504654
【0175】
したがって、コンテクストおよび販売比率による判断に基づき、「Mission to Mars」の広告が、最適となる。このアルゴリズムでは、検索されている情報の断片との関与度に基づいて、様々なカテゴリのコンテクストに注目する。更に、販売基準に関して再生する必要のある広告が注目され、因数分解され順序付けされるという事実を系統化する。この例では、広告、カテゴリ、およびPの基準の短いリストのみを例示している。このアルゴリズムは、更に多くのカテゴリおよび基準を取り上げることを意図したものである。
【0176】
図37乃至43は、ユーザとボイスポータル10との間の対話の例示的なダイアログマップを表している。図37乃至43を参照して説明されるダイアログマップは、例示的な目的のみを有する。これらの図では、映画と、天気と、交通と、株式と、スポーツとの垂直的関心ドメインのみが表示されているが、特に、図4乃至6を参照して説明したデータ構造モデル300、400、および450により利用可能となる拡張性および適合性機能の観点から、こうしたダイアログマップ(およびボイスポータル10のユーザとの対話)に任意の垂直的関心ドメインを含めることが可能であるのは明白である。更に、ユーザとボイスポータル10との間の様々な対話を示す特定のブロックは、例示的な目的のみを有する。可能な多くの垂直的関心ドメインのそれぞれについて、広範な対話が可能である。
【0177】
図37は、ダイアログマップ3700を表しており、ここではユーザがボイスポータル10に電話をかけた後、ブロック3710が実行され、歓迎の言葉が提供される。ブロック3710の後、ブロック3720が実行され、サインイン手続きが進められる(図38を参照して更に説明される)。ブロック3720のサインイン手続きの後、ユーザは、ブロック3730および3740において、ボイスポータル10のサービスの紹介を聞くこと、または、ブロック3750において、可能な垂直的関心ドメインの紹介のためにランウェイ情報へ直接進むことが選択できる。具体的には、ブロック3730では、サービスプロバイダに関して、紹介情報が提供される。ブロック3740では、サービスがどのように機能するかに関して、紹介情報が提供される。ブロック3750では、ボイスポータル10は、ユーザに対して、「ランウェイ」から関心ドメイン(例えば、映画、天気、交通、株式、スポーツ)を選択するように要求する。
【0178】
ユーザが映画の関心ドメインを選択した場合、ブロック3760が実行され、ここで映画サブシステムが実行され(図39を参照して更に説明される)、ユーザは、映画リスト、劇場、およびレビューのような、映画情報およびトランザクションへのアクセスを有する。ユーザが天気の関心ドメインを選択した場合、ブロック3770が実行され、ここで天気サブシステムが実行され(図40を参照して更に説明する)、ユーザは、好適な場所または任意の場所に関する今日の予報または長期予報のような、天気情報へのアクセスを有する。ユーザが交通の関心ドメインを選択した場合、ブロック3780が実行され、ここで交通サブシステムが実行され(図41を参照して更に説明される)、ユーザは、都市による報告、特定のルートに関する報告、または個人化された報告のような、交通情報へのアクセスを有する。ユーザが株式の関心ドメインを選択した場合、ブロック3790が実行され、ここで株式サブシステムが実行され(図42を参照して更に説明される)、ユーザは、市場概況、株式市況、株式ニュース、および個人化された株式ニュースまたはトランザクション(例えば、購入、売却)のような、株式情報およびトランザクションへのアクセスを有する。ユーザがスポーツの関心ドメインを選択した場合、ブロック2500が実行され、ここでスポーツサブシステムが実行され(図43を参照して更に説明する)、ユーザは、スポーツのスコア、スポーツニュース、スポーツイベントのチケット情報、およびスポーツ・ファンタジ・リーグ・トランザクションのような、スポーツ情報へのアクセスを有する。
【0179】
次に図38を参照すると、ここには、サインインサブシステムが表示されている。ブロック3810では、発信者識別が試行される。ボイスポータル10のユーザの一タイプは、未確認ユーザである。未確認ユーザは、(おそらく初めての)着信後、従来の発信者識別技術(「発信者ID」)により場所を確認可能であるか、またはこうした確認は不可能である。発信者IDがデータベース170に存在しない場合、発信者は、新しい発信者である可能性がある。発信者IDが非通知にされている場合、ボイスポータル10は、どちらにせよ識別ができない。一実施形態の場合、ボイスポータル10は、電話番号(またはその他の識別子)を要求し、「確認済み」発信者として先に進む。代替実施形態の場合、ボイスポータル10は、検証を行わずに先に進む。この判断は、要求されている情報の種類に応じて変化させることができる。例えば、特定の垂直的ドメインでは、手続きの前に、ユーザを識別するために、ユーザのIDを決定する必要がある(オークション等の場合)。
【0180】
確認済みユーザは、登録済みまたは未登録の一方である。確認済みユーザが登録済みである場合、ボイスポータル10は、クレジットカードおよび嗜好のようなユーザに関する情報をデータベース170に有する。ボイスポータル10が嗜好および関心の追跡を開始し、高い度合いの消費者付加価値と、これによるサービスへの愛着とを達成できるように、ユーザが、登録を行うことが、好ましい。ユーザは、登録時、住所およびクレジットカード番号を有するプロフィール情報を記入することができる。更に、特定の発信者に関して多くの情報が蓄積されると、方向付けされた(したがって価値のある)広告も蓄積される。
【0181】
発信者の識別が可能である場合、ブロック3820が実行され、ユーザにパスワードを求めることにより、ユーザの確認が実行される。パスワードが検証されると、ユーザ嗜好を設定することが可能となり、制御はブロック3870に移行し、更に制御は図37に戻り、紹介またはランウェイの選択が実行される。与えられたパスワードが無効である場合、制御はブロック3840に移行する。
【0182】
発信者の識別が不可能である場合、またはユーザが自分のパスワードを知らなかった場合、制御はブロック3830に移行し、ボイスポータル10は、ユーザのアカウントステータスを決定する。ユーザがアカウントを有しない場合、制御はブロック3850に移行し、ユーザがアカウントを設定するべきであるというアカウント設定リマインダが提示される。ユーザがアカウントを有している場合、制御はブロック3840に移行し、ボイスポータル10は、ユーザのアカウント番号を取得する。ユーザがアカウント番号を忘れていた場合、制御はブロック3850に移行し、ユーザは、アカウントを設定するように求められる。ユーザが有効なアカウント番号を提供した場合、制御は、ユーザ確認のため、ブロック3820に移行する。ユーザが無効なアカウント番号を提示した場合、制御はブロック3860に移行し、ボイスポータル10は、ユーザに対して、アカウントが無効であり、Webサイトを訪問するか、またはサポート番号に電話をして、支援を受けるように通知する。その後、制御はブロック3880および図37に移行し、紹介またはランウェイの選択が実行される。
【0183】
次に図39を参照すると、ここでは、映画サブシステムが実行される。ブロック3910では、ボイスポータル10が、映画の関心ドメインの紹介を再生する。ユーザは、劇場での映画、映画リスト、および映画レビューのようなオプションを選択することができる。ユーザが劇場での映画を選択した場合、制御はブロック3915に移行し、ボイスポータル10は、ユーザが希望する地理的な場所を決定する。場所の決定には、郵便番号、州および都市、または嗜好のような、様々な方法を利用することができる。与えられた場所の近くに劇場がない場合、ブロック3920が実行され、与えられたエリア内に位置する劇場がないことをユーザに通知するメッセージが再生される。場所が決定されると、ブロック3925が実行され、その場所にある劇場名が列挙される。ブロック3925の後、ブロック3930が実行され、エリア内の劇場で上映されている映画が列挙される。ボイスポータル10は、ユーザに映画を選択することを要求し、制御はブロック3935に移行する。
【0184】
次にブロック3910を参照すると、ここでは、映画の関心ドメインの紹介が再生され、ユーザが映画リストを要求すると、ブロック3940が実行され、ボイスポータル10は、映画タイトルをユーザに要求する。ブロック3940の後、ブロック3945が実行され、ユーザが希望する地理的な場所が決定される。上で説明したように、発信者の場所の決定には、様々な方法を使用することができる。選択した映画を上映している劇場が存在する場合、ブロック3950が実行され、その映画を上映している劇場が列挙され、ユーザは、リストから選択するように求められる。制御は、その後、ブロック3935に移行する。選択した映画を上映している劇場が存在しない場合、ブロック3955が実行され、最も近い場所での映画の時間が、ユーザに提供される。制御は、その後、ブロック3935に移行する。
【0185】
次にブロック3910を参照すると、ここでは、映画の関心ドメインの紹介が再生され、ユーザが映画レビューを要求すると、ブロック3960が実行され、ボイスポータル10は、映画タイトルをユーザに要求する。ブロック3960の後、ブロック3965が実行され、選択された映画に関するレビューが再生される。ブロック3965の後、ブロック3970が実行され、ボイスポータル10は、選択した映画の上映について知りたいか否かをユーザにたずねる。ユーザが拒否した場合、映画レビューに関する別の映画タイトルを取得するために、制御は、ブロック3960に戻る。ユーザが受け入れた場合、制御は、ブロック3945に移行する。
【0186】
ブロック3935の後、ボイスポータル10は、選択した映画および劇場に関する映画上映時間を提供する。ブロック3980では、ボイスポータル10は、次の行動を要求する。ユーザは、劇場の住所を要求することが可能であり、この場合、ブロック3985が提供される。ユーザは、更に、映画レビューを要求することが可能であり、この場合、ブロック3990が提供される。ユーザが映画の関心ドメインを中止することを希望すると、制御は、図37のブロック3750に戻る。
【0187】
次に図40を参照すると、図示されているように、天気サブシステムが実行される。ブロック4010では、ボイスポータル10は、天気の関心ドメインの紹介を再生する。ブロック4010で紹介が再生された後、制御はブロック4020に移行し、ボイスポータル10は、天気の関心ドメインにおけるユーザの場所情報を取得する。上で説明したように、場所情報の取得には、郵便番号、都市または州、およびその他の場所の指示による場所の取得のような、多数の方法が可能である。ブロック4020の後、制御はブロック4030に移行し、ボイスポータル10は、ユーザが現在の天気情報を求めるか、または後の期間に関する天気情報を求めるかについて、プロンプトを提供する。ユーザが後の期間に関する天気情報を聞くことを選択した場合、制御はブロック4040に移行し、ボイスポータル10は、ユーザに対して、天気に関する待ち時間オプションを提供するプロンプトを再生する。ユーザが現在の天気情報を求めた場合、またはユーザがブロック4040で待ち時間オプションを選択した後、制御はブロック4050に移行し、ボイスポータル10は、希望する天気情報を提供する。
【0188】
ブロック4050が実行された後、制御はブロック4060に移行し、ボイスポータル10は、ユーザに対して、長期予報を希望するか否かをたずねる。長期予報が希望される場合、制御はブロック4070に移行し、ボイスポータル10は、長期予報を提供する。ブロック4070の後、またはユーザが長期予報を希望しない場合、制御はブロック4080に移行し、ボイスポータル10は、ユーザに次の行動を要求する。ユーザが天気の関心領域を継続したい場合、制御は、ブロック4020に移行する。ユーザが天気関心領域を中止したい場合、制御は、ブロック4090に移行し、これはブロック3750として図37を参照して説明したランウェイに対応する。
【0189】
次に図41を参照すると、ここでは、交通サブシステムが実行される。ブロック4110では、ボイスポータル10は、交通の関心ドメインの紹介を再生する。ブロック4110の後、制御はブロック4115に移行し、ボイスポータル10は、ユーザからの場所情報またはユーザに関する個人化情報を取得する。ブロック4115の後、制御はブロック4120に移行し、ボイスポータル10は、都市交通情報を取得する。都市交通情報が利用できない場合、制御はブロック4135に移行し、郵便番号交通情報が取得される。郵便番号交通情報は、ボイスポータル10が都市を認識しなかった場合の予備である。都市データが発見されず、近くの場所に関するデータが含まれる場合、制御はブロック4140に移行し、ボイスポータル10は、近くの都市を求める。ブロック4120において、報告すべき交通イベントが存在しない場合、制御はブロック4125に移行し、ユーザは、報告すべき交通状況がその都市に存在しないことを通知される。ブロック4120において、交通データが利用できない場合、制御はブロック4130に移行し、ユーザには、別の都市を試すオプション、または新しい関心ドメインを選択するためにランウェイへ進むオプションが提供される。
【0190】
ブロック4120の後、制御はブロック4145に移行し、ボイスポータル10は、特定の交通ルートまたは「全市」を要求する。ブロック4145の後、制御はブロック4145に移行し、ボイスポータル10は、ルート指示情報を取得する。ブロック4145の後、ルート上で報告すべき交通情報が存在しない場合、制御は、ブロック4155に移行する。ブロック4155では、ユーザは、新しい交通ルートまたは「全市」を選択するオプションと、ランウェイへ進み、新しい関心ドメインを選択するオプションとが与えられる。ルート交通情報が入手可能である場合、ブロック4150の後、制御はブロック4160に移行し、ボイスポータル10は、選択されたルートに関するルート交通情報を列挙する。ブロック4145においてユーザが「全市」を選択した場合、制御はブロック4165に移行し、ボイスポータル10は、都市交通情報を列挙する。
【0191】
ブロック4160およびブロック4165の後、制御はブロック4170に移行し、ボイスポータル10は、希望された交通レポートをユーザに提供する。ブロック4170の後、制御はブロック4175に移行し、ボイスポータル10は、交通の関心ドメインにおいて実行する次の行動を求める。例示的な一実施形態の場合、次の行動には、交通レポートの繰り返しと、交通情報の列挙の継続と、ランウェイへ進むこととが含まれる。ブロック4175でユーザが選択を行った後、制御は、適切なブロックに移行する。例えば、ユーザが交通レポートの繰り返しを選択した場合、制御は、ブロック4170に移行する。ユーザが列挙の継続のオプションを選択した場合、制御は、ブロック4145で行われた特定の交通ルートまたは「全市」の選択に応じて、ブロック4160またはブロック4165のいずれかに移行する。ユーザがランウェイへ進むことを選択した場合、制御は、ブロック4180に移行し、これはブロック3750として図37を参照して説明したランウェイに対応する。
【0192】
次に図42を参照すると、ここでは、株式サブシステムが実行される。ブロック4210において、ボイスポータル10は、株式の関心ドメインの紹介を再生する。ブロック4210の後、制御はブロック4215に移行し、ボイスポータル10は、ユーザに、市場概況、株式市況、または「MyQuack」と呼ばれる個人化されたリストを選択するオプションを提供する。ユーザが市場概況を選択した場合、制御はブロック4240に移行し、ダウ工業株平均、NASDAQ、S&P500、NYSE出来高、NASDAQ出来高、および30年債のような市場概況が様々な市場に関して提供される。ユーザが株式市況を選択した場合、制御はブロック4220に移行し、ボイスポータル10は、ユーザから特定の株式銘柄を取得する。ブロック4220の後、制御はブロック4225に移行し、ボイスポータル10は、ブロック4220において提供された株式銘柄に対応する株式市場を取得する。株式市場を特定した後、制御はブロック4230に綿入り、ボイスポータル10は、株価、最終取引、変化、出来高、および一日の高値/安値のような株式情報を提供する。
【0193】
ブロック4230の後、制御はブロック4235に移行し、ボイスポータル10は、株式の関心ドメインにおいて実行する次の行動を要求する。例示的な一実施形態の場合、ユーザは、株式情報の繰り返し/株式情報の列挙の継続、新しい株式の取得、市場概況を聞くこと、またはランウェイへ進むことを選択できる。ブロック4235でユーザが行った選択に応じて、制御は、市場概況の場合はブロック4240に、新しい株式銘柄の場合はブロック4220に、個人化されたmy Quack株式の場合はブロック4250に、またはランウェイの場合はブロック4275に移行する。ブロック4275の前に、制御はブロック4270に移行することが可能であり、ここでボイスポータル10は、ユーザに、個人化された情報を迅速な形で取得するために嗜好を設定することが可能であることを伝える嗜好リマインダを提供する。今回の通話で、ユーザに嗜好について既に指摘している場合、制御は、直接ブロック4275に移行する。
【0194】
ブロック4215において、ユーザが「MyQuack」を選択した場合、制御は、アカウント情報が特定されていない場合はブロック4245に移行し、アカウント情報が特定されている場合はブロック4250に移行する。ブロック4245において、嗜好設定およびアカウント情報が確定される。Web上でアカウントが設定されたことを、ユーザに対して忠告することができる。ブロック4250では、株価、最終取引、変化、および出来高のような個人化された株式情報が提供される。ブロック4250の動作中、ユーザは、特定の株式に関する情報の再生中に、例えば「that one」と言うことにより、特定の株式を特定することができる。こうした選択が行われた場合、制御はブロック4255に移行し、特定の株式に関して、株式ニュースオプションが列挙される。ユーザがブロック4255のリストから特定のタイプの株式ニュースを選択した後、制御はブロック4260に移行し、ボイスポータル10は、選択された株式ニュースを再生する。ブロック4260の後、制御はブロック4265に移行し、ボイスポータル10は、ユーザに、株式ニュースのリストを取得するか(ブロック4255)、または株式ニュースを終了するかをたずねる。ユーザが株式ニュースの終了を選択した場合、制御はブロック4235に移行し、株式に関する次の行動が要求される。ユーザが株式の関心ドメインを完了すると、制御はブロック4275に移行する。これはブロック3750として図37を参照して説明したランウェイに対応する。
【0195】
次に図43を参照すると、ここでは、スポーツサブシステムが実行される。ブロック4310では、ボイスポータル10は、スポーツの関心ドメインの紹介を再生する。ブロック4310の後、制御はブロック4315に移行し、ボイスポータル10は、ユーザが希望するスポーツのタイプを取得し、または、ユーザは、「MyQuack」と発声し、個人化されたスポーツタイプのスコアを得ることができる。ユーザが特定のスポーツを選択した場合、制御はブロック4320に移行し、ボイスポータル10は、選択したスポーツのリーグ名をリストから取得する。例えば、ボイスポータル10は、「NFL、NBA、NHL、およびメジャーリーグベースボール」を列挙することができる。ユーザがリーグ名を選択した後、制御はブロック4325に移行し、ボイスポータル10は、ユーザが関心を有する特定のチームを取得する。ブロック4325の後、制御はブロック4330に移行し、スポーツのスコアが提供される。例えば、ボイスポータル10は、「TEAMの前回の試合はDATEに行われ、最終結果は、TEAM1、SCORE1、TEAM2、SCORE2でした」と伝えることができる。
【0196】
ブロック4315において、ユーザが「MyQuack」を選択した場合、制御は、ブロック4340に移行する。ブロック4340では、ボイスポータル10は、個人化されたMyyQuackスポーツチームのスポーツスコアを提供する。ブロック4340の後、制御はブロック4335に移行し、ボイスポータル10は、チーム限定のニュースとして、スポーツニュースを提供する。ブロック4330およびブロック4335の後、制御はブロック4345に移行し、ボイスポータル10は、直前に聞いたスポーツ情報をユーザが繰り返したいか否かをたずねる。ユーザが肯定的な反応を示した場合、ボイスポータル10は、元に戻って、提供した情報を繰り返す。ユーザが情報の繰り返しを望まなかった場合、制御はブロック4350に移行し、ボイスポータル10は、スポーツの関心ドメインにおいて実行する次の行動を求める。ブロック4350の後、制御は、リーグ名を選択するためにブロック4320に、my Quackスポーツのスコアを提供するためにブロック4340に、またはランウェイ情報のためにブロック4355に移行する。ブロック4355は、ブロック3750として図37を参照して更に説明したランウェイに対応する。図40乃至43の各サブシステムは、例としてのみ表示されている。
【0197】
各図に例示し且つ上で説明した実施形態は現在において好適なものであるが、こうした実施形態は、例示としてのみ提供されていることは理解されよう。他の実施形態は、ボイスポータルを介したインターネットへのアクセスを単純化する様々なデータ構造を有することができる。本発明は、特定の実施形態に限定されず、前記特許請求の範囲および趣旨になお含まれる様々な変形例、組み合わせ、および置換例とを包含する。
【図面の簡単な説明】
本発明は、同様の参照記号が類似する要素を示す添付図面の各図において、例示的且つ非限定的に示されている。
【図1】インターネットに接続するボイスポータルを示す全体概略図である。
【図2】図1のボイスポータルの例示的な機能的実施形態を示す全体機能ブロック図である。
【図3】図1のボイスポータルの例示的な物理的実施形態を示す更に詳細なブロック図である。
【図4】図1のボイスポータルで使用される例示的なデータ構造モデルを示す概略図である。
【図5】ユーザ関連情報に関する図4の例示的なデータ構造モデルを示す概略図である。
【図6】広告関連情報に関する図4の例示的なデータ構造モデルを示す概略図である。
【図7】図4の例示的なデータ構造モデルの例示的な作成プロセスを示すフロー図である。
【図8】図7の例示的な作成プロセスを示す概略図である。
【図9】ノンプログラミング手段を使用してインターネットからの情報を収集する例示的なプロセスを示すフロー図である
【図10】図1のボイスポータルに関連するルールのノンプログラミング策定の例示的なプロセスを示す概略図である。
【図11】図1のボイスポータルに関連するルールのノンプログラミング策定に関する例示的なグラフィカルユーザインタフェースを示す。
【図12】図1のボイスポータルに関連するルールのノンプログラミング策定において使用される例示的なグラフィカルユーザインタフェースウィンドウを示す。
【図13】図12のグラフィカルユーザインタフェースウィンドウの拡張形態を示す。
【図14】図1のボイスポータルに関連するルールのノンプログラミング策定において使用される例示的なグラフィカルユーザインタフェース検索データエディタウィンドウを示す。
【図15】図1のボイスポータルに関連するルールのノンプログラミング策定において使用される例示的なグラフィカルユーザインタフェースウィンドウを示す。
【図16】図15のグラフィカルユーザインタフェースウィンドウの拡張形態を示す。
【図17】図1のボイスポータルに関連するルールのノンプログラミング策定において使用される例示的なグラフィカルユーザインタフェースウィンドウを示す。
【図18】図1のボイスポータルに関連するルールのノンプログラミング策定において使用されるベンダ形態オプションに関する例示的なグラフィカルユーザインタフェースウィンドウを示す。
【図19】図1のボイスポータルに関連するルールのノンプログラミング策定におけるURLのテストに関する例示的なグラフィカルユーザインタフェースウィンドウを示す。
【図20】図1のボイスポータルに関連するルールのノンプログラミング策定におけるパターンの選択に関する例示的なグラフィカルユーザインタフェースウィンドウを示す。
【図21】図1のボイスポータルに関連するルールのノンプログラミング策定中に、多数のページのリンクの検出に関するパターンを特定するために使用される例示的なグラフィカルユーザインタフェースウィンドウを示す。
【図22】スパイダのプログラミングにおいて使用される階層構造を示す概略図である。
【図23】図1のボイスポータルにより使用されるスパイダのプログラミングに関する例示的なグラフィカルユーザインタフェースウィンドウを示す。
【図24】図23の例示的なグラフィカルユーザインタフェースウィンドウの拡張形態を示す。
【図25】図1のボイスポータルの統一データベースに情報を融合する例示的なプロセスを示すフロー図である。
【図26】図1のボイスポータルの統一データベースに情報を融合する第二の例示的なプロセスを示すフロー図である。
【図27】より完全な一定の項目に関する情報のための二つのイグジスタントからのカノニカルなイグジスタントの作成を示す概略図である。
【図28】インターネットソースから図1のボイスポータルのユーザに対するデータの分離および変換の例示的なプロセスの第一の部分を示す概略図である。
【図29】インターネットソースから図1のボイスポータルのユーザに対してデータが分離および変換される図28の例示的なプロセスの第二の部分を示す概略図である。
【図30】図1のボイスポータルの例示的な動作フローを示すフロー図である。
【図31】図30のフロー図の例示的な動作サブシステムを示すフロー図である。
【図32】図30のフロー図の第二の例示的な動作サブシステムを示すフロー図である。
【図33】図30のフロー図の第三の例示的な動作サブシステムを示すフロー図である。
【図34】希望する品目またはサービスを決定するために図1のボイスポータルにおけるユーザの応答をファンネリングする例示的なプロセスを示すフロー図。
【図35】図1のボイスポータルを使用してトランザクションを実行する例示的なプロセスを示すフロー図である。
【図36A】図1のボイスポータルを使用して広告する例示的なプロセスを示すフロー図である。
【図36B】図1のボイスポータルを使用して広告する第二の例示的なプロセスを示すフロー図である。
【図37】図1のボイスポータルの例示的なダイアログマップを示すフロー図である。
【図38】図37の例示的なダイアログマップの例示的なサブシステムを示すフロー図である。
【図39】図37の例示的なダイアログマップの第二の例示的なサブシステムを示すフロー図である。
【図40】図37の例示的なダイアログマップの第三の例示的なサブシステムを示すフロー図である。
【図41】図37の例示的なダイアログマップの第四の例示的なサブシステムを示すフロー図である。
【図42】図37の例示的なダイアログマップの第五の例示的なサブシステムを示すフロー図である。
【図43】図37の例示的なダイアログマップの第六の例示的なサブシステムを示すフロー図である。
【符号の説明】
10 ボイスポータル
12 携帯電話
14 標準電話
20 ネットワーク
30 Web ページ
40 Web ページ
52 コンピュータ
54 コンピュータ
55 データベース
58 データベース
59 ユーザインタフェース
110 ユーザインタフェース
120 広告サブシステム
130 顧客管理サブシステム

Claims (25)

  1. プログラムによらない手段がウェブページから情報を得ることを可能にするために、識別されるものの属性に対応するルールを確立する方法であって、
    所望のものに関する情報に対応するウェブページを発見するステップと、
    前記発見されたウェブページにオーバーレイするフォームを選択するステップであって、前記フォームが、前記所望のものの属性に対応するルールにより規定されているステップと、
    前記フォームに基づいて前記発見されたウェブページから情報を抽出するステップとを、有する方法。
  2. 前記発見されたウェブページにオーバーレイするフォームを選択する前記ステップが、グラフィカルユーザーインタフェース(GUI)によりリストされるフォームを選択することを有する請求項1の方法。
  3. フォームを選択する前記ステップが、前記フォームをさらに規定するルールを加えることを有する請求項1の方法。
  4. 前記フォームに基づいて前記発見されたウェブページから情報を抽出する前記ステップが、その情報を、前記発見されたウェブページに位置させることができるパターンを識別することを有する請求項1の方法。
  5. 所定の属性に一致する項目を含むウェブページに対する前記インターネットをサーチすることを、さらに、有する請求項1の方法。
  6. ウェブページに対して前記インターネットをサーチする前記ステップが、スパイダを実施することを有する請求項5の方法。
  7. 前記発見されたウェブページから情報を抽出する前記ステップが、HTMLタグを使用している情報のパターンを識別することを有する請求項1の方法。
  8. 前記発見されたウェブページにオーバーレイするフォームを選択する前記ステップが、検索される情報に関する属性を含むフォームを生成することを有する請求項1の方法。
  9. 前記選択されたフォームおよび抽出された情報を他のウェブページに適用することを、更に、有する請求項1の方法。
  10. ウェブページから情報を得るために識別されるものの属性に対応するルールを確立するシステムであって、
    所望のものに関連した情報に対応するウェブページを発見する手段と、
    前記発見されたウェブページにオーバーレイするフォームを選択する手段であって、前記フォームが、前記所望のものの属性に対応するルールにより規定されている手段と、
    前記フォームに基づいて前記発見されたウェブページから情報を抽出する手段とを、有するシステム。
  11. フォームを選択する前記手段が、さらに、前記フォームを規定するルールを加える手段を有する請求項10のシステム。
  12. 前記フォームに基づいて前記発見されたウェブページから情報を抽出する前記手段が、情報が前記発見されたウェブページへの位置することができるパターンを識別する手段を有する請求項10のシステム。
  13. 所定の属性に一致する項目を含むウェブページに対する前記インターネットをサーチする手段を、さらに、有する請求項10のシステム。
  14. 前記発見されたウェブページにオーバーレイするフォームを選択する前記手段が、検索される情報に関する属性を含むフォームを生成する手段を有する請求項10のシステム。
  15. ウェブに基づく情報を共通データ構造に変換するさいに使用されるルールをプログラミングによらずに開発する方法であって、
    情報の、関連した情報を含む領域を有するページを発見するステップと;
    関連した情報を含む記領域を孤立させるパターンを含むフォームを識別するステップと、
    関連した情報を含む領域を含むページのセット内でより多くの情報のページへのリンクを発見するステップと、
    関連した情報を含む領域を孤立させるために同様のパターンによりページのセットに対し抽出ファイルを生成するステップとを、有する方法。
  16. データを抽出することをさらに有する請求項15の方法。
  17. 抽出ファイルを生成する前記ステップが、ベンダーのウェブサイトへの情報表示のパターンを識別することを有し、
    前記ベンダーのウェブサイトが、マルチプルウェブページを含む請求項15の方法。
  18. ウェブに基づく情報を共通データ構造に変換するさいに使用されるルールをプログラミングによらないで開発するシステムであって、
    関連情報を含む領域を有する、情報のページを発見する手段と、
    関連情報を含む前記領域を孤立させるパターンを含むフォームを識別する手段と、
    関連情報を含む領域を含むページのセットの範囲内で、情報のより多くのページへのリンクを発見する手段と、
    関連情報を含む領域を孤立させるために同様のパターンによりページのセットに対して抽出ファイルを生成する手段とを、有するシステム。
  19. データを抽出する手段を更に有する請求項18のシステム。
  20. 前記抽出ファイルを他のウェブページに適用する手段を更に有する請求項18のシステム。
  21. ウェブに基づく情報の前記変換において使用されるルールを開発するシステムであって、
    複数のフォームの内の一フォームを使用するウェブページから抽出される情報を格納するデータベースであって、ルールからなる複数のフォームが、前記ウェブページから求められた関連情報に関係するデータベースと、
    フォームの前記フォームを前記複数から選択するために非エキスパートルールメーカーを可能にするツールを編成しているデータであって、前記選択されたフォームが、前記ウェブページへの情報の構成およびコンテクストを近似するように選択されているデータとを、有するシステム。
  22. 共通データ構造にウェブに基づく情報を変換するさいに使用されるルールをプログラミングによらないで開発するコンピュータ読取り可能なプログラムコードを有するコンピュータプログラム製品であって、
    ウェブページを発見する第一のコンピュータ読取り可能なプログラムコードと、
    関連情報を含む前記領域を孤立させるパターンを含むフォームを識別する第二のコンピュータ読取り可能なプログラムコードとを、有するコンピュータプログラム製品。
  23. 前記フォームに基づいて前記発見されたウェブページから情報を抽出する第三のコンピュータ読取り可能なプログラムコードを、更に、有する請求項22のコンピュータープログラムコード。
  24. 前記抽出された選択されたフォームと抽出された情報を他のウェブページに適用する第四のコンピュータ読取り可能なプログラムコードを、更に、有する請求項22のコンピュータープログラムコード。
  25. グラフィカルユーザーインタフェースを実施する第五のコンピュータ読取り可能なプログラムコードを、更に、有する請求項22のコンピュータープログラムコード。
JP2001569657A 2000-03-21 2001-03-16 ウェブに基づく情報の変換に使用されるルールのプログラミングによらない開発システムおよび方法 Pending JP2004504654A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US53195000A 2000-03-21 2000-03-21
PCT/US2001/008384 WO2001071538A2 (en) 2000-03-21 2001-03-16 System and method for non-programming development of rules used in the transformation of web-based information

Publications (1)

Publication Number Publication Date
JP2004504654A true JP2004504654A (ja) 2004-02-12

Family

ID=24119749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001569657A Pending JP2004504654A (ja) 2000-03-21 2001-03-16 ウェブに基づく情報の変換に使用されるルールのプログラミングによらない開発システムおよび方法

Country Status (5)

Country Link
EP (1) EP1287447A2 (ja)
JP (1) JP2004504654A (ja)
CN (1) CN1427971A (ja)
AU (1) AU2001252909A1 (ja)
WO (1) WO2001071538A2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006516767A (ja) * 2002-08-30 2006-07-06 ミヴァ・インコーポレーテッド リスティングの複数のセットを使用するペイフォーパフォーマンス広告のシステムおよび方法
US20070022098A1 (en) * 2005-07-25 2007-01-25 Dale Malik Systems and methods for automatically updating annotations and marked content of an information search
WO2011018681A1 (en) * 2009-08-13 2011-02-17 Youfoot Ltd Process and method for generating dynamic sport statistics, multilingual sport commentaries, and media tags for association with user generated media content
CN116304217B (zh) * 2023-03-31 2024-04-26 易智瑞信息技术有限公司 地理空间数据查询方法、装置、电子设备和可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5649186A (en) * 1995-08-07 1997-07-15 Silicon Graphics Incorporated System and method for a computer-based dynamic information clipping service
EP0834822A2 (en) * 1996-10-04 1998-04-08 Canon Information Systems, Inc. World wide web news retrieval system
WO1998014896A1 (en) * 1996-09-30 1998-04-09 Sterling Software, Inc. Web server data/process integrator
JPH10222539A (ja) * 1996-10-02 1998-08-21 Jangree Corp 半構造化情報の照会および解釈を構造化する方法および装置
US5864863A (en) * 1996-08-09 1999-01-26 Digital Equipment Corporation Method for parsing, indexing and searching world-wide-web pages
WO2000014625A1 (en) * 1998-09-03 2000-03-16 Sony Electronics, Inc. Apparatus and method for designating information to be retrieved over a computer network

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6898591B1 (en) * 1997-11-05 2005-05-24 Billy Gayle Moon Method and apparatus for server responding to query to obtain information from second database wherein the server parses information to eliminate irrelevant information in updating databases

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5649186A (en) * 1995-08-07 1997-07-15 Silicon Graphics Incorporated System and method for a computer-based dynamic information clipping service
US5864863A (en) * 1996-08-09 1999-01-26 Digital Equipment Corporation Method for parsing, indexing and searching world-wide-web pages
WO1998014896A1 (en) * 1996-09-30 1998-04-09 Sterling Software, Inc. Web server data/process integrator
JPH10222539A (ja) * 1996-10-02 1998-08-21 Jangree Corp 半構造化情報の照会および解釈を構造化する方法および装置
US5826258A (en) * 1996-10-02 1998-10-20 Junglee Corporation Method and apparatus for structuring the querying and interpretation of semistructured information
EP0834822A2 (en) * 1996-10-04 1998-04-08 Canon Information Systems, Inc. World wide web news retrieval system
JPH10254912A (ja) * 1996-10-04 1998-09-25 Canon Inf Syst Inc ワールドワイド・ウエブ・ニュース検索システム
WO2000014625A1 (en) * 1998-09-03 2000-03-16 Sony Electronics, Inc. Apparatus and method for designating information to be retrieved over a computer network
JP2002524791A (ja) * 1998-09-03 2002-08-06 ソニー エレクトロニクス インク コンピュータネットワークを介して読み出すべき情報を指定する装置及び方法

Also Published As

Publication number Publication date
CN1427971A (zh) 2003-07-02
WO2001071538A3 (en) 2002-04-18
WO2001071538A2 (en) 2001-09-27
EP1287447A2 (en) 2003-03-05
AU2001252909A1 (en) 2001-10-03

Similar Documents

Publication Publication Date Title
US8868589B2 (en) System and method for the transformation and canonicalization of semantically structured data
JP5193412B2 (ja) インターネットに基づく情報への音声アクセスのためのシステム及び方法
US7103563B1 (en) System and method for advertising with an internet voice portal
US6687734B1 (en) System and method for determining if one web site has the same information as another web site
US8874446B2 (en) System and method for funneling user responses in an internet voice portal system to determine a desired item or servicebackground of the invention
US7974875B1 (en) System and method for using voice over a telephone to access, process, and carry out transactions over the internet
AU2001247456A1 (en) System and method for voice access to internet-based information
JP5124160B2 (ja) 広告効果を予想するシステム
EP2165437A2 (en) Presenting content to a mobile communication facility based on contextual and behaviorial data relating to a portion of a mobile content
JP2004534299A (ja) 位置に基づくサービス
JP2004504654A (ja) ウェブに基づく情報の変換に使用されるルールのプログラミングによらない開発システムおよび方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100512

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101019