JP2009534735A - 単一および複数のタクソノミーを管理する方法とシステム - Google Patents

単一および複数のタクソノミーを管理する方法とシステム Download PDF

Info

Publication number
JP2009534735A
JP2009534735A JP2009506043A JP2009506043A JP2009534735A JP 2009534735 A JP2009534735 A JP 2009534735A JP 2009506043 A JP2009506043 A JP 2009506043A JP 2009506043 A JP2009506043 A JP 2009506043A JP 2009534735 A JP2009534735 A JP 2009534735A
Authority
JP
Japan
Prior art keywords
taxonomy
category
content
profile
categories
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009506043A
Other languages
English (en)
Other versions
JP2009534735A5 (ja
JP5150871B2 (ja
Inventor
ルーサー、フィリス
Original Assignee
モバイル・コンテント・ネットワークス・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by モバイル・コンテント・ネットワークス・インコーポレーテッド filed Critical モバイル・コンテント・ネットワークス・インコーポレーテッド
Publication of JP2009534735A publication Critical patent/JP2009534735A/ja
Publication of JP2009534735A5 publication Critical patent/JP2009534735A5/ja
Application granted granted Critical
Publication of JP5150871B2 publication Critical patent/JP5150871B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

システムおよび方法は、少なくとも1つの第1のカテゴリを有する第1のタクソノミーと1つ以上の第2のタクソノミーとを取得することを含み、少なくとも1つの第2のカテゴリが、1つ以上の第2のタクソノミーの少なくとも1つに関係付けられている。システムおよび方法は、少なくとも1つの第1のカテゴリの第1のカテゴリプロファイルと少なくとも1つの第2のカテゴリの第2のカテゴリプロファイルとの比較に基づいて、第1のタクソノミーと第2のタクソノミーとをマージすることによって、新しいタクソノミーを作成することをさらに含む。
【選択図】 図1

Description

関連出願への相互参照
本出願は、2006年4月19日に出願され、“単一および複数のタクソノミーを管理する方法と装置”と題された、米国仮出願第60/745,155号に対して優先権を主張し、その内容は参照としてここにその全体が組み込まれている。
発明の分野
本発明は、コンピュータソフトウェアおよびハードウェアにより使用される、単一および複数のタクソノミーを作成し、維持し、管理する方法と装置に関連し、これは、電子的に利用可能なコンテンツ、すなわち、テキスト、データおよび“デジタルコンテンツ”(すなわち、画像、ソフトウェア、マルチメディア)の情報検索および取得、コンテンツ解析、ならびに、分類または類別を行い、あるいは、これらを改善する。
背景情報
安価なコンピュータおよびネットワーキング技術が、有線および無線ネットワークにより、ますます大量のデジタルコンテンツを電子的に利用可能にしたことにより、ユーザは、彼らが一貫して確実に位置特定できるよりも、かなり多くの情報に対するアクセスを有するので、情報が過負荷となった。
従来から、私立または公立の図書館における印刷された出版物のような、本、硬貨、地図および図を含むが、これらに制限されることのない物理的なコンテンツ収集物は、人である図書館司書により管理されてきている。図書館司書は、収集物のコンテンツを記述するタクソノミー的構造を開発し、各コンテンツアイテムを調査することと、各コンテンツアイテムを関連性のあるカテゴリに対して割り当てることとにより、物理的収集物に構造を課す。この人的なプロセスは、コンテンツ収集物がゆっくりと増加するときには管理可能であるかもしれないが、現在における、テキストおよびマルチメディア両方のデジタルコンテンツの急速な普及は、いずれのコンテンツ収集物所有者の編集要員も圧倒しかねない。
情報検索および取得技術の結果的な普及と商品化は、コンテンツ情報源により独立してインデックス付けされて維持され、知的所有権下におかれていて数が増加している商業データ、メディアおよびテキスト収集物を生み出してきた。これらのコンテンツ情報源は、公衆検索エンジンによるインデックス付けのためにそれらのデジタルコンテンツを完全にアクセス可能にするのには経済的インセンティブが限られており、公衆検索エンジンは、実際のコンテンツへの直接のアクセスを検索エンジンのユーザに提供することによってよりも、情報源を広告主として持つことにより、より多くの経済的利益を得る。
据え置き型のコンピュータによる従来型コンテンツアクセスに加えて、ラップトップ、パーソナルデジタルアシスタント(PDA)、および移動体電話機のような移動体コンピューティングデバイスを使用するインターネットアクセスの爆発的急増があった。この移動体デバイスの急増は著しくコンテンツ利用可能性の性質を変えており、コンテンツ発行者は移動体インターネットアクセスのために彼らのコンテンツを再フォーマットし、再組織化している。
デスクトップコンピュータユーザが複数の試行および閲覧を使用して、快適に情報を検索できるのに対して、移動体コンピューティングユーザは、小型スクリーンおよび入力エルゴノミックス、位置の特定性、および彼ら自身の移動性によって、一般的に制限されている。これらの制約のため、移動体コンピューティングユーザは潜在的に関連性のあるすべての結果を受け取ろうと望む傾向が少なく、特定の情報を即座に望む傾向が多い。
移動体デバイスの利用人口によるコンテンツアクセスの変化する性質は、再現率に対する情報取得適合率の値を増加させる際に大きな役割を果たし、新しい検索および取得プロセスは、結果集合の最初の5から10エントリに対してできる限り最高の適合率をきわだたせる。同じ理由で、移動体ユーザは彼らの所望のコンテンツへの最短パスも要求する。したがって、発行者は、コンテンツのグループまたはカテゴリへのアクセスを容易にする情報アーキテクチャで彼らのコンテンツを組織化するのにより大きなインセンティブを有する。
単一の発行者検索エンジンまたは大規模公衆検索エンジンに対する代替物として、複数のコンテンツ情報源に渡るフェデレイト検索は、ユーザが彼らのクエリに対して、関連性のある応答を得る機会を改善する。しかしながら、コンテンツ発行者は、異なる情報アーキテクチャ、すなわち“タクソノミー”を使用して、彼らのコンテンツを組織化してきている。
一般的に、タクソノミーは、階層的に組織化されて、統制語彙中の用語間の関係を表す統制語彙である。タクソノミーカテゴリは、ラベル付けされた語彙用語、または関連する語彙用語のグループであってもよい。例えば、製品販売業者名の集合は、百貨店に対する統制語彙であってもよく、カテゴリは(例えば、靴、家庭用品、電気器具のような)店舗部門名であってもよい。
どのように語彙がカテゴリ中にグループ化されるか、および、どのように結果カテゴリが互いに関して配置されるかにしたがって、同一の統制語彙から別のタクソノミーを作成することができる。
自動化されたタクソノミー開発および分類技術により、重要な実用的および商業的価値がもたらされ、その目的は、所定のコンテンツ収集物中の情報を類似したコンテンツのグループへと組織化し、各グループを適切にラベル付けして配置し、収集物にアクセスしているユーザに対して、利便性が最大のグループ組織化を表示することである。
タクソノミー管理および分類技術の結果的な急増は、生み出されている公衆タクソノミーの数を増加させてきており、公衆タクソノミーは、Yahoo!(登録商標)、Amazon(登録商標)、および、eBay(登録商標)で見受けられるようなナビゲーションディレクトリ、すなわち、“閲覧検索”として主に使用され、コンテンツ発行者、集中型公衆検索エンジン、またはコンテンツアグリゲータから利用可能な、知的所有権下にあるコンテンツへのアクセスを容易にする。
本発明は、改良されたタクソノミー管理システムに対する方法およびシステムに特に関連し、これは、既存のタクソノミーおよび類別されたコンテンツに影響を及ぼして、情報アーキテクトおよびコンテンツ発行者による最小の努力とより大きな制御により、新しいタクソノミーを自動的に作成し、維持し、そして管理する。
発明の概要
したがって、本発明の1つの観点は、上に述べた問題のうちの1つ以上を取り扱うことである。本発明の例示的な実施形態にしたがった、コンピュータにより実現される方法において、第1の複数のカテゴリを有する第1のタクソノミーを取得するステップと、1つ以上の第2のタクソノミーを取得し、第2の複数のカテゴリが1つ以上の第2のタクソノミーに関係付けられているステップと、第1の複数のカテゴリのそれぞれのカテゴリプロファイルと第2の複数のカテゴリのそれぞれのカテゴリプロファイルとを比較して、マッチングしているカテゴリと、マッチングしていないカテゴリとを識別するステップと、マッチングしているカテゴリとマッチングしていないカテゴリとを含む、第3のタクソノミーを作成するステップとを含む方法。
本発明の他の例示的な実施形態にしたがった、コンピュータにより実現される方法において、少なくとも1つの第1のカテゴリを有する第1のタクソノミーと1つ以上の第2のタクソノミーとを取得し、少なくとも1つの第2のカテゴリが、1つ以上の第2のタクソノミーの少なくとも1つに関係付けられているステップと、少なくとも1つの第1のカテゴリの第1のカテゴリプロファイルと少なくとも1つの第2のカテゴリの第2のカテゴリプロファイルとの比較に基づいて、第1のタクソノミーと第2のタクソノミーとをマージすることによって、新しいタクソノミーを作成するステップとを含む方法。
本発明の例示的な実施形態にしたがった、コンピュータにより実現されるシステムにおいて、ネットワークに通信可能に結合され、少なくとも1つの第1のカテゴリを有している第1のタクソノミーを記憶する第1のコンテンツ情報源と、ネットワークに通信可能に結合されている第2のコンテンツ情報源と、第1のコンテンツ情報源は少なくとも1つの第2のカテゴリを有している第2のタクソノミーを記憶し、ネットワークに通信可能に結合され、第1のタクソノミーと第2のタクソノミーとを識別するデータを発生させるクライアントデバイスと、ネットワークに通信可能に結合され、データを受信し、第1のタクソノミーと第2のタクソノミーとを取得するサーバとを具備し、サーバは、少なくとも1つの第1のカテゴリの第1のカテゴリプロファイルと、少なくとも1つの第2のカテゴリの第2のカテゴリプロファイルとの比較に基づいて、第1のタクソノミーと第2のタクソノミーとをマージすることによって、新しいタクソノミーを作成するようにさらに構成されているシステム。
本発明の例示的な実施形態にしたがった、コンピュータにより実現されるクエリを処理する装置において、1つ以上のコンテンツ情報源から第1のタクソノミーと第2のタクソノミーとを取得し、第1のタクソノミーは少なくとも1つの第1のカテゴリを有し、第2のタクソノミーは少なくとも1つの第2のカテゴリを有する情報源コネクタモジュールと、少なくとも1つの第1のカテゴリ、および、少なくとも1つの第2のカテゴリに対して、コンテンツカテゴリプロファイルを発生させるカテゴリコンテンツモジュールと、少なくとも1つの第1のカテゴリの第1のカテゴリプロファイルと少なくとも1つの第2のカテゴリの第2のカテゴリプロファイルとの比較に基づいて、第1のタクソノミーと第2のタクソノミーとをマージすることによって、新しいタクソノミーを作成するタクソノミーマージプログラムモジュールとを具備するシステム。
本発明の完全な理解を容易にするために、添付の図面に対する参照がここで行われる。これらの図面は本発明を制限するものとして考えられるべきでなく、例示的なものとしてのみ企図されている。
実施形態の詳細な説明
詳細な説明および添付の図面は、本発明の好ましい実施形態を表すが、添付の特許請求の範囲に規定された、本発明の精神および範囲から逸脱することなく、ここで数々の追加、修正および置換を行うことができることが理解されるだろう。特に、本発明はその精神または本質的な特徴から逸脱することなく、他の特定の形態、構造、配置、形状で、そして、他のエレメント、マテリアルおよび構成部品で、実現されてもよいことが当業者にとって明らかになるだろう。したがって、ここで開示する実施形態は、すべての観点で説明的なものであって制限的なものではないとして解釈すべきであり、本発明の範囲は添付の特許請求の範囲によって示され、前述の説明に制限されない。さらに、プロセスの結果を本質的に変えることなく、プロセスが実行される順序を変更させてもよいことに留意すべきである。
したがって、ここで開示する実施形態は、すべての観点で説明的なものであって制限的なものではないとして解釈すべきである。本発明の範囲は、前述の説明というよりは、添付の特許請求の範囲によって示され、これらの均等物の意味および範囲内に収まるすべての変更はここに内包されることが企図されている。
以下の定義は、単に例示的なものであり、以下に説明する本発明のさまざまな実施形態を例示するためにここで参照されている。本発明の実施形態および範囲は以下で述べる定義により制限されない。
検索エンジン:は、情報にインデックス付けし、情報を記憶し、およびクエリによるユーザからの命令に基づいて情報を取得するように設計されているコンピュータプログラムを指す。単一の収集物に対して個々の検索を実行するプロセスは検索エンジンと呼ばれる。複数の検索エンジンおよび/またはデータベースに対して検索を実行し、結果を組み合せるプロセスは、フェデレイトまたはメタ検索エンジンとして知られている。
コンテンツ情報源またはコンテンツ発行者:は、ネットワーク経由で利用可能なデジタルまたは非デジタルコンテンツの収集物を所有する発行者を指す。
クエリ:は、ユーザまたはタクソノミー管理システムによって探される情報もしくはデータを記述あるいは識別する要求を指す。クエリはテキスト、非テキスト、および/または、カテゴリのさまざまな組み合わせを含んでいてもよい。例えば、クエリはキーワード(例えば、用語、フレーズ、自然言語文)とともに、非テキストクエリ(例えば、画像または音声クリップのようなマルチメディア、および/または、オークション入札、購入金額もしくは旅行日付のような数的クエリ)、および/または、カテゴリ(例えば、ロック、ポップ、またはアーバンのような音楽ジャンル)を含んでいてもよい。
クエリタイプおよびフォーマットのさまざまな組み合わせが適用されてもよい。例えば、旅行予約のケースでは、クエリは日付範囲、出発都市と目的都市の対、および/または旅行人数を含んでいてもよい。音声ファイルのケースでは、クエリは言語のまたは音楽のフレーズとともに、アーティスト名、曲タイトル等を含んでいてもよい。より複雑なシナリオでは、クエリは株式相場、株価デリバティブ、信号パターンまたは等圧線に関して特徴付けられてもよい。
ユーザまたはタクソノミー管理システムはネットワークを通してクエリを送信してもよい。さらに、ユーザはコンピュータまたは他の通信デバイスを使用して、クエリを送信してもよい。
記憶されたクエリ:ユーザまたはタクソノミー管理システムは根本的な技術を何も変更することなく、主題カテゴリまたは情報源タクソノミークエリのような頻繁な検索を予めプログラムしてもよい。
結果アイテム:情報の最小部分。結果アイテムはクエリに応答して戻され、特定の文書を指すために使用される。結果アイテムは情報リソースの位置と、記述、タイトルおよび価格等のようなさまざまな他のメタデータ値とを含んでいてもよい。
結果集合:クエリに応答して戻された結果アイテムのリスト。
類別:は、そのメンバーが互いに何らかの類似性を有するタクソノミーとして潜在的に階層的に構成されているグループ中におけるエンティティの配置として規定される。類別システムはそのリソースの知的、機能的または概念的コンテンツを表現することを意図した1つ以上のグループラベルの、リソースに対する割り当てを伴う。これらのラベルは通常、統制語彙から得られる。統制語彙は、用語の集合(ターミノロジー)を正規化し、検索クエリを適切に投げかけるのに使用することができる1組の認証された用語またはラベルを特定することにより、情報取得システムと個々またはいくつかの情報取得システムとの間の通信を提供する。
タクソノミー:は、収集物中のコンテンツを組織化するのに使用される、階層的に配置された統制語彙であってもよい。インターネット検索エンジンは、コンテンツ収集物の閲覧検索を容易にするために、1つ以上の関係するタクソノミーを持っていてもよい。ウェブアプリケーション開発者およびマーケティング担当者は、異なる利害関係者の組織的使用を満足させるために、リソースの組織を2つの別の表現に分割してもよい。単一のタクソノミーノード(taxonomy node)をカテゴリと呼ぶ。ナビゲーション、すなわち、閲覧検索の技術は、記憶されたデジタル情報へのユーザアクセスのための組織的媒体としてタクソノミーを使用してもよい。関係付けられたタクソノミーのマルチレベルの集合は、エンドユーザに対して単純な構造を表示すること、および、正確な類別のために要求される詳細な構造を提供すること、のような異なる要求を満たすのに使用されることが多い。
参照タクソノミー:は、ローカル収集物中に記憶されているコンテンツアイテムの人的または機械的分類のための構造として使用される、細粒度のある、単調に展開するタクソノミーであってもよい。参照タクソノミーは、記憶されたコンテンツを類別するための基礎として使用される構造であってもよい。参照タクソノミーは、検索および情報取得エンジンによって提供されるタイプおよび主題により異なっていてもよい。類似のタイプのコンテンツ、または、類似の主題領域からのコンテンツは、同じ参照タクソノミー内に組織化されてもよい。マルチタクソノミーシステムでは、参照タクソノミーは、数多くの情報源タクソノミー中に表現されるすべてのカテゴリの結合であってもよい。
表示タクソノミー:は、参照タクソノミーの部分集合であり、コンテンツにアクセスしている個人に対する表示のために使用される。表示タクソノミーは、簡潔で、高度に可変性があるタクソノミーであってもよく、表示タクソノミーは、エンドユーザに提示され、エンドユーザによってナビゲートされ、市場の要求を満たすために頻繁に変更できる。表示タクソノミーは参照タクソノミーよりも、より可変性がある。その理由は、表示タクソノミーは個々の閲覧検索に対してカテゴリを表示するのに使用され、異なる時期において、または異なるターゲットユーザグループに対して、コンテンツ発行者スタッフが、コンテンツの異なる領域を強調表示することがさらに重要であると決定することがあるからである。コンテンツ収集物の再類別を最小化させるために、表示タクソノミーへの変更が参照タクソノミー中の変更を発生させることは稀である。マルチタクソノミーシステムでは、表示タクソノミーは、初めのうち、または、全体として、数多くの情報源タクソノミー中に表現されるカテゴリの共通部分であってもよい。
情報源タクソノミー:は、アクセス可能なコンテンツ発行者において利用可能なコンテンツを表現する公的に利用可能なタクソノミーである。フェデレイト検索システムでは、3つのレベルのコンテンツ組織があってもよい。例えば、個人により閲覧可能な表示タクソノミーと、メタ収集物中で利用可能なリソースを組織化するための参照タクソノミーレベルとに加えて、コンテンツ発行者表示タクソノミーが、ユーザ閲覧のために間接的に利用可能であってもよい。
本開示の例示的な実施形態は、単一および複数のタクソノミーを管理する方法およびシステムに関連する。例示的な方法および装置は、既存の単一および複数のタクソノミーを利用して、タクソノミーの人的または機械的な作成と管理を可能にしてもよい。例示的な方法および装置は、複数のタクソノミーの作成、メンテナンス、および記憶を行ってもよい。
自動的に発生されたタクソノミーは多様性の高いトピックを持つ大きなコンテンツ収集物の組織に対する共通感覚の期待にマッチングしないおそれがある。そこで、ここで説明した例示的な実施形態は、タクソノミー、証拠構造およびメタデータを人的に編集するのに使用される管理的ツールの詳細な説明を提供して、タクソノミーの類別とタクソノミーを使用するナビゲーションの容易性とを改善する。
本開示の例示的な実施形態は、タクソノミーを管理する方法および装置を説明し、ネットワークアクセス可能なテキスト、データおよびデジタルコンテンツ収集物に対する、類別および分類エンジンのための、そして、情報検索および取得プラットフォームのためのコンピュータソフトウェアとハードウェアによってタクソノミーは使用される。本開示の例示的な実施形態は、カテゴリ細粒度の異なるレベルにおいて、小さいまたは大きい、タクソノミーの発生を容易にし、このことは類別プロセスに対するカテゴリプロファイルとして必要とされる関係付けられた証拠構造の開発を含む。本開示の例示的実施形態は、予め分類されたコンテンツとアクセス使用法パターンとの両方の解析に基づいて、メンテナンスとエラー処理を提供する。
さらに、本開示の例示的実施形態は、タクソノミー管理に対する管理的プロセスとツールを含み、これらはグラフィカルユーザインターフェイス(GUI)、タクソノミーインポートおよびエクスポート、ローカライゼーションおよび翻訳、ユーザおよび役割処理、エラー解析ならびにレポートすることを含む。GUIは、人的および自動的なタクソノミー編集を提供し、このことは新しいカテゴリを作成すること、類別証拠構造を強化すること、ならびに、自動的および人的にタクソノミー間マッピングおよびタクソノミー内マッピングをすることのような、しかし、これらに制限されることのない、承認サイクル、自動変更履歴およびタクソノミーエラー訂正機能を備えるワークフローを含む。
図1は、本開示の例示的実施形態にしたがった、単一および複数のタクソノミーを管理するシステム100の例示的な図である。図1はネットワーク接続と構成部品レベル処理モジュールとを備えるシステムレベル図を示す。用語モジュールはコンピュータハードウェア、ソフトウェア、ファームウェア、他の命令処理デバイス、および/または、これらの組合せを指してもよい。システム100の構成部品はさらに複製され、結合され、および/または、分けられて、本開示の実施形態のさまざまな適用をサポートする。追加的なエレメントがシステム中で実現され、さまざまな適用をサポートしてもよい。
タクソノミー管理クライアント110は、ユーザが単一のおよび複数のタクソノミーを管理できるようにする。タクソノミー管理クライアント110は、移動体デバイス、または、キオスクもしくはデスクトップコンピュータのような、しかしこれらに制限されない、他の通信デバイスを含んでいてもよい。タクソノミー管理クライアント110は、グラフィカルユーザインターフェイスアプリケーションを含んでいてもよい。グラフィカルユーザインターフェイスアプリケーションは、複数のタクソノミー入力を管理するローカルリレーショナルデータベースおよびタクソノミーコンテンツレポジトリ144と対話する。タクソノミー管理クライアント110は、(有用性テストと配布チャネル要求のための)表示および参照タクソノミーの急速な開発を容易にし、タクソノミー内マッピングおよびタクソノミー間マッピングを作成する。タクソノミー管理クライアント110は、カテゴリおよび証拠作成、タクソノミー管理、記憶、エラー解析、ならびに翻訳も容易にする。タクソノミー管理クライアント110は、証拠用語の重みを含むカテゴリプロファイルをさらに入力し、そして記憶し、また、校閲および承認を含むタクソノミーワークフロープロセスを管理し、そして、ファイルに対して一括でタクソノミーインポート/エクスポートを行う。以下でより詳細に説明するように、タクソノミー管理クライアント110は、ネットワーク120を通して、タクソノミーコンテンツレポジトリ144に、および/または、タクソノミー管理サーバシステム130のタクソノミー管理処理モジュールに接続される。
タクソノミー管理クライアント110は、グラフィカルユーザインターフェイスモジュール111、ワークフローエンジンモジュール112、インポート/エクスポートタクソノミーモジュール113、ローカライゼーションモジュール114、ローカルデータ記憶115、および、ネットワーク接続116を含む。
グラフィカルユーザインターフェイスモジュール111は、タクソノミー管理クライアント110のユーザにグラフィカルユーザインターフェイスを提示して、ユーザがタクソノミー上でさまざまな機能を実行できるようにしてもよい。グラフィカルユーザインターフェイスモジュール111は、例えば、ドラッグ・アンド・ドロップのグラフィカルユーザインターフェイスアプリケーションを実現してもよい。グラフィカルユーザインターフェイスモジュール111は、タクソノミー編集ツールをユーザに提供してもよい。タクソノミー編集ツールは、ワークフローおよびコンテンツ管理機能を含んでいてもよい。ワークフローおよびコンテンツ管理機能は、ユーザおよび役割処理、認証、変更履歴、ステージング/生産サイクルアウェアネス、校閲、承認、ならびに、注釈を含む。タクソノミー編集の別のバージョンは、特定のユーザ役割に対する、読み出し/書き込み/承認機能を強化してもよい。
ユーザ役割は、表示編集者役割、ドメイン編集者役割、マネージャ役割、および、管理者役割を含む。管理者役割は、例えば、ユーザが、タクソノミーを開発することと、複数のタクソノミー間でマッピングおよび/または翻訳することと、ユーザを作成することと、ユーザ役割および権限を設定することとを可能にする。表示編集者役割は、ユーザが、彼ら自身の表示タクソノミーを作成することと、更新および削除することと、制限された選択を参照タクソノミーから読み出すこととを可能にする。ドメイン編集者役割はオントロジスト役割または図書館司書役割として呼ばれることがあり、ユーザが、表示タクソノミーおよび参照タクソノミーを開発することと、複数のタクソノミー間でマッピングおよび/または翻訳することとを可能にする。タクソノミー編集機能は、例えば、自然史または音楽のような、ドメイン編集者役割の主題領域に制限されていてもよい。マネージャ役割は、ユーザが、任意のタクソノミーを開発することと、タクソノミー間でマッピングおよび/または翻訳することと、ドメインおよび表示編集者役割による変更を承認することとを可能にする。
ワークフローエンジンモジュール112は、タクソノミー作成およびメンテナンス手続の操作上の観点を管理することができる。タクソノミー作成およびメンテナンス手続の操作上の観点は、校閲および承認タスクを構成することと、誰がどのタスクを実行するかと、それらの相対的順序は何であるかと、どのようにタスクが同期化されるのかと、どのように情報が流れてタスクをサポートするのかと、どのようにタスクが追跡されるのかとを含むが、これらに制限されない。
インポート/エクスポートタクソノミーモジュール113は、さまざまなデータファイルフォーマットからのタクソノミーの一括アップロードを容易にするインポート/エクスポート機能を実行する。さまざまなデータファイルフォーマットは、拡張可能マークアップ言語(XML)、ウェブ・オントロジ言語(OWL)、エクセル、プレーンテキストフォーマットファイル、および、他の利用可能なデータファイルフォーマットのようなものであるが、これらに制限されない。インポート機能がタクソノミー詳細を読み出してもよく、タクソノミー詳細は、データファイルからの、メタデータ、カテゴリ、証拠用語、ならびに、タクソノミー間マッピングおよびタクソノミー内マッピングを含むが、これらに制限されない。インポート機能は、タクソノミー管理サーバシステム130の内部でタクソノミーの表現を作成し、タクソノミーの表現をタクソノミーコンテンツレポジトリ144中に記憶させる。エクスポート機能は、タクソノミー管理サーバシステム130またはタクソノミーコンテンツレポジトリ144からタクソノミー表現を読み出して、メタデータ、カテゴリ、証拠用語およびマッピングを外部ファイルに書き出す。タクソノミーインポートおよびエクスポート機能は、タクソノミスト、オンロジスト、翻訳者、編集者および発行者からの人的な更新を容易にするために、独自のタクソノミースキーマ、および、(例えば、オープンディレクトリプロジェクト(DMOZ)と、国際標準製品・サービス分類(UNSPSC)タクソノミーとによりサポートされるもののような)標準のタクソノミースキーマを使用して、代替フォーマットでインポート/エクスポートできるように拡張可能であってもよい。代替フォーマットは、マイクロソフトエクセル(登録商標)スプレッドシート、プレーンテキスト、OWLおよびXMLファイルを含むが、これらに制限されない。さらに、インポート/エクスポートタクソノミーモジュール113は、タクソノミーモードからシソーラスモードに切り替えて、(例えば、シンプルナレッジ組織化システム(SKOS)およびNISOシソーラス作成標準Z39.19のような)標準シソーラスフォーマットでコンテンツを表示し、インポートし、または、エクスポートすることができる。
ローカライゼーションモジュール114はタクソノミーローカライゼーションを実行する。各タクソノミーメタデータ、カテゴリラベル、および、類別証拠用語は、地域の特性を特定するプロパティを有する。地域の特性を特定するプロパティは、言語、国、文字セットエンコーディングのようなものであるが、これらに制限されない。ローカライゼーションモジュール114は、人的および自動的プロセスの組合せによって、ユーザがタクソノミーを直接編集できるようにし、メタデータ、カテゴリラベルおよび用語翻訳を追加できるようにする。ローカライゼーションモジュール114は、人的にタクソノミーをローカライズし、または、外部の翻訳者によるローカライゼーションのためにファイルをインポート/エクスポートし、あるいは、人の校閲サイクルを備える自動化された翻訳プロセスを管理するために使用することができる。タクソノミーカテゴリラベルは、可能なときは、ベース言語およびターゲット言語の両方のバージョンを有している情報源タクソノミーからの用語の集合(ターミノロジー)を使用して、翻訳される。さらに、ローカライゼーションモジュール114は自動化された方法を実行し、翻訳辞書、自動化された機械翻訳プロセス、人的翻訳、および/または、これらの組合せを使用して、タクソノミーローカライゼーションを開始してもよい。
ローカルデータ記憶115は、作成、メンテナンスおよび校閲サイクルの間にタクソノミーのワーキングコピーを記憶できるようにする。
ネットワーク接続116は、タクソノミー管理クライアント110が、ネットワーク120を通して、タクソノミー管理サーバシステム130に通信することを可能にする。ネットワーク120は、インターネットまたは他のネットワークを含んでいてもよい。
タクソノミー管理サーバシステム130は、有線または無線ネットワーク接続によりネットワーク120を通してタクソノミー管理クライアント110に通信してもよく、ネットワーク124を通して(例えば、外部コンテンツ情報源150a、150b、・・・150kのような)コンテンツ情報源、(データベースとして表される)記憶されたコンテンツ収集物モジュール170、および/または、例えば、“オンデッキ”コンテンツ情報源のような他の情報源にさらに通信してもよい。
タクソノミー管理サーバシステム130は、クエリすることに、取得することに、および/または、他の処理に関係付けられた機能を実行するさまざまなモジュールを含んでいてもよい。例えば、タクソノミー管理サーバシステム130はネットワーク通信モジュール132、タクソノミープロセッサモジュール134、カテゴリコンテンツプロセッサモジュール136、タクソノミーマージプログラムモジュール138、情報源コネクタモジュール140、1つ以上の情報源タクソノミーキャッシュ142a、・・・142nおよび/または他のモジュールを含んでいてもよい。タクソノミー管理サーバシステム130のさまざまな構成部品はさまざまなアプリケーションおよびプラットフォームをサポートするために、さらに二重化され、組み合わされ、および/または統合されてもよい。さらに、モジュール、キャッシュおよび他の構成部品は、複数のシステム、プラットフォーム、アプリケーション等に渡って実現されてもよい。さまざまな適用をサポートするために、追加的なエレメントがシステムで実現されてもよい。
ネットワーク通信モジュール132は、ネットワーク120、ネットワーク124、ならびに/あるいは、他のネットワークおよび通信ポータルを通して、バランスの取れたデータの交換を管理する。
タクソノミープロセッサモジュール134は、保存されたタクソノミーを調べて、カテゴリコンテンツプロファイルおよび証拠用語を作成し、新しいタクソノミーを作成し、そして既存のタクソノミーを維持してもよい。保存されたタクソノミーを調べることは情報源タクソノミーおよびコンテンツをクエリすることを含む。タクソノミープロセッサモジュール134は、保存されたタクソノミー閲覧履歴とユーザクエリとを調べて、タクソノミー自動化プロセスを増強および改良し、ユーザに対する個人化サービスと関連カテゴリとクエリ曖昧性除去とを提供する。ユーザに対する個人化サービスは検索、サービスおよび広告の推奨を含む。
カテゴリコンテンツプロセッサモジュール136は、コンテンツ情報源150に記憶されたコンテンツ収集物を調べて、コンテンツタイプおよび利用可能なメタデータに基づき、何らかの関連する機械学習プロセスおよびアルゴリズムを使用して重みを有するカテゴリプロファイルおよび証拠用語リストを発生させてもよい。何らかの関連する機械学習プロセスおよびアルゴリズムは、シングルベクターマシン(SVM)、または、k−最近傍法(knn)分類のようなものである。カテゴリコンテンツプロセッサモジュール136は、タクソノミーマージプログラムモジュール138による使用のために情報源タクソノミーを使用して、コンテンツ情報源150において予め分類された文書を解析して、タクソノミーカテゴリ間のマッピングを提案してもよい。
タクソノミーマージプログラムモジュール138は、例えばツリー横断アルゴリズムを使用して、1つ以上の既存のタクソノミーをマージし、カテゴリコンテンツプロセッサモジュール136によって発生されるカテゴリコンテンツプロファイルを比較することにより新しいタクソノミーを作成するプロセスを管理してもよい。ツリー横断アルゴリズムは、例えば、幅優先検索のようなものであるが、これに制限されない。
情報源コネクタモジュール140は、タクソノミーおよびコンテンツに対するコンテンツ発行者にクエリし、情報源要求に適切な要求をフォーマットし、情報源からの応答を処理し、それを発行者特有のフォーマットから内部XMLフォーマットへと再フォーマットするフレームワークを含む。
コンテンツ情報源150a・・・150kはいくつかのモジュールを使用してそれらのコンテンツ収集物からの情報取得を容易にする。コンテンツ情報源150は、有線もしくは無線ネットワーク接続によりネットワーク接続160a・・・160kを通して、タクソノミー管理クライアント110、および、タクソノミー管理サーバシステム130、または、他のプログラムに通信する。検索エンジンアクセスモジュール164a・・・164kは、検索エンジン独自のインデックス付けアルゴリズムを使用して到来クエリに対して構文解析することと、クエリをコンテンツインデックスにマッチングすることと、マッチングしているコンテンツアイテムの記述および位置のようなメタデータを含む結果集合を戻すこととを行う。コンテンツインデックス166a・・・166kは、記憶メカニズムとコンピュータプログラムを含んでいてもよい。これらは、コンテンツ情報源150のコンテンツ収集物中に含まれるリソースからの、メタデータ、テキストおよび/または他の属性を含有していてもよい。記憶されたコンテンツ収集モジュール170a・・・170kは、リソース、マルチメディアおよび/または他のコンテンツを含んでいてもよい。リソース、マルチメディアおよび/または他のコンテンツは、検索エンジンによってインデックス付けされ、メタデータにより参照され、結果集合中にリストアップされた位置によりアクセス可能である。
検索エンジンアクセスモジュール164a・・・164kは、(例えば、文書、画像、ウェブサイトのような)コンテンツアイテムの収集物に予めインデックス付けし、次にクエリに応答して、クエリを満たすコンテンツアイテムのために1つのまたはグループのコンピュータ中の収集物を調査し、可能性のあるマッチングの順序付けられたリストをカテゴリコンテンツアイテム結果集合として戻す。コンテンツアイテムがどのくらい近くクエリにマッチングしているかを意味している関連性ランキングを示す結果アイテムメタデータが、明示的に戻されてもよく、または、暗黙的にカテゴリコンテンツアイテム結果集合中のアイテムの順序で与えられてもよく、通常最も関連性のあるコンテンツアイテムは順序付けられたリストのトップにある。ランキングは数的類似性スコア値に基づいて、またはコンテンツ発行者によってコンテンツに対して予め計算されて、フルテキストもしくはデータベースインデックスで記憶されている多くの可能性のある尺度のうちの1つに基づいていてもよい。
検索エンジンアクセスモジュール164a・・・164kは、少なくとも3つのタイプ、すなわち、集中型インデックス付け、メタ検索、およびフェデレイト検索エンジンに変化してもよく、そしてこれらを含んでいてもよい。各タイプは異なるタイプのコンテンツアイテム収集物に対して検索を行うのに使用される。例えば、集中型インデックスは、単一企業コンテンツ管理システム中に、または、公衆に利用可能なおびただしい数のインターネット可能にされたウェブサイト中に見受けられるもののような、完全にアクセス可能な均質なコンテンツに対する検索を容易にするのに使用される。
異なるコンテンツ情報源150は、テキストおよび/またはメタデータの異なるセクションに対して、異なるアルゴリズムを使用して、もしくは、同一のアルゴリズムを処理することにより、それらのコンテンツアイテム収集物をインデックス付けしてもよい。したがって、いくつかの例では、ローカル情報源で計算されたランキング統計および類別は、カテゴリを結合するときに、直接比較されない。
コンテンツ情報源150のモジュールおよび他の構成部品は、複数のシステム、プラットフォーム、アプリケーション等に渡って実現されてもよい。さまざまな適用をサポートするために、追加的なエレメントがコンテンツ情報源システム中で実現されてもよい。
記憶されたコンテンツ収集物モジュール170は、収集アイテム[170a−a…170a−e]および[170a−a、170a−b、170b−a、170b−b、170b−e]のようなデータアイテムを含んでいてもよい。例えば、コンテンツアイテムは、コンテンツアイテム[170a−a…170a−e]でのように、1つの収集物中に出現してもよい。しかしながら、コンテンツアイテムは、記憶されたコンテンツ収集物モジュール170aと170b中のコンテンツ集合[170a−a、170a−b]のオーバーラップにより示されるように、1つより多い収集物中に出現してもよい。
本開示の実施形態にしたがうと、情報源コネクタモジュール140は、個々のコンテンツ情報源150(例えば、検索エンジン、データベース、他のデータ情報源等)からの情報源タクソノミー162を受け取り、他のモジュールによる処理を待機している間に、情報源タクソノミー162を情報タクソノミーキャッシュ142a…142n中にさらに記憶させる。情報タクソノミーキャッシュ142は、クエリに応答してコンテンツ情報源150から戻された情報源タクソノミー162を含む。情報源タクソノミーキャッシュ142は、関係する一意的なキャッシュキーを持っていてもよく、これは、情報源識別子、クエリまたはカテゴリ用語、および/または、再使用を容易にする他の要因を含んでいてもよい。
クエリ特有の情報源タクソノミーキャッシュ(例えば、情報源タクソノミーキャッシュ142a…142n)は、カテゴリコンテンツプロセッサモジュール136における処理のために、コンテンツ情報源150a…150kから戻されたタクソノミーおよび/またはコンテンツを記憶してもよい。カテゴリコンテンツプロセッサモジュール136は、コンテンツを解析し、カテゴリコンテンツプロファイルを作成し、タクソノミーマージプログラムモジュール138による使用のために、タクソノミーコンテンツレポジトリ144中にプロファイルを記憶させる。
タクソノミーマージプログラムモジュール138は1つ以上の情報源タクソノミーから新しいタクソノミーを作成する。タクソノミーマージプログラムモジュール138は、1つ以上のコンテンツ情報源タクソノミーからタクソノミーを抽出し、妥当性を検査し、および、更新するプロセスを含む。タクソノミーマージプログラムモジュール138は2つ以上のタクソノミーのコンテンツを自動的に比較するプロセスを含んでいてもよく、そして、新しいタクソノミー中のマッチングしているカテゴリを提案してもよい。これらのプロセスは、例えば、インターネットをクロールして、類似したコンテンツを含んでいる新しいコンテンツ情報源150を位置特定する、ウェブスパイダーに付随していてもよい。
タクソノミーマージプログラムモジュール138は(複数の既存のタクソノミーおよびこれらの関係する文書からの)タクソノミーの作成およびメンテナンスと、(同一タクソノミー中のカテゴリ間での)タクソノミー内マッピングと、(異なるタクソノミー中のカテゴリ間での)タクソノミー間マッピングと、類別メンテナンスとを提供し、カテゴリおよび証拠のドリフトと旧式化を軽減し、タクソノミー拡張と、類別エラー解析と、校閲および承認ワークフローとを発生させる。校閲および承認ワークフローは、タクソノミー、カテゴリ、証拠およびメタデータの作成、更新、翻訳を確認するためのものである。タクソノミーマージプログラムモジュール138は、情報源タクソノミーを使用して、コンテンツ情報源150において予め類別された文書を解析し、タクソノミーカテゴリ間のマッピングを提案してもよい。これらのプロセスのそれぞれは、図2−4を参照して以下で説明する。
図2−4は、本開示の例示的な実施形態にしたがった方法のフロー図を図示する。この例示的な方法は例として提供され、本開示にしたがった方法を実行するさまざまな方法がある。図2−4に示した方法は、1つのシステム、または、さまざまなシステムの組み合わせによって実行され、または、さもなければ実施されてもよい。例として、図1中で示したシステム100により実行されるものとして方法を以下で説明し、図2−4の例示的方法を説明する際にシステム100のさまざまなエレメントを参照する。図2−4に示した各ブロックは、例示的な方法で実行される、1つ以上のプロセス、方法、または、サブルーチンを表す。
図2は、本開示の例示的な実施形態にしたがったプロセスの例示的なフロー図を図示する。プロセスにより、現存するタクソノミーが取得され、処理されて、タクソノミーカテゴリプロファイルとコンテンツプロファイルとが作成される。フロー図200はブロック212において開始する。
ブロック210において、情報源コネクタモジュール140は、コンテンツ情報源150からの情報源タクソノミーを要求する。ブロック212において、コンテンツ情報源150は、要求を受信して、要求された情報源タクソノミーを情報源コネクタモジュール140に戻す。ブロック214において、情報源コネクタモジュール140は、情報源タクソノミーを情報源タクソノミーキャッシュ142中に記憶させてもよい。
ブロック232において、タクソノミープロセッサモジュール134は、発行者の好ましいフォーマットから、タクソノミー管理サーバシステム130により使用されるフォーマットへと情報源タクソノミーを再フォーマットしてもよい。例えば、タクソノミープロセッサモジュール134は、情報源タクソノミーをウェブ・オントロジ言語(OWL)表現へと再フォーマットして、タクソノミーカテゴリ、メタデータおよびタクソノミー内マッピングを首尾一貫したフォーマットで取り込んでもよい。
一度再フォーマットされると、ブロック234において、タクソノミープロセッサモジュール134は再フォーマットされた情報源タクソノミーをタクソノミーコンテンツレポジトリ144に記憶させる。
ブロック236において、タクソノミープロセッサモジュール134は、再フォーマットされた情報源タクソノミーをカテゴリコンテンツプロセッサモジュール136に渡す。
カテゴリコンテンツプロセッサモジュール136は、ルートカテゴリにおいて開始して、情報源タクソノミー内の各カテゴリに進み、以下に説明するブロック241-245のそれぞれを完了させる。ブロック241において、カテゴリコンテンツプロセッサモジュール136は、カテゴリコンテンツアイテム結果集合のために、情報源タクソノミーに関係付けられたコンテンツ情報源150に対してクエリする。カテゴリコンテンツアイテム結果集合は、特定のカテゴリに関係付けられた情報源タクソノミー中のコンテンツアイテムのすべてを識別する。例えば、カテゴリコンテンツアイテム結果集合は、最新のニュースヘッドライン、または、すべてのダウンロード可能なポップ音楽着信音のリストを含んでいてもよい。カテゴリコンテンツアイテム結果中の各コンテンツアイテムに対して、カテゴリコンテンツプロセッサモジュール136はタクソノミーカテゴリラベルと、各コンテンツアイテムに関係付けられたメタデータとを識別してもよく、またウェブサイト/ページから関心のあるコンテンツを集めてもよい。
ブロック242において、カテゴリコンテンツプロセッサモジュール136は、コンテンツ情報源150から、カテゴリコンテンツアイテム結果集合中で識別された各コンテンツアイテムを取得する。
ブロック243において、カテゴリコンテンツプロセッサモジュール136は、取得されたそれぞれのコンテンツアイテムから特徴を抽出する。タクソノミーの特定のカテゴリ内のコンテンツアイテムを類別するのに使用されるコンテンツアイテムから関連性のある証拠用語を決定することによって、カテゴリコンテンツプロファイルを作成するのに抽出された特徴が使用される。証拠用語は、例えば、任意のストップワードでない用語(例えば、“a”,“the”“but”等以外の単語)、n-タームフレーズ(例えば、“random terms”に対する“ran dom ter ms”のような、3文字テキスト分割)、固有名詞(例えば、人、場所、物)、メタデータ(例えば、アーティスト名、ファイルサイズ、画像寸法、価格、色、位置)、構造的強調インジケータ(例えば、ヘッドライン、タイトルまたは要約)および/または導出された統計を含む。導出された統計は、例えば、テキスト中の単語数に対する画像数の比、コンテンツアイテムが電話番号、住所、または、価格を含むというインジケータ、コンテンツアイテム中に特定の用語が出現する回数、あるいは、コンテンツアイテムに含まれている、単語、画像もしくは他の測定可能なアイテムの存在または不存在を示す、他の統計であってもよい。
ブロック244において、タクソノミー内の特定のカテゴリに関係づけられた(例えば、コンテンツアイテムのいくつか、または、すべてのような)コンテンツアイテムを代表する集合に対して、カテゴリコンテンツプロセッサモジュール136は、抽出された特徴を処理して、タクソノミー内のカテゴリのそれぞれに対するカテゴリプロファイルを作成してもよい。例えば、カテゴリコンテンツプロセッサモジュール136は、“ロサンゼルスでのアメリカ癌研究学会の年次会合において月曜に提示された、Mayoクリニックの2つの論文が、炎症を減少させることは癌の予防を助ける、と提案した。”というフレーズを含んでいる“病気”カテゴリから、テキストページを読み出してもよい。“病気”カテゴリ中のこのページに対するコンテンツプロファイルは、[炎症を減少させること 1、癌 2、研究 1、Mayoクリニック 1、論文 2]のように作成されるだろう。“子供および10代の若者に対する抗うつ薬の新しい論文の著者は、何人かの患者が自殺の考えを持つ機会を増加させる小さい危険性よりも治療の利点が勝っている、と述べている。”というテキストを持っている、異なる記事に対するコンテンツプロファイルは、[抗うつ薬 1、自殺の考え 1、論文 1]のように作成されるだろう。カテゴリプロファイルは、カテゴリ中のすべてのコンテンツに対するコンテンツプロファイルの集合を解析することと、そのカテゴリ中のテキストのメンバーシップを識別するために、特徴の最も有用なものを含む重みづけされたプロファイルを発生させることとにより作成される。例示的な“病気”カテゴリに対して、プロファイルは[炎症 0.5、癌 1、自殺 0.5、論文 1.5]であるとして決定されるだろう。
カテゴリコンテンツプロセッサモジュール136は、特定のコンテンツアイテムに関係付けられた用語のリストを発生させることによって、用語/コンテンツのアイテム頻度行列により文書を発生させることによって、行列を処理して([0,1]に)正規化された類似度行列を取得することによって、行列を処理してアイテム中の用語に対する解析係数を取得することによって、および/または、特徴解析の結果として用語重みを発生させるSVMまたはknnのような任意の機械言語処理アルゴリズムによって、カテゴリコンテンツプロファイル中の証拠用語の重みを決定してもよい。
ブロック245において、カテゴリコンテンツプロセッサモジュール136は、タクソノミーコンテンツレポジトリ144中にタクソノミーカテゴリのそれぞれに対するカテゴリプロファイルを記憶させる。カテゴリコンテンツプロセッサモジュール136は、タクソノミー内の各カテゴリに対して、ブロック241-245を繰り返す。一度、カテゴリコンテンツプロセッサモジュール136がタクソノミー内のすべてのカテゴリを処理し終わると、ブロック260において、カテゴリコンテンツプロセッサモジュール136はタクソノミーマージプログラムモジュール138に知らせる。
図3は、本開示の例示的な実施形態にしたがって、タクソノミーマージプログラムモジュール138により実行されるタクソノミーマージプロセスの例示的なフロー図を図示する。タクソノミーマージプログラムモジュール138により、1つ以上のタクソノミーがマージされて、新しいタクソノミーT’が作成される。タクソノミーマージプログラムモジュール138は、効率的なツリー横断アルゴリズムを使用してもよい。効率的なツリー横断アルゴリズムは、例えば、第1のタクソノミーを探索し、各カテゴリを訪問する、深さ優先検索または幅優先検索のようなものであるが、これらに制限されない。フロー図はブロック310で開始する。
ブロック310において、新しいタクソノミーT’を作成するために、タクソノミーマージプログラムモジュール138は、新しいタクソノミーT’に対するタクソノミータイプを選択するようにユーザを促す。タクソノミータイプは、上で説明したように、例えば、参照タクソノミー、表示タクソノミー、位置タクソノミー、主題タクソノミー等を含む。
ブロック320において、タクソノミーマージプログラムモジュール138は比較器関数を選択および/またはビルドするようにユーザを促す。タクソノミーマージプログラムモジュール138により比較器関数を使用して、マッチングを識別してもよい。マッチングは予め特定されたしきい値を上回っているコンテンツプロファイル間の関係として規定されてもよい。タクソノミーマージプログラムモジュール138は、第1のカテゴリプロファイルと第2のカテゴリプロファイルとを比較して、マッチングが存在するかどうか決定してもよく、このことは以下でより詳細に説明する。
ブロック330において、タクソノミーマージプログラムモジュール138はマージするためにN個のタクソノミーを選ぶようにユーザに促す。ここで、Nは正の整数(すなわち、1,2,3・・・)である。
ブロック334において、タクソノミーマージプログラムモジュール138は、N=1であるか決定する。N=1である場合、フロー図300はブロック338に続く。Nが1に等しくない場合、フロー図300はブロック340に続く。
ブロック338において、タクソノミーマージプログラムモジュール138は、新しいタクソノミーT’が元のタクソノミーTNと同一かどうか決定して、元のタクソノミーTN-1を新しいタクソノミーT’として、タクソノミーコンテンツレポジトリ中に記憶させる。
ブロック340において、タクソノミーマージプログラムモジュール138は、N個の異なるタクソノミーTiを各タクソノミー中のカテゴリの数Mにより順序付けする。例えば、タクソノミーT1は、M1=5カテゴリを含んでいてもよく、タクソノミーT2は、M2=3カテゴリを含んでいてもよい。
ブロック350は、本開示の例示的な実施形態にしたがって、タクソノミーマージプログラムモジュール138により実行されるタクソノミーマージプロセスの例示的なフロー図を図示する。タクソノミーマージプログラムモジュール138によって、2つ以上のタクソノミーが数多くのタクソノミーの結合としてマージされ、新しいタクソノミーT’が作成される。この新しいタクソノミーは、上に説明したように、数多くの情報源タクソノミーの上位集合として作成される参照タクソノミーであってもよい。情報源タクソノミーの共通部分として、または、比較器関数により表現された情報源タクソノミーの類似性に基づいて、他のタクソノミーを作成してもよい。
ブロック350において、タクソノミーマージプログラムモジュール138は新しいタクソノミーT’に対するカテゴリリストt’を作成する。カテゴリリストt’はN個すべてのタクソノミーのすべてのカテゴリの上位集合である。タクソノミーマージプログラムモジュール138は、各タクソノミーTi内の各カテゴリtijをマージして、新しいタクソノミーT’を作成する。ここで、i=1・・・Nおよびj=1・・・Miである。
ブロック351において、タクソノミーマージプログラムモジュール138は、T1のカテゴリおよびマッピングを含むように新しいタクソノミーT’を設定し、カテゴリ内マッピングの重みを1に等しく設定してもよい。
ブロック352において、i=2・・・Nである各タクソノミーTiに対して、新しいタクソノミーT’中のk=1・・・M’である各カテゴリt’kに対して、および、j=1・・・Miである各カテゴリtijに対して、タクソノミーマージプログラムモジュール138は、以下に説明するように、ブロック360、361、362、364および366を実行する。
ブロック360において、タクソノミーマージプログラムモジュール138は、比較器関数を適用して、カテゴリtijのカテゴリプロファイルとタクソノミーT’内のカテゴリt’kのすべてのカテゴリプロファイルとを比較することによって、カテゴリtijをタクソノミーT’にマージする。タクソノミーマージプログラムモジュール138は、t’kのカテゴリプロファイルとタクソノミーTi中の各カテゴリtijのカテゴリプロファイルとを比較する。
ブロック361において、タクソノミーマージプログラムモジュール138は、タクソノミーT’内のカテゴリt’kのカテゴリプロファイルとカテゴリtijのカテゴリプロファイルとの間のマッチングを識別し、フロー図300はブロック362に続く。タクソノミーマージプログラムモジュール138が、タクソノミーT’内のカテゴリt’kのカテゴリプロファイルとカテゴリtijのカテゴリプロファイルとの間のマッチングを識別しない場合、フロー図300はブロック364に続く。
ブロック362において、タクソノミーマージプログラムモジュール138は、タクソノミーT’内のカテゴリtkとその親カテゴリとの間のカテゴリマッピングの重みを増加させ、タクソノミーコンテンツレポジトリ144中にマッピングの重みを記憶させる。
ブロック364において、タクソノミーマージプログラムモジュール138はカテゴリtijを新しいタクソノミーT’に追加し、ブロック366において、タクソノミーマージプログラムモジュール138はカテゴリtijをt’k+1としてマッチングしていないマッピングリスト中に配置する。ここで、“l”はT’に追加される新しいカテゴリの数である。何らかのものが識別された場合、後続するマッチングしていないカテゴリは、t’k+2、t’k+3等のように、マッチングしていないマッピングリストに追加される。タクソノミーマージプログラムモジュール138は、次にタクソノミーコンテンツレポジトリ144中にカテゴリtijを記憶させる。フロー図300は、それぞれのタクソノミーT2,・・・,TNのすべてのカテゴリtijがタクソノミーT’のカテゴリt’k+1等と比較され終わるまで、ブロック352に戻る。
ブロック370において、タクソノミーマージプログラムモジュール138はタクソノミー内マッピングを作成する。
図4は、本開示の例示的な実施形態にしたがって、タクソノミーマージプログラムモジュール138により実行されるタクソノミー内カテゴリマッピングプロセスの例示的なフロー図を図示しする。タクソノミーマージプログラムモジュール138により、1つ以上のタクソノミーがマージされ、新しいタクソノミーT’が作成される。
タクソノミー内マッピングは、同じタクソノミー中のカテゴリを関係付けて、親子関係を持っているカテゴリによる階層的ツリーとしてタクソノミーを作成する。これらの関係は、統制語彙をカテゴリのサブツリーへと区分し、このことは類別を容易にし、情報取得に対する有用性を向上させる。
タクソノミーマージプログラムモジュール138は、例えば、2つのタクソノミーを探索して、同一のまたはほぼ同一のカテゴリプロファイルを持っている異なる情報源タクソノミーからのカテゴリから、新しいタクソノミー中のカテゴリの間の関係を作成する。
ブロック400は、本開示の例示的な実施形態にしたがって、タクソノミーマージプログラムモジュール138により実行されるタクソノミー内マッピングプロセスの例示的なフロー図を図示する。タクソノミーマージプログラムモジュール138により、2つ以上のタクソノミーが数多くのタクソノミーの結合としてマージされるとき、マッピングが作成されて、新しいタクソノミーT’が作成される。
ブロック410において、タクソノミーマージプログラムモジュール138は、新しいタクソノミーT’から、k=1・・・M1であるカテゴリリストt’k を取得する。カテゴリリストt’kはタクソノミーT’からのすべてのカテゴリの集合である。
ブロック420において、タクソノミーマージプログラムモジュール138は、新しいタクソノミーT’から、i=(M’−M1)・・・M’であるマッチングしていないマッピングリストt’iを取得する。マッチングしていないマッピングリストt’iは、タクソノミーTi,i=2・・・Nからのすべてのマッチングしていないカテゴリの集合である。
ブロック421において、タクソノミーマージプログラムモジュール138は比較器関数を使用して、カテゴリt’iのカテゴリプロファイルとカテゴリt’kのカテゴリプロファイルとを比較する。例示的な実施形態では、タクソノミーマージプログラムモジュール138は、比較器関数を適用して、タクソノミーT’内のカテゴリt’kのカテゴリプロファイルとカテゴリt’iのカテゴリプロファイルとを比較することにより、1の重みを有するマッピングを作成する。タクソノミーマージプログラムモジュール138は、次のタクソノミーTi中の各カテゴリt’iのカテゴリプロファイルとt’kのカテゴリプロファイルとを比較する。
ブロック422において、タクソノミーマージプログラムモジュール138は、タクソノミーT’内のカテゴリt’kのカテゴリプロファイルとカテゴリt’iのカテゴリプロファイルとの間の近似マッチングを識別し、フロー図はブロック424に進む。比較器関数の結果がブロック320で特定された近似マッチングしきい値よりも大きい場合、タクソノミーマージプログラムモジュール138は近似マッチングを識別する。
タクソノミーマージプログラムモジュール138が、タクソノミーT’内のカテゴリt’kのカテゴリプロファイルとカテゴリt’iのカテゴリプロファイルとの間のマッチングを識別しない場合、フロー図はブロック426に続く。
ブロック424において、タクソノミーマージプログラムモジュール138はタクソノミーT’内のカテゴリt’kとその親カテゴリとの間のカテゴリマッピングの重みを増加させ、マッピングの重みをタクソノミーコンテンツレポジトリ144中に記憶させる。
ブロック426において、タクソノミーマージプログラムモジュール138は、カテゴリt’iのカテゴリプロファイルとカテゴリのグループの関数とを比較してもよく、カテゴリのグループの関数はタクソノミーT’内の同じ親カテゴリを持つ、すべてのカテゴリt’kのカテゴリプロファイルの比較からの比較器関数結果の平均のようなものである。比較器関数の結果が近似マッチングである場合、タクソノミーマージプログラムモジュール138はブロック424に進む。比較器関数の結果が近似マッチングでない場合、タクソノミーマージプログラムモジュール138はiを増加させ、ブロック420の始めに戻る。
図5は、統制語彙500と、2つの異なる例示的なタクソノミー501および502との例を示す。統制語彙500は販売業者ブランド名からなり、タクソノミー501および502は、異なる階層に組織化した統制語彙500の2つの例を表す。タクソノミー501および502は、統制語彙500のカテゴリと、カテゴリ内のサブカテゴリとを例示する。例えば、タクソノミー501は“ファッション”および“キッチン用品”カテゴリを含み、タクソノミー502は“男性ファッション”、“女性ファッション”、“キッチン用品” および“家電”カテゴリを含む。“キッチン用品”カテゴリは “鍋とフライパン”および“ナイフ”サブカテゴリをさらに含む。
図6は、例示的なタクソノミー601の例を示し、例示的タクソノミー601は、本開示で実現される方法および装置を使用して、タクソノミー501および502の上位集合として作成される。例えば、タクソノミー601は、タクソノミー501からの“ファッション”および“キッチン用品”カテゴリを含み、タクソノミー502からの“男性ファッション”、“女性ファッション”、“キッチン用品” および“家電”カテゴリを含む。
したがって、例示的な実施形態は、本開示の例示的な実施形態にしたがって、関係する単一および複数のタクソノミーを管理する方法および装置を開示する。例示的な実施形態は、複数の類似したタクソノミーから作成された、単一の均質なタクソノミーを管理するために使用してもよい。ここで説明した例示的なプロセスおよびツールを使用して、タクソノミー類別と、人的タクソノミー類別および自動的情報クエリ類別と、管理的機能タクソノミーツールと、自動化されたタクソノミー作成および類別と、タクソノミーマッピングおよびエラー解析と、移動体デバイス上でのタクソノミー履歴作成および管理とを通して、タクソノミーを管理してもよい。例示的なタクソノミー管理方法および装置は、情報に対するクエリを解析し、類別する際に、移動体デバイスのためのコンピュータソフトウェアおよびハードウェアの情報検索および取得プラットフォームを使用して実現されてもよい。
例示的な実施形態は、タクソノミーの作成、メンテナンスおよび管理を支援してもよい。例示的な実施形態は、これらに制限されるものではないが(例えば、音楽ジャンルまたは製品タイプのような)主題および機能タクソノミー、翻訳辞書、(例えば、人、場所および物のような)固有名詞辞書、ならびに、(例えば、国、州、郡、都市タクソノミーのような)地理的タクソノミーを開発するために使用してもよい。例示的な実施形態の管理的機能は、タクソノミーおよびカテゴリ(すなわち、タクソノミーノード)作成、バージョン管理、更新、メタデータ作成、および、注釈付けを含んでいてもよい。ワークフロー機能は、タクソノミーとカテゴリの自動的なおよび人的な作成、校閲ならびに承認を含む。
例示的な実施形態は、安全な変更操作をもたらす、ユーザおよび役割のアクセス制御リストの作成およびメンテナンスを容易にする。
本開示の例示的な実施形態にしたがうと、この開示で説明したシステムおよびプロセスは、任意の汎用または専用計算デバイス上で、スタンドアローンのアプリケーションとして、あるいは、クライアントサーバモードで動作するグループとして、ネットワーク上で接続されたいくつかの汎用または専用計算デバイスを通して実施される。本開示の他の実施形態にしたがうと、それらの中に記憶された複数のコンピュータ読取可能プログラムコードを持っている、コンピュータ利用可能および書込可能な媒体が、本開示のプロセスを実現するために提供されてもよい。本開示のプロセスおよびシステムは、Windows(登録商標)オペレーティングシステム、または、Unix(登録商標)ベースのオペレーティングシステム(例えば、Unixベースのオペレーティングシステムのヒューレットパッカード(登録商標)またはレッドハットリナックス(登録商標)バージョン)のさまざまなバージョン、あるいは、AS/500ベースのオペレーティングシステムのさまざまなバージョンのような、さまざまなオペレーティングシステム内で実現されてもよい。例えば、コンピュータ利用可能および書込可能な媒体は、CD ROM、フロッピー(登録商標)ディスク、ハードディスク、または他の任意のコンピュータ利用可能媒体から構成されていてもよい。本開示を具体化するシステムの構成部品のうちの1つ以上は、コンピュータ利用可能媒体がシステムにインストールされるとき、これらの構成部品が記述された機能をシステムに実行させるように、コンピュータ利用可能な媒体に記憶されている機能的命令の形態のコンピュータ読取可能プログラムコードを含んでいてもよい。本開示に対するコンピュータ読取可能プログラムコードは、他のコンピュータ読取可能プログラムソフトウェアと抱き合わせ販売されていてもよい。また、構成部品のいくつかのものだけが、コンピュータ読取可能コード中に提供されていてもよい。
さらに、さまざまなエンティティおよびエンティティの組み合わせがコンピュータを用いて、上に説明した機能を実行する構成部品を実現してもよい。本開示の実施形態にしたがうと、コンピュータは、入力デバイス、出力デバイス、プロセッサデバイス、および、データ記憶デバイスを含む、標準コンピュータであってもよい。本開示の他の実施形態にしたがうと、さまざまな構成部品は同一の企業またはエンティティ内の異なる部門のコンピュータであってもよい。他のコンピュータ構成を使用してもよい。本開示の他の実施形態にしたがうと、さまざまな構成部品は企業または有限会社のような別々のエンティティであってもよい。適用できる法律および規則に準拠して、他の実施形態を使用してもよい。
本開示のある特定の実施形態にしたがうと、システムはソフトウェアシステムの構成部品を含んでいてもよい。システムはネットワーク上で動作してもよく、付加的データまたはアプリケーションサービスを動作させる、共通データベースおよび共通サーバを共有する他のシステムに接続されていてもよい。他のハードウェア配置が提供されてもよい。
本開示の他の実施形態、使用および利点は、ここで開示した本開示の仕様および実行を考慮すると、当業者に明らかになるだろう。仕様および例は、例示的なものとしてのみ考慮されるべきである。本開示の意図する範囲は、添付の特許請求の範囲によってのみ制限される。
本開示は特許請求の範囲のプロセスの枠組み内で特に示し、説明したが、変形および修正が本開示の範囲を逸脱することなく当業者にとって実行可能になることが理解されるだろう。さらに、そのようなプロセスおよびシステムはここで説明した特定の実施形態に制限される必要がないことを当業者は理解するだろう。
図1は、本開示の例示的な実施形態にしたがった、単一および複数のタクソノミーを管理するシステムの例示的な図である。 図2は、本開示の例示的な実施形態にしたがった、プロセスの例示的なフロー図を図示し、このプロセスにより、現存するタクソノミーが取得され、処理されて、タクソノミーカテゴリプロファイルとコンテンツプロファイルとが作成される。 図3は、本開示の例示的な実施形態にしたがって、タクソノミーマージプログラムモジュールにより実行されるタクソノミーマージプロセスの例示的なフロー図を図示し、タクソノミーマージプログラムモジュールにより、1つ以上のタクソノミーがマージされて、新しいタクソノミーT’が作成される 図4は、本開示の例示的な実施形態にしたがって、タクソノミーマージプログラムモジュールにより実行されるタクソノミー内カテゴリマッピングプロセスの例示的なフロー図を図示し、タクソノミーマージプログラムモジュールにより、1つ以上のタクソノミーがマージされ、新しいタクソノミーT’が作成される。 図5は、本開示の例示的な実施形態にしたがった、統制語彙の例と、2つの異なる例示的なタクソノミーとを示す。 図6は、本開示の例示的な実施形態にしたがった、2つの異なる例示的なタクソノミーの上位集合として作成される例示的なタクソノミーの例を示す。

Claims (20)

  1. コンピュータにより実現される方法において、
    第1の複数のカテゴリを有する第1のタクソノミーを取得するステップと、
    1つ以上の第2のタクソノミーを取得し、第2の複数のカテゴリが前記1つ以上の第2のタクソノミーに関係付けられているステップと、
    前記第1の複数のカテゴリのそれぞれのカテゴリプロファイルと前記第2の複数のカテゴリのそれぞれのカテゴリプロファイルとを比較して、マッチングしているカテゴリと、マッチングしていないカテゴリとを識別するステップと、
    前記マッチングしているカテゴリと前記マッチングしていないカテゴリとを含む、第3のタクソノミーを作成するステップと
    を含む方法。
  2. 前記第1の複数のカテゴリのそれぞれと前記第2の複数のカテゴリのそれぞれとが、1つ以上のコンテンツアイテムに関係付けられている、請求項1記載の方法。
  3. 前記比較することは、カテゴリプロファイル間の比較がしきい値を上回るときにマッチングを識別する比較器機能を適用する、請求項1記載の方法。
  4. 少なくとも1つの第1のカテゴリを有する第1のタクソノミーと1つ以上の第2のタクソノミーとを取得し、少なくとも1つの第2のカテゴリが、前記1つ以上の第2のタクソノミーの少なくとも1つに関係付けられていることと、
    前記少なくとも1つの第1のカテゴリの第1のカテゴリプロファイルと前記少なくとも1つの第2のカテゴリの第2のカテゴリプロファイルとの比較に基づいて、前記第1のタクソノミーと前記第2のタクソノミーとをマージすることによって、新しいタクソノミーを作成することと
    を含む方法。
  5. タクソノミータイプの選択を受信することをさらに含む、請求項4記載の方法。
  6. 前記比較を実行するためのカテゴリ比較器機能を識別することをさらに含む、請求項4記載の方法。
  7. 前記第1のカテゴリプロファイルと前記第2のカテゴリプロファイルとに前記比較器機能を適用して、前記少なくとも1つの第1のカテゴリが前記少なくとも1つの第2のカテゴリにマッチングしているかどうかを決定することをさらに含む、請求項6記載の方法。
  8. 前記比較がしきい値を上回る場合、前記比較器機能はマッチングしていることを識別する、請求項7記載の方法。
  9. 前記比較が前記しきい値を上回らない場合に、
    前記少なくとも1つの第1のカテゴリと前記少なくとも1つの第2のカテゴリとの両方を前記新しいタクソノミーに追加すること
    をさらに含む、請求項8記載の方法。
  10. 前記比較が前記しきい値を上回る場合に、
    前記少なくとも1つの第1のカテゴリを前記新しいタクソノミーに追加することと、
    前記少なくとも1つの第1のカテゴリと、前記少なくとも1つの第2のカテゴリとの間に関係を作成することと
    をさらに含む、請求項8記載の方法。
  11. 前記第1のタクソノミーと前記第2のタクソノミーのどちらがより多くの数のカテゴリを含んでいるかに基づいて、前記第2のタクソノミーに関して前記第1のタクソノミーを順序付けすることをさらに含む、請求項4記載の方法。
  12. 前記少なくとも1つの第1のカテゴリと前記少なくとも1つの第2のカテゴリとを有するカテゴリリストを作成することをさらに含む、請求項4記載の方法。
  13. タクソノミー内マッピングを作成して、前記新しいタクソノミー中で、前記少なくとも1つの第1のカテゴリを前記少なくとも1つの第2のカテゴリに関係付けることをさらに含む、請求項4記載の方法。
  14. カテゴリプロファイルは、シングルベクターマシン(SVM)を使用して発生される、請求項4記載の方法。
  15. カテゴリプロファイルは、k−最近傍法(knn)分類を使用して発生される、請求項4記載の方法。
  16. 前記新しいタクソノミーに対して、タクソノミー内マッピングを作成することをさらに含む、請求項4記載の方法。
  17. 前記タクソノミー内マッピングは、前記新しいタクソノミー中のカテゴリ間の親子関係を作成する、請求項16記載の方法。
  18. 前記タクソノミー内マッピングは、前記新しいタクソノミー中にツリー構造を作成する、請求項16記載の方法。
  19. ネットワークに通信可能に結合され、少なくとも1つの第1のカテゴリを有している第1のタクソノミーを記憶する第1のコンテンツ情報源と、
    ネットワークに通信可能に結合されている第2のコンテンツ情報源と、
    前記第1のコンテンツ情報源は少なくとも1つの第2のカテゴリを有している第2のタクソノミーを記憶し、
    ネットワークに通信可能に結合され、第1のタクソノミーと第2のタクソノミーとを識別するデータを発生させるクライアントデバイスと、
    ネットワークに通信可能に結合され、データを受信し、前記第1のタクソノミーと前記第2のタクソノミーとを取得するサーバと
    を具備し、
    前記サーバは、前記少なくとも1つの第1のカテゴリの第1のカテゴリプロファイルと、前記少なくとも1つの第2のカテゴリの第2のカテゴリプロファイルとの比較に基づいて、前記第1のタクソノミーと前記第2のタクソノミーとをマージすることによって、新しいタクソノミーを作成するようにさらに構成されているシステム。
  20. 1つ以上のコンテンツ情報源から第1のタクソノミーと第2のタクソノミーとを取得し、第1のタクソノミーは少なくとも1つの第1のカテゴリを有し、第2のタクソノミーは少なくとも1つの第2のカテゴリを有する情報源コネクタモジュールと、
    前記少なくとも1つの第1のカテゴリに対して第1のカテゴリプロファイルを発生させ、前記少なくとも1つの第2のカテゴリに対して第2のカテゴリプロファイルを発生させるカテゴリコンテンツモジュールと、
    前記第1のカテゴリプロファイルと前記第2のカテゴリプロファイルとの比較に基づいて、前記第1のタクソノミーと前記第2のタクソノミーとをマージすることによって、新しいタクソノミーを作成するタクソノミーマージプログラムモジュールと
    を具備する装置。
JP2009506043A 2006-04-19 2007-04-20 単一および複数のタクソノミーを管理する方法とシステム Active JP5150871B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US74515506P 2006-04-19 2006-04-19
US60/745,155 2006-04-19
PCT/IS2007/000009 WO2007119250A1 (en) 2006-04-19 2007-04-20 Method and system for managing single and multiple taxonomies

Publications (3)

Publication Number Publication Date
JP2009534735A true JP2009534735A (ja) 2009-09-24
JP2009534735A5 JP2009534735A5 (ja) 2012-04-19
JP5150871B2 JP5150871B2 (ja) 2013-02-27

Family

ID=38278014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009506043A Active JP5150871B2 (ja) 2006-04-19 2007-04-20 単一および複数のタクソノミーを管理する方法とシステム

Country Status (6)

Country Link
US (1) US7974984B2 (ja)
EP (1) EP2011039A1 (ja)
JP (1) JP5150871B2 (ja)
KR (1) KR20090010185A (ja)
RU (1) RU2008145578A (ja)
WO (1) WO2007119250A1 (ja)

Families Citing this family (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602004031152D1 (de) * 2003-12-06 2011-03-03 Abbott Lab Verfahren und system zum analysieren von reaktione
JP2008537225A (ja) 2005-04-11 2008-09-11 テキストディガー,インコーポレイテッド クエリについての検索システムおよび方法
WO2007081681A2 (en) 2006-01-03 2007-07-19 Textdigger, Inc. Search system with query refinement and search method
US8862573B2 (en) 2006-04-04 2014-10-14 Textdigger, Inc. Search system and method with text function tagging
US7526486B2 (en) 2006-05-22 2009-04-28 Initiate Systems, Inc. Method and system for indexing information about entities with respect to hierarchies
US8332366B2 (en) * 2006-06-02 2012-12-11 International Business Machines Corporation System and method for automatic weight generation for probabilistic matching
KR100785928B1 (ko) * 2006-07-04 2007-12-17 삼성전자주식회사 멀티모달 정보를 이용한 사진 검색 방법 및 사진 검색시스템
US7822769B2 (en) * 2006-08-31 2010-10-26 Rivet Software, Inc. Analysis of financial and business information based on interactive data
US7685093B1 (en) 2006-09-15 2010-03-23 Initiate Systems, Inc. Method and system for comparing attributes such as business names
US8356009B2 (en) 2006-09-15 2013-01-15 International Business Machines Corporation Implementation defined segments for relational database systems
US7698268B1 (en) 2006-09-15 2010-04-13 Initiate Systems, Inc. Method and system for filtering false positives
WO2008097891A2 (en) * 2007-02-02 2008-08-14 Musgrove Technology Enterprises Llc Method and apparatus for aligning multiple taxonomies
US8359339B2 (en) * 2007-02-05 2013-01-22 International Business Machines Corporation Graphical user interface for configuration of an algorithm for the matching of data records
US8515926B2 (en) 2007-03-22 2013-08-20 International Business Machines Corporation Processing related data from information sources
WO2008121824A1 (en) * 2007-03-29 2008-10-09 Initiate Systems, Inc. Method and system for data exchange among data sources
US8423514B2 (en) * 2007-03-29 2013-04-16 International Business Machines Corporation Service provisioning
WO2008121170A1 (en) 2007-03-29 2008-10-09 Initiate Systems, Inc. Method and system for parsing languages
US8370355B2 (en) * 2007-03-29 2013-02-05 International Business Machines Corporation Managing entities within a database
US8346764B1 (en) * 2007-06-01 2013-01-01 Thomson Reuters Global Resources Information retrieval systems, methods, and software with content-relevancy enhancements
US20090031367A1 (en) * 2007-07-24 2009-01-29 The Directv Group, Inc. Method and system for utilizing multiple content delivery networks for distributing content
US9104987B2 (en) * 2007-07-24 2015-08-11 The Directv Group, Inc. Method and system for associating business rules with received content in a content processing system and generating a content list therefrom
US8875209B2 (en) * 2007-07-26 2014-10-28 The Directv Group, Inc. Method and system for receiving content in a content processing system using a workflow system
US20090030941A1 (en) * 2007-07-26 2009-01-29 The Directv Group, Inc. Method and system for receiving normalizing content data in a content processing system using a workflow system
US20090043839A1 (en) * 2007-08-06 2009-02-12 Mark Albert Filtering Content According To A Filter Plan Using A Gateway On A Data Path
US7792128B2 (en) * 2007-08-06 2010-09-07 Cisco Technology, Inc. Maintaining a content category cache at a gateway on a data path
US10133826B2 (en) * 2007-08-22 2018-11-20 Sap Se UDDI based classification system
CA2701043C (en) 2007-09-28 2016-10-11 Initiate Systems, Inc. Method and system for associating data records in multiple languages
US8131757B2 (en) * 2007-09-28 2012-03-06 Autodesk, Inc. Taxonomy based indexing and searching
US8713434B2 (en) 2007-09-28 2014-04-29 International Business Machines Corporation Indexing, relating and managing information about entities
BRPI0817507B1 (pt) 2007-09-28 2021-03-23 International Business Machines Corporation Método para análise de um sistema para associação de registro de dados, mídia de armazenamento legível por computador e sistema computacional para análise de um centro de identidade
US8189963B2 (en) * 2007-11-13 2012-05-29 Microsoft Corporation Matching advertisements to visual media objects
US9003465B1 (en) 2008-04-25 2015-04-07 The Directv Group, Inc. Method and system for converting content into multiple formats
IL192477A0 (en) * 2008-06-26 2009-02-11 Hyperroll Israel Ltd A method and system for creation and dynamic updating of best data store system
US8126912B2 (en) * 2008-06-27 2012-02-28 Microsoft Corporation Guided content metadata tagging for an online content repository
US20100042610A1 (en) * 2008-08-15 2010-02-18 Microsoft Corporation Rank documents based on popularity of key metadata
US9336511B2 (en) * 2008-10-06 2016-05-10 Sap Se Import and merge of categorization schemas
US20100094846A1 (en) * 2008-10-14 2010-04-15 Omid Rouhani-Kalleh Leveraging an Informational Resource for Doing Disambiguation
IL197961A0 (en) * 2009-04-05 2009-12-24 Guy Shaked Methods for effective processing of time series
US9443209B2 (en) * 2009-04-30 2016-09-13 Paypal, Inc. Recommendations based on branding
WO2010142078A1 (zh) * 2009-06-10 2010-12-16 华为技术有限公司 一种移动搜索接口适配的方法、搜索服务器以及系统
JP5090408B2 (ja) 2009-07-22 2012-12-05 インターナショナル・ビジネス・マシーンズ・コーポレーション ネットワーク通信において送信データの宛先を動的に制御する方法及び機器
US9443245B2 (en) * 2009-09-29 2016-09-13 Microsoft Technology Licensing, Llc Opinion search engine
US9081767B2 (en) 2010-07-26 2015-07-14 Radiant Logic, Inc. Browsing of contextual information
JP5496853B2 (ja) * 2010-10-29 2014-05-21 インターナショナル・ビジネス・マシーンズ・コーポレーション 構造化文書を分類するためのルールを生成するための方法、並びにそのコンピュータ・プログラム及びコンピュータ
US20130198234A1 (en) * 2012-01-26 2013-08-01 Microsoft Corporation Shared and Local Properties in a Multi-Hierarchy Taxonomy
US8645317B1 (en) * 2012-01-30 2014-02-04 Adobe Systems Incorporated Managing taxonomy relationships in a content repository
US9262506B2 (en) 2012-05-18 2016-02-16 International Business Machines Corporation Generating mappings between a plurality of taxonomies
US10140372B2 (en) 2012-09-12 2018-11-27 Gracenote, Inc. User profile based on clustering tiered descriptors
US9563663B2 (en) 2012-09-28 2017-02-07 Oracle International Corporation Fast path evaluation of Boolean predicates
US9361308B2 (en) 2012-09-28 2016-06-07 Oracle International Corporation State initialization algorithm for continuous queries over archived relations
US9152705B2 (en) 2012-10-24 2015-10-06 Wal-Mart Stores, Inc. Automatic taxonomy merge
US9311373B2 (en) 2012-11-09 2016-04-12 Microsoft Technology Licensing, Llc Taxonomy driven site navigation
US10956422B2 (en) * 2012-12-05 2021-03-23 Oracle International Corporation Integrating event processing with map-reduce
US10298444B2 (en) 2013-01-15 2019-05-21 Oracle International Corporation Variable duration windows on continuous data streams
US10915557B2 (en) * 2013-01-31 2021-02-09 Walmart Apollo, Llc Product classification data transfer and management
US20140214845A1 (en) * 2013-01-31 2014-07-31 Wal-Mart Stores, Inc. Product classification into product type families
US9390135B2 (en) 2013-02-19 2016-07-12 Oracle International Corporation Executing continuous event processing (CEP) queries in parallel
US9934279B2 (en) 2013-12-05 2018-04-03 Oracle International Corporation Pattern matching across multiple input data streams
US10120907B2 (en) 2014-09-24 2018-11-06 Oracle International Corporation Scaling event processing using distributed flows and map-reduce operations
US9886486B2 (en) 2014-09-24 2018-02-06 Oracle International Corporation Enriching events with dynamically typed big data for event processing
US10860186B2 (en) * 2014-09-26 2020-12-08 Oracle International Corporation User interface component wiring for a web portal
US10459949B2 (en) * 2014-12-30 2019-10-29 Oscaro System and method for building, verifying and maintaining an ontology
US10909144B1 (en) * 2015-03-06 2021-02-02 Amazon Technologies, Inc. Taxonomy generation with statistical analysis and auditing
US10235395B2 (en) * 2016-03-28 2019-03-19 International Business Machines Corporation Keyword identification for an enterprise resource planning manager
US10372744B2 (en) * 2016-06-03 2019-08-06 International Business Machines Corporation DITA relationship table based on contextual taxonomy density
US10789250B2 (en) 2016-09-15 2020-09-29 Oracle International Corporation Non-intrusive monitoring output of stages in micro-batch streaming
US10628424B2 (en) 2016-09-15 2020-04-21 Oracle International Corporation Graph generation for a distributed event processing system
WO2018169430A1 (en) 2017-03-17 2018-09-20 Oracle International Corporation Integrating logic in micro batch based event processing systems
WO2018169429A1 (en) 2017-03-17 2018-09-20 Oracle International Corporation Framework for the deployment of event-based applications
US11023441B2 (en) 2017-05-11 2021-06-01 Oracle International Corporation Distributed storage and processing of hierarchical data structures
US11321665B2 (en) * 2017-08-29 2022-05-03 Weightrx Inc. System and method of automated tracking of consumable products
US10872122B2 (en) * 2018-01-30 2020-12-22 Government Of The United States Of America, As Represented By The Secretary Of Commerce Knowledge management system and process for managing knowledge
US10936654B2 (en) * 2018-05-24 2021-03-02 Xandr Inc. Aggregated content editing services (ACES), and related systems, methods, and apparatus
US11087179B2 (en) * 2018-12-19 2021-08-10 Netskope, Inc. Multi-label classification of text documents
US20200257544A1 (en) * 2019-02-07 2020-08-13 Goldmine World, Inc. Personalized language conversion device for automatic translation of software interfaces
US20230017384A1 (en) * 2021-07-15 2023-01-19 DryvIQ, Inc. Systems and methods for machine learning classification-based automated remediations and handling of data items

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10116290A (ja) * 1996-10-11 1998-05-06 Mitsubishi Electric Corp 文書分類管理方法及び文書検索方法
JP2000339169A (ja) * 1999-05-25 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> 複数の階層型知識体系合成方法及び装置及び複数の階層型知識体系合成プログラムを格納した記憶媒体
JP2005063332A (ja) * 2003-08-19 2005-03-10 Fujitsu Ltd 情報体系対応付け装置および対応付け方法。

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822720A (en) 1994-02-16 1998-10-13 Sentius Corporation System amd method for linking streams of multimedia data for reference material for display
US5845270A (en) * 1996-01-02 1998-12-01 Datafusion, Inc. Multidimensional input-output modeling for organizing information
US6895430B1 (en) 1999-10-01 2005-05-17 Eric Schneider Method and apparatus for integrating resolution services, registration services, and search services
US6446061B1 (en) * 1998-07-31 2002-09-03 International Business Machines Corporation Taxonomy generation for document collections
US6675161B1 (en) * 1999-05-04 2004-01-06 Inktomi Corporation Managing changes to a directory of electronic documents
US6795820B2 (en) 2001-06-20 2004-09-21 Nextpage, Inc. Metasearch technique that ranks documents obtained from multiple collections
US6728704B2 (en) 2001-08-27 2004-04-27 Verity, Inc. Method and apparatus for merging result lists from multiple search engines
US7162480B2 (en) * 2001-12-26 2007-01-09 Sbc Technology Resources, Inc. Usage-based adaptable taxonomy
JP3726263B2 (ja) * 2002-03-01 2005-12-14 ヒューレット・パッカード・カンパニー 文書分類方法及び装置
US7296020B2 (en) * 2002-06-05 2007-11-13 International Business Machines Corp Automatic evaluation of categorization system quality
US20060053382A1 (en) 2004-09-03 2006-03-09 Biowisdom Limited System and method for facilitating user interaction with multi-relational ontologies
US20060053099A1 (en) 2004-09-03 2006-03-09 Biowisdom Limited System and method for capturing knowledge for integration into one or more multi-relational ontologies
US20060053175A1 (en) * 2004-09-03 2006-03-09 Biowisdom Limited System and method for creating, editing, and utilizing one or more rules for multi-relational ontology creation and maintenance
US20070220035A1 (en) * 2006-03-17 2007-09-20 Filip Misovski Generating user interface using metadata
US7792838B2 (en) * 2007-03-29 2010-09-07 International Business Machines Corporation Information-theory based measure of similarity between instances in ontology

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10116290A (ja) * 1996-10-11 1998-05-06 Mitsubishi Electric Corp 文書分類管理方法及び文書検索方法
JP2000339169A (ja) * 1999-05-25 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> 複数の階層型知識体系合成方法及び装置及び複数の階層型知識体系合成プログラムを格納した記憶媒体
JP2005063332A (ja) * 2003-08-19 2005-03-10 Fujitsu Ltd 情報体系対応付け装置および対応付け方法。

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200100737010; 伊藤 英毅: '概念体系間の比較と重ね合わせによる関連発見' 第40回 人工知能基礎論研究会資料 (SIG-FAI-9904) , 20000321, 65-70ページ, 社団法人人工知能学会 *
JPN6012015888; 伊藤 英毅: '概念体系間の比較と重ね合わせによる関連発見' 第40回 人工知能基礎論研究会資料 (SIG-FAI-9904) , 20000321, 65-70ページ, 社団法人人工知能学会 *

Also Published As

Publication number Publication date
RU2008145578A (ru) 2010-05-27
WO2007119250A1 (en) 2007-10-25
US20070250487A1 (en) 2007-10-25
US7974984B2 (en) 2011-07-05
EP2011039A1 (en) 2009-01-07
JP5150871B2 (ja) 2013-02-27
KR20090010185A (ko) 2009-01-29

Similar Documents

Publication Publication Date Title
JP5150871B2 (ja) 単一および複数のタクソノミーを管理する方法とシステム
JP6246279B2 (ja) 消費者定義の情報アーキテクチャ用のシステム、方法およびコンピュータプログラム
US8099423B2 (en) Hierarchical metadata generator for retrieval systems
US8386469B2 (en) Method and system for determining relevant sources, querying and merging results from multiple content sources
EP2482204B1 (en) System and method for information retrieval from object collections with complex interrelationships
JP4861961B2 (ja) 情報アクセスおよび検索におけるレレバンス重み付けナビゲーション
JP5377829B2 (ja) 関連性のある情報源を決定し、クエリし、複数のコンテンツ情報源からの結果をマージするための方法とシステム
Tran et al. Hermes: Data Web search on a pay-as-you-go integration infrastructure
JP2007234008A5 (ja)
Dragut et al. Deep web query interface understanding and integration
US20200272651A1 (en) Heuristic dimension reduction in metadata modeling
Färber et al. The data set knowledge graph: Creating a linked open data source for data sets
Koperwas et al. Intelligent information processing for building university knowledge base
Díaz-Corona et al. Profiling of knowledge organisation systems for the annotation of Linked Data cultural resources
CN101866340A (zh) 一种产品情报的在线检索和智能分析方法与系统
Koren et al. Searching and navigating petabyte-scale file systems based on facets
Brambilla et al. Semantic resource framework
Tran et al. Semantic search–using graph-structured semantic models for supporting the search process
Zhang et al. Exploiting multi-category characteristics and unified framework to extract web content
Hedeler et al. Chapter 7: dataspaces
Kargar Enhancing knowledge accessibility in digital economy with search over enterprise data
Clough et al. Extending Domain-Specific Resources to Enable Semantic Access to Cultural Heritage Data.
Butt Ontology Ranking: Finding the Right Ontologies on the Web
Passant et al. Using linked data to build recommender systems
Kumari et al. A Brief Survey on Exploratory Search Systems

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120228

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20120228

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20120321

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120327

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120627

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121002

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20121026

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20121026

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5150871

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250