JP2002541590A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2002541590A5 JP2002541590A5 JP2000611203A JP2000611203A JP2002541590A5 JP 2002541590 A5 JP2002541590 A5 JP 2002541590A5 JP 2000611203 A JP2000611203 A JP 2000611203A JP 2000611203 A JP2000611203 A JP 2000611203A JP 2002541590 A5 JP2002541590 A5 JP 2002541590A5
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- taxonomy
- phrases
- level
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000699 topical Effects 0.000 description 10
- 239000000284 extract Substances 0.000 description 5
- 230000000875 corresponding Effects 0.000 description 1
Images
Description
【特許請求の範囲】
【請求項1】 データベースのためのタクソノミを生成するシステムであって、
テキストの複数の片、及び上記テキストの片から抽出された複数のフレーズを含むデータベースを備え、
同じテキスト片における及び複数のテキスト片全体にわたる上記抽出されたフレーズ間の関係を決定するために上記複数のテキスト片から抽出されたフレーズをクラスタ化する手段を更に備え、
上記データベース内のクラスタ化されたフレーズからリーダーフレーズを識別する手段を更に備え、上記リーダーフレーズは、上記データベース内の所定数の他のフレーズに関連付けられており、
上記識別されたリーダーフレーズに基づいて第1のレベルのタクソノミを生成する手段を更に備え、上記リーダーフレーズは、階層状トピカルアウトライン内の第1のレベルの見出しを形成しており、
上記リーダーフレーズに関連付けられている上記データベース内のフレーズに基づいて第2のレベルのタクソノミを生成する手段を更に備え、上記フレーズは、それらが関連付けられている上記リーダーフレーズの下の副見出しであり、上記タクソノミは、ユーザが最終タクソノミを使用して上記データベースを通して探索するように、上記データベース内のテキストの片から抽出されたフレーズを表している、
ことを特徴とするシステム。
【請求項2】 上記タクソノミをトピカルライブラリと組合せて最終タクソノミを形成する手段を更に備え、上記最終タクソノミは、ユーザが上記最終タクソノミを使用して上記データベースを通して探索するように、上記データベース内のテキストの片から抽出されたフレーズを表していることを特徴とする請求項1に記載のシステム。
【請求項3】 上記第1のレベル及び第2のレベルのタクソノミを生成する手段は、1つまたはそれ以上のテキスト文書のセットをパージングして各文書から1つまたはそれ以上のフレーズを抽出する手段と、上記1つまたはそれ以上のテキスト文書から1つまたはそれ以上のフレーズを処理するためにクラスタ化して上記抽出されたフレーズ間の関係を生成する手段と、上記抽出されたフレーズ及び上記抽出されたフレーズ間の関係に基づいて上記テキスト文書セットについて固有の最終タクソノミを生成するタクソノミを生成する手段とを含むことを特徴とする請求項1に記載のシステム。
【請求項4】 1つまたはそれ以上のソフトウェアアプリケーションを更に備えることを特徴とする請求項1に記載のシステム。
【請求項5】 最終タクソノミをポピュレートする手段であって、それにより、上記データベースからの1つまたはそれ以上のテキストが上記第1のレベル及び第2のレベルのタクソノミに結合されている手段を更に備えることを特徴とする請求項1に記載のシステム。
【請求項6】 データベースのためのタクソノミを生成する方法であって、
データベース内に格納されているテキストの複数の片、及び上記テキストの片から抽出された複数のフレーズを処理するステップを含み、
同じテキスト片における及び複数のテキスト片全体にわたる上記抽出された複数のフレーズ間の関係を決定するために上記複数のテキスト片から抽出されたフレーズをクラスタ化するステップを更に含み、
上記データベース内のクラスタ化されたフレーズからリーダーフレーズを識別するステップを更に含み、上記リーダーフレーズは、上記データベース内の所定数の他のフレーズに関連付けられており、
上記識別されたリーダーフレーズに基づいて第1のレベルのタクソノミを生成するステップを更に含み、上記リーダーフレーズは、階層状トピカルアウトライン内の第1のレベルの見出しを形成しており、
上記リーダーフレーズに関連付けられている上記データベース内のフレーズに基づいて第2のレベルのタクソノミを生成するステップを更に含み、上記フレーズは、それらが関連付けられている上記リーダーフレーズの下の副見出しであり、上記タクソノミは、ユーザが最終タクソノミを使用して上記データベースを通して探索するように、上記データベース内のテキストの片から抽出されたフレーズを表している、
ことを特徴とする方法。
【請求項7】 上記タクソノミをトピカルライブラリと組合せて最終タクソノミを形成するステップを更に含み、上記最終タクソノミは、ユーザが上記最終タクソノミを使用して上記データベースを通して探索するように、上記データベース内のテキストの片から抽出されたフレーズを表していることを特徴とする請求項6に記載の方法。
【請求項8】 上記第1のレベル及び第2のレベルのタクソノミを生成するステップは、1つまたはそれ以上のテキスト文書のセットをパージングして各文書から1つまたはそれ以上のフレーズを抽出するステップと、上記1つまたはそれ以上のテキスト文書から1つまたはそれ以上のフレーズを処理するためにクラスタ化して上記抽出されたフレーズ間の関係を生成するステップと、上記抽出されたフレーズ及び上記抽出されたフレーズ間の関係に基づいて上記テキスト文書セットについて固有の最終タクソノミを生成するタクソノミを生成するステップとを含むことを特徴とする請求項6に記載の方法。
【請求項9】 最終タクソノミをポピュレートするステップであって、それにより、上記データベースからの1つまたはそれ以上のテキスト片が上記第1のレベル及び第2のレベルのタクソノミに結合されるステップを更に備えることを特徴とする請求項6に記載の方法。
【請求項10】 タクソノミを生成するシステムであって、
1つまたはそれ以上のテキスト文書のセットを処理して各文書から1つまたはそれ以上のフレーズを抽出するパーザを備え、
上記1つまたはそれ以上のフレーズを処理して、同じテキスト片における及び複数のテキスト片全体にわたる上記抽出されたフレーズ間の関係を生成するクラスタライザを更に備え、
上記抽出されたフレーズ間の関係のマップを生成するマップ発生器を更に備え、
上記抽出されたフレーズ及び上記マップの上記抽出されたフレーズ間の関係に基づいて上記テキスト文書セットについて固有の最終タクソノミを生成するタクソノミ発生器を更に備え、
1つまたはそれ以上のトピックスの広義の分類を含むトピカル索引を記憶するデータベースを更に備え、
上記タクソノミ発生器は、
上記抽出されたフレーズからリーダーフレーズを識別するリーダーフレーズ識別器を含み、上記リーダーフレーズは、所定数の他のフレーズに関連付けられており、
上記識別されたリーダーフレーズに基づいて第1のレベルのタクソノミを生成するオーガナイザを更に含み、上記リーダーフレーズは、階層状トピカルアウトライン内の第1のレベルの見出しを形成しており、
上記オーガナイザは、上記リーダーフレーズに関連付けられている抽出されたフレーズに基づいて第2のレベルのタクソノミを生成し、上記フレーズは、それらが関連付けられている上記リーダーフレーズの下の副見出しであり、
上記第1のレベル及び第2のレベルのタクソノミを上記トピカル索引と組み合わせて上記テキスト文書セットに固有のタクソノミを形成するコンバイナを更に含む、
ことを特徴とするシステム。
【請求項11】 最終タクソノミをポピュレートする手段であって、それにより、上記データベースからの1つまたはそれ以上のテキスト片が上記第1のレベル及び第2のレベルのタクソノミに結合される手段を更に備えることを特徴とする請求項10に記載のシステム。
【請求項12】 内容から抽出されたリンクしたフレーズを使用してその内容を分類するマルチレベルタクソノミを生成するコンピュータベーステキスト処理システムを備え、上記マルチレベルタクソノミの第1のレベルは、関連する多数のリンクに基づいて上記フレーズから選択されるリーダーフレーズを含み、
上記マルチレベルタクソノミを出力するように動作可能なユーザインターフェイスを更に備え、それにより、ユーザが上記マルチレベルタクソノミの第1のレベルから第2のレベルへ進み、上記第2のレベルは、上記リーダーフレーズとリンクした接続されたフレーズを含む、
ことを特徴とするシステム。
【請求項13】 上記内容と関連するトピックスを含むトピカルライブラリを更に備え、上記テキスト処理システムは、上記トピカルライブラリにアクセスして上記トピックスを上記マルチレベルタクソノミ内に含むように動作可能であることを特徴とする請求項12に記載のシステム。
【請求項14】 上記テキスト処理システムは、上記タクソノミ内に第3のレベルを含むように動作可能であり、上記第3のレベルは、上記接続されたフレーズにリンクしたサブフレーズを含むことを特徴とする請求項12に記載のシステム。
【請求項15】 上記テキスト処理システムは、
上記内容内でフレーズを識別するように動作可能なパーザを備え、
上記フレーズ間のリンクを決定するように動作可能であるクラスタイザを更に備えることを特徴とする請求項12に記載のシステム。
【請求項16】 上記テキスト処理システムは、上記リンクしたフレーズを表示するように動作可能であるマップ発生器を更に備えることを特徴とする請求項15に記載のシステム。
【請求項17】 上記テキスト処理システムは、上記ユーザから上記内容を受け取ってそれに応答して上記マルチレベルタクソノミを出力するように動作可能であることを特徴とする請求項12に記載のシステム。
【請求項18】 命令が記憶された読出し可能な記憶媒体を備え、処理装置が上記命令を読み出して動作を実行する装置であって、上記命令は、
テキストを含む複数の文書を入力する第1コードセグメントと、
上記テキストからフレーズを抽出する第2コードセグメントと、
上記フレーズの間の接続を確立する第3コードセグメントと、
関連する多数の接続に基づいて上記フレーズの中からリーダーフレーズを定める第4コードセグメントと、
上記リーダーフレーズが第1のレベルに含まれるタクソノミを定める第5コードセグメントと、
を含むことを特徴とする装置。
【請求項19】 上記第5コードセグメントは、上記タクソノミの第2のレベルにおいて上記第3コードセグメントによって上記リーダーフレーズに直接接続された二次フレーズを含むことを特徴とする請求項18に記載の装置。
【請求項20】 上記第5コードセグメントは、上記タクソノミの第3のレベルにおいて上記第3コードセグメントによって上記二次フレーズに直接接続された三次フレーズを含むことを特徴とする請求項18に記載の装置。
【請求項21】 上記第5コードセグメントは、上記文書の内容と関連するトピカルライブラリ内のトピックスにアクセスする第6コードセグメントを含み、上記第5コードセグメントは、上記リーダーフレーズを上記タクソノミ内の上記トピックスの1つと関連させることを特徴とする請求項18に記載の装置。
【請求項22】 上記タクソノミをマルチレベルタクソノミとして出力する第6コードセグメントを含み、上記マルチレベルタクソノミは、上記第1のレベルにおいて上記リーダーフレーズを含むと共に上記第1のレベルよりも下の第2のレベルにおいて上記リーダーフレーズに接続されたフレーズを含むことを特徴とする請求項18に記載の装置。
【請求項23】 上記リーダーフレーズのユーザ選択を受け取ってそれに応答して上記第2レベルのフレーズを提供する第7コードセグメントを含むことを特徴とする請求項22に記載の装置。
【請求項24】 上記第7コードセグメントは、上記第2レベルのフレーズの1つの更なるユーザ選択に応答して該選択された第2レベルのフレーズに対応する1つの文書を、上記複数の文書の中から出力する第8コードセグメントを含むことを特徴とする請求項23に記載の装置。
【請求項1】 データベースのためのタクソノミを生成するシステムであって、
テキストの複数の片、及び上記テキストの片から抽出された複数のフレーズを含むデータベースを備え、
同じテキスト片における及び複数のテキスト片全体にわたる上記抽出されたフレーズ間の関係を決定するために上記複数のテキスト片から抽出されたフレーズをクラスタ化する手段を更に備え、
上記データベース内のクラスタ化されたフレーズからリーダーフレーズを識別する手段を更に備え、上記リーダーフレーズは、上記データベース内の所定数の他のフレーズに関連付けられており、
上記識別されたリーダーフレーズに基づいて第1のレベルのタクソノミを生成する手段を更に備え、上記リーダーフレーズは、階層状トピカルアウトライン内の第1のレベルの見出しを形成しており、
上記リーダーフレーズに関連付けられている上記データベース内のフレーズに基づいて第2のレベルのタクソノミを生成する手段を更に備え、上記フレーズは、それらが関連付けられている上記リーダーフレーズの下の副見出しであり、上記タクソノミは、ユーザが最終タクソノミを使用して上記データベースを通して探索するように、上記データベース内のテキストの片から抽出されたフレーズを表している、
ことを特徴とするシステム。
【請求項2】 上記タクソノミをトピカルライブラリと組合せて最終タクソノミを形成する手段を更に備え、上記最終タクソノミは、ユーザが上記最終タクソノミを使用して上記データベースを通して探索するように、上記データベース内のテキストの片から抽出されたフレーズを表していることを特徴とする請求項1に記載のシステム。
【請求項3】 上記第1のレベル及び第2のレベルのタクソノミを生成する手段は、1つまたはそれ以上のテキスト文書のセットをパージングして各文書から1つまたはそれ以上のフレーズを抽出する手段と、上記1つまたはそれ以上のテキスト文書から1つまたはそれ以上のフレーズを処理するためにクラスタ化して上記抽出されたフレーズ間の関係を生成する手段と、上記抽出されたフレーズ及び上記抽出されたフレーズ間の関係に基づいて上記テキスト文書セットについて固有の最終タクソノミを生成するタクソノミを生成する手段とを含むことを特徴とする請求項1に記載のシステム。
【請求項4】 1つまたはそれ以上のソフトウェアアプリケーションを更に備えることを特徴とする請求項1に記載のシステム。
【請求項5】 最終タクソノミをポピュレートする手段であって、それにより、上記データベースからの1つまたはそれ以上のテキストが上記第1のレベル及び第2のレベルのタクソノミに結合されている手段を更に備えることを特徴とする請求項1に記載のシステム。
【請求項6】 データベースのためのタクソノミを生成する方法であって、
データベース内に格納されているテキストの複数の片、及び上記テキストの片から抽出された複数のフレーズを処理するステップを含み、
同じテキスト片における及び複数のテキスト片全体にわたる上記抽出された複数のフレーズ間の関係を決定するために上記複数のテキスト片から抽出されたフレーズをクラスタ化するステップを更に含み、
上記データベース内のクラスタ化されたフレーズからリーダーフレーズを識別するステップを更に含み、上記リーダーフレーズは、上記データベース内の所定数の他のフレーズに関連付けられており、
上記識別されたリーダーフレーズに基づいて第1のレベルのタクソノミを生成するステップを更に含み、上記リーダーフレーズは、階層状トピカルアウトライン内の第1のレベルの見出しを形成しており、
上記リーダーフレーズに関連付けられている上記データベース内のフレーズに基づいて第2のレベルのタクソノミを生成するステップを更に含み、上記フレーズは、それらが関連付けられている上記リーダーフレーズの下の副見出しであり、上記タクソノミは、ユーザが最終タクソノミを使用して上記データベースを通して探索するように、上記データベース内のテキストの片から抽出されたフレーズを表している、
ことを特徴とする方法。
【請求項7】 上記タクソノミをトピカルライブラリと組合せて最終タクソノミを形成するステップを更に含み、上記最終タクソノミは、ユーザが上記最終タクソノミを使用して上記データベースを通して探索するように、上記データベース内のテキストの片から抽出されたフレーズを表していることを特徴とする請求項6に記載の方法。
【請求項8】 上記第1のレベル及び第2のレベルのタクソノミを生成するステップは、1つまたはそれ以上のテキスト文書のセットをパージングして各文書から1つまたはそれ以上のフレーズを抽出するステップと、上記1つまたはそれ以上のテキスト文書から1つまたはそれ以上のフレーズを処理するためにクラスタ化して上記抽出されたフレーズ間の関係を生成するステップと、上記抽出されたフレーズ及び上記抽出されたフレーズ間の関係に基づいて上記テキスト文書セットについて固有の最終タクソノミを生成するタクソノミを生成するステップとを含むことを特徴とする請求項6に記載の方法。
【請求項9】 最終タクソノミをポピュレートするステップであって、それにより、上記データベースからの1つまたはそれ以上のテキスト片が上記第1のレベル及び第2のレベルのタクソノミに結合されるステップを更に備えることを特徴とする請求項6に記載の方法。
【請求項10】 タクソノミを生成するシステムであって、
1つまたはそれ以上のテキスト文書のセットを処理して各文書から1つまたはそれ以上のフレーズを抽出するパーザを備え、
上記1つまたはそれ以上のフレーズを処理して、同じテキスト片における及び複数のテキスト片全体にわたる上記抽出されたフレーズ間の関係を生成するクラスタライザを更に備え、
上記抽出されたフレーズ間の関係のマップを生成するマップ発生器を更に備え、
上記抽出されたフレーズ及び上記マップの上記抽出されたフレーズ間の関係に基づいて上記テキスト文書セットについて固有の最終タクソノミを生成するタクソノミ発生器を更に備え、
1つまたはそれ以上のトピックスの広義の分類を含むトピカル索引を記憶するデータベースを更に備え、
上記タクソノミ発生器は、
上記抽出されたフレーズからリーダーフレーズを識別するリーダーフレーズ識別器を含み、上記リーダーフレーズは、所定数の他のフレーズに関連付けられており、
上記識別されたリーダーフレーズに基づいて第1のレベルのタクソノミを生成するオーガナイザを更に含み、上記リーダーフレーズは、階層状トピカルアウトライン内の第1のレベルの見出しを形成しており、
上記オーガナイザは、上記リーダーフレーズに関連付けられている抽出されたフレーズに基づいて第2のレベルのタクソノミを生成し、上記フレーズは、それらが関連付けられている上記リーダーフレーズの下の副見出しであり、
上記第1のレベル及び第2のレベルのタクソノミを上記トピカル索引と組み合わせて上記テキスト文書セットに固有のタクソノミを形成するコンバイナを更に含む、
ことを特徴とするシステム。
【請求項11】 最終タクソノミをポピュレートする手段であって、それにより、上記データベースからの1つまたはそれ以上のテキスト片が上記第1のレベル及び第2のレベルのタクソノミに結合される手段を更に備えることを特徴とする請求項10に記載のシステム。
【請求項12】 内容から抽出されたリンクしたフレーズを使用してその内容を分類するマルチレベルタクソノミを生成するコンピュータベーステキスト処理システムを備え、上記マルチレベルタクソノミの第1のレベルは、関連する多数のリンクに基づいて上記フレーズから選択されるリーダーフレーズを含み、
上記マルチレベルタクソノミを出力するように動作可能なユーザインターフェイスを更に備え、それにより、ユーザが上記マルチレベルタクソノミの第1のレベルから第2のレベルへ進み、上記第2のレベルは、上記リーダーフレーズとリンクした接続されたフレーズを含む、
ことを特徴とするシステム。
【請求項13】 上記内容と関連するトピックスを含むトピカルライブラリを更に備え、上記テキスト処理システムは、上記トピカルライブラリにアクセスして上記トピックスを上記マルチレベルタクソノミ内に含むように動作可能であることを特徴とする請求項12に記載のシステム。
【請求項14】 上記テキスト処理システムは、上記タクソノミ内に第3のレベルを含むように動作可能であり、上記第3のレベルは、上記接続されたフレーズにリンクしたサブフレーズを含むことを特徴とする請求項12に記載のシステム。
【請求項15】 上記テキスト処理システムは、
上記内容内でフレーズを識別するように動作可能なパーザを備え、
上記フレーズ間のリンクを決定するように動作可能であるクラスタイザを更に備えることを特徴とする請求項12に記載のシステム。
【請求項16】 上記テキスト処理システムは、上記リンクしたフレーズを表示するように動作可能であるマップ発生器を更に備えることを特徴とする請求項15に記載のシステム。
【請求項17】 上記テキスト処理システムは、上記ユーザから上記内容を受け取ってそれに応答して上記マルチレベルタクソノミを出力するように動作可能であることを特徴とする請求項12に記載のシステム。
【請求項18】 命令が記憶された読出し可能な記憶媒体を備え、処理装置が上記命令を読み出して動作を実行する装置であって、上記命令は、
テキストを含む複数の文書を入力する第1コードセグメントと、
上記テキストからフレーズを抽出する第2コードセグメントと、
上記フレーズの間の接続を確立する第3コードセグメントと、
関連する多数の接続に基づいて上記フレーズの中からリーダーフレーズを定める第4コードセグメントと、
上記リーダーフレーズが第1のレベルに含まれるタクソノミを定める第5コードセグメントと、
を含むことを特徴とする装置。
【請求項19】 上記第5コードセグメントは、上記タクソノミの第2のレベルにおいて上記第3コードセグメントによって上記リーダーフレーズに直接接続された二次フレーズを含むことを特徴とする請求項18に記載の装置。
【請求項20】 上記第5コードセグメントは、上記タクソノミの第3のレベルにおいて上記第3コードセグメントによって上記二次フレーズに直接接続された三次フレーズを含むことを特徴とする請求項18に記載の装置。
【請求項21】 上記第5コードセグメントは、上記文書の内容と関連するトピカルライブラリ内のトピックスにアクセスする第6コードセグメントを含み、上記第5コードセグメントは、上記リーダーフレーズを上記タクソノミ内の上記トピックスの1つと関連させることを特徴とする請求項18に記載の装置。
【請求項22】 上記タクソノミをマルチレベルタクソノミとして出力する第6コードセグメントを含み、上記マルチレベルタクソノミは、上記第1のレベルにおいて上記リーダーフレーズを含むと共に上記第1のレベルよりも下の第2のレベルにおいて上記リーダーフレーズに接続されたフレーズを含むことを特徴とする請求項18に記載の装置。
【請求項23】 上記リーダーフレーズのユーザ選択を受け取ってそれに応答して上記第2レベルのフレーズを提供する第7コードセグメントを含むことを特徴とする請求項22に記載の装置。
【請求項24】 上記第7コードセグメントは、上記第2レベルのフレーズの1つの更なるユーザ選択に応答して該選択された第2レベルのフレーズに対応する1つの文書を、上記複数の文書の中から出力する第8コードセグメントを含むことを特徴とする請求項23に記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/289,174 | 1999-04-09 | ||
US09/289,174 US6665681B1 (en) | 1999-04-09 | 1999-04-09 | System and method for generating a taxonomy from a plurality of documents |
PCT/US2000/009471 WO2000062203A1 (en) | 1999-04-09 | 2000-04-06 | System and method for generating a taxonomy from a plurality of documents |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002541590A JP2002541590A (ja) | 2002-12-03 |
JP2002541590A5 true JP2002541590A5 (ja) | 2007-06-07 |
Family
ID=23110369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000611203A Pending JP2002541590A (ja) | 1999-04-09 | 2000-04-06 | 複数の文書からタクソノミを生成するシステム及び方法 |
Country Status (7)
Country | Link |
---|---|
US (2) | US6665681B1 (ja) |
EP (1) | EP1208464A4 (ja) |
JP (1) | JP2002541590A (ja) |
AU (1) | AU4221200A (ja) |
CA (1) | CA2366545C (ja) |
HK (1) | HK1047174A1 (ja) |
WO (1) | WO2000062203A1 (ja) |
Families Citing this family (95)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6665681B1 (en) * | 1999-04-09 | 2003-12-16 | Entrieva, Inc. | System and method for generating a taxonomy from a plurality of documents |
US7305399B2 (en) * | 2000-03-09 | 2007-12-04 | The Web Access, Inc. | Method and apparatus for applying a parametric search methodology to a directory tree database format |
US6711558B1 (en) | 2000-04-07 | 2004-03-23 | Washington University | Associative database scanning and information retrieval |
US20020049705A1 (en) * | 2000-04-19 | 2002-04-25 | E-Base Ltd. | Method for creating content oriented databases and content files |
AUPR033800A0 (en) * | 2000-09-25 | 2000-10-19 | Telstra R & D Management Pty Ltd | A document categorisation system |
US7191252B2 (en) | 2000-11-13 | 2007-03-13 | Digital Doors, Inc. | Data security system and method adjunct to e-mail, browser or telecom program |
US8458214B1 (en) * | 2000-11-14 | 2013-06-04 | Ebay Inc. | Taxonomy-based database partitioning |
US7305416B2 (en) | 2000-12-18 | 2007-12-04 | Hewlett-Packard Development Company, L.P. | Network assembly and method for inserting an identification code |
US20070156665A1 (en) * | 2001-12-05 | 2007-07-05 | Janusz Wnek | Taxonomy discovery |
AUPR958901A0 (en) * | 2001-12-18 | 2002-01-24 | Telstra New Wave Pty Ltd | Information resource taxonomy |
US7243092B2 (en) * | 2001-12-28 | 2007-07-10 | Sap Ag | Taxonomy generation for electronic documents |
US6996558B2 (en) | 2002-02-26 | 2006-02-07 | International Business Machines Corporation | Application portability and extensibility through database schema and query abstraction |
US7567953B2 (en) | 2002-03-01 | 2009-07-28 | Business Objects Americas | System and method for retrieving and organizing information from disparate computer network information sources |
CN1649897A (zh) * | 2002-03-01 | 2005-08-03 | 普罗特米克斯公司 | Falp蛋白 |
US7650327B2 (en) * | 2002-03-01 | 2010-01-19 | Marine Biological Laboratory | Managing taxonomic information |
US7673234B2 (en) * | 2002-03-11 | 2010-03-02 | The Boeing Company | Knowledge management using text classification |
US7266553B1 (en) | 2002-07-01 | 2007-09-04 | Microsoft Corporation | Content data indexing |
US8335779B2 (en) | 2002-08-16 | 2012-12-18 | Gamroe Applications, Llc | Method and apparatus for gathering, categorizing and parameterizing data |
US7231384B2 (en) * | 2002-10-25 | 2007-06-12 | Sap Aktiengesellschaft | Navigation tool for exploring a knowledge base |
US7047236B2 (en) * | 2002-12-31 | 2006-05-16 | International Business Machines Corporation | Method for automatic deduction of rules for matching content to categories |
US9026901B2 (en) * | 2003-06-20 | 2015-05-05 | International Business Machines Corporation | Viewing annotations across multiple applications |
US8321470B2 (en) * | 2003-06-20 | 2012-11-27 | International Business Machines Corporation | Heterogeneous multi-level extendable indexing for general purpose annotation systems |
GB0315191D0 (en) * | 2003-06-28 | 2003-08-06 | Ibm | Methods, apparatus and computer programs for visualization and management of data organisation within a data processing system |
GB2403636A (en) * | 2003-07-02 | 2005-01-05 | Sony Uk Ltd | Information retrieval using an array of nodes |
US20050278362A1 (en) * | 2003-08-12 | 2005-12-15 | Maren Alianna J | Knowledge discovery system |
US7333997B2 (en) * | 2003-08-12 | 2008-02-19 | Viziant Corporation | Knowledge discovery method with utility functions and feedback loops |
US7756750B2 (en) | 2003-09-02 | 2010-07-13 | Vinimaya, Inc. | Method and system for providing online procurement between a buyer and suppliers over a network |
US7870152B2 (en) * | 2003-10-22 | 2011-01-11 | International Business Machines Corporation | Attaching and displaying annotations to changing data views |
US7617196B2 (en) | 2003-10-22 | 2009-11-10 | International Business Machines Corporation | Context-sensitive term expansion with multiple levels of expansion |
US20050144177A1 (en) * | 2003-11-26 | 2005-06-30 | Hodes Alan S. | Patent analysis and formulation using ontologies |
US20050234738A1 (en) * | 2003-11-26 | 2005-10-20 | Hodes Alan S | Competitive product intelligence system and method, including patent analysis and formulation using one or more ontologies |
US7900133B2 (en) | 2003-12-09 | 2011-03-01 | International Business Machines Corporation | Annotation structure type determination |
US9288000B2 (en) | 2003-12-17 | 2016-03-15 | International Business Machines Corporation | Monitoring a communication and retrieving information relevant to the communication |
US7243099B2 (en) * | 2003-12-23 | 2007-07-10 | Proclarity Corporation | Computer-implemented method, system, apparatus for generating user's insight selection by showing an indication of popularity, displaying one or more materialized insight associated with specified item class within the database that potentially match the search |
US7870046B2 (en) * | 2004-03-04 | 2011-01-11 | Cae Solutions Corporation | System, apparatus and method for standardized financial reporting |
US8055553B1 (en) | 2006-01-19 | 2011-11-08 | Verizon Laboratories Inc. | Dynamic comparison text functionality |
US7487471B2 (en) * | 2004-07-23 | 2009-02-03 | Sap Ag | User interface for conflict resolution management |
US7533074B2 (en) * | 2004-07-23 | 2009-05-12 | Sap Ag | Modifiable knowledge base in a mobile device |
US7853574B2 (en) * | 2004-08-26 | 2010-12-14 | International Business Machines Corporation | Method of generating a context-inferenced search query and of sorting a result of the query |
US20080059416A1 (en) * | 2004-09-15 | 2008-03-06 | Forbes David I | Software system for rules-based searching of data |
US7584161B2 (en) * | 2004-09-15 | 2009-09-01 | Contextware, Inc. | Software system for managing information in context |
US8051096B1 (en) * | 2004-09-30 | 2011-11-01 | Google Inc. | Methods and systems for augmenting a token lexicon |
EP1812898A2 (en) * | 2004-11-02 | 2007-08-01 | Eagleforce Associates | System and method for predictive analysis and predictive analysis markup language |
CA2500573A1 (en) * | 2005-03-14 | 2006-09-14 | Oculus Info Inc. | Advances in nspace - system and method for information analysis |
US7634406B2 (en) * | 2004-12-10 | 2009-12-15 | Microsoft Corporation | System and method for identifying semantic intent from acoustic information |
US9400838B2 (en) * | 2005-04-11 | 2016-07-26 | Textdigger, Inc. | System and method for searching for a query |
WO2006110853A2 (en) * | 2005-04-12 | 2006-10-19 | Maren Alianna J | System and method for evidence accumulation and hypothesis generation |
EP2244443A1 (en) * | 2005-06-09 | 2010-10-27 | Whirlpool Corporation | Software architecture system and method for communication with, and mangement of, at least one component within a household appliance |
US8024338B2 (en) * | 2005-08-31 | 2011-09-20 | Brei James E | Systems, methods, and interfaces for reducing executions of overly broad user queries |
US20070136335A1 (en) * | 2005-12-09 | 2007-06-14 | Robert Dionne | Method and system for multiple independent extensions of a concept taxonomy via description logic classification |
US20070174255A1 (en) * | 2005-12-22 | 2007-07-26 | Entrieva, Inc. | Analyzing content to determine context and serving relevant content based on the context |
US8694530B2 (en) | 2006-01-03 | 2014-04-08 | Textdigger, Inc. | Search system with query refinement and search method |
WO2007121035A2 (en) | 2006-03-23 | 2007-10-25 | Exegy Incorporated | Method and system for high throughput blockwise independent encryption/decryption |
US8019754B2 (en) * | 2006-04-03 | 2011-09-13 | Needlebot Incorporated | Method of searching text to find relevant content |
WO2007114932A2 (en) * | 2006-04-04 | 2007-10-11 | Textdigger, Inc. | Search system and method with text function tagging |
US20070276676A1 (en) * | 2006-05-23 | 2007-11-29 | Christopher Hoenig | Social information system |
US7519619B2 (en) * | 2006-08-21 | 2009-04-14 | Microsoft Corporation | Facilitating document classification using branch associations |
US7660793B2 (en) | 2006-11-13 | 2010-02-09 | Exegy Incorporated | Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors |
US8326819B2 (en) | 2006-11-13 | 2012-12-04 | Exegy Incorporated | Method and system for high performance data metatagging and data indexing using coprocessors |
KR100836878B1 (ko) | 2006-11-29 | 2008-06-11 | 한국과학기술정보연구원 | 정보 검색 시스템에서의 주제 또는 분야 할당 장치 및 그방법 |
US8423565B2 (en) * | 2006-12-21 | 2013-04-16 | Digital Doors, Inc. | Information life cycle search engine and method |
US8468244B2 (en) | 2007-01-05 | 2013-06-18 | Digital Doors, Inc. | Digital information infrastructure and method for security designated data and with granular data stores |
US8732197B2 (en) * | 2007-02-02 | 2014-05-20 | Musgrove Technology Enterprises Llc (Mte) | Method and apparatus for aligning multiple taxonomies |
US8280877B2 (en) * | 2007-02-22 | 2012-10-02 | Microsoft Corporation | Diverse topic phrase extraction |
US8879727B2 (en) | 2007-08-31 | 2014-11-04 | Ip Reservoir, Llc | Method and apparatus for hardware-accelerated encryption/decryption |
US20080243823A1 (en) * | 2007-03-28 | 2008-10-02 | Elumindata, Inc. | System and method for automatically generating information within an eletronic document |
US7792838B2 (en) * | 2007-03-29 | 2010-09-07 | International Business Machines Corporation | Information-theory based measure of similarity between instances in ontology |
US8275773B2 (en) * | 2007-03-30 | 2012-09-25 | Stuart Donnelly | Method of searching text to find relevant content |
US8271476B2 (en) * | 2007-03-30 | 2012-09-18 | Stuart Donnelly | Method of searching text to find user community changes of interest and drug side effect upsurges, and presenting advertisements to users |
US8280892B2 (en) * | 2007-10-05 | 2012-10-02 | Fujitsu Limited | Selecting tags for a document by analyzing paragraphs of the document |
US9081852B2 (en) * | 2007-10-05 | 2015-07-14 | Fujitsu Limited | Recommending terms to specify ontology space |
WO2009059297A1 (en) * | 2007-11-01 | 2009-05-07 | Textdigger, Inc. | Method and apparatus for automated tag generation for digital content |
US10733223B2 (en) * | 2008-01-08 | 2020-08-04 | International Business Machines Corporation | Term-driven records file plan and thesaurus design |
US9189478B2 (en) * | 2008-04-03 | 2015-11-17 | Elumindata, Inc. | System and method for collecting data from an electronic document and storing the data in a dynamically organized data structure |
KR100990292B1 (ko) | 2008-06-11 | 2010-10-26 | 서강대학교산학협력단 | 온토소노미를 이용한 태그 템플릿 제작 방법, 태그등록방법 및 컨텐츠 검색방법 |
US8176042B2 (en) * | 2008-07-22 | 2012-05-08 | Elumindata, Inc. | System and method for automatically linking data sources for providing data related to a query |
US10007729B1 (en) | 2009-01-23 | 2018-06-26 | Zakta, LLC | Collaboratively finding, organizing and/or accessing information |
US9607324B1 (en) | 2009-01-23 | 2017-03-28 | Zakta, LLC | Topical trust network |
US10191982B1 (en) | 2009-01-23 | 2019-01-29 | Zakata, LLC | Topical search portal |
US20100211621A1 (en) * | 2009-02-19 | 2010-08-19 | Yahoo! Inc. | Web-based organization of online advertising content |
WO2010135375A1 (en) | 2009-05-20 | 2010-11-25 | Hotgrinds, Inc. | Semiotic square search and/or sentiment analysis system and method |
US8954893B2 (en) * | 2009-11-06 | 2015-02-10 | Hewlett-Packard Development Company, L.P. | Visually representing a hierarchy of category nodes |
US10068266B2 (en) | 2010-12-02 | 2018-09-04 | Vinimaya Inc. | Methods and systems to maintain, check, report, and audit contract and historical pricing in electronic procurement |
US8577823B1 (en) | 2011-06-01 | 2013-11-05 | Omar M. A. Gadir | Taxonomy system for enterprise data management and analysis |
US10366117B2 (en) | 2011-12-16 | 2019-07-30 | Sas Institute Inc. | Computer-implemented systems and methods for taxonomy development |
US9116985B2 (en) * | 2011-12-16 | 2015-08-25 | Sas Institute Inc. | Computer-implemented systems and methods for taxonomy development |
US20140108006A1 (en) * | 2012-09-07 | 2014-04-17 | Grail, Inc. | System and method for analyzing and mapping semiotic relationships to enhance content recommendations |
US10474702B1 (en) | 2014-08-18 | 2019-11-12 | Street Diligence, Inc. | Computer-implemented apparatus and method for providing information concerning a financial instrument |
US11144994B1 (en) | 2014-08-18 | 2021-10-12 | Street Diligence, Inc. | Computer-implemented apparatus and method for providing information concerning a financial instrument |
US9842100B2 (en) | 2016-03-25 | 2017-12-12 | TripleDip, LLC | Functional ontology machine-based narrative interpreter |
US10467277B2 (en) | 2016-03-25 | 2019-11-05 | Raftr, Inc. | Computer implemented detection of semiotic similarity between sets of narrative data |
US11093706B2 (en) | 2016-03-25 | 2021-08-17 | Raftr, Inc. | Protagonist narrative balance computer implemented analysis of narrative data |
US10643178B1 (en) | 2017-06-16 | 2020-05-05 | Coupa Software Incorporated | Asynchronous real-time procurement system |
US20200341977A1 (en) * | 2019-04-25 | 2020-10-29 | Mycelebs Co., Ltd. | Method and apparatus for managing attribute language |
WO2022185538A1 (ja) * | 2021-03-05 | 2022-09-09 | 日本電気株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4370707A (en) * | 1971-08-03 | 1983-01-25 | Computer Service, Inc. | Computer system for generating architectural specifications and project control instructions |
US5157783A (en) | 1988-02-26 | 1992-10-20 | Wang Laboratories, Inc. | Data base system which maintains project query list, desktop list and status of multiple ongoing research projects |
US5146552A (en) * | 1990-02-28 | 1992-09-08 | International Business Machines Corporation | Method for associating annotation with electronically published material |
US5257185A (en) * | 1990-05-21 | 1993-10-26 | Ann W. Farley | Interactive, cross-referenced knowledge system |
US5325298A (en) * | 1990-11-07 | 1994-06-28 | Hnc, Inc. | Methods for generating or revising context vectors for a plurality of word stems |
US5265065A (en) * | 1991-10-08 | 1993-11-23 | West Publishing Company | Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query |
US5483650A (en) * | 1991-11-12 | 1996-01-09 | Xerox Corporation | Method of constant interaction-time clustering applied to document browsing |
US5371807A (en) * | 1992-03-20 | 1994-12-06 | Digital Equipment Corporation | Method and apparatus for text classification |
US5517783A (en) * | 1994-02-14 | 1996-05-21 | Edgar; Dwight A. | Lure container |
US5655116A (en) * | 1994-02-28 | 1997-08-05 | Lucent Technologies Inc. | Apparatus and methods for retrieving information |
US5991709A (en) * | 1994-07-08 | 1999-11-23 | Schoen; Neil Charles | Document automated classification/declassification system |
US5694594A (en) * | 1994-11-14 | 1997-12-02 | Chang; Daniel | System for linking hypermedia data objects in accordance with associations of source and destination data objects and similarity threshold without using keywords or link-difining terms |
US5625767A (en) * | 1995-03-13 | 1997-04-29 | Bartell; Brian | Method and system for two-dimensional visualization of an information taxonomy and of text documents based on topical content of the documents |
US5708825A (en) * | 1995-05-26 | 1998-01-13 | Iconovex Corporation | Automatic summary page creation and hyperlink generation |
US5708822A (en) * | 1995-05-31 | 1998-01-13 | Oracle Corporation | Methods and apparatus for thematic parsing of discourse |
US5768580A (en) * | 1995-05-31 | 1998-06-16 | Oracle Corporation | Methods and apparatus for dynamic classification of discourse |
JPH0969101A (ja) * | 1995-08-31 | 1997-03-11 | Hitachi Ltd | 構造化文書生成方法および装置 |
US5826025A (en) * | 1995-09-08 | 1998-10-20 | Sun Microsystems, Inc. | System for annotation overlay proxy configured to retrieve associated overlays associated with a document request from annotation directory created from list of overlay groups |
US5819260A (en) * | 1996-01-22 | 1998-10-06 | Lexis-Nexis | Phrase recognition method and apparatus |
JP3643470B2 (ja) * | 1997-09-05 | 2005-04-27 | 株式会社日立製作所 | 文書検索システムおよび文書検索支援方法 |
US5832495A (en) | 1996-07-08 | 1998-11-03 | Survivors Of The Shoah Visual History Foundation | Method and apparatus for cataloguing multimedia data |
US5832499A (en) | 1996-07-10 | 1998-11-03 | Survivors Of The Shoah Visual History Foundation | Digital library system |
US5920854A (en) * | 1996-08-14 | 1999-07-06 | Infoseek Corporation | Real-time document collection search engine with phrase indexing |
US6502191B1 (en) * | 1997-02-14 | 2002-12-31 | Tumbleweed Communications Corp. | Method and system for binary data firewall delivery |
JP3655714B2 (ja) * | 1996-11-15 | 2005-06-02 | 株式会社ニューズウオッチ | 情報フィルタリング装置及び記録媒体 |
JP3579204B2 (ja) * | 1997-01-17 | 2004-10-20 | 富士通株式会社 | 文書要約装置およびその方法 |
US6415319B1 (en) * | 1997-02-07 | 2002-07-02 | Sun Microsystems, Inc. | Intelligent network browser using incremental conceptual indexer |
US5963965A (en) * | 1997-02-18 | 1999-10-05 | Semio Corporation | Text processing and retrieval system and method |
US6023697A (en) * | 1997-02-24 | 2000-02-08 | Gte Internetworking Incorporated | Systems and methods for providing user assistance in retrieving data from a relational database |
US5819258A (en) * | 1997-03-07 | 1998-10-06 | Digital Equipment Corporation | Method and apparatus for automatically generating hierarchical categories from large document collections |
US6266681B1 (en) * | 1997-04-08 | 2001-07-24 | Network Commerce Inc. | Method and system for inserting code to conditionally incorporate a user interface component in an HTML document |
US5940821A (en) * | 1997-05-21 | 1999-08-17 | Oracle Corporation | Information presentation in a knowledge base search and retrieval system |
US6271843B1 (en) * | 1997-05-30 | 2001-08-07 | International Business Machines Corporation | Methods systems and computer program products for transporting users in three dimensional virtual reality worlds using transportation vehicles |
US6233575B1 (en) * | 1997-06-24 | 2001-05-15 | International Business Machines Corporation | Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values |
US6094650A (en) * | 1997-12-15 | 2000-07-25 | Manning & Napier Information Services | Database analysis using a probabilistic ontology |
US5991714A (en) * | 1998-04-22 | 1999-11-23 | The United States Of America As Represented By The National Security Agency | Method of identifying data type and locating in a file |
US6389462B1 (en) * | 1998-12-16 | 2002-05-14 | Lucent Technologies Inc. | Method and apparatus for transparently directing requests for web objects to proxy caches |
US6374241B1 (en) * | 1999-03-31 | 2002-04-16 | Verizon Laboratories Inc. | Data merging techniques |
US6424982B1 (en) * | 1999-04-09 | 2002-07-23 | Semio Corporation | System and method for parsing a document using one or more break characters |
US6665681B1 (en) * | 1999-04-09 | 2003-12-16 | Entrieva, Inc. | System and method for generating a taxonomy from a plurality of documents |
US6401077B1 (en) * | 1999-05-28 | 2002-06-04 | Network Commerce, Inc. | Method and system for providing additional behavior through a web page |
US6519586B2 (en) * | 1999-08-06 | 2003-02-11 | Compaq Computer Corporation | Method and apparatus for automatic construction of faceted terminological feedback for document retrieval |
US6571240B1 (en) * | 2000-02-02 | 2003-05-27 | Chi Fai Ho | Information processing for searching categorizing information in a document based on a categorization hierarchy and extracted phrases |
US6741981B2 (en) * | 2001-03-02 | 2004-05-25 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration (Nasa) | System, method and apparatus for conducting a phrase search |
US6697793B2 (en) * | 2001-03-02 | 2004-02-24 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | System, method and apparatus for generating phrases from a database |
US6823333B2 (en) * | 2001-03-02 | 2004-11-23 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | System, method and apparatus for conducting a keyterm search |
-
1999
- 1999-04-09 US US09/289,174 patent/US6665681B1/en not_active Expired - Lifetime
-
2000
- 2000-04-06 WO PCT/US2000/009471 patent/WO2000062203A1/en active Application Filing
- 2000-04-06 AU AU42212/00A patent/AU4221200A/en not_active Abandoned
- 2000-04-06 JP JP2000611203A patent/JP2002541590A/ja active Pending
- 2000-04-06 CA CA002366545A patent/CA2366545C/en not_active Expired - Fee Related
- 2000-04-06 EP EP00921957A patent/EP1208464A4/en not_active Ceased
-
2002
- 2002-11-29 HK HK02108694.0A patent/HK1047174A1/zh unknown
-
2003
- 2003-11-10 US US10/704,138 patent/US7113954B2/en not_active Expired - Lifetime
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2002541590A5 (ja) | ||
CN102737013B (zh) | 基于依存关系来识别语句情感的设备和方法 | |
CN102567509B (zh) | 视觉信息辅助的即时通信方法及系统 | |
US10839155B2 (en) | Text analysis of morphemes by syntax dependency relationship with determination rules | |
WO2013125286A1 (ja) | ノン・ファクトイド型質問応答システム及びコンピュータプログラム | |
WO2010038540A1 (ja) | テキストセグメントを有する文書から用語を抽出するためのシステム | |
US20040064305A1 (en) | System, method, and program product for question answering | |
CN101937430A (zh) | 一种汉语句子中事件句式的抽取方法 | |
Sahu et al. | Prashnottar: a Hindi question answering system | |
JP2006244262A (ja) | 質問回答検索システム、方法およびプログラム | |
CN109344187A (zh) | 一种司法判决书案情信息结构化处理系统 | |
CN101404036A (zh) | PowerPoint电子演示文稿的关键词抽取方法 | |
Hachey et al. | Datasets for generic relation extraction | |
JP4085156B2 (ja) | テキスト生成方法及びテキスト生成装置 | |
CA3207685A1 (en) | System and method for text processing for summarization and optimization | |
Alshaina et al. | Multi-document abstractive summarization based on predicate argument structure | |
JP2007047974A (ja) | 情報抽出装置および情報抽出方法 | |
Singh et al. | Writing Style Change Detection on Multi-Author Documents. | |
Kaisser et al. | Question Answering by Searching Large Corpora With Linguistic Methods. | |
Lewis | ODIN: A model for adapting and enriching legacy infrastructure | |
JP4931114B2 (ja) | データ表示装置、データ表示方法及びデータ表示プログラム | |
Das et al. | The 5w structure for sentiment summarization-visualization-tracking | |
JPH1196177A (ja) | 用語辞書生成方法および用語辞書生成プログラムを記録した記録媒体 | |
US6973423B1 (en) | Article and method of automatically determining text genre using surface features of untagged texts | |
Garg et al. | A systematic and exhaustive review of automatic abstractive text summarization for Hindi language |