JP5534266B2 - 電子文書コレクションからクエリ結果を送付する方法、システム及び装置 - Google Patents

電子文書コレクションからクエリ結果を送付する方法、システム及び装置 Download PDF

Info

Publication number
JP5534266B2
JP5534266B2 JP2012521605A JP2012521605A JP5534266B2 JP 5534266 B2 JP5534266 B2 JP 5534266B2 JP 2012521605 A JP2012521605 A JP 2012521605A JP 2012521605 A JP2012521605 A JP 2012521605A JP 5534266 B2 JP5534266 B2 JP 5534266B2
Authority
JP
Japan
Prior art keywords
document
aggregate
documents
profile
collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012521605A
Other languages
English (en)
Other versions
JP2012533817A (ja
Inventor
レスニック,ジェイソン,デイヴィッド
Original Assignee
ファンデーションアイピー,エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ファンデーションアイピー,エルエルシー filed Critical ファンデーションアイピー,エルエルシー
Publication of JP2012533817A publication Critical patent/JP2012533817A/ja
Application granted granted Critical
Publication of JP5534266B2 publication Critical patent/JP5534266B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Description

本発明は、電子文書コレクション、コレクションへのクエリの送出、及びクエリ結果の提示に関する。より具体的には、本発明は、サーチされる知財文書の各セクションに重点を置くことによってサーチプロファイルを作成し、サーチプロファイルの少なくとも1つに対して返されたクエリ結果の関連性(relevancy)に基づいてクエリ結果を提示することに関する。
審査のために提出される全ての知財文書は、世界中のどの特許局(以下では、特許庁又は特許局)かを選択する以前に、各知財文書が、新規で有用で非自明であると考えられることを含む、特定の要件を満たさなければならない。審査のための知財文書を適切に作成するには、一発明に一特許だけが与えられるというような、関連技術分野の従来における知財文書(すなわち、先行技術)の知識を有することが有用である。先行技術を確認するプロセスは、サーチとして知られる。サーチの結果は、一般に、その後の知的財産権出願の作成者が、特許可能又は別の方法で保護可能な内容と考えられまた発明者又は知的財産権の所有者の目的を達成するのに妥当な戦略の策定を支援するものに労力を集中させるのに役立つ。
現在の電子情報時代における技術の発展前は、知的財産権サーチが手作業で行われたことは知られている。サーチャは、開示を調査し、分類体系に基づいて、その開示が分類されているはずの場所を確認し、その後で分類内の文書と記録のサーチを行う。サーチャが、行われるサーチの定義範囲に基づいて知財文書の適切なセクションを視覚的に調査することは認識されている。情報技術の出現により、ほとんどの知的財産権付与と公開出願が、電子的形態でしか利用できなくなったため、ほとんどの管轄範囲で手作業のサーチが利用できなくなった。電子形式の知財文書の出現により、電子知的財産権データベースのサーチに、手動サーチに使用されたものと類似の戦略が使用されることがある。
様々な結果を得るために様々な分類のサーチが依頼されることがある。例えば、知的財産権資産の出願をすべきかどうかを確認するために、新規性サーチが依頼されることがある。製品が現行の知的財産権資産のクレームの対象かどうかを確認するために、製品クリアランスサーチが依頼されることがある。知的財産権資産の発行クレームが有効かどうかを判定するために、無効性サーチが依頼されることがある。従来の電子知財文書サーチツールは、様々な分類のサーチに対応していなかった。より正確に言うと、サーチを行う人(サーチャとして知られる)には、サーチで調査する知財文書のセクションをサーチ範囲に基づいて限定する負担がかかる。データベースの付与済み知的財産権と公開済みで係属中の知的財産権出願の量が増えており、各サーチでより多くの関連文書を調査しなければならないので、サーチャの負担が増大した。
従って、クエリ送信の結果を編成して結果を評価することと関連した負担を軽減し、かつ電子形式の知財文書を利用するためにサーチャよって使用されるツールが必要である。このツールは、サーチャが、サーチ中に知財文書の様々なセクションを活用して、正確で、妥当で、望ましいサーチ結果を効率的かつ効果的に決定することを可能にしなければならない。
本発明は、特許文書のコレクションを効率的かつ効果的にサーチするために方法、システム及び物品を含む。
本発明の一様相では、電子文書コレクションのサーチの結果に関連性を割り当てるためにコンピュータで実施される方法が提供される。特許文書のコレクションを集約し索引付けし、コレクション内の各特許文書は、複数のセクションからなる。コレクション内の各特許の各セクションを識別する。文書コレクションのサーチプロファイルを編成する。サーチプロファイルは、コレクション内に各文書の識別された各セクションの選択を含む。各プロファイルに関して、特定のセクションのそれぞれに重みを割り当てる。コレクションへのクエリの送信時に、サーチプロファイルが選択され、クエリデータが、選択されたプロファイル内の重みが識別され割り当てられたような文書コレクションの各セクション内のデータと比較される。関連性スコアは、クエリ送信から生成された文書の集約物(compilation)内の返された文書ごとに計算される。集約物内の文書は、計算された関連性スコアに基づいて順位付けされる。その後で、集約物の結果は、順位付けに基づいて動的に限定される。集約物に適用された動的限定に基づいて集約物中の関連文書がソートされる。さらに、各プロファイルの選択セクション内の一致文字列の量に基づいて前記識別されたセクションの各々に割り当てられた重みに加えるか前記重みから減じるために、二次重みが適用される。
本発明の別の態様では、コンピュータシステムは、記憶媒体と通信するプロセッサと、記憶媒体上に維持される電子文書コレクションとを備える。電子文書コレクションは、知財文書の集約物である。知財文書の特性に基づいて、コレクション内の各文書は、複数のセクションを有する。文書のコレクションを索引付けし集約するためにディレクタが使用される。ディレクタは、コレクション内の文書の各セクションを識別するドキュメントマネージャと通信する。更に、文書コレクションのサーチプロファイルを編成するプロファイルマネージャが提供される。プロファイルマネージャは、ドキュメントマネージャと通信し、サーチプロファイルを使用して、集約されたコレクション内の各文書の特定の各セクションの選択を含める。プロファイルに含める特定のセクションを選択することに加えて、プロファイルマネージャは、各プロファイル内の選択された各セクションに重みを割り当てる。重みは、関連付けられたセクションへの重点の反映である。クエリ時に、クエリマネージャは、文書コレクションにクエリを送信する。クエリは、少なくとも1つのサーチプロファイルの選択を含み、クエリデータを、プロファイル内で反映されたような文書の各セクション内のデータと比較する。クエリマネージャによって送信された後で、関連する特許文書の集約物が生成され返される。返された集約物内の各文書は、割り当てられた重みと関連性スコアとを有する少なくとも1つの特定のプロファイルセクション内のデータに対するクエリの一致を含む。クエリマネージャと通信し、集約物内の文書を順位付けし、順位に基づいて集約物の結果を動的に限定する関連性ナビゲータが提供される。関連性ナビゲータは、集約物に適用される動的限定に基づいて前記集約物中の関連文書をソートするさらに、プロファイルマネージャは、各プロファイルの選択セクション内の一致文字列の量に基づいて前記識別されたセクションの各々に割り当てられた重みに加えるか前記重みから減じるために、二次重みを適用する。
本発明の更に別の態様では、コンピュータメモリ上の電子文書コレクションのサーチの結果に関連性を割り当てるように構成されたコンピュータプログラム命令を含むコンピュータ可読キャリアを備えた物品が提供される。コンピュータ可読キャリアは、関連性の割り当てを行うコンピュータプログラム命令を含む。知財文書のコレクションを集約し索引付けする命令が提供される。コレクション内の特許文書はそれぞれ、複数のセクションに分割される。コレクションを索引付けした後、コレクション内の各文書の各セクションを識別する命令が提供される。文書のセクションを識別した後で、文書コレクションのサーチプロファイルを編成する命令が提供される。サーチプロファイルは、コレクション内の各文書の識別された各セクションの選択物である。更に、サーチプロファイル内の識別された各セクションに重みを割り当てる命令が提供される。文書コレクションにクエリを送信した後で、少なくとも1つのサーチプロファイルを選択し、クエリデータを、プロファイル内の識別されたコレクション内の文書のセクション内のデータと比較する命令が提供される。次に、クエリ送信から生成された文書の集約物内の返された各文書の関連性スコアを計算し、スコアに基づいてコレクション内の文書を順位付けする命令が提供される。順位付けが完了した後で、順位に基づいて集約物内の結果を動的に限定する命令が提供される。集約物に適用され動的限定に基づいて集約物の関連文書がソートされる。さらに、各プロファイルの選択セクション内の一致文字列の量に基づいて前記識別されたセクションの各々に割り当てられた重みに加えるか前記重みから減じるために、二次重みが適用される。
本発明の他の特徴及び利点は、添付図面と関連して行われる本発明の現在の好ましい実施形態の以下の詳細な説明から明らかになる。
本明細書で参照した図面は、明細書の一部を構成する。図面に示された特徴は、明示的に示されない限り、本発明の全ての実施形態ではなく本発明の一部の実施形態だけを示すものである。その他の場合にはこれと逆の意味は含まれない。
1つ又は複数のプロファイルを生成するために特許文書のセクションを識別するプロセスを示すフローチャートである。
1つ又は複数のプロファイルのための二次重みを作成するプロセスを示すフローチャートである。
二次重みを使用して各プロファイルセクション内の文字列一致が起こる場所を反映させるプロセスを示すフローチャートである。
二次プロファイルを作成し、クエリ送信からのサーチ結果に重みを割り当てるプロセスを示すフローチャートである。
クエリ結果セットに二次プロファイルを適用するプロセスを示すフローチャートである。
クエリ結果をソートするプロセスを示すフローチャートである。
本発明の好ましい実施形態による返されソートされた結果に関連性を割り当てるプロセスを示すフローチャートであり、発行特許の最初のページに印刷するように提案される。
基となる文書コレクションのクエリ結果の表現を動的に限定するプロセスを示すフローチャートである。
基となる文書コレクションのクエリ結果に対する限定を動的に設定するツールとしてグラフィカルユーザインタフェースを使用するプロセスを示すフローチャートである。
グラフィカルユーザインタフェースの例を示すブロック図である。
基となる文書コレクションのクエリ結果をソートし解析するために使用される1組のツールのブロック図である。
本明細書に概略的に述べられ示されたような本発明の構成要素が、様々な異なる構成で構成され設計されてもよいことを容易に理解されよう。したがって、図に示されたような本発明の装置、システム及び方法の実施形態の以下の詳細な説明は、請求されたような本発明の範囲を限定するものではなく、単に発明の特定の実施形態を表すものである。
本明細書に記述された機能ユニットは、マネージャとディレクタとして示された。マネージャ及び/又はディレクタは、フィールドプログラマブルゲートアレイ、プログラマブルアレイロジック、プログラマブルロジックデバイスなどのプログラマブルハードウェアデバイスで実現されてもよい。また、マネージャ及び/又はディレクタは、様々なタイプのプロセッサによって実行されるソフトウェアで実現されてもよい。たとえば、実行可能コードの特定のマネージャ及び/又はディレクタは、たとえば、オブジェクト、プロシージャ、関数又は他の構造として編成されてもよいコンピュータ命令の1つ又は複数の物理又は論理ブロックからなってもよい。しかしながら、特定のマネージャ及び/又はディレクタの実行可能ファイルは、物理的に一緒に配置されなくてもよいが、論理的に結合されたときに、マネージャ及び/又はディレクタを構成しかつマネージャ及び/又はディレクタの規定の目的を達成する、異なる場所に記憶された個別の命令からなってもよい。
実際には、実行可能コードのマネージャ及び/又はディレクタは、単一の命令でも多数の命令でもよく、いくつかの異なるコードセグメントにわたって、様々なアプリケーション間で、またいくつかのメモリ素子にわたって分配されてもよい。同様に、運用データは、本明細書ではマネージャ及び/又はディレクタ内に特定され示されてもよく、任意の適切な形で実施され、任意の適切なタイプのデータ構造内に編成されてもよい。運用データは、単一のデータセットとして収集されてもよく様々な記憶装置を含む様々な場所に分配されてもよく、また少なくとも部分的にシステム又はネットワーク上の電子信号として存在してもよい。
本明細書全体にわたって参照する「特定の実施形態」、「一実施形態」又は「実施形態」は、実施形態と関連して記述される特定の特徴、構造又は特性が、本発明の少なくとも1つの実施形態に含まれることを意味する。したがって、本明細書全体にわたる様々な場所に現れる語句「特定の実施形態」、「一実施形態では」、又は「実施形態では」は、必ずしも同じ実施形態を指すとは限らない。
更に、説明した特徴、構造又は特性は、1つ又は複数の実施形態において任意の適切な仕方で組み合わされてもよい。以下の説明では、本発明の実施形態の完全な理解を提供するために、多数の特定の詳細が提供される。しかしながら、当業者は、本発明を、1つ又は複数の特定の詳細なしに、又は他の方法、構成要素、材料などにより、実施できることを理解するであろう。他の例では、本発明の態様を不明瞭にしないように、周知の構造、材料又は操作は詳細に示されず説明されない。
本発明の示された実施形態は、図面を参照することによって最もよく理解され、全体にわたって同じ部品は同じ番号によって示される。以下の説明は、単なる例として意図され、本明細書で請求される発明と適合する装置、システム及びプロセスの特定の選択された実施形態を単に示す。
[概要]
知財文書コレクションは、発行され公開された出願の集約物である。特許文書コレクションは、知財文書コレクションの部分集合(サブセット)である。特許文書は、発行特許許可と公開特許出願の形で来る。2つのカテゴリの文書間の違いが、それらの実施可能値を識別する。より具体的には、特許許可は、法廷で執行することができる実際の財産権であり、一方、公開特許出願は、係属中の特許権である係属出願である。各特許文書は、複数のセクションに解析され、各セクションは、文字列データとしても知られる記述された単語と句を含む。コレクションのサーチに適応するために、コレクション内の各文書が、各文書内のセクションに基づいて解析され、知財文書の解析されたセクションのそれぞれに重みが割り当てられる。重みは、文書の1つ又は複数の特定のセクションに、クエリのために置かれる重点の数値尺度である。文書セクションの選択が、特定のセクションに割り当てられた重みと共に、サーチプロファイルを作成する。サーチの範囲に応じて、サーチは、文書の特定セクションに限定されることもあり、文書の各セクション内の適合クエリデータに異なる重点が置かれてもよい。クエリ送信からのクエリ結果の表現に適応するために、結果の関連性が動的に限定されることがある。より具体的には、結果と関連付けられた関連性は、結果の統計解析、クエリ結果の全体、及び/又はサーチプロファイルの特性に基づいて動的に修正されてもよい。従って、サーチプロファイルの作成と選択は、サーチ結果の定量化と表現に直接関連する。
[技術的詳細]
実施形態の次の説明では、実施形態の一部分を構成し、本発明を実施することができる特定の実施形態を説明図によって示す添付図面を参照する。本発明の範囲から逸脱することなく構造的な変更を行うことができるので、他の実施形態を利用できることが理解される。
発行され公開された知財文書を示す文書は、複数のセクションに分けられることが理解される。各セクションは、完成した出願を提出するのに必要とされ、各セクションには目的がある。基となる知的財産権の各セクションの詳細は、本明細書では考察されない。しかしながら、開示のために、知財文書の例として、特許の様々なセクションを特定する。ほとんどの場合、各特許出願は、名称、優先権出願日、要約、背景の説明、サマリ、図面の簡単な説明(ある場合)、図面(ある場合)、発明の詳細な説明、及び特許請求の範囲を含む。
特許業界では、サーチの目的により様々なサーチカテゴリが使用されている。例えば、侵害及び/又は製品クリアランスサーチは、特許請求の範囲の文言と関係し、したがって、本質的に文書コレクション内にある特許請求の範囲を対象とすべきである。妥当性及び/又は無効性サーチは、既知の先行技術と関係し、特許文書の優先権出願日の特定を必要とする。発明者が、特許出願の提出前又は後にその発明の新規性を判定しようとするときは、発明者その代理人又は代表者が、新規性サーチを依頼することがある。そのようなサーチは、特許請求の範囲を重視せず、発明の詳細な説明に注目することがある。従って、本明細書に示されたように、各サーチは、文書コレクション内の特許文書の様々なセクションに重点を置く。
図1は、1つ又は複数のプロファイルを作成するために特許文書のセクションを識別するプロセスを示すフローチャート(100)である。例えば米国特許商標局に関しては、現行の施行規則の下で、米国特許商標局に提出された各特許文書は、名称、技術分野と従来技術の説明を含む背景、発明の要約、図面の簡単な説明、図面、好ましい実施形態の詳細な説明、特許請求の範囲、及び要約を含む。一実施形態では、全ての特許文書が、化学的実施例、いくつかの外国特許、特許文書などに、図面を含むとは限らない。同様に、他の国々、地方事務所及び従来の国内慣例では、特許文書に異なる量のセクションがあることがあり、セクションが異なる順位で示されることがある。従って、クエリでコレクション内の特許文書の1つ又は複数のセクションに重点を置く前に、文書の出所、文書の様々なセクション、及びコレクション内のセクションの編成順位を識別しなければならない。
最初に、特許文書のコレクションを集約し索引付けする(102)。当該技術分野では、特許及び特許公報が、複数のセクションからなることが理解される。文書の集約に続いて、文書のコレクション内の各特許の各セクションを識別する(104)。特許文書内のセクションの数に変数NTotalを割り当てる(106)。様々なサーチ要求に対処するために様々なプロファイルを作成する。プロファイルは、特許文書のセクションの様々な組み合わせに重点を置き、かつ/又はセクションに値0を割り当てることによってサーチ自体の際に文書の1つ又は複数のセクションを検討から外すことによって作成される。プロファイル式サーチを支援するために、少なくとも1つのプロファイルが作成される。しかしながら、一実施形態では、プロファイルの選択に対応して特定のサーチの要求に応えるために、複数のプロファイルが作成される。ステップ(106)で、特許文書のセクションが識別された後で、プロファイル指定と関連付けられたカウント変数Xが、初期化され、整数1に割り当てられ(108)、特許文書のセクションに関係するカウント変数Nが、整数1に割り当てられる(110)。特許文書コレクションのセクションから始めて、セクションが、作成されるプロファイル(プロファイル)の一部として使用されるどうかが判定される(112)。ステップ(112)の判定で肯定応答の場合、セクションがプロファイルに接続される(114)。セクションの選択により、セクションに一次重み(primary weight)が割り当てられる(116)。一次重みは、プロファイルにとってのセクションの重要度を示す数値であり、この重要度は、任意の予め選択されたセクションと、プロファイルに結合されるかプロファイルから外される他のセクションとを含む、特許文書コレクションの他のセクションに対するものである。ステップ(116)の後、又はステップ(112)の判定に否定応答した後で、特許文書のセクションと関連付けられた変数Nが、増分される(118)。次に、集約され索引付けされたコレクション内の特許文書の識別された全てのセクションが、プロファイルに結合するかプロファイルから外すことに関して評価されたかどうか判定される(120)。ステップ(120)の判定で肯定応答の場合、プロファイルのプロファイル作成プロセスを終了する(122)。これと反対に、ステップ(120)の判定で否定応答の場合は、次にステップ(112)に戻り、プロファイルに関してコレクション内の更に別のセクションを検討する。次に、文書コレクションのために作成すべき更に別のプロファイルがあるかどうかを判定する(124)。ステップ(124)の判定で肯定応答の場合は、次にカウント変数Xが増分され(126)、ステップ(110)に戻る。これと反対に、ステップ(124)の判定で否定応答の場合、Xと関連付けられた数を変数XTotalに割り当てることによりプロファイルの作成を終える(128)。従って、特許文書コレクションのために1つ又は複数のプロファイルを作成することができ、各プロファイルは、特許文書コレクション内の1つ又は複数の特定されたセクションに重点を置く。
図1に示されたように、サーチプロセス中に特許文書の選択セクションの採用を重視するか重視しないために1つ又は複数のプロファイルが作成されてもよい。図2は、各作成プロファイルに追加されることがある追加次元の重点を示すフローチャート(200)である。より具体的には、各プロファイルの選択セクション内の一致文字列の量に基づいて、重みスコアに加えるか重みスコアから減じるために、二次重み(secondary weight)の形の付加的な重みが使用されることがある。変数XTotalは、図1に示されたような作成プロファイルの量を表すために割り当てられ(202)、カウント変数Xは、整数1に割り当てられる(204)。その後で、変数YTotalは、図1に示されたように、プロファイル内のセクションの量を重み割り当てで表すために割り当てられる(206)。プロファイルの個々のセクションを評価するために、カウント変数Yは、整数1に割り当てられる(208)。次に、プロファイルのセクションYに二次重みが追加されるかどうか判定される(210)。ステップ(210)の判定で否定応答の場合は、次にステップ(230)にジャンプし、必要に応じてプロファイル内の次のセクションを評価する。これと反対に、ステップ(210)の判定で肯定応答の場合は、次に第2のクエリが行われ、二次重み割り当てが層状構造(tiered structure)になるかどうかを判定する(212)。より具体的には、各プロファイルは、選択されたプロファイルによるサーチプロセス中に返されたデータ文字列一致の量に依存する重み値の階層を含むことがある。ステップ(212)の判定で否定応答の場合は、次にセクションYへの二次重み割り当てを使用するために返さなければならないデータ文字列一致の最小しきい値を設定する(214)。ステップ(214)に続いて、プロファイル,セクションの二次重み値が設定される(216)。ステップ(214)及び(216)の入力は、二次重み構造に適合するパラメータを、ステップ(212)で確立された通りに設定することである。従って、各プロファイルセクションに関して、一致のしきい値を超えたときにサーチ結果に重点を置くように二次重み値が設定されてもよい。
単一の二次重み値の設定に加えて、プロファイルの各選択セクションは、二次重みしきい値の階層に対応するように構成されてもよい。ステップ(212)の判定で肯定応答の後で、変数ZTotalは、プロファイル,セクションに割り当てられる階層しきい値の量に割り当てられ(218)、層カウント変数Zが、整数0に設定される(220)。ステップ(220)の後で、プロファイル,セクション,層(tier)に対する二次重み割り当てを使用するために返されなければならないデータ文字列一致の最小しきい値が設定され(222)、プロファイル,セクション,層の二次重み値が設定される(224)。選択された層に重み値が設定された後、層カウント変数Zが増分され(226)、続いて、プロファイル,セクションの全ての層に関して全ての重み値が設定されたかどうかが判定される(228)。ステップ(228)の判定で否定応答の後、ステップ(222)に戻る。これと反対に、(228)の判定で肯定応答の後又はステップ(216)に続いて、カウント変数Yが増分され、選択プロファイルの次のセクションの評価に移る(230)。次に、二次重みしきい値の階層の割り当てのために、選択プロファイルの全てのセクションが評価されかどうかを判定する(232)。ステップ(232)の判定で否定応答の場合は、次にステップ(210)に戻り、ステップ(232)の判定で肯定応答の場合は、次にプロファイルカウント変数Xが増分される(234)。ステップ(234)に続いて、二次重みの割り当てに関して作成プロファイルがすべて評価されたかどうか判定される(236)。ステップ(236)の判定での否定応答に続いて、ステップ(206)に戻り、ステップ(236)の判定での肯定応答は、作成プロファイルの選択くセクションに二次重みしきい値の階層を割り当てることで終わる(238)。従って、各プロファイルは、二次重みの階層により、各プロファイルの選択セクションとプロファイル内の一致文字列の量の両方に重点を置くように構成されてもよい。
図2に示されたように、二次重みの階層(すなわち、層)は、解析される文書コレクション内のクエリ文字列とデータの一致の量に関する1つ又は複数のしきい値に基づく二次重みにより、プロファイルの個々の各セクションに適用されてもよい。別の実施形態では、図3に示されたように、二次重みは、1つ又は複数のプロファイルセクション内の文字列一致が起こる場所を反映してもよい。この二次重みは、図2に示された二次重みと別でもよく追加でもよい。図1に示されたように、変数XTotalは、作成プロファイルの量を表すように割り当てられ(302)、カウント変数Xは、整数1に割り当てられる(304)。その後で、変数YTotalは、重み割り当てでプロファイル内のセクションの量を表すように割り当てられ(306)、カウント変数Yが、整数1に割り当てられる(308)。次に、プロファイル,セクションに二次重みが追加されたかどうか判定される(310)。ステップ(310)の判定で肯定応答の後、プロファイル,セクションが複数のサブセクションに分割される(312)。ステップ(312)での分割には様々な実施形態が使用できる。例えば、一実施形態では、最初の文に限定される第1のサブセクション、最後の文に限定される第3のサブセクション、及び第1と第3のサブセクション間にある全てのデータに限定される第2のサブセクションを含む3つのサブセクションがあってもよい。同様に、別の実施形態では、プロファイル,セクションが複数のセクションに分割されてもよく、各セクションの長さは、全体としてプロファイル,セクションの割合に関係する。サブセクションの量の決定に使用される方法に関係なく、各プロファイル,セクションは、プロファイル,セクション内だけでなく選択サブセクション内の一致の場所の一致文字列を反映させるために割り当てられた二次重みを有する2つ以上のサブセクションに分割されてもよい。
ステップ(312)に続いて、変数ZTotalが、プロファイル,セクションのために作成されたサブセクションの量に割り当てられ(314)、カウント変数Zが、整数1に割り当てられる(316)。プロファイル,セクション,サブセクションには二次重みが割り当てられる(318)。ステップ(318)での割り当てに続いて、カウント変数Zが増分され(320)、次にプロファイル,セクション内に、二次重み割り当てに関して評価されなかったサブセクションが他にないかどうか判定される(322)。ステップ(322)の判定で否定応答の後、ステップ(318)に戻る。これと反対に、ステップ(322)の判定で肯定応答又はステップ(310)の判定で否定応答の後で、カウント変数Yが増分される(324)。次に、プロファイル内に、二次重みの割り当てに関して評価されなかったセクションがあるかどうか判定される(326)。ステップ(326)の判定で否定応答の後、ステップ(310)に戻る。これと反対に、ステップ(326)の判定で肯定応答の後、カウント変数Xが増分され(328)、全てのプロファイルが、二次重み割り当てに関して評価されたかどうか判定される(330)。ステップ(330)の判定で否定応答の後、ステップ(306)に戻り、肯定応答の場合は、二次重み割り当てプロセスを終える。これにより、プロファイルセクションは、1つ又は複数の特定のサブセクションに割り当てられた二次重みにより、物理的な場所に基づいて複数のサブセクションに細分されてもよい。
図1〜図3では、特許文書を一致文字列セットに関してサーチし、一致を有する各文書の様々なセクションに重みを適用するための一次プロファイルを作成した。また、一致文字列セットを有する文書の集約物に基づいて二次プロファイルを使用してもよい。より具体的には、結果をサーチャに提示する前に、二次的検討に基づいて結果に二次重みを適用するために二次プロファイルを使用してもよい。優先日及び/また公開日を含むがこれらに限定されない特許文書の様々な特徴が二次重みの使用に利用されてもよい。特許業界では、優先日は、特許ファミリ内の最も早い日付を表す。より具体的には、優先日は、発明を詳細に記述した特許出願を最初に出願するときに発明に設定される。特許文書の公開日は、発行特許が許可される日付を表し、特許公開の公開日は、係属中の特許出願が公開された日付を表す。これらの日付のうちの1つ又は全てから日付を利用する二次プロファイルが作成されてもよい。
図4は、クエリ送信から返された文書データと関連付けられた日付因子に基づいて重みをサーチ結果に割り当てる、二次プロファイルを作成するプロセスを示すフローチャート(400)である。一実施形態では、日付因子には、公開日、出願日及び外国優先日が限定なし挙げられる。最初に、二次プロファイル(SecondaryProfile)を設定する(402)。クエリ送信からの文書の量を変数NTotalに割り当て(404)、カウント変数Nを整数1に設定する(406)。1組の返された文書内の文書に関して、優先日を取得し(408)、続いて変数Nを増分する(410)。次に、1組の返された文書に関して因子SecondaryProfileの取得が完了したかどうかが判定される(412)。ステップ(412)の判定で否定応答の後、ステップ(408)に戻る。これと反対に、ステップ(412)の判定で肯定応答の後、抽出されたSecondaryProfile因子に基づいてサーチ結果内の文書をソートするソートアルゴリズムを実行する(414)。使用できるソートアルゴリズムには多くの様々な形態があり、したがって、本発明は、いかなる特定のソートアルゴリズムにも限定されない。コレクション内の文書のソートが完了した後で、変数文書OLDを、組内の最も昔のSecondaryProfile日付を有する文書に割り当て(416)、変数文書NEWを、組内の最も新しいSecondaryProfile日付を有する1つの文書に割り当てる(418)。変数日付範囲を変数文書NEWと文書OLDとの差に割り当て(420)、日付範囲を複数のセクションに分割する(422)。ステップ(422)での日付範囲の分割に使用できる様々な実施形態がある。例えば、一実施形態では、文書NEWと関連付けられた日付に最も近い文書に限定する第1のサブセクション、文書OLDと関連付けられた日付に最も近い文書に限定する第3のサブセクション、及び第1と第3のサブセクションの間にある日付を有する全ての文書に限定する第2のサブセクションを含む3つのサブセクションがある。同様に、別の実施形態では、日付範囲は、複数のセクションに分割されてもよく、各セクションが、コレクションからの文書の等しい分布を有する。従って、使用される方法に関係なく、文書セット内の各サブセクションは、二次重みに基づくクエリ結果の関連性により二次重みが適用されてもよい。
少なくとも1つの二次データ基準に基づいてクエリ結果から文書をソートした後で、日付範囲内のセクションの量に変数ZTotalを割り当て(424)、カウント変数Zを整数1に割り当てる(426)。日付範囲Zに重みを割り当て(428)、次に変数Zを増分する(430)。ステップ(430)に続いて、各サブセクションの重みの割り当てが完了したかどうかを判定する(432)。ステップ(432)の判定で否定応答に続いて、ステップに戻る(428)。これと反対に、ステップ(432)の判定で肯定応答の場合は、作成された各サブセクションの重み割り当てを終える。従って、データを表示する前に二次因子を更に強調するために、結果セットに二次重みを適用する二次プロファイルが作成されてもよい。
文書コレクションのクエリ結果に対する二次因子の適用は、日付に限定されない。図5は、特許文書のどれかと関連付けられた日付を使用しない結果セットに対する二次プロファイルの適用を示すフローチャート(500)である。サーチを開始したとき、クエリに対応するために1つ又は複数の文書コレクションを選択する(502)。一実施形態では、文書コレクションは、知財文書コレクションの形でよい。同様に、一実施形態では、文書コレクションは、米国特許商標局、日本特許庁、欧州特許庁などによって発行された文書のコレクションなどの様々な状態の形でよい。文書コレクションを選択した後で、サーチのためのプロファイルを選択する(504)。プロファイルの例は、前に図1〜図3に示された。ステップ(502)と(504)で選択が完了した後、クエリを入力してプロファイル及び選択文書コレクションに送信する(506)。一実施形態では、クエリは、文字列である。コレクション内のクエリの少なくとも1つの発生を有する文書の量のカウントを決定し、変数XTotalに割り当て(508)、一致文書のためのカウント変数Xを整数1に割り当てる(510)。更に、変数NTotalをクエリ送信用に選択したプロファイル内のセクションの量に割り当て(512)、選択されたプロファイルのカウント変数Nを整数1に割り当てる(514)。各文書,セクションのスコアを計算する。一実施形態では、セクション内のクエリの一致の数とセクションに割り当てられたポイントの量の積としてスコアを計算する(516)。一実施形態では、セクションへのポイント割り当ては、コレクション内の特定のセクションの値を示す。
ステップ(516)に続いて、変数Nを増分し(518)、次にプロファイル内の全てのセクションの評価が完了したかどうかを判定する(520)。ステップ(520)の判定で否定応答の後、ステップに戻る(516)。これと反対に、ステップ(520)の判定で肯定応答の後、変数Xを増分する(522)。次に、カウント内の全ての文書の評価が完了したかどうか判定する(524)。ステップ(524)の判定で肯定応答の場合、返された文書のスコア評価が終わる(526)。これと反対に、ステップ(524)の判定で否定応答の後、ステップ(516)に戻り、プロファイルセクション全体にわたって次の文書のスコアを評価する。
全ての文書と選択プロファイルにスコアを割り当てた後、クエリ送信から返された文書と選択プロファイルのそれぞれに関して総スコアを計算する(526)。前に図5に示されたように、集約物内の各文書は、プロファイルで指定されたような一致文字列の量及びそれと関連した重みに基づく数値の形のスコアを含む。
特許サーチを行うプロセスでは、どのサーチ結果がより関連性が高いかを決定することが重要であることは理解される。したがって、スコアは、クエリへの寄与因子であることに加えて、一致文書の順位付けを提供するためにも使用される。順位付けは、返されたどの文書が、返された他の文書より関連性が高いと思われるかを示す。順位付けと一緒に使用される様々な因子があり、そのような因子には、スコアに基づく順位及び/又は順位と二次因子の組み合わせが挙げられる。
図6は、クエリから返された文書を、返された文書1個当たりとプロファイル内のセクション1個当たりのスコア割り当てに基づいてソートするプロセスを示すフローチャート(600)である。図5で計算されたように、変数XTotalは、クエリ送信の少なくとも1つの発生を有するクエリ内の返された文書の総量に割り当てられる(602)。次に、ソートアルゴリズムを呼び出して文書をソートする(604)。一実施形態では、文書は、最高スコアから最低スコアの順序でソートされてもよく、最低スコアから最高スコアの順序でソートされてもよい。様々な形のソートアルゴリズムを使用することができ、したがって、本発明は、如何なる特定のソートアルゴリズムにも限定されない。コレクション内の文書のソート全体が完了した後で、クエリで選択されたプロファイル内の文書コレクションもそれぞれソートし、各セクション内の文書のソートを作成する。一実施形態では、返された文書をソートするプロセスは、スコア結果の順位付けと考えることができる。変数NTotalは、サーチに選択されたプロファイル内のセクションの量を表す(606)。セクションカウント変数Nを整数1に初期化し(608)、文書カウント変数Xを変数1に初期化する(610)。セクションNに関して、クエリ入力の少なくとも1つの発生を有する各文書Xを、最初の文書Xから最後の文書XTotalまでソートする(612)。セクションのソートを完了した後で、変数Nを増分し(614)、続いて選択プロファイル内の全てのセクションがソートに関して評価されたかどうかを判定する(616)。ステップ(616)の判定で否定応答の後、(612)に戻る。これと反対に、ステップ(616)の判定で肯定応答の場合は、特定プロファイル内の全てのセクションが、ソートされた文書の総数を有することを示す。従って、クエリ結果のソートは、2つのレベルで行われ、第1のレベルは、全体のクエリであり、第2のレベルは、プロファイルを含む特定セクションによるソートである。
文書コレクションのソートが完了した後、ソートされたクエリ結果を伝えるために様々なツールを起動することができる。より具体的には、クエリが完了しクエリ結果をソートする際に、クエリ送信者に伝えられるデータは、全体としてクエリからの結果の関連性及び/又は送信クエリプロファイル内のセクション1個当たりの関連性に基づく。図7は、返されソートされたサーチ結果に関連性を割り当てるプロセスを示すフローチャート(700)である。サーチ結果を返した層の量を変数TTotalに割り当てる(702)。一実施形態では、変数TTotalは、静的変数である。しかしながら、別の実施形態では、変数TTotalは、動的変数でもよい。関連性の評価は、2つのレベルで行われてもよく、第1のレベルは、クエリ結果内の全ての文書に基づき、第2の評価は、各プロファイル文書コレクションに基づく。変数XTotalは、クエリから返されソートされた全ての文書を表し(704)、各層Tに割り当てられるクエリ結果の量QSを計算するために、層TTotalの量によって割られる(706)。クエリ結果を層Tに割り当てるために、層カウント変数Tを整数1に初期化し(708)、層に割り当てられる文書を表すカウント変数Xを整数1に初期化する(710)。ステップ(708)及び(710)の初期化の後、文書を層に割り当てる(712)。ステップ(712)での割り当ての後、変数Xを増分し(714)、層が、割り当てられたクエリ結果で満杯かどうかを判定する(716)。ステップ(716)の判定で否定応答の後、ステップ(712)に戻る。これと反対に、ステップ(716)の判定で肯定応答の後で、層に関するクエリ結果の割り当てが完了する。次に、変数Tを増分し(718)、続いて層へのクエリ結果の割り当てがすべて完了したかどうかを判定する(720)。ステップ(720)の判定で否定応答の後、ステップ(710)に戻る。これと反対に、ステップ(720)の判定で肯定応答の場合は、確立された層へのクエリ結果への割り当てを完了する。層へのクエリ結果のソートリストの割り当てが、最も関連性の高いものから最も関連性の低いものにソートする降順形式でもよく、最も関連性の低いものから最も関連性の高いものへの昇順形式でもよいことに注意されたい。同様に、一実施形態では、ソート結果と順位付け結果に変曲点があり、隣り合った層は変曲点で分割される。したがって、クエリ結果は、選択ソート文書の関連性を強調するために層に割り当てられる。
前述のように、クエリ結果は、クエリ送信のプロファイルに関係なく粗ベース(coarse basis)でソートされてもよい。しかしながら、層割り当ては、粒ベース(granular basis)としても知られるプロファイルベースで行われてもよい。より具体的には、クエリ送信における各プロファイルは、プロファイルの特徴を考慮した返された文書の関連性の順にソートされてもよい。プロファイルの使用を支援するために、プロファイルに割り当てられた各組の文書は、図7に示されたように層に編成されてもよい。この粒プロファイルの層割り当ては、プロファイルの特性に基づいてクエリ結果を更に伝達することを可能にする。
前述のように、文書コレクションのクエリ結果内の各特許を解析して、関連性に基づいて結果を提示することができる。一実施形態では、結果は、知財文書の返された集約物の指定セクション内のデータ一致の値を強調するか強調しないように提示されてもよい。同様に、一実施形態では、関連性に基づいてサーチ結果の表現が限定されもよい。クエリ結果への層の割り当てに関して、選択層だけが表示に利用可能でもよく、選択層は、より関連性の高いクエリ結果を含むと考えられる層でよい。同様に、クエリ結果のスコア付けに関して、送信されたクエリに対して定義されたスコア内の結果だけを提示できるように限定を割り当ててもよい。クエリ結果の表示を特定の関連性スコアを有する結果だけに限定する他の形態を実施することができるので、クエリ結果の表示の限定は、本明細書に示された例に限定されるべきでない。
一実施形態では、ソートされたクエリ結果は、関連文書の集約物として静的に提示される。しかしながら、別の実施形態では、文書コレクションの返しは、返された文書の順位付けに基づいて動的に限定されてもよい。動的態様は、クエリ結果を反映させる関連性基準の変更を支援する。図8は、クエリ結果の表示を動的に限定するための一実施形態を示すフローチャート(800)である。前述のように、クエリから返された各文書は、クエリ送信因子に対する関連性の数値因子に基づいてソートされる(802)。曲線当てはめルーチン(curve fitting routine)は、数値データ、すなわち返された各文書に割り当てられた関連性の数値因子に基づいて、返された文書の集約物に適用される(804)。曲線当てはめルーチンは、集約物のデータに対する理論関数を計算する。より具体的には、曲線当てはめルーチンは、この論理関数を未処理の関連性数値因子に基づいて決定する。曲線当てはめルーチンに基づいて、集約物内の文書のいくつかは、論理関数の曲線上又はその曲線近くであることがある(806)。論理関数の1つ又は複数の導関数が計算される(808)。集約物の結果を動的に制限するために、関数の導関数の量を選択する(810)。より具体的には、集約の結果を最も関連性の高い文書に限定するには、動的選択は、曲線当てはめルーチンの関数の一次導関数内に限定されることなる。同様に、集約の結果を拡張するには(得られる文書の量が多くなる)、動的選択が、二次導関数(又はもっと高次)に拡張される。選択する導関数の量に基づいて、導関数選択内にある文書の集約物を返す(812)。従って、返された文書の集約物は、曲線当てはめルーチンの論理関数に対する文書の近さに基づいて動的に修正される。
図8に示された動的選択プロセス及びツールは、集約結果を限定する一実施形態を示す。別の実施形態では、ソートされた集約物の全体結果とのユーザ対話及び修正を支援するために、ソースコード上の装飾として、グラフィカルユーザインタフェースが適用される。図9は、グラフィカルユーザインタフェースの使用によって集約結果を動的に限定するプロセスを示すフローチャート(900)である。前述のように、クエリから返された各文書を、クエリ送信因子に対する関連性の数値因子に基づいてソートする(902)。サーチ結果をグラフ上にプロットする(904)。様々な形のグラフを使用することができる。一実施形態では、グラフは、返された文書の量を1つの軸上に有し、数値関連性因子を別の軸に有する二次元グラフの形でよい。インタフェース上に、文書の量を特定の関連性値に限定することができる機構が提供される(906)。一実施形態では、ユーザインタフェース上にスライダが提供され、ポインティングツールによって、スライダをグラフ上に提供された任意の関連性値に移動させることができる(908)。スライダの移動に基づいて、関連文書の量と、関連すると考えられる特定の文書が動的に変化する。より具体的には、スライダは、区分線として働き、スライダ位置より上の関連性割り当てと関連付けられた全ての文書は、関連あるものとして返され(910)、スライダ位置より下の関連割り当てと関連付けられた文書はすべて返されない(912)。一実施形態では、スライダ位置に割り当てられた関連性の全ての文書は、関連性があるものとして返される。これと反対に、一実施形態では、スライダ位置に割り当てられた関連性の全ての文書は、関連すると考えられないので、返されない。従って、グラフィカルユーザインタフェース上のスライダを移動させて、集約物内の関連すると考えられ返される文書を調整することができる。
図9で前述したように、グラフィカルユーザインタフェースを使用して、関連文書の動的選択を容易にするツールを提供することができる。図10は、グラフィカルユーザインタフェースの例を示すブロック図(1000)である。より具体的には、コンピュータシステム(1000)は、バス構造(1008)によってメモリ(1006)に結合された処理装置(1002)を備える。1つの処理装置(1004)だけが示されているが、一実施形態では、拡張設計でより多くの処理装置が提供されてもよい。システム(1002)は、文書コレクション(1042)を収容するように構成された記憶媒体(1040)と通信するように示された。一実施形態では、電子文書コレクションは、発行特許と公開特許出願を含む特許文書の集約物を含む。記憶媒体(1040)は、処理装置(1004)と通信する。更に、システムは、画像データを表すために表示装置(1050)と通信するように示された。表示装置(1050)と通信するために入力装置(1052)が使用される。キーボード、マウス、トラックボール、電子ペンなどを含むがこれらに限定されない様々な形の入力装置を使用することができる。表示装置(1050)上には、個々の結果に付けられた計算された関連性スコアと、集約物を構成する文書の量の両方に基づいて、クエリ結果の集約の図形表現を伝達するグラフィカルユーザインタフェース(1054)が提供される。一実施形態では、グラフィカルユーザインタフェース(1054)は、プロセッサ(1004)上で実行されるソースコード上の装飾として働く。グラフィカルユーザインタフェース内には、クエリ結果の部分集合の動的選択を支援するために、入力装置(1052)によってアクセス可能な図形機構(1060)が提供される。一実施形態では、図形機構(1060)は、クエリ結果の図形表現内で区切り線を表すスライダの形である。図形機構(1060)が図形表現を横切って移動されるとき、集約物に入れられる特定のクエリ結果が修正される。一実施形態では、一方の側で参照された全ての文書及び/又は図形機構(1060)上に含まれる全ての文書は、クエリ結果に含めるように選択され、図形機構(1060)の別の側で参照された全ての文書は、除外される。従って、グラフィカルユーザインタフェースの図形機構(1060)は、クエリ結果の集約物に動的修正を適用するツールである。
図1〜図9に示されたように、文書コレクションにクエリを送信し、クエリに応じてコレクションを解析するプロセス及び/又は命令が使用される。しかしながら、本発明は、プロセス又は1組の命令に限定されるべきでない。一実施形態では、本発明は、文書コレクションと通信するハードウェア要素からなってもよい。図11は、クエリ送信によるサーチプロファイルの送信に基づくクエリ結果を1つ又は複数の層内にソートし解析するための1組のツールを示すブロック図(1100)であり、このツールは、サーチプロファイル内の特定された知財文書の様々なセクションへの重みの割り当てを含む。図示されたように、コンピュータシステム(1102)は、バス構造(1108)によってメモリ(1106)に結合された処理装置(1104)を備える。1つの処理装置(1104)だけが示されているが、一実施形態では、拡張設計でより多くの処理装置が提供されてもよい。システム(1102)は、文書コレクション(1142)を収容するように構成された記憶媒体(1140)と通信するように示された。一実施形態では、電子文書コレクションは、発行特許と公開特許出願を含む特許文書の集約物を含む。記憶媒体(1140)は、処理装置(1104)と通信する。更に、システムは、画像データを表すための表示装置(1150)と通信するように示された。本明細書で図示され説明される因子はそれぞれ、文書コレクション(1142)に対するクエリ送信を支援する。
コンピュータシステム(1102)に対してローカルに、メモリ(1106)及びプロセッサ(1104)と通信するディレクタ(1160)が提供される。ディレクタ(1160)は、文書コレクション(1142)を集約し索引付けする役割をする。ディレクタ(1160)は、コレクション内の各文書の各セクションを識別するドキュメントマネージャ(1162)と通信する。前述のように、特許文書コレクションの場合、各特許又は公開特許出願は、特定の均一なセクションからなる。しかしながら、全ての特許文書コレクションが、均一な配置を有するとは限らない。したがって、ドキュメントマネージャ(1162)は、コレクション内の文書のセクションを識別し、一実施形態では、識別したセクションを表現する順位を識別するために使用される。ドキュメントマネージャ(1162)と通信するプロファイルマネージャ(1164)が提供される。プロファイルマネージャ(1164)は、文書コレクション(1142)のためのサーチプロファイルを編成する。より具体的には、プロファイルマネージャ(1164)は、クエリに含めるためにドキュメントマネージャ(1162)によって識別されるような文書の1つ又は複数のセクションの選択を容易にし、選択された各セクションに重みを割り当てる。一実施形態では、重みは、選択されたセクション内の一致データの重要性を識別する数値である。従って、プロファイルマネージャ(1164)によって編成されるようなサーチプロファイルは、クエリに関係する文書コレクションのセクションの概略を提供する。
プロファイルマネージャ(1164)と通信するクエリマネージャ(1166)が、やはりコンピュータシステム(1102)に対してローカルで、メモリ(1106)と通信するように提供される。クエリマネージャ(1166)は、文書コレクション(1142)へのクエリの送信により少なくとも1つのサーチプロファイルを選択する役割をする。より具体的には、クエリマネージャ(1166)は、クエリデータを、プロファイル内で識別されかつ重みが割り当てられた文書コレクション(1142)のセクション内のデータと比較する。クエリマネージャ(1166)は、関連性ナビゲータ(1168)と通信し、集約物内の文書を関連性スコアに基づいて順位付けし、集約物内の結果を順位に基づいて動的に限定する働きをする。関連性ナビゲータ(1168)の使用と共にクエリマネージャ(1166)によって行われるような比較により、適用された動的限定に基づいて関連特許文書の集約物が得られる。一実施形態では、集約物は、表示装置(1150)に提示される。同様に、一実施形態では、集約物は、記憶装置に一時的又は永続的に保持されてもよい。クエリ送信者への伝達を容易にするために、クエリマネージャは、ソートマネージャと通信して、文書ソートに基づいてクエリ送信の結果を順位付けする。
一実施形態では、ディレクタ(1160)、ドキュメントマネージャ(1162)、プロファイルマネージャ(1164)及びクエリマネージャ(1166)が、コンピュータシステム(1102)に対してローカルなメモリ(1106)にあってもよい。しかしながら、本発明は、この実施形態に限定されない。例えば、一実施形態では、ディレクタ、ドキュメントマネージャ、プロファイルマネージャ及びクエリマネージャ(1160)〜(1166)がそれぞれ、ローカルメモリ(1106)の外部のハードウェアツールとしてあってもよく、あるいはハードウェアとソフトウェアの組み合わせとして実現されてもよい。同様に、一実施形態では、ディレクタ及びマネージャ(1160)〜(1166)が、記憶媒体(1140)と通信するリモートシステム上にあってもよい。従って、ディレクタとマネージャは、関連特許文書の集約物を得るために、電子特許文書コレクションへの1つ又は複数のクエリの送信を支援するソフトウェアツール又はハードウェアツールとして実現されてもよい。
一実施形態では、本発明は、ファームウェア、常駐ソフトウェア、マイクロコードなどを含むがこれらに限定されないソフトウェアで実現される。本発明は、コンピュータ又は任意の命令実行システムによって使用するか又はそれらと関連して使用するためのプログラムコードを提供するコンピュータ可用又はコンピュータ可読媒体からアクセス可能なコンピュータプログラム製品の形をとることができる。この説明のため、コンピュータ可用又はコンピュータ可読媒体は、命令実行システム、装置又は装置によって使用するか又はそれらと関連して使用するためのプログラムを含むか、記憶するか、通信するか、伝搬するか、搬送することができる任意の装置でよい。
本発明の範囲内の実施形態は、また、符号化されたプログラムコードを有するプログラム記憶手段を含む製造物品を含む。そのようなプログラム記憶手段は、汎用又は専用コンピュータによってアクセスすることができる任意の入手可能な媒体でよい。限定ではなく例として、そのようなプログラム記憶手段には、RAM、ROM、EEPROM、CD−ROM若しくは他の光学ディスク記憶装置、磁気ディスク記憶装置若しくは他の磁気記憶装置、又は所望のプログラムコード手段を記憶するために使用することができかつ汎用又は専用コンピュータによってアクセスすることができる他の媒体を挙げることができる。上記のものの組み合わせも、プログラム記憶手段の範囲に含まれるべきである。
媒体は、電子、磁気、光学、電磁気、赤外線、又は半導体システム(又は、装置若しくは素子)でよい。コンピュータ可読媒体の例には、半導体又は固体記憶装置、磁気テープ、取外し可能なコンピュータディスケット、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、剛性磁気ディスク、及び光ディスクがある。光ディスクの現在の例には、コンパクトディスクB読み出し専用(CD−ROM)、コンパクトディスクB読書き(CD−R/W)及びDVDがある。
プログラムコードを記憶しかつ/又は実行するのに適したデータ処理システムには、システムバスによってメモリ要素に直接又は間接に結合された少なくとも1つのプロセッサがある。メモリ要素には、プログラムコードの実際の実行中に使用されるローカルメモリ、大容量記憶装置、及び実行中に大容量記憶装置からコードを取得しなければならない回数を減らすために少なくとも一部分のプログラムコードの一時的記憶を提供するキャッシュメモリを挙げることができる。
入出力又はI/O装置(キーボード、表示装置、ポインティングデバイスなどを含むがこれに限定されない)は、システムに直接結合されてもよく、介在I/Oコントローラを介して結合されてもよい。システムには、データ処理システムを、介在する専用又は公衆ネットワークを介して他のデータ処理システム又はリモートプリンタ又は記憶装置に結合することを可能にするネットワークアダプタが結合されてもよい。
ソフトウェア実装は、コンピュータ又は任意の命令実行システムにより使用するか又はそれらと関連して使用するためのプログラムコードを提供するコンピュータ可用又はコンピュータ可読媒体からアクセス可能なコンピュータプログラム製品の形を取ってもよい。
[先行技術に対する利点]
各知財文書は、当技術分野では、法令申告義務を満たすために必要なセクションの概要が定義されていることが知られている。文書コレクションへのクエリの送信を容易にするために1つ又は複数のプロファイルが作成される。各プロファイルは、文書内の1つ又は複数の特定のセクションに重みを与える。重みは、識別セクションの重要性を表し、返された集約物内の各文書の価値を高める。全てのクエリが同じとは限らない。例えば、化学技術における知財文書が、必要に応じて、限られた数の図面を有することを理解されたい。したがって、化学技術におけるクエリは、図面を重視せず、記述された文字をより重視することがある。様々な結果を得るために様々なクエリがコレクションに送信される。従って、識別セクションの異なる選択をそれぞれ使用し、また様々な選択セクションに様々な重みをそれぞれ与える複数のプロファイルを作成することによって、クエリ送信を効率的かつ効果的に処理して、文書結果の焦点の合った集約物を得ることができる。
プロファイルが作成され、クエリ送信のために少なくとも1つのプロファイルが選択された後、次のステップは、選択されたプロファイルを並列にするようにクエリ結果の表現に対処する。一実施形態では、クエリは、ソートされ層の階層分類に位置付けられた文書の集約物を作成する。これにより、クエリ結果の提示により関連性を直接示すことができる。別の実施形態では、クエリ結果は、更に、プロファイル内の選択されたセクションに基づいて伝達されてもよく、第2組のクエリ結果は、プロファイルに表された個別のセクション及びそれぞれのセクション内の文書のソートに基づいて提示される。従って、プロファイル選択は、クエリ結果を生成し、クエリ結果を関連性に基づいて、選択されたプロファイルを並列にするように提示するために使用される。
[代替実施形態]
本発明の特定の実施形態は、本明細書で例示のために述べられたが、本発明の精神及び範囲から逸脱することなく様々な修正を行うことができることを理解されよう。詳細には、特許、商標及び著作権を含む様々な形態の知財文書がある。特許文書の分類には、発行特許、公開特許出願、特許要約及び実用新案登録を含む文書の更なる細分類がある。そのような文書のいくつかは、同じ量のセクションを同じ順序で含むことがあり、他の文書は、様々な量のセクション及び/又は様々な順序を有する。プロファイルは、存在するセクションに基づいて独立に作成され、必ずしも基となる文書に現われる順序でなくてもよい。
更に、電子文書コレクションは、特に、発行特許と公開特許出願、商標登録及び出願、並びに著作権登録及び出願を含む知財文書に関して具体的に記述された。しかしながら、本発明は、これらの特定のカテゴリの電子文書に限定されるべきでない。一実施形態では、電子文書コレクションは、定義された複数のセクションを有する任意のタイプの文書を含んでもよい。これにより、マネージャは、定義されたセクション内に文書を解析し、1つ又は複数の定義されたセクションのために関連重みを有する複数のプロファイルを作成し、特定のプロファイルを有する文書コレクションにクエリを送信することができる。前述のように、クエリプロファイルの選択は、動的に修正されてもよい。一実施形態では、クエリ内容を維持しながらクエリプロファイルを修正することにより、集約物内の返された文書を変更し、また集約物内の文書が提示される関連性の順序を変更することができる。従って、本発明の保護の範囲は、以下の特許請求の範囲とその等価物によってのみ限定される。

Claims (35)

  1. 電子文書コレクションのサーチの結果に関連性を割り当てるための、コンピュータにより実施される方法であって、
    知財文書のコレクションを集約し索引付けするステップであって、前記コレクション内の前記文書のそれぞれが複数のセクションを有するステップと、
    前記コレクション内の各文書の前記セクションのそれぞれを識別するステップと、
    前記文書コレクションのためのサーチプロファイルを編成するステップであって、前記サーチプロファイルが、前記集約されたコレクション内の各文書の前記識別されたセクションのうちの少なくとも1つのセクションの選択を含むステップと、
    前記編成されたサーチプロファイル内で、前記識別され選択されたセクションのそれぞれに重みを割り当てるステップと、
    クエリ時に、前記特許文書コレクションにクエリを送信するステップであって、少なくとも1つのサーチプロファイルを選択するステップと、割り当てられた重みを有する前記コレクション内の前記選択されたプロファイルの各前記文書セクション内のデータとクエリデータを比較するステップと、を含むステップと、
    前記クエリ送信から生成された文書の集約物内に返された各文書のための関連性スコアを計算するステップと、
    前記計算された関連性スコアに基づいて前記集約物内の前記文書を順位付けするステップと、
    前記順位付けに基づいて前記集約物内の結果を動的に限定するステップと、
    前記集約物に適用された前記動的な限定に基づいて前記集約物中の関連文書をソートするステップと、
    各プロファイルの選択セクション内の一致文字列の量に基づいて前記識別されたセクションの各々に割り当てられた前記重みに加えるか前記重みから減じるために、二次重みを適用するステップと、
    を有する方法。
  2. 前記集約物の前記ソートに基づいて前記集約物の文書を階層に分割するステップを更に有する請求項1に記載の方法。
  3. 要求された階層の選択に基づいてクエリ結果の表現を限定するステップを更に有する請求項2に記載の方法。
  4. 隣接層を前記順位付けに存在する変曲点で分割するステップを更に有する請求項2に記載の方法。
  5. 前記第1の文書集約物に二次順位因子を適用し、前記ソートされた集約物を前記二次因子に基づいて順位付けするステップを更に有する請求項1に記載の方法。
  6. 前記二次因子が、出願日、公開日、外国優先日、名称のアルファベット順リスト、譲受人、及びこれらの組み合わせから成るグループから選択される請求項5に記載の方法。
  7. 記集約物の部分集合として第2の文書集約物を更に含み、前記サーチプロファイルとは別の二次プロファイルに基づいて、前記部分集合の第2の関連性スコアを計算するステップを有する請求項1に記載の方法。
  8. 文書の各部分集合を別々にソートするステップを更に有する請求項7に記載の方法。
  9. 前記ソートされた部分集合に関連性限定を動的に割り当てて、前記割り当てられた関連性限定に基づいてクエリ結果の返しを限定するステップを更に有する請求項8に記載の方法。
  10. 前記計算された関連性スコアと、前記集約物を構成する文書の量とに基づいて、前記集約物の図形表現を作成するステップを更に有する請求項1に記載の方法。
  11. 前記図形表現上に、前記集約物を含む区分線を表すためのスライダを更に有し、前記線の一方の側で参照される全ての文書を含め、前記線の他方の側で参照される全ての文書を除外するステップを更に有する請求項10に記載の方法。
  12. 前記第1の集約物に曲線当てはめルーチンを適用するステップを更に有し、前記ルーチンが、前記第1の集約物のデータに対して論理関数を計算し、前記関数の少なくとも1つの導関数を計算する請求項1に記載の方法。
  13. 前記集約物内の結果を動的に限定するステップが、前記関数の導関数を選択し、前記関数から前記選択された導関数内に入ったデータを返すステップを含む請求項12に記載の方法。
  14. メモリ及び記憶媒体と通信するプロセッサと、
    前記記憶媒体上に保持された知財文書のコレクションであって、前記コレクション内の前記文書のそれぞれが複数のセクションを有するコレクションと、
    前記プロセッサと通信し、前記文書のコレクションを集約し索引付けするディレクタと、
    前記ディレクタと通信し、前記コレクション内の各文書の各セクションを識別するドキュメントマネージャと、
    前記ドキュメントマネージャと通信し、前記文書コレクションのためのサーチプロファイルを編成するプロファイルマネージャであって、前記サーチプロファイルが、前記集約されたコレクション内の各文書の前記識別されたセクションの少なくとも1つのセクションの選択を含むプロファイルマネージャと、
    前記編成されたサーチプロファイルを有する前記識別され選択されたセクションのそれぞれに重みを割り当てる前記プロファイルマネージャと、
    クエリ時に、前記文書コレクションにクエリを送信するクエリマネージャであって、前記クエリが、少なくとも1つのサーチプロファイルの選択と、割り当てられた重みを有する前記コレクション内の前記選択されたプロファイルの各前記文書セクション内のデータとクエリデータの比較とを含み、前記クエリによって、前記クエリ送信から生成され前記クエリマネージャから返された関連文書の集約物が得られ、各文書が、割り当てられた重みと関連性スコアとを有する少なくとも1つの識別されたプロファイルセクション内のデータとの前記クエリの一致を有するクエリマネージャと、
    前記クエリマネージャと通信し、前記関連性スコアに基づいて前記集約物内の前記文書を順位付けし、前記順位に基づいて前記集約物内の結果を動的に限定する関連性ナビゲータと、
    前記集約物に適用される前記動的な限定に基づいて前記集約物中の関連文書をソートする前記関連性ナビゲータと、
    各プロファイルの選択セクション内の一致文字列の量に基づいて前記識別されたセクションの各々に割り当てられた前記重みに加えるか前記重みから減じるために、二次重みを適用する前記プロファイルマネージャと、
    を備えたシステム。
  15. 前記第1の文書集約物に適用される二次順位因子であって、前記二次因子に基づいて前記ソートされた第1の集約物を順位付けする前記二次順位因子を更に備えた請求項14に記載のシステム。
  16. 前記二次因子が、出願日、公開日、外国優先日、名称のアルファベット順リスト、譲受人、及びこれらの組み合わせから成るグループから選択される請求項15に記載のシステム。
  17. 記集約物の部分集合として集約された第2の文書集約物と、前記サーチプロファイルとは別の二次プロファイルに基づく前記部分集合のための第2の関連性スコアと、を更に備えた請求項16に記載のシステム。
  18. 前記関連性ナビゲータと通信し、前記第2の関連性スコアに基づいて各集約物をソートするソートマネージャを更に備えた請求項17に記載のシステム。
  19. 前記集約物の前記ソートに基づいて前記第1の文書集約物を階層に分割し、階層の選択に基づいてクエリ結果の表現を限定する請求項14に記載のシステム。
  20. 前記関連性ナビゲータは、前記順位内にある変曲点で隣接層を分割する請求項19に記載のシステム。
  21. 前記計算された関連性スコアと、前記集約物を構成する文書の量とに基づく、前記集約物の図形表現を更に備えた請求項14に記載のシステム。
  22. 前記図形表現と通信するように構成されたツールを備え、前記ツールが、集約結果の区分の線を、前記線の第1の側で参照される全ての文書を含め、前記線の第2の側で参照される全ての文書を除外するよう動的に設定する請求項21に記載のシステム。
  23. 前記プロセッサ上で前記第1の集約物に曲線当てはめルーチンを実行する命令を更に備え、前記ルーチンが、前記第1の集約物のデータに対して論理関数を計算し、前記関数の少なくとも1つの導関数を計算する請求項14に記載のシステム。
  24. 前記関連性ナビゲータは、前記関数の選択された導関数内の第1の集約物内の結果を限定し、前記選択された関数導関数内に入ったデータを返す請求項23に記載のシステム。
  25. コンピュータメモリ上の電子特許文書コレクションのサーチの結果に関連性を割り当てるようコンピュータで実行されるコンピュータプログラムを記録したコンピュータ可読媒体であって、
    前記コンピュータプログラムが、コンピュータに関連性の割り当てを実行させるコンピュータプログラム命令を含
    前記コンピュータプログラム命令は、
    知財文書のコレクションを集約し索引付けする命令であって、前記コレクション内の前記文書のそれぞれが複数のセクションを有する命令と、
    前記コレクション内の各文書の前記セクションのそれぞれを識別する命令と、
    前記文書コレクションのためのサーチプロファイルを編成する命令であって、前記サーチプロファイルが、前記集約されたコレクション内の各文書の前記識別されたセクションのうちの少なくとも1つのセクションの選択を含む命令と、
    前記編成されたサーチプロファイル内で、前記識別され選択されたセクションのそれぞれに重みを割り当てる命令と、
    クエリ時に、前記特許文書コレクションにクエリを送信する命令であって、少なくとも1つのサーチプロファイルを選択することと、割り当てられた重みを有する前記コレクション内の前記選択されたプロファイルの各前記文書セクション内のデータとクエリデータを比較することと、を含む命令と、
    前記クエリ送信から生成された文書の集約物内に返された各文書のための関連性スコアを計算し、前記計算された関連性スコアに基づいて前記集約物内の前記文書を順位付けする命令と、
    前記順位付けに基づいて前記集約物内の結果を動的に限定する命令と、
    前記集約物に適用された前記動的な限定に基づいて前記集約物中の関連文書をソートする命令と、
    各プロファイルの選択セクション内の一致文字列の量に基づいて前記識別されたセクションの各々に割り当てられた前記重みに加えるか前記重みから減じるために、二次重みを適用する命令と、
    を含むコンピュータ可読媒体
  26. 前記第1の文書集約物に二次順位因子を適用し、前記二次因子に基づいて前記ソートされた第1の集約物を順位付けする命令を更に含む請求項25に記載のコンピュータ可読媒体
  27. 前記二次因子が、出願日、公開日、外国優先日、名称のアルファベット順リスト、譲受人、及びこれらの組み合わせから成るグループから選択される請求項26に記載のコンピュータ可読媒体
  28. 前記サーチプロファイルとは別の二次プロファイルに基づいて、前記集約物の部分集合として第2の文書集約物を集約する命令を更に含む請求項25に記載のコンピュータ可読媒体
  29. 前記部分集合のための第2の関連性スコアを計算するコンピュータへの命令を更に含む請求項28に記載のコンピュータ可読媒体
  30. 前記第2の関連性スコアに基づいて前記第2の文書集約物をソートする命令を更に含む請求項28に記載のコンピュータ可読媒体
  31. 前記集約物の前記ソートに基づいて前記文書集約物を階層に分割し、階層の選択に基づいて前記クエリ結果の表現を限定する命令を更に含む請求項25に記載のコンピュータ可読媒体
  32. 隣接層を前記順位付けに存在する変曲点で分割する命令を更に含む請求項25に記載のコンピュータ可読媒体
  33. 前記計算された関連性スコアと、前記集約物を構成する文書の量とに基づいて、前記集約物の図形表現と、前記図形表現と通信する命令と、を更に含み、
    前記命令が、集約結果の区分の線を、前記線の第1の側で参照される全ての文書を含め、前記線の第2の側で参照される全ての文書を除外するよう動的に設定する請求項25に記載のコンピュータ可読媒体
  34. 前記第1の集約物に曲線当てはめルーチンを実行する命令を更に含み、前記ルーチンが、前記第1の集約物のデータに対して論理関数を計算し、前記関数の少なくとも1つの導関数を計算する請求項25に記載のコンピュータ可読媒体
  35. 前記関数の選択された導関数内で前記第1の集約物内の結果を限定し、前記選択された関数導関数内に入ったデータを返す命令を更に含む請求項34に記載のコンピュータ可読媒体
JP2012521605A 2009-07-22 2009-07-22 電子文書コレクションからクエリ結果を送付する方法、システム及び装置 Active JP5534266B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2009/051432 WO2011011002A1 (en) 2009-07-22 2009-07-22 Method, system, and apparatus for delivering query results from an electronic document collection

Publications (2)

Publication Number Publication Date
JP2012533817A JP2012533817A (ja) 2012-12-27
JP5534266B2 true JP5534266B2 (ja) 2014-06-25

Family

ID=43499303

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012521605A Active JP5534266B2 (ja) 2009-07-22 2009-07-22 電子文書コレクションからクエリ結果を送付する方法、システム及び装置

Country Status (7)

Country Link
EP (1) EP2457182A4 (ja)
JP (1) JP5534266B2 (ja)
KR (1) KR101481680B1 (ja)
CN (1) CN102483749B (ja)
AU (1) AU2009350126A1 (ja)
CA (1) CA2768901A1 (ja)
WO (1) WO2011011002A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10977693B2 (en) 2008-11-26 2021-04-13 Free Stream Media Corp. Association of content identifier of audio-visual data with additional data through capture infrastructure
US10419541B2 (en) 2008-11-26 2019-09-17 Free Stream Media Corp. Remotely control devices over a network without authentication or registration
US9519772B2 (en) 2008-11-26 2016-12-13 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US9986279B2 (en) 2008-11-26 2018-05-29 Free Stream Media Corp. Discovery, access control, and communication with networked services
US9961388B2 (en) 2008-11-26 2018-05-01 David Harrison Exposure of public internet protocol addresses in an advertising exchange server to improve relevancy of advertisements
US9026668B2 (en) 2012-05-26 2015-05-05 Free Stream Media Corp. Real-time and retargeted advertising on multiple screens of a user watching television
US10880340B2 (en) 2008-11-26 2020-12-29 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US10567823B2 (en) 2008-11-26 2020-02-18 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US9154942B2 (en) 2008-11-26 2015-10-06 Free Stream Media Corp. Zero configuration communication between a browser and a networked media device
US8180891B1 (en) 2008-11-26 2012-05-15 Free Stream Media Corp. Discovery, access control, and communication with networked services from within a security sandbox
US10334324B2 (en) 2008-11-26 2019-06-25 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US10631068B2 (en) 2008-11-26 2020-04-21 Free Stream Media Corp. Content exposure attribution based on renderings of related content across multiple devices
US9386356B2 (en) 2008-11-26 2016-07-05 Free Stream Media Corp. Targeting with television audience data across multiple screens
US9223769B2 (en) 2011-09-21 2015-12-29 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
JP5526209B2 (ja) * 2012-10-09 2014-06-18 株式会社Ubic フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11250070A (ja) * 1998-03-05 1999-09-17 Toshiba Corp 類似文書検索装置、類似文書検索方法、および類似文書検索のためのプログラムが記録された記録媒体
JP2001325273A (ja) * 2000-05-15 2001-11-22 Ricoh Co Ltd 重要文抽出装置およびその方法ならびに記憶媒体
US7376635B1 (en) * 2000-07-21 2008-05-20 Ford Global Technologies, Llc Theme-based system and method for classifying documents
US6694331B2 (en) * 2001-03-21 2004-02-17 Knowledge Management Objects, Llc Apparatus for and method of searching and organizing intellectual property information utilizing a classification system
JP3717808B2 (ja) * 2001-06-29 2005-11-16 株式会社日立製作所 情報検索システム
US20040230568A1 (en) * 2002-10-28 2004-11-18 Budzyn Ludomir A. Method of searching information and intellectual property
US8600963B2 (en) * 2003-08-14 2013-12-03 Google Inc. System and method for presenting multiple sets of search results for a single query
US7346839B2 (en) * 2003-09-30 2008-03-18 Google Inc. Information retrieval based on historical data
US20080015968A1 (en) * 2005-10-14 2008-01-17 Leviathan Entertainment, Llc Fee-Based Priority Queuing for Insurance Claim Processing
US20090138466A1 (en) * 2007-08-17 2009-05-28 Accupatent, Inc. System and Method for Search
JP5146108B2 (ja) * 2008-05-27 2013-02-20 日本電気株式会社 文書重要度算出システム、文書重要度算出方法およびプログラム
CN102483744A (zh) * 2009-05-07 2012-05-30 Cpa软件有限公司 检索电子文献集合的方法、系统及装置

Also Published As

Publication number Publication date
CN102483749B (zh) 2015-06-17
JP2012533817A (ja) 2012-12-27
KR20120085731A (ko) 2012-08-01
CA2768901A1 (en) 2011-01-27
WO2011011002A1 (en) 2011-01-27
KR101481680B1 (ko) 2015-01-12
AU2009350126A1 (en) 2012-02-23
EP2457182A4 (en) 2014-01-15
EP2457182A1 (en) 2012-05-30
CN102483749A (zh) 2012-05-30

Similar Documents

Publication Publication Date Title
JP5534266B2 (ja) 電子文書コレクションからクエリ結果を送付する方法、システム及び装置
US8364679B2 (en) Method, system, and apparatus for delivering query results from an electronic document collection
JP4378646B2 (ja) 情報処理装置、情報処理方法、およびプログラム
KR100756921B1 (ko) 문서 분류방법 및 그 문서 분류방법을 컴퓨터에서 실행시키기 위한 프로그램을 포함하는 컴퓨터로 읽을 수있는 기록매체.
US20090307184A1 (en) Hyperspace Index
US20100287148A1 (en) Method, System, and Apparatus for Targeted Searching of Multi-Sectional Documents within an Electronic Document Collection
CN111506727B (zh) 文本内容类别获取方法、装置、计算机设备和存储介质
US20100042610A1 (en) Rank documents based on popularity of key metadata
US20100287177A1 (en) Method, System, and Apparatus for Searching an Electronic Document Collection
US8577865B2 (en) Document searching system
Lu et al. How do author-selected keywords function semantically in scientific manuscripts?
EP2427830B1 (en) Method, system, and apparatus for searching an electronic document collection
JP5516916B2 (ja) 電子ドキュメントコレクション内の複数選択ドキュメントを標的調査する方法、システムおよび装置
CN103186650B (zh) 一种搜索方法和装置
JP2007164633A (ja) コンテンツ検索方法及び装置及びプログラム
Gonçalves et al. Ranking MEDLINE documents
Irshad et al. SwCS: Section-Wise Content Similarity Approach to Exploit Scientific Big Data.
JP2004206571A (ja) 文書情報提示方法及び装置並びにプログラム及び記録媒体
CN109213830A (zh) 专业性技术文档的文档检索系统
KR100932046B1 (ko) 도서 검색 방법 및 도서 검색 시스템
EP1643379B1 (en) Document searching system
Araghi Users satisfaction through better indexing
Chen et al. Classifying Digital Resources in a Practical and Coherent Way with Easy-to-Get Features

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131224

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20140210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140401

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140415

R150 Certificate of patent or registration of utility model

Ref document number: 5534266

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250