JP4814238B2 - 法律上の要点をサーチするシステム及び方法 - Google Patents

法律上の要点をサーチするシステム及び方法 Download PDF

Info

Publication number
JP4814238B2
JP4814238B2 JP2007529964A JP2007529964A JP4814238B2 JP 4814238 B2 JP4814238 B2 JP 4814238B2 JP 2007529964 A JP2007529964 A JP 2007529964A JP 2007529964 A JP2007529964 A JP 2007529964A JP 4814238 B2 JP4814238 B2 JP 4814238B2
Authority
JP
Japan
Prior art keywords
search
text
document
identified
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007529964A
Other languages
English (en)
Other versions
JP2008511075A5 (ja
JP2008511075A (ja
Inventor
ディヴィッド ミラー
ハリー シルヴァー
アンドリュー フライスラー
Original Assignee
レクシスネクシス ア ディヴィジョン オブ リード エルザヴィア インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by レクシスネクシス ア ディヴィジョン オブ リード エルザヴィア インコーポレイテッド filed Critical レクシスネクシス ア ディヴィジョン オブ リード エルザヴィア インコーポレイテッド
Publication of JP2008511075A publication Critical patent/JP2008511075A/ja
Publication of JP2008511075A5 publication Critical patent/JP2008511075A5/ja
Application granted granted Critical
Publication of JP4814238B2 publication Critical patent/JP4814238B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、対話式法律データベース、特に、対話式オンライン法律データベースを使用した法律上の要点をサーチするシステム及び方法に係る。より詳細には、本発明は、検索されたドキュメントにおける法律上の要点位置を正確に示すサーチ結果を与える、法律上の要点をサーチするシステム及び方法に係る。
関連出願の相互参照:本特許出願は、引用としてここにその全体を組み入れる2004年8月23日に出願された米国仮特許出願第60/603,277号に基づくもので、その優先権を主張する。
「頭書(headnote:判決要旨)」という語は、ここでは、判例法ドキュメントの主文において編集者により特定された法律上の要点を指し、法律上の要点は、判例の最上部に再現され、調査者が何についての判例か容易に決定できるようにする。
対話式データベース、特に、対話式オンライン法律データベースは、通常、「選択テキストにより類似する(more like select text)」という特徴を有する。この特徴は、ユーザ調査に関連しながら、ユーザにより特定された判例においてユーザが選択したテキストに基づく付加的な判例を、ユーザがサーチできるようにするものである。ユーザは、サーチ要求に頭書のテキストを使用することにより同様のサーチ結果を得ることができる。しかしながら、従来のやり方による「選択テキストにより類似する」サーチ又は頭書サーチは、回答セットにあるドキュメント内で法律上の考察に適用し得る要点にユーザを向けさせることが殆どないか又は全くない。
本発明は、これら及び他の問題の解決に向けられる。
従って、本発明の主たる目的は、判例に含まれた編集上のコンテンツを利用して、法律上の同じ要点を考察している他の判例を特定することができる対話式データベースサーチの特徴を提供することである。
従って、本発明の別の目的は、法律上の同じ要点を考察する1組の判例内において、法律上の考察に適用し得る要点にユーザを向けさせることのできる対話式データベースサーチの特徴を提供することである。
本発明の更に別の目的は、ユーザが、不当な困難さ、無関係なナビゲーション、又は特殊なサーチ熟練度を伴わずに、関連する頭書を迅速に検索する手段をもつことができるような、オンラインの頭書を理にかなって(intelligently)関連付けることのできる対話式データベースサーチ特徴を提供することである。
本発明のこれら及び他の目的は、オンラインの頭書を理にかなって関連付ける“More Like This Headnote(この頭書により類似したもの)”をサーチすることにより達成され、その結果、ユーザは関連する頭書を迅速且つ容易に検索するための手段を有することができる。これは、頭書のテキストをサーチストリングとして取り扱うように設計されたサーチエンジンに合ったサーチ形式を使用することにより達成される。次いで、検索ロジックが、ユーザ選択オプションにより分類された関連の頭書及び判例資料を含む「バーチャルダイジェスト」ビューにおいてサーチ結果をユーザに提示する。
本発明の他の目的、特徴及び効果は、当業者であれば、添付図面を含む本明細書を読むことで明らかとなろう。
本発明は、添付図面を参照した好ましい実施形態の以下の詳細な説明から良く理解されよう。
添付図面に示された本発明の好ましい実施形態の説明において、明瞭化のために、特定の用語を使用する。しかしながら、本発明は、このように選択された特定の用語に限定されず、各特定の要素は、同様の目的を達成するために同様に動作する全ての技術的均等物を包含することを理解されたい。
本発明は、本発明の実施形態に基づく方法、装置(システム)及びコンピュータプログラム製品のフローチャートを参照して以下に説明する。フローチャートの各ブロック、及びフローチャートのブロックの組み合せは、コンピュータプログラム命令により実施できることを理解されたい。これらのコンピュータプログラム命令は、汎用コンピュータ、特殊目的コンピュータ、又は他のプログラム可能なデータ処理装置のプロセッサに供給されて、マシンを形成し、コンピュータ又は他のプログラム可能なデータ処理装置のプロセッサを経て実行される命令は、フローチャートのブロック(1つ又は複数)に指定されたファンクションを実施する手段を形成する。
また、これらのコンピュータプログラム命令は、コンピュータ読み取り可能なメモリに記憶されて、特定の仕方で機能するようコンピュータ又は他のプログラム可能なデータ処理装置に指令でき、コンピュータ読み取り可能なメモリに記憶されたこれら命令は、フローチャートの(1つ又は複数の)ブロックに指定されたファンクションを実施するインストラクション手段を含む製造物品を形成する。
また、コンピュータプログラム命令は、コンピュータ又は他のプログラム可能なデータ処理装置にロードされて、このコンピュータ又は他のプログラム可能な装置において一連の動作ステップを実行させて、コンピュータ実施プロセスを形成し、コンピュータ又は他のプログラム可能な装置で実行される命令が、フローチャートの(1つ又は複数の)ブロックに指定されたファンクションを実施するステップを与えるようにする。
本発明は、クライアント/サーバープログラミング環境内で実施されるのが好ましい。当業者に良く知られるように、クライアント/サーバーとは、2つのコンピュータプログラム間の関係に対するモデルであって、あるプログラム、即ちクライアントが、要求を満足する別のプログラム、即ちサーバーからのサービス要求を行うようなモデルである。クライアント/サーバーモデルは、単一コンピュータ内のプログラムにより使用できるが、より一般的には、計算ファンクション及びデータを異なるネットワーク位置で多数のクライアント及びサーバープログラム間により効率的に配布できるようなネットワークに使用される。
当業者に良く知られるように、クライアント/サーバー環境は、インターネットのようなパブリックネットワークと、「イントラネット」及び「エクストラネット」としばしば称されるプライベートネットワークとを含んでもよい。「インターネット」という語は、「イントラネット」及び「エクストラネット」という語を包含するもので、インターネットにアクセスするとは、イントラネット及び/又はエクストラネットにもアクセスすることを意味すると理解されたい。「コンピュータネットワーク」という語は、公然とアクセスできるコンピュータネットワーク及びプライベートコンピュータネットワークを包含するものとする。
ここでは、次の定義を使用する。
ダイジェストビュー又はダイジェストフォーマット:単一回答セットにおいて一致する頭書及び最良の段落表示フォーマットを表わすビュー。
最良の段落又は最良のテキスト:判例テキストの一部分が表示されるフォーマット。表示される語は、判例における最も関連性のある考察の1つからであるのが好ましく、そしてテキストのかたまり全体が、ほぼ段落のサイズとなる。判例に関する付加的な情報、例えば、名前及び引用も含まれる。
XSLT:著者及びユーザがフォーマット化の目的でXMLドキュメントを変換できるようにするスタイルシート言語である。
サブストリングファンクション:XSLTにおけるサブストリング(SUBSTRING)ファンクションは、ソースストリングのストリング長さキャラクタを含むキャラクタ又は2進ストリングを、スタート位置で指定されたキャラクタにおいてスタートして、それらがソースストリングに現われるのと同じシーケンスで返送する。これらの位置のいずれかが、ソースストリングのスタート前か又は終了後である場合には、その位置に対してキャラクタが返送されない。全ての位置がソースストリングの外側である場合には、空きストリングが返送される。
本発明による法律上の要点をサーチするシステム及び方法は、頭書(「ソース」頭書)の言語を取り上げ、そしてそのソース頭書の言語及び/又は意味に厳密に一致する頭書を有する判例を見出す能力と、頭書の形態で表わされないがオリジナルソース頭書に含まれた言語に一致する言語を有する他の判例において「最良の段落」又は「最良のテキスト」を見出す能力とを有する“More Like This Headnote(この頭書により類似したもの)”のサーチを提供する。
頭書を生成しそして“More Like This Headnote”サーチを実行するプロセスは、特定のデータベースサーチに限定されないが、ここに述べる実施形態における例示的目的のために、本発明は、LexisTMリサーチシステムの対話式、オンライン、法律データベースを通して利用できるサービスとして提供される。しかしながら、当業者であれば、本発明は、対話式法律データベースに限定されるものではなく、顕著なアイデアが頭書に表わされたドキュメントを対話式データベースが含む限り、LexisTMリサーチシステム以外のサービスを使用して、他の対象エリアにおける対話式データベースに関連して実施できることが明らかであろう。
“More Like This Headnote”サーチでは、頭書を対話式法律データベースサーチエンジンにより使用して、法律上のその要点に関連した1組の回答(又は「回答セット」)を識別することができる。“More Like This Headnote”サーチは、ユーザが、不当な困難さ、無関係なナビゲーション、又は特殊なサーチ熟練度を伴わずに、関連する頭書を迅速に検索する手段をもつように、オンライン頭書を理にかなって関連付けるものである。これは、頭書のテキストをサーチストリングとして取り扱うように設計されたサーチエンジンに合ったサーチ形式を使用することにより達成される。次いで、検索ロジックが、ユーザ選択オプションにより分類された関連頭書及び判例資料を含む「バーチャルダイジェスト」ビューにおいてサーチ結果をユーザに提示する。“More Like This Headnote”サーチは、判例に含まれた頭書から「バーチャルダイジェスト」へのシングルクリックによるアクセスを受け入れるのが好ましい。従って、“More Like This Headnote”サーチは、判例に含まれた編集上のコンテンツを利用し、法律上の同じ要点を考察する他の判例をユーザが特定できるようにする。
図5−9を参照すれば、法律上の要点をサーチするシステム及び方法に含まれたステップを例示する高レベルフローチャートが示されている。
図5は、本発明による法律上の要点をサーチするシステム及び方法100を概略的に示す高レベルフローチャートである。図5のブロック102−112は、次のステップを表わす。
102:このプロセスは、完全(FULL)フォーマットの判例法ドキュメントを要求するときに始まる。この要求は、キーワードサーチ、引用Get、又は別のドキュメント内からの引用リンクの選択の結果である。
104:LexisTMリサーチシステムは、ドキュメント検索要求を処理し、そして要求された判例法ドキュメント内の頭書に対する特殊な“More Like This Headnote(MLTH)”リンクを挿入する。
106:LexisTMリサーチシステムは、そのドキュメントをユーザに表示し、そしてユーザは、ユーザに関心のある法律上の要点を表わす頭書に対するMLTHリンクを選択する。
108:LexisTMリサーチシステムは、MLTHサーチを実行して、法律上の同じ要点をもつドキュメントを探索する。ドキュメントは、オリジナルな頭書における法律上の要点に対する統計学的な類似性に基づいて関連性がランク付けされる。
110:LexisTMリサーチシステムは、最も高いランク付けのドキュメントを検索し、そしてそのドキュメントに見られる法律上の類似要点をハイライト状態にするダイジェストフォーマットでユーザにそれらを表示する。法律上の類似要点は、1つから多数の頭書でもよいし、或いは法律上の要点を考察する「最良の段落」でもよい。
112:ダイジェストフォーマットのドキュメントがユーザに表示される。
図6は、図5のブロック104に対応する“More Like This Headnote”サーチの出発ポイントとなるドキュメントに対する検索プロセス200の高レベルフローチャートである。図6のブロック202−218は、次のステップを表わす。
202:Lexisサーチ及び検索(LSR)エンジンにより完全フォーマットの検索要求が受け取られる。この要求は、ドキュメントフォーマット化の役割を果たすLSRエンジン内のコンポーネントである共通検索エンジン(CRE)へルーティングされる。
204:CREは、要求されたドキュメントをそのデータベースから検索する。
206:CREは、ドキュメントの割り当てられたソース識別子に基づいてソースコントロールドキュメント(SCD)と称される検索プロセスプランを探索し、検索する。このプロセスプランは、ドキュメントをフォーマットするのに必要なステップを含む。
208:ドキュメントのデータベース割り当てに基づいてデータベース定義(DBD)がアクセスされる。この定義は、表示のためのヘッダテキストと共に完全フォーマットに対して表示されるべきドキュメント内のエレメントのリストを含む。
210:DBDからの情報を使用して、ドキュメントをそのネィティブ(native)なXML形態から完全表示形態へ変換できるXSLTスタイルシートを構成する。
212:XSLTエンジンが実行されて、ドキュメントルールに基づいてドキュメントを変換する。
214:スタイルシートの集合体から特定用途向けXSLTスタイルシートがアクセスされる。このスタイルシートは、要求側の用途に特有のルールを含む。
216:XSLTエンジンは、変換を実行する。この変換の一部分は、頭書が“See”のテキストシーケンスで始まらない限り、ドキュメント内の各頭書に対するMLTHリンクを構成する。このようなシーケンスは、単一の法令参照に対して使用され、そして頭書は、法律上の要点を適切に記載するに充分な情報を含んでいない。
218:フォーマットされたドキュメントが、ユーザのウェブブラウザに表示するために準備される。
図7は、図5のブロック108に対応する“More Like This Headnote”サーチプロセス300の高レベルフローチャートである。図7のブロック302−316は、次のステップを表わす。
302:LexisNexis頭書に続いて“More Like This Headnote(MLTH)”リンクが見つかる。これらのリンクは、判例の頭書を示すドキュメントビューにおいて与えられる。
304:MLTHリンクをクリックした後に、ユーザには、彼等が適用したい日付制約と共にサーチに対する管轄を選択可能にするサーチ形態が与えられる。管轄の選択の一例は、「1900年1月1日から」という例示的日付制約を伴う「合同連邦裁判所(Combined Federal Courts)」である。
306:MLTHサーチ形態におけるサーチボタンをクリックすると、管轄及び日付情報を頭書テキストと一緒に束ね、そしてMLTHサーチとしてサーチ前処理レイヤへ送信させる。
308:句の確認は、参考としてここに組み入れる米国特許第5,771,378号及び第5,819,260号に説明された句識別プロセスを使用して自由形態の頭書テキストにおいて行なわれる。
310:MLTHサーチがシソーラスの適用を要求した場合には、それが処理される。本発明による法律上の要点をサーチするシステム及び方法の実施に基づいて、シソーラスを含ませることは、ユーザのオプションであってもよいし、そうでなくてもよい。ユーザのオプションでない場合には、束ねられたサーチ要求が、法律シソーラスの要望を自動的に指示する。
312:指定のシソーラスにおいて見つかった同意語がサーチ要求に追加される。各サーチ用語(単一の語又は句)がシソーラス内のエントリーに対してチェックされる。エントリーが見つかった場合には、その用語に対する同意語がサーチ要求に追加される。このシソーラスは、管轄と管轄との間のコンセプトを正規化するための用語を含む(例えば、“driving while intoxicated(酩酊状態の運転)”は、“driving under the influence(飲酒運転)”の同意語である。
314:頭書テキストで識別されるキーワードの数が設定スレッシュホールドより大きい場合には、用語を除去するためのプロセスに要求が送信される。
316:サーチ要求から用語を除去するためのルールが適用される。この除去のためのファクタは、サーチ要求における用語の頻度、語が句の一部分であるかどうか、及び用語の正規化された長さを含む。頻度が低いほど、用語が除去される可能性が高い。長さが短いほど、用語が除去される可能性が高い。
318:法令参照が識別され、成句される。法令参照は、サーチ要求内のあるトークンを探索し、次いで、これらトークンのパターンを識別することにより、識別される。トークンは、デジット、セクション記号、サブセクション記号、及び法令記録の上で共通の省略形のみで構成された用語を含む。これらトークンのシーケンスが句としてマークされ、シーケンスが単一サーチ用語としてサーチされる。
320:サーチされるべきデータは、どの管轄が選択されたかに基づいて種々の異なるシステムにわたり分散される。サーチ要求は分割されて、種々のサーチユニットに送信される。例えば、「合同連邦裁判所」は、158の独立したデータベースより成り、これらは、12個の異なるコンピュータにわたって分散される。各コンピュータは、Lexisサーチ及び検索(LSR)エンジンの1から10のコピーに対するホストである。サーチ前処理コンポーネントは、サーチ要求を、これらLSRコピーにより処理されるべき必要なコンピュータ位置へルーティングする。
322:Lexisフリースタイルサーチエンジンは、参考としてここに組み入れる米国特許第5,692,176号に説明されたサーチプロセスを使用して当該ドキュメントを識別する。
324:判例法ドキュメントは、データベースに含まれ、各データベースは、ドキュメントの集合体と、これらドキュメントを効率的にサーチするのに必要なインデックス情報とを収容する。
326:見つかった全てのドキュメントに対する参照情報(データベース位置、ドキュメント番号、及び関連性スコア)が単一の回答セットに束ねられる。この時点で、ドキュメントは検索プロセスを開始する準備ができることになる。
図8は、図5のブロック110に対応するダイジェスト検索プロセス400の高レベルフローチャートであり、ブロック402−418は、図6のブロック202−218に各々対応している。図8のブロック420及び422は、次の付加的なステップを表わす。
420:検索要求は、用語(語又は句)がサーチ要求用語に一致するところのドキュメント内の各位置を識別する「サーチヒット」を含む。
422:サーチヒットは、全ての頭書に対する当該スコアを発生するようにドキュメント内で処理される。どの頭書が、MLTHサーチ要求を発生したオリジナル頭書と同じ法律上の要点を考察しているかを決定するためのアルゴリズムが使用される。関連する頭書が見つからないか、又は頭書が存在しない場合には、段落がスコア決めされ、最もスコアの高い段落が選択される。
図9は、図8のダイジェスト検索プロセスフローチャートに見られる「頭書及び最良段落識別」プロセスブロック422の高レベルフローチャートである。図9のブロック1−14は、次のステップを表わす。
422a:各サーチヒットの正規化された値が、一致するヒットのテキストを取り巻くヒットエレメントの属性として追加される。例えば、これは唯一性(uniqueness)でサーチヒットを分析するときに、ランキングシステムが“dog”を“dogs”と同じキーワードとして識別することを可能にする。
422b:ドキュメントは、XMLドキュメントオブジェクトモデル(DOM)に基づいてXMLツリー構造でメモリに維持される。XPATHファンクションを使用して、エレメントのノードセットが構築される。この場合には、ヒットエレメントを子として有する全ての頭書エレメントのノードセットが構築される。これは、エレメントのリストとして処理される。
422c:XPATHコールがノードセットを構築する場合には、ルーチンは、エレメントのスコアを決めるように進む。もしそうでなければ、最良の段落識別に至る。
422d:XPATHを使用して、ヒットエレメントを子として有する判例の見解セグメントに全ての段落エレメントのノードセットを構築する。
422e:XPATHコールがノードセットを構築する場合には、ルーチンは、エレメントのスコアを決めるように進む。もしそうでなければ、最良の段落又は頭書が識別されない状態で存在する。
422f:このステップ(残りのエレメントをチェックする)は、全てのエレメントが処理されるまでループする。
422g:各エレメントのもとでのサーチヒット(頭書であるか段落であるか)が分析され、そしてそのエレメントに対してスコアが計算される。計算されたスコアは、4バイトの16進数であり、上半分の語は、サーチ用語範囲(coverage)を表わし、そして下半分の語は、全サーチ用語頻度を表わす。サーチ用語範囲は、エレメントにおいてどれほど多くの独特のサーチ用語がヒットしたかとして定義される。サーチ用語頻度は、サーチ用語ヒットであったエレメント内のキーワードのパーセンテージとして定義される。この構成では、より多くのサーチ用語を含むエレメントは、より少ないサーチ用語をより高い頻度で含むエレメントより常にランクが高い。スコアは、入力サーチストリングに依存するので、同じドキュメントに含まれた頭書に関して分析することしかできない。
422h:計算されたスコアは、それが計算されたところのエレメントの属性として追加される。
422i:アルゴリズムは、頭書のスコア決めを丁度終了すると、どれを保持すべきか識別するように進む。アルゴリズムは、段落のスコア決めを丁度終了すると、段落テキストをフォーマットするように進む。
422j:頭書は、スコアにより分類される。
422k:アルゴリズムは、どの頭書を保持すべきか決定する。先ず、最も高いスコアの頭書を見つけ、そしてそれを絶対スレッシュホールドに基づいて保持すべきかどうか決定する。このスレッシュホールドは、最も高いスコアの頭書が3つの独特のサーチ用語ヒットをもたねばならないか、或いは2つの独特のサーチ用語ヒット及び57%の用語頻度をもたねばならないかを示す。第1のものが保持された場合には、第2の最も高いスコアの頭書が分析される。これを保持するためには、最も高いスコアの頭書の67%以内のスコアをもつか、又は第2の絶対スレッシュホールドを越えねばならない。この第2のスレッシュホールドは、頭書が4つの唯一なサーチ用語ヒットをもつか、又は3つの唯一なサーチ用語ヒット及び86%の用語頻度をもたねばならない。第2の頭書が保持された場合には、第3の最も高いスコアの頭書が、第2と同じ式で分析される。アルゴリズムは、せいぜい、3つの頭書を選択する。使用するスレッシュホールドは、トレーニングセットを使用して経験的に確立され、そして望ましい結果に基づいて変更することができる。
422l:1から3の頭書が選択された場合には、ルーチンが終了となる。0が選択された場合には、段落がスコア決めされる(ステップ422dへ進む)。
422m:最も高いスコアの段落に属性が追加され、最良の段落とマークされる。
422n:段落のテキストにスライディング・ウィンドゥ・フォーマッター(sliding window formatter)が適用される。最も大きなヒットのパーセンテージを生じるウィンドゥが識別される。このウィンドゥがマークされ、ルーチンが終了となる。
完了時に、このプロセスによりXMLドキュメントに追加される値は、検索プロセスの最終XSLTステップが表示のためにドキュメントを完成させるのを許す。
“More Like This Headnote”サーチを行なうためにユーザがたどるステップについて、以下に説明する。ユーザは、先ず、ユーザが他の判例において見つけることを望む言語を含む頭書10(図1)を探索する(例えば、Lexisリサーチシステムを使用して対話式法律データベースサーチを遂行することにより)。次いで、ユーザは、頭書10に隣接する“More Like This Headnote”リンク10aをクリックし、“More Like This Headnote”ダイアログボックス20(図2)を表示させる。この“More Like This Headnote”ダイアログボックス20において、ユーザは、サーチを制限すべき管轄20a及び日付20bを選択することもできるし、或いはユーザは、メニュー20c及び20dを選択して、全ての管轄及び全ての日付をサーチすることもできる(図2)。次いで、ユーザは、“Search(サーチ)”ボタン20eをクリックする。
判例が見つからない場合には、その作用に対するメッセージ30がユーザのコンピュータモニタに表示される(図3)。さもなければ、サーチ結果40が表示される(図4A及び4B)。ダイジェストビューは、回答セットのデフォールト表示フォーマットである。ダイジェストビューは、一致する頭書40a、又は頭書をもたない判例からの一致する言語40bを表示する。ユーザは、“Sort by”ドロップダウンリスト40cを使用して、自分の結果を「最も近い一致」、「裁判所/日付」、又は「日付」により分類する。
前記の教示に鑑み、当業者であれば、本発明の上述した実施形態の変更や修正がなされ得ることが明らかであろう。例えば、ここに述べた方法は、ドキュメント内のMLTHリンクからサーチ要求を発生する。或いは又、MLTHリンクは、サーチ要求を形成するための第2の検索を発生して、ドキュメントの最初の表示の際にリンク内に必要とされるデータの量を減少することができる。それ故、特許請求の範囲及びその均等物の範囲内で、本発明を、前記以外の仕方で実施できることが理解されよう。
双方向データベースサーチの結果の例示的スクリーン表示の一部分を示す図で、頭書及び“More Like This Headnote”リンクを提示するところを示す図である。 “More Like This Headnote”ダイアログボックスの例示的スクリーン表示を示す図である。 “More Like This Headnote”サーチの実行に続く“No Documents Found(ドキュメント見つからず)”メッセージの例示的スクリーン表示を示す図である。 “More Like This Headnote”サーチの結果の例示的スクリーン表示の最上部を示す図である。 “More Like This Headnote”サーチの結果の例示的スクリーン表示の中間部を示す図である。 図4Aのスクリーン表示の最下部を示す図である。 本発明による法律上の要点をサーチするシステム及び方法の概略を示す高レベルフローチャートである。 図5のブロック104に対応する“More Like This Headnote”サーチの出発ポイントとなるドキュメントに対する検索プロセスの高レベルフローチャートである。 図5のブロック108に対応する“More Like This Headnote”サーチプロセスの高レベルフローチャートである。 図5のブロック110に対応するダイジェスト検索プロセスの高レベルフローチャートである。 図8のダイジェスト検索プロセスフローチャートに見られる「頭書及び最良段落識別」プロセスブロックの高レベルフローチャートである。

Claims (13)

  1. 選択された見解(idea)を考察しているドキュメントをコンピュータで探索するサーチ方法であって、
    見解を考察する本文を有するドキュメントをユーザ選択することに応答し、その選択されたドキュメントを、前記ドキュメントの本文で識別される意味ある見解をあらわす頭書(headnotes:判決要旨)をもつフォーマットでコンピュータ表示装置上に表示するステップと、
    )前記選択されたドキュメントの頭書の1つをユーザがディスプレイ上で選択するのに応答して、フレーズ又は単語を識別するために前記選択された頭書のテキストを処理し、前記識別されたフレーズ又は単語を含むサーチ要求を生成するステップと、
    (c)前記サーチ要求内のサーチ用語の数が設定された閾値よりも多い場合、前記サーチ要求内のサーチ用語の長さ及びサーチ用語の頻度に基づきサーチ用語を除去するステップと、
    前記サーチ用語をシソーラスと比較することによって1以上の前記サーチ用語に関する1以上の類義語を決定し、そして1以上の前記サーチ用語に関する類義語が前記シソーラスに発見された場合、発見された当該類義語を前記サーチ要求に追加するステップと、
    (e)同様の見解を考察している他のドキュメントを探索するために前記サーチ要求によってデータベースサーチを行なうステップと、
    (f)コンピュータ表示装置上でユーザに表示される検索ロジックに基づき、ユーザ選択オプションによりソートされた関連の頭書及び最適テキストの少なくとも1つを含むデータベースサーチの結果を表示するステップと、
    を含むサーチ方法。
  2. 前記ステップ()の前に、選択された判例の1以上の頭書のためにリンクを挿入するステップを更に備えた、請求項1に記載のサーチ方法。
  3. 同様の見解を考察している他のドキュメントにおける前記サーチ要求にあるサーチ用語の頻度に基づく関連性により前記ステップ(c)における探索の結果をランク付けするステップを更に含む、請求項1に記載のサーチ方法。
  4. 前記データベースは対話式法律データベースであり、前記ドキュメントは法律上の判例であり、そして前記見解は法律上の要点である、請求項1に記載のサーチ方法。
  5. 選択された見解を考察するドキュメントをコンピュータで探索するサーチ方法であって、
    (a)ユーザにより要求されたドキュメントをデータベースから検索するステップであって、前記ドキュメントが、見解を考察する本文と、前記本文で識別される意味ある見解をあらわす少なくとも1つの頭書を有する当該ステップと、
    (b)前記ユーザに対し、検索されたドキュメントを少なくとも1つの頭書を表示するフォーマットでコンピュータ表示装置上に表示するステップと、
    (c)前記検索されたドキュメントの表示において、前記ユーザにより選択された少なくとも頭書(headnotes:判決要旨)に基づいて、1以上のサーチ用語を含むサーチ要求を生成させるステップと、
    (d)前記選択された頭書によってあらわされる前記見解に関連するドキュメントを識別するために、前記サーチ要求に関する関連テキストサーチを実行するステップであって、その識別されたドキュメントが回答セットを定義する当該ステップと、
    (e)前記回答セットにおける前記ドキュメントの何れの頭書が、前記選択された頭書と同じ見解をあらわしているかを、前記サーチ要求のサーチ用語に一致する1以上の用語を有する頭書を見つけることによって識別するステップと、
    (f)各識別された頭書に関するスコアを、当該頭書内で固有なサーチ用語の数及び当該頭書内におけるサーチ用語であるキーワードのパーセンテージに基づき計算して、前記識別された頭書をスコアによってソートすること、
    絶対閾値を超える最高スコアをもつ識別された第1の頭書を選択すること、
    識別された第2の頭書が前記識別された第1の頭書のスコアのパーセンテージ内にあるか、若しくは第2の絶対閾値を超える場合は、二番目の最高スコアをもつ前記識別された第2の頭書を選択すること、
    識別された第3の頭書が前記識別された第1の頭書のスコアのパーセンテージ内にあるか、若しくは第2の絶対閾値を超える場合は、三番目の最高スコアをもつ識別された前記第3の頭書を選択すること、
    によって、前記識別された頭書の何れが、前記ユーザに表示するに充分なほど、前記選択された頭書にあらわされた見解に関連しているか決定するステップと、
    (g)前記回答セットにおけるドキュメントが、頭書をもたないか、又は前記選択された頭書と同じ見解の要点をあらわす頭書をもたない場合には、前記選択された頭書においてあらわされた見解に最も関連しているドキュメント内のテキストの部分を、サーチ要求の用語に一致する1以上の用語をもつ前記テキストの部分を見つけることによって識別するステップと、
    (h)各テキスト部分に関するスコアを、当該テキスト部分内で固有なサーチ用語の数及び当該テキスト部分内のサーチ用語であるキーワードのパーセンテージに基づき計算することによって、前記テキストの識別された部分の何れが、前記ユーザに表示するに充分なほど、前記選択された頭書にあらわされた見解に関連しているかを決定し、前記テキストの識別された部分をスコアによってソートし、そして前記選択された頭書にあらわされた見解に充分に関連している識別されたテキスト部分として、前記閾値を超えるスコアをもつテキスト部分を選択するステップと、
    (i)前記ユーザに表示するに充分なほど関連した部分がある場合には、前記テキストの最も関連している部分を識別するステップと、
    (j)前記関連している頭書及び前記テキストの関連した部分を前記回答セット内のドキュメントの引例リストとともに前記コンピュータ表示装置上でユーザに表示するステップと、
    を含むサーチ方法。
  6. 前記ステップ(a)に続いて、少なくとも幾つかの頭書に関連したハイパーリンクでユーザに表示するように前記ドキュメントをフォーマットして、そのフォーマットされたドキュメントが前記ステップ(b)においてユーザに表示されるようにするステップと、
    前記ステップ(b)に続いて、前記ハイパーリンクの1つをユーザがクリックするのに応答し、前記ステップ(c)において生成されるサーチ要求で用いられるサーチフォームであって、前記ユーザが前記サーチを制限するパラメータを入力できる当該サーチフォームを前記ユーザに表示するステップと、
    を更に含む請求項5に記載のサーチ方法。
  7. 前記対話式データベースは法律データベースであり、前記ドキュメントは法律上の判例であり、そして前記見解は法律上の要点である、請求項6に記載のサーチ方法。
  8. 前記サーチフォームは、ユーザが管轄及び日付制約を指定できるようにし、そして
    前記ステップ(c)において、ユーザにより指定された管轄及び日付制約に基づいて前記サーチ要求が生成される、請求項7に記載のサーチ方法。
  9. 前記管轄は、少なくとも1つのデータベースに関連され、
    前記ステップ(d)において、前記サーチ要求を使用して、前記選択された管轄に関連した少なくとも1つのデータベースに含まれた関連する判例を識別し、
    前記少なくとも1つのデータベースに含まれた判例の各々は、少なくとも判例のデータベースにおける位置を指示する参照情報に関連付けられ、そして
    前記ステップ(d)において、前記回答セットは、識別された全ての関連する判例に対する参照情報を含む、請求項8に記載のサーチ方法。
  10. 前記ステップ(c)において、前記選択された頭書のテキストは前記サーチ要求を生成するために編集され、その結果、前記サーチ要求は前記選択された頭書の編集されたテキストに基づいている、請求項5に記載のサーチ方法。
  11. 前記ステップ(c)において、前記頭書テキストは、
    それに句確認するための句識別プロセスに従わせ、そして頭書テキストにおいてキーワードを識別し、更に、
    前記頭書テキストにおいて識別されたキーワードの数が設定スレッシュホールドより大きい場合には、サーチ要求から用語を除去するルールを適用する、
    ことにより編集される請求項10に記載のサーチ方法。
  12. 前記ステップ(c)において、前記頭書テキストは、その頭書テキストにおいて法令参照を識別し、そして前記識別した法令参照をサーチ要求におけるサーチ用語とするように編集る、請求項10に記載のサーチ方法。
  13. 前記絶対閾値とは、前記識別された頭書が3つの特有なサーチ用語ヒット、或いは、2つの特有なサーチ用語ヒットで57%の用語頻度を有するという前記最高スコアとして定義され、
    前記第2の絶対閾値とは、前記識別された頭書が4つの特有なサーチ用語ヒット、或いは、3つの特有なサーチ用語ヒットで86%の用語頻度を有するとして定義され、
    前記識別された第1の頭書のスコアのパーセンテージは、67%である、請求項5に記載のサーチ方法。
JP2007529964A 2004-08-23 2005-08-17 法律上の要点をサーチするシステム及び方法 Active JP4814238B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US60327704P 2004-08-23 2004-08-23
US60/603,277 2004-08-23
PCT/US2005/029234 WO2006023542A2 (en) 2004-08-23 2005-08-17 Point of law search system and method

Publications (3)

Publication Number Publication Date
JP2008511075A JP2008511075A (ja) 2008-04-10
JP2008511075A5 JP2008511075A5 (ja) 2008-10-02
JP4814238B2 true JP4814238B2 (ja) 2011-11-16

Family

ID=35968123

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007529964A Active JP4814238B2 (ja) 2004-08-23 2005-08-17 法律上の要点をサーチするシステム及び方法

Country Status (7)

Country Link
US (2) US7689546B2 (ja)
EP (1) EP1782291A4 (ja)
JP (1) JP4814238B2 (ja)
AU (1) AU2005277506C1 (ja)
CA (1) CA2577376C (ja)
WO (1) WO2006023542A2 (ja)
ZA (1) ZA200701520B (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7548929B2 (en) * 2005-07-29 2009-06-16 Yahoo! Inc. System and method for determining semantically related terms
US7739708B2 (en) * 2005-07-29 2010-06-15 Yahoo! Inc. System and method for revenue based advertisement placement
CA2624865C (en) * 2005-10-04 2016-09-20 Thomson Global Resources Systems, methods, and software for identifying relevant legal documents
US9177050B2 (en) * 2005-10-04 2015-11-03 Thomson Reuters Global Resources Systems, methods, and interfaces for extending legal search results
US7814102B2 (en) 2005-12-07 2010-10-12 Lexisnexis, A Division Of Reed Elsevier Inc. Method and system for linking documents with multiple topics to related documents
CA2652762A1 (en) * 2006-05-19 2008-02-07 My Virtual Model Inc. Simulation-assisted search
JP2007328714A (ja) * 2006-06-09 2007-12-20 Hitachi Ltd 文書検索装置及び文書検索プログラム
US8909616B2 (en) 2006-09-14 2014-12-09 Thomson Reuters Global Resources Information-retrieval systems, methods, and software with content relevancy enhancements
AU2007339839A1 (en) * 2006-12-29 2008-07-10 Thomson Reuters Global Resources Information-retrieval systems, methods, and software with concept-based searching and ranking
US8346764B1 (en) 2007-06-01 2013-01-01 Thomson Reuters Global Resources Information retrieval systems, methods, and software with content-relevancy enhancements
WO2009091917A1 (en) * 2008-01-15 2009-07-23 Kingsley Martin Processing of phrases and clauses in documents
US8521731B2 (en) 2008-07-09 2013-08-27 Yahoo! Inc. Systems and methods for query expansion in sponsored search
WO2010027964A1 (en) * 2008-09-02 2010-03-11 Free Market International Corp. Information searching and retrieval system and method
WO2010141799A2 (en) 2009-06-05 2010-12-09 West Services Inc. Feature engineering and user behavior analysis
US8452765B2 (en) * 2010-04-23 2013-05-28 Eye Level Holdings, Llc System and method of controlling interactive communication services by responding to user query with relevant information from content specific database
US20130124515A1 (en) * 2010-07-23 2013-05-16 Foundationip Llc Method for document search and analysis
US20150363397A1 (en) * 2014-06-11 2015-12-17 Thomson Reuters Global Resources (Trgr) Systems and methods for content on-boarding
US10635705B2 (en) * 2015-05-14 2020-04-28 Emory University Methods, systems and computer readable storage media for determining relevant documents based on citation information
CN106919572B (zh) * 2015-12-24 2020-06-30 北京奇虎科技有限公司 网页搜索方法及浏览器
US11449534B2 (en) * 2017-10-13 2022-09-20 Thomson Reuters Enterprise Centre Gmbh Systems and methods for conducting legal research across multiple jurisdictions
US10303771B1 (en) 2018-02-14 2019-05-28 Capital One Services, Llc Utilizing machine learning models to identify insights in a document
CN112732865B (zh) * 2020-12-29 2022-11-29 长春市把手科技有限公司 一种刑事案件情节对刑期影响比例的测算方法及装置
CN113535933B (zh) * 2021-06-01 2023-07-25 科大讯飞股份有限公司 案例检索方法及装置和电子设备、存储装置
WO2024059672A1 (en) * 2022-09-13 2024-03-21 Thomson Reuters Enterprise Centre Gmbh Systems and methods for generating graphical views
US20240086465A1 (en) * 2022-09-13 2024-03-14 Thomson Reuters Enterprise Centre Gmbh Systems and methods for generating graphical views

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002543528A (ja) * 1999-05-05 2002-12-17 ウエスト パブリッシング カンパニー ドキュメント分類システム、ドキュメント分類方法およびドキュメント分類ソフトウェア
US20030115213A1 (en) * 1998-05-27 2003-06-19 Mielenhausen Thomas C. Data processing system and method for organizing, analyzing, recording, storing and reporting research results
US20040059726A1 (en) * 2002-09-09 2004-03-25 Jeff Hunter Context-sensitive wordless search

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5692176A (en) 1993-11-22 1997-11-25 Reed Elsevier Inc. Associative text search and retrieval system
US5819260A (en) 1996-01-22 1998-10-06 Lexis-Nexis Phrase recognition method and apparatus
US5794236A (en) 1996-05-29 1998-08-11 Lexis-Nexis Computer-based system for classifying documents into a hierarchy and linking the classifications to the hierarchy
US7778954B2 (en) * 1998-07-21 2010-08-17 West Publishing Corporation Systems, methods, and software for presenting legal case histories
US7529756B1 (en) * 1998-07-21 2009-05-05 West Services, Inc. System and method for processing formatted text documents in a database
US6772149B1 (en) * 1999-09-23 2004-08-03 Lexis-Nexis Group System and method for identifying facts and legal discussion in court case law documents

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030115213A1 (en) * 1998-05-27 2003-06-19 Mielenhausen Thomas C. Data processing system and method for organizing, analyzing, recording, storing and reporting research results
JP2002543528A (ja) * 1999-05-05 2002-12-17 ウエスト パブリッシング カンパニー ドキュメント分類システム、ドキュメント分類方法およびドキュメント分類ソフトウェア
US20040059726A1 (en) * 2002-09-09 2004-03-25 Jeff Hunter Context-sensitive wordless search

Also Published As

Publication number Publication date
CA2577376A1 (en) 2006-03-02
EP1782291A2 (en) 2007-05-09
ZA200701520B (en) 2009-08-26
WO2006023542A2 (en) 2006-03-02
AU2005277506B2 (en) 2010-12-09
AU2005277506A1 (en) 2006-03-02
WO2006023542A3 (en) 2007-11-22
US7689546B2 (en) 2010-03-30
EP1782291A4 (en) 2009-08-26
CA2577376C (en) 2012-02-21
US20060041607A1 (en) 2006-02-23
JP2008511075A (ja) 2008-04-10
AU2005277506C1 (en) 2011-03-31
USRE44394E1 (en) 2013-07-23

Similar Documents

Publication Publication Date Title
JP4814238B2 (ja) 法律上の要点をサーチするシステム及び方法
KR101027999B1 (ko) 사용자 로그로부터의 검색 카테고리 유의어 추론
Agichtein et al. Learning search engine specific query transformations for question answering
US11100124B2 (en) Systems and methods for similarity and context measures for trademark and service mark analysis and repository searches
JP5379696B2 (ja) 概念ベースの検索とランク付けを伴う情報検索のシステム、方法およびソフトウェア
JP4976666B2 (ja) 情報検索システムにおけるフレーズ識別方法
JP4944406B2 (ja) フレーズに基づく文書説明の生成方法
JP4944405B2 (ja) 情報検索システムにおけるフレーズに基づくインデックス化方法
JP3755134B2 (ja) コンピュータベースの適合テキスト検索システムおよび方法
US20160260033A1 (en) Systems and Methods for Similarity and Context Measures for Trademark and Service Mark Analysis and Repository Searchess
US20090171907A1 (en) Method and system for searching text-containing documents
US20040122816A1 (en) Method, apparatus, and program for refining search criteria through focusing word definition
US20060122997A1 (en) System and method for text searching using weighted keywords
JP2008511075A5 (ja)
WO2009059297A1 (en) Method and apparatus for automated tag generation for digital content
US9031949B1 (en) Creation of inferred queries for use as query suggestions
US20130046532A1 (en) System and method for providing definitions
Kantorski et al. Automatic filling of hidden web forms: a survey
JP4092933B2 (ja) 文書情報検索装置及び文書情報検索プログラム
JP4935243B2 (ja) 検索プログラム、情報検索装置及び情報検索方法
EP3864524A1 (en) Method and system to perform text-based search among plurality of documents
KR102256007B1 (ko) 자연어 질의를 통한 문서 검색 및 응답 제공 시스템 및 방법
US8375017B1 (en) Automated keyword analysis system and method
US20050071333A1 (en) Method for determining synthetic term senses using reference text
Álvarez et al. A Task-specific Approach for Crawling the Deep Web.

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080812

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110808

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110825

R150 Certificate of patent or registration of utility model

Ref document number: 4814238

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140902

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250