JP2015527641A - 引用を処理、提示、および、推奨するためのシステム、方法、および、ソフトウェア - Google Patents

引用を処理、提示、および、推奨するためのシステム、方法、および、ソフトウェア Download PDF

Info

Publication number
JP2015527641A
JP2015527641A JP2015519384A JP2015519384A JP2015527641A JP 2015527641 A JP2015527641 A JP 2015527641A JP 2015519384 A JP2015519384 A JP 2015519384A JP 2015519384 A JP2015519384 A JP 2015519384A JP 2015527641 A JP2015527641 A JP 2015527641A
Authority
JP
Japan
Prior art keywords
user
citation
data
module
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015519384A
Other languages
English (en)
Other versions
JP2015527641A5 (ja
JP6403340B2 (ja
Inventor
カリッド アル−コファヒ,
カリッド アル−コファヒ,
ジェイソン ローリンズ,
ジェイソン ローリンズ,
エレン ローテンベルグ,
エレン ローテンベルグ,
クリスティーン キリアン,
クリスティーン キリアン,
チャールズ マッコマー,
チャールズ マッコマー,
Original Assignee
トムソン ルーターズ グローバル リソーシーズ
トムソン ルーターズ グローバル リソーシーズ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by トムソン ルーターズ グローバル リソーシーズ, トムソン ルーターズ グローバル リソーシーズ filed Critical トムソン ルーターズ グローバル リソーシーズ
Publication of JP2015527641A publication Critical patent/JP2015527641A/ja
Publication of JP2015527641A5 publication Critical patent/JP2015527641A5/ja
Application granted granted Critical
Publication of JP6403340B2 publication Critical patent/JP6403340B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本発明は、文書中に含まれるデータを自動的に処理し、処理されたデータに合致する引用を識別および推奨するためのシステム、方法、およびソフトウェアを提供する。本システムは、ユーザが、分析のためのテキストセグメント(単数または複数)を選択および提出し、一式の推奨される引用から、テキストセグメントならびに文書中に含まれるプロファイルデータに合致する引用(単数または複数)を選択することを可能にする。1つ以上の引用ライブラリまたは出典データベースにクエリが行なわれ、著者によって選択および提出されたテキストセグメントに最も合致する推奨のための引用を見つける。本システムは、文書が、文書レンダリングアプリケーションによって提示されたまま、著者によって提出されたデータを自動的に処理し、検討および文書中に含むための一式の推奨される引用を生成する。選択された引用は、次いで、書式設定され、文書中に挿入される。

Description

(発明の分野)
本発明の分野は、概して、文書処理に関し、より具体的には、ワードプロセッサ等の文書レンダリングアプリケーション内において、データ、特に、テキストセグメントを動的に処理し、引用データ、特に、文学的引用を識別および推奨するため、ユーザへの提示のため、ならびに引用データを選択的に含めるためのシステム、方法、およびソフトウェアに関する。本発明はさらに、概して、情報科学および情報学(または情報計量学)に関し、より具体的には、計量書誌学および科学計量学の分野に関する。
(発明の背景)
印刷機、植字、タイプライティング機、ならびにコンピュータ実装文書処理および記憶装置の出現により、人間によって生成される情報の量が劇的に、かつてない速度で増加してきた。結果として、この増大している多量の情報の読み出しおよび流通を正確に収集および記憶し、識別し、追跡し、類別し、かつ目録を作る必要性が引き続き存在し、高まっている。
学術的および科学的な研究、ならびに文書研究のための洗練されたプロセスおよび慣例の執筆の分野では、「書誌的引用」と呼ばれる、資料を支持し、研究分野を組織化することが出現してきている。そのような科学的書物は、とりわけ、本、機関誌、雑誌、または他の定期出版物に発表された記事、原稿、ならびに、例えば、議事録および議事出版物において、機関、業界、および職能団体によって提示、提出、および発表された論文を含む。研究の主要部をより効率的かつ効果的に前進させるように、学術的書物で発表された情報の広範な流通を促進するために、学者および科学者は、書物に記載される進歩が基礎とする他者または自身の過去の研究を認識するために、書誌的引用を使用する。任意の特定の研究または研究の本文に含まれるような「引用」または「引用参考文献」は、テキスト内引用、脚注、巻末注、および文献目録を集合的に形成し、著者によって依拠または考慮される情報源を識別するため、ならびにさらなる研究のために内容および方向の正確性を確認する方法を読者に与えるために使用される引用参考文献、書誌、または他の参考文献データを広範に指すために本明細書で使用される。「文献目録」とは、著者、出版社、または所与の主題に特有の書物の完全または選択的なリストまたは編集物を指し得、あるいは、論文、記事、本、または他の情報物等の特定の著作物を作成する際に著者によって依拠または考慮される書物物のリストまたは編集物を指し得る。
引用は、引用書物を情報源または出典への参照として簡潔に表現および識別する。引用および文献目録は、情報を解釈することの一貫性を増進するために、特定の書式設定慣例に従う。各引用は、典型的には、完全書名、著者名(単数または複数)、出版データ(出版社識別、巻、版、および他のデータを含む)ならびに出版の日付および位置といった情報を含む。各引用と関連付けられる書式設定要件および多数のフィールドを考慮し、所与の論文の中に数十の引用、場合によっては、数百の引用があることを考慮すると、所与の論文またはプロジェクトにおいて、そのような実質的な数の引用を正確に識別および引用する際の著者に要求される作業量は、出版および研究プロセスに実質的な問題および負担を提示する。論文またはプロジェクトの著者または共同研究者が、過去の文書においてある論文を引用したときでも、将来の論文に引用するために、そのような論文を効率的かつ正確に思い出すという問題が存在する。必要とされるのは、著者に、ワードプロセッサ環境において作業しながら、ワードプロセッサアプリケーションから離れずに、引用情報への効果的アクセスを提供する能力をもたらすシステムである。
加えて、引用内の多くのフィールドは、本質的に曖昧であり、著者が、進行中の論文または著作物に引用を正確に表すことを非常に困難にする。例えば、引用されるべき論文の正確な書名またはそのような論文の著者を思い出すことは、プロセスを本質的に問題のあるものにする。研究者および著者に現在利用可能なシステムは、著者の「大まかな」またはおおよその引用情報あるいはさらに作業文書のテキスト内の論題情報に基づいて、引用を識別および生成するための効果的手段を提供するものではない。
また、著者名は、通例、完全なファーストネームまたはミドルネームではなく、イニシャル(例えば、J.Smith)等の省略形態で引用中有に表される、あるいは、例えば、John Smithといったありふれたファーストまたはラストネームまたは両方を有することのように、他の著者との共通点に自然に悩まされる。これは、著作プロセス中に引用が探される著者または論文の実際の識別に関する潜在的な曖昧性をもたらす。著者および他の引用情報の曖昧性を排除するために多くの試行が行われてきた。情報の曖昧性を排除するためのシステムおよび方法は、2011年5月31日に発行された米国特許第7,953,724号「Method and System for Disambiguating Information Objects」(参照することによって全体として本明細書に組み込まれる)に開示されている。
科学および研究データベースの追求の支援において、データベース管理ツール、引用管理および分析ツール、研究著作ツール、ならびに他の強力なツールおよびリソースが、学者、研究者、および科学者の有益な利用のために使用および開発されてきた。これらのツールおよびリソースは、インターネットまたは何らかの他のコンピュータネットワーク上のオンライン環境内のユーザに利用可能であり得、クライアント・サーバアーキテクチャ、中央データベースおよび/またはローカルデータベース、アプリケーションサービスプロバイダ(ASP)、または電子データベースおよびソフトウェアツールに効果的に通信およびアクセスするための他の環境の形態であってもよい。そのようなツールおよびリソースの例は、Thomson Reuters ScientificのWeb of ScienceTM(WoS)、Web of KnowledgeTM(WoK)、および、ResearchSoftTM、出版ソリューションの組(EndNoteTM、EndNoteWebTM、Reference ManagerTM、およびManuscript CentralTMを含む)である。
著作および出版プロセスにおける長年の問題は、作成中に引用情報を論文に正確に入力すること、および出版に先立って引用の精度を手動で検証するという時間がかかりかつ手間のかかるプロセスである。不完全な情報および不正確な情報(例えば、つづりの間違いおよび誤字)等の小さいが重大な間違いは、著者および出版社に信頼性を失わせ、読者に文書で不正確に引用された参考資料を探す努力を無駄にさせる。必要とされるのは、著者が、ワードプロセッサアプリケーションを開いたまま、正確な引用情報を識別し、選択し、直接文書の中に挿入することを可能にするシステムである。
問題となる著作プロセスの特定の側面の1つは、著者が、論文中において、過去の研究によって支持される技術的または他の立場を表明することを所望するが、その意見を支持する過去の論文を思い出せないときである。自然言語処理、IDF(逆文書頻度)、TF−IDF(単語の出現頻度−逆文書頻度)に基づいたものを含む、テキスト分析のための技法が、公知であり、提示されたテキストから意味を判別することを支援するため、および、例えば、スコア化された関連性に基づいて、そのようなテキストを関係、概念、および文書と関連付けるために使用されている。そのような技法は、さらなる処理のために論文および引用から情報を抽出するために電子文書において行われる、文または単語の構造からのデータを構文解析することのような抽出および分類を含んでもよい。
本明細書で使用される場合、「書物」、「原稿」、および「論文」は、「ハード」文書および「ソフト」電子文書の両方を指すものとし、交換可能に使用され、最も広い集合的な意味を与えられるものとする。そのような著作物が、現在、全体的または部分的に電子的に広く作成され、編集され、維持され、アーカイブに保管され、目録作成され、研究されている。インターネットならびに他のネットワークおよびイントラネットが、そのような情報の電子流通およびアクセスを容易にする。データベース、データベース管理システム、および検索言語、特に、リレーショナルデータベース(例えば、IBM、Oracle、Sybase、Microsoft、およびその他によって開発されたDB2およびその他)の出現は、科学および科学の研究の全ての分野をさらに進歩させる強力な研究および開発のツールおよび環境を提供してきた。無数の知識を組織化し、活用することに役立つように特に設計されている電子データベースおよび関連サービス(例えば、WoSおよびWoK)を作成してきた企業および組織も存在する。
参考文献検証ツールは、原稿作成、提出、承認、校正、および生産プロセスの文脈において利用可能である。本明細書では、出典データベースと称され得る、多くの引用または参考文献データベースが、ウェブサービス接続を介して利用可能になっている。しかしながら、これらのツールは、現在、著作アプリケーションと良好に統合されておらず、実質的手動介入および確認を要求する。数千もの論文および原稿が毎日、著者によって校閲者および出版社に提出され、提出物の多くが不正な書式の参考文献を含む。これらの間違いを見つけて訂正するために、出版への現在の経路は、通常、スタイルおよび内容の精度のチェックから構成される手動の参考文献検証ステップを含む。検証タスクは、種々の役割によって、最も一般的には、コピーエディタまたはプロダクションエディタによって、しかし、おそらくは植字工によっても行われ得る。数十(または数百)の引用参考文献を一般的に含む論文および原稿があると、検証プロセスは退屈で時間がかかり、出版社の訂正および書式設定の労力の最大60%を占めると推定されているかなりの費用を出版プロセスに追加する。必要とされるのは、どの引用が所望のスタイルに正確かつ均一に一致するかを効果的に識別し、論文中に著者によって含めるための引用データを推奨するシステムである。
既存のシステムは、例えば、文書/引用中のXMLタグおよびスキーマの検証を提供し、文書/引用または文書/引用記録を伴う拡張データを提供することが公知である。そのようなシステムは、学術的メタデータおよびリンク付け(例えば、別個の論題フィールド、要約フィールド等)、ならびにデジタルオブジェクト識別子(DOI)または特定の学術的著作物に関する一意のデジタル識別子(例えば、URL)の作成を提供し得る。DOIは、デジタル環境内のコンテンツオブジェクトを識別するために使用され得る。デジタルネットワーク上で動作するエンティティは、DOI「名」を割り当てられ、アドレス情報を含む「現在の」情報とそれらとを関連付けている。名称情報は変化しないが、他の情報、例えば、アドレスは、経時的に変化し得る。DOIシステムは、識別、コンテンツ、メタデータ、リンク、および媒体を管理するためのフレームワークを提供する。
ユーザ(著者)経験を向上させ、より効率的かつ効果的に、挿入される引用の正確性を促進し、かつ文書中に著者によって提供されるような限定された一式のテキストおよび/または引用データに基づいて、文書中に含めるための一式の推奨される引用の選択を識別および推奨する、文学的引用を自動的に処理するための改良された方法、システム、およびソフトウェアが、必要とされる。
米国特許第7,953,724号明細書
(発明の概要)
本発明は、文書中に含まれるデータ(例えば、テキストセグメント)を自動的に処理し、処理されたデータに合致する引用を識別および推奨するためのシステム、方法、およびソフトウェアを提供する。本システムは、ユーザ(例えば、著者)が、分析のためにテキストセグメント(単数または複数)を選択および提出し、一式の推奨される引用から、テキストセグメントならびに(例えば、脚注または巻末注として)文書中に含まれるプロファイルデータに合致する引用(単数または複数)を選択することを可能にする。より具体的には、本発明は、著者が、文書レンダリングアプリケーション、例えば、ワードプロセッサ内で文書を作成または編集中に、本プロセスを行なう。1つ以上の引用ライブラリまたは他の出典データベースにクエリが行なわれ、著者によって選択および提出されたテキストセグメントに最も合致する、可能性のある推奨のための引用を見つける。より具体的には、本発明は、テキスト分析およびプロファイル(例えば、個人プロファイル)の組み合わせを使用して、一式の推奨される引用を識別し、ランク付けし、および提示する。選択された引用は、次いで、適切に書式設定された形態またはスタイルにおいて、文書中に挿入される。
本発明は、文書が文書レンダリングアプリケーションによって提示されている間、著者によって提出されたデータを自動的に処理し、著者の検討のため、および文書中に含めるために、一式の推奨される引用を生成するためのシステムを想定する。本発明のシステムは、ローカルマシン上に存在する、あるいはオンラインサービスを通じた、著作者または引用エディタあるいは他のソフトウェアアプリケーションまたはクライアントと組み合わせて機能してもよく、それは、著者または著者のチームと関連付けられた個人ライブラリまたは引用の文献目録を含み得、かつ、選択されたテキストセグメントに合致する引用、例えば、不完全または書式設定されていない引用を引用ライブラリから読み出し得る。
本発明は、出版またはレビューのために、出典データベース(単数または複数)からの引用を効果的に識別し、推奨し、論文および他の提出物中に挿入することによって、著者(例えば、研究者、科学者、および学術的著者)および間接的に出版社(例えば、機関誌ならびに専門家組織および技術組織)のための拡張ワークフローソリューションを提供する。本発明は、論文、機関誌、会議抄録、および会議の議事録の出版または販売のための時間を加速化し、有意な生産性の向上をプロセスにもたらす。本発明は、ユーザが、ワードプロセッサアプリケーションにおいて作業しながら、研究および他の生産性リソースおよびソリューションにシームレスにアクセスすることを可能にする。本発明は、ユーザが適切な引用をより効率的に識別および挿入することを支援するソフトウェアツールおよびアプリケーションを用いて、付加価値情報を提供する。本発明は、科学研究の文脈において本明細書に説明され得るが、本発明はまた、他の用途および環境にも適用可能である。
一実施形態では、本発明は、着目データベース、例えば、WoS、WoK、CrossRef、およびPubMedと併用するために、研究および著作生産性ソフトウェアの統合されたシステムまたは統合可能システムを提供する。本発明のシステムは、他の著作ツールおよびソリューションと統合され、または併用されてもよい。一例として、Thomson Reuters Scientific applications EndNote(登録商標)、EndNote WebTM、Reference Manager(登録商標)、Abstract CentralTM、Proceedings CentralTM、およびManuscript CentralTMは、文献目録、論文、出版物、および他の学術的研究を作成、執筆、出版、提出、および管理するために使用されるソリューションを提供する商業的に利用可能なシステムである。ソリューションのシステム内に含まれる機能の多くは、自動化され得る。
本発明は、ソリューションの1つ以上またはその組み合わせと併用されてもよい。例えば、Manuscript Centralは、学術的出版社のためのウェブベースのデータベース駆動型査読およびオンライン提出ソリューションを提供する。Manuscript Centralは、機関誌への原稿提出を自動化し、容易な管理、編集、およびレビュー能力を可能にする。EndNote(登録商標)およびReference Manager(登録商標)は、文献目録を公表および管理するために使用されるデスクトップアプリケーションであるが、ブラウザベースのアプリケーションでもあり得る。これらの製品を用いて、ユーザ(例えば、論文を執筆する学生、研究を発表する専門家)は、例えば、インターネットデータベースを検索して個人参考文献ライブラリを構築し、参考文献をオンラインおよびCD−ROMデータベースならびにライブラリカタログからインポートし、数百もの学術的出版物に対して文献目録を自動的に書式設定し、Cite While You WriteTM機能とMicrosoft(登録商標) Word(登録商標)を併用することにより、参考文献が引用されるとすぐに、文献目録を作成することができる。EndNote Webは、論文中の参考文献を管理および引用し、文献目録を作成するためのウェブベースのツールである。EndNoteデスクトップおよびWeb of KnowledgeSMリサーチプラットフォームとシームレスに統合されることによって、EndNote Webは、既存のEndNoteユーザにオンライン共同研究環境を提供し、基本的文献目録ソリューションを要求する大学生に導入口を提供する。一様式において、本発明は、テキスト分析および可視化ツールを提供し、EndNoteおよびReference Managerとシームレスに作動し、主要テーマおよび論題に関して参考文献ライブラリを視覚的に探索するための強力な方法を提供する。本発明は、ユーザが膨大な量の参考文献を迅速に評価することを可能にするツールと統合され、研究プロセスを加速化し得る。
プロセスの一部として、ユーザは、推奨または提案プロセスが行なわれるデータベースのリストから選択することができ、またはシステムは、所定の一式の1つ以上のデータベースにデフォルト設定されてもよい。本発明と併用するための例示的データベースとして、公共参考文献データベース(例えば、CrossRef、およびPubMed)、市販のデータベース(例えば、Web of Science(WoS)、Web of Knowledge(WoK)、およびBIOSYS)、ならびに私的に保有された特殊データベースが挙げられる。
本発明は、機能的特徴、すなわち、テキスト分析モジュール、個人プロファイルモジュール、推奨モジュールを提供し、さらに、ワードプロセッサ統合モジュール、通信モジュール、ソースアプリケーション切替、Microsoft Word引用インポート、文献目録のセクション化、引用の複合化、引用から文献目録へのリンク化、ソース参考文献管理アプリケーション内における組織グループの生成、および参考文献モジュールの管理を含んでもよい。
本発明の完全な理解を容易にするために、同様の要素が同様の数字で参照される添付図面をここで参照する。これらの図面は、本発明を限定するものとして解釈されるべきではないが、例示的であり、参考のためであることを目的としている。
図1は、本発明の一実施形態による、ハードウェアコンポーネントおよびソフトウェアコンポーネントの構成を表す概略図である。 図2は、本発明の第2の実施形態による、ハードウェアコンポーネントおよびソフトウェアコンポーネントの構成を表す概略図である。 図3は、本発明の一実施形態による、一式の推奨される引用を生成する方法を表す流れ図である。 図4は、第3の本発明の実施形態による、ハードウェアコンポーネントおよびソフトウェアコンポーネントの構成を表す概略図と、データフローである。 図5は、本発明に関連する、ユーザ登録インターフェースのスクリーンショットである。 図6は、本発明の一実施形態による、ユーザウェブポータルまたはブラウザ構成を表す概略図である。 図7は、本発明に関連する、ユーザダッシュボードである。 図8は、本発明に関連する、ユーザホームページまたはポータルである。 図9は、本発明に関連する、プロジェクトホームページまたはポータルである。 図10は、本発明に関連する、結果フィルタインターフェースのスクリーンショットである。 図11は、本発明に関連する、ユーザプロジェクトマイルストーンレビューおよび提出インターフェースのスクリーンショットである。 図12は、本発明に関連する、ワードプロセッサプラグインを有するユーザワードプロセッサ文書処理画面である。 図13は、本発明に関連する、ワードプロセッサプラグインを有するユーザワードプロセッサ文書処理画面である。 図14は、本発明に関連する、ワードプロセッサプラグインを有するユーザワードプロセッサ文書処理画面である。 図15は、本発明に関連する、ワードプロセッサプラグインを有するユーザワードプロセッサ文書処理画面である。 図16は、本発明に関連する、ワードプロセッサプラグインを有するユーザワードプロセッサ文書処理画面である。 図17は、本発明に関連する、電子メールプラグインを有するユーザ電子メール処理画面である。
(発明の詳細な説明)
ここで、添付図面で示されるような例示的実施形態を参照して、本発明をさらに詳細に説明する。本発明は、例示的実施形態を参照して本明細書で説明されるが、本発明は、そのような例示的実施形態に限定されないことを理解されたい。本明細書の教示にアクセスできる当業者であれば、本明細書で開示および請求されるような本発明の範囲内にあるものとして、および本発明が有意に有用となり得ることに関して、本明細書で完全に想定される、付加的な実装、修正、および実施形態、ならびに本発明を使用するための他の用途を認識する。
本明細書に説明されるように、用語「書物」、「原稿」、「論文」、および「記事」は、ハードおよびソフト文書、論文、書物、および他の出版物を指すと理解されるものとし、本発明は、あらゆる種類の出版物、論文、書物、記事、書簡、社説、本、章、または他の種類の出版された論文または文書を対象とすることを意図するため、全て他の用語をそれぞれ本質的に指すように意図されている。用語「テキストセグメント」または「一式のテキスト」は、研究者によって著作された研究論文等の文書中に含まれるまたは含まれるはずである、あるいは、その中に現れるテキストに関連する選択された、マークされた、ハイライトされた、抽出された、または別様に示された一式のテキスト情報(例えば、英数字文字)を指すために広義に使用される。
図を参照すると、本発明の種々の実施形態が、提示されている。図1は、本発明を備える、ハードウェアコンポーネントおよびソフトウェアコンポーネントの構成の一実施形態を表すブロック図である。汎用オペレーティングシステムが、データを記憶し、(例えば、汎用コンピューティングシステムを特殊目的コンピューティングシステムにするための)アプリケーションを実行し、入力および出力情報のフローを規制するためのフレームワークとして提供される。例示的汎用オペレーティングシステムは、Apple Computer, Inc.からのMac OS、Microsoft Corp.からのWindows(登録商標)、ならびにLinux(登録商標)およびUNIX(登録商標)オペレーティングシステムの種々の頒布形態である。本発明は、とりわけ、アプリケーションが文書およびホストアプリケーションから離れずに、いくつかの機能を行なうことを可能にする、ソフトウェアプラットフォームコンポーネントを提供する。本質的に、文書は、ソフトウェアプラットフォームとなり得る。
一実施形態では、本発明は、プロセッサと、メモリと、メモリ内に記憶され、引用推奨を提供するためにプロセッサによって実行可能である機械読み取り可能なコードとを含むコンピュータベースのシステムを提供する。図1を参照すると、システム100は、一式のデータベース110と、サーバシステム120と、クライアントアクセスデバイス130とを含むクライアント−サーバアーキテクチャ内にある。システム100は、サーバ120に、引用推奨モジュール127を含むが、本モジュールの側面は、ローカルワードプロセッサアプリケーションと統合されたアドインまたはプラグインモジュールの形態等において、クライアントアクセスデバイス130に存在してもよい。図2に示されるように、引用推奨モジュール127は、テキスト分析モジュール(TAM)206と、個人プロファイルモジュール(PPM)207と、システム分析モジュール(SAM)208とを備える引用推奨モジュール(CRM)205として図示される。テキスト分析モジュール、個人プロファイルモジュール、および推奨モジュールは、ローカルクライアントデバイスおよび中央サーバのうちの1つ以上に存在してそこで実行される機能的コンポーネントを含む。動作において、アクセスデバイス130上で動作するワードプロセッサアプリケーションを介して、文書を準備中の著者等のユーザは、文書中からテキストの一部、すなわち、「テキストセグメント」を識別、マーク、ハイライト、または別様に選択する。クライアントデバイスから受信された信号は、選択されたテキストセグメントを表し、引用推奨システム127、205に通信される。TAM206は、受信されたテキストセグメントに関して、自然言語アルゴリズム、ヒューリスティック、統計モデル化または重み付け、idf、tf−idf、共起確率、潜在意味インデックス、および他のプロセス等のプロセスを行ない、第1の出力を生成する。例えば、選択されたテキストセグメントに関連すると識別された特定の参考文献が、頻繁に引用されている(「頻用」)ことが統計によって示される場合、過去に論文に引用するために、本参考文献を選択した過去の著者に基づいて、より関連性が高いものとして、より高くランク付けされる。これは、参考文献が、PPM等によって、進行中の論文または著者と関連付けられた研究分野とより密接に関連付けられる場合、さらに高くランク付けされ得る。
TAM出力は、ユーザに推奨するために、一式の潜在的または候補引用参考文献または文書の形態、あるいは、可能性として考えられる引用のデータ表現の他の形態をとってもよい。本動作において適用され得るテキスト分析技法の例は、例えば、米国出願公開第2008/0033929号(Al−Kofahi et al.)「SYSTEMS, METHODS, AND SOFTWARE FOR IDENTIFYING RELEVANT LEGAL DOCUMENTS」、および米国出願公開第2009/0198674号「INFORMATION RETRIEVAL SYSTEMS, METHODS, AND SOFTWARE WITH CONCEPT BASED−SEARCHING AND RANKING」(両方とも、参照することによって全体として本明細書に組み込まれる)に説明されている。テキスト分析に関連する技法は、例えば、米国出願公開第2010/0332520号(Lu et al.)「SYSTEMS, METHODS, AND INTERFACES FOR EXTENDING LEGAL SEARCH RESULTS」(参照することによって全体として本明細書に組み込まれる)に説明されるように、前処理機能として、論理グループへの文書のクラスタ化を含んでもよい。本発明によると、クラスタ化は、個人プロファイルに基づいて、ユーザの研究分野の前提を考慮して行なわれてもよい。故に、TAMの出力は、PPMによって影響を受けてもよく、CRMは、次いで、個人プロファイルと関連付けられたデータを用いて、TAMの結果をさらに洗練してもよい。
個人プロファイルモジュール207は、ユーザまたはユーザグループ、例えば、プロジェクトまたは論文に関わる共著者と関連付けられた情報を読み出し、またはそれにアクセスし、第2の出力を生成し、またはTAMの出力をさらに処理する。例えば、TAM206の出力が、一式の候補引用または文書である場合、PPM207は、ユーザプロファイルデータに基づいて、その一式を再ランク付け、フィルタリング、または補足してもよい。例えば、著者によって著作された過去の論文内に含まれる引用、または著者と関連付けられた研究分野、または他の基準を使用して、出力を生成してもよく、その出力は、TAM出力に対して得られる修正となってもよい。例えば、TAMからの一式の結果は、ユーザと関連付けられた研究分野内にあると識別された引用、ユーザと関連付けられた研究分野外にあると識別された引用、および関連研究分野内にあると識別された引用を含んでもよい。CRM204は、TAMおよびPPM出力を処理し、ユーザに提示するための一式の推奨される引用に辿り着く。引用推奨モジュールは、TAMの第1の出力およびPPMの第2の出力に応答して、一式の引用推奨データを生成する。
個人プロファイルモジュールは、個人プロファイル記録と第1のユーザとを関連付け、一式の第1のユーザ出版物、一式の第1のユーザ検索用語、一式の助成金または類似資金調達ソース、一式の第1のユーザ検索結果または保存されたクエリ、第1のユーザと関連付けられた個人参考文献ライブラリ内に記憶された一式の項目、第1のユーザと関連付けられたユーザ−システム相互作用の一式の記憶された履歴、第1のユーザの一式の個人または専門文献目録データ要素、および第1のユーザと関連付けられた、または第1のユーザに関係する他のシステムユーザの一式の個人または専門文献目録データ要素のうちの少なくとも1つに関する情報を読み出し、またはそれにアクセスする。PPMの第2の出力は、ユーザの個人参考文献ライブラリからの1つ以上の推奨される参考文献または引用のリスト、少なくとも1つの出典データベースからの1つ以上の推奨される参考文献または引用のリスト、他のシステムユーザの個人参考文献ライブラリからの1つ以上の推奨される参考文献または引用のリスト、またはこれらの項目のデータ表現のうちの1つ以上の形態をとってもよい。
一実装様式では、PPM出力およびTAM出力は、引用推奨モジュールに送達されて引用推奨モジュールによって処理され、最終の一式の引用推奨データを生成し、これは、次いで、ユーザに提示するために送達されてもよい。別の実装様式では、PPMは、TAMの出力をランク付けし、再ランク付けし、フィルタリングし、補足し、または別様に調節し、ユーザと関連付けられた個人プロファイルの側面を最終の一式の推奨される引用データに反映するように、TAMの出力を受信または修正してもよい。PPMの出力は、次いで、引用推奨モジュールに送達されて引用推奨モジュールによって処理され、最終の一式の引用推奨データを生成し、これは、次いで、ユーザに提示するために送達されてもよい。このように、データ処理フローは、本質的に、引用推奨プロセスを通じて直列の経路を辿る。例えば、TAMは、第1の一式の候補引用または参考文献あるいは文書を生成してもよく、PPMは、ユーザと関連付けられた個人プロファイルに基づいて、その一式をランク付けし、再ランク付けし、またはフィルタリングし、訂正または修正された一式の候補記録を生成してもよく、これは、次いで、CRMによってさらに処理され、一式の引用推奨データをもたらす。さらなる変形例では、PPMは、第1の出力に到達したとき、検討のために、TAMに送達されるデータまたはフィルタ基準を含んでもよく、PPMは、CRMに送達された両出力を用いて、さらなる第2の出力を生成してもよい。
引用推奨モジュールは、1つ以上の推奨される参考文献または参考引用のリスト、1つ以上の推奨される検索結果または保存されたクエリのリスト、ユーザから入力を要求するシステム応答のうちの少なくとも1つを生成してもよい。一様式では、少なくとも1つの引用を含む一式の引用推奨データが、一式の引用推奨データを処理して少なくとも1つの引用の表現をディスプレイに提示するために、クライアントデバイス130(図1)または211(図2)に通信される。例えば、提示される一式の引用推奨データは、推奨される引用のリストを含むGUIの形態であってもよく、その引用のリストから、ユーザは、著作中の文書内に含めるための所望の引用を選択する。システムは、クライアントデバイスから信号を受信し、信号は、一式の引用推奨データと関連付けられた選択を含む。
クライアントデバイス130は、個人プロファイル記録と関連付けられたユーザアカウント下で動作し、個人プロファイルモジュールは、ユーザアカウントを認識し、個人プロファイル記録内に含まれるデータに少なくとも部分的に基づいて、第2の出力を生成する。個人プロファイルモジュールは、ユーザ相互作用を監視するため、使用関連データを記憶するため、および、使用関連データと特定のユーザを関連付けるために使用されてもよく、本使用データは、第2の出力を生成するときまたはTAM出力を修正するときに使用されてもよい。ワード処理統合モジュールが、テキスト分析モジュール、個人プロファイルモジュール、および推奨モジュールとワードプロセッサアプリケーションとを統合するために含まれてもよい。ワード処理統合モジュールは、ローカルクライアント処理デバイス上にインストールするためのアドインまたはプラグインモジュールの形態であってもよい。アクティブ化モジュールは、プラグインモジュールの動作を開始するために使用されてもよい。
ローカルクライアント処理デバイスは、本発明の動作と関連付けられたグラフィカルユーザインターフェースを提示し、そのインターフェースは、一式の引用推奨データと関連付けられたユーザ選択を取り扱うためのユーザ選択要素を備える。アドインを通して、ローカルクライアント処理デバイス上で動作するワードプロセッサアプリケーションは、受信されたユーザ選択を処理する。ユーザ選択に基づいて、アドインは、選択された推奨される引用をワードプロセッサによって動作される文書中に自動的に含める。
システムは、一式の少なくとも1つの出典データベースとインターフェース接続するように適合された出典データベースモジュールを含んでもよい。一式の少なくとも1つの出典データベースは、例えば、一式のフルテキストファイル、一式のメタデータ記録、データベース要素を接続する一式のリンク、外部ソースデータベースへの一式のリンクのうちの1つ以上を含む。一式の少なくとも1つの出典データベースは、Web of Science、Web of Knowledge、National Library of Medicine PubMed、CrossRef、BIOSIS、Dialog、library OPACS、Medline、ProQuest、Ovid、Ebsco、WilsonWeb、ResearchGate、およびジャーナル構成外部データベースといったデータベースのうちの少なくとも1つを含む。システムは、ユーザインターフェースを提示し得、テキスト分析に基づいて検索するために、1つ以上の出典データベースのユーザ選択を表す入力を受信してもよい。データベースの選択は、フルテキスト検索および/またはメタデータあるいは擬似文書もしくは代理検索をもたらしてもよい。
通信または電子メールモジュールは、引用推奨データを宛先アプリケーションに通信する。ツール統合モジュールは、少なくとも1つの参考文献ツールと統合し、少なくとも1つの参考文献ツールからの少なくとも1つの引用に関する引用データを受信し、一式の引用推奨は、受信された引用データからの少なくともいくつかのデータを含む。
引用位置検索
本発明のアプリケーションの1つが、以下に説明される。学術的機関誌記事の著者または学問研究者が新しい論文を執筆しているとき、引用可能参考文献の検索は、通常、既知の著者および機関誌の調査、書名検索、文献検索、ならびに専門家組織および大学リポジトリの調査を伴う。引用推奨システムは、著者が過去の関連著作物を見つけることを支援する。CRMの実施は、引用ネットワーク、コーパス統計、キーワードおよび技術用語を抽出するためのテキストマイニング等を伴ってもよい。
特に着目される1つの方法は、引用位置または生じる引用の周囲の参照テキストを利用するものである(以下の例参照)。例えば、本アプローチは、準備書面を草稿中の弁護士に判例引用を推奨する、法律分野のための製品において使用されてもよい。基本概念として、論文は、いくつかの論題または研究成果を含み得るが、多くの場合、これらの論題の一部のみ引用される。一式の参照テキスト(または、引用位置)は、著者の団体が論文を引用する理由を表す。それは、なぜ論文が重要であるかのその集合的判断を捉えている。引用位置を検索する付加利益は、当該文書の用語不整合の影響を軽減させ得ることである。
関連引用を見つける際の引用位置の利用は、フルテキストとは対照的に、参照テキストを検索する様式を表し、フルテキスト検索の代替ならびにフルテキスト検索の拡張として使用されてもよい。文書の引用位置は、理想的には、その文書を参照する全引用テキストの本文である。例えば、イタリック体で示されるその参考文献に直接関連するテキストとして先行する文を伴う引用[3]として以下の抜粋1−3に示されるように引用された記事を検討する。
抜粋 1−
Figure 2015527641
抜粋 2−
Figure 2015527641
抜粋 3−
Figure 2015527641
例えば、引用位置を引用に先行する文であると定義すると、この一式の3つの参考文献文書からの引用[3]の引用位置は、
Figure 2015527641
となる。このように、記事[3]のフルテキストを検索するのではなく、検索は、他の論文中の記事[3]の引用に関連する参照テキストに関連する他の記事中のテキストに基づく。要するに、参照テキストから連結された「擬似文書」または「代理」文書の検索によって、合致または推奨に辿り着く。代替として、引用位置に続くテキストが、直観的にその先行するテキストに関連する可能性があまり高くないが、本プロセスにおいて検討されてもよい。学術的記事の引用位置検索の特定の実施は、試験された有効性に基づいて、洗練されてもよい。
本タイプの参照テキスト検索およびローカルワード処理アプリケーションとの統合と関連付けられた技法は、米国出願公開第2012/0036125号「METHOD AND SYSTEM FOR INTEGRATING WEB−BASED SYSTEMS WITH LOCAL DOCUMENT PROCESSING APPLICATIONS」(その内容は、参照することによって全体として本明細書に組み込まれる)において論じられている。
ある動作様式では、文書の1つ以上のコーパスの前処理によって、引用位置参照テキストに基づく検索コレクションをもたらす。1つ以上のコーパスは、着目分野またはフィールドに基づいて選択されてもよい。例えば、テキストマイニング研究のために、BioMed Centralオープンアクセスフルテキストコーパスを使用する。コーパスは、生物医学分野における査読済研究論文のうちの約120,000の論文から成る。
引用位置コレクション−引用位置検索コレクションを構築するために、前処理として、BioMed Centralコーパステキストを詳しく検討する。文書の引用が見つかると、検索データベースは、文書の引用テキストを保存する。コーパス全体の詳細検討の結果、コーパス中に少なくとも1つの引用を有する、各文書に対してBioMed Central内の全引用テキストを含む新しい文書が生じる。このように、参照テキストは、引用位置検索コーパスをもたらすように連結される。
本アプローチの有効性を試験するために、標準的フルテキスト検索が、オリジナルコーパスに対して行なわれ得、同一の一式のクエリを使用して、引用位置コーパスに対して行なわれた引用位置検索と比較されてもよい。結果は、引用位置の検索の有効性を決定し、かつ技法に対する修正を決定するために評価されてもよい。一例では、引用の前に生じる設定単語数または他の区切り(先行する文等)として、引用位置を定義することから開始する。例えば、数百例のそのような場所をランダムに選択および検討することは、引用位置の定義(すなわち、単語の数および位置)を修正し、有効性を改善することにつながり得る。本技法の有効性は、多様であり、オリジナルコーパスの性質および着目主題フィールドに依存し得る。引用位置コレクションは、検索プラットフォーム、例えば、Thomson Reuters Novus検索プラットフォーム上で処理するためにロードされてもよい(その側面は、米国出願公開第US2005/0004898号「DISTRIBUTED SEARCH METHODS ARCHITECTURES, SYSTEMS, AND SOFTWARE」(その内容は、参照することによって全体として本明細書に組み込まれる)に説明されている)。
フルテキストおよび引用位置検索に加え、代替テキスト分析は、協調フィルタリング(例えば、著者および論文に関して)、引用ネットワーク(例えば、共引用)、コーパス統計(例えば、特定の論文、著者、機関、著者間の関係、共同著作者等に関する以前の引用)、文書構造(例えば、文献レビュー対方法説明)、文書に対する引用関連性、著者プロファイル(著者と関連付けられた専門用語)、専門用語を識別するためのテキストマイニング等を含んでもよい。
図1は、クライアントデバイスに存在するネイティブオペレーティングシステムまたはローカルで動作するワードプロセッサ等の文書処理システムと統合するように適合されたオンライン情報読出および分析システムを備える例示的統合システム100を示す。本例示的実施形態では、システム100は、クライアントアクセスデバイス130上の拡張文書処理アプリケーションの1つ以上の側面を自動的に制御し得る少なくとも1つのウェブサーバ120を含む。文書処理アプリケーション1392、例えば、Microsoft Wordアプリケーションは、アドオンフレームワーク1393を用いて拡張され、アドオンフレームワーク1393は、アプリケーションのグラフィカルユーザインターフェースに統合され、ブラウザコントロールを含み、ブラウザコントロールは、1つ以上のウェブベースのアプリケーションにアクセスし、ウェブベースのアプリケーションまたはサービスのマクロタイプスクリプトが、文書処理アプリケーションを制御することを可能にし得る。システム100は、1つ以上のデータベース110と、1つ以上のサーバ120と、1つ以上のアクセスデバイス130とを含む。
データベース110は、一式の一次データベース(PDC)112と、一式の二次データベース(RTC)114と、一式のメタデータデータベース116とを含み、研究者、学生、医師、弁護士、および他の専門家等のユーザによって依拠されるリソースを表す。一次データベース112は、例示的実施形態では、独占的、登録制、またはThomson Reuters Corporation等のサービスプロバイダの内部にあってもよく、例えば、Wos/WoKデータベース1121、Cortellus1122、およびTR Innovationデータベース(単数または複数)1123を含む。二次データベース114は、外部または公共のものであってもよく、ユーザグループにさらなる着目リソースを提示し、一次データベースによってもたらされるものに出典を補足してもよい。本例では、二次データベースは、PubMedデータベース、1141と、AMJURデータベース1142と、Crossref.orgデータベース1143とを含む。メタデータデータベース116は、例えば、引用関係、要約、リンク、分類データ、および他のソースデータを含む。実施形態は、法律、研究、金融、科学、または医療の情報を含むデータベースを含んでもよい。
データベース110は、1つ以上の電子、磁気、または光学データ記憶デバイスの例示的形態をとり、個別のインデックス(図示せず)を含むか、または別様にそれと関連付けられる。インデックスのそれぞれは、対応する文書アドレス、識別子、および他の従来の情報と関連する用語および語句を含む。データベース110は、ローカルネットワーク、ワイドネットワーク、プライベートネットワーク、または仮想プライベートネットワーク等の無線または有線通信ネットワークを介して、サーバ120に結合されるか、または結合可能である。
サーバ120は、関連付けられたアプレット、ActiveX制御、リモート呼び出しオブジェクト、または種々の「厚さ」のサービスクライアントと関連する他のソフトウェアおよびデータ構造を用いて、概して、ウェブページの形態または他のマークアップ言語形態において、データを供給するための1つ以上のサーバを表す。より具体的には、サーバ120は、プロセッサモジュール121と、メモリモジュール122と、加入者データベース123と、一次検索モジュール124と、メタデータ検索モジュール125と、ユーザインターフェースモジュール126とを含む。プロセッサモジュール121は、1つ以上のローカルまたは分散プロセッサ、コントローラ、あるいは仮想マシンを含む。例示的実施形態では、プロセッサモジュール121は、任意の便宜的または望ましい形態をとる。メモリモジュール122は、1つ以上の電子、磁気、または光学データ記憶デバイスの例示的形態をとり、加入者データベース123と、一次検索モジュール124と、二次検索モジュール125と、ユーザインターフェースモジュール126とを記憶する。
本発明によると、引用検索および推奨モジュール127は、サーバ120および/またはクライアントアクセスデバイス130のいずれかにおいて、全体的または部分的のいずれかで実行される実行可能コードを含み、サーバ120および/またはクライアントアクセスデバイス130は、文書から受信された一式の選択されたテキストにテキスト分析を行い、かつ、個々のユーザまたは共同研究者グループに関連する個人プロファイル(記録等)に分析を行なうことにより、一式の推奨される引用に辿り着くように適合され、一式の推奨される引用から、引用が、機関誌において発表するための提出用研究論文等の作業文書に挿入するために選択され得る。本機能性は、以下に詳細に論じられる。
加入者データベース123は、データベース110の従量制アクセスまたは登録制アクセスを制御、運営、および管理するための加入者関連データを含む。例示的実施形態では、加入者データベース123は、1つ以上のユーザ選好(または、より一般的には、ユーザ)データ構造を含む。例示的実施形態では、ユーザデータ構造の1つ以上の側面は、種々の検索およびインターフェース選択肢のユーザカスタマイズに関する。この目的を達成するために、いくつかの実施形態は、文献目録情報、組織機関(例えば、大学、企業、社会等)、実践または調査または研究の分野(例えば、喘息、アレルギー)、および過去の出版物等のユーザプロファイル情報を含む。ユーザデータ(1231A−E)は、ユーザの資格を認証し、登録制のリソースまたはワークスペースへのアクセスを許可するために使用されてもよい。複数のプラットフォームおよび/またはサービスあるいはリソースにわたるシームレスなアクセスのために、統合認証情報サービス、例えば、Thomson Reuters’ OnePassソリューションが、使用されてもよい。
一次検索モジュール124は、データベース110のうちの1つ以上に対してデータを受信および処理するために、1つ以上の検索エンジンと、関連ユーザインターフェースコンポーネントとを含む。例示的実施形態では、検索モジュール124と関連付けられた1つ以上の検索エンジンは、Boolean、tf−idf、自然言語分析能力を提供する。二次モジュール125は、データベース114のうちの1つ以上に対してデータを処理するための1つ以上の検索エンジンを含む。
情報統合ツール(IIT)フレームワークモジュール126(または、ソフトウェアフレームワークまたはプラットフォーム)は、ソフトウェアおよび関連ユーザインターフェースを全体的または部分的に定義するための機械読み取り可能かつ/または実行可能な命令セットを含み、ソフトウェアおよび関連ユーザインターフェースは、1つ以上の文書処理アプリケーションと統合または協働する、その1つ以上の部分を有する。例示的文書処理(または、文書著作または編集)アプリケーションは、ワード処理アプリケーションと、電子メールアプリケーションと、プレゼンテーションアプリケーションと、スプレッドシートアプリケーションとを含む。例示的実施形態では、これらのアプリケーションは、1つ以上のアクセスデバイス、例えば、デバイス130上に提供される。
アクセスデバイス130は、サーバまたはデータベースとの効果的なユーザインターフェースを提供することが可能なパーソナルコンピュータ、ワークステーション、パーソナルデジタルアシスタント、携帯電話、または任意の他のデバイスの形態をとってもよい。具体的には、アクセスデバイス130は、プロセッサモジュール131(1つ以上のプロセッサ(または、処理回路)131)と、メモリ132と、ディスプレイ133と、キーボード134と、グラフィカルポインタまたはセレクタ135とを含む。プロセッサモジュール131は、1つ以上のプロセッサ、処理回路、またはコントローラを含む。例示的実施形態では、プロセッサモジュール131は、任意の便宜的または望ましい形態をとる。メモリ132が、プロセッサモジュール131に結合される。
メモリ132は、オペレーティングシステム136と、ブラウザ137と、文書処理ソフトウェアを含む、アプリケーションソフトウェア138とのためのコード(機械読み取り可能または実行可能な命令)を記憶する。例示的実施形態では、オペレーティングシステム136は、あるバージョンのMicrosoft Windows(登録商標)オペレーティングシステムの形態をとり、ブラウザ137は、あるバージョンのMicrosoft Internet Explorerの形態をとる。オペレーティングシステム136およびブラウザ137は、キーボード134およびセレクタ135から入力を受信するだけではなく、ディスプレイ133上のグラフィカルユーザインターフェースのレンダリングを支援することも行う。例示的実施形態では、文書処理ソフトウェア138は、1つ以上のワード処理アプリケーション、例えば、Microsoft Word処理ソフトウェア、Powerpointプレゼンテーションソフトウェア、Excelスプレッドシートソフトウェア、およびOutlook電子メールソフトウェアを含む。文書処理ソフトウェア1392は、例えば、ISPとの確立された有線または無線通信リンクを介して、例えば、サーバ120からダウンロードされ得る情報統合ツールと統合されてもよい。文書処理ソフトウェアの立ち上げに応じて、統合文書処理および情報読出グラフィカルユーザインターフェース139が、メモリ132内で定義され、ディスプレイ133上にレンダリングされる。レンダリングに応じて、インターフェース139は、1つ以上の双方向制御特徴(または、ユーザインターフェース要素)と関連して、データを提示する。例示的実施形態では、これらの制御特徴はそれぞれ、ハイパーリンクまたは他のブラウザ互換性コマンド入力の形態をとる。いくつかの制御特徴のユーザ選択は、インターフェース139の領域内の対応する文書の少なくとも一部の読み出しおよび表示をもたらす。領域は、同時にまたは別個の時に表示されてもよい。
インターフェース139は、文書処理ツールバー領域1391と、文書処理(編集および表示)領域1392と、統合情報領域(単数または複数)1393とを含む。例示的実施形態では、領域1393は、サーバ120およびデータベース110によって提供される、1つ、2つ、またはそれ以上のウェブアプリ(または、ローカルでサポートされるアプリ)、具体的には、モジュール126のウェブアプリおよびフレームワークコンポーネントのリストのような外部コンテンツおよびサービスのための制御および表示要素を含む。領域1393は、文書処理(アクティブ編集)ウィンドウ1392にロードされた文書の著作に関連するタスクの完了に関連するメタデータコンテンツのための制御および表示要素を含む。いくつかの実施形態では、領域1393は、ユーザダッシュボードの形態をとり、文書処理アプリケーションを立ち上げたユーザに関連する特定のワークフロー情報および制御要素、および/またはユーザによってアクセス可能な一般的ワークフロー情報を含む。いくつかの実施形態では、ユーザは、領域1393内のワークフローステップまたはタスクを選択し、モジュール126のコンテンツまたは利用可能なツールおよびサービスのアップデートを開始してもよい。
また、例示的実施形態では、情報統合ツールは、ローカルデスクトップツールを含む。これらのツールは、モジュール126の例示的ソフトウェアプラットフォームまたはフレームワークを通して、サーバ120から利用可能となってもよい。以下により詳細に論じられるように、ツール、API、およびソフトウェアの1つ以上の部分が、アドオンまたはアドインフレームワークおよび一式の関連付けられたAPIとして、ホストアプリケーション138にダウンロードおよびインストールされる。例示的実施形態では、フレームワークは、概して、ユーザデスクトップワークフローシナリオにおいて動作するアプリケーションを構築することを可能にする。例示的フレームワークまたはプラットフォームは、以下の層またはサイロに分類されることができる。フック:コンテナを起動するためのMS Wordワード処理アプリケーションにおけるツールバーボタン等のホストアプリケーションにおけるメカニズム。コンテナ:特徴アプリケーションが提供される、MS Wordアプリケーションにおけるコマンドバーオブジェクト等のエリア。アプリケーション:特定の一式の特徴をサポートする特徴アプリケーション。サービスブロック:特徴アプリケーションが活用し得る、インフラストラクチャ要素。
フックは、例示的実施形態では、ユーザが、ホストアプリケーションからコンテナを開くためのメカニズムとして設計される。フック自体は、内部にロードされ、ホストアプリケーションが、次いで、コンテナをロードする。フックはまた、コンテンツを閲覧するための均一な方法を導入する。フックは、アプリケーションプログラミングインターフェース(API)の使用を通して、ホストアプリケーション内の特定の開いている文書のデータに辿り着き、それを抽出し、かつ/またはそれを挿入する方法を提供する。ホストアプリケーションは、任意のMicrosoftデスクトップアプリケーション、WordPerfect、Adobe Professional、またはウェブブラウザ(例えば、Internet Explorer、Netscape、FireFox等)であり得る。一例では、ホストアプリケーションは、Microsoft Wordである。例示的実施形態は、全てのサポートされるWordバージョンのための単一アドインを提供する。本サポートを達成する1つの方法は、同一のコードがWordの全バージョンに対して機能することを可能にするために、バージョン固有のライブラリ内へのリフレクションの使用に基づいて、抽象化層を追加することである。抽象化層は、最新バージョンに基づき、必要に応じて、以前のサポートされていたメソッド呼び出しに戻る。また、機能性がWordバージョンに欠如しているときは、率直に機能を停止する。加えて、層は、ロードするべき正確なバージョン固有ライブラリを決定するためのアドインへの変更およびリフレクションを使用したWordオブジェクトモデルへの全メソッド呼び出しを実施する。
ソフトウェアプラットフォームのホストアプリケーション統合のために、多くのインターフェースが、コンテナのためのユーザインターフェース(UI)専有面積を提供するために、ホストアプリケーションを補助する、フックを含むため、および統合メカニズム自体を提供するためのサポートを提供する。UI専有面積は、コンテナおよびツールバーボタンのために確保された画面上のエリアである。ホストアプリケーションは、本スペースを作成すること、および、Forms.DynamicContainerのインスタンスを作成することに関与する。概して、ウィンドウが、DynamicContainerの親として作成される。加えて、ホストは、DynamicContainerのためのエリアをサイズ調整する能力を提供することに関与する。
一例では、ソフトウェアプラットフォームは、コアにおいてCommon Language Runtime(CLR)を有する、マネージ.Netプロダクトであり、ホストプロセスにロードされる。CLRは、メタデータを実行することによってサービスを提供する、ソフトウェア開発のためのプラットフォームである。一実施形態では、ソフトウェアプラットフォームは、C++/COMを使用して、アンマネージホスト統合を作成するためのサポートおよび支援を提供する。COMベースの言語から、CLRLoaderは、CLRをプロセスにロードし、別個のアセンブリ内の指定されるマネージクラスを起動し、マネージコードおよびアドイン実装の残りにブリッジするために使用されることができる。CLRLoaderは、標準的COMメソッド(CoCreateInstance( )etc)を使用して作成され得る、COMオブジェクトである。それは、CLRを開始するインターフェースを提供し、構成ファイル内に提供される情報とともに、アセンブリからマネージクラスをロードすることができる。CLRLoaderによって作成されるマネージクラスは、HostShim Attributeが与えられなければならず、ユーザは、ボイドを返し、単一「オブジェクト」パラメータを有する、「Configure」と呼ばれるメソッドを定義しなければならない。ソフトウェアプラットフォームホストアプリケーションは、インターフェースを実装するはずである。加えて、プロジェクト(ファイルdocument.cs)内に定義されるインターフェースは全て、一式のクラス上に実装され、ホストアプリケーションの文書コンテンツへのアクセスを提供する。
いくつかの例示的実施形態では、コンテナは、特徴アプリケーションの特徴および機能を提供するように設計される。しかしながら、いくつかの実施形態は、特徴アプリケーション自体を提供する。ブラウザコントロールまたはミニ埋込ブラウザが、コンテナ内に提供される。ブラウザコントロールは、アプリケーションユーザインターフェース(UI)レンダリングおよびスクリプト実行を行なう。例示的ブラウザコントロールは、Internet Explorerであるが、任意のウェブブラウザまたは均等物も、同様に、容認可能である。UIレンダリングとは、コンテナ内に特徴アプリケーションのユーザインターフェースを表示することを指す。特徴アプリケーションUIは、htmlおよびCascading Style Sheet(CSS)を使用して開発されるが、いくつかの実施形態は、ASP.Netページ、Silverlightアプリケーション、Adobe Flashアプリケーション等の他のブラウザに基づいた技術を使用する。特徴アプリケーションの機能性の多くは、JavaScript(登録商標)プログラミング言語において実装される。スクリプトを読み取り、JavaScript(登録商標)プログラム内に定義される要求動作を行なうJavaScript(登録商標)実行エンジンが、ブラウザコントロールに埋め込まれる。
特徴アプリケーションは、ソフトウェアプラットフォームおよび機能性を再使用することを意図して設計される。それらは、独立して開発されるが、ソフトウェアプラットフォームコンポーネントに依存してもよい。例えば、1つのアプリが、フラグを挿入および更新する。ソフトウェアプラットフォームが、通信サービスブロックおよび診断サービスブロック(以下にさらに詳細に説明されるサービスブロック)を既に有すると仮定すると、通信サービスブロックは、フラグ情報を収集するために使用され得、診断サービスブロックは、トレーシングおよびロギングをアプリケーションに追加し、かつ例外処理をアプリケーションに追加するために使用され得る。
別の例示的特徴アプリケーションは、参照される文書へのリンク付けを提供する。本特徴アプリケーションは、Office Integrationに依拠し、Word内で焦点が当てられた文書へのハンドルを提供する。アプリケーションはまた、分析のために、参照される文書を選択する能力を含むはずである。ソフトウェアプラットフォームを伴う診断サービスブロックは、トレーシングおよびロギングをアプリケーションに追加し、かつ例外処理をアプリケーションに追加するために使用され得る。
ソフトウェアプラットフォームコンテナ内に提供され得るアプリケーションを開発するための種々の方法が存在する。少なくとも、例示的実施形態では、ユーザは、UIのためのHTMLページが存在するソフトウェアプラットフォームおよびHTML UI自体を通知するXML特徴ファイルを提供する必要がある。特徴XMLファイルは、所与の特徴/アプリケーションのための主要UIのURLを含む単純XML文書である。それは、ルート要素“ ”、単一子要素“ ”から成り、そのコンテンツは、アプリケーションのHTMLユーザインターフェースのURLである。本特徴XMLファイルは、ユーザのデスクトップに展開される。UIは、静的HTMLページまたは他のウェブアプリケーション言語の形態をとることができる。inject.csスクリプトファイルのためのスクリプトタグの包含は、HostおよびServiceLocatorのデスクトップに挿入された項目へのアクセスを容易にする。ServiceLocatorは、名称別に、他のデスクトップサービスのインスタンスを作成するために使用される。UI位置は、コンテナによって制約され、したがって、UIの設計に影響を及ぼす。
アプリケーションがソフトウェアプラットフォームホストアプリケーション内からコンテンツにアクセスする必要がある場合、例示的実施形態は、ソフトウェアプラットフォーム主要ウェブパッケージの一部である2つのJavaScript(登録商標)ファイル(inject.csおよびLoad.cs)を参照する。JavaScript(登録商標)は、提供されるデスクトップサービスと相互作用する。これは、「ホスト」オブジェクトならびに「ロケータ」ServiceLocatorオブジェクトへのJavaScript(登録商標)参照へのアクセスを与える。最後に、アプリケーションがデスクトップサービスを提供する場合、サービス実装(ソフトウェアプラットフォームの例示的サービス実施のセクションを参照)は、インストール可能パッケージ内に提供される。
特徴アプリケーションは、それらの特徴アプリケーションのサービスの再使用性および公開を意図して設計されているサービスブロックを呼び出す。言い換えると、サービスブロックの目的は、ローカル再使用可能コンポーネントを特徴アプリケーションに供給することである。その機能性は、JavaScript(登録商標)を介して、および/または必要な.Netアセンブリを参照して、アクセスされることができる。活用され得るアプリケーション構築プラットフォームコンポーネントの例は、米国出願公開第2010/0115401号「SYSTEM AND METHODS FOR WEB−BASED CONTROL OF DESKTOP APPLICATIONS」(参照することによって全体として本明細書に組み込まれる)により完全に詳述および記載されている。
本発明を使用してシステムを動作させる一実施形態では、アドオンフレームワークが、インストールされ、サーバ120上の1つ以上のツールまたはAPIが、1つ以上のクライアントデバイス130上にロードされる。例示的実施形態では、これは、ユーザが、アクセスデバイス130等のクライアントアクセスデバイス内のブラウザをWestlawシステム等のオンライン情報読出システムのためのインターネットプロトコル(IP)アドレスに向け、次いで、ユーザ名および/またはパスワードを使用して、システムにログオンすることを伴う。正常なログインは、ウェブベースのインターフェースがサーバ120から出力され、メモリ132内に記憶され、クライアントアクセスデバイス130によって表示されることをもたらす。インターフェースは、1つ以上のアプリケーションのための対応するツールバープラグインとともに、情報統合ソフトウェアのダウンロードを開始するための選択肢を含む。ダウンロード選択肢が開始される場合、ダウンロードアドミニストレーションソフトウェアが、クライアントアクセスデバイスが情報統合ソフトウェアと互換性があることを保証し、アクセスデバイス上のどの文書処理アプリケーションが、情報統合ソフトウェアと互換性があるかを検出する。ユーザ承認によって、適切なソフトウェアが、クライアントデバイス上にダウンロードおよびインストールされる。一つの代替では、中間「ファーム」ネットワークサーバが、内部プロセスを使用して、1つ以上のクライアントデバイス130上にロードするために、フレームワーク、ツール、API、およびアドオンソフトウェアのうちの1つ以上を受信してもよい。
いずれかの方式でインストールされると、ユーザは、次いで、文書処理アプリケーションの文脈において、オンラインツールインターフェースを提示され得る。例示的実施形態では、これは、ユーザが、Microsoft Wordワード処理アプリケーション、Corel WordPerfectワード処理アプリケーション、Internet Explorerブラウザアプリケーション、Adobe Acrobatデスクトップパプリッシングアプリケーション、およびMicrosoft Outlook電子メールアプリケーションといった独立アプリケーションのうちの1つ以上を使用して、文書を立ち上げ、かつ、開き、または、作成することを伴う。本明細書で使用される場合、「ワードプロセッサ」および「ワード処理アプリケーション」は、「文書プロセッサ」および「文書処理アプリケーション」を広義に指し、「ワード」および「文書」の使用は、通信ユニットの文脈において、広義の意味を与えられ、電子メール、および、電子通信または情報コンテナの他の別個の形態のような形態を含むはずである。これらのアプリケーションのうちの1つ以上のためのアドオンソフトウェアは、同時に起動され、順に、アドオンメニューの提示をもたらす。アドオンメニューは、ウェブサービスあるいはアプリケーションおよび/またはローカルに提供されるツールあるいはサービスのリストを含む。ユーザは、ツールインターフェースを介して(例えば、ポインティングデバイスを介して手動で)選択する。選択されると、選択されたツール、またはより正確には、その関連付けられた命令が、実行される。例示的実施形態では、これは、サーバ120上の対応する命令またはウェブアプリケーションとの通信を伴い、順に、アドオンフレームワークの一部として、ホストアプリケーション上に記憶された1つ以上のAPIを使用して、ホストワード処理アプリケーションの動的スクリプティングおよび制御を提供し得る。
例えば、ユーザは、ホストアプリケーション(すなわち、Microsoft Word、WordPerfect等)を立ち上げ、文書、例えば、研究論文に取りかかる。ワードプロセッサソフトウェアフレームワーク(WSF)インターフェースは、アドオンとしてホストアプリケーション(例えば、App138)にロードされ得る、コード、アドオン、またはモジュールを含む。これは、WSF Document API、WSF Application Containerをロードし、インストールされたApplication Listを初期化し、UI要素(Ribbon、ツールバー、メニュー項目等)を作成する。ユーザは、文書を開き、統合UI要素を介して提示されたアプリケーションのリストから所望のWSF Applicationを選択する。WSFは、WSF Container内にアプリケーションを表示し、埋め込まれたブラウザをアプリケーションベースのURL(サーバ120、IITモジュール126の適切な部分)にナビゲートする。WSFアプリケーションは、インストールされ得、例えば、Local HTA(すなわち、ローカルにインストールされたHTML、JS、CSS等)、Enterpriseウェブアプリケーション(イントラネットまたはエクストラネット)、またはインターネットウェブアプリケーションとして実行することができる。WSFは、アプリケーションJavaScript(登録商標)からアクセスするために、WSF Document API参照をJavaScript(登録商標)実行エンジンに挿入する。ディスプレイ内の文書(ワード処理アプリケーション等のホストアプリケーションのアクティブ編集ウィンドウ)は、WSF内のアプリケーションのコンテキストを保存する(すなわち、各文書は、ユーザ選好に基づいてカスタマイズされ得る、WSFのその独自のインスタンスを有する)。
WSF JavaScript(登録商標)実行エンジンは、アプリケーションコードを実行させる。アプリケーションは、WSF APIを使用して、開いているホスト(すなわち、Microsoft Word、WordPerfect等)文書のコンテンツにアクセス(これらの文書への修正を含む)することができる。クライアントに曝されるWSF APIは、文書固有データにアクセスするためのAPIメソッドを含む、Open Documentのコレクションと、段落、脚注、巻末注、出典表、ハイパーリンク、画像、および特定の開いている文書中の多くの他の文書コンテンツオブジェクトのコレクションと、文書内の所与のテキスト位置を表すための位置オブジェクトとを作成する能力を含むが、これらに限定されない。
アプリケーションによって呼び出されるWSF APIメソッドは、順に、ホストアプリケーション(例えば、Microsoft Word)によって曝されるメソッドを読み出す。これらの呼び出しが行なわれる様式は、ホストアプリケーション固有であり、ホストアプリケーションによって曝される機能に依存する。WSFは、その独自のAPIとホストによって曝される機能性との間のマッピングを管理する。加えて、アプリケーションは、ネイティブブラウザ能力および他のWSF機能性を使用して、エンタープライズ(イントラネットまたはエクストラネット)において、またはインターネットを経由して、ホストマシン上でローカルに利用可能なウェブサービスと通信することができる。
図2は、ハードウェアおよびソフトウェアと通信ネットワークキングとの組み合わせと併せて実施される、本明細書に説明されるプロセスを実施するための例示的システム200の別の表現を図示する。本例では、システム200は、文書中に挿入するための一式の推奨される引用を検索、読み出し、分析、および提示するためのフレームワークと、ユーザ加入権、アクセス、および使用を監視ならびに追跡し、拡張サービスを加入ユーザに提供することと関連付けられたツールおよびソフトウェアをダウンロードするためのシステムとを提供する。システム200は、情報または専門サービスプロバイダ(ISP)(例えば、種々のThomson Reuters Corporationエンティティ)が供給するシステム204と併用され得、本明細書に前述されるような情報統合およびツールフレームワークおよびアプリケーションモジュール126を含んでもよい。さらに、本例では、システム200は、ネットワークサーバ202、データベース、例えば、WoS/WoK203を備える中央ネットワークサーバ/データベース設備201と、テキスト分析モジュール(TAM)206、個人プロファイルモジュール(PPM)207、およびシステム分析モジュール(SAM)208を含む検索/分析モジュール209をコンポーネントとして有する引用推奨モジュール(CRM)205とを含む。中央設備201は、例えば、ネットワーク226(例えば、インターネット)を介して、遠隔ユーザ210によってアクセスされてもよい。システム200の側面は、インターネットまたは(World Wide)ウェブベースのコンポーネント、デスクトップベースのコンポーネント、あるいはアプリケーションウェブ対応コンポーネントの任意の組み合わせを使用して可能とされてもよい。遠隔ユーザシステム210は、本例では、コンピュータ211に関して示されるように、システムメモリ212、オペレーティングシステム214、アプリケーションプログラム216、グラフィカルユーザインターフェース(GUI)218、プロセッサ220、および電子文書等の電子情報224を含み得る記憶装置222を含むハードウェアおよびソフトウェアの典型的な組み合わせを備え得るコンピュータ211(例えば、PCコンピュータまたは同様のもの)を介して動作するGUIインターフェースを含む。遠隔ユーザ210は、文書中に含まれるテキストを選択し、選択されたテキストセグメントに合致する、一式の提案または推奨される引用を模索する形態において、研究補助を求めてもよい。引用推奨機能性は、CRM205によって提供される。中央設備に存在するように示されるが、引用推奨機能性は、分散されてもよく、GUI/アドインエリア218内のようにクライアントデバイス211に存在するクライアント側アドインまたはプラグインによる動作を含んでもよい。
クライアント側アプリケーションソフトウェアは、機械読み取り可能な媒体上に記憶され、例えば、コンピュータ211のプロセッサ220によって実行される命令を備えてもよく、ウェブベースのインターフェース画面の提示は、ユーザシステム210と中央システム211との間の相互作用を促進する。オペレーティングシステム214は、本明細書に説明されるシステム201およびブラウザ機能性、例えば、適切なサービスパックを伴う、Microsoft Windows(登録商標) Vista(ビジネス、エンタープライズ、およびアルティメットエディション)、Windows(登録商標) 7、またはWindows(登録商標) XP Professionalと併用するために好適であるはずである。システムは、遠隔ユーザまたはクライアントマシンが、最小閾値レベルの処理能力、例えば、Intel Pentium(登録商標) III、速度、例えば、500MHz、最小メモリレベル、および他のパラメータと適合可能であることを要求し得る。
これまで説明された構成は、多くのもののうちの一部であり、本発明に関する限定ではない。中央システム201は、LAN、WLAN、Ethernet(登録商標)、トークンリング、FDDIリング、または他の通信ネットワークインフラストラクチャを経由するような、サーバ、コンピュータ、およびデータベースのネットワークを含んでもよい。例えば、無線、LAN、WLAN、ISDN、X.25、DSL、およびATMタイプネットワークのうちの1つまたはそれらの組み合わせのようないくつかの好適な通信リンクのいずれかが、利用可能である。システム201と関連付けられた機能を行なうためのソフトウェアは、デスクトップまたはサーバまたはネットワーク環境内の内蔵アプリケーションを含んでもよく、SQL2005以降またはSQL Express、IBM DB2、あるいは他の好適なデータベース等のローカルデータベースを利用して、文書、コレクション、そのような情報の処理と関連付けられたデータを記憶してもよい。例示的実施形態では、種々のデータベースは、関係データベースであってもよい。関係データベースの場合、種々のデータのテーブルが、作成され、データは、SQLまたは当技術分野において公知のいくつかの他のデータベースクエリ言語を使用して、これらのテーブルに挿入され、および/またはこれらのテーブルから選択される。テーブルおよびSQLを使用するデータベースの場合、例えば、MySQLTM、SQLServerTM、Oracle 8ITM、10GTM、またはいくつかの他の好適なデータベースアプリケーションのようなデータベースアプリケーションが、データを管理するために使用されてもよい。これらのテーブルは、当技術分野において公知のように、RDSまたはObject Relational Data Schema(ORDS)に編成されてもよい。
一例では、コンピュータ211を使用する著者は、文書レンダリングまたは処理アプリケーション216を実行する。本発明の一実施形態によると、文書レンダリングアプリケーション216は、MICROSOFT WORDTM等のテキストおよび同様の混合メディア文書を草稿するために使用されるワードプロセッサである。代替として、文書レンダリングアプリケーションは、MICROSOFTまたはBare Bones Software, Inc.製BBEDITTMによって提供されるようなHTMLテキストエディタを備えてもよい。実際、テキストデータファイルを操作およびレンダリングするために設計されたソフトウェアシステムは全て、本発明の範囲内である。
多くの文書レンダリングアプリケーションは、プラグインまたは類似アーキテクチャの使用を通して、アプリケーションの機能性を拡張する能力を備える。本発明の例示的システムは、引用エディタアドインクライアント218を含み、GUI機能性を含んでもよく、文書レンダリングアプリケーション216の文脈において、引用処理を提供する。著者は、引用エディタアドインが供給するグラフィカルツールバー要素およびメニューコマンドをクリックすることによって、引用エディタアドイン218の機能性へのアクセスが提供される。代替として、引用エディタアドインは、カスタムコマンドまたはカスタム特徴をアプリケーションに追加する補助プログラムであってもよい。引用エディタアドインならびに本発明の他のコンポーネントは、コンピュータによってロードされると、または、例えばウェブポータルを通してコンピュータによってアクセスされると、コンピュータにプロセスを実行するように、または別様に、以下により詳細に説明される遠隔で実行される機能性を提示するように命令する、コンピュータ読み取り可能な媒体上に記憶されたソフトウェアとして具現化されてもよいことに留意されたい。
本発明の一実施形態によると、引用エディタアドイン218は、ロードされて1つ以上のMicrosoft Officeアプリケーション内で実行されるように設計された、例えば、COM(Component Object Model)オブジェクトであってもよい。COMアドインは、アプリケーション間で共有されるアーキテクチャを使用して、1つ以上のOfficeアプリケーションに接続し、かつそこから切断されるように設計される。引用エディタアドイン218は、DLL(Dynamic Link Library)を作成可能な、任意の数のプログラミングツールを用いて実装されてもよい。
引用エディタアドイン218は、引用を検索すること、推奨される引用データを提示すること、推奨される引用データから選択すること、および推奨される引用データならびに文献目録を挿入することに関連する複数の機能へのアクセスを提供する。例示的機能性は、引用を見つけ、編集し、挿入し、外部引用アプリケーションにアクセスし、文献目録を書式設定する能力を含み、ユーザ使用監視およびトラッキングを含んでもよい。引用エディタアドイン218はまた、著者が文書を草稿している間に、引用スタイルまたは同様のものの選択のような引用の即時書式設定を提供する。本発明の実施形態によると、引用は、引用されている図面またはチャート等のグラフィックを備えてもよい。
文書レンダリングアプリケーション216が実行されると、引用エディタアドイン218が、ロードされる。引用エディタアドイン218は、メニューおよびツールバー要素を実施し、メニューおよびツールバー要素は、クライアントデバイス211においてローカルに、またはISP204において遠隔で実行される機能性を含み得る引用推奨システムまたはアプリケーション209と、文書著者によって選択されたコマンド、例えば、本明細書で後述される「suggest citations」を実施または実行するために必要とされる文書レンダリングアプリケーション216とへの通信を提供する。一実施形態によると、本通信は、文書レンダリングアプリケーション218および引用推奨システムまたはアプリケーション209によって曝されるCOMインターフェースを介して実施される。さらに、引用エディタアドイン218は、引用処理を要求する条件、例えば、選択されたテキストセグメントの存在および/または文書中に現れる引用マーカー位置あるいは位置の存在について、例えば、文書224からのユーザによって処理されている文書を監視する。
加えて、システムは、文書レンダリングアプリケーション216が動作させられると、例えば、参考文献ツールによってローカルにロードされる、あるいは引用推奨システムまたはアプリケーション209によって遠隔でアクセスされる、あるいは個人プロファイル記録と関連付けられる、参考文献ライブラリを含んでもよい。参考文献ライブラリは、引用エディタアドイン218と引用推奨システムまたはアプリケーション209との間の中間体としての役割を果たしてもよい。一様式では、ライブラリは、初期書式から引用推奨システムまたはアプリケーション209特有の書式にデータを変換してもよい。例えば、引用エディタアドイン218がCOMオブジェクトとして実装される場合、ライブラリは、引用推奨システムまたはアプリケーション209特有の、例えば、COMインターフェースを提供する通信プロトコルまたは書式に準拠するデータ要素にCOMデータ要素を変換する。
さらに、ソースアプリケーション切替は、同じ参考文献ライブラリをデスクトップデータベース内およびウェブ上に記憶し、いずれかの位置から参考文献を文書中に挿入し、いずれかのソースアプリケーションからの引用をシームレスに書式設定および更新する方法を提供する。Microsoft Word引用インポートは、Microsoft Word2007以降によって文書中に挿入されるXML引用データを取り出し、これを好ましい、所定の、または専用文書内データ書式に変換するためのメカニズムを提供する。文献目録のセクションは、文書中のセクションマーカーを識別し、文書の終わりに完全文献目録を伴って、または伴わずに、各セクションの終わりに別個の文献目録を作成するためのメカニズムを提供する。複合引用は、文献目録中の1つのエントリとしてともにグループ化され、所与の一式の文献目録書式設定ルールによって規定されるような特定の英数字ラベルによって個々に区別される、1つの複合引用として参考文献のグループを取り扱うためのメカニズムを提供する。引用から文献目録へのリンクは、本目的のためにハイパーリンクとして取り扱われる、テキスト内引用をクリックすることによって、文献目録中のエントリにナビゲートするためのメカニズムを提供する。ソース参考文献管理アプリケーション内で編成グループを生成することは、ソース参考文献管理アプリケーション内において、文書中で使用されている参考文献の編成グループ化を自動的に作成するメカニズムを提供し、グループ化は、次いで、参考文献が文書中に挿入されるか、または文書から削除されると、自動的に更新される。複数のライブラリからの参考文献の管理は、複数の参考文献ライブラリから参考文献を文書中に挿入するためのサポートを提供し、参考文献毎にソースライブラリを示し、ユーザがそのソースライブラリからの個々の参考文献を更新すること、または参考文献を別のライブラリからのバージョンと交換することを可能にするユーザインターフェースを提供する。
一例では、著者は、文書または文書の選択されたテキストセグメント内にある、あるいは文書中のマーカーまたは位置と密接に関連付けられた不完全または部分的引用を供給してもよい。引用推奨システムまたはアプリケーション209は、選択されたテキストセグメント内の部分的引用データを認識し、それによって、引用推奨プロセスを短縮および促進してもよく、または、自動的に、部分的引用データを修正し、完全に書式設定された引用を提供し、推奨される引用セットを提示する必要性を回避してもよい。本発明によると、引用エディタは、周期的に、文書をスキャンし、一時的引用を識別し、自動的に、そのような部分的引用を完成および補正してもよい。GUIは、挿入される引用のユーザ確認のために提示され、かつ/または推奨される引用セットの検索を促進し得る。例示的機能性は、米国出願公開第2012/0072422号「SYSTEM AND METHOD FOR CITATION PROCESSING, PRESENTATION AND TRANSPORT AND FOR VALIDATINGREFERENCES」(参照することによって全体として本明細書に組み込まれる)に開示されている。
動作において、引用推奨システムまたはアプリケーション209への入力のためのテキストセグメントを選択すると、ユーザと関連付けられた個人プロファイルとともに選択されたテキストの処理に応じて、システムは、結果として生じる一式の推奨される引用を生成し、そこから、ユーザは、選択してもよい。著者が文書中に挿入することを所望する引用の選択に応じて、引用データは、文書中への挿入のために、ワードプロセッサ216および引用エディタアドイン218の動作を介して、文書中に送られる。一様式では、引用データを参照する「フィールドコード」が、文書中に挿入されてもよく、これは、ユーザまたは第三者データプロバイダによって維持されるローカルまたは遠隔引用ライブラリ内に記憶されてもよい。フィールドコードは、文書中に表示される書式設定された引用のソースとして使用される下層引用データへのリンクである。フィールドコードを通して定義される書式は、著者定義パラメータによって設定されてもよい。種々の学術的機関誌は、引用のための書式設定要件に関して異なる制約を有する。例えば、Journal of the American Medical Associationは、引用が第1の書式に準拠することを要求し得る一方、the journal Scienceは、全体的に異なる引用書式を要求し得る。本発明のシステムは、有利には、周知の機関誌および出版物に関する引用書式パラメータを供給され得る。このように、著者は、パラメータを自動的に設定されるインターフェースを通して単に発表を選択することによって、文書中の引用が標的出版物の引用仕様に準拠することを確実にし得る。さらに、著者が、文書のための標的出版物を変更し、ソフトウェアに、文書を詳細に検討させ、新しい標的出版物の引用仕様に準拠するように、その中に含まれる引用の書式を修正させ得る機能性が提供されてもよい。
加えて、著者は、文書中に以前に挿入された選択された引用を編集してもよい。例えば、著者は、挿入された引用の周囲の一式のテキストを訂正してもよく、システムに、自動的に、またはユーザ制御によって、訂正された「テキストセグメント」を処理させ、挿入された引用が、依然として、有効であるかどうか、またはテキスト分析および個人プロファイルデータに基づいて、最も高い関連のある引用であるかどうかを決定してもよい。システムは、ユーザに、以前に挿入された引用を交換するために選択すべき訂正された一式の推奨される引用を提供してもよい。
本発明は、構造化された書式設定済文書を準備するための著作、提出、および検証システム、例えば、EndNote XML参照マークップを使用するEndNoteと併用されてもよい。そのようなソフトウェアアプリケーションは、出版社への提出に先立って、文書中に含まれるデータを識別およびタグ付けすることによって、Microsoft Word文書を書式設定するために使用されてもよい。例えば、文書は、限定ではなく、一例のみとして、GML、SGML、またはXMLに基づくプロセスを使用して、マークまたはタグ付けされてもよい。例えば、GML、SGML、またはXMLベースのマークアップを使用して、文書をマークまたはタグ付けし、構造化された文書を作成することによって、引用される参考文献は、より容易に文書から抽出され、検証のために、参考文献リスト内に含まれ得る。本発明は、一式の提案される引用を認証するために使用されてもよい。構造化された文書は、アプリケーション機能を使用して、特定の文献目録スタイルに従って書式設定されてもよい。例えば、EndNote Tool Barが、MS Wordの隠しコードフィールドのAPI(アプリケーションプログラミングインターフェース)を呼び出すために起動されてもよい。構造化されたワード文書は、データベースと通信するワークフローシステム(例えば、Manuscript Central)にロードまたはアップロードされてもよい。加えて、システムは、テキスト内引用と、文書と関連付けられた文献目録、プロジェクト、ユーザ(個人プロファイル記録)、またはデータベースとの間の自動ハイパーリンク付けを提供してもよい。
別の例示的ワークフローとして、ユーザが、共通の文書またはプロジェクトに関して、別の著者(共同著者)と共同研究しているときが挙げられる。著者は、共通の文書またはその一部(例えば、本または論文の章)にアクセスし得、両者とも、引用を挿入する能力を有する。
一つの例示的動作方法では、図3のフローを参照すると、以下のプロセスが、行なわれる。最初に、ステップ302において、ユーザは、ワード処理アプリケーションに提示される文書中のテキストをハイライト、選択、またはマークする。ステップ304では、ユーザは、ハイライトされたテキストセグメントを分析するために、ハイライトされたテキストをCRMに提出する。CRMは、例えば、テキストセグメント内に含まれる用語に関連する引用を識別するためのデータ表現を生成するための検索(例えば、自然言語検索)を含め、少なくとも部分的に、テキストセグメントに基づいて、第1の出力を生成する。ステップ306では、システムは、参考文献テキストコレクション(RTC)の一式の結果を検索、生成、および提示する(必要に応じて、一式の結果をランク付けする)。検索は、従来の検索技法(例えば、自然言語処理)を採用してもよく、および/または引用位置検索(以下に詳細に論じられる)を含んでもよい。ステップ308では、システムは、個人プロファイルと関連付けられたデータを分析し、データ表現を生成する、あるいは一式の結果を集約、フィルタリング、ランク付け、または再ランク付けする。ステップ310では、システムは、第1の出力および第2の出力を受信および分析し、第1の出力および第2の出力に少なくとも部分的に基づいて、一式の引用推奨データを生成する。ステップ304−310のプロセスは、部分的に、ユーザ経験外で行なわれてもよい。ステップ312では、システムは、ユーザインターフェースに戻り、ユーザインターフェースを介して、一式の推奨される引用をユーザに表示するために提示する。ユーザは、次いで、GUI等を介して、さらなる動作を行なう、例えば、推奨される引用を推奨される引用のリストから選択し、一式の推奨される引用の側面をワード処理アプリケーションにおいて開かれているユーザ文書中に組み込む。
図4は、本発明と関連付けられたハードウェアおよびソフトウェア機能性のさらなる例示的実施形態を図示する。本例では、本発明は、コンピュータベースのシステムであるサーバシステム402と、ワード処理アプリケーション404と、1つ以上の出典データベース406−408とを提供する。システム400は、テキスト分析モジュール(TAM)412、個人プロファイルモジュール(PPM)414、およびシステム分析モジュール(SAM)416から入力を受信する引用推奨モジュール410を含む。テキスト分析モジュール、個人プロファイルモジュール、および推奨モジュールは、概略形態で示され、ローカルクライアントデバイスおよび中央サーバのうちの1つ以上に存在してそこで実行される機能的コンポーネントを含んでもよい。動作において、ワードプロセッサアプリケーション404を介して文書を準備中の著者等のユーザ418は、文書中からテキストの一部、すなわち、「テキストセグメント」を識別し、マークし、ハイライトし、または別様に選択する。前述のように、TAM412は、受信されたテキストセグメント入力に関して、自然言語プロセス等のプロセスを行ない、第1の出力、例えば、一式の潜在的または候補引用参考文献あるいは文書もしくはデータ表現の他の形態を生成する。
個人プロファイルモジュール414は、ユーザと関連付けられた情報を受信し、またはその情報にアクセスし、第2の出力を生成するか、またはTAM412の出力をさらに処理する。CRM410は、TAMおよびPPM出力を処理し、ユーザ418に提示するための一式の推奨される引用に辿り着く。引用推奨モジュール410は、TAMの第1の出力およびPPMの第2の出力に応答して、一式の引用推奨データを生成する。加えて、システム分析モジュール416が、一式の推奨される引用に辿り着く際に使用するためのシステム情報を処理することを対象としたさらなる機能性を組み込むために含まれてもよい。
動作において、システム402、特に、推奨モジュール410は、ユーザ418に提示するための一式の推奨される引用を決定する際、1つ以上の出典データベース406−408を参照してもよい。出典データベース406−408は、所与の研究において高い信頼性があると認識される引用または文書のデータベースを表し得る。
図5は、著者/研究者サービスプラットフォームへのアクセスを試みるユーザに提示される例示的ユーザ登録インターフェース(例えば、本発明を組み込んでいるインターフェース)を表す。本発明に照らして、登録プロセスはまた、個人プロファイル記録に組み込まれ得る有用ユーザ情報を提供してもよい。例えば、登録インターフェース500は、代替として、ユーザが、直接、アカウントに登録すること、あるいは既知かつ容認可能な既存のアカウント、例えば、facebook、linked−in、または他のソーシャルメディアサイトを使用して、サインオンすることを可能にしてもよい。ログインは、Thomson Reuters OnePass等の既存のサービスプロバイダアカウントを通して処理されてもよい。登録の際、プルダウン502において、ユーザは、ユーザが関連付けられた団体エンティティ(例えば、大学または研究所(例えば、National Institute of Health)の研究者または学生)を提供する。プルダウン504において、ユーザは、ユーザが、研究または類似活動に能動的に従事している、1つ以上の着目研究分野または「主題エリア」(単数または複数)(例えば、アレルギーおよび喘息)を示す。ボックス506において、ユーザは、過去に著作または出版に貢献したことがあるかどうかを示す。これは、ユーザを出版著者として識別し、本情報は、ユーザを識別し、出典データベースまたは他のリソース内に含まれる記録と合致させることを支援するために使用されてもよく、本ユーザおよび他のユーザに関する情報の曖昧性を解消するために使用されてもよい。
図6は、本発明に照らした例示的引用推奨システム(CRS)600の略図である。システムに登録または別様にロギングした後、ユーザは、ログイン認証情報を用いたセッションを特定の個人プロファイルに関連付け、特定の個人プロファイルは、データベース内に記憶され、かつ/または記憶された分散プロファイルコンポーネントを有し、かつ、複数のデータベースおよびシステムを通してアクセス可能である、個人プロファイル記録の形態をとり得る。602に反映されるように、ウェブポータル、ホームページ、または他の好適なインターフェース(例えば、図7−図9)を介して、ユーザは、そのプロファイル記録にアクセスすることにより、個々のユーザに関するプロファイルデータを更新、訂正、補足、または単に監視してもよい。同様に、ユーザは、「Quick find & cite」604(例えば、電子メールおよびウェブブラウザのためのプラグイン)および研究リコメンダ606(例えば、ワードプロセッサのためのプラグイン)に反映されるような研究補助ツールにアクセスしてもよい。研究および引用ツールを実施するための例示的実施形態は、図12−図18に示される。
ユーザインターフェースはまた、総合的な一式の研究者ツールを提供し、例示的実施形態は、研究者中心であるか、または高度な経験をユーザにもたらすことに焦点が当てられている。特に、CRS600はまた、助成金マッチャまたは資金調達ファインダ608と、チームまたはプロジェクトワークスペース610と、個人引用カリキュレータ612と、スマートクラウドストレージ614と、自己出版616とを含む。助成金マッチャ608を用いて、CRSは、ユーザの過去または現在の研究活動の認識と併せて、個人プロファイル情報を適用し、自動的に(または、ユーザの焦点を合わせた方向性によって)、利用可能なリソースを監視し、助成金および研究資金調達の潜在的ソースを識別および合致させてもよい。例えば、特定の研究分野における研究を求めているgrants.govにおいて公表されている助成金が、ユーザプロファイルおよび活動と合致し得る。CRS600は、そのような潜在的合致を識別することに応じて、電子メールを生成するか、あるいはユーザのホームページまたはダッシュボード上のエリアを介して、潜在的合致を示してもよい。チームまたはプロジェクトワークスペース610は、プロジェクトまたは論文情報およびアクセスへの共有パスを反映する。例えば、一緒にまたは別個に、本の個々の章または論文のセクションに取り組んでいる複数の著者は、研究活動を監視するためのアクセスならびに引用および文書データへの共通リンクを提供され、CRSは、ユーザのための推奨に辿り着く際、共同研究活動を考慮してもよい。
CRS600は、コンテンツおよびコンテンツに関連するツールを含む種々のデータソースへのアクセスを含む。例えば、CRS600は、Web of KnowledgeTM(WoS)、Web of ScienceTM(WoS)、CortellisTM、WestlawTM、およびThomson Innocationを含む、Thomson Reutersによって供給されるような上等コンテンツまたは専用コンテンツ618(CRSサービスを提供する組織内部にあり得る)、ならびに、Mendeley研究ネットワーク、Google Scholar、RSS、SciVerse、Microsoft Academic Search、IEEE(Institute of Electrical and Electronics Engineers)、ExLibris、Scopus、およびEbsco等のその他によって供給されるリソースと通信するための手段を含む。CRSシステムはまた、外部または公共データベースおよびリソース620、例えば、PubMed.gov、crossref.orgにアクセスしてもよい。CRS600はまた、使用データ622を記録するためのデータ記憶を含み、使用データ622は、個人プロファイルデータを拡張するために使用され得、かつシステムによって行なわれる推奨をさらに洗練するために使用され得る。クラウドソースコンテンツ624は、ソーシャルメディア関連情報、ユーザライブラリ等を含んでもよい。
図7−図9に示される例示的実施形態を参照すると、ローカルクライアント処理デバイスは、複数の着目分野および論題、例えば、検索引用推奨、検索パラメータ、検索データベースまたはリソース選択またはフィルタ、ユーザ活動、文書またはプロジェクト関連データ、共同研究者活動、助成金または資金調達関連データ、プロジェクトタイムラインまたは管理ワークフロー、データフィルタリング基準、および検索履歴を表示するための電子ユーザダッシュボードまたはウェブポータルページを含む。
図7は、研究へのポータルとしての例示的な個々のユーザ「ダッシュボード」およびユーザへの他の着目ツールを図示する。本例では、ユーザ「Lance J Kriegsfeld, PhD.」は、CRSシステムにログオンしており、タブ702を介して、ダッシュボード700をアクティブにしている。ダッシュボードは、「Edit Profile」ボタンを含み、ユーザが、個人プロファイルデータを編集する、例えば、ユーザについておよびユーザに関する情報を更新または訂正または補足することを可能にし、そのデータは、CRSにおいて使用され、研究論文または同様のもの中に挿入するための推奨される引用に辿り着き得る。エリア706は、つながり、グループメンバー、進行中の助成金、および進行中の論文を含む、着目またはユーザに関連する活動を示す。エリア708は、ユーザの共同研究ネットワークの絵文字表現であり、ユーザがプロジェクトまたはその他で共同研究を行なっている他者とのつながりとともに、ユーザが中央に示される。エリア710は、ユーザに、統計情報およびリンクとともに、その出版物の概要を与える。エリア712は、ユーザに、リンクおよび統計とともに、研究分野または関心の概要を提供する。スコアカード714は、ユーザに、出版リソースに関連する着目統計概要、例えば、ユーザによって著作された論文を引用するWeb of Science内に含まれる論文の数(例えば、200)を提供する。エリア716は、ユーザが着目し得る、推奨される論文のリストを提供する。本推奨リストは、ユーザの個人プロファイルに基づいてもよい。エリア718および720は、所定の一式の選好を含み得るユーザの個人プロファイルに基づいて、ユーザが着目し得る、一式の記事または他の媒体を提供する。
引用推奨システムのPPMは、上記に識別されたもののような複数の形態の個人プロファイルデータにアクセスし、それを分析し、引用推奨プロセスを補助する。例えば、ユーザによって頻繁に引用される論文は、TAMによって生成される一式の候補引用に追加されてもよく、またはTAM出力に既に含まれる場合、関連性のより高い順位に再ランク付けされてもよい。また、多くの著者は、種々の理由から、自己引用を好むため、ユーザの独自の論文が、TAM出力に補足されてもよく、またはTAM出力に含まれる場合、より高くランク付けされてもよい。また、EndNoteにユーザによって維持されるような既存の参考文献ライブラリも、一式の引用推奨内にランク付けまたは含まれる際、検討されてもよい。
さらに、PPMは、論文、機関誌、またはプロジェクトに対するメタデータとして、データを使用してもよい。例えば、メタデータは、研究分野等の分野と関連付けられてもよい。特定の研究分野は、動的または急速に変化するものとして特徴付けられ得る一方、他の研究分野は、十分に確立されており、比較的に非動的であるものとして特徴付けられ、研究の大部分における実質的変化は、より漸次的に生じることを意味し得る。システムは、より最近の論文が、進行中の現在の論文から時間的により離れた論文より高くランク付けされ得るように、動的研究分野と非動的研究分野とを区別する。分野と関連付けられた本メタデータはまた、「より古い」論文をフィルタリングするために使用されてもよい。この関連性の閾値期間は、研究分野に依存する。これは、影響力の大きい著作物等の特定の頻繁に引用される「頻用」論文をより高くランク付けするか、またはフィルタを通すことによって、オフセットされてもよい。このように、システムは、特定の研究分野に対して、設定期間を超えて発表された論文が、関連性が低いと決定を下す。
同様に、動的分野と関連付けられた機関誌は、あまり動的ではない分野と関連付けられた機関誌とは異なるように取り扱われてもよい。同様に、論文は、それと関連付けられたメタデータを有してもよく、動的研究分野または非動的研究分野に関連するとして識別されてもよい。この種の分析は、第2の出力においてPPMによって生成されたデータ表現またはTAM出力の調整に反映されてもよい。この種のメタデータは、TAMプロセスにおいて同様に使用されてもよく、実際、検索コレクションは、擬似文書または代理文書記録として処理され得る、そのようなメタデータを備えてもよい。
図8は、さらなる例示的ユーザウェブページまたはポータル800である。エリア802は、ユーザあるいは着目人物または共有チーム内の人物と関連付けられた最近の活動を示す。システムはまた、ユーザが潜在的に着目する人物(例えば、共有研究分野における論文の著者)およびそのユーザの最近の活動を提案してもよい。図10に示されるように、ユーザは、プロジェクト更新、チームメンバー、ユーザのつながり、出版物、およびメッセージ/通知による選択的フィルタリングを含むプルダウンメニューを介して、活動表示および情報をフィルタリングしてもよい。マイプロジェクトスペース804は、ユーザの関連プロジェクトを表示し、ユーザに、新しいプロジェクトまたはリンクを追加するための手段を提供する。プロジェクトスペースは、統計概要およびプロジェクト関連情報へのリンクを提供する。例えば、図9に示されるように、ユーザは、プロジェクト「Approach to a Child with Recurrent Infections」を選択し、その特定のプロジェクトと関連付けられた情報およびリンクにアクセスしてもよい。原稿アナライザ806は、関連性、論文「asthma_draft_1.doc」の予測される棄却率、潜在的機関誌合致率(例えば、研究分野およびユーザプロファイルに基づく)を測定および格付けするためのツール、ならびに原稿を追加する方法を提供する。エリア808は、ユーザの共同研究成果の統計表現を提供する。エリア810は、研究ツールまたはソリューションの統合、例えば、Thomson Reuters EndNote(登録商標)を提供する。例えば、ユーザは、EndNoteアプリケーションからの参考文献ライブラリをCRSにアップロードしてもよく、次いで、参考文献ライブラリは、ユーザプロファイルと関連付けられ、PPMにおいて使用され、進行中の論文における一式の推奨される引用に辿り着き得る。エリア812はさらに、CRSの助成金マッチャまたは資金調達ファインダ側面を図示する。例えば、ユーザのプロファイルデータを与えられると、CRSは、潜在的着目助成金を推奨し、助成金提出締め切りおよび他の必須条件、資金調達ソース、合致基準等の重要情報を表示してもよい。
図9は、図8に提示されるリンクからユーザがプロジェクト「Approach to a Child with Recurrent Infections」を選択することに応じて表示される、さらなる例示的ユーザウェブページまたはポータル900である。本例では、プロジェクトポータルは、選択されたプロジェクトに関連するプロジェクトタイムライン特徴902を表示し、ハイライトされたプロジェクトマイルストーンまたはイベント904、および、イベント904に関連するさらなる特定の情報を表示するためのリンクを示す。マイルストーンは、プルダウンメニュー906を介して、タスクタイプ別に選択的に表示されてもよく、新しいマイルストーンが、ボタン908を介して、追加されてもよい。タイムライン表示は、マイルストーンまたはイベント910のステータス(例えば、完了、進行中、未完了、期限切れ等)のグラフィカル表現を提供する。ユーザは、マイルストーンを選択し、プロジェクトのワークフローの一部として、データまたは論文またはレビューまたは同様のものをアップロードあるいはリンク付けしてもよい。例えば、図11は、特定のプロジェクトと関連付けられた情報およびリンクにアクセスするためのマイルストーン関連インターフェースを図示する。エリア802は、ユーザあるいは着目人物または共有チーム内の人物と関連付けられた最近の活動を示す。システムはまた、ユーザが潜在的に着目する人物(例えば、共有研究分野における論文の著者)およびそのユーザの最近の活動を提案してもよい。図10に示されるように、ユーザは、プロジェクト更新、チームメンバー、ユーザのつながり、出版物、およびメッセージ/通知による選択的フィルタリングを含むプルダウンメニューを介して、活動表示および情報をフィルタリングしてもよい。マイプロジェクトスペース804は、ユーザの関連プロジェクトを表示し、ユーザに、新しいプロジェクトまたはリンクを追加するための手段を提供する。プロジェクトスペースは、統計概要およびプロジェクト関連情報へのリンクを提供する。
図12は、Microsoft Word等のワード処理アプリケーションによって生成される例示的文書1200を表す。ウィンドウは、PCコンピュータ等のユーザのクライアントアクセスデバイス上にローカルに存在するワード処理アプリケーションと統合してそれとインターフェース接続するCRSワード処理プラグインを表す「Beehive」として識別されるタブ1202を含む。アクセスデバイスは、イントラネット、インターネット、あるいは他の有線または無線ネットワークに接続されてもよい。動作において、ユーザは、文書1200中に含まれるテキストからテキストセグメント1204(ハイライトで示される「SP−D was described ...phospholipid material」)を選択する。ユーザは、次いで、「Suggest Citations」として識別されるボタン1206をクリックすることによって、CRS引用推奨機能をアクティブ化する。ハイライトされたテキストセグメントは、次いで、本明細書の別の箇所に詳細に説明されるように、CRSによって処理される。1つの代替では、ユーザは、引用を挿入するために意図された位置にマーカーを置いてもよい。プラグインは、次いで、マーカー(脚注または巻末注のためのプレースホルダ)と同じ場所に位置するテキスト、例えば、マーカーの直前の文を自動的に収集し、収集されたテキストに引用推奨プロセスを行なってもよい。また、プラグインは、動作を別々に行なうのとは対照的に、文書全体に本プロセスを行い、複数のそのようなマーカーを検索してもよい。故に、著者は、「バッチ」様式において、引用挿入プロセスを行なうことができる。
CRSは、遠隔でアクセスされるかまたはプラグインと関連して部分的にローカルに存在する機能性およびデータベースを有することができる。動作において、クッキー接続が、遠隔オンラインログイン/認証とローカルプラグイン動作との間に確立される。CRSは、提出されたテキストセグメント、および、ユーザまたはユーザアカウントと関連付けられた個人プロファイルデータに応答して、推奨される引用1210のリスト1208を生成する。ユーザは、次いで、文書1200中に挿入するための推奨される引用のリストから選択してもよい。加えて、システムは、リストとともに、推奨される引用に関する情報(例えば、関連項目、フルテキスト閲覧、my EndNoteライブラリへの追加、WoS引用回数統計)への付加的アクセスを提供する。ある様式では、リスト1208は、提案される引用の関連性に関するユーザフィードバックを受信するための手段を含んでもよい。例えば、ユーザが、特定の引用が特に関連性がないと考える場合、チェックボックスが、ユーザのフィードバックを受信するために使用されてもよい。本フィードバック情報は、システムの知能に追加し、引用推奨システムを訓練することを支援するために使用されてもよい。個人によって選択された引用は、文献目録記録、EndNoteツールによって維持されるようなユーザの参考文献ライブラリ、または他の位置に追加されてもよい。このように、ユーザまたはユーザグループ/共同研究者または機関は、組織全体で使用するために参考文献の「専門家」ライブラリを生成することができる。また、推奨される引用を選択する際、システムは、ユーザと関連付けられたメタデータ記録および使用の履歴追跡等のユーザ個人プロファイルを更新してもよい。前述のように、そのような「活動」は、ユーザのポータルまたはダッシュボードならびに共同研究者ポータルおよびダッシュボードに報告される。
図13は、文書1200中の脚注1308として挿入されるリスト1302上に示されるような選択された引用「Persson A, Rust, K ...」1304を有するワードプロセッサ文書1200の後続スクリーンショットを示す。脚注参考文献1306は、文書の本文中のテキストセグメントの終わりに挿入される。
図14は、CRSワードプロセッサプラグインと関連付けられた履歴機能を図示する。ユーザは、ツールバー内のHistoryとして識別されるボタン1402を選択し、システムは、ダイアログボックス1404またはユーザの引用検索履歴を表す他のそのようなユーザインターフェースを生成する。この場合、過去の引用検索結果のリスト1406は、ユーザによるさらなるアクションのために表示される。リストをナビゲートするために、ユーザは、結果を狭めまたはフィルタリングするための検索機能が提供される。
図15は、CRSワードプロセッサプラグインと関連付けられた検索機能を図示する。ユーザは、ツールバー内のSearchとして識別されるボタン1502を選択し、システムは、ダイアログボックス1504または独立検索能力を表す他のそのようなユーザインターフェースを生成する。この場合、データベースまたはリソースのリスト1508は、所望のボックスをチェックし、edit resources to searchボタン1506をクリックすることによるユーザ選択のために表示される。ユーザは、次いで、着目検索用語をタイプし、Searchボタン1510をクリックし、一式の応答結果を読み出す。これは、文書1200からのハイライトされたテキストセグメントの代わりに、TAMへの代替入力であってもよい。
図16は、CRSプラグインを有するワードプロセッサ生成文書1600のさらなる実施形態を図示する。本例では、システムは、自動的に、インデックス内に現れる用語、または、着目分野、研究、または調査に非常に関連する用語を別様に表す用語として、文書1600中に現れる特定の用語、例えば、「Fentanyl」を認識し得る。代替として、ユーザは、例えば、テキストをハイライトすることによって、用語を選択してもよい。いずれの場合も、ユーザは、次いで、その用語に関連する引用または参考文献またはリソースを取得するために、「Search While You Write」のシームレスな様式において、CRSシステムに関わり得る。例えば、CRSは、入力された用語およびユーザ個人プロファイル記録に基づいて、推奨される引用のリストを生成してもよい。示されるように、リスト1604は、ユーザによる検討および選択のために生成および表示される。選択された引用は、次いで、前述の様式において、文書中に挿入されてもよい。また、システムは、文書中に含むための付加的資料、例えば、化学化合物を図示する図を推奨してもよい。ユーザはまた、着目主題に関する最近発表された論文または文書を示すために、結果を選択またはフィルタリングしてもよい。
図17は、電子メールまたは通信プラグインと関連付けられた機能性を図示し、それによって、CRSによって推奨される引用は、検討のために、電子メールを介して受信者に転送されてもよい。電子メール1700は、推奨される引用のリスト1702を含み、受信者によって編集されている文書中に引用を挿入するために、引用と関連付けられた文書へのリンクを含んでもよい。例えば、共通のプロジェクトに従事するチーム内の研究者は、CRSを使用して、論文のテキストセグメントに関連する推奨される引用関連のリストを生成してもよく、レビューおよび検討およびコメントのために、他のチームメンバーに結果を転送してもよい。システムは、検討および/または引用のために、新しく引用された論文を転送するために使用されてもよい。
本発明は、本明細書で説明される特定の実施形態によって範囲が限定されない。本発明の他の種々の実施形態および修正は、本明細書で説明されるものに加えて、先述の説明および添付図面から当業者に明白となることが十分に想定される。したがって、そのような他の実施形態および修正は、以下の添付特許請求の範囲の範囲内に入ることを目的としている。さらに、本発明は、特定の実施形態および実装および用途との関連において、および特定の環境において、本明細書で説明されているが、当業者であれば、その有用性はそれらに限定されず、任意の数の目的のために、任意の数の方法および環境で有益に本発明を適用できることを理解する。したがって、以下で記載される特許請求の範囲は、本明細書で開示されるような本発明の全範囲および精神を考慮して解釈されるべきである。

Claims (58)

  1. コンピュータベースシステムであって、前記システムは、プロセッサと、メモリと、メモリ内に記憶され、引用推奨を提供するためにプロセッサによって実行可能である機械読み取り可能なコードとを備え、前記システムは、
    a.第1の出力を生成するように適合されたテキスト分析モジュールと、
    b.第2の出力を生成するように適合された個人プロファイルモジュールと、
    c.前記第1の出力および前記第2の出力に応答し、一式の引用推奨データを生成するように適合された推奨モジュールと
    を備える、システム。
  2. 前記推奨モジュールは、前記一式の引用推奨データを含む第3の出力を生成し、前記データは、少なくとも1つの引用を含む、前記第3の出力は、前記一式の引用推奨データを処理するため、および、前記少なくとも1つの引用の表現を表示のために提示するために、クライアントデバイスに通信されるように適合されている、請求項1に記載のシステム。
  3. 前記クライアントデバイスからの信号を受信するための入力をさらに備え、前記信号は、前記一式の引用推奨データと関連付けられた選択を含む、請求項2に記載のシステム。
  4. 前記クライアントデバイスからの信号を受信するための入力をさらに備え、前記信号は、前記第1の出力に到達したとき、前記テキスト分析モジュールによって処理されるテキストの選択を含む、請求項2に記載のシステム。
  5. 前記テキスト分析モジュール、前記個人プロファイルモジュール、および前記推奨モジュールは、ローカルクライアントデバイスおよび中央サーバのうちの1つ以上に存在してそこで実行される機能的コンポーネントを含む、請求項2に記載のシステム。
  6. 前記個人プロファイルモジュールは、ユーザ相互作用を監視しかつ使用関連データを記憶するように適合され、前記個人プロファイルモジュールは、使用関連データを特定のユーザと関連付ける、請求項2に記載のシステム。
  7. 前記クライアントデバイスは、個人プロファイル記録と関連付けられたユーザアカウント下で動作可能であり、前記個人プロファイルモジュールは、前記個人プロファイル記録内に少なくとも部分的に含まれるデータに基づいて、前記ユーザアカウントを認識して前記第2の出力を生成する、請求項2に記載のシステム。
  8. 前記テキスト分析モジュール、前記個人プロファイルモジュール、および前記推奨モジュールをワードプロセッサアプリケーションと統合するように適合されたワード処理統合モジュールをさらに備える、請求項1に記載のシステム。
  9. 前記ワード処理統合モジュールは、ローカルクライアント処理デバイス上のインストールのためプラグインモジュールを備え、前記プラグインモジュールは、前記テキスト分析モジュール、前記個人プロファイルモジュール、および前記推奨モジュールを統合するように適合されている、請求項8に記載のシステム。
  10. 前記プラグインモジュールの動作を開始することが可能なアクティブ化モジュールをさらに備える、請求項9に記載のシステム。
  11. 前記ローカルクライアント処理デバイスは、ユーザ選択要素を含むグラフィカルユーザインターフェースを提示するように適合され、前記一式の引用推奨データと関連付けられたユーザ選択を処理するように適合されている、請求項9に記載のシステム。
  12. 前記ワードプロセッサアプリケーションは、前記ローカルクライアント処理デバイス上で動作可能であり、前記ローカルクライアント処理デバイスは、前記受信されたユーザ選択を処理し、前記選択と関連付けられた引用を前記ワードプロセッサによって動作させられている文書中に自動的に含めるように適合されている、請求項11に記載のシステム。
  13. 前記ローカルクライアント処理デバイスは、
    a.検索引用推奨、
    b.検索パラメータ、
    c.検索データベースまたはリソース選択またはフィルタ、
    d.ユーザ活動、
    e.文書またはプロジェクト関連データ、
    f.共同研究者活動、
    g.助成金または資金調達関連データ、
    h.プロジェクトタイムラインまたは管理ワークフロー、
    i.データフィルタリング基準、および
    j.検索履歴
    のうちの1つ以上を含む少なくとも2つの別個のエリアを含む電子ユーザダッシュボードまたはウェブポータルページを含む、請求項9に記載のシステム。
  14. 前記ワード処理統合モジュールは、前記ワードプロセッサにおいて動作している文書中のテキストセグメントのユーザによる選択、ハイライト、または指示を処理するように適合され、前記テキスト分析モジュールは、前記ユーザ選択されたテキストセグメントを受信および処理するように適合され、前記第1の出力は、前記テキストセグメントに少なくとも部分的に基づいている、請求項8に記載のシステム。
  15. 前記テキスト分析モジュールは、入力を有し、前記入力は、ワードプロセッサ文書と関連付けられた一式のテキストを受信するように適合されている、請求項1に記載のシステム。
  16. 前記一式の引用推奨データは、ローカルクライアントデバイスへの提示のために出力され、前記テキスト分析モジュールは、選択される推奨される引用をワードプロセッサ文書中に挿入するために、少なくとも1つの推奨される引用のユーザ選択を前記一式の引用推奨データから受信するように適合された入力を有する、請求項1に記載のシステム。
  17. 一式の少なくとも1つの出典データベースとインターフェース接続するように適合された出典データベースモジュールをさらに備える、請求項1に記載のシステム。
  18. 前記一式の少なくとも1つの出典データベースは、
    a.一式のフルテキストファイル、
    b.一式のメタデータ記録、
    c.データベース要素を接続する一式のリンク、および
    d.外部ソースデータベースへの一式のリンク
    のうちの1つ以上を含む、請求項17に記載のシステム。
  19. 前記一式の少なくとも1つの出典データベースは、Web of Science、Web of Knowledge、National Library of Medicine PubMed、CrossRef、BIOSIS、Dialog、library OPACS、Medline、ProQuest、Ovid、Ebsco、WilsonWeb、および、ジャーナル構成外部データベースといったデータベースのうちの少なくとも1つを含む、請求項17に記載のシステム。
  20. ユーザインターフェースを提示し、テキスト分析に基づいて検索するための1つ以上の出典データベースのユーザ選択を表す入力を受信するようにさらに適合されている、請求項17に記載のシステム。
  21. 前記推奨モジュールは、
    a.1つ以上の推奨される参考文献または参考引用のリスト、
    b.1つ以上の推奨される検索結果または保存されたクエリのリスト、および
    c.前記ユーザから入力を要求するシステム応答
    のうちの少なくとも1つを生成するようにさらに適合されている、請求項1に記載のシステム。
  22. 前記個人プロファイルモジュールは、個人プロファイル記録を第1のユーザと関連付け、前記個人プロファイルモジュールは、入力を有し、前記入力は、
    a.一式の第1のユーザ出版物、
    b.一式の第1のユーザ検索用語、
    c.一式の助成金または類似資金調達ソース、
    d.一式の第1のユーザ検索結果または保存されたクエリ、
    e.前記第1のユーザと関連付けられた個人参考文献ライブラリ内に記憶された一式の項目、
    f.前記第1のユーザと関連付けられたユーザ−システム相互作用の一式の記憶された履歴、
    g.前記第1のユーザの一式の個人または専門文献目録データ要素、および
    h.前記第1のユーザと関連付けられた、または前記第1のユーザに関係する他のシステムユーザの一式の個人または専門文献目録データ要素
    のうちの少なくとも1つと関連付けられている、請求項1に記載のシステム。
  23. 前記第2の出力は、
    a.ユーザの個人参考文献ライブラリからの1つ以上の推奨される参考文献または引用のリスト、
    b.少なくとも1つの出典データベースからの1つ以上の推奨される参考文献または引用のリスト、および
    c.他のシステムユーザの個人参考文献ライブラリからの1つ以上の推奨される参考文献または引用のリスト
    のうちの1つ以上である、請求項1に記載のシステム。
  24. 前記引用推奨を宛先アプリケーションに通信するように適合された通信モジュールをさらに備える、請求項1に記載のシステム。
  25. 参考文献、引用、または引用を含む文書を通信するように適合された電子メールモジュールをさらに備える、請求項1に記載のシステム。
  26. 少なくとも1つの参考文献ツールと統合し、前記少なくとも1つの参考文献ツールから少なくとも1つの引用に関する引用データを受信するように適合されたツール統合モジュールをさらに備え、前記一式の引用推奨は、前記受信された引用データからの少なくともいくつかのデータを含む、請求項1に記載のシステム。
  27. クラスタ化モジュールをさらに備える、請求項1に記載のシステム。
  28. 曖昧性解消モジュールをさらに備える、請求項1に記載のシステム。
  29. 前記個人プロファイルモジュールは、入力として、前記第1の出力を受信し、前記第2の出力は、前記第1の出力に部分的に基づき、前記推奨モジュールは、前記第2の出力を受信するように適合されている、請求項1に記載のシステム。
  30. 前記テキスト分析モジュールは、テキストセグメントを受信し、前記受信されたテキストセグメントを検索コレクションに対して処理する、請求項1に記載のシステム。
  31. 前記検索コレクションは、引用位置連結に基づいている、請求項30に記載のシステム。
  32. ユーザに、ユーザアカウントと関連付けられた個人プロファイルに関する情報を提示するように適合されたユーザダッシュボードインターフェースをさらに備える、請求項1に記載のシステム。
  33. 前記一式の引用推奨データのユーザ評価に関連するユーザ入力から導出される信号を受信するように適合されたユーザフィードバックモジュールをさらに備える、請求項1に記載のシステム。
  34. 引用推奨を提供するための、コンピュータによって実施される方法であって、前記方法は、
    a.テキストセグメントを受信および分析し、前記テキストセグメントに少なくとも部分的に基づいて、第1の出力を生成することであって、前記第1の出力は、前記テキストセグメント内に含まれる用語に関連する引用を識別するためのデータ表現である、ことと、
    b.個人プロファイルと関連付けられたデータを分析し、第2の出力を生成することであって、前記第2の出力は、前記個人プロファイルに関連する引用を識別するためのデータ表現である、ことと、
    c.前記第1の出力および前記第2の出力を受信および分析し、前記第1および第2の出力に少なくとも部分的に基づいて、一式の引用推奨データを生成することと
    を含む、方法。
  35. 少なくとも1つの引用を含む前記一式の引用推奨データを含む第3の出力を生成することと、前記一式の引用推奨データを処理し、前記少なくとも1つの引用の表現を表示のために提示するために、前記第3の出力をクライアントデバイスに通信することとをさらに含む、請求項34に記載の方法。
  36. 前記クライアントデバイスから信号を受信することであって、前記信号は、前記一式の引用推奨データと関連付けられた選択を含む、ことをさらに含む、請求項35に記載の方法。
  37. 前記クライアントデバイスから信号を受信することであって、前記信号は、前記第1の出力に到達したとき、テキスト分析モジュールによって処理されるテキストの選択を含む、ことをさらに含む、請求項35に記載の方法。
  38. ユーザ相互作用を監視し、使用関連データを記憶し、使用関連データを特定のユーザと関連付けることをさらに含む、請求項35に記載の方法。
  39. 前記クライアントデバイスは、個人プロファイル記録と関連付けられたユーザアカウント下で動作しており、前記方法は、前記ユーザアカウントを認識し、前記個人プロファイル記録内に含まれるデータに少なくとも部分的に基づいて、前記第2の出力を生成することをさらに含む、請求項35に記載の方法。
  40. テキスト分析モジュール、個人プロファイルモジュール、および推奨モジュールとワードプロセッサアプリケーションを統合するように適合されたワード処理統合モジュールをさらに含む、請求項34に記載の方法。
  41. ユーザ選択要素を含み、前記一式の引用推奨データと関連付けられたユーザ選択を処理するように適合されたグラフィカルユーザインターフェースを生成することをさらに含む、請求項35に記載の方法。
  42. 受信されたユーザ選択を処理し、前記選択と関連付けられた引用をワードプロセッサによって動作させられる文書中に自動的に挿入することをさらに含む、請求項41に記載の方法。
  43. ローカルクライアント処理デバイスにおいて提示するために、
    a.検索引用推奨、
    b.検索パラメータ、
    c.検索データベースまたはリソース選択またはフィルタ、
    d.ユーザ活動、
    e.文書またはプロジェクト関連データ、
    f.共同研究者活動、
    g.助成金または資金調達関連データ、
    h.プロジェクトタイムラインまたは管理ワークフロー、
    i.データフィルタリング基準、および
    j.検索履歴
    のうちの1つ以上を含む少なくとも2つの別個のエリアを含む電子ユーザダッシュボードまたはウェブポータルページを生成することをさらに含む、請求項34に記載の方法。
  44. ワードプロセッサにおいて動作している文書中のテキストセグメントのユーザによる選択、ハイライト、または指示と関連付けられた信号を処理することをさらに含み、前記第1の出力は、前記テキストセグメントに少なくとも部分的に基づいている、請求項34に記載の方法。
  45. ワードプロセッサ文書と関連付けられた一式のテキストを受信することをさらに含む、請求項34に記載の方法。
  46. ローカルクライアントデバイスにおいて提示するために、前記一式の引用推奨データを出力し、選択される推奨される引用をワードプロセッサ文書中に挿入するために、少なくとも1つの推奨される引用のユーザ選択を前記一式の引用推奨データから受信することをさらに含む、請求項34に記載の方法。
  47. 一式の少なくとも1つの出典データベースとインターフェース接続することにより、前記一式の引用推奨データを確認することをさらに含む、請求項34に記載の方法。
  48. 前記一式の少なくとも1つの出典データベースは、
    a.一式のフルテキストファイル、
    b.一式のメタデータ記録、
    c.データベース要素を接続する一式のリンク、および
    d.外部ソースデータベースへの一式のリンク
    のうちの1つ以上を含む、請求項47に記載の方法。
  49. 前記一式の少なくとも1つの出典データベースは、Web of Science、Web of Knowledge、National Library of Medicine PubMed、CrossRef、BIOSIS、Dialog、library OPACS、Medline、ProQuest、Ovid、Ebsco、WilsonWeb、およびジャーナル構成外部データベースといったデータベースのうちの少なくとも1つを含む、請求項47に記載の方法。
  50. ローカルクライアントデバイスにおいて提示するためのユーザインターフェースを生成し、1つ以上の出典データベースのユーザ選択を表す入力を受信することをさらに含む、請求項47に記載の方法。
  51. 前記一式の引用推奨データは、
    a.1つ以上の推奨される参考文献または参考引用のリスト、
    b.1つ以上の推奨される検索結果または保存されたクエリのリスト、および
    c.前記ユーザから入力を要求するシステム応答
    のうちの少なくとも1つを含む、請求項34に記載の方法。
  52. 個人プロファイル記録と第1のユーザを関連付けることであって、前記個人プロファイルは、
    a.一式の第1のユーザ出版物、
    b.一式の第1のユーザ検索用語、
    c.一式の助成金または類似資金調達ソース、
    d.一式の第1のユーザ検索結果または保存されたクエリ、
    e.前記第1のユーザと関連付けられた個人参考文献ライブラリ内に記憶された一式の項目、
    f.前記第1のユーザと関連付けられたユーザ−システム相互作用の一式の記憶された履歴、
    g.前記第1のユーザの一式の個人または専門文献目録データ要素、および
    h.前記第1のユーザと関連付けられた、または前記第1のユーザに関係する他のシステムユーザの一式の個人または専門文献目録データ要素
    のうちの少なくとも1つを含む、ことをさらに含む、請求項34に記載の方法。
  53. 前記第2の出力は、
    aユーザの個人参考文献ライブラリからの1つ以上の推奨される参考文献または引用のリスト、
    b.少なくとも1つの出典データベースからの1つ以上の推奨される参考文献または引用のリスト、および
    c.他のシステムユーザの個人参考文献ライブラリからの1つ以上の推奨される参考文献または引用のリスト
    のうちの1つ以上である、請求項34に記載の方法。
  54. 前記一式の引用推奨データを宛先アプリケーションに通信することをさらに含む、請求項34に記載の方法。
  55. 受信されたテキストセグメントからのデータを処理し、前記テキストセグメント内に含まれる用語の曖昧性を解消することをさらに含む、請求項34に記載の方法。
  56. 前記文書中のテキスト内引用と引用の文献目録中の対応する引用との間のハイパーリンクを提供することをさらに含む、請求項34に記載の方法。
  57. テキストセグメントを自動的に処理することにより、前記第1の出力を生成することであって、前記テキストセグメントは、ワードプロセッサ文書中に置かれたマーカーに基づいて決定される、ことをさらに含む、請求項34に記載の方法。
  58. 前記テキストセグメントは、前記マーカーの前に現れるテキストおよび前記マーカーの後に現れるテキストを含む、請求項57に記載の方法。
JP2015519384A 2012-06-29 2013-06-28 引用を処理、提示、および、推奨するためのシステム、方法、および、ソフトウェア Active JP6403340B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/539,280 2012-06-29
US13/539,280 US9218344B2 (en) 2012-06-29 2012-06-29 Systems, methods, and software for processing, presenting, and recommending citations
PCT/IB2013/001958 WO2014001915A2 (en) 2012-06-29 2013-06-28 Systems, methods, and software for processing, presenting, and recommending citations

Publications (3)

Publication Number Publication Date
JP2015527641A true JP2015527641A (ja) 2015-09-17
JP2015527641A5 JP2015527641A5 (ja) 2016-06-30
JP6403340B2 JP6403340B2 (ja) 2018-10-10

Family

ID=49484392

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015519384A Active JP6403340B2 (ja) 2012-06-29 2013-06-28 引用を処理、提示、および、推奨するためのシステム、方法、および、ソフトウェア

Country Status (5)

Country Link
US (1) US9218344B2 (ja)
EP (1) EP2867798A2 (ja)
JP (1) JP6403340B2 (ja)
CN (1) CN104428764B (ja)
WO (1) WO2014001915A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102554452B1 (ko) * 2022-06-21 2023-07-11 한국과학기술정보연구원 메타데이터 추출장치 및 메타데이터 추출 방법
WO2023171790A1 (ja) * 2022-03-10 2023-09-14 Ronride株式会社 文章作成支援装置及び文章作成支援プログラム

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9367530B2 (en) * 2011-01-21 2016-06-14 Jive Software Distributed document co-authoring and processing
US9595298B2 (en) 2012-07-18 2017-03-14 Microsoft Technology Licensing, Llc Transforming data to create layouts
US20140059051A1 (en) * 2012-08-22 2014-02-27 Mark William Graves, Jr. Apparatus and system for an integrated research library
US20150012562A1 (en) * 2013-02-04 2015-01-08 Zola Books Inc. Literary Recommendation Engine
US9112827B2 (en) * 2013-03-15 2015-08-18 Amazon Technologies, Inc. Determining appropriate browsing applications for selected network resources
US10706092B1 (en) * 2013-07-28 2020-07-07 William S. Morriss Error and manipulation resistant search technology
US10509861B2 (en) * 2013-09-16 2019-12-17 Camelot Uk Bidco Limited Systems, methods, and software for manuscript recommendations and submissions
US9588955B2 (en) * 2013-09-16 2017-03-07 Jason Rollins Systems, methods, and software for manuscript recommendations and submissions
US9477492B2 (en) * 2014-02-12 2016-10-25 Bank Of America Corporation Deploying multi-channel or device agnostic applications
US9495175B2 (en) * 2014-02-12 2016-11-15 Bank Of America Corporation Deploying multi-channel or device agnostic applications
US9354922B2 (en) * 2014-04-02 2016-05-31 International Business Machines Corporation Metadata-driven workflows and integration with genomic data processing systems and techniques
US10467336B2 (en) * 2014-08-07 2019-11-05 John Romney Apparatus and method for processing citations within a document
US9626768B2 (en) 2014-09-30 2017-04-18 Microsoft Technology Licensing, Llc Optimizing a visual perspective of media
US10282069B2 (en) 2014-09-30 2019-05-07 Microsoft Technology Licensing, Llc Dynamic presentation of suggested content
US20160196342A1 (en) * 2015-01-06 2016-07-07 Inha-Industry Partnership Plagiarism Document Detection System Based on Synonym Dictionary and Automatic Reference Citation Mark Attaching System
US9858349B2 (en) 2015-02-10 2018-01-02 Researchgate Gmbh Online publication system and method
US10366151B1 (en) 2015-03-12 2019-07-30 Google Llc Contextually relevant knowledge panels in an application environment
US9430451B1 (en) 2015-04-01 2016-08-30 Inera, Inc. Parsing author name groups in non-standardized format
EP3096277A1 (en) 2015-05-19 2016-11-23 ResearchGate GmbH Enhanced online user-interaction tracking
US10515152B2 (en) 2015-08-28 2019-12-24 Freedom Solutions Group, Llc Mitigation of conflicts between content matchers in automated document analysis
US10460023B1 (en) 2016-03-10 2019-10-29 Matthew Connell Shriver Systems, methods, and computer readable media for creating slide presentations for an annotation set
CN105930546B (zh) * 2016-07-08 2020-04-03 北京北大英华科技有限公司 文件关联显示方法
US12020340B2 (en) 2016-09-01 2024-06-25 Thomson Reuters Enterprise Centre Gmbh Legal research recommendation system
US12002122B2 (en) * 2016-09-01 2024-06-04 Thomson Reuters Enterprise Centre Gmbh Legal research recommendation system
US10255359B2 (en) * 2016-10-27 2019-04-09 HighWire Press, Inc. Rejected article tracker
CN106557568B (zh) * 2016-11-14 2019-05-21 中国电子科技集团公司第二十八研究所 模式匹配的xml文件格式与关系数据库转换的处理方法
US10089297B2 (en) * 2016-12-15 2018-10-02 Microsoft Technology Licensing, Llc Word order suggestion processing
US10380228B2 (en) 2017-02-10 2019-08-13 Microsoft Technology Licensing, Llc Output generation based on semantic expressions
US10621160B2 (en) * 2017-03-30 2020-04-14 International Business Machines Corporation Storage management inconsistency tracker
US10747759B2 (en) 2017-06-23 2020-08-18 City University Of Hong Kong System and method for conducting a textual data search
CN107643869A (zh) * 2017-09-21 2018-01-30 南京律臻法衡软件科技有限公司 一种文档编辑与检索功能同界面实现的功能模块
CN109697231A (zh) * 2017-10-24 2019-04-30 北京国双科技有限公司 一种案件文书的显示方法、系统、存储介质和处理器
CN108460149B (zh) * 2018-03-22 2021-05-18 平安科技(深圳)有限公司 文本数据处理方法、装置、设备及计算机可读存储介质
US20190311023A1 (en) * 2018-04-06 2019-10-10 Li-Cor, Inc. Automated reference list builder
WO2019222787A1 (en) * 2018-05-21 2019-11-28 Citehero Pty Ltd A computer implemented method and a computer system for determining a set of citations related to an electronic document edited by a user on a computing device
CN109145190B (zh) * 2018-08-27 2021-07-30 安徽大学 一种基于神经机器翻译技术的局部引文推荐方法及系统
CN109359249B (zh) * 2018-09-29 2020-07-10 清华大学 基于学者科研成果挖掘的学者精准定位方法及装置
US10878005B2 (en) * 2018-10-15 2020-12-29 International Business Machines Corporation Context aware document advising
CN109597896B (zh) * 2018-10-19 2023-06-20 上海星佑网络科技有限公司 信息引用方法和装置
US11023503B2 (en) * 2018-12-13 2021-06-01 Textio, Inc. Suggesting text in an electronic document
CN109885694B (zh) * 2019-01-17 2022-10-14 南京邮电大学 一种文献选择及其学习先后次序确定方法
CN110674318A (zh) * 2019-08-14 2020-01-10 中国科学院计算机网络信息中心 一种基于引文网络社区发现的数据推荐方法
US20210097095A1 (en) * 2019-09-04 2021-04-01 Thomas Peavler Apparatus, system and method of using text recognition to search for cited authorities
WO2021227632A1 (en) * 2020-05-15 2021-11-18 Guangdong Oppo Mobile Telecommunications Corp., Ltd. System and method for auto-recommending at least one intelligent text to a user
CN111859873A (zh) * 2020-07-30 2020-10-30 京华信息科技股份有限公司 一种文档脚注转换方法
US11755822B2 (en) * 2020-08-04 2023-09-12 International Business Machines Corporation Promised natural language processing annotations
US11520972B2 (en) * 2020-08-04 2022-12-06 International Business Machines Corporation Future potential natural language processing annotations
US11049023B1 (en) 2020-12-08 2021-06-29 Moveworks, Inc. Methods and systems for evaluating and improving the content of a knowledge datastore
CN113268951B (zh) * 2021-04-30 2023-05-30 南京邮电大学 一种基于深度学习的引文推荐方法
CN113487291A (zh) * 2021-07-23 2021-10-08 成都航盛智行科技有限公司 项目质量自动化监控系统
CN113641810A (zh) * 2021-08-16 2021-11-12 润申标准化技术服务(上海)有限公司 数据引用方法、装置及电子设备
EP4160469A1 (en) * 2021-09-30 2023-04-05 DePuy Ireland Unlimited Company Technical document error detection
US11620441B1 (en) * 2022-02-28 2023-04-04 Clearbrief, Inc. System, method, and computer program product for inserting citations into a textual document
US20240005084A1 (en) * 2022-06-29 2024-01-04 Intuit Inc. Dynamic electronic document creation assistance through machine learning

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009205674A (ja) * 2008-02-01 2009-09-10 Kanazawa Inst Of Technology 引用判定支援装置および引用判定支援プログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6279017B1 (en) * 1996-08-07 2001-08-21 Randall C. Walker Method and apparatus for displaying text based upon attributes found within the text
US8886629B2 (en) 2003-04-25 2014-11-11 Mark A. Bluhm Distributed search methods, architectures, systems, and software
WO2006072027A2 (en) * 2004-12-30 2006-07-06 Word Data Corp. System and method for retrieving information from citation-rich documents
US20060149720A1 (en) * 2004-12-30 2006-07-06 Dehlinger Peter J System and method for retrieving information from citation-rich documents
WO2007041688A1 (en) 2005-10-04 2007-04-12 Thomson Global Resources Systems, methods, and software for identifying relevant legal documents
US9177050B2 (en) 2005-10-04 2015-11-03 Thomson Reuters Global Resources Systems, methods, and interfaces for extending legal search results
US7925649B2 (en) * 2005-12-30 2011-04-12 Google Inc. Method, system, and graphical user interface for alerting a computer user to new results for a prior search
US20080071803A1 (en) * 2006-09-15 2008-03-20 Boucher Michael L Methods and systems for real-time citation generation
CA2674294C (en) 2006-12-29 2017-03-07 Thomson Reuters Global Resources Information-retrieval systems, methods, and software with concept-based searching and ranking
US7917493B2 (en) * 2007-04-19 2011-03-29 Retrevo Inc. Indexing and searching product identifiers
US7953724B2 (en) 2007-05-02 2011-05-31 Thomson Reuters (Scientific) Inc. Method and system for disambiguating informational objects
US8700604B2 (en) * 2007-10-17 2014-04-15 Evri, Inc. NLP-based content recommender
US8019769B2 (en) * 2008-01-18 2011-09-13 Litera Corp. System and method for determining valid citation patterns in electronic documents
US10372798B2 (en) 2008-07-11 2019-08-06 Thomson Reuters Global Resources Unlimited Company System and methods for web-based control of desktop applications
CN101866341A (zh) * 2009-04-17 2010-10-20 华为技术有限公司 一种信息推送方法、装置及系统
US8479094B2 (en) * 2009-09-08 2013-07-02 Kenneth Peyton Fouts Interactive writing aid to assist a user in finding information and incorporating information correctly into a written work
JP5992404B2 (ja) 2010-06-15 2016-09-14 トムソン ルーターズ (サイエンティフィック) エルエルシー 参考文献検証のための引用処理、提示および移送用のシステムおよび方法
US11386510B2 (en) 2010-08-05 2022-07-12 Thomson Reuters Enterprise Centre Gmbh Method and system for integrating web-based systems with local document processing applications
US8612586B2 (en) * 2011-12-09 2013-12-17 Facebook, Inc. Notification of social interactions with a networking system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009205674A (ja) * 2008-02-01 2009-09-10 Kanazawa Inst Of Technology 引用判定支援装置および引用判定支援プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023171790A1 (ja) * 2022-03-10 2023-09-14 Ronride株式会社 文章作成支援装置及び文章作成支援プログラム
KR102554452B1 (ko) * 2022-06-21 2023-07-11 한국과학기술정보연구원 메타데이터 추출장치 및 메타데이터 추출 방법

Also Published As

Publication number Publication date
CN104428764B (zh) 2017-09-26
WO2014001915A3 (en) 2014-06-26
CN104428764A (zh) 2015-03-18
JP6403340B2 (ja) 2018-10-10
EP2867798A2 (en) 2015-05-06
US9218344B2 (en) 2015-12-22
WO2014001915A2 (en) 2014-01-03
US20140006424A1 (en) 2014-01-02

Similar Documents

Publication Publication Date Title
JP6403340B2 (ja) 引用を処理、提示、および、推奨するためのシステム、方法、および、ソフトウェア
US11386510B2 (en) Method and system for integrating web-based systems with local document processing applications
US7720856B2 (en) Cross-language searching
JP5992404B2 (ja) 参考文献検証のための引用処理、提示および移送用のシステムおよび方法
US9176938B1 (en) Document referencing system
AU2014318392B2 (en) Systems, methods, and software for manuscript recommendations and submissions
JP2010513997A (ja) オンラインコンピュータ支援翻訳
Malmasi et al. Canary: an NLP platform for clinicians and researchers
US20230394224A1 (en) Offline interactive natural language processing results
Cui et al. Introducing Explorer of Taxon Concepts with a case study on spider measurement matrix building
Meyer Reference accuracy: best practices for making the links
US20090112842A1 (en) Methods and apparatus for web-based research
Teixeira Lopes et al. Assisting health consumers while searching the web through medical annotations
Queder et al. NIDM-Terms: community-based terminology management for improved neuroimaging dataset descriptions and query
WO2018126019A1 (en) Systems, methods, and software for manuscript recommendations and submissions
WO2022076705A1 (en) Enhancing machine learning models to evaluate electronic documents based on user interaction
US10636517B1 (en) Computer-executable application that facilitates provision of a collaborative summary for a care plan
Hutchinson et al. Improving Subject Description of an LGBTQ+ Collection
Thompson et al. Academic Tracker: Software for tracking and reporting publications associated with authors and grants
Marc Assessing Metadata Quality and Terminology Coverage of a Federally Sponsored Health Data Repository
US20230170099A1 (en) Pharmaceutical process
Kapp et al. The searchbuildR shiny app: A new implementation of the objective approach for search strategy development in systematic reviews
Mutlu et al. Automated information extraction for behavioural interventions: evaluation and reflections on interdisciplinary AI development
Kumar et al. The Neuroimaging Data Model Linear Regression Tool (nidm_linreg): PyNIDM Project
Crystal-Ornelas et al. A Guide to Using GitHub for Developing and Versioning Data Standards and Reporting

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160509

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160509

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170602

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20170904

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20170914

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170914

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171006

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180709

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20180717

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180906

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180910

R150 Certificate of patent or registration of utility model

Ref document number: 6403340

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250