JP5438112B2 - Method and apparatus for generating a standard document identifier from a content reference - Google Patents

Method and apparatus for generating a standard document identifier from a content reference Download PDF

Info

Publication number
JP5438112B2
JP5438112B2 JP2011524951A JP2011524951A JP5438112B2 JP 5438112 B2 JP5438112 B2 JP 5438112B2 JP 2011524951 A JP2011524951 A JP 2011524951A JP 2011524951 A JP2011524951 A JP 2011524951A JP 5438112 B2 JP5438112 B2 JP 5438112B2
Authority
JP
Japan
Prior art keywords
issue
website
information
parser
script
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011524951A
Other languages
Japanese (ja)
Other versions
JP2012501490A (en
Inventor
ハワード クリストファー
メイヤー キース
Original Assignee
コピーライト クリアランス センター インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コピーライト クリアランス センター インコーポレイテッド filed Critical コピーライト クリアランス センター インコーポレイテッド
Publication of JP2012501490A publication Critical patent/JP2012501490A/en
Application granted granted Critical
Publication of JP5438112B2 publication Critical patent/JP5438112B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Storage Device Security (AREA)

Description

本発明は、デジタル著作権の表示、ならびに、複数のライセンスおよびサブスクリプションが適用されるコンテンツの再利用権を判定するための方法および装置に関する。著作物、すなわち「コンテンツ」は、作者により作成されるが、一般に再利用に関しては法的規制を受ける。例えば、ほとんどのコンテンツが著作権により保護される。著作権法を守るために、コンテンツのユーザは、コンテンツ再利用ライセンスを入手することが多い。コンテンツ再利用ライセンスは、実際には、コンテンツを異なる形式で表す権利、コンテンツを異なる形式で再現する権利、派生著作物を制作する権利、等を含む権利の「束」である。従って、特定の再利用に依存して、再利用に対する特有のライセンスを取得しなければならないであろう。   The present invention relates to a method and apparatus for determining digital copyright indication and content reuse rights to which multiple licenses and subscriptions apply. The work, or “content”, is created by the author, but is generally subject to legal restrictions regarding reuse. For example, most content is protected by copyright. In order to comply with copyright laws, content users often obtain content reuse licenses. The content reuse license is actually a “bundle” of rights including the right to express the content in different formats, the right to reproduce the content in different formats, the right to produce derivative works, and so on. Thus, depending on the particular reuse, a unique license for reuse will have to be obtained.

多くの組織が、様々な目的でコンテンツを利用するが、これには調査および知識労働が含まれる。これらの組織は、発行元から直接コンテンツを購入する、サブスクリプションを介してサブスクリプション再販業者からコンテンツを購入する、など多くの経路を介してコンテンツを入手する。サブスクリプションには、一般にサブスクライバへ譲渡されるいくつかの再利用権が含まれる。所与のサブスクリプションサービスは、一般にそのサブスクリプション全体に標準設定の権利を提供しようとするものであるが、多くの顧客が、そのサービスと交渉して追加の権利を取得することが良くある。従って再利用権は、サブスクリプションによって異なり、特定のサブスクリプションで利用可能な再利用権が、そのサブスクリプション範囲内でも発行物によって異なることがある。加えてこれらのサブスクリプションにおいて譲渡された再利用権は、ライセンスクリアリングハウスから、または他の発行元から購入された他の権利およびライセンスと重複することが多い。   Many organizations use content for a variety of purposes, including research and knowledge labor. These organizations obtain content via a number of channels, such as purchasing content directly from publishers, purchasing content from subscription resellers via subscriptions, and so on. A subscription typically includes a number of reuse rights that are transferred to subscribers. A given subscription service generally seeks to provide default rights for the entire subscription, but many customers often negotiate with the service to obtain additional rights. Accordingly, the reuse right varies depending on the subscription, and the reuse right available for a specific subscription may vary depending on the issue even within the scope of the subscription. In addition, reuse rights transferred in these subscriptions often overlap with other rights and licenses purchased from license clearinghouses or from other publishers.

多くの知識労働者は、権利者の正当な権利を侵害することの無いように、あるコンテンツでどの権利が有効かを、そのコンテンツを利用する前に判定しようとする。しかし現在、任意の所与の発行物について何の再利用権を組織が有するかを判定することは、時間がかかる手作業であり、一般にコンテンツの提供者から取得される、および他の購入元から購入される、コンテンツおよびその利用に関連する可能性のある全てのライセンス契約を、利用に先だって再検討する司書または弁護士を必要とする。この判定は困難であることから、権利に関して既に支払いが生じていて、その権利を購入するために、過剰に出費してしまうことがあるということである。あるいは、知識労働者は、再利用権のライセンスを組織が有していると思い込んでいるが、実際には有しておらず知識労働者が再利用権を侵害するリスクがある。   Many knowledge workers try to determine which rights are valid for a piece of content before using it, so as not to infringe the rightful rights of the right holder. Currently, however, determining what reuse rights an organization has for any given issue is a time consuming manual process, typically obtained from the content provider, and other sources Requires a librarian or attorney to review all license agreements purchased from the site and any potential licensing related to its use prior to use. Since this determination is difficult, payment for the right has already occurred, and excessive spending may be required to purchase the right. Alternatively, knowledge workers assume that the organization has a license for reuse rights, but do not actually have the risk that knowledge workers will violate reuse rights.

所与の発行物にどの権利を適用するかを判定する際の問題の1つは、正しい契約を検査して何の権利が組織に利用可能であるかを判定することができるようにするために、その発行物を、権利を譲渡する1つまたは複数の契約に結びつけることである。この結びつけを行うための従来技術の方法のひとつは、発行物に特別の「タグ」を埋め込むことである。例えば、調査のために後で発行物を開く時、タグがアクティブにされ、ウェブサイト等の、権利契約が配置される指定の場所にユーザを導かせることができる。この契約では、効力がある間は、各発行物が特別のタグを含むことが要求される。これは新しく発行される発行物に対して実現可能であるが、より古い発行物を特別のタグを付けて再発行することは禁止されるだろう。従ってこのシステムは多くの既存の発行物には使用できない。   One issue in determining which rights apply to a given issue is to be able to examine the correct contract to determine what rights are available to the organization. In other words, the issue is tied to one or more contracts that transfer rights. One prior art method for making this connection is to embed a special “tag” in the publication. For example, when a publication is later opened for investigation, the tag can be activated to direct the user to a designated location where the rights agreement is located, such as a website. This contract requires each issue to include a special tag for the duration of the contract. This is feasible for newly issued publications, but republishing older publications with special tags would be prohibited. Therefore this system cannot be used for many existing publications.

発行物の権利の所在を探るユーザは、発行物のユニバーサルリソースロケータすなわち発行物に関連するURLしかを持たない者が多い。そのようなURLの主要な目的は、インターネット等のネットワーク上のどこで発行物のコピーを探すことができるかを示すことである。従って、URLは、通常、発行物自体を直接特定することはない。一方、多くのURLが、発行物の特定に有用な情報を含有する。しかしそのような有用な情報が、発行元またはクリアリングハウスに依存するURL内の種々の場所で探せるような現在標準のURLの構成は存在しない。さらにこのような有用な情報は、種々の方法でコーディングされるかもしれない。従って、特定のURLから情報を抽出することは難しい。   Many users who seek the location of the rights of a publication have only a universal resource locator of the publication, i.e., a URL associated with the publication. The primary purpose of such a URL is to indicate where on the network, such as the Internet, where a copy of the publication can be found. Thus, the URL usually does not directly identify the issue itself. On the other hand, many URLs contain information useful for identifying the issue. However, there is currently no standard URL configuration in which such useful information can be found at various locations within the URL depending on the publisher or clearinghouse. Further, such useful information may be coded in various ways. Therefore, it is difficult to extract information from a specific URL.

さらに別の場合においては、URLでさえ利用できない。例えば発行物のタイトル、作者、発行物が含まれる著作物、および発行の年、または前述の情報の何らかの組み合わせ等の基本情報しか、作業者が閲覧しているウェブページのテキストで見ることができない。あるいは作業者が閲覧している発行物には、前述の情報を含有する要約または文献一覧のページ等の別のウェブページへの参照が含まれるかもしれない。このようなウェブページは各々異なる特別な形式を有するため、入手可能な権利を特定するのに必要な情報(コンテンツ「メタデータ」と呼ばれる)を、個々のページ上のどこで探すべきなのかさえ判定することが困難である。   In yet another case, even a URL cannot be used. Only basic information such as the title of the issue, the author, the work that contains the issue, and the year of issue, or some combination of the above information can be seen in the text of the web page that the worker is browsing. . Alternatively, the publication that the operator is browsing may include a reference to another web page, such as a summary or document list page containing the information described above. Since each of these web pages has a different special format, it can even determine where on the individual page the information needed to identify the available rights (called content “metadata”) should be looked for Difficult to do.

本発明の原理に従って、知識労働者が作業しているウェブサイトのドメイン名が、権利アドバイザのウェブサイトに送られる。権利アドバイザのウェブサイトでは、そのドメイン名を使用して、ドメインに特有のパーサ(構文解析)プログラムを取得する。パーサプログラムは、次に、知識労働者が情報を閲覧しているブラウザに送り返され、知識労働者が作業しているウェブサイトからコンテンツメタデータを抽出する。抽出されたコンテンツメタデータは、権利アドバイザのウェブサイトに返され、発行物に関連する権利を判定するために使用される。   In accordance with the principles of the present invention, the domain name of the website on which the knowledge worker is working is sent to the website of the rights advisor. The Rights Advisor website uses the domain name to obtain a domain-specific parser program. The parser program is then sent back to the browser where the knowledge worker is browsing the information to extract the content metadata from the website where the knowledge worker is working. The extracted content metadata is returned to the rights advisor website and used to determine the rights associated with the publication.

一実施形態において、パーサプログラムがコンテンツメタデータをブラウザ内に表示されるウェブページから抽出する。   In one embodiment, the parser program extracts content metadata from web pages displayed in the browser.

別の実施形態において、パーサプログラムは、ブラウザ内に表示されているウェブページからコンテンツメタデータを含有する別のウェブページへナビゲートし、その別のページからコンテンツメタデータを抽出する。   In another embodiment, the parser program navigates from a web page displayed in the browser to another web page containing content metadata and extracts content metadata from the other page.

さらに別の実施形態において、パーサを介して権利アドバイザのウェブサイトから返される、発行物のタイトル等のコンテンツメタデータは、「正規化」されて標準の識別子が取得され、その標準の識別子を使用してコンテンツの権利が判定される。   In yet another embodiment, content metadata, such as issue titles, returned from the Rights Advisor website via a parser is “normalized” to obtain a standard identifier and uses that standard identifier. Thus, the content right is determined.

さらに別の実施形態において、URLがコンテンツに関連付けられると、権利アドバイザのウェブサイトは、そのURLを使用してコンテンツの標準の識別子の探索を試み、それと同時に、ウェブサイトのドメインに特有であり、ウェブページ上のコンテンツに関連する情報を探すことができるパーサプログラムの取得を試みる。   In yet another embodiment, when a URL is associated with the content, the Rights Advisor website attempts to search for the standard identifier of the content using that URL, while at the same time being unique to the website domain; Attempt to obtain a parser program that can find information related to content on a web page.

高レベルの形式で発明の権利配置システムの基本アーキテクチャを示すブロック概略図である。1 is a block schematic diagram showing the basic architecture of an inventive rights allocation system in a high level form. ブックマークレットスクリプト情報を記憶するためのデータベース内におけるテーブル配列を示す図である。It is a figure which shows the table arrangement | sequence in the database for memorize | storing bookmarklet script information. ウェブブラウザにおける従来の検索エンジンにより表される典型的な画面表示である。It is the typical screen display represented by the conventional search engine in a web browser. キーワード「nature methods」がテキストボックスに入力された時に、検索エンジンにより探索されるコンテンツの典型的な表示を示す図である。この図面は、権利アドバイザのウェブページへのハイパーリンクを示す。It is a figure which shows the typical display of the content searched by a search engine, when the keyword "nature methods" is input into the text box. This drawing shows a hyperlink to the rights advisor web page. 要求される使用のタイプの権利を判定かつ解明するための例示の処理におけるステップを示すフローチャートである。FIG. 6 is a flow chart showing the steps in an exemplary process for determining and resolving the type of usage rights required. 契約の構成要素を例示するブロック概略図である。It is a block schematic diagram which illustrates the component of a contract. 発行の識別子探索装置における構成要素を例示するブロック概略図である。It is the block schematic diagram which illustrates the component in the identifier search apparatus of issue. 図8Bと共に、図7に示す装置により処理が実行される発行識別子を探索するための例示の処理におけるステップを示すフローチャートである。FIG. 8B is a flowchart illustrating steps in an exemplary process for searching for an issue identifier that is executed by the apparatus illustrated in FIG. 7 together with FIG. 8B. 図8Aと共に、図7に示す装置により処理が実行される発行識別子を探索するための例示の処理におけるステップを示すフローチャートである。FIG. 8B is a flowchart illustrating steps in an exemplary process for searching for an issue identifier that is executed by the apparatus illustrated in FIG. 7 together with FIG. 8A. URLパーサおよびメタデータ構文解析スクリプトを記憶するためのデータベースにおけるテーブル配列を示す図である。It is a figure which shows the table arrangement | sequence in the database for memorize | storing a URL parser and a metadata parsing script. ISSN(International Standard Serial Number(国際標準逐次刊行物番号))識別子がページ内に埋め込まれる、定期刊行物のウェブサイトのスクリーンショットを示す図である。FIG. 5 shows a screenshot of a periodicals website where an ISSN (International Standard Serial Number) identifier is embedded in the page. 図10に示すウェブページを従来のウェブブラウザに表示するために使用されるHTMLコードを示し、そのようなウェブページをどのように構文解析して識別子を取り出すかを例示する図である。It is a figure which shows the HTML code used in order to display the web page shown in FIG. 10 on the conventional web browser, and how to parse such a web page and take out an identifier.

図1は、本発明の原理に従って構成される一実施形態100を例示するブロック概略図である。いくつかの場合において、顧客は、ウェブブラウザ102における従来の検索エンジンを使用して、コンテンツを検索しそのコンテンツを表示領域103に表示することができる。「ブックマークレット」と呼ばれる小さな実行可能プログラムをダウンロードすることにより、ウェブブラウザ102は、本発明の原理に従って、ブラウザに「権利アドバイザ」のウェブサーバと対話させるよう変更されている。そのようなプログラムは、例えば、Javascriptプログラムとすることができ、これは特定のURLドメインまたは1組のURLドメインについて特有のものである。   FIG. 1 is a block schematic diagram illustrating one embodiment 100 constructed in accordance with the principles of the present invention. In some cases, the customer can use a conventional search engine in the web browser 102 to search for content and display the content in the display area 103. By downloading a small executable program called a “bookmarklet”, the web browser 102 has been modified to allow the browser to interact with the “rights advisor” web server in accordance with the principles of the present invention. Such a program can be, for example, a JavaScript program, which is specific for a particular URL domain or set of URL domains.

図2は、種々のブックマークレットスクリプトに対応するスクリプトテキストを記憶するための1組のデータベーステーブル200を例示する。これらのテーブルには、URLのマップキーを指定するURLの基本キーテーブル204が含まれ、各URLのマップキーは特定のブックマークレットスクリプトが適用される1組のURLを特定する。基本キーテーブル204の各レコードには、URLマップキー識別子(URL_MAPKEY_ID)、マップキーの名称(URL_MAPKEY_BASE)、およびそのマップキーに適用される特定のブックマークレットテキストを指定する識別子(BOOKMARKLET_SCRIPT_ID)が含まれる。各ドメインマップの要素であるURLドメインは、URLドメインテーブル206内に指定される。URLドメインテーブル206にはレコードが格納され、各レコードには、URLドメイン識別子(URL_DOMAIN_ID)、ドメインが属するドメインマップを指定するマップキー識別子(URL_MAPKEY_ID)、ドメイン名(URL_DOMAIN)、URL構成ファイル(URL_CONFIG_XML)、主パーサ識別子(URL_PRIMARY_PASER)、および関連するブックマークレットスクリプトの識別子(BOOKMARKLET_SCRIPT_ID)、が含まれる。ブックマークレットスクリプトは、特定のドメインに対して指定される場合、そのドメインが属するドメインマップに対して指定される任意のスクリプトよりも優先される。   FIG. 2 illustrates a set of database tables 200 for storing script text corresponding to various bookmarklet scripts. These tables include a URL basic key table 204 for specifying URL map keys, and each URL map key identifies a set of URLs to which a particular bookmarklet script is applied. Each record of the basic key table 204 includes a URL map key identifier (URL_MAPKEY_ID), a map key name (URL_MAPKEY_BASE), and an identifier (BOOKMARKMARK_SCRIPT_ID) that specifies a specific bookmarklet text to be applied to the map key. The URL domain that is an element of each domain map is specified in the URL domain table 206. Records are stored in the URL domain table 206. Each record includes a URL domain identifier (URL_DOMAIN_ID), a map key identifier (URL_MAPKEY_ID) designating a domain map to which the domain belongs, a domain name (URL_DOMAIN), and a URL configuration file (URL_CONFIG_XML). , The main parser identifier (URL_PRIMARY_PASER), and the identifier of the associated bookmarklet script (BOOKMARKLET_SCRIPT_ID). When a bookmarklet script is specified for a particular domain, it takes precedence over any script specified for the domain map to which that domain belongs.

ブックマークレットスクリプトは、ブックマークレットスクリプトテーブル208において特定される。テーブル208の各レコードは、スクリプト識別子(SCRIPT_ID)、特定のスクリプトを選択するためのキー(SELECT_KEY)、スクリプトが有効であるかどうかを示す指標、スクリプトをどのようにダウンロードし実行するかの判定に使用される、種々のタイミングおよび再試行のパラメータを格納する。実際のスクリプトテキストは、バージョン管理テキストテーブル210に記憶される。このバージョン管理テキストテーブルはレコードを格納し、各レコードには、テキスト識別子(VTEXT_ID)、テキスト型(VTEXT_TYPE_ID)、レビジョン(改訂)番号(REVISION_NUM)、および実際のテキスト(CONTENT)が含まれる。このテキストテーブルには、型のフィールドで示されるようなスクリプトテキストおよびURL構成の両方が記憶される。スクリプトが変更されると、そのレコードは上書されない。その代わり、新しいレコードがテキストテーブルに挿入される。これにより、必要に応じて、以前のスクリプトのバージョンの見直しおよび逆戻しが可能になる。   The bookmarklet script is specified in the bookmarklet script table 208. Each record of the table 208 includes a script identifier (SCRIPT_ID), a key for selecting a specific script (SELECT_KEY), an index indicating whether or not the script is valid, and how to download and execute the script. Stores various timing and retry parameters used. The actual script text is stored in the version control text table 210. This version control text table stores records, and each record includes a text identifier (VTEXT_ID), a text type (VTEXT_TYPE_ID), a revision number (REVISION_NUM), and an actual text (CONTENT). This text table stores both script text and URL structure as shown in the type field. If the script is changed, the record is not overwritten. Instead, a new record is inserted into the text table. This allows review and reversion of previous script versions as needed.

図3は、そのような検索エンジンにより表される典型的な画面表示を示す。ウェブブラウザ300には、検索フィールド302が含まれ、検索フィールド302には、検索語句を受け入れるためのテキストボックス304、および検索語句が含まれるテキストを有する発行物の検索を起動するためのコマンドボタン306が含まれる。ウェブブラウザ300は、本発明の原理に従って、ブラウザに「権利アドバイザ」プログラムと対話させる「ブックマークレット」と呼ばれる小さな実行可能プログラムを含むように変更されている。   FIG. 3 shows a typical screen display represented by such a search engine. The web browser 300 includes a search field 302 that includes a text box 304 for accepting a search term and a command button 306 for launching a search for a publication having text that includes the search term. Is included. Web browser 300 has been modified in accordance with the principles of the present invention to include a small executable program called a “bookmarklet” that causes the browser to interact with a “rights advisor” program.

図4は、キーワード「nature methods」が、ブラウザ400の検索フィールド402内のテキストボックス404に入力され、かつコマンドボタン406が選択されると、検索エンジンにより配置されるコンテンツの典型的な表示を示す。検索結果が、リストボックス407内の複数の行408から418として示される。各行には、検索で探索される記事に関する情報が含まれる。図4に例示される検索エンジンにより、記事のタイトル、発行元、およびその記事を含む発行物に関連付けられる標準の識別番号を含む情報が表示される。   FIG. 4 shows an exemplary display of content placed by the search engine when the keyword “nature methods” is entered into the text box 404 in the search field 402 of the browser 400 and the command button 406 is selected. . The search results are shown as a plurality of rows 408 to 418 in the list box 407. Each line includes information about an article searched by the search. The search engine illustrated in FIG. 4 displays information including the title of the article, the publisher, and the standard identification number associated with the publication that contains the article.

各記事では、その情報が、記事に関連する権利をユーザが配置および表示することを可能にするブックマークレットにより生成されるハイパーリンクと関連付けされている。例えば、行408には、その行内に表示される「Nature Methods」の記事の権利をユーザが探索および表示することを可能にするハイパーリンク420が含まれる。同様に、行410から418には、それらの行に表示される記事に関連する権利を探索および閲覧するためのハイパーリンク422から430が含まれる。   In each article, that information is associated with a hyperlink generated by a bookmarklet that allows the user to place and display the rights associated with the article. For example, row 408 includes a hyperlink 420 that allows the user to search and display the rights to articles of “Nature Methods” displayed within that row. Similarly, lines 410 to 418 include hyperlinks 422 to 430 for searching and browsing for rights associated with articles displayed in those lines.

これとは別に、記事に関連するURLでは、発行元またはその記事を含む発行物を参照されない場合がある。例えば、ユーザは、文書の異なる部分を示すURLまたは発行元および発行物を特定するテキスト情報を含む文献一覧を示すURLを含む文書の全文を調査しているかもしれない。あるいは、その文書の全文のページがいずれのURLも含まないことがある。その代わり、発行元および発行物を特定するテキスト、または発行元および発行物を示すURLを、別のウェブページ上、例えば文献一覧ページまたは最初の文書情報ページ上に配置させることができる。情報の配置および形式は、一般に個々のドメインまたはウェブサイトに特有のものであり、ドメインを含む、ウェブサイトのURLのみが利用可能なものの全てである場合がある。しかし、本発明の原理に従って、URLを構文分析することにより、またはウェブページ上の他のテキスト情報に埋め込まれる記事の識別情報を検索することにより、記事を特定することができる。さらに、URL構文解析機構およびテキスト検索を、様々な形式が適応できるように、ドメインごとに仕立てることができる。   Apart from this, the URL related to the article may not refer to the publisher or the publication containing the article. For example, the user may be examining the full text of a document that contains URLs that indicate URLs that indicate different parts of the document or URLs that list text that identifies the publisher and issue. Alternatively, the full text page of the document may not contain any URL. Instead, text identifying the publisher and issue, or a URL indicating the publisher and issue, can be placed on another web page, for example, on the literature list page or the first document information page. The arrangement and format of the information is generally specific to an individual domain or website, and may be all that is available only for the URL of the website, including the domain. However, in accordance with the principles of the present invention, articles can be identified by parsing URLs or searching for article identification information embedded in other text information on a web page. Furthermore, the URL parsing mechanism and text search can be tailored for each domain so that various formats can be adapted.

図1に戻り、ハイパーリンクが選択されると、ブックマークレット104は、ウェブブラウザ102に、権利クリアリングハウスに配置されたサーバによりホストされる権利アドバイザのウェブページ108にアクセスさせる。ウェブページ108にアクセスがあると、ブックマークレットは、要素(member)、および表示される記事の権利が取り出されて表示される間の「セッション」を特定するのに使用される一意的なブックマークレットキーを生成する。ブックマークレットは、また、記事に関する任意の利用可能な情報を権利アドバイザのウェブページ108に送信する。権利アドバイザのウェブページ108は、記事情報を使用して、記事に関連する権利を試み、探索する。加えて、発明の原理に従って、権利アドバイザのウェブページを表示するウェブサーバは、また、記事に関する追加の情報の探索を試行するために、表示される記事が読み出された元のウェブサイトを検索する。   Returning to FIG. 1, when a hyperlink is selected, the bookmarklet 104 causes the web browser 102 to access the rights advisor web page 108 hosted by a server located in the rights clearinghouse. When the web page 108 is accessed, the bookmarklet is a unique bookmarklet that is used to identify the element and the "session" during which the rights of the displayed article are retrieved and displayed. Generate a key. The bookmarklet also sends any available information about the article to the rights advisor web page 108. The rights advisor web page 108 uses the article information to try and search for rights associated with the article. In addition, in accordance with the principles of the invention, the web server that displays the rights advisor web page also searches the original website from which the displayed article was read to attempt to find additional information about the article. To do.

権利を探索および決定するために権利アドバイザのウェブページ108により実行される処理は、図5を参照して説明する。この処理は、ステップ500で開始され、ステップ502に進み、そこで、権利アドバイザのウェブページ108は、記事情報、組織構成員コンテキスト、および所望の使用のタイプを、ブックマークレット104から受け取る。組織に入手可能な権利が、権利データベース112に記憶される契約により定義される。権利データベース112は、コンテンツ識別子とは別のテーブルに権利が記憶される、複数のテーブルとして構成される。そのようなデータベースは、米国特許No.5,991,876に詳細に記載されており、その内容を参照することにより全体が組み込まれる。特に、権利データベース112は、契約に関する情報を格納する。   The process performed by rights advisor web page 108 to search and determine rights is described with reference to FIG. The process begins at step 500 and proceeds to step 502 where the rights advisor web page 108 receives article information, organization member context, and the type of usage desired from the bookmarklet 104. Rights available to the organization are defined by contracts stored in rights database 112. The rights database 112 is configured as a plurality of tables in which rights are stored in a table different from the content identifier. Such a database is described in US Pat. No. 5,991,876, which is incorporated by reference in its entirety. In particular, the rights database 112 stores information about contracts.

契約とは、組織がコンテンツの二次利用に関する権利を取得または表現する際に従うべきいずれかの構造である。そのような契約は、権利クリアリングハウスから取得される一群の発行物全体についての著作権ライセンスを含むことができるだろう。そのような契約の例には、米国著作権料精算センターから取得される年次著作権ライセンスがある。契約は、また発行元により直接作成することもでき、例えば発行元エルゼビアによるPharmaceutical Documentation Ringの契約がある。例えば、イギリスのCopyright Licensing Agencyによる規約等のような、他の複製権機構(Reproductive Rights Organizations)による別のタイプの契約を作成することもでき、契約は、また種々のコンテンツアグリゲータから取得することもできる。そのようは契約に、Factiva社のライセンスがある。契約は、成文法により暗黙に示されることもでき、例えばスイス法では、スイスの企業はロイヤリティなしでコンテンツを共有することができる。さらに別の契約には、会社ポリシーが含まれる。   A contract is any structure that an organization must follow when it acquires or represents a right to secondary use of content. Such a contract could include a copyright license for the entire group of publications acquired from the rights clearinghouse. An example of such a contract is an annual copyright license obtained from the US Copyright Fee Settlement Center. The contract can also be created directly by the publisher, for example, a Pharmaceutical Document Ring contract by the publisher Elsevier. Other types of contracts can be created by other Reproductive Rights Organizations, such as, for example, by the UK's Copyright Licensing Agency, and contracts can also be obtained from various content aggregators. it can. Such a contract has a license from Factiva. Contracts can also be implied by grammar, eg Swiss law allows Swiss companies to share content without loyalty. Yet another contract includes company policy.

ステップ504にて、権利アドバイザ108は、矢印114で示すように権利データベースにアクセスし、組織に使用される全ての契約を取り出す。権利データベース112で表されるような契約600の構成要素を図6に示す。これらの構成要素には、適用範囲602、含まれるタイトル610、権利620および条件621が含まれる。適用範囲602は、構成員コンテキストまたは種々の制約を指定し、組織構成員は、契約の対象とされるように適合しなければならず、かつ3つの変数、すなわち国、場所、および組織で定義される属性、により定められる。国変数は、アメリカ合衆国またはフランス等の、世界中の国籍に対応する値を有する。場所変数は、ウォルサムの所在地、またはウィルミントンの所在地等の、組織の種々の所在地の場所に対応する値を有する。組織定義の変数は、組織内において、その組織の構成員に契約が適用されるかどうかを判定する任意の値を有することができる。例えば、変数は、組織の構成員が、マーケティング部の一員または研究開発部の一員でなければならないことなど、契約の対象とされるように指定する。国、場所、および組織定義の変数には、契約が他の適用範囲変数に合う任意の構成員コンテキストに適用されることを示す値「any」が割り当てられる。例えば、組織定義の変数には、値「any」が適用されるが、この場合、契約は、国および場所の適用範囲変数に適合する任意の構成員に適用される。   At step 504, rights advisor 108 accesses the rights database as indicated by arrow 114 to retrieve all contracts used for the organization. The components of the contract 600 as represented in the rights database 112 are shown in FIG. These components include scope 602, included title 610, right 620 and condition 621. Scope 602 specifies a member context or various constraints, the organization member must be adapted to be covered by the contract, and is defined by three variables: country, location, and organization Attribute. Country variables have values corresponding to nationalities around the world, such as the United States or France. The location variable has a value corresponding to the location of various locations in the organization, such as the location of Waltham or the location of Wilmington. An organization-defined variable can have any value within an organization that determines whether a contract applies to members of that organization. For example, a variable specifies that an organization member is subject to a contract, such as that it must be a member of a marketing department or a research and development department. The country, location, and organization-defined variables are assigned the value “any” indicating that the contract applies to any member context that matches the other scope variables. For example, the value “any” applies to organization-defined variables, in which case the contract applies to any member that meets the country and location scope variables.

契約600には、また、契約600が対象とする発行物またはタイトルの標示610が含まれる。契約600は、発行物が任意に分類されるコレクション612に適用することができる。例えば、契約を、EBSCOサブスクリプションパッケージに含まれる全てのタイトルに適用することができる。これは、「公の」コレクションであるとみなすことができ、含まれるタイトルは情報提供業者により定義され、パッケージの全ての購入者に対して標準となる。別の手法としては、「個人の」コレクションがある。例えば、組織は、EBSCO等のプロバイダから「アラカルト」サブスクリプションを作成することができる。契約600は、また、コレクション612に加えて、またはコレクション612に代えて、別個の発行物616に適用することができる。   The contract 600 also includes an indication 610 of the issue or title targeted by the contract 600. The contract 600 can be applied to a collection 612 in which publications are arbitrarily classified. For example, a contract can be applied to all titles included in an EBSCO subscription package. This can be considered a “public” collection, the titles included are defined by the information provider and are the standard for all purchasers of the package. Another approach is a “personal” collection. For example, an organization can create an “à la carte” subscription from a provider such as EBSCO. Contract 600 can also be applied to a separate publication 616 in addition to or instead of collection 612.

契約の第3の構成要素は、契約に関連する権利620である。各権利は、特有の使用タイプに関連付けられる。契約を標準化するために、1組の明瞭な権利が予め定められる。以下の検討において、1組の明瞭な使用タイプが、発行物に対して予め定められる。しかし、当業者が理解するように、1組の予め定められた権利は、明瞭な権利を事実上含むものである。例えば、例示の1組の予め定められた権利に含まれるものには、(1)発行物のコピーを組織の構成員に電子メールで送信すること、(2)発行物のコピーを組織の構成員ではない人に電子メールで送信すること、(3)発行物のコピーをローカルハードドライブに記憶すること、(4)発行物のコピーを共有ネットワークドライブに記憶すること、(5)発行物のコピーを読み取って組織の構成員に電子メールで送信すること、(6)発行物のコピーを読み取って組織の構成員ではない人に電子メールで送信すること、(7)発行物をフォトコピーして組織の構成員と共有すること、(8)発行物をフォトコピーして組織の構成員ではない人と共有すること、(9)印刷された発行物のコピーを組織の構成員と共有すること、(10)印刷された発行物のコピーを組織の構成員ではない人と共有すること、(11)Lotus Notes(商標)を使用して発行物のコピー共有すること(12)発行物のコピーをインターネットのサイトにアップロードすること、(13)発行物のコピーを広告の目的で掲示すること、(14)発行物のコピーを電子ペーパ(ソフト広告)にアップロードすること、が含まれる。顧客は、自分独自の使用タイプを定義することができるが、これらの顧客の使用タイプは、14個の予め定められた使用タイプの内の1つに対応していなければならない。   The third component of the contract is a right 620 associated with the contract. Each right is associated with a specific usage type. In order to standardize the contract, a set of distinct rights is predetermined. In the following discussion, a set of distinct usage types is predetermined for a publication. However, as those skilled in the art will appreciate, a set of predetermined rights effectively includes distinct rights. For example, an exemplary set of predetermined rights includes (1) sending a copy of the issue to an organization member by email, and (2) configuring a copy of the issue in the organization. E-mail to non-members, (3) store a copy of the issue on the local hard drive, (4) store a copy of the issue on a shared network drive, (5) issue of the issue Reading a copy and sending it to an organization member by e-mail; (6) Reading a copy of the issue and sending it to a person who is not a member of the organization; (7) Photocopying the issue. (8) Photo-copy the publication and share it with someone who is not a member of the organization. (9) Share a printed copy of the publication with the organization member. (10) Printing (11) Share a copy of the publication using Lotus Notes ™ (12) Copy the publication to an Internet site Uploading, (13) posting a copy of the publication for advertising purposes, and (14) uploading a copy of the publication to electronic paper (soft advertisement). Customers can define their own usage types, but these customer usage types must correspond to one of 14 predetermined usage types.

権利は、各使用タイプに関連付けすることができる。加えて、権利は、矢印622で示すように、契約600に対して指定することができ、矢印624で示すように、契約が対象とするコレクションに対して指定することができ、または矢印626で概略的に示すように、そのコレクション内の個々の発行物に対して指定することができる。権利は、また矢印628で示すように、契約が個々に対象とする別個の発行物に対して割り当てることができる。   Rights can be associated with each usage type. In addition, rights may be specified for the contract 600, as indicated by arrow 622, may be specified for the collection covered by the contract, as indicated by arrow 624, or by arrow 626. As shown schematically, it can be specified for individual publications in the collection. Rights may also be assigned to separate issues that the contract individually targets, as indicated by arrow 628.

条件621も、また各契約に関連付けすることができる。条件は、権利者条件、権利としてプログラムでは表現することができない制約条件、例えば発行物を他のスイスの従業員と共有することを可能にするスイス法等の特定の成文法、および会社ポリシーが含まれる。条件は、発行物、コレクションおよび契約のレベルで割り当てることができる。一般的に、権利に関連する条件には、「制限的」または「非制限的」というタグが付けられる。「制限的」というタグは、関連する権利(発行物をフォトコピーする権利等)が、条件のテキストにより制限される(例えば、制限的条件としては、「内部配布のみ可能」などがある)ことを示す。「非制限的」というタグは、条件が権利の適用性の制限をしないことを示すが、おそらくこれは、条件が、許可される動作の範囲を拡大するからである(例えば、非制限的条件には「本コンテンツのフォトコピーを配布することに制限は無い」などがある)。   A condition 621 can also be associated with each contract. Conditions include rights holders, restrictions that cannot be expressed in the program as rights, eg specific syntactics such as Swiss law that allow publications to be shared with other Swiss employees, and company policies It is. Conditions can be assigned at the issue, collection and contract level. In general, rights-related conditions are tagged as “restrictive” or “non-restrictive”. The tag “Restrictive” has related rights (such as the right to photocopy publications) restricted by the text of the condition (for example, “Restrictive conditions include“ only internal distribution is possible ”) Indicates. The tag “non-restrictive” indicates that the condition does not limit the applicability of rights, perhaps because the condition expands the range of permitted actions (eg, non-restrictive conditions). "There are no restrictions on distributing photo copies of this content").

図5に戻ると、ステップ506にて、矢印120で示すように、権利アドバイザは、メタデータデータベース122にアクセスし、構成員が要求した権利情報の記事が含まれている発行物の標準の番号を取るよう試行する。これは、任意の取り出される契約がその発行物に適用可能であるかどうかを判定するためである。本発明の原理に従って、権利アドバイザは、並行して実行される2つの別個の方法を使用して、発行物の探索を試みる。   Returning to FIG. 5, at step 506, as indicated by arrow 120, the rights advisor accesses the metadata database 122 and the standard number of the publication that contains the article of rights information requested by the member. Try to take. This is to determine if any retrieved contract is applicable to the issue. In accordance with the principles of the present invention, Rights Advisor attempts to search for publications using two separate methods that are performed in parallel.

第1の方法に従うと、権利アドバイザは、構成員のブラウザから受け取った情報を使用して、発行物を探索しようとする。この情報に、記事のタイトル、および発行物のISSN番号またはISBN番号等の認証された標準の識別番号が含まれる場合は、この情報だけ使用して発行物の探索が可能であろう。しかしいくつかの場合において、記事のURLしか利用できない場合がある。記事のURLは、任意に付されることが多く、それ自体では、所与の記事が、認証された標準の識別子を持つ発行物に掲載されたものかどうかを判定するための一貫した意味を持つものではない。従って権利アドバイザのウェブページ108は、URLをそこで利用可能な標準的な識別子にマッピングまたは変換することを試みる。この標準の識別子を使用して、権利アドバイザのウェブページ108は、メタデータデータベース122にアクセスして発行物を特定する標準の番号を取得することができる。この標準の番号は、指定される発行物にどの契約を適用するかを組織が判定するために、取り出された契約に使用することができる。   According to the first method, the rights advisor attempts to search for publications using information received from the member's browser. If this information includes the title of the article and an authenticated standard identification number, such as the ISSN number or ISBN number of the issue, only this information could be used to search for the issue. However, in some cases, only the article URL may be available. Article URLs are often given arbitrarily and, as such, provide a consistent meaning for determining whether a given article is published in a publication with an authenticated standard identifier. I don't have it. Accordingly, the rights advisor web page 108 attempts to map or convert the URL to a standard identifier available there. Using this standard identifier, rights advisor web page 108 can access metadata database 122 to obtain a standard number identifying the issue. This standard number can be used for retrieved contracts to allow the organization to determine which contract applies to the specified issue.

権利アドバイザにより実行されるURLのマッピングは、様々なURLパーサに依存するもので、各パーサは、構文解析アルゴリズム、およびURL形式の支援データベース118を使用する。特に権利アドバイザプログラム108は、どのパーサが特定のURLに利用可能であるかを判定するための1組の規則、および特定のURLをURLマッピングタスクに有効なウェブサイト特有の識別子に分離することが可能な1組のパーサを使用する。これらの特有の識別子が取得されると、矢印116で示すようにウェブサイト特有の識別子を、ISSNまたはISBNの識別子等の標準の識別子に変換するための規則のデータベース118に適用される。標準の識別子が取得されると、矢印114で示すように発行物に対して標準の識別子により入力されるデータベース112に適用される。このデータベース112は、発行物のタイトル、および発行物が使用可能である際に従うべき権利を列挙する。   The URL mapping performed by the rights advisor depends on various URL parsers, and each parser uses a parsing algorithm and a support database 118 in URL format. In particular, rights advisor program 108 may separate a set of rules to determine which parsers are available for a particular URL, and a specific URL into a website-specific identifier that is valid for a URL mapping task. Use one possible set of parsers. Once these unique identifiers are obtained, they are applied to a database of rules 118 for converting website-specific identifiers into standard identifiers, such as ISSN or ISBN identifiers, as indicated by arrow 116. Once the standard identifier is obtained, it is applied to the database 112 that is entered with the standard identifier for the issue as indicated by arrow 114. This database 112 lists the titles of publications and the rights to follow when the publications are available.

標準の識別子を記事情報から取得するための装置700を図7に例示し、探索処理のステップを図8Aおよび図8Bに例示する。探索処理はステップ800で開始され、ステップ802に進み、そこで表示される記事に関する情報702を構成員のウェブブラウザ102から受け取る。ステップ804にてブラウザから受け取った情報内に存在するタイトルまたは任意の標準の番号等の情報を使用して、(矢印703で示すように)メタデータテーブル734内の対応する発行物を探索する試みをウェブサーバが行う。この試みが成功の場合、ステップ806で判定されるように、矢印736で示すように標準の識別子が返され、処理はオフページコネクタ822および828を介して進み、ステップ848にて終了する。   An apparatus 700 for obtaining standard identifiers from article information is illustrated in FIG. 7, and the steps of the search process are illustrated in FIGS. 8A and 8B. The search process begins at step 800 and proceeds to step 802 where information 702 about the article displayed there is received from the member's web browser 102. Attempt to search for corresponding issue in metadata table 734 (as indicated by arrow 703) using information such as title or any standard number present in the information received from the browser at step 804 Is performed by the web server. If this attempt is successful, a standard identifier is returned, as indicated by arrow 736, as determined at step 806, processing proceeds via off-page connectors 822 and 828, and ends at step 848.

試みが成功でない場合処理はステップ808に進み、ドメイン名が、例えば蓄積転送ディスパッチャを使用してウェブサーバにより保存される。この記憶動作により、適用可能な発行物のための標準の識別子を配置する試みを行う、並行に動作する2つの処理がトリガされる。第1の処理は、ステップ810、814、818、824、830および834で説明する。第2の処理は、ステップ812、816、820、832、836、840および842で説明する。   If the attempt is not successful, processing proceeds to step 808 where the domain name is saved by the web server using, for example, a store-and-forward dispatcher. This storage operation triggers two processes operating in parallel that attempt to place a standard identifier for the applicable issue. The first process is described in steps 810, 814, 818, 824, 830 and 834. The second process is described in steps 812, 816, 820, 832, 836, 840 and 842.

第1の処理のステップ810において、矢印703で示すように構成員のブラウザで閲覧されているウェブサイトのURLを使用して、最も適したURLパーサを判定する1組のパーサ規則704を、その規則が特定する事例においてパーサがどのように使用されるかを判定する構成設定と同様にクエリする。特にURL内に記憶されているドメイン名をその1組のパーサ規則とマッチングさせてそのドメインに適用される規則を選択する。次に、選択された規則を使用して、パーサを選択して構成する。   In step 810 of the first process, a set of parser rules 704 that determine the most suitable URL parser using the URL of the website being viewed in the member's browser as indicated by arrow 703 Queries as well as configuration settings that determine how the parser is used in the case specified by the rule. In particular, the domain name stored in the URL is matched with the set of parser rules to select a rule that applies to the domain. Next, a parser is selected and configured using the selected rules.

図9は、パーサ規則の組704の例示の実施形態900を示す。本実施形態において、パーサ規則の組は、1組のリレーショナルデータベーステーブル902、904、906、910および912として実装される。各コンテンツプロバイダには、コンテンツプロバイダテーブル902内に、一意の識別子(CONTENT_PROVIDER_ID)および名称(CONTENT_PROVIDER_NAME)を格納するレコードが提供される。コンテンツプロバイダは、コンテンツプロバイダドメインテーブル904を介して1つまたは複数のインターネットドメインと関連付けることができる。テーブル904は、各コンテンツプロバイダの1つまたは複数のレコードを格納し、各レコードは、ドメイン識別子(CONTENT_PROVIDER_DOMAIN_ID)、ドメイン名(CONTENT_PROVIDER_DOMAIN)、コンテンツプロバイダへの参照(CONTENT_PROVIDER_ID)、および複数のドメインがある場合に、どのドメインを最初に検査すべきかを示す優先レベル(PRECEDENCE_LEVEL)を格納する。テーブルには、またURLセグメントマップ識別子(URL_SEGMENT_MAP_ID)および各ドメインに対するURLパーサ識別子(URL_PARSER_ID)が含まれる。URLセグメントマップ識別子は、3つのセグメント(URL_SEGMENT_1、URL_SEGMENT_2およびURL_SEGMENT_3)から成る、URLの構造を示すデータを含有するURLセグメントマップテーブル912内のレコードを特定する。標準の発行物番号または発行識別子は、直接ドメイン名に関連付ける場合がある。この場合これらの識別子は、URLセグメントマップ(STD_NOおよびPUB_ID)に記憶される。   FIG. 9 shows an exemplary embodiment 900 of a set of parser rules 704. In this embodiment, the set of parser rules is implemented as a set of relational database tables 902, 904, 906, 910 and 912. Each content provider is provided with a record in the content provider table 902 that stores a unique identifier (CONTENT_PROVIDER_ID) and name (CONTENT_PROVIDER_NAME). A content provider can be associated with one or more Internet domains via a content provider domain table 904. Table 904 stores one or more records for each content provider, where each record has a domain identifier (CONTENT_PROVIDER_DOMAIN_ID), a domain name (CONTENT_PROVIDER_DOMAIN), a reference to the content provider (CONTENT_PROVIDER_ID), and multiple domains Stores a priority level (PRECEDENCE_LEVEL) indicating which domain to check first. The table also includes a URL segment map identifier (URL_SEGMENT_MAP_ID) and a URL parser identifier (URL_PARSER_ID) for each domain. The URL segment map identifier specifies a record in the URL segment map table 912 containing data indicating the structure of the URL, which is composed of three segments (URL_SEGMENT_1, URL_SEGMENT_2, and URL_SEGMENT_2). A standard issue number or issue identifier may be directly associated with a domain name. In this case, these identifiers are stored in the URL segment map (STD_NO and PUB_ID).

発行識別子を直接ドメイン名に関連付けることができない場合、URLパーサは、URLパーサテーブル906への参照を介してコンテンツプロバイダドメインに関連付けられる。テーブル906には、パーサ識別子(URL_PARSER_ID)およびパーサ名(URL_PARSER_NAME)ならびに特定のパーサが有効であるかどうかの指標が含まれる。さらなるテーブル910(URLパーサパラメータテーブル)には、特定のパーサと共に使用されるパラメータが格納される。   If the issue identifier cannot be directly associated with the domain name, the URL parser is associated with the content provider domain via a reference to the URL parser table 906. Table 906 includes a parser identifier (URL_PARSER_ID) and parser name (URL_PARSER_NAME) and an indication of whether a particular parser is valid. A further table 910 (URL parser parameter table) stores parameters used with a particular parser.

図7に戻ると、URL内のドメイン名に基づきパーサ規則の組を選択した後、選択された規則で特定されるパーサ706および708が示す1組のパーサの1つを使用して、ステップ814にてURLを構文解析し、およびデータフィールド値を生成する。パーサは、変換規則を使用して標準の識別子を判定するのに必要なデータフィールドをURLから抽出するための命令から構成される。そのような1組のデータフィールドには、3つの要素、キーベース、定期刊行物キーおよび発行日が含まれる。キーベースは、成生された識別子に意味があるコンテキストを指定する。換言すれば個々の発行元は、そのウェブサイト上の全ての発行物に、一意の専用番号を与え、およびこのナンバリングシステムをそのウェブサイト上の記事のURLにおいて使用することができる。この場合のキーベースは、発行元のウェブサイトを指定する「PUB1」等の任意の文字列とすることができ、ジャーナルキーは、発行元所有の専用識別子である。   Returning to FIG. 7, after selecting a set of parser rules based on the domain name in the URL, step 814 is performed using one of the set of parsers indicated by parsers 706 and 708 identified by the selected rule. Parses the URL and generates a data field value. The parser consists of instructions for extracting from the URL the data fields necessary to determine the standard identifier using the conversion rules. Such a set of data fields includes three elements: a key base, a periodicals key, and a publication date. The key base specifies the context in which the generated identifier is meaningful. In other words, each publisher can give every publication on the website a unique dedicated number and use this numbering system in the URLs of articles on that website. The key base in this case can be an arbitrary character string such as “PUB1” that specifies the website of the publisher, and the journal key is a dedicated identifier owned by the publisher.

パーサ706から708等のパーサは、特定の形式でデータを抽出するよう定義される。例えば多くの発行元は、記事の発行の年および月を表す4桁の数字で発行物を特定する、一意の文字列の連結を記事のURLが含むといった非公式の慣習に従う。様々な周知の構文解析技術を使用して、この文字列を探して、所望の構成要素に分割することができる。パーサが作成されて、この連結される文字列がURLから抽出され、文字列が2つの有用な構成要素に分割されると、パーサが、上述のようなパーサ規則で構成されて、この慣習に従う任意の発行元のURLに対して同じタスクを実行することができる。任意の選択される構文解析技術は、少なくとも以下の機能を実装可能でなければならない。すなわち、所与の文字列内で、指定される接頭文字列を探索する。指定される接尾文字列が探索されるまで、接頭文字列に続くキャラクタを抽出する。そして、抽出された文字列を簡素な形式仕様に従って複数のサブ文字列に分割する。従来のUNIX正規表現またはPerlのような正規表現により、これらの構文解析および抽出タスクを容易に実行することができる。一般に、新しいパーサ規則およびパーサを、新しいURL形式をサポートするために追加することができる。パーサおよびその構成についてのより詳細な検討は、2007年4月10日提出のC.Howard、J.ArboおよびV.Shettyによる、「Method and Apparatus for Converting a Document Universal Resource Locator to a Standard Document Identifier(文書URLを標準文書識別子に変換するための方法および装置)」と題する米国特許出願No.11/733,423に含まれる。本出願のこの開示は、参照にすることにより全体が本明細書に含まれる。   Parsers such as parsers 706-708 are defined to extract data in a specific format. For example, many publishers follow informal conventions where the URL of an article includes a unique string concatenation that identifies the issue with a four-digit number representing the year and month of publication of the article. Various well-known parsing techniques can be used to find this string and split it into the desired components. When a parser is created and this concatenated string is extracted from the URL and the string is split into two useful components, the parser is composed of parser rules as described above and follows this convention. The same task can be executed for any publisher URL. Any chosen parsing technique must be capable of implementing at least the following functions: That is, a specified prefix character string is searched for within a given character string. Characters following the prefix string are extracted until the specified suffix string is searched. Then, the extracted character string is divided into a plurality of sub character strings according to a simple format specification. These parsing and extraction tasks can be easily performed by conventional UNIX regular expressions or regular expressions such as Perl. In general, new parser rules and parsers can be added to support new URL formats. A more detailed discussion of the parser and its composition can be found in C.I. Howard, J.M. Arbo and V.A. A Method and Apparatus for Converting Document URLs to Standard Document Identifiers and Methods for Converting a Method and Apparatus for Converting a Document Universal Resource Locator to a Standard Document Identifier. 11 / 733,423. This disclosure of the present application is hereby incorporated by reference in its entirety.

次に、オフページコネクタ818および824を介してステップ830に処理は進み、抽出されたデータフィールド値が、矢印712および714で示すように、変換規則データベース716に対して提供される。変換データベースには、複数の項目が含まれ、各項目は変換規則を構成し、変換規則には、少なくとも3つのフィールド、キーベース、ジャーナルキーおよび標準の識別子が含まれ、またデータフィールド等の他のフィールドを含むことができる。キーベースは、およびジャーナルキーは、キーフィールドとして使用される。変換規則データベースに対して提供されるデータフィールド値が、これらのフィールドに合致する場合、関連する標準の識別子が返される。   The process then proceeds to step 830 via off-page connectors 818 and 824, and the extracted data field values are provided to the conversion rules database 716 as indicated by arrows 712 and 714. The conversion database includes a plurality of items, and each item constitutes a conversion rule. The conversion rule includes at least three fields, a key base, a journal key, a standard identifier, and other data fields. Field can be included. The key base and journal key are used as key fields. If the data field values provided for the transformation rule database match these fields, the associated standard identifier is returned.

ジャーナルキーが、特定の発行元の内部データであるため、ジャーナルキーが特定のウェブサイトまたはウェブサイトのサブセットのコンテキストの外部で一意であるという保証がない。キーベースは、確実にジャーナルキーを、ISSN等の標準の識別子に対して正確にマッピング可能にする機構を提供する。ステップ834にて、そのような標準の識別子がデータベースクエリに起因すると判定される場合、URLマッピング処理がステップ836に進み、標準識別子を使用して発行物を探索する試みがなされる。ステップ840で判定されるように、発行物が見つかると、処理はステップ848で終了する。   Since the journal key is internal data of a particular publisher, there is no guarantee that the journal key is unique outside the context of a particular website or subset of websites. Keybase provides a mechanism that ensures that journal keys can be accurately mapped to standard identifiers such as ISSN. If at step 834 it is determined that such a standard identifier is due to a database query, then the URL mapping process proceeds to step 836 where an attempt is made to search for publications using the standard identifier. If an issue is found, as determined at step 840, processing ends at step 848.

発行物の標準識別子を取得するための第2の処理は、ステップ812で開始される。以前に述べたように、本処理はドメイン名が記憶されると(ステップ808にて)起動され、前述のURL構文解析処理と並行して進められる。ステップ812にて、メタデータパーサと呼ばれる、ドメインに特有のスクリプトがURLマッピングデータベース118から取り出される。一例として、本スクリプトはJavascriptとすることができる。図9に示すように、メタデータパーサスクリプトは、メタデータパーサテーブル908に記憶される。このテーブルの各レコードに含まれるものには、パーサ識別子(METADATA_PARSER_ID)、ドメインキー(SELECT_KEY)、スクリプトが有効であるかどうかの指標、スクリプトテキスト(SCRIPT_TEXT)、およびスクリプト実行のためのタイムアウト間隔および再試行の方策を制御するいくつかのタイミングエントリがある。各スクリプトは、また、メタデータ顧客無効テーブル(METADATA_CUST_DISABLE)914への入力を行うことにより、特定の顧客に対して無効とすることができる。ウェブページのURLをドメインキーとして使用して、テーブル914にアクセスし、そのドメインに特有のスクリプトテキストを取り出す。   A second process for obtaining a standard identifier for a publication begins at step 812. As described above, this process is started when the domain name is stored (at step 808), and proceeds in parallel with the URL parsing process described above. At step 812, a domain specific script, called a metadata parser, is retrieved from the URL mapping database 118. As an example, the script can be Javascript. As shown in FIG. 9, the metadata parser script is stored in the metadata parser table 908. Each record in this table includes a parser identifier (METADATA_PARSER_ID), a domain key (SELECT_KEY), an indication of whether the script is valid, script text (SCRIPT_TEXT), and a timeout interval and re-execution for script execution. There are several timing entries that control the trial strategy. Each script can also be invalidated for a particular customer by making an entry in the metadata customer invalidation table (METADATA_CUST_DISABLE) 914. Using the URL of the web page as the domain key, access table 914 and retrieve the script text specific to that domain.

取り出されたスクリプトテキストは、構成員のブラウザにダウンロードされ、スクリプトと共に記憶されるタイミングおよび再試行の数を使用して、ブラウザ内で既に稼働しているブックマークレットスクリプトに付加される。スクリプトテキストは、アクティブにされると、現在のウェブサイト上の1つまたは複数のウェブページのHTMLコードを構文解析し、スクリプトと共に記憶されるタイミングおよび再試行の情報を再度使用して所望の発行物に関する追加のデータを探し出すことを試みる。例えば、そのようなスクリプトは、構成員が現在閲覧しているウェブページのHTMLコードを構文解析可能である。あるいは、スクリプトは、1つのページから別のウェブページにナビゲートし、第2のウェブページ上のHTMLコードを構文解析することができる。一例として、これは構成員が記事の全文版を閲覧している状況で起こり得るが、その記事の発行情報は、発行物の要約を表示する異なるウェブページ上で利用可能である。   The retrieved script text is downloaded to the member's browser and appended to the bookmarklet script already running in the browser using the timing and number of retries stored with the script. When activated, the script text parses the HTML code of one or more web pages on the current website and uses the timing and retry information stored with the script again to produce the desired publication. Try to find additional data about things. For example, such a script can parse HTML code for a web page that a member is currently viewing. Alternatively, the script can navigate from one page to another web page and parse the HTML code on the second web page. As an example, this can happen in situations where a member is viewing the full text version of an article, but the publication information for that article is available on different web pages that display a summary of the publication.

スクリプトは、一般的には、ウェブサイトにアクセスし、追加の情報の所在に留意し、スクリプトを記述して情報を取り出す、オペレータにより設計される。オペレータは、機能的な限界としてコンテンツ識別子を抽出するためのサイトの一般的なワークフローを使用して、スクリプトを「最初から」生成することができるが、ほとんどの場合、オペレータは既存のメタデータパーサスクリプトで開始するであろう。同様のタイプの発行物を処理するよう設計されるスクリプトは、一般的には、構造が同様であるため、各発行物のタイプは特有のドメインに対して修正可能なテンプレートのスクリプトを有する。例えば、テンプレートスクリプトは、業界の定期刊行物、ニュース記事、特許公開およびプレスリリース向けに、または同様のページレイアウトおよび型を有するか、もしくは同様のメタデータが抽出されるか、もしくは同様のサイト構造を有する他のサイト向けに設計することができる。あるいは、構文解析されるコンテンツまたは文書が、同様のタイプおよび構造である場合、または著作権表示の作者名または年等の同じ種類のメタデータを含む場合には、オペレータは、既存のスクリプトを使用すると判断することができる。例えば、著作権表示は、ほとんどのウェブページのフッター、ページの最下部に表示される。典型的な形式は「Copyright(c)2006著作権保有者名」である。形式およびキャプチャされるデータが同様であるので、システムのユーザは、既存のスクリプトを修正して、異なるウェブサイトまたはページの組においても同じ機能を実行することができる。   Scripts are typically designed by an operator who accesses a website, takes note of the location of additional information, and writes the script to retrieve information. Operators can generate scripts “from scratch” using the site's general workflow to extract content identifiers as a functional limitation, but in most cases, operators will be able to generate existing metadata parsers. Will start with a script. Because scripts designed to process similar types of publications are generally similar in structure, each issue type has a template script that can be modified for a specific domain. For example, template scripts can be used for industry periodicals, news articles, patent publications and press releases, or have similar page layouts and types, or similar metadata can be extracted, or similar site structure Can be designed for other sites with Alternatively, if the content or document being parsed is of similar type and structure, or if it contains the same kind of metadata, such as a copyright notice author name or year, the operator will use an existing script. It can be determined. For example, the copyright notice is displayed at the footer of most web pages, at the bottom of the page. A typical format is “Copyright (c) 2006 copyright holder name”. Because the format and captured data are similar, system users can modify existing scripts to perform the same functions on different websites or sets of pages.

テンプレートスクリプトまたは既存のスクリプトは、図7に矢印719で概略的に例示するように、ウェブサイトのURLに基づきオペレータが選択することができる。そして、オペレータは、通常は、仮のアカウントでウェブサイトにログオンし、関連情報の所在に留意し、テンプレートスクリプトを修正してその所在にナビゲートする。この修正は、既存のスクリプトをスクリプトエディタ721に適用することにより実行され、メタデータスクリプトパーサテーブル720に記憶されるスクリプトである新しいスクリプト723を生成する。一例として、業界の定期刊行物用のテンプレートスクリプトでは、ヘッダ情報を避け、残りのHTMLスクリプトを、上記で検討したURL用のものと同様のパーサで構文解析するために、HTMLコードの最初の1000バイトをスキップすることができる。   The template script or existing script can be selected by the operator based on the URL of the website, as schematically illustrated by arrow 719 in FIG. The operator usually logs on to the website with a temporary account, takes note of the location of related information, modifies the template script, and navigates to that location. This modification is performed by applying an existing script to the script editor 721 to generate a new script 723 that is a script stored in the metadata script parser table 720. As an example, the template script for industry periodicals avoids header information and parses the remaining HTML script with the first 1000 of HTML code to parse with a parser similar to that for the URLs discussed above. Bytes can be skipped.

一般にスクリプトは、サイトに特有のものである。例えば、HTMLコードおよび他の書式要素で作成されるウェブページは、PDF(Portable Document Format)でコーディングされるページとは、異なるパーサを必要とする。しかし、ISBN(International Standard Book Number(国際標準図書番号))、ISSN(International Standard Serial Number)、またはDOI(Digital Object Identifier(デジタルオブジェクト識別子))等の、同様に探索される標準の識別子を有するウェブページは、特定の種類の著作物(例えば、本、定期刊行物、または研究論文)の多くのサイトおよびサービスで使用することができる。   In general, scripts are site specific. For example, a web page created with HTML code and other format elements requires a different parser than a page coded with PDF (Portable Document Format). However, an identifier such as ISBN (International Standard Book Number (International Standard Book Number)), ISSN (International Standard Serial Number), or DOI (Digital Object Identifier) (such as a digital object identifier) is searched similarly. Pages can be used in many sites and services for a particular type of work (eg, a book, periodicals, or research article).

例えば図10は、定期刊行物「Marine Chemistry」を特定するウェブページテキストに埋め込まれたISSN(0304−4203)を含む、発行元エルゼビアのウェブサイトからの例示のウェブページの画像である。図11は、図10に示すウェブページ表示を従来のウェブブラウザに生成するHTMLコードを示す。図11に示すHTMLコードを構文解析するために、パーサは、DOM(Document Object Model(文書オブジェクトモデル))を介してステップを進み、文書識別子(ISSN、DOI等)を選び出す。DOMは、ウェブページの階層構造を値と共に提供し、プログラムに、検索させかつ固定の形式を介したステップを進ませて、必要な情報を集めさせる。形式の一貫性は重要であるが、DOMにより返されるページ情報で、プログラムは、クラスが、例えば、「journalinformation」と等しい場合、例えば、<span>タグをクエリし、次に、正規表現マッチング等の種々の従来の方法を使用して、返されたテキストのブロックから標準の番号を抽出することができる。
以下は、本発明の原理に従って、構成されるメタデータパーサスクリプトの一例である。本スクリプトはJavascript言語で記述される。
For example, FIG. 10 is an image of an exemplary web page from publisher Elsevier's website, including ISSN (0304-4203) embedded in web page text identifying the periodicals “Marine Chemistry”. FIG. 11 shows an HTML code for generating the web page display shown in FIG. 10 in a conventional web browser. In order to parse the HTML code shown in FIG. 11, the parser proceeds through DOM (Document Object Model) to select a document identifier (ISSN, DOI, etc.). DOM provides a hierarchical structure of web pages with values, allowing the program to search and step through a fixed form to gather the necessary information. Format consistency is important, but with page information returned by DOM, if the class is equal to, for example, “journalinformation”, for example, query the <span> tag, then regular expression matching, etc. Various conventional methods can be used to extract a standard number from the returned block of text.
The following is an example of a metadata parser script configured in accordance with the principles of the present invention. This script is described in the Javascript language.

Figure 0005438112
Figure 0005438112

Figure 0005438112
Figure 0005438112

Figure 0005438112
Figure 0005438112

Figure 0005438112
Figure 0005438112

Figure 0005438112
Figure 0005438112

Figure 0005438112
Figure 0005438112

本例において、1から35行のコードは、後のサブルーチンで使用される種々の変数を定義する。36から84行のコードは、検査中のウェブページのプロトコルがhttpであるかhttpsであるかを判定するサブルーチンを定義する。85から118行のコードは、別のテキスト文字列の発生を求めてテキスト文字列を検索するサブルーチンを定義する。119から204行のコードは、85から118行で定義される検索関数を使用して、発行物の標準識別子および文書のタイトルの存在を示す所定のキャラクタパターンを求めてウェブページのhtmlコードを順次検索する。205から218行は、ウェブページのhtmlコードから取り出されたメタデータ情報をブックマークレットデータストレージに記憶するサブルーチンを定義する。219から243行のコードは、デバッグ情報を表示し、メタデータストレージ操作の後ウェブページをそのままにする。244から251行のコードはユーザの表示ウィンドウをリフレッシュし、252から262行のコードは構文解析サブルーチンを実行する。   In this example, 1 to 35 lines of code define various variables that are used in later subroutines. The code on lines 36 to 84 defines a subroutine that determines whether the protocol of the web page under examination is http or https. The 85 to 118 lines of code define a subroutine that searches for a text string in search of the occurrence of another text string. The codes on lines 119 to 204 use the search function defined on lines 85 to 118 to sequentially search the web page html code for a predetermined character pattern indicating the presence of the standard identifier of the publication and the title of the document. Search for. Lines 205 to 218 define a subroutine for storing the metadata information retrieved from the html code of the web page in the bookmarklet data storage. The code from line 219 to line 243 displays debug information and leaves the web page intact after a metadata storage operation. The code from line 244 to 251 refreshes the user's display window, and the code from line 252 to 262 executes the parsing subroutine.

メタデータは、最初に表示されるウェブページ上には含まれず、先行するページ上またはユーザがウェブサイトと対話することを必要とするページ上にしか含まれない場合がある。従っていくつかのメタデータパーサスクリプトは、メタデータを抽出する前に閲覧の履歴においてクライアントブラウザを上下にナビゲートするのに必要な関数を実行することができる。ブラウザの探索を制御することが必要な新しいサイトのスクリプトを作成する時、システムのユーザは、この機能性を含む既存のメタデータパーサスクリプトから新しいメタデータパーサスクリプトの生成を開始することができる。   The metadata may not be included on the first displayed web page, but only on the previous page or on the page that requires the user to interact with the website. Thus, some metadata parser scripts can perform the functions necessary to navigate the client browser up and down in the browsing history before extracting the metadata. When creating a script for a new site that needs to control browser search, the user of the system can begin generating a new metadata parser script from an existing metadata parser script that includes this functionality.

ステップ816にて、スクリプトが、構成員のブラウザにおいて実行され、HTMLコードを構文解析して、関連発行物情報を探索する。この情報には、例えば発行物のタイトル、およびISSN番号またはISBN番号等の標準の発行物番号を含むことができる。そして処理はオフページコネクタ820および826を介してステップ832に進み、そこでウェブサイトから抽出される任意の情報は、ブックマークレットキーを検索キーとして使用して記憶される。第1の処理がまだ進行中であるため、情報の記憶がこの時点で必要である。   At step 816, the script is executed in the member's browser to parse the HTML code and search for related issue information. This information may include, for example, the issue title and a standard issue number such as an ISSN or ISBN number. Processing then proceeds to step 832 via off-page connectors 820 and 826, where any information extracted from the website is stored using the bookmarklet key as a search key. Information storage is required at this point because the first process is still in progress.

ステップ834にて、第1の処理が発行物URLを構文解析することにより発行識別子を探索することができないと判定、またはステップ840にて配置される識別子で発行物を探索する試みが失敗したと判定した場合、ステップ838の処理に進み、ステップ832にて前述のブックマークレットキーでストレージにアクセスすることにより、任意の発行物情報が記憶されたかどうかについて判定される。発行物情報が探索されない場合ステップ846の処理に進み、検索ウェブページが表示され、構成員に発行物情報の手動の検索を実行させ、処理はステップ848にて終了する。   In step 834, the first process determines that the issue identifier cannot be searched by parsing the issue URL, or the attempt to search for the issue with the identifier arranged in step 840 has failed. If it is determined, the process proceeds to step 838, and it is determined in step 832 whether or not any issue information is stored by accessing the storage with the bookmarklet key described above. If the issue information is not searched, the process proceeds to step 846 where a search web page is displayed, causing the member to perform a manual search for issue information, and the process ends at step 848.

あるいは、ステップ838にて、第2の処理により取得され、記憶された情報を、ブックマークレットキーで探索すると判定される場合、ステップ842にて記憶された情報を使用して発行物を探索する試みがなされる。そのような探索の試みがなされる前に、探索処理を簡素化するために、情報を前処理して標準形式にすることができる。例えばHTMLタグ、スペース、外国語文字および共通の項目を含む特定の標準の情報を削除することができる。次に標準の形式を使用して探索の試みが実行される。探索の試みそれ自体が、いくつかの段階で進むことがある。まず、探索処理では、発行物を探索するために、「フィンガープリント」を生成するために見つけられた任意の標準の発行物番号およびタイトルを使用しようとする。その試みが失敗した場合、処理は、代替のID番号に注目して単に標準の番号を使用する。それでも発行物が見つからない場合、探索処理は、タイトルのみを使用し、一致するフィンガープリントを探す。   Alternatively, if it is determined in step 838 that the information acquired and stored by the second process is searched using the bookmarklet key, the information stored in step 842 is used to search for an issue. Is made. Before such a search attempt is made, the information can be pre-processed into a standard format to simplify the search process. For example, specific standard information including HTML tags, spaces, foreign language characters and common items can be deleted. A search attempt is then performed using a standard format. The search attempt itself may proceed in several stages. First, the search process attempts to use any standard issue number and title found to generate a “fingerprint” to search for issues. If the attempt fails, the process simply uses the standard number, paying attention to the alternative ID number. If the issue is still not found, the search process uses only the title and looks for a matching fingerprint.

ステップ844にて判定され発行物が見つかった場合、ステップ848にて発行識別子が返される。あるいは、ステップ844にて判定され、発行物が見つからない場合、構成員に標準の発行識別子の手動の検索を実行させる前述の検索ウェブページが表示され、処理はステップ848にて終了する。   If an issue is found as determined at step 844, an issue identifier is returned at step 848. Alternatively, if the issue is not found, as determined at step 844, the search web page described above is displayed, causing the member to perform a manual search for the standard issue identifier, and the process ends at step 848.

図5に戻ると、ステップ506にて、上述の方法の1つを使用して、標準の発行識別子が取得されている場合、ステップ508の処理に進み、権利アドバイザウェブサーバが、その識別子を使用し、特定される発行物に適用される全ての取り出された契約を判定する。ステップ510にて、構成員コンテキストに適合する全ての契約について判定がなされる。この判定は、各契約の適用範囲を調査すること、ならびにその契約が要素である国および場所を対象とするかどうか、および構成員が任意の組織で定義される属性に合うかどうかを判定することにより行われる。   Returning to FIG. 5, if, at step 506, a standard issuance identifier has been obtained using one of the methods described above, processing proceeds to step 508 where the rights advisor web server uses the identifier. And determine all retrieved contracts that apply to the identified issue. At step 510, a determination is made for all contracts that match the member context. This determination examines the scope of each contract and determines whether the contract covers the country and location of which it is an element and whether the members meet the attributes defined by any organization Is done.

ステップ512にて、要求される使用のタイプの中で最良の権利を判定する。そして、処理は514にて終了する。   At step 512, the best right among the types of usage required is determined. Then, the process ends at 514.

ステップ512にて記載されるような最良の権利を判定する処理には、これによりその契約に含まれる指定される使用のタイプに最も適切な権利を判定するために、発行物に適用され、構成員コンテキストに適合する各契約も調査することを伴う。この調査の実行では、各契約が「ボトムアップ」で調査される。すなわち、より特別な権利がより一般的な権利に優先する。従ってまず契約を調査して、要求される使用のタイプの権利が直接指定される発行物に割り当てられたかどうかを、それ自身でまたはコレクションに含まれるような発行物に対して判定する。そのような権利が見つかった場合、それがその契約に使用される権利である。そのような権利が発行物に割り当てられなかった場合、契約をチェックし、要求される使用のタイプの権利が、指定される発行物を含むコレクションに割り当てられたかどうかを判定する。割り当てられている場合、それはその発行物に使用される権利である。そのような権利が見つからない場合、契約をチェックし、使用のタイプの権利が、契約のレベルで割り当てられたかどうかを判定する。割り当てられている場合、その権利が契約に使用される。   The process of determining the best rights, as described in step 512, is applied to the issue and configured to determine the rights most appropriate for the type of use included in the contract. It also involves investigating each contract that fits the employee context. In the execution of this survey, each contract is examined “bottom-up”. That is, more specific rights take precedence over more general rights. Therefore, the contract is first examined to determine whether the rights of the type of use required have been assigned to a directly specified issue, either for itself or for an issue that is included in the collection. If such a right is found, it is the right used for the contract. If no such rights were assigned to the issue, the contract is checked to determine if the type of use right requested has been assigned to the collection containing the specified issue. If assigned, it is the right used for the issue. If no such right is found, the contract is checked to determine if the type of use right has been assigned at the contract level. If so, that right is used for the contract.

次に、最も適用可能な権利が、全ての契約から収集され、順序づけられる。具体的には、権利は、権利のタイプに基づき、および任意の条件が権利に関連するかどうかに基づき、特別の最良から悪いほうの順に配置される。決定を行うため、「Nonrestrictive」のタグが付けられた条件を有する権利を、条件無しの権利として、すなわち、最高レベルで適用しやすいものとして扱う。権利について最良の適用性から悪いほうの適用性への順番は、(1)関連する条件を得ないで使用する権利、(2)関連する制約的な条件を得て使用する権利、(3)事前に認可された規約の下で購入可能な権利、(4)購入可能な権利であるが、権利者はより多くの情報に触れなければならない、(5)購入可能な権利であるが、特別に順序付けられなければならない、(6)権利を判定する専門家への接触、および(7)利用可能な権利が無いである。権利の判定ができない場合、上記(6)として扱う。   The most applicable rights are then collected from all contracts and ordered. Specifically, rights are placed in order from special best to bad based on the type of rights and whether any conditions are associated with the rights. In order to make a decision, a right having a condition tagged “Nonrestrictive” is treated as an unconditional right, ie, one that is easy to apply at the highest level. The order of rights from best applicability to worst applicability is: (1) the right to use without obtaining relevant conditions, (2) the right to use with relevant restrictive conditions, (3) Rights that can be purchased under pre-approved terms, (4) Rights that are available for purchase, but the rights holder must touch more information, (5) Rights that are available for purchase, but special (6) contact the expert to determine the rights, and (7) no rights available. If the right cannot be determined, it is handled as (6) above.

入手可能な権利が情報収集され順序付けられた後、順序付けにより「圧倒的な勝者」が生じたかどうかの判定がなされる。すなわち、1つの契約に、全ての他の契約に含まれる権利よりもより適用可能な権利が含まれるということである。「圧倒的な勝者」が生じている場合、この「圧倒的な勝者」を使用して、要求される使用のタイプの権利および条件を判定する。次に、これらの権利および条件は、権利アドバイザのウェブページの構成員に対して表示される。   After the available rights are gathered and ordered, a determination is made as to whether the ordering has resulted in an “overwhelming winner”. That is, one contract contains more applicable rights than those contained in all other contracts. If an “overwhelming winner” has occurred, this “overwhelming winner” is used to determine the rights and conditions of the type of use required. These rights and conditions are then displayed to members of the rights advisor web page.

「圧倒的な勝者」が存在しない場合は、2つまたはそれ以上の契約の間に「結びつき」が存在する。2つまたはそれ以上の権利の間の結びつきは、いくつかの形式をとることができる。例えば、条件無しの2つまたはそれ以上の権利の間の結びつきは、同一の権利が2つの異なる契約から取得可能であることを示す。権利が同一で区別できないため、1つの契約を様々な手法により(例えば、任意に)選択し、その契約の権利および条件を表示する。   In the absence of an “overwhelming winner”, there is a “link” between two or more contracts. The connection between two or more rights can take several forms. For example, a connection between two or more unconditional rights indicates that the same right can be obtained from two different contracts. Since the rights are the same and cannot be distinguished, one contract is selected by various techniques (eg, arbitrarily) and the rights and conditions of the contract are displayed.

あるいは、条件付きの2つまたはそれ以上の権利の間に結びつきがあると、結果的に全てのそのような権利は条件と共に表示されるため、エンドユーザは、要求される行為の許容について、情報に基づく判断を行うことができる。別の例には、「Purchase(購入)」ステータスを有する2つまたはそれ以上の権利の間の結びつきがある。そのような結びつきは、結果的には全てのそのような権利について購入の情報の可能性の一覧が表示される。別の実施形態においては、発行物が選択されると、種々の使用のタイプの入手可能な「最良」の権利が判定され、構成員に対して同時に提示される。   Alternatively, if there is a connection between two or more conditional rights, then all such rights will be displayed with the condition, so the end user will be informed about the admissibility of the required action. Judgment based on can be made. Another example is a connection between two or more rights that have a “Purchase” status. Such a connection will result in a list of possible purchase information for all such rights. In another embodiment, when an issue is selected, the “best” rights available for the various types of use are determined and presented to the members simultaneously.

権利が権利アドバイザのウェブページ上に表示されると、処理はステップ514にて終了する。   If the rights are displayed on the rights advisor web page, processing ends at step 514.

上述の実施形態のソフトウェアでの実装は、例えばディスケット、CD−ROM、ROM、もしくは固定ディスク、などのコンピュータ可読媒体等の有形の媒体に固定される一連のコンピュータ命令、または伝送路上をモデムもしくは他のインターフェースデバイスを介して、記憶のためにコンピュータシステムに伝送可能な一連のコンピュータ命令、を備えることができる。伝送路は、光通信回線もしくはアナログ通信回線を含むがこれに限定されない有形の回線とすることができ、またはマイクロ波、赤外線、もしくは他の伝送技術、を含むがこれに限定されない無線技術で実装することができる。伝送路はまた、インターネットとすることができる。一連のコンピュータ命令は、本発明に関して本明細書に前記した機能性の全てまたは一部を具現化する。当業者は理解するであろうが、そのようなコンピュータ命令は、多くのコンピュータアーキテクチャまたはオペレーティングシステムでの使用のために、幾つかのプログラミング言語で記述することができる。さらにそのような命令は、現在または未来において、半導体、磁気、光もしくは他のメモリデバイスを含むがこれに限定されない任意のメモリ技術を使用して記憶することができ、または現在または未来において、光、赤外線、マイクロ波、もしくは他の伝送技術を含むがこれに限定されない任意の通信技術を使用して伝送することができる。そのようなコンピュータプログラム製品は、添付した印刷された文書もしくは電子文書を伴って、着脱可能媒体、例えば収縮包装のソフトウェアとして配布可能であり、例えばシステムROMもしくは固定ディスクにコンピュータシステムで事前にロード可能であり、または、例えばインターネットもしくはWorld Wide Web等のネットワーク上でサーバもしくは電子掲示板から配布することが可能であることが意図される。   The software implementation of the above-described embodiments may be a series of computer instructions fixed to a tangible medium such as a diskette, CD-ROM, ROM, or fixed disk, or a modem or other over a transmission path. A series of computer instructions that can be transmitted to the computer system for storage via the interface device. The transmission line may be a tangible line including but not limited to an optical communication line or an analog communication line, or implemented with wireless technology including but not limited to microwave, infrared, or other transmission technology can do. The transmission line can also be the Internet. The series of computer instructions embodies all or part of the functionality previously described herein with respect to the present invention. Those skilled in the art will appreciate that such computer instructions can be written in a number of programming languages for use in many computer architectures or operating systems. Further, such instructions can be stored using any memory technology, including but not limited to, semiconductor, magnetic, optical, or other memory devices, now or in the future, or optically in the present or future. It can be transmitted using any communication technology including, but not limited to, infrared, microwave, or other transmission technologies. Such computer program products can be distributed as removable media, eg shrink wrap software, with attached printed or electronic documents, eg preloaded in a computer system onto a system ROM or fixed disk It is intended that it can be distributed from a server or an electronic bulletin board over a network such as the Internet or World Wide Web.

本発明の例示の実施形態が開示されたが、当業者には明らかであろうが、本発明の趣旨および範囲から逸脱することなく、いくつかの本発明の利点を達成するであろう種々の変更および修正を行うことができる。例えば、当業者には明白であろうが、他の実装において、示されるものとは異なる処理操作を実行することができる。特有の処理フローおよび例示のステップの順序等の他の態様が、発明の概念に対する他の修正と同様に、添付の請求項により対象とされることが意図される。   While exemplary embodiments of the present invention have been disclosed, it will be apparent to those skilled in the art that various modifications may be achieved without departing from the spirit and scope of the present invention. Changes and modifications can be made. For example, as will be apparent to those skilled in the art, processing operations different from those shown may be performed in other implementations. Other aspects, such as specific processing flows and exemplary sequence of steps, are intended to be covered by the appended claims, as well as other modifications to the inventive concepts.

Claims (18)

ブラウザに表示されるウェブサイトのウェブページにおいて参照される記事を含む発行物を特定する、標準の発行識別子を探索するための装置による方法であって、
(a)複数のパーサスクリプトを作成するステップであって、該パーサスクリプトの各々は、ウェブサイトの少なくとも1つのウェブページから、前記ウェブページのHTMLコードを構文解析することにより発行物の情報を抽出するよう適合されるステップと、
(b)前記ウェブサイトのドメインに基づき前記パーサスクリプトの1つを選択するステップと、
(c)前記選択されたパーサスクリプトを前記ブラウザにダウンロードして、前記ダウンロードされたスクリプトを前記ブラウザにおいて実行するステップであって、前記パーサスクリプトを使用して、ブラウザに表示されているウェブページから前記ウェブサイト内の別のウェブページにナビゲートし、前記別のウェブページの前記HTMLコードを構文解析することにより発行物情報を抽出するステップを含む、ステップと、
(d)前記ウェブサイトから抽出された情報を使用して、発行物情報によりインデックスが付けられた標準の発行識別子を格納するデータベースにアクセスし、前記標準の発行識別子を探索するステップと
を備えることを特徴とする方法。
A method by an apparatus for searching for a standard issue identifier that identifies an issue containing an article referenced in a web page of a website displayed in a browser, comprising:
(A) A step of creating a plurality of parser scripts, each of the parser scripts extracting publication information from at least one web page of the website by parsing the HTML code of the web page A step adapted to
(B) selecting one of the parser scripts based on the website domain;
(C) downloading the selected parser script to the browser and executing the downloaded script in the browser using the parser script from a web page displayed in the browser Navigating to another web page in the website and extracting publication information by parsing the HTML code of the other web page; and
(D) using the information extracted from the website to access a database storing standard issue identifiers indexed by issue information and searching for the standard issue identifiers. A method characterized by.
ステップ(d)は、前記ウェブサイトから抽出された情報を所定の形式にし、前記情報を使用して前記データベースにアクセスするステップを含むことを特徴とする請求項1に記載の方法。   The method of claim 1, wherein step (d) includes the step of formatting the information extracted from the website into a predetermined format and using the information to access the database. ステップ(d)は、前記情報の少なくとも2つの異なる組み合わせを使用して前記データベースにアクセスするステップを含むことを特徴とする請求項に記載の方法。 The method of claim 2 , wherein step (d) includes accessing the database using at least two different combinations of the information. (e)複数のパーサ規則を作成するステップであって、該パーサ規則の各々は、特定の形式URL(ユニバーサルリソースロケータ)の発行物情報を抽出するよう適合されるステップと、
(f)前記パーサ規則の1つを前記ウェブサイトのドメインに基づき選択し、前記選択された規則で前記ウェブサイトの前記URLを構文解析して発行物情報を抽出するステップと、
(g)前記ステップ(f)で抽出された前記発行物情報を使用して、前記標準の発行識別子を取得するステップと
をさらに備えることを特徴とする請求項1に記載の方法。
(E) creating a plurality of parser rules, each of the parser rules being adapted to extract publication information of a particular format URL (Universal Resource Locator);
(F) selecting one of the parser rules based on a domain of the website, and parsing the URL of the website with the selected rules to extract publication information;
The method of claim 1, further comprising: (g) obtaining the standard issue identifier using the issue information extracted in step (f).
前記ステップ(e)および前記ステップ(f)は、前記ステップ(b)および前記ステ
ップ(c)と並行して実行されることを特徴とする請求項に記載の方法。
The method according to claim 4 , wherein the step (e) and the step (f) are performed in parallel with the step (b) and the step (c).
(h)複数の変換規則を作成するステップであって、該変換規則の各々は、発行物情報を入力および標準の発行識別子を出力するステップと、
(i)前記ステップ(f)で抽出された前記発行物情報を入力して、前記複数の変換規則の1つに対して適用し、前記変換規則の出力を前記標準の発行識別子として使用するステップと、
をさらに備えることを特徴とする請求項に記載の方法。
(H) creating a plurality of conversion rules, each of the conversion rules inputting issue information and outputting a standard issue identifier;
(I) inputting the issue information extracted in step (f), applying the issue information to one of the plurality of conversion rules, and using the output of the conversion rule as the standard issue identifier; When,
The method of claim 4 , further comprising:
前記ステップ(d)で前記標準の発行識別子を探索することができない場合、発行物検索ウェブページをブラウザに表示するステップをさらに備えることを特徴とする請求項1に記載の方法。 The method of claim 1, further comprising the step of displaying an issue search web page in a browser if the standard issue identifier cannot be searched in step (d). 前記ステップ(a)は、前記ウェブサイトの前記ドメインに基づきテンプレートスクリプトを選択し、前記ウェブサイトにアクセスし、前記テンプレートスクリプトを修正して前記発行物情報を取得するステップを含むことを特徴とする請求項1に記載の方法。   The step (a) includes selecting a template script based on the domain of the website, accessing the website, and correcting the template script to obtain the publication information. The method of claim 1. 前記発行物情報は、前記発行物のタイトルおよび発行物番号の内の少なくとも1つを含むことを特徴とする請求項1に記載の方法。   The method according to claim 1, wherein the publication information includes at least one of a title and a publication number of the publication. ブラウザに表示されるウェブサイトのウェブページにおいて参照される記事を含む発行物を特定する、標準の発行識別子を配置するための装置であって、
複数のパーサスクリプトを作成する手段であって、該パーサスクリプトの各々は、ウェブサイトの少なくとも1つのウェブページから、そのウェブページの前記HTMLコードを構文解析することにより発行物の情報を抽出するよう適合される手段と、
前記ウェブサイトのドメインに基づき前記パーサスクリプトの1つを選択する手段と、
前記選択されたパーサスクリプトをブラウザにダウンロードして、前記ダウンロードされたスクリプトを前記ブラウザにおいて実行する手段であって、前記パーサスクリプトを使用して、ブラウザに表示されているウェブページからウェブサイト内の別のウェブページにナビゲートする手段と、前記別のウェブページの前記HTMLコードを構文解析することにより発行物情報を抽出する手段とを備える、手段と、
前記ウェブサイトから抽出された情報を使用して、発行物情報によりインデックスが付けられた標準の発行識別子を格納するデータベースにアクセスし、前記標準の発行識別子を探索する手段と、
を備えることを特徴とする装置。
A device for placing a standard issue identifier that identifies an issue containing an article referenced in a web page of a website displayed in a browser, comprising:
Means for creating a plurality of parser scripts, each of the parser scripts extracting from the at least one web page of the website the issue information by parsing the HTML code of the web page; Means adapted,
Means for selecting one of the parser scripts based on a domain of the website;
Means for downloading the selected parser script to a browser and executing the downloaded script in the browser from the web page displayed in the browser using the parser script; Means for navigating to another web page; means for extracting publication information by parsing the HTML code of the other web page ;
Means for accessing a database storing standard issue identifiers indexed by issue information using information extracted from the website and searching for the standard issue identifiers;
A device comprising:
前記ウェブサイトから抽出された情報を使用してデータベースにアクセスする前記手段は、前記ウェブサイトから抽出された前記情報を所定の形式にする手段と、前記情報を使用して前記データベースにアクセスする手段とを含むことを特徴とする請求項10に記載の装置。 The means for accessing a database using information extracted from the website includes means for converting the information extracted from the website into a predetermined format, and means for accessing the database using the information. The apparatus according to claim 10 , comprising: 前記ウェブサイトから抽出された情報を使用してデータベースにアクセスする手段は、前記情報の少なくとも2つの異なる組み合わせを使用して前記データベースにアクセスする手段を含むことを特徴とする請求項11に記載の装置。 Said means for accessing the database using the information extracted from the web site, according to claim 11, characterized in that it comprises a means for accessing said database using at least two different combinations of the information apparatus. 複数のパーサ規則を作成する手段であって、該パーサ規則の各々は、特定の形式URLの発行物情報を抽出するよう適合される手段と、
前記パーサ規則の1つを前記ウェブサイトの前記ドメインに基づき選択する手段と、
前記選択された規則で前記ウェブサイトの前記URLを構文解析して発行物情報を抽出する手段と、
前記URLを構文解析する手段により抽出された前記発行物情報を使用して、前記標準の発行識別子を取得する手段と、
をさらに備えることを特徴とする請求項10に記載の装置。
Means for creating a plurality of parser rules, each of the parser rules being adapted to extract publication information of a particular format URL;
Means for selecting one of the parser rules based on the domain of the website;
Means for parsing the URL of the website with the selected rules to extract publication information;
Means for obtaining the standard issue identifier using the issue information extracted by means for parsing the URL;
The apparatus of claim 10 , further comprising:
前記パーサ規則の1つを前記ウェブサイトの前記ドメインに基づき選択する手段および前記選択された規則で前記ウェブサイトの前記URLを構文解析して発行物情報を抽出する手段は、前記パーサスクリプトの1つを前記ウェブサイトのドメインに基づき選択する手段および前記選択されたパーサスクリプトを前記ブラウザにダウンロードして、ダウンロードされたスクリプトを前記ブラウザにおいて実行する手段と、並行して動作することを特徴とする請求項13に記載の装置。 Means for selecting one of the parser rules based on the domain of the website and means for parsing the URL of the website with the selected rules to extract publication information; Means for selecting one based on the domain of the website and means for downloading the selected parser script to the browser and executing the downloaded script in the browser. The apparatus of claim 13 . 複数の変換規則を作成する手段であって、該変換規則の各々は、発行物情報を入力し、および標準の発行識別子を出力する手段と、
前記選択された規則で前記ウェブサイトの前記URLを構文解析する手段により抽出された前記発行物情報を入力して、前記複数の変換規則の1つに対して適用し、前記変換規則の出力を前記標準の発行識別子として使用する手段と、
をさらに備えることを特徴とする請求項13に記載の装置。
Means for creating a plurality of conversion rules, each of the conversion rules being configured to input issue information and output a standard issue identifier;
The publication information extracted by the means for parsing the URL of the website with the selected rule is input, applied to one of the plurality of conversion rules, and the output of the conversion rule is output Means for use as the standard issue identifier;
The apparatus of claim 13 , further comprising:
前記ウェブサイトから抽出された情報を使用してデータベースにアクセスし前記標準の発行識別子を探索する手段により、前記標準の発行識別子を探索することができない場合、発行物検索ウェブページを前記ブラウザに表示する手段をさらに備えることを特徴とする請求項10に記載の装置。 Display the by accessing the database using the information extracted from the website means for searching the issue identifier of the standard, may not be able to explore the issue identifier of the standard, the publication search Web page to the browser 11. The apparatus of claim 10 , further comprising means for performing. 前記複数のパーサスクリプトを作成する手段は、前記ウェブサイトの前記ドメインに基づきテンプレートスクリプトを選択する手段と、前記テンプレートスクリプトを修正して前記発行物情報を取得するスクリプトエディタとを含むことを特徴とする請求項10に記載の装置。 The means for creating the plurality of parser scripts includes means for selecting a template script based on the domain of the website, and a script editor for correcting the template script to obtain the publication information. The apparatus according to claim 10 . 前記発行物情報は、前記発行物のタイトルおよび発行物番号の内の少なくとも1つを含むことを特徴とする請求項10に記載の装置。 The apparatus according to claim 10 , wherein the issue information includes at least one of a title and an issue number of the issue.
JP2011524951A 2008-08-28 2008-08-28 Method and apparatus for generating a standard document identifier from a content reference Active JP5438112B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2008/074579 WO2010024811A1 (en) 2008-08-28 2008-08-28 Method and apparatus for generating standard document identifiers from content references

Publications (2)

Publication Number Publication Date
JP2012501490A JP2012501490A (en) 2012-01-19
JP5438112B2 true JP5438112B2 (en) 2014-03-12

Family

ID=40451190

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011524951A Active JP5438112B2 (en) 2008-08-28 2008-08-28 Method and apparatus for generating a standard document identifier from a content reference

Country Status (5)

Country Link
EP (1) EP2321743A1 (en)
JP (1) JP5438112B2 (en)
AU (1) AU2008360993B2 (en)
CA (1) CA2735215C (en)
WO (1) WO2010024811A1 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5991143B2 (en) * 2012-10-31 2016-09-14 株式会社リコー Information processing apparatus, system, and information registration method
JP6075011B2 (en) * 2012-10-31 2017-02-08 株式会社リコー Information processing apparatus, system, and information providing method
JP6304408B2 (en) * 2017-01-12 2018-04-04 株式会社リコー Information processing apparatus, information providing method, and program
JP6451888B2 (en) * 2018-03-08 2019-01-16 株式会社リコー Information processing apparatus, system, and program
CN111046629B (en) * 2019-12-16 2022-03-01 北大方正集团有限公司 Outline display method, device and equipment

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3543726B2 (en) * 2000-04-17 2004-07-21 株式会社日立製作所 Knowledge search service method and apparatus for supporting search of books and the like
EP1422633A3 (en) * 2002-11-25 2007-11-28 Internet Disclosure Co., Ltd. Document authoring system and authoring management program
JP2004348241A (en) * 2003-05-20 2004-12-09 Hitachi Ltd Information providing method, server, and program
JP2007183833A (en) * 2006-01-06 2007-07-19 Kazutoshi Tsuda Information processing system
JP2007328510A (en) * 2006-06-07 2007-12-20 Ricoh Co Ltd Content conversion device, content display device, content browsing device, content conversion method, content browsing method and program

Also Published As

Publication number Publication date
CA2735215A1 (en) 2010-03-04
AU2008360993B2 (en) 2015-07-09
EP2321743A1 (en) 2011-05-18
JP2012501490A (en) 2012-01-19
AU2008360993A1 (en) 2010-03-04
WO2010024811A1 (en) 2010-03-04
CA2735215C (en) 2017-09-05

Similar Documents

Publication Publication Date Title
CA2590523C (en) Method and apparatus for converting a document universal resource locator to a standard document identifier
TW501033B (en) Electronic shopping agent which is capable of operating with vendor sites which have disparate formats
US20100114864A1 (en) Method and system for search engine optimization
EP2033125A2 (en) Message catalogs for remote modules
CN108052632A (en) A kind of method for obtaining network information, system and company information search system
US20030177202A1 (en) Method and apparatus for executing an instruction in a web page
JP5438112B2 (en) Method and apparatus for generating a standard document identifier from a content reference
US9015166B2 (en) Methods and systems for annotation of digital information
JP4774554B2 (en) Character content providing method and character content providing system
US8201242B2 (en) Method and apparatus for verifying content reuse rights and resolving rights in the presence of multiple licenses
RU2632149C2 (en) System, method and constant machine-readable medium for validation of web pages
Roumeliotis et al. An effective SEO techniques and technologies guide-map
US7711648B2 (en) Method and apparatus for obtaining content license rights via a document link resolver
US8131752B2 (en) Breaking documents
JP2007041983A (en) Application form creation program and application form creation apparatus
US20060184655A1 (en) Traffic analysis
JP2004341942A (en) Content classification method, content classification device, content classification program, and storage medium storing content classification program
Albertsen The paradigma web harvesting environment
US20130007585A1 (en) Methods and systems for annotation of digital information
Arnold et al. Procedural challenges: the FAIR principles and PRC electronic resources-a case study of Chinese republican newspapers
KR20100004016A (en) Method, system, and computer-readable recording medium for providing searchable advertisement
JP5682480B2 (en) Information processing apparatus, information processing method, and information processing program
Roumeliotis et al. 2 SEO Techniques & On-Page Optimization
EP1629399A2 (en) Method and apparatus for executing an instruction in a web page and for managing imported or exported data

Legal Events

Date Code Title Description
A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130910

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130918

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131212

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5438112

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250