JP2007183833A - Information processing system - Google Patents

Information processing system Download PDF

Info

Publication number
JP2007183833A
JP2007183833A JP2006001784A JP2006001784A JP2007183833A JP 2007183833 A JP2007183833 A JP 2007183833A JP 2006001784 A JP2006001784 A JP 2006001784A JP 2006001784 A JP2006001784 A JP 2006001784A JP 2007183833 A JP2007183833 A JP 2007183833A
Authority
JP
Japan
Prior art keywords
document
identifier
information
link
cited
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006001784A
Other languages
Japanese (ja)
Inventor
Kazutoshi Tsuda
和俊 津田
Hiroshi Sato
博 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KOMIYAMA INSATSU KOGYO KK
Original Assignee
KOMIYAMA INSATSU KOGYO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KOMIYAMA INSATSU KOGYO KK filed Critical KOMIYAMA INSATSU KOGYO KK
Priority to JP2006001784A priority Critical patent/JP2007183833A/en
Publication of JP2007183833A publication Critical patent/JP2007183833A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a system capable of automatically checking whether a document described as a cited reference exists or not. <P>SOLUTION: The electronic journal system comprises: a search formula generation means for extracting cited reference information included in document data, and generating a search formula based on the extracted cited reference information; an identifier acquisition means for searching a storage means for an identifier specific to the document by using the search formula generated by the search formula generation means; a link embedding means for generating link information for accessing original data of the cited reference by using the acquired identifier when the identifier specific to the document is acquired by the identifier acquisition means, and embedding the link information generated by the document data. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、電子ジャーナルを発行するための情報処理技術に関する。   The present invention relates to an information processing technique for issuing an electronic journal.

従来、学術論文の発表は、紙媒体の学術誌を通して行われていたが、昨今、インターネット上の電子ジャーナルで論文が公開されることが一般的になっている。   Conventionally, academic papers have been published through paper-based academic journals. Recently, however, papers are generally published in electronic journals on the Internet.

ところで、インターネット上で公開される論文には、多くの場合、各論文をユニークに特定するための識別子であるDOI(デジタル・オブジェクト識別子:Digital Object Identifier)が付与される。DOIとは、インターネット上で公開された論文の所在地を示すための世界共通のコード体系であり、URLの変更等に左右されず論文のオリジナルの所在地を特定できる。   By the way, in many cases, a DOI (Digital Object Identifier) that is an identifier for uniquely identifying each paper is given to a paper published on the Internet. DOI is a universal code system for indicating the location of a paper published on the Internet, and the original location of the paper can be specified without being affected by a change in URL or the like.

具体的には、DOIは「10.1039/j29710000797」のようなコードであり、図書や雑誌の単位だけでなく、その中に含まれる章、論文、表など、どのような単位にでも付与可能である。そして、このDOIを使うことによって、当該DOIに対応付けられる論文のオリジナルデータにアクセスすることが可能となる。   Specifically, the DOI is a code such as “10.1039 / j29710000797”, and can be assigned not only to the unit of books and magazines, but also to any unit such as chapters, papers, tables included in it. . By using this DOI, it is possible to access original data of a paper associated with the DOI.

DOIを用いて論文のオリジナルデータを閲覧する場合、例えば、crossref.org(非特許文献1)により提供されるWebページにおいて、DOIを入力するためのテキストボックスにDOIを入力して検索ボタンを押すと、当該DOIに対応付けられたURLをディレクトリサーバから取得し、当該URLを用いて論文のオリジナルデータにアクセスできる。また、DOIのディレクトリサーバを示すURL「http://dx.doi.org/」の後ろにDOIを付加したURL「http://dx.doi.org/10.1039/j29710000797」を使用して、文献に直接アクセスすることもできる。なお、ディレクトリサーバには、DOIと当該DOIによって特定される論文のオリジナルデータが存在するURLとが対応付けられて管理されている。また、crossref.orgには、論文等の属性情報とDOIとが対応付けられたデータベースも管理されている。
「crossref.org」、[online]、[平成18年1月6日検索]、インターネット<URL:http://mailserv.crossref.org/>
When browsing original data of a paper using DOI, for example, crossref. In the Web page provided by org (Non-Patent Document 1), when a DOI is input into a text box for inputting a DOI and the search button is pressed, a URL associated with the DOI is acquired from the directory server, The original data of the paper can be accessed using the URL. In addition, the URL “http://dx.doi.org/10.1039/j29710000797” with the DOI added after the URL “http://dx.doi.org/” indicating the DOI directory server You can also access directly. Note that the directory server manages the DOI and the URL where the original data of the paper specified by the DOI is associated with each other. Also, crossref. org also manages a database in which attribute information such as papers is associated with DOI.
“Crossref.org”, [online], [search January 6, 2006], Internet <URL: http://mailserv.crossref.org/>

ところで、上述のとおり、インターネット上の電子ジャーナルで論文が公開されることが一般的になり、紙媒体で論文誌を発行していた頃と比べて、研究者の論文執筆・閲覧環境は変化している。しかしながら、各々の論文の引用文献の記載の正確さについては、電子化前と変わらず、依然として著者の記述を信用するにとどまっている。編集出版側で検証及び修正することは、検証負担という人的な観点及び出版スケジュールという時間的な観点から見て、非常に難しいものである。   By the way, as described above, it is common for papers to be published in electronic journals on the Internet, and researchers' paper writing and browsing environments have changed compared to when paper journals were published. ing. However, the accuracy of the cited references in each paper is the same as before the digitization, and the author's description is still trusted. Verification and correction on the editing and publishing side is very difficult from the viewpoint of human burden of verification burden and time of publication schedule.

本発明は、かかる実情に鑑み、文書中に引用文献として記載された文献が存在するかどうかを自動的に確認することのできるシステムを提供しようとするものである。特に、引用文献の電子ジャーナル等へのリンクの存在を自動的に確認し、リンクが存在する場合には当該リンクを文書に埋め込んだ上で公開し、また、新たに公開される論文の引用文献を自動的に蓄積することを目的としている。   In view of such a situation, the present invention intends to provide a system capable of automatically confirming whether or not a document described as a cited document exists in a document. In particular, the existence of a link to an electronic journal etc. of a cited document is automatically confirmed, and if a link exists, the link is embedded in the document and published, and the cited document of a newly published paper is also published. Is intended to automatically accumulate

上記課題を解決するため、本発明の電子ジャーナルシステムは、文書データに含まれる引用文献に関する情報を抽出し、抽出した引用文献情報に基づいて検索式を生成する検索式生成手段と、検索式生成手段により生成された検索式を用いて、記憶手段(データベース)から文献固有の識別子を検索する識別子取得手段と、識別子取得手段によって文献固有の識別子が取得されたとき、取得された識別子を用いて引用文献のオリジナルデータへアクセスするためのリンク情報を生成し、文書データに生成されたリンク情報を埋め込むリンク埋込手段と、を備える。   In order to solve the above problems, an electronic journal system of the present invention extracts information relating to a cited document included in document data, and generates a search expression based on the extracted cited document information, and a search expression generation Using the search expression generated by the means, an identifier acquisition means for searching for a document-specific identifier from the storage means (database), and when the identifier acquisition means acquires the document-specific identifier, the acquired identifier is used. Link embedding means for generating link information for accessing the original data of the cited document and embedding the link information generated in the document data.

好適には、文献固有の識別子と文献のジャーナル名等を示す属性情報とを対応付けて記憶する文献情報記憶手段をさらに備え、識別子取得手段は、検索式生成手段により生成された検索式を用いて文献情報記憶手段を検索し、文献情報記憶手段から識別子を取得できない場合には、システム外部の記憶手段を使用して、識別子を検索することを特徴とする。なお、「システム外部の記憶手段」とは、本電子ジャーナルシステムとネットワークを介して接続される記憶手段のことであり、例えば、crossref.org等の管理する記憶手段(データベース)を含む。   Preferably, the information processing apparatus further includes a document information storage unit that stores an identifier unique to the document and attribute information indicating a journal name of the document in association with each other, and the identifier acquisition unit uses the search formula generated by the search formula generation unit. If the document information storage means is searched and the identifier cannot be obtained from the document information storage means, the identifier is searched using the storage means outside the system. The “storage means outside the system” is a storage means connected to the electronic journal system via a network. For example, crossref. storage means (database) managed by org or the like.

このとき、識別子取得手段が、システム外部の記憶手段(データベース)を使用して識別子を取得したとき、取得された識別子と当該識別子に係る引用文献の属性情報とを対応付けて文献情報記憶手段に蓄積する文献情報蓄積手段をさらに備えることが好ましい。   At this time, when the identifier acquisition unit acquires the identifier using the storage unit (database) outside the system, the acquired identifier is associated with the attribute information of the cited document related to the identifier in the document information storage unit. It is preferable to further include document information storage means for storing.

また、好適には、文書データを電子メールにより受け付ける受付手段と、識別子取得手段によって文献固有の識別子が取得されないとき、電子メールの送信元に対して、誤記の確認等を促すための電子メールを送信する確認手段と、をさらに備える。さらに、文書データは、電子ジャーナルに投稿された論文であることが好ましい。   Preferably, an e-mail for urging the sender of the e-mail to confirm an error or the like when the document-specific identifier is not acquired by the receiving unit that receives the document data by e-mail and the identifier acquiring unit. And a confirmation means for transmitting. Furthermore, the document data is preferably a paper submitted to an electronic journal.

また、本発明のリンク生成方法は、システムの動作又は処理を制御するための制御手段を備える電子ジャーナルシステムにおいて、文書データに含まれる引用文献にリンク情報を生成する方法であって、制御手段が、文書データに含まれる引用文献情報を抽出し、抽出した引用文献情報に基づいて検索式を生成するステップと、生成された検索式を用いて、制御手段が記憶手段(データベース)から文献固有の識別子を検索するステップと、検索の結果、文献固有の識別子が取得されたとき、制御手段が取得された識別子を用いて引用文献のオリジナルデータへアクセスするためのリンク情報を生成し、文書データに生成されたリンク情報を埋め込むステップと、を備える。   The link generation method of the present invention is a method for generating link information in a cited document included in document data in an electronic journal system comprising a control means for controlling the operation or processing of the system, wherein the control means , Extracting cited document information included in the document data, generating a search expression based on the extracted cited document information, and using the generated search expression, the control means stores the document-specific information from the storage means (database). When the identifier unique to the document is acquired as a result of the search, and the search means generates link information for accessing the original data of the cited document using the acquired identifier, Embedding the generated link information.

本発明のプログラムは、本発明のリンク生成方法の各ステップをコンピュータに実行させることを特徴とする。本発明のプログラムは、CD−ROM等の光学ディスク、磁気ディスク、半導体メモリなどの各種の記録媒体を通じて、又は通信ネットワークなどを介してダウンロードすることにより、コンピュータにインストール又はロードすることができる。   The program of the present invention causes a computer to execute each step of the link generation method of the present invention. The program of the present invention can be installed or loaded on a computer through various recording media such as an optical disk such as a CD-ROM, a magnetic disk, or a semiconductor memory, or via a communication network.

なお、本明細書等において、手段とは、単に物理的手段を意味するものではなく、その手段が有する機能をソフトウェアによって実現する場合も含む。また、1つの手段が有する機能が2つ以上の物理的手段により実現されても、2つ以上の手段の機能が1つの物理的手段により実現されてもよい。   In this specification and the like, the means does not simply mean a physical means, but includes a case where the functions of the means are realized by software. Further, the function of one means may be realized by two or more physical means, or the functions of two or more means may be realized by one physical means.

本発明によれば、文書中に引用文献として記載された文献が電子ジャーナルで公表されているかどうかを自動的に確認することのできるシステムを実現することが可能となる。また、引用文献の電子ジャーナル等へのリンクの存在を自動的に確認し、リンクが存在する場合には当該リンクを文書に埋め込んだ上で公開する。また、リンクが存在しない場合には電子メールを自動的に送信することによって、論文の著者に誤記等の確認を促すことができる。さらに、新たに公開される論文の引用文献を自動的に蓄積することにより、通信コストやトラフィックの負荷を削減できるという効果を奏する。   According to the present invention, it is possible to realize a system capable of automatically confirming whether or not a document described as a cited document in a document is published in an electronic journal. In addition, the existence of a link to an electronic journal or the like of a cited document is automatically confirmed, and if a link exists, the link is embedded in a document and released. In addition, when a link does not exist, an e-mail is automatically transmitted to prompt the author of the paper to confirm an error. Furthermore, by automatically accumulating citations of newly published papers, the communication cost and traffic load can be reduced.

以下、本発明の実施の形態について図面を参照しつつ説明する。   Embodiments of the present invention will be described below with reference to the drawings.

図1は、本実施形態に係る電子ジャーナルシステムの概略構成を示す図である。図1に示すように、本電子ジャーナルシステム10は、文献識別子サーバ20と、一以上のユーザ端末装置30とが、ネットワーク40を介して相互に接続されることにより構成される。   FIG. 1 is a diagram showing a schematic configuration of an electronic journal system according to the present embodiment. As shown in FIG. 1, the electronic journal system 10 is configured by connecting a document identifier server 20 and one or more user terminal devices 30 via a network 40.

電子ジャーナルシステム10は、電子ジャーナルに投稿された論文の電子データ(以下、「電子論文」という)に含まれる引用文献へのリンクを当該電子論文に自動的に埋め込む機能を備えるコンピュータシステムである。詳細は後述する。   The electronic journal system 10 is a computer system having a function of automatically embedding a link to a cited document included in electronic data of an article submitted to an electronic journal (hereinafter referred to as “electronic article”). Details will be described later.

文献識別子サーバ20は、電子論文のメタデータである属性情報と当該電子論文を識別するためのDOI(デジタル・オブジェクト識別子)とを対応付けて記憶手段(データベース)に管理し、電子論文の属性情報の入力に基づいて当該属性情報に対応付けられたDOIを検索して出力するためのコンピュータサーバである。文献識別子サーバ20は、インターネット上の主要な電子ジャーナルで公表される論文を原則全て管理することが好ましい。具体的には、crossref.orgなどのWebサーバが該当する。なお、属性情報とは、著者名、ジャーナル(論文誌)の名称、発行年、発行月、巻、号、ページ数、論文名称等、電子論文を特定するための各種情報(メタデータ)の一部又は全部を意味する。   The document identifier server 20 associates attribute information, which is metadata of an electronic paper, and a DOI (digital object identifier) for identifying the electronic paper in association with each other in a storage means (database). This is a computer server for searching and outputting the DOI associated with the attribute information based on the input. The document identifier server 20 preferably manages all articles published in major electronic journals on the Internet. Specifically, crossref. or a web server such as org. The attribute information is a variety of information (metadata) for identifying electronic papers such as author name, journal (paper journal) name, publication year, publication month, volume, issue, number of pages, paper title, etc. Part or all.

ユーザ端末装置30は、電子ジャーナルシステム10に電子論文を送信可能な端末装置である。好適には、電子メールを送受信するためのメーラーを備える。また、Webページを閲覧するためのブラウザを備え、電子ジャーナルシステム10にて公開された電子論文を閲覧できることが好ましい。   The user terminal device 30 is a terminal device capable of transmitting an electronic paper to the electronic journal system 10. Preferably, a mailer for sending and receiving electronic mail is provided. In addition, it is preferable that a browser for browsing web pages is provided so that electronic papers published in the electronic journal system 10 can be browsed.

ネットワーク40は、電子ジャーナルシステム10と、文献識別子サーバ20と、ユーザ端末装置30との間で情報を送受信するための通信回線である。例えば、インターネット、LAN、専用線、パケット通信網、電話回線、企業内ネットワーク、その他の通信回線、それらの組み合わせ等のいずれであってもよく、有線であるか無線であるかを問わない。   The network 40 is a communication line for transmitting / receiving information among the electronic journal system 10, the document identifier server 20, and the user terminal device 30. For example, it may be any of the Internet, a LAN, a dedicated line, a packet communication network, a telephone line, a corporate network, other communication lines, combinations thereof, and the like, regardless of whether they are wired or wireless.

図2は、電子ジャーナルシステム10の主な装置構成の一例を示すブロック図である。電子ジャーナルシステム10は、電子ジャーナルシステム10全体の処理及び動作を制御するCPU等の制御手段50と、制御手段50が制御等を実行する際の作業領域であるRAM等の主記憶手段52と、制御手段50が制御等を実行するためのプログラム又はデータを記憶するROM等の読出用記憶手段54と、電子ジャーナルシステム10の実行する処理に必要な各種情報を記憶するための外部記憶手段56と、情報の入出力を行う入出力インタフェース等の入出力手段58と、少なくとも文献識別子サーバ20及びユーザ端末装置30と通信を行うための通信インタフェース等の通信手段60と、これら各手段を結ぶバス等の接続手段62を備える。   FIG. 2 is a block diagram illustrating an example of a main device configuration of the electronic journal system 10. The electronic journal system 10 includes a control unit 50 such as a CPU that controls processing and operations of the entire electronic journal system 10, a main storage unit 52 such as a RAM that is a work area when the control unit 50 executes control and the like, A reading storage means 54 such as a ROM for storing a program or data for the control means 50 to execute control or the like, and an external storage means 56 for storing various information necessary for processing executed by the electronic journal system 10 , An input / output means 58 such as an input / output interface for inputting / outputting information, a communication means 60 such as a communication interface for communicating with at least the document identifier server 20 and the user terminal device 30, and a bus connecting these means The connection means 62 is provided.

上記の装置構成の全部又は本発明を実施するのに必要な一部を備える専用又は汎用のコンピュータを、電子ジャーナルシステム10として適用することができる。なお、電子ジャーナルシステム10は、単一のコンピュータより構成されるものであっても、ネットワーク上に分散した複数のコンピュータより構成されるものであってもよい。   A dedicated or general-purpose computer having all of the above-described apparatus configuration or a part necessary for carrying out the present invention can be applied as the electronic journal system 10. The electronic journal system 10 may be composed of a single computer or a plurality of computers distributed on a network.

文献識別子サーバ20は、例えば、電子論文の属性情報とDOIとを対応付けた記憶手段(データベース)を管理するデータベースサーバと、当該データベースサーバを操作して検索結果を送受信するためのWebサーバとを備えて構成される。各サーバは、単一のコンピュータより構成されるものであっても、ネットワーク上に分散した複数のコンピュータより構成されるものであってもよい。   The document identifier server 20 includes, for example, a database server that manages storage means (database) that associates electronic paper attribute information with DOI, and a Web server that operates the database server to transmit and receive search results. It is prepared for. Each server may be composed of a single computer or may be composed of a plurality of computers distributed on a network.

ユーザ端末装置30は、インターネット等のネットワークに接続可能な汎用又は専用のコンピュータ又は携帯電話機を含む携帯型端末装置を適用できる。   As the user terminal device 30, a portable terminal device including a general-purpose or dedicated computer or a mobile phone that can be connected to a network such as the Internet can be applied.

図3は、電子ジャーナルシステム10の主な機能構成を示すブロック図である。電子ジャーナルシステム10は、受付手段70と、検索式生成手段72と、識別子取得手段74と、リンク埋込手段76と、公開手段78を含んで構成される。また、好ましくは、文献情報蓄積手段80と、確認手段82とを、さらに含んで構成される。例えば、電子ジャーナルシステム10の制御手段50が、読出用記憶手段54又は外部記憶手段56などに記憶された所定のプログラムを実行し、制御手段50を各種機能実現手段として機能させることによって、これら各機能手段が実現される。   FIG. 3 is a block diagram showing the main functional configuration of the electronic journal system 10. The electronic journal system 10 includes an accepting unit 70, a search expression generating unit 72, an identifier obtaining unit 74, a link embedding unit 76, and a disclosure unit 78. In addition, preferably, the document information storage unit 80 and the confirmation unit 82 are further included. For example, the control means 50 of the electronic journal system 10 executes a predetermined program stored in the reading storage means 54 or the external storage means 56 and causes the control means 50 to function as various function realization means. Functional means are realized.

また、好ましくは、電子ジャーナルシステム10の外部記憶手段56は、以前に引用した文献(電子論文)の属性情報とDOIとを対応付けて記憶する文献情報蓄積領域84と、あいまい検索を行うための辞書情報を記憶する辞書情報記憶領域86とを含んで構成される。   Preferably, the external storage unit 56 of the electronic journal system 10 includes a document information storage area 84 that stores attribute information of a previously cited document (electronic article) and DOI in association with each other, and an ambiguous search. And a dictionary information storage area 86 for storing dictionary information.

受付手段70は、電子ジャーナルへの論文の投稿を受け付ける機能を備える。好ましくは、論文の著者等が、電子メールに電子論文を添付又は貼り付けて、自己のユーザ端末装置30から電子ジャーナルシステム10に当該電子メールを送信し、受付手段70が当該電子メールに添付又は貼り付けられた電子論文を受け取る。   The accepting unit 70 has a function of accepting submission of a paper to an electronic journal. Preferably, the author or the like of the paper attaches or pastes the electronic paper to the electronic mail and transmits the electronic mail from the user terminal device 30 to the electronic journal system 10, and the receiving means 70 attaches or attaches to the electronic mail. Receive the pasted electronic paper.

検索式生成手段72は、受付手段70により受け付けられた電子論文から引用文献が記述されている箇所を抽出し、DOIを検索するための検索式を生成する機能を備える。例えば、電子論文の末尾周辺部分を全文検索し、「参考文献」又は「References」等の項目立てを検出することによって引用文献が記述されている箇所を抽出する。そして、電子論文に記述されている各引用文献ごとに、DOIを検索するための検索式を生成する。検索式は、ジャーナル名、発行年、巻、号、ページ数等の属性情報を含んで構成される。検索に使用する属性情報は、必要に応じて任意のものを使用すればよい。   The search expression generation unit 72 has a function of extracting a portion where a cited document is described from the electronic paper received by the reception unit 70 and generating a search expression for searching the DOI. For example, a full-text search is performed on the end peripheral part of an electronic paper, and a part where a cited document is described is extracted by detecting an item set such as “references” or “References”. Then, a search expression for searching the DOI is generated for each cited document described in the electronic paper. The search formula includes attribute information such as journal name, publication year, volume, issue, and number of pages. Any attribute information used for the search may be used as necessary.

なお、論文に記載される引用文献は、ジャーナルごとに一定のフォーマットに従って記載されることが一般的である。そこで、ジャーナルごとに属性情報を抽出するためのフォーム情報を予め設定しておくことにより、検索に必要な属性情報を取得することができる。   In addition, it is general that the cited references described in the paper are described according to a certain format for each journal. Therefore, by setting in advance form information for extracting attribute information for each journal, it is possible to acquire attribute information necessary for the search.

識別子取得手段74は、検索式生成手段72によって生成された検索式に基づいて記憶手段(データベース)を検索し、文献固有の識別子であるDOIを取得する機能を備える。好ましくは、まず、電子ジャーナルシステム10のローカルで管理されるデータベースである文献情報記憶手段84を検索する。そして、文献情報記憶手段84で検索結果を得られる場合、すなわち、文献情報記憶手段84に当該検索式に係る文献の情報が蓄積されている場合、文献情報記憶手段84からDOIを取得する。文献情報記憶手段84で検索結果を得られない場合、電子ジャーナルシステム10外部の文献識別子サーバ20にアクセスして、文献識別子サーバ20のデータベースの検索を行い、DOIを取得する。このように、まずローカルの記憶手段(文献情報記憶手段84)を検索してDOIの取得を試みることによって、通信コストやトラフィックの負荷を抑えることができるとともに、トータルの処理スピードを向上させることができる。   The identifier acquisition unit 74 has a function of searching the storage unit (database) based on the search formula generated by the search formula generation unit 72 and acquiring a DOI that is a document-specific identifier. Preferably, first, the document information storage means 84 which is a locally managed database of the electronic journal system 10 is searched. Then, when the search result can be obtained in the document information storage unit 84, that is, when the information of the document related to the search formula is accumulated in the document information storage unit 84, the DOI is acquired from the document information storage unit 84. When the search result cannot be obtained in the document information storage unit 84, the document identifier server 20 outside the electronic journal system 10 is accessed, the database of the document identifier server 20 is searched, and the DOI is acquired. Thus, by first searching the local storage means (document information storage means 84) and attempting to obtain the DOI, it is possible to reduce the communication cost and traffic load and improve the total processing speed. it can.

文献識別子サーバ20を検索しても、検索結果が得られないとき、検索式の一部を変更して検索を行う(いわゆる、あいまい検索)。このとき、辞書情報記憶手段86に記憶される辞書情報を利用して検索式を変更する。例えば、辞書情報記憶手段86を参照して、検索式中のジャーナル名称を「Journal of International ・・・」から「Jour. Int. ・・・」に変更する。また、検索する属性情報の種類を一部入れ替えてもよい。   If a search result is not obtained even after searching the document identifier server 20, a search is performed by changing a part of the search formula (so-called fuzzy search). At this time, the search formula is changed using the dictionary information stored in the dictionary information storage means 86. For example, referring to the dictionary information storage means 86, the journal name in the search formula is changed from "Journal of International ..." to "Jour. Int ....". In addition, the type of attribute information to be searched may be partially replaced.

リンク埋込手段76は、識別子取得手段74により取得されたDOIに基づいて、引用文献のオリジナルデータに直接アクセスするためのリンク情報(URL)を生成し、当該生成されたリンク情報を電子論文中の当該引用文献が記載されている部分に埋め込む機能を備える。識別子取得手段68がDOIを取得できなかった場合は、リンクを埋め込まない。   The link embedding unit 76 generates link information (URL) for directly accessing the original data of the cited document based on the DOI acquired by the identifier acquiring unit 74, and the generated link information is included in the electronic paper. A function of embedding in the portion where the cited document is described is provided. If the identifier acquisition unit 68 cannot acquire the DOI, the link is not embedded.

公開手段78は、電子論文に引用文献のリンク情報の付加が完了した後、電子論文をWebサイト上に公開する機能を備える。例えば、電子ジャーナルのWebページに電子論文をアップロードするなどすればよい。   The publishing means 78 has a function of publishing an electronic paper on a Web site after the addition of the link information of the cited document to the electronic paper is completed. For example, an electronic paper may be uploaded to a web page of an electronic journal.

文献情報蓄積手段80は、識別子取得手段74が、文献識別子サーバ20からDOIを取得したとき、取得したDOIと当該DOIに係る文献の属性情報とを対応付けて、文献情報記憶手段84に蓄積する機能を備える。これにより、過去にDOIを取得した文献をローカルで管理することができ、識別子取得手段74がDOIを検索・取得する際に、文献情報記憶手段84をキャッシュのように利用することが可能となる。論文に引用される文献は特定の文献に集中することが多いため、一度使用したDOIをローカルで管理することは、処理効率の大幅な向上につながる。   When the identifier acquisition unit 74 acquires the DOI from the document identifier server 20, the document information storage unit 80 stores the acquired DOI and the document attribute information related to the DOI in association with each other in the document information storage unit 84. It has a function. As a result, it is possible to locally manage a document for which a DOI has been acquired in the past, and when the identifier acquiring unit 74 searches and acquires the DOI, the document information storage unit 84 can be used like a cache. . Since the documents cited in the paper are often concentrated on specific documents, managing the DOI once used locally leads to a significant improvement in processing efficiency.

確認手段82は、識別子取得手段74がDOIを取得できなかった場合に、電子論文の著者に対して、引用文献の記載に誤りがないかを確認するための機能を備える。例えば、DOIを取得できなかった引用文献の記載、及び、現在の引用文献の記載ではDOIを取得できない旨を記載した電子メールを電子論文の著者等に自動的に通知し、誤記等の確認を促す。このとき、電子メールの送信先には、受付手段60により受け付けた電子メールの送信元を使用することが好ましい。   The confirmation unit 82 has a function for confirming whether or not there is an error in the description of the cited document with respect to the author of the electronic paper when the identifier acquisition unit 74 cannot acquire the DOI. For example, it automatically notifies the authors of electronic papers of e-mails stating that the DOI cannot be obtained with the description of the cited references that could not obtain the DOI and the description of the current cited references, and confirms typographical errors, etc. Prompt. At this time, it is preferable to use the transmission source of the email received by the receiving means 60 as the transmission destination of the email.

文献情報記憶手段84は、電子ジャーナルシステム10のローカルで、文献固有のDOIと当該文献の属性情報とを対応付けて記憶するための記憶手段(データベース)である。   The document information storage unit 84 is a storage unit (database) for storing a document-specific DOI and attribute information of the document in association with each other locally in the electronic journal system 10.

辞書情報記憶手段86は、識別子取得手段74がDOIを検索する際に、検索式生成手段72で生成された検索式の一部を変更してあいまい検索を実行する場合に参照される辞書情報を記憶する手段である。例えば、ジャーナルの正式名称と略称との対応付けや、単語とその略語との対応付けが辞書情報として記憶されている。   The dictionary information storage means 86 stores the dictionary information that is referred to when the identifier acquisition means 74 performs a fuzzy search by changing a part of the search expression generated by the search expression generation means 72 when searching the DOI. It is a means to memorize. For example, associations between the official names and abbreviations of journals and associations between words and abbreviations are stored as dictionary information.

図4は、リンク埋込手段76により電子論文に埋め込まれるリンク情報の一例を示す図である。同図(A)は、リンク情報が埋め込まれる前の引用文献の記載を示す図である。この例では、a)〜c)の3文献が引用されている。同図(B)は、リンク情報が埋め込まれた後の引用文献の記載を示す図である。同図の例では、a)とc)の2文献についてはDOIを取得でき、b)の文献についてはDOIを取得できなかった場合を示している。リンク埋込手段76は、取得したDOI(例えば、10.1039/j29710000797)に所定の文字列(http://dx.doi.org/)を付加して文献のオリジナルデータにアクセスするためのURL等のリンク情報(例えば、http://dx.doi.org/10.1039/j29710000797)を生成し、公開する電子論文のファイル形式に合わせた所定フォーマット(例えば、\href[http://dx.doi.org/10.1039/j29710000797])よって電子論文にリンク情報を埋め込む。   FIG. 4 is a diagram showing an example of link information embedded in the electronic paper by the link embedding unit 76. FIG. 6A is a diagram showing the description of a cited document before link information is embedded. In this example, three documents a) to c) are cited. FIG. 5B is a diagram showing the description of the cited document after the link information is embedded. In the example shown in the figure, the DOI can be acquired for the two documents a) and c), and the DOI cannot be acquired for the document b). The link embedding unit 76 adds a predetermined character string (http://dx.doi.org/) to the acquired DOI (for example, 10.1039 / j29710000797) and accesses a URL or the like for accessing the original data of the document. A link information (for example, http://dx.doi.org/10.1039/j29710000797) is generated, and a predetermined format (for example, \ href [http://dx.doi.org /10.1039/j29710000797]) Therefore, the link information is embedded in the electronic paper.

図5は、電子ジャーナルシステム10における処理手順の一例を示すフローチャートである。まず、電子ジャーナルシステム10の受付手段70が、ユーザ端末装置30から電子論文の投稿を受け付ける(S100)。検索式生成手段72は、受け付けた電子論文から引用文献が記載されている箇所を抽出し、DOIを検索するための検索式を生成する(S102)。その後、識別子取得手段74は、生成された検索式を用いてDOIを検索する。このとき、まず、文献情報記憶手段84を検索してDOIの取得を試みる(S104)。文献情報記憶手段84を検索してDOIを取得できない場合、文献識別子サーバ20にアクセスして、文献識別子サーバ20の記憶手段(データベース)を検索する(S106)。なお、DOIを検索するとき、必要に応じて辞書情報記憶手段86を参照し、あいまい検索を実行する。文献識別子サーバ20の記憶手段(データベース)を検索してDOIを取得したとき、文献情報蓄積手段80は、取得したDOIを文献の属性情報と対応付けて文献情報記憶手段84に蓄積する(S108)。   FIG. 5 is a flowchart illustrating an example of a processing procedure in the electronic journal system 10. First, the accepting means 70 of the electronic journal system 10 accepts submission of an electronic paper from the user terminal device 30 (S100). The search expression generation unit 72 extracts a part where the cited document is described from the accepted electronic paper and generates a search expression for searching the DOI (S102). Thereafter, the identifier acquisition unit 74 searches the DOI using the generated search expression. At this time, first, the document information storage unit 84 is searched to try to obtain the DOI (S104). If the DOI cannot be obtained by searching the document information storage unit 84, the document identifier server 20 is accessed and the storage unit (database) of the document identifier server 20 is searched (S106). When searching for a DOI, the dictionary information storage unit 86 is referred to as necessary to perform an ambiguous search. When the storage means (database) of the document identifier server 20 is searched and the DOI is acquired, the document information storage unit 80 stores the acquired DOI in the document information storage unit 84 in association with the attribute information of the document (S108). .

識別子取得手段74がDOIを取得できたとき、取得したDOIを基に、リンク埋込手段76は引用文献のオリジナルデータに直接アクセスするためのリンク情報(URL)を生成し、電子論文の引用文献記載箇所に当該リンク情報を付加する(S110)。識別子取得手段74がDOIを取得できなかったとき、当該引用文献にはリンク情報を付加しない。また、必要に応じて、電子論文の著者等に対して電子メールを送信し、引用文献の記載に誤記がないかどうかの確認を促す(S112)。なお、この確認処理は、DOIを取得できない引用文献をまとめて著者等に通知してもよい。   When the identifier acquisition unit 74 can acquire the DOI, the link embedding unit 76 generates link information (URL) for directly accessing the original data of the cited document based on the acquired DOI, and describes the cited document of the electronic paper. The link information is added to the location (S110). When the identifier acquisition unit 74 cannot acquire the DOI, link information is not added to the cited document. Further, if necessary, an e-mail is transmitted to the author of the electronic paper, etc., and confirmation is made as to whether or not there is an error in the description of the cited document (S112). In this confirmation process, the cited documents that cannot obtain the DOI may be collectively notified to the author or the like.

電子ジャーナルシステム10は、受け付けた電子論文に引用される全ての文献について、S102からS112の処理を繰り返し行う(S114)。そして、全ての引用文献について処理が完了した後、公開手段78がリンク情報の埋め込まれた電子論文をWebサイトに公開する(S116)。   The electronic journal system 10 repeats the processing from S102 to S112 for all documents cited in the accepted electronic paper (S114). Then, after the processing is completed for all the cited references, the publication means 78 publishes the electronic paper with the link information embedded on the website (S116).

なお、各ステップは処理内容に矛盾を生じない範囲で任意に順番を変更して又は並列に実行することができる。   Note that the steps can be executed in any order or in parallel as long as the processing contents do not contradict each other.

なお、本発明は、上記した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において、他の様々な形で実施することができる。このため、上記実施形態はあらゆる点で単なる例示にすぎず、限定的に解釈されるものではない。   The present invention is not limited to the above-described embodiment, and can be implemented in various other forms without departing from the gist of the present invention. For this reason, the said embodiment is only a mere illustration in all points, and is not interpreted limitedly.

例えば、本実施形態においては、電子ジャーナルに投稿される電子論文の引用文献にリンク情報を自動的に埋め込む例を示したが、電子論文に限らず、レポートや本の電子データ、その他、文献を引用するあらゆる文書データに適用できる。   For example, in the present embodiment, an example in which link information is automatically embedded in a cited reference of an electronic paper submitted to an electronic journal has been shown, but not limited to an electronic paper, a report, electronic data of a book, and other documents Applicable to any document data cited.

本実施形態においては、DOIを利用して電子論文を識別し、リンク情報を生成するものとしたが、識別子及びリンク情報の生成はDOIを使用するものに限定されない。また、本実施形態においては、電子論文中の引用文献のリンクを自動生成する例を示したが、文献以外にも音楽や映像データ等のデジタルオブジェクトを引用する場合にも適用可能である。   In the present embodiment, the electronic article is identified by using the DOI and the link information is generated. However, the generation of the identifier and the link information is not limited to that using the DOI. In the present embodiment, an example of automatically generating a link of a cited document in an electronic paper has been described. However, the present invention can be applied to a case where a digital object such as music or video data is cited in addition to the document.

本実施形態に係る電子ジャーナルシステムの概略構成を示す図である。It is a figure which shows schematic structure of the electronic journal system which concerns on this embodiment. 電子ジャーナルシステム10の主な装置構成の一例を示すブロック図である。1 is a block diagram illustrating an example of a main device configuration of an electronic journal system 10. FIG. 電子ジャーナルシステム10の主な機能構成を示すブロック図である。2 is a block diagram showing a main functional configuration of the electronic journal system 10. FIG. 電子論文に埋め込まれるリンク情報の一例を示す図である。It is a figure which shows an example of the link information embedded in an electronic paper. 電子ジャーナルシステム10における処理手順の一例を示すフローチャートである。4 is a flowchart illustrating an example of a processing procedure in the electronic journal system 10.

符号の説明Explanation of symbols

10 電子ジャーナルシステム
20 文献識別子サーバ
30 ユーザ端末装置
40 ネットワーク

10 Electronic Journal System 20 Literature Identifier Server 30 User Terminal Device 40 Network

Claims (8)

文書データに含まれる引用文献に関する情報を抽出し、抽出した引用文献情報に基づいて検索式を生成する検索式生成手段と、
前記検索式生成手段により生成された検索式を用いて、記憶手段から文献固有の識別子を検索する識別子取得手段と、
前記識別子取得手段によって文献固有の識別子が取得されたとき、前記取得された識別子を用いて引用文献のオリジナルデータへアクセスするためのリンク情報を生成し、前記文書データに前記生成されたリンク情報を埋め込むリンク埋込手段と、
を備える電子ジャーナルシステム。
A search expression generating means for extracting information on the cited document included in the document data, and generating a search expression based on the extracted cited document information;
Using the search formula generated by the search formula generation means, an identifier acquisition means for searching for a document-specific identifier from the storage means;
When an identifier unique to a document is acquired by the identifier acquisition means, link information for accessing original data of a cited document is generated using the acquired identifier, and the generated link information is added to the document data. A link embedding means for embedding;
Electronic journal system with
文献固有の識別子と前記文献のジャーナル名等を示す属性情報とを対応付けて記憶する文献情報記憶手段をさらに備え、
前記識別子取得手段は、
前記検索式生成手段により生成された検索式を用いて前記文献情報記憶手段を検索し、前記文献情報記憶手段から識別子を取得できない場合には、システム外部の記憶手段を使用して、識別子を検索する
ことを特徴とする請求項1記載の電子ジャーナルシステム。
A document information storage unit that stores an identifier unique to the document and attribute information indicating a journal name of the document in association with each other,
The identifier acquisition means
The document information storage unit is searched using the search expression generated by the search expression generation unit, and when the identifier cannot be obtained from the document information storage unit, the identifier is searched using the storage unit outside the system. The electronic journal system according to claim 1, wherein:
前記識別子取得手段が、システム外部の記憶手段を使用して識別子を取得したとき、前記取得された識別子と当該識別子に係る引用文献の属性情報とを対応付けて前記文献情報記憶手段に蓄積する文献情報蓄積手段をさらに備える
ことを特徴とする請求項2記載の電子ジャーナルシステム。
When the identifier acquisition unit acquires an identifier using a storage unit outside the system, the document is stored in the document information storage unit in association with the acquired identifier and attribute information of the cited document related to the identifier. 3. The electronic journal system according to claim 2, further comprising information storage means.
文書データを電子メールにより受け付ける受付手段と、
前記識別子取得手段によって文献固有の識別子が取得されないとき、前記電子メールの送信元に対して電子メールを送信する確認手段と、
をさらに備えることを特徴とする請求項1乃至3のいずれかに記載の電子ジャーナルシステム。
A receiving means for receiving document data by e-mail;
When the identifier acquisition unit does not acquire a document-specific identifier, a confirmation unit that transmits an e-mail to the e-mail transmission source;
The electronic journal system according to claim 1, further comprising:
前記文書データは、電子ジャーナルに投稿された論文である
ことを特徴とする請求項1乃至4のいずれかに記載の電子ジャーナルシステム。
The electronic journal system according to claim 1, wherein the document data is a paper submitted to an electronic journal.
システムの動作又は処理を制御するための制御手段を備える電子ジャーナルシステムにおいて、文書データに含まれる引用文献にリンク情報を生成する方法であって、
前記制御手段が、文書データに含まれる引用文献情報を抽出し、抽出した引用文献情報に基づいて検索式を生成するステップと、
前記生成された検索式を用いて、前記制御手段が記憶手段から文献固有の識別子を検索するステップと、
前記検索の結果、文献固有の識別子が取得されたとき、前記制御手段が前記取得された識別子を用いて引用文献のオリジナルデータへアクセスするためのリンク情報を生成し、前記文書データに前記生成されたリンク情報を埋め込むステップと、
を備えるリンク生成方法。
In an electronic journal system comprising a control means for controlling the operation or processing of a system, a method for generating link information in a cited document included in document data,
The control means extracting cited document information included in the document data, and generating a search formula based on the extracted cited document information;
Using the generated search expression, the control means searches for a document-specific identifier from a storage means;
As a result of the search, when an identifier unique to a document is acquired, the control means generates link information for accessing original data of a cited document using the acquired identifier, and is generated in the document data. Embedding the link information
A link generation method comprising:
請求項6に記載のリンク生成方法をコンピュータに実行させるためのプログラム。   A program for causing a computer to execute the link generation method according to claim 6. 請求項7に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。

A computer-readable recording medium on which the program according to claim 7 is recorded.

JP2006001784A 2006-01-06 2006-01-06 Information processing system Pending JP2007183833A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006001784A JP2007183833A (en) 2006-01-06 2006-01-06 Information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006001784A JP2007183833A (en) 2006-01-06 2006-01-06 Information processing system

Publications (1)

Publication Number Publication Date
JP2007183833A true JP2007183833A (en) 2007-07-19

Family

ID=38339862

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006001784A Pending JP2007183833A (en) 2006-01-06 2006-01-06 Information processing system

Country Status (1)

Country Link
JP (1) JP2007183833A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009064091A (en) * 2007-09-04 2009-03-26 Komiyama Insatsu Kogyo Kk Electronic journal editing system and original editing method
JP2012501490A (en) * 2008-08-28 2012-01-19 コピーライト クリアランス センター インコーポレイテッド Method and apparatus for generating a standard document identifier from a content reference
US9239884B2 (en) 2008-05-22 2016-01-19 Alcatel Lucent Electronic document processing with automatic generation of links to cited references

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001118180A (en) * 1999-10-15 2001-04-27 Sharp Corp Device and method for guiding route, and storage medium storing route guide program
JP2003094367A (en) * 2001-09-21 2003-04-03 Ricoh Co Ltd Robot hand with tip visual sense

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001118180A (en) * 1999-10-15 2001-04-27 Sharp Corp Device and method for guiding route, and storage medium storing route guide program
JP2003094367A (en) * 2001-09-21 2003-04-03 Ricoh Co Ltd Robot hand with tip visual sense

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
久保田壮一、植松利晃、山崎匠、近藤裕治、時実象一、尾身朝子: "JSTリンクセンターを利用した電子ジャーナルのリンクの現状", 情報管理, vol. 第48巻、第3号, CSNG200501317001, 1 June 2005 (2005-06-01), JP, pages 149 - 155, ISSN: 0000799814 *
佐藤恵子: "JSTリンクセンター", 情報の科学と技術, vol. 第53巻,第4号, CSNG200500678004, 1 April 2003 (2003-04-01), JP, pages 211 - 215, ISSN: 0000880853 *
安達淳: "メタデータを中心に構成した文書画像の電子図書館システム", 電子情報通信学会論文誌, vol. 第J84-D-I巻、第6号, CSNG200301488023, 1 June 2001 (2001-06-01), JP, pages 768 - 776, ISSN: 0000799812 *
早川公泉、高須淳宏、安達淳: "OCR認識誤りを含む処理情報の確率的パターン解析手法", 第55回(平成9年後期)全国大会講演論文集(4), vol. 第55回会議, CSNJ199700021001, 26 September 1997 (1997-09-26), JP, pages 4 - 392, ISSN: 0000799813 *
白木澤佳子、外1名: "JSTリンクセンター−電子ジャーナルの効率的なリンクの実現−", 情報管理, vol. 第45巻,第7号, CSNG200500606005, 1 October 2002 (2002-10-01), JP, pages 502 - 505, ISSN: 0000880852 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009064091A (en) * 2007-09-04 2009-03-26 Komiyama Insatsu Kogyo Kk Electronic journal editing system and original editing method
US9239884B2 (en) 2008-05-22 2016-01-19 Alcatel Lucent Electronic document processing with automatic generation of links to cited references
JP2012501490A (en) * 2008-08-28 2012-01-19 コピーライト クリアランス センター インコーポレイテッド Method and apparatus for generating a standard document identifier from a content reference

Similar Documents

Publication Publication Date Title
US20140330790A1 (en) Method and system for archiving and retrieving bibliography information and reference material
JP2009301335A (en) Image processing device, image processing method and computer program
JP2006244071A (en) Method of providing information, portal site system and program
JP2005182353A (en) Electronic mail retrieving system, electronic mail retrieving device and electronic mail retrieval control program
JP2006301987A (en) System for automatically acquiring/browsing information
JP5098605B2 (en) Annotation program, annotation device
JP2007183833A (en) Information processing system
JP2009064091A (en) Electronic journal editing system and original editing method
JP2010165218A (en) Device, method and program for controlling display of electronic mail
JP2007041983A (en) Application form creation program and application form creation apparatus
JP2005346671A (en) Information processing device and document processing method
US6993525B1 (en) Document-database access device
KR20000049891A (en) System and method for electronic publishing with structured data
JP2007034986A (en) Patent information management system, patent information management method, program and recording medium
JP2010009334A (en) Information processor, information processing method, and information processing program
JP4752020B2 (en) Character string acquisition method and character string acquisition system
JP3862553B2 (en) Document management system
JP2003115879A (en) Server, control method therefor and control system using the same
JP2005208901A (en) Information retrieval system, and program
JP2003228535A (en) File transfer method, file transfer device and computer program
JP2014228903A (en) Information processing server, information storage server, information processing program, information storage program and information storage method
JP2005339376A (en) Method and device for web information conversion
KR100587825B1 (en) System and method for providing picture
JP2006031543A (en) Information provision device, information provision method, information provision program and storage medium
JP4811451B2 (en) Database system and data generation method

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070802