KR101243058B1 - Xml thesis constructing system and method - Google Patents

Xml thesis constructing system and method Download PDF

Info

Publication number
KR101243058B1
KR101243058B1 KR1020120118885A KR20120118885A KR101243058B1 KR 101243058 B1 KR101243058 B1 KR 101243058B1 KR 1020120118885 A KR1020120118885 A KR 1020120118885A KR 20120118885 A KR20120118885 A KR 20120118885A KR 101243058 B1 KR101243058 B1 KR 101243058B1
Authority
KR
South Korea
Prior art keywords
text
information
item
unit
xml
Prior art date
Application number
KR1020120118885A
Other languages
Korean (ko)
Inventor
김규환
김병규
최선희
서태설
이혜진
최호남
최희윤
류범종
박재원
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Priority to KR1020120118885A priority Critical patent/KR101243058B1/en
Application granted granted Critical
Publication of KR101243058B1 publication Critical patent/KR101243058B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates

Abstract

PURPOSE: A full text XML treatise construction system and method are provided to automatically convert various treatise files into a full text XML treatise suitable for a style of a treatise defined in data type definition(DTD) of a PubMed central(PMC). CONSTITUTION: A screen input unit(100) inputs text information for a treatise for research performance in a PDF document by a paragraph unit through a text input part on a web input page. An item setting unit(110) controls the text input part by mapping the text information with an item defined in DTD of a PMC. When the item is selected, an automatic change unit(120) changes a stored type of text data in the text input part corresponding to the selected item. [Reference numerals] (100) Screen input unit; (110) Item setting unit; (120) Data attribute automatic change unit; (130) XML thesis generating unit; (AA) Database storage; (BB) Outputting a web screen; (CC) Setting a text field item; (DD) Storing data; (EE) Generating Full-Text XML; (FF) Mapping PMC DTD

Description

풀 텍스트 엑스엠엘 논문 구축 시스템 및 방법{XML thesis constructing system and method}Full text xml thesis constructing system and method

본 발명은 전자저널 출판을 위한 PMC(PubMed Central) DTD(Data Type Definition) 기반의 풀 텍스트(Full Text) XML(eXtensible Markup Language) 논문을 구축하는 시스템 및 방법에 관한 것이다.
The present invention relates to a system and method for constructing a full text (eXtensible Markup Language) XML paper based on a PubMed Central (PMC) Data Type Definition (DTD) for electronic journal publication.

현재 일반적으로 사용되고 있는 컴퓨터는 수치 데이터 취급에 있어서는 빠르고 효율적이지만 텍스트 데이터를 조작하는 데 있어서는 비효율적이다. 따라서, 식별되지 않은 텍스트 문서의 단어들과 같은 소정의 텍스트 열 또는 부분을 검출할 수는 있어도, 단어들이 특정한 의미를 갖는 곳에 정보의 특정한 부분을 위치시키기란 쉽지 않다. 예컨대, 인간은 문장 중에서 단어를 식별하는 데에 어려움이 없지만, 컴퓨터는 일반적으로 그렇지 않다.Computers in common use today are fast and efficient in handling numerical data, but inefficient in manipulating text data. Thus, although it is possible to detect certain text strings or parts, such as words in an unidentified text document, it is not easy to locate a particular piece of information where the words have a particular meaning. For example, humans have no difficulty identifying words in sentences, but computers generally do not.

그에 따라, 컴퓨터가 적절한 도큐먼트 코딩에 의해 텍스트 문서를 번역하는 것을 돕기 위한 기법이 개발되었다. 이러한 여러 기법들은 컴퓨터가 신뢰할 수 있게 정보를 인식할 수 있도록 하는 방식으로 상이한 문서의 부분들을 식별하는 문서정보, 소위 '마크업 태그(markup tags)'를 추가함으로써 텍스트 문서의 선택된 부분들을 식별한다.Accordingly, techniques have been developed to help computers translate text documents by proper document coding. These various techniques identify selected portions of a text document by adding document information, so-called 'markup tags', to identify portions of different documents in a manner that allows the computer to reliably recognize the information.

이러한 언어들 중 하나는 소위 SGML(일반화된 표준 마크업 언어: Standard Generalized Markup Language)이며 정보 표현을 위해 국제적으로 승인되어 있다. 이러한 언어 표준은 1970년 초에 수행되었던 일반적 코딩 및 마크업 언어의 개발 작업에서 이루어지게 되었다. 다양한 연구라인들이 국제 표준 기구의 소위원회, 소위 텍스트 기술 및 처리 언어에 대한 소위원회로 병합되었다. 이러한 소위원회는 1986년에 SGML 표준을 제정하였다.One of these languages is the so-called Standard Generalized Markup Language (SGML) and is internationally approved for the presentation of information. This language standard came from the work of developing a general coding and markup language that was carried out in the early 1970s. Various research lines were merged into subcommittees of the International Standards Organization, the so-called text description and processing language. This subcommittee enacted the SGML Standard in 1986.

SGML 그 자체는 마크업 태그를 정의하지도 문서의 특정한 형태에 대한 마크업 탬플릿(template)을 제공하지도 않는다는 면에서 마크업 언어가 아니다. 대신에, SGML은 일반화 된 디스크립션 마크업 기법들을 기술하고 개발하는 방법을 나타내고 있다. 이러한 기법들은 마크업이 특정한 어플리케이션을 지향하지 않기 때문에 범용적이며, 어떻게 표시되어야 하는지 대신에 텍스트가 나타내는 것을 마크업이 기술하기 때문에 기술적이다. SGML은 사용자가 도큐먼트들을 위한 그 자신의 포맷들을 정의하고, 크고 복잡한 도큐먼트들을 취급하며 대규모 정보 저장소를 관리하도록 한다는 면에서 매우 유연하다.SGML itself is not a markup language in that it neither defines markup tags nor provides markup templates for specific types of documents. Instead, SGML shows how to describe and develop generalized description markup techniques. These techniques are generic because markup is not directed to a particular application and is technical because markup describes what the text represents instead of how it should be displayed. SGML is very flexible in that it allows users to define their own formats for documents, handle large and complex documents, and manage large information repositories.

최근에, SGML은 웹 기반 어플리케이션을 위해 요구되지 않는 많은 선택적인 특징들을 포함하며 웹 브라우저의 현재의 벤더들에 매력적이지 않은 비용/이익 비율을 갖고 있음이 입증되었다. 따라서, SGML은 일반적으로 사용되지 않고 있으며 대신에 웹 상의 대부분의 문서들은 마크업 언어, 소위 하이퍼 텍스트 마크업 언어 또는 HTML로 저장 및 전송된다.Recently, SGML has proven to have many optional features that are not required for web-based applications and have a cost / benefit ratio that is not attractive to current vendors of web browsers. Thus, SGML is not commonly used and instead most documents on the web are stored and transmitted in markup language, so-called hypertext markup language or HTML.

HTML은 SGML기반의 간단한 마크업 언어이며 하이퍼텍스트, 멀티미디어 및 웹 상에서 공통적으로 전송되는 작고 상당히 간단한 문서들의 표시에 적합하다. 이는 작고 고정된 세트의 마크업 태그들을 사용하여 문서의 각 부분을 기술한다. 소수의 고정된 태그들은 문서의 구성을 간소화하며 어플리케이션 구축을 훨씬 용이하게 한다.HTML is a simple markup language based on SGML and is suitable for displaying small and fairly simple documents that are commonly transmitted over hypertext, multimedia, and the Web. It describes each part of the document using a small, fixed set of markup tags. A few fixed tags simplify the organization of the document and make the application much easier to build.

그러나, 태그들이 고정되어 있으므로 HTML은 확장 가능하지 않으며 매우 제한된 구조 및 유효 능력을 가지고 있다. 전자 웹 문서들이 보다 커지고 복잡해짐에 따라 HTML은 대규모의 상업적인 간행을 위해 요구되는 능력을 가지고 있지 않음이 점차 명백해지게 되었다.However, because the tags are fixed, HTML is not extensible and has very limited structure and validity. As electronic web documents become larger and more complex, it becomes increasingly clear that HTML does not have the capabilities required for large commercial publications.

이러한 대규모의 상업적인 간행 요구에 부응하고 배포된 문서 처리의 새로운 기술을 가능하게 하기 위해, 산업 단체 소위 월드 와이드 웹 컨소시엄은 HTML에 의해 제공되는 것 이상의 능력을 필요로 하는 어플리케이션들을 위한 다른 마크업 언어, 소위 확장 마크업 언어(XML:eXtensible Markup Language)를 개발하였다.In order to meet these large commercial publishing needs and enable new technologies for distributed document processing, industry so-called World Wide Web Consortiums have created other markup languages for applications that require more capabilities than those provided by HTML, The so-called extensible markup language (XML) has been developed.

HTML과 같이 XML은 웹 어플리케이션들을 위해 특별히 설계된 SGML의 간소화된 서브셋이며 전체 SGML보다 습득, 사용 및 구현이 용이하다. HTML과 달리 XML은 확장성, 구조 및 유효성인 SGML의 장점들을 유지하였지만 XML은 문서의 일정한 컴포넌트들에 대한 억세스가 인터넷을 통해 현재 가능하지 않을 때 디폴트가 유효한 것을 보장하도록 SGML구성의 사용을 제한한다.Like HTML, XML is a simplified subset of SGML designed specifically for Web applications and is easier to learn, use, and implement than full SGML. Unlike HTML, XML retains the advantages of SGML, which is extensibility, structure, and validity, but XML restricts the use of SGML constructs to ensure that defaults are valid when access to certain components of a document is not currently available over the Internet. .

또한, XML은 인터넷 유니폼 리소스 로케이터(Uniform Resource Locators)가 어떻게 XML 문서들의 컴포넌트 부분들을 식별하는 데 사용될 수 있는지를 정의하고 있다. In addition, XML defines how Internet Uniform Resource Locators can be used to identify component parts of XML documents.

XML 문서는 일련의 실체(entities) 또는 객체(object)로 구성된다. 각각의 실체는 하나 이상의 논리적인 엘리먼트를 포함할 수 있으며 각각의 엘리먼트는 그것이 처리되는 방식을 기술한 임의의 속성 또는 특성을 가질 수 있다. XML은 XML 문서를 구성하는 실체들, 엘리먼트들 및 속성들 사이의 관계를 기술하기 위해 형식적인 구문(syntax)을 제공한다. 이러한 구문은 컴퓨터에게 각각의 문서의 컴포넌트 부분들을 어떻게 인식할지를 제공한다.An XML document consists of a series of entities or objects. Each entity may include one or more logical elements and each element may have any attribute or characteristic that describes how it is handled. XML provides a formal syntax to describe the relationships between the entities, elements, and attributes that make up an XML document. This syntax gives the computer how to recognize the component parts of each document.

XML은 문서 컴포넌트들을 식별하는 쌍으로 된 마크업 태그들을 사용한다. 특히, 각각의 논리적인 엘리먼트의 시작 및 말단이 엘리먼트 이전의 시작 태그 및 엘리먼트 후의 말단 태그의 입력에 의해 명확히 식별된다. 예컨대, 태그 <to> 및 </to>는 "document text.......<to>Recipient</to>.....document text"와 같은 방식으로 문서의 'recipient' 엘리먼트를 식별하는 데 사용될 수 있다. 마크업 태그들의 형태 및 구성은 사용자에 의해 정의될 수 있지만, 종종 사용자들 간의 상호 이용성을 제공하기 위해 무역협회 또는 유사 단체에 의해 정의된다. 소정의 세트의 태그들로 동작하기 위해, 사용자들은 마크업 태그들이 통상적인 텍스트 및 다양한 엘리먼트들 간의 관계로부터 어떻게 범위가 결정되는지를 알 필요가 있다. 예컨대, XML 시스템에서, 엘리먼트들 및 그 속성들은 꺽쇠 괄호(<...>)의 일치된 쌍들 사이에 입력되며 실체 레퍼런스들은 앰퍼샌드로 시작하여 세미콜론(amp;...;)으로 끝난다. XML 태그 세트들은 문서의 논리적인 구조에 기반하기 때문에 이들을 판독하고 이해하기란 어렵지 않다. XML 태그 세트들은 상이한 부분들 또는 컴포넌트들을 가지므로 모든 문서들의 모든 엘리먼트들에 대해 소정의 태그들이 실용적이지는 않다. 대신에, 문서들은 일정한 엘리먼트들을 갖는 '타입(types)'으로 분류될 수 있다.XML uses paired markup tags to identify document components. In particular, the beginning and end of each logical element is clearly identified by the input of the start tag before the element and the end tag after the element. For example, the tags <to> and </ to> identify the 'recipient' element of a document in the same way as "document text ....... <to> Recipient </ to> ..... document text". Can be used to The form and configuration of markup tags may be defined by the user, but is often defined by a trade association or similar entity to provide for interoperability between users. To operate with a certain set of tags, users need to know how markup tags are scoped from the normal text and the relationship between the various elements. For example, in an XML system, elements and their attributes are entered between matched pairs of angle brackets (<...>) and entity references begin with an ampersand and end with a semicolon (amp; ...;). Because XML tag sets are based on the logical structure of a document, it is not difficult to read and understand them. Since XML tag sets have different parts or components, certain tags are not practical for all elements of all documents. Instead, documents can be classified as 'types' with certain elements.

도큐먼트 타입 정의(Document Type Definition; DTD)는 어느 엘리먼트가 도큐먼트 타입으로 예상되는지를 나타내며 문서에서 발견된 각각의 엘리먼트가 허용되는지, 허용되고 요구되는지, 또는 허용되지만 요구되지 않는지를 나타낸다. 결국, DTD내의 각각의 문서 엘리먼트의 역할을 정의함으로써 각각의 엘리먼트가 문서 내의 유효 위치에서 발생하는지를 검사하는 것이 가능하다. 예를 들어, XML DTD는 제2 레벨 표제(heading)의 존재 없이 제3 레벨 표제가 입력되지 않도록 검사가 이루어지게 한다. 이러한 계층적인 검사가 HTML로는 이루어질 수 없다. 문서에 대한 DTD는 전형적으로 문서 헤더(header)에 삽입되며 각각의 엘리먼트는 <!ELEMENT>와 같은 식별자로 마킹된다.The Document Type Definition (DTD) indicates which element is expected to be a document type and indicates whether each element found in the document is allowed, allowed and required, or allowed but not required. Finally, by defining the role of each document element in the DTD, it is possible to check whether each element occurs at a valid location in the document. For example, the XML DTD allows a check to be made so that third level headings are not entered without the presence of second level headings. This hierarchical check cannot be done in HTML. The DTD for a document is typically inserted in the document header and each element is marked with an identifier such as <! ELEMENT>.

만일, DTD가 문서에 대해 이용 가능하지 않다면 DTD의 전부 또는 일부가 인터넷을 통해 액세스 가능하지 않거나 문서 저자가 DTD를 생성하는 데 실패했기 때문이므로 XML 시스템이 문서 내에서 선언되지 않은 엘리먼트들에 대해 디폴트(default) 정의를 할당할 수 있다. XML은 서신, 보고서, 메모, 데이터베이스 또는 사전과 같은 임의의 논리적인 텍스트 구조를 기술하기에 충분히 유연한 코딩 기법을 제공한다.If the DTD is not available for the document, then the XML system defaults to elements that are not declared in the document because all or part of the DTD is not accessible over the Internet or the document author failed to generate the DTD. (default) Can assign a definition. XML provides coding techniques that are flexible enough to describe any logical text structure such as letters, reports, notes, databases, or dictionaries.

한편, 학술커뮤니케이션 전 과정을 둘러싼 비즈니스 모델과 연구행태가 디지털 기반의 오픈정보 서비스 방향으로 변화하고 있다. 최근 학술정보 연구자들은 메타데이터 기반보다 풀 텍스트 기반의 활용 가능한 학술정보를 원하고 있으며, 세계 수준의 오픈 액세스 저널이 되기 위해서 해외 유수 DB업체·출판사는 풀 텍스트 XML 논문 구축을 지향하고 있고 이는 필수적인 기반이 되고 있다. 실제로 대형 출판사 springer의 경우 기존 PDF 파일을 XML 파일로 만들기 위해 5,000명이 투입되고 있는 실정이다. 이처럼 연구자들이 원문까지 원스톱으로 원하는 정보를 획득할 수 있도록 저널의 논문을 대상으로 풀 텍스트 기반의 데이터베이스를 구축하여 수요자 중심의 학술정보 서비스의 기반을 구축하는 것이 필요하다.
On the other hand, business models and research behaviors surrounding the entire academic communication process are shifting toward the digital-based open information service. Recently, academic information researchers want to use full-text based academic information rather than metadata-based, and in order to become a world-class open access journal, leading DB companies and publishers are seeking to build full-text XML papers. It is becoming. Indeed, in the case of springer, a large publishing company, 5,000 people are used to make existing PDF files into XML files. As such, it is necessary to establish a foundation of consumer-oriented academic information service by constructing a full text-based database for journal articles so that researchers can obtain the desired information in one stop.

대한민국 등록특허공보 제10-0319756호(등록일:2001. 12. 21)Republic of Korea Patent Publication No. 10-0319756 (Registration Date: Dec. 21, 2001) 대한민국 공개특허공보 제10-2008-0019960호(공개일: 2008. 03. 05)Republic of Korea Patent Publication No. 10-2008-0019960 (published: 2008. 03. 05)

전술한 문제점을 해결하기 위한 본 발명은, 학술지 논문 파일에서 텍스트 정보를 입력도구에 복사 및 붙이기(Copy & Paste) 방식으로 입력하고, 논문의 형태에 따라 서지 정보, 본문 정보, 참고문헌 정보로 구분하여, 본문 정보의 유연한 구축을 위해 문단의 성격을 나타내는 항목을 선택하여 정의함으로써, 각 항목의 영역을 시스템에서 인지할 수 있도록 하며, 텍스트 입력박스에서 항목을 선택하여 각각의 문단 정보, 표, 그림 정보 등을 구성할 수 있도록 함으로써 PMC에서 정의하고 있는 DTD 기반의 XML 데이터를 일괄적으로 생성할 수 있도록 하는 Full-Text XML 논문 구축 시스템 및 방법을 제공함에 그 목적이 있다.
The present invention for solving the above problems, the text information in the journal article file by inputting a copy and paste (Copy & Paste) method to the input tool, and divided into bibliographic information, text information, bibliographic information according to the form of the paper By selecting and defining the items representing the characteristics of paragraphs for flexible construction of body information, the area of each item can be recognized by the system, and each paragraph information, table, figure is selected by selecting items from the text input box. The purpose of this paper is to provide a full-text XML paper construction system and method that can generate information such as information, which can generate batches of DTD-based XML data defined by PMC.

전술한 목적을 달성하기 위한 본 발명의 일 측면에 따르면, PDF 문서 내에 존재하는 학술 연구 성과의 논문에 관한 텍스트 정보를 구조화되게 입력 할 수 있는 웹 입력 페이지 상의 텍스트 입력칸을 통해 문단 단위로 입력하기 위한 화면 입력부; 상기 텍스트 정보에 대해 PMC(PubMed Central) DTD(Data Type Definition)에서 정의하고 있는 항목과 매핑하여 의미를 부여하고, 논문 순서에 맞게 구성하기 위해 상기 텍스트 입력칸을 제어하는 항목 설정부; 상기 PMC DTD에서 정의하고 있는 항목 중 하나가 선택되면, 상기 텍스트 입력칸의 텍스트 데이터가 저장되는 형태를 상기 선택된 항목에 따라 자동 변경하고, 특정 테이블에 저장되는 데이터의 속성을 자동으로 변경하여 상기 텍스트 데이터를 저장하는 데이터속성 자동변경부; 및 상기 저장된 텍스트 데이터에 대해 PMC(PubMed Central)에서 제공하고 있는 DTD(Data Type Definition)에 따라 XML 데이터를 생성 및 출력하는 XML 논문 생성부를 포함하는 풀 텍스트 엑스엠엘 논문 구축 시스템이 제공된다.According to an aspect of the present invention for achieving the above object, for entering the text information about the article of the academic research existing in the PDF document in paragraph units through the text input box on the web input page that can be structured input A screen input unit; An item setting unit which gives meaning to the text information by mapping it with an item defined in a PubMed Central (PMC) Data Type Definition (DTD) and controls the text input box to be configured according to a paper order; When one of the items defined in the PMC DTD is selected, the form in which the text data of the text input box is stored is automatically changed according to the selected item, and the attribute of the data stored in a specific table is automatically changed to the text data. Data property automatic change unit for storing the; And an XML paper generation unit for generating and outputting XML data according to a DTD (Data Type Definition) provided by a PMC (PubMed Central) with respect to the stored text data.

또한, 상기 화면 입력부는, 상기 PDF 문서로부터 문단 단위로 사용자에 의한 복사(Copy) 및 붙이기(Paste)로 입력받은 텍스트 정보를 상기 웹 입력 페이지 상의 텍스트 입력칸에 단락별로 구분하여 화면 상에 구성할 수 있다.In addition, the screen input unit may be configured on the screen by dividing the text information received by the user (Copy) and Paste (Paste) in paragraph units from the PDF document by paragraphs in the text input box on the web input page have.

또한, 상기 화면 입력부는, 상기 학술연구 결과의 논문에 관한 텍스트 정보를 웹 입력 페이지 제공을 통해, 논문의 기본정보인 학회정보, 저널정보, 발행년도, 권호, 논문 시작페이지, 논문제목, 저자명, 저자소속, 이메일, 초록, 키워드 정보를 입력 할 수 있는 서지영역, 본문의 문단 제목, 문단, 표 번호 및 표 제목, 그림 번호 및 그림 제목, 수식이미지 정보, 표, 그림, 참고문헌 링크 정보 및 주석정보를 입력 할 수 있는 본문영역, 참고문헌의 자료타입(저널, 학술대회, 보고서 등)에 따라 입력항목을 달리하여, 입력창을 추가로 제공하는 참고문헌 영역을 하나의 화면에 제공함으로써, 사용자의 작업 편의성을 확보하여 논문 전체 정보를 구축 할 수 있도록 한다.In addition, the screen input unit, through the web input page provides the text information about the article of the academic research results, academic information, journal information, year of publication, issue number, thesis start page, thesis title, author name, Bibliographic area for authorship, e-mail, abstract, keyword information, paragraph title of body, paragraph, table number and table title, picture number and picture title, formula image information, table, picture, bibliography link information and comments By providing the reference area that provides additional input window by changing the input items according to the text area where information can be input and the data type of the reference (journal, conference, report, etc.), the user It is possible to build the entire information of the thesis by securing the convenience of work.

또한, 상기 항목 설정부는, 상기 웹 입력 페이지 상의 텍스트 입력칸에 대해 3 개의 항목으로 정의하고, 항목 선택에 따라 각 항목이 가지고 있는 하위 항목 선택 기능의 제공과 표 및 그림 정보의 구축을 위한 추가 입력 창을 제공할 수 있다.In addition, the item setting unit defines three items for the text input box on the web input page, and additional input window for providing a lower item selection function of each item according to the item selection and for constructing table and picture information. Can be provided.

또한, 상기 항목 설정부는, 상기 텍스트 정보의 단락별 문단에 대해 PMC DTD에서 정의하고 있는 서지정보, 본문정보, 참고문헌 정보 및 각 항목의 하위 요소들과 자동 매핑되도록 항목을 선택함에 따라 상기 텍스트 정보에 의미를 부여하고, 상기 논문 순서에 맞게 구성하기 위해 상기 텍스트 입력칸의 업(Up) 또는 다운(Down) 제어하여, 한 개 또는 다수의 텍스트 입력칸을 선택하여 삭제 또는 추가할 수 있다.In addition, the item setting unit selects an item to be automatically mapped to bibliographic information, body information, bibliographic information, and sub-elements of each item defined in the PMC DTD for each paragraph of the text information. In order to give meaning to the text and to configure the paper order, the text input box may be controlled up or down, and one or more text input fields may be selected and deleted or added.

또한, 상기 항목 설정부는, 상기 논문에 관한 텍스트 정보를 서지영역, 본문영역, 참고문헌 영역으로 항목을 설정하고, 항목 설정 시 텍스트 입력칸의 박스 앞에 항목 설정 기능을 배치하여, 텍스트 입력칸의 기능을 서지, 본문, 참고문헌의 선택에 따라 하위 항목을 선택 할 수 있도록 자동으로 제공하여 선택 항목에 따라 텍스트 박스의 기능을 변경 및 표, 그림 정보 선택 시, 표, 그림의 번호, 제목, 주석 정보를 추가 입력 할 수 있도록 추가 입력 창을 제공 해 줄 수 있다.In addition, the item setting unit may set the text information of the article into a bibliographic area, a text area, and a bibliography area, and arrange an item setting function in front of a box of a text input box when setting the item, thereby providing a function of the text input box. Provides automatic selection of sub-items based on the selection of text, text, and bibliography. Changes the function of the text box according to the selection and adds table, figure number, title, and annotation information when selecting table and figure information. It can provide additional input window for input.

또한, 상기 데이터속성 자동변경부는, 상기 항목 설정부에서 항목 설정 시 텍스트 입력칸이 가지고 있는 기능을 자동 변경함으로써, 저장되는 데이터 테이블을 자동으로 변경하고, 데이터의 저장항목을 재 구성 할 수 있도록 하는 데이터 속성 자동 변경 기능을 포함한다.In addition, the data attribute automatic change unit automatically changes the function of the text input box when setting an item in the item setting unit, thereby automatically changing the data table to be stored and reconfiguring the data storage item. Includes automatic property change.

또한, 상기 데이터속성 자동변경부는, 상기 논문에 관한 텍스트 정보에 대해 사용자로부터 서지, 본문, 참고문헌 항목의 변경 및 각 3 개의 영역에 대한 세부 항목 정보를 입력받아, PMC DTD 형태에 따라 데이터 저장소에 상기 텍스트 정보를 저장할 수 있다.In addition, the data attribute automatic change unit receives a bibliography, a text, a bibliography item, and detailed item information for each of three areas with respect to the text information of the article, and inputs the information to the data store according to the PMC DTD form. The text information may be stored.

또한, 상기 XML 논문 생성부는, 상기 논문에 관한 텍스트 정보를 학회단위, 저널단위, 권호단위, 논문단위로 PMC DTD 기반 풀 텍스트 XML로 일괄 생성할 수 있다.The XML article generation unit may collectively generate text information about the article in PMC DTD-based full-text XML in an academic unit, journal unit, issue unit, and article unit.

그리고, 상기 XML 논문 생성부는, 상기 데이터 저장소에 저장된 텍스트 정보에 대해 PMC에서 제공하고 있는 DTD 기준에 따라 저널 단위, 권호 단위, 기사 단위로 선택하여 수십 개의 논문을 일괄 생성하거나 또는 논문 단위의 풀 텍스트 XML로 자동 생성해 줄 수 있다.
The XML article generation unit may collectively generate dozens of papers or select the text information stored in the data repository by journal unit, issue unit, or article unit according to the DTD criteria provided by the PMC, or full text of the article unit. It can be generated automatically in XML.

한편, 전술한 목적을 달성하기 위한 본 발명의 다른 측면에 따르면, (a) PDF 문서 내에 존재하는 학술 연구 성과의 논문에 관한 텍스트 정보를 구조화되게 입력 할 수 있는 웹 입력 페이지 상의 텍스트 입력칸을 통해 문단 단위로 입력받는 단계; (b) 상기 텍스트 정보에 대해 PMC(PubMed Central) DTD(Data Type Definition)에서 정의하고 있는 항목과 매핑하여 상기 텍스트 입력칸에 항목을 정의하고, 논문 순서에 맞게 구성하기 위한 상기 텍스트 입력칸을 제어하는 단계; (c) 상기 PMC DTD에서 정의하고 있는 항목 중 하나가 선택되면, 상기 텍스트 입력칸의 텍스트 데이터가 저장되는 형태를 상기 선택된 항목에 따라 자동 변경하고, 특정 테이블에 저장되는 데이터의 속성을 자동으로 변경하여 상기 텍스트 데이터를 저장하는 단계; 및 (d) 상기 저장된 텍스트 데이터에 대해 PMC(PubMed Central)에서 제공하고 있는 DTD(Data Type Definition)에 따라 XML 데이터를 생성 및 출력하는 단계를 포함하는 풀 텍스트 엑스엠엘 논문 구축 방법이 제공된다.On the other hand, according to another aspect of the present invention for achieving the above object, (a) the paragraph through a text input box on the web input page that can be a structured input of the text information about the article of the academic research results present in the PDF document Receiving an input in units; (b) defining an item in the text input box by mapping the text information to an item defined in a PubMed Central (PMC) Data Type Definition (DTD) and controlling the text input box to be configured according to a paper order. ; (c) If one of the items defined in the PMC DTD is selected, the form in which the text data of the text input box is stored is automatically changed according to the selected item, and the attribute of the data stored in a specific table is automatically changed. Storing the text data; And (d) generating and outputting XML data according to a DTD (Data Type Definition) provided by a PubMed Central (PMC) with respect to the stored text data.

또한, 상기 (a) 단계는, 상기 PDF 문서로부터 문단 단위로 사용자에 의한 복사(Copy) 및 붙이기(Paste)로 입력받은 텍스트 정보를 상기 웹 입력 페이지 상의 텍스트 입력칸에 단락별로 구분하여 화면 상에 구성할 수 있다.In addition, the step (a) is configured on the screen by dividing the text information received by the user by copy and paste in paragraph units from the PDF document by paragraphs in the text input box on the web input page. can do.

또한, 상기 (a) 단계는, 상기 학술연구 결과의 논문에 관한 텍스트 정보를 웹 입력 페이지 제공을 통해, 논문의 기본정보인 학회정보, 저널정보, 발행년도, 권호, 논문 시작페이지, 논문제목, 저자명, 저자소속, 이메일, 초록, 키워드 정보를 입력 할 수 있는 서지영역, 본문의 문단 제목, 문단, 표 번호 및 표 제목, 그림 번호 및 그림 제목, 수식이미지 정보, 표, 그림, 참고문헌 링크 정보 및 주석정보를 입력 할 수 있는 본문영역, 참고문헌의 자료타입(저널, 학술대회, 보고서 등)에 따라 입력항목을 달리하여, 입력창을 추가로 제공하는 참고문헌 영역을 하나의 화면에 제공함으로써, 사용자의 작업 편의성을 확보하여 논문 전체 정보를 구축 할 수 있다.In addition, the step (a), through the web input page provides the text information about the article of the academic research results, academic information, journal information, publication year, issue number, thesis start page, thesis title, Bibliography for inputting author name, author's name, email, abstract, keyword information, paragraph title of body, paragraph, table number and table title, picture number and picture title, formula image information, table, picture, bibliography link information By providing a reference area that provides additional input window by changing the input items according to the text area where annotation information can be input and the reference data type (journal, conference, report, etc.) In addition, it is possible to build the entire information of the thesis by securing the user's convenience.

또한, 상기 (a) 단계는, 상기 텍스트 정보에 관한 학회정보, 저널정보, 발행년도, 권호 및 논문 정보에 대해, 사용자가 Full-Text XML 데이터로 가공 할 수 있도록 학회, 저널, 발행년도, 권호의 개념을 유지하고, 상기 Full-Text XML 데이터를 생성 할 수 있도록 해당 권호의 리스트 페이지에서 웹 입력 페이지를 호출하는 과정을 통해 상기 웹 입력 페이지에 논문에 관한 텍스트 정보를 입력받을 수 있다.In addition, the step (a), the society information, journal information, publication year, issue number, article and article information about the society, journal, year of publication, issue so that the user can process into full-text XML data Maintaining the concept of, and through the process of calling the web input page from the list page of the issue number to generate the full-text XML data can receive the text information about the article on the web input page.

또한, 상기 (b) 단계는, 상기 웹 입력 페이지 상의 텍스트 입력칸에 대해 3 개의 항목으로 정의하고, 항목 선택에 따라 각 항목이 가지고 있는 하위 항목 선택 기능의 제공과 표 및 그림 정보의 구축을 위한 추가 입력 창을 제공할 수 있다.In addition, the step (b) is defined as three items for the text input box on the web input page, according to the item selection to provide a sub-item selection function of each item and addition for the construction of table and figure information You can provide an input window.

또한, 상기 (b) 단계는, 상기 텍스트 정보의 단락별 문단에 대해 PMC DTD에서 정의하고 있는 서지정보, 본문정보, 참고문헌 정보 및 각 항목의 하위 요소들과 자동 매핑되도록 항목을 선택함에 따라 상기 텍스트 정보에 의미를 부여하고, 상기 논문 순서에 맞게 구성하기 위해 상기 텍스트 입력칸의 업(Up) 또는 다운(Down) 제어하여, 한 개 또는 다수의 텍스트 입력칸을 선택하여 삭제 또는 추가할 수 있다.In addition, in the step (b), the paragraphs of the text information may be automatically mapped to bibliographic information, body information, bibliographic information, and sub-elements of each item defined in the PMC DTD. In order to give meaning to text information and to configure the paper order, the text input box may be controlled up or down, and one or more text input boxes may be selected or deleted.

또한, 상기 (b) 단계는, 상기 논문에 관한 텍스트 정보를 서지영역, 본문영역, 참고문헌 영역으로 항목을 설정하고, 항목 설정 시 텍스트 입력칸의 박스 앞에 항목 설정 기능을 배치하여, 텍스트 입력칸의 기능을 서지, 본문, 참고문헌의 선택에 따라 하위 항목을 선택 할 수 있도록 자동으로 제공하여 선택 항목에 따라 텍스트 박스의 기능을 변경 및 표, 그림 정보 선택 시, 표, 그림의 번호, 제목, 주석 정보를 추가 입력 할 수 있도록 추가 입력 창을 제공 해 줄 수 있다.In addition, in the step (b), the text information regarding the article is set as a bibliographic area, a text area, and a bibliography area, and the item setting function is placed in front of the box of the text input box when the item is set. It automatically provides the sub-items according to the selection of bibliography, text, and bibliography to change the function of the text box according to the selection, and when selecting the table and picture information, the number of table, picture, title, and annotation information. You can provide additional input window for additional input.

또한, 상기 (c) 단계는, 상기 항목 설정 시 텍스트 입력칸이 가지고 있는 기능을 자동 변경함으로써, 저장되는 데이터 테이블을 자동으로 변경하고, 데이터의 저장항목을 재 구성 할 수 있도록 하는 데이터 속성 자동 변경 기능을 제공할 수 있다.In addition, the step (c), by automatically changing the function of the text input box when setting the item, to automatically change the data table to be stored, the data attribute automatic change function to reconstruct the storage items of the data Can be provided.

또한, 상기 (c) 단계는, 상기 논문에 관한 텍스트 정보에 대해 서지, 본문, 참고문헌 항목의 변경 및 각 3 개의 영역에 대한 세부 항목 정보에 대해 구성 또는 항목의 변경 시, 자동으로 텍스트 데이터가 저장되는 저장 테이블 및 항목을 변경하여 저장할 수 있다.In addition, in step (c), the text data is automatically generated when the bibliography, the text, the bibliography item is changed, and the detailed item information of each of the three areas is configured or the item is changed. You can change the storage table and items to be saved.

또한, 상기 (d) 단계는, 상기 논문에 관한 텍스트 정보를 학회단위, 저널단위, 권호단위, 논문단위로 PMC DTD 기반 풀 텍스트 XML로 일괄 생성할 수 있다.In addition, in the step (d), the text information about the article may be collectively generated in full unit text based on PMC DTD in an academic unit, journal unit, issue unit, and article unit.

또한, 상기 (d) 단계는, 상기 텍스트 정보에 대해 PMC에서 제공하고 있는 DTD 기준에 따라 저널 단위, 권호 단위, 기사 단위로 선택하여 수십 개의 논문을 일괄 생성하거나 또는 논문 단위의 풀 텍스트 XML로 자동 생성해 줄 수 있다.In addition, in step (d), dozens of papers are collectively generated by selecting journal units, issue units, and article units according to the DTD criteria provided by the PMC for the text information, or automatically generated in full-text XML of the paper units. Can be created.

그리고, 상기 (d) 단계는, 상기 웹 입력 페이지를 통해 학회 단위, 저널 단위, 논문 단위로 관리자 항목 선택 및 기능 실행 시에, 특정 위치에 학회/저널/발행년도/권호의 하위에 Full-Text XML 데이터를 자동으로 생성하고, 생성 현황을 관리자에게 제공할 수 있다.
In the step (d), when the administrator item is selected and the function is executed by the society unit, the journal unit, and the article unit through the web input page, the full-text under the society / journal / year of publication / volume at a specific position Automatically generate XML data and provide the manager with the status of creation.

본 발명에 의하면, XML에 대한 전문지식이 없이도 학술지 논문 구조에 대한 지식만 있다면 누구든지 다양한 학술지 논문 파일을 PMC DTD에서 정의하고 있는 학술지 논문의 양식에 맞는 풀 텍스트 XML 논문으로 쉽게 자동 변환시킬 수 있다. According to the present invention, anyone without knowledge of XML can easily convert various journal papers into full-text XML papers that fit the style of journal papers defined by PMC DTD. .

또한, XML 논문을 구축하는데 비 전문가라 하더라도 PMC에서 제공하는 DTD에 준하여 풀 텍스트 XML 논문 정보를 구축할 수 있으며, 풀 텍스트 XML 논문 정보를 구축하는데 많은 시간과 비용이 소요되는 것을 대폭 줄일 수 있다. Also, even non-experts in building XML papers can build full-text XML paper information based on the DTD provided by PMC, and it can greatly reduce the time and cost required to build full-text XML paper information.

그리고, 기존에는 PMC에서 정의하고 있는 DTD 정보에 대한 인지와 XML에 대한 정확한 인지를 통해 작업자가 풀 텍스트 XML 파일을 장시간에 걸쳐 생성하였으나, 본 발명에 따른 풀 텍스트 XML은 PMC DTD나 XML에 대한 구조적인 정보를 모르더라도 논문의 형태만 알면 손쉽게 생성시킬 수 있도록 하여 국내 학술지의 국제 수준의 출판 및 유통 체제를 갖추도록 하는데 기여할 수 있다.
In the past, a worker generated a full-text XML file for a long time by recognizing the DTD information defined in the PMC and correct XML, but the full-text XML according to the present invention has a structure for a PMC DTD or XML. Even if you do not know the general information, you can contribute to equip the international level of publication and distribution system of domestic journals by making it easy to generate only knowing the type of thesis.

도 1은 논문정보 구축을 위한 일반적인 웹 입력 페이지의 기능을 블록으로 나타낸 것이다.
도 2는 본 발명의 실시 예에 따른 입력화면과 데이터베이스와의 연결 관계를 도식화 한 것이다.
도 3은 본 발명의 실시예에 따른 풀 텍스트 XML 논문 구축 시스템의 전체적인 기능 블럭을 나타낸 구성도이다.
도 4는 본 발명의 실시예에 따른 화면 입력부의 풀 텍스트 XML 생성을 위한 구조화 작업 화면의 예를 나타낸 도면이다.
도 5는 본 발명의 실시예에 따른 풀 텍스트 XML 논문 구축 시스템의 풀 텍스트 XML 논문 구축 방법을 설명하기 위한 동작 흐름도이다.
도 6a 내지 도 6d는 본 발명의 실시예에 따라 풀 텍스트 XML 논문을 생성하기 위한 PMC DTD 구조의 한 예를 나타낸 도면이다.
도 7은 본 발명의 실시예에 따른 텍스트 정보에 대해 저자정보의 입력, 항목 정의, 텍스트 입력칸의 제어 화면의 한 예를 나타낸 도면이다.
도 8은 본 발명의 실시예에 따라 사용자가 UI 형태로 항목을 선택함에 따라 선택된 항목에 대응된 PMC DTD 항목을 매핑하는 예를 나타낸 도면이다.
도 9는 본 발명의 실시예에 따라 풀 텍스트 XML 논문을 생성하기 위한 PMC DTD 구조의 한 예를 나타낸 도면이다.
도 10은 본 발명의 실시예에 따라 생성할 논문에서 본문 정보의 구성 트리를 나타낸 도면이다.
도 11은 본 발명의 실시예에 따른 풀 텍스트 XML 파일을 스타일쉬트의 선언을 통해 논문 형태로 제공하는 한 예를 나타낸 도면이다.
1 is a block diagram illustrating the functions of a general web input page for constructing article information.
2 is a diagram illustrating a connection relationship between an input screen and a database according to an exemplary embodiment of the present invention.
3 is a block diagram showing the overall functional block of the full-text XML paper construction system according to an embodiment of the present invention.
4 is a diagram illustrating an example of a structured work screen for generating full text XML of a screen input unit according to an embodiment of the present invention.
FIG. 5 is a flowchart illustrating a method of constructing a full-text XML paper in a full-text XML paper construction system according to an embodiment of the present invention.
6A through 6D are diagrams illustrating an example of a PMC DTD structure for generating a full text XML paper according to an embodiment of the present invention.
FIG. 7 is a diagram illustrating an example of a screen for inputting author information, defining an item, and controlling a text input box with respect to text information according to an exemplary embodiment of the present invention.
8 is a diagram illustrating an example of mapping a PMC DTD item corresponding to the selected item as the user selects the item in a UI form according to an embodiment of the present invention.
9 is a diagram illustrating an example of a PMC DTD structure for generating a full-text XML paper according to an embodiment of the present invention.
10 is a diagram illustrating a configuration tree of body information in a paper to be generated according to an embodiment of the present invention.
11 is a diagram illustrating an example of providing a full-text XML file in the form of a paper by declaring a style sheet according to an embodiment of the present invention.

본 발명의 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 실시예를 상세하게 설명한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Reference will now be made in detail to the preferred embodiments of the present invention, examples of which are illustrated in the accompanying drawings, wherein like reference numerals refer to the like elements throughout. Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 논문정보 구축을 위한 일반적인 웹 입력 페이지의 기능을 블록으로 나타낸 것이다.1 is a block diagram illustrating the functions of a general web input page for constructing article information.

도 1에 도시된 바와 같이, 일반적인 웹 입력기는 논문의 서지정보만을 구성하는 입력기로써, 논문 전체를 수용 할 수는 없는 입력기이며, 서지정보의 논문명, 저자, 초록, 키워드 정보 등의 기본적인 항목만 구성한다. As shown in FIG. 1, a general web input device is an input device constituting only bibliographic information of a paper, and is an input device that cannot accommodate the entire paper. do.

또한, 텍스트 입력칸은 데이터베이스의 특정 항목에 연결 되어 있으므로, 사용자가 논문의 특성에 따라, 항목을 추가 한다거나, 항목을 변경하거나 등의 행위는 할 수 없는 고정적인 작업 형태를 기반으로 한다.In addition, since the text entry box is linked to a specific item in the database, it is based on a fixed form of work where the user cannot add, change or change the item according to the characteristics of the article.

즉, 웹 입력 페이지의 텍스트 입력칸은 특정 테이블의 특정 칼럼에 저장되어지게끔 구조화 되어 있으므로, 데이터 저장 테이블을 변경 할 수 없는 구조적인 한계점을 가지고 있다.
That is, the text input field of the web input page is structured to be stored in a specific column of a specific table, and thus has a structural limitation that the data storage table cannot be changed.

도 2는 본 발명의 실시 예에 따른 입력화면과 데이터베이스와의 연결 관계를 도식화 한 것으로, 사용자가 웹 입력 페이지의 텍스트 입력칸의 항목을 변경 함으로써, 정보가 저장되는 대상 테이블 및 항목 속성 정보가 항목 변경에 따라 변경 되는 Full-Text XML 논문구축 시스템의 기능 개요도이다.2 is a diagram illustrating a connection relationship between an input screen and a database according to an exemplary embodiment of the present invention. As a user changes an item of a text input box of a web input page, the target table and item attribute information where information is stored are changed. This is a functional overview diagram of the full-text XML paper construction system that is changed according to.

도 2를 참조하면, 본 발명의 실시 예에 따른 풀 텍스트 XML 논문 구축 시스템이 일반적인 논문 구축 시스템과 다른 차이점은 사용자가 Copy & Paste 기반으로 논문구축 시스템에서 제공하는 웹 입력페이지의 텍스트 입력칸에 텍스트 정보를 입력하고, 각 텍스트 입력칸에 대해 항목 설정 시, 설정 된 항목 대로 데이터베이스에 분산 저장되어, PMC에서 제공하는 DTD 3.0 기반의 XML 데이터를 생성하는 것이다.
Referring to FIG. 2, the difference between the full text XML paper construction system and the general paper construction system according to an embodiment of the present invention is that text information is provided in a text input box of a web input page provided by a user in a paper construction system based on copy and paste. , And when setting items for each text input box, the items are distributed and stored in the database according to the set items to generate DTD 3.0-based XML data provided by PMC.

도 3은 본 발명의 실시예에 따른 풀 텍스트 XML 논문 구축 시스템의 전체적인 기능 블럭을 나타낸 구성도이다.3 is a block diagram showing the overall functional block of the full-text XML paper construction system according to an embodiment of the present invention.

도 3을 참조하면, 본 발명의 실시예에 따른 풀 텍스트 XML 논문 구축 시스템은, 화면 입력부(100), 항목 설정부(110), 데이터속성 자동변경부(120), XML 논문 생성부(130)를 포함한다.Referring to FIG. 3, the full-text XML paper constructing system according to the embodiment of the present invention includes a screen input unit 100, an item setting unit 110, a data attribute automatic change unit 120, and an XML paper generation unit 130. It includes.

화면 입력부(100)는 PDF 문서 내에 존재하는 학술 연구 성과의 논문에 관한 텍스트 정보를 구조화되게 입력 할 수 있는 웹 입력 페이지 상의 텍스트 입력칸을 통해 문단 단위로 입력한다. 이때, 화면 입력부(100)는 입력화면에서 텍스트 정보를 문단 단위로 구분하여 수작업 입력 및 구축을 위한 웹페이지를 제공할 수 있다.The screen input unit 100 inputs text information about a paper of an academic research result present in a PDF document in paragraph units through a text input box on a web input page that allows a structured input of text information. In this case, the screen input unit 100 may provide a web page for manual input and construction by dividing the text information into paragraph units on the input screen.

또한, 화면 입력부(100)는 서지정보, 본문정보, 참고문헌 정보 등의 3단계 영역으로 구분 할 수 있으며, 3단계 항목 구분시 자동으로 각 단계별 하위 항목을 구성 할 수 있다.In addition, the screen input unit 100 may be divided into three step areas such as bibliographic information, text information, and bibliographic information. When the three step items are divided, the screen input unit 100 may automatically configure sub-step items.

또한, 화면 입력부(100)는, PDF 문서로부터 문단 단위로 사용자에 의한 복사(Copy) 및 붙이기(Paste)로 입력받은 텍스트 정보를 상기 웹 입력 페이지 상의 텍스트 입력칸에 단락별로 구분하여 화면 상에 구성할 수 있다.In addition, the screen input unit 100 may divide text information received by a user by copying and pasting in paragraph units from a PDF document into paragraphs in a text input box on the web input page and configured on the screen. Can be.

또한, 화면 입력부(100)는, 학술연구 결과의 논문에 관한 텍스트 정보를 웹 입력 페이지 제공을 통해, 논문의 기본정보인 학회정보, 저널정보, 발행년도, 권호, 논문 시작페이지, 논문제목, 저자명, 저자소속, 이메일, 초록, 키워드 정보를 입력 할 수 있는 서지영역, 본문의 문단 제목, 문단, 표 번호 및 표 제목, 그림 번호 및 그림 제목, 수식이미지 정보, 표, 그림, 참고문헌 링크 정보 및 주석정보를 입력 할 수 있는 본문영역, 참고문헌의 자료타입(저널, 학술대회, 보고서 등)에 따라 입력항목을 달리하여, 입력창을 추가로 제공하는 참고문헌 영역을 하나의 화면에 제공함으로써, 사용자의 작업 편의성을 확보하여 논문 전체 정보를 구축 할 수 있도록 한다.In addition, the screen input unit 100, through the web input page provides the text information about the article of the academic research results, academic information, journal information, publication year, issue number, thesis start page, thesis title, author name, the basic information of the article , Bibliographic area for authorship, e-mail, abstract, keyword information, paragraph title of body, paragraph, table number and table title, picture number and picture title, formula image information, table, picture, bibliography link information and By providing a reference area that provides an additional input window by changing the input items according to the text area where annotation information can be entered and the reference data type (journal, conference, report, etc.), The overall information of the thesis should be established by securing user's convenience.

항목 설정부(110)는 텍스트 정보에 대해 PMC(PubMed Central) DTD(Data Type Definition)에서 정의하고 있는 항목과 매핑하여 의미를 부여하고, 논문 순서에 맞게 구성하기 위해 텍스트 입력칸을 제어한다.The item setting unit 110 maps the text information with the item defined in the PMC (PubMed Central) DTD (Data Type Definition) to give meaning, and controls the text input box to be configured according to the order of the paper.

또한, 항목 설정부(110)는, 웹 입력 페이지 상의 텍스트 입력칸에 대해 3 개의 항목으로 정의하고, 항목 선택에 따라 각 항목이 가지고 있는 하위 항목 선택 기능의 제공과 표 및 그림 정보의 구축을 위한 추가 입력 창을 제공할 수 있다.In addition, the item setting unit 110 is defined as three items for the text input box on the web input page, and provides for the sub-item selection function that each item has according to the item selection and addition for the construction of table and figure information You can provide an input window.

또한, 항목 설정부(110)는, 텍스트 정보의 단락별 문단에 대해 PMC DTD에서 정의하고 있는 서지정보, 본문정보, 참고문헌 정보 및 각 항목의 하위 요소들과 자동 매핑되도록 항목을 선택함에 따라 텍스트 정보에 의미를 부여하고, 논문 순서에 맞게 구성하기 위해 상기 텍스트 입력칸의 업(Up) 또는 다운(Down) 제어하여, 한 개 또는 다수의 텍스트 입력칸을 선택하여 삭제 또는 추가할 수 있다.In addition, the item setting unit 110 selects an item to automatically map the paragraph-specific paragraphs of the text information to bibliographic information, text information, bibliographic information, and sub-elements of each item defined in the PMC DTD. In order to give meaning to the information and to configure the paper order, the text input box may be controlled up or down, and one or more text input fields may be selected and deleted or added.

또한, 항목 설정부(110)는, 논문에 관한 텍스트 정보를 서지영역, 본문영역, 참고문헌 영역으로 항목을 설정하고, 항목 설정 시 텍스트 입력칸의 박스 앞에 항목 설정 기능을 배치하여, 텍스트 입력칸의 기능을 서지, 본문, 참고문헌의 선택에 따라 하위 항목을 선택 할 수 있도록 자동으로 제공하여 선택 항목에 따라 텍스트 박스의 기능을 변경 및 표, 그림 정보 선택 시, 표, 그림의 번호, 제목, 주석 정보를 추가 입력 할 수 있도록 추가 입력 창을 제공 해 줄 수 있다.In addition, the item setting unit 110 sets the text information on the article into the bibliographic area, the text area, and the bibliography area, and arranges the item setting function in front of the box of the text input box at the time of setting the item. It automatically provides the sub-items according to the selection of bibliography, text, and bibliography to change the function of the text box according to the selection, and when selecting the table and picture information, the number of table, picture, title, and annotation information. You can provide additional input window for additional input.

데이터속성 자동변경부(120)는 PMC DTD에서 정의하고 있는 항목 중 하나가 선택되면, 텍스트 입력칸의 텍스트 데이터가 저장되는 형태를 선택된 항목에 따라 자동 변경하고, 특정 테이블에 저장되는 데이터의 속성을 자동으로 변경하여 텍스트 데이터를 저장한다. 즉, 데이터속성 자동변경부(120)는 전자 문서에 대해 논문 순서에 서지영역, 본문영역, 참고문헌 영역을 3단계 구분 및 하위 항목에 대한 설정 변경 시 입력칸의 텍스트 정보가 각 항목에 맞는 데이터베이스의 특정 칼럼에 저장되도록 제어한다.When one of the items defined in the PMC DTD is selected, the data property automatic change unit 120 automatically changes the form in which the text data in the text input box is stored according to the selected item, and automatically changes the property of the data stored in the specific table. To save the text data. That is, the data property automatic change unit 120 divides the bibliographic area, the text area, and the bibliography area into three stages in the order of articles for the electronic document, and changes the settings of the sub-items. Control to be stored in a specific column.

이때, 데이터속성 자동변경부(120)는 전자 문서에 대해 논문 순서에 맞게 구성하기 위한 텍스트 입력칸을 제어한다. 즉, 데이터속성 자동변경부(120)는 전자 문서에 대해 논문 순서에 맞게 구성하기 위해, 텍스트 입력칸의 업(Up) 또는 다운(Down) 제어, 한 개 또는 다수의 텍스트 입력칸을 선택하여 삭제 또는 추가하는 것으로 텍스트 입력칸을 제어할 수 있다.In this case, the data property automatic change unit 120 controls the text input box for configuring the electronic document in the order of the articles. That is, the data property automatic change unit 120 controls up or down control of text input boxes, selects one or more text input boxes, or deletes or adds them in order to configure the electronic document in the order of articles. You can control text entry fields by doing so.

따라서, 데이터속성 자동변경부(120)는, 항목 설정부에서 항목 설정 시 텍스트 입력칸이 가지고 있는 기능을 자동 변경함으로써, 저장되는 데이터 테이블을 자동으로 변경하고, 데이터의 저장항목을 재 구성 할 수 있도록 하는 데이터 속성 자동 변경 기능을 포함한다.Therefore, the data attribute automatic change unit 120 automatically changes the function of the text input box when setting the item in the item setting unit, thereby automatically changing the data table to be stored and reconfiguring the stored items of the data. It includes a data attribute automatic change function.

또한, 데이터속성 자동변경부(120)는, 논문에 관한 텍스트 정보에 대해 사용자로부터 서지, 본문, 참고문헌 항목의 변경 및 각 3 개의 영역에 대한 세부 항목 정보를 입력받아, PMC DTD 형태에 따라 데이터 저장소에 저장할 수 있다.In addition, the data attribute automatic change unit 120 receives bibliographic information, text changes, bibliography items, and detailed item information for each of the three areas from the user with respect to text information regarding the article, and the data according to the PMC DTD form. Can be stored in the repository.

XML 논문 생성부(130)는 저장된 텍스트 데이터에 대해 PMC(PubMed Central)에서 제공하고 있는 DTD(Data Type Definition)에 따라 XML 데이터를 생성 및 출력한다.The XML paper generation unit 130 generates and outputs XML data based on a DTD (Data Type Definition) provided by PMC (PubMed Central) with respect to the stored text data.

또한, XML 논문 생성부(130)는, 논문에 관한 텍스트 정보를 학회단위, 저널단위, 권호단위, 논문단위로 PMC DTD 기반 풀 텍스트 XML로 일괄 생성할 수 있다.In addition, the XML paper generation unit 130 may collectively generate text information about the paper in PMC DTD-based full-text XML in an academic unit, journal unit, issue unit, and paper unit.

그리고, XML 논문 생성부(130)는, 데이터 저장소에 저장된 텍스트 정보에 대해 PMC에서 제공하고 있는 DTD 기준에 따라 저널 단위, 권호 단위, 기사 단위로 선택하여 수십 개의 논문을 일괄 생성하거나 또는 논문 단위의 풀 텍스트 XML로 자동 생성해 줄 수 있다.
The XML paper generation unit 130 may generate dozens of papers in batches or journal units based on the DTD criteria provided by the PMC for the text information stored in the data repository, Automatically generated with full text XML.

도 5는 본 발명의 실시예에 따른 풀 텍스트 XML 논문 구축 시스템의 풀 텍스트 XML 논문 구축 방법을 설명하기 위한 동작 흐름도이다.FIG. 5 is a flowchart illustrating a method of constructing a full-text XML paper in a full-text XML paper construction system according to an embodiment of the present invention.

도 5를 참조하면, 본 발명의 실시예에 따른 풀 텍스트 XML 논문 구축 시스템에서, 화면 입력부(100)는 PDF 문서 내에 존재하는 학술 연구 성과의 논문에 관한 텍스트 정보를 도 4에 도시된 바와 같이 구조화 작업 웹 입력 페이지 상의 텍스트 입력칸을 통해 문단 단위로 입력받는다(S510).Referring to FIG. 5, in the full-text XML paper construction system according to an embodiment of the present invention, the screen input unit 100 structures text information about a paper of an academic research result existing in a PDF document as shown in FIG. 4. The text input box on the work web input page is input in paragraph units (S510).

즉, 화면 입력부(100)는 PDF 문서로부터 문단 단위로 사용자에 의한 복사(Copy) 및 붙이기(Paste)로 입력받은 텍스트 정보를 웹 입력 페이지 상의 텍스트 입력칸에 단락별로 구분하여 입력받을 수 있다. 여기서, 도 4는 본 발명의 실시예에 따른 화면 입력부의 풀 텍스트 XML 생성을 위한 구조화 작업 화면의 예를 나타낸 도면이다. 도 4에서, ①대분류는 논문에 대해 크게 서지정보, 본문정보, 참고문헌정보 영역으로 텍스트 입력칸의 영역을 설정하며, 서지정보, 본문정보, 참고문헌정보의 영역 설정시 각 항목의 하위 항목이 세부 항목 설정 창에 표시된다. ②세부항목은 서지 정보의 세부 항목의 경우, 논문명[ko,en], 초록 정보[ko,en], 키 워드 정보[ko, en]가 존재하며, 초록 정보는 초록을 문단별로도 나누어 구성 할 수 있다. 본문정보의 세부 항목은 문단 제목을 장†절†소절†항†소 항의 5단계로 구분하여 설정할 수 있으며, 일반의 문단 정보는 최초 문단으로 구성하여 별도 정의하지 않는다. ③ 텍스트의 경우, 텍스트 입력 칸에는 각 항목에 맞게 PDF 파일로부터 Copy & Paste 방식으로 작업을 하여 데이터 정보를 입력한다. ④ 참고문헌의 경우, 문단 사이에 있는 표, 그림의 정보 구성 시 표 또는 그림 항목 선택 시 각 항목의 정보를 입력할 수 있는 텍스 트 입력칸이 추가로 구성된다.That is, the screen input unit 100 may receive text information input by copying and pasting by a user in paragraph units from a PDF document in paragraphs into text input boxes on a web input page. 4 is a diagram illustrating an example of a structured work screen for generating full text XML of a screen input unit according to an embodiment of the present invention. In Fig. 4, ① large classification sets the area of the text input box into the bibliographic information, the text information, and the bibliographic information area, and the sub-items of each item are detailed when the bibliographic information, the text information, and the bibliographic information area are set. It is displayed in the item setting window. ② For detailed items of bibliographic information, there are paper title [ko, en], abstract information [ko, en], and keyword information [ko, en]. The abstract information can be divided into paragraphs. Can be. The detailed information of the body information can be set by dividing the paragraph heading into five stages of the chapter † Section † Section † Section † Section. General paragraph information is composed of the first paragraph and is not defined separately. ③ In the case of text, input the data information by copying and pasting from the PDF file according to each item in the text input box. ④ In the case of a bibliography, a text input field is provided to enter information of each item when selecting a table or picture item between paragraphs.

또한, 화면 입력부(100)는 학술연구 결과의 논문에 관한 텍스트 정보를 웹 입력 페이지 제공을 통해, 논문의 기본정보인 학회정보, 저널정보, 발행년도, 권호, 논문 시작페이지, 논문제목, 저자명, 저자소속, 이메일, 초록, 키워드 정보를 입력 할 수 있는 서지영역, 본문의 문단 제목, 문단, 표 번호 및 표 제목, 그림 번호 및 그림 제목, 수식이미지 정보, 표, 그림, 참고문헌 링크 정보 및 주석정보를 입력 할 수 있는 본문영역, 참고문헌의 자료타입(저널, 학술대회, 보고서 등)에 따라 입력항목을 달리하여, 입력창을 추가로 제공하는 참고문헌 영역을 하나의 화면에 제공함으로써, 사용자의 작업 편의성을 확보하여 논문 전체 정보를 구축 할 수 있다.In addition, the screen input unit 100 through the web input page provides the text information about the article of the academic research results, academic information, journal information, publication year, issue number, issue number, thesis start page, thesis title, author name, Bibliographic area for authorship, e-mail, abstract, keyword information, paragraph title of body, paragraph, table number and table title, picture number and picture title, formula image information, table, picture, bibliography link information and comments By providing the reference area that provides additional input window by changing the input items according to the text area where information can be input and the data type of the reference (journal, conference, report, etc.), the user It is possible to build the entire information of the thesis by securing the convenience of work.

또한, 화면 입력부(100)는 텍스트 정보에 관한 학회정보, 저널정보, 발행년도, 권호 및 논문 정보에 대해, 사용자가 Full-Text XML 데이터로 가공 할 수 있도록 학회, 저널, 발행년도, 권호의 개념을 유지하고, 상기 Full-Text XML 데이터를 생성 할 수 있도록 해당 권호의 리스트 페이지에서 웹 입력 페이지를 호출하는 과정을 통해 상기 웹 입력 페이지에 논문에 관한 텍스트 정보를 입력받을 수 있다.In addition, the screen input unit 100 is a concept of society, journal, year of publication, issue for sociation, journal information, publication year, issue and article information on text information, so that the user can be processed into full-text XML data In order to generate the full-text XML data, a web input page may be called from a list page of a corresponding issue to receive text information about a paper on the web input page.

이어, 항목 설정부(110)는 텍스트 정보에 대해 PMC(PubMed Central) DTD(Data Type Definition)에서 정의하고 있는 항목과 매핑하여 텍스트 입력칸에 항목을 정의한다(S520).Subsequently, the item setting unit 110 defines an item in the text input box by mapping the text information with the item defined in the PubMed Central (PMC) DTD (Data Type Definition) (S520).

또한, 항목 설정부(110)는 웹 입력 페이지 상의 텍스트 입력칸에 대해 3 개의 항목으로 정의하고, 항목 선택에 따라 각 항목이 가지고 있는 하위 항목 선택 기능의 제공과 표 및 그림 정보의 구축을 위한 추가 입력 창을 제공할 수 있다.In addition, the item setting unit 110 defines three items for the text input box on the web input page, and provides additional items for providing sub-item selection function that each item has according to item selection and for constructing table and picture information. Can provide a window.

이때, 항목 설정부(110)는 도 6(도 6a 내지 도 6d)에 도시된 바와 같이 PMC에서 정의하고 있는 DTD 3.0 항목대로, 텍스트 정보의 단락별 문단에 대해, PMC DTD에서 정의하고 있는 서지정보, 본문정보, 참고문헌 정보 및 각 항목의 하위 요소들과 자동 매핑되도록 XML 논문 구축 시스템에 정의된 항목을 사용자가 선택함에 따라 텍스트 정보에 의미를 부여할 수 있다. 도 6a 내지 도 6d는 본 발명의 실시예에 따라 풀 텍스트 XML 논문을 생성하기 위한 PMC DTD 구조의 한 예를 나타낸 도면이다.At this time, the item setting unit 110 is a DTD 3.0 item defined in the PMC as shown in FIG. 6 (FIGS. 6A to 6D), and bibliographic information defined in the PMC DTD for paragraphs of paragraphs of text information. , Text information, bibliographic information, and text items can be assigned as the user selects items defined in the XML paper construction system to be automatically mapped to sub-elements of each item. 6A through 6D are diagrams illustrating an example of a PMC DTD structure for generating a full text XML paper according to an embodiment of the present invention.

또한, 항목 설정부(110)는 텍스트 정보의 단락별 문단에서 도 6(도 6a 내지 도 6d)에 도식된 바와 같이 저널메타 영역의 학회정보, 저널정보, 권호정보, 발행정보와 Article-meta 영역의 논문제목, 저자, 소속, 초록정보, 키워드를 관리할 수 있는 항목; 논문의 본문 영역에 해당하는 Body 영역의 장, 절, 소절, 항, 소항의 문단구조 정보; 문단, 표, 그림 정보; 표, 그림, 참고문헌 링크 정보 및 이미지 패싱 정보를 담고 있는 항목; 감사의 글 및 참고문헌 정보를 소유하고 있는 back 요소의 정보에 대해 사용자가 입력박스의 항목을 선택해 줌에 따라 PMC DTD 형태와 자동 매핑화를 진행하여 항목을 정의할 수 있다. In addition, the item setting unit 110, as illustrated in Fig. 6 (Figs. 6A to 6D) in the paragraph-by-paragraph of the text information, the society information, journal information, issue information, publication information and Article-meta area of the journal meta area. Items that can manage thesis title, author, affiliation, abstract information, and keywords of; Paragraph, paragraph, paragraph, paragraph, paragraph, paragraph structure information of the body area corresponding to the body of the article; Paragraph, table, picture information; Items containing tables, figures, bibliographic link information, and image passing information; As the user selects an item in the input box for the information of the back element that owns the acknowledgment and bibliographic information, the item can be defined by automatically mapping with the PMC DTD form.

또한, 항목 설정부(110)는 도 8에 도식된 바와 같이 사용자에 의해 각 항목이 선택되면, 선택된 항목에 해당하는 PMC DTD 항목을 매핑시켜 XML 논문 생성부(130)의 XML 생성모듈에 전달하는 것이다. 도 8은 본 발명의 실시예에 따라 사용자가 UI 형태로 항목을 선택함에 따라 선택된 항목에 대응된 PMC DTD 항목을 매핑하는 예를 나타낸 도면이다. 즉, 항목 설정부(110)는 단락별 문단에 대한 텍스트 정보에 대해 항목을 부여하기 위해, 도 8에 도시된 바와 같이 UI(User Interface) 형태로 항목을 선택하는 화면을 출력하고, 사용자에 의해 각 항목이 선택되면, 선택된 항목에 해당하는 PMC DTD 항목을 매핑시켜 XML 논문 생성부(170)의 XML 생성모듈에 전달하는 것이다.In addition, when each item is selected by the user as illustrated in FIG. 8, the item setting unit 110 maps a PMC DTD item corresponding to the selected item and transmits the item to the XML generation module of the XML paper generation unit 130. will be. 8 is a diagram illustrating an example of mapping a PMC DTD item corresponding to the selected item as the user selects the item in a UI form according to an embodiment of the present invention. That is, the item setting unit 110 outputs a screen for selecting an item in the form of a UI (User Interface), as shown in FIG. When each item is selected, the PMC DTD item corresponding to the selected item is mapped and transmitted to the XML generation module of the XML paper generation unit 170.

또한, 항목 설정부(110)는 논문에 관한 텍스트 정보를 서지영역, 본문영역, 참고문헌 영역으로 항목을 설정하고, 항목 설정 시 텍스트 입력칸의 박스 앞에 항목 설정 기능을 배치하여, 텍스트 입력칸의 기능을 서지, 본문, 참고문헌의 선택에 따라 하위 항목을 선택 할 수 있도록 자동으로 제공하여 선택 항목에 따라 텍스트 박스의 기능을 변경 및 표, 그림 정보 선택 시, 표, 그림의 번호, 제목, 주석 정보를 추가 입력 할 수 있도록 추가 입력 창을 제공 해 줄 수 있다.In addition, the item setting unit 110 sets the text information on the article into a bibliographic area, a text area, and a bibliography area, and arranges the item setting function in front of the box of the text input box when setting the item, thereby providing a function of the text input box. It automatically provides sub-items according to the selection of bibliography, text, and bibliography to change the function of the text box according to the selection, and to select the table, figure number, title, and annotation information. It can provide additional input window for additional input.

이어, 항목 설정부(110)는 전자 문서의 텍스트 정보에 대해 도 7에 도시된 바와 같이 논문 순서에 맞게 구성하기 위한 텍스트 입력칸을 제어한다(S530).Subsequently, the item setting unit 110 controls the text input box for configuring the text information of the electronic document in the order of the article as shown in FIG. 7 (S530).

즉, 항목 설정부(110)는 도 7에 도시된 바와 같이 텍스트 정보를 논문 순서에 맞게 구성하기 위해 텍스트 입력칸의 업(Up) 또는 다운(Down) 제어하여, 한 개 또는 다수의 텍스트 입력칸을 선택하여 삭제 또는 추가할 수 있다. 도 7은 본 발명의 실시예에 따른 텍스트 정보에 대해 저자정보의 입력, 항목 정의, 텍스트 입력칸의 제어 화면의 한 예를 나타낸 도면이다.That is, the item setting unit 110 selects one or a plurality of text input boxes by controlling the up or down of the text input boxes in order to configure the text information according to the order of the papers as shown in FIG. 7. Can be deleted or added. FIG. 7 is a diagram illustrating an example of a screen for inputting author information, defining an item, and controlling a text input box with respect to text information according to an exemplary embodiment of the present invention.

또한, 항목 설정부(110)는 텍스트 정보가 오탈자 없이 글의 순서에 맞게 구축되는지에 대한 내용을 사용자가 확인할 수 있도록, 화면 입력부(100)와 연동하여 학회 정보, 저널 정보, 논문기사 정보, 본문 정보, 표/그림 정보 및 참고문헌을 관리하는 테이블을 도 9에 도시된 바와 같은 PMC DTD 형태에 따라 XML로 파싱(Parsing)하여 스타일쉬트(Style Sheet)의 선언을 통해 미리보기 기능을 제공할 수 있다. 도 9는 본 발명의 실시예에 따라 풀 텍스트 XML 논문을 생성하기 위한 PMC DTD 구조의 한 예를 나타낸 도면이다.In addition, the item setting unit 110, in conjunction with the screen input unit 100, so that the user can check the contents of the text information is built in the order of the writing without typos, academic information, journal information, article article information, text A table that manages information, table / picture information, and references can be parsed into XML according to the PMC DTD format as shown in FIG. 9 to provide a preview function through the declaration of a style sheet. have. 9 is a diagram illustrating an example of a PMC DTD structure for generating a full-text XML paper according to an embodiment of the present invention.

이어, 데이터속성 자동변경부(120)는 PMC DTD에서 정의하고 있는 항목 중 하나가 선택되면(S540-예), 텍스트 입력칸의 텍스트 데이터가 저장되는 형태를 선택된 항목에 따라 자동 변경하고, 특정 테이블에 저장되는 데이터의 속성을 자동으로 변경하여 텍스트 데이터를 저장한다(S550).Subsequently, when one of the items defined in the PMC DTD is selected (S540-Yes), the data property automatic change unit 120 automatically changes the form in which the text data of the text input box is stored according to the selected item, The text data is stored by automatically changing an attribute of the stored data (S550).

이때, 데이터속성 자동변경부(120)는 항목 설정 시 텍스트 입력칸이 가지고 있는 기능을 자동 변경함으로써, 저장되는 데이터 테이블을 자동으로 변경하고, 데이터의 저장항목을 재 구성 할 수 있도록 하는 데이터 속성 자동 변경 기능을 제공할 수 있다.In this case, the data property automatic change unit 120 automatically changes the data table to be stored by automatically changing the function of the text input box when setting the item, and automatically changes the data property so that the data storage item can be reconfigured. Can provide functionality.

또한, 데이터속성 자동변경부(120)는 논문에 관한 텍스트 정보에 대해 서지, 본문, 참고문헌 항목의 변경 및 각 3 개의 영역에 대한 세부 항목 정보에 대해 구성 또는 항목의 변경 시, 자동으로 텍스트 데이터가 저장되는 저장 테이블 및 항목을 변경하여 저장할 수 있다.In addition, the data property automatic change unit 120 automatically changes the text data when the bibliography, the text, the bibliography items are changed, and the detailed item information of each of the three areas is configured or the items are changed. You can change the storage table and items that are stored.

이어, XML 논문 생성부(130)는 저장된 텍스트 데이터에 대해 PMC(PubMed Central)에서 제공하고 있는 DTD(Data Type Definition)에 따라 XML 논문 데이터를 생성 및 출력한다(S560).Subsequently, the XML paper generation unit 130 generates and outputs the XML paper data according to the DTD (Data Type Definition) provided by the PMC (PubMed Central) for the stored text data (S560).

즉, XML 논문 생성부(130)는 전술한 항목 정의, 유니코드 변환, 링크정보 구성 등의 과정들을 통해 구축된 도 10에 도시된 바와 같은 구조를 갖는 학술논문 정보를 PMC DTD 형태에 따라 도 11에 도시된 바와 같은 PMC DTD 기반 풀 텍스트 XML을 생성하는 것이다.That is, the XML paper generation unit 130 displays academic paper information having the structure as shown in FIG. 10 constructed through the above-described item definition, Unicode conversion, link information construction, etc. according to the PMC DTD form. PMC DTD based full text XML is generated as shown in FIG.

이때, XML 논문 생성부(130)는 전술한 과정들을 통해 구축된 도 10에 도시된 바와 같은 구조를 갖는 학술논문 정보를 학회단위, 저널단위, 권호단위, 논문단위로 도 11에 도식된 바와 같은 PMC DTD 기반 풀 텍스트 XML을 일괄 생성할 수 있다. 여기서, 도 10은 본 발명의 실시예에 따라 생성할 논문에서 본문 정보의 구성 트리를 나타낸 도면이고, 도 11은 본 발명의 실시예에 따른 풀 텍스트 XML 파일을 스타일쉬트의 선언을 통해 논문 형태로 제공하는 한 예를 나타낸 도면이다.At this time, the XML article generation unit 130 is shown in Figure 11 in the academic unit, journal unit, issue number unit, thesis unit having the structure as shown in Figure 10 built through the above-described process You can batch generate PMC DTD-based full-text XML. 10 is a diagram illustrating a configuration tree of body information in a paper to be generated according to an embodiment of the present invention, and FIG. 11 is a full text XML file according to an embodiment of the present invention in the form of a paper through the declaration of a style sheet. It is a figure which shows the example which provides.

도 10과 같이, 논문의 구성은 제목, 저자, 소속, 초록 및 키워드 정보를 구성하는 서지 정보와, 논문의 연구 목적 및 개요, 연구 방법, 연구 재료, 연구 결과 등의 정보를 구성하는 논문의 본문 정보와, 논문의 연구 결과를 위해 참고하고 인용한 정보로 구성되어져 있는 참고문헌으로 구분할 수 있다. 이중, 논문 본문 정보 중 논문의 연구 목적 및 개요, 연구 방법, 연구 재료, 연구 결과 등의 구분을 위한 문단 정보의 구성 내역은 다음과 같다. 문단 구성“은 하위에 장, 절, 소절, 항, 소항으로 나누어져 있으며, 하위에 정보를 가지고 있는 항목은 장에 대해서만 존재한다. 본문 정보 중 최상위 Section은 장으로 구분하며, 장은 반드시 속성 정보 중 하나를 선택할 수 있다.As shown in Fig. 10, the structure of the article is bibliographic information constituting the title, author, affiliation, abstract, and keyword information, and the body of the article constituting information such as the purpose and outline of the article, the research method, the research material, and the research results. It can be divided into information and references that consist of references and citations for the research results. Among these, the contents of paragraph information to classify research purpose and outline, research method, research material, and research result of thesis are as follows. Paragraph structure is divided into chapters, sections, subsections, terms, and subsections. Items with information at the bottom exist only for chapters. The top section of the body information is divided into chapters, and the chapter can select one of the attribute information.

속성 정보는 크게 6가지 유형으로 구성되며, 그 예는 다음과 같다. Intro는 연구의 배경 및 연구를 하는 목적을 나타내는 것으로, 논문 상에서는 서론, "Introduction", Intro" 등으로 명명되어진다. Methods는 연구의 목적을 위해, 연구의 방법 등을 주요 내용으로 하는 장으로써, 논문 상에서는 연구 방법, 방법, Methods", "Methods and Materials" 또는 Materials and Methods" 등으로 명명되어진다. "Methods and Materials" 또는 Materials and Methods"의 경우 먼저 명명된 용어를 기준으로 Methods or "Materials"로 구분할 수 있다. Materials는 연구에 사용되어지는 재료에 관련된 내용을 주요 내용으로 하는 장으로써, 논문 상에서는 연구 재료, 재료, Materials", "Methods and Materials" 또는 Materials and Methods" 등으로 명명되어진다. "Methods and Materials" 또는 Materials and Methods"의 경우 먼저 명명된 용어를 기준으로 Methods or "Materials"로 구분할 수 있다. Result는 연구 방법 및 재료를 기반으로 연구를 한 결과를 주요 내용으로 설명하는 장으로써, 연구 결과, 결과, Result", "Result and Discussion", "Result and Conclusion"등으로 명명되어지며, 명명된 용어를 기준으로 먼저 명명된 "Result" or "Discussion" or "Conclusion"등으로 명명할 수 있다. 도 8에서, 리스트 정보의 형태는 논문의 일부 내용을 설명하기 위해, 순차적으로 *, †, (1), "(a)" 등 시리얼하게 순서를 정하여 설명한 형태의 문단을 리스트 정보라 정의할 수 있다.The attribute information is largely composed of six types. An example is as follows. Intro refers to the background of research and the purpose of research, and is named introductory, "Introduction", Intro ", etc. Methods are the chapters for the purpose of research. In the paper, they are referred to as "methods and materials", "Methods and Materials" or "Materials and Methods", etc. In the case of "Methods and Materials" or "Materials and Methods", methods or "Materials" Can be divided into Materials is a chapter that is mainly related to the materials used in the research. In the paper, the materials are called "Materials, Materials, Materials", "Methods and Materials", or "Materials and Methods". "Methods and Materials" or "Materials and Methods" can be categorized as Methods or "Materials" based on the terms first named. Result is a chapter describing the results of research based on research methods and materials. , "Result", "Result and Discussion", "Result and Conclusion", etc., and named "Result" or "Discussion" or "Conclusion" first based on the named term. Can be. In FIG. 8, in the form of list information, paragraphs of a form described in order of serial order such as *, †, (1), and "(a)" may be defined as list information in order to explain a part of the article. have.

또한, XML 논문 생성부(130)는 텍스트 정보에 대해 PMC에서 제공하고 있는 DTD 기준에 따라 저널 단위, 권호 단위, 기사 단위로 선택하여 수십 개의 논문을 일괄 생성하거나 또는 논문 단위의 풀 텍스트 XML로 자동 생성해 줄 수 있다.In addition, the XML article generation unit 130 generates dozens of articles in batches by selecting journal units, issue units, and article units according to the DTD criteria provided by the PMC for text information, or automatically generates the full text XML in the unit of articles. Can be created.

그리고, XML 논문 생성부(130)는 웹 입력 페이지를 통해 학회 단위, 저널 단위, 논문 단위로 관리자 항목 선택 및 기능 실행 시에, 특정 위치에 학회/저널/발행년도/권호의 하위에 Full-Text XML 데이터를 자동으로 생성하고, 생성 현황을 관리자에게 제공할 수 있다.In addition, the XML paper generation unit 130 selects a manager item by a society unit, a journal unit, and a paper unit through a web input page, and executes a function. Automatically generate XML data and provide the manager with the status of creation.

전술한 바와 같이 본 발명에 의하면, 학술지 논문 파일에서 텍스트 정보를 입력도구에 복사 및 붙이기(Copy & Paste) 방식으로 입력하고, 논문의 형태에 따라 서지 정보, 본문 정보, 참고문헌 정보로 구분하여, 본문 정보의 유연한 구축을 위해 문단의 성격을 나타내는 항목을 선택하여 정의함으로써, 각 항목의 영역을 시스템에서 인지할 수 있도록 하며, 텍스트 입력박스에서 항목을 선택하여 각각의 문단 정보, 표, 그림 정보 등을 구성할 수 있도록 함으로써 PMC에서 정의하고 있는 DTD 기반의 XML 데이터를 일괄적으로 생성할 수 있도록 하는 Full-Text XML 논문 구축 시스템 및 방법을 실현할 수 있다.As described above, according to the present invention, in the journal article file, text information is input to the input tool in a copy and paste manner, and classified into bibliographic information, text information, and bibliographic information according to the form of the article. By selecting and defining the items that show the characteristics of paragraphs for flexible construction of the body information, the system can recognize the area of each item, and select each item in the text input box to select each paragraph information, table, picture information, etc. It is possible to realize a full-text XML paper construction system and method that can generate DTD-based XML data defined by PMC collectively.

본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있으므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the present invention as defined by the following claims and their equivalents. Only. The scope of the present invention is defined by the appended claims rather than the detailed description and all changes or modifications derived from the meaning and scope of the claims and their equivalents are to be construed as being included within the scope of the present invention do.

본 발명은 마이크로소프트(MS)사 워드 파일이나 어도브(Adobe)사 PDF 파일로 된 논문을 웹페이지 상에서 볼 수 있도록 하는 XML 논문 파일로 변환하는 시스템에 적용할 수 있다.The present invention can be applied to a system for converting a paper in a Microsoft Word file or an Adobe PDF file into an XML paper file for viewing on a web page.

또한, 학술지 논문의 풀 텍스트(Full Text)를 PMC DTD 기반 XML 문서로 변환시켜서 학술지 데이터베이스를 구축하는 서비스나 시스템에 적용할 수 있다.In addition, the full text of a journal article can be converted into a PMC DTD-based XML document and applied to a service or system that builds a journal database.

그리고, XML이나 PMC DTD에 관한 전문 지식이 없는 사람도 일반적으로 많이 사용하는 워드 파일이나 PDF 포맷의 학술지 논문을 XML 논문으로 변환시켜 사용할 수 있도록 하는 서비스나 시스템에 적용할 수 있다.
In addition, even those who do not have expertise in XML or PMC DTD can be applied to services or systems that can convert a commonly used word file or PDF journal article into an XML article.

100 : 화면 입력부 110 : 항목 설정부
120 : 데이터속성 자동변경부 130 : XML 논문 생성부
100: screen input unit 110: item setting unit
120: automatic data change unit 130: XML paper generation unit

Claims (22)

PDF 문서 내에 존재하는 학술 연구 성과의 논문에 관한 텍스트 정보를 구조화되게 입력 할 수 있는 웹 입력 페이지 상의 텍스트 입력칸을 통해 문단 단위로 입력하기 위한 화면 입력부;
상기 텍스트 정보에 대해 PMC(PubMed Central) DTD(Data Type Definition)에서 정의하고 있는 항목과 매핑하여 의미를 부여하고, 논문 순서에 맞게 구성하기 위해 상기 텍스트 입력칸을 제어하는 항목 설정부;
상기 PMC DTD에서 정의하고 있는 항목 중 하나가 선택되면, 상기 텍스트 입력칸의 텍스트 데이터가 저장되는 형태를 상기 선택된 항목에 따라 자동 변경하고, 특정 테이블에 저장되는 데이터의 속성을 자동으로 변경하여 상기 텍스트 데이터를 저장하는 데이터속성 자동변경부; 및
상기 저장된 텍스트 데이터에 대해 PMC(PubMed Central)에서 제공하고 있는 DTD(Data Type Definition)에 따라 XML 데이터를 생성 및 출력하는 XML 논문 생성부;
를 포함하는 풀 텍스트 엑스엠엘 논문 구축 시스템.
A screen input unit for inputting paragraph-by-paragraph text through a text input box on a web input page for structured input of text information about a paper of an academic research result existing in a PDF document;
An item setting unit which gives meaning to the text information by mapping it with an item defined in a PubMed Central (PMC) Data Type Definition (DTD) and controls the text input box to be configured according to a paper order;
When one of the items defined in the PMC DTD is selected, the form in which the text data of the text input box is stored is automatically changed according to the selected item, and the attribute of the data stored in a specific table is automatically changed to the text data. Data property automatic change unit for storing the; And
An XML paper generation unit configured to generate and output XML data based on a DTD (Data Type Definition) provided by PMC (PubMed Central) with respect to the stored text data;
Full text XLM paper building system that includes.
제 1 항에 있어서,
상기 화면 입력부는, 상기 PDF 문서로부터 문단 단위로 사용자에 의한 복사(Copy) 및 붙이기(Paste)로 입력받은 텍스트 정보를 상기 웹 입력 페이지 상의 텍스트 입력칸에 단락별로 구분하여 화면 상에 구성하는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 시스템.
The method of claim 1,
The screen input unit may be configured on the screen by dividing the text information received by the user to copy and paste in paragraph units from the PDF document by paragraphs in a text input box on the web input page. Full Text XML Thesis Building System.
제 1 항에 있어서,
상기 화면 입력부는, 상기 학술 연구 성과의 논문에 관한 텍스트 정보를 웹 입력 페이지 제공을 통해, 논문의 기본정보인 학회정보, 저널정보, 발행년도, 권호, 논문 시작페이지, 논문제목, 저자명, 저자소속, 이메일, 초록, 키워드 정보를 입력 할 수 있는 서지영역, 본문의 문단 제목, 문단, 표 번호 및 표 제목, 그림 번호 및 그림 제목, 수식이미지 정보, 표, 그림, 참고문헌 링크 정보 및 주석정보를 입력 할 수 있는 본문영역, 참고문헌의 자료타입(저널, 학술대회, 보고서 등)에 따라 입력항목을 달리하여, 입력창을 추가로 제공하는 참고문헌 영역을 하나의 화면에 제공함으로써, 사용자의 작업 편의성을 확보하여 논문 전체 정보를 구축 할 수 있도록 하는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 시스템.
The method of claim 1,
The screen input unit, through the web input page provides the text information about the article of the academic research results, academic information, journal information, publication year, issue, thesis start page, thesis title, author name, author's belonging Bibliographic field for inputting e-mail, abstract, and keyword information, paragraph heading, paragraph, table number and table title, figure number and figure title, formula image information, table, figure, bibliography link information and annotation information The user's work is provided by providing a bibliography area that provides an additional input window by varying the input items according to the text area that can be input and the bibliography data type (journal, conference, report, etc.). Full text XML paper construction system, characterized in that to ensure the convenience to build the entire paper information.
제 1 항에 있어서,
상기 항목 설정부는, 상기 웹 입력 페이지 상의 텍스트 입력칸에 대해 3 개의 항목으로 정의하고, 항목 선택에 따라 각 항목이 가지고 있는 하위 항목 선택 기능의 제공과 표 및 그림 정보의 구축을 위한 추가 입력 창을 제공하는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 시스템.
The method of claim 1,
The item setting unit defines three items for the text input box on the web input page, and provides an additional input window for providing sub-item selection function of each item according to item selection and for constructing table and picture information. Full text XLM paper building system, characterized in that.
제 1 항에 있어서,
상기 항목 설정부는, 상기 텍스트 정보의 단락별 문단에 대해 PMC DTD에서 정의하고 있는 서지정보, 본문정보, 참고문헌 정보 및 각 항목의 하위 요소들과 자동 매핑되도록 항목을 선택함에 따라 상기 텍스트 정보에 의미를 부여하고, 상기 논문 순서에 맞게 구성하기 위해 상기 텍스트 입력칸의 업(Up) 또는 다운(Down) 제어하여, 한 개 또는 다수의 텍스트 입력칸을 선택하여 삭제 또는 추가하는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 시스템.
The method of claim 1,
The item setting unit may mean the text information by selecting an item to be automatically mapped to bibliographic information, text information, bibliographic information, and sub-elements of each item defined in the PMC DTD for each paragraph of the text information. And full text XMB to select one or a plurality of text input fields and delete or add the text input fields by controlling the up or down of the text input fields in order to configure the paper order. Thesis Building System.
제 1 항에 있어서,
상기 항목 설정부는, 상기 논문에 관한 텍스트 정보를 서지영역, 본문영역, 참고문헌 영역으로 항목을 설정하고, 항목 설정 시 텍스트 입력칸의 박스 앞에 항목 설정 기능을 배치하여, 텍스트 입력칸의 기능을 서지, 본문, 참고문헌의 선택에 따라 하위 항목을 선택 할 수 있도록 자동으로 제공하여 선택 항목에 따라 텍스트 박스의 기능을 변경 및 표, 그림 정보 선택 시, 표, 그림의 번호, 제목, 주석 정보를 추가 입력 할 수 있도록 추가 입력 창을 제공 해 주는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 시스템.
The method of claim 1,
The item setting unit sets an item in the bibliographic area, the text area, and the bibliography area for the text information about the article, and sets the item setting function in front of the box of the text input box when setting the item. It automatically provides the sub-items according to the selection of the bibliography so that the function of the text box can be changed according to the selection and the table, figure number, title, and comment information can be added. Full text XML paper building system, characterized in that it provides an additional input window.
제 1 항에 있어서,
상기 데이터속성 자동변경부는, 상기 항목 설정부에서 항목 설정 시 텍스트 입력칸이 가지고 있는 기능을 자동 변경함으로써, 저장되는 데이터 테이블을 자동으로 변경하고, 데이터의 저장항목을 재 구성 할 수 있도록 하는 데이터 속성 자동 변경 기능을 포함하는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 시스템.
The method of claim 1,
The data property automatic change unit automatically changes a function of a text input box when setting an item in the item setting unit, thereby automatically changing a data table to be stored and automatically reconfiguring a stored item of data. Full text XLML paper construction system comprising a change function.
제 1 항에 있어서,
상기 데이터속성 자동변경부는, 상기 논문에 관한 텍스트 정보에 대해 사용자로부터 서지, 본문, 참고문헌 항목의 변경 및 각 3 개의 영역에 대한 세부 항목 정보를 입력받아, PMC DTD 형태에 따라 데이터 저장소에 상기 텍스트 정보를 저장하는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 시스템.
The method of claim 1,
The data attribute automatic change unit receives a bibliographic information, a text, a bibliographic item, and detailed item information for each of three areas from the user with respect to the text information of the article, and inputs the text to the data repository according to the PMC DTD form. Full text XML paper building system, characterized in that for storing information.
제 1 항에 있어서,
상기 XML 논문 생성부는, 상기 논문에 관한 텍스트 정보를 학회단위, 저널단위, 권호단위, 논문단위로 PMC DTD 기반 풀 텍스트 XML로 일괄 생성하는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 시스템.
The method of claim 1,
The XML paper generation unit, the full-text XML paper construction system, characterized in that the generation of the PMC DTD-based full-text XML in the text unit, journal unit, issue unit, the paper unit unit.
제 8 항에 있어서,
상기 XML 논문 생성부는, 상기 데이터 저장소에 저장된 텍스트 정보에 대해 PMC에서 제공하고 있는 DTD 기준에 따라 저널 단위, 권호 단위, 기사 단위로 선택하여 수십 개의 논문을 일괄 생성하거나 또는 논문 단위의 풀 텍스트 XML로 자동 생성해 주는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 시스템.
The method of claim 8,
The XML article generation unit may generate dozens of articles in batches, journal units, issue units, and article units according to the DTD criteria provided by the PMC for the text information stored in the data repository, or generate full text XML in article units. Full text XML paper construction system characterized in that the automatic generation.
화면 입력부와 항목 설정부, 데이터속성 자동변경부 및 XML 논문 생성부를 포함하는 시스템의 풀 텍스트 엑스엠엘 논문 구축 방법으로서,
(a) 상기 화면 입력부가 PDF 문서 내에 존재하는 학술 연구 성과의 논문에 관한 텍스트 정보를 구조화되게 입력 할 수 있는 웹 입력 페이지 상의 텍스트 입력칸을 통해 문단 단위로 입력받는 단계;
(b) 상기 항목 설정부가 상기 텍스트 정보에 대해 PMC(PubMed Central) DTD(Data Type Definition)에서 정의하고 있는 항목과 매핑하여 상기 텍스트 입력칸에 항목을 정의하고, 논문 순서에 맞게 구성하기 위한 상기 텍스트 입력칸을 제어하는 단계;
(c) 상기 데이터속성 자동변경부가 상기 PMC DTD에서 정의하고 있는 항목 중 하나가 선택되면, 상기 텍스트 입력칸의 텍스트 데이터가 저장되는 형태를 상기 선택된 항목에 따라 자동 변경하고, 특정 테이블에 저장되는 데이터의 속성을 자동으로 변경하여 상기 텍스트 데이터를 저장하는 단계; 및
(d) 상기 XML 논문 생성부가 상기 저장된 텍스트 데이터에 대해 PMC(PubMed Central)에서 제공하고 있는 DTD(Data Type Definition)에 따라 XML 데이터를 생성 및 출력하는 단계;
를 포함하는 풀 텍스트 엑스엠엘 논문 구축 방법.
A method for constructing a full text XML paper of a system including a screen input unit, an item setting unit, a data property automatic change unit, and an XML paper generation unit,
(a) receiving the screen input unit in paragraph units through a text input box on a web input page through which text information about an article of an academic research achievement existing in a PDF document can be structuredly input;
(b) the text input box configured to define an item in the text input box by mapping the item information to an item defined in a PubMed Central (PMC) Data Type Definition (PMD) for the text information, and to configure the text in the order of a paper. Controlling;
(c) If one of the items defined in the PMC DTD is selected by the data attribute automatic change unit, automatically changes the format in which the text data of the text input box is stored according to the selected item, and the data stored in a specific table. Automatically changing an attribute to store the text data; And
(d) generating and outputting XML data according to a DTD (Data Type Definition) provided by the PubMed Central (PMC) for the stored text data;
Full text XML paper construction method comprising a.
제 11 항에 있어서,
상기 (a) 단계는, 상기 PDF 문서로부터 문단 단위로 사용자에 의한 복사(Copy) 및 붙이기(Paste)로 입력받은 텍스트 정보를 상기 웹 입력 페이지 상의 텍스트 입력칸에 단락별로 구분하여 화면 상에 구성하는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 방법.
The method of claim 11,
In the step (a), the text information input by copying and pasting by the user in paragraph units from the PDF document is divided into paragraphs in a text input box on the web input page and configured on the screen. Method for constructing a full-text XML paper.
제 11 항에 있어서,
상기 (a) 단계는, 상기 학술 연구 성과의 논문에 관한 텍스트 정보를 웹 입력 페이지 제공을 통해, 논문의 기본정보인 학회정보, 저널정보, 발행년도, 권호, 논문 시작페이지, 논문제목, 저자명, 저자소속, 이메일, 초록, 키워드 정보를 입력 할 수 있는 서지영역, 본문의 문단 제목, 문단, 표 번호 및 표 제목, 그림 번호 및 그림 제목, 수식이미지 정보, 표, 그림, 참고문헌 링크 정보 및 주석정보를 입력 할 수 있는 본문영역, 참고문헌의 자료타입(저널, 학술대회, 보고서 등)에 따라 입력항목을 달리하여, 입력창을 추가로 제공하는 참고문헌 영역을 하나의 화면에 제공함으로써, 사용자의 작업 편의성을 확보하여 논문 전체 정보를 구축 할 수 있도록 하는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 방법.
The method of claim 11,
In the step (a), through the web input page, the text information about the article of the academic research achievement, the academic information which is the basic information of the article, the journal information, the publication year, the issue, thesis start page, the title of the article, the author's name, Bibliographic area for authorship, e-mail, abstract, keyword information, paragraph title of body, paragraph, table number and table title, picture number and picture title, formula image information, table, picture, bibliography link information and comments By providing the reference area that provides additional input window by changing the input items according to the text area where information can be input and the data type of the reference (journal, conference, report, etc.), the user Full text XML paper construction method characterized in that to ensure the convenience of the work to build the entire information of the paper.
제 11 항에 있어서,
상기 (a) 단계는, 상기 텍스트 정보에 관한 학회정보, 저널정보, 발행년도, 권호 및 논문 정보에 대해, 사용자가 Full-Text XML 데이터로 가공 할 수 있도록 학회, 저널, 발행년도, 권호의 개념을 유지하고, 상기 Full-Text XML 데이터를 생성 할 수 있도록 해당 권호의 리스트 페이지에서 웹 입력 페이지를 호출하는 과정을 통해 상기 웹 입력 페이지에 논문에 관한 텍스트 정보를 입력받는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 방법.
The method of claim 11,
In the step (a), the concept of a society, a journal, a year of publication, and a number of issues for the user to process the full-text XML data about the society information, journal information, publication year, issue, and article information on the text information. Full text X, characterized in that to receive the text information about the paper on the web input page through the process of calling the web input page from the list page of the corresponding issue so as to generate the Full-Text XML data How to build an MD paper.
제 11 항에 있어서,
상기 (b) 단계는, 상기 웹 입력 페이지 상의 텍스트 입력칸에 대해 3 개의 항목으로 정의하고, 항목 선택에 따라 각 항목이 가지고 있는 하위 항목 선택 기능의 제공과 표 및 그림 정보의 구축을 위한 추가 입력 창을 제공하는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 방법.
The method of claim 11,
In step (b), the text input box on the web input page is defined as three items, and an additional input window for providing a lower item selection function of each item according to the item selection and for constructing table and picture information is provided. Full text XLM paper construction method characterized in that to provide.
제 11 항에 있어서,
상기 (b) 단계는, 상기 텍스트 정보의 단락별 문단에 대해 PMC DTD에서 정의하고 있는 서지정보, 본문정보, 참고문헌 정보 및 각 항목의 하위 요소들과 자동 매핑되도록 항목을 선택함에 따라 상기 텍스트 정보에 의미를 부여하고, 상기 논문 순서에 맞게 구성하기 위해 상기 텍스트 입력칸의 업(Up) 또는 다운(Down) 제어하여, 한 개 또는 다수의 텍스트 입력칸을 선택하여 삭제 또는 추가하는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 방법.
The method of claim 11,
In the step (b), the paragraph information of the text information may be automatically mapped to the bibliographic information, the body information, the bibliographic information, and sub-elements of each item defined in the PMC DTD. Full text, characterized in that to add to the meaning, and to control the up or down of the text input box in order to configure according to the article order, to select or delete one or more text input box. How to build XML paper.
제 11 항에 있어서,
상기 (b) 단계는, 상기 논문에 관한 텍스트 정보를 서지영역, 본문영역, 참고문헌 영역으로 항목을 설정하고, 항목 설정 시 텍스트 입력칸의 박스 앞에 항목 설정 기능을 배치하여, 텍스트 입력칸의 기능을 서지, 본문, 참고문헌의 선택에 따라 하위 항목을 선택 할 수 있도록 자동으로 제공하여 선택 항목에 따라 텍스트 박스의 기능을 변경 및 표, 그림 정보 선택 시, 표, 그림의 번호, 제목, 주석 정보를 추가 입력 할 수 있도록 추가 입력 창을 제공 해 주는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 방법.
The method of claim 11,
In the step (b), the text information of the article is set in the bibliographic area, the text area, and the bibliography area, and the item setting function is arranged in front of the box of the text input box when the item is set. Provides automatic selection of sub-items based on the selection of text, text, and bibliography. Changes the function of the text box according to the selection and adds table, figure number, title, and annotation information when selecting table and figure information. A method of constructing a full text XML paper, which provides an additional input window for input.
제 11 항에 있어서,
상기 (c) 단계는, 상기 항목 설정 시 텍스트 입력칸이 가지고 있는 기능을 자동 변경함으로써, 저장되는 데이터 테이블을 자동으로 변경하고, 데이터의 저장항목을 재 구성 할 수 있도록 하는 데이터 속성 자동 변경 기능을 제공하는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 방법.
The method of claim 11,
In the step (c), by automatically changing the function of the text input box when setting the item, the data property to be changed is automatically changed, and the data property automatic change function is provided so that the data storage item can be reconfigured. Full text XML paper building method, characterized in that.
제 11 항에 있어서,
상기 (c) 단계는, 상기 논문에 관한 텍스트 정보에 대해 서지, 본문, 참고문헌 항목의 변경 및 각 3 개의 영역에 대한 세부 항목 정보에 대해 구성 또는 항목의 변경 시, 자동으로 텍스트 데이터가 저장되는 저장 테이블 및 항목을 변경하여 저장하는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 방법.
The method of claim 11,
In the step (c), the text data is automatically stored when the bibliography, the text, the bibliography item is changed, and the detailed item information of each of the three areas is configured or the item is changed. A method of constructing a full text XML paper, comprising changing and storing a storage table and items.
제 11 항에 있어서,
상기 (d) 단계는, 상기 논문에 관한 텍스트 정보를 학회단위, 저널단위, 권호단위, 논문단위로 PMC DTD 기반 풀 텍스트 XML로 일괄 생성하는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 방법.
The method of claim 11,
In the step (d), the text information related to the article is generated in PMC DTD-based full-text XML in a unit, journal unit, issue unit, and article unit.
제 11 항에 있어서,
상기 (d) 단계는, 상기 텍스트 정보에 대해 PMC에서 제공하고 있는 DTD 기준에 따라 저널 단위, 권호 단위, 기사 단위로 선택하여 수십 개의 논문을 일괄 생성하거나 또는 논문 단위의 풀 텍스트 XML로 자동 생성해 주는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 방법.
The method of claim 11,
In the step (d), according to the DTD criteria provided by the PMC, the text information is selected in a journal unit, an issue unit, or an article unit to generate dozens of papers collectively or automatically generate the full text XML in the paper unit. Full text XLML paper construction method characterized in that the giving.
제 11 항에 있어서,
상기 (d) 단계는, 상기 웹 입력 페이지를 통해 학회 단위, 저널 단위, 논문 단위로 관리자 항목 선택 및 기능 실행 시에, 특정 위치에 학회/저널/발행년도/권호의 하위에 Full-Text XML 데이터를 자동으로 생성하고, 생성 현황을 관리자에게 제공하는 것을 특징으로 하는 풀 텍스트 엑스엠엘 논문 구축 방법.
The method of claim 11,
In the step (d), when the administrator item is selected and the function is executed by the society unit, journal unit, and thesis unit through the web input page, the full-text XML data under the society / journal / year of publication / volume at a specific location. A method for constructing a full text XML paper, characterized in that automatically generating and providing the administrator with a generation status.
KR1020120118885A 2012-10-25 2012-10-25 Xml thesis constructing system and method KR101243058B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120118885A KR101243058B1 (en) 2012-10-25 2012-10-25 Xml thesis constructing system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120118885A KR101243058B1 (en) 2012-10-25 2012-10-25 Xml thesis constructing system and method

Publications (1)

Publication Number Publication Date
KR101243058B1 true KR101243058B1 (en) 2013-03-13

Family

ID=48181775

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120118885A KR101243058B1 (en) 2012-10-25 2012-10-25 Xml thesis constructing system and method

Country Status (1)

Country Link
KR (1) KR101243058B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110349620A (en) * 2019-06-28 2019-10-18 广州序科码生物技术有限责任公司 One kind accurately identifying interaction of molecules and its polarity and directionality method from PubMed document
KR102055407B1 (en) * 2019-06-13 2019-12-12 (주)케이엔랩 Providing method for policy information, Providing system for policy information, and computer program therefor

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004240507A (en) 2003-02-03 2004-08-26 Nec Corp Xml generation device and xml generation program
KR20090011712A (en) * 2007-07-27 2009-02-02 한국전자통신연구원 Machine translation method for pdf file
KR20120077860A (en) * 2010-12-31 2012-07-10 모젼스랩(주) Transformation method of markup data using multi thread
KR20120097548A (en) * 2010-11-24 2012-09-04 한국과학기술정보연구원 Supporting system and method for digital-object-identifier registration

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004240507A (en) 2003-02-03 2004-08-26 Nec Corp Xml generation device and xml generation program
KR20090011712A (en) * 2007-07-27 2009-02-02 한국전자통신연구원 Machine translation method for pdf file
KR20120097548A (en) * 2010-11-24 2012-09-04 한국과학기술정보연구원 Supporting system and method for digital-object-identifier registration
KR20120077860A (en) * 2010-12-31 2012-07-10 모젼스랩(주) Transformation method of markup data using multi thread

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102055407B1 (en) * 2019-06-13 2019-12-12 (주)케이엔랩 Providing method for policy information, Providing system for policy information, and computer program therefor
CN110349620A (en) * 2019-06-28 2019-10-18 广州序科码生物技术有限责任公司 One kind accurately identifying interaction of molecules and its polarity and directionality method from PubMed document
CN110349620B (en) * 2019-06-28 2020-06-19 南方医科大学 Method for accurately identifying molecular interaction and polarity and directionality thereof

Similar Documents

Publication Publication Date Title
US8307012B2 (en) Schema mapping and data transformation on the basis of a conceptual model
US7415482B2 (en) XBRL enabler for business documents
US8972854B2 (en) Graphical creation of a document conversion template
US8234312B2 (en) Schema mapping and data transformation on the basis of layout and content
US7363581B2 (en) Presentation generator
US20040221233A1 (en) Systems and methods for report design and generation
JP2009043258A (en) Method and system for converting data group into structured format
KR101243057B1 (en) An automated input system and method for producing xml full-text of journal articles
WO2006085455A1 (en) Document processing device and document processing method
US20120226967A1 (en) Spreadsheet-Based Graphical User Interface for Modeling of Products Using the Systems Engineering Process
WO2006121051A1 (en) Document processing device and document processing method
US7899846B2 (en) Declarative model editor generation
US20040049739A1 (en) Project structure
WO2005098663A1 (en) Information management device
US8615733B2 (en) Building a component to display documents relevant to the content of a website
KR101243058B1 (en) Xml thesis constructing system and method
US8082496B1 (en) Producing a set of operations from an output description
KR20220083185A (en) An online report creation system using Excel tool
WO2005098698A1 (en) Document processing device
Mandal MultiTes: A knowledge organization thesaurus construction tool for college libraries under the University of Burdwan
Lee Metadata representation and management for context mediation
DeRose What is a diagram, really?
Lange Mathematical semantic markup in a wiki: The roles of symbols and notations
Laclavík et al. Lightweight Semantic Approach for Enterprise Search and Interoperability.
Sperberg-McQueen et al. Igel: Comparing document grammars using XQuery

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160202

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20161228

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180102

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190130

Year of fee payment: 7