KR101321130B1 - Multilingual electronic publishing management system and method thereof - Google Patents
Multilingual electronic publishing management system and method thereof Download PDFInfo
- Publication number
- KR101321130B1 KR101321130B1 KR1020120016414A KR20120016414A KR101321130B1 KR 101321130 B1 KR101321130 B1 KR 101321130B1 KR 1020120016414 A KR1020120016414 A KR 1020120016414A KR 20120016414 A KR20120016414 A KR 20120016414A KR 101321130 B1 KR101321130 B1 KR 101321130B1
- Authority
- KR
- South Korea
- Prior art keywords
- file
- translation
- format
- identifier
- content
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000013519 translation Methods 0.000 claims abstract description 118
- 238000007726 management method Methods 0.000 claims description 57
- 230000009466 transformation Effects 0.000 claims description 3
- 238000000844 transformation Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims 2
- 230000000694 effects Effects 0.000 abstract description 2
- 230000014616 translation Effects 0.000 description 105
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000008676 import Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 2
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/197—Version control
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Machine Translation (AREA)
- Stored Programmes (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 다국어 번역이 필요한 전자 출판물에 관하여 전자 출판을 위한 레이아웃을 유지한 상태에서 효과적으로 내용만 번역하고 이를 관리할 수 있도록 한 다국어 전자 출판 관리 시스템 및 그 관리 방법에 관한 것으로, DTP용 출판물을 다국어로 번역하기 위해 번역 매칭율이 높도록 번역자에게 제공할 파일을 생성하여 제공하고, 번역된 결과물을 별도의 DTP 재작업 없이도 즉시 반영하도록 하여 생산성을 극히 높일 수 있는 효과가 있다. 또한, 번역 대상이 되는 DTP용 출판물 포맷을 직접 이용하여 번역될 컨텐츠만 별도의 식별자를 수정이 불가능한 종류의 태그로 부여하면서 추출하여 번역용 파일로 생성하고, 해당 생성된 번역용 파일에 대한 번역 결과에서 상기 부여된 태그를 기반으로 번역된 컨텐츠를 원본 DTP용 출판물 포맷에 재결합하도록 하여 DTP용 출판물의 컨텐츠만 번역된 내용으로 교체하도록 함으로써 해당 컨텐츠와 결합된 인덱스나 상호참조 등의 복잡한 레이아웃 정보들을 그대로 이용할 수 있는 효과가 있다.The present invention relates to a multilingual electronic publication management system and a method for managing the same, which can effectively translate and manage contents only while maintaining a layout for electronic publication with respect to an electronic publication requiring multilingual translation. In order to translate into a high translation matching rate to create a file to be provided to the translator to provide, and to immediately reflect the translated results without a separate DTP rework, it is possible to increase the productivity extremely. In addition, only the content to be translated using the DTP publication format to be translated directly is extracted while assigning a separate identifier as a tag of a type that cannot be modified to generate a translation file, and the translation result of the generated translation file. Recombines the translated content based on the tag given in the original DTP publication format, and replaces only the contents of the DTP publication with the translated content, thereby maintaining complex layout information such as index or cross-reference combined with the content. There is an effect available.
Description
본 발명은 다국어 전자 출판 관리 시스템 및 그 관리 방법에 관한 것으로, 특히 다국어 번역이 필요한 전자 출판물에 관하여 전자 출판을 위한 레이아웃을 유지한 상태에서 효과적으로 내용만 번역하고 이를 관리할 수 있도록 한 다국어 전자 출판 관리 시스템 및 그 관리 방법에 관한 것이다.
BACKGROUND OF THE
대부분의 오프라인 출판물이나 온라인 출판물이 데스크톱 퍼플리싱(DTP) 소프트웨어를 통해 이루어지고 있으며 다양한 사용자의 요구를 만족시키기 위해서 다양한 기능들이 계속하여 추가되고 있다.Most offline and online publications are made through desktop publishing (DTP) software, and various features are constantly being added to meet the needs of different users.
따라서, 하나의 DTP 출판 결과물은 여러 레이아웃에 대한 정보와 실제 내용인 컨텐츠들에 대한 정보가 서로 영향을 주면서 복잡하게 상호 연동하여 구성되므로 컨텐츠가 달라지게 되면 원하는 출판 결과물을 제공하기 위해 복잡한 DTP 작업을 다시 수행해야한다.Therefore, a single DTP publication output is composed of complex interworking with information on various layouts and information on actual contents, so that complex DTP work can be performed to provide a desired publication output when the contents are changed. Should be done again.
예를 들어, 동일한 형태이나 그 컨텐츠의 언어가 달라지는 다국어 매뉴얼 제작의 경우에는 각 언어별로 DTP 작업을 실시하고 있는 상황이다. 특히, 다국어 번역을 위한 번역 작업이 DTP 작업을 실시하는 작업자와 별개로 이루어지는 경우가 많으며 대부분 전문 번역가나 번역회사에 번역을 의뢰하게 되므로 기준이 되는 DTP 내용을 전문적인 번역가가 사용하는 CAT(Computer-assisted translation) 소프트웨어에서 사용 가능한 형태로 변환하여 제공하며, 이를 받은 번역가는 CAT 소프트웨어를 통해 번역한 결과를 돌려주게 되는데, 번역의 특성상 레이아웃의 변형이 발생하게 되며, 이러한 번역을 위한 공용 파일 변환 과정에서 DTP 결과물 내의 인덱스나 상호참조, 링크 등에 손실이 발생하게 되므로 이렇게 번역된 파일을 다시 DTP 소프트웨어에서 불러들일 경우 상당히 많은 수정이 요구된다.For example, in the case of producing a multilingual manual in which the same form or content of the language is different, DTP work is performed for each language. In particular, the translation work for multilingual translation is often done separately from the workers who perform the DTP work, and most of them are referred to a professional translator or translation company for translation. assisted translation) is provided in the form that can be used in the software, and the translator who receives it returns the translation result through CAT software. Because of the loss of indexes, cross-references, and links in the DTP output, a significant amount of modification is required when the translated file is imported back into the DTP software.
도 1은 일반적인 다국어 매뉴얼 작업을 위한 구성 및 절차를 보인 것으로, 도시한 바와 같이 번역 요청자(주로 DTP 작업자)는 적어도 DTP부(10)를 포함하는 전자 출판 시스템을 구비하며, 좀더 원활한 작업을 위해 해당 시스템에 CAT부(20)를 더 포함할 수 있다. 번역자는 CAT부(30)를 포함하는 번역 시스템을 이용한다. 일반적으로 CAT부(20, 30)는 한번 번역한 내용을 기억하여 후속 번역 시 제시하여 번역 효율성을 높이도록 구성되어 있으므로 각각 데이터베이스(25, 35)를 구비할 수 있다.1 shows a configuration and procedure for a general multilingual manual operation, as shown, a translation requestor (mainly a DTP worker) is provided with an electronic publishing system including at least a
예를 들어, DTP부(10)는 현재 DTP 소프트웨어로 많이 사용되고 있는 어도비(Adobe)사의 인디자인(InDesign)이고, CAT부(20, 30)는 현재 CAT 소프트웨어로 많이 사용되고 있는 에스디엘(SDL)사의 트라도스(Trados)라 가정한다.For example, the
상기와 같은 구성에서, 번역 요청자는 자신이 완성한 기본언어 출판물 원본(1)을 DTP부(10)를 통해서 불러들인 후(과정 ①) 공유가 가능한 형태의 출력 포맷으로 변환한다(과정 ②, ②'). 상기 공유가 가능한 형태의 출력 포맷은 인디자인에서 하위 버전과의 호환성을 위해 공용화 가능한 컴포넌트의 조합으로 출판 내용을 구성한 INX(Indesign Interchange)파일(2)이나 XML(Extensible Markup Language)파일(2')을 이용한다.In the above configuration, the translation requester imports the
번역 요청자는 상기 변환된 출력 포맷 파일(2, 2')을 직접 번역자에게 전달할 수 있고, 도시된 바와 같이 번역 데이터를 수집하여 재활용하기 위해 CAT부(20)를 구비하고 있는 경우라면 CAT부(20)를 통해서 해당 공유 가능한 파일(2, 3)을 불러들여(과정 ③, ③') 이를 CAT부(20, 30)에서 실제 번역시 사용하는 태그 에디터용 다국어 파일 포맷(TTX)로 변환하여 요청 TTX 파일(3)을 생성한다(과정 ④).The translation requester can deliver the converted
번역 요청자는 상기 생성된 요청 TTX 파일(3)을 번역자에게 제공하며, 상기 번역자는 상기 요청 TTX 파일(3)을 CAT부(30)의 태그 에디터를 통해 불러들인다(과정 ⑤). 이후, 상기 번역 요청자는 상기 CAT부(30)의 태그 에디터를 이용하여 번역을 실시하여 최종 번역된 내용이 포함된 번역 TTX파일(4)을 생성한다(과정⑥).The translation requester provides the generated
상기 번역자는 상기 생성된 번역 TTX 파일(4)을 다시 번역 요청자에게 제공한다. 상기 번역 TTX 파일(4)에는 번역된 컨텐츠만을 포함할 수도 있고, 번역을 요청한 컨텐츠도 함께 포함할 수 있으며, 그 상호 관계에 대한 정보도 포함될 수 있다. 한편, 상기 번역자는 일반적으로 상기 번역 TTX 파일(4)외에도 해당 번역을 실시하는 과정에서 얻어진 번역 메모리(TM) 정보나 용어 정보 등도 얻어질 수 있으므로 해당 정보도 함께 제공할 수 있다.The translator provides the generated
상기 번역 요청자는 상기 번역자가 제공하는 번역 TTX 파일(4)을 수신하여 이를 CAT부(20)로 불러들여(과정 ⑦) 이를 다시 DTP부(10)를 통해 출판물로 관리하기 위한 공용 포맷인 INX 파일(2)이나 XML파일(2')로 변환(과정 ⑧, ⑧')한다. 상기 과정 ⑦과 과정 ⑧, ⑧'는 번역 요청자가 CAT부(20)를 구비하지 않은 경우 번역자가 변환하여 제공할 수도 있다.The translation requester receives the
이후, 번역 요청자는 상기 변환된 INX 파일(2)이나 XML 파일(2')을 DTP부(10)로 불러들인다(과정 ⑨, ⑨').Thereafter, the translation requester imports the
상기 DTP부(10)로 불러들인 번역된 공용 파일의 경우 포맷 변경에 의해 내부적인 설정이 다수 변화되고 번역 과정에서 수정된 태그 등에 의해서 상당히 많은 DTP 재작업이 필요하게 된다.In the case of the translated common file imported into the
이러한 DTP 재작업을 마치면 번역된 출판물인 번역 결과(5)를 생성할 수 있다(과정 ⑩).
After this DTP rework, the translated publication (5) can be generated (process iii).
상기와 같은 방식은 현재 다국어 번역을 위해 실질적으로 사용하고 있는 방법으로, 상기 공용 파일 중 INX 파일을 이용하는 경우가 상당한데, CAT부(30)를 통해 번역된 INX파일을 DTP부(10)에서 불러들일 경우 내부적인 설정이 많이 변형되기 때문에 DTP 재작업량이 상당히 많아진다. 더불어 INX 파일이 인디자인의 버전 호환성을 위한 것이라는 점에서 트라도스에서 해당 파일을 임포트(Import)할 경우 번역 매칭율(유사한 이전 번역 결과를 제시할 때 유사한 것으로 판단하는 정도)이 좋지 않아 번역 시간이 오래 걸리는 문제점도 있다. 하지만, 아직도 많은 경우 이러한 방식으로 번역 작업을 실시하고 있는 상황이다. As described above, the present method is actually used for multilingual translation. In this case, the common file uses the INX file, and the INX file translated through the
이러한 문제점을 보완하기 위해 상기 공용 파일 중 XML 파일을 이용하는 경우는 번역 시 메모리 매칭율이 어느 정도 개선되며 이를 다시 인디자인으로 임포트할 경우에도 INX 파일을 이용했을 경우보다는 DTP 작업량이 줄어들기는 하지만, 이 역시 인덱스의 재설정이나 상호참조와 같은 내부 설정들을 처음부터 다시 입력해 주어야하는 번거로움이 있어 소모적인 DTP 작업 시간이 요구된다.
In order to compensate for this problem, when using the XML file among the common files, the memory matching rate is improved to some extent, and when importing it back into InDesign, the amount of DTP work is reduced compared to the case of using the INX file. Also, it is cumbersome to re-enter internal settings such as resetting indexes and cross-referencing from the beginning, which requires time-consuming DTP work.
따라서, 번역자에게 제공하는 번역 요청 파일의 번역 매칭율과 번역된 결과물을 DTP 출판물에 적용했을 때 작업량을 줄일 수 있는 새로운 방식의 다국어 출판물 관리 시스템이 요구되는 실정이다.
Accordingly, there is a need for a new multilingual publication management system that can reduce the amount of work when the translation matching rate of the translation request file provided to the translator and the translated result are applied to the DTP publication.
전술한 문제점을 개선하기 위한 본 발명 실시예들의 목적은 DTP(Desktop Publishing)용 출판물을 다국어로 번역하기 위해 번역 매칭율이 높도록 번역자에게 제공할 파일을 생성하여 제공하고, 번역된 결과물을 별도의 DTP 재작업 없이도 즉시 반영하도록 하여 생산성을 높일 수 있도록 한 다국어 전자 출판 관리 시스템 및 그 관리 방법을 제공하는 것이다. An object of the embodiments of the present invention for improving the above-mentioned problem is to generate and provide a file to provide the translator so that the translation matching rate is high to translate the publication for Desktop Publishing (DTP) in multiple languages, and provide the translated results It is to provide a multilingual e-publish management system and its management method to increase productivity by immediately reflecting without DTP rework.
본 발명 실시예들의 다른 목적은 번역 대상이 되는 DTP용 출판물 포맷을 직접 이용하여 번역될 컨텐츠만 별도의 식별자를 수정이 불가능한 종류의 태그로 부여하면서 추출하여 번역용 파일로 생성하고, 해당 생성된 번역용 파일에 대한 번역 결과에서 상기 부여된 태그를 기반으로 번역된 컨텐츠를 원본 DTP용 출판물 포맷에 재결합하도록 하여 DTP용 출판물의 컨텐츠만 번역된 내용으로 교체하도록 함으로써 해당 컨텐츠와 결합된 인덱스나 상호참조 등의 복잡한 레이아웃 정보들을 그대로 이용할 수 있도록 한 다국어 전자 출판 관리 시스템 및 그 관리 방법을 제공하는 것이다. Another object of the embodiments of the present invention is to directly extract the content to be translated using the DTP publication format to be translated, assigning a separate identifier to a tag of a type that cannot be modified, extracting it, and generating a translation file, and generating the corresponding translation. In the translation result for the file, the content translated based on the above-mentioned tag is recombined into the original DTP publication format so that only the contents of the DTP publication are replaced with the translated contents. The present invention provides a multilingual electronic publication management system and a method of managing the complex layout information.
본 발명 실시예들의 또 다른 목적은 번역된 컨텐츠를 필요에 따라 웹페이지 형태로 즉시 변형할 수 있도록 하여 온라인 출판물이나 HTML 기반 출력물을 용이하게 생성할 수 있도록 한 다국어 전자 출판 관리 시스템 및 그 관리 방법을 제공하는 것이다. Another object of the embodiments of the present invention is to provide a multilingual electronic publication management system and a method for managing the translated content in a web page form as needed so that an online publication or HTML-based output can be easily generated. To provide.
본 발명 실시예들의 또 다른 목적은 번역 컨텐츠와 번역된 컨텐츠에 적용된 식별자를 기반으로 하나의 모듈로 간주하면서 이들의 변형을 추적하여 버전을 관리함으로써 고가의 모듈 관리 시스템을 구축하지 않더라도 용이한 데이터 재활용과 다중 출판이 가능하도록 한 다국어 전자 출판 관리 시스템 및 그 관리 방법을 제공하는 것이다.
Another object of the embodiments of the present invention is to consider the translation content as a module based on the identifier applied to the translated content and track their modifications to manage the version so that data can be easily recycled without building an expensive module management system. To provide a multilingual electronic publishing management system and its management method to enable multiple publications.
상기와 같은 목적을 달성하기 위하여, 본 발명의 일 실시예에 따른 다국어 전자 출판 관리 시스템은 태그를 포함하는 마크업 랭귀지 형태의 전자 출판용 소프트웨어 포맷으로 구성된 원본 출판물 파일을 수신하여 해당 포맷 내용 중 번역될 컨텐츠를 포함하는 영역을 선별한 후, 상기 선별 영역 중 기 설정된 태그에 XSLT(Extensible Stylesheet Language Transformations)를 이용하여 식별자를 부여하면서 해당 선별 영역를 추출하는 식별자 부여부와; 상기 식별자 부여부에 의해 추출된 선별 영역을 번역 요청을 위한 요청 XML 파일로 출력하는 요청 포맷 출력부와; 상기 요청 XML 파일에 대한 번역을 완료한 번역 XML 파일을 수신하는 결과 포맷 수신부와; 상기 결과 포맷 수신부가 제공하는 번역 XML 파일에 포함된 상기 식별자를 XSLT를 이용하여 상기 원본 출판물 포맷의 대응 선별 영역 내용을 치환하거나 식별자가 유지 혹은 유지되지 않은 웹페이지 포맷의 출력물을 생성하는 번역 결과 제공부를 포함하는 것을 특징으로 한다. In order to achieve the above object, a multilingual electronic publication management system according to an embodiment of the present invention receives an original publication file composed of a software format for electronic publishing in the form of a markup language including a tag, and translates the contents in the corresponding format. An identifier assigning unit for selecting a region including content to be extracted and extracting the selected selection region while assigning an identifier to a predetermined tag among the selection regions using XSLT (Extensible Stylesheet Language Transformations); A request format output unit for outputting the selection region extracted by the identifier granter as a request XML file for a translation request; A result format receiver for receiving a translation XML file having completed translation of the request XML file; Providing a translation result for generating an output of a web page format in which the identifier included in the translation XML file provided by the result format receiving unit is replaced with the contents of the corresponding selection area of the original publication format or the identifier is not maintained or maintained using XSLT. It is characterized by including a wealth.
상기 마크업 랭귀지 형태의 전자 출판용 소프트웨어 포맷은 인디자인 마크업 랭귀지(IDML)인 것을 특징으로 한다. The markup language type of electronic publishing software format is characterized in that the InDesign Markup Language (IDML).
상기 식별자 부여부는 상기 IDML 포맷의 출판물 파일에 포함된 스토리 파일 중 적어도 일부를 번역될 컨텐츠를 포함하는 영역으로 선별하는 스토리 파일 추출부를 포함하는 것을 특징으로 한다. The identifier assigning unit may include a story file extracting unit which selects at least a part of the story file included in the publication file in the IDML format as an area including the content to be translated.
상기 식별자 부여부의 스토리 파일 추출부는 XSLT를 이용하여 상기 스토리 파일에 포함된 ParagraphStyleRange 태그마다 GUID(Global Unique ID)를 부여하는 것을 특징으로 한다.The story file extracting unit of the identifier assigning unit may assign a GUID (Global Unique ID) to each ParagraphStyleRange tag included in the story file using XSLT.
상기 식별자 부여부의 스토리 파일 추출부는 스토리 파일에 포함된 개별 content 태그에도 식별자를 부여하는 것을 특징으로 한다. The story file extracting unit of the identifier assigning unit may assign an identifier to an individual content tag included in the story file.
상기 식별자 부여부나 상기 요청 포맷 출력부는 상기 추출된 스토리 파일이 속하는 IDML 파일에 대한 정보를 신규 태그로 추가하는 것을 특징으로 한다. The identifier providing unit or the request format output unit adds information about an IDML file to which the extracted story file belongs as a new tag.
상기 식별자 부여부가 부여한 식별자를 기준으로 번역될 컨텐츠와 상기 결과 포맷 수신부를 통해 수신된 번역된 컨텐츠를 모듈화하여 버전을 부여하면서 데이터베이스에 저장하고, 요청에 따라 상기 모듈을 상기 데이터베이스에서 출납하며 버전을 갱신하는 CCM(Component Content Manager)을 더 포함하는 것을 특징으로 한다.Based on the identifier given by the identifier assigning unit, the content to be translated and the translated content received through the result format receiving unit are modularized and stored in a database while assigning a version, and withdrawing the module from the database and updating the version as requested. Characterized in that it further comprises a Component Content Manager (CCM).
상기 CCM은 전자 출판용 소프트웨어나 CAT(Computer-assisted translation) 소프트웨어와 연동하는 것을 특징으로 한다.The CCM is characterized in that it works with electronic publishing software or CAT (Computer-assisted translation) software.
상기 다국어 전자 출판 관리 시스템의 적어도 일부는 웹 어플리케이션으로 구성되는 것을 특징으로 한다.At least a part of the multilingual electronic publication management system is configured as a web application.
본 발명의 다른 실시예에 따른 다국어 전자 출판 관리 방법은 전자 출판 소프트웨어와 번역 소프트웨어와 연동하는 다국어 전자 출판 관리 시스템에서 실시되는 다국어 전자 출판 관리 방법으로서, 태그를 포함하는 마크업 랭귀지 형태의 전자 출판용 소프트웨어 포맷으로 구성된 원본 출판물 파일을 수신하여 해당 포맷 내용 중 번역될 컨텐츠를 포함하는 영역을 선별한 후, 상기 선별 영역 중 기 설정된 태그에 XSLT를 이용하여 식별자를 부여하면서 해당 선별 영역를 추출하는 식별자 부여 단계와; 상기 식별자 부여부에 의해 추출된 선별 영역을 번역 요청을 위한 요청 XML 파일로 출력하는 요청 포맷 출력 단계와; 상기 요청 XML 파일에 대한 번역을 완료한 번역 XML 파일을 수신하는 결과 포맷 수신 단계와; 상기 결과 포맷 수신부가 제공하는 번역 XML 파일에 포함된 상기 식별자를 XSLT를 이용하여 상기 원본 출판물 포맷의 대응 선별 영역 내용을 치환하거나 식별자가 유지 혹은 유지되지 않은 웹페이지 포맷의 출력물을 생성하는 번역 결과 제공 단계를 포함하는 것을 특징으로 한다.
The multilingual electronic publication management method according to another embodiment of the present invention is a multilingual electronic publication management method implemented in a multilingual electronic publication management system interoperating with electronic publishing software and translation software, and for markup language type electronic publications including tags. Receiving an original publication file composed of a software format to select the region containing the content to be translated among the contents of the format, the identifier assignment step of extracting the selected region while assigning an identifier to the predetermined tag of the selected region using XSLT Wow; A request format output step of outputting a selection region extracted by the identifier granter as a request XML file for a translation request; A result format receiving step of receiving a translation XML file having completed translation on the request XML file; Providing a translation result for generating an output of a web page format in which the identifier included in the translation XML file provided by the result format receiving unit is replaced with the contents of the corresponding selection area of the original publication format or the identifier is not maintained or maintained using XSLT. Characterized in that it comprises a step.
본 발명 실시예에 따른 다국어 전자 출판 관리 시스템 및 그 관리 방법은 DTP용 출판물을 다국어로 번역하기 위해 번역 매칭율이 높도록 번역자에게 제공할 파일을 생성하여 제공하고, 번역된 결과물을 별도의 DTP 재작업 없이도 즉시 반영하도록 하여 생산성을 높일 수 있는 효과가 있다.The multilingual electronic publication management system and its management method according to an embodiment of the present invention generate and provide a file to be provided to the translator so that the translation matching rate is high so as to translate the publication for DTP into a multilingual language, and provide the translated result as a separate DTP material. It is effective to increase productivity by reflecting immediately without work.
본 발명 실시예에 따른 다국어 전자 출판 관리 시스템 및 그 관리 방법은 번역 대상이 되는 DTP용 출판물 포맷을 직접 이용하여 번역될 컨텐츠만 별도의 식별자를 수정이 불가능한 종류의 태그로 부여하면서 추출하여 번역용 파일로 생성하고, 해당 생성된 번역용 파일에 대한 번역 결과에서 상기 부여된 태그를 기반으로 번역된 컨텐츠를 원본 DTP용 출판물 포맷에 재결합하도록 하여 DTP용 출판물의 컨텐츠만 번역된 내용으로 교체하도록 함으로써 해당 컨텐츠와 결합된 인덱스나 상호참조 등의 복잡한 레이아웃 정보들을 그대로 이용할 수 있는 효과가 있다.The multilingual electronic publication management system and management method thereof according to an embodiment of the present invention extracts only the content to be translated using a DTP publication format to be translated directly while assigning a separate identifier to a tag of a type that cannot be modified to translate the file. And convert the content translated based on the tag given in the translation result of the generated translation file into the original DTP publication format so that only the contents of the DTP publication are replaced with the translated content. Complex layout information such as index and cross reference combined with can be used as it is.
본 발명 실시예에 따른 다국어 전자 출판 관리 시스템 및 그 관리 방법은 번역된 컨텐츠를 필요에 따라 웹페이지 형태로 즉시 변형할 수 있도록 하여 온라인 출판물이나 HTML 기반 출력물을 용이하게 생성할 수 있는 효과가 있다.The multilingual electronic publication management system and its management method according to an embodiment of the present invention can easily transform the translated content into a web page form as needed to easily generate an online publication or an HTML-based output.
본 발명 실시예에 따른 다국어 전자 출판 관리 시스템 및 그 관리 방법은 번역 컨텐츠와 번역된 컨텐츠에 적용된 식별자를 기반으로 하나의 모듈로 간주하면서 이들의 변형을 추적하여 버전을 관리함으로써 고가의 모듈 관리 시스템을 구축하지 않더라도 용이한 데이터 재활용과 다중 출판이 가능한 효과가 있다.
The multilingual electronic publication management system and its management method according to an embodiment of the present invention are considered to be a module based on the translated content and the identifier applied to the translated content, and the modified module is managed by tracking the version of the expensive module management system. Even if it is not built, there is an effect of easy data recycling and multiple publishing.
도 1은 종래 다국어 전자 출판을 위한 절차를 보인 개념도.
도 2는 본 발명의 실시예에 따른 다국어 전자 출판 관리 시스템의 구성을 보인 블록도.
도 3은 마크업 랭귀지 형태의 전자 출판용 소프트웨어 포맷(IDML)의 구성을 보인 개념도.
도 4는 IDML의 스토리 파일의 예를 보인 예시도.
도 5는 도 4의 IDML 스토리 파일의 표현 예를 보인 예시도.
도 6은 본 발명의 실시예에 따라 식별자가 부여된 IDML의 스토리 파일의 예를 보인 예시도.
도 7은 본 발명의 실시예에 따른 요청 XML파일을 번역하는 과정을 보인 태그 에디터의 화면 예시도.
도 8은 본 발명의 실시예 따른 CCM(Component Content Manager)의 동작 방식을 설명하기 위한 개념도.1 is a conceptual diagram showing a procedure for a conventional multilingual electronic publishing.
Figure 2 is a block diagram showing the configuration of a multilingual electronic publishing management system according to an embodiment of the present invention.
FIG. 3 is a conceptual diagram showing the configuration of a markup language-type electronic publishing software format (IDML). FIG.
4 is an exemplary view showing an example of a story file of IDML.
5 is an exemplary view showing an example of representation of the IDML story file of FIG.
6 is an exemplary view showing an example of a story file of IDML to which an identifier is assigned according to an embodiment of the present invention.
7 is an exemplary screen diagram of a tag editor showing a process of translating a request XML file according to an embodiment of the present invention.
8 is a conceptual diagram illustrating an operation method of a component content manager (CCM) according to an embodiment of the present invention.
상기한 바와 같은 본 발명을 첨부된 도면들과 실시예들을 통해 상세히 설명하도록 한다. BRIEF DESCRIPTION OF THE DRAWINGS The above and other objects, features and advantages of the invention will become more apparent from the following detailed description of the present invention when taken in conjunction with the accompanying drawings.
도 2는 본 발명의 실시예에 따른 다국어 전자 출판 관리 시스템(100)의 구성을 보인 블록도로서, 본 발명의 실시예에서 상기 다국어 전자 출판 관리 시스템(100)은 DTP(Desktop Publishing) 소프트웨어와 CAT(Computer-assisted translation) 소프트웨어와 연동 되도록 구성될 수 있으며, 필요한 경우 독립형태로 구성될 수도 있다. 한편, 최근 전자 출판은 HTML등의 온라인 출판 등을 포함하며, 효율적인 관리를 위해 웹서버에서 동작하는 웹 서비스 형태의 전자 출판 관리가 이루어지기도 한다. 따라서, 상기 DTP 소프트웨어와 CAT 소프트웨어와 연동하여 다국어 전자 출판을 관리하는 상기 시스템(100)은 적어도 일부가 데이터페이스 연동 웹어플리케이션 형태로 구성될 수 있다. 이러한 웹서비스 방식의 전자출판 관리 시스템은 필요에 따라 DTP 기능을 구비하거나 CAT 기능을 구비할 수도 있으며, 개별적인 DTP 소프트웨어나 CAT 소프트웨어와 더 긴밀하게 연동할 수도 있다.2 is a block diagram showing a configuration of a multilingual electronic
본 발명의 실시예에서 상기 도시된 다국어 출판 관리 시스템(100)을 설명하면서 언급하는 DTP 소프트웨어로 널리 알려져 있는 인디자인(InDesign)을 예로 들어 설명하지만 인디자인과 유사한 파일 포맷을 가진 다른 종류의 DTP 소프트웨어에도 유사하게 적용될 수 있다는 것에 유의한다. InDesign, which is widely known as the DTP software mentioned while explaining the multilingual
먼저, 도시된 다국어 출판 관리 시스템(100)은 DTP 소프트웨어를 통해서 생성된 기본 언어의 원본 DTP 출판물 포맷(인디자인의 고유 포맷인 IDML(InDesign Markup Language)포맷)의 파일(201)을 번역을 위해 CAT의 태그 에디터가 인식 가능한 공유가능 파일(XML이나 INX)로 변형하지 않고 그 포맷의 파일(201)을 그대로 수신하여 해당 포맷을 유지한 상태에서 번역이 필요한 컨텐츠만 선별 추출하여 추출된 컨텐츠만 CAT의 태그 에디터가 인식 가능한 공용 포맷 파일인 요청 XML 파일(211)로 변환하여 제공하고, 상기 요청 XML 파일(211)을 CAT 소프트웨어를 통해 번역한 번역 XML 파일(221)을 수신하여 해당 번역된 공용 포맷의 컨텐츠를 상기 원본 DTP 출판물 포맷(IDML)의 파일에 통합한 다국어 DTP 출판물 포맷의 파일(231)을 생성하는 것으로 해당 포맷에 정의된 각종 인덱스, 상호 참조, 레이아웃 등의 출판을 위한 각종 설정이 그대로 유지되도록 한다. 즉, 번역 후 DTP 재작업이 필요하지 않으며, 필요하더라도 기존 방식과 비교가 어려울 정도로 간단한 정도에 불과하게 된다.First, the illustrated multilingual
이러한 방식의 동작을 위해서 본 발명의 실시예에 따른 상기 다국어 출판 관리 시스템(100)은 IDML파일의 구조적 특징을 고려하여 컨텐츠 영역을 구분 및 추출하면서 추출 컨텐츠에 대해 고유 식별자(GUID:Global Unique ID)를 부여한다. 상기 고유 식별자의 부여는 CAT 소프트웨어의 태그 에디터에서 수정이 불가능한 상태로 구분이 가능한 컨텐츠 관련 태그에 고유 식별자를 부여하는 방식이 이용될 수 있다. In order to operate in this manner, the multilingual
상기 다국어 출판 관리 시스템(100)은 이렇게 고유 식별자가 부여된 컨텐츠를 요청 XML 파일(211)로 제공하며, 상기 요청 XML 파일(211)을 번역한 번역 XML 파일(221)을 수신하여 해당 번역 XML 파일(221)에 유지되는 GUID를 기준으로 원본 IDML 파일의 내용을 치환하는 것으로 번역 통합 IDML 파일(231)을 생성할 수 있다. The multilingual
한편, 이러한 과정에서 상기 다국어 출판 관리 시스템(100)은 상기 번역 XML 파일(221)의 내용을 HTML 등의 웹페이지로 변환하는 작업을 더 수행할 수 있으며, 상기 GUID를 기반으로 다국어 번역 컨텐츠를 하나의 모듈로 간주하여 이를 재활용하거나 이를 통해 다중 출판이 가능하도록 관리할 수도 있다.Meanwhile, in this process, the multilingual
상기 설명한 동작을 위한 본 발명의 실시예에 따른 다국어 출판 관리 장치(100)의 구성 블럭도를 살펴보면, 우선 복수의 XML 형태의 파일들을 포함하는 고유한 마크업 랭귀지 형태의 원본 DTP 파일 포맷(IDML)의 원본 IDML 파일(201)을 수신하여 해당 원본 IDML 파일(201)에 포함된 스토리 파일 중 적어도 일부를 번역 대상 컨텐츠로 추출하면서 해당 컨텐츠에 포함된 기 설정된 태그에 XSLT(Extensible Stylesheet Language Transformations)를 이용하여 GUID를 부여하는 GUID 부여부(110)와, 상기 GUID 부여부(110)에 의해 추출된 스토리 파일을 번역 요청을 위한 요청 XML 파일(211)로 출력하는 요청 포맷 출력부(120)와, 상기 요청 XML 파일(211)에 대한 번역을 완료한 번역 XML 파일(221)을 수신하는 결과 포맷 수신부(160)와, 상기 결과 포맷 수신부(160)가 제공하는 번역 XML 파일에 포함된 상기 GUID를 XSLT를 이용하여 상기 원본 IDML 파일의 대응 선별 영역 내용을 치환하여 번역 통합 IDML 파일(231)을 제공하거나 GUID가 유지 혹은 유지되지 않은 웹페이지 포맷의 출력물(232)을 생성하는 번역 결과 제공부(150)를 기본적으로 구비한다. 한편, 상기 GUID 부여부(110)와 상기 번역 결과 제공부(150)에서 GUID를 부여하고 이를 기반으로 치환을 수행하는 XSLT는 별도의 XSLT부(130)로 구성될 수 있으며 필요에 따라 해당 기능은 상기 GUID 부여부(110)나 번역 결과 제공부(150) 내에 포함될 수도 있다. Referring to the block diagram of the multi-language
상기 번역 결과 제공부(150)는 내부적으로 번역 XML 파일(221)에 포함된 GUID를 기반으로 원본 IDML 파일의 대응 위치 컨텐츠를 번역된 컨텐츠로 치환하거나, 다국어로 통합하는 IDML 통합부(151)와, 필요에 따라 상기 번역 XML 파일(221)을 HTML, SGML, XML 등의 다양한 xML 형태의 웹페이지로 변환하여 출력하는 웹페이지 변환부(152)를 구비할 수 있다. The translation
한편, 상기 각 기능부는 각 기능의 요청에 따라 동작하도록 함으로써 별도의 제어부나 관리부가 필요하지 않을 수도 있으나, 통합적 관리를 위해서 해당 다국어 출판 관리 시스템에 대한 사용자 인증, 접속 관리 및 다양한 부가 기능 활용을 위해 상기 GUID 부여부(110), 요청 포맷 출력부(120), XSLT부(130), 결과 포맷 수신부(160), 번역 결과 제공부(150)의 동작을 관리하고 그 결과를 수신하는 제어부(140)를 더 포함할 수 있다.On the other hand, each function unit may operate according to a request of each function, but a separate control unit or a management unit may not be necessary, but for the purpose of integrated management for user authentication, access management and various additional functions for the multilingual publication management system.
더불어, 상기 다국어 출판 관리 시스템(100)은 내부적으로 상기 GUID 부여부(110)가 부여한 GUID를 기준으로 번역될 컨텐츠와 상기 결과 포맷 수신부(160)를 통해 수신된 번역된 컨텐츠를 모듈화하여 버전을 부여하면서 데이터베이스(180)에 저장하고, 요청에 따라 상기 모듈을 상기 데이터베이스(180)에서 출납하며 버전을 갱신하는 CCM(Component Content Manager)(170)을 더 포함할 수 있다. 이를 통해서 모듈화된 번역 내용을 후속 차분 번역의 자료로 활용하거나 다중 출판 등에 활용할 수 있는 등 모듈 컴포넌트화된 컨텐츠를 다양하게 활용할 수 있게 되므로 고가의 별도 컨텐츠 관리 시스템(CMS)을 구성하지 않더라도 출판 자원을 효율적으로 이용할 수 있게 된다.
In addition, the multilingual
결국, 상기 다국어 출판 관리 시스템(100)은 번역을 의뢰하는 번역 의뢰인이 활용하여 기존과 같은 방식으로 번역자에게 의뢰할 수 있고, 번역자가 번역 의뢰인으로부터 IDML 파일 자체를 수신하여 이를 상기 다국어 출판 관리 시스템(100)을 활용하여 다국어 IDML 파일을 납품할 수도 있다. 또한, 다국어 출판과 번역자를 모두 관리하는 업체인 경우 상기 다국어 출판 관리 시스템(100)을 활용하여 업무 효율을 극대화할 수도 있다. 따라서, 상기 다국어 출판 관리 시스템(100)은 로컬 소프트웨어로 구성될 수도 있으나 그 효율적 적용을 위해서는 데이터베이스 연동 웹어플리케이션으로 구성되어 웹 로그인을 통해 사용할 수 있는 서비스로 구현되는 것이 바람직하다.
As a result, the multilingual
다국어 번역 Multilingual Translation 실시예Example
상기 설명한 본 발명 실시예의 구성을 통해서 다국어 출판물을 관리하는 예를 도 3 내지 도 7을 통해 설명하도록 한다. An example of managing a multilingual publication through the configuration of the embodiment of the present invention described above will be described with reference to FIGS. 3 to 7.
먼저, GUID 부여부(110)는 원본 IDML 파일(201)을 수신하여 해당 IDML 파일(201)의 내용 중 스토리 파일을 번역할 컨텐츠 영역으로 추출하면서 기 설정된 태그에 GUID를 부여하게 된다. First, the
도 3은 마크업 랭귀지 형태의 전자 출판용 소프트웨어 포맷의 일종인 IDML의 구성을 보인 개념도로서, 도시한 바와 같이 IDML 파일 포맷(310)은 내부적으로 그 데이터 형식을 정의하는 MIMETYPE 정보(311), 디자인맵에 대한 XML(312), 각종 리소스에 대한 정보를 XML 파일로 정의하는 리소스 영역(313), 각종 스프레드에 대한 정보를 XML 파일로 정의하는 스프레드 영역(314), 실제 컨텐츠에 해당하는 스토리 XML 파일들인 스토리 영역(315), XML로 기능하기 위한 설정 정보들을 가지는 XML 영역(316), 마스터 스프레드(317) 및 메타 정보(318)로 이루어진다. 3 is a conceptual diagram showing the configuration of IDML, which is a kind of markup language format for electronic publishing software. As shown, the
최근 DTP 소프트웨어는 기본적으로 스트립트 언어로 이루어지며, 이를 효율적으로 체계화하기 위해 XML을 이용하기 때문에 DTP 소프트웨어의 고유 포맷 역시 도시한 바와 같이 마크업 랭귀지 형태를 가지게 되므로 비단 IDML 뿐만 아니라 다른 종류의 DTP 고유 포맷도 유사한 형태를 가지는 것이 일반적이다. Recently, DTP software is basically written in a scripting language, and since XML is used to efficiently organize it, the native format of DTP software also has a markup language form as shown, thus not only IDML but other DTP native formats. It is also common to have a similar form.
따라서, 상기 GUID 부여부(110)는 이러한 DTP 고유 포맷에서 출판에 관련된 다양한 설정 관련 내용들은 유지한 상태에서 실제 컨텐츠를 가지는 스토리 파일(314)을 추출하면서 상기 스토리 파일의 각 컨텐츠마다 GUID를 부여한다. 필요한 경우 내부적으로 사용될 추가적인 식별자를 더 부여할 수도 있다. Accordingly, the
도 4는 IDML의 스토리 파일의 일부 내용을 예를 보인 예시도로서, 도시한 바와 같이 스토리 파일(320)의 내부 소스를 보면 XML 형태의 각종 태그를 가지는 컨텐츠가 존재함을 확인할 수 있다. 4 is an exemplary view showing some contents of a story file of IDML. As shown in FIG. 4, it can be seen that contents having various tags in XML form exist when looking at the internal source of the
도시된 구성은 원본 언어로 영어를 사용한 것이며, 메뉴얼의 일부임을 알 수 있다. The illustrated configuration uses English as the original language and can be seen as part of the manual.
도시된 스토리 파일의 구성을 보면, 내부적으로 번역이 이루어질 각 컨텐츠의 단락(321~323)을 태그 <ParagraphStyleRange> </ParagraphStyleRange>가 구분하고 있음을 알 수 있다. Looking at the structure of the illustrated story file, it can be seen that the tags <ParagraphStyleRange> </ ParagraphStyleRange> classify
상기 도시된 스토리 파일은 실질적으로 인디자인으로 보면 도 5와 같은 화면(330)으로 표현된다. 여기서, 도 4의 각 단락(321, 322, 323)은 도 5에서 3종류의 서로 다른 표현(331)으로 나타난다.The illustrated story file is substantially represented by the
따라서, 이러한 각 단락들을 각각 달리 구분되어야 하므로 본 발명의 실시예에 따른 GUID 부여부(110)는 원본 IDML 파일에서 스토리 파일을 선별 추출하면서 XSLT부(130)를 통해 상기 <ParagraphStyleRange> 태그에 GUID를 부여한다. 상기 XSLT는 XML을 원하는 포맷이나 형태로 변환하는 방법 중 하나로 알려져 있는 것이므로 그에 대한 상세한 설명은 생략한다. Therefore, since each of these paragraphs should be distinguished from each other, the
더불어, 상기 GUID 부여부(110)나 상기 요청 포맷 출력부(120)는 해당 스토리 파일이 속하는 IDML 파일에 대한 정보를 신규 태그로 추가하여 번역을 요청하는 요청 XML이나 번역 XML의 원본 IDML이 어떠한 것인지 확인할 수 있도록 하는 것이 바람직하다.In addition, the
도 6은 본 발명의 실시예에 따라 식별자가 부여된 IDML의 스토리 파일의 예를 보인 예시도로서, 도시한 바와 같이 도 4의 스토리 파일을 요청 XML 형태로 변환한 결과의 예로서, 상기 GUID 부여부(110)에 의해 GUID를 부여한 후 요청 포맷 출력부(120)에 의해 출력된 요청 XML 파일(211)의 소스 중 일부(340)를 보인 것이다.FIG. 6 is an exemplary diagram illustrating an example of a story file of IDML to which an identifier is assigned according to an embodiment of the present invention. As illustrated, the GUID unit is an example of a result of converting the story file of FIG. 4 into a request XML form. After granting the GUID according to whether or not 110, some of the
먼저 해당 스토리 파일이 원래 속하는 IDML 파일에 대한 정보를 신규 태그(341)로 추가하였으며, 각 <ParagraphStyleRange> 태그에는 GUID가 부여(342, 343, 344)되었음을 알 수 있다. First, information about an IDML file to which a corresponding story file originally belongs was added as a
필요한 경우 각 <ParagraphStyleRange></ParagraphStyleRange> 태그 내의 각 문장별 컨텐츠 태그인 <content> 태그에 추가적인 식별자(로컬 식별자)를 부여할 수도 있다. If necessary, an additional identifier (local identifier) may be assigned to a <content> tag, which is a content tag for each sentence in each <ParagraphStyleRange> </ ParagraphStyleRange> tag.
이후, 번역자는 상기 요청 XML 파일(211)을 CAT 소프트웨어의 태그 에디터(본 발명의 실시예에서는 트라도스의 태그 에디터)로 불러들여 이를 번역하게 되는데, 상기 <ParagraphStyleRange> 태그는 일반적으로 수정이 금지되도록 설정되므로 번역 중 표현을 위한 태그들이 다소 변형되더라도 GUID 할당 내용은 안전하게 유지된다.Thereafter, the translator imports the
도 7은 트라도스의 태그 에디터의 번역 화면(350) 예를 보인 것이다. 7 shows an example of the
도시된 바와 같이 태그 에디터에서 GUID가 부여된 <ParagraphStyleRange> 태그는 보이지 않으며 수정도 불가능하다.As shown, the <ParagraphStyleRange> tag with a GUID is not visible in the tag editor and cannot be modified.
이렇게 태그 에디터를 통해서 원본에 대한 번역이 이루어지면 해당 번역 내용만을 번역 XML 파일(221)로 생성할 수 있고, 원본 내용도 포함하는 이중언어(bilingual) 파일을 만들 수 있으며, 이들에 대한 상호 관계 정보도 포함시킬 수 있다. When the translation of the original is made through the tag editor, only the corresponding translation can be generated as a
한편, 도시하지는 않았으나 이러한 번역에 사용한 번역 메모리(TM)나 용어 정보 등도 상기 번역 XML 파일(221)과 함께 제공될 수 있으며 이들은 IDML별이거나 해당 GUID가 속하는 정보로 CCM(170)에 의해 데이터베이스(180)에 등록되어 재활용될 수 있다. Although not shown, translation memory (TM) or terminology information used for such translation may also be provided with the
이렇게 번역된 번역 XML 파일(221)은 결과 포맷 수신부(160)를 통해 수신되어 GUID를 기준으로 원본 컨텐츠와 모듈화되어 CCM(170)이 관리하며, 상기 수신된 번역 XML 파일(221)은 번역 결과 제공부(150)에 제공되어 IDML 통합부(151)가 원본 IDML 파일에 GUID를 기준으로 번역된 내용을 기존 내용(즉, 기존 스토리 파일의 각 단락)과 치환하거나 더 추가하여 번역 통합 IDML 파일(231)을 생성한다. 물론, 번역 내용을 통합하는 방식은 더 다양할 수 있으며, 필요에 따라 변형될 수도 있으나 GUID를 기준으로 번역 내용을 반영한다는 방법론에 의해 용이하게 수행될 수 있다.The translated
한편, 상기 번역 결과 제공부(150)는 웹페이지 변환부(152)를 통해 상기 번역된 XML파일의 각 스토리 파일들을 각각 개별적인 웹페이지로 변환할 수 있으며, 이렇게 변환하더라도 GUID를 기준으로 재활용할 수 있다. 물론, 변환 시 GUID를 제거할 수도 있다.
Meanwhile, the translation
도 8은 본 발명의 실시예 따른 CCM(Component Content Manager)의 동작 방식을 설명하기 위한 개념도로서, 상기 CCM(170)은 상기 번역된 XML 파일을 수신하는 경우 원본과 번역 내용을 단락별로 하나의 모듈로 만들어 버전을 부여하여 데이터베이스(180)에 저장하며, DTP 소프트웨어나 CAT 소프트웨어 혹은 사용자의 요청에 의해 해당 모듈을 제공하며, 수정이 있는 경우 수정 수신된 모듈은 버전을 높여 저장하여 출납과 버전 관리를 실시한다.FIG. 8 is a conceptual diagram illustrating an operation method of a component content manager (CCM) according to an embodiment of the present invention. When the
이렇게 CCM(170)에 의해 번역 내용을 단락 단위로 모듈화한 후 GUID와 해당 내용의 해쉬(hash)값, 버전 값 등으로 관리하면 용이한 검색과 재사용이 가능하므로 이를 통해 표준 문장 유출, 차분 번역 또는 특정 단어의 다국어 자동 매치, 다중 출판 등에 폭넓게 활용할 수 있다.
After the translation is modularized by the
이상에서는 본 발명에 따른 바람직한 실시예들에 대하여 도시하고 또한 설명하였다. 그러나 본 발명은 상술한 실시예에 한정되지 아니하며, 특허 청구의 범위에서 첨부하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능할 것이다. The foregoing and other objects, features and advantages of the present invention will become more apparent from the following detailed description of the present invention when taken in conjunction with the accompanying drawings. However, the present invention is not limited to the above-described embodiments, and various changes and modifications may be made by those skilled in the art without departing from the scope of the present invention. .
100: 다국어 출판 관리 시스템 110: GUID 부여부
120: 요청 포맷 출력부 130: XSLT부
140: 제어부 150: 번역결과 제공부
160: 결과 포맷 수신부 170: CCM
180: 데이터베이스 201: 원본 IDML 파일
211: 요청 XML 파일 221: 번역 XML 파일
231: 번역 통합 IDML 파일 232: 웹페이지100: multilingual publishing management system 110: granting GUID
120: request format output unit 130: XSLT unit
140: control unit 150: translation result providing unit
160: result format receiving unit 170: CCM
180: Database 201: Source IDML File
211: Request XML File 221: Translation XML File
231: Translation Integration IDML File 232: Web Page
Claims (18)
상기 식별자 부여부에 의해 추출된 선별 영역을 번역 요청을 위한 요청 XML 파일로 출력하는 요청 포맷 출력부와;
상기 요청 XML 파일에 대한 번역을 완료한 번역 XML 파일을 수신하는 결과 포맷 수신부와;
상기 결과 포맷 수신부가 제공하는 번역 XML 파일에 포함된 상기 식별자를 XSLT를 이용하여 상기 원본 출판물 포맷의 대응 선별 영역 내용을 치환하거나 식별자가 유지 혹은 유지되지 않은 웹페이지 포맷의 출력물을 생성하는 번역 결과 제공부를 포함하며,
상기 마크업 랭귀지 형태의 전자 출판용 소프트웨어 포맷은 인디자인 마크업 랭귀지(IDML)이며, 상기 식별자 부여부는 상기 IDML 포맷의 출판물 파일에 포함된 스토리 파일 중 적어도 일부를 번역될 컨텐츠를 포함하는 영역으로 선별하는 스토리 파일 추출부를 포함하며, 상기 식별자 부여부의 스토리 파일 추출부는 XSLT를 이용하여 상기 스토리 파일에 포함된 ParagraphStyleRange 태그마다 GUID(Global Unique ID)를 부여하는 것을 특징으로 하는 다국어 전자 출판 관리 시스템.
Receives an original publication file composed of a software format for electronic publishing in the form of a markup language including a tag, selects an area including the content to be translated among the contents of the format, and then sets an XSLT (Extensible Stylesheet) to a preset tag among the selected areas. An identifier assigning unit configured to extract a selected region while assigning an identifier using Language Transformations;
A request format output unit for outputting the selection region extracted by the identifier granter as a request XML file for a translation request;
A result format receiver for receiving a translation XML file having completed translation of the request XML file;
Providing a translation result for generating an output of a web page format in which the identifier included in the translation XML file provided by the result format receiving unit is replaced with the contents of the corresponding selection area of the original publication format or the identifier is not maintained or maintained using XSLT. Includes wealth,
The markup language type of electronic publishing software format is InDesign Markup Language (IDML), and the identifier providing unit selects at least a part of the story file included in the publication file in the IDML format as an area including the content to be translated. And a story file extracting unit, wherein the story file extracting unit of the identifier assigning unit assigns a Global Unique ID (GUID) to each ParagraphStyleRange tag included in the story file using XSLT.
The multilingual electronic publication management system of claim 1, wherein the story file extracting unit of the identifier providing unit assigns an identifier to individual content tags included in the story file.
The multilingual electronic publication management system of claim 1, wherein the identifier providing unit or the request format output unit adds information about an IDML file to which the extracted story file belongs as a new tag.
The method of claim 1, wherein the content to be translated and the translated content received through the result format receiving unit are modularized and stored in a database while assigning a version, and the module is stored in the database according to a request. Multilingual electronic publication management system, characterized in that it further comprises a component content manager (CCM) to update the version.
8. The system of claim 7, wherein the CCM is interoperable with electronic publishing software or computer-assisted translation software.
The system of claim 1, wherein at least a portion of the multilingual electronic publication management system comprises a web application.
태그를 포함하는 마크업 랭귀지 형태의 전자 출판용 소프트웨어 포맷으로 구성된 원본 출판물 파일을 수신하여 해당 포맷 내용 중 번역될 컨텐츠를 포함하는 영역을 선별한 후, 상기 선별 영역 중 기 설정된 태그에 XSLT를 이용하여 식별자를 부여하면서 해당 선별 영역를 추출하는 식별자 부여 단계와;
상기 식별자 부여부에 의해 추출된 선별 영역을 번역 요청을 위한 요청 XML 파일로 출력하는 요청 포맷 출력 단계와;
상기 요청 XML 파일에 대한 번역을 완료한 번역 XML 파일을 수신하는 결과 포맷 수신 단계와;
상기 결과 포맷 수신부가 제공하는 번역 XML 파일에 포함된 상기 식별자를 XSLT를 이용하여 상기 원본 출판물 포맷의 대응 선별 영역 내용을 치환하거나 식별자가 유지 혹은 유지되지 않은 웹페이지 포맷의 출력물을 생성하는 번역 결과 제공 단계를 포함하며,
상기 마크업 랭귀지 형태의 전자 출판용 소프트웨어 포맷은 인디자인 마크업 랭귀지(IDML)이며, 상기 식별자 부여 단계는 상기 IDML 포맷의 출판물 파일에 포함된 스토리 파일 중 적어도 일부를 번역될 컨텐츠를 포함하는 영역으로 선별하는 스토리 파일 추출 단계를 더 포함하며, 상기 스토리 파일 추출 단계는 XSLT를 이용하여 상기 스토리 파일에 포함된 ParagraphStyleRange 태그마다 GUID를 부여하는 것을 특징으로 하는 다국어 전자 출판 관리 방법.
A multilingual electronic publishing management method implemented in a multilingual electronic publishing management system that interworks with electronic publishing software and translation software.
Receiving an original publication file composed of a software format for electronic publishing in the form of markup language including a tag, selecting an area including the content to be translated among the contents of the format, and using XSLT to a predetermined tag among the selected areas An identifier assigning step of extracting the selected selection area while assigning an identifier;
A request format output step of outputting a selection region extracted by the identifier granter as a request XML file for a translation request;
A result format receiving step of receiving a translation XML file having completed translation on the request XML file;
Providing a translation result for generating an output of a web page format in which the identifier included in the translation XML file provided by the result format receiving unit is replaced with the contents of the corresponding selection area of the original publication format or the identifier is not maintained or maintained using XSLT. Steps,
The markup language type of electronic publishing software format is InDesign Markup Language (IDML), and the identifier assignment step includes at least a part of a story file included in a publication file of the IDML format as an area including content to be translated. And a story file extraction step of selecting, wherein the story file extraction step assigns a GUID to each ParagraphStyleRange tag included in the story file using XSLT.
The method of claim 10, wherein the extracting the story file comprises assigning identifiers to individual content tags included in the story file.
The method of claim 10, wherein the identifier assignment step or the request format output step add information about an IDML file to which the extracted story file belongs as a new tag.
The method of claim 10, wherein the content to be translated and the translated content received through the result format receiving unit are modularized and stored in a database while assigning a version, and the module is stored in the database according to a request. The method for managing multilingual electronic publications, further comprising: stepping in and out of the component content to update the version.
17. The method of claim 16, wherein in the component content management step, withdrawal of the module is requested by electronic publishing software or translation software.
The multilingual electronic publishing management method according to claim 10, wherein the multilingual electronic publishing system in which at least a part of each step of the multilingual electronic publishing management method is performed is configured as a web application on a web server.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120016414A KR101321130B1 (en) | 2012-02-17 | 2012-02-17 | Multilingual electronic publishing management system and method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120016414A KR101321130B1 (en) | 2012-02-17 | 2012-02-17 | Multilingual electronic publishing management system and method thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130095029A KR20130095029A (en) | 2013-08-27 |
KR101321130B1 true KR101321130B1 (en) | 2013-10-23 |
Family
ID=49218557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020120016414A KR101321130B1 (en) | 2012-02-17 | 2012-02-17 | Multilingual electronic publishing management system and method thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101321130B1 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010113145A (en) * | 2000-06-16 | 2001-12-28 | 임승영 | Manual providing server system and manual providing method thereof |
JP2004310648A (en) * | 2003-04-10 | 2004-11-04 | Schreiber:Kk | Translation support system |
-
2012
- 2012-02-17 KR KR1020120016414A patent/KR101321130B1/en active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010113145A (en) * | 2000-06-16 | 2001-12-28 | 임승영 | Manual providing server system and manual providing method thereof |
JP2004310648A (en) * | 2003-04-10 | 2004-11-04 | Schreiber:Kk | Translation support system |
Also Published As
Publication number | Publication date |
---|---|
KR20130095029A (en) | 2013-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102521230B (en) | For the result type that data with good conditionsi show | |
CA2901703C (en) | System and method for generating task-embedded documents | |
US8407585B2 (en) | Context-aware content conversion and interpretation-specific views | |
US7406660B1 (en) | Mapping between structured data and a visual surface | |
US8010899B2 (en) | System offering a data-skin based on standard schema and the method | |
US20070219959A1 (en) | Computer product, database integration reference method, and database integration reference apparatus | |
EP1128277A2 (en) | Data processing method and system, program for realizing the method, and computer readable storage medium storing the program | |
US7797354B2 (en) | Method and system for managing documents for software applications | |
US7756819B2 (en) | Integrated authoring system for electronic technical manual and paper technical manual using logistics support analysis data and authoring method therefor | |
Kemps-Snijders et al. | ISOcat: Corralling data categories in the wild | |
AU2010245310A1 (en) | Method and system for verifying a citation | |
CN111831384B (en) | Language switching method, device, equipment and storage medium | |
CN102902673A (en) | Method and device for dynamically generating web pages | |
WO2007081017A1 (en) | Document processor | |
JP2001290812A (en) | Distributing method for web page, web server system, and recording medium | |
KR101321130B1 (en) | Multilingual electronic publishing management system and method thereof | |
Van De Ven et al. | Metavex: Regulation drafting meets the semantic web | |
Kwietniewski et al. | Transforming XML documents as schemas evolve | |
KR20210040545A (en) | Multilingual manual authoring apparatus based on XML and method thereof | |
KR20040056298A (en) | A data integration system and method using XQuery for defining the integrated schema | |
KR100644317B1 (en) | Method and system for the circulation of information by ontology vocabulary | |
Maier et al. | The XBabelPhish MAGE-ML and XML Translator | |
JP2007265429A (en) | Document conversion system, document conversion method, and computer readable storage medium storing document conversion program | |
US20140129533A1 (en) | Intermediary model to handle web vocabulary conflicts | |
Gorjanc et al. | Slovene terminology web portal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20161013 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20181015 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20191015 Year of fee payment: 7 |