KR20050096352A - The electronic dictionary editing methodology in internet environment - Google Patents

The electronic dictionary editing methodology in internet environment Download PDF

Info

Publication number
KR20050096352A
KR20050096352A KR1020040021521A KR20040021521A KR20050096352A KR 20050096352 A KR20050096352 A KR 20050096352A KR 1020040021521 A KR1020040021521 A KR 1020040021521A KR 20040021521 A KR20040021521 A KR 20040021521A KR 20050096352 A KR20050096352 A KR 20050096352A
Authority
KR
South Korea
Prior art keywords
cdata
information
phr
electronic dictionary
trans
Prior art date
Application number
KR1020040021521A
Other languages
Korean (ko)
Inventor
정휘웅
윤애선
Original Assignee
부산대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 부산대학교 산학협력단 filed Critical 부산대학교 산학협력단
Priority to KR1020040021521A priority Critical patent/KR20050096352A/en
Publication of KR20050096352A publication Critical patent/KR20050096352A/en

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K63/00Receptacles for live fish, e.g. aquaria; Terraria
    • A01K63/04Arrangements for treating water specially adapted to receptacles for live fish
    • A01K63/045Filters for aquaria

Abstract

본 발명은 일반적인 컴퓨터 기반 전자사전을 이식성 있고 호환 가능하며, 차세대 인터넷 환경에 활용 가능한 형태로 XML문서 구조를 설계하고, 이를 인터넷에서 쉽게 편집할 수 있는 방법을 제시한다.The present invention provides a method of designing an XML document structure in a form that is portable and compatible with general computer-based electronic dictionaries, and can be used in the next generation Internet environment, and easily edits it on the Internet.

이를 위해 표준화된 전자사전의 문서 구조와 인터넷 기반 사용자 인터페이스의 구성을 특허로 청구한다.To this end, he claims a standardized electronic dictionary document structure and an Internet-based user interface.

Description

인터넷에서 전자사전을 편집하는 방법{The Electronic dictionary editing methodology in internet environment} The electronic dictionary editing methodology in internet environment}

전자사전을 개발하는 것은 특수한 문서 편집 분야로서 지금까지 하나의 전자사전 개발을 위해 편집 환경은 프로그램 개발자들의 편의를 위해 구성되었을 뿐, 언어학 전문가들이나 일반 사전 전문가들을 위한 인터페이스는 구성되지 못했다. 또한 통신망을 기반으로 구성되기 보다는 하나의 독립된 컴퓨터 환경에서 자료를 특수한 기호 문자열의 형태로 구성하도록 하여 인터넷이나 다양한 프로그램 환경에서 자료를 편집할 수 없었다. 이는 국립국어연구원에서 개발된 표준국어대사전의 경우에 있어서도 쉽게 찾아볼 수 있는데, 데이터베이스에 각종 기호 코드를 별도의 비트맵 글꼴로 구성하여 일반적인 편집 환경이나 인터넷에서는 제대로 자료를 편집할 수 없었다.Developing electronic dictionaries is a special field of document editing. Until now, the development environment for the development of electronic dictionaries has been designed for the convenience of program developers, but no interface for linguistics specialists or general dictionaries. In addition, the data could not be edited in the Internet or various program environments by configuring the data in the form of a special symbol string in an independent computer environment rather than based on a communication network. This is easy to find even in the case of the standard Korean dictionary, which was developed by the National Institute of Korean Language. The various symbol codes are composed in a separate bitmap font in the database so that the data cannot be edited properly in a general editing environment or the Internet.

이에 따라 전자사전을 구성하기 위해서는 전산입력을 위한 단순 노동자(전산 사식), 사전 편찬 및 교정자로 나뉘었다. 이는 개발비용의 증가 및 어려운 자료 관리, 호환성의 부재로 나타났으며, 이는 현재 국내에 출시된 한글 전자사전의 호환성이 있지 않음에서도 잘 알 수 있다.Accordingly, in order to construct an electronic dictionary, it was divided into simple workers (computational meals), dictionary compilation, and proofreaders. This resulted in the increase of development cost, difficult data management, and lack of compatibility, which can be seen from the fact that there is no compatibility of Hangul electronic dictionary released in Korea.

오늘날 XML은 기술 표준의 큰 대세로 굳어져 있으며 본 발명에서도 XML기반 새로운 문서 구조를 설계하고 이를 웹 인터페이스에 연동하는데 가장 큰 주안점을 둔다. 본 기술에서는 크게 전자사전을 호환성이 있도록 구성하기 위한 표준화된 XML 문서구조와 이를 인터넷에서 편집하도록 지원하는 사용자 인터페이스로 구성된다. XML 문서구조는 청구1항에 기술되며 사용자 인터페이스는 청구2항에 기술된다.Today, XML is becoming a major technology standard, and the present invention has the greatest focus on designing a new XML-based document structure and integrating it into a web interface. This technology consists of a standardized XML document structure for composing an electronic dictionary with compatibility and a user interface supporting editing on the Internet. The XML document structure is described in claim 1 and the user interface is described in claim 2.

1. 전자사전을 구성하기 위한 XML 문서구조1. XML document structure for composing electronic dictionary

본 발명의 모든 문서는 Unicode를 바탕으로 기술되는데, 이는 다국어 정보를 표현하는 측면, 그리고 발음기호를 저장하기 위해서는 유니코드가 가장 적절한 대응책으로 생각되기 때문이다.All documents of the present invention are described on the basis of Unicode, because Unicode is regarded as the most appropriate countermeasure for expressing multilingual information and storing phonetic symbols.

전자사전의 정보는 크게 표제어로 분류된다. 본 발명에서도 사전의 최소 저장 단위는 ENTRY로 정의한다. 하나의 ENTRY는 여러개의 품사별 분류체계를 저장할 수 있으므로, 검색을 위한 TITLE이라는 표제어 영역 하나와 SEP(Separation)이라는 분류체계를 저장한다. ENTRY는 하나의 표제어가 어떠한 언어의 표제어 정보를 저장하는지를 알기 위해 LANG(language)라는 속성값을 저장한다.The information in the electronic dictionary is largely classified as a heading. In the present invention, the minimum storage unit of the dictionary is defined as ENTRY. An ENTRY can store multiple parts-of-speech classifications, so it stores one heading area called TITLE and a classification system called SEP (Separation). ENTRY stores an attribute value called LANG (language) to know which language's heading information is stored by a single heading.

LANG이라는 속성값은 세 글자로 된 언어별 코드로 정의하는데, 각 코드의 설정은 지원 언어의 개수가 늘어날 경우 임의로 추가할 수 있다. 이에 대한 대조표는 다음과 같다.The property value LANG is defined as a three-letter language code. The setting of each code can be added arbitrarily when the number of supported languages increases. The comparison table is as follows.

KOR; 한글ENG: 영어KOR; ENG: English

FRN: 불어GER: 독어FRN: French GER: German

RUS: 러시아어JPN: 일어RUS: RussianJPN: Japanese

CHN: 번체 중국어SCN: 간체 중국어CHN: Traditional Chinese SCN: Simplified Chinese

SPN: 스페인어SPN: Spanish

하나의 SEP 정보는 하나 이상의 의미 정보를 포함하는데 이를 MEAN이라고 기술한다. SEP 정보는 CLAS(Class)라는 품사 정보와 PRON(Prononciation)이라는 발음기호 정보를 속성으로 가진다. MEAN 정보는 하나 이상 SEP 요소에 포함되어야 하며, 다음의 각 정보를 포함할 수 있다.One SEP information includes one or more semantic information, which is described as MEAN. SEP information has parts of speech information called CLAS (Class) and phonetic symbol information called PRON (Prononciation) as attributes. MEAN information must be included in one or more SEP elements and may include each of the following information.

EXAM(Example): 예문 정보. 예문 정보는 또다른 GRAM이나 PHR 정보를 포함할 수 있다. 그리고 반드시 하나 이상의 번역 정보(TRANS:Translation)를 저장한다. EXAM (Example): Example information. Example information may include another GRAM or PHR information. And at least one translation information (TRANS: Translation) is stored.

GRAM(Grammar): 문법 정보. 하나이 상의 번역 정보를 저장한다. 하나 이상의 번역 정보, 그리고 또다른 GRAM이나 EXAM 정보를 포함할 수 있다. GRAM (Grammar): Grammar information. Stores one or more translation information. It may contain one or more translation information and another GRAM or EXAM information.

PHR(Phrase): 숙어 정보를 저장한다. 하나 이상의 번역 정보, 그리고 또다른 GRAM이나 EXAM 정보를 포함할 수 있다. PHR (Phrase): Stores idiom information. It may contain one or more translation information and another GRAM or EXAM information.

또한 MEAN 정보는 속성 정보로서 여러 언어적 정보를 포함하게 되는데, 향후 의미기반 OWL 언어와 연동되는 경우 본 정보에 OWL 포인터 정보들이 저장될 수 있다.In addition, the MEAN information includes various linguistic information as attribute information. When interworking with a semantic-based OWL language in the future, OWL pointer information may be stored in this information.

AB(Abbreviation): 약어 정보.AB (Abbreviation): Abbreviation information.

SY(Synonym): 동의어 정보.Synonym (SY): Synonym Information.

AN(Antonym): 반의어 정보.AN (Antonym): Antonym information.

ES(English Syonoym): 영어 동의어 정보. 이는 향후 OWL 환경과 연동하게 될 경우 자동으로 외부 Ontology 환경과 연동될 수 있는 기반을 마련 해 준다. ES (English Syonoym): English synonym information. This provides a foundation for automatically linking with external Ontology environment when interworking with OWL environment in the future.

2. 인터넷에서 전자사전을 편집하는 인터페이스2. Interface for editing electronic dictionaries on the Internet

본 발명의 [도1]에서 제시한 바와 같이 본 인터페이스는 인터넷 환경에서 운영된다. 본 인터페이스의 기본 아이디어는 어떻게 하면 쉽고 빠르게 인터넷에서 XML에 기반한 전자사전 정보를 편집할 수 있느냐에 있다. 구조적으로 잘 짜여진 XML 문서 구조는 청구항 1항과 같으며, 이를 활용하여 쉽게 문서를 편집하기 위해 마우스의 click 횟수를 고려하였다. 이를 위하여 다음의 인터페이스적 사항을 고려하였다.As shown in FIG. 1 of the present invention, the interface operates in an Internet environment. The basic idea of this interface is how to quickly and easily edit XML-based electronic dictionary information on the Internet. The structure of well-structured XML document is the same as that of claim 1, and the number of clicks of the mouse is considered in order to easily edit the document by using the same. For this, the following interface points were considered.

■하나의 노드를 클릭하면 그에 연관된 정보를 어떻게 한 화면에서 입력할 수 있을까?■ How can I enter information related to one screen by clicking on a node?

■노드의 추가와 삭제는 어떻게 쉽게 할 수 있을까?How can I add and remove nodes easily?

이러한 문제를 해결하기 위해 본 발명은 XML DTD의 기준에 따라 사용이 활성화 혹은 비활성화 되는 다섯 개의 버튼을 [도1]에 제시된 바와 같이 만들었다. 각 버튼은 앞으로 이동, 뒤로 이동, 형제 추가 버튼, 삭제 버튼이 주를 이룬다. 갱신 버튼은 다른 노드를 마우스로 클릭하는 경우에 자동으로 갱신되므로 중요도는 떨어진다.In order to solve this problem, the present invention has made five buttons as shown in FIG. 1 to enable or disable the use according to the criteria of XML DTD. Each button is made up of forward, backward, add sibling, and delete buttons. The update button is updated automatically when another node is clicked with a mouse, so the importance is low.

형제 추가 버튼은 동일한 요소를 많이 입력하는 사전의 특성을 고려하였다. 즉 사전에서는 예문 정보를 매우 많이 입력하는데, 만약 부모 노드를 클릭해서 다시 자식 노드로 EXAM이라는 요소를 입력할 경우 두 번의 마우스 클릭이 필요하다. 만약 많은 수의 예문을 입력해야 하는 관점이라면 이 작업은 매우 많은 시간 소비를 초래한다.The Add Siblings button takes into account the characteristics of the dictionary that enter many of the same elements. In other words, a lot of example information is entered in the dictionary. If you click on the parent node and enter an element called EXAM as a child node, two mouse clicks are required. If you need to enter a large number of examples, this can be very time consuming.

노드의 상위, 하위 이동 버튼은 넣지 않았는데, 이는 XML 문서의 무결성 및 문서의 구조를 깨지 않도록 하기 위한 배려다.We don't include the parent and child navigation buttons, which are considered to avoid breaking the integrity of the XML document and its structure.

삭제버튼의 경우 자신이 하나 이상 와야 하는 요소인 경우 비활성화 되며, 만약 마지막 자식노드로서 삭제가 되면, 자신의 형제 노드중 유효한 것 하나(앞 노드 우선)나 부모 노드로 사용자 인터페이스가 이동하게 된다. The delete button is deactivated if it is one or more elements that need to be present. If deleted as the last child node, the user interface is moved to one of its sibling nodes (first node first) or the parent node.

1. 표준화된 전자사전 구조 제시. 향후 의미망 구조인 OWL(Web Ontology) 및 RDF(Resource Description Format)와 같은 웹 기반 온톨로지 정보의 의미 정보 제공 소스로 활용 가능.1. Standardized electronic dictionary structure. In the future, it can be used as a source for providing semantic information of web-based ontology information such as OWL (Web Ontology) and RDF (Resource Description Format).

2. 인터페이스를 활용할 경우 다양한 형태의 XML 문서를 편집하거나, 다양한 네임스페이스 환경을 편집할 수 있다.2. You can use the interface to edit various types of XML documents or to edit various namespace environments.

3. 전자사전의 표준화를 유도하여 향후 전자사전 편찬 환경을 개선하고, 의미 있는 언어 라이브러리 구축을 촉진할 수 있다.3. Encourage standardization of electronic dictionaries to improve the electronic dictionary compilation environment and promote the establishment of meaningful language libraries.

인터넷에서 전자사전을 편집하기 위해서는 재사용성 및 여러 사항을 고려하여 XML에 기반한 DTD를 정의해야 한다. 그러나 이를 일반 언어전문가들에게 제시할 경우 정교한 XML 문서를 생성하지 못한다. 본 발명은 이러한 DTD 정의와 함께 웹에서 전자사전을 쉽게 편집할 수 있는 인터페이스를 제시한다. [도1]에서 제시하는바와 같이 In order to edit electronic dictionaries on the Internet, XML-based DTDs must be defined in consideration of reusability and various factors. However, when presented to general language experts, it does not generate sophisticated XML documents. The present invention provides an interface that can easily edit the electronic dictionary on the web with the DTD definition. As shown in Figure 1

Claims (2)

전자사전을 구성하는 문서의 구조(DTD format)Document structure of an electronic dictionary (DTD format) <?xml version="1.0" encoding="utf-8" ?><? xml version = "1.0" encoding = "utf-8"?> <!ELEMENT ENTRY (TITLE, SEP+)><! ELEMENT ENTRY (TITLE, SEP +)> <!ELEMENT SEP (MEAN+)><! ELEMENT SEP (MEAN +)> <!ELEMENT MEAN(#PCDATA, (EXAM | PHR | GRAM)*)><! ELEMENT MEAN (#PCDATA, (EXAM | PHR | GRAM) *)> <!ELEMENT EXAM(#PCDATA, TRANS+, (PHR | GRAM)*)><! ELEMENT EXAM (#PCDATA, TRANS +, (PHR | GRAM) *)> <!ELEMENT PHR(#PCDATA, TRANS+, (EXAM | PHR)*)><! ELEMENT PHR (#PCDATA, TRANS +, (EXAM | PHR) *)> <!ELEMENT GRAM(#PCDATA, TRANS+, (EXAM | PHR)*)><! ELEMENT GRAM (#PCDATA, TRANS +, (EXAM | PHR) *)> <!ELEMENT TRANS(#PCDATA)><! ELEMENT TRANS (#PCDATA)> <!ATTRIBUTE ENTRY<! ATTRIBUTE ENTRY LANG CDATA (KOR|ENG|FRN|DEU|RUS|GRK|JPN|SCN|CHN|SPN) #REQUIRED>LANG CDATA (KOR | ENG | FRN | DEU | RUS | GRK | JPN | SCN | CHN | SPN) #REQUIRED> <!ATTRIBUTE SEP<! ATTRIBUTE SEP CLAS CDATA #REQUIREDCLAS CDATA #REQUIRED PRON CDATA>PRON CDATA> <!ATTRIBUTE MEAN<! ATTRIBUTE MEAN AB CDATAAB CDATA SY CDATASY CDATA AN CDATAAN CDATA ES CDATA>ES CDATA> <!ATTRIBUTE TRANS<! ATTRIBUTE TRANS LANG CDATA (KOR|ENG|FRN|DEU|RUS|GRK|JPN|SCN|CHN|SPN) "KOR" #REQUIRED>LANG CDATA (KOR | ENG | FRN | DEU | RUS | GRK | JPN | SCN | CHN | SPN) "KOR" #REQUIRED> [도면1]에 제시된 인터넷 기반 전자사전 편집 사용자 인터페이스 구조(설명은 발명의 구성에 제시되어 있음)Internet-based electronic dictionary editing user interface structure presented in Figure 1 (the description is given in the configuration of the invention)
KR1020040021521A 2004-03-30 2004-03-30 The electronic dictionary editing methodology in internet environment KR20050096352A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040021521A KR20050096352A (en) 2004-03-30 2004-03-30 The electronic dictionary editing methodology in internet environment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040021521A KR20050096352A (en) 2004-03-30 2004-03-30 The electronic dictionary editing methodology in internet environment

Publications (1)

Publication Number Publication Date
KR20050096352A true KR20050096352A (en) 2005-10-06

Family

ID=37276439

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040021521A KR20050096352A (en) 2004-03-30 2004-03-30 The electronic dictionary editing methodology in internet environment

Country Status (1)

Country Link
KR (1) KR20050096352A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100785756B1 (en) * 2006-04-26 2007-12-18 엔에이치엔(주) Method for providing personal dictionary and system thereof
KR20110132570A (en) * 2009-03-25 2011-12-08 마이크로소프트 코포레이션 Sharable distributed dictionary for applications

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100785756B1 (en) * 2006-04-26 2007-12-18 엔에이치엔(주) Method for providing personal dictionary and system thereof
KR20110132570A (en) * 2009-03-25 2011-12-08 마이크로소프트 코포레이션 Sharable distributed dictionary for applications

Similar Documents

Publication Publication Date Title
Desagulier et al. Corpus linguistics and statistics with R
Carley et al. AutoMap User's Guide 2013
Ide et al. International standard for a linguistic annotation framework
Lu Computational methods for corpus annotation and analysis
US6539348B1 (en) Systems and methods for parsing a natural language sentence
US7233891B2 (en) Natural language sentence parser
Hajič et al. Prague dependency treebank
Ide et al. Standards for language resources
Simov et al. Building a Linguistically Interpreted Corpus of Bulgarian: the BulTreeBank.
Ide et al. Towards International Standards for Language Resources Nancy Ide and Laurent Romary
US7401016B2 (en) Communication support system, communication support method, and computer program
Yıldız et al. Constructing a Turkish constituency parse treebank
KR20050096352A (en) The electronic dictionary editing methodology in internet environment
KR100631086B1 (en) Method and apparatus for text normalization using extensible markup language(xml)
Cimiano et al. Modelling linguistic annotations
Cimiano et al. Representing Annotated Texts as RDF
Weisser Essential programming for linguistics
Sornlertlamvanich et al. Collaborative Collection of Multilingual Pronoun Substitutes and Address Terms
Dhanabalan et al. Tamil to unl enconverter
Scrivner et al. Le Roman de Flamenca: An annotated corpus of old occitan
Jaafar et al. A New Tool for Benchmarking and Assessing Arabic Syntactic Parsers
Anchiêta et al. Using NLP Techniques for Identifying GUI Prototypes and UML Diagrams From Use Cases.
Patil et al. A review on implementation of Sandhi Viccheda for Sanskrit words
Smrž et al. Learning to use the prague arabic dependency Treebank
Simons et al. A model for interoperability: XML documents as an RDF database

Legal Events

Date Code Title Description
N231 Notification of change of applicant
WITN Withdrawal due to no request for examination