KR20120035244A - Translation apparatus and method for providing various style of translatability - Google Patents

Translation apparatus and method for providing various style of translatability Download PDF

Info

Publication number
KR20120035244A
KR20120035244A KR1020100096600A KR20100096600A KR20120035244A KR 20120035244 A KR20120035244 A KR 20120035244A KR 1020100096600 A KR1020100096600 A KR 1020100096600A KR 20100096600 A KR20100096600 A KR 20100096600A KR 20120035244 A KR20120035244 A KR 20120035244A
Authority
KR
South Korea
Prior art keywords
style
translation
mother
unit
input unit
Prior art date
Application number
KR1020100096600A
Other languages
Korean (ko)
Inventor
서나미
Original Assignee
에스케이플래닛 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이플래닛 주식회사 filed Critical 에스케이플래닛 주식회사
Priority to KR1020100096600A priority Critical patent/KR20120035244A/en
Publication of KR20120035244A publication Critical patent/KR20120035244A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

PURPOSE: An automatic translation device capable of providing various writing styles and a method thereof are provided to supply a desired writing style according to a usage purpose. CONSTITUTION: An input unit(110) inputs a primitive language sentence. The input unit sets a desired writing style. A translation unit(120) analyzes the syntax of the primitive language sentence. The translation unit extracts a replacement word based on a sentence structure analysis result. The translation unit generates an end of a word corresponding to the set writing style about the replacement word. A display unit(130) displays a translation sentence.

Description

다양한 문체 제공이 가능한 자동 번역 장치 및 방법{translation APPARATUS AND METHOD FOR PROVIDING VARIOUS STYLE OF TRANSLATABILITY}Automatic translation device and method that can provide various styles {translation APPARATUS AND METHOD FOR PROVIDING VARIOUS STYLE OF TRANSLATABILITY}

본 발명은 자동 번역에 관한 것으로서, 더욱 상세하게는 목적 언어의 용언을 어미 형태 변화에 따라 다양한 문체로 각각 구분하고, 문체도 불규칙 용언 및 규칙 용언에 따라 각각 구축해 둠으로써 번역 요청시 사용자로부터 원하는 문체로의 설정이 있으면 해당 문체에 해당하는 어미를 생성하여 어간과 함께 제공하는 자동 번역 장치 및 방법에 관한 것이다. The present invention relates to an automatic translation, and more specifically, the language of the target language is divided into various styles according to the change in the form of the mother, and the style is also constructed according to the irregular and rule words, respectively. The present invention relates to an automatic translation apparatus and method for generating a mother corresponding to a writing style and providing the stem with a stem.

자동 번역 기술은 한 언어를 다른 언어로 자동으로 전환해주는 소프트웨어적 기술을 의미한다. 이러한 기술은 20세기 중반부터 미국에서 군사적인 목적으로 연구가 시작되었으며, 지금은 세계적으로 정보접근범위의 확대와 휴먼인터페이스의 혁신을 목적으로 다수의 연구소와 민간기업에서 활발히 연구 중이다. Automatic translation technology refers to a software technology that automatically switches from one language to another. This technology has been studied in the United States for military purposes since the middle of the 20th century, and is now being actively researched by numerous research institutes and private companies for the purpose of expanding the scope of information access and innovation of the human interface.

이러한 자동 번역 기술을 활용하는 용도는 사용자에 따라 다양할 수 있다. 예를 들어, 일반 보고서에 대한 번역 서비스에 활용하거나, 외국 친구들과 채팅하는 서비스 등에 활용할 수 있다. The use of this automatic translation technology may vary depending on the user. For example, it can be used for translation services for general reports or for chatting with foreign friends.

그런데, 현재 제공되는 자동 번역문은 천편일률적으로 딱딱한 문체로 제공하고 있다. 따라서, 외국 친구와의 채팅에 활용하는 경우 번역은 완벽하게 되었지만 딱딱해 보이는 문체로 인해 완성된 번역 문장을 수정해야 할 작업이 불가피하다. 해당 번역 문장을 메일로 보내려고 하는 경우에도 이와 마찬가지이다. By the way, the automatic translation currently provided is provided in a uniform stylistic style. Therefore, when using it for chatting with a foreign friend, the translation is perfect, but due to the stiff style, it is inevitable to correct the completed translated sentence. The same is true when the translated sentence is to be sent by e-mail.

또한, 자동 번역문을 수신하는 수신자에 따라 편한 문체가 허용이 될 수도 있고 격식을 차려야 하는 경우도 있는데, 이 경우에도 딱딱한 어미로 번역된 번역문을 가공 없이 쓸 수 있는 있지만 사용자의 활용도를 높이기 위해 상황에 맞는 문체로 번역할 필요성이 있다. In addition, depending on the recipient of the automatic translation, a comfortable style may be allowed or formalized. In this case, the translated translation can be written without hard processing. There is a need for translation into the correct style.

본 발명은 상기의 필요성을 충족하기 위해 창안된 것으로서, 목적 언어의 용언을 어미 형태 변화에 따라 다양한 문체로 각각 구분하고, 문체도 불규칙 용언 및 규칙 용언에 따라 각각 구축해 둠으로써 번역 요청시 사용자로부터 원하는 문체로의 설정이 있으면 해당 문체에 해당하는 어미를 생성하여 어간과 함께 제공하는 자동 번역 장치 및 방법을 제공하는 데 그 목적이 있다. The present invention was devised to satisfy the above needs, and the language of the target language is divided into various styles according to the change in the form of the mother, and the style is also constructed according to the irregular language and the regular language, respectively. The purpose of the present invention is to provide an automatic translation apparatus and method for generating a mother corresponding to a writing style and providing the stem with the stem.

이를 위하여 본 발명의 제1 측면에 따르면, 본 발명의 자동 번역 장치는, 번역할 원시 언어 문장을 입력하고 사용자가 원하는 문체를 설정할 수 있는 입력부; 상기 입력부에 입력된 원시 언어 문장을 구문 분석하고 구문 분석한 결과를 기반으로 대역어를 추출한 동시에 상기 대역어에 대하여 상기 입력부를 통해 설정한 문체에 해당하는 어미를 생성하여 최종 번역문을 출력하는 번역부; 상기 번역부로부터 출력되는 번역문을 표시하는 표시부를 포함하는 것을 특징으로 한다.To this end, according to a first aspect of the present invention, the automatic translation device of the present invention, an input unit for inputting a source language sentence to be translated and the user sets the desired style; A translator that extracts a band word based on a result of parsing and parsing a primitive language sentence input to the input unit, and generating a final word corresponding to a style set through the input unit for the band word; It characterized in that it comprises a display unit for displaying the translations output from the translation unit.

여기서, 상기 장치는 상기 구문 분석 및 상기 대역어와 관련한 사전 정보를 저장하고, 상기 어미를 다양한 문체에 따라 구분하여 저장하며 상기 어미가 불규칙하게 변하는 불규칙 용언을 구분하여 저장한 사전 저장부를 더 포함하는 것을 특징으로 한다. The apparatus may further include a dictionary storage unit configured to store dictionary information related to the syntax analysis and the band word, classify and store the ending according to various styles, and classify and store irregular verbs in which the ending is changed irregularly. It features.

상기 문체는 구어체, 문어체, 경어체, 평서체, 비칭체, 간결체, 만연체, 우유체, 강건체, 화려체, 건조체를 포함하는 것을 특징으로 한다. The writing style is characterized by including colloquial style, written style, hard style, flat style, asymmetrical body, simplified body, rampant body, milk body, hard body, colorful body, and dry body.

상기 표시부는, 다양한 문체에 대한 리스트와 선택 가능한 화면을 표시하는 것을 특징으로 한다.The display unit may display a list of various styles and a selectable screen.

본 발명의 제2 측면에 따르면, 본 발명의 자동 번역 방법은, 입력부를 통해 번역할 원시 언어 문장을 입력받는 단계; 상기 입력부를 통해 번역할 문체를 입력받는 단계; 상기 입력부를 통해 입력된 원시 언어 문장을 구문 분석하여 분석한 결과를 기반으로 대역어를 추출하고 상기 입력부를 통해 입력받은 문체를 확인하여 상기 문체에 해당하는 어미를 생성하는 단계; 상기 문체에 해당하는 어미를 생성한 번역문을 출력하는 단계; 상기 번역문을 표시부에 표시하는 단계를 포함하는 것을 특징으로 한다.According to a second aspect of the present invention, an automatic translation method of the present invention comprises: receiving a source language sentence to be translated through an input unit; Receiving a style to translate through the input unit; Extracting a band word based on a result of parsing and analyzing a primitive language sentence input through the input unit, and generating a mother corresponding to the style by checking a writing style input through the inputting unit; Outputting a translation in which a mother corresponding to the writing style is generated; And displaying the translated text on a display unit.

여기서, 상기 어미는 다양한 문체에 따라 구분하여 저장되어 있으며 상기 어미가 불규칙하게 변하는 불규칙 용언을 구분한 것을 특징으로 한다. Here, the mother is divided and stored according to various styles, characterized in that the mother is divided into irregular words that change irregularly.

상기 문체는 구어체, 문어체, 경어체, 평서체, 비칭체, 간결체, 만연체, 우유체, 강건체, 화려체, 건조체를 포함하는 것을 특징으로 한다. The writing style is characterized by including colloquial style, written style, hard style, flat style, asymmetrical body, simplified body, rampant body, milk body, hard body, colorful body, and dry body.

상기 번역할 문체를 입력받는 단계는 상기 표시부에 다양한 문체에 대한 리스트와 리스트 중 어느 하나를 선택 가능한 화면을 제공하는 것을 특징으로 한다. The receiving of the style to be translated may include providing a screen for selecting one of a list of various styles and a list on the display unit.

본 발명의 제3 측면에 따르면, 본 발명의 컴퓨터로 읽을 수 있는 기록매체는, 입력부를 통해 번역할 원시 언어 문장을 입력받는 단계; 상기 입력부를 통해 번역할 문체를 입력받는 과정과, 상기 입력부를 통해 입력된 원시 언어 문장을 구문 분석하여 분석한 결과를 기반으로 대역어를 추출하고 상기 입력부를 통해 입력받은 문체를 확인하여 상기 문체에 해당하는 어미를 생성하는 과정과, 상기 문체에 해당하는 어미를 생성한 번역문을 출력하는 과정과, 상기 번역문을 표시부에 표시하는 과정을 실행시키기 위한 프로그램을 기록한 것을 특징으로 한다.According to a third aspect of the present invention, a computer-readable recording medium of the present invention includes: receiving an input of a source language sentence to be translated through an input unit; Inputting the stylistic to be translated through the input unit, and extracting a band word based on a result of parsing and analyzing a raw language sentence input through the input unit and confirming the stylistic input through the input unit to correspond to the stylistic And a program for executing a process of generating a mother word, a process of outputting a translation word corresponding to the writing style, and a process of displaying the translation text on a display unit.

본 발명에 따르면, 번역어의 어미를 사용자가 활용 용도에 따라 원하는 다양한 문체로 제공함으로써 자동 번역의 활용도를 극대화할 수 있는 효과가 있다. According to the present invention, there is an effect of maximizing the utilization of the automatic translation by providing a variety of styles desired by the user according to the usage purpose.

도 1은 본 발명의 실시 예에 따른 자동 번역의 기본 프로세싱 과정을 설명하기 위한 도면이다.
도 2는 본 발명의 실시 예에 따른 자동 번역 장치를 나타낸 구성도이다.
도 3은 본 발명의 실시 예에 따른 다양한 문체 제공을 위한 사전 저장부의 구조를 세부적으로 나타낸 도면이다.
도 4는 본 발명의 실시 예에 따른 다양한 문체를 설정하는 사용자 인터페이스의 예시 화면이다.
도 5는 본 발명의 실시 예에 따라 다양한 문체를 제공하는 번역 문장의 예를 보인 도면이다.
도 6은 본 발명의 실시 예에 따른 자동 번역 방법을 나타낸 순서도이다.
1 is a view for explaining the basic processing of the automatic translation according to an embodiment of the present invention.
2 is a block diagram showing an automatic translation apparatus according to an embodiment of the present invention.
3 is a view showing in detail the structure of the dictionary storage unit for providing a variety of styles according to an embodiment of the present invention.
4 is an exemplary screen of a user interface for setting various styles according to an embodiment of the present invention.
5 is a diagram illustrating an example of a translation sentence providing various styles according to an embodiment of the present invention.
6 is a flowchart illustrating an automatic translation method according to an embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 발명에 따른 실시 예를 상세하게 설명한다. 본 발명의 구성 및 그에 따른 작용 효과는 이하의 상세한 설명을 통해 명확하게 이해될 것이다. 본 발명의 상세한 설명에 앞서, 동일한 구성요소에 대해서는 다른 도면 상에 표시되더라도 가능한 동일한 부호로 표시하며, 공지된 구성에 대해서는 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 구체적인 설명은 생략하기로 함에 유의한다. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. The configuration of the present invention and the operation and effect thereof will be clearly understood through the following detailed description. Prior to the detailed description of the present invention, the same components will be denoted by the same reference numerals even if they are displayed on different drawings, and the detailed description will be omitted when it is determined that the well-known configuration may obscure the gist of the present invention. do.

이하에서 언급하는 원시 언어 또는 원시 언어 문장은 번역할 대상으로 입력하는 문장이고, 목적 언어 또는 목적 언어 문장은 원시 언어를 원하는 언어로 번역하여 출력한 문장임을 가정한다. It is assumed that the primitive language or primitive language sentence mentioned below is a sentence to be input as a target to be translated, and the target language or target language sentence is a sentence which is translated from the primitive language into a desired language and output.

도 1은 본 발명의 실시 예에 따른 자동 번역의 기본 프로세싱 과정을 설명하기 위한 도면이다.1 is a view for explaining the basic processing of the automatic translation according to an embodiment of the present invention.

일반적으로 자동 번역은 입력한 원시 언어 문장을 형태소 단위로 분석하고(S1), 분석한 형태소 정보에 품사 정보를 태그(tag)로 첨부한 다음(S2), 이 품사 정보에 근거하여 구문을 분석한다(S3). 구문 분석한 결과에서 목적 언어의 문법에 맞게 어순을 변경하는 변환 과정을 거치고(S4), 어순에 맞게 변경된 구문 분석 결과에 대응되는 대역어를 각각 추출하고 이 대역어에 조사나 어미를 생성하여 자연스러운 목적 언어 문장(번역문)을 생성한다(S5).In general, automatic translation analyzes the input source language sentence in morpheme units (S1), attaches the part-of-speech information to the analyzed morpheme information as a tag (S2), and then parses the syntax based on the part-of-speech information. (S3). From the result of parsing, the word order is changed according to the grammar of the target language (S4), and the band words corresponding to the parse result changed according to the word order are extracted, respectively, and the survey or ending is generated in the band language, thereby providing a natural target language. Generate a sentence (translation) (S5).

본 발명은 상기한 자동 번역 과정에서 마지막 생성 과정(S5)에 해당하는 구성으로, 특히 생성 과정(S5)에서 어미 생성시 대역어의 어미를 원하는 문체 유형에 맞게 생성하여 번역의 활용도를 극대화하고자 한다. The present invention is the configuration corresponding to the last generation process (S5) in the above automatic translation process, and in particular, to generate the mother of the band words according to the desired stylistic type when generating the mother in the generation process (S5) to maximize the utilization of the translation.

이러한 본 발명의 자동 번역 장치 및 방법은 다음과 같다. The automatic translation apparatus and method of the present invention are as follows.

도 2는 본 발명의 실시 예에 따른 자동 번역 장치를 나타낸 구성도이고, 도 3은 본 발명의 실시 예에 따른 다양한 문체 제공을 위한 사전 저장부의 구조를 세부적으로 나타낸 도면이다.2 is a block diagram showing an automatic translation apparatus according to an embodiment of the present invention, Figure 3 is a view showing in detail the structure of the dictionary storage unit for providing various styles according to an embodiment of the present invention.

먼저 도 2를 참조하면, 본 발명의 실시 예에 따른 자동 번역 장치(100)는 원시 언어 문장을 입력 받는 입력부(110)와, 입력부(110)에 입력된 원시 언어 문장을 분석하여 대응되는 목적 언어 문장으로 번역하는 번역부(120), 변역한 결과를 표시하는 표시부(130), 원시 언어 문장을 분석하고 번역하는 데 관련 사전 정보를 제공하는 사전 저장부(140)를 포함한다. First, referring to FIG. 2, the automatic translation apparatus 100 according to an embodiment of the present invention analyzes an input unit 110 that receives a source language sentence and a source language sentence corresponding to the input language 110 by analyzing the input language 110. A translation unit 120 for translating the sentence, a display unit 130 for displaying the translation result, and a dictionary storage unit 140 for providing related dictionary information for analyzing and translating the source language sentences.

입력부(110)는 사용자의 문자 입력이 가능한 키 패드를 구비하여, 사용자로부터 원시 언어 문장을 입력받으며, 사용자의 활용도에 따라 원하는 문체의 유형에 대한 정보를 입력받는다. The input unit 110 includes a keypad for inputting a character of the user, receives a native language sentence from the user, and receives information about a desired style type according to the user's utilization.

표시부(130)는 입력부(110)로 입력되는 원시 언어 문장과 번역부(120)를 통해 번역된 목적 언어 문장을 상호 매핑하여 디스플레이하고, 사용자가 원시 언어 문장을 입력하고 원하는 문체를 설정하는 등의 입력 화면을 제공한다. 도 4는 표시부(130)에 다양한 문체에 대한 리스트를 제공하고 제공된 리스트 중에서 어느 하나를 선택하여 문체를 설정하는 화면을 보여주고 있다. The display unit 130 maps and displays the source language sentence inputted through the input unit 110 and the target language sentence translated through the translation unit 120, and the user inputs the native language sentence and sets a desired style. Provide an input screen. 4 shows a screen for providing a list of various styles on the display unit 130 and setting a style by selecting any one of the provided lists.

사전 저장부(140)는 번역부(120)에서 원시 언어 문장을 형태소 및 구문 분석하고 번역하는데 필요한 번역 사전을 저장한다. 번역 사전은 번역부(120)의 번역 엔진에서 사용하는 지식을 통칭하기로 한다. 예를 들어, 번역 사전에는 대역어 사전, 복합명사 사전, 문법 사전, 형태소 사전, 태깅 사전, 생성 사전 및 변환 규칙 사전 등이 포함될 수 있다.The dictionary storage unit 140 stores a translation dictionary necessary for morphing, parsing, and translating the source language sentence in the translation unit 120. The translation dictionary will be collectively referred to as knowledge used in the translation engine of the translation unit 120. For example, the translation dictionary may include a bandword dictionary, a compound noun dictionary, a grammar dictionary, a morpheme dictionary, a tagging dictionary, a generation dictionary, and a conversion rule dictionary.

또한, 본 발명의 실시 예에 따른 사전 저장부(140)는 도 3에 도시한 바와 같이 문체에 대한 사전(142)을 포함할 수 있다. In addition, the dictionary storage unit 140 according to an embodiment of the present invention may include a dictionary 142 for the writing style as shown in FIG.

문체 사전(142)에는 어간과 어미로 구분하여 저장한 용언 정보(1422)와, 사익 어미를 구어체, 문어체, 경어체, 평서체, 비칭체, 간결체, 만연체, 우유체, 강건체, 화려체, 건조체 등 다양한 문체에 따라 구분하여 저장한 문체 정보(1424)를 포함할 수 있다. 여기서, 문체 정보(1424)는 규칙 용언의 경우 각 문체에 따라 어미 상태가 변화하는 룰(rull)에 대한 정보만 저장될 수 있지만, 불규칙 용언의 경우 각 문체에 따라 변하는 해당 어미 정보가 저장된다. The stylistic dictionary 142 includes verb information (1422), which is divided into stems and mothers, and a variety of styles such as colloquial, written language, slang, flat typeface, aching body, simplified, widespread, milk, rigid, colorful, dry, etc. The stylistic information 1424 may be stored according to the classification. Here, the stylistic information 1424 may store only information about a rule whose mother state changes according to each stylistic in the case of a rule verb, but corresponding mother information that varies according to each stylistic is stored in an irregular verb.

또한, 용언 정보(1422)는 어미의 변화가 규칙적으로 변하는 규칙 용언과, 불규칙적으로 변하는 불규칙 용언에 대하여 구분한다. Also, the verb information 1422 distinguishes between regular verbs in which the change of the mother is regularly changed and irregular verbs in which the irregular changes.

번역부(120)는 형태소 분석기(121), 태깅기(123), 구문 분석기(125), 변환기(127), 생성기(129)를 포함하여, 번역 사전을 기초로 하여 번역하거나 또는 통계 자료를 기반으로 원시 언어 문장을 번역할 수 있다. 여기서, 번역부(120)는 설명의 편의상 일반 자동 번역의 각 기능별로 독립적으로 구성된 것을 예시하였으나, 하나 또는 그 이상의 서버 또는 장치에 상기 기능들이 통합되어 구비될 수도 있으며, 필요에 따라서는 독립적으로 구성된 상기 구성요소를 삭제할 수 있다.The translator 120 includes a morpheme analyzer 121, a tagging machine 123, a parser 125, a converter 127, and a generator 129 to translate based on a translation dictionary or based on statistical data. You can translate primitive language sentences. Here, the translation unit 120 is illustrated for convenience of description, but configured independently for each function of the general automatic translation, one or more of the server or device may be provided with the above functions integrated, if necessary independently configured The component may be deleted.

형태소 분석기(121)는 입력부(110)에 수신한 원시 언어 문장을 형태소 단위로 분석한다. The morpheme analyzer 121 analyzes the source language sentences received by the input unit 110 in morpheme units.

태깅기(123)는 형태소 분석기(121)를 통해 분석된 형태소에 주어(S), 동사(V), 목적어(O), 부사(AD) 등의 품사 정보, 의미, 위치 정보 등을 태그(tag)로 첨부한다. The tagging machine 123 tags parts of speech information such as subject (S), verb (V), object (O), adverb (AD), meaning, location information, etc. in the morpheme analyzed by the morpheme analyzer 121. Attach).

구문 분석기(125)는 태깅기(123)에서 첨부된 태그를 근거로 구문을 분석한다. 구문 분석 결과는 형태소 단위로 분석된 형태소와 형태소간 품사, 의미, 전후 관계에 의한 변화 등에 의하여 다수의 번역어가 있을 수 있으며, 원문에 맞는 번역문도 다수의 번역문으로 번역될 수 있다. The parser 125 parses the syntax based on the tag attached by the tagging machine 123. The result of parsing may include a large number of translations due to morphemes and morphemes analyzed in morphemes, changes in meaning, context, and the like, and translations corresponding to the original text may be translated into multiple translations.

변환기(127)는 구문 분석기(125)를 통해 분석된 형태소를 목적 언어의 어순에 맞게 어순을 변경한다. The converter 127 changes the word order of the morphemes analyzed by the parser 125 according to the word order of the target language.

이를 테면, 영어와 한글의 어순은 반대가 된다. 따라서, 원시 언어인 영어 문장 "I love you"를 구문 분석한 트리 "I-love-you"로부터, 한글 문장에 맞게 어순을 변경하면 "I-you-love"가 될 수 있다. For example, the order of English and Korean is reversed. Therefore, from the tree "I-love-you" which parses the English sentence "I love you" which is a native language, it may become "I-you-love" by changing the order of a word according to a Korean sentence.

생성기(129)는 변환기(127)를 거친 결과에서 각 형태소와 대응되는 대역어를 사전 저장부(140)에 기저장된 번역 사전으로부터 추출하고, 이 대역어에 조사나 어미를 생성하여 자연스러운 목적 언어 문장(이하, 번역문)을 생성한다. The generator 129 extracts a band word corresponding to each morpheme from the translation dictionary previously stored in the dictionary storage 140 in the result of the translator 127, and generates a survey or a mother word for the target language sentence (hereinafter, referred to as a natural language). , Translations).

이때, 생성기(129)는 사용자가 입력부(110)를 통해 설정한 문체를 확인하고, 설정한 문체에 맞는 어미를 사전 저장부(140)로부터 추출하여 생성한다. In this case, the generator 129 checks the style set by the user through the input unit 110, and extracts and generates a mother ending in accordance with the set style from the dictionary storage 140.

일 예로, 도 5에 나타난 예시 문장 '나는 당신을 사랑한다'라는 번역문 중에 '사랑한다'라는 대역어의 어미 생성을 예로 들어 설명한다. For example, in the example sentence 'I love you' illustrated in FIG. 5, the mother word of the band word 'I love you' will be described as an example.

사용자가 문체를 딱딱한 문어체로 설정한 경우, 생성기(129)는 '나는 당신을 사랑한다'로 생성하고, 구어체로 설정한 경우에는 '-한다'를 '-해'로 어미 변경함으로써 '사랑해'로 생성한다. 또한, 경어+문어체로 설정한 경우 '-한다'를 '-합니다'로 어미 변경하여 '나는 당신을 사랑합니다'라고 생성하고, 경어+구어체로 설정한 경우는 '-한다'를 '-해요'로 어미 변경하여 '나는 당신을 사랑해요'로 생성할 수 있다. When the user sets the writing style to a hard writing style, the generator 129 generates 'I love you', and when setting the colloquial style, the generator 129 generates 'I love' by changing '-to' to '-solution'. do. In addition, if it is set as a suffix + written language, it changes the ending to '-should' to '-I' to create 'I love you'. You can change it to "I love you."

그럼, 이상의 구성에 기초하여 사용자가 설정한 문체에 따라 어미를 생성하여 번역하는 방법에 대하여 도 6을 참조하여 설명한다. Next, a method of generating and translating the mother ending according to the style set by the user based on the above configuration will be described with reference to FIG. 6.

도 6은 본 발명의 실시 예에 따른 자동 번역 방법을 나타낸 순서도이다.6 is a flowchart illustrating an automatic translation method according to an embodiment of the present invention.

먼저, 입력부를 통해 번역할 원시 언어 문장을 입력 받는다(S100).First, input a source language sentence to be translated through the input unit (S100).

그리고, 입력부를 통해 번역할 문체를 입력받는다(S110).Then, through the input unit receives the style to translate (S110).

그러면, 번역부에서 입력부를 통해 입력된 원시 언어 문장을 형태소 단위로 분석하고 각 형태소를 품사나 의미, 전후 관계에 따라 통계적 자료를 기반으로 분석한다(S120).Then, the translator analyzes the primitive language sentences input through the input unit in morpheme units and analyzes each morpheme based on statistical data according to parts of speech, meaning, and context (S120).

이후, 분석한 구문 분석 결과를 기반으로 사전 저장부로부터 대역어를 추출하고 추출한 대역어에서 용언을 사용자가 설정한 문체로 변경하여 생성한다(S130, S140). 즉, 사용자로부터 입력부를 통해 입력받은 문체를 확인하고 설정된 문체에 해당하는 어미를 추출하여 대역어의 용언을 변경 생성한다.Subsequently, the band word is extracted from the dictionary storage based on the analyzed syntax analysis result, and the verb is changed into a style set by the user in the extracted band word (S130 and S140). That is, it checks the stylistic input from the user through the input unit, extracts the ending corresponding to the set stylistic, and changes the verbal language of the band word.

그리고, 생성된 번역문을 출력하여 표시부에 표시한다(S150).The generated translation is output and displayed on the display unit (S150).

한편, 본 발명은 이상에서 설명한 단어 정렬 방법을 소프트웨어적인 프로그램으로 구현하여 컴퓨터로 읽을 수 있는 소정 기록 매체에 기록해 둠으로써 다양한 재생 장치에 적용할 수 있다. Meanwhile, the present invention can be applied to various reproduction apparatuses by implementing the word alignment method described above as a software program and recording it on a computer-readable predetermined recording medium.

다양한 재생 장치는 PC, 노트북, 휴대용 단말 등일 수 있다. Various playback devices may be PCs, laptops, portable terminals, and the like.

예컨대, 기록 매체는 각 재생 장치의 내장형으로 하드 디스크, 플래시 메모리, RAM, ROM 등이거나, 외장형으로 CD-R, CD-RW와 같은 광디스크, 콤팩트 플래시 카드, 스마트 미디어, 메모리 스틱, 멀티미디어 카드일 수 있다. For example, the recording medium may be a hard disk, a flash memory, a RAM, a ROM, or the like as an internal type of each playback device, or an optical disc such as a CD-R or a CD-RW, a compact flash card, a smart media, a memory stick, or a multimedia card as an external type. have.

이 경우, 컴퓨터로 읽을 수 있는 기록 매체에 기록한 프로그램은, 앞서 설명한 바와 같이 입력부를 통해 번역할 원시 언어 문장을 입력받는 과정과, 상기 입력부를 통해 번역할 문체를 입력받는 과정과, 상기 입력부를 통해 입력된 원시 언어 문장을 구문 분석하여 분석한 결과를 기반으로 대역어를 추출하고 상기 입력부를 통해 입력받은 문체를 확인하여 상기 문체에 해당하는 어미를 생성하는 과정과, 상기 문체에 해당하는 어미를 생성한 번역문을 출력하는 과정과, 상기 번역문을 표시부에 표시하는 과정을 포함하여 실행될 수 있다. In this case, the program recorded on the computer-readable recording medium, as described above, the process of receiving a source language sentence to be translated through the input unit, the process of receiving a style to translate through the input unit, and through the input unit Extracting a band word based on a result of parsing the input source language sentence and analyzing the input language, and checking a style of the input style through the input unit to generate a mother corresponding to the style, and generating a mother corresponding to the style And outputting the translated text, and displaying the translated text on a display unit.

이상의 설명은 본 발명을 예시적으로 설명한 것에 불과하며, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술적 사상에서 벗어나지 않는 범위에서 다양한 변형이 가능할 것이다. 따라서 본 발명의 명세서에 개시된 실시 예들은 본 발명을 한정하는 것이 아니다. 본 발명의 범위는 아래의 특허청구범위에 의해 해석되어야 하며, 그와 균등한 범위 내에 있는 모든 기술도 본 발명의 범위에 포함되는 것으로 해석해야 할 것이다.The above description is merely illustrative of the present invention, and various modifications may be made by those skilled in the art without departing from the technical spirit of the present invention. Therefore, the embodiments disclosed in the specification of the present invention are not intended to limit the present invention. The scope of the present invention should be construed by the claims below, and all techniques within the scope equivalent thereto will be construed as being included in the scope of the present invention.

종래 기술에 따른 자동 번역은 천편일률적으로 딱딱한 문체로 제공되어 사용자의 활용 용도에 맞게 수작업으로 번역 문장을 수정해야 하나, 본 발명은 목적 언어의 용언을 어미 형태 변화에 따라 다양한 문체로 각각 구분하고, 문체도 불규칙 용언 및 규칙 용언에 따라 각각 구축해 둠으로써 번역 요청시 사용자로부터 원하는 문체로의 설정이 있으면 해당 문체에 해당하는 어미를 생성하여 어간과 함께 제공하여 사용자가 활용 용도에 맞는 다양한 문체로 제공함으로써 자동 번역의 활용도를 극대화할 수 있다.Although the automatic translation according to the prior art is provided in a uniform and uniform style, the translation sentence must be manually modified according to the user's use, but the present invention divides the language of the target language into various styles according to the change of the mother form, By constructing the styles according to irregular words and rule words, if there is a setting from the user to the desired style at the time of translation request, by creating a mother corresponding to the style and providing them with the stem, the user can provide various styles suitable for the purpose of use. Maximize the use of automatic translation.

100: 자동 번역 장치 110: 입력부
120: 번역부 121: 형태소 분석기
123: 태깅기 125: 구문 분석기
127: 변환기 129: 생성기
130: 표시부 140: 사전 저장부
142: 문체 DB 1422: 용언 정보 DB
1424: 문체 정보 DB
100: automatic translation device 110: input unit
120: Translation Unit 121: Morphological Analyzer
123: tagging 125: parser
127: Converter 129: Generator
130: display unit 140: dictionary storage unit
142: Style DB 1422: Verbal Information DB
1424: Stylistic Information DB

Claims (9)

번역할 원시 언어 문장을 입력하고 사용자가 원하는 문체를 설정할 수 있는 입력부;
상기 입력부에 입력된 원시 언어 문장을 구문 분석하고 구문 분석한 결과를 기반으로 대역어를 추출한 동시에 상기 대역어에 대하여 상기 입력부를 통해 설정한 문체에 해당하는 어미를 생성하여 최종 번역문을 출력하는 번역부;
상기 번역부로부터 출력되는 번역문을 표시하는 표시부
를 포함하는 것을 특징으로 하는 자동 번역 장치.
An input unit for inputting a source language sentence to be translated and setting a desired style of the user;
A translator that extracts a band word based on a result of parsing and parsing a primitive language sentence input to the input unit, and generating a final word corresponding to a style set through the input unit for the band word;
A display unit for displaying the translations output from the translation unit
Automatic translation device comprising a.
제 1 항에 있어서,
상기 구문 분석 및 상기 대역어와 관련한 사전 정보를 저장하고,
상기 어미를 다양한 문체에 따라 구분하여 저장하며 상기 어미가 불규칙하게 변하는 불규칙 용언을 구분하여 저장한 사전 저장부
를 더 포함하는 것을 특징으로 하는 자동 번역 장치.
The method of claim 1,
Storing dictionary information related to the parsing and the bandword,
The pre-storage unit stores the mother according to various styles and stores the mother word irregularly changed irregularly
Automatic translation device further comprises.
제 1 항에 있어서,
상기 문체는 구어체, 문어체, 경어체, 평서체, 비칭체, 간결체, 만연체, 우유체, 강건체, 화려체, 건조체를 포함하는 것을 특징으로 하는 자동 번역 장치.
The method of claim 1,
The written style is colloquial, written, ordinal, flat style, asymmetrical, simplified, rampant, milk, rigid, colorful, dried.
제 1 항에 있어서,
상기 표시부는,
다양한 문체에 대한 리스트와 선택 가능한 화면을 표시하는 것을 특징으로 하는 자동 번역 장치.
The method of claim 1,
The display unit,
An automatic translation device for displaying a list of various styles and a selectable screen.
입력부를 통해 번역할 원시 언어 문장을 입력받는 단계;
상기 입력부를 통해 번역할 문체를 입력받는 단계;
상기 입력부를 통해 입력된 원시 언어 문장을 구문 분석하여 분석한 결과를 기반으로 대역어를 추출하고 상기 입력부를 통해 입력받은 문체를 확인하여 상기 문체에 해당하는 어미를 생성하는 단계;
상기 문체에 해당하는 어미를 생성한 번역문을 출력하는 단계;
상기 번역문을 표시부에 표시하는 단계
를 포함하는 것을 특징으로 하는 자동 번역 방법.
Receiving a source language sentence to be translated through an input unit;
Receiving a style to translate through the input unit;
Extracting a band word based on a result of parsing and analyzing a primitive language sentence input through the input unit, and generating a mother corresponding to the style by checking a writing style input through the inputting unit;
Outputting a translation in which a mother corresponding to the writing style is generated;
Displaying the translation on a display unit;
Automatic translation method comprising a.
제 5 항에 있어서,
상기 어미는 다양한 문체에 따라 구분하여 저장되어 있으며 상기 어미가 불규칙하게 변하는 불규칙 용언을 구분한 것을 특징으로 하는 자동 번역 방법.
The method of claim 5, wherein
The mother is classified and stored according to a variety of styles and automatic translation method characterized in that the mother is divided into irregular words that change irregularly.
제 5 항에 있어서,
상기 문체는 구어체, 문어체, 경어체, 평서체, 비칭체, 간결체, 만연체, 우유체, 강건체, 화려체, 건조체를 포함하는 것을 특징으로 하는 자동 번역 방법.
The method of claim 5, wherein
The written style is colloquial, written, ordinal, flat style, asymmetrical, simplified, rampant, milk, rigid, colorful, dried.
제 5 항에 있어서,
상기 번역할 문체를 입력받는 단계는
상기 표시부에 다양한 문체에 대한 리스트와 리스트 중 어느 하나를 선택 가능한 화면을 제공하는 것을 특징으로 하는 자동 번역 방법.
The method of claim 5, wherein
The step of receiving the style to translate is
And a screen for selecting one of a list and a list of various styles in the display unit.
제 5 항 내지 제 8 항 중 어느 한 항에 의한 과정을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체. A computer-readable recording medium having recorded thereon a program for executing a process according to any one of claims 5 to 8.
KR1020100096600A 2010-10-05 2010-10-05 Translation apparatus and method for providing various style of translatability KR20120035244A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100096600A KR20120035244A (en) 2010-10-05 2010-10-05 Translation apparatus and method for providing various style of translatability

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100096600A KR20120035244A (en) 2010-10-05 2010-10-05 Translation apparatus and method for providing various style of translatability

Publications (1)

Publication Number Publication Date
KR20120035244A true KR20120035244A (en) 2012-04-16

Family

ID=46137179

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100096600A KR20120035244A (en) 2010-10-05 2010-10-05 Translation apparatus and method for providing various style of translatability

Country Status (1)

Country Link
KR (1) KR20120035244A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150116675A (en) * 2014-04-08 2015-10-16 네이버 주식회사 Method and system for providing translated result
KR20160052506A (en) * 2016-04-26 2016-05-12 네이버 주식회사 Method and system for providing translated result

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150116675A (en) * 2014-04-08 2015-10-16 네이버 주식회사 Method and system for providing translated result
US9760569B2 (en) 2014-04-08 2017-09-12 Naver Corporation Method and system for providing translated result
US9971769B2 (en) 2014-04-08 2018-05-15 Naver Corporation Method and system for providing translated result
KR20160052506A (en) * 2016-04-26 2016-05-12 네이버 주식회사 Method and system for providing translated result

Similar Documents

Publication Publication Date Title
US11734514B1 (en) Automated translation of subject matter specific documents
US20190163691A1 (en) Intent Based Dynamic Generation of Personalized Content from Dynamic Sources
KR102195627B1 (en) Apparatus and method for generating translation model, apparatus and method for automatic translation
KR101762866B1 (en) Statistical translation apparatus by separating syntactic translation model from lexical translation model and statistical translation method
CN100437557C (en) Machine translation method and apparatus based on language knowledge base
JP2015201169A (en) Translation result providing method and system based on various semantic categories
US9026430B2 (en) Electronic device and natural language analysis method thereof
US10565982B2 (en) Training data optimization in a service computing system for voice enablement of applications
US10553203B2 (en) Training data optimization for voice enablement of applications
JP2017199363A (en) Machine translation device and computer program for machine translation
KR101426214B1 (en) Method and system for text to speech conversion
US9547645B2 (en) Machine translation apparatus, translation method, and translation system
KR101541170B1 (en) Apparatus and method for summarizing text
KR20120035244A (en) Translation apparatus and method for providing various style of translatability
KR20120045906A (en) Apparatus and method for correcting error of corpus
US8965750B2 (en) Acquiring accurate machine translation
JP2019053262A (en) Learning system
KR20160140527A (en) System and method for multilingual ebook
KR101501459B1 (en) Translation apparatus and method for providing various style of translatability
JP2005182794A (en) Data processing method and system for normalization of linguistic structure
KR20110137961A (en) Apparatus and method for translating using overlay of the original and translation
KR20120046409A (en) Apparatus and method translating using word for individual translation field
KR20120046414A (en) Apparatus and method for providing result of mid-translation processing
KR101670995B1 (en) Statistical Machine Translation System based on Word Reordering and Morpheme Difference and Method thereof
KR20120007785A (en) Apparatus and method for translating using filtering

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application