WO2016043539A1 - 소번역메모리를 포함하는 번역 메모리, 그를 이용한 역방향 번역메모리 및 이들을 기록한 컴퓨터 판독가능한 저장매체 - Google Patents

소번역메모리를 포함하는 번역 메모리, 그를 이용한 역방향 번역메모리 및 이들을 기록한 컴퓨터 판독가능한 저장매체 Download PDF

Info

Publication number
WO2016043539A1
WO2016043539A1 PCT/KR2015/009779 KR2015009779W WO2016043539A1 WO 2016043539 A1 WO2016043539 A1 WO 2016043539A1 KR 2015009779 W KR2015009779 W KR 2015009779W WO 2016043539 A1 WO2016043539 A1 WO 2016043539A1
Authority
WO
WIPO (PCT)
Prior art keywords
translation
small
memory
unit
translation memory
Prior art date
Application number
PCT/KR2015/009779
Other languages
English (en)
French (fr)
Inventor
이시용
Original Assignee
특허법인 남앤드남
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 특허법인 남앤드남 filed Critical 특허법인 남앤드남
Publication of WO2016043539A1 publication Critical patent/WO2016043539A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Definitions

  • the present invention relates to a new translation memory (TM) used when translating original text in a source language into translated text in a target language, and to create a new translation memory.
  • TM translation memory
  • CAT computer-assisted translation
  • Translation memory is a database that stores "segments" that are units such as sentences, paragraphs, or previously translated sentences to help humans translate.
  • the translation memory stores the original text of the original text and the translation corresponding to the language pair called "translation units". Individual words are not within the domain of the translation memory, but are processed by the term bases.
  • TMX International standard format
  • CAT Computer Aided Translation
  • TMX is a vendor-neutral open XML standard for the exchange of translation memory data created with Computer Aided Translation (CAT) and localization tools. The goal of TMX is to make it easier to exchange translation memory data between tools and translators while minimizing significant data loss in the process.
  • the translation unit of the translation memory conventionally stores translations of sentences or paragraphs or more
  • the conventional original sentence unit translation memory has been used for newly translated original sentences when the original sentence matches 100%.
  • the translator since the detailed correspondence between the original text and the translated text is not displayed, if the original text to be translated is matched with the original text in the stored translation memory when the matching rate is 80% to 90%, the translator is only displayed to the translator for reference. Further down, calling the translation memory did not really help the translator in terms of translation accuracy and time savings.
  • Conventional translation memory maintains the accuracy when the original text is 100% identical, but when it is displayed for reference by 80% to 90%, the translator modifies the original text by comparing the original text with other parts. . In the translation, it is very unlikely that the original sentence matches 100% of the original sentence in the translation memory, so the translation memory did not really help the translator.
  • translation programs and CATs that are generally sold have up to 95% accuracy in machine translations in Japanese and Korean, which are translations between deadlocks, and English and German translations, which are translations between refractive languages, also have high accuracy. Translation between deadlocks is relatively low in accuracy due to differences in word order.
  • the conventional translation memory has a problem that the translation memory reuse rate is significantly low because the translation memory is stored in units of sentences.
  • the existing verification program for verifying an error that the original sentence is properly translated into the translated sentence has a problem that performance is degraded as there are duplicate words in the sentence or the sentence length is longer because sentence verification is performed.
  • the problem to be solved by the present invention is to find a method for maximizing the translation of the original text to translate the matching portion of the translation memory even in translation memories with low matching rate, to increase the reuse rate of the translation memory, duplicate words in the sentence In order to maintain the verification performance of detecting translation errors even if the sentence is long or the sentence length is long.
  • the present invention provides a method of defining and translating a new translation memory storage format in order to compensate for the disadvantages of the conventional translation memory in order to increase the utilization of the translation memory. This allows translators to translate more accurately and quickly in terms of translation accuracy, translation error checking, and translation time.
  • Another problem to be solved by the present invention is a new translation memory that can be used in automatic translation programs and CAT programs having a translation accuracy that overcomes differences in word order in translation between refractive and deadlocks and approximates translation accuracy between deadlocks and translations using the same. To provide a way.
  • a translation unit subdividing a translation unit (TU), which is an original sentence, and a translation memory (TM) without breaking the translation speed of translating the original sentence into a translation sentence
  • Sub-TM having a pair of sub-translations, which is a translation part of the sub-translation unit, and corresponding to the sub-unit for each sub-translation memory including the small translation unit and the small translation.
  • a related indicator is specified.
  • the small translation unit that the user built the translation memory at the same time as the translation and translated it once reduces the typing time by importing, replacing, or modifying the small translation, which is the translation part of the translation.
  • the present invention provides a method of using a translation memory including a small translation memory.
  • the translation memory is used to translate an original sentence in a source language into a translation sentence in a target language.
  • the translation memory stores the original sentences and the corresponding translation sentences, and a small translation memory is formed for each small translation unit in which the original sentences are subdivided into translation subunits, and the small translation unit and the small translation unit are each small translation unit. And a subunit correspondence indicator indicating the correspondence between and each subtranslation.
  • a small translation unit position information which is information indicating an alignment position in an original sentence of a small translation unit
  • a small translation position position information which is information indicating an alignment position of a small translation sentence in a translated sentence
  • the small translation unit position information includes a number that can specify the order within the original sentence between the small translation unit, the small translation position information is a number that can specify the order within the translation sentence between the small translations It does not include.
  • the small translation unit position information includes a number that can specify the order within the original sentence between the small translation unit, the small translation position information is a number that can specify the order within the translation sentence between the small translations Include.
  • the small translation unit position information indicates a cumulative number of words belonging to one or more words or words belonging to the small translation unit within the original sentence, and the small translation sentence position information indicates the small translation sentence in the translation sentence. The cumulative number of words in the word or one or more words.
  • each sub-translation unit consists of one or more parsing units, each of which is a collection of one or more words or phrases to which the word belongs, wherein each parsing unit is a parsing unit in the original sentence. Is an array of one or more words constructed through stemming.
  • each small translation unit is a sequential plurality of parsing units, and does not require rearrangement of the plurality of parsing units constituting each small translation unit when sorting the small translations according to the order in the translation sentence. It consists of a plurality of sequential parsing units.
  • the original sentence is divided into a plurality of parsing units based on the word or part of speech of the original sentence.
  • a plurality of original sentences are sequentially executed from the beginning of the original sentence, in front of and behind a word or morpheme to which a part of speech belongs, and after a morpheme to which a word or words to which a part of speech belongs is a noun or a pronoun.
  • a word or morpheme to which a word or words to which a part of speech belongs is a noun or a pronoun.
  • the original sentence is further divided into a plurality of parsing units, sequentially from the beginning of the original sentence, in front of the word or morpheme to which the words belong to a preposition.
  • a text sentence is a plurality of original sentences sequentially from the beginning of the original sentence, in front of and behind a word or morpheme to which a part of speech is a noun, pronoun, verb, adjective, adverb, preposition, conjunction or adjective. It is divided into parsing units.
  • a method of storing a translation memory used for translating an original sentence in a source language into a translation sentence in a target language in a boilerplate includes: storing the original sentence and a corresponding translation sentence in a translation memory.
  • a small translation memory including small translations is formed for each small translation unit storing and subdividing the original sentence into translation sub-units, and the small translation unit and the small translation correspond to each small translation unit and each small translation.
  • a method of applying a translation memory used for translating an original sentence in a source language into a translation sentence in a target language to reverse translation includes: converting the original sentence and a corresponding translation sentence into a translation memory. Subunit correspondence for each subtranslation unit that stores and subdivides the original text into translation subunits, and indicates the correspondence between each subtranslation unit and each subtranslation in the subtranslation unit and the subtranslation.
  • a translation memory used for translating a source sentence in a source language into a translation sentence in a target language in a reverse translation in which the target language becomes the original source language and the source language becomes the target language.
  • the reverse translation memory including a small translation memory for
  • the translation memory stores the original sentence and the translation sentence corresponding thereto,
  • a small translation memory is formed for each of the small translation units subdividing the original sentences into translation subunits, the small translation sentence being a translation sentence,
  • a sub-unit correspondence indicator indicating a correspondence between each sub translation unit and each sub translation is designated.
  • a small translation unit corresponding to the small translation unit of the translation memory is a small translation unit of the reverse translation memory
  • the small translation unit of the translation memory is a small translation sentence of the reverse translation memory
  • the small translation sentence position information of the translation memory including the small translation memory becomes the small translation unit position information of the reverse translation memory, and the small translation unit position information of the translation memory including the small translation memory is the small translation sentence position information of the reverse translation memory.
  • a translation memory used for translating a source sentence in a source language into a translation sentence in a target language is applied to a reverse translation in which the target language is the original source language and the source language is the target language.
  • the method of forming a reverse translation memory including a small translation memory for
  • the translation memory stores the original sentence and the translation sentence corresponding thereto,
  • a small translation memory is formed for each of the small translation units subdividing the original sentences into translation subunits, the small translation sentence being a translation sentence,
  • a sub-unit correspondence indicator indicating a correspondence between each sub translation unit and each sub translation is designated.
  • the small translation unit corresponding to the small translation unit of the translation memory becomes the small translation unit of the reverse translation memory, and the small translation unit of the translation memory is the reverse direction for use in the reverse translation in which the target language is the original sentence and the original language is the translation sentence.
  • the small translation unit of the translation memory is the reverse direction for use in the reverse translation in which the target language is the original sentence and the original language is the translation sentence.
  • the small translation sentence position information of the translation memory including the small translation memory becomes the small translation unit position information of the reverse translation memory, and the small translation unit position information of the translation memory including the small translation memory is the small translation sentence position information of the reverse translation memory.
  • a method for generating a translation memory which is used for translating an original sentence in a source language into a translation sentence in a target language, includes storing the original sentence and a corresponding translation sentence in the translation memory.
  • a small translation which is a translation of the small translation unit, is formed and sorted, and the translated sentence is stored, and each small translation is stored in the small translation unit and the small translation.
  • a translation memory applying apparatus including a small translation memory obtained by translating an original text sentence in a source language into a small translation unit for subdividing the original sentence into a target language,
  • a user interface unit for inputting a new original text to be newly translated
  • a morphological analysis unit for analyzing the morphemes of the words constituting the imported original text to be translated
  • a translation memory generation unit including a small translation unit determination unit that sequentially determines the small translation unit from the first one parsing unit to be translated, and a small translation memory that generates and sorts the small translation text.
  • Start parsing unit by specifying the end parsing unit in reverse order while sequentially removing the next parsing unit from the first one parsing unit to be translated as the starting parsing unit, and then sequentially starting from the parsing unit located at the end of the original text to be translated.
  • a comparison unit for comparing one or more parsing units to be translated with a small translation memory DB from a starting parsing unit to an ending wave unit;
  • the comparison unit compares the sequential parsing units constituting the original text to be translated with one or more small translation units in the original text of the small translation memory DB to compare one or more small translations in the original text of the small translation memory DB. Determine the longest sequential parsing unit that matches the unit as one small translation unit,
  • the small translation unit is translated to generate a new sub-translation memory, and a sub-unit correspondence indicator is specified, or in d) all the sub-translation units of the original text are sequentially determined. After that, new sub-translations are generated by translating the sub-translation units, and the sub-unit correspondence indicators are collectively assigned to the new sub-translations.
  • a translation memory application program including a small translation memory that is translated into a target language with respect to a sub-translation unit that subdivides an original sentence into an original language
  • a basic translation memory matching unit 20 for inputting a new original sentence to be newly translated
  • a morphological analysis unit 40 for analyzing the morphemes of the words constituting the imported original text to be translated
  • the first parsing unit to be translated is compared by comparing whether the sequential parsing units constituting the original text to be translated in the comparing unit 60 match one or more small translation units in the original text of the small translation memory DB.
  • a small translation unit determining unit 70 that sequentially determines, as one small translation unit, the longest sequential parsing unit that at least partially matches one or more small translation units in the original text of the small translation memory DB;
  • a translation memory including a pair of original sentences in an original language and translation sentences in a target language and including a subunit translation memory (hereinafter referred to as "small translation memory”) is a small translation memory.
  • small translation memory Includes a small translation unit subdividing the original sentence into translation subunits, and a pair of small translation sentences which are translation portions in the translation sentence corresponding to the small translation unit, wherein the translation memory indicates a subunit correspondence specifying the small translation memory in the translation memory.
  • the correspondence relationship between the small translation unit and the small translation pair of the small translation memory in the translation memory by the subunit correspondence indicator is a small translation memory.
  • the sub-unit correspondence indicator is a small translation unit position information (8 ') which is information indicating a position in a source sentence of a small translation unit, and a small translation sentence position information which is information indicating a position in a translation sentence of a small translation sentence. (8 ").
  • the original sentence of the translation memory is composed of a plurality of small translation units
  • the translation sentence of the translation memory is composed of small translation sentences corresponding to the plurality of small translation units, each of the small translation units
  • the correspondence relations of the sub-translations for the sub-correspondence indicators are indicated by the sub-correspondence indicators, and the sub-translational unit position information of the sub-correspondence indicators can indicate the subdivided position in the original sentence of each sub-translation unit. It includes numbers, and the small translation position information of the sub-correspondence indicators includes numbers that can indicate the position in the translation sentence of each of the small translations.
  • the numbers capable of indicating the subdivided position in the original sentence of each of the small translation units are the starting position of the first character of each of the small translation units, and the last character of each of the small translation units.
  • Numbers indicating one or more of the ending positions, and which may indicate a position in the translation sentences of each of the small translations are one or more of the beginning of the first character of each of the small translations and the ending position of the last character of each of the small translations. To indicate.
  • numbers that may indicate a position in a translation sentence of each of the small translations further indicate a position indicating a sorting order of each of the small translations in the translation sentence.
  • the small translation located in front of two adjacent small translations is the inserted small translation. It may include an insertion position indicator that indicates the position in which the sub-language (hereinafter referred to as "insert sub-translation”) located in the back.
  • the inserted small translation is specified by the insertion position indicator into the first half and the second half based on the position of the insertion position indicator, and can indicate the position in the translation sentence of the inserted small translation.
  • the numerals indicate one or more of the start position of the first character of the first half of the inserted subtranslation text and the end position of the last character of the first half, and the at least one of the start position of the first character of the second half and the end position of the last character of the second half.
  • the original sentence of the translation memory is composed of a plurality of small translation units, small translations corresponding to some of the plurality of small translation units are formed, and some small translation units and some small translation units
  • the correspondence relationship between Korean and English sub-translations is indicated by the sub-unit correspondence indicator, and the sub-translation unit position information of the sub-unit correspondence indicator includes numbers that can indicate the subdivided position in the original sentence of some sub-translation unit.
  • the small translation position information of the corresponding subunit indicator includes numbers that can indicate the position in the translation sentence of the small translation.
  • a translation memory comprising a small translation memory according to the invention is recorded in a computer readable storage medium.
  • the small translation unit corresponding to the small translation unit of the translation memory is used for the reverse translation in which the target language is the original sentence and the original language is the translation sentence.
  • the small translation unit of the translation memory becomes the small translation sentence of the reverse translation memory
  • the small translation sentence position information of the translation memory including the small translation memory becomes the small translation unit position information of the reverse translation memory, and includes the small translation memory.
  • the small translation unit position information in the translation memory becomes the small translation sentence position information in the reverse translation memory.
  • a reverse translation memory including a small translation memory is stored in a computer readable storage medium.
  • a translation memory including a pair of original sentences in an original language and translation sentences in a target language and including a subunit translation memory (hereinafter referred to as "primary small translation memory") is a primary
  • the small translation memory includes a pair of primary small translation units that subdivide original sentences into translation subunits and primary small translation sentences which are translation portions in the translation sentences corresponding to the first small translation unit, wherein the translation memory is 1 within the translation memory.
  • the primary subunit correspondence indicator specifying the primary sub-translation memory, and the correspondence relationship between the primary small translation unit and the primary small translation pair of the primary sub-translation memory in the translation memory by the primary sub-unit correspondence indicator.
  • the primary small translation memory may include a secondary small translation memory, which is an additional small translation memory further subdividing the primary small translation memory, and in the case of including the secondary small translation memory, the primary Includes a pair of secondary sub-translation units, which are further subdivisions of the primary sub-translation units of the translation memory, and a pair of secondary sub-translation sentences corresponding to the second sub-translation unit, with the secondary sub-translation memory being 2
  • a secondary subunit correspondence indicator specifying a secondary sub-translation memory, wherein the secondary subunit correspondence relationship indicator indicates a correspondence relationship between the secondary sub-translation unit and the secondary small translation pair of the secondary sub-translation memory.
  • the secondary subunit correspondence indicator is the first small translation of the second small translation unit position information and the second small translation, which is information indicating the position in the first small translation unit of the second small translation unit. It includes the location information of the second small translation, which is information indicating my location.
  • the primary small translation unit of the primary small translation memory is composed of a plurality of secondary small translation units, and the primary small translation sentence of the primary translation memory is assigned to the plurality of secondary small translation units. Consisting of corresponding secondary sub-translations, the correspondence between the secondary sub-translational units and the secondary sub-translations is indicated by the secondary sub-unit correspondence indicators, and the small translation of the secondary sub-unit correspondence indicators.
  • the unit location information includes numbers that can indicate the location subdivided into sub-units within each primary sub-translation unit of each of the secondary sub-translation units. Each contains a number to indicate its position in the first minor translation.
  • the numbers capable of indicating subdivided positions into subunits within the primary sub-translation units of each of the secondary sub-translation units are the starting position of the first character of each of the secondary sub-translation units
  • the secondary Numbers indicating one or more of the end positions of the last character of each of the minor translation units, and which can indicate the position in the primary minor translation of each secondary minor translation are the starting position of the first character of each of the secondary minor translations.
  • the ending positions of the last character of each of the secondary minor translations are the starting position of the first character of each of the secondary minor translations.
  • the numbers capable of indicating the position in the primary minor translations of each of the secondary minor translations further indicate the position indicative of the sorting order of each of the secondary minor translations in the primary minor translation.
  • the secondary small translation positioned in front of two adjacent secondary small translations (hereinafter referred to as “inserted secondary small translation”).
  • Translation includes an insertion position indicator indicating the position at which a secondary minor translation (hereinafter referred to as” inserted secondary minor translation ”) is inserted into the inserted secondary minor translation.
  • the inserted secondary small translation when the inserted secondary small translation includes the insertion position indicator, the inserted secondary small translation is specified by the insertion position indicator into the first half and the second half based on the position of the insertion position indicator.
  • Numbers that can indicate the position in the first minor translation of the inserted secondary minor translation shall be one or more of the beginning of the first character of the first half of the inserted secondary minor translation and the end of the last character of the first half of the inserted secondary minor translation, and the first character of the latter half.
  • the primary small translation unit of the primary small translation memory is composed of a plurality of secondary small translation units, and a secondary small translation sentence corresponding to some of the plurality of secondary small translation units is formed.
  • the correspondence between the secondary sub-translation statements for some secondary sub-translational units and some secondary sub-translational units is indicated by the secondary sub-unit correspondence indicator, and the small translation unit position information of the secondary sub-unit correspondence indicator Contains numbers that can indicate the location of the subdivision into subunits within some of the secondary subtranslation units.
  • a translation memory including a primary small translation memory and a secondary small translation memory is recorded in a computer readable storage medium.
  • a target language may be selected from a translation memory including a primary small translation memory and a secondary small translation memory.
  • the reverse translation memory including a small translation memory for applying to a reverse translation in which the original language is the original language and the original language is the target language is one of the translation memories for use in the reverse translation in which the target language is the original sentence and the original language is the translation sentence.
  • the first small translation and the second small translation corresponding to the first small translation unit and the second small translation unit become the first small translation unit and the second small translation unit of the reverse translation memory
  • the first small translation unit of the translation memory and The second small translation unit becomes the first small translation and the second small translation of the reverse translation memory
  • the first small translation position location information of the translation memory including the first small translation memory is The first small translation unit position information of Lee
  • the first small translation unit position information of the translation memory including the first small translation memory becomes the first small translation sentence position information of the reverse translation memory, and includes the second small translation memory.
  • the secondary small translation position information of the translation memory is the secondary small translation unit position information of the reverse translation memory
  • the secondary small translation unit position information of the translation memory including the secondary small translation memory is the secondary information of the reverse translation memory. It becomes the small translation position information.
  • a reverse translation memory including a small translation memory is recorded in a computer readable storage medium.
  • the present invention includes a small translation that translates a small translation unit subdivided into small translation units in the translation memory by improving the translation memory of the original source language and the target language, and when the small translation is aligned to complete the translation sentence. And a subunit correspondence indicator having alignment position information of. Small translations containing such indicators, when translating the original language, do not match the text within the original text, even if the original text of the original language to be translated does not match 100% of the previously translated original text stored in translation memory. By using the small translation memory, the translation memory is available for a part of the original text, thereby improving the accuracy of the translation and reducing the translation time.
  • the translation memory corresponding to the small translation unit can be used. Therefore, the translation time can be shortened by increasing the frequency of use of the translation memory. .
  • the error can be checked by a small translation unit that subdivides the original sentence into a small translation unit (or a small translation memory unit if it is stored in the translation memory) rather than an error check by the original sentence vs. the translation sentence.
  • Automatic error checking by the user is accurate and faster, reducing the review time to verify that the translation is correct.
  • the term extraction through the program becomes accurate, and the small translation unit is Because it is part of the phrase that makes up the original sentence, even if the machine translation for the small translation unit, the translation accuracy within the small translation unit increases.
  • the conventional original sentence to translation sentence error check program if the same word or number in the original sentence is present more than once, the problem that can not check the error because it can not accurately distinguish the position of the same word or number in the original sentence.
  • the error checking of the small translation unit versus the small translation unit of the present invention the probability that the same word exists in the small translation unit is significantly reduced than the probability that the same word or number exists in the original sentence, thereby greatly improving the performance of the error checking program. Can be.
  • the error checking of the small translation unit to the small translation unit of the present invention can be improved in parallel with the error check for the original text sentence to the translation sentence.
  • Small translation sentences including small translations for subdivided sub-translational units of the original sentence, consisting of words or words that contain words in the original sentence stored in the small translation memory database.
  • sentence component analysis the sentence component analysis of the original sentence is accurate (for example, the sentence component of the small translation unit of the original sentence can be estimated by analyzing the main sentence, the target investigation, and the supplementary investigation of the translated sentence), Corresponding small translations of the words in the original sentence can be extracted accurately, thereby increasing the utilization of the translation memory.
  • the memory is divided into small translation memories and stored in the translation memory storage step, the translation memory including the original text and the translated text is divided into translation subunits using a statistical method and is more accurate than the statistics-based partitioning method for finding translation rules. It is much higher, and there is no need to collect a lot of translation memory data to improve the accuracy of data statistical analysis in statistical based automatic translation.
  • the target language of the original text is divided into small translation units according to the morphological analysis in translation between refractive words and interstitial languages having different linguistic order, and the corresponding small translation and small translation memory are formed.
  • the small translations can be quickly sorted into the translation sentences of the target language, so that the small translation memory necessary for the translation between the refractive language and the deadlock can be quickly and accurately constructed.
  • the number of small translation memories to be applied to the new original text increases, so that the user can reduce the time for typing directly by using a CAT program without directly translating the small translation units. Will be faster.
  • 1A and 1B show a conventional translation memory.
  • 2A is an embodiment of an input unit and a display unit of a user interface unit for generating an intermediate stage small translation memory made for storage into a translation memory including a small translation memory according to the present invention.
  • 2B is another embodiment of an input unit and a display unit of a user interface unit for generating a small translation memory according to the present invention.
  • 2C and 2CC illustrate embodiments of a primary small translation memory input unit for generating a primary small translation memory and a secondary small translation memory input unit for generating a secondary small translation memory according to the present invention.
  • 2D is an embodiment of an insertion sort for small translations of two adjacent small translation memories in an input unit of a user interface unit for generating the small translation memory according to the present invention.
  • 3A to 3L are exemplary embodiments of a translation memory including a small translation memory according to the present invention.
  • FIG. 4 is a block diagram illustrating an apparatus for applying a translation memory including a small translation memory according to an embodiment of the present invention.
  • 5A to 5D illustrate an example of reverse translation memory using a translation memory including a small translation memory according to the present invention.
  • FIG. 6 is a flowchart illustrating an embodiment of a method of using a translation memory including a small translation memory according to the present invention.
  • FIG. 7 is a flowchart of another embodiment of a method of using a translation memory including a small translation memory according to the present invention.
  • FIG. 8A illustrates an embodiment of a translation memory corresponding to FIG. 3D, including a small translation memory in which the original language is English and the target language is Japanese
  • FIG. 8B illustrates a small translation memory in which the original language is English and the target language is Japanese
  • 3 illustrates an embodiment of a translation memory corresponding to FIG. 3E.
  • FIG. 8C illustrates an embodiment of a translation memory corresponding to FIG. 3D, including a small translation memory in which the original language is English and the target language is Chinese
  • FIG. 8D illustrates a small translation memory in which the original language is English and the target language is Chinese
  • 3 illustrates an embodiment of a translation memory corresponding to FIG. 3E.
  • the present invention is described using English as the original sentence and Korean as the translated sentence.
  • the present invention may be used or applied to a translation memory constructed by translating a refractive language into a deadlock, or a translation memory constructed by translating a deadlock into a refractive language.
  • Original sentence (1) Translation units of the sentence to be translated in the original language.
  • the translation unit may be designated as a paragraph original sentence or a unit smaller than the original sentence, but in the present invention, except for being specifically stated otherwise, the original sentence stored in the translation memory is a translation unit.
  • Translation sentence (6) A translation sentence in which the original sentence to be translated in the original language is translated into the target language, which is paired with the original text that becomes the translation unit (TU) to form a translation memory.
  • TU translation unit
  • Parsing Unit A unit in which a computer can be a sub-translational unit through morphological analysis in a text sentence that is a translation unit (TU). It is an aggregate.
  • Small translation unit (2), small translation (7), and small translation memory (9) A small translation unit is a unit that subdivides a translation unit (TU) that is translated into translation sentences into several subunits, and constitutes one or more parsing units. Can be.
  • TU translation unit
  • Small translations are defined as partial translations within a translation sentence corresponding to the small translation unit of the original text of the translation memory.
  • the small translation is the translation part of the small translation unit, and when the small translations of the small translation units are sorted, the translation sentence becomes.
  • the original sentence of the translation memory is composed of a plurality of small translation units
  • the translation sentence of the translation memory is composed of small translations corresponding to the plurality of small translation units
  • the small translations corresponding to the plurality of small translation units Sorting can complete the translated sentence.
  • the small translation memory includes a small translation unit and a pair of small translations corresponding to the translation.
  • the translation memory includes the small translation memories.
  • the translation memory including the small translation memory includes a translation including the original sentence (1), which is a translation unit including the small translation unit (2), and a small translation (7), which is a translation part of the small translation unit (2).
  • the original sentence when the original sentence is a translation unit, the original sentence can be divided into a number of small translation unit, the translation unit (TU), the small translation unit is stored in the small translation unit of the small translation memory already stored It may be determined by the small translation unit of the small translation memory and the partitioning pattern already stored.
  • the translation unit TU
  • the small translation memory itself may be further subdivided to have a secondary small translation memory including a secondary small translation unit 202, a secondary small translation sentence 207, and a secondary small unit correspondence indicator 208.
  • a small translation memory having a secondary small translation memory is called a primary small translation memory.
  • Subunit correspondence indicator (8) An indicator indicating a sub-unit correspondence between the small translation unit (2) of the original sentence (1) and the small translation sentence (7) of the translation sentence. Since the memory is specified by the subunit correspondence indicator in the translation memory, the number of subtranslational memory is equal to the number of subunit correspondence indicators.
  • the sub-unit correspondence indicator (8) includes sub-translation unit position information (8 '), which indicates the alignment position in the original sentence of the small translation unit, and sub-translation position information (8 "), which indicates the alignment position in the translated sentence of the small translation unit.
  • the minor translation sentence position information (8 ") designates the alignment position between the small translation sentences which comprise one translation sentence.
  • the small translation is a translation portion of the small translation unit (2) of the original text constituting the translation memory, and is a translation portion of the small translation memory generated by translating the small translation unit (2). If the translation is arranged according to the small translation position information (8 "), it becomes the translation sentence of the translation memory.
  • Intermediate Level Subunit Correspondence Indicator (4) In the process of translating and sorting the small translation units (2) sequentially, this indicates the correspondence between the small translation unit (2) and the small translation unit (2). Includes the sequence number of the translation parts of a small translation unit (2) before being stored as a subunit correspondence indicator (6).
  • the translation memory including the small translation memory of the present invention may be displayed as a translation memory including the intermediate level subunit correspondence indicator 4 (FIGS. 2A and 2B).
  • Insertion position indicator (5) An indicator included in the small translation position information that indicates the insertion of adjacent small translations located at the back into the small translation located at the front of two adjacent small translations. In order to complete the later translation sentence, it is a mark indicating the position where one of the two small translations is inserted into the other small translation according to the sorting order.
  • Reverse Subunit Correspondence Indicator When the subunit correspondence indicator extracted from the translation memory including the small translation memory generates a reverse small translation memory in which the original language and the target language are inverted, the small translation unit and the small translation of the reverse small translation memory Is a subunit correspondence indicator 144 specified.
  • Word A node in a coat that forms a sentence.
  • the minimum unit of a sentence component which is a unit of spacing.
  • I am going home means "I / am / going / home.” It is defined as consisting of four words.
  • Word The smallest unit of a word that has independence and separation. It consists of at least one morpheme and has a certain meaning. In English, words and words coincide. In Korean, words are searched and attached to words.
  • FIG. 4 is a block diagram illustrating an apparatus for applying a translation memory including a small translation memory according to an embodiment of the present invention.
  • Create user interface unit 10 basic translation memo matching unit 20, morphological analysis unit 40, sentence parsing unit 50, comparison unit 60, small translation unit determination unit 70, subunit correspondence indicator A unit 80, a translation memory generation unit 90 including a small translation memory, a translation memory database including a small translation memory 100 (hereinafter referred to as a "small translation memory DB”), and a small translation memory generation unit 110
  • a translation memory DB 120 hereinafter referred to as an "expanded small translation memory DB" including an extended small translation memory.
  • the user interface unit 10 includes an intermediate translation memory input unit 11 and a display unit 12.
  • the small translation unit may be determined and the determined small translation unit may provide sequential translation so that it can be stored in the small translation memory unit. If necessary, the user can adjust the length (number of words) of subdivided small translation units for the translation memory application device including the small translation memory through the intermediate small translation memory input unit 11, and the intermediate step.
  • the intermediate level small translation memory displayed from the small translation memory generating unit can be modified.
  • the display unit 12 displays to the user through the basic translation memory matching unit 20 if the original text is matched with the translation memory DB 100 including the small translation memory, and if mismatched, the original text is mismatched for morphological analysis. Print a sentence.
  • the basic translation memory matching unit 20 may determine whether the entire translation of the original text and the translation memory including the small translation memory are matched in the same manner as the conventional translation memory. It is determined from the basic translation memory matching unit 20 whether the basic translation memory DB and the original sentence match, and if there is a match, the translation sentence of the translation memory DB is displayed on the display unit 12 and stored in the translation memory DB including the small translation memory. If it does not match, the morphological analysis unit 40 performs a morphological analysis of the original sentence.
  • the sentence parsing unit 50 parses, after the words whose parts of speech are at least nouns, sequentially from the first word of the sentence among the stemmed words.
  • This parsing unit may be a minimum translation unit that the computer or user translates in the original text.
  • the comparison unit 60 determines whether the parsing unit parsed by the sentence parsing unit 50 matches the small translation unit of the original sentence in the small translation memory DB 100. In addition, it is determined whether the parsing unit parsed by the sentence parsing unit 50 matches the small translation unit of the original sentence in the extended small translation memory DB 120, and the result is output.
  • the small translation unit determination unit 70 determines the small translation unit according to the comparison result from the comparison unit 60 and displays it on the display unit 12, and the user can directly modify the small translation unit to be translated.
  • the translation memory generation unit 90 including the small translation memory includes an intermediate stage small translation memory generation unit 91 and a translation engine unit 92.
  • the intermediate stage small translation memory generating unit 91 is a small memory to be translated from the small translation and the small translation memory corresponding to the small translation unit in the translation memory DB and the small translation memory DB including the small translation memory.
  • the small translation memory for the translation unit is called and displayed on the display unit 12.
  • the translation engine unit 92 is a translation memory DB including a small translation memory and a small translation unit of a small translation memory and an extended small translation memory including a small translation sentence corresponding to the small translation unit in the extended small translation memory DB.
  • a translation memory DB or an extended small translation memory including a small translation memory The small translation unit of the small translation memory including the small translation unit corresponding to the small translation unit in the DB and the small translation unit of the extended translation memory are compared with the determined small translation unit, and the inconsistency is translated through the translation engine.
  • the inconsistency part is replaced with a translation of the translation engine, and the small translation of the small translation memory or the extended small translation memory including the small translation corresponding to the small translation unit in the translation memory DB or the small translation memory DB including the small translation memory Modify the unit.
  • the translation through the translation engine is not a machine translation of the whole sentence, but a machine translation of a small translation unit that breaks down the original sentence, which is a translation unit, and thus can have much higher accuracy than machine translation of the whole sentence. . Short machine translation takes into account a certain level of translation accuracy.
  • the sub-unit correspondence designator generation unit 80 determines the small translation unit position information (information indicating the alignment position in the original sentence of the small translation unit) in the original sentence. 4 ', 8'), and a small translation sentence position information (4 "), which is information indicating an alignment position in a translation sentence of a small translation sentence from a translation memory generation unit 90 including a small translation memory, which is associated with it. , 8 ").
  • the translation memory DB 100 including the small translation memory is a database storing the translation memory including the small translation memory generated from the translation memory generation unit 90 including the small translation memory.
  • the extended and small translation memory generating unit 110 includes a sentence component and type analysis unit 111 and a small translation memory analysis unit 112.
  • the translation memory of the present invention includes a small translation of subdivided sub-translation units of the original sentence, consisting of words or phrases containing words within the original sentence, so that the sentence component analysis of the original sentence is accurate. Since the corresponding translation part of the words in the sentence can be extracted accurately, the utilization of the translation memory is increased. For example, if the small translation is Korean from the information on the correspondence between the small translation and the small translation unit, the Korean can accurately identify the sentence components by the investigation. Therefore, the small translations are analyzed and the common sentence for the same original word in the original sentence is analyzed.
  • the extended small translation memory is subdivided from the extended memory of the conventional sentence unit translation memory, and thus is constructed for the small translation unit in the sentence, so that it is excellently accurate and has high utilization.
  • the sentence component and format analysis unit 111 analyzes the sentence components and sentence format of the translation memory including the small translation memory stored in the translation memory DB 100, and similar sentences in the intermediate small translation memory generation unit 91. It should be used for the translation of small translation units with components and forms.
  • the small translation memory analysis unit 122 analyzes the morphemes and sentence components of the small translation unit based on the small translation memories of the translation memory DB 100 to translate the translation patterns of the small translation memories having common verbs and nouns. Extend the DB.
  • a translation memory application program including a small translation memory that is translated into a target language with respect to a small translation unit subdividing an original sentence in an original language into a target language.
  • a basic translation memory matching unit 20 for inputting a new original sentence to be newly translated
  • a morpheme analysis unit 40 for analyzing the morphemes of the words constituting the imported original text to be translated
  • the first parsing unit to be translated is sequentially parsed from the next parsing unit as the starting parsing unit, and the ending parsing unit is designated in the reverse order while excluding one by one from the parsing unit located at the end of the original text to be translated.
  • the first one parsing unit to be translated is compared by comparing whether the sequential parsing units constituting the original text to be translated in the comparing unit 60 match one or more small translation units in the original text of the small translation memory DB.
  • a sequential translation unit determining unit 70 that sequentially determines, as one small translation unit, the longest sequential parsing unit that at least partially matches one or more small translation units in the original text of the small translation memory DB;
  • Figure 2a is an embodiment of an intermediate level small translation memory made for storing as a translation memory including a small translation memory according to the present invention
  • Figures 3a to 3l is a translation memory including a small translation memory according to the present invention Example.
  • the translation memory which includes a pair of original sentences in the original language and translation sentences in the target language, and includes a subunit translation memory (9), is a small translation unit (2) and a small translation unit that subdivides the original sentence into translation subunits.
  • a pair of small translations (7) which are translation portions in a translation sentence corresponding to a translation unit, wherein the translation memory includes a subunit correspondence indicator (8) specifying a small translation memory in the translation memory, and the subunit correspondence indicator
  • the correspondence relationship between the small translation unit and the small translation pair of the small translation memory is displayed in the translation memory.
  • the translation memory for the original text is as follows.
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
  • Intermediate Level Small Translation Memory Input Unit (11) A second operating BZ2 state [ 2nd operating BZ2 state may be ] 5-1 / can be a operating state [operating state .
  • the second operating BZ2 state may be an operating state in which a very small amount of fuel (in contrast to operating state BZ1) is metered in particular for catalytic heating.
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
  • the second operating BZ2 state may be an operating state in which a very small amount of fuel (as opposed to operating state BZ1) is metered in, especially for catalytic converter heating.
  • the translation memory for the original text is divided into '//' to store the original text and the translated text.
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// Secondary BZ2 state (as opposed to operating state BZ1) Very small amounts of fuel may be in an operating state, especially metered for catalytic converter heating.
  • the existing translation memory does not contain correspondence information on how words in the original sentence are translated in the translation sentence. It is only possible to infer the correspondence between the words through morphological analysis of both languages.
  • the following is an embodiment of a translation memory having a small translation memory including a small translation for each small translation unit which can know how the words in the original sentence are translated in the translated sentence according to the present invention (FIG. 3E).
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating. // The second operating BZ2 state is 4 / (in contrast to the operating state BZ1). Very small amounts of fuel may be in an operating state, especially metered for catalytic heating. [5-5,24-9,16-12,18-13,30-17,26-18,10-22]
  • subunit correspondence indicators (8) [5-5,24-9,16-12,18-13,30-17,26-18,10-22] are subunit correspondence indicators for each of the small translation memories.
  • 5-5 indicates the subunit correspondence indicator specified in the first sub-translation memory for the first sub-translation unit, and the subunit correspondence indicator specified in the second sub-translation memory for the second sub-translation unit.
  • Is 24-9, and the last 10-21 is the subunit correspondence designator specified in the seventh small translation memory for the seventh small translation unit.
  • the small translation unit position information (8 ') of the subunit correspondence indicator indicates the position of the small translation units in the original sentence
  • the small translation position information (8 ") indicates the position of the translation sentence in the small translation memory and the alignment of the corresponding small translation sentence. "-" Between the small translation unit position information and the small translation sentence position information indicates a correspondence relationship between the small translation memory corresponding to the small translation unit.
  • sub-unit correspondence indicators are displayed in the order of 'sub-unit correspondence indicators of sub-translation units,' '-,' and 'sub-unit correspondence indicators of sub-translation memories'.
  • [5-5,24-9,16-12,18-13,30-17,26-18,10-22] which are subunit correspondence indicators of the above embodiment, are respectively [1-5-1-5,19].
  • Small translation memory corresponding to small translation units of 24-5 to 9, 11 to 16-9 to 12, 18-13, 27 to 30-13 to 17, 19 to 26-18, 6 to 10-18 to 22 Correspondence relationship of is expressed as starting word (or word) and ending word (or word).
  • the first small translation unit is 1 to 5 words
  • the first small translation memory is 1 to 4 words
  • the second small translation unit is 19 to 24 words
  • the second small translation memory is 5 to 5 words. It is a word up to 8
  • the seventh small translation unit is a word from 6 to 10
  • the seventh small translation memory is a word from 18 to 21.
  • the final subunit correspondence indicator [5-5,24-9,16-12,18-13,30-17,26-18,10-22] of the format closest to the conventional translation memory is used. It can be seen that the correspondence relation of the small translation memory corresponding to s is omitted by omitting the starting position.
  • FIG. 3E shows the subunit correspondence indicators in the order of the translated sentences
  • the subunit correspondence indicators of FIG. 3F are [5-5, 10-22, 16-12, 18-13, 24-9, 26-18].
  • , 30-17] show the sub-corresponding relationship indicators in the translation memory including the small translation memory of FIG. 3E in the order of the original sentences.
  • FIG. 3G shows the subunit correspondence indicator on the basis of the unit in which the cursor moves to the subunit correspondence indicator in FIG. 3F.
  • the difference from FIG. 3f is that the small translation unit at which a very small amount / of fuel in the original sentence of FIG. 3f is merged to determine one small translation unit at which a very small amount of fuel. Therefore, the process of generating the small translation unit of the original text and the corresponding small translation and generating the subunit correspondence indicator is shown as follows.
  • a second operating BZ2 state 5 / can be a operating state 10- / at which a very small amount of fuel / (in contrast to operating state BZ1) [in contrast to operating state BZ1] 24- / is metered, 26- / especiallly for catalyst heating.
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
  • the second operating BZ2 state may be / in operation (in contrast to operating state BZ1) / a very small amount of fuel / especially for catalytic heating / metered / [5-5, 10-22, 18-13. , 24-9, 26-18, 30-17]
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
  • the second operating BZ2 state may be an operating state in which very small amounts of fuel (in contrast to operating state BZ1) are metered in particular for catalytic heating. [5-5, 10-22, 18-13, 24-9, 26-18, 30-17]
  • the subunit correspondence indicator may be expressed in units of moving the cursor (1 byte for general characters and 2 bytes for special characters) rather than word units. If the sub-correspondence indicator is displayed in the unit of movement of the cursor rather than the word, it is as follows.
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
  • the second operating BZ2 state may be an operating state in which a very small amount of fuel (in contrast to operating state BZ1) is metered in particular for catalytic heating.
  • the format of the sub-unit correspondence indicator is 'small translation unit position information
  • the sub-translational unit position information (0-28) of the subunit correspondence indicator is the first character (A) of the original sentence in the original sentence, and the last character (A) from the first character of the original sentence (') in the original sentence.
  • 0) of the sub-corresponding relation indicator indicates the first character of the translation sentence (' ze ') within the translation sentence.
  • the sort order of the small translation sentence ' may be in operation' of the second small translation memory is the last part of the sort order separated by the '
  • the rear translation when sorting the small translations of the small translation memories sorted by the sorting order, the rear translation is placed into a small translation in front of two adjacent small translations (hereinafter referred to as "inserted small translation"). It may include an insertion position indicator indicating a position where a small translation (hereinafter referred to as "inserted small translation”) is inserted, the inserted small translation by the insertion position indicator is based on the position of the insertion position indicator the first half ( 8a) and the second half 8b, the numbers capable of indicating a position in the translated sentence of the inserted minor translation are the beginning of the first character of the first half of the inserted minor translation 8a relative to the first character of the translated sentence. Position and end position of the last character of the first half 8a, and the start position of the first character of the second half 8b and the end position of the last character of the second half 8b with respect to the first character of the translation sentence. It instructs.
  • FIG. 2D shows an input unit 111 for generating a small translation memory into which small translations of a small translation memory arranged at the rear of two adjacent small translations are inserted at a ' ⁇ ' position in the small translations arranged at the front; 3J, 3K, and 3L are examples of small translation memories generated by such insertion alignment.
  • the long translation memory is longer while reducing the number of the small translation memories than when completing the translation sentence by the alignment only method. Can be generated.
  • the insertion position indicator '/' (Fig. 5) of the small translation position information of the subunit correspondence indicator is inserted into an insertion small translation arranged at the rear of two adjacent adjacent small translations.
  • is the small translation insertion position indicator indicating the insertion position of the small translation after the small translation.
  • the original text may be divided into two short sentences before the related company, and thus the original text may be divided into two small translation units.
  • the small translation unit location information and the small translation are as follows.
  • a second operating BZ2 state can be a operating state 10- /
  • the backward small translation must be inserted at the ' ⁇ ' position before the 'operation status' of the previous small translation.
  • a second operating BZ2 state can be a operating state 10- /
  • the small translation position information may be generated as follows.
  • a second operating BZ2 state can be a operating state
  • the subunit correspondence indicators of the small translation memory generated by the insertion alignment of FIG. 2D are shown as [10-5 / 22, 30-18] as shown in FIG. 3J.
  • ' ⁇ ' Is the insert indicator
  • the sub-translational position information of the subunit correspondence indicator 10-5 / 22 considering the position of ' ⁇ ' in the small translation [the second operation BZ2 state may be the ⁇ operation state] is 5 / 22.
  • 10 is the small translation unit position information of the first small translation memory
  • 5/22 represents the insertion position of the small translation sentence of the first small translation memory.
  • the small translation position information is 5 and in the completed translation sentence of 'may be in operation' behind ' ⁇ '. Since the translated sentence position information is 22, the small translated sentence position information of the subunit correspondence indicator of the first small translation memory is generated on 5/22.
  • Fig. 3K is a small translation memory generated by the insertion sort method by counting by one character unit to which the cursor is moved. As shown in Fig. 3K, in the method for displaying the first and last characters of the small translation unit and the small translation sentence, the '0' of the subunit correspondence indicator "0-53
  • the '/' symbol in the sub-unit correspondence designator indicates that the insert-to-insert sub-translation containing the '/' and the insert-to-back sub-translation containing the '/' are completed by insertion alignment, and behind the inserted sub-translation containing the '/' Insert Indicates that a minor translation is inserted.
  • the second working BZ2 state may be the ⁇ working state
  • the very small amount of fuel in contrast to operating state BZ1
  • the second operating BZ2 state may be the operating state.
  • a positional translation indicator ('/') indicating the position at which a small translation ("as opposed to operating state BZ1"), in contrast to very small amounts of fuel, is metered specifically for catalytic heating
  • the inserted small translation is inserted into the first half 8a (“second operation BZ2 state") and the second half 8b ("operation state” based on the position of the insertion position indicator by the insertion position indicator.
  • Digits that can indicate a position in a translation sentence of the inserted minor translation are, for example, the starting position of the first character of the first half 8a of the inserted minor translation relative to the first character of the translated sentence. ('0' of '0-14') and the first half 8a from the start position At least one of the ending position ('14' of '0-14') of the last character of the letter) and the starting position of the first character of the second character (8b) with respect to the first character of the sentence. ') And one or more of the end positions (' 11 'of '65 -11') of the last character of the second half 8b from the start position. In the case where only one of the start position and the end position is indicated, it is possible to find out the start position or the end position of the other small translation through the subsequent processing from the start positions or end positions of the other translations.
  • the target language is the insertion position as in Korean.
  • the indication is also possible if an indicator is inserted between the noun and the probe (relative to communications ⁇ ).
  • the original sentence is "Various embodiments are directed to device to device communications, and more particularly to controlling device to device communications.”
  • the small translation memory including the insertion position indicator and the translation memory including the small translation memory are as follows.
  • 69-69 is the second translation unit of the second translation memory. Starts before the first character and indicates that the second sub-translation unit consists of 69 characters.
  • Various embodiments are directed to device to device communications, 68 and more particularly to controlling device to device communications. (The subscript 68 in the original indicates the length of the first translation memory.)
  • Various embodiments are directed to device to device communications, and more particularly to controlling device to device communications.
  • Various embodiments relate to controlling device to device communications and more specifically to device to device communications. [0-68
  • a translation memory including a small translation memory having two or more insertion position indicators is as follows.
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating and idling.
  • the second operating BZ2 state may be an operating state in which a very small amount of fuel (as opposed to operating state BZ1) is metered in particular for catalytic heating and idling.
  • the translation memory includes two insertion position indicators.
  • the above translation memory is the result of completing the translation sentences by inserting sorting the following small translation memories by insertion position indicator.
  • a second operating BZ2 state can be a operating state / at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating [ Very small amounts of fuel (in contrast to operating state BZ1) are metered specifically for catalytic heating] / and idling.
  • the first half of the first minor translation (“second operational BZ2 state”) is 14 and the second half (“may be operational”) is 11, in contrast to the first half of the second minor translation ["(in contrast to the operational state BZ1).
  • a very small amount of fuel, in particular, catalytic heating "] has a length of 40 and a length of the latter half (“ metered for ") is 9.
  • the position of ⁇ relative to the first sentence of the translated sentence is as follows.
  • BZ2 second operating state may be 14, 15 (in contrast to the operation state BZ1) of a very small amount of fuel 71 in particular operating conditions that quantitative for heating the catalyst 56 and 62 idle.
  • the subunit correspondence relation indicator of the translation memory of this embodiment is as follows.
  • the second operating BZ2 state may be an operating state in which a very small amount of fuel (as opposed to operating state BZ1) is metered in particular for catalytic heating and idling.
  • A includes B and C.
  • A includes B and C. [0-12
  • the sub-unit correspondence indicator indicates that the second sub-translation is inserted at the ⁇ position between the object 'B' and the investigation 'of' A contains B ⁇ 'in the first sub-translation.
  • the small translation position information of the sub-unit correspondence indicators may include numbers that may indicate a position in the translation sentence of each of the small translations, and may indicate a position in the translation sentence of each of the small translations.
  • the numbers may include only positions indicating the sort order of each of the sub-translations within the translation sentence.
  • the sorting of the small translations can perform the same function as inserting the small translations arranged in the sort order into the small translations placed at the front, so that some of the small translation memories included in the translation memory are adjacent to each other.
  • the two sub-translations may further include a position indicating the position at which one sub-translation is inserted into the other sub-translation (first subunit correspondents of FIGS. 3J, 3K and 3L).
  • the translation memory including the small translation memory of FIG. 3G is indicated by the subunit correspondence indicator indicating the alignment position, it may be indicated by the insertion position indicator as follows.
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
  • the second operating BZ2 state may be an operating state in which very small amounts of fuel (in contrast to operating state BZ1) are metered in particular for catalytic heating.
  • the sorting can perform the same function as inserting the small translations sorted in the sort order into the small translations placed at the front, so that the small translations adjacent to each other by the sorting order are sorted in the sorting order. It will be inserted at the end of the.
  • 0) for the small translation sentence of the first small translation memory (second operation BZ2 state) is the small translation sentence [(operation state BZ1) of the fourth small translation memory arranged next.
  • the first sentence of the first translation (14-0 / 14-0, after the beginning position 14 of the latter half, 0 indicates the position of the "second operating state BZ2 is ⁇ ").
  • the first minor translation position information having "-0" in the latter part (8b) specified after the insertion position indicator '/' of the first minor translation (which means that no minor translation is present in the latter part) is aligned after the inserted minor translation. It means that it is inserted at the end of the inserted minor translation.
  • a small translation placed at the end of a translation sentence in the sorting order does not have an insertion position indicator because it does not have an insertion small translation at the back.
  • the small translation sentence position information can be configured such that when the small translation sentences are adjacent by the alignment, insertion alignment is performed. Therefore, it can be seen that all subunit correspondence indicators can form the format of the subunit correspondence indicator basically having the insertion position indicator except the subunit correspondence indicator for the small translations arranged at the end of the translated sentence. If there is no insertion position indicator in the sub-correspondence indicator, it can be seen that the small translation in the small translation memory that specifies it is the last small translation in the translation sentence.
  • numbers that may indicate a position in a translation sentence of each of the minor translations indicate a sorting order of each of the minor translations within the translation sentence and insert one adjacent minor translation into the other minor translation. May include all of the positions that are present (FIGS. 3J, 3K and 3L).
  • This sorting method by insertion sort is faster than the general basic sorting method which sorts only the front and back of a small translation because the word order can be inserted freely in the middle of another small translation as well as before and after another small translation.
  • Enable sorting You can use a combination of basic and insert sorts to quickly complete translated sentences.
  • This sorting method by insertion sorting divides the small translation units according to the morphological analysis of the target language of the original text in the translation between refractive words with different word order and forms a small translation memory and a small translation memory. Quickly assemble small translations into translation sentences of the target language so that small translation memory can be constructed quickly and accurately between refractive and deadlock.
  • the sub-unit correspondence indicator includes sub-translation unit position information, which is information indicating the alignment position in the original sentence of the small translation unit, but sub-translation position information, which is information indicating the alignment position in the translated sentence of the small translation memory. It may not include.
  • the sub-translational position information is represented by '/' in the translated sentence instead of including a number and can be obtained therefrom.
  • the following is the sorting information of the intermediate level small translation memory in which the original sentence is translated into the translated sentence, the determination of the small translation unit, the designation of the subunit correspondence indicator of the small translation unit, and the subunit correspondence indicator of the small translation memory are specified.
  • the intermediate level small translation memory is separated by '/', and the subunit correspondence indicators for the small translation memory are separated by '[]' after the translation memory.
  • the sub-correspondence relation indicator of the intermediate small translation memory is the sequence number from the first word to the word corresponding to the small translation memory. For example, corresponding to predetermined translation unit that corresponds to the predetermined translation memory "of a very small amount", the third predetermined Because subunit of the translation memory correspondence between indicator 16 and a 'at 11 which in the 11th Eojeol to the 16th word 12 a 13 very 14 small 15 amount 16 '.
  • the generation process of the translation memory according to the present invention is as follows.
  • 'parsing' refers to dividing the original sentence by a mechanical division rule. Parsing may be based on the parts of speech analyzed after the morphological analysis of the original sentence.
  • a 'parsing unit' is a minimal set of sentence words that are stored on a computer and processed for translation and consist of one or more words.
  • a second operating / BZ2 / state / can be a operating state / at which / a very small amount / of fuel / (in contrast / to operating state / BZ1 /) / is metered, / especially / for catalyst / heating./
  • the original text sentence which is the original text, may be parsed by a mechanical division rule based on the parts of speech sequentially from the beginning of the sentence among the stemmed words. Partial parsing may be based on parsing at least after a word (or word) that is a noun and before and after a word that is a conjunction. Nouns are subjects of expression, subjects of verbs, adjectives, and meanings, and sentences are completed by describing the movements of the nouns in the sentences. Throughout the invention, it becomes a basic unit for subdividing parsing units. BZ2 is parsed back and forth because morphological analysis does not reveal its parts of speech.
  • parsing on the basis of nouns in the original text includes a small translation memory while maintaining the parsing unit to a minimum because the translation speed is slowed down as the original text is divided into more parsing units and sequentially translated into translated units.
  • By storing the translation memory it is possible to maintain a translation speed at least equal to the normal translation time.
  • the parsing unit dictates the ending phrase when the original text is broken down and translated, without the translator first reading the original text. Therefore, the translator does not need to read the sentence from the front sentence of the original sentence in advance and determine the structure of the sentence, whether it is a subject part or a predicate part.
  • the translator only sees and translates the last word of the parsing unit into one translation unit, and if the verb is found in the next parsing unit, the translator translates the current parsing unit according to the part, and if the current parsing unit contains the main verb, translates it according to the predicate. Done.
  • analyzing the morpheme of the original sentence and parsing the parsing unit provides the translator with the position of the unit which can be divided and translated without reading the sentence in advance, thereby maximizing the advantages of the sequential translation by reducing the translation time. To be able.
  • the parsing unit is a unit in which the computer can subdivide the original text and store it in the small translation unit. That is, in the present invention, since the computer generates the small translation memory using one or more parsing units as the small translation unit, even if two or more parsing units are designated and translated as one small translation unit, the translator later becomes the two or more parsing units. It is a unit that a computer can store in a small translation memory in that it can be further divided into small translation units.
  • parsing the original text sentence from the beginning of the sentence, sequentially from the beginning of the sentence, to the parts of speech, at least after the noun, the pronoun, and before and after the conjunction Subdivided into parsing units containing one or more words in the original text.
  • the parts of speech are at least nouns, after pronouns, before and after conjunctions, and languages containing prepositions are prepositions. Parsing up to the word and parsing it into parsing units containing one or more words in the original text.
  • Parsing after morphological analysis is not limited to words. Chinese or Japanese that are not separated by words may be parsed by other rules, such as parsing before and after non-word parts of speech.
  • parsing units can be preceded by a word containing a noun or a word containing a search.
  • the original text which is the original text
  • the parsing unit is not limited to the above-described embodiment, and all parts of speech necessary to correctly translate the original text of the original text may be the parsing unit.
  • the original sentence may be subdivided into parsing units, sequentially from the beginning of the sentence, among the stemmed phrases.
  • the parsing of the translation unit of the original sentence is preferably performed so that the small translation unit is automatically determined by matching the small translation unit of the translation memory DB including the small translation memory to be compared in order to maintain the translation speed. Do.
  • the sub-translational unit is determined by one or more parsing units having the same word order between the two original languages and the translation language, or by one or more parsing units whose meaning is substantially consistent between two language sentences.
  • the small translation unit of the small translation memory may be determined as the small translation unit. This is because, if there is a small translation unit already stored, the translation can be generated by importing it.
  • the sub-translational units are composed of one or more parsing units which stem the original sentence and subdivide the original sentence into one or more sequential words starting from the first sentence of the sentence, wherein the parsing units are the translated original language and the translation.
  • the target language is determined up to one or more sequential parsing units in which the meanings in the sentences between the two languages are substantially the same and within the small translation units that no longer require reordering of the parsing units to equalize the meanings.
  • the meaning of "substantially the same” may not be possible to translate exactly the same, due to differences in translation between languages, so that someone who speaks both languages is not exactly the same, but conveys the meaning to almost the same degree. Include.
  • the decision of a small translation unit is closely related to the speed of translation.
  • the noun is a part of speech that constitutes a subject or object, and thus, the word including the noun is a small translation unit.
  • phrase that has two or more phrases (composite nouns of "noun + noun” or "noun of noun”) that have two or more nouns linked by compound nouns or prepositions as a single translation unit.
  • the number after the [] symbol indicates the subunit correspondence of the word corresponding to the subtranslation unit.
  • These [] symbols and sub-translation unit-specific numbers can be programmed to be generated automatically when a line break enter key is entered.
  • This small translation unit is displayed on the display unit of the user interface, and can preferably be modified for the user to speed up the translation. For example, the user may combine the third small translation unit "at which / a very small amount [] 16 /" and the fourth small translation unit "of fuel [] 18 /" as the third small translation unit. .
  • Determination of the small translation unit may be made using a small translation memory DB already stored. Determination of the small translation unit using the already stored small translation memory DB is performed by comparing the parsing units parsing the translation unit to be translated in the comparison unit 60 with the small translation unit of the translation memory DB 100 including the small translation memory. As a result, it may be preferentially determined as the longest parsing unit among one or more small translation units of the translation memory DB that are wholly or partially coincident.
  • the small translation unit position information of the subunit correspondence indicator can be determined.
  • the small translation unit location information is determined after the small translation unit is determined, and is changed when the user later merges the small translation unit with the front and rear small translation units or divides the small translation unit according to the needs of the translation. Accordingly, the small translation unit position information of the subunit correspondence indicator may be determined collectively with the small translation position information after the small translation, which is a translation of the small translation unit, is generated in another embodiment.
  • the small translation unit of the translation memory existing in the existing translation memory DB the parsing unit mechanically partitioned by the partitioning rule, or the merged parsing unit in which these parsing units are merged, the partitioning pattern input by the user, etc.
  • the small translation unit can be determined by dividing.
  • the segmentation pattern input by the user indicates that the program displays parsing units that are mechanically divided to the user, and if there are small translation units input from the user, the parsing units displayed are compared to each other.
  • the arrangement of the morphemes of the unit is stored as a division pattern, and the division pattern thus stored may determine the sub-translation unit in preference to the mechanical division rule in sentence translation. This is a kind of learning function that uses the morphological arrangement of the small translation unit input by the user to determine the small translation unit by compensating for the disadvantage that the mechanical parsing unit is uniformly mechanically divided.
  • the comparison unit 60 compares whether or not the sequential parsing units constituting the original text to be translated match one or more small translation units in the original text of the small translation memory DB 100, and then compares the original text of the small translation memory DB.
  • the longest sequential parsing unit that matches one or more subtranslation units in whole or in part is determined as one subtranslation unit.
  • the extended small translation memory DB 120 is formed by the small translation memory analysis unit 122. Compared to the translation memory, parsing units that are wholly or partially matched are determined as one small translation unit.
  • the extended small translation memory is a translation memory expanded from a translation pattern of small translation memories having common verbs and nouns by analyzing morphemes and sentence components of the small translation unit based on the small translation memories of the small translation memory DB.
  • the small translation memory analysis unit 122 extracts common verbs and nouns from the original sentences and translation sentences of the small translation memory DB, and the small translation unit and the small translation memory, and then translates the verbs and nouns in the sentence components and sentences. Can be created with extended small translation memory.
  • the small translation memory analysis unit 122 extracts the verbs common to the small translations to avoid the infinitive verbs "to avoid” common to the small translation units and expands the small translations to the "to avoid N”. Create a memory "N to avoid” (N indicates a part-of-speech noun). In other words, it is an argument of a common part-of-speech noun. In this way, the tagged small translation memory can be created.
  • this embodiment can be used to translate a translation unit consisting of a verb and an object, in particular, since the parsing unit is determined based on the noun and thus the verb and the object form one parsing unit.
  • N avoid N
  • parentheses indicate the basic form of a verb, N denotes a part-of-speech noun (a generalization of a noun)
  • noun expansion based on matching phrasal verbs is possible (eg, (give) up N), and noun expansion based on matching prepositions is also possible (eg in spite of N).
  • the generated extended translation memory may be stored in the translation memory DB including the extended translation.
  • Such an extended small translation memory has an effect of expanding translation coverage without generating a new translation memory DB by using a translation memory DB including a small translation memory already stored.
  • Such an extended small translation memory can apply the same extended translation memory technology applied to the conventional sentence unit translation memory to the small translation memory, and it is possible to accurately match 1: 1 between the original language and the target language. It can have much larger coverage than the extended translation memory technology. For example, even if only 20% of the original sentences of a translation unit to be translated match the translation memory, the translation memory having the small translation memory matches and analyzes the small translation memory portion corresponding to the small translation unit of the portion corresponding to the 20% portion. Since 20% of translation meaning can be extracted, the coverage of the translation memory can be expanded.
  • the translation unit (TU) is defined in the original sentence unit in the same manner as the conventional translation memory formation process. If the original unit unit parsing performed by the computer is incorrect, the process of modifying the unit of translation by merging or dividing the unit of translation by the user is performed as described in the present invention. The process of dividing or merging the units is still accomplished.
  • the present invention further includes a subsequent process after the translation unit is determined for each original sentence.
  • a computer parses the original text, which is a translation unit, and divides the original text into parsing units, searches the stored small translation memory DB, or merges the parsing units according to the user's intention to determine the small translation unit. Therefore, in the present invention, the parsing unit formation in the original sentence corresponds to the process of forming a translation unit in sentence units within a paragraph, but in the present invention, the computer performs a parsing unit determination process according to parts of speech after morphological analysis. In addition, although the determination of the small translation unit corresponds to the merging of the translation units, the merging division of the parsing unit may be performed according to the intention of the user. However, when the small translation memory already stored in the small translation memory DB exists, the computer may perform the small translation unit. Can be determined.
  • the parsing units to be translated are displayed to the user and the user is switched to the user input mode.
  • the small translation unit be determined. If there are no stored small translation units in whole or in part in the translation memory DB 100 including the small translation memory, and there are no stored small translation units in whole or in part in the expanded small translation memory DB, the user directly A translation memory may be input and a subunit correspondence indicator may be generated, or a small translation sentence may be generated using a machine translation for the subtranslation memory, and a subunit correspondence indicator may be generated.
  • CAT computer-assisted translation
  • 2A is an intermediate stage small translation memory which is made for storing in a intermediate stage small translation memory generating unit 91 into a translation memory including a small translation memory according to the present invention.
  • the intermediate translation small memory is generated in the translation memory generating unit 90 including the small translation memory and modified to generate the small translation memory (FIGS. 3A to 3K).
  • the intermediate level small translation memory of FIG. 2A is an intermediate level small translation memory which is passed through before generating a translation memory including the small translation memory according to the present invention. If a user has a small translation unit that matches the small translation unit stored in the small translation memory DB, the user can load it.If the user needs to view and modify the imported small translation memory, the translator can directly input it according to the user's needs. Can be generated by the user interface. The small translation unit of the original sentence, the small translation sentence of the translated sentence, and the subunit correspondence indicator are all displayed so that the translator can translate the text quickly.
  • the intermediate translation may have a format arranged in ascending order according to the location information of the small translation unit of the subunit correspondence indicator in order to sort the small translation units of the original sentence.
  • the difference from the final small translation memory (FIGS. 3A to 3K) is that the small translation unit remains in the translation memory portion. The user can directly check the correspondence between the small translation unit and the small translation sentence, and translates while viewing the small translation unit.
  • Intermediate small translation memory is compared with the existing translation memory recorded in the small translation memory database, by replacing or by machine translation, by using registered boilerplate, by using extended small translation memory, or by the user directly translating in the user switching mode. Create a small translation memory for the small translation unit.
  • the intermediate intermediate translation memory format shown below is used to generate such a translation memory.
  • Such a small translation unit is determined by parsing units that are partially or completely matched with the small translation unit when the small translation memory, which is the translation of the original sentence, can be loaded from the already stored small translation memory database. If there is no unit, it is specified directly by the user.
  • a subunit correspondence indicator designated in the small translation memory is inserted.
  • the original sentence of the translation memory is composed of a plurality of small translation units
  • the translation sentence of the translation memory is composed of small translation sentences corresponding to the plurality of small translation units.
  • the correspondence relationship between the sub-translation units and the sub-translations is indicated by the sub-unit correspondence indicators
  • the sub-translation unit position information of the sub-unit correspondence indicators is subdivided into sub-units in the original sentences of the sub-translation units.
  • the numbers may indicate a position
  • the small translation position information of the sub-correspondence indicators includes numbers that may indicate a position in the translation sentence of each of the small translations.
  • the small translation memory may be generated for a portion of the original text. Even if a small translation is generated for all the small translation units that have subdivided the original sentence, some of the small translation units may not have value as small translation memories or may already exist in the translation memory database, and thus duplicated small translation memories may exist. Small translations may be generated, and therefore, subunit correspondence descriptors specifying them may also be generated for some.
  • the correspondence between some sub-translational unit (s) and the corresponding sub-translational statement (s) is indicated by the sub-unit correspondence indicator (s), and the small translation unit position information ( (S) includes numbers that can indicate subdivided positions into subunits in the original sentence of the partial translation unit (s), and the small translation position information (s) of the partial subunit correspondence indicator (s) It includes numbers that can indicate the position in the translation sentence of the small translation (s).
  • the position of the last character of each of the minor translations relative to the first character of the translation sentence, the position indicating the sorting order of each of the minor translations within the translation sentence, and the position at which each of the minor translations are inserted into the minor translation of another adjacent minor translation memory may include one or more of the indicating locations.
  • the sub-correspondence relation indicator for the small translation memory may translate the small translations into a batch and batch sort method, and the small translation units may be designated in the sequential sorting order whenever the small translation unit is translated from the first small translation unit of the original sentence. See Table 2).
  • a second operating BZ2 state [the second operating BZ2 condition] 5 / can be a operating state / at which / a very small amount / of fuel / (in contrast / to operating state / BZ1 /) / is metered, / especially / for catalyst / heating./
  • the second working BZ2 state is 2-1
  • a second operating BZ2 state may be a 5-1 / can be a operating state [operating state .
  • the second operating BZ2 state may be an operating state.
  • 3-1 A second operating BZ2 state may be 5-1 / can be a operating state.
  • the second operating BZ2 state may be an operating state.
  • a second operating state BZ2 may be a [second operating state BZ2] 5-1 / at which a very small amount - a very small amount of] 16- 2 / can be a operating state - the operating state.
  • Second operation BZ2 state is very small amount It may be in an operational state.
  • 4-1 A second operating BZ2 state may be 5-1 / at which a very small amount 16-2 / can be a operating state.
  • the second operating BZ2 state may be a very small amount of operating state.
  • Fuel 4-2 A second operating state BZ2 [second operating state BZ2] 5-1 / at which a very small amount [ a very small amount of] 16-2 / of fuel [fuel] 18- 3 / can be a operating state [ Operation May be in a state. ] 10-4 / (in contrast to operating state BZ1) / is metered, / especially / for catalyst / heating./
  • the second operating BZ2 state may be in a very small amount of fuel operating state.
  • a second operating BZ2 state is 5-1 / at which a very small amount 16-2 / of fuel 18-3 / can be a operating state May be in a state. ] 10-4 / (in contrast to operating state BZ1) [(in contrast to operating state BZ1 ) ] 24 / is metered, / especially / for catalyst / heating./ The second operating BZ2 state may be in a very small amount of fuel operating state.
  • the second operating BZ2 state may be in a very small amount of fuel (in contrast to the operating state BZ1) .
  • a second operating BZ2 state 5-1 / (in contrast to operating state BZ1) [in contrast to operating state BZ1] 24-2 / at which a very small amount ] 16-3 / of fuel 18-4 / can be a operating state ] 10-5 / is metered, [ metered ] 26 / especially / for catalyst / heating. [] 30 /
  • the second operating BZ2 state may be in a very small amount of fuel (in contrast to the operating state BZ1).
  • a second operating BZ2 state 5-1 / (in contrast to operating state BZ1) [in contrast to operating state BZ1] 24-2 / at which a very small amount ] it may be 16-3 / of fuel [fuel] 18-4 / is metered, [weighing is] 26- 5 / can be a operating state [ operating state. 10-6 / especially / for catalyst / heating.
  • the second operating BZ2 state may be an operating state in which a very small amount of fuel is metered (in contrast to the operating state BZ1).
  • a second operating BZ2 state 5-1 / (in contrast to operating state BZ1) [in contrast to operating state BZ1] 24-2 / at which a very small amount ] 16-3 / of fuel 18-4 / is metered, 26-5 / can be a operating state. ] 10-6 / especially / for catalyst / heating. [ In particular for catalytic heating - 30 /
  • the second operating BZ2 state may be an operating state in which a very small amount of fuel is metered (in contrast to the operating state BZ1).
  • a second operating BZ2 state 5-1 / (in contrast to operating state BZ1) [in contrast to operating state BZ1] 24-2 / at which a very small amount ] 16-3 / of fuel [fuel] 18-4 / especially / for catalyst / heating.
  • [metered] 26-6 / can be a operating state [ It may be in an operational state.
  • the second operating BZ2 state may be an operating state in which a very small amount of fuel (in contrast to operating state BZ1) is metered in particular for catalytic heating .
  • an intermediate level small translation memory is generated, so that the subunit correspondence indicators formed at this time are distinguished by intermediate level sorting positions, which are small translation unit position information ( 4 ') and sub-translational position information (4 ") (e.g.] 5-1 /).
  • the sub-unit correspondence indicator of the intermediate-level small translation memory indicates the alignment position in the original sentence of the small translation unit of the original sentence.
  • a subunit correspondence indicator it may consist of a combination of the order of a word in a translation sentence and an order indicating the alignment position of a subtranslation sentence, for example, the intermediate subunit correspondence in '[second operation BZ2 status] 5-1'.
  • the small translation unit position information '5' of the related indicator is the sequential number of the final word that becomes the small translation unit of the original sentence, and the small translation sentence position information '1' of the intermediate level corresponding indicator is indicated in the translation sentence of the small translation.
  • 1, 2, 3, 4, 5, 6, and 7, which indicate the sort order of the small translations in the translation stage, include information indicating the position of each small translation in the translation sentence (translation memory).
  • the small translation sentence position information 5, 24, 16, 18, 30, 26, and 10 of FIG. 3C and FIG. 3D includes both an alignment order and a position of the small translation sentence.
  • the small sub-correspondence indicator of the intermediate small translation memory in order to shorten the process of generating the small translation memory without being substantially the same speed as the translator's normal sentence translation speed or at least slower than the general translation speed.
  • the translation position information has only sort order information. That is, the small translation unit position information of the sub-unit correspondence designator of the intermediate level small translation memory includes the small translation unit and the alignment position information of the small translation unit constituting the original text sentence, but the intermediate level small translation memory
  • the small translation sentence position information 4 "of the sub-unit correspondence indicator of U has only information on the order of sorting. Only the intermediate interposition alignment position branch can express the translation memory including the small translation memory of the present invention (FIG. 3A). And FIG. 3b).
  • the sub-correspondence indicator indicates the start and end words of the sub-translational unit and the original text of the sub-translational text, as well as the respective sorting order in the text. It is possible to include information including the sequence number of the beginning and ending words of the small translation in the translation sentence which is the sequence number and the translation memory. In addition, if one of the small translation unit position information and the small translation sentence position information of the sub-unit correspondence indicators are in ascending order, this means that they are already sorted in the sorting order. For example, the intermediate-level small translation memory subunit correspondence indicators among the small translations in FIG.
  • 2A are 5-1, 10-7, 16-3, 18-4, 24-2, 26-6, 30-5, Since the sub-translational unit position information is sorted in ascending order (5-, 10-, 16-, 18-, 24-, 26-, 30-), it can be seen that they are already sorted in the sorting order. Relevant indicators indicate the order of the corresponding small translation units, indicating the word order of 1 to 5, 6 to 10, 11 to 16, 17 to 18, 19 to 24, 25 to 26, and 27 to 30. Information about the location becomes more important.
  • the intermediate translations are 5-10-16-18-24-26-30 in ascending order according to the sub-translation unit position information of the sub-corresponding relation indicator.
  • the result is as follows in order of 1-2-3-4-5-6-7 in ascending order according to the small-translation sentence position information of the intermediate-level subunit correspondence indicator of the small translation memory.
  • the small-translation sentence position information 4 "only needs to indicate the information about the alignment sequence number, it may also be displayed as a letter and a symbol indicating the alignment sequence number in addition to the number. You can indicate the sort order by specifying a position relative to the preceding minor translation memory (/ 1, / 2, / 3 ). The symbols and letters “/ 1", “/ 2", and “/ 3” are specified. Indicates that the minor translation memory is placed in the first leading (/ 1), second leading (/ 2), and third leading (/ 3) of the previous small translation memory (the first leading (/ 1) is more simply indicated by a (/)). It can be used as information on the position of intermediate level translations placed in front of the sub-translation unit.
  • '/' is placed in the first preceding small translation memory.
  • '/ 2' indicates to be located in the second preceding small translation memory
  • '/-' indicates to follow the first, that is, immediately after the minor translation memory
  • '/ 2-' indicates after the second preceding small translation memory.
  • the method of indicating the relative alignment position with the preceding small translation memories can speed up the translator's translation speed since the translation position of the small translation memory can be designated at the same time as the translation.
  • the intermediate level small translation memory may be generated by designating a subunit correspondence indicator including a correspondence relationship between the small translation unit and the small translation memory and their alignment position while the user translates through the user interface as shown in the following 4.
  • an intermediate level translation memory generating method and a user interface program including a small translation memory by sequential translation of a small translation unit and designation of a subunit correspondence indicator are implemented.
  • the user interface program includes an input unit 11 through which a user can directly input translation contents corresponding to a parsing unit, a small translation unit, and a translated unit, and a user through the input unit 11. It is composed of a display unit 12 that can directly check the translation content corresponding to the translation unit in real time.
  • the display unit 12 may display the result of the matching in the basic translation memory matching unit 20 and the result of the small translation unit determination in the small translation unit determination unit.
  • Table 2 shows a specific translation example of the intermediate low translation memory generation method.
  • the block in which the letter is inverted in white indicates the small translation unit designated as the part to be translated in sequential translation, and the part immediately following the [] mark (eg [ second operation]
  • the BZ2 status indicates that the intermediate small translation memory is input by replacing, machine translation, or user translation through the small translation memory DB and extended small translation memory DB search from the first small translation unit. Indicates. Thus, the user can correct the translation in [] through the input unit 11.
  • the first small translation unit is sequentially translated into the second small translation unit after the translation
  • the first small translation unit which has already been sequentially translated is displayed as a gray block (eg, A second operating BZ2 state).
  • the subunit correspondence indicator (specifically, the intermediate subunit correspondence indicator in the intermediate small translation memory generation step) between the symbol "]" and "/" may be generated each time a single translation unit is sequentially translated or (See FIG. 7), when the user translates all the small translation units in the original sentence and then moves to the next original sentence, it may be generated collectively (see FIG. 6).
  • the user can modify the information of the subunit correspondence indicator between the "]” and "/" (strictly, the small translation sentence position information of the intermediate-level correspondence governor) similarly to the translation in [] through the input unit 11. .
  • a second operating BZ2 state [5]
  • the first small translation unit DB is searched and replaced by the small translation unit DB, the extended small translation memory DB is searched and the first small translation memory is created by translation, machine translation or user translation.
  • a second operating BZ2 state is] 5-1 / Reordering the first translation memory (subject to the first small translation unit, virtually no alignment change)
  • a second operating BZ2 state [2 second operating BZ2 state]
  • a second operating BZ2 state [2 second operating BZ2 state]
  • the translation memory DB is searched and replaced if it matches entirely, and if the partial match is made, the expanded small translation memory DB is searched and if it matches the stored extended small translation memory, the extended small translation memory is applied and translated. If it does not match the expanded small translation memory, the machine does not match the part that does not match and additionally creates the third small translation memory by user translation.
  • a second operating BZ2 state [2 second operating BZ2 state]
  • Third translation unit is searched and replaced by translation, expanded translation database is searched and translated, machine translated or user translated to create third translation memory.
  • a second operating BZ2 state [2 second operating BZ2 state]
  • a second operating BZ2 state [2 second operating BZ2 state]
  • a second operating BZ2 state [2 second operating BZ2 state]
  • a second operating BZ2 state [2 second operating BZ2 state]
  • a second operating BZ2 state [2 second operating BZ2 state]
  • a second operating BZ2 state [2 second operating BZ2 state]
  • a second operating BZ2 state [2 second operating BZ2 state]
  • a second operating BZ2 state [2 second operating BZ2 state]
  • a second operating BZ2 state [2 second operating BZ2 state]
  • the small translation units of the original text are processed in the order of 1-1 to 7-2, and the translation memory DB is searched for the small translation unit and replaced if they are matched as a whole. Searches the database and applies the expanded small translation memory if it matches the stored small translation memory.If it does not match the expanded small translation memory, translates the parts that do not match, and creates the small translation memory by user translation. .
  • an intermediate level small translation memory is generated as follows.
  • a second operating BZ2 state [2 second operating BZ2 state]
  • a method of designating the intermediate subunit correspondence indicators in a batch may be used.
  • the entire translation sentence is completed by inputting the intermediate small translation memory without generating the subunit correspondence indicator for each small translation memory for each small translation unit from [1-1] to [7-2]. Sort the memory according to the translation sentence.
  • the small translation sentence position information of the subunit correspondence indicator is collectively designated as follows.
  • Such a method of generating a translation memory initially stores a small translation unit as a small translation memory even if it takes a little longer than a normal translation time in the case of a short sentence in the process of constructing a small translation memory.
  • the small translation memory can be used from the later translation, and the extended small translation memory DB can be constructed and the extended small translation memory DB can be used from the extended small translation memory DB.
  • the translation memory including the small translation memory increases, the number of small translation memories to be applied to the new original text increases, so that the user can reduce the time for typing directly by using a CAT program without directly translating the small translation units. Will be faster.
  • 2B is another embodiment of the input unit 11 and the display unit 12 of the user interface unit 10 for generating the small translation memory according to the present invention.
  • the window in which the translated text is displayed is the display unit 12 and the window in which the small translation memory generation operation is performed is the input unit 10.
  • the small translation memory generated by the small translation memory input unit 10 of FIG. 2B may be FIGS. 3A to 3G.
  • 2C and 2CC illustrate the primary small translation memory input unit 111 for generating the primary small translation memory and the secondary small translation memory input unit 211 for generating the secondary small translation memory according to the present invention. Another embodiment.
  • the window in which the primary small translation memory generation operation is performed is the primary small translation memory input unit 111, and the window in which the primary small translation memory generation operation is performed is the secondary small translation memory input unit 211.
  • the secondary small translation memory input unit 211 subdivides and parses the yellow third primary small translation unit 102 of the primary small translation memory input unit 111 to parse it. Shows.
  • FIG. 2CC shows secondary secondary translation units 202 parsed by parsing the third primary small translation unit 102 of the primary small translation memory input unit 111 from the secondary small translation memory input unit 211.
  • the second small translations 207 are generated and sorted to generate a third primary small translation 107 in the primary small translation memory input unit 111.
  • the small translation memory generated through the primary small translation memory input unit 111 and the secondary small translation memory input unit 211 of FIG. 2CC is shown in FIGS. 3H and 3I.
  • the translation memory DB is searched for the small translation units and replaced if they are matched as a whole, and if the partial match is found, the extended translation translation memory is searched if the partial translation memory DB is matched with the stored extended translation translation memory.
  • Machine translation of the mismatched part if it does not match the expanded small translation memory, and additionally generates the small translation memory by user translation, and then sorts it according to the small translation unit, the small translation memory and the subunit correspondence indicator.
  • the intermediate small translation memory can be expressed as follows (FIG. 2A).
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// A second operating BZ2 state -1 / can be a operating state 10 -7 / at which a very small amount 16 -3 / of fuel 18 -4 / (in contrast to operating state BZ1) [ (in contrast to operating state BZ1) ] 24 -2 / is metered, [measured] 26-6 / especiallly for catalyst heating
  • Translation memory including small translation memory (FIG. 3A)
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// [ 2nd operating BZ2 state] 5-1 / [operation May be in a state. ] 10-7 / [very small amount ] 16-3 / [fuel] 18-4 / [(as opposed to operating state BZ1)] 24-2 / [weighed] 26-6 / [especially catalyst heating To] 30-5 /
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// [ 2nd operating BZ2 state] 5-1 / [( In contrast to operating state BZ1)] 24-2 / [very small amount of ] 16-3 / [fuel] 18-4 / [especially for heating catalysts] 30-5 / [measured] 26-6 / [ May be in operation.] 10-7 /
  • the translation memory including the small translation memory may be represented as follows in a manner of separating the small translation memory and the subunit correspondence indicator.
  • the sub-correspondence indicators of the small translation memory indicate the sorting order of the small translations when they are located between each of the small translation memories, in increasing order from 1 indicating the sort order of each small translation memory, in ascending order. Since the small translations have already been sorted in the sorted order of the translation sentences when they are located, each small translation can be modified to have information specifying the position of the words that occupy the translation sentences. This example is as follows (Fig. 3c).
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// The second operating BZ2 state is / ( in contrast to operating state BZ1 ) / A very small amount of fuel may be / operated / especially metered for catalytic heating / [5-5,24-9,16-12,18-13,30-17,26-18 , 10-22]
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// The second operating BZ2 state is / ( in contrast to operating state BZ1 ) / A very small amount of fuel can be / operated / especially for catalytic heating / [5,24,16,18,30,26,10]
  • the subunit correspondence indicator indicates the position occupied in the original text by the small translation unit corresponding to the small translation.
  • the subunit correspondence indicator specified in the sub-translation "fuel price" is 18, so the corresponding sub-translation unit is 'of fuel' with the beginning word 17 to the 18th word (or word) ending.
  • the symbol '/' separating the small translation memory translation unit is removed, and the original sentence of the conventional translation memory and the sentence pair of the corresponding translation sentence are transformed into a conventional translation memory.
  • the symbol '/' separating the small translation memory translation unit is removed, and the original sentence of the conventional translation memory and the sentence pair of the corresponding translation sentence are transformed into a conventional translation memory.
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating. // The second operating BZ2 state (as opposed to operating state BZ1) Very small amounts of fuel may be in an operating state, especially metered for catalytic heating. [5-5,24-9,16-12,18-13,30-17,26-18,10-22]
  • the translation memory format having the small translation memory may include information indicating the correspondence between the small translation unit in the original sentence and the small translation memory in the translation memory while maintaining the same form as the conventional translation memory.
  • FIG. 3E Although the form shown in FIG. 3E is closest to the conventional translation memory format, the forms shown in FIGS. 3A to 3D may be used as the translation memory format as needed.
  • the subunit correspondence indicator of the translation memory including the small translation memory may be stored in a different area from the original text and the translation storage area of the translation memory so that the user may not be able to see the source such as the storage date source.
  • the translation memory format including the small translation memory according to the present invention has various advantages over the conventional translation memory format.
  • the translation memory according to the present invention additionally displays a small translation memory, which is a translation pair for a small translation unit, which is a subdivision of a subdivision of a original sentence, which is subdivided into a translation unit, in comparison with a conventional translation memory, so that the small translation memory is aligned to display the translated sentence.
  • a small translation memory which is a translation pair for a small translation unit, which is a subdivision of a subdivision of a original sentence, which is subdivided into a translation unit, in comparison with a conventional translation memory, so that the small translation memory is aligned to display the translated sentence.
  • the translation memory according to the present invention includes a small translation memory so that even if the original sentence to be translated does not correspond 100% with the original sentence of the translation memory DB already existing in the system, By translating even a part of the original sentence to be translated using the translation memory (s), the accuracy of the translation can be improved and the translation time can be shortened.
  • the small translation unit translation memory corresponding to the matched small translation unit can be used. Can be.
  • the translation memory according to the present invention includes the small translation memory, the error check is performed for each sentence subunit rather than for each sentence, so that the error check is accurate and the error check time can be shortened.
  • Conventional translation inspection programs compare the sentence-to-sentence, so that when the same word appears several times in a sentence, the matching rate of the word in the original sentence to the word in the translated sentence is inferior.
  • the translation memory of the present invention includes positional information for each sentence subunit, the matching rate of the small translation unit words in the original sentence and the small translation word in the translation sentence is significantly increased.
  • the sentence component analysis of the original sentence becomes accurate, and the corresponding translation part of the words in the original sentence can be extracted accurately, Increased utilization of translation memory.
  • a small translation is Korean from the information on the correspondence relationship between the small translation units, the Korean can accurately identify the sentence components by the investigation. Therefore, the small translations are analyzed and the common sentences for the same original word in the original sentence are analyzed.
  • the translation pattern of the small translation can be extracted by analyzing the translation of the small translation. Therefore, it is possible to construct an extended small translation memory for the small translation rather than the whole sentence.
  • the extended small translation memory is subdivided from the extended memory of the conventional sentence unit translation memory, and thus is constructed for the small translation unit in the sentence, so that it is excellently accurate and has high utilization.
  • the one-way translation memory can be constructed as a reverse translation memory.
  • a translation memory DB including a small translation memory whose target language is Korean is constructed for an original text of which English is the original text
  • the small translation unit of Korean is used as the small translation unit of the original text.
  • Small translation unit division for original sentences can generate more small translation memory as the number of small translation units increases, but the number of small translation sentences that need to be sorted also increases by the number of small translation units, which can improve translation efficiency. An appropriate number of small translation units needs to be determined.
  • 3H and 3I are translation memories generated through the primary small translation memory input unit 111 and the secondary small translation memory input unit 211 of FIGS. 2C and 2CC, and include original sentences and target languages in the original language.
  • a second small translation memory 209 which is an additional small translation memory 209, which includes a pair of translation sentences, and further subdivids the first small translation memory 109 into a first small translation memory 109, which is a subunit translation memory.
  • a translation memory is shown.
  • Small translation unit division for original sentences can generate more small translation memory as the number of small translation units increases, but the number of small translation sentences that need to be sorted also increases by the number of small translation units, which can improve translation efficiency. An appropriate number of small translation units needs to be determined.
  • the original sentence is divided into small translation units 102 to generate small translations 107 corresponding to each of the small translation units 102, and the small translation unit location information for each of the small translation units 102 is determined.
  • the small translation memory having a pair of the small translation unit 102 and the small translation sentence 107 formed by generating the small translation sentence position information 108 " for each of the 108 translations and the small translation sentences.
  • the format of the translation memory including the small translation memory indicated by can also be applied to the format of the primary small translation memory 109 including the secondary small translation memory 209.
  • the translation memory includes a primary subunit correspondence indicator 108 that specifies the primary small translation memory 109 in the translation memory, and the primary subunit correspondence indicator 108 includes a primary subtranslation. Unit location information 108 'and primary small translation sentence position information 108 ".
  • the primary small translation memory 109 is stored in the translation memory by the primary subunit correspondence indicator 108; Correspondence of the translation unit 102 and the primary small translation 107 pair is displayed.
  • the primary small translation memory 109 may include a secondary small translation memory 209 which is an additional small translation memory further subdividing the primary small translation memory 109.
  • the secondary small translation memory 209 is a translation subunit further subdividing the primary small translation unit 102 of the primary small translation memory 109 before further subdividing into the secondary small translation memory 209.
  • a pair of secondary small translations 207 which are translation portions corresponding to the small translation unit 202 and the second small translation unit 202, wherein the primary small translation memory 109 includes a secondary small translation memory 209
  • the secondary subunit correspondence indicator 208 specifies the secondary sub-translation unit 202 and the secondary sub-translational text (209) of the secondary sub-translation memory 209. 207) correspondence of pairs.
  • a first operating state BZ1 can be a state of low load
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
  • the above example sentence is stored as a translation memory including a small translation memory generated after dividing by a mechanical segmentation rule parsed before and after the conjunction.
  • a first operating state BZ1 can be a state of low load, 12- / and [and] 13- / a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
  • the second operating BZ2 state is that very small amounts of fuel (as opposed to operating state BZ1) Can be metered in operation.] 43- /
  • a first operating state BZ1 can be a state of low load
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
  • the first operating state BZ1 can be a low load state, and [12-10] / and [13-11] / the second operating BZ2 state (in contrast to operating state BZ1) has a very small amount of fuel, especially catalytic heating. It may be an operating state that is metered for. [43-33]
  • a first operating state BZ1 can be a state of low load, and a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
  • the first operating state BZ1 can be in a low load state, and the second operating BZ2 state can be in an operating state in which a very small amount of fuel (in contrast to the operating state BZ1) is metered in particular for heating the catalyst.
  • the secondary small translation memory 209 is a small translation memory further subdividing the primary small translation memory 109.
  • the translation memory of the example above includes three sub-translation memories, indicated by subunit correspondence indicators [12-10, 13-11, 43-33] ([A first operating state BZ1 can be a state of low]. load / the first operating state BZ1], [and / and], [a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) The second operating BZ2 state may be an operating state in which a very small amount of fuel is metered specifically for catalyst heating (in contrast to operating state BZ1).
  • a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
  • a very small amount of fuel in contrast to operating state BZ1 may be in an operating state that is especially metered for catalytic heating.
  • the third small translation memory (a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating./
  • the second operating BZ2 state may be an operating state in which a very small amount of fuel (in contrast to operating state BZ1) is metered specifically for catalyst heating.]
  • the unit 109, under the broken down this predetermined Translation memories are the second bovine translation memory 209.
  • a second operating BZ2 state 5-5 / can be a operating state 10-22 / at which a very small amount of fuel 18-13 / (in contrast to operating state BZ1) [in contrast to operating state BZ1] 24-9 / is metered, especiallly for catalyst heating.
  • the translation memory including the primary small translation memory 109 having the secondary small translation memory 209 may be displayed as shown in FIGS. 3H and 3I.
  • the small translation memory generated in the primary small translation memory input unit 111 before being subdivided into secondary to distinguish it from the secondary small translation memory 209 is subjected to the primary small translation.
  • the primary small translation memory 109 may have a secondary small translation memory 209.
  • the subunit correspondence indicator 108 of the primary small translation memory 109 is compared to the subunit correspondence indicator of the small translation memory 109 in parentheses immediately after the subunit correspondence indicator 108 of the primary small translation memory 109.
  • a first operating state BZ1 can be a state of low load, and a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
  • the first operating state BZ1 can be in a low load state, and the second operating BZ2 state can be in an operating state in which very small amounts of fuel are metered especially for catalytic heating (as opposed to operating state BZ1).
  • the primary subunit correspondence indicator 108 "60-172
  • Ruler (208) "0-28
  • 3 in parentheses.
  • the translation memory including the small translation memory is a primary small translation memory input unit which generates a small translation memory from translation sentences.
  • the first small translation memory 109 having the short translation as a small translation unit is generated, and the second small translation memory input unit 211 generates a second small translation memory from the first small translation unit.
  • It may have a secondary small translation memory 209 which is a small translation memory for the subdivided sentence components (see FIGS. 2C and 2CC).
  • the configuration of the primary small translation memory input unit 111 and the secondary small translation memory input unit 211 divides the compound sentence into short sentences, generates a small translation memory (primary small translation memory), and generates the respective short sentences. It is possible to generate a small translation memory (secondary small translation memory) by dividing it into more detailed small translation units.
  • the compound sentence is divided into the first small translation unit 102 of the short sentence by a mechanical segmentation rule that divides the front and back of the conjunction in case of the compound sentence, and the machine translation is applied to the short sentence.
  • the first small translation memory 109 is generated by generating the first small translation sentence 107, and if the first small translation unit 102 having the long sentence length among the short sentences forming the complex sentence is applied as the machine translation to generate the translation, it is incorrect.
  • the secondary small translation unit 207 having the second small translation units 207 may be generated by dividing the primary small translation unit 102 having a long sentence length into the secondary small translation units 202.
  • the translation memory having such a second small translation unit 202 has an advantage of generating a translation memory using machine translation.
  • the first small translation memory input unit 111 retrieves and retrieves a short translation-oriented small translation memory
  • the second small translation memory input unit 211 retrieves small translation memories constituting a sentence component constituting a short sentence and sorts or inserts them. By completing the translation sentence can be completed.
  • the secondary subunit correspondence indicator 208 is the second small translation unit position information (208 ') and the translation sentence of the small translation, which is information indicating a position in the small translation unit of the secondary small translation unit 202.
  • Second small translation unit location information 208 " which is information indicating my location, and the second small translation unit location information 208 " Includes a number that can indicate the subdivided position, the second small translation position information 208 "may include a number that can indicate the position in the translation sentence of each of the secondary small translations (207) .
  • the secondary small translation unit location information 208 includes a number that can indicate a location subdivided into subunits within the primary small translation 107 of each of the secondary small translation units 202.
  • the secondary small translation position information 208 ′′ may include a number that may indicate a sorting order in the primary small translation 107 between the secondary small translations 207.
  • the secondary small translation unit location information 208 ' is each of the secondary small translation units 202 for the first character of the primary small translation unit 102 within the primary small translation unit 102.
  • 207 may include a position indicating a position to be inserted into.
  • numbers that may indicate a subdivided position within the original sentence of each of the small translation units may indicate the position of the last character of each of the small translation units relative to the first character of the original sentence within the original sentence.
  • numbers that may indicate a position in the translation sentence of each of the small translations may indicate the position of the last character of each of the small translations relative to the first character of the translation sentence in the translation sentence.
  • numbers that may indicate a position in a translation sentence of each of the small translations are one of a position indicating a sorting order of each of the small translations within the translation sentence and a position where each of the small translations is inserted into another adjacent small translation. It may further include one or more.
  • the translation memory including the small translation memory or the primary small translation memory and the secondary small translation memory may be recorded in a computer readable storage medium and used in a work such as translation.
  • the translation memory including the small translation memory further subdivided into the secondary small translation memory stores the short translation-oriented long small translation memory as the primary small translation memory, and the second translation memory that distinguishes the sentence components in the short sentence. Because it can be stored in the small translation memory, it is possible to apply to the stepwise translation and machine translation considering the sentence content in the short sentence by further segmenting and considering the short sentence and compound sentence.
  • Table 3 is an embodiment of a registration phrase using a translation memory including a small translation memory according to the present invention.
  • the second working BZ2 state is can be a operating state Can be working at which a very small amount Very small amount of fuel Fuel in contrast to operating state BZ1 In contrast to operating state BZ1 is metered Metered especiallly for catalyst heating Especially for catalytic heating
  • the process of generating a small translation memory for the small translation unit in the process of storing the translation memory including the small translation memory according to the present invention may be used for storing the registered idiom. All minor translation units become the original language portion of the registered idiom, and the minor translation portion corresponding to the target language portion may be stored as the registered idiom, instead of being stored in the minor translation memory.
  • the registered idiom for the sub-translation unit is shown in Table 4 through a post-processing process that deletes the "at which" and the "language” of "a” of the target language, which do not reflect the meaning of the original language.
  • the survey portion can be deleted and saved.
  • a second operating BZ2 state 2nd working BZ2 status can be a operating state Can be working at which a very small amount Very small amount of fuel fuel in contrast to operating state BZ1 In contrast to operating state BZ1 is metered Metered especiallly for catalyst heating Especially for catalytic heating
  • nouns are always at the end of the sub-translational unit, and nouns in the sub-translational sentences are mainly located at the front of the sub-translational sentences.
  • the words and parts of speech can be extracted as follows by removing the adverbs.
  • a method of extracting a term from a translation memory including a pair of original sentences in a source language and a translation sentence in a target language and including a small translation memory is a noun that mechanically divides an original sentence of a small translation memory after a noun. Extracting the small translation memories containing only, extracting the small translation memory including the article + noun or the definite + noun, or the preposition + noun in the small translation unit, and starting from the small translation unit of the extracted small translation memory.
  • the reverse translation memory is formed of a translation memory (Korean-> English) in which an original sentence of an original language (English) and a translation sentence of a translation language (Korean) are interchanged.
  • the translation memory is a DB that stores previous translation sentences (eg, Korean) for original sentences (eg, English)
  • the translation memory including the small translation memory of the present invention mentioned above The original sentence and the translated sentence of the target language (eg Korean) are translated into the original sentence and the original sentence of the original language (140) (eg Korean), and the original sentence is translated into the target language (141). (E.g., English), and the small translation unit position information 144 'and the small translation position position information 144 "of the subunit correspondence indicator 144 are exchanged with each other.
  • Translation memory having English can be constructed (FIG. 5A).
  • Such a reverse translation memory can be reversed simply by constructing a translation memory (English-> Korean) having a small translation memory for the original language without establishing a separate translation memory (Korean-> English) for the translation language.
  • Memory DB can be built. Therefore, since the reverse small translation memory can be constructed by constructing the one-way small translation memory, it is possible to significantly reduce the translation memory construction time between the two languages.
  • the reverse translation memory like the translation memory including the small translation memory of FIGS. 3A to 3E, displays the original text including the small translation unit, the translated text including the small translation, and the correspondence relationship between the small translation unit and the small translation. May include subunit correspondence indicators.
  • FIG. 5A may be a translation memory including a small translation memory having a reverse translation memory having a form as shown in FIG. 3E, FIG. 5B as shown in FIG. 3D, and FIG. 5C as shown in FIG. 3C. .
  • the small translation corresponding to the small translation unit of the translation memory becomes the small translation unit of the reverse translation memory for use in reverse translation in which the target language is the original sentence and the original language is the translation sentence.
  • the translation unit becomes a small translation sentence of the reverse translation memory
  • the small translation sentence position information of the translation memory including the small translation memory becomes the small translation unit position information of the reverse translation memory
  • the small translation unit of the translation memory including the small translation memory becomes the small translation unit position information of the reverse translation memory.
  • the position information becomes the small translation sentence position information of the reverse translation memory.
  • the target language is obtained from the original source language.
  • a reverse translation memory including a small translation memory for applying to the reverse translation in which the original language is the target language.
  • the first small translation and the second small translation corresponding to the first small translation unit and the second small translation unit of the translation memory are converted into the reverse translation memory. It becomes the first small translation unit and the second small translation unit.
  • the first small translation unit and the second small translation unit of the translation memory are the first small translation and the second small translation of the reverse translation memory.
  • the primary small translation sentence position information of the translation memory including the primary small translation memory becomes the primary small translation unit position information of the reverse translation memory.
  • the primary small translation unit position information of the translation memory including the primary small translation memory becomes the primary small translation sentence position information of the reverse translation memory, and the secondary small translation sentence position information of the translation memory including the secondary small translation memory.
  • the second small translation unit position information of the reverse translation memory is used, and the second small translation unit position information of the translation memory including the second small translation memory is the second small translation sentence position information of the reverse translation memory.
  • the reverse translation memory including such a small translation memory may be stored in a computer readable storage medium.
  • the translation memory having the subunit correspondence according to the present invention has been described using English as the original language and Korean as the target language.
  • the present invention is not limited to English and Korean, and may be used, for example, between other original languages and target languages between deadlocks and deadlocks, deadlocks and inflections, inflections and inflections.
  • FIG. 8A is an embodiment of a translation memory corresponding to FIG. 3D, including a small translation memory in which the original language is English and the target language is Japanese
  • FIG. 8B includes a small translation memory in which the original language is English and the target language is Japanese
  • 3E is an embodiment of a translation memory corresponding to FIG. 3E.
  • FIG. 8C is an embodiment of a translation memory corresponding to FIG. 3D, including a small translation memory in which the original language is English and the target language is Chinese, and FIG. 8D includes a small translation memory in which the original language is English and the target language is Chinese
  • FIG. 8E is an embodiment of a translation memory corresponding to FIG. 3E.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

본 발명의 일 양태에 따른, 원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리(이하, "소번역메모리"라고 함)를 포함하는 번역 메모리는, 상기 소번역메모리는 상기 원문 문장을 번역 소단위로 세분화한 소번역단위 및 상기 소번역단위에 대응하는 번역 문장 내의 번역 부분인 소번역문의 쌍을 포함하되, 상기 번역 메모리는 상기 번역 메모리 내에서 상기 소번역메모리를 특정하는 소단위 대응관계지시자를 포함하고, 상기 소단위 대응관계지시자에 의해 상기 번역 메모리 내에서 상기 소번역메모리의 소번역단위 및 소번역문 쌍의 대응 관계가 표시된다. 본 발명의 일 양태에서, 본 발명에 따른 소번역메모리를 포함하는 번역 메모리는 컴퓨터 판독가능한 저장 매체에 기록된다.단위 및 소번역문 쌍의 대응 관계가 표시된다.

Description

소번역메모리를 포함하는 번역 메모리, 그를 이용한 역방향 번역메모리 및 이들을 기록한 컴퓨터 판독가능한 저장매체
본 발명은 원문언어(source language)로 된 원문문장을 목표언어(target language)로 된 번역문장으로 번역할 때 이용되는 새로운 번역 메모리(translation memory, TM)에 관한 것이며, 새로운 번역 메모리를 생성하기 위한 방법, 상기 번역 메모리를 이용하는 번역 방법, 및 이들이 이용되는 컴퓨터 보조 번역(CAT) 프로그램(컴퓨터 번역 지원 프로그램)에 관한 것이다.
번역 메모리(영어: translation memory, TM)는 인간의 번역을 돕기 위한 문장, 단락 또는 이전에 번역된 문장과 같은 단위들인 "세그먼트"들을 저장하는 데이터베이스이다. 번역 메모리는 원본 텍스트의 원문문장을 저장하고 "번역단위(translation units)"로 불리는 언어 쌍에 해당하는 번역을 저장한다. 개별 단어들은 번역 메모리의 도메인 내부에서 있지 않고, 용어 기반들에 의해 처리된다.
도 1에 도시된 바와 같이, 종래의 번역 메모리의 국제 표준 포맷(TMX)은 번역단위 및 이에 대한 번역부분인 번역 메모리로만 구성되어 있으므로, 번역단위 내의 원문 문장들이 번역 문장으로 어떻게 세부적으로 대응되는지 알 수 없었다. TMX(Translation Memory eXchange)는 CAT(Computer Aided Translation) 및 로컬라이제이션 도구로 만들어진 번역 메모리 데이터의 교환을 위한 공급업체 중립 공개 XML 표준이다. TMX의 목적은 프로세스에서 중요한 데이터 손실을 최소화하면서 도구와 번역 업체 간 번역 메모리 데이터의 교환을 더욱 쉽게 만드는 것이다.
종래에 번역 메모리의 "번역 단위"는 문장, 단락 등 문장 이상의 번역문을 저장하였기 때문에, 종래의 원문문장 단위 번역 메모리는 원문문장이 100% 일치하는 경우에 새로 번역되는 원문문장에 사용되었다. 또한, 원문과 번역문 간 세부 대응관계를 표시하지 않았기 때문에, 만약 새로 번역되는 원문문장이 저장된 번역 메모리의 원문 문장과 일치율이 80% 내지 90%인 경우에는 참고할 수 있도록 번역자에게 표시할 뿐이고, 일치율이 더 떨어지면 번역 메모리를 호출한다고 하더라도 실제 번역자에게 번역 정확도와 번역 시간 단축의 측면에서 큰 도움이 되지 못했다. 종전 번역 메모리는 원문문장이 100%일치하는 경우는 정확도를 유지하나 80% 내지 90% 일치하여 참고할 수 있도록 표시되는 경우는 번역자가 새로 번역될 원문문장과 다른 부분을 비교하여 원문문장을 수정하게 되고. 번역에서 원문문장이 번역 메모리의 원문 문장과 100% 일치하는 경우는 확률상 매우 드문 일이어서 실제로 번역 메모리가 번역자에게 큰 도움을 주지 못하였다.
또한, 일반적으로 판매되고 있는 번역 프로그램 및 CAT는 교착어 간의 번역인 일본어와 한국어의 번역에서 최대 95%의 기계 번역 정확도를 자랑하고, 굴절어 간의 번역인 영어와 독일어 번역 역시 높은 정확도를 자랑하나, 굴절어와 교착어 간의 번역은 어순의 차이로 인해 정확도가 상대적으로 매우 낮다.
종래에 기계번역은 기계번역 알고리즘에 의해 번역을 수행하고 아무리 복잡한 원문문장이라도 알고리즘에 따라 번역하기 때문에 원문언어 원문문장이 목표언어 번역문장의 어느 부분으로 번역되는지 대응관계를 알 수 있었다. 그러나, 기존의 번역 메모리는 번역자에 의해 번역되기 때문에 목표언어로 번역된 원문문장에서 서로 대응관계를 알 수 없다. 간단한 원문문장은 알고리즘 등을 사용하여 원문언어 원문문장과 목표언어 원문문장의 대응관계를 알아낼 수 있으나 원문문장의 길이가 길어지고 접속사가 여러 개 있는 원문문장에서는 원문언어 원문문장과 목표언어 원문문장의 대응관계를 알고리즘만으로 알아내기 어렵고 매칭 프로그램을 사용한다고 하더라도 오류가 나타나게 된다. 특히, 원문언어 원문문장 내에 동일한 원문언어 단어들이 반복되거나 원문언어 단어들은 다르나 원문언어들이 동의어 관계에 있어서 원문문장 내에서 동일한 목표언어로 번역되는 경우 매칭 알고리즘에 의해 원문문장과 번역문장 사이에서 정확한 단어들의 대응관계를 알아 내지 못하고 오류가 많이 발생하며 인간이 직접 매칭관계를 알고자 하더라도 원문문장과 번역문장 사이에서 단어들을 일일이 대조하여야 하므로 긴 문장일수록 시간이 오래 걸린다.
기존의 번역 프로그램들 및 컴퓨터 보조 번역(CAT) 프로그램들은 한 번 번역된 문장은 다시 번역하지 않기 위해 번역 메모리를 사용하거나, 번역 품질 및 용어 통일을 위해 용어집 및 등록상용어구를 이용하고 있다. 그러나, 이러한 부분일치 번역 메모리, 용어집 및 등록상용어구는 문장 내의 해당 단어들만 치환하는 것이기 때문에 번역자가 번역 문장을 완성하기 위해서는 일일이 상용어구나 용어를 다시 정렬하여 번역해야만 한다. 이러한 작업은 용어집이나 상용어구의 사용 없이 번역하는 시간보다 오히려 더 많은 시간이 걸리게 되어 숙련된 번역가의 입장에서는 이러한 용어집이나 등록 상용어구를 이용하지 않게 된다.
종래 번역메모리는 문장단위로 번역메모리 저장하기 때문에 번역메모리 재사용률이 현저히 낮은 문제점이 있었다. 또한, 원문문장이 번역문장으로 적절하게 번역됐는지 오류를 검증하는 기존 검증 프로그램은 문장 단위 검증이 이루어지기 때문에 문장 내에 중복 단어가 있거나, 문장 길이가 길수록 성능이 떨어지는 문제점이 있었다.
이에 본 발명이 해결하고자 하는 과제는 매칭율이 낮은 번역메모리들이라도 번역메모리들의 매칭되는 부분을 번역하고자 하는 원문문장의 번역에 최대한 이용하는 방법을 찾아서, 번역메모리의 재사용율을 높이고, 문장 내 중복 단어가 있거나 문장 길이가 길어도 번역 오류를 탐지하는 검증 성능을 유지하도록 하는 것이다. 본 발명은 종래의 기술에 따른 번역 메모리의 단점을 보완하여 번역 메모리의 활용을 높이기 위해 새로운 번역 메모리 저장 포맷을 정의하고 이를 이용하여 번역하는 방법을 제공한다. 이를 통해 번역자는 번역 내용의 번역 정확도, 번역 내용 오류 체크 등의 검수 및 번역 시간 측면에서 보다 정확하고 빠르게 번역할 수 있게 된다.
본 발명이 해결하고자 하는 다른 과제는 굴절어와 교착어 간의 번역에서 어순의 차이를 극복하고 교착어 간의 번역 정확도에 근접하는 번역 정확도를 갖는 자동번역 프로그램 및 CAT 프로그램에 이용될 수 있는 새로운 번역 메모리 및 그를 이용한 번역 방법을 제공하는 것이다.
본 발명은 원문문장을 번역문장으로 번역하는 번역 속도를 해치지 않으면서, 원문문장인 번역단위(Translation Units, TU)를 세분화한 소번역단위(sub-TU), 및 번역단위에 대한 번역 메모리(TM) 내에 상기 소번역단위에 대한 번역 부분인 소번역문(sub-Translation)의 쌍을 갖는 소번역메모리(sub-TM)를 정의하고 소번역단위 및 소번역문을 포함하는 각 소번역메모리에 대해서 소단위 대응관계지시자가 지정된다. 사용자가 번역과 동시에 번역 메모리를 구축하고 한번 번역했던 소번역단위는 이에 대한 번역부분인 소번역문을 불러와 대체 또는 수정함으로써 타이핑 시간을 줄임으로써 소번역메모리 자료가 축적됨에 따라 번역자가 정확하면서도 빠른 번역을 할 수 있도록 하는 소번역메모리를 포함하는 번역메모리 이용 방법을 제시한다.
본 발명의 일 양태에 따른 번역 메모리는 원문언어로 된 원문 문장을 목표언어로 된 번역 문장으로 번역하기 위해 사용된다. 번역 메모리는 원문 문장 및 그에 대응하는 번역 문장을 저장하고, 원문 문장을 번역 소단위로 세분화한 각각의 소번역단위에 대하여 소번역메모리가 형성되고, 소번역단위 및 소번역문에는, 각각의 소번역단위와 각각의 소번역문 간의 대응 관계를 나타내는, 소단위 대응관계지시자가 지정된다.
본 발명의 일 양태에서, 소번역단위의 원문 문장 내 정렬위치를 가리키는 정보인 소번역단위위치정보와 번역 문장 내 소번역문의 정렬위치를 가리키는 정보인 소번역문위치정보를 포함한다.
본 발명의 일 양태에서, 소번역단위위치정보는 소번역단위들 간의 원문문장 내 순서를 지정할 수 있는 숫자를 포함하고, 소번역문위치정보는 소번역문들 간의 번역 문장 내 순서를 지정할 수 있는 숫자를 포함하지 아니한다.
본 발명의 일 양태에서, 소번역단위위치정보는 소번역단위들 간의 원문문장 내 순서를 지정할 수 있는 숫자를 포함하고, 소번역문위치정보는 소번역문들 간의 번역 문장 내 순서를 지정할 수 있는 숫자를 포함한다.
본 발명의 일 양태에서, 소번역단위위치정보는 원문 문장 내에서 해당 소번역단위까지의 단어 또는 하나 이상의 단어들이 속하는 어절의 누적개수를 나타내고, 소번역문위치정보는 번역 문장 내에서 해당 소번역문까지의 단어 또는 하나 이상의 단어들이 속하는 어절의 누적개수를 나타낸다.
본 발명의 일 양태에서, 각각의 소번역단위는, 각각이 하나 이상의 단어들 또는 단어가 속하는 어절들의 집합체인, 하나 이상의 파싱 단위로 구성되고, 각각의 파싱 단위는 각각의 파싱 단위는 원문 문장 내에서 형태소 분석을 통해서 구성되는 하나 이상의 단어의 배열이다.
본 발명의 일 양태에서, 각각의 소번역단위는, 순차적인 복수 개의 파싱 단위들로서 소번역문들을 번역 문장 내 순서에 따라서 정렬할 때 각각의 소번역단위를 구성하는 복수 개의 파싱 단위들의 재정렬을 요하지 아니하도록 하는, 순차적인 복수 개의 파싱 단위들로 구성된다.
본 발명의 일 양태에서, 원문 문장은, 원문 문장이 포함하고 있는 단어 또는 단어들의 품사를 기준으로 복수 개의 파싱 단위들로 분할된다.
본 발명의 일 양태에서, 원문 문장의 맨 앞에서부터 순차적으로, 품사가 접속사인 단어 또는 단어들이 속하는 형태소의 앞에서 및 뒤에서 그리고 품사가 명사 또는 대명사인 단어 또는 단어들이 속하는 형태소의 뒤에서, 원문 문장이 복수 개의 파싱 단위들로 분할된다.
본 발명의 일 양태에서, 원문 문장의 맨 앞에서부터 순차적으로, 품사가 전치사인 단어 또는 단어들이 속하는 형태소의 앞에서, 원문 문장이 복수 개의 파싱 단위들로 추가적으로 분할된다.
본 발명의 일 양태에서, 원문 문장의 맨 앞에서부터 순차적으로, 품사가 명사, 대명사, 동사, 형용사, 부사, 전치사, 접속사 또는 감탄사인 단어 또는 단어들이 속하는 형태소의 앞에서 및 뒤에서, 원문 문장이 복수 개의 파싱 단위들로 분할된다.
본 발명의 일 양태에 따른, 원문언어로 된 원문 문장을 목표언어로 된 번역문장으로 번역하기 위해 사용되는 번역 메모리를 상용구로 저장하는 방법은, 번역 메모리에, 원문 문장 및 그에 대응하는 번역 문장을 저장하고, 원문 문장을 번역 소단위로 세분화한 각각의 소번역단위에 대하여 소번역문을 포함하는 소번역메모리를 형성하고, 소번역단위 및 소번역문에, 각각의 소번역단위와 각각의 소번역문 간의 대응 관계를 나타내는, 소단위 대응관계지시자를 지정하고, 그리고 소번역단위 및 소번역단위에 대응하는 소번역문을 각각 등록상용구의 원문언어 및 목표언어로 저장하는, 번역 메모리를 상용구로 저장하는 방법을 포함한다.
본 발명의 일 양태에 따른, 원문언어로 된 원문 문장을 목표언어로 된 번역문장으로 번역하기 위해 사용되는 번역 메모리를 역방향 번역에 적용하는 방법은, 번역 메모리에 원문 문장 및 그에 대응하는 번역 문장을 저장하고, 원문문장을 번역 소단위로 세분화한 각각의 소번역단위에 대하여 소번역문을 형성하고, 소번역단위 및 소번역문에, 각각의 소번역단위와 각각의 소번역문 간의 대응 관계를 나타내는, 소단위 대응관계지시자를 지정하고, 그리고 목표언어로 된 원문 문장을 원문언어로 된 번역 문장으로 번역하기 위해 소단위 대응관계지시자로부터 역방향 소단위 대응관계지시자를 추출하는, 번역 메모리를 역방향 번역에 적용하는 방법을 포함한다.
본 발명에 따른 일 양태에서, 원문언어로 된 원문 문장을 목표언어로 된 번역 문장으로 번역하기 위해 사용되는 번역 메모리를, 목표언어가 원문 원어가 되고 원문언어가 목표언어가 되는 역방향 번역에 적용하기 위한 소번역메모리를 포함하는 역방향 번역메모리는
원문언어로 된 원문 문장을 목표언어로 된 번역 문장으로 번역하기 위해 사용되는, 소단위 대응관계를 갖는 번역 메모리로서,
상기 번역 메모리는 원문 문장 및 그에 대응하는 번역 문장을 저장하고,
상기 원문 문장을 번역 소단위로 세분화한 각각의 소번역단위에 대하여 번역문인 소번역문을 포함하는 소번역메모리가 형성되고,
소번역단위 및 소번역문에, 각각의 소번역단위와 각각의 소번역문 간의 대응 관계를 나타내는, 소단위 대응관계지시자가 지정되는,
번역 메모리에 있어서,
상기 번역 메모리의 소번역단위에 대응하는 소번역문을 역방향 번역메모리의 소번역단위이고,
상기 번역 메모리의 소번역단위가 역방향 번역메모리의 소번역문이며,
상기 소번역메모리를 포함하는 번역메모리의 소번역문위치정보가 역방향 번역메모리의 소번역단위위치정보가 되고, 소번역메모리를 포함하는 번역메모리의 소번역단위위치정보가 역방향 번역메모리의 소번역문위치정보가 되는, 역방향 소단위 대응관계지시자를 포함한다.
본 발명에 따른 다른 양태에서, 원문언어로 된 원문 문장을 목표언어로 된 번역 문장으로 번역하기 위해 사용되는 번역 메모리를, 목표언어가 원문 원어가 되고 원문언어가 목표언어가 되는 역방향 번역에 적용하기 위한 소번역메모리를 포함하는 역방향 번역메모리 형성 방법은
원문언어로 된 원문 문장을 목표언어로 된 번역 문장으로 번역하기 위해 사용되는, 소단위 대응관계를 갖는 번역 메모리로서,
상기 번역 메모리는 원문 문장 및 그에 대응하는 번역 문장을 저장하고,
상기 원문 문장을 번역 소단위로 세분화한 각각의 소번역단위에 대하여 번역문인 소번역문을 포함하는 소번역메모리가 형성되고,
소번역단위 및 소번역문에, 각각의 소번역단위와 각각의 소번역문 간의 대응 관계를 나타내는, 소단위 대응관계지시자가 지정되는,
번역 메모리를 형성하고,
상기 목표언어가 원문 문장이고 원문 언어가 번역 문장인 역방향 번역에 이용하기 위해, 번역 메모리의 소번역단위에 대응하는 소번역문이 역방향 번역메모리의 소번역단위가 되고, 번역 메모리의 소번역단위가 역방향 번역메모리의 소번역문 부분이 되며,
상기 소번역메모리를 포함하는 번역메모리의 소번역문위치정보가 역방향 번역메모리의 소번역단위위치정보가 되고, 소번역메모리를 포함하는 번역메모리의 소번역단위위치정보가 역방향 번역메모리의 소번역문위치정보가 되는,
소번역메모리를 포함하는 역방향 번역메모리 형성 방법을 포함한다.
본 발명의 일 양태에서 따른, 원문언어로 된 원문 문장을 목표언어로 된 번역 문장으로 번역하기 위해 사용되는, 번역 메모리를 생성하는 방법은, 번역 메모리에 원문 문장 및 그에 대응하는 번역 문장을 저장하되, 원문 문장을 번역 소단위로 세분화한 각각의 소번역단위에 대하여 소번역단위를 번역한 번역문인 소번역문을 형성하고 정렬하여 번역 문장을 저장하고, 그리고 소번역단위 및 소번역문에, 각각의 소번역단위와 각각의 소번역문 간의 대응 관계를 나타내는, 소단위 대응관계지시자를 지정한다.
본 발명의 일 양태에 따른, 원문언어로 된 원문문장을 세분한 소번역단위에 대해 목표언어로 번역한 소번역메모리를 포함하는 번역 메모리 적용 장치는,
a) 새로 번역될 새로운 원문문장을 입력하는 사용자 인터페이스 유닛;
b) 불러온 번역될 원문문장을 구성하는 단어들의 형태소를 분석하는 형태소 분석 유닛;
c) 형태소 분석된 단어들 중, 문장의 맨 앞 단어부터 순차적으로, 품사가 명사, 대명사 및 접속사인 단어 뒤까지, 그리고 접속사인 단어 앞까지 세분되는, 하나 이상의 원문문장의 단어들로 구성된 하나 이상의 파싱 단위(parsing unit)들을 형성하는 문장 파싱 유닛;
d) 번역될 맨 앞의 하나의 파싱 단위부터 순차적으로 소번역단위를 결정하는 소번역단위 결정 유닛 및 소번역문을 생성하고 정렬하여 번역메모리를 생성하는 소번역메모리를 포함하는 번역 메모리 생성 유닛]로서,
번역될 맨 앞의 하나의 파싱 단위부터 순차적으로 다음 파싱단위를 시작 파싱단위로 하고, 번역될 원문문장의 끝에 위치한 파싱 단위부터 순차적으로 하나 씩 제외하면서 역순으로 종료 파싱단위를 지정하여, 시작 파싱단위를 포함하는 번역될 하나 이상의 파싱 단위들을 시작 파싱단위부터 종료 파상단위까지 소번역메모리 DB와 비교하는 비교 유닛을 포함하고,
i) 비교 유닛은 번역될 원문문장을 구성하는 순차적인 파싱단위들이 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는지 여부를 비교하여, 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는 가장 긴 순차적인 파싱단위들을 하나의 소번역단위로 결정하고,
ii) 비교결과 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는 순차적인 파싱단위들이 존재하지 않는 경우, 확장 소번역메모리 형성 유닛]에 의해 형성된 확장 소번역메모리와 비교하여 일치하는 파싱 단위들을 하나의 소번역단위로 결정하고, 확장 소번역메모리는 소번역메모리 DB의 소번역메모리들을 기초로 소번역단위의 품사 및 문장성분을 분석하여 공통되는 동사 및 명사를 갖는 소번역메모리들의 번역 패턴으로부터 확장된 번역 메모리이고,
iii) 비교결과 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는 순차적인 파싱단위들이 존재하지 않는 경우, 번역될 파싱단위들을 사용자에게 표시하고 사용자입력 모드로 전환하여 사용자 인터페이스부 사용자가 소번역단위를 결정하게 하는,
번역될 맨 앞의 하나 이상의 파싱 단위부터 순차적으로 소번역단위를 결정하고 소번역메모리를 생성하는 단계; 및
f) 결정된 생성된 번역 메모리에 소단위 대응관계지시자를 지정하는 단계로서,
상기 d)에서 순차적으로 하나의 소번역단위가 결정될 때마다 소번역단위를 번역하여 새로운 소번역메모리를 생성하고 소단위 대응관계지시자를 지정하거나, d)에서 순차적으로 원문문장의 소번역단위들이 모두 결정된 후 소번역단위들을 번역하여 새로운 소번역문들을 생성하고, 새로운 소번역문들에 일괄적으로 소단위 대응관계지시자를 지정하는,
상기 생성된 번역 메모리에 소단위 대응관계지시자를 지정하는 단계;를 포함한다.
본 발명의 일 양태에 따른, 원문언어로 된 원문문장을 세분한 소번역단위에 대해 목표언어로 번역한 소번역메모리를 포함하는 번역 메모리 적용 프로그램은,
a) 새로 번역될 새로운 원문문장을 입력하는 기본번역메모리 매칭유닛(20);
b) 불러온 번역될 원문문장을 구성하는 단어들의 형태소를 분석하는 형태소 분석 유닛(40);
c) 형태소 분석된 단어들 중, 문장의 맨 앞 단어부터 순차적으로, 품사가 명사 및 대명사인 단어 뒤까지, 그리고 접속사인 단어 앞 및 귀까지 세분되는, 하나 이상의 원문문장의 단어들로 구성된 하나 이상의 파싱 단위(parsing unit)들을 형성하는 문장 파싱 유닛(50);
d) 번역될 맨 앞의 하나의 파싱 단위부터 순차적으로 다음 파싱단위를 시작 파싱단위로 하고, 번역될 원문문장의 끝에 위치한 파싱 단위부터 순차적으로 하나 씩 제외하면서 역순으로 종료 파싱단위를 지정하여, 시작 파싱단위부터 종료 파싱단위까지 연속되는 파싱단위들을 소번역메모리 DB)와 비교하는, 비교유닛(60);
상기 비교 유닛(60)에서 번역될 원문문장을 구성하는 순차적인 파싱단위들이 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는지 여부를 비교하여, 번역될 맨 앞의 하나의 파싱 단위부터 순차적으로, 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 전체적으로 또는 부분적으로 일치하는 가장 긴 순차적인 파싱단위들을 하나의 소번역단위로 결정하는, 소번역단위 결정 유닛(70);
상기 소번역단위결정 유닛(70)에서 결정된 소번역단위와 전체적으로 일치하는 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위에 대응되는 하나 이상의 소번역메모리를, 번역될 소번역단위의 새로운 소번역메모리로 치환하여 번역될 소번역단위에 대한 소번역메모리를 생성하고, 소번역단위결정 유닛(70)에서 결정된 소번역단위와 부분적으로 일치하는 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위에 대응되는 하나 이상의 소번역메모리를, 소번역메모리 DB의 소번역메모리와 비교하고, 일치하지 않는 부분을 번역 엔진의 번역으로 치환하여, 번역될 소번역단위의 새로운 소번역메모리를 생성하는, 번역 메모리 생성 유닛(90); 및
상기 원문 문장 내에서의 소번역단위의 소번역단위 위치정보를 나타내는 소번역단위의 소번역단위위치정보를 결정하고, 결정된 소번역단위로부터 소번역메모리를 생성하고 소번역메모리의 소번역문위치정보를 결정하는 소단위 대응관계지시자 생성유닛(80);을 포함한다.
본 발명의 일 양태에 따른, 원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리(이하, "소번역메모리"라고 함)를 포함하는 번역 메모리는, 소번역메모리는 원문 문장을 번역 소단위로 세분화한 소번역단위 및 소번역단위에 대응하는 번역 문장 내의 번역 부분인 소번역문의 쌍을 포함하되, 번역 메모리는 번역 메모리 내에서 소번역메모리를 특정하는 소단위 대응관계지시자를 포함하고, 소단위 대응관계지시자에 의해 번역 메모리 내에서 소번역메모리의 소번역단위 및 소번역문 쌍의 대응 관계가 표시된다.
본 발명의 일 양태에서, 소단위 대응관계지시자는 소번역단위의 원문 문장 내 위치를 나타내는 정보인 소번역단위위치정보(8'), 및 소번역문의 번역 문장 내 위치를 나타내는 정보인 소번역문위치정보(8")를 포함한다.
본 발명의 일 양태에서, 번역 메모리의 원문 문장은 복수 개의 소번역단위들로 구성되고, 번역메모리의 번역 문장은 복수 개의 소번역단위들에 대응하는 소번역문들로 구성되고, 소번역단위들 각각에 대한 소번역문들의 대응관계가 소단위 대응관계표시자들에 의해 표시되고, 소단위 대응관계표시자들의 소번역단위위치정보들은 소번역단위들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고, 소단위 대응관계표시자들의 소번역문위치정보들은 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들을 포함한다.
본 발명의 일 양태에서, 소번역단위들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들은 소번역단위들 각각의 첫 문자의 시작위치, 및 소번역단위들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시하고, 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 소번역문들 각각의 첫 문자의 시작위치, 및 소번역문들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시한다.
본 발명의 일 양태에서, 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역 문장 내에서 소번역문들 각각의 정렬 순서를 나타내는 위치를 더 지시한다.
본 발명의 일 양태에서, 정렬 순서에 의해 소번역메모리들의 소번역문들을 정렬할 때 인접하는 두 개의 소번역문들 중 앞쪽에 위치한 소번역문(이하 "피삽입 소번역문"이라고 함)은 피삽입 소번역문 내로 뒷쪽에 위치한 소번역문(이하 "삽입 소번역문"이라고 함)이 삽입되는 위치를 지시하는 삽입위치지시자를 포함할 수 있다.
본 발명의 일 양태에서, 피삽입 소번역문은 삽입위치지시자에 의해 피삽입 소번역문이 삽입위치지시자의 위치를 기준으로 전반부 및 후반부로 특정되며, 피삽입 소번역문의 번역 문장 내 위치를 지시할 수 있는 숫자들은 피삽입 소번역문의 전반부의 첫 문자의 시작위치 및 전반부의 마지막 문자의 종료위치 중 하나 이상, 그리고 후반부의 첫 문자의 시작위치 및 후반부의 마지막 문자의 종료위치 중 하나 이상을 지시한다.
본 발명의 일 양태에서, 번역 메모리의 원문 문장은 복수 개의 소번역단위들로 구성되고, 복수 개의 소번역단위들 중 일부에 대응하는 소번역문들이 형성되고, 일부 소번역단위와 일부 소번역단위에 대한 소번역문 간의 대응관계가 소단위 대응관계표시자에 의해 표시되고, 소단위 대응관계표시자의 소번역단위위치정보는 일부 소번역단위의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고, 소단위 대응관계표시자의 소번역문위치정보는 소번역문의 번역 문장 내 위치를 지시할 수 있는 숫자들을 포함한다.
본 발명의 일 양태에서, 본 발명에 따른 소번역메모리를 포함하는 번역 메모리는 컴퓨터 판독가능한 저장 매체에 기록된다.
본 발명의 일 양태에 따른, 소번역메모리를 포함하는 번역 메모리를 형성한 후, 소번역메모리를 포함하는 번역 메모리로부터, 목표언어가 원문 원어가 되고 원문언어가 목표언어가 되는 역방향 번역에 적용하기 위한 소번역메모리를 포함하는 역방향 번역메모리는 목표언어가 원문 문장이고 원문 언어가 번역 문장인 역방향 번역에 이용하기 위해, 번역 메모리의 소번역단위에 대응하는 소번역문이 역방향 번역메모리의 소번역단위가 되고, 번역 메모리의 소번역단위가 역방향 번역메모리의 소번역문이 되며, 소번역메모리를 포함하는 번역메모리의 소번역문위치정보가 역방향 번역메모리의 소번역단위위치정보가 되고, 소번역메모리를 포함하는 번역메모리의 소번역단위위치정보가 역방향 번역메모리의 소번역문위치정보가 된다.
본 발명의 일 양태에 따른, 소번역메모리를 포함하는 역방향 번역 메모리는 컴퓨터 판독가능한 저장 매체에 저장된다.
본 발명의 일 양태에 따른, 원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리(이하, " 1차 소번역메모리"라고 함)를 포함하는 번역 메모리는 1차 소번역메모리는 원문 문장을 번역 소단위로 세분화한 1차 소번역단위 및 1차 소번역단위에 대응하는 번역 문장 내의 번역 부분인 1차 소번역문의 쌍을 포함하되, 번역 메모리는 번역 메모리 내에서 1차 소번역메모리를 특정하는 1차 소단위 대응관계지시자를 포함하고, 1차 소단위 대응관계지시자에 의해 번역 메모리 내에서 1차 소번역메모리의 1차 소번역단위 및 1차 소번역문 쌍의 대응 관계가 표시되고, 1차 소번역메모리는 1차 소번역메모리를 추가로 세분화한 추가적인 소번역메모리인 2차 소번역메모리를 포함할 수 있으며, 2차 소번역메모리를 포함하는 경우, 1차 소번역메모리의 1차 소번역단위를 추가로 세분화한 번역 소단위인 2차 소번역단위 및 2차 소번역단위에 대응하는 번역 부분인 2차 소번역문의 쌍을 포함하되, 2차 소번역메모리는 2차 소번역메모리를 특정하는 2차 소단위 대응관계지시자를 포함하고, 2차 소단위 대응관계지시자는 2차 소번역메모리의 2차 소번역단위 및 2차 소번역문 쌍의 대응 관계를 나타낸다.
본 발명의 일 실시예에서, 2차 소단위 대응관계지시자)는 2차 소번역단위의 1차 소번역단위 내 위치를 나타내는 정보인 2차 소번역단위위치정보와 2차 소번역문의 1차 소번역문 내 위치를 나타내는 정보인 2차 소번역문위치정보를 포함한다.
본 발명의 일 양태에서, 1차 소번역메모리의 1차 소번역단위는 복수 개의 2차 소번역단위들로 구성되고, 1차 번역메모리의 1차 소번역문은 복수 개의 2차 소번역단위들에 대응하는 2차 소번역문들로 구성되고, 2차 소번역단위들과 2차 소번역문들 간의 대응관계가 2차 소단위 대응관계표시자들에 의해 표시되고, 2차 소단위 대응관계표시자들의 소번역단위위치정보들은 2차 소번역단위들 각각의 1차 소번역단위 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고, 2차 소단위 대응관계표시자들의 소번역문위치정보들은 2차 소번역문들 각각의 1차 소번역문 내 위치를 지시할 수 있는 숫자들을 포함한다.
본 발명의 일 양태에서, 2차 소번역단위들 각각의 1차 소번역단위 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들은 2차 소번역단위들 각각의 첫 문자의 시작위치, 및 2차 소번역단위들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시하고, 2차 소번역문들 각각의 1차 소번역문 내 위치를 지시할 수 있는 숫자들은 2차 소번역문들 각각의 첫 문자의 시작위치, 및 2차 소번역문들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시한다.
본 발명의 일 양태에서, 2차 소번역문들 각각의 1차 소번역문 내 위치를 지시할 수 있는 숫자들은 1차 소번역문 내에서 2차 소번역문들 각각의 정렬 순서를 나타내는 위치를 더 지시한다.
본 발명의 일 양태에서, 정렬 순서에 의해 2차 소번역메모리들의 2차 소번역문들을 정렬할 때 인접하는 두 개의 2차 소번역문들 중 앞쪽에 위치한 2차 소번역문(이하 "피삽입 2차 소번역문"이라고 함)은 피삽입 2차 소번역문 내로 뒷쪽에 위치한 2차 소번역문(이하 "삽입 2차 소번역문"이라고 함)이 삽입되는 위치를 지시하는 삽입위치지시자를 포함한다.
본 발명의 일 양태에서, 피삽입 2차 소번역문은 삽입위치지시자를 포함하는 경우, 삽입위치지시자에 의해 피삽입 2차 소번역문이 삽입위치지시자의 위치를 기준으로 전반부 및 후반부로 특정되며, 피삽입 2차 소번역문의 1차 소번역문 내 위치를 지시할 수 있는 숫자들은 피삽입 2차 소번역문의 전반부의 첫 문자의 시작위치 및 전반부의 마지막 문자의 종료위치 중 하나 이상, 그리고 후반부의 첫 문자의 시작위치 및 후반부의 마지막 문자의 종료위치 중 하나 이상를 지시한다.
본 발명의 일 양태에서, 1차 소번역메모리의 1차 소번역단위는 복수 개의 2차 소번역단위들로 구성되고, 복수 개의 2차 소번역단위들 중 일부에 대응하는 2차 소번역문이 형성되고, 일부 2차 소번역단위와 일부 2차 소번역단위에 대한 2차 소번역문 간의 대응관계가 2차 소단위 대응관계표시자에 의해 표시되고, 2차 소단위 대응관계표시자의 소번역단위위치정보는 일부 2차 소번역단위의 1차 소번역단위 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함한다.
본 발명의 일 양태에 따른, 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리는 컴퓨터 판독가능한 저장 매체에 기록된다.
본 발명의 일 양태에 따른, 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리를 형성한 후, 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리로부터, 목표언어가 원문 원어가 되고 원문언어가 목표언어가 되는 역방향 번역에 적용하기 위한 소번역메모리를 포함하는 역방향 번역메모리는 목표언어가 원문 문장이고 원문 언어가 번역 문장인 역방향 번역에 이용하기 위해, 번역 메모리의 1차 소번역단위 및 2차 소번역단위에 대응하는 1차 소번역문 및 2차 소번역문이 역방향 번역메모리의 1차 소번역단위 및 2차 소번역단위가 되고, 번역 메모리의 1차 소번역단위 및 2차 소번역단위가 역방향 번역메모리의 1차 소번역문 및 2차 소번역문이 되며, 1차 소번역메모리를 포함하는 번역메모리의 1차 소번역문위치정보가 역방향 번역메모리의 1차 소번역단위위치정보가 되고, 1차 소번역메모리를 포함하는 번역메모리의 1차 소번역단위위치정보가 역방향 번역메모리의 1차 소번역문위치정보가 되며, 2차 소번역메모리를 포함하는 번역메모리의 2차 소번역문위치정보가 역방향 번역메모리의 2차 소번역단위위치정보가 되고, 2차 소번역메모리를 포함하는 번역메모리의 2차 소번역단위위치정보가 역방향 번역메모리의 2차 소번역문위치정보가 된다.
본 발명의 일 양태에 따른, 소번역메모리를 포함하는 역방향 번역 메모리는 컴퓨터 판독가능한 저장 매체에 기록된다.
본 발명은 기존의 원문언어와 목표언어로 된 번역메모리를 개선하여 번역메모리 내에 소번역단위로 세분된 소번역단위를 번역한 소번역문을 포함하고, 소번역문이 번역문장을 완성하기 위해 정렬될 때의 정렬위치 정보를 갖는 소단위 대응관계지시자를 갖도록 구성된다. 이러한 지시자를 포함하는 소번역문은 원문언어를 번역할 때 비록 번역할 원문언어의 원문문장이 번역 메모리에 저장된, 이전에 번역된 원문문장과 100% 일치하지 않는다고 하더라도, 원문문장 내에서 일치하는 부분에 대한 소번역메모리를 이용하여 원문문장의 일부에 대해서도 번역 메모리를 이용가능하게 함으로써 번역의 정확성을 높이고 번역 시간을 단축시킬 수 있다.
원문문장이 100% 일치하지 않더라도 원문문장 내 소번역단위가 일치하면, 일치된 소번역단위에 해당하는 소번역단위 번역 메모리를 이용할 수 있으므로, 번역메모리의 활용 빈도를 높여서 번역 시간을 단축할 수 있다.
원문문장 대 번역문장 단위로 오류 체크를 할 때보다 원문문장을 더 세분화 한 소번역단위 대 번역문장을 세분화한 소번역단위(번역메모리로 저장된 경우 소번역메모리 단위)로 오류 체크할 수 있으므로, 컴퓨터에 의한 자동 오류 체크가 정확해지고 빨라져서, 번역이 제대로 되었는지 확인하는 리뷰 시간이 단축된다. 구체적으로, 원문문장 대 번역문장으로 단어를 1:1 매칭할 때보다 소번역단위와 번역단위 내의 단어들의 1:1 매칭율이 매우 높아지기 때문에 프로그램을 통한 용어 추출이 정확해지고, 또한 소번역단위가 원문문장을 구성하는 구절을 이루는 일부분이기 때문에 소번역단위에 대해 기계번역을 하더라도 소번역단위 내에서의 번역 정확도가 높아진다. 예를 들어, 기존의 원문 문장 대 번역 문장 오류 체크 프로그램은 원문 문장 내 동일한 단어 또는 숫자가 2회 이상 존재하는 경우 원문 문장 내 동일한 단어 또는 숫자의 위치를 정확하게 구분하지 못하여 오류 체크를 하지 못하는 문제점이 있었지만, 본 발명의 소번역단위 대 소번역문 단위의 오류 체크는 동일한 단어가 소번역단위 내에 존재할 확률이 원문 문장 내 동일한 단어 또는 숫자가 존재할 확률보다 현저하게 줄어들게 되어 오류 체크 프로그램의 성능을 크게 향상시킬 수 있다. 또한, 본 발명의 소번역단위 대 소번역문 단위의 오류 체크를 기존의 원문 문장 대 번역 문장에 대한 오류 체크와 병행하여 성능을 향상시킬 수 있다.
소번역메모리 DB에 저장된 원문문장 내의 단어 또는 단어를 포함하는 어절들(영어는 단어와 어절이 일치함)로 구성된, 원문문장에 대한 세분된 소번역단위에 대한 소번역문을 포함하여서, 소번역문의 문장성분 분석을 통하여, 원문문장에 대한 문장 성분 분석이 정확해지며(예를 들어, 번역문의 주격 조사, 목적격 조사, 보격 조사 분석을 통해 원문의 소번역단위의 문장성분을 추정할 수 있음), 원문문장에 있는 단어들의 대응 소번역문을 정확하게 추출할 수 있게 되므로, 번역 메모리에 대한 활용도가 높아진다. 이는 번역메모리 저장단계에서 소번역메모리들로 분할하여 저장하기 때문에, 원문과 번역문을 포함하는 번역메모리들을 통계적인 방법을 이용하여 번역 소단위들로 분할하고 번역 규칙을 찾는 통계 기반의 분할방법보다 정확도가 훨씬 높고, 통계 기반 자동번역에서 데이터 통계분석의 정확성을 높이기 위해 많은 번역메모리 데이터를 수집할 필요도 없다.
본 발명의 삽입정렬에 의한 정렬 방식은 언어학적으로 어순이 상이한 굴절어와 교착어 사이의 번역에서 원문의 대상 언어를 형태소 분석에 따라 소번역단위들로 분할하고 이에 대응하는 소번역문 및 소번역메모리를 형성한 후, 소번역문들을 목표 언어의 번역문장으로 빠르게 정렬할 수 있게 하므로, 굴절어와 교착어 간의 번역에 필요한 소번역메모리를 빠르고 정확하게 구축할 수 있게 한다.
소번역메모리를 포함하는 번역메모리가 쌓일수록 새로운 원문문장에 적용할 소번역메모리들이 많아지기 때문에 사용자는 직접 소번역단위들을 번역하지 않고 CAT 프로그램을 이용하여 직접 타이핑하는 시간을 줄일 수 있으므로, 번역 속도가 빨라지게 된다.
도 1a 및 도 1b는 종래의 번역메모리를 도시한다.
도 2a는 본 발명에 따른 소번역메모리를 포함하는 번역메모리로 저장하기 위해 만들어지는 중간단계 소번역메모리를 생성하는 유저 인터페이스 유닛의 입력 유닛 및 표시 유닛의 실시예이다.
도 2b는 본 발명에 따른 소번역메모리를 생성하기 위한 유저 인터페이스 유닛의 입력 유닛 및 표시 유닛의 다른 실시예이다.
도 2c 및 도 2cc는 본 발명에 따른 1차 소번역메모리를 생성하기 위한 1차 소번역메모리 입력 유닛 및 2차 소번역메모리를 생성하기 위한 2차 소번역메모리 입력 유닛의 실시예이다.
도 2d는 본 발명에 따른 소번역메모리를 생성하기 위한 유저 인터페이스 유닛의 입력 유닛에서 인접한 두 개의 소번역메모리의 소번역문에 대한 삽입정렬의 실시예이다.
도 3a 내지 도 3l는 본 발명에 따른 소번역메모리를 포함하는 번역메모리의 실시예이다.
도 4은 본 발명의 일 실시예에 따른 소번역메모리를 포함하는 번역 메모리 적용 장치에 대한 블록 구성도이다.
도 5a 내지 도 5d는 본 발명에 따른 소번역메모리를 포함하는 번역메모리를 이용한 역방향 번역메모리의 실시예이다.
도 6은 본 발명에 따른 소번역메모리를 포함하는 번역메모리 이용 방법의 일 실시예에 대한 순서도이다.
도 7은 본 발명에 따른 소번역메모리를 포함하는 번역메모리 이용 방법의 다른 실시예에 대한 순서도이다.
도 8a는 원문 언어가 영어이고 목표언어가 일본어인 소번역메모리를 포함하는, 도 3d에 대응하는 번역 메모리의 실시예를 도시하고, 도 8b는 원문 언어가 영어이고 목표언어가 일본어인 소번역메모리를 포함하는, 도 3e에 대응하는 번역 메모리의 실시예를 도시한다.
도 8c는 원문 언어가 영어이고 목표언어가 중국어인 소번역메모리를 포함하는, 도 3d에 대응하는 번역 메모리의 실시예를 도시하고, 도 8d는 원문 언어가 영어이고 목표언어가 중국어인 소번역메모리를 포함하는, 도 3e에 대응하는 번역 메모리의 실시예를 도시한다.
본 발명은 영어를 원문 문장으로 한국어를 번역 문장으로 하여 기술된다. 이외에도, 본 발명은 굴절어를 교착어로 번역하여 구축되는 번역 메모리, 또는 교착어를 굴절어로 번역하여 구축되는 번역 메모리에 이용 또는 응용될 수 있다.
본 발명에서 발명자가 정의한 용어의 정의는 다음과 같다(정의된 용어들은 본 발명에서만 적용되며 자연어 처리에 관해 통용되는 용어들과 일치하지 않을 수도 있다):
원문문장(1): 원문언어로 된 번역될 문장의 번역 단위(Traslation Units). 번역 단위는 단락 원문문장 또는 원문문장보다 작은 단위로 지정될 수 있으나, 본 발명에서는 특별히 다르게 언급되는 것을 제외하고 번역이 이루어져 번역 메모리로 저장되는 원문 문장을 번역단위로 한다.
번역문장(6): 원문언어로 된 번역될 원문 문장을 목표언어로 번역한 번역 문장으로, 번역 단위(TU)가 되는 원문과 짝을 이루어 번역 메모리가 된다.
파싱 단위(Parsing Unit): 컴퓨터가 번역 단위(TU)인 원문 문장 내에서 형태소 분석을 통해서 소번역단위가 될 수 있는 단위로서, 기계적인 분할 규칙에 의해 분할된 원문문장 내의 단어 또는 하나 이상의 단어들의 집합체이다.
소번역단위(2), 소번역문(7) 및 소번역메모리(9): 소번역단위는 번역문장으로 번역되는 번역단위(TU)를 여러 개의 소단위로 세분화한 단위로서, 하나 이상의 파싱 단위들로서 구성될 수 있다.
소번역문은 번역 메모리의 원문의 소번역단위에 대응하는, 번역문장 내의 부분번역문으로 정의된다. 소번역문은 소번역단위에 대한 번역부분이고 소번역단위들에 대한 소번역문들을 정렬하면 번역문장이 된다. 번역 메모리의 원문 문장은 복수 개의 소번역단위들로 구성되고, 번역메모리의 번역 문장은 복수 개의 소번역단위들에 대응하는 소번역문들로 구성되며, 복수 개의 소번역단위들에 대응하는 소번역문들을 정렬하면 번역 문장이 완성될 수 있다.
소번역메모리는 소번역단위 및 이에 대응하는 번역문인 소번역문의 쌍을 포함하고, 본 발명에서 번역 메모리는 소번역메모리들을 포함한다. 따라서, 소번역메모리를 포함하는 번역메모리는 소번역단위(2)를 포함하는 번역 단위인 원문 문장(1), 및 소번역단위(2)에 대한 번역 부분인 소번역문(7)을 포함하는 번역문장(6), 그리고 소번역단위(2)와 소번역문(7) 간의 대응관계를 나타내는 소단위 대응관계지시자(8)를 포함한다. 소번역메모리는 소번역단위와 소번역문의 쌍이기 때문에, 소번역단위에 대한 번역문인 소번역문이 생성되면 동시에 소번역메모리도 완성될 수 있다.
본 발명에서 원문 문장이 번역단위가 되면, 이러한 원문 문장이 번역단위(TU)를 여러개의 소번역단위로 세분화할 수 있고, 소번역단위는 이미 저장된 소번역메모리의 소번역단위이 존재하는 경우 이러한 저장된 소번역메모리의 소번역단위 및 이미 저장된 분할패턴에 의해 결정될 수도 있다.
또한, 소번역메모리는 그 자신도 다시 세분화되어 2차 소번역단위(202), 2차 소번역문(207) 및 2차 소단위 대응관계 지시자(208)를 포함하는 2차 소번역메모리를 가질 수 있다. 2차 소번역메모리를 갖는 소번역메모리를 1차 소번역메모리라고 한다.
소단위 대응관계지시자(8): 원문문장(1)의 소번역단위(2)와 번역문장의 소번역문(7) 간의 소단위(sub-unit) 대응 관계를 나타내는 지시자로서, 번역메모리를 구성하는 소번역메모리는 번역메모리 내에서 소단위 대응관계지시자에 의해 특정되기 때문에, 소번역메모리의 갯수는 소단위 대응관계지시자의 갯수와 일치한다. 소단위 대응관계지시자(8)는 소번역단위의 원문 문장 내 정렬위치를 가리키는 정보인 소번역단위위치정보(8')와 소번역문의 번역 문장 내 정렬위치를 가리키는 정보인 소번역문위치정보(8")를 포함한다. 소번역문위치정보(8")는 하나의 번역문장을 이루는 소번역문들 간의 정렬 위치를 지정한다. 소번역문은 번역메모리를 구성하는 원문의 소번역단위(2)에 대한 번역부분으로서, 소번역단위(2)를 번역하여 생성한 소번역메모리의 번역문 부분이고, 이러한 소번역문들을 소단위 대응관계지시자의 소번역문위치정보(8")에 따라 정렬하면 번역메모리의 번역문장이 된다.
중간단계 소단위 대응관계지시자(4): 소번역단위(2)들을 순차적으로 번역하고 정렬하는 과정에서 소번역단위(2)와 소번역단위(2)에 대한 소번역문의 대응관계를 나타낸다. 소단위 대응관계지시자(6)로 저장되기 전 소번역단위(2)의 번역부분들의 순번을 포함함. 중간단계 소번역단위의 원문 문장 내 정렬위치를 가리키는 정보인 소번역단위위치정보(4')와 중간단계 소번역문의 번역 문장 내 정렬위치를 가리키는 정보인 소번역문위치정보(4")를 포함할 수 있다. 중간단계 소단위 대응관계지시자(4)를 포함하는 번역메모리로 본 발명의 소번역메모리를 포함하는 번역메모리를 표시할 수도 있다(도 2a 및 도 2b).
삽입위치지시자(5): 인접하는 두개의 소번역문들 중 앞쪽에 위치하는 소번역문 내로 뒷쪽에 위치된 인접하는 소번역문의 삽입을 지시하는, 소번역문위치정보에 포함된 지시자로서, 소번역문들을 완성한 후 번역문장을 완성하기 위해 이를 정렬할 때, 정렬 순서에 따라 인접하는 두개의 소번역문들 중 하나의 소번역문이 다른 하나의 소번역문 내로 삽입되는 위치를 지시하는 표시이다.
역방향 소단위 대응관계지시자: 소번역메모리를 포함하는 번역메모리에서 추출된 소단위 대응관계지시자를 원문언어와 목표언어가 반대가 되는 역방향 소번역 메모리를 생성할 때 역방향 소번역메모리의 소번역단위와 소번역문 간에 지정된 소단위 대응관계지시자(144)이다.
어절: 문장을 이루는 도막도막의 마디. 문장 성분의 최소 단위로서 띄어쓰기의 단위가 됨.국문 문장인 경우를 예를 들어, "나는 집에 가고 있다." 는 "나는/집에/가고/있다." 와 같이 네 개의 어절로 구성되는 것으로 정의되고, 영문 문장인 경우를 예를 들어, "I am going home" 은 "I/am/going/home." 과 같이 네 개의 어절로 구성되는 것으로 정의된다.
단어: 자립성(自立性)과 분리성(分離性)을 가진 말의 최소 단위. 최소한 1개 이상의 형태소로 이루어지고, 일정한 뜻을 가짐. 영어는 단어와 어절이 일치하고, 한국어는 단어에 조사 등이 붙어 어절이 된다.
도 4는 본 발명의 일 실시예에 따른 소번역메모리를 포함하는 번역 메모리 적용 장치에 대한 블록 구성도이다. 사용자 인터페이스 유닛(10), 기본 번역 메모 매칭 유닛(20), 형태소 분석 유닛(40), 문장 파싱 유닛(50), 비교유닛(60), 소번역단위 결정 유닛(70), 소단위 대응관계지시자 생성 유닛(80), 소번역메모리를 포함하는 번역 메모리 생성 유닛(90), 소번역메모리를 포함하는 번역메모리 데이터 베이스(100, 이하 "소번역메모리 DB"라고 한다), 소번역메모리 생성 유닛(110) 및 확장된 소번역메모리를 포함하는 번역메모리 DB(120)(이하, "확장 소번역메모리 DB"라고 함)를 포함할 수 있다.
사용자 인터페이스 유닛(10)은 중간소번역메모리 입력 유닛(11) 및 표시 유닛(12)을 포함한다. 사용자는 중간소번역메모리 입력 유닛(11)을 통해 원문문장의 소번역단위로부터 소번역문을 포함하는 소번역메모리를 생성할 때 일반적으로 원문문장을 번역할 때 걸리는 시간을 초과하지 않으면서 원문문장을 소번역메모리 단위로 저장할 수 있도록 소번역단위의 결정 및 결정된 소번역단위가 순차번역을 제공할 수 있게 한다. 필요한 경우, 사용자는 중간소번역메모리 입력 유닛(11)을 통해, 사용자는 소번역메모리를 포함하는 번역 메모리 적용 장치를 위해 세분된 소번역단위의 길이(단어들의 수)를 조정할 수 있고, 중간단계 소번역메모리 생성 유닛으로부터 표시된 중간단계 소번역메모리를 수정할 수 있다. 표시 유닛(12)은 소번역메모리를 포함하는 번역메모리 DB(100)와 원문문장이 매칭되면 기본 번역 메모리 매칭 유닛(20)을 통해 사용자에게 표시하고, 비매칭되면 형태소 분석을 위해 비매칭된 원문문장을 출력한다.
기본 번역 메모리 매칭 유닛(20)은 종래의 번역 메모리와 동일한 방법으로 소번역 메모리를 포함하는 번역 메모리와 원문문장 전체가 매칭되는지를 판단할 수 있다. 기본 번역 메모리 매칭 유닛(20)으로부터 기본 번역 메모리DB와 원문문장이 매칭되는지를 판단하여 매칭되면 번역 메모리 DB의 번역문장을 표시 유닛(12)에 표시하고 소번역메모리를 포함하는 번역메모리 DB에 저장하며, 매칭되지 않으면 형태소분석유닛(40)이 원문문장을 형태소 분석을 한다.
문장 파싱 유닛(50)은 형태소 분석된 단어들 중, 문장의 맨 앞 단어부터 순차적으로, 품사가 적어도 명사인 단어 뒤를 파싱(parsing)한다. 이러한 파싱 단위는 컴퓨터 또는 사용자가 원문문장에서 번역하는 최소한의 번역 단위가 될 수 있다.
비교 유닛(60)은 문장 파싱 유닛(50)에서 파싱된 파싱 단위가 소번역메모리 DB(100) 내의 원문문장의 소번역단위와 일치하는지 여부를 판단한다. 또한, 문장 파싱 유닛(50)에서 파싱된 파싱 단위를 확장 소번역메모리 DB(120) 내의 원문문장의 소번역단위와 일치하는지 여부를 판단하고 그 결과를 출력한다. 소번역단위 결정 유닛(70)은 비교 유닛(60)으로부터의 비교 결과에 따라 소번역단위를 결정하고 표시 유닛(12)에 표시하며, 사용자는 번역될 소번역단위를 직접 수정할 수 있다.
소번역메모리를 포함하는 번역 메모리 생성 유닛(90)은 중간단계 소번역메모리 생성 유닛(91)과 번역 엔진 유닛(92)을 포함한다. 소번역단위가 결정되면 중간단계 소번역메모리 생성 유닛(91)은 소번역메모리를 포함하는 번역메모리 DB 및 확장 소번역메모리 DB 내의 소번역단위에 대응하는 소번역문 및 확장 소번역메모리로부터 번역될 소번역단위에 대한 소번역메모리를 호출하고 표시 유닛(12)에 표시한다. 번역 엔진 유닛(92)은 소번역메모리를 포함하는 번역메모리 DB 및 확장 소번역메모리 DB 내의 소번역단위에 대응하는 소번역문을 포함하는 소번역메모리 및 확장 소번역메모리의 소번역단위와 번역될 소번역단위가 100%일치하지 않는 경우 ,예를 들어 동사의 시제의 불일치, 동사의 목적어의 불일치, 명사의 수의 불일치, 등의 경우에, 소번역메모리를 포함하는 번역메모리 DB 또는 확장 소번역메모리 DB 내의 소번역단위에 대응하는 소번역문을 포함하는 소번역메모리 및 확장 소번역메모리의 소번역단위와, 결정된 소번역단위를 비교하여 불일치 부분을 번역 엔진을 통해 번역한다. 이후 불일치 부분을 번역 엔진의 번역으로 치환하여, 소번역메모리를 포함하는 번역메모리 DB 또는 확장 소번역메모리 DB 내의 소번역단위에 대응하는 소번역문을 포함하는 소번역메모리 또는 확장 소번역메모리의 소번역단위를 수정한다. 이러한 번역 엔진을 통한 번역은 문장 전체에 대한 기계번역이 아니라, 번역단위인 원문문장을 세분한 하나의 소번역단위에 대한 기계번역이므로, 문장 전체에 대한 기계 번역들보다 훨씬 높은 정확도를 가질 수 있다. 단문의 기계번역은 번역 정확도가 일정 수준으로 담보됨을 고려한 것이다.
소단위 대응관계지시자 생성 유닛(80)는 소번역단위 결정 유닛(70)으로부터 원문문장의 소번역단위가 결정되면 원문문장에서 소번역단위의 원문 문장 내 정렬위치를 가리키는 정보인 소번역단위위치정보(4', 8')를 생성하고, 이에 대응관계에 있는, 소번역메모리를 포함하는 번역메모리 생성 유닛(90)으로부터 소번역문의 번역 문장 내 정렬위치를 가리키는 정보인, 소번역문위치정보(4", 8")를 생성한다.
소번역메모리를 포함하는 번역메모리 DB(100)는 소번역메모리를 포함하는 번역메모리 생성 유닛(90)으로부터 생성된 소번역메모리를 포함하는 번역메모리를 저장해 놓은 데이터베이스이다.
확장소번역메모리 생성 유닛(110)은 문장성분 및 형식분석유닛(111) 및 소번역메모리분석유닛(112)을 포함한다. 본 발명의 번역메모리는 원문문장 내의 단어 또는 단어를 포함하는 어절들로 구성된, 원문문장에 대한 세분된 소번역단위에 대한 소번역문을 포함하여서, 원문문장에 대한 문장 성분 분석이 정확해지며, 원문문장에 있는 단어들의 대응 번역부분을 정확하게 추출할 수 있게 되므로, 번역메모리에 대한 활용도가 높아진다. 예를 들어 소번역문와 소번역단위의 대응관계에 관한 정보로부터 소번역문이 한국어인 경우 한국어는 조사에 의해 정확하게 문장성분의 파악이 가능하므로, 소번역문들을 분석하여 원문문장에서 동일한 원문 단어에 대한 공통된 소번역문의 번역을 분석하여 소번역문의 번역 패턴('번역 태그'라고도 함, 공통된 부분을 품사로 인자로 저장한 부분)을 추출하여, 문장 전체가 아닌 소번역문에 대한 확장 소번역메모리 구축을 가능하게 한다. 이러한 확장 소번역메모리는 종래의 문장 단위 번역메모리의 확장 메모리보다 세분되어 문장 내의 소번역단위에 대해 구축되기 때문에 월등하게 정확하고 활용도가 높게 된다. 문장성분 및 형식분석유닛(111)은 상기 번역메모리 DB(100)에 저장된 소번역메모리를 포함하는 번역메모리의 문장 성분 및 문장 형식등을 분석하여 중간단계 소번역메모리생성유닛(91)에서 유사한 문장 성분 및 형식을 갖는 소번역단위의 번역에 이용되도록 한다. 소번역메모리분석유닛(122)은 번역메모리 DB(100)의 소번역메모리들을 기초로 소번역단위의 형태소 및 문장성분을 분석하여 공통되는 동사, 명사 등을 갖는 소번역메모리들의 번역 패턴으로부터 번역메모리 DB를 확장한다.
본 발명의 일 실시예에서, 원문언어로 된 원문문장을 세분한 소번역단위에 대해 목표언어로 번역한 소번역메모리를 포함하는 번역 메모리 적용 프로그램은
a) 새로 번역될 새로운 원문문장을 입력하는 기본번역메모리 매칭유닛(20);
*b) 불러온 번역될 원문문장을 구성하는 단어들의 형태소를 분석하는 형태소 분석 유닛(40);
c) 형태소 분석된 단어들 중, 문장의 맨 앞 단어부터 순차적으로, 품사가 명사 및 대명사인 단어 뒤까지, 그리고 접속사인 단어 앞 및 귀까지 세분되는, 하나 이상의 원문문장의 단어들로 구성된 하나 이상의 파싱 단위(parsing unit)들을 형성하는 문장 파싱 유닛(50);
d) 번역될 맨 앞의 하나의 파싱 단위부터 순차적으로 다음 파싱단위를 시작 파싱단위로 하고, 번역될 원문문장의 끝에 위치한 파싱 단위부터 순차적으로 하나 씩 제외하면서 역순으로 종료 파싱단위를 지정하여, 상기 시작 파싱단위부터 상기 종료 파싱단위까지 연속되는 파싱단위들을 소번역메모리 DB)와 비교하는, 비교유닛(60);
상기 비교 유닛(60)에서 번역될 원문문장을 구성하는 상기 순차적인 파싱단위들이 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는지 여부를 비교하여, 번역될 맨 앞의 하나의 파싱 단위부터 순차적으로, 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 전체적으로 또는 부분적으로 일치하는 가장 긴 순차적인 파싱단위들을 하나의 소번역단위로 결정하는, 소번역단위 결정 유닛(70);
상기 소번역단위결정 유닛(70)에서 결정된 소번역단위와 전체적으로 일치하는 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위에 대응되는 하나 이상의 소번역문을, 번역될 소번역단위의 새로운 소번역문으로 치환하여 번역될 소번역단위에 대한 소번역문을 생성하고, 상기 소번역단위결정 유닛(70)에서 결정된 소번역단위와 부분적으로 일치하는 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위에 대응되는 하나 이상의 소번역문을, 소번역메모리 DB의 소번역문와 비교하고, 일치하지 않는 부분을 번역 엔진의 번역으로 치환하여, 번역될 소번역단위의 새로운 소번역문을 생성하는, 번역 메모리 생성 유닛(90); 및
상기 원문 문장 내에서의 상기 소번역단위의 소번역단위 위치정보를 나타내는 소번역단위의 소번역단위위치정보를 결정하고, 상기 결정된 소번역단위로부터 소번역문을 생성하고 소번역문의 소번역문위치정보를 결정하는 소단위 대응관계지시자 생성유닛(80);을 포함한다.
도 2a는 본 발명에 따른 소번역메모리를 포함하는 번역메모리로 저장하기 위해 만들어지는 중간단계 소번역메모리의 실시예이며, 도 3a 내지 도 3l는 본 발명에 따른 소번역메모리를 포함하는 번역메모리의 실시예이다.
원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리(9)를 포함하는 번역 메모리는 소번역메모리는 원문 문장을 번역 소단위로 세분화한 소번역단위(2) 및 소번역단위에 대응하는 번역 문장 내의 번역 부분인 소번역문(7)의 쌍을 포함하되, 번역 메모리는 번역 메모리 내에서 소번역메모리를 특정하는 소단위 대응관계지시자(8)를 포함하고, 소단위 대응관계지시자에 의해 상기 번역 메모리 내에서 상기 소번역메모리의 소번역단위 및 소번역문 쌍의 대응 관계가 표시된다.
영어 원문과 한국어 번역문의 예시를 들어 본 발명을 설명하면, 원문문장 원문에 대해 번역 메모리는 다음과 같다
원문문장 A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
중간단계 소번역메모리 입력유닛(11) A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ can be a operating state[작동 상태일 수 있다.]10-7/ at which a very small amount[매우 작은 양의 ]16-3/of fuel[연료가 ]18-4/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로) ]24-2/is metered,[계량되는 ]26-6/ especiallly for catalyst heating[특히 촉매 가열을 위해 ]30-5/
표시유닛(12) - 대응관계지시자에 따라 []안의 내용이 표시부에 표시됨 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.
[원문]
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
[번역문]
제 2 작동 BZ2 상태는 (동작 상태 BZ1와 대조적으로) 매우 작은 양의 연료가, 특히 촉매 변환기 가열을 위해 계량되는 작동 상태일 수 있다.
기존 번역 메모리는 문장 단위로 번역 메모리를 불러오기 때문에 원문에 대한 번역 메모리는 '//'로 구분하여 원문과 번역문을 저장한다.
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.//제 2 작동 BZ2 상태는 (동작 상태 BZ1와 대조적으로) 매우 작은 양의 연료가, 특히 촉매 변환기 가열을 위해 계량되는 작동 상태일 수 있다.
그러나, 기존 번역 메모리는 원문문장 내 단어들이 번역문장에서 어떻게 번역되었는지에 관한 대응관계 정보를 포함하고 있지 않다. 양 언어의 형태소 분석 등을 통해 양 단어들의 대응관계를 추론할 수 있을 뿐이다.
다음은 본 발명에 따른 원문문장 내 단어들이 번역문장에서 어떻게 번역되었는지 알 수 있는 각각의 소번역단위에 대한 소번역문을 포함하는 소번역메모리를 갖는 번역 메모리의 실시예이다(도 3e).
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// 제 2 작동 BZ2 상태는 4/(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다. [5-5,24-9,16-12,18-13,30-17,26-18,10-22]
여기서, 소단위 대응관계지시자(8)들인 [5-5,24-9,16-12,18-13,30-17,26-18,10-22]는 소번역메모리 각각에 대한 소단위 대응관계지시자(8)이며, 차례로, 5-5는 제1 소번역단위에 대한 제1 소번역메모리에 지정된 소단위 대응관계지시자를 나타내며, 제2 소번역단위에 대한 제2 소번역메모리에 지정된 소단위 대응관계지시자는 24-9이 되며, 마지막 10-21은 제7 소번역단위에 대한 제7 소번역메모리에 지정된 소단위 대응관계지시자이다.
소단위 대응관계지시자의 소번역단위위치정보(8')는 원문문장의 소번역단위들의 위치를 나타내며, 소번역문위치정보(8")는 번역문장의 소번역메모리에 대한 위치 및 해당 소번역문의 정렬 위치를 나타내고 소번역단위위치정보와 소번역문위치정보 사이의 "-"는 소번역단위에 대응하는 소번역메모리 사이의 대응관계를 나타낸다.
따라서, 소단위 대응관계지시자는 '소번역단위의 소단위 대응관계지시자,' '-,' 및 '소번역메모리의 소단위 대응관계지시자'의 순서로 표시된다. 상기 실시예의 소단위 대응관계지시자인 [5-5,24-9,16-12,18-13,30-17,26-18,10-22]는 각각 [1∼5-1∼5,19∼24-5∼9,11∼16-9∼12,18-13,27∼30-13∼17,19∼26-18,6∼10-18∼22]의 소번역단위에 대응하는 소번역메모리의 대응 관계를 시작단어(또는 어절)과 끝단어(또는 어절)로 표현한 것이다. 즉 제1 소번역단위는 1∼5까지의 어절이며 제1 소번역메모리는 1∼4까지의 어절이며, 제2 소번역단위는 19∼24까지의 어절이며, 제2 소번역메모리는 5∼8까지의 어절이고, 또한, 제7 소번역단위는 6∼10까지의 어절이며, 제7 소번역메모리는 18∼21까지의 어절이다.
결국, 종래의 번역 메모리와 가장 근접한 포멧의 최종적인 소단위 대응관계지시자 [5-5,24-9,16-12,18-13,30-17,26-18,10-22]는 소번역단위에 대응하는 소번역메모리의 대응 관계를 시작 위치를 생략하고 끝어절 중심으로 표시한 것임을 알 수 있다.
도 3e는 번역문장의 순서에 의한 소단위 대응관계지시자를 표시한 것이고, 도 3f의 소단위 대응관계지시자인 [5-5, 10-22, 16-12, 18-13, 24-9, 26-18, 30-17]는 도 3e의 소번역메모리를 포함하는 번역메모리를 원문 문장의 순서에 따라 소단위 대응관계지시자를 표시한 것이다.
도 3g는 도 3f를 소단위 대응관계지시자를 커서가 이동하는 단위를 기준으로 소단위 대응관계지시자를 표시한 것이다. 도 3f와 차이점은 도 3f의 원문 문장에서의 소번역단위 at which a very small amount/ of fuel를 병합하여 하나의 소번역단위 at which a very small amount of fuel로 결정한 것이다. 따라서, 원문의 소번역단위와 이에 대응하는 소번역문을 생성하고 소단위 대응관계지시자를 생성하는 과정은 아래와 같이 나타난다.
A second operating BZ2 state [제 2 작동 BZ2 상태는]5-/ can be a operating state[작동 상태일 수 있다.]10-/ at which a very small amount of fuel[매우 작은 양의 연료가]18-/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-/ is metered,[계량되는]26-/ especiallly for catalyst heating.[특히 촉매 가열을 위해]30-/
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
제 2 작동 BZ2 상태는/ (작동 상태 BZ1와 대조적으로)/ 매우 작은 양의 연료가/ 특히 촉매 가열을 위해/ 계량되는/ 작동 상태일 수 있다.[5-5, 10-22, 18-13, 24-9, 26-18, 30-17]
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.[5-5, 10-22, 18-13, 24-9, 26-18, 30-17]
다른 실시예에서, 소단위 대응관계지시자는 어절 단위가 아닌 커서가 이동하는 단위(일반 문자는 1 바이트, 특수문자는 2바이트)로 표시될 수 있다. 어절이 아닌 커서가 이동하는 단위로 소단위 대응관계지시자를 표시하면 다음과 같다.
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.[ 0-28|0-14|0, 29-24|65-11|5, 54-36|34-12|2, 91-36|15-18|1, 128-11|60-4|4, 140-32|47-12|3 ]
여기서 [ 0-28|0-14|0, 29-24|65-11|5, 54-36|34-12|2, 91-36|15-18|1, 128-11|60-4|4, 140-32|47-12|3 ]는 각각[5-5, 10-22, 18-13, 24-9, 26-18, 30-17]에 대응한다. 소단위 대응관계표시자의 포멧은 '소번역단위위치정보|소번역문위치정보|소번역문정렬순서'이다. 예를 들어, 소번역메모리"A second operating BZ2 state 제 2 작동 BZ2 상태는"를 표시하는 소단위 대응관계지시자 "0-28|0-14|0"를 살펴보면, 소단위 대응관계지시자 0-28|0-14|0에서 소번역단위위치정보는 0-28이고 소번역문위치정보는 0-14 및 정렬정보인 마지막의 0이다.
소단위 대응관계지시자의 소번역단위위치정보(0-28)는 원문 문장 내에서 원문 문장의 첫 문자(A)으로부터 해당 소번역단위의 첫 문자(A) 및 원문 문장의 첫 문자로부터 마지막 문자('state'의 마지막 문자 e)까지 카운트한 위치(0-28)를 포함하고, 소단위 대응관계지시자의 소번역문위치정보(0-14|0)는 번역문 문장 내에서 번역문 문장의 첫 문자('제'자)로부터 해당 소번역문의 첫 문자(제) 및 번역문 문장의 첫 문자로부터 마지막 문자('상태는'의 마지막 문자 '는')까지 카운트한 위치(0-14), 및 번역 문장 내에서 해당 소번역문의 정렬 순서(0)를 나타내는 위치를 포함한다. 소번역문 '제 2 작동 BZ2 상태는'의 번역문장 내에서 정렬 위치는 맨앞이므로 0이다. 두번째 소번역메모리의 소번역문 '작동 상태일 수 있다.'의 정렬 순서는 '29-24|65-11|5'의 '|'기호로 구분된 정렬 순서 부분인 맨 마지막 부분이며 맨 마지막이므로 5이다.
일 실시예에서, 정렬 순서에 의해 정렬된 소번역메모리들의 소번역문들을 정렬할 때, 인접하는 두 개의 소번역문들 중 앞쪽에 위치한 소번역문(이하 "피삽입 소번역문"이라고 함) 내로 뒷쪽에 위치한 소번역문(이하 "삽입 소번역문"이라고 함)이 삽입되는 위치를 지시하는 삽입위치지시자를 포함할 수 있고, 상기 삽입위치지시자에 의해 상기 피삽입 소번역문이 삽입위치지시자의 위치를 기준으로 전반부(8a) 및 후반부(8b)로 특정되며, 상기 피삽입 소번역문의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역문 문장의 첫 문자에 대한 상기 피삽입 소번역문의 전반부(8a)의 첫 문자의 시작위치 및 전반부(8a)의 마지막 문자의 종료위치, 그리고 상기 번역문 문장의 첫 문자에 대한 후반부(8b)의 첫 문자의 시작위치 및 후반부(8b)의 마지막 문자의 종료위치를 지시한다.
도 2d는 인접하는 2개의 소번역문들에서 뒷쪽에 정렬된 소번역메모리의 소번역문이 앞쪽에 정렬된 소번역문 내 '\'위치에 삽입되는 소번역메모리를 생성하는 입력 유닛(111)을 도시하고, 도 3j, 도 3k 및 도 3l는 이러한 삽입정렬에 의해 생성된 소번역메모리의 예이다.
도 2d에 도시된 바와 같이, 영어 어순과 한글 어순이 다르기 때문에, 삽입정렬의 방법을 이용하면, 정렬만의 방법으로 번역문장을 완성할 때보다 소번역메모리의 수를 줄이면서 더 긴 소번역메모리의 생성이 가능해진다.
도 3j, 도 3k 및 도 3l에서 소단위 대응관계표시자의 소번역문위치정보의 삽입위치지시자 '/'(도면번호 5)는 정렬된 인접하는 두개의 소번역문들 중 뒷쪽에 정렬된 삽입 소번역문이 삽입되는 앞쪽의 피삽입 소번역문 '\'위치(\은 소번역문에서의 뒤의 소번역문의 삽입위치를 나타내는 소번역문 삽입위치지시자임)에 삽입되는 것을 지시한다.
도 2d에서 원문문장은 관계사 앞에서 두개의 단문으로 분할될 수 있으므로, 원문은 2개의 소번역단위로 분할될 수 있다. 이 경우 소번역단위위치정보 및 소번역문을 다음과 같다.
A second operating BZ2 state can be a operating state[제 2 작동 BZ2 상태는 작동 상태일 수 있다.]10-/
at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.[(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는]22-/
이를 정렬하여 완성된 문장을 만들기 위해서는 앞쪽 소번역문의 '작동 상태'앞인 '\'위치에 뒤쪽 소번역문이 삽입되어야 한다.
A second operating BZ2 state can be a operating state[제 2 작동 BZ2 상태는 \작동 상태일 수 있다.]10-/
at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.[(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는]30-/
\ 자리에 뒷쪽 소번역문을 삽입하여 번역문장을 완성하면 소번역문위치정보는 다음과 같이 생성될 수 있다.
A second operatingBZ2 state can be a operating state[제 2 작동 BZ2 상태는 \작동 상태일 수 있다.]10-5/22
at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.[(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는]30-18
따라서, 도 2d의 삽입정렬에 의해 생성된 소번역메모리의 소단위 대응관계지시자는 도 3j와 같이 [10-5/22, 30-18]로 나타난다. '\'는 삽입지시자이고, 소번역문 [제 2 작동 BZ2 상태는 \작동 상태일 수 있다.]에서 '\'의 위치를 고려한 소단위 대응관계지시자 10-5/22의 소번역문위치정보는 5/22이다. 여기서, 10은 첫번째 소번역메모리의 소번역단위위치정보이고, 5/22는 첫번째 소번역메모리의 소번역문의 삽입위치를 나타낸다. 첫번째 소번역문의 '\' 앞쪽의 '제 2 작동 BZ2 상태는'의 완성된 번역문장에서 소번역문위치정보는 5이고 '\' 뒷쪽의 '작동 상태일 수 있다.'의 완성된 번역문장에서 소번역문위치정보는 22이므로, 5/22로 첫번째 소번역메모리의 소단위 대응관계지시자의 소번역문위치정보가 생성된다.
도 3k는 커서가 이동하는 하나의 문자단위로 카운트하여 삽입정렬의 방법으로 생성된 소번역메모리이다. 도3k와 같이, 소번역단위 및 소번역문의 앞 문자와 끝문자를 표시하는 방법에서, 첫번째 소번역메모리의 소단위 대응관계지시자 "0-53|0-14/65-11|0"의 '0-53'은 소번역단위 "A second operatingBZ2 state can be a operating state"의 '첫문자위치-끝문자까지의 갯수'를 나타내고, '0-14/65-11'은 소번역문 "제 2 작동 BZ2 상태는 \작동 상태일 수 있다."의 완성된 번역문장에서 "제 2 작동 BZ2 상태는"의 '첫문자위치-\전까지의 문자갯수인 0-14과, "\작동 상태일 수 있다."의 \뒤의 첫문자위치-끝문자까지의 갯수'인 65-11을 지시한다. 소단위 대응관계지시자에 '/'기호는 '/'를 포함하는 앞쪽의 피삽입 소번역문과 뒷쪽의 삽입 소번역문이 삽입정렬로 완성된 것을 나타내며, '/'를 포함하는 피삽입 소번역문에 뒷쪽에 있는 삽입 소번역문이 삽입됨을 지시한다.
도 3k에서 정렬 순서에 의해 정렬된 소번역메모리들의 소번역문들을 정렬할 때, 인접하는 두 개의 소번역문["제 2 작동 BZ2 상태는 \작동 상태일 수 있다." 및 "(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는"] 중 앞쪽에 위치한 소번역문 내로("제 2 작동 BZ2 상태는 \작동 상태일 수 있다."의 \의 위치) 뒷쪽에 위치한 소번역문("(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는")이 삽입되는 위치를 지시하는 삽입위치지시자('/')를 포함할 수 있고, 상기 삽입위치지시자에 의해 상기 피삽입 소번역문이 삽입위치지시자의 위치를 기준으로 전반부(8a)("제 2 작동 BZ2 상태는") 및 후반부(8b)("작동 상태일 수 있다.")로 특정되며, 상기 피삽입 소번역문의 번역 문장 내 위치를 지시할 수 있는 숫자들은 예를 들어 번역문 문장의 첫 문자에 대한 상기 피삽입 소번역문의 전반부(8a)의 첫 문자의 시작위치('0-14' 중 '0') 및 상기 시작위치로부터 전반부(8a)의 마지막 문자의 종료위치('0-14' 중 '14') 중 하나 이상, 그리고 상기 번역문 문장의 첫 문자에 대한 후반부(8b)의 첫 문자의 시작위치('65-11' 중 '65') 및 상기 시작위치부터 후반부(8b)의 마지막 문자의 종료위치('65-11' 중 '11') 중 하나 이상을 지시한다. 시작위치 및 종료위치 중 하나만을 지시하는 경우에는 다른 소번역문의 시작위치들 또는 종료위치들로부터 후속 처리를 통해 해당 소번역문의 나머지 하나의 시작위치 또는 종료위치를 알아낼 수 있다.
도 3l과 같은 하나의 문자마다 카운트하여 삽입위치지시자를 포함하는 소단위 대응관계지시자는 도 3j와 비교하여 어절 단위가 아닌 하나의 문자마다 카운트된 위치를 기록하기 때문에, 대상 언어가 한국어와 같이 삽입위치지시자가 명사와 조사 사이에 삽입되는 경우에도(통신들\에 관한 것이다) 표시가 가능하다. 예를 들어 원문 문장이 "Various embodiments are directed to device to device communications, and more particularly to controlling device to device communications." 이고, 삽입위치지시자를 포함하는 소번역메모리 및 상기 소번역메모리를 포함하는 번역메모리는 다음과 같다.
"Various embodiments are directed to device to device communications,[다양한 실시예들은 장치 대 장치 통신들에 관한 것이다.]0-68||"
"and more particularly to controlling device to device communications.[그리고 더 세부적으로는 장치 대 장치 통신들을 제어하는 것]69-69||", 여기서 69-69는 두번째 소번역메모리의 소번역단위가 원문의 69번째 문자 앞부터 시작하고 두번째 소번역단위의 길이가 69문자로 이루어짐을 나타낸다.
위의 소번역문들을 정렬하면 [다양한 실시예들은 장치 대 장치 통신들에 관한 것 그리고 더 세부적으로는 장치 대 장치 통신들을 제어하는 것이다.]가 되며, 이는 본 발명에서 설명한 정렬만으로는 완성번역문을 만들 수 없다. 위의 인접하는 두개의 소번역문들을 삽입정렬에 의해 문장을 완성하려면 두번째 소번역메모리의 소번역문은 첫번째 소번역문의 '통신들'과 '에 관한 것이다'사이에 다음가 같은 "\"의 삽입위치지시자 위치에 두번째 소번역문이 삽입되어야 한다. [다양한 실시예들은 장치 대 장치 통신들\에 관한 것이다.]
"Various embodiments are directed to device to device communications,68 and more particularly to controlling device to device communications. (원문의 아래 첨자 표시 68은 첫번째 소번역메모리의 소번역문 길이를 나타낸다.)
다양한 실시예들은 장치 대 장치 통신들21 그리고 더 세부적으로는 장치 대 장치 통신들을 제어하는 것54에 관한 것이다.[0-68|0-21/54-9|0, 69-69|22-32|1]" 여기서, 그리고 번역문의 아래첨자들 21, 54은 각각, 두번째 소번역메모리의 소번역문(삽입 소번역문)이 첫번재 소번역문(피삽입 소번역문) 내로 삽입정렬되었을 때 완성 번역문장에 대해서, 첫번째 소번역메모리의 소번역문에서의 '\'위치의 앞뒤에 대한 첫번째 소번역문(피삽입 소번역문)의 삽입으로 인한 분할된 위치들인, 피삽입 소번역문의 전반부의 종료위치(아래첨자 21) 및 후반부의 시작위치(아래 첨자 54)를 카운트한다. 완성된 소번역메모리를 포함하는 번역메모리는 다음과 같다.
"Various embodiments are directed to device to device communications, and more particularly to controlling device to device communications.
다양한 실시예들은 장치 대 장치 통신들 그리고 더 세부적으로는 장치 대 장치 통신들을 제어하는 것에 관한 것이다.[0-68|0-21/54-9|0, 69-69|22-32|1]"
도 3l과 같이, 하나의 문자로 소단위 대응관계지시자를 표시할 경우에는, 하나의 문자마다 카운팅하기 때문에, 어절과 어절 사이 뿐만 아니라 어절 내 삽입위치에 대해서도 정확하게 카운팅할 수 있는 장점이 있다. 이러한 삽입정렬은 대상 언어와 목표 언어 사이에 어순이 다른 경우(예를 들어, 대상 언어:굴절어, 목표 언어: 교착어), 즉, 소번역단위들의 어순과 소번역문들의 어순이 달라서 소번역문들의 정렬만으로 번역문장을 완성할 수 없게 분할된 경우에도(위와 같이, "다양한 실시예들은 장치 대 장치 통신들\에 관한 것이다." 및 "그리고 더 세부적으로는 장치 대 장치 통신들을 제어하는 것"), 소번역메모리들을 생성하고 소번역메모리들의 소번역문들을 조립(여기서 조립은 정렬 및 삽입정렬의 의미임)하여 번역문장을 완성할 수 있게 해준다.
다른 실시예에서, 2개 이상의 삽입위치지시자를 갖는 소번역메모리를 포함하는 번역메모리는 다음과 같다.
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating and idling.
제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열 및 아이들링을 위해 계량되는 작동 상태일 수 있다.
[ 0-53|0-14/71-11|0, 54-118|15-40/62-9|1, 173-11|56-6|2]
상기 번역메모리에는 2개의 삽입위치지시자가 포함되어 있다.
위의 번역메모리는 다음의 소번역메모리들을 삽입위치지시자\에 의해 삽입정렬로 번역문장을 완성한 결과이다.
A second operating BZ2 state can be a operating state[제 2 작동 BZ2 상태는 \작동 상태일 수 있다.]/ at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating[(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열\을 위해 계량되는]/ and idling[및 아이들링].
첫번째 소번역문의 전반부("제 2 작동 BZ2 상태는")의 길이는 14이고 후반부("작동 상태일 수 있다")의 길이는 11이며, 두번째 소번역문의 전반부["(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열"]의 길이는 40이고 후반부의 길이("을 위해 계량되는")는 9이다. 또한, 번역문장의 맨앞 첫어절에 대한 \의 위치를 표시하면 다음과 같다.
제 2 작동 BZ2 상태는14 15(작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열 56및 아이들링62을 위해 계량되는 71작동 상태일 수 있다.
따라서, 본 실시예의 번역메모리의 소단위 대응관계지시자는 다음과 같다.
제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열 및 아이들링을 위해 계량되는 작동 상태일 수 있다.
[ 0-53|0-14/71-11|0, 54-118|15-40/62-9|1, 173-11|56-6|2]
또 다른 실시예에서, "A includes B and C" 이고 번역문장이 "A는 B 및 C를 포함한다"인 경우, 인접하는 소번역문들 "A includes B[A는 B를 포함한다]/" "and C[및 C]"로 생성하고, 소번역문들을 조립하여 완성 번역문장을 생성하면 다음가 같다.
A includes B and C.
A는 B 및 C를 포함한다.[0-12|0-4/9-7|0, 13-6|5-3|1]
여기서, 소단위 대응관계지시자는 두번째 소번역문에서 첫번째 소번역문 내의 [A는 B\를 포함한다]의 목적어 'B'와 조사 '를' 사이의 \ 위치에 삽입된 것을 나타낸다.
일 실시예에서, 소단위 대응관계표시자들의 소번역문위치정보는 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들을 포함할 수 있고, 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역 문장 내에서 소번역문들 각각의 정렬 순서를 나타내는 위치만을 포함할 수도 있다. 그러나, 결국 소번역문들의 정렬은 정렬 순서로 정렬되는 소번역문들을 각각 앞쪽에 위치된 소번역문 문미에 삽입하는 것과 동일한 기능을 수행할 수 있으므로, 번역메모리에 포함된 소번역메모리들 중 일부는 인접하는 두 개의 소번역문들에서 하나의 소번역문이 다른 하나의 소번역문 내로 삽입되는 위치를 지시하는 위치를 더 포함할 수도 있다(도 3j, 도 3k 및 도 3l의 첫번째 소단위 대응관계지시자들).
예를 들어, 도 3g의 소번역메모리를 포함하는 번역메모리는 정렬위치를 지시하는 소단위 대응관계지시자로 표시되었지만, 다음과 같이, 삽입위치지시자로 표시될 수도 있다.
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.[ 0-28|0-14/14-0|0, 29-24|65-11|5, 54-36|34-12/46-0|2, 91-36|15-18/33-0|1, 128-11|60-4/64-0|4, 140-32|47-12/59-0|3 ]
여기서, 정렬은 정렬 순서로 정렬되는 소번역문들을 각각 앞쪽에 위치된 소번역문 문미에 삽입하는 것과 동일한 기능을 수행할 수 있으므로 정렬 순서에 의해 인접하는 소번역문들은 각각 정렬 순서상으로 앞에 정렬되는 소번역문의 문미에 삽입되게 된다. 첫번째 소번역메모리의 소번역문(제 2 작동 BZ2 상태는 )에 대한 소번역문위치정보(0-14/14-0|0)는 다음에 정렬되는 4번째 소번역메모리의 소번역문[(작동 상태 BZ1와 대조적으로)]이 첫번재 소번역문의 문미(14-0/14-0에서 후반부의 시작위치 14다음에 0은 "제 2 작동 상태BZ2는\"의 위치를 표시한 것으로 \후반부의 길이가 0, 즉 아무것도 없음을 나타냄)에 삽입되는 것은 첫번째 소번역문이 4번째 소번역문 다음에 정렬되는 것과 같은 의미이다. 첫번째 소번역문위치정보가 첫번째 소번역문의 삽입위치지시자 '/'뒤에 특정되는 후반부(8b)에 "-0"을 갖는 것(후반부에 어떠한 소번역문도 갖지 않는 것을 의미)은 뒤에 정렬되는 삽입 소번역문이 피삽입 소번역문 문미에 삽입됨을 의미한다. 삽입 정렬에서 정렬 순서상 번역문장 마지막에 위치되는 소번역문은 뒷쪽에 삽입 소번역문을 가지지 않기 때문에 삽입위치지시자를 가지지 않는다. 이와 같이, 원문의 소번역단위들이 서로 인접하고 있지 않더라도, 정렬에 의해 소번역문들이 인접하는 경우에는 삽입 정렬이 이루어지도록 소번역문위치정보를 구성할 수 있다. 따라서, 번역문장의 맨뒤에 정렬되는 소번역문에 대한 소단위 대응관계지시자를 제외하고, 모든 소단위 대응관계지시자가 삽입위치지시자를 기본적으로 가지게 소단위 대응관계지시자의 포멧을 구성할 수 있음을 알 수 있고, 소단위 대응관계지시자에 삽입위치지시자가 없다면 이를 특정하는 소번역메모리의 소번역문이 번역문장의 맨 마지막 소번역문임을 알 수 있게 된다.
일 실시예에서, 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역 문장 내에서 소번역문들 각각의 정렬 순서를 나타내는 위치 및 인접하는 하나의 소번역문이 다른 하나의 소번역문 내로 삽입되는 위치 모두를 포함할 수도 있다(도 3j, 도 3k 및 도 3l).
이와 같은 삽입정렬에 의한 정렬 방식은 어순이 하나의 소번역문이 다른 소번역문의 앞뒤 뿐만 아니라 다른 소번역문의 중간에도 자유로운 삽입이 가능하기 때문에, 소번역문 앞과 뒤로만 정렬하는 일반적인 기본 정렬 방식보다 빠른 정렬을 가능하게 한다. 기본 정렬 방식 및 삽입 정렬 방식을 혼용하여 번역문장을 빠르게 완성시킬 수 있다. 이러한 삽입정렬에 의한 정렬 방식은 언어학적으로 어순이 상이한 굴절어와 교착어 사이의 번역에서 원문의 대상 언어의 형태소 분석에 따라 소번역단위들을 분할 하여 이에 대응하는 소번역문 및 소번역메모리를 형성한 후, 소번역문들을 목표 언어의 번역문장으로 빠르게 조립하여 굴절어와 교착어 간에 소번역메모리를 빠르고 정확하게 구축할 수 있게 한다.
도 3d에서와 같이, 소단위 대응관계지시자는 소번역단위의 원문 문장 내 정렬위치를 가리키는 정보인 소번역단위위치정보를 포함하지만, 소번역메모리의 번역문장 내 정렬위치를 가리키는 정보인 소번역문위치정보를 포함하지 아니할 수 있다. 또 3d에서 소번역문위치정보는 숫자를 포함하는 대신, 번역문장 내 '/'로 표시되고 이로부터 얻어질 수 있다.
다음은 원문문장을 번역문장으로 번역하면서 소번역단위의 결정과 소번역단위의 소단위 대응관계지시자 지정 및 소번역메모리의 소단위 대응관계지시자가 지정되는 중간단계 소번역메모리의 정렬 정보는 다음과 같다.
본원 발명에 따른 번역메모리의 실시예에서 중간단계 소번역메모리는 '/'로 구분되어 있고 소번역메모리에 대한 소단위 대응관계지시자는 번역메모리 뒤에 '[]'로 구분되어 있다. 중간단계 소번역메모리의 소단위 대응관계지시자는 원문문장의 단어 또는 단어를 포함하는 어절들을 맨 앞 어절부터 순서대로 순번을 붙였을 때 소번역메모리와 각각 대응하는 단어까지의 순번이다. 예를 들어 소번역메모리 "매우 작은 양의"에 해당하는 대응 소번역단위는, 3번째 소번역메모리의 소단위 대응관계지시자가 16이므로, 11번째 어절에서 16번째 단어까지인 'at11 which12 a13 very14 small15 amount16'가 된다.
본 발명의 따른 번역 메모리의 생성 과정은 다음과 같다.
1. 원문문장 파싱
본 발명에서 '파싱(parsing)'은 원문 문장을 기계적 분할 규칙에 의해 분할하는 것을 말한다. 파싱은 원문 문장에 대한 형태소 분석이 이루어진 후에 분석된 형태소의 품사를 기준으로 이루어질 수 있다. '파싱 단위'는 원문문장을 컴퓨터에 저장되어 번역하기 위해 프로세싱되는 문장 단어들의 최소한의 집합으로서, 하나 이상의 단어들로 구성된다.
[원문문장을 명사, 대명사 뒤 및 전치사 앞까지 파싱한 예시]
A second operating/ BZ2/ state/ can be a operating state/ at which/ a very small amount/of fuel/(in contrast/ to operating state/ BZ1/)/ is metered,/ especially/ for catalyst/ heating./
원문인 원문문장을 형태소 분석된 어절들 중, 문장의 맨 앞부터 순차적으로, 품사를 기준으로 기계적 분할 규칙에 의해 파싱할 수 있다. 품사가 적어도 명사인 어절(또는 단어) 뒤까지 그리고 접속사인 어절의 앞 및 뒤까지 세분하여 파싱하는 것을 기본으로 할 수 있다. 명사는 표현의 주체이고 동사, 형용사의 의미상의 주어가 되며, 문장 내의 명사들의 성상 이동 등을 기술함으로써 문장이 완성되고, 문장성분을 분석할 때 주어, 목적어, 보어 및 각종 구의 성분이 되므로, 본 발명 전체에서 파싱단위를 세분하는 기본 단위가 된다. BZ2는 형태소 분석을 통해 그 품사를 알 수 없으므로, 앞뒤로 파싱된다.
본 발명에서 원문문장에서 명사를 기준으로 파싱하는 것은 원문문장을 더 많은 파싱 단위로 세분하여 피번역 단위로 순차번역할수록 번역 속도가 느려지기 때문에, 파싱 단위를 최소한도로 유지하면서 소번역메모리를 포함하는 번역메모리를 저장함으로써 통상의 번역 시간과 적어도 동일한 번역 속도를 유지할 수 있게 한다. 원문문장의 문장 분석을 통해 주어부에 순차적인 두 개 이상의 명사들이 파싱되는 경우 순차적으로 파싱했을 때 뒤의 명사를 포함하는 어절까지 파싱하는 것이 바람직하다. 원문문장을 언어에 따라 명사 자체가 어절이 되는 경우는 명사 뒤까지 파싱하며, 명사에 조사나 어미가 붙는 언어는 명사를 포함하는 어절까지 파싱한다. 각종 괄호, "," ";" 등의 문장 내 기호는 품사를 포함하는 어절 내에 포함되므로 독립적으로 파싱단위가 되는 경우를 제외하고 파싱하지 않는다.
번역자의 관점에서, 파싱단위는 원문문장을 세분하여 번역할 때 번역자가 먼저 원문문장을 읽지 않고도 세분하여 번역하는 끝 어절을 지시해준다. 따라서, 번역자는 원문문장의 앞어절부터 문장을 미리 읽어 어디까지 주어부인지 또는 술어부인지 문장 구조를 파악하지 않아도 된다. 번역자는 단지 파싱단위의 마지막 어절까지는 하나의 번역단위로 보고 번역하고 다음 파싱 단위에 동사가 나오면 현재 번역하는 파싱단위를 주어부에 맞게 번역하고, 현재 파싱단위에 본동사가 포함되어 있으면 술어부에 맞게 번역하게 된다. 따라서, 본 발명에서 원문문장의 형태소를 분석하고 파싱단위로 파싱하는 것은 번역자에게 미리 문장을 읽지 않고도 세분하여 번역할 수 있는 단위의 위치를 제공하므로, 번역 시간을 단축시켜 순차번역의 장점을 극대화할 수 있도록 한다.
컴퓨터의 소번역메모리 생성 관점에서, 파싱단위는 컴퓨터가 원문문장을 세분하여 소번역단위로 저장할 수 있는 단위가 된다. 즉, 본 발명에서 컴퓨터는 하나 이상의 파싱단위를 소번역단위로 하여 소번역메모리를 생성하므로, 둘 이상의 파싱단위가 하나의 소번역단위로 지정되어 번역되었을지라도, 추후가 번역자가 둘 이상의 파싱단위로 된 소번역단위를 더 세분하여 번역할 수 있다는 점에서 컴퓨터가 소번역메모리로 저장할 수 있는 단위가 된다.
영어를 한국어로 번역하는 바람직한 실시예에서 원문인 원문문장을 형태소 분석된 어절들 중, 문장의 맨 앞부터 순차적으로, 품사가 적어도 명사, 대명사인 어절 뒤까지, 그리고 접속사인 어절 앞뒤까지 세분하여 파싱하며, 원문문장의 하나 이상의 어절들을 포함하는 파싱 단위(parsing unit)들로 세분한다.
다른 바람직한 실시예에서 원문인 원문문장을 형태소 분석된 어절들 중, 문장의 맨 앞부터 순차적으로, 품사가 적어도 명사, 대명사인 어절 뒤까지, 접속사인 어절 앞뒤까지, 그리고 전치사를 포함하는 언어는 전치사 어절 앞까지 세분하여 파싱하며, 원문문장의 하나 이상의 어절들을 포함하는 파싱 단위들로 세분한다.
형태소 분석 후 파싱은 어절로 구분되는 경우에만 국한되지 않는다. 어절로 구분되지 않는 중국어나 일본어 등은 어절이 아닌 품사의 앞뒤에서 파싱되는 것과 같이 다른 규칙으로 파싱될 수도 있다.
어미와 조사가 발달한 언어(예를 들어 한국어)는 명사를 포함하는 어절 앞 또는 조사를 포함하는 어절의 뒤가 파싱단위가 될 수 있다.
다른 실시예에서, 원문인 원문문장을 형태소 분석된 어절들 중, 문장의 맨 앞부터 순차적으로, 품사가 적어도 명사, 대명사 및 접속사인 어절 뒤까지, 그리고 품사가 전치사 및 접속사인 어절 앞까지 세분되는, 원문문장의 하나 이상의 어절들을 포함하는 파싱 단위(parsing unit)들로 세분한다.
파싱 단위는 전술한 실시예에 국한되지 않고 원문의 원문문장을 올바르게 번역하기 위해 필요한 모든 품사들이 파싱 단위가 될 수 있음을 주의해야 한다. 다른 실시예에서, 원문인 원문문장을 형태소 분석된 어절들 중, 문장의 맨 앞부터 순차적으로, 모든 품사를 파싱 단위(parsing unit)들로 세분할 수 있다. 그러나, 원문 문장의 번역단위의 파싱은 번역 속도를 유지하면서 번역을 하기 위해, 비교되는 소번역메모리를 포함하는 번역메모리 DB의 소번역단위와 일치되도록 하여 자동적으로 소번역단위가 정해지도록 하는 것이 바람직하다.
2. 소번역단위의 결정
[소번역단위 결정]
소번역단위는 번역원문언어와 번역언어 사이의 두 언어간 어순이 동일한 하나 이상의 파싱 단위 또는 문장 정렬만으로 두언어 문장 간에 의미가 실질적으로 일치되는 하나 이상의 파싱단위까지로 결정한다. 또한, 원문 문장의 적어도 일부와 일치하는 이미 저장된 소번역메모리가 있는 경우 상기 소번역메모리의 소번역단위가 소번역단위로 결정될 수 있다. 이미 저장된 소번역단위가 있는 경우 이를 불러와 번역문을 생성할 수 있기 때문이다.
일 실시예에서, 소번역단위들은 원문문장을 형태소 분석하여 원문문장을 문장의 맨 앞 어절부터 순차적인 하나 이상의 단어로 세분한 하나 이상의 파싱 단위들로 구성되며, 상기 파싱 단위들이 번역 원문언어와 번역 목표언어 두 언어간 문장 내 의미가 실질적으로 동일하고 소번역단위들 내에서는 의미를 동일하게 하기 위해 더 이상 파싱단위들의 재정렬이 필요없는 순차적인 하나 이상의 파싱 단위까지로 결정된다. 여기서 "실질적으로 동일"의 의미는 언어간 번역의 차이로 인하여 완전 동일하게 번역하는 것이 불가능할 수 있으므로, 두 언어를 모두 구사할 수 있는 사람이 봤을 때 완전 동일하지는 않지만 거의 동일한 정도로 의미를 전달하는 경우를 포함한다.
소번역단위의 결정은 번역속도와 밀접한 관계가 있다. 소번역단위로 정해진 파싱단위의 수가 적을수록 파싱 단위 번역의 정확도는 높아지나 그만큼 소번역메모리 및 소번역메모리의 소단위 대응관계지시자의 수가 늘어나게 되어 번역 속도가 떨어지고, 반대로 소번역단위로 정해지는 파싱단위의 수가 많을수록 번역 속도는 향상되나 번역 정확도가 떨어질 확률이 커지고, 이후 번역에서 이용 가능한 소번역메모리의 일치 확률이 떨어지게 되므로, 번역 정확도 및 번역 속도를 고려하여 적절하게 소번역단위를 결정해야 한다. 바람직하게는, 문장 성분을 분석했을 때 명사는 주어 또는 목적어를 이루는 품사이므로, 명사를 포함하는 어절까지를 소번역단위로 한다. 예를 들어 복합명사나 전치사로 연결된 2개의 명사가 2개 이상 있는 구절("명사+명사"의 복합명사 또는 "명사 of 명사")를 하나의 소번역단위로 결정하는 것이 바람직하다.
다음은 줄바꿈으로 구분된 소번역단위를 보여준다.
A second operating/ BZ2/ state []5/ 제1 소번역단위
can be a operating state []10/ 제2 소번역단위
at which/ a very small amount []16/ 제3 소번역단위
of fuel []l8/ 제4 소번역단위
(in contrast/ to operating state/ BZ1/)[]24/ 제5 소번역단위
is metered,[]26/ 제6 소번역단위
especially/ for catalyst/ heating.[]30/ 제7 소번역단위
여기서, []기호 다음 숫자는 소번역단위에 해당하는 어절의 소단위 대응관계지시자이다. 이러한 []기호 및 소번역단위 지정 숫자는 줄바꿈 엔터키가 들어가면 자동적으로 생성되도록 프로그램될 수 있다. 이러한 소번역단위는 사용자 인터페이스의 표시 유닛에 표시되고, 바람직하게 사용자가 번역 속도를 빠르게 하기 위해 수정될 수 있다. 예를 들어, 사용자는 제3 소번역단위 "at which/ a very small amount []16/"와 제4 소번역단위 "of fuel []18/"를 병합하여서 제3 소번역단위로 할 수 있다.
소번역단위의 결정은 이미 저장된 소번역메모리DB를 이용하여 이루어질 수 있다. 이미 저장된 소번역메모리DB를 이용한 소번역단위의 결정은 비교유닛(60)에서 번역될 번역단위를 파싱한 파싱 단위들과 소번역메모리를 포함하는 번역메모리 DB(100)의 소번역단위를 비교한 결과, 전체적으로 일치하거나 부분적으로 일치하는 상기 번역메모리 DB의 하나 이상의 소번역단위들 중 가장 긴 파싱 단위로 우선적으로 결정될 수 있다.
소번역단위가 결정되면, 원문 문장 내에서의 소번역단위의 위치가 결정된다. 따라서, 소단위 대응관계지시자의 소번역단위위치정보를 결정할 수 있다. 상기 소번역단위위치정보는 소번역단위가 결정된 후 결정되고, 사용자가 추후 소번역단위를 번역의 필요에 따라 앞뒤 소번역단위들과 병합하거나 소번역단위를 분할한 경우 변경된다. 따라서, 소단위 대응관계지시자의 소번역단위위치정보는 다른 실시예에서 소번역단위에 대한 번역문인 소번역문이 생성된 후에 소번역문위치정보와 일괄적으로 결정될 수도 있다.
이와같이 기존 번역메모리 DB에 존재하는 번역메모리의 소번역단위, 분할 규칙에 의해 기계적으로 분할된 파싱단위, 또는 이들 파싱단위들이 병합된 병합된 파싱단위, 사용자가 입력한 분할 패턴 등에 의해 소번역단위로 분할되어 소번역단위가 결정될 수 있다.
사용자가 입력한 분할 패턴은 프로그램이 사용자에게 기계적으로 분할된 파싱 단위를 표시하고, 사용자로부터 입력된 소번역단위가 있는 경우 이를 상기 표시한 파싱단위가 비교하여 차이가 있는 경우 사용자가 입력한 소번역단위의 형태소들의 배열을 분할 패턴으로 저장하게 되고, 이렇게 저장된 분할 패턴은 이후 문장 번역에서 기계적 분할 규칙보다 우선하여 소번역단위를 결정할 수 있다. 이는 기계적 파싱단위가 일률적으로 기계적 분할되는 단점을 보완하여 사용자가 입력한 소번역단위의 형태소 배열을 소번역단위 결정에 활용하는 일종의 학습기능이다.
상기 비교 유닛(60)은 번역될 원문문장을 구성하는 순차적인 파싱단위들이 소번역메모리 DB(100)의 원문문장 내의 하나 이상의 소번역단위와 일치하는지 여부를 비교하여, 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 전체적으로 또는 부분적으로 일치하는 가장 긴 순차적인 파싱단위들을 하나의 소번역단위로 결정한다. 비교결과 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는 순차적인 파싱단위들이 존재하지 않는 경우, 소번역메모리 분석 유닛(122)에 의해 형성된 확장 소번역메모리 DB(120)의 확장 소번역메모리와 비교하여 전체적으로 또는 부분적으로 일치하는 파싱 단위들을 하나의 소번역단위로 결정한다. 상기 확장 소번역메모리는 소번역메모리 DB의 소번역메모리들을 기초로 소번역단위의 형태소 및 문장성분을 분석하여 공통되는 동사 및 명사를 갖는 소번역메모리들의 번역 패턴으로부터 확장된 번역 메모리이다. 소번역메모리 분석유닛(122)은 소번역메모리 DB의 원문 문장 및 번역 문장, 그리고 소번역단위 및 소번역메모리로부터 공통되는 동사 및 명사를 추출하여 문장 성분 및 문장 내에서 동사 및 명사의 번역패턴을 확장 소번역메모리로 생성할 수 있다.
예를 들어, "to avoid the negative effects"에 대한 소번역문 "부정적인 효과를 피할 수 있도록" 및 "to avoid an accident"에 대한 소번역문 "손상을 피할 수 있도록"이 소번역메모리 DB에 저장되어 있다면, 소번역메모리분석유닛(122)은 소번역단위에 공통된 부정사 동사 "to avoid"에 대해 소번역문에 공통된 동사"을(를) 피할 수 있도록"을 추출하고 "to avoid N"에 대한 확장소번역메모리 "N을 피할 수 있도록"을 생성할 수 있다(N은 품사 명사를 지시함). 다시말해, 공통된 품사 명사를 인자(argument)한 것이다. 이러한 방식으로 태그화된 소번역메모리를 생성할 수 있다.
"to avoid the negative effects" "부정적인 효과를 피할 수 있도록"
"to avoid a damage" "손상을 피할 수 있도록"
->
"to avoid N" "N을(를) 피할 수 있도록"(N은 품사 명사를 지시함)
[명사 확장 예]
또한, 이러한 실시예는 특히, 명사를 기준으로 파싱단위를 결정하고 따라서, 동사와 목적어가 하나의 파싱단위를 이루기 때문에, 동사와 목적어로 이루어진 번역단위를 번역할 때 이용될 수 있다.
"avoided the negative effects" "부정적인 효과를 피하였다"
"can avoid a damage" "손상을 피할 수 있다"
->
"(avoid) N" "N을(를) 피하다"(괄호는 동사의 기본형을 지시하고, N은 품사 명사(명사의 일반화)를 지시함)
[일치하는 동사를 기준으로 한 명사의 일반화로 인한 확장 예]
유사하게, 일치하는 구동사를 기준으로 한 명사 확장이 가능하고(예, (give) up N), 일치하는 전치사를 기준으로 한 명사 확장도 또한 가능하다(예, in spite of N).
이러한 생성된 확장소번역메모리는 확장소번역포함 번역메모리 DB에 저장될 수 있다. 이러한 확장소번역메모리는 이미 저장된 소번역메모리를 포함하는 번역메모리 DB를 이용하여 새로 번역메모리 DB를 생성하지 않고도 번역 커버리지를 넓히는 효과가 있다. 이러한 확장소번역메모리는 종래의 문장단위 번역메모리에 적용되는 확장 번역메모리 기술을 소번역메모리에 동일하게 적용시킬 수 있으며, 원문언어와 목표언어의 단어간 정확한 1:1 매칭이 가능해질 수 있어서 종래의 확장번역메모리 기술보다 훨씬 큰 커버리지를 가질 수 있다. 예를 들어 번역될 번역단위의 원문 문장의 20%만 일치하는 번역 메모리라도, 소번역메모리를 갖는 번역메모리는 20%부분에 대응하는 부분의 소번역단위와 대응하는 소번역메모리부분을 분석하여 일치하는 20%의 번역 의미를 추출할 수 있으므로, 번역메모리의 커버리지를 넓힐 수 있다.
본 발명에서 원문 문장을 파싱하고 소번역단위 결정하는 과정을 종래의 번역 메모리 형성 과정에서 번역단위를 결정하는 것과 비교한다면, 종래의 번역 메모리 형성 과정과 동일하게 원문 문장 단위로 번역 단위(TU)를 결정하고, 컴퓨터가 행한 원문 단위 파싱이 잘못된 경우 사용자가 번역 단위를 병합하거나 분할하여 번역 단위를 수정하는 과정은 본 발명에서 종래와 같이, 원문 문장별로 번역단위가 결정되고, 사용자의 의도에 따라 번역단위의 분할 또는 병합의 과정이 그래도 이루어진다. 이에 덧붙여, 본 발명은 원문 문장별로 번역단위가 결정된후, 후속적인 과정을 더 포함한다. 번역단위인 원문 문장에 대해서 컴퓨터가 파싱 과정을 수행하여 원문을 파싱단위로 세분하고, 저장된 소번역메모리 DB를 검색하거나 사용자의 의도에 따라 파싱단위를 병합하여 소번역단위를 결정한다. 따라서, 본 발명에서 원문 문장내 파싱 단위 형성은 단락 내에서 문장단위로 번역단위를 형성하는 과정과 대응되지만, 본원 발명은 컴퓨터가 형태소 분석 후 품사에 따라 파싱 단위 결정과정을 수행하게 된다. 또한, 소번역단위의 결정은 번역단위들의 병합에 대응되지만, 사용자의 의도에 따라 파싱단위의 병합 분할이 이루어질 수 있지만, 소번역메모리DB에 이미 저장된 소번역메모리가 존재하는 경우 컴퓨터가 소번역단위를 결정할 수 있다.
비교결과 소번역메모리 DB 및 확장 소번역메모리 DB의 원문문장 내의 하나 이상의 소번역단위와 일치하는 순차적인 파싱단위들이 존재하지 않는 경우, 번역될 파싱단위들을 사용자에게 표시하고 사용자입력 모드로 전환하여 사용자가 소번역단위를 결정하게 한다. 소번역메모리를 포함하는 번역메모리 DB(100)에 전체적으로 또는 부분적으로 일치하는 저장된 소번역단위가 없고, 확장 소번역메모리 DB에 전체적으로 또는 부분적으로 일치하는 저장된 소번역단위가 없다면, 사용자가 직접 새로운 소번역메모리를 입력하고 소단위 대응관계지시자를 생성하거나 소번역메모리에 대한 기계번역을 이용하여 소번역문을 생성하고 소단위 대응관계지시자를 생성할 수 있다. 컴퓨터 보조 번역(CAT) 프로그램은 번역메모리의 규모가 커질수록 번역의 속도 및 정확도가 올라가기 때문에 다른 의미를 갖도록 번역할 필요성이 없다면 한번 번역한 소번역단위는 번역자가 다시 직접 번역하지 않아도 된다.
3. 중간단계 소번역메모리 생성과 소단위 대응관계지시자
도 2a는 중간단계소번역메모리생성유닛(91)에서 본 발명에 따른 소번역메모리를 포함하는 번역메모리로 저장하기 위해 만들어지는 중간단계 소번역메모리이다. 소번역단위가 결정되면, 소번역메모리를 포함하는 번역메모리 생성유닛(90)에서 중간단계 소번역메모리를 생성하고 이를 변형하여 소번역메모리(도 3a 내지 도 3k)를 생성하게 된다.
도 2a의 중간단계 소번역메모리는 본 발명에 따른 소번역메모리를 포함하는 번역메모리를 생성하기 전에 거치는 중간단계 성격의 소번역메모리이다. 사용자는 소번역메모리 DB에 저장된 소번역단위를 매칭되는 소번역단위가 있는 경우 이를 불러올 수 있고, 이렇게 불러온 소번역메모리를 보고 수정할 필요가 있는 경우 사용자의 필요에 따라 번역자가 직접입력할 수 있는 유저 인터페이스에 의해 생성될 수 있다. 번역자가 직접 번역할 시에 신속하게 번역할 수 있도록 원문문장의 소번역단위, 번역 문장의 소번역문 및 소단위 대응관계지시자가 모두 표시된다. 중간단계 소번역문은 원문문장의 소번역단위를 정렬하기 위해 소단위 대응관계지시자의 소번역단위위치정보에 따라 오름차순정렬로 정렬된 포맷을 가질 수 있다. 최종적인 소번역메모리(도 3a 내지 도 3k)와 차이는 번역 메모리 부분에 소번역단위가 제거되지 않고 남아 있다는 것이다. 사용자는 소번역단위와 소번역문간 대응관계를 직접 확인할 수 있고, 소번역단위를 보면서 번역하게 된다.
중간단계 소번역메모리는, 소번역메모리 DB에 기록된 기존의 번역메모리와 비교하여 치환하거나 기계번역하거나, 등록 상용구를 활용하거나, 확장 소번역메모리를 이용하거나, 사용자가 사용자 전환모드에서 직접 번역함으로써 소번역단위에 대한 소번역메모리를 생성한다.
예를 들어 이러한 소번역메모리를 생성하기 위해 아래와 같은 중간단계 소번역메모리 포맷이 이용된다.
A second operating /BZ2/ state[제 2 작동 BZ2 상태는]5/
can be a operating state[작동 상태일 수 있다.]10/
at which / a very small amount[매우 작은 양의]16/
of fuel[연료가]18/
(in contrast/ to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24/
is metered,[계량되는]26/
especiallly for catalyst/ heating[특히 촉매 가열을 위해]30/
이러한 소번역단위의 결정은 이미 저장된 소번역메모리DB에서 원문문장의 번역인 소번역메모리를 불러올 수 있는 경우 소번역단위와 전체적 또는 부분적으로 매칭되는 파싱단위까지 소번역단위로 결정되고, 매칭되는 파싱단위가 없는 경우 사용자에 의해 직접 지정된다.
생성된 소번역메모리 간에 소번역문을 정렬하여 번역문장을 완성하기 위하여 소번역메모리에 지정되는 소단위 대응관계지시자를 삽입한다. 번역 메모리의 원문 문장은 복수 개의 소번역단위들로 구성되고, 번역메모리의 번역 문장은 상기 복수 개의 소번역단위들에 대응하는 소번역문들로 구성된다. 이때, 소번역단위들과 소번역문들 간의 대응관계가 소단위 대응관계표시자들에 의해 표시되고, 소단위 대응관계표시자들의 소번역단위위치정보들은 소번역단위들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고, 소단위 대응관계표시자들의 소번역문위치정보들은 상기 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들을 포함한다.
일 실시예에서, 소번역메모리는 원문문장의 일부에 대해 생성될 수 있다. 원문문장을 세분화한 모든 소번역단위에 대해 소번역문을 생성하더라도 일부는 소번역메모리로서 가치가 없거나 번역메모리 DB에 이미 존재하여 중복된 소번역메모리가 존재할 수 있기 때문에, 일부에 소번역단위에 대하여 소번역문이 생성될 수 있고, 따라서, 이를 특정하는 소단위 대응관계지시자도 일부에 대해서만 생성될 수 있다. 이때, 일부 소번역단위(들)와 이에 대응하는 소번역문(들) 간의 대응관계가 소단위 대응관계표시자(들)에 의해 표시되고, 소단위 대응관계표시자(들)의 소번역단위위치정보(들)은 상기 일부의 소번역단위(들)의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고, 상기 일부 소단위 대응관계표시자(들)의 소번역문위치정보(들)은 상기 일부 소번역문(들)의 번역 문장 내 위치를 지시할 수 있는 숫자들을 포함한다.
소번역단위들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들은 원문 문장 내에서 원문 문장의 첫 문자에 대한 소번역단위들 각각의 첫 문자의 위치를 지시할 수 있다. 그리고 원문 문장의 첫 문자에 대한 소번역단위들 각각의 마지막 문자의 위치를 지시할 수 있다. 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역문 문장 내에서 번역문 문장의 첫 문자에 대한 소번역문들 각각의 첫 문자의 위치를 지시할 수 있다. 번역문 문장의 첫 문자에 대한 소번역문들 각각의 마지막 문자의 위치 및 번역 문장 내에서 소번역문들 각각의 정렬 순서를 나타내는 위치 및 소번역문들 각각이 인접한 다른 소번역메모리의 소번역문 내로 삽입되는 위치를 지시하는 위치 중 하나 이상을 포함할 수 있다.
소번역메모리에 대한 소단위 대응관계지시자는 소번역문들을 일괄 번역하고 일괄 정렬 방식으로 할 수 있고, 소번역단위들을 원문문장의 맨앞 소번역단위부터 번역할때마다 순차적으로 순차 정렬 방식으로 지정할 수 있다(표 2 참조).
중간단계 소번역메모리 입력유닛(11) 표시유닛(12) - 대응관계지시자에 따라 []안의 내용이 표시부에 표시됨)
1-1 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5/ can be a operating state/ at which/ a very small amount/of fuel/(in contrast/ to operating state/ BZ1/)/ is metered,/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는
2-1 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ can be a operating state[작동 상태일 수 있다. ]10-2/ at which a very small amount/of fuel/ (in contrast to operating state BZ1)/is metered,/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는 작동 상태일 수 있다.
3-1 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ can be a operating state[작동 상태일 수 있다. ]10-2/at which a very small amount[매우 작은 양의 ]16/ of fuel/ (in contrast to operating state BZ1)/is metered,/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는 작동 상태일 수 있다. 매우 작은 양의
3-2 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ at which a very small amount[매우 작은 양의 ]16-2/can be a operating state[작동 상태일 수 있다. ]10-3/of fuel[]18/ (in contrast to operating state BZ1)[]24/is metered,[]26/ especially/ for catalyst/ heating.[]30/ 제 2 작동 BZ2 상태는 매우 작은 양의 작동 상태일 수 있다.
4-1 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ at which a very small amount[매우 작은 양의 ]16-2/can be a operating state[작동 상태일 수 있다. ]10-3/ of fuel[연료가]18/ (in contrast to operating state BZ1)/is metered,/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는 매우 작은 양의 작동 상태일 수 있다.연료가
4-2 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ at which a very small amount[매우 작은 양의 ]16-2/of fuel[연료가]18-3/ can be a operating state[작동 상태일 수 있다. ]10-4/ (in contrast to operating state BZ1)/ is metered,/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는 매우 작은 양의 연료가 작동 상태일 수 있다.
5-1 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ at which a very small amount[매우 작은 양의 ]16-2/of fuel[연료가]18-3/ can be a operating state[작동 상태일 수 있다. ]10-4/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로) ]24/ is metered,/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는 매우 작은 양의 연료가 작동 상태일 수 있다. (작동 상태 BZ1와 대조적으로)
5-2 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/ at which a very small amount[매우 작은 양의 ]16-3/of fuel[연료가]18-4/ can be a operating state[작동 상태일 수 있다. ]10-5/ is metered,/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 작동 상태일 수 있다.
6-1 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/at which a very small amount[매우 작은 양의 ]16-3/of fuel[연료가]18-4/ can be a operating state[작동 상태일 수 있다. ]10-5/ is metered,[계량되는 ]26/ especially/ for catalyst/ heating.[]30/ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 작동 상태일 수 있다. 계량되는
6-2 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/at which a very small amount[매우 작은 양의 ]16-3/of fuel[연료가]18-4/ is metered,[계량되는 ]26-5/can be a operating state[작동 상태일 수 있다. ]10-6/ especially/ for catalyst/ heating./ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 계량되는 작동 상태일 수 있다.
7-1 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/at which a very small amount[매우 작은 양의 ]16-3/of fuel[연료가]18-4/ is metered,[계량되는]26-5/ can be a operating state[작동 상태일 수 있다. ]10-6/ especially/ for catalyst/ heating.[특히 촉매 가열을 위해 ]30/ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 계량되는 작동 상태일 수 있다. 특히 촉매 가열을 위해
7-2 A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/at which a very small amount[매우 작은 양의 ]16-3/of fuel[연료가]18-4/ especially/ for catalyst/ heating.[ 특히 촉매 가열을 위해]30-5/ is metered,[계량되는]26-6/ can be a operating state[작동 상태일 수 있다. ]10-7/ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.
전술한 바와 같이, 순차번역에 의한 소번역메모리를 생성하기 위해서는 중간단계 소번역메모리를 생성하게 되기 때문에, 이때 형성되는 소단위 대응관계지시자는 중간단계 정렬위치자로 구별되고, 이는 소번역단위위치정보(4') 및 소번역문위치정보(4")로 구성된다(예, ]5-1/). 중간단계 소번역메모리의 소단위 대응관계지시자는 원문문장의 소번역단위의 원문문장 내 정렬 위치를 나타내는 소단위 대응관계지시자로서 번역문장에서의 어절의 순번과 소번역문의 정렬위치를 나타내는 순번의 조합으로 구성될 수 있다. 예를 들어 '[제 2 작동 BZ2 상태는]5-1'에서 중간단계 소단위 대응관계지시자의 소번역단위위치정보'5'는 원문문장의 소번역단위가 되는 끝어절의 순번이고 중간단계 소단위 대응관계지시자의 소번역문위치정보'1'은 소번역문의 번역문장에서의 정렬 순서를 나타낸다. 번역단계에서 소번역문의 정렬 순서를 나타내는 1, 2, 3, 4, 5, 6, 7은 각각의 소번역문의 번역문장(번역메모리)에서의 위치를 나타내는 정보는 포함되어 있지 않다. 반면, 도 3c 및 도 3d의 소번역문위치정보인 5, 24, 16, 18, 30, 26, 10는 소번역문의 정렬순서 및 위치를 모두 포함한다.
중간단계 소번역메모리 생성 단계에서는 번역자의 일반적인 문장 번역 속도와 실질적으로 동일한 속도 또는 최소한 일반 번역 속도 보다 느리지 않으면서 소번역메모리의 생성 과정을 단축하기 위해 중간단계 소번역메모리의 소단위 대응관계지시자의 소번역문위치정보는 정렬 순서 정보만 갖는다. 즉, 중간단계 소번역메모리의 소단위 대응관계지시자의 소번역단위위치정보는 소번역단위를 지정하는 것과 더불어 원문인 원문문장을 구성하는 소번역단위의 정렬 위치 정보까지 포함하지만, 중간단계 소번역메모리의 소단위 대응관계지시자의 소번역문위치정보(4")는 정렬 순번에 대한 정보만 갖게 된다. 이러한 중간간계 정렬위치 지사자만으로도 본 발명의 소번역메모리를 포함하는 번역메모리를 표현할 수 있다(도 3a 및 도 3b).
다른 실시예에서, 소단위 대응관계지시자는 소번역단위 및 소번역문의 원문문장 및 번역문장에서의 각각의 정렬 순서 뿐만 아니라 도 3c에서와 같이, 소번역단위의 원문문장에서의 시작 단어 및 종료 단어의 순번 및 번역메모리인 번역문장에서의 소번역문의 시작 단어 및 종료 단어의 순번을 포함하는 정보를 포함하게 할 수 있다. 또한, 소단위 대응관계지시자들의 소번역단위위치정보 및 소번역문위치정보 중 하나가 오름차순으로 되어 있다면, 이를 이미 정렬 순서대로 정렬되어 있음을 의미한다. 예를 들어 도 2a의 각 소번역문 사이의 중간단계소번역메모리 소단위 대응관계지시자는 5-1,10-7,16-3, 18-4, 24-2, 26-6,30-5이고, 소번역단위위치정보가 오름차순으로 정렬(5-, 10-, 16-, 18-, 24-, 26-, 30-)되어 있으므로, 이미 정렬 순서대로 정렬되어 있음을 알 수 있고, 따라서, 소단위 대응관계지시자는 1∼5-, 6∼10-, 11∼16-, 17∼18-, 19∼24-, 25∼26-, 27∼30-의 어절 순번을 나타내는, 대응하는 소번역단위의 정렬 위치에 대한 정보가 더 중요해진다.
상기 예문을 원문문장으로 정렬하면 소단위 대응관계지시자의 소번역단위위치정보에 따라 오름차순정렬로 5-10-16-18-24-26-30가 되므로 중간단계 소번역메모리는 다음과 같다.
A second operating BZ2 state[제 2 작동 BZ2 상태는]5-1/
can be a operating state[작동 상태일 수 있다.]10-7/
at which a very small amount[매우 작은 양의]16-3/
of fuel[연료가]18-4/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
is metered,[계량되는]26-6/
especiallly for catalyst heating[특히 촉매 가열을 위해]30-5/
이것을 번역문장으로 정렬하면, 소번역메모리의 중간단계소단위 대응관계지시자의 소번역문위치정보에 따라 오름차순 정렬로 1-2-3-4-5-6-7이 되므로 다음과 같이 된다.
A second operating BZ2 state[제 2 작동 BZ2 상태는]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
at which a very small amount[매우 작은 양의]16-3/
of fuel[연료가]18-4/
especiallly for catalyst heating[특히 촉매 가열을 위해]30-5/
is metered,[계량되는]26-6/
can be a operating state[작동 상태일 수 있다.]10-7/
다른 실시예에서, 소번역문위치정보(4")는 정렬 순번에 대한 정보를 나타내기만 하면 되므로, 숫자이외에 정렬 순번을 나타내는 문자 및 기호로도 표시될 수 있다. 예를 들어, 소번역메모리의 바로 앞 소번역메모리와의 상대적인 위치를 지정함으로써 정렬 순번을 나타낼 수 있다(/1, /2, /3 ...). 기호와 문자 "/1", "/2", "/3"은 지정된 소번역메모리가 앞 소번역메모리의 첫번째 앞(/1), 두번째 앞(/2) 및 세번째 앞(/3)에 놓임을 나타낸다. 첫번째 앞(/1)은 더욱 간단하게 (/)로 나타내어 지정된 소번역단위 첫번째 앞에 위치하는 중간단계 소번역문위치정보로 활용할 수 있다. 또한, 등위 접속사가 있는 문장 구조를 갖는 경우, 주어, 목적어 및 서술어의 일반적인 우리말 어순을 고려하여, 주어, 목적어 및 서술어의 문자를 함께 표시할 수도 있다(/s1, /s2, /s3, ... /o1, /o2, /o3, ... /v1, /v2, /v3). 이러한 소번역문위치정보는 한국어의 경우 s1+o1+v1, s2+o2+v3, s3+o3+v3 ...의 정렬 순서를 갖는다.
A second operating BZ2 state[제 2 작동 BZ2 상태는//]5
can be a operating state[작동 상태일 수 있다./]10
at which a very small amount[매우 작은 양의/]16
of fuel[연료가/-]18
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)/2]24
is metered,[계량되는/2-]26
especiallly for catalyst heating[특히 촉매 가열을 위해/]30/
'//'(="/s1")는 번역문장 전체 주어표시이고, './'(="/v1")는 번역문장 전체 동사 표시이고, '/'는 첫번째 앞 소번역메모리에 위치됨을 나타내고, '/2'는 두번째 앞 소번역메모리에 위치됨을 나타내고, '/-'는 첫번째 앞, 즉 바로 앞 소번역메모리 뒤에 이어짐을 나타내고, '/2-'는 두번째 앞 소번역메모리 뒤에 이어짐을 나타냅니다. 이러한 앞 소번역메모리들과의 상대적 정렬위치를 나타내는 방법은 순차번역되는 소번역메모리를 번역과 동시에 번역되는 소번역메모리의 정렬 위치를 지정할 수 있게 되므로 번역자의 번역 속도를 높일 수 있습니다.
중간단계 소번역메모리는 사용자가 사용자 인터페이스를 통해 번역하면서 소번역단위와 소번역메모리간 대응관계 및 이들의 정렬위치를 포함하는 소단위 대응관계지시자를 지정하여 다음의 4.와 같이 생성될 수 있다.
4. 소번역단위의 순차 번역 및 소단위 대응관계지시자 지정에 의한 소번역메모리를 포함하는 중간단계 소번역메모리 생성 방법 및 유저 인터페이스 프로그램의 실시예
본 발명의 일 실시예에서, 소번역단위의 순차 번역 및 소단위 대응관계지시자 지정에 의한 소번역메모리를 포함하는 중간단계 소번역메모리 생성 방법 및 유저 인터페이스 프로그램이 구현된다. 유저 인터페이스 프로그램은 사용자가 파싱단위, 소번역단위 및 피번역 단위에 해당하는 번역 내용을 직접 입력할 수 있는 입력 유닛(11)과 사용자가 입력 유닛(11)을 통해 파싱단위, 소번역단위 및 피번역 단위에 해당하는 번역 내용을 직접 실시간으로 확인할 수 있는 표시 유닛(12)으로 구성된다. 표시 유닛(12)은 이밖에도 기본번역메모리 매칭 유닛(20)에서의 매칭의 결과 및 소번역단위 결정 유닛에서의 소번역단위 결정 결과를 표시할 수 있다.
맨앞 소번역단위부터 번역메모리DB 및 확장변역메모리DB를 검색하여 치환, 기계번역 또는 사용자 번역하고, 정렬한 다음 순차적으로 맨 뒤 소번역단위까지 번역 및 정렬의 단계를 반복하여 소단위 대응관계지시자를 삽입할 수 있다.
표 2는 중간단계 소번역메모리 생성 방법에 관한 구체적인 번역예를 도시한다. 블록으로 지정된 부분 중 글자가 흰색으로 반전된 블록(예, A second operating BZ2 state)은 순차적인 번역에서 번역될 부분으로 지정된 소번역단위를 나타내며 바로 뒤의 []표시부분(예, [제 2 작동 BZ2 상태는 ])은 지정된 소번역단위에 대해 맨앞 소번역단위부터 소번역메모리DB 및 확장 소번역메모리DB 검색을 통하여 치환되거나, 기계번역하거나, 사용자 번역됨으로써 중간단계 소번역메모리가 입력되는 부분을 나타낸다. 따라서, 사용자는 입력 유닛(11)을 통해 [] 내의 번역내용을 수정할 수 있다. 제1 소번역단위 번역 후 제2 소번역단위로 순차번역이 진행되면 이미 순차번역이 끝난 제1 소번역단위 부분은 블록으로 지정된 부분 중 회색 블록(예, A second operating BZ2 state)으로 표시된다. 기호"]"와 "/" 사이의 소단위 대응관계지시자(구체적으로는, 중간단계 소번역메모리 생성단계에서는 중간 소단위 대응관계지시자임)는 하나의 소번역단위가 순차번역될 때마다 생성될 수 있거나(도 7 참조), 사용자가 원문문장 내의 소번역단위들을 모두 번역한 후 다음 원문문장으로 넘어갈 때 일괄적으로 생성될 수 있다(도 6 참조). 사용자가 입력 유닛(11)을 통해 [] 내의 번역문과 마찬가지로 "]"와 "/"사이의 소단위 대응관계지시자의 정보(엄밀하게는, 중간단계 대응관계 지사자의 소번역문위치정보)를 수정할 수 있다.
사용자가 직접 순차 번역하여 소번역단위에 대해 소번역메모리를 생성하고 소번역메모리에 소단위 대응관계지시자를 삽입하는 표 2에 따른 실시예의 설명은 다음과 같다.
[1-1. 제1 소번역단위에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 제1 소번역메모리 생성]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5/ 제1 소번역단위 번역메모리DB 검색하여 치환, 확장 소번역메모리DB 검색하여 번역, 기계번역 또는 사용자 번역으로 제1 소번역메모리 생성
can be a operating state[]10/
at which/ a very small amount []16/
of fuel []18/
(in contrast/ to operating state/ BZ1/)[]24/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[1-2. 제1 소번역메모리 재정렬]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/ 제1 번역 메모리 재정렬(맨 앞 소번역단위가 주어이므로 실질적으로 정렬 위치 변화 없음)
can be a operating state[]10/
at which/ a very small amount []16/
of fuel []18/
(in contrast/ to operating state/ BZ1/)[]24/
is metered,[]26/
[2-1. 제2 소번역단위에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 제2 소번역메모리 생성]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
can be a operating state[작동 상태일 수 있다. ]10/ 제2 소번역단위 번역메모리DB 검색하여 치환, 확장 소번역메모리DB 검색하여 번역, 기계번역 또는 사용자 번역으로 제2 소번역메모리 생성
at which a very small amount[]16/
of fuel[]18/
(in contrast to operating state BZ1)[]24/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[2-2. 제2 소번역메모리 재정렬]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
can be a operating state[작동 상태일 수 있다. ]10-2/ 제2 소번역메모리 재정렬(실질적으로 위치 변화 없음)
at which a very small amount[]16/
of fuel[]18/
(in contrast to operating state BZ1)[]24/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[3-1. 제3 소번역단위에 대해, 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자번역으로 제3 소번역메모리 생성]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
can be a operating state[작동 상태일 수 있다. ]10-2/
at which a very small amount[매우 작은 양의 ]16/ 제3 소번역단위 번역메모리DB 검색하여 치환, 확장 소번역메모리DB 검색하여 번역, 기계번역 또는 사용자번역으로 제3 소번역메모리 생성
of fuel[]18/
(in contrast to operating state BZ1)[]24/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[3-2. 제3 소번역메모리 재정렬]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
at which a very small amount[매우 작은 양의 ]16-2/
can be a operating state[작동 상태일 수 있다. ]10-3/ 제3 소번역메모리 정렬위치 재정렬
of fuel[]18/
(in contrast to operating state BZ1)[]24/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[4-1. 제4 소번역단위에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 제4 소번역메모리 생성]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
at which a very small amount[매우 작은 양의 ]16-2/
can be a operating state[작동 상태일 수 있다. ]10-3/
of fuel[연료가]18/ 제4 소번역단위 번역메모리DB 검색하여 치환, 확장 소번역메모리DB 검색하여 번역, 기계번역 또는 사용자 번역으로 제4 소번역메모리 생성
(in contrast to operating state BZ1)[]24/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[4-2. 제4 소번역메모리 재정렬]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
at which a very small amount[매우 작은 양의 ]16-2/
of fuel[연료가]18-3/ 제4 소번역메모리 재정렬
can be a operating state[작동 상태일 수 있다. ]10-4/
(in contrast to operating state BZ1)[]24/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[5-1. 제5 소번역단위에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 제5 소번역메모리 생성]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
at which a very small amount[매우 작은 양의 ]16-2/
*of fuel[연료가]18-3/
can be a operating state[작동 상태일 수 있다. ]10-4/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로) ]24/ 제5 소번역단위 번역메모리DB 검색하여 치환, 확장 소번역메모리DB 검색하여 번역, 기계번역 또는 사용자 번역으로 제5 소번역메모리 생성
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[5-2. 제5 소번역메모리 재정렬]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/ 제5 소번역메모리 재정렬
at which a very small amount[매우 작은 양의 ]16-3/
of fuel[연료가]18-4/
can be a operating state[작동 상태일 수 있다. ]10-5/
is metered,[]26/
especially/ for catalyst/ heating.[]30/
[6-1. 제6 소번역단위에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 제6 소번역메모리 생성]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
at which a very small amount[매우 작은 양의 ]16-3/
of fuel[연료가]18-4/
can be a operating state[작동 상태일 수 있다. ]10-5/
is metered,[계량되는]26/ 제6 소번역단위 번역메모리DB 검색하여 치환, 확장 소번역메모리DB 검색하여 번역, 기계번역 또는 사용자 번역으로 제6 소번역메모리 생성
especially/ for catalyst/ heating.[]30/
[6-2. 제6 소번역메모리 재정렬]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
at which a very small amount[매우 작은 양의 ]16-3/
of fuel[연료가]18-4/
is metered,[계량되는]26-5/ 제6 소번역메모리 재정렬
can be a operating state[작동 상태일 수 있다. ]10-6/
especially/ for catalyst/ heating.[]30/
[7-1. 제7 소번역단위에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 제7 소번역메모리 생성]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
at which a very small amount[매우 작은 양의 ]16-3/
of fuel[연료가]18-4/
is metered,[계량되는]26-5/
can be a operating state[작동 상태일 수 있다. ]10-6/
especially/ for catalyst/ heating.[ 특히 촉매 가열을 위해]30/ 제7 소번역단위 번역메모리DB 검색하여 치환, 확장 소번역메모리DB 검색하여 번역, 기계번역 또는 사용자 번역으로 제7 소번역메모리 생성
[7-2. 제7 소번역메모리 재정렬]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
at which a very small amount[매우 작은 양의 ]16-3/
of fuel[연료가]18-4/
especially/ for catalyst/ heating.[ 특히 촉매 가열을 위해]30-5/ 제7 소번역메모리 재정렬
is metered,[계량되는]26-6/
can be a operating state[작동 상태일 수 있다. ]10-7/
이와 같이, 1-1에서 7-2까지의 순서로 원문문장의 소번역단위들이 처리되며, 소번역단위에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 소번역메모리를 생성한다.
또한, 소번역메모리의 소번역단위들에 소단위 대응관계지시자들을 지정하면 중간단계 소번역메모리가 다음과 같이 생성된다.
[원문문장을 중심으로 순차적으로 정렬된 중간단계 소번역메모리]
A second operating BZ2 state[제 2 작동 BZ2 상태는]5-1/
can be a operating state[작동 상태일 수 있다.]10-7/
at which a very small amount[매우 작은 양의]16-3/
of fuel[연료가]18-4/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
is metered,[계량되는]26-6/
especiallly for catalyst heating[특히 촉매 가열을 위해]30-5/
[번역문장을 중심으로 순차적으로 정렬된 중간단계 소번역메모리]
A second operating BZ2 state[제 2 작동 BZ2 상태는 ]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
at which a very small amount[매우 작은 양의 ]16-3/
of fuel[연료가]18-4/
especially/ for catalyst/ heating.[ 특히 촉매 가열을 위해]30-5/
is metered,[계량되는]26-6/
can be a operating state[작동 상태일 수 있다. ]10-7/
다른 실시예에서, 일괄적으로 중간단계 소단위 대응관계지시자를 지정하는 방법이 이용될 수 있다.
구체적으로, [1-1]에서 [7-2]까지 각 소번역단위에 대한 소번역메모리마다 소단위 대응관계지시자 생성하지 않고 중간단계 소번역메모리를 입력하여 전체 번역문장을 완성(중간단계 소번역메모리를 번역문장에 따라 정렬)한다.
A second operating BZ2 state[제 2 작동 BZ2 상태는]5-/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-/
at which a very small amount[매우 작은 양의]16-/
of fuel[연료가]18-/
*especiallly for catalyst heating[특히 촉매 가열을 위해]30-/
is metered,[계량되는]26-/
can be a operating state[작동 상태일 수 있다.]10-/
그후, 다음과 같이 일괄적으로 소단위 대응관계지시자의 소번역문위치정보를 지정하는 방법이다.
A second operating BZ2 state[제 2 작동 BZ2 상태는]5-1/
(in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-2/
at which a very small amount[매우 작은 양의]16-3/
of fuel[연료가]18-4/
especiallly for catalyst heating[특히 촉매 가열을 위해]30-5/
is metered,[계량되는]26-6/
can be a operating state[작동 상태일 수 있다.]10-7/
이러한 번역메모리 생성 방법은 초기에 소번역메모리를 구축하는 과정에서는 길이가 짧은 단순한 문장의 경우에 일반 번역시간보다 약간의 시간이 더 걸린다고 할지라도, 일단 한번 번역된 소번역단위는 소번역메모리로 저장되기만 하면 이후 번역부터 소번역메모리 이용이 가능해지고 확장 소번역메모리 DB를 구축하고 확장 소번역메모리 DB로부터 확장 소번역메모리 이용이 가능해진다. 소번역메모리를 포함하는 번역메모리가 쌓일수록 새로운 원문문장에 적용할 소번역메모리들이 많아지기 때문에 사용자는 직접 소번역단위들을 번역하지 않고 CAT 프로그램을 이용하여 직접 타이핑하는 시간을 줄일 수 있으므로, 번역 속도가 빨라지게 된다.
도 2b는 본 발명에 따른 소번역메모리를 생성하기 위한 유저 인터페이스 유닛(10)의 입력 유닛(11) 및 표시 유닛(12)의 다른 실시예이다.
번역문이 표시되는 창이 표시 유닛(12)이고 소번역메모리 생성 작업이 이루어지는 창이 입력 유닛(10)이다. 도 2b의 소번역메모리 입력 유닛(10)에 의해 생성된 소번역메모리는 도 3a 내지 도 3g일 수 있다.
도 2c 및 도 2cc는 본 발명에 따른 1차 소번역메모리를 생성하기 위한 1차 소번역메모리 입력 유닛(111) 및 2차 소번역메모리를 생성하기 위한 2차 소번역메모리 입력 유닛(211)의 또 다른 실시예이다.
1차 소번역메모리 생성 작업이 이루어지는 창이 1차 소번역메모리 입력 유닛(111)이고 1차 소번역메모리 생성 작업이 이루어지는 창이 2차 소번역메모리 입력 유닛(211)이다.
도 2c에서 2차 소번역메모리 입력 유닛(211)은 1차 소번역메모리 입력 유닛(111)의 노란색의 3번째 1차 소번역단위(102)를 세분화하여 파싱한 2차 소번역단위(202)를 도시한다.
도 2cc은 2차 소번역메모리 입력 유닛(211)에서 1차 소번역메모리 입력 유닛(111)의 3번째 1차 소번역단위(102)를 세분화하여 파싱한 2차 소번역단위(202)들에 대해 2차 소번역문(207)들을 생성하고 정렬하여 1차 소번역메모리 입력 유닛(111)에 3번째 1차 소번역문(107)을 생성한 것을 보여준다.
도 2cc의 1차 소번역메모리 입력 유닛(111) 및 2차 소번역메모리 입력 유닛(211)을 통해 생성한 소번역메모리는 도 3h 및 도 3i에 도시된다.
5. 원문문장에 대한 중간단계 소번역메모리의 최종 번역 메모리 형태로의 변
본 발명에 따르면, 소번역단위들에 대해 번역메모리DB를 검색하여 전체적으로 일치하면 치환하고, 부분적으로 일치하는 경우 확장 소번역메모리 DB를 검색하여 저장된 확장 소번역메모리와 일치하면 확장 소번역메모리를 적용하여 번역하고, 확장 소번역메모리와 일치하지 않으면 일치하지 않는 부분을 기계번역하고, 추가로 사용자 번역으로 소번역메모리 생성한 후, 소번역단위, 소번역메모리 및 소단위 대응관계지시자에 따라 정렬되기 전의 중간단계 소번역메모리는 다음과 같이 표현될 수 있다(도 2a).
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// A second operating BZ2 state[제 2 작동 BZ2 상태는]5 -1/ can be a operating state[작동 상태일 수 있다.]10 -7/ at which a very small amount[매우 작은 양의]16 -3/of fuel[연료가]18 -4/ (in contrast to operating state BZ1)[ (작동 상태 BZ1와 대조적으로)]24 -2/is metered, [계량되는]26-6/ especiallly for catalyst heating[특히 촉매 가열을 위해]30-5/
[소번역메모리를 포함하는 번역 메모리(도 3a)]
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// [ 제 2 작동 BZ2 상태는 ]5-1/[작동 상태일 수 있다. ]10-7/[매우 작은 양의 ]16-3/[연료가 ]18-4/[(작동 상태 BZ1와 대조적으로) ]24-2/[계량되는 ]26-6/ [특히 촉매 가열을 위해]30-5/
[완성된 최종 번역문장 순서대로 소번역메모리 재정렬된 번역메모리(도 3b)]
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// [ 제 2 작동 BZ2 상태는 ]5-1/[(작동 상태 BZ1와 대조적으로) ]24-2/[매우 작은 양의 ]16-3/[연료가 ]18-4/[특히 촉매 가열을 위해 ]30-5/[계량되는 ]26-6/[작동 상태일 수 있다.]10-7/
소번역메모리를 포함하는 번역메모리는 소번역메모리와 소단위 대응관계지시자를 분리하는 방식으로 다음과 같이 나타내는 것도 가능하다. 소번역메모리의 소단위 대응관계지시자는 각각의 소번역메모리 사이에 위치할 때는 각각의 소번역메모리의 정렬 순서를 표시하는 1부터 오름차순으로 증가하는 수로 표시되어 소번역문의 정렬 순서를 나타내었으나, 문미에 위치될 때에는 이미 소번역문이 번역 문장의 정렬 순서로 정렬되었으므로, 각 소번역문이 번역 문장에 차지하는 단어들의 위치를 지정하는 정보를 갖도록 변형될 수 있다. 이러한 예는 아래와 같다(도 3c).
[소번역문와 소단위 대응관계지시자를 분리]
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// 제 2 작동 BZ2 상태는 /(작동 상태 BZ1와 대조적으로) /매우 작은 양의 /연료가 /특히 촉매 가열을 위해 /계량되는 /작동 상태일 수 있다./[5-5,24-9,16-12,18-13,30-17,26-18,10-22]
소번역문이 번역문장의 순서로 이미 정렬되어 있으므로 소번역문에 대한 정렬 순서를 제거하고 소번역문의 원문문장 대응관계를 포함하는 소번역단위에 대한 소단위 대응관계지시자인 소번역단위위치정보만으로 표현하는 것도 가능하다(도 3d).
[소번역단위에 대한 소단위 대응관계지시자만으로 표현]
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// 제 2 작동 BZ2 상태는 /(작동 상태 BZ1와 대조적으로) /매우 작은 양의 /연료가 /특히 촉매 가열을 위해 /계량되는 /작동 상태일 수 있다./[5,24,16,18,30,26,10]
이러한 포맷에서 '/'는 소번역문을 지정하고, 소단위 대응관계지시자는 소번역문에 대응하는 소번역단위가 원문문장에서 차지하는 위치를 나타낸다. 예를 들어 소번역문 "연료가"에 지정된 소단위 대응관계지시자는 18이므로 대응하는 소번역단위는 시작 단어 17에서 끝 어절이 18번째 단어(또는 어절)까지인 'of fuel'이 된다.
그 후 변형을 거쳐, 소번역메모리 번역부를 구분하는 기호 '/'를 제거하고 종래와 같은 번역메모리의 원문 문장과 이에 상응하는 번역문 문장의 문장 쌍으로 변형하여서, 최종적으로 종래의 번역 메모리에 소번역단위와 소번역메모리의 소단위 대응관계지시자를 추가한 형태로 표현하면 다음과 같다(도 3e).
[종래의 번역 메모리에 소단위 대응관계지시자를 추가한 형태로 표현]
A second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.// 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다. [5-5,24-9,16-12,18-13,30-17,26-18,10-22]
이러한 소번역메모리를 갖는 번역 메모리 포맷은 종래의 번역 메모리와 동일한 형태를 유지하면서, 원문문장 내 소번역단위와 번역메모리 내 소번역메모리의 대응관계를 나타내는 정보까지 포함할 수 있다.
도 3e에 도시된 형태가 종래의 번역메모리 포맷과 가장 가까운 형태이지만, 도 3a 내지 도 3d에 도시된 형태들은 필요에 따라 번역 메모리 포맷으로 사용될 수 있다.
소번역메모리를 포함하는 번역메모리의 소단위 대응관계표시자는 번역메모리의 원문과 번역문 저장 영역과 다른 영역에 저장되어 저장 날짜 출처 등과 같이 사용자에게 보이지 않게 할 수 있다.
이러한 본 발명에 따른 소번역메모리를 포함하는 번역메모리 포맷은 기존의 번역메모리 포맷에 비해 여러가지 장점을 갖는다.
본 발명에 따른 번역메모리는 기존의 번역메모리와 비교하여 번역단위인 원문 문장이 세분된 소단위인 소번역단위에 대한 번역쌍인 소번역메모리를 추가로 표시하여, 소번역메모리가 정렬되어 번역문 문장을 형성하도록 소단위 대응관계지시자를 갖는다.
따라서, 첫째로, 본 발명에 따른 번역메모리는 소번역메모리를 포함함으로써 번역될 원문 문장이 시스템에 이미 존재하는 번역 메모리DB의 원문 문장과 100% 일치하지 않더라도 번역될 원문문장의 일부와 일치하는 소번역메모리(들)을 이용하여 번역될 원문문장의 일부라도 번역함으로써 번역의 정확성이 높아지고 번역 시간이 단축될 수 있다.
둘째로, 원문문장이 100% 일치하지 않더라도 문장 내 소번역단위가 일치하면, 일치된 소번역단위에 해당하는 소번역단위 번역 메모리를 이용할 수 있으므로, 기존의 번역 메모리보다 번역 메모리의 활용 빈도를 높일 수 있다.
셋째로, 본 발명에 따른 번역메모리는 소번역메모리를 포함함으로써 오류 체크가 문장 단위 별이 아닌 문장 소단위 별로 이루어지기 때문에, 오류 체크가 정확해지고 오류 체크 시간이 단축될 수 있다. 종래의 번역 검수 프로그램들은 문장 대 문장을 비교하기 때문에, 문장 내에 동일한 단어가 여러번 나오는 경우 원문 문장 내 단어 대 번역문 문장 내 단어의 매칭율이 떨어지는 단점이 있었다. 반면, 본 발명의 번역메모리는 각각의 문장 소단위에 대해 위치 정보를 포함하고 있기 때문에, 원문 문장의 소번역단위 단어들과 번역문장 내의 소번역문 단어들의 매칭율이 현저하게 높아진다.
넷째로, 원문문장에 대해 세분된 소번역단위에 대한 소번역문을 포함하기 때문에, 원문문장에 대한 문장 성분 분석이 정확해지며, 원문문장에 있는 단어들의 대응 번역부분을 정확하게 추출할 수 있게 되므로, 번역 메모리에 대한 활용도가 높아진다. 예를 들어 소번역문이 소번역단위의 대응관계에 관한 정보로부터 소번역문이 한국어인 경우 한국어는 조사에 의해 정확하게 문장성분의 파악이 가능하므로, 소번역문들을 분석하여 원문문장에서 동일한 원문 단어에 대한 공통된 소번역문의 번역을 분석하여 소번역문의 번역 패턴을 추출할 수 있다. 따라서, 문장 전체가 아닌 소번역문에 대한 확장 소번역메모리 구축을 가능하게 한다. 이러한 확장 소번역메모리는 종래의 문장 단위 번역메모리의 확장 메모리보다 세분되어 문장 내의 소번역단위에 대해 구축되기 때문에 월등하게 정확하고 활용도가 높게 된다.
다섯째로, 원문 문장의 소번역단위에 대한 소번역문이 구축되기 때문에, 일방향 번역메모리를 반대로 역방향 번역메모리로 구축할 수 있다. 예를 들어, 원문이 영어인 원문에 대해 목표 언어가 한국어인 소번역메모리를 포함하는 번역메모리 DB를 구축하였다면, 역으로, 한국어인 소번역문을 원문의 소번역단위로 하고 영어인 소번역단위를 번역문의 소번역문로 하는 역방향 번역메모리 DB를 구축하여 일방향 번역메모리 DB를 구축하는 것만으로도 역방향 번역메모리 DB를 구축할 수 있다. 따라서, 별도로, 한국어가 원문 언어이고 영어가 목표 언어인 번역메모리를 별도로 구축하여 데이터를 축적하지 않고도, 영어가 원문 언어이고 한국어가 목표 언어인 소번역메모리를 포함하는 번역메모리 DB의 구축만으로, 반대방향의 번역메모리를 구축하는 비용과 시간을 절약할 수 있다.
6. 번역메모리 내에 추가적으로 세분화된 소번역메모리(2차 소번역메모리)를 갖는 소번역메모리(1차 소번역메모리)
원문 문장에 대한 소번역단위 분할은 소번역단위의 갯수가 많을수록 많은 소번역메모리를 생성할 수 있지만, 정렬해야하는 소번역문의 갯수도 소번역단위의 갯수만큼 많아지기 때문에, 번역의 효율성을 높일 수 있는 적절한 갯수의 소번역단위 결정이 필요하다.
도 3h 및 도 3i는 도 2c 및 도 2cc의 1차 소번역메모리 입력 유닛(111) 및 2차 소번역메모리 입력 유닛(211)을 통해 생성되는 번역메모리로서, 원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리인 1차 소번역메모리(109)가 1차 소번역메모리(109)를 추가로 세분화한 추가적인 소번역메모리인 2차 소번역메모리(209)를 포함하는 번역메모리를 도시한다.
원문 문장에 대한 소번역단위 분할은 소번역단위의 갯수가 많을수록 많은 소번역메모리를 생성할 수 있지만, 정렬해야하는 소번역문의 갯수도 소번역단위의 갯수만큼 많아지기 때문에, 번역의 효율성을 높일 수 있는 적절한 갯수의 소번역단위 결정이 필요하다.
원문 문장을 소번역단위들(102)로 분할하여 상기 소번역단위들(102) 각각에 대응하는 소번역문들(107)을 생성하고, 소번역단위들(102) 각각에 대한 소번역단위위치정보(108') 및 소번역문들 각각에 대한 소번역문위치정보(108")를 생성하여 형성된 소번역단위(102) 및 소번역문(107)의 쌍을 갖는 소번역메모리가 소단위대응관계지시자(108)에 의해 표시되는 소번역메모리를 포함하는 번역메모리의 포멧은 2차 소번역메모리(209)를 포함하는 1차 소번역메모리(109)의 포멧에도 적용될 수 있다.
즉, 원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리(1차 소번역메모리)를 포함하는 번역 메모리는 상기 1차 소번역메모리(109)는 상기 원문 문장을 번역 소단위로 세분화한 1차 소번역단위(102) 및 상기 1차 소번역단위(102)에 대응하는 번역 문장 내의 번역 부분인 1차 소번역문(107)의 쌍을 포함한다. 여기서, 상기 번역 메모리는 상기 번역 메모리 내에서 상기 1차 소번역메모리(109)를 특정하는 1차 소단위 대응관계지시자(108)를 포함하고, 1차 소단위 대응관계지시자(108)는 1차 소번역단위위치정보(108') 및 1차 소번역문위치정보(108")을 포함한다. 1차 소단위 대응관계지시자(108)에 의해 상기 번역 메모리 내에서 1차 소번역메모리(109)의 1차 소번역단위(102) 및 1차 소번역문(107) 쌍의 대응 관계가 표시된다.
일 실시예에서, 1차 소번역메모리(109)는 1차 소번역메모리(109)를 추가로 세분화한 추가적인 소번역메모리인 2차 소번역메모리(209)를 포함할 수 있다. 2차 소번역메모리(209)는 2차 소번역메모리(209)로 추가로 세분화하기 전 1차 소번역메모리(109)의 1차 소번역단위(102)를 추가로 세분화한 번역 소단위인 2차 소번역단위(202) 및 2차 소번역단위(202)에 대응하는 번역 부분인 2차 소번역문(207)의 쌍을 포함하고, 1차 소번역메모리(109)는 2차 소번역메모리(209)를 특정하는 2차 소단위 대응관계지시자(208)를 포함하고, 2차 소단위 대응관계지시자(208)은 2차 소번역메모리(209)의 2차 소번역단위(202) 및 2차 소번역문(207) 쌍의 대응 관계를 나타낸다.
- A first operating state BZ1 can be a state of low load, and a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
위 예문을 접속사의 앞 및 뒤에서 파싱하는 기계적 분할 규칙에 의해 분할한 후 생성한 소번역메모리를 포함하는 번역메모리로 저장하면 다음과 같다.
- A first operating state BZ1 can be a state of low load,[제 1 작동 상태 BZ1는 낮은 부하의 상태일 수 있고,]12-/ and[그리고]13-/ a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.[제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.]43-/
- A first operating state BZ1 can be a state of low load, and a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating.
제 1 작동 상태 BZ1는 낮은 부하의 상태일 수 있고,[12-10]/ 그리고[13-11]/ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.[43-33]
- A first operating state BZ1 can be a state of low load, and a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating. 제 1 작동 상태 BZ1는 낮은 부하의 상태일 수 있고, 그리고 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다. [12-10, 13-11, 43-33]
2차 소번역메모리(209)는 1차 소번역메모리(109)를 더 세분화한 소번역메모리이다. 위의 예문의 번역메모리는 소단위 대응관계지시자[12-10, 13-11, 43-33]에 의해 지시되는, 3개의 소번역메모리를 포함한다([A first operating state BZ1 can be a state of low load /제 1 작동 상태 BZ1는 낮은 부하의 상태일 수 있고] , [and /그리고], [a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating./ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.]).
이러한 소번역메모리를 더 세분화한다면 세분화된 소번역메모리는 2차 소번역메모리(209)가 되고 2차로 세분화되기 전 소번역메모리는 1차 소번역메모리(109)이다. 예를 들어, 세번째 소번역메모리[a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating./ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.]를 더 세분화하여 단문 내에서 명사뒤 전치사앞을 파싱하는 기계적 분할 규칙에 의해 분할한 후 생성한 소번역메모리를 포함하는 번역메모리로 저장하면 세번째 소번역메모리인 [a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating./ 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.]가 1차 소번역메모리(109)가 되고, 이를 세분화한 아래의 소번역메모리들이 2차 소번역메모리(209)가 된다.
a second operating BZ2 state[제 2 작동 상태 BZ2는]5-5/ can be a operating state[작동 상태일 수 있다.]10-22/ at which a very small amount of fuel[매우 작은 양의 연료가]18-13/ (in contrast to operating state BZ1)[(작동 상태 BZ1와 대조적으로)]24-9/ is metered,[계량되는] especiallly for catalyst heating.[특히 촉매 변환기 가열을 위해]30-17/
따라서, 2차 소번역메모리(209)를 갖는 1차 소번역메모리(109)를 포함하는 번역메모리는 도 3h 및 도 3i와 같이 표시될 수 있다. 2차 소번역메모리(209)를 갖는 번역메모리에서 2차 소번역메모리(209)와 구별하기 위해 2차로 세분화되기 전 1차 소번역메모리 입력 유닛(111)에서 생성된 소번역메모리를 1차 소번역메모리(109)로 지칭한다. 1차 소번역메모리(109)는 2차 소번역메모리(209)를 가질 수 있다. 1차 소번역메모리(109)의 소단위 대응관계지시자(108)는 소번역메모리의 소단위 대응관계지시자와 비교하여 1차 소번역메모리(109)의 소단위 대응관계지시자(108) 바로 뒤의 괄호 안에 2차 소단위 대응관계지시자(208)들을 더 가지고 있다.
A first operating state BZ1 can be a state of low load, and a second operating BZ2 state can be a operating state at which a very small amount of fuel (in contrast to operating state BZ1) is metered, especiallly for catalyst heating. 제 1 작동 상태 BZ1는 낮은 부하의 상태일 수 있고, 그리고 제 2 작동 BZ2 상태는 (작동 상태 BZ1와 대조적으로) 매우 작은 양의 연료가 특히 촉매 가열을 위해 계량되는 작동 상태일 수 있다.[ 0-55|0-31|0, 56-3|32-3|1, 60-172|36-76|2(0-28|0-14|0,29-24|65-11|5,54-36|34-12|2,91-36|15-18|1,128-11|60-4|4,140-32|47-12|3) ]
위에서 1차 소번역단위(102)를 표시하는 1차 소단위 대응관계지시자(108) "60-172|36-76|2"는 2차 소번역메모리(209)를 표시하는 2차 소단위 대응관계표시자(208) "0-28|0-14|0, 29-24|65-11|5, 54-36|34-12|2, 91-36|15-18|1, 128-11|60-4|4, 140-32|47-12|3"를 괄호 안에 포함한다.
이러한 2차 소번역메모리(209)를 갖는 1차 소번역메모리(109)를 구성요소로 가짐으로서 소번역메모리를 포함하는 번역메모리는 번역문장으로부터 소번역메모리를 생성하는 1차 소번역메모리 입력 유닛(111)에서 단문을 소번역단위로 하는 1차 소번역메모리(109)를 생성하고, 1차 소번역단위로부터 2차 소번역메모리를 생성하는 2차 소번역메모리 입력 유닛(211)에서 단문 내에 세분화된 문장성분들에 대한 소번역메모리인 2차 소번역메모리(209)를 가질 수 있다(도 2c 및 도 2cc 참조).
이러한 1차 소번역메모리 입력 유닛(111)과 2차 소번역메모리 입력 유닛(211)의 구성은 복문을 단문으로 분할한 뒤 소번역메모리(1차 소번역메모리)를 생성하고, 각각의 단문들을 더 세분화된 소번역단위로 분할하여 소번역메모리(2차 소번역메모리)를 생성할 수 있게 한다.
최근 단문에 대한 기계번역 성능이 높아짐에 따라, 복문의 경우 접속사 앞 및 뒤를 분할하는 기계적 분할 규칙에 의해 복문을 단문의 1차 소번역단위(102)로 분할하고 단문에 대해 기계번역을 적용하여 1차 소번역문(107)을 생성하여 1차 소번역메모리(109)를 생성하며, 복문을 이루는 단문 중 문장 길이가 긴 1차 소번역단위(102)가 기계번역으로 적용하여 번역문을 생성하면 부정확한 경우 문장 길이가 긴 1차 소번역단위(102)를 2차 소번역단위(202)들로 분할하여 2차 소번역문(207)들을 갖는 2차 소번역문(207)을 생성할 수 있다. 이러한 2차 소번역단위(202)를 갖는 번역메모리는 기계번역을 이용하여 번역메모리를 생성할 수 있는 장점이 있다. 또한, 이미 저장된 소번역메모리를 불러오는 작업에서도 여러 장점들을 가지게 된다. 1차 소번역메모리 입력 유닛(111)에서는 단문 위주의 소번역메모리를 검색하여 불러오고 2차 소번역메모리 입력 유닛(211)에서는 단문을 구성하는 문장 성분을 이루는 소번역메모리들을 불러와 정렬 또는 삽입함으로써 번역문장을 완성할 수 있다.
일 실시예에서, 2차 소단위 대응관계지시자(208)은 2차 소번역단위(202)의 소번역단위 내 위치를 나타내는 정보인 2차 소번역단위위치정보(208')와 소번역문의 번역 문장 내 위치를 나타내는 정보인 2차 소번역문위치정보(208")를 포함할 수 있고, 2차 소번역단위위치정보(208')들은 2차 소번역단위(202)들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자를 포함하고, 2차 소번역문위치정보(208")들은 상기 2차 소번역문(207)들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자를 포함할 수 있다.
일 실시예에서, 2차 소번역단위위치정보(208')들은 상기 2차 소번역단위(202)들 각각의 1차 소번역문(107) 내 소단위로 세분화된 위치를 지시할 수 있는 숫자를 포함하고, 2차 소번역문위치정보(208")들은 2차 소번역문(207)들 간의 1차 소번역문(107) 내 정렬 순서를 지시할 수 있는 숫자를 포함할 수 있다.
일 실시예에서, 2차 소번역단위위치정보(208')들은 1차 소번역단위(102) 내에서 1차 소번역단위(102)의 첫 문자에 대한 2차 소번역단위(202)들 각각의 첫 문자 및 마지막 문자의 위치를 포함하고, 2차 소번역문위치정보(208")는 1차 소번역문(107) 내에서 1차 소번역문(107)의 첫 문자에 대한 2차 소번역문(207)들 각각의 첫 문자, 및 1차 소번역문(107)의 첫 문자에 대한 2차 소번역문(207)들 각각의 마지막 문자의 위치, 및 2차 소번역문(207)들 각각이 인접한 다른 소번역문(207) 내로 삽입되는 위치를 지시하는 위치를 포함할 수 있다.
일실시예에서, 소번역단위들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들은 원문 문장 내에서 원문 문장의 첫 문자에 대한 소번역단위들 각각의 마지막 문자의 위치를 지시할 수 있고, 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역문 문장 내에서 번역문 문장의 첫 문자에 대한 소번역문들 각각의 마지막 문자의 위치를 지시할 수 있다.
일실시예에서, 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역 문장 내에서 소번역문들 각각의 정렬 순서를 나타내는 위치 및 소번역문들 각각이 인접한 다른 소번역문 내로 삽입되는 위치 중 하나 이상을 더 포함할 수 있다.
소번역메모리 또는 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리는 컴퓨터 판독가능한 저장 매체에 기록되어 번역 등의 작업에서 활용될 수 있다.
이러한, 2차 소번역메모리로 더욱 세분화된 소번역메모리를 포함하는 번역메모리는 단문위주의 긴 소번역메모리는 1차 소번역메모리로 저장하고, 단문 내 문장 성분을 구별하는 소번역메모리를 2차 소번역메모리로 저장할 수 있기 때문에, 단문과 복문을 고려하고 더 세분화하여 단문 내 문장 성분을 고려한, 단계적인 번역 및 기계번역에 적용될 수 있는 장점이 있다.
7. 등록 관용구 저장 및 용어 추출
표 3는 본 발명에 따른 소번역메모리를 포함하는 번역메모리를 이용한 등록 관용구의 실시예이다.
원문언어부 목표언어부
A second operating BZ2 state 제 2 작동 BZ2 상태는
can be a operating state 작동 상태일 수 있다
at which a very small amount 매우 작은 양의
of fuel 연료가
in contrast to operating state BZ1 작동 상태 BZ1와 대조적으로
is metered 계량되는
especiallly for catalyst heating 특히 촉매 가열을 위해
본 발명에 따른 소번역메모리를 포함하는 번역메모리를 저장하는 과정에서 소번역단위에 대한 소번역메모리 생성과정은 등록 관용구 저장에 이용될 수 있다. 모든 소번역단위는 등록 관용구의 원문 언어부분이 되고 목표 언어부분에 해당하는 소번역부분은 소번역메모리로 저장되는 대신 등록 관용구로 저장될 수 있다.
또한, 소번역단위에 대한 등록 관용구는 원문언어의 의미가 반영되지 않은 "at which" 및 목표언어의 "는" "의" "가"의 조사부분을 삭제하는 후처리 과정을 통해 표 4에서와 같이, 조사부분을 삭제하고 저장될 수 있다.
원문언어부 목표언어부
A second operating BZ2 state 제 2 작동 BZ2 상태
can be a operating state 작동 상태일 수 있다
at which a very small amount 매우 작은 양
of fuel 연료
in contrast to operating state BZ1 작동 상태 BZ1와 대조적으로
is metered 계량되는
especiallly for catalyst heating 특히 촉매 가열을 위해
아래 표 5에서 보는 바와 같이, 명사 뒷부분을 분할하면 소번역단위에 하나의 명사만을 포함하게 되므로, 명사 이외의 문장성분을 제거하여 용어집을 만들 수 있다. 이 경우, 명사는 항상 소번역단위에서 끝부분에 위치하고 소번역문에서 명사는 주로 소번역문에서 앞부분에 위치하므로, 소번역단위에서 관사, 정관사 및 전치사까지의 단어를 제거하며 소번역문에서 명사 뒤의 조사 이후 단어들 및 품사가 부사인 단어를 제거함으로써 아래와 같이 용어를 추출할 수 있다.
원문언어부 목표언어부
second operating BZ2 state 제 2 작동 BZ2 상태
operating state 작동 상태
very small amount 매우 작은 양
fuel 연료
operating state BZ1 작동 상태 BZ1
catalyst heating 촉매 가열
원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소번역메모리를 포함하는 번역 메모리에서 용어를 추출하는 방법은 소번역메모리들 중 원문 문장을 명사 뒤에서 기계적 분할한, 하나의 명사만 포함된, 소번역메모리들을 추출하고, 소번역단위에 관사+명사 또는 정관사+명사, 또는 전치사+명사가 포함된 소번역메모리들을 추출하고, 추출된 상기 소번역메모리의 소번역단위에서 맨 앞부터 관사 또는 정관사 및 전치사까지의 형태소를 제거하고, 소번역문에서 명사 이후의 형태소, 및 품사가 부사인 형태소를 제거하고, 상기 소번역단위에서 제거하고 남은 부분을 용어의 원문언어 부분으로 저장하고, 그리고 상기 소번역단위에 대응하는 소번역문에서 제거하고 남은 부분을 용어의 목표언어 부분으로 저장한다.
8. 역방향 소번역메모리
도 5a 내지 도 5d는 본 발명에 따른 소번역메모리를 포함하는 번역메모리를 이용한 역방향 번역메모리의 실시예이다. 역방향번역메모리는 원문언어(영어)의 원문문장과 번역언어(한국어)의 번역문장이 서로 바뀐 번역메모리(한국어->영어)로 형성된다.
번역 메모리는 원문 문장(예, 영어)에 대한 이전의 번역 문장(예, 한국어)을 저장한 DB이기 때문에, 전술한 본 발명의 소번역메모리를 포함하는 번역메모리의 원문 언어(예, 영어)의 원문 문장과 목표언어(예, 한국어)의 번역문장을 역으로 목표언어의 번역문장을 원문언어의 원문문장(140)(예, 한국어)로하고 원문언어의 원문문장을 목표언어의 번역문장(141)(예, 영어)으로 하고, 그리고 소단위 대응관계지시자(144)의 소번역단위위치정보(144')와 소번역문위치정보(144")를 서로 위치 교환함으로써, 역방향 소번역 메모리(한국어->영어)를 갖는 번역메모리를 구축할 수 있다(도 5a).
이러한 역방향 번역메모리는 번역언어에 대한 별도의 번역메모리(한국어->영어)를 번역을 통해 구축하지 않고도 원문언어에 대한 소번역메모리를 갖는 번역메모리(영어->한국어)를 구축한 것만으로도 역방향메모리 DB를 구축할 수 있다. 따라서, 일방향 소번역 메모리의 구축으로 역방향 소번역 메모리를 구축할 수 있으므로, 두 언어간 번역 메모리 구축 시간을 대폭 줄일 수 있다.
역방향 번역메모리는 도 3a 내지 도 3e의 소번역메모리를 포함하는 번역메모리와 같이, 소번역단위를 포함하는 원문문장, 소번역문을 포함하는 번역문장, 그리고 소번역단위와 소번역문 간의 대응관계를 표시하는 소단위 대응관계지시자를 포함할 수 있다. 예를 들어, 도 5a는 도 3e와 같은 형태, 도 5b는 도 3d와 같은 형태, 도 5c는 도 3c와 같은 형태의 역방향 소번역메모리를 갖는 소번역메모리를 포함하는 번역메모리를 구축할 수 있다.
일 실시예에서, 목표언어가 원문 문장이고 원문 언어가 번역 문장인 역방향 번역에 이용하기 위해, 번역 메모리의 소번역단위에 대응하는 소번역문이 역방향 번역메모리의 소번역단위가 되고, 번역 메모리의 소번역단위가 역방향 번역메모리의 소번역문이 되며, 소번역메모리를 포함하는 번역메모리의 소번역문위치정보가 역방향 번역메모리의 소번역단위위치정보가 되고, 소번역메모리를 포함하는 번역메모리의 소번역단위위치정보가 역방향 번역메모리의 소번역문위치정보가 된다.
다른 실시예에서, 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리를 형성한 후, 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리로부터, 목표언어가 원문 원어가 되고 원문언어가 목표언어가 되는 역방향 번역에 적용하기 위한 소번역메모리를 포함하는 역방향 번역메모리를 구축할 수 있다. 목표언어가 원문 문장이고 원문 언어가 번역 문장인 역방향 번역에 이용하기 위해, 번역 메모리의 1차 소번역단위 및 2차 소번역단위에 대응하는 1차 소번역문 및 2차 소번역문이 역방향 번역메모리의 1차 소번역단위 및 2차 소번역단위가 된다. 번역 메모리의 1차 소번역단위 및 2차 소번역단위가 역방향 번역메모리의 1차 소번역문 및 2차 소번역문이 된다. 1차 소번역메모리를 포함하는 번역메모리의 1차 소번역문위치정보가 역방향 번역메모리의 1차 소번역단위위치정보가 된다. 1차 소번역메모리를 포함하는 번역메모리의 1차 소번역단위위치정보가 역방향 번역메모리의 1차 소번역문위치정보가 되고, 2차 소번역메모리를 포함하는 번역메모리의 2차 소번역문위치정보가 역방향 번역메모리의 2차 소번역단위위치정보가 되고, 2차 소번역메모리를 포함하는 번역메모리의 2차 소번역단위위치정보가 역방향 번역메모리의 2차 소번역문위치정보가 된다.
이러한 소번역메모리를 포함하는 역방향 번역메모리는 컴퓨터 판독가능한 저장매체에 저장될 수 있다.
9. 사용 언어 형태의 제한 없이 응용
전술한 바와 같이, 본 발명에 따른 소단위 대응관계를 갖는 번역 메모리는 영어를 원문언어로 한국어를 목표언어로 하여 설명되었다. 그러나, 본 발명은 영어와 한국어에 한정되지 않고, 예를 들어 교착어와 교착어, 교착어와 굴절어, 굴절어와 굴절어 간의 다른 원문 언어와 목표 언어 사이에서도 활용될 수 있다.
도 8a는 원문 언어가 영어이고 목표언어가 일본어인 소번역메모리를 포함하는, 도 3d에 대응하는 번역 메모리의 실시예이고, 도 8b는 원문 언어가 영어이고 목표언어가 일본어인 소번역메모리를 포함하는, 도 3e에 대응하는 번역 메모리의 실시예이다.
도 8c는 원문 언어가 영어이고 목표언어가 중국어인 소번역메모리를 포함하는, 도 3d에 대응하는 번역 메모리의 실시예이고, 도 8d는 원문 언어가 영어이고 목표언어가 중국어인 소번역메모리를 포함하는, 도 3e에 대응하는 번역 메모리의 실시예이다.
한국어와, 일본어 및 중국어 사이의 파싱 단위를 생성하는데 있어서의 차이점은 띄어쓰기가 없기 때문에 한국어와 같이 어절단위로 소번역 메모리 위치정보를 지정하는 것이 아니라, 글자단위로 소번역문위치정보를 지정하여 소번역메모리를 포함하는 번역메모리를 지정해야 한다는 것이다.
이와 같이, 일본어 및 중국어 뿐만 아니라, 독일어, 스페인어 등 다른 언어들도 본 발명의 소번역메모리를 포함하는 번역 메모리를 적용시킬 수 있다.

Claims (20)

  1. 원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리(9)(이하, "소번역메모리"라고 함)를 포함하는 번역 메모리로서,
    상기 소번역메모리는 상기 원문 문장을 번역 소단위로 세분화한 소번역단위(2) 및 상기 소번역단위에 대응하는 번역 문장 내의 번역 부분인 소번역문(7)의 쌍을 포함하되,
    상기 번역 메모리는 상기 번역 메모리 내에서 상기 소번역메모리를 특정하는 소단위 대응관계지시자(8)를 포함하고, 상기 소단위 대응관계지시자(8)에 의해 상기 번역 메모리 내에서 상기 소번역메모리의 소번역단위 및 소번역문 쌍의 대응 관계가 표시되는,
    소번역메모리를 포함하는 번역 메모리.
  2. 제1 항에 있어서,
    상기 소단위 대응관계지시자(8)는
    상기 소번역단위의 원문 문장 내 위치를 나타내는 정보인 소번역단위위치정보(8'), 및
    상기 소번역문의 번역 문장 내 위치를 나타내는 정보인 소번역문위치정보(8")를 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  3. 제2 항에 있어서,
    상기 번역 메모리의 원문 문장은 복수 개의 소번역단위들로 구성되고, 상기 번역메모리의 번역 문장은 상기 복수 개의 소번역단위들에 대응하는 소번역문들로 구성되고,
    상기 소번역단위들 각각에 대한 소번역문들의 대응관계가 소단위 대응관계표시자들에 의해 표시되고,
    상기 소단위 대응관계표시자들의 소번역단위위치정보들은 상기 소번역단위들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고,
    상기 소단위 대응관계표시자들의 소번역문위치정보들은 상기 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들을 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  4. 제3 항에 있어서,
    상기 소번역단위들 각각의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들은 상기 소번역단위들 각각의 첫 문자의 시작위치, 및 상기 소번역단위들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시하고,
    상기 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 상기 소번역문들 각각의 첫 문자의 시작위치, 및 상기 소번역문들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시하는,
    소번역메모리를 포함하는 번역 메모리.
  5. 제4 항에 있어서,
    상기 소번역문들 각각의 번역 문장 내 위치를 지시할 수 있는 숫자들은 번역 문장 내에서 소번역문들 각각의 정렬 순서를 나타내는 위치를 더 지시하는,
    소번역메모리를 포함하는 번역 메모리.
  6. 제5 항에 있어서,
    상기 소단위 대응관계표시자들의 소번역문위치정보들은 정렬 순서에 의해 상기 소번역메모리들의 소번역문들을 정렬할 때 인접하는 두 개의 소번역문들 중 앞쪽에 위치한 소번역문(이하 "피삽입 소번역문"이라고 함)에 상기 피삽입 소번역문 내로 뒷쪽에 위치한 소번역문(이하 "삽입 소번역문"이라고 함)이 삽입되는 위치를 지시하는 삽입위치지시자(5)를 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  7. 제6 항에 있어서,
    상기 피삽입 소번역문은 상기 삽입위치지시자(5)에 의해 상기 피삽입 소번역문이 삽입위치지시자(5)의 위치를 기준으로 전반부(8a) 및 후반부(8b)로 특정되며, 상기 피삽입 소번역문의 번역 문장 내 위치를 지시할 수 있는 숫자들은 상기 피삽입 소번역문의 전반부(8a)의 첫 문자의 시작위치 및 상기 전반부(8a)의 마지막 문자의 종료위치 중 하나 이상, 그리고 상기 후반부(8b)의 첫 문자의 시작위치 및 상기 후반부(8b)의 마지막 문자의 종료위치 중 하나 이상을 지시하는,
    소번역메모리를 포함하는 번역 메모리.
  8. 제2 항에 있어서,
    상기 번역 메모리의 원문 문장은 복수 개의 소번역단위들로 구성되고,
    상기 복수 개의 소번역단위들 중 일부에 대응하는 소번역문들이 형성되고,
    상기 일부 소번역단위와 상기 일부 소번역단위에 대한 소번역문 간의 대응관계가 소단위 대응관계표시자에 의해 표시되고,
    상기 소단위 대응관계표시자의 소번역단위위치정보는 상기 일부 소번역단위의 원문 문장 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고,
    상기 소단위 대응관계표시자의 소번역문위치정보는 상기 소번역문의 번역 문장 내 위치를 지시할 수 있는 숫자들을 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  9. 제1 항 내지 제8항에 따른 소번역메모리를 포함하는 번역 메모리를 형성한 후, 상기 소번역메모리를 포함하는 번역 메모리로부터, 상기 목표언어가 원문 원어가 되고 상기 원문언어가 목표언어가 되는 역방향 번역에 적용하기 위한 소번역메모리를 포함하는 역방향 번역메모리으로서,
    상기 번역 메모리의 소번역단위에 대응하는 소번역문이 상기 역방향 번역메모리의 소번역단위가 되고, 상기 번역 메모리의 소번역단위가 상기 역방향 번역메모리의 소번역문이 되며,
    상기 소번역메모리를 포함하는 번역메모리의 소번역문위치정보가 역방향 번역메모리의 소번역단위위치정보가 되고, 상기 소번역메모리를 포함하는 번역메모리의 소번역단위위치정보가 상기 역방향 번역메모리의 소번역문위치정보가 되는,
    소번역메모리를 포함하는 역방향 번역메모리.
  10. 제1항 내지 제8항에 따른 소번역메모리를 포함하는 번역메모리 또는 제9 항에 따른 소번역메모리를 포함하는 역방향 번역 메모리를 기록한 컴퓨터 판독가능한 저장 매체.
  11. 원문언어로 된 원문 문장 및 목표언어로 된 번역 문장의 쌍을 포함하며 소단위 번역메모리(이하, " 1차 소번역메모리"라고 함)를 포함하는 번역 메모리로서,
    상기 1차 소번역메모리는 상기 원문 문장을 번역 소단위로 세분화한 1차 소번역단위(102) 및 상기 1차 소번역단위(102)에 대응하는 번역 문장 내의 번역 부분인 1차 소번역문(107)의 쌍을 포함하되,
    상기 번역 메모리는 상기 번역 메모리 내에서 상기 1차 소번역메모리를 특정하는 1차 소단위 대응관계지시자(108)를 포함하고, 상기 1차 소단위 대응관계지시자(108)에 의해 상기 번역 메모리 내에서 상기 1차 소번역메모리의 1차 소번역단위(102) 및 1차 소번역문(107) 쌍의 대응 관계가 표시되고,
    상기 1차 소번역메모리는 상기 1차 소번역메모리를 추가로 세분화한 추가적인 소번역메모리인 2차 소번역메모리를 포함할 수 있으며, 상기 2차 소번역메모리를 포함하는 경우, 상기 1차 소번역메모리의 1차 소번역단위(102)를 추가로 세분화한 번역 소단위인 2차 소번역단위(202) 및 상기 2차 소번역단위(202)에 대응하는 번역 부분인 2차 소번역문(207)의 쌍을 포함하되,
    상기 2차 소번역메모리는 상기 2차 소번역메모리를 특정하는 2차 소단위 대응관계지시자(208)를 포함하고, 상기 2차 소단위 대응관계지시자(208)는 상기 2차 소번역메모리의 2차 소번역단위(202) 및 2차 소번역문(207) 쌍의 대응 관계를 나타내는,
    소번역메모리를 포함하는 번역 메모리.
  12. 제11 항에 있어서,
    상기 2차 소단위 대응관계지시자(208)는
    상기 2차 소번역단위(202)의 1차 소번역단위(102) 내 위치를 나타내는 정보인 2차 소번역단위위치정보(208')와
    상기 2차 소번역문의 1차 소번역문 내 위치를 나타내는 정보인 2차 소번역문위치정보(208")를 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  13. 제12 항에 있어서,
    상기 1차 소번역메모리의 1차 소번역단위(102)는 복수 개의 2차 소번역단위(202)들로 구성되고, 상기 1차 번역메모리의 1차 소번역문은 상기 복수 개의 2차 소번역단위(202)들에 대응하는 2차 소번역문들로 구성되고,
    상기 2차 소번역단위(202)들과 2차 소번역문들 간의 대응관계가 2차 소단위 대응관계표시자들에 의해 표시되고,
    상기 2차 소단위 대응관계표시자들의 소번역단위위치정보들은 상기 2차 소번역단위(202)들 각각의 1차 소번역단위(102) 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하고,
    상기 2차 소단위 대응관계표시자들의 소번역문위치정보들은 상기 2차 소번역문들 각각의 1차 소번역문 내 위치를 지시할 수 있는 숫자들을 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  14. 제13 항에 있어서,
    상기 2차 소번역단위(202)들 각각의 1차 소번역단위(102) 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들은 상기 2차 소번역단위(202)들 각각의 첫 문자의 시작위치, 및 상기 2차 소번역단위(202)들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시하고,
    상기 2차 소번역문들 각각의 1차 소번역문 내 위치를 지시할 수 있는 숫자들은 상기 2차 소번역문들 각각의 첫 문자의 시작위치, 및 상기 2차 소번역문들 각각의 마지막 문자의 종료위치 중 하나 이상을 지시하는,
    소번역메모리를 포함하는 번역 메모리.
  15. 제14 항에 있어서,
    상기 2차 소번역문들 각각의 1차 소번역문 내 위치를 지시할 수 있는 숫자들은 상기 1차 소번역문 내에서 2차 소번역문들 각각의 정렬 순서를 나타내는 위치를 더 지시하는,
    소번역메모리를 포함하는 번역 메모리.
  16. 제15 항에 있어서,
    상기 2차 소단위 대응관계표시자들의 소번역문위치정보들은 정렬 순서에 의해 상기 2차 소번역메모리들의 2차 소번역문들을 정렬할 때 인접하는 두 개의 2차 소번역문들 중 앞쪽에 위치한 2차 소번역문(이하 "피삽입 2차 소번역문"이라고 함)은 상기 피삽입 2차 소번역문 내로 뒷쪽에 위치한 2차 소번역문(이하 "삽입 2차 소번역문"이라고 함)이 삽입되는 위치를 지시하는 삽입위치지시자(5)를 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  17. 제16 항에 있어서,
    상기 피삽입 2차 소번역문은 상기 삽입위치지시자(5)에 의해 상기 피삽입 2차 소번역문이 삽입위치지시자(5)의 위치를 기준으로 전반부(8a) 및 후반부(8b)로 특정되며, 상기 피삽입 2차 소번역문의 1차 소번역문 내 위치를 지시할 수 있는 숫자들은 상기 피삽입 2차 소번역문의 전반부의 첫 문자의 시작위치 및 상기 전반부(8a)의 마지막 문자의 종료위치 중 하나 이상, 그리고 상기 후반부(8b)의 첫 문자의 시작위치 및 상기 후반부의 마지막 문자의 종료위치 중 하나 이상를 지시하는,
    소번역메모리를 포함하는 번역 메모리.
  18. 제12 항에 있어서,
    상기 1차 소번역메모리의 1차 소번역단위(102)는 복수 개의 2차 소번역단위(202)들로 구성되고, 상기 복수 개의 2차 소번역단위(202)들 중 일부에 대응하는 2차 소번역문이 형성되고,
    상기 일부 2차 소번역단위(202)와 상기 일부 2차 소번역단위(202)에 대한 2차 소번역문 간의 대응관계가 2차 소단위 대응관계표시자에 의해 표시되고,
    상기 2차 소단위 대응관계표시자의 소번역단위위치정보는 상기 일부 2차 소번역단위(202)의 1차 소번역단위(102) 내 소단위로 세분화된 위치를 지시할 수 있는 숫자들을 포함하는,
    소번역메모리를 포함하는 번역 메모리.
  19. 제11 항 내지 제18항에 따른 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리를 형성한 후, 상기 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리로부터, 상기 목표언어가 원문 원어가 되고 상기 원문언어가 목표언어가 되는 역방향 번역에 적용하기 위한 소번역메모리를 포함하는 역방향 번역메모리로서,
    상기 번역 메모리의 1차 소번역단위 및 2차 소번역단위에 대응하는 1차 소번역문 및 2차 소번역문이 상기 역방향 번역메모리의 1차 소번역단위 및 2차 소번역단위가 되고, 상기 번역 메모리의 1차 소번역단위 및 2차 소번역단위가 상기 역방향 번역메모리의 1차 소번역문 및 2차 소번역문이 되며,
    상기 1차 소번역메모리를 포함하는 번역메모리의 1차 소번역문위치정보가 역방향 번역메모리의 1차 소번역단위위치정보가 되고, 상기 1차 소번역메모리를 포함하는 번역메모리의 1차 소번역단위위치정보가 상기 역방향 번역메모리의 1차 소번역문위치정보가 되며,
    상기 2차 소번역메모리를 포함하는 번역메모리의 2차 소번역문위치정보가 역방향 번역메모리의 2차 소번역단위위치정보가 되고, 상기 2차 소번역메모리를 포함하는 번역메모리의 2차 소번역단위위치정보가 상기 역방향 번역메모리의 2차 소번역문위치정보가 되는,
    소번역메모리를 포함하는 역방향 번역메모리.
  20. 제11항 내지 제18항에 따른 1차 소번역메모리 및 2차 소번역메모리를 포함하는 번역 메모리 또는 제19 항에 따른 소번역메모리를 포함하는 역방향 번역 메모리를 기록한 컴퓨터 판독가능한 저장 매체.
PCT/KR2015/009779 2014-09-18 2015-09-17 소번역메모리를 포함하는 번역 메모리, 그를 이용한 역방향 번역메모리 및 이들을 기록한 컴퓨터 판독가능한 저장매체 WO2016043539A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2014-0124238 2014-09-18
KR20140124238 2014-09-18

Publications (1)

Publication Number Publication Date
WO2016043539A1 true WO2016043539A1 (ko) 2016-03-24

Family

ID=55533507

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2015/009779 WO2016043539A1 (ko) 2014-09-18 2015-09-17 소번역메모리를 포함하는 번역 메모리, 그를 이용한 역방향 번역메모리 및 이들을 기록한 컴퓨터 판독가능한 저장매체

Country Status (2)

Country Link
KR (1) KR20160033641A (ko)
WO (1) WO2016043539A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160138837A (ko) * 2015-05-26 2016-12-06 주식회사 케이티 음성 인식 및 번역 시스템,방법 및 컴퓨터 프로그램

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080015842A1 (en) * 2002-11-20 2008-01-17 Microsoft Corporation Statistical method and apparatus for learning translation relationships among phrases
KR20120018687A (ko) * 2010-08-23 2012-03-05 에스케이플래닛 주식회사 토큰 분리 및 번역 과정을 통합한 통합 디코딩 장치 및 그 방법
KR20120048101A (ko) * 2010-11-05 2012-05-15 에스케이플래닛 주식회사 병렬 말뭉치를 이용한 동사구 번역 패턴 구축 장치 및 그 방법
KR20120048139A (ko) * 2010-11-05 2012-05-15 한국전자통신연구원 자동 번역 장치 및 그 방법
US20120253785A1 (en) * 2011-04-03 2012-10-04 Microsoft Corporation Translation of multilingual embedded phrases

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080015842A1 (en) * 2002-11-20 2008-01-17 Microsoft Corporation Statistical method and apparatus for learning translation relationships among phrases
KR20120018687A (ko) * 2010-08-23 2012-03-05 에스케이플래닛 주식회사 토큰 분리 및 번역 과정을 통합한 통합 디코딩 장치 및 그 방법
KR20120048101A (ko) * 2010-11-05 2012-05-15 에스케이플래닛 주식회사 병렬 말뭉치를 이용한 동사구 번역 패턴 구축 장치 및 그 방법
KR20120048139A (ko) * 2010-11-05 2012-05-15 한국전자통신연구원 자동 번역 장치 및 그 방법
US20120253785A1 (en) * 2011-04-03 2012-10-04 Microsoft Corporation Translation of multilingual embedded phrases

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160138837A (ko) * 2015-05-26 2016-12-06 주식회사 케이티 음성 인식 및 번역 시스템,방법 및 컴퓨터 프로그램
KR102385851B1 (ko) 2015-05-26 2022-04-13 주식회사 케이티 음성 인식 및 번역 시스템,방법 및 컴퓨터 프로그램

Also Published As

Publication number Publication date
KR20160033641A (ko) 2016-03-28

Similar Documents

Publication Publication Date Title
WO2020044290A1 (ko) 특허 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
WO2015170945A1 (ko) 영어 어순 지도를 이용한 영어 학습방법 및 그 시스템
WO2018034426A1 (ko) 커널 rdr을 이용한 태깅 말뭉치 오류 자동수정방법
WO2011025200A9 (ko) 확장키를 이용한 정보입력시스템 및 정보입력방법
WO2010036012A2 (ko) 인터넷을 이용한 의견 검색 시스템, 의견 검색 및 광고 서비스 시스템과 그 방법
WO2012074338A2 (ko) 자연어 및 수학식 처리 방법과 그를 위한 장치
WO2021071012A1 (ko) 무매체 신원 확인을 통한 상품 구매 서비스 제공 장치 및 방법
WO2016006745A1 (ko) 클라우드 서버, 제어 기기, 출력 기기, 이들을 포함하는 클라우드 시스템 및 기기 간 페어링 방법
WO2011137724A1 (zh) 基于语义逻辑的类自然语言人机对话装置
WO2020222539A1 (en) Hub device, multi-device system including the hub device and plurality of devices, and method of operating the same
WO2022065811A1 (en) Multimodal translation method, apparatus, electronic device and computer-readable storage medium
WO2019177182A1 (ko) 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법
WO2018101534A1 (ko) 전자 문서 컨버팅 방법 및 이를 수행하는 시스템
WO2021029627A1 (en) Server that supports speech recognition of device, and operation method of the server
WO2020197257A1 (ko) 가시적 표현 요소를 이용한 번역 방법 및 그 장치
WO2016060409A2 (ko) 전자펜, 전자펜과 연동되는 전자기기 및 전자기기의 제어방법
WO2016043539A1 (ko) 소번역메모리를 포함하는 번역 메모리, 그를 이용한 역방향 번역메모리 및 이들을 기록한 컴퓨터 판독가능한 저장매체
WO2017188749A9 (ko) Ic 칩 테스트 장치, ic 칩 테스트 방법, 및 ic 칩 테스트 시스템
WO2021075910A1 (en) Electronic device and method for operating screen capturing by electronic device
WO2017094967A1 (ko) 자연 언어 처리 스키마 및 그 지식 데이터베이스 구축 방법 및 시스템
WO2023191206A1 (ko) 변수 속성에 기반한 탐색적 데이터 분석 자동화 시스템과 방법
WO2012115492A2 (ko) 확장키를 이용한 정보입력시스템 및 정보입력방법
WO2022005238A1 (ko) 문자 입력 방법
WO2014069969A2 (ko) 세미콤팩트 키보드 및 방법
WO2015088291A1 (ko) 장문 번역 서비스 장치 및 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15842418

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15842418

Country of ref document: EP

Kind code of ref document: A1