KR20020020409A - 다양한 포맷을 갖는 문서번역이 가능한 기계번역장치 - Google Patents

다양한 포맷을 갖는 문서번역이 가능한 기계번역장치 Download PDF

Info

Publication number
KR20020020409A
KR20020020409A KR1020000053541A KR20000053541A KR20020020409A KR 20020020409 A KR20020020409 A KR 20020020409A KR 1020000053541 A KR1020000053541 A KR 1020000053541A KR 20000053541 A KR20000053541 A KR 20000053541A KR 20020020409 A KR20020020409 A KR 20020020409A
Authority
KR
South Korea
Prior art keywords
additional information
text
document
buffer
information
Prior art date
Application number
KR1020000053541A
Other languages
English (en)
Inventor
서은주
최종환
Original Assignee
정규석
주식회사데이콤
조용범
주식회사 유니소프트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정규석, 주식회사데이콤, 조용범, 주식회사 유니소프트 filed Critical 정규석
Priority to KR1020000053541A priority Critical patent/KR20020020409A/ko
Publication of KR20020020409A publication Critical patent/KR20020020409A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

본 발명은 여러가지 포맷의 문서를 번역할 수 있는 기계번역장치에 관한 것이다. 이러한 기계번역장치는 서로 다른 n가지 포맷의 문서에 대하여 해당 포맷에 맞는 특수한 처리를 수행하여 구분된 텍스트와 부가정보를 입력으로 하고, 텍스트와 부가정보를 추출하여 상기 부가정보 대신에 해당하는 공통파일포맷을 부가하여 출력하고, 상기 부가정보를 별도의 버퍼에 저장하는 텍스트/부가정보 추출부; 상기 텍스트/부가정보 추출부에서 추출된 텍스트와 부가정보의 위치정보를 입력으로 하며, 상기 추출된 텍스트만 번역을 행하는 번역엔진; 및 상기 번역엔진에서 번역된 텍스트와 상기 텍스트/부가정보 추출부에 저장되어 있는 부가정보를 입력으로 하며, 상기 부가정보의 위치정보를 이용하여 상기 번역된 텍스트와 부가정보를 재조립하는 텍스트/부가정보 재조립부로 이루어진다.

Description

다양한 포맷을 갖는 문서번역이 가능한 기계번역장치{Machine translation apparatus capable of translating documents in various formats}
본 발명은 기계번역장치에 관한 것으로서, 특히 문서포맷이 서로 다른 포맷의 각종 문서를 텍스트와 부가정보로 분리한 다음, 부가정보 대신 공통파일포맷을 부가하고, 추출된 텍스트만을 번역하여 다시 부가정보와 재조립하는 기계번역장치에 관한 것이다.
최근 국가간의 교류가 증대하고, 정보통신망이 확대됨에 따라서 제 1 언어 즉, 원시언어(source language)의 문장을 제 2 언어 즉, 목적언어(target language)의 문장으로 번역하는 기계번역장치들의 필요성이 점점 증가하고 있다. 이러한 기계번역장치들은 입력 원문에 대하여 형태소 해석, 구문 해석, 변환 및 생성의 일반적인 단계를 거쳐서 다른 언어의 원문으로 번역하는 것을 목적으로 하고 있다.
종래의 기계번역 방식으로는 문서의 분석정도에 따라 직접방식(direct method), 변환방식(transfer method), 그리고 피봇방식(pivot method) 등이 있다. 여기서, 직접방식은 원시언어와 목적언어 사이의 직접적인 대응으로 번역이 이루어지고, 변환방식은 원시언어와 목적언어 각각에 대해 2가지 형태의 중간표현을 정의하고 분석, 변환, 생성단계를 통해 번역이 이루어지고, 피봇방식은 원시언어와 목적언어에 대해 하나의 중립표현을 정의하여 크게 분석단계와 생성단계의 2단계를 거쳐 번역이 이루어진다. 한편, 90년대 들어서 발표된 기계번역 방식들 중에는 지식기반 기계번역, 예제기반 기계번역, 말뭉치 기반 기계번역, 통계적 방법에 기반한 기계번역 등이 있는데, 이들은 미리 번역된 과정으로부터 얻은 지식이나 번역예제들, 혹은 그 통계를 이용하여 번역을 행한다.
그러나, 지금까지의 문서 번역작업은 주로 단순한 텍스트와 웹 번역을 위한 마크업 언어에 한정되어 있었다. 하지만 각종 워드 프로세서 및 전자문서 포맷의 등장에 따라 다양한 문서포맷에 대한 번역요구가 증가하기 시작했고, 이를 효과적으로 지원하기 위해서는 다양한 포맷의 문서를 단일한 방식으로 처리할 수 있는 방법이 필요해졌다.
따라서, 본 발명의 목적은 상술한 필요성을 충족시키기 위한 것으로서, 문서포맷이 서로 다른 포맷의 각종 문서를 텍스트와 부가정보로 분리한 다음, 부가정보 대신 공통파일포맷을 부가하고, 추출된 텍스트만을 번역하여 다시 부가정보와 재조립하는 기계번역장치를 제공하는데 있다.
상기 목적을 달성하기 위하여 본 발명에 따른 기계번역장치는 서로 다른 n가지 포맷의 문서에 대하여 해당 포맷에 맞는 특수한 처리를 수행하여 구분된 텍스트와 부가정보를 입력으로 하고, 텍스트와 부가정보를 추출하여 상기 부가정보 대신에 해당하는 공통파일포맷을 부가하여 출력하고, 상기 부가정보를 별도의 버퍼에 저장하는 텍스트/부가정보 추출부; 상기 텍스트/부가정보 추출부에서 추출된 텍스트와 부가정보의 위치정보를 입력으로 하며, 상기 추출된 텍스트만 번역을 행하는 번역엔진; 및 상기 번역엔진에서 번역된 텍스트와 상기 텍스트/부가정보 추출부에 저장되어 있는 부가정보를 입력으로 하며, 상기 부가정보의 위치정보를 이용하여 상기 번역된 텍스트와 부가정보를 재조립하는 텍스트/부가정보 재조립부를 포함하는 것을 특징으로 한다.
이에 따르면, 마크업언어, 프리젠테이션 파일언어 및 전자문서언어 등 각종 포맷의 언어에 공통으로 적용될 수 있는 연산은 문서처리계층으로 처리하고, 포맷별로 특수처리를 요하는 연산은 문서처리계층 이전에 별도의 포맷처리기로 분석함으로써 서로 다른 포맷의 각종 문서를 단일한 방법으로 분석한 다음 번역하는 것이 가능하다.
도 1은 본 발명에 따른 기계번역장치의 개념을 설명하는 블럭도,
도 2는 도 1에 있어서 문서처리부의 세부 구성을 설명하는 블럭도,
도 3은 도 1에 있어서 텍스트 및 부가정보 저장과정을 설명하는 흐름도,
도 4는 도 1에 있어서 텍스트 및 부가정보 합성과정을 설명하는 흐름도, 및
도 5는 본 발명에 따른 기계번역장치의 동작을 설명하는 도면이다.
* 도면의 주요부분에 대한 부호의 설명
11,16 ... 문서처리부 12 ... 텍스트 추출부
13 ... 부가정보 저장부 14 ... 번역엔진
15 ... 텍스트/부가정보 합성부 21 ... DCO 처리기
22 ... PDF 처리기 23 ... PPT 처리기
24 ... HTML 처리기 25 ... 해당하는 처리기
10 ... 문서처리계층
이하 첨부된 도면을 참조하여 본 발명의 바람직한 일실시예에 대하여 상세히 설명하기로 한다.
기계번역장치에 있어서, 각종 문서 번역시 지원해 주어야 할 포맷은 HTML(Hyper-Text Markup Language), XML(eXtensible Markup Language), SGML(Standard General Markup Language) 등과 같은 마크업 언어와, PPT 및 XLS 등과 같은 슬라이드 혹은 스프레드시트 프리젠테이션 포맷과, DOC 및 HWP 등과 같은워드프로세서용 언어, PS(PostScript), Acrobat 파일용 PDF 등의 전자문서 포맷 등이 있다. 이러한 문서포맷들은 텍스트를 내부적으로 저장하고 있기 때문에 텍스트와 이외의 바이너리 정보 즉, 부가정보를 추출해 낸 후, 텍스트만 번역한 다음, 부가정보를 합성하여 원래의 문서형태로 재조립이 가능하다.
이를 위한 본 발명에 따른 기계번역장치가 도 1에 도시되어 있다. 본 발명에 따른 기계번역장치는 제 1 문서처리부(11), 텍스트 추출부(12), 부가정보 저장부(13), 번역엔진(14), 텍스트 재조립부(15) 및 제 2 문서처리부(16)으로 이루어진다. 여기서, 텍스트 추출부(12), 부가정보 저장부(13) 및 텍스트 재조립부(15)는 문서처리계층(10)을 형성한다.
도 1에 있어서, 제 1 문서처리부(11)은 DOC, PPT, HTML, PDF 등의 포맷으로 생성된 파일에 대하여 각 파일포맷에 따라 텍스트와 부가정보를 별도로 분리한다. 이 제 1 문서처리부(11)는 도 2를 참조하면 DOC 처리기(21), PDF 처리기(22), PPT 처리기(23), HTML 처리기(24) 및 다른 포맷에 해당하는 처리기(25) 로 이루어진다.
즉, 서로 다른 여러가지의 파일포맷을 지원하기 위해서는 먼저 각 문서포맷에 대하여 특수처리를 요하는 연산은 각종 문서처리기(21,22,23,24,25)에서 분석을 행하고, 각종 문서의 포맷에 공통으로 적용될 수 있는 연산은 하나의 문서처리계층(10)으로 분리시켜 행하게 된다.
이 문서처리계층(10)에서는 첫째, 각종 문서처리기(21,22,23,24,25)로부터입력되는 데이타가 부가정보인지 텍스트인지 판별하는 연산, 둘째, 현재 입력데이타가 문서의 끝인지 판별하는 연산, 셋째, 입력데이타 중 현재의 부가정보와 다음 부가정보 사이의 텍스트를 추출하여 저장하는 연산, 넷째, 추출된 부가정보를 저장하는 연산을 지원한다.
다시 도 1로 돌아가서, 텍스트 추출부(12)에서 텍스트를 추출할 때에는 각 파일 포맷에 따라 서로 다른 모듈을 사용할 수 있도록 한다. 원본문서가 HTML 언어로 작성된 경우의 부가정보는 각 파일에 대해 다음 표 1과 같은 형태로 저장된다.
부가정보의 번호 부가정보의 길이 부가정보
1 32 <HTML>\n<META>...
... ... ...
1000 7 </HTML>\n
이 부가정보를 추출하는 과정을 도 5를 참조하여 설명하면 다음과 같다. 여기서, 입력은 일정한 포맷에 의해 텍스트와 포맷정보를 유지하고 있는 문서이고, 출력은 문서의 포맷정보를 추출한 버퍼, 이스케이프 시퀀스(escape sequence)로 포맷된 번역 스트링이 된다.
텍스트 및 부가정보를 추출하는 전반적인 과정은 제 1 제어부(52)에 의해 다음과 같이 제어된다. 첫째, 입력버퍼(51)에 저장되어 있는 현재 문서내 위치 포인터를 문서의 처음으로 맞추고 문서정보버퍼(53)를 초기화한다. 둘째, 입력버퍼(51)에 저장되어 있는 현재의 문서에 해당하는 문서의 핸들러를 얻어온다. 셋째, 지정한 문서의 핸들러에 따라 문서의 끝이 아닌 동안 다음 제 1 내지 제 5 단계를 반복수행한다. 먼저, 부가정보를 추출하고(제 1 단계), 추출한 부가정보를 부가정보 번호, 길이와 함께 문서정보버퍼(53)에 저장하고(제 2 단계), 결과버퍼(54)의 부가정보 위치에 이스케이프 시퀀스(escape sequence)를 저장하고(제 3 단계), 텍스트를 추출하고(제 4 단계), 추출한 텍스트를 결과버퍼(54)의 이스케이프 시퀀스에 이어 저장한다(제 5 단계). 넷째, 문서를 검사하여 문서의 끝인 경우 문서의 끝을 알리는 이스케이프 시퀀스(escape sequence)를 결과 버퍼(54)에 덧붙인다.
이와 같은 추출된 텍스트 및 부가정보 저장과정을 도 3 및 도 5를 참조하여 좀 더 상세히 설명하기로 한다.
도 3을 참조하면, 상기 각 처리기(21~25)로부터 출력되는 데이타가 텍스트정보인지 여부를 판단하고(제 31 단계) 텍스트정보이면 결과버퍼(54)에 저장하고(제 32 단계), 텍스트정보가 아니면 부가정보이므로 이 부가정보를 문서정보버퍼(53)에 저장한다(제 33 단계). 한편, 제 34 단계에서는 문서의 핸들러를 감시하여 문서의 끝인지 여부를 판단하고, 문서의 끝이 아닌 경우 제 31 단계로 복귀하고 문서의 끝인 경우 종료한다.
다시 도 1로 돌아가서, 번역엔진(14)은 공통 파일 포맷 즉, 문서처리계층(10)에서 각종의 부가정보에 대하여 정의한 이스케이프 시퀀스(escape sequence)들을 무시하고 번역을 할 수 있도록 수정되어야 하며, 텍스트 추출부(12)에서 추출한 텍스트와 부가정보의 위치정보를 공급받아 추출된 텍스트만을 번역한다.
텍스트 재조립부(15)는 번역엔진(14)에서 번역된 텍스트와 부가정보의 위치가 기록되어 있는 파일을 문서정보버퍼(도 5의 57)에 이미 저장한 부가정보를 이용해 원래의 문서파일로 재조립한다. 문서정보 파일과 텍스트, 이스케이프 시퀀스(escape sequence)를 번역한 이후 원래의 문서파일로 재조립하는 과정은 다음과 같다. 이때, 입력은 번역한 텍스트와 이스케이프 시퀀스(escape sequence)로 포맷된 스트링, 문서정보 버퍼(도 5의 57)이고, 출력은 원래의 문서에서 텍스트만을 번역한 포맷된 문서 파일이 된다.
텍스트와 부가정보를 합성하는 전반적인 과정은 제 2 제어부(56)에 의해 다음과 같이 제어된다. 첫째, 현재 위치에 대한 포인터를 입력버퍼(55)의 처음으로 한다. 둘째, 입력버퍼(55)에서 현재 위치의 스트링을 읽어온다. 셋째, 현재 읽어온 정보에 따라 다음 제 1 및 제 2 단계를 수행한다. 즉, 현재 위치의 정보가 번역한 텍스트이면 결과버퍼(58)에 현재의 정보를 기록한다(제 1 단계). 현재 위치의 정보가 이스케이프 시퀀스(escape sequence)이면 문서정보버퍼(57)에서 읽어온정보를 결과버퍼(58)에 기록하고, 문서정보버퍼(57)에 남아있는 내용이 더 없으면 결과버퍼(58)를 출력한다(제 2 단계).
이와 같이, 번역된 텍스트 및 부가정보 합성과정을 도 4 및 도 5를 참조하여 좀 더 상세히 설명하기로 한다.
도 4에 있어서, 제 41 단계에서는 현재 위치의 정보가 이스케이프 시퀀스인지를 판단하여 이스케이프 시퀀스이면 문서정보버퍼(57)에서 읽어온 정보를 결과버퍼(58)에 저장하고, 이스케이프 시퀀스가 아니면 번역된 텍스트이므로 결과버퍼(58)에 현재 정보를 기록한 다음 다음 글자로 이동한다(제 43 단계). 제 44 단계에서는 텍스트의 끝인지를 판단하여 텍스트의 끝이 아니면 제 41 단계로 복귀하고 텍스트의 끝이면 종료한다.
모든 문서의 포맷에 유연하게 대처하기 위해서는 번역용 텍스트의 정보와 이외의 부가적인 정보를 공통으로 기록할 수 있는 파일 포맷이 필요하다. 텍스트를 추출하는 과정에서 필요한 정보들은 이미 부가정보를 기록하였으므로 부가정보가 기록될 위치정보를 필요로 한다. 이를 문서처리계층(도 1의 10)에서는 다음과 같이 정의한다. 'Escape sequence 1' 은 부가정보가 기록되어야 할 자리임을 표시하고, 'Escape sequence 2' 는 문서의 끝임을 표시한다. 그 결과, 문서는 텍스트 + escape sequence 1 + 텍스트 + escape sequence 1 + ... + 텍스트 + escape sequence 2 의 스트링으로 나타낼 수 있다.
다시 도 1로 돌아가서, 제 2 문서처리부(16)에서는 상기와 같은 포맷으로 재조립된 텍스트와 부가정보를 원본문서의 포맷에 해당하는 처리기로 입력하여 결과문서를 생성한다.
상술한 바와 같이 본 발명에 따르면, 마크업언어, 프리젠테이션 파일언어 및 전자문서언어 등 각종 포맷별로 특수처리를 요하는 연산은 별도의 포맷처리기로 분석한 다음, 각종 포맷에 공통으로 적용될 수 있는 연산은 문서처리계층으로 처리함으로써 서로 다른 포맷의 각종 문서를 단일한 방법으로 분석한 다음 번역할 수 있다.

Claims (3)

  1. 서로 다른 n가지 포맷의 문서에 대하여 해당 포맷에 맞는 특수한 처리를 수행하여 구분된 텍스트와 부가정보를 입력으로 하고, 텍스트와 부가정보를 추출하여 상기 부가정보 대신에 해당하는 공통파일포맷을 부가하여 출력하고, 상기 부가정보를 별도의 버퍼에 저장하는 텍스트/부가정보 추출부;
    상기 텍스트/부가정보 추출부에서 추출된 텍스트와 부가정보의 위치정보를 입력으로 하며, 상기 추출된 텍스트만 번역을 행하는 번역엔진; 및
    상기 번역엔진에서 번역된 텍스트와 상기 텍스트/부가정보 추출부에 저장되어 있는 부가정보를 입력으로 하며, 상기 부가정보의 위치정보를 이용하여 상기 번역된 텍스트와 부가정보를 재조립하는 텍스트/부가정보 재조립부를 포함하는 것을 특징으로 하는 다양한 포맷을 갖는 문서번역이 가능한 기계번역장치.
  2. 제 1 항에 있어서, 상기 텍스트/부가정보 추출부는
    서로 다른 n가지 포맷의 문서에 대하여 해당 포맷에 맞는 특수한 처리를 수행하여 구분된 텍스트와 부가정보를 입력하는 제 1 입력버퍼;
    상기 제 1 입력버퍼로부터 현재 입력되는 데이타가 독출된 데이타가 텍스트인지 부가정보인지 판별하고, 현재 입력데이타가 문서의 끝인지 판별하고, 입력데이타 중 현재의 부가정보와 다음 부가정보 사이의 텍스트를 추출하고, 추출된 부가정보를 저장하는 한편, 부가정보를 대신하는 공통파일포맷을 정의하는 제 1 제어부;
    상기 제 1 제어부의 제어하에, 상기 제 1 입력버퍼로부터 독출된 데이타 중 부가정보를 저장하는 문서정보버퍼; 및
    상기 제 1 제어부의 제어하에, 텍스트와 상기 부가정보의 위치에 상기 공통파일포맷을 저장하는 결과버퍼로 이루어지는 것을 특징으로 하는 다양한 포맷을 갖는 문서번역이 가능한 기계번역장치
  3. 제 2 항에 있어서, 상기 텍스트/부가정보 재조립부는
    상기 번역엔진으로부터 출력되는 번역된 텍스트와 상기 부가정보를 대신하는 공통파일포맷을 입력으로 하는 제 2 입력버퍼;
    상기 부가정보의 위치정보를 이용하여 상기 제 2 입력버퍼로부터 현재 입력되는 데이타가 텍스트인지 공통파일포맷인지 판별하고, 현재 입력데이타가 텍스트의 끝인지 판별하고, 상기 공통파일포맷 대신 부가정보를 독출하는 제 2 제어부; 및
    상기 제 2 제어부의 제어하에, 상기 제 2 입력버퍼의 번역된 텍스트와 상기 공통파일포맷 대신 상기 문서저장버퍼에 저장된 부가정보를 삽입하여 저장하는 결과버퍼로 이루어지는 것을 특징으로 하는 다양한 포맷을 갖는 문서번역이 가능한 기계번역장치.
KR1020000053541A 2000-09-08 2000-09-08 다양한 포맷을 갖는 문서번역이 가능한 기계번역장치 KR20020020409A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020000053541A KR20020020409A (ko) 2000-09-08 2000-09-08 다양한 포맷을 갖는 문서번역이 가능한 기계번역장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000053541A KR20020020409A (ko) 2000-09-08 2000-09-08 다양한 포맷을 갖는 문서번역이 가능한 기계번역장치

Publications (1)

Publication Number Publication Date
KR20020020409A true KR20020020409A (ko) 2002-03-15

Family

ID=19688286

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000053541A KR20020020409A (ko) 2000-09-08 2000-09-08 다양한 포맷을 갖는 문서번역이 가능한 기계번역장치

Country Status (1)

Country Link
KR (1) KR20020020409A (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101059631B1 (ko) * 2008-07-04 2011-08-25 야후! 인크. 자동 입출력 인터페이스를 갖춘 번역기 및 그 인터페이싱방법
US8108202B2 (en) 2007-07-27 2012-01-31 Electronics And Telecommunications Research Institute Machine translation method for PDF file
CN102622340A (zh) * 2012-03-28 2012-08-01 成都优译信息技术有限公司 翻译文件的拆分和分配方法
KR101693627B1 (ko) * 2015-10-08 2017-01-17 숭실대학교산학협력단 문자 인코딩 변환 장치 및 방법
KR20180109408A (ko) * 2017-03-28 2018-10-08 주식회사 와이즈넛 언어 판별 장치 및 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR920015221A (ko) * 1991-01-17 1992-08-26 정용문 자동 번역 복사 시스템 및 방법
JPH056396A (ja) * 1991-12-06 1993-01-14 Toshiba Corp 機械翻訳装置
JPH07182344A (ja) * 1993-12-24 1995-07-21 Sharp Corp 機械翻訳装置
JPH1083399A (ja) * 1996-05-16 1998-03-31 Sharp Corp 機械翻訳装置及び翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体
KR100278095B1 (ko) * 1997-08-22 2001-01-15 윤덕용 원문의복잡도에따라융통성을갖는기계번역시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR920015221A (ko) * 1991-01-17 1992-08-26 정용문 자동 번역 복사 시스템 및 방법
JPH056396A (ja) * 1991-12-06 1993-01-14 Toshiba Corp 機械翻訳装置
JPH07182344A (ja) * 1993-12-24 1995-07-21 Sharp Corp 機械翻訳装置
JPH1083399A (ja) * 1996-05-16 1998-03-31 Sharp Corp 機械翻訳装置及び翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体
KR100278095B1 (ko) * 1997-08-22 2001-01-15 윤덕용 원문의복잡도에따라융통성을갖는기계번역시스템

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8108202B2 (en) 2007-07-27 2012-01-31 Electronics And Telecommunications Research Institute Machine translation method for PDF file
KR101059631B1 (ko) * 2008-07-04 2011-08-25 야후! 인크. 자동 입출력 인터페이스를 갖춘 번역기 및 그 인터페이싱방법
CN102622340A (zh) * 2012-03-28 2012-08-01 成都优译信息技术有限公司 翻译文件的拆分和分配方法
KR101693627B1 (ko) * 2015-10-08 2017-01-17 숭실대학교산학협력단 문자 인코딩 변환 장치 및 방법
KR20180109408A (ko) * 2017-03-28 2018-10-08 주식회사 와이즈넛 언어 판별 장치 및 방법

Similar Documents

Publication Publication Date Title
KR100453227B1 (ko) 번역 지원 시스템에서의 유사 문장 검색 방법
JP3220560B2 (ja) 機械翻訳装置
KR100912502B1 (ko) Pdf 파일을 대상으로 하는 자동 번역 방법
US9002695B2 (en) Machine translation device, method of processing data, and program
US8494839B2 (en) Apparatus, method, and recording medium for morphological analysis and registering a new compound word
KR101266361B1 (ko) 구조화된 번역 메모리 기반의 자동 번역 시스템 및 자동 번역 방법
EP0797155A2 (en) Translating machine
JP2001043236A (ja) 類似語抽出方法、文書検索方法及びこれらに用いる装置
JPH02165378A (ja) 機械翻訳システム
JP2017199363A (ja) 機械翻訳装置及び機械翻訳のためのコンピュータプログラム
JP2006251843A (ja) 同義語対抽出装置及びそのためのコンピュータプログラム
JP2009217689A (ja) 情報処理装置、情報処理方法、及びプログラム
KR20020020409A (ko) 다양한 포맷을 갖는 문서번역이 가능한 기계번역장치
Nghiem et al. Using MathML parallel markup corpora for semantic enrichment of mathematical expressions
CN111652007A (zh) 一种多种语言混合文件的翻译方法及装置
KR101670995B1 (ko) 어순 조정 및 형태소 차이에 기반한 통계 기반 기계 번역 시스템 및 그 방법
KR101814431B1 (ko) 오디오 파일 동기화를 위한 번역 서비스 시스템 및 그 방법
JP2008071001A (ja) 自然言語処理装置、およびプログラム
JP2006190226A (ja) 用言自動換言装置、用言換言方法及び用言換言処理プログラム
KR20010004090A (ko) 에이치티엠엘 기반 한글 용어/약어 하이퍼링크 생성기
JP2715875B2 (ja) 多言語要約生成装置
US20030172351A1 (en) Mark-up language conversion
KR101810555B1 (ko) 오디오 파일 동기화를 위한 번역 서비스 시스템 및 그 방법
JP3389313B2 (ja) 機械翻訳装置
JP3267168B2 (ja) 自然言語変換システム

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E601 Decision to refuse application