KR20030059678A - 웹기반 번역장치 및 방법 - Google Patents

웹기반 번역장치 및 방법 Download PDF

Info

Publication number
KR20030059678A
KR20030059678A KR1020020000406A KR20020000406A KR20030059678A KR 20030059678 A KR20030059678 A KR 20030059678A KR 1020020000406 A KR1020020000406 A KR 1020020000406A KR 20020000406 A KR20020000406 A KR 20020000406A KR 20030059678 A KR20030059678 A KR 20030059678A
Authority
KR
South Korea
Prior art keywords
translation
sentence
internet server
translator
computer
Prior art date
Application number
KR1020020000406A
Other languages
English (en)
Inventor
정현진
Original Assignee
정현진
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정현진 filed Critical 정현진
Priority to KR1020020000406A priority Critical patent/KR20030059678A/ko
Publication of KR20030059678A publication Critical patent/KR20030059678A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/49Data-driven translation using very large corpora, e.g. the web

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

본 발명의 목적은 원시 문서 파일을 분석하여 번역문 데이터베이스와 용어 데이터베이스를 생성한 후, 이를 이용하여 다수의 번역사들이 다자간 동시에 원시 문서를 번역하도록 하는 웹기반 번역장치 및 방법을 제공하는 데에 있다. 이와 같은 본 발명의 목적을 달성하기 위한 웹기반 번역장치는 탑재된 원시 문서 파일을 관리 및 분석하여, 각 문장에 포함된 용어를 추출함과 아울러 각 문장의 중복도를 분석하고, 번역이 완료되었을 때 번역문 DB로부터 목적 파일을 생성하여 관리하는 엔지니어 컴퓨터와; 상기 엔지니어 컴퓨터의 분석 결과에 의하여 번역문 DB를 생성하고, 상기 엔지니어 컴퓨터에서 추출된 용어에 의하여 용어 DB를 생성하며, 번역 완료시 문장 단위로 원시 문서와 번역문을 상기 번역문 DB에 저장하는 인터넷 서버와; 상기 인터넷 서버에서 생성된 번역문 DB 및 용어 DB를 이용하여 다자간 동시 번역을 수행하도록 다수의 번역사 컴퓨터들로 구성된 외부 번역사 컴퓨터를 포함하여 구성되는 것을 특징으로 한다.

Description

웹기반 번역장치 및 방법{WEB-BASED TRANSLATION APPARATUS AND METHOD}
본 발명은 웹기반 번역장치 및 방법에 관한 것으로, 특히 원시 문서 파일을 분석하여 번역문 데이터베이스와 용어 데이터베이스를 생성한 후, 이를 이용하여 다수의 번역사들이 다자간 동시에 원시 문서를 번역하도록 하는 웹기반 번역장치 및 방법에 관한 것이다.
종래의 인터넷을 통한 번역 방법으로는, 대한민국 특허(공개번호 10-2001-0069364)에 언급된 바와 같이, 인터넷 사이트에서 번역사와 동서비스의 수요자를 인터넷 사이트의 데이터베이스에 입력된 자료와 서비스 요구/제안 자료를 프로그램이 자동으로 편집하여, 제안서 형태로 작성해 번역사와 의뢰인에게 전자 메일로 송부하여 서비스 제공자와 의뢰인을 연결시켜 방법이 있다.
그러나, 이 방법은 오로지 한 사람의 번역사의 경험에 의존하여 원시 문서를 번역함으로써, 번역의 정확도가 떨어지는 문제점이 있다.
그리고, 종래의 인터넷을 통한 번역 방법으로는, 대한민국 특허(등록번호 0265548)에 언급된 바와 같이, WWW 서버에 의해서 제공된 WWW 페이지 중의 외국어 텍스트를 모국어 텍스트로 번역하는 기계 번역 방법 및 장치가 있다. 이 번역 방법 및 장치는 처리 대상의 외국어 텍스트에 최적의 번역 환경, 즉 번역 처리에 이용되는 사전 데이터베이스나 문법 처리 알고리즘등을 자동적으로 선택하여 번역하는 것이다.
그러나, 이 번역 방법은 사이트의 외국어 텍스트만을 모국어 텍스트로 번역하는 것으로, 클라이언트가 원하는 일반 원시 문서는 번역할 수 없는 문제점이 있다.
따라서, 본 발명의 목적은 원시 문서 파일을 분석하여 번역문 데이터베이스와 용어 데이터베이스를 생성한 후, 이를 이용하여 다수의 번역사들이 다자간 동시에 원시 문서를 번역하도록 하는 웹기반 번역장치 및 방법을 제공하는 데에 있다.
이와 같은 본 발명의 목적을 달성하기 위한 웹기반 번역장치는 탑재된 원시문서 파일을 관리 및 분석하여, 각 문장에 포함된 용어를 추출함과 아울러 각 문장의 중복도를 분석하고, 번역이 완료되었을 때 번역문 DB로부터 목적 파일을 생성하여 관리하는 엔지니어 컴퓨터와; 상기 엔지니어 컴퓨터의 분석 결과에 의하여 번역문 DB를 생성하고, 상기 엔지니어 컴퓨터에서 추출된 용어에 의하여 용어 DB를 생성하며, 번역 완료시 문장 단위로 원시 문서와 번역문을 상기 번역문 DB에 저장하는 인터넷 서버와; 상기 인터넷 서버에서 생성된 번역문 DB 및 용어 DB를 이용하여 다자간 동시 번역을 수행하도록 다수의 번역사 컴퓨터들로 구성된 외부 번역사 컴퓨터를 포함하여 구성되는 것을 특징으로 한다.
이와 같은 본 발명의 목적을 달성하기 위한 웹기반 번역 방법은 엔지니어 컴퓨터에서 번역할 원시 문서 파일을 탑재하여 관리하는 제1 단계와; 상기 엔지니어 컴퓨터에서 상기 탑재된 원시 문서 파일을 분석하는 제2 단계와; 상기 인터넷 서버에서 엔지니어 컴퓨터에서의 분석 결과를 기반으로 번역문 DB를 생성하고, 상기 엔지니어 컴퓨터에서 추출된 용어에 의하여 용어 DB를 생성하는 제3 단계와; 다수의 번역사들에 의해 로그-인이 수행되는 제4 단계와; 상기 로그-인된 번역사들이 상기 생성된 번역문 DB 및 용어 DB를 이용하여 다자간 동시에 원시 문서를 번역하는 제5 단계와; 상기 엔지니어 컴퓨터에서 전용 툴을 사용하여 상기 번역문 DB에 저장된 완료 번역문을 역 필터링하여 목적 파일을 생성한 후, 관리하는 제6 단계를 포함하여 구성되는 것을 특징으로 한다.
도 1은 본 발명의 실시예에 따른 웹기반 번역장치의 블록도.
도 2는 본 발명의 실시예에 따른 웹기반 번역방법의 흐름도.
<도면의 주요부분에 대한 부호의 설명>
100 : 엔지니어 컴퓨터200 : 인터넷 서버
210 : 번역문 DB202 : 용어 DB
300 : 외부 번역사 컴퓨터
도 1은 본 발명의 실시예에 따른 웹기반 번역장치의 블록도를 도시한 것이다.
도 1에 도시된 바와 같이, 본 발명의 실시예에 따른 웹기반 번역장치는 탑재된 원시 문서 파일(101)을 관리 및 분석하여, 각 문장에 포함된 용어를 추출함과 아울러 각 문장의 중복도를 분석하고, 번역이 완료되었을 때 번역문 데이터베이스(DB)(201)에서 목적 파일을 생성하여 관리하는 엔지니어 컴퓨터(100)와, 상기 엔지니어 컴퓨터(100)의 분석 결과에 의하여 번역문 DB(201)를 생성하고, 상기 엔지니어 컴퓨터(100)에서 추출된 용어에 의하여 용어 DB(202)를 생성하며, 번역 완료시 문장 단위로 원시 문서와 번역문을 상기 번역문 DB(201)에 저장하는 인터넷 서버(200)와, 상기 인터넷 서버(200)에서 생성된 번역문 DB(201) 및 용어 DB(202)를 이용하여 다자간 동시 번역을 수행하도록 다수의 번역사 컴퓨터(300-1~300-N)로 구성된 외부 번역사 컴퓨터(300)로 구성된다.
도 2는 본 발명의 실시예에 따른 웹기반 번역 방법의 흐름도를 도시한 것이다.
도 1을 참조하여, 본 발명의 실시예에 따른 웹기반 번역 방법을 상세히 설명하면 다음과 같다.
먼저, 엔지니어 컴퓨터(100)는 번역할 원시 문서 파일(101)을 탑재하여 관리하게 된다(S100). 상기 엔지니어 컴퓨터(100)는 상기 탑재된 원시 문서 파일(101)을 분석하게 된다(S101). 다시 말하면, 상기 엔지니어 컴퓨터(100)는 전용 툴을 사용하여 탑재된 원시 문서 파일(101)에 포함된 번역시 불필요한 코드를 필터링하고,상기 원시 문서 파일(101)의 각 문장을 세그멘테이셔닝(segmentationing), 즉 각 단락을 문장별로 구분하여 인터넷 서버(200)에 제공하게된다. 또한, 상기 엔지니어 컴퓨터(100)는 상기 원시 문서 파일(101)의 각 문장에 포함된 용어를 추출하여 상기 인터넷 서버(200)에 제공하고, 상기 원시 문서 파일(101)의 각 문장의 중복도를 분석하여 상기 인터넷 서버(200)에 제공하게 된다.
상기 인터넷 서버(200)는 엔지니어 컴퓨터(100)에서의 분석 결과를 기반으로 번역문 DB(201)를 생성하고, 상기 엔지니어 컴퓨터(100)에서 추출된 용어에 의하여 용어 DB(202)를 생성하게 된다.
이후, 다수의 번역사들은 각각 외부 번역사 컴퓨터(300)에서의 다수의 번역사 컴퓨터(300-1~300-N)에 탑재된 웹 브라우저나 특정 어플리케이션을 사용하여 인터넷을 통해 상기 인터넷 서버(200)의 사이트에 접속한 후, 이미 인터넷 서버(200)에 의해 인증된 ID와 패스워드를 이용하여 로그-인을 수행하여, 상기 인터넷 서버(200)에 연결된다(S103).
상기 인터넷 서버(200)는 원시 문서를 문장 단위로 상기 로그-인된 다수의 번역사 컴퓨터(300-1~300-N)에 각각 제공하고, 동일한 문장이 상기 번역문 DB(201)에 추가로 있는지 검색하여 동일한 문장이 존재하면, 그 동일한 원시 문장에 대응되는 번역문으로 자동으로 대체하여 다수의 번역사 컴퓨터(300-1~300-N)에 제공하게 된다. 이때, 단어 하나가 틀리거나 특정 단어가 첨삭된 것과 같은 유사한 문장은 자동으로 대체하지 않으며, 이러한 문장은 번역 과정에서 다수의 번역사 컴퓨터(300-1~300-N)에 각각 제공된다. 따라서, 번역사들은 첨삭된 부분만을 일부수정하여 번역문을 손쉽게 완성할 수 있다. 이때, 인터넷 서버(200)에서의 시스템 모듈이 지원하는 유사 범위는 85%이며, 물론 이 유사 범위는 필요에 따라 조절할 수 있다.
다수의 번역사 컴퓨터(300-1~300-N)에 대응되는 다수의 번역사들은 상기 인터넷 서버(200)에서 제공되는 원시 문서를 문장 단위로 받아서 상기 용어 DB(202)를 이용하여 다자간 동시 번역을 수행하게 된다(S104).
이후, 번역사들의 번역이 완료되면, 인터넷 서버(200)는 완료된 번역문을 번역문 DB(201)에 문장 단위로 1:1(예들 들면, 영문:한글) 형식으로 저장하게 된다.
이와 같이 완료된 번역문은 분야 전문가에 의하여 감수를 받게 되고(S105), 그 감수된 결과는 모든 번역사들에게 전달되어 동일한 오류가 없도록 미연에 방지하게 된다.
상기 엔지니어 컴퓨터(100)는 전용 툴을 사용하여 상기 번역문 DB(201)에 저장된 완료 번역문을 역 필터링하여 목적 파일을 생성한 후, 관리하게 된다(S106).
이와 같은 본 발명은 원시 문서 파일을 분석하여 번역문 데이터베이스와 용어 데이터베이스를 생성한 후, 이를 이용하여 다수의 번역사들이 다자간 동시에 원시 문서를 번역함으로써, 번역의 에러를 줄일 수 있는 효과가 있다.
또한, 본 발명은 원시 문서에서의 일치된 문장은 그에 대응되는 번역문을 번역사들에게 제공하고, 유사한 문장에 대하여는 이미 번역된 유사 번역문을 번역사들에게 제공함으로써, 일치된 문장에 대한 번역비는 번역사들에게 지급할 필요가 없고, 유사 문자에 대한 번역비는 비율로 산정하여 번역사에게 지급하게 된다. 그러므로, 번역비가 절감되는 효과가 있다. 특히, 버전업되는 기술 자료, 제품 메뉴얼, 및 프로그램의 경우에는 일치되는 문장이나 유사 문장이 많으므로 상당한 번역비가 절감되는 효과가 있다.

Claims (11)

  1. 탑재된 원시 문서 파일을 관리 및 분석하여, 각 문장에 포함된 용어를 추출함과 아울러 각 문장의 중복도를 분석하고, 번역이 완료되었을 때 번역문 DB로부터 목적 파일을 생성하여 관리하는 엔지니어 컴퓨터와;
    상기 엔지니어 컴퓨터의 분석 결과에 의하여 번역문 DB를 생성하고, 상기 엔지니어 컴퓨터에서 추출된 용어에 의하여 용어 DB를 생성하며, 번역 완료시 문장 단위로 원시 문서와 번역문을 상기 번역문 DB에 저장하는 인터넷 서버와;
    상기 인터넷 서버에서 생성된 번역문 DB 및 용어 DB를 이용하여 다자간 동시 번역을 수행하도록 다수의 번역사 컴퓨터들로 구성된 외부 번역사 컴퓨터를 포함하여 구성되는 것을 특징으로 하는 웹기반 번역 장치.
  2. 제 1 항에 있어서,
    상기 인터넷 서버는 원시 문서를 문장 단위로 상기 로그-인된 다수의 번역사 컴퓨터에 각각 제공하는 것을 특징으로 하는 웹기반 번역 방법.
  3. 제 1 항에 있어서,
    상기 인터넷 서버는 동일한 문장이 상기 번역문 DB에 추가로 있는지 검색하여 동일한 문장이 존재하면, 그 동일한 원시 문장에 대응되는 번역문으로 자동으로 대체하여 다수의 번역사 컴퓨터에 제공하는 것을 특징으로 하는 웹기반 번역 방법.
  4. 제 1 항에 있어서,
    상기 인터넷 서버는 단어 하나가 틀리거나 특정 단어가 첨삭된 것과 같은 유사한 문장은 자동으로 대체하지 않고, 이러한 문장을 번역 과정에서 다수의 번역사 컴퓨터에 각각 제공하는 것을 특징으로 하는 웹기반 번역 방법.
  5. 제 1 항에 있어서,
    상기 인터넷 서버는 번역사들의 번역이 완료되면, 완료된 번역문을 번역문 DB에 문장 단위로 1:1 형식으로 저장하는 것을 특징으로 하는 웹기반 번역 방법.
  6. 엔지니어 컴퓨터에서 번역할 원시 문서 파일을 탑재하여 관리하는 제1 단계와;
    상기 엔지니어 컴퓨터에서 상기 탑재된 원시 문서 파일을 분석하는 제2 단계와;
    상기 인터넷 서버에서 엔지니어 컴퓨터에서의 분석 결과를 기반으로 번역문DB를 생성하고, 상기 엔지니어 컴퓨터에서 추출된 용어에 의하여 용어 DB를 생성하는 제3 단계와;
    다수의 번역사들에 의해 로그-인이 수행되는 제4 단계와;
    상기 로그-인된 번역사들이 상기 생성된 번역문 DB 및 용어 DB를 이용하여 다자간 동시에 원시 문서를 번역하는 제5 단계와;
    상기 엔지니어 컴퓨터에서 전용 툴을 사용하여 상기 번역문 DB에 저장된 완료 번역문을 역 필터링하여 목적 파일을 생성한 후, 관리하는 제6 단계를 포함하여 구성되는 것을 특징으로 하는 웹기반 번역 방법.
  7. 제 6 항에 있어서,
    상기 제2 단계는 상기 엔지니어 컴퓨터에서 전용 툴을 사용하여 탑재된 원시 문서 파일에 포함된 번역시 불필요한 코드를 필터링하고, 상기 원시 문서 파일의 각 문장을 세그멘테이셔닝(segmentationing)하는 제1 과정과;
    상기 엔지니어 컴퓨터에서 상기 원시 문서 파일의 각 문장에 포함된 용어를 추출하고, 상기 원시 문서 파일의 각 문장의 중복도를 분석하는 제2 과정으로 구성되는 것을 특징으로 하는 웹기반 번역 방법.
  8. 제 6 항에 있어서,
    상기 인터넷 서버는 원시 문서를 문장 단위로 상기 로그-인된 다수의 번역사 컴퓨터에 각각 제공하는 것을 특징으로 하는 웹기반 번역 방법.
  9. 제 6 항에 있어서,
    상기 인터넷 서버는 동일한 문장이 상기 번역문 DB에 추가로 있는지 검색하여 동일한 문장이 존재하면, 그 동일한 원시 문장에 대응되는 번역문으로 자동으로 대체하여 다수의 번역사 컴퓨터에 제공하는 것을 특징으로 하는 웹기반 번역 방법.
  10. 제 6 항에 있어서,
    상기 인터넷 서버는 단어 하나가 틀리거나 특정 단어가 첨삭된 것과 같은 유사한 문장은 자동으로 대체하지 않고, 이러한 문장을 번역 과정에서 다수의 번역사 컴퓨터에 각각 제공하는 것을 특징으로 하는 웹기반 번역 방법.
  11. 제 6 항에 있어서,
    상기 인터넷 서버는 번역사들의 번역이 완료되면, 완료된 번역문을 번역문 DB에 문장 단위로 1:1 형식으로 저장하는 것을 특징으로 하는 웹기반 번역 방법.
KR1020020000406A 2002-01-04 2002-01-04 웹기반 번역장치 및 방법 KR20030059678A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020020000406A KR20030059678A (ko) 2002-01-04 2002-01-04 웹기반 번역장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020020000406A KR20030059678A (ko) 2002-01-04 2002-01-04 웹기반 번역장치 및 방법

Publications (1)

Publication Number Publication Date
KR20030059678A true KR20030059678A (ko) 2003-07-10

Family

ID=32216938

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020020000406A KR20030059678A (ko) 2002-01-04 2002-01-04 웹기반 번역장치 및 방법

Country Status (1)

Country Link
KR (1) KR20030059678A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8407039B2 (en) 2008-08-11 2013-03-26 Lg Electronics Inc. Method and apparatus of translating language using voice recognition
KR20190025188A (ko) * 2017-08-31 2019-03-11 주식회사 에버트란 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버 및 번역 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8407039B2 (en) 2008-08-11 2013-03-26 Lg Electronics Inc. Method and apparatus of translating language using voice recognition
KR20190025188A (ko) * 2017-08-31 2019-03-11 주식회사 에버트란 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버 및 번역 방법

Similar Documents

Publication Publication Date Title
US11734514B1 (en) Automated translation of subject matter specific documents
KR101099196B1 (ko) 적응형 기계 번역
US6983238B2 (en) Methods and apparatus for globalizing software
KR100594512B1 (ko) 지식 창조 능력을 가지는 문서 의미 분석/선택 시스템 및그 방법
US20070233460A1 (en) Computer-Implemented Method for Use in a Translation System
US9195644B2 (en) Short phrase language identification
US20040260532A1 (en) Adaptive machine translation service
US20150088484A1 (en) Domain specific salient point translation
EP1969490A2 (en) A text editing apparatus and method
US8874426B2 (en) Method for translating computer generated log files
US20170154029A1 (en) System, method, and apparatus to normalize grammar of textual data
KR101709693B1 (ko) 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법
JP2004220266A (ja) 機械翻訳装置および機械翻訳方法
EP0316743A2 (en) Method for removing enclitic endings from verbs in romance languages
Rabbani et al. A new verb based approach for English to Bangla machine translation
KR20030059678A (ko) 웹기반 번역장치 및 방법
Kumar et al. Hindi to Punjabi machine translation system based on statistical approach
Schacht et al. Promptie-information extraction with prompt-engineering and large language models
Pinnis et al. Developing a neural machine translation service for the 2017-2018 european union presidency
Manchanda et al. Domain informed neural machine translation: Developing translation services for healthcare enterprise
Sridhar et al. A Scalable Approach to Building a Parallel Corpus from the Web.
JPH10269223A (ja) 翻訳サービスシステム及び翻訳サービス提供方法
Ganesh et al. Grammar error detection tool for medical transcription using stop words parts-of-speech tags ngram based model
JP2000250913A (ja) 実例型自然言語翻訳方法、対訳用例集作成方法および装置とそのプログラムを記録した記録媒体
Rabbani et al. PVBMT: A Principal Verb based Approach for English to Bangla Machine Translation

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application