KR20220111825A - 분배모델을 기반으로 번역서비스를 제공하기 위한 시스템 - Google Patents

분배모델을 기반으로 번역서비스를 제공하기 위한 시스템 Download PDF

Info

Publication number
KR20220111825A
KR20220111825A KR1020210015055A KR20210015055A KR20220111825A KR 20220111825 A KR20220111825 A KR 20220111825A KR 1020210015055 A KR1020210015055 A KR 1020210015055A KR 20210015055 A KR20210015055 A KR 20210015055A KR 20220111825 A KR20220111825 A KR 20220111825A
Authority
KR
South Korea
Prior art keywords
text
distributed
distribution
proofreader
terminal devices
Prior art date
Application number
KR1020210015055A
Other languages
English (en)
Other versions
KR102526392B1 (ko
Inventor
박미진
Original Assignee
주식회사 휴텍씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 휴텍씨 filed Critical 주식회사 휴텍씨
Priority to KR1020210015055A priority Critical patent/KR102526392B1/ko
Publication of KR20220111825A publication Critical patent/KR20220111825A/ko
Application granted granted Critical
Publication of KR102526392B1 publication Critical patent/KR102526392B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063114Status monitoring or status determination for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063116Schedule adjustment for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 분배모델을 기반으로 번역서비스를 제공하기 위한 시스템이 개시된다.
본 발명에 일 실시예에 따르면, 통신망 상에서 분배모델을 기반으로 번역서비스를 제공하기 위한 시스템으로서, 사용자 단말장치에서 수집되거나 변환되어 전송되는 콘텐츠에 포함된 텍스트를 인식하여 추출하고, 추출된 상기 텍스트로 원어 텍스트를 생성하는 제1 정보 처리부; 상기 원어 텍스트를 해당 분배모델을 기준으로 설정된 분배단위에 따라, 다수의 제1 교정자 단말장치 마다 할당하여 분배하고, 분배된 상기 원어 텍스트가 상기 다수의 제1 교정자 단말장치에서 교정되어 수집되면, 이를 다시 조합하는 제1 분배 교정부; 교정되어 조합된 상기 원어 텍스트를, 인공지능 알고리즘에 따라 상기 사용자 단말장치에서 선택한 언어로 기계번역 하여 번역 텍스트를 생성하는 AI 번역부; 상기 번역 텍스트를 해당 분배모델을 기준으로 설정된 분배단위에 따라, 다수의 제2 교정자 단말장치 마다 할당하여 분배하고, 분배된 상기 번역 텍스트가 상기 다수의 제2 교정자 단말장치에서 교정되어 수집되면, 이를 다시 조합하는 제2 분배 교정부; 및 교정되어 조합된 상기 번역 텍스트를, 상기 사용자 단말장치로 제공하는 제2 정보 처리부를 포함하는 것을 특징으로 한다.

Description

분배모델을 기반으로 번역서비스를 제공하기 위한 시스템{SYSTEM FOR PROVIDING TRANSLATION SERVICES BASED ON DISTRIBUTION MODEL}
본 발명은 분배모델을 기반으로 번역서비스를 제공하기 위한 시스템에 관한 것이다. 보다 상세하게는, 텍스트 정보의 번역 시, 분배모델에 따라 신속하고도 정확하게 교정된 번역서비스를 제공할 수 있는 기술에 관한 것이다.
세계화의 흐름과 정보통신기술이 발전하면서, 전세계적으로 보다 많은 정보가 활발하게 교류되고 있다. 특히, 다양한 언어로 작성된 문서들을 통한 정보의 원활한 교류를 위하여 실시간 번역과 더불어, 내용의 중요성을 감안하여 번역 정확도를 확보하는 것이 중요하다. 따라서, 일반적으로 중요한 문서에 대하여는 해당 분야의 전문 번역사에게 의뢰하여 번역하는 방식으로 진행할 수 있으며, 비교적 간단한 문서에 대하여는 인공지능(AI: Artificial Intelligence) 알고리즘에 의한 자동번역(기계번역)을 이용할 수 있다.
하지만, 전문 번역사를 이용할 경우, 소요되는 시간적인 측면에서나 비용적인 측면에서 어려움이 존재하며, 번역분량이 많을 경우 수작업 시 발생하는 집중력 저하와 과부하 등으로 인한 누락이나 착오 등의 문제점을 완벽하게 배제시킬 수 없다는 한계를 가지고 있다.
따라서, 최근에는 정보통신기술을 기반으로 온라인 상에서 기계번역을 제공하는 서비스가 주목 받고 있다. 하지만, 이러한 온라인 번역서비스의 경우, 대부분 인공지능(AI) 알고리즘의 기술적 한계로 인하여 전문 번역사의 번역 보다 낮은 품질을 보이는 문제점이 있다.
특히, 다수의 언어로 작성된 다수의 문서를 단시간 내에 처리해야 되는 업무적인 상황의 경우, 상술된 바와 같은 문제점 외에도 추가적으로 다른 문제점을 더 수반할 수 있다.
먼저, 전문 번역사를 활용하는 경우, 접수된 모든 언어의 문서에 대하여 해당 언어의 전문 번역사가 수작업으로 방대한 번역량을 실시간으로 번역하는 것은 상당히 어렵다. 또한, 온라인 상에서 다수의 전문 번역사가 매칭되어 실시간 번역이 진행되는 경우에도, 투입되는 전문 번역사에 따라 일정한 품질의 번역을 기대하기 어려울 뿐만 아니라, 다수의 전문 번역사 마다 할당되는 전체적인 번역량을 조율하기 어렵다는 문제점도 가지고 있다.
한편, 온라인 번역서비스 상에서 인공지능(AI) 알고리즘의 의해 기계번역을 실시 할 경우에도, 다양한 정보(예를 들면, 텍스트, 이미지, 동영상)가 조합된 콘텐츠의 경우, 해당 콘텐츠에서 텍스트만을 인식하여 신속하고 정확하게 기계번역 한다는 것은 상당히 어렵다.
따라서, 인공지능(AI) 알고리즘에 의한 자동번역과 일정한 수준의 전문가에 의한 번역을 결합한 새로운 형태의 번역서비스에 대한 개발이 요구되고 있다.
공개특허공보 제10-2016-0118198호(등록일자: 2016.10.11.)
따라서, 본 발명은 상기와 같은 종래 기술의 제반 문제점을 해결하기 위한 것으로서, 번역이 요청된 콘텐츠에서 인식된 텍스트 정보를 추출하여 인공지능(AI) 알고리즘에 의한 자동번역 과정을 처리하며, 이때, 분배모델을 기준으로 설정된 분배단위에 따라, 텍스트(원어 텍스트, 번역 텍스트)를 다수의 해당 교정자들(원어 교정자, 번역 교정자)에게 할당하여 분배하는데 그 목적이 있다.
또한, 본 발명은 상기 텍스트(원어 텍스트 및 상기 번역 텍스트)에서 피리어드(Period)인 마침표를 기준으로 구분된 하나 또는 다수의 문장 덩어리의 집합을 분배단위로 설정하여 분배하는데 다른 목적이 있다.
또한, 본 발명은 상기 분배모델을 기준으로 설정된 분배단위에 따라, 상기 텍스트(원어 텍스트, 번역 텍스트)를 글자수 또는 단어수 중 어느 하나를 기준으로 분배하는 방식, 분배된 텍스트(원어 텍스트, 번역 텍스트)가 교정되어 입력되는 교정(소요)시간을 기준으로 분배하는 방식, 분배된 텍스트(원어 텍스트, 번역 텍스트)를 교정자(원어 교정자, 번역 교정자)가 선택한 그룹을 기준으로 재분배하는 방식 중 어느 하나이거나 이들의 조합된 방식으로 제공하는데 또 다른 목적이 있다.
또한, 본 발명은 상기 번역 교정자에 의해 교정된 번역 텍스트를 기초로, 사용자가 요청하는 양식으로 문서화(예를 들면, WORD, PDF, PPT, HTML 등)하며, 상기 문서에는 상기 원어 텍스트의 교정자 및 상기 번역 텍스트의 교정자의 정보를 포함하여 제공하는데 또 다른 목적이 있다.
또한, 본 발명은 사용자가 신청한 번역조건(예를 들면, 교정자 레벨, 교정자 인원수)에 따라 다수의 교정자(원어 교정자, 번역 교정자)를 매칭하는데, 이때 다수의 교정자(원어 교정자, 번역 교정자)의 교정결과에 대한 통계정보(예를 들면, 사용자 만족도)를 기초로, 상기 번역조건의 적합도에 따라 우선 배정하는데 또 다른 목적이 있다.
본 발명의 상기 목적은, 통신망 상에서 분배모델을 기반으로 번역서비스를 제공하기 위한 시스템으로서, 사용자 단말장치에서 수집되거나 변환되어 전송되는 콘텐츠에 포함된 텍스트를 인식하여 추출하고, 추출된 상기 텍스트로 원어 텍스트를 생성하는 제1 정보 처리부; 상기 원어 텍스트를 해당 분배모델을 기준으로 설정된 분배단위에 따라, 다수의 제1 교정자 단말장치 마다 할당하여 분배하고, 분배된 상기 원어 텍스트가 상기 다수의 제1 교정자 단말장치에서 교정되어 수집되면, 이를 다시 조합하는 제1 분배 교정부; 교정되어 조합된 상기 원어 텍스트를, 인공지능 알고리즘에 따라 상기 사용자 단말장치에서 선택한 언어로 기계번역 하여 번역 텍스트를 생성하는 AI 번역부; 상기 번역 텍스트를 해당 분배모델을 기준으로 설정된 분배단위에 따라, 다수의 제2 교정자 단말장치 마다 할당하여 분배하고, 분배된 상기 번역 텍스트가 상기 다수의 제2 교정자 단말장치에서 교정되어 수집되면, 이를 다시 조합하는 제2 분배 교정부; 및 교정되어 조합된 상기 번역 텍스트를, 상기 사용자 단말장치로 제공하는 제2 정보 처리부를 포함하는 것을 특징으로 하는 시스템에 의해 달성된다.
이 외에도, 본 발명을 구현하기 위한 다른 구성, 시스템, 방법 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하기 위한 컴퓨터 판독 가능한 기록 매체에 의해서도 달성된다.
본 발명에 따르면, 번역이 요청된 콘텐츠에서 인식된 텍스트 정보를 추출하여 인공지능(AI) 알고리즘에 의한 자동번역 과정을 처리하며, 이때, 분배모델을 기준으로 설정된 분배단위에 따라, 텍스트(원어 텍스트, 번역 텍스트)를 다수의 해당 교정자들(원어 교정자, 번역 교정자)에게 할당하여 분배하여 신속하고도 정확하게 교정된 번역서비스를 제공할 할 수 있는 효과가 있다.
또한, 본 발명에 따르면, 상기 텍스트(원어 텍스트 및 상기 번역 텍스트)에서 피리어드(Period)인 마침표를 기준으로 구분된 하나 또는 다수의 문장 덩어리의 집합을 분배단위로 설정하여 분배함으로써, 분배효율을 향상시키고 교정작업 시 속도와 정확도를 기대할 수 있는 효과가 있다.
또한, 본 발명에 따르면, 상기 분배모델을 기준으로 설정된 분배단위에 따라, 상기 텍스트(원어 텍스트, 번역 텍스트)를 글자수 또는 단어수 중 어느 하나를 기준으로 분배하는 방식, 분배된 텍스트(원어 텍스트, 번역 텍스트)가 교정되어 입력되는 교정시간을 기준으로 분배하는 방식, 분배된 텍스트(원어 텍스트, 번역 텍스트)를 교정자(원어 교정자, 번역 교정자)가 선택한 그룹을 기준으로 재분배하는 방식 중 어느 하나이거나 이들의 조합된 방식으로 분배하여, 분배(할당)순서와 재분배를 포함하는 분배효율을 향상시키고, 교정속도와 정확도 확보가 용이하다는 효과가 있다.
또한, 본 발명에 따르면, 상기 번역 교정자에 의해 교정된 번역 텍스트를 기초로, 사용자가 요청하는 양식으로 문서화(예를 들면, WORD, PDF, PPT, HTML 등)하며, 상기 문서에는 상기 원어 텍스트의 교정자 및 상기 번역 텍스트의 교정자의 정보를 포함하여 제공하기 때문에, 사용자가 원하는 양식으로 다운받을 수 있으며, 번역내용의 정확도에 대한 보증 및 책임소재를 명확하게 할 수 있는 효과가 있다.
또한, 본 발명에 따르면, 사용자가 신청한 번역조건(예를 들면, 교정자 레벨, 교정자 인원수)에 따라 다수의 교정자(원어 교정자, 번역 교정자)를 매칭하는데, 이때 다수의 교정자(원어 교정자, 번역 교정자)의 교정결과에 대한 통계정보(예를 들면, 사용자 만족도)를 기초로, 상기 번역조건의 적합도에 따라 우선순위를 배정함으로써, 해당 분야의 경험이 축적된 보다 전문적인 교정자를 매칭 받을 수 있는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 분배모델을 기반으로 번역서비스를 제공하기 위한 전체 시스템의 구성을 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른 분배형 번역시스템(300)의 내부 구성을 상세하게 도시한 도면이다.
도 3은 본 발명의 일 실시예에 따른 분배모델을 기준으로 설정된 분배단위에 따라, 텍스트를 다수의 교정자 단말장치 마다 할당하여 분배하는 맵핑도이다.
도 4는 본 발명의 일 실시예에 따른 다수의 교정자 단말장치 중 어느 하나의 단말장치의 교정 인터페이스 화면이다.
도 5는 본 발명의 일 실시예에 따른 분배된 텍스트를 재분배하여 교정하는 과정을 보여주는 교정자 단말장치 마다의 교정 인터페이스 화면이다.
도 6은 본 발명의 일 실시예에 따른 분배모델을 기반으로 번역서비스를 제공하기 위한 각 구성들 간의 흐름도이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 본 발명에서 첨부된 구성도(블록도)의 각 블록과 흐름도의 각 단계의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수 있다. 이러한 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또한, 몇 가지 대체 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 인접하거나 순서에 따라 도시되어 있는 두 개의 블록들 또는 단계들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들 또는 단계들이 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.
또한 각각의 게시된 실시 예 내의 개별 구성요소의 위치 또는 배열은 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 그 청구항들이 주장하는 것과 균등한 모든 범위를 포괄하는 것으로 해석되어야 한다. 또한, 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭하며, 그 형태는 편의를 위하여 과장되어 표현될 수도 있다.
한편, 본 발명에서 사용되는 용어들은 본 발명의 바람직한 실시 예를 적절히 표현하기 위해 사용된 용어들로서, 이는 사용자의 의도 또는 본 발명이 속하는 분야의 관례 등에 따라 달라질 수 있다. 따라서, 본 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 이해되어야 할 것이다. 명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함" 한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "부", "모듈" 등의 용어는 적어도 하나 이상의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
이하에서는, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시 예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
[본 발명의 실시 예]
본 발명에 있어서, "전자화 문서(digitalized document)"란, 종이문서와 그 밖에 전자적 형태로 작성되지 않은 문서를 정보시스템이 처리할 수 있는 형태로 변환한 전자파일 형식의 문서를 의미하는 것이다. 이때, 컴퓨터 등 정보처리능력을 지닌 장치에 의하여 전자적인 형태로 작성되어 송수신되거나 저장, 검색되는 "전자문서"와는 구분되어 이해되어야 할 것이다.
또한 본 발명에 있어서, "오프라인 문서(off-line document)"란, 종이문서와 이를 포함하는 디지털화되지 않는 문서를 포괄하는 개념으로, 전자파일 형식의 상기'전자화문서'및'전자문서'와는 반대되는 개념으로 이해될 수 있다.
전체 시스템의 구성
도 1은 본 발명의 일 실시예에 따른 분배모델을 기반으로 번역서비스를 제공하기 위한 전체 시스템의 구성을 나타내는 도면이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 전체 시스템은 통신망(100), 운영 서버(200), 분배형 번역시스템(300), 사용자 단말장치(400), 제1 교정자 단말장치(500) 및 제2 교정자 단말장치(600)를 포함하여 구성될 수 있다.
먼저, 본 발명의 일 실시예에 따른 통신망(100)은, 데이터 전송 및 정보 교환을 위한 일련의 데이터 송수신 동작을 수행할 수 있는 네트워크 망으로, 유선 및/또는 무선과 같은 그 통신 양태를 가리지 않고 구성될 수 있다.
보다 구체적으로, 근거리 통신망(LAN: Local Area Network), 도시권 통신망(MAN: Metropolitan Area Network), 광역 통신망(WAN: Wide Area Network), 종합정보통신망(ISDN: Integrated Services Digital Network), 무선랜(wireless LAN) 또는 이동통신망(mobile telecommunication) 등 중에서 어느 하나이거나, 이들의 조합으로 연결되어 구성되는 다양한 형태의 유/무선 통신망일 수 있다. 바람직하게는, 이러한 본 발명에 의해 구성된 통신망(100)은 월드와이드웹(WWW: World Wide Web) 서비스를 이용할 수 있는 인터넷 망일 수 있다.
다음으로, 본 발명의 일 실시예에 따른 운영 서버(200)는, 접속(로그인) 관리, 콘텐츠 관리, 번역지원 관리, 비용 결제 등의 번역서비스와 관련된 운영 업무를 수행할 수 있는 운영 서버일 수 있다.
보다 구체적으로, 운영 서버(200)는 번역서비스 운영社의 웹/앱 운영 서버의 기능을 수행할 수 있는데, 사용자가 해당 웹/앱에 가입하고 로그인하여 번역서비스를 신청할 경우, 관련 서비스를 지원해 줄 수 있다. 이때, 운영 서버(200)는 이후 설명되는 분배형 번역시스템(300)과 사용자 단말장치(400), 제1 교정자 단말장치(500) 및/또는 제2 교정자 단말장치(600)를 통신망(100)을 통해 연결하는 전용 웹(Web) 및/또는 앱(App) 프로그램을 운영하거나, 이를 지원하는 기능을 수행할 수 있다. 또한, 운영 서버(200)는 분배형 번역시스템(300)과 다른 장치들(400 내지 600)이 본 발명에 의한 네트워크를 구현하기 위한 애플리케이션이 구동할 수 있도록, 웹/앱 상에서 API(Application Programming Interface)와 같은 애플리케이션을 구축할 수 있도록 필요한 인터페이스를 지원하는 기능을 수행할 수도 있다.
다음으로, 본 발명의 일 실시예에 따른 분배형 번역시스템(300)은, 번역이 요청된 콘텐츠에서 텍스트 정보만을 인식하여 추출하고, 추출된 텍스트 정보를 인공지능(AI) 알고리즘(번역 소프트웨어)에 의한 자동번역(기계번역) 과정을 처리하며, 이때, 분배모델을 기준으로 설정된 분배단위에 따라 텍스트(원어 텍스트, 번역 텍스트)를 다수의 해당 교정자들(원어 교정자, 번역 교정자)에게 할당하여 분배함으로써, 신속하고도 정확하게 교정된 번역서비스를 제공할 수 있는 시스템일 수 있다.
보다 구체적으로, 분배형 번역시스템(300)은 사용자 단말장치(400)에서 수집하거나 변환하여 전송되는 콘텐츠에 포함된 텍스트를 인식하여 추출하고, 추출된 상기 텍스트로 원어 텍스트를 생성할 수 있다. 이때, 사용자 단말장치(400)는 상기 콘텐츠가 작성, 검색, 촬영 중 어느 하나 이상으로 수집되는 텍스트를 포함하는 정보, 즉 전자 파일에 포함된 텍스트의 경우, 이를 온라인 상으로 수집하여 전송할 수 있다. 또한, 상기 콘텐츠가 사용자 단말장치(400)에서 또는 사용자 단말장치(400)와 연결된 다른 장치(예를 들면, 스캐너)에서 이미지정보 입력과정(스캔)을 통해 변환된 텍스트를 포함하는 전자화 문서, 즉 종이 문서와 같은 오프라인 상의 문서에 포함된 텍스트의 경우, 이를 디지털화된 이미지(전자 문서화)로 변환하여 온라인 상으로 전송할 수도 있다.
또한, 분배형 번역시스템(300)은 상기 원어 텍스트를 해당 분배모델을 기준으로 설정된 분배단위에 따라, 다수의 제1 교정자 단말장치(500) 마다 할당하여 분배하고, 분배된 상기 원어 텍스트가 상기 다수의 제1 교정자 단말장치(500)에서 교정되어 수집되면, 이를 다시 조합할 수 있다.
또한, 분배형 번역시스템(300)은 이러한 교정되어 조합된 상기 원어 텍스트를 인공지능 알고리즘에 따라 상기 사용자 단말장치(400)에서 선택한 언어로 기계번역 하여 번역 텍스트를 생성할 수 있다. 또한, 상기 번역 텍스트를 해당 분배모델을 기준으로 설정된 분배단위에 따라, 다수의 제2 교정자 단말장치(600) 마다 할당하여 분배하고, 분배된 상기 번역 텍스트가 상기 다수의 제2 교정자 단말장치(600)에서 교정되어 수집되면, 이를 다시 조합할 수 있다.
이러한 교정되어 조합된 상기 번역 텍스트를 다시 상기 사용자 단말장치(400)로 제공하여 신속하고 정확한 번역서비스를 할 수 있는데, 이러한 본 발명의 일 실시예에 따른 분배형 번역시스템(300)은 도 2를 참조한 이하의 상세한 설명에 의해 보다 구체적으로 이해될 수 있을 것이다.
다음으로, 본 발명의 일 실시예에 따른 사용자 단말장치(400)는, 해당 단말장치를 이용하는 사용자가 요청하는 텍스트 정보가 포함된 콘텐츠를 수집하거나, 변환하여 분배형 번역시스템(300)으로 전송하는 기능을 수행할 수 있는 디지털 기기일 수 있다.
보다 구체적으로, 사용자 단말장치(400)는 해당 사용자 단말장치(400)를 이용하는 사용자가 요청하는 텍스트 정보가 포함된 콘텐츠를 작성, 검색, 촬영 중 어느 하나 이상으로 수집하거나, 사용자 단말장치(400) 또는 사용자 단말장치(400)와 연결된 다른 장치(스캐너)에서 이미지정보 입력과정을 통해 변환된 텍스트를 포함하는 전자화 문서를 운영 서버(200) 및/또는 분배형 번역시스템(300)으로 제공(전송)할 수 있다. 또한, 사용자 단말장치(400)는 이와 반대로, 번역시스템(300)으로부터 제공되는 번역 텍스트가 포함된 콘텐츠를 제공(수신)받는 기능을 수행할 수도 있다.
한편, 이러한 사용자 단말장치(400)에는 상기 텍스트 정보가 포함된 콘텐츠를 전송하거나, 번역된 텍스트가 포함된 콘텐츠를 제공받을 수 있는 전용 웹(Web) 또는 앱(App) 프로그램이 더 설치되어 있을 수 있다. 특히, 사용자 단말장치(400)는 종이문서와 같은 오프라인 상의 정보를 디지털 데이터로서 입력하여 통신망(100)을 통해, 분배형 번역시스템(300)으로 전송할 수 있는 이미지정보 입력장치를 더 포함하는 개념일 수 있다. 대표적으로는 스캐너(scanner)일 수 있는데, 본 발명에서는 일례로 오프라인 문서를 이미지(예를 들면, JPEG, JPG, PNG, TIFF, PDF 등) 파일의 디지털화된 이미지(전자 문서화)로 변환하여 전송할 수 있다. 이러한 정보 인식기술은 당업자에게 이미 공지의 기술이므로 상세한 설명은 생략하도록 한다. 이러한 기능(수단)들은 사용자 단말장치(400) 내부에 반드시 구비되는 것은 아니며, 유선 또는 근거리 무선통신 기술을 이용하여 정보를 송수할 수 있는 유/무선 통신모듈(미도시됨)에 의해 전기적으로 연결되는 별도의 장치에 의해 구현될 수도 있다.
다음으로, 본 발명의 일 실시예에 따른 제1 교정자 단말장치(500)는, 다수로 구성되며, 분배형 번역시스템(300)에서 분배모델을 기준으로 설정된 분배단위에 따라 분배되는 텍스트(원어 텍스트)를 교정하여, 다시 분배형 번역시스템(300)으로 제공(전송)하는 기능을 수행할 수 있는 디지털 기기일 수 있다.
보다 구체적으로, 다수의 제1 교정자 단말장치(500)는 분배형 번역시스템(300)에서 인식되어 생성된 상기 원어 텍스트가 분배모델을 기준으로 설정된 분배단위에 따라 다수의 제1 교정자 단말장치(500) 마다 할당하여 분배되면, 상기 원어 텍스트의 언어를 사용하는 원어 교정자에 의해 분배된 상기 원어 텍스트의 문장이 교정되는 과정을 수행할 수 있다. 또한, 상기 다수의 제1 교정자 단말장치(500)에서 교정된 상기 원어 텍스트는 다시 분배형 번역시스템(300)으로 제공(전송)되어 조합될 수 있다.
마지막으로, 본 발명의 일 실시예에 따른 제2 교정자 단말장치(600)는, 다수로 구성되며, 분배형 번역시스템(300)에서 분배모델을 기준으로 설정된 분배단위에 따라 분배되는 텍스트(번역 텍스트)를 교정하여, 다시 분배형 번역시스템(300)로 제공(전송)하는 기능을 수행할 수 있는 디지털기기일 수 있다.
보다 구체적으로, 다수의 제2 교정자 단말장치(600)는 분배형 번역시스템(300)에서 AI 알고리즘에 의해 자동 번역된 텍스트(번역 텍스트)가 분배모델을 기준으로 설정된 분배단위에 따라 다수의 제2 교정자 단말장치(600) 마다 할당하여 분배되면, 상기 번역 텍스트의 언어를 사용하는 번역 교정자에 의해 분배된 상기 번역 텍스트의 문장이 교정되는 과정을 수행할 수 있다. 또한, 상기 다수의 제2 교정자 단말장치(600)에서 교정된 상기 번역 텍스트는 다시 분배형 번역시스템(300)으로 제공(전송)되어 조합될 수 있다.
이때, 다수의 제1 교정자 단말장치(500) 및 다수의 제2 교정자 단말장치(600)는 이후 설명되는 분배모델의 분배방식 중에서 해당 제1 교정자 단말장치(500) 및 제2 교정자 단말장치(600)를 사용하는 원어 교정자 및 번역 교정자가 선택한 하나 또는 다수의 상기 분배단위의 그룹을 기준으로 재분배하는 과정을 수행할 수도 있는데, 도 4, 5를 참조한 이하의 상세한 설명에 의해 명확하게 이해될 수 있다.
한편, 이상에서 설명된 본 발명의 실시 예에 따른 사용자 단말장치(400), 제1 교정자 단말장치(500) 및/또는 제2 교정자 단말장치(600)는 통신망(100)을 통해 접속하여 상술된 번역서비스를 송수신할 수 있는 기능을 포함하는 디지털 기기로, 이러한 디지털 기기로는 공지된 모든 이동통신단말장치, 정보통신기기, 멀티미디어 단말장치, 유선 단말장치, 고정형 단말장치 및 IP(Internet Protocol) 단말장치 등의 다양한 단말장치가 적용될 수 있다. 구체적으로, 단말장치는 스마트폰(Smart Phone), PMP(Portable Multimedia Player), 개인 정보 단말기(Personal Digital Assistant: PDA), MID(Mobile Internet Device), 텔레매틱스(Telematics) 단말기, 데스크톱(Desktop), 태블릿 컴퓨터(Tablet PC), 노트북(Note book), 넷북(Net book) 등과 같이 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산 능력을 갖춘 디지털 기기로, 유/무선의 통신기능을 포함하고 있다면 얼마든지 본 발명에 따른 단말장치로서 채택될 수 있을 것이다.
또한, 사용자 단말장치(400), 제1 교정자 단말장치(500) 및/또는 제2 교정자 단말장치(600)에는 본 발명에 의한 번역서비스 및 이와 관련된 정보를 디스플레이 할 수 있는 표시수단을 구비할 수 있다. 여기서, 표시수단은 LCD(Liquid Crystal Display), TFT-LCD(Thin Film Transistor LCD), OLED(Organic Light Emitting Diodes), 발광다이오드(LED), AMOLED(Active Matrix Organic LED), 플렉시블 디스플레이(Flexible display) 및 3차원 디스플레이(3 Dimension) 등으로 구성될 수 있다. 이때, 표시수단에 터치스크린(touch screen) 형태가 포함될 수도 있어 입력수단의 기능 중 일부 또는 전부를 수행할 수도 있다.
특히, 본 발명에서의 사용자 단말장치(400)에는 오프라인 문서를 컴퓨터에서 인식할 수 있도록 디지털화된 이미지(전자 문서화)로 변환하여 읽어 들이는 별도의 이미지정보 입력장치[예를 들면, 스캐너(scanner)]를 더 포함하거나, 이와 연동되어 번역서비스 제공시, 텍스트 정보 수집의 편의성을 향상시킬 수 있다.
한편, 본 발명의 일 실시예를 나타내는 도 1에서는, 분배형 번역시스템(300)과 운영 서버(200)가 별개로 구성되어 있는 것으로 도시되어 있지만, 본 발명을 구현하는 당업자의 필요에 따라, 분배형 번역시스템(300)을 운영 서버(200)에 통합하여 구성할 수 있음은 자명할 것이다.
분배형 번역시스템(300)의 구성
이하의 상세한 설명에서는, 본 발명의 구현을 위하여 중요한 기능을 수행하는 분배형 번역시스템(300)의 내부 구성 및 각 구성요소의 기능에 대하여 살펴보기로 한다.
도 2는 본 발명의 일 실시예에 따른 분배형 번역시스템(300)의 내부 구성을 상세하게 도시한 도면이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 분배형 번역시스템(300)은 제1 정보 처리부(310), 제1 분배 교정부(320), AI 번역부(330), 제2 분배 교정부(340), 제2 정보 처리부(350), 데이터베이스(360), 통신부(370) 및 제어부(380)를 포함하여 구성될 수 있다.
이러한 본 발명의 일 실시예에 따르면, 제1 정보 처리부(310), 제1 분배 교정부(320), AI 번역부(330), 제2 분배 교정부(340), 제2 정보 처리부(350), 데이터베이스(360), 통신부(370) 및 제어부(380)는 그 중 적어도 일부가 운영 서버(200), 사용자 단말장치(400), 제1 교정자 단말장치(500) 및/또는 제2 교정자 단말장치(600)와 데이터를 송수신하는 프로그램 모듈들일 수 있다. 이러한 프로그램 모듈들은 운영 시스템, 응용 프로그램 모듈 및 기타 프로그램 모듈의 형태로 분배형 번역시스템(300)에 포함될 수 있으며, 물리적으로는 여러 가지 공지의 기억 장치 상에 저장될 수 있는데, 하드웨어적인 구성요소(예를 들면, 범용 프로세서, 전용 프로세서) 및/또는 소프트웨어적인 구성요소(예를 들면, 펌웨어, 애플리케이션, 프로그램 모듈)와 이들의 조합으로 구현될 수 있다. 또한, 이러한 프로그램 모듈들은 분배형 번역시스템(300)과 통신 가능한 원격 기억 장치에 저장될 수도 있다. 한편, 이러한 프로그램 모듈들은 본 발명에 따라 후술할 특정 업무를 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 본 발명이 이에 한정되는 것은 아니다.
먼저, 본 발명의 일 실시예에 따른 제1 정보 처리부(310)는, 사용자 단말장치(400)에서 수집되거나 변환되어 전송되는 콘텐츠에 포함된 텍스트를 인식하여 추출하고, 추출된 상기 텍스트로 원어 텍스트로 생성하는 기능을 수행할 수 있다.
보다 구체적으로, 제1 정보 처리부(310)는 사용자 단말장치(400)에서 작성(전자문서 작성기로 작성한 정보), 검색(온라인으로 검색한 정보), 촬영(카메라로 저장한 정보) 중 어느 하나 이상으로 수집(획득)되는 텍스트를 포함하는 콘텐츠(예를 들면, 동영상, 이미지, 전자문서)를 처리할 수 있다.
또한, 제1 정보 처리부(310)는 사용자 단말장치(400)에서 오프라인 상의 문서를 컴퓨터에서 인식할 수 있도록 디지털화된 이미지(예를 들면, 전자 문서화)로 변환하여 읽어 들이는 별도의 화상정보 입력장치[예를 들면, 스캐너(scanner)]를 통해 텍스트가 포함된 콘텐츠(예를 들면, 전자화 문서)를 처리할 수 있다.
이때, 상기 콘텐츠에서 텍스트를 인식하여 추출한 후, 원어 텍스트를 생성하는 과정을 수행할 수 있는데, 상기 콘텐츠(예를 들면, 동영상, 이미지, 전자화 문서 등)에서 텍스트를 추출할 수 있는 광학식 문자 판독(OCR: Optical character reader) 전용 소프트웨어를 더 포함할 수 있는데, 이러한 문자 판독 기술은 이에 한정되는 것은 아니며, 공지된 기술을 제한 없이 적용하여 처리할 수 있다. 한편, 상기 콘텐츠가 전자문서 작성기로 작성된 전자문서일 경우 별도의 복잡한 문자 인식과정 없이도 전자문서에서 텍스트만을 리드(read) 할 수 있다.
다음으로, 본 발명의 일 실시예에 따른 제1 분배 교정부(320)는, 상기 원어 텍스트를 해당 분배모델을 기준으로 설정된 분배단위에 따라, 다수의 제1 교정자 단말장치(500) 마다 할당하여 분배하고, 분배된 상기 원어 텍스트가 상기 다수의 제1 교정자 단말장치(500)에서 교정되어 수집되면, 이를 다시 조합하는 기능을 수행할 수 있다.
보다 구체적으로, 제1 분배 교정부(320)는 상기 원어 텍스트에서 피리어드(Period)인 마침표를 기준으로 구분된 하나 또는 다수의 문장 덩어리의 집합을 상기 분배단위로 설정하여 분배함으로써, 분배효율을 향상시킬 수 있다.
또한, 제1 분배 교정부(320)는 분배된 상기 원어 텍스트가 상기 다수의 제1 교정자 단말장치(500)에서 교정되면, 이를 수집하여 조합함으로써, 하나의 교정된 원어 텍스트가 완성(생성)될 수 있다.
다음으로, 본 발명의 일 실시예에 따른 AI 번역부(330)는, 교정되어 조합된 상기 원어 텍스트를 인공지능 알고리즘에 따라 사용자 단말장치(400)에서 선택한 언어로 기계번역 하여 번역 텍스트를 생성하는 기능을 수행할 수 있다.
보다 구체적으로, AI 번역부(330)는 인간이 사용하는 자연 언어의 번역을 인공지능 알고리즘이 내장된 기계(computer)를 통해 처리하는 것으로, 특정 언어의 텍스트를 다른 언어의 텍스트로 기계(자동) 번역하는 기능을 수행할 수 있다. 예를 들면, 단어 사전과 번역 규칙을 이용하는 규칙 기반 기계 번역(RBMT: Rule-Based Machine Translation), 원문과 해당 번역문에 대한 대량의 말뭉치 데이터를 활용하는 통계적 기계 번역(SMT: Statistical Machine Translation), 원문과 해당 번역문 사이의 관계를 인공 신경망으로 학습하는 신경망 기계 번역(NMT: Neural Machine Translation) 등 공지된 번역 기술을 제한 없이 채택하여 사용할 수 있다.
다음으로, 본 발명의 일 실시예에 따른 제2 분배 교정부(340)는, 상기 번역 텍스트를 해당 분배모델을 기준으로 설정된 분배단위에 따라, 다수의 제2 교정자 단말장치(600) 마다 할당하여 분배하고, 분배된 상기 번역 텍스트가 상기 다수의 제2 교정자 단말장치(6000에서 교정되어 수집되면, 이를 다시 조합하는 기능을 수행할 수 있다.
보다 구체적으로, 제2 분배 교정부(340)는 상기 번역 텍스트에서 피리어드(Period)인 마침표를 기준으로 구분된 하나 또는 다수의 문장 덩어리의 집합을 상기 분배단위로 설정하여 분배함으로써, 분배효율을 향상시킬 수 있다.
또한, 제2 분배 교정부(340)는 분배된 상기 번역 텍스트가 상기 다수의 제2 교정자 단말장치(600)에서 교정되면, 이를 수집하여 조합함으로써, 하나의 교정된 번역 텍스트가 완성(생성)될 수 있다.
한편, 이상에서 설명된, 상기 텍스트(원어 텍스트 및 번역 텍스트)를 해당 분배모델을 기준으로 설정된 분배단위에 따라 다수의 제1 교정자 단말장치(500) 및 제2 교정자 단말장치(600)를 통해 교정자(원어 교정자, 번역 교정자)마다 분배하는 방식은 다음과 같이 크게 세가지로 구분할 수 있다.
첫째, 상기 원어 텍스트 및 상기 번역 텍스트의 글자수 또는 단어수 중 어느 하나를 기준으로, 상기 분배단위에 따라 상기 다수의 제1, 제2 교정자 단말장치(500, 600) 마다 할당하여 분배하는 방식, 둘째, 분배된 상기 원어 텍스트 및 분배된 상기 번역 텍스트가 교정되어 수집되는데 소요되는 교정시간을 기준으로, 상기 분배단위에 따라 상기 다수의 제1, 제2 교정자 단말장치(500, 600) 마다 할당하여 분배하는 방식, 셋째, 분배된 상기 원어 텍스트 및 분배된 상기 번역 텍스트 중에서 상기 다수의 제1 교정자 단말장치(500) 또는 상기 다수의 제2 교정자 단말장치(600)가 선택한 하나 또는 다수의 상기 분배단위의 그룹을 기준으로 재분배하는 방식 중 어느 하나이거나 이들의 조합으로 구성되는 방식일 수 있는데, 보다 구체적인 내용은 도 3 내지 도 5를 참조한 이하의 상세한 설명에 의해 이해될 수 있다.
다음으로, 본 발명의 일 실시예에 따른 제2 정보 처리부(350)는, 제2 분배 교정부(340)에서 제공하는 교정되어 조합된 상기 번역 텍스트를 다시 사용자 단말장치(400)로 제공하는 기능을 수행할 수 있다.
보다 구체적으로, 제2 정보 처리부(350)는 제2 분배 교정부(340)에서 제공하는, 교정되어 조합된 상기 번역 텍스트 또는 이를 기초로 사용자가 요청하는 양식으로 문서화(예를 들면, WORD, PDF, PPT, HTML 등)하여 제공할 수 있다. 상기 문서에는 상기 원어 텍스트의 교정자 및 상기 번역 텍스트의 교정자의 정보를 포함하여 제공하기 때문에, 사용자가 원하는 양식으로 다운받을 수 있으며, 번역내용의 정확도에 대한 보증 및 책임소재를 명확하게 할 수 있는 효과가 있다.
다음으로, 본 발명의 일 실시예에 따른 데이터베이스(360)는, 번역서비스에 필요하거나 관련된 정보, 예를 들면, 사용자 정보, 텍스트 정보, 자연어 정보, 단어/문장 정보, 분배모델 정보 등을 저장할 수 있는 저장장치일 수 있다.
한편, 비록 도 2에서 데이터베이스(360)는 분배형 번역시스템(300)에 포함되어 구성되는 것으로 도시되어 있지만, 본 발명을 구현하는 당업자의 필요에 따라, 데이터베이스(360)는 분배형 번역시스템(300)과 별개로 구성하거나 운영 서버(200)에 포함되도록 구성할 수도 있다. 이러한, 데이터베이스(360)는 컴퓨터 판독 가능한 기록 매체를 포함하는 개념으로서, 협의의 데이터베이스뿐만 아니라, 파일 시스템에 기반한 데이터 기록 등을 포함하는 넓은 의미의 데이터베이스도 포함하여 지칭하며, 단순한 로그의 집합이라도 이를 검색하여 데이터를 추출할 수 있다면 본 발명에서 말하는 데이터베이스(360)에 포함될 수 있다.
다음으로, 본 발명의 일 실시예에 따른 통신부(370)는, 분배형 번역시스템(300)의 내부 구성들이 운영 서버(200), 분배형 번역시스템(300), 사용자 단말장치(400), 제1 교정자 단말장치(500) 및/또는 제2 교정자 단말장치(600) 등과 같은 외부 장치와 데이터(정보)를 송수신할 수 있도록 하는 기능을 수행할 수 있다.
마지막으로, 본 발명의 일 실시예에 따른 제어부(380)는, 제1 정보 처리부(310), 제1 분배 교정부(320), AI 번역부(330), 제2 분배 교정부(340), 제2 정보 처리부(350), 데이터베이스(360) 및 통신부(370) 간의 데이터의 흐름을 제어하는 기능을 수행할 수 있다. 즉, 본 발명에 따른 제어부(380)는 외부로부터의, 또는 분배형 번역시스템(300)의 각 구성요소 간의 데이터의 흐름을 제어함으로써, 제1 정보 처리부(310), 제1 분배 교정부(320), AI 번역부(330), 제2 분배 교정부(340), 제2 정보 처리부(350), 데이터베이스(360) 및 통신부(370)에서 각각 고유 기능을 수행하도록 제어할 수 있다.
한편, 도 3에 도시되지는 않았지만, 사용자 단말장치(400)에서 신청한 번역조건(예를 들면, 교정자 레벨, 교정자 인원수)에 따라, 다수의 상기 제1, 2 교정자 단말장치(500, 600)를 매칭하는 매칭부를 더 포함할 수 있다. 이러한 상기 매칭부는, 다수의 상기 제1, 2 교정자 단말장치(500, 600)의 교정 통계정보(예를 들면, 사용자 만족도)를 기초로 상기 번역조건의 적합도에 따라 우선 배정될 수 있다.
예를 들면, 사용자가 자신이 요청하는 번역량과 중요도를 감안하여 중간 레벨의 교정자 3명을 번역조건으로 신청할 경우, 상기 매칭부는 이에 맞는 교정자를 추천후보(예를 들면, 2배수)로 매칭시켜 줄 수 있는데, 이때, 사용자는 해당 추천후보자들의 과정 교정결과에 대한 만족도를 기초로 하는 적합도에 따라 우선순위를 배정하여 신청할 수 있다. 따라서 최종적으로 해당 교정자(원어 교정자, 번역 교정자)가 매칭되면, 해당 분야의 경험이 축적된 보다 전문적인 교정자를 매칭 받을 수 있는 효과가 있다.
분배모델의 예시
이하의 상세한 설명에서는, 본 발명에 의한 분배형 번역시스템(300)에서 신속하고도 정확한 번역서비스를 제공하기 위해 중요한 기능을 수행하는, 분배모델을 예시를 통해 설명하도록 한다. 설명의 편의를 위해 제1 교정자 단말장치(500)를 원어 교정자, 제2 교정자 단말장치(600)를 번역 교정자로 등가적으로 표현하도록 한다.
상기 텍스트(원어 텍스트 및 번역 텍스트)를 해당 분배모델을 기준으로 설정된 분배단위에 따라 다수의 제1 교정자 단말장치(500) 및 제2 교정자 단말장치(600)를 통해 교정자(원어 교정자, 번역 교정자)마다 분배하는 방식은 다음과 같이 크게 세가지로 구분할 수 있다.
첫째, 상기 원어 텍스트 및 상기 번역 텍스트의 글자수 또는 단어수 중 어느 하나를 기준으로, 상기 분배단위에 따라 상기 다수의 제1, 제2 교정자 단말장치(500, 600) 마다 할당하여 분배하는 방식, 둘째, 분배된 상기 원어 텍스트 및 분배된 상기 번역 텍스트가 교정되어 수집되는데 소요되는 교정시간을 기준으로, 상기 분배단위에 따라 상기 다수의 제1, 제2 교정자 단말장치(500, 600) 마다 할당하여 분배하는 방식, 셋째, 분배된 상기 원어 텍스트 및 분배된 상기 번역 텍스트 중에서 상기 다수의 제1 교정자 단말장치(500) 또는 상기 다수의 제2 교정자 단말장치(600)가 선택한 하나 또는 다수의 그룹(그룹화)을 기준으로, 상기 분배단위에 따라 재분배하는 방식 중 어느 하나이거나 이들의 조합으로 구성되는 방식일 수 있다.
보다 구체적으로, 먼저, 본 발명에 의한 글자수 또는 단어수 중 어느 하나를 기준으로 분배하는 방식을 살펴보면, 텍스트(원어 텍스트, 번역 텍스트)의 글자수 또는 단어수가 n개(n은 자연수)를 기준으로, 상기 n개 이내에 모두 포함되는 문장 덩어리로 구성된 상기 분배단위에 따라 상기 제1, 제2 교정자 단말장치(원어 교정자, 번역 교정자)로 할당하여 분배할 수 있다. 이와 반대로 글자수 또는 단어수가 상기 n개 중 일부라도 포함되는 문장 덩어리로 구성된 상기 분배단위에 따라 상기 제1, 제2 교정자 단말장치(원어 교정자, 번역 교정자)로 할당하여 분배할 수 있다.
예를 들면, 단어수 10개를 기준으로 할 경우, 텍스트(원어 텍스트, 번역 텍스트)에서 10개의 단어까지 구분한 후, 상기 단어수 10개 이내에 모두 포함되는 문장의 덩어리(분배단위)만을 분배할 수 있는데, "안녕하세요. 저는 이번 회의에서 주제 발표를 하게 되었습니다. 이번 주제는 빅데이터의 발전방향에 관한 것입니다."라는 텍스트(원어 텍스트: 한국어)에서 10개의 단어수를 기준으로 할당하면, '안녕하세요. 저는 이번 회의에서 주제 발표를 하게 되었습니다. 이번 주제는'까지 이다. 따라서, 피리어드(Period)인 마침표를 기준으로 하는 문장의 덩어리(분배단위) 중에서 '이번 주제는'은 상기 단어수 10개 이내에 모두 포함되는 문장의 덩어리(분배단위)가 아니므로, '안녕하세요. 저는 이번 회의에서 주제 발표를 하게 되었습니다.'까지의 2개 문장의 덩어리(분배단위)만 다수의 교정자(원어 교정자) 중 제1 교정자에게 할당하여 분배할 수 있다. 결국, '이번 주제는 빅데이터의 발전방향에 관한 것입니다.'는 다수의 교정자(원어 교정자) 중 다른 교정자에게 분배될 수 있다.
이러한 텍스트(원어 텍스트, 번역 텍스트)의 글자수 또는 단어수 n개(n은 자연수)를 기준으로 분배하는 방식의 경우, 상기 n개의 기준값은 분배형 번역시스템(300)에서 설정되거나, 사용자에 의해 선택될 수 있으나, 본 발명이 이에 한정되는 것은 아니며 이후 설명되는 교정시간에 따라 가변적으로 변경될 수 있다. 즉, 텍스트(원어 텍스트, 번역 텍스트)의 교정 속도가 빨라지면 상기 n개의 기준값은 증가할 수 있고, 교정 속도가 느려지면 상기 n개의 기준값은 감소할 수도 있다.
다음으로, 본 발명에 의한 교정시간을 기준으로 분배하는 경우를 살펴보면, 교정자(원어 교정자, 번역 교정자)에게 분배된 텍스트(원어 텍스트, 번역 텍스트)가 교정이 완료되어 분배형 번역시스템(300)으로 입력되는데(수집되는데) 소요되는 시간(교정시간)을 기준으로 분배하는 방식일 수 있다.
보다 구체적으로, 상기 교정시간은 상기 교정자가 분배형 번역시스템(300)으로부터 분배된 텍스트를 수신한 시간부터 교정을 완료하여 분배형 번역시스템(300)으로 입력한 시간까지의 소요시간을 의미할 수 있다.
예를 들면, 상기 교정시간이 최저 설정시간 이내에 교정이 완료되면, 다음 분배 순서에서는 교정이 완료된 상기 분배단위 문장 덩어리의 2배 분량을 분배단위로 설정하여 분배할 수 있다. 또한, 상기 교정시간이 최고 설정시간을 초과하여 교정이 완료되면, 다음 분배 순서에서는 교정이 완료된 상기 분배단위 문장 덩어리의 1/2배 분량만을 분배단위로 설정하여 분배할 수 있다. 또한, 상기 교정시간이 상기 최저 설정시간은 초과하고 상기 최고 설정시간 이내에 교정이 완료되면, 다음 분배 순서에서는 교정이 완료된 상기 분배단위 덩어리 문장의 분량을 유지하여 분배할 수 있다.
일 예로, 이러한 최저 설정시간은 온라인 상에서 실시간 번역서비스가 원활하게 수행될 수 있는 시간(예를 들면, 5초 이내)을 의미할 수 있으며, 최고 설정시간은 온라인 상에서 실시간 번역서비스를 제공하기 어려운 한계 시간(예를 들면, 10초 초과)을 의미할 수 있다. 한편, 이와 같은 교정시간을 기준으로 분배하는 방식은, 교정자(원어 교정자, 번역 교정자) 마다 분배된 텍스트(원어 텍스트, 번역 텍스트)를 할당순서를 결정할 수도 있다. 이러한 할당순서는 도 3을 참조한 이하의 상세한 설명에 의해 이해될 수 있다.
도 3은 본 발명의 일 실시예에 따른 분배모델을 기준으로 설정된 분배단위에 따라, 텍스트를 다수의 교정자 단말장치 마다 할당하여 분배하는 맵핑도이다.
설정된 분배모델의 기준에 따라 텍스트(원어 텍스트, 번역 텍스트)를 다수의 교정자들에게 순서대로 할당할 수 있는데, 분배된 상기 원어 텍스트 및 분배된 상기 번역 텍스트 중 교정이 완료되는 시간이 짧을수록 할당순서가 우선하며, 다수의 제1, 제2 교정자 단말장치(500, 600) 중 보유중인 상기 분배단위가 설정범위를 초과하면, 해당 단말장치는 다음 분배순서에서는 할당순서를 누락할 수 있다. 또한, 다수의 제1, 제2 교정자 단말장치(500, 600) 중 이전 분배순서의 교정이 완료되는 시간이 가장 짧은 단말장치로 중복 분배될 수도 있다.
도 3을 참조하면, 일 예로, 앞서 설명된 단어수 n개를 기준으로 번역 텍스트를 할당하여, 다수의 번역 교정자(A, B, C, D 교정자 단말)에게 분배하는 경우를 설명하도록 한다.
먼저, 다수의 번역 교정자(A, B, C, D 교정자 단말) 마다 번역 텍스트(1, 2, 3, 4)를 분배할 수 있는데, 이러한 1차 분배과정은 다수의 번역 교정자마다 순차적으로 진행되어 'A 교정자 단말은 번역 텍스트1, B 교정자 단말은 번역 텍스트2, C 교정자 단말은 번역 텍스트3, D 교정자 단말은 번역 텍스트4'로 분배될 수 있다. 이때의 시점을 단위시간의 시작점으로 설정할 수 있다. 이어서, 1차 분배과정에서 분배된 번역 텍스트(1, 2, 3, 4) 중에서 3, 2, 4 순서로 교정이 완료(도 3의 음영 원형)되어 교정된 번역 텍스트가 분배형 번역시스템(300)으로 입력될 수 있다. 한편, A 교정자 단말에 분배된 번역 텍스트1은 교정이 완성되지 않았다.
이어서, 2차 분배과정(단위시간1 기준, 5초)에서는, 교정이 완료된 순서에 따라 할당이 진행되어, 다수의 번역 교정자 마다 번역 텍스트 8, 6, 5, 7이 순서대로 할당될 수 있다. 즉, 아직 교정이 완료되지 않은 A 교정자 단말이 가장 늦은 순서로 번역 텍스트8이 할당될 수 있다.
이어서, 2차 분배과정에서 분배된 번역 텍스트(8, 6, 5, 7) 중에서 6, 5, 7 순서로 교정이 완료(도 3의 음영 원형)되어 교정된 번역 텍스트가 분배형 번역시스템(300)으로 입력될 수 있다.
이어서, 3차 분배과정(단위시간2 기준, 10초)에서는, 교정이 완료된 순서에 따라 할당이 진행되어, 다수의 번역 교정자 마다 번역 텍스트 9+12, 10, 11 순서대로 할당될 수 있다. 즉, A교정자 단말은 번역 텍스트 1, 8이 아직 교정이 완료되지 않은 상태이므로 더 이상의 할당이 보류(중지)되고, A교정자 단말에 분배되어야 할 번역 텍스트8은 B교정자 단말로 전달(이동)되어 중복 분배될 수 있다. 이때, 번역 텍스트의 보유 한계값(Limit)은 일 예로 2개를 보유하는 경우로 설정될 수 있다.
다음으로, 본 발명에 의한 교정자(원어 교정자, 번역 교정자)가 선택한 하나 또는 다수의 상기 분배단위의 그룹을 기준으로 재분배하는 경우를 살펴보면, 교정자(원어 교정자, 번역 교정자)에게 분배된 텍스트(원어 텍스트, 번역 텍스트)를 교정하는 과정에서, 교정자(원어 교정자, 번역 교정자)의 선택에 따라 분배된 텍스트(원어 텍스트, 번역 텍스트)가 그룹화되어 재분배될 수 있다.
도 4는 본 발명의 일 실시예에 따른 다수의 교정자 단말장치 중 어느 하나의 단말장치의 교정 인터페이스 화면이다.
도 4를 참조하면, 상기 다수의 제1, 제2 교정자 단말장치(500, 600)가 선택한 하나 또는 다수의 상기 분배단위의 그룹을 기준으로 재분배하는 방식은, 상기 다수의 제1, 제2 교정자 단말장치(500, 600) 마다 서로 다르게 구성되는 교정 인터페이스(10) 상에서 제공될 수 있다. 이러한 교정 인터페이스(10)는, 다수의 분배 텍스트 블록(20: 21, 22, 23), 교정 블록(30) 및 선택블록(40)을 포함하며 구성될 수 있다.
먼저, 다수의 분배 텍스트 블록(20: 21, 22, 23)은 분배된 상기 원어 텍스트 또는 분배된 상기 번역 텍스트 중 순차적으로 조합될 수 있으며, 다수의 분배 텍스트 블록(20: 21, 22, 23)은 해당 제1, 제2 교정자 단말장치(500, 600) 마다 할당되어 분배된 해당 분배단위가 배치된 분배 텍스트 블록(22)은 중앙에 배열하고, 순차적으로 조합되는 해당 분배단위가 배치된 분배 텍스트 블록(21, 23)은 그 주변에 순서대로 배열될 수 있다.
이어서, 교정 블록(30)은, 다수의 분배 텍스트 블록(20: 21, 22, 23) 중 어느 하나 이상을 교정하여 입력할 수 있다. 이때, 중앙에 배열된 해당 분배 텍스트 블록(22)은 활성화 상태일 수 있다.
이어서, 선택블록(40)은, 다수의 분배 텍스트 블록(20: 21, 22, 23) 중 교정대상(활성화) 여부를 선택하여, 상기 분배단위를 그룹화할 수 있다.
보다 구체적으로 일 예로, 번역 교정자에게 분배된 번역 텍스트를 기준으로 설명하면, 제2 교정자의 단말장치(600)에 디스플레이 되는 교정 인터페이스 화면(10) 상에 분배된 제2 분배 텍스트 블록(번역 텍스트4: 22)이 중앙에 배열된 모습을 보여주고 있다. 이때, 제2 분배 텍스트 블록(번역 텍스트4: 22)의 앞단으로 다른 번역 교정자에게 분배된 제1 분배 텍스트 블록 (번역 텍스트3: 21)가 상단에 배열되고, 제2 분배 텍스트 블록(번역 텍스트4: 22)의 뒷단으로 또 다른 번역 교정자에게 분배된 제3 분배 텍스트 블록(번역 텍스트5: 23)가 하단에 배열될 수 있다.
이러한 상단과 하단의 다른 번역 교정자들에게 분배된 제1, 3 분배 텍스트 블록(번역 텍스트3, 5: 21, 23)은 비활성화(음영) 되어 제공되며, 해당 번역 교정자에게 분배된 제2 분배 텍스트 블록(번역 텍스트4: 22)만이 활성화 되어 제공될 수 있다.
이어서, 맨 하단에 위치하는 교정 블록(30)은 활성화된 제2 분배 텍스트 블록(번역 텍스트4: 22)에 대하여 해당 번역 교정자에 교정한 후, 결과를 입력하는 영역일 수 있다. 이러한 교정 블록(30)에는 활성화된 분배 텍스트 블록이 기본적으로 반영(복사 입력)되어 교정과정이 진행될 수 있다. 이때, 교정과정이 완성되면 교정완료 선택블록(40)의 완료버튼(42) 선택하여 분배형 번역시스템(300)로 전송할 수 있다.
이어서, 다른 번역 교정자들에게 분배된 제1, 3 분배 텍스트 블록(번역 텍스트3, 5: 21, 23)의 우측 선택블록(40)에는 각각의 선택버튼(41a, 41b)이 배열되는데, 이러한 선택버튼(41a, 41b)을 선택(클릭)할 경우, 해당 제1, 3 분배 텍스트 블록(번역 텍스트3, 5: 21, 23)의 음영이 제거되고 활성화 상태로 변경될 수 있다. 예를 들면, 제1 분배 텍스트 블록(번역 텍스트3: 21)의 우측에 위치하는 선택버튼(41a)을 선택(클릭)할 경우, 해당 블록이 활성화되어,'번역 텍스트3: 21 + 번역 텍스트4: 22'으로 그룹화되어 재분배 설정되고, 맨 하단에 위치하는 교정 블록(30)에도 활성화된 분배된 번역 텍스트1, 4가 기본적으로 반영(복사 입력)되어 교정과정이 진행될 수 있다.
이와 동일한 원리로, 제3 분배 텍스트 블록(번역 텍스트5: 23)의 우측에 위치하는 선택버튼(41b)을 선택(클릭)할 경우, 해당 블록이 활성화되어, '번역 텍스트4: 22 + 번역 텍스트5: 23'으로 그룹화되어 설정될 수 있다. 한편, 선택버튼(41a, 41b)이 모두 선택될 경우 제1, 2, 3 분배 텍스트 블록(21, 22, 23)이 모두 활성화되어 '번역 텍스트3: 21 + 번역 텍스트4: 22 + 번역 텍스트5: 23'으로 그룹화되어 재분배 설정될 수 있다.
이러한 번역 교정자의 선택에 따라 분배된 텍스트가 그룹화 되어 재분배되는 과정은 도 5를 참조한 이하의 상세한 설명에 의해 보다 명확하게 이해될 수 있다.
도 5는 본 발명의 일 실시예에 따른 분배된 텍스트를 재분배하여 교정하는 과정을 보여주는 교정자 단말장치 마다의 교정 인터페이스 화면이다.
도 5를 참조하면, 일 예로, 번역 교정자의 단말장치(600) 마다 디스플레이 되는 인터페이스 화면을 보여주고 있다. 설명의 편의를 위해 총 3명의 번역 교정자의 단말장치(600)의 교정 인터페이스 화면(A, B, C)을 기준으로 살펴보면 다음과 같다.
먼저, A교정자 단말 화면(A)에는 분배된 번역 텍스트(번역 텍스트4)가 제2 분배 텍스트 블록에 배치되어 활성화된 상태로 중앙에 배열된 모습을 보여주고 있다. 이어서, B교정자 단말 화면(B)에는 분배된 번역 텍스트(번역 텍스트5)가 제2 분배 텍스트 블록에 배치되어 활성화된 상태로 중앙에 배열되고, C교정자 단말 화면(C)에는 분배된 번역 텍스트(번역 텍스트6)가 제2 분배 텍스트 블록에 배치되어 활성화된 상태로 중앙에 배열될 수 있다. 이때, 상기 중앙에 배열된 번역 텍스트(제2 분배 텍스트 블록)의 상단과 하단에는 번역 텍스트의 순서상 앞단 및 뒷단에 위치하여 순차적으로 조합되는 번역 교정자의 단말장치(600) 마다 분배된 번역 텍스트가 배열될 수 있다.
따라서, 전체적으로는 A교정자 단말 화면(A)에는 분배된 번역 텍스트(번역 텍스트 3, 4, 5), B교정자 단말 화면(B)에는 분배된 번역 텍스트(번역 텍스트 4, 5, 6), C교정자 단말 화면(C)에는 분배된 번역 텍스트(번역 텍스트 5, 6, 7)가 순서대로 분배 텍스트 블록 마다 배치되어 배열되고, 각각의 번역 교정자 단말장치(600)의 교정 인터페이스 화면(A, B, C) 상에 디스플레이 될 수 있다.
이때, 각각의 번역 교정자는 기본적으로는 도 4를 참조하여 설명된 바와 같이 교정 인터페이스 화면(A, B, C)의 중앙에 위치하며 활성화되어 분배된 번역 텍스트(6, 7, 8)만을 교정할 수 있다. 다만, 각각의 번역 교정자는 분배된 번역 텍스트의 전체적인 문맥을 검토하여 순서상 앞단 및 뒷단에 위치하는 다른 번역 교정자에게 분배된 번역 텍스트까지 함께 교정하고자 할 경우에는, 비활성화된 번역 텍스트(분배 텍스트 블록) 우측에 위치하는 선택박스를 선택하여 그룹화하여 재분배하여 교정하는 과정을 진행할 수 있다. 이하에서는 이해를 돕기 위해 몇 가지 경우를 제시하여 설명하도록 한다.
먼저, A교정자(A)가 '번역 텍스트4'를 교정완료하고, B교정자(B)가 '번역 텍스트4 + 번역 텍스트5'을 그룹화하여 교정할 경우, 분배형 번역시스템(300) 상에서 A교정자(A)의 '번역 텍스트4'은 폐기(만일, '번역 텍스트4가 교정중인 경우에는 중지처리')하고, B교정자(B)의 '번역 텍스트4+ 번역 텍스트5'으로 그룹화된 교정이 우선 적용될 수 있다. 이는 그룹화된 교정이 전체적인 앞뒤 문맥에 따라 더 정확한 교정(번역) 품질을 제공하는 확률을 보여주기 때문이다. 이어서, C교정자(C)가 '번역 텍스트6'의 교정이 완료될 수 있다.
결과적으로, B교정자(B)의 '번역 텍스트4 + 번역 텍스트5'교정결과와 C교정자(C)의 '번역 텍스트6'교정결과가 분배형 번역시스템(300)으로 수집되어, '번역 텍스트4 + 번역 텍스트5 + 번역 텍스트6'으로 조합될 수 있다.
다음으로, 상기와 같은 경우에서, C교정자(C)가 '번역 텍스트5 + 번역 텍스트6'을 그룹화하여 교정할 경우, B교정자(B)의 '번역 텍스트4 + 번역 텍스트5'와 비교하여'번역 텍스트5'가 중복되는데, 이러한 경우 시간적으로 나중에 그룹화한 C교정자(C)가 B교정자(B) 보다 우선할 수 있다. 따라서, B교정자(B)의 '번역 텍스트4 + 번역 텍스트5'교정결과는 폐기되고, C교정자(C)가 '번역 텍스트4 + 번역 텍스트5 + 번역 텍스트6'을 모두 그룹화하여 교정할 수 있다. 만일, B교정자(B)가'번역 텍스트4 + 번역 텍스트5'를 아직 교정중인 경우에는 중지처리 할 수 있고, 대신 다른 분배된 번역 텍스트가 배정될 수 있다.
다음으로, B교정자(B)와 C교정자(C)가 모두'번역 텍스트5 + 번역 텍스트6'을 그룹화하여 교정할 경우, 앞단과 그룹화한 C교정자(C) 보다는 뒷단과 그룹화한 B교정자(B)가 우선할 수 있다. 이는 교정자에게 분배된 번역 텍스트를 중심으로 뒷단에 위치(배열)하는 번역 텍스트를 함께 교정(번역)할 경우 전체적인 문맥에 따라 더 정확한 교정(번역) 품질을 제공하는 확률을 보여주기 때문이다.
다음으로, B교정자(B)가 '번역 텍스트4 + 번역 텍스트5' 그룹화하여 교정하고, C교정자(C)가'번역 텍스트5 + 번역 텍스트6 + 번역 텍스트7'을 그룹화하여 교정할 경우, 앞단과 그룹화한 B교정자(B) 보다는 뒷단과 그룹화한 C교정자(C)가 우선할 수 있다. 따라서, B교정자(B)의 '번역 텍스트4 + 번역 텍스트5'교정결과는 폐기(만일, 아직 교정중인 경우에는 중지처리)되고, C교정자(C)가 '번역 텍스트5 + 번역 텍스트6 + 번역 텍스트7'을 모두 그룹화하여 교정할 수 있다.
따라서, 상술된 원리를 정리해 보면, 상기 다수의 제1, 제2 교정자 단말장치(500, 600) 중에서 선택한, 단일 분배 텍스트 블록 보다 그룹화 된 분배 텍스트 블록을 선택한 단말장치의 교정결과가 우선될 수 있다.
또한, 상기 다수의 제1, 제2 교정자 단말장치(500, 600) 중에서 선택한, 그룹화 된 분배 텍스트 블록의 전체가 중복되는 경우, 시간적으로 나중에 선택한 단말장치의 교정결과가 우선될 수 있다.
또한, 상기 다수의 제1, 제2 교정자 단말장치(500, 600) 중에서 선택한, 그룹화 된 분배 텍스트 블록의 일부가 중복되는 경우, 순차적으로 조합되는 뒷부분의 분배 텍스트 블록을 선택한 단말장치의 전체 그룹화 된 분배 텍스트 블록의 교정결과가 우선될 수 있다.
이상에서 설명된 본 발명에 따른 분배형 번역시스템(300)의 보다 구체적인 구성에 대한 이해를 돕기 위해, 이하의 상세한 설명에서는 사용자가 시스템에 접속하여 번역서비스를 신청하고, 이를 따라 분배모델을 기반으로 번역서비스를 제공하는 과정(방법)에 대하여, 일례를 들어 설명한다.
분배모델을 기반으로 번역서비스를 제공하기 위한 과정
이하의 상세한 설명에서는, 본 발명에 의한 분배모델을 기반으로 번역서비스를 제공하는 과정에 대하여, 분배형 번역시스템(300), 사용자 단말장치(400), 제1 교정자 단말장치(500) 및 제2 교정자 단말장치(600) 간에 데이터 처리과정을 중심으로 일 예를 들어 설명하지만, 이는 설명의 편의를 위해 가장 대표적인 과정을 설명한 것으로, 본 발명이 이에 한정되는 것은 아니다.
도 6은 본 발명의 일 실시예에 따른 분배모델을 기반으로 번역서비스를 제공하기 위한 각 구성들 간의 흐름도이다.
도 6을 참조하면, 먼저, 사용자 단말장치(400)에서 텍스트 정보를 포함하는 콘텐츠를 수집(획득)하거나 변환하는 과정(S10)을 진행하고, 이러한 텍스트를 포함하는 콘텐츠를 분배형 번역시스템(300)으로 전송하여 번역을 요청하는 과정을 수행할 수 있다(S20). 이때, 일 예로, 사용자 단말장치(400)는 작성(전자문서 작성기로 작성한 정보), 검색(온라인으로 검색한 정보), 촬영(카메라로 저장한 정보) 중 어느 하나 이상으로 텍스트를 포함하는 콘텐츠를 수집(획득)하여 분배형 번역시스템(300)으로 전송하거나, 종이문서와 같은 오프라인 상의 정보를 전자 이미지(예를 들면, JPEG, JPG, PNG, TIFF, PDF 등) 파일인 디지털화된 이미지(전자 문서화)로 변환하여 분배형 번역시스템(300)으로 전송할 수 있는 스캐너(scanner)를 포함하는 개념일 수 있다.
이어서, 분배형 번역시스템(300)는 사용자 단말장치(400)에서 제공되는 상기 콘텐츠(예를 들면, 동영상, 이미지, 전자화 문서 등)에서 텍스트 정보만을 인식하여 추출하고, 이를 기초로 원어 텍스트를 생성하는 텍스트 처리 과정을 수행할 수 있다(S30). 예를 들면, 한국어로 작성된 오프라인 상의 서류 문서를 스캐너로 전자 이미지 파일로 변환한 후, 상기 이미지에서 한국어 텍스트만을 광학식 문자 판독(OCR: Optical character reader) 기술로 인식하여 추출하고, 이를 소프트웨어 상에서 한국어(한글)로 구성된 원어 텍스트 전자 파일을 생성할 수 있다. 이때, 상기 콘텐츠가 전자문서 작성기로 작성된 전자문서일 경우 별도의 복잡한 문자 인식과정 없이도 전자문서에서 텍스트만을 리드(read) 할 수 있다.
이어서, 상기 원어 텍스트의 정확도를 향상시키기 위하여, 분배단위에 따라 설정된 분배모델의 기준으로 상기 원어 텍스트를 다수의 제1 교정자 단말장치(500) 마다 할당하여 분배하는 과정을 연속적으로 수행할 수 있다(S40, S50). 상기 분배단위는, 상기 원어 텍스트에서 피리어드(Period)인 마침표를 기준으로 구분된 하나 또는 다수의 문장 덩어리의 집합일 수 있는데, 이러한 분배모델(S40)에 대한 상세한 설명은 앞서 도 3 내지 도 5를 참조하여 상술된 설명과 중복됨으로 생략하도록 한다.
이어서, 분배된 원어 텍스트는 해당 제1 교정자 단말장치(500)의 사용자인 원어 교정자에 의해, 원어 텍스트의 오류 부분과 미흡한 부분을 교정하는 텍스트 교정과정을 수행할 수 있다(S60).
이어서, 상기 교정된 원어 텍스트는 다수의 제1 교정자 단말장치(500)에서 분배형 번역시스템(300)로 제공(전송)되어 조합하는 과정을 수행할 수 있다(S70). 이때, 각각의 교정된 원어 텍스트는 분배단위인 문장 덩어리가 모인 분배단위일 수 있는데, 이러한 분배단위들을 순차적으로 조합하여 완성된 하나의 교정된 원어 텍스트가 완성될 수 있다.
이어서, 교정되어 조합된 상기 원어 텍스트를 인공지능(AI) 알고리즘에 따라 사용자 단말장치(400)에서 선택한 언어로 번역하는 기계번역 과정을 수행할 수 있다(S80). 예를 들면, 상기 선택한 언어가 영어일 경우, 기계번역 과정(S80)을 통해 한국어(한글)로 구성된 원어 텍스트를 영어로 구성된 번역 텍스트로 변역 할 수 있다. 이러한 기계번역 과정(S80)은 공지된 특정 언어의 텍스트를 다른 언어의 텍스트로 자동번역 하는 기술을 제한 없이 사용할 수 있으나, 일 예로, 원문과 해당 번역문 사이의 관계를 인공 신경망으로 학습하는 신경망 기계 번역(NMT: Neural Machine Translation)을 적용하여 한글 텍스트(원어문)를 영어 텍스트(번역문)로 자동번역 할 수 있다.
이어서, 자동번역이 완료된 번역 텍스트의 정확도를 향상시키기 위하여, 분배단위에 따라 설정된 분배모델(S90)의 기준으로 상기 번역 텍스트를 다수의 제2 교정자 단말장치(600) 마다 할당하여 분배하는 과정을 연속적으로 수행할 수 있다(S100). 상기 분배단위는, 상기 원어 텍스트에서 피리어드(Period)인 마침표를 기준으로 구분된 하나 또는 다수의 문장 덩어리의 집합일 수 있는데, 이러한 분배모델(S90)에 대한 상세한 설명은 앞서 도 3 내지 도 5를 참조하여 상술된 설명과 중복됨으로 생략하도록 한다.
이어서, 분배된 번역 텍스트는 해당 제2 교정자 단말장치(600)의 사용자인 번역 교정자에 의해, 자동번역에 따른 오류 부분과 미흡한 부분을 교정하는 번역 교정과정을 수행할 수 있다(S110).
이어서, 상기 교정된 번역 텍스트는 다수의 제2 교정자 단말장치(600)에서 분배형 번역시스템(300)으로 제공(전송)되어 수집될 수 있다(S120).
이어서, 분배형 번역시스템(300)은 교정되어 수집된 번역 텍스트 정보를 조합하는 텍스트 조합과정을 수행할 수 있다(S130). 이때, 각각의 교정된 텍스트는 분배단위인 문장 덩어리가 모인 분배단위일 수 있는데, 이러한 분배단위들을 순차적으로 조합하여 완성된 하나의 교정된 번역 텍스트가 완성될 수 있다. 예를 들면, 영어로 구성된 다수의 교정된 번역 텍스트일 경우, 이를 조합하여 하나의 교정된 번역 텍스트로 다시 조합할 수 있다.
이어서, 분배형 번역시스템(300)에서 다시 사용자 단말장치(400)로 교정되어 조합된 상기 번역 텍스트를 제공하는 과정을 수행할 수 있다(S140). 이렇게 제공된 번역 텍스트는 사용자 단말장치(400)를 이용하여 사용자에게 다양한 형태의 콘텐츠와 함께 제공될 수도 있다.
한편, 도시되지는 않았지만, 상기와 같이 서술된 본 발명의 일 실시예에 따른 분배모델을 기반으로 번역서비스 하는 과정 중에서, 번역 텍스트를 사용자 단말장치(400)에서 요청되는 양식으로 문서화하여 제공하는 과정이 추가로 수행될 수 있다. 이때, 상기 문서에는 해당 텍스트의 교정자(원어 교정자 및/또는 번역 교정자)의 정보를 포함하여 제공할 수 있어, 번역서비스에 대한 품질을 향상시키고 책임소재를 명확하게 할 수 있다. 또한, 추가적으로 교정되어 조합된 상기 번역 텍스트를 제1 교정자 단말장치(500)에서 수집한 상기 콘텐츠에 조합하여 제공할 수도 있다. 따라서, 번역 텍스트 외에 다른 정보(예를 들면, 동영상 정보, 이미지 정보, 문서 정보 등)가 포함된 하나의 콘텐츠가 제공되어, 온라인 상에서의 다양한 번역서비스를 제공할 수 있다.
이상 설명된 본 발명에 따른 실시 예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
또한, 본 발명의 상세한 설명에서는 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시 예들에 한정되는 것은 아니며, 본 발명이 속하는 기술 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다. 따라서, 본 발명의 사상은 상기 설명된 실시 예에 국한되어 정해지는 것은 아니며, 후술하는 특허청구범위뿐만 아니라 그 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.
100: 통신망
200: 운영 서버
300: 분배형 번역시스템
310: 제1 정보 처리부
320: 제1 분배 교정부
330: AI 번역부
340: 제2 분배 교정부
350: 제2 정보 처리부
360: 데이터베이스
370: 통신부
380: 제어부
400: 사용자 단말장치
500: 제1 교정자 단말장치
600: 제2 교정자 단말장치

Claims (10)

  1. 통신망 상에서 분배모델을 기반으로 번역서비스를 제공하기 위한 시스템으로서,
    사용자 단말장치에서 수집되거나 변환되어 전송되는 콘텐츠에 포함된 텍스트를 인식하여 추출하고, 추출된 상기 텍스트로 원어 텍스트를 생성하는 제1 정보 처리부;
    상기 원어 텍스트를 해당 분배모델을 기준으로 설정된 분배단위에 따라, 다수의 제1 교정자 단말장치 마다 할당하여 분배하고, 분배된 상기 원어 텍스트가 상기 다수의 제1 교정자 단말장치에서 교정되어 수집되면, 이를 다시 조합하는 제1 분배 교정부;
    교정되어 조합된 상기 원어 텍스트를, 인공지능 알고리즘에 따라 상기 사용자 단말장치에서 선택한 언어로 기계번역 하여 번역 텍스트를 생성하는 AI 번역부;
    상기 번역 텍스트를 해당 분배모델을 기준으로 설정된 분배단위에 따라, 다수의 제2 교정자 단말장치 마다 할당하여 분배하고, 분배된 상기 번역 텍스트가 상기 다수의 제2 교정자 단말장치에서 교정되어 수집되면, 이를 다시 조합하는 제2 분배 교정부; 및
    교정되어 조합된 상기 번역 텍스트를, 상기 사용자 단말장치로 제공하는 제2 정보 처리부
    를 포함하는 것을 특징으로 하는 시스템.
  2. 제1항에 있어서,
    상기 분배단위는,
    상기 원어 텍스트 및 상기 번역 텍스트에서 피리어드(Period)인 마침표를 기준으로 구분된 하나 또는 다수의 문장 덩어리의 집합이며,
    상기 분배모델은,
    상기 원어 텍스트 및 상기 번역 텍스트의 글자수 또는 단어수 중 어느 하나를 기준으로, 상기 분배단위에 따라 상기 다수의 제1, 제2 교정자 단말장치 마다 할당하여 분배하는 방식,
    분배된 상기 원어 텍스트 및 분배된 상기 번역 텍스트가 교정되어 수집되는데 소요되는 교정시간을 기준으로, 상기 분배단위에 따라 상기 다수의 제1, 제2 교정자 단말장치 마다 할당하여 분배하는 방식,
    분배된 상기 원어 텍스트 및 분배된 상기 번역 텍스트 중에서 상기 다수의 제1 교정자 단말장치 또는 상기 다수의 제2 교정자 단말장치가 선택한 하나 또는 다수의 그룹(그룹화)을 기준으로, 상기 분배단위에 따라 재분배하는 방식 중 어느 하나이거나 이들의 조합으로 구성되는 방식인 것을 특징으로 하는 시스템.
  3. 제2항에 있어서,
    상기 글자수 또는 상기 단어수 중 어느 하나를 기준으로 분배하는 방식은,
    상기 글자수 또는 상기 단어수인 n개(상기 n은 자연수)를 기준으로 하며,
    상기 n개 이내에 모두 포함되는 문장 덩어리로 구성된 상기 분배단위에 따라 상기 제1, 제2 교정자 단말장치로 할당하여 분배하거나,
    상기 n개 중 일부라도 포함되는 문장 덩어리로 구성된 상기 분배단위에 따라 상기 제1, 제2 교정자 단말장치로 할당하여 분배하는 것을 특징으로 하는 시스템.
  4. 제2항에 있어서,
    상기 교정시간을 기준으로 분배하는 방식은,
    상기 교정시간이 최저 설정시간 이내에 교정이 완료되면, 다음 분배 순서에서는 교정이 완료된 상기 분배단위 문장 덩어리의 2배 분량을 분배단위로 설정하여 분배하고,
    상기 교정시간이 최고 설정시간을 초과하여 교정이 완료되면, 다음 분배 순서에서는 교정이 완료된 상기 분배단위 문장 덩어리의 1/2배 분량만을 분배단위로 설정하여 분배하고,
    상기 교정시간이 상기 최저 설정시간은 초과하고 상기 최고 설정시간 이내에 교정이 완료되면, 다음 분배 순서에서는 교정이 완료된 상기 분배단위 덩어리 문장의 분량을 유지하여 분배하는 것을 특징으로 하는 시스템.

  5. 제2항에 있어서,
    상기 교정시간을 기준으로 분배하는 방식은,
    상기 다수의 제1, 제2 교정자 단말장치 마다 할당순서를 포함하며,
    분배된 상기 원어 텍스트 및 분배된 상기 번역 텍스트 중 교정이 완료되는 시간이 짧을수록 할당순서가 우선하며,
    상기 다수의 제1, 제2 교정자 단말장치 중 보유중인 상기 분배단위가 설정범위를 초과하면, 해당 단말장치는 다음 분배순서에서는 할당순서를 누락하고, 상기 다수의 제1, 제2 교정자 단말장치 중 이전 분배순서의 교정이 완료되는 시간이 가장 짧은 단말장치로 중복 분배하는 것을 특징으로 하는 시스템.
  6. 제2항에 있어서,
    상기 다수의 제1, 제2 교정자 단말장치가 선택한 하나 또는 다수의 그룹을 기준으로, 상기 분배단위에 따라 재분배하는 방식은,
    상기 다수의 제1, 제2 교정자 단말장치 마다 서로 다르게 구성되는 교정 인터페이스 상에서 제공되며,
    상기 교정 인터페이스는,
    분배된 상기 원어 텍스트 또는 분배된 상기 번역 텍스트 중 순차적으로 조합되는 상기 분배단위가 각각 배치되는 다수의 분배 텍스트 블록,
    상기 다수의 분배 텍스트 블록 중 어느 하나 이상을 교정하여 입력하는 교정 블록, 및
    상기 다수의 분배 텍스트 블록 중 교정대상(활성화) 여부를 선택하여, 그룹화하는 선택블록을 포함하여 구성되며,
    상기 분배단위가 각각 배치되는 다수의 분배 텍스트 블록 중에서, 해당 제1, 제2 교정자 단말장치 마다 할당되어 분배된 해당 분배단위가 배치된 분배 텍스트 블록은 중앙에 배열하고, 이와 순차적으로 조합되는 분배단위가 배치된 분배 텍스트 블록은 그 주변에 순서대로 배열되는 것을 특징으로 하는 시스템.
  7. 제6항에 있어서,
    중앙에 배열된 상기 분배 텍스트 블록은 활성화 상태로, 상기 교정 블록에 반영되며,
    주변에 배열된 상기 분배 텍스트 블록은 비활성화 상태로, 상기 선택블록의 해당 버튼을 선택하면 활성화 상태로 변경되어, 중심에 배열된 상기 분배 텍스트 블록과 그룹화 되어 상기 교정 블록에 반영되는 것을 특징으로 하는 시스템.
  8. 제6항에 있어서,
    상기 다수의 제1, 제2 교정자 단말장치 마다 서로 다르게 구성되는 교정 인터페이스 상에서,
    상기 다수의 제1, 제2 교정자 단말장치 중에서 선택한, 단일 분배 텍스트 블록 보다 그룹화 된 분배 텍스트 블록을 선택한 단말장치의 교정결과가 우선되고,
    상기 다수의 제1, 제2 교정자 단말장치 중에서 선택한, 그룹화 된 분배 텍스트 블록의 전체가 중복되는 경우, 시간적으로 나중에 선택한 단말장치의 교정결과가 우선되며,
    상기 다수의 제1, 제2 교정자 단말장치 중에서 선택한, 그룹화 된 분배 텍스트 블록의 일부가 중복되는 경우, 순차적으로 조합되는 뒷부분의 분배 텍스트 블록을 선택한 단말장치의 전체 그룹화 된 분배 텍스트 블록의 교정결과가 우선되는 것을 특징으로 하는 시스템.
  9. 제1항에 있어서,
    상기 콘텐츠는, 상기 사용자 단말장치에서 작성, 검색, 촬영 중 어느 하나 이상으로 수집되는 텍스트를 포함하는 정보이거나,
    상기 콘텐츠는, 상기 사용자 단말장치에서 또는 상기 사용자 단말장치와 연결된 다른 장치에서 이미지정보 입력과정을 통해 변환된 텍스트를 포함하는 전자화 문서인 것을 특징으로 하는 시스템.
  10. 제1항에 있어서,
    상기 제2 정보 처리부는,
    교정되어 조합된 상기 번역 텍스트를 기초로, 상기 사용자 단말장치에서 요청하는 양식으로 문서화하며,
    문서에는, 상기 원어 텍스트의 교정자 및 상기 번역 텍스트의 교정자의 정보를 포함하여 제공하는 것을 특징으로 하는 시스템.
KR1020210015055A 2021-02-02 2021-02-02 분배모델을 기반으로 번역서비스를 제공하기 위한 시스템 KR102526392B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210015055A KR102526392B1 (ko) 2021-02-02 2021-02-02 분배모델을 기반으로 번역서비스를 제공하기 위한 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210015055A KR102526392B1 (ko) 2021-02-02 2021-02-02 분배모델을 기반으로 번역서비스를 제공하기 위한 시스템

Publications (2)

Publication Number Publication Date
KR20220111825A true KR20220111825A (ko) 2022-08-10
KR102526392B1 KR102526392B1 (ko) 2023-05-19

Family

ID=82846666

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210015055A KR102526392B1 (ko) 2021-02-02 2021-02-02 분배모델을 기반으로 번역서비스를 제공하기 위한 시스템

Country Status (1)

Country Link
KR (1) KR102526392B1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110093741A (ko) * 2011-06-04 2011-08-18 엄영철 번역중계 운영시스템 및 그 방법
KR20150070019A (ko) * 2013-12-13 2015-06-24 주식회사 플리토 장문 번역 서비스 장치 및 방법
KR20160118198A (ko) 2016-09-30 2016-10-11 에스케이플래닛 주식회사 실시간 자동번역 시스템 및 방법, 실시간 자동번역이 가능한 단말기
KR20170052974A (ko) * 2015-11-05 2017-05-15 윤제현 언어 학습을 위한 원어민 번역 교정 방법 및 번역 교정 서비스 제공 서버
KR20170115004A (ko) * 2017-08-11 2017-10-16 네이버 주식회사 복수 번역자의 공동 번역 환경을 지원하는 서비스 방법, 이를 지원하는 공동 번역 지원 장치 및 공동 번역 지원 장치에 저장된 공동 번역 지원 컴퓨터 프로그램
KR20180039371A (ko) * 2016-10-10 2018-04-18 한국전자통신연구원 자동 통역 시스템

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110093741A (ko) * 2011-06-04 2011-08-18 엄영철 번역중계 운영시스템 및 그 방법
KR20150070019A (ko) * 2013-12-13 2015-06-24 주식회사 플리토 장문 번역 서비스 장치 및 방법
KR20170052974A (ko) * 2015-11-05 2017-05-15 윤제현 언어 학습을 위한 원어민 번역 교정 방법 및 번역 교정 서비스 제공 서버
KR20160118198A (ko) 2016-09-30 2016-10-11 에스케이플래닛 주식회사 실시간 자동번역 시스템 및 방법, 실시간 자동번역이 가능한 단말기
KR20180039371A (ko) * 2016-10-10 2018-04-18 한국전자통신연구원 자동 통역 시스템
KR20170115004A (ko) * 2017-08-11 2017-10-16 네이버 주식회사 복수 번역자의 공동 번역 환경을 지원하는 서비스 방법, 이를 지원하는 공동 번역 지원 장치 및 공동 번역 지원 장치에 저장된 공동 번역 지원 컴퓨터 프로그램

Also Published As

Publication number Publication date
KR102526392B1 (ko) 2023-05-19

Similar Documents

Publication Publication Date Title
US11899681B2 (en) Knowledge graph building method, electronic apparatus and non-transitory computer readable storage medium
Nelson et al. Five task clusters that enable efficient and effective digitization of biological collections
CN107273356B (zh) 基于人工智能的分词方法、装置、服务器和存储介质
US20180011931A1 (en) Master content summaries for variant content
CN100416591C (zh) 字符识别电子设备和字符识别方法
US8391609B2 (en) Method of massive parallel pattern matching against a progressively-exhaustive knowledge base of patterns
US20180329894A1 (en) Language conversion method and device based on artificial intelligence and terminal
CN108108342B (zh) 结构化文本的生成方法、检索方法及装置
US11551437B2 (en) Collaborative information extraction
CN107861954B (zh) 基于人工智能的信息输出方法和装置
US11170214B2 (en) Method and system for leveraging OCR and machine learning to uncover reuse opportunities from collaboration boards
US11093774B2 (en) Optical character recognition error correction model
CN111310440A (zh) 文本的纠错方法、装置和系统
CN110851644A (zh) 图像检索方法及装置、计算机可读存储介质、电子设备
CN112925898B (zh) 基于人工智能的问答方法、装置、服务器及存储介质
US11971916B2 (en) Conversion of tabular format data to machine readable text for QA operations
CN111199540A (zh) 图像质量评价方法、装置、电子设备及存储介质
Salvaris et al. Cognitive services and custom vision
US11373057B2 (en) Artificial intelligence driven image retrieval
CN111931034A (zh) 数据搜索方法、装置、设备及存储介质
CN111881900A (zh) 语料生成、翻译模型训练、翻译方法、装置、设备及介质
KR102526392B1 (ko) 분배모델을 기반으로 번역서비스를 제공하기 위한 시스템
KR102003221B1 (ko) 필기 이미지 데이터 생성 시스템 및 이를 이용한 필기 이미지 데이터 생성 방법
WO2021082518A1 (zh) 机器翻译方法、机器翻译模型训练方法、装置及存储介质
US11842165B2 (en) Context-based image tag translation

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right