KR102258001B1 - 아케이드 이미지 파일을 통해 이미지 번역 서비스를 제공하기 위한 방법 및 서버 - Google Patents
아케이드 이미지 파일을 통해 이미지 번역 서비스를 제공하기 위한 방법 및 서버 Download PDFInfo
- Publication number
- KR102258001B1 KR102258001B1 KR1020210045248A KR20210045248A KR102258001B1 KR 102258001 B1 KR102258001 B1 KR 102258001B1 KR 1020210045248 A KR1020210045248 A KR 1020210045248A KR 20210045248 A KR20210045248 A KR 20210045248A KR 102258001 B1 KR102258001 B1 KR 102258001B1
- Authority
- KR
- South Korea
- Prior art keywords
- information
- text
- image
- user terminal
- original text
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000013519 translation Methods 0.000 claims abstract description 149
- 238000011156 evaluation Methods 0.000 claims description 75
- 238000013441 quality evaluation Methods 0.000 claims description 27
- 230000004044 response Effects 0.000 claims description 20
- 230000001186 cumulative effect Effects 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims 5
- 230000005540 biological transmission Effects 0.000 abstract description 3
- 238000012360 testing method Methods 0.000 abstract description 3
- 238000013528 artificial neural network Methods 0.000 description 66
- 238000012549 training Methods 0.000 description 40
- 230000006870 function Effects 0.000 description 25
- 230000008569 process Effects 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 238000012552 review Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000003860 storage Methods 0.000 description 9
- 238000007689 inspection Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 241000282326 Felis catus Species 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000002747 voluntary effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000001915 proofreading effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000000463 effect on translation Effects 0.000 description 1
- 210000003746 feather Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G06K9/344—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G06K2209/01—
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Computational Linguistics (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Transfer Between Computers (AREA)
- Machine Translation (AREA)
Abstract
전술한 과제를 해결하기 위한 본 개시의 일 실시예에서, 컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는 이미지 파일에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지를 생성하기 위한 방법이 개시된다. 상기 방법은, 이미지 파일에 포함된 하나 이상의 글자 이미지를 인식하여 원문 텍스트 정보를 획득하는 단계, 상기 획득된 원문 텍스트 정보에 대한 품질 검사를 수행하여 상기 원문 텍스트 정보에 대한 적정성을 판별하는 단계, 상기 적정성 판별 결과에 기초하여 상기 원문 텍스트 정보를 포함하는 번역 인터페이스를 사용자 단말로 전송할 것을 결정하는 단계, 상기 사용자 단말로부터 상기 번역 인터페이스를 통해 상기 하나 이상의 글자 이미지에 대응하는 번역 텍스트 정보를 수신하는 단계 및 상기 하나 이상의 글자 이미지 및 상기 수신된 번역 텍스트 정보에 기초하여 번역 텍스트 이미지를 생성하고, 상기 생성된 번역 텍스트 이미지를 상기 하나 이상의 글자 이미지의 상위 레이어로 표시하여 아케이드 이미지 파일을 생성하는 단계를 포함할 수 있다.
Description
본 개시는 이미지 번역 기술에 관한 것으로, 보다 구체적으로, 이미지 파일 내에 존재하는 글자 이미지를 번역하여 번역에 관련한 이미지를 생성하고, 해당 글자 이미지에 대응하는 영역에 생성된 번역에 관련한 이미지를 반영하여 번역된 이미지 파일을 제공하기 위함이다.
오늘날 인터넷 사용이 보편화되면서 사용자들은 인터넷 검색을 통하여 다양한 정보를 획득할 수 있게 되었다. 구체적으로, 사용자들은 인터넷에 접속이 가능한 단말을 통해 인터넷 검색 사이트에 접속한 후, 뉴스, 지식, 게임, 커뮤니티 등에 관련된 각종 컨텐츠 검색하며, 웹 페이지나 파일 등에 대한 정보를 획득할 수 있다.
한편, 오늘날 생활환경이 다변화됨에 따라 국내는 물론 해외로의 취업이나 진출이 활성화되고 있으며, sns 등의 플랫폼으로 인해 다양한 국적의 사용자 간의 의사소통의 필요성이 더 증대되고 있다. 이러한 환경에서 해외 사이트를 통한 다양한 컨텐츠의 획득이 활성화되고 있다. 다만, 해당 컨텐츠에 포함된 텍스트가 사용자가 활용하지 않는 외국어인 경우, 원하는 정보를 획득하는데 어려움을 겪을 수 있다. 이러한 사용자들의 인터넷 검색 활용도를 높이고, 수많은 컨텐츠들로부터 원하는 정보를 획득할 수 있도록 하기 위해, 많은 웹 사이트의 운영자들은 웹 번역 서비스를 제공하고 있다. 대한민국 공개특허 2000-0072108은 언어 번역기를 이용하여 인터넷상에서의 다국어를 지원하는 방법을 개시하고 있다.
한편, 사용자에게 제공되는 웹 페이지에는 이미지가 포함되어 있을 수 있으며, 해당 이미지에는 하나 이상의 문자 또는 기호 등이 포함되어 있을 수 있다. 그러나, 통상적인 웹 번역 서비스는 해당 컨텐츠에 포함된 텍스트에 대해서만 이루어지고 있는 실정이다.
즉, 해당 컨텐츠 내에 이미지, 동영상, 텍스트 등이 포함되어 있는 경우, 텍스트에 대응하는 부분에 대해서만 번역이 수행되어 제공된다. 다시 말해, 번역을 원하는 컨텐츠가 이미지 또는 동영상 등의 형태인 경우, 웹 번역 서비스에 의해 번역되지 않을 수 있다. 예컨대, 사용자가 획득하고자 하는 주요 정보가 이미지 또는 동영상 형태로 표시되는 경우, 주요 정보에 대해서는 번역되지 않은 채, 주변의 텍스트에 대해서만 번역이 이루어 질 수 있다.
이와 같은 문제점을 해소하기 위해, OCR(Optical Character Recognition) 등의 문자 판독 기술을 통해 다양한 언어를 통한 번역 서비스가 제공될 수 있다. 다만, 이미지로부터의 문자 기호의 판독이나 이미지 상의 텍스트의 번역 등과 같은 서비스를 위해서는 문자 판독 장치나 번역 장치 등과 같은 고가의 장치가 구비되어야 하며, 이에 따른 시스템의 구축 및 유지/보수를 위한 관리 비용을 초래할 우려가 있다.
따라서, 당 업계에는, 다양한 언어를 활용 가능한 다수의 사용자들의 자발적인 참여를 유도하여 이미지 번역 서비스를 제공받고자 하는 사용자와 연계함으로써, 이미지 내 포함된 글자에 대응하는 번역 서비스를 제공하는 서버에 대한 수요가 존재할 수 있다.
본 개시가 해결하고자 하는 과제는 상술한 문제점을 해결하기 위한 것으로서, 이미지 파일 내에 존재하는 글자 이미지를 번역하여 번역에 관련한 이미지를 생성하고, 해당 글자 이미지에 대응하는 영역에 생성된 번역에 관련한 이미지를 반영하여 번역된 이미지 파일을 제공하기 위함이다.
본 개시가 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상술한 과제를 해결하기 위한 본 개시의 다양한 실시예에 따른 컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는 이미지 파일에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지를 생성하기 위한 방법이 개시된다. 상기 방법은, 이미지 파일에 포함된 하나 이상의 글자 이미지를 인식하여 원문 텍스트 정보를 획득하는 단계, 상기 획득된 원문 텍스트 정보에 대한 품질 검사를 수행하여 상기 원문 텍스트 정보에 대한 적정성을 판별하는 단계, 상기 적정성 판별 결과에 기초하여 상기 원문 텍스트 정보를 포함하는 번역 인터페이스를 사용자 단말로 전송할 것을 결정하는 단계, 상기 사용자 단말로부터 상기 번역 인터페이스를 통해 상기 하나 이상의 글자 이미지에 대응하는 번역 텍스트 정보를 수신하는 단계 및 상기 하나 이상의 글자 이미지 및 상기 수신된 번역 텍스트 정보에 기초하여 번역 텍스트 이미지를 생성하고, 상기 생성된 번역 텍스트 이미지를 상기 하나 이상의 글자 이미지의 상위 레이어로 표시하여 아케이드 이미지 파일을 생성하는 단계를 포함할 수 있다.
대안적인 실시예에서, 상기 이미지 파일에 포함된 하나 이상의 글자 이미지를 인식하여 원문 텍스트 정보를 획득하는 단계는, 하나 이상의 네트워크 함수를 포함하는 글자 인식 모델을 통해 상기 이미지 파일 내에 포함된 하나 이상의 글자 이미지에 대응하는 상기 원문 텍스트 정보를 획득하는 단계 또는 원문 인터페이스를 통해 상기 사용자 단말로부터 상기 원문 텍스트 정보를 획득하는 단계 중 적어도 하나를 포함할 수 있다.
대안적인 실시예에서, 상기 원문 인터페이스를 통해 상기 사용자 단말로부터 상기 원문 텍스트 정보를 획득하는 단계는, 상기 이미지 파일에 포함된 하나 이상의 글자 이미지 중 일부를 포함하는 원문 인터페이스를 생성하여 상기 사용자 단말에 전송할 것을 결정하는 단계 및 상기 원문 인터페이스를 통한 상기 사용자 단말의 사용자 입력에 기초하여 상기 원문 텍스트 정보를 수신하는 단계를 포함할 수 있다.
대안적인 실시예에서, 상기 원문 인터페이스에 대한 상기 사용자 단말의 타이핑 입력을 감지하는 단계, 미리 정해진 단위 시간을 기준으로 미리 정해진 임계 횟수 이상의 타이핑 입력이 감지되면, 상기 사용자 단말의 타이핑 입력을 오류 입력으로 결정하는 단계 및 상기 오류 입력이 감지된 사용자 단말에 대해 상기 하나 이상의 글자 이미지를 미리 정해진 시간동안 노출시키지 않을 것을 결정하는 단계를 더 포함할 수 있다.
대안적인 실시예에서, 상기 원문 텍스트 정보에 대한 품질 검사를 수행하여 상기 원문 텍스트 정보에 대한 적정성을 판별하는 단계는, 상기 사용자 단말의 히스토리 정보에 기초하여 상기 품질 검사를 수행할 다른 사용자 단말의 수를 결정하는 단계, 상기 결정된 다른 사용자 단말의 수에 대응하여 하나 이상의 다른 사용자 단말에게 상기 하나 이상의 글자 이미지 및 상기 원문 텍스트 정보를 포함하는 평가 정보 입력 창을 전송할 것을 결정하는 단계, 상기 하나 이상의 다른 사용자 단말 각각으로부터 상기 평가 정보 입력 창을 통해 수신한 품질 평가 정보에 기초하여 상기 원문 텍스트 정보에 대한 적정성을 판별하는 단계 및 상기 적정성 판별 결과에 기초하여 상기 사용자 단말에 리워드(reward)를 부여하는 단계를 포함하고, 상기 히스토리 정보는, 상기 사용자 단말의 입력 참여 횟수 정보 및 누적 품질 평가 정보 중 적어도 하나를 포함할 수 있다.
대안적인 실시예에서, 복수의 사용자 단말 중 상기 번역 인터페이스에 포함된 상기 원문 텍스트 정보와 매칭되는 사용자 단말을 식별하는 단계 및 상기 식별된 사용자 단말을 상기 번역 인터페이스를 전송할 사용자 단말로 결정하는 단계를 더 포함할 수 있다.
대안적인 실시예에서, 하나 이상의 다른 사용자 단말로 상기 원문 텍스트 정보 및 상기 번역 텍스트 정보를 포함하는 평가 인터페이스를 생성하여 전송할 것을 결정하는 단계 및 상기 평가 인터페이스를 통한 하나 이상의 다른 사용자 단말 각각의 번역 평가 정보에 기초하여 상기 번역 텍스트 정보에 대한 적정성을 판별하는 단계를 더 포함할 수 있다.
대안적인 실시예에서, 상기 평가 인터페이스는, 상기 번역 텍스트 정보에 대한 검수 입력을 허용하는 검수 정보 입력 영역 및 상기 번역 텍스트 정보에 대한 평가 점수를 산출하기 위한 하나 이상의 평가 그래픽 객체를 포함할 수 있다.
대안적인 실시예에서, 상기 하나 이상의 글자 이미지 및 상기 번역 텍스트 정보에 기초하여 번역 텍스트 이미지를 생성하고, 상기 번역 텍스트 이미지를 상기 하나 이상의 글자 이미지의 상위 레이어로 표시하여 아케이드 이미지를 생성하는 단계는, 상기 하나 이상의 글자 이미지의 좌표 정보, 색상 정보 및 폰트 정보를 포함하는 글자 이미지 정보를 식별하는 단계, 상기 좌표 정보에 대응하는 영역의 평균 색상 값에 기초하여 번역 텍스트 배경 이미지를 생성하는 단계, 상가 번역 텍스트 배경 이미지에 상기 번역 텍스트 정보를 상기 폰트 정보에 기초하여 반영함으로써 상기 번역 텍스트 이미지를 생성하는 단계 및 상기 번역 텍스트 이미지를 상기 좌표 정보에 대응하는 영역에 상위 레이어로 표시하여 상기 아케이드 이미지 파일을 생성하는 단계를 포함할 수 있다.
본 개시의 다른 실시예에 따르면, 이미지 파일 내에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지 파일을 생성하기 위한 컴퓨팅 장치가 개시된다. 상기 컴퓨팅 장치는 하나 이상의 코어를 포함하는 프로세서, 상기 프로세서에서 실행가능한 프로그램 코드들을 저장하는 메모리 및 하나 이상의 사용자 단말과 데이터를 송수신하는 네트워크부를 포함하고, 상기 프로세서는, 이미지 파일에 포함된 하나 이상의 글자 이미지를 인식하여 원문 텍스트 정보를 획득하고, 상기 획득된 원문 텍스트 정보에 대한 품질 검사를 수행하여 상기 원문 텍스트 정보에 대한 적정성을 판별하고, 상기 적정성 판별 결과에 기초하여 상기 원문 텍스트 정보를 포함하는 번역 인터페이스를 사용자 단말로 전송할 것을 결정하고, 상기 사용자 단말로부터 상기 번역 인터페이스를 통해 상기 하나 이상의 글자 이미지에 대응하는 번역 텍스트 정보를 수신하고, 상기 하나 이상의 글자 이미지 및 상기 수신된 번역 텍스트 정보에 기초하여 번역 텍스트 이미지를 생성하고, 상기 생성된 번역 텍스트 이미지를 상기 하나 이상의 글자 이미지의 상위 레이어로 표시하여 아케이드 이미지 파일 생성할 수 있다.
본 개시의 다양한 실시예에 따라, 이미지 파일 내에 존재하는 글자 이미지를 번역하여 번역에 관련한 이미지를 생성하고, 해당 글자 이미지에 대응하는 영역에 생성된 번역에 관련한 이미지를 반영하여 번역된 이미지 파일을 제공함으로써, 다양한 언어에 관련한 텍스트를 포함하는 이미지로부터의 정보 획득의 편의성을 제공할 수 있다.
추가적으로, 다양한 언어의 활용이 가능한 다수의 사용자들의 자발적인 참여를 유도함으로써, 학습성 또는 오락적 요소를 제공하는 등 부가가치 창출에 기여할 수 있으며, 이와 동시에 번역의 정확도 향상을 도모할 수 있다.
본 개시의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
다양한 양상들이 이제 도면들을 참조로 기재되며, 여기서 유사한 참조 번호들은 총괄적으로 유사한 구성요소들을 지칭하는데 이용된다. 이하의 실시예에서, 설명 목적을 위해, 다수의 특정 세부사항들이 하나 이상의 양상들의 총체적 이해를 제공하기 위해 제시된다. 그러나, 그러한 양상(들)이 이러한 구체적인 세부사항들 없이 실시될 수 있음은 명백할 것이다.
도 1은 본 개시의 일 실시예와 관련된 이미지 파일 내에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지를 생성하기 위한 컴퓨팅 장치의 다양한 양태가 구현될 수 있는 시스템을 나타낸 개념도를 도시한다.
도 2는 본 개시의 일 실시예와 관련한 이미지 파일 내에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지를 생성하기 위한 컴퓨팅 장치의 블록 구성도를 도시한다.
도 3는 본 개시의 일 실시예와 관련된 원문 인터페이스 및 번역 인터페이스를 예시적으로 도시한 예시도이다.
도 4는 본 개시의 일 실시예와 관련된 번역 인터페이스를 예시적으로 도시한 예시도이다.
도 5는 본 개시의 일 실시예와 관련된 평가 인터페이스 및 아케이드 이미지를 예시적으로 도시한 예시도이다.
도 6은 본 개시의 일 실시예와 관련된 이미지 파일 내에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지를 생성하기 위한 방법을 수행하기 위한 단계들을 예시적으로 도시한 순서도이다.
도 7은 본 개시의 일 실시예와 관련된 하나 이상의 네트워크 함수를 나타낸 개략도이다.
도 1은 본 개시의 일 실시예와 관련된 이미지 파일 내에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지를 생성하기 위한 컴퓨팅 장치의 다양한 양태가 구현될 수 있는 시스템을 나타낸 개념도를 도시한다.
도 2는 본 개시의 일 실시예와 관련한 이미지 파일 내에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지를 생성하기 위한 컴퓨팅 장치의 블록 구성도를 도시한다.
도 3는 본 개시의 일 실시예와 관련된 원문 인터페이스 및 번역 인터페이스를 예시적으로 도시한 예시도이다.
도 4는 본 개시의 일 실시예와 관련된 번역 인터페이스를 예시적으로 도시한 예시도이다.
도 5는 본 개시의 일 실시예와 관련된 평가 인터페이스 및 아케이드 이미지를 예시적으로 도시한 예시도이다.
도 6은 본 개시의 일 실시예와 관련된 이미지 파일 내에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지를 생성하기 위한 방법을 수행하기 위한 단계들을 예시적으로 도시한 순서도이다.
도 7은 본 개시의 일 실시예와 관련된 하나 이상의 네트워크 함수를 나타낸 개략도이다.
다양한 실시예들이 이제 도면을 참조하여 설명된다. 본 명세서에서, 다양한 설명들이 본 개시의 이해를 제공하기 위해서 제시된다. 그러나, 이러한 실시예들은 이러한 구체적인 설명 없이도 실행될 수 있음이 명백하다.
본 명세서에서 사용되는 용어 "컴포넌트", "모듈", "시스템" 등은 컴퓨터-관련 엔티티, 하드웨어, 펌웨어, 소프트웨어, 소프트웨어 및 하드웨어의 조합, 또는 소프트웨어의 실행을 지칭한다. 예를 들어, 컴포넌트는 프로세서상에서 실행되는 처리과정(procedure), 프로세서, 객체, 실행 스레드, 프로그램, 및/또는 컴퓨터일 수 있지만, 이들로 제한되는 것은 아니다. 예를 들어, 컴퓨팅 장치에서 실행되는 애플리케이션 및 컴퓨팅 장치 모두 컴포넌트일 수 있다. 하나 이상의 컴포넌트는 프로세서 및/또는 실행 스레드 내에 상주할 수 있다. 일 컴포넌트는 하나의 컴퓨터 내에 로컬화 될 수 있다. 일 컴포넌트는 2개 이상의 컴퓨터들 사이에 분배될 수 있다. 또한, 이러한 컴포넌트들은 그 내부에 저장된 다양한 데이터 구조들을 갖는 다양한 컴퓨터 판독가능한 매체로부터 실행할 수 있다. 컴포넌트들은 예를 들어 하나 이상의 데이터 패킷들을 갖는 신호(예를 들면, 로컬 시스템, 분산 시스템에서 다른 컴포넌트와 상호작용하는 하나의 컴포넌트로부터의 데이터 및/또는 신호를 통해 다른 시스템과 인터넷과 같은 네트워크를 통해 전송되는 데이터)에 따라 로컬 및/또는 원격 처리들을 통해 통신할 수 있다.
더불어, 용어 "또는"은 배타적 "또는"이 아니라 내포적 "또는"을 의미하는 것으로 의도된다. 즉, 달리 특정되지 않거나 문맥상 명확하지 않은 경우에, "X는 A 또는 B를 이용한다"는 자연적인 내포적 치환 중 하나를 의미하는 것으로 의도된다. 즉, X가 A를 이용하거나; X가 B를 이용하거나; 또는 X가 A 및 B 모두를 이용하는 경우, "X는 A 또는 B를 이용한다"가 이들 경우들 어느 것으로도 적용될 수 있다. 또한, 본 명세서에 사용된 "및/또는"이라는 용어는 열거된 관련 아이템들 중 하나 이상의 아이템의 가능한 모든 조합을 지칭하고 포함하는 것으로 이해되어야 한다.
또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하는 것으로 이해되어야 한다. 다만, "포함한다" 및/또는 "포함하는"이라는 용어는, 하나 이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다. 또한, 달리 특정되지 않거나 단수 형태를 지시하는 것으로 문맥상 명확하지 않은 경우에, 본 명세서와 청구범위에서 단수는 일반적으로 "하나 또는 그 이상"을 의미하는 것으로 해석되어야 한다.
당업자들은 추가적으로 여기서 개시된 실시예들과 관련되어 설명된 다양한 예시적 논리적 블록들, 구성들, 모듈들, 회로들, 수단들, 로직들, 및 알고리즘 단계들이 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양쪽 모두의 조합들로 구현될 수 있음을 인식해야 한다. 하드웨어 및 소프트웨어의 상호교환성을 명백하게 예시하기 위해, 다양한 예시적 컴포넌트들, 블록들, 구성들, 수단들, 로직들, 모듈들, 회로들, 및 단계들은 그들의 기능성 측면에서 일반적으로 위에서 설명되었다. 그러한 기능성이 하드웨어로 또는 소프트웨어로서 구현되는지 여부는 전반적인 시스템에 부과된 특정 어플리케이션(application) 및 설계 제한들에 달려 있다. 숙련된 기술자들은 각각의 특정 어플리케이션들을 위해 다양한 방법들로 설명된 기능성을 구현할 수 있다. 다만, 그러한 구현의 결정들이 본 개시내용의 영역을 벗어나게 하는 것으로 해석되어서는 안된다.
제시된 실시예들에 대한 설명은 본 개시의 기술 분야에서 통상의 지식을 가진 자가 본 개시를 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 개시의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이다. 여기에 정의된 일반적인 원리들은 본 개시의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 개시는 여기에 제시된 실시예들로 한정되는 것이 아니다. 본 개시는 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.
본 명세서에서, 컴퓨터는 적어도 하나의 프로세서를 포함하는 모든 종류의 하드웨어 장치를 의미하는 것이고, 실시 예에 따라 해당 하드웨어 장치에서 동작하는 소프트웨어적 구성도 포괄하는 의미로서 이해될 수 있다. 예를 들어, 컴퓨터는 스마트폰, 태블릿 PC, 데스크톱, 노트북 및 각 장치에서 구동되는 사용자 클라이언트 및 애플리케이션을 모두 포함하는 의미로서 이해될 수 있으며, 또한 이에 제한되는 것은 아니다.
이하, 첨부된 도면을 참조하여 본 개시의 실시예를 상세하게 설명한다.
본 명세서에서 설명되는 각 단계들은 컴퓨터에 의하여 수행되는 것으로 설명되나, 각 단계의 주체는 이에 제한되는 것은 아니며, 실시 예에 따라 각 단계들의 적어도 일부가 서로 다른 장치에서 수행될 수도 있다.
도 1은 본 개시의 일 실시예와 관련된 이미지 파일 내에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지를 생성하기 위한 컴퓨팅 장치의 다양한 양태가 구현될 수 있는 시스템을 나타낸 개념도를 도시한다.
본 개시의 실시예들에 따른 시스템은, 컴퓨팅 장치(100), 사용자 단말(10), 외부 서버(20) 및 네트워크를 포함할 수 있다. 도 1에서 도시되는 컴포넌트들은 예시적인 것으로서, 추가적인 컴포넌트들이 존재하거나 또는 도 1에서 도시되는 컴포넌트들 중 일부는 생략될 수 있다. 본 개시의 실시예들에 따른 컴퓨팅 장치(100), 사용자 단말(10) 및 외부 서버(20)는 네트워크를 통해, 본 개시의 일 실시예들에 따른 시스템을 위한 데이터를 상호 송수신할 수 있다.
본 개시의 실시예들에 따른 네트워크는 공중전화 교환망(PSTN: Public Switched Telephone Network), xDSL(x Digital Subscriber Line), RADSL(Rate Adaptive DSL), MDSL(Multi Rate DSL), VDSL(Very High Speed DSL), UADSL(Universal Asymmetric DSL), HDSL(High Bit Rate DSL) 및 근거리 통신망(LAN) 등과 같은 다양한 유선 통신 시스템들을 사용할 수 있다.
또한, 여기서 제시되는 네트워크는 CDMA(Code Division Multi Access), TDMA(Time Division Multi Access), FDMA(Frequency Division Multi Access), OFDMA(Orthogonal Frequency Division Multi Access), SC-FDMA(Single Carrier-FDMA) 및 다른 시스템들과 같은 다양한 무선 통신 시스템들을 사용할 수 있다.
본 개시의 실시예들에 따른 네트워크는 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 단거리 통신망(PAN: Personal Area Network), 근거리 통신망(WAN: Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 또한, 상기 네트워크는 공지의 월드와이드웹(WWW: World Wide Web)일 수 있으며, 적외선(IrDA: Infrared Data Association) 또는 블루투스(Bluetooth)와 같이 단거리 통신에 이용되는 무선 전송 기술을 이용할 수도 있다. 본 명세서에서 설명된 기술들은 위에서 언급된 네트워크들뿐만 아니라, 다른 네트워크들에서도 사용될 수 있다.
본 개시의 일 실시예에 따르면, 사용자 단말(10)은 컴퓨팅 장치(100)에 엑세스하여 이미지 파일에 포함된 하나 이상의 글자 이미지에 대한 정보를 수신하거나, 또는 하나 이상의 글자 이미지에 대응하는 번역 테스트 정보를 제공하기 위한 사용자와 관련된 단말일 수 있다. 도 1에서는 단순히 컴퓨팅 장치(100)와 연계된 하나의 사용자 단말만을 예시적으로 도시하나, 본 개시에서의 컴퓨팅 장치(100)와 연계된 사용자 단말(10)은 복수 개일 수 있다. 예를 들어, 컴퓨팅 장치(100)와 연결된 복수의 사용자 단말 중 제 1 사용자 단말은 이미지 파일 내에 포함된 하나 이상의 글자 이미지에 대한 번역 텍스트 정보를 제공받기 위한 제 1 사용자에 관련한 단말일 수 있으며, 제 2 사용자 단말은 하나 이상의 글자 이미지에 대한 번역 텍스트 정보를 제공하여 리워드를 획득하기 위한 제 2 사용자에 관련한 단말일 수 있으며, 제 3 사용자 단말은 제 2 사용자가 제공한 번역 텍스트 정보가 적정한지 여부에 대한 품질 검사를 수행하는 제 3 사용자에 관련한 단말일 수 있다. 전술한 각각의 사용자 단말에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다. 즉, 본 개시에서의 사용자 단말(10)은, 컴퓨팅 장치(100)와 연결되어 다양한 서비스를 제공받기 위한 복수의 사용자 각각에 대응하여 복수 개로 구비될 수 있다.
이러한 사용자 단말(10)은 컴퓨팅 장치(100)와 통신을 위하 메커니즘을 갖는 시스템에서의 임의의 형태의 엔티티(들)를 의미할 수 있다. 예를 들어, 이러한 사용자 단말(10)은 PC(personal computer), 노트북(note book), 모바일 단말기(mobile terminal), 스마트 폰(smart phone), 태블릿 PC(tablet pc) 및 웨어러블 디바이스(wearable device) 등을 포함할 수 있으며, 유/무선 네트워크에 접속할 수 있는 모든 종류의 단말을 포함할 수 있다. 또한, 사용자 단말(10)은 에이전트, API(Application Programming Interface) 및 플러그-인(Plug-in) 중 적어도 하나에 의해 구현되는 임의의 서버를 포함할 수도 있다. 또한, 사용자 단말(10)은 애플리케이션 소스 및/또는 클라이언트 애플리케이션을 포함할 수 있다.
본 개시의 일 실시예에 따르면, 외부 서버(20)는 이미지 파일에 포함된 하나 이상의 글자 이미지를 기초로 원문 텍스트 정보를 생성하기 위한 글자 인식 모델의 학습에 관련한 학습 데이터들을 저장하는 서버일 수 있다. 본 개시의 글자 인식 모델은 OCR 기초 문자 인식이 가능한 신경망 모델일 수 있다. 구체적으로, 글자 인식 모델은, 이미지 파일을 스캔하여 이미지 파일에 포함된 하나 이상의 글자 이미지를 인식하고, 하나 이상의 글자 이미지를 각각의 글자로 분류하여 하나 이상의 글자 이미지 각각이 포함하는 글자를 인식할 수 있다. 이 경우, 글자 인식 모델은 하나 이상의 네트워크 함수를 포함할 수 있으며, 하나 이상의 네트워크 함수는 딥러닝 알고리즘을 통해 학습될 수 있다. 즉, 글자 인식 모델은 이미지 파일에 존재하는 하나 이상의 글자 이미지를 인식하여 해당 하나 이상의 글자 이미지에 대응하는 원문 텍스트 정보를 생성하는 자연어 처리 모델일 수 있다.
외부 서버(20)에 저장된 정보들은 본 개시에서의 신경망을 학습시키기 위한 학습 데이터, 검증 데이터 및 테스트 데이터로 활용될 수 있다. 즉, 외부 서버(20)는 본 개시의 딥러닝 모델을 학습시키기 위한 데이터 세트에 관한 정보를 저장하고 있는 서버일 수 있다.
본 개시의 컴퓨팅 장치(100)는 외부 서버(20)로부터 다양한 카테고리의 비디오 데이터들 및 각 비디오 데이터에 관한 정보에 기초하여 학습 데이터 세트를 구축할 수 있으며, 학습 데이터 세트를 통해 하나 이상의 네트워크 함수를 포함하는 신경망 모델을 학습시킴으로써, 이미지 파일에서 하나 이상의 글자 이미지를 인식하여 원문 텍스트 정보를 생성하는 글자 인식 모델을 생성할 수 있다. 또한, 본 개시의 컴퓨팅 장치(100)는 원문 텍스트 정보에 대응하여 생성된 번역 텍스트 정보를 외부 서버(20)로 전송함으로써, 학습 데이터에 대한 증강(augmentation)을 수행할 수도 있다.
외부 서버(20)는 디지털 기기로서, 랩탑 컴퓨터, 노트북 컴퓨터, 데스크톱 컴퓨터, 웹 패드, 이동 전화기와 같이 프로세서를 탑재하고 메모리를 구비한 연산 능력을 갖춘 디지털 기기일 수 있다. 외부 서버(20)는 서비스를 처리하는 웹 서버일 수 있다. 전술한 서버의 종류는 예시일 뿐이며 본 개시는 이에 제한되지 않는다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 이미지 파일을 획득할 수 있다. 이 경우, 이미지 파일은, 하나 이상의 인식 대상 글자 이미지를 포함하는 이미지 파일일 수 있다. 글자 이미지는 하나의 글자를 포함하는 이미지일 수 있다. 예를 들어, 글자 이미지는 '나'라는 글자 하나를 포함하고 있는 이미지일 수 있다. 컴퓨팅 장치(100)는 네트워크부(110)를 통해 사용자 단말(10)로부터 이미지 파일을 수신하여 획득하거나, 카메라부(미도시)를 통한 촬영을 통해 이미지 파일을 획득할 수 있다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 이미지 파일에 포함된 하나 이상의 글자 이미지에 대한 변환을 수행하여 아케이드 이미지 파일을 생성함으로써, 이미지 파일 내 글자 이미지에 대한 번역 정보를 제공할 수 있다. 이 경우, 아케이드 이미지 파일은, 하나 이상의 글자 이미지가 특정 언어로 번역된 번역 텍스트 이미지로 대체된 이미지 파일을 의미할 수 있다.
보다 구체적으로, 컴퓨팅 장치(100)는 이미지 파일에 포함된 하나 이상의 글자 이미지에 인식하여 원문 텍스트 정보를 획득할 수 있다. 원문 텍스트 정보는, 하나 이상의 글자 이미지 각각에 대응하는 글자들에 대한 정보일 수 있다. 예컨대, 컴퓨팅 장치(100)는 글자 인식 모델을 활용하여 하나 이상의 글자 이미지에 대응하는 원문 텍스트 정보를 획득하거나, 또는 원문 인터페이스를 통해 사용자 단말(10)로부터 원문 텍스트 정보를 획득할 수 있다. 컴퓨팅 장치(100)는 획득한 원문 텍스트 정보의 적정성을 판별하고, 원문 텍스트 정보의 적정성이 사전 결정된 임계치 이상인 경우, 원문 텍스트 정보를 포함하는 번역 인터페이스를 생성하여 사용자 단말로 전송할 수 있다. 번역 인터페이스는, 이미지 파일 내 하나 이상의 글자에 대응하는 번역 텍스트 정보를 수신하기 위한 사용자 인터페이스로, 원문 텍스트 정보에 대한 정보를 포함할 수 있다. 다시 말해, 컴퓨팅 장치(100)가 사용자 단말(10)로 번역 인터페이스를 제공하는 경우, 번역 인터페이스는 사용자 단말(10)에 표시되어 하나 이상의 글자 이미지에 대응하는 번역 텍스트 정보를 수신하기 위한 사용자와의 상호 작용을 허용할 수 있다. 예컨대, 번역 인터페이스는 번역 텍스트 정보에 관련하여 사용자 단말(10)의 사용자와의 상호 작용을 허용하기 위한 하나 이상의 입력 영역, 또는 하나 이상의 그래픽 객체 등을 포함할 수 있다. 즉, 사용자 단말(10)은 컴퓨팅 장치(100)로부터 번역 인터페이스를 수신하여 디스플레이할 수 있으며, 사용자는 사용자 단말(10)을 통해 번역 인터페이스에 포함된 원문 텍스트 정보에 기초하여 하나 이상의 글자 이미지에 대응하는 번역 텍스트 정보를 입력할 수 있다. 이에 따라, 컴퓨팅 장치(100)는 번역 인터페이스를 통해 사용자 단말(10)로부터 하나 이상의 글자 이미지에 대응하는 번역 텍스트 정보를 수신할 수 있다. 또한, 컴퓨팅 장치(100)는 하나 이상의 글자 이미지 및 번역 텍스트 정보에 기초하여 번역 텍스트 이미지를 생성할 수 있다.
자세히 설명하면, 컴퓨팅 장치(100)는 이미지 파일에서 하나 이상의 글자 이미지에 대응하는 글자 이미지 정보를 식별할 수 있다. 글자 이미지 정보는 이미지 파일 내에서, 하나 이상의 글자에 대응하는 좌표 정보, 색상 정보 및 폰트 정보를 포함할 수 있다. 예컨대, 글자 이미지 정보는, 이미지 내에서 하나 이상의 글자 이미지의 위치가 제 1 위치에 위치한다는 좌표 정보, 하나 이상의 글자 이미지의 배경 색상이 노란색이며, 텍스트 색상이 검정색이라는 색상 정보 및 하나 이상의 글자 이미지가 폰트 사이즈 '11'이며, 서체 '맑은 고딕'이라는 폰트 정보를 포함할 수 있다. 전술한 글자 이미지 정보에 포함된 좌표 정보, 색상 정보 및 폰트 정보에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다. 또한, 컴퓨팅 장치(100)는 번역 텍스트 이미지를 글자 이미지의 상위 레이어로 표시하여 아케이드 이미지를 생성할 수 있다. 즉, 컴퓨팅 장치(100)에 의해 생성된 아케이드 이미지는, 이미지 파일에 제 1 언어로 표시된 하나 이상의 글자 이미지가 제 2 언어의 번역 이미지로 변경된 이미지 파일일 수 있다. 이 경우, 제 1 언어는 사용자가 번역을 수행하고자 하는 시작 언어와 관련한 것일 수 있으며, 제 2 언어는 사용자가 이해하고자 하는 도착 언어와 관련한 것일 수 있다. 예컨대, 제 1 언어는 사용자가 자주 활용하지 않은 외국어일 수 있으며, 제 2 언어는 사용자가 활용하는 모국어에 관련한 언어일 수 있다.
즉, 컴퓨팅 장치(100)는 이미지 파일 내에서 사용자가 이해하지 못하는 언어(예컨대, 외국어)로 작성된 하나 이상의 글자 이미지에 대한 번역을 수행하여 번역 텍스트 정보를 생성하고, 생성된 번역 텍스트 정보에 기초하여 이미지 파일에 대한 변환을 통해 아케이드 이미지를 생성할 수 있다. 이에 따라, 사용자는 자신에게 익숙한 언어를 통해 생성된 아케이드 이미지를 제공받을 수 있으므로, 이미지 파일 내에서 자신이 이해하지 못하는 정보들을 용이하게 획득할 수 있다. 이와 더불어, 컴퓨팅 장치(100)를 통해 생성된 아케이드 이미지는, 기존 하나 이상의 글자 이미지의 글자 이미지 정보에 기초하여 생성된 번역 이미지 정보를 포함할 수 있다. 즉, 아케이드 이미지 번역 전 이미지 내의 원문에 해당하는 글자의 표시 영역, 색상, 글자 크기, 서체 등에 기초하여 생성된 번역 이미지 정보를 포함함으로써, 번역에 관련한 정보를 획득하고자 하는 사용자에게 번역 전 이미지와 유사한 자연스러운 이미지를 제공할 수 있다.
일 실시예에서, 컴퓨팅 장치(100)는 단말 또는 서버일 수 있으며, 임의의 형태의 장치는 모두 포함할 수 있다. 컴퓨팅 장치(100)는 디지털 기기로서, 랩탑 컴퓨터, 노트북 컴퓨터, 데스크톱 컴퓨터, 웹 패드, 이동 전화기와 같이 프로세서를 탑재하고 메모리를 구비한 연산 능력을 갖춘 디지털 기기일 수 있다. 컴퓨팅 장치(100)는 서비스를 처리하는 웹 서버일 수 있다. 전술한 컴퓨팅 장치의 종류는 예시일 뿐이며 본 개시는 이에 제한되지 않는다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 클라우드 컴퓨팅 서비스를 제공하는 서버일 수 있다. 보다 구체적으로, 컴퓨팅 장치(100)는 인터넷 기초 컴퓨팅의 일종으로 정보를 사용자의 컴퓨터가 아닌 인터넷에 연결된 다른 컴퓨터로 처리하는 클라우드 컴퓨팅 서비스를 제공하는 서버일 수 있다. 상기 클라우드 컴퓨팅 서비스는 인터넷 상에 자료를 저장해 두고, 사용자가 필요한 자료나 프로그램을 자신의 컴퓨터에 설치하지 않고도 인터넷 접속을 통해 언제 어디서나 이용할 수 있는 서비스일 수 있으며, 인터넷 상에 저장된 자료들을 간단한 조작 및 클릭으로 쉽게 공유하고 전달할 수 있다. 또한, 클라우드 컴퓨팅 서비스는 인터넷 상의 서버에 단순히 자료를 저장하는 것뿐만 아니라, 별도로 프로그램을 설치하지 않아도 웹에서 제공하는 응용프로그램의 기능을 이용하여 원하는 작업을 수행할 수 있으며, 여러 사람이 동시에 문서를 공유하면서 작업을 진행할 수 있는 서비스일 수 있다. 또한, 클라우드 컴퓨팅 서비스는 IaaS(Infrastructure as a Service), PaaS(Platform as a Service), SaaS(Software as a Service), 가상 머신 기초 클라우드 서버 및 컨테이너 기초 클라우드 서버 중 적어도 하나의 형태로 구현될 수 있다. 즉, 본 개시의 컴퓨팅 장치(100)는 상술한 클라우드 컴퓨팅 서비스 중 적어도 하나의 형태로 구현될 수 있다. 전술한 클라우드 컴퓨팅 서비스의 구체적인 기재는 예시일 뿐, 본 개시의 클라우드 컴퓨팅 환경을 구축하는 임의의 플랫폼을 포함할 수도 있다.
본 개시에서의 이미지 파일 내에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지를 생성하는 방법에 대한 구체적인 구성 및 이에 따른 효과는 도 2를 참조하여 후술하도록 한다.
도 2는 본 개시의 일 실시예와 관련한 이미지 파일 내에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지를 생성하기 위한 컴퓨팅 장치의 블록 구성도를 도시한다.
도 2에 도시된 바와 같이, 컴퓨팅 장치(100)는 네트워크부(110), 메모리(120) 및 프로세서(130)를 포함할 수 있다. 전술한 컴퓨팅 장치(100)에 포함된 컴포넌트들은 예시적인 것으로 본 개시내용의 권리범위가 전술한 컴포넌트들로 제한되지 않는다. 즉, 본 개시내용의 실시예들에 대한 구현 양태에 따라서 추가적인 컴포넌트들이 포함되거나 전술한 컴포넌트들 중 일부가 생략될 수 있다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 사용자 단말(10) 및 외부 서버(20)와 데이터를 송수신하는 네트워크부(110)를 포함할 수 있다. 네트워크부(110)는 본 개시의 일 실시예에 따른 이미지 파일에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지를 생성하기 위한 방법을 수행하기 위한 데이터들 및 신경망 모델을 학습시키기 위한 학습 데이터 세트 등을 다른 컴퓨팅 장치, 서버 등과 송수신할 수 있다. 즉, 네트워크부(110)는 컴퓨팅 장치(100)와 사용자 단말(10) 및 외부 서버(20) 간의 통신 기능을 제공할 수 있다. 예를 들어, 네트워크부(110)는 사용자 단말(10)로부터 원문 텍스트 정보, 번역 텍스트 정보 및 각 텍스트 정보의 적정성 판별에 기준이 되는 평가 정보 등을 수신할 수 있다. 다른 예를 들어, 네트워크부(110)는 외부 서버(20)로부터 본 개시의 글자 인식 모델을 학습시키기 위한 학습 데이터 세트를 수신할 수 있다. 추가적으로, 네트워크부(110)는 컴퓨팅 장치(100)로 프로시저를 호출하는 방식으로 컴퓨팅 장치(100)와 사용자 단말(10) 및 외부 서버(20) 간의 정보 전달을 허용할 수 있다.
본 개시의 일 실시예에 따른 네트워크부(110)는 공중전화 교환망(PSTN: Public Switched Telephone Network), xDSL(x Digital Subscriber Line), RADSL(Rate Adaptive DSL), MDSL(Multi Rate DSL), VDSL(Very High Speed DSL), UADSL(Universal Asymmetric DSL), HDSL(High Bit Rate DSL) 및 근거리 통신망(LAN) 등과 같은 다양한 유선 통신 시스템들을 사용할 수 있다.
또한, 본 명세서에서 제시되는 네트워크부(110)는 CDMA(Code Division Multi Access), TDMA(Time Division Multi Access), FDMA(Frequency Division Multi Access), OFDMA(Orthogonal Frequency Division Multi Access), SC-FDMA(Single Carrier-FDMA) 및 다른 시스템들과 같은 다양한 무선 통신 시스템들을 사용할 수 있다.
본 개시에서 네트워크부(110)는 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 단거리 통신망(PAN: Personal Area Network), 근거리 통신망(WAN: Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 또한, 상기 네트워크는 공지의 월드와이드웹(WWW: World Wide Web)일 수 있으며, 적외선(IrDA: Infrared Data Association) 또는 블루투스(Bluetooth)와 같이 단거리 통신에 이용되는 무선 전송 기술을 이용할 수도 있다. 본 명세서에서 설명된 기술들은 위에서 언급된 네트워크들뿐만 아니라, 다른 네트워크들에서도 사용될 수 있다.
본 개시의 일 실시예에 따르면, 메모리(120)는 본 개시의 일 실시예에 따른 이미지 파일 내 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지를 생성하기 위한 방법을 수행하기 위한 컴퓨터 프로그램을 저장할 수 있으며, 저장된 컴퓨터 프로그램은 프로세서(130)에 의하여 판독되어 구동될 수 있다. 또한, 메모리(120)는 프로세서(130)가 생성하거나 결정한 임의의 형태의 정보 및 네트워크부(110)가 수신한 임의의 형태의 정보를 저장할 수 있다. 또한, 메모리(120)는 단일 이미지 데이터에 관련한 정보들을 저장할 수 있다. 예를 들어, 메모리(120)는 입/출력되는 데이터들(예를 들어, 하나 이상의 글자 이미지에 대응하는 원문 텍스트 정보, 하나 이상의 글자 이미지에 대응하는 번역 텍스트 정보 및 번역 텍스트 정보에 대응하는 번역 이미지가 반영됨에 따라 생성되는 아케이드 이미지 등)을 임시 또는 영구 저장할 수 있다.
본 개시의 일 실시예에 따르면, 메모리(120)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 컴퓨팅 장치(100)는 인터넷(internet) 상에서 상기 메모리(120)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다. 전술한 메모리에 대한 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 하나 이상의 코어로 구성될 수 있으며, 서버의 중앙 처리 장치(CPU: central processing unit), 범용 그래픽 처리 장치(GPGPU: general purpose graphics processing unit), 텐서 처리 장치(TPU: tensor processing unit) 등의 데이터 분석, 딥러닝을 위한 프로세서를 포함할 수 있다.
프로세서(130)는 메모리(120)에 저장된 컴퓨터 프로그램을 판독하여 본 개시의 일 실시예에 따른 딥러닝을 위한 데이터 처리를 수행할 수 있다. 본 개시의 일 실시예에 따라 프로세서(130)는 신경망의 학습을 위한 연산을 수행할 수 있다. 프로세서(130)는 딥러닝(DL: deep learning)에서 학습을 위한 입력 데이터의 처리, 입력 데이터에서의 피처 추출, 오차 계산, 역전파(backpropagation)를 이용한 신경망의 가중치 업데이트 등의 신경망의 학습을 위한 계산을 수행할 수 있다.
또한, 프로세서(130)는 CPU, GPGPU, 및 TPU 중 적어도 하나가 네트워크 함수의 학습을 처리할 수 있다. 예를 들어, CPU 와 GPGPU가 함께 네트워크 함수의 학습, 네트워크 함수를 이용한 데이터 분류를 처리할 수 있다. 또한, 본 개시의 일 실시예에서 복수의 컴퓨팅 장치의 프로세서를 함께 사용하여 네트워크 함수의 학습, 네트워크 함수를 이용한 데이터 분류를 처리할 수 있다. 또한, 본 개시의 일 실시예에 따른 컴퓨팅 장치에서 수행되는 컴퓨터 프로그램은 CPU, GPGPU 또는 TPU 실행가능 프로그램일 수 있다.
본 명세서에서 네트워크 함수는 인공 신경망, 뉴럴 네트워크와 상호 교환 가능하게 사용될 수 있다. 본 명세서에서 네트워크 함수는 하나 이상의 뉴럴 네트워크를 포함할 수도 있으며, 이 경우 네트워크 함수의 출력은 하나 이상의 뉴럴 네트워크의 출력의 앙상블(ensemble)일 수 있다.
프로세서(130)는 메모리(120)에 저장된 컴퓨터 프로그램을 판독하여 본 개시의 일 실시예에 따른 글자 인식 모델을 제공할 수 있다. 본 개시의 일 실시예에 따라, 프로세서(130)는 하나 이상의 글자 이미지로부터 원문 텍스트 정보를 획득하기 위한 계산을 수행할 수 있다. 본 개시의 일 실시예에 따라 프로세서(130)는 글자 인식 모델을 학습시키기 위한 계산을 수행할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 통상적으로 컴퓨팅 장치(100)의 전반적인 동작을 처리할 수 있다. 프로세서(130)는 위에서 살펴본 구성요소들을 통해 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나 메모리(120)에 저장된 응용 프로그램을 구동함으로써, 사용자 단말에게 적정한 정보 또는, 기능을 제공하거나 처리할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 이미지 파일을 획득할 수 있다. 이 경우, 이미지 파일은 네트워크부(110)를 통해 사용자 단말(10)로부터 획득된 것일 수 있다. 이미지 파일은, 사용자 단말(10)에서 캡쳐되는 이미지에 관련한 파일이거나 또는 사용자 단말(10)에 구비된 카메라 모듈을 통해 촬영된 이미지에 관련한 파일일 수 있다. 또한, 이미지 파일은, 하나 이상의 인식 대상 글자 이미지를 포함하는 파일일 수 있다. 글자 이미지는 다양한 언어 텍스트로 작성된 하나 이상의 글자를 포함하는 이미지일 수 있다. 예를 들어, 글자 이미지는 '나'라는 글자(즉, 한국어로 작성된 글자) 하나를 포함하고 있는 이미지일 수 있다. 추가적인 실시예에서, 컴퓨팅 장치(100)는 별도의 카메라부(미도시)를 더 포함할 수 있으며, 해당 카메라부를 통한 촬영을 통해 이미지 파일을 획득할 수도 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 이미지 파일에 포함된 하나 이상의 글자 이미지를 인식하여 원문 텍스트 정보를 획득할 수 있다. 원문 텍스트 정보는, 하나 이상의 글자 이미지 각각에 대응하는 글자들에 대한 정보일 수 있다. 예를 들어, 프로세서(130)는 제 1 이미지 파일 내 포함된 하나 이상의 글자 이미지를 인식하여 '오돌뼈'라는 원문 텍스트 정보를 획득할 있다. 다른 예를 들어, 프로세서(130)는 제 2 이미지 파일 내 포함된 하나 이상의 글자 이미지를 인식하여 '양깃머리는 소의 첫번째 위 부위로 담백한 맛이 일품입니다'라는 원문 텍스트 정보를 획득할 수 있다. 프로세서(130)는 글자 인식 모델을 활용하여 하나 이상의 글자 이미지에 대응하는 원문 텍스트 정보를 획득하거나, 또는 원문 인터페이스를 통해 사용자 단말(10)로부터 원문 텍스트 정보를 획득할 수 있다. 전술한 원문 텍스트 정보에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
자세히 설명하면, 프로세서(130)는 하나 이상의 네트워크 함수를 포함하는 글자 인식 모델을 통해 이미지 파일 내에 포함된 하나 이상의 글자 이미지에 대응하는 원문 텍스트 정보를 획득할 수 있다. 프로세서(130)는 이미지 파일에 포함된 하나 이상의 글자 이미지를 글자 인식 모델을 통해 각각의 글자로 분류하여 하나 이상의 글자 이미지 각각이 포함하는 글자를 인식할 수 있다. 프로세서(130)는 외부 서버(20)를 통해 글자 인식 모델을 학습시키기 위한 학습 데이터를 수신하고, 그리고 수신한 학습 데이터를 활용하여 하나 이상의 네트워크 함수에 대한 학습을 수행함으로써, 하나 이상의 글자 이미지에 대응하여 원문 텍스트 정보를 생성하는 글자 인식 모델을 생성할 수 있다. 즉, 글자 인식 모델은 하나 이상의 네트워크 함수를 포함할 수 있으며, 하나 이상의 네트워크 함수는 딥러닝 알고리즘을 통해 학습될 수 있다. 프로세서(130)는 이미지 파일에 대한 글자 세그멘테이션(segmentation)을 수행할 수 있으며, 글자 각각에 대한 세그멘테이션을 수행할 수 있다. 즉, 프로세서(130)는 이미지 파일 내 포함된 하나 이상의 글자 이미지를 인식할 수 있다.
자세한 예를 들어, 프로세서(130)는 글자 인식 모델을 통해 글자 이미지의 피처를 추출하여, 하나 이상의 클래스 각각에 대한 스코어를 추출할 수 있다. 클래스는, 글자 이미지가 의미하는 글자일 수 있다. 예를 들어, 하나 이상의 클래스 각각은, 가, 나, 다, 라 등일 수 있다. 프로세서(130)는 글자 이미지의 클래스 각각에 대한 스코어 값에 기초하여 글자 이미지를 글자로 분류할 수 있다. 프로세서(130)는 글자 인식 모델을 통하여 글자 이미지를 연산한 결과, 가장 높은 스코어 값을 가지는 클래스로 글자 이미지를 분류하여 하나 이상의 글자 이미지 각각이 포함하는 글자를 결정함으로써, 하나 이상의 글자 이미지에 대응하는 원문 텍스트 정보를 획득할 수 있다. 전술한 글자 이미지의 클래스에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
또한, 프로세서(130)는 원문 인터페이스를 통해 사용자 단말(10)로부터 원문 텍스트 정보를 획득할 수 있다. 구체적으로, 프로세서(130)는 이미지 파일에 포함된 하나 이상의 글자 이미지를 포함하는 원문 인터페이스(200)를 생성하여 사용자 단말(10)에 전송할 것을 결정할 수 있다. 원문 인터페이스(200)는, 사용자로부터 하나 이상의 글자 이미지에 대응하는 원문 텍스트 정보를 획득하기 위해 사용자 단말(10)에 표시되는 사용자 인터페이스일 수 있다. 이러한 원문 인터페이스(200)는 특정 언어 텍스트로 구성된 하나 이상의 글자 이미지를 포함할 수 있다.
프로세서(130)가 원문 인터페이스(200)를 제공하는 사용자 단말(10)은, 컴퓨팅 장치(100)에 연계된 서버에 접속 중이거나, 또는 컴퓨팅 장치와 연계된 서버에 가입한 복수의 사용자 단말 중 적어도 하나의 사용자 단말일 수 있다. 다시 말해, 프로세서(130)는 컴퓨팅 장치(100)와 연계된 복수의 사용자 단말 중 원문 인터페이스(200)를 전송할 사용자 단말을 결정함으로써, 해당 사용자 단말로부터 하나 이상의 글자 이미지에 대응하는 원문 텍스트 정보를 획득할 수 있다. 이 경우, 프로세서(130)가 원문 인터페이스(200)를 전송할 단말로 결정(또는 선별)하는 사용자 단말(즉, 원문 텍스트 정보를 획득하고자 하는 사용자 단말들)은 하나 이상의 글자 이미지에 관련한 언어를 활용 가능한 사용자에 관련한 단말일 수 있다. 예를 들어, 제 1 사용자 단말이 영어를 모국어로 활용하는 사용자에 관련한 단말인 경우, 프로세서(130)는 영어에 대응하는 글자 이미지들을 포함하는 원문 인터페이스(200)를 해당 제 1 사용자 단말로 전송할 것을 결정할 수 있다. 다른 예를 들어, 제 2 사용자 단말이 한국어를 모국어 활용하는 사용자에 관련한 단말인 경우, 프로세서(130)는 한국어에 대응하는 글자 이미지들을 포함하는 원문 인터페이스(200)를 해당 제 2 사용자 단말로 전송할 것을 결정할 수 있다. 전술한 각 사용자 단말에 관련한 언어에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
추가적인 실시예에서, 프로세서(130)는 컴퓨팅 장치(100)와 연계된 복수의 사용자 단말 각각의 참여 이력 정보 또는 언어 숙련도에 기초하여 복수의 사용자 단말 각각에 원문 인터페이스(200)가 노출되는 정도(즉, 원문 인터페이스가 제공되는 횟수)를 결정할 수 있다. 예컨대, 참여 이력 정보 및 언어 숙련도는 각 사용자 단말의 활동 정보 또는 개인 정보를 통해 식별될 수 있다. 구체적으로, 프로세서(130)는 복수의 사용자 단말 각각의 기존 참여 이력 정보 또는 언어 숙련도에 기초하여 복수의 사용자 단말 중 원문 인터페이스(200)를 통해 원문 텍스트 정보를 획득하기 위한 하나 이상의 사용자 단말(10)을 결정할 수 있다. 예를 들어, 제 1 사용자 단말의 참여 이력 정보가 기존 참여 횟수(즉, 과거 시점에 원문 인터페이스를 통한 사용자 단말의 응답 횟수)가 10회 라는 정보를 포함하며, 제 2 사용자 단말의 참여 이력 정보가 기존 참여 횟수가 20회 라는 정보를 포함하는 경우, 프로세서(130)는 제 2 사용자 단말 보다 제 1 사용자 단말에 원문 인터페이스(200)가 노출되는 횟수 증가하거나 또는 노출 시간 주기를 짧게 결정할 수 있다. 다른 예를 들어, 제 3 사용자 단말이 제 4 사용자 단말 보다 특정 언어인 '영어'에 대한 언어 숙련도가 높은 경우, 프로세서(130)는 제 4 사용자 단말 보다 제 3 사용자 단말에 원문 인터페이스(200)가 노출되는 횟수를 증가시키거나 또는 노출 시간 주기를 짧게 결정할 수 있다. 전술한 각 사용자 단말의 참여 이력 정보 또는 언어 숙련도에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
다시 말해, 프로세서(130)는 과거 참여 이력이 많은 사용자 단말(즉, 참여율이 높은 사용자 단말) 또는 언어 숙력도가 보다 높은 사용자 단말에 원문 인터페이스(200)가 다수 회 노출되도록 결정할 수 있다. 즉, 과거 참여 이력이 많거나 또는 특정 언어에 대한 언어 숙련도가 높은 사용자 단말일수록 원문 인터페이스를 수신할 확률이 증가할 수 있다. 이에 따라, 하나 이상의 글자 이미지에 대응하는 원문 텍스트 정보 수신의 응답률이 향상될 수 있다.
보다 구체적으로, 도 3을 참조하면, 원문 인터페이스(200)는, 원문 안내 정보 표시 영역(210), 글자 이미지 표시 영역(220), 원문 텍스트 입력 영역(230), 이미지 건너뛰기 그래픽 객체(240) 및 선택 저장 그래픽 객체(250)를 포함할 수 있다.
원문 인터페이스(200)에 포함된 원문 안내 정보 표시 영역(210)은, 해당 인터페이스에 관련한 안내 정보가 표시되는 영역일 수 있다. 예컨대, 도 3에 도시된 바와 같이, "박스 속 글자를 읽고 똑같이 써주세요"와 같이 한국어로 구성된 텍스트 정보가 표시될 수 있다. 이 경우, 원문 안내 정보 표시 영역(210)에 표시되는 텍스트 정보는 하나 이상의 글자 이미지에 대응하는 언어로 표시될 수 있다. 예를 들어, 하나 이상의 글자 이미지가 한국어에 관련한 경우, 원문 안내 정보 표시 영역(210)에 표시되는 텍스트 정보는 해당 글자 이미지에 대응하는 한국어에 관련한 텍스트일 수 있으며, 하나 이상의 글자 이미지가 중국어에 관련한 경우, 원문 안내 정보 표시 영역(210)에 표시되는 텍스트 정보는 해당 글자 이미지에 대응하는 중국어에 관련한 텍스트일 수 있다. 또한, 원문 안내 정보 표시 영역(210)은 원문 텍스트 정보에 관련한 사용자의 입력에 관련하여 발생하는 리워드에 관한 정보를 포함할 수 있다. 여기서 리워드는, 원문 인터페이스(200)를 통해 원문 텍스트 정보에 관련한 입력에 따라 사용자 단말(10)의 사용자에게 제공되는 보상에 관한 정보일 수 있다. 예컨대, 사용자의 입력에 관련하여 발생하는 리워드에 관한 정보는 도 3에 도시된 바와 같이, '10P'일 수 있다. 이러한 리워드는, 프로세서(130)에 의해 산출될 수 있다. 구체적으로, 프로세서(130)는 하나 이상의 글자 이미지의 수에 기초하여 리워드를 산출할 수 있다. 예를 들어, 원문 텍스트 정보의 획득에 관련한 하나 이상의 글자 이미지의 수가 5개인 경우, 프로세서(130)는 사용자 단말에 제공될 리워드를 '12P'로 산출할 수 있다. 다른 예를 들어, 원문 텍스트 정보의 획득에 관련한 하나 이상의 글자 이미지의 수가 10개인 경우, 프로세서(130)는 사용자 단말에 제공될 리워드를 '20P'로 산출할 수 있다. 즉, 프로세서(130)는 하나 이상의 글자 이미지의 수에 기초하여, 글자 이미지에 대응하여 입력해야할 원문 텍스트가 보다 적을 것으로 예상되는 경우, 발생하는 리워드를 보다 적게 산출하고, 그리고 해당 이미지에 대응하는 원문 텍스트가 보다 많을 것으로 예상되는 경우, 발생하는 리워드를 보다 많게 산출할 수 있다. 즉, 원문 텍스트를 입력하는 사용자의 노력의 정도에 따라 상이한 리워드를 할당함으로써, 사용자들의 자발적인 참여를 유도할 수 있으며, 오락적 흥미 요소를 제공할 수 있다.
다시 말해, 사용자 단말의 사용자는 원문 안내 정보 표시 영역(210)에 표시된 텍스트 정보를 통해 원문 인터페이스(200)를 통한 원문 텍스트 정보 입력 방법 및 그에 따른 리워드에 관한 안내 정보를 제공받을 수 있다.
원문 인터페이스(200)에 포함된 이미지 표시 영역(220)은, 하나 이상의 글자 이미지가 표시되는 영역일 수 있다. 여기서, 이미지 표시 영역(220)에 표시되는 하나 이상의 글자 이미지는, 사용자가 원문 텍스트 입력 영역(230)에 텍스트를 입력하기 위한 기준이 되는 이미지일 수 있다. 또한, 하나 이상의 글자 이미지는, 사용자 단말(10)에 구비된 카메라 모듈을 통해 획득한 이미지 파일에 관련한 것일 수 있다. 예컨대, 사용자는 자신이 이해하지 못하는 언어로 작성된 글자를 사용자 단말(10)을 통해 촬영하여 해당 글자를 포함하는 이미지 파일을 획득하여 프로세서(130)로 전송할 수 있다. 구체적인 예를 들어, 영어를 활용하는 사용자가 한국어로 작성된 텍스트에 대한 정보를 획득하고자 하는 경우, 사용자 단말(10)의 카메라 모듈을 통해 해당 텍스트를 촬영하여 하나 이상의 글자 이미지를 포함하는 이미지 파일을 획득하고, 획득된 이미지 파일을 프로세서(130)로 전송할 수 있다. 프로세서(130)는 하나 이상의 글자 이미지를 포함하는 이미지 파일을 수신하는 경우, 이미지 파일에 포함된 하나 이상의 글자 이미지를 이미지 표시 영역(220)에 표시하도록 하는 원문 인터페이스(200)를 생성할 수 있다. 즉, 사용자 단말(10)이 수신하는 원문 인터페이스(200)는 이미지 표시 영역(220)에 하나 이상의 글자 이미지를 표시할 수 있다. 사용자 단말(10)의 사용자는 이미지 표시 영역(220)에 표시된 하나 이상의 글자 이미지를 참조하여 원문 텍스트 입력에 원문 텍스트에 관련한 정보를 입력할 수 있다. 이미지 표시 영역(220)은 하나 이상의 글자 이미지에 대한 조정을 위한 사용자의 조정 입력을 허용할 수 있다. 사용자의 조정 입력은, 하나 이상의 글자 이미지에 대한 크기 조정, 또는 방향 조정에 관련한 것일 수 있다. 즉, 글자 이미지 표시 영역(220)은 사용자의 조정 입력에 대응하여 하나 이상의 글자 이미지를 확대/축소하거나, 또는 시계/반시계 방향으로 회전시켜 표시할 수 있다. 이에 따라, 하나 이상의 글자 이미지에 대한 사용자의 가독성이 향상될 수 있다.
원문 인터페이스(200)에 포함된 원문 텍스트 입력 영역(230)은, 원문 텍스트 정보에 관련하여 사용자 단말의 사용자의 입력을 수신하기 위한 영역일 수 있다. 즉, 사용자 단말(10)의 사용자는 이미지 표시 영역(220)에 표시된 하나 이상의 글자 이미지를 참조하여 원문 텍스트 입력 영역(230)에 원문 텍스트에 관련한 입력을 수행할 수 있다. 예를 들어, 도 3에 도시된 바와 같이, 사용자는 이미지 표시 영역(220)에 표시된 하나 이상의 글자 이미지를 참조하여 원문 텍스트 입력 영역(230)에 '오뎅탕'을 입력할 수 있다. 또한, 사용자는 원문 텍스트 입력 영역(230)에 입력을 완료한 경우, 선택 저장 그래픽 객체(250)에 대한 선택 입력을 인가할 수 있으며, 프로세서(130)는 선택 저장 그래픽 객체(250)에 대한 사용자의 입력에 대응하여 원문 텍스트 입력 영역(230)에 입력된 텍스트 정보를 원문 텍스트 정보로써 획득할 수 있다. 즉, 사용자가 원문 텍스트 입력 영역(230)에 '오뎅탕'을 입력한 후, 선택 저장 그래픽 객체(250)에 대한 입력을 인가하는 경우, 프로세서(130)는 '오뎅탕'을 하나 이상의 글자 이미지 객체에 대응하는 원문 텍스트 정보로 획득할 수 있다.
원문 인터페이스(200)에 포함된 이미지 건너뛰기 그래픽 객체(240)는 이미지 표시 영역(220)에 표시되는 글자 이미지를 다른 글자 이미지로 전환하기 위한 사용자의 입력을 수신하는 그래픽 객체일 수 있다. 구체적으로, 이미지 건너뛰기 그래픽 객체(240)에 대한 사용자의 입력이 수신되는 경우, 프로세서(130)는 현재 이미지 표시 영역(220)에 표시된 이미지 파일을 다른 글자 이미지를 포함하는 다른 이미지 파일로 전환할 수 있다.
예를 들어, 이미지 표시 영역(220)에는 하나 이상의 글자 이미지를 포함하는 이미지 파일이 표시될 수 있으며, 사용자는 해당 글자 이미지를 참조하여 원문 텍스트 입력 영역(230)에 원문 텍스트 정보에 관련한 입력을 입력시킬 수 있다. 다만, 사용자가 해당 이미지 표시 영역(220)에 표시된 하나 이상의 글자 이미지의 식별이 어려울 수 있다. 예컨대, 사용자가 하나 이상의 글자 이미지의 조합을 인지하지 못하거나, 해당 글자 이미지의 낮은 해상도를 통해 획득됨에 따라 가독성이 저하될 수 있다. 다른 예를 들어, 사용자는 높은 리워드를 획득하기 위하여 이미지 표시 영역(220)에 표시된 이미지 파일을 전환하고자 할 수 있다. 이러한 경우, 사용자는 이미지 건너뛰기 그래픽 객체(240)에 대한 입력을 인가할 수 있으며, 프로세서(130)는 해당 입력에 대응하여 이미지 표시 영역(220)에 표시된 하나 이상의 글자 이미지를 포함하는 이미지 파일을 다른 글자 이미지들을 포함하는 다른 이미지 파일로 전환할 수 있다. 즉, 원문 인터페이스(200)에 포함된 이미지 건너뛰기 그래픽 객체(240)를 통해 상이한 글자 이미지들을 포함하는 이미지 파일을 전환할 수 있음에 따라, 다양한 이미지 파일(또는 다양한 글자 이미지)에 대응하는 원문 텍스트 정보 획득의 편의성이 향상될 수 있다.
즉, 전술한 바와 같이, 프로세서(130)가 제공하는 원문 인터페이스(200)는 사용자 단말(10)에 표시될 수 있다. 또한, 원문 인터페이스에 포함된 각 표시 영역 및 그래픽 객체를 통한 사용자와 상호 작용에 따라 원문 텍스트 정보가 획득될 수 있다. 이는, 글자 인식 모델을 활용하여 원문 텍스트 정보를 획득하는 것보다 향상된 품질의 원문 텍스트 정보가 획득된다는 장점이 있다. 예를 들어, 신경망의 학습을 통해 하나 이상의 글자 이미지에 대응하는 원문 텍스트 정보를 출력하는 글자 인식 모델은, 학습 데이터가 부족하거나, 또는 해당 이미지 파일에서 글자 이미지들에 대한 가독성이 결여되는 경우, 정확도가 결여된 원문 텍스트 정보를 출력할 우려가 있다. 다만, 본 개시에서 원문 인터페이스를 활용하여 원문 텍스트 정보를 획득하는 구성은, 다수의 사용자 단말 각각의 사용자들의 직접적인 입력과 관련하여 획득되는 것임에 따라, 기계가 식별, 또는 판독하지 못하는 글자 이미지에 관련하여 향상된 정확도를 가진 원문 텍스트 정보의 획득이 가능해질 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 원문 인터페이스(200)에 대한 사용자 단말(10)의 타이핑 입력을 식별할 수 있다. 구체적으로, 프로세서(130)는 원문 인터페이스(200)에 포함된 원문 텍스트 입력 영역(230) 및 선택 저장 그래픽 객체(250)에 대한 사용자 단말(10)의 타이핑 입력을 식별할 수 있다. 예를 들어, 프로세서(130)는 제 1 사용자 단말(10)에 표시된 원문 인터페이스에 관련하여 제 1 사용자가 원문 텍스트 입력 영역(230)에 특정 텍스트를 입력하는 시점 및 선택 저장 그래픽 객체(250)에 대하여 입력을 인가하는 시점을 식별할 수 있다.
또한, 프로세서(130)는 미리 정해진 단위 시간을 기준으로 미리 정해진 임계 횟수 이상의 타이핑 입력이 식별되면, 사용자 단말(10)의 타이핑 입력을 오류 입력으로 결정할 수 있다. 구체적인 예를 들어, 미리 정해진 단위 시간이 5초이며, 미리 정해진 임계 횟수가 2회이고, 제 1 사용자 단말에 표시된 원문 텍스트 입력 영역(230) 및 선택 저장 그래픽 객체(250)에 대한 제 1 사용자의 타이핑 입력이 10초 이내에 10회 발생하였다는 정보를 포함하는 경우, 프로세서(130)는 해당 사용자 단말(10)의 타이핑 입력을 오류 입력으로 결정할 수 있다. 이러한 오류 입력에 관련한 타이밍 입력은, 원문 텍스트 정보 획득 과정에서 폐기될 수 있다. 즉, 프로세서(130)는 원문 텍스트 정보 입력에 관련한 사용자의 입력이 비정상적으로 빠른 경우, 해당 사용자 단말(10)에 관련한 타이핑 입력으로 오류 입력(예컨대, 어뷰징)으로 결정할 수 있다. 이에 따라, 비정상적인 활동에 관련한 무분별한 정보 입력을 방지함으로써, 원문 인터페이스(200)를 통해 확보되는 원문 텍스트 정보의 정확성 향상을 도모할 수 있다.
또한, 프로세서(130)는 오류 입력에 관련한 사용자 단말(10)에 하나 이상의 글자 이미지를 미리 정해진 시간 기간동안 노출시키기 않을 것을 결정할 수 있다. 예컨대, 프로세서(130)에 의해 제 2 사용자 단말에 관련한 타이핑 입력이 오류 입력으로 결정된 경우, 제 2 사용자 단말에 하나 이상의 글자 이미지를 미리 정해진 시간 기간동안(예컨대, 24시간) 노출시키지 않을 수 있다. 즉, 프로세서(130)는 오류 입력(즉, 부정 입력)에 관련한 사용자 단말을 식별하고, 식별된 사용자 단말에 사전 결정된 기간 동안의 패널티를 부과함으로써, 시스템 내에서의 선순환을 유도할 수 있다. 다시 말해, 부당하게 리워드를 획득하려는 사용자 단말에 대하여 미리 정해진 시간기간 동안 리워드의 획득이 제한되도록 하나 이상의 글자 이미지를 노출시키지 않음으로써, 사용자 단말들의 올바른 참여를 유도할 수 있다. 즉, 프로세서(130)는 부정 입력에 관련한 사용자 단말에 패널티를 부과하여 시스템 내의 사용자 단말들의 선순환을 유도함으로써, 향상된 품질의 원문 텍스트 정보 획득을 야기시킬 수 있다.
추가적인 실시예에서, 프로세서(130)는 글자 인식 모델의 출력 정확도에 기반하여 원문 인터페이스를 활용 여부를 결정할 수 있다. 구체적으로, 프로세서(130)는 글자 인식 모델의 출력에 관한 스코어에 기초하여 원문 인터페이스(200)를 사용자 단말로 전송할지 여부를 결정할 수 있다. 프로세서(130)는 하나 이상의 글자 이미지를 포함하는 이미지 파일을 글자 인식 모델에 입력으로 처리하여 하나 이상의 글자 이미지에 대응하는 원문 텍스트 정보를 출력할 수 있다. 이 경우, 프로세서(130)는 원문 텍스트 정보의 출력에 관련한 스코어 값에 기초하여 원문 인터페이스(200)를 사용자 단말로 전송할지 여부를 결정할 수 있다.
구체적인 예를 들어, 글자 인식 모델이 제 1 이미지 파일을 입력으로 하여 제 1 텍스트 정보를 출력하고, 해당 제 1 텍스트 정보 출력에 관련한 스코어 값이 80이며, 미리 정해진 임계 스코어 값이 85인 경우, 프로세서(130)는 원문 인터페이스(200)를 사용자 단말로 전송할 것을 결정할 수 있다. 이에 따라, 원문 인터페이스(200)에 대한 사용자 단말의 입력에 대응하여 원문 텍스트 정보가 획득될 수 있다.
다른 예를 들어, 글자 인식 모델이 제 2 이미지 파일을 입력으로 하여 제 2 텍스트 정보를 출력하고, 해당 제 2 텍스트 정보 출력에 관련한 스코어 값이 90이며, 미리 정해진 임계 스코어 값이 85인 경우, 프로세서(130)는 원문 인터페이스(200)를 사용자 단말로 전송하지 않을 수 있다. 즉, 프로세서(130)는 글자 인식 모델의 출력의 정확도가 임계치 이상인 경우, 해당 글자 인식 모델의 출력을 통해 원문 텍스트 정보를 획득할 수 있다.
즉, 프로세서(130)는 글자 인식 모델의 출력에 관련한 스코어가 임계치 이상인 경우, 해당 출력 통해 원문 텍스트 정보를 획득할 수 있다. 또한, 프로세서(130)는 글자 인식 모델의 출력에 관련한 스코어가 임계치 미만인 경우, 해당 모델의 정확도가 임계치에 도달하지 못한것으로 판별하여, 사용자 단말로 원문 인터페이스를 전송함으로써, 원문 텍스트 정보를 수신할 수 있다. 따라서, 글자 인식 모델의 출력 정확도에 따라 사용자 단말을 통해 원문 텍스트 정보를 획득할 지 여부를 결정함에 따라, 원문 텍스트 정보를 획득하는 프로세스의 응답 속도가 향상시킬 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 원문 텍스트 정보에 대한 품질 검사를 수행하여 원문 텍스트 정보에 대한 적정성을 판별할 수 있다. 구체적으로, 프로세서(130)는 사용자 단말의 히스토리 정보에 기초하여 품질 검사를 수행할 다른 사용자 단말의 수를 결정할 수 있다. 히스토리 정보는, 사용자 단말의 입력 참여 횟수 정보, 또는 누적 품질 평가 정보 중 적어도 하나를 포함할 수 있다. 입력 참여 횟수 정보는, 사용자 단말(10)이 원문 인터페이스를 통해 프로세서(130)로 원문 텍스트 정보를 전송한 횟수에 관련한 참여 이력에 관한 정보일 수 있다. 누적 품질 평가 정보는, 사용자 단말(10)이 프로세서(130)로 전송한 원문 텍스트 정보에 대한 다른 사용자들의 품질 평가 정보에 관련한 것일 수 있다.
구체적인 예를 들어, 제 1 사용자 단말(10)의 입력 참여 횟수 정보가 과거 시점에 원문 텍스트 정보를 다수 회 전송하였다는 정보를 포함하는 경우, 프로세서(130)는 제 1 사용자 단말(10)로부터 수신한 원문 텍스트 정보에 대한 품질 검사를 수행할 다른 사용자 단말의 수를 '2'로 결정할 수 있다. 다른 예를 들어, 제 2 사용자 단말(10)의 입력 참여 횟수 정보가 과거 시점에 원문 텍스트 정보 이력이 존재하지 않는다는 정보를 포함하는 경우, 프로세서(130)는 제 2 사용자 단말(10)로부터 수신한 원문 텍스트 정보에 대한 품질 검사를 수행할 다른 사용자 단말의 수를 '5'로 결정할 수 있다. 또 다른 예를 들어, 제 3 사용자 단말(10)의 누적 품질 평가 정보가 3점이며, 제 4 사용자 단말(10)의 누적 품질 평가 정보가 9점인 경우, 프로세서(130)는 제 3 사용자 단말(10)로부터 수신한 원문 텍스트 정보에 대한 품질 검사를 수행할 다른 사용자 단말의 수를 '6'로 결정할 수 있으며, 제 4 사용자 단말로부터 수신한 원문 텍스트 정보에 대한 품질 검사를 수행할 다른 사용자 단말의 수를 '2'로 결정할 수 있다. 전술한 각 사용자 단말의 입력 참여 횟수 정보, 누적 품질 평가 정보 및 다른 사용자 단말의 수에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
즉, 프로세서(130)는 원문 텍스트 정보를 송신한 사용자 단말의 입력 참여 횟수 정보에 다수의 과거 참여 이력이 존재하거나, 또는 누적 품질 평가 정보에 타 사용자들로터의 과거 품질 평가 점수가 높은 경우, 해당 원문 텍스트 정보에 대한 품질 평가를 위한 다른 사용자 단말의 수를 적게 결정할 수 있다. 즉, 원문 텍스트 정보를 송신한 사용자 단말 각각의 정보(입력 참여 횟수 정보 및 누점 품질 평가 정보)에 기반하여 각 단말로부터 획득한 원문 텍스트 정보에 대한 평가를 위한 다른 사용자 단말의 수를 상이하게 결정할 수 있다. 이는, 각 사용자 단말을 특성을 고려하여 평가를 위한 타 사용자 단말을 수를 결정함으로써, 평가를 위한 응답속도를 극대화하는 효과를 가질 수 있다. 다시 말해, 검증이 필요한 사용자 단말의 원문 텍스트 정보는 보다 많은 다른 사용자 단말을 통해 평가되도록 하며, 검증된 사용자 단말의 원문 텍스트 정보는 보다 적은 다른 사용자 단말을 통해 평가되도록 함으로써, 원문 텍스트 정보의 품질 평가의 응답 속도의 최적화를 야기시킬 수 있다.
또한, 프로세서(130)는 결정된 다른 사용자 단말의 수에 대응하여 하나 이상의 다른 사용자 단말에게 하나 이상의 글자 이미지 및 원문 텍스트 정보를 포함하는 평가 정보 입력 창을 전송할 것을 결정할 수 있다. 구체적으로, 프로세서(130)는 사용자 단말(10)의 과거 참여 이력 정보 및 누적 품질 평가 정보에 기초하여 평가에 관련한 다른 사용자 단말들을 결정할 수 있으며, 결정된 하나 이상의 다른 사용자 단말 각각에 평가 정보 입력 창을 전송할 것을 결정할 수 있다. 이 경우, 평가 정보 입력 창은, 사용자 단말(10)을 통해 획득된 원문 텍스트 정보가 적정한지 여부를 판별하기 위한 다른 사용자 단말 각각에 전송되는 입력 창일 수 있다.
구체적인 예를 들어, 프로세서(130)는 제 1 사용자 단말에 과거 참여 이력 정보 및 누적 품질 평가 정보에 기초하여 제 2 사용자 단말 및 제 3 사용자 단말을 제 1 사용자 단말이 전송한 제 1 원문 텍스트 정보에 대한 평가를 위한 다른 사용자 단말로 결정할 수 있다. 이 경우, 프로세서(130)는 제 2 사용자 단말 및 제 3 사용자 단말 각각에 제 1 원문 텍스트 정보를 포함하는 평가 정보 입력 창을 전송할 것을 결정할 수 있다. 평가 정보 창은, 원문 텍스트 정보에 대한 평가를 위한 하나 이상의 그래픽 객체를 포함할 수 있다. 예를 들어, 하나 이상의 그래픽 객체는 원문 텍스트 정보에 관련한 타 사용자의 품질 평가를 위해 '나쁨', '좋음'으로 구성되거나, '상', '중', '하'로 구성되거나, 또는 평가 품질에 관련한 복수의 수치를 통해 구성될 수 있으나, 이에 제한되는 것은 아니다. 즉, 프로세서(130)는 제 1 사용자 단말로부터 수신한 제 1 원문 텍스트 정보를 포함하는 평가 정보 입력 창을 생성하여 제 2 사용자 단말 및 제 3 사용자 단말에 전송할 것을 결정할 수 있다.
또한, 프로세서(130)는 하나 이상의 다른 사용자 단말 각각으로부터 평가 정보 입력 창을 통해 수신한 품질 평가 정보에 기초하여 원문 텍스트 정보에 대한 적정성을 판별할 수 있다. 구체적으로, 프로세서(130)는 평가 정보 입력 창을 통해 다른 사용자 단말 각각으로부터 하나 이상의 품질 평가 정보를 획득할 수 있다. 또한, 프로세서(130)는 각 단말로부터 수신한 하나 이상의 품질 평가 정보와 미리 정해진 평가 기준에 기초하여 원문 텍스트 정보에 대한 적정성을 판별할 수 있다. 예를 들어, 미리 정해진 기준이 평균 품질 평가 정보가 8점 이상이며, 제 2 사용자 단말 및 제 3 사용자 단말 각각으로부터 평가 정보 입력 창을 통해 '8', '9'라는 품질 평가 정보를 수신하는 경우, 프로세서(130)는 단말들의 평균 품질 평가 정보(즉, 8.5)가 미리 정해진 기준을 충족하는 것으로 판별하여 해당 원문 텍스트 정보가 적정하다고 판별할 수 있다. 다른 예를 들어, 미리 정해진 기준이 2개 이상의 사용자로부터 7점 이하의 품질 평가 정보 수신하는 것이며, 제 1 사용자 단말, 제 2 사용자 단밀 및 제 3 사용자 단말 각각으로부터 평가 정보 입력 창을 '6', '7', '5'라는 품질 평가 정보를 수신하는 경우, 프로세서(130)는 6점 이하의 품질 평가 정보를 적어도 둘 이상의 사용자 단말(즉, 제 1 사용자 단말 및 제 3 사용자 단말)로부터 수신한 것을 식별하여, 해당 원문 텍스트 정보가 적정하지 않은 것으로 판별할 수 있다. 이에 따라, 프로세서(130)는 해당 원문 텍스트 정보를 폐기할 것을 결정할 수 있다. 전술한, 미리 정해진 기준 및 각 사용자 단말을 통해 수신한 품질 평가 정보에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
또한, 프로세서(130)는 원문 데이터 정보에 대한 적정성 판별 결과에 기초하여 사용자 단말(10)에 리워드를 부여할 수 있다. 이 경우, 리워드는 원문 데이터 정보 생성에 관련하여 사용자 단말(10)에 부여되는 포인트에 관련한 것일 수 있으며, 예컨대, 해당 포인트는 특정 서버에서 활용 가능하거나, 또는 사용자의 계좌에 현금으로 지급되어 활용 가능한 것일 수 있다. 예를 들어, 프로세서(130)는 제 1 사용자 단말(10)을 통해 수신한 제 1 원문 데이터가 적정한 것으로 판별한 경우, 제 1 사용자 단말(10)에 '10P'의 리워드를 부여할 수 있다. 전술한 리워드에 관련한 구체적인 수치적 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 번역 인터페이스를 통해 사용자 단말(10)로부터 번역 텍스트 정보를 획득할 수 있다. 구체적으로, 프로세서(130)는 원문 텍스트 정보에 대한 적정성 판별 결과에 기초하여 원문 텍스트 정보를 포함하는 번역 인터페이스(300)를 생성하여 사용자 단말(10)로 전송할 것을 결정할 수 있다. 예컨대, 프로세서(130)는 원문 텍스트 정보가 적정하다고 판별되는 경우, 해당 원문 텍스트 정보를 포함하는 번역 인터페이스(300)를 생성하여 사용자 단말로 전송할 것을 결정할 수 있다. 번역 인터페이스(300)는 사용자로부터 원문 텍스트 정보에 대응하는 번역 텍스트 정보를 획득하기 위해 사용자 단말(10)로 제공되는 사용자 인터페이스일 수 있다. 본 개시의 원문 텍스트 정보는 하나 이상의 글자 이미지에 대응하여 획득되는 것임에 따라, 원문 텍스트 정보에 대응하여 생성되는 번역 텍스트 정보는 하나 이상의 글자 이미지에 번역과 관련한 텍스트 정보일 수 있다. 이러한 번역 인터페이스(300)는 특정 언어 텍스트로 구성된 하나 이상의 글자 이미지 및 원문 텍스트 정보를 포함할 수 있다.
이 경우, 프로세서(130)는 번역 인터페이스를 전송하기 위한 하나 이상의 다른 사용자 단말을 결정할 수 있다. 구체적으로, 프로세서(130)는 복수의 사용자 단말 중 상기 번역 인터페이스에 포함된 상기 원문 텍스트 정보와 매칭되는 사용자 단말을 식별할 수 있다. 또한, 프로세서(130)는 식별된 사용자 단말을 상기 번역 인터페이스를 전송할 사용자 단말로 결정할 수 있다. 예컨대, 원문 텍스트 정보가 한국어에 관련한 경우, 프로세서(130)는 해당 한국어를 활용 가능한 사용자 단말을 번역 인터페이스를 전송할 사용자 단말로 결정할 수 있다.
추가적으로, 프로세서(130)가 번역 인터페이스(300)를 제공하는 사용자 단말(10)은, 컴퓨팅 장치(100)와 연계된 서버에 접속 중이거나, 또는 컴퓨팅 장치와 연계된 서버에 가입한 복수의 사용자 단말 중 적어도 하나의 사용자 단말일 수 있다. 다시 말해, 프로세서(130)는 컴퓨팅 장치(100)와 네트워크를 통해 연계된 복수의 사용자 단말 중 번역 인터페이스를 전송한 사용자 단말을 결정함으로써, 해당 사용자 단말로부터 원문 텍스트에 대응하는 번역 텍스트 정보를 획득할 수 있다. 이 경우, 프로세서(130)가 번역 인터페이스를 전송한 단말로 결정하는 사용자 단말(즉, 원문 텍스트 정보에 대응하는 번역 텍스트 정보를 획득하고자 하는 사용자 단말)은 원문 텍스트 정보에 관련한 제 1 언어 및 번역 텍스트 정보에 관련한 제 2 언어를 활용 가능한 사용자에 관련한 단말일 수 있다. 예를 들어, 번역 인터페이스(300)에 포함된 원문 텍스트 정보가 한국어로 구성된 텍스트이며, 획득하고자 하는 번역 텍스트 정보가 영어로 구성된 텍스트인 경우, 프로세서(130)는 한국어와 영어 모두 활용 가능한 제 1 사용자에 관련한 제 1 사용자 단말을 번역 인터페이스를 전송할 사용자 단말로 결정할 수 있다. 이 경우, 제 1 사용자 단말의 활용 가능 언어는 예를 들어, 가입 시, 입력되는 사용자 정보를 통해 식별될 수 있다. 추가적인 실시예에서, 프로세서(130)는 원문 텍스트 정보에 대응하는 주제를 식별하고, 식별된 주제에 대응하는 사용자 단말들을 번역 인터페이스를 전송할 사용자 단말로 결정할 수도 있다.
즉, 프로세서(130)는 컴퓨팅 장치(100)와 연계된 복수의 사용자 단말 중 번역 작업에 보다 적합한 사용자 단말을 식별하여 번역 인터페이스를 전송할 사용자 단말로 결정할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 원문 텍스트 정보에 대한 적정성 판별 결과에 기초하여 원문 텍스트 정보를 포함하는 번역 인터페이스를 생성하여 사용자 단말(10)로 전송할 것을 결정할 수 있다.
구체적인 예를 들어, 번역 인터페이스(300)는 도 4에 도시된 바와 같이, 번역 안내 정보 표시 영역(310), 이미지 표시 영역(320), 원문 텍스트 표시 영역(330), 번역 텍스트 입력 영역(340), 건너뛰기 그래픽 객체(350) 및 선택 저장 그래픽 객체(360)를 포함할 수 있다.
번역 인터페이스(300)에 포함된 번역 안내 정보 표시 영역(310)은, 해당 인터페이스에 관련한 안내 정보가 표시되는 영역일 수 있다. 예컨대, 도 4에 도시된 바와 같이, "이 문장을 번역하세요"와 같이 한국어로 작성된 텍스트 정보가 표시될 수 있다. 이 경우, 번역 안내 정보 표시 영역(310)에 표시되는 텍스트 정보는 원문 텍스트 정보에 대응하는 언어로 표시될 수 있다. 예를 들어, 원문 텍스트 정보가 영어에 관련한 경우, 번역 안내 정보 표시 영역(310)에 표시되는 텍스트 정보는 해당 원문 텍스트 정보에 대응하는 영어에 관련한 텍스트 일 수 있으며, 원문 텍스트 정보가 일본어에 관련한 경우, 번역 안내 정보 표시 영역(310)은 해당 원문 텍스트 정보에 대응하는 일본어에 관련한 텍스트일 수 있다. 또한, 번역 안내 정보 표시 영역(310)은 번역 텍스트 정보에 관련한 사용자의 입력에 관련하여 발생하는 리워드에 관한 정보를 포함할 수 있다. 여기서, 리워드는, 번역 인터페이스(300)를 통해 번역 텍스트 정보에 관련한 입력이 수신됨에 따라 사용자 단말(10)에게 제공되는 보상에 관한 정보일 수 있다. 예컨대, 사용자의 입력에 관련하여 발생하는 리워드에 관한 정보는 도 4에 도시된 바와 같이, '10P'일 수 있다. 이러한 리워드는, 프로세서(130)에 의해 산출될 수 있다. 구체적으로, 프로세서(130)는 원문 텍스트 정보에 포함된 단어의 수에 기초하여 리워드를 산출할 수 있다. 예를 들어, 원문 텍스트 정보에 포함된 단어의 수가 10개인 경우, 프로세서(130)는 사용자 단말에 제공될 리워드를 '20P'로 산출할 수 있다. 다른 예를 들어, 원문 텍스트 정보에 포함된 단어의 수가 15개인 경우, 프로세서(130)는 사용자 단말에 제공될 리워드를 '30P'로 산출할 수 있다. 즉, 프로세서(130)는 원문 텍스트 정보에 포함된 하나 이상의 단어의 수에 기초하여, 원문 텍스트에 대응하여 입력해야할 번역 텍스트가 보다 적을 것으로 예상되는 경우, 발생하는 리워드를 보다 적게 산출하고, 그리고 해당 원문 텍스트 정보에 대응하여 입력해야할 번역 텍스트가 보다 많을 것으로 예상되는 경우, 발생하는 리워드를 보다 많게 산출할 수 있다. 즉, 번역 텍스트를 입력하는 사용자의 노력의 정도에 따라 상이한 리워드를 부여함으로써, 사용자들의 자발적인 참여를 유도할 수 있으며, 오락적 흥미 요소를 제공할 수 있다.
다시 말해, 사용자 단말의 사용자는 번역 안내 정보 표시 영역(310)에 표시된 텍스트 정보를 통해 번역 인터페이스(300)를 통한 번역 텍스트 정보 입력 방법 및 그에 따른 리워드에 관한 안내 정보를 제공받을 수 있다.
번역 인터페이스(300)에 포함된 이미지 표시 영역(320)은, 하나 이상의 글자 이미지가 표시되는 영역일 수 있다. 여기서, 이미지 표시 영역(320)에 표시되는 하나 이상의 글자 이미지는, 사용자가 번역 텍스트 입력 영역(340)에 텍스트를 입력하기 위한 기준이 되는 이미지일 수 있다. 예컨대, 사용자 단말의 사용자는 이미지 표시 영역(320)과 원문 텍스트 표시 영역(330)에 표시된 정보들을 비교하여 번역 텍스트 입력 영역(340)에 번역 텍스트에 관련한 입력을 수행할 수 있다. 즉, 사용자 단말(10)의 사용자는 이미지 표시 영역(320)에 표시된 하나 이상의 글자 이미지와 원문 텍스트 표시 영역(330)에 표시된 원문 텍스트 정보를 참조하여 번역 텍스트 입력 영역(340)에 번역 텍스트에 관련한 정보를 입력할 수 있다. 이미지 표시 영역(320)은 하나 이상의 글자 이미지에 대한 조정을 위한 사용자의 조정 입력을 허용할 수 있다. 사용자의 조정 입력은, 하나 이상의 글자 이미지에 대한 크기 조정, 또는 방향 조정에 관련한 것일 수 있다. 즉, 이미지 표시 영역(320)은 사용자의 조정 입력에 대응하여 하나 이상의 글자 이미지를 확대/축소하거나, 또는 시계/반시계 방향으로 회전시켜 표시할 수 있다. 이에 따라, 하나 이상의 글자 이미지에 대한 사용자의 가독성이 향상될 수 있다.
번역 인터페이스(300)에 포함된 원문 텍스트 표시 영역(330)은, 전술한 도 3에서의 원문 텍스트 입력 영역(230)을 통해 획득한 원문 텍스트 정보가 표시되는 영역일 수 있다. 즉, 사용자 단말(10)의 사용자가 원문 인터페이스(200)의 이미지 표시 영역(220)에 표시된 하나 이상의 글자 이미지를 참조하여 원문 텍스트 입력 영역(230)에 원문 텍스트에 관련한 입력을 수행함에 따라 획득되는 원문 텍스트 정보가 원문 텍스트 표시 영역(330)에 표시될 수 있다.
번역 인터페이스(300)에 포함된 번역 텍스트 입력 영역(340)은, 번역 텍스트 정보에 관련하여 사용자 단말의 사용자의 입력을 수신하기 위한 영역일 수 있다. 즉, 사용자 단말(10)의 사용자는 이미지 표시 영역(320) 및 원문 텍스트 표시 영역(330)에 표시된 정보들을 참조하여 번역 텍스트 입력 영역(340)에 번역 텍스트에 관련한 입력을 수행할 수 있다. 예를 들어, 도 4에 도시된 바와 같이, 사용자는 이미지 표시 영역(320) 및 원문 텍스트 표시 영역(330)에 표시된 정보들을 참조하여 번역 텍스트 입력 영역(340)에 대한 입력을 수행할 수 있다. 또한, 사용자는 번역 텍스트 입력 영역(340)에 입력을 완료한 경우, 선택 저장 그래픽 객체(360)에 대한 입력을 인가할 수 있으며, 프로세서(130)는 선택 저장 그래픽 객체(360)에 대한 사용자의 입력에 대응하여 번역 텍스트 입력 영역(340)에 입력된 텍스트 정보를 번역 텍스트 정보로써 획득할 수 있다. 즉, 사용자가 번역 텍스트 입력 영역(340)에 번역 텍스트를 입력한 후, 선택 저장 그래픽 객체(360)에 대한 입력을 인가하는 경우, 프로세서(130)는 해당 번역 텍스트를 하나 이상의 글자 이미지 또는 원문 텍스트 정보에 대응하는 번역 텍스트 정보로 획득할 수 있다.
번역 인터페이스(300)에 포함된 텍스트 건너뛰기 그래픽 객체(350)는 이미지 표시 영역(320) 및 원문 텍스트 표시 영역(330)에 표시된 정보들을 전환하기 위한 사용자의 입력을 수신하는 그래픽 객체일 수 있다. 구체적으로, 텍스트 건너뛰기 그래픽 객체(350)에 대한 사용자의 입력을 수신하는 경우, 프로세서(130)는 현재 이미지 표시 영역(320) 및 원문 텍스트 표시 영역(330) 각각에 표시된 정보들을 다른 이미지 파일 및 다른 원문 텍스트 정보로 전환할 수 있다.
예를 들어, 이미지 표시 영역(320) 및 원문 텍스트 표시 영역(330) 각각에는 영어에 관련한 하나 이상의 글자 이미지 및 하나 이상의 글자 이미지에 대응하는 원문 텍스트 정보가 표시될 수 있으며, 사용자는 해당 정보들을 참조하여 번역 텍스트 입력 영역(340)에 번역 텍스트 정보에 관련한 입력을 입력할 수 있다. 다만, 사용자가 해당 이미지 표시 영역(320) 또는 원문 텍스트 표시 영역(330)에 대응하는 번역 텍스트 정보를 생성하기 위한 사용자의 언어 지식이 부족할 수 있다. 이러한 경우, 텍스트 건너뛰기 그래픽 객체(350)를 활용하여 이미지 표시 영역(320) 및 원문 텍스트 표시 영역(330)에 표시된 정보들을 전환함으로써, 자신이 수행할 수 있는 번역 문장을 선택할 수 있다.
다른 예를 들어, 사용자는 높은 리워드를 획득하기 위하여 이미지 표시 영역(320)에 표시된 이미지 파일을 전환하고자 할 수 있다. 이 경우, 사용자는 이미지 건너뛰기 그래픽 객체(350)에 대한 입력을 인가할 수 있으며, 프로세서(130)는 해당 입력에 대응하여 이미지 표시 영역(320)에 표시된 하나 이상의 글자 이미지를 포함하는 이미지 파일을 다른 글자 이미지들을 포함하는 다른 이미지 파일로 전환하여 표시하고, 그리고 원문 텍스트 표시 영역(330)에 표시된 원문 텍스트 정보를 다른 이미지 파일에 포함된 다른 들자 이미지들에 대응하는 다른 원문 텍스트 정보로 전환하여 표시할 수 있다. 즉, 번역 인터페이스(300)에 포함된 이미지 건너뛰기 그래픽 객체(350)를 통해 상이한 글자 이미지들을 포함하는 이미지 파일 및 그에 대응하는 원문 텍스트 정보를 전환할 수 있음에 따라, 다양한 이미지 파일(또는 다양한 글자 이미지), 또는 다양한 원문 텍스트 정보에 대응하는 번역 텍스트 정보 획득의 편의성이 향상될 수 있다.
즉, 전술한 바와 같이 사용자 단말로 제공된 번역 인터페이스를 통해 프로세서(130)는 사용자 단말(10)로부터 하나 이상의 글자 이미지에 대응하는 번역 텍스트 정보를 수신할 수 있다. 또한, 번역 인터페이스에 포함된 각 표시 영역 및 그래픽 객체를 통해 사용자와의 상호작용을 수행함에 따라 번역 텍스트 정보가 획득될 수 있다. 이는, 단순히 인공 신경망 기반 번역 모델을 활용하여 번역 텍스트 정보를 획득하는 것보다 향상된 품질의 번역 텍스트 정보가 획득된다는 장점이 있다. 예를 들어, 신경망의 학습을 통해 원문 텍스트 정보에 대응하는 번역 텍스트 정보를 출력하는 번역 모델은, 학습 데이터 자체에 오류에 관련한 정보가 포함되거나, 또는 학습을 위한 학습 데이터의 양이 충분하지 않은 경우, 정확도가 결여된 번역 텍스트 정보를 출력할 우려가 있다. 다만, 본 개시에서 번역 인터페이스를 활용하여 번역 텍스트 정보를 획득하는 구성은, 원문 텍스트 및 번역 텍스트에 관련한 언어를 모두 활용 가능한 사용자 단말들 각각의 사용자들의 직접적인 입력과 관련하여 획득되는 것임에 따라, 기계 번역 보다 향상된 품질의 번역 텍스트 정보의 제공이 가능해질 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 번역 텍스트 정보에 대한 품질 검사를 수행하여 번역 텍스트 정보에 대한 적정성을 판별할 수 있다. 자세히 설명하면, 프로세서(130)는 하나 이상의 다른 사용자 단말로 원문 텍스트 정보 및 번역 텍스트 정보를 포함하는 평가 인터페이스를 생성하여 전송할 것을 결정할 수 있다. 평가 인터페이스(400)는 사용자 단말을 통해 획득한 번역 텍스트 정보에 대한 적정성 평가를 위해 하나 이상의 다른 사용자 단말로 제공되는 사용자 인터페이스일 수 있다.
이 경우, 프로세서(130)는 평가 인터페이스를 전송하기 위한 하나 이상의 다른 사용자 단말을 결정할 수 있다. 구체적으로, 프로세서(130)는 복수의 사용자 단말 중 상기 번역 인터페이스에 포함된 상기 원문 텍스트 정보와 매칭되는 사용자 단말을 식별할 수 있다. 또한, 프로세서(130)는 식별된 사용자 단말을 상기 번역 인터페이스를 전송할 사용자 단말로 결정할 수 있다. 예컨대, 원문 텍스트 정보가 한국어에 관련한 경우, 프로세서(130)는 해당 한국어를 활용 가능한 사용자 단말을 번역 인터페이스를 전송할 사용자 단말로 결정할 수 있다.
일 실시예에 따르면, 프로세서(130)는 사용자 단말의 히스토리 정보에 기초하여 품질 검사를 수행할 다른 사용자 단말의 수를 결정할 수 있다. 히스토리 정보는, 사용자 단말의 번역 입력 참여 횟수 정보 또는 누적 번역 평가 정보 중 적어도 하나를 포함할 수 있다. 번역 입력 참여 횟수 정보는, 사용자 단말이 번역 인터페이스를 통해 프로세서(130)로 번역 텍스트 정보를 전송한 횟수에 관련한 참여 이력에 관한 정보일 수 있다. 누적 번역 평가 정보는, 사용자 단말이 프로세서(130)로 전송한 원문 텍스트 정보에 대한 다른 사용자 단말들의 번역 평가 정보에 관련한 것일 수 있다.
또한, 프로세서(130)는 평가 인터페이스를 통한 하나 이상의 다른 사용자 단말 각각의 번역 평가 정보에 기초하여 번역 텍스트 정보에 대한 적정성을 판별할 수 있다. 도 5의 (a)를 참조하여 보다 구체적으로 설명하면, 평가 인터페이스(400)는, 이미지 표시 영역(410), 원문 텍스트 표시 영역(420), 번역 텍스트 표시 영역(430), 검수 관련 하나 이상의 그래픽 객체(440), 건너뛰기 그래픽 객체(450) 및 선택 저장 그래픽 객체(460)를 포함할 수 있다.
평가 인터페이스(400)에 포함된 이미지 표시 영역(410)은, 하나 이상의 글자 이미지가 표시되는 영역일 수 있다. 여기서, 이미지 표시 영역(410)에 표시되는 하나 이상의 글자 이미지는, 번역 텍스트 표시 영역(430)에 표시된 번역 텍스트 정보가 적정한지 여부를 판별하기 위한 기준이 되는 이미지일 수 있다. 예컨대, 사용자 단말의 사용자는 이미지 표시 영역(410), 원문 텍스트 표시 영역(420) 및 번역 텍스트 표시 영역(430)에 표시된 정보들을 비교하여 번역 텍스트 정보가 적정한지 여부를 평가할 수 있다.
평가 인터페이스(400)에 포함된 원문 텍스트 표시 영역(420)은, 전술한 도 3에서의 원문 텍스트 정보 입력 영역(230)을 통해 획득한 원문 텍스트 정보가 표시되는 영역일 수 있다. 즉, 사용자 단말(10)의 사용자가 원문 인터페이스(200)의 이미지 표시 영역(220)에 표시된 하나 이상의 글자 이미지를 참조하여 원문 텍스트 입력 영역(230)에 원문 텍스트에 관련한 입력을 수행함에 따라 획득되는 원문 텍스트 정보가 원문 텍스트 표시 영역(420)에 표시될 수 있다.
평가 인터페이스(400)에 포함된 번역 텍스트 표시 영역(430)은, 전술한 도 4에서의 번역 텍스트 입력 영역(340)을 통해 획득한 번역 텍스트 정보가 표시되는 영역일 수 있다. 즉, 사용자 단말의 사용자가 번역 인터페이스(300)의 원문 텍스트 표시 영역(330)에 표시된 원문 텍스트 정보를 참조하여 번역 텍스트 입력 영역(340)에 번역 텍스트에 관련한 입력을 수행함에 따라 획득되는 번역 텍스트 정보가 번역 텍스트 표시 영역(430)에 표시될 수 있다.
평가 인터페이스(400)에 포함된 검수 관련 하나 이상의 그래픽 객체(440)는, 번역 텍스트 정보에 대한 검수 입력을 허용하기 위한 검수 그래픽 객체(442) 및 번역 텍스트 정보에 대한 평가 점수를 산출하기 위한 하나 이상의 평가 그래픽 객체(441, 443)를 포함할 수 있다.
검수 그래픽 객체(442)는 번역 텍스트 정보에 대한 타 사용자의 검수 입력을 허용하기 위한 것으로, 사용자의 선택 입력을 수신하는 경우, 번역 텍스트 정보에 대한 사용자의 검수 입력을 허용하도록 번역 텍스트 표시 영역(430)을 활성화시킬 수 있다. 예를 들어, 평가 인터페이스(400)는 번역 텍스트 정보의 품질 평가를 위해 제 2 사용자 단말로 전송될 수 있으며, 번역 인터페이스(300)에 포함된 번역 텍스트 표시 영역(430)에는 제 1 사용자 단말을 통해 획득된 제 1 번역 텍스트 정보가 표시될 수 있다. 이 경우, 평가를 수행하는 제 2 사용자 단말의 제 2 사용자는 제 1 원문 텍스트 정보와 제 1 번역 텍스트 정보를 참조하여 해당 제 1 번역 텍스트 정보가 적정한지 여부를 판별할 수 있다. 제 2 사용자 단말의 제 2 사용자가 번역 텍스트 표시 영역(430)에 표시된 제 1 원문 텍스트 정보가 적정하지 않은 것으로 판별한 경우, 제 2 사용자는 검수 그래픽 객체(442)에 입력을 인가할 수 있다. 이 경우, 프로세서(130)는 제 2 사용자의 입력에 대응하여 번역 텍스트 표시 영역(430)을 제 2 사용자의 검수 입력을 허용하도록 활성화시킬 수 있다. 이에 따라, 제 2 사용자는 번역 텍스트 표시 영역(430)에 표시된 제 1 번역 텍스트 정보에 대한 검수 작업을 수행할 수 있다. 즉, 번역 텍스트 표시 영역(430)은 검수 그래픽 객체(442)에 대한 사용자의 입력 여부에 따라 검수 작업을 위한 영역으로 전환될 수 있다. 또한, 제 2 사용자는 검수 작업을 완료한 경우, 선택 저장 그래픽 객체(460)에 대한 선택 입력을 인가할 수 있으며, 프로세서(130)는 선택 저장 그래픽 객체(460)에 대한 제 2 사용자의 입력에 대응하여 번역 텍스트 정보에 수행된 제 2 사용자의 감수 입력을 감수 텍스트 정보로써 획득할 수 있다.
이 경우, 프로세서(130)는 검수 텍스트 정보를 획득함에 따라, 제 2 사용자 단말로 리워드를 제공할 수 있다. 즉, 프로세서(130)는 제 1 사용자 단말(10)이 제공한 번역 텍스트 정보에 대한 검수 작업을 수행하는 제 2 사용자 단말에 리워드를 제공할 수 있다. 이에 따라, 번역 텍스트 정보에 대한 평가 또는 검수(또는 교정)를 위한 타 사용자들의 능동적인 참여가 이뤄질 수 있다. 또한, 다른 사용자들의 검수 작업을 통해 번역 텍스트 정보에 대한 교정이 수행됨에 따라 원문 텍스트에 대응하여 보다 적절한 번역 텍스트 정보가 생성될 수 있다.
추가적인 실시예에서, 번역 텍스트 정보에 대응하여 검수 텍스트 정보가 생성된 경우, 프로세서(130)는 생성된 검수 텍스트 정보를 번역 텍스트 정보 생성에 관련한 사용자 단말(10)에 전송할 것을 결정할 수 있다. 예를 들어, 제 1 사용자 단말(10)을 통해 획득된 제 1 번역 텍스트 정보에 대하여 제 2 사용자 단말(10)의 검수 입력을 통해 제 1 검수 텍스트 정보가 생성된 경우, 프로세서(130)는 검수 텍스트 정보를 제 1 사용자 단말로 전송할 것을 결정할 수 있다. 이에 따라, 제 1 사용자 단말의 사용자는 자신이 번역한 번역 텍스트 정보의 교정에 관한 정보를 수신할 수 있음에 따라, 원문 텍스트 정보에 대응하여 보다 적정한 번역 텍스트 정보를 학습할 수 있다. 즉, 교정에 관련한 정보를 통해 번역에 대한 학습 효과를 제공할 수 있다.
하나 이상의 평가 그래픽 객체는 도 5의 (a)에 도시된 바와 같이, 번역 텍스트 정보에 관련한 번역이 적정하지 않다는 제 1 그래픽 객체(441) 및 번역 텍스트 정보에 관련한 번역이 적정하다는 제 2 그래픽 객체(442)를 포함할 수 있다. 즉, 평가 인터페이스(400)가 다른 하나 이상의 사용자 단말로 제공되는 경우, 다른 하나 이상의 사용자 단말 각각의 사용자는 제 1 그래픽 객체(441) 및 제 2 그래픽 객체(442) 중 적어도 하나에 대한 선택 입력을 통해 번역 텍스트 정보가 적정한지 여부에 관한 번역 평가 정보를 생성할 수 있다. 도 5의 예시에서는, 제 1 그래픽 객체 및 제 2 그래픽 객체 즉, 좋음, 또는 나쁨, 2개의 그래픽 객체를 통해 번역 텍스트 정보에 대한 번역 평가 정보를 생성함을 예시적으로 나타내나, 이에 제한되는 것은 아니다. 예컨대, 번역 평가 정보를 생성하기 위한 그래픽 객체는 '상', '중', '하'로 구성되거나, 또는 평가 품질에 관련한 복수의 수치를 통해 구성될 수도 있다.
실시 예에 따라서, 번역 평가를 수행하기 위한 기준에 대한 정보가 함께 제공될 수 있다. 예를 들어, 고유명사 혹은 식품명 등 특정 어휘들의 경우 언어 혹은 문화적 차이로 인하여 명확한 번역이 불가능하거나, 정확한 뜻을 전달하기 어려울 수 있다. 이 경우, 유사한 단어를 이용하여 번역하거나, 문장 혹은 구문으로 풀어서 번역하거나, 발음 그대로 음역을 하는 방법 중 하나를 선택하여 적용할 수 있다. 예를 들어, 도 5에 도시된 '양깃머리' 및 '오돌뼈'의 경우 Gras-double 및 Tribe 라고 번역할 수도 있지만, 'yanggit-meori' 혹은 'oddol-byeo' 와 같이 번역하는 것이 더 적절할 수도 있다.
이 경우, 번역 평가를 수행하기 위한 기준에 대한 정보가 함께 제공되지 않는다면 평가자마다 상이한 평가결과를 내놓을 수 있어, 혼란이 야기될 수 있다. 따라서, 번역 평가 인터페이스(400)에는 번역 평가기준이 표시될 수 있다. 예를 들어, 번역 평가 인터페이스(400)에 포함된 원문을 키워드 단위로 검색하였을 때, 직접적으로 매칭되는 단어가 사전에 존재하지 않는 경우, 음역을 기준으로 평가하도록 할 수 있고, 이 경우 평가자는 외래어표기법을 기준으로 음역이 정상적으로 이루어졌는지를 평가할 수 있다.
다른 예로, 번역 평가 인터페이스(400)에 포함된 원문을 키워드 단위로 검색하였을 때, 직접적으로 매칭되는 단어가 사전에 존재하지 않지만 예문에 해당 단어가 존재하거나, 기 설정된 유사도 이상의 단어가 존재하는 경우 유사 단어를 이용하여 번역하도록 할 수 있다. 이 경우, 평가자는 가장 유사한 단어를 잘 선택했는지 여부에 기초하여 번역결과를 평가할 수 있다. 단어의 유사도 평가는 word2vec 에 기반하여 수행될 수 있으나, 이에 제한되는 것은 아니다.
일 실시 예에서, 번역 평가 인터페이스(400)에는 번역 평가 기준을 선택하거나 변경할 수 있는 인터페이스가 더 표시될 수 있다. 예를 들어, 번역 평가 기준이 별도로 제시되지 않은 경우, 평가자는 본인이 번역을 평가한 기준을 선택할 수 있다. 예를 들어, 평가자는 해당 원문에 대하여 적절하다고 판단되는 번역 평가기준 혹은 번역이 기 수행된 번역문의 번역방법에 대응하는 평가기준을 선택하고, 이에 대한 평가결과를 입력할 수 있다. 마찬가지로, 번역 평가 기준이 제시되어 있는 경우에도 평가자는 번역 평가 기준이 잘못 제시되었거나, 더 나은 평가 기준이 있다고 판단되는 경우 이를 변경하는 입력을 수행할 수 있다.
평가 인터페이스(400)에 포함된 텍스트 건너뛰기 그래픽 객체(450)는 이미지 표시 영역(410), 원문 텍스트 표시 영역(420), 번역 텍스트 표시 영역(430)에 표시된 정보들을 전환하기 위한 사용자의 입력을 수신하는 그래픽 객체일 수 있다. 구체적으로, 텍스트 건너뛰기 그래픽 객체(450)에 대한 사용자의 입력을 수신하는 경우, 프로세서(130)는 현재 이미지 표시 영역(410), 원문 텍스트 표시 영역(420) 및 번역 텍스트 표시 영역(430) 각각에 표시된 정보들을 다른 이미지 파일 및 다른 원문 텍스트 정보로 전환할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 원문 텍스트 정보 및 해당 원문 텍스트 정보에 대응하는 번역 텍스트 정보에 기초하여 번역 모델을 학습시키기 위한 학습 데이터를 구축할 수 있다. 이 경우, 번역 모델은, 제 1 언어에 관련한 텍스트를 입력으로하여 제 2 언어에 관련한 텍스트를 출력하는 신경망 모델일 수 있다. 일반적으로, 인공 신경망 기반의 번역 모델은 학습 데이터가 많은수록 유의미한 정보의 추출이 가능해짐에 따라 향상된 정확도의 출력을 제공할 수 있다. 다만, 언어의 종류가 다양하고, 각 언어에는 수만가지의 단어와 각 단어의 조합을 통한 다양한 표현 방법이 존재하므로 적정한 학습 데이터 구축에 어려움이 있을 수 있다. 예컨대, 학습 데이터가 다량으로 확보되지 않는 경우, 번역 모델의 출력 정확도가 저하될 수 있다. 또한, 검증되지 않은 번역 데이터에 관련한 학습 데이터를 통한 학습은 번역 모델의 정확도를 결여시킬 우려가 있다. 이에 따라, 신경망을 학습시키기 위한 학습 데이터 구축 시, 검증 과정이 필수적으로 요구될 수 있다.
본 개시에서 프로세서(130)가 구축하는 학습 데이터(즉, 원문 텍스트 정보 및 번역 텍스트 정보)는 다수의 사용자들의 직접적인 입력 과정과 검증 과정을 거친 데이터임에 따라 다량으로 확보될 수 있으며, 추가적인 별도의 검증 과정이 생략될 수 있다. 즉, 신뢰도를 가진 다량 정보들을 통해 학습 데이터를 구축하고, 해당 학습 데이터를 통해 학습된 번역 모델이 제공될 수 있음에 따라, 학습 데이터 구축의 편의성 및 번역 모델의 출력 정확도 향상에 기여할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 하나 이상의 글자 이미지 및 번역 텍스트 정보에 기초하여 번역 텍스트 이미지를 생성하고, 번역 텍스트 이미지를 하나 이상의 글자 이미지의 상위 레이어로 표시하여 아케이드 이미지를 생성할 수 있다. 구체적으로, 프로세서(130)는 하나 이상의 글자 이미지의 좌표 정보, 생성 정보 및 폰트 정보를 포함하는 글자 이미지 정보를 식별할 수 있다. 예컨대, 글자 이미지 정보는, 이미지 내에서 하나 이상의 글자 이미지의 위치가 제 1 위치에 위치한다는 좌표 정보, 하나 이상의 글자 이미지의 배경 색상이 노란색이며, 텍스트 색상이 검정색이라는 색상 정보 및 하나 이상의 글자 이미지가 폰트 사이즈 '11'이며, 서체 '맑은 고딕'이라는 폰트 정보를 포함할 수 있다. 전술한 글자 이미지 정보에 포함된 좌표 정보, 색상 정보 및 폰트 정보에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
프로세서(130)는 좌표 정보에 대응하는 영역의 평균 색상 값에 기초하여 번역 텍스트 배경 이미지를 생성할 수 있다. 즉, 프로세서(130)에 의해 생성된 번역 텍스트 배경 이미지는 하나 이상의 글자 이미지에 대응하는 색상으로 구성될 수 있다.
프로세서(130)는 번역 텍스트 배경 이미지에 번역 텍스트 정보를 상기 폰트 정보에 기초하여 반영함으로써 번역 텍스트 이미지를 생성할 수 있다. 예컨대, 하나 이상의 글자 이미지에 폰트 정보가 폰트 사이즈 '11'이며, 서체 '맑은 고딕'이라는 정보를 포함하는 경우, 프로세서(130)는 번역 텍스트 정보를 폰트 사이즈 '11'이며, 서체 '맑은 고딕'로 하여 번역 텍스트 이미지를 생성할 수 있다.
또한, 프로세서(130)는 생성된 번역 텍스트 이미지를 좌표 정보에 대응하는 영역에 상위 레이어로 표시하여 아케이드 이미지 파일을 생성할 수 있다. 즉, 이미지 파일 내 하나 이상의 글자 이미지 위에 생성된 번역 텍스트 이미지를 상위 레이어로 표시함으로써, 하나 이상의 글자 이미지가 특정 언어로 번역된 번역 텍스트 이미지로 대체된 아케이드 이미지 파일을 생성할 수 있다. 예컨대, 도 5의 (a)의 이미지 표시 영역(410) 표시된 하나 이상의 글자 이미지를 포함하는 이미지 파일에 대한 변환이 수행됨에 따라 생성되는 아케이드 이미지 파일은 도 5의 (b)와 같을 수 있다.
다시 말해, 프로세서(130)는 이미지 파일 내에서 사용자가 이해하지 못하는 언어(예컨대, 외국어)로 작성된 하나 이상의 글자 이미지에 대한 번역을 수행하여 번역 텍스트 정보를 생성하고, 생성된 번역 텍스트 정보에 기초하여 이미지 파일에 대한 변환을 통해 아케이드 이미지를 생성할 수 있다. 이에 따라, 사용자는 자신에게 익숙한 언어를 통해 생성된 아케이드 이미지를 제공받을 수 있으므로, 이미지 파일 내에서 자신이 이해하지 못하는 정보들을 용이하게 획득할 수 있다. 이와 더불어, 프로세서(130)를 통해 생성된 아케이드 이미지는, 기존 하나 이상의 글자 이미지의 글자 이미지 정보에 기초하여 생성된 번역 이미지 정보를 포함할 수 있다. 즉, 아케이드 이미지 번역 전 이미지 내의 원문에 해당하는 글자의 표시 영역, 색상, 글자 크기, 서체 등에 기초하여 생성된 번역 이미지 정보를 포함함으로써, 번역에 관련한 정보를 획득하고자 하는 사용자에게 번역 전 이미지와 유사한 자연스러운 이미지를 제공할 수 있다.
도 6은 본 개시의 일 실시예와 관련된 이미지 파일 내에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지를 생성하기 위한 방법을 수행하기 위한 단계들을 예시적으로 도시한 순서도이다.
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 이미지 파일에 포함된 하나 이상의 글자 이미지를 인식하여 원문 텍스트 정보를 획득할 수 있다(510).
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 획득된 원문 텍스트 정보에 대한 품질 검사를 수행하여 원문 텍스트 정보에 대한 적정성을 판별할 수 있다(520).
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 적정성 판별 결과에 기초하여 원문 텍스트 정보를 포함하는 번역 인터페이스를 사용자 단말로 전송할 수 있다(530).
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 사용자 단말(10)로부터 번역 인터페이스를 통해 하나 이상의 글자 이미지에 대응하는 번역 텍스트 정보를 수신할 수 있다(540).
본 개시의 일 실시예에 따르면, 컴퓨팅 장치(100)는 하나 이상의 글자 이미지 및 번역 텍스트 정보에 기초하여 번역 텍스트 이미지를 생성하고, 생성된 번역 텍스트 이미지를 하나 이상의 글자 이미지의 상위 레이어로 표시하여 아케이드 이미지 파일을 생성할 수 있다(550).
전술한 도 6에 도시된 단계들은 필요에 의해 순서가 변경될 수 있으며, 적어도 하나 이상의 단계가 생략 또는 추가될 수 있다. 즉, 전술한 단계는 본 개시의 일 실시예에 불과할 뿐, 본 개시의 권리 범위는 이에 제한되지 않는다.
도 7은 본 개시의 일 실시예와 관련된 하나 이상의 네트워크 함수를 나타낸 개략도이다.
본 명세서에 걸쳐, 연산 모델, 신경망, 네트워크 함수, 뉴럴 네트워크(neural network)는 동일한 의미로 사용될 수 있다. 신경망은 일반적으로 “노드”라 지칭될 수 있는 상호 연결된 계산 단위들의 집합으로 구성될 수 있다. 이러한 “노드”들은 “뉴런(neuron)”들로 지칭될 수도 있다. 신경망은 적어도 하나 이상의 노드들을 포함하여 구성된다. 신경망들을 구성하는 노드(또는 뉴런)들은 하나 이상의“링크”에 의해 상호 연결될 수 있다.
신경망 내에서, 링크를 통해 연결된 하나 이상의 노드들은 상대적으로 입력 노드 및 출력 노드의 관계를 형성할 수 있다. 입력 노드 및 출력 노드의 개념은 상대적인 것으로서, 하나의 노드에 대하여 출력 노드 관계에 있는 임의의 노드는 다른 노드와의 관계에서 입력 노드 관계에 있을 수 있으며, 그 역도 성립할 수 있다. 상술한 바와 같이, 입력 노드 대 출력 노드 관계는 링크를 중심으로 생성될 수 있다. 하나의 입력 노드에 하나 이상의 출력 노드가 링크를 통해 연결될 수 있으며, 그 역도 성립할 수 있다.
하나의 링크를 통해 연결된 입력 노드 및 출력 노드 관계에서, 출력 노드는 입력 노드에 입력된 데이터에 기초하여 그 값이 결정될 수 있다. 여기서 입력 노드와 출력 노드를 상호 연결하는 노드는 가중치(weight)를 가질 수 있다. 가중치는 가변적일 수 있으며, 신경망이 원하는 기능을 수행하기 위해, 사용자 또는 알고리즘에 의해 가변될 수 있다. 예를 들어, 하나의 출력 노드에 하나 이상의 입력 노드가 각각의 링크에 의해 상호 연결된 경우, 출력 노드는 상기 출력 노드와 연결된 입력 노드들에 입력된 값들 및 각각의 입력 노드들에 대응하는 링크에 설정된 가중치에 기초하여 출력 노드 값을 결정할 수 있다.
상술한 바와 같이, 신경망은 하나 이상의 노드들이 하나 이상의 링크를 통해 상호 연결되어 신경망 내에서 입력 노드 및 출력 노드 관계를 형성한다. 신경망 내에서 노드들과 링크들의 개수 및 노드들과 링크들 사이의 연관관계, 링크들 각각에 부여된 가중치의 값에 따라, 신경망의 특성이 결정될 수 있다. 예를 들어, 동일한 개수의 노드 및 링크들이 존재하고, 링크들 사이의 가중치 값이 상이한 두 신경망이 존재하는 경우, 두 개의 신경망들은 서로 상이한 것으로 인식될 수 있다.
신경망은 하나 이상의 노드들을 포함하여 구성될 수 있다. 신경망을 구성하는 노드들 중 일부는, 최초 입력 노드로부터의 거리들에 기초하여, 하나의 레이어(layer)를 구성할 수 있다, 예를 들어, 최초 입력 노드로부터 거리가 n인 노드들의 집합은, n 레이어를 구성할 수 있다. 최초 입력 노드로부터 거리는, 최초 입력 노드로부터 해당 노드까지 도달하기 위해 거쳐야 하는 링크들의 최소 개수에 의해 정의될 수 있다. 그러나, 이러한 레이어의 정의는 설명을 위한 임의적인 것으로서, 신경망 내에서 레이어의 차수는 상술한 것과 상이한 방법으로 정의될 수 있다. 예를 들어, 노드들의 레이어는 최종 출력 노드로부터 거리에 의해 정의될 수도 있다.
최초 입력 노드는 신경망 내의 노드들 중 다른 노드들과의 관계에서 링크를 거치지 않고 데이터가 직접 입력되는 하나 이상의 노드들을 의미할 수 있다. 또는, 신경망 네트워크 내에서, 링크를 기준으로 한 노드 간의 관계에 있어서, 링크로 연결된 다른 입력 노드들 가지지 않는 노드들을 의미할 수 있다. 이와 유사하게, 최종 출력 노드는 신경망 내의 노드들 중 다른 노드들과의 관계에서, 출력 노드를 가지지 않는 하나 이상의 노드들을 의미할 수 있다. 또한, 히든 노드는 최초 입력 노드 및 최후 출력 노드가 아닌 신경망을 구성하는 노드들을 의미할 수 있다. 본 개시의 일 실시예에 따른 신경망은 입력 레이어의 노드의 개수가 출력 레이어의 노드의 개수와 동일할 수 있으며, 입력 레이어에서 히든 레이어로 진행됨에 따라 노드의 수가 감소하다가 다시 증가하는 형태의 신경망일 수 있다. 또한, 본 개시의 다른 일 실시예에 따른 신경망은 입력 레이어의 노드의 개수가 출력 레이어의 노드의 개수 보다 적을 수 있으며, 입력 레이어에서 히든 레이어로 진행됨에 따라 노드의 수가 감소하는 형태의 신경망일 수 있다. 또한, 본 개시의 또 다른 일 실시예에 따른 신경망은 입력 레이어의 노드의 개수가 출력 레이어의 노드의 개수보다 많을 수 있으며, 입력 레이어에서 히든 레이어로 진행됨에 따라 노드의 수가 증가하는 형태의 신경망일 수 있다. 본 개시의 또 다른 일 실시예에 따른 신경망은 상술한 신경망들의 조합된 형태의 신경망일 수 있다.
딥 뉴럴 네트워크(DNN: deep neural network, 심층신경망)는 입력레이어와 출력 레이어 외에 복수의 히든 레이어를 포함하는 신경망을 의미할 수 있다. 딥 뉴럴 네트워크를 이용하면 데이터의 잠재적인 구조(latent structures)를 파악할 수 있다. 즉, 사진, 글, 비디오, 음성, 음악의 잠재적인 구조(예를 들어, 어떤 물체가 사진에 있는지, 글의 내용과 감정이 무엇인지, 음성의 내용과 감정이 무엇인지 등)를 파악할 수 있다. 딥 뉴럴 네트워크는 컨볼루션 뉴럴 네트워크(CNN: convolutional neural network), 리커런트 뉴럴 네트워크(RNN: recurrent neural network), 오토 인코더(auto encoder), GAN(Generative Adversarial Networks), 제한 볼츠만 머신(RBM: restricted boltzmann machine), 심층 신뢰 네트워크(DBN: deep belief network), Q 네트워크, U 네트워크, 샴 네트워크 등을 포함할 수 있다. 전술한 딥 뉴럴 네트워크의 기재는 예시일 뿐이며 본 개시는 이에 제한되지 않는다.
뉴럴 네트워크는 교사 학습(supervised learning), 비교사 학습(unsupervised learning) 및 반교사학습(semi supervised learning) 중 적어도 하나의 방식으로 학습될 수 있다. 뉴럴 네트워크의 학습은 출력의 오류를 최소화하기 위한 것이다. 뉴럴 네트워크의 학습에서 반복적으로 학습 데이터를 뉴럴 네트워크에 입력시키고 학습 데이터에 대한 뉴럴 네트워크의 출력과 타겟의 에러를 계산하고, 에러를 줄이기 위한 방향으로 뉴럴 네트워크의 에러를 뉴럴 네트워크의 출력 레이어에서부터 입력 레이어 방향으로 역전파(backpropagation)하여 뉴럴 네트워크의 각 노드의 가중치를 업데이트 하는 과정이다. 교사 학습의 경우 각각의 학습 데이터에 정답이 라벨링되어있는 학습 데이터를 사용하며(즉, 라벨링된 학습 데이터), 비교사 학습의 경우는 각각의 학습 데이터에 정답이 라벨링되어 있지 않을 수 있다. 즉, 예를 들어 데이터 분류에 관한 교사 학습의 경우의 학습 데이터는 학습 데이터 각각에 카테고리가 라벨링 된 데이터 일 수 있다. 라벨링된 학습 데이터가 뉴럴 네트워크에 입력되고, 뉴럴 네트워크의 출력(카테고리)과 학습 데이터의 라벨이 비교함으로써 오류(error)가 계산될 수 있다. 다른 예로, 데이터 분류에 관한 비교사 학습의 경우 입력인 학습 데이터가 뉴럴 네트워크 출력과 비교됨으로써 오류가 계산될 수 있다. 계산된 오류는 뉴럴 네트워크에서 역방향(즉, 출력 레이어에서 입력 레이어 방향)으로 역전파 되며, 역전파에 따라 뉴럴 네트워크의 각 레이어의 각 노드들의 연결 가중치가 업데이트 될 수 있다. 업데이트 되는 각 노드의 연결 가중치는 학습률(learning rate)에 따라 변화량이 결정될 수 있다. 입력 데이터에 대한 뉴럴 네트워크의 계산과 에러의 역전파는 학습 사이클(epoch)을 구성할 수 있다. 학습률은 뉴럴 네트워크의 학습 사이클의 반복 횟수에 따라 상이하게 적용될 수 있다. 예를 들어, 뉴럴 네트워크의 학습 초기에는 높은 학습률을 사용하여 뉴럴 네트워크가 빠르게 일정 수준의 성능을 확보하도록 하여 효율성을 높이고, 학습 후기에는 낮은 학습률을 사용하여 정확도를 높일 수 있다.
뉴럴 네트워크의 학습에서 일반적으로 학습 데이터는 실제 데이터(즉, 학습된 뉴럴 네트워크를 이용하여 처리하고자 하는 데이터)의 부분집합일 수 있으며, 따라서, 학습 데이터에 대한 오류는 감소하나 실제 데이터에 대해서는 오류가 증가하는 학습 사이클이 존재할 수 있다. 과적합(overfitting)은 이와 같이 학습 데이터에 과하게 학습하여 실제 데이터에 대한 오류가 증가하는 현상이다. 예를 들어, 노란색 고양이를 보여 고양이를 학습한 뉴럴 네트워크가 노란색 이외의 고양이를 보고는 고양이임을 인식하지 못하는 현상이 과적합의 일종일 수 있다. 과적합은 머신러닝 알고리즘의 오류를 증가시키는 원인으로 작용할 수 있다. 이러한 과적합을 막기 위하여 다양한 최적화 방법이 사용될 수 있다. 과적합을 막기 위해서는 학습 데이터를 증가시키거나, 레귤라이제이션(regularization), 학습의 과정에서 네트워크의 노드 일부를 생략하는 드롭아웃(dropout) 등의 방법이 적용될 수 있다.
본 개시의 실시예와 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접 구현되거나, 하드웨어에 의해 실행되는 소프트웨어 모듈로 구현되거나, 또는 이들의 결합에 의해 구현될 수 있다. 소프트웨어 모듈은 RAM(Random Access Memory), ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리(Flash Memory), 하드 디스크, 착탈형 디스크, CD-ROM, 또는 본 개시가 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터 판독가능 기록매체에 상주할 수도 있다.
본 개시의 구성 요소들은 하드웨어인 컴퓨터와 결합되어 실행되기 위해 프로그램(또는 애플리케이션)으로 구현되어 매체에 저장될 수 있다. 본 개시의 구성 요소들은 소프트웨어 프로그래밍 또는 소프트웨어 요소들로 실행될 수 있으며, 이와 유사하게, 실시 예는 데이터 구조, 프로세스들, 루틴들 또는 다른 프로그래밍 구성들의 조합으로 구현되는 다양한 알고리즘을 포함하여, C, C++, 자바(Java), 어셈블러(assembler) 등과 같은 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능적인 측면들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다.
본 개시의 기술 분야에서 통상의 지식을 가진 자는 여기에 개시된 실시예들과 관련하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 프로세서들, 수단들, 회로들 및 알고리즘 단계들이 전자 하드웨어, (편의를 위해, 여기에서 "소프트웨어"로 지칭되는) 다양한 형태들의 프로그램 또는 설계 코드 또는 이들 모두의 결합에 의해 구현될 수 있다는 것을 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 호환성을 명확하게 설명하기 위해, 다양한 예시적인 컴포넌트들, 블록들, 모듈들, 회로들 및 단계들이 이들의 기능과 관련하여 위에서 일반적으로 설명되었다. 이러한 기능이 하드웨어 또는 소프트웨어로서 구현되는지 여부는 특정한 애플리케이션 및 전체 시스템에 대하여 부과되는 설계 제약들에 따라 좌우된다. 본 개시의 기술 분야에서 통상의 지식을 가진 자는 각각의 특정한 애플리케이션에 대하여 다양한 방식들로 설명된 기능을 구현할 수 있으나, 이러한 구현 결정들은 본 개시의 범위를 벗어나는 것으로 해석되어서는 안 될 것이다.
여기서 제시된 다양한 실시예들은 방법, 장치, 또는 표준 프로그래밍 및/또는 엔지니어링 기술을 사용한 제조 물품(article)으로 구현될 수 있다. 용어 "제조 물품"은 임의의 컴퓨터-판독가능 장치로부터 액세스 가능한 컴퓨터 프로그램, 캐리어, 또는 매체(media)를 포함한다. 예를 들어, 컴퓨터-판독가능 매체는 자기 저장 장치(예를 들면, 하드 디스크, 플로피 디스크, 자기 스트립, 등), 광학 디스크(예를 들면, CD, DVD, 등), 스마트 카드, 및 플래쉬 메모리 장치(예를 들면, EEPROM, 카드, 스틱, 키 드라이브, 등)를 포함하지만, 이들로 제한되는 것은 아니다. 또한, 여기서 제시되는 다양한 저장 매체는 정보를 저장하기 위한 하나 이상의 장치 및/또는 다른 기계-판독가능한 매체를 포함한다. 용어 "기계-판독가능 매체"는 명령(들) 및/또는 데이터를 저장, 보유, 및/또는 전달할 수 있는 무선 채널 및 다양한 다른 매체를 포함하지만, 이들로 제한되는 것은 아니다.
제시된 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조는 예시적인 접근들의 일례임을 이해하도록 한다. 설계 우선순위들에 기초하여, 본 개시의 범위 내에서 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조가 재배열될 수 있다는 것을 이해하도록 한다. 첨부된 방법 청구항들은 샘플 순서로 다양한 단계들의 엘리먼트들을 제공하지만 제시된 특정한 순서 또는 계층 구조에 한정되는 것을 의미하지는 않는다.
제시된 실시예들에 대한 설명은 임의의 본 개시의 기술 분야에서 통상의 지식을 가진 자가 본 개시를 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 개시의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이며, 여기에 정의된 일반적인 원리들은 본 개시의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 개시는 여기에 제시된 실시예들로 한정되는 것이 아니라, 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.
Claims (5)
- 이미지 파일에 포함된 하나 이상의 글자 이미지를 인식하여 원문 텍스트 정보를 획득하는 단계;
상기 획득된 원문 텍스트 정보에 대한 품질 검사를 수행하여 상기 원문 텍스트 정보에 대한 적정성을 판별하는 단계;
상기 적정성 판별 결과에 기초하여 상기 원문 텍스트 정보를 포함하는 번역 인터페이스를 사용자 단말로 전송할 것을 결정하는 단계;
상기 사용자 단말로부터 상기 번역 인터페이스를 통해 상기 하나 이상의 글자 이미지에 대응하는 번역 텍스트 정보를 수신하는 단계; 및
상기 하나 이상의 글자 이미지 및 상기 수신된 번역 텍스트 정보에 기초하여 번역 텍스트 이미지를 생성하고, 상기 생성된 번역 텍스트 이미지를 상기 하나 이상의 글자 이미지의 상위 레이어로 표시하여 아케이드 이미지 파일을 생성하는 단계;
를 포함하고,
상기 이미지 파일에 포함된 하나 이상의 글자 이미지를 인식하여 원문 텍스트 정보를 획득하는 단계는,
상기 이미지 파일에 포함된 하나 이상의 글자 이미지 중 일부를 포함하는 원문 인터페이스를 생성하여 상기 사용자 단말에 전송할 것을 결정하는 단계; 및
상기 원문 인터페이스를 통한 상기 사용자 단말의 사용자 입력에 기초하여 상기 원문 텍스트 정보를 수신하는 단계;
를 포함하고,
상기 원문 인터페이스는,
상기 사용자 단말의 참여 이력 정보 또는 언어 숙련도 중 적어도 하나에 기초하여 노출되는 정도가 결정되는 것을 특징으로 하며,
상기 하나 이상의 글자 이미지 및 상기 수신된 번역 텍스트 정보에 기초하여 번역 텍스트 이미지를 생성하고, 상기 생성된 번역 텍스트 이미지를 상기 하나 이상의 글자 이미지의 상위 레이어로 표시하여 아케이드 이미지 파일을 생성하는 단계는,
상기 하나 이상의 글자 이미지의 좌표 정보, 색상 정보 및 폰트 정보를 포함하는 글자 이미지 정보를 식별하는 단계;
상기 좌표 정보에 대응하는 영역의 평균 색상 값에 기초하여 번역 텍스트 배경 이미지를 생성하는 단계;
상기 번역 텍스트 배경 이미지에 상기 번역 텍스트 정보를 상기 폰트 정보에 기초하여 반영함으로써 상기 번역 텍스트 이미지를 생성하는 단계; 및
상기 번역 텍스트 이미지를 상기 좌표 정보에 대응하는 영역에 상위 레이어로 표시하여 상기 아케이드 이미지 파일을 생성하는 단계;
를 포함하는,
컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는, 이미지 파일에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지 파일을 생성하기 위한 방법.
- 제 1 항에 있어서,
하나 이상의 다른 사용자 단말로 상기 원문 텍스트 정보 및 상기 번역 텍스트 정보를 포함하는 평가 인터페이스를 생성하여 전송할 것을 결정하는 단계; 및
상기 평가 인터페이스를 통한 하나 이상의 다른 사용자 단말 각각의 번역 평가 정보에 기초하여 상기 번역 텍스트 정보에 대한 적정성을 판별하는 단계;
를 더 포함하는,
컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는, 이미지 파일에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지 파일을 생성하기 위한 방법.
- 제 1 항에 있어서,
상기 원문 인터페이스에 대한 상기 사용자 단말의 타이핑 입력을 감지하는 단계;
미리 정해진 단위 시간을 기준으로 미리 정해진 임계 횟수 이상의 타이핑 입력이 감지되면, 상기 사용자 단말의 타이핑 입력을 오류 입력으로 결정하는 단계; 및
상기 오류 입력이 감지된 사용자 단말에 대해 상기 하나 이상의 글자 이미지를 미리 정해진 시간동안 노출시키지 않을 것을 결정하는 단계;
를 더 포함하는,
컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는, 이미지 파일에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지 파일을 생성하기 위한 방법.
- 제 1 항에 있어서,
상기 원문 텍스트 정보에 대한 품질 검사를 수행하여 상기 원문 텍스트 정보에 대한 적정성을 판별하는 단계는,
상기 사용자 단말의 히스토리 정보에 기초하여 상기 품질 검사를 수행할 다른 사용자 단말의 수를 결정하는 단계;
상기 결정된 다른 사용자 단말의 수에 대응하여 하나 이상의 다른 사용자 단말에게 상기 하나 이상의 글자 이미지 및 상기 원문 텍스트 정보를 포함하는 평가 정보 입력 창을 전송할 것을 결정하는 단계;
상기 하나 이상의 다른 사용자 단말 각각으로부터 상기 평가 정보 입력 창을 통해 수신한 품질 평가 정보에 기초하여 상기 원문 텍스트 정보에 대한 적정성을 판별하는 단계; 및
상기 적정성 판별 결과에 기초하여 상기 사용자 단말에 리워드(reward)를 부여하는 단계;
를 포함하고,
상기 히스토리 정보는,
상기 사용자 단말의 입력 참여 횟수 정보 및 누적 품질 평가 정보 중 적어도 하나를 포함하는,
컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는, 이미지 파일에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지 파일을 생성하기 위한 방법.
- 제 1 항에 있어서,
복수의 사용자 단말 중 상기 번역 인터페이스에 포함된 상기 원문 텍스트 정보와 매칭되는 사용자 단말을 식별하는 단계; 및
상기 식별된 사용자 단말을 상기 번역 인터페이스를 전송할 사용자 단말로 결정하는 단계;
를 더 포함하는,
컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는, 이미지 파일에 존재하는 텍스트에 대한 변환을 수행하여 아케이드 이미지 파일을 생성하기 위한 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210045248A KR102258001B1 (ko) | 2020-10-05 | 2021-04-07 | 아케이드 이미지 파일을 통해 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200128008A KR102244447B1 (ko) | 2020-10-05 | 2020-10-05 | 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
KR1020210045248A KR102258001B1 (ko) | 2020-10-05 | 2021-04-07 | 아케이드 이미지 파일을 통해 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200128008A Division KR102244447B1 (ko) | 2020-10-05 | 2020-10-05 | 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102258001B1 true KR102258001B1 (ko) | 2021-05-31 |
Family
ID=75725929
Family Applications (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200128008A KR102244447B1 (ko) | 2020-10-05 | 2020-10-05 | 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
KR1020210045249A KR102258000B1 (ko) | 2020-10-05 | 2021-04-07 | 복수의 사용자 단말들과의 연계를 통해 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
KR1020210045253A KR20220045879A (ko) | 2020-10-05 | 2021-04-07 | 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
KR1020210045252A KR102258004B1 (ko) | 2020-10-05 | 2021-04-07 | 하나 이상의 글자 이미지들을 표시하는 사용자 인터페이스를 활용하여 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
KR1020210045250A KR102258002B1 (ko) | 2020-10-05 | 2021-04-07 | 인공지능을 활용하여 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
KR1020210045251A KR102258003B1 (ko) | 2020-10-05 | 2021-04-07 | 글자 인식 모델을 활용하여 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
KR1020210045248A KR102258001B1 (ko) | 2020-10-05 | 2021-04-07 | 아케이드 이미지 파일을 통해 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
Family Applications Before (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200128008A KR102244447B1 (ko) | 2020-10-05 | 2020-10-05 | 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
KR1020210045249A KR102258000B1 (ko) | 2020-10-05 | 2021-04-07 | 복수의 사용자 단말들과의 연계를 통해 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
KR1020210045253A KR20220045879A (ko) | 2020-10-05 | 2021-04-07 | 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
KR1020210045252A KR102258004B1 (ko) | 2020-10-05 | 2021-04-07 | 하나 이상의 글자 이미지들을 표시하는 사용자 인터페이스를 활용하여 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
KR1020210045250A KR102258002B1 (ko) | 2020-10-05 | 2021-04-07 | 인공지능을 활용하여 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
KR1020210045251A KR102258003B1 (ko) | 2020-10-05 | 2021-04-07 | 글자 인식 모델을 활용하여 이미지 번역 서비스를 제공하기 위한 방법 및 서버 |
Country Status (1)
Country | Link |
---|---|
KR (7) | KR102244447B1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102431383B1 (ko) | 2021-07-04 | 2022-08-10 | 글로지 주식회사 | 인공지능 학습모델을 이용하여 다국어 자막 서비스를 제공하는 서버 및 방법과, 서버의 제어 방법 |
KR20230083971A (ko) * | 2021-12-03 | 2023-06-12 | 주식회사 오후랩스 | 이미지 내에 포함된 텍스트를 번역하고 편집하는 방법 및 이를 수행하는 장치 |
CN114047981B (zh) * | 2021-12-24 | 2024-06-21 | 珠海金山数字网络科技有限公司 | 项目配置方法及装置 |
KR102625441B1 (ko) * | 2023-09-04 | 2024-01-16 | 주식회사 에이디자인그룹 | 디지털 경전에 대한 필사를 체험하기 위한 시스템 및 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100045336A (ko) * | 2008-10-23 | 2010-05-03 | 엔에이치엔(주) | 웹 상의 멀티미디어 컨텐츠에 포함되는 특정 언어를 다른 언어로 번역하여 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 |
KR20160064370A (ko) * | 2014-11-27 | 2016-06-08 | 네이버 주식회사 | 만화 참여번역 장치 및 이를 이용한 만화 참여번역 방법 |
KR20190088437A (ko) * | 2019-07-08 | 2019-07-26 | 성정두 | 스캔 도서 이미지의 완벽한 텍스트 변환 및 텍스트파일 활용 시스템 |
-
2020
- 2020-10-05 KR KR1020200128008A patent/KR102244447B1/ko active IP Right Grant
-
2021
- 2021-04-07 KR KR1020210045249A patent/KR102258000B1/ko active IP Right Grant
- 2021-04-07 KR KR1020210045253A patent/KR20220045879A/ko unknown
- 2021-04-07 KR KR1020210045252A patent/KR102258004B1/ko active IP Right Grant
- 2021-04-07 KR KR1020210045250A patent/KR102258002B1/ko active IP Right Grant
- 2021-04-07 KR KR1020210045251A patent/KR102258003B1/ko active IP Right Grant
- 2021-04-07 KR KR1020210045248A patent/KR102258001B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100045336A (ko) * | 2008-10-23 | 2010-05-03 | 엔에이치엔(주) | 웹 상의 멀티미디어 컨텐츠에 포함되는 특정 언어를 다른 언어로 번역하여 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 |
KR20160064370A (ko) * | 2014-11-27 | 2016-06-08 | 네이버 주식회사 | 만화 참여번역 장치 및 이를 이용한 만화 참여번역 방법 |
KR20190088437A (ko) * | 2019-07-08 | 2019-07-26 | 성정두 | 스캔 도서 이미지의 완벽한 텍스트 변환 및 텍스트파일 활용 시스템 |
Also Published As
Publication number | Publication date |
---|---|
KR102258000B1 (ko) | 2021-05-31 |
KR102258002B1 (ko) | 2021-05-31 |
KR102258003B1 (ko) | 2021-05-31 |
KR102244447B1 (ko) | 2021-04-27 |
KR20220045879A (ko) | 2022-04-13 |
KR102258004B1 (ko) | 2021-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102258001B1 (ko) | 아케이드 이미지 파일을 통해 이미지 번역 서비스를 제공하기 위한 방법 및 서버 | |
US12039280B2 (en) | Multi-turn dialogue response generation with persona modeling | |
US20210365635A1 (en) | Joint intent and entity recognition using transformer models | |
KR102244448B1 (ko) | 전문 번역 서비스 플랫폼을 제공하기 위한 방법 | |
KR102040400B1 (ko) | 머신러닝을 이용한 사용자 맞춤형 문제 제공 시스템 및 방법 | |
US11381651B2 (en) | Interpretable user modeling from unstructured user data | |
JP7290861B2 (ja) | 質問応答システムのための回答分類器及び表現ジェネレータ、並びに表現ジェネレータを訓練するためのコンピュータプログラム | |
CN113656570A (zh) | 基于深度学习模型的视觉问答方法及装置、介质、设备 | |
US11928985B2 (en) | Content pre-personalization using biometric data | |
Singh et al. | Mobile Deep Learning with TensorFlow Lite, ML Kit and Flutter: Build scalable real-world projects to implement end-to-end neural networks on Android and iOS | |
CN118246537B (zh) | 基于大模型的问答方法、装置、设备及存储介质 | |
CN114492661B (zh) | 文本数据分类方法和装置、计算机设备、存储介质 | |
CN112131345A (zh) | 文本质量的识别方法、装置、设备及存储介质 | |
JP2023007432A (ja) | コンテンツアウェアおよびスタイルアウェアデータを増強することによる筆跡認識方法および装置 | |
KR102673273B1 (ko) | 텍스트 교정 방법 및 장치 | |
CN113869068A (zh) | 场景服务推荐方法、装置、设备及存储介质 | |
Asha et al. | Artificial Neural Networks based DIGI Writing | |
KR102409001B1 (ko) | 번역 및 감수 효율화 기능을 제공하는 컴퓨터 프로그램 | |
CN114610878A (zh) | 模型训练方法、计算机设备及计算机可读存储介质 | |
CN115510457A (zh) | 数据识别方法、装置、设备及计算机程序产品 | |
US20240290095A1 (en) | Method, electronic device, and computer program product for extracting target frame | |
US12050878B2 (en) | Handwriting text summarization | |
KR20230108432A (ko) | 번역 플랫폼 | |
Rodríguez Badas | Kanji recognition with AI | |
Sabour et al. | Auto-Diacritization and Stylistic Realization of Arabic Text using Deep Neural Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A302 | Request for accelerated examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |