KR101248449B1 - 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체 - Google Patents

정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체 Download PDF

Info

Publication number
KR101248449B1
KR101248449B1 KR1020080098515A KR20080098515A KR101248449B1 KR 101248449 B1 KR101248449 B1 KR 101248449B1 KR 1020080098515 A KR1020080098515 A KR 1020080098515A KR 20080098515 A KR20080098515 A KR 20080098515A KR 101248449 B1 KR101248449 B1 KR 101248449B1
Authority
KR
South Korea
Prior art keywords
character
image
recognition
translation
feature
Prior art date
Application number
KR1020080098515A
Other languages
English (en)
Other versions
KR20090098650A (ko
Inventor
마사히로 가토
Original Assignee
후지제롯쿠스 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지제롯쿠스 가부시끼가이샤 filed Critical 후지제롯쿠스 가부시끼가이샤
Publication of KR20090098650A publication Critical patent/KR20090098650A/ko
Application granted granted Critical
Publication of KR101248449B1 publication Critical patent/KR101248449B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Abstract

본 발명은 화상 내의 문자를 인식해서 번역시킬 경우에, 문자 이외의 화상 영역을 문자로서 인식해서 번역시키는 것을 억제하는 정보 처리 장치를 제공하는 것을 과제로 한다.
상기 과제를 해결하기 위하여, 정보 처리 장치의 문자 인식 수단은 화상 내의 문자를 인식하고, 인식 문자 특징 취득 수단은 상기 문자 인식 수단에 의해 인식된 결과인 인식 문자의 특징을 취득하며, 번역 판단 수단은 상기 인식 문자 특징 취득 수단에 의해 취득된 특징에 의거하여 상기 인식 문자를 번역해야 할지의 여부를 판단한다.
화상 접수 모듈, 영역 추출 모듈, 행 추출 모듈, 문자 인식 모듈, 인식 문자 특징 취득 모듈, 번역 판단 모듈, 번역 모듈

Description

정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체{INFORMATION PROCESSOR, INFORMATION PROCESSING METHOD, AND COMPUTER READABLE MEDIUM}
본 발명은 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체에 관한 것이다.
예를 들면, 주로 제 1 언어로 기재된 문장(이후, 원문이라고도 칭함. 단, 반드시 문장, 글의 형태를 구비하고 있을 필요는 없고, 제 1 언어로 기재된 문자임)을 갖는 종이 문서를 스캔하고, 얻어진 화상을 해석해서 문장 영역을 추출하며, 그 문장 영역에 대하여 문자 인식을 실시하고, 얻어진 문자 인식의 결과인 텍스트를 제 2 언어로 번역한 문장(이후, 번역문이라고도 칭함. 반드시 문장, 글의 형태를 구비하고 있을 필요는 없고, 제 2 언어인 문자임)을 페이지에 레이아웃해서 출력하는 번역 장치가 있다.
이에 관련한 기술로서, 예를 들면 특허문헌 1에는, 종이에 찍혀 있는 문서를 기계 번역기 상에서 번역하는 수단을 제공하는 것을 목적으로 하여, 원고를 판독하는 화상 입력부와, 화상 입력부에서 얻어진 이미지 데이터를 기억하는 원고 이미지 기억부와, 원고 이미지 기억부에 기억되어 있는 이미지 데이터에 대하여 레이아웃 인식을 실시하는 레이아웃 인식 수단과, 레이아웃 인식에서 얻어진 문자 인식 영역을 기억하는 원문 영역 기억부와, 도형 영역 기억부와, 문자 인식 영역의 문자에 대응하는 코드 데이터를 출력하는 문자 인식 실행부와, 원문 기억부와, 번역 수단과, 번역문 기억부와, 원문 영역 기억부에 기재되어 있는 영역에 번역문 기억부에 기재되어 있는 번역문을 매립하는 수단을 구성한 것이 개시되어 있다.
또한, 예를 들면, 특허문헌 2에는, 입력된 원문서의 텍스트 이미지의 행간에 텍스트의 번역 결과를 출력하는 수단과, 입력된 원문서의 텍스트 이미지의 행간이 좁은 경우, 원문서의 텍스트를 폰트 사이즈를 작게 해서 재(再)묘화하여, 번역문을 출력하는 데 필요한 행간을 얻는 수단을 갖는 것을 특징으로 하는 기계 번역 장치가 개시되어 있다.
또한, 예를 들면, 특허문헌 3에는, 원고 화상 중에 존재하는 단어에 대응하는 번역어의 위치를 명확히 하고, 또한, 번역어 부가에 의해 출력 화상의 내용이 대폭 변경되었다고 해도, 복사 화상의 내용을 읽기 쉽게 레이아웃해서 출력하는 것을 목적으로 하며, CPU는 원고 화상 정보와 그 정보의 대역(對譯) 정보를 상하 위치에 합성할 때, 원고 화상 정보의 정보 폭보다 대역 정보의 정보 폭이 작아지도록 제어하는 것이 개시되어 있다.
또한, 예를 들면, 특허문헌 4에는, 제 1 언어에 의거하는 제 1 문자 및 화상을 포함하는 원고를 화상 입력하는 원고 입력 수단과, 이 원고 입력 수단으로부터 화상 입력된 원고 화상 데이터를 해석해서 문서 데이터 영역과 화상 데이터 영역으 로 영역 분리하는 분리 수단과, 이 분리 수단에 의해 분리된 상기 문서 데이터 영역으로부터 문자 화상을 잘라내서 제 1 문자를 인식하는 인식 수단과, 이 인식 수단에 의해 인식된 제 1 문자에 대응하는 문자 데이터를 제 2 언어에 의거하는 제 2 문자 데이터로 번역하는 번역 수단과, 상기 분리 수단에 의해 영역 분리된 문서 데이터 영역 정보 및 상기 제 2 문자 데이터에 의거하여 레이아웃된 인쇄 데이터를 생성하는 데이터 생성 수단과, 이 데이터 생성 수단에 의해 생성된 상기 인쇄 데이터에 의거하여 제 2 문자 데이터와 상기 원고 화상 데이터를 각각 기록 매체의 각한쪽 면으로 나누어 양면 인쇄하는 인쇄 수단을 갖는 화상 처리 장치가 개시되어 있다.
[특허문헌 1] 일본 공개특허 평08-006948호 공보
[특허문헌 2] 일본 특허 제3294919호 공보
[특허문헌 3] 일본 공개특허 평05-324720호 공보
[특허문헌 4] 일본 특허 제3636490호 공보
그런데, 화상을 판독하고, 그 화상 내의 문자를 인식해서 번역하는 것과 같은 경우에서, 문자 이외의 화상 영역을 문자로서 인식해서 번역하여, 번역의 품질 및/또는 번역 문서의 질을 저하시키는 경우가 있다.
본 발명은 상기 과제를 해결하도록 한 정보 처리 장치 및 정보 처리 프로그램을 제공하는 것을 목적으로 하고 있다.
이러한 목적을 달성하기 위한 본 발명의 요지는, 다음 각 발명에 있다.
제 1 발명은, 화상 내의 문자를 인식하는 문자 인식 수단과, 상기 문자 인식 수단에 의해 인식된 결과인 인식 문자의 특징을 취득하는 인식 문자 특징 취득 수단과, 상기 인식 문자 특징 취득 수단에 의해 취득된 특징에 의거하여, 상기 인식 문자를 번역해야 할지의 여부를 판단하는 번역 판단 수단을 구비하는 것을 특징으로 하는 정보 처리 장치이다.
제 2 발명은, 상기 인식 문자 특징 취득 수단은 상기 문자 이외의 화상을 인식한 경우의 인식 문자의 배열에 관한 특징을 취득하는 것을 특징으로 하는, 제 1 발명의 정보 처리 장치이다.
제 3 또는 제 4 발명은, 상기 인식 문자 특징 취득 수단은 상기 인식 문자의 소정의 문자 수 당의 특징을 취득하는 것을 특징으로 하는, 제 1 또는 제 2 발명의 정보 처리 장치이다.
제 5 발명은, 화상 내의 문자를 인식하는 공정과, 인식된 결과인 인식 문자의 특징을 취득하는 공정과, 상기 취득된 특징에 의거하여 상기 인식 문자를 번역해야 할지의 여부를 판단하는 공정과, 번역해야 한다고 판단된 경우에, 상기 인식 문자를 번역하는 공정과, 번역된 결과인 번역 결과의 특징을 취득하는 공정과, 상기 취득된 특징에 의거하여 상기 번역 결과를 출력해야 할지의 여부를 판단하는 공정과, 화상을 접수하는 공정과, 출력해야 한다고 판단된 경우에, 상기 접수된 화상의 구성에 의거하여 상기 번역 결과를 출력하는 공정을 구비하고, 상기 문자를 인식하는 공정에서, 상기 화상을 접수하는 공정에 의해 접수된 화상 내의 문자를 인식하며, 상기 인식 문자의 특징을 취득하는 공정에서, 문자 이외의 화상을 인식한 경우의 인식 문자를 포함하고 있는 것에 관한 특징을 취득하는 것을 특징으로 하는 정보 처리 방법이다.
제 6 발명은, 컴퓨터를, 화상 내의 문자를 인식하는 문자 인식 수단과, 상기 문자 인식 수단에 의해 인식된 결과인 인식 문자의 특징을 취득하는 인식 문자 특징 취득 수단과, 상기 인식 문자 특징 취득 수단에 의해 취득된 특징에 의거하여 상기 인식 문자를 번역해야 할지의 여부를 판단하는 번역 판단 수단과, 상기 번역 판단 수단에 의해 번역해야 한다고 판단된 경우에, 상기 인식 문자를 번역하는 번역 수단과, 상기 번역 수단에 의해 번역된 결과인 번역 결과의 특징을 취득하는 번역 결과 특징 취득 수단과, 상기 번역 결과 특징 취득 수단에 의해 취득된 특징에 의거하여 상기 번역 결과를 출력해야 할지의 여부를 판단하는 출력 판단 수단과, 화상을 접수하는 화상 접수 수단과, 상기 출력 판단 수단에 의해 출력해야 한다고 판단된 경우에, 상기 화상 접수 수단에 의해 접수된 화상의 구성에 의거하여 상기 번역 결과를 출력하는 출력 수단으로서 기능시키는 정보 처리 프로그램을 저장하고, 상기 문자 인식 수단은 상기 화상 접수 수단에 의해 접수된 화상 내의 문자를 인식하며, 상기 인식 문자 특징 취득 수단은 문자 이외의 화상을 인식한 경우의 인식 문자를 포함하고 있는 것에 관한 특징을 취득하는 것을 특징으로 하는 컴퓨터 판독 가능한 기억 매체이다.
제 7 발명은, 상기 번역 판단 수단에 의해 번역해야 한다고 판단된 경우에, 상기 인식 문자를 번역하는 번역 수단과, 상기 번역 수단에 의해 번역된 결과인 번역 결과의 특징을 취득하는 번역 결과 특징 취득 수단과, 상기 번역 결과 특징 취득 수단에 의해 취득된 특징에 의거하여, 상기 번역 결과를 출력해야 할지의 여부를 판단하는 출력 판단 수단을 구비하는 것을 특징으로 하는, 제 1 발명의 정보 처리 장치이다.
제 8 발명은, 화상을 접수하는 화상 접수 수단과, 상기 출력 판단 수단에 의해 출력해야 한다고 판단된 경우에, 상기 화상 접수 수단에 의해 접수된 화상의 구성에 의거하여, 상기 번역 결과를 출력하는 출력 수단을 더 구비하고, 상기 문자 인식 수단은 상기 화상 접수 수단에 의해 접수된 화상 내의 문자를 인식하는 것을 특징으로 하는, 제 7 발명의 정보 처리 장치이다.
제 9 발명은, 상기 인식 문자 특징 취득 수단은 문자 이외의 화상을 인식한 경우의 인식 문자를 포함하고 있는 것에 관한 특징을 취득하는 것을 특징으로 하는, 제 1, 제 7, 또는 제 8 발명 중 어느 한 발명의 정보 처리 장치이다.
제 1, 제 7, 제 8, 제 9 발명의 정보 처리 장치에 의하면, 화상 내의 문자를 인식해서 번역시키는 경우에, 문자 이외의 화상 영역을 문자로서 인식해서 번역시키는 것을 억제할 수 있다.
또한, 문자 이외의 화상 영역을 문자로서 인식해서 번역해야 한다고 판단한 경우에도, 그 화상 영역에 대하여 번역해서 출력하는 것을 억제할 수 있다.
또한, 화상 내의 문자를 인식해서 번역한 결과를 그 화상에 합쳐서 출력하는 경우에, 문자 이외의 화상 영역을 문자로서 인식해서 번역하여 출력하는 것을 억제 할 수 있다.
또한, 기존의 문자 인식 기술을 이용한 경우에도, 문자 이외의 화상 영역을 문자로서 인식해서 번역하여 출력하는 것을 억제할 수 있다.
제 2 발명의 정보 처리 장치에 의하면, 제 1 발명의 정보 처리 장치에 비해서, 문자 이외의 화상 영역을 문자로서 인식해서 번역하여 출력하는 것을 더 억제할 수 있다.
제 3 또는 제 4 발명의 정보 처리 장치에 의하면, 문자 화상 영역을 문자로서 인식해서 번역시키는 것을 억제하는 것을 방지하도록 할 수 있다.
제 5 발명의 정보 처리 방법 또는 제 6 발명의 컴퓨터 판독 가능한 기억 매체에 의하면, 화상 내의 문자를 인식해서 번역시키는 경우에, 문자 이외의 화상 영역을 문자로서 인식해서 번역시키는 것을 억제할 수 있다.
이하, 도면에 의거하여 본 발명을 실현시키는 데 있어서 적합한 일 실시예의 예를 설명한다.
도 1은 본 실시예의 구성예에 대한 개념적인 모듈 구성도를 나타내고 있다.
또한, 모듈이란, 일반적으로 논리적으로 분리 가능한 소프트웨어(컴퓨터 프로그램), 하드웨어 등의 부품을 가리킨다. 따라서, 본 실시예에서의 모듈은 컴퓨터 프로그램에서의 모듈뿐 아니라, 하드웨어 구성에서의 모듈도 가리킨다. 그래서, 본 실시예는, 컴퓨터 프로그램, 시스템 및 방법의 설명도 겸하고 있다. 단, 설명의 형편상, 「기억한다」, 「기억시킨다」, 이들과 동등한 표현을 이용하지만, 이들 표현은, 실시예가 컴퓨터 프로그램인 경우에는, 기억 장치에 기억시킨다, 또는 기억 장치에 기억시키도록 제어한다는 의미이다. 또한, 모듈은 기능에 거의 일대 일로 대응하고 있지만, 실장에서는, 1모듈을 1프로그램으로 구성해도 되고, 복수 모듈을 1프로그램으로 구성해도 되며, 반대로 1모듈을 복수 프로그램으로 구성해도 된다. 또한, 복수 모듈은 1컴퓨터에 의해 실행되어도 되고, 분산 또는 병렬 환경에서의 컴퓨터에 의해 1모듈이 복수 컴퓨터에 의해 실행되어도 된다. 또한, 1개의 모듈에 다른 모듈이 포함되어 있어도 된다. 또한, 이하, 「접속」이란 물리적인 접속 외에, 논리적인 접속(데이터의 수수, 지시, 데이터 사이의 참조 관계 등)을 포함한다.
또한, 시스템 또는 장치란, 복수의 컴퓨터, 하드웨어, 장치 등이 네트워크(일대 일 대응의 통신 접속을 포함함) 등의 통신 수단으로 접속되어 구성되는 것 외에, 1개의 컴퓨터, 하드웨어, 장치 등에 의해 실현되는 경우도 포함된다. 「장치」와 「시스템 」이란, 서로 같은 의미의 용어로서 이용된다.
본 실시예는, 도 1에 나타낸 바와 같이, 화상 접수 모듈(110), 영역 추출 모듈(115), 행 추출 모듈(120), 문자 인식 모듈(125), 인식 문자 특징 취득 모듈(130), 번역 판단 모듈(135), 번역 모듈(140), 번역문 특징 취득 모듈(145), 출력 판단 모듈(150), 출력 모듈(155)을 갖고 있다.
화상 접수 모듈(110)은 영역 추출 모듈(115)과 접속되어 있고, 화상을 접수하며, 그 화상을 영역 추출 모듈(115)로 넘긴다. 화상을 접수한다는 것은, 스캐너로 화상 판독하는 것, 팩스로 화상을 수신하는 것, 화상 데이터베이스 등으로부터 화상을 판독하는 것 등이 포함된다. 화상에는 2치(値) 화상, 컬러 화상 등의 다치(多値) 화상이 포함되어 있다. 그 화상은 1매여도 되고, 복수 매여도 된다. 또한, 화상의 내용으로서, 비지니스용으로 이용되는 문서, 광고 선전용의 팸플릿 등이어도 된다.
영역 추출 모듈(115)은 화상 접수 모듈(110), 행 추출 모듈(120)과 접속되어 있고, 화상 접수 모듈(110)로부터 화상을 수취하며, 다치 화상의 경우에는 2치 화상으로 변환하고, 그 화상으로부터 문자 화상 영역을 추출하며, 그 문자 화상 영역을 행 추출 모듈(120)로 넘긴다. 즉, 화상을 문자 화상 영역과 문자 화상 영역 이외의 화상 영역으로 나눈다. 문자 화상 영역의 추출로서는, 기존의 방법을 이용하도록 해도 된다. 예를 들면, 영역 내의 단위 면적 당의 복잡도, 화소값, 흑화소 수 등에 의거하여 행해도 된다. 문자 화상 영역을 넘긴다는 것은, 추출한 문자 화상 영역의 화상 자체를 넘기도록 해도 되고, 화상 접수 모듈(110)로부터 수취한 화상과 문자 화상 영역의 좌표(예를 들면, 문자 화상 영역이 직사각형인 경우에는, 좌상각(左上角)의 x좌표, y좌표, 폭, 높이)를 넘기도록 해도 된다.
행 추출 모듈(120)은 영역 추출 모듈(115), 문자 인식 모듈(125)과 접속되어 있고, 영역 추출 모듈(115)로부터 문자 화상 영역을 수취하여, 그 중에서 문자 행을 추출하고, 그 문자 행을 문자 인식 모듈(125)로 넘긴다. 즉, 문자 인식 모 듈(125)에 처리시키기 위해, 행마다 문자 영역을 추출한다. 여기서, 문자 행에는 횡서(橫書)의 문자 행, 종서(縱書)의 문자 행을 포함한다. 문자 행의 추출로서는, 기존의 방법을 이용하도록 해도 된다. 예를 들면, 문자 화상 영역에 대해서 종방향 또는 횡방향으로 사영(射影)을 취하고, 그 흑화소 수의 히스토그램(histogram)으로부터 문자 행 사이의 경계를 취출하도록 해도 된다.
문자 인식 모듈(125)은 행 추출 모듈(120), 인식 문자 특징 취득 모듈(130)과 접속되어 있고, 행 추출 모듈(120)로부터 행 마다 잘라내진 문자 화상을 수취하여, 그 문자 화상에 대해서 문자 인식을 행하고, 그 문자 인식된 결과인 인식 문자를 인식 문자 특징 취득 모듈(130)로 넘긴다. 문자 인식이란, 화상을 문자 코드(텍스트)로 변환하는 것이며, 기존의 방법을 이용하도록 해도 된다. 또한, 문자 코드 외에 그 문자의 크기 등을 인식하도록 해도 된다. 그 경우, 인식 문자로서 그 문자의 크기 등을 포함한다. 또한, 문자 인식 모듈(125)은 영역 추출 모듈(115) 또는 행 추출 모듈(120)에 의한 오류, 즉, 본래 문자 화상 영역이 아닌 화상 영역을 문자 인식의 대상으로 하는 경우가 있을 수 있다.
화상 접수 모듈(110)~문자 인식 모듈(125)의 처리예에 대해서는, 도 8~10 등을 이용해서 후술한다.
인식 문자 특징 취득 모듈(130)은 문자 인식 모듈(125), 번역 판단 모듈(135)과 접속되어 있다. 문자 인식 모듈(125)에 의해 인식된 결과인 인식 문자의 특징을 취득하고, 그 인식 문자의 특징을 번역 판단 모듈(135)로 넘긴다. 여기서, 인식 문자의 특징이란, 그 인식 문자의 주로 텍스트로서의 특징을 말한다. 단, 그 인식 문자의 크기를 포함해도 된다.
예를 들면, 문자 이외의 화상을 인식한 경우의 인식 문자를 포함하고 있는 것에 관한 특징을 취득하도록 해도 된다.
또한, 예를 들면, 문자 이외의 화상을 인식한 경우의 인식 문자의 배열에 관한 특징을 취득하도록 해도 된다.
또한, 예를 들면, 인식 문자의 소정의 문자 수(數)당의 특징을 취득하도록 해도 된다.
번역 판단 모듈(135)은 인식 문자 특징 취득 모듈(130), 번역 모듈(140)과 접속되어 있다.
인식 문자 특징 취득 모듈(130)에 의해 취득된 특징에 의거하여 인식 문자를 번역해야 할지의 여부를 판단하고, 그 결과를 번역 모듈(140)로 넘긴다.
인식 문자 특징 취득 모듈(130), 번역 판단 모듈(135)의 처리예에 대해서는, 도 4~6 등을 이용해서 후술한다.
번역 모듈(140)은 번역 판단 모듈(135), 번역문 특징 취득 모듈(145)과 접속되어 있다.
번역 판단 모듈(135)에 의해 번역해야 한다고 판단된 경우에, 문자 인식 모듈(125)에 의한 인식 문자이면서 번역해야 한다고 판단된 것을 번역하고, 번역문을 번역문 특징 취득 모듈(145)로 넘긴다. 번역이란, 제 1 언어를 별도의 제 2 언어로 의미적으로 대응하는 것으로 변환하는 것이며, 기존의 방법을 이용하도록 해도 된다.
번역문 특징 취득 모듈(145)은 번역 모듈(140), 출력 판단 모듈(150)과 접속되어 있다.
번역 모듈(140)에 의해 번역된 결과인 번역 결과의 특징을 취득하고, 그 번역 결과의 특징을 출력 판단 모듈(150)로 넘긴다.
번역문 특징 취득 모듈(145)은 번역문 내에 그 언어에 있어서의 단어를 포함하는 것에 관한 정보를 취득하도록 해도 된다. 구체적으로는, 그 언어에 있어서의 단어를 기억하고 있는 사전(문자 인식 모듈(125) 또는 번역 모듈(140)이 이용하는 사전을 유용하여도 됨)을 준비하고, 번역문 내에 그 사전에 기억되어 있는 단어가 몇 개 포함되어 있는지를 취득한다. 예를 들면, 출력 판단 모듈(150)은 소정의 임계값과 비교하여, 포함되어 있는 단어 수가 많은 경우에는, 출력 필요라고 판단하도록 해도 된다.
또한, 번역문 특징 취득 모듈(145)은 상기 단어를 구성하고 있는 문자가, 대상으로 삼고 있는 번역문의 문자 행 내에서 포함되어 있는 비율을 취득하도록 해도 된다. 예를 들면, 출력 판단 모듈(150)은 소정의 임계값과 비교하여, 1행의 문자 수에 대하여 그 언어에 있어서의 단어를 구성하고 있는 문자 수의 비율이 높은 경우에는, 출력 필요라고 판단하도록 해도 된다.
또한, 번역문 특징 취득 모듈(145)은 번역문의 구문 해석을 행하고, 그 구문해석 결과를 취득하도록 해도 된다. 예를 들면, 출력 판단 모듈(150)은 정당한 구문 해석 결과인 경우에는, 출력 필요라고 판단하도록 해도 된다.
또한, 번역문 특징 취득 모듈(145)은 앞서 서술한 번역문의 복수의 특징을 추출하도록 해도 된다.
출력 판단 모듈(150)은 번역문 특징 취득 모듈(145), 출력 모듈(155)과 접속되어 있다.
번역문 특징 취득 모듈(145)에 의해 취득된 특징에 의거하여 번역문을 출력해야 할지의 여부를 판단하고, 그 결과를 출력 모듈(155)로 넘긴다.
또한, 번역문 특징 취득 모듈(145)이 앞서 서술한 번역문의 복수의 특징을 추출하도록 한 경우, 출력 판단 모듈(150)은 복수의 특징을 조합하여 판단하도록 해도 된다. 그 경우, 특징에 대하여 가중을 행하도록 해도 된다.
출력 모듈(155)은 출력 판단 모듈(150)과 접속되어 있다. 출력 판단 모듈(150)에 의해 출력해야 한다고 판단된 경우에, 화상 접수 모듈(110)에 의해 접수된 화상의 구성에 의거하여 번역 모듈(140)에 의한 번역 결과이며, 출력 판단 모듈(150)에 의해 출력해야 한다고 판단된 것을 출력한다.
출력 모듈(155)의 처리예에 대해서는, 도 7을 이용해서 후술한다.
도 2는 본 실시예에 의한 처리예를 나타내는 흐름도이다. 도 2에 나타낸 흐름도를 설명할 때, 도 3에 나타낸 처리 테이블(300)의 각 난을 어떻게 완성시킬지를 합쳐서 설명한다. 처리 테이블(30O)은 No.란(302), x좌표란(304), y좌표란(306), 높이란(308), 폭란(310), 문자 인식 결과란(312), 번역 필요 여부란(314), 번역 결과란(316), 출력 필요 여부란(318)을 갖고 있다.
스텝 S202에서는, 화상 접수 모듈(110)이 번역 대상의 화상을 접수한다.
스텝 S204에서는, 영역 추출 모듈(115)이, 스텝 S202에서 접수된 화상으로부 터 문자 화상 영역을 추출한다.
스텝 S206에서는, 행 추출 모듈(120)이, 스텝 S204에서 추출된 문자 화상 영역으로부터 문자 행을 추출한다. 여기서, 행 추출 모듈(120)은 처리 테이블(300)에 대하여, 추출한 문자 행을 순서대로 No.란(302)에 그 순번을 기억시키고, 그 문자 행의 좌상(左上)의 x좌표를 x좌표란(304)에, y좌표를 y좌표란(306)에, 문자 행의 높이를 높이란(308)에, 문자 행의 폭을 폭란(310)에 각각 기억시킨다.
스텝 S208에서는, 문자 인식 모듈(125)이, 스텝 S206에서 추출된 문자 행을 대상으로 하여 문자 인식 처리를 행한다. 그리고, 처리 테이블(300) 내의 문자 인식 결과란(312)에 인식 문자를 기억시킨다.
스텝 S210에서는, 인식 문자 특징 취득 모듈(130)이, 스텝 S208에서의 인식 문자의 특징을 취득한다. 즉, 문자 인식 결과란(312) 내의 문자를 대상으로 삼아, 문자 행마다 그 특징을 추출한다.
스텝 S212에서는, 번역 판단 모듈(135)이, 스텝 S210에서 취득된 특징에 의거하여 그 인식 문자를 번역 대상으로 삼아야 할지의 여부를 판단한다. 그 문자 행을 번역 불필요라고 판단한 경우(Y)에는 스텝 S214로 진행하고, 그 이외의 경우(N)에는 스텝 S216으로 진행하다. 그리고, 번역 판단 모듈(135)이, 스텝 S214에서는 대응하는 번역 필요 여부란(314)에 「N」을 기억시키고, 스텝 S216에서는 대응하는 번역 필요 여부란(314)에 「Y」를 기억시킨다. 또한, 스텝 S210~스텝 S216의 처리예에 대해서는, 도 4~6 등을 이용해서 후술한다.
단계 S218에서는, 스텝 S206에서 추출한 모든 문자 행에 대하여, 스텝 S212 의 판단 처리가 완료했는지의 여부를 판단한다. 완료하지 않은 경우(N)에는 스텝 S210으로 돌아가고, 완료한 경우(Y)에는 스텝 S220으로 진행한다.
스텝 S220에서는, 번역 모듈(140)이 번역 필요 여부란(314)에 「N」으로 되어 있는 것을 배제하고(즉, 번역 필요 여부란(314)이 「Y」로 되어 있는 것을 취출하고), 문자 인식 결과란(312) 내의 문자열에 대하여 번역을 실시한다. 그리고, 번역 모듈(140)은 그 번역 결과를 대응하는 번역 결과란(316)에 저장한다.
스텝 S222에서는, 번역문 특징 취득 모듈(145)이, 스텝 S220에서의 번역문의 특징을 취득한다. 즉, 번역 결과란(316) 내의 문자를 대상으로 삼아, 문자 행마다 그 특징을 추출한다.
스텝 S224에서는, 출력 판단 모듈(150)이, 스텝 S222에서 취득된 특징에 의거하여 그 번역문은 유의인지의 여부, 즉 출력 대상으로 삼아야 할지의 여부를 판단한다. 그 문자 행을 유의라고 판단한 경우(Y)에는 스텝 S226으로 진행하고, 그 이외의 경우(N)에는 스텝 S228로 진행한다. 그리고, 출력 판단 모듈(150)이, 스텝 S226에서는 대응하는 출력 필요 여부란(318)에 「Y」를 기억시키고, 스텝 S228에서는 대응하는 출력 필요 여부란(318)에 「N」을 기억시킨다.
스텝 230에서는, 스텝 S206에서 추출한 모든 문자 행에 대하여 스텝 S224의 판단 처리가 완료했는지의 여부를 판단한다. 완료하지 않은 경우(N)에는 스텝 S222로 돌아가고, 완료한 경우(Y)에는 스텝 S232로 진행한다.
스텝 S232에서는, 출력 모듈(155)이 출력해야 하는 번역문이 확정되고, 출력 모듈(155)이 스텝 S202에서 접수된 화상의 구성에 따라, 번역문을 출력한다.
도 4는 인식 문자 특징 취득 모듈(130), 번역 판단 모듈(135)에 의한 처리예(스텝 S210~스텝 S216의 구체적인 처리예)를 나타낸 플로 차트이다. 여기서는, 번역해야 할지의 여부를 1문자당의 포인트 수(점수)에 의해 판단한다. 그리고, 포인트 수가 높은 것은 번역해야 하는 것이 아니라고 한다. 즉, 포인트는 문자 화상영역이 아닌 화상을 문자 인식한 가능성을 반영하고 있다.
스텝 S402에서는, 각 문자 행 내의 각 인식 문자의 포인트 수를 취득한다. 여기서, 인식 문자는 문자 인식 결과란(312)을 참조하고, 그 문자의 포인트 수는 포인트 설정 테이블(500)을 참조해서 취득한다.
도 5를 이용하여, 포인트 설정 테이블(500)의 예를 설명한다. 포인트 설정 테이블(500)에서는, 포인트를 3단계(포인트: 3, 포인트: 2, 포인트: 1)로 나누고 있다. 즉, 문자 화상 영역이 아닌 화상을 문자 인식한 경우에, 빈번히 인식 문자로서 출력되는 「―」, 「一」, 「1」, 「I」 등을 3포인트로 하고, 1문자 영역 내에 「トン」의 문자가 있는 것, 「ノ」, 「レ」, 「{」 등을 2포인트로 하며, 그 이외의 문자를 1포인트로 정한 것이다. 즉, 포인트 설정 테이블(500)은, 포인트 수와 문자를 대응시켜서 기억한 것이다. 그리고, 인식 처리의 각 언어마다(예를 들면, 일본어용, 중국용, 한국어용, 영어용 등) 그 문자를 기억시킨다.
문자 인식 결과란(312) 내의 각 문자가 포인트 설정 테이블(500) 내의 어느 포인트 수에 해당하는 문자인지를 취득함으로써, 각 문자의 포인트를 취득한다.
스텝 S404에서는, 스텝 S402에서 포인트 부여된 문자의 배열(문자열)에 의해 포인트의 가중을 행한다. 그 가중은 가중 설정 테이블(600)을 이용한다.
도 6을 이용하여 가중 설정 테이블(600)의 예를 설명한다. 가중 설정 테이블(600)은 가중의 계수(係數)와 그 계수가 적용되는 상황을 나타낸 룰을 대응시켜서 기억한 것이다. 예를 들면, 「포인트: 2 또는 포인트: 3의 특정한 문자의 조합(그 문자 행의 방향으로 n문자 이상 배열되어 있음)」인 상황(구체예로서, 「――」 등)인 경우에는, 그 문자의 포인트 수를 4배로 한다. 또한, 「포인트: 2 또는 포인트: 3의 문자가 n문자 이상 배열되어 있는」 상황의 경우에는, 그 문자의 포인트 수를 2배로 하는 등이다.
문자 인식 결과란(312) 내의 문자의 배열이, 가중 설정 테이블(600) 내의 룰에 해당하는지에 의해 가중 계수를 결정한다.
스텝 S406에서는, 스텝 S402에서 취득된 포인트 수, 스텝 S404에서 결정된 가중 계수에 의거하여 각 문자 행의 포인트 수를 계산한다.
스텝 S408에서는, 그 행 내의 문자 수에 포인트 수가 좌우되지 않도록 하기 위하여, 문자 인식 결과란(312) 내의 문자 수를 계수하고, 스텝 S406에서 계산된 포인트 수를 제산하여 문자당의 평균 포인트 수를 계산한다.
스텝 S410에서는, 스텝 S408에서 계산된 평균 포인트 수는 소정의 임계값(TH)보다 큰지의 여부를 판단한다. 크다고 판단한 경우(Y)에는 스텝 S412로 진행하고, 그 이외라고 판단한 경우(N)에는 스텝 S414로 진행한다. 스텝 S412에서는, 대상 행은 번역 불필요(즉, 그 문자 행의 인식 문자는 문자 화상 영역이 아닌 화상을 문자 인식한 가능성이 높은 것)라고 판단하고, 대응하는 번역 필요 여부란(314)에 「N」을 기억시킨다. 스텝 S414에서는, 대상 행은 번역 필요(즉, 그 문 자 행의 인식 문자는 문자 화상 영역인 화상을 문자 인식한 가능성이 높은 것)라고 판단하고, 대응하는 번역 필요 여부란(314)에 「Y」를 기억시킨다.
또한, 스텝 S402~스텝 S408은 인식 문자 특징 취득 모듈(130)에 의해 행해진다. 스텝 S410~스텝 S414는 번역 판단 모듈(135)에 의해 행해지고, 도 2에 나타낸 플로 차트에서의 스텝 S212~스텝 S216에 대응한다.
또한, 인식 문자 특징 취득 모듈(130)은 인식 문자 내에 그 언어에 있어서의 단어를 포함하는 것에 관한 정보를 취득하도록 해도 된다. 구체적으로는, 그 언어에 있어서의 단어를 기억하고 있는 사전(문자 인식 모듈(125) 또는 번역 모듈(140)이 이용하는 사전을 유용해도 됨)을 준비하고 인식 문자 내에 그 사전에 기억되어 있는 단어가 몇 개 포함되어 있는지를 취득한다. 예를 들면, 번역 판단 모듈(135)은 소정의 임계값과 비교하여, 포함되어 있는 단어 수가 많은 경우에는, 번역 필요라고 판단하도록 해도 된다.
또한, 인식 문자 특징 취득 모듈(130)은 상기 단어를 구성하고 있는 문자가, 대상으로 하고 있는 문자 행 내에 포함되어 있는 비율을 취득하도록 해도 된다. 예를 들면, 번역 판단 모듈(135)은 소정의 임계값과 비교하여, 1행의 문자 수에 대하여 그 언어에 있어서의 단어를 구성하고 있는 문자 수의 비율이 높은 경우에는, 번역 필요라고 판단하도록 해도 된다.
또한, 인식 문자 특징 취득 모듈(130)은 문자 인식 모듈(125)이 출력하는 각 인식 문자의 크기를 취득하도록 해도 된다. 예를 들면, 번역 판단 모듈(135)은 각 문자의 크기의 통계적 분포에 의거하여(예를 들면, 문자의 크기가 소정의 범위의 편차 내에 들어 있는 경우), 번역 필요라고 판단하도록 해도 된다.
또한, 인식 문자 특징 취득 모듈(130)은, 문자 인식 모듈(125)이 출력하는 행마다의 인식 문자 수를 취득하도록 해도 된다. 예를 들면, 번역 판단 모듈(135)은 소정의 임계값과 비교하여 문자 수가 적은 행은, 번역 불필요라고 판단하도록 해도 된다.
또한 인식 문자 특징 취득 모듈(130)은 대상으로 하는 행이 인접해 있는 화상 영역의 종류(문자 화상 영역, 문자 화상 영역 이외의 화상 영역 등)에 관한 정보를 취득하도록 해도 된다. 예를 들면, 번역 판단 모듈(135)은 대상으로 하고 있는 행의 화상 영역이 문자 화상 영역에 둘러싸여 있는 경우에는, 번역 필요라고 판단하도록 해도 된다.
또한, 인식 문자 특징 취득 모듈(130)은 인식 문자의 구문 해석을 행하고, 그 구문 해석 결과를 취득하도록 해도 된다. 예를 들면, 번역 판단 모듈(135)은 정당한 구문 해석 결과인 경우에는, 번역 필요라고 판단하도록 해도 된다.
또한, 인식 문자 특징 취득 모듈(130)은 앞서 서술한 인식 문자의 복수의 특징을 추출하도록 해도 된다. 그리고, 번역 판단 모듈(135)은 복수의 특징을 조합해서 판단하도록 해도 된다. 그 경우, 특징에 대하여 가중을 행하도록 해도 된다.
도 7은 본 실시예에 의한 구체적인 처리예(특히, 출력 모듈(155)에 의한 처리예)를 나타낸 설명도이다.
화상 접수 모듈(110)이, 예를 들면 오리지널 원고(700)를 접수한다. 오리지널 원고(700)는 문장 영역(702), 문장 영역(704), 화상 영역(706), 화상 영역(708) 을 갖고 있다. 문장 영역(702, 704)은 문자 인식 모듈(125)에 의한 문자 인식의 대상, 그리고 번역 모듈(140)에 의한 번역의 대상으로 된다. 또한, 화상 영역(706, 708)은 영역 추출 모듈(115)에 의해 문자 화상 영역이 아니라고 판단되어 그대로 출력된다.
출력 모듈(155)은 영역 추출 모듈(115), 행 추출 모듈(120), 문자 인식 모듈(125)에 의한 오리지널 원고(700)에 대한 구조의 해석 결과(즉, 문장 영역(702, 704), 화상 영역(706, 708)의 종류(문자 영역인지의 여부 등), 위치, 크기 등)에 따라, 출력 판단 모듈(150)에 의해 출력 필요라고 판단된 번역문(처리 테이블(300)의 출력 필요 여부란(318)이 「Y」로 되어 있는 행의 번역 결과란(316))을 출력한다. 즉, 출력 모듈(155)은 처리 테이블(300) 내의 x좌표란(304)~폭란(310) 등을 이용해서, 번역문을 출력할 화상에 배치한다. 예를 들면, 위첨자 번역 출력(710), 치환 번역 출력(720)과 같이 출력한다. 위첨자 번역 출력(710)은 문장 영역(712, 714), 화상 영역(706, 708)을 갖고 있고, 오리지널 원고(700)의 화상 영역(706, 708)을 그대로 출력하고 있으며, 문장 영역(712, 714)은 번역문을 위첨자처럼 배치(대응하는 원문의 근방에 번역문을 배치)해서 출력하고 있는 예이다. 또한, 치환 번역 출력(720)은 문장 영역(722), 문장 영역(724), 화상 영역(706), 화상 영역(708)을 갖고 있고, 오리지널 원고(700)의 화상 영역(706, 708)을 그대로 출력하고 있으며, 문장 영역(722, 724)은 번역문을 원문 대신에 배치해서 출력하고 있는 예이다.
도 8은 화상 접수 모듈(110), 영역 추출 모듈(115), 행 추출 모듈(120), 문 자 인식 모듈(125)에 의한 처리예를 나타낸 설명도이다.
화상 접수 모듈(110)이, 예를 들면 오리지널 원고(800)를 접수한다. 오리지널 원고(800)는 화상 영역(801), 문장 영역(802), 문장 영역(803)을 갖고 있다. 즉, 문장 영역(802, 803)은 문자 인식, 번역의 대상으로 되어야 하는 것이고, 화상 영역(801) 내의 문장 영역(802) 이외의 영역은 그대로 출력해야 하는 것이다.
다음으로, 영역 추출 모듈(115)이 오리지널 원고(800)에 대하여, 2치화를 행하여 2치 화상(810)을 생성한다. 오리지널 원고(800)의 다치 화상의 화상 영역(801)도 2치 화상(810)의 화상 영역(811)과 같이 2치 화상이 된다.
또한, 영역 추출 모듈(115)은, 2치 화상(810)에 대하여, 문자 화상 영역을 추출한다. 여기서, 영역 추출 모듈(115)은 문장 영역(828, 829)을 문자 화상 영역으로서 추출하지만, 화상 영역(821) 내의 문장 영역(826, 827)도 문자 화상 영역으로서 추출한다. 이는, 자연화(自然畵) 등의 다치 화상을 2치화한 경우, 문자 화상 영역의 특징을 구비하고 있는 것과 같은 영역이 발생함에 의한 것이다.
이 결과(문장 영역(826~829)을 문자 화상 영역으로서 추출)대로, 행 추출 모듈(120), 문자 인식 모듈(125)에 의해 처리를 행하게 하면, 문장 영역(826)은 『レα』, 문장 영역(827)은 『、≠ノ徵』, 문장 영역(828)은 『그림 중의 문자열』, 문장 영역(829)은 『본문 중의 문자열입니다.』의 인식 문자로 된다. 여기서, 인식 문자 특징 취득 모듈(130), 번역 판단 모듈(135)에 의한 처리에 의해, 문장 영역(826, 827)의 인식 문자는 번역 대상으로 되지 않도록 한다.
도 9는 번역문 특징 취득 모듈(145), 출력 판단 모듈(150)에 의한 처리예(인 식 문자 특징 취득 모듈(130), 번역 판단 모듈(135)에 의한 처리가 행해지지 않은 경우의 예)를 나타낸 설명도이다.
화상 접수 모듈(110)이, 예를 들면 원(原)화상(900)을 접수한다. 원화상(900)에는 문자 화상 영역이 없고, 그대로 출력해야 하는 것이다.
다음으로, 영역 추출 모듈(115)이, 원화상(900)에 대하여, 2치화를 행하여 2치 화상(910)을 생성한다. 영역 추출 모듈(115)은 2치 화상(910)에 대하여, 문자 화상 영역을 추출한다.
문자 인식 모듈(125)이 이 문자 화상 영역에 대하여 문자 인식을 행하면, 도 9에 나타낸 바와 같은 일본어 문자 인식 결과(920)로 된다. 또한, 일본어 문자 인식 결과(920)를 번역 모듈(140)이 번역하면, 예를 들면, 도 9에 나타낸 바와 같은 중국어 번역(930), 영어 번역(940)이 된다.
여기서, 번역문 특징 취득 모듈(145), 출력 판단 모듈(150)은 앞서 서술에 나타낸 바와 같은 처리를 행하고, 중국어 번역(930), 영어 번역(940)과 같은 번역문은 출력시키지 않는다.
도 10은 각 언어를 대상으로 한 문자 인식 모듈(125)에 의한 처리예를 나타낸 설명도이다.
도 10에 나타낸 한국어 문자 인식 결과(1010), 중국어 문자 인식 결과(1020), 영어 문자 인식 결과(1030)는, 2치 화상(910)에 대하여, 각각 한국어, 중국어, 영어를 대상으로 한 문자 인식 모듈(125)에 의한 처리 결과이다.
이들 인식 문자는 도 9에 나타낸 일본어 문자 인식 결과(920)와 동일한 성질 을 갖고 있다. 따라서, 문자 인식 모듈(125)이 일본어 이외의 언어를 대상으로 한 것이라도, 인식 문자 특징 취득 모듈(130), 번역 판단 모듈(135)은 포인트 설정 테이블(500), 가중 설정 테이블(600) 등을 이용함으로써, 앞서 서술한 일본어를 대상으로 한 처리와 동일한 처리를 행할 수 있다.
도 11을 참조하여, 본 실시예의 하드웨어 구성예에 대하여 설명한다. 도 11에 나타낸 구성은, 예를 들면 퍼스널 컴퓨터(PC) 등에 의해 구성되는 것이고, 스캐너 등의 데이터 판독부(1117)와, 프린터 등의 데이터 출력부(1118)를 구비한 하드웨어 구성예를 나타내고 있다.
CPU(Central Processing Unit)(1101)는 앞서 서술한 실시예에서 설명한 각종 모듈, 즉, 영역 추출 모듈(115), 행 추출 모듈(120), 문자 인식 모듈(125), 인식 문자 특징 취득 모듈(130) 등의 각 모듈의 실행 시퀀스를 기술한 컴퓨터 프로그램에 따른 처리를 실행하는 제어부이다.
ROM(Read Only Memory)(1102)은 CPU(1101)가 사용하는 프로그램이나 연산 파라미터 등을 저장한다. RAM(Random Access Memory)(1103)은 CPU(1101)의 실행에서 사용하는 프로그램이나, 그 실행에서 적당하게 변화하는 파라미터 등을 저장한다. 이들은 CPU 버스 등으로 구성되는 호스트 버스(1104)에 의해 서로 접속되어 있다.
호스트 버스(1104)는 브리지(1105)를 통하여, PCI(Peripheral Component Interconnect/Interface) 버스 등의 외부 버스(1106)에 접속되어 있다.
키보드(1108), 마우스 등의 포인팅 디바이스(1109)는 조작자에 의해 조작되는 입력 디바이스이다. 디스플레이(1110)는 액정 표시 장치 또는 CRT(Cathode Ray Tube) 등으로 이루어지고, 각종 정보를 텍스트나 이미지 정보로서 표시한다.
HDD(Hard Disk Drive)(1111)는 하드디스크를 내장하고, 하드디스크를 구동하며, CPU(1101)에 의해 실행하는 프로그램이나 정보를 기록 또는 재생시킨다. 하드디스크에는 접수한 화상이나 문자 인식 모듈(125)에 의한 인식 결과 등이 저장된다. 또한, 그 외의 각종 데이터 처리 프로그램 등, 각종 컴퓨터 프로그램이 저장된다.
드라이브(1112)는 장착되어 있는 자기디스크, 광디스크, 광자기디스크, 또는 반도체 메모리 등의 리무버블 기록 매체(1113)에 기록되어 있는 데이터 또는 프로그램을 판독하고, 그 데이터 또는 프로그램을 인터페이스(1107), 외부 버스(1106), 브리지(1105), 및 호스트 버스(1104)를 통하여 접속되어 있는 RAM(1103)에 공급한다. 리무버블 기록 매체(1113)도 하드디스크와 동일한 데이터 기록 영역으로서 이용 가능하다.
접속 포트(1114)는 외부 접속 기기(1115)를 접속하는 포트이며, USB, IEEE1394 등의 접속부를 갖는다. 접속 포트(1114)는 인터페이스(1107) 및 외부 버스(1106), 브리지(1105), 호스트 버스(1104) 등을 통하여 CPU(1101) 등에 접속되어 있다. 통신부(1116)는 네트워크에 접속되어, 외부와의 데이터 통신 처리를 실행한다. 데이터 판독부(1117)는, 예를 들면 스캐너이고, 도큐먼트의 판독 처리를 실행한다. 데이터 출력부(1118)는, 예를 들면 프린터이고, 도큐먼트 데이터의 출력 처리를 실행한다.
또한, 도 11에 나타낸 하드웨어 구성은, 1개의 구성예를 나타낸 것이며, 본 실시예는 도 11에 나타낸 구성에 한하지 않고, 본 실시예에서 설명한 모듈을 실행 가능한 구성이면 된다. 예를 들면, 일부의 모듈을 전용 하드웨어(예를 들면, 특정 용도용 집적 회로(Application Specific Integrated Circuit: ASIC) 등)로 구성해도 되고, 일부의 모듈은 외부의 시스템 내에 있으며 통신 회선으로 접속하고 있는 것과 같은 형태여도 되며, 또한 도 11에 나타낸 시스템이 복수 서로 통신 회선에 의해 접속되어 있으며 서로 협조 동작하도록 해도 된다. 또한, 복사기, 팩시밀리, 스캐너, 프린터, 복합기(스캐너, 프린터, 복사기, 팩시밀리 등 중 어느 2개 이상의 기능을 갖고 있는 화상 처리 장치) 등에 조립되어 있어도 된다.
상기 실시예에서는, 도 4에 나타낸 플로 차트에서 1문자당의 포인트 수에 의해 번역해야 할지의 여부를 판단하는 예를 나타냈지만, 1문자당이 아니라, 복수 문자당의 포인트 수여도 된다.
또한, 설명한 프로그램에 대해서는, 기록 매체에 저장해서 제공해도 되고, 또한, 그 프로그램을 통신 수단에 의해 제공해도 된다. 그 경우, 예를 들면, 상기설명한 프로그램에 대하여, 「프로그램을 기록한 컴퓨터 판독 가능한 기록 매체」의 발명으로서 받아들여도 된다.
「프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 」란, 프로그램의 인스톨, 실행, 프로그램의 유통 등을 위해 이용되는, 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체를 말한다.
또한, 기록 매체로서는, 예를 들면, 디지털 버서타일 디스크(DVD)이고, DVD 포럼에서 책정된 규격인 「DVD-R, DVD-RW, DVD-RAM 등」, DVD+RW에서 책정된 규격 인 「DVD+R, DVD+RW 등」, 컴팩트 디스크(CD)이고, 판독 전용 메모리(CD-ROM), CD 레코더블(CD-R), CD 리라이터블(CD-RW) 등, 광자기 디스크(MO), 플렉시블 디스크(FD), 자기 테이프, 하드디스크, 판독 전용 메모리(ROM), 전기적 소거 및 재기입 가능한 판독 전용 메모리(EEPROM), 플래시 메모리, 랜덤 억세스 메모리(RAM) 등이 포함된다.
그리고, 상기한 프로그램 또는 그 일부는, 상기 기록 매체에 기록해서 보존이나 유통 등을 시켜도 된다. 또한, 통신에 의해, 예를 들면 로컬 에어리어 네트워크(LAN), 메트로폴리탄 에어리어 네트워크(MAN), 와이드 에어리어 네트워크(WAN), 인터넷, 인트라넷, 엑스트라넷 등에 이용되는 유선 네트워크, 또는 무선 통신 네트워크, 또한 이들의 조합 등의 전송 매체를 이용해서 전송시켜도 되고, 또한, 반송파에 실어서 반송시켜도 된다.
또한, 상기한 프로그램은, 다른 프로그램의 일부분이어도 되고, 또는 별개의 프로그램과 함께 기록 매체에 기록되어 있어도 된다. 또한, 복수의 기록 매체에 분할해서 기록되어 있어도 된다. 또한, 압축이나 암호화 등, 복원 가능하면 어떤 형태로 기록되어 있어도 된다.
도 1은 본 실시예의 구성예에 대한 개념적인 모듈 구성도.
도 2는 본 실시예에 의한 처리예를 나타내는 플로 차트.
도 3은 처리 테이블의 데이터 구조 예를 나타내는 설명도.
도 4는 인식 문자 특징 취득 모듈, 번역 판단 모듈에 의한 처리예를 나타내는 플로 차트.
도 5는 포인트 설정 테이블의 예를 나타내는 설명도.
도 6은 가중 설정 테이블의 예를 나타내는 설명도.
도 7은 본 실시예에 의한 구체적인 처리예를 나타내는 설명도.
도 8은 화상 접수 모듈, 영역 추출 모듈, 행 추출 모듈, 문자 인식 모듈에 의한 처리예를 나타내는 설명도.
도 9는 번역문 특징 취득 모듈, 출력 판단 모듈에 의한 처리예를 나타내는 설명도.
도 10은 각 언어를 대상으로 한 문자 인식 모듈에 의한 처리예를 나타내는 설명도.
도 11은 본 실시예를 실현하는 컴퓨터의 하드웨어 구성예를 나타내는 블록도.
도면의 주요 부분에 대한 부호의 설명
110…화상 접수 모듈 115…영역 추출 모듈
120…행 추출 모듈 125…문자 인식 모듈
130…인식 문자 특징 취득 모듈 135…번역 판단 모듈
140…번역 모듈 145…번역문 특징 취득 모듈
150…출력 판단 모듈 155…출력 모듈
300…처리 테이블

Claims (9)

  1. 화상 내의 문자를 인식하는 문자 인식 수단과,
    상기 문자 인식 수단에 의해 인식된 결과인 인식 문자에 대하여, 문자 이외의 화상 영역임에도 문자로 인식한 가능성을 포인트로 산출하여 인식 문자의 특징으로서 취득하는 인식 문자 특징 취득 수단과,
    상기 인식 문자 특징 취득 수단에 의해 취득된 특징에 의거하여, 상기 인식 문자를 번역해야 할지의 여부를 판단하는 번역 판단 수단을 구비하는 것을 특징으로 하는 정보 처리 장치.
  2. 제 1 항에 있어서,
    상기 인식 문자 특징 취득 수단은 상기 문자 이외의 화상을 인식한 경우의 인식 문자의 배열에 관한 특징을 취득하는 것을 특징으로 하는 정보 처리 장치.
  3. 제 1 항에 있어서,
    상기 인식 문자 특징 취득 수단은 상기 인식 문자의 소정의 문자 수 당의 특징을 취득하는 것을 특징으로 하는 정보 처리 장치.
  4. 제 2 항에 있어서,
    상기 인식 문자 특징 취득 수단은 상기 인식 문자의 소정의 문자 수 당의 특징을 취득하는 것을 특징으로 하는 정보 처리 장치.
  5. 화상 내의 문자를 인식하는 공정과,
    인식된 결과인 인식 문자에 대하여, 문자 이외의 화상 영역임에도 문자로 인식한 가능성을 포인트로 산출하여 인식 문자의 특징으로서 취득하는 공정과,
    상기 취득된 특징에 의거하여 상기 인식 문자를 번역해야 할지의 여부를 판단하는 공정과,
    번역해야 한다고 판단된 경우에, 상기 인식 문자를 번역하는 공정과,
    번역된 결과인 번역 결과의 특징을 취득하는 공정과,
    상기 취득된 특징에 의거하여 상기 번역 결과를 출력해야 할지의 여부를 판단하는 공정과,
    화상을 접수하는 공정과,
    출력해야 한다고 판단된 경우에, 상기 접수된 화상의 구성에 의거하여 상기 번역 결과를 출력하는 공정을 구비하고,
    상기 문자를 인식하는 공정에서, 상기 화상을 접수하는 공정에 의해 접수된 화상 내의 문자를 인식하며,
    상기 인식 문자의 특징을 취득하는 공정에서, 문자 이외의 화상을 인식한 경우의 인식 문자를 포함하고 있는 것에 관한 특징을 취득하는 것을 특징으로 하는 정보 처리 방법.
  6. 컴퓨터를,
    화상 내의 문자를 인식하는 문자 인식 수단과,
    상기 문자 인식 수단에 의해 인식된 결과인 인식 문자에 대하여, 문자 이외의 화상 영역임에도 문자로 인식한 가능성을 포인트로 산출하여 인식 문자의 특징으로서 취득하는 인식 문자 특징 취득 수단과,
    상기 인식 문자 특징 취득 수단에 의해 취득된 특징에 의거하여 상기 인식 문자를 번역해야 할지의 여부를 판단하는 번역 판단 수단과,
    상기 번역 판단 수단에 의해 번역해야 한다고 판단된 경우에, 상기 인식 문자를 번역하는 번역 수단과,
    상기 번역 수단에 의해 번역된 결과인 번역 결과의 특징을 취득하는 번역 결과 특징 취득 수단과,
    상기 번역 결과 특징 취득 수단에 의해 취득된 특징에 의거하여 상기 번역 결과를 출력해야 할지의 여부를 판단하는 출력 판단 수단과,
    화상을 접수하는 화상 접수 수단과,
    상기 출력 판단 수단에 의해 출력해야 한다고 판단된 경우에, 상기 화상 접수 수단에 의해 접수된 화상의 구성에 의거하여 상기 번역 결과를 출력하는 출력 수단으로서 기능시키는 정보 처리 프로그램을 저장하고,
    상기 문자 인식 수단은 상기 화상 접수 수단에 의해 접수된 화상 내의 문자를 인식하며,
    상기 인식 문자 특징 취득 수단은 문자 이외의 화상을 인식한 경우의 인식 문자를 포함하고 있는 것에 관한 특징을 취득하는 것을 특징으로 하는 컴퓨터 판독 가능한 기억 매체.
  7. 제 1 항에 있어서,
    상기 번역 판단 수단에 의해 번역해야 한다고 판단된 경우에, 상기 인식 문자를 번역하는 번역 수단과,
    상기 번역 수단에 의해 번역된 결과인 번역 결과의 특징을 취득하는 번역 결과 특징 취득 수단과,
    상기 번역 결과 특징 취득 수단에 의해 취득된 특징에 의거하여, 상기 번역 결과를 출력해야 할지의 여부를 판단하는 출력 판단 수단을 구비하는 것을 특징으로 하는 정보 처리 장치.
  8. 제 7 항에 있어서,
    화상을 접수하는 화상 접수 수단과,
    상기 출력 판단 수단에 의해 출력해야 한다고 판단된 경우에, 상기 화상 접수 수단에 의해 접수된 화상의 구성에 의거하여, 상기 번역 결과를 출력하는 출력 수단을 더 구비하고,
    상기 문자 인식 수단은 상기 화상 접수 수단에 의해 접수된 화상 내의 문자를 인식하는 것을 특징으로 하는 정보 처리 장치.
  9. 제 1 항, 제 7 항, 또는 제 8 항 중 어느 한 항에 있어서,
    상기 인식 문자 특징 취득 수단은 문자 이외의 화상을 인식한 경우의 인식 문자를 포함하고 있는 것에 관한 특징을 취득하는 것을 특징으로 하는 정보 처리 장치.
KR1020080098515A 2008-03-14 2008-10-08 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체 KR101248449B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2008-065504 2008-03-14
JP2008065504A JP4626777B2 (ja) 2008-03-14 2008-03-14 情報処理装置及び情報処理プログラム

Publications (2)

Publication Number Publication Date
KR20090098650A KR20090098650A (ko) 2009-09-17
KR101248449B1 true KR101248449B1 (ko) 2013-03-28

Family

ID=41063991

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080098515A KR101248449B1 (ko) 2008-03-14 2008-10-08 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체

Country Status (5)

Country Link
US (1) US8751214B2 (ko)
JP (1) JP4626777B2 (ko)
KR (1) KR101248449B1 (ko)
CN (1) CN101533392B (ko)
AU (1) AU2008221525B2 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5372110B2 (ja) * 2011-10-28 2013-12-18 シャープ株式会社 情報出力装置、情報出力方法、及びコンピュータプログラム
JP5862260B2 (ja) * 2011-12-09 2016-02-16 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
CN102609408B (zh) * 2012-01-11 2014-11-26 清华大学 基于多文种文档图像识别的跨文种理解方法
US9411801B2 (en) * 2012-12-21 2016-08-09 Abbyy Development Llc General dictionary for all languages
CN104933068A (zh) * 2014-03-19 2015-09-23 阿里巴巴集团控股有限公司 一种信息搜索的方法和装置
JP6888410B2 (ja) * 2017-05-15 2021-06-16 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5517409A (en) * 1992-03-24 1996-05-14 Ricoh Company, Ltd. Image forming apparatus and method having efficient translation function
JP2002132765A (ja) * 2000-10-30 2002-05-10 Sharp Corp 翻訳システム

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02249064A (ja) * 1989-03-22 1990-10-04 Oki Electric Ind Co Ltd 電子辞書
US5175684A (en) * 1990-12-31 1992-12-29 Trans-Link International Corp. Automatic text translation and routing system
JPH05324720A (ja) 1992-05-19 1993-12-07 Ricoh Co Ltd 対訳画像形成装置
US5675815A (en) * 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
JPH0765012A (ja) * 1993-08-27 1995-03-10 Ricoh Co Ltd 対訳画像形成装置
JP3294919B2 (ja) 1993-10-21 2002-06-24 松下電器産業株式会社 機械翻訳装置
JPH086948A (ja) 1994-06-22 1996-01-12 Matsushita Electric Ind Co Ltd 機械翻訳機
US5821929A (en) * 1994-11-30 1998-10-13 Canon Kabushiki Kaisha Image processing method and apparatus
JPH0981566A (ja) * 1995-09-08 1997-03-28 Toshiba Corp 翻訳装置及び翻訳方法
JPH11167623A (ja) * 1997-12-03 1999-06-22 Canon Inc 画像処理装置及び画像処理方法
JP2003178067A (ja) * 2001-12-10 2003-06-27 Mitsubishi Electric Corp 携帯端末型画像処理システム、携帯端末およびサーバ
JP4251629B2 (ja) * 2003-01-31 2009-04-08 キヤノン株式会社 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US7496230B2 (en) * 2003-06-05 2009-02-24 International Business Machines Corporation System and method for automatic natural language translation of embedded text regions in images during information transfer
JP2005301664A (ja) * 2004-04-12 2005-10-27 Fuji Xerox Co Ltd 画像辞書作成装置、符号化装置、データファイル、画像辞書作成方法及びそのプログラム
JP4788106B2 (ja) * 2004-04-12 2011-10-05 富士ゼロックス株式会社 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム
JP4419871B2 (ja) * 2005-03-02 2010-02-24 富士ゼロックス株式会社 翻訳依頼装置およびプログラム
JP4517895B2 (ja) * 2005-03-04 2010-08-04 富士ゼロックス株式会社 翻訳文出力装置
JP2006251902A (ja) * 2005-03-08 2006-09-21 Fuji Xerox Co Ltd 翻訳文書画像生成装置、翻訳文書画像生成プログラム及び翻訳文書画像生成方法
JP2006252048A (ja) * 2005-03-09 2006-09-21 Fuji Xerox Co Ltd 翻訳装置、翻訳プログラムおよび翻訳方法
JP2006252047A (ja) * 2005-03-09 2006-09-21 Fuji Xerox Co Ltd 言語処理装置および言語処理プログラム
JP2006259830A (ja) * 2005-03-15 2006-09-28 Toshiba Corp 光学的文字認識装置および光学的文字認識結果確認方法
JP4428266B2 (ja) * 2005-03-22 2010-03-10 富士ゼロックス株式会社 翻訳装置およびプログラム
US7865353B2 (en) * 2005-03-22 2011-01-04 Fuji Xerox Co., Ltd. Translation device, image processing device, translation method, and recording medium
JP2006268372A (ja) * 2005-03-23 2006-10-05 Fuji Xerox Co Ltd 翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラム
JP4311365B2 (ja) * 2005-03-25 2009-08-12 富士ゼロックス株式会社 文書処理装置およびプログラム
JP4419893B2 (ja) * 2005-03-25 2010-02-24 富士ゼロックス株式会社 画像処理装置及び画像処理方法
JP2006276911A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 電子機器およびプログラム
JP2006277103A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd 文書翻訳方法および文書翻訳装置
JP2006350664A (ja) * 2005-06-15 2006-12-28 Fuji Xerox Co Ltd 文書処理装置
MX2008010554A (es) * 2006-02-17 2008-10-29 Lumex As Metodo y sistema para la verificacion de palabras reconocidas de manera incierta en un sistema ocr.
JP4626570B2 (ja) * 2006-06-13 2011-02-09 富士ゼロックス株式会社 画像処理システムおよび画像処理装置
US8031940B2 (en) * 2006-06-29 2011-10-04 Google Inc. Recognizing text in images using ranging data
JP2008052439A (ja) * 2006-08-23 2008-03-06 Fuji Xerox Co Ltd 画像処理システムおよび画像処理プログラム
US7650035B2 (en) * 2006-09-11 2010-01-19 Google Inc. Optical character recognition based on shape clustering and multiple optical character recognition processes
US8045808B2 (en) * 2006-12-04 2011-10-25 Trend Micro Incorporated Pure adversarial approach for identifying text content in images
US8144990B2 (en) * 2007-03-22 2012-03-27 Sony Ericsson Mobile Communications Ab Translation and display of text in picture
JP5066977B2 (ja) * 2007-03-29 2012-11-07 富士ゼロックス株式会社 画像処理装置、画像形成装置、及びプログラム
US8023725B2 (en) * 2007-04-12 2011-09-20 Samsung Electronics Co., Ltd. Identification of a graphical symbol by identifying its constituent contiguous pixel groups as characters
JP5011508B2 (ja) * 2007-04-27 2012-08-29 日本電産サンキョー株式会社 文字列認識方法及び文字列認識装置
CN101354704B (zh) * 2007-07-23 2011-01-12 夏普株式会社 字形特征字典制作装置及具备该装置的文档图像处理装置
CN101354746B (zh) * 2007-07-23 2011-08-31 夏普株式会社 文字图像抽出装置及文字图像抽出方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5517409A (en) * 1992-03-24 1996-05-14 Ricoh Company, Ltd. Image forming apparatus and method having efficient translation function
JP2002132765A (ja) * 2000-10-30 2002-05-10 Sharp Corp 翻訳システム

Also Published As

Publication number Publication date
US8751214B2 (en) 2014-06-10
US20090234637A1 (en) 2009-09-17
KR20090098650A (ko) 2009-09-17
AU2008221525B2 (en) 2010-04-22
CN101533392A (zh) 2009-09-16
JP2009223477A (ja) 2009-10-01
AU2008221525A1 (en) 2009-10-01
CN101533392B (zh) 2011-06-15
JP4626777B2 (ja) 2011-02-09

Similar Documents

Publication Publication Date Title
US8201084B2 (en) Image processing apparatus and computer readable medium
AU2009200633B2 (en) Image processing apparatus, image processing method and image processing program
KR101248449B1 (ko) 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체
AU2009200420A1 (en) Image processing apparatus, image processing method and image processing program
US20130308862A1 (en) Image processing apparatus, image processing method, and computer readable medium
JP4232679B2 (ja) 画像形成装置およびプログラム
US20080050016A1 (en) Image processing apparatus, image processing method, computer readable medium, and computer data signal
JP4780184B2 (ja) 画像処理装置及び画像処理プログラム
JP5365440B2 (ja) 画像処理装置及び画像処理プログラム
JP5601027B2 (ja) 画像処理装置及び画像処理プログラム
US8649055B2 (en) Image processing apparatus and computer readable medium
KR20100088052A (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
JP5262778B2 (ja) 画像処理装置及び画像処理プログラム
JP5489894B2 (ja) 画像処理装置及び画像処理プログラム
JP4973765B2 (ja) 画像処理装置及び画像処理プログラム
JP4793429B2 (ja) 画像処理装置及び画像処理プログラム
JP4995507B2 (ja) 画像処理システム、文字認識システムおよび画像処理プログラム
JP4973536B2 (ja) 画像処理装置及び画像処理プログラム
JP2010049336A (ja) 画像処理装置及び画像処理プログラム
JP2021034813A (ja) 画像処理装置及び画像処理プログラム
JP2008084186A (ja) 画像処理システム及び画像処理プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160219

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170221

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180302

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190306

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20200303

Year of fee payment: 8