KR20060005191A

KR20060005191A - 동영상 연속촬영을 통한 전자문서 생성방법 및 장치

Info

Publication number: KR20060005191A
Application number: KR1020040054078A
Authority: KR
Inventors: 강우석
Original assignee: 삼성전자주식회사
Priority date: 2004-07-12
Filing date: 2004-07-12
Publication date: 2006-01-17
Also published as: CN100492349C; US20060008156A1; CN1722134A; KR101188393B1; US7565012B2

Abstract

여러 페이지로 구성된 문서를 연속으로 동영상 촬영하여 전자문서를 생성하는 방법 및 장치가 개시된다. 본 발명에 따라, 전자문서 생성방법은 (a) 문서를 촬영하여 동영상 데이터를 생성하는 단계; (b) 상기 생성된 동영상 데이터에 대해 움직임 추정을 수행하여 문서의 한 페이지를 검출하고, 문서인식을 하여 텍스트 데이터로 저장하는 단계; (c) 상기 동영상 데이터에 대해 움직임 추정을 수행하여 다음 페이지의 데이터가 입력되었는가를 검출하고, 다음 페이지 데이터를 문서인식하여 텍스트 데이터로 저장하는 단계; 및 (d) 상기 텍스트 데이터들을 하나의 전자문서로 저장하는 단계를 포함하는 것을 특징으로 한다. 이에 의해, 여러 페이지의 양/단면 종이문서를 해당 페이지만큼의 스캔이나 촬영 없이 한번의 동영상 촬영만으로, 전자문서로 쉽게 변환할 수 있다.

Description

동영상 연속촬영을 통한 전자문서 생성방법 및 장치{Electronic document publishing method by continuous photographing a document, and apparatus thereof}

도 1은 종래의 전자문서 생성 시스템의 간략화한 블록도,

도 2는 종래의 전자문서 생성방법의 플로우차트,

도 3은 본 발명의 바람직한 실시예에 따른 전자문서 생성장치의 블록도,

도 4는 도 3의 전자문서 생성장치의 상세 블록도,

도 5는 본 발명에 따른 전자문서 생성방법의 플로우차트이다.

본 발명은 동영상 연속촬영을 통한 전자문서 생성방법 및 장치에 관한 것으로, 보다 상세하게는 여러 페이지로 구성된 문서를 연속으로 동영상 촬영하여 전자문서를 생성하는 방법 및 장치에 관한 것이다.

최근 들어 동영상 압축기술과 이동기기 제조기술 및 소형의 저장장치 등의 발전으로 인하여 디지털 캠코더나 동영상을 지원하는 이동통신 단말과 같은 휴대형 동영상 촬영기기들이 많이 개발되었다. 이러한 기기들의 장점은 편하게 휴대가 가 능하여 언제 어디서나 멀티미디어 데이터의 생성, 편집, 저장 등을 할 수 있다는 것이다. 따라서, 이들을 이용하여 인쇄된 문서 또는 책 등을 전자문서로 만들기 위하여, 종래에는 문서 또는 책을 스캐너, 디지털 카메라 등을 사용하여 이미지 데이터로 입력받은 다음, 입력받은 이미지 데이터를 여러 가지 문자인식 알고리즘을 사용하여 인식하여 텍스트 데이터로 변경함으로써 전자문서를 생성하였다.

도 1은 종래의 전자문서 생성 시스템의 간략화한 블록도이다.

이미지 데이터 입력부(110)는 카메라, 스캐너 등을 통해 전자문서화 할 문서나 책의 이미지 데이터를 입력받는다. 입력받은 이미지 데이터는 비트맵의 형태가 될 수 있다. 문자인식부(120)는 이미지 데이터를 여러 가지 문자인식 알고리즘에 따라 인식하여 텍스트 데이터로 만든다. 이렇게 만들어진 텍스트 데이터는 메모리(130)에 저장된다. 사용자 인터페이스부(140)는 사용자의 명령을 입력받아 제어부(150)로 전달하여 전자문서 생성 시스템을 제어한다. 표시부(160)는 문서인식 결과나 사용자 명령처리 상태 등을 여러 가지 디스플레이 장치들을 통하여 제공한다. 이외에 도 1에는 표시하지 않았지만 메모리(130)에 저장된 텍스트 데이터를 편집하여, 원하는 형태의 전자문서로 만들기 위한 편집기능 수행부 등이 추가될 수 있다.

도 2는 종래의 전자문서 생성방법의 플로우차트이다.

종이문서, 책 등과 같이 전자문서로 만들고자 하는 피사체를 카메라, 스캐너 등을 통해 촬영하거나 스캐닝하여 그 이미지 데이터를 입력받는다(S210). 입력시작 명령 등은 사용자 인터페이스부(140)에 구비된 키 입력, 마우스 등을 통해서 가능하다. 즉, 카메라의 촬영버튼, 스캐너의 스캔시작버튼 등을 누름으로써 이미지 데 이터를 만든다. 이렇게 입력된 이미지 데이터를 저장한다(S220). 그리고, 저장된 이미지 데이터에 대하여 문자인식을 수행하여 텍스트 데이터로 바꾼다(S230). 이렇게 만들어진 텍스트 데이터는 메모리(130)에 저장된다. 문자인식에 의해 생성된 텍스트 데이터는 사용자가 미리 설정한 전자문서 파일의 형태로 가공되어 다시 메모리(130)에 저장된다.

그러나, 만일 문서가 한 페이지가 아니고 여러 페이지인 경우에는 각 페이지에 대하여 위의 과정을 반복하여 하나의 페이지마다 하나의 전자문서 파일로 만들고, 나중에 이들을 모두 합하여 하나의 전자문서 파일로 만들어야 한다. 이 과정에서, 촬영한 이미지의 중간처리결과나 최종인식결과 등은 표시부(160)를 통해 사용자에게 제공될 수 있다.

최근에는 이미지 처리기술 및 문자인식 기술이 발전하여 어느 정도 열화된 이미지에 대해서도 문자인식 성공률이 매우 높아졌다. 그러나, 카메라나 스캐너를 사용하여 문자인식을 하고 이렇게 하여 전자문서를 생성하는 종래의 방법은 많은 양의 문서를 처리하는데는 불편하다. 즉, 전자문서로 만들 문서의 페이지 수가 많은 경우에는 각 페이지에 대해서, 촬영 및 문자인식을 반복해서 수행하여야 하고, 이렇게 만들어진 이미지 데이터와 문자인식에 의해 만들어진 텍스트 데이터를 따로 저장하였다가 나중에 편집을 통해 하나의 문서로 만드는 등의 부가적인 작업이 필요하게 되어 시간과 비용이 많이 든다는 문제점이 있다.

따라서, 본 발명이 이루고자 하는 기술적 과제는 여러 페이지로 구성된 문서 를 효율적으로 전자문서로 만들기 위해서, 캠코더, PDA, 핸드폰, PC 카메라 등의 여러 가지 동영상 디지털 촬영장치를 통해 여러 페이지의 문서를 연속적으로 촬영하고 그 결과에 대해 문서인식을 수행하여 전자문서를 만드는 방법 및 장치를 제공하는 것이다.

상기 기술적 과제는 본 발명에 따라, (a) 문서를 촬영하여 동영상 데이터를 생성하는 단계; (b) 상기 생성된 동영상 데이터에 대해 움직임 추정을 수행하여 문서의 한 페이지를 검출하고, 문서인식을 하여 텍스트 데이터로 저장하는 단계; (c) 상기 동영상 데이터에 대해 움직임 추정을 수행하여 다음 페이지의 데이터가 입력되었는가를 검출하고, 다음 페이지 데이터를 문서인식하여 텍스트 데이터로 저장하는 단계; 및 (d) 상기 텍스트 데이터들을 하나의 전자문서로 저장하는 단계를 포함하는 것을 특징으로 하는 전자문서 생성방법에 의해 달성된다.

상기 (b) 단계는, (b1) 상기 생성된 동영상 데이터에 대해 움직임 추정을 수행하는 단계; (b2) 상기 문서가 양면으로 구성된 문서인 경우에는, 하나의 프레임 내에서 페이지와 페이지간의 에지를 검출하여, 이를 두 페이지로 구분하여 이미지 데이터로 저장하는 단계; 및 (b3) 상기 이미지 데이터를 문서 인식하여 텍스트 데이터로 저장하는 단계를 포함하는 것이 바람직하다.

상기 (b) 단계는, 일정시간동안 움직임이 없어 현재 프레임에 대한 움직임 값의 총합이 소정의 제1임계값보다 작은가 판단하여, 작은 경우에는 그때까지의 프레임 중에서 하나의 프레임을 문서의 한 페이지로 검출하고, 문서인식을 하여 텍스 트 데이터로 저장하는 것이 바람직하다.

상기 (c) 단계는, 상기 문서의 페이지가 넘어감으로써 움직임 값이 커지게 되면, 현재 프레임에 대한 움직임 값의 총합이 소정의 제2임계값보다 큰가를 판단하여 다음 페이지의 시작을 알아내고, 계속해서 입력되는 프레임에 대한 움직임 값의 총합이 제1임계값보다 작은가를 판단하여 다음 페이지의 데이터가 입력되었는가를 검출하고, 문서인식하여 텍스트 데이터로 저장하는 것이 바람직하다.

한편, 본 발명의 다른 분야에 따르면, 상기 기술적 과제는 문서를 촬영하여 동영상 데이터를 생성하는 이미지 데이터 입력부; 상기 생성된 동영상 데이터에 대해 움직임 추정을 수행하여 움직임을 검출하는 움직임 검출부; 및 상기 움직임 검출결과에 따라, 문서의 페이지를 구분하고, 그 페이지에 대하여 문서인식을 하여 텍스트 데이터로 만드는 데이터 처리부를 포함하는 것을 특징으로 하는 전자문서 생성장치에 의해서도 달성된다.

상기 전자문서 생성장치는, 문서인식용 촬영모드를 설정하고, 좌우양면, 상하양면 또는 단면모드의 여부를 설정하며, 전자문서로 만들어져 저장될 저장파일 형식을 정하여 설정하는 사용자 명령을 입력받는 사용자 인터페이스부를 더 포함하는 것이 바람직하다.

상기 사용자 인터페이스부는, 미리 저장된 동영상을 재생하면서 사용자가 선택한 프레임의 문서인식 명령을 입력받아 상기 데이터 처리부로 전달함으로써, 상기 데이터 처리부가 상기 움직임 검출결과에 관계없이 전자문서를 생성하도록 하는 것이 더욱 바람직하다.

상기 전자문서 생성장치는, 현재 프레임의 이미지가 에러없이 저장되었는가의 여부, 문서인식의 결과나 오류를 사용자에게 알려주는 표시부를 더 포함하는 것이 바람직하다.

상기 데이터 처리부는, 상기 움직임 검출결과에 따라 하나의 페이지의 프레임을 골라내는 영상처리부; 상기 문서가 양면으로 구성된 문서인 경우에는, 하나의 프레임 내에서 페이지와 페이지간의 에지를 검출하여, 이를 두 페이지로 구분하여 이미지 데이터로 저장하는 양면처리부; 및 상기 이미지 데이터를 문서 인식하여 텍스트 데이터로 출력하는 문서 인식부를 포함하는 것이 바람직하다.

이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대해 상세히 설명한다.

본 발명에 따른 전자문서 생성방법은, 동영상 촬영장치를 이용하여 하나의 문서를 연속적으로 한 번 촬영함으로써 여러 페이지의 문서를 그에 대응하는 하나의 전자문서로 만들고 저장하도록 한다. 전자문서로의 변환이 가능한 대상 문서의 종류는 한 번에 한 페이지만 보여지는 단면문서와, 책과 같이 한 번에 좌우 또는 상하의 두 페이지가 보여지는 양면문서가 있고, 이들 문서 모두를 전자문서로 만들 수 있다.

도 3은 본 발명의 바람직한 실시예에 따른 전자문서 생성장치의 블록도이다.

본 발명의 전자문서 생성장치는 이미지 데이터 입력부(310), 움직임 검출부(320), 데이터 처리부(330), 메모리(340), 사용자 인터페이스부(350) 및 표시부(360)를 포함한다.

이미지 데이터 입력부(310)는 문서를 촬영하여 디지털 동영상 데이터로 만들며, 여러 가지 동영상 촬영장치 어느 것이든 될 수 있다. 이러한 동영상 촬영장치의 예로는 디지털 캠코더, PDA, 디지털 카메라가 내장된 핸드폰, PC 카메라 등을 들 수 있다. 이렇게 촬영된 디지털 동영상 데이터는 움직임 검출부(320)로 입력된다. 움직임 검출부(320)는 화면의 움직임을 검출한다. 문서의 한 페이지를 촬영하는 도중에는 아무런 움직임이 없으나, 한 페이지를 촬영한 후 다음 페이지를 촬영하기 위하여 페이지를 넘기는 과정에서 화면의 움직임이 발생하므로 이를 검출하여 페이지와 페이지를 구분하는 것이다. 데이터 처리부(330)는 이렇게 만들어진 문서의 동영상 이미지 데이터에 대하여 양면처리과정 및 문서인식과정을 거쳐 텍스트 데이터로 만들어, 정해진 형태의 전자문서로 만든다. 양면처리과정 및 문서인식과정에 대해서는 후술한다.

메모리(340)는 문서의 동영상 이미지 데이터를 임시로 저장하거나, 완성된 전자문서를 저장한다. 사용자 인터페이스부(350)는 촬영시작/종료 명령, 양면문서인가 단면문서인가를 정하는 촬영옵션 등의 사용자 선택사항을 입력받아, 데이터 처리부(330)에 전달하여 그에 맞도록 전자문서를 생성하게 한다. 표시부(360)는 이미지의 중간처리결과나 문서인식결과, 전자문서생성결과 등을 사용자에게 제공한다.

도 4는 도 3의 전자문서 생성장치의 상세 블록도이다.

디지털 캠코더와 같은 디지털 동영상 촬영장치는 입력영상에 대해 압축 부호화를 실행한다. 이러한 압축 부호화를 수행하는 부호화부(420)는 움직임 추정부 (Motion Estimator)(421), 움직임 보상부(Motion Compensator)(422), 변환 및 양자화부(Transform & Quantizer)(423), 엔트로피 코딩부(Entropy coder)(424), 프레임 메모리(425) 등을 포함하여 소정의 압축 부호화 방법에 따라 입력영상을 부호화한다. 소정의 압축 부호화 방법은 MPEG, H.264 등 움직임 예측에 기반을 둔 동영상 압축 부호화 방법들 중 어떤 것이든 사용될 수 있다. 또한 디지털 동영상 촬영장치도 디지털 캠코더뿐만 아니라, PDA, PC 카메라, 동영상 촬영이 가능한 휴대폰 등 어느 것이든 될 수 있다.

이미지 데이터 입력부(410)는 단면 문서 또는 양면 문서 등을 상술한 동영상 촬영장치를 통하여 입력받는다. 사용자 인터페이스부(430)는 여러 페이지로 구성된 문서를 전자문서로 만들기 위해서, 문서 인식용 촬영모드 및 양/단면 인식모드 선택 및 촬영시작/종료명령을 입력받는다. 또한, 저장된 동영상을 촬영장치로 재생하면서 문서인식을 원하는 시점에서 사용자가 문서인식 명령을 입력함으로써 전자문서를 수동으로 만들 수도 있는데, 이 때의 수동인식 명령을 사용자 인터페이스부(430)를 통해 데이터 처리부(330)로 전달한다.

부호화부(420)는 이미지 데이터 입력부(410)로부터 입력받은 동영상에 대해서 움직임 예측에 따른 부호화를 수행하는데, 그 과정에서 움직임 추정부(421)는 입력된 동영상으로부터 움직임 정보를 계산하여 영상 처리부(440)로 전달한다. 즉, 움직임 추정부(421)는 현재 프레임의 매크로 블록의 움직임 예측치를 참조 프레임내의 소정의 탐색영역내에서 찾아봄으로써 이전 프레임과의 움직임 차이를 계산한다. 영상 처리부(440)는 움직임 추정부(421)로부터 수신된 움직임 정보를 바탕으로 문서인식의 대상이 되는 프레임을 골라내서 문서인식에 적합한 영상으로 처리한다. 즉, 어느 시간까지의 동영상 데이터가 하나의 페이지에 해당하는가 하는 정보를 움직임 추정부로부터 받아, 그 때까지의 영상중에서 가장 선명한 프레임을 한 페이지의 문서 이미지로 만든다. 즉, 하나의 페이지에 대하여 문서인식이 수행될 수 있는 형태로 만든다.

양면처리부(450)는 양면모드인 경우에 하나의 프레임을 두 페이지를 분리한다. 두 페이지로 분리하는 방법에 대해서는 도 5를 참조하여 후술한다. 문서 인식부(460)는 이렇게 만들어진 이미지에서 문자정보, 이미지 정보 등을 추출한다. 인식하고자 하는 문서는 텍스트 문서, 그림문서, 사진문서 등 여러 가지가 될 수 있다. 문서가 텍스트 문서인 경우에는 문서 인식부(460)는 지정된 메모리 영역에 저장되어 있는 문서인식 대상영상에 대해 문자인식을 실행하여 인식이 가능한 영상만을 판별하여 그 결과를 사용자가 설정한 파일형식으로 저장부(480)나 기타 외부 저장장치에 기록한다. 촬영 종료 후에는 촬영된 전자문서를 직렬통신 또는 USB 등의 외부 인터페이스나 네트워크를 통해 외부로 전송할 수 있다.

문서인식과 함께, 입력된 동영상 데이터를 저장하고자 하는 경우에는 부호화부(420)를 구성하는 나머지 구성요소들이 동작하여, 입력된 동영상 데이터를 압축한다. 표시부(470)는 문서인식 과정에서의 결과를 사용자에게 제공한다. 저장부(480)는 동영상 문서 데이터를 임시로 저장하거나, 완성된 전자문서를 저장한다. 입력된 문서가 주소록이거나, 외국어로 작성된 문서인 경우에는, 저장된 전자문서를 주소록 형태로 변환하거나, 번역부를 더 구비하여 자동번역이 되도록 할 수도 있다.

초기화를 수행한다(S510). 즉, 사용자는 우선 사용자 인터페이스부를 통해 문서인식용 촬영모드여부를 설정하고, 좌우양면, 상하양면 또는 단면모드의 여부를 설정하며, 전자문서로 만들어져 저장될 저장파일 형식(pdf, txt 등)을 정하여 설정함으로써, 문서인식의 대상이 되는 책이나 전화번호부, 사진 등을 촬영준비를 완료한다.

준비가 완료되면 사용자 인터페이스부를 통하여 촬영시작 명령을 전달한다(S520). 즉, 디지털 캠코더, PDA, 핸드폰 등의 촬영버튼을 누름으로써 촬영시작 명령을 전달한다.

문서인식용 촬영모드인가를 판단한다(S530). 전자문서를 만들기 위해 초기화 수행단계에서 문서인식용 촬영모드로 설정한 경우에는 문서인식을 하기 위한 촬영을 수행하고, 그렇지 않고 일반적인 동영상 촬영모드인 경우에는 일반적인 동영상 촬영과 같이 압축된 동영상을 생성하여 저장한다(S535).

움직임을 검출함으로써 한 페이지 검출한다(S540). 움직임을 검출하는 것은, 일정시간동안 움직임이 없어 현재 프레임에 대한 움직임 값의 총합이 소정의 제1임계값보다 작은가 판단하여, 작은 경우에는 그때까지의 프레임 중에서 하나의 프레임을 문서의 한 페이지에 해당하는 이미지 데이터로 저장하기 위함이다. 보다 상세하게 설명하면, 문서의 촬영이 시작되면 이미지 데이터 입력부를 통해 입력되는 동영상은 움직임 추정부에 의해 매 프레임마다 그 움직임 값이 계산되고, 현재 프레 임의 움직임 값은 영상 처리부로 입력된다. 영상처리부에서는 입력된 현재 프레임에 대한 움직임 값의 총합이, 미리 설정되어 있는 상수인 제1임계값(TH1)보다 작은 첫번째 프레임을 찾아내 해당 프레임에 대해 문서인식에 필요한 처리를 한다. 문서 인식에 필요한 처리의 예로는 이미지 향상(Image Enhancement)이 있다. 제1임계값은 실험에 의해 충분히 작은값으로 정해지며, 문서인식의 경우에는 움직임 없으므로, 실질적으로 0에 가까운 값이 된다. 또한 하나의 페이지를 어느 정도 오랫동안 촬영하는가에 따라, 움직임 값의 총합을 계산할 일정시간이 정해진다.

이렇게 처리된 현재 프레임을 하나의 페이지의 이미지로 저장한다(S550). 그러면서, LCD, LED 등으로 만들어진 표시부를 통해 하나의 페이지의 데이터가 에러없이 저장되었음을 사용자에게 알려준다. 사용자는 이 표시부를 통해 현재의 페이지가 제대로 입력되었음을 알 수 있으므로 촬영이 계속되는 상태에서 다음 페이지로 넘겨서 촬영을 계속할 수 있다.

다음으로 현재 촬영중인 모드가 양면문서모드인가 판단한다(S560). 양면문서모드로 설정되어 있는 경우에는, 현재 프레임의 중앙부분에서의 에지검출을 하여 현재 프레임을 두 페이지로 나누어 저장한다(S570). 보다 상세하게 설명하면, 양면 처리부에서는 영상 처리부에 의해 저장된 영상의 에지를 검출한다. 좌우양면으로 구성된 문서에 대해서는 그 중간 부분의 세로라인에서 에지를 검출하고, 상하양면으로 구성된 문서에 대해서는 그 중간부분의 가로라인에서의 에지를 검출한다. 검출된 에지 중 영상의 중심 부근에서 양면을 구분할 수 있는 기준값보다 큰 세로 또는 가로 에지 후보군을 선정하고 이들 중 가장 큰 값을 갖는 에지를 찾음으로써 좌 우 또는 상하 페이지를 분리하여 각각을 다시 저장할 수 있다. 단면모드인 경우, 양면처리부는 동작하지 않고 다음 작업을 문서 인식부에 넘긴다(S575).

문서인식 및 저장을 수행한다(S580). 텍스트 문서의 경우에 수행되는 문자이식은 여러 가지 문자인식 알고리즘 들 중 어느 것에 의해서도 수행될 수 있다. 그리고, 문자인식을 통해 만들어진 문서에 대한 텍스트 데이터를 저장부에 저장한다. 촬영이 종료되었는가를 판단하여(S582), 계속 촬영중이면 다음 페이지의 시작을 검출한다(S585). 다음 페이지의 시작은 다음과 같이 검출한다. 페이지를 넘기면 움직임 값이 커지므로 현재 프레임에 대한 움직임 값의 총합이 제2임계값보다 큰가를 판단하면 된다. 제2임계값 또한 실험에 의해 결정되며 제1임계값보다 큰 값이 된다. 즉, 계속 입력되는 프레임에 대한 움직임 값을 체크하여, 일정시간 동안 그 값이 제2임계값(TH2)보다 커지면 그 시점이 사용자가 다음 페이지로 설정하는 상황이라고 판단하는 것이다. 다음 페이지의 시작을 검출하지 못했으면 S582 단계로 되돌아가고, 검출하였으면 사용자로부터 촬영종료 명령을 받았는지 판단하여(S590), 촬영종료 명령을 받았으면 종료하고 그렇지 않으면 계속해서 다음 페이지의 문서를 촬영하여 문서 인식을 계속한다.

한편, 전술한 전자문서 생성방법은 컴퓨터 프로그램으로 작성 가능하다. 상기 프로그램을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 프로그램은 컴퓨터가 읽을 수 있는 정보저장매체(computer readable media)에 저장되고, 컴퓨터에 의하여 읽혀지고 실행됨으로써 전자문서 생성방법을 구현한다. 상기 정보저장매체는 자기 기 록매체, 광 기록매체, 및 캐리어 웨이브 매체를 포함한다.

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

전술한 바와 같이 본 발명에 따르면, 여러 페이지의 양/단면 종이문서를 해당 페이지만큼의 스캔이나 촬영 없이 한번의 동영상 촬영만으로, 전자문서로 쉽게 변환할 수 있고, 전화번호부나 주소록 등도 쉽게 입력받아 전자문서로 만들 수 있다.

또한, 종래의 동영상 부호화부에 포함되어 있는 움직임 추정부를 이용하여 움직임을 검출함으로써, 여러 페이지로 구성된 문서를 전자문서로 만드는 것을 보다 편리하게 할 수 있다. 그리고, 문서 인식을 통해, 텍스트 데이터로 저장되어 있는 문서를 주소록 형태로 변환하거나, 외국어 문서를 번역하여 출력함으로써 문서의 형식 또는 언어변환을 보다 신속하게 할 수 있다.

Claims

(a) 문서를 촬영하여 동영상 데이터를 생성하는 단계;

(b) 상기 생성된 동영상 데이터에 대해 움직임 추정을 수행하여 문서의 한 페이지를 검출하고, 문서인식을 하여 텍스트 데이터로 저장하는 단계;

(c) 상기 동영상 데이터에 대해 움직임 추정을 수행하여 다음 페이지의 데이터가 입력되었는가를 검출하고, 다음 페이지 데이터를 문서인식하여 텍스트 데이터로 저장하는 단계; 및

(d) 상기 텍스트 데이터들을 하나의 전자문서로 저장하는 단계를 포함하는 것을 특징으로 하는 전자문서 생성방법.
제1항에 있어서, 상기 (a) 단계 이전에

사용자 인터페이스를 통해 문서인식용 촬영모드를 설정하고, 좌우양면, 상하양면 또는 단면모드의 여부를 설정하며, 전자문서로 만들어져 저장될 저장파일 형식을 정하여 설정하는 것을 특징으로 하는 전자문서 생성방법.
제1항에 있어서, 상기 (b) 또는 (c) 단계는

미리 저장된 동영상을 재생하면서 사용자가 선택한 프레임의 문서인식 명령을 입력받은 경우에는, 상기 사용자가 선택한 프레임에 대해서 문서인식하여 텍스트 데이터로 저장하는 것을 특징으로 하는 전자문서 생성방법.
제1항에 있어서, 상기 (b) 단계는

(b1) 상기 생성된 동영상 데이터에 대해 움직임 추정을 수행하는 단계;

(b2) 상기 문서가 양면으로 구성된 문서인 경우에는, 하나의 프레임 내에서 페이지와 페이지간의 에지를 검출하여, 이를 두 페이지로 구분하여 이미지 데이터로 저장하는 단계; 및

(b3) 상기 이미지 데이터를 문서 인식하여 텍스트 데이터로 저장하는 단계를 포함하는 것을 특징으로 하는 전자문서 생성방법.
제4항에 있어서, 상기 (b2) 단계는

상기 문서가 좌우양면으로 구성된 문서에 대해서는, 프레임의 세로중간 부분의 세로라인에서 에지를 검출하고, 상하양면으로 구성된 문서에 대해서는 프레임의 가로 중간부분의 가로라인에서의 에지를 검출하여 두 페이지로 구분하여 이미지 데이터로 저장하는 것을 특징으로 하는 전자문서 생성방법.
제5항에 있어서, 상기 (b2) 단계는

상기 검출된 에지 중 영상의 중심 부근에서 양면을 구분할 수 있는 기준값보다 큰 세로 또는 가로 에지 후보군을 선정하고 이들 중 가장 큰 값을 갖는 에지를 찾음으로써 좌우 또는 상하 페이지를 분리하는 것을 특징으로 하는 전자문서 생성방법.
제1항에 있어서, 상기 (a) 단계는

카메라, 캠코더, PDA, PC 카메라를 포함하는 이미지 데이터 입력장치를 사용하여 문서를 촬영하여 동영상 데이터를 생성하는 것을 특징으로 하는 전자문서 생성방법.
제1항에 있어서, 상기 (b) 단계는

일정시간동안 움직임이 없어 현재 프레임에 대한 움직임 값의 총합이 소정의 제1임계값보다 작은가 판단하여, 작은 경우에는 그때까지의 프레임 중에서 하나의 프레임을 문서의 한 페이지로 검출하고, 문서인식을 하여 텍스트 데이터로 저장하는 것을 특징으로 하는 전자문서 생성방법.
제1항에 있어서,

표시부를 통해 현재 프레임의 이미지가 에러없이 저장되었는가의 여부, 문서인식의 결과나 오류를 사용자에게 알려주는 단계를 더 포함하는 것을 특징으로 하는 전자문서 생성방법.
제1항에 있어서, 상기 (c) 단계는

상기 문서의 페이지가 넘어감으로써 움직임 값이 커지게 되면, 현재 프레임에 대한 움직임 값의 총합이 소정의 제2임계값보다 큰가를 판단하여 다음 페이지의 시작을 알아내고, 계속해서 입력되는 프레임에 대한 움직임 값의 총합이 제1임계값보다 작은가를 판단하여 다음 페이지의 데이터가 입력되었는가를 검출하고, 문서인 식하여 텍스트 데이터로 저장하는 것을 특징으로 하는 전자문서 생성방법.
문서를 촬영하여 동영상 데이터를 생성하는 이미지 데이터 입력부;

상기 생성된 동영상 데이터에 대해 움직임 추정을 수행하여 움직임을 검출하는 움직임 검출부; 및

상기 움직임 검출결과에 따라, 문서의 페이지를 구분하고, 그 페이지에 대하여 문서인식을 하여 텍스트 데이터로 만드는 데이터 처리부를 포함하는 것을 특징으로 하는 전자문서 생성장치.
제11항에 있어서,

문서인식용 촬영모드를 설정하고, 좌우양면, 상하양면 또는 단면모드의 여부를 설정하며, 전자문서로 만들어져 저장될 저장파일 형식을 정하여 설정하는 사용자 명령을 입력받는 사용자 인터페이스부를 더 포함하는 것을 특징으로 하는 전자문서 생성장치.
제12항에 있어서, 상기 사용자 인터페이스부는

미리 저장된 동영상을 재생하면서 사용자가 선택한 프레임의 문서인식 명령을 입력받아 상기 데이터 처리부로 전달함으로써, 상기 데이터 처리부가 상기 움직임 검출결과에 관계없이 전자문서를 생성하도록 하는 것을 특징으로 하는 전자문서 생성장치.
제11항에 있어서,

현재 프레임의 이미지가 에러없이 저장되었는가의 여부, 문서인식의 결과나 오류를 사용자에게 알려주는 표시부를 더 포함하는 것을 특징으로 하는 전자문서 생성장치.
제11항에 있어서, 상기 데이터 처리부는

상기 움직임 검출결과에 따라 하나의 페이지의 프레임을 골라내는 영상처리부;

상기 문서가 양면으로 구성된 문서인 경우에는, 하나의 프레임 내에서 페이지와 페이지간의 에지를 검출하여, 이를 두 페이지로 구분하여 이미지 데이터로 저장하는 양면처리부; 및

상기 이미지 데이터를 문서 인식하여 텍스트 데이터로 출력하는 문서 인식부를 포함하는 것을 특징으로 하는 전자문서 생성장치.
제15항에 있어서, 상기 양면처리부는

상기 문서가 좌우양면으로 구성된 문서에 대해서는, 프레임의 세로중간 부분의 세로라인에서 에지를 검출하고, 상하양면으로 구성된 문서에 대해서는 프레임의 가로 중간부분의 가로라인에서의 에지를 검출하여 두 페이지로 구분하여 이미지 데이터로 저장하는 것을 특징으로 하는 전자문서 생성장치.
제15항에 있어서, 상기 영상처리부는

일정시간동안 움직임이 없어 현재 프레임에 대한 움직임 값의 총합이 소정의 제1임계값보다 작은가 판단하여, 작은 경우에는 그때까지의 프레임 중에서 하나의 프레임을 문서의 한 페이지로 검출하는 것을 특징으로 하는 전자문서 생성장치.
제15항에 있어서, 상기 영상처리부는

상기 문서의 페이지가 넘어감으로써 움직임 값이 커지게 되면, 현재 프레임에 대한 움직임 값의 총합이 소정의 제2임계값보다 큰가를 판단하여 다음 페이지의 시작 시점을 검출하는 것을 특징으로 하는 전자문서 생성장치.
제1항에 기재된 전자문서 생성방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.