KR100570224B1 - 전표정의데이터 작성방법 및 전표처리장치 - Google Patents

전표정의데이터 작성방법 및 전표처리장치 Download PDF

Info

Publication number
KR100570224B1
KR100570224B1 KR1020040002535A KR20040002535A KR100570224B1 KR 100570224 B1 KR100570224 B1 KR 100570224B1 KR 1020040002535 A KR1020040002535 A KR 1020040002535A KR 20040002535 A KR20040002535 A KR 20040002535A KR 100570224 B1 KR100570224 B1 KR 100570224B1
Authority
KR
South Korea
Prior art keywords
definition
character
definition data
data
information
Prior art date
Application number
KR1020040002535A
Other languages
English (en)
Other versions
KR20040078046A (ko
Inventor
아세노에이스케
신지요우히로시
Original Assignee
가부시키가이샤 히타치세이사쿠쇼
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시키가이샤 히타치세이사쿠쇼 filed Critical 가부시키가이샤 히타치세이사쿠쇼
Publication of KR20040078046A publication Critical patent/KR20040078046A/ko
Application granted granted Critical
Publication of KR100570224B1 publication Critical patent/KR100570224B1/ko

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F41WEAPONS
    • F41BWEAPONS FOR PROJECTING MISSILES WITHOUT USE OF EXPLOSIVE OR COMBUSTIBLE PROPELLANT CHARGE; WEAPONS NOT OTHERWISE PROVIDED FOR
    • F41B11/00Compressed-gas guns, e.g. air guns; Steam guns
    • F41B11/80Compressed-gas guns, e.g. air guns; Steam guns specially adapted for particular purposes
    • F41B11/89Compressed-gas guns, e.g. air guns; Steam guns specially adapted for particular purposes for toys
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F41WEAPONS
    • F41BWEAPONS FOR PROJECTING MISSILES WITHOUT USE OF EXPLOSIVE OR COMBUSTIBLE PROPELLANT CHARGE; WEAPONS NOT OTHERWISE PROVIDED FOR
    • F41B11/00Compressed-gas guns, e.g. air guns; Steam guns
    • F41B11/50Magazines for compressed-gas guns; Arrangements for feeding or loading projectiles from magazines
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F41WEAPONS
    • F41BWEAPONS FOR PROJECTING MISSILES WITHOUT USE OF EXPLOSIVE OR COMBUSTIBLE PROPELLANT CHARGE; WEAPONS NOT OTHERWISE PROVIDED FOR
    • F41B11/00Compressed-gas guns, e.g. air guns; Steam guns
    • F41B11/70Details not provided for in F41B11/50 or F41B11/60

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)

Abstract

본 발명은 전표정의데이터 작성방법 및 전표처리장치에 관한 것으로, 전표정의데이터 작성시의 유저부담을 경감한다. 전표처리장치는 유저가 지정한 영역에 대해, 레이아웃정보의 추출(스텝 200) 및 지정한 영역과 관련이 있는 항목명을 추출하고, 이들의 정보를 정의데이터에 변환함으로써(스텝 500, 스텝 600), 전표정의데이터의 자동작성을 실시한다. 이와 같이 함으로써, 정의위치만을 지정하는 것만으로, 정의데이터가 자동작성되기 때문에, 유저의 전표정의데이터의 설정부담을 경감할 수 있는 기술을 제공한다.

Description

전표정의데이터 작성방법 및 전표처리장치{FORM DEFINITION DATA CREATION METHOD AND FORM HANDLING MACHINES}
도 1은 전표처리장치의 개략 구성도이다.
도 2는 전표이미지 및 전표정의데이터의 구성을 나타내는 도이다.
도 3은 전표정의데이터 자동작성처리의 플로차트이다.
도 4는 전표정의데이터의 작성을 설명하기 위한 표시예를 나타내는 도이다.
도 5는 전표정의데이터 작성을 설명하기 위한 표시예를 나타내는 도이다.
도 6은 전표정의데이터 작성의 항목명-정의데이터 변환처리의 플로차트이다.
도 7은 전표정의데이터 작성에 있어서의 지정된 정의영역에 대한 항목명의 위치를 나타내는 도이다.
도 8은 전표정의데이터 작성에 있어서의 항목명-정의데이터 변환사전의 일례를 나타내는 도이다.
본 발명은 전표를 처리하는 기술에 관하여, 특히 문자인식처리를 행할 때에 이용되는 전표정의데이터를 작성하는 기술에 관한 것이다.
전표의 금액란 등의 문자열을 인식할 때에는 문자인식요구영역의 위치나 문자수 등의 정보를 미리 등록하고 있는 전표정의데이터를 이용하여 문자인식을 행한다. 이 전표정의데이터 작성에 대하여, 지금까지에 각가지의 수법이 고안되어 있고, 그들 수법은 주로 부담이 큰 정의데이터작성을 보다 용이하게 하기 위해 고안된 것이다.
예를 들면, 일본국 특개 2001-126010호 공보(제 8-9페이지, 도 7)에 기재되어 있는 전표정의작성방법에서는 데이터가 기입되어 있지 않는 전표에 대해서, 괘선추출 및 틀추출로부터 정의데이터를 자동추출한다. 또, 프레인쇄의 문자를 인식하고, 미리 등록하고 있는 키워드사전과 조합함으로써, 괘선으로 둘러싸여 있지 않는 문자기입틀을 설정하거나, 키워드에 대응한 위치에 존재하는 틀의 문자종류를 설정하거나 할 수가 있다. 또한, 전체 면의 프레인쇄문자를 읽는 것에 의해, 사람 손으로 틀을 지정하는 일이 없이, 모든 정의작성에 관한 작업을 자동으로 행하는 수법에 대해 설명하고 있다.
그러나, 상술한 정의작성방법에서는 틀을 지정한 경우, 지정틀내에 프레인쇄가 없으면 문자종류 등의 정의데이터는 작성할 수가 없다. 또, 전체 면 프레인쇄문자를 인식하기에는 현상에서는 상당히 시간이 걸리기 때문에 실용적이 아니다. 또한, 키워드에 대한 위치는 전표에 따라 다르기 때문에, 키워드사전을 각가지 전표에 대해 범용적으로 사용하는 것은 불가능하다.
그래서, 이 개시의 주된 관점은 이러한 과제를 해결하는 것이고, 특정의 전표 혹은 기입된 것, 미기입에 관계없이, 여러가지 전표라도 전표정의데이터의 자동작성을 가능하게 하는 것이다.
구체적으로 예를 들면, 지정된 독취영역주변 혹은 내부의 프레인쇄문자, 기입문자와 정의화상데이터 입력시에 자동추출한 틀, 괘선 등의 레이아웃정보를 기초로 하여 정의데이터의 자동작성을 행한다. 이 정의데이터 작성방법은 독취영역의 내부에 프레인쇄가 없어도, 독취영역의 주변에 존재하는 문자열을 인식하고, 그 인식결과를 정의데이터로 변환함으로써 정의데이터의 추출이 가능하다. 또, 독취영역주변에 복수의 문자열이 존재하는 경우이라도, 문자열의 위치나 사이즈, 틀의 유무, 틀사이즈에 대한 문자열 사이즈의 비율 등에서, 독취영역에 대한 키워드(이후, 항목명이라고 호칭하기로 한다)로서의 타당성을 수치화하고, 가장 타당한 문자열의 인식결과를 정의데이터로 변환함으로써 정의데이터의 추출이 가능하다.
이상의 처리에 의하여, 기입전표/미기입전표, 독취영역에 대한 항목명의 위치, 지정영역내부의 프레인쇄의 유무에 관계없이, 전표정의데이터를 자동작성하는 것이 가능하다.
또한, 각가지의 모양을 뽑을 수가 있고, 예를 들면 상술한 전표처리에 있어서의 자동정의데이터 작성방법으로서 구성해도 좋고, 이러한 기능을 컴퓨터에 실현시키기 위한 컴퓨터프로그램로서 구성해도 좋다. 여기서, 기억매체로서는 플렉시블디스크, CD-ROM, DVD, 광자기디스크, IC카드, IC칩, ROM카트리지, 펀치카드, 바코드 등의 부호가 인쇄된 인쇄물, 컴퓨터의 내부기억장치(RAM나 ROM 등의 메모리) 및 외부기억장치 등 광학적, 자기적, 전기적으로 컴퓨터가 독취가능한 각가지 매체를 이용할 수 있다. 상술한 각가지 특징은 적당히 조합하는 것이 가능하다.
최적인 하나의 실시예를 도면을 침조하면서, 이하의 항목에 나누어 설명한다.
A. 시스템구성
B. 전표정의데이터의 구성
C. 전표정의데이터의 작성
C1. 항목명-정의데이터 변환처리
A. 시스템구성
도 1은 전표정의데이터의 작성을 지원하는 전표처리장치의 구성을 나타내는 블록도이다. 또한, 이하에서는 전표(106)의 이미지데이터에 기초하여 신규로 전표정의데이터를 자동작성할 경우를 예를 들어 설명하지만, 본 전표처리장치는 이미 작성된 전표정의데이터에 새롭게 다른 독취영역의 정의데이터를 추가등록하는 것이 가능하다.
이 전표처리장치는 도시하는 대로, 하드웨어로서는 범용의 파스널컴퓨터(101) 및 디스플레이(102), 키보드(103), 마우스(104), 스캐너(105)를 접속해서 구성된다. 파스널컴퓨터(101)에는 전표처리장치의 기능을 실현하기 위한 어플리케이션 소프트가 인스톨 되어 있다. 도면중에 전표처리장치로서의 기능블록(107~113)을 나타내고 있다. 이들의 기능블록은 상술의 어플리켄이션 소프 트에 의해 구성된다. 물론, 하드웨어로 구성하는 것도 가능한다.
화상입력부(107)는 스캐너(105)를 제어해서, 전표정의데이터를 작성하는 샘플이 되는 전표(106)의 이미지데이터를 입력하는 기능을 한다. 전표정의데이터 작성부(108)는 키보드(103)나 마우스(104)의 입력장치로부터 정의영역을 지정되는 것에 의해, 이 이미지데이터에 기초하여 전표정의데이터를 자동추출하는 기능을 한다. 이때에는 문자인식용사전(110), 항목명조합용 지식사전(111), 항목명-정의정보변환사전(112) 등의 각 데이터베이스가 참조된다. 문자인직용사전(110)은 이미지데이터의 형상과 문자를 각 문자단위로 조합하기 위한 사전이다. 항목명조합용 지식사전(111)은 문자열과 항목명이 될 수 있는 단어를 조합함으로써, 문자인식율을 향상시키기 위한 사전이다. 항목명-정의정보변환사전(112)은 상기 항목명조합에 의해 얻어진 항목명으로부터 독취대상이 되는 속성이나 문자수 등의 정의데이터에 변환하기 위한 사전이다.
전표정의데이터 출력부(109)는 전표정의데이터 작성부(108)에 의해 추출한 정의데이터를 출력한다. 자동작성한 정의데이터는 전표정의데이터용의 데이터베이스(113)에 등록된다.
B. 전표정의데이터의 구성
도 2는 전표이미지와 전표정의데이터의 구성을 나타내는 도이다. 도의 상방에 정의하고 싶은 전표이미지(201)를 예시하고, 하방에 정의데이터(202)의 구성의 일례를 도시하였다. 전표이미지(201)에는 좌측 상방의 모서리를 원점으로 하여, 도시하는 방향에 x, y축이 정의되어 있다.
전표정의데이터(202)의 일례로서는 인식요구영역좌표, 틀형상, 지식사전종류, 문자수, 수서(手書)ㆍ활자 등으로 구성된다. 예를 들면, 전표이미지(201)의 우측 상방에 있는 의뢰일의 문자인식 정의데이터는 정의데이터(202)의 좌측상방에 있는 정의데이터와 대응하고 있다. 정의데이터에서는 이 인식요구영역에 대하여, 문자인식처리를 행해야 할 장방형 범위가 좌측상방(시작위치) 및 우측하방(종료위치)의 각 정점의 (x, y)좌표로 정의되어 있다. 도면중의 예에서는 좌측상방의 정점이 (1200, 100), 우측하방의 정점이 (1400, 150)로 설정되어 있다. 또, 틀은 존재하기 때문에, 틀형상은 "틀 있음"으로 설정되어 있다. 지식사전종류에 관해서는 독취대상의 속성은 날짜이기 때문에, "날짜"라고, 문자수는 "12문자"라고, 문자의 종별로서는 "활자"라고 설정되어 있다.
다만, 여기서 들었던 정의데이터는 일례이고, 이들 이외에 각가지 정보를 정의데이터로서 설정해도 좋다. 예를 들면, 인식요구영역이 활자이고, 문자피치가 일정한 것이 사전에 알고 있을 경우, 문자피치를 정의데이터에 설정하고, 문자인식시에 그 정보를 사용함으로써 인식율을 향상시키는 것이 가능하다.
C. 전표정의데이터의 작성
도 3은 정의데이터 자동작성처리의 플로차트이다. 컴퓨터(101)의 CPU가 유저의 커멘드에 따라 실행하는 처리이다. 처리가 개시되면, CPU는 우선 전표의 이미지데이터를 화상입력부(107)에서 입력하고(스텝 S100), 전표전면에 대해 레이아웃해석처리를 실행한다(스텝 S200). 즉, 입력된 이미지데이터로부터, 표, 틀, 괘선 등의 정보를 문자정보로서 추출하는 것과 동시에, 문자행이라고 인식되는 부분도 문 자정보로서 추출한다.
이 처리에 의해 얻어진 레이아웃정보를 컴퓨터(101)의 디스프레이(102) 등의 표시장치에 의해 유저에 제공한다. 예를 들면, 도 4(a)의 예에서는 레이아웃해석에 의해 얻어진 틀 추출결과를 윈도(405)에 표시하고 있다. 이 예에서는 간단화를 위해 틀 추출결과만을 표시하고 있지만, 실제로는 단추나 커멘드 등에 의해 괘선, 문자행정보의 표시를 절환하는 것이 가능하다.
이것으로부터 정의하는 예정 영역의 괘선이나 틀이 잘못 추출일 경우에, 잘못 추출한 레이아웃정보를 유저가 수정한다(스텝 300). 수정처리는 디스프레이(102) 등의 표시장치에 표시된 틀이나 괘선 등을 컴퓨터(101)의 마우스(104) 등의 포인팅디바이스를 이용하여 행한다. 예를 들면, 도 4(b)의 예에서는 레이아웃해석에 의해 얻어진 틀(406)을 잘못 추출하고 있기 때문에, 수정단추(401)를 온으로 하여, 마우스(104)로 수성틀을 선택한 후에 드래그 함으로써 틀을 수정한다(407). 레이아웃정보에 수정처리가 더한 것을 CPU가 검지하면, CPU는 수정한 정보를 기초로 하여 다시 레이아웃해석을 행하고, 정의하는 예정의 영역에 관한 레이아웃정보를 올바르게 설정한다.
이 처리는 정의영역에 틀이나 괘선 등의 레이아웃정보에 잘못 추출이 있을 경우만 행한다. 따라서, 잘못 추출이 확인할 수 없는 경우나, 정의하는 영역 이외의 부분에서 잘못 추출이 일어나고 있는 경우 등은 이 처리를 스킵 하는 것도 가능하기 때문에, 정의데이터 작성시간의 단축에 이어진다.
레이아웃정보의 수정은 틀이나 괘선 등의 레이아웃정보에 대해 추가/삭제/수 정/통합/분할 등의 처리에 의해 행한다. 또, 내부에서 보지하고 있는 레이아웃정보 추출에 관한 임계치를 변경함으로써, 한 번에 레이아웃정보를 수정하는 것도 가능하다. 예를 들면, 내부에서 보지하고 있는 추출가능한 틀의 최소 사이즈ㆍ최대 사이즈의 임계치를 변경하고, 다시 레이아웃해석처리를 행함으로써, 임계치 변경전에서는 추출할 수 없었던 틀을 한 번에 추출할 수 있도록 하는 것도 가능하다.
이 처리에 의해 필요한 레이아웃정보가 얻어지면, 다음에 CPU는 정의영역설정처리를 행한다(스텝 S400). 이 처리에서는 얻어진 레이아웃정보를 디스프레이(102) 등의 표시장치에 의해 유저에 제시해서, 어느 영역을 정의하는가를 마우스(104) 등의 포인팅디바이스를 이용해서 지정을 받는다. 이 처리는 얻어진 틀을 선택해도 좋고, 틀이 없는 영역을 정의하고 싶은 경우는 독취하는 문자열이 쓰여진 부분을 마우스 드래그 등에 의해 영역을 둘러싸는 것으로 선택해도 좋다. 예를 들면, 도 4(d)의 예에서는 틀(408)을 정의영역으로 할 경우, 선택단추(402)를 온으로, 마우스(104)으로 틀(408)을 서택함으로써 정의영역의 설정을 행한다.
유저에 정의영역을 지정 받으면, CPU는 레이아웃정보-정의데이터 변환처리를 행한다(스텝 S500). 정의영역설정처리에 의해 레이아웃정보로서 추출된 틀을 선택한 경우는 선택한 틀에 해당하는 정보를 레이아웃정보 테이블로부터 취득하고, 이것을 기초로 정의데이터에 변환한다. 틀이 없는 영역을 정의한 경우는 둘러싼 틀을 가상틀이라고 보고 정의데이터를 작성한다. 여기서 말하는 정의데이터라는 것은 인식요구영역의 장방형 좌표나 틀의 유무 등의 레이아웃정보에 의해 추출 가능한 정의항목인 것을 가리킨다.
또, 정의영역내에 복수의 틀이 존재하고, 또한 각 틀의 종폭ㆍ횡폭 사이즈로부터 모든 틀이 한문자 틀이라고 판정되면, 틀 수를 기초로 하여 문자수의 설정을 행하는 것도 가능하다. 예를 들면, 금액란에는 형선에 의해 구별된 한문자틀이 존재하는 것이 많이 있다. 이 영역을 정의할 때에는 상기의 방법에 의해 인식요구영역의 장방형좌표나 틀의 유무, 문자수 등의 정의데이터가 추출가능하다.
CPU는 이 처리와 전후해서, 항목명-정의데이터 변환처리도 행한다(스텝 S600). 상세한 처리내용은 후술하지만, 이 처리에서는 지정한 정의영역 주변의 문자를 인식함으로써, 독취속성이나 문자수 등의 정의데이터를 추출하는 처리이다.
이들의 처리에 의해 정의데이터가 얻어지면, 다음으로 CPU는 정의데이터를 정리하고, 디스프레이 등의 표시장치(102)에 의해 정의데이터를 유저에 제시한다. 제시한 정의데이터에 잘못이 있을 경우나 설정되어 있지 않는 항목이 있을 경우는 유저가 정의데이터를 수정하거나, 추가하거나 한다(스텝 S700). 유저에 정의데이터를 제시할 때, 자동설정되어 있는 항목이나 미설정항목 등을 색으로 구분하는 것에 의해, 유저에게 알기 쉽게 시키는 것도 가능하다. 또, 자동으로 설정한 항목중에서, 애매성이 높은 항목도 동일하게 색으로 구분하는 것으로, 유저에 주의를 재촉하는 것도 가능하다. 여기서는 정의데이터의 유저제시방법의 일례를 들었지만, 이 외에도 각가지 제시방법이 생각된다.
예를 들면, 도 4(e)의 예에서는 레이아웃해석 및 항목명으로부터 추출한 정의데이터를 정리해서 윈도(409)에 표시하고 있다. 유저는 표시되어 있는 정의데이터를 확인하고, 모든 정의데이터가 올바르면 정의데이터에 수정을 가해지지 않고, 잘못하고 있으면 각 정의데이터를 유저가 수정해서 OK단추(410)를 누르는 것에 의해 틀(408)에 대한 정의영역설정이 완료한다. 정의영역으로서 설정하지 않는 경우는 취소단추(411)를 누르는 것으로, 선택한 틀의 정의영역설정은 무효가 된다.
도 4(d)의 예에서는 표형식이 되어 있으므로, 각 틀에 있어서의 정의데이터의 속성은 열단위로 동일한 값을 가진다. 예를 들면, "은행명"의 밑에 있는 틀은 모두 "은행명"의 속성이 들어가, "지점명"도 동일하다. 이와 같이, 열단위로 정의데이터의 속성이 동등한 영역을 정의영역으로 해서 설정할 경우는 정의영역의 복사기능을 사용함으로써, 정의작업을 효율적으로 행하는 것이 가능하다(스텝 S800).
예를 들면, 도 5(f)의 예에서는 정의영역으로서, "은행명", "지점명", "계좌번호"의 전영역을 정의할 경우, 각 항목의 바로 밑에 존재하는 영역(412)을 상기에서 설명한 순서에 의해 설정한다. 다음으로 복사단추(403)을 누른 뒤에 도 5(g)에 도시하는 것과 같이 복사하고 싶은 영역(413)을 마우스(104)로 드래그 함으로써 둘러싼다. CPU는 복사하고 싶은 영역(413)에 대해, 설정을 마친 정의영역을 검출하는 처리 및 설정을 마친 정의영역(412)과 종폭ㆍ횡폭이 동등한 틀을 검출하는 처리를 행한다. 이 처리에서는 설정을 마친 정의영역(412)에 대해 복사하고 싶은 영역(413)내에서 상하방향을 탐색하고, 종폭ㆍ횡폭이 동등한 틀을 검출한다. 다음으로 CPU는 도 5(h)에 도시하는 것과 같이 설정을 마친 정의속성치를 검출한 틀에 복사한다(414). 여기서 말하는 정의속성치라는 것은 좌표정보 이외의 문자수나 지식사전종류 등의 정의데이터를 가리키는 것이다. 시작위치나 종료위치 등의 좌표정보는 각 틀에서 다르기 때문에, 이들의 정의데이터는 레이아웃해석에 의해 얻어진 틀정보로부터 추출한다.
이 예에서는 열에 대한 복사에 대해 설명했지만, 행에 대한 복사도 동일하게 해서 실현하는 것이 가능하다. 또, 이 외에 종폭ㆍ횡폭이 동등한 틀을 검출한 시점에서 디스프레이(102)에 의해 유저에 제시하고, 정의속성 복사를 행하고 싶은 틀만을 유저가 마우스(104)로 선택하고, 정의속성 복사를 실행시키는 것도 가능하다.
이상의 처리에 의해, 설정된 전표정의데이터를 출력해서(스텝 S900), 전표정의데이터의 자동작성처리를 종료한다. 작성된 전표정의데이터는 우선 설명한 대로, 전표처리장치에 기억되고, 전표의 문자인식에 활용된다. 예를 들면, 도 4의 예에서는 모든 전표정의데이터가 정확하게 설정되어 있는 것을 확인한 뒤에 보존단추(404)를 누름으로써 전표정의데이터를 보존하는 것이 가능하다.
C1. 항목명-정의데이터 변환처리
도 6은 항목명-정의데이터 변환처리(600)의 플로차트이다. 이 처리에서는 유저가 지정한 정의영역에 대해, 위방향, 좌측방향으로 인접하는 틀을 검출한다(스텝 S601). 여기서는 CPU는 미리 전표전면에서 추출한 레이아웃정보의 틀정보테이블을 참조하고, 해당하는 틀정보를 검출한다. 예를 들면, 도 7의 예에서는 "평성 14년 12월 1일"라는 영역(705)을 정의영역으로 하여 지정할 경우, 영역(705)에 대한 인접틀은 영역(706)에 해당한다.
다음으로, CPU는 해당하는 영역틀내에 존재하는 문자행에 대해 문자인식처리를 행하고(스텝 S602), 얻어진 인식결과가 존재하는가의 체크를 행한다(스텝 S603). 여기서는 CPU는 우선 설명한 문자인식용사전(110)을 참조하고, 절출한 래스 터 이미지와 문자와의 조합을 행한다. 또, 얻어진 문자열을 항목명조합용 지식사전(111)과 조합함으로써 단어로서 확정하는 지식조합처리를 실행한다.
예를 들면, 도 7의 예에서는 지정한 정의영역(705)에 대한 인접틀(706)내의 문자행(707)을 문자인식용사전(110) 및 항목명조합 지식사전(111)을 참조하고, 항목명인식결과 "이체 지정일"을 얻는다. 얻어진 인식결과가 존재하지 않는다고 하는 것은 해당하는 인접틀이 없는 경우나 인접틀내에 문자행이 존재하지 않는 경우, 또, 문자행이 존재했지만 지식조합으로 실패한 경우인 것을 가리킨다. 예를 들면, 도 7의 예에서는 영역(701)에 대한 인접틀은 존재하지 않고, 인접하는 문자행(702)만 존재한다. 또, 영역(703)에 대해서도 인접틀은 존재하지 않고, 영역(703)의 내부에 문자행(704)이 존재한다. 또한, 인접틀이 2개이상 존재하고, 항목인식결과가 2개이상 존재한 경우는 문자인식처리로부터 얻어진 확신도가 높은 쪽을 우선한다. 또, 이 경우, 유저에 제시함으로써 올바른 항목명을 선택시키는 것도 가능하다.
인접틀내에 대한 항목명 인식결과가 얻어진 경우, CPU는 인식결과의 항목명을 정의데이터에 변환한다(스텝 S609). 이 처리에서는 우선 설명한 항목명-정의정보변환사전(111)을 참조함으로써, 항목명에 대한 정의데이터에 변환한다. 도 8에 항목명-정의정보변환사전(111)의 일례를 나타낸다. 도 7의 영역(706)내의 "이체 지정일"을 예를 들어 설명하면, 이 항목명은 항목명-정의정보변환사전(111)에 존재하고, 이 항목명에 행당하는 지식사전종류는 "날짜", 문자수는 "12문자"이다. 이와 같이 해서, 항목명으로부터 정의데이터를 추출한다. 또한, 항목명에 부수한 정의데이터는 지식사전종류나 문자수에 관계없이, 각가지 정보를 설정해도 좋다. 예를 들 면, 지식사전종류나 문자수 이외에서는 문자종류 등이 생각된다.
스텝 603에 있어서, 인접틀에 대한 항목명 인식결과가 얻어지지 않았던 경우에는 지정한 정의영역내의 문자행 추출처리를 행한다. 여기서는 CPU는 미리 전표전면에서 추출한 레이아웃정보의 문자행정보 테이블을 참조하고, 지정한 영역내에 존재하는 문자행정보를 검출한다. 추출한 문자행에 대해 문자인식처리를 행하고(스텝 S604), 얻어진 인식결과가 존재하는가의 체크를 한다(스텝 S605). 여기서는 CPU는 상기와 동일하게 문자인식용사전(110), 항목명조합용 지식사전(111)을 이용하여 문자인식을 행한다.
예를 들면, 도 7의 예에서는 "의뢰일 월 일"이라는 영역(703)을 정의영역으로서 지정한 경우, 지정한 정의영역(703)의 내부에 존재하는 문자행(704)을 문자인식용사전(110) 및 항목명조합용 지식사전(111)을 참조하고, 항목명인식결과 "의뢰일"을 얻는다. 내부문자행에 대한 항목명인식결과가 얻어진 경우, CPU는 인식결과의 항목명을 정의데이터에 변환한다(스텝 S609).
내부문자행에 대한 항목명인식결과가 얻어지지 않았을 경우에는 지정한 정의영역에 대해, 위방향, 좌측방향에 인접하는 문자행을 검출한다(스텝 S606). 여기서는 CPU는 미리 전표전면에서 추출한 레이아웃정보의 틀정보테이블을 참조하고, 해당하는 문자행정보를 검출한다. 예를 들면, 도 7의 예에서는 " 귀하"라는 영역(701)을 정의영역으로서 지정한 경우, 영역(701)에 대한 인접문자행은 영역(702)에 해당한다.
다음으로, CPU는 해당하는 인접문자행에 대해 문자인식처리를 행하고(스텝 S607), 얻어진 인식결과가 존재하는가의 체크를 행한다(스텝 S608). 여기서는 CPU는 상기와 동일하게 문자인식용사전(110), 항목명조합용 지식사전(111)을 이용하여 문자인식을 행한다. 예를 들면, 도 7의 예에서는 지정한 정의영역(701)에 대한 인접문자행(702)을 문자인식용사전(110) 및 항목명조합용 지식사전(111)을 참조하고, 항목명인식결과 "의뢰인"을 얻는다.
인접문자행에 대한 항목명인식결과가 얻어진 경우, CPU는 인식결과의 항목명을 정의데이터에 변환한다(스텝 S609). 인접문자행에 대한 항목명인식결과가 얻어지지 않았을 경우는 지정한 정의영역이 항목명을 갖지 않는 영역이라고 보고, 지식사전종류나 문자수 등의 정의데이터는 미설정으로서 종료한다.
CPU는 이상의 처리를 전지정 정의영역에 대해 실행한다. 또한, 이번에 항목명추출처리에 있어서, 인접틀내 문자행, 지정정의영역내 문자행, 인접문자행의 순서로 우선도를 설정했지만, 전표종류에 따라서는 우선도를 변경해도 좋다. 또, 3개의 문자행을 사용하지 않고, 예를 들면 인접틀내 문자행만을 사용해도 좋다. 이와 같이 하는 것으로, 항목명이 출현하는 위치가 한정되어 있는 전표 등은 보다 정확한 항목명추출, 정의데이터작성을 행하는 것이 가능하게 된다.
이상 설명한 바와 같이, 개시한 기술에 의해 전표정의데이터의 작성을 할 수 있는 만큼 자동화 하고, 자동화 할 수 없는 처리에 관해서는 부분적으로 사람의 손의 개입을 행하는 것으로, 보다 원활하게 전표정의데이터작성을 지원할 수가 있다.
유저가 정의데이터를 수정하거나 추가하거나 할 때에 자동설정되어 있는 항목이나 미설정항목 등을 표시장치로 색으로 구분함으로써, 유저에 알기 쉬운 화면구성으로 할 수가 있다. 또, 자동으로 설정한 항목중, 애매성이 높은 항목도 동일하게 색으로 구분하는 것으로, 유저에 주의를 재촉할 수가 있다.
또한, 특정한 전표 혹은 기입 마친 것, 미기입에 관계없이, 여러가지 전표라도 전표정의데이터의 자동작성을 가능하게 할 수가 있다.
이상, 개시한 기술은 실시예에 한정되지 않고, 그 취지를 일탈하지 않는 범위에서 각가지의 구성을 취한다는 것은 말할 것도 없다. 예를 들면, 이상의 제어처리는 소프트웨어로 실현하는 이외, 하드웨어로 실현하는 것으로 해도 좋다. 또, 전표정의데이터의 작성을 전표처리장치의 문자인식수단이 실시하도록 구성하는 것도 가능하다.
개시한 기술에 의하면, 특정의 전표 혹은 기입된 것, 미기입된 것에 관계없이, 여러가지의 전표이라도 전표정의데이터의 자동작성을 가능하게 할 수가 있다.

Claims (10)

  1. 전표정의데이터 작성방법에 있어서,
    전표의 이미지데이터를 취득하고,
    당해 이미지데이터로부터 문자정보의 레이아웃정보를 추출하고,
    상기 취득한 전표의 이미지데이터상의 조작자에 의해서 지정된 정의영역에 대응하는 상기 레이아웃정보로부터 당해 정의 영역의 위치에 관한 제 1 정의데이터를 추출하고,
    상기 정의영역의 주변 혹은 내부에 존재하는 문자정보를 인식하고,
    인식결과를 당해 정의영역의 속성에 관한 제 2 정의데이터로 변환하는 것을 특징으로 하는 전표정의데이터 작성방법.
  2. 청구항 1에 있어서,
    상기 정의영역의 부근에서 상기 문자정보의 존재를 검사하고,
    검사의 결과, 상기 정의영역의 부근에서 문자정보의 존재를 검출하지 않는 경우, 당해 정의영역의 내부에서 문자정보의 존재를 검사하고,
    검사결과, 상기 정의영역의 내부에도 문자정보의 존재를 검출하지 않는 경우, 당해 정의영역의 위 방향 및 좌측 방향에 위치하는 문자정보의 존재를 검사하는 것을 특징으로 하는 전표정의데이터 작성방법.
  3. 청구항 1에 있어서,
    상기 정의영역이 열방향에 연속할 경우, 각 정의영역에 대응하는 상기 레이아웃정보로부터 당해 각 정의영역의 위치에 관한 제 1 정의데이터를 추출하고, 상기 제 2 정의데이터를 상기 각 정의영역의 속성에 관한 제 2 정의데이터로서 복사하는 것을 특징으로 하는 전표정의데이터 작성방법.
  4. 청구항 1에 있어서,
    상기 레이아웃정보가 오류일 경우, 수정된 정보를 기초로 다시 레이아웃정보를 추출하는 것을 특징으로 하는 전표정의데이터 작성방법.
  5. 청구항 1에 있어서,
    상기 정의영역에 대응하는 상기 레이아웃정보로부터 당해 정의영역내의 각 틀에 있어서의 종횡비를 구함으로써 문자틀의 유무를 판정하고, 문자틀이라고 판정한 경우에는 문자틀수를 계산하고 문자수의 정의데이터를 추출하는 것을 특징으로 하는 전표정의데이터 작성방법.
  6. 전표의 이미지데이터에 기초하여 기입된 내용의 문자인식처리를 행할 때에 이용되는 정의데이터의 작성을 행하는 전표처리장치에 있어서,
    전표의 이미지데이터를 취득하는 수단과,
    상기 이미지데이터에 대하여 틀, 괘선 및 문자행 등의 레이아웃 해석정보를 추출하는 수단과,
    상기 취득한 전표의 이미지데이터상의 조작자에 의해서 지정된 정의영역에 대응하는 상기 레이아웃 해석정보로부터 당해 정의영역의 위치에 관한 정의데이터를 추출하는 수단과,
    상기 정의영역주변 혹은 내부에 존재하는 틀 및 문자행으로부터 당해 정의영역의 항목명을 추출하는 수단과,
    상기 항목명의 문자인식을 행하는 수단과,
    상기 문자인식처리에 의해 얻어진 인식결과를 항목명사전과 조합하는 수단과,
    상기 조합결과로부터 얻어진 항목명을 당해 정의영역의 속성을 나타내는 정의데이터로 변환하는 수단과,
    상기 정의데이터를 정리해서 전표정의데이터파일로 출력하는 수단을 갖는 것을 특징으로 하는 전표처리장치.
  7. 청구항 6에 있어서,
    상기 레이아웃 해석정보가 오류일 경우, 수정된 레이아웃 해석수정정보를 기초로 다시 레이아웃 해석처리를 행함으로써, 괘선이나 틀 등의 레이아웃 해석정보를 수정하는 수단을 갖는 것을 특징으로 하는 전표처리장치.
  8. 삭제
  9. 삭제
  10. 삭제
KR1020040002535A 2003-02-24 2004-01-14 전표정의데이터 작성방법 및 전표처리장치 KR100570224B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2003-00045406 2003-02-24
JP2003045406A JP4183527B2 (ja) 2003-02-24 2003-02-24 帳票定義データ作成方法および帳票処理装置

Publications (2)

Publication Number Publication Date
KR20040078046A KR20040078046A (ko) 2004-09-08
KR100570224B1 true KR100570224B1 (ko) 2006-04-11

Family

ID=33112215

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040002535A KR100570224B1 (ko) 2003-02-24 2004-01-14 전표정의데이터 작성방법 및 전표처리장치

Country Status (4)

Country Link
JP (1) JP4183527B2 (ko)
KR (1) KR100570224B1 (ko)
CN (1) CN1525378A (ko)
TW (1) TW200416583A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018151805A (ja) * 2017-03-13 2018-09-27 日本電気株式会社 データ項目名推定装置、データ項目名推定方法、及びプログラム

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4973063B2 (ja) * 2006-08-14 2012-07-11 富士通株式会社 表データ処理方法及び装置
CN101464951B (zh) * 2007-12-21 2012-05-30 北大方正集团有限公司 图像识别方法及系统
JP2012009000A (ja) * 2010-05-24 2012-01-12 Pfu Ltd 帳票処理システム、ocr装置、ocr処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法
JP5583542B2 (ja) 2010-05-24 2014-09-03 株式会社Pfu 帳票処理システム、ocr装置、ocr処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法
JP5561856B2 (ja) * 2010-05-24 2014-07-30 株式会社Pfu 帳票作成装置、帳票作成プログラム、および帳票作成方法
JP2012009005A (ja) * 2010-05-24 2012-01-12 Pfu Ltd 帳票処理システム、ocr装置、ocr処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法
JP5556524B2 (ja) 2010-09-13 2014-07-23 株式会社リコー 帳票処理装置、帳票処理方法、帳票処理プログラム、及びそのプログラムを記録した記録媒体
JP2012083951A (ja) * 2010-10-12 2012-04-26 Pfu Ltd 情報処理装置、情報処理方法及びプログラム
JP2013109690A (ja) * 2011-11-24 2013-06-06 Oki Electric Ind Co Ltd 帳票データ入力装置及び帳票データ入力方法
JP6040990B2 (ja) * 2012-10-15 2016-12-07 富士通株式会社 帳票作成支援装置、帳票作成支援方法、及び帳票作成支援プログラム
CN102930174B (zh) * 2012-11-20 2015-07-01 江苏省疾病预防控制中心 居民健康信息采集系统及采集方法
CN103092625B (zh) * 2013-01-28 2016-01-20 中国航空结算有限责任公司 一种基于.NET Framework平台的处理民航客运客票票证数据的方法和装置
JP6109688B2 (ja) * 2013-09-06 2017-04-05 株式会社東芝 帳票読取装置およびプログラム
CN104391830A (zh) * 2014-10-24 2015-03-04 华迪计算机集团有限公司 单据页面动态布局的方法及装置
CN107533651B (zh) * 2015-05-11 2021-05-04 株式会社东芝 识别装置、识别方法及计算机可读取的记录介质
JP6445645B1 (ja) * 2017-09-21 2018-12-26 株式会社東芝 帳票情報認識装置および帳票情報認識方法
CN109634606A (zh) * 2018-12-10 2019-04-16 山东浪潮通软信息科技有限公司 一种定义功能菜单的方法及装置
JP7259468B2 (ja) 2019-03-25 2023-04-18 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2020167618A (ja) * 2019-03-29 2020-10-08 キヤノン株式会社 画像処理装置、その制御方法及びプログラム
CN111931473A (zh) * 2019-05-13 2020-11-13 阿里巴巴集团控股有限公司 票据的处理方法及装置
JP7468004B2 (ja) 2020-03-11 2024-04-16 富士フイルムビジネスイノベーション株式会社 帳票処理装置及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018151805A (ja) * 2017-03-13 2018-09-27 日本電気株式会社 データ項目名推定装置、データ項目名推定方法、及びプログラム

Also Published As

Publication number Publication date
JP4183527B2 (ja) 2008-11-19
JP2004258706A (ja) 2004-09-16
TW200416583A (en) 2004-09-01
KR20040078046A (ko) 2004-09-08
CN1525378A (zh) 2004-09-01

Similar Documents

Publication Publication Date Title
KR100570224B1 (ko) 전표정의데이터 작성방법 및 전표처리장치
US8270721B2 (en) Method and system for acquiring data from machine-readable documents
US7926732B2 (en) OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
US7668372B2 (en) Method and system for collecting data from a plurality of machine readable documents
US6707466B1 (en) Method and system for form recognition and digitized image processing
US6208744B1 (en) Document image processor and method for setting a document format conforming to a document image
JPH04343190A (ja) 文字データ入力方式
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JPH08305778A (ja) ユーザの作成したマークの存在を調査するための方法
JP6859977B2 (ja) 画像処理装置、画像処理システム、画像処理方法およびプログラム
US6600482B1 (en) Method and system for form recognition and digitized image processing
JP2835178B2 (ja) 文書読取装置
JPH1011531A (ja) 帳票読取装置
JP2008059157A (ja) 書類確認支援システム、書類確認支援装置およびプログラム
US5950213A (en) Input sheet creating and processing system
JP2003018393A (ja) 画像処理システム
WO2001052519A1 (en) A method and system for form recognition and digitized image processing
JP6190549B1 (ja) 文書処理システム
JP3484446B2 (ja) 光学文字認識装置
JP6960646B1 (ja) 読取システム、読取プログラムおよび読取方法
JP6994727B1 (ja) 読取システム、読取プログラムおよび読取方法
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
JP4213558B2 (ja) 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置
CN117391045B (zh) 可复制蒙文的可携带文件格式文件输出方法
JP2682873B2 (ja) 表形式文書の認識装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20100402

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee