KR100351171B1 - 전표종별 판별방법 및 그 장치 - Google Patents

전표종별 판별방법 및 그 장치 Download PDF

Info

Publication number
KR100351171B1
KR100351171B1 KR1020000050521A KR20000050521A KR100351171B1 KR 100351171 B1 KR100351171 B1 KR 100351171B1 KR 1020000050521 A KR1020000050521 A KR 1020000050521A KR 20000050521 A KR20000050521 A KR 20000050521A KR 100351171 B1 KR100351171 B1 KR 100351171B1
Authority
KR
South Korea
Prior art keywords
keyword
type
document
keywords
extracted
Prior art date
Application number
KR1020000050521A
Other languages
English (en)
Other versions
KR20010076183A (ko
Inventor
이마이즈미아츠히로
테라모토마사토
야스에쯔카사
Original Assignee
가부시키가이샤 히타치세이사쿠쇼
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시키가이샤 히타치세이사쿠쇼 filed Critical 가부시키가이샤 히타치세이사쿠쇼
Publication of KR20010076183A publication Critical patent/KR20010076183A/ko
Application granted granted Critical
Publication of KR100351171B1 publication Critical patent/KR100351171B1/ko

Links

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07FCOIN-FREED OR LIKE APPARATUS
    • G07F19/00Complete banking systems; Coded card-freed arrangements adapted for dispensing or receiving monies or the like and posting such transactions to existing accounts, e.g. automatic teller machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

본 발명은 전표종별 판별방법 및 그 장치에 관한 것으로서, 입력된 전표가 소정의 전표종별중 어느 것인지를 판정하기 위한 전표종별 판별방법 및 그 장치에 있어서, 키워드의 쌍을 소정의 전표종별마다 한쌍으로 키워드 등록부에 미리 등록하고, 입력된 전표의 이미지데이터를 판독하여, 판독한 이미지데이터로부터 문자열을 추출하여 추출한 각 문자열에 대해 문자인식을 수행하고, 문자인식된 문자열의 각각을 키워드로서 추출하고, 추출한 키워드와 키워드 등록부에 등록된 키워드의 쌍을 전표종별마다 조합함으로써 입력된 전표의 종별을 판별하는 기술이 제시된다.

Description

전표종별 판별방법 및 그 장치{METHOD AND APPARATUS FOR DETERMINING FORM SHEET TYPE}
본 발명은, 현금자동거래장치 등에 이용하는 전표종별 판별장치에 관한 것으로서, 특히 전표의 이미지 데이터를 판독하여 그 판독한 이미지 데이터로부터 문자열을 추출하여 전표의 종별을 판별하는 전표종별 판별방법, 전표종별 판별 프로그램을 수록한 기록매체 및 그 장치에 관한 것이다.
현금자동거래장치 등의 자동기는, 자동불입 이용신청서를 이용한 자동불입, 계좌이체표를 이용한 공공요금의 대체, 혹은 보통예금 입금표를 이용한 입금처리 등의 각종 처리를 자동처리한다. 이 때, 상기 자동기는 이용자가 삽입한 자동불입이용신청서 등의 전표류의 종별을 자동판별할 필요가 있다. 전표종별의 판별방법으로서 가장 일반적인 방법은, 각 전표의 공통되는 위치에 전표종별을 나타내는 ID번호, 바코드 정보, 마크 등의 식별가능한 정보를 부가하여, 그 정보를 판독함으로써 전표종별을 판별하는 방법이다.
또한, 상기 부가정보를 필요로 하지 않는 판별방법으로는, 전표 상의 특정위치에 있는 문자열 혹은 마크 등을 판독함으로써 전표종별을 판별하는 방법, 혹은 전표 상의 괘선의 위치, 형상을 판독함으로써 전표종별을 판별하는 방법이 알려져 있다.
그러나, 상기 ID 번호, 바코드 정보, 마크 등의 부가정보를 판독함으로써 전표종별을 판별하는 방법은, 대상으로 하는 전표를 새롭게 레이아웃하여 작성하는 경우에만 효과적인 방법으로서, 기존의 전표종별을 판별하는 경우에 적용할 수는 없다. 또한, 전표 상의 특정한 위치에 있는 문자나 마크 등을 판독함으로써 전표종별을 판별하는 방법, 혹은 전표 상의 괘선의 위치, 형상을 판독함으로써 전표종별을 판별하는 방법은, 전표 레이아웃의 변경이나 마크 형상이 변경되면 전표종별을 판별할 수 없게 된다. 또한, 이들 방법으로는 인쇄가 약간 어긋나게 된 전표 혹은 판독장치의 스캔속도의 변동 등에 의해 화상판독이 불안정하게 될 우려가 있다.
본 발명의 목적은, 상기 여러 문제점들을 해결하여 전표의 물리적인 레이아웃의 변동에 대응가능한 전표종별의 자동판별방법 및 그 장치와, 또한 그와 같은 방법을 실시하는 컴퓨터가 읽을 수 있는 프로그램을 수록한 기록매체를 제공하는 데에 있다.
상기 과제를 달성하기 위하여, 본 발명의 일측면에 의한 전표종별의 판별방법에서는, 입력된 전표 상의 문자열을 문자인식하여 키워드로서 추출하고, 이들 키워드를 미리 전표종별마다 1쌍으로 키워드 등록부에 등록한 복수쌍의 키워드로 조합함으로써 상기 입력한 전표의 종별을 판별한다.
본 발명의 한 실시예에 의한 전표종별의 판별방법에서는, 입력된 전표의 이미지 데이터를 판독하고, 그 판독한 이미지 데이터로부터 문자열을 추출하여 추출한 각 문자열에 대해 문자인식을 수행한다. 이어서, 문자인식한 각 문자열로 이루어지는 키워드의 각각과 미리 등록한 소정의 전표종별 마다의 키워드의 쌍을 조합하여 전표의 종별을 판별한다.
또한, 본 발명의 한 실시예에 있어서, 전표의 이미지 데이터를 판독하고 그 판독한 이미지 데이터로부터 문자열을 추출할 때, 문자인식한 각 문자열로 이루어지는 키워드의 각각을, 데이터 베이스에 격납된 기준문자열 패턴데이터의 각각과 조합하여, 어느 하나의 기준문자열 패턴과 적어도 부분적으로 일치하는 문자인식한 문자열을 각각 키워드로서 추출한다. 기준문자열 패턴데이터는 전표의 종별을 나타내는 문자열이 포함되는 문자인식된 문자열을 추출하기 위한 것이다. 이어서, 추출한 키워드와 전표종별마다 설치한 파일의 각각에 등록된, 특정의 전표종별을 판별하기 위한 키워드를 조합하여 전표의 종별을 판별한다.
도 1은 본 발명의 한 실시예인 전표종별의 자동판별방법의 순서도이다.
도 2A∼2C는 각각 전표종별 파일의 내용을 설명하기에 유용한 도이다.
도 3은 문자패턴 데이터베이스의 내용을 설명하기에 유용한 도이다.
도 4는 키워드에 부여하는 중요도 값을 설명하는 도이다.
도 5는 전표의 확실성에 대한 값의 계산예를 나타내는 도이다.
도 6은 추출한 키워드를 조합하여 새로운 키워드를 생성하는 순서를 설명하기에 유용한 도이다.
도 7은 새로운 키워드 생성의 구체예를 나타내는 도이다.
도 8은 본 발명의 다른 실시예인 전표종별의 자동판별장치의 구성을 나타내는 도이다.
<도면의 주요부분에 대한 부호의 설명>
1∼3, 1b : 전표 11∼13, 11a : 전표종별 파일
31 : 데이터베이스 71 : 키워드 단어군
72 : 새로운 키워드 단어군 81 : 화상입력부
82 : 문자인식부 83 : 키워드 추출부
85 : 전표종별 판별부 86 : 전표종별 키워드 등록부
이하에 본 발명의 실시예를 도 1 내지 도 5를 이용하여 설명하기로 한다.
도 1은 본 실시예에 관한 전표종별 판별방법, 전표종별판별 프로그램 및 전표종별 자동판별장치의 처리를 설명하는 도이다. 우선, 단계 1에 있어서, 전표종별 판별장치의 판별대상이 되는 소정의 전표 각각으로부터 추출한 전표종별 판별용 키워드를 전표종별마다 설치한 파일에 등록한다.
도 2A∼2D는, 본 발명인 전표종별 판별장치의 판별대상이 되는 전표, 및 상기 전표로부터 추출한 전표종별 판별용 키워드 단어를 등록한 전표종별 파일의 내용을 나타내는 도이다. 도에 있어서, 1 내지 3은 전표로서, 전표 1은 「자동불입용지(은행보관용)」, 전표 2는「보통예금 입금표」, 전표 3은「전기요금」의 불입용지이다. 또한, 11 내지 13은 전표 1 내지 3에 각각 대응한 전표종별 파일이며, 전표 1 내지 3으로부터 각각 전표의 종별을 일의로 결정할 수 있도록 선택한 복수의키워드와, 상기 키워드의 각각에 그 중요도에 따라 부여된 중요도 값을 등록하고 있다. 상기 중요도는 다시말해 키워드 그 자체에 의존한 중요도이다.
예를들어, 전표 1은「자동불입 이용신청서(은행보관용)」으로, 키워드로서 「자동불입 이용신청서」,「은행보관용」,「계좌번호」및 은행명 「△○은행」을 추출하고, 추출한 키워드마다 각각 단어의 중요도 값 「5」,「1」,「3」 및 「3」을 부여하여, 부여한 파일을 전표종별 파일(11)로서 등록하고 있다. 즉, 키워드 「자동불입 이용신청서」는 전표종별의 판별에 가장 중요하기 때문에 중요도 값「5」를 부여하고 있다.
다음으로, 단계 2에 있어서 전표종별 판별장치의 판별대상이 되는 전표(1a)의 이미지화상을 판독한다. 이미지 화상은 2값화 화상이 바람직하지만, 다값화 화상 혹은 칼라화상이라도 좋다. 또한, 화상판독에 사용하는 광전변환수단으로는, 카메라나 CCD 센서 등의 판독수단을 이용할 수 있다.
다음으로, 단계 3에 있어서, 판독한 이미지 화상중 모든 문자열을 추출한다. 문자열을 추출할 때에는 연결화소의 크기 혹은 형상 등의 정보를 이용할 수 있다.
다음으로, 단계 4에 있어서, 이미지 화상으로부터 추출한 모든 문자열의 각각에 대하여 문자인식을 수행한다.
다음으로, 단계 5에 있어서, 문자인식의 결과 얻어진 문자열 중에서 문자열패턴 데이터베이스(31)를 이용하여 전표종별판별의 키워드가 되는 키워드를 추출한다. 또한, 전표종별 파일(11∼13)은 상기 데이터베이스(31)에 격납하여도 좋다.
도 3은 문자열패턴 데이터베이스(31)의 내용을 나타내는 도이다. 문자열패턴데이터베이스(31)에는, 도에 나타낸 바와 같이, 「*신청서」,「*요금」,「*은행」,「*세금」,「성명」,「확인도장」,「계좌번호」,「은행보관용」등의 문자열패턴이 기준 문자열패턴으로서 등록되어 있다. 상기 문자인식한 결과 얻어진 문자열의 각각과, 상기 문자열패턴 데이터베이스에 등록되어 있는 문자열패턴을 조합하여 적어도 일부가 어느 하나의 문자열패턴과 일치하는 문자열을 키워드로서 추출한다. 예를들어, 문자인식한 결과인 「자동불입 이용신청서(은행보관용)」과, 문자열패턴 데이터베이스(31)에 등록되어 있는 문자열패턴 「*신청서」를 조합하면, 「자동불입 이용신청서」를 키워드로서 추출할 수 있다. 또한, 「*신청서」등의 *마크는 「신청서」를 포함하는 문자열은 모두 키워드로서 추출하는 것을 나타낸다.
다음으로, 매칭처리 단계 6에 있어서, 상기 추출한 키워드에 글자종의 중요도 값 및 위치의 중요도 값을 부여하고, 상기 중요도 값이 부여된 상기 키워드와, 단계 1에 있어서 전표종별 파일에 등록한 중요도를 부가한 키워드와의 조합을 수행하여, 확실성의 값을 구해 전표종별의 판별을 수행한다.
상기 단계에 있어서는, 우선 추출한 키워드에 중요도 값을 부여한다. 도 4는 키워드 단어에 부여하는 중요도 값을 설명하는 도이다. 추출한 키워드 단어에 대하여 그 글자종에 따른 중요도 값을 부여한다. 키워드 단어의 글자종은, 주지의 문자열의 직선성이나 문자의 간격과 같은 특징을 검출하여 활자인지 손으로 쓴 것인지를 판별하며, 판별한 글자종에 따라서 키워드 단어의 중요도를 부여한다. 본 실시예에서는, 전표종별의 판별을 위하여 활자만을 사용하고 손으로 쓴 문자는 사용하지 않기로 하고 있기 때문에, 활자문자라면 중요도 값을 1로 하고, 수기문자라면중요도 값을 0으로 한다.
또한, 추출한 키워드 단어가 전표 내에서 기재되어 있던 위치에 따라 중요도를 부여한다. 본 실시예에서는, 도 4에 나타낸 바와 같이 전표를 종방향으로 등간격으로 10의 영역으로 분할하고, 전표의 상부에 기재된 문자열일수록 그 전표를 특징지우는 문자열이 많은 것으로 하여, 제일 상부인 영역에는 10의 중요도 값을 부여하고, 이하 키워드 단어의 기재영역에 따라서 9에서 1까지의 위치의 중요도 값을 부여한다. 또한, 대상으로 하는 전표에 따라 임의로 위치의 중요도를 부여하여도 물론 상관없다.
다음으로, 전표종별의 판별을 수행한다. 전표종별을 판별할 때에는 상기 글자종의 중요도 값 및 위치의 중요도 값이 부여된 상기 키워드와, 전표종별 파일에 등록된 중요도의 키워드와의 조합을 수행하여, 확실성의 값을 구하여 전표종별을 판별한다.
본 실시예에서는, 이하의 계산식을 이용하여 전표의 확실성의 값을 구한다.
K = 추출 키워드의 문자종별에 의한 중요도
P = 추출 키워드의 기재위치에 의한 중요도
J = 전표종별 파일에 등록되어 있는 중요도
확실성의 값 = K × P × J
전표의 확실성의 값에 대한 계산은, 조합하는 모든 단어에 대하여 상기 계산식에 의해 확실성의 값을 구하고, 구한 값의 합계를 전표의 확실성의 값으로 하여 확실성의 값이 가장 높은 전표를 입력화상의 전표종별로서 판별한다.
도 5는 전표의 확실성의 값의 계산예를 나타내는 도이다. 도에 있어서, 입력된 전표의 종별이 전표 1이라는 확실성의 값과, 전표 2라는 확실성의 값과, 전표 3이라는 확실성의 값이 각각 72, 9, 12로 되어, 전표 1의 72가 가장 큰 값으로 되어 있다. 따라서, 입력화상의 전표종별을 전표 1이라 판별한다.
상기 실시예에서는, 단계 1에 있어서 상기 전표종별 파일에 등록한 전표종별 판별용 키워드와 단계 5에 있어서 추출한 키워드를 조합하였는데, 단계 5에 있어서 추출한 키워드 대신에, 혹은 그에 덧붙여 단계 5에 있어서 추출한 키워드를 복수 조합(組合)하여 생성한 새로운 키워드를 조합하여 사용하여도 좋다.
도 6은 키워드끼리를 조합하여 새로운 키워드를 형성하는 순서를 설명하는 도아다. 도에 있어서 1b는 판별대상이 되는 전표, 11a는 전표종별 파일이다. 새로운 키워드를 생성할 때, 우선 판별대상이 되는 전표(1b)로부터 키워드「평성 OO년」,「납세통지서」…「○×시」,「시장」을 추출한다(단계 5). 계속해서 추출한 키워드 「평성 OO년」,「납세통지서」…「○×시」,「시장」을 조합하여, 예를들어 「○×시 납세통지서」(60)를 새로운 키워드로서 생성한다(단계 10). 계속해서 상기 새로운 키워드를 상기 전표종별 파일(11a)에 등록한 전표종별 판별용 키워드와 조합하여(단계 6) 전표(1b)의 전표종별을 판별한다. 또한, 단계 10은 도 1의 단계 5와 6 사이에 설치하여도 좋으며, 혹은 단계 5에 포함시켜도 좋다.
도 7은 새로운 키워드 단어군을 형성하는 방법을 설명하는 도이다.
도에 있어서, 71은 단계 5에 있어서 추출한 키워드 단어이다.
키워드 단어군(71)의 2개 또는 복수의 키워드 단어를 조합하여 새로운 키워드 단어를 형성한다. 이 때, 키워드 단어군(71)의 단어 중에서 모든 조합방법으로 형성한 새로운 단어를 새로운 키워드 단어군(72)으로 한다.
도 8은 본 발명의 다른 실시예인 전표종별 판별장치의 구성을 나타내는 블럭도이다.
도 8에 있어서, 화상입력부(81)는, 전표종별 판별장치의 판별대상이 되는 전표의 이미지 화상을 판독한다. 화상판독에 사용하는 광전변환수단으로는, 카메라나 CCD 센서 등의 판독수단을 사용할 수 있다.
문자인식부(82)는, 입력한 이미지 화상으로부터 문자열을 추출하고, 추출한 문자열의 문자인식을 수행한다.
키워드 추출부(83)는, 문자인식의 결과 얻어진 문자열 중에서 전표종별 판별에 유용한 키워드를 추출한다.
전표종별 판별부(조합부)(85)는, 미리 등록해 둔 전표종별 키워드 등록부(86)에 격납된 전표종별 파일(11∼13)(도 2)에 등록된 각 키워드와 추출한 키워드를 전표종별마다 조합하여 전표의 종별을 판정한다.
본 실시예의 전표종별 판별장치의 동작은 상술한 바와 같기 때문에, 여기서는 상세한 설명은 생략하기로 한다.
이상과 같이 본 발명에 의하면, 전표종별을 판별하기 위하여 임의의 위치에 있는 단어를 자동추출하여 문자인식하고, 전표종별 정보에 기재된 단어군과 조합함으로써 전표식별을 수행하기 때문에, 적어도 다음과 같은 효과를 볼 수 있다.
전표에 대하여 바코드, ID 번호 등의 새로운 정보를 부가하지 않아도 전표종별을 판별할 수 있게 된다.
전표 레이아웃의 변경, 전표 폰트의 변경이 있어도, 전표종별을 판별할 수 있게 된다.
전표의 인쇄가 고르지 못해 어긋남이 있어도 전표종별을 판별할 수 있게 된다.
전표판별을 위한 전표의 특징정보의 등록을 용이하게 수행할 수 있다. 또한, 전표판별시의 특징정보를 기억하는 격납영역을 줄일 수 있다.
전표 내의 임의의 위치의 문자열을 이용하기 때문에, 전표종별 판별을 수행하는 자유도가 높아지고, 동시에 판별가능한 전표의 종별을 증가시킬 수 있다.
또한, 본 발명에 의하면, 전표의 물리적인 레이아웃의 변동에 대응가능한 전표종별의 자동판별장치를 제공할 수 있다.
또한, 상술한 바에 비추어 본 발명을 다양하게 수정하여 변형할 수 있음이 명백히 밝혀졌다. 따라서, 그와 같은 수정과 변형은 본 발명의 특허청구범위에서 벗어나는 것이 아니라 본 발명에 속하는 것이다. 예를들어, 전표종별 키워드 등록부(86)는 데이터베이스(31)의 일부로 하여도 좋다.

Claims (36)

  1. 입력된 전표상의 각 문자열을 문자인식하여 키워드로서 추출하고(단계 5),
    상기 키워드(복수)를 미리 소정의 전표종별마다 한쌍으로 키워드 등록부에 등록한 키워드의 쌍(복수)과 조합함으로써(단계 6), 상기 입력한 전표의 종별을 판별하는 것을 특징으로 하는 전표종별 판별방법.
  2. 청구항 1에 있어서,
    상기 미리 등록된 키워드 쌍 내의 각 키워드는 소정의 중요도와 대응시켜 상기 키워드 등록부에 등록되어 있으며(도 2),
    상기 조합하는 단계(단계 6)에서는, 상기 입력된 전표의 상기 추출된 키워드의 각각에 각각 중요도를 부여하고(도 6),
    상기 추출한 키워드(복수)의 상기 중요도(복수)와 상기 키워드 등록부 내의 상기 전표종별 마다의 한쌍의 키워드의 상기 소정의 중요도를 사용하여,
    상기 입력된 전표와 상기 소정의 전표종별(복수)과의 매칭정도를 소정의 전표종별마다 평가하여(도 5), 가장 매칭정도가 높은 소정의 전표종별을 상기 입력된 전표의 종별이라고 판정하는 것을 특징으로 하는 전표종별 판별방법.
  3. 청구항 2에 있어서,
    상기 미리 등록된 키워드 쌍 내의 각 키워드의 상기 소정의 중요도는, 키워드 의존의 중요도인 것을 특징으로 하는 전표종별 판별방법.
  4. 청구항 2에 있어서,
    상기 입력된 전표의 상기 추출한 키워드 각각에 부여된 중요도는, 적어도 상기 키워드를 구성하는 문자의 종별을 바탕으로 하는 중요도와 상기 키워드의 상기 입력된 전표상의 위치를 바탕으로 하는 중요도를 포함하는 것을 특징으로 하는 전표종별 판별방법.
  5. 입력된 전표가 소정의 전표종별중 어느 것인가를 판정하기 위한 전표종별 판별방법에 있어서,
    키워드의 쌍(복수)을 소정의 전표종별마다 한쌍으로 키워드 등록부에 미리 등록하는 단계(단계 1)와,
    입력된 전표의 이미지데이터를 판독하는 단계(단계 2)와,
    상기 판독한 이미지데이터로부터 문자열(복수)을 추출하는 단계(단계 3)와,
    상기 추출한 각 문자열에 대해 문자인식을 수행하는 단계(단계 4)와,
    상기 문자인식된 문자열의 각각을 키워드(도 4)로서 추출하는 단계(단계 5)와,
    상기 추출한 키워드(복수)와 상기 키워드 등록부에 등록된 상기 키워드의 쌍을 전표종별마다 조합하는 단계(단계 6)를 가짐으로써,
    상기 입력된 전표의 종별을 판정하는 것을 특징으로 하는 전표종별 판별방법.
  6. 청구항 5에 있어서,
    상기 등록부에서는 상기 키워드 쌍(복수) 내의 상기 각 키워드는 각각 소정의 중요도와 대응시켜 등록되어 있으며(도 2),
    상기 조합하는 단계(단계 6)에서는, 상기 입력전표의 상기 추출된 키워드의 각각에 각각 중요도를 부여하고,
    상기 추출한 키워드(복수)의 상기 중요도(복수)와 상기 키워드 등록부 내의 상기 키워드 쌍 내의 각 키워드의 상기 소정의 중요도를 사용하여,
    상기 입력된 전표와 상기 소정의 전표종별(복수)과의 매칭정도를 전표종별마다 평가하여, 가장 매칭정도가 높은 전표종별을 상기 입력전표의 종별이라고 판정하는 것을 특징으로 하는 전표종별 판별방법.
  7. 청구항 6에 있어서,
    상기 입력된 전표의 상기 추출한 키워드 각각에 부여된 중요도는, 상기 키워드를 구성하는 문자의 종별에 바탕을 둔 중요도인 것을 특징으로 하는 전표종별 판별방법.
  8. 청구항 6에 있어서,
    상기 입력전표의 상기 추출된 키워드 각각에 부여된 중요도는, 상기 키워드의 상기 입력된 전표상의 위치에 바탕을 둔 중요도인 것을 특징으로 하는 전표종별 판별방법.
  9. 청구항 6에 있어서,
    상기 등록된 키워드 쌍 내의 각 키워드의 상기 소정의 중요도는, 키워드 의존의 중요도인 것을 특징으로 하는 전표종별 판별방법.
  10. 청구항 8에 있어서,
    상기 입력된 전표의 상기 추출한 키워드 각각에 부여된 상기 전표상의 위치를 바탕으로 하는 중요도는, 상기 키워드의 상기 입력된 전표상의 위치가 그 전표에서 보다 상부에 있을수록 큰 중요도가 부여되도록 되어 있는 것을 특징으로 하는 전표종별 판별방법.
  11. 청구항 6에 있어서,
    상기 입력된 전표의 상기 추출한 키워드 각각에 부여된 중요도는, 그 키워드를 구성하는 문자의 종별에 바탕을 둔 중요도와 그 키워드의 상기 입력된 전표상의 위치에 바탕을 둔 중요도를 포함하는 것을 특징으로 하는 전표종별 판별방법.
  12. 청구항 5에 있어서,
    상기 추출하는 단계에서 추출된 키워드로부터 임의의 2개 이상의 키워드를꺼내어, 그 꺼낸 키워드를 조합하여 하나 이상의 새로운 키워드를 형성하는 단계(단계 10)를 가지며,
    상기 조합하는 단계(단계 6)는, 상기 추출된 키워드 및 상기 형성된 새로운 하나 이상의 키워드를 상기 키워드 등록부에 등록된 상기 키워드 쌍(복수)과 전표종별마다 조합하여, 상기 입력된 전표의 종별을 판정하는 것을 특징으로 하는 전표종별 판별방법.
  13. 입력된 전표가 소정의 전표종별중 어느 것인가를 판정하기 위한 전표종별 판별방법에 있어서,
    키워드의 쌍(복수)을 전표종별마다 한쌍으로 미리 키워드 등록부에 등록하는 단계(단계 1)와,
    입력된 전표의 이미지데이터를 판독하여, 상기 판독한 이미지데이터로부터 문자열(복수)을 추출하고, 상기 추출한 각 문자열에 대해 문자인식을 수행하는 단계(단계 4)와,
    상기 문자인식된 문자열(복수)과 데이터베이스에 미리 격납된 기준 문자열패턴(복수)을 조합하는 단계(단계 6)와,
    상기 기준 문자열패턴(복수)의 임의의 하나와 적어도 부분적으로 각각이 일치하는 문자인식된 문자열의 각각을 키워드(도 4)로서 추출하는 단계(단계 5)와,
    상기 추출한 키워드(복수)와 상기 키워드 등록부에 등록된 상기 키워드 쌍(복수)을 전표종별마다 조합하는 단계(단계 6)를 가짐으로써,
    상기 입력된 전표의 종별을 판정하는 것을 특징으로 하는 전표종별 판별방법.
  14. 청구항 13에 있어서,
    상기 추출하는 단계(단계 5)에서 추출된 키워드로부터 임의의 2개 이상의 키워드를 꺼내어, 그 꺼낸 키워드를 조합하여 하나 이상의 새로운 키워드를 형성하는 단계(단계 10)를 가지며,
    상기 조합하는 단계(단계 6)는, 상기 추출된 키워드 및 상기 형성된 하나 이상의 새로운 키워드를 상기 키워드 등록부에 등록된 상기 키워드 쌍(복수)과 전표종별마다 조합함으로써, 상기 입력된 전표의 종별을 판정하는 것을 특징으로 하는 전표종별 판별방법.
  15. 입력된 전표가 소정의 전표종별중 어느 것인가를 판정하기 위한 전표종별 판별장치에 있어서,
    키워드 쌍을 소정의 전표종별(도 2의 1, 2, 3)마다 한쌍으로 미리 등록한 키워드 등록부(11∼13, 86)와,
    입력된 전표의 이미지데이터를 판독하여, 상기 판독한 이미지데이터로부터 문자열(복수)을 추출하고, 상기 추출한 각 문자열에 대해 문자인식을 수행하는 문자인식부(82)와,
    상기 문자인식부가 인식한 문자열의 각각을 키워드(도 4)로서 추출하는 키워드 추출부(83)와,
    상기 추출한 키워드(복수)와 상기 키워드 등록부에 등록된 상기 키워드 쌍(복수)의 각 쌍의 키워드를 각 소정의 전표종별마다 조합함으로써, 상기 입력된 전표의 종별을 판정하는 조합부(85)를 가지는 것을 특징으로 하는 전표종별 판별장치.
  16. 청구항 15에 있어서,
    상기 조합부에 있어서, 상기 추출한 키워드 각각에는, 그 키워드를 구성하는 문자의 종별에 바탕을 둔 중요도가 부여되는 것을 특징으로 하는 전표종별 판별장치.
  17. 청구항 16에 있어서,
    상기 문자의 종별은 상기 추출한 키워드의 각각이 타이핑된 문자인지 손으로 쓴 문자인지를 구별하는 것을 특징으로 하는 전표종별 판별장치.
  18. 청구항 15에 있어서,
    상기 조합부에 있어서, 상기 추출한 키워드 각각에는, 그 키워드의 상기 입력전표 상의 위치에 의존한 중요도가 부여되는 것을 특징으로 하는 전표종별 판별장치.
  19. 청구항 15에 있어서,
    상기 등록부에 있어서, 상기 키워드의 각 쌍 내의 각 키워드는, 키워드 의존의 중요도와 대응시켜 등록되어 있는 것을 특징으로 하는 전표종별 판별장치.
  20. 청구항 15에 있어서,
    상기 등록부에 있어서, 상기 키워드의 각 쌍 내의 각 키워드는, 소정의 중요도와 대응시켜 등록되어 있으며,
    상기 조합부에 있어서, 상기 입력전표의 상기 추출된 키워드의 각각에는 각각 중요도가 부여되어 있으며,
    상기 추출한 키워드(복수)의 상기 중요도(복수)와 상기 키워드 등록부 내의 상기 키워드 쌍 내의 각 키워드의 상기 소정의 중요도를 사용하여,
    상기 입력전표와 상기 소정의 전표종별(복수)과의 매칭정도를 전표종별마다 평가하여, 가장 매칭정도가 높은 전표종별을 상기 입력전표의 종별이라고 판정하는 것을 특징으로 하는 전표종별 판별장치.
  21. 청구항 20에 있어서,
    상기 입력된 전표의 상기 추출한 키워드 각각에 부여된 상기 중요도는, 상기 키워드를 구성하는 문자의 종별에 바탕을 둔 중요도인 것을 특징으로 하는 전표종별 판별장치.
  22. 청구항 21에 있어서,
    상기 문자의 종별은 상기 추출한 키워드의 각각이 타이핑된 문자인지 손으로 쓴 문자인지를 구별하는 것을 특징으로 하는 전표종별 판별장치.
  23. 청구항 20에 있어서,
    상기 입력전표의 상기 추출된 키워드 각각에 부여된 중요도는, 상기 키워드의 상기 입력된 전표상의 위치에 바탕을 둔 중요도인 것을 특징으로 하는 전표종별 판별장치.
  24. 청구항 20에 있어서,
    상기 등록부에 등록된 키워드의 각 쌍 내의 각 키워드의 상기 소정의 중요도는, 키워드 의존의 중요도인 것을 특징으로 하는 전표종별 판별장치.
  25. 청구항 22에 있어서,
    상기 추출한 키워드의 각각은 그 키워드가 타이핑된 문자인 경우 0보다 큰 중요도가 부여되고, 손으로 쓴 문자인 경우에는 0이 부여됨으로써, 상기 입력된 전표의 상기 추출한 키워드중 하나 이상의 수기문자 키워드는 전표종별의 판정에서 제외되는 것을 특징으로 하는 전표종별 판별장치.
  26. 청구항 23에 있어서,
    상기 입력된 전표의 상기 추출한 키워드 각각에 부여된 중요도는, 상기 키워드의 상기 입력된 전표상의 위치가 그 전표에서 보다 상부에 있을수록 큰 중요도가 부여되도록 되어 있는 것을 특징으로 하는 전표종별 판별장치.
  27. 청구항 20에 있어서,
    상기 입력된 전표의 상기 추출한 키워드 각각에 부여된 중요도는, 그 키워드를 구성하는 문자의 종별에 바탕을 둔 중요도와 그 키워드의 상기 입력된 전표상의 위치에 바탕을 둔 중요도를 포함하는 것을 특징으로 하는 전표종별 판별장치.
  28. 청구항 15에 있어서,
    상기 키워드 추출부(단계 5, 83)에서 추출된 키워드로부터 임의의 2개 이상의 키워드를 꺼내어, 그 꺼낸 키워드를 조합하여 하나 이상의 새로운 키워드를 형성하는 단어형성부를 가지며,
    상기 판정부는, 상기 키워드 추출부에 의해 추출된 상기 키워드 및 상기 형성된 하나 이상의 새로운 키워드를 상기 키워드 등록부에 등록된 상기 키워드 쌍과 전표종별마다 조합함으로써, 상기 입력된 전표의 종별을 판정하는 것을 특징으로 하는 전표종별 판별장치.
  29. 청구항 15에 있어서,
    상기 키워드 등록부는, 각각이 특정 전표를 판별하기 위한 한쌍의 키워드를등록한 전표종별 마다의 파일(11∼13, 11a)을 포함하는 것을 특징으로 하는 전표종별 판별장치.
  30. 입력된 전표가 소정의 전표종별중 어느 것인가를 판정하기 위한 전표종별 판별장치에 있어서,
    키워드 쌍을 전표종별마다 한쌍으로 등록한 키워드 등록부(86)와,
    입력된 전표의 이미지데이터를 판독하여, 상기 판독한 이미지데이터로부터 문자열(복수)을 추출하고, 상기 추출한 각 문자열에 대해 문자인식을 수행하는 문자인식부(82)와,
    기준 문자열 데이터베이스(복수)를 격납한 데이터베이스(84)와,
    상기 문자인식된 문자열(복수)과 상기 기준 문자열패턴(복수)을 조합하여, 상기 기준 문자열패턴(복수)의 임의의 하나와 적어도 부분적으로 각각이 일치하는 문자인식된 문자열의 각각을 키워드(도 4)로서 추출하는 키워드 추출부(단계 5, 83)와,
    상기 추출한 키워드(복수)와 상기 키워드 등록부에 등록된 상기 키워드 쌍을 전표종별마다 조합함으로써, 상기 입력된 전표의 종별을 판정하는 조합부(85)를 가지는 것을 특징으로 하는 전표종별 판별장치.
  31. 청구항 30에 있어서,
    상기 키워드 추출부(단계 5, 83)에서 추출된 키워드로부터 임의의 2개 이상의 키워드를 꺼내어, 그 꺼낸 키워드를 조합하여 하나 이상의 새로운 키워드를 형성하는 단어형성부(단계 10)를 가지며,
    상기 조합부(85)는, 상기 추출된 키워드 및 상기 형성된 하나 이상의 새로운 키워드를 상기 키워드 등록부에 등록된 상기 키워드 쌍과 전표종별마다 조합함으로써, 상기 입력된 전표의 종별을 판정하는 것을 특징으로 하는 전표종별 판별장치.
  32. 키워드의 조를 소정의 전표종별마다 1조로 미리 키워드등록부에 등록하는 스텝과,
    입력된 전표의 이미지데이터를 읽어들이는 스텝과,
    상기 읽어들인 이미지데이터에서 문자열을 추출하는 스텝과,
    상기 추출한 각 문자열에 대해 문자인식을 행하는 스텝과,
    상기 문자인식된 문자열의 각각을 키워드로 추출하는 스텝과,
    상기 추출한 키워드와 상기 키워드등록부에 등록된 상기 키워드의 조를 상기 전표종별마다 조합하는 것에 의해 상기 입력된 전표의 종별을 판정하는 스텝을 갖는 것을 특징으로 하는 입력전표가 소정 전표종별 중 어느 것인지를 판정하기 위한 컴퓨터가 읽을 수 있는 프로그램을 수록한 기록매체.
  33. 청구항 32에 있어서,
    상기 키워드등록부 등록스텝에서 상기 키워드 조내의 각 키워드는 소정의 중요도와 대응시켜 등록되어 있으며,
    상기 추출한 키워드와 상기 키워드등록부에 등록된 상기 키워드의 조를 상기 전표종별마다 조합하는 것에 의해 상기 입력된 전표의 종별을 판정하는 스텝은,
    상기 추출한 키워드(복수)의 각각에 부여된 중요도(복수)와 상기 키워드등록부 내의 상기 키워드 조의 각 키워드의 상기 소정의 중요도를 사용하여, 상기 입력전표와 상기 소정의 전표종별(복수)과의 매칭정도를 전표종별마다 평가하여, 가장 매칭정도가 높은 전표종별을 상기 입력전표의 종별로 판정하고 평가하는 것을 특징으로 하는 입력전표가 소정 전표종별 중 어느 것인지를 판정하기 위한 컴퓨터가 읽을 수 있는 프로그램을 수록한 기록매체.
  34. 청구항 32에 있어서,
    상기 키워드 추출스텝으로부터 추출된 키워드로부터 임의의 2개 이상의 키워드를 꺼내어, 그 꺼낸 키워드를 조합하여 하나 이상의 새로운 키워드를 형성하는 스텝을 더 포함하고,
    상기 추출된 키워드 및 상기 형성된 하나 이상의 새로운 키워드를 상기 키워드등록부에 등록된 상기 키워드 조와 전표종별마다 조합하는 스텝을 더 포함하는 것을 특징으로 하는 입력전표가 소정 전표종별 중 어느 것인지를 판정하기 위한 컴퓨터가 읽을 수 있는 프로그램을 수록한 기록매체.
  35. 키워드의 조를 전표종별마다 1조로 미리 키워드 등록부에 등록하는 스텝과,
    입력된 전표의 이미지데이터를 판독하여, 상기 판독한 이미지데이터로부터 문자열(복수)을 추출하여 추출한 각 문자열에 대해 문자인식을 수행하는 스텝과,
    상기 문자인식된 문자열(복수)과 데이터베이스에 미리 격납된 기준 문자열패턴(복수)을 조합하여, 상기 기준 문자열패턴(복수)의 임의의 하나와 적어도 부분적으로 각각이 일치하는 문자인식된 문자열의 각각을 키워드로서 추출하는 스텝과,
    상기 추출한 키워드(복수)와 상기 키워드 등록부에 등록된 상기 키워드 조를 전표종별마다 조합함으로써 상기 입력된 전표의 종별을 판정하는 스텝을 포함하는 입력전표가 소정 전표종별 중 어느 것인지를 판정하기 위한 컴퓨터가 읽을 수 있는 프로그램을 수록한 기록매체.
  36. 청구항 35에 있어서,
    상기 키워드 추출스텝으로부터 추출된 키워드로부터 임의의 2개 이상의 키워드를 꺼내어, 그 꺼낸 키워드를 조합하여 하나 이상의 새로운 키워드를 형성하는 스텝을 더 포함하고,
    상기 추출된 키워드 및 상기 형성된 하나 이상의 새로운 키워드를 상기 키워드등록부에 등록된 상기 키워드 조와 전표종별마다 조합하는 스텝을 더 포함하는 것을 특징으로 하는 입력전표가 소정 전표종별 중 어느 것인지를 판정하기 위한 컴퓨터가 읽을 수 있는 프로그램을 수록한 기록매체.
KR1020000050521A 2000-01-18 2000-08-29 전표종별 판별방법 및 그 장치 KR100351171B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2000009165A JP2001202466A (ja) 2000-01-18 2000-01-18 帳票種別判別装置
JP2000-009165 2000-01-18

Publications (2)

Publication Number Publication Date
KR20010076183A KR20010076183A (ko) 2001-08-11
KR100351171B1 true KR100351171B1 (ko) 2002-09-05

Family

ID=18537349

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000050521A KR100351171B1 (ko) 2000-01-18 2000-08-29 전표종별 판별방법 및 그 장치

Country Status (6)

Country Link
US (1) US6963665B1 (ko)
EP (1) EP1118959B1 (ko)
JP (1) JP2001202466A (ko)
KR (1) KR100351171B1 (ko)
DE (1) DE60031502T2 (ko)
TW (1) TW511028B (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7236653B2 (en) * 2003-03-27 2007-06-26 Sharp Laboratories Of America, Inc. System and method for locating document areas using markup symbols
US8050512B2 (en) * 2004-11-16 2011-11-01 Sharp Laboratories Of America, Inc. High dynamic range images from low dynamic range images
US8050511B2 (en) * 2004-11-16 2011-11-01 Sharp Laboratories Of America, Inc. High dynamic range images from low dynamic range images
US7860844B2 (en) * 2005-07-15 2010-12-28 Indxit Systems Inc. System and methods for data indexing and processing
EP1927936B1 (en) * 2006-11-29 2016-08-17 Brother Kogyo Kabushiki Kaisha Image scanning device
JP4918937B2 (ja) * 2007-03-08 2012-04-18 富士通株式会社 帳票種識別プログラム、帳票種識別方法および帳票種識別装置
CN102054171A (zh) * 2009-10-30 2011-05-11 株式会社东芝 文档文件种类识别装置以及文档文件种类识别方法
JP5894064B2 (ja) * 2012-12-13 2016-03-23 日立オムロンターミナルソリューションズ株式会社 帳票表示システム、帳票表示装置、及び帳票表示方法
JP6123597B2 (ja) * 2013-09-12 2017-05-10 ブラザー工業株式会社 筆記データ処理装置
CN108932692B (zh) * 2017-05-26 2021-12-31 杭州海康机器人技术有限公司 面单信息的获取方法及装置
JP6938228B2 (ja) * 2017-05-31 2021-09-22 株式会社日立製作所 計算機、文書識別方法、及びシステム
KR102127985B1 (ko) * 2018-11-28 2020-06-29 삼성생명보험주식회사 문서 이미지로부터 항목을 추출하는 컴퓨팅 장치
JP2021043775A (ja) 2019-09-12 2021-03-18 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7379987B2 (ja) 2019-09-20 2023-11-15 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP7439435B2 (ja) 2019-09-30 2024-02-28 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5235653A (en) * 1984-08-31 1993-08-10 Hitachi, Ltd. Document analysis system
JPH0797373B2 (ja) * 1985-08-23 1995-10-18 株式会社日立製作所 文書フアイリングシステム
JPH0484366A (ja) * 1990-07-27 1992-03-17 Toshiba Corp 文書種別判別装置
JP3515586B2 (ja) * 1992-10-16 2004-04-05 株式会社ジャストシステム 文書処理方法及び装置
GB9305554D0 (en) 1993-03-18 1993-05-05 Ncr Int Inc Method and apparatus for processing decuments
JPH07273922A (ja) * 1994-03-30 1995-10-20 Matsushita Electric Ind Co Ltd Fax情報転送装置
US5821929A (en) * 1994-11-30 1998-10-13 Canon Kabushiki Kaisha Image processing method and apparatus
US5937084A (en) 1996-05-22 1999-08-10 Ncr Corporation Knowledge-based document analysis system
JPH09330363A (ja) * 1996-06-10 1997-12-22 Toshiba Corp 帳票読取装置
JP3090070B2 (ja) * 1996-11-26 2000-09-18 日本電気株式会社 帳票識別方法及び装置
US5987448A (en) * 1997-07-25 1999-11-16 Claritech Corporation Methodology for displaying search results using character recognition
US6263121B1 (en) * 1998-09-16 2001-07-17 Canon Kabushiki Kaisha Archival and retrieval of similar documents
JP2000348041A (ja) * 1999-06-03 2000-12-15 Nec Corp 文書検索方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体

Also Published As

Publication number Publication date
US6963665B1 (en) 2005-11-08
TW511028B (en) 2002-11-21
EP1118959A3 (en) 2004-06-09
DE60031502T2 (de) 2007-06-21
DE60031502D1 (de) 2006-12-07
KR20010076183A (ko) 2001-08-11
JP2001202466A (ja) 2001-07-27
EP1118959A2 (en) 2001-07-25
EP1118959B1 (en) 2006-10-25

Similar Documents

Publication Publication Date Title
KR100351171B1 (ko) 전표종별 판별방법 및 그 장치
EP0011388B1 (en) System and method for processing documents
US20020141660A1 (en) Document scanner, system and method
US20080177764A1 (en) Document and/or Image Retrieval Method, Program Therefor, Document and/or Image Storage Apparatus, and Retrieval Apparatus
Casey et al. Intelligent forms processing
CN106250830A (zh) 数字图书结构化分析处理方法
WO2009070032A1 (en) A method for processing optical character recognition (ocr) data, wherein the output comprises visually impaired character images
JPH07105308A (ja) 書類上の金額フィールドの位置特定方法および識別方法
JP2012008791A (ja) 帳票認識装置及び帳票認識方法
JP3422924B2 (ja) 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH03161891A (ja) 表形式文書読取装置
CN111695555B (zh) 一种基于题号的精准框题方法、装置、设备和介质
EA013012B1 (ru) Документ, снабженный идентифицирующими и верификационными данными
JP4280355B2 (ja) 文字認識装置
CN111144445B (zh) 印刷书刊书写格式的检错方法及系统、电子设备
KR102094234B1 (ko) 지폐 일련번호 인식 장치 및 방법
US7920742B2 (en) Image processing apparatus, program and recording medium for document registration
CN116090424A (zh) 一种基于局部区域模板匹配的票据信息提取方法
JP7351159B2 (ja) 情報処理装置及びプログラム
JP3673616B2 (ja) 商品券識別方法及び装置
JP3946043B2 (ja) 帳票識別装置及び識別方法
WO2023021636A1 (ja) データ処理装置、データ処理方法及びプログラム
ALAMERİ et al. Computational Methods for Forgery Detection in Printed Official Documents
JP2004025467A (ja) 微小記号文字群が印刷された印刷物、印刷物に微小記号文字を配置する方法及びその装置、微小記号文字群が印刷された印刷物の真偽判別を行う方法及びその装置
JPH0528302A (ja) 文字読取装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110720

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20120802

Year of fee payment: 11

LAPS Lapse due to unpaid annual fee