KR101322953B1 - 화상 처리 장치, 화상 처리 방법 및 기록 매체 - Google Patents

화상 처리 장치, 화상 처리 방법 및 기록 매체 Download PDF

Info

Publication number
KR101322953B1
KR101322953B1 KR1020137014292A KR20137014292A KR101322953B1 KR 101322953 B1 KR101322953 B1 KR 101322953B1 KR 1020137014292 A KR1020137014292 A KR 1020137014292A KR 20137014292 A KR20137014292 A KR 20137014292A KR 101322953 B1 KR101322953 B1 KR 101322953B1
Authority
KR
South Korea
Prior art keywords
image
specifying
deformation
area
difference
Prior art date
Application number
KR1020137014292A
Other languages
English (en)
Other versions
KR20130077898A (ko
Inventor
시가꾸 이와부찌
Original Assignee
라쿠텐 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 라쿠텐 인코포레이티드 filed Critical 라쿠텐 인코포레이티드
Publication of KR20130077898A publication Critical patent/KR20130077898A/ko
Application granted granted Critical
Publication of KR101322953B1 publication Critical patent/KR101322953B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • G06K7/1408Methods for optical code recognition the method being specifically adapted for the type of code
    • G06K7/14131D bar codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/01Details
    • G06K7/015Aligning or centering of the sensing device with respect to the record carrier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing

Abstract

본 발명은, 도형 코드와 적어도 1개의 문자가 소여의 위치 관계에 있는 화상으로부터의 문자 인식의 정밀도를 향상시킨다. 화상 취득부(20)는 소여의 위치 관계에 있는 도형 코드와 도형 코드의 외측에 배치된 적어도 1개의 문자가 포함되는 화상을 취득한다. 변형 규칙 특정부(26)는 화상 취득부(20)에 의해 취득되는 화상에 포함되는 도형 코드를 기지의 종류의 도형으로 변형하는 변형 규칙을 특정한다. 변형 처리 실행부(28)는, 화상 취득부(20)에 의해 취득되는 화상에 포함되는 문자에 대하여 변형 규칙 특정부(26)에 의해 특정되는 변형 규칙을 따르는 변형 처리를 실행한다.

Description

화상 처리 장치, 화상 처리 방법 및 기록 매체{IMAGE PROCESSING DEVICE, IMAGE PROCESSING METHOD, AND RECORDING MEDIUM}
본 발명은 화상 처리 장치, 화상 처리 방법, 프로그램 및 기록 매체에 관한 것이다.
바코드 리더에 의해, 바코드로 표현되어 있는 정보의 일부를 해독할 수 없는 상황에서도, 바코드에 인접하는 문자를 문자 인식 기술을 사용해서 인식함으로써, 바코드에 의해 표현되는 정보의 해독을 보충하는 기술이 존재한다. 예를 들어, 특허문헌 1에는 광학적 문자 인식 처리를 사용하여, 바코드 기호 내의 해독할 수 없었던 코드·워드에 대응하는, 인간이 판독 가능한 문자를 판독함으로써, 종래의 바코드 판독 기술을 보충하도록 한 바코드 해독 시스템이 개시되어 있다.
[특허문헌]
특허문헌 1: 일본 특허 공표 제2000-511320호 공보
특허문헌 1에 기재된 기술에서는, 예를 들어 바코드의 판독 결과가 희미해져 있거나, 판독 대상이 되는 바코드가 더러워졌을 뿐 아니라, 바코드의 판독 결과의 화상이 원래의 바코드에 비하여 변형되어버린 경우에는, 바코드에 의해 표현된 정보를 정확하게 판독할 수 없다.
본 발명은 상기 과제를 감안하여 이루어진 것이며, 그 목적으로 하는 한가지는, 도형 코드와 적어도 1개의 문자가 소여의 위치 관계에 있는 화상으로부터의 문자 인식의 정밀도를 향상시키는 것에 있다.
상기 과제를 해결하기 위해서, 본 발명에 따른 화상 처리 장치는, 소여의 위치 관계에 있는 도형 코드와 당해 도형 코드의 외측에 배치된 적어도 1개의 문자가 포함되는 화상을 취득하는 화상 취득 수단과, 상기 화상 취득 수단에 의해 취득되는 화상에 포함되는 도형 코드를 기지의 종류의 도형으로 변형하는 변형 규칙을 특정하는 변형 규칙 특정 수단과, 상기 화상 취득 수단에 의해 취득되는 화상에 포함되는 문자에 대하여 상기 변형 규칙 특정 수단에 의해 특정되는 변형 규칙을 따르는 변형 처리를 실행하는 변형 처리 실행 수단을 포함하는 것을 특징으로 한다.
또한, 본 발명에 따른 화상 처리 방법은, 소여의 위치 관계에 있는 도형 코드와 당해 도형 코드의 외측에 배치된 적어도 1개의 문자가 포함되는 화상을 취득하는 화상 취득 스텝과, 상기 화상 취득 스텝에 의해 취득되는 화상에 포함되는 도형 코드를 기지의 종류의 도형으로 변형하는 변형 규칙을 특정하는 변형 규칙 특정 스텝과, 상기 화상 취득 스텝에 의해 취득되는 화상에 포함되는 문자에 대하여 상기 변형 규칙 특정 스텝에 의해 특정되는 변형 규칙을 따르는 변형 처리를 실행하는 변형 처리 실행 스텝을 포함하는 것을 특징으로 한다.
또한, 본 발명에 따른 프로그램은, 소여의 위치 관계에 있는 도형 코드와 당해 도형 코드의 외측에 배치된 적어도 1개의 문자가 포함되는 화상을 취득하는 화상 취득 수단, 상기 화상 취득 수단에 의해 취득되는 화상에 포함되는 도형 코드를 기지의 종류의 도형으로 변형하는 변형 규칙을 특정하는 변형 규칙 특정 수단, 상기 화상 취득 수단에 의해 취득되는 화상에 포함되는 문자에 대하여 상기 변형 규칙 특정 수단에 의해 특정되는 변형 규칙을 따르는 변형 처리를 실행하는 변형 처리 실행 수단으로서 컴퓨터를 기능시키는 것을 특징으로 한다.
또한, 본 발명에 따른 기록 매체는, 소여의 위치 관계에 있는 도형 코드와 당해 도형 코드의 외측에 배치된 적어도 1개의 문자가 포함되는 화상을 취득하는 화상 취득 수단, 상기 화상 취득 수단에 의해 취득되는 화상에 포함되는 도형 코드를 기지의 종류의 도형으로 변형하는 변형 규칙을 특정하는 변형 규칙 특정 수단, 상기 화상 취득 수단에 의해 취득되는 화상에 포함되는 문자에 대하여 상기 변형 규칙 특정 수단에 의해 특정되는 변형 규칙을 따르는 변형 처리를 실행하는 변형 처리 실행 수단으로서 컴퓨터를 기능시키는 것을 특징으로 하는 프로그램을 기록한 기록 매체다.
본 발명에 따르면 도형 코드를 기지의 종류의 도형으로 변형하는 변형 규칙을 따르는 변형 처리가 화상에 포함되는 문자에 대하여 실행되므로, 도형 코드와 적어도 1개의 문자가 소여의 위치 관계에 있는 화상으로부터의 문자 인식 정밀도가 향상되게 된다.
본 발명의 일 형태에서는, 상기 화상 취득 수단에 의해 취득되는 화상 내의 영역의, 서로 대략 직교하는 두 방향 각각에 대해서, 당해 영역 내의, 당해 방향을 따라서 서로 인접하는 부분 화상의 특징량의 차의 합계를 특정하는 특징량 차 합계 특정 수단과, 상기 특징량 차 합계 특정 수단에 의해 상기 두 방향에 대해서 특정되는 상기 합계의 차가, 합계의 차에 관한 소여의 조건을 만족하는, 상기 화상 취득 수단에 의해 취득되는 화상 내의 영역을 특정하는 영역 특정 수단을 더 포함하고, 상기 변형 규칙 특정 수단은, 상기 영역 특정 수단에 의한 특정 결과인 영역의 윤곽 도형을 기지의 종류의 도형으로 변형하는 변형 규칙을 특정하는 것을 특징으로 한다.
또한, 본 발명의 일 형태에서는, 상기 영역 특정 수단이 상기 특징량 차 합계 특정 수단에 의해 상기 두 방향에 대해서 특정되는 상기 합계의 차가 최대가 되는, 상기 화상 취득 수단에 의해 취득되는 화상 내의 영역을 특정하는 것을 특징으로 한다.
또한, 본 발명의 일 형태에서는, 상기 특징량 차 합계 특정 수단은, 상기 화상 취득 수단에 의해 취득되는 화상 내의 영역의, 서로 대략 직교하는 두 방향 각각에 대해서, 당해 영역 내의, 당해 방향을 따라서 서로 인접하는 화소의 휘도 차의 합계를 특정하는 것을 특징으로 한다.
또한, 본 발명의 일 형태에서는, 상기 영역 특정 수단은, 복수의 상기 두 방향에 관한 영역의 특정을 실행하고, 상기 변형 규칙 특정 수단은, 상기 영역 특정 수단에 의한 특정 결과인, 각각이 서로 상이한 상기 두 방향에 대응되는 복수의 영역 중, 상기 특징량 차 합계 특정 수단에 의해 특정되는 상기 합계의 차가 최대가 되는 영역의 윤곽 도형을 기지의 종류의 도형으로 변형하는 변형 규칙을 특정하는 것을 특징으로 한다.
또한, 본 발명의 일 형태에서는, 서로 대략 직교하는 두 방향이며, 상기 화상 취득 수단에 의해 취득되는 화상의 적어도 일부에 대해서 각 방향의 히스토그램의 주파수 특징량의 차이가, 주파수 특징량의 차이에 관한 소여의 조건을 만족하는 두 방향을 특정하는 방향 특정 수단을 더 포함하고, 상기 특징량 차 합계 특정 수단은, 상기 방향 특정 수단에 의해 특정되는 두 방향 각각에 대해서, 당해 방향을 따라서 서로 인접하는 부분 화상의 특징량 차의 합계를 특정하는 것을 특징으로 한다.
또한, 본 발명의 일 형태에서는, 상기 변형 규칙 특정 수단은 상기 화상 취득 수단에 의해 취득되는 화상에 포함되는 도형 코드를 기지 형상의 도형으로 변형하는 변형 규칙을 특정하는 것을 특징으로 한다.
또한, 본 발명의 일 형태에서는, 상기 변형 처리 실행 수단에 의한 변형 처리 실행 후의 문자를 인식하는 문자 인식 수단을 더 포함하는 것을 특징으로 한다.
도 1은 본 발명의 일 실시 형태에 따른 화상 처리 장치의 하드웨어 구성의 일례를 도시하는 도면이다.
도 2는 본 발명의 일 실시 형태에 따른 화상 처리 장치로 실현되는 기능의 일례를 도시하는 기능 블록도이다.
도 3은 바코드 화상의 일례를 도시하는 도면이다.
도 4는 특징량 계산 기준 영역의 변화의 일례를 모식적으로 도시하는 도면이다.
도 5는 변형 후의 바코드 화상의 일례를 도시하는 도면이다.
도 6은 바코드 화상의 다른 일례를 도시하는 도면이다.
이하, 본 발명의 일 실시 형태에 대해서 도면에 기초하여 상세하게 설명한다.
도 1은, 본 발명의 일 실시 형태에 따른 화상 처리 장치(10)의 하드웨어 구성의 일례를 도시하는 도면이다. 도 1에 도시한 바와 같이, 본 실시 형태에 따른 화상 처리 장치(10)는, 예를 들어 화상 처리 장치(10)에 인스톨되는 프로그램에 따라서 동작하는 CPU 등의 프로그램 제어 디바이스인 제어부(12), ROM이나 RAM 등의 기억 소자나 하드디스크 드라이브 등인 기억부(14), 액정 터치 패널이나 디스플레이, 키패드 등, 유저가 행한 조작의 내용을 제어부(12)에 출력하거나, 제어부(12)로부터 입력되는 지시에 따라서 정보를 출력하거나 하는 유저 인터페이스(UI)부(16), 이미지 스캐너나 웹 카메라 등이며, 바코드를 판독하는 판독부(18)를 포함하고 있다.
도 2는, 본 실시 형태에 따른 화상 처리 장치(10)로 실현되는 기능의 일례를 도시하는 기능 블록도이다. 본 실시 형태에 따른 화상 처리 장치(10)는, 기능적으로는 화상 취득부(20), 영역 특정부(22), 특징량 차 합계 특정부(24), 변형 규칙 특정부(26), 변형 처리 실행부(28), 문자 인식부(30)를 포함하여 구성된다. 이들 요소는 제어부(12)를 주로 해서 실현된다.
이들 요소는, 컴퓨터인 화상 처리 장치(10)에 인스톨된 프로그램을, 화상 처리 장치(10)의 제어부에서 실행함으로써 실현되고 있다. 또한, 이 프로그램은, 예를 들어 CD-ROM, DVD-ROM 등의 컴퓨터 판독 가능한 기록 매체를 통하거나, 혹은, 인터넷 등의 통신 네트워크를 통해서 화상 처리 장치(10)에 공급된다.
화상 취득부(20)는, 도 3에 예시하는 판독부(18)에 의해 판독된 바코드 화상(40)을 취득한다. 도 3에 도시한 바와 같이, 본 실시 형태에서 바코드 화상(40)은 도형 코드(40a)와 문자열(40b)을 포함하고 있다. 그리고, 본 실시 형태에서 도형 코드(40a)와 문자열(40b)은, 소여의 위치 관계에 있다. 또한, 본 실시 형태에서 판독한 바코드 화상(40)은 위를 향해서 만곡하고 있어, 좌우 단부 부분이 희미해져 있다.
영역 특정부(22)는 화상 취득부(20)가 취득하는 바코드 화상(40)으로부터, 도형 코드(40a)가 차지하는 영역(이하, 도형 코드 영역이라 함)을 특정한다.
본 실시 형태에서 영역 특정부(22)는 서로 상이한 복수의 XY 좌표계(예를 들어, 화상 취득부(20)가 취득한 바코드 화상(40)의 오른쪽 방향을 X축 정방향으로 하고, 아래 방향을 Y축 정방향으로 했을 경우를 기준으로 하고, 반시계 방향으로 0도(즉, XY 좌표계를 회전시키지 않음), 30도, 60도, 90도, 120도, 150도 회전시킨 XY 좌표계) 각각에 대해서, 최종 특징량 계산 기준 영역(42c)(도 4 참조)의 특정 처리를 실행한다. 그리고, 영역 특정부(22)는 이들 복수의 최종 특징량 계산 기준 영역(42c) 중에서 후술하는 방법에 의해 선택되는 하나를 도형 코드 영역으로서 특정한다.
여기서, 특징량 계산 기준 영역(42) 변화의 일례를 모식적으로 도시하는 도 4를 참조하면서, 최종 특징량 계산 기준 영역(42c)의 특정 처리에 대해서 설명한다. 또한, 도 4에 있어서는, 바코드 화상(40)은 윤곽선으로만 표현되어 있다. 또한, 도 4에서는 바코드 화상(40)의 가로 방향을 X축 정방향인 경우가 일례로서 도시되어 있다. 도 4에 도시한 바와 같이, 영역 특정부(22)는 우선, XY 좌표계에 있어서의, 초기 상태의 특징량 계산 기준 영역(42)(이하, 초기 설정 특징량 계산 기준 영역(42a)이라 함)을 설정한다. 본 실시 형태에서는, 초기 설정 특징량 계산 기준 영역(42a)은, 그 형상, 크기, 바코드 화상(40) 내에 있어서의 위치가 미리 정해져 있다.
그리고, 영역 특정부(22)는 소여의 조건을 만족할 때까지, 특징량 계산 기준 영역(42)의 갱신 처리를 실행한다. 특징량 계산 기준 영역(42)의 갱신 처리의 상세한 것은 후술한다. 그리고, 영역 특정부(22)는 소정의 조건을 만족한 시점에 있어서의 특징량 계산 기준 영역(42)을, 최종 특징량 계산 기준 영역(42c)으로서 특정한다.
본 실시 형태에서는, 특징량 계산 기준 영역(42)의 윤곽 도형은 사각형이다. 그리고, 특징량 계산 기준 영역(42)의 윤곽 도형의 네 정점의 위치가 갱신됨으로써, 특징량 계산 기준 영역(42)의 위치, 형상 및 크기가 갱신되게 된다.
도 4에는, 최종 특징량 계산 기준 영역(42c)이 특정될 때까지 사이의 도중 경과에 있어서의 특징량 계산 기준 영역(42)이, 도중 상태 특징량 계산 기준 영역(42b)으로 나타나고 있다. 이하, 도중 상태 특징량 계산 기준 영역(42b)에 대하여 실행되는, 특징량 계산 기준 영역(42)의 갱신 처리에 대해서 설명한다.
도 4의 예에서는, 도중 상태 특징량 계산 기준 영역(42b)의 윤곽 도형의 좌측 상단, 우측 상단, 좌측 하단, 우측 하단의 정점의 화소 좌표값은 각각, (p1, q1), (p2, q2), (p3, q3), (p4, q4)인 것으로 한다. 그리고, 본 실시 형태에서는 p1=p3<p2=p4, q2<q1<q3<q4라는 관계가 성립하는 것으로 한다.
본 실시 형태에서는, 특징량 차 합계 특정부(24)는 특징량 계산 기준 영역(42)에 기초하여 복수의 특징량 계산 영역을 결정한다. 특징량 차 합계 특정부(24)는, 구체적으로 예를 들어 각 정점에 대해서, 특징량 계산 기준 영역(42)의 윤곽 도형의 정점 자체인 기준 화소, 기준 화소의 좌측 상단의 화소, 기준 화소 상단의 화소, 기준 화소의 우측 상단의 화소, 기준 화소의 좌측의 화소, 기준 화소의 우측의 화소, 기준 화소의 좌측 하단의 화소, 기준 화소 하단의 화소, 기준 화소의 우측 하단의 화소의 9가지 화소 중 어느 하나를 특징량 계산 영역의 윤곽 도형의 정점으로서 결정한다. 예를 들어, 특징량 계산 기준 영역(42)의 좌측 상단의 정점에 대해서, 화소 좌표값이 (p1-1, q1-1), (p1, q1-1), (p1+1, q1-1), (p1-1, q1), (p1, q1), (p1+1, q1), (p1-1, q1+1), (p1, q1+1), (p1+1, q1+1)인 9가지 화소가 특징량 계산 영역의 윤곽 도형의 정점으로서 선택된다. 이와 같이 하여, 본 실시 형태에서는, 네 정점 각각에 대해서 9개의 화소 중 어느 하나가 결정되기 때문에, 9×9×9×9=6561개의 특징량 계산 영역이 결정되게 된다.
그리고, 특징량 계산 영역 내의 서로 직교하는(대략 직교이어도 상관없음) 두 방향(본 실시 형태에서는 X축 방향 및 Y축 방향) 각각에 따른, 서로 인접하는 화소의 특징량의 차(본 실시 형태에서는 휘도차)의 합계값인, 특징량 차 합계값CTotalDiff를 각 특징량 계산 영역에 대해서 산출한다.
이하의 설명에 있어서, 화소 좌표값의 Y 성분의 값이 y인 특징량 계산 영역 내의 화소의 X 성분 화소 좌표값은 xmin, xmin+1, …, xmax이며, X 성분 화소 좌표값이 x인 특징량 계산 영역 내의 화소의, Y 성분 화소 좌표값은 ymin, ymin+1, …, ymax인 것으로 한다. 또한, 이하의 설명에서는 화소 좌표값 (x, y)에 있어서의 특징량(본 실시 형태에서는 휘도)을 C (x, y)로 표현한다. 또한, 이하의 설명에 있어서, 특징량 계산 영역의 네 정점의 X 성분 화소 좌표값 중 최소값을 pmin, 최대값을 pmax로 한다. 또한, 특징량 계산 영역의 네 정점의 Y 성분 화소 좌표값 중 최소값을 qmin, 최대값을 qmax로 한다.
우선, 특징량 차 합계 특정부(24)는 y=qmin, qmin+1, …, qmax 각각에 대해서, X축 특징량 차 소계값 CSubtotalDiff(x)=|C (xmin+1, y)-C (xmin, y)|+|C (xmin+2, y)-C (xmin+1, y)|+…+|C (xmax, y)-C (xmax-1, y)|를 계산한다(또한, |C (xmin+1, y)-C (xmin, y)|)는 화소 좌표값 (xmin+1, y)에 있어서의 특징량과, 화소 좌표값 (xmin, y)에 있어서의 특징량의 차의 절대값을 나타냄. 이하 동일). 그리고, 특징량 차 합계 특정부(24)는 y=qmin, qmin+1, …, qmax에 대해서 계산된 X축 특징량 차 소계값 CSubtotalDiff(x)를 합계함으로써, X축 특징량 차 합계값CTotalDiff(x)를 계산한다.
그리고, 특징량 차 합계 특정부(24)는 x=pmin, pmin+1, …, pmax 각각에 대해서, Y축 특징량 차 소계값 CSubtotalDiff(y)=|C (x, ymin+1)-C (x, ymin)|+|C (x, ymin+2)-C (x, ymin+1)|+…+|C (x, ymax)-C (x, ymax-1)|을 계산한다. 그리고, 특징량 차 합계 특정부(24)는 x=pmin, pmin+1, …, pmax에 대해서 계산된 Y축 특징량 차 소계값 CSubtotalDiff(y)를 합계함으로써, Y축 특징량 차 합계값 CTotalDiff(y)를 계산한다.
그리고, 특징량 차 합계 특정부(24)는 X축 특징량 차 합계값 CTotalDiff(x)와 Y축 특징량 차 합계값 CTotalDiff(y)의 차의 절대값을, 특징량 계산 영역의 특징량 차 합계값 CTotalDiff로서 특정한다.
그리고, 영역 특정부(22)는 소정의 조건을(예를 들어, 특징량 차 합계값CTotalDiff가 모든 특징량 계산 영역에서 동일해지는 등) 만족하고 있지 않은 경우에는, 특징량 계산 기준 영역의 윤곽 도형의 네 정점의 위치를, 특징량 차 합계값CTotalDiff가 최대인 특징량 계산 영역의 윤곽 도형의 네 정점의 위치로 갱신한다.
이상과 같이 하여, 특징량 계산 기준 영역(42)이 갱신되어 가게 된다.
그리고, 영역 특정부(22)는 특징량 차 합계값 CTotalDiff가 모든 특징량 계산 영역에서 동일해지는 등, 소여의 조건을 만족했을 때에 있어서의 특징량 계산 기준 영역(42)을, 최종 특징량 계산 기준 영역(42c)으로서 특정한다. 또한, 이와 같이 하여 특정되는 최종 특징량 계산 기준 영역(42c)은, 국소적으로는 특징량 차 합계값 CTotalDiff가 최대의 영역이라고 생각된다.
그리고, 본 실시 형태에서 영역 특정부(22)는, 상술한 바와 같이 복수의 XY 좌표계 각각에 대해서, 최종 특징량 계산 기준 영역(42c)의 특정을 실행한다. 그리고, 최종 특징량 계산 기준 영역(42c)에 대응하는 특징량 차 합계값 CTotalDiff가 최대인 최종 특징량 계산 기준 영역(42c)을 도형 코드 영역으로서 특정한다. 이와 같이 하여 특정되는 도형 코드 영역은, 도형 코드(40a)에 거의 외접하고 있다고 생각된다.
변형 규칙 특정부(26)는 영역 특정부(22)에 의해 특정된 도형 코드 영역의 윤곽 도형을, 기지 종별의 도형으로 변형하는 변형 규칙을 특정한다. 본 실시 형태에서는, 예를 들어 도형 코드 영역의 윤곽 도형인 사각형을, 기지 종횡비의 직사각형으로 변환하는 변환 행렬을 특정한다.
변형 처리 실행부(28)는 바코드 화상(40) 전체에 대하여, 변형 규칙 특정부(26)에 의해 특정된 변형 규칙에 의한 변형(예를 들어, 변환 행렬에 의한 선형 변환이나 아핀 변환)을 실행한다. 도 5에, 변형 처리 실행부(28)에 의한 변형 후의 바코드 화상(40)의 일례를 도시한다.
문자 인식부(30)는 변형 처리 실행부(28)에 의한 변형 후의 바코드 화상(40) 내의 도형 코드(40a)에 대하여 소여의 위치 관계에 있는 영역(예를 들어, 도형 코드(40a)를 가로로 길게 배치했을 때의 도형 코드(40a) 위 또는 아래의 영역)에 배치되어 있는 문자열(40b)에 대하여 OCR 처리를 실행함으로써, 문자열(40b)에 대한 문자 인식을 행한다.
이와 같이 하여, 본 실시 형태에서는, 문자열(40b)이 변형된 후에 OCR 처리가 실행되므로, 문자 인식의 정밀도가 향상되게 된다. 예를 들어, 바코드 화상(40)의 전부 또는 일부가 희미해지고 있어, 바코드 화상(40)의 도형 코드(40a)에 의해 표현되어 있는 정보를 해독할 수 없는 경우에도, 문자 인식부(30)에 의한 문자 인식의 결과를, 도형 코드(40a)에 의해 표현되고 있는 정보의 해독 결과로서 취급함으로써 도형 코드(40a)에 의해 표현되고 있는 정보의 해독 결과를 사용하는 다양한 정보 처리(예를 들어, 문자 인식의 결과가 되는 문자열(40b)에 의해 표현되는 ID에 대응되는 상품의 상세한 정보를 디스플레이 등의 UI부(16)에 표시하는 처리 등)가 실행 불가능하게 될 가능성을 낮출 수 있다. 또한, 본 발명은 바코드 화상(40)의 전부 또는 일부가 식별 곤란하고, 또한 식별 곤란한 장소가 변형되어 있으면 적용 가능하며, 식별 곤란한 이유는 묻지 않는다. 예를 들어, 도 6에 도시한 바와 같이, 바코드 화상(40)이 희미해지는 것이 아닌, 바코드 화상(40)의 일부가 더러워진 경우라도 본 발명은 적용 가능하다.
또한, 본 발명은 상술한 실시 형태에 한정되는 것은 아니다.
예를 들어, 영역 특정부(22)가 최종 특징량 계산 기준 영역(42c)에 있어서의 특징량 차 합계값 CTotalDiff가 소정의 기준값 이하이면 초기 설정 특징량 계산 기준 영역(42a)을 변경한 후에, 최종 특징량 계산 기준 영역(42c)의 특정을 다시 하도록 해도 좋다. 또한, 예를 들어 영역 특정부(22)가 도형 코드(40a)에 외접하는 다각형(예를 들어, 사각형)을 도형 코드 영역으로서 특정해도 좋다. 또한, 예를 들어 변형 규칙 특정부(26)가, 영역 특정부(22)에 의해 특정된 도형 코드 영역의 윤곽 도형을, 기지의 형상 및 크기의 도형으로 변형하는 변형 규칙을 특정하도록 해도 상관없다.
또한, 예를 들어 화상 처리 장치(10)가, 화상 취득부(20)가 취득한 바코드 화상(40)의 가로 방향을 X축 정방향으로 했을 경우를 기준으로 하고, 반시계 방향으로 0도, 30도, 60도, 90도, 120도, 150도 회전시킨 복수의 XY 좌표계 각각에 대해서, 바코드 화상(40)의 X축 방향의 히스토그램의 주파수 특징량과, 바코드 화상(40)의 X축 방향의 히스토그램의 주파수 특징량을 계산하고, 주파수 특징량의 차이가 소여의 조건을 만족하는(예를 들어, 최대가 되는) XY 좌표계의 X축 방향과 Y축 방향을 특정하는 방향 특정부를 포함하고 있어도 좋다. 그리고, 영역 특정부(22)가 방향 특정부에 의해 특정되는 X축 방향과 Y축 방향으로 이루어지는 XY 좌표계에 대해서 특정되는 최종 특징량 계산 기준 영역(42c)을 도형 코드 영역으로서 특정하도록 해도 좋다.
또한, 예를 들어 특징량 차 합계 특정부(24)는 서로 인접하는 화소의 특징량의 차의 합계 대신에 서로 인접하는 부분 화상(예를 들어, 바코드 화상(40)을 분할 함으로써 얻어지는, 적어도 1개의 화소를 포함하여 구성되는 부분 화상)의 특징량의 차의 합계를 특징량 차 합계값 CTotalDiff로서 사용하도록 해도 상관없다.
또한, 변형 규칙에 의한 변형은, 선형 변환이나 아핀 변환에는 한정되지 않는다. 예를 들어, 비선형의 왜곡을 보정하는 공지된 방법(구체적으로는, 예를 들어 비선형 국부 기하 보정법이나 선형 국부 기하 보정법 등)을 사용하여, 바코드 화상(40)에 대하여 비선형 변환을 실행함으로써, 문자열(40b)의 문자 인식의 정밀도를 향상시키도록 해도 좋다.
또한, 예를 들어 특징량 계산 기준 영역(42)이나 도형 코드 영역이, 5점 이상의 정점으로 구성되는 다각형이어도 상관없다. 또한, 특징량 계산 기준 영역(42)이나 도형 코드 영역에 포함되는 변에 곡선이 포함되어 있어도 상관없다. 또한, 영역 특정부(22)는, 예를 들어 상술한 방법 이외의, 공지된 국소 탐색법을 사용해서 특징량 차 합계값 CTotalDiff가 최대가 되는 도형 코드 영역을 특정하도록 해도 상관없다. 또한, 화상 처리 장치(10)가 복수의 하우징으로 구성되어 있어도 좋다. 또한, 도면에 기재된 구체적인 바코드 화상(40)은 예시이며, 본 발명의 적용 범위는 도면에 기재된 바코드 화상(40)에는 한정되지 않는다.

Claims (15)

  1. 소여의(given) 위치 관계에 있는 도형 코드와 당해 도형 코드의 외측에 배치된 적어도 1개의 문자가 포함되는 화상을 취득하는 화상 취득 수단과,
    상기 화상 취득 수단에 의해 취득되는 화상에 포함되는 도형 코드를 기지의 종류의 도형으로 변형하는 변형 규칙을 특정하는 변형 규칙 특정 수단과,
    상기 화상 취득 수단에 의해 취득되는 화상에 포함되는 문자에 대하여 상기 변형 규칙 특정 수단에 의해 특정되는 변형 규칙을 따르는 변형 처리를 실행하는 변형 처리 실행 수단
    을 포함하는 것을 특징으로 하는 화상 처리 장치.
  2. 제1항에 있어서, 상기 화상 취득 수단에 의해 취득되는 화상 내의 영역의, 서로 대략 직교하는 두 방향 각각에 대해서, 당해 영역 내의 당해 방향을 따라서 서로 인접하는 부분 화상의 특징량의 차의 합계를 특정하는 특징량 차 합계 특정 수단과,
    상기 특징량 차 합계 특정 수단에 의해 상기 두 방향에 대해서 특정되는 상기 합계의 차가, 합계의 차에 관한 소여의 조건을 만족하는, 상기 화상 취득 수단에 의해 취득되는 화상 내의 영역을 특정하는 영역 특정 수단을 더 포함하고,
    상기 변형 규칙 특정 수단은, 상기 영역 특정 수단에 의한 특정 결과인 영역의 윤곽 도형을 기지의 종류의 도형으로 변형하는 변형 규칙을 특정하는 것을 특징으로 하는 화상 처리 장치.
  3. 제2항에 있어서, 상기 영역 특정 수단이, 상기 특징량 차 합계 특정 수단에 의해 상기 두 방향에 대해서 특정되는 상기 합계의 차가 최대가 되는, 상기 화상 취득 수단에 의해 취득되는 화상 내의 영역을 특정하는 것을 특징으로 하는 화상 처리 장치.
  4. 제2항 또는 제3항에 있어서, 상기 특징량 차 합계 특정 수단은, 상기 화상 취득 수단에 의해 취득되는 화상 내의 영역의, 서로 대략 직교하는 두 방향 각각에 대해서, 당해 영역 내의 당해 방향을 따라서 서로 인접하는 화소의 휘도 차의 합계를 특정하는 것을 특징으로 하는 화상 처리 장치.
  5. 제2항 또는 제3항에 있어서, 상기 영역 특정 수단은, 복수의 상기 두 방향에 관한 영역의 특정을 실행하고,
    상기 변형 규칙 특정 수단은, 상기 영역 특정 수단에 의한 특정 결과인, 각각이 서로 상이한 상기 두 방향에 대응되는 복수의 영역 중, 상기 특징량 차 합계 특정 수단에 의해 특정되는 상기 합계의 차가 최대가 되는 영역의 윤곽 도형을 기지의 종류의 도형으로 변형하는 변형 규칙을 특정하는 것을 특징으로 하는 화상 처리 장치.
  6. 제2항 또는 제3항에 있어서, 서로 대략 직교하는 두 방향으로서, 상기 화상 취득 수단에 의해 취득되는 화상의 적어도 일부에 대해서 각 방향의 히스토그램의 주파수 특징량의 차이가, 주파수 특징량의 차이에 관한 소여의 조건을 만족하는 두 방향을 특정하는 방향 특정 수단을 더 포함하고,
    상기 특징량 차 합계 특정 수단은, 상기 방향 특정 수단에 의해 특정되는 두 방향 각각에 대해서, 당해 방향을 따라서 서로 인접하는 부분 화상의 특징량의 차의 합계를 특정하는 것을 특징으로 하는 화상 처리 장치.
  7. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 변형 규칙 특정 수단은 상기 화상 취득 수단에 의해 취득되는 화상에 포함되는 도형 코드를 기지 형상의 도형으로 변형하는 변형 규칙을 특정하는 것을 특징으로 하는 화상 처리 장치.
  8. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 변형 처리 실행 수단에 의한 변형 처리 실행 후의 문자를 인식하는 문자 인식 수단을 더 포함하는 것을 특징으로 하는 화상 처리 장치.
  9. 소여의 위치 관계에 있는 도형 코드와 당해 도형 코드의 외측에 배치된 적어도 1개의 문자가 포함되는 화상을 취득하는 화상 취득 스텝과,
    상기 화상 취득 스텝에 의해 취득되는 화상에 포함되는 도형 코드를 기지의 종류의 도형으로 변형하는 변형 규칙을 특정하는 변형 규칙 특정 스텝과,
    상기 화상 취득 스텝에 의해 취득되는 화상에 포함되는 문자에 대하여 상기 변형 규칙 특정 스텝에 의해 특정되는 변형 규칙을 따르는 변형 처리를 실행하는 변형 처리 실행 스텝을 포함하는 것을 특징으로 하는 화상 처리 방법.
  10. 삭제
  11. 소여의 위치 관계에 있는 도형 코드와 당해 도형 코드의 외측에 배치된 적어도 1개의 문자가 포함되는 화상을 취득하는 화상 취득 수단,
    상기 화상 취득 수단에 의해 취득되는 화상에 포함되는 도형 코드를 기지의 종류의 도형으로 변형하는 변형 규칙을 특정하는 변형 규칙 특정 수단,
    상기 화상 취득 수단에 의해 취득되는 화상에 포함되는 문자에 대하여 상기 변형 규칙 특정 수단에 의해 특정되는 변형 규칙을 따르는 변형 처리를 실행하는 변형 처리 실행 수단으로서 컴퓨터를 기능시키는 것을 특징으로 하는 프로그램을 기록한 기록 매체.
  12. 제4항에 있어서, 상기 영역 특정 수단은, 복수의 상기 두 방향에 관한 영역의 특정을 실행하고,
    상기 변형 규칙 특정 수단은, 상기 영역 특정 수단에 의한 특정 결과인, 각각이 서로 상이한 상기 두 방향에 대응되는 복수의 영역 중, 상기 특징량 차 합계 특정 수단에 의해 특정되는 상기 합계의 차가 최대가 되는 영역의 윤곽 도형을 기지의 종류의 도형으로 변형하는 변형 규칙을 특정하는 것을 특징으로 하는 화상 처리 장치.
  13. 제4항에 있어서, 서로 대략 직교하는 두 방향으로서, 상기 화상 취득 수단에 의해 취득되는 화상의 적어도 일부에 대해서 각 방향의 히스토그램의 주파수 특징량의 차이가, 주파수 특징량의 차이에 관한 소여의 조건을 만족하는 두 방향을 특정하는 방향 특정 수단을 더 포함하고,
    상기 특징량 차 합계 특정 수단은, 상기 방향 특정 수단에 의해 특정되는 두 방향 각각에 대해서, 당해 방향을 따라서 서로 인접하는 부분 화상의 특징량의 차의 합계를 특정하는 것을 특징으로 하는 화상 처리 장치.
  14. 제4항에 있어서, 상기 변형 규칙 특정 수단은 상기 화상 취득 수단에 의해 취득되는 화상에 포함되는 도형 코드를 기지 형상의 도형으로 변형하는 변형 규칙을 특정하는 것을 특징으로 하는 화상 처리 장치.
  15. 제4항에 있어서, 상기 변형 처리 실행 수단에 의한 변형 처리 실행 후의 문자를 인식하는 문자 인식 수단을 더 포함하는 것을 특징으로 하는 화상 처리 장치.
KR1020137014292A 2011-05-31 2011-05-31 화상 처리 장치, 화상 처리 방법 및 기록 매체 KR101322953B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/062486 WO2012164686A1 (ja) 2011-05-31 2011-05-31 画像処理装置、画像処理方法、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
KR20130077898A KR20130077898A (ko) 2013-07-09
KR101322953B1 true KR101322953B1 (ko) 2013-10-29

Family

ID=46243772

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137014292A KR101322953B1 (ko) 2011-05-31 2011-05-31 화상 처리 장치, 화상 처리 방법 및 기록 매체

Country Status (9)

Country Link
US (1) US8781251B2 (ko)
EP (1) EP2634725B1 (ko)
JP (1) JP4917698B1 (ko)
KR (1) KR101322953B1 (ko)
CN (1) CN103562931B (ko)
BR (1) BR112013013425B1 (ko)
CA (1) CA2816247C (ko)
ES (1) ES2603153T3 (ko)
WO (1) WO2012164686A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5776562B2 (ja) * 2012-01-17 2015-09-09 株式会社デンソーウェーブ 二次元コード読み取り装置
JP5914313B2 (ja) * 2012-12-10 2016-05-11 日立オムロンターミナルソリューションズ株式会社 光学読取装置、光学的シンボルを読み取る方法、プログラム、記録紙葉類
JP6162584B2 (ja) * 2013-11-21 2017-07-12 株式会社オプトエレクトロニクス 光学的情報読取装置の画像処理方法及び光学的情報読取装置
CN106682560B (zh) * 2016-12-28 2020-01-31 深圳市共进电子股份有限公司 二维码识别方法、装置和系统
DE102018107950A1 (de) * 2017-04-18 2018-10-18 Canon Kabushiki Kaisha Bildverarbeitungsvorrichtung, bildverarbeitungsverfahren und bildaufnahmevorrichtung
JP2019061527A (ja) * 2017-09-27 2019-04-18 富士通株式会社 データ判定装置、ライブラリ装置、及びデータ判定プログラム
JP7304992B2 (ja) * 2020-09-01 2023-07-07 東芝テック株式会社 コード認識装置
JP7036874B2 (ja) * 2020-09-01 2022-03-15 東芝テック株式会社 コード認識装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07121673A (ja) * 1993-10-28 1995-05-12 Hitachi Ltd 情報提供方法およびその装置
JP2006018655A (ja) 2004-07-02 2006-01-19 Ricoh Co Ltd 文書処理システム
JP2007520001A (ja) 2004-01-14 2007-07-19 インターナショナル バーコード コーポレイション スキャン可能な歪補償用仮想バーコード画像
JP2009129269A (ja) 2007-11-26 2009-06-11 Nec Soft Ltd 情報読取装置及び情報読取方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6947571B1 (en) * 1999-05-19 2005-09-20 Digimarc Corporation Cell phones with optical capabilities, and related applications
US5880451A (en) 1997-04-24 1999-03-09 United Parcel Service Of America, Inc. System and method for OCR assisted bar code decoding
JP2001326847A (ja) * 2000-05-16 2001-11-22 Fuji Photo Film Co Ltd 画像撮像装置
WO2003044586A1 (en) * 2001-10-16 2003-05-30 Accu Sort Systems, Inc. Linear imager rescaling method
JP2003168071A (ja) * 2001-11-30 2003-06-13 Sanyo Electric Co Ltd 2次元バーコードの読み取り方法
US20040003052A1 (en) * 2002-03-20 2004-01-01 Fuji Photo Film Co., Ltd. Data detection method, apparatus, and program
US7365875B2 (en) * 2002-05-14 2008-04-29 Canon Kabushiki Kaisha Image processing apparatus, image processing method, program, and recording medium
US7567360B2 (en) * 2003-03-27 2009-07-28 Canon Kabushiki Kaisha Image forming system, method and program of controlling image forming system, and storage medium
US7337970B2 (en) * 2004-12-03 2008-03-04 Symbol Technologies, Inc. Barcode scanner decoding
JP4617328B2 (ja) * 2006-07-20 2011-01-26 キヤノン株式会社 画像処理装置及びその処理方法
US7780084B2 (en) * 2007-06-29 2010-08-24 Microsoft Corporation 2-D barcode recognition
US8199370B2 (en) * 2007-08-29 2012-06-12 Scientific Games International, Inc. Enhanced scanner design
US8379914B2 (en) * 2008-01-18 2013-02-19 Mitek Systems, Inc. Systems and methods for mobile image capture and remittance processing
EP2409260A1 (en) * 2009-03-17 2012-01-25 Scientific Games Holdings Limited Optical signature to enable image correction
CN101882207B (zh) * 2010-06-01 2012-06-20 福建新大陆电脑股份有限公司 Data Matrix码条码解码芯片及其解码方法
CN101908125B (zh) * 2010-06-01 2014-07-02 福建新大陆电脑股份有限公司 Qr码条码解码芯片及其解码方法
CN101882210B (zh) * 2010-06-01 2012-06-27 福建新大陆电脑股份有限公司 矩阵式二维条码解码芯片及其解码方法
US8792748B2 (en) * 2010-10-12 2014-07-29 International Business Machines Corporation Deconvolution of digital images

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07121673A (ja) * 1993-10-28 1995-05-12 Hitachi Ltd 情報提供方法およびその装置
JP2007520001A (ja) 2004-01-14 2007-07-19 インターナショナル バーコード コーポレイション スキャン可能な歪補償用仮想バーコード画像
JP2006018655A (ja) 2004-07-02 2006-01-19 Ricoh Co Ltd 文書処理システム
JP2009129269A (ja) 2007-11-26 2009-06-11 Nec Soft Ltd 情報読取装置及び情報読取方法

Also Published As

Publication number Publication date
KR20130077898A (ko) 2013-07-09
US8781251B2 (en) 2014-07-15
US20130177245A1 (en) 2013-07-11
CN103562931B (zh) 2016-12-07
BR112013013425A2 (pt) 2016-10-11
JPWO2012164686A1 (ja) 2014-07-31
EP2634725A1 (en) 2013-09-04
ES2603153T3 (es) 2017-02-23
JP4917698B1 (ja) 2012-04-18
BR112013013425B1 (pt) 2021-03-02
EP2634725B1 (en) 2016-08-31
CA2816247A1 (en) 2012-12-06
EP2634725A4 (en) 2014-06-11
CN103562931A (zh) 2014-02-05
WO2012164686A1 (ja) 2012-12-06
CA2816247C (en) 2016-02-23

Similar Documents

Publication Publication Date Title
KR101322953B1 (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
JP2004054529A (ja) 2次元コード読み取り方法,2次元コード読み取りプログラム,該2次元コード読み取りプログラムの記録媒体及び2次元コード読み取り装置
CN105009170A (zh) 物体识别设备、方法和存储介质
JP2007241356A (ja) 画像処理装置および画像処理プログラム
WO2010095460A1 (ja) 画像処理システム、画像処理方法および画像処理プログラム
US8908988B2 (en) Method and system for recovering a code image including blurring
CN101882220A (zh) 一种基于动态模板的条码图像校正方法及校正点获取方法
CN113033559A (zh) 一种基于目标检测的文本检测方法及装置、存储介质
CN107609448B (zh) 条码解码方法以及条码解码装置
CN101882213A (zh) 一种条码图像采样方法
US9129171B2 (en) Code reading device and code reading method
CN115063279A (zh) 一种文本水印图像的预处理方法和装置
CN101908144B (zh) 一种条码图像校正方法及校正点获取方法
JP4910635B2 (ja) 画像処理装置及び画像処理プログラム
CN113971738A (zh) 图像检测方法、装置、电子设备及存储介质
CN111860025B (zh) 二维码感兴趣区域定位方法及装置
CN107392285B (zh) 一种形变条码的制作方法及系统
JP5563390B2 (ja) 画像処理装置およびその制御方法、及びプログラム
CN117648905B (zh) 热敏打印机标签指令解析方法及相关装置
CN111263242B (zh) 帧序列处理方法、系统和存储介质
CN111681161B (zh) 折叠二维码图像的还原方法、设备及计算机可读存储介质
JP6815712B1 (ja) 画像処理システム、画像処理方法、画像処理プログラム、画像処理サーバ、及び学習モデル
CN111882570A (zh) 边缘定位方法、装置、存储介质及电子设备
JP5445056B2 (ja) 2次元コード読取装置、及び、2次元コードからデータを読み取る2次元コード読取方法
JP4869364B2 (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant