KR102396885B1 - 문자를 포함한 이미지 정렬 처리방법 - Google Patents

문자를 포함한 이미지 정렬 처리방법 Download PDF

Info

Publication number
KR102396885B1
KR102396885B1 KR1020190163154A KR20190163154A KR102396885B1 KR 102396885 B1 KR102396885 B1 KR 102396885B1 KR 1020190163154 A KR1020190163154 A KR 1020190163154A KR 20190163154 A KR20190163154 A KR 20190163154A KR 102396885 B1 KR102396885 B1 KR 102396885B1
Authority
KR
South Korea
Prior art keywords
image
character
rectangular
text
mobile terminal
Prior art date
Application number
KR1020190163154A
Other languages
English (en)
Other versions
KR20210072639A (ko
Inventor
박지윤
Original Assignee
주식회사 제이에이치씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 제이에이치씨 filed Critical 주식회사 제이에이치씨
Priority to KR1020190163154A priority Critical patent/KR102396885B1/ko
Publication of KR20210072639A publication Critical patent/KR20210072639A/ko
Application granted granted Critical
Publication of KR102396885B1 publication Critical patent/KR102396885B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)

Abstract

본 발명은 문자를 포함한 이미지 정렬 처리방법에 관한 것으로서, 특히 사용자 단말기에서 취득한 사각형상의 이미지를 문자 인식 서버로 전송한 후 인식된 문자와 각각의 문자의 좌표값 변화에 따라 사각형상의 이미지를 정방향으로 회전하여 정렬 처리할 수 있도록 한 문자를 포함한 이미지 정렬 처리방법에 관한 것이다.
본 발명의 상기 목적은 문자를 포함한 이미지 정렬 처리방법에 있어서, 모바일 단말기에서 앱을 구동하여 사각형상의 이미지를 취득한 후 직사각형이미지로 변환하는 이미지 취득 단계; 상기 모바일 단말기가 상기 직사각형 이미지를 문자인식 서버로 전송하는 이미지 전송 단계; 상기 문자인식 서버로부터 전송된 문자인식결과에 따른 문자 및 상기 문자 각각의 좌표값을 상기 모바일 단말기가 수신하는 인식결과 수신단계; 및 상기 문자를 상기 모바일 단말기의 앱에 입력되어야 할 입력란에 입력하고, 상기 문자 각각의 좌표값 변화에 따라 상기 이미지를 정방향으로 회전하는 입력처리 단계;로 구성되는 것을 기술적인 특징으로 한다.

Description

문자를 포함한 이미지 정렬 처리방법{Method for alligning the image include the text}
본 발명은 문자를 포함한 이미지 정렬 처리방법에 관한 것으로서, 특히 사용자 단말기에서 취득한 사각형상의 이미지를 문자 인식 서버로 전송한 후 인식된 문자와 각각의 문자의 좌표값 변화에 따라 사각형상의 이미지를 정방향으로 회전하여 정렬 처리할 수 있도록 한 문자를 포함한 이미지 정렬 처리방법에 관한 것이다.
일반적으로 스마트폰과 같은 무선 단말기 사용자가 유선 또는 무선 인터넷을 통해 데이터 변환 및 저장, 전송 서비스를 제공하는 시스템이 보편화되어 있다.
이와 관련한 종래의 기술로서는 대한민국 공개특허 제10-2005-0080410호의 '이미지-텍스트 변환 서비스 제공 방법'이 제안된 바 있으며, 이를 도 1을 참조하여 설명하면 다음과 같다.
종래의 기술은 이미지-텍스트 변환 시스템(10)은 예컨대 WAP을 기반으로 한 무선인터넷을 통해 무선단말기(40)로부터 이미지 데이터를 받아들이고, 이미지에 포함된 텍스트를 추출함으로써 이미지-텍스트 변환 작업을 수행한다. 변환 시스템(10)은 변환된 텍스트를 무선단말기(40)에 제공할 수도 있고, 유선 클라이언트(42) 또는 그밖의 클라이언트의 요구에 응답하여 월드와이드웹(WWW)을 기반으로 한 유선인터넷을 통해 해당 클라이언트에 제공할 수도 있도록 하고 잇으며, 변환 시스템(10)에 있어서, WAP 서버(12)는 무선인터넷을 통해 무선단말기(40)로부터 상기 이미지 데이터를 받아들여 데이터베이스(DB) 서버(16)에 저장하고, 변환된 텍스트를 무선인터넷을 통해 무선단말기(40)에 제공한다. 변환 서버(14)는 DB 서버(16)에 저장된 이미지 데이터를 WAP 서버(12)의 요구에 따라 또는 등록 순서에 따라 순차적으로 텍스트로 변환하여 다시 DB 서버(16)에 저장한다. WEB 서버(18)는 유선 클라이언트(42)의 요구에 응답하여 변환된 텍스트를 유선인터넷을 통해 해당 클라이언트에 제공한다.
또한, 무선단말기(40)에 촬영/저장 관리 프로그램이 적재되어 있어서, 이 촬영/저장 관리 프로그램(40)이 카메라의 구동을 제어하고 촬영된 이미지를 변환 시스템(10)에 전송하며, 변환 시스템(10)에 의해 변환된 텍스트 데이터를 받아들여 주소록 DB에 삽입하게 된다.
그러나, 이러한 종래의 기술은 이미지에 포함된 정보를 텍스트로 변환하여 무선 단말기 사용자에게 제공하는 것에 그치고 있다.
또한 다른 종래의 기술로서는 대한민국 공개특허 제10-2017-0098091호의 '명함 인식 장치 및 이에 의한 명함 인식 방법'이 제안된 바 있다. 이를 도 2를 참조하여 설명하면 다음과 같다.
S11 단계에서, 명함 인식 장치는 이미지 내의 에지(edge)를 검출하고, S12 단계에서, 검출된 에지에 기초하여 이미지 내에 포함된 적어도 하나의 오브젝트를 식별한다. 명함 인식 장치는 폐곡선으로 이루어진 에지 각각을 오브젝트로서 식별할 수 있다. S13 단계에서, 명함 인식 장치는 이미지 내에서 식별된 적어도 하나의 오브젝트를 사각 이미지로 라벨링(labelling)한다. S14 단계에서, 명함 인식 장치는 라벨링된 사각 이미지의 폭 길이 및 높이 길이에 기초하여 명함 오브젝트를 결정한다. S15 단계에서, 명함 인식 장치는 S14 단계에서 결정된 명함 오브젝트에서 텍스트를 인식하여 저장한다. 명함 인식 장치는 명함 오브젝트에서 이름, 회사명, 전화번호, 이메일 주소 등의 텍스트를 추출 및 저장할 수 있다.
그러나, 단순히 이러한 종래의 기술은 에지 검출을 통해 명함 오브젝트를 결정함으로써 명함의 인식률 향상 및 명함 인식 장치에 가해지는 부하를 경감하고자 하고자 하였으나, 사용자 단말기인 스마트폰에 부하가 주어지는 것이 여전하며, 명함 오브젝트의 정렬과 관련된 기술적인 사항을 개시하고 있지 못한다.
상기와 같은 종래 기술의 문제점을 해결하기 위하여 안출된 본 발명은 문자를 포함하는 이미지를 직사각형 이미지로 변환하여 외부 문자인식 서버로 전송한 후 문자 인식된 결과를 모바일 단말기가 수신하여 구동중인 앱에 입력함으로써 모바일 단말기의 구동에 따른 부담을 경감하기 위한 목적이 있다.
또한, 본 발명은 직사각형 이미지를 외부 문자인식 서버로 전송하여 문자 인식된 각각의 문자 좌표를 수신하여 이를 통하여 문자를 포함하는 이미지를 정방향으로 간편하게 회전시킬 수 있도록 하기 위한 또 다른 목적이 있다.
본 발명의 상기 목적은 문자를 포함한 이미지 정렬 처리방법에 있어서, 모바일 단말기에서 앱을 구동하여 사각형상의 이미지를 취득한 후 직사각형이미지로 변환하는 이미지 취득 단계; 상기 모바일 단말기가 상기 직사각형 이미지를 문자인식 서버로 전송하는 이미지 전송 단계; 상기 문자인식 서버로부터 전송된 문자인식결과에 따른 문자 및 상기 문자 각각의 좌표값을 상기 모바일 단말기가 수신하는 인식결과 수신단계; 및 상기 문자를 상기 모바일 단말기의 앱에 입력되어야 할 입력란에 입력하고, 상기 문자 각각의 좌표값 변화에 따라 상기 이미지를 정방향으로 회전하는 입력처리 단계;로 구성되는 것을 특징으로 한다.
따라서, 본 발명의 문자를 포함한 이미지 정렬 처리방법은 문자를 포함하는 이미지를 외부 문자인식 서버로 전송하여 문자 인식된 결과를 모바일 단말기가 수신함으로써 모바일 단말기의 구동에 따른 부담을 경감할 수 있는 효과가 있다.
또한, 본 발명은 종래의 기술들이 수평면에서 이미지를 취득하는 경우에는 모바일 단말기 내부 센서의 값을 활용할 수 없어 이미지를 정렬 처리하기에는 어려움이 있어서 문자를 포함하는 이미지를 외부 문자인식 서버로 전송하여 문자 인식된 각각의 문자 좌표를 수신하여 이를 통하여 문자를 포함하는 이미지를 정방향으로 간편하게 회전시켜 정렬하여 수평면에서의 이미지의 정방향 정렬을 용이하게 할 수 있는 효과가 있다.
도 1은 종래의 기술에 따른 이미지-텍스트 변환 시스템의 실시예와 네트웍 환경을 보여주는 도면,
도 2는 종래의 기술에 따른 명함 인식 장치 및 이에 의한 명함 인식 방법의 순서도,
도 3은 본 발명에 따른 문자를 포함한 이미지 정렬 처리방법의 순서도,
도 4는 본 발명에 따른 인식된 문자와 방향성을 결정하기 위한 좌표관계를 설명하기 위한 도면,
도 5는 본 발명에 따른 x좌표값의 변화에 따른 방향성 결정 예시도,
도 6은 본 발명에 따른 y좌표값의 변화에 따른 방향성 결정 예시도이다.
본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다.
따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다.
도 3은 본 발명에 따른 본 발명에 따른 문자를 포함한 이미지 정렬 처리방법의 순서도이다. 도 3에 도시된 바와 같이, 사용자가 휴대한 모바일 단말기에서 문자 인식 및 이미지 정렬용 앱을 구동하여 사각형상의 이미지를 취득한 후 직사각형 이미지로 변환하여 이미지를 취득한다(S110).
여기서, 문자를 포함한 이미지는 명함 이미지로서, 문자 인식 및 이미지 정렬용 앱에 의해 취득된 사각형상 이미지의 꼭지점을 기준으로 이미지 취득 영역이 설정된다.
이후, 모바일 단말기가 직사각형 이미지를 문자인식 서버로 전송한다(S120). 여기서, 문자인식 서버는 구글 등의 상용화된 문자인식 서버를 사용하는 것이 바람직하다.
이후 문자인식 서버로부터 전송된 문자인식결과에 따른 문자 및 문자 각각의 좌표값을 상기 모바일 단말기가 수신한다(S130).
여기서, 좌표값은 비트맵 데이터이며, 문자 각각의 좌표는 도 4에 도시한 바와 같이 (a) 정방향 및 (b) 역방향의 "나는"이라는 문자 인식결과가 있는 경우 문자를 포함한 이미지의 방향성을 탐지하기 위한 좌표값은 문자의 4개의 꼭지점중에서 (x1, y1)를 기준으로 하는 것이 바람직하다.
다만, (x1, y1)외의 1개 좌표값 또는 (x1, y1)와 다른 하나 이상의 좌표값을 기준으로 하는 것도 가능함은 물론이다.
여기서, 본 발명에서 사각형상은 직사각형의 형상을 가지는 것이 바람직하나, 그 형상이 사각형, 사다리꼴, 평행사변형, 마름모 또는 정사각형중 어느 하나인 직사각형 형상을 갖도록 이미지를 변환한다.
이후, 문자 인식된 각각의 문자를 모바일 단말기의 앱에 입력되어야 할 입력란에 입력하고, 문자 각각의 비트맵 좌표값 변화에 따라 직사각형 이미지를 정방향으로 회전한다(S140).
여기서, 도 5와 도 6에 사각형 비트맵 좌표값 변화에 따른 방향성 결정 관계를 설명하기 위한 방향성 결정 예시도를 도시한 것으로 직사각형 이미지의 가로 길이 방향 또는 세로 길이 방향중 어느 하나 이상의 비트맵 좌표값 변화를 이용하는 것이 가능하다.
도 5는 본 발명에 따른 좌표값중 직사각형 이미지의 가로 길이 방향 비트맵 좌표값 변화에 따른 방향성 결정 예시도로서, 각 문구의 (x1,y1)좌표값이 도 5와 같다면 (a) 정방향의 경우 x1의 값은 1=>2=>3=>4와 같이 증가하며, (b) 역방향의 경우 x1의 값은 13=>12=>11=>10과 같이 감소한다.
도 6은 본 발명에 따른 좌표값중 직사각형 이미지의 세로 길이 방향 비트맵 좌표값 변화에 따른 방향성 결정 예시도로서, 각 행의 첫번째 문자의 (x1,y1)좌표값이 도 6과 같다면 (a) 정방향의 경우 y1값이 10=>9=>8과 같이 감소하며, (b) 역방향의 경우 y1값이 10=>11=>12와 같이 증가한다.
이와 같이 문자를 포함한 이미지 원본은 도 5 및 도 6에 예시한 바와 같이 문자인식된 문자의 순서와 함께 수신된 사각형 비트맵 좌표값을 이용하여 방향성을 예측하고, 정방향인 경우 이미지의 방향성은 그대로 유지하고, 역방향인 경우 이미지를 180도 회전시킨다.
본 발명은 이상에서 살펴본 바와 같이 바람직한 실시예를 들어 도시하고 설명하였으나, 상기한 실시예에 한정되지 아니하며 본 발명의 정신을 벗어나지 않는 범위 내에서 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변경과 수정이 가능할 것이다.

Claims (6)

  1. 문자를 포함한 이미지 정렬 처리방법에 있어서,
    모바일 단말기에서 앱을 구동하여 사각형상의 이미지를 취득한 후 직사각형이미지로 변환하는 이미지 취득 단계;
    상기 모바일 단말기가 상기 직사각형 이미지를 문자인식 서버로 전송하는 이미지 전송 단계;
    상기 문자인식 서버로부터 전송된 문자인식결과에 따른 문자 및 상기 문자 각각의 좌표값을 상기 모바일 단말기가 수신하는 인식결과 수신단계; 및
    상기 문자를 상기 모바일 단말기의 앱에 입력되어야 할 입력란에 입력하고, 상기 문자 각각의 좌표값 변화에 따라 상기 직사각형 이미지를 정방향으로 회전하는 입력처리 단계;로 구성되며,
    상기 좌표값은 비트맵 데이터이며, 상기 직사각형 이미지의 정방향 여부 판단은 상기 문자의 사각형 비트맵 좌표값 변화를 이용하여 판단하며, 상기 직사각형 이미지는 상기 사각형상의 이미지의 꼭지점을 기준으로 설정되는 영역이며, 상기 사각형 비트맵 좌표값 변화는 상기 직사각형 이미지의 가로 길이 방향 또는 세로 길이 방향중 어느 하나 이상의 좌표값 변화인 것을 특징으로 하는 문자를 포함한 이미지 정렬 처리방법.
  2. 삭제
  3. 제1항에 있어서,
    상기 문자를 포함한 이미지는 명함 이미지인 것을 특징으로 하는 문자를 포함한 이미지 정렬 처리방법.
  4. 삭제
  5. 삭제
  6. 삭제
KR1020190163154A 2019-12-09 2019-12-09 문자를 포함한 이미지 정렬 처리방법 KR102396885B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190163154A KR102396885B1 (ko) 2019-12-09 2019-12-09 문자를 포함한 이미지 정렬 처리방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190163154A KR102396885B1 (ko) 2019-12-09 2019-12-09 문자를 포함한 이미지 정렬 처리방법

Publications (2)

Publication Number Publication Date
KR20210072639A KR20210072639A (ko) 2021-06-17
KR102396885B1 true KR102396885B1 (ko) 2022-05-12

Family

ID=76603901

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190163154A KR102396885B1 (ko) 2019-12-09 2019-12-09 문자를 포함한 이미지 정렬 처리방법

Country Status (1)

Country Link
KR (1) KR102396885B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113963339A (zh) * 2021-09-02 2022-01-21 泰康保险集团股份有限公司 一种信息提取方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001266067A (ja) * 2000-03-15 2001-09-28 Sharp Corp 文字認識装置および方法ならびに文字認識プログラムを記録したコンピュータで読取可能な記録媒体
JP2006098590A (ja) * 2004-09-29 2006-04-13 Casio Comput Co Ltd 画像投影装置、画像投影方法、及び画像位置補正プログラム
KR101306661B1 (ko) * 2012-10-09 2013-09-10 신현섭 클라우드 ocr 명함 정보 관리 시스템

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140137254A (ko) * 2013-05-22 2014-12-02 서울시립대학교 산학협력단 문자 인식을 이용한 위치 정보 제공 단말, 서버, 시스템 및 방법
KR102609648B1 (ko) * 2016-02-19 2023-12-05 대전대학교 산학협력단 명함 인식 장치 및 이에 의한 명함 인식 방법
KR102052580B1 (ko) * 2017-12-28 2019-12-05 삼성중공업 주식회사 모바일 도면 제공 시스템 및 모바일 도면 제공 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001266067A (ja) * 2000-03-15 2001-09-28 Sharp Corp 文字認識装置および方法ならびに文字認識プログラムを記録したコンピュータで読取可能な記録媒体
JP2006098590A (ja) * 2004-09-29 2006-04-13 Casio Comput Co Ltd 画像投影装置、画像投影方法、及び画像位置補正プログラム
KR101306661B1 (ko) * 2012-10-09 2013-09-10 신현섭 클라우드 ocr 명함 정보 관리 시스템

Also Published As

Publication number Publication date
KR20210072639A (ko) 2021-06-17

Similar Documents

Publication Publication Date Title
US10013624B2 (en) Text entity recognition
US9436883B2 (en) Collaborative text detection and recognition
US20190205618A1 (en) Method and apparatus for generating facial feature
US8965117B1 (en) Image pre-processing for reducing consumption of resources
US8879785B1 (en) Virtual postage based on image recognition
CN110136198B (zh) 图像处理方法及其装置、设备和存储介质
US10163007B2 (en) Detecting orientation of textual documents on a live camera feed
CN106934632A (zh) 发票验真方法及发票验真系统
US11341605B1 (en) Document rectification via homography recovery using machine learning
US20130339525A1 (en) Augmented reality system, apparatus and method
CN110751146A (zh) 文本区域检测方法、装置、电子终端和计算机可读存储介质
CN112686257A (zh) 一种基于ocr的店头文字识别方法及系统
KR102396885B1 (ko) 문자를 포함한 이미지 정렬 처리방법
US9582230B1 (en) Method and system for automated form document fill-in via image processing
CN108304840B (zh) 一种图像数据处理方法以及装置
US20220351512A1 (en) Systems and methods for augmented reality inventory tracking
US20190228486A1 (en) Method and system for acquiring data files of blocks of land and of building plans and for making matches thereof
CN113255629B (zh) 文档处理方法、装置、电子设备及计算机可读存储介质
US20220269396A1 (en) Dynamic targeting of preferred objects in video stream of smartphone camera
US20150117781A1 (en) Method, apparatus and system for information identification
CN114637930A (zh) 信息共享方法、装置、电子设备及计算机可读存储介质
CN107944336A (zh) 基于云计算的手写签名鉴别系统
CN103279754A (zh) 名片云识别方法及系统
CN113780269A (zh) 图像识别方法、装置、计算机系统及可读存储介质
US9208380B2 (en) Methods and systems for recognizing handwriting in handwritten documents

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant