KR102513456B1 - 그림파일 형태의 그래프 데이터 인식 및 추출하는 시스템 및 그 방법 - Google Patents

그림파일 형태의 그래프 데이터 인식 및 추출하는 시스템 및 그 방법 Download PDF

Info

Publication number
KR102513456B1
KR102513456B1 KR1020220121841A KR20220121841A KR102513456B1 KR 102513456 B1 KR102513456 B1 KR 102513456B1 KR 1020220121841 A KR1020220121841 A KR 1020220121841A KR 20220121841 A KR20220121841 A KR 20220121841A KR 102513456 B1 KR102513456 B1 KR 102513456B1
Authority
KR
South Korea
Prior art keywords
graph
data
unit
axis
image
Prior art date
Application number
KR1020220121841A
Other languages
English (en)
Inventor
조남제
Original Assignee
주식회사 오르비스파브리카
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 오르비스파브리카 filed Critical 주식회사 오르비스파브리카
Priority to KR1020220121841A priority Critical patent/KR102513456B1/ko
Application granted granted Critical
Publication of KR102513456B1 publication Critical patent/KR102513456B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Character Input (AREA)

Abstract

그림파일 형태의 그래프 데이터 인식 및 추출 시스템 및 그 방법이 개시된다. 본 발명의 일실시례에 따른 그림파일 형태의 그래프 데이터 인식 및 추출 시스템은 입력된 원본 이미지를 기설정된 형식의 이미지 데이터로 변환하고, 상기 이미지 데이터에서 노이즈를 제거하는 이미지 전처리부; 상기 이미지 전처리부에서 처리된 이미지 데이터를 분석하여 적어도 하나의 그래프가 존재하는지 유무를 판단하고, 상기 그래프가 존재하는 경우, 상기 그래프의 종류를 판단하는 그래프 판단부; 상기 그래프 판단부에서 판단된 그래프 종류에 기초하여 상기 그래프에서 적어도 하나의 데이터를 추출하고 매핑하는 데이터 매핑부; 및 상기 데이터 매핑부에서 도출된 데이터를 취합하여 그래프 변환 데이터를 생성하는 데이터 출력부;를 포함한다.

Description

그림파일 형태의 그래프 데이터 인식 및 추출하는 시스템 및 그 방법{GRAPH DATA RECOGNITION AND EXTRACTION SYSTEM AND THE METHOD OF THEREOF}
본 발명은 이미지 데이터에 포함된 그래프 정보 인식 및 추출 시스템 및 그 방법에 관한 것으로 보다 상세하게는, 파일 형태의 이미지 데이터를 입력받고, 이미지 데이터 포함된 그래프 정보를 인식 및 추출하여 데이터화 할 수 있는 그림파일 형태의 그래프 데이터 인식 및 추출 시스템 및 그 방법에 관한 것이다.
최근 이미지 내에 포함된 한글, 영어, 숫자 등을 인식하여 편집 가능하게 텍스트로 표시해주는 광학 문자 인식 서비스(OCR, Optical Character Recognition)가 널리 이용되고 있다.
텍스트의 인식은 전자장치가 이미지 파일을 분석함으로써 수행된다. 텍스트를 인식하기 위한 종래기술의 일례로서 영역 기반(region-based) 인식이 있다. 영역 기반 인식은 영상을 글자마다 분할하는 세그멘테이션을 수행하고, 분할된 영역마다 텍스트가 존재하는지 판단하고, 영역에 텍스트가 존재하는 경우, 한글인지 영문인지 등을 판단한다. 나아가 분할된 영역에 텍스트의 언어에 맞게 광학 문자 인식(OCR)을 수행하여 이미지에 텍스트를 인식한다.
종래기술인 한국공개특허공보 제10-2010-0120753호는 이미지 센서를 통해 촬영되는 영상을 영상처리하여 특정 이미지 영역의 비텍스트 정보를 제거하고, 문자로 판단된 이미지 영역의 정보를 이진 정보로 변환하는 문자인식을 위한 이미지 센서 및 이미지 센싱 방법에 대하여 개시하고 있다.
그러나, 영역 기반 인식을 통해 이미지에 포함된 데이터를 인식하려는 경우, 이미지에 세그멘테이션이 반드시 수행되어야 하므로, 영역 기반 인식은 이미지에 포함된 글자 수가 많을수록 글자별로 영역을 나누어야 하기 때문에 이미지 상에서 텍스트를 인식하는 시간이 오래 걸리는 단점이 있다. 또한 영역에 포함된 언어를 사전에 파악해 두어야 텍스트 인식이 가능하므로 여러 단계를 걸쳐 텍스트를 인식하는 문제점이 있다.
또한, 이미지 상에 한글, 수식, 영문이 혼합하여 존재하는 경우, 각 글자마다 높이 또는 합자(ligature) 등과 같은 특성이 상이함으로 인해 세그멘테이션을 정밀하게 수행하는 것이 어려운 문제가 있다.
이러한 종래기술의 문제점을 개선하기 위하여 한국등록특허공보 제10-2189373호는 뉴럴 네트워크(neural network)를 활용하여 이미지로부터 텍스트를 생성하는 장치 및 방법에 대하여 개시하고 있다.
보다 상세하게는, 뉴럴 네트워크(neural network)는 인간의 두뇌 신경망을 모방하여 정보를 처리하는 네트워크 구조로 학습이 완료된 알고리즘을 적용하여 이미지 또는 텍스트의 추론하는 기술을 의미한다.
그러나, 뉴럴 네트워크와 같은 딥러닝 기법을 이용한 이미지 분석 기술이 개발되고 있으나, 학습 속도가 현저히 느리고 연산 복잡도가 높으며, 생성된 이미지의 해상도가 낮다는 문제점이 있다.
따라서, 이미지 데이터에 포함된 텍스트 및 그래프 정보를 정확하게 인식하여 추출하고, 사용자의 요청에 따라 원하는 형태의 데이터로 생성할 수 있는 그림파일 형태의 그래프 데이터 인식 및 추출 시스템 및 그 방법에 관한 연구가 필요하다.
본 발명은 입력된 그림 파일 형태의 이미지 데이터를 분석하여, 이미지 데이터에 포함된 그래프를 인식하고, 그래프에 대응하는 데이터를 산출함으로써, 종이 형태로 존재하는 정보를 디지털 데이터로 용이하게 변환할 수 있는 그림파일 형태의 그래프 데이터 인식 및 추출 시스템 및 그 방법을 제공하는 데 그 목적이 있다.
또한, 이미지 데이터로부터 인식된 그래프의 픽셀 분포에 기초하여 그래프 종류를 결정하고 그래프 종류에 기초하여 축 영역 및 데이터 영역을 추출함으로써, 그래프 특성을 고려하여 데이터 영역에 포함된 좌표 정보를 정확하게 산출할 수 있는 그림파일 형태의 그래프 데이터 인식 및 추출 시스템 및 그 방법을 제공하는 데 그 목적이 있다.
본 발명이 해결하고자 하는 과제들은 이상에서 언급한 과제로 제한되지 않으며, 여기에 언급되지 않은 본 발명이 해결하려는 또 다른 과제들은 아래의 기재로부터 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명의 일실시례에 따른 그림파일 형태의 그래프 데이터 인식 및 추출 시스템은 입력된 원본 이미지를 기설정된 형식의 이미지 데이터로 변환하고, 이미지 데이터에서 노이즈를 제거하는 이미지 전처리부, 이미지 전처리부에서 처리된 이미지 데이터를 분석하여 적어도 하나의 그래프가 존재하는지 유무를 판단하고, 그래프가 존재하는 경우, 그래프의 종류를 판단하는 그래프 판단부, 그래프 판단부에서 판단된 그래프 종류에 기초하여 그래프에서 적어도 하나의 데이터를 추출하고 매핑하는 데이터 매핑부 및 데이터 매핑부에서 도출된 데이터를 취합하여 그래프 변환 데이터를 생성하는 데이터 출력부를 포함한다.
또한, 이미지 전처리부는 원본 데이터를 기설정된 형식으로 변환하여 제1 이미지 데이터를 생성하는 파일형식 변환부, 파일형식 변환부에서 생성된 제1 이미지 데이터에서 노이즈를 제거하고 제2 이미지 데이터를 생성하는 노이즈 제거부 및 기설정된 조건에 기초하여 노이즈 제거부에서 생성된 제2 이미지 데이터의 해상도를 조정하여 제3 이미지 데이터를 생성하는 해상도 설정부를 포함하는 것을 특징으로 한다.
또한, 그래프 판단부는, 이미지 전처리부에서 변환된 이미지 데이터에 적어도 하나의 그래프가 존재하는지 여부를 판단하는 그래프 인식부 및 그래프 인식부에서 그래프가 존재하는 것으로 판단된 경우, 그래프의 픽셀 분포도 및 분포 형상에 기초하여 그래프의 종류를 도트, 라인 및 영역 중 어느 하나로 판단하는 그래프 종류 결정부를 포함하는 것을 특징으로 한다.
또한, 데이터 매핑부는, 그래프 판단부에서 결정된 그래프 종류에 기초하여 그래프의 축 영역 및 데이터 영역을 구분하는 영역 판단부, 축 영역에서 적어도 하나의 축 라벨, 축 최대값, 축 최소값 및 축 단위값을 추출하는 축 영역 추출부, 데이터 영역에서 적어도 하나의 좌표 정보를 추출하는 데이터 영역 추출부 및 축 최대값, 축 최소값 및 축 단위값에 기초하여 좌표 정보에 대응하는 좌표 매핑 데이터를 산출하는 좌표 매핑부를 포함하는 것을 특징으로 한다.
또한, 본 발명의 일실시례에 따른 그림파일 형태의 그래프 데이터 인식 및 추출 방법은 적어도 하나의 그림 파일 형태의 원본 이미지가 입력되는 제1 단계, 원본 이미지를 기설정된 형식의 이미지 데이터로 변환하고, 이미지 데이터에 포함된 노이즈를 제거하고 이미지 데이터의 해상도를 조정하여 이미지 전처리를 완료하는 제2 단계, 이미지 전처리가 완료된 이미지 데이터를 분석하여 그래프 유무를 판단하고, 그래프가 존재하는 경우, 그래프의 종류를 결정하는 제3 단계, 그래프 종류가 결정된 경우, 그래프에서 축 영역 및 데이터 영역을 추출하는 제4 단계, 축 영역에서 적어도 하나의 축 라벨, 축 최대값, 축 최소값 및 축 단위값을 추출하는 제5 단계, 데이터 영역에서 적어도 하나의 좌표 정보를 추출하는 제6 단계, 축 최대값, 축 최소값 및 축 단위값에 기초하여 좌표 정보에 대응하는 좌표 매핑 데이터를 산출하는 제7 단계 및 좌표 매핑 데이터를 취합하여 그래프 변환 데이터를 생성하는 제8 단계를 포함한다.
본 발명의 그림파일 형태의 그래프 데이터 인식 및 추출 시스템 및 그 방법은 입력된 그림 파일 형태의 이미지 데이터를 분석하여, 이미지 데이터에 포함된 그래프를 인식하고, 그래프에 대응하는 데이터를 산출함으로써, 종이 형태로 존재하는 정보를 디지털 데이터로 용이하게 변환할 수 있는 효과를 가진다.
또한, 이미지 데이터로부터 인식된 그래프의 픽셀 분포에 기초하여 그래프 종류를 결정하고 그래프 종류에 기초하여 축 영역 및 데이터 영역을 추출함으로써, 그래프 특성을 고려하여 데이터 영역에 포함된 좌표 정보를 정확하게 산출할 수 있는 효과를 가진다.
도 1은 본 발명의 일실시례에 따른 그림파일 형태의 그래프 데이터 인식 및 추출 시스템의 구성도이다.
도 2는 본 발명의 일실시례에 따른 그림파일 형태의 그래프 데이터 인식 및 추출 시스템의 이미지 전처리부를 설명하기 위한 도면이다.
도 3은 본 발명의 일실시례에 따른 그림파일 형태의 그래프 데이터 인식 및 추출 시스템의 그래프 판단부를 설명하기 위한 도면이다.
도 4 내지 도 6은 본 발명의 일실시례에 따른 그림파일 형태의 그래프 데이터 인식 및 추출 시스템의 데이터 매핑부를 설명하기 위한 도면이다.
도 7은 본 발명의 일실시례에 따른 그림파일 형태의 그래프 데이터 인식 및 추출 방법을 설명하기 위한 순서도이다.
이상과 같은 본 발명에 대한 해결하고자 하는 과제, 과제의 해결 수단, 발명의 효과를 포함한 구체적인 사항들은 다음에 기재할 실시례 및 도면들에 포함되어 있다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시례들을 참조하면 명확해질 것이다.
이하, 첨부된 도면을 참조하여 본 발명을 보다 상세히 설명하기로 한다.
도 1은 본 발명의 일실시례에 따른 그림파일 형태의 그래프 데이터 인식 및 추출 시스템의 구성도이고, 도 2는 본 발명의 일실시례에 따른 그림파일 형태의 그래프 데이터 인식 및 추출 시스템의 이미지 전처리부를 설명하기 위한 도면이고, 도 3은 본 발명의 일실시례에 따른 그림파일 형태의 그래프 데이터 인식 및 추출 시스템의 그래프 판단부를 설명하기 위한 도면이고, 도 4 내지 도 6은 본 발명의 일실시례에 따른 그림파일 형태의 그래프 데이터 인식 및 추출 시스템의 데이터 매핑부를 설명하기 위한 도면이고, 도 7은 본 발명의 일실시례에 따른 그림파일 형태의 그래프 데이터 인식 및 추출 방법을 설명하기 위한 순서도이다.
<실시례 1>
도 1을 참고하면, 본 발명의 일실시례에 따른 그림파일 형태의 그래프 데이터 인식 및 추출 시스템(100)은 이미지 전처리부(110), 그래프 판단부(120), 데이터 매핑부(130) 및 데이터 출력부(140)로 구성되되, 상기 이미지 전처리부(110)는 입력된 원본 이미지를 기설정된 형식의 이미지 데이터로 변환하고, 상기 이미지 데이터에서 노이즈를 제거할 수 있다.
보다 상세하게는, 도 2를 참고하면, 상기 이미지 전처리부(110)는 상기 입력된 원본 이미지를 기설정된 형식의 확장자로 변환하여 제1 이미지 데이터를 생성하는 파일 형식 변환부(111), 상기 파일 형식 변환부(111)에서 생성된 상기 제1 이미지 데이터에 기설정된 노이즈 제거 필터를 적용하여 노이즈를 제거하고 제2 이미지 데이터를 생성하는 노이즈 제거부(112) 및 기설정된 조건에 기초하여 상기 노이즈 제거부(112)에서 생성된 상기 제2 이미지 데이터의 해상도를 조정하여 제3 이미지 데이터를 생성하는 해상도 설정부(113)를 포함할 수 있다.
일례로, 상기 해상도 설정부(113)는 상기 노이즈 제거부(112)에서 생성된 제2 이미지 데이터에서 임의의 단위 영역을 추출하고, 상기 단위 영역당 해상도를 산출할 수 있다. 이때, 상기 산출된 해상도가 기설정된 기준 해상도 미만인 경우, 상기 이미지 데이터에 고해상도 변환 필터를 적용하여 상기 제2 이미지 데이터를 고해상도 이미지로 변환하여 제3 이미지 데이터를 생성할 수 있다.
일례로, 상기 노이즈 제거부(112)는 상기 파일 형식 변환부(111)에서 생성된 상기 제1 이미지 데이터를 기설정된 크기로 변환할 수 있다.
이때, 상기 노이즈 제거부(112)는 상기 제1 이미지 데이터의 가로 및 세로 비율을 기설정된 비율로 조정한 뒤, 크기를 조정할 수 있다.
한편, 상기 그래프 판단부(120)는 상기 이미지 전처리부(110)에서 처리된 이미지 데이터를 분석하여 적어도 하나의 그래프가 존재하는지 유무를 판단하고, 상기 그래프가 존재하는 경우, 상기 그래프의 종류를 판단할 수 있다.
보다 상세하게는, 도 3을 참고하면, 상기 그래프 판단부(120)는 상기 이미지 전처리부(110)에서 변환된 상기 이미지 데이터에 적어도 하나의 그래프가 존재하는지 여부를 판단하는 그래프 인식부(121) 및 상기 그래프 인식부(121)에서 상기 그래프가 존재하는 것으로 판단된 경우, 상기 그래프의 픽셀 분포도 및 분포 형상에 기초하여 그래프의 종류를 도트, 라인 및 영역 중 어느 하나로 판단하는 그래프 종류 결정부(122)를 포함할 수 있다.
보다 상세하게는, 상기 그래프 인식부(121)는 기저장된 그래프 샘플 템플릿을 미리 학습하고, 상기 그래프 샘플 템플릿과 대응되는 템플릿이 상기 이미지 데이터 내에 존재하는지 여부를 판단하여 상기 그래프를 인식할 수 있다.
또한, 상기 그래프 종류 결정부(122)는 상기 그래프 인식부(121)에서 그래프가 존재하는 것으로 판단된 경우, 상기 그래프에서 색상값이 같은 픽셀을 추출하여 적어도 하나의 픽셀 좌표값을 추출할 수 있다.
이때, 상기 추출된 픽셀 좌표값 중 원점에 가장 가까운 좌표를 기준 좌표로 설정하고, 상기 기준 좌표에서 기설정된 반경 이내에 존재하는 픽셀의 개수를 카운팅하여 상기 그래프의 종류를 판단할 수 있다.
예를 들어, 상기 기준 좌표로부터 상기 기설정된 반경 이내에 존재하는 상기 픽셀의 개수가 0개 또는 2개 이상 기설정된 제1 기준 개수 미만인 경우, 상기 그래프를 도트형 그래프로 판단하고, 상기 기준 좌표로부터 기설정된 반경 이내에 존재하는 상기 픽셀의 개수가 1개인 경우, 상기 그래프를 라인형 그래프로 판단할 수 있다.
또한, 상기 기준 좌표로부터 기설정된 반경 이내에 존재하는 상기 픽셀의 개수가 상기 제1 기준 개수 이상인 경우, 상기 그래프를 영역형 그래프로 판단하며, 상기 영역형 그래프는 막대형 그래프, 원형 그래프, 군집형 도트 그래프 등으로 구분될 수 있다.
보다 상세하게는, 상기 픽셀 좌표값 중 각 X 좌표를 기준으로 Y 좌표값이 기설정된 제2 기준 개수 이상 존재하는 경우, 상기 그래프를 막대형 그래프로 판단할 수 있다.
또한, 상기 픽셀 좌표값 중 하나의 중심 좌표가 존재하고, 상기 중심 좌표와 임의의 타 픽셀 좌표 사이의 거리에 기초하여 산출된 원주 길이와 상기 타 픽셀의 개수가 동일한 경우, 상기 그래프를 원형 그래프로 판단할 수 있다.
또한, 상기 픽셀 좌표값 중 각 X 좌표를 기준으로 Y 좌표값의 최소값 내지 최대값 사이에 대응되는 좌표값이 존재하지 않는 경우, 상기 그래프를 군집형 도트 그래프로 판단할 수 있다.
한편, 상기 데이터 매핑부(130)는 상기 그래프 판단부(120)에서 판단된 그래프 종류에 기초하여 상기 그래프에서 적어도 하나의 데이터를 추출하고 매핑할 수 있다.
보다 상세하게는, 도 4를 참고하면, 상기 데이터 매핑부(130)는 상기 그래프 판단부(120)에서 결정된 상기 그래프 종류에 기초하여 상기 그래프의 축 영역 및 데이터 영역을 구분하는 영역 판단부(131), 상기 축 영역에서 적어도 하나의 축 라벨, 축 최대값, 축 최소값 및 축 단위값을 추출하는 축 영역 추출부(132), 상기 데이터 영역에서 적어도 하나의 좌표 정보를 추출하는 데이터 영역 추출부(133) 및 상기 축 최대값, 상기 축 최소값 및 상기 축 단위값에 기초하여 상기 좌표 정보에 대응하는 좌표 매핑 데이터를 산출하는 좌표 매핑부(134)를 포함할 수 있다.
일례로, 상기 영역 판단부(131)는 상기 그래프 샘플 템플릿에 기초하여 상기 축 영역 및 상기 데이터 영역을 판단할 수 있다.
또한, 상기 축 영역 추출부(132)는 상기 영역 판단부(131)에서 구분된 상기 축 영역을 가로축(X축) 및 세로축(Y축)으로 구분하여 축 라벨, 축 최대값, 축 최소값 및 축 단위값을 추출할 수 있다.
예를 들어, 도 5 및 도 6을 참고하면, 상기 축 영역 추출부(132)는 상기 가로축(X축) 영역(510)에서 텍스트(511) 및 상기 텍스트의 위치 좌표(512)를 추출하되, 상기 텍스트의 위치 좌표(512)는 상기 텍스트(511) 영역의 하측 중심점으로 설정될 수 있다.
따라서, 상기 좌표 매핑부(134)는 상기 축 영역 추출부(132)에 추출된 텍스트 및 텍스트 위치 좌표에 기초하여 상기 데이터 영역 추출부(133)에서 추출된 픽셀의 좌표를 변환하여 좌표 매핑 데이터를 생성할 수 있다.
예를 들어, 상기 축 영역 추출부(132)에서 추출된 상기 가로축(X축) 영역에서 추출된 텍스트 '20'의 좌표는 (400, 3), 상기 가로축(X축) 영역에서 추출된 텍스트 '40'의 좌표는 (600, 3)이고, 상기 데이터 영역 추출부(133)에서 추출된 데이터 픽셀의 좌표는 (500, 500)인 경우, 상기 좌표 매핑부(134)는 상기 가로축(X축) 영역에서 추출된 텍스트 좌표에 기초하여 상기 데이터 픽셀의 가로축(X축) 데이터 '30'을 산출할 수 있다.
한편, 상기 데이터 출력부(140)는 상기 데이터 매핑부(130)에서 도출된 데이터를 취합하여 그래프 변환 데이터를 생성할 수 있다.
일례로, 상기 그래프 변환 데이터는 텍스트, 테이블 및 그래프 중 적어도 어느 하나의 형태로 변환될 수 있다.
또 다른 일례로, 그림파일 형태의 그래프 데이터 인식 및 추출 시스템(100)은 페이퍼 형태의 원본 이미지가 입력되는 이미지 스캐닝부(미도시) 및 상기 이미지 스캐닝부 (미도시)의 고장 여부를 판단하는 센서 모니터링부(미도시)를 더 포함할 수 있다.
보다 상세하게는, 상기 이미지 스캐닝부(미도시)는 상기 페이퍼 형태의 원본 이미지를 스캔하고, 상기 페이퍼 형태의 원본 이미지가 정상적으로 입력된 경우, 상기 입력된 원본 이미지 데이터를 상기 이미지 전처리부(110)로 전송할 수 있다.
이때, 상기 이미지 스캐닝부(미도시)는 상기 페이퍼 형태의 원본 이미지가 삽입되는 영역의 밝기를 측정하는 조도 센서를 포함할 수 있다.
따라서, 상기 이미지 스캐닝부(미도시)는 상기 조도 센서로부터 측정된 측정값이 기설정된 기준 데이터를 초과하는 경우, 상기 원본 이미지가 비정상적으로 입력된 것으로 판단하여, 상기 원본 이미지를 상기 이미지 전처리부(110)로 전송하지 않고, 상기 페이퍼 형태의 원본 이미지를 재입력하도록 요청하는 신호를 출력할 수 있다.
한편, 상기 센서 모니터링부(미도시)는 상기 [수학식 1]에 의해 산출되는 상기 조도 센서의 평균오차(Aerr)가 기설정된 한계오차(Serr)보다 큰 경우, 상기 조도 센서가 고장난 것으로 판단할 수 있다.
[수학식 1]
Figure 112022101245809-pat00001
여기서, Aerr은 평균오차, Taver는 상기 조도 센서 센서값의 전체평균, Paver는 상기 조도 센서 센서값 n개에 대한 일부평균, Tσ는 상기 조도 센서 센서값의 전체표준편차를 의미한다.
보다 상세하게는, Taver는 상기 조도 센서 센서값의 전체평균이며, 조도 센서가 정상 동작하는 기설정된 기간동안(ex. 한 달) 다수의 데이터를 수집하여 센싱되는 조도값들의 전체 평균을 산출한 값을 의미하고, Tσ는 상기 기설정된 기간동안(ex. 한 달) 다수의 데이터를 수집하여 센싱되는 조도값들의 전체표준편차를 산출한 값을 의미한다.
또한, Paver는 상기 조도 센서 센서값 n개에 대한 일부평균이며, 조도 센서가 현장 설치되어 사용되는 과정에서 기설정된 수(n개)의 조도값을 실시간으로 입력받고 상기 기설정된 수(n개)의 조도값에 대한 평균을 산출한 것으로서, 일부 조도값의 평균에 해당하므로 일부평균이라 지칭할 수 있다.
이 때, 일부평균을 이용하여 95%의 신뢰도로 추정평균값을 산출하면, 추정평균값(μ)은
Figure 112022101245809-pat00002
범위를 갖게 된다.
따라서, 추정평균값(μ)의 상한 또는 하한과 전체평균(Taver)과의 차이값인 평균오차(Aerr)는, 상기 [수학식 1]과 같이 산출될 수 있다.
그러므로, 상기 [수학식 1]에 의해 산출되는 평균오차(Aerr)가 기설정된 한계오차(Serr)보다 크다는 것은 실시간으로 입력받은 기설정된 수(n개)의 조도값이 조도 센서의 고장으로 잘못 입력되고 있을 가능성이 매우 높음을 의미하므로, 센서 모니터링부(미도시)는 상기 조건이 만족되면 조도 센서가 고장난 것으로 판단할 수 있다.
<실시례 2>
도 7을 참고하면, 본 발명의 일실시례에 따른 그림파일 형태의 그래프 데이터 인식 및 추출 방법은 적어도 하나의 그림 파일 형태의 원본 이미지가 입력되는 제1 단계(710), 상기 원본 이미지를 기설정된 형식의 이미지 데이터로 변환하고, 상기 이미지 데이터에 포함된 노이즈를 제거하고 상기 이미지 데이터의 해상도를 조정하여 이미지 전처리를 완료하는 제2 단계(720), 상기 이미지 전처리가 완료된 상기 이미지 데이터를 분석하여 그래프 유무를 판단하고, 상기 그래프가 존재하는 경우, 상기 그래프의 종류를 결정하는 제3 단계(730), 상기 그래프 종류가 결정된 경우, 상기 그래프에서 축 영역 및 데이터 영역을 추출하는 제4 단계(740), 상기 축 영역에서 적어도 하나의 축 라벨, 축 최대값, 축 최소값 및 축 단위값을 추출하는 제5 단계(750), 상기 데이터 영역에서 적어도 하나의 좌표 정보를 추출하는 제6 단계(760), 상기 축 최대값, 상기 축 최소값 및 상기 축 단위값에 기초하여 상기 좌표 정보에 대응하는 좌표 매핑 데이터를 산출하는 제7 단계(770) 및 상기 좌표 매핑 데이터를 취합하여 그래프 변환 데이터를 생성하는 제8 단계(780)를 포함할 수 있다.
상기와 같은 본 발명의 효과에 따르면, 입력된 그림 파일 형태의 이미지 데이터를 분석하여, 이미지 데이터에 포함된 그래프를 인식하고, 그래프에 대응하는 데이터를 산출함으로써, 종이 형태로 존재하는 정보를 디지털 데이터로 용이하게 변환할 수 있는 그림파일 형태의 그래프 데이터 인식 및 추출 시스템 및 그 방법이 제공될 수 있다.
또한, 이미지 데이터로부터 인식된 그래프의 픽셀 분포에 기초하여 그래프 종류를 결정하고 그래프 종류에 기초하여 축 영역 및 데이터 영역을 추출함으로써, 그래프 특성을 고려하여 데이터 영역에 포함된 좌표 정보를 정확하게 산출할 수 있는 그림파일 형태의 그래프 데이터 인식 및 추출 시스템 및 그 방법이 제공될 수 있다.
또한, 본 발명의 일실시례에 따른, 그림파일 형태의 그래프 데이터 인식 및 추출 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 본 발명의 일실시례는 비록 한정된 실시례와 도면에 의해 설명되었으나, 본 발명의 일실시례는 상기 설명된 실시례에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서 본 발명의 일실시례는 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.
110 : 이미지 전처리부 111 : 파일 형식 변환부
112 : 노이즈 제거부
113 : 해상도 설정부
120 : 그래프 판단부 121 : 그래프 인식부
122 : 그래프 종류 결정부
130 : 데이터 매핑부 131 : 영역 판단부
132 : 축 영역 추출부
133 : 데이터 영역 추출부
134 : 좌표 매핑부
140 : 데이터 출력부

Claims (5)

  1. 입력된 원본 이미지를 기설정된 형식의 이미지 데이터로 변환하고, 상기 이미지 데이터에서 노이즈를 제거하는 이미지 전처리부;
    상기 이미지 전처리부에서 처리된 이미지 데이터를 분석하여 적어도 하나의 그래프가 존재하는지 유무를 판단하고, 상기 그래프가 존재하는 경우, 상기 그래프의 종류를 판단하는 그래프 판단부;
    상기 그래프 판단부에서 판단된 그래프 종류에 기초하여 상기 그래프에서 적어도 하나의 데이터를 추출하고 매핑하는 데이터 매핑부; 및
    상기 데이터 매핑부에서 도출된 데이터를 취합하여 그래프 변환 데이터를 생성하는 데이터 출력부;를 포함하고,

    상기 이미지 전처리부는,
    상기 원본 이미지를 기설정된 형식으로 변환하여 제1 이미지 데이터를 생성하는 파일형식 변환부;
    상기 파일형식 변환부에서 생성된 상기 제1 이미지 데이터에서 노이즈를 제거하고 제2 이미지 데이터를 생성하는 노이즈 제거부; 및
    기설정된 조건에 기초하여 상기 노이즈 제거부에서 생성된 상기 제2 이미지 데이터의 해상도를 조정하여 제3 이미지 데이터를 생성하는 해상도 설정부;를 포함하며,

    상기 그래프 판단부는,
    상기 이미지 전처리부에서 변환된 상기 이미지 데이터에 적어도 하나의 그래프가 존재하는지 여부를 판단하는 그래프 인식부; 및
    상기 그래프 인식부에서 상기 그래프가 존재하는 것으로 판단된 경우, 상기 그래프의 픽셀 분포도 및 분포 형상에 기초하여 그래프의 종류를 도트, 라인 및 영역 중 어느 하나로 판단하는 그래프 종류 결정부;를 포함하고,

    상기 그래프 인식부는,
    기저장된 그래프 샘플 템플릿을 학습하고, 상기 그래프 샘플 템플릿과 대응되는 템플릿이 상기 이미지 데이터 내에 존재하는지 여부를 판단하고,

    상기 그래프 종류 결정부는,
    상기 그래프 인식부에서 상기 그래프 샘플 템플릿과 대응되는 템플릿이 존재하는 것으로 판단된 경우, 이미지 데이터 내에서 색상값이 같은 픽셀을 추출하여 적어도 하나의 픽셀 좌표값을 추출하고,
    상기 추출된 픽셀 좌표값 중 기지정된 원점에 가장 가까운 좌표를 기준 좌표로 설정하며,
    상기 기준 좌표에서 기설정된 반경 이내에 존재하는 픽셀의 개수를 카운팅 하여 상기 그래프의 종류를 판단하되,
    상기 기준 좌표로부터 상기 기설정된 반경 이내에 존재하는 상기 픽셀의 개수가 0개 또는 2개 이상 기설정된 제1 기준 개수 미만인 경우, 상기 그래프의 종류를 도트형 그래프로 판단하고,
    상기 기준 좌표로부터 상기 기설정된 반경 이내에 존재하는 상기 픽셀의 개수가 1개인 경우, 상기 그래프의 종류를 라인형 그래프로 판단하며,
    상기 기준 좌표로부터 상기 기설정된 반경 이내에 존재하는 상기 픽셀의 개수가 상기 제1 기준 개수 이상인 경우, 상기 그래프의 종류를 영역형 그래프로 판단하고,

    상기 영역형 그래프는,
    막대형 그래프, 원형 그래프 및 군집형 도트 그래프 중 적어도 어느 하나를 포함하되,
    상기 그래프 종류 결정부는,
    상기 픽셀 좌표값 중 X축 좌표에 대응되는 Y축 좌표가 기설정된 제2 기준 개수 이상 존재하는 경우, 상기 그래프의 종류를 상기 막대형 그래프로 판단하고,
    상기 픽셀 좌표값은 하나의 중심 좌표가 존재하고, 상기 중심 좌표와 타 픽셀 좌표 사이의 거리에 기초하여 산출된 원주의 길이와 타 픽셀의 개수가 동일한 경우, 상기 그래프의 종류를 상기 원형 그래프로 판단하며,
    상기 픽셀 좌표값 중 상기 Y축 좌표의 최소값 내지 최대값 사이의 범위 내에서 상기 X축 좌표에 대응하는 상기 Y축 좌표가 존재하지 않는 경우, 상기 그래프의 종류를 상기 군집형 도트 그래프로 판단하고,

    상기 데이터 매핑부는,
    상기 그래프 판단부에서 결정된 상기 그래프 종류에 기초하여 상기 그래프의 축 영역 및 데이터 영역을 구분하는 영역 판단부;
    상기 축 영역에서 적어도 하나의 축 라벨, 축 최대값, 축 최소값 및 축 단위값을 추출하는 축 영역 추출부;
    상기 데이터 영역에서 적어도 하나의 좌표 정보를 추출하는 데이터 영역 추출부; 및
    상기 축 최대값, 상기 축 최소값 및 상기 축 단위값에 기초하여 상기 좌표 정보에 대응하는 좌표 매핑 데이터를 산출하는 좌표 매핑부;를 포함하고,

    상기 축 영역 추출부는,
    상기 축 영역에서 텍스트 영역 및 상기 텍스트의 위치 좌표를 추출하되,
    상기 텍스트의 위치 좌표는 상기 텍스트 영역의 하측 중심점으로 설정되는 것을 특징으로 하는 그림파일 형태의 그래프 데이터 인식 및 추출하는 시스템.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 그림파일 형태의 그래프 데이터 인식하고 추출하는 시스템에서 수행되는 그림파일 형태의 그래프 데이터 인식하고 추출하는 방법으로서,
    이미지 처리부가 적어도 하나의 그림 파일 형태의 원본 이미지를 획득하는 제1 단계;
    상기 이미지 전처리부가 상기 원본 이미지를 기설정된 형식의 이미지 데이터로 변환하고, 상기 이미지 데이터에 포함된 노이즈를 제거하고 상기 이미지 데이터의 해상도를 조정하여 이미지 전처리를 완료하는 제2 단계;
    그래프 판단부가 상기 이미지 전처리가 완료된 상기 이미지 데이터를 분석하여 그래프 유무를 판단하고, 상기 그래프가 존재하는 경우, 상기 그래프의 종류를 결정하는 제3 단계;
    상기 그래프의 종류가 결정된 경우, 데이터 매핑부가 상기 그래프에서 축 영역 및 데이터 영역을 추출하는 제4 단계;
    상기 데이터 매핑부가 상기 축 영역에서 적어도 하나의 축 라벨, 축 최대값, 축 최소값 및 축 단위값을 추출하는 제5 단계;
    상기 데이터 매핑부가 상기 데이터 영역에서 적어도 하나의 좌표 정보를 추출하는 제6 단계;
    상기 데이터 매핑부가 상기 축 최대값, 상기 축 최소값 및 상기 축 단위값에 기초하여 상기 좌표 정보에 대응하는 좌표 매핑 데이터를 산출하는 제7 단계; 및
    데이터 출력부가 상기 좌표 매핑 데이터를 취합하여 그래프 변환 데이터를 생성하는 제8 단계;를 포함하는 그림파일 형태의 그래프 데이터 인식 및 추출하는 방법.
KR1020220121841A 2022-09-26 2022-09-26 그림파일 형태의 그래프 데이터 인식 및 추출하는 시스템 및 그 방법 KR102513456B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220121841A KR102513456B1 (ko) 2022-09-26 2022-09-26 그림파일 형태의 그래프 데이터 인식 및 추출하는 시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220121841A KR102513456B1 (ko) 2022-09-26 2022-09-26 그림파일 형태의 그래프 데이터 인식 및 추출하는 시스템 및 그 방법

Publications (1)

Publication Number Publication Date
KR102513456B1 true KR102513456B1 (ko) 2023-03-24

Family

ID=85872813

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220121841A KR102513456B1 (ko) 2022-09-26 2022-09-26 그림파일 형태의 그래프 데이터 인식 및 추출하는 시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR102513456B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200052790A (ko) * 2018-11-07 2020-05-15 주식회사 지디에프랩 오염된 차량 번호판 인식이 가능한 이미지 인식 장치
JP6968241B1 (ja) * 2020-07-30 2021-11-17 楽天グループ株式会社 情報処理装置、情報処理方法およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200052790A (ko) * 2018-11-07 2020-05-15 주식회사 지디에프랩 오염된 차량 번호판 인식이 가능한 이미지 인식 장치
JP6968241B1 (ja) * 2020-07-30 2021-11-17 楽天グループ株式会社 情報処理装置、情報処理方法およびプログラム

Similar Documents

Publication Publication Date Title
JP5934762B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置
EP3822830B1 (en) Feature processing method and device for motion trajectory, and computer storage medium
CN110503054B (zh) 文本图像的处理方法及装置
KR20170006355A (ko) 모션벡터 및 특징벡터 기반 위조 얼굴 검출 방법 및 장치
JP2007172132A (ja) レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法
KR20150137752A (ko) 문자 인식 방법 및 그 장치
JP4300098B2 (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
TW200529093A (en) Face image detection method, face image detection system, and face image detection program
JP2002288589A (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
CN103530625A (zh) 一种基于数字图像处理的光学字符识别方法
JP5971108B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
KR101967858B1 (ko) 3d 깊이 이미지 기반 객체 분리 장치 및 그 방법
CN110414505A (zh) 图像的处理方法、处理系统及计算机可读存储介质
KR102513456B1 (ko) 그림파일 형태의 그래프 데이터 인식 및 추출하는 시스템 및 그 방법
JP2013003686A (ja) 認識装置および方法、プログラム、並びに記録媒体
JPH11306325A (ja) 対象物検出装置及び対象物検出方法
CN116030472A (zh) 文字坐标确定方法及装置
KR100449486B1 (ko) 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법
CN115393589A (zh) 一种通用dcs工艺流程图识别转换方法、系统以及介质
JP7234719B2 (ja) 画像処理装置及びプログラム
Rani et al. Object Detection in Natural Scene Images Using Thresholding Techniques
RU2340941C2 (ru) Способ оценки сходства образцов почерка и способы верификации личности и идентификации почерка с использованием данного способа оценки
JP2004094427A (ja) 帳票画像処理装置及び該装置を実現するためのプログラム
CN106372632B (zh) 一种基于ocr的漏识文字自动检测的方法

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant