KR101396678B1

KR101396678B1 - 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시시스템 및 방법

Info

Publication number: KR101396678B1
Application number: KR1020140007966A
Authority: KR
Inventors: 조진수; 김혜영; 정정일; 김흥기; 김이슬
Original assignee: 가천대학교 산학협력단
Priority date: 2014-01-22
Filing date: 2014-01-22
Publication date: 2014-05-30
Also published as: KR20140049525A

Abstract

본 발명은 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시시스템 및 방법에 관한 것으로, 문자와 함께 시각자료가 포함된 교육자료를 촉각정보로 변환하여 제공하기 위한 것이다.
이를 위하여 본 발명은 일반 교육자료 내에 혼합되어 있는 각 정보에 대한 문자영역 및 영상영역을 추출하는 일반교육 자료 내 영상영역 및 문자영역 추출단계, 추출한 영상영역을 분석하여 저 복잡도 영상과 고 복잡도 영상을 구분하고 각 영상을 복잡도에 따라 처리하여 촉각정보로 변환하는 복잡도별 영상정보 촉각화단계, 및 촉각화한 문자영역 내의 문자정보 및 영상영역 내의 문자정보를 각각 인식하여 점자정보로 변환하는 문자인식 및 점자 변환단계를 포함하는, 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법 및 그 시스템을 제공하여, 시각장애인들에게 다양한 형태의 특수 교육자료 활용기회를 부여할 수 있게 하고, 촉도 생성에 요구되는 많은 자원의 절감 효과를 얻을 수 있게 한다.

Description

시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시시스템 및 방법{System and method for displaying visual information based on haptic display for blind person}

본 발명은 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시시스템 및 방법에 관한 것으로, 보다 상세하게는 멀티미디어장치를 통해 표시되는 일반 교육자료 내의 시각정보를 촉각정보로 변환하여 표시할 수 있도록 함으로써 멀티미디어장치를 통해 제공되는 교육자료를 시각장애인들이 현실적으로 수용할 수 있도록 하는 시각장애인을 위한 햅틱 디스플레이 기반의 촉각정보 변환 및 표현기술에 관한 것이다.

최근 컴퓨터, 이동통신 단말기, PDA, PMP 등의 각종 전자 및 휴대 장치의 보급으로 인해 디지털 멀티미디어정보의 접근이 일상화되고 있는데, 이들 통상적인 장치들은 신체적인 어려움을 수반하지 않은 비장애인을 기준으로 설계되기 때문에, 이들 멀티미디어 정보에 대한 장애인들의 접근이 어려웠다.

이에 따라, 시각 장애인들에게 촉각정보를 제공할 수 있는 다양한 점자 출력 장치 또는 햅틱 기술을 적용하여 촉각정보를 제공하는 출력장치 등이 상용화되고 있다.

한편, 현재의 일반 교육자료에는 사진, 삽화, 만화, 도표 및 그래프 등과 같이 점자로 나타낼 수 없는 시각정보들이 상당량 포함되어 있다. 일반 교과서의 내용도 시각자료의 사용을 전제로 하는 경우가 많고, 시각정보를 추가적으로 제시함으로서 본문 내용을 보다 완벽히 이해할 수 있도록 도움을 준다. 그러나 특수 교육 자료에서는 이러한 시각정보들은 점자로 변환될 수 없어 대부분이 삭제되며, 반면에 촉각정보로 변환하는데 있어서도 인력 및 시간 등의 많은 자원이 요구되고 있어, 그 양이 극히 제한적이다.

또한 최근에는 교육, 취업, 이직 또는 자격증 취득 등을 위한 사교육에 대한 사람들의 관심이 높아지게 되면서, 입시 학원, 보습 학원, 자격증 학원 및 영어 학원 등의 사설 학원에 등록하고, 진학 및 자격증 취득에 대해 사설 학원에서 어학을 학습하는 학습자들이 증가하고 있는 실정이나, 시각장애인의 경우 의사 소통 및 보행의 어려움으로 인해 자격증 및 어학 등의 교육을 받고 싶어도 받기 어려운 실정이다.

따라서, 시각 장애인에게도 촉각정보를 이용하여 멀티미디어 자료를 이용한 교육 정보를 제공할 수 있게 하는 기술의 개발이 요구되는 실정이다.

본 발명이 해결하고자 하는 기술적 과제는, 문자와 함께 시각자료가 포함된 교육자료를 촉각정보로 변환하여 일반 교육자료와 유사한 수준의 특수 교육자료로 제공할 수 있도록 함으로써, 시각장애인으로 하여금 일반 교육자료와 유사한 수준의 특수 교육자료 활용기회를 부여할 수 있는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시시스템 및 방법을 제공하고자 하는 것이다.

상기 목적을 달성하기 위한 본 발명의 실시 형태는, 일반 교육자료 내에 혼합되어 있는 각 정보에 대한 문자영역 및 영상영역을 추출하는 일반교육 자료 내 영상영역 및 문자영역 추출단계, 추출한 영상영역을 분석하여 저 복잡도 영상과 고 복잡도 영상을 구분하고 각 영상을 복잡도에 따라 처리하여 촉각정보로 변환하는 복잡도별 영상정보 촉각화단계, 및 촉각화한 문자영역 내의 문자정보 및 영상영역 내의 문자정보를 각각 인식하여 점자정보로 변환하는 문자인식 및 점자 변환단계를 포함하는, 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법이다.

상기 본 발명에 의한 시각정보 표시방법에서, 일반교육 자료 내 영상영역 및 문자영역 추출단계는, 일반 교육자료 내의 각 정보를 영상영역 이외의 문자영역, 영상영역 내의 문자영역, 및 영상영역으로 분류하는 것을 특징으로 한다.

상기 본 발명에 의한 시각정보 표시방법에서, 일반교육 자료 내 영상영역 및 문자영역 추출단계는, 일반 교육자료에 대한 문자와 시각자료의 특성 분석을 위한 밝기(brightness) 영상 및 라벨(label)에 대한 기반 정보를 생성하는 일반교육 자료 입력단계, 생성된 밝기 영상 내에서 나타나는 문자와 시각자료의 특징을 기반으로 문자영역과 영상영역을 각각 분류하여 영상영역을 추출하는 영상영역 추출단계, 및 분류한 영상영역 내에서 문자영역을 검출하는 영상영역 내 문자 추출단계를 포함하여 이루어진다.

상기 본 발명에 의한 시각정보 표시방법에서, 일반교육 자료 입력단계는, 스캔한 일반 교육자료의 모든 픽셀에 대해 그레이 스케일(gray scale) 처리를 수행하여 밝기 영상에 대한 기반정보를 생성하는 단계, 생성된 밝기 영상에 대한 기반정보의 이진화 및 라벨링 처리를 통해 라벨에 대한 기반정보를 생성하는 단계;를 포함하여 이루어진다.

상기 본 발명에 의한 시각정보 표시방법에서, 라벨에 대한 기반정보 생성단계는, 생성된 밝기 영상을 흑화소와 백화소만으로 재구성하는 이진화 처리단계, 이진화 처리된 밝기 영상의 인접한 흑화소 간의 연결 상태를 검사하여 서로 연결된 픽셀들을 하나의 개체로 판단하여 적어도 자소(문자를 구성하는 최소 단위) 단위 이상의 개체들로 분류되는 문자와, 백화소의 유무에 따라 하나 혹은 그 이상의 개체로 분류되는 시각자료를 구분하는 라벨링 처리단계를 포함하여 이루어진다.

상기 본 발명에 의한 시각정보 표시방법에서, 영상영역 추출단계는, 입력된 일반교육 자료에 대한 밝기 영상 내에서 문자와 시각자료의 이웃한 픽셀 간의 밝기 값에 대한 변화량(G)을 수학식 1을 통해 산출하는 단계, 산출된 문자와 시각자료의 이웃한 픽셀 간의 밝기 값에 대한 변화량(G)만으로 변화량 차이(GD, Gradient Difference) 영상을 생성하는 단계, 생성된 GD 영상 내에서 예상되는 문자 영역의 후보군을 결정하기 위해, 시각자료에 대한 라벨을 이상치(Outlier)로 제외시킨 상태에서 문자의 라벨에 대한 평균 너비(LW _average )를 수학식 2를 통해 산출하는 단계, 산출된 문자의 라벨에 대한 평균 너비(LW _average )를 기준으로 GD 영상에 대해 수학식 3을 적용하여 최대 변화량 차이(MGD, Maximum Griadient Difference) 영상을 재구성하는 단계, 재구성한 MGD 영상에 대해 수학식 4를 통해 경계값(Tb)을 결정하여 이진화를 수행하고 각 행별로 연결된 백화소의 너비를 구하여 2개의 문자를 합한 너비(2 LW _average )보다 작은 너비의 백화소를 제거하여 MGD 영상 내 예상되는 문자영역의 후보군을 결정하는 단계, 예상되는 문자영역의 후보군을 결정한 MGD 영상에 대해 팽창(dilate)과 침식(erode)의 모폴로지(morphology) 연산을 수행하여 MGD 영상 내에서 자소 및 띄어쓰기에 의해 산재되어 있는 문자영역을 병합하는 단계, 및 일반교육 자료의 입력단계에서 산출한 자료의 라벨들에 대해, 후보군의 문자영역 내에 포함되는지의 여부를 검사하여 일반교육 자료 내 문자와 시각자료를 각각 문자영역과 영상영역으로 분류하는 단계를 포함하여 이루어지며,

수학식 1

수학식 2

수학식 3

수학식 4

상기 수학식 1 내지 4에서, x, y는 픽셀의 열과 행의 위치, w, h는 영상의 너비와 높이, B(x, y)는 해당 픽셀 위치의 밝기 값, G(x, y)는 이웃한 픽셀에 대한 변화량, Q ₁ 과 Q ₃ 는 라벨의 너비에 대한 1사분위 수와 3사분위 수, LW 와 NL은 각각 라벨의 너비와 라벨의 총 개수, T _b 는 이진화를 수행할 경계값인 것을 특징으로 한다.

상기 본 발명에 의한 시각정보 표시방법에서, 문자영역과 영상영역 분류단계는 일반교육 자료의 입력단계에서 산출한 자료의 라벨이 후보군의 문자영역 내에 포함되어 있으면 문자에 대한 라벨로 결정하고, 후보군에 포함되어 있지 않으면 영상영역에 대한 라벨로 결정하여, 일반교육 자료 내 문자와 시각자료를 각각 문자영역과 영상영역으로 분류하는 것을 특징으로 한다.

상기 본 발명에 의한 시각정보 표시방법에서, 영상영역 내 문자 추출단계는, 영상영역 추출단계에서 결정한 영상영역 내에 문자의 유/무를 판단하여, 문자가 있을 시에는 이를 문자영역으로 추출하되, 영상영역 추출단계와 동일한 환경(문자의 라벨에 대한 평균너비, 모폴로지 연산의 필터) 하에서 그 탐색 범위를 영상영역만으로 제한하여 수행하며, 그 결과 영상영역 내 문자영역을 추출하는 것을 특징으로 한다.

상기 본 발명에 의한 시각정보 표시방법에서, 복잡도별 영상정보 촉각화단계는, 산출된 영상영역의 밝기에 대한 누적 히스토그램을 분석하여 복잡도에 따라 영상을 저 복잡도 영상과 고 복잡도 영상으로 분류하는 영상 분류단계, 분류된 고 복잡도 영상이 주요 객체를 포함하는지의 여부를 판단하여 주요객체를 추출하는 고 복잡도 영상의 중심객체 유무 판별 및 추출단계, 및 시각장애인의 인지를 돕기 위해 영상의 복잡도를 낮춰 단순화하는 고 복잡도 영상의 잡음제거 및 단순화단계를 포함하여 이루어진다.

상기 본 발명에 의한 시각정보 표시방법에서, 영상 분류단계는, 영상에 대한 밝기의 평균누적값을 조건적 연산식 1을 통해 산출하는 단계, 산출된 밝기의 평균누적값을 조건적 연산식 2를 통해 각각의 밝기 누적값에서 차분하여 저 복잡도 영상 내 밝기의 누적값이 연속된 구간에서 나타나는 현상을 제거하는 단계를 포함하여 이루어지며, 상기 조건적 연산식 1은, for(i=0, cnt=0, sum=0; i<256; i++){if((Q ₁ -1.5(Q ₃ -Q ₁ ) <= NH _i <= (Q ₃ +1.5(Q ₃ -Q ₁ )) then cnt++, sum+= NH _i ;} NH _average = sum / cnt;이며, 상기 조건적 연산식 2는, for(i=0; i<256; i++) NH _i -= NH _average ;이고, 각 연산식에서 NH _i 는 해당 밝기에 대한 누적값, NH _average 는 영상에 대한 밝기의 평균 누적값, Q ₁ 과 Q ₃ 는 각각 밝기의 누적 값에 대한 1사분위수와 3사분위수인 것을 특징으로 한다.

상기 본 발명에 의한 시각정보 표시방법에서, 영상 분류단계는, 밝기의 평균누적값을 제거하기 이전과 제거한 후에 영상의 밝기 누적값의 잔여 구간에 대한 변화율(D _NH )을 수학식 5를 통해 검사하여 그 검사 결과에 따라 저 복잡도 영상과 고 복잡도 영상을 분류하는 단계를 더 포함하여 이루어지며,

수학식 5

상기 수학식 5에서, 고 복잡도 및 저 복잡도 영상을 분류하는 변화율(D _NH )에 대한 임계값(D _th )은 도형, 그래프, 삽화, 지도 및 사진을 포함하는 일반교육 자료 내에서 빈번하게 나타나는 영상들에 대해 도출되는 최적 실험치, cnt _before 와 cnt _after 는 누적 값을 제거하기 이전과 이후의 밝기의 잔여구간, I 는 영상영역인 것을 특징으로 한다.

상기 본 발명에 의한 시각정보 표시방법에서, 고 복잡도 영상의 중심 객체 유무 판별 및 추출단계는, 고 복잡도 영상을 구성하는 픽셀의 색상 유사도를 측정하고, 양자화(quantization)를 통해 유사한 색상들을 대표색상으로 변환하는 단계, 대표색상으로 변환된 영상 내에서 중심객체 영역에 해당되는 색상의 분포도를 측정하여 중심객체의 유무를 판별하는 단계, 및 판별 결과 중심객체가 존재할 경우 그 중심객체에 대한 윤곽선을 추출하는 단계를 포함하여 이루어진다.

상기 본 발명에 의한 시각정보 표시방법에서, 유사한 색상들을 대표색상으로 변환하는 단계는, PGF(Peer Group Filtering)기법을 이용하여 양자화 레벨을 결정하는 단계, 결정된 레벨에 따른 양자화를 통해 유사한 색상들을 대표색상으로 변환시켜 고 복잡도 영상의 색상에 대한 복잡도를 감소시키는 단계를 포함하여 이루어진다.

상기 본 발명에 의한 시각정보 표시방법에서, 중심객체의 유무를 판별하는 단계는, 수학식 6에 정의한 영상의 중심영역에서 빈도수가 가장 많은 색상을 중심객체의 대표색상이라 가정한 상태에서 이에 대한 세로 방향 및 가로 방향에 대한 분산을 계산하여 영상 내 분포도를 산출하는 단계, 산출된 분포도에 따라 중심객체의 유무를 판별하는 단계를 포함하여 이루어지며,

수학식 6

상기 수학식 6에서, w, h는 각각 고 복잡도 영상의 너비와 높이, AreaX _obj 와 AreaY _obj 는 각각 중심영역의 x축과 y축의 범위인 것을 특징으로 한다.

상기 본 발명에 의한 시각정보 표시방법에서, 중심객체 유무 판별단계는, 조건적 연산식 3을 통해 중심객체를 대표하는 색상이 수평적으로 넓게 분포되어 있거나 분포도가 낮은 경우를 중심객체가 없는 영상으로 판단하고, 그 밖의 경우에는 중심객체가 있는 것으로 판단하는 것을 특징으로 하며,

조건적 연산식 3

s _max =max(s _verticality , s _{horizontality} )

if(((s _max == s _{horizontality} )&&(s _max >T ₁ ))||(s _max <T ₂ ))

then I is a non-object image

otherwise I is an object image

(T ₁ = 0.06, T ₂ = 0.01)

상기 조건적 연산식 3에서, s _verticality 및 s _{horizontality} 는 고 복잡도 영상(I) 내 중심객체의 대표색상에 대한 최대 수직 및 최대 수평 분산, s _max 는 s _verticality 와 s _{horizontality} 중 큰 값을 갖는 최대 분산, 최대 분산과 비교하는 임계값 T ₁ 과 T ₂ 는 상수로서 다양한 고 복잡도 영상에 대해 반복적인 실험을 통해 산출되는 최적 실험치인 것을 특징으로 한다.

상기 본 발명에 의한 시각정보 표시방법에서, 중심객체의 윤곽선 추출단계는, 양자화된 고 복잡도 영상에서 수학식 7을 통해 정의된 영상의 네 모서리 구간에 대한 배경영역의 대표색상들을 추출하고 그 추출된 색상들을 영상 전체에서 제거하여 영상 내에 중심객체에 대한 정보만을 남기는 단계, 고 복잡도 영상에 대해 이진화 및 라벨링을 수행하여 중심영역 이외에서 나타나는 색상정보들을 제거함과 아울러 중심객체의 대표색상에 대한 라벨들을 생성하는 단계, 및 생성된 각각의 라벨들에 대한 위치가 중심영역에 포함되는지를 검사하여 잡음을 제거하고 고 복잡도 영상 내에 남겨진 중심 객체의 윤곽선을 검출하여 촉각정보로 변환할 영상의 중심객체를 추출하는 단계를 포함하여 이루어지며,

수학식 7

상기 수학식 7에서, AreaX _n 및 AreaY _n 은 각각 영상의 네 모서리에 대한 배경영역, w와 h는 고 복잡도 영상의 너비와 높이인 것을 특징으로 한다.

상기 본 발명에 의한 시각정보 표시방법에서, 고 복잡도 영상의 잡음제거 및 단순화단계는, 고 복잡도 영상에 대해 이진화 및 라벨링 처리를 수행하여 영상을 구성하는 윤곽선들에 대한 라벨의 크기를 산출하는 단계, 영상의 해상도와 햅틱디스플레이의 해상도를 비교하여 너비와 높이의 비율을 산출한 후 각각의 라벨을 수학식 8을 통해 햅틱디스플레이의 해상도에 맞춰 축소하였을 경우, 픽셀의 크기가 햅틱디스플레이의 1셀 이하로 축소되는 라벨이 가진 영상정보를 중요도가 낮은 잡음으로 분류하여 제거하는 단계를 포함하여 이루어지며,

수학식 8

상기 수학식 8에서, H _width 와 H _height 는 햅틱디스플레이의 너비와 높이, I _width 와 I _height 는 영상의 너비 및 높이, T _w 와 T _h 는 햅틱디스플레이로 축소하기 위한 영상의 너비 및 높이에 대한 축소 비율, LW, LH 및 n은 해당 라벨의 너비와 높이 및 총 개수, S는 라벨을 햅틱디스플레이 해상도로 변환하였을 때의 픽셀의 크기인 것을 특징으로 한다.

상기 본 발명에 의한 시각정보 표시방법에서, 고 복잡도 영상의 잡음제거 및 단순화단계는, 검출된 윤곽선들의 복잡도를 낮추기 위해 윤곽선들의 코너점을 검출하고 그 코너점을 이용하여 연결선을 생성하는 단계, 연결선들 간의 교차각을 검사하여 그 교차각이 임계각 이상일 경우 그 연결선이 공유하는 코너점을 제거하고 남은 두 점으로 새로운 연결선을 생성하여 영상의 윤곽선에 대한 복잡도를 낮추는 단계를 더 포함하여 이루어지며, 상기 임계각은 윤곽선의 복잡도가 높은 다양한 영상에 대해 실험을 수행하여 측정된 최적 실험치인 것을 특징으로 한다.

상기 본 발명에 의한 시각정보 표시방법에서, 문자인식 및 점자 변환단계는, 추출한 문자영역에 대해 광학문자인식(OCR, Optional Character Recognition)을 적용하여 컴퓨터가 인식할 수 있는 정보로 변환한 후 이를 시각장애인이 인지할 수 있는 점자형태로 변환하는 것을 특징으로 한다.

상기 본 발명에 의한 시각정보 표시방법에서, 문자인식 및 점자 변환단계는, 일반교육 자료 내 시각자료를 제외한 문단이나 단락의 문자영역에 광학문자인식을 수행하여 문자영역에 대한 영상정보로부터 컴퓨터가 인식할 수 있는 문자정보를 생성하는 영상영역 외의 문자 인식단계, 일반교육 자료 내 시각자료 내에 포함되는 문자들에 대해 광학문자인식을 수행하여 영상영역 내의 문자영역으로부터 컴퓨터가 인식할 수 있는 문자정보를 생성하는 영상영역 내의 문자 인식단계, 및 생성된 영상영역 외의 문자정보 및 영상영역 내의 문자정보를 점자 표현 알고리즘을 통해 시각장애인들이 인지할 수 있는 점자정보로 점역하여 표시하는 인식된 문자의 점자 표현단계를 포함하여 이루어진다.

상기 본 발명에 의한 시각정보 표시방법에서, 인식된 문자의 점자 표현단계는, 영상영역 외의 문자정보로부터 점역된 점자정보를 햅틱디스플레이에 표현하기 위해, 점자의 길이를 계산하여 햅틱디스플레이 해상도의 너비에 맞추어 줄 바꿈을 수행하는 단계를 포함하여 이루어질 수 있다.

상기 본 발명에 의한 시각정보 표시방법에서, 인식된 문자의 점자 표현단계는, 영상영역 내의 문자정보로부터 점역된 점자정보를 영상영역 내에 배치한 후 주변의 영상정보와 중첩되는지를 검사하여, 중첩될 경우에는 그 점자정보에 대응하는 인덱스를 영상영역 내에 배치하고 영상영역의 외부에 해당 인덱스와 함께 점자정보를 출력하는 단계를 포함하여 이루어질 수 있다.

상기 본 발명에 의한 시각정보 표시방법에서, 인식된 문자의 점자 표현단계는, 한국어점자규정’ 및 ‘영어점자규정’ 을 따라 점역이 이루어지며, 연결어, 약어, 기본적인 산술 연산기호, 및 일반기호에 대한 점역을 포함하는 것을 특징으로 한다.

본 발명에 의하면, 문자와 함께 시각자료가 포함된 교육자료를 촉각정보로 변환하여 일반 교육자료와 유사한 수준의 특수 교육자료를 제공할 수 있게 되므로, 시각장애인들에게 다양한 형태의 특수 교육자료 활용기회를 부여할 수 있는 이점이 있으며, 아울러 기존의 촉도를 생성하는데 요구되는 많은 자원을 절감함과 함께 시각장애인에게도 많은 자료를 손쉽게 생성하여 제공할 수 있게 되는 이점이 있다.

도 1은 본 발명에 따른 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시시스템의 전체적인 구성을 개략적으로 예시한 블록도이다.
도 2는 본 발명에 따른 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법의 전체적인 처리과정을 예시한 개략적인 동작 흐름도이다.
도 3은 도 2의 영상영역 추출단계에 대한 상세 흐름도이다.
도 4a와 도 4b는 도 2의 고 복잡도 영상에 대한 중심객체 유무 판별 및 추출단계 및 잡음 제거 및 단순화단계에 대한 상세 흐름도이다.
도 5의 (a) 내지 (d)는 일반 교육 자료 내 영상영역 및 문자영역을 분리하는 동작을 설명하기 위하여 예시한 참고도로서, (a)는 일반 교육자료의 한 예시도이고, (b)는 (a)에 대한 밝기 영상이며, (c)는 (b)의 영상 내에서 특정 행의 픽셀 정보를 추출하여 그 행의 각 열에 대한 픽셀의 밝기 값을 히스토그램으로 변환한 결과이며, (d)는 (c)의 밝기 값에 대한 변화량의 차이를 히스토그램으로 변환한 결과이다.
도 6의 (a)와 (b)는 저 복잡도 영상과 고 복잡도 영상의 밝기에 대한 누적 히스토그램을 각각 예시하는 참고도이다.
도 7 내지 도 9는 본 발명에 의한 일반 교육자료 내 영상영역 및 문자 추출단계를 설명하기 위하여 예시한 참고도이다.
도 10은 본 발명에 의한 복잡도별 영상의 촉각화 단계를 설명하기 위하여 예시한 참고도이다.
도 11은 본 발명에 의한 고 복잡도 영상의 잡음 제거 및 단순화 단계를 설명하기 위하여 예시한 참고도이다.
도 12는 본 발명에 의한 문자 인식 및 추출단계에서 영상영역을 제외한 문자 인식 단계를 설명하기 위하여 예시한 참고도이다.
도 13은 본 발명에 의한 문자 인식 및 추출단계에서 영상영역 내 문자 인식 및 인덱싱 단계를 설명하기 위하여 예시한 참고도이다.
도 14는 본 발명을 통해 일반 교육자료를 촉각정보로 변환한 최종 결과를 예시한 참고도이다.

이하, 본 발명의 실시 형태에 의한 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시시스템의 구성 및 그 방법에 대한 동작 흐름을 첨부 도면을 참조하여 상세히 설명한다.

본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정 해석되지 아니하며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시 예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시 예에 불과할 뿐이므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.

도 1은 본 발명에 따른 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시시스템의 전체적인 구성을 개략적으로 예시한 블록도로서, 본 발명의 촉각정보 변환시스템(100)은, 일반 교육자료 내에 혼합되어 있는 각 정보에 대한 문자영역 및 영상영역을 추출하는 영상/문자영역 추출부(110), 추출한 영상영역을 분석하여 저 복잡도 영상과 고 복잡도 영상을 구분하여 촉각정보로 변환하는 복잡도별 영상 촉각화부(120), 추출한 문자영역 내의 문자정보 및 상기 영상영역 내의 문자정보를 분석하여, 시각장애인이 인지할 수 있는 점자정보로 변환하는 문자인식 및 점역부(130)를 포함하여 구성되며, 그 외에도 자료 입력을 위한 교육자료 입력부(10), 점역된 점자를 표현하는 촉각정보 표시부(20)를 더 포함하여 구성될 수 있다.

도 2는 본 발명에 따른 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법의 전체적인 처리과정을 예시한 개략적인 동작 흐름도이며, 도 3 및 도 4a와 도 4b는 도 2의 영상영역 추출단계(a2) 및 고 복잡도 영상에 대한 중심객체 유무 판별 및 추출단계(b2)와 잡음제거 및 단순화단계(b3)에 대한 각각의 상세 흐름도이다.

본 발명의 방법은 도 2에 예시된 바와 같이, 크게 일반교육 자료 내 영상영역 및 문자영역 추출단계(a100), 복잡도별 영상정보 촉각화단계(b100), 및 문자인식 및 점자 변환단계(c100)로 이루어진다.

일반교육 자료 내 영상영역 및 문자영역 추출단계(a100)에서는 일반 교육자료 내에 혼합되어 있는 각 정보에 대한 문자영역 및 영상영역을 각각 추출하는 단계로서, 일반 교육자료 내의 각 정보를 영상영역 이외의 문자영역, 영상영역 내의 문자영역, 및 영상영역으로 분류하며, 일반교육 자료 입력단계(a1), 영상영역 추출단계(a2), 및 영상영역 내 문자 추출단계(a3)로 이루어진다.

일반교육 자료 입력단계(a1)에서는 일반 교육자료에 대한 문자와 시각자료의 특성 분석을 위한 밝기(brightness) 영상 및 라벨(label)에 대한 기반 정보를 생성한다. 밝기 영상에 대한 기반정보는 스캔한 일반 교육자료의 모든 픽셀에 대해 그레이 스케일(gray scale) 처리를 수행하여 생성하고, 라벨에 대한 기반정보는 상기 생성된 밝기 영상에 대한 기반정보의 이진화 및 라벨링 처리를 통해 생성한다. 상기 라벨에 대한 기반정보 생성단계는 이진화 및 라벨링 처리를 통해 이루어지며, 이진화 처리를 통해 상기 생성된 밝기 영상을 흑화소(픽셀 값:0)와 백화소(픽셀 값:255)만으로 재구성하고, 라벨링 처리를 통해 상기 이진화 처리된 밝기 영상의 인접한 흑화소 간의 연결 상태를 검사하고 서로 연결된 픽셀들을 하나의 개체로 판단하여, 적어도 자소(문자를 구성하는 최소 단위) 단위 이상의 개체들로 분류되는 문자와, 백화소의 유무에 따라 하나 혹은 그 이상의 개체로 분류되는 시각자료를 구분한다. 이 단계에서 생성된 밝기 영상과 라벨은 영상영역 추출 과정과 영상 내 문자 추출 과정의 입력데이터로 활용된다.

영상영역 추출단계(a2)에서는 상기 생성된 밝기 영상 내에서 나타나는 문자와 시각자료의 특징을 기반으로 문자영역과 영상영역을 각각 분류하여 영상영역을 추출한다. 이 영상영역 추출단계(a2)는 도 3의 동작 흐름도에 예시된 바와 같이, 밝기 값에 대한 변화량(G) 산출단계(a21), 변화량 차이(GD) 영상 생성단계(a22), 문자의 라벨에 대한 평균 너비(LW _average ) 산출단계(a23), 최대 변화량 차이(MGD) 영상 재구성단계(a24), MGD 영상 내 예상되는 문자영역의 후보군 결정단계(a25), MGD 영상 내 산재된 문자영역 병합단계(a26), 및 문자영역과 영상영역 분류단계(a27)를 포함하여 이루어진다.

밝기 값에 대한 변화량(G) 산출단계(a21)에서는 입력된 일반교육 자료에 대한 밝기 영상 내에서 문자와 시각자료의 이웃한 픽셀 간의 밝기 값에 대한 변화량(G, Gradient)을 다음의 수학식 1을 통해 산출한다.

상기 수학식 1에서, x, y는 픽셀의 열과 행의 위치, w, h는 영상의 너비와 높이, B(x, y)는 해당 픽셀 위치의 밝기 값, G(x, y)는 이웃한 픽셀에 대한 변화량을 나타낸다.

변화량 차이(GD) 영상 생성단계(a22)에서는 상기 산출된 문자와 시각자료의 이웃한 픽셀 간의 밝기 값에 대한 변화량(G)만으로 변화량 차이(GD, Gradient Difference) 영상을 생성한다.

문자의 라벨에 대한 평균 너비(LW _average ) 산출단계(a23)에서는 상기 생성된 GD 영상 내에서 예상되는 문자 영역의 후보군을 결정하기 위해, 상기 생성한 시각자료에 대한 라벨을 이상치(Outlier)로 제외시킨 상태에서, 문자의 라벨에 대한 평균 너비(LW _average )를 다음의 수학식 2를 통해 산출한다.

상기 수학식 2에서, Q ₁ 과 Q ₃ 는 라벨의 너비에 대한 1사분위 수와 3사분위 수, LW 와 NL은 각각 라벨의 너비와 라벨의 총 개수를 나타낸다.

최대 변화량 차이(MGD) 영상 재구성단계(a24)에서는 상기 산출된 문자의 라벨에 대한 평균 너비(LW _average )를 기준으로 GD 영상에 대해 다음의 수학식 3을 적용하여 최대 변화량 차이(MGD, Maximum Griadient Difference) 영상을 재구성한다.

상기 수학식 3의 변수는 상기 수학식 1의 것과 동일하다.

MGD 영상 내 예상되는 문자영역의 후보군 결정단계(a25)에서는 상기 재구성한 MGD 영상에 대해 다음의 수학식 4를 통해 경계값(Tb)을 결정하여 이진화를 수행하고, 각 행별로 연결된 백화소의 너비를 구하여 2개의 문자를 합한 너비(2 LW _average )보다 작은 너비의 백화소를 제거하여 MGD 영상 내 예상되는 문자영역의 후보군을 결정한다.

상기 수학식 4의 변수는 수학식 1 및 수학식 2의 변수들과 동일하며, T _b 는 이진화를 수행할 경계값을 나타낸다.

MGD 영상 내 산재된 문자영역 병합단계(a26)에서는 상기 예상되는 문자영역의 후보군을 결정한 MGD 영상에 대해 팽창(dilate)과 침식(erode)의 모폴로지(morphology) 연산을 수행하여 상기 MGD 영상 내에서 자소 및 띄어쓰기에 의해 산재되어 있는 문자영역을 병합한다.

문자영역과 영상영역 분류단계(a27)에서는 상기 일반교육 자료의 입력단계에서 산출한 자료의 라벨들에 대해, 상기 후보군의 문자영역 내에 포함되는지의 여부를 검사하여, 일반교육 자료 내 문자와 시각자료를 각각 문자영역과 영상영역으로 분류한다. 이 분류단계에서는 일반교육 자료의 입력단계에서 산출한 자료의 라벨이 상기 후보군의 문자영역 내에 포함되어 있으면 문자에 대한 라벨로 결정하고, 후보군에 포함되어 있지 않으면 영상영역에 대한 라벨로 결정하여, 일반교육 자료 내 문자와 시각자료를 각각 문자영역과 영상영역으로 분류한다.

영상영역 내 문자 추출단계(a3)에서는 상기 영상영역 추출단계에서 결정한 영상영역 내에 문자의 유/무를 판단하여, 문자가 있을 시에는 이를 문자영역으로 추출하되, 상기 영상영역 추출단계와 동일한 환경(문자의 라벨에 대한 평균너비, 모폴로지 연산의 필터) 하에서 그 탐색 범위를 영상영역만으로 제한하여 수행하며, 그 결과 영상영역 내 문자영역을 추출한다.

복잡도별 영상정보 촉각화단계(b100)에서는 추출한 영상영역을 분석하여 도형 및 그래프 등을 포함하는 저 복잡도 영상과, 삽화 및 사진 등을 포함하는 고 복잡도 영상을 구분하고, 구분된 각 영상을 복잡도에 따라 서로 다른 처리과정을 통해 촉각정보로 변환하며, 영상 분류단계(b1), 고 복잡도 영상의 중심객체 유무 판별 및 추출단계(b2), 및 고 복잡도 영상의 잡음제거 및 단순화단계(b3)로 이루어진다.

영상 분류단계(b1)에서는 상기 산출된 영상영역의 밝기에 대한 누적 히스토그램을 분석하여 복잡도에 따라 영상을 저 복잡도 영상(도표 및 그래프)과 고 복잡도 영상(삽화, 만화, 지도 및 사진)으로 분류한다.

이를 위해 영상 분류단계(b1)에서는 먼저, 영상에 대한 밝기의 평균누적값을 다음의 조건적 연산식 1을 통해 산출하고, 그 산출된 밝기의 평균누적값을 다음의 조건적 연산식 2를 통해 각각의 밝기 누적값에서 차분하여 저 복잡도 영상 내 밝기의 누적값이 연속된 구간에서 나타나는 현상을 제거한다.

상기 조건적 연산식 1은,

for(i=0, cnt=0, sum=0; i<256; i++){if((Q ₁ -1.5(Q ₃ -Q ₁ ) <= NH _i <= (Q ₃ +1.5(Q ₃ -Q ₁ )) then cnt++, sum+= NH _i ;} NH _average = sum / cnt;이며,

상기 조건적 연산식 2는,

*for(i=0; i<256; i++) NH _i -= NH _average ;이고,

상기 각 연산식에서 NH _i 는 해당 밝기에 대한 누적값, NH _average 는 영상에 대한 밝기의 평균 누적값, Q ₁ 과 Q ₃ 는 각각 밝기의 누적 값에 대한 1사분위수와 3사분위수이다.

다음으로 영상 분류단계(b1)에서는 상기 밝기의 평균누적값을 제거하기 이전과 제거한 후에 영상의 밝기 누적값의 잔여 구간에 대한 변화율(D _NH )을 다음의 수학식 5를 통해 검사하여 그 검사 결과에 따라 저 복잡도 영상과 고 복잡도 영상을 분류한다.

상기 수학식 5에서, 고 복잡도 및 저 복잡도 영상을 분류하는 변화율(D _NH )에 대한 임계값(D _th )은 도형, 그래프, 삽화, 지도 및 사진을 포함하는 일반교육 자료 내에서 빈번하게 나타나는 영상들에 대해 도출되는 최적 실험치, cnt _before 와 cnt _after 는 누적 값을 제거하기 이전과 이후의 밝기의 잔여구간, I 는 영상영역이다.

*고 복잡도 영상의 중심객체 유무 판별 및 추출단계(b2)에서는 상기 분류된 고 복잡도 영상이 주요 객체를 포함하는지의 여부를 판단하여 추출한다. 이 고 복잡도 영상의 중심 객체 유무 판별 및 추출단계(b2)는 도 4a의 동작 흐름도에 예시된 바와 같이, 유사한 색상들의 대표색상 변환단계(b21), 중심객체의 유무 판별단계(b22), 및 중심객체에 대한 윤곽선 추출단계(b23)를 포함하여 이루어진다.

유사한 색상들의 대표색상 변환단계(b21)는 고 복잡도 영상을 구성하는 픽셀의 색상 유사도를 측정하고, 양자화(quantization)를 통해 유사한 색상들을 대표색상으로 변환하는 단계로서, 이 단계에서는 유사한 색상들을 대표색상으로 변환하는 고 복잡도 영상의 양자화를 위해, 먼저 PGF(Peer Group Filtering)기법을 이용하여 양자화 레벨을 결정한다. 다음으로 상기 결정한 레벨에 따라 양자화를 수행함으로써 유사한 색상들을 대표색상으로 변환시켜 고 복잡도 영상의 색상에 대한 복잡도를 감소시킨다.

중심객체의 유무 판별단계(b22)는 상기 대표색상으로 변환된 고 복잡도 영상 내에서 중심객체 영역에 해당되는 색상의 분포도를 측정하여, 중심객체의 유무를 판별하는 단계로서, 이 단계에서는 다음의 수학식 6에 정의한 영상의 중심영역에서 빈도수가 가장 많은 색상을 중심객체의 대표색상이라 가정하고, 이에 대한 세로 방향 및 가로 방향에 대한 분산을 계산하여 영상 내 분포도를 산출하고, 이 분포도에 따라 중심객체의 유무를 판별하게 된다.

상기 수학식 6에서 w, h는 각각 고 복잡도 영상의 너비와 높이, AreaX _obj 와 AreaY _obj 는 각각 중심영역의 x축과 y축의 범위이다.

여기서, 중심객체 유무 판별은 다음의 조건적 연산식 3을 통해 이루어지며, 숲이나 바다 등과 같은 배경영상들에서 나타나는 특징과 같이 중심객체를 대표하는 색상이 수평적으로 넓게 분포되어 있거나 분포도가 낮은 경우 중심객체가 없는 영상으로 판단하고, 그 밖의 경우에는 중심객체가 있는 것으로 판단한다.

상기 조건적 연산식 3은

s _max =max(s _verticality , s _{horizontality} )

then I is a non-object image

otherwise I is an object image

(T ₁ = 0.06, T ₂ = 0.01)

상기 조건적 연산식 3에서 s _verticality 및 s _{horizontality} 는 고 복잡도 영상(I) 내 중심객체의 대표색상에 대한 최대 수직 및 최대 수평 분산, s _max 는 s _verticality 와 s _{horizontality} 중 큰 값을 갖는 최대 분산, 최대 분산과 비교하는 임계값 T ₁ 과 T ₂ 는 상수로서 다양한 고 복잡도 영상에 대해 반복적인 실험을 통해 산출되는 최적 실험치이다.

중심객체에 대한 윤곽선 추출단계(b23)는 상기 중심객체 유무 판별 결과 중심객체가 존재할 경우 그 중심객체에 대한 윤곽선을 추출하는 단계로서, 이 단계에서는 먼저, 상기 양자화된 고 복잡도 영상에서 수학식 7을 통해 정의되는 영상의 네 모서리 구간에 대한 배경영역의 대표색상들을 추출하고, 그 추출된 색상들을 영상 전체에서 제거한다. 이로써, 고 복잡도 영상 내에는 중심객체에 대한 대표색상 남게 된다.

상기 수학식 7에서 AreaX _n 및 AreaY _n 은 각각 영상의 네 모서리에 대한 배경영역을 나타내며, w와 h는 고 복잡도 영상의 너비와 높이를 나타낸다.

그런데, 이때 중심 영역 이외의 영역에서도 동일한 색상정보들이 잔재할 수 있으며, 이렇게 중심 영역 이외에서 나타나는 색상정보들은 객체를 표현하는 정보가 아닌 잡음으로 판단할 수 있다. 따라서 이를 제거하기 위해 본 단계에서는 상기 고 복잡도 영상에 대해 이진화 및 라벨링을 수행하여, 중심영역 이외에서 나타나는 색상정보들을 제거함과 아울러 중심객체의 대표색상에 대한 라벨들을 생성하고, 생성된 각각의 라벨들에 대한 위치가 중심영역에 포함되는지를 검사하여 잡음을 제거하고, 고 복잡도 영상 내에 남겨진 중심 객체의 윤곽선을 검출하여, 촉각정보로 변환할 영상의 중심객체를 추출한다.

잡음제거 및 단순화단계(b3)에서는 시각장애인의 인지를 돕기 위해 영상의 복잡도를 낮춰 단순화한다. 이 잡음제거 및 단순화단계(b3)는 도 4b의 동작 흐름도에 예시된 바와 같이, 윤곽선들에 대한 라벨 크기 산출단계(b31), 잡음 제거단계(b32), 연결선 생성단계(b33), 및 윤곽선에 대한 복잡도 낮춤단계(b34)를 포함하여 이루어진다.

윤곽선들에 대한 라벨 크기 산출단계(b31)에서는 고 복잡도 영상에 대해 이진화 및 라벨링 처리를 수행하여 영상을 구성하는 윤곽선들에 대한 라벨의 크기를 산출한다.

잡음 제거단계(b32)에서는 영상의 해상도와 햅틱디스플레이의 해상도를 비교하여 너비와 높이의 비율을 산출한 후, 각각의 라벨을 수학식 8을 통해 햅틱디스플레이의 해상도에 맞춰 축소하였을 경우, 픽셀의 크기가 햅틱디스플레이의 1셀 이하로 축소되는 라벨이 가진 영상정보를 중요도가 낮은 잡음으로 분류하여 제거한다.

상기 수학식 8에서, H _width 와 H _height 는 햅틱 디스플레이의 너비와 높이, I _width 와 I _height 는 영상의 너비 및 높이, T _w 와 T _h 는 햅틱디스플레이로 축소하기 위한 영상의 너비 및 높이에 대한 축소 비율, LW, LH 및 n은 해당 라벨의 너비와 높이 및 총 개수, S는 라벨을 햅틱디스플레이 해상도로 변환하였을 때의 픽셀의 크기를 나타낸다.

연결선 생성단계(b33)에서는 상기 검출된 윤곽선들의 복잡도를 낮추기 위해 윤곽선들의 코너점을 검출하고, 그 코너점들을 서로 연결하는 연결선을 생성한다.

윤곽선에 대한 복잡도 낮춤단계(b34)에서는 상기 연결선들 간의 교차각을 검사하여 그 교차각이 임계각(바람직하게는 150도) 이상일 경우 그 연결선이 공유하는 코너점을 제거하고 남은 두 점으로 새로운 연결선을 생성하여 영상의 윤곽선에 대한 복잡도를 낮추게 된다. 이때 상기 임계각(150도)은 윤곽선의 복잡도가 높은 다양한 영상에 대해 실험을 수행하여 측정될 수 있는 최적 실험치이다.

문자인식 및 점자 변환단계(c100)는 추출한 문자영역 내의 문자정보 및 영상영역 내의 문자정보를 분석하여 시각장애인이 인지가능한 점자정보로 변환하는 단계로서, 상기 추출한 문자영역에 대해 광학문자인식(OCR, Optional Character Recognition)을 적용하여 컴퓨터가 인식할 수 있는 정보로 변환한 후, 다시 이를 시각장애인이 인지할 수 있는 점자형태로 변환할 수 있게 된다. 이 문자인식 및 점자 변환단계(c100)는 영상영역 외의 문자 인식단계(c1), 영상영역 내의 문자 인식단계(c2), 및 인식된 문자의 점자 표현단계(c3)를 포함하여 이루어진다.

영상영역 외의 문자 인식단계(c1)에서는 일반교육 자료 내 시각자료를 제외한 문단이나 단락의 문자영역에 광학문자인식을 수행하여, 문자영역에 대한 영상정보로부터 컴퓨터가 인식할 수 있는 문자정보를 생성한다.

영상영역 내의 문자 인식단계(c2)에서는 일반교육 자료 내 시각자료 내에 포함되는 문자들에 대해 광학문자인식을 수행하여, 영상영역 내의 문자영역으로부터 컴퓨터가 인식할 수 있는 문자정보를 생성한다.

인식된 문자의 점자 표현단계(c3)에서는 상기 생성된 영상영역 외의 문자정보, 영상영역 내의 문자정보를 한국어점자규정’ 및 ‘영어점자규정’ 을 따르는 점자 표현 알고리즘을 통해 시각장애인들이 인지할 수 있는 점자정보로 점역하여 표시한다. 이러한 점자표현 알고리즘은 연결어, 약어, 기본적인 산술 연산기호, 및 일반기호에 대한 점역을 포함하는 것이 바람직하다. 특히 이 점자 표현단계에서는 영상영역 외의 문자정보로부터 점역된 점자정보에 대해서는 햅틱디스플레이에의 표현을 위해, 먼저 점자의 길이를 계산하고, 햅틱디스플레이 해상도의 너비에 맞추어 줄 바꿈을 수행한 후 점자정보를 출력한다. 또한 영상영역 내의 문자정보로부터 점역된 점자정보에 대해서는 먼저 해당 점자정보를 영상영역 내에 배치한 후 주변의 영상정보와 중첩되는지를 검사하고, 그 검사 결과 영상영역 내에 배치되는 점자정보가 주변의 영상정보와 중첩될 경우 그 점자정보에 대응하는 인덱스를 해당 영상영역 내에 배치하고, 상기 영상영역의 외부에 해당 인덱스와 함께 점자정보를 출력한다.

이와 같이 구성되는 본 발명의 전체적인 동작 및 그에 의한 작용 및 효과를 설명하면 다음과 같다.

먼저 영상/문자 영역 추출부(110)에서는 교육자료 입력부(10)를 통해 입력되는 일반 교육 자료 내에 혼합되어 있는 문자정보와 시각정보를 촉각정보로 변환하기 위해 각 정보에 대한 문자영역 및 영상영역을 추출하는 일반교육 자료 내 영상영역 및 문자영역 추출단계(a100)를 수행하며, 이 일반교육 자료 내 영상영역 및 문자영역 추출단계(a100)에서는 일반교육 자료 입력단계(a1), 영상영역 추출단계(a2), 및 영상영역 내 문자 추출단계(a3)가 순차적으로 실행된다.

일반교육 자료 입력단계(a1)에서는 일반교육 자료에 대한 문자와 시각자료의 특성을 분석하기 위해 밝기 영상 및 라벨 등과 같은 기반 정보를 생성한다. 먼저, 밝기 영상과 같은 경우는 스캔한 일반교육 자료의 모든 픽셀에 대해 그레이스케일(gray scale) 과정을 수행함으로써 생성할 수 있게 된다. 다음으로 문자와 시각자료에 대해 특성을 분석하기 위한 라벨은 밝기 영상에 대해 이진화를 수행한 후, 라벨링 처리를 통해서 생성할 수 있게 된다. 이 때, 이진화 처리르 통해 밝기 영상을 흑화소(픽셀 값:0)와 백화소(픽셀 값:255)만으로 재구성하며, 라벨링 처리를 통해 인접한 흑화소간의 연결 상태를 검사하여 연결된 픽셀들을 하나의 개체로 판단할 수 있게 된다. 이를 통해 문자는 적어도 자소(문자를 구성하는 최소 단위) 단위 이상의 개체들로 분류되고, 시각자료는 백화소의 유무에 따라 하나 혹은 그 이상의 개체로 분류된다. 본 단계에서 생성한 밝기 영상과 라벨은 영상영역 추출 과정과 영상 내 문자 추출 과정의 입력데이터로 활용된다.

영상영역 추출단계(a2)에서는 문자와 시각자료 간의 밝기의 특성을 분석하고, 이와 함께 선행과정을 통해 산출한 라벨의 영역을 이용하여 입력된 일반교육 자료를 문자영역과 영상영역으로 분류한다.

도 5의 (a) 내지 (d)는 일반 교육 자료 내 영상영역 및 문자영역을 분리하는 동작을 설명하기 위하여 예시한 참고도로서, (a)는 일반 교육자료의 한 예시도이고, (b)는 (a)에 대한 밝기 영상이며, (c)는 (b)의 영상 내에서 특정 행의 픽셀 정보를 추출하여 그 행의 각 열에 대한 픽셀의 밝기 값을 히스토그램으로 변환한 결과이고, (d)는 (c)의 밝기값에 대한 변화량의 차이를 히스토그램으로 변환한 결과를 예시하고 있다. 이 때, 문자를 구성하는 픽셀들에서는 0에 가까운 밝기 값(흑화소, 문자가 인쇄된 검은색)과 255에 가까운 밝기 값(백화소, 여백)들이 교차하면서 나타남을 볼 수 있고, 시각자료를 구성하는 픽셀들에서는 밝기 값이 연속적으로 변화하는 것을 볼 수 있다. 이를 보다 명확하게 판단하기 위하여 (c)의 밝기 값에 대한 변화량의 차이를 나타내는 (d)의 히스토그램을 생성하면, 그 결과에서 문자와 시각자료를 구성하는 픽셀 간의 밝기 값에 대한 변화량의 차이가 매우 상이함을 확인할 수 있다. 따라서 이러한 문자와 시각자료의 밝기 값의 변화량에 대한 특징을 이용하여 이웃한 픽셀에 대한 변화량(G)을 상기 수학식 1을 통해 산출한 후 이러한 변화량만으로 변화량 차이(GD) 영상을 재구성한다.

이를 통해 생성한 GD 영상 내 문자가 존재하는 영역에서는 픽셀 간의 밝기 변화량이 높아 백화소들이 군집되어 있으며, 문자 간의 사이를 나타내는 여백과 인쇄영역 이외의 여백에서는 픽셀 간의 밝기 변화량이 거의 없으므로 흑화소에 가까운 결과가 나타난다. 그리고 시각자료와 같은 경우는 영상의 전체 밝기를 낮추고, 대비를 높인 그레이스케일 영상과 같이 나타난다.

다음으로 생성한 GD 영상 내에서 예상되는 문자 영역의 후보군을 결정하기 위해 문단이나 단락 내 문자 간의 경계를 제거한다. 이를 위해 선행단계에서 생성한 라벨을 이용하여 평균적인 문자의 너비를 수학식 2과 같은 조건으로 산출하며, 산출한 너비를 기준으로 GD 영상에 대해 수학식 3을 적용하여 최대 변화량 차이 영상(MGD)으로 재구성한다.

일반적으로 일반교육 자료로부터 생성한 라벨은 대부분이 문자에 대한 것이며, 시각자료에 대한 라벨은 그 크기가 문자에 비해 상대적으로 큰 반면에 빈도수는 매우 적다. 따라서 수학식 2를 이용함으로써 시각자료에 대한 라벨을 이상치(Outlier)로 제외한 후, 문자의 라벨에 대한 평균 너비(LW _average )를 산출할 수 있게 되며, 상기 산출한 LW _average 를 수학식 3에 대입함으로써 MGD 영상을 생성할 수 있게 된다.

또한, GD 영상을 재구성한 MGD 영상에 대해 문자영역을 보다 명확하게 분류하기 위해 수학식 4의 임계값 결정을 통해 이진화를 수행한 후, 각 행별로 연결된 백화소의 너비를 구하여 2개의 문자를 합한 너비(2 LW _average )보다 작은 너비의 백화소를 제거한다. 이는 대체로 문자가 단독으로 존재하지 않는 특성을 이용함과 함께 자료의 스캔 과정 및 영상영역에 대한 잡음을 제거하기 위함이다.

마지막으로 예상되는 문자 영역의 후보군을 결정한 MGD 영상 내에서 자소 및 띄어쓰기에 의해 산재되어 있는 문자영역을 병합하기 위해 팽창(dilate)과 침식(erode)의 모폴로지(morphology) 연산을 수행한다. 이 때, 모폴로지 연산의 필터 크기는 수학식 2의 LW _average 와 동일하게 설정하며, 이러한 모폴로지 연산의 결과를 통해 문자영역을 명확히 결정할 수 있게 된다. 따라서 일반교육 자료의 입력 과정에서 산출한 자료의 라벨들에 대해 결정한 문자영역 내에 포함되는지의 여부를 검사하고, 포함되었을 시에는 문자에 대한 라벨로, 미 포함되었을 시에는 영상영역에 대한 라벨로 결정한다. 이를 통해 최종적으로 일반교육 자료 내 문자와 시각자료를 각각 문자영역과 영상영역으로 분류할 수 있게 된다.

영상영역 내 문자 추출단계(a3)에서는 영상영역 추출 과정에서 결정한 영상영역 내에 문자의 유무를 판단하여, 문자가 있을 시에는 이를 문자영역으로 추출한다. 본 과정은 영상영역 추출 과정과 동일한 환경(문자의 평균너비, 모폴로지 연산의 필터 등) 하에 탐색 범위를 영상영역만으로 제한하여 수행하며, 그 결과 영상 내 문자영역을 추출할 수 있다.

다음으로 복잡도별 영상 촉각화부(120)에서는 상기 추출한 영상영역을 저 복잡도 영상과 고 복잡도 영상으로 구분하여 주요 객체 포함 여부를 판단하고, 이를 각각의 복잡도에 따라 처리하여 촉각정보로 변환하는 복잡도별 영상정보 촉각화단계(b100)를 수행하며, 이 복잡도별 영상정보 촉각화단계(b100)에서는, 영상영역을 분석하여 복잡도에 따라 저 복잡도 영상(도표 및 그래프)과 고 복잡도 영상(삽화, 만화, 지도 및 사진)으로 분류하는 영상 분류단계(b1), 고 복잡도 영상이 주요 객체를 포함하는지를 판단하고 이를 추출하는 고 복잡도 영상의 중심객체 유무 판별 및 추출단계(b2), 및 시각장애인의 인지를 돕기 위해 영상의 복잡도를 낮춰주는 고 복잡도 영상의 잡음제거 및 단순화단계(b3)가 순차적으로 실행된다.

영상 분류단계(b1)에서는 영상영역의 밝기에 대한 누적 히스토그램을 분석하여 저 복잡도 영상과 고 복잡도 영상을 분류한다.

먼저, 도 6의 (a)와 (b)는 저 복잡도 영상과 고 복잡도 영상의 밝기에 대한 누적 히스토그램을 각각 예시하는 참고도로서, 도면에 예시된 바와 같이 (a)와 같은 저 복잡도 영상은 단순한 밝기로 구성되어 있어, 그 밝기의 누적 값이 특정 구간들에서만 나타난다. 반면에 (b)와 같은 고 복잡도 영상은 다채로운 밝기로 구성되어 있어, 그 밝기의 누적 값이 연속된 구간에서 나타난다. 따라서 이러한 특징을 바탕으로 밝기 값이 나타나는 구간의 빈도수를 산출하여 영상을 분류하는데, 이 때, 저 복잡도 영상과 같은 경우에도 미세한 밝기 값들이 존재하여 고 복잡도 영상과 같이 밝기 값이 연속된 구간에서 나타날 수 있다. 따라서 상기 조건적 연산식 1 및 2를 통해 평균적인 밝기의 누적 값을 산출하여, 이를 각각의 밝기 값에서 차분함으로써 저 복잡도 영상 내 밝기 값이 연속된 구간에서 나타나는 현상을 제거할 수 있게 된다.

다음으로 평균적인 밝기의 누적 값을 제거하기 이전과 제거한 후에 밝기 값의 잔여 구간에 대한 변화율을 상기 수학식 5와 같이 검사하여 저 복잡도 영상과 고 복잡도 영상으로 분류한다.

고 복잡도 영상의 중심객체 유무 판별 및 추출단계(b2)에서는 고 복잡도 영상을 구성하는 픽셀의 색상 유사도를 측정하고, 양자화(quantization)를 통해 유사한 색상들을 대표색상으로 변환한다. 그리고 대표색상으로 변화된 영상 내에서 중심객체 영역에 해당되는 색상의 분포도를 측정하여, 중심객체의 유무를 판별함과 함께 중심객체가 존재할 시에는 이에 대한 윤곽선을 추출한다.

이러한 고 복잡도 영상의 중심객체 유무 판별 및 추출단계(b2)에서는 유사한 색상들을 대표색상으로 변환하는 고 복잡도 영상의 양자화를 수행하기 위해 먼저, PGF(Peer Group Filtering)기법을 이용하여 양자화 레벨을 결정하고 그 결정한 레벨에 따라 양자화를 수행함으로써, 유사한 색상들이 이를 대표하는 색상으로 변환되어 고 복잡도 영상의 색상에 대한 복잡도를 감소시킬 수 있게 된다.

다음으로 고 복잡도 영상의 중심객체 유무 판별 및 추출단계(b2)에서는 상기 수학식 6에 정의한 영상의 중심영역에서 빈도수가 가장 많은 색상을 중심객체의 대표색상이라 가정하고, 이에 대한 세로 방향 및 가로 방향에 대한 분산을 계산하여 영상 내 분포 정도를 산출한다. 이 때, 중심객체를 대표하는 색상이 수평적으로 넓게 분포되어 있거나, 분포도가 낮으면 중심객체가 없는 영상으로 판단한다. 이는 숲이나 바다 등과 같은 배경 영상들에서 나타나는 특징이기 때문이다. 그 밖의 경우에는 중심객체가 있는 것으로 판단하며, 이러한 동작은 상기 조건적 연산식 3을 통해 수행될 수 있게 된다.

마지막으로 고 복잡도 영상의 중심객체 유무 판별 및 추출단계(b2)에서는 양자화된 고 복잡도 영상에서 배경영역의 대표색상들을 추출하고, 추출한 색상들을 영상 전체에서 제거한다. 이 때, 영상의 배경영역은 수학식 7과 같이 영상의 네 모서리에 대한 구간으로 정의한다. 이를 수행함으로써, 영상 내에는 중심객체에 대한 대표색상만이 남게 되는데, 이 때, 중심영역 이외의 영역에서도 동일한 색상정보들이 잔재할 수 있다. 이렇게 중심영역 이외에서 나타나는 색상정보들은 객체를 표현하는 정보가 아닌 잡음으로 판단할 수 있으며, 이를 제거하기 위해 이진화 및 라벨링을 수행한다. 이진화 및 라벨링을 수행한 결과로부터 중심객체의 대표색상에 대한 라벨들을 생성함과 함께 그 위치를 찾을 수 있으며, 각각의 라벨들에 대한 위치가 중심영역에 포함되는지를 검사하여 잡음을 제거한다. 결과적으로 고 복잡도 영상 내에는 중심객체의 정보만이 남게 되며, 이에 윤곽선을 검출함으로써 촉각정보로 변환할 영상의 중심객체를 추출할 수 있게 된다.

고 복잡도 영상의 잡음제거 및 단순화단계(b3)에서는 고 복잡도 영상을 햅틱디스플레이의 해상도에 적합한 촉각정보로 변환하기 위하여 먼저 이진화 및 라벨링을 수행하여 영상을 구성하는 윤곽선들에 대한 라벨의 크기를 산출한다. 그리고 수학식 8을 통해 영상의 해상도와 햅틱디스플레이의 해상도를 비교하여 너비와 높이의 비율을 산출한 후, 각각의 라벨을 햅틱디스플레이의 해상도에 맞추어 축소하였을 시, 라벨을 햅틱디스플레이 해상도로 변환하였을 때의 픽셀의 크기(S _i )가 햅틱디스플레이의 1셀 이하로 축소되는 경우에 해당 라벨이 가진 영상정보를 중요도가 낮다고 판단하여 이를 잡음으로 분류하여 제거한다.

또한, 고 복잡도 영상 내 복잡한 윤곽선들은 시각장애인이 정보를 인지하는데 어려움을 준다. 따라서 고 복잡도 영상의 잡음제거 및 단순화단계(b3)에서는 다음 과정으로 이러한 윤곽선들의 복잡도를 낮추기 위해 윤곽선들의 코너점을 검출하고, 검출한 코너점을 이용하여 연결선을 생성한다. 그리고 연결선들 간의 교차각을 검사하여 임계각(150도) 이상일 때에는 연결선이 공유하는 코너점을 제거하고 남은 두 점으로 새로운 연결선을 생성한다. 이 때, 임계각(150도)에 대한 설정값은 윤곽선의 복잡도가 높은 다양한 영상에 대해 실험을 수행하여 측정한 최적 실험치이다. 결과적으로 특정 수치를 기준으로 코너점을 제거하여 영상정보에 대한 새로운 윤곽선을 생성함으로써 영상의 윤곽선에 대한 복잡도를 낮춰 시각장애인의 정보 인지에 도움을 줄 수 있게 된다.

영상/문자 영역 추출부(110)에서는 교육자료 입력부(10)를 통해 입력되는 일반 교육 자료 내에 혼합되어 있는 문자정보와 시각정보를 촉각정보로 변환하기 위해 각 정보에 대한 문자영역 및 영상영역을 추출하는 일반교육 자료 내 영상영역 및 문자영역 추출단계(a)를 수행하며, 이 일반교육 자료 내 영상영역 및 문자영역 추출단계(a)에서는 일반교육 자료 입력단계(a1), 영상영역 추출단계(a2), 및 영상영역 내 문자 추출단계(a3)가 순차적으로 실행된다.

마지막으로 문자 인식 및 점역부(130)에서는 상기 추출한 문자영역(영상영역 이외의 문자영역 및 영상영역 내의 문자영역)에 대해 광학문자인식(OCR, Optional Character Recognition)을 적용하여 컴퓨터가 인지할 수 있는 정보로 변환한 후, 이를 다시 시각장애인이 인지할 수 있는 점자정보로 변환하는 문자인식 및 점자 변환단계(c100)를 수행함으로써, 촉각정보 표시부(20)를 통해 표현할 수 있게 되며, 이 문자인식 및 점자 변환단계(c100)에서는 영상영역 외의 문자 인식단계(c1), 영상영역 내의 문자 인식단계(c2), 및 인식된 문자의 점자 표현단계(c3)가 순차적으로 수행된다.

영상영역 외의 문자 인식단계(c1)에서는 일반교육 자료 내 시각자료를 제외한 문단이나 단락 등과 같은 문자영역에 대해 광학문자인식을 수행하여, 문자영역에 대한 영상정보로부터 컴퓨터가 인식할 수 있는 문자정보를 생성한다.

영상영역 내의 문자 인식단계(c2)에서는 일반교육 자료 내에서 시각자료 내 포함되는 문자들에 대해 상기와 마찬가지로 광학문자인식을 수행하여, 영상영역 내의 문자영역으로부터 컴퓨터가 인식할 수 있는 문자정보를 생성한다.

인식된 문자의 점자 표현단계(c3)에서는 영상영역 이외의 문자영역과 영상영역 내 문자영역에서 각각 광학문자인식을 통해 생성한 문자정보를 ‘한국어점자규정’ 및 ‘영어점자규정’ 에 따라 시각장애인들이 인지할 수 있는 점자정보로 각각 변환하게 되며, 현재의 시각장애인들이 사용하고 있는 연결어나 약어, 기본적인 산술연산 기호 및 일반기호 등도 함께 점역한다.

한편, 일반적으로 점자는 문자를 자소 단위로 표현함으로써 그 길이가 문자에 비해 길어지게 된다. 따라서 이 점자 표현단계(c3)에서는 상기 영상영역 외의 문자정보로부터 점역된 점자정보를 햅틱디스플레이에 표현하기 위해, 점자의 길이를 계산하여 햅틱디스플레이 해상도의 너비에 맞추어 줄 바꿈을 수행하여 점자정보를 출력한다.

또한 영상영역 내에서 점자를 표현할 때에는 점자가 영상정보와 중첩되어 시각장애인의 인지율을 떨어뜨릴 위험이 있다. 따라서 이를 해결하기 위해 이 단계(c3)에서는 상기 영상영역 내의 문자정보로부터 점역된 점자정보를 영상영역 내에 배치한 후, 주변의 영상정보와 중첩되는지를 검사하여, 중첩될 경우에는 그 점자정보에 대응하는 인덱스를 영상영역 내에 배치하고, 상기 영상영역의 외부에 해당 인덱스와 함께 점자정보를 출력한다.

도 7 내지 도 9는 일반 교육자료 내 영상영역 및 문자 추출단계를 설명하기 위하여 예시한 참고도로서, 본 발명에 따른 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법을 일반교육 자료에 적용하여 촉각정보로 변환한 실험결과를 예시하고 있다. 본 실험은 총 3단계로 구성된 각각의 일반교육 자료 내 영상영역 및 문자영역 추출단계(a), 복잡도별 영상정보 촉각화단계(b), 및 문자인식 및 점자 변환단계(c)에 대한 성능을 측정하기 위해 도 7부터 도 9까지의 (a)에 보인 바와 같이 문자, 시각자료(그래프, 지도, 사진) 및 시각자료 내 문자가 혼합되어 있는 세 가지 종류의 일반교육 자료들을 바탕으로 진행하였다. 먼저, 각 그림의 (b)부터 (e)까지는 입력된 교육자료의 영상영역과 문자영역을 분류하기 위한 단계(수학식 1 내지 수학식 4 참조)을 순차적으로 예시하고 있으며, (f)는 분류한 결과를 예시하고 있다. 이 때, 영상 내 파란색 라벨과 녹색 라벨은 각각 영상영역 이외의 문자영역과 영상영역에 포함된 문자영역을 나타내며, 붉은색 라벨은 시각자료에 대한 영상영역을 나타낸다. 문자영역 및 영상영역에 대한 분류의 정확도(p) 및 재현율(r)은 추출한 문자를 기준으로 다음의 수학식 9를 통해 산출할 수 있다.

상기 수학식 9에서 NDT(Number of Detected Texts)는 문자로 판단한 라벨의 총 수를 나타내며, TNCT(Total Number of Correct Texts)는 NDT 중 정확히 추출한 문자의 라벨 수를 나타낸다. 그리고 TNT(Total Number of Texts)는 자료 내 실제 문자개체의 총 수를 나타낸다. 본 수학식을 통해 그래프, 지도 및 사진을 포함하는 문자의 정확도는 각각 100%, 97.2%, 90.9%로 나타났으며, 재현율은 모든 문자가 라벨에 포함되어 모두 100%로 나타났다.

다음으로, 도 10은 각각 복잡도별 영상의 촉각화 단계를 설명하기 위하여 예시한 참고도이고, 도 11은 고 복잡도 영상의 잡음 제거 및 단순화 단계를 설명하기 위하여 예시한 참고도로서, 도 10의 (a)는 각각 그래프, 지도 및 사진에 대한 밝기 영상을 예시하고 있으며, (b)는 이에 대한 밝기의 누적 히스토그램을 예시하고 있다. 이에 조건적 연산식 1 및 2를 적용하여 밝기의 평균 누적값을 제거함으로써 (c)와 같은 히스토그램을 생성할 수 있으며, 밝기 값의 잔여 구간에 대한 변화율은 각각 82.5%, 58.4%, 0.4%로 나타났다. 산출한 각각의 변화율을 수학식 5에 대입함으로써 그래프는 저 복잡도 영상으로, 지도 및 사진은 고 복잡도 영상으로 분류할 수 있다. 그리고 (d)는 분류한 영상을 촉각정보로 변환한 결과를 예시하고 있는데, 이 때, 고 복잡도 영상으로 분류된 지도 및 사진과 같은 경우는 저 복잡도 영상인 그래프와는 달리 시각장애인에게 보다 명확하게 영상정보를 전달하기 위해, 도 11의 (a)부터 (d)까지에 예시한 바와 같이 잡음 및 단순화 과정(수학식 6 내지 수학식 8), 조건적 연산식 3을 추가적으로 수행한다.

마지막으로 도 12는 문자 인식 및 추출단계에서 영상영역을 제외한 문자 인식 단계를 설명하기 위하여 예시한 참고도이고, 도 13은 문자 인식 및 추출단계에서 영상영역 내 문자 인식 및 인덱싱 단계를 설명하기 위하여 예시한 참고도로서, 도 12와 도 13은 추출한 문자영역들에 대해 광학문자인식을 적용하여 컴퓨터가 인식할 수 있는 정보를 추출하고, 시각장애인이 인지할 수 있는 점자정보로 변환한 결과를 예시하고 있다. 이 때, 도 13에 예시된 바와 같이 영상 내 문자가 존재할 경우에는 점자정보가 영상정보와 중첩되지 않으면 영상 내 점자를 표현하고, 중첩될 시에는 점자의 위치에 인덱스를 표기한 후, 이에 대한 인덱스 및 점자정보를 따로 생성한다.

도 14는 그래프, 지도 및 사진을 포함하는 일반교육 자료를 촉각정보로 변환한 최종결과를 예시하고 있다. 이러한 촉각정보의 배치는 시각자료를 우선 시하며, 시각자료 내 문자 및 인덱스가 있을 경우에는 이어서 관련된 정보를 출력한다. 그리고 본문의 내용을 점역한 결과를 출력하며, 결과 영상 내 파랑색의 선은 햅틱디스플레이의 해상도에 따른 페이지를 나타내는 경계선이다. 결과적으로 본 발명의 일반교육 자료 내 영상영역 및 문자영역 추출단계(a100), 복잡도별 영상정보 촉각화단계(b100), 및 문자인식 및 점자 변환단계(c100)를 통해 일반교육 자료 내 주요정보들을 추출하여 시각장애인이 인지할 수 있는 촉각정보로 변환함으로써, 기존의 촉도를 생성하는데 요구되는 많은 자원을 절감함과 함께 시각장애인에게도 많은 자료를 손쉽게 생성하여 제공할 수 있게 된다.

이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.

10 : 교육자료 입력부 20 : 촉각정보 표시부
100 : 촉각정보 변환시스템 110 : 영상/문자영역 추출부
120 : 복잡도별 영상 촉각화부 130 : 문자인식 및 점역부

Claims

(a100) 일반 교육자료 내에 혼합되어 있는 각 정보에 대한 문자영역 및 영상영역을 추출하는 일반교육 자료 내 영상영역 및 문자영역 추출단계;
(b100) 상기 추출한 영상영역을 분석하여 도형 및 그래프를 포함하는 저 복잡도 영상과, 삽화 및 사진을 포함하는 고 복잡도 영상을 구분하고, 상기 구분된 각 영상을 복잡도에 따라 서로 다른 처리과정을 통해 촉각정보로 변환하는 복잡도별 영상정보 촉각화단계; 및
(c100) 상기 추출한 문자영역 내의 문자정보 및 상기 영상영역 내의 문자정보를 분석하여, 시각장애인이 인지할 수 있는 점자정보로 변환하는 문자인식 및 점자변환단계;를 포함하여 이루어지는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제1항에 있어서, 상기 (a100) 일반교육 자료 내 영상영역 및 문자영역 추출단계는,
일반 교육자료 내의 각 정보를 영상영역 이외의 문자영역, 영상영역 내의 문자영역, 및 영상영역으로 분류하는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제1항에 있어서, 상기 (a100) 일반교육 자료 내 영상영역 및 문자영역 추출단계는,
(a1) 일반 교육자료에 대한 문자와 시각자료의 특성 분석을 위한 밝기(brightness) 영상 및 라벨(label)에 대한 기반 정보를 생성하는 일반교육 자료 입력단계;
(a2) 상기 생성된 밝기 영상 내에서 나타나는 문자와 시각자료의 특징을 기반으로 문자영역과 영상영역을 각각 분류하여 영상영역을 추출하는 영상영역 추출단계; 및
(a3) 상기 분류한 영상영역 내에서 문자영역을 검출하는 영상영역 내 문자 추출단계;를 포함하여 이루어지는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제3항에 있어서, 상기 (a1) 일반교육 자료 입력단계는,
(a11) 스캔한 일반 교육자료의 모든 픽셀에 대해 그레이 스케일(gray scale) 처리를 수행하여 밝기 영상에 대한 기반정보를 생성하는 단계;
(a12) 상기 생성된 밝기 영상에 대한 기반정보의 이진화 및 라벨링 처리를 통해 라벨에 대한 기반정보를 생성하는 단계;를 포함하여 이루어지는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제4항에 있어서, 상기 (a12) 라벨에 대한 기반정보 생성단계는,
상기 생성된 밝기 영상을 흑화소와 백화소만으로 재구성하는 이진화 처리단계;
상기 이진화 처리된 밝기 영상의 인접한 흑화소 간의 연결 상태를 검사하여 서로 연결된 픽셀들을 하나의 개체로 판단하여, 적어도 자소(문자를 구성하는 최소 단위) 단위 이상의 개체들로 분류되는 문자와, 백화소의 유무에 따라 하나 혹은 그 이상의 개체로 분류되는 시각자료를 구분하는 라벨링 처리단계;를 포함하여 이루어지는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제3항에 있어서, 상기 (a2) 영상영역 추출단계는,
(a21) 상기 입력된 일반교육 자료에 대한 밝기 영상 내에서 문자와 시각자료의 이웃한 픽셀 간의 밝기 값에 대한 변화량(G)을 수학식 1을 통해 산출하는 단계;
(a22) 상기 산출된 문자와 시각자료의 이웃한 픽셀 간의 밝기 값에 대한 변화량(G)만으로 변화량 차이(GD) 영상을 생성하는 단계;
(a23) 상기 생성된 GD 영상 내에서 예상되는 문자 영역의 후보군을 결정하기 위해, 상기 생성한 시각자료에 대한 라벨을 이상치(Outlier)로 제외시킨 상태에서, 문자의 라벨에 대한 평균 너비(LW _average )를 수학식 2를 통해 산출하는 단계;
(a24) 상기 산출된 문자의 라벨에 대한 평균 너비(LW _average )를 기준으로 GD 영상에 대해 수학식 3을 적용하여 최대 변화량 차이(MGD) 영상을 재구성하는 단계;
(a25) 상기 재구성한 MGD 영상에 대해 수학식 4를 통해 경계값(Tb)을 결정하여 이진화를 수행하고, 각 행별로 연결된 백화소의 너비를 구하여 2개의 문자를 합한 너비(2 LW _average )보다 작은 너비의 백화소를 제거하여 MGD 영상 내 예상되는 문자영역의 후보군을 결정하는 단계;
(a26) 상기 예상되는 문자영역의 후보군을 결정한 MGD 영상에 대해 팽창(dilate)과 침식(erode)의 모폴로지(morphology) 연산을 수행하여 상기 MGD 영상 내에서 자소 및 띄어쓰기에 의해 산재되어 있는 문자영역을 병합하는 단계; 및
(a27) 상기 일반교육 자료의 입력단계에서 산출한 자료의 라벨들에 대해, 상기 후보군의 문자영역 내에 포함되는지의 여부를 검사하여, 일반교육 자료 내 문자와 시각자료를 각각 문자영역과 영상영역으로 분류하는 단계;를 포함하여 이루어지는 것을 특징으로 하며,
수학식 1

수학식 2

수학식 3

수학식 4

상기 수학식 1 내지 수학식 4에서, x, y는 픽셀의 열과 행의 위치, w, h는 영상의 너비와 높이, B(x, y)는 해당 픽셀 위치의 밝기 값, G(x, y)는 이웃한 픽셀에 대한 변화량, Q ₁ 과 Q ₃ 는 라벨의 너비에 대한 1사분위 수와 3사분위 수, LW 와 NL은 각각 라벨의 너비와 라벨의 총 개수, T _b 는 이진화를 수행할 경계값인, 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제6항에 있어서, 상기 (a27) 문자영역과 영상영역 분류단계는,
상기 일반교육 자료의 입력단계에서 산출한 자료의 라벨이 상기 후보군의 문자영역 내에 포함되어 있으면 문자에 대한 라벨로 결정하고, 후보군에 포함되어 있지 않으면 영상영역에 대한 라벨로 결정하여, 일반교육 자료 내 문자와 시각자료를각각 문자영역과 영상영역으로 분류하는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제3항에 있어서, 상기 (a3) 영상영역 내 문자 추출단계는,
상기 영상영역 추출단계에서 결정한 영상영역 내에 문자의 유/무를 판단하여, 문자가 있을 시에는 이를 문자영역으로 추출하되, 상기 영상영역 추출단계와 동일한 환경(문자의 라벨에 대한 평균너비, 모폴로지 연산의 필터) 하에서 그 탐색 범위를 영상영역만으로 제한하여 수행하며, 그 결과 영상영역 내 문자영역을 추출하는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제1항에 있어서, 상기 (b100) 복잡도별 영상정보 촉각화단계는,
(b1) 상기 산출된 영상영역의 밝기에 대한 누적 히스토그램을 분석하여 복잡도에 따라 영상을 저 복잡도 영상과 고 복잡도 영상으로 분류하는 영상 분류단계;
(b2) 상기 분류된 고 복잡도 영상이 주요 객체를 포함하는지의 여부를 판단하여 추출하는 고 복잡도 영상의 중심객체 유무 판별 및 추출단계; 및
(b3) 시각장애인의 인지를 돕기 위해 영상의 복잡도를 낮춰 단순화하는 고 복잡도 영상의 잡음제거 및 단순화단계;를 포함하여 이루어지는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제9항에 있어서, 상기 (b1) 영상 분류단계는,
(b11) 영상에 대한 밝기의 평균누적값을 조건적 연산식 1을 통해 산출하는 단계;
(b12) 상기 산출된 밝기의 평균누적값을 조건적 연산식 2를 통해 각각의 밝기 누적값에서 차분하여 저 복잡도 영상 내 밝기의 누적값이 연속된 구간에서 나타나는 현상을 제거하는 단계; 를 포함하여 이루어지는 것을 특징으로 하며,
상기 조건적 연산식 1은,
for(i=0, cnt=0, sum=0; i<256; i++){if((Q ₁ -1.5(Q ₃ -Q ₁ ) <= NH _i <= (Q ₃ +1.5(Q ₃ -Q ₁ )) then cnt++, sum+= NH _i ;} NH _average = sum / cnt;이며,
상기 조건적 연산식 2는,
for(i=0; i<256; i++) NH _i -= NH _average ;이고,
상기 각 연산식에서 NH _i 는 해당 밝기에 대한 누적값, NH _average 는 영상에 대한 밝기의 평균 누적값, Q ₁ 과 Q ₃ 는 각각 밝기의 누적 값에 대한 1사분위수와 3사분위수인, 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제9항에 있어서, 상기 (b2) 고 복잡도 영상의 중심 객체 유무 판별 및 추출단계는,
(b21) 고 복잡도 영상을 구성하는 픽셀의 색상 유사도를 측정하고, 양자화(quantization)를 통해 유사한 색상들을 대표색상으로 변환하는 단계;
(b22) 상기 대표색상으로 변환된 영상 내에서 중심객체 영역에 해당되는 색상의 분포도를 측정하여, 중심객체의 유무를 판별하는 단계; 및
(b23) 상기 판별 결과 중심객체가 존재할 경우 그 중심객체에 대한 윤곽선을 추출하는 단계;를 포함하여 이루어지는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제11항에 있어서, 상기 (b21) 유사한 색상들을 대표색상으로 변환하는 단계는,
PGF(Peer Group Filtering)기법을 이용하여 양자화 레벨을 결정하는 단계;
상기 결정된 레벨에 따른 양자화를 통해 유사한 색상들을 대표색상으로 변환시켜 고 복잡도 영상의 색상에 대한 복잡도를 감소시키는 단계;를 포함하여 이루어지는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제11항에 있어서, 상기 (b22) 중심객체의 유무를 판별하는 단계는,
수학식 6에 정의한 영상의 중심영역에서 빈도수가 가장 많은 색상을 중심객체의 대표색상이라 가정한 상태에서, 이에 대한 세로 방향 및 가로 방향에 대한 분산을 계산하여 영상 내 분포도를 산출하는 단계;
상기 산출된 분포도에 따라 중심객체의 유무를 판별하는 단계;를 포함하여 이루어지는 것을 특징으로 하며,
수학식 6

상기 수학식 6에서 w, h는 각각 고 복잡도 영상의 너비와 높이, AreaX _obj 와 AreaY _obj 는 각각 중심영역의 x축과 y축의 범위인, 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제13항에 있어서, 상기 중심객체 유무 판별단계는,
조건적 연산식 3을 통해 중심객체를 대표하는 색상이 수평적으로 넓게 분포되어 있거나 분포도가 낮은 경우를 중심객체가 없는 영상으로 판단하고, 그 밖의 경우에는 중심객체가 있는 것으로 판단하는 것을 특징으로 하며,
조건적 연산식 3
s _max =max(s _verticality , s _{horizontality} )
if(((s _max == s _{horizontality} )&&(s _max >T ₁ ))||(s _max <T ₂ ))
then I is a non-object image
otherwise I is an object image
(T ₁ = 0.06, T ₂ = 0.01)
상기 조건적 연산식 3에서 s _verticality 및 s _{horizontality} 는 고 복잡도 영상(I) 내 중심객체의 대표색상에 대한 최대 수직 및 최대 수평 분산, s _max 는 s _verticality 와 s _{horizontality} 중 큰 값을 갖는 최대 분산, 최대 분산과 비교하는 임계값 T ₁ 과 T ₂ 는 상수로서 다양한 고 복잡도 영상에 대해 반복적인 실험을 통해 산출되는 최적 실험치인, 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제11항에 있어서, 상기 (b23) 중심객체의 윤곽선 추출단계는,
상기 양자화된 고 복잡도 영상에서 수학식 7을 통해 정의된 영상의 네 모서리 구간에 대한 배경영역의 대표색상들을 추출하고, 그 추출된 색상들을 영상 전체에서 제거하여 영상 내에 중심객체에 대한 정보만을 남기는 단계;
상기 고 복잡도 영상에 대해 이진화 및 라벨링을 수행하여, 중심영역 이외에서 나타나는 색상정보들을 제거함과 아울러 중심객체의 대표색상에 대한 라벨들을 생성하는 단계; 및
상기 생성된 각각의 라벨들에 대한 위치가 중심영역에 포함되는지를 검사하여 잡음을 제거하고, 고 복잡도 영상 내에 남겨진 중심 객체의 윤곽선을 검출하여, 촉각정보로 변환할 영상의 중심객체를 추출하는 단계;를 포함하여 이루어지며,
수학식 7

상기 수학식 7에서 AreaX _n 및 AreaY _n 은 각각 영상의 네 모서리에 대한 배경영역, w와 h는 고 복잡도 영상의 너비와 높이인, 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제9항에 있어서, 상기 (b3) 고 복잡도 영상의 잡음제거 및 단순화단계는,
(b31) 고 복잡도 영상에 대해 이진화 및 라벨링 처리를 수행하여 영상을 구성하는 윤곽선들에 대한 라벨의 크기를 산출하는 단계;
(b32) 영상의 해상도와 햅틱디스플레이의 해상도를 비교하여 너비와 높이의 비율을 산출한 후, 각각의 라벨을 수학식 8을 통해 햅틱디스플레이의 해상도에 맞춰 축소하였을 경우, 픽셀의 크기가 햅틱디스플레이의 1셀 이하로 축소되는 라벨이 가진 영상정보를 중요도가 낮은 잡음으로 분류하여 제거하는 단계;를 포함하여 이루어지며,
수학식 8

상기 수학식 8에서, H _width 와 H _height 는 햅틱디스플레이의 너비와 높이, I _width 와 I _height 는 영상의 너비 및 높이, T _w 와 T _h 는 햅틱디스플레이로 축소하기 위한 영상의 너비 및 높이에 대한 축소 비율, LW, LH 및 n은 해당 라벨의 너비와 높이 및 총 개수, S는 라벨을 햅틱디스플레이 해상도로 변환하였을 때의 픽셀의 크기인, 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제16항에 있어서, 상기 (b3) 고 복잡도 영상의 잡음제거 및 단순화단계는,
(b33) 상기 검출된 윤곽선들의 복잡도를 낮추기 위해 윤곽선들의 코너점을 검출하고, 그 코너점을 이용하여 연결선을 생성하는 단계;
(b34) 상기 연결선들 간의 교차각을 검사하여 그 교차각이 임계각 이상일 경우 그 연결선이 공유하는 코너점을 제거하고 남은 두 점으로 새로운 연결선을 생성하여 영상의 윤곽선에 대한 복잡도를 낮추는 단계;를 더 포함하여 이루어지며,
상기 임계각은 윤곽선의 복잡도가 높은 다양한 영상에 대해 실험을 수행하여 측정된 최적 실험치인, 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제1항에 있어서, 상기 (c100) 문자인식 및 점자 변환단계는,
상기 추출한 문자영역에 대해 광학문자인식(OCR, Optional Character Recognition)을 적용하여 컴퓨터가 인식할 수 있는 정보로 변환한 후 이를 시각장애인이 인지할 수 있는 점자형태로 변환하는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제1항에 있어서, 상기 (c100) 문자인식 및 점자 변환단계는,
(c1) 일반교육 자료 내 시각자료를 제외한 문단이나 단락의 문자영역에 광학문자인식을 수행하여, 문자영역에 대한 영상정보로부터 컴퓨터가 인식할 수 있는 문자정보를 생성하는, 영상영역 외의 문자 인식단계;
(c2) 일반교육 자료 내 시각자료 내에 포함되는 문자들에 대해 광학문자인식을 수행하여, 영상영역 내의 문자영역으로부터 컴퓨터가 인식할 수 있는 문자정보를 생성하는, 영상영역 내의 문자 인식단계; 및
(c3) 상기 생성된 영상영역 외의 문자정보 및 영상영역 내의 문자정보를 점자 표현 알고리즘을 통해 시각장애인들이 인지할 수 있는 점자정보로 점역하여 표시하는, 인식된 문자의 점자 표현단계;를 포함하여 이루어지는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제19항에 있어서, 상기 (c3) 인식된 문자의 점자 표현단계는,
(c31) 상기 영상영역 외의 문자정보로부터 점역된 점자정보를 햅틱디스플레이에 표현하기 위해, 점자의 길이를 계산하여 햅틱디스플레이 해상도의 너비에 맞추어 줄 바꿈을 수행하여 점자정보를 출력하는 단계;를 포함하여 이루어지는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제19항에 있어서, 상기 (c3) 인식된 문자의 점자 표현단계는,
(c32) 상기 영상영역 내의 문자정보로부터 점역된 점자정보를 영상영역 내에 배치한 후, 주변의 영상정보와 중첩되는지를 검사하여, 중첩될 경우에는 그 점자정보에 대응하는 인덱스를 영상영역 내에 배치하고, 상기 영상영역의 외부에 해당 인덱스와 함께 점자정보를 출력하는 단계;를 포함하여 이루어지는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
제19항에 있어서, 상기 (c3) 인식된 문자의 점자 표현단계는,
한국어점자규정 및 영어점자규정을 따라 점역이 이루어지며, 연결어, 약어, 기본적인 산술 연산기호, 및 일반기호에 대한 점역을 포함하는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시방법.
자료 입력을 위한 교육자료 입력부(10), 점역된 점자를 표현하는 촉각정보 표시부(20)가 구비된 시각장애인을 위한 시각정보 표시시스템에 있어서,
일반 교육자료 내에 혼합되어 있는 각 정보에 대한 문자영역 및 영상영역을 추출하는 영상/문자영역 추출부(110);
추출한 영상영역을 분석하여 저 복잡도 영상과 고 복잡도 영상을 구분하여 촉각정보로 변환하는 복잡도별 영상 촉각화부(120); 및
추출한 문자영역 내의 문자정보 및 상기 영상영역 내의 문자정보를 분석하여, 시각장애인이 인지할 수 있는 점자정보로 변환하는 문자인식 및 점역부(130);를 포함하여 구성되는 것을 특징으로 하는 시각장애인을 위한 햅틱 디스플레이 기반 시각정보 표시시스템.