KR101357946B1 - Computer image processing system for blind person - Google Patents

Computer image processing system for blind person Download PDF

Info

Publication number
KR101357946B1
KR101357946B1 KR1020110147237A KR20110147237A KR101357946B1 KR 101357946 B1 KR101357946 B1 KR 101357946B1 KR 1020110147237 A KR1020110147237 A KR 1020110147237A KR 20110147237 A KR20110147237 A KR 20110147237A KR 101357946 B1 KR101357946 B1 KR 101357946B1
Authority
KR
South Korea
Prior art keywords
image processing
screen
computer
visually impaired
usb
Prior art date
Application number
KR1020110147237A
Other languages
Korean (ko)
Other versions
KR20130078342A (en
Inventor
김송민
김연진
Original Assignee
(주)에스에이치디
전북대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)에스에이치디, 전북대학교산학협력단 filed Critical (주)에스에이치디
Priority to KR1020110147237A priority Critical patent/KR101357946B1/en
Publication of KR20130078342A publication Critical patent/KR20130078342A/en
Application granted granted Critical
Publication of KR101357946B1 publication Critical patent/KR101357946B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces

Abstract

본 발명에서 시각 장애인에 대한 컴퓨터 화면 인식을 위한 영상 처리장치를 개시한다.
본 발명에 따른 컴퓨터 영상 처리장치는, 시각장애인을 위한 음성안내 매크로 기능을 가지며, 번거로운 입력장치를 소거함으로써, 플래그 앤 플레이 기능, 마우스 및 키보드의 자유롭게 컨트롤 기능, 고속 데이터 처리를 수행하도록 USB 접속 구조를 갖는 HID(Human Interface Device) 드라이버; 상기 HID 드라이버의 기동에 응답하여, 유클리드 기하학적 변환기술을 이용한 확대, 축소, 회전 기능을 컴퓨터 화면상으로 구현하며, 인덱스 영상기법을 이용하여 RGB 영상에 대한 화면 인식을 수행하는 영상처리 소프트웨어 모듈; 및 한글을 기반으로 제작되며 자음과 모음을 포함하여 총 2,351개의 음성 데이터를 기반으로, 마우스의 위치분석과 모니터에 출력된 영상 데이터의 분석을 통해 화면상의 임의의 정보를 음성 안내하는 음성처리 소프트웨어 모듈로 구성된 USB 펌웨어를 포함하는 것을 특징으로 한다.
따라서, 본 발명은 시각 장애인이 컴퓨터 시스템에 구애받지 않고 사무처리가 가능하고, 이동성 확보를 위해 휴대 가능한 구조를 제시하며, 화면 캡처의 빠른 속도를 위한 영상처리필터에 기반하여, 화면 정보를 실시간으로 전달함으로써, 장애인의 컴퓨터 사용 능력을 극대화할 수 있는 효과가 있다.
The present invention discloses an image processing apparatus for computer screen recognition for the visually impaired.
The computer image processing apparatus according to the present invention has a voice guidance macro function for the visually impaired, and by removing a cumbersome input device, a USB connection structure to perform flag and play functions, free control of a mouse and keyboard, and high-speed data processing. A Human Interface Device (HID) driver having a; An image processing software module that implements an enlargement, reduction, and rotation function using Euclidean geometric transformation technology on a computer screen in response to starting the HID driver, and performs screen recognition on an RGB image using an index image technique; And voice processing software module based on 2,351 audio data including consonants and vowels, and guiding arbitrary information on the screen through analysis of mouse position and image data output on the monitor. It characterized in that it comprises a USB firmware consisting of.
Accordingly, the present invention provides a structure that can be visually impaired regardless of the computer system, portable to secure mobility, and based on the image processing filter for fast screen capture, screen information in real time By transmitting, there is an effect that can maximize the computer use ability of the disabled.

Description

시각 장애인을 위한 컴퓨터 영상 처리장치{COMPUTER IMAGE PROCESSING SYSTEM FOR BLIND PERSON}COMPUTER IMAGE PROCESSING SYSTEM FOR BLIND PERSON}

본 발명은 부분 시각 장애를 갖는 컴퓨터 사용자에 대한 영상 처리방법에 관한 것으로, 더욱 상세하게는 다수 종류의 색상을 갖는 RGB 영상에 대한 인덱스 영상기법을 사용하여, 화면인식의 효율성 극대화를 도모하고, 화면의 해상도 및 색상 값을 유저에 따라 설정토록 하며, DLL 인젝션 기술을 사용하여 유저가 원하는 모든 응용소프트웨어의 영상을 캡쳐 후 분석 및 통지함으로써, 모니터에서 일어나는 모든 상황의 변화를 시각장애인에게 실시간으로 전달할 수 있는 시각 장애인을 위한 컴퓨터 영상 처리장치에 관한 것이다.
The present invention relates to an image processing method for a computer user with a partial visual impairment, and more particularly, by using an index imaging technique for RGB images having a plurality of colors, to maximize the efficiency of screen recognition, The resolution and color value of the user can be set according to the user. By using the DLL injection technology, the user can capture and analyze and notify the images of all the application softwares that the user wants, so that all the changes in the monitor can be delivered to the blind in real time. The present invention relates to a computer image processing device for the visually impaired.

일반적으로, 컴퓨터는 정보화사회를 살아가는데 있어서 없어서는 안 될 최고의 기기이며, 이러한 컴퓨터를 얼마나 능숙하고 효과적으로 사용하느냐 하는 것이 정보화사회를 살아가는 현대 사회인의 능력으로 평가받고 있는 실정이다. 따라서, 최근에는 컴퓨터를 배우기 위한 교육열이 매우 높을 뿐만 아니라 컴퓨터와 사용자를 연결시켜주는 OS(operation system) 프로그램의 발전으로 컴퓨터를 보다 배우기 쉽고 매우 간편한 사용할 수 있도록 하는 윈도우 등과 같은 OS 프로그램의 개발로 인하여 컴퓨터 사용인구가 기하급수적으로 증가하고 있다.In general, computers are indispensable in living an information society, and how proficient and effective use of such computers is regarded as the ability of modern society to live in an information society. Therefore, in recent years, due to the development of OS programs such as Windows, which is not only highly trained to learn a computer, but also the development of an OS (operation system) program that connects a computer and a user, the computer is easier to learn and very simple to use. The computer population is growing exponentially.

그러나, 상기와 같은 컴퓨터 및 OS 프로그램의 급속한 발전에도 불구하고, 시각장애인들은 윈도우 등과 같은 OS 프로그램이 탑재된 컴퓨터를 사용할 수가 없기 때문에 정상인과의 능력격차가 보다 크게 벌어지게 되어 사회로부터 급속히 도태될 수밖에 없다는 문제점이 있다.However, despite the rapid development of computers and OS programs as described above, the visually impaired people cannot use computers with OS programs such as Windows. There is no problem.

근래에는 이러한 문제점을 해결하기 위한 시각 장애인용 알고리즘이 개발되고 있는 추세이며, 일 예로 웹브라우저를 실행하여 인터넷에 접속하였을 때 홈페이지상의 각종 객체, 목록, 홈페이지의 구성 및 입력되는 주소, 홈페이지 작성시 사용된 응용프로그램의 정보 등을 사용자의 설정조건에 따라 음성으로 읽어줌으로써 시각장애인도 매우 손쉽고, 편리하게 인터넷에 접속하여 각종 정보를 얻을 수 있는 시각장애인용 인터넷 범용 프로그램화면 낭독방법이 개시되고 있다. 이를 첨부된 도 1에 의거 상세히 설명하면 다음과 같다.In recent years, algorithms for the visually impaired have been developed to solve these problems. For example, when the user accesses the Internet by executing a web browser, various objects on the homepage, a list, the address of the homepage, the address input, and the homepage are used. Disclosed is a method of reading a general-purpose program screen for the visually impaired, which allows the visually impaired to read the information of the application program by voice according to the user's setting conditions, so that the visually impaired person can easily access the Internet and obtain various information. This will be described in detail with reference to FIG. 1 as follows.

먼저, 도시된 컴퓨터 부팅단계(S100)는 컴퓨터를 ON시키는 것이며, 상기 OS프로그램 시작단계(S110)는 OS 프로그램을 실행시켜 부팅이 완료된 컴퓨터를 사용자가 용이하게 사용할 수 있도록 하는 것이다. 메시지 훅 설정 단계(S120)는 프로그램을 실행시켜 메시지 훅을 설정하고, 상기 메시지 훅킹 단계(S130)는 상기 메시지 훅 설정 단계(S120)가 완료되면, 메시지 훅킹을 시작한다. 상기와 같이 메시지 훅킹 단계(S130)가 완료되면, 상기 범용 프로그램실행단계(S140)가 실시되는데 이 단계는 사용자가 선택적으로 범용 프로그램을 실행함으로써 이루어진다.First, the illustrated computer booting step (S100) is to turn on the computer, the OS program starting step (S110) is to run the OS program so that the user can easily use the computer is completed booting. The message hook setting step (S120) executes a program to set a message hook, and the message hooking step (S130) starts the message hooking when the message hook setting step (S120) is completed. When the message hooking step (S130) is completed as described above, the general program execution step (S140) is carried out by the user selectively executes the general program.

상기와 같이 인터넷 범용 프로그램인 웹브라우저를 실행되면, 상기 주소입력단계(S200)를 실시한다. 상기 주소입력단계(S200)는 범용 프로그램상의 주소 입력란에 접속할 서버의 주소를 입력하는 것으로, 주소 입력란 포커스 단계(S210)와, 키보드 이벤트 발생 단계(S220)와, 키보드 철자 버퍼링 단계(S230)와, 저장된 키보드철자를 음성엔진에 전송하는 단계(S240)와, 키보드철자를 음성 출력하는 단계(S250)로 구성된다.When the web browser, which is a general-purpose Internet program, is executed as described above, the address input step (S200) is performed. The address input step (S200) is to input the address of the server to be connected to the address input box on the general-purpose program, the address input field focus step (S210), the keyboard event generation step (S220), the keyboard spelling buffering step (S230), And transmitting the stored keyboard spell to the voice engine (S240) and outputting the keyboard spell to the voice (S250).

상기 주소 입력란 포커스 단계(S210)는 웹브라우저 실행하면 주소 입력란에 커서를 위치시키는 것이고, 상기 키보드 이벤트발생단계(S220)는 사용자가 커서가 위치된 주소 입력란에 접속할 서버의 주소를 입력하기 위하여 키보드를 치는 것이며, 상기 키보드 철자 버퍼링 단계(S230)는 사용자가 친 키보드의 철자를 버퍼에 저장하고, 상기 저장된 키보드철자를 음성엔진에 전송하는 단계(S240)는 버퍼에 저장되어 있는 키보드철자를 음성엔진으로 전송하고, 상기와 같이 음성엔진으로 전송된 키보드 철자 정보는 상기 키보드철자를 음성 출력하는 단계(S250)가 실시됨으로 출력수단을 통하여 음성으로 출력됨으로써 시각장애인은 자신이 올바른 주소를 입력하고 있는지 음성출력에 의해 바로 확인할 수 있어 잘못된 입력을 즉시 정정할 수 있는 것이다.The address input field focusing step (S210) is to place a cursor in an address input box when the web browser is executed, and the keyboard event generating step (S220) allows a user to input a keyboard address to access an address input box where a cursor is located. The keyboard spelling buffering step (S230) is to store the spelling of the keyboard hit by the user in the buffer, and the step of transmitting the stored keyboard spelling to the voice engine (S240) to the keyboard spelling stored in the buffer to the voice engine And the keyboard spelling information transmitted to the voice engine as described above is outputted as a voice through an output means by outputting the keyboard spell (S250), so that the visually impaired person inputs a correct address. It can be checked immediately by so that the wrong input can be corrected immediately.

상기와 같은 주소입력단계(S200)가 완료되면, 상기 서버접속확인단계(S150)가 실시된다. 상기 서버접속확인단계(S150)는 상기 주소입력단계(S200)에서 입력된 주소에 해당되는 서버에 접속되었는지를 확인하고, 만약 접속되지 않거나 또는 접속 중 재 차 주소를 입력할 때에는 상기 주소입력단계(S200)로 리턴 된다.When the address input step (S200) is completed as described above, the server connection confirmation step (S150) is performed. The server access check step (S150) checks whether the server corresponding to the address input in the address input step (S200) is connected, and if not connected or inputs the address again during the connection, the address input step ( It is returned to (S200).

상기 문서파싱단계(S160)는 웹브라우저를 사용하여 접속된 홈페이지상의 문서를 음성엔진에 의해 음성 출력할 수 있도록 문서내용을 파싱(PARSING)한다. 상기 객체유무확인 및 객체정보음성출력단계(S300)는 접속된 서버의 홈페이지내에 객체가 존재하는지를 확인하고, 객체가 존재할 때 그 객체정보를 음성으로 출력하는 것으로써, 객체유무확인단계(S310)와, 객체정보버퍼링단계(S320)와, 객체정보전송단계(S330)와, 객체정보음성출력단계(S340)로 구성된다.The document parsing step S160 parses the document contents so that the document on the home page accessed using the web browser can be output by the voice engine. The object existence check and object information voice output step (S300) is to check whether the object exists in the home page of the connected server, and when the object exists by outputting the object information by voice, the object presence check step (S310) and , An object information buffering step (S320), an object information transmitting step (S330), and an object information voice output step (S340).

상기 객체유무확인단계(S310)는 접속된 서버의 홈페이지내에 객체가 있는 지를 확인하고, 만약 객체가 존재하지 않을 때 상기 문서파싱단계(S160)로 리턴된다. 상기 객체정보버퍼링단계(S320)는 상기 객체유무확인단계(S310)에서 객체가 있을 때 객체들의 정보를 버퍼에 저장하고, 상기 객체정보전송단계(S330)는 버퍼에 저장된 객체정보를 음성출력을 위하여 음성엔진으로 전송하며, 상기 객체정보음성출력단계(S340)는 음성엔진으로 전송된 객체정보를 출력수단을 통하여 음성으로 출력한다.The object existence checking step S310 checks whether an object exists in the homepage of the connected server, and if the object does not exist, returns to the document parsing step S160. The object information buffering step (S320) stores the information of the objects in the buffer when there is an object in the object existence checking step (S310), and the object information transmitting step (S330) for voice output of the object information stored in the buffer. It transmits to the voice engine, the object information voice output step (S340) outputs the object information transmitted to the voice engine as a voice through the output means.

상기 객체정보는 접속된 페이지상의 프레임 갯수, 그림정보 및 응용프로그램 구성요소, 깜박이는 그림 또는 문자 또는 도표 등이다. 상기 객체내용읽기순서선택단계(S400)는 홈페이지내에 존재하는 객체중 내용이 있는 객체를 확인하고 내용이 있는 객체를 사용자가 임의로 순서를 정하여 각 객체내용을 음성으로 출력하도록 하는 것으로써, 객체내용유무확인단계(S410)와, 읽기순서선택단계(S420)와, 객체내용버퍼링단계(S430)와, 객체내용전송단계(S440)와, 객체내용음성출력 단계(S450)로 구성된다.The object information may include the number of frames on a page to be accessed, picture information and application components, a flashing picture or text or a table. In the object content reading order selection step (S400), by checking the objects with contents among the objects existing in the homepage and allowing the user to randomly order the objects with contents, the contents of each object are output by voice. The verification step (S410), the reading order selection step (S420), the object content buffering step (S430), the object content transmission step (S440), and the object content voice output step (S450).

상기 객체내용유무확인단계(S410)는 상기 문서파싱단계(S160)에서 파싱된 페이지에 객체가 있을 때 객체의 내용이 있는지를 확인하고, 만약 내용이 없을 때 객체의 내용이 없음을 알리는 메시지를 사용자에게 음성으로 출력한다. 상기 읽기순서선택단계(S420)는 상기 객체내용유무확인단계(S410)에서 객체의 내용이 있을 때 사용자가 객체내용의 읽기 순서를 선택하고, 상기 객체내용버퍼링단계(S430)는 상기 읽기순서선택단계(S420)에서 순서가 선택된 객체 내용을 순서에 따라 순차적으로 버퍼링하고, 상기 객체내용전송단계(S440)는 상기 버퍼에 저장된 객체내용을 음성 출력하기 위하여 음성엔진으로 전송하며, 상기 객체내용음성출력단계(S450)는 음성엔진으로 전송된 객체내용을 출력수단을 통하여 음성으로 출력한다.The object content existence check step (S410) checks whether there is an object content when there is an object on the page parsed in the document parsing step (S160), and if there is no content, a message indicating that there is no content of the object. The voice is output to. In the reading order selection step (S420), the user selects the reading order of the object content when there is an object content in the object content checking step (S410), and the object content buffering step (S430) is the reading order selection step. In step S420, the contents of the objects selected in order are sequentially buffered according to the order, and the object contents transmission step S440 is transmitted to a voice engine to output the contents of the objects stored in the buffer to the voice engine. S450 outputs the object content transmitted to the voice engine as voice through the output means.

상기 링크유무확인 및 정보 출력단계(S500)는 접속된 서버의 페이지에 링크가 있는지를 확인하고, 만약 링크가 있을 때 그 링크목적을 작성하고, 작성된 링크목록을 음성을 출력하는 것으로서, 링크유무확인단계(S510)와, 링크목록작성단계 (S520)와, 링크 목록 버퍼링 단계(S530)와, 링크 목록전송단계(S540)와, 링크목록음성출력단계(S550)로 구성된다.The link presence confirmation and information output step (S500) is to check whether there is a link on the page of the server connected to, and if there is a link to create the link purpose, and outputs the created link list, the link presence confirmation Step S510, link list creation step S520, link list buffering step S530, link list transmission step S540, and link list voice output step S550.

상기 링크유무확인단계(S510)는 접속된 서버의 페이지에 링크가 있는 지를 확인하고, 만약 링크가 없을 때 상기 문서파싱단계(S160)로 리턴 되거나 또는 상기 프레임유무확인 및 출력단계(S600)로 이동한다. 상기 링크목록작성단계(S520)는 상기 링크유무확인단계(S510)에서 링크가 있을 때 링크목록을 작성하고, 상기 링크목록버퍼링단계(S530)는 상기 링크목록작성단계(S520)에서 작성된 링크목록을 버퍼에 저장하고, 상기 링크목록 전송단계(S540)는 버퍼에 저장된 링크목록을 음성으로 출력하기 위하여 음성엔진으로 전송하며, 상기 링크목록음성 출력단계(S550)는 음성엔진으로 전송된 링크목록을 출력수단을 통하여 음성으로 출력한다.The link presence checking step (S510) checks whether there is a link on the page of the connected server, and if there is no link, return to the document parsing step (S160) or go to the frame presence check and output step (S600). do. The link list creation step (S520) creates a link list when there is a link in the link presence checking step (S510), and the link list buffering step (S530) creates a link list created in the link list creation step (S520). Store in a buffer, the link list transmission step (S540) is transmitted to the voice engine to output the link list stored in the buffer, the link list voice output step (S550) outputs the link list transmitted to the voice engine Sound is output through the means.

상기와 같은 구성을 갖는 종래 시각장애인용 인터넷 웹브라우저화면낭독방법은 인터넷을 접속할 때 주소입력에서부터 접속된 페이지 상에 존재하는 각종정보(객체정보, 화면구성, 그림정보, 응용프로그램정보 등)를 음성으로 변화시켜 상세하게 출력하도록 한다. 그러나, 전술된 웹브라우저화면 낭독방법은 웹 화면상에서 제공되는 정보 예컨대, "전송완료", "전송중", "전송실패, 파일의 "전송된량", 남아 있는 데이터량", 파일의 "이름", "위치", "용량", 작성날짜" 등과 같은 텍스트 정보를 음성 데이터로 변환하는 것으로, 화면에 대한 실질적인 인식은 불가능한 구조이다. 즉, 화면상에서의 변화를 인식하지 못하기 때문에 사무자동화 OS를 운용하기에는 많은 무리가 따르게 된다.
In the conventional method of reading the Internet web browser screen for the visually impaired person having the above configuration, the user inputs various information (object information, screen composition, picture information, application program information, etc.) existing on the accessed page from address input when accessing the Internet. Change to to print in detail. However, the above-described method of reading the web browser screen includes information provided on the web screen, for example, "transfer completed", "transmitting", "transmission failure," transmitted amount ", amount of data remaining", and "name" of the file. By converting text information such as "," location "," capacity ", creation date", etc. into voice data, it is impossible to actually recognize the screen, that is, office automation OS because it does not recognize the change on the screen. There are a lot of crowds to run.

1. 대한민국 특허등록번호 10-0421566, 등록일자 2004년 02월 24일, 출원번호 10-2000-0058922, 출원일자 2000년 10월 06일1. Republic of Korea Patent Registration No. 10-0421566, Registration Date February 24, 2004, Application No. 10-2000-0058922, Application Date October 06, 2000

본 발명은 이와 같은 문제점을 해결하기 위해 창출된 것으로, 본 발명의 목적은 시각장애인이 정상인과 같이 화면을 보면서 원하는 작업을 처리할 수 있도록 하여 장애인에 대한 사무 직종의 취업을 도모할 수 있는 시각 장애인을 위한 컴퓨터 영상 처리장치를 제공함에 있다.The present invention was created to solve the above problems, and an object of the present invention is to enable a visually impaired person to handle a desired task while viewing a screen as a normal person, so that the visually impaired person can promote employment of office occupations for the disabled. It is to provide a computer image processing apparatus for.

본 발명의 다른 목적은, 시각 장애인이 컴퓨터 시스템에 구애받지 않고 사무처리가 가능하고, 이동성 확보를 위해 휴대 가능한 구조를 제시하며, 화면 캡처의 빠른 속도를 위한 영상처리필터에 기반하여, 화면 정보를 실시간으로 전달함으로써, 장애인의 컴퓨터 사용 능력을 극대화할 수 있는 시각 장애인을 위한 컴퓨터 영상 처리장치를 제공함에 있다.Another object of the present invention, the visually impaired can be handled without regard to the computer system, propose a portable structure to secure mobility, and based on the image processing filter for fast screen capture, screen information By delivering in real time, to provide a computer image processing device for the visually impaired that can maximize the computer ability of the disabled.

본 발명의 또 다른 목적은, 가상마우스와 가상키보드 드라이버가 장착되어 있어 화면상의 문자를 인식하여 음성으로 안내하는 기능을 통해 메일, 메신저, 각종문서 작성 등이 가능하여 다양한 정보를 주고받을 수 있도록 하고, 매크로설정과 단축키설정기능을 통해 반복적으로 이루어지거나 정밀을 요구하는 업무에도 시각장애인이 사용 가능할 수 있는 시각 장애인을 위한 컴퓨터 영상 처리장치를 제공함에 있다.Still another object of the present invention is equipped with a virtual mouse and a virtual keyboard driver to recognize the characters on the screen through the function of voice guidance to enable a variety of information to send and receive mail, messenger, various documents, etc. In addition, the present invention provides a computer image processing apparatus for the visually impaired, which may be used by the visually impaired even in a task that is repeatedly performed or requires precision through macro setting and a shortcut key setting function.

본 발명의 또 다른 목적은, 공공기관이나 가정에서 저 시력자가 인터넷을 사용하는 경우 원하는 화면을 부분 확대하여 정보 접근성을 용이하게 함으로써, 장애인에 대한 글로벌 정보 공유를 활성화할 수 있는 시각 장애인을 위한 컴퓨터 영상 처리장치를 제공함에 있다.
Another object of the present invention is to provide a computer for the visually impaired who can activate global information sharing by disabling the desired screen to facilitate information access when a low vision person uses the Internet in a public institution or at home. An image processing apparatus is provided.

상기 목적을 달성하기 위한 본 발명의 관점에 따른 시각 장애인을 위한 컴퓨터 영상 처리장치는, 시각 장애인을 위한 컴퓨터 화면 인식을 위한 영상처리 장치에 있어서, 시각장애인을 위한 음성안내 매크로 기능을 가지며, 번거로운 입력장치를 소거함으로써, 플래그 앤 플레이 기능, 마우스 및 키보드의 자유롭게 컨트롤 기능, 고속 데이터 처리를 수행하도록 USB 접속 구조를 갖는 HID(Human Interface Device) 드라이버; 상기 HID 드라이버의 기동에 응답하여, 유클리드 기하학적 변환기술을 이용한 확대, 축소, 회전 기능을 컴퓨터 화면상으로 구현하며, 인덱스 영상기법을 이용하여 RGB 영상에 대한 화면 인식을 수행하는 영상처리 소프트웨어 모듈; 및 한글을 기반으로 제작되며 자음과 모음을 포함하여 총 2,351개의 음성 데이터를 기반으로, 마우스의 위치분석과 모니터에 출력된 영상 데이터의 분석을 통해 화면상의 임의의 정보를 음성 안내하는 음성처리 소프트웨어 모듈로 구성된 USB 펌웨어를 포함하는 것을 특징으로 한다.Computer image processing apparatus for the visually impaired according to an aspect of the present invention for achieving the above object, in the image processing apparatus for computer screen recognition for the visually impaired, has a voice guidance macro function for the visually impaired, cumbersome input A Human Interface Device (HID) driver having a USB connection structure to perform flag and play functions, free control of a mouse and keyboard, and high-speed data processing by erasing the device; An image processing software module that implements an enlargement, reduction, and rotation function using Euclidean geometric transformation technology on a computer screen in response to starting the HID driver, and performs screen recognition on an RGB image using an index image technique; And voice processing software module based on 2,351 audio data including consonants and vowels, and guiding arbitrary information on the screen through analysis of mouse position and image data output on the monitor. It characterized in that it comprises a USB firmware consisting of.

본 발명의 바람직한 실시 예에 따른 USB 펌웨어는, 사용자 컴퓨터에 접속되어 USB 통신 프로토콜에 따라 데이터 교환이 가능한 USB 통신모듈; 장치를 이용하여 실제 장애인의 입력신호 없이 간단한 매크로 설정만으로 복잡한 작업들을 처리하기 위한 가상마우스/가상키보드 드라이버; 각종 프로그램 제어를 포함하여, 메신저 또는 이메일 정보에 대한 음성 출력을 수행하는 매크로 설정모듈; 반복 작업에 대한 데이터 정리를 단축키를 이용하여 수행할 수 있도록 도모하는 단축키 설정모듈; 원본 그림을 크기를 변경하는 StretchBlt 함수를 이용하는 윈도우 소스 프로그램에 기반하여 사용자로부터 임의의 화면이 가공 제어되는 부분 확대모듈; 상기 부분 확대모듈과 연동함으로써, 2차원 영상인식 기법에 따라 문자나 이미지를 인식하고 유클리드 기하학적 변환기술을 이용하여 해당 화면에 대한 확대, 축소, 회전 등을 구현하는 영상처리 라이브러리; 및 상기 가상마우스/가상키보드 드라이버와 연동하여, 마우스의 위치분석과 모니터에 출력된 영상 데이터의 분석을 통해 다양한 정보를 음성 안내하기 위한 음성처리 라이브러리로 구성되는 것을 특징으로 한다.
USB firmware according to an embodiment of the present invention, the USB communication module connected to the user computer capable of data exchange in accordance with the USB communication protocol; A virtual mouse / virtual keyboard driver for processing complex tasks using a simple macro setting without an input signal of an actual disabled person using a device; A macro setting module for performing voice output on messenger or email information, including various program control; Short cut key setting module to facilitate data cleanup for a repetitive operation using a shortcut key; A partial magnification module in which an arbitrary screen is processed by a user based on a window source program using a StretchBlt function for resizing an original picture; An image processing library for recognizing a character or an image according to a 2D image recognition technique and for enlarging, reducing, or rotating a corresponding screen by using a Euclidean geometric transformation technique by interworking with the partial enlargement module; And a voice processing library for guiding various information by guiding with the virtual mouse / virtual keyboard driver and analyzing the position of the mouse and the image data output to the monitor.

전술된 바와 같이, 본 발명에 따른 시각 장애인을 위한 컴퓨터 영상 처리장치는, 시각 장애인이 컴퓨터 시스템에 구애받지 않고 사무처리가 가능하고, 이동성 확보를 위해 휴대 가능한 구조를 제시하며, 화면 캡처의 빠른 속도를 위한 영상처리필터에 기반하여, 화면 정보를 실시간으로 전달함으로써, 장애인의 컴퓨터 사용 능력을 극대화할 수 있는 효과가 있다. 또한, 본 발명에서는 공공기관이나 가정에서 저 시력자가 인터넷을 사용하는 경우 원하는 화면을 부분 확대하여 정보 접근성을 용이하게 함으로써, 장애인에 대한 글로벌 정보 공유가 가능하여 장애인의 삶의 질 향상을 도모할 수 있는 효과가 있다.
As described above, the computer image processing apparatus for the visually impaired according to the present invention is capable of office work without regard to the computer system, and suggests a portable structure for securing mobility, and speed of screen capture Based on the image processing filter for, by delivering the screen information in real time, there is an effect that can maximize the computer use ability of the disabled. In addition, in the present invention, when a low-sight person uses the Internet in a public institution or at home, the desired screen is partially enlarged to facilitate access to information, thereby enabling global information sharing for the disabled to improve the quality of life of the disabled. It has an effect.

도 1은 종래 시각장애인용 인터넷 웹브라우저 화면낭독방법을 설명하기 위한 플로우챠트이다.
도 2는 본 발명에 따른 시각장애인을 위한 컴퓨터 영상처리 장치를 나타낸 구성도이다.
도 3은 본 발명에 따른 HID 드라이버의 동작 순서를 설명하기 위한 플로우챠트이다.
도 4는 본 발명에 따른 화면인식 알고리즘을 설명하기 위한 플로우챠트이다.
도 5는 본 발명에 따른 영상처리를 위한 화면 분석 시간을 측정한 실험 데이터를 나타낸 도면이다.
도 6은 본 발명에 따른 매크로 설정을 위한 탭 페이지를 나타낸 도면이다.
도 7은 도 6의 매크로 녹화/재생 기능을 설명하기 위한 탭 페이지이다.
도 8은 도 6의 원격제어명령-Client & Server 기능을 설명하기 위한 탭 페이지이다.
도 9는 본 발명에 따른 화면 인식을 위한 스크린 샷 설정을 나타낸 화면이다.
도 10은 도 9의 화면인식 등록을 설명하기 위한 도면이다.
도 11은 본 발명에 따른 인식점을 비교 방법을 설명하기 위한 도면이다.
도 12는 본 발명에 따른 시간 변수를 인식하기 위한 조건 설정 창을 나타낸 도면이다.
1 is a flowchart illustrating a conventional method for reading a screen of an Internet web browser for the visually impaired.
2 is a block diagram showing a computer image processing apparatus for the visually impaired according to the present invention.
3 is a flowchart for explaining an operation procedure of the HID driver according to the present invention.
4 is a flowchart for explaining a screen recognition algorithm according to the present invention.
5 is a diagram illustrating experimental data obtained by measuring a screen analysis time for image processing according to the present invention.
6 is a diagram illustrating a tab page for setting a macro according to the present invention.
FIG. 7 is a tab page for explaining the macro recording / playback function of FIG. 6.
FIG. 8 is a tab page for describing the remote control command-client & server function of FIG. 6.
9 is a screen showing a screen shot setting for screen recognition according to the present invention.
FIG. 10 is a diagram for describing screen recognition registration of FIG. 9.
11 is a view for explaining a method for comparing the recognition point according to the present invention.
12 is a view showing a condition setting window for recognizing a time variable according to the present invention.

이하, 본 발명의 바람직한 실시 예를 첨부된 예시도면에 의거 상세히 설명하면 다음과 같다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.

먼저, 본 발명에 따른 시각장애인을 위한 컴퓨터 영상처리 장치는, 시각장애인이 정상인과 같이 화면을 보면서 원하는 작업을 처리할 수 있도록 하기 위한 것으로, 언제어디서나 사무처리가 가능하도록 이동성 확보를 위해 휴대용 장치이다. 또한, 가상마우스와 가상키보드 드라이버가 장착됨으로써, 화면상의 문자를 인식하여 음성으로 안내하는 기능을 포함하며, 매크로설정과 단축키설정기능을 통해 반복적으로 이루어지거나 정밀을 요구하는 업무에도 시각장애인이 사용 가능하도록 한다. 그리고, 본 발명에서는 화면 부분 확대기능을 포함하고, 펌웨어를 탑재하여 추가비용 없이 업그레이드 서비스 제공 가능하도록 설계된다.First, a computer image processing apparatus for the visually impaired according to the present invention is to enable a visually impaired person to process a desired task while viewing a screen as a normal person, and is a portable device for securing mobility so that office work can be performed at any time. . In addition, it is equipped with a virtual mouse and a virtual keyboard driver, it includes a function to recognize the characters on the screen to guide the voice, and the visually impaired can also be used for tasks that are repeatedly performed or require precision through the macro setting and hot key setting function Do it. In addition, the present invention includes a screen magnification function, and is designed to be able to provide upgrade service without additional cost by mounting firmware.

도 2는 본 발명에서 제시되는 시각장애인을 위한 컴퓨터 영상처리 장치를 나타낸 구성도이다. 이는 하드웨어적 구성과 소프트웨어적 구성을 포괄하는 것으로, WindowXP 및 Window7 등 모든 OS에 제한 없이 사용이 가능하며, USB 모듈을 이용함으로써 플래그 앤 플레이 기능을 구현하여 자동으로 장치를 사용할 수 있도록 제공한다. 또한, 직접적인 제어가 없이도 마우스 및 키보드를 자유롭게 컨트롤할 수 있을 뿐 만 아니라, 초당 100회 이상의 고속 데이터 처리가 가능하도록 한다.2 is a block diagram showing a computer image processing apparatus for the visually impaired presented in the present invention. It covers both hardware and software configurations, and can be used for all OSs such as WindowXP and Window7 without any limitations. The USB module enables flag and play functions to automatically use the device. In addition, the mouse and keyboard can be freely controlled without direct control, and high-speed data processing of 100 or more times per second is possible.

즉, 시각장애인을 위한 음성안내 매크로 기능을 가지며, 번거로운 입력장치를 소거함으로써, 플래그 앤 플레이 기능, 마우스 및 키보드의 자유롭게 컨트롤 기능, 고속 데이터 처리를 수행하도록 USB 접속 구조를 갖는 HID(Human Interface Device) 드라이버, 유클리드 기하학적 변환기술을 이용하여 화면에 대한 확대, 축소, 회전 등을 구현하며, 인덱스 영상기법을 이용하여 RGB 영상에 대한 화면 인식을 수행하는 영상처리 소프트웨어, 한글을 기반으로 제작되었으며 자음과 모음을 포함하여 총 2,351개의 음성 데이터를 기반으로, 마우스의 위치분석과 모니터에 출력된 영상 데이터의 분석을 통해 다양한 정보를 음성 안내하는 음성처리 소프트웨어로 이루어진다.In other words, HID (Human Interface Device) has a voice guidance macro function for the visually impaired, and has a USB connection structure to perform flag and play functions, free control of a mouse and keyboard, and high-speed data processing by eliminating cumbersome input devices. It uses the driver and Euclid's geometric transformation technology to implement zooming in, zooming out, and rotation on the screen, and image processing software that performs screen recognition on RGB images using indexed image techniques. Based on a total of 2,351 audio data, including a voice analysis software to guide a variety of information through the analysis of the location of the mouse and the image data output to the monitor.

한편 도시된 바와 같이, 하드웨어적 구조 및 소프트웨어로 이루어진 USB 펌웨어는 사용자 컴퓨터에 접속되어 USB 통신 프로토콜에 따라 데이터 교환이 가능한 USB 통신모듈(221)을 포함하며, 장치를 이용하여 실제 장애인의 입력신호 없이 간단한 매크로 설정만으로 복잡한 작업들을 빠르고 정확하게 처리하기 위한 가상마우스 드라이버(211) 및 가상키보드 드라이버(213)와, 각종 프로그램을 제어(시작 및 종료)를 포함하여, 메신저 또는 이메일 정보에 대한 음성 출력을 수행하는 매크로 설정모듈(215)과, 반복 작업에 대한 데이터 정리를 단축키를 이용하여 수행할 수 있도록 도모하는 단축키 설정모듈(217)과, 원본 그림을 크기를 변경하는 StretchBlt 함수를 이용하는 윈도우 소스 프로그램에 기반하여 사용자로부터 임의의 화면이 가공 제어되는 부분 확대모듈(219)과, 상기 부분 확대모듈(219)과 연동함으로써, 2차원 영상인식 기법에 따라 문자나 이미지를 인식하고 유클리드 기하학적 변환기술을 이용하여 해당 화면에 대한 확대, 축소, 회전 등을 구현하는 영상처리 라이브러리(221)와, 상기 가상마우스 드라이버(211) 및 가상키보드 드라이버(213)와 연동하여, 마우스의 위치분석과 모니터에 출력된 영상 데이터의 분석을 통해 다양한 정보를 음성 안내하기 위한 음성처리 라이브러리(223)로 구성된다.On the other hand, as shown, the USB firmware consisting of a hardware structure and software includes a USB communication module 221 that can be connected to the user computer to exchange data in accordance with the USB communication protocol, without the input signal of the actual disabled using the device Performs voice output for messenger or e-mail information, including virtual mouse driver 211 and virtual keyboard driver 213 for controlling complex tasks quickly and accurately with simple macro settings, and controlling (starting and closing) various programs. Based on a Windows source program that uses a macro setting module 215 to perform the data, and a shortcut setting module 217 to perform data cleanup for repetitive operations using a shortcut key, and a StretchBlt function for resizing the original picture. Partial magnification module 21 in which an arbitrary screen is processed by the user 9) and image processing for interworking with the partial magnification module 219 to recognize a character or an image according to a two-dimensional image recognition technique and to implement enlargement, reduction, and rotation of a corresponding screen using Euclidean geometric transformation technology. A voice processing library for guiding various information by guiding the library 221 and the virtual mouse driver 211 and the virtual keyboard driver 213 through analysis of the position of the mouse and the analysis of the image data output to the monitor ( 223).

여기서, 상기 USB 펌웨어에 적용되는 하드웨어는 본 발명의 일 예로서 AT90USB162 칩이 사용되며, 16MHz의 주파수 클럭을 제공받는 AVR USB MCU이다. 이는 16K FLASH 메모리를 보유하며, SMD 타입으로 TQFP32 소켓 아답터 보드를 사용한다. EEPROM 메모리는 512Byte이고, RAM 메모리는 512Byte이며 USB 컨트롤러을 내장하고 있다.Here, the hardware applied to the USB firmware is an AVR USB MCU that uses an AT90USB162 chip as an example of the present invention and receives a frequency clock of 16 MHz. It has 16K FLASH memory and uses a TQFP32 socket adapter board as a SMD type. EEPROM memory is 512 bytes, RAM memory is 512 bytes and it has a built-in USB controller.

따라서, 상기 MCU의 내부 메모리를 이용하여 프로그램(펌웨어)을 저장 및 실행토록 하며, 입력된 포트를 통해 각 하드웨어를 제어하거나, USB 포트 및 컨텍터를 통해 컴퓨터와 통신을 수행한다. 상기 USB 컨트롤러는 컴퓨터에 USB장치로 인식토록 함으로써, 펌웨어를 통해 USB 마우스로 인식 후 명령에 따른 이벤트를 통해 실제 마우스를 제어한다.Therefore, a program (firmware) is stored and executed using the internal memory of the MCU, and each hardware is controlled through an input port or communicated with a computer through a USB port and a contactor. The USB controller allows the computer to recognize the USB device as a USB device. The USB controller recognizes the USB mouse as a firmware and controls the actual mouse through an event according to a command.

상기한 바와 같이, 하드웨어적 구조와 소프트웨어를 포함하는 것은, 불법 복제를 방지함과 더불어, 펌웨어 업데이트를 통해 주기적으로 변경 즉, 제품의 VenderID 및 ProductorID 그리고 USB 인증 방식을 변경함으로써 보안성을 강화하기 위함이다.As described above, including the hardware structure and software is to prevent illegal copying, and to enhance security by periodically changing through firmware update, that is, changing the product's VenderID and ProductorID and USB authentication method. to be.

한편, 상기 HID(Human Interface Device) 드라이버는, 장애인을 위한 음성안내 매크로의 경우 기존의 번거로운 입력장치를 대신해 유저의 편의성을 최대화할 수 있는 장치로써, WindowXP 및 Window7 등 모든 OS에 제한 없이 사용되도록 하고 있다. 또한, 플래그앤플레이 기능을 사용하여 자동으로 장치를 사용할 수 있도록 제공하기 때문에, 개발환경에 따라 운영체제의 영향을 받지 않도록 하며, 추가적으로 드라이버 파일을 설치해야하는 번거로움을 제거한다.On the other hand, the HID (Human Interface Device) driver is a device that can maximize the convenience of the user in place of the existing cumbersome input device in the case of the voice guidance macro for the disabled, so that it can be used in all OS such as WindowXP and Window7 without limitation have. In addition, by using the flag and play function to automatically use the device, it is not affected by the operating system depending on the development environment, and eliminates the need to install additional driver files.

그리고, 직접적인 제어가 없이도 마우스 및 키보드를 자유롭게 컨트롤할 수 있도록 함에 따라, 시각장애인을 위한 기기의 경우 유저의 간단한 조작만으로도 다른 복잡하고 다양한 일들이 처리되도록 유도한다. 따라서 유저가 버튼 하나만으로 마우스와 키보드를 통한 실제 입력기능들을 처리하기 위해 이를 제어할 수 있도록 하고 있다.In addition, by allowing the mouse and the keyboard to be freely controlled without direct control, the device for the visually impaired leads to other complicated and various things to be handled with a simple operation of the user. Therefore, the user can control this to handle the actual input functions through the mouse and keyboard with a single button.

또한 상기 HID(Human Interface Device) 드라이버는, 초당 100회 이상의 고속 데이터 처리가 가능하도록 설계됨에 따라, 속도와 정확성을 높이게 된다. 이는 윈도우 메시지를 이용하여 데이터를 처리하는 경우 순차처리 방식으로 데이터 처리에 지연시간이 최소화하고, 입력처리 부분의 오류를 방지할 뿐만 아니라, 통신 데이터의 크기를 최소화하여 통신 부하를 줄여 최대의 성능 발휘할 수 있도록 하고 있다.In addition, the human interface device (HID) driver is designed to enable high-speed data processing of 100 or more times per second, thereby increasing speed and accuracy. When processing data using a window message, this method can minimize delay time in data processing, prevent errors in input processing part, and minimize communication size to reduce the communication load to achieve maximum performance. To make it possible.

도 3은 본 발명에 따른 HID 드라이버의 동작 순서를 설명하기 위한 플로우챠트이다. 도시된 바와 같이, S301 단계에서 USB 스틱을 컴퓨터에 장착하며, 상기 USB 통신모듈(221)을 통해 컴퓨터와의 접속이 이루어진다. S303 단계로 진입하여, HID 키보드 및 마우스 가상 드라이버가 생성되는데, 이는 상기 가상마우스 드라이버(211) 및 가상키보드 드라이버(213)의 동작을 수행하기 위한 드라이버 생성단계이다.3 is a flowchart for explaining an operation procedure of the HID driver according to the present invention. As shown, in step S301 the USB stick is mounted on the computer, and the connection with the computer is made through the USB communication module 221. In step S303, a HID keyboard and mouse virtual driver is generated, which is a driver generation step for performing operations of the virtual mouse driver 211 and the virtual keyboard driver 213.

그리고, S305 단계에서 통신을 위해 디바이스가 초기화되며, S307 단계를 통해 디바이스가 오픈 되며, 이후, S309 단계로 진입하여 보안을 위해 스틱 인증(VID, PID)을 수행하며, S311 단계에서 마우스 및 키보드가 제어된다. 즉, 상기 가상마우스 드라이버(211)와 가상키보드 드라이버(213)의 동작이 이루어진다. 이는 가상키보드 드라이버(213)를 통해 기 설정된 단축키 설정모듈(217)에 따른 동작을 수행하거나, 매크로 설정 모듈(215)에 의한 매크로 기능이 수행된다.The device is initialized for communication in step S305, the device is opened through step S307, and then the device enters step S309 to perform stick authentication (VID, PID) for security, and in step S311 the mouse and keyboard Controlled. That is, the operation of the virtual mouse driver 211 and the virtual keyboard driver 213 is performed. This performs an operation according to the preset shortcut key setting module 217 through the virtual keyboard driver 213 or performs a macro function by the macro setting module 215.

그리고, S313 단계를 거쳐 제어 완료 후 디바이스를 닫는다. 이러한 절차는 플래그앤플레이 동작에 기반하며, 키보드 및 마우스에 대한 누름, 땜, 클릭, 더블클릭, 드레그, 휠 동작 등을 인지하게 된다.After the control is completed through the step S313, the device is closed. This procedure is based on flag and play gestures and recognizes pressing, soldering, clicking, double-clicking, dragging, wheeling, etc. for the keyboard and mouse.

한편, 상기 영상처리 소프트웨어는 유저의 행동 패턴과 화면 속의 움직임을 빠르고 정확하게 캡쳐하고 분석하여 이 데이터를 음성안내 하기 위한 것으로, 유저 컴퓨터에 실행중인 모든 응용 소프트웨어에 대한 화면 인식을 수행한다. 이를 위해, DLL 인젝션 기술을 사용하여 유저가 원하는 모든 응용소프트웨어의 영상을 캡쳐후 분석하며, 게임과 동영상재생 응용프로그램의 화면 인식을 수행한다.On the other hand, the image processing software is to quickly and accurately capture and analyze the user's behavior patterns and movements on the screen to guide the data, and performs screen recognition for all the application software running on the user computer. To do this, DLL injection technology is used to capture and analyze the images of any application software that the user desires, and to perform screen recognition of game and video playback applications.

상기 DLL 인젝션은 다른 프로세스(현재 컴퓨터에서 실행중인 프로그램)에 특정 DLL 파일을 삽입시키는 것으로, 다른 프로세스에게 API 함수인 LoadLibary()를 호출하도록 명령하여 내가 원하는 DLL을 로딩시키는 것이다. 본 발명에 따른 DLL 인젝션은 파이프 통신 기법을 이용하여 데이터를 주고받게 되며, 여기서 파이프 통신이란 프로세스가 쓰고 다른 프로세스가 읽은 선입선출의 큐 형태이다.The DLL injection inserts a specific DLL file into another process (a program currently running on the computer), and instructs another process to call the API function LoadLibary () to load the DLL I want. The DLL injection according to the present invention transmits and receives data using a pipe communication technique, where pipe communication is a first-in, first-out queue form written by a process and read by another process.

상기 영상처리 소프트웨어는 영상처리 라이브러리(221)의 동작에 의거 수행되며, 상기 영상처리 라이브러리(221)는 2차원 영상인식 기법을 이용하여 문자나 이미지를 인식하고 유클리드 기하학적 변환기술을 이용하여 화면의 확대, 축소, 회전 등을 구현한다. 또한 초당 100[fps] 영상 처리를 위하여 필터링 기술을 적용하여 정확한 색상 값을 처리한다. 즉, 1,698만 종류의 색상을 갖는 RGB 영상을 2차원 배열에서 인덱스정보를 갖고 있고 그 정보에 해당하는 색상 값을 컬러 맵에 저장하는 인덱스 영상기법을 사용한다.The image processing software is performed based on the operation of the image processing library 221. The image processing library 221 recognizes a character or an image using a 2D image recognition technique and enlarges a screen using a Euclidean geometric transformation technique. Implement, reduce, rotate, etc. In addition, filtering is applied for 100 [fps] image processing per second to process accurate color values. That is, an index image technique is used in which an RGB image having 16.9 million kinds of colors has index information in a two-dimensional array and stores color values corresponding to the information in a color map.

따라서, 상기 영상처리 라이브러리(221)는 이미지와 텍스트를 각기 다른 알고리즘을 사용하여 인식하는데, 이미지는 유저가 설정한 데이터를 기준으로 캡처한 화면과 비교하여 동일 여부를 판단한다. 이는 작업 표시 줄의 각 아이콘의 모양을 비교하여 프로그램의 실행 여부 및 상태파악을 할 수 있는 간단한 기능부터, 제품의 불량 검사를 위한 검수 등의 정밀작업까지 수행토록 한다. 예컨대, 네트워크 연결이 끊긴 경우 해당 아이콘은 연결 끊김 상태로 바뀌게 되는데, 이러한 상태 변화를 감지 후 유저에게 안내함으로써 빠른 조치가 가능하도록 하는 것이다.Accordingly, the image processing library 221 recognizes images and text using different algorithms, and determines whether the images are the same by comparing them with the screen captured based on data set by the user. It compares the shape of each icon in the task bar to perform a simple function such as checking the execution and status of the program, and performing precise work such as inspection for product defect inspection. For example, when the network is disconnected, the corresponding icon is changed to the disconnected state, so that a quick action is possible by guiding the user after detecting the change of state.

반면, 텍스트의 경우에는 폰트를 이용하여 캡쳐한 문자열과 비교함으로써 얻는다. 이러한 방식은 사진 및 동영상에서 사용하는 문자열은 물론, 게임에서 사용하는 이미지 폰트에 이르기까지 다양한 영역에서의 텍스트 인식이 가능하다. 예컨대, 인터넷 및 이메일 그리고 쪽지 등의 내용을 문자화시켜 음성으로 안내하게 된다.Text, on the other hand, is obtained by comparing the string captured with the font. This method can recognize texts in various areas, from character strings used in pictures and videos to image fonts used in games. For example, the contents of the Internet, an email, a message, and the like are texted and guided by voice.

그리고, 상기 영상처리 라이브러리(221)는 유저 컴퓨터의 화면 해상도에 따라 자동으로 색상 값의 범위를 조정함으로써, 시각장애인들은 자신의 환경에 따라 다양한 조건에서 컴퓨터를 이용토록 한다. 따라서 이들에게 가장 중요한 기능인 화면인식의 효율성 극대화를 위하여 화면의 해상도 및 색상 값이 자동으로 프로그램에 설정된다.In addition, the image processing library 221 automatically adjusts the range of color values according to the screen resolution of the user computer, so that the visually impaired people use the computer under various conditions according to their environment. Therefore, the screen resolution and color value are automatically set in the program to maximize the efficiency of screen recognition, the most important function for them.

여기서, 본 발명에 따른 화면인식 알고리즘은 화면인식 속도를 매우 높이게 되는데, 화면인식 알고리즘은 도 4에 도시된다. 도시된 바와 같이, S401 단계에서 쓰레드를 생성하며, S403 단계로 진입하여 타겟 프로세스의 시작을 감시한다. 이후, S405 단계와 같이 프로세스가 실행되면 DLL 인젝션을 수행하고, S407 단계에서 화면을 캡쳐하여 메모리에 저장한다. 그리고, S409 단계를 통해 색상정보를 수집하며, S411 단계에서 속도 향상을 위해 필터링을 수행한다. 그리고, S413 단계로 진입하여 색상 분석 값을 리턴하는 순서를 갖는다.Here, the screen recognition algorithm according to the present invention will increase the screen recognition speed very much, the screen recognition algorithm is shown in FIG. As shown, the thread is created in step S401, and enters step S403 to monitor the start of the target process. Thereafter, when the process is executed in step S405, DLL injection is performed, and in step S407, the screen is captured and stored in the memory. Color information is collected through step S409, and filtering is performed to improve speed in step S411. In step S413, the color analysis value is returned.

이러한 절차에 따라 본 발명의 영상처리 방법은 일반적으로 사용하는 화면 캡쳐 방식보다 약 10배 정도 빠른 처리가 가능하게 된다. 즉, 일반적인 화면분석 방법에서는 기본 API 인 GetPixel 함수를 사용하게 되는데, 이러한 API는 처리 속도 부분에서 지연시간이 많아 실시간 데이터 분석이 필요한 시각장애인용 기기장치에는 사용할 수가 없는 문제가 발생한다. 상기 영상처리 라이브러리(221)는 전술된 일반적 화면 분석에 따른 속도 지연을 극복함으로써, 화면의 변화 값에 대한 처리 시 불필요한 시간 소요를 최소화한다.According to such a procedure, the image processing method of the present invention can process about 10 times faster than the screen capture method that is generally used. That is, the general screen analysis method uses the basic API GetPixel function, which has a large delay time in the processing speed part, which causes a problem that cannot be used in a device for the visually impaired device that requires real-time data analysis. The image processing library 221 overcomes the speed delay according to the general screen analysis described above, thereby minimizing unnecessary time when processing the change value of the screen.

따라서, 모니터에서 일어나는 모든 상황의 변화를 시각장애인에게 실시간으로 전달하여 마치 눈으로 화면을 보면서 작업하는 듯한 느낌을 제공할 수 있으며, 이를 위해 화면의 변화 값 중 불필요한 부분을 제거함으로써, 약 30%의 속도향상을 가능하도록 하고 있다.Therefore, all changes in the situation that occur on the monitor can be delivered to the visually impaired in real time to provide a feeling of working with the eyes, and by removing unnecessary parts of the change value of the screen, about 30% It is possible to improve speed.

도 5는 본 발명에 따른 영상처리를 위한 화면 분석 시간을 측정한 실험 데이터이다.5 is experimental data obtained by measuring a screen analysis time for image processing according to the present invention.

본 실험은 인터넷 브라우저(internet explorer) 화면 인식 속도 테스트로서, 일반 화면인식과 본 발명에 따른 화면인식 방식의 속도차이를 비교하기 위함이다. 테스트 방법은 동일한 컴퓨터에서 각각 다른 방식을 적용하여 화면인식 후 데이터 가공까지의 시간을 체크(1회당 10번씩 반복해서 총 30번 테스트 후 가장 빠른 5번, 가장느린 5번의 결과를 제외한 20번의 평균값을 산출함) 하였다.This experiment is an internet explorer screen recognition speed test to compare the speed difference between the general screen recognition and the screen recognition method according to the present invention. The test method uses different methods on the same computer and checks the time from screen recognition to data processing. (Repeat 10 times each time and check the average of 20 times except the fastest 5 times and the slowest 5 results after 30 tests in total) Calculation).

테스트 환경은, CPU : Intel(R) Core(TM) i3 CPU M339 @2.13GHz, OS : Microsoft Windows XP Home Edition K Service Pack 3, RAM : 2.0GB, GPU : NVIDIA GeForce 310M, 해상도 : 1366* 768 (16Bit)이며, 측정된 결과는 도시된 바와 같이 본 발명에 따른 화면인식 방식이 일반적인 화면인식 방식에 비해 대략 10배 정도의 속도 향상을 보이고 있다.Test environment, CPU: Intel (R) Core (TM) i3 CPU M339 @ 2.13GHz, OS: Microsoft Windows XP Home Edition K Service Pack 3, RAM: 2.0GB, GPU: NVIDIA GeForce 310M, Resolution: 1366 * 768 ( 16Bit), and the measured results show that the screen recognition method according to the present invention shows a speed improvement of approximately 10 times compared to the general screen recognition method.

한편, 본 발명에서 제시되는 음성인식 프로그램은, 상기 음성처리 라이브러리(223)에 기반하여 동작되며, 음성처리 라이브러리(223)는 마우스의 위치분석과 모니터에 출력된 영상 데이터의 분석을 통해 다양한 정보를 음성 안내 함으로써, 시각장애인들이 모니터를 눈으로 보고 제어하는 것과 같은 느낌을 줄 수 있도록 한다. 상기 음성처리 라이브러리(223)는 한글을 기반으로 제작되었으며 자음과 모음을 포함하여 총 2,351개의 음성 데이터를 기반으로 제작된다.On the other hand, the speech recognition program proposed in the present invention is operated based on the speech processing library 223, the speech processing library 223 is a variety of information through the analysis of the position of the mouse and the image data output to the monitor Voice guidance allows the visually impaired to feel as if they are looking at and controlling the monitor. The voice processing library 223 is produced based on Korean characters and is produced based on a total of 2,351 voice data including consonants and vowels.

즉, 현재 마우스 포인터 위치와 설정되어있는 마우스 포인터 위치를 검사한 후, 서로 일치할 경우 한 글자 단위로 사전 제작된 한글 음성안내 데이터를 재생시킨다. 따라서, 각 텍스트에 대한 음성안내가 이루어짐으로써 시각장애인들이 모니터를 눈으로 보고 제어하는 느낌을 갖게 된다.That is, after checking the current mouse pointer position and the set mouse pointer position, if it matches with each other, it plays the pre-produced Hangul voice guidance data by one character unit. Therefore, the voice guidance for each text is made, the visually impaired people have a feeling to see and control the monitor.

도 6은 본 발명에 따른 매크로 설정을 위한 탭 페이지를 도시하고 있으며, 본 발명의 실시 예로서 제시된다. 따라서, 본 발명에서 제공되는 탭 페이지의 구조 및 형태는 본 발명의 기술적 사상을 한정하지 않을 것이다. 도시된 6A는 동작 편집 매크로이며, 10개의 동작 편집 매크로를 설정한 후, 시작 키를 눌러 저장해 놓은 동작 편집 매크로를 실행토록 한다. 즉, 동작 편집 매크로를 만들기 위해서는, 기 설정된 값을 파일 열기를 눌러 확인한 후, 키 설정을 하고 실행을 수행하면, 기 설정된 값에 의해 움직이게 된다.6 shows a tab page for setting a macro according to the present invention, which is presented as an embodiment of the present invention. Therefore, the structure and shape of the tab page provided in the present invention will not limit the technical spirit of the present invention. 6A is an action edit macro. After setting 10 action edit macros, the start key is pressed to execute the action edit macro stored. That is, in order to create an action edit macro, after confirming a preset value by pressing a file open, if a key is set and executed, it is moved by the preset value.

그리고, 도 6A에서 동작 편집 매크로 만들기 버튼을 클릭하면, 도 6B와 같은 화면에 제공되는데, 이를 통해 키보드 동작, 마우스 버튼 동작, 마우스 이동 동작 및 시간지연 동작을 포함하여, 구간반복, 매크로 종료, 파일저장, 파일열기, 새로 만들기 동작을 설정할 수 있게 된다. 먼저, 키보드 동작은 키 누르기, 눌렀던 키 떼기, 키 눌렀다 떼기 기능을 설정할 수 있다.6A, when the Create Action Edit Macro button is clicked, it is provided on the screen as shown in FIG. 6B, and includes a keyboard operation, a mouse button operation, a mouse movement operation, and a time delay operation. You can set the Save, Open, and New actions. First, the keyboard operation may set a key press, a key release, and a key press and release.

상기한 구간 반복은 특정 구간을 일정 횟수만큼 반복할 때 사용하는 것으로, 도면의 왼쪽에 있는 데이터 번호에서 시작번호와 종료 번호를 넣고 반복 횟수를 입력함으로써 동작 설정이 이루어진다. 그리고, 상기 파일저장은 현재 등록되어 있는 동작 리스트를 저장하는 기능이고, 파일 열기는 저장된 동작 리스트를 불러오는 기능이다. 또한, 상기 새로 만들기 기능은 한 가지 동작 리스트를 만들고 다시 또 다른 동작 리스트를 만들 때 사용하는 버튼으로써, 버튼을 누르면 새로운 데이터를 만들 수 있도록 등록된 모든 데이터를 삭제하게 된다.The section repetition is used when a specific section is repeated a predetermined number of times. An operation setting is performed by inserting a start number and an end number from a data number on the left side of the figure and inputting a repetition number. The file storage is a function of storing a currently registered action list, and the file open is a function of recalling a stored action list. In addition, the new function is a button used to create one action list and another action list, and when the button is pressed, all data registered to create new data is deleted.

도 6C는 도 6A의 상단에 위치한 "조합 매크로" 기능을 기동하기 위한 페이지로서, 5개의 조합 매크로를 키를 통해 설정하고, 설정된 키를 누르면 저장해 놓은 조합 매크로가 실행되도록 하고 있다. 즉, 화면의 하단에 위치한 조합 매크로 만들기로 설정해 놓은 값을 파일 열기 버튼을 통해 불러온 다음 키 설정 후 실행함으로써 조합 매크로를 수행할 수 있다.FIG. 6C is a page for starting the "combination macro" function located at the top of FIG. 6A. Five combination macros are set via a key, and when the set key is pressed, the stored combination macro is executed. That is, the combination macro can be executed by loading the value set by the combination macro creation located at the bottom of the screen through the file open button and executing the key setting.

도 7은 도 6A의 상단에 위치한 "매크로 녹화/재생" 버튼을 클릭할 경우 제공되는 탭 페이지이다. 본 페이지는 10개의 매크로를 녹화하여 키를 설정하고, 설정된 키를 누를 경우, 녹화된 데이터가 재생되도록 하고 있다. 화면의 좌측 상단에 위치한 '녹화/재생 상태'는 녹화/재생 상태를 선택하기 위한 버튼이며, '옵션 관리'는 키보드 또는 마우스를 선택하여 녹화기 위한 버튼이다. 즉, 키보드만 녹화를 하고자 할 경우 키보드 녹화 버튼을 클릭하고, 마우스만 녹화를 하고자 할 경우 마우스 버튼을 클릭한다. 또한, 화면의 우측 상단에 위치한 '재생횟수'는 매크로의 재생 횟수를 설정하기 위한 버튼으로, 설정된 횟수만큼 재생된 후, 종료되도록 하고 있다.FIG. 7 is a tab page provided when a user clicks the "macro recording / playback" button located at the top of FIG. 6A. This page records 10 macros to set keys, and when the set key is pressed, the recorded data is played back. 'Recording / playing status' on the upper left of the screen is a button for selecting the recording / playing status, and 'option management' is a button for selecting and recording a keyboard or mouse. In other words, if you want to record only the keyboard, click the keyboard record button. If you want to record only the mouse, click the mouse button. In addition, the 'play count' located at the upper right of the screen is a button for setting the number of times the macro is played.

도 8은 도 6A의 상단에 위치한 "원격제어명령-Client & Server"를 클릭함으로써 얻어지는 탭 화면이다. 이는 메인화면의 상단부에서 팝업되며, 서버의 IP 입력 후 접속 버튼을 선택함으로써 서버와 연결된 상태로 실행된다. 이는 서버의 IP를 Client IP의 빈칸에 입력한 후 접속이 이루어지며, 이로부터 서버 PC에서 Client PC로 원격 제어명령을 보낼 수 있게 된다.8 is a tab screen obtained by clicking "Remote Control Command-Client & Server" located at the top of FIG. 6A. This pops up in the upper part of the main screen and is executed in connection with the server by selecting the access button after entering the IP of the server. It enters the server's IP in the Client IP blank and connects to it. From this, the remote control command can be sent from the server PC to the client PC.

도 9는 본 발명에 따른 화면 인식을 위한 스크린 샷 설정을 나타낸 화면으로, 유저는 화면의 '캡쳐 방식'을 통해 일반 스크린 샷 또는 정밀 스크린 샷을 설정할 수 있다. 여기서, 상기 정밀 스크린 샷은 일반 스크린 샷으로 원하는 곳에 스크린 샷이 찍히지 않을 경우에 사용되는 것으로, 캡션을 따와서 설정하게 된다. 정밀 캡쳐 방식을 선택할 경우, 화면의 오른 쪽에 위치한 캡션 명 부분이 활성화되며 해당 위치에 캡션 명을 입력한다.9 is a screen illustrating a screen shot setting for screen recognition according to the present invention, and a user may set a normal screen shot or a precision screen shot through a 'capture method' of the screen. Here, the precision screen shot is a normal screen shot and is used when a screen shot is not taken where desired, and the caption is set accordingly. If you select the precision capture method, the caption name part on the right side of the screen is activated and enter the caption name in the corresponding position.

이와 같이 일반 방식과 정밀 방식을 설정한 후, 인식점 작업을 수행하는데, 인식 점 만드는 방법은, 프로그램을 열고 스크린 샷 키를 설정한 다음 크 키를 눌러 스크린 샷을 찍는데, 스크린 샷은 클릭과 동시에 설정된 폴더 안에 자동으로 저장된다.After setting the normal method and the precision method, the recognition point operation is performed. The method of creating the recognition point is to open a program, set a screenshot key, and press the key to take a screenshot. It is automatically saved in the set folder.

이후, 인식지점 설정 부분의 파일을 열어 기 저장된 폴더 내의 스크린 샷을 불러 온다. 그리고, 도 10과 같이 원하는 위치를 마우스로 클릭하면, 클릭 위치가 인식점이 되며, 인식 이름과 인식 번호를 설정한다. 인식 이름은 마우스로 클릭한 위치에 대한 이름값이며, 인식 번호는 1 ~ 200까지의 인식 번호를 임의대로 부여한다. 따라서, 원하는 인식 번호를 설정할 경우, 등록 창에 올라가게 되며, 등록 창의 인식 번호를 클릭하면, 마우스로 클릭했던 위치를 확인할 수 있게 된다.Then, open the file of the recognition point setting section and load the screen shot in the previously saved folder. When the desired position is clicked on with a mouse as shown in FIG. 10, the click position becomes a recognition point, and a recognition name and a recognition number are set. The recognition name is a name value for the position clicked with the mouse, and the recognition number is arbitrarily assigned with a recognition number of 1 to 200. Therefore, when the desired identification number is set, the registration window is raised. When the identification number is clicked on the registration window, the position clicked with the mouse can be checked.

상기한 인식점 비교는 화면상의 실제 동작 중인 인식점과, 스크린 샷에 의해 찍은 인식점을 비교하는 것으로, 도 11과 같이 위치끼리 비교하거나, 중심점과 비교하거나, 중심점 간 비교하거나, 평균값을 비교하는 방법이 사용될 수 있다. 즉, 위치끼리 비교할 경우, N1-P1 내지 N9-P9를 비교하여 2 점 이상이 비슷한 상태인지를 판단한다. 또는, 중심점과 비교 방법은 N1-P5, N2-P5, N3-P5...N9-P5를 비교하는 것으로, 원하는 색이 존재하는지를 판단할 때 사용될 수 있다. 또한, 중심점 비교는 N5-P5를 비교하는 것으로 가장 간단한 비교 방법이며, 평균값 비교는 N1 내지 N9의 평균값과 P1 내지 P9의 평균값을 비교하는 것이다.The above-described recognition point comparison is to compare the recognition point in operation on the screen with the recognition point taken by the screen shot. As shown in FIG. 11, the position point comparison, the center point comparison, the center point comparison, or the average value are compared. The method can be used. That is, when comparing positions, it is determined whether two or more points are similar by comparing N1-P1 to N9-P9. Alternatively, the center point and the comparison method may be used to determine whether a desired color exists by comparing N1-P5, N2-P5, N3-P5 ... N9-P5. In addition, center point comparison is the simplest comparison method by comparing N5-P5, and average value comparison is comparing the average value of N1-N9, and the average value of P1-P9.

한편, 도 12는 시간 변수를 인식하기 위한 조건 설정 창을 나타낸 도면이다. 도시된 바와 같이, 시간 설정은 '1'번 항목에서 체크박스 체크를 함으로써 수행되며, '2'번 항목에서 초 단위의 시간을 입력한 후, '3'번 항목을 통해 비교 조건을 설정한다. 비교조건은 '작다', '크다', '크거나 같다' 등을 선택할 수 있으며, '4'번 항목에서 시간을 설정한다. 시간은 1 ~ 10 시간까지 설정한다. '5'번 항목은 큰쪽 비교조건을 설정하기 위한 항목으로, '비교 안함', '작다', '같다', '작거나 같다', '다르다' 등으로 설정 변경이 가능하다. '6'번 항목은 조건을 비교하여 큰 쪽 시간을 입력하는 부분으로, 초 단위로 기재된다. 그리고, '7'번 항목은 설정 값을 지우기 위한 버튼이다. 결국, 본 발명은 전술된 방법에 따라 화면 인식을 수행하며, 화면 인식에 따른 속도를 매우 증가시키게 된다.
12 illustrates a condition setting window for recognizing a time variable. As shown, time setting is performed by checking a check box in item '1', inputting time in seconds from item '2', and setting a comparison condition through item '3'. The comparison condition can be selected as 'small', 'large', 'greater than or equal', etc., and set the time in '4'. Set the time from 1 to 10 hours. Item '5' is for setting the larger comparison condition. You can change the setting to 'not compare', 'small', 'equal', 'small or equal', 'different', etc. The item '6' is a part of inputting the larger time by comparing the conditions, and is described in seconds. Item '7' is a button for deleting the set value. As a result, the present invention performs screen recognition according to the above-described method, and greatly increases the speed according to the screen recognition.

211 : 가상마우스 드라이버 213 : 가상키보드 드라이버
215 : 매크로 설정모듈 217 : 단축키 설정모듈
219 : 부분 확대 모듈 221 : USB 통신모듈
221 : 영상처리 라이브러리 223 : 음성처리 라이브러리
211: virtual mouse driver 213: virtual keyboard driver
215: macro setting module 217: shortcut key setting module
219: loupe expansion module 221: USB communication module
221: image processing library 223: sound processing library

Claims (6)

USB 펌웨어가 적용되는 시각 장애인용 컴퓨터 영상 처리 장치에 있어서,
상기 USB 펌웨어는, 사용자 컴퓨터에 접속되어 USB 통신 프로토콜에 따라 데이터 교환이 가능한 USB 통신모듈;
장치를 이용하여 실제 장애인의 입력신호 없이 매크로 기능을 수행하기 위한 가상마우스/가상키보드 드라이버;
각종 프로그램 제어를 포함하여, 메신저 또는 이메일 정보에 대한 음성 출력을 수행하는 매크로 설정모듈;
원본 그림을 크기를 변경하는 StretchBlt 함수를 이용하는 윈도우 소스 프로그램에 기반하여 사용자로부터 임의의 화면이 가공 제어되는 부분 확대모듈;
상기 부분 확대모듈과 연동함으로써, 2차원 영상인식 기법에 따라 문자나 이미지를 인식하고 유클리드 기하학적 변환기술을 이용하여 해당 화면에 대한 확대, 축소, 회전 등을 구현하는 영상처리 라이브러리; 및
상기 가상마우스/가상키보드 드라이버와 연동하여, 마우스의 위치분석과 모니터에 출력된 영상 데이터의 분석을 통해 다양한 정보를 음성 안내하기 위한 음성처리 라이브러리로 구성되는 것을 특징으로 하는 시각 장애인을 위한 컴퓨터 영상 처리장치.
In the computer image processing device for the visually impaired to which the USB firmware is applied,
The USB firmware may include a USB communication module connected to a user computer and capable of exchanging data according to a USB communication protocol;
A virtual mouse / virtual keyboard driver for performing a macro function without an input signal of an actual disabled person using a device;
A macro setting module for performing voice output on messenger or email information, including various program control;
A partial magnification module in which an arbitrary screen is processed by a user based on a window source program using a StretchBlt function for resizing an original picture;
An image processing library for recognizing a character or an image according to a 2D image recognition technique and for enlarging, reducing, or rotating a corresponding screen by using a Euclidean geometric transformation technique by interworking with the partial enlargement module; And
Computer image processing for the visually impaired, comprising a voice processing library for guiding various information by guiding the virtual mouse / virtual keyboard driver and analyzing the mouse position and the image data output to the monitor. Device.
제 1 항에 있어서,
상기 영상처리 라이브러리는, 이미지와 텍스트를 각기 다른 알고리즘을 사용하여 인식하며, 상기 이미지는 유저가 설정한 데이터를 기준으로 캡처한 화면과 비교하여 동일 여부를 판단하고, 상기 텍스트의 경우에는 폰트를 이용하여 캡쳐한 문자열과 비교함으로써 데이터를 인식하는 것을 특징으로 하는 시각 장애인을 위한 컴퓨터 영상 처리장치.
The method of claim 1,
The image processing library recognizes images and text using different algorithms, and determines whether the images are identical to the screen captured based on data set by the user, and uses fonts for the text. Computer image processing apparatus for the visually impaired, characterized in that to recognize the data by comparing with the captured character string.
제 1 항에 있어서,
상기 USB 펌웨어는, USB 포트를 통해 컴퓨터와 통신을 수행하며, 상기 USB 펌웨어를 USB 마우스로 인식 후 명령에 따른 이벤트를 통해 실제 마우스를 제어하고;
제품의 VenderID, ProductorID, USB 인증 정보를 포함하며, 상기 정보들을 변경함으로써 보안성을 유지하는 것을 특징으로 하는 시각 장애인을 위한 컴퓨터 영상 처리장치.
The method of claim 1,
The USB firmware communicates with a computer through a USB port, recognizes the USB firmware as a USB mouse, and controls an actual mouse through an event according to a command;
And a VenderID, a ProductorID, and USB authentication information of a product, wherein the computer image processing apparatus for the visually impaired is maintained by changing the information.
제 1 항에 있어서,
상기 영상처리 라이브러리는, DLL 인젝션을 사용하여 영상을 캡쳐 후 분석함으로써, 동영상재생 응용프로그램의 화면 인식을 수행하는 것을 특징으로 하는 시각 장애인을 위한 컴퓨터 영상 처리장치.
The method of claim 1,
The image processing library is a computer image processing apparatus for the visually impaired, characterized in that to perform screen recognition of the video playback application by capturing and analyzing the image using a DLL injection.
제 4 항에 있어서,
상기 DLL 인젝션은 다른 프로세스에 특정 DLL 파일을 삽입하여, 다른 프로세스에게 API 함수인 LoadLibary()를 호출하도록 명령한 후, 원하는 DLL을 로딩시키는 것을 특징으로 하는 시각 장애인을 위한 컴퓨터 영상 처리장치.
5. The method of claim 4,
The DLL injection inserts a specific DLL file into another process, instructs another process to call LoadLibary (), which is an API function, and then loads a desired DLL.
제 5 항에 있어서,
상기 DLL 인젝션은 파이프 통신 기법을 이용하여 데이터 통신을 수행하는 것을 특징으로 하는 시각 장애인을 위한 컴퓨터 영상 처리장치.
The method of claim 5, wherein
The DLL injection is a computer image processing apparatus for the visually impaired, characterized in that to perform data communication using a pipe communication technique.
KR1020110147237A 2011-12-30 2011-12-30 Computer image processing system for blind person KR101357946B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110147237A KR101357946B1 (en) 2011-12-30 2011-12-30 Computer image processing system for blind person

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110147237A KR101357946B1 (en) 2011-12-30 2011-12-30 Computer image processing system for blind person

Publications (2)

Publication Number Publication Date
KR20130078342A KR20130078342A (en) 2013-07-10
KR101357946B1 true KR101357946B1 (en) 2014-02-04

Family

ID=48991332

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110147237A KR101357946B1 (en) 2011-12-30 2011-12-30 Computer image processing system for blind person

Country Status (1)

Country Link
KR (1) KR101357946B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023277229A1 (en) * 2021-07-02 2023-01-05 쿠팡 주식회사 Information providing method and electronic device using same

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100421566B1 (en) 2000-10-06 2004-03-11 박기범 Internet common program screen reading for the blind
KR100606406B1 (en) 2005-03-11 2006-07-28 골든키정보통신 주식회사 Computer for a blind person

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100421566B1 (en) 2000-10-06 2004-03-11 박기범 Internet common program screen reading for the blind
KR100606406B1 (en) 2005-03-11 2006-07-28 골든키정보통신 주식회사 Computer for a blind person

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023277229A1 (en) * 2021-07-02 2023-01-05 쿠팡 주식회사 Information providing method and electronic device using same

Also Published As

Publication number Publication date
KR20130078342A (en) 2013-07-10

Similar Documents

Publication Publication Date Title
US7216266B2 (en) Change request form annotation
US20080282160A1 (en) Designated screen capturing and automatic image exporting
US20150277686A1 (en) Systems and Methods for the Real-Time Modification of Videos and Images Within a Social Network Format
EP2189926A1 (en) Method for providing camera-based services using a portable communication device of a user and portable communication device of a user
US20080215548A1 (en) Information search method and system
TW201322050A (en) Electronic device and read guiding method thereof
KR20060128022A (en) Automated system and method for conducting usability testing
DE112013002381T5 (en) Apparatus, method and graphical user interface for moving and dropping a user interface object
US20080240683A1 (en) Method and system to reproduce contents, and recording medium including program to reproduce contents
US20090150779A1 (en) Method and apparatus for displaying help information
CN110362483A (en) Performance data acquisition method, device, equipment and storage medium
US11175735B2 (en) Choice-based analytics that combine gaze and selection data
CN109857505A (en) Execution method, apparatus, terminal and the storage medium of operation
CN113918522A (en) File generation method and device and electronic equipment
JP5345963B2 (en) Method for generating tag data to search for images
JP2014123179A (en) Information processing apparatus, information processing method, and oversight prevention program
KR101357946B1 (en) Computer image processing system for blind person
CN112286617A (en) Operation guidance method and device and electronic equipment
JP5523122B2 (en) Image management apparatus, method and program
JP2006195575A (en) Information processing device and method thereof
KR20080060693A (en) System and method for providing web document editon service
CN107733779B (en) Function expansion method and device based on contact persons
JP5098976B2 (en) Behavior analysis support system and behavior analysis support program
JP6458358B2 (en) Image processing apparatus and program
JP7186455B2 (en) Construction site image acquisition system, construction site image acquisition device, and construction site image acquisition program

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170123

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee