KR100399016B1 - 아이엠티-2000을 통한 문서인식/음성낭독방법 - Google Patents

아이엠티-2000을 통한 문서인식/음성낭독방법 Download PDF

Info

Publication number
KR100399016B1
KR100399016B1 KR10-2000-0083873A KR20000083873A KR100399016B1 KR 100399016 B1 KR100399016 B1 KR 100399016B1 KR 20000083873 A KR20000083873 A KR 20000083873A KR 100399016 B1 KR100399016 B1 KR 100399016B1
Authority
KR
South Korea
Prior art keywords
document
imt
image
voice
character
Prior art date
Application number
KR10-2000-0083873A
Other languages
English (en)
Other versions
KR20020055487A (ko
Inventor
이인동
Original Assignee
주식회사 한국인식기술
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 한국인식기술 filed Critical 주식회사 한국인식기술
Priority to KR10-2000-0083873A priority Critical patent/KR100399016B1/ko
Publication of KR20020055487A publication Critical patent/KR20020055487A/ko
Application granted granted Critical
Publication of KR100399016B1 publication Critical patent/KR100399016B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 IMT-2000에 탑재되어 있는 화상 카메라를 이용하여 문서영상을 입력하고 이를 인식하여 컴퓨터와 텍스트 문서를 송수신하며, 이를 음성으로 낭독할 수 있도록 한 IMT-2000을 통한 문서인식/음성낭독방법에 관한 것이다.
상기 IMT-2000 단말기에 설치되어 있는 화상 카메라를 이용하여 문서의 내용을 촬영하고, 촬영한 문서에서 문자를 인식하며, 인식된 문서가 IMT-2000의 스피커를 통해 문서의 내용이 낭독 될 수 있도록 하므로 눈이 잘 보이지 않는 노인들 또는 눈이 보이지 않는 맹인들이 그 즉시에 문서의 내용을 확인할 수 있어 계약관계, 금융에 관계되는 일 등을 다른 사람의 도움 없이도 혼자서도 처리할 수 있고, 메인 컴퓨터로 자료를 송신하므로 많은 양의 정보를 입수 할 수 있는 효과를 가져온다.

Description

아이엠티-2000을 통한 문서인식/음성낭독방법{IMT-2000 utilization a document cognition/a voice recitation means}
본 발명은 문서인식을 통한 음성낭독방법에 관한 것으로, IMT-2000에 탑재되어 있는 화상 카메라를 이용하여 문서영상을 입력하고 이를 인식하여 컴퓨터와 텍스트 문서를 송수신하며, 이를 음성으로 낭독할 수 있도록 한 IMT-2000을 통한 문서인식/음성낭독방법에 관한 것이다.
현재 종이문서를 데이터화하기 위해서는 스캐너를 이용하여 컴퓨터의 데이터베이스에 저장하여 보관하였으며, 이를 공유하기 위해서는 컴퓨터와 컴퓨터간에 데이터를 공유하기 위해서는 랜을 통해 서로 공유하고 있으며, 또한 근거리에 있는 컴퓨터간에는 인터넷을 통한 E-mail을 통해 문서를 공유하고 있다. 그리고 타 지역에서 데이터를 공유하기 위해서는 컴퓨터 또는 팩스기가 설치되어 있는 곳에서만 데이터의 공유가 가능하나, 컴퓨터나 팩스기가 설치되어 있지 아니한 곳에서는 데이터를 메인 컴퓨터와 데이터를 공유하기란 매우 힘이 드는 불편함이 있다.
그리고, 개인 통신장비로 사용되는 셀룰러폰 또는 PCS폰의 경우 간단한 문자 메시지를 서로 주고받을 수는 있지만, 컴퓨터와 개인 휴대통신간의 문서를 공유하기란 매우 힘이 들고, 또한 상기 개인휴대통신을 통해 어떠한 문서를 발송하기 위해서는 컴퓨터와 꼭 연결하여 문서를 발송하였고, 개인통신기기와 컴퓨터간 또는 개인통신기기간의 데이터를 공유하기란 매우 힘이 드는 단점이 있었다.
또한, 눈이 잘 보이지 않는 노약자와 맹인과 같은 경우에는 문서가 개인통신기기로 수신되었다 하더라도 그 내용이 무엇인지 파악할 수 없는 문제점이 있었다.
따라서, 본 발명은 상기와 같은 문제점을 해결하기 위한 것으로 본 발명의 IMT-2000을 통한 문서인식/음성낭독방법은 IMT-2000의 단말기에 설치되어 있는 화상 카메라를 통해 어떠한 문서를 영상화하여 입력할 수 있도록 하며, 이를 메인 컴퓨터와 문서가 공유 될 수 있도록 하고, 수신된 문서 또는 영상으로 입력된 문서의내용을 음성을 통해 낭독할 수 있도록 하는 IMT-2000을 통한 문서인식/음성낭독방법을 제공하는 데 그 목적이 있다.
상기한 목적을 달성하기 위한 본 발명에 의한 IMT-2000을 통한 문서인식/음성낭독방법은 문자를 라인스캔 방식을 이용하여 문자를 인식하여 음성으로 출력하는 방법에 있어서, IMT-2000의 단말기에 설치되어 있는 화상카메라를 이용하여 문서를 촬영하고, 상기 IMT-2000을 통해 입력되는 영상을 흑백화하고, 이를 이진화하여 문서영상을 입력하여, 입력된 문서에서 카테고리별로 분리 및 영상을 해석하고, 해석된 영상에서 영역을 분리하며, 분리된 영역에서 문자를 분리 및 인식하여 이를 사용자로 하여금 IMT-2000의 단말기 표시판에 결과를 출력하여 문자가 인식되었음을 표시하고, 표시판으로 출력된 결과에 오류가 발생하였을 시에 이를 수정할 수 있도록 하며, 상기 출력된 결과에 오류가 없을 시에는 데이터를 선택적으로 컴퓨터로 송신하거나 자체 데이터베이스에 인식결과를 저장, 저장된 문서의 각 글자를 인식하여 그에 해당하는 웨이브(WAV)파일로 조합하여 이를 음성출력하는 것을 특징으로 포함하는 IMT-2000을 통한 문서인식/음성낭독방법을 제공한다.
또한, 본 발명에 의하면 상기 문자를 웨이브파일로 조합하는 것은 상기 IMT-2000의 단말기에 설치된 화상카메라를 통해 입력되어 텍스트문서 변환된 데이터의 문자를 코드화시키고, 코드화된 문자를 분류 및 어떠한 문자인지를 판별하며, 판별된 문자가 어느 문자인지에 해당하는지를 선택하여 이를 각가의 코드롸 문자 웨이브파일을 조합하여 음성으로 출력하는 것을 특징으로 한다.
도 1은 본 발명에 의한 IMT-2000을 통한 문서인식/음성낭독방법에 의한 구성도.
도 2는 본 발명에 의한 IMT-2000을 통한 문서인식/음성낭독방법에 의한 단계를 보인 순서도.
도 3은 본 발명의 음성표출방법을 보인 순서도이다.
*도면의 주요부분에 대한 부호의 설명*
10 : 메인 컴퓨터 20 : IMT-2000
21 : 화상 카메라 22 : 표시판
23 : 스피커
이하, 본 발명에 의한 문서관리시스템 및 그 방법을 첨부된 도면을 통해 상세하게 설명하면 다음과 같다.
도 1은 본 발명에 의한 IMT-2000을 통한 문서인식/음성낭독방법에 의한 구성도이고, 도 2는 본 발명에 의한 IMT-2000을 통한 문서인식/음성낭독방법에 의한 단계를 보인 순서도이며, 도 3은 본 발명의 음성표출방법을 보인 순서도이다.
도 1 내지 도 3에 도시된 바와 같이 본 발명에 의한 IMT-2000을 통한 문서인식/음성낭독방법은 IMT-2000을 통한 문서인식/음성낭독방법은 IMT-2000(20) 단말기에 설치되어 있는 화상카메라(21)를 이용하여 문서를 촬영하는 S10단계와; 상기 IMT-2000(20)을 통해 입력되는 영상을 흑백화하고, 이를 이진화하여 문서영상을 입력하는 S20단계와; 상기 영상으로 입력된 문서에서 카테고리별로 분리하고, 그 내에서 문자의 영상을 해석하고, 해석된 영상에서 영역을 분리하며, 분리된 영역에서 문자를 분리하고, 분리된 문자를 인식하여 이를 사용자가 확인할 수 있도록 IMT-2000(20)의 단말기 표시판(22)에 결과를 출력하여 문자가 인식되었음을 표시하는 S30단계와; 상기 IMT-2000(20)의 단말기의 표시판으로 출력된 결과에 오류가 발생하였을 시에 이를 수정할 수 있도록 하는 S40단계를 행한다.
상기 IMT-2000(20)의 단말기 표시판(22)으로 출력된 결과에 오류가 없을 시에는 데이터를 선택적으로 메인 컴퓨터(10)로 송신하거나 자체 데이터베이스에 인식결과를 저장하는 S50단계와; 상기 데이터베이스에 저장된 문서의 각 글자를 인식하여 그에 해당하는 웨이브(WAV)파일로 조합하는 S60단계와; 상기 웨이브(WAV)파일로 형성된 데이터를 조합하여 이를 음성으로 낭독하는 S70단계를 수행한다.
상기 S60단계는 상기 IMT-2000(20)의 단말기에 설치된 화상카메라(21)를 통해 입력되어 텍스트문서로 변환된 데이터의 문자를 코드화시키는 S61단계와; 상기 코드화된 문자를 분류하는 S62단계와; 상기 코드화된 문자가 어떠한 문자인지를 판별하는 S63단계와; 상기 코드화된 문자가 어떤 문자에 해당하는지를 선택하는 S64단계와; 상기 각각의 코드화 문자 웨이브(WAV)파일을 조합하는 S65단계와; 상기 조합된 웨이브(WAV)파일을 스피커(23)를 통해 음성으로 표출하는 S66단계를 수행하여 눈이 잘 보이지 않는 노인이나 맹인들에게 문서의 내용을 알릴 수 있게 되는 것이다.
상기와 같은 단계들을 수행하는 본 발명에 의한 IMT-2000을 통한 문서인식/음성낭독방법의 작용을 설명하면 다음과 같다.
사용자가 원하는 종이문서의 내용을 촬영하기 위해서는 촬영하고자하는 위치에 IMT-2000(20) 단말기에 설치되어 있는 화상 카메라(21)를 위치시키고, 종이문서의 내용을 촬영한다.
상기 화상 카메라(21)를 통해 촬영되는 문자영상을 흑백화하고, 이를 이진화하여 입력한 후에 상기 문자영상을 해석하고, 해석된 영상에서 카테고리별로 영역을 분리하며, 분리된 카테고리별 영역에서 문자만을 분리하여 이를 인식하고, 인식된 문자를 상기 IMT-2000(20) 단말기의 표시판(22)에 결과를 출력한다.
상기와 같이 IMT-2000(20) 단말기에 설치되어 있는 키를 이용하여 상기 문자에서 오류가 발생하였을 시에는 이를 사용자가 직접 수정하거나, 상기 화상 카메라(21)를 이용하여 다시 촬영하여 이를 수정할 수 있도록 하며, 상기 문자에서 오류가 발생하지 않았을 시에는 표시판에 출력하여 오류가 없음을 사용자가 알 수 있도록 한다.
그리고, 상기 IMT-2000(20) 단말기의 표시판에 출력된 결과를 무선으로 사용자가 정한 메인 컴퓨터(10) 또는 IMT-2000(20)을 공급하는 사업자의 서버에 연결하여 IMT-2000(20)에 데이터베이스에 저장되어 있는 데이터를 송신할 수 있도록 하여 계속적으로 문서를 입력할 수 있도록 한다. 이때 송신되는 문서의 파일은 텍스트(Text)문서로 변환되어 송신 또는 저장을 할 수 있도록 한다.
상기 텍스트(Text)문서로 변환되어 있는 데이터에서 각 문자의 코드를 확인하고, 이를 코드 별로 분류한 후 코드에 맞는 문자를 판별하며, 판별한 문자코드의 웨이브를 선택하고, 선택된 웨이브파일을 조합하여 이를 상기 IMT-2000(20) 단말기에 설치되어 있는 스피커를 통해 음성(사운드)으로 표현하여 눈이 잘 보이지 않는 노인들 또는 맹인들이 그 즉시 문서의 내용을 파악할 수 있다. 특히, 도서관에서 어떠한 내용을 카피할 시에 상기 IMT-2000(20) 단말기의 화상 카메라(21)를 통해 그 내용을 촬영 저장하고, 데이터베이스의 용량이 부족할 시에는 사용자가 미리 정하여 놓은 메인 컴퓨터(10)로 그 내용을 송신할 수 있으므로 많은 양의 정보를 수집할 수 있게 있다.
이하 본 발명에 의한 IMT-2000을 통한 문서인식/음성낭독방법의 효과를 살펴보면, IMT-2000의 단말기를 이용하여 문자를 인식하고 이를 음성으로 낭독될 수 될 수 있도록 함으로 눈이 잘 보이지 않는 노인들과 맹인들이 간단한 문서를 읽어 들일 수 있으므로 다른 사람의 도움 없이도 혼자서 금융업무, 계약관계 등을 처리할 수 있고, 상기 문서를 텍스트 파일로 보관하여 이를 무선 또는 유선으로 다른 단말기 및 컴퓨터와 데이터를 공유할 수 있어 다량의 정보를 입수할 수 있게 되는 효과를 가져온다.

Claims (2)

  1. 문자를 라인스캔 방식을 이용하여 문자를 인식하여 음성으로 출력하는 방법에 있어서,
    IMT-2000의 단말기에 설치되어 있는 화상카메라를 이용하여 문서를 촬영하고, 상기 IMT-2000을 통해 입력되는 영상을 흑백화하고, 이를 이진화하여 문서영상을 입력하여, 입력된 문서에서 카테고리별로 분리 및 영상을 해석하고, 해석된 영상에서 영역을 분리하며, 분리된 영역에서 문자를 분리 및 인식하여 이를 사용자로 하여금 IMT-2000의 단말기 표시판에 결과를 출력하여 문자가 인식되었음을 표시하고, 표시판으로 출력된 결과에 오류가 발생하였을 시에 이를 수정할 수 있도록 하며, 상기 출력된 결과에 오류가 없을 시에는 데이터를 선택적으로 컴퓨터로 송신하거나 자체 데이터베이스에 인식결과를 저장, 저장된 문서의 각 글자를 인식하여 그에 해당하는 웨이브(WAV)파일로 조합하여 이를 음성출력하는 것을 특징으로 포함하는 IMT-2000을 통한 문서인식/음성낭독방법.
  2. 제1항에 있어서,
    상기 문자를 웨이브파일로 조합하는 것은 상기 IMT-2000의 단말기에 설치된 화상카메라를 통해 입력되어 텍스트문서 변환된 데이터의 문자를 코드화시키고, 코드화된 문자를 분류 및 어떠한 문자인지를 판별하며, 판별된 문자가 어느 문자인지에 해당하는지를 선택하여 이를 각가의 코드롸 문자 웨이브파일을 조합하여 음성으로 출력하는 것을 특징으로 하는 IMT-2000을 통한 문서인식/음성낭독방법.
KR10-2000-0083873A 2000-12-28 2000-12-28 아이엠티-2000을 통한 문서인식/음성낭독방법 KR100399016B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2000-0083873A KR100399016B1 (ko) 2000-12-28 2000-12-28 아이엠티-2000을 통한 문서인식/음성낭독방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2000-0083873A KR100399016B1 (ko) 2000-12-28 2000-12-28 아이엠티-2000을 통한 문서인식/음성낭독방법

Publications (2)

Publication Number Publication Date
KR20020055487A KR20020055487A (ko) 2002-07-09
KR100399016B1 true KR100399016B1 (ko) 2003-09-22

Family

ID=27687434

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2000-0083873A KR100399016B1 (ko) 2000-12-28 2000-12-28 아이엠티-2000을 통한 문서인식/음성낭독방법

Country Status (1)

Country Link
KR (1) KR100399016B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100800835B1 (ko) * 2002-07-15 2008-02-04 삼성전자주식회사 휴대용 전화기의 카메라를 개인용 컴퓨터의 카메라로 사용할 수 있는 장치 및 방법
KR100800896B1 (ko) * 2003-04-22 2008-02-04 삼성전자주식회사 휴대용 단말기의 메시지 전송 장치 및 방법
KR100687800B1 (ko) * 2004-08-03 2007-02-28 주식회사 나스텍엔지니어링 지하매설관로 구조보강용 비굴착보수 강화펠트

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR200193152Y1 (ko) * 2000-03-04 2000-08-16 한화전자통신주식회사 이동통신 단말기의 문자 데이터 처리장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR200193152Y1 (ko) * 2000-03-04 2000-08-16 한화전자통신주식회사 이동통신 단말기의 문자 데이터 처리장치

Also Published As

Publication number Publication date
KR20020055487A (ko) 2002-07-09

Similar Documents

Publication Publication Date Title
EP1808799B1 (en) Image processing apparatus and image processing method
US7929808B2 (en) Systems and methods for generating digital images having image meta-data combined with the image data
US20100268929A1 (en) Electronic device and setting method thereof
US9473669B2 (en) Electronic document generation system, electronic document generation apparatus, and recording medium
KR20060077988A (ko) 멀티미디어 통신 시스템에서 컨텍스트 추출 및 이를 통한정보 제공 시스템 및 방법
JP2007034443A (ja) 画像形成システム、画像形成装置及び画像形成処理方法
JP2005267146A (ja) 画像認識機能を利用した電子メール作成方法および装置
US20150169197A1 (en) Screen generation device, remote operation device, remote control device, screen generation method, and screen generation program
US7426054B1 (en) Image processing apparatus, image reproduction apparatus, system, method and storage medium for image processing and image reproduction
US20150086122A1 (en) Image processing system, image processing method, and medium
JP6354253B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及び画像処理プログラム
KR100399016B1 (ko) 아이엠티-2000을 통한 문서인식/음성낭독방법
JP2009005194A (ja) 画像処理装置、方法及びプログラム
JP2002269093A (ja) 画像処理システム、画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP5181631B2 (ja) 画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラム
JP4251643B2 (ja) 画像撮像装置、および、プログラム
US20120057186A1 (en) Image processing apparatus, method for managing image data, and computer-readable storage medium for computer program
US8130408B2 (en) Image forming system and data processing method
JP7187145B2 (ja) 画像送信装置、画像送信装置の制御方法、及びプログラム
US20030174867A1 (en) System and method for selecting a destination profile using biometrics
JP4133298B2 (ja) デジタルカメラ装置
US7471317B2 (en) Digital camera apparatus
JP2021026604A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2012133619A (ja) 文書編集装置、文書編集方法および文書編集プログラム
JP2007148640A (ja) 画像読取装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110908

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20121206

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee