KR20060094599A - 휴대형 코드인식 음성 합성출력장치 - Google Patents

휴대형 코드인식 음성 합성출력장치 Download PDF

Info

Publication number
KR20060094599A
KR20060094599A KR1020050015735A KR20050015735A KR20060094599A KR 20060094599 A KR20060094599 A KR 20060094599A KR 1020050015735 A KR1020050015735 A KR 1020050015735A KR 20050015735 A KR20050015735 A KR 20050015735A KR 20060094599 A KR20060094599 A KR 20060094599A
Authority
KR
South Korea
Prior art keywords
voice
reader
data
user
mode
Prior art date
Application number
KR1020050015735A
Other languages
English (en)
Other versions
KR100719776B1 (ko
Inventor
박민철
Original Assignee
에이디정보통신 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에이디정보통신 주식회사 filed Critical 에이디정보통신 주식회사
Priority to KR1020050015735A priority Critical patent/KR100719776B1/ko
Priority to CN2005800486841A priority patent/CN101128863B/zh
Priority to EP05721932A priority patent/EP1851754A4/en
Priority to US11/884,972 priority patent/US20100145703A1/en
Priority to PCT/KR2005/000686 priority patent/WO2006090944A1/en
Publication of KR20060094599A publication Critical patent/KR20060094599A/ko
Application granted granted Critical
Publication of KR100719776B1 publication Critical patent/KR100719776B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephone Function (AREA)

Abstract

본 발명은 소정의 압축 코드형태로 인쇄된 출력물을 읽어들여 음성으로 출력해줄 수 있도록 하는 휴대형 음성합성출력장치에 관한 것이다.
본 발명은 소정의 압축된 형태의 디지털 코드 이미지를 인식하고 이를 음성으로 합성 출력할 수 있도록 하는 코드인식 음성 합성출력장치를 제안하고자 한 것으로, 압축된 디지털 코드 이미지를 인식하기 위한 스캔장치인 리더(reader)와, 리더로부터 읽어들인 코드 이미지를 처리하여 음성으로 합성 출력하기 위한 플레이어(player)가 분리가능한 구성을 갖는 휴대가 가능한 휴대형 코드인식 음성 합성출력장치를 제공하고자 하며, 또한 본 발명은 주 사용자층인 시각장애인, 문맹자, 노인 들을 감안하여 다양한 기능을 지원하고자 하는 바, 텍스트 파일의 음성출력기능, MP3재생기능, 녹음기능, FM라디오 기능, 시계기능 등을 지원하고자 하며, 모든 메뉴 및 동작상태들에 대한 음성안내 기능을 제공하여 사용자의 편의를 도모할 수 있도록 하는 휴대형 코드 인식 음성합성 출력장치를 제공하고자 한다.
디지털코드이미지, 음성합성, TTS, 디지털압축코드, 코드인식음성합성

Description

휴대형 코드인식 음성 합성출력장치{Portable cord recognition voice output device}
도 1은 본 발명 휴대형 코드인식 음성 합성 출력장치의 전체 구성을 나타낸 도면.
도 2는 본 발명에 있어서, 리더와 플레이어의 상세 구성을 나타낸 블록도.
도 3은 본 발명에 있어서, 디지털 코드 이미지의 표시출력예를 나타낸 도면.
도 4는 본 발명에 있어서, 재생모드 실행과정의 일 예를 나타낸 플로우챠트.
도 5는 본 발명에 있어서, 캡처 재생모드 실행과정의 일 예를 나타낸 플로우챠트.
본 발명은 소정의 압축 코드형태로 인쇄된 출력물을 읽어들여 음성으로 출력해줄 수 있도록 하는 휴대형 음성합성출력장치에 관한 것이다.
정보통신기술의 발달로 개인과 사회, 국가전체가 정보생활을 영위하고 있으나 전 세계적으로 장애인, 노인, 문맹자 등 정보 소외 계층은 정보통신에 대한 접근과 활용이 어려워 정보화의 혜택을 누리지 못하고 있다.
대다수 선진국은 정보통신 제품과 서비스의 제공시 장애인과 노인의 접근성배려를 위해 많은 노력을 기울이고 있으며, 정보통신 기기 제조업자 및 서비스 제공자에게 장애인의 접근 및 사용을 배려하도록 의무하고 하고 있다.
이러한 국제적 동향과 더불어 국내에서도 많은 관심을 기울이고 있으나 제품개발 및 서비스 제공을 담당할 업계는 기업기윤과 직결되지 않는 다는 이유로 다소 소극적인 실정이다.
특히 시각에 장애를 가진 이들은 현대 정보화 시대의 다양한 정보들로부터 접근성에 제한을 받거나 차단되어 있는데, 이 중 가장 대표적인 것이 문자장애이라고 할 수 있다.
이러한 문자장애를 겪는 시각장애인들에게 점자, 녹음 등의 방법으로 인쇄된 책자를 읽을 수 있도록 하고 있으나, 책을 점역하기 위해서는 입력과 교정에 많은 시간이 소요되며, 점자는 독서 속도가 묵자에 비해 상대적으로 느릴 뿐 아니라 부피가 너무 커서 보관하기가 어렵다는 단점이 있다.
또한 녹음 도서는 제작기간이 길고 장기보관이 어렵다는 문제 등으로 고도화되는 정보화 사회속에서 비장애자에 비해 상대적으로 정보수집에 많은 어려움을 겪어왔다.
시각의 장애를 겪는 사람들에게는 독서는 다양한 간접경험의 기회를 제공해준다. 읽기와 쓰기의 제한성을 극복하기 위해 독서교육을 풍부하게 시키므로써, 시각 장애인들의 부족한 경험의 폭이 확대될 뿐만 아니라 정보접근의 기회가 넓어진다고 할 수 있다.
이러한 환경들을 살펴볼 때, 시각장애인 또는 노인들이 타인의 도움없이 비장애자와 같이 스스로 다양한 정보매체에 접근이 용이하도록 하는 장치의 필요성이 대두되었다.
이와 같은 필요성에 의해 문자를 소정의 코드화해서 압축하고, 이를 기록하여 시각장애인이나 노인들이 손쉽게 스스로 책을 읽을 수 있도록 하는 코드인식 음성합성장치가 개발되고, 상용화에 이르게 되었다.
본 발명에서는 이와 같은 압축된 코드를 인식하고 이를 음성으로 출력할 수 있도록 하는 음성합성 출력장치에 관한 것이다.
일반적으로 코드형태의 출력물로 바코드의 예를 들 수 있는 바, 바코드는 바(bar)와 스페이스의 배열을 이용하여 정보를 제공하기 위한 부호이다.
이와 같은 바코드는 심볼로지라고 하는 바코드 언어에 정의된 규칙에 의해 광학적으로 판독하기 위해 쉽게 부호화 한 것으로, 바와 스페이스는 그 폭에 따라 1개 도는 복수개의 이진수 비트(binary bit : 0 또는 1)로 바뀌게 되고, 이들의 조합으로 아스킬 문자가 표현된다.
이때 표현되는 문자는 바코드의 종류에 따라 숫자 또는 문자로 표현된다.
이와 같은 바코드는 데이터의 입력이 간편하고 데이터의 입력시 에러율이 적으며, 자료 처리 시스템의 구성이 가능하고 다양한 재질에 인쇄가 가능하여 상품의 국가코드, 제조사, 제품코드, 제조년월일 등 상품을 나타내기 위한 형태는 물론 여러 다양한 분야에서 폭 넓게 사용되고 있다.
그러나 이와 같은 바코드는 심볼에 함축되는 정보가 국가코드, 제조회사명, 제품코드정보로 정보의 양이 한정되어 있어, 많은 정보를 표현할 수 없고, 심볼이 손상될 경우 복구가 어려운 단점이 있다.
따라서 이와 같은 바코드를 이용하여서는 책과 같은 다량의 문서를 코드화하기 어려운 점을 고려하여 많은 양의 정보를 실을 수 있도록, 다양한 심볼의 연구가 지속되어져 왔고, 근래에 들어서는 다양한 형태의 디지털 코드 이미지가 개발되고 사용되고 있다.
본 발명은 소정의 압축된 형태의 디지털 코드 이미지를 인식하고 이를 음성으로 합성 출력할 수 있도록 하는 코드인식 음성 합성출력장치를 제안하고자 한 것으로, 압축된 디지털 코드 이미지를 인식하기 위한 스캔장치인 리더(reader)와, 리더로부터 읽어들인 코드 이미지를 처리하여 음성으로 합성 출력하기 위한 플레이어(player)가 분리된 휴대가 가능한 휴대형 코드인식 음성 합성출력장치를 제공하고자 한 것이다.
또한 본 발명은 주 사용자층인 시각장애인, 문맹자, 노인 들을 감안하여 다양한 기능을 지원하고자 하는 바,
텍스트 파일의 음성출력기능, MP3재생기능, 녹음기능, FM라디오 기능, 시계기능 등을 지원하고자 하며, 모든 메뉴 및 동작상태들에 대한 음성안내 기능을 제공하여 사용자의 편의를 도모할 수있도록 하는 휴대형 코드 인식 음성합성 출력장치를 제공하고자 한 것이다.
본 발명은 소정의 압축된 형태의 디지털코드 이미지를 읽어들이기 위한 리더(reader)와, 리더와 소정의 유무선 네트워크 인터페이스수단을 통해 연결되어 리더로부터 읽어들인 정보를 디코딩하여 정해진 음성으로 출력하는 플레이어로 구성된다.
상기 리더는 압축된 디지털 코드 이미지를 캡처하기 위한 영상스캔수단과 플레이어로 캡처된 데이터를 전송하기 위한 유무선 네트워크 인터페이스수단을 포함하여 구성된다.
상기 플레이어는 리더로부터 데이터를 입력받기 위한 네트워크 인터페이스수단과, 사용자의 키이입력 및 리더의 연결여부에 따라 동작모드를 결정하고, 그 동작모드에 따라서 리더를 통해 입력된 데이터를 프로그램 메모리수단에 저장된 프로그램 프로세스에 따라 디코딩(decoding)하고, 그 디코딩된 데이터를 프로그램메모리수단에 저장된 음성합성값에 따라 음성합성처리하여 출력될 음성합성 데이터의 생성 처리 또는 데이터 저장용 메모리수단에 저장된 텍스트 파일을 프로그램 메모리수단에 저장된 음성합성값에 따라 음성합성처리하여 출력될 음성합성 데이터를 생성처리 제어하는 음성합성처리수단(DSP)과, 리더를 통해 입력된 데이터를 디코딩하고 저장된 각 데이터의 음성값에 따라 음성을 합성하기 위한 프로세스 및 동작모드 변환 및 동작상태를 음성안내해주기 위한 프로세스가 설정된 프로그램을 포함하는 프로그램 메모리수단과, 디코딩된 데이터(텍스트 파일)를 저장하기 위한 데이터저장용 메모리수단과, 음성합성처리수단을 통해 생성된 음성합성 디지털 정보를 음성출력하기 위한 음성출력수단과, 볼륨, 모드 변환등 사용자가 플레이어를 조작하 기 위한 사용자 키이입력수단과, 컴퓨터(PC)와 네트워크 연결하여 플레이어내의 데이터 관리 및 컴퓨터(PC)로부터 소정의 텍스트 정보를 제공받을 수 있도록 하는 컴퓨터 네트워크 인터페이스수단과, 플레이어의 동작 전원 공급을 위한 전력제어수단을 포함하여 구성되는 것을 특징으로 한다.
이와 같은 특징을 갖는 본 발명 휴대형 코드인식 음성 합성출력장치를 첨부된 도면에 도시된 실시예를 참조하여 설명하면 다음과 같다.
도 1은 본 발명 휴대형 코드인식 음성 합성출력장치의 전체 구성을 나타낸 도면이고, 도 2는 본 발명에 있어서, 플레이어의 구성을 나타낸 블록도이다.
소정의 압축된 형태의 디지털코드 이미지를 읽어들이기 위한 리더(reader)(100)와, 리더(100)와 유무선 네트워크 인터페이스수단를 통해 연결되어 리더(100)로부터 읽어들인 정보를 디코딩하여 정해진 음성으로 출력하는 플레이어(200)를 포함하여 구성된다.
상기 리더(100)는 압축된 디지털 코드 이미지를 캡처하기 위한 카메라부(101)와, 카메라부(101)로부터 캡처된 정보를 USB포트(103)를 통해 플레이어(200)로 전송하기 위한 USB 통신 인터페이스부(102)를 포함하여 구성된다.
상기 플레이어(200)는 상기 USB통신포트(103)와 연결되는 USB통신포트(201)를 갖고, USB통신포트(201)를 통해 리더(100)로부터 데이터를 전송받기 위한 USB통신 인터페이스부(202)와, 전송받은 캡처된 데이터를 음성합성처리하기위하여 디지털 데이터로 변환하는 A/D 변환부(203)와, 사용자 키이입력 또는 리더(100)의 연결여부에 따라 동작모드(캡처재생모드,재생모드)를 결정하고, 그 동작모드에 따라 리 더(100)에 의해 캡처된 데이터를 프로그램 메모리부(205)에 저장된 프로그램 프로세스에 따라 디코딩하고, 그 디코딩된 데이터를 프로그램 메모리수단(205)에 저장된 음성합성값에 따라 음성합성처리하여 출력될 음성합성 데이터의 생성처리 및 데이터 저장용 메모리(206)에 저장된 텍스트 파일을 프로그램 메모리수단에 저장된 음성합성값에 따라 음성합성처리하여 출력될 음성합성 데이터를 생성처리 제어하는 음성합성처리 제어부(DSP)(204)와, 상기 음성합성처리 제어부(204)에서 이루어지는 압축 디지털 이미지의 디코딩 및 디코딩된 데이터에 대한 음성합성 처리 프로세스 및 동작모드 변환 및 동작상태를 음성안내해주기 위한 프로세스가 설정된 프로그램 메모리부(205)와, 디코딩된 텍스트 파일 및 컴퓨터(PC)로부터 전송받은 파일을 저장하기 위한 데이터 저장용 메모리부(206)와, 상기 음성합성처리 제어부(204)로부터 출력된 음성합성정보를 음성출력을 위한 아날로그 데이터로 변환하는 D/A 변환부(207)와, 아날로그 데이터로 변환된 음성합성처리 제어부(204)를 통해 생성된 음성합성 정보를 외부로 음성출력하기 위한 음성출력부(208)와, 볼륨, 모드 변환등 사용자가 플레이어(200)를 조작하기 위한 사용자 키이입력부(209)와, 컴퓨터(PC)와 네트워크 연결하여 플레이어(200)내의 데이터 관리 및 컴퓨터(PC)로부터 소정의 텍스트 정보를 제공받을 수 있도록 하는 컴퓨터 통신인터페이스부(210)와, 리더(100) 및 플레이어(200)의 동작상태 및 플레이어(200)의 파일 탐색화면을 제공하기 위한 LCD 표시부(211)와, 플레이어(200)에 전원 공급을 위한 전력제어부(212)를 포함하여 구성된다.
상기 음성합성처리 제어부(204)는 리더(100)를 통해 캡처된 디지털 코드 이 미지를 프로그램 메모리부(204)에 저장된 디코딩 정보에 따라 디코딩하여 문자(텍스트)로 변환하는 문자변환부(204A)와, 변환된 문자정보를 프로그램 메모리부(205)에 설정된 음성합성 정보에 따라서 음성정보로 변환하는 음성합성부(204B)와, 사용자의 선택에 따라 플레이어(200)의 동작모드가 설정되는 모드 설정부(204C)를 포함하여 구성된다.
상기 프로그램 메모리부(205)는 압축 디지털 이미지의 디코딩을 위한 디코딩정보 및 디코딩된 데이터에 대한 음성합성 처리 프로그램 및 모드변환 및 동작상태에 대한 안내메시지를 출력하는 프로그램이 저장된 프로그램이 저장된 프로그램 저장부(205A)와, 디코딩된 문자 데이터(텍스트)를 음성으로 변환(TTS)시키기 위한 데이터가 저장된 DB저장부(205B)를 포함하여 구성된다.
그리고 상기 DB저장부(205B)는 사용자가 설정한 기호, 숫자, 문자 등에 대한 음성변환데이터가 저장되는 사용자정의 데이터 저장부(205B-1)를 더 포함하여 구성된다.
상기 DB저장부(205B)는 디지털 코드 이미지에 포함된 음성출력시 음색, 속도, 높낮이등을 지시하는 테그(tag)정보를 저장하는 테그정보 저장부(205B-2)를 더 포함하여 구성된다.
그리고 상기 DB저장부(205B)는 사용자에게 알림 음성 메시지정보가 저장되는 음성안내 저장부(205B-3)를 더 포함하여 구성된다.
상기 음성출력부(208)는 D/A 변환부(207)를 통해 변환된 음성출력 데이터를 증폭하여 스피커(208A) 또는 이어폰잭(208B)으로 출력하는 구성을 갖는다.
이와 같은 구성을 갖는 본 발명은,
디지털 코드 이미지를 읽어 들이기 위한 리더(100)와 플레이어(200)로 구성되며, 상기 리더(100)와 플레이어(200)는 USB 통신으로 데이터를 송수신할 수 있도록 데이터 통신 통신인터페이스수단으로 USB통신 인터페이스부(102)(202)를 구성하고, 외부로 USB통신포트(103)(201)를 각각 구성한다.
여기서 상기 리더(100)와 플레이어(200)는 본 실시예에 있어서, USB통신으로 그 네트워크를 구성하였지만, 블루투스, 시리얼통신 등 유무선의 다양한 통신 수단의 적용이 가능하다.
주 사용층이 시각장애인 또는 노인들인점을 감안하여 리더(100)와 플레이어(200)의 크기는 소형화한 것이고, 리더(100)와 플레이어(200)를 USB 통신으로 연결하여 사용자가 리더(100)만을 움직여 캡처가 용이한 구성을 갖도록 한다.
그리고 상기 플레이어(200)는 컴퓨터와의 네트워크 연결을 위하여 컴퓨터 통신인터페이스부(210)를 구성하게 되는 바, 컴퓨터 통신인터페이스부(210) 또한 USB통신으로 구성할 수 있으며, 별도로 컴퓨터 통신인터페이스부(209) 및 이를 위한 통신포트(209a)를 구성하지 않고, 상기 리더(200)와의 통신접속을 위한 USB 통신인터페이스부(102) 및 USB통신포트(103)를 통해 컴퓨터와의 데이터를 통신을 수행하도록 구성할 수 있다.
물론, 컴퓨터와의 네트워크 연결 또한 다양한 통신 접속수단으로 구성 가능하다.
음성합성처리제어부(204)를 통해 캡처된 디지털 이미지에 대하여 음성합성처 리를 수행하기 위한 프로세스를 제공하는 프로그램 메모리부(205)가 구성되며, 프로그램 메모리부(205)에는 프로그램 저장부(205A)와 DB저장부(205B)가 구성된다.
프로그램 저장부(205A)에는 캡처된 디지털 코드 이미지를 음성합성 처리하기 위한 일련의 프로세스를 제공하며, DB저장부(205B)는 디코딩된 디지털 코드 이미지에 대응하는 음성 정보값이 저장된다.
이와 같은 DB 저장부(205B)는 상기에서 설명한 바와 같이, 디코딩된 디지털 코드이미지를 음성합성하기 위한 정보가 입력되는 바, 사용자가 임의로 해당 문자에 대하여 출력값을 지정하기 위한 사용자 정의 데이터 저장부(205-1)를 구성한다.
사용자 정의 데이터는 특수한 문자열(숫자, 기호, 외래어 포함 등)을 사용자가 원하는 데로 읽어줄 수 있도록 사용자 정의 기능을 제공하기 위한 것으로, 사용자 정의 데이터 저장부(205-1)에는 사용자가 사용자 키이입력부(209)를 이용하여 이 기능에 필요한 정보를 입력한다.
또한 DB저장부(205B)에는 테그정보 저장부(205B-2)가 구성된다.
디지털 코드 이미지에 음색, 속도, 높낮이 등을 지정하기 위한 테그를 포함시킬 수 있다.
따라서 이와 같은 테그를 실행하기 위한 테그정보에 대한 정의가 기록 되어있다.
상기 데이터 저장용 메모리부(206)에는 음성합성 출력을 위해 문자 변환된 데이터가 텍스트 파일로 저장되며, 이와 같이 저장된 파일들은 필요에 따라 사용자가 재생하여 음성으로 들어볼 수 있으며, 데이터 저장용 메모리부(206)는 데이터 저장용량의 제약이 있으므로, 확장용 데이터 메모리를 사용할 수 있도록 데이터 저장용 메모리부(206)의 확장을 위한 데이터 메모리부를 더 구성할 수 있다.
그리고 상기 DB저장부(205B)에는 음성출력모드에 따른 음성합성정보를 더 포함하여, 이는 사용자가 키이입력부(209)를 통해 음성출력모드를 선택할 수 있도록 하는 데, 여성 음성, 남성음성 그리고 기사낭독용, 상쾌한 목소리, 연예인 목소리 등 다양하게 그 음성출력모드를 제공할 수 있다.
그리고 플레이어(200)내의 파일 탐색 및 리더(100) 및 플레이어(200)의 동작상태를 나타내주기 위하여 LCD표시부(211)를 구성하며, 시각장애자 또는 문맹자들을 위해 지정된 폴더 및 파일에 대한 음성안내 메시지 및 각 모드의 변환 동작상태에 따라서 음성안내메시지를 출력하도록 구성한다.
사용자 키이입력부(209)는 플레이어(200)의 케이스 외부에 실장되며, 사용자가 시각장애인 또는 노인임을 감안하여 키이의 입력이 용이하도록 간단하게 구성하여 키이의 선택순서 등에 따라 각 모드의 변환, 볼륨 등의 전환이 가능하도록 구성한다.
또한 키이에 점자등을 식각하여 사용자가 손쉽게 키이가 지시하는 내용이 무엇인지를 인식할 수 있도록 할 수 있다.
이와 같은 구성을 갖는 본 발명은 다음과 같은 동작 과정을 갖는다.
본 발명은 문서 또는 출판된 서적에 인쇄되어 있는 디지털 코드 이미지(이하 보이스아이 코드라고 함)를 캡처하고, 그 캡처된 정보를 음성으로 합성하여 사용자에게 음성으로 들려줄 수 있도록 하는 장치이다.
이와 같은 장치가 사용되기 위해서는 문서 또는 출판 서적물에 인쇄된 텍스트의 내용을 압축 저장하는 보이스 아이 코드가 인쇄 되어있어야 한다.
이때 보이스 아이 코드는 책의 하단 또는 상단에 일정한 위치에 인쇄하여 시각장애인들이 손쉽게 그 위치를 인식할 수 있도록 한다.
도 3은 보이스 아이코드가 문서 페이지의 하단에 인쇄된 예를 나타낸 것이다.
이와 같이 인쇄된 보이스 아이 코드를 캡처하여 그 텍스트 정보를 사용자에게 음성으로 들려줄 수 있도록 한다.
먼저, 그 개략적인 동작과정을 살펴보면 다음과 같다.
리더(100)와 플레이어(200)가 연결된 상태에서는 캡처재생모드로 동작한다.
따라서 리더(100)를 이용하여 문서를 캡처하고자 한다면 리더(100)와 플레이어(200)가 연결된 상태에서 리더(100)를 조작하여 보이스 아이코드를 캡처한다.
리더(100)의 카메라부(101)가 보이스 아이코드를 읽어들이고, 그 읽어들인 정보는 USB통신포트(103)에 연결된 플레이어(200)의 USB 통신포트(201)를 통해 플레이어(200)에 전송된다.
플레이어(200)의 A/D 변환부(203)에서는 수신된 캡처된 아날로그 이미지를 디지털 데이터로 변환하여 음성합성처리 제어부(204)에 전달한다.
음성합성처리 제어부(204)에서는 이와 같이 입력된 디지털 이미지 데이터를 소정의 문자로 인식변환하고, 그 변환된 문자정보를 음성으로 합성하여 출력될 음성정보를 생성한다.
음성합성처리 제어부(204)에서는,
문자변환부(204A)를 통해 DB저장부(205B)에 저장된 보이스 아이코드의 디코딩정보에 따라서 입력된 보이스 아이 코드 정보를 문자로 변환한다.
이와 같이 문자로 변환되면, 음성합성부(204B)에서는 각 변환된 문자를 DB저장부(205B)에 저장된 각 문자에 대응하는 음성합성값을 이용하여 음성합성하여 출력될 음성정보를 생성한다.
이때, 사용자 정의 데이터 저장부(205B-1)에 정의된 사용자 정의값에 해당하는 문자가 나타날 경우에는 정의된 사용자값에 의해 음성합성값을 결정한다.
또한 변환된 문자중 테그가 존재하는 경우 테그정보 저장부(205B-2)로부터 해당 테그의 값을 인식하여 테그가 지정하는 명령에 따라서 출력될 음성정보를 생성한다.
이와 같이 생성된 음성정보는 음성출력을 위해 D/A변환부(207)를 거쳐 아날로그 음성데이터로 변환되고, 음성출력부(208)를 통해 증폭되어 케이스에 실장된 스피커(208A) 또는 이어폰잭(208B)을 통해 외부로 출력된다.
한편, 음성합성처리 제어부(204)에서는 디코딩된 음성정보를 사용자가 이후에 재생시켜 반복적으로 들어볼 수 있도록 모드설정부(204C)에 설정된 사용자의 설정모드에 따라서 데이터 저장용 메모리(206)에 텍스트 파일로 저장하게 된다.
사용자는 사용자 키이입력부(209)를 통해 자동 저장 및 필요에 따라 저장하는 자동저장모드 또는 선택저장을 설정할 수 있다.
이와 같은 본 발명을 모드별 동작과정에 대하여 상세히 설명하면 다음과 같 다.
플레이어(200)의 동작모드 변환은 리더(100)의 연결여부 및 사용자 키이입력부(209)에 의한 사용자 선택에 의해 이루어진다.
리더(100)가 연결되어있는 지를 판단하고, 그 판단결과에 따라 동작모드를 결정하게 되는 바, 리더(100)가 연결되어 있으며, 캡처 재생모드로 동작하고, 리더(100)가 연결되어 있지 않을 경우 데이터 저장용 메모리(206)에 저장된 파일 재생을 위한 재생모드로 동작한다.
그러나 사용자 키이입력부(209)의 모드변환키이를 통해 사용자가 모드 변환을 시도하게 되면, 리더(100)의 연결여부와 상관없이 사용자 선택을 우선순위로 하여 해당하는 동작모드로 동작한다.
사용자가 사용자 키이입력부(209)의 모드변환키이를 선택하여 캡처재생모드를 지정하게 되면, 리더(100)가 연결되어 있는 가를 판단하게 된다.
리더(100)가 연결되어 있지 않을 경우 음성안내정보 저장부(205B-3)에 저장된 안내멘트를 읽어 음성 출력하여 사용자에게 알려준다.
예를 들어, "리더가 연결되어 있지 않습니다." 와 같은 음성안내멘트를 송출하게 되는 것이다.
이후 사용자가 리더(100)를 플레이어(200)에 연결하게 되면, " 리더가 연결되었습니다."와 같은 메시지를 송출하여 사용자에게 캡처 재생모드가 수행될 수 있다는 것을 알린다.
이와 같이 캡처 재생모드가 설정된 상태에서 리더(100)와 플레이어(200)가 연결되면, 자동으로 캡처 재생모드가 수행되며, 이와 같은 경우 별도의 캡처를 지시하는 동작이 필요없다.
즉, 캡처 명령 키이가 불필요한 것이다.
리더(100)를 조작하여 보이스 아이코드를 읽게 도면, 상기에서 설명한 바와 같이 문자변환부(204A)에 의해 문자변환되어 텍스트 파일로 버퍼에 저장되고, 음성합성부(204B)에 의해 음성 합성되어 리얼 타임(real time)으로 음성 출력 된다.
모든 캡처 재생과정이 완료되고, 사용자가 정지(stop)키이를 선택하게 되면, 캡처 재생모드가 종료되고, 지금까지 출력된 음성출력 정보를 저장할 것인가를 음성안내멘트를 통해 사용자에게 알리고, 사용자가 이에 따라 저장여부를 판단하게 된다.
사용자가 저장키이를 선택하게 되면, 상기 변환된 문자 파일 텍스트 파일을 데이터 저장용 메모리부(206)에 저장하고, 사용자가 저장을 원하지 않을 경우에는 메모리 버퍼의 내용을 지우게 된다.
여기서, 음성 합성된 정보가 재생되고 있는 중에도 저장이 가능한 바, 사용자가 저장(save) 키이를 선택하게 되면, 비프 음을 출력하면서 메모리 버퍼에 일시 저장된 텍스트 파일이 데이터 저장용 메모리부(206)에 저장된다
물론, 음성합성 출력된 파일의 저장이 이루어지고 있는 중에도 음성합성출력은 사용자가 정지 키이를 눌러 음성합성출력을 정지시키지 않는 한 계속 이루어진다.
또한 사용자가 자동저장모드를 설정하여 두면 상기에서와 같이 저장여부를 확인하지 않고 자동으로 저장한다.
그 저장방법의 일 예를 간단히 살펴보면,
책을 디코딩했을 경우 보이스 아이 코드의 헤더에 정의되어있는 책이름으로 지정된 북폴더(voiceeye book)내에 자동으로 폴더를 만들고, 폴더내의 책의 페이지번호.txt와 같은 형태로 저장하며, 이때 LCD표시부에 보여지는 파일은 이름순으로 정렬되어 보여지도록 한다.
이때, 지정된 북폴더내의 파일들은 저작권보호를 위해 컴퓨터(PC)에서 억세스(access) 불가능하도록 설정한다.
즉, 미리 책 내용을 압축 엔코딩할 때 헤더내에 책에 대한 엔코딩임을 알리는 데이터를 포함시키고, 이러한 내용을 디코딩하여 저장할 때 그 정보가 포함되어질 수 있도록 하므로써, 저작권에 대한 보호가 가능하도록 한 것이다.
책이 아닌 일반 문서일 경우에는 다른 폴더(voiceeye)내에 저장하며, 설정된 이름 정하는 방법에 따라 이름+페이지번호.txt형태로 저장한다.
이때 사용자가 PC를 통해 하부 폴더를 생성할 수 있도록 하여, 사용자에 의한 파일관리가 이루어질 수 있도록 한다.
디코딩되는 문서의 종류에 따라 이름을 부여하고 소정의 규칙에 따라 저장하도록 한다.
사용자가 재생모드를 선택하게 되면,
사용자에 의해 재생모드가 선택되면, 탐색화면을 LCD표시부를 통해 표시하고, 사용자가 이를 통해 원하는 파일을 선택하여 음성 재생하여 들을 수 있도록 한 다.
재생모드는 리더(100)의 연결유무와 상관없이 내부의 데이터 저장용 메모리부(206)에 저장된 텍스트 파일의 음성출력에 관한 것이므로, 리더(100)의 연결유무를 판단하지 않는다.
이때, 사용자에 의해 탐색 지정되는 폴더 또는 파일을 음성으로 알려주므로, 사용자는 안내음성을 들으면서 데이터 저장용 메모리부(206)에 저장된 기 캡처되어 음성정보로 변환된 정보를 재생하여 들을 수 있다.
별도의 사용자 재생모드 변환이 이루어지지 않는다면, 리더(100)와 플레이어(200)가 연결된 상태가 캡처된 보이스 아이 코드를 음성합성하여 실시간 음성출력하는 캡처재생모드가 기본동작모드이고, 리더(100)와 플레이어(200)가 연결되어 있지 않은 상태가 재생모드를 기본동작으로 하고 있는 바, 플레이어(200)는 최초 전원 온 상태(리셋상태)에서는 리더(100)가 연결된 상태에서도 사용자가 재생모드 변환을 선택한 것과 마찬가지로 재생모드를 기본으로 동작한다.
이와 같은 경우, 데이터 저장용 메모리부(206)에 저장된 텍스트 파일중 최근에 재생했던 텍스트 파일부터 지정되어 표시하고, 탐색이 가능하도록 하는 재생파일의 탐색과정을 진행하는 재생모드로 진행한다.
한편 상기에서와 같이 캡처재생 모드를 통해 데이터 저장용 메모리부(206)에 저장된 텍스트 파일들을 컴퓨터에 억세스(access)하거나, 컴퓨터(PC)로부터 텍스트 파일들을 전송받아 음성 합성하여 음성 재생할 수 있다.
플레이어(200)를 컴퓨터와 연결하여 컴퓨터와 데이터를 송수신할 수 있는데, USB 통신을 통해 컴퓨터와 연결하여 앞서 설명한 바와 같이 플레이어(200)내의 폴더 및 파일관리가 가능하도록 한다.
또한 컴퓨터(PC)내의 텍스트 파일을 플레이어(200)에 전송하여 플레이어(200)에서 지원하는 음성합성 출력기능을 이용하여 음성으로 외부 출력이 가능하도록 하는 텍스트 파일의 음성합성 기능이 가능하다.
도 4는 본 발명에 있어서, 재생모드 실행과정의 일 예를 나타낸 플로우챠트이고, 도 5는 본 발명에 있어서, 사용자의 캡처재생모드 키이 입력에 의한 캡처 재생모드 실행과정의 일 예를 나타낸 플로우 챠트이다.
캡처재생모드가 선택된 경우 캡처재생모드가 선택되었음을 알리는 안내메시지를 음성출력하고, 리더가 연결되었는지를 판단하는 리더연결판단과정과,
상기 리더연결판단과정 판단결과 리더가 연결되어 있지 않으면, 리더의 연결상태를 알리는 안내메시지를 출력하여 리더를 연결하도록 하는 리더 상태안내메시지 출력과정과,
리더가 연결되었으면, 캡처된 이미지를 수신하고, 수신된 이미지를 디코딩하여 텍스트로 변환하는 문자변환과정과,
사용자가 설정한 음성출력모드에 따라서 변환된 문자를 설정된 음성합성값을 이용하여 출력될 음성정보를 생성하는 음성정보 생성과정과,
생성된 음성정보를 외부로 음성출력하는 음성출력과정을 포함하는 캡처재생모드 수행과정으로 이루어지며,
재생모드가 선택된 경우 재생모드가 선택되었음을 알리는 안내메시지를 음성 출력하고, 저장된 파일의 검색이 가능하도록 탐색화면을 표시하고, 사용자가 지정하는 폴더 및 파일에 대한 안내메시지를 음성출력하는 재생선택과정과,
사용자가 재생을 위해 선택한 파일에 대하여 음성합성값을 이용하여 출력될 음성정보를 생성하는 음성정보생성과정과,
생성된 음성정보를 외부로 음성출력하는 음성출력과정으로 이루어지는 재생모드 수행과정으로 이루어진다.
그리고 상기 최초 전원 온 상태인가를 판단하는 리셋판단과정과,
상기 리셋판단과정 판단결과 초기 전원 온 상태인 경우 재생모드를 리더의 연결여부와 상관없이 재생모드로 수행됨을 알리는 안내메시지를 수행하고, 상기와 같은 재생모드를 수행하는 과정을 더 포함하여 이루어진다.
그리고 상기 캡처재생모드는 리더의 연결여부에 따라서 캡처재생모드가 수행되도록 하고, 사용자의 모드변환키이가 입력되면 사용자가 변환한 해당하는 모드로 동작하도록 하는 과정을 더 포함한다.
그리고 상기 캡처재생모드는 사용자의 정지키이입력에 의해 캡처 재생이 종료될 때, 자동 저장모드인가를 판단하는 과정과, 자동저장모드이면 디코딩된 텍스트 파일을 데이터 저장용 메모리에 저장하고, 자종저장모드가 아닐 경우 사용자에게 저장할 것인지를 확인하고, 사용자의 선택에 따라 디코딩된 텍스트 파일을 저장하고 종료하는 과정을 더 포함한다.
한편, 본 발명은 주 사용자인 시각장애자, 문맹자, 노인들의 사용편의를 위하여 다양한 기능을 포함하여 제공할 수 있는 바,
먼저, MP3파일의 디코딩수단을 더 포함하여 구성하여 MP3파일재생 기능을 제공할 수 있다.
라디오신호를 수신하기 위한 수신수단으로 라디오 튜너를 내장시켜 FM라디오의 청취가 가능하도록 한다.
또한, 음성입력수단과, 음성입력수단을 통해 입력된 아날로그 음성 데이터를 디지털 데이터로 변환하여 소정의 압축파일(MP3)로 저장할 수 있도록 엔코더(encoder)를 더 포함한 구성으로, 사용자의 음성을 파일로 녹음할 수있도록 하는 구성을 제공한다.
그리고 라디오 청취시 필요에 따라 상기 엔코더를 이용하여 라디오 출력음성을 MP3로 녹음 할 수있도록 한다.
또한 상기 음성합성처리제어부는 출력되는 음성정보를 상기한 바와 같은 엔코더를 이용하여 압축된 파일형태(MP3)로 저장할 수 있으며, 저장 형태를 텍스트 형태가 아닌 압축된 파일 형태로 저장할 수 있다.
이와 같은 경우 파일 포맷을 선택적으로 변환 제공하기 위하여 각각에 해당하는 엔코더 또는 파일 포맷을 변환하기 위한 파일 포맷변환수단을 더 포함하여 구성할 수 있으며,
사용자가 지정한 출력포맷(PCM, WAV,ASF,MP3 등)에 따라서 음성합성된 정보를 변환하여 데이터 저장용 메모리부에 저장 또는 컴퓨터(PC)로 전송할 수 있다.
또한 본 발명은 모든 메뉴 및 동작상태가 음성안내기능이 지원되므로, 시간을 나타낼 수 있는 시계부를 구성하고, 이와 같은 시계부로부터 나타내는 시간정보 를 LCD표시부를 통해 표시함은 물론 소정의 시간마다 음성으로 안내해줄 수있도록 하므로써, 사용자의 편의를 도모할 수 있도록 한다.
이와 같은 본 발명을 적용하면,
도서, 문서 등의 각 페이지별로 해당 내용을 인쇄할 때 그 내용을 포함하는 디지털 코드 이미지만 함께 인쇄하게되면, 본 발명 장치로 해당 이미지를 음성으로 변환하여 사용자가 들을 수 있어, 시각장애자들은 물론, 문맹자, 노인들이 다양한 정보의 접근이 용이해진다.
또한, 리더와 플레이어가 USB통신을 통해 연결되며, 필요에 따라 분리 가능한 구조를 가지므로, 사용자는 플레이어를 주머니 또는 별도의 위치에 얹어두고, 캡처를 위한 리더만을 움직여여 캡처 재생모드를 수행할 수 있어 사용에 편리하다.
사용자키이 인터페이스가 매우 간단하고, 사용에 편리하게 되어있으며, 모든 메뉴 및 동작상태를 음성으로 안내해 주므로써, 시각장애인인, 노인들도 쉽게 사용할 수 있다.

Claims (18)

  1. 소정의 압축된 형태의 디지털코드 이미지를 읽어들이기 위한 리더(reader)와, 리더와 소정의 유무선 네트워크 인터페이스수단을 통해 연결되어 리더로부터 읽어들인 정보를 디코딩하여 정해진 음성으로 출력하는 플레이어로 구성되며,
    상기 리더는 압축된 디지털 코드 이미지를 캡처하기 위한 영상스캔수단과 플레이어로 캡처된 데이터를 전송하기 위한 유무선 네트워크 인터페이스수단을 포함하고,
    상기 플레이어는 리더 또는 컴퓨터(PC)와의 데이터 송수신을 위한 네트워크 인터페이스수단과, 동작모드에 따라서 리더를 통해 입력된 데이터를 프로그램 메모리수단에 저장된 프로그램 프로세스에 따라 디코딩(decoding)하고, 그 디코딩된 데이터를 프로그램메모리수단에 저장된 음성합성값에 따라 음성합성 처리하여 출력될 음성합성 데이터의 생성 처리 또는 데이터 저장용 메모리수단에 저장된 텍스트 파일을 프로그램 메모리수단에 저장된 음성합성값에 따라 음성 합성처리하여 출력될 음성합성 데이터를 생성처리 제어하는 음성합성처리수단(DSP)과, 리더를 통해 입력된 데이터를 디코딩하고 저장된 각 데이터의 음성값에 따라 음성을 합성하기 위한 프로세스 및 동작모드 변환 및 동작상태를 음성안내해주기 위한 프로세스가 설정된 프로그램을 포함하는 프로그램 메모리수단과, 디코딩된 데이터(텍스트 파일)를 저장하기 위한 데이터저장용 메모리수단과, 음성합성처리수단을 통해 생성된 음성합성 디지털 정보를 음성출력하기 위한 음성출력수단과, 볼륨, 모드 변환등 사용자가 플레이어를 조작하기 위한 사용자 키이입력수단과, 리더 및 플레이어의 동작상태 및 플레이어의 파일 탐색화면을 제공하기 위한 표시수단과, 플레이어의 동작 전원 공급을 위한 전력제어수단과, 상기 음성합성처리 제어수단으로 입력되는 데이터를 디지털 데이터로 변환하고, 음성합성처리제어수단으로부터 출력되는 출력될 음성데이터를 아날로그 데이터로 변환하는 데이터변환수단을 포함하여 구성되는 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  2. 제 1항에 있어서, 상기 컴퓨터(PC)와 네트워크 연결하여 플레이어내의 데이터 관리 및 컴퓨터(PC)로부터 소정의 텍스트 정보를 제공받을 수 있도록 하는 네트워크 인터페이스수단을 별도로 구성한 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  3. 제 1항에 있어서, 상기 음성합성처리 제어부는 리더를 통해 캡처된 디지털 코드 이미지를 프로그램 메모리부에 저장된 디코딩 정보에 따라 디코딩하여 문자(텍스트)로 변환하는 문자변환부와, 변환된 문자정보를 프로그램 메모리부에 설정된 음성합성 정보에 따라서 음성정보로 변환하는 음성합성부와, 사용자의 선택에 따라 플레이어의 동작모드가 설정되는 모드 설정부를 포함하여 구성되며,
    상기 프로그램 메모리부는 압축 디지털 이미지의 디코딩을 위한 디코딩정보 및 디코딩된 데이터에 대한 음성합성 처리 프로그램 및 모드변환 및 동작상태에 대한 안내메시지를 출력하는 프로그램이 저장된 프로그램 저장부와, 디코딩된 문자 데이터(텍스트)를 음성으로 변환(TTS)시키기 위한 데이터 및 사용자에게 알림 음성 메시지 정보가 저장된 DB저장부를 포함하여 구성되는 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  4. 제 3항에 있어서, 그리고 상기 DB저장부는 사용자가 설정한 기호, 숫자, 문자 등에 대한 음성변환데이터가 저장되는 사용자정의 데이터 저장부를 더 포함하여 구성되는 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  5. 제 3항에 있어서, 상기 DB저장부는 디지털 코드 이미지에 포함된 음성출력시 음색, 속도, 높낮이등을 지시하는 테그(tag)정보를 저장하는 테그정보 저장부를 더 포함하여 구성되는 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  6. 제 1항에 있어서, 상기 음성출력수단은 음성출력 데이터를 증폭하는 수단과, 증폭된 음성출력데이터를 외부로 음성출력하는 수단으로 스피커 및 이어폰잭을 포함하여 구성되는 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  7. 제 1항에 있어서, 상기 네트워크 인터페이스수단은 USB통신 인터페이스인 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  8. 제 1항에 있어서, 확장용 메모리 슬롯부를 더 포함하여 사용자의 필요에 의 해 데이터 저장용 메모리를 확장할 수 있도록 한 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  9. 제 1항 내지 제 5항중 어느 한 항에 있어서, 상기 음성합성처리 제어수단에서 동작모드 결정은 사용자 키이입력수단을 통한 사용자 선택에 의한 모드 변환 또는 리더와의 연결유무를 판별하여 이루어지는 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  10. 제 9항에 있어서, 상기 음성합성처리 제어수단은 사용자 키이입력수단에 의한 사용자 선택을 우선순위로 하여 동작모드를 결정하도록 한 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  11. 제 1항에 있어서, 상기 음성합성처리 제어수단은 디코딩된 정보로부터 헤더정보를 읽어, 저작권과 관련된 문서정보인 경우를 인식하고, 이를 데이터 저장용 메모리의 소정의 지정된 영역(폴더)에 저장하고, 컴퓨터(PC)와 연결될 때 컴퓨터(PC)로부터 이를 억세스 불가능하도록 설정한 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  12. 제 1항 내지 제 5항중 어느 한 항에 있어서, 상기 음성합성처리 제어수단은,
    사용자의 모드변환키이의 입력을 판단하는 과정과, 상기 판단결과 캡처재생 모드가 선택된 경우 캡처재생모드가 선택되었음을 알리는 안내메시지를 음성출력하고 리더가 연결되었는지를 판단하는 리더연결판단과정과, 상기 리더연결판단과정 판단결과 리더가 연결되어 있지 않으면, 리더의 연결상태를 알리는 안내메시지를 출력하여 리더를 연결하도록 하는 리더 상태안내메시지 출력과정과, 리더가 연결되었으면, 캡처된 이미지를 수신하고, 수신된 이미지를 디코딩하여 텍스트로 변환하는 문자변환과정과, 사용자가 설정한 음성출력모드에 따라서 변환된 문자를 설정된 음성합성값을 이용하여 출력될 음성정보를 생성하는 음성정보 생성과정과, 생성된 음성정보를 외부로 음성 출력하는 음성출력과정을 포함하는 캡처재생모드 수행과정으로 이루어지며,
    상기 재생모드가 선택된 경우 재생모드가 선택되었음을 알리는 안내메시지를 음성출력하고, 저장된 파일의 검색이 가능하도록 탐색화면을 표시하고, 사용자가 지정하는 폴더 및 파일에 대한 안내메시지를 음성출력하는 재생선택과정과, 사용자가 재생을 위해 선택한 파일에 대하여 음성 합성값을 이용하여 출력될 음성정보를 생성하는 음성정보생성과정과, 생성된 음성정보를 외부로 음성 출력하는 음성출력과정으로 이루어지는 재생모드 수행과정으로 이루어지는 프로세스에 따라 음성합성 출력 처리 제어를 수행하는 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  13. 제 12항에 있어서, 상기 음성합성 처리제어수단에서의 프로세스는 최초 전원 온 상태인가를 판단하는 리셋판단과정과, 상기 리셋판단과정 판단결과 초기 전원 온 상태인 경우 재생모드를 리더의 연결여부와 상관없이 재생모드로 수행됨을 알리는 안내메시지를 수행하고, 상기와 같은 재생모드를 수행하는 과정을 더 포함하는 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  14. 제 12항에 있어서, 상기 캡처 재생모드는 리더의 연결여부에 따라서 캡처재생모드가 자동 수행되도록 하고, 사용자의 모드변환키이가 입력되면 사용자가 지정한 모드로 동작 모드 변환하도록 하는 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  15. 제 12항에 있어서, 상기 캡처재생모드는 사용자의 정지키이입력에 의해 캡처 재생이 종료될 때, 자동 저장모드인가를 판단하는 과정과, 자동저장모드이면 디코딩된 텍스트 파일을 데이터 저장용 메모리에 저장하고, 자종저장모드가 아닐 경우 사용자에게 저장할 것인지를 확인하고, 사용자의 선택에 따라 디코딩된 텍스트 파일을 저장하고 종료하는 과정을 더 포함하여 이루어지는 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  16. 제 1항에 있어서, 상기 플레이어는 MP3파일을 디코딩하기 위한 MP3파일 디코딩수단을 더 포함하는 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
  17. 제 1항에 있어서, 라디오 수신수단과, 라디오 튜너를 더 포함하는 것을 특징 으로 하는 휴대형 코드인식 음성 합성출력장치.
  18. 제 1항에 있어서, 음성입력수단과, 음성입력수단을 통해 입력된 아날로그 음성 데이터를 디지털 데이터로 변환하여 소정의압축파일(MP3)로저장할 수 있도록 엔코더를 더 포함하는 것을 특징으로 하는 휴대형 코드인식 음성 합성출력장치.
KR1020050015735A 2005-02-25 2005-02-25 휴대형 코드인식 음성 합성출력장치 KR100719776B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020050015735A KR100719776B1 (ko) 2005-02-25 2005-02-25 휴대형 코드인식 음성 합성출력장치
CN2005800486841A CN101128863B (zh) 2005-02-25 2005-03-10 便携式码识别语音输出装置
EP05721932A EP1851754A4 (en) 2005-02-25 2005-03-10 PORTABLE CODE RECOGNITION VOICE DISPLAY DEVICE
US11/884,972 US20100145703A1 (en) 2005-02-25 2005-03-10 Portable Code Recognition Voice-Outputting Device
PCT/KR2005/000686 WO2006090944A1 (en) 2005-02-25 2005-03-10 Portable code recognition voice-outputting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050015735A KR100719776B1 (ko) 2005-02-25 2005-02-25 휴대형 코드인식 음성 합성출력장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR20-2005-0007433U Division KR200387914Y1 (ko) 2005-03-18 2005-03-18 휴대형 코드인식 음성 합성출력장치

Publications (2)

Publication Number Publication Date
KR20060094599A true KR20060094599A (ko) 2006-08-30
KR100719776B1 KR100719776B1 (ko) 2007-05-18

Family

ID=36927559

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050015735A KR100719776B1 (ko) 2005-02-25 2005-02-25 휴대형 코드인식 음성 합성출력장치

Country Status (5)

Country Link
US (1) US20100145703A1 (ko)
EP (1) EP1851754A4 (ko)
KR (1) KR100719776B1 (ko)
CN (1) CN101128863B (ko)
WO (1) WO2006090944A1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100968885B1 (ko) * 2008-04-17 2010-07-09 (주)토모텍 데이지 플레이어의 파싱 장치 및 그 방법
KR101108646B1 (ko) * 2010-08-31 2012-03-02 김민기 어린이용 시계
US11887581B2 (en) 2019-11-14 2024-01-30 Google Llc Automatic audio playback of displayed textual content

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AR058054A1 (es) * 2005-09-22 2008-01-23 Du Pont Utilizacion de liquidos ionicos para la separacion de hidrofluorocarburos
JP4810343B2 (ja) * 2006-07-20 2011-11-09 キヤノン株式会社 音声処理装置およびその制御方法
US7961851B2 (en) * 2006-07-26 2011-06-14 Cisco Technology, Inc. Method and system to select messages using voice commands and a telephone user interface
GB2468524A (en) * 2009-03-12 2010-09-15 Speaks4Me Ltd Image-to-Speech System
US8374864B2 (en) * 2010-03-17 2013-02-12 Cisco Technology, Inc. Correlation of transcribed text with corresponding audio
CN102339603A (zh) * 2010-07-23 2012-02-01 张文 通用数字语音直接交流机
CN102610250A (zh) * 2012-03-16 2012-07-25 深圳市福智软件技术有限公司 盲人用媒体播放装置
CN103871300A (zh) * 2012-12-13 2014-06-18 陈小磊 一种盲人文本阅读器
CN106446887A (zh) * 2016-11-07 2017-02-22 罗杰仁 一种将图片转换为语音的方法及装置
US11145311B2 (en) * 2017-08-02 2021-10-12 Panasonic Intellectual Property Management Co., Ltd. Information processing apparatus that transmits a speech signal to a speech recognition server triggered by an activation word other than defined activation words, speech recognition system including the information processing apparatus, and information processing method
CN110795007B (zh) * 2019-09-11 2023-12-26 深圳市联谛信息无障碍有限责任公司 一种获取截图信息的方法及装置
CN110970011A (zh) * 2019-11-27 2020-04-07 腾讯科技(深圳)有限公司 图片处理方法、装置、设备及计算机可读存储介质

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5901246A (en) * 1995-06-06 1999-05-04 Hoffberg; Steven M. Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
DE69327774T2 (de) * 1992-11-18 2000-06-21 Canon Information Syst Inc Prozessor zur Umwandlung von Daten in Sprache und Ablaufsteuerung hierzu
US5481712A (en) * 1993-04-06 1996-01-02 Cognex Corporation Method and apparatus for interactively generating a computer program for machine vision analysis of an object
US6947571B1 (en) * 1999-05-19 2005-09-20 Digimarc Corporation Cell phones with optical capabilities, and related applications
US6650761B1 (en) * 1999-05-19 2003-11-18 Digimarc Corporation Watermarked business cards and methods
US5920877A (en) * 1996-06-17 1999-07-06 Kolster; Page N. Text acquisition and organizing system
US5890152A (en) * 1996-09-09 1999-03-30 Seymour Alvin Rapaport Personal feedback browser for obtaining media files
US6539359B1 (en) * 1998-10-02 2003-03-25 Motorola, Inc. Markup language for interactive services and methods thereof
KR100360121B1 (ko) * 1999-03-29 2002-11-04 (주) 헤세드테크놀러지 디지털 음성재생장치
US6522769B1 (en) * 1999-05-19 2003-02-18 Digimarc Corporation Reconfiguring a watermark detector
US8055588B2 (en) * 1999-05-19 2011-11-08 Digimarc Corporation Digital media methods
CN1300018A (zh) * 1999-10-05 2001-06-20 株式会社东芝 书籍朗读电子机器,编辑系统,存储媒体,及信息提供系统
WO2001028222A2 (en) * 1999-10-12 2001-04-19 Perception Digital Technology (Bvi) Limited Digital multimedia jukebox
US6192340B1 (en) * 1999-10-19 2001-02-20 Max Abecassis Integration of music from a personal library with real-time information
WO2001052178A1 (en) * 2000-01-13 2001-07-19 Digimarc Corporation Authenticating metadata and embedding metadata in watermarks of media signals
US6513003B1 (en) * 2000-02-03 2003-01-28 Fair Disclosure Financial Network, Inc. System and method for integrated delivery of media and synchronized transcription
JP2001358602A (ja) * 2000-06-14 2001-12-26 Nec Corp 文字情報受信装置
FI115868B (fi) * 2000-06-30 2005-07-29 Nokia Corp Puhesynteesi
US6751593B2 (en) * 2000-06-30 2004-06-15 Fujitsu Limited Data processing system with block attribute-based vocalization mechanism
KR20000063774A (ko) * 2000-08-03 2000-11-06 백종관 음성합성을 이용하여 문자를 음성으로 변환하는 방법 및 그 단말기
US7292678B2 (en) * 2000-08-31 2007-11-06 Lamson Holdings Llc Voice activated, voice responsive product locator system, including product location method utilizing product bar code and aisle-situated, aisle-identifying bar code
US6901270B1 (en) * 2000-11-17 2005-05-31 Symbol Technologies, Inc. Apparatus and method for wireless communication
US6990444B2 (en) * 2001-01-17 2006-01-24 International Business Machines Corporation Methods, systems, and computer program products for securely transforming an audio stream to encoded text
US20020158129A1 (en) * 2001-03-15 2002-10-31 Ron Hu Picture changer with recording and playback capability
US6608618B2 (en) * 2001-06-20 2003-08-19 Leapfrog Enterprises, Inc. Interactive apparatus using print media
JP2003242280A (ja) * 2002-02-15 2003-08-29 Sony Corp コンテンツ提供システムとその方法、コンテンツ処理装置ならびにプログラム
US6965862B2 (en) * 2002-04-11 2005-11-15 Carroll King Schuller Reading machine
KR20040025435A (ko) * 2002-09-19 2004-03-24 에이디정보통신 주식회사 표시매체 및 표시매체를 제공하는 방법과 기계로 판독이가능한 디지털 코드이미지를 사람이 지각할 수 있는형태로 출력하는 장치 및 방법
US7324943B2 (en) * 2003-10-02 2008-01-29 Matsushita Electric Industrial Co., Ltd. Voice tagging, voice annotation, and speech recognition for portable devices with optional post processing
KR100608677B1 (ko) * 2003-12-17 2006-08-02 삼성전자주식회사 Tts탐색기능을 지원하는 방법 및 이를 이용한멀티미디어 장치
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US7629989B2 (en) * 2004-04-02 2009-12-08 K-Nfb Reading Technology, Inc. Reducing processing latency in optical character recognition for portable reading machine
CN1584874A (zh) * 2004-06-15 2005-02-23 汪兰珍 一种智能采集、语言互译、语音合成的方法及装置
US7774705B2 (en) * 2004-09-28 2010-08-10 Ricoh Company, Ltd. Interactive design process for creating stand-alone visual representations for media objects
US7675641B2 (en) * 2004-10-28 2010-03-09 Lexmark International, Inc. Method and device for converting scanned text to audio data via connection lines and lookup tables
US8694319B2 (en) * 2005-11-03 2014-04-08 International Business Machines Corporation Dynamic prosody adjustment for voice-rendering synthesized data
US20070260460A1 (en) * 2006-05-05 2007-11-08 Hyatt Edward C Method and system for announcing audio and video content to a user of a mobile radio terminal
JP4280272B2 (ja) * 2006-05-31 2009-06-17 株式会社東芝 情報処理装置
US8594387B2 (en) * 2007-04-23 2013-11-26 Intel-Ge Care Innovations Llc Text capture and presentation device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100968885B1 (ko) * 2008-04-17 2010-07-09 (주)토모텍 데이지 플레이어의 파싱 장치 및 그 방법
KR101108646B1 (ko) * 2010-08-31 2012-03-02 김민기 어린이용 시계
US11887581B2 (en) 2019-11-14 2024-01-30 Google Llc Automatic audio playback of displayed textual content

Also Published As

Publication number Publication date
EP1851754A4 (en) 2009-10-28
CN101128863A (zh) 2008-02-20
CN101128863B (zh) 2011-06-15
EP1851754A1 (en) 2007-11-07
US20100145703A1 (en) 2010-06-10
WO2006090944A1 (en) 2006-08-31
KR100719776B1 (ko) 2007-05-18

Similar Documents

Publication Publication Date Title
KR100719776B1 (ko) 휴대형 코드인식 음성 합성출력장치
KR20050122274A (ko) 휴대용 장치에서 텍스트 음성 변환 처리를 위한 시스템 및방법
KR20090044627A (ko) 사용자가 직접 컨텐츠를 생성하고 재생할 수 있는 지능형광학펜 및 그 동작방법
JP2006135967A (ja) サウンドを演奏及び記録できるピクチャフレームデバイス
KR200387914Y1 (ko) 휴대형 코드인식 음성 합성출력장치
JP2007249653A (ja) マークアップ言語情報の処理装置、情報処理方法、およびプログラム
KR100360121B1 (ko) 디지털 음성재생장치
WO2008108512A1 (en) User created contents toy and the method for operating the same
JP4149370B2 (ja) オーダー処理装置、オーダー処理方法、オーダー処理プログラム、オーダー処理プログラム記録媒体及びオーダー処理システム
WO1997034407A2 (en) Dictation device for the storage of speech signals
JP6422647B2 (ja) 二次元コード記録方法及び該二次元コードの読み取り装置
JP2000244611A (ja) バーコード読取装置およびバーコード表示体
KR100466520B1 (ko) 텍스트 데이터의 편집 및 재생 시스템
JP2001292204A (ja) 携帯電話機
JP4772631B2 (ja) 二次元コード音声化装置、二次元コード音声化方法およびプログラム
JP5248051B2 (ja) 電子機器
KR200342674Y1 (ko) 바코드를 이용한 음성재생서적
WO1994018667A1 (en) Voice recording electronic scheduler
JP3106896U (ja) イメージコード化電子ブックの構造
JP2002297170A (ja) 二次元コードエンコーダ、二次元コードのエンコード方法、二次元コード音声化装置、二次元コード音声化方法、テキスト文書音声化方法、プログラムおよびコンピュータ読み取り可能な記録媒体
CN1267888C (zh) 利用发音记述语言执行声音合成的终端设备
JPH09288500A (ja) 音声記録再生装置
KR100677215B1 (ko) 엠피3 플레이어의 음성 합성/인식 기능을 이용한 파일선택 방법
JPH05313684A (ja) 音声読書装置
JP2007135110A (ja) 画像形成装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130506

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140611

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee