KR20080028359A - 음성 정보 기록 장치 - Google Patents

음성 정보 기록 장치 Download PDF

Info

Publication number
KR20080028359A
KR20080028359A KR1020077027213A KR20077027213A KR20080028359A KR 20080028359 A KR20080028359 A KR 20080028359A KR 1020077027213 A KR1020077027213 A KR 1020077027213A KR 20077027213 A KR20077027213 A KR 20077027213A KR 20080028359 A KR20080028359 A KR 20080028359A
Authority
KR
South Korea
Prior art keywords
information
voice
dot pattern
dot
link
Prior art date
Application number
KR1020077027213A
Other languages
English (en)
Inventor
켄지 요시다
Original Assignee
켄지 요시다
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 켄지 요시다 filed Critical 켄지 요시다
Publication of KR20080028359A publication Critical patent/KR20080028359A/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K19/00Record carriers for use with machines and with at least a part designed to carry digital markings
    • G06K19/06Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B33/00Constructional parts, details or accessories not provided for in the other groups of this subclass
    • G11B33/10Indicating arrangements; Warning arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00403Voice input means, e.g. voice commands
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/17Card-like record carriers

Abstract

링크 테이블을 생성하고, 도트 패턴마다 음성 정보를 링크시켜 두고, 스캐너로 상기 도트 패턴을 읽어 들였을 때에, 해당 도트 패턴에 링크된 음성 정보를 스피커로부터 재생한다. 이에 의하여, 그림책이나 카드 등의 표면에 도트 패턴을 인쇄하여 두고, 그림책의 도안이나 이야기에 대응한 음성 정보를 재생하거나, 카드로 기재된 캐릭터에 대응한 음성 정보를 재생할 수 있다. 또한 링크 테이블에 의해, 새로운 도트 패턴에 새로운 음성 정보를 링크시키거나, 해제하거나 변경할 수 있다.
도트패턴, 음성 정보

Description

음성 정보 기록 장치{Audio Information Recording Device}
본 발명은, 인쇄물 등에 형성한 도트 패턴(dot pattern) 정보를 광학적으로 독취함으로써, 음성 정보를 출력시키는 도트 패턴을 이용한 정보 입출력 방법에 관한 것이다.
종래부터, 인쇄물 등에 인쇄된 바코드를 독취하고, 이 바코드에 대응하는 음성 등의 정보를 메모리(memory)로부터 읽어내어 출력시키는 정보 출력 방법이 제안되어 왔다. 예를 들어, 미리 기억 수단에 주어진 키 정보와 일치하는 정보를 기억시켜 두고, 바코드 리더로 읽은 키로부터 검색하여 정보 등을 출력하는 방법이 제안되어 있다. 또한, 다채로운 음성 정보를 출력할 수 있도록, 미세한 도트를 소정의 법칙으로 정렬한 도트 패턴을 생성하고, 인쇄물 등에 인쇄한 도트 패턴을 카메라에 의해 화상 데이터로서 수록하고, 디지털화하여 음성 정보를 출력시키는 기술도 제안되어 있다.
그러나, 상기 종래의 바코드에 의해 음성 등을 출력시키는 방법은, 인쇄물 등에 인쇄된 바코드가 눈에 거슬린다는 문제를 가지고 있었다. 또한, 바코드가 크고, 지면의 일부를 점유하기 때문에, 그처럼 바코드가 크면 일부분의 글이나 문장 또는 사진, 그림, 그래픽의 화상 속에 등장하는 의미를 갖는 캐릭터나 대상물마다 알기 쉽고 수많은 바코드를 할당한다는 것은 레이아웃(layout) 상 불가능하다는 문제를 안고 있었다.
또한, 바코드에 할당된 음성은 고정적이어서, 동일한 바코드를 읽어낼 경우에는 늘 동일한 음성 정보밖에 출력할 수 없었다.
본 발명은, 그러한 문제점을 해결하기 위해서 창안된 것이다. 즉, 본 발명의 목적은, 도트 패턴과 음성 정보와의 관계(link)를 유저(user)가 임의로 설정, 해제할 수 있는 구조를 제안함으로써, 임의의 도트 패턴에 링크된 음성 정보의 기록을 가능하게 하고, 아울러, 음성 정보와 도트 패턴과의 관계(link)의 설정, 해제를 가능하게 함으로써, 양자의 관계에 유연성을 갖도록 하고, 도트 패턴마다 다른 음성 정보를 링크시키거나, 복수의 다른 도트 패턴으로 동일한 음성 정보를 재생시킬 수 있는 음성 정보 기록 방식을 제공하는 것을 기술적 과제로 한다.
본 발명은, 상기 과제를 해결하기 위해, 이하의 수단을 채용했다.
본 발명의 청구항 1은, 음성 정보를 입력하는 음성 정보 입력 수단과, 입력된 음성 정보를 기억하는 기억 수단과, 미리 인쇄된 도트 패턴을 읽어내는 광학 독취 수단과, 광학 독취 수단으로 읽어낸 도트 패턴을 코드 정보 좌표 정보로 변환하는 변환 수단과, 상기 변환 수단에 의해 변환된 코드 정보 좌표 정보를 상기 음성 정보와 링크시키는 링크설정 지시수단과, 링크설정 지시 수단에 의해 링크된 코드 정보 좌표 정보와 상기 음성 정보의 링크관계를 등록하는 링크 테이블과, 상기 광학 독취 수단으로 재차 도트 패턴을 읽어낸 뒤에, 상기 링크 테이블에 링크된 상기 음성 정보를 상기 기억 수단으로부터 읽어내 출력하는 음성 정보 재생 수단으로 구성되는 음성 정보 기록 장치이다.
이 음성 정보 기록 장치에 의하면, 도트 패턴마다 음성 정보를 링크시키고, 광학 독취 수단으로 상기 도트 패턴을 읽어냈을 때, 해당 도트 패턴에 링크된 음성 정보를 음성 정보 재생 수단으로부터 출력할 수 있다. 이에 따라, 그림책이나 카드 등의 표면에 도트 패턴을 인쇄해 두고, 그림책의 도안이나 이야기에 대응한 음성 정보를 재생하거나, 카드에 기재된 캐릭터에 대응한 음성 정보를 재생할 수 있다. 또한 링크설저 지시 수단에 의해, 새로운 도트 패턴에 음성 정보를 새로이 링크시키거나, 해제하거나 변경할 수 있다.
한편, 도트 패턴은, 상기 그림책이나 카드 외에, 명함, 수첩, 씰(seal) 등 어떠한 매체에 설정된 것이라도 무방하다.
또한, 도트 패턴은 기억 수단에 기억된 음성 정보에 대응하는 코드 정보라도 되며, 좌표 정보라도 무방하다. 코드 정보인 경우에는, 코드 정보에 대응한 어드레스(address)에 기록된 음성 정보를 재생할 수가 있고, 좌표 정보의 경우에는, 광학 독취 수단이 읽어낸 위치(좌표 정보)에 대응한 음성 정보를 재생할 수 있다.
본 발명의 청구항 2는, 상기 링크 테이블은, 1개의 음성 정보에 대하여, 복수의 코드 정보 좌표 정보를 링크시킨 것을 특징으로 하는 청구항 1에 기재한 음성 정보 기록 장치이다.
이와 같이 1개의 음성 정보를 복수의 도트 패턴에 링크시킴으로써, 도트 패턴이 다른 복수의 카드를 광학 독취 수단으로 읽어낼 경우에도 동일한 음성 정보를 재생시킬 수 있다.
본 발명의 청구항 3은, 상기 음성 정보를 기억하는 기억 수단은, 카드 기억 매체인 것을 특징으로 하는 청구항 1 기재의 음성 정보 기록 장치이다.
해당 음성 정보 기록 장치에 착탈 자재한 카드 기억 매체를 장착함으로써, 카드 기억 매체마다 다른 음성 정보를 재생할 수 있다. 또한, 이 카드 기억 매체마다 조합(照合) 테이블과 조합 코드를 설치해 둠으로써, 음성 정보의 재생 조건을 카드 기억 매체마다 변경할 수 있다. 구체적으로는 기업마다, 게임마다 서로 다른 조합 코드를 설정해 두고, 도트 패턴에 등록된 해당 조합 코드가 맞는지 아닌지로 음성 정보의 재생 허가, 불허가를 판정하도록 하는 사양으로 할 수도 있다.
본 발명의 청구항 4는, 적어도, 상기 음성 정보의 입력 개시와, 음성 정보의 입력 종료와, 음성 정보의 재생과, 재생의 정지를 지시하기 위해, 상기 광학 독취 수단으로 독취 가능한 도트 패턴이 인쇄된 인쇄 매체를 장치본체와는 별체로 갖는 청구항 1 기재의 음성 정보 기록 장치이다.
음성 정보의 입력 개시 등의 지시 입력을 도트 패턴의 독취로 수행함으로써, 하드웨어 스위치로 이들을 수행할 경우와 비교하여 시각적이고 또한 직감적으로 음성 정보 기록 장치를 조작할 수 있게 된다.
본 발명의 청구항 5는, 상기 코드 정보 좌표 정보와 상기 음성 정보와의 링크설정, 또는 링크설정의 해제를 지시하는 상기 링크설정 지시 수단으로서, 상기 광학 독취 수단으로 독취 가능한 도트 패턴이 인쇄된 인쇄 매체를 장치 본체와는 별체(別體)로 갖는 청구항 3 기재의 음성 정보 기록 장치이다.
이러한 도트 패턴이 인쇄된 인쇄 매체(소위 paper controller)를 이용하여 음성 정보 기록 장치를 구성함으로써, 인쇄 부분을 눈으로 봄으로써 음성 정보 기록 장치의 가시적인 오퍼레이션이 가능하게 된다.
본 발명의 청구항 6은, 상기 도트 패턴은 상기 매체면과 상기 광학 독취 수단과의 위치 관계에 따라 방향을 갖는 도트 패턴에 있어서, 상기 광학 독취 수단으로 촬영한 도트 패턴이 화소군으로서 격납되는 화상 기억 영역에 있어서, 그곳에 격납된 화소군에 기초한 XY좌표의 X정방향 또는 Y정방향과, 도트 패턴의 방향이 이루는 각도를 계산하는 수단을 구비하고, 상기 코드 정보 좌표 정보에 더하여 각도 정보마다 다른 상기 음성 정보를 기억 재생 가능하게 하는 수단을 갖는 청구항 1~5에 기재한 음성 정보 기록 장치이다.
도트 패턴은 매체면과 상기 광학 독취 수단과의 위치 관계에 의하여 방향을 가지기 때문에, 이에 착안하여 방향마다 다른 음성 정보를 출력시키도록 한 것이다.
본 발명에 따르면, 임의의 도트 패턴에 링크된 음성 정보의 기록이 가능하고, 또한 음성 정보와 도트 패턴과의 관계(link)의 설정 해제를 가능하게 함으로써, 양자의 관계에 유연성을 갖도록 하고, 도트 패턴마다 다른 음성 정보를 링크 시키거나, 복수의 다른 도트 패턴으로 동일한 음성 정보를 재생시킬 수 있는 음성 정보 기록 방식을 제공할 수 있다.
도 1은, 음성 레코더의 정면도(1).
도 2는, 음성 레코더의 좌측면도.
도 3은, 음성 레코더의 우측면도.
도 4는, 음성 레코더의 사용 상태를 나타내는 설명도.
도 5는, 음성 레코더의 내부 구성 블럭도.
도 6은, 지시 보드의 심볼의 배치 상태를 나타내는 도면.
도 7은, 음성 파일 포맷을 나타내는 도면.
도 8은, 조합 테이블, 조합 코드의 설명도.
도 9는, 음성 레코더의 정면도(2).
도 10은, 링크 테이블의 설명도.
도 11은, 메모리 카드를 나타내는 도면.
도 12는, 도트 패턴을 설명하기 위한 도(1).
도 13은, 도트 패턴을 설명하기 위한 도(2).
도 14는, 도트 패턴을 설명하기 위한 도(3).
도 15는, 도트 패턴을 설명하기 위한 도(4).
도 16은, 도트 패턴을 설명하기 위한 도(5).
도 17은, 도트 패턴을 설명하기 위한 도(6).
도 18은, 메모리 카드로서 SD카드를 사용한 상태를 설명하기 위한 도면.
도 19는, 음성 레코더의 다른 실시 형태에 대해 설명하기 위한 도면.
도 20은, 각도를 검출하는 기능을 갖는 음성 레코더에 대해 설명하기 위한 도면.
도 21은, 도 20에 있어서 사용되는 지시 보드의 심볼의 배치 상태를 나타내는 도면.
도 22는, 녹음 링크 처리를 나타내는 플로차트(1).
도 23은, 녹음 링크 처리를 나타내는 플로차트(2).
도 24는, 링크가 완료된 음성을 재생하는 처리를 나타내는 플로차트.
도 25는, 각도를 검출하는 방법에 대해 설명하기 위한 도(1).
도 26은, 음성 결정 테이블에 대해 설명하기 위한 도면.
도 27은, 각도를 검출하는 방법에 대해 설명하기 위한 도(2).
도 28은, 각도를 검출하는 기능을 갖는 음성 레코더의, 다른 실시 형태에 대해 설명하기 위한 도(1).
도 29는, 각도를 검출하는 기능을 갖는 음성 레코더의, 다른 실시 형태에 대해 설명하기 위한 도(2).
도 30은, 각도를 검출하는 기능을 갖는 음성 레코더의, 다른 실시 형태에 대해 설명하기 위한 도(3).
도 31은, 본 발명의 다른 실시 형태에 대해 설명하기 위한 도면.
도 32는, 도 31의 실시예에 있어서 사용되는 지시 보드의 심볼의 배치 상태를 나타내는 도면.
도 33은, 본 발명의 하나의 실시 형태인 음성 메일 시스템에 있어서의 네트워크 구성도.
도 34는, 음성 메일 시스템에 있어서 사용하는 페이퍼 컨트롤러의 심볼의 배 치 상태를 나타내는 도면.
도 35는, 음성 메일 데이터베이스에 대해 설명하기 위한 도면.
도 36은, 음성 메일을 송수신 하는 처리를 나타내는 플로차트.
도 37은, 음성 메일의 송수신에 대해 설명하기 위한 도면.
도 38은, 음성 메일 시스템의 하나의 실시예인 음성 메일 매니저에 대해 설명하기 위한 도면.
도 39는, 음성 메일 매니저에 있어서 사용하는 페이퍼 컨트롤러의 심볼의 배치 상태를 나타내는 도면.
도 40은, 본 발명의 하나의 실시 형태인 음성인식 데이터 통신에 의한 기기 제어에 대해 설명하기 위한 도면.
도 41은, 기기 제어에 있어서 사용하는 페이퍼 컨트롤러의 심볼의 배치 상태를 나타내는 도면.
<부호의 설명>
1 : 도트 패턴 2 : 키 도트
3 : 정보 도트 4 : 격자 도트
101, 1901, 3101 : 음성 레코더 102, 1902, 3102 : 스피커
103 : 녹음 정지 버튼 104 : 녹음 재생 표시부
105 : 링크 표시부 106 : 메모리 카드
107 : 마이크 108 : 전원 스위치
109 : 볼륨 110 : 커넥터 단자
111 : 음성 출력 단자 112 : 외부 전원 단자
113 : 스캐너(광학 독취 수단) 114 : 케이블
115 : USB 커넥터 116 : 사진
600 : 지시 보드 701 : 인덱스
702 : 음성 파일 트랙 1903 : 센서 유니트
1904, 3104 : 스캔 버튼 1905 : 녹음 버튼
1906 : 볼륨 1907 : LED
1908, 2004, 3108 : 마이크 2001 : 대좌(臺座)
2002 : 스테이지 2003 : 피규어(figure)
2005 : 액정 표시부 2006, 3200 : 페이퍼 컨트롤러
2801 : 컴퓨터 3105 : 녹음 버튼
3109 : 안테나
도 1은, 본 발명의 실시 형태인 음성 레코더(음성 정보 기록 장치)의 정면도이며, 도 2는 우측면도, 도 3은 좌측면도이다.
음성 레코더(101)에는, 하우징(광체) 표면에 스피커(102)가 설치되어 있고, 음성 정보의 재생 출력이 가능하게 되어 있다. 스피커(102)의 상방에는, 녹음 정지 버튼(103), 녹음재생 표시부(104), 링크 표시부(105), 좌상방에는 음성 정보 입력용의 마이크(107)가 설치되어 있다.
음성 레코더(101)의 하우징 표면에는 도 9에 나타낸 것 같은 액정화면(901) 을 설치해도 된다. 이 액정화면(901)에는, 녹음 상태, 재생 상태, 정지상태, 링크 상태, 녹음 재생 트랙 번호 등을 표시할 수 있다.
음성 레코더(101)의 우측면에는, 전원 스위치(108)과 볼륨(109)이 배치되고 있고, 음성 레코더(101)의 전원 투입과 스피커(102)로부터 재생되는 음성 정보의 음량 조절이 가능하게 되어 있다.
음성 레코더(101)의 좌측면에는, 커넥터 단자(SCANNER)(110), 음성 출력 단자(PHONE)(111) 및 외부 전원 단자(DC IN)(112)가 설치되어 있다. 커넥터 단자(110)는, 예를 들어 USB 단자 등의 범용 시리얼 인터페이스이며, 도 4에 나타내는 바와 같이 스캐너(113)(광학 독취 수단)의 케이블(114)의 단부(端部)에 설치된 USB 커넥터(115)가 장착되도록 되어 있다.
스캐너(113)에는, 도 5에 나타내는 바와 같이, CMOS 촬상 소자(CMOS)가 배치되고 있고, LED(IRLED)로부터의 조사광을 도트 패턴의 인쇄면에 조사되고, 그 반사광이 가시광선 필터(도시하지 않음)를 개재하여 적외선 영역만의 파장광으로서 수광하고, 이것이 렌즈를 개재하여 CMOS 촬상 소자에 의해 촬영되고, 해당 촬영 화상이 중앙처리장치(MPU)에 의해 해석되고, 해석 결과의 코드 정보(32 bit의 도트 코드) 또는 좌표 정보로서 음성 레코더(101)에 송신된다. 한편, 이 때 도트 패턴에는 키 도트(2)(도 12 및 도 14 참조)가 배치되어 도트 패턴을 구성하는 블록의 방향(각도)도 각도 정보로서 수신할 수 있게 되어 있다.
즉, 도트 패턴의 촬영 화상을 비디오 메모리에 전개함으로써, 각 도트의 XY 좌표치를 알 수 있으므로, 이를 바탕으로 격자 도트와 키 도트를 탐색함으로써 해 당 도트 패턴의 방향(비디오 메모리의 정 XY 좌표축에 대한 도트 패턴의 각도)을 검출할 수 있다.
한편, 스캐너 내에는 해석 소프트웨어가 ROM 등에 격납되고 있으며, MPU는 해당 ROM로부터 해당 소프트웨어를 읽어 들임으로써 촬영 화상의 해석 처리(도트 패턴의 인식→수치 변환→도트 코드, 좌표 정보, 각도 정보로 변환)를 실행한다.
음성 레코더(101) 본체 내부는, 도 5에 나타내는 바와 같이, MPU를 중심으로 구성되어 있다. 즉, MPU의 제어에 의해, 마이크로부터 입력된 음성 정보는, 앰프를 개재하여 A/D 컨버터, 압축 회로에 의해 처리되고, 디지털 음성 정보로서, 커넥터를 개재하여 메모리 카드(106)(기억 수단)에 기록된다.
이 메모리 카드(106)의 외관을 나타낸 것이 도 11이다. 이 메모리 카드(106)는, 예를 들어 메모리로서의 IC 칩을 내장한 크레디트 카드 사이즈의 플라스틱 체크 카드로서, 신호 핀, 전원 핀을 구성하는 접촉형 전극(106a)을 갖고 있다. 한편, 비접촉의 무선통신형인 RFID 카드라도 된다. 또한, 이와 같은 카드 이외에, SD카드(상표명), 미니 SD카드(상표명), 메모리 스틱(상표명), 메모리 스틱 듀오(상표명) 등의 규격형 메모리 카드라도 된다.
해당 음성 레코더(101)에 있어서, 음성 정보를 재생할 때에는, 메모리 카드(106)(기억 수단)로부터 읽어낸 디지털 음성 정보는, 커넥터를 개재하여 MPU에 읽어들여, 압축 회로에서 역압축(전개)되고, A/D 컨버터에서 아날로그 정보로 변환되어 앰프(AMP)를 통해 스피커로부터 출력된다.
음성 레코더(101)의 구동 전류는, 전지로부터 DC-DC 컨버터를 개재하여, MPU, 압축 회로, 앰프(AMP)로 공급하도록 되어 있다.
도 6은, 음성 레코더(101)의 조작 지시를 스캐너(113)의 독취를 수행하기 위한 지시 보드(600)(페이퍼 컨트롤러:인쇄 매체)이다. 이 지시 보드(600)는, 음성 레코더(101)의 조작 지시를 나타내는 심볼이 인쇄되어 있다. 이 심볼 영역에는 조작 지시에 대응한 코드를 의미하는 도트 패턴이 인쇄되어 있다. 도트 패턴에 대해서는 후술 한다.
이 지시 보드(600)는 종이재질로 구성되고, 종이재질의 표면에 도트 패턴이 인쇄되고, 그 상층에 라미네이트 가공이 되어 있다.
지시 보드(600) 상에는, 녹음(601), 음성 품질(602a~602c), 재생(604), 빨리 감기(605), 정지(606), 일시정지(619), 되감기 재생(607), 감기 재생(608), 선두 재생(609), 후미 재생(610)이 설치되어 있어 음성 레코더(101)에서의 각각의 기능을 명령할 수 있도록 되어 있다.
또한, 지시 보드(600)의 하부에는, 링크 관련의 지시 심볼이 인쇄되어 있다. 즉, 링크 개시(611), 링크 종료(612), 링크 해제(613), 전(全) 링크 해제(614)의 각 지시 심볼이 배치되어 있다.
또한, 지시 보드(600)의 최하부에는, 음성 소거(615), 전음성(全音聲) 소거(616)의 각 지시 심볼과 실행(617), 중지(618)의 각 지시 심볼이 배치되어 있다.
한편, 도시는 하지 않았으나, 기타의 지시 보드(600)에는, 음성 네비게이션의 심볼을 인쇄해도 된다. 이 음성 네비게이션은, 음성 레코더(101)나 지시 보드(600)를 조작할 때의 음성 가이던스의 유무를 지시 입력하기 위한 심볼이다.
도 7은, 기억 수단(메모리 카드)에 기록되는 음성 정보의 포맷을 나타내고 있다. 음성 정보는, 인덱스(701)와, 복수의 음성 파일 트랙(702)으로 구성되어 있다.
인덱스(701)에는, 트랙마다의 관리 정보와 재생 플래그가 등록되도록 되어 있다.
또한, 인덱스(701)는 각 음성 파일 트랙(702)의 음성 정보의 소거 갱신의 금지 정보가 기록되어 있고, 이에 따라 음성 파일 트랙은 소거 갱신이 가능한 트랙과 소거 갱신이 금지되어 있는 트랙의 2 종류로 나누어 관리할 수 있도록 되어 있다.
예를 들어, 소거 갱신을 금지하는 트랙으로서는, 음성 레코더(101)나 지시 보드(600)의 다음 조작을 음성으로 지시하는 네비게이션 음성 파일이 격납된 트랙이나, 그림책 등과 세트로 판매된 메모리 카드(106)로서 미리 그림책의 스토리에 따라 성우가 음성을 기록하고 있는 트랙 등을 고려할 수 있다. 한편, 소거 갱신이 가능한 트랙에는, 구입한 유저가 그림책의 등장인물이 되어 발성하는 대사 등을 입력해 둘 수 있다.
또한, 소거 갱신을 금지하는 트랙에는, 상술한 음성 네비게이션의 가이던스 음성 등을 등록해 두어도 된다.
도 8은, 기억 수단(메모리 카드)에 설치된 조합 테이블 및 조합 코드를 나타내고 있다.
동도에 나타내는 바와 같이, 본 실시 형태에서의 조합 테이블은 C8~C22, C31의 값을 조합 범위로서 설정하고 있으며, 이 범위에 존재하는 조합 코드가 도트 패 턴으로부터 읽어낸 조합 코드와 일치하는 경우에는, 해당 도트 패턴이 해당 음성 레코더에 적합한 것으로서 음성 정보의 재생을 허가한다.
한편, 조합 테이블은 임의로 변경이 가능하고, 예를 들어 해당 음성 레코더의 메이커마다, 메모리 카드의 메이커마다, 게임의 종류마다 조합 테이블의 조합 범위를 변경해도 된다.
이와 같은 조합 테이블, 조합 코드를 메모리 카드(106)에 등록해 두면, 해당 조합 코드와 동일한 코드가 도트 패턴으로서 인쇄되어 있는 그림책에서밖에 음성 정보의 녹음 재생을 할 수 없도록 할 수 있다. 즉, 세트로 판매되고 있는 그림책과 메모리 카드(106)와의 조합이 아니면 음성 녹음 재생을 할 수 없는 구조를 제공할 수 있다.
이 때, MPU는 스캐너(113)가 읽어 들인 도트 패턴을 바탕으로, 소정 영역의 도트 코드(조합 코드)를 스캐너(113)로부터 수신하고, 이를 메모리 카드(106)의 조합 코드와 비교하여 일치하면 메모리 카드(106) 내의 음성 정보의 녹음 재생을 허가한다.
도 10은, 링크 테이블에 대해 설명한 것으로서, 해당 링크 테이블은 메모리 카드(106)에 설치되어 있다. 링크 테이블은, 동 도에 나타내는 바와 같이, 등록순서를 나타내는 라벨과, 음성 파일 트랙 번호와, 32bit의 도트 코드로 구성되어 있다. 본 실시 형태에 있어서, 1개의 음성 파일 트랙 번호에 대하여 복수의 도트 코드를 링크 시킬 수 있도록 되어 있다. 이에 따라, 서로 다른 다수의 도트 패턴이 인쇄된 사진, 씰, 그림책 등의 매체를 스캐너(113)로 읽어냈을 경우에 동일한 음성 정보를 재생시킬 수 있다.
다음에, 본 실시 형태에서 사용되는 도트 패턴에 대해 설명한다.
도 12는 본 발명의 도트 패턴의 한 예인 GRID1을 나타내는 설명도이다. 도 13은 도트 패턴의 정보 도트 및 여기에 정의된 데이터의 비트 표시의 한 예를 나타내는 확대도이다. 도 14(a), (b)는 키 도트를 중심으로 배치한 정보 도트를 나타내는 설명도이다.
본 발명의 도트 패턴을 사용한 정보 입출력 방법은, 도트 패턴(1)의 생성과, 그 도트 패턴(1)의 인식과, 이 도트 패턴(1)으로부터 정보 및 프로그램을 출력하는 수단으로 구성된다. 즉, 도트 패턴(1)을 카메라에 의해 화상 데이터로서 읽어 들이고, 우선, 격자 도트를 추출하고, 다음에 본래 격자 도트가 있는 위치에 도트가 없는 것으로부터 키 도트(2)를 추출하고, 다음에 정보 도트(3)를 추출함으로써, 디지털화하여 정보 영역을 추출하여 정보의 수치화를 도모하고, 이 수치 정보에 의해, 이 도트 패턴(1)으로부터 음성 정보를 출력시킨다.
본 발명의 도트 패턴(1)의 생성은, 도트 코드 생성 알고리즘에 의해, 음성 등의 정보를 인식시키기 위해 미세한 도트, 즉, 키 도트(2), 정보 도트(3), 격자 도트(4)를 소정의 규칙에 따라 배열한다. 도 12에 나타내는 바와 같이, 정보를 나타내는 도트 패턴(1)의 블록은, 키 도트(2)를 중심으로 5×5의 격자 도트(4)를 배치하고, 4점의 격자 도트(4)에 둘러싸인 중심의 가상점의 주위에 정보 도트(3)를 배치한다. 이 블록에는 임의의 수치 정보가 정의된다. 한편, 도 12의 도시예에서는, 도트 패턴(1)의 블록(굵은 선의 테두리 내)을 4개 병렬시킨 상태를 나타내고 있다. 다만, 도트 패턴(1)은 4 블록으로 한정되지 않는 것은 물론이다.
1개의 블록에 1개의 대응 정보를 출력시키거나, 또는, 복수의 블록에 1개의 대응 정보를 출력시킬 수 있다.
격자 도트(4)는, 카메라로 이 도트 패턴(1)을 화상 데이터로서 읽어 들일때, 카메라 렌즈의 왜곡이나 비스듬한 촬상, 지면의 신축, 매체 표면의 만곡, 인쇄 시의 일그러짐을 교정할 수 있다. 구체적으로는 일그러진 4점의 격자 도트(4)를 본래의 정방형으로 변환하는 보정용의 함수(Xn, Yn)=f(X′n, Y′n)를 구하고, 이와 동일한 함수로 정보 도트를 보정하여, 올바른 정보 도트(3)의 벡터를 구한다.
도트 패턴(1)에 격자 도트(4)를 배치하고 있으면, 이 도트 패턴(1)을 카메라로 읽어 들인 화상 데이터는, 카메라가 원인이 되는 일그러짐을 보정함으로써, 왜곡율이 높은 렌즈를 부착한 보급형 카메라로도 도트 패턴(1)의 화상 데이터를 읽어 들일 때 정확하게 인식할 수 있다. 또한, 도트 패턴(1)의 면에 대하여 카메라를 비스듬히 하여 읽어내더라도, 그 도트 패턴(1)을 정확하게 인식할 수 있다.
키 도트(2)는, 도 12에 나타내는 바와 같이, 직사각형 모양으로 배치한 격자 도트(4)의 실질적으로 중심 위치에 있는 1개의 격자 도트(4)를 일정 방향으로 어긋나게 배치한 도트이다. 이 키 도트(2)는, 정보 도트(3)를 나타내는 1 블록 분의 도트 패턴(1)의 대표점이다. 예를 들어, 도트 패턴(1)의 블록 중심의 격자 도트(4)를 상방으로 0.01mm 벗어나게 한 것이다. 정보 도트(3)가 X, Y 좌표치를 나타내는 경우에, 키 도트(2)를 하방으로 0.1mm 벗어나게 한 위치가 좌표점이 된다. 다만, 이 수치는 이에 한정되지 않고, 도트 패턴(1) 블록의 대소에 대응해 변할 수 있다.
정보 도트(3)는 여러 가지 정보를 인식시키는 도트이다. 이 정보 도트(3)는, 키 도트(2)를 대표점으로 하고, 그 주변에 배치함과 동시에, 4점의 격자 도트(4)로 둘러싸인 중심을 가상점으로 하고, 이를 시점으로 하여 벡터에 의해 표현된 종점에 배치한 것이다. 예를 들어, 이 정보 도트(3)는, 격자 도트(4)로 둘러싸이고, 도 13에 나타내는 바와 같이, 그 가상점으로부터 0.1mm 벗어난 도트는, 벡터로 표현되는 방향과 길이를 가지기 때문에, 시계 방향으로 45도씩 회전시켜 8 방향으로 배치하고, 3 비트를 표현한다. 따라서, 1 블록의 도트 패턴(1)으로 3 비트×16개=48 비트를 표현할 수 있다.
도시한 예에서는 8 방향으로 배치하여 3 비트를 표현하고 있으나, 이에 한정되지 않고, 16 방향으로 배치하여 4 비트를 표현할 수도 있으며, 여러 가지 변경을 할 수 있는 것은 물론이다.
키 도트(2), 정보 도트(3) 또는 격자 도트(4)의 도트의 직경은, 외관과 종이 질에 대한 인쇄의 정밀도, 카메라의 해상도 및 최적의 디지털화를 고려하여, 0.05mm 정도가 바람직하다.
또한, 촬상면적에 대한 필요한 정보량과, 각종 도트(2), (3), (4)의 오인을 고려하여 격자 도트(4)의 간격은 세로 및 가로 0.5mm 전후가 바람직하다. 격자 도트(4) 및 정보 도트(3)와의 오인을 고려하여, 키 도트(2)의 어긋남은 격자 간격의 20% 전후가 바람직하다.
이 정보 도트(3)와, 4점의 격자 도트(4)로 둘러싸인 가상점과의 간격은, 인접하는 가상점 사이의 거리의 15~30% 정도의 간격인 것이 바람직하다. 정보 도 트(3)와 가상점 사이의 거리가 그 간격보다 멀면 도트끼리가 큰 덩어리로 시인(視認)되기 쉬워, 도트 패턴(1)으로서 보기 어려워지기 때문이다. 반대로, 정보 도트(3)와 가상점 사이의 거리가 그 간격보다 가까우면 인접하는 어느 가상점을 중심으로 벡터 방향성을 갖도록 한 정보 도트(3)인가를 인정하는 것이 곤란하게 되기 때문이다.
예를 들어, 정보 도트(3)은, 도 14(a)에 나타내는 바와 같이, 키 도트(2)를 중심으로 시계방향으로 I1로부터 I16을 배치하는, 격자 간격은 0.5mm이며, 4 mm×4 mm로서 3 비트×16=48 비트를 표현한다.
한편, 블록 내에, 개개로 독립한 정보 내용을 갖고, 또한 다른 정보 내용에 영향을 받지 않는 서브 블록을 또한 설치할 수 있다. 도 14(b)는 이를 도시한 것으로서, 4개의 정보 도트로 구성되는 서브 블록[I1, I2, I3, I4],[I5, I6, I7, I8],[I9, I10, I11, I12],[I13, I14, I15, I16]은 각각 독립한 데이터(3 비트×4=12 비트)가 정보 도트로 전개되도록 되어 있다. 이와 같이 서브 블록을 설치함으로써, 에러 체크를 서브 블록 단위로 용이하게 수행할 수 있다.
정보 도트(3)의 벡터 방향(회전 방향)은, 30도~90도마다 균등하게 설정하는 것이 바람직하다.
도 15는 정보 도트 및 정보 도트에 정의된 데이터의 비트 표시의 예의 다른 형태를 나타내는 것이다.
또한, 정보 도트(3)에 대해 격자 도트(4)로 둘러싸인 가상점으로부터 장단의 2 종류를 사용하여, 벡터 방향을 8 방향으로 하면, 4 비트를 표현할 수 있다. 이 때, 긴 쪽이 인접하는 가상점 사이의 거리는 25~30% 정도, 짧은 쪽은 15~20% 정도가 바람직하다. 다만, 장단 정보 도트(3)의 중심 간격은, 이들 도트의 직경보다 길어지는 것이 바람직하다.
4점의 격자 도트(4)로 둘러싸인 정보 도트(3)는, 외관을 고려하여, 1 도트가 바람직하다. 그러나, 외관을 무시하고, 정보량을 늘리고 싶은 경우에는, 1 벡터마다 1 비트를 할당해 정보 도트(3)를 복수 도트로 표현함으로써, 다량의 정보를 갖도록 할 수 있다. 예를 들어, 동심원(8) 방향의 벡터에서는, 4점의 격자 도트(4)에 둘러싸인 정보 도트(3)로 28의 정보를 표현할 수 있고, 1 블록의 정보 도트 16개로 2128이 된다.
도 16은 정보 도트 및 정보 도트에 정의된 데이터의 비트 표시의 예로서, (a)는 도트를 2개, (b)는 도트를 4개, (c)는 도트를 5개 배치한 것을 나타낸 것이다.
도 17은 도트 패턴의 변형예를 나타내는 것으로서, (a)는 정보 도트 6개 배치형, (b)는 정보 도트 9개 배치형, (c)는 정보 도트 12개 배치형, (d)는 정보 도트 36개 배치형의 개략도이다.
도 12와 도 14에 나타내는 도트 패턴(1)은, 1 블록에 16(4×4)의 정보 도트(3)를 배치한 예를 나타내고 있다. 그러나, 이 정보 도트(3)는 1 블록에 16개 배치하는 데 한정되지 않고, 여러 가지로 변경할 수 있다. 예를 들어, 필요로 하는 정보량의 대소 또는 카메라의 해상도에 대응해, 정보 도트(3)를 1 블록에 6개(2×3) 배치한 것 (a), 정보 도트(3)를 1 블록에 9개(3×3) 배치한 것 (b), 정보 도트(3)를 1 블록에 12개(3×4) 배치한 것 (c), 또는 정보 도트(3)를 1 블록에 36개(6×6) 배치한 것 (d)이 있다.
이러한 도트 패턴은, 사진(116)(도 4 참조)이나, 그림책, 카드 등의 표면에 인쇄되어 있다. 또한, 도 6에서 설명한 지시 보드(600)(페이퍼 컨트롤러)의 각 심볼 부분에도 설치되어 있다.
다음에, 본 실시 형태의 음성 레코더(101)를 사용한 조작 순서에 대해 설명한다.
(기본 기능)
도트 패턴이 그림과 중첩 인쇄된 그림책과, 녹음이 완료된 메모리 카드(106)가 세트로 판매되고 있으며, 이를 구입한 유저는, 메모리 카드(106)를 음성 레코더(101)에 장착한다. 그리고, 도 4에 나타내는 바와 같이, 스캐너(113)의 커넥터(115)를 커넥터 단자(110)에 장착한다. 그리고, 예를 들면 그림책의 개의 그림에 중첩 인쇄되어 있는 도트 패턴을 스캐너(113)가 독취하면, 스캐너의 MPU는 해당 도트 패턴을 해석 소프트웨어에 의해 해석하고, 도트 코드(코드 정보)로 변환한다. 이 도트 코드는 음성 레코더(101)의 MPU에 송신된다. 음성 레코더(101)에서는, 해당 도트 코드를 바탕으로 메모리 카드(106)의 링크 테이블(도 10 참조)을 검색한다. 그리고, 이 도트 코드에 대응하는 음성 파일 트랙(702)을 검출하여, 메모리 카드(106) 내의 해당하는 음성 파일 트랙(702)(예를 들어, 개의 울음소리)을 읽어낸 다. 이 음성 파일 트랙(702)의 음성 정보는, 압축 회로로 역압축(전개)되어, A/D 컨버터에서 아날로그 음성 정보로 변환되어, 앰프(AMP)를 통해 스피커에서 출력된다. 이와 같이 하여, 그림책의 개의 그림 부분을 스캐너(113)로 읽어내면, 음성 레코더(101)의 스피커(102)로부터 개의 울음소리가 재생된다.
(재생 순서)
다음에, 미리 메모리 카드(106) 내에, 도트 패턴에 음성 정보가 링크된 경우의 여러 가지의 재생 방법에 대해 자세하게 설명한다.
우선, 스캐너로 도트 패턴이 인쇄된 그림책, 사진, 씰 등을 클릭(촬상)하면, 상기와 같이 도트 패턴에 대응한 도트 코드가 해석되고, 링크 테이블이 참조되어, 해당 도트 코드에 대응하는 음성 정보가 재생된다. 이 때, MPU는, 음성 정보의 재생과 함께, 녹음재생 표시부의 LED를 점등 시킨다.
다음에, 음성 재생 중에, 스캐너(113)로 지시 보드(600)의 빨리 감기(605)의 심볼이 클릭(촬상)되면, 빨리 감기 재생(x배속 재생:x는 임의의 정수)이 실행된다.
여기서 재생 속도를 원래의 상태로 돌리기를 원하는 경우(통상 음성 재생)에는, 지시 보드(600)의 빨리 감기(605) 심볼을 다시 클릭하든지, 재생(604) 심볼을 클릭한다.
또한, 음성 재생 중에, 스캐너(113)에서 지시 보드(600)의 일시정지(619)의 심볼이 클릭되면, 재생이 일시정지(포즈 상태)가 된다. 다시 일시정지(619) 심볼이 클릭되면 재생이 재개된다.
또한, 음성 재생 중에, 감기 재생(608)이 클릭되면, MPU는 메모리 카드(106) 내의 링크 테이블(도 10 참조)을 검색하고, 현재 재생하고 있는 음성 파일 트랙(702)의 다음의 라벨(등록순서)에 등록되어 있는 음성 파일 트랙(702)의 재생을 개시한다. 또한, 되감기 재생(607)이 클릭되면, MPU는, 링크 테이블(도 10 참조)을 검색하여, 현재 재생하고 있는 음성 파일 트랙(702)의 전의 라벨(등록순서)에 등록되어 있는 음성 파일 트랙(702)의 재생을 개시한다.
또한, 음성 재생 중에, 후미 재생(610)이 클릭되면, MPU는, 메모리 카드(106) 내의 링크 테이블(도 10 참조)을 검색하여, 음성 파일 트랙(702) 최후 트랙(도 10에서는 음성 파일 트랙 No. 4)의 재생을 개시한다. 또한, 선두 재생(609)이 클릭되면, 음성 파일 트랙(702)의 선두 트랙(도 10에서는 음성 파일 트랙 No. 3)의 재생을 개시한다.
(녹음 순서)
음성 레코더(101)에 새로이 음성을 녹음하는 경우, 스캐너(113)로 지시 보드(600)의 녹음(601) 심볼을 클릭하던지, 본체의 녹음재생 버튼(103)을 누르면 녹음이 개시된다. 마이크(107)를 향해 발성된 음성은 A/D 컨버터에 의해 디지털로 변환되어, 압축 회로에 의해 압축된다. 이와 같이 압축 데이터 형식으로 음성 정보는 순차로 메모리 카드(106)에 등록된다.
이 녹음 중에, 스캐너(113)로 지시 보드(600)의 녹음(601) 심볼 또는 정지(606) 심볼을 클릭하던가, 본체의 녹음정지 버튼(103)을 누르면 녹음이 정지된다. 이 때까지 녹음된 음성 정보가 메모리 카드(106)에 기록된다.
이들 음성을 소거하는 경우에는, 스피커(102)로부터 음성이 재생되고 있는 상태, 또는 음성의 재생 종료 후 5초 이내에 지시 보드(600)의 음성 소거(615) 심볼이 스캐너(113)로 클릭되면 스피커(102)로부터 ‘삐’하는 소리가 출력되어 녹음재생 표시부(106)의 LED가 5초 동안 점멸한다. 이 5초 동안에, 지시 보드(600)의 실행(617) 심볼이 클릭되면 재생되고 있는 음성이 소거된다. 이 때 MPU는 해당 음성 파일 트랙(702)의 데이터를 메모리 카드(106)로부터 삭제하는 처리를 한다.
또한, 상기 5초 동안 사이에 중지(618) 심볼이 스캐너(113)로 클릭되든지, 5초 동안 사이 어느 심볼도 클릭되지 않는 경우에는, 이 음성 소거 모드를 종료한다.
또한, 메모리 카드(106)에 녹음되고 있는 모든 음성 정보를 소거하고 싶은 경우에는, 상기 음성 소거(615) 대신에 전음성 소거(616) 심볼을 스캐너(113)로 클릭하면 된다.
(링크 작업)
본 실시 형태에서는, 유저가 자기 자신이 녹음한 음성 정보 또는 메모리 카드(106)에 기억된 기존의 음성 정보를 어느 도트 패턴과 링크 하느냐를 자유롭게 설정할 수 있다. 이것을 링크 설정이라고 한다.
링크 설정은 도 10에 나타내는 링크 테이블[메모리 카드(106) 내에 설정]에 의해 관리되고 있다.
링크를 작성할 때에는, 우선 지시 보드(600)의 녹음(601) 심볼을 스캐너(113)로 클릭하든지, 녹음정지 버튼(103)을 눌러 음성 녹음을 개시한다. 이 때 녹음 재생 표시부(104)의 LED가 점멸 상태가 된다.
다음에, 녹음 상태를 유지한 채, 그림책, 사진, 씰, 카드 등에 인쇄된 도트 패턴이 스캐너(113)로 클릭(촬상)되면, MPU는 녹음 상태를 정지함과 동시에, 녹음된 음성 파일 트랙 번호에 대해서 촬상한 도트 패턴의 도트 코드를 링크지어 등록한다. 이 때, 스피커(102)로부터 ‘삣’하는 음으로 출력시켜 링크의 생성을 유저에게 통지한다.
또한, 도트 패턴을 스캐너(113)로 클릭했을 때에, 이미 링크 테이블에 해당 도트 패턴에 대응하는 도트 코드에 다른 음성 파일 트랙(702)이 링크되어 등록되어 있는 경우에는, MPU는 스피커(102)로부터 ‘붓’하는 소리를 출력시켜 링크 작성을 할 수 없는 것을 유저에게 통지한다.
다음에, 이미 메모리 카드(106)에 음성 정보가 등록되어 있는 경우, 도트 패턴과의 링크를 생성하는 순서에 대해 설명한다.
우선, 지시 보드(600)의 링크 개시(611) 심볼을 스캐너(113)로 클릭하면, 음성 레코더(101)의 MPU는, 링크 표시부(105)의 LED를 점멸시켜 링크 개시를 유저에게 통지한다.
다음에, 지시 보드(600)의 재생(604) 심볼을 스캐너(113)로 클릭하여 링크시킬 음성 파일 트랙(702)의 음성을 재생시킨다. 이 때, 유저는 지시 보드(600)의 감기 재생(608), 되감기 재생(607), 선두 재생(609), 후미 재생(610)을 클릭함으로써 재생하는 음성 파일 트랙(702)을 순차로 바꾸어 소망하는 음성 파일 트랙(702)을 찾아낸다.
이와 같이 하여 소망하는 음성 파일 트랙(702)을 재생하는 동안, 또는 음성 재생 종료 후 5초 이내에 그림책, 사진, 씰, 카드 등에 인쇄된 도트 패턴을 스캐너(113)로 클릭하면, 해당 음성 파일 트랙(702)과 도트 패턴의 도트 코드가 링크되어 링크 테이블에 등록된다. 여기에서, 이미 링크 테이블에 해당 도트 패턴에 대응하는 도트 코드에 다른 음성 파일 트랙(702)이 링크되어 등록되어 있는 경우에는, MPU는 스피커(102)로부터 ‘붓’하는 음을 출력시켜 링크 작성을 할 수 없다는 것을 유저에게 통지한다.
이와 같이, 1개의 도트 패턴(도트 코드)은 1개의 음성 파일 트랙으로 밖에 링크시킬 수 없으나, 반대로 1개의 음성 파일 트랙(702)은 복수의 도트 패턴(도트 코드)과 링크시킬 수 있다. 따라서, 완전히 다른 도트 패턴이라도 클릭하여 동일한 음성 정보를 재생시킬 수 있다.
이상의 링크 모드를 종료하는 경우에는, 지시 보드(600)의 링크 종료(612) 심볼을 스캐너(113)로 클릭한다. 이것에 의해, 음성 레코더(101)는, 전원 스위치(108)를 온(ON) 상태로 했을 때의 초기 상태로 되돌아온다.
다음에, 이상과 같이 설정된 링크 테이블의 링크를 소거하는 순서에 대해 설명한다.
어느 링크를 소거하고 싶은 경우에는, 우선 링크 테이블에 이미 링크가 생성되고 있는 도트 패턴을 스캐너(113)로 클릭하고, MPU는 링크된 음성 파일 트랙을 읽어내어 재생한다.
다음에, 해당 음성의 재생 중, 또는 재생 종료 후 5초 사이에 링크 해 제(613) 심볼을 스캐너(113)로 클릭한다. 다음에, MPU는 스피커(102)로부터 ‘삐-’하는 음을 5초 동안 출력함과 동시에, 링크 표시부(105)의 LED를 점멸시킨다. 그 동안에 지시 보드(600)의 실행(617) 심볼을 스캐너(113)로 클릭하면, 해당 도트 패턴(도트 코드)과 음성 파일 트랙과의 링크가 해제된다. 이 때, 링크가 해제되는 것만으로 링크된 음성 파일 트랙은 소거되지 않는다.
또한, 상기 5초 동안 사이에 중지(618) 심볼이 스캐너(113)로 클릭되든지, 5초 동안 어느 심볼도 클릭되지 않는 경우에는, 이 모드를 종료한다.
다음에, 링크 테이블 내의 모든 링크를 해제하는 경우에는, 상기 링크 해제(613) 심볼 대신에, 전(全) 링크 해제(614) 심볼을 스캐너(113)로 클릭하면 된다. 그 순서는 상기 개개의 링크 해제와 마찬가지로서 설명을 생략 한다.
(그 외의 기능)
음성 레코더(101)는, 이상의 기능 외에 이하의 부가 기능을 가지고 있다.
5분 동안 어느 스위치나 버튼도 조작되지 않고, 또한 스캐너(113)로 어느 도트 패턴 또는 심볼도 클릭되지 않는 경우에는 전원 오프 상태가 된다. 이것은 MPU가 클록(clock)을 이용해 5분 동안 계수를 실시하여, MPU와 DC-DC 컨버터와의 사이에 있는 스위치를 개방하는 제어를 함으로써 실현된다.
음성 레코더(101)는 녹음하는 음성에 대해서 음성 품질(비트 레이트)을 가변할 수 있다. 음성 품질의 ‘저’(602c) 심볼을 스캐너(113)로 클릭했을 경우, 녹음되는 비트 레이트가 낮게 설정되어 장시간 녹음이 가능하게 된다. 한편, ‘고’(602a) 심볼이 클릭되었을 경우에는 비트 레이트가 높게 설정되고 고품위인 녹음 이 가능해진다. ‘중’(602b)의 심볼은 그 중간인 비트 레이트로 설정이 가능하게 된다.
MPU는 메모리 카드(106)의 빈 용량을 감시하고 있으며, 빈 용량이 0.2 Mbyte 미만이 되면 녹음재생 표시부(104)의 LED를 점멸시켜 녹음 가능 시간이 적은 것을 유저에게 통지하게 되어 있다. 이 때, 상술한 바와 같이, 지시 보드(600)에서 음성 네비게이션 심볼을 스캐너(113)로 클릭했을 경우에는, 유저에 대한 통지를 음성 정보, 예를 들어 “메모리가 얼마 남지 않았습니다”라는 등의 음성 정보를 스피커(102)로부터 출력시켜도 된다.
한편, 이상의 실시 형태에서는, 사진, 그림책, 카드, 씰 등에 형성된 도트 패턴으로서 코드 정보(도트 코드)의 경우만을 설명했으나, 이에 국한하지 않고 좌표 정보, 코드 정보와 좌표 정보의 조합, 또한 키 도트(2)에 의한 각도 정보의 조합을 스캐너로 읽어내도록 해도 된다.
각도 정보를 조합한 경우, 예를 들어 스캐너(113)에 대하여 독취한 도트 패턴이 인쇄된 카드의 방향(각도)에 따라 다른 음성 정보를 출력시키는 것도 가능해진다.
도 18, 도 19는 본 발명의 다른 실시 형태를 나타내는 것이다.
도 18에 나타내는 음성 레코더(101a)는, 도 1에 나타낸 음성 레코더(101)와 거의 마찬가지의 것이지만, 메모리 카드로서 SD 카드(106A)를 사용한 것이다. 그 외의 기능은 도 1로 설명한 것과 같기 때문에 설명은 생략한다. 도 18에서는 SD 카드를 예시했으나, 메모리 매체라면 miniSD, 메모리 스틱, 메모리 스틱 Duo 등 어떠 한 매체라도 된다.
도 19는, 스캐너를 일체화한 음성 레코더(1901)를 나타내고 있다.
이 음성 레코더(1901)의 장치 본체의 선단(그림에서 상단)에는, 센서 유니트(1903)가 내장되어 있고, 도시는 생략 하지만, 적외선 LED 등의 적외선 조사 수단이나 도트 패턴으로부터의 반사광을 촬영하는 CCD나 CMOS로 구성된 촬상 수단이 설치되어 있다. 즉, 도 4 및 도 5에서 설명한 스캐너(113)가 음성 레코더(1901) 본체에 일체적으로 내장된 구조로 되어 있다.
본체의 저부 근방의 측면에는 스피커(1902)가 설치되어 있고, 마이크(1908)로부터 입력한 음성이나, SD 카드(106A)(도 19에서는 도시하지 않음)나 내장된 메모리에 미리 등록된 음성, 음악 등이 출력되게 되어 있다.
이 음성 레코더(1903)의 정면[조작면, 도 19(b)에 나타낸 면]에는, 센서 유니트 측으로부터 스캔 버튼(1904), 녹음 버튼(1905), 볼륨(1906), LED(1907) 및 마이크(1908)가 각각 배치되어 있다.
<회전 파라미터를 갖는 실시 형태>
도 20부터 도 27은, 본 발명의 다른 실시 형태를 나타내는 것이다.
이들의 실시 형태는, 도트 패턴[피규어(figure)의 방향]의 각도를 인식함으로써, 도트 코드 및 그 각도에 대응한 음성을 출력할 수 있는 대좌(음성 정보 기록 장치)에 관한 것이다.
본 실시 형태는, 도 20에 나타내는 바와 같이, 대좌(2001)와, 여기에 접속된 스캐너(113)와 이 스캐너(113)로 독취하기 위한 페이퍼 컨트롤러(2006)와 대 좌(2001)의 상면의 스테이지(2002)에 재치되는 피규어(2003)로 구성된다.
또한, 대좌(2001)의 주위면의 정면측에는, 마이크(2004)와 액정 표시부(2005)가 설치되어 있다.
피규어(2003)의 저면에는 도 12~17에서 설명한 도트 패턴이 인쇄된 씰이 첨부 되어 있다.
대좌(2001)의 내부에는, 도시하지 않는 적외선 조사 수단(예를 들어 적외선 조사 LED)과, 촬상 수단(CCD, CMOS 등)이 설치되고 있으며, 대좌(2001)의 스테이지(2002)에 설치된 독취공(孔)을 개재하여 피규어(2003) 저면의 도트 패턴이 촬상 가능하게 되어 있다.
본 실시 형태에 사용하는 지시 보드[페이퍼 컨트롤러(2006)]는, 도 21에 나타낸다.
이 페이퍼 컨트롤러(2006)에는, 녹음을 지정하는 녹음 영역, 링크 영역, 회전 파라미터 영역, 재생, 빨리 감기, 되감기 재생, 감기 재생, 선두 재생, 후미 재생 등의 재생 제어를 하는 재생 제어 영역, 링크의 생성이나 해제 및 음성의 소거를 제어하는 링크 제어영역이 설치되고, 각기 도트 패턴이 인쇄되어 있다.
즉, 페이퍼 컨트롤러(2006)의 이들 영역을 스캐너(113)로 촬상함으로써, 음성의 입력, 재생, 피규어와의 관련지음(링크)이 제어될 수 있도록 되어 있다.
또한, 페이퍼 컨트롤러(2006)에는, 회전 파라미터의 ON/OFF 영역이 설치되어 있다.
이 회전 파라미터 ON/OFF 영역은, 피규어의 저면에 설치된 도트 패턴의 방향 의 파라미터를 ON 상태(방향의 파라미터도 부가하여 제어를 하는 모드)로 할지 OFF 상태(방향의 파라미터를 무시하여 제어를 하는 모드)로 할지를 지시하기 위한 영역이며, ON의 영역을 스캐너(113)로 촬상했을 때에는, 스테이지(2002) 상에서의 피규어(2003)의 방향, 예를 들어 정면을 향하도록 재치했을 때[도 20(a)], 옆을 향해 재치했을 때[도 20(b)], 정면에 등을 돌려 재치했을 때[도 20(c)]의 각각에서 다른 음성을 출력하는 것이 가능하게 된다.
도 25는, 도트 패턴의 방향을 검출하기 위한 기술을 설명한 도이다.
도 12에서 설명한 바와 같이, 도트 패턴(1)은, 키 도트(2)를 중심으로 정보 도트(3)를 배치한 구성으로 되어 있다. 따라서, 도트 패턴(1)으로부터 정보 도트를 의미하는 값을 추출하기 위한 알고리즘(중앙처리장치에 의해 실행되는 해석 프로그램)에서는, 스캐너(113)나 센서 유니트(1903)로 촬상된 도트 패턴(1)의 화상 데이터를 비디오 메모리에 전개하고, 이 비디오 메모리의 화소를 해석하여 우선 키 도트(2)를 찾는다. 따라서, 키 도트(2)가 색출되면 도트 패턴(1)의 방향[촬상기준선(2501)(여기에서는 Y 정방향)]에 대한 도트 패턴(1)의 기울기의 각도(θ)가 계산된다.
본 실시 형태는 이 방향의 각도를 도트 패턴이 뜻하는 코드 값에 파라미터로서 부가한 것으로서, 동일한 도트 패턴이라도 각도에 따라 출력시키는 음성 데이터(voice address)를 변화시킬 수 있다.
한편, 여기에서는 Y 정방향에 대한 도트 패턴의 방향과의 각도로 설명했으나 여기에 X 정방향을 기준으로 해도 무방함은 말할 필요도 없다.
도 26은 그 각도를 파라미터로서 부가한 경우의 음성 결정 테이블이다. 이를 구체적으로 도 20에서 설명한 피규어(2003)의 방향과 대응하여 설명하면, 피규어(2003)가 정면을 향해 재치되고 있을 때[도 20(a)]에는, 각도는 -46~+45(0±45)도이므로, 음성 결정 테이블에 의해 각도 No.001가 선택되어 음성 어드레스 a에 등록된 “아침은 드셨습니까”라는 음성이 대좌(2001)의 스피커(도시 생략)로부터 발성된다.
또한, 도 20(b)에 나타내는 바와 같이 피규어(2003)를 좌방향으로 향해 재치한 경우에는, 각도는 +46~+135(90±45)도이므로, 음성 결정 테이블에 의해 각도 No.002가 선택되어, 보이스 어드레스 b에 등록된 “점심은 드셨습니까”라는 음성이 대좌(2001)의 스피커(도시 생략)로부터 발성된다.
또한, 도 20(c)에 나타내는 바와 같이 피규어(2003)가 정면에서 봐서 등을 돌리고 재치된 경우, 각도는 +136~+225(180±45)도이므로, 음성 결정 테이블에 의해 각도 No.003이 선택되어, 음성 어드레스 c에 등록된 “저녁은 드셨습니까”라는 음성이 대좌(2001)의 스피커(도시 생략)로부터 발성된다.
<녹음 및 링크 처리>
다음에, 도 22~24를 사용해, 본 실시 형태의 음성 레코더의 조작 순서에 대해 설명한다.
우선, 스캐너의 MPU는, 프로그램을 바탕으로, 유저에 의해 회전 파라미터 ON(804)의 심볼이 클릭되었는지 아닌지를 판정한다(2201). 여기에서, 클릭되었다고 판단할 경우에는 스텝(2202)으로 처리를 옮기고, 클릭되었다고 판단하지 않은 경우 에는, 본 처리를 종료한다.
스텝(2202)에서는, 회전 파라미터를 ON으로 한다. 스캐너의 MPU는, 스텝(2201)에서 읽어낸 도트 패턴을 해석 소프트에 의해 해석하고, 도트 코드(코드 정보)로 변환한다. 이 도트 코드가 대좌(2001)의 MPU에 송신된다. 그리고, 대좌(2001)의 MPU는, 회전 파라미터를 ON으로 한다.
다음에, 녹음(801)이 클릭되었는지 아닌지를 판단한다(2203). 클릭되었다고 판단한 경우에는 스텝(2204)으로 처리를 옮기고, 클릭되었다고 판단하지 않은 경우에는, 본 처리를 종료한다.
스텝(2204)에서는, 녹음 모드를 ON로 한다.
다음에, 녹음 처리를 한다(2205). 대좌(2001)의 MPU는, 마이크(2004)를 향해 발성된 음성을 A/D 컨버터에 의해 디지털 변환하고, 압축 회로에 의해 압축한다. 그와 같은 압축 데이터 형식으로 음성 정보를 순차적으로 메모리에 등록한다.
다음에, 링크 개시(802)의 심볼이 클릭되었는지 아닌지 판단한다(스텝 2206). 클릭되었다고 판단한 경우에는 녹음을 정지하고(2301), 클릭되었다고 판단하지 않은 경우에는 스텝(2207)으로 처리를 옮긴다.
스텝(2207)에서는, 음성의 녹음이 완료하였는지 아닌지를 판단한다(2207). 녹음(801)의 심볼 또는 정지(808)의 심볼이 클릭되었다고 판단한 경우에는, 녹음이 완료했다고 판단한다. 녹음이 완료했다고 판단할 경우에는 본 처리를 종료하고, 녹음이 완료했다고 판단하지 않은 경우에는, 재차 스텝(2207)의 처리를 한다.
스텝(2301)에서는, 녹음 상태를 정지한다. 그리고, 링크 모드를 ON로 한 다(2302).
다음에, 링크 종료(803)의 심볼이 클릭되었는지 아닌지를 판단한다(2303). 클릭되었다고 판단할 경우에는 본 처리를 종료하고, 클릭되었다고 판단하지 않은 경우에는 스텝(2304)으로 처리를 옮긴다.
스텝(2304)에서는, 피규어(2003)가 대좌(2001)의 스테이지(2002)에 재치(載置)되어 있는지 아닌지를 판단한다. 피규어(2003)가 재치되어 있는지 아닌지의 판단은, 대좌의 센서 유니트가 피규어(2003) 저면의 도트 패턴을 독취 가능한 상태로 되어 있는지 아닌지로 판단한다. 재치되고 있는 경우에는, 센서가 읽어낸 도트 패턴을 MPU로 송신한다.
스텝(2305)에서는, 코드 정보의 추출 및 각도의 검출을 한다. MPU는, 화상 처리 알고리즘에 의해, 독취한 화상 정보로부터 코드 정보를 추출한다. 그리고, 키 도트의 위치로부터 해당 도트 패턴의 각도를 계산한다.
다음에, 도트 코드와 각도가 이미 링크되어 있는지 아닌지를 판단한다(2306). 대좌의 MPU는, 이미 링크 테이블에 해당 도트 코드, 즉 해당 각도에 다른 음성 파일 트랙이 링크되어 등록되어 있는지 아닌지를 판단한다. 이미 링크되어 있는 경우에는 스텝(2303)으로부터의 처리를 다시 하고, 링크되어 있다고 판단하지 않은 경우에는, 스텝(2307)으로 처리를 옮긴다.
스텝(2307)에서는, 링크 처리를 한다. MPU는, 녹음된 음성 파일 트랙 번호에 대하여, 코드 정보 및 각도를 링크시켜 등록한다.
다음에, MPU는, 타이머의 값을 독취하고, 링크 개시(802)의 심볼이 클릭되고 나서 5초 경과했는지 아닌지를 판단한다. 5초 미만인 경우에는 스텝(2303)으로부터의 처리를 다시 실시하고, 5초 경과한 경우에는, 본 처리를 종료한다.
한편, 본 처리에 있어서는, 녹음과 링크를 연속하여 수행했으나, 이미 메모리에 등록되어 있는 음성 정보와의 링크를 생성하는 것도 가능하다.
<링크 완료 음성 재생 처리>
다음에, 도 22, 23의 처리에 의해 링크한 음성을 재생하는 순서에 대하여, 도 24를 사용해 설명한다.
우선, 스캐너의 MPU는, 유저에 의해, 회전 파라미터 ON(804)의 심볼이 클릭되었는지 아닌지를 판단한다. 클릭되었다고 판단한 경우에는 회전 파라미터를 ON으로 하고(2402), 클릭되었다고 판단하지 않은 경우에는, 본 처리를 종료한다.
다음에, 피규어가 재치되었는지 아닌지를 판단한다(2403). 피규어가 재치되어 있다고 판단할 경우에는, 센서가 읽어낸 도트 패턴을 MPU로 송신한다. 그리고, 읽어낸 화상 정보로부터 코드 정보를 추출하고(2404), 키 도트의 위치로부터 해당 도트 패턴의 각도를 계산한다(2405).
다음에, 음성 재생 처리를 한다(2406). MPU는, 메모리 내의 링크 테이블을 검색하고, 코드 정보와 각도 양쪽 모두에 대응하는 음성 파일 트랙을 색출하여, 메모리 내의 해당하는 음성 파일 트랙을 읽어낸다. 이 음성 파일 트랙(702)의 음성 정보는, 압축 회로에서 역압축(전개)되고, A/D 컨버터로 아날로그 음성 정보로 변환되어, 앰프(AMP)를 통해 스피커로 출력된다.
<각도 검출 방법>
상술한 바와 같이, 도 25는, 도트 패턴(1)의 각도를 설명한 것으로서, 전술한 키 도트(2)의 위치를 검출함으로써, 평면 방향에서의 도트 패턴(1)의 기울기의 각도(방향)를 검출할 수가 있도록 되어 있다. 도 26의 음성 결정 테이블은, 캐릭터 코드, 각도, 각도 No. , 음성 어드레스로 구성되어 있다. 센서에 의하여 도트 패턴(1)을 독취하면, 이 도트 패턴(1)에 기록된 캐릭터 코드가 우선 결정된다. 다음에, 키 도트(2)를 기준으로 하여 도트 패턴(1)의 각도가 계산되면, 이 각도로부터 각도 No.가 결정된다. 그리고, 캐릭터 코드 및 각도 No.에 의해, 대응하는 음성 어드레스가 결정된다. 음성 어드레스와 음성이 대응되고, 예를 들어, 음성 어드레스가 a의 경우는 “점심은 드셨습니까”, b의 경우는 “안녕히 가세요”라는 음성이 출력된다.
한편, 도 26에서는, 90도마다, 즉 4방향에서 각도 No.를 결정하고 있다. 이 경우, 각도 정보는 2 bit로 표현된다. 그러나, 본 발명은 이에 국한하지 않고, 임의의 방향 수에서 각도 No.를 결정해도 된다. 예를 들어, 8 방향의 경우에는 45도마다 각도 No.를 설치하고, 각도 정보는 3 bit로 표현된다. 16 방향의 경우는 22. 5도마다 각도 No.를 설치하고, 각도 정보는 4 bit로 표현된다.
도 27은, 센서의 기울기와 각도와의 관계를 설명한 도이다.
(a)에 나타내는 바와 같이, 도트 패턴의 방향과, 센서의 방향이 이루는 각도를 α로 한다. 또한, (b)에 나타내는 바와 같이, 센서의 기울기와 센서의 방향이 이루는 각도를 β로 한다. 이 경우에, 도트의 방향과 센서의 기울기가 이루는 각도 γ가, 피규어를 기울인 각도가 된다. 즉, 각도 γ는, γ=α+β로 된다.
<각도 파라미터가 OFF인 경우>
다음에, 각도 파라미터가 OFF의 경우에, 도트 패턴에 링크된 음성을 재생하는 순서에 대해 설명한다.
유저에 의해, 각도 파라미터 OFF(805)의 심볼이 클릭되면, 각도 파라미터가 OFF가 된다. 다음에, 대좌(2001)의 센서가, 스테이지 상에 재치된 피규어(2003) 저면의 도트 패턴을 독취하면, MPU는 해당 도트 패턴을 해석 소프트에 의해 해석하고, 도트 코드(코드 정보)로 변환한다. 그리고, 해당 도트 코드르 바탕으로 메모리의 링크 테이블을 검색하고, 이 도트 코드에 대응하는 음성 파일 트랙을 읽어낸다. 여기에서, 해당 도트 코드에, 서로 다른 각도에서 복수의 음성이 링크되고 있는 경우는, 최후에 녹음된 음성을 읽어낸다.
<퍼스널 컴퓨터(PC)에 접속하여 조작>
상술한 실시 형태에서는, 지시 보드(800)를 사용하여 조작을 했으나, 본 발명에서는, 이에 한정되지 않는다.
예를 들어, 도 28에 나타내는 바와 같이, 대좌(2001)를, 커넥터를 사용해 PC(2801)에 접속하는 형태로 해도 된다. 이 경우 유저는, 키보드 및 마우스(도시하지 않음)를 사용해 녹음, 재생, 링크 등의 조작을 한다.
<대좌에 버튼을 설치하여 조작>
또한, 도 29에 나타내는 바와 같이, 이 음성 클록 자체를 PC(2801)의 USB 단자에 접속할 수 있게 하고, PC 측에서 음성의 제어나 알람 시간의 설정 등을 실시하도록 해도 된다. 이 경우, 대좌(2001)에 설치한 액정 표시부(2005)는 불필요 하 더라도 된다.
또한, 도 30에 나타내는 바와 같이, 대좌(2001) 상에 카드를 재치하고, 카드에 인쇄된 도트 패턴을 읽어내어 상기 조작을 하도록 해도 된다.
<음성인식 기능부착 음성 레코더>
도 31은, 스캐너를 일체화한 음성 레코더의 다른 형태를 나타낸 것이다.
이 음성 레코더(3101)는, 도 19에서 나타낸 일체형 음성 레코더의 기능에 더하여, 음성인식을 위한 입력 기능과 액정 표시 화면(3110)을 갖고 있다.
이 음성 레코더(3101)는, 녹음 버튼(3105)이 음성 입력 버튼을 겸용하고 있고, 음성 입력 기기로서 사용하는 경우에는, 해당 녹음 버튼(3105)을 누르면서 마이크(3108)를 향해 발성함으로써, 이 음성 정보가 음성 레코더(3101) 내에 입력된다.
그리고, 이 발성 정보는, 음성 레코더 내의 도시하지 않는 A/D 컨버터에 의하여 디지털 변환된 후에, 음성인식 회로에 의해 해석되고, 발성 정보에 대응하는 텍스트 정보로 변환된다.
예를 들어, 미리 출장 등의 스케줄 정보가 등록되어 있는 경우에는, 유저는 녹음 버튼(3105)을 누르면서 ‘스케줄’ 또는 ‘예정’이라고 발성하면, 이것이 음성인식 회로에 의해 해석되어, 각각 ‘스케줄’ 또는 ‘예정’이라는 텍스트 데이터로 변환되고, 이들 텍스트 데이터를 검색 키로 하여 메모리에 구축된 데이터베이스가 검색되고, ‘○○출장’이라는 텍스트 정보가 추출되고, 이것이 음성 정보로 변환되어 스피커(3102)로부터 ‘○○출장’이라고 발성된다.
한편, 데이터베이스에는 ‘○○출장’이라는 음성 정보 자체가 메모리에 기억되어 있고, 여기에 텍스트로 날짜정보(예를 들어 ‘4월 28일’)를 관련지어도 된다.
이 경우, 음성 레코더(3101)에 대해서 음성으로 ‘4월 28일’이라고 발성하는 것만으로, 이 음성이 텍스트 데이터로 변환되어 데이터베이스를 검색하고, 이 텍스트 데이터에 대응하는 ‘○○출장’의 음성 정보를 스피커(3102)로부터 출력시켜도 된다.
한편, 상기의 예에서는, 입력된 음성 정보를 바탕으로 음성 레코더 내의 데이터베이스를 검색하여 색출한 데이터를 스피커(3102)로부터 발성시켰을 경우를 설명했으나, 해당 음성 레코더를 음성인식을 위한 입력 기기로서만 사용해도 되며, 녹음 기능을 생략하여 스캐너 기능을 구비한 음성인식용 단말로서 사용해도 된다. 또한, PC에는 복수의 음성 레코더를 접속하여 서로 음성 메일을 주고받아도 된다.
예를 들어, 유저가 녹음 버튼(3105)을 누르면서 발성한 음성 정보가 입력되면, 해당 음성 레코더의 MPU는, 이 음성 정보를 도시하지 않는 통신 인터페이스를 통하여 안테나(3109)로부터 PC로 송신하고, PC 내의 음성인식 프로그램에 의해 해당 음성 정보를 해석하고, 이를 텍스트 데이터로 변환하여 PC 내에 구축된 데이터베이스 또는 네트워크 상의 데이터베이스를 검색하고, 검색 결과를 PC의 디스플레이 장치에 출력해도 된다.
또한, 검색 결과 데이터를 통신 기능을 사용해 음성 레코더로 회신시켜 음성 레코더의 스피커(3102)로부터 음성 정보로서 발성시켜도 된다.
도 32는, 이 음성인식 정밀도를 높이기 위하여, 또한 입력한 음성 정보의 분류를 위한 페이퍼 컨트롤러(3200)의 구성을 나타낸 것이다.
동 도에 나타내는 바와 같이, 이 페이퍼 컨트롤러(3200)에는, ‘성명 입력’(3208), ‘우편 번호 입력’(3209), ‘어드레스 입력’(3210), ‘전화번호 입력’(3211), ‘메일 어드레스 입력’(3214) 등의 입력 음성 카테고리가 각각 영역으로서 인쇄되어 있고, 이들 영역에는 각각 다른 코드가 도트 패턴으로서 인쇄되어 있다. 또한 마찬가지로서 입력 기능으로서 ‘위로’, ‘결정’, ‘아래로’의 영역이 인쇄되어 있고, 디스플레이 화면 상에 표시된 후보 또는 메뉴를 선택할 수 있게 되어 있다.
즉, 본 음성 레코더(3101)의 녹음 버튼(3105)을 눌러 음성 입력을 할 때, 미리 카테고리 코드(도트 패턴)를 센서 유닛(3103)으로 스캔함으로써, 음성인식 정밀도를 높임과 동시에, 입력한 음성 정보를 분류하는 것이다.
예를 들어, ‘우에노’라고 발성했을 경우, 그것이 지명인 우에노인지 또는 인명인 우에노인지를 파악하기는 어렵지만, ‘어드레스 입력’이 스캔된 후에 ‘우에노’라는 발성이 음성 정보로서 입력되었을 경우, 어드레스 입력의 카테고리 코드와 함께 ‘우에노’의 음성 정보가 PC로 송신된다.
PC의 MPU는, 어드레스 입력의 카테고리 코드가 부가되어 있어, 해당 ‘우에노’의 음성 정보가 ‘어드레스’의 카테고리인 것을 용이하게 판별할 수 있기 때문에, 즉시 우에노 부근의 지도 정보를 PC의 디스플레이 화면에 표시할 수 있다.
한편, 음성 레코더의 통신선(先)은 이러한 PC에 한정되지 않고, 카 내비게이 션 장치, 정보 가전제품, 제어 기기, 로봇 등 어떠한 것이라도 무방하다. 즉, 본 음성 레코더를 음성인식 기능의 입력장치로서 사용함으로써, 모든 정보 기기, 정보 가전의 제어가 가능하게 된다.
다음에, 본 실시 형태의 한 예로서 도 32에 나타내는 지시 보드(페이퍼 컨트롤러)(3200)를 사용해 음성인식을 하는 경우에 대하여 설명한다.
지시 보드(3200)는, 통신 판매 카탈로그로부터 상품을 주문하는 경우 등에 사용된다. 통신 판매 카탈로그(도시하지 않음)에는, 상품의 사진 상에 도트 패턴이 중첩 인쇄되고 있고, 유저가 음성 레코더(3101)의 센서 유닛(3103)으로 상품의 사진을 클릭(센서 유닛으로 해당 사진 부분의 도트 패턴을 촬상)하면, PC(도시하지 않음)의 디스플레이 화면 상에, 해당 도트 패턴이 의미하는 코드에 대응한 상품 설명 화면이 표시된다. 또한, 카탈로그의 상품 번호를 인쇄한 부분에도 도트 패턴이 중첩 인쇄되어 있고, 상품 번호의 인쇄면을 클릭하면, PC의 디스플레이 화면 상에 주문 상품 정보가 표시되고, 클릭한 상품이 주문 리스트에 등록된다. 다음에, 확인(3201)을 클릭하면, 화면 상에 주문 리스트가 표시된다. 주문 리스트에 등록된 상품을 선택하는 경우에는 ‘위로’(3202) 및 ‘아래로’(3203)의 각 심볼을 클릭하고, 주문수를 변경하는 경우에는, ‘주문 수를 증가’(3204) 또는 ‘주문 수를 감소’ (3205)의 각 심볼을 클릭한다. 등록한 상품의 주문 리스트를 취소하는 경우에는 ‘모두 취소’(3206)를 클릭하고, 주문하는 상품 및 개수가 결정된 경우에는, ‘주문’(3207)을 클릭한다. 또한, 최후로 열람한 상품 카탈로그 화면으로 되돌아가려면 ‘되돌아감’(3212)을 클릭하며, 주문 프로그램을 종료하는 경우에는, 종 료(3213)를 클릭한다. 이들 조작을 실시하는 경우에는, 유저는, 스캔 버튼(3104)을 누르면서, 원하는 상품 사진 및 심볼을 클릭한다.
유저는, 주문하는 상품이 결정된 뒤에, 성명, 어드레스 등의 입력을 한다. 유저가, 스캔 버튼(3104)을 누르면서 성명 입력(3208)을 클릭하면, 스캐너(3101)에 내장된 MPU에서 해당 도트 패턴을 해석하고, 도트 코드(코드 정보)로 변환한다. 이 도트 코드가 컴퓨터의 MPU로 송신되면, 해당 도트 코드에 기초하여, 음성인식 모드를 ON으로 한다.
다음에 유저는, 녹음 버튼(3105)을 누르면서, 마이크(3108)를 향해 성명을 발성한다. 그러면, MPU는, 마이크를 향해 발성된 음성을 A/D 컨버터(도시하지 않음)에 의해 디지털 변환하고, 압축 회로에 의해 압축 및/또는 변환한다. 이러한 압축 데이터를, 안테나(3109)를 통해 컴퓨터에 송신한다. 컴퓨터의 MPU는, 해당 음성 데이터를 음성 해석 소프트프로그램으로 해석하고, 문자 정보로 변환하여, 해당 문자 정보를 화면 상에 표시한다. 동일한 조작에 의해, 우편 번호, 어드레스, 전화번호도 음성 입력 기능에 의해 입력된다.
이와 같은 음성 입력 기능을 가짐으로써, 유저는, 키보드나 스캐너를 사용한 번잡한 조작을 하지 않고도, 간이한 조작으로 어드레스 등의 정보를 입력할 수 있게 된다.
한편, 본 실시 형태에 있어서는, 전술한 바와 같이, 스캔 버튼(3104)이 눌려진 상태에서 도트 패턴이 클릭되었을 때만, 도트 패턴이 읽혀진다. 센서 유닛(3103 )내에는, LED, CMOS 센서 등이 내장되어 있는데, 이들은 전력을 소비한다. 더구나, 해당 음성 레코더(3101)는 무선이기 때문에, 통신 기능을 항상 유지하고 위해 아이들링 전력이 필요하므로, 전지(충전기 포함)를 사용하고 있으며, 이 전력 소비를 억제할 필요가 있다.
따라서, 전력의 소비를 최소한으로 하기 위해, 스캔 버튼(3104)이 눌려진 경우만, 센서 유닛(3103)에 통전을 하여 기능하도록 했다.
또한, 음성인식 기능에 있어서도, 녹음 버튼(3105)이 눌려진 동안에만, 음성이 입력된다. 항상 음성 입력이 수행되는 상태면, 마이크(3108)는 유저가 입력하려고 하지 않은 음성도 인식하여, 유저가 의도하지 않는 정보가 입력될 가능성이 있다. 유저가 소망하는 정보만을 입력하는 것이 가능하게 되도록, 음성 입력 버튼(3105)이 눌려져 있는 동안만 음성이 입력되도록 했다.
한편, 도 31에 나타낸 음성 레코더(3101)에서는, 안테나(3109)를 설치하고 무선 통신 방식으로 PC와 통신을 실시하도록 하고, 이것으로 음성 정보와 도트 패턴을 읽어낸 코드 정보를 PC 측에 송신하도록 했으나, 음성 정보만 또는 코드 정보만을 PC에 송신하도록 해도 무방하다.
<음성 메일 시스템>
도 33부터 도 39는, 본 발명에 있어서 음성 레코더를 사용한 음성 메일 시스템에 대해 설명하는 것이다.
도 33은, 본 실시 형태에 있어서 네트워크 구성도이다. 본 발명의 음성 메일 시스템에 있어서는, PC가 인터넷 등의 네트워크를 통해 다른 PC와 접속되어 있고, 데이터 송수신을 할 수 있도록 되어 있다. 따라서 그러한 PC는, 블루투 스(Bluetooth) 등의 근거리 무선통신 시스템에 의하여, 음성 레코더와의 통신이 가능하게 되어 있다. 음성 레코더와 PC와의 통신은 이처럼 블루투스에 국한하지 않고, 적외선 통신, 무선 LAN, USB 케이블에 의한 유선 접속 등 어떠한 것라도 무방하다.
도 34는, 유저가 음성 메일의 등록, 송수신 등을 할 때 사용하는 페이퍼 컨트롤러(3400)에 대해 설명한 도이다.
페이퍼 컨트롤러(3400)의 좌측에는 음성 녹음, 재생, 링크를 하기 위한 심볼이 인쇄되고, 우측에는 음성 메일의 송수신 등을 하기 위한 심볼이 인쇄되어 있다.
도 35는, 음성 메일 데이터베이스에 대해 설명한 도이다.
동도는, 음성 레코더끼리 블루투스 인터페이스(I/F)를 통해, 음성 메일 제어부와 통신 하면서 음성 레코더에 입력된 음성 메일, 즉 음성 데이터를 송수신하는 시스템이다.
음성 메일 제어부는, 네트워크 접속 가능한 범용의 서버 또는 PC로 구성되어 있고, 이 서버 또는 PC에 접속된 하드 디스크 장치에 음성 데이터 격납부가 설치되어 있다.
음성 데이터 격납부에는, 수신용 인덱스 테이블과, 송신용 인덱스 테이블이 설치되어 있다. 여기에서 수신용 인덱스 테이블에는, 수신 ID(발신원의 어드레스 또는 수신측 음성 레코더의 ID 번호)와 데이터 격납 어드레스가 링크되어 등록되어 있다. 또한, 송신용 인덱스 테이블에는 송신 ID(송신선의 어드레스 또는 송신선 음성 레코더의 ID 번호)와 데이터 격납 어드레스가 링크되어 등록되어 있다.
즉, 음성 메일 제어부는, 그 음성 메일 제어부가 관리해야 할 음성 레코더의 ID를 수신용 인덱스 테이블에 등록해 두고, 해당 음성 레코더에 정의된 수신 ID를 수신처로 하는 음성 메일을 자신의 음성 데이터 격납부의 수신용 인덱스 테이블에 등록하게 되어 있다.
한편, 음성 메일 제어부가 관리하는 음성 레코더에 의해 음성 메일이 입력되었을 때에는, 송신용 인덱스 테이블에 송신 ID(송신선의 어드레스나 송신선의 음성 레코더 ID)를 일단 등록해 둔다. 그 후, 음성 메일 제어부는, 정기적으로 송신용 인덱스 테이블에 액세스하고, 여기에 미송신의 음성 메일이 있는 경우에는, 네트워크 인터페이스(NW I/F) 및 네트워크를 통해 음성 메일 데이터를 송신 ID를 관리하는 도시하지 않는 음성 메일 제어부에 대해 송신한다.
도 36은, 음성 레코더와 PC(음성 메일 제어부) 사이에서의 데이터의 송수신에 대해 설명하는 플로차트(flow chart)이다.
먼저, 통신 가능한 영역에 음성 레코더가 있는지 없는지를 판단한다(3601). 음성 레코더가, PC 근방에 배치되면, 블루투스 등의 근거리 무선통신 시스템에 의해, 음성 레코더 ID가 PC로 송신된다. 이 음성 레코더 ID가 송신되었을 경우에는, 통신 가능한 영역에 음성 레코더가 있다고 판단한다.
다음에, 음성 레코더 ID가 읽혔는지 아닌지를 판단한다(3602). PC는, 블루투스 I/F를 통해 음성 레코더 ID를 읽어 들인다.
다음에, 수신 인덱스 테이블에 일치하는 ID가 있는지 아닌지를 판단한다(3603). 제어부는, 음성 데이터 데이터베이스 내의 수신 인덱스 테이블에, 읽어 들인 음성 레코더 ID에 일치하는 ID가 존재하는지 아닌지를 판단한다. 수신 ID가 존재한다고 판단한 경우에는, 수신 ID에 대응하는 데이터 격납 어드레스에 액세스하고, 수신 데이터를 읽어낸다(3604). 그리고, 읽어낸 수신 데이터를, 블루투스 I/F를 통해 음성 레코더에 전송하고(3605), 본 처리를 종료한다.
한편, 수신 인덱스 테이블에 일치하는 ID가 없는 경우에는, 음성 레코더 내에 송신 데이터가 있는지 없는지를 판단한다(3606). 송신 데이터가 있는 경우에는, 송신 데이터, 즉, 송신선의 어드레스와 음성 데이터를 읽어 들이고, 데이터베이스 내의 송신 데이터 인덱스 테이블에 등록한다(3607). 등록이 완료하면, 본 처리를 종료한다.
도 37은, 유저끼리 음성 메일을 송수신하는 구체적인 예를 나타낸 것이다. 동도는 도 38에도 나타낸 바와 같이, 네트워크 상에 음성 메일 관리 서버가 접속되고, 음성 메일을 일원적으로 관리하는 시스템으로 되어 있다.
유저(A)가, 옥외에서 음성 레코더의 마이크를 향해 입력하고 싶은 음성을 발성하면, 음성 레코더의 마이크를 통해 이 메모리 내에 음성 데이터가 디지털 데이터로서 축적된다.
다음에 유저(A)는, 음성 메일의 송신선를 결정한다. 즉, 페이퍼 컨트롤러를 이용하여, 송신선의 어드레스를 입력한다. 입력한 어드레스는, 음성 레코더의 메모리 내에 등록된다.
유저(A)는, 자택이나 직장 등의 실내로 들어가 음성 메일의 송신 처리를 할 때에는, 먼저 유저는, 음성 메일을 PC의 근방에 배치한다. 그러면, 블루투스 통신 기능에 의하여, PC는 음성 레코더마다 정의된 장치 ID, 즉 음성 레코더 ID를 읽어 들인다. 다음에, 메모리에 축적된 음성 데이터 및 메일 어드레스가 PC로 송신된다.
PC(음성 메일 제어부)는, 음성 데이터 및 메일 어드레스를 수신하면, 모니터(디스플레이 장치)에 ‘음성 메일 수신 중’의 표시를 한다. 그리고, 음성 메일 관리 서버에 대하여 상기 음성 데이터 및 메일 어드레스를 송신한다.
음성 메일 관리 서버는, 수신한 음성 데이터 및 어드레스를, 서버 내의 데이터베이스에 등록한다. 그리고, 네트워크 I/F를 통해, 음성 데이터를 해당하는 메일 어드레스 앞으로 송신한다. 음성 메일을 수신한 PC는, 모니터(디스플레이 장치)에 ‘음성 메일 취득송신’의 표시를 한다. 그리고, 블루투스 I/F를 통해서, 음성 데이터를 유저(B)의 음성 레코더에 송신한다. 음성 레코더는, 음성 데이터를 수신하면, ‘음성 메일이 도착해 있습니다’라고, 음성 및/또는 음성 레코더의 모니터에서, 유저(B)에게 통지한다. 이에 따라 유저(B)는, 유저(A)가 송신한 메세지를 수신한다.
도 38은, PC에 인스톨된 제어 프로그램(음성 메일 매니저)에 의해, 음성 메일 관리 서버와 연동하면서 음성 레코더를 사용하는 경우의 예에 나타낸 것이다.
유저는 CD-ROM, 또는 인터넷의 배신 서버에 액세스하여 다운로드한 인스톨 프로그램을 PC 상에서 실행하고, OS(operating system) 상에 음성 메일 매니저를 상주 프로그램으로서 등록한다.
다음에, 음성 레코더가, PC 근방에 배치되면, 블루투스 등의 근거리 무선통신 시스템에 의해, PC에 음성 레코더 ID가 송신된다. PC 내의 중앙처리장치(CPU) 는, 음성 메일 관리 서버에 있어서, 음성 레코더 ID의 인증을 한다. 즉, 송신된 음성 레코더 ID가, 해당 PC를 사용해 데이터를 송수신할 수 있는 음성 레코더의 ID인지 아닌지를 인증한다.
여기서, 송수신이 가능한 음성 레코더인 경우에는, PC 내의 음성 메일 관리 테이블(도트 코드 관리 테이블)을 참조하고, 해당 음성 레코더 ID 앞으로 송신된 음성 메일이 격납되어 있는지 아닌지를 확인한다.
음성 메일이 격납되고 있는 경우에는, 중앙처리장치(CPU)는, 이 음성 메일을 읽어내어, 블루투스 등의 근거리 무선통신 시스템에 의해, 음성 레코더에 송신한다.
다음에, PC로부터 수신한(다운로드한) 음성 데이터를 해당 음성 레코더로 재생함으로써, 수신자는 음성 메일을 들을 수 있도록 되어 있다.
음성 메일 관리 테이블(도트 코드 관리 테이블)에 음성 메일이 격납되어 있지 않은 경우에는, 인터넷 상의 음성 메일 관리 서버를 참조한다. 여기에서, 음성 메일 관리 서버의 음성 메일 관리 테이블에, 해당 음성 레코더 ID 앞으로 송신된 음성 메일이 격납되고 있으면, 이 음성 메일을 읽어내어, PC 내에 다운로드한다.
음성 레코더를 관리하고 있는 PC마다에 필요한 음성 메일이 PC 내에 다운로드될 때에는, 이 음성 메일과 함께, 이 음성 메일을 기동하기 위한 음성 메일 관리 테이블의 추가 데이터(음성 데이터 격납 어드레스, 도트 코드)도 다운로드되고, 이후는 PC 내의 음성 메일 관리 테이블만으로 관리되도록 되어 있다.
따라서, 그 후는 상기와 동일한 음성 레코더 ID가 송신되었을 경우, 다시 인 터넷 상의 음성 메일 관리 서버에 액세스하지 않고, 새로이 추가된 데이터를 포함한 음성 메일 관리 테이블에 기초하여, PC의 하드 디스크 장치(HD) 내에 다운로드된 음성 메일을 읽어내게 된다.
한편, 음성 레코더를 사용한 송신 처리를 하는 경우에는, PC는, 자신이 관리하는 음성 레코더가 근방에 배치된 때는, 해당 음성 레코더와의 블루투스 통신을 하고, 음성 레코더의 ID(디바이스 ID)를 읽어 들임과 동시에, 해당 음성 레코더의 메모리로부터 축적된 음성 메일을 읽어 들인다. 이 때, 음성 레코더에서의 녹음시에 도트 패턴을 스캔 했을 때의 도트 코드를 디바이스 ID에 링크시켜 등록해 둔다.
그리고, 배치처리에 의해, 정기적으로 해당 PC는 음성 메일 관리 서버로 억세스하고, 해당 음성 메일 관리 테이블의 데이터를 음성 메일 관리 서버로 송신한다. 음성 메일 관리 서버에서는, 해당 데이터를 수신하면, 이 데이터를 바탕으로 자신의 음성 메일 관리 테이블을 갱신한다.
<음성인식 데이터 통신>
도 40은, 본 발명의 실시 형태에 대해 설명한 것이다. 본 발명에서는, 음성인식 데이터 통신을 함으로써, 여러 가지 제어를 할 수 있다. 도 40은, 그 한 예로서 공장에서 제어를 하는 경우의 구체적인 예를 나타낸 것이며, 도 41은, 제어 시에 이용하는 페이퍼 컨트롤러를 나타낸 것이다.
이와 같이, 본원 발명에서는, 도트 패턴으로 입력을 제어한 음성 레코더를 사용하여, 공작 로봇이나 인쇄기의 제어가 가능하게 된다.
한편, 본 발명은, 본 실시 형태에서 설명한 형태 이외에, 예를 들어 취재용 의 음성 레코더의 제어 기술로서도 응용할 수 있다. 예를 들어, 인터뷰어(interviewer)가 인터뷰 할 때의 음성 레코더로서 사용하고, 음성인식의 제어를 도 34로 나타낸 페이퍼 컨트롤러에 의하여 수행해도 된다.
또한, 도 37 및 도 38에서 설명한 음성 레코더는 네트워크를 통해 음성 데이터를 송수신하는 기능을 가지고 있기 때문에, 해당 음성 레코더를 예를 들면 IP 전화의 마이크와 스피커를 구비한 단말로서 사용할 수도 있다. 이 경우, 음성 레코더가 항상 PC 근방에 배치되고 있는 경우에는, 통상의 IP 전화 단말로서 사용할 수 있기 때문에, 음성 데이터를 축적해 두는 내장 메모리는 불필요해지지만, 이와 같은 메모리를 장비해 둠으로써, PC와의 통신을 할 수 없는 격리된 장소에 있을 때에도 음성 메일을 해당 음성 레코더에 등록해 둘 수 있다. 이 경우, PC 근방에 음성 레코더가 배치되었을 때, 블루투스 통신에 의해 PC에 인스톨된 음성 메일 매니저 등에 의해 자동적으로 음성 메일이 송신되거나 수신 되거나 하는 것도 가능하게 된다.
도 39는 그와 같은 용도로 사용하는 페이퍼 컨트롤러를 나타내고 있으며, PC에서 수신된 자기 앞의 음성 메일을 재생하거나 다운로드할 수 있다.
또한, PC에 대해서 음성 메일을 작성등록하거나, 업로드(upload)할 수 있다.
또한, PC 내의 음성 메일과 음성 레코더의 메모리 내용을 싱크로나이즈(synchronize)하는 모드(PC와 싱크로나이즈)의 도트 패턴이 등록된 영역도 준비되어 있다.
본 발명은, 그림책, 사진, 카드, 씰 등의 매체와 음성 정보의 재생을 링크시키는데 관한 것으로, 음성 녹음기, 음성 재생장치, 음성인식을 위한 입력 기기로서 이용할 수 있다.

Claims (6)

  1. 음성 정보를 입력하는 음성 정보 입력 수단과,
    입력된 음성 정보를 기억하는 기억 수단과,
    미리 인쇄된 도트 패턴을 읽어내는 광학 독취 수단과,
    광학 독취 수단으로 독취된 도트 패턴을 코드 정보좌표 정보로 변환하는 변환 수단과,
    상기 변환 수단에 의해 변환된 코드 정보좌표 정보를 상기 음성 정보와 링크시키기 위한 링크설정 지시 수단과,
    링크설정 지시 수단에 의해 링크된 코드 정보좌표 정보와 상기 음성 정보와의 링크관계를 등록하는 링크 테이블과,
    상기 광학 독취 수단으로 다시 도트 패턴을 읽어낸 후에, 상기 링크 테이블에서 링크된 상기 음성 정보를 상기 기억 수단으로부터 읽어내어 출력하는 음성 정보 재생 수단
    을 포함하는 것을 특징으로 하는 음성 정보 기록 장치.
  2. 제 1항에 있어서, 상기 링크 테이블은, 1개의 음성 정보에 대하여, 복수의 코드 정보좌표 정보를 링크시키는 것을 특징으로 하는 음성 정보 기록 장치.
  3. 제 1항에 있어서, 상기 음성 정보를 기억하는 기억 수단은, 카드 기억 매체 인 것을 특징으로 하는 음성 정보 기록 장치.
  4. 제 1항에 있어서, 적어도, 상기 음성 정보의 입력 개시와, 음성 정보의 입력 종료와, 음성 정보의 재생과, 재생의 정지를 지시하기 위해,
    상기 광학 독취 수단으로 독취 가능한 도트 패턴이 인쇄된 인쇄 매체를 장치 본체와는 별도로 갖는 것을 특징으로 하는 음성 정보 기록 장치.
  5. 제 3항에 있어서, 상기 코드 정보좌표 정보와 상기 음성 정보와의 링크설정, 또는 링크설정의 해제를 지시하는 상기 링크설정 지시 수단으로서,
    상기 광학 독취 수단으로 독취 가능한 도트 패턴이 인쇄된 인쇄 매체를 장치 본체와는 별도로 갖는 것을 특징으로 하는 음성 정보 기록 장치.
  6. 제 1항 내지 제 5항 중 어느 한 항에 있어서, 상기 도트 패턴은 상기 매체면과 상기 광학 독취 수단과의 위치 관계에 의하여 방향을 갖는 도트 패턴에 있어서,
    상기 광학 독취 수단으로 촬영한 도트 패턴이 화소군으로서 격납되는 화상 기억 영역에 있어서, 그곳에 격납된 화소군을 바탕으로 XY 좌표의 X정방향 또는 Y정방향과, 도트 패턴의 방향이 이루는 각도를 계산하는 수단을 구비하고,
    상기 코드 정보좌표 정보에 더하여 각도 정보마다 서로 다른 상기 음성 정보를 기억재생 가능하게 하는 수단을 포함하는 것을 특징으로 하는 음성 정보 기록 장치.
KR1020077027213A 2005-05-19 2006-05-19 음성 정보 기록 장치 KR20080028359A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JPJP-P-2005-00147084 2005-05-19
JP2005147084 2005-05-19
WOPCT/JP2006/309521 2006-04-28
PCT/JP2006/309521 WO2006123575A1 (ja) 2005-05-19 2006-04-28 音声情報記録装置

Related Child Applications (2)

Application Number Title Priority Date Filing Date
KR1020097024613A Division KR101000810B1 (ko) 2005-05-19 2006-05-19 음성 인식 시스템
KR1020097024614A Division KR101032752B1 (ko) 2005-05-19 2006-05-19 보이스 메일 시스템

Publications (1)

Publication Number Publication Date
KR20080028359A true KR20080028359A (ko) 2008-03-31

Family

ID=37431151

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020097024614A KR101032752B1 (ko) 2005-05-19 2006-05-19 보이스 메일 시스템
KR1020077027213A KR20080028359A (ko) 2005-05-19 2006-05-19 음성 정보 기록 장치
KR1020097024613A KR101000810B1 (ko) 2005-05-19 2006-05-19 음성 인식 시스템

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020097024614A KR101032752B1 (ko) 2005-05-19 2006-05-19 보이스 메일 시스템

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020097024613A KR101000810B1 (ko) 2005-05-19 2006-05-19 음성 인식 시스템

Country Status (6)

Country Link
US (2) US8843374B2 (ko)
EP (2) EP2352273B1 (ko)
JP (3) JP4268641B2 (ko)
KR (3) KR101032752B1 (ko)
CN (4) CN102623029B (ko)
WO (1) WO2006123575A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007336465A (ja) * 2006-06-19 2007-12-27 Fuji Xerox Co Ltd 活動履歴記録装置および方法
CN101981941A (zh) 2008-04-04 2011-02-23 吉田健治 手机用支座、电视电话系统、卡拉ok系统、汽车导航系统及紧急信息通知系统
US9002486B1 (en) * 2009-04-14 2015-04-07 Smith Micro Software, Inc. Audio systems and methods
JP6058925B2 (ja) * 2012-07-04 2017-01-11 独立行政法人大学入試センター リスニングテストに用いられる文書情報再生システム及び該文書情報再生システムに用いられる問題用紙
US20150341713A1 (en) * 2014-05-25 2015-11-26 I-Lin Tsai Voice sticker structure
CN107451185B (zh) * 2017-06-22 2022-03-04 重庆缘溪行文化传媒有限公司 录音方法、朗读系统、计算机可读存储介质和计算机装置
US20190018408A1 (en) * 2017-07-12 2019-01-17 Qualcomm Incorporated Systems and methods for verifying integrity of a sensing system

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5126543A (en) * 1989-11-27 1992-06-30 Pitney Bowes Inc. Integrated hand microphone with barcode reader and dictation controls
US5059126A (en) * 1990-05-09 1991-10-22 Kimball Dan V Sound association and learning system
US5237628A (en) * 1991-06-03 1993-08-17 Nynex Corporation System and method for automatic optical data entry
US5852803A (en) * 1992-03-20 1998-12-22 Chips International, Inc. Apparatus, system and method for recording and/or retrieving audio information
US5235654A (en) * 1992-04-30 1993-08-10 International Business Machines Corporation Advanced data capture architecture data processing system and method for scanned images of document forms
DK0670555T3 (da) * 1992-09-28 2000-09-18 Olympus Optical Co Registreringsmedium med prikkode og informationsregistreringssystem
US5698834A (en) * 1993-03-16 1997-12-16 Worthington Data Solutions Voice prompt with voice recognition for portable data collection terminal
US5455872A (en) * 1993-04-26 1995-10-03 International Business Machines Corporation System and method for enhanced character recogngition accuracy by adaptive probability weighting
US5905250A (en) * 1993-12-27 1999-05-18 Olympus Optical Co., Ltd. Audio information recording/reproducing system
US6424830B1 (en) * 1994-07-26 2002-07-23 Telxon Corporation Portable data collection network with telephone and voice mail capability
JPH0870366A (ja) * 1994-08-26 1996-03-12 Hitachi Ltd 音声メッセージの記録再生方法及び通信装置
JP2952170B2 (ja) * 1994-12-16 1999-09-20 オリンパス光学工業株式会社 情報再生システム
JPH096798A (ja) * 1995-06-19 1997-01-10 Sony Corp 情報処理システムおよび情報処理方法
JPH0944591A (ja) * 1995-08-03 1997-02-14 Olympus Optical Co Ltd コードシート及び情報再生装置
US5787445A (en) * 1996-03-07 1998-07-28 Norris Communications Corporation Operating system including improved file management for use in devices utilizing flash memory as main memory
US6397184B1 (en) * 1996-08-29 2002-05-28 Eastman Kodak Company System and method for associating pre-recorded audio snippets with still photographic images
US7327711B2 (en) * 1996-09-05 2008-02-05 Symbol Technologies, Inc. System for digital radio communication between a wireless LAN and a PBX
US6038199A (en) * 1997-11-21 2000-03-14 Dictaphone Corporation Portable digital audio recorder with adaptive control configurations
US6148173A (en) * 1998-02-26 2000-11-14 Eastman Kodak Company System for initialization of an image holder that stores images with associated audio segments
GB0003903D0 (en) * 2000-02-18 2000-04-05 Canon Kk Improved speech recognition accuracy in a multimodal input system
US7233903B2 (en) * 2001-03-26 2007-06-19 International Business Machines Corporation Systems and methods for marking and later identifying barcoded items using speech
US6869016B2 (en) * 2001-04-04 2005-03-22 Symbol Technologies, Inc. Bar code data driven communications by mobile computer terminals operable in wireless networks
JP2003067121A (ja) * 2001-08-24 2003-03-07 Tsubasa System Co Ltd 入力指示書及び情報処理装置
JP3943983B2 (ja) * 2002-04-18 2007-07-11 キヤノン株式会社 音声認識装置及びその方法、プログラム
US20040202291A1 (en) * 2002-08-27 2004-10-14 Skinner Davey Nyle Mobile phone with voice recording transfer function
US7967217B2 (en) * 2002-09-26 2011-06-28 Kenji Yoshida Information reproduction/i/o method using dot pattern, information reproduction device, mobile information i/o device, and electronic toy
AU2002952106A0 (en) * 2002-10-15 2002-10-31 Silverbrook Research Pty Ltd Methods and systems (npw008)
CA2529037A1 (en) * 2003-08-15 2005-02-24 Silverbrook Research Pty Ltd Natural language recognition using distributed processing

Also Published As

Publication number Publication date
JP4268641B2 (ja) 2009-05-27
US8843374B2 (en) 2014-09-23
CN101180672A (zh) 2008-05-14
JP4268667B2 (ja) 2009-05-27
KR20090127444A (ko) 2009-12-11
KR20090127445A (ko) 2009-12-11
KR101032752B1 (ko) 2011-05-06
EP2352273B1 (en) 2017-01-11
EP2352273A1 (en) 2011-08-03
EP2302632B1 (en) 2016-02-17
CN103208297A (zh) 2013-07-17
CN102623029A (zh) 2012-08-01
WO2006123575A1 (ja) 2006-11-23
JPWO2006123837A1 (ja) 2008-12-25
CN102592633A (zh) 2012-07-18
US20150012276A1 (en) 2015-01-08
JP2009009141A (ja) 2009-01-15
JP4270520B2 (ja) 2009-06-03
CN102592633B (zh) 2014-05-28
EP2302632A1 (en) 2011-03-30
US20090094034A1 (en) 2009-04-09
KR101000810B1 (ko) 2010-12-13
CN102623029B (zh) 2014-08-20
JP2008182689A (ja) 2008-08-07

Similar Documents

Publication Publication Date Title
JP4691741B2 (ja) 携帯電話用クレードル、tv電話システム、カラオケシステム、カーナビゲーションシステム、および緊急情報通知システム
US20150012276A1 (en) Voice recording for association with a dot pattern for retrieval and playback
JP5489118B2 (ja) 入出力装置、情報入出力システム
US8169469B2 (en) Information processing device, information processing method and computer readable medium
CN108174236A (zh) 一种媒体文件处理方法、服务器及移动终端
JP2008198135A (ja) 情報配信システム、情報配信装置および情報配信方法
EP1887560A1 (en) Audio information recording device
JP4248589B2 (ja) 音声認識システム
KR20200054153A (ko) 마이크로폰으로 인공지능스피커와 연동되는 전자펜 시스템
RU2005112458A (ru) Способ воспроизведения информации, способ ввода/выводаин информации, устройство воспроизведения информации, портативное устройство ввода/вывода информации и электронная игрушка, в которой использован точечный растр
KR20200054152A (ko) 인공지능스피커와 연동하여 인터랙티브 프로그램을 제어하는 전자펜 시스템
JP2012022424A (ja) ストリームドットを用いた音声情報記録装置
US20230280961A1 (en) Device management system, information processing system, information processing device, device management method, and non-transitory recording medium
WO2012008466A1 (ja) ストリームドットを用いた情報入出力方法、情報入出力装置、音声情報記録装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
A107 Divisional application of patent
AMND Amendment
B601 Maintenance of original decision after re-examination before a trial
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20091028

Effective date: 20110223