CN102623029B - 声音识别系统 - Google Patents
声音识别系统 Download PDFInfo
- Publication number
- CN102623029B CN102623029B CN201210002866.7A CN201210002866A CN102623029B CN 102623029 B CN102623029 B CN 102623029B CN 201210002866 A CN201210002866 A CN 201210002866A CN 102623029 B CN102623029 B CN 102623029B
- Authority
- CN
- China
- Prior art keywords
- information
- dot pattern
- sound
- voice
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000008676 import Effects 0.000 claims description 3
- 239000013028 medium composition Substances 0.000 claims 1
- 238000012545 processing Methods 0.000 description 74
- 238000003860 storage Methods 0.000 description 40
- 238000000034 method Methods 0.000 description 26
- 230000006870 function Effects 0.000 description 24
- 238000004891 communication Methods 0.000 description 20
- NJPPVKZQTLUDBO-UHFFFAOYSA-N novaluron Chemical compound C1=C(Cl)C(OC(F)(F)C(OC(F)(F)F)F)=CC=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F NJPPVKZQTLUDBO-UHFFFAOYSA-N 0.000 description 20
- 238000007639 printing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 238000007726 management method Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 15
- 239000000123 paper Substances 0.000 description 12
- 238000001514 detection method Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 239000004973 liquid crystal related substance Substances 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000005855 radiation Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000012905 input function Methods 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 239000002023 wood Substances 0.000 description 2
- 108091006146 Channels Proteins 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 102100022193 Glutamate receptor ionotropic, delta-1 Human genes 0.000 description 1
- 101000900493 Homo sapiens Glutamate receptor ionotropic, delta-1 Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000002224 dissection Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000003475 lamination Methods 0.000 description 1
- WABPQHHGFIMREM-UHFFFAOYSA-N lead(0) Chemical compound [Pb] WABPQHHGFIMREM-UHFFFAOYSA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K19/00—Record carriers for use with machines and with at least a part designed to carry digital markings
- G06K19/06—Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B33/00—Constructional parts, details or accessories not provided for in the other groups of this subclass
- G11B33/10—Indicating arrangements; Warning arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/0035—User-machine interface; Control console
- H04N1/00352—Input means
- H04N1/00403—Voice input means, e.g. voice commands
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/17—Card-like record carriers
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
- Facsimiles In General (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
- Time Recorders, Dirve Recorders, Access Control (AREA)
Abstract
生成链接表,并对每个点图案将声音信息关联起来,在用扫描器读取上述点图案之际,将与该点图案建立联系的声音信息从扬声器进行重放。由此,就能够在图画书或卡等的表面印刷点图案,并重放与图画书的图案或故事相对应的声音信息,或者重放与卡上所记载的字符相对应的声音信息。另外借助于链接表还能够在新的点图案上将新的声音信息建立联系,或者解除并进行变更等。
Description
本申请是申请号为200680017364.4、国际申请日为2006年5月19日(国际申请号为PCT/JP2006/310501)、发明名称为“声音信息记录装置”的发明专利申请的分案申请。
技术领域
本发明涉及使用了通过以光学方式读取在印刷物等上形成的点图案信息,而使声音信息输出的点图案的信息输入输出方法。
背景技术
以往,人们提出读取在印刷物等上印刷的条形码,并将与此条形码对应的声音等信息从存储器读出使之输出的信息输出方法。例如,预先在存储部件上存储与所赋予的键信息一致的信息,并根据条形码阅读器所读入的键来进行检索而输出信息等的方法得以提案。另外,为了能够输出丰富多彩的音声信息,还提出了生成以规定的法则将细微的点排列起来的点图案,并借助于照相机将印刷物等上印刷的点图案作为图像数据取入,进行数字化并使声音信息输出的技术。
但是,上述以往的通过条形码使声音等输出的方法,存在印刷在印刷物等上的条形码碍眼之类的问题。另外,由于条形码较大而占有纸面的一部分,所以若像这样条形码较大就具有一部分的文章或句子或者照片、图画、图形的图像之中出现的具有含意的字符或对象物的每个分配易理解数量多的条形码在布局上不可能之类的问题。
进而,被分配给条形码的声音是固定的,在读取到同一条形码的情况下常常只能输出同一声音信息。
发明内容
本发明就是为了解决这种问题点而首创的。即、本发明的目的在于解决如下技术课题:通过提出用户能够任意地设定/解除点图案与声音信息的关系(链接)的结构而提供一种声音信息记录方式,其可以进行与任意的点图案所关联起来的声音信息的记录、且可以进行声音信息与点图案的关系(链接)的设定/解除,由此就可以使两者的关系持有灵活性,对每个点图案将不同声音信息建立联系,或者用多个不同的点图案使同一声音信息重放。
本发明为了解决上述课题而采用了以下手段。
本发明的技术方案1是一种声音信息记录装置,包括:输入声音信息的声音信息输入部件;存储所输入的声音信息的存储部件;读取预先所印刷的点图案的光学读取部件;将光学读取部件所读取到的点图案变换成代码信息/坐标信息的变换部件;将由上述变换部件所变换的代码信息/坐标信息与上述声音信息建立联系的关系建立指示部件;登录由关系建立指示部件所建立联系的代码信息/坐标信息与上述声音信息的关系建立的链接表;以及在上述光学读取部件再次读取了点图案以后,将用上述链接表而建立联系的上述声音信息从上述存储部件读出并输出的声音信息重放部件。
根据该声音信息记录装置,就能够对每个点图案将声音信息关联起来,在用光学读取部件读取到上述点图案时,从声音信息重放部件输出对该点图案建立联系的声音信息。由此,就能够在图画书或卡等表面上印刷点图案,并重放与图画书或图案或故事对应的声音信息,或者重放与卡上记载的字符相对应的声音信息。另外通过关系建立指示部件能够对新点图案将声音信息重新建立关系,或者解除等进行变更。
此外,除在上述图画书或卡以外点图案还可以设置在名片、笔记本、封印纸等什么样的媒体上。
另外,点图案既可以与存储部件所存储的声音信息对应的代码信息,也可以是坐标信息。在作为代码信息的情况下,能够重放在与代码信息对应的地址上记录的声音信息,在坐标信息的情况下,能够重 放与光学读取部件读取到的位置(坐标信息)对应的声音信息。
本发明技术方案2是按照技术方案1所记载的声音信息记录装置,其中:上述链接表将多个代码信息/坐标信息对一个声音信息建立联系。
这样通过将一个声音信息与多个点图案建立联系,即便在用光学读取部件读取到点图案不同的多个卡的情况下也能够使同一声音信息重放。
本发明技术方案3是按照技术方案1所记载的声音信息记录装置,其中:上述存储声音信息的存储部件是卡存储介质。
通过在该声音信息记录装置上安装可自由拆装的卡存储介质,就能够对每个卡存储介质重放不同的声音信息。另外,通过对每个卡存储介质设置核对表和核对代码,就能够对每个卡存储介质变更声音信息的重放条件。具体而言还能够采用对每个企业、每个ゲ一ム设定不同的核对代码,根据点图案上登录的该核对代码正确与否来判定声音信息的重放许可/不许可的这样的方法。
本发明技术方案3是按照技术方案1所记载的声音信息记录装置,其中:至少为了指示上述声音信息的输入开始、声音信息的输入结束、声音信息的重放、和重放的停止,而具有印刷了可由上述光学读取部件读取的点图案的印刷媒体。
通过用点图案的读取来进行声音信息的输入开始等指示输入,与用硬件开关来进行的情况相比较就可以在视觉上直感地操作声音信息记录装置。
本发明技术方案4是按照技术方案3所记载的声音信息记录装置,其中:作为指示上述代码信息/坐标信息与上述声音信息的关系建立、或者关系建立的解除的上述关系建立指示部件,而具有印刷了可由上述光学读取部件读取的点图案的印刷媒体。
点图案与声音信息的关系建立以及解除指示还可有用点图案的读取来进行,由此就可以进一步在视觉上直感地操作声音信息记录装置。
本发明技术方案5是按照技术方案3所记载的声音信息记录装置,其中:作为指示上述代码信息/坐标信息与上述声音信息的关系建立、或者关系建立的解除的上述关系建立指示部件,与装置本体区别开来具有印刷了可由上述光学读取部件读取的点图案的印刷媒体。
通过使用这种印刷了点图案的印刷媒体(所谓纸板控制器)来构成声音信息记录装置,就可以通过目视印刷部分来实现声音信息记录装置的可视方式的操作。
本发明技术方案6是按照技术方案1~5所记载的声音信息记录装置,其中:上述点图案是根据上述媒体面与上述光学读取部件的位置关系而具有方向的点图案,具备在用上述光学读取部件所摄影的点图案作为像素组被保存起来的图像存储区域中,计算基于在该处所保存的像素组的XY坐标的X正方向或者Y正方向、与点图案的方向所成的角度的部件,并具有除上述代码信息/坐标信息外还可以存储/重放对每个角度信息不同的上述声音信息的部件。
由于点图案根据媒体面与上述光学读取部件的位置关系具有方向,所以着眼于其对每个方向使不同的声音信息输出。
根据本发明,就可以进行与任意的点图案上所关联起来的声音信息的记录,且可以进行声音信息与点图案的关系(链接)的设定/解除,由此就能够提供一种声音信息记录方式,使两者的关系持有灵活性,对每个点图案将不同的声音信息建立关系,用多个不同的点图案使同一声音信息重放。
附图说明
图1是话音记录器的正面图(1)。
图2是话音记录器的左侧面图。
图3是话音记录器的右侧面图。
图4是表示话音记录器的使用状态的说明图。
图5是话音记录器的内部构成框图。
图6是表示指示板的符号的配置状态的图。
图7是表示声音文件格式的图。
图8是核对表、核对代码的说明图。
图9是话音记录器的正面图(2)。
图10是链接表的说明图。
图11是表示存储卡的图。
图12是用于说明点图案的图(1)。
图13是用于说明点图案的图(2)。
图14是用于说明点图案的图(3)。
图15是用于说明点图案的图(4)。
图16是用于说明点图案的图(5)。
图17是用于说明点图案的图(6)。
图18是用于说明作为存储卡使用了SD卡的状态的图。
图19是用于就话音记录器的其他的实施方式进行说明的图。
图20是用于就具有检测角度的功能的话音记录器进行说明的图。
图21是表示在图20中使用的指示板的符号的配置状态的图。
图22是表示录音/链接处理的流程图(1)。
图23是表示录音/链接处理的流程图(2)。
图24是表示重放已链接完毕的声音的处理的流程图。
图25是用于就检测角度的方法进行说明的图(1)。
图26是用于就声音决定表进行说明的图。
图27是用于就检测角度的方法进行说明的图(2)。
图28是用于就具有检测角度的功能的话音记录器的、其他实施方式进行说明的图(1)。
图29是用于就具有检测角度的功能的话音记录器的、其他实施形态进行说明的图(2)。
图30是用于就具有检测角度的功能的话音记录器的、其他实施方式进行说明的图(3)。
图31是用于就本发明的其他实施方式进行说明的图。
图32是表示在图31的实施例中使用的指示板的符号的配置状态的图。
图33是作为本发明一实施方式的话音邮件系统中的网络构成图。
图34是表示在话音邮件系统中使用的纸板控制器的符号的配置状态的图。
图35是用于就话音邮件数据库进行说明的图。
图36是表示收发话音邮件的处理的流程图。
图37是用于就话音邮件的收发进行说明的图。
图38是用于就作为话音邮件系统一实施例的话音邮件管理器进行说明的图。
图39是表示在话音邮件管理器中使用的纸板控制器的符号的配置状态的图。
图40是用于就本发明一实施方式即利用声音识别数据通信的机器控制进行说明的图。
图41是表示在机器控制中使用的纸板控制器的符号的配置状态的图。
附图标记说明
1点图案;2键点;3信息点;4格子点;101、1901、3101话音记录器;102、1902、3102扬声器;103录音/停止按钮;104录音/重放显示部;105链接显示部;106存储卡;107话筒;108电源开关;109音量调节器;110连接器端子;111声音输出端子;112外部电源端子;113扫描器(光学读取部件);114电缆;115USB连接器;116照片;600指示板;701索引;702声音文件道;1903传感器单元;1904、3104扫描按钮;1905录音按钮;1906音量;1907LED;1908、2004、3108话筒;2001台座;2002工作台;2003塑像;2005液晶显示部;2006、3200纸板控制器;2801计算机;3105录音按钮;3109天线。
具体实施方式
图1是作为本发明实施方式的话音记录器(声音信息记录装置)的正面图,图2是其右侧面图,图3是其左侧面图。
在话音记录器101其框体表面上设置扬声器102,可以进行声音信息的重放输出。在扬声器102的上方设置有录音/停止按钮103、录音/重放显示部104、链接显示部105,在左上方设置有声音信息输入用的话筒107。
此外,还可以在话音记录器101的框体表面设置有如图9所示那样的液晶画面901。在该液晶画面901上可以显示录音状态、重放状态、停止状态、链接状态、录音/重放道编号等。
在话音记录器101的右侧面配置有电源开关108和音量调节器109,可以实现话音记录器101的电源接通和从扬声器102重放的声音信息的音量调节。
在话音记录器101的左侧面设置有连接器端子(SCANNER)110、声音输出端子(PHNE)111以及外部电源端子(DC IN)112。连接器端子110例如是USB端子等通用串行接口,如图4所示那样能够安装在扫描器113(光学读取部件)的电缆114的端部设置的USB连接器115。
在扫描器113上如图5所示那样配置有CMOS摄像元件(CMOSS),将来自LED(IRLED)的照射光照射到点图案的印刷面,其反射光通过经由可视光滤波器(未图示)而作为仅红外线区域的波长光被接受,其经透镜而由CMOS摄像元件进行摄影,该摄影图像由中央处理装置(MPU)进行解析,并作为解析结果的代码信息(32bit的点代码)或者坐标信息被发送给话音记录器101。此外,此时在点图案上配置键点2(参照图12以及图14)而构成点图案的块的方向(角度)也可以作为角度信息进行接收。
也就是说,通过将点图案的摄影图像展开到视频存储器,就可以知道各点的XY坐标值,所以通过以其为基础来检索格子点和键点就能够检测出该点图案的方向(与视频存储器的正XY坐标轴相对的点图案的角度)。
此外,在扫描器内解析软件被保存在ROM等中,中央处理装置(MPU)通过从该ROM读入该软件来执行摄影图像的解析处理(点图案的识别→数值变换→变换成点代码、坐标信息、角度信息)。
话音记录器101本体内,如图5所示那样以中央处理装置(MPU)为中心而构成。即、通过中央处理装置(MPU)的控制,从话筒输入的声音信息经由放大器通过A/D转换器、压缩电路进行处理,并作为数字声音信息经由连接器被记录在存储卡106(存储部件)中。
表示该存储卡106的外观的是图11。该存储卡106是例如内置了作为存储器的IC芯片的信用卡尺寸的塑料卡,具有构成信号引线、电源引线的接触型的电极106a。此外,还可以是非接触的无线通信型的RFID卡。另外,除这种卡以外,还可以是SD卡(商标名)、袖珍SD卡(商标名)、存储棒(商标名)、存储棒/Duo(商标名)等规格型的存储卡。
在该话音记录器101中,在重放声音信息之际,从存储卡106(存储部件)所读出的数字声音信息经由连接器读入到中央处理装置(MPU),用压缩电路进行逆压缩(展开),并用A/D转换器变换成模拟信息后经放大器(AMP)从扬声器输出。
此外,话音记录器101的驱动电流从电池经由DC-DC转换器,被提供给中央处理装置(MPU)、压缩电路、放大器(AMP)。
图6是用于通过扫描器113的读取来进行话音记录器101的操作指示的指示板600(纸板控制器;印刷媒体)。该指示板600印刷着表示话音记录器101的操作指示的符号。在该符号的区域上印刷着意味着与操作指示对应的代码的点图案。关于点图案后述。
该指示板600由纸材所构成,在纸材的表面上印刷着点图案,进而在其上层实施叠片加工。
在指示板600上设置有录音601、声音品质602a~602c、重放604、快进605、停止606、暂停619、返回/重放607、前进/重放608、开头/重放609、末尾/重放610,可以命令话音记录器101中的各个功能。
另外,在指示板600的下部印刷着链接关联的指示符号。即、配置有链接开始611、链接结束612、链接解除613、全链接解除614的各指示符号。
进而,在指示板600的最下部配置有声音删除615、全声音删除616的各指示符号和执行617、中止618的各指示符号。
此外,虽然没有图示,除此以外还可以在指示板600上印刷声音导航的符号。此声音导航是用于指示输入对话音记录器101或对指示板600进行操作时的声音引导的有无的符号。
图7是表示存储部件(存储卡)上所记录的声音信息的格式。声音信息由索引701、和多个声音文件道702构成。
在索引701上登录每个道的管理信息和重放标记。
另外,索引701记录着各声音文件道702的声音信息的删除/更新的禁止信息,由此声音文件道就可以分成可以删除/更新的道、和禁止删除/更新的道这两种来进行管理。
例如,作为禁止删除/更新的道,考虑有用声音对话音记录器101或指示板600的下一操作进行指示的导航声音文件得以保存的道、和用与图画书等成套销售的存储卡106预先按照图画书的故事配音员记录着声音的道等。另一方面,在可以删除/更新的道上能够输入已购入的用户成为图画书的登场人物而发声的台词等。
另外,还可以在禁止删除/更新的道上登录前述的声音导航的引导声音等。
图8是表示存储部件(存储卡)上所设置的核对表以及核对代码。
如同图所示那样,本实施方式中的核对表将C8~C22,C31的值设定为核对范围,当存在于此范围的核对代码与从点图案读取到的核对代码一致的情况下,该点图案作为适合于该话音记录器的情况而许可声音信息的重放。
此外,核对表可以任意地变更,例如还可以按该话音记录器的制造商、存储卡的制造商、游戏的种类来变更核对表的核对范围。
通过将这种核对表、核对代码登录在存储卡106中,就可以使与 该核对代码同一的代码作为点图案只能在印刷的图画书进行声音信息的录音/重放。即、能够提供如果不是与成套销售的图画书与存储卡106的组合就无法进行声音录音/重放的结构。
此时,中央处理装置(MPU)基于扫描器113读入的点图案,从扫描器113接收规定的区域的点代码(核对代码),并将其与存储卡106的核对代码进行比较如果一致就许可存储卡106内的声音信息的录音/重放。
图10是就链接表进行了说明的图,该链接表设置在存储卡106中。链接表如同图所示那样,用表示登录顺序的标签、声音文件道编号、和32bit的点代码构成。在本实施方式中,能够对一个声音文件道编号将多个点代码建立联系。由此,即便在用扫描器113读取到不同的许多点图案被印刷的照片、封印纸、图画书等媒体的情况下也可以使同一声音信息进行重放。
其次,就本实施方式中所用的点图案进行说明。
图12是表示作为本发明的点图案的一个例子的GRID1的说明图。图13是表示点图案的信息点以及被其所定义的数据的位显示的一个例子的扩大图。图14(a)、(b)是表示以键点为中心而配置的信息点的说明图。
利用了本发明的点图案的信息输入输出方法由点图案1的生成、该点图案1的识别和从该点图案1输出信息以及程序的部件组成。即、借助于照相机将点图案1作为图像数据取入,首先抽取格子点,其次通过在本来存在格子点的位置未被打点来抽取键点2,其次通过抽取信息点3而进行数字化并抽取出信息区域以谋求信息的数值化,并根据该数值信息从该点图案1使声音信息进行输出。
本发明的点图案1的生成根据点代码生成算法,为了使声音等信息识别而将细微点、即、键点2、信息点3、格子点4按照规定的规则进行配列。如图12所示那样,表示信息的点图案1的块以键点2为中心配置5×5的格子点4,并在4点格子点4所包围的中心的假想点的周围配置信息点3。在此块上定义任意的数值信息。此外,在图 12的图示例中,表示使点图案1的块(粗线框内)并列4个的状态。但是,当然点图案1并不限定于4块。
能够使一个块输出一个对应的信息,或者使多个块输出一个对应的信息。
格子点4在用照相机将该点图案1作为图像数据取入之际,能够对源于该照相机的透镜的失真或歪斜的摄像、纸面的伸缩、媒体表面的弯曲、印刷时的失真进行矫正。具体而言,求解将歪斜的4点格子点4变换成原来的正方形的校正用函数(Xn,Yn)=f(X′n,Y′n),并用该同一函数对信息点进行校正,求出正确信息点3的矢量。
若在点图案1上配置格子点4,则用照相机取入了该点图案1的图像数据对照相机造成的失真进行校正,所以即便在用附带失真系数高的透镜的普及型的照相机取入点图案1的图像数据时也能够正确地进行识别。另外,即便相对于点图案1的面将照相机倾斜来进行读取,也能够正确地识别该点图案1。
键点2如图12所示那样,是将处于呈矩形状配置的格子点4的大致中心位置的1个格子点4在一定方向上错开进行配置的点。该键点2是表示信息点3的1块部分的点图案1的代表点。例如,将点图案1的块中心的格子点4向上方错开了0.1mm。在信息点3表示X,Y坐标值的情况下,将键点2向下方错开了0.1mm的位置成为坐标点。但是,该数值并不限定于此,还可以依照点图案1的块大小而可变。
信息点3是识别各种信息的点。该信息点3以键点2作为代表点,配置在其周边,同时以用4点格子点4包围的中心作为假想点,并将其作为始点配置在由矢量表现的终点。例如,该信息点3被格子点4包围,如图13所示那样,从该假想点偏离了0.1mm的点具有矢量所表现的方向和长度,所以在顺时针方向每45度使之旋转而在8方向配置,表现3位。从而,1块的点图案1能够表现3位×16个=48位。
此外,虽然在图示例中在8方向上配置而表现3位,但并不限定于此,还可以配置在16方向上表现4位,当然还能够进行种种变更。
考虑到外观、和针对纸质的印刷精度、照相机的分辨率以及最佳 的数字化而希望键点2、信息点3或者格子点4的点径为0.05mm左右。
另外,考虑到对于摄像面积的必要的信息量、和各种点2,3,4的误认而希望格子点4的间隔为纵/横0.5mm前后。考虑到格子点4以及信息点3的误认而希望键点2的错位为格子间隔的20%前后。
该信息点3和4点格子点4所包围的假想点的间隔希望是邻接的假想点间的距离的15~30%程度的间隔。这是因为若信息点3与假想点间的距离较这一间隔远则点彼此易于被认识为大块,而作为点图案1变得难看。反之,若信息点3与假想点间的距离较这一间隔近则是否是以邻接的某个假想点为中心使其持有矢量方向性的信息点3的认定变得困难的缘故。
例如,信息点3如图14(a)所示那样以键点2为中心顺时针配置从I1到I16的格子间隔为0.5mm,按4mm×4mm来表现3位×16=48位。
此外,还能够在块内进一步设置具有各个独立的信息内容,且对其他信息内容没有影响的子块。图14(b)对其进行了图示,用4个信息点构成的子块[I1,I2,I3,I4]、[I5,I6,I7,I8]、[I9,I10,I11,I12][I13,I14,I15,I16]各自独立的数据(3位×4=12位)被展开成信息点。通过这样设置子块,就能够以子块为单位容易地进行错误检查。
信息点3的矢量方向(旋转方向)希望是按30度~90度均等地确定。
图15是信息点以及那里所定义的数据的位表现的例子,表示其他的形态。
另外,对于信息点3若根据从格子点4所包围的假想点使用长/短两种,将矢量方向设为8方向,就能够表现4位。此时,希望长的一方为邻接的假想点间的距离的25~30%左右,短的一方为15~20%左右。但是,希望长/短的信息点3的中心间隔比这些点的径长。
4点的格子点4所包围的信息点3考虑到美观希望为1点。但是,在无视美观,想增多信息量的情况下通过对每1矢量分配1位用多个 点来表现信息点3,就能够具有大量的信息。例如,在同心圆8方向的矢量中,能够用4点格子点4所包围的信息点3来表现28的信息,按1块的信息点16个而成为2128。
图16是信息点以及那里所定义的数据的位显示的例子,(a)表示配置了2个点,(b)表示配置了4个点以及(c)是表示配置了5个点的情况。
图17表示点图案的变形例,(a)是信息点6个配置型,(b)是信息点9个配置型,(c)是信息点12个配置型,(d)是信息点36个配置型的概略图。
图12与图14所示的点图案1表示1块配置了16(4×4)的信息点3的例子。但是,该信息点3并不限定于在1块上配置16个,而能够进行种种变更。例如,依照必要的信息量的大小或者照相机的分辨率,有在1块中配置了6个(2×3)信息点3的(a)、在1块中配置了9个(3×3)信息点3的(b)、在1块中配置了12个(3×4)信息点3的(c)、或者在1块中配置了36个(6×6)信息点3的(d)。
这种点图案被印刷在照片116(参照图4)或、图画书、卡等的表面。另外,还可以设置在图6中所说明的指示板600(纸板控制器)的各符号部分。
其次,就使用了本实施方式的话音记录器101的操作过程进行说明。
(基本功能)
点图案与图样重叠印刷的图画书、和已录音好的存储卡106被成套销售,将其购入的用户将存储卡106安装在话音记录器101上。然后,如图4所示那样将扫描器113的连接器115安装到连接器端子110。然后,若扫描器113读取在图画书的例如狗图画上重叠印刷的点图案,则扫描器的中央处理装置(MPU)通过解析软件对该点图案进行解析,变换成点代码(代码信息)。这一点代码被发送给话音记录器101的中央处理装置(MPU)。在话音记录器101中基于该点代码对存储卡106的链接表(参照图10)进行检索。然后,检索出与此点代码对应的声音 文件道702,并读出存储卡106内的符合条件的声音文件道702(例如、狗的鸣叫声)。此声音文件道702的声音信息用压缩电路进行逆压缩(展开),用A/D转换器变换成模拟声音信息,并经放大器(AMP)从扬声器输出。这样,若用扫描器113读取图画书的狗图画部分,狗的鸣叫声从话音记录器101的扬声器102得以重放。
(重放过程)
其次,就预先在存储卡106内对点图案将声音信息建立联系情况的种种重放方法详细地进行说明。
首先,若用扫描器点击(摄像)印刷了点图案的图画书、照片、封印纸等,就如上述那样与点图案对应的点代码得以解析,参照链接表,与该点代码对应的声音信息得以重放。此时,中央处理装置(MPU)在声音信息的重放的同时使录音/重放显示部的LED点灯。
其次,若在声音重放中用扫描器113点击(摄像)指示板600的快进605的符号,则快进重放(x倍速重放=x是任意的整数)得以执行。
这里在想将重放速度返回到原来的情况下(通常声音重放),再次点击指示板600的快进605的符号,或者点击重放604的符号。
另外,若在声音重放中用扫描器113点击指示板600的暂停619的符号,则重放成为暂停(停顿状态)。通过再次点击暂停619的符号重放被重新开始。
进而,若在声音重放中点击前进/重放608,则中央处理装置(MPU)对存储卡106内的链接表(参照图10)进行检索,并开始现在重放着的声音文件道702的下一标签(登录顺序)上所登录的声音文件道702的重放。另外,若点击返回/重放607,则中央处理装置(MPU)对链接表(参照图10)进行检索,并开始现在重放着的声音文件道702的前一标签(登录顺序)上所登录的声音文件道702的重放。
另外,若在声音重放中点击末尾/重放610,则中央处理装置(MPU)对存储卡106内的链接表(参照图10)20进行检索,并开始声音文件道702的最后道(在图10中为声音文件道No.4)的重放。另外,若点击开头/重放609,则开始声音文件道702的开头道(在图10中为声音文件 道No.3)的重放。
(录音过程)
在话音记录器101上新录制声音的情况下,通过用扫描器113点击指示板600的录音601的符号,或者按下本体的录音/重放按钮103而开始录音。朝向话筒107发出的声音通过A/D转换器进行数字变换,并通过压缩电路得以压缩。声音信息以这种压缩数据形式被顺次登录在存储卡106中。
在该录音中通过用扫描器113点击指示板600的录音601的符号或者停止606的符号,或者按下本体的录音/停止按钮103而停止录音。直到此时为止所录音的声音信息被记录在存储卡106中。
在删除这些声音的情况下,若在声音从扬声器102重放着的状态、或者声音的重放结束后5秒以内用扫描器113点击指示板600的声音删除615的符号则从扬声器102输出“噼”音并使录音/重放显示部106的LED忽亮忽灭5秒钟。在这5秒钟之间若点击指示板600的执行617的符号则重放着的声音被删除。此时中央处理装置(MPU)进行从存储卡106削除该声音文件道702的数据的处理。
另外,当在上述5秒钟之间用扫描器113点击中止618的符号,或者5秒钟之间任何符号都没有被点击的情况下,结束该声音删除模式。
另外,在欲删除存储卡106中所录音的全部声音信息的情况下,取代上述声音删除615而用扫描器113点击全声音删除616的符号即可。
(链接作业)
在本实施方式中,用户能够自己自由地设定将自身录音的声音信息或者存储卡106中所存储的既存声音信息与哪个点图案建立联系。并其称为链接设定。
链接设定通过图10所示的链接表(在存储器卡106内设定)来进行管理。
在创建链接之际,首先用扫描器113点击指示板600的录音601 的符号、或者按下录音/停止按钮103以开始声音的录音。此时录音/重放显示部104的LED成为点亮熄灭状态。
其次,若在维持着录音状态不变而用扫描器113点击(摄像)图画书、照片、封印纸、卡等上所印刷的点图案,则中央处理装置(MPU)停止录音状态,同时对所录音的声音文件道编号将已摄像的点图案的点代码关联起来进行登录。此时,使“嘀”音从扬声器102输出以对用户通知链接的生成。
另外,在用扫描器113点击了点图案时,当已经在链接表中对与该点图案对应的点代码将其他声音文件道702建立联系而被登录的情况下,中央处理装置(MPU)使“噗”音从扬声器102输出以对用户通知链接无法创建。
其次,就声音信息已经被登录在存储卡106中时,生成与点图案的链接的过程进行说明。
首先,若用扫描器113点击指示板600的链接开始611的符号,则话音记录器101的中央处理装置(MPU)使链接显示部105的LED点亮熄灭以通知用户链接开始。
其次,使将指示板600的重放604的符号用扫描器113点击而使其链接的声音文件道702的声音进行重放。此时,用户通过点击指示板600的前进/重放608、返回/重放607、开头/重放609、末尾/重放610而顺次切换将重放的声音文件道702以搜寻出所希望的声音文件道702。
若这样在重放所希望的声音文件道702期间或者在声音重放结束后5秒以内用扫描器113点击图画书、照片、封印纸、卡等上所印刷的点图案,则该声音文件道702与点图案的点代码建立联系并登录在链接表中。此外,在这里当已经在链接表中对与该点图案对应的点代码将其他声音文件道702建立联系而被登录的情况下,中央处理装置(MPU)使“噗”音从扬声器102输出以对用户通知链接无法创建。
这样,仅能够使1个点图案(点代码)链接到1个声音文件道,但反之能够使1个声音文件道702与多个点图案(点代码)链接。从而, 即便是完全不同的点图案也可以通过点击而使同一声音信息进行重放。
在结束以上的链接模式的情况下,用扫描器113点击指示板600的链接结束612的符号。由此,话音记录器101返回到使电源开关108处于接通状态时的初始状态。
其次,就删除如以上那样设定的链接表的链接的过程进行说明。
在欲删除某个链接的情况下,首先用扫描器113点击在链接表中链接已经生成的点图案,中央处理装置(MPU)读出已建立联系的声音文件道进行重放。
其次,在该声音的重放中、或者重放结束后5秒钟之间用扫描器113点击链接解除613的符号。其次,中央处理装置(MPU)从扬声器102输出5秒钟“噼”音,同时使链接显示部105的LED点亮熄灭。若在这期间用扫描器113点击指示板600的执行617的符号,则该点图案(点代码)与声音文件道的链接得以解除。此时,仅链接得以解除已建立联系的声音文件道未被删除。
另外,在上述5秒钟之间用扫描器113点击中止618的符号、或者5秒钟之间任何符号都没有被点击的情况下,结束这一模式。
其次,在解除链接表内的全部链接的情况下,取代上述链接解除613的符号而用扫描器113点击全链接解除614的符号即可。其过程与与上述的各个链接的解除相同故说明省略。
(其他功能)
话音记录器101除以上的功能外还具有以下的附加功能。
在5分钟任何开关或按钮都未被操作、且任何点图案或者符号也未用扫描器113点击的情况下,成为电源切断状态。这通过中央处理装置(MPU)使用时钟进行5分钟的计数,并进行将处于中央处理装置(MPU)与DC-DC转换器之间的开关开放的控制而得以实现。
话音记录器101能够对于将录音的声音使声音品质(比特率)可变。在用扫描器113点击了声音品质的“低”602c的符号的情况下,所录音的比特率被设定得较低而可以长时间录音。另一方面,在 “高”602a的符号被点击的情况下比特率被设定得较高而可以进行高品位的录音。“中”602b的符号则可以设定成其中间的比特率。
中央处理装置(MPU)对存储卡106的空容量进行监视,若空容量变得不足0.2Mbyte则使录音/重放显示部104的LED点亮熄灭以通知用户可以录音的时间较少。此时,也可以如前述那样,在指示板600中用扫描器113点击了声音导航的符号的情况下,将针对用户的通知使声音信息、例如“存储器剩余变得较少”这样的声音信息从扬声器102输出。
此外,虽然在以上的实施方式中,作为照片、图画书、卡、封印纸等上所形成的点图案仅仅说明了代码信息(点代码)的情况,但并不限于此,还可以用扫描器读取坐标信息、代码信息与坐标信息的组合,进而读取利用键点2的角度信息的组合。
在组合了角度信息的情况下,例如还可以根据印刷了将读取的点图案的卡相对于扫描器113的方向(角度)而使不同的声音信息输出。
图18、图19表示本发明的其他实施方式。
图18所示的话音记录器101a与图1所示的话音记录器101大致相同,但使用了SD卡106A作为存储卡。其他的功能与图1中说明过的相同所以说明省略。此外,在图18中例示了SD卡,但只要是存储介质则miniSD、存储棒、存储棒Duo等任何介质都可以。
图19是表示使扫描器一体化的话音记录器1901。
在此话音记录器1901的装置本体的前端(在图中为上端)内置有传感器单元1903,图示省略,但设置着由红外线LED等红外线照射部件和对来自点图案的反射光进行摄影的CCD或CMOS组成的摄像部件。即、采用图4以及图5中说明过的扫描器113被一体地内置于话音记录器1901本体的构造。
在本体的底部附近的侧面设置着扬声器1902,以使从话筒1908输入的声音、或在SD卡106A(图19中未图示)和内置的存储器中预先登录的声音、音乐等得以输出。
在本话音记录器1902的正面(操作面、图19(b)所示的面)从传感 器单元一侧起分别配置有扫描按钮1904、录音按钮1905、音量1906、LED1907以及话筒1908。
<具有旋转参数的实施方式>
从图20至图27是表示本发明的其他实施方式。
这些实施方式涉及能够通过识别点图案(塑像的方向)的角度,输出与点代码及其角度对应的声音的台座(声音信息记录装置)。
本实施方式如图20所示由台座2001、被连接在其上的扫描器113和用该扫描器113读取用的纸板控制器2006、被装载在台座2001上面的工作台2002的塑像2003而构成。
另外,在台座2001周围的正面侧设置有话筒2004和液晶显示部2005。
在塑像2003的底面粘贴有被印刷图12~17中已说明的点图案的封印纸。
在台座2001的内部设置有未图示的红外线照射部件(例如红外线照射LED)、摄像部件(CCD、CMOS等),可以经设置在台座2001的工作台2002上的读取孔对塑像2003底面的点图案进行摄像。
本实施方式中所用的指示板(纸板控制器2006)如图21所示。
在该纸板控制器2006上设置有对录音进行指定的录音区域、链接区域、旋转参数区域、进行重放、快进、返回/重放、前进/重放、开头/重放、末尾/重放等重放控制的重放控制区域、对链接的生成和解除以及声音的删除进行控制的链接控制区域,并分别印刷着点图案。
即、通过用扫描器113对纸板控制器2006的这些区域进行摄像,就能够控制声音的输入、重放、与塑像的关系建立(链接)。
进而,在纸板控制器2006上设置有旋转参数的ON/OFF区域。
该旋转参数ON/OFF区域是用于指示将在塑像底面所设置的点图案的方向参数设成ON状态(方向参数也附加进行控制的模式)还是设成OFF状态(忽视方向参数来进行控制的模式)的区域,在用扫描器113对ON区域进行了摄像时,就可以按工作台2002上的塑像2003 的朝向、例如朝着正面装载时(图20(a))、朝着横向装载时(图20(b))、背朝着正面装载时(图20(c))分别输出不同的声音。
图25是说明用于检测点图案的方向的技术的图。
如图12中所说明那样,点图案1采用以键点2为中心配置了信息点3的构成。从而,在用于从点图案1抽取出意味信息点的值的算法(由中央处理装置所执行的解析程序)中,将扫描器113或传感器单元1903所摄像的点图案1的图像数据展开到视频存储器,对该视频存储器的像素进行解析并首先寻找键点2。从而,若键点被检索出则能够计算点图案1的方向(相对于摄像基准线2501(在这里为Y正方向)的点图案1的倾斜角度θ)。
本实施方式是将该方向的角度作为参数附加在点图案意味的代码值上,即便是同一点图案也能够根据角度使输出的声音数据(话音地址)变化。
此外,在这里以与相对于Y正方向的点图案的方向的角度进行了说明但不言而喻其也可以将X正方向作为基准。
图26是将该角度作为参数进行了附加时的声音决定表。若具体地将其与图20中已说明的塑像2003的方向对应起来进行说明,则在塑像2003朝向正面装载时(图20(a))角度是-46~+45(0±45)度,所以根据声音决定表而选择角度No.001并从台座2001的扬声器(图示省略)发出登录在话音地址a上的“早上好”之类的声音。
另外,在如图20(b)所示那样使塑像2003朝向左方向装载了的情况下,由于角度是+46~+135(90±45)度所以根据声音决定表而选择角度No.002,并从台座2001的扬声器(图示省略)发出登录在话音地址b上的“你好”之类的声音。
进而,在如图20(c)所示那样塑像2003从正面看朝向后装载的情况下,由于角度是+136~+225(180±45)度,所以根据声音决定表而选择角度No.003,并从台座2001的扬声器(图示省略)发出登录在话音地址c上的“晚上好”之类的声音。
<录音以及链接处理>
其次,利用图22~24就本实施方式的话音记录器的操作过程进行说明。
首先,扫描器的中央处理装置(MPU)基于程序,判定旋转参数ON804的符号是否被用户点击(2201)。在这里,在判断为被点击的情况下将处理转移到步骤2202,在未判断为被点击的情况下结束本处理。
在步骤2202中将旋转参数设成ON。扫描器的中央处理装置(MPU)通过解析软件解析在步骤2201中读取到的点图案,并变换成点代码(代码信息)。该点代码被发送给台座2001的中央处理装置(MPU)。然后,台座2001的中央处理装置(MPU)将旋转参数设成ON。
其次,判断录音801是否被点击(2203)。在判断为被点击的情况下将处理转移到步骤2204,在未判断为被点击的情况下结束本处理。
在步骤2204中,将录音模式设成ON。
其次,进行录音处理(2205)。台座2001的中央处理装置(MPU)将朝向话筒2004发出的声音通过A/D转换器进行数字变换,并通过压缩电路进行压缩。以这种压缩数据形式将声音信息顺次登录在存储器中。
其次,判断链接开始802的符号是否被点击(步骤2206)。在判断被点击的情况下停止录音(2301),在未判断被点击的情况下将处理转移到步骤2207。
在步骤2207中,判断声音的录音是否完成(2207)。在判断为录音801的符号或者停止808的符号被点击的情况下判断为录音已完成。在判断为录音已完成的情况下结束本处理,在未判断为录音已完成的情况下再次进行步骤2207的处理。
在步骤2301中,停止录音状态。然后将链接模式设成ON(2302)。
其次,判断链接结束803的符号是否被点击(2303)。在判断为被点击的情况下结束本处理,在未判断为被点击的情况下将处理转移到步骤2304。
在步骤2304中判断塑像2003是否被装载在台座2001的工作台 2002上。塑像2003是否被装载的判断根据台座的传感器单元是否为可读取塑像2003底面的点图案的状态来进行判断。在装载着的情况下将传感器读取到的点图案发送给中央处理装置(MPU)。
在步骤2305中,进行代码信息的抽取以及角度的检测。中央处理装置(MPU)通过图像处理算法,从读取到的图像信息抽取出代码信息。然后,根据键点的位置来计算该点图案的角度。
其次,判断点代码与角度是否已经链接起来(25306)。台座的中央处理装置(MPU)判断是否已经在链接表中对该点代码且该角度将其他声音文件道建立联系而登录。在已经链接起来的情况下再次进行从步骤2303起的处理,在未判断为链接起来的情况下将处理转移到步骤2307。
在步骤2307中进行链接处理。中央处理装置(MPU)对于所录音的声音文件道编号将代码信息以及角度关联起来进行登录。
其次,中央处理装置(MPU)读取计时器的值,判断在链接开始802的符号被点击起是否经过了5秒。在不足5秒的情况下再次进行从步骤2303起的处理,在经过了5秒的情况下结束本处理。
此外,虽然在本处理中连续进行录音和链接,但也可以生成与已经登录在存储器中声音信息的链接。
<已链接声音重放处理>
接着,利用图24就重放通过图22、23的处理而链接的声音的过程进行说明。
首先,扫描器的中央处理装置(MPU)判断旋转参数ON804的符号是否被用户点击过。在判断为被点击过的情况下将旋转参数设成ON(2402),在未判断被点击过的情况下结束本处理。
其次,判断塑像是否被装载(2403)。在判断为塑像被装载着的情况下,将传感器读取到的点图案发送给中央处理装置(MPU)。然后,从读取到的图像信息抽取出代码信息(2404),并根据键点的位置来计算该点图案的角度(2405)。
其次,进行声音重放处理(2406)。中央处理装置(MPU)检索存储 器内的链接表,检索出与代码信息与角度两方对应的声音文件道,并读出存储器内的符合条件的声音文件道。该声音文件道702的声音信息用压缩电路进行逆压缩(展开),并用A/D转换器变换成模拟声音信息,经放大器(AMP)从扬声器输出。
<角度检测方法>
如前述那样,图25对点图案1的角度进行了说明,通过检测前述的键点2的位置,能够检测出平面方向的点图案1的倾斜角度(方向)。图26的声音决定表由字符代码、角度、角度No.、话音地址所构成。若通过传感器读取点图案1,则该点图案1中所记录的字符代码被首先决定。其次,若以键点2为基准来计算点图案1的角度,则根据该角度而决定角度No.。然后,根据字符代码以及角度No.来决定对应的话音地址。话音地址与声音被对应起来,例如、在话音地址为a的情况下输出“你好”,在b的情况下输出“再见”的声音。
此外,在图26中每90度、即按4方向来决定角度No.。在此情况下,角度信息用2bit来表现。但是,本发明并不限于此,还可以按任意的方向数来决定角度No.。例如,在8方向的情况下每45度设置角度No.,角度信息用3bit来表现。在16方向的情况下每22.5度设置角度No.,角度信息用4bit来表现。
图27是对传感器的倾斜与角度的关系进行了说明的图。
如(a)所示,设点图案的方向与传感器的方向所成的角度为α。另外,如(b)所示,设传感器的倾斜与传感器的方向所成的角度为β。在此情况下,点的方向与传感器的倾斜所成的角度γ就为将塑像倾斜了的角度。即、角度γ为γ=α+β。
<角度参数为OFF的情况>
其次,就角度参数为OFF的情况下重放点图案上所链接的声音的过程进行说明。
若角度参数OFF805的符号被用户所点击,则角度参数成为OFF。其次,若台座2001的传感器读取工作台上装载的塑像2003底面的点图案,则中央处理装置(MPU)通过解析软件来解析该点图案, 并变换成点代码(代码信息)。然后,基于该点代码对存储器的链接表进行检索,读出与该点代码对应的声音文件道。这里,在该点代码以不同的角度链接着多个声音的情况下,最后所录音的声音被读出。
<连接到个人计算机操作>
虽然在上述的实施方式中,使用指示板800来进行操作,但本发明并不限于此。
例如,还可以如图28所示那样,采用将台座2001使用连接器连接到个人计算机2801的形态。在此情况下用户使用键盘以及鼠标(未图示)来进行录音/重放、链接等操作。
<在台座上设置按钮操作>
另外,如图29所示那样,能够将该话音时钟自身连接到个人计算机2801的USB端子,还可以在个人计算机侧进行声音的控制和闹铃时间的设定等。在此情况下,设置在台座2001的液晶显示部2005也可以不要。
另外,还可以如图30所示那样,通过在台座2001上装载卡并读取卡上所印刷的点图案来进行上述操作。
<带声音识别功能的话音记录器>
图31表示将扫描器一体化的话音记录器的其他形态。
该话音记录器3101除图19所示的一体型话音记录器的功能外还具有用于声音识别的输入功能和液晶显示画面3110。
该话音记录器3101在录音按钮3105兼用声音输入按钮,而用作声音输入设备的情况下,通过一边按下该录音按钮3105一边朝向话筒3108发声,该声音信息就被输入到话音记录器3101内。
然后,该发声信息在通过话音记录器内的未图示的A/D转换器经过数字变换后,通过声音识别电路进行解析,变换成与发声信息对应的文本信息。
例如,在预先登录着出差等日程安排信息的情况下,若用户一边按下录音按钮3105一边发声“日程安排”或者“预定”,则其通过声音识别电路进行解析,分别变换成“日程安排”或者“预定”这样的文本数 据,并将这些文本数据作为检索键对存储器中所构筑的数据库进行检索,抽取出“○○出差”之类的文本信息,其被变换成声音信息后由扬声器3102发声“○○出差”。
此外,在数据库中“○○出差”这样的声音信息自身被存储在存储器中,也可以在其中用文本将日期信息(例如“4月28日”)关联起来。
在此情况下,也可以仅通过对话音记录器3101以声音发出“4月28日”,此声音被变换成文本数据并对数据库进行检索,使与该文本数据对应的“○○出差”的声音信息从扬声器3102输出。
此外,在上述的例子中,用使基于所输入的声音信息对话音记录器内的数据库进行检索而检索出的数据从扬声器3102发声的情况进行了说明,但既可以仅将该话音记录器作为用于声音识别的输入设备来使用,也可以作为省略录音功能而具备扫描器功能的声音识别用终端来使用。另外,还可以在个人计算机上连接多个话音记录器彼此进行话音邮件的交换。
例如,还可以当用户一边按下录音按钮3105一边输入已发声的声音信息,该话音记录器的中央处理装置(MPU)通过没有图示的通信接口将该声音信息从天线3109发送给个人计算机,通过个人计算机内的声音识别程序对该声音信息进行解析,并将其变换成文本数据对个人计算机内所构筑的数据库或者网络上的数据库进行检索,将检索结果输出给个人计算机的显示器装置。
另外,还可以使用通信功能将检索结果数据返送给话音记录器从话音记录器的扬声器3102作为声音信息使其发声。
图32表示用于提高该声音识别精度以及用于已输入的声音信息的分类的纸板控制器3200的构成。
如同图所示那样,在该纸板控制器3200中“姓名输入”(3208)、“邮政编码输入”(3209)、“住所输入”(3210)、“电话号码输入”(3211)、“邮件地址输入”(3214)等输入声音范畴分别作为区域而印刷,在这些区域上不同的代码分别作为点图案而印刷。另外同样作为输入功能印刷着“向上”、“决定”、“向下”的区域,并能够选择在显示器画面上所显示 的候补或者菜单。
即、在按下本话音记录器3101的录音按钮3105进行声音输入之际,通过提前用传感器单元3103对范畴代码(点图案)进行扫描,使声音识别精度提高,同时对已输入的声音信息进行分类。
例如,在发声为“上野”的情况下,难以把握其是地名的上野还是人名的上野,但在“住所输入”经过扫描后“上野”这样的发声作为声音信息被输入的情况下,“上野”的声音信息与住所输入的范畴代码一起发送给个人计算机。
个人计算机的中央处理装置(MPU)通过附加住所输入的范畴代码,就能够容易地判别该“上野”的声音信息是“住所”的范畴,所以能够立刻将上野附近的地图信息显示在个人计算机的显示器画面上。
此外,话音记录器的通信方并不限于这种个人计算机,还可以是汽车导航装置、信息家电、控制设备、机器人等任何设备。也就是,通过将本话音记录器用作声音识别功能的输入装置就可以进行所有信息设备、信息家电的控制。
其次,就作为本实施方式的一例使用图32所示的指示板(纸板控制器)3200进行声音识别的情况进行说明。
指示板3200在从通信销售的商品目录来订购商品等情况下使用。在通信销售的商品目录(未图示)中点图案被重叠印刷在商品的照片上,若用户利用话音记录器3101的传感器单元3103点击商品的照片(利用传感器单元对该照片部分的点图案进行摄像),则在个人计算机(未图示)的显示器画面上显示与意味该点图案的代码相对应的商品说明的画面。另外,在印刷了商品目录的商品编号的部分上也重叠印刷着点图案,若点击商品编号的印刷面,则在个人计算机的显示器画面上显示订货商品信息,已点击的商品被登录在订货列表中。接着,若点击确认3201,则在画面上显示订货列表。在选择订货列表中所登录的商品的情况下点击向上3202以及向下3203的各符号,在变更订货数的情况下点击将订货数增加3204或者订货数减少3205的各符号。在取消已登录的商品的订货列表的情况下点击全取消3206,在将 订货的商品以及个数已决定的情况下点击订货3207。另外,要返回到最后阅览的商品商品目录画面就点击返回3212,在结束订货程序的情况下点击结束3213。在进行这些操作的情况下用户一边按下扫描按钮3104一边对所希望的商品照片以及符号进行点击。
用户在将订货的商品已决定后,进行姓名、住所等的输入。若用户一边按下扫描按钮3104一边点击姓名输入3208,就用扫描器3101中内置的中央处理装置(MPU)对该点图案进行解析,并变换成点代码(代码信息)。当该点代码被发送到计算机的中央处理装置(MPU)就基于该点代码将声音识别模式设成ON。
其次用户一边按下录音按钮3105一边向话筒3108发声姓名。于是,中央处理装置(MPU)将朝向话筒所发声的声音通过A/D转换器(未图示)进行数字变换,并通过压缩电路进行压缩和/或变换。并通过天线3109将这种压缩数据发送给计算机。计算机的中央处理装置(MPU)通过声音解析软件解析该声音数据,变换成文字信息,并将该文字信息显示在画面上。通过同样的操作,邮政编码、住所、电话号码也借助于声音输入功能而得以输入。
通过具有这种声音输入功能,用户就能够以简易操作输入住所等信息而不用进行使用了键盘或扫描器的烦杂的操作。
此外,在本实施方式中,如前述那样,仅在扫描按钮3104被按下的状态下点击点图案时,读取点图案。在传感器单元3103内内置有LED、CMOS传感器等,但它们将消耗电力。进而,由于该话音记录器3101是无线,故需要用于始终维持通信功能的待机电力,所以就需要使用电池(包含充电器),并抑制该电力的消耗。
因而,为了使电力的消费成为最小限度,仅在扫描按钮3104被按下的情况下对传感器单元3103进行通电使其发挥功能。
另外,在声音识别功能中也仅在录音按钮3105被按下期间进行声音的输入。若时常处于声音输入进行的状态,就有话筒3108将用户不想输入的声音也进行识别,用户不希望输入的信息也被输入的可能性。为了可以仅输入用户所希望的信息,仅在声音输入按钮3105 被按下期间,进行声音的输入。
此外,虽然在图31所示的话音记录器3101中,设置天线3109以无线通信方式与个人计算机进行通信,这样将声音信息和读取到点图案的代码信息发送给个人计算机侧,但也可以仅将声音信息、或者仅将代码信息发送给个人计算机。
<话音邮件系统>
从图33到图39就使用了本发明中的话音记录器的话音邮件系统进行说明。
图33是本实施方式中的网络构成图。在本发明的话音邮件系统中,个人计算机经因特网等网络与其他个人计算机连接起来,可以进行数据的收发。而且这些个人计算机可以通过蓝牙等近距离无线通信系统与话音记录器进行通信。此外,话音记录器与个人计算机的通信并不限于这种蓝牙,还可以是红外线通信、无线LAN、利用USB电缆的有线连接等任何方式。
图34是就在用户进行话音邮件的登录、收发等时所用的纸板控制器3400进行了说明的图。
在纸板控制器3400的左部印刷着用于进行声音的录音/重放、链接的符号,在右侧印刷着用于进行话音邮件的收发等的符号。
图35是就话音邮件数据库进行说明的图。
同图是话音记录器彼此一边经由蓝牙接口(I/F)与话音邮件控制部进行通信一边收发用话音记录器所输入的话音邮件、即声音数据的系统。
话音邮件控制部用可以进行网络连接的通用服务器或者个人计算机而构成,在该服务器或者个人计算机上所连接的硬盘装置中设置话音数据保存部。
在话音数据保存部中设置接收用索引表和发送用索引表。这里接收ID(发信源的地址或者接收侧话音记录器的ID编号)与数据保存地址建立联系而登录在接收用索引表中。另外,发送ID(发送目的地的地址或者发送目的地话音记录器的ID编号)与数据保存地址建立联系 而登录在发送用索引表中。
即、话音邮件控制部将该话音邮件控制部应管理的话音记录器的ID登录在接收用索引表中,并将以该话音记录器所附加定义的接收ID为收件方的话音邮件登录在自身的话音数据保存部的接收用索引表中。
另一方面,在由话音邮件控制部管理的话音记录器输入了话音邮件时,暂且在发送用索引表中登录好发送ID(发送目的地的地址或发送目的地的话音记录器的ID)。之后,话音邮件控制部定期地访问发送用索引表,在这里存在未发送的话音邮件的情况下,经由网络接口(NW I/F)以及网络将话音邮件数据对管理发送ID的未图示的话音邮件控制部进行发送。
图36是就话音记录器与个人计算机(话音邮件控制部)间的数据收发进行说明的流程图。
首先,判断在可以通信区是否有话音记录器(3601)。若话音记录器被配置在个人计算机的附近,则通过蓝牙等近距离无线通信系统,话音记录器ID被发送到个人计算机。在该话音记录器ID被发送的情况下,判断为在可以通信区有话音记录器。
接着,判断话音记录器ID是否被读入(3602)。个人计算机经由蓝牙I/F读入话音记录器ID。
其次,判断在接收索引表中是否有一致的ID(3603)。控制部对话音数据数据库内的接收索引表中是否存在与已读入的话音记录器ID一致的ID。在判断为存在接收ID的情况下,访问与接收ID对应的数据保存地址,读出接收数据(3604)。然后,将已读出的接收数据经由蓝牙I/F传送给话音记录器(3605),并结束本处理。
另一方面,在接收索引表中不存在一致的ID的情况下,判断在话音记录器内是否有发送数据(3606)。在有发送数据的情况下,读入发送数据、即发送目的地的地址和话音数据,并登录在数据库内的发送数据索引表中(3607)。登录一完成就结束本处理。
图37表示用户彼此进行话音邮件的收发的具体例。同图是如图 38所示那样,在网络上连接着话音邮件管理服务器,一元化地管理话音邮件的系统。
当用户A在屋外朝向话音记录器的话筒发出想输入的声音,经由话音记录器的话筒在其存储器内话音数据被作为数字数据储存起来。
接着用户A决定话音邮件的发送目的地。即、利用纸板控制器输入发送目的地的地址。已输入的地址被登录在话音记录器的存储器内。
在用户A进入自己家里或工作单位等的屋内,进行话音邮件的发送处理时,首先用户将话音邮件配置在个人计算机的附近。于是,借助于蓝牙通信功能个人计算机进行每个话音记录器所定义的装置ID、即话音记录器ID的读入。其次,存储器中储存的话音数据及邮件地址被发送给个人计算机。
当个人计算机(话音邮件控制部)接收话音数据以及邮件地址,在监视器(显示器装置)上进行“话音邮件接收中”的显示。然后,对话音邮件管理服务器发送上述话音数据以及邮件地址。
话音邮件管理服务器将接收到的话音数据以及地址登录在服务器内的数据库中。然后,经由网络I/F将话音数据发送给相符的邮件地址收件方。接收到话音邮件的个人计算机在监视器(显示器装置)上进行“话音邮件取得/发送”的显示。然后通过蓝牙I/F将话音数据发送给用户B的话音记录器。话音记录器当接收到话音数据就以“收到话音邮件”的声音和/或话音记录器的监视器对用户B进行通知。由此用户B接收用户A所发送的消息。
图38表示一边通过个人计算机(PC)上安装的控制程序(话音邮件管理器)与话音邮件管理服务器联动一边使用话音记录器时的例子。
用户将访问CD-ROM、或者因特网的发布服务器而下载的安装程序在个人计算机(PC)上执行,并将话音邮件管理器作为常驻程序登录在OS(操作系统)上。
其次,若话音记录器被配置在个人计算机(PC)的附近,则通过蓝 牙等近距离无线通信系统将话音记录器ID发送给个人计算机(PC)。个人计算机(PC)内的中央处理装置(CPU)在话音邮件管理服务器中进行话音记录器ID的认证。即、进行所发送的话音记录器ID是否是可以使用该个人计算机(PC)进行数据收发的话音记录器的ID的认证。
这里,在是可以收发的话音记录器的情况下,参照个人计算机(PC)内的话音邮件管理表(点代码管理表)对被发送给该话音记录器ID收件方的话音邮件是否已保存进行确认。
在话音邮件已保存的情况下,中央处理装置(CPU)读出该话音邮件,并通过蓝牙等近距离无线通信系统发送给话音记录器。
其次,通过将从个人计算机接收(下载)的话音数据用该话音记录器进行重放,接收者就能够听到话音邮件。
在话音邮件管理表(点代码管理表)中尚未保存话音邮件的情况下,参照因特网上的话音邮件管理服务器。这里,如果在话音邮件管理服务器的话音邮件管理表中保存着被发送给该话音记录器ID收件方的话音邮件,就读出该话音邮件并下载到个人计算机(PC)内。
在每个管理话音记录器的个人计算机所需要的话音邮件被下载到个人计算机(PC)内时,与该话音邮件一起也将用于启动该话音邮件的话音邮件管理表的追加数据(话音数据保存地址、点代码)进行下载,以后就仅用个人计算机内的话音邮件管理表来管理。
从而,之后在与上述相同的话音记录器ID被发送的情况下,就基于包含新追加的数据的话音邮件管理表,读出被下载到个人计算机的硬盘装置(HD)内的话音邮件,而不用再次访问因特网上的话音邮件管理服务器。
此外,在进行使用了话音记录器的发送处理的情况下,个人计算机在自身管理的话音记录器被配置在附近时,与该话音记录器进行蓝牙通信,读入话音记录器的ID(设备ID),同时从该话音记录器的存储器读入所储存的话音邮件。此时,将在用话音记录器录音时扫描了点图案时的点代码与设备ID建立关系后进行登录。
而且,通过分批处理,该个人计算机定期地进行对话音邮件管理 服务器的访问,并将该话音邮件管理表的数据发送给话音邮件管理服务器。在话音邮件管理服务器中,当接收该数据就基于该数据对自身的话音邮件管理表进行更新。
<声音识别数据通信>
图40就本发明的实施方式进行了说明。在本发明中通过进行声音识别数据通信能够进行种种控制。图40作为其一例表示了在工厂进行控制时的具体例,图41表示了控制之际所用的纸板控制器。
这样一来,利用本申请发明,就可以使用通过点图案对输入进行控制的话音记录器,实现工作机器人或打印机的控制。
此外,本发明除本实施方式中所说明的方式外,例如还可以作为采访用的话音记录器的控制技术而应用。例如,还可以作为采访器进行采访时的话音记录器而使用,通过图34所示的纸板控制器来进行声音识别的控制。
另外,由于在图37以及图38中已说明的话音记录器具有经由网络来收发话音数据的功能,所以还能够将该话音记录器作为例如具备IP电话的话筒和扬声器的终端而使用。在此情况下,在话音记录器时常被配置在个人计算机附近的情况下,可以作为通常的IP电话终端来使用,所以就不需要储存声音数据的内置存储器,但通过装备这种存储器,就能够在处于无法与个人计算机通信的隔离的场所时也能够将话音邮件登录在该话音记录器中。在此情况下,当话音记录器被配置在个人计算机附近时,还可以借助于安装在个人计算机上的话音邮件管理器等通过蓝牙通信自动地对话音邮件进行发送或者接收。
图39表示这种用途中所用的纸板控制器,能够将个人计算机中接收到的发给自己的话音邮件进行重放,或者进行下载。
另外,还能够对个人计算机创建/登录话音邮件,或者进行上载。
另外,还准备有使个人计算机内的话音邮件与话音记录器的存储器的内容进行同步配合的模式(与PC同步)的点图案被登录的区域。
产业上的可利用性
本发明涉及图画书、照片、卡、封印纸等媒体与声音信息的重放 的关系建立,并能够作为声音录音机、声音重放装置、用于声音识别的输入设备而利用。
Claims (2)
1.一种声音识别系统,其特征在于:
该声音识别系统由输入声音信息的声音输入部件、和将表示范畴代码的点图案重叠印刷到表示范畴的区域的介质组成,
通过由读取点图案的光学读取部件在上述介质上读取表示范畴的点图案,将该点图案变换为作为范畴代码的点代码,然后根据上述范畴代码对从上述声音输入部件输入的声音信息进行分类,从而提高声音识别的精度。
2.按照权利要求1所记载的声音识别系统,其特征在于:
上述声音识别系统具有解析上述声音信息并变换为文本数据的声音识别电路,
并且发送该文本数据。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005147084 | 2005-05-19 | ||
JP2005-147084 | 2005-05-19 | ||
PCT/JP2006/309521 WO2006123575A1 (ja) | 2005-05-19 | 2006-04-28 | 音声情報記録装置 |
JPPCT/JP2006/309521 | 2006-04-28 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800173644A Division CN101180672A (zh) | 2005-05-19 | 2006-05-19 | 声音信息记录装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102623029A CN102623029A (zh) | 2012-08-01 |
CN102623029B true CN102623029B (zh) | 2014-08-20 |
Family
ID=37431151
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800173644A Pending CN101180672A (zh) | 2005-05-19 | 2006-05-19 | 声音信息记录装置 |
CN201210002348.5A Expired - Fee Related CN102592633B (zh) | 2005-05-19 | 2006-05-19 | 话音邮件系统 |
CN201210002866.7A Expired - Fee Related CN102623029B (zh) | 2005-05-19 | 2006-05-19 | 声音识别系统 |
CN2012100023502A Pending CN103208297A (zh) | 2005-05-19 | 2006-05-19 | 声音信息记录装置 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800173644A Pending CN101180672A (zh) | 2005-05-19 | 2006-05-19 | 声音信息记录装置 |
CN201210002348.5A Expired - Fee Related CN102592633B (zh) | 2005-05-19 | 2006-05-19 | 话音邮件系统 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012100023502A Pending CN103208297A (zh) | 2005-05-19 | 2006-05-19 | 声音信息记录装置 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8843374B2 (zh) |
EP (2) | EP2352273B1 (zh) |
JP (3) | JP4268641B2 (zh) |
KR (3) | KR101000810B1 (zh) |
CN (4) | CN101180672A (zh) |
WO (1) | WO2006123575A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007336465A (ja) * | 2006-06-19 | 2007-12-27 | Fuji Xerox Co Ltd | 活動履歴記録装置および方法 |
WO2009122756A1 (ja) | 2008-04-04 | 2009-10-08 | Yoshida Kenji | 携帯電話用クレードル、tv電話システム、カラオケシステム、カーナビゲーションシステム、および緊急情報通知システム |
US9002486B1 (en) * | 2009-04-14 | 2015-04-07 | Smith Micro Software, Inc. | Audio systems and methods |
JP6058925B2 (ja) * | 2012-07-04 | 2017-01-11 | 独立行政法人大学入試センター | リスニングテストに用いられる文書情報再生システム及び該文書情報再生システムに用いられる問題用紙 |
US20150341713A1 (en) * | 2014-05-25 | 2015-11-26 | I-Lin Tsai | Voice sticker structure |
CN107451185B (zh) * | 2017-06-22 | 2022-03-04 | 重庆缘溪行文化传媒有限公司 | 录音方法、朗读系统、计算机可读存储介质和计算机装置 |
US20190018408A1 (en) * | 2017-07-12 | 2019-01-17 | Qualcomm Incorporated | Systems and methods for verifying integrity of a sensing system |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5698834A (en) * | 1993-03-16 | 1997-12-16 | Worthington Data Solutions | Voice prompt with voice recognition for portable data collection terminal |
JP2001272995A (ja) * | 2000-02-18 | 2001-10-05 | Canon Inc | 音声認識方法及び装置 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5126543A (en) * | 1989-11-27 | 1992-06-30 | Pitney Bowes Inc. | Integrated hand microphone with barcode reader and dictation controls |
US5059126A (en) * | 1990-05-09 | 1991-10-22 | Kimball Dan V | Sound association and learning system |
US5237628A (en) * | 1991-06-03 | 1993-08-17 | Nynex Corporation | System and method for automatic optical data entry |
US5852803A (en) * | 1992-03-20 | 1998-12-22 | Chips International, Inc. | Apparatus, system and method for recording and/or retrieving audio information |
US5235654A (en) * | 1992-04-30 | 1993-08-10 | International Business Machines Corporation | Advanced data capture architecture data processing system and method for scanned images of document forms |
ATE235720T1 (de) * | 1992-09-28 | 2003-04-15 | Olympus Optical Co | System zur informationswiedergabe für optische punktcode-ablesung von einem aufzeichnungsmedium |
US5455872A (en) * | 1993-04-26 | 1995-10-03 | International Business Machines Corporation | System and method for enhanced character recogngition accuracy by adaptive probability weighting |
US5905250A (en) * | 1993-12-27 | 1999-05-18 | Olympus Optical Co., Ltd. | Audio information recording/reproducing system |
US6424830B1 (en) * | 1994-07-26 | 2002-07-23 | Telxon Corporation | Portable data collection network with telephone and voice mail capability |
JPH0870366A (ja) * | 1994-08-26 | 1996-03-12 | Hitachi Ltd | 音声メッセージの記録再生方法及び通信装置 |
JP2952170B2 (ja) * | 1994-12-16 | 1999-09-20 | オリンパス光学工業株式会社 | 情報再生システム |
JPH096798A (ja) * | 1995-06-19 | 1997-01-10 | Sony Corp | 情報処理システムおよび情報処理方法 |
JPH0944591A (ja) * | 1995-08-03 | 1997-02-14 | Olympus Optical Co Ltd | コードシート及び情報再生装置 |
US5787445A (en) | 1996-03-07 | 1998-07-28 | Norris Communications Corporation | Operating system including improved file management for use in devices utilizing flash memory as main memory |
US6397184B1 (en) * | 1996-08-29 | 2002-05-28 | Eastman Kodak Company | System and method for associating pre-recorded audio snippets with still photographic images |
US7327711B2 (en) * | 1996-09-05 | 2008-02-05 | Symbol Technologies, Inc. | System for digital radio communication between a wireless LAN and a PBX |
US6038199A (en) * | 1997-11-21 | 2000-03-14 | Dictaphone Corporation | Portable digital audio recorder with adaptive control configurations |
US6148173A (en) * | 1998-02-26 | 2000-11-14 | Eastman Kodak Company | System for initialization of an image holder that stores images with associated audio segments |
US7233903B2 (en) * | 2001-03-26 | 2007-06-19 | International Business Machines Corporation | Systems and methods for marking and later identifying barcoded items using speech |
US6869016B2 (en) * | 2001-04-04 | 2005-03-22 | Symbol Technologies, Inc. | Bar code data driven communications by mobile computer terminals operable in wireless networks |
JP2003067121A (ja) * | 2001-08-24 | 2003-03-07 | Tsubasa System Co Ltd | 入力指示書及び情報処理装置 |
JP3943983B2 (ja) * | 2002-04-18 | 2007-07-11 | キヤノン株式会社 | 音声認識装置及びその方法、プログラム |
US20040202291A1 (en) * | 2002-08-27 | 2004-10-14 | Skinner Davey Nyle | Mobile phone with voice recording transfer function |
CN102930311B (zh) * | 2002-09-26 | 2016-04-27 | 吉田健治 | 在媒介物上形成点图形的方法、使用点图形的信息输入方法、使用点图形的信息输入输出方法、使用点图形的信息输入装置、使用点图形的信息处理装置 |
AU2002952106A0 (en) * | 2002-10-15 | 2002-10-31 | Silverbrook Research Pty Ltd | Methods and systems (npw008) |
EP1661028A1 (en) * | 2003-08-15 | 2006-05-31 | Silverbrook Research Pty. Limited | Natural language recognition using distributed processing |
-
2006
- 2006-04-28 WO PCT/JP2006/309521 patent/WO2006123575A1/ja active Application Filing
- 2006-05-19 KR KR1020097024613A patent/KR101000810B1/ko active IP Right Grant
- 2006-05-19 CN CNA2006800173644A patent/CN101180672A/zh active Pending
- 2006-05-19 KR KR1020097024614A patent/KR101032752B1/ko active IP Right Grant
- 2006-05-19 JP JP2006551663A patent/JP4268641B2/ja active Active
- 2006-05-19 CN CN201210002348.5A patent/CN102592633B/zh not_active Expired - Fee Related
- 2006-05-19 CN CN201210002866.7A patent/CN102623029B/zh not_active Expired - Fee Related
- 2006-05-19 US US11/914,917 patent/US8843374B2/en not_active Expired - Fee Related
- 2006-05-19 CN CN2012100023502A patent/CN103208297A/zh active Pending
- 2006-05-19 EP EP10191433.1A patent/EP2352273B1/en not_active Not-in-force
- 2006-05-19 EP EP10191437.2A patent/EP2302632B1/en not_active Not-in-force
- 2006-05-19 KR KR1020077027213A patent/KR20080028359A/ko active Search and Examination
-
2007
- 2007-12-25 JP JP2007333153A patent/JP4270520B2/ja not_active Expired - Fee Related
-
2008
- 2008-07-14 JP JP2008183250A patent/JP4268667B2/ja active Active
-
2014
- 2014-09-19 US US14/491,643 patent/US20150012276A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5698834A (en) * | 1993-03-16 | 1997-12-16 | Worthington Data Solutions | Voice prompt with voice recognition for portable data collection terminal |
JP2001272995A (ja) * | 2000-02-18 | 2001-10-05 | Canon Inc | 音声認識方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
US20150012276A1 (en) | 2015-01-08 |
EP2352273A1 (en) | 2011-08-03 |
CN102592633A (zh) | 2012-07-18 |
US20090094034A1 (en) | 2009-04-09 |
CN101180672A (zh) | 2008-05-14 |
WO2006123575A1 (ja) | 2006-11-23 |
JP4270520B2 (ja) | 2009-06-03 |
EP2302632B1 (en) | 2016-02-17 |
EP2302632A1 (en) | 2011-03-30 |
KR20090127444A (ko) | 2009-12-11 |
JP4268641B2 (ja) | 2009-05-27 |
CN102592633B (zh) | 2014-05-28 |
JP2009009141A (ja) | 2009-01-15 |
KR20080028359A (ko) | 2008-03-31 |
KR20090127445A (ko) | 2009-12-11 |
US8843374B2 (en) | 2014-09-23 |
JP2008182689A (ja) | 2008-08-07 |
KR101000810B1 (ko) | 2010-12-13 |
EP2352273B1 (en) | 2017-01-11 |
CN103208297A (zh) | 2013-07-17 |
CN102623029A (zh) | 2012-08-01 |
JP4268667B2 (ja) | 2009-05-27 |
KR101032752B1 (ko) | 2011-05-06 |
JPWO2006123837A1 (ja) | 2008-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102623029B (zh) | 声音识别系统 | |
US7508535B2 (en) | Stand alone multimedia printer with user interface for allocating processing | |
US7528976B2 (en) | Stand alone printer with hardware/software interfaces for sharing multimedia processing | |
CN101067955B (zh) | 内容列表显示方法及装置、内容选择和处理方法及装置 | |
JP2005108229A (ja) | メディア装置のためのハードウェア及びソフトウェアインタフェースを備えるプリンタ | |
CN1316335C (zh) | 信息输入指示方法及信息输入指示装置 | |
WO2018020608A1 (ja) | 在庫管理システム、在庫管理方法、および在庫管理プログラム | |
CN204515768U (zh) | 用于增强现实的地图服务系统 | |
CN1937504A (zh) | 同步系统以及方法 | |
EP1887560A1 (en) | Audio information recording device | |
JP2006253894A (ja) | 通訳システム、通訳方法、移動通信端末およびサーバ装置 | |
TWI835574B (zh) | 點讀系統及該點讀系統的操作方法 | |
JP4248589B2 (ja) | 音声認識システム | |
US7188766B2 (en) | Item identification using electronic tags | |
CN115407880A (zh) | 一体式vr虚拟现实播放管理系统 | |
JP2012022424A (ja) | ストリームドットを用いた音声情報記録装置 | |
CN1374618A (zh) | 节目分配系统 | |
KR20180116714A (ko) | 저장 메모리의 데이터를 접촉 및 비접촉식으로 디바이스에 전송하도록 구성한 박형 미디어 카드 및 미디어 카드의 데이터를 재생하는 디바이스 | |
KR101457179B1 (ko) | 패턴 인식 젠더를 갖는 스마트 단말기 및 이를 이용한 학습 시스템 및 방법 | |
KR20200015261A (ko) | 온라인 콘텐츠 스트리밍 서비스 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20161024 Address after: Tokyo, Japan, Japan Patentee after: IP Solutions Inc Address before: Tokyo, Japan, Japan Patentee before: Yoshida Kenji |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140820 Termination date: 20200519 |