CN202798910U - 可语音控制的扫描仪 - Google Patents

可语音控制的扫描仪 Download PDF

Info

Publication number
CN202798910U
CN202798910U CN 201220482153 CN201220482153U CN202798910U CN 202798910 U CN202798910 U CN 202798910U CN 201220482153 CN201220482153 CN 201220482153 CN 201220482153 U CN201220482153 U CN 201220482153U CN 202798910 U CN202798910 U CN 202798910U
Authority
CN
China
Prior art keywords
scanner
unit
speech
voice
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201220482153
Other languages
English (en)
Inventor
王渤渤
吴海娟
孔佳琛
许热
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Technology (zhenjiang) Co Ltd
Original Assignee
Technology (zhenjiang) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Technology (zhenjiang) Co Ltd filed Critical Technology (zhenjiang) Co Ltd
Priority to CN 201220482153 priority Critical patent/CN202798910U/zh
Application granted granted Critical
Publication of CN202798910U publication Critical patent/CN202798910U/zh
Priority to TW102132616A priority patent/TW201414282A/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Facsimiles In General (AREA)

Abstract

本实用新型提供一种可语音控制的扫描仪,包括扫描模块单元和处理器,还包括:语音采集单元,用于将一外部的语音指令转换为模拟电信号;语音处理单元,用于处理所接收到的模拟电信号;语音指令存储器,用于预先存储多个语音指令,并预先存储该多个语音指令所转换的数字信号与该扫描仪的控制指令之间的映射关系;语音识别单元,分别与语音处理单元和语音指令存储器连接,用于识别语音指令并将识别结果发送至处理器,处理器根据该识别结果对应的数字信号控制该扫描仪的具体运行。扫描仪具备了语音控制功能,用户可通过语言直接控制扫描仪执行多种操作,提供良好的人机互动,给用户的日常扫描发送工作带来便利,满足用户全方位的使用需求。

Description

可语音控制的扫描仪
技术领域
本实用新型涉及扫描仪领域,且特别是关于一种可语音控制的扫描仪。
背景技术
扫描仪是一种影像捕获装置,可将纸质文本的影像转换为计算机可以显示、编辑、储存和输出的数字格式,如JPEG、JPG、TIFF、MTIFF、或PDF等格式。扫描仪的应用范围很广泛,例如将美术图形和照片扫描结合到文件中;将印刷文字扫描输入到文字处理软件中,避免再重新打字;将传真文件扫描输入到数据库软件或文字处理软件中储存;以及在多媒体中加入影像等等。
随着办公环境中互联网络的流行和普及,扫描仪成为了一种在网络中共享的影像处理装置,即成为了网络扫描仪。早期的扫描仪由扫描头、控制电路和机械部件组成,采取逐行扫描的工作方式,得到的数字信号以点阵的形式保存,再使用文件编辑软件将影像信号编辑成标准格式的文本进行储存。目前的扫描仪仍是一种计算机外围设备,仅作为图像的捕获和输入装置,其产生的影像必须通过计算机进行显示、编辑、存储和输出。扫描仪对照片、文本页面、图纸、美术图画、照相底片、菲林软片都可以进行扫描处理,甚至纺织品、标牌面板、印制板样品等三维对象也可作为扫描对象,扫描仪获取它们的原始线条、图形、文字、照片、平面实物等信息并转换成数字格式,再通过计算机转换成可以编辑的格式和形式。
就目前而言,扫描仪大致经历了四个阶段的发展:
在1984年前后,第一代平板式扫描仪的面世,第一代扫描仪的功能局限于仅扫描黑白文字和简单黑白线条图形,且对简单图形和文字的输入速度和输出速度都比较慢,分辨率也较低,装置体积较大,使用不方便;但扫描仪在问世后便拥有广泛的市场应用价值和市场前景;1986年推出的第二代扫描仪在第一代扫描仪的基础上增加了黑白灰阶的功能,可以扫描具有灰阶变化的黑白图像,使得扫描的黑白图像在图像文件输出时富有层次感,图像更加真实;1989年推出的第三代扫描仪使扫描设备进入了彩色时代,彩色扫描仪能够扫描彩色印刷品和彩色照片,并输出彩色图片格式给计算机进行编辑处理;随着其他办公设备的发展和普及,1996年出现的第四代扫描仪,将扫描仪与打印机、传真机整合,使扫描仪兼具有了一些复印、传真、打印的功能,但仍作为计算机的外围设备,其各项功能必须借助计算机才能完成。
在现有技术中,网络扫描仪仅仅是图像捕获和图像输出工具,功能单一,远远不能满足现代办公过程的对网络扫描仪的方便快捷、智能化控制的要求。在通讯领域,语音识别设备从输入的语音信号提取诸如频率特征等特征信息,用以识别输入的语音命令,在例如AT&T公司公开的一种话音命令控制和校验的系统中,其直接对话音信号进行处理和识别,这样的语音识别和控制系统在例如蜂窝式电话中的应用是成熟的,但尚未发现有一种语音控制技术用于扫描仪上,使扫描仪的智能控制成为一种可能。
实用新型内容
针对现有技术存在的缺陷,本实用新型提供的扫描仪能够通过一组件实现语音的采集、处理和识别,并基于识别的结果执行对应的控制指令,使用户可通过语音命令控制扫描仪的执行各种操作。
为实现上述目的,本实用新型的技术方案是:
一种可语音控制的扫描仪,包括扫描模块单元和处理器,其特征在于,还包括:
语音采集单元,用于将一外部的语音指令转换为模拟电信号;
语音处理单元,用于处理所接收到的模拟电信号;
语音指令存储器,用于预先存储多个语音指令,并预先存储该多个语音指令所转换的数字信号与该扫描仪的控制指令之间的映射关系;
语音识别单元,分别与所述语音处理单元和语音指令存储器连接,用于识别语音指令并将识别结果发送至所述处理器,所述处理器根据该识别结果对应的数字信号控制该扫描仪的具体运行。
进一步地,前述的语音采集单元为一麦克风。
进一步地,前述语音处理单元包括一AD转换单元和降噪单元。
进一步地,前述语音指令存储器为一非易失性随机访问存储器。
进一步地,前述扫描仪还包括网络连接单元,将该扫描仪接入网络。
进一步地,前述扫描仪还包括文档转换单元,该文档转化单元将扫描模块单元扫描生成的扫描文件转换成打印机可识别的文件格式。
由以上本实用新型提供的技术方案可见,本实用新型提供的可语音控制的扫描仪,其上设置了语音采集、处理和识别单元,使得扫描仪具备了语音控制功能,用户可以通过语言直接控制扫描仪执行多种操作,提供良好的人机互动,给用户的日常扫描发送工作带来便利,满足用户全方位的使用扫描仪的需求。
附图说明
图1为本实用新型实施例的扫描仪的示意图。
具体实施方式
为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。
如图1所示,根据本实用新型的第一实施例,可语音控制的扫描仪的包括语音采集单元101、语音处理单元102、语音识别单元103、语音指令存储器104、和处理器105、扫描模块单元110和网络连接单元120。
语音采集单元101,用于将一外部的语音指令转换为模拟电信号,本实施例中,该语音采集单元101为一麦克风,可以让用户在一定距离范围内发出声音指令,通过麦克风采集用户的声音指令,并转换成模拟电信号,该模拟电信号传输至语音处理单元102。
语音处理单元102,用于处理所接收到的模拟电信号。该语音处理单元102包括一AD转换单元和降噪单元,用于对所接收到的模拟电信号进行模数转换,然后进行降噪处理,例如利用基于谱相减算法的降噪单元进行降噪处理,该处理后的数字信号发送至语音识别单元104。
语音指令存储器103,用于预先存储多个语音指令,并预先存储该多个语音指令所转换的数字信号与该扫描仪的控制指令之间的映射关系。本实施例中,该语音指令存储器103优选为一个非易失性随机访问存储器(NVRAM),例如SD卡以及CF卡、SONY记忆棒等其他类型的闪存扩展存储卡。
语音识别可基于讲话者相关识别模式或讲话者无关系识别模式。讲话者相关识别模式是指在执行识别之前预先存储和登记一个或多个用户的语音,并且将外界输入语音的模型与所存储的语音的模型进行比较,以执行语音识别。讲话者无关系识别模式是指在识别操作之前无需预先登记和存储用户的语音,而是收集未指定讲话者的语音以便研究统计模型,并且利用所研究的统计模型来执行识别,这样,消除了每一个讲话者的个人特征,采用每个讲话者之间的共同特征进行有利地识别。
本实施例中,基于讲话者相关识别模式,语音指令存储器103内预先录制存储了至少一个用户的多个语音控制指令,并存储该多个语音指令所转换的数字信号与该扫描仪的控制指令之间的映射关系(一一对应映射关系)。
语音识别单元104分别与语音处理单元102和语音指令存储器103连接,用于识别语音指令,并将识别结果发送至处理器105,处理器105根据该识别结果对应的数字信号控制该扫描仪的具体运行。
用户可通过扫描仪上的按键来启动扫描仪的语音控制模式,该按键可以是扫描仪上的一个已有功能按键,例如双面打印时的继续键位,短按后将完成双面打印时的继续打印操作,长按后将触发其第二功能键位,启动语音控制模式。
在另外的实施例中,基于讲话者无关系识别模式,语音指令存储器103内预先存储了经过研究的多个语音控制指令的统计模型特征,该统计模型特征对应于多个语音指令所转换的数字信号与该扫描仪的控制指令之间的映射关系。因此,在用户发出语音指令后,经过语音处理单元102的数据处理,语音识别单元104提取语音数据中的模型特征,并与语音指令存储器103中的多个语音控制指令的统计模型特征进行比较,执行语音识别,并基于识别结果扫描仪执行对应的操作。
本实施例中,用户可在一定的距离范围内对扫描仪发出语音指令,例如“份数设定”、“时间显示”、“黑白扫描”等语音指令,语音采集单元101接收到用户发出的语音指令后,经过语音处理单元102的模数转换、降噪处理后,发送至语音识别单元104进行识别处理,并识别结果发送至处理器105,处理器105基于识别结果对应的数字信号控制该扫描仪执行所对应的控制指令。
前述的语音采集单元101、语音处理单元102、语音识别单元103、语音指令存储器104、和处理器105可以是分立的元件,或者是集成在一起的。
扫描模块单元110内具有光学成像模块等扫描仪通用部件,用于对待扫描文件(如文档、图片、照片、胶片、幻灯片等载有一定数据信息的载体)进行扫描而捕获影像信息,生成一扫描文件,扫描仪还包括转换单元(未示出),在处理器105的控制下,转换单元对所生成的扫描文件进行数据处理,使其转换为打印机可识别和直接打印的文件格式。
处理器105,控制扫描仪的整体操作。特别地,处理器控制扫描仪的操作以便根据本实用新型,通过语音采集单元、语音处理单元、语音识别单元和语音指令存储器,执行语音识别,并基于识别的结果,控制该扫描仪执行所对应的控制指令。
网络连接单元120,用于将扫描仪连接至网络中,例如通过一无线网络收发装置,将扫描仪接入网络中。有利地,这里的网络是指因特网,也可以是局域网(LAN)、电话线路网络之类的内部网。
综上所述,本实施例的可语音控制的扫描仪,其设置了语音采集、处理和识别单元,使得扫描仪具备了语音控制功能,用户可以通过语言直接控制扫描仪执行多种操作,提供良好的人机互动,给用户的日常扫描发送工作带来便利,满足用户全方位的使用扫描仪的需求。
以上说明书与附图仅为对本实用新型的解释和说明,不以任何形式对本实用新型构成限制和限定,本实用新型的范围以权利要求书为准,一切不超出本实用新型宗旨的显而易见的修改、变换和替代方案均在本实用新型范围内。

Claims (6)

1.一种可语音控制的扫描仪,包括扫描模块单元和处理器,其特征在于,还包括:
语音采集单元,用于将一外部的语音指令转换为模拟电信号;
语音处理单元,用于处理所接收到的模拟电信号;
语音指令存储器,用于预先存储多个语音指令,并预先存储该多个语音指令所转换的数字信号与该扫描仪的控制指令之间的映射关系;
语音识别单元,分别与所述语音处理单元和语音指令存储器连接,用于识别语音指令并将识别结果发送至所述处理器,所述处理器根据该识别结果对应的数字信号控制该扫描仪的具体运行。
2.如权利要求1所述的可语音控制的扫描仪,其特征在于,所述语音采集单元为一麦克风。
3.如权利要求1所述的可语音控制的扫描仪,其特征在于,所述语音处理单元包括一AD转换单元和降噪单元。
4.如权利要求1所述的可语音控制的扫描仪,其特征在于,所述语音指令存储器为一非易失性随机访问存储器。
5.如权利要求1所述的可语音控制的扫描仪,其特征在于,所述扫描仪还包括网络连接单元,将该扫描仪接入网络。
6.如权利要求1所述的可语音控制的扫描仪,其特征在于,所述扫描仪还包括文档转换单元,该文档转化单元将所述扫描模块单元扫描生成的扫描文件转换成打印机可识别的文件格式。
CN 201220482153 2012-09-19 2012-09-20 可语音控制的扫描仪 Expired - Fee Related CN202798910U (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN 201220482153 CN202798910U (zh) 2012-09-20 2012-09-20 可语音控制的扫描仪
TW102132616A TW201414282A (zh) 2012-09-19 2013-09-10 掃描器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201220482153 CN202798910U (zh) 2012-09-20 2012-09-20 可语音控制的扫描仪

Publications (1)

Publication Number Publication Date
CN202798910U true CN202798910U (zh) 2013-03-13

Family

ID=47826078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201220482153 Expired - Fee Related CN202798910U (zh) 2012-09-19 2012-09-20 可语音控制的扫描仪

Country Status (1)

Country Link
CN (1) CN202798910U (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105869635A (zh) * 2016-03-14 2016-08-17 江苏时间环三维科技有限公司 一种语音识别方法及系统
CN107786766A (zh) * 2016-08-29 2018-03-09 河源市新天彩科技有限公司 一种扫描仪的操作方法及扫描仪
CN111586255A (zh) * 2020-04-01 2020-08-25 武汉中观自动化科技有限公司 一种支持语音控制的扫描仪装置及扫描方法
CN115811576A (zh) * 2018-09-04 2023-03-17 佳能株式会社 带交互代理功能的图像形成系统及其控制方法和存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105869635A (zh) * 2016-03-14 2016-08-17 江苏时间环三维科技有限公司 一种语音识别方法及系统
CN105869635B (zh) * 2016-03-14 2020-01-24 江苏时间环三维科技有限公司 一种语音识别方法及系统
CN107786766A (zh) * 2016-08-29 2018-03-09 河源市新天彩科技有限公司 一种扫描仪的操作方法及扫描仪
CN115811576A (zh) * 2018-09-04 2023-03-17 佳能株式会社 带交互代理功能的图像形成系统及其控制方法和存储介质
CN111586255A (zh) * 2020-04-01 2020-08-25 武汉中观自动化科技有限公司 一种支持语音控制的扫描仪装置及扫描方法

Similar Documents

Publication Publication Date Title
US6295391B1 (en) Automatic data routing via voice command annotation
US8346023B2 (en) User control of computer peripheral apparatuses to perform tasks according to user input image file
US20050205671A1 (en) Cellular phone with scanning capability
CN101453502B (zh) 能够组织重复地址簿记录的通信设备
CN202798910U (zh) 可语音控制的扫描仪
CN103152505A (zh) 智慧型扫描仪及操作方法
CN102476509A (zh) 具有语音识别功能的打印装置及其打印方法
US20040034529A1 (en) Multifunction printer that converts and prints voice data
CN111723653A (zh) 基于人工智能的绘本阅读方法及装置
CN101262513A (zh) 有微型扫描仪的拍照手机
CN202856854U (zh) 可设定发送地址的扫描仪
US7395957B2 (en) Image processing apparatus
CN202856855U (zh) 面部影像识别式扫描仪
CN102857672A (zh) 扫描仪
KR102164773B1 (ko) 마이크로폰으로 인공지능스피커와 연동되는 전자펜 시스템
KR102156055B1 (ko) 인공지능스피커와 연동하여 인터랙티브 프로그램을 제어하는 전자펜 시스템
KR102164774B1 (ko) 인공지능스피커의 기능을 조작하는 전자펜 시스템
KR20060123916A (ko) 화상형성장치 및 그의 이미지데이터 처리방법 그리고이미지데이터 전송 시스템
US20100056049A1 (en) Wireless Mobile Telescanners
CN202907037U (zh) 可识别声纹特征的扫描仪
KR19990006421A (ko) 카메라에 의해 포착된 영상에 관련된 정보 처리 및 디스플레이용 시스템
US11336793B2 (en) Scanning system for generating scan data for vocal output, non-transitory computer-readable storage medium storing program for generating scan data for vocal output, and method for generating scan data for vocal output in scanning system
CN208890892U (zh) 一种新型扫描仪
US10275194B2 (en) Electronic device for file conversion
CN202856850U (zh) 可设定打印份数的扫描仪及智能扫描仪系统

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130313

Termination date: 20140920

EXPY Termination of patent right or utility model