CN1635453A - 作为计算机外设的声控装置 - Google Patents

作为计算机外设的声控装置 Download PDF

Info

Publication number
CN1635453A
CN1635453A CN 200310123451 CN200310123451A CN1635453A CN 1635453 A CN1635453 A CN 1635453A CN 200310123451 CN200310123451 CN 200310123451 CN 200310123451 A CN200310123451 A CN 200310123451A CN 1635453 A CN1635453 A CN 1635453A
Authority
CN
China
Prior art keywords
pin
circuit
capacitor
computing machine
resistance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200310123451
Other languages
English (en)
Other versions
CN1300662C (zh
Inventor
徐波
张东泉
肖兵
杨永良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongke Mosi Technology Co ltd
Institute of Automation of Chinese Academy of Science
Original Assignee
Beijing Zhongke Mosi Technology Co ltd
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongke Mosi Technology Co ltd, Institute of Automation of Chinese Academy of Science filed Critical Beijing Zhongke Mosi Technology Co ltd
Priority to CNB2003101234516A priority Critical patent/CN1300662C/zh
Publication of CN1635453A publication Critical patent/CN1635453A/zh
Application granted granted Critical
Publication of CN1300662C publication Critical patent/CN1300662C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及计算机技术领域,是一种语音信息查询系统用于语音交互的电子装置,特别涉及原有触摸屏类信息查询产品的改造和产品升级。该装置主要包括语音识别工具软件、麦克风、语音信号的滤波与放大电路和增益控制电路、加解密电路及驱动程序、加解密电路与计算机接口电路,及配套的软件开发包。本发明装置充分利用PC的强大资源,语音功能自然而丰富,交互性强,结构简单,轻便,直接连接在计算机的USB口上,通过与通用的多媒体软件开发工具的结合,即可实现用说话的方式进行语音浏览、查询、控制功能。可以很好改善原有触摸屏系统查询效率低,而且需要接触的使用方式,灵活性更强。同时,也是实现pc语音控制功能的统一外部设备。

Description

作为计算机外设的声控装置
技术领域
本发明是涉及语音信息查询系统用于语音交互的电子装置,特别涉及原有信息查询产品(触摸屏)的改造和产品升级。同时,也可作为外部设备安装在个人电脑上,实现语音控制功能,增强计算机的可操作性。
背景技术
作为专用交互平台的信息查询系统主要通过使用者利用手指点击触摸屏幕上的特定信息区域,达到信息查询的目的。主要由计算机主机、显示屏、触摸屏、USB接口声音处理及加密板、音频功率放大器、机柜、音箱、电源等部分组成。
原有触摸屏信息查询系统目前主要存在如下问题:
(1)使用中,对使用者手指的点击动作具有感知和定位能力的触摸屏,在使用中需粘贴在用于显示信息的显示屏上,在触摸屏和显示屏两个部分调试到坐标统一的前提下,实现将手指移动/点击转换成类似于鼠标移动/点击的功能,达到对显示信息进行触摸选择的使用目的。但由于触摸屏本身的构造和材料限制,经常会出现定位的漂移,因而造成显示区域和原有的对应触摸区域的偏差,甚至是不匹配,给正常的使用带来很大的麻烦。为了弥补上述不足,必须将显示和对应的触摸点击区域尽可能做的大一些,以此增加点击的有效性,但显而易见的是降低了每个页面可选信息的数量;而且,还需要定期校正定位。
(2)在使用中,经常触摸区域由于受手指附着物的污染和自然老化等非主观原因,需要定期维护,这也无疑大量增加了用户的维护工作量。
(3)原有的触摸使用方式不够卫生。触摸屏(包括键盘)很可能成为某些疾病的传播者。另外,大部分的消毒液会氧化、分解触摸屏的表面,因此也不允许频繁的进行擦拭,客观上造成使用者的抵触心理。而使用者与具有语音识别功能的查询系统进行交互时,无需接触,而且总存在20-60cm的使用距离,此外,麦克风隔罩的更换和消毒极为简单方便。因而,更加卫生、可靠。
综上所述,信息查询效率不高,必然造成使用复杂程度的增加,在加上卫生等方面的考虑,势必该使用者造成抵触心理。而原有产品对维护工作的要求较高,也增加了维护成本。这些不利因素,在一定程度上阻碍了原有触摸屏系统的发展和推广。
另一方面,作为一个计算机外设的通用产品(USB接口声音处理及加密板可以作为通用USB声卡),本装置可以改善原有的人机交互模式,增加语音控制功能。使用户在操作计算机时,具有的语音控制的选择。特别是不方便使用键盘和用户的双手被占用的情况下,更能突出这一个选择的必要性。
发明内容
借助语音识别功能特有的优势,不仅可以弥补上述不足,更可以有效地改善传统产品的生硬的人机交互方式,实现类似于对话的自然交流。增加使用的亲切感。
本发明装置的设计目的是(一)提供一种基于原有信息查询产品的具有语音交互功能和使用者检测能力的、小型、灵活、低成本的,语音信息浏览、查询、控制应用的专用装置。(二)作为一个通用的计算机外部设备,为原有系统增加一个可控的语音通道,实现但不限于语音控制功能。
为实现上述目的,本发明装置包括:
(1)语音识别工具软件,
(2)麦克风,
(3)语音信号的滤波与放大电路和增益控制电路,
(4)驱动程序,
(5)加解密电路及配套的软件开发包;
其(3)语音信号的滤波与放大电路和增益控制电路中,vcc3接于电阻R12,电阻R12、R13、R14串联,并接于电容C8;电阻R12、R13之间连接有电容器C19,电阻R13、R14之间连接有麦克脚1,电阻R14、电容C8之间连接有电容C7;电容C7另一端与麦克脚2、电位器C19另一端相连接到模拟地;电容C8另一端与R15相接,R15另一端与N2B的第6脚及R16一端相接,N2B的第5脚与USB接口内部放大反馈信号电连接,N2B的第7脚与R17一端相接后做为麦克的最后输出端。
所述的装置,其(5)加解密电路及与计算机接口电路中的模拟通道上,利用数据和不同频率的模拟信号组合的交互,与计算机USB接口通信,达到计算机与装置之间进行握手确认的保密方法;首先,计算机通过USB口向识别软件选定的此设备发出验证请求码;当本设备接收到与其相对应的验证请求码之后,即通过USB口向计算机发送设备标识码;计算机通过USB口接收设备标识码,判断其是否通过验证;通过验证识别软件开始工作。
所述的装置,其(5)加解密电路及与计算机接口电路中含有相应的频率检出电路、电平转换部分的三极管和限流电阻以及用于通道转换的模拟开关和继电器;其中,C23与C22一端相连另一端分别相接与G2两端,G2两端再接于U2的2,3脚;U2的第6脚分别与R35,R34相接;U2的第5脚接到R3 1再与RL1的第5脚相接,通过C31到地,U2的第8脚通过C30到地,U2的第1脚到地;VCC通过R60,R61串联分压连接到N2A的第3脚,N2A的第3脚接一滤波电容,计算机输出的模拟信号通过R53接到N2A的第2脚,N2A的第2脚通过R52与N2A的第1脚相接,N2A的第1脚连接到U2的第7脚;R34另一端接到RL1的第7脚,R35另一端接到V1的B极;RL1的第7脚与第8脚之间接一电容C21。
所述的装置,其交互模式上,不但可以逐步显示交互内容,而且,由于声控技术的融入,能在屏幕上提示更多的交互目录,以声控目录方式提示下一级交互的内容,做到触摸与声控的高效率兼容。
所述的装置,其既可附加到现有触摸屏查询系统,又可连接到个人电脑,实现语音浏览、查询、控制功能。
本发明装置的优点在于:
(1)提高信息交互效率,降低使用复杂度。大部分情况下,使用者可以通过屏幕提供多级查询的引导信息,利用声控功能进行选择。尽可能避免了原有触摸屏系统使用效率方面的问题。
(2)交互时无需用户触摸,从根本上解决了原有系统因为需要接触而带来的不够卫生等方面的局限性。
(3)解决了哪些不方便使用键盘或双后被占用时的人机交互问题。
本发明充分利用计算机的丰富资源和强大的处理能力,语音交互功能自然,娱乐性强。结构简单,轻便,直接连接在计算机的USB口。配套使用的语音识别软件的识别率高,而且是非特定人,不需要使用者去训练,对说话人限制极少,可以很好的进行人机交互。灵活性强,可以方便的通过编程调整、增加语音命令或功能。
本发明装置,既可附加在利用原有信息查询系统上,增加语音识别功能,实现对信息的语音浏览或查询。从而满足市场对非接触式、人性化、高效率的人机交互目的使用需求。
附图说明
图1为作为计算机外设的声控装置的原理示意图;
图2为作为计算机外设的声控装置软件部分的功能示意图;
图3为作为计算机外设的声控装置的语音信号的滤波与放大电路原理图;
图4为作为计算机外设的声控装置的其他电路原理图;
图5为作为计算机外设的声控装置的加解密电路原理图。
具体实施方式
如图1所示,使用者的语音通过麦克风(2)采集后,经过专用电路(3)的处理后的信号送到计算机USB口,识别算法(1)通过对声卡语音信号的检测和处理得到识别结果,信息查询软件根据识别结果的内容,将使用者需要的图像、文字、声音等多媒体信息通过显示屏和扬声器反馈给使用者,或通过合成算法(1)将语音信息播放给使用者,完成交互功能和语音浏览/查询功能。
语音信号的滤波与放大电路和增益控制电路(3)的设计如图3所示,vcc3接于电阻R12,电阻R12、R13、R14串联,并接于电容C8;电阻R12、R13之间连接有电容器C19,电阻R13、R14之间连接有麦克脚1,电阻R14、电容C8之间连接有电容C7;电容C7另一端与麦克脚2、电位器C19另一端相连接到模拟地;电容C8另一端与R15相接,R15另一端与N2B的第6脚及R16一端相接,N2B的第5脚与USB接口内部放大反馈信号电连接,N2B的第7脚与R17一端相接后做为麦克的最后输出端。
包括信号的电容c1的滤波(隔直流)和运算放大器U3和U4的两级运算放大功能,放大电路中的反馈电阻的阻值可根据麦克风特性的不同进行调整。通过运算放大器U3和U4上附加的偏置电压,可使该部分工作于单电压供电方式,ZENER(1.5V)是标称值为1.5伏的稳压管,当采用驻极体麦克风时,该稳压电路提供麦克风的供电;当采用动圈式麦克风时,该部分可不使用。
如图2所示,语音识别算法(1)USB接口声音处理及加密板和计算机数字口(USB口),在每次装置与计算机进行信号交互时通过加解密电路(5)及驱动程序(4)进行相互确认,如未通过确认,则系统不能正常工作,从而实现加密保护功能。上述的保密机制我们称为“握手”,“握手”的具体实现方法是,“握手”协议中定义了一组不同频率的正旋波信号,分别表示“将者”、“听者”、“发送”、“接受”、“数据类型”等,需要“握手”的双方,根据上述协议的约定,利用该设备的模拟通道和USB口的数据通道上信号的组合,完成相互身份合法性的确认。如图4、 图5所示,为计算机外设的声控装置的电路原理图,其中,C23与C22一端相连另一端分别相接与G2两端,G2两端再接于U2的2,3脚;U2的第6脚分别与R35,R34相接U2的第5脚接到R31再与RL1的第5脚相接,通过C31到地,U2的第8脚通过C30到地,U2的第1脚到地;VCC通过R60,R61串联分压连接到N2A的第3脚,N2A的第3脚接一滤波电容,计算机输出的模拟信号通过R53接到N2A的第2脚,N2A的第2脚通过R52与N2A的第1脚相接,N2A的第1脚连接到U2的第7脚;R34另一端接到RL1的第7脚,R35另一端接到V1的B极;RL1的第7脚与第8脚之间接一电容C21。
其中由运算放大器U2A、U2B及相联的电阻、电容、三极管等分离器件组成“握手”信号的检测电路。UA2-4.5NEC用来完成对通道的切换。
本电路供电由计算机USB口直接供电,所有运放为单电源供电完成差分放大。

Claims (5)

1.一种作为计算机外设的声控装置,包括:
(1)语音识别工具软件,
(2)麦克风,
(3)语音信号的滤波与放大电路和增益控制电路,
(4)驱动程序,
(5)加解密电路及配套的软件开发包;
其特征在于:(3)语音信号的滤波与放大电路和增益控制电路中,Vcc3接于电阻R12,电阻R12、R13、R14串联,并接于电容C8;电阻R12、R13之间连接有电容器C19,电阻R13、R14之间连接有麦克脚1,电阻R14、电容C8之间连接有电容C7;电容C7另一端与麦克脚2、电位器C19另一端相连接到模拟地;电容C8另一端与R15相接,R15另一端与N2B的第6脚及R16一端相接,N2B的第5脚与USB接口内部放大反馈信号电连接,N2B的第7脚与R17一端相接后做为麦克的最后输出端。
2.根据权利要求1所述的装置,其特征在于:(5)加解密电路及与计算机接口电路中的模拟通道上,利用数据和不同频率的模拟信号组合的交互,与计算机USB接口通信,达到计算机与装置之间进行握手确认的保密方法;首先,计算机通过USB口向识别软件选定的此设备发出验证请求码;当本设备接收到与其相对应的验证请求码之后,即通过USB口向计算机发送设备标识码;计算机通过USB口接收设备标识码,判断其是否通过验证;通过验证识别软件开始工作。
3.根据权利要求1所述的装置,其特征在于:(5)加解密电路及与计算机接口电路中含有相应的频率检出电路、电平转换部分的三极管和限流电阻以及用于通道转换的模拟开关和继电器;其中,C23与C22一端相连另一端分别相接与G2两端,G2两端再接于U2的2,3脚;U2的第6脚分别与R35,R34相接;U2的第5脚接到R31再与RL1的第5脚相接,通过C31到地,U2的第8脚通过C30到地,U2的第1脚到地;VCC通过R60,R61串联分压连接到N2A的第3脚,N2A的第3脚接一滤波电容,计算机输出的模拟信号通过R53接到N2A的第2脚,N2A的第2脚通过R52与N2A的第1脚相接,N2A的第1脚连接到U2的第7脚;R34另一端接到RL1的第7脚,R35另一端接到V1的B极;RL1的第7脚与第8脚之间接一电容C21。
4.根据权利要求1所述的装置,其特征在于:交互模式上,不但可以逐步显示交互内容,而且,由于声控技术的融入,能在屏幕上提示更多的交互目录,以声控目录方式提示下一级交互的内容,做到触摸与声控的高效率兼容。
5.根据权利要求1所述的装置,其特征在于,既可附加到现有触摸屏查询系统,又可连接到个人电脑,实现语音浏览、查询、控制功能。
CNB2003101234516A 2003-12-29 2003-12-29 作为计算机外设的声控装置 Expired - Lifetime CN1300662C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2003101234516A CN1300662C (zh) 2003-12-29 2003-12-29 作为计算机外设的声控装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2003101234516A CN1300662C (zh) 2003-12-29 2003-12-29 作为计算机外设的声控装置

Publications (2)

Publication Number Publication Date
CN1635453A true CN1635453A (zh) 2005-07-06
CN1300662C CN1300662C (zh) 2007-02-14

Family

ID=34844789

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2003101234516A Expired - Lifetime CN1300662C (zh) 2003-12-29 2003-12-29 作为计算机外设的声控装置

Country Status (1)

Country Link
CN (1) CN1300662C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426483A (zh) * 2011-12-27 2012-04-25 中国科学院软件研究所 一种面向触控设备的多通道精确目标定位方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1103076C (zh) * 1997-05-30 2003-03-12 刘达民 利用语音讯号控制游戏软件的方法及装置
JPH11184877A (ja) * 1997-12-22 1999-07-09 Sekisui House Ltd 植物選定装置
CN1223400A (zh) * 1998-01-13 1999-07-21 黄金富 声控电脑用语音输入装置
CN1269557A (zh) * 2000-05-18 2000-10-11 王广武 一种信息查询方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426483A (zh) * 2011-12-27 2012-04-25 中国科学院软件研究所 一种面向触控设备的多通道精确目标定位方法

Also Published As

Publication number Publication date
CN1300662C (zh) 2007-02-14

Similar Documents

Publication Publication Date Title
CN1967458B (zh) 控制触控屏幕使用者接口的方法及其装置
CN1619585A (zh) 使用便携终端中的触摸屏输入字符的装置和方法
WO2006071357A3 (en) Method and system for resolving cross-modal references in user inputs
CN1517834A (zh) 将第二个计算机系统实现为第一个计算机系统的接口
CN103577099A (zh) 移动设备中用于虚拟tour创建的方法和装置
ATE280971T1 (de) Tragbare kommunikationsvorrichtung und verfahren
CN1731464A (zh) 可群组遥控多个电子装置的遥控器及相关方法
EP2772829B1 (en) System for enabling a visually impaired or blind person to use an input device having at least one key
CN102405455A (zh) 触摸板输入设备
Corradini et al. A map-based system using speech and 3D gestures for pervasive computing
CN1300662C (zh) 作为计算机外设的声控装置
CN103295570A (zh) 一种手套式发声系统
Tsukada et al. Ubi-finger: A simple gesture input device for mobile and ubiquitous environment
CN106022051A (zh) 移动终端找回方法以及移动终端
KR20030085268A (ko) 아이콘 형식의 유저 인터페이스를 갖는 리모콘
CN1285994C (zh) 人机交互方法及装置
CN112975944A (zh) 一种银行预填单服务机器人
KR20150046997A (ko) 사용자 단말의 터치 인식 장치 및 방법
CN215101297U (zh) 一种非接触式电梯外控设备
CN114898727A (zh) 一种基于外设设备的midi控制器、midi消息生成系统及方法
CN209928653U (zh) 一种编程教育机器人
Mulder The I-Cube system: moving towards sensor technology for artists
WO2018148881A1 (zh) 交互教学机器人及其处理方法
CN207946726U (zh) 一种基于语音识别的一体机
CN1786878A (zh) 具有音频输出的键盘

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20070214

CX01 Expiry of patent term