CN101893993B - 电子白板系统及其语音处理方法 - Google Patents

电子白板系统及其语音处理方法 Download PDF

Info

Publication number
CN101893993B
CN101893993B CN 201010230032 CN201010230032A CN101893993B CN 101893993 B CN101893993 B CN 101893993B CN 201010230032 CN201010230032 CN 201010230032 CN 201010230032 A CN201010230032 A CN 201010230032A CN 101893993 B CN101893993 B CN 101893993B
Authority
CN
China
Prior art keywords
voice
user
unit
recognition
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201010230032
Other languages
English (en)
Other versions
CN101893993A (zh
Inventor
封春日
张松如
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU WANIN EDUCATION MULTIMEDIA TECHNOLOGY CO LTD
Original Assignee
HANGZHOU HUAYIN VIDEO SIGNAL TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU HUAYIN VIDEO SIGNAL TECHNOLOGY Co Ltd filed Critical HANGZHOU HUAYIN VIDEO SIGNAL TECHNOLOGY Co Ltd
Priority to CN 201010230032 priority Critical patent/CN101893993B/zh
Publication of CN101893993A publication Critical patent/CN101893993A/zh
Application granted granted Critical
Publication of CN101893993B publication Critical patent/CN101893993B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明提供了一种电子白板系统,包括语音识别单元、控制单元和执行单元,其中,所述语音识别单元用于接收用户语音信息,对所述语音信息进行识别,将与语音信息对应的识别结果发送给控制单元;所述控制单元基于语音识别单元发送的识别结果,与操作指令列表进行对应,获得与识别结果对应的操作指令,将所述操作指令发送至执行单元;所述执行单元基于控制单元的操作指令进行相应的操作。本发明的电子白板系统利用用户的语音信息辅助操作电子白板,简化了用户的操作,提供一种人机交互新方法。

Description

电子白板系统及其语音处理方法
技术领域
本发明涉及电子白板系统,特别涉及利用语音识别技术的电子白板系统及语音处理方法。
背景技术
现有的电子白板系统包括具有触摸功能的大屏幕液晶显示屏、电子计算机、投影机,主要应用于现代化的教学、培训、会议和演示。现有的电子白板系统利用具有触摸功能的大屏幕液晶显示屏幕作为电子白板显示屏,利用投影机将计算机中的内容投影于电子白板显示屏中,电子白板显示屏作为人机交互界面,用户可以通过电子白板显示屏对计算机进行操作。
借助于各种不同的应用程序,现有的电子白板系统具有多种功能,主要包括手写功能、交互功能和管理功能。所述交互功能主要是指用户可以通过电子白板显示屏上显示的操作系统来操作计算机,实现人机交互。具体地,用户无需鼠标,利用电子笔作为输入设备,在电子白板显示屏进行点选,实现对计算机的各种操作,例如用户可以随时调用计算机中存放的所有文档(比如Word、Power Point、图片等),将文档在白板触摸显示屏上。所述手写功能是指用户可以利用电子笔在电子白板显示屏进行手写,包括对电子白板上显示的内容进行批注,并且用户可以选择书写效果。例如用户可以选择使用毛笔、铅笔、普通笔、荧光笔等进行书写,可以调节电子笔的粗细、颜色。手写功能还包括了电子板擦、局部放大、探照灯突出重点等功能。所述管理功能是指用户的演示过程中可以随时保存文档以及对文档进行后台编辑管理,例如用户可以将文档保存为JPG、BMP、HTML等图片或网页格式;用户可以打印文件,发送电子邮件等。借助于计算机的内存,现有的电子白板系统还提供丰富的资源库功能,供用户进行选择使用,以取得更好的演示效果。
由于现有的电子白板系统的资源库内容丰富,用户在选择时需要花费时间查找,并且现有的资源库多包括多个文件夹,每个文件夹下包括多个子文件夹,用户可能需要多次点选才可以找到需要的资源,操作不方便,且花费用户的时间。现有的电子白板操作的功能多,用户可选的功能按钮多,需要用户花费时间记忆各种功能按钮的对应的功能,对用户而言不方便。
因此,需要一种新的电子白板系统,能够满足用户的操作需要,方便、快捷。
发明内容
本发明解决的问题是,提供了一种新的电子白板系统,能够满足用户的操作需要,方便、快捷。
为了解决上述问题,本发明提出一种电子白板系统,包括语音识别单元、控制单元和执行单元,其中,
所述语音识别单元用于接收用户语音信息,对所述语音信息进行识别,将与语音信息对应的识别结果发送给控制单元;
所述控制单元基于语音识别单元发送的识别结果,与操作指令列表进行对应,获得与识别结果对应的操作指令,将所述操作指令发送至执行单元;
所述执行单元基于控制单元的操作指令进行相应的操作。
可选地,所述语音识别单元包括语音采集单元和语音引擎;其中,
所述语音采集单元采集用户语音信息,将所述语音信息发送至所述语音引擎;
语音引擎,用于对所述语音采集单元发送的所述用户语音信息进行语音识别,若所述与用户语音信息的语音特征与标准语音特征匹配,则产生与标准语音特征对应的识别结果,将所述识别结果发送至控制单元。
可选地,所述语音引擎包括预处理单元、识别单元;
所述预处理单元用于对所述语音采集单元输入的用户的语音信息进行预处理,去除用户语音信息中的噪声,将预处理后的用户语音信息发送至识别单元;
所述识别单元用于对来自预处理单元的语音信息进行特征提取,获得用户的语音特征,基于用户的语音特征进行语音识别,若用户的语音特征与标准语音特征匹配,则产生与标准语音特征对应的识别结果,将所述识别结果发送至控制单元。
可选地,所述识别单元包括特征提取单元、比对单元、标准语音特征单元,
所述特征提取单元用于提取用户语音信息的语音特征,将所述语音特征发送至比对单元;
所述比对单元基于所述语音特征,与标准语音特征单元中存放的标准语音特征进行比对,若所述语音特征与标准语音特征匹配,则比对单元产生与所述标准语音特征对应的识别结果,将所述识别结果发送至控制单元。
可选地,所述标准语音特征单元中存放的标准语音特征的数目范围为大于等于1小于等于300。
可选地,所述语音引擎为基于语音识别技术的Speech SDK 5.1识别引擎或Pattek PC SDK识别引擎。
可选地,所述控制单元包括语音识别接口单元和操作指令单元;
所述语音识别接口单元用于基于用户的控制指令开启语音识别单元或关闭语音识别单元;接收来自语音识别单元的识别结果,将所述识别结果与操作指令单元中的操作指令对应,获得与识别结果对应的操作指令,并将所述操作指令发送至执行单元。
本发明还提供一种电子白板系统的语音处理方法,包括:
接收用户的语音信息;
对所述语音信息进行语音识别,获得与所述语音信息对应的识别结果;
基于所述识别结果与操作指令进行对应,产生与所述识别结果对应的操作指令;
基于操作指令进行相应的操作。
可选地,所述对所述语音信息进行语音识别,获得与所述语音信息对应的识别结果包括:
对用户语音信息进行预处理,去除用户语音信息中的噪声;
对预处理后的用户语音信息进行特征提取,获得用户语音信息的语音特征;
基于所述语音特征与标准的语音特征进行比对,若所述语音特征与标准的语音特征匹配,则产生识别结果;反之则继续进行比对,至获得识别结果。
可选地,所述基于所述识别结果与操作指令进行对应,产生与所述识别结果对应的操作指令包括:
将所述识别结果与操作指令列表中的操作指令对应,获得与所述识别结果对应的操作指令。
与现有技术相比,本发明具有以下优点:本发明提供的语音识别单元基于用户的语音信息进行语音识别,获得与所述语音信息对应的识别结果;所述控制单元基于语音识别单元的识别结果产生操作指令;所述执行单元基于控制单元的操作指令进行相应的操作,所述白板系统利用用户的语音信息获得操作指令,辅助用户操作电子白板,提供了一种新的人机交互界面,使用户具有更好的使用体验,本发明的白板系统使用户的操作更加简单方便,节约了用户的时间,使用户具有更好的使用体验。
进一步优化地,语音识别单元中的标准语音特征的数目范围为1~300个,用户的特征语音与标准语音特征比对的次数少,加快了语音识别的速度,提高了语音识别的正确率。
附图说明
图1是本发明一个实施方式的电子白板结构示意图。
图2是本发明又一实施方式的电子白板系统结构示意图。
图3是本发明的一个实施方式的识别单元结构示意图。
图4是本发明一个实施方式的电子白板系统的通讯方法流程示意图。
具体实施方式
发明人发现,现有的电子白板系统的功能强大,利用电子笔对白板触摸显示屏上显示的操作界面进行各种操作。用户需要非常熟悉现有电子白板操作系统的各种功能按钮,如果用于点选时选错功能按钮,则需要重新退回原操作界面重新点选,浪费用户的时间;并且由于现有的白板操作软件的菜单选项多,用户使用时需要一一选择,不方便;现有的资源库丰富的资源,也给用户查找常用的资源带来了一定的负担。
相对地,本发明利用用户的语音信息取代电子笔,通过语音识别技术识别用户语音,获得对应的操作指令,辅助用户对电子白板进行操作,本发明的电子白板系统节约用户时间,并且提供了人机交互的新方法,给用户以更好的使用体验。
本发明提供一种电子白板系统,请参考图1所示的本发明一个具体实施方式的电子白板系统结构示意图。所述电子白板系统包括:语音识别单元100、控制单元200和执行单元300。
在实际中,所述电子白板系统还可以包括具有触摸功能的大屏幕液晶显示屏、电子计算机、投影机。本发明所述的语音识别单元100、控制单元200和执行单元300工作时利用计算机的内存存放各种信息数据。
其中所述语音识别单元100用于接收用户语音信息,对所述语音信息进行识别,获得与所述语音信息对应的识别结果,将所述识别结果发送给控制单元200;所述控制单元200基于所述语音识别单元100发送的识别结果,与操作指令列表进行对应,获得与所述识别结果对应的操作指令,将所述操作指令发送至所述执行单元300;所述执行单元300基于控制单元200的操作指令进行相应的操作。
继续参考图1,所述语音识别单元100包括语音引擎101和语音采集单元102。其中,所述语音采集单元102用于接收用户语音信息,将所述语音信息发送至语音引擎101,所述语音引擎101用于对用户的语音信息进行语音识别,若所述与用户语音信息的语音特征与标准语音特征匹配,则产生与标准语音特征即对应的识别结果,将所述识别结果发送至控制单元200。例如,用户输入“铅笔”的语音信息至语音引擎101,用户语音引擎101将“铅笔”的语音特征与标准语音特征匹配,若用户的“铅笔”的语音信息与标准语音特征中的“铅笔”匹配,则识别用户输入的信息是“铅笔”,则语音引擎101输出与标准语音特征中的“铅笔”对应的识别结果,将其发送至控制单元200。
作为一个具体的实施例,所述语音引擎101可以为基于语音识别技术的Speech SDK 5.1识别引擎或Pattek PC SDK识别引擎。其中所述Speech SDK5.1识别引擎为美国微软公司开发的语音识别开发平台,其具有语音识别开发方便快捷的优点;所述Pattek PC SDK识别引擎为中国科学院自动化所开发的语音识别平台,其汉语言识别准确率高。在实际中,本领域技术人员可以根据实际需要进行具体选择。
作为本发明具体实施例,所述语音采集单元102可以进一步包括采样模块、转化模块、通讯模块。所述通讯模块用于与外部通讯,并且基于外部命令控制所述采样模块、转化模块进行工作。所述采样模块用于获得用户的声音信号,将所述用户的声音信号发送至所述转换模块。所述转换模块用于将用户的声音信号进行转换,获得模拟电信号,并且将所述模拟电信号发送至通讯模块。所述通讯模块将模拟电信号作为用户的语音信息,发送至所述语音引擎101。
所述通讯模块接收外部的控制命令,所述控制命令包括开启命令和关闭命令。在接到开启命令后,所述通讯模块发送开启信号,使得所述采样模块和转换模块开始工作;在接到关闭命令后,所述通讯模块发送关闭信号,使得所述采样模块和转换模块停止工作。作为一个实施例,用户需要利用语音信息辅助操作时,通过控制单元输入开启语音识别单元的命令或直接向语音识别单元输入开启命令,语音识别单元开启,由语音识别单元发送开启命令至通讯模块,将通讯模块开启,所述通讯模块控制采样模块和转换模块开始工作。当用户不需要利用语音信息辅助操作时,通过控制单元输入关闭语音识别单元的命令或直接向语音识别单元输入关闭命令,将语音识别单元关闭,所述语音识别单元在关闭之前,发送关闭命令至通讯模块,将通讯模块关闭,由通讯模块控制采样模块和转换模块停止工作。在其他的实施例中,通讯模块还可以有其他的控制方式,例如通讯模块基于来自语音引擎的控制命令工作。
所述采样模块需要在一定的采用频率下工作,以采集用户的声音信号。根据采样定理,所述采样频率应大于用户声音信号的两倍,以保证获得的用户声音信号不失真。
作为本发明的又一具体实施例,所述语音采集单元102可以为具有蓝牙功能的麦克风,其包括电容式麦克风和蓝牙通讯单元(作为通讯模块)。所述电容式麦克风集成了采集模块和转换模块。所述电容式麦克风包括具有两块金属电极板的电容,其中一块电极板表面涂有驻极体薄膜(例如是聚全氟乙丙烯)并接地,另一电极板接在场效应晶体管的栅极上,栅极与源极之间接有一个二极管。当所述驻极体薄膜本身带的电荷的电量为Q,两个电极板间的电容为C时,两个电极板之间的电压为U=Q/C。由于用户发出的声音使得驻极体薄膜发生震动,从而改变两个电极板之间的距离,则所述电容C发生改变。由于所述驻极体薄膜带有的电荷的电量为Q,则相应的两个电极板之间的电压会变化。电压变化的频率反应了用户声音的频率,从而将用户的声音信号转换为模拟电信号。
需要说明的是,作为本发明的一个实施方式,语音采集单元集成于语音识别单元中,接收语音识别单元发送的的控制信号,控制语音采集单元开启或关闭。在用户在希望利用语音指令辅助操作时,选择开启语音识别单元,由语音识别单元开启语音采集单元,这样无需用户进行开启语音采集单元的动作,方便用户操作,并节省时间。
作为本发明的其他实施方式,语音采集单元还可以独立于语音识别单元。语音采集单元基于用户的操作指令开启或关闭,并且在开启时接收用户的声音信息,将其转换后发送至语音识别单元。
下面请参考图2,图2是本发明又一实施方式的电子白板系统结构示意图。语音识别单元100包括语音引擎101和语音采集单元101。所述语音引擎101进一步包括预处理单元1011和识别单元1012。
参考图2,所述预处理单元1011用于对语音采集单元101输入的用户的语音信息进行预处理,以去除用户的语音信息中包括的噪声,将明显不属于用户声音的信息过滤,使得预处理后的语音信息更接近真实的用户的语音信息(或更能反应用户的语音信息的本质),从而提高后续识别单元1012的识别速度,并且节约系统的资源。由于所述语音采集单元101采集用户语音信息时,环境中可能有噪声(包括来自用户以外的其他人的声音或者其他物体的声音),所述噪声与用户的语音信息相比,在频率、能量等方面具有差异,因此本发明利用所述差异将用户的语音信息与噪声区分开,以去除噪声。在实际中,所述预处理可以利用端点检测技术和语音增强技术。其中所述端点检测技术将语音信号和非语音信号时段区分开,确定语音信号的起始点,后续处理仅对语音信号处理,提高后续语音识别的准确率;语音增强出要用户消除环境噪声对语音的影响,可以利用维纳滤波的方法,可以取得较好的滤波效果。
参考图2,所述识别单元1012用于根据所述预处理单元1011处理后的语音信息进行特征提取,获得用户的语音特征,并基于用户的语音特征进行语音识别,若所述语音特征与标准的语音特征进行匹配,则产生与标准语音信息对应的识别结果,并将所述识别结果发送至控制单元200。具体地,所述识别结果可以是对于某一应用程序的命令字。
具体地,参考图3,图3是本发明的一个实施方式的识别单元结构示意图。所述识别单元1012包括:特征提取单元10121、比对单元10122、标准语音特征单元10123。其中特征提取单元10121基于预处理单元1011发送的处理后的用户语音信息进行特征提取,获得用户语音信息的语音特征。所述语音特征单元10123中存放了标准的语音特征,比对单元10122将特征提取单元10121的中获得的用户的语音特征与标准的语音特征进行比对。若用户的语音特征与语音特征单元10123中存放的语音信息匹配,则比对单元10122产生与标准的语音特征对应的识别结果,将其发送至控制单元200。其中,本发明所述的匹配具体是指,用户的语音特征与标准的语音特征之间的相似度达到预设值。例如,预处理单元1011基于用户的语音信息对其进行统计学的分析,获得用户语音信息的频谱特征,作为用户的语音特征;比对单元10122对用户语音信息的频谱特征与标准的语音的频谱特征相似度达到预定值(例如90%),则比对单元10122产生与标准的频谱特征对应的识别结果,并将所述识别结果至控制单元200。
所述标准语音特征单元10123中存放的标准的语音特征,所述标准的语音特征在实际中通过对标准的语音进行特征提取获得。标准的语音的数目越多,对应的标准的语音特征越多。所述标准的语音可以是若干单词,例如是用户输入计算机中的操作指令(放大、缩小、保存等都属于用户的操作指令)。由于用户的语音特征需要与标准的语音特征进行比对,标准的语音特征越多,比对的速度就越慢,从而语音识别的速度越慢。为了保证语音识别的速度,同时占用系统的内存少,标注的语音的数目不宜过多,其数目优选在1~300个之内,从而对应的标准的语音特征在1~300个以内。由于标准的语音特征的存放于计算机中,将其数目设置在1~300个以内,节约了计算机内存。作为优选的实施例,标准的语音特征数目为1~300。在实际中,标准的语音特征数目不限于300以内。
由于用户输入计算机中的操作指令较多,应对各种操作指令进行优选,选择其中部分用户需要利用语音信息辅助操作的指令,作为标准的语音;然后根据标准语音进行特征提取,获得标准的语音特征。
具体地,所述操作指令的选取原则可以首先基于用户需要经常点选、点选操作不方便的功能按钮,这样部分用户常用的功能按钮可以用语音指令辅助操作,例如用户常用的“放大”功能、“缩小”功能,确定所述功能对应的标准语音,以及与标准语音对应标准特征。
然后,由于用户经常使用资源库,将用户的资源库划分节点,将资源库根据节点划分,这样用户在查找资源库时不需要点选节点,直接用语音指令辅助即可,例如教学用的资源库中分为“文科”和“理科”一级节点,在“文科”和“理科”一级节点下包括若干二级节点,确定所述一级节点和二级节点对应的标准语音的标准语音特征。
接着,将用户常用的资源库中的资源进行划分,将部分特殊的或者用户常用的资源用语音指令表示,这样用户在使用常用资源时,无需多次点选,可以直接利用语音指令获得,例如对于化学资源库中的“化学仪器烧杯”、地理资源库中的“中国地图”等资源,确定与其对应的标准语音特征。
最后,在对前述标准的语音特征进行确认,确认标准的语音特征与标准的语音对应,并且标准的语音与功能按钮、资源库的节点以及特殊资源一一对应,以确保后续语音识别的准确性,提高语音识别的速度。
参考图2,所述控制单元200进一步包括语音识别接口单元201和操作指令单元202。其中所述语音识别接口单元201根据语音识别单元100发送的识别结果,将所述识别结果与操作指令单元202中的操作指令对应,将与识别结果对应的操作指令发送至执行单元300。作为本发明的一个实施例,所述语音识别接口单元201还基于用户的控制指令开启或关闭语音识别单元100。例如,用户在希望利用语音信息辅助操作时,输入开启语音辅助操作的控制指令至语音识别接口单元201,所述语音识别接口单元201输出开启操作指令至语音识别单元100,同时所述语音识别接口单元201在计算机内存中为语音识别单元100分配相应的空间,用于语音识别单元100工作。用户不需要利用语音信息辅助操作时,输入关闭语音辅助操作的控制指令至语音识别接口单元201,所述语音识别接口单元201输出关闭操作指令至语音识别单元100,并且将计算机内存中的语音识别单元100的空间释放,以免占用内存。
所述操作指令单元202根据语音识别接口单元201发送的识别结果,将所述识别结果与操作指令单元202中的操作指令对应,确定与识别结果对应的操作指令,将操作指令发送给执行单元300。所述操作指令与用户的语音信息对应,可以为执行某一功能、打开某一资源库或者显示某一特殊资源。所述操作指令代替了用户利用电子笔进行点击操作的动作,简化了用户的操作,使用户更加方便的操作电子白板。所述执行单元300能够执行的操作可以是用户希望用户利用语音信息辅助的任何操作,所述操作与用户的语音信息对应。例如,所述执行单元300接收的操作指令为打印当前文档,则执行单元300与打印机进行通讯,发送当前文档至打印机,进行打印。
本发明的白板系统包括电子计算机,白板系统在语音识别的过程中的数据存放于计算机内存中,白板系统的资源库可以存放于计算机内存中。可以利用执行单元发送的操作指令对电子计算机进行相应的操作,例如执行单元发送保存当前文档的指令,使得计算机进行保存当前文档的操作或者发送调用计算机中存放的资源库等。
本发明提供的白板系统操作简单,利用用户的语音信息取代电子笔点击,进行辅助操作,简化了操作电子白板的方法。对于用户而言,若希望实现某一功能或显示某一特殊资源,只需要对麦克风发出相应的声音,由白板系统进行后续的操作。例如,用户希望“放大”或希望展示“中国地图”,只需发出“放大”或“中国地图”的声音信号,由语音采集单元转换为语音信息;将语音信息发送至语音识别单元;语音识别单元进行识别,将语音信息与识别单元中的标准语音信息进行匹配,获得与所述语音信息对应的识别结果;将识别结果发送至控制单元,由控制单元根据识别结果发送操作指令至相应的执行单元,执行“放大”功能或将“中国地图”显示在电子白板上。
本发明还提供一种在电子白板系统的通讯方法。请参考图4,图4是本发明一个实施方式的电子白板系统的通讯方法流程示意图。所述通讯方法包括:
步骤S1,接收用户的语音信息;
步骤S2,对所述语音信息进行语音识别,获得与所述语音信息对应的识别结果;
步骤S3,基于所述识别结果与操作指令进行对应,产生与所述识别结果对应的操作指令;
步骤S4,基于操作指令进行相应的操作。
下面将结合具体实施方式对本发明的技术方案进行详细说明。
首先,接收用户的语音信息。所述用户的语音信息为利用语音采集单元获得。所述语音采集单元输入用户的声音信号,对语音信号进行转换,获得对应的用户的语音信息。所述语音信息为模拟电信号。所述语音采集单元可以为具有蓝牙功能的麦克风,所述麦克风佩戴于用户身上,接收用户的声音信号,将声音信号转换成为语音信息,利用蓝牙功能进行数据传输,将语音信息传输至语音识别单元。
然后,基于用户的语音信息,语音识别单元进行语音识别,获得识别结果,具体包括:
对用户语音信息进行预处理,去除用户语音信息中的噪声;
对预处理后的用户语音信息进行特征提取,获得用户语音信息的语音特征;
基于所述语音特征与标准的语音特征进行比对,若所述语音特征与标准的语音特征匹配,则产生识别结果;反之则继续进行比对,至获得识别结果。
其中,所述预处理将明显不属于用户声音的信息过滤,使得预处理后的语音信息更接近真实的用户的语音信息(或更能反应用户的语音信息的本质),从而提高后续识别单元的识别速度,并且节约系统的资源。由于噪声包括来自用户以外的其他人的声音或者其他物体的声音,所述噪声与用户的声音相比,在频率、能量等方面具有差异,利用所述差异将用户的语音信息与噪声区分开,去除噪声。在实际中,所述预处理可以利用端点检测技术和语音增强技术,其中所述端点检测技术将语音信号和非语音信号时段区分开,确定语音信号的起始点,后续处理仅对语音信号处理,提高后续语音识别的准确率;语音增强出要用户消除环境噪声对语音的影响,可以利用维纳滤波的方法,可以取得较好的滤波效果。
所述特征提取用于获获得用户信息的语音特征,所述语音特征可以为用户语音信息的频谱特征,可以通过统计学分析获得。在获得用户的语音信息后,将用户的语音特征与标准的语音特征进行比对,若两者的相似度达到预定值,则认为两者匹配,相应的产生与所述标准的语音特征对应的识别结果,将识别结果发送至控制单元。
然后,基于所述识别结果,将所述识别结果与操作指令单元中的操作指令对应,确定与识别结果对应的操作指令,将操作指令发送给执行单元。所述操作指令与用户的语音信息对应,可以为执行某一功能、打开某一资源库或者显示某一特殊资源。所述操作指令代替了用户利用电子笔进行点击操作的动作,简化了用户的操作,使用户更加方便的操作电子白板。所述执行单元能够执行的操作可以是用户希望用户利用语音信息辅助的任何操作,所述操作与用户的语音信息对应。例如,所述执行单元接收的操作指令为打印当前文档,则执行单元与打印机进行通讯,发送当前文档至打印机,进行打印;或者,所述执行单元接收的操作指令为从计算机中调用某一资源库,则执行单元与计算机进行通讯,使得计算机调用所述资源库。
本发明所述的白板系统在进行语音识别前,需要开启语音识别功能,以开启语音识别单元。开启语音识别功能的同时需要在计算机的内存中为语音识别单元分别相应的单元,以便于语音识别单元存放各种数据。语音识别功能由用户选择开启或由控制单元开启。利用控制单元开启,可以进一步减少用户的操作,用户只需要对控制单元进行一次操作就可以获得相应的操作指令。由用户选择开启,可以提高用户自由选择的权利。在用户不想使用语音识别功能的时候,通过控制单元关闭语音识别单元,节约系统内存。
综上,本发明提供的白板系统利用用户的语音信息辅助操作,节约用户时间,方便用户操作,并且提供了人机交互的新方法。
本发明虽然已以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以利用上述揭示的方法和技术内容对本发明技术方案做出可能的变动和修改,因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化及修饰,均属于本发明技术方案的保护范围。

Claims (5)

1.一种电子白板系统的语音处理装置,其特征在于,包括语音识别单元、控制单元和执行单元,其中,
所述语音识别单元用于接收用户语音信息,对所述语音信息进行识别,获得与所述语音信息对应的识别结果;
所述控制单元基于语音识别单元获得的识别结果,与操作指令列表进行对应,获得与所述识别结果对应的操作指令;
所述执行单元基于控制单元的操作指令进行相应的操作,其中,
所述语音识别单元包括预处理单元和识别单元,
所述预处理单元用于对用户的语音信息进行预处理,去除用户语音信息中的噪声;
所述识别单元用于对来自预处理单元的语音信息进行特征提取,获得用户语音信息的语音特征,基于所述语音特征与标准语音特征单元中的标准语音特征进行比对,若所述语音特征与标准语音特征匹配,则产生识别结果;反之则继续进行比对,直至获得识别结果;
所述标准语音特征单元,位于所述识别单元中,用于存放标准语音特征,所述标准语音特征包括:与常用的功能按钮对应的标准语音特征、与用户的资源库节点对应的标准语音特征、以及与用户常用的资源库中的资源对应的标准语音特征。
2.如权利要求1所述的电子白板系统的语音处理装置,其特征在于,所述标准语音特征单元中存放的标准语音特征的数目范围为大于等于1小于等于300。
3.如权利要求1所述的电子白板系统的语音处理装置,其特征在于,所述语音识别单元为基于语音识别技术的Speech SDK 5.1识别引擎或Pattek PC SDK识别引擎。 
4.如权利要求1所述的电子白板系统的语音处理装置,其特征在于,所述控制单元包括语音识别接口单元和操作指令单元;
所述语音识别接口单元用于基于用户的控制指令开启语音识别单元或关闭语音识别单元;接收来自语音识别单元的识别结果,将所述识别结果与操作指令单元中的操作指令对应,获得与识别结果对应的操作指令,并将所述操作指令发送至执行单元。
5.一种电子白板系统的语音处理方法,其特征在于,包括:
接收用户的语音信息;
对所述语音信息进行语音识别,获得与所述语音信息对应的识别结果;
基于所述识别结果与操作指令列表进行对应,产生与所述识别结果对应的操作指令;
基于操作指令进行相应的操作,其中,
所述对所述语音信息进行语音识别,获得与所述语音信息对应的识别结果包括:
对用户语音信息进行预处理,去除用户语音信息中的噪声;
对预处理后的用户语音信息进行特征提取,获得用户语音信息的语音特征;
基于所述语音特征与标准语音特征进行比对,若所述语音特征与标准语音特征匹配,则产生识别结果;反之则继续进行比对,直至获得识别结果;
所述标准语音特征包括:与常用的功能按钮对应的标准语音特征、与用户的资源库节点对应的标准语音特征、以及与用户常用的资源库中的资源对应的标准语音特征。 
CN 201010230032 2010-07-15 2010-07-15 电子白板系统及其语音处理方法 Expired - Fee Related CN101893993B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010230032 CN101893993B (zh) 2010-07-15 2010-07-15 电子白板系统及其语音处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010230032 CN101893993B (zh) 2010-07-15 2010-07-15 电子白板系统及其语音处理方法

Publications (2)

Publication Number Publication Date
CN101893993A CN101893993A (zh) 2010-11-24
CN101893993B true CN101893993B (zh) 2012-05-23

Family

ID=43103198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010230032 Expired - Fee Related CN101893993B (zh) 2010-07-15 2010-07-15 电子白板系统及其语音处理方法

Country Status (1)

Country Link
CN (1) CN101893993B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3214542A1 (en) * 2016-03-04 2017-09-06 Ricoh Company, Ltd. Voice control of interactive whiteboard appliances

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103135751A (zh) * 2011-11-30 2013-06-05 北京德信互动网络技术有限公司 基于声控的智能电子设备和声控方法
CN103543930A (zh) * 2012-07-13 2014-01-29 腾讯科技(深圳)有限公司 一种电子书操作控制方法及装置
CN104104899B (zh) * 2013-04-02 2018-09-21 华为技术有限公司 视频会议中信息传送的方法与装置
CN103258544B (zh) * 2013-04-15 2016-05-25 深圳市海云天科技股份有限公司 一种考试系统
CN103218122B (zh) * 2013-04-25 2016-08-31 上海华勤通讯技术有限公司 移动终端及其声控屏幕方法
CN105278817A (zh) * 2014-05-30 2016-01-27 金兆栋 一种语音、唇语控制装置及控制方法
CN104123939A (zh) * 2014-06-06 2014-10-29 国家电网公司 基于变电站巡检机器人的语音交互控制方法
CN106816046A (zh) * 2015-11-27 2017-06-09 施政 一种交互板型语言学习装置
CN107767713A (zh) * 2017-03-17 2018-03-06 青岛陶知电子科技有限公司 一种集成语音操作功能的智能教学系统
CN107731028A (zh) * 2017-11-15 2018-02-23 安徽声讯信息技术有限公司 一种智能语音电子白板
CN109963190A (zh) * 2017-12-22 2019-07-02 鸿富锦精密工业(武汉)有限公司 电子白板
CN108536421A (zh) * 2018-04-19 2018-09-14 合肥学院 一种基于绘画软件的语音控制自由绘画系统及其控制方法
CN110491189A (zh) * 2018-05-14 2019-11-22 朴蓍衍 电子学习装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1949756A (zh) * 2006-09-06 2007-04-18 华为技术有限公司 基于语音的人机通讯系统和方法
CN1959628A (zh) * 2005-10-31 2007-05-09 西门子(中国)有限公司 一种人机交互导航系统
CN201278099Y (zh) * 2008-10-24 2009-07-22 青岛海信电器股份有限公司 一种语音控制的电器设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080133743A1 (en) * 2006-11-30 2008-06-05 Canon Kabushiki Kaisha Electronic apparatus and information processing system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1959628A (zh) * 2005-10-31 2007-05-09 西门子(中国)有限公司 一种人机交互导航系统
CN1949756A (zh) * 2006-09-06 2007-04-18 华为技术有限公司 基于语音的人机通讯系统和方法
CN201278099Y (zh) * 2008-10-24 2009-07-22 青岛海信电器股份有限公司 一种语音控制的电器设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3214542A1 (en) * 2016-03-04 2017-09-06 Ricoh Company, Ltd. Voice control of interactive whiteboard appliances

Also Published As

Publication number Publication date
CN101893993A (zh) 2010-11-24

Similar Documents

Publication Publication Date Title
CN101893993B (zh) 电子白板系统及其语音处理方法
US10078376B2 (en) Multimodel text input by a keyboard/camera text input module replacing a conventional keyboard text input module on a mobile device
US20190025950A1 (en) User interface apparatus and method for user terminal
US9123341B2 (en) System and method for multi-modal input synchronization and disambiguation
CN104090652A (zh) 一种语音输入方法和装置
KR101545881B1 (ko) 휴대 단말기의 입력 처리 장치 및 방법
US20120050530A1 (en) Use camera to augment input for portable electronic device
TWI505155B (zh) 電容和電磁雙模觸摸屏的觸控方法及手持式電子設備
CN110457105B (zh) 界面操作方法、装置、设备及存储介质
KR20140114280A (ko) 입력 처리 방법 및 장치
CN107491286A (zh) 移动终端的语音输入方法、装置、移动终端及存储介质
CN110534109B (zh) 语音识别方法、装置、电子设备及存储介质
US11144175B2 (en) Rule based application execution using multi-modal inputs
EP3869301A1 (en) Information processing device, information processing method, and computer program
US11269430B2 (en) Stylus ink parameter setting
JP2001100878A (ja) マルチモーダル入出力装置
CN113641328A (zh) 基于语音识别的电脑控制方法、装置、设备及存储介质
CN116540972A (zh) 用于问答的方法、装置、设备和存储介质
CN115909505A (zh) 手语识别设备的控制方法、装置、存储介质及电子设备
CN108874797A (zh) 语音处理方法和装置
CN112578965A (zh) 处理方法、装置和电子设备
US20120278751A1 (en) Input method and input module thereof
US20230306965A1 (en) Speech Recognition Using Word or Phoneme Time Markers Based on User Input
CN116266404A (zh) 扫描笔的控制方法、装置和电子设备
CN116301414A (zh) 功能切换方法、装置、电子笔、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: HANGZHOU WANIN EDUCATIONAL MULTIMEDIA INC.

Free format text: FORMER NAME: HANGZHOU WANIN VISUAL TECHNOLOGIES CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: 1, No. 2, No. 8, No. 310018, Hangzhou economic and Technological Development Zone, Zhejiang

Patentee after: Hangzhou Wanin Education Multimedia Technology Co.,Ltd.

Address before: 1, No. 2, No. 8, No. 310018, Hangzhou economic and Technological Development Zone, Zhejiang

Patentee before: Hangzhou Huayin Video Signal Technology Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120523

Termination date: 20180715