CN110288988A - 目标数据筛选方法、装置及存储介质 - Google Patents
目标数据筛选方法、装置及存储介质 Download PDFInfo
- Publication number
- CN110288988A CN110288988A CN201910405714.3A CN201910405714A CN110288988A CN 110288988 A CN110288988 A CN 110288988A CN 201910405714 A CN201910405714 A CN 201910405714A CN 110288988 A CN110288988 A CN 110288988A
- Authority
- CN
- China
- Prior art keywords
- starting
- voice signal
- target data
- sample
- obtains
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 130
- 238000012216 screening Methods 0.000 title claims abstract description 112
- 238000003860 storage Methods 0.000 title claims abstract description 25
- 230000000977 initiatory effect Effects 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims description 22
- 238000009432 framing Methods 0.000 claims description 20
- 238000000605 extraction Methods 0.000 claims description 19
- 238000001514 detection method Methods 0.000 claims description 17
- 238000010276 construction Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000001755 vocal effect Effects 0.000 abstract description 2
- 239000000523 sample Substances 0.000 description 95
- 238000005070 sampling Methods 0.000 description 13
- 238000007781 pre-processing Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 238000005096 rolling process Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000004438 eyesight Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 235000015170 shellfish Nutrition 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及人工智能技术领域,本发明提供一种目标数据筛选方法、装置及计算机可读存储介质,其中的方法包括:通过语音输入装置获取启动语音信号;对启动语音信号进行预处理,获取预设启动信息;将预设启动信息输入预先构建的启动语音模型中,利用匹配算法将预设启动信息与启动语音模型进行匹配,获取用于筛选目标数据的开始命令;根据开始命令启动目标数据筛选过程;在通过语音输入装置获取到暂停语音信号时,根据暂停语音信号获取暂停命令;根据获取的暂停命令停止目标数据筛选过程,确定筛选得到的目标数据。本发明将语音识别技术与数据筛选结合,由控制者发出语音口令控制整个筛选过程,简化数据筛选的控制方法,整个筛选过程智能、便捷。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种目标数据筛选方法、装置及存储介质。
背景技术
数据筛选是指从大批量的数据中筛选出一小部分的所需数据,由于需要从庞大的数据中筛选出所需要数据,需要通过借助计算机或者数据存储和计算装置来完成,过程中一般需要由人工操作计算机来完成。例如,各种形式的抽奖活动、某种产品或者药品的样本检验、员工工作业绩抽查等都属于数据筛选。
对于抽奖活动来说,在企业年会、婚礼等大型活动现场,为了增加庆祝的气氛、调动活动现场的氛围都会举办一系列的抽奖活动,传统的抽奖方法是以号码的方式进行抽奖,先发放号码牌给参加抽奖的人员,再由抽奖者抽选出中奖号码,参加抽奖的人员以手中的中奖号码牌进行领奖,在抽奖的过程中,若参加抽奖的人员将中奖号码牌丢失,会导致出现无人领奖的尴尬情况,而且,有时在发放号码牌的时候,有可能会出现重复发给同一个人的情况,使一人手中持多张号码牌,增加其中奖概率,导致抽奖不公平的现象发生。
为了克服传统抽奖方法所存在的弊端,目前,还有一种通过电脑控制抽奖的方法,通过微信签到的方式,获取在场人员的头像,然后随机滚动头像照片来抽选中奖人员。但主要的控制方式是由抽奖领导喊话开始和停止,由一个工作人员在电脑上根据领导口令进行实际点击控制,操作过程中需要人工控制,在抽奖的过程中需要使工作人员对电脑的操作与领导发出的口令保持一致,需要有人协助才可完成,不够方便。
在对生产的产品和药品的样本检验时需要从一大批的产品或者药品中随机抽取少量样本作为检验的对象,在抽选样本时,需要借助计算设备来完成,在利用计算机抽选的过程中仍然需要由人工来操作,不够方便,占用人力。
在员工工作业绩抽查的过程中,也需要从大量的员工工作业绩中进行抽选,仍然需要借助计算机设备来完成,但是在操作过程中仍然需要人工手动操作计算机来完成。
发明内容
本发明提供一种目标数据筛选方法、装置及存储介质,其主要目的在于通过将语音识别技术与数据筛选相结合,由负责数据筛选的人员发出的语音口令控制整个数据筛选过程,不需要其他人员的协助,也不需要负责筛选工作的人员手动在计算机上操作,基于语音识别技术简化数据筛选的控制,使整个数据筛选过程更加智能、便捷。
为实现上述目的,本发明提供一种电子装置,该电子装置包括:存储器、处理器及语音输入装置,所述存储器中包括目标数据筛选程序,所述目标数据筛选程序被所述处理器执行时实现如下步骤:
通过语音输入装置获取启动语音信号;
对所述启动语音信号进行预处理,获取预设启动信息;
将所述预设启动信息输入预先构建的启动语音模型中,利用匹配算法将所述预设启动信息与所述启动语音模型进行匹配,获取用于筛选目标数据的开始命令;
根据所述开始命令启动目标数据筛选过程;
在通过语音输入装置获取到暂停语音信号时,根据所述暂停语音信号获取暂停命令;及
根据获取的暂停命令停止所述目标数据筛选过程,确定筛选得到的目标数据。
优选地,对启动语音信号进行预处理的方法包括:
对启动语音信号进行端点检测,获取有效启动语音信号;
对所述有效启动语音信号预加重处理,获取预加重后的有效启动语音信号;
对预加重后的有效启动语音信号进行分帧加窗处理,获取启动语音信号的短时语音帧;及
对所述启动语音信号的短时语音帧进行特征提取,获取预设启动信息。
优选地,所述启动语音模型的构建方法包括:
采集启动信号样本;
对所述启动信号样本进行样本处理,获取满足预设条件的启动信号样本;
对所述满足预设条件的启动信号样本进行特征提取,获取启动信号样本特征;及
将所述启动信号样本特征用于模型训练,得到训练好的启动语音模型。
此外,为实现上述目的,本发明还提供一种目标数据筛选方法,该方法包括:
通过语音输入装置获取启动语音信号;
对所述启动语音信号进行预处理,获取预设启动信息;
将所述预设启动信息输入预先构建的启动语音模型中,利用匹配算法将所述预设启动信息与所述启动语音模型进行匹配,获取用于筛选目标数据的开始命令;
根据所述开始命令启动目标数据筛选过程;
在通过语音输入装置获取到暂停语音信号时,根据所述暂停语音信号获取暂停命令;及
根据获取的暂停命令停止所述目标数据筛选过程,确定筛选得到的目标数据。
优选地,对启动语音信号进行预处理的方法包括:
对启动语音信号进行端点检测,获取有效启动语音信号;
对所述有效启动语音信号预加重处理,获取预加重后的有效启动语音信号;
对预加重后的有效启动语音信号进行分帧加窗处理,获取启动语音信号的短时语音帧;及
对所述启动语音信号的短时语音帧进行特征提取,获取预设启动信息。
优选地,所述启动语音模型的构建方法包括:
采集启动信号样本;
对所述启动信号样本进行样本处理,获取满足预设条件的启动信号样本;
对所述满足预设条件的启动信号样本进行特征提取,获取启动信号样本特征;及
将所述启动信号样本特征用于模型训练,得到训练好的启动语音模型。
优选地,对启动信号样本进行样本处理的方法包括:
对所述启动信号样本进行端点检测,获取有效启动信号样本;
对所述有效启动信号样本进行预加重处理,获取预加重后的有效启动信号样本;及
对所述预加重后的有效启动信号样本进行分帧加窗处理。
优选地,所述匹配算法为动态时间规整法。
优选地,所述目标数据筛选方法还包括:
在通过语音输入装置获取结束语音信号时,根据获取到的结束语音信号,对筛选得到的目标数据进行公布。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中包括目标数据筛选程序,所述目标数据筛选程序被处理器执行时,实现如上所述的目标数据筛选方法的步骤。
本发明提出的目标数据筛选方法、装置及存储介质,通过语音输入装置获取启动语音信号;将所述启动语音信号与构建的启动语音模型进行匹配,获取用于筛选目标数据的开始命令;根据开始命令,启动目标数据筛选过程;再通过语音输入装置获取暂停语音信号,根据获取到的暂停语音信号,停止目标数据筛选过程,确定筛选得到的目标数据。整个目标数据筛选过程由控制者发出的语音信号控制,不需要其他人员的协助,也不需筛选人员手动操作计算机,简化数据筛选的控制,使整个目标数据筛选过程更加智能、便捷。
附图说明
图1为本发明目标数据筛选方法较佳实施例的应用环境示意图;
图2为图1中目标数据筛选程序较佳实施例的模块示意图;
图3为本发明目标数据筛选方法较佳实施例的流程图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种目标数据筛选方法,应用于一种电子装置1。参照图1所示,为本发明目标数据筛选方法较佳实施例的应用环境示意图。
在本实施例中,电子装置1可以是服务器、智能手机、平板电脑、便携计算机、桌上型计算机等具有运算功能的终端设备。
该电子装置1包括:处理器12、存储器11、摄像装置13、网络接口14、通信总线15及语音输入装置16。
存储器11包括至少一种类型的可读存储介质。所述至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器11等的非易失性存储介质。在一些实施例中,所述可读存储介质可以是所述电子装置1的内部存储单元,例如该电子装置1的硬盘。在另一些实施例中,所述可读存储介质也可以是所述电子装置1的外部存储器11,例如所述电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
在本实施例中,所述存储器11的可读存储介质通常用于存储安装于所述电子装置1的目标数据筛选程序10、语音模型库等。所述存储器11还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行目标数据筛选程序10等。
摄像装置13既可以是所述电子装置1的一部分,也可以独立于电子装置1。在一些实施例中,所述电子装置1为智能手机、平板电脑、便携计算机等具有摄像头的终端设备,则所述摄像装置13即为所述电子装置1的摄像头。在其他实施例中,所述电子装置1可以为服务器,所述摄像装置13独立于该电子装置1、与该电子装置1通过网络连接,例如,该摄像装置13安装于特定场所,如办公场所、监控区域,对进入该特定场所的目标实时拍摄得到实时图像,通过网络将拍摄得到的实时图像传输至处理器12。
网络接口14可选地可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该电子装置1与其他电子设备之间建立通信连接。
通信总线15用于实现这些组件之间的连接通信。
语音输入装置16为:比如麦克风(microphone)等具有语音识别功能的设备。
图1仅示出了具有组件11-16的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,该电子装置1还可以包括用户接口,用户接口可以包括输入单元比如键盘(Keyboard)、语音输出装置比如音响、耳机等,可选地用户接口还可以包括标准的有线接口、无线接口。
可选地,该电子装置1还可以包括显示器,显示器也可以称为显示屏或显示单元。在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)触摸器等。显示器用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。
可选地,该电子装置1还包括触摸传感器。所述触摸传感器所提供的供用户进行触摸操作的区域称为触控区域。此外,这里所述的触摸传感器可以为电阻式触摸传感器、电容式触摸传感器等。而且,所述触摸传感器不仅包括接触式的触摸传感器,也可包括接近式的触摸传感器等。此外,所述触摸传感器可以为单个传感器,也可以为例如阵列布置的多个传感器。
此外,该电子装置1的显示器的面积可以与所述触摸传感器的面积相同,也可以不同。可选地,将显示器与所述触摸传感器层叠设置,以形成触摸显示屏。该装置基于触摸显示屏侦测用户触发的触控操作。
可选地,该电子装置1还可以包括射频(Radio Frequency,RF)电路,传感器、音频电路等等,在此不再赘述。
在图1所示的装置实施例中,作为一种计算机存储介质的存储器11中可以包括操作系统、以及目标数据筛选程序10;处理器12执行存储器11中存储的目标数据筛选程序10时实现如下步骤:
通过语音输入装置获取启动语音信号;
对启动语音信号进行预处理,获取预设启动信息;
将预设启动信息输入预先构建的启动语音模型中,利用匹配算法将预设启动信息与启动语音模型进行匹配,获取用于筛选目标数据的开始命令;
根据开始命令启动目标数据筛选过程;
在通过语音输入装置获取到暂停语音信号时,根据暂停语音信号获取暂停命令;及
根据获取的暂停命令停止目标数据筛选过程,确定筛选得到的目标数据。
为了得到更加清晰有效的启动语音信号,对启动语音信号进行预处理的方法包括:
对启动语音信号进行端点检测,获取有效启动语音信号;
对有效启动语音信号预加重处理,获取预加重后的有效启动语音信号;
对预加重后的有效启动语音信号进行分帧加窗处理,获取启动语音信号的短时语音帧;及
对启动语音信号的短时语音帧进行特征提取,获取预设启动信息。
为了更好地构建启动语音模型,启动语音模型的构建方法包括:
采集启动信号样本;
对启动信号样本进行样本处理,获取满足预设条件的启动信号样本;
对满足预设条件的启动信号样本进行特征提取,获取启动信号样本特征;
将启动信号样本特征用于模型训练,得到训练好的启动语音模型。
为了得到的样本清晰度更高,节约样本空间,对启动信号样本进行样本处理的方法包括:
对启动信号样本进行端点检测,获取有效启动信号样本;
对有效启动信号样本进行预加重处理,获取预加重后的有效启动信号样本;
对预加重后的有效启动信号样本进行分帧加窗处理。
为了使预设启动信息与启动语音模型能够更好的进行匹配,匹配算法为动态时间规整法。
为了可进行多轮数据的筛选以及将筛选的结果进行展示,处理器12执行存储器11中存储的目标数据筛选程序10时还实现如下步骤:
在通过语音输入装置获取结束语音信号时,根据获取到的结束语音信号,对筛选得到的目标数据进行公布。
在其他实施例中,目标数据筛选程序10还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由处理器12执行,以完成本发明。
本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。参照图2所示,为图1中目标数据筛选程序10较佳实施例的程序模块图。所述目标数据筛选程序10可以被分割为:获取模块110、预处理模块120、匹配模块130、执行模块140。
所述模块110-140所实现的功能或操作步骤均与上文类似,此处不再详述,示例性地,例如其中:
获取模块110用于获取启动语音信号、暂停语音信号及结束语音信号。
预处理模块120用于对获取模块110获取的启动语音信号、暂停语音信号及结束语音信号进行端点检测、预加重、分帧加窗及特征提取处理,获取预设启动信息、暂停语音信息及结束语音信息。
匹配模块130用于将预处理模块120获取的预设启动信息、暂停语音信息及结束语音信息分别与启动语音模型、暂停语音模型和结束语音模型进行匹配。
执行模块140用于根据匹配模块130对预设启动信息、暂停语音信息和结束语音信息分别与启动语音模型、暂停语音模型和结束语音模型进行匹配的结果对目标数据筛选过程进行控制。
此外,本发明还提供一种目标数据筛选方法。参照图3所示,为本发明目标数据筛选方法较佳实施例的流程图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,目标数据筛选方法包括:步骤S10-步骤S60。
步骤S10,通过语音输入装置获取启动语音信号。
启动语音信号由目标数据筛选的控制者发出,启动语音信号根据目标数据筛选具体应用的场景进行确定,本发明中的目标数据筛选过程可为各类型的类似抽奖等活动、产品或者药品样本抽检或者大型企业员工业绩抽查等需要从大批量的数据中筛选出一定数量的数据筛选的过程。
下面以上述所列举的抽奖活动、样本抽检以及员工业绩抽查等过程为例,进一步对启动语音信号进行解释说明。
在抽奖活动的过程中,启动语音信号可以是由负责抽奖者发出的控制抽奖启动的语音命令,例如:“开始抽奖”、“抽奖开始”、“启动抽奖”、“抽奖启动”、“开启抽奖”、“抽奖开启”等语音命令”;同理,在下面内容中出现的暂停语音信息可以是由负责抽奖者发出的暂停抽奖语音命令;结束语音信号可以是由负责抽奖者发出的结束抽奖语音命令。
在样本抽检的过程中,启动语音信号可以是由负责样本抽取的人员发出的控制样本抽取的语音命令,例如:“开始抽取样本”、“抽取样本开始”、“开启样本抽取”、“样本抽取开启”“启动样本抽取”、“样本抽取开启”等类似的控制样本抽取的语音命令;同理,在下面内容中出现的暂停语音信息可以是由负责样本抽取者发出的暂停样本抽取语音命令;结束语音信号可以是由负责样本抽取者发出的结束样本抽取的语音命令。
在员工业绩抽查的过程中,启动语音信号可以是由负责业绩抽选的人员发出的控制业绩抽选的语音命令,例如:“开始抽选业绩”、“抽选业绩开始”、“开启业绩抽选”、“业绩抽选开启”“启动业绩抽选”、“业绩抽选开启”等类似的控制业绩抽选的语音命令;同理,在下面内容中出现的暂停语音信息可以是由负责业绩抽选者发出的暂停业绩抽选语音命令;结束语音信号可以是由负责业绩抽选者发出的结束业绩抽选的语音命令。
步骤20,对启动语音信号进行预处理,获取预设启动信息。具体地,对启动语音信号进行预处理的方法包括:
对启动语音信号进行端点检测,获取有效启动语音信号;
对有效启动语音信号预加重处理,获取预加重后的有效启动语音信号;
对预加重后的有效启动语音信号进行分帧加窗处理,获取启动语音信号的短时语音帧;及
对启动语音信号的短时语音帧进行特征提取,获取预设启动信息。
其中,端点检测就是从连续的语音流中检测出有效的语音段。它包括两个方面,检测出有效语音的起始点即前端点,检测出有效语音的结束点即后端点,可以降低存储或传输的数据量。
有效语音信号进行预加重处理的目的是为了对语音的高频部分进行加重,去除口唇辐射的影响,增加语音的高频分辨率。
分帧加窗处理使预加重后的语音信号更加平稳,将预加重后的语音信号切成多段,每一段为一帧,每一帧的长度为20-30ms,每一帧的起始段和末尾端会出现不连续的地方,所以分帧越多与原始信号的误差也就越大,为此再对分帧后的语音信号进行加窗处理。
对启动语音信号的短时语音帧进行特征提取是为了得到启动语音信号的关键字词,便于处理器对预设启动信息的识别。
步骤30,将预设启动信息输入预先构建的启动语音模型中,利用匹配算法将预设启动信息与启动语音模型进行匹配,获取用于筛选目标数据的开始命令。
处理器在存储器中预先创建语音模型库,语音模型库内储存启动语音模型、暂停语音模型和结束语音模型。每一中语音模型均关联一个对目标数据筛选的控制命令,其中,启动语音模型关联一个用于控制目标数据筛选的开始命令;暂停语音模型关联一个用于控制目标数据筛选过程暂停的暂停命令;结束语音模型关联一个用于控制将筛选出的目标数据进行公布的结束命令。
下面以启动语音模型的构建方法为例进行说明,启动语音模型的构建方法包括:
采集启动信号样本;
对启动信号样本进行样本处理,获取满足预设条件的启动信号样本;
对满足预设条件的启动信号样本进行特征提取,获取启动信号样本特征;
将启动信号样本特征用于模型训练,得到训练好的启动语音模型。
具体地,对启动信号样本进行样本处理的方法包括:
对启动信号样本进行端点检测,获取有效启动信号样本;
对有效启动信号样本进行预加重处理,获取预加重后的有效启动信号样本;
对预加重后的有效启动信号样本进行分帧加窗处理。
获取满足预设条件的启动信号样本,其中,预设条件可为预处理后的启动信号样本要满足预设的分贝值以及预设清楚度指数等条件。其中,预设的分贝值以及预设清楚度指数可根据实际需要来确定。
下面以抽奖活动为例,对启动语音模型的构建方法进一步详细解释。
采集“开始抽奖”、“抽奖开始”、“启动抽奖”、“抽奖启动”、“开启抽奖”、“抽奖开启”等语信息作为基础启动信号样本。
将采集到的用于启动抽奖的基础启动信号样本进行样本处理,获取满足预设的分贝值以及预设清楚度指数等条件的启动抽奖信号样本,对满足预设条件的启动抽奖信号样本进行特征提取,提取出启动抽奖信号样本的关键字词,作为启动抽奖信号样本特征,将启动抽奖信号样本特征用于模型训练,得到训练好的启动抽奖语音模型。
对启动抽奖信号样本进行样本处理的方法包括:
对启动抽奖信号样本进行端点检测,获取有效启动抽奖信号样本;例如,在基础抽奖信号样本中,包括“可以开始抽奖了”那么,可通过端点检测将开头的“可以”以及结尾的“了”忽略掉,只保留“开始抽奖”作为有效的语音段。
对有效启动抽奖信号样本进行预加重处理,获取预加重后的有效启抽奖动信号样本;例如,将“开始抽奖”的语音的高频部分进行加重,去除口唇辐射的影响,增加语音的高频分辨率。
对预加重后的有效启动抽奖信号样本进行分帧加窗处理。将预加重后的抽奖语音信号切成多段,每一段为一帧,每一帧的长度为20-30ms,每一帧的起始段和末尾端会出现不连续的地方,所以分帧越多与原始信号的误差也就越大,为此再对分帧后的语音信号进行加窗处理。
暂停语音模型和结束语音模型与启动语音模型的构建方法大体相同,不同之处在于,采集的信号样本不同。暂停语音模型采集“暂停抽奖”、“抽奖暂停”、“暂缓抽奖”及“抽奖暂缓”等语音信息作为基础暂停信号样本;结束语音模型采集“停止抽奖”、“抽奖停止”、“结束抽奖”及“抽奖结束”等语音信息作为基础结束信号样本。
处理器将获取的预设启动信息输入到启动语音模型中,利用匹配算法将预设启动信息与启动语音模型进行匹配。
具体地,匹配算法为动态时间规整法,动态时间规整法是一种衡量两个时间序列之间的相似度的方法,在时间序列中,需要比较相似性的两段时间序列的长度可能并不相等,在语音识别领域表现为不同人的语速不同。而且同一个单词内的不同音素的发音速度也不同,另外,不同时间序列可能仅仅存在时间轴上的位移,亦即在还原位移的情况下,两个时间序列是一致的。动态时间规整法(DTW)通过把时间序列进行延伸和缩短,来计算两个时间序列性之间的相似性。
利用动态时间规整法来判断处理器获取的控制者发出的启动信号是否与预先构建的启动语音模型表示同一个单词,如果表示相同,则预设启动信号与启动语音模型相匹配,处理器获取与启动语音模型关联的对目标数据筛选的控制命令;如果表示不同,则预设启动信号与启动语音模型不匹配,处理器将获取的控制者发出的启动语音信号作废。
步骤40,根据开始命令启动目标数据筛选过程。
具体地,处理器获取与启动语音模型关联的开始命令,开始命令用于控制目标数据筛选过程的开启。
上述举例的语音抽奖,具体的筛选中奖者的方法可以有多种方式,如:将微信头像作为目标数据的基于语音识别的微信头像滚动抽奖方法、将电话号码作为目标数据的基于语音识别的电话号码滚动抽奖方法、将抽奖者的脸部照片作为目标数据的照片滚动抽奖方法等。
以上述的基于语音识别的微信头像滚动抽奖方法为例。
具体地,启动抽奖语音模型关联控制抽奖启动的开始命令,处理器利用匹配算法将获取的有用的启动抽奖信息与启动抽奖语音模型进行匹配,获取到与启动抽奖语音模型关联的开始命令。
其中,启动抽奖语音模型关联的控制抽奖启动的开始命令为对微信头像的滚动命令,当处理器对启动抽奖语音信号预处理后,获取预设启动抽奖信息,处理器利用匹配算法将预设启动抽奖信息与启动抽奖语音模型进行匹配,获取与启动抽奖语音模型关联的对微信头像的滚动命令。
其中,微信头像可来源于签到人员通过微信扫码的方式签到时,签到系统获取的该签到人员的微信头像,签到系统获取签到人员的微信头像后,将该微信头像照片发送给处理器。为了避免两个甚至多个签到人员使用相同的微信头像,以至于导致抽取后难以进行区分,签到系统同时还获取相应的微信昵称,签到系统将微信头像照片发送给处理器时一同将该签到人员的微信昵称发送给处理器。
步骤50,在通过语音输入装置获取到暂停语音信号时,根据暂停语音信号获取暂停命令。
当目标数据筛选进行一段时间后,处理器获取由控制发出的暂停语音信号,处理器对暂停语音信号进行预处理。
具体地,对暂停语音信号进行预处理的方法包括:
对暂停语音信号进行端点检测,获取有效暂停语音信号;
对有效暂停语音信号预加重处理,获取预加重后的有效暂停语音信号;
对预加重后的有效暂停语音信号进行分帧加窗处理,获取暂停语音信号的短时语音帧;及
对暂停语音信号的短时语音帧进行特征提取,获取预设暂停信息。
将预设暂停信息输入预先构建的暂停语音模型中,利用匹配算法将预设暂停信息与暂停语音模型进行匹配,获取与暂停语音模型关联的暂停命令,赞停命令用于筛选目标数据。
步骤60,根据获取的暂停命令停止目标数据筛选过程,确定筛选得到的目标数据。
处理器根据获取的暂停命令停止对目标数据筛选的过程,确定筛选得到的目标数据。
以上述基于语音识别的微信头像滚动的抽奖方法为例,当抽奖开始一段时间后,抽奖者发出暂停抽奖语音信号,例如,“暂停抽奖”、“抽奖暂停”、“暂缓抽奖”及“抽奖暂缓”等语音信号,语音输入装置获取由抽奖者发出的暂停抽奖语音信号,语音输入装置将获取的暂停抽奖语音信号发送给处理器,处理器对暂停抽奖语音信号预处理,获取有用的暂停抽奖语音信息。
暂停抽奖语音模型关联控制抽奖暂停的暂停命令,处理器利用匹配算法将有用的暂停抽奖语音信息与暂停抽奖语音模型进行匹配,获取到与暂停抽奖语音模型关联的暂停命令。
处理器获取与暂停抽奖语音模型关联的控制微信头像暂停滚动的暂停命令,根据暂停命令,暂停对滚动的微信头像的滚动控制,确定出中奖的微信头像。
根据现场需要抽奖的轮数,抽奖者可以重复发出启动抽奖语音信号和暂停抽奖语音信号,直到抽出所有的中奖者。
在本发明的一个优选实施例中,在通过语音输入装置获取结束语音信号时,根据获取到的结束语音信号,对筛选得到的目标数据进行公布。
以上述基于语音识别的微信头像滚动的抽奖方法为例,抽奖者抽出所有中奖头像后,发出结束抽奖语音信号,例如:“停止抽奖”、“抽奖停止”、“结束抽奖”及“抽奖结束”等语音命令,语音输入装置获取由抽奖者发出的结束抽奖语音信号,语音输入装置将获取的结束抽奖语音信号发送给处理器,处理器对结束抽奖语音信号预处理,获取预设结束抽奖信息。
结束抽奖语音模型关联对中奖头像进行公布的结束命令,处理器利用匹配算法将有用的结束抽奖语音信息与结束抽奖语音模型进行匹配,获取到与结束抽奖语音模型关联的对中奖微信头像进行公布的结束命令。根据该对中奖照片进行公布的结束命令,将所有中奖照片在显示屏幕上进行公布。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质中包括目标数据筛选程序,所述目标数据筛选程序被处理器执行时实现如下操作:
通过语音输入装置获取启动语音信号;
对所述启动语音信号进行预处理,获取预设启动信息;
将所述预设启动信息输入预先构建的启动语音模型中,利用匹配算法将所述预设启动信息与所述启动语音模型进行匹配,获取用于筛选目标数据的开始命令;
根据所述开始命令启动目标数据筛选过程;
在通过语音输入装置获取到暂停语音信号时,根据所述暂停语音信号获取暂停命令;及
根据获取的暂停命令停止所述目标数据筛选过程,确定筛选得到的目标数据。
优选地,对启动语音信号进行预处理的方法包括:
对启动语音信号进行端点检测,获取有效启动语音信号;
对所述有效启动语音信号预加重处理,获取预加重后的有效启动语音信号;
对预加重后的有效启动语音信号进行分帧加窗处理,获取启动语音信号的短时语音帧;及
对所述启动语音信号的短时语音帧进行特征提取,获取预设启动信息。
优选地,启动语音模型的构建方法包括:
采集启动信号样本;
对所述启动信号样本进行样本处理,获取满足预设条件的启动信号样本;
对所述满足预设条件的启动信号样本进行特征提取,获取启动信号样本特征;及
将所述启动信号样本特征用于模型训练,得到训练好的启动语音模型。
优选地,对启动信号样本进行样本处理的方法包括:
对所述启动信号样本进行端点检测,获取有效启动信号样本;
对所述有效启动信号样本进行预加重处理,获取预加重后的有效启动信号样本;及
对所述预加重后的有效启动信号样本进行分帧加窗处理。
优选地,匹配算法为动态时间规整法。
优选地,目标数据筛选程序被处理器执行时还实现如下操作:
在通过语音输入装置获取结束语音信号时,根据获取到的结束语音信号,对筛选得到的目标数据进行公布。
本发明之计算机可读存储介质的具体实施方式与上述目标数据筛选方法、电子装置的具体实施方式大致相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种目标数据筛选方法,应用于电子装置,其特征在于,所述方法包括:
通过语音输入装置获取启动语音信号;
对所述启动语音信号进行预处理,获取预设启动信息;
将所述预设启动信息输入预先构建的启动语音模型中,利用匹配算法将所述预设启动信息与所述启动语音模型进行匹配,获取用于筛选目标数据的开始命令;
根据所述开始命令启动目标数据筛选过程;
在通过语音输入装置获取到暂停语音信号时,根据所述暂停语音信号获取暂停命令;及
根据获取的暂停命令停止所述目标数据筛选过程,确定筛选得到的目标数据。
2.根据权利要求1所述的目标数据筛选方法,其特征在于,对启动语音信号进行预处理的方法包括:
对启动语音信号进行端点检测,获取有效启动语音信号;
对所述有效启动语音信号预加重处理,获取预加重后的有效启动语音信号;
对预加重后的有效启动语音信号进行分帧加窗处理,获取启动语音信号的短时语音帧;及
对所述启动语音信号的短时语音帧进行特征提取,获取预设启动信息。
3.根据权利要求1所述的目标数据筛选方法,其特征在于,所述启动语音模型的构建方法包括:
采集启动信号样本;
对所述启动信号样本进行样本处理,获取满足预设条件的启动信号样本;
对所述满足预设条件的启动信号样本进行特征提取,获取启动信号样本特征;及
将所述启动信号样本特征用于模型训练,得到训练好的启动语音模型。
4.根据权利要求3所述的目标数据筛选方法,其特征在于,对启动信号样本进行样本处理的方法包括:
对所述启动信号样本进行端点检测,获取有效启动信号样本;
对所述有效启动信号样本进行预加重处理,获取预加重后的有效启动信号样本;及
对所述预加重后的有效启动信号样本进行分帧加窗处理。
5.根据权利要求1所述的目标数据筛选方法,其特征在于,
所述匹配算法为动态时间规整法。
6.根据权利要求1所述的目标数据筛选方法,其特征在于,所述方法还包括:
在通过语音输入装置获取结束语音信号时,根据获取到的结束语音信号,对筛选得到的目标数据进行公布。
7.一种电子装置,其特征在于,该电子装置包括:存储器、处理器及语音输入装置,所述存储器中包括目标数据筛选程序,所述目标数据筛选程序被所述处理器执行时实现如下步骤:
通过语音输入装置获取启动语音信号;
对所述启动语音信号进行预处理,获取预设启动信息;
将所述预设启动信息输入预先构建的启动语音模型中,利用匹配算法将所述预设启动信息与所述启动语音模型进行匹配,获取用于筛选目标数据的开始命令;
根据所述开始命令启动目标数据筛选过程;
在通过语音输入装置获取到暂停语音信号时,根据所述暂停语音信号获取暂停命令;及
根据获取的暂停命令停止所述目标数据筛选过程,确定筛选得到的目标数据。
8.根据权利要求7所述的电子装置,其特征在于,对启动语音信号进行预处理的方法包括:
对启动语音信号进行端点检测,获取有效启动语音信号;
对所述有效启动语音信号预加重处理,获取预加重后的有效启动语音信号;
对预加重后的有效启动语音信号进行分帧加窗处理,获取启动语音信号的短时语音帧;及
对所述启动语音信号的短时语音帧进行特征提取,获取预设启动信息。
9.根据权利要求7所述的电子装置,其特征在于,所述启动语音模型的构建方法包括:
采集启动信号样本;
对所述启动信号样本进行样本处理,获取满足预设条件的启动信号样本;
对所述满足预设条件的启动信号样本进行特征提取,获取启动信号样本特征;及
将所述启动信号样本特征用于模型训练,得到训练好的启动语音模型。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括目标数据筛选程序,所述目标数据筛选程序被处理器执行时,实现如权利要求1至6中任一项所述的目标数据筛选方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910405714.3A CN110288988A (zh) | 2019-05-16 | 2019-05-16 | 目标数据筛选方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910405714.3A CN110288988A (zh) | 2019-05-16 | 2019-05-16 | 目标数据筛选方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110288988A true CN110288988A (zh) | 2019-09-27 |
Family
ID=68002129
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910405714.3A Pending CN110288988A (zh) | 2019-05-16 | 2019-05-16 | 目标数据筛选方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110288988A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112242138A (zh) * | 2020-11-26 | 2021-01-19 | 中国人民解放军陆军工程大学 | 一种无人平台语音控制方法 |
CN112312150A (zh) * | 2020-10-21 | 2021-02-02 | 深圳市声扬科技有限公司 | 直播信息处理方法、直播信息处理装置及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6839670B1 (en) * | 1995-09-11 | 2005-01-04 | Harman Becker Automotive Systems Gmbh | Process for automatic control of one or more devices by voice commands or by real-time voice dialog and apparatus for carrying out this process |
CN103634318A (zh) * | 2013-12-02 | 2014-03-12 | 天脉聚源(北京)传媒科技有限公司 | 一种抽奖的方法及系统 |
US20160271490A1 (en) * | 2013-11-08 | 2016-09-22 | Sony Interactive Entertainment Inc. | Entertainment device, display control method, program, and information storage medium |
CN106482285A (zh) * | 2015-08-28 | 2017-03-08 | 青岛海尔空调电子有限公司 | 一种空调控制方法及其空调控制器 |
CN107481718A (zh) * | 2017-09-20 | 2017-12-15 | 广东欧珀移动通信有限公司 | 语音识别方法、装置、存储介质及电子设备 |
CN107680589A (zh) * | 2017-09-05 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 语音信息交互方法、装置及其设备 |
-
2019
- 2019-05-16 CN CN201910405714.3A patent/CN110288988A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6839670B1 (en) * | 1995-09-11 | 2005-01-04 | Harman Becker Automotive Systems Gmbh | Process for automatic control of one or more devices by voice commands or by real-time voice dialog and apparatus for carrying out this process |
US20160271490A1 (en) * | 2013-11-08 | 2016-09-22 | Sony Interactive Entertainment Inc. | Entertainment device, display control method, program, and information storage medium |
CN103634318A (zh) * | 2013-12-02 | 2014-03-12 | 天脉聚源(北京)传媒科技有限公司 | 一种抽奖的方法及系统 |
CN106482285A (zh) * | 2015-08-28 | 2017-03-08 | 青岛海尔空调电子有限公司 | 一种空调控制方法及其空调控制器 |
CN107680589A (zh) * | 2017-09-05 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 语音信息交互方法、装置及其设备 |
CN107481718A (zh) * | 2017-09-20 | 2017-12-15 | 广东欧珀移动通信有限公司 | 语音识别方法、装置、存储介质及电子设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112312150A (zh) * | 2020-10-21 | 2021-02-02 | 深圳市声扬科技有限公司 | 直播信息处理方法、直播信息处理装置及电子设备 |
CN112242138A (zh) * | 2020-11-26 | 2021-01-19 | 中国人民解放军陆军工程大学 | 一种无人平台语音控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210286589A1 (en) | Electronic device for processing multi-modal input, method for processing multi-modal input and server for processing multi-modal input | |
CN108665890B (zh) | 操作语音识别服务的方法、电子设备和支持该设备的系统 | |
CN106297777B (zh) | 一种唤醒语音服务的方法和装置 | |
CN111341326B (zh) | 语音处理方法及相关产品 | |
CN108564955B (zh) | 电子装置、身份验证方法和计算机可读存储介质 | |
KR102495517B1 (ko) | 전자 장치, 전자 장치의 음성 인식 방법 | |
EP2990930A1 (en) | Scrapped information providing method and apparatus | |
EP3709294A1 (en) | Electronic device for providing speech recognition service and method thereof | |
KR102348758B1 (ko) | 음성 인식 서비스 운용 방법 및 이를 지원하는 전자 장치 | |
CN108897732B (zh) | 语句类型识别方法和装置、存储介质及电子装置 | |
CN108632653B (zh) | 语音管控方法、智能电视及计算机可读存储介质 | |
KR102653450B1 (ko) | 전자 장치의 입력 음성에 대한 응답 방법 및 그 전자 장치 | |
CN109086276B (zh) | 数据翻译方法、装置、终端及存储介质 | |
CN110060693A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN112735417B (zh) | 语音翻译方法、电子设备、计算机可读存储介质 | |
WO2020238046A1 (zh) | 人声智能检测方法、装置及计算机可读存储介质 | |
US10987570B2 (en) | Device to provide network access to entertainment machine | |
CN112749685B (zh) | 视频分类方法、设备和介质 | |
CN110288988A (zh) | 目标数据筛选方法、装置及存储介质 | |
CN109040444B (zh) | 一种通话录音方法、终端及计算机可读存储介质 | |
WO2021169365A1 (zh) | 声纹识别的方法和装置 | |
CN105913842A (zh) | 一种语音自定义唤醒手机的方法 | |
CN113190646A (zh) | 一种用户名样本的标注方法、装置、电子设备及存储介质 | |
CN109602421A (zh) | 健康监测方法、装置及计算机可读存储介质 | |
CN112084478A (zh) | 多用户账户的切换方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190927 |
|
RJ01 | Rejection of invention patent application after publication |