CN110580902A - 一种可快速识别的语音交互系统 - Google Patents

一种可快速识别的语音交互系统 Download PDF

Info

Publication number
CN110580902A
CN110580902A CN201910743317.7A CN201910743317A CN110580902A CN 110580902 A CN110580902 A CN 110580902A CN 201910743317 A CN201910743317 A CN 201910743317A CN 110580902 A CN110580902 A CN 110580902A
Authority
CN
China
Prior art keywords
module
voice
recognition
recognition unit
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910743317.7A
Other languages
English (en)
Inventor
陈琳
曹真龙
魏云燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Li Da Gao (shanghai) Intelligent Technology Co Ltd
Original Assignee
Li Da Gao (shanghai) Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Li Da Gao (shanghai) Intelligent Technology Co Ltd filed Critical Li Da Gao (shanghai) Intelligent Technology Co Ltd
Priority to CN201910743317.7A priority Critical patent/CN110580902A/zh
Publication of CN110580902A publication Critical patent/CN110580902A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72409User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories
    • H04M1/72412User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories using two-way short-range wireless interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种可快速识别的语音交互系统,具体涉及语音交互领域,包括语音采集模块,所述语音采集模块输出端设有语音识别模块一,所述语音识别模块一输出端设有任务分配模块,所述任务分配模块输出端设有语音识别模块二,所述语音识别模块二输出端设有中央处理器,所述中央处理器输出端设有执行元件。本发明通过语音识别的关键词拆分识别以及有效关键词的汇总方法,不仅能够实现快速语音识别,而且不会发生执行元件控制混乱的情况,并且通过手机终端定制各执行元件缩写指令的方法,不仅节省用户的控制时间,以及语音识别的速度,而且能够避免他人随意语音控制各执行元件,避免造成用户麻烦。

Description

一种可快速识别的语音交互系统
技术领域
本发明涉及语音交互技术领域,更具体地说,本发明涉及一种可快速识别的语音交互系统。
背景技术
智能语音交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。典型的应用场景—语音助手。自从iPhone 4S推出SIRI后,智能语音交互应用得到飞速发展。中文典型的智能语音交互应用如:虫洞语音助手、讯飞语点已得到越来越多的用户认可。
但是现有技术中智能语音交互在具体应用时,语音识别速度不快,导致用户在语音控制一些智能设备时,调控反应慢,影响使用感受,语音识别速度还有待提高。
发明内容
为了克服现有技术的上述缺陷,本发明的实施例提供一种可快速识别的语音交互系统,通过语音识别的关键词拆分识别以及有效关键词的汇总方法,不仅能够实现快速语音识别,而且不会发生执行元件控制混乱的情况,并且通过手机终端定制各执行元件缩写指令的方法,不仅节省用户的控制时间,以及语音识别的速度,而且能够避免他人随意语音控制各执行元件,避免造成用户麻烦。
为实现上述目的,本发明提供如下技术方案:一种可快速识别的语音交互系统,包括语音采集模块,所述语音采集模块输出端设有语音识别模块一,所述语音识别模块一输出端设有任务分配模块,所述任务分配模块输出端设有语音识别模块二,所述语音识别模块二输出端设有中央处理器,所述中央处理器输出端设有执行元件;
所述语音识别模块二包括名词识别单元、动词识别单元、数量词识别单元和形容词识别单元,所述名词识别单元、动词识别单元、数量词识别单元和形容词识别单元均连接有数据库二,且输出端连接有效信息汇总处理模块;
所述中央处理器输入端连接有手机终端以及连接端连接有指令定制模块,所述指令定制模块输出端设有数据库一,所述数据库一与语音识别模块一连接,所述语音识别模块一输出端设有指令转换模块,所述指令转换模块输出端与中央处理器输入端连接;
所述手机终端用于通过中央处理器访问指令定制模块,用户可以根据需要,定制生成各种执行元件的缩写控制指令,生成的缩写控制指令通过指令定制模块发送给数据库一存储;
所述语音采集模块用于采集语音信息并发送给语音识别模块一,经语音识别模块一进行语音初步识别,判断语音信息是否为指令信息,若是,则将信息发送给指令转换模块,若不是,则将信息发送给任务分配模块;
所述任务分配模块用于将语音识别模块一发送的语音信息分别发送至语音识别模块二中的每个识别单元,四个识别单元根据数据库二对于语音信息内容进行多种关键词的单独识别,然后经有效信息汇总处理模块将有效的关键词提取并生成相应的控制信号,发送给中央处理器进行智能控制执行元件;
所述指令转换模块用于将语音识别模块一发送的指令信息转换为相应的控制信号,发送给中央处理器进行智能控制执行元件。
在一个优选地实施方式中,所述手机终端通过蓝牙模块与中央处理器连接。
在一个优选地实施方式中,所述名词识别单元、动词识别单元、数量词识别单元和形容词识别单元分别用于识别语音信息中的名词、动词、数量词和形容词。
在一个优选地实施方式中,所述名词识别单元、动词识别单元、数量词识别单元和形容词识别单元连接的数据库二内分别存储有与执行元件相关的所有关键词,关键词具体为名词、动词、数量词和形容词。
本发明的技术效果和优点:
1、本发明通过任务分配模块将语音信息分别发送给名词识别单元、动词识别单元、数量词识别单元和形容词识别单元共四个关键词识别的单元,将语句中的关键词拆分快速识别,然后经有效信息汇总处理模块将有效的关键词提取并生成相应的控制信号,发送给中央处理器进行智能控制执行元件,整个交互系统中这种语音识别的关键词拆分识别以及有效关键词的汇总方法,不仅能够实现快速语音识别,而且不会发生执行元件控制混乱的情况,整个语音交互系统识别语音快速,使用稳定,解决了现有技术中语音统一识别造成的识别速度慢,语句判断时间长等造成的语音识别效率慢,执行元件控制反应慢的问题;
2、通过手机终端经蓝牙模块连接中央处理器,并访问指令定制模块,用户可以根据需要,定制生成各种执行元件的缩写控制指令,用户使用时直接说出指令即可快速控制相应的执行元件,这种定制各执行元件缩写指令的方法,不仅节省用户的控制时间,以及语音识别的速度,而且能够避免他人随意语音控制各执行元件,避免造成用户麻烦。
附图说明
图1为本发明的整体系统结构框图。
图2为本发明的语音识别模块二结构框图。
图3为本发明的语音识别模块二局部结构框图。
图4为本发明的整体流程图。
附图标记为:1语音采集模块、2语音识别模块一、3任务分配模块、4语音识别模块二、41名词识别单元、42动词识别单元、43数量词识别单元、44形容词识别单元、45数据库二、46有效信息汇总处理模块、5中央处理器、6执行元件、7手机终端、8指令定制模块、9数据库一、10指令转换模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据图1-3所示的一种可快速识别的语音交互系统,包括语音采集模块1,所述语音采集模块1输出端设有语音识别模块一2,所述语音识别模块一2输出端设有任务分配模块3,所述任务分配模块3输出端设有语音识别模块二4,所述语音识别模块二4输出端设有中央处理器5,所述中央处理器5输出端设有执行元件6;
所述语音识别模块二4包括名词识别单元41、动词识别单元42、数量词识别单元43和形容词识别单元44,所述名词识别单元41、动词识别单元42、数量词识别单元43和形容词识别单元44均连接有数据库二45,且输出端连接有效信息汇总处理模块46;
所述名词识别单元41、动词识别单元42、数量词识别单元43和形容词识别单元44分别用于识别语音信息中的名词、动词、数量词和形容词;
所述名词识别单元41、动词识别单元42、数量词识别单元43和形容词识别单元44连接的数据库二45内分别存储有与执行元件6相关的所有关键词,关键词具体为名词、动词、数量词和形容词;
所述任务分配模块3用于将语音识别模块一2发送的语音信息分别发送至语音识别模块二4中的每个识别单元,四个识别单元根据数据库二45对于语音信息内容进行多种关键词的单独识别,然后经有效信息汇总处理模块46将有效的关键词提取并生成相应的控制信号,发送给中央处理器5进行智能控制执行元件6;
实施方式具体为:通过语音采集模块1采集语音信息,并发送给语音识别模块一2,经语音识别模块一2发送给任务分配模块3,此时任务分配模块3将语音识别模块一2发送的语音信息分别发送至语音识别模块二4中的每个识别单元,四个识别单元根据相对应的数据库二45内部存储的关键词信息,对于语音信息内容进行多种关键词的单独识别,例如语音内容为:“声音调大一点”,此时此段语音分别发送给四个识别单元,经四个识别单元分别快速提取出:“声音、调、大、一点”共四个关键词,从而再将此四个关键词发送给有效信息汇总处理模块46,有效信息汇总处理模块46将“声音、大、一点”共三个有效的关键词提取并生成关于控制音响音量的控制信号,发送给中央处理器5,由中央处理器5控制音响将声音调大一点,当调大的声音不够,用户再次发出语音指示:“再大一点”,此时关键词中只有“大、一点”两个关键词,没有声音这个名词,此时有效信息汇总处理模块46默认调节声音,直接再次发出音量控制信号,整个交互系统中语音识别的关键词拆分识别以及有效关键词的汇总方法,不仅能够实现快速语音识别,而且不会发生执行元件6控制混乱的情况,整个语音交互系统识别语音快速,使用稳定;
根据图1和图4所示的一种可快速识别的语音交互系统,所述中央处理器5输入端连接有手机终端7以及连接端连接有指令定制模块8,所述手机终端7通过蓝牙模块与中央处理器5连接,所述指令定制模块8输出端设有数据库一9,所述数据库一9与语音识别模块一2连接,所述语音识别模块一2输出端设有指令转换模块10,所述指令转换模块10输出端与中央处理器5输入端连接;
所述手机终端7用于通过中央处理器5访问指令定制模块8,用户可以根据需要,定制生成各种执行元件6的缩写控制指令,生成的缩写控制指令通过指令定制模块8发送给数据库一9存储;
所述语音采集模块1用于采集语音信息并发送给语音识别模块一2,经语音识别模块一2进行语音初步识别,判断语音信息是否为指令信息,若是,则将信息发送给指令转换模块10,若不是,则将信息发送给任务分配模块3;
所述指令转换模块10用于将语音识别模块一2发送的指令信息转换为相应的控制信号,发送给中央处理器5进行智能控制执行元件6。
实施方式具体为:通过手机终端7经蓝牙模块连接中央处理器5,并访问指令定制模块8,用户可以根据需要,定制生成各种执行元件6的缩写控制指令,生成的缩写控制指令通过指令定制模块8发送给数据库一9存储,存储后,使用时,语音采集模块1采集语音信息并发送给语音识别模块一2,经语音识别模块一2进行语音初步识别,判断语音信息是否为指令信息,若不是,则将信息发送给任务分配模块3,具体实施方式见上述内容,若是,则将信息发送给指令转换模块10,指令转换模块10将语音识别模块一2发送的指令信息转换为相应的控制信号,发送给中央处理器5进行智能控制执行元件6;例如,用户设置开启音响的缩写控制指令为Y,音响音量的指令根据音量大小分为Y1、Y2、Y3等,存储在数据库一9中,并将各缩写控制指令代表的内容保存在指令转换模块10内,若此时用户说出Y1,则语音识别模块一2识别Y1,并能够在数据库一9中查找到Y1,此时语音识别模块一2发送指令信息给指令转换模块10,指令转换模块10根据保存的各缩写控制指令代表的内容,提取指令信息相应的控制信号,再经中央处理器5控制音响音量为一档,这种定制各执行元件6缩写指令的方法,不仅节省用户的控制时间,以及语音识别的速度,而且能够避免他人随意语音控制各执行元件6,避免造成用户麻烦。
最后应说明的几点是:首先,在本申请的描述中,需要说明的是,除非另有规定和限定,术语“安装”、“相连”、“连接”应做广义理解,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变,则相对位置关系可能发生改变;
其次:本发明公开实施例附图中,只涉及到与本公开实施例涉及到的结构,其他结构可参考通常设计,在不冲突情况下,本发明同一实施例及不同实施例可以相互组合;
最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种可快速识别的语音交互系统,包括语音采集模块(1),其特征在于:所述语音采集模块(1)输出端设有语音识别模块一(2),所述语音识别模块一(2)输出端设有任务分配模块(3),所述任务分配模块(3)输出端设有语音识别模块二(4),所述语音识别模块二(4)输出端设有中央处理器(5),所述中央处理器(5)输出端设有执行元件(6);
所述语音识别模块二(4)包括名词识别单元(41)、动词识别单元(42)、数量词识别单元(43)和形容词识别单元(44),所述名词识别单元(41)、动词识别单元(42)、数量词识别单元(43)和形容词识别单元(44)均连接有数据库二(45),且输出端连接有效信息汇总处理模块(46);
所述中央处理器(5)输入端连接有手机终端(7)以及连接端连接有指令定制模块(8),所述指令定制模块(8)输出端设有数据库一(9),所述数据库一(9)与语音识别模块一(2)连接,所述语音识别模块一(2)输出端设有指令转换模块(10),所述指令转换模块(10)输出端与中央处理器(5)输入端连接;
所述手机终端(7)用于通过中央处理器(5)访问指令定制模块(8),用户可以根据需要,定制生成各种执行元件(6)的缩写控制指令,生成的缩写控制指令通过指令定制模块(8)发送给数据库一(9)存储;
所述语音采集模块(1)用于采集语音信息并发送给语音识别模块一(2),经语音识别模块一(2)进行语音初步识别,判断语音信息是否为指令信息,若是,则将信息发送给指令转换模块(10),若不是,则将信息发送给任务分配模块(3);
所述任务分配模块(3)用于将语音识别模块一(2)发送的语音信息分别发送至语音识别模块二(4)中的每个识别单元,四个识别单元根据数据库二(45)对于语音信息内容进行多种关键词的单独识别,然后经有效信息汇总处理模块(46)将有效的关键词提取并生成相应的控制信号,发送给中央处理器(5)进行智能控制执行元件(6);
所述指令转换模块(10)用于将语音识别模块一(2)发送的指令信息转换为相应的控制信号,发送给中央处理器(5)进行智能控制执行元件(6)。
2.根据权利要求1所述的一种可快速识别的语音交互系统,其特征在于:所述手机终端(7)通过蓝牙模块与中央处理器(5)连接。
3.根据权利要求1所述的一种可快速识别的语音交互系统,其特征在于:所述名词识别单元(41)、动词识别单元(42)、数量词识别单元(43)和形容词识别单元(44)分别用于识别语音信息中的名词、动词、数量词和形容词。
4.根据权利要求1所述的一种可快速识别的语音交互系统,其特征在于:所述名词识别单元(41)、动词识别单元(42)、数量词识别单元(43)和形容词识别单元(44)连接的数据库二(45)内分别存储有与执行元件(6)相关的所有关键词,关键词具体为名词、动词、数量词和形容词。
CN201910743317.7A 2019-08-13 2019-08-13 一种可快速识别的语音交互系统 Pending CN110580902A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910743317.7A CN110580902A (zh) 2019-08-13 2019-08-13 一种可快速识别的语音交互系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910743317.7A CN110580902A (zh) 2019-08-13 2019-08-13 一种可快速识别的语音交互系统

Publications (1)

Publication Number Publication Date
CN110580902A true CN110580902A (zh) 2019-12-17

Family

ID=68810733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910743317.7A Pending CN110580902A (zh) 2019-08-13 2019-08-13 一种可快速识别的语音交互系统

Country Status (1)

Country Link
CN (1) CN110580902A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111816176A (zh) * 2020-06-30 2020-10-23 安徽芯智科技有限公司 五菱车机语音交互系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111816176A (zh) * 2020-06-30 2020-10-23 安徽芯智科技有限公司 五菱车机语音交互系统

Similar Documents

Publication Publication Date Title
US9390711B2 (en) Information recognition method and apparatus
CN106981290B (zh) 语音控制装置和语音控制方法
JP2021018797A (ja) 対話の交互方法、装置、コンピュータ可読記憶媒体、及びプログラム
EP2770445A2 (en) Method and system for supporting a translation-based communication service and terminal supporting the service
CN104866274B (zh) 信息处理方法及电子设备
US10811005B2 (en) Adapting voice input processing based on voice input characteristics
EP0653701B1 (en) Method and system for location dependent verbal command execution in a computer based control system
US10170122B2 (en) Speech recognition method, electronic device and speech recognition system
KR102056330B1 (ko) 통역장치 및 그 방법
KR20170033722A (ko) 사용자의 발화 처리 장치 및 방법과, 음성 대화 관리 장치
CN105469789A (zh) 一种语音信息的处理方法及终端
CN108470563B (zh) 一种语音交互中的语音切换方法、服务器及系统
CN101576901A (zh) 搜索请求的产生方法及移动通信设备
CN109036406A (zh) 一种语音信息的处理方法、装置、设备和存储介质
JP6625772B2 (ja) 検索方法及びそれを用いた電子機器
US11532301B1 (en) Natural language processing
CN109741749B (zh) 一种语音识别的方法和终端设备
US20220399013A1 (en) Response method, terminal, and storage medium
CN108806688A (zh) 智能电视的语音控制方法、智能电视、系统及存储介质
CN112669842A (zh) 人机对话控制方法、装置、计算机设备及存储介质
CN108335692B (zh) 一种语音切换方法、服务器及系统
CN111128175B (zh) 口语对话管理方法及系统
KR20190074508A (ko) 챗봇을 위한 대화 모델의 데이터 크라우드소싱 방법
CN110580902A (zh) 一种可快速识别的语音交互系统
CN104281609B (zh) 语音输入指令匹配规则的配置方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191217

WD01 Invention patent application deemed withdrawn after publication