CN107680595A - 一种智能语音手机或智能语音平板 - Google Patents

一种智能语音手机或智能语音平板 Download PDF

Info

Publication number
CN107680595A
CN107680595A CN201711131801.1A CN201711131801A CN107680595A CN 107680595 A CN107680595 A CN 107680595A CN 201711131801 A CN201711131801 A CN 201711131801A CN 107680595 A CN107680595 A CN 107680595A
Authority
CN
China
Prior art keywords
module
voice
intelligent sound
mobile phone
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711131801.1A
Other languages
English (en)
Inventor
虞焰兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Voice Communication Information Technology Co Ltd
Original Assignee
Anhui Voice Communication Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Voice Communication Information Technology Co Ltd filed Critical Anhui Voice Communication Information Technology Co Ltd
Priority to CN201711131801.1A priority Critical patent/CN107680595A/zh
Publication of CN107680595A publication Critical patent/CN107680595A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/39Electronic components, circuits, software, systems or apparatus used in telephone systems using speech synthesis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种智能语音手机或智能语音平板,涉及电子设备技术领域。本发明包括云端服务器和电子设备;电子设备内设置有语音唤醒模块、语音识别模块、语音命令模块、语义分析模块、语音合成模块和程序控制模块;语音识别模块通过有线通信模块与云端服务器相联;语音识别模块通过信息分析处理及信号转换传输模块与语音命令模块相联;语音命令模块通过信息处理及信号传输模块与程序控制模块相联。本发明通过在电子设备内设置有语音唤醒模块、语音识别模块、语音命令模块、语义分析模块、语音合成模块和程序控制模块,实现语音的交互,通过语音唤醒模块直接唤醒程序,无需手动打开应用,通过语音交互功能实现软件应用,语音交互功能操作简单。

Description

一种智能语音手机或智能语音平板
技术领域
本发明属于电子设备技术领域,特别是涉及一种智能语音手机或智能语音平板。
背景技术
4G时代,网速大大提高,手机APP软件程序应用的频次和范围不断的增加,手机APP控制和语音交互将会向着更智能的方向发展。语音输入可以极大方便用户提升输入效率,特别是在手机上应用语音输入。现有技术用户通过带有语音输入功能的装置,向手机下达语音控制指令,手机接收到指令后,不再与通话耳机进行交互,而是在正在执行的APP中自行对语音控制指令进行识别,并在该APP中对应执行所述指令。
随着手机行业的不断发展,手机已从之前单纯的通讯工具转变为及通讯、娱乐、工作等功能为一体的电子产品。用户对手机的交互体验越来越关注,传统的语音交互功能需要用户手动选择进入语音功能模块,弹出提示输入语音的对话框和图表,用户才能通过语音对手机发出操作请求,操作起来不便捷。要实现功能上的语音识别,需要每个相应的应用去开发,花费大量的人力物力。因此,提供一种智能语音手机或智能语音平板,解决上述问题。
发明内容
本发明的目的在于提供一种智能语音手机或智能语音平板,通过在电子设备内设置有语音唤醒模块、语音识别模块、语音命令模块、语义分析模块、语音合成模块和程序控制模块,实现语音的交互,解决了现有的语音交互功能操作使用不便、开发耗时耗力的问题。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明为一种智能语音手机或智能语音平板,包括云端服务器和安装有智能APP软件的电子设备;所述电子设备内设置有语音唤醒模块、语音识别模块、语音命令模块、语义分析模块、语音合成模块和程序控制模块;所述语音唤醒模块通过信息分析处理及传输模块与运行指令模块相联;所述语音识别模块通过WiFi模块和/或有线通信模块与云端服务器相联;所述语音识别模块通过信息分析处理及信号转换传输模块与语音命令模块相联;所述语音命令模块通过信息处理及信号传输模块与程序控制模块相联,实现语音的交互,无需手动打开应用,操作简单。
进一步地,所述语音唤醒模块接收用户的语音信息并形成指令信息;所述语音唤醒模块通过信息分析处理及信号转换传输模块与运行指示模块相联;所述运行指示模块接收并执行指令信息,用户的语音通过语音唤醒模块自动唤醒程序,便于使用,实现智能化使用应用程序。
进一步地,所述语音识别模块接收用户的语音信息并识别用户的语音信息;所述语音识别模块通过信息分析处理及信号转换传输模块与语音命令模块相联;所述语音识别模块通过信息分析处理及信号传输模块与语义分析模块相联,用户的语音通过语音识别模块将文字信息转换为语音信息传输至语音命令模块,实现智能语音交互。
进一步地,所述语义分析模块通过信号转换处理模块与语音合成模块相联;所述语音合成模块通过语音信号输出模块进行语音的输出,实现语音信号的输出。
进一步地,所述语音命令模块通过信息处理及信号转换传输模块与程序控制模块相联,打开并应用程序,操作简单方便。
本发明具有以下有益效果:
1、本发明通过在电子设备内设置有语音唤醒模块、语音识别模块、语音命令模块、语义分析模块、语音合成模块和程序控制模块,实现语音的交互,通过语音唤醒模块直接唤醒程序,无需手动打开应用,通过语音交互功能实现APP的开启应用,语音交互功能操作简单。
2、本发明中语音识别模块将语音信息传输至云端服务器,云端服务器将相应的文字信息返回至语音识别模块,实现语音识别模块与云端服务器之间的信息传输,减少手机的内存负荷,实现功能上的语音识别,提高输入效率,降低成本。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明智能语音手机或智能语音平板的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明为一种智能语音手机或智能语音平板,包括云端服务器和安装有智能APP软件的电子设备;电子设备内设置有语音唤醒模块、语音识别模块、语音命令模块、语义分析模块、语音合成模块和程序控制模块;语音唤醒模块通过信息分析处理及传输模块与运行指令模块相联;语音识别模块通过WiFi模块和/或有线通信模块与云端服务器相联;语音识别模块通过信息分析处理及信号转换传输模块与语音命令模块相联;语音命令模块通过信息处理及信号传输模块与程序控制模块相联。
其中,电子设备为手机或平板电脑。
其中,语音唤醒模块接收用户的语音信息并形成指令信息;语音唤醒模块通过信息分析处理及信号转换传输模块与运行指示模块相联;运行指示模块接收并执行指令信息。
其中,语音识别模块接收用户的语音信息并识别用户的语音信息;语音识别模块通过信息分析处理及信号转换传输模块与语音命令模块相联;语音识别模块通过信息分析处理及信号传输模块与语义分析模块相联。
其中,语义分析模块通过信号转换处理模块与语音合成模块相联;语音合成模块通过语音信号输出模块进行语音的输出。
其中,语音命令模块通过信息处理及信号转换传输模块与程序控制模块相联。
实施例一:
电子设备为手机,手机内安装有QQ、视屏播放APP、Word等APP软件且没有安装微信;
语音唤醒模块接收并识别用户发出的“唤醒词”并唤醒程序,运行指令;当用户发出“打开Word”时,语音识别模块将“打开Word”语音信息传输至云端服务器,云端服务器将文字信息返回至语音识别模块,语义分析模块对语义进行分析修改,并通过语音合成模块合成语音,语音合成模块通过语音信号输出模块进行语音的输出,语音命令模块分析并传输语音命令,通过程序控制模块打开Word,并可以通过语音输入进行文字的编辑;
语音唤醒模块接收并识别用户发出的“唤醒词”并唤醒程序,运行指令;当用户发出“打开微信”时,语音唤醒模块将“打开微信”信息传输至运行提示模块,运行提示模块生成“没有微信,是否安装微信?”提示用户安装APP;
实施例二:
电子设备为平板电脑,平板电脑内安装有QQ、视屏播放APP、Word、微信等APP软件;
语音唤醒模块接收并识别用户发出的“唤醒词”并唤醒程序,运行指令;当用户发出“打开QQ”时,语音识别模块将“打开QQ”语音信息传输至云端服务器,云端服务器将文字信息返回至语音识别模块,语义分析模块对语义进行分析修改,并通过语音合成模块合成语音,语音合成模块通过语音信号输出模块进行语音的输出,语音命令模块分析并传输语音命令,通过程序控制模块打开QQ,并可以通过语音输入进行QQ聊天。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (6)

1.一种智能语音手机或智能语音平板,其特征在于,包括云端服务器和安装有智能APP软件的电子设备;
所述电子设备内设置有语音唤醒模块、语音识别模块、语音命令模块、语义分析模块、语音合成模块和程序控制模块;
所述语音唤醒模块通过信息分析处理及传输模块与运行指令模块相联;
所述语音识别模块通过WiFi模块和/或有线通信模块与云端服务器相联;所述语音识别模块通过信息分析处理及信号转换传输模块与语音命令模块相联;
所述语音命令模块通过信息处理及信号传输模块与程序控制模块相联。
2.根据权利要求1所述的一种智能语音手机或智能语音平板,其特征在于,所述电子设备为手机或平板电脑。
3.根据权利要求1所述的一种智能语音手机或智能语音平板,其特征在于:
所述语音唤醒模块接收用户的语音信息并形成指令信息;
所述语音唤醒模块通过信息分析处理及信号转换传输模块与运行指示模块相联;所述运行指示模块接收并执行指令信息。
4.根据权利要求1所述的一种智能语音手机或智能语音平板,其特征在于:
所述语音识别模块接收用户的语音信息并识别用户的语音信息;
所述语音识别模块通过信息分析处理及信号转换传输模块与语音命令模块相联;
所述语音识别模块通过信息分析处理及信号传输模块与语义分析模块相联。
5.根据权利要求1所述的一种智能语音手机或智能语音平板,其特征在于,所述语义分析模块通过信号转换处理模块与语音合成模块相联;所述语音合成模块通过语音信号输出模块进行语音的输出。
6.根据权利要求1所述的一种智能语音手机或智能语音平板,其特征在于,所述语音命令模块通过信息处理及信号转换传输模块与程序控制模块相联。
CN201711131801.1A 2017-11-15 2017-11-15 一种智能语音手机或智能语音平板 Pending CN107680595A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711131801.1A CN107680595A (zh) 2017-11-15 2017-11-15 一种智能语音手机或智能语音平板

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711131801.1A CN107680595A (zh) 2017-11-15 2017-11-15 一种智能语音手机或智能语音平板

Publications (1)

Publication Number Publication Date
CN107680595A true CN107680595A (zh) 2018-02-09

Family

ID=61149368

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711131801.1A Pending CN107680595A (zh) 2017-11-15 2017-11-15 一种智能语音手机或智能语音平板

Country Status (1)

Country Link
CN (1) CN107680595A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108417215A (zh) * 2018-04-27 2018-08-17 三星电子(中国)研发中心 一种播放设备交互方法和装置
CN108630201A (zh) * 2018-03-07 2018-10-09 北京墨丘科技有限公司 一种用于建立设备关联的方法和装置
CN109878218A (zh) * 2019-01-30 2019-06-14 厦门爱立得科技有限公司 一种带有智能语音控制的打印机及其打印方法
CN110493123A (zh) * 2019-09-16 2019-11-22 腾讯科技(深圳)有限公司 即时通讯方法、装置、设备及存储介质
CN115509627A (zh) * 2022-11-22 2022-12-23 威海海洋职业学院 一种基于人工智能的电子设备唤醒方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201796356U (zh) * 2010-09-20 2011-04-13 方正科技集团苏州制造有限公司 一种能识别语音命令的计算机
CN102932539A (zh) * 2012-10-22 2013-02-13 深圳市中兴移动通信有限公司 一种基于语音识别通过打开应用方式解锁的终端及方法
CN104050966A (zh) * 2013-03-12 2014-09-17 百度国际科技(深圳)有限公司 终端设备的语音交互方法和使用该方法的终端设备
CN105204838A (zh) * 2014-06-26 2015-12-30 金德奎 用手机语音控制软件对应用程序进行具体控制的方法
CN107277904A (zh) * 2017-07-03 2017-10-20 上海斐讯数据通信技术有限公司 一种终端及语音唤醒方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201796356U (zh) * 2010-09-20 2011-04-13 方正科技集团苏州制造有限公司 一种能识别语音命令的计算机
CN102932539A (zh) * 2012-10-22 2013-02-13 深圳市中兴移动通信有限公司 一种基于语音识别通过打开应用方式解锁的终端及方法
CN104050966A (zh) * 2013-03-12 2014-09-17 百度国际科技(深圳)有限公司 终端设备的语音交互方法和使用该方法的终端设备
CN105204838A (zh) * 2014-06-26 2015-12-30 金德奎 用手机语音控制软件对应用程序进行具体控制的方法
CN107277904A (zh) * 2017-07-03 2017-10-20 上海斐讯数据通信技术有限公司 一种终端及语音唤醒方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108630201A (zh) * 2018-03-07 2018-10-09 北京墨丘科技有限公司 一种用于建立设备关联的方法和装置
CN108630201B (zh) * 2018-03-07 2020-09-29 北京墨丘科技有限公司 一种用于建立设备关联的方法和装置
CN108417215A (zh) * 2018-04-27 2018-08-17 三星电子(中国)研发中心 一种播放设备交互方法和装置
CN109878218A (zh) * 2019-01-30 2019-06-14 厦门爱立得科技有限公司 一种带有智能语音控制的打印机及其打印方法
CN110493123A (zh) * 2019-09-16 2019-11-22 腾讯科技(深圳)有限公司 即时通讯方法、装置、设备及存储介质
CN110493123B (zh) * 2019-09-16 2022-06-28 腾讯科技(深圳)有限公司 即时通讯方法、装置、设备及存储介质
CN115509627A (zh) * 2022-11-22 2022-12-23 威海海洋职业学院 一种基于人工智能的电子设备唤醒方法和系统

Similar Documents

Publication Publication Date Title
CN107680595A (zh) 一种智能语音手机或智能语音平板
CN105869655B (zh) 音频装置以及语音检测方法
US11295760B2 (en) Method, apparatus, system and storage medium for implementing a far-field speech function
CN202961885U (zh) 基于移动通讯终端语音控制玩具的通讯装置
CN107277904A (zh) 一种终端及语音唤醒方法
WO2017128775A1 (zh) 一种语音控制系统、语音处理方法及终端设备
CN102546953A (zh) 一种全语音操控移动终端的系统及方法
CN103365836B (zh) 一种采用自然语言的分布式智能交互的实现方法及其系统
CN103838714A (zh) 一种语音信息转换方法及装置
CN108877805A (zh) 语音处理模组和具有语音功能的终端
CN103095813A (zh) 语音交互系统、移动终端装置及语音通信的方法
CN101893993A (zh) 电子白板系统及其语音处理方法
CN107731231A (zh) 一种支持多云端语音服务的方法及一种存储设备
CN109725868A (zh) 纯语音交互的车机系统的实现方法、适用于车机系统的语音交互装置及系统
CN102929385A (zh) 语音控制应用程序的方法
CN110491381A (zh) 一种无人飞行器语音交互系统及其语音交互方法
CN103713812A (zh) 网络化的智能交互系统
CN103077716A (zh) 辅助启动装置、语音操控系统及其方法
CN202838948U (zh) 基于移动通讯终端语音控制空调的通讯装置
CN106201015A (zh) 基于输入法应用软件的语音输入方法及装置
CN107527618A (zh) 一种音频文字同步播放系统
CN212161279U (zh) 一种无人飞行器语音交互装置
CN107562733A (zh) 一种即时消息翻译方法和系统以及一种电子设备
CN202924498U (zh) 一种家用电梯的语音识别系统
CN208351468U (zh) 在线离线同时翻译装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180209