CN108595141A - 语音输入方法及装置、计算机装置和计算机可读存储介质 - Google Patents
语音输入方法及装置、计算机装置和计算机可读存储介质 Download PDFInfo
- Publication number
- CN108595141A CN108595141A CN201810241694.6A CN201810241694A CN108595141A CN 108595141 A CN108595141 A CN 108595141A CN 201810241694 A CN201810241694 A CN 201810241694A CN 108595141 A CN108595141 A CN 108595141A
- Authority
- CN
- China
- Prior art keywords
- voice
- recognition result
- related information
- scene
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000009434 installation Methods 0.000 title claims abstract description 13
- 238000012905 input function Methods 0.000 claims abstract description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 description 8
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明实施例公开了一种语音输入方法,应用于终端。所述语音输入方法包括:在开启终端的语音输入功能时,采集语音信息并确定所述终端的语音输入场景;对所述语音信息进行识别,以得到语音识别结果;根据所述语音识别结果和所述语音输入场景确定至少一个关联信息;以及展示所述至少一个关联信息。本发明实施例还公开了一种语音输入装置、计算机装置和计算机可读存储介质。本发明实施例通过对所述语音识别结果根据场景化进行智能联想以得到至少一个关联信息,并展示所述至少一个关联信息,操作方便,使输入更加智能、快捷、高效,给用户带来了便利。
Description
技术领域
本发明涉及终端技术领域,特别涉及一种语音输入方法及装置、计算机装置和计算机可读存储介质。
背景技术
随着电子技术和通信技术的快速发展,智能手机成为了日常生活中必不可少的通信终端。用户通过操作智能手机上安装的很多应用程序,使得智能手机完成很多不同的功能,实现了用户与智能手机的交互,给人们的生活提供了很大的便利。
由于语音输入使用简单方便,所以语音功能使用越来越广泛,用户量也越来越多,将用户的声音识别成文字,然后直接发送。只是简单的将声音转发给对应文字,不会对相应的信息根据场景化进行智能联想。用户需要将需要的信息再次录入一遍。这些都给用户带来了不利,用户体验不够好。
发明内容
本发明实施例一方面公开了一种语音输入方法,应用于终端;所述语音输入方法包括:
在开启终端的语音输入功能时,采集语音信息并确定所述终端的语音输入场景;
对所述语音信息进行识别,以得到语音识别结果;
根据所述语音识别结果和所述语音输入场景确定至少一个关联信息;以及
展示所述至少一个关联信息。
作为一种可能的实施方式,所述语音输入方法还包括:
将所述语音识别结果输入编辑框中。
作为一种可能的实施方式,在将所述语音识别结果输入编辑框中之后,所述语音输入方法还包括:
接收针对所述至少一个关联信息的选择操作;
将根据所述选择操作从所述至少一个关联信息中选择出的关联信息输入所述编辑框中。
作为一种可能的实施方式,在所述语音输入方法中,所述根据语音识别结果和语音输入场景确定至少一个关联信息包括:
若语音输入场景为预设场景,则根据所述语音识别结果和语音输入场景确定至少一个关联信息。
作为一种可能的实施方式,在所述语音输入方法中,所述根据语音识别结果和语音输入场景确定至少一个关联信息包括:
在所述语音输入场景为社交聊天场景且语音识别结果为人名的情况下,确定所述人名的电话和/或工作单位;或者
在所述语音输入场景为聊天场景且语音识别结果为地名的情况下,确定所述地名的地理位置、人口、面积或行政级别;或者
在语音输入场景为购物聊天场景且语音识别结果为人名的情况下,确定所述买家姓名的电话和/或通讯地址;或者
在语音输入场景为游戏场景且语音识别结果为游戏角色名称的情况下,确定所述游戏角色名称对应的技能和使用方法。
本发明实施例另一方面公开了一种语音输入装置,应用于终端;所述语音输入装置包括:
采集模块,用于在开启终端的语音输入功能时,采集语音信息并确定所述终端的语音输入场景;
识别模块,用于对所述语音信息进行识别,以得到语音识别结果;
确定模块,用于根据所述语音识别结果和所述语音输入场景确定至少一个关联信息;以及
展示模块,用于展示所述至少一个关联信息。
作为一种可能的实施方式,所述语音输入装置还包括:
输入模块,用于将所述语音识别结果输入编辑框中。
作为一种可能的实施方式,所述语音输入装置还包括:
接收模块,接收针对所述至少一个关联信息的选择操作;
其中,所述输入模块还用于将根据所述选择操作从所述至少一个关联信息中选择出的关联信息输入所述编辑框中。
本发明实施例又一方面公开了一种计算机装置,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现上述语音输入方法的步骤。
本发明实施例再一方面公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述语音输入方法的步骤。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例公开了上述语音输入方法及装置、计算机装置和计算机可读存储介质,通过对所述语音识别结果根据场景化进行智能联想以得到至少一个关联信息,并展示所述至少一个关联信息,操作方便,使输入更加智能、快捷、高效,给用户带来了便利。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种实施例的语音输入方法的流程图。
图2为本发明一种实施例的语音输入装置的功能模块图。
具体实施方式
为了提高语音输入的用户体验,本发明实施例公开了一种语音输入方法及装置、计算机装置和计算机可读存储介质。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一种实施例的语音输入方法100的流程图,语音输入方法100应用于终端。本发明实施例中的终端可以是例如智能手机、平板电脑、个人数字助理(PDA)、智能手表等智能终端。
语音输入方法100包括步骤S102、步骤S104、步骤S106和步骤S108。
步骤S102:在开启终端的语音输入功能时,采集语音信息并确定所述终端的语音输入场景。
步骤S104:对所述语音信息进行识别,以得到语音识别结果。
步骤S106:根据所述语音识别结果和所述语音输入场景确定至少一个关联信息。
步骤S108:展示所述至少一个关联信息。
进一步地,在一种实施例中,所述语音输入方法100还包括:将所述语音识别结果输入编辑框中。如此,可以完成正常的语音输入功能,也即例如将语音输入转换为文字输入。
进一步地,在另一种实施例中,在将所述语音识别结果输入编辑框中之后,所述语音输入方法100还包括:接收针对所述至少一个关联信息的选择操作;将根据所述选择操作从所述至少一个关联信息中选择出的关联信息输入所述编辑框中。如此,可以完成完整的语音输入功能,也即对所述语音识别结果根据语音输入场景进行智能联想以得到至少一个关联信息,并将根据选择操作从所述至少一个关联信息中选择出的关联信息输入所述编辑框中,操作方便,使输入更加智能、快捷、高效,给用户带来了便利。
在一种可能的实施例中,所述步骤S106中根据所述语音识别结果和语音输入场景确定至少一个关联信息包括:根据语音识别结果对应的关键字和语音输入场景确定至少一个关联信息。
在本发明实施例中,所述步骤S106中根据所述语音识别结果和语音输入场景确定至少一个关联信息包括:若语音输入场景为预设场景,则根据所述语音识别结果和语音输入场景确定至少一个关联信息。
作为一种具体的实施例,所述步骤S106中根据所述语音识别结果和语音输入场景确定至少一个关联信息包括:在所述语音输入场景为社交聊天场景且语音识别结果为人名的情况下,确定所述人名的电话和/或工作单位。
或者,所述步骤S106中根据所述语音识别结果和语音输入场景确定至少一个关联信息包括:在所述语音输入场景为聊天场景且语音识别结果为地名的情况下,确定所述地名的地理位置、人口、面积或行政级别。
或者,所述步骤S106中根据所述语音识别结果和语音输入场景确定至少一个关联信息包括:在语音输入场景为购物聊天场景且语音识别结果为人名的情况下,确定所述买家姓名的电话和/或通讯地址。
或者,所述步骤S106中根据所述语音识别结果和语音输入场景确定至少一个关联信息包括:在语音输入场景为游戏场景且语音识别结果为游戏角色名称的情况下,确定所述游戏角色名称对应的技能和使用方法。
图2为本发明一种实施例的语音输入装置200的功能模块图,语音输入装置200应用于终端。语音输入装置200与语音输入方法100对应,也可以说语音输入方法100执行于语音输入装置200中。语音输入装置200包括:采集模块202、识别模块204、确定模块206和展示模块208。
采集模块202,用于在开启终端的语音输入功能时,采集语音信息并确定所述终端的语音输入场景。
识别模块204,用于对所述语音信息进行识别,以得到语音识别结果。
确定模块206,用于根据所述语音识别结果和所述语音输入场景确定至少一个关联信息。
展示模块208,用于展示所述至少一个关联信息。
进一步地,在一种可能的实施例中,所述语音输入装置200还包括:输入模块,用于将所述语音识别结果输入编辑框中。
进一步地,在一种可能的实施例中,所述语音输入装置200还包括:接收模块,接收针对所述至少一个关联信息的选择操作。其中,所述输入模块还用于将根据所述选择操作从所述至少一个关联信息中选择出的关联信息输入所述编辑框中。
本发明实施例还公开了一种计算机装置,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现上述语音输入方法100的步骤。
另外,本发明实施例还公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述语音输入方法100的步骤。
本发明实施例提供一种根据语音输入的内容,并且结合相应的场景,在候选栏上能联想出现相应的信息。具体的应用场景为:该语音输入方法的原理是:输入法先识别当前是处于何种场景,然后用户在使用语音输入情况,识别出关键字词,然后联想相关的信息,让用户去选择。
A.在聊天过程,用户语音输入了相应的人名,输入法就将通讯录中该人名的电话和公司显示在候选栏。
或者,B.用户在淘宝跟别人聊天过来,用语音输入“我家的地址是:”,直接在候选栏上面就显示对应的地址信息。
或者,C.在游戏场景中,语音输入中出现相应的人名,直接候选上面显示相应的技能和使用方法,以及其他信息。
本发明实施例公开的语音输入方法100、语音输入装置200、计算机装置和计算机可读存储介质,通过对所述语音识别结果根据场景化进行智能联想以得到至少一个关联信息,并展示所述至少一个关联信息,操作方便,使输入更加智能、快捷、高效,给用户带来了便利。
在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种语音输入方法,应用于终端,其特征在于,所述语音输入方法包括:
在开启终端的语音输入功能时,采集语音信息并确定所述终端的语音输入场景;
对所述语音信息进行识别,以得到语音识别结果;
根据所述语音识别结果和所述语音输入场景确定至少一个关联信息;以及
展示所述至少一个关联信息。
2.如权利要求1所述的语音输入方法,其特征在于,所述语音输入方法还包括:
将所述语音识别结果输入编辑框中。
3.如权利要求2所述的语音输入方法,其特征在于,在将所述语音识别结果输入编辑框中之后,所述语音输入方法还包括:
接收针对所述至少一个关联信息的选择操作;
将根据所述选择操作从所述至少一个关联信息中选择出的关联信息输入所述编辑框中。
4.如权利要求1所述的语音输入方法,其特征在于,所述根据语音识别结果和语音输入场景确定至少一个关联信息包括:
若语音输入场景为预设场景,则根据所述语音识别结果和语音输入场景确定至少一个关联信息。
5.如权利要求1所述的语音输入方法,其特征在于,所述根据语音识别结果和语音输入场景确定至少一个关联信息包括:
在所述语音输入场景为社交聊天场景且语音识别结果为人名的情况下,确定所述人名的电话和/或工作单位;或者
在所述语音输入场景为聊天场景且语音识别结果为地名的情况下,确定所述地名的地理位置、人口、面积或行政级别;或者
在语音输入场景为购物聊天场景且语音识别结果为人名的情况下,确定所述买家姓名的电话和/或通讯地址;或者
在语音输入场景为游戏场景且语音识别结果为游戏角色名称的情况下,确定所述游戏角色名称对应的技能和使用方法。
6.一种语音输入装置,应用于终端,其特征在于,所述语音输入装置包括:
采集模块,用于在开启终端的语音输入功能时,采集语音信息并确定所述终端的语音输入场景;
识别模块,用于对所述语音信息进行识别,以得到语音识别结果;
确定模块,用于根据所述语音识别结果和所述语音输入场景确定至少一个关联信息;以及
展示模块,用于展示所述至少一个关联信息。
7.如权利要求6所述的语音输入装置,其特征在于,所述语音输入装置还包括:
输入模块,用于将所述语音识别结果输入编辑框中。
8.如权利要求7所述的语音输入装置,其特征在于,所述语音输入装置还包括:
接收模块,接收针对所述至少一个关联信息的选择操作;
其中,所述输入模块还用于将根据所述选择操作从所述至少一个关联信息中选择出的关联信息输入所述编辑框中。
9.一种计算机装置,其特征在于,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5中任意一项所述语音输入方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-5中任意一项所述语音输入方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810241694.6A CN108595141A (zh) | 2018-03-22 | 2018-03-22 | 语音输入方法及装置、计算机装置和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810241694.6A CN108595141A (zh) | 2018-03-22 | 2018-03-22 | 语音输入方法及装置、计算机装置和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108595141A true CN108595141A (zh) | 2018-09-28 |
Family
ID=63627138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810241694.6A Withdrawn CN108595141A (zh) | 2018-03-22 | 2018-03-22 | 语音输入方法及装置、计算机装置和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108595141A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109688271A (zh) * | 2019-01-16 | 2019-04-26 | 深圳壹账通智能科技有限公司 | 联系人信息输入的方法、装置及终端设备 |
CN110070872A (zh) * | 2019-04-22 | 2019-07-30 | 南京邮电大学 | 一种基于智能语音识别的物流填单方法 |
CN112801239A (zh) * | 2021-01-28 | 2021-05-14 | 科大讯飞股份有限公司 | 输入识别方法、装置、电子设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101419531A (zh) * | 2008-12-12 | 2009-04-29 | 腾讯科技(深圳)有限公司 | 在计算机中进行文字输入的方法及装置 |
CN106371625A (zh) * | 2016-09-29 | 2017-02-01 | 北京小米移动软件有限公司 | 关联词显示方法及装置 |
CN106896932A (zh) * | 2016-06-07 | 2017-06-27 | 阿里巴巴集团控股有限公司 | 一种候选词推荐方法及装置 |
CN107346229A (zh) * | 2017-07-18 | 2017-11-14 | 珠海市魅族科技有限公司 | 语音输入方法及装置、计算机装置及可读存储介质 |
-
2018
- 2018-03-22 CN CN201810241694.6A patent/CN108595141A/zh not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101419531A (zh) * | 2008-12-12 | 2009-04-29 | 腾讯科技(深圳)有限公司 | 在计算机中进行文字输入的方法及装置 |
CN106896932A (zh) * | 2016-06-07 | 2017-06-27 | 阿里巴巴集团控股有限公司 | 一种候选词推荐方法及装置 |
CN106371625A (zh) * | 2016-09-29 | 2017-02-01 | 北京小米移动软件有限公司 | 关联词显示方法及装置 |
CN107346229A (zh) * | 2017-07-18 | 2017-11-14 | 珠海市魅族科技有限公司 | 语音输入方法及装置、计算机装置及可读存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109688271A (zh) * | 2019-01-16 | 2019-04-26 | 深圳壹账通智能科技有限公司 | 联系人信息输入的方法、装置及终端设备 |
CN110070872A (zh) * | 2019-04-22 | 2019-07-30 | 南京邮电大学 | 一种基于智能语音识别的物流填单方法 |
CN112801239A (zh) * | 2021-01-28 | 2021-05-14 | 科大讯飞股份有限公司 | 输入识别方法、装置、电子设备和存储介质 |
CN112801239B (zh) * | 2021-01-28 | 2023-11-21 | 科大讯飞股份有限公司 | 输入识别方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109145123B (zh) | 知识图谱模型的构建方法、智能交互方法、系统及电子设备 | |
CN103377652B (zh) | 一种用于进行语音识别的方法、装置和设备 | |
EP3095113B1 (en) | Digital personal assistant interaction with impersonations and rich multimedia in responses | |
CN103035240B (zh) | 用于使用上下文信息的语音识别修复的方法和系统 | |
CN102483917B (zh) | 针对显示文本的命令 | |
CN104794122A (zh) | 一种位置信息推荐方法、装置和系统 | |
US8799254B2 (en) | Method and apparatus for improved searching of database content | |
US9237122B2 (en) | Method and apparatus for adding recipient information | |
US10558655B2 (en) | Data query method supporting natural language, open platform, and user terminal | |
US11829433B2 (en) | Contextual deep bookmarking | |
US9055419B2 (en) | Mobile terminal to recommend a short message recipient | |
CN110187780B (zh) | 长文本预测方法、装置、设备和存储介质 | |
CN108595141A (zh) | 语音输入方法及装置、计算机装置和计算机可读存储介质 | |
CN112784112B (zh) | 报文校验方法及装置 | |
CN106504050A (zh) | 一种信息比对装置及方法 | |
CN106101358A (zh) | 一种联系人信息更新的方法及智能设备 | |
JP6442807B1 (ja) | 対話サーバ、対話方法及び対話プログラム | |
CN111813900A (zh) | 多轮对话处理方法、装置、电子设备及存储介质 | |
CN111028834A (zh) | 语音信息提醒方法、装置、服务器和语音信息提醒设备 | |
CN103118346A (zh) | 一种发送短信的方法、装置及终端 | |
CN104780516A (zh) | 一种短信显示的方法及装置 | |
CN111787042A (zh) | 用于推送信息的方法和装置 | |
CN109683727A (zh) | 一种数据处理方法及装置 | |
CN111367942B (zh) | 通讯录检索方法及装置 | |
CN110931014A (zh) | 基于正则匹配规则的语音识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20180928 |
|
WW01 | Invention patent application withdrawn after publication |