CN115116434A - 应用实现方法、装置、存储介质及电子设备 - Google Patents

应用实现方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN115116434A
CN115116434A CN202210738966.XA CN202210738966A CN115116434A CN 115116434 A CN115116434 A CN 115116434A CN 202210738966 A CN202210738966 A CN 202210738966A CN 115116434 A CN115116434 A CN 115116434A
Authority
CN
China
Prior art keywords
voice
voice signal
keyword
type
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210738966.XA
Other languages
English (en)
Inventor
易旺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Bank Co Ltd
Original Assignee
Ping An Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Bank Co Ltd filed Critical Ping An Bank Co Ltd
Priority to CN202210738966.XA priority Critical patent/CN115116434A/zh
Publication of CN115116434A publication Critical patent/CN115116434A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本申请公开了一种应用实现方法、装置、存储介质及电子设备,首先采集目标用户的语音信号,然后对语音信号进行语音类型识别,得到语音信号对应的语音类型,之后根据语音类型确定关键词识别模式,并基于关键词识别模式对语音信号进行关键词识别,得到语音信号的关键词,最后对关键词进行程序代码转换处理,得到语音信号对应应用的程序代码。由于根据语音信号即可自动生成相应的程序代码,因此,用户只需发出语音信号即可完成程序代码编写,该编写过程的操作难度以及对于用户的专业要求较低,从而有效降低程序代码的编写难度,进而有效提高程序代码的编写效率。

Description

应用实现方法、装置、存储介质及电子设备
技术领域
本申请涉及应用实现领域,尤其涉及一种应用实现方法、装置、存储介质及电子设备。
背景技术
随着互联网技术的高速发展,越来越多人们青睐于使用智能手机、平板电脑等移动设备中的各类应用程序(APP)来充实日常工作与生活,为了提高用户体验,当前市面上开发出大量的应用程序来满足人们的各类需求。
在开发移动应用程序时,由于程序代码编写对于编写人员的专业要求较高,使得一些特殊人群(例如,老年人、儿童和残疾人士)无法自主编写程序代码,另外,由于当前通常是由程序员使用代码编辑工具手动编写程序代码,而完成一个应用程序通常需要编写海量程序代码,该过程极为繁琐复杂,导致程序代码编写效率较低。
发明内容
本申请提供一种应用实现方法、装置、存储介质及电子设备,用于缓解当前程序代码编写效率较低的技术问题。
为了解决上述技术问题,本申请提供以下技术方案:
本申请提供一种应用实现方法,包括:
采集目标用户的语音信号;
对所述语音信号进行语音类型识别,得到所述语音信号对应的语音类型;
根据所述语音类型确定关键词识别模式;
基于所述关键词识别模式对所述语音信号进行关键词识别,得到所述语音信号的关键词;
对所述关键词进行程序代码转换处理,得到所述语音信号对应应用的程序代码。
其中,所述对所述语音信号进行语音类型识别,得到所述语音信号对应的语音类型的步骤,包括:
将所述语音信号输入语音类型识别模块,以通过所述语音类型识别模块识别所述语音信号对应的语音类型;其中,所述语音类型包括口语类型和书面语类型。
其中,所述语音类型识别模块包括语音类型识别网络,所述将所述语音信号输入语音类型识别模块,以通过所述语音类型识别模块识别所述语音信号对应的语音类型的步骤,包括:
将所述语音信号输入所述语音类型识别网络,以通过所述语音类型识别网络提取所述语音信号中的语音特征,并确定所述语音特征对应的语音类型;
将所述语音特征对应的语音类型作为所述语音信号对应的语音类型。
其中,所述语音类型识别模块还包括语音类型识别库,所述将所述语音信号输入语音类型识别模块,以通过所述语音类型识别模块识别所述语音信号对应的语音类型的步骤,还包括:
将所述语音信号输入语音类型识别库,以通过所述语音类型识别库中存储的语音信息与语音类型之间的映射关系确定所述语音信号对应的语音类型;其中,所述语音信息包括语义信息和语气信息。
其中,所述根据所述语音类型确定关键词识别模式的步骤,包括:
当所述语音类型为所述口语类型,将口语关键词识别模式作为所述关键词识别模式;
当所述语音类型为所述书面语类型,将书面语关键词识别模式作为所述关键词识别模式。
其中,所述基于所述关键词识别模式对所述语音信号进行关键词识别,得到所述语音信号的关键词的步骤,包括:
当所述关键词识别模式为所述口语关键词识别模式,将所述语音信号输入口语关键词映射库,以通过所述口语关键词映射库查询所述语音信号的关键词;
当所述关键词识别模式为所述书面语关键词识别模式,将所述语音信号输入书面语关键词映射库,以通过所述书面语关键词映射库查询所述语音信号的关键词。
其中,在所述基于所述关键词识别模式对所述语音信号进行关键词识别,得到所述语音信号的关键词的步骤之后,还包括:
若所述语音信号的关键词的数量小于阈值,基于已识别关键词进行语义关联处理,得到与所述已识别关键词具有关联关系的关联关键词;其中,所述已识别关键词为已识别的所述语音信号的关键词。
其中,所述对所述关键词进行程序代码转换处理,得到所述语音信号对应应用的程序代码的步骤,包括:
将所述已识别关键词和所述关联关键词转换为代码功能语义特征标识;
对所述代码功能语义特征标识进行解码,得到所述语音信号对应应用的程序代码。
其中,所述对所述关键词进行程序代码转换处理,得到所述语音信号对应应用的程序代码的步骤,还包括:
若所述已识别关键词或所述关联关键词满足参数获取条件,生成参数获取语音指令;
接收所述目标用户基于所述参数获取语音指令发送的参数语音信号;
识别所述参数语音信号的参数关键词,并将所述参数关键词、所述已识别关键词和所述关联关键词进行程序代码转换处理,得到所述语音信号对应应用的程序代码。
其中,在所述对所述关键词进行程序代码转换处理,得到所述语音信号对应应用的程序代码的步骤之后,还包括:
当接收到代码修改语音信号,根据所述代码修改语音信号修改所述语音信号对应应用的程序代码。
本申请实施例还提供了一种应用实现装置,包括:
采集模块,用于采集目标用户的语音信号;
语音类型识别模块,用于对所述语音信号进行语音类型识别,得到所述语音信号对应的语音类型;
确定模块,用于根据所述语音类型确定关键词识别模式;
关键词识别模块,用于基于所述关键词识别模式对所述语音信号进行关键词识别,得到所述语音信号的关键词;
转换模块,用于对所述关键词进行程序代码转换处理,得到所述语音信号对应应用的程序代码。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有多条指令,所述指令适于由处理器加载以执行上述应用实现方法中的步骤。
本申请实施例还提供了一种电子设备,包括处理器和存储器,所述处理器与所述存储器电性连接,所述存储器用于存储指令和数据,所述处理器用于执行上述应用实现方法中的步骤。
本申请提供一种应用实现方法、装置、存储介质及电子设备,首先采集目标用户的语音信号,然后对语音信号进行语音类型识别,得到语音信号对应的语音类型,之后根据语音类型确定关键词识别模式,并基于关键词识别模式对语音信号进行关键词识别,得到语音信号的关键词,最后对关键词进行程序代码转换处理,得到语音信号对应应用的程序代码。由于根据语音信号即可自动生成相应的程序代码,因此,用户只需发出语音信号即可完成程序代码编写,该编写过程对于用户的专业要求较低,且操作难度较低,从而有效降低程序代码的编写难度,进而有效提高程序代码的编写效率。
附图说明
下面结合附图,通过对本申请的具体实施方式详细描述,将使本申请的技术方案及其它有益效果显而易见。
图1是本申请实施例提供的应用实现方法的流程示意图。
图2是本申请实施例提供的应用实现方法的场景示意图。
图3是本申请实施例提供的应用实现装置的结构示意图。
图4是本申请实施例提供的电子设备的结构示意图。
图5是本申请实施例提供的电子设备的另一结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种应用实现方法、装置、存储介质及电子设备。
如图1所示,图1是本申请实施例提供的应用实现方法的流程示意图,具体流程可以如下:
S101.采集目标用户的语音信号。
其中,语音信号是一种短时平稳信号,用于携带语音信息(例如,语义、语气等),目标用户为发出语音信号的对象。具体地,在实际应用过程中,可以通过诸如麦克风、麦克风阵列等能够采集语音信号的音频输入设备来采集目标用户输入的语音信号,该音频输入设备可以为计算机设备的内置部件,也可以为计算机设备的外置部件,后续可从该音频输入设备的输出端中读取该语音信号。
例如,目标用户通过麦克风发出携带有“新增一个数组”语义信息的语音信号,此时麦克风即完成语音信号的采集。
可选地,在语音信号采集完成后,还可对语音信号进行降噪处理,以尽可能降低语音环境对于语音信号的干扰,从而在复杂的语音环境中提取出有效的语音信息。
S102.对语音信号进行语音类型识别,得到语音信号对应的语音类型。
其中,语音类型用于表征语音信号的属性、类别。具体地,由于不同的目标用户的说话习惯不同,例如,部分目标用户习惯说口语,另一部分目标用户习惯说书面语,为了正确辨识语音信号,需要先确定语音信号对应的语音类型。
在本实施例中,将语音信号输入语音类型识别模块,以通过语音类型识别模块识别语音信号对应的语音类型,可选地,语音类型包括口语类型和书面语类型。其中,语音类型识别模块可以为具有语音类型识别功能的装置或程序。
在一个实施例中,语音类型识别模块为语音类型识别网络,在识别语音信号对应的语音类型时,将语音信号输入语音类型识别网络,可选地,语音类型识别网络为YOLO网络,在实际应用过程中,预先利用YOLO网络提取大量语音类型为口语类型和书面语类型的语音特征,并根据提取到的语音特征进行多次训练,训练后的YOLO网络具备识别语音类型为口语类型/书面语类型的语音特征的能力,此时再将语音信号输入至训练后的YOLO网络中,以利用YOLO网络提取语音信号中的语音特征,并确定该语音特征对应的语音类型,将该语音特征对应的语音类型作为语音信号对应的语音类型。
例如,将携带有“跑代码”语义信息的语音信号A和携带有“开始运行”语义信息的语音信号B输入语音类型识别网络,语音类型识别网络提取出语音信号A的语音特征为特征a,语音信号B的语音特征为特征b,并确定特征a对应的语音类型为口语类型,特征b对应的语音类型为书面语类型,因此,确定语音信号A对应的语音类型为口语类型,语音信号B对应的语音类型为书面语类型。
在另一个实施例中,语音类型识别模块为语音类型识别库,其中,语音类型识别库中存储有语音信号的语音信息(包括语义信息、语气信息)与语音类型之间的映射关系,在识别语音信号对应的语音类型时,将语音信号输入语音类型识别库,以通过语音类型识别库查询其存储的语音信息与语音类型之间的映射关系从而确定语音信号对应的语音类型。
例如,将语义信息为“确定要有M子类”、语气信息为疑问的语音信号输入语音类型识别库,以通过语音类型识别库查询其存储的语音信息与语音类型之间的映射关系,确定该语音信号所表征的含义为不需要设置M子类,其对应的语音类型为口语类型。
S103.根据语音类型确定关键词识别模式。
其中,关键词识别模式为用于识别语音信号中关键词的方式。具体地,由于语音信号中可能携带大量的语义信息,一些语义信息可能是与程序代码编写无关的,为了保证最终生成的程序代码的可靠性,需要提取出有效的语义信息(例如,关键词),并滤除冗杂无关的语义信息。可选地,关键词识别模式包括口语关键词识别模式和书面语关键词识别模式,二者的关键词识别机制不同,当语音类型为口语类型,将口语关键词识别模式作为关键词识别模式;当语音类型为书面语类型,将书面语关键词识别模式作为关键词识别模式。
例如,由于携带有“跑代码”语义信息的语音信号A的语音类型为口语类型,故将口语关键词识别模式作为语音信号A的关键词识别模式,由于携带有“开始运行”语义信息的语音信号B的语音类型为书面语类型,故将书面语关键词识别模式作为语音信号B的关键词识别模式。
S104.基于关键词识别模式对语音信号进行关键词识别,得到语音信号的关键词。
其中,语音信号的关键词为与程序代码关联程度较高的词汇,例如,新增、保存、运行等,为了保证最终生成的程序代码的可靠性,需要提取出语音信号中的关键词,以便于后续根据关键词生成可靠性较高的程序代码。
进一步地,上述步骤S104具体包括:
当关键词识别模式为口语关键词识别模式,将语音信号输入口语关键词映射库,以通过口语关键词映射库查询语音信号的关键词;
当关键词识别模式为书面语关键词识别模式,将语音信号输入书面语关键词映射库,以通过书面语关键词映射库查询语音信号的关键词。
其中,口语关键词映射库中存储有口语语义与关键词之间的映射关系,书面语关键词映射库中存储有书面语语义与关键词之间的映射关系,在实际应用过程中,可预先在口语关键词映射库/书面语关键词映射库中设置若干口语语义/书面语语义与关键词之间的映射关系(例如,口语关键词映射库中存储有口语语义:“现在要查找”、“接下来开始寻找”与关键词“查询”之间的映射关系;书面语关键词映射库中存储有书面语语义:“继承父类属性”与关键词“新增子类”之间的映射关系),将语音信号输入口语关键词映射库/书面语关键词映射库后,口语关键词映射库/书面语关键词映射库会自动查询语音信号的口语语义/书面语语义与关键词之间的映射关系,以确定该语音信号的关键词。
例如,将携带有“现在要查找”口语语义的语音信号C输入口语关键词映射库,以通过口语关键词映射库查询到语音信号C的关键词为“查询”;将携带有“继承父类属性”书面语语义的语音信号D输入书面语关键词映射库,以通过书面语关键词映射库查询到语音信号D的关键词为“新增子类”。
具体地,由于不同目标用户的语言习惯不同,因此,不同的目标用户在表达相同语义时所表述的方式也不尽相同,例如,在表达关键词“查询”时,目标用户Q习惯将其表述为:“我现在打算查找”,目标用户P习惯将其表述为:“接下来就可以寻找”,为了保证不同目标用户所编写的程序代码都具有较高的可靠性,可预先建立使用者的个人语音映射库,该个人语音映射库内存储有使用者习惯使用的语言表达方式以及其对应的关键词(可由使用者自定义),在使用者发出语音信号时,自动调用个人语音映射库以查询语音信号对应的关键词。
进一步地,各个人语音映射库之间具有相互访问的权限。具体地,由于个人语音映射库中存储的内容有限,为了避免在使用过程中查询不到语音信号对应的关键词这一情况,还可根据目标用户(即使用者)的个人属性(例如,工作岗位、年龄等)查找具有相同/相似属性的其他目标用户的个人语音映射库,从而提高关键词识别的成功率。
例如,目标用户Q的工作岗位为教师,年龄为25岁,当目标用户Q发出口语语义为“开始跑起来”的语音信号时,未在目标用户Q的个人语音映射库中查询到对应的关键词,此时可访问工作岗位也为教师,年龄为26岁的目标用户P的个人语音映射库,并从中查询到口语语义为“开始跑起来”的语音信号对应的关键词为“运行”。
可选地,还可利用摄像装置采集目标用户的动作、手势,以根据采集到的动作手势确定关键词,具体地,可预先设置动作/手势与关键词之间的映射关系,在目标用户做出动作/手势时,将其与预设的动作/手势进行比对,从而确定其对应的关键词。例如,目标用户做出OK手势(将拇指和食指弯曲至呈“O”型,并伸直其余三指),由于OK手势与关键词“运行”具有映射关系,故确定此时目标用户做出的手势对应的关键词为“运行”。
进一步地,在上述步骤S104之后,还包括:
若语音信号的关键词的数量小于阈值,基于已识别关键词(即已识别的语音信号的关键词)进行语义关联处理,得到与已识别关键词具有关联关系的关联关键词。
其中,若语音信号的关键词的数量小于阈值,说明当前获取的关键词数量较少,无法保证各关键词能够拼接成为完整的语句,为了避免后续生成的程序代码出现代码遗漏现象,此时需要对语音信号已识别出来的关键词进行连贯度检测,若连贯度小于预设值,则根据已识别的关键词进行上下文语义关联处理,以推测出更多与该语音信号关联度较高的关键词(即关联关键词)。例如,阈值为4,如图2所示,目标用户向服务器2002发出“我想创建一个窗口”语音信号2001,服务器2002提取该语音信号2001中的关键词并将各关键词按照先后顺序进行排序:“创建”、“窗口”,也就是说,已识别关键词的数量小于阈值,故基于已识别关键词进行上下文语义关联处理:由于创建窗口需要设置窗口的尺寸、标题以及坐标,故推测该语音信号2001的关联关键词为“尺寸”、“标题名称”和“坐标”。
S105.对关键词进行程序代码转换处理,得到语音信号对应应用的程序代码。
其中,语音信号对应应用的程序代码用于实现应用程序的功能,应用程序是程序代码经过编译链接之后生成的可执行文件。具体地,在一个实施例中,将已识别关键词和关联关键词转换为代码功能语义特征标识,然后对代码功能语义特征标识进行解码,得到语音信号对应应用的程序代码。例如,如图4,已识别关键词为“创建”、“窗口”,关联关键词为“尺寸”、“标题名称”和“坐标”,服务器2002将其转换为代码功能语义特征标识,然后对代码功能语义特征标识进行解码,得到语音信号2001对应应用的程序代码2003:typedefstruct{int width;int height;char*title;int coordinate}。
进一步地,在另一实施例中,若已识别关键词或关联关键词所表征的语义环境为缺少参数,则判断其满足参数获取条件,并自动生成参数获取语音指令(即语音提示),目标用户可根据该参数获取语音指令向服务器发出携带有参数的语义信息的参数语音信号,服务器接收到该参数语音信号后可识别参数语音信号中的参数关键词,最后将参数关键词、已识别关键词和关联关键词进行程序代码转换处理,得到语音信号对应应用的程序代码。
例如,已识别关键词为“创建”、“窗口”,关联关键词为“尺寸”、“标题名称”和“坐标”,由于缺少窗口的具体尺寸参数、标题名称参数以及坐标参数,故确定其满足参数获取条件,并自动生成“请输入窗口尺寸参数、窗口标题名称参数以及窗口坐标参数”的语音指令,目标用户听到该语音指令后发出“窗口的宽为640,高为480,标题名称就取为“保险商城登录界面”吧,横坐标是10,纵坐标是52”的参数语音信号,识别出该参数语音信号中的参数关键词为“窗口宽等于640”、“窗口高等于480”、“窗口标题名称为“保险商城登录界面””、“窗口坐标为(10,52)”,最后将各关键词转换为代码功能语义特征标识,然后对代码功能语义特征标识进行解码,得到语音信号对应应用的程序代码为:#define width 640;#defineheight 480;#define title“保险商城登录界面”;#define coordinate 10,52。
可选地,在生成语音信号对应应用的程序代码之后,可将所生成的程序代码展示于显示屏幕以供目标用户查看,若目标用户发现存在错误、遗漏的程序代码,可以发出代码修改语音信号,服务器接收该代码修改语音信号后,根据代码修改语音信号对语音信号对应应用的程序代码进行修改。具体地,根据代码修改语音信号对语音信号对应应用的程序代码进行修改的过程与上文根据语音信号生成对应应用的程序代码的过程相同,故在此不再赘述。
在当前的移动应用程序开发过程中,由于代码编写对于编写人员的专业要求较高,一些特殊人群(例如,老年人、儿童或残疾人士)所掌握的专业知识有限/无法手动打字,使得这类特殊人群无法自主编写程序代码,从而造成一系列不良影响:例如,儿童对于应用程序开发具有浓厚兴趣,但是由于其理解能力、学习能力有限,无法自主手动编写程序代码,不利于儿童的智力开发与兴趣培养;或,残疾人士具有较强的应用程序开发专业能力,但是由于自身身体缺陷导致其无法通过手动打字来编写程序代码,导致其无法充分发挥其专业技能,另外,由于当前通常是由程序员使用代码编辑工具手动打字的方式来编写程序代码,而通常需要编写海量程序代码才能完成一个应用程序,该过程极为繁琐复杂,导致程序代码编写效率较低。
为了缓解上述问题,在本申请提供的应用实现方法中,通过采集目标用户的语音信号以替代当前通过手动打字的方式来完成程序代码的编写,该编写过程对于目标用户的专业要求较低,且操作难度较低,有效降低程序代码的编写难度,使得特殊人群亦可独立编写程序代码,另外,相较于当前手动打字的方式,通过语音信号自动编写程序代码能够有效提高程序代码的编写效率。
由上述可知,本申请提供的应用实现方法,首先采集目标用户的语音信号,然后对语音信号进行语音类型识别,得到语音信号对应的语音类型,之后根据语音类型确定关键词识别模式,并基于关键词识别模式对语音信号进行关键词识别,得到语音信号的关键词,最后对关键词进行程序代码转换处理,得到语音信号对应应用的程序代码。由于根据语音信号即可自动生成相应的程序代码,因此,用户只需发出语音信号即可完成程序代码编写,该编写过程对于用户的专业要求较低,且操作难度较低,从而有效降低程序代码的编写难度,进而有效提高程序代码的编写效率。
根据上述实施例所描述的方法,本实施例将从应用实现装置的角度进一步进行描述。
请参阅图3,图3具体描述了本申请实施例提供的应用实现装置,该应用实现装置可以包括:采集模块10、语音类型识别模块20、确定模块30、关键词识别模块40和转换模块50,其中:
(1)采集模块10
采集模块10,用于采集目标用户的语音信号。
(2)语音类型识别模块20
语音类型识别模块20,用于对语音信号进行语音类型识别,得到语音信号对应的语音类型。
其中,语音类型识别模块20具体用于:
将语音信号输入语音类型识别模块,以通过语音类型识别模块识别语音信号对应的语音类型;其中,语音类型包括口语类型和书面语类型。
具体地,语音类型识别模块包括语音类型识别网络,语音类型识别模块20还用于:
将语音信号输入语音类型识别网络,以通过语音类型识别网络提取语音信号中的语音特征,并确定语音特征对应的语音类型;
将语音特征对应的语音类型作为语音信号对应的语音类型。
进一步地,语音类型识别模块还包括语音类型识别库,语音类型识别模块20还用于:
将语音信号输入语音类型识别库,以通过语音类型识别库中存储的语音信息与语音类型之间的映射关系确定语音信号对应的语音类型;其中,语音信息包括语义信息和语气信息。
(3)确定模块30
确定模块30,用于根据语音类型确定关键词识别模式。
其中,确定模块30具体用于:
当语音类型为口语类型,将口语关键词识别模式作为关键词识别模式;
当语音类型为书面语类型,将书面语关键词识别模式作为关键词识别模式。
(4)关键词识别模块40
关键词识别模块40,用于基于关键词识别模式对语音信号进行关键词识别,得到语音信号的关键词。
其中,关键词识别模块40具体用于:
当关键词识别模式为口语关键词识别模式,将语音信号输入口语关键词映射库,以通过口语关键词映射库查询语音信号的关键词;
当关键词识别模式为书面语关键词识别模式,将语音信号输入书面语关键词映射库,以通过书面语关键词映射库查询语音信号的关键词。
(5)转换模块50
转换模块50,用于对关键词进行程序代码转换处理,得到语音信号对应应用的程序代码。
其中,转换模块50具体用于:
将已识别关键词和关联关键词转换为代码功能语义特征标识;
对代码功能语义特征标识进行解码,得到语音信号对应应用的程序代码。
具体地,转换模块50还用于:
若已识别关键词或关联关键词满足参数获取条件,生成参数获取语音指令;
接收目标用户基于参数获取语音指令发送的参数语音信号;
识别参数语音信号的参数关键词,并将参数关键词、已识别关键词和关联关键词进行程序代码转换处理,得到语音信号对应应用的程序代码。
具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个模块的具体实施可参见前面的方法实施例,在此不再赘述。
由上述可知,本申请提供的应用实现装置,首先通过采集模块10采集目标用户的语音信号,然后通过语音类型识别模块20对语音信号进行语音类型识别,得到语音信号对应的语音类型,之后通过确定模块30根据语音类型确定关键词识别模式,并通过关键词识别模块40基于关键词识别模式对语音信号进行关键词识别,得到语音信号的关键词,最后通过转换模块50对关键词进行程序代码转换处理,得到语音信号对应应用的程序代码。由于根据语音信号即可自动生成相应的程序代码,因此,用户只需发出语音信号即可完成程序代码编写,该编写过程对于用户的专业要求较低,且操作难度较低,从而有效降低程序代码的编写难度,进而有效提高程序代码的编写效率。
相应的,本发明实施例还提供一种应用实现系统,包括本发明实施例所提供的任一种应用实现装置,该应用实现装置可以集成在电子设备中。
其中,采集目标用户的语音信号;对语音信号进行语音类型识别,得到语音信号对应的语音类型;根据语音类型确定关键词识别模式;基于关键词识别模式对语音信号进行关键词识别,得到语音信号的关键词;对关键词进行程序代码转换处理,得到语音信号对应应用的程序代码。
以上各个设备的具体实施可参见前面的实施例,在此不再赘述。
由于该应用实现系统可以包括本发明实施例所提供的任一种应用实现装置,因此,可以实现本发明实施例所提供的任一种应用实现装置所能实现的有益效果,详见前面的实施例,在此不再赘述。
另外,本申请实施例还提供一种电子设备,该电子设备可以是智能手机或电脑等设备。如图4所示,电子设备400包括处理器401、存储器402。其中,处理器401与存储器402电性连接。
处理器401是电子设备400的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或加载存储在存储器402内的应用程序,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。
在本实施例中,电子设备400中的处理器401会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能:
采集目标用户的语音信号;
对语音信号进行语音类型识别,得到语音信号对应的语音类型;
根据语音类型确定关键词识别模式;
基于关键词识别模式对语音信号进行关键词识别,得到语音信号的关键词;
对关键词进行程序代码转换处理,得到语音信号对应应用的程序代码。
图5示出了本发明实施例提供的电子设备的具体结构框图,该电子设备可以用于实施上述实施例中提供的应用实现方法。
RF电路510用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。RF电路510可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。RF电路510可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的无线网络可以使用各种通信标准、协议及技术,包括但并不限于全球移动通信系统(Global System for Mobile Communication,GSM)、增强型移动通信技术(Enhanced DataGSM Environment,EDGE),宽带码分多址技术(Wideband Code Division MultipleAccess,WCDMA),码分多址技术(Code Division Access,CDMA)、时分多址技术(TimeDivision Multiple Access,TDMA),无线保真技术(Wireless Fidelity,Wi-Fi)(如美国电气和电子工程师协会标准IEEE802.11a,IEEE 802.11b,IEEE802.11g和/或IEEE 802.11n)、网络电话(Voice over Internet Protocol,VoIP)、全球微波互联接入(WorldwideInteroperability for Microwave Access,Wi-Max)、其他用于邮件、即时通讯及短消息的协议,以及任何其他合适的通讯协议,甚至可包括那些当前仍未被开发出来的协议。
存储器520可用于存储软件程序以及模块,处理器580通过运行存储在存储器520内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现存储5G能力信息的功能。存储器520可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器520可进一步包括相对于处理器580远程设置的存储器,这些远程存储器可以通过网络连接至电子设备500。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入单元530可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元530可包括触敏表面531以及其他输入设备532。触敏表面531,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面531上或在触敏表面531附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面531可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器580,并能接收处理器580发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面531。除了触敏表面531,输入单元530还可以包括其他输入设备532。具体地,其他输入设备532可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元540可用于显示由用户输入的信息或提供给用户的信息以及电子设备500的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元540可包括显示面板541,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板541。进一步的,触敏表面531可覆盖显示面板541,当触敏表面531检测到在其上或附近的触摸操作后,传送给处理器580以确定触摸事件的类型,随后处理器580根据触摸事件的类型在显示面板541上提供相应的视觉输出。虽然在图5中,触敏表面531与显示面板541是作为两个独立的部件来实现输入和输出功能,但是在某些实施例中,可以将触敏表面531与显示面板541集成而实现输入和输出功能。
电子设备500还可包括至少一种传感器550,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板541的亮度,接近传感器可在电子设备500移动到耳边时,关闭显示面板541和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于电子设备500还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路560、扬声器561,传声器562可提供用户与电子设备500之间的音频接口。音频电路560可将接收到的音频数据转换后的电信号,传输到扬声器561,由扬声器561转换为声音信号输出;另一方面,传声器562将收集的声音信号转换为电信号,由音频电路560接收后转换为音频数据,再将音频数据输出处理器580处理后,经RF电路510以发送给比如另一终端,或者将音频数据输出至存储器520以便进一步处理。音频电路560还可能包括耳塞插孔,以提供外设耳机与电子设备500的通信。
电子设备500通过传输模块570(例如Wi-Fi模块)可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图5示出了传输模块570,但是可以理解的是,其并不属于电子设备500的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器580是电子设备500的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器520内的软件程序和/或模块,以及调用存储在存储器520内的数据,执行电子设备500的各种功能和处理数据。可选的,处理器580可包括一个或多个处理核心;在一些实施例中,处理器580可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器580中。
电子设备500还包括给各个部件供电的电源590(比如电池),在一些实施例中,电源可以通过电源管理系统与处理器580逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源590还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,电子设备500还可以包括摄像头(如前置摄像头、后置摄像头)、蓝牙模块等,在此不再赘述。具体在本实施例中,电子设备的显示单元是触摸屏显示器,电子设备还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行一个或者一个以上程序包含用于进行以下操作的指令:
采集目标用户的语音信号;
对语音信号进行语音类型识别,得到语音信号对应的语音类型;
根据语音类型确定关键词识别模式;
基于关键词识别模式对语音信号进行关键词识别,得到语音信号的关键词;
对关键词进行程序代码转换处理,得到语音信号对应应用的程序代码。
具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个模块的具体实施可参见前面的方法实施例,在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。为此,本发明实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种应用实现方法中的步骤。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本发明实施例所提供的任一种应用实现方法中的步骤,因此,可以实现本发明实施例所提供的任一种应用实现方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
综上,虽然本申请已以优选实施例揭露如上,但上述优选实施例并非用以限制本申请,本领域的普通技术人员,在不脱离本申请的精神和范围内,均可作各种更动与润饰,因此本申请的保护范围以权利要求界定的范围为准。

Claims (13)

1.一种应用实现方法,其特征在于,包括:
采集目标用户的语音信号;
对所述语音信号进行语音类型识别,得到所述语音信号对应的语音类型;
根据所述语音类型确定关键词识别模式;
基于所述关键词识别模式对所述语音信号进行关键词识别,得到所述语音信号的关键词;
对所述关键词进行程序代码转换处理,得到所述语音信号对应应用的程序代码。
2.根据权利要求1所述的应用实现方法,其特征在于,所述对所述语音信号进行语音类型识别,得到所述语音信号对应的语音类型的步骤,包括:
将所述语音信号输入语音类型识别模块,以通过所述语音类型识别模块识别所述语音信号对应的语音类型;其中,所述语音类型包括口语类型和书面语类型。
3.根据权利要求2所述的应用实现方法,其特征在于,所述语音类型识别模块包括语音类型识别网络,所述将所述语音信号输入语音类型识别模块,以通过所述语音类型识别模块识别所述语音信号对应的语音类型的步骤,包括:
将所述语音信号输入所述语音类型识别网络,以通过所述语音类型识别网络提取所述语音信号中的语音特征,并确定所述语音特征对应的语音类型;
将所述语音特征对应的语音类型作为所述语音信号对应的语音类型。
4.根据权利要求2所述的应用实现方法,其特征在于,所述语音类型识别模块还包括语音类型识别库,所述将所述语音信号输入语音类型识别模块,以通过所述语音类型识别模块识别所述语音信号对应的语音类型的步骤,还包括:
将所述语音信号输入语音类型识别库,以通过所述语音类型识别库中存储的语音信息与语音类型之间的映射关系确定所述语音信号对应的语音类型;其中,所述语音信息包括语义信息和语气信息。
5.根据权利要求3或4所述的应用实现方法,其特征在于,所述根据所述语音类型确定关键词识别模式的步骤,包括:
当所述语音类型为所述口语类型,将口语关键词识别模式作为所述关键词识别模式;
当所述语音类型为所述书面语类型,将书面语关键词识别模式作为所述关键词识别模式。
6.根据权利要求5所述的应用实现方法,其特征在于,所述基于所述关键词识别模式对所述语音信号进行关键词识别,得到所述语音信号的关键词的步骤,包括:
当所述关键词识别模式为所述口语关键词识别模式,将所述语音信号输入口语关键词映射库,以通过所述口语关键词映射库查询所述语音信号的关键词;
当所述关键词识别模式为所述书面语关键词识别模式,将所述语音信号输入书面语关键词映射库,以通过所述书面语关键词映射库查询所述语音信号的关键词。
7.根据权利要求6所述的应用实现方法,其特征在于,在所述基于所述关键词识别模式对所述语音信号进行关键词识别,得到所述语音信号的关键词的步骤之后,还包括:
若所述语音信号的关键词的数量小于阈值,基于已识别关键词进行语义关联处理,得到与所述已识别关键词具有关联关系的关联关键词;其中,所述已识别关键词为已识别的所述语音信号的关键词。
8.根据权利要求7所述的应用实现方法,其特征在于,所述对所述关键词进行程序代码转换处理,得到所述语音信号对应应用的程序代码的步骤,包括:
将所述已识别关键词和所述关联关键词转换为代码功能语义特征标识;
对所述代码功能语义特征标识进行解码,得到所述语音信号对应应用的程序代码。
9.根据权利要求7所述的应用实现方法,其特征在于,所述对所述关键词进行程序代码转换处理,得到所述语音信号对应应用的程序代码的步骤,还包括:
若所述已识别关键词或所述关联关键词满足参数获取条件,生成参数获取语音指令;
接收所述目标用户基于所述参数获取语音指令发送的参数语音信号;
识别所述参数语音信号的参数关键词,并将所述参数关键词、所述已识别关键词和所述关联关键词进行程序代码转换处理,得到所述语音信号对应应用的程序代码。
10.根据权利要求8或9所述的应用实现方法,其特征在于,在所述对所述关键词进行程序代码转换处理,得到所述语音信号对应应用的程序代码的步骤之后,还包括:
当接收到代码修改语音信号,根据所述代码修改语音信号修改所述语音信号对应应用的程序代码。
11.一种应用实现装置,其特征在于,包括:
采集模块,用于采集目标用户的语音信号;
语音类型识别模块,用于对所述语音信号进行语音类型识别,得到所述语音信号对应的语音类型;
确定模块,用于根据所述语音类型确定关键词识别模式;
关键词识别模块,用于基于所述关键词识别模式对所述语音信号进行关键词识别,得到所述语音信号的关键词;
转换模块,用于对所述关键词进行程序代码转换处理,得到所述语音信号对应应用的程序代码。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有多条指令,所述指令适于由处理器加载以执行权利要求1至10任一项所述的应用实现方法中的步骤。
13.一种电子设备,其特征在于,包括处理器和存储器,所述处理器与所述存储器电性连接,所述存储器用于存储指令和数据,所述处理器用于执行权利要求1至10任一项所述的应用实现方法中的步骤。
CN202210738966.XA 2022-06-25 2022-06-25 应用实现方法、装置、存储介质及电子设备 Pending CN115116434A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210738966.XA CN115116434A (zh) 2022-06-25 2022-06-25 应用实现方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210738966.XA CN115116434A (zh) 2022-06-25 2022-06-25 应用实现方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN115116434A true CN115116434A (zh) 2022-09-27

Family

ID=83331065

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210738966.XA Pending CN115116434A (zh) 2022-06-25 2022-06-25 应用实现方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN115116434A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116028031A (zh) * 2023-03-29 2023-04-28 中科航迈数控软件(深圳)有限公司 代码自动生成模型训练方法、系统及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116028031A (zh) * 2023-03-29 2023-04-28 中科航迈数控软件(深圳)有限公司 代码自动生成模型训练方法、系统及存储介质

Similar Documents

Publication Publication Date Title
CN107644642B (zh) 语义识别方法、装置、存储介质及电子设备
CN107943860B (zh) 模型的训练方法、文本意图的识别方法及装置
CN108287918B (zh) 基于应用页面的音乐播放方法、装置、存储介质和电子设备
CN109947650B (zh) 脚本步骤处理方法、装置和系统
CN108958606B (zh) 分屏显示方法、装置、存储介质和电子设备
WO2020001165A1 (zh) 语音控制方法、装置、存储介质及电子设备
CN111061383B (zh) 文字检测方法及电子设备
CN109543014B (zh) 人机对话方法、装置、终端及服务器
CN111177180A (zh) 一种数据查询方法、装置以及电子设备
WO2015043200A1 (en) Method and apparatus for controlling applications and operations on a terminal
US20150153921A1 (en) Apparatuses and methods for inputting a uniform resource locator
CN112230877A (zh) 一种语音操作方法、装置、存储介质及电子设备
WO2021139486A1 (zh) 文本增量方法、装置及终端设备
CN115116434A (zh) 应用实现方法、装置、存储介质及电子设备
WO2023246558A1 (zh) 语义理解方法、装置、介质及设备
CN110826098B (zh) 一种信息处理方法及电子设备
CN111292727B (zh) 一种语音识别方法及电子设备
US20230087022A1 (en) Text language type switching method and apparatus, device, and storage medium
CN111580911A (zh) 一种终端的操作提示方法、装置、存储介质及终端
CN104750401A (zh) 一种触控方法、相关装置以及终端设备
CN111145734A (zh) 一种语音识别方法及电子设备
WO2015067116A1 (zh) 处理语音文本的方法及装置
CN111897916B (zh) 语音指令识别方法、装置、终端设备及存储介质
CN115145547A (zh) 基于语音的编程方法、装置、电子设备及存储介质
CN110928539B (zh) 代码工程生成方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination