CN102937834A - 混合型输入的方法、客户端及系统 - Google Patents
混合型输入的方法、客户端及系统 Download PDFInfo
- Publication number
- CN102937834A CN102937834A CN2012104894201A CN201210489420A CN102937834A CN 102937834 A CN102937834 A CN 102937834A CN 2012104894201 A CN2012104894201 A CN 2012104894201A CN 201210489420 A CN201210489420 A CN 201210489420A CN 102937834 A CN102937834 A CN 102937834A
- Authority
- CN
- China
- Prior art keywords
- input
- candidate item
- content
- input mode
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明提供了一种混合型输入的方法、客户端及系统,属于输入法技术领域。所提供的方法包括:在语音输入的过程中,进行第二输入方式的输入操作,该第二输入方式是语音输入之外的其它输入方式;根据第二输入方式的输入内容,对语音输入的识别结果候选项进行筛选,采集满足第二输入方式的结果候选项作为语音输入的内容,或者采集为优先排序在前的结果候选项进行输出;或者根据语音输入的识别结果,对第二输入候选项进行筛选,采集符合语音识别结果条件的第二输入候选项作为第二输入方式的输入内容,或者采集为优先排序在前的第二输入候选项进行输出。利用本发明,能够在语音输入的基础上,混合其它的输入方式来调整语音输入的结果。
Description
技术领域
本发明属于输入法技术领域。
技术背景
人们广泛使用有各种计算终端,比如台式机电脑、笔记本电脑、平板电脑、手机、个人数字助理,等等。这些计算终端中,通常都设置有各种类型的输入法工具。
比如,在进行汉字输入操作的过程中,常用搜狗拼音输入法工具,通过输入汉语拼音的方式来输入汉字。其中,汉语拼音对应着字母,在输入汉语拼音所构成的字符串之后,即可通过所在的输入法工具,获得与这些字符相对应的候选项。通过选取特定的候选项获取自己所需要的汉字,或者其它能够通过前述拼音字符串所获得的候选项,比如符号,或音频,或视频,或多媒体等各种预设的数据内容。
在当前的输入法中,在采用一种输入法方式后,那么各内容的输入操作都会采用该设定的输入方式,不会汇总其它的输入法类型。
比如,在启动语音输入法的情况下,仅仅执行语音输入法;在启动汉语拼音输入法的情况下,仅仅执行汉语拼音输入法;在启动手写输入法时,仅仅执行手写输入法。
另一方面,目前的语音输入法已经有了很大的进步,应用日益广泛。但目前仍无法准确地实现数据的语音输入功能。这是因为每个人说话的方式都不一样,并且,就算是同一个人,不同次数重复同样的话,也会具有区别。
如何使得语音输入的方式更加准确,以及提高已有输入法的输出速度,是目前需要解决的重要问题。
发明内容
本发明的目的是提供一种混合输入的方法,以及对应的客户端及系统,利用本发明,能够在语音输入的基础上,混合其它的输入方式来调整语音输入的结果。
本发明所提供的一种混合型输入的方法,包括有如下步骤:
步骤1,在语音输入的过程中,进行第二输入方式的输入操作,该第二输入方式是语音输入之外的其它输入方式;
步骤2,根据第二输入方式的输入内容,对语音输入的识别结果候选项进行筛选,采集满足第二输入方式的结果候选项作为语音输入的内容,或者采集为优先排序在前的结果候选项在候选项列表中输出;
或者,根据语音输入的识别结果,对第二输入方式所获得的第二输入候选项进行筛选,采集符合语音识别结果条件的第二输入候选项作为第二输入方式的输入内容,或者采集为优先排序在前的第二输入候选项在候选项列表中输出。
进一步,在语音输入获得目标语言字符的情况下,所述的第二输入方式,是采集字符串形式输入获得目标语言字符的候选项。
进一步,所述的语音输入为汉语语音输入,对应的第二输入方式为汉语拼音输入,其中通过汉语拼音字符串获得汉字候选项。
进一步,在进行汉语拼音输入时,输入每个汉字的拼音首字母。
进一步,在前述的语音输入为汉语语音输入,第二输入方式为汉语拼音输入方式的情况下,在进行筛选时,获得语音识别字符中首字母的发音,将该首字母与第二输入方式所输入的首字母进行比对,使其比对吻合;进而采集语音的读音内容中韵母的发音,用以和首字母所对应汉字的汉语拼音韵母进行比对,判定两者的吻合状况。
进一步,所述的语音输入为汉语语音输入,对应的第二输入方式为笔画输入或五笔输入。
进一步,在进行笔画输入时,输入每个汉字所对应笔画的首笔,或者,在进行五笔输入时,输入每个汉字和/或词组的五笔输入法中的首笔。
进一步,在进行语音输入的过程中,对应着第二输入方式中新输入的字符产生之前,完成所对应前一字符的语音内容的输入操作。
进一步,所述的语音输入,为字母组成类语言的语音输出,对应的第二输入方式是输入字母组成类词汇的首字母。
进一步,在根据第二输入方式的输入内容对语音输入的识别结果候选项进行筛选时,对语音输入的结果候选项分别按照第二输入方式提取当前输入内容,判定是否与已采集的第二输入方式的输入内容吻合,将吻合的结果候选项进行筛选。
进一步,在根据语音输入的识别结果对第二输入方式所获得的第二输入候选项进行筛选时,采集语音识别结果的候选项,与第二输入候选项进行比对,将比对吻合的第二输入候选项进行筛选。
进一步,在通过前述的第二输入方式输入的是对应内容的首字母的前提下,筛选时若不满足第二输入方式中所输入首字母限定条件,且语音识别结果的字符数量大于第二输入方式所输入首字母数量的情况下,将未与首字母相对应的多余字符识别结果删除;
或者,筛选时若不满足第二输入方式中所输入首字母限定条件,且语音识别结果的字符数量少于第二输入方式所输入首字母数量的情况下,则依据首字母与前面和/或后面字符之间的关联性,以及重新采集对应内容处的语音,判定获得可能的字符,添加到对应位置。
进一步,在根据语音输入的识别结果对第二输入方式所获得的第二输入候选项进行筛选时,按照如下的方式进行:
对语音输入的内容按照语言规则分出由字或词组成的字词单元;
采集各字词单元读音组成元素1-3个;
采集第二输入候选项,判定其中的内容是否与前述的读音组成元素相吻合,采集符合吻合条件的候选项作为输入内容,或者在候选项列表中优先排序。
进一步,所述的读音组成元素为汉语拼音中的声母与韵母,其判定步骤为:
取前述的语音输入为汉字语音输入,对于语音识别获得的字词单元,采集其读音内容中首字母的发音,用以将该首字母与第二输入方式所输入的首字母进行比对,使其比对吻合;
采集读音内容中韵母的发音,用以和首字母所对应汉字的汉语拼音韵母进行比对,来判定两者的吻合状况。
本发明还提供一种混合型输入的客户端,该客户端包括:
复合数据采集单元,用以在语音输入的过程中,进行第二输入方式的输入操作,该第二输入方式是语音输入之外的其它输入方式;
筛选执行单元,用以根据第二输入方式的输入内容,对语音输入的识别结果候选项进行筛选,采集满足第二输入方式的结果候选项作为语音输入的内容,或者采集为优先排序在前的结果候选项在候选项列表中输出;
或者,根据语音输入的识别结果,对第二输入方式所获得的第二输入候选项进行筛选,采集符合语音识别结果条件的第二输入候选项作为第二输入方式的输入内容,或者采集为优先排序在前的第二输入候选项在候选项列表中输出。
本发明还提供一种混合型输入的系统,该系统包括:
输入法客户端,它包括,
语音采集单元,用以采集用户所输入的语音信息;
第二输入采集单元,用以采集用户在输入语音信息时通过第二输入方式所输入的数据内容,该第二输入方式是语音输入之外的其它输入方式;
复合数据上传单元,用以将前述语音采集单元和第二输入采集单元所采集的输入内容上传至对应的识别服务器;
识别结果输出单元,用以接收识别服务器所推送的识别结果,将识别结果确定为输入的字符内容,或者输出候选项列表供用户选择;
对应的识别服务器,它包括,
复合数据接收单元,用以接收所述输入法客户端中复合数据上传单元所上传的待识别的输入内容;
语音识别单元,用以获取前述复合数据接收单元所接收到的语音数据,将其识别为特定的字符内容,或者由识别字符组成的一组以上的识别结果候选项;
筛选执行单元,用以根据第二输入方式的输入内容,对前述语音识别单元的识别结果候选项进行筛选,采集满足第二输入方式的结果候选项作为语音输入的内容,或者采集为优先排序在前的结果候选项;
或者,根据语音输入的识别结果,对第二输入方式所获得的第二输入候选项进行筛选,采集符合语音识别结果条件的第二输入候选项作为第二输入方式的输入内容,或者采集为优先排序在前的第二输入候选项;
识别结果推送单元,用以将前述筛选执行单元所筛选获得的识别结果推送至前述对应的输入法客户端。
附图说明
图1是本发明所述一种混合型输入的方法流程图,对应着实施例1。
图2是本发明所述的一种混合型输入的客户端的结构框图,对应着实施例3。
图3是本发明所述的一种混合型输入的系统的结构框图,对应着实施例4。
具体实施方式
实施例1
参图1所示,在本实施例中,所述的混合型输入具有如下的操作流程:
步骤S110,设置通过所在的输入法工具,在进行汉语语音输入的情况下,同步进行汉语拼音输入操作,且输入语音对应汉字拼音的首字母。
在本发明中,在以语音输入的方式去获得目标语言字符的情况下,所述的第二输入方式,优选为采集字符串内容,通过对应关系获得目标语言字符的候选项。比如在本实施例中,目标语言字符为汉字,所采集的字符串内容为汉语拼音,而汉语拼音对应着汉字候选项。
进一步,在输入汉语拼音时,优选为仅输入每个汉字的拼音首字母。这种方式可以获得更快的输入速度。而且,因为有了同步的语音输入信息作为筛选因素,因此,也可以保持较高的正确识别率。
需要指出的是,第二输入方式的具体类型是不限定的,只要能够利用所输入的内容与语音输入的语言类型之间产生对应关系就可以了。作为举例,在所述的语音输入的方式为汉语语音输入的情况下,所对应的第二输入方式还可以是笔划输入的方式或者五笔输入的方式。进一步,在采用笔划输入时,所对应的字符串优选为所输入每个汉字笔划的首笔,这样能够减少所输入的字符串数量;类似地,在进行五笔输入时,优选为输入每个汉字和/或词组的五笔输入法中的首笔,这样也是为了减少字符串输入的数量。
需要指出的是,本发明所述的语音输入字符的语言类型并不限定,比如,还可以输入字母组成类语言,比如英语。英语的基本组成单元为英语单词,绝大多数的英语单词中均包括有两个或以上的字母。这种情况下,用语音口述英语发音内容的情况下,来识别获得对应的英语内容,同步采集用户对每个英语单词首字母的写入信息,作为本发明所述的第二输入方式。将口述的英语发音内容的识别结果与前述第二输入方式所输入的每个英语单词的首字母这两者信息相互结合,来判定最终的输入结果,提高输入的效率。当然,对其它能够应用本发明思路的语言类型,也均可以进行应用。
步骤S120,在采集用户口述汉语语音的语音输入信息的过程中,采集用户通过第二输入方式所进行的汉语拼音首字母的输入操作信息。
在本实施例中,就是在口述汉语语音的过程中,采集第二输入方式所输入的汉语拼音首字母。
在进行语音输入的过程中,优选在对应着第二输入方式新输入字符之前,完成所对应前一字符的语音内容的输入操作。作为举例,适合在口述特定汉字的时候输入与其对应的特定汉语拼音的首字母,这样能够产生时间上的一一对应关系;进而在输入新的首字母之前,完成所对应前一首字母所对应汉字的语音输入操作。利用这种方式,能够更加方便地利用语音和首字母获得准确的汉字识别结果,并且能够减少语音识别时的运算量。
步骤S130,对口述汉语语音的语音输入信息进行内容识别,获得两个或以上的识别结果候选项。
口述的汉语语音内容,因为有停顿位置的差别、地方方言的差别、说话习惯的差别、语音声带及口腔和口型的区别、发音大小的区别等等因素,使得用户口述的语音内容还无法被完全准确地识别。于是,就可能会生成不同的识别结果候选项,该识别结果候选项通常在两个或以上。
需要指出的是,所述的识别结果候选项可以对应着所输入的整个语音内容生成两个或以上的识别结果候选项,但同样作为良好的实施例,适合选择单个的字或者词或者词组等更细节层次的内容组成部分,在语音识别后单独获得与其相对应的识别结果候选项。该方式能够让用户对细节部分的错误作出更加灵活的调整。
步骤S140,采集各识别结果候选项中的汉字数据内容,获取各候选项汉语拼音的首字母。
在该步骤中,需要获取识别结果候选项中的汉字数据,然后依据汉字和拼音之间的对应关系,获取候选项中各汉字的拼音内容,进而在各汉字拼音内容中采集首字母数据。
步骤S150,将所获得的前述候选项中各汉字拼音的首字母,与前述第二输入方式所输入首字母进行比对。
在本实施例中,将第二输入方式所输入的首字母认定为判定标准。这是因为这些首字母是用户一个个输入的,在输入的时候经过了自己的判断与斟酌。
于是,在将第二输入方式所输入的首字母作为判定标准的情况下,就要求前述的语音识别获得的识别结果候选项所对应汉字拼音的首字母与其相吻合,否则,就意味着语音识别结果可能发生了错误。
步骤S160,筛选时取满足第二输入方式中所输入首字母限定条件的识别结果候选项,采集作为当前输入法工具的最终输入结果,或者,在候选项列表中排序在最前方,将吻合度降低的排序靠后;
筛选时若不满足第二输入方式中所输入首字母限定条件,且语音识别结果的汉字数量大于第二输入方式所输入首字母数量的话,则将未与首字母相对应的多余汉字识别结果删除;
筛选时若不满足第二输入方式中所输入首字母限定条件,且语音识别结果的汉字数量少于第二输入方式所输入首字母数量的话,则依据拼音首字母与前面和/或后面汉字之间关联性,以及重新采集对应内容处的语音,判定获得可能的汉字,添加到对应位置。
在根据第二输入方式的输入内容对语音输入的识别结果候选项进行筛选时,对语音输入的结果候选项分别按照第二输入方式提取当前输入的内容,判定是否与已采集的第二输入方式的输入内容吻合,将吻合的结果候选项进行筛选。具体来说,在该步骤中,利用第二输入方式所输入的首字母为限定条件,来对识别结果候选项进行筛选,以及对多余或者缺失的语音识别结果进行修补等操作。
其中,如果有特定的识别结果候选项所对应的汉字拼音首字母均与第二输入方式所输入的首字母吻合的话,就可以将该识别结果候选项作为默认的正确识别结果,直接载入到需要进行字符输入的目标位置。或者,若满足第二输入方式所提供限定条件的识别结果候选项具有两个或以上的情况下,生成候选项列表,输出符合限定条件的各识别结果候选项供用户选择。当然,也会有部分的识别结果候选项接近符合第二输入方式的限定条件但并非完全符合,这种情况下也可以将其作为候选项进行输出。
甚至,也可能没有一项识别结果候选项完全符合第二输入方式的限定条件,这种情况下,就可以依据符合程度的高低对识别结果候选项进行排序,将符合程度高的排序在前、符合程度低的排序在后。
进一步,也可以依据第二输入方式所输入的数据内容,对识别结果候选项进行相应的修订。作为一种情况,是利用语音识别的结果所获得的字符量超过实际所需求的字符量,比如语音识别结果有12个汉字,而采集获得的第二输入方式的首字母量为10个,也就是说,语音识别结果多出了两个汉字。对于这种情况,就可以根据第二输入方式中首字母输入的内容及排序方式,将不符合该首字母内容及排序方式的多余汉字识别结果删除,将删除多余汉字识别结果后的候选项输出给用户。
作为另一种常见的情况,利用语音识别结果所获得的字符量可能少于实际用户需要输入的字符量,比如用户语音输入某些内容,可能发音轻微,造成无法识别的现象。对于这种情况就可以通过所采集获得的第二输入方式的首字母数据,与语音识别的候选项结果进行比对,判定特定的候选项中所缺失汉字的首字母,然后获取该首字母所对应位置的发音内容以及前面和/或后面的相邻汉字,从而依据该缺失位置所对应的发音内容及前后汉字的关联关系,判定符合条件的可能性汉字,筛选出作为识别结果,或者筛选出两个或以上的可能性的汉字识别结果分别作为候选项。
步骤S170,在识别结果以候选项列表的形式输出时,采集对特定候选项的触发消息,获取所触发候选项中的数据内容,完成输入操作。
实施例2
在本实施例中,具有如下的操作流程:
步骤S210,设置通过所在的输入法工具,在进行汉语语音输入的情况下,同步进行汉语拼音输入操作,且输入语音对应汉字拼音的首字母。
步骤S220,在采集用户口述汉语语音的语音输入信息的过程中,采集用户通过第二输入方式所进行的汉语拼音首字母的输出操作信息。
步骤S230,对第二输入方式所输入的汉语拼音首字母,解析后获取两个或以上的第二输入候选项。
在本实施例中,通过第二输入方式所输入的汉语拼音首字母来获取与其相对应的第二输入候选项。需要指出的是,这种拼音首字母对应候选项的形式,在当前的输入法工具中,比如搜狗汉语拼音输入法中,就常用这种方式进行候选项的获取操作。
步骤S240,对前述口述汉语语音的语音输入信息进行内容识别,获得一个或以上的识别结果候选项。
步骤S250,采集第二输入候选项和前述的识别结果候选项之间进行比对,判定符合第二输入候选项和该识别结果候选项之间的吻合程度。
步骤S260,若具有和识别结果候选项吻合的第二输入候选项,则采集作为当前输入法工具的最终输入结果,或者,在候选项列表中排序在最前方,将吻合度低的排序靠后。
在本实施例中,能够根据语音输入的识别结果,对第二输入方式所获得的第二输入候选项进行筛选。在进行筛选时,采集语音识别结果的候选项,与第二输入候选项进行比对,利用比对的吻合程度对第二输入候选项进行筛选。
进一步,还可以发展其它的比对形式。作为举例,在根据语音输入的识别结果对第二输入方式所获得的第二输入候选项进行筛选时,还可以按照如下的方式实施:
对语音输入的内容按照语言规则分出由字或词组成的字词单元;
采集各字词单元读音组成元素1-3个;
采集第二输入候选项,判定其中的内容是否与前述的读音组成元素相吻合,采集符合吻合条件的候选项作为输入内容,或者在候选项列表中优先排序。
举例来说,所述的读音组成元素可取为汉语拼音中的声母与韵母。对于识别获得的字词单元,可以采集其读音内容中首字母的发音,用以将该首字母与第二输入方式所输入的首字母进行比对,使其比对吻合;以及采集读音内容中韵母的发音,用以和首字母所对应汉字的汉语拼音韵母进行比对,来判定两者吻合状况。于是,利用声母和已输入首字母进行比对,再利用韵母进行比对的方式,就可以对符合条件的候选项进行筛选了,如果完全吻合,则采集为默认的正确识别结果,否则,可输出为候选项供用户选择。
步骤S270,在识别结果以候选项列表的形式输出的情况下,采集对特定候选项的触发消息,获取所触发候选项中的数据内容,完成输入操作。
实施例3
参图2所示,在本实施例中,还提供了一种混合型输入的客户端100,它是一种输入法客户端,能够利用语音输入及语音输入之外的第二输入方式,相互结合起来进行输入操作。为实现该目的,所述的客户端100包括有如下结构:
复合数据采集单元110,用以在语音输入的过程中,进行第二输入方式的输入操作,该第二输入方式是语音输入之外的其它输入方式;
筛选执行单元120,用以根据第二输入方式的输入内容,对语音输入的识别结果候选项进行筛选,采集满足第二输入方式的结果候选项作为语音输入的内容,或者采集为优先排序在前的结果候选项在候选项列表中输出;
或者,根据语音输入的识别结果,对第二输入方式所获得的第二输入候选项进行筛选,采集符合语音识别结果条件的第二输入候选项作为第二输入方式的输入内容,或者采集为优先排序在前的第二输入候选项在候选项列表中输出。
在本实施例中,通过复合数据采集单元110在进行语音输入的过程中,适合同步进行第二输入方式。尤其是,第二输入方式所对应的内容的读音与同时所输入的语音信息相对应,该“同时”适合设置时间范围,比如前后相邻1秒钟或2秒钟之内的时间范围等。
利用前述的筛选执行单元120,在第二输入方式的输入内容与语音输入的输入结果两者之间可以相互进行比对,既可以由第二输入方式的输入内容预先获得候选项,然后由语音识别结果候选项对其进行筛选;也可以先由语音识别结果获得候选项,然后通过第二输入方式所获得的候选项作为限定条件,进行筛选操作。将筛选获得的识别结果直接作为载入的内容,或者通过候选项列表输出符合比对条件,或者接近符合比对条件的候选项。在采集用户对候选项列表中特定候选项的选择消息后,获取所选择候选项中的数据内容,作为最终输入的数据内容。
实施例4
参图3所示,在本实施例中,还提供了一种混合型输入的系统200,它包括输入法客户端210和识别服务器220。
其中,所述的输入法客户端210,包括:
语音采集单元211,用以采集用户所输入的语音信息;
第二输入采集单元212,用以采集用户在输入语音信息时通过第二输入方式所输入的数据内容,该第二输入方式是语音输入之外的其它输入方式;
复合数据上传单元213,用以将前述语音采集单元211和第二输入采集单元212所采集的输入内容上传至对应的识别服务器220;
识别结果输出单元214,用以接收识别服务器220所推送的识别结果,将识别结果确定为输入的字符内容,或者输出候选项列表供用户选择。
对应地,所述的识别服务器220,包括:
复合数据接收单元221,用以接收所述输入法客户端210中复合数据上传单元213所上传的待识别的输入内容;
语音识别单元222,用以获取前述复合数据接收单元221所接收到的语音数据,将其识别为特定的字符内容,或者由识别字符组成的一组以上的识别结果候选项;
筛选执行单元223,用以根据第二输入方式的输入内容,对前述候选项作为语音输入的内容,或者采集为优先排序在前的结果候选项;
或者,根据语音输入的识别结果,对第二输入方式所获得的第二输入候选项进行筛选,采集符合语音识别结果条件的第二输入候选项作为第二输入方式的输入内容,或者采集为优先排序在前的第二输入候选项;
识别结果推送单元224,用以将前述筛选执行单元223所筛选获得的识别结果推送至前述对应的输入法客户端210。
在具体实施时,前述的输入法客户端210既可以安装在用户所使用的终端设备中,也可以将用户所使用的终端设备仅仅作为数据输入及输出的端口。
利用前述输入法客户端210中的语音采集单元211,在利用输入法进行输入操作的过程中,采集用户的语音信息,以及在采集用户语音信息时,通过第二输入采集单元212采集第二输入方式所输入的数据内容。进而利用复合数据上传单元213,将前述所采集的两类输入内容打包后推送至远程的识别服务器220。
进而在识别服务器220,通过复合数据接收单元221,接收前述复合数据上传单元213所上传的待识别的两类数据内容。通过语音识别单元222,首先将所接收到的语音内容识别为字符内容,包括由识别的字符内容所组成的识别结果候选项。进而通过筛选执行单元223,依据语音内容的识别结果候选项,将第二输入方式的输入内容作为限定条件进行比对,采集符合比对条件的识别结果候选项作为最终的输入内容,或者作为候选项列表中优先输出的候选项。另外,也可以通过第二输入内容首先获得第二输入候选项,然后利用语音识别结果作为限定条件,对第二输入候选项进行筛选,将筛选后的结果作为最终的输入内容,或者作为候选项列表中优先输出的候选项。进一步,通过前述的识别结果推送单元224,将筛选执行单元223所筛选获得的识别结果向前述的输入法客户端210进行推送。
前述的输入法客户端210通过识别结果输出单元214接收到识别服务器220所推送的识别结果后,将识别结果直接确定为待输入的字符内容,加载到需要输入字符内容的目标位置;或者,生成候选项列表,将识别、筛选获得的候选项输出,根据用户对其中候选项的选择结果,采集所选择候选项的数据内容,载入到需要输入字符内容的目标位置。
以上是对本发明的描述而非限定,基于本发明思想的其它实施例,亦均在本发明的保护范围之中。
Claims (16)
1.一种混合型输入的方法,其特征在于该方法包括有如下步骤:
步骤1,在语音输入的过程中,进行第二输入方式的输入操作,该第二输入方式是语音输入之外的其它输入方式;
步骤2,根据第二输入方式的输入内容,对语音输入的识别结果候选项进行筛选,采集满足第二输入方式的结果候选项作为语音输入的内容,或者采集为优先排序在前的结果候选项在候选项列表中输出;
或者,根据语音输入的识别结果,对第二输入方式所获得的第二输入候选项进行筛选,采集符合语音识别结果条件的第二输入候选项作为第二输入方式的输入内容,或者采集为优先排序在前的第二输入候选项在候选项列表中输出。
2.根据权利要求1所述的一种混合型输入的方法,其特征在于:在语音输入获得目标语言字符的情况下,所述的第二输入方式,是采集字符串形式输入获得目标语言字符的候选项。
3.根据权利要求2所述的一种混合型输入的方法,其特征在于:所述的语音输入为汉语语音输入,对应的第二输入方式为汉语拼音输入,其中通过汉语拼音字符串获得汉字候选项。
4.根据权利要求3所述的一种混合型输入的方法,其特征在于:在进行汉语拼音输入时,输入每个汉字的拼音首字母。
5.根据权利要求1或4所述的一种混合型输入的方法,其特征在于:在前述的语音输入为汉语语音输入,第二输入方式为汉语拼音输入方式的情况下,在进行筛选时,获得语音识别字符中首字母的发音,将该首字母与第二输入方式所输入的首字母进行比对,使其比对吻合;进而采集语音的读音内容中韵母的发音,用以和首字母所对应汉字的汉语拼音韵母进行比对,判定两者的吻合状况。
6.根据权利要求2所述的一种混合型输入的方法,其特征在于:所述的语音输入为汉语语音输入,对应的第二输入方式为笔画输入或五笔输入。
7.根据权利要求6所述的一种混合型输入的方法,其特征在于:在进行笔画输入时,输入每个汉字所对应笔画的首笔,或者,在进行五笔输入时,输入每个汉字和/或词组的五笔输入法中的首笔。
8.根据权利要求1所述的一种混合型输入的方法,其特征在于:在进行语音输入的过程中,对应着第二输入方式中新输入的字符产生之前,完成所对应前一字符的语音内容的输入操作。
9.根据权利要求1所述的一种混合型输入的方法,其特征在于:所述的语音输入,为字母组成类语言的语音输出,对应的第二输入方式是输入字母组成类词汇的首字母。
10.根据权利要求1所述的一种混合型输入的方法,其特征在于:在根据第二输入方式的输入内容对语音输入的识别结果候选项进行筛选时,对语音输入的结果候选项分别按照第二输入方式提取当前输入内容,判定是否与已采集的第二输入方式的输入内容吻合,将吻合的结果候选项进行筛选。
11.根据权利要求1所述的一种混合型输入的方法,其特征在于:在根据语音输入的识别结果对第二输入方式所获得的第二输入候选项进行筛选时,采集语音识别结果的候选项,与第二输入候选项进行比对,将比对吻合的第二输入候选项进行筛选。
12.根据权利要求1所述的一种混合型输入的方法,其特征在于:在通过前述的第二输入方式输入的是对应内容的首字母的前提下,筛选时若不满足第二输入方式中所输入首字母限定条件,且语音识别结果的字符数量大于第二输入方式所输入首字母数量的情况下,将未与首字母相对应的多余字符识别结果删除;
或者,筛选时若不满足第二输入方式中所输入首字母限定条件,且语音识别结果的字符数量少于第二输入方式所输入首字母数量的情况下,则依据首字母与前面和/或后面字符之间的关联性,以及重新采集对应内容处的语音,判定获得可能的字符,添加到对应位置。
13.根据权利要求1所述的一种混合型输入的方法,其特征在于:在根据语音输入的识别结果对第二输入方式所获得的第二输入候选项进行筛选时,按照如下的方式进行,
对语音输入的内容按照语言规则分出由字或词组成的字词单元;
采集各字词单元读音组成元素1-3个;
采集第二输入候选项,判定其中的内容是否与前述的读音组成元素相吻合,采集符合吻合条件的候选项作为输入内容,或者在候选项列表中优先排序。
14.根据权利要求13所述的一种混合型输入的方法,其特征在于:所述的读音组成元素为汉语拼音中的声母与韵母,其判定步骤为,
取前述的语音输入为汉字语音输入,对于语音识别获得的字词单元,采集其读音内容中首字母的发音,用以将该首字母与第二输入方式所输入的首字母进行比对,使其比对吻合;
采集读音内容中韵母的发音,用以和首字母所对应汉字的汉语拼音韵母进行比对,来判定两者的吻合状况。
15.一种混合型输入的客户端,其特征在于该客户端包括:
复合数据采集单元,用以在语音输入的过程中,进行第二输入方式的输入操作,该第二输入方式是语音输入之外的其它输入方式;
筛选执行单元,用以根据第二输入方式的输入内容,对语音输入的识别结果候选项进行筛选,采集满足第二输入方式的结果候选项作为语音输入的内容,或者采集为优先排序在前的结果候选项在候选项列表中输出;
或者,根据语音输入的识别结果,对第二输入方式所获得的第二输入候选项进行筛选,采集符合语音识别结果条件的第二输入候选项作为第二输入方式的输入内容,或者采集为优先排序在前的第二输入候选项在候选项列表中输出。
16.一种混合型输入的系统,其特征在于该系统包括:
输入法客户端,它包括,
语音采集单元,用以采集用户所输入的语音信息;
第二输入采集单元,用以采集用户在输入语音信息时通过第二输入方式所输入的数据内容,该第二输入方式是语音输入之外的其它输入方式;
复合数据上传单元,用以将前述语音采集单元和第二输入采集单元所采集的输入内容上传至对应的识别服务器;
识别结果输出单元,用以接收识别服务器所推送的识别结果,将识别结果确定为输入的字符内容,或者输出候选项列表供用户选择;
对应的识别服务器,它包括,
复合数据接收单元,用以接收所述输入法客户端中复合数据上传单元所上传的待识别的输入内容;
语音识别单元,用以获取前述复合数据接收单元所接收到的语音数据,将其识别为特定的字符内容,或者由识别字符组成的一组以上的识别结果候选项;
筛选执行单元,用以根据第二输入方式的输入内容,对前述语音识别单元的识别结果候选项进行筛选,采集满足第二输入方式的结果候选项作为语音输入的内容,或者采集为优先排序在前的结果候选项;
或者,根据语音输入的识别结果,对第二输入方式所获得的第二输入候选项进行筛选,采集符合语音识别结果条件的第二输入候选项作为第二输入方式的输入内容,或者采集为优先排序在前的第二输入候选项;
识别结果推送单元,用以将前述筛选执行单元所筛选获得的识别结果推送至前述对应的输入法客户端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210489420.1A CN102937834B (zh) | 2012-11-26 | 2012-11-26 | 混合型输入的方法、客户端及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210489420.1A CN102937834B (zh) | 2012-11-26 | 2012-11-26 | 混合型输入的方法、客户端及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102937834A true CN102937834A (zh) | 2013-02-20 |
CN102937834B CN102937834B (zh) | 2016-01-06 |
Family
ID=47696735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210489420.1A Active CN102937834B (zh) | 2012-11-26 | 2012-11-26 | 混合型输入的方法、客户端及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102937834B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218199A (zh) * | 2013-02-26 | 2013-07-24 | 马骏 | 带标识码输入的语音输入法 |
CN104166462A (zh) * | 2013-05-17 | 2014-11-26 | 北京搜狗科技发展有限公司 | 一种文字的输入方法和系统 |
CN104345875A (zh) * | 2013-08-07 | 2015-02-11 | 联想(北京)有限公司 | 信息处理的方法及电子设备 |
CN104423543A (zh) * | 2013-08-26 | 2015-03-18 | 联想(北京)有限公司 | 一种信息处理方法及装置 |
CN106406804A (zh) * | 2016-09-12 | 2017-02-15 | 北京百度网讯科技有限公司 | 一种基于语音的输入方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1181529A (zh) * | 1996-10-31 | 1998-05-13 | 倚天资讯股份有限公司 | 使用者行为记录装置 |
CN1294340A (zh) * | 1999-10-20 | 2001-05-09 | 英业达集团(西安)电子技术有限公司 | 中文词汇输入方法 |
CN1755589A (zh) * | 2004-09-29 | 2006-04-05 | 松下电器产业株式会社 | 基于按键和语音识别的文字输入方法及装置 |
CN1842842A (zh) * | 2003-08-29 | 2006-10-04 | 松下电器产业株式会社 | 一种根据辅助信息提高语音识别的方法和设备 |
CN101377726A (zh) * | 2007-08-31 | 2009-03-04 | 西门子(中国)有限公司 | 语音识别和笔划识别相结合的输入方法及其终端 |
CN101488044A (zh) * | 2009-02-18 | 2009-07-22 | 陈拙夫 | 一种语音和单笔混合式计算机汉字输入法 |
-
2012
- 2012-11-26 CN CN201210489420.1A patent/CN102937834B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1181529A (zh) * | 1996-10-31 | 1998-05-13 | 倚天资讯股份有限公司 | 使用者行为记录装置 |
CN1294340A (zh) * | 1999-10-20 | 2001-05-09 | 英业达集团(西安)电子技术有限公司 | 中文词汇输入方法 |
CN1842842A (zh) * | 2003-08-29 | 2006-10-04 | 松下电器产业株式会社 | 一种根据辅助信息提高语音识别的方法和设备 |
CN1755589A (zh) * | 2004-09-29 | 2006-04-05 | 松下电器产业株式会社 | 基于按键和语音识别的文字输入方法及装置 |
CN101377726A (zh) * | 2007-08-31 | 2009-03-04 | 西门子(中国)有限公司 | 语音识别和笔划识别相结合的输入方法及其终端 |
CN101488044A (zh) * | 2009-02-18 | 2009-07-22 | 陈拙夫 | 一种语音和单笔混合式计算机汉字输入法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218199A (zh) * | 2013-02-26 | 2013-07-24 | 马骏 | 带标识码输入的语音输入法 |
CN104166462A (zh) * | 2013-05-17 | 2014-11-26 | 北京搜狗科技发展有限公司 | 一种文字的输入方法和系统 |
CN104166462B (zh) * | 2013-05-17 | 2017-07-21 | 北京搜狗科技发展有限公司 | 一种文字的输入方法和系统 |
CN104345875A (zh) * | 2013-08-07 | 2015-02-11 | 联想(北京)有限公司 | 信息处理的方法及电子设备 |
CN104423543A (zh) * | 2013-08-26 | 2015-03-18 | 联想(北京)有限公司 | 一种信息处理方法及装置 |
CN106406804A (zh) * | 2016-09-12 | 2017-02-15 | 北京百度网讯科技有限公司 | 一种基于语音的输入方法及装置 |
CN106406804B (zh) * | 2016-09-12 | 2020-08-28 | 北京百度网讯科技有限公司 | 一种基于语音的输入方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN102937834B (zh) | 2016-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108255290B (zh) | 移动装置上的模态学习 | |
US9348808B2 (en) | Content-based automatic input protocol selection | |
CN105957518B (zh) | 一种蒙古语大词汇量连续语音识别的方法 | |
US10558701B2 (en) | Method and system to recommend images in a social application | |
AU2013270485B2 (en) | Input processing method and apparatus | |
CN109637537B (zh) | 一种自动获取标注数据优化自定义唤醒模型的方法 | |
CN102937834B (zh) | 混合型输入的方法、客户端及系统 | |
WO2014117548A1 (en) | Method and device for acoustic language model training | |
EP2643770A2 (en) | Text segmentation with multiple granularity levels | |
TW200900967A (en) | Multi-mode input method editor | |
CN105183761A (zh) | 敏感词替换方法和装置 | |
KR20090019198A (ko) | 음성 인식을 이용한 텍스트 입력 자동 완성 방법 및 장치 | |
JP5703491B2 (ja) | 言語モデル・音声認識辞書作成装置及びそれらにより作成された言語モデル・音声認識辞書を用いた情報処理装置 | |
TW201606750A (zh) | 使用外國字文法的語音辨識 | |
CN110738997B (zh) | 一种信息修正方法、装置、电子设备及存储介质 | |
CN113282701B (zh) | 作文素材生成方法、装置、电子设备及可读存储介质 | |
Bilu et al. | Claim synthesis via predicate recycling | |
CN108346426A (zh) | 语音识别装置以及语音识别方法 | |
JP5231484B2 (ja) | 音声認識装置、音声認識方法、プログラム、及びプログラムを配信する情報処理装置 | |
CN102970618A (zh) | 基于音节识别的视频点播方法 | |
CN105786204A (zh) | 信息处理方法和电子设备 | |
CN101577115A (zh) | 语音输入系统及其方法 | |
KR20170009486A (ko) | 청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기 | |
CN112489634A (zh) | 语言的声学模型训练方法、装置、电子设备及计算机介质 | |
JP5722375B2 (ja) | 文末表現変換装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |