CN104166462A

CN104166462A - 一种文字的输入方法和系统

Info

Publication number: CN104166462A
Application number: CN201310185321.9A
Authority: CN
Inventors: 张雷; 张霓; 王坚
Original assignee: Beijing Sogou Technology Development Co Ltd
Current assignee: Beijing Sogou Technology Development Co Ltd
Priority date: 2013-05-17
Filing date: 2013-05-17
Publication date: 2014-11-26
Anticipated expiration: 2033-05-17
Also published as: CN104166462B

Abstract

本发明提供了一种文字的输入方法和系统，以解用户需要长时间才能查找到欲输入的候选项，并且输入效率较低的问题。所述的方法包括：接收编码字符串中目标音节对应输入的语音数据；其中，所述语音数据用于对所述目标音节所匹配的目标文字进行描述；将所述语音数据识别为自然语言文本；并通过语义分析从所述自然语言文本中提取出目标文字；将所述目标文字作为语义候选项，并结合语义候选项展示所述编码字符串对应的各候选项。

Description

一种文字的输入方法和系统

技术领域

本发明涉及输入法技术，特别是涉及一种文字的输入方法和系统。

背景技术

随着移动互联网技术的发展，输入法作为人和智能终端交互的工具其作用越来越重要。因此也产生了诸如五笔，拼音，笔画，双拼等多种输入方式，各种输入方式都在尽量用尽可能少的输入，输出尽可能多的文字，从而方便用户的输入。

当前越来越多的用户使用移动终端，移动终端为了便于携带，通常采用的是简化的键盘，即九键构成的键盘。在使用该九键键盘进行输入时，由于每个键位对应的字母较多，造成了通过键位输入一个编码字符串后，输入法会匹配多个同音或不同音的候选项。

在用户利用输入法输入的过程中，虽然匹配的候选项在排序上已经反应了用户使用各候选项的频率，但移动终端的候选项展示区域大小非常有限，对于排序靠后的候选项，用户需要不断翻页进行查找，导致用户需要长时间才能查找到欲输入的候选项，降低了输入效率。

发明内容

本发明实施例提供了一种文字的输入方法和系统，以解用户需要长时间才能查找到欲输入的候选项，并且输入效率较低的问题。

为了解决上述问题，本发明实施例公开了一种文字的输入方法，包括：

接收编码字符串中目标音节对应输入的语音数据；其中，所述语音数据用于对所述目标音节所匹配的目标文字进行描述；

将所述语音数据识别为自然语言文本；并通过语义分析从所述自然语言文本中提取出目标文字；

将所述目标文字作为语义候选项，并结合语义候选项展示所述编码字符串对应的各候选项。

可选的，所述通过语义分析从所述自然语言文本中提取出目标文字，包括：采用预置的分词词库对所述自然语言文本进行切分，确定所述自然语言文本的分词结果；采用语义模型对所述分词结果进行分析，从所述分词结果中提取出所述语音数据描述的目标文字。

可选的，所述采用预置的分词词库确定所述自然语言文本进行切分，确定所述自然语言文本的分词结果，包括：采用预置的分词词库对所述自然语言文本进行元素分析，确定至少一种备选切分结果；对每种备选切分结果进行概率计算，并将概率最大的切分结果作为分词结果。

可选的，所述采用语义模型对所述分词结果进行分析，从所述分词结果中提取出所述语音数据描述的目标文字，包括：通过所述语义模型对所述分词结果进行分析，提取出所述分词结果中的关键词和描述词；依据所述描述词对所述关键词进行修正，将修正后的关键词作为所述目标文字。

可选的，所述语义模型，包括以下至少一种：以词定字模型、拆分模型和语义筛选模型。

可选的，所述依据所述描述词对所述关键词进行修正，将修正后的关键词作为所述目标文字，包括：若所述语义模型为以词定字模型，则从所述描述词中查找所述关键词的同音词；将所述关键词修正为所述同音词，作为所述目标文字。

可选的，所述依据所述描述词对所述关键词进行修正，将修正后的关键词作为所述目标文字，包括：若所述语义模型为拆分模型，则对所述描述词进行构词组合，获取构成的文字；将所述关键词修正为所述构成的文字，作为所述目标文字。

可选的，所述依据所述描述词对所述关键词进行修正，将修正后的关键词作为所述目标文字，包括：若所述语义模型为语义筛选模型，则对所述描述词进行语义分析，筛选得到与描述词匹配的至少一个匹配文字；根据所述匹配文字分别对所述关键词进行修正，将修正后的关键词作为所述目标文字。

可选的，将所述目标文字作为语义候选项之前，还包括：计算所述目标文字与所述语音数据的关联度；则将所述目标文字作为语义候选项，并结合语义候选项展示所述编码字符串对应的各候选项，包括：将所述目标文字作为语义候选项；依据所述关联度将所述语义候选项与当前的候选项进行合并，构成所述编码字符串对应的候选项并展示。

相应的，本发明实施例还公开了一种文字的输入系统，包括：

接收模块，用于接收编码字符串中目标音节对应输入的语音数据；其中，所述语音数据用于对所述目标音节所匹配的目标文字进行描述；

识别并提取模块，用于将所述语音数据识别为自然语言文本；并通过语义分析从所述自然语言文本中提取出目标文字；

展示模块，用于将所述目标文字作为语义候选项，并结合语义候选项展示所述编码字符串对应的各候选项。

可选的，所述识别并提取模块，包括：切分子模块，用于采用预置的分词词库对所述自然语言文本进行切分，确定所述自然语言文本的分词结果；分析并提取子模块，用于采用语义模型对所述分词结果进行分析，从所述分词结果中提取出所述语音数据描述的目标文字。

可选的，所述切分子模块，包括：分析单元，用于采用预置的分词词库对所述自然语言文本进行元素分析，确定至少一种备选切分结果；结果确定单元，用于对每种备选切分结果进行概率计算，并将概率最大的备选切分结果作为分词结果。

可选的，所述分析并提取子模块，包括：分析并提取单元，用于通过所述语义模型对所述分词结果进行分析，提取出所述分词结果中的关键词和描述词；修正单元，用于依据所述描述词对所述关键词进行修正，将修正后的关键词作为所述目标文字。

可选的，所述修正单元，用于在所述语义模型为以词定字模型时，从所述描述词中查找所述关键词的同音词；将所述关键词修正为所述同音词，作为所述目标文字。

可选的，所述修正单元，用于在所述语义模型为拆分模型时，对所述描述词进行构词组合，获取构成的文字；将所述关键词修正为所述构成的文字，作为所述目标文字。

可选的，所述修正单元，用于在所述语义模型为语义筛选模型时，对所述描述词进行语义分析，筛选得到与描述词匹配的至少一个匹配文字；采用所述匹配文字分别对所述关键词进行修正，将修正后的关键词作为所述目标文字。

可选的，所述的系统还包括：关联度计算模块，用于计算所述目标文字与所述语音数据的关联度；则所述展示模块，包括：语义候选项确定子模块，用于将所述目标文字作为语义候选项；结合并展示子模块，用于将所述语义候选项与当前的候选项进行合并，构成所述编码字符串对应的候选项并展示。

与现有技术相比，本发明包括以下优点：

本发明输入语音数据对该目标音节匹配的目标文字进行语义描述，并将该语音数据识别为自然语言文本，进而提取出目标音节对应的目标文字并反馈给客户端，从而快速的获取用户想要输入的字词，提高了用户选取候选项的效率；并结合语义候选项展示所述编码字符串对应的各候选项，从而给用户提供更多样的匹配结果，进一步提高了用户的输入效率。

本发明实施例中采用语义模型对输入的自然语言进行语义分析，快速地从中提取了描述的目标文字，并将目标文字作为语义候选项，从而给用户提供更多样的匹配结果，增强了输入的扩展性，方便了用户的后续输入。

附图说明

图1是本发明实施例一提供的文字的输入方法流程图；

图2是本发明实施例一提供的文字的输入方法可选流程图；

图3是本发明实施例一提供的文字的输入方法中服务器的处理流程图；

图4是本发明实施例二提供的文字的输入系统结构图；

图5是本发明实施例二提供的文字的输入系统的第一种可选结构图；

图6是本发明实施例二提供的文字的输入系统中识别并提取模块的可选结构图；

图7是本发明实施例二提供的文字的输入系统的第二种可选结构图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例一

本发明实施例提供了一种文字的输入方法，在客户端进行文字输入时，若输入的编码字符串中目标音节所匹配的文字在候选项中排序靠后，不易查找，可以输入语音数据对该目标音节匹配的目标文字进行描述，将语音数据上传至服务器，服务器可以将该语音数据识别为自然语言文本，并通过对自然语言文本进行语义分析提取出目标文字，并将目标文字反馈给客户端，从而可以通过服务器快速的获取用户想要输入的候选项，节省了时间，提高了用户的输入效率。并且，客户端会将提取的目标文字作为语义候选项，并结合语义候选项展示所述输入的编码字符串对应的各候选项，从而给用户提供更多样的匹配结果，增强了输入的扩展性，方便了用户输入。

用户使用输入法进行文字输入时，输入法会根据目标音节对用户输入的编码字符串进行匹配，并显示候选项，若用户无法比较快速的从候选项中查找到想要输入的文字，可以通过输入语音数据，再通过语音数据快速的获取想要输入的文字。具体包括如下步骤：

参照图1，给出了本发明实施例一提供的文字的输入方法流程图。

步骤101，接收编码字符串中目标音节对应输入的语音数据。

其中，所述语音数据用于对所述目标音节所匹配的目标文字进行描述。

步骤102，将所述语音数据识别为自然语言文本；并通过语义分析从所述自然语言文本中提取出目标文字。

步骤103，将所述目标文字作为语义候选项，并结合语义候选项展示所述编码字符串对应的各候选项。

本发明实施例中，为了提高问题的输入速度，上述方法可以由客户端和服务器共同执行，即客户端在执行步骤101后可以将语音数据传输给服务器，然后服务器执行步骤102，再将该目标文字反馈给客户端，由客户端执行步骤103，展示各候选项供用户选择。从而可以通过客户端和服务器快速的实现文字输入。

但是，在其他实施例中，也存在一些特殊的情况，例如网络比较不稳定，数据传输速度较低，甚至客户端无法连接服务器等情况，因此上述步骤101至步骤103也可以仅由客户端完成，从而仅由客户端也可以快速的实现文字的输入。

综上，在文字输入时，若输入的编码字符串中目标音节所匹配的文字在候选项中不易查找，可以输入语音数据对该目标音节匹配的目标文字进行描述，然后将该语音数据识别为自然语言文本，并通过对自然语言文本进行语义分析提取出目标文字，从而快速的获取用户想要输入的候选项，节省了时间，提高了用户的输入效率。并且，可以将提取的目标文字作为语义候选项，并结合语义候选项展示所述输入的编码字符串对应的各候选项，从而给用户提供更多样的匹配结果，方便了用户输入。

下面，给出服务器和客户端的一种处理流程，以整体论述本实施例的文字输入方法。

参照图2，给出了本发明实施例一提供的文字的输入方法可选流程图。

步骤201，客户端对接收的编码字符串进行匹配，并展示匹配得到的各候选项。

客户端可以接收用户输入的编码字符串，然后对该编码字符串进行匹配，得到相应的候选项。将选定的音节作为目标音节，则目标音节至少对应于部分的编码字符串。

例如，在接收编码字符串并完成匹配后，可以展示各匹配的候选项，如音节为ji，对应匹配的候选项为“即、级、及、机、集……”。此时比较靠前的候选项中没有用户想要输入的目标文字“冀”，则可以将音节ji作为目标音节。

在此种情况下，本实施例结合用户输入的语音得到目标音节对应的候选项，即用户可以采用输入的语音数据对该目标音节所匹配的目标文字进行描述，即输入的编码字符串中目标音节对应的语音数据，然后将该语音数据发送给服务器，通过语音数据进行语义分析快速的确定目标文字。

步骤202，客户端接收编码字符串中目标音节对应输入的语音数据，并向服务器上传所述语音数据。

客户端接收该语音数据，本实施例中为通过移动终端的话筒输入的语音数据，并将该语音数据上传至服务器，通过服务器进行语音识别，其中，所述语音数据用于对目标音节所匹配的目标文字进行描述。

步骤203，服务器将所述语音数据识别为自然语言文本。

步骤204，服务器通过语义分析从所述自然语言文本中提取出目标文字，并将目标文字反馈给客户端；

服务器将接收到语音数据识别为自然语言文本后，可以通过语义分析从所述自然语言文本中提取出目标文字。如服务器在解析语音数据时，解析出的拼音串为“jin4cha2ji4de1ji4”，则对应自然语言文本为“晋察冀的及”，通过语义分析可以进行切分等操作，得到分词结果为“晋察冀”、“的”和“及”，再去掉停用词和无意义的虚词确定描述词为“晋察冀”，关键词为“及”，通过描述词对关键词进行校正，从而确定校验后的关键词为“冀”，即目标文字为“冀”。将“冀”作为返回结果反馈给客户端。

步骤205，客户端将所述目标文字作为语义候选项，并结合语义候选项展示所述编码字符串对应的各候选项。

然后客户端可以获取客户端反馈的目标文字，然后将目标文字作为语义候选项，并结合语义候选项对步骤101中原有匹配得到的候选项进行调整或合并，从而重新显示编码字符串对应的各候选项。

综上所述，在客户端进行文字输入时，若目标音节匹配的目标文字在候选项中不易查找，可以通过语音数据对该目标音节匹配的文字以自然语言的形式进行描述，再将目标音节上传至服务器，从而服务器可以将该语音数据识别成自然语言文本，并通过语义分析从该自然语言文本中识别出语音数据描述的该目标音节对应的目标文字，并反馈给客户端，从而可以通过服务器快速的获取用户想要输入的候选项，节省了用户查找候选项的时间，提高了文字输入效率。并且，客户端会将描述的目标文字作为语义候选项，结合语义候选项和原有编码字符串匹配得到的各候选项进行展示，从而给用户提供了更多样的编码字符串的匹配结果，方便了用户输入。

本实施例中，用户可以通过语音数据对想要输入的目标文字进行描述，对该语音数据进行语义分析，分析出用户所描述的目标文字，从而将目标文字排在各候选项的前面，下面给出服务器侧的处理流程，具体包括如下步骤：

参照图3，给出了本发明实施例一提供的文字的输入方法中服务器的处理流程图。

子步骤S301，将客户端上传的语音数据识别为自然语言文本。

在服务器在接收到客户端上传的语音数据后，会对该语音数据进行解析，即服务器会通过语音识别引擎对该语音数据进行语音识别，从而得到识别出的自然语言文本。可以理解的是该自然语言文本就是对客户端中目标音节匹配的文字进行描述的文字。

其中，语音识别引擎可以通过如下方法构建：

首先对获取的语音训练数据作为语料进行预处理（如去噪等），并将预处理完毕的数据进行特征提取，提取语音中各语音元素的特征；然后将特征提取之后的语音数据进行模型训练，如采用隐马尔可夫模型（Hidden MarkovModel，HMM）进行训练，从而形成模板库。在语音识别引擎经过足够多的训练之后，即可将客户端输入的语音数据进行特征提取之后输入至语音模型，语音模型会根据模型中的模板库对语音数据进行模式匹配，给出最优解的匹配结果，即概率最大的识别结果，从而获得该语音数据对应的自然语言文本。

由于语音元素之间并不是孤立存在的，包括字间的停顿，都可以成为分割语音片段的依据。而语音片段之间的关系，也决定了解析出的汉字的准确性。在采用语音识别引擎进行语音数据的识别时，如识别出自然语言文本“动物的那个它”时，语音识别系统会通过元素的读音和元素间的关系，给出正确的解析，并给出注音(dong4wu4de1na4ge4ta1)，其中4代表四声，1代表一声。Dong4wu4对应可以取出相关词条：“动物”、“动务”等，ta1对应可以获取到的文字：“他”、“她”、“它”等，然后对该自然语言文本进行语义分析时，根据大量的数据统计（如采用贝叶斯模型），“动物”和“它”的共现频率是最大的。所以语音识别的结果，即识别出的自然语言文本为“动物的那个它”。

其中，所述共现频率可以理解为两个词汇在依据话、一个段落或一篇文章中共同出现的频率。

本实施例中，服务器通过语音识别出语音数据对应的自然语言文本后，还会对该自然语言文本进行语义分析，以从该自然语言文本中获取描述的目标文字。具体如下：

在本发明一个可选实施例中，上述步骤204中服务器通过语义分词从所述自然语言文本中提取出目标文字，包括如下子步骤：

子步骤S302，采用预置的分词词库对所述自然语言文本进行切分，确定所述自然语言文本的分词结果。

由于自然语言文本可以对目标字节匹配的目标文字进行描述，因此其中通常存在一些可以进行描述的词汇，从而可以首先采用预置的分词词库对该自然语言文本进行切分，获取其中的各个词汇，即可以将该自然语言文本切分成至少两个分词，构成分词结果。

在本发明的一个可选实施例中，采用预置的分词词库确定所述自然语言文本进行切分，确定所述自然语言文本的分词结果，包括以下子步骤：采用预置的分词词库对所述自然语言文本进行元素分析，确定至少一种备选切分结果；对每种备选切分结果进行概率计算，并将概率最大的切分结果作为分词结果。

如上述解析出的自然语言文本为“计算机的计”，则可以采用分词词库对该自然语言文本进行元素分析，然后根据分析出的元素对其进行切分，获取到备选切分结果。其中，分词词库用于为分词算法提供分词的依据。本发明实施例中，元素可以是各词的词性，如名词、助词、形容词等，又如元素可以是构成句子的各部分，如主语、谓语、宾语等。因此在采用分词词库对自然语言文本时，如“计算机的计”中，可以分析出“计算机”为名词、“的”为助词，“计”是单独的一个字，可以认为是名词或其他词等。当然，在切分时不只有一种备选切分结果，也可能切分为“计”、“算”、“机”、“的”、“计”，每一个元素都是一种其他词。然后可以对每一种备选切分结果进行概率计算，即针对所述备选切分结果中每一个词，计算其切分的概率，从而得到切分成此种备选切分结果的概率，然后从各备选切分结果中获取概率最大的作为本次分词的分词结果，如分词结果为“计算机”、“的”、“计”。

通过上述方法，实现了对该自然语言文本的切分，从而可以获知该自然语言文本的结构，但是此时还不能确定描述的文字，因此需要进一步对分词结果进行分析以识别出描述的目标文字。

子步骤S303，采用语义模型对所述分词结果进行分析，从所述分词结果中提取出所述语音数据描述的目标文字。

采用语义模型对分词结果进行分析，通过语义分析分词结果中各词，以及词与词之间的关联关系，提取出自然语言文本中的关键词，并对该关键词进行校正，从而确定正确的文字，即为语音数据描述的目标文字，也即目标音节匹配的目标文字。

其中，语义模型用于基于语义对词的集合（至少两个词）、一段文字等自然语言文本进行分析和校正，以便获取其中的关键词。

在本发明另一个可选实施例中，服务器采用所述语义模型对所述分词结果进行分析，从所述分词结果中提取出所述语音数据描述的目标文字，包括以下子步骤：服务器通过所述语义模型对所述分词结果进行分析，提取出所述分词结果中的关键词和描述词；依据所述描述词对所述关键词进行修正，将修正后的关键词作为所述目标文字。

首先，通过语义模型对该分词结果进行分析，从而提取出分词结果中的关键词和描述词。其中，为了能够对匹配的文字进行描述，因此分词结果中的各词往往具有一定的关联关系，如具有解释、构造或包含等关系，如自然语言文本“计算机的计”分词结果为“计算机”、“的”、“计”，此时对该分词结果进行分析，其中，停用词、助词，如“的”可以认为是无意义的因此可以忽略，而“计算机”和“计”具有包含关系，从而可以认定被包含的是关键词，包含的是描述词，即关键词为“计”，描述词为“计算机”，当然对“计算机的计”进行语义分析时，由于“的”的分隔也可以认为“计算机”和“计”具有解释的关系，则被解释的“计”为关键词，解释的“计算机”为描述词。

其中，关键词与语音数据描述的目标文字相关，如该关键词与目标文字同音，如描述的文字是“计”，则其可以就是该描述的文字“计”，也可以同音字，从而对关键词进行修正可以得到描述的文字，如关键词为“即”，则后续通过修正可以确定描述的文字为“计”。

然后就可以采用描述词对关键词进行修正，将修正后的关键词作为所述语音数据描述的目标文字。例如可以计算关键词和描述词之间的关联度，从而依据关联度对关键词进行修正，或确定描述词中关键词的同音词，依据该同音词对关键词进行修正，即确定关键词正确与否，并确定正确的关键词。

其中，关联度是关键词和描述词之间相关的程度，可以根据语义分析的分析结果进行评价，本实施例中，采用语义模型中两者的共现频率进行衡量，也可以依据语义模型中分析两者意义的相近性进行度量。其中，语义模型可以通过机器学习的方法训练抓取得到的全网数据，并通过不断的迭代优化精度得到。

本发明实施例中，语义模型也可以根据应用场景的不同而不同对自然语言文本进行语义分析，因此语义模型可以包括以下至少一种：以词定字模型、拆分模型和语义筛选模型。

1）以词定字模型

以词定字模型用于根据描述词中的组成元素确定相应的关键词，如自然语言文本为“ABC的A”，其中A、B、C各代表一个字，并且ABC合在一起是个词条，“的”后方的“A”对应的音节“ei”与词条中的某个组成元素同音，则可以确定“A”对应的文字为A，又如自然语言文本为“DE的E”，其中D、E各代表一个字，DE合并在一起也是个词条，“的”后方的“E”对应的音节与词条中的某个组成元素同音，从而“E”对应的文字为E。

依据所述描述词对所述关键词进行修正，将修正后的关键词作为所述目标文字，包括以下子步骤：若所述语义模型为以词定字模型，则服务器从所述描述词的组成元素中查找所述关键词的同音词；将所述关键词修正为所述同音词，作为所述目标文字。

若语义模型为以词定字模型，在分析出关键词和描述词后，采用描述词对关键词进行修正时，由于其为以词定字模型，因此关键词往往应当与描述词具有强关联性，如关键词与描述词中的某些组成元素是同音词。因此可以从描述词中依次查找各元素，查找到与所述关键词的同音词，从而采用该同音词对关键词进行修正，即将所述关键词修正为该同音词，即所述同音词就是所述目标文字。

例如，若自然语言文本为“计算机的季”，分词结果为“计算机”、“的”、“季”，此时在描述词“计算机”的各字符中查找关键词“季”的同音词，将关键词“季”修正为所述同音词为“计”，然后采用修改后“计”作为关键词即作为目标文字。其中，本发明实施例中从“计算机”中获取同音字包括“计”和“机”，其中，“计”与关键词“季”同样为4声，“机”为1声，则“计”的关联度高于“机”的关联度，从而可以确定可以用于修正的同音词为“计”，则修正后的关键词为“计”，即确定“计”为目标文字。

2）拆分模型

拆分模型中包括既定的构词词典，从而通过构词词典可以以不同的字形特征构成相应的词汇、文字等。例如，针对汉字的构词词典，由于汉字是由部首构成的，简单汉字可能只有一个部首，如“言”，“人”等，而有些汉字可能需要至少两个部首才能构成，如“李”“张”等。为了对目标音节匹配的目标文字进行描述，有时用户可能会按照构词方法进行描述，如解析出自然语言文本为“木子李”，“弓长张”等，从而在此种情况下，就可以采用拆分模型中的构词词典，根据构词词典中的汉字的结构和字形特征对自然语言文本进行分析和校验。

依据所述描述词对所述关键词进行修正，将修正后的关键词作为所述目标文字，包括：若所述语义模型为拆分模型，则对所述描述词进行构词组合，获取构成的文字；将所述关键词修正为所述构成的文字，作为目标文字。

若语义模型为拆分模型，则在分析出关键词和描述词后，采用描述词对关键词进行修正时，由于其为拆分模型，通过对描述词进行构词可以获取关键词对应的正确文字，即正确的目标文字，因此可以对描述词进行构词组合，得到构成的文字，然后采用构成的文字对关键词进行修正，其中若关键词与所述构成的文字相同，则构成的文字即为修正后的关键词，将构成的文字作为目标文字。

如自然语言文本为“三金的那个鑫”，划分出的描述词为“三金”，关键词为“鑫”，采用拆分模型中的构词词典对描述词“三金”进行构词，根据既定的构词词典得到构成的文字为“鑫”，构成的文字与关键词一致，不用对关键词进行修正，当然，也可以配置为无论关键词与构成的文字是否一致，都进行修正，本发明实施例对此不作限定。从而得到构成的目标文字为“鑫”。

3）语义筛选模型

采用以词定字模型或拆分模型对分词结果进行分析时，语音数据对应的自然语言文本由于人们的习惯表述往往具有一定的格式，可通过模板的形式进行匹配，提取出同音词或构成的文字，进而将关键词修正为目标文字。但用户输入的语音数据往往不具备既定的格式，实际处理中并不能对于语音数据进行格式的限制，因此在不满足以词定字模型或拆分模型时，本发明实施例还提供了语义筛选模型，通过语义分析对描述词和关键词进行分析，从而确定修正后的关键词。

依据所述描述词对所述关键词进行修正，将修正后的关键词作为所述目标文字，包括：若所述语义模型为语义筛选模型，则对所述描述词进行语义分析，筛选得到与描述词匹配的至少一个匹配文字；根据所述匹配文字分别对所述关键词进行修正，将修正后的关键词作为所述目标文字。

若语义模型为语义筛选模型，则在分析出关键词和描述词后，采用描述词对关键词进行修正时，由于其为语义筛选模型，因此通过对描述词进行语义分析，根据分析结果确定至少一种匹配文字，如自然语言文本为“女的那个他”，则描述词为“女”、“的”、“那个”，关键词为“他”，从而服务器通过对抓取的全网海量数据的分析，去掉无意义的停用词“的”和“那个”，再通过语义分析“女”和“他”的读音“ta”的关系，读音“ta”应该指代是第三人称，可以从音节“ta”的候选项中得到匹配的人称指示代词为“他”、“它”或“她”，然后分别计算“女”和每一个匹配文字的关联度分值，确定“女”和“她”的关联度最大，则采用关联度最大的“她”对关键词“他”进行修正，即修正后的关键词为“她”，从而确定语音数据描述的目标文字为“她”。

通过上述语义模型对关键词和描述词进行分词，可以确定语音数据描述的目标文字，从而得到服务器确定的目标音节匹配的目标文字。

本发明实施例中，计算所述目标文字与所述语音数据的关联度；则将所述目标文字作为语义候选项，并结合语义候选项展示所述编码字符串对应的各候选项，包括：将所述目标文字作为语义候选项；依据所述关联度将所述语义候选项与当前的候选项进行合并，构成所述编码字符串对应的候选项并展示。

从而若由服务器和客户端共同完成上述方法，则服务器向客户端反馈语音数据描述的目标文字时，还可以反馈该文字的关联度，以更准确的确定该目标文字的展示位置，从而在本发明另一个可选实施例中，上述方法中服务器在向客户端进行反馈时，可以包括如下子步骤：

子步骤S304，服务器从语义模型中获取所述目标文字，以及所述目标文字与所述语音数据的关联度。

子步骤S305，将所述目标文字和所述关联度构成返回结果，并将所述返回结果反馈给客户端。

由于语音数据的质量各有不同，服务器的语义分析的能力也是有限度的，因此为了确保匹配的准确性，在确定该语音数据描述的目标文字后，还可以计算该目标文字与语音数据的关联度，其中若采用语音模型分析中已经计算出该文字的关联度，则可以不重复计算，然后将该所述描述的目标文字和关联度添加到返回结果中，然后从该返回结果获取目标文字和关联度反馈给客户端。

因此，在本发明的另一个可选实施例中，上述步骤205包括如下子步骤：客户端从所述返回结果中获取所述目标文字和所述关联度；将所述描述的文字作为语义候选项；依据所述关联度将所述语义候选项与当前的候选项进行合并，构成所述编码字符串对应的候选项并展示。

如上述步骤204中反馈给客户端的返回结果中为目标文字为“冀”，关联度为80%，从而可以将该目标文字“冀”作为候选项之一，并将显示在各候选项中第二个位置上，即显示各候选项为“即、冀、级、及、机、集……”。

实际处理中，依据所述关联度将所述语义候选项与所述客户端中当前的各候选项进行结合，构成所述编码字符串对应的各候选项并展示，包括以下几种方法：

1、仅展示编码字符串中目标音节对应的各候选项，依据关联度配置语义候选项的展示位置并进行展示，将语义候选项与已匹配完毕的字符结合，形成最终的待上屏文字。

用户输入编码字符串为“zhaobudaota”，其中“zhaobudao”已匹配为“找不到”，在客户端当前的候选项中没有目标音节“ta”对应目标文字，此时可以先选择部分匹配结果“找不到”，则待上屏区域的显示为“找不到ta”。通过录入语音数据解析出自然语言文本“动物的那个他”，通过语义分析得到目标文字为“它”，关联度为85%，从而客户端在得到返回结果后，可以将“它”作为语义候选项与已匹配的字符“找不到”结合，形成最终的待上屏文字。依据关联度可以将语义候选项“它”配置于候选项中较前的位置，如第一位或第二位。

2、展示编码字符串对应的各候选项，即将语义候选项与当前的候选项合并，构成用户输入的编码字符串对应的候选项，依据关联度配置编码字符串对应的候选项的展示位置并进行展示。

用户输入的编码字符串为“zhaobudaota”，其中“zhaobudao”候选项中，匹配为“找不到”时的关联度最高，在客户端当前的候选项中没有目标音节“ta”对应目标文字，此时可以不进行选择，则待上屏区域的显示为“zhaobudaota”。通过录入语音数据解析出自然语言文本“动物的那个他”，通过语义分析得到目标文字为“它”，关联度为85%，从而客户端在得到返回结果后，将语义候选项与当前的候选项合并作为用户输入的编码字符串的候选项，即将语义候选项“它”与当前的候选项中关联度最高的“找不到”合并，构成编码字符串对应的候选项“找不到它”，并依据关联度确定编码字符串的候选项“找不到它”的展示位置，如第一位等进行展示。

下面通过几个例子具体论述本实施例提供的方法：

1、拆分模型的应用

在输入法的客户端中接收输入“946”(九键状态下)，此时用户想用输入的音节为“xin”，即想得到“鑫”。但是候选项中首位是“因”，“鑫”的候选比较靠后，需要不断翻页进行查找。

用户可以触发语音输入，通过拆字输入格式，录入语音数据“金金金鑫”，客户端通过网络将语音数据发送到服务器。

服务器通过识别得到的自然语言文本“三金的鑫”，再通过构词词典分析得到目标文字“鑫”，并给出关联度90%。

服务器将“鑫”和关联度90%构成返回结果，通过网络返回给客户端。

客户端根据目标文字“鑫”对应的关联度，将目标文字“鑫”调整到编码字符串中对应的候选项的首候选进行显示。

2、语义筛选模型的应用

在输入法的客户端中接收输入“9468”(九键状态下)，此时用户想用输入的音节为“zhou”，即想得到“舟”。但是候选项中首位是“心疼”，“舟”的候选比较靠后，需要不断翻页进行查找。

用户可以触发语音输入，通过语义输入格式，录入语音数据“小船的那个舟”，客户端通过网络将语音数据发送到服务器。

服务器通过识别得到自然语言文本“小船的那个粥”。再通过语义分析，将关键字“粥”修正为“舟”，得到目标文字“舟”，并给出关联度60%。

服务器将目标文字“舟”和关联度60%构成返回结果，通过网络返回给客户端。

客户端根据目标文字“舟”对应的关联度，将目标文字“舟”调整到编码字符串中对应的候选项的首屏末位进行显示。

综上所述，本发明实施例中服务器可以将客户端上传的语音数据识别成自然语言文本，从而获取该语音数据对客户端中目标音节匹配的目标文字进行语义描述，再通过分词词库切分、采用语义模型进行语义分析等，从该自然语言文本中提取出目标文字，然后将该目标文字反馈给客户端，从而可以通过服务器快速的获取用户想要输入的字词，提高了用户选取候选项的效率。

其次，本发明实施例中服务器可以采用语义模型对分析结果进行分析，从而确定关键词和描述词，为了确保准确性，还可以采用描述词对关键词进行进一步的修正，从而可以将修正后的关键词作为目标文字，从而给用户提供更多样的匹配结果，增强了输入的扩展性，方便后续用户的输入。

再次，本发明实施例中语义模型包括以下至少一种：以词定字模型、拆分模型和语义筛选模型。从而可以为分词结果选择合适的语义模型，通过语义模型进行快速的分析、校验，在保证分析的准确率的基础上，提高分析的速度，提高效率。

本实施例提供了由客户端和服务器共同执行的过程，在其他实施例中，在网络不畅或是没有网络的环境下也可以由客户端单独执行上述过程，客户端调用本地存储的语音识别引擎和语义模型，对输入的语音数据进行识别，并将识别得到的自然语言文本进行语义分析，提取出目标文字，将目标文字直接作为语义候选项在编码字符串对应的各候选项中进行优先显示。客户端单独执行的具体执行逻辑与上述方法基本一致，因此不再赘述。

实施例二

参照图4，给出了本发明实施例二提供的文字的输入系统结构图。

相应的，本发明实施例还提供了一种文字的输入系统，

接收模块31，用于接收编码字符串中目标音节对应输入的语音数据；其中，所述语音数据用于对所述目标音节所匹配的目标文字进行描述；

识别并提取模块41，用于将所述语音数据识别为自然语言文本；并通过语义分析从所述自然语言文本中提取出目标文字；

展示模块32，用于将所述目标文字作为语义候选项，并结合语义候选项展示所述编码字符串对应的各候选项。

实际处理中，上述系统可以仅配置于客户端中，在网络不畅或是没有网络的环境下也可以由客户端单独执行上述过程，客户端通过识别并提取模块41调用本地存储的语音识别引擎和语义模型，对接收模块31输入的语音数据进行识别，并将识别得到的自然语言文本进行语义分析，提取出目标文字，在展示模块32中将目标文字直接作为语义候选项在编码字符串对应的各候选项中进行优先显示。也可以如图5所示，由服务器4和客户端3构成该系统，其中：

客户端3包括：接收模块31和展示模块32。

服务器4包括：识别并提取模块41。

综上所述，在进行文字输入时，若编码字符串中目标音节匹配的文字在候选项中不易查找，可以输入语音数据对该目标音节匹配的目标文字进行描述，从而可以将该语音数据识别为自然语言文本，并通过语义分析提取出目标文字，快速的获取用户想要输入的字词，节省时间，提供输入的效率。并且，还可以将目标文字作为语义候选项，并结合语义候选项展示所述编码字符串对应的各候选项，从而给用户提供更多样的匹配结果，方便用户输入。

参照图6，给出了本发明实施例二提供的文字的输入系统中识别并提取模块的可选结构图。

在本发明一个可选实施例中，识别并提取模块41具有如下结构：

识别并提取模块41，包括：

切分子模块411，用于采用预置的分词词库对所述自然语言文本进行切分，确定所述自然语言文本的分词结果；

分析并提取子模块412，用于采用语义模型对所述分词结果进行分析，从所述分词结果中提取出所述语音数据描述的目标文字。

可选的，所述切分子模块411，包括：

分析单元4111，用于采用预置的分词词库对所述自然语言文本进行元素分析，确定至少一种备选切分结果；

结果确定单元4112，用于对每种备选切分结果进行概率计算，并将概率最大的备选切分结果作为分词结果。

可选的，所述分析并提取子模块412，包括：

分析并提取单元4121，用于通过所述语义模型对所述分词结果进行分析，提取出所述分词结果中的关键词和描述词；

修正单元4122，用于依据所述描述词对所述关键词进行修正，将修正后的关键词作为所述目标文字。

可选的，所述修正单元4122，用于在所述语义模型为以词定字模型时，从所述描述词中查找所述关键词的同音词；将所述关键词修正为所述同音词，作为所述目标文字。

可选的，所述修正单元4122，用于在所述语义模型为拆分模型时，则对所述描述词进行构词组合，获取构成的文字；将所述关键词修正为所述构成的文字，作为所述目标文字。

可选的，所述修正单元4122，用于在所述语义模型为语义筛选模型时，对所述描述词进行语义分析，筛选得到与描述词匹配的至少一个匹配文字；采用所述匹配文字分别对所述关键词进行修正，将修正后的关键词作为所述目标文字。

参照图7，给出了本发明实施例二提供的文字的输入系统的第二种可选结构图。

可选的，所述系统还包括：

关联度计算模块42，用于计算所述目标文字与所述语音数据的关联度；

展示模块32，包括：

语义候选项确定子模块321，用于将所述目标文字作为语义候选项；

展示子模块322，用于将所述语义候选项与当前的各候选项进行合并，构成所述编码字符串对应的候选项并展示。

其中，若是由客户端3和服务器4构成该文字的输入系统，则上述关联度计算模块42可以配置于服务器4中。

综上所述，本发明实施例中服务器可以将客户端上传的语音数据解析成自然语言文本，从而获取该语音数据对客户端中目标音节匹配的目标文字的描述，再通过分词词库切分、采用语义模型进行语义分析等处理，从该自然语言文本中提取出目标文字，然后将该目标文字反馈给客户端，从而可以通过服务器快速的获取用户想要输入的字词，节省时间，提供输入的效率。

对于系统实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上对本发明所提供的一种文字输入方法和系统，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种文字的输入方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述通过语义分析从所述自然语言文本中提取出目标文字，包括：

采用预置的分词词库对所述自然语言文本进行切分，确定所述自然语言文本的分词结果；

采用语义模型对所述分词结果进行分析，从所述分词结果中提取出所述语音数据描述的目标文字。

3.根据权利要求2所述的方法，其特征在于，所述采用预置的分词词库确定所述自然语言文本进行切分，确定所述自然语言文本的分词结果，包括：

采用预置的分词词库对所述自然语言文本进行元素分析，确定至少一种备选切分结果；

对每种备选切分结果进行概率计算，并将概率最大的切分结果作为分词结果。

4.根据权利要求2或3所述的方法，其特征在于，所述采用语义模型对所述分词结果进行分析，从所述分词结果中提取出所述语音数据描述的目标文字，包括：

通过所述语义模型对所述分词结果进行分析，提取出所述分词结果中的关键词和描述词；

依据所述描述词对所述关键词进行修正，将修正后的关键词作为所述目标文字。

5.根据权利要求4所述的方法，其特征在于，所述语义模型，包括以下至少一种：以词定字模型、拆分模型和语义筛选模型。

6.根据权利要求5所述的方法，其特征在于，所述依据所述描述词对所述关键词进行修正，将修正后的关键词作为所述目标文字，包括：

若所述语义模型为以词定字模型，则从所述描述词中查找所述关键词的同音词；

将所述关键词修正为所述同音词，作为所述目标文字。

7.根据权利要求5所述的方法，其特征在于，所述依据所述描述词对所述关键词进行修正，将修正后的关键词作为所述目标文字，包括：

若所述语义模型为拆分模型，则对所述描述词进行构词组合，获取构成的文字；

将所述关键词修正为所述构成的文字，作为所述目标文字。

8.根据权利要求5所述的方法，其特征在于，所述依据所述描述词对所述关键词进行修正，将修正后的关键词作为所述目标文字，包括：

若所述语义模型为语义筛选模型，则对所述描述词进行语义分析，筛选得到与描述词匹配的至少一个匹配文字；

根据所述匹配文字分别对所述关键词进行修正，将修正后的关键词作为所述目标文字。

9.根据权利要求1或2所述的方法，其特征在于，将所述目标文字作为语义候选项之前，还包括：

计算所述目标文字与所述语音数据的关联度；

则将所述目标文字作为语义候选项，并结合语义候选项展示所述编码字符串对应的各候选项，包括：

将所述目标文字作为语义候选项；

依据所述关联度将所述语义候选项与当前的候选项进行合并，构成所述编码字符串对应的候选项并展示。

10.一种文字的输入系统，其特征在于，包括：

11.根据权利要求10所述的系统，其特征在于，所述识别并提取模块，包括：

切分子模块，用于采用预置的分词词库对所述自然语言文本进行切分，确定所述自然语言文本的分词结果；

分析并提取子模块，用于采用语义模型对所述分词结果进行分析，从所述分词结果中提取出所述语音数据描述的目标文字。

12.根据权利要求11所述的系统，其特征在于，所述切分子模块，包括：

分析单元，用于采用预置的分词词库对所述自然语言文本进行元素分析，确定至少一种备选切分结果；

结果确定单元，用于对每种备选切分结果进行概率计算，并将概率最大的备选切分结果作为分词结果。

13.根据权利要求11或12所述的系统，其特征在于，所述分析并提取子模块，包括：

分析并提取单元，用于通过所述语义模型对所述分词结果进行分析，提取出所述分词结果中的关键词和描述词；

修正单元，用于依据所述描述词对所述关键词进行修正，将修正后的关键词作为所述目标文字。

14.根据权利要求13所述的系统，其特征在于，所述语义模型，包括以下至少一种：以词定字模型、拆分模型和语义筛选模型。

15.根据权利要求14所述的系统，其特征在于，所述修正单元，用于在所述语义模型为以词定字模型时，从所述描述词中查找所述关键词的同音词；将所述关键词修正为所述同音词，作为所述目标文字。

16.根据权利要求14所述的系统，其特征在于，所述修正单元，用于在所述语义模型为拆分模型时，对所述描述词进行构词组合，获取构成的文字；将所述关键词修正为所述构成的文字，作为所述目标文字。

17.根据权利要求14所述的系统，其特征在于，所述修正单元，用于在所述语义模型为语义筛选模型时，对所述描述词进行语义分析，筛选得到与描述词匹配的至少一个匹配文字；采用所述匹配文字分别对所述关键词进行修正，将修正后的关键词作为所述目标文字。

18.根据权利要求10或11所述的系统，其特征在于，还包括：

关联度计算模块，用于计算所述目标文字与所述语音数据的关联度；

则所述展示模块，包括：

语义候选项确定子模块，用于将所述目标文字作为语义候选项；

结合并展示子模块，用于将所述语义候选项与当前的候选项进行合并，构成所述编码字符串对应的候选项并展示。