CN109799917A - 文字输入方法和装置 - Google Patents

文字输入方法和装置 Download PDF

Info

Publication number
CN109799917A
CN109799917A CN201910123788.8A CN201910123788A CN109799917A CN 109799917 A CN109799917 A CN 109799917A CN 201910123788 A CN201910123788 A CN 201910123788A CN 109799917 A CN109799917 A CN 109799917A
Authority
CN
China
Prior art keywords
input
string
coded string
user
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910123788.8A
Other languages
English (en)
Inventor
陈小帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin ByteDance Technology Co Ltd
Original Assignee
Tianjin ByteDance Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin ByteDance Technology Co Ltd filed Critical Tianjin ByteDance Technology Co Ltd
Priority to CN201910123788.8A priority Critical patent/CN109799917A/zh
Publication of CN109799917A publication Critical patent/CN109799917A/zh
Pending legal-status Critical Current

Links

Abstract

本公开提出一种文字输入方法和装置,其中,方法包括:接收用户输入的编码字符串;对所述编码字符串进行意图识别,获取符合用户输入意图的目标文字;将所述目标文字展示给所述用户。通过本方法,能够根据用户输入的编码字符串直接确定符合用户期望的文字,方便用户输入低频文字,提高低频文字的输入效率,解决现有技术中输入低频文字时的输入效率低的技术问题。

Description

文字输入方法和装置
技术领域
本公开涉及输入法技术领域,尤其涉及一种文字输入方法和装置。
背景技术
用户在使用输入法输入一些使用频率较低的文字时,若用户直接输入对应的拼音,输入法会将低频的文字排在高频文字的后面,用户需要多次翻页才能找到期望的文字,输入效率低。
目前,尚没有一种输入法能够提供比较直接的输入方式,以满足用户快速输入低频文字的输入需求。
发明内容
本公开提供一种文字输入方法和装置,解决现有技术中输入低频文字时的输入效率低的技术问题。
为此,本公开第一方面提出了一种文字输入方法,以根据用户输入的编码字符串直接确定符合用户期望的文字,方便用户输入低频文字,提高低频文字的输入效率,提升用户输入体验。
本公开第二方面提出了一种文字输入装置。
本公开第三方面提出了一种电子设备。
本公开第四方面提出了一种非暂态计算机可读存储介质。
本公开第五方面提出了一种计算机程序产品。
本公开第一方面实施例提出了一种文字输入方法,包括:
接收用户输入的编码字符串;
对所述编码字符串进行意图识别,获取符合用户输入意图的目标文字;
将所述目标文字展示给所述用户。
本公开实施例的文字输入方法,通过接收用户输入的编码字符串,对编码字符串进行意图识别,获取符合用户输入意图的目标文字,进而将目标文字展示给用户。由此,通过从用户输入的编码字符串中识别出用户的输入意图,基于输入意图确定目标文字展示给用户,实现了根据用户输入的编码字符串直接确定符合用户期望的文字,方便了用户输入低频文字,提高了低频文字的输入效率,提升了用户输入体验。
本公开第二方面实施例提出了一种文字输入装置,包括:
接收模块,用于接收用户输入的编码字符串;
获取模块,用于对所述编码字符串进行意图识别,获取符合用户输入意图的目标文字;
展示模块,用于将所述目标文字展示给所述用户。
本公开实施例的文字输入装置,通过接收用户输入的编码字符串,对编码字符串进行意图识别,获取符合用户输入意图的目标文字,进而将目标文字展示给用户。由此,通过从用户输入的编码字符串中识别出用户的输入意图,基于输入意图确定目标文字展示给用户,实现了根据用户输入的编码字符串直接确定符合用户期望的文字,方便了用户输入低频文字,提高了低频文字的输入效率,提升了用户输入体验。
本公开第三方面实施例提出了一种电子设备,包括:处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如第一方面实施例所述的文字输入方法。
本公开第四方面实施例提出了一种非暂态计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面实施例所述的文字输入方法。
本公开第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如第一方面实施例所述的文字输入方法。
本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1(a)为现有输入法输出的文字推荐列表示例图一;
图1(b)为现有输入法输出的文字推荐列表示例图二;
图2为本公开一实施例提出的文字输入方法的流程示意图;
图3为本公开实施例的文字输入方法输出的文字推荐列表示例图;
图4为本公开另一实施例提出的文字输入方法的流程示意图;
图5为本公开又一实施例提出的文字输入方法的流程示意图;
图6为本公开一实施例提出的文字输入装置的结构示意图;
图7为本公开另一实施例提出的文字输入装置的结构示意图;
图8为本公开又一实施例提出的文字输入装置的结构示意图;
图9为用于实现本公开实施例的电子设备的结构示意图;以及
图10为图示根据本公开的实施例的计算机可读存储介质的示意图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
下面参考附图描述本公开实施例的文字输入方法和装置。
当用户想要输入一些生僻字,或者用户想输入某个固定词汇下的字时,由于这些文字属于低频字,用户直接输入这些字的编码字符串(即拼音),输入法会将与该编码字符串对应的高频字显示在文字列表的前面,而将用户期望输入的低频字显示在后面,导致用户无法直接查找到期望输入的文字。例如,用户想要输入“魑魅魍魉”的“魅”,当用户输入编码字符串“mei”时,输入法会显示如图1(a)所示的文字推荐列表。从图1(a)中可以看出,用户期望输入的“魅”不会优先显示在文字推荐列表中,用户需要多次翻页才能查找到期望输入的文字。
目前的输入法均不能提供一种直接的选择输入方式,比如,当用户输入编码字符串“chimeiwangliangdemei”时,输入法返回的是对用户输入的编码字符串进行转换后的结果,如图1(b)所示,并不能直接输出“魅”字。
为了相对快捷地输入期望的文字,用户通常选择以词定字的方式实现低频字的输入,比如,用户期望输入“魑魅魍魉”的“魅”时,用户先输入完整的词条“魑魅魍魉”,再删除多余的文字“魑”、“魍”和“魉”,从而实现“魅”字的输入。
可见,现有的文字输入方式,不便于用户输入低频字,现有低频字的输入过程降低了输入效率。
针对上述问题,本公开提出了一种文字输入方法,以根据用户输入的编码字符串直接确定符合用户期望的文字,方便用户输入低频文字,提高低频文字的输入效率。
图2为本公开一实施例提出的文字输入方法的流程示意图,该方法可以由本公开实施例提出的文字输入装置执行,该文字输入装置可以安装于台式电脑、笔记本电脑、智能手机、平板电脑等支持文字输入的电子设备中。
如图2所示,该文字输入方法包括以下步骤:
步骤101,接收用户输入的编码字符串。
当电子设备检测到用户的输入需求时,比如用户打开了Word文档、用户点击了浏览器的搜索框等,此时,电子设备检测到用户当前存在输入需求,则电子设备控制文字输入装置启动,以使用户利用文字输入装置完成文字的输入。
本实施例中,当用户利用文字输入装置输入编码字符串时,文字输入装置获取用户的输入。其中,编码字符串可以是用户输入的拼音全拼,比如“chimeiwangliangdemei”,或者也可以是首字母组合,比如“cmwldm”,或者,也可以是全拼与首字母的混合输入,比如“chimwldemei”。编码字符串中包含了用户的输入意图,比如,当用户输入编码字符串“chimeiwangliangdemei”时,表明用户想要输入的是“魑魅魍魉”中的“魅”字。
步骤102,对编码字符串进行意图识别,获取符合用户输入意图的目标文字。
本实施例中,文字输入装置获取了用户输入的编码字符串之后,可以对获取的编码字符串进行意图识别,获取符合用户输入意图的目标文字。
举例而言,可以预先收集大量的训练样本对,用于对网络模型进行训练得到意图识别模型,其中,训练样本对包括包含用户输入意图的编码字符串和对应的文字,比如编码字符串“chimeiwangliangdemei”和文字“魅”构成一对训练样本对,编码字符串“balesitandele”和文字“勒”构成一对训练样本对。进而利用训练好的意图识别模型,可以获取与编码字符串对应的目标文字。比如,当获取的编码字符串为“balesitandele”时,可以获取到目标文字为“勒”。
步骤103,将目标文字展示给用户。
本实施例中,文字输入装置获取到符合用户输入意图的目标文字后,可以将目标文字展示在文字推荐列表中,以将目标文字展示给用户,以便于用户输入目标文字。
比如,当用户输入的编码字符串为“chimeiwangliangdemei”时,文字输入装置不仅展示“魑魅魍魉的美”等普通转换结果,还展示符合用户输入意图的文字“魅”,如图3所示。如图3所示,文字输入装置还可以对符合用户输入意图的目标文字以不同的颜色显示,以突出显示目标文字。
本实施例的文字输入方法,通过接收用户输入的编码字符串,对编码字符串进行意图识别,获取符合用户输入意图的目标文字,进而将目标文字展示给用户。由此,通过从用户输入的编码字符串中识别出用户的输入意图,基于输入意图确定目标文字展示给用户,实现了根据用户输入的编码字符串直接确定符合用户期望的文字,方便了用户输入低频文字,提高了低频文字的输入效率,提升了用户输入体验。
本公开实施例提出了多种方式来对编码字符串进行意图识别,获取符合用户输入意图的目标文字,下面将针对每种方式分别进行详细描述。
在本公开实施例一种可能的实现方式中,如图4所示,在如图2所示实施例的基础上,步骤102可以包括以下步骤:
步骤201,对编码字符串进行意图识别,从编码字符串中提取出词条编码字符串和目标编码字符串。
本实施例中,获取了用户输入的编码字符串之后,可以对编码字符串进行意图识别,从编码字符串中提取出词条编码字符串和目标编码字符串。
在本公开实施例一种可能的实现方式中,可以预先定义输入模板,比如输入模板定义为“XXXXdeYY”,其中,“XXXX”为词条对应的编码字符串,“YY”为意图输入部分的编码字符串。进而,从编码字符串中提取词条编码字符串和目标编码字符串时,可以将获取的编码字符串与输入模板进行匹配,判断编码字符串的输入模式是否与预设的输入模板匹配,若匹配,则按照输入模板,从编码字符串中提取出词条编码字符串和目标编码字符串。
举例而言,假设输入模板为“XXXXdeYY”,获取的编码字符串为“chimeiwangliangdemei”,将编码字符串与输入模板进行比较,获知编码字符串的输入模式与输入模板匹配,则根据输入模板的结构,从编码字符串中提取出“chimeiwangliang”作为词条编码字符串,从编码字符串中提取出“mei”作为目标编码字符串。
在本公开实施例一种可能的实现方式中,可以预先训练得到序列标注模型,利用序列标注模型从编码字符串中提取出词条编码字符串和目标编码字符串。具体地,在进行序列标注模型训练时,需要先构建训练语料,其中,训练语料中包括具备选择输入意图的编码字符串(作为正样本)和普通输入的编码字符串(作为负样本),通过人工标注的方式对训练语料中的编码字符串进行标注,比如,将“balesitandele”标注为具备选择输入意图的编码字符串,并将“balesitan”部分标注为词条编码字符串,将“le”标注为目标编码字符串,将“jintiantianqibucuo”标注为不具备选择输入意图的编码字符串。接着,利用标注好的训练语料对初始模型进行训练,得到序列标注模型,其中,初始模型比如可以为条件随机场(Conditional Random Field,CRF)模型、长短期记忆(Long-Short Term Memory,LSTM)模型、BiLSTM-CRF模型等。利用训练好的序列标注模型,可以对输入的编码字符串的各个位置进行类别标注,标注出编码字符串的词条编码字符串部分和目标编码字符串部分。
进而,获取了用户输入的编码字符串之后,文字输入装置将获取的编码字符串输入至预先训练的序列标注模型中,获取序列标注模型对编码字符串的标注信息,其中,标注信息包括词条编码字符串标签和目标编码字符串标签,分别用于标注出编码字符串的词条编码字符串部分和目标编码字符串部分。文字输入装置根据标注信息,从编码字符串中提取出词条编码字符串和目标编码字符串。例如,当获取的编码字符串为“chimeiwangliangdemei”时,利用预先训练的序列标注模型,可以获取到编码字符串的标注信息,其中,编码字符串中,“chimeiwangliang”被标注词条编码字符串标签,“mei”被标注目标编码字符串标签,进而根据标注结果,可以从编码字符串中提取出“chimeiwangliang”作为词条编码字符串,从编码字符串中提取出“mei”作为目标编码字符串。
需要说明的是,本公开实施例中,上述两种从编码字符串中提取出词条编码字符串和目标编码字符串的方式可以单独使用,也可以结合使用,比如,当通过输入模板无法提取出词条编码字符串和目标编码字符串时,可以再使用序列标注模型对编码字符串进行标注以提取出词条编码字符串和目标编码字符串,反之亦然。
步骤202,获取与词条编码字符串匹配的词条。
其中,获取与词条编码字符串匹配的词条时,可以采用现有的字符串转换为文字的方式,将词条编码字符串转换为对应的词条,本公开对此不作详细描述。
步骤203,根据目标编码字符串,从词条中获取与目标编码字符串匹配的文字作为目标文字。
作为一种示例,可以建立词条和词条编码字符串的对应关系,如表1所示,将目标编码字符串与词条编码字符串进行匹配,并将词条编码字符串中,与目标编码字符串匹配成功的字符串对应的文字,确定为目标文字。例如,目标编码字符串为“mei”,则确定目标文字为“魅”。
表1
词条编码字符串 chi mei wang liang
词条
本实施例的文字输入方法,通过对编码字符串进行意图识别,从编码字符串中提取出词条编码字符串和目标编码字符串,获取与词条编码字符串匹配的词条,根据目标编码字符串,从词条中获取与目标编码字符串匹配的文字作为目标文字,能够准确识别用户的输入意图,并获取符合用户输入意图的目标文字,提高了用户输入文字的速度和效率,提升了用户的输入体验。
在本公开实施例一种可能的实现方式中,如图5所示,在如图2所示实施例的基础上,步骤102之前,还可以包括以下步骤:
步骤301,获取用户的历史输入记录,并从历史输入记录中筛选出多个预设编码字符串和与每个预设编码字符串对应的候选文字。
本实施例中,可以搜集不同用户使用各个输入法时产生的历史输入记录,从历史输入记录中筛选出多个预设编码字符串和与每个预设编码字符串对应的候选文字。例如,可以从历史输入记录中筛选出用户“输入编码字符串-选择输入的候选文字-删除部分文字-剩余部分文字”的输入行为,从输入行为中挖掘出候选编码字符串和对应的候选文字。
举例而言,从历史输入记录中筛选出的输入行为有“chimeiwangliang-魑魅魍魉-删除魑魍魉-剩余魅”、“chimeiwangliang-魑魅魍魉-删除魅魍魉-剩余魑”,则可以确定候选编码字符串为“chimeiwangliang”,与其对应的候选文字包括“魑”和“魅”。
步骤302,利用多个预设编码字符串和候选文字,构建选择输入词库。
本实施例中,获取了多个预设编码字符串和与每个预设编码字符串对应的候选文字之后,即可利用多个预设编码字符串和对应的候选文字,构建选择输入词库。其中,选择输入词库中,同一个预设编码字符串可以对应至少一个候选文字。
在本公开实施例一种可能的实现方式中,在利用多个预设编码字符串和候选文字构建选择输入词库之前,还可以获取与同一预设编码字符串对应的各候选文字出现的次数,并从候选文字中剔除次数低于预设阈值的候选文字,得到剩余候选文字,其中,预设阈值可以预先设定,比如预设阈值设置为10次、20次等。进而,可以利用剩余候选文字和与剩余候选文字对应的预设编码字符串,构建选择输入词库。由于获取的预设编码字符串和对应的候选文字中,可能存在某一预设编码字符串对应的某个候选文字出现的次数较少,或者某个预设编码字符串对应的各个候选文字出现的次数都较少,通过预设阈值对预设编码字符串对应的候选文字进行过滤,仅保留出现次数较高的候选编码字符串和候选文字对,能够减少选择输入词库中存储的预设编码字符串与候选文字的对应关系的数量,从而降低后续将获取的编码字符串与选择输入词库进行匹配的计算量,提高确定目标文字的处理速度。
进而,如图5所示,步骤102可以包括以下步骤:
步骤303,将编码字符串与预先建立的选择输入词库进行匹配,其中,选择输入词库中存储预设编码字符串与候选文字的对应关系。
本实施例中,获取了用户输入的编码字符串之后,可以将编码字符串与预先建立的选择输入词库进行匹配,具体地,将获取的编码字符串与选择输入词库中存储的预设编码字符串进行匹配。
步骤304,若获知编码字符串与选择输入词库中的任一预设编码字符串匹配,则获取与预设编码字符串对应的候选文字作为目标文字。
本实施例中,当从选择输入词库中获取到与编码字符串匹配的预设编码字符串时,则根据选择输入词库中存储的预设编码字符串与候选文字的对应关系,获取与该预设编码字符串对应的候选文字作为目标文字,该目标文字即为符合用户输入意图的文字。
本实施例的文字输入方法,通过获取用户的历史输入记录,并从历史输入记录中筛选出多个预设编码字符串和与每个预设编码字符串对应的候选文字,利用多个预设编码字符串和候选文字,构建选择输入词库,将编码字符串与预先建立的选择输入词库进行匹配,其中,选择输入词库中存储预设编码字符串与候选文字的对应关系,在获知编码字符串与选择输入词库中的任一预设编码字符串匹配时,获取与该预设编码字符串对应的候选文字作为目标文字,能够准确识别用户的输入意图,并获取符合用户输入意图的目标文字,提高了用户输入文字的速度和效率,提升了用户的输入体验。
需要说明的是,图4和图5所示实施例的方法,可以单独使用以获取符合用户输入意图的目标文字,也可以结合使用获取符合用户输入意图的目标文字,比如,当采用图5所示的方法无法获取到与编码字符串对应的目标文字时,可以再使用图4所示的方法获取目标文字。
在本公开实施例一种可能的实现方式中,文字输入装置还支持用户从词条中选择符合输入意图的文字,比如,当用户想要输入“魅”时,用户可以输入编码字符串“chimeiwangliang”,文字输入装置在文字推荐列表中展示“魑魅魍魉”,用户可以基于3d-touch的重按力度触控“魑魅魍魉”中的“魅”,实现目标文字的输入。
在本公开实施例一种可能的实现方式中,可以在文字输入装置中设置“选择输入”功能选项,当该功能选项开启时,文字输入装置执行本公开的方案实现文字输入,当该功能选择关闭时,文字输入装置采用现有的字符串转换为文字的方式,将获取的编码字符串转换为文字并展示在文字推荐列表中,由用户查找期望的文字进行输入。由此,方便了用户选择不同的输入方式,提高了文字输入装置的使用灵活性。
为了实现上述实施例,本公开还提出一种文字输入装置。
图6为本公开一实施例提出的文字输入装置的结构示意图。
如图6所示,该文字输入装置40包括:接收模块410、获取模块420,以及展示模块430。
其中,接收模块410,用于接收用户输入的编码字符串。
获取模块420,用于对编码字符串进行意图识别,获取符合用户输入意图的目标文字。
展示模块430,用于将目标文字展示给用户。
在本公开实施例一种可能的实现方式中,如图7所示,在如图6所示实施例的基础上,获取模块420包括:
提取单元4201,用于对编码字符串进行意图识别,从编码字符串中提取出词条编码字符串和目标编码字符串。
在本公开实施例一种可能的实现方式中,提取单元4201用于判断编码字符串的输入模式是否与预设的输入模板匹配;若匹配,则按照输入模板,从编码字符串中提取出词条编码字符串和目标编码字符串。
在本公开实施例一种可能的实现方式中,提取单元4201用于将编码字符串输入预先训练的序列标注模型,获取序列标注模型对编码字符串的标注信息;根据标注信息,从编码字符串中提取出词条编码字符串和目标编码字符串。
第一获取单元4202,用于获取与词条编码字符串匹配的词条。
第二获取单元4203,用于根据目标编码字符串,从词条中获取与目标编码字符串匹配的文字作为目标文字。
在本公开实施例一种可能的实现方式中,如图8所示,在如图6所示实施例的基础上,该文字输入装置40包括:
词库构建模块400,用于获取用户的历史输入记录,并从历史输入记录中筛选出多个预设编码字符串和与每个预设编码字符串对应的候选文字;利用多个预设编码字符串和所述候选文字,构建选择输入词库。
在本公开实施例一种可能的实现方式中,词库构建模块400在利用多个预设编码字符串和候选文字,构建选择输入词库之前,还用于获取与同一预设编码字符串对应的各候选文字出现的次数;从候选文字中剔除次数低于预设阈值的候选文字,得到剩余候选文字。从而,词库构建模块400还用于利用剩余候选文字和与剩余候选文字对应的预设编码字符串,构建选择输入词库。
获取模块420包括:
匹配单元4211,用于将编码字符串与预先建立的选择输入词库进行匹配,其中,选择输入词库中存储预设编码字符串与候选文字的对应关系。
第三获取单元4212,用于在获知编码字符串与选择输入词库中的任一预设编码字符串匹配时,获取与预设编码字符串对应的候选文字作为目标文字。
需要说明的是,前述对文字输入方法实施例的解释说明也适用于该实施例的文字输入装置,其实现原理类似,此处不再赘述。
本公开实施例的文字输入装置,通过接收用户输入的编码字符串,对编码字符串进行意图识别,获取符合用户输入意图的目标文字,进而将目标文字展示给用户。由此,通过从用户输入的编码字符串中识别出用户的输入意图,基于输入意图确定目标文字展示给用户,实现了根据用户输入的编码字符串直接确定符合用户期望的文字,方便了用户输入低频文字,提高了低频文字的输入效率,提升了用户输入体验。
为了实现上述实施例,本公开还提出一种电子设备,包括:处理器和存储器。其中,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于实现如前述实施例所述的文字输入方法。
下面参考图9,其示出了适于用来实现本公开实施例的电子设备800的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图9示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图9所示,电子设备800可以包括处理装置(例如中央处理器、图形处理器等)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储装置808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有电子设备800操作所需的各种程序和数据。处理装置801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
通常,以下装置可以连接至I/O接口805:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置806;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置807;包括例如磁带、硬盘等的存储装置808;以及通信装置809。通信装置809可以允许电子设备800与其他设备进行无线或有线通信以交换数据。虽然图9示出了具有各种装置的电子设备800,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置809从网络上被下载和安装,或者从存储装置808被安装,或者从ROM 802被安装。在该计算机程序被处理装置801执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收用户输入的编码字符串;对所述编码字符串进行意图识别,获取符合用户输入意图的目标文字;将所述目标文字展示给所述用户。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该模块本身的限定,例如,接收模块还可以被描述为“接收用户输入的编码字符串的模块”。
为了实现上述实施例,本公开还提出一种非暂态计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如前述实施例所述的文字输入方法。
图10为图示根据本公开的实施例的计算机可读存储介质的示意图。如图10所示,根据本公开实施例的计算机可读存储介质300,其上存储有非暂态计算机可读指令310。当该非暂态计算机可读指令310由处理器运行时,执行前述的本公开各实施例的文字输入方法的全部或部分步骤。
为了实现上述实施例,本公开还提出一种计算机程序产品,当该计算机程序产品中的指令由处理器执行时,实现如前述实施例所述的文字输入方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本公开各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种文字输入方法,其特征在于,包括:
接收用户输入的编码字符串;
对所述编码字符串进行意图识别,获取符合用户输入意图的目标文字;
将所述目标文字展示给所述用户。
2.如权利要求1所述的方法,其特征在于,所述对所述编码字符串进行意图识别,获取符合用户输入意图的目标文字,包括:
对所述编码字符串进行意图识别,从所述编码字符串中提取出词条编码字符串和目标编码字符串;
获取与所述词条编码字符串匹配的词条;
根据所述目标编码字符串,从所述词条中获取与所述目标编码字符串匹配的文字作为目标文字。
3.如权利要求2所述的方法,其特征在于,所述对所述编码字符串进行意图识别,从所述编码字符串中提取出词条编码字符串和目标编码字符串,包括:
判断所述编码字符串的输入模式是否与预设的输入模板匹配;
若匹配,则按照所述输入模板,从所述编码字符串中提取出所述词条编码字符串和所述目标编码字符串。
4.如权利要求2所述的方法,其特征在于,所述对所述编码字符串进行意图识别,从所述编码字符串中提取出词条编码字符串和目标编码字符串,包括:
将所述编码字符串输入预先训练的序列标注模型,获取所述序列标注模型对所述编码字符串的标注信息;
根据所述标注信息,从所述编码字符串中提取出所述词条编码字符串和所述目标编码字符串。
5.如权利要求1所述的方法,其特征在于,所述对所述编码字符串进行意图识别,获取符合用户输入意图的目标文字,包括:
将所述编码字符串与预先建立的选择输入词库进行匹配,其中,所述选择输入词库中存储预设编码字符串与候选文字的对应关系;
若获知所述编码字符串与所述选择输入词库中的任一所述预设编码字符串匹配,则获取与所述预设编码字符串对应的候选文字作为所述目标文字。
6.如权利要求5所述的方法,其特征在于,在所述将所述编码字符串与预先建立的选择输入词库进行匹配之前,还包括:
获取用户的历史输入记录,并从所述历史输入记录中筛选出多个预设编码字符串和与每个预设编码字符串对应的候选文字;
利用所述多个预设编码字符串和所述候选文字,构建所述选择输入词库。
7.如权利要求6所述的方法,其特征在于,在所述利用所述多个预设编码字符串和所述候选文字,构建所述选择输入词库之前,还包括:
获取与同一预设编码字符串对应的各候选文字出现的次数;
从所述候选文字中剔除所述次数低于预设阈值的候选文字,得到剩余候选文字;
所述利用所述多个预设编码字符串和所述候选字符,构建所述选择输入词库,包括:
利用所述剩余候选文字和与所述剩余候选文字对应的预设编码字符串,构建所述选择输入词库。
8.一种文字输入装置,其特征在于,包括:
接收模块,用于接收用户输入的编码字符串;
获取模块,用于对所述编码字符串进行意图识别,获取符合用户输入意图的目标文字;
展示模块,用于将所述目标文字展示给所述用户。
9.一种电子设备,其特征在于,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-7中任一项所述的文字输入方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的文字输入方法。
CN201910123788.8A 2019-02-19 2019-02-19 文字输入方法和装置 Pending CN109799917A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910123788.8A CN109799917A (zh) 2019-02-19 2019-02-19 文字输入方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910123788.8A CN109799917A (zh) 2019-02-19 2019-02-19 文字输入方法和装置

Publications (1)

Publication Number Publication Date
CN109799917A true CN109799917A (zh) 2019-05-24

Family

ID=66560997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910123788.8A Pending CN109799917A (zh) 2019-02-19 2019-02-19 文字输入方法和装置

Country Status (1)

Country Link
CN (1) CN109799917A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111325031A (zh) * 2020-02-17 2020-06-23 北京字节跳动网络技术有限公司 简历解析方法及装置
CN112684907A (zh) * 2020-12-24 2021-04-20 科大讯飞股份有限公司 一种文本输入方法、装置、设备及存储介质
CN112684907B (zh) * 2020-12-24 2024-04-26 科大讯飞股份有限公司 一种文本输入方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104166462A (zh) * 2013-05-17 2014-11-26 北京搜狗科技发展有限公司 一种文字的输入方法和系统
CN105224666A (zh) * 2015-10-08 2016-01-06 广东欧珀移动通信有限公司 一种输入方法、装置以及终端
CN107247519A (zh) * 2017-08-16 2017-10-13 北京搜狗科技发展有限公司 一种输入方法及装置
CN108241438A (zh) * 2016-12-23 2018-07-03 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104166462A (zh) * 2013-05-17 2014-11-26 北京搜狗科技发展有限公司 一种文字的输入方法和系统
CN105224666A (zh) * 2015-10-08 2016-01-06 广东欧珀移动通信有限公司 一种输入方法、装置以及终端
CN108241438A (zh) * 2016-12-23 2018-07-03 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN107247519A (zh) * 2017-08-16 2017-10-13 北京搜狗科技发展有限公司 一种输入方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111325031A (zh) * 2020-02-17 2020-06-23 北京字节跳动网络技术有限公司 简历解析方法及装置
CN111325031B (zh) * 2020-02-17 2023-06-23 抖音视界有限公司 简历解析方法及装置
CN112684907A (zh) * 2020-12-24 2021-04-20 科大讯飞股份有限公司 一种文本输入方法、装置、设备及存储介质
CN112684907B (zh) * 2020-12-24 2024-04-26 科大讯飞股份有限公司 一种文本输入方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN107220235B (zh) 基于人工智能的语音识别纠错方法、装置及存储介质
CN108984683B (zh) 结构化数据的提取方法、系统、设备及存储介质
CN109165384A (zh) 一种命名实体识别方法及装置
CN108170773A (zh) 新闻事件挖掘方法、装置、计算机设备和存储介质
CN108170859A (zh) 语音查询的方法、装置、存储介质及终端设备
CN108009228A (zh) 一种内容标签的设置方法、装置及存储介质
CN108062388A (zh) 人机对话的回复生成方法和装置
CN103777774B (zh) 终端装置及输入法的文字纠错方法
CN108536803A (zh) 歌曲推荐方法、装置、设备及计算机可读介质
US20220147835A1 (en) Knowledge graph construction system and knowledge graph construction method
CN110309275A (zh) 一种对话生成的方法和装置
CN104965834B (zh) 字体显示方法和装置
CN108305050A (zh) 报案信息及服务需求信息的提取方法、装置、设备及介质
CN107885888A (zh) 信息处理方法及装置、终端设备以及计算机可读存储介质
CN108563655A (zh) 基于文本的事件识别方法和装置
CN112749547A (zh) 文本分类器训练数据的产生
CN105117380A (zh) 粘贴处理方法及装置
CN111753551A (zh) 基于词向量生成模型的信息生成方法和装置
CN109284367B (zh) 用于处理文本的方法和装置
CN112489676A (zh) 模型训练方法、装置、设备及存储介质
CN111767740A (zh) 音效添加方法和装置、存储介质和电子设备
CN111178056A (zh) 基于深度学习的文案生成方法、装置及电子设备
CN109726380A (zh) 表格编辑方法及装置
CN109389660A (zh) 图像生成方法和装置
CN109389365A (zh) 多人协作式文档的处理方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190524

RJ01 Rejection of invention patent application after publication