CN103353824A - 语音输入字符串的方法、装置和终端设备 - Google Patents

语音输入字符串的方法、装置和终端设备 Download PDF

Info

Publication number
CN103353824A
CN103353824A CN201310239630XA CN201310239630A CN103353824A CN 103353824 A CN103353824 A CN 103353824A CN 201310239630X A CN201310239630X A CN 201310239630XA CN 201310239630 A CN201310239630 A CN 201310239630A CN 103353824 A CN103353824 A CN 103353824A
Authority
CN
China
Prior art keywords
substring
character string
information
phonetic entry
divided
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310239630XA
Other languages
English (en)
Other versions
CN103353824B (zh
Inventor
刘俊启
张琳琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310239630.XA priority Critical patent/CN103353824B/zh
Publication of CN103353824A publication Critical patent/CN103353824A/zh
Application granted granted Critical
Publication of CN103353824B publication Critical patent/CN103353824B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种语音输入字符串的方法、装置和终端设备,其中所述语音输入字符串的方法包括:接收用户输入的语音信号;将语音信号转换为对应的字符串;将所述字符串划分为至少两个子字符串;分别获取各子字符串对应的子字符串显示信息;按各子字符串在所述字符串中的排列顺序依次显示各子字符串对应的子字符串显示信息。本发明使得识别得到的字符串可以以动态方式在输入框中显示,使得识别结果上下文承上启下,连续性更强,方便用户阅读和检查。

Description

语音输入字符串的方法、装置和终端设备
技术领域
本发明涉及计算机技术,尤其涉及一种语音输入字符串的方法、装置和终端设备。
背景技术
随着计算技术的发展,语音识别技术为终端设备提供了全新的人机交互接口,用户可以通过语音输入信息,例如,文字和操作指令,由此极大地提高了人机交互的便捷性。
现有的语音输入方法通常等待用户语音输入结束后,对输入的语音信号进行语音识别,将识别得到的字符串直接在输出显示窗口显示。在用户输入长句时,由于输入内容较多,直接将识别得到的字符串输出到显示窗口表现能力较弱,不方便用户阅读和检查是否需要修改,同时,用户对于设备的掌控感较差。
发明内容
有鉴于此,本发明实施例的目的在于提出一种语音输入字符串的方法、装置和终端设备,使得进行语音输入时,用户输入的信息能够分步显示输出,方便用户阅读和检查,同时,提高用户对输入的掌控感,增强客户使用体验。
第一方面,本发明实施例提供了一种语音输入字符串的方法,所述方法包括:
接收用户输入的语音信号;
将语音信号转换为对应的字符串;
将所述字符串划分为至少两个子字符串;
分别获取各子字符串对应的子字符串显示信息;
按各子字符串在所述字符串中的排列顺序依次显示所述子字符串各子字符串对应的子字符串显示信息。
第二方面,本发明实施例提供了一种语音输入字符串的装置,所述装置包括:
接收单元,用于接收用户输入的语音信号;
转换单元,用于将语音信号转换为对应的字符串;
划分单元,用于将所述字符串划分为至少两个子字符串;
显示信息获取单元,用于分别获取各子字符串对应的子字符串显示信息;
显示单元,用于按各子字符串在所述字符串中的排列顺序依次显示所述子字符串各子字符串对应的子字符串显示信息。
第三方面,本发明实施例还提供一种终端设备,其包括语音采集装置以及如上第二方面所述的语音输入字符串的装置。
本发明实施例通过将识别得到的字符串划分为多个子字符串,并以动态方式按照子字符串在所述字符串中的排列顺序依次显示各子字符串,由此,识别得到的字符串可以以动态方式在输入框中显示,使得识别结果上下文承上启下,连续性更强,方便用户阅读和检查,同时,提高用户对输入的掌控感,增强客户使用体验,避免了用户由于阅读和检查不方便造成的反复不必要操作。
附图说明
图1是本发明第一实施例的语音输入字符串的方法的流程图;
图2是现有技术语音输入字符串的显示效果示意图;
图3a-3c是本发明第一实施例的一个优选实施方式的语音输入字符串的显示效果示意图;
图4是本发明第一实施例的子字符串沿曲线以旋转方式移动到最终显示位置的效果示意图;
图5是本发明第一实施例的一个优选实施方式的语音输入字符串的显示效果示意图;
图6是本发明第一实施例的一个优选实施方式中显示子字符串的当前状态信息和/或解释信息的示意图;
图7a-7d是本发明第一实施例的一个优选实施方式中利用图像表示子字符串的示意图;
图8是本发明第二实施例的语音输入字符串的方法的流程图;
图9是本发明第三实施例的语音输入字符串的方法的流程图;
图10是本发明第四实施例的语音输入字符串的装置的结构示意图;
图11是可以实施本发明实施例的终端设备的示意图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
图1是本发明第一实施例的语音输入字符串的方法的流程图。如图1所示,所述方法包括:
步骤110、接收用户输入的语音信号。
具体地,可以通过语音采集装置采集用户语音模拟信号,经过数模转换将语音模拟信号转换为语音数字信号。所述数模转换可以通过独立的数模转换器实现,也可以通过各类可编程器件实现。
步骤120、将语音信号转换为对应的字符串。
在本步骤,可以通过任何现有的语音识别技术将语音信号转换为对应的字符串。在本实施例中,“字符串”是指由包括至少两个按顺序排列的字符组成的字符序列,其中,字符可以是数字、任意语言的字母(例如,英文字母、希腊字母等)或字(例如中文的字)、符号(例如标点符号)等。通过语音识别,可以获取语音信号所表达的语言要素对应的字符串,转换获得的字符串表达与语音信号表达的相同的含义。
步骤130、将所述字符串划分为至少两个子字符串。
在本步骤中可以根据各种预定的形式或规则来进行字符串的划分。本实施例中,所述“子字符串”是指用于组成字符串的连续的字符组合,其可以为多个连续字符的组合,也可以为单个字符。
在本实施例的一个优选实施方式中,可以对字符串进行语义分析,根据语义分析规则将所述字符串划分为至少两个子字符串,所述子字符串为构成字符串的语义单元。例如,当字符串为中文长句时,可以根据语义分析将其划分为至少两个短句。当然,也可以根据语义分析将语句划分为更加小的单元,例如,将语句划分为至少两个短语或词。通过语义分析规则进行划分,灵活性强,可以进行不同层次的子字符串划分和获取。
在本实施例的另一个优选实施方式中,可以根据语音信号中的停顿将所述字符串划分为至少两个子字符串。例如,当字符串为中文长句“今天是星期六,天气很好,我和小丽准备去爬山”时,各个短句之间会有停顿,根据语音信号的短暂停顿即可将上述中文长句划分为“今天是星期六”、“天气很好”、“我和小丽准备去爬山”等三个短句。通过语音信号停顿来进行划分效率较语义分析更高,可以节省系统计算资源。
在本实施例的另一个优选实施方式中,直接根据所识别的字符串的语言种类将字符串划分为对应的语言种类的最小组成单元(字母或字),也即,划分得到的子字符串为由一个字符组成的子字符串,例如,对于中文语句“我和小丽准备去爬山”,可以将其划分为“我”、“和”、“小”、“丽”、“准”、“备”、“去”“爬”、“山”九个子字符串,每个子字符串仅包括一个中文字。直接将字符串划分为仅包括一个字符的子字符串,效率高,可以用于后续模拟用户打字输入的显示方式,在节省系统计算资源的同时,可以方便用户逐字符阅读和检查。
当然,本领域技术人员可以理解,以上仅以中文语句作为示例进行说明,但上述对于字符串的划分原则及方式也可以适用于基于其它语言的语句,例如,英文,日文等。举例来说,对于英文语句“What’s up”,可以根据语义分析将其划分为“What”、“’s”、“up”三个词,也可以将其划分为英文字母。
步骤140、分别获取各子字符串对应的子字符串显示信息。
步骤150、按各子字符串在所述字符串中的排列顺序依次显示所述子字符串各子字符串对应的子字符串显示信息。
在划分获取到组成字符串的各子字符串后,可以根据获得的各子字符串分别获取其对应的子字符串显示信息,所述子字符串显示信息可以是子字符串本身也可以是包含子字符串所表述信息的动画,还可以是与子字符串表述的实体相关的信息,通过子字符串显示信息的依次显示可以实现字符串的动态显示,由于子字符串显示信息逐个动态显示,使得用户可以随着动态显示的过程阅读和检查转换得到的子字符串是否满足要求。
图2为现有技术中语音输入字符串的显示效果示意图。如图2所示,现有技术中,通常将转换得到的字符串(例如,图2中所示的中文长句“今天是星期六,天气很好,我和小丽准备去爬山”)直接整体显示在字符串显示输入框中。这样,当句子较长时,用户阅读和检查并不方便。而本实施例将字符串划分为至少两个子字符串,并对子字符串按顺序依次动态显示。
而在本实施例的一个优选实施方式中,如图3a-3c所示,所述子字符串显示信息包括子字符串沿预定轨迹以预定方式移动到子字符串显示位置的动画。图3a-3c以字符串为中文长句“今天是星期六,天气很好,我和小丽准备去爬山”被划分为“今天是星期六,”、“天气很好,”、“我和小丽准备去爬山”三个短句为例。在步骤140,对于说三个子字符串分别获取其由输入框下端沿直线轨迹向顶端最终的显示位置以平移方式移动的动画,然后,在步骤150,顺序显示这三个动画。如图3a所示,其显示了第一子字符串“今天是星期六,”的动态显示动画,第一子字符串“今天是星期六,”从输入框下端沿直线轨迹向顶端其最终的显示位置平移,直到移动到其位于输入框顶端的显示位置。
然后,如图3b所示,第二子字符串“天气很好,”从输入框下端沿直线轨迹向输入框上部其最终的显示位置平移,直到移动到第一子字符串的下方停止。
最后,如图3c所示,第三子字符串“我和小丽准备去爬山”从输入框下端沿直线轨迹向输入框上部其最终的显示位置平移,直到移动到第二子字符串的下方停止。
其中,第一子字符串、第二子字符串和第三子字符串的显示动画之间可以间隔预定的时间间隔。
当然,以上以由下至上的直线轨迹作为轨迹,以平移作为移动方式来示例性说明本实施方式的动态显示方式。本领域技术人员可以理解,所述轨迹和移动方式均可以根据需要进行修改和设定。例如,所述轨迹可以是由输入框某个角到最终显示位置的曲线(例如波浪线或抛物线),也可以是由输入框左端到子字符串最终显示位置的曲线,移动方式也可以是子字符串按照不同的轴翻转移动或旋转移动,由此进一步丰富显示的效果。当然,在必要时,也可以提供人机交互界面供用户对动画中的轨迹和移动方式进行设定。
图4提供了“今天是星期六”这一子字符串沿曲线以旋转方式移动到最终显示位置的效果示意图。如图4所示,子字符串“今天是星期六”从输入框的右下角沿曲线轨迹并旋转移动到输入框上端的最终显示位置显示。
同时,优选地,本实施方式还可以从多个预定的轨迹以及多个移动方式中选择对应的轨迹以及移动方式来形成所述动画。
步骤140可以以子字符串的长度作为选择轨迹以及移动方式的依据,在此前提下,步骤140可以包括如下子步骤:
步骤141、获取各子字符串的长度。
步骤142、根据子字符串的长度选择对应的轨迹以及方式形成子字符串移动到子字符串显示位置的动画。
动态显示方式可以在不同的轨迹和/或不同的移动方式之间选择,也即,当子字符串长度位于第一范围时,该子字符串沿第一轨迹以第一方式移动实现动态显示,当子字符串长度位于不同于第一范围的第二范围时,该子字符串沿第二轨迹以第二方式移动实现动态显示,其中,第一轨迹可以不同于第二轨迹同时第一方式不同第二方式,或者,第一轨迹可以与第二轨迹相同,但第一方式不同于第二方式,亦或者,第一轨迹不同于第二轨迹而第一方式与第二方式相同。当然,本领域技术人员能够理解,本实施方式中范围、轨迹和移动方式并不限于两种,可以根据需要提供更多的选择。
具体地,可以预先设定较长的子字符串对应直线轨迹以及平移的移动方式,而较短的子字符串则对应于曲线轨迹以及旋转的移动方式,由此,可以实现不同长度的子字符串有不同的动画表现形式,丰富显示效果。
而且,本实施方式的动态方式也并非仅限于基于划分为短句的子字符串,被划分为词或短语以及字符的子字符串均可以使用本实施方式提供的动态方式来进行选择。
由此,在本实施方式中,以显示所述子字符串沿预定轨迹以预定方式移动到子字符串显示位置的动画的方式来动态依次显示各子字符串,可以更好地丰富子字符串显示模式。
而在本实施例的另一个优选实施方式中,如图5所示,所述动态方式为在显示位置显示子字符串显现的动画。所述显现可以为直接显现由无到有的动画,也可以是对应子字符串由透明度为100递减为透明度为0的在一个预定的时间周期内逐渐显现的动画。图5以字符串为中文语句“今天是星期六”,且其被划分为“今”、“天”、“是”、“星”、“期”、“六”六个子字符串为例进行说明。首先,通过直接显现或逐渐显现的动态方式显示第一子字符串“今”。然后,依次通过直接显现或逐渐显现动态方式显示“天”、“是”、“星”、“期”、“六”等子字符串。由此,可以模拟用户手动输入的效果进行显示,方便客户阅读和检查。
而且,本实施方式的动态方式也并非仅限于基于由一个字符组成的子字符串,被划分为短句或词或短语的子字符串均可以使用本实施方式提供的动态方式来进行选择。例如,通过直接显现或逐渐显现的动态方式依次显示“今天”、“是”、“星期六”,由此可以加快显示的进度,一定程度上节省阅读时间。
当然,本领域技术人员能够理解,上述不同的动态方式可以灵活组合以实现更加丰富的子字符串显示输出。
在本实施例的另一个优选实施方式中,步骤140中获得子字符串显示信息还可以是子字符串所对应的实体的当前状态信息和/或解释信息。步骤140具体可包括:分别以各子字符串为查询关键词查询获取各子字符串对应的实体的当前状态信息和/或解释信息。
其中,所述当前状态信息和解释信息视子字符串对应的实体不同而不同。例如,在子字符串为地名例如“北京”时,其当前状态信息可以为天气信息,其解释信息可以是城市的宣传介绍图片或文字。在子字符串为节假日名称例如“春节”是,其当前状态信息可以是当前日期距离该节假日的时间期间,其解释信息可以是对该节日的介绍信息,也可以是下一个该节假日的放假信息。所述的当前状态信息以及解释信息可以预先进行设置后存储在本地的定时更新的数据库或者云端的数据库中。
对于每个子字符串,可以以子字符串为关键词在本地存储的数据库或者云端存储的数据中查询是否存在当前状态信息和/或解释信息,如果存在则根据设置提取相应的状态信息和/或解释信息作为子字符串显示信息的一部分。
例如,对用户输入的语音信号转化得到字符串“端午节放假,我们打算去杭州”,通过步骤130的语义分析该字符串被划分为“端午节”、“放假”、“我们”、“打算”、“去”、“杭州”等6个子字符串。对这6个子字符串查询是否存在当前状态信息和/或解释信息,如果查询到子字符串“端午节”存在解释信息(例如,端午节的放假安排),而同时“杭州”也存在解释信息(例如,杭州的旅游景点列表),则将获得的解释信息与子字符串一起作为子字符串显示信息,并在后续步骤150进行显示,如图6所示。
由此,可以在用户语音输入字符串时,可以为用户自动提供更加丰富的信息。
在本实施例的另一个优选实施方式中,步骤140中获得子字符串显示信息还可以是子字符串所对应的图像,例如,子字符串所表述动作对应的表情图标、子字符串所对应的实体的图片或子字符串对应的艺术字图像。更具体的,对于子字符串“微笑”,其对应的子字符串显示信息可以为如图7a所示的表情图标,对于子字符串“跑步”,其对应的子字符串显示信息可以为如图7b所示的图标,对于子字符串“汽车”,其对应的子字符串显示信息可以是如图7c所示的汽车图片,对于子字符串“太好了”,其对应的子字符串显示信息可以是如图7d所示的艺术字图片。由此,通过图片来展现各子字符串的内容,可以丰富显示效果。
本实施例的语音输入字符串的装置可以应用于百度搜索、百度输入法等各种需要进行人机交互的应用中。
由此,本实施例通过将识别得到的字符串划分为多个子字符串,并以动态方式按照子字符串在所述字符串中的排列顺序依次显示各子字符串,由此,识别得到的字符串可以以动态方式在输入框中显示,使得识别结果上下文承上启下,连续性更强,方便用户阅读和检查,同时,提高用户对输入的掌控感,增强客户使用体验,避免了用户由于阅读和检查不方便造成的反复不必要操作。
图8是本发明第二实施例的语音输入字符串的方法的流程图。如图8所示,所述方法包括:
步骤810、接收用户输入的语音信号。
步骤820、将语音信号转换为对应的字符串。
步骤830、获取所述字符串长度。
步骤840、判断所述字符串长度是否大于预定阈值,如果大于预定阈值,则执行步骤850,否则执行步骤880。
步骤850、将所述字符串划分为至少两个子字符串。
步骤860、分别获取各子字符串对应的子字符串显示信息。
步骤870、按各子字符串在所述字符串中的排列顺序依次显示所述子字符串各子字符串对应的子字符串显示信息。
步骤880、直接显示所述字符串。
本实施例与第一实施例的不同在于,本实施例在获取转化获得对应的字符串后,会获取字符串长度,并进而对比字符串长度和预定阈值,在字符串长度较小时,直接显示字符串,而在字符串长度较大时,才进行字符串划分操作以及动态显示操作。
所述预定阈值可以根据需要进行设定,当希望大部分语音输入字符串均能以划分后动态方式显示时,预定阈值可以设置得较小,当希望更多的输入字符串能以原有的方式显示时,预定阈值可以设置得较大。
举例来说,将预定阈值设定为3,对于根据语音信号转化得到的字符串“对不起”由于字符串长度不大于3,因此,直接显示该字符串而不进行划分为子字符串的操作,对于语音信号转化得到的字符串“我和小丽准备去爬山”,其长度大于3,因此,按照预定的规则进行划分以及动态显示。
本实施例通过对字符串的长度进行判断减少不必要的字符串划分操作,节省系统资源,同时不影响用户的阅读和检查。
图9是本发明第三实施例的语音输入字符串的方法的流程图。如图6所示,所述方法包括:
步骤910、接收用户输入的语音信号。
步骤920、将语音信号转换为对应的字符串。
步骤930、将所述字符串划分为至少两个子字符串。
步骤940、获取子字符串所对应的至少两种待显示信息,所述待显示信息包括子字符串沿预定轨迹以预定方式移动到子字符串显示位置的动画、子字符串显现的动画、子字符串所对应的实体的当前状态信息和/或解释信息以及子字符串所对应的图像。
步骤950、根据预定优先级或子字符串长度从所述至少两种待显示信息中选取一种待显示信息作为子字符串对应的子字符串显示信息。
步骤960、按各子字符串在所述字符串中的排列顺序依次显示所述子字符串各子字符串对应的子字符串显示信息。
本实施例与第一实施例的不同在于,本实施例的方法预先为子字符串设置至少两种对应的待显示信息,所述待显示信息可以以不同于字符串本身的方式来展示子字符串所要表达的含义,并且,本实施例根据子字符串的预定优先级或子字符串长度选择一个待显示信息作为子字符串显示信息进行显示,也即,不同的子字符串根据对应的待显示信息种类的不同以及优先级设置的不同或子字符串长度的不同可能采用不同种类的待显示信息进行显示。
例如,在待显示信息仅有移动动态显示动画和逐渐显现方式的动画两种时,当子字符串长度满足特定范围时(大于预定阈值或小于预定阈值或位于特定数值区间内)选择以显示子字符串沿预定轨迹以预定方式移动到子字符串显示位置的动画的方式来进行动态显示,在子字符串长度不满该特定范围时,选择以逐渐显现的方式来来进行动态显示。本实施例可以丰富显示效果,提升客户体验。
图10是本发明第四实施例的语音输入字符串的装置的结构示意图。如图10所示,所述装置100包括接收单元101、转换单元102、划分单元103、显示信息获取单元104和显示单元105。
其中,接收单元101用于接收用户输入的语音信号;转换单元102用于将语音信号转换为对应的字符串;划分单元103用于将所述字符串划分为至少两个子字符串;显示信息获取单元104用于分别获取各子字符串对应的子字符串显示信息;显示单元105用于按各子字符串在所述字符串中的排列顺序依次显示所述子字符串各子字符串对应的子字符串显示信息。
在本实施例的一个优选实施方式中,划分单元103包括长度获取子单元1031和子字符串获取子单元1032。
其中,长度获取子单元1031用于获取所述字符串长度。子字符串获取子单元1032用于在所述字符串长度大于预定阈值时,将所述字符串划分为至少两个子字符串。
同时,所述装置100还可包括直接显示单元106,用于在所述字符串长度小于等于所述预定阈值时,直接显示所述字符串。
所述预定阈值可以根据需要进行设定,当希望大部分语音输入字符串均能以划分后动态方式显示时,预定阈值可以设置得较小,当希望更多的输入字符串能以原有的方式显示时,预定阈值可以设置得较大。
该优选实施方式通过对字符串的长度进行判断减少不必要的字符串划分操作,节省系统资源,同时不影响用户的阅读和检查。
在本实施例中,可以根据各种预定的形式或规则来进行字符串的划分。本实施例中,所述“子字符串”是指用于组成字符串的连续的字符组合,其可以为多个连续字符的组合,也可以为单个字符。
在本实施例的一个优选实施方式中,划分单元103可以对字符串进行语义分析,根据语义分析规则将所述字符串划分为至少两个子字符串,所述子字符串为构成字符串的语义单元。例如,当字符串为中文长句时,划分单元103可以根据语义分析将其划分为至少两个短句。当然,也可以根据语义分析将语句划分为更加小的单元,例如,将语句划分为至少两个短语或词。通过语义分析规则进行划分,灵活性强,可以进行不同层次的子字符串划分和获取。
在本实施例的另一个优选实施方式中,划分单元103可以根据语音信号中的停顿将所述字符串划分为至少两个子字符串。例如,当字符串为中文长句“今天是星期六,天气很好,我和小丽准备去爬山,你来么?”时,各个短句之间会有停顿,划分单元103根据语音信号的短暂停顿即可将上述中文长句划分为“今天是星期六”、“天气很好”、“我和小丽准备去爬山”和“你来么”等四个短句。通过语音信号停顿来进行划分效率较语义分析更高,可以节省系统计算资源。
在本实施例的另一个优选实施方式中,划分单元103还可以直接根据所识别的字符串的语音种类将字符串划分为对应的语言种类的最小组成单元(字母或字),也即,划分得到的子字符串为由一个字符组成的子字符串,例如,对于中文语句“我和小丽准备去爬山”,可以将其划分为“我”、“和”、“小”、“丽”、“准”、“备”、“去”“爬”、“山”九个子字符串,每个子字符串仅包括一个中文字。划分单元103直接将字符串划分为仅包括一个字符的子字符串,效率高,可以用于后续模拟用户打字输入的显示方式,在节省系统计算资源的同时,可以方便用户逐字符阅读和检查。
当然,本领域技术人员可以理解,以上仅以中文语句作为示例进行说明,但上述对于字符串的划分原则及方式也可以适用于基于其它语言的语句,例如,英文,日文等。举例来说,对于英文语句“What’s up”,划分单元103可以根据语义分析将其划分为“What”、“’s”、“up”三个词,也可以将其划分为英文字母。
在划分单元103划分获取到组成字符串的各子字符串后,显示信息获取单元104可以根据获得的各子字符串分别获取其对应的子字符串显示信息,所述子字符串显示信息可以是子字符串本身也可以是包含子字符串所表述信息的动画,还可以是与子字符串表述的实体相关的信息,通过子字符串显示信息的依次显示可以实现字符串的动态显示,由于子字符串显示信息逐个动态显示,使得用户可以随着动态显示的过程阅读和检查转换得到的子字符串是否满足要求。
在本实施例的一个优选实施方式中,显示信息获取单元104包括:
子字符串长度获取子单元1041,用于获取各子字符串的长度;
信息形成子单元1042,根据子字符串的长度选择对应的轨迹以及方式形成子字符串移动到子字符串显示位置的动画。
所述子字符串显示信息包括子字符串显现的动画。
优选地,所述子字符串显示信息包括子字符串所对应的实体的当前状态信息和/或解释信息。
其中,所述当前状态信息和解释信息视子字符串对应的实体不同而不同。例如,在子字符串为地名例如“北京”时,其当前状态信息可以为天气信息,其解释信息可以是城市的宣传介绍图片或文字。在子字符串为节假日名称例如“春节”是,其当前状态信息可以是当前日期距离该节假日的时间期间,其解释信息可以是对该节日的介绍信息,也可以是下一个该节假日的放假信息。所述的当前状态信息以及解释信息可以预先进行设置后存储在本地的定时更新的数据库或者云端的数据库中。
对于每个子字符串,可以以子字符串为关键词在本地存储的数据库或者云端存储的数据中查询是否存在当前状态信息和/或解释信息,如果存在则根据设置提取相应的状态信息和/或解释信息作为子字符串显示信息的一部分。
所述显示信息获取单元104用于分别以各子字符串为查询关键词查询获取各子字符串对应的实体的当前状态信息和/或解释信息。
优选地,所述子字符串显示信息包括子字符串所对应的图像。
优选地,所述子字符串所对应的图像包括子字符串所表述动作对应的表情图标、子字符串所对应的实体的图片或子字符串对应的艺术字图像。
在本实施例的一个优选实施方式中,显示信息获取单元104包括:
待显示信息获取子单元1043,用于获取子字符串所对应的至少两种待显示信息,所述待显示信息包括子字符串沿预定轨迹以预定方式移动到子字符串显示位置的动画、子字符串显现的动画、子字符串所对应的实体的当前状态信息和/或解释信息以及子字符串所对应的图像;
信息选择子单元1044,用于根据预定优先级或子字符串长度从所述至少两种待显示信息中选取一种待显示信息作为子字符串对应的子字符串显示信息。
本实施例的语音输入字符串的装置可以应用于百度搜索、百度输入法等各种需要进行人机交互的应用中。
综上,本实施例通过将识别得到的字符串划分为多个子字符串,并以动态方式按照子字符串在所述字符串中的排列顺序依次显示各子字符串,由此,识别得到的字符串可以以动态方式在输入框中显示,使得识别结果上下文承上启下,连续性更强,方便用户阅读和检查,同时,提高用户对输入的掌控感,增强客户使用体验,避免了用户由于阅读和检查不方便造成的反复不必要操作。
图11是可以实施本发明实施例的终端设备的示意图。所述终端设备为数据处理系统,图11阐释了终端设备的多个组件,并不意味着代表组件连接的任何特定架构和方式。还应当知道具有较少组件或者可能具有较多组件其他数据处理系统也可以用于本发明。
如图11所示,终端设备A0是数据处理系统的一种形式,其可以形成为个人计算机、笔记本计算机、平板电脑、数字媒体播放器、智能移动通信终端等各种终端形式。终端设备A0可以包括总线A1。微处理器A2、易失性存储器A3以及非易失性存储器A4均连接到总线A1,某些情况下,终端设备还可以包括硬盘存储器A5,这些部件通过总线A1进行数据交换和通信。微处理器A2可以是独立的微处理器,也可以是一个或者多个微处理器集合。总线A1将上述多个组件连接在一起,同时将上述组件连接到显示控制器A6和显示装置以及输入/输出(I/0)装置A7。输入/输出(I/0)装置A7至少包括用于输入语音的语音采集装置和用于进行显示的显示装置,其还可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地,输入/输出装置A7通过输入/输出控制器A8与系统相连。
终端设备A0中的易失性存储器A3也称为内存,其具有数据读写速度快的特点,具体地,易失性存储器A3可由动态随机读写存储器(DRAM)实现,动态随机读写存储器需要持续供电以更新或者维持存储器中的数据。
通常而言,非易失性存储器A4是指当电流关掉后,所存储的数据不会消失的存储器,其可以包括例如只读存储器(ROM)、闪存(Flash Memory)等。
总线A1可以包括通过多个本领域公知的桥连接器、控制器和/或适配器,相互连接的一条或者多条总线。在实施例中I/O控制器A8包括用于控制USB外围设备的USB(通用串行总线)适配器、用于IEEE1394外围设备的IEEE1394控制器或者用于控制蓝牙外围设备的蓝牙控制器,以及适用于其它外围设备接口标准的外围设备控制器。
在某些情况下,所述终端设备还可以无线通信模块A9,其通过无线/有线方式发送和接收数据,优选地,所述通信模块A9为无线通讯装置,其可基于已有的无线通信技术(例如,GPRS(General Packet Radio Service,通用分组无线服务)、CDMA(Code Division Multiple Access,码分多址)、WCDMA(WidebandCode Division Multiple Access,宽带码分多址)、LTE(Long Term Evolution,长期演进)、WiFi(wireless fidelity,无线保真)、蓝牙等)进行数据发送和接收。
显然,本领域技术人员应该明白,上述的本发明的各模块或各步骤可以通过如上所述的通信终端实施,对于语音信息的发送以及接收功能可以集成于同一通信终端上以使得通信终端既可以发送也可以接收语音信息。可选地,本发明实施例可以用计算机装置可执行的程序来实现,从而可以将它们存储在存储装置中由处理器来执行,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等;或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (27)

1.一种语音输入字符串的方法,其特征在于,包括:
接收用户输入的语音信号;
将语音信号转换为对应的字符串;
将所述字符串划分为至少两个子字符串;
分别获取各子字符串对应的子字符串显示信息;
按各子字符串在所述字符串中的排列顺序依次显示各子字符串对应的子字符串显示信息。
2.根据权利要求1所述的语音输入字符串的方法,其特征在于,所述将所述字符串划分为至少两个子字符串包括:
获取所述字符串长度;
在所述字符串长度大于预定阈值时,将所述字符串划分为至少两个子字符串。
3.根据权利要求2所述的语音输入字符串的方法,其特征在于,所述方法还包括:
在所述字符串长度小于等于所述预定阈值时,直接显示所述字符串。
4.根据权利要求1-3中任一项所述的语音输入字符串的方法,其特征在于,所述将所述字符串划分为至少两个子字符串包括:
根据语义分析规则将所述字符串划分为至少两个子字符串,所述子字符串为构成字符串的语义单元。
5.根据权利要求1-3中任一项所述的语音输入字符串的方法,其特征在于,所述将所述字符串划分为至少两个子字符串包括:
根据语音信号中的停顿将所述字符串划分为至少两个子字符串。
6.根据权利要求1-3中任一项所述的语音输入字符串的方法,其特征在于,所述子字符串为由一个字符组成的子字符串。
7.根据权利要求1-3中任一项所述的语音输入字符串的方法,其特征在于,所述子字符串显示信息包括子字符串沿预定轨迹以预定方式移动到子字符串显示位置的动画。
8.根据权利要求7所述的语音输入字符串的方法,其特征在于,所述分别获取各子字符串对应的子字符串显示信息包括:
获取各子字符串的长度;
根据子字符串的长度选择对应的轨迹以及方式形成子字符串移动到子字符串显示位置的动画。
9.根据权利要求1-3中任一项所述的语音输入字符串的方法,其特征在于,所述子字符串显示信息包括子字符串显现的动画。
10.根据权利要求1-3中任一项所述的语音输入字符串的方法,其特征在于,所述子字符串显示信息包括子字符串所对应的实体的当前状态信息和/或解释信息;
所述分别获取各子字符串对应的子字符串显示信息包括:
分别以各子字符串为查询关键词查询获取各子字符串对应的实体的当前状态信息和/或解释信息。
11.根据权利要求1-3中任一项所述的语音输入字符串的方法,其特征在于,所述子字符串显示信息包括子字符串所对应的图像。
12.根据权利要求11所述的语音输入字符串的方法,其特征在于,所述子字符串所对应的图像包括子字符串所表述动作对应的表情图标、子字符串所对应的实体的图片或子字符串对应的艺术字图像。
13.根据权利要求1-3中任一项所述的语音输入字符串的方法,其特征在于,所述分别获取各子字符串对应的子字符串显示信息包括:
获取子字符串所对应的至少两种待显示信息,所述待显示信息包括子字符串沿预定轨迹以预定方式移动到子字符串显示位置的动画、子字符串显现的动画、子字符串所对应的实体的当前状态信息和/或解释信息以及子字符串所对应的图像;
根据预定优先级或子字符串长度从所述至少两种待显示信息中选取一种待显示信息作为子字符串对应的子字符串显示信息。
14.一种语音输入字符串的装置,其特征在于,包括:
接收单元,用于接收用户输入的语音信号;
转换单元,用于将语音信号转换为对应的字符串;
划分单元,用于将所述字符串划分为至少两个子字符串;
显示信息获取单元,用于分别获取各子字符串对应的子字符串显示信息;
显示单元,用于按各子字符串在所述字符串中的排列顺序依次显示所述各子字符串对应的子字符串显示信息。
15.根据权利要求14所述的语音输入字符串的装置,其特征在于,所述划分单元包括:
长度获取子单元,用于获取所述字符串长度;
子字符串获取子单元,用于在所述字符串长度大于预定阈值时,将所述字符串划分为至少两个子字符串。
16.根据权利要求15所述的语音输入字符串的装置,其特征在于,所述装置还包括:
直接显示单元,用于在所述字符串长度小于等于所述预定阈值时,直接显示所述字符串。
17.根据权利要求14-16中任一项所述的语音输入字符串的装置,其特征在于,所述划分单元用于根据语义分析规则将所述字符串划分为至少两个子字符串,所述子字符串为构成字符串的语义单元。
18.根据权利要求14-16中任一项所述的语音输入字符串的装置,其特征在于,所述划分单元用于根据语音信号中的停顿将所述字符串划分为至少两个子字符串。
19.根据权利要求14-16中任一项所述的语音输入字符串的装置,其特征在于,所述划分单元用于将所述字符串划分为至少两个由一个字符组成的子字符串。
20.根据权利要求14-16中任一项所述的语音输入字符串的装置,其特征在于,所述子字符串显示信息包括子字符串沿预定轨迹以预定方式移动到子字符串显示位置的动画。
21.根据权利要求20所述的语音输入字符串的装置,其特征在于,所述显示信息获取单元包括:
子字符串长度获取子单元,用于获取各子字符串的长度;
信息形成子单元,根据子字符串的长度选择对应的轨迹以及方式形成子字符串移动到子字符串显示位置的动画。
22.根据权利要求14-16中任一项所述的语音输入字符串的装置,其特征在于,所述子字符串显示信息包括子字符串显现的动画。
23.根据权利要求14-16中任一项所述的语音输入字符串的装置,其特征在于,所述子字符串显示信息包括子字符串所对应的实体的当前状态信息和/或解释信息;
所述显示信息获取单元用于分别以各子字符串为查询关键词查询获取各子字符串对应的实体的当前状态信息和/或解释信息。
24.根据权利要求14-16中任一项所述的语音输入字符串的装置,其特征在于,所述子字符串显示信息包括子字符串所对应的图像。
25.根据权利要求24所述的语音输入字符串的装置,其特征在于,所述子字符串所对应的图像包括子字符串所表述动作对应的表情图标、子字符串所对应的实体的图片或子字符串对应的艺术字图像。
26.根据权利要求14-16中任一项所述的语音输入字符串的装置,其特征在于,所述显示信息获取单元包括:
待显示信息获取子单元,用于获取子字符串所对应的至少两种待显示信息,所述待显示信息包括子字符串沿预定轨迹以预定方式移动到子字符串显示位置的动画、子字符串显现的动画、子字符串所对应的实体的当前状态信息和/或解释信息以及子字符串所对应的图像;
信息选择子单元,用于根据预定优先级或子字符串长度从所述至少两种待显示信息中选取一种待显示信息作为子字符串对应的子字符串显示信息。
27.一种终端设备,包括语音采集装置,其特征在于,所述终端设备还包括如权利要求14-16中任一项所述的语音输入字符串的装置。
CN201310239630.XA 2013-06-17 2013-06-17 语音输入字符串的方法、装置和终端设备 Active CN103353824B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310239630.XA CN103353824B (zh) 2013-06-17 2013-06-17 语音输入字符串的方法、装置和终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310239630.XA CN103353824B (zh) 2013-06-17 2013-06-17 语音输入字符串的方法、装置和终端设备

Publications (2)

Publication Number Publication Date
CN103353824A true CN103353824A (zh) 2013-10-16
CN103353824B CN103353824B (zh) 2016-08-17

Family

ID=49310200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310239630.XA Active CN103353824B (zh) 2013-06-17 2013-06-17 语音输入字符串的方法、装置和终端设备

Country Status (1)

Country Link
CN (1) CN103353824B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103823561A (zh) * 2014-02-27 2014-05-28 广州华多网络科技有限公司 表情输入方法和装置
CN104853026A (zh) * 2014-02-19 2015-08-19 联想(北京)有限公司 一种信息处理的方法及电子设备
CN105630959A (zh) * 2015-12-24 2016-06-01 联想(北京)有限公司 一种文本信息显示方法及电子设备
CN107391105A (zh) * 2017-06-07 2017-11-24 北京五八信息技术有限公司 文本绘制方法和装置
CN108230818A (zh) * 2018-01-25 2018-06-29 上海顺砾智能科技有限公司 一种多功能电子书写本及其使用方法
CN109478201A (zh) * 2016-07-20 2019-03-15 索尼公司 信息处理装置、信息处理方法及程序
CN109669751A (zh) * 2018-12-14 2019-04-23 Oppo广东移动通信有限公司 一种输入框的绘制方法、装置、终端及计算机存储介质
CN111404638A (zh) * 2019-12-16 2020-07-10 王振江 一种数字信号传输方法
CN111832279A (zh) * 2020-07-09 2020-10-27 北京字节跳动网络技术有限公司 文本划分方法、装置、设备和计算机可读介质
CN112926419A (zh) * 2021-02-08 2021-06-08 北京百度网讯科技有限公司 字符判定结果处理方法、装置、电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050075143A1 (en) * 2003-10-06 2005-04-07 Curitel Communications, Inc. Mobile communication terminal having voice recognition function, and phoneme modeling method and voice recognition method for the same
CN1774738A (zh) * 2003-04-14 2006-05-17 夏普株式会社 能够适当地显示文本数据的文本数据显示设备
CN101256559A (zh) * 2007-02-27 2008-09-03 株式会社东芝 用于处理输入语音的装置和方法
US20090199110A1 (en) * 2008-02-05 2009-08-06 Samsung Electronics Co., Ltd. Apparatus and method for transmitting animation-based message
CN102662568A (zh) * 2012-03-23 2012-09-12 北京百舜华年文化传播有限公司 一种图画输入方法及装置
CN103076892A (zh) * 2012-12-31 2013-05-01 百度在线网络技术(北京)有限公司 一种用于提供输入字符串所对应的输入候选项的方法与设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1774738A (zh) * 2003-04-14 2006-05-17 夏普株式会社 能够适当地显示文本数据的文本数据显示设备
US20050075143A1 (en) * 2003-10-06 2005-04-07 Curitel Communications, Inc. Mobile communication terminal having voice recognition function, and phoneme modeling method and voice recognition method for the same
CN101256559A (zh) * 2007-02-27 2008-09-03 株式会社东芝 用于处理输入语音的装置和方法
US20090199110A1 (en) * 2008-02-05 2009-08-06 Samsung Electronics Co., Ltd. Apparatus and method for transmitting animation-based message
CN102662568A (zh) * 2012-03-23 2012-09-12 北京百舜华年文化传播有限公司 一种图画输入方法及装置
CN103076892A (zh) * 2012-12-31 2013-05-01 百度在线网络技术(北京)有限公司 一种用于提供输入字符串所对应的输入候选项的方法与设备

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104853026A (zh) * 2014-02-19 2015-08-19 联想(北京)有限公司 一种信息处理的方法及电子设备
CN104853026B (zh) * 2014-02-19 2018-04-27 联想(北京)有限公司 一种信息处理的方法及电子设备
CN103823561B (zh) * 2014-02-27 2017-01-18 广州华多网络科技有限公司 表情输入方法和装置
CN103823561A (zh) * 2014-02-27 2014-05-28 广州华多网络科技有限公司 表情输入方法和装置
CN105630959A (zh) * 2015-12-24 2016-06-01 联想(北京)有限公司 一种文本信息显示方法及电子设备
CN109478201A (zh) * 2016-07-20 2019-03-15 索尼公司 信息处理装置、信息处理方法及程序
CN107391105A (zh) * 2017-06-07 2017-11-24 北京五八信息技术有限公司 文本绘制方法和装置
CN108230818A (zh) * 2018-01-25 2018-06-29 上海顺砾智能科技有限公司 一种多功能电子书写本及其使用方法
CN109669751A (zh) * 2018-12-14 2019-04-23 Oppo广东移动通信有限公司 一种输入框的绘制方法、装置、终端及计算机存储介质
CN111404638A (zh) * 2019-12-16 2020-07-10 王振江 一种数字信号传输方法
CN111404638B (zh) * 2019-12-16 2022-10-04 王振江 一种数字信号传输方法
CN111832279A (zh) * 2020-07-09 2020-10-27 北京字节跳动网络技术有限公司 文本划分方法、装置、设备和计算机可读介质
CN111832279B (zh) * 2020-07-09 2023-12-05 抖音视界有限公司 文本划分方法、装置、设备和计算机可读介质
CN112926419A (zh) * 2021-02-08 2021-06-08 北京百度网讯科技有限公司 字符判定结果处理方法、装置、电子设备
CN112926419B (zh) * 2021-02-08 2023-10-27 北京百度网讯科技有限公司 字符判定结果处理方法、装置、电子设备

Also Published As

Publication number Publication date
CN103353824B (zh) 2016-08-17

Similar Documents

Publication Publication Date Title
CN103353824A (zh) 语音输入字符串的方法、装置和终端设备
CN108510983B (zh) 用于序列标注的自动单元选择和目标分解的系统和方法
US6088731A (en) Intelligent assistant for use with a local computer and with the internet
CN103268313B (zh) 一种自然语言的语义解析方法及装置
US9779080B2 (en) Text auto-correction via N-grams
CN101206528B (zh) 用多种词汇之一以及解析模态对简化用户输入文本的处理
CN109119079B (zh) 语音输入处理方法和装置
CN113590739A (zh) 基于模型的语义文本搜索
US10402474B2 (en) Keyboard input corresponding to multiple languages
CN101561725B (zh) 一种手写快速输入的方法和系统
CN102236423A (zh) 一种字符自动补充的方法、装置和输入法系统
US20210286951A1 (en) Generative text summarization system and method
CN109062572A (zh) 一种组件调用方法、装置、设备及存储介质
CN107861948A (zh) 一种标签提取方法、装置、设备和介质
CN108664141B (zh) 具有文档上下文自学习功能的输入法
Rahmadi et al. Visual recognition of graphical user interface components using deep learning technique
CN104050962A (zh) 基于语音合成技术的多功能阅读器
CN110308947A (zh) 问答信息的处理方法、系统、计算机设备和存储介质
CN103106194A (zh) 移动终端语言转换方法及其移动终端
CN102014199A (zh) 一种信息显示方法及终端
CN105683891A (zh) 通过手势来输入声调和音符符号
WO2019231346A1 (ru) Способ и система для выстраивания диалога с пользователем в удобном для пользователя канале
CN113312025B (zh) 组件库生成方法及装置、存储介质、电子设备
CN109065016B (zh) 语音合成方法、装置、电子设备及非暂态计算机存储介质
US20170177569A1 (en) Method for writing a foreign language in a pseudo language phonetically resembling native language of the speaker

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant