CN106952655A - 一种输入方法和终端 - Google Patents

一种输入方法和终端 Download PDF

Info

Publication number
CN106952655A
CN106952655A CN201710101628.4A CN201710101628A CN106952655A CN 106952655 A CN106952655 A CN 106952655A CN 201710101628 A CN201710101628 A CN 201710101628A CN 106952655 A CN106952655 A CN 106952655A
Authority
CN
China
Prior art keywords
voice messaging
voice
word
text information
replaced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710101628.4A
Other languages
English (en)
Inventor
苏净
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Jinli Communication Equipment Co Ltd
Original Assignee
Shenzhen Jinli Communication Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Jinli Communication Equipment Co Ltd filed Critical Shenzhen Jinli Communication Equipment Co Ltd
Priority to CN201710101628.4A priority Critical patent/CN106952655A/zh
Publication of CN106952655A publication Critical patent/CN106952655A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • G10L21/10Transforming into visible information

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例公开了一种输入方法及终端,其中方法包括:获取用户输入的第一语音信息;将第一语音信息转换为对应的文字信息;将文字信息以预设的待确认的显示形式进行显示;若检测到用户触发语音纠正的请求,则获取用户输入的第二语音信息;根据第二语音信息以及第一语音信息,确定第二语音信息对应的替换文字和文字信息中的待替换文字;使用替换文字替换待替换文字,并显示更新后的文字信息。本发明实施例通过语音纠正的方式对语音输入转文字过程中转化错误的文字进行修改,使得用户无需对转化错误的文字进行手动删除和重新手动输入,可以提高在语音输入转化为文字后对错误文字的修改效率。

Description

一种输入方法和终端
技术领域
本发明涉及通信技术领域,尤其涉及一种输入方法和终端。
背景技术
目前,语音转文字功能在各种终端设备上被广泛使用。但语音转文字功能准确率并不高,用户仍然需要对转换错误的文字进行修改。
现有技术中,用户对转换错误的文字进行修改时主要采用选定错误文字,手动删除后重新输入的方式,这种修改方式导致修改效率较低。
发明内容
本发明实施例提供一种输入方法和终端,可以提高在语音输入转化为文字后对错误文字的修改效率。
第一方面,本发明实施例提供了一种输入方法,该方法包括:
获取用户输入的第一语音信息;
将所述第一语音信息转换为对应的文字信息;
将所述文字信息以预设的待确认的显示形式进行显示;
若检测到所述用户触发语音纠正的请求,则获取所述用户输入的第二语音信息;
根据所述第二语音信息以及所述第一语音信息,确定所述第二语音信息对应的替换文字和所述文字信息中的待替换文字;
使用所述替换文字替换所述待替换文字;
显示更新后的所述文字信息。
另一方面,本发明实施例提供了一种终端,该终端包括:
第一获取单元,用于获取用户输入的第一语音信息;
转换单元,用于将所述第一语音信息转换为对应的文字信息;
第一显示单元,用于将所述文字信息以预设的待确认的显示形式进行显示;
第二获取单元,用于若检测到所述用户触发语音纠正的请求,则获取所述用户输入的第二语音信息;
分析单元,用于根据所述第二语音信息以及所述第一语音信息,确定所述第二语音信息对应的替换文字和所述文字信息中的待替换文字;
替换单元,用于使用所述替换文字替换所述待替换文字;
第二显示单元,用于显示更新后的所述文字信息。
本发明实施例,终端获取用户输入的第一语音信息,将该第一语音信息转换为对应的文字信息,并将文字信息以预设的待确认的显示形式进行显示,当检测到用户触发语音纠正的请求时,获取用户输入的第二语音信息,根据第二语音信息以及第一语音信息,确定第二语音信息对应的替换文字和文字信息中的待替换文字,然后使用替换文字替换待替换文字,并显示更新后的文字信息,通过语音纠正的方式对语音输入转文字过程中转化错误的文字进行修改,使得用户无需对转化错误的文字进行手动删除和重新手动输入,从而提高在语音输入转化为文字后对错误文字的修改效率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种输入方法的示意流程图;
图2是本发明实施例二提供的一种输入方法的示意流程图;
图3是本发明实施例三提供的一种终端的示意性框图;
图4是本发明实施例四提供的一种终端的示意性框图;
图5是本发明实施例五提供的一种终端的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
具体实现中,本发明实施例中描述的终端包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在某些实施例中,所述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
在接下来的讨论中,描述了包括显示器和触摸敏感表面的终端。然而,应当理解的是,终端可以包括诸如物理键盘、鼠标和/或控制杆的一个或多个其它物理用户接口设备。
终端支持各种应用程序,例如以下中的一个或多个:绘图应用程序、演示应用程序、文字处理应用程序、网站创建应用程序、盘刻录应用程序、电子表格应用程序、游戏应用程序、电话应用程序、视频会议应用程序、电子邮件应用程序、即时消息收发应用程序、锻炼支持应用程序、照片管理应用程序、数码相机应用程序、数字摄影机应用程序、web浏览应用程序、数字音乐播放器应用程序和/或数字视频播放器应用程序。
可以在终端上执行的各种应用程序可以使用诸如触摸敏感表面的至少一个公共物理用户接口设备。可以在应用程序之间和/或相应应用程序内调整和/或改变触摸敏感表面的一个或多个功能以及终端上显示的相应信息。这样,终端的公共物理架构(例如,触摸敏感表面)可以支持具有对用户而言直观且透明的用户界面的各种应用程序。
实施例一:
请参阅图1,图1是本发明实施例一提供的一种输入方法的示意流程图,本实施例的执行主体可以是智能手机或者其他智能终端等设备。图1所示的输入方法可以包括以下步骤:
S101、获取用户输入的第一语音信息。
具体地,用户在使用终端设备的语音输入转文字功能时,输入第一语音信息,终端获取用户输入的第一语音信息。
第一语音信息是指用户在使用终端设备语音输入转文字功能时输入的语音信息。
S102、将第一语音信息转换为对应的文字信息。
具体地,终端将用户输入的第一语音信息转换为对应的文字信息。
文字信息是指终端使用语音输入转文字功能,将用户输入的语音信息转换成的文本信息,语音与文字呈现一一对应的关系。
S103、将文字信息以预设的待确认的显示形式进行显示。
具体地,终端将获取到的文字信息以预设的待确认的显示形式进行显示。
预设的待确认的显示形式具体可以是对文字信息增加下划线的方式,还可以是对文字信息采用特定颜色进行显示的方式,但并不限于此,待确认的显示形式可以根据应用的需要进行设置,此处不做限制。
需要说明的是,如果用户确认语音输入转换后的文字信息正确,则可以通过点击文字信息所在的文本框以外的空白部分确认语音信息输入无误,当文字信息采用下划线的方式进行显示时,此时下划线自动取消,完成此次语音转文字的输入过程;如果用户确认语音输入转换后的文字信息存在错误需要纠正,则可以继续发起通过语音进行纠正的过程。
S104、若检测到用户触发语音纠正的请求,则获取用户输入的第二语音信息。
具体地,当用户确认语音输入转换后的文字信息存在错误时,可以触发语音纠正的请求,并输入新的语音。终端若检测到用户触发了语音纠正的请求,则获取用户输入的第二语音信息。
语音纠正的请求可以通过再次点击语音输入转文字指令的按钮进行触发,但并不限于此,语音纠正请求的触发方式可以根据实际应用的需要进行设置,此处不做限制。
S105、根据第二语音信息以及第一语音信息,确定第二语音信息对应的替换文字和文字信息中的待替换文字。
具体地,终端通过对第二语音信息进行语音分析,确定第二语音信息对应的替换文字,并结合第一语音信息,确定文字信息中的待替换文字。
S106、使用替换文字替换待替换文字。
具体地,终端根据步骤S105确定的替换文字和待替换文字,使用替换文字替换待替换文字。
S107、显示更新后的文字信息。
从上述图1示例的输入方法可知,本实施例中,终端获取用户输入的第一语音信息,将该第一语音信息转换为对应的文字信息,并将文字信息以预设的待确认的显示形式进行显示,当检测到用户触发语音纠正的请求时,获取用户输入的第二语音信息,根据第二语音信息以及第一语音信息,确定第二语音信息对应的替换文字和文字信息中的待替换文字,然后使用替换文字替换待替换文字,并显示更新后的文字信息,通过语音纠正的方式对语音输入转文字过程中转化错误的文字进行修改,使得用户无需对转化错误的文字进行手动删除和重新手动输入,从而提高在语音输入转化为文字后对错误文字的修改效率。
实施例二:
请参阅图2,图2是本发明实施例二提供的一种输入方法的示意流程图,本实施例的执行主体可以是智能手机或者其他智能终端等设备。图2所示的输入方法可以包括以下步骤:
S201、获取用户输入的第一语音信息。
具体地,用户在使用终端设备的语音输入转文字功能时,输入第一语音信息,终端获取用户输入的第一语音信息。
第一语音信息是指用户在使用终端设备语音输入转文字功能时输入的语音信息,
S202、将第一语音信息转换为对应的文字信息。
具体地,终端将用户输入的第一语音信息转换为对应的文字信息。
文字信息是指终端使用语音输入转文字功能,将用户输入的语音信息转换成的文本信息,语音与文字呈现一一对应的关系。
S203、将文字信息以预设的待确认的显示形式进行显示。
具体地,终端将获取到的文字信息以预设的待确认的显示形式进行显示。
预设的待确认的显示形式具体可以是对文字信息增加下划线的方式,还可以是对文字信息采用特定颜色进行显示的方式,但并不限于此,待确认的显示形式可以根据应用的需要进行设置,此处不做限制。
需要说明的是,如果用户确认语音输入转换后的文字信息正确,则可以通过点击文字信息所在的文本框以外的空白部分确认语音信息输入无误,当文字信息采用下划线的方式进行显示时,此时下划线自动取消,完成此次语音转文字的输入过程;如果用户确认语音输入转换后的文字信息存在错误需要纠正,则可以继续发起通过语音进行纠正的过程。
S204、若检测到用户触发语音纠正的请求,则获取用户输入的第二语音信息。
具体地,当用户确认语音输入转换后的文字信息存在错误时,可以触发语音纠正的请求,并输入新的语音。终端若检测到用户触发了语音纠正的请求,则获取用户输入的第二语音信息。
语音纠正的请求可以通过再次点击语音输入转文字指令的按钮进行触发,但并不限于此,语音纠正请求的触发方式可以根据实际应用的需要进行设置,此处不做限制。
S205、按照预设的语音格式对第二语音信息进行分析,确定第二语音信息中的替换语音信息和该替换语音信息对应的替换文字。
预设的语音格式为终端预先设定的语音输入格式,终端根据该语音格式对第二语音信息进行分析,能够更加准确的获取用户需要替换的正确文字,从而更加符合用户的预期。
替换语音信息指终端从用户输入的第二语音信息中提取出用户想要纠正的错误文字对应的语音信息,替换文字是指该替换语音信息对应的正确的文字。
具体地,按照预设的语音格式对第二语音信息进行分析,确定第二语音信息中的替换语音信息和该替换语音信息对应的替换文字可以通过步骤S2051至步骤S2052实现,详细说明如下:
S2051、获取第二语音信息中的重复语音信息和包含该重复语音信息的语音词组,并将该重复语音信息确定为替换语音信息。
具体地,终端通过对第二语音信息进行语音分析,获取该第二语音信息中重复出现的重复语音信息,以及包含该重复语音信息的语音词组,并将该重复语音信息确定为替换语音信息。
S2052、在预设的输入法中,根据语音词组和重复语音信息匹配替换文字。
具体地,终端根据步骤S2051确定的重复语音信息和包含该重复语音信息的语音词组,在预设的输入法中进行匹配,确定正确的替换文字。
为了更好了理解步骤S205,以下通过具体例子进行说明。
假设用户通过语音输入转文字功能得到的文字信息为:我喜欢坐迪迪上下班。用户确认“迪迪”为转换错误的文字,则触发语音纠正的请求,并按照预设的语音格式输入第二语音信息“滴滴快车的滴滴”或者“滴滴是滴滴快车的滴滴”。
终端对第二语音信息进行语音分析,获取该第二语音信息中重复出现的语音部分即“滴滴”,以及包含“滴滴”的语音词组即“滴滴快车”,终端将重复出现的语音部分“滴滴”确定为替换语音信息,并根据“滴滴快车”和“滴滴”在预设的输入法中进行匹配,获取正确的替换文字。
S206、根据替换语音信息,确定文字信息中的待替换文字。
终端根据步骤S205确定的替换语音信息,确定第一语音信息对应的文字信息中的待替换文字。
具体地,根据替换语音信息,确定文字信息中的待替换文字可以通过步骤S2061至步骤S2063实现,详细说明如下:
S2061、计算替换语音信息与第一语音信息之间的语音匹配度。
具体地,终端通过计算语音匹配度的方式,在第一语音信息中查找与替换语音信息匹配的语音部分。
S2062、若语音匹配度达到预设的匹配阈值,则将当前第一语音信息中对应的语音部分确定为待替换语音。
具体地,如果替换语音信息与第一语音信息之间的语音匹配度达到预设的匹配阈值,则终端将达到匹配阈值时第一语音信息中对应的语音部分确定为待替换语音。
预设的匹配阈值可以设置为80%,但并不限于此,具体可以根据实际应用的需要进行设置,此处不做限制。
S2063、根据待替换语音确定文字信息中对应的待替换文字。
具体地,终端根据步骤S2062确定的待替换语音,将第一语音信息对应的文字信息中待替换语音对应的文字部分确定为待替换文字。
S207、使用替换文字替换待替换文字。
具体地,终端根据步骤S205确定的替换文字和步骤S206确定的待替换文字,使用替换文字替换待替换文字。
S208、显示更新后的文字信息。
S209、若检测到用户触发手写纠正的请求,则获取用户输入的第三语音信息。
具体地,如果用户对更新后的文字信息仍然不满意,可以触发手写纠正的请求,并输入第三语音信息。用户在输入第三语音信息时,可以直接输入待替换的文字对应的语音。
S210、在文字信息中确定第三语音信息对应的错误文字。
具体地,终端使用获取到的第三语音信息与第一语音信息进行匹配,确定第一语音信息中需要替换的语音部分,并在第一语音信息对应的文字信息中选中该语音部分对应的错误文字。
需要说明的是,本步骤的实现过程可以采用与步骤S206相同的方法,即将第三语音信息作为替换语音信息,使用步骤S206的处理过程,确定文字信息中对应的错误文字。
S2011、获取用户通过手写输入的更新文字。
具体地,终端获取用户通过手写输入的更新文字,其中,手写输入的方式可以是通过输入法进行的输入。
S212、使用更新文字替换错误文字,并显示更新后的文字信息。
具体地,终端使用步骤S211获取的更新文字替换在文字信息中确定的错误文字,并显示更新后的文字信息。
需要说明的是,步骤S209至步骤S212与步骤S204至步骤S208之间还可以是并列执行的关系,即用户可以对以待确认的显示形式进行显示的文字信息直接触发手写纠正的请求。
从上述图2示例的输入方法可知,本实施例中,终端获取用户输入的第一语音信息,将该第一语音信息转换为对应的文字信息,并将文字信息以预设的待确认的显示形式进行显示,当检测到用户触发语音纠正的请求时,获取用户输入的第二语音信息,按照预设的语音格式对第二语音信息进行分析,确定第二语音信息中的替换语音信息和该替换语音信息对应的替换文字,并根据替换语音信息确定文字信息中的待替换文字,然后使用替换文字替换待替换文字,并显示更新后的文字信息,通过语音纠正的方式对语音输入转文字过程中转化错误的文字进行修改,使得用户无需对转化错误的文字进行手动删除和重新输入,从而提高在语音输入转化为文字后对错误文字的修改效率;若检测到用户触发手写纠正的请求,则获取用户输入的第三语音信息,在文字信息中确定第三语音信息对应的错误文字,并获取用户通过手写输入的更新文字,使用更新文字替换该错误文字,并显示更新后的文字信息,这种采用通过语音输入确定需要纠正的错误文字,并通过手写输入确定正确的文字的方式,是对直接使用语音纠正方式的有益补充,进一步提高纠正错误文字的准确率和效率。
实施例三:
请参阅图3,图3是本发明实施例三提供的一种终端示意框图。为了便于说明,仅示出了与本发明实施例相关的部分。图3示例的终端300可以是前述实施例一提供的一种输入方法的执行主体。图3示例的终端300主要包括:第一获取单元31、转换单元32、第一显示单元33、第二获取单元34、分析单元35、替换单元36和第二显示单元37。各单元详细说明如下:第一获取单元31,用于获取用户输入的第一语音信息;
转换单元32,用于将第一获取单元31获取到的第一语音信息转换为对应的文字信息;
第一显示单元33,用于将转换单元32得到的文字信息以预设的待确认的显示形式进行显示;
第二获取单元34,用于若检测到用户触发语音纠正的请求,则获取用户输入的第二语音信息;
分析单元35,用于根据第二获取单元34获取到的第二语音信息以及第一获取单元31获取到的第一语音信息,确定第二语音信息对应的替换文字和文字信息中的待替换文字;
替换单元36,用于使用分析单元35确定的替换文字替换待替换文字;
第二显示单元37,用于显示更新后的文字信息。
本实施例提供的一种终端300中各单元实现各自功能的过程,具体可参考前述图1所示实施例的描述,此处不再赘述。
从上述图3示例的终端300可知,本实施例中,终端获取用户输入的第一语音信息,将该第一语音信息转换为对应的文字信息,并将该文字信息以预设的待确认的显示形式进行显示,当检测到用户触发语音纠正的请求时,获取用户输入的第二语音信息,根据第二语音信息以及第一语音信息,确定第二语音信息对应的替换文字和文字信息中的待替换文字,然后使用替换文字替换待替换文字,并显示更新后的文字信息,通过语音纠正的方式对语音输入转文字过程中转化错误的文字进行修改,使得用户无需对转化错误的文字进行手动删除和重新手动输入,从而提高在语音输入转化为文字后对错误文字的修改效率。
实施例四:
请参阅图4,图4是本发明实施例四提供的一种终端示意框图。为了便于说明,仅示出了与本发明实施例相关的部分。图4示例的终端400可以是前述实施例二提供的一种输入方法的执行主体。图4示例的终端400主要包括:第一获取单元41、转换单元42、第一显示单元43、第二获取单元44、分析单元45、替换单元46和第二显示单元47。各单元详细说明如下:
第一获取单元41,用于获取用户输入的第一语音信息;
转换单元42,用于将第一获取单元41获取到的第一语音信息转换为对应的文字信息;
第一显示单元43,用于将转换单元42得取到的文字信息以预设的待确认的显示形式进行显示;
第二获取单元44,用于若检测到用户触发语音纠正的请求,则获取用户输入的第二语音信息;
分析单元45,用于根据第二获取单元44获取到的第二语音信息以及第一获取单元41获取到的第一语音信息,确定第二语音信息对应的替换文字和文字信息中的待替换文字;
替换单元46,用于使用分析单元45确定的替换文字替换待替换文字;
第二显示单元47,用于显示更新后的文字信息。
进一步地,分析单元45包括:
第一分析单元451,用于按照预设的语音格式对第二获取单元44获取到的第二语音信息进行分析,确定第二语音信息中的替换语音信息和该替换语音信息对应的替换文字;
第二分析单元452,用于根据第一分析单元451得到的替换语音信息,确定文字信息中的待替换文字。
进一步地,第一分析单元451还用于:
获取第二语音信息中的重复语音信息和包含该重复语音信息的语音词组,并将重复语音信息确定为替换语音信息;
在预设的输入法中,根据包含该重复语音信息的语音词组和该重复语音信息匹配替换文字。
进一步地,第二分析单元452还用于:
计算替换语音信息与第一语音信息之间的语音匹配度;
若语音匹配度达到预设的匹配阈值,则将当前第一语音信息中对应的语音部分确定为待替换语音;
根据待替换语音确定文字信息中对应的待替换文字。
进一步地,终端400还包括:
第三获取单元48,用于若检测到用户触发手写纠正的请求,则获取用户输入的第三语音信息;
选择单元49,用于在转换单元42得到的文字信息中确定第三获取单元48获取的第三语音信息对应的错误文字;
文字获取单元50,用于获取用户通过手写输入的更新文字;
更新单元51,用于使用文字获取单元50获取的更新文字替换选择单元49确定的错误文字,并显示更新后的文字信息。
本实施例提供的一种终端400中各单元实现各自功能的过程,具体可参考前述图2所示实施例的描述,此处不再赘述。
从上述图4示例的终端400可知,本实施例中,终端获取用户输入的第一语音信息,将该第一语音信息转换为对应的文字信息,并将文字信息以预设的待确认的显示形式进行显示,当检测到用户触发语音纠正的请求时,获取用户输入的第二语音信息,按照预设的语音格式对第二语音信息进行分析,确定第二语音信息中的替换语音信息和该替换语音信息对应的替换文字,并根据替换语音信息确定文字信息中的待替换文字,然后使用替换文字替换待替换文字,并显示更新后的文字信息,通过语音纠正的方式对语音输入转文字过程中转化错误的文字进行修改,使得用户无需对转化错误的文字进行手动删除和重新输入,从而提高在语音输入转化为文字后对错误文字的修改效率;若检测到用户触发手写纠正的请求,则获取用户输入的第三语音信息,在文字信息中确定第三语音信息对应的错误文字,并获取用户通过手写输入的更新文字,使用更新文字替换该错误文字,并显示更新后的文字信息,这种采用通过语音输入确定需要纠正的错误文字,并通过手写输入确定正确的文字的方式,是对直接使用语音纠正方式的有益补充,进一步提高纠正错误文字的准确率和效率。
实施例五:
请参阅图5,图5是本发明实施例五提供的一种终端示意框图。图5所示的本实施例中的终端500可以包括:一个或多个处理器501(图5中仅示出一个);一个或多个输入设备502(图5中仅示出一个),一个或多个输出设备503(图5中仅示出一个)、存储器504。上述处理器501、输入设备502、输出设备503和存储器504通过总线505连接。存储器504用于存储指令,处理器501用于执行存储器504存储的指令。
其中,输入设备502用于:
接收用户输入的第一语音信息和第二语音信息。
处理器501用于:
从输入设备502获取用户输入的第一语音信息;
将第一语音信息转换为对应的文字信息;
将文字信息以预设的待确认的显示形式进行显示;
若检测到用户触发语音纠正的请求,则从输入设备502获取用户输入的第二语音信息;
根据第二语音信息以及第一语音信息,确定第二语音信息对应的替换文字和文字信息中的待替换文字;
使用替换文字替换待替换文字;
显示更新后的文字信息。
进一步地,处理器501还用于:
按照预设的语音格式对第二语音信息进行分析,确定第二语音信息中的替换语音信息和该替换语音信息对应的替换文字;
根据替换语音信息,确定文字信息中的待替换文字。
进一步地,处理器501还用于:
获取第二语音信息中的重复语音信息和包含该重复语音信息的语音词组,并将重复语音信息确定为替换语音信息;
在预设的输入法中,根据包含重复语音信息的语音词组和该重复语音信息匹配替换文字。
进一步地,处理器501还用于:
计算替换语音信息与第一语音信息之间的语音匹配度;
若语音匹配度达到预设的匹配阈值,则将当前第一语音信息中对应的语音部分确定为待替换语音;
根据待替换语音确定文字信息中对应的待替换文字。
进一步地,输入设备502还用于:
接收用户输入的第三语音信息。
处理器501还用于:
若检测到用户触发手写纠正的请求,则从输入设备502获取用户输入的第三语音信息;
在文字信息中确定第三语音信息对应的错误文字;
获取用户通过手写输入的更新文字;
使用更新文字替换在文字信息中确定的错误文字,并显示更新后的文字信息。
应当理解,在本发明实施例中,所称处理器501可以是中央处理单元(CentralProcessing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备502可以包括触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、光线感应器(用于检测光线的强度)、麦克风等,输出设备503可以包括显示器(LCD等)、扬声器等。
该存储器504可以包括只读存储器和随机存取存储器,并向处理器501提供指令和数据。存储器504的一部分还可以包括非易失性随机存取存储器。例如,存储器504还可以存储设备类型的信息。
具体实现中,本发明实施例中所描述的处理器501可执行本发明实施例一和实施例二提供的一种输入方法所描述的实现方式,也可执行本发明实施例三和实施例四所描述的终端的实现方式,在此不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的终端和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例终端中的单元可以根据实际需要进行合并、划分和删减。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种输入方法,其特征在于,所述输入方法包括:
获取用户输入的第一语音信息;
将所述第一语音信息转换为对应的文字信息;
将所述文字信息以预设的待确认的显示形式进行显示;
若检测到所述用户触发语音纠正的请求,则获取所述用户输入的第二语音信息;
根据所述第二语音信息以及所述第一语音信息,确定所述第二语音信息对应的替换文字和所述文字信息中的待替换文字;
使用所述替换文字替换所述待替换文字;
显示更新后的所述文字信息。
2.根据权利要求1所述的输入方法,其特征在于,所述根据所述第二语音信息以及所述第一语音信息,确定所述第二语音信息对应的替换文字和所述文字信息中的待替换文字包括:
按照预设的语音格式对所述第二语音信息进行分析,确定所述第二语音信息中的替换语音信息和所述替换语音信息对应的替换文字;
根据所述替换语音信息,确定所述文字信息中的待替换文字。
3.根据权利要求2所述的输入方法,其特征在于,所述按照预设的语音格式对所述第二语音信息进行分析,确定所述第二语音信息中的替换语音信息和所述替换语音信息对应的替换文字包括:
获取所述第二语音信息中的重复语音信息和包含所述重复语音信息的语音词组,并将所述重复语音信息确定为所述替换语音信息;
在预设的输入法中,根据所述语音词组和所述重复语音信息匹配所述替换文字。
4.根据权利要求2所述的输入方法,其特征在于,所述根据所述替换语音信息,确定所述文字信息中的待替换文字包括:
计算所述替换语音信息与所述第一语音信息之间的语音匹配度;
若所述语音匹配度达到预设的匹配阈值,则将当前所述第一语音信息中对应的语音部分确定为待替换语音;
根据所述待替换语音确定所述文字信息中对应的待替换文字。
5.根据权利要求1至4任一项所述的输入方法,其特征在于,所述将所述文字信息以预设的待确认的显示形式进行显示之后,所述输入方法还包括:
若检测到所述用户触发手写纠正的请求,则获取所述用户输入的第三语音信息;
在所述文字信息中确定所述第三语音信息对应的错误文字;
获取所述用户通过手写输入的更新文字;
使用所述更新文字替换所述错误文字,并显示更新后的所述文字信息。
6.一种终端,其特征在于,所述终端包括:
第一获取单元,用于获取用户输入的第一语音信息;
转换单元,用于将所述第一语音信息转换为对应的文字信息;
第一显示单元,用于将所述文字信息以预设的待确认的显示形式进行显示;
第二获取单元,用于若检测到所述用户触发语音纠正的请求,则获取所述用户输入的第二语音信息;
分析单元,用于根据所述第二语音信息以及所述第一语音信息,确定所述第二语音信息对应的替换文字和所述文字信息中的待替换文字;
替换单元,用于使用所述替换文字替换所述待替换文字;
第二显示单元,用于显示更新后的所述文字信息。
7.根据权利要求6所述的终端,其特征在于,所述分析单元包括:
第一分析单元,用于按照预设的语音格式对所述第二语音信息进行分析,确定所述第二语音信息中的替换语音信息和所述替换语音信息对应的替换文字;
第二分析单元,用于根据所述替换语音信息,确定所述文字信息中的待替换文字。
8.根据权利要求7所述的终端,其特征在于,所述第一分析单元还用于:
获取所述第二语音信息中的重复语音信息和包含所述重复语音信息的语音词组,并将所述重复语音信息确定为所述替换语音信息;
在预设的输入法中,根据所述语音词组和所述重复语音信息匹配所述替换文字。
9.根据权利要求7所述的终端,其特征在于,所述第二分析单元还用于:
计算所述替换语音信息与所述第一语音信息之间的语音匹配度;
若所述语音匹配度达到预设的匹配阈值,则将当前所述第一语音信息中对应的语音部分确定为待替换语音;
根据所述待替换语音确定所述文字信息中对应的待替换文字。
10.根据权利要求6至9任一项所述的终端,其特征在于,所述终端还包括:
第三获取单元,用于若检测到所述用户触发手写纠正的请求,则获取所述用户输入的第三语音信息;
选择单元,用于在所述文字信息中确定所述第三语音信息对应的错误文字;
文字获取单元,用于获取所述用户通过手写输入的更新文字;
更新单元,用于使用所述更新文字替换所述错误文字,并显示更新后的所述文字信息。
CN201710101628.4A 2017-02-23 2017-02-23 一种输入方法和终端 Pending CN106952655A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710101628.4A CN106952655A (zh) 2017-02-23 2017-02-23 一种输入方法和终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710101628.4A CN106952655A (zh) 2017-02-23 2017-02-23 一种输入方法和终端

Publications (1)

Publication Number Publication Date
CN106952655A true CN106952655A (zh) 2017-07-14

Family

ID=59467213

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710101628.4A Pending CN106952655A (zh) 2017-02-23 2017-02-23 一种输入方法和终端

Country Status (1)

Country Link
CN (1) CN106952655A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108364653A (zh) * 2018-02-12 2018-08-03 王磊 语音数据处理方法及处理装置
CN108650424A (zh) * 2018-08-14 2018-10-12 奇酷互联网络科技(深圳)有限公司 消息处理方法、系统、可读存储介质及移动终端
CN108710484A (zh) * 2018-03-12 2018-10-26 西安艾润物联网技术服务有限责任公司 一种通过语音修改车牌号的方法、存储介质及装置
CN109284501A (zh) * 2018-08-30 2019-01-29 上海与德通讯技术有限公司 一种文字更正方法、装置、服务器及存储介质
CN110085087A (zh) * 2019-03-21 2019-08-02 合肥精大自动化工程有限公司 一种船控制系统的展示装置
CN113378530A (zh) * 2021-06-28 2021-09-10 北京七维视觉传媒科技有限公司 语音编辑方法及装置、设备和介质
WO2022135259A1 (zh) * 2020-12-22 2022-06-30 维沃移动通信有限公司 语音输入方法、装置及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101382866A (zh) * 2008-09-26 2009-03-11 腾讯科技(深圳)有限公司 修正输入文字的系统及方法
CN103645876A (zh) * 2013-12-06 2014-03-19 百度在线网络技术(北京)有限公司 语音输入方法和装置
CN105068982A (zh) * 2015-08-26 2015-11-18 百度在线网络技术(北京)有限公司 输入内容的修改方法和装置
WO2016152408A1 (ja) * 2015-03-26 2016-09-29 京セラドキュメントソリューションズ株式会社 表示入力装置、表示入力装置の制御方法、表示入力装置の制御プログラム
CN106022357A (zh) * 2016-05-11 2016-10-12 珠海市魅族科技有限公司 一种数据输入校准的方法及终端
CN106406807A (zh) * 2016-09-19 2017-02-15 北京云知声信息技术有限公司 一种语音修改文字的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101382866A (zh) * 2008-09-26 2009-03-11 腾讯科技(深圳)有限公司 修正输入文字的系统及方法
CN103645876A (zh) * 2013-12-06 2014-03-19 百度在线网络技术(北京)有限公司 语音输入方法和装置
WO2016152408A1 (ja) * 2015-03-26 2016-09-29 京セラドキュメントソリューションズ株式会社 表示入力装置、表示入力装置の制御方法、表示入力装置の制御プログラム
CN105068982A (zh) * 2015-08-26 2015-11-18 百度在线网络技术(北京)有限公司 输入内容的修改方法和装置
CN106022357A (zh) * 2016-05-11 2016-10-12 珠海市魅族科技有限公司 一种数据输入校准的方法及终端
CN106406807A (zh) * 2016-09-19 2017-02-15 北京云知声信息技术有限公司 一种语音修改文字的方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108364653A (zh) * 2018-02-12 2018-08-03 王磊 语音数据处理方法及处理装置
CN108710484A (zh) * 2018-03-12 2018-10-26 西安艾润物联网技术服务有限责任公司 一种通过语音修改车牌号的方法、存储介质及装置
CN108710484B (zh) * 2018-03-12 2021-09-21 西安艾润物联网技术服务有限责任公司 一种通过语音修改车牌号的方法、存储介质及装置
CN108650424A (zh) * 2018-08-14 2018-10-12 奇酷互联网络科技(深圳)有限公司 消息处理方法、系统、可读存储介质及移动终端
CN109284501A (zh) * 2018-08-30 2019-01-29 上海与德通讯技术有限公司 一种文字更正方法、装置、服务器及存储介质
CN110085087A (zh) * 2019-03-21 2019-08-02 合肥精大自动化工程有限公司 一种船控制系统的展示装置
WO2022135259A1 (zh) * 2020-12-22 2022-06-30 维沃移动通信有限公司 语音输入方法、装置及电子设备
CN113378530A (zh) * 2021-06-28 2021-09-10 北京七维视觉传媒科技有限公司 语音编辑方法及装置、设备和介质

Similar Documents

Publication Publication Date Title
CN106952655A (zh) 一种输入方法和终端
US11544458B2 (en) Automatic grammar detection and correction
CN110110041A (zh) 错词纠正方法、装置、计算机装置及存储介质
US20190278841A1 (en) Inverse text normalization for automatic speech recognition
Fowler et al. Effects of language modeling and its personalization on touchscreen typing performance
CN102971725B (zh) 语音输入的字词级纠正
US8170866B2 (en) System and method for increasing accuracy of searches based on communication network
US7719521B2 (en) Navigational interface providing auxiliary character support for mobile and wearable computers
AU2014212844B2 (en) Character and word level language models for out-of-vocabulary text input
TWI408905B (zh) 使用數字鍵之語音輸入
CN108108094A (zh) 一种信息处理方法、终端及计算机可读介质
CN107610698A (zh) 一种实现语音控制的方法、机器人及计算机可读存储介质
CN108227565A (zh) 一种信息处理方法、终端及计算机可读介质
WO2015183699A1 (en) Predictive messaging method
AU2013296732A1 (en) Dynamic context-based language determination
CN104142909A (zh) 一种汉字注音方法及装置
US20130297316A1 (en) Voice entry of sensitive information
CN103777774B (zh) 终端装置及输入法的文字纠错方法
CN111090728A (zh) 一种对话状态跟踪方法、装置及计算设备
CN105469789A (zh) 一种语音信息的处理方法及终端
CN106601256B (zh) 语音识别的方法及移动终端
GB2533842A (en) Text correction based on context
CN106415531A (zh) 用于输入法编辑器的特定于场境的语言模型
WO2023071562A1 (zh) 语音识别文本处理方法、装置、设备、存储介质及程序产品
US20180350390A1 (en) System and method for validating and correcting transcriptions of audio files

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20210108

AD01 Patent right deemed abandoned