CN107832035B - 一种智能终端的语音输入方法 - Google Patents

一种智能终端的语音输入方法 Download PDF

Info

Publication number
CN107832035B
CN107832035B CN201711112882.0A CN201711112882A CN107832035B CN 107832035 B CN107832035 B CN 107832035B CN 201711112882 A CN201711112882 A CN 201711112882A CN 107832035 B CN107832035 B CN 107832035B
Authority
CN
China
Prior art keywords
input
input word
user
path
word bank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711112882.0A
Other languages
English (en)
Other versions
CN107832035A (zh
Inventor
程守宝
赵桂银
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Sihao Intelligent Technology Co.,Ltd.
Original Assignee
Shenzhen Sihao Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Sihao Intelligent Technology Co ltd filed Critical Shenzhen Sihao Intelligent Technology Co ltd
Priority to CN201711112882.0A priority Critical patent/CN107832035B/zh
Publication of CN107832035A publication Critical patent/CN107832035A/zh
Application granted granted Critical
Publication of CN107832035B publication Critical patent/CN107832035B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本发明基于用户当前的语音输入所在的编辑环境建立与其对应的第一输入词库,并结合该第一输入词库和输入法自带输入词库供用户进行语音匹配,由于该第一输入词库是基于当前编辑环境建立的,因此该第一输入词库的文本数量少,进而节约了终端的存储空间;其次,由于该第一输入词库是基于当前编辑环境建立的,词库中文本更符合用户当前的输入需求,因此该第一输入词库的可匹配性更高,从而提高了用户的语音输入效率,改善了用户的输入体验;再次,该第一输入词库根据用户的编辑场景的不同而不同,词库设置的灵活性大大提高,是一种小而精的词库;此外,该第一输入词库可以根据编辑环境的存储路径进行合并或者相近路径的调用,提高了该词库的适用性。

Description

一种智能终端的语音输入方法
技术领域
本申请涉及智能终端控制的技术领域,尤其涉及一种智能终端的语音输入方法。
背景技术
经过多年的技术发展,语音输入作为一种重要的非键盘输入方法已经在平 板电脑、智能手机等设备上得到了广泛的应用。采用语音进行信息数据输入,语音输入质量的高低对语音识别的准确性具有决定性作用,而语音识别的准确性又在很大程度上影响了用户体验的好坏。然而,现有的语音输入技术通常都需要服务器的支持,例如通过客户端录制声音,上传给服务器后,服务器进行语音识别,匹配获得对应的输入候选文本并返回给客户端,由客户端负责后续处理。该种方式的语音识别与输入候选文本匹配主要在网络端实现,依赖于网络连接,且需要庞大的数据模型。对于处理速度、带宽等都受限的用户设备来讲,该种方式不利于用户的使用体验。
针对上述问题,文献CN103699530A提供一种用于在用户设备中根据语音输入信息在目标应用中进行文本输入的方法与设备;通过获取用户通过用户设备的语音采集装置所输入的语音输入信息;对该语音输入信息进行语音识别处理,以获得与该语音输入信息相对应的语言字符串;根据该语言字符串,在与该目标应用所对应的输入法相对应的输入词库中进行匹配查询,以获得与该语言字符串相匹配的一个或多个输入候选文本,将该一个或多个输入候选文本中至少一个提供给该目标应用。
然而,上述方法也存在许多缺陷,首先,上述方法虽然实现了输入词库的本地匹配,但匹配的输入词库由输入法提供,而用户终端的输入法往往有多种,这就会造成用户在终端本地存储多个输入词库,由此造成占用大量的终端存储空间,因此,这种输入匹配与存储的方法效率低下;此外,由于上述方法提供的词库是固定不变的,无法根据用户的使用过程灵活调整,由此造成用户体验不佳;最后,上述方法仅仅针对应用程序进行语音输入与控制,并未考虑用户对终端进行语音输入的其他场景,因此,上述方法的应用存在局限性。
发明内容
针对上述问题,本发明提供一种智能终端的语音输入方法,所述方法包括如下步骤:
S1,检测用户是否启用所述智能终端中输入法中的语音输入功能;如果启用所述语音输入功能,则进入步骤S2;如果未启用所述语音输入功能,则不做任何操作;
S2,检测用户当前输入光标所在的编辑环境中是否存在文本信息,如果存在所述文本信息,则进入步骤S3;如果不存在所述文本信息,则进入步骤S4;
S3,获取所述文本信息,并基于所述文本信息建立与当前编辑环境对应的第一输入词库,所述第一输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;基于所述第一输入词库和所述自带输入词库对用户的语音输入信息进行识别与匹配查询,如果所述语音输入信息与所述第一输入词库匹配成功且所述语音输入信息与所述自带输入词库匹配成功,则直接将所述匹配成功的文本输入到文本编辑区;否则,进入步骤S5;
S4,基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入;
S5,为用户提供输入候选文本以供用户选择,并将用户选择的所述候选文本更新到所述第一输入词库。
作为一种优选的实施方式,将所述第一输入词库存储到与其对应的文本编辑环境相同的存储路径内;检测所述存储路径的子目录和父目录内是否有其他输入词库,如果有,则合并所述第一输入词库和其他输入词库为同路径输入词库,并建立所述同路径输入词库与所述路径下语音输入的对应关系,以供在所述路径下进行语音输入过程中对所述同路径输入词库的调用,所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;如果无,则在所述存储路径的子目录和父目录进行语音输入过程中给用户提供语音输入的所述第一输入词库的调用建议。
作为一种优选的实施方式,所述基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入,具体包括:
检测当前文本编辑环境的存储路径的子目录和父目录内是否有所述同路径输入词库,如果有,则建立所述同路径输入词库和所述输入法自带输入词库与所述当前文本编辑环境的语音输入的对应关系,以供在所述路径下进行语音输入过程中对所述同路径输入词库和所述输入法自带输入词库的调用,所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;如果无,则基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入。
作为一种优选的实施方式,检测用户是否对所述文本编辑区内语音识别输入的文本进行替换操作,如果进行所述替换操作,则在所述第一输入词库中用替换后的文本替换被替换的文本;如果未进行所述替换操作,则不做任何操作。
本发明基于用户当前的语音输入所在的编辑环境建立与其对应的第一输入词库,并结合该第一输入词库和输入法自带输入词库供用户进行语音匹配,由于该第一输入词库是基于当前编辑环境建立的,因此该第一输入词库的文本数量少,进而节约了终端的存储空间;其次,由于该第一输入词库是基于当前编辑环境建立的,词库中文本更符合用户当前的输入需求,因此该第一输入词库的可匹配性更高,从而提高了用户的语音输入效率,改善了用户的输入体验;再次,该第一输入词库根据用户的编辑场景的不同而不同,词库设置的灵活性大大提高,是一种小而精的词库;此外,该第一输入词库可以根据编辑环境的存储路径进行合并或者相近路径的调用,进一步提高了该词库的适用性;最后,本发明的语音输入所在的编辑环境不受限制,应用范围广阔。
此外,发明提供一种智能终端的语音输入装置,所述装置包括如下模块:
语音输入启用模块,用于检测用户是否启用所述智能终端中输入法中的语音输入功能;如果启用所述语音输入功能,则执行文本信息监测模块;如果未启用所述语音输入功能,则不做任何操作;
文本信息监测模块,用于检测用户当前输入光标所在的编辑环境中是否存在文本信息,如果存在所述文本信息,则执行输入词库匹配模块;如果不存在所述文本信息,则执行第一输入模块;
输入词库匹配模块,用于获取所述文本信息,并基于所述文本信息建立与当前编辑环境对应的第一输入词库,所述第一输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;基于所述第一输入词库和所述自带输入词库对用户的语音输入信息进行识别与匹配查询,如果所述语音输入信息与所述第一输入词库匹配成功且所述语音输入信息与所述自带输入词库匹配成功,则直接将所述匹配成功的文本输入到文本编辑区;否则,执行第二输入模块;
第一输入模块,用于基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入;
第二输入模块,用于为用户提供输入候选文本以供用户选择,并将用户选择的所述候选文本更新到所述第一输入词库。
作为一种优选的实施方式,将所述第一输入词库存储到与其对应的文本编辑环境相同的存储路径内;检测所述存储路径的子目录和父目录内是否有其他输入词库,如果有,则合并所述第一输入词库和其他输入词库为同路径输入词库,并建立所述同路径输入词库与所述路径下语音输入的对应关系,以供在所述路径下进行语音输入过程中对所述同路径输入词库的调用,所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;如果无,则在所述存储路径的子目录和父目录进行语音输入过程中给用户提供语音输入的所述第一输入词库的调用建议。
作为一种优选的实施方式,所述基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入,具体包括:
检测当前文本编辑环境的存储路径的子目录和父目录内是否有所述同路径输入词库,如果有,则建立所述同路径输入词库和所述输入法自带输入词库与所述当前文本编辑环境的语音输入的对应关系,以供在所述路径下进行语音输入过程中对所述同路径输入词库和所述输入法自带输入词库的调用,所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;如果无,则基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入。
作为一种优选的实施方式,检测用户是否对所述文本编辑区内语音识别输入的文本进行替换操作,如果进行所述替换操作,则在所述第一输入词库中用替换后的文本替换被替换的文本;如果未进行所述替换操作,则不做任何操作。
本发明基于用户当前的语音输入所在的编辑环境建立与其对应的第一输入词库,并结合该第一输入词库和输入法自带输入词库供用户进行语音匹配,由于该第一输入词库是基于当前编辑环境建立的,因此该第一输入词库的文本数量少,进而节约了终端的存储空间;其次,由于该第一输入词库是基于当前编辑环境建立的,词库中文本更符合用户当前的输入需求,因此该第一输入词库的可匹配性更高,从而提高了用户的语音输入效率,改善了用户的输入体验;再次,该第一输入词库根据用户的编辑场景的不同而不同,词库设置的灵活性大大提高,是一种小而精的词库;此外,该第一输入词库可以根据编辑环境的存储路径进行合并或者相近路径的调用,进一步提高了该词库的适用性;最后,本发明的语音输入所在的编辑环境不受限制,应用范围广阔。
附图说明
图1是本发明的一种智能终端的语音输入装置示意图。
具体实施方式
以下结合附图进一步说明本发明的实施例。
实施例一:
本发明提供一种智能终端的语音输入方法,所述方法包括如下步骤:
S1,检测用户是否启用所述智能终端中输入法中的语音输入功能;如果启用所述语音输入功能,则进入步骤S2;如果未启用所述语音输入功能,则不做任何操作;需要说明的是,用户通过与智能终端的交互,通过其上的语音采集装置输入语音输入信息,如通过麦克风输入语音输入信息,该语音输入信息对应于该用户拟在该用户设备的目标应用中输入的文本;上述语音输入功能通过输入法应用程序中的插件实现,用户通过操作该插件的开关按钮来启动或者关闭语音输入功能。
S2,检测用户当前输入光标所在的编辑环境中是否存在文本信息,如果存在所述文本信息,则进入步骤S3;如果不存在所述文本信息,则进入步骤S4;需要说明的是,上述文本信息可以是文字、字母、数字、标点符号,或者其他标记,在此不作限制。上述输入光标所在的编辑环境可以在文档中,也可以在应用程序的搜索输入框中。
S3,获取所述文本信息,并基于所述文本信息建立与当前编辑环境对应的第一输入词库,所述第一输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;基于所述第一输入词库和所述自带输入词库对用户的语音输入信息进行识别与匹配查询,如果所述语音输入信息与所述第一输入词库匹配成功且所述语音输入信息与所述自带输入词库匹配成功,则直接将所述匹配成功的文本输入到文本编辑区;否则,进入步骤S5;需要说明的是,示例性的,如果输入光标所在的编辑环境为文档,则上述文本信息为文档中的文本;如果输入光标所在的编辑环境为应用程序的搜索输入框,则上述文本信息为搜索输入框中的文本。并基于上述文本建立第一输入词库,该第一输入词库的建立方式与本领域中常规的词库建立方式相同,在此不做赘述。如果所述语音输入信息同时与上述两个词库匹配成功,则表明语音输入匹配的正确性是很高的,此时直接将匹配成功的文本输入到文本编辑区,以提高用户的输入效率;相反,如果上述两个词库只有一个匹配成功或者两个词库都匹配失败,此时无法判断匹配成功的文本是否准确,此时不宜直接将匹配成功的文本输入到文本编辑区,因此,对上述两种情形进行区分。
S4,基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入;需要说明的是,由于当前编辑场景下没有可供用户参考的文本信息,此时不需要建立第一输入词库,进而只能调用与匹配自带输入词库,这种情形与本领域比较常规的输入方式比较类似,在此不作赘述。
S5,为用户提供输入候选文本以供用户选择,并将用户选择的所述候选文本更新到所述第一输入词库。需要说明的是,上述候选文本可以为一个或者多个。为用户提供输入候选文本可以根据上述两个不同的词库来进行区分显示,例如,第一输入词库的候选文本显示在第一行,自带输入词库的候选文本显示在第二行,此外,也可以通过不同的颜色标记上述候选文本,以便于用户进行区分与选择。由于该第一输入词库是基于当前编辑环境建立的,因此该第一输入词库的文本数量少,进而节约了终端的存储空间;其次,由于该第一输入词库是基于当前编辑环境建立的,词库中文本更符合用户当前的输入需求,因此该第一输入词库的可匹配性更高,从而提高了用户的语音输入效率。
需要说明的是,上述智能终端包括但不限于任何可通过语音采集装置与用户进行交互的设备,如手机、笔记本、平板电脑等移动设备,或诸如智能冰箱、智能微波炉等智能家具,或大楼的地图展示器等,本领域技术人员应能理解上述用户设备仅为举例,其他现有的或今后可能出现的用户设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
作为一种优选的实施方式,将所述第一输入词库存储到与其对应的文本编辑环境相同的存储路径内;检测所述存储路径的子目录和父目录内是否有其他输入词库,如果有,则合并所述第一输入词库和其他输入词库为同路径输入词库,并建立所述同路径输入词库与所述路径下语音输入的对应关系,以供在所述路径下进行语音输入过程中对所述同路径输入词库的调用,所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;如果无,则在所述存储路径的子目录和父目录进行语音输入过程中给用户提供语音输入的所述第一输入词库的调用建议。例如,文档A及其第一输入词库存储在路径/E/d/a,文档C及其第二输入词库存储在路径/E/d/a/c,由于文档C存储在文档A的子目录下,此时,合并所述第一输入词库和第二输入词库为同路径输入词库AC,并建立所述同路径输入词库AC与路径/E/d/a或者路径/E/d/a/c下语音输入的对应关系,以供在所述路径下进行语音输入过程中对所述同路径输入词库AC的调用;通过上述词库的合并,避免了相同路径或者相似路径下不同词库之间的数据冗余,从而进一步降低了对存储空间的占用。此外,由于同路径输入词库是基于当前编辑环境建立的,同路径输入词库与语音输入匹配正确的概率要高于输入法自带输入词库,因此,设置其调用优先级高于所述输入法自带输入词库的调用优先级。
作为一种优选的实施方式,所述基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入,具体包括:
检测当前文本编辑环境的存储路径的子目录和父目录内是否有所述同路径输入词库,如果有,则建立所述同路径输入词库和所述输入法自带输入词库与所述当前文本编辑环境的语音输入的对应关系,以供在所述路径下进行语音输入过程中对所述同路径输入词库和所述输入法自带输入词库的调用,所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;如果无,则基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入。例如,文档A及其第一输入词库存储在路径/E/d/a,文档B存储在路径/E/d,由于文档B存储在文档A的父目录下,且文档B没有建立对应的输入词库,此时,如果当前文本编辑环境为文档B,则检测当前文本编辑环境的文档B存储在路径/E/d的子目录/E/d/a和父目录/E内是否有所述同路径输入词库,由于在子目录/E/d/a存在文档A对应的第一输入词库,此时建立所述同路径的第一输入词库和输入法自带输入词库与所述当前文本编辑环境的语音输入的对应关系,以供在路径/E/d下进行语音输入过程中对所述同路径的第一输入词库和所述输入法自带输入词库的调用。此时,调用第一输入词库是考虑到用户通常会将相同或者相似功能、用途的文档、程序存储在相同或者接近的存储路径内;该第一输入词库可以根据编辑环境的存储路径进行合并或者相近路径的调用,进一步提高了该词库的适用性。
作为一种优选的实施方式,检测用户是否对所述文本编辑区内语音识别输入的文本进行替换操作,如果进行所述替换操作,则在所述第一输入词库中用替换后的文本替换被替换的文本;如果未进行所述替换操作,则不做任何操作。需要说明的是,如果用户对语音识别输入的文本进行了替换,比如将A替换为了B,则表明该替换了的文本A不正确的,此时需要对第一输入词库进行错误更新,即将其中的文本A替换为文本B,这样就可以在下次进行相同的语音输入时避免存在同样的错误,从而提高了用户的语音输入效率。这里的文本可以是一次语音输入中的全部或者部分,例如,可以是一次语音输入中的一句话或者是其中的一个或者几个字。
本发明基于用户当前的语音输入所在的编辑环境建立与其对应的第一输入词库,并结合该第一输入词库和输入法自带输入词库供用户进行语音匹配,由于该第一输入词库是基于当前编辑环境建立的,因此该第一输入词库的文本数量少,进而节约了终端的存储空间;其次,由于该第一输入词库是基于当前编辑环境建立的,词库中文本更符合用户当前的输入需求,因此该第一输入词库的可匹配性更高,从而提高了用户的语音输入效率,改善了用户的输入体验;再次,该第一输入词库根据用户的编辑场景的不同而不同,词库设置的灵活性大大提高,是一种小而精的词库;此外,该第一输入词库可以根据编辑环境的存储路径进行合并或者相近路径的调用,进一步提高了该词库的适用性;最后,本发明的语音输入所在的编辑环境不受限制,应用范围广阔。
实施例二:
如图1所示,发明提供一种智能终端的语音输入装置,所述装置包括如下模块:
语音输入启用模块,用于检测用户是否启用所述智能终端中输入法中的语音输入功能;如果启用所述语音输入功能,则执行文本信息监测模块;如果未启用所述语音输入功能,则不做任何操作;需要说明的是,用户通过与智能终端的交互,通过其上的语音采集装置输入语音输入信息,如通过麦克风输入语音输入信息,该语音输入信息对应于该用户拟在该用户设备的目标应用中输入的文本;上述语音输入功能通过输入法应用程序中的插件实现,用户通过操作该插件的开关按钮来启动或者关闭语音输入功能。
文本信息监测模块,用于检测用户当前输入光标所在的编辑环境中是否存在文本信息,如果存在所述文本信息,则执行输入词库匹配模块;如果不存在所述文本信息,则执行第一输入模块;需要说明的是,上述文本信息可以是文字、字母、数字、标点符号,或者其他标记,在此不作限制。上述输入光标所在的编辑环境可以在文档中,也可以在应用程序的搜索输入框中。
输入词库匹配模块,用于获取所述文本信息,并基于所述文本信息建立与当前编辑环境对应的第一输入词库,所述第一输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;基于所述第一输入词库和所述自带输入词库对用户的语音输入信息进行识别与匹配查询,如果所述语音输入信息与所述第一输入词库匹配成功且所述语音输入信息与所述自带输入词库匹配成功,则直接将所述匹配成功的文本输入到文本编辑区;否则,执行第二输入模块;需要说明的是,示例性的,如果输入光标所在的编辑环境为文档,则上述文本信息为文档中的文本;如果输入光标所在的编辑环境为应用程序的搜索输入框,则上述文本信息为搜索输入框中的文本。并基于上述文本建立第一输入词库,该第一输入词库的建立方式与本领域中常规的词库建立方式相同,在此不做赘述。如果所述语音输入信息同时与上述两个词库匹配成功,则表明语音输入匹配的正确性是很高的,此时直接将匹配成功的文本输入到文本编辑区,以提高用户的输入效率;相反,如果上述两个词库只有一个匹配成功或者两个词库都匹配失败,此时无法判断匹配成功的文本是否准确,此时不宜直接将匹配成功的文本输入到文本编辑区,因此,对上述两种情形进行区分。
第一输入模块,用于基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入;需要说明的是,由于当前编辑场景下没有可供用户参考的文本信息,此时不需要建立第一输入词库,进而只能调用与匹配自带输入词库,这种情形与本领域比较常规的输入方式比较类似,在此不作赘述。
第二输入模块,用于为用户提供输入候选文本以供用户选择,并将用户选择的所述候选文本更新到所述第一输入词库。需要说明的是,上述候选文本可以为一个或者多个。为用户提供输入候选文本可以根据上述两个不同的词库来进行区分显示,例如,第一输入词库的候选文本显示在第一行,自带输入词库的候选文本显示在第二行,此外,也可以通过不同的颜色标记上述候选文本,以便于用户进行区分与选择。由于该第一输入词库是基于当前编辑环境建立的,因此该第一输入词库的文本数量少,进而节约了终端的存储空间;其次,由于该第一输入词库是基于当前编辑环境建立的,词库中文本更符合用户当前的输入需求,因此该第一输入词库的可匹配性更高,从而提高了用户的语音输入效率。
需要说明的是,上述智能终端包括但不限于任何可通过语音采集装置与用户进行交互的设备,如手机、笔记本、平板电脑等移动设备,或诸如智能冰箱、智能微波炉等智能家具,或大楼的地图展示器等,本领域技术人员应能理解上述用户设备仅为举例,其他现有的或今后可能出现的用户设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
作为一种优选的实施方式,将所述第一输入词库存储到与其对应的文本编辑环境相同的存储路径内;检测所述存储路径的子目录和父目录内是否有其他输入词库,如果有,则合并所述第一输入词库和其他输入词库为同路径输入词库,并建立所述同路径输入词库与所述路径下语音输入的对应关系,以供在所述路径下进行语音输入过程中对所述同路径输入词库的调用,所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;如果无,则在所述存储路径的子目录和父目录进行语音输入过程中给用户提供语音输入的所述第一输入词库的调用建议。例如,文档A及其第一输入词库存储在路径/E/d/a,文档C及其第二输入词库存储在路径/E/d/a/c,由于文档C存储在文档A的子目录下,此时,合并所述第一输入词库和第二输入词库为同路径输入词库AC,并建立所述同路径输入词库AC与路径/E/d/a或者路径/E/d/a/c下语音输入的对应关系,以供在所述路径下进行语音输入过程中对所述同路径输入词库AC的调用;通过上述词库的合并,避免了相同路径或者相似路径下不同词库之间的数据冗余,从而进一步降低了对存储空间的占用。此外,由于同路径输入词库是基于当前编辑环境建立的,同路径输入词库与语音输入匹配正确的概率要高于输入法自带输入词库,因此,设置其调用优先级高于所述输入法自带输入词库的调用优先级。
作为一种优选的实施方式,所述基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入,具体包括:
检测当前文本编辑环境的存储路径的子目录和父目录内是否有所述同路径输入词库,如果有,则建立所述同路径输入词库和所述输入法自带输入词库与所述当前文本编辑环境的语音输入的对应关系,以供在所述路径下进行语音输入过程中对所述同路径输入词库和所述输入法自带输入词库的调用,所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;如果无,则基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入。例如,文档A及其第一输入词库存储在路径/E/d/a,文档B存储在路径/E/d,由于文档B存储在文档A的父目录下,且文档B没有建立对应的输入词库,此时,如果当前文本编辑环境为文档B,则检测当前文本编辑环境的文档B存储在路径/E/d的子目录/E/d/a和父目录/E内是否有所述同路径输入词库,由于在子目录/E/d/a存在文档A对应的第一输入词库,此时建立所述同路径的第一输入词库和输入法自带输入词库与所述当前文本编辑环境的语音输入的对应关系,以供在路径/E/d下进行语音输入过程中对所述同路径的第一输入词库和所述输入法自带输入词库的调用。此时,调用第一输入词库是考虑到用户通常会将相同或者相似功能、用途的文档、程序存储在相同或者接近的存储路径内;该第一输入词库可以根据编辑环境的存储路径进行合并或者相近路径的调用,进一步提高了该词库的适用性。
作为一种优选的实施方式,检测用户是否对所述文本编辑区内语音识别输入的文本进行替换操作,如果进行所述替换操作,则在所述第一输入词库中用替换后的文本替换被替换的文本;如果未进行所述替换操作,则不做任何操作。需要说明的是,如果用户对语音识别输入的文本进行了替换,比如将A替换为了B,则表明该替换了的文本A不正确的,此时需要对第一输入词库进行错误更新,即将其中的文本A替换为文本B,这样就可以在下次进行相同的语音输入时避免存在同样的错误,从而提高了用户的语音输入效率。这里的文本可以是一次语音输入中的全部或者部分,例如,可以是一次语音输入中的一句话或者是其中的一个或者几个字。
本发明基于用户当前的语音输入所在的编辑环境建立与其对应的第一输入词库,并结合该第一输入词库和输入法自带输入词库供用户进行语音匹配,由于该第一输入词库是基于当前编辑环境建立的,因此该第一输入词库的文本数量少,进而节约了终端的存储空间;其次,由于该第一输入词库是基于当前编辑环境建立的,词库中文本更符合用户当前的输入需求,因此该第一输入词库的可匹配性更高,从而提高了用户的语音输入效率,改善了用户的输入体验;再次,该第一输入词库根据用户的编辑场景的不同而不同,词库设置的灵活性大大提高,是一种小而精的词库;此外,该第一输入词库可以根据编辑环境的存储路径进行合并或者相近路径的调用,进一步提高了该词库的适用性;最后,本发明的语音输入所在的编辑环境不受限制,应用范围广阔。
实施例三:
本发明还提供一种智能终端的语音输入系统,所述语音输入系统执行上述智能终端的语音输入方法。本领域技术人员应当能够理解,上述实施例的方法或者装置实现的语音输入功能均可通过对应的方式在该智能终端的语音输入系统中实现,在此不做赘述。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来生成机器,从而通过计算机或其他可编程数据处理方法的处理器来执行的指令创建了用于实现结构图和/或框图和/或流图的框或多个框中指定的方法。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (7)

1.一种智能终端的语音输入方法,其特征在于,所述方法包括如下步骤:
S1,检测用户是否启用所述智能终端中输入法中的语音输入功能;如果启用所述语音输入功能,则进入步骤S2;如果未启用所述语音输入功能,则不做任何操作;
S2,检测用户当前输入光标所在的编辑环境中是否存在文本信息,如果存在所述文本信息,则进入步骤S3;如果不存在所述文本信息,则进入步骤S4;
S3,获取所述文本信息,并基于所述文本信息建立与当前编辑环境对应的第一输入词库,所述第一输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;基于所述第一输入词库和所述自带输入词库对用户的语音输入信息进行识别与匹配查询,如果所述语音输入信息与所述第一输入词库匹配成功且所述语音输入信息与所述自带输入词库匹配成功,则直接将所述匹配成功的文本输入到文本编辑区;否则,进入步骤S5;
S4,基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将匹配结果提供给所述用户进行选择与输入;
S5,为用户提供输入候选文本以供用户选择,并将用户选择的所述候选文本更新到所述第一输入词库;
还包括:
将所述第一输入词库存储到与其对应的文本编辑环境相同的存储路径内;检测所述存储路径的子目录和父目录内是否有其他输入词库,如果有,则合并所述第一输入词库和其他输入词库为同路径输入词库,并建立所述同路径输入词库与所述路径下语音输入的对应关系,以供在所述路径下进行语音输入过程中对所述同路径输入词库的调用,所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;如果无,则在所述存储路径的子目录和父目录进行语音输入过程中给用户提供语音输入的所述第一输入词库的调用建议。
2.根据权利要求1所述的方法,其特征在于,所述基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入,具体包括:
检测当前文本编辑环境的存储路径的子目录和父目录内是否有所述同路径输入词库,如果有,则建立所述同路径输入词库和所述输入法自带输入词库与所述当前文本编辑环境的语音输入的对应关系,以供在所述路径下进行语音输入过程中对所述同路径输入词库和所述输入法自带输入词库的调用,所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;如果无,则基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入。
3.根据权利要求1所述的方法,其特征在于:
检测用户是否对所述文本编辑区内语音识别输入的文本进行替换操作,如果进行所述替换操作,则在所述第一输入词库中用替换后的文本替换被替换的文本;如果未进行所述替换操作,则不做任何操作。
4.一种智能终端的语音输入装置,其特征在于,所述装置包括如下模块:
语音输入启用模块,用于检测用户是否启用所述智能终端中输入法中的语音输入功能;如果启用所述语音输入功能,则执行文本信息监测模块;如果未启用所述语音输入功能,则不做任何操作;
文本信息监测模块,用于检测用户当前输入光标所在的编辑环境中是否存在文本信息,如果存在所述文本信息,则执行输入词库匹配模块;如果不存在所述文本信息,则执行第一输入模块;
输入词库匹配模块,用于获取所述文本信息,并基于所述文本信息建立与当前编辑环境对应的第一输入词库,所述第一输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;基于所述第一输入词库和所述自带输入词库对用户的语音输入信息进行识别与匹配查询,如果所述语音输入信息与所述第一输入词库匹配成功且所述语音输入信息与所述自带输入词库匹配成功,则直接将所述匹配成功的文本输入到文本编辑区;否则,执行第二输入模块;
第一输入模块,用于基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将匹配结果提供给所述用户进行选择与输入;
第二输入模块,用于为用户提供输入候选文本以供用户选择,并将用户选择的所述候选文本更新到所述第一输入词库;
还包括:
将所述第一输入词库存储到与其对应的文本编辑环境相同的存储路径内;检测所述存储路径的子目录和父目录内是否有其他输入词库,如果有,则合并所述第一输入词库和其他输入词库为同路径输入词库,并建立所述同路径输入词库与所述路径下语音输入的对应关系,以供在所述路径下进行语音输入过程中对所述同路径输入词库的调用,所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;如果无,则在所述存储路径的子目录和父目录进行语音输入过程中给用户提供语音输入的所述第一输入词库的调用建议。
5.根据权利要求4所述的装置,其特征在于,所述基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入,具体包括:
检测当前文本编辑环境的存储路径的子目录和父目录内是否有所述同路径输入词库,如果有,则建立所述同路径输入词库和所述输入法自带输入词库与所述当前文本编辑环境的语音输入的对应关系,以供在所述路径下进行语音输入过程中对所述同路径输入词库和所述输入法自带输入词库的调用,所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级;如果无,则基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询,将所述匹配结果提供给所述用户进行选择与输入。
6.根据权利要求4所述的装置,其特征在于:
检测用户是否对所述文本编辑区内语音识别输入的文本进行替换操作,如果进行所述替换操作,则在所述第一输入词库中用替换后的文本替换被替换的文本;如果未进行所述替换操作,则不做任何操作。
7.一种智能终端的语音输入系统,其特征在于,所述语音输入系统执行权利要求1-3的所述智能终端的语音输入方法。
CN201711112882.0A 2017-11-13 2017-11-13 一种智能终端的语音输入方法 Active CN107832035B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711112882.0A CN107832035B (zh) 2017-11-13 2017-11-13 一种智能终端的语音输入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711112882.0A CN107832035B (zh) 2017-11-13 2017-11-13 一种智能终端的语音输入方法

Publications (2)

Publication Number Publication Date
CN107832035A CN107832035A (zh) 2018-03-23
CN107832035B true CN107832035B (zh) 2021-03-12

Family

ID=61655149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711112882.0A Active CN107832035B (zh) 2017-11-13 2017-11-13 一种智能终端的语音输入方法

Country Status (1)

Country Link
CN (1) CN107832035B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109741750A (zh) * 2018-05-09 2019-05-10 北京字节跳动网络技术有限公司 一种语音识别的方法、文件处理方法及终端设备
CN109213469A (zh) * 2018-08-27 2019-01-15 四川长虹电器股份有限公司 语音输入法词库优先级自动调整方法及系统
CN109712613B (zh) * 2018-12-27 2021-04-20 北京百佑科技有限公司 语义分析库更新方法、装置及电子设备
CN112068793B (zh) * 2019-06-11 2024-08-30 北京搜狗科技发展有限公司 一种语音输入方法及装置
CN110675871B (zh) * 2019-09-25 2021-03-05 北京蓦然认知科技有限公司 一种语音识别方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101051323A (zh) * 2007-05-22 2007-10-10 北京搜狗科技发展有限公司 一种字符输入的方法、输入法系统及词库更新的方法
CN101149757A (zh) * 2007-11-09 2008-03-26 腾讯科技(深圳)有限公司 一种实现场景化文字输入的方法
CN101334774A (zh) * 2007-06-29 2008-12-31 北京搜狗科技发展有限公司 一种字符输入的方法和输入法系统
CN102508554A (zh) * 2011-10-02 2012-06-20 上海量明科技发展有限公司 一种通信关联的输入方法、个性语库及系统
WO2012152097A1 (zh) * 2011-11-09 2012-11-15 中兴通讯股份有限公司 输入法词库的更新方法、字符输入方法及终端
CN103049458A (zh) * 2011-10-17 2013-04-17 北京搜狗科技发展有限公司 一种修正用户词库的方法和系统
CN103218447A (zh) * 2013-04-24 2013-07-24 东莞宇龙通信科技有限公司 一种联想输入方法及装置
CN103699530A (zh) * 2012-09-27 2014-04-02 百度在线网络技术(北京)有限公司 根据语音输入信息在目标应用中输入文本的方法与设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101051323A (zh) * 2007-05-22 2007-10-10 北京搜狗科技发展有限公司 一种字符输入的方法、输入法系统及词库更新的方法
CN101334774A (zh) * 2007-06-29 2008-12-31 北京搜狗科技发展有限公司 一种字符输入的方法和输入法系统
CN101149757A (zh) * 2007-11-09 2008-03-26 腾讯科技(深圳)有限公司 一种实现场景化文字输入的方法
CN102508554A (zh) * 2011-10-02 2012-06-20 上海量明科技发展有限公司 一种通信关联的输入方法、个性语库及系统
CN103049458A (zh) * 2011-10-17 2013-04-17 北京搜狗科技发展有限公司 一种修正用户词库的方法和系统
WO2012152097A1 (zh) * 2011-11-09 2012-11-15 中兴通讯股份有限公司 输入法词库的更新方法、字符输入方法及终端
CN103699530A (zh) * 2012-09-27 2014-04-02 百度在线网络技术(北京)有限公司 根据语音输入信息在目标应用中输入文本的方法与设备
CN103218447A (zh) * 2013-04-24 2013-07-24 东莞宇龙通信科技有限公司 一种联想输入方法及装置

Also Published As

Publication number Publication date
CN107832035A (zh) 2018-03-23

Similar Documents

Publication Publication Date Title
CN107832035B (zh) 一种智能终端的语音输入方法
CN110502608B (zh) 基于知识图谱的人机对话方法及人机对话装置
CN108170859B (zh) 语音查询的方法、装置、存储介质及终端设备
US9508028B2 (en) Converting text strings into number strings, such as via a touchscreen input
US20190279622A1 (en) Method for speech recognition dictation and correction, and system
CN110164435A (zh) 语音识别方法、装置、设备及计算机可读存储介质
CN110415679B (zh) 语音纠错方法、装置、设备和存储介质
KR102046486B1 (ko) 정보 입력 방법
US20120330662A1 (en) Input supporting system, method and program
JP2012230670A (ja) 戻ることによって誤認識を修正するシステム、方法及びコンピュータプログラム
EP3029567B1 (en) Method and device for updating input method system, computer storage medium, and device
JP2015510176A (ja) 入力処理方法及び装置
CN107564526B (zh) 处理方法、装置和机器可读介质
CN108121455B (zh) 识别纠正方法及装置
CN104135577A (zh) 一种基于自定义语音实现快速查找联系人的方法和装置
CN107894882B (zh) 一种移动终端的语音输入方法
CN111198936B (zh) 一种语音搜索方法、装置、电子设备及存储介质
CN111259170A (zh) 一种语音搜索方法、装置、电子设备及存储介质
CN111143556A (zh) 软件功能点自动计数方法、装置、介质及电子设备
CN112163074A (zh) 用户意图识别方法、装置、可读存储介质及电子设备
CN112052005A (zh) 界面处理方法、装置、设备及存储介质
CN115879440A (zh) 自然语言处理、模型训练方法、装置、设备及存储介质
CN113268246B (zh) 正则表达式的生成方法、装置及计算机设备
CN114242047A (zh) 一种语音处理方法、装置、电子设备及存储介质
CN101198124A (zh) 一种移动终端输入信息处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Cheng Shoubao

Inventor after: Zhao Guiyin

Inventor before: Zhao Guiyin

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210128

Address after: 518000 1201-2, 3118 Longgang Avenue (Henggang section), Liuyue community, Henggang street, Longgang District, Shenzhen City, Guangdong Province

Applicant after: Shenzhen Sihao Intelligent Technology Co.,Ltd.

Address before: 301800 Baoxing garden, Jinwei Road, Chaoyang Street, Baodi District, Tianjin

Applicant before: Zhao Guiyin

GR01 Patent grant
GR01 Patent grant