CN106406804A - 一种基于语音的输入方法及装置 - Google Patents

一种基于语音的输入方法及装置 Download PDF

Info

Publication number
CN106406804A
CN106406804A CN201610815756.0A CN201610815756A CN106406804A CN 106406804 A CN106406804 A CN 106406804A CN 201610815756 A CN201610815756 A CN 201610815756A CN 106406804 A CN106406804 A CN 106406804A
Authority
CN
China
Prior art keywords
phrase
user
mode
voice
intended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610815756.0A
Other languages
English (en)
Other versions
CN106406804B (zh
Inventor
李瑾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610815756.0A priority Critical patent/CN106406804B/zh
Publication of CN106406804A publication Critical patent/CN106406804A/zh
Application granted granted Critical
Publication of CN106406804B publication Critical patent/CN106406804B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供了一种基于语音的输入方法及装置,该方法包括:接收用户输入的字符串信息,生成候选词列表;在语音筛选模式下,采集用户的语音信息;依据预设的匹配规则对所述语音信息进行匹配,得到至少一个意图词组;将所述意图词组在所述候选词列表中进行优先排序。本发明能够简化用户的输入操作,提升用户的输入效率。

Description

一种基于语音的输入方法及装置
【技术领域】
本发明涉及输入法技术领域,尤其涉及一种基于语音的输入方法及装置。
【背景技术】
随着信息时代的发展,人们无时无刻都在与外界进行着沟通与交流,其中应用最多的媒介就是文字。人们日常的工作、学习和生活,都与各种文字信息紧密相关,而对文字的编辑,例如撰写文档或者发送信息时,都离不开输入法的应用。
在现有技术中,用户利用输入法完成文字的输入操作时,首先要输入该文字的字符串信息,然后在产生的候选词列表中对输入文字进行选择。如果当前显示的候选词列表中没有用户想要输入的内容,用户就需要对候选词列表翻页进行查找。特别是对于生僻词或者用户自己的组词等进行输入时,用户往往需要对每个字进行逐一地翻页查找,因此造成输入效率低下,操作过程复杂。
【发明内容】
有鉴于此,本发明提供了一种基于语音的输入方法及装置,以便于简化用户的输入操作,提高用户的输入效率。
本发明为解决技术问题而采用的技术方案是提供一种基于语音的输入方法,其特征在于,所述方法包括:接收用户输入的字符串信息,生成候选词列表;在语音筛选模式下,采集用户的语音信息;依据预设的匹配规则对所述语音信息进行匹配,得到至少一个意图词组;将所述意图词组在所述候选词列表中进行优先排序。
根据本发明一优选实施例,所述用户输入的字符串信息为:拼音。
根据本发明一优选实施例,在所述采集用户的语音信息之前还包括:在用户操作的触发下,进入语音筛选模式,或者默认进入语音筛选模式。
根据本发明一优选实施例,所述依据预设的匹配规则对所述语音信息进行匹配,得到至少一个意图词组包括:对所述语音信息进行识别,得到识别结果;采用预设的匹配规则对所述识别结果进行匹配,得到至少一个意图词组。
根据本发明一优选实施例,所述采用预设的匹配规则对所述识别结果进行匹配,得到至少一个意图词组包括:判断所述识别结果是否由至少一个A的B模式的表达构成,其中所述B为所述A中的部分组成;如果是,则提取所述B;利用提取出的所述B,形成意图词组。
根据本发明一优选实施例,所述在形成意图词组之前还包括:判断提取出的所述B是否与用户输入的字符串信息匹配,如果是,则由提取出的所述B形成意图词组;否则匹配失败,显示提示信息。
根据本发明一优选实施例,若所述识别结果并非由至少一个A的B的模式的表达构成,则匹配失败,显示提示信息。
根据本发明一优选实施例,所述由提取出的所述B,形成意图词组包括:若所述识别结果仅包含一个A的B模式,且从该A的B模式中仅提取出一个B,则利用该一个B形成意图词组;若所述识别结果仅包含一个A的B模式,且从该A的B模式中提取出多个可能的B,则利用各B分别形成意图词组;若所述识别结果包含两个以上A的B模式,则将各A的B模式中提取出的B按顺序进行组合,形成意图词组。
根据本发明一优选实施例,将所述意图词组在所述候选词列表中进行优先排序包括:将所述意图词组排在所述候选词列表中其他词语前面。
根据本发明一优选实施例,若存在两个以上的意图词组,则各意图词组在所述候选词列表中按照输入热度或搜索热度进行排序。
本发明还提供了一种基于语音的输入装置,其特征在于,该装置包括:
接收单元,用于接收用户输入的字符串信息,生成候选词列表;
采集单元,用于在语音筛选模式下,采集用户的语音信息;
处理单元,用于依据预设的匹配规则对所述语音信息进行匹配,得到至少一个意图词组;
展示单元,用于将所述意图词组在所述候选词列表中进行优先排序。
根据本发明一优选实施例,所述接收单元获取用户的字符串信息为:拼音。
根据本发明一优选实施例,所述采集单元在采集用户的语音信息之前进一步执行:在用户操作的触发下,进入语音筛选模式,或者默认进入语音筛选模式。
根据本发明一优选实施例,所述处理单元,具体用于对所述语音信息进行识别,得到识别结果;采用预设的匹配规则对所述识别结果进行匹配,得到至少一个意图词组。
根据本发明一优选实施例,所述处理单元在采用预设的匹配规则对所述识别结果进行匹配,得到至少一个意图词组时,具体执行:判断所述识别结果是否至少由一个A的B模式的表达构成,其中所述B为所述A中的部分组成;如果是,则提取所述B;利用提取出的所述B,形成意图词组。
根据本发明一优选实施例,所述处理单元在形成意图词组之前,进一步执行:判断提取出的所述B是否与用户输入的字符串信息匹配,如果是,则由提取出的所述B形成意图词组;否则匹配失败,显示提示信息。
根据本发明一优选实施例,若所述识别结果并非由至少一个A的B模式的表达构成,则所述处理单元确定匹配失败,由所述展示单元显示提示信息。
根据本发明一优选实施例,所述处理单元利用提取出的所述B,形成意图词组时,具体执行:若所述识别结果仅包含一个A的B模式,且从该A的B模式中仅提取出一个B,则利用该一个B形成意图词组;若所述识别结果仅包含一个A的B模式,且从该A的B模式中提取出多个可能的B,则利用各B分别形成意图词组;若所述识别结果包含两个以上A的B模式,则将各A的B模式中提取出的B按顺序进行组合,形成意图词组。
根据本发明一优选实施例,所述展示单元在将所述意图词组在所述候选词列表中进行优先排序时,进一步执行:将所述意图词组排在所述候选词列表中其他词语之前。
根据本发明一优选实施例,所述展示单元,还用于若存在两个以上的意图词组,则将各意图词组在所述候选词列表中按照输入热度或搜索热度进行排序。
由以上技术方案可以看出,本发明在输入时开启语音筛选模式,利用采集的用户的语音信息,依据预设的匹配规则得到用户想要输入的至少一个意图词组,并将所有匹配得到的意图词组在候选词列表中按照一定的优先次序进行排列展示。这种方式,当用户输入生僻词或者自造词时,能够充分利用用户的语音信息,对用户想要输入的内容进行快速筛选及定位,从而大大简化了输入操作,提升了输入效率。
【附图说明】
图1为本发明实施例提供的方法流程图。
图2为本发明一实施例提供的进入语音筛选模式的示意图。
图3为本发明实施例提供的装置结构示意图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
图1为本发明实施例提供的方法流程图,如图1所示,该方法可以主要包括以下步骤:
在101中,接收用户输入的字符串信息,生成候选词列表。
在本步骤中,用户输入的字符串信息为拼音,即本发明可以适用于拼音输入法,但本发明并不限于拼音输入法。
本步骤的实现与现有技术相同,在此不再详述。
在102中,在语音筛选模式下,采集用户的语音信息。
可选地,在本实施例的一个可能的实现过程中,可以通过用户操作的触发,进入语音筛选模式。在输入法面板上存在进入语音筛选模式的按钮,当由用户输入的字符串信息得到的当前候选词列表里,没有用户想要输入的内容时,用户点击该按钮进入语音筛选模式。例如,通过点击输入法面板中预设的按钮进入语音筛选模式,如图2中所示的话筒图标的按钮。当然,除了图2中所示按钮的方式之外,也可以通过其他操作方式触发,例如通过长按空格键,等等。
也可以默认进入语音筛选模式。例如,可以默认输入法一直处于语音筛选模式,也可以在生成候选词列表后自动进入语音筛选模式。进入语音筛选模式后,开始对用户的语音信息进行采集。若在语音筛选模式下捕捉到用户从候选词列表中选择候选词进行上屏的操作,则可以退出语音筛选模式,也可以保持语音筛选模式,但将用户从候选词列表中选择的候选词进行上屏。
在语音筛选模式下,开启语音采集功能,用户需要按照预设的模式来进行语音的输入。在本发明实施例中,用户需要按照预设的模式表达进行语音输入,诸如按照“A的B”模式进行语音输入,可以仅输入一个“A的B”模式的表达,也可以连续输入多个“A的B”模式的表达。具体将在后续详述。
在103中,依据预设的匹配规则对所述语音信息进行匹配,得到至少一个意图词组。
在本步骤中,可以先对采集到的用户的语音信息进行识别,得到识别结果,然后再依据预设的匹配规则对识别结果进行匹配,得到至少一个意图词组。其中得到的意图词组可以是字、词或者复杂的句等,本发明对意图词组的内容不进行限定。
可选地,在本实施例的一个具体实现过程中,预设的匹配规则可以为“A的B”模式,即用户需要以该“A的B”格式的语音进行输入,并对该模式中“的”后面的内容进行提取,其中B是A的部分组成。
上面已经提及,用户需要按照预设的模式表达进行语音输入,若用户输入的语音并不符合预设的表达模式,则认为匹配失败,可以在输入法界面上显示提示信息,例如显示“语音输入错误”之类的提示信息。例如,在用户的语音输入完成后,输入法判断语音信息的识别结果是否由至少一个“A的B”模式的表达构成,如果是,提取B形成意图词组;如果不是,则匹配失败,显示提示信息。
举例来说,用户通过语音输入“玫瑰的玫”,将用户的语音识别成文字后,判断该输入符合预设的匹配规则“A的B”模式,则提取“玫”用于形成意图词组;如果用户通过语音输入“玫瑰中有玫”,该语音输入不符合匹配规则“A的B”模式,则匹配失败,显示提示信息。
再举例来说,用户通过语音输入“玫瑰的香”,由于其中的“香”并不是“玫瑰”中的部分组成,即该语音输入格式中B不是A的组成部分,同样认为匹配失败,显示提示信息。
可选地,在本实施例的一个具体实现过程中,在形成意图词组之前可以首先判断提取出的B是否与输入的字符串信息相匹配,如果是,提取B用于形成意图词组;如果不是,则匹配失败,并显示提示信息。
举例来说,用户输入的字符串信息为“mei”,若通过语音输入[méi gui de méi],由于[méi gui]的含义固定,可以认为是“玫瑰”,则提取内容为“玫”,该内容与用户输入的字符串信息“mei”相匹配,则将“玫”作为意图词组;如果用户通过语音输入[fěn hóng de fěn],提取内容为“粉”,该提取内容与用户输入的“mei”不匹配,则匹配失败,显示提示信息。
再举一个例子,用户输入的字符串信息为“meifen”,如果通过语音输入[méi guide méi、fěn hóng de fěn],即“玫瑰的玫、粉红的粉”,从中提取出“玫”和“粉”。由于“玫”和“粉”与输入的字符串“meifen”匹配,可以认为匹配成功。或者如果用户通过语音输入[méigui de méi],从中提取出“玫”,而“玫”是“meifen”中的一部分,也可以认为匹配成功,提取出“玫”用于形成意图词组。但若用户通过语音输入[méi gui de gui],,提取出的“瑰”并非“meifen”中的一部分,也与“meifen”不一致,可以认为匹配失败。
可选地,在本实施例的一个具体实现过程中,提取出的所述B,形成意图词组包括:若所述识别结果仅包含一个A的B模式,且从该A的B模式中仅提取出一个B,则利用该一个B形成意图词组。
若用户输入的语音只有一个识别结果,即不存在相同语音的其他识别结果,例如,用户输入语音[méi gui],则仅得到一个识别结果“玫瑰”,输入语音[yālìguō],则仅得到一个识别结果“压力锅”等,则可以从中提取出唯一一个B,这种情况可以直接利用提取的B形成意图词组。
举个例子,若用户输入字符串“beizi”,在候选词列表中会包含“被子”、“杯子”、“辈子”、“贝子”、“褙子”等等词。若用户输入语音[wǎn bèi de bèi],可以唯一提取出“辈”,那么在利用“辈”形成意图词组时,可以将“辈”在候选词列表中进行匹配,将匹配到的“辈子”作为意图词组。
可选地,在本实施例的一个具体实现过程中,提取出的所述B,形成意图词组还包括:若所述识别结果仅包含一个A的B模式,且从该A的B模式中提取出多个可能的B,则利用各B分别形成意图词组。
举例来说,若识别结果中的A具有相同的发音但其组成不同,需要将所有可能的B提取用于形成意图词组。例如,用户输入字符串“lizi”,在候选词列表里会包含“例子”、“栗子”、“粒子”等,用户通过语音输入[w ēi lìde lì],对[wēi lì]进行语音识别后得到的内容可以为“威力”、“微粒”、“微利”等,输入法无法区分用户到底想要输入的是哪一个[lì],因此将“力”、“粒”、“利”等所有可能的匹配结果进行提取,并分别利用这些匹配结果形成“力子”、“粒子”、“利子”等意图词组。
可选地,在本实施例的一个具体实现过程中,提取出的所述B,形成意图词组还进一步包括:若所述识别结果包含两个以上A的B模式,则将各A的B模式中提取出的B按顺序进行组合,形成意图词组。
举例来说,若用户要进行输入的内容由多个词语组成,则用户需要输入多个“A的B”模式的语音,然后将从每个A中提取的B进行组合,得到意图词组。例如,用户想要输入一个自造词“海玫天”,输入的字符串为“haimeitian”,生成的候选词列表中会包含“还每天”、“还没填”等内容。用户通过语音输入[dàhǎi de hǎi、méi gui de méi、tiān kōng de tiān],从用户的语音信息中可以唯一提取出“海”、“玫”和“天”,将提取的内容按照输入顺序组合,得到组合结果“海玫天”形成意图词组。
在104中,将所述意图词组在所述候选词列表中进行优先排序。
可选地,在本实施例的一个具体实现过程中,将所述意图词组在所述候选词列表中进行优先排序包括:将所述意图词组排在所述候选词列表中其他词语前面;如果存在两个以上的意图词组,则将各意图词组在所述候选词列表中按照输入热度或搜索热度进行排序,还可以以其他方式进行排序,例如按照词语的笔画多少等进行排序。
举例来说,若用户输入的字符串为“shi”,候选词列表中包含“是”、“时”、“使”、“事”等内容,用户通过语音输入[zhuāng shìde shì],可以唯一提取出“饰”,在候选词列表中对“饰”进行匹配,将匹配到的“饰”字排在候选词列表的首位。
再举例来说,若用户语音输入的内容对应两个以上的意图词组,则将两个以上的意图词组按一定顺序排序展示。例如,用户输入的字符串为“jiechu”,候选词列表中会包含“接触”、“解除”、“结出”、“杰出”等内容,用户通过语音输入[zhāng jié de jié、wài chūde chū],由[wài chū de chū]可以提取唯一的结果“出”,而与[zhāng jié]读音一样的词会包含“章节”、“张洁”和“张杰”等词,因此语音信息的匹配结果不唯一,则将“节”、“洁”和“杰”等全部提取,假如按照“zhangjie”的输入热度或搜索热度得到“张杰”的热度最高,“章节”、“张洁”等排在其后,则将“杰”、“节”、“洁”等依次与“出”进行组合,把得到的意图词组“杰出”排在候选词列表首位,“节出”、“洁出”等内容依次在候选词列表中排序。
采用本发明提供的技术方案,可以利用用户的语音信息,依据预设的匹配规则,对用户要输入包括普通字、普通词的内容进行快速筛选和定位,同时也满足用户对生僻字、生僻词或者自造词的快速输入,可以使用户不需要手动或者语音控制翻页进行逐个字的查找,从而简化了输入操作,提升了用户的输入效率。
本发明实施例的上述方法可以由输入装置来执行,该装置可以位于本地终端的应用(例如输入法应用),或者还可以为位于本地终端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,或者,还可以位于服务器端,本发明实施例对此不进行特别限定。
图3为本发明实施例提供的装置结构示意图,如图3所示。本实施例的基于语音的输入装置包括接收单元21、采集单元22、处理单元23和展示单元24。其中,接收单元21,用于接收用户输入的字符串信息,并生成候选词列表;采集单元22,用于在语音筛选模式下,采集用户的语音信息;处理单元23,用于依据预设的匹配规则对所述语音信息进行匹配,得到至少一个意图词组;展示单元24,用于将所述意图词组在所述候选词列表中进行优先排序。
接收单元21,接收用户输入的字符串信息为拼音,即本发明可以适用于拼音输入法,但本发明并不限于拼音输入法。
可选地,在本发明实施例的一个可能的实现过程中,采集单元22,在语音筛选模式下,采集用户的语音信息之前,可以通过用户操作的触发,进入语音筛选模式,例如,通过点击输入法面板中预设的按钮进入语音筛选模式;或者默认进入语音筛选模式,例如,可以默认输入法一直处于语音筛选模式,也可以在生成候选词列表后自动进入语音筛选模式。进入语音筛选模式后,开始对用户的语音信息进行采集。若在语音筛选模式下捕捉到用户从候选词列表中选择候选词进行上屏的操作,则可以退出语音筛选模式,也可以保持语音筛选模式,但将用户从候选词列表中选择的候选词进行上屏。
在语音筛选模式下,开启语音采集功能。用户可以按照预设的模式来进行语音的输入。在本发明实施例中,用户需要按照预设的模式表达进行语音输入,诸如按照“A的B”模式进行语音输入,可以仅输入一个“A的B”模式的表达,也可以连续输入多个“A的B”模式的表达。
处理单元23,用于依据预设的匹配规则对所述语音信息进行匹配,得到至少一个意图词组。其中,可以先对采集到的用户的语音信息进行识别,得到识别结果,然后再依据预设的匹配规则对识别结果进行匹配,得到至少一个意图词组。其中得到的意图词组可以是字、词或者复杂的句等,本发明对意图词组的内容不进行限定。
可选地,在本实施例的一个具体实现过程中,预设的匹配规则可以为“A的B”模式,即用户需要以该“A的B”格式的语音进行输入,并对该模式中“的”后面的内容进行提取,其中B是A的部分组成。
上面已经提及,用户需要按照预设的模式表达进行语音输入,若用户输入的语音并不符合预设的模式表达,则认为匹配失败,可以在输入法界面上显示提示信息,例如显示“语音输入错误”之类的提示信息。例如,在用户的语音输入完成后,输入法判断语音信息的识别结果是否由至少一个“A的B”模式的表达构成,如果是,提取B形成意图词组;如果不是,则匹配失败,显示提示信息。
举例来说,用户通过语音输入“玫瑰的玫”,将用户的语音识别成文字后,判断该输入符合预设的匹配规则“A的B”模式,则提取“玫”用于形成意图词组;如果用户通过语音输入“玫瑰中有玫”,该语音输入不符合匹配规则“A的B”模式,则匹配失败,显示提示信息。
再举例来说,用户通过语音输入“玫瑰的香”,由于其中的“香”并不是“玫瑰”中的部分组成,即该语音输入格式中B不是A的组成部分,同样认为匹配失败,显示提示信息。
可选地,在本实施例的一个具体实现过程中,在形成意图词组之前可以首先判断提取出的B是否与输入的字符串信息相匹配,如果是,提取B用于形成意图词组;如果不是,则匹配失败,并显示提示信息。
举例来说,用户输入的字符串信息为“mei”,如果通过语音输入[méi gui de méi],由于[méi gui]的含义固定,可以认为是“玫瑰”,则提取内容为“玫”,该内容与用户输入的字符串信息“mei”相匹配,则将“玫”作为意图词组;如果用户通过语音输入[fěn hóng defěn],提取内容为“粉”,该内容与用户输入的“mei”不匹配,则匹配失败,显示提示信息。
再举一个例子,用户输入的字符串信息为“meifen”,如果通过语音输入[méi guide méi、fěn hóng de fěn],即“玫瑰的玫、粉红的粉”,从中提取出“玫”和“粉”。由于“玫”和“粉”与输入的字符串“meifen”匹配,可以认为匹配成功。或者如果用户通过语音输入[méigui de méi],从中提取出“玫”,而“玫”是“meifen”中的一部分,也可以认为匹配成功,提取出“玫”用于形成意图词组。但若用户通过语音输入[méi gui de gui],,提取出的“瑰”并非“meifen”中的一部分,也与“meifen”不一致,可以认为匹配失败。
可选地,在本实施例的一个具体实现过程中,提取出的所述B,形成意图词组包括:若所述识别结果仅包含一个A的B模式,且从该A的B模式中仅提取出一个B,则利用该一个B形成意图词组。
若用户输入的语音只有一个识别结果,即不存在相同语音的其他识别结果,例如,用户输入语音[méi gui],则仅得到一个识别结果“玫瑰”,输入语音[yā lì guō],则仅得到一个识别结果“压力锅”等,则可以从中提取出唯一一个B,这种情况可以利用提取的B形成意图词组。
举个例子,若用户输入字符串“beizi”,在候选词列表中会包含“被子”、“杯子”、“辈子”、“贝子”、“褙子”等等词。若用户输入语音[wǎn bèi de bèi],可以唯一提取出“辈”,那么在利用“辈”形成意图词组时,可以将“辈”在候选词列表中进行匹配,将匹配到的“辈子”作为意图词组。
可选地,在本实施例的一个具体实现过程中,提取出的所述B,形成意图词组还包括:若所述识别结果仅包含一个A的B模式,且从该A的B模式中提取出多个可能的B,则利用各B分别形成意图词组。
举例来说,若识别结果中的A具有相同的发音但其组成不同,需要将所有可能的B提取用于形成意图词组。例如,用户输入字符串“lizi”,在候选词列表里会包含“例子”、“栗子”、“粒子”等,用户通过语音输入[wēi lìde lì],由[wēi lì]得到的内容可以为“威力”、“微粒”、“微利”等,输入法无法区分用户到底想要输入的是哪一个[lì],因此将“力”、“粒”、“利”等所有可能的匹配结果提取出来,并分别利用这些匹配结果形成“力子”、“粒子”、“利子”等意图词组。
可选地,在本实施例的一个具体实现过程中,提取出的所述B,形成意图词组还进一步包括:若所述识别结果包含两个以上A的B模式,则将各A的B模式中提取出的B按顺序进行组合,形成意图词组。
举例来说,若用户要进行输入的内容由多个词语组成,则用户需要输入多个“A的B”模式的语音,将从每个A中提取的B进行组合得到意图词组。例如,用户想要输入一个自组词“海玫天”,输入的字符串为“haimeitian”,生成的候选词列表中会包含“还每天”、“还没填”等内容。用户语音输入[dàhǎi de hǎi、méi gui de méi、tiān kōng de tiān],从用户的语音信息中可以唯一提取出“海”、“玫”和“天”,将提取的内容按照输入顺序组合,得到“海玫天”形成意图词组。
展示单元24,用于将所述意图词组在所述候选词列表中进行优先排序。
可选地,在本实施例的一个具体实现过程中,将所述意图词组在所述候选词列表中进行优先排序包括:将所述意图词组排在所述候选词列表中其他词语前面;如果存在两个以上的意图词组,则将各意图词组在所述候选词列表中按照输入热度或搜索热度进行排序,还可以按照词语的常用程度等进行排序。
举例来说,若用户输入法的字符串为“shi”,当前生成的候选词列表中有“是”、“时”、“使”、“事”等内容,用户语音输入[zhuāng shìde shì],可以唯一提取出“饰”,在候选词列表中对“饰”进行匹配,将匹配到的“饰”字排在候选词列表的首位。
再举例来说,若用户语音输入的内容对应两个以上的意图词组,则将两个以上的意图词组按一定顺序排序展示。例如,用户输入的字符串为“jiechu”,候选词列表中会包含“接触”、“解除”、“结出”、“杰出”等词,用户通过语音输入[zhāng jié de jié、wài chū dechū],由[wài chū de chū]可以提取唯一的结果“出”,而与[zhāngjié]读音一样的词会包含“章节”、“张洁”和“张杰”等等词,因此语音信息的匹配结果不唯一,则将“节”、“洁”和“杰”等全部提取,假如按照“zhangjie”的输入热度或搜索热度得到“张杰”的热度最高,“章节”、“张洁”等排在其后,则将“杰”、“节”、“洁”等依次与“出”进行组合,把得到的意图词组“杰出”排在候选词列表的首位,“节出”、“洁出”等内容依次在候选词列表中排序。
采用本发明提供的技术方案,可以利用用户的语音信息,并依据预设的匹配规则,对用户要输入的包括普通字、普通词等内容进行快速筛选和定位,尤其也满足对生僻字、生僻词或者自造词的快速输入,使得用户不需要手动或者语音控制翻页进行逐个字的查找,从而极大地简化了输入操作,提升了用户的输入效率。
在本发明所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (20)

1.一种基于语音的输入方法,其特征在于,所述方法包括:
接收用户输入的字符串信息,生成候选词列表;
在语音筛选模式下,采集用户的语音信息;
依据预设的匹配规则对所述语音信息进行匹配,得到至少一个意图词组;
将所述意图词组在所述候选词列表中进行优先排序。
2.根据权利要求1所述的方法,其特征在于,所述用户输入的字符串信息为:拼音。
3.根据权利要求1所述的方法,其特征在于,在所述采集用户的语音信息之前还包括:
在用户操作的触发下,进入语音筛选模式,或者默认进入语音筛选模式。
4.根据权利要求1所述的方法,其特征在于,所述依据预设的匹配规则对所述语音信息进行匹配,得到至少一个意图词组包括:
对所述语音信息进行识别,得到识别结果;
采用预设的匹配规则对所述识别结果进行匹配,得到至少一个意图词组。
5.根据权利要求4所述的方法,其特征在于,采用预设的匹配规则对所述识别结果进行匹配,得到至少一个意图词组包括:
判断所述识别结果是否至少由一个A的B模式的表达构成,其中所述B为所述A中的部分组成;
如果是,则提取所述B;
利用提取出的所述B,形成意图词组。
6.根据权利要求5所述的方法,其特征在于,在形成意图词组之前,还包括:
判断提取出的所述B是否与用户输入的字符串信息匹配,如果是,则由提取出的所述B形成意图词组;否则匹配失败,显示提示信息。
7.根据权利要求5所述的方法,其特征在于,若所述识别结果并非由至少一个A的B模式的表达构成,则匹配失败,显示提示信息。
8.根据权利要求5所述的方法,其特征在于,所述由提取出的所述B,形成意图词组包括:
若所述识别结果仅包含一个A的B模式,且从该A的B模式中仅提取出一个B,则利用该一个B形成意图词组;
若所述识别结果仅包含一个A的B模式,且从该A的B模式中提取出多个可能的B,则利用各B分别形成意图词组;
若所述识别结果包含两个以上A的B模式,则将各A的B模式中提取出的B按顺序进行组合,形成意图词组。
9.根据权利要求1所述的方法,其特征在于,将所述意图词组在所述候选词列表中进行优先排序包括:
将所述意图词组排在所述候选词列表中其他词语之前。
10.根据权利要求9所述的方法,其特征在于,若存在两个以上的意图词组,则将各意图词组在所述候选词列表中按照输入热度或搜索热度进行排序。
11.一种基于语音的输入装置,其特征在于,包括:
接收单元,用于接收用户输入的字符串信息,生成候选词列表;
采集单元,用于在语音筛选模式下,采集用户的语音信息;
处理单元,用于依据预设的匹配规则对所述语音信息进行匹配,得到至少一个意图词组;
展示单元,用于将所述意图词组在所述候选词列表中进行优先排序。
12.根据权利要求11所述的装置,其特征在于,所述接收单元获取用户的字符串信息为:拼音。
13.根据权利要求11所述的装置,其特征在于,所述采集单元在采集用户的语音信息之前,进一步执行:
在用户操作的触发下,进入语音筛选模式,或者默认进入语音筛选模式。
14.根据权利要求11所述的装置,其特征在于,所述处理单元,具体用于:
对所述语音信息进行识别,得到识别结果;
采用预设的匹配规则对所述识别结果进行匹配,得到至少一个意图词组。
15.根据权利要求14所述的装置,其特征在于,所述处理单元在采用预设的匹配规则对所述识别结果进行匹配,得到至少一个意图词组时,具体执行:
判断所述识别结果是否至少由一个A的B模式的表达构成,其中所述B为所述A中的部分组成;
如果是,则提取所述B;
利用提取出的所述B,形成意图词组。
16.根据权利要求15所述的装置,其特征在于,所述处理单元在形成意图词组之前,进一步执行:
判断提取出的所述B是否与用户输入的字符串信息匹配,如果是,则由提取出的所述B形成意图词组;否则匹配失败,显示提示信息。
17.根据权利要求15所述的装置,其特征在于,若所述识别结果并非由至少一个A的B模式的表达构成,则所述处理单元确定匹配失败,由所述展示单元显示提示信息。
18.根据权利要求15所述的装置,其特征在于,所述处理单元在利用提取出的所述B,形成意图词组时,具体执行:
若所述识别结果仅包含一个A的B模式,且从该A的B模式中仅提取出一个B,则利用该一个B形成意图词组;
若所述识别结果仅包含一个A的B模式,且从该A的B模式中提取出多个可能的B,则利用各B分别形成意图词组;
若所述识别结果包含两个以上A的B模式,则将各A的B模式中提取出的B按顺序进行组合,形成意图词组。
19.根据权利要求11所述的装置,其特征在于,所述展示单元在将所述意图词组在所述候选词列表中进行优先排序时,具体执行:
将所述意图词组排在所述候选词列表中其他词语之前。
20.根据权利要求19所述的装置,其特征在于,所述展示单元,还用于若存在两个以上的意图词组,则将各意图词组在所述候选词列表中按照输入热度或搜索热度进行排序。
CN201610815756.0A 2016-09-12 2016-09-12 一种基于语音的输入方法及装置 Active CN106406804B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610815756.0A CN106406804B (zh) 2016-09-12 2016-09-12 一种基于语音的输入方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610815756.0A CN106406804B (zh) 2016-09-12 2016-09-12 一种基于语音的输入方法及装置

Publications (2)

Publication Number Publication Date
CN106406804A true CN106406804A (zh) 2017-02-15
CN106406804B CN106406804B (zh) 2020-08-28

Family

ID=57999059

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610815756.0A Active CN106406804B (zh) 2016-09-12 2016-09-12 一种基于语音的输入方法及装置

Country Status (1)

Country Link
CN (1) CN106406804B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106873798A (zh) * 2017-02-16 2017-06-20 北京百度网讯科技有限公司 用于输出信息的方法和装置
CN110308886A (zh) * 2018-03-27 2019-10-08 三星电子株式会社 提供与个性化任务相关联的声音命令服务的系统和方法
CN110942769A (zh) * 2018-09-20 2020-03-31 九阳股份有限公司 一种基于有向图的多轮对话应答系统
TWI771720B (zh) * 2020-07-24 2022-07-21 華碩電腦股份有限公司 具有多型態輸入之辨識方法及使用其之電子裝置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1755589A (zh) * 2004-09-29 2006-04-05 松下电器产业株式会社 基于按键和语音识别的文字输入方法及装置
CN102541252A (zh) * 2010-12-26 2012-07-04 上海量明科技发展有限公司 一种语音协助字符输入的方法及系统
CN102937834A (zh) * 2012-11-26 2013-02-20 上海量明科技发展有限公司 混合型输入的方法、客户端及系统
CN103631385A (zh) * 2012-08-23 2014-03-12 北京搜狗科技发展有限公司 一种在文字输入中筛选候选项的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1755589A (zh) * 2004-09-29 2006-04-05 松下电器产业株式会社 基于按键和语音识别的文字输入方法及装置
CN102541252A (zh) * 2010-12-26 2012-07-04 上海量明科技发展有限公司 一种语音协助字符输入的方法及系统
CN103631385A (zh) * 2012-08-23 2014-03-12 北京搜狗科技发展有限公司 一种在文字输入中筛选候选项的方法和装置
CN102937834A (zh) * 2012-11-26 2013-02-20 上海量明科技发展有限公司 混合型输入的方法、客户端及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106873798A (zh) * 2017-02-16 2017-06-20 北京百度网讯科技有限公司 用于输出信息的方法和装置
CN110308886A (zh) * 2018-03-27 2019-10-08 三星电子株式会社 提供与个性化任务相关联的声音命令服务的系统和方法
CN110308886B (zh) * 2018-03-27 2024-03-01 三星电子株式会社 提供与个性化任务相关联的声音命令服务的系统和方法
CN110942769A (zh) * 2018-09-20 2020-03-31 九阳股份有限公司 一种基于有向图的多轮对话应答系统
TWI771720B (zh) * 2020-07-24 2022-07-21 華碩電腦股份有限公司 具有多型態輸入之辨識方法及使用其之電子裝置
US11544301B2 (en) 2020-07-24 2023-01-03 Asustek Computer Inc. Identification method with multi-type input and electronic device using the same

Also Published As

Publication number Publication date
CN106406804B (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
JP7197259B2 (ja) 情報処理方法、情報処理装置およびプログラム
CN106406804A (zh) 一种基于语音的输入方法及装置
CN107430851B (zh) 发言提示装置及发言提示方法
KR101934280B1 (ko) 발화내용 분석 장치 및 방법
CN103559880B (zh) 语音输入系统和方法
CN106814879A (zh) 一种输入方法和装置
CN106202285A (zh) 搜索结果展示方法和装置
KR101571240B1 (ko) 텍스트에 기반한 동영상 생성장치 및 그 생성방법
JP5083033B2 (ja) 感情推定装置及びプログラム
CN105718239B (zh) 一种语音输入的方法和装置
KR101410601B1 (ko) 유머 발화를 이용하는 음성 대화 시스템 및 그 방법
Paetzel et al. “So, which one is it?” The effect of alternative incremental architectures in a high-performance game-playing agent
JP2016102920A (ja) 文書記録システム及び文書記録プログラム
JP2017016296A (ja) 画像表示装置
KR101791979B1 (ko) 오버레이 아이템 또는 추가 아이템을 통해 메신저 서비스를 제공하는 방법 및 그를 이용한 서버
JP2018092582A (ja) 情報処理方法、情報処理装置、及び、プログラム
JP5158022B2 (ja) 対話処理装置、対話処理方法、及び対話処理プログラム
CN100517186C (zh) 基于按键和语音识别的文字输入方法及装置
CN107807949A (zh) 智能交互方法、设备及存储介质
JP2014149571A (ja) コンテンツ検索装置
Sabic et al. Threshold of spearcon recognition for auditory menus
JPWO2020017151A1 (ja) 情報処理装置、情報処理方法及びプログラム
JP2016212499A (ja) 対話パターン自動生成装置、方法およびプログラム
CN109388708A (zh) 一种个性化定制写作系统
CN109524001A (zh) 一种信息处理方法、装置及儿童穿戴设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant