CN103577548A - 近音文字匹配方法及装置 - Google Patents

近音文字匹配方法及装置 Download PDF

Info

Publication number
CN103577548A
CN103577548A CN201310476514.XA CN201310476514A CN103577548A CN 103577548 A CN103577548 A CN 103577548A CN 201310476514 A CN201310476514 A CN 201310476514A CN 103577548 A CN103577548 A CN 103577548A
Authority
CN
China
Prior art keywords
node
matching
characters
digital sound
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310476514.XA
Other languages
English (en)
Other versions
CN103577548B (zh
Inventor
梁捷
范兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Ucweb Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ucweb Inc filed Critical Ucweb Inc
Priority to CN201310476514.XA priority Critical patent/CN103577548B/zh
Publication of CN103577548A publication Critical patent/CN103577548A/zh
Application granted granted Critical
Publication of CN103577548B publication Critical patent/CN103577548B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例公开了近音文字匹配方法及装置,所述方法将接收到的文本信息中的各个文字转换为对应的数字音值后,与关键词树中的节点数值进行匹配,当匹配结果满足终止条件时,依据匹配结果得到对应的操作指令。由上述内容可知,该方法将汉字的读音转换为数值后,读音相近的汉字对应的数值相同,相当于减少了关键词树中节点的数量,从而缩短了查找关键词树需要的时间,实现快速查找关键词树,提高近音文字匹配的效率;而且,数值匹配相对于拼音匹配而言,程序设计更简单。

Description

近音文字匹配方法及装置
技术领域
本发明涉及移动通信技术领域,特别是涉及近音文字匹配方法及装置。
背景技术
现有技术在语音交互过程中,客户端搜集用户的音频信息,进一步将该音频信息转换为对应的文本信息,客户端将该本文信息发送到语音服务器进行语义分析,最终向客户端返回相应的执行指令。
在客户端将搜集到的语音信息转换为对应的文本信息的过程中,可能存在文本信息与语音信息之间的偏差,导致客户端发送给语音服务器的文本信息与搜集到的语音信息之间存在偏差,例如,搜集到的语音信息为“打开新浪”,而客户端转换得到的文本信息为“大楷新郎”,其中,“打”和“大”两个字的读音相近均为“da”,不同之处仅是音调不同,即“打”和“大”为近音字,同理,“开”和“楷”也为近音字,“郎”和“浪”也为近音字。近音字并非仅指读音包含的字母及字母的排序相同的汉字,其中,读音中包含的字母相差不多的汉字也可以定义为近音字,例如,读音“an”和“ang”。由于近音字的存在,客户端的语音信息转换成文本信息的过程可能存在偏差,导致提供给语音服务器的文本信息与客户端接收到的语音信息的语义可能不匹配。
上述情况,需要语音服务器能够对接收到的文本信息做相应的近音模糊匹配处理,提高容错性和语音交互的有效性和智能性。而且,语音交互是客户端与用户之间直接进行语音交互,为提高用户的语音交互体验,需要语音服务器具备快速和高效地处理及响应能力,因此,急需一种近音文字匹配方法提高语音服务器的响应速度和效率。
发明内容
本发明实施例中提供了一种近音文字匹配方法及装置,以提高语音服务器的响应速度和效率。为了解决上述技术问题,本发明实施例公开了如下技术方案:
一方面,本申请提供了一种近音文字匹配方法,包括:
接收文本信息;
根据所述文本信息的区位码信息生成对应的数字音值,其中,所述文本信息中读音相近的文字对应的数字音值相同;
将所述文本信息的数字音值逐一与依据关键词的数字音值预先构建的关键词树的节点数值进行匹配,直到匹配结果满足终止条件,所述终止条件包括所述文本信息中的文字匹配完或匹配到所述关键词树中的可终止的节点;
依据所述匹配结果得到相应的操作指令。
优选地,所述方法还包括:
根据文字的区位码信息,获取由文字对应的数字音值构成的数字音值字典表;
依据关键词构建以所述关键词中文字对应的数字音值为节点的关键词树。
优选地,根据所述文本信息的区位码信息生成对应的数字音值的步骤包括:
获取文本信息中各个文字的区位码信息;
从所述数字音值字典表中查找所述各个文字的区位码信息对应的数字音值。
优选地,所述获取文本信息中各个文字的区位码信息的步骤包括:依据各个文字中GB2312编码中的ASCII码值计算得到所述各个文字的区位码信息。
优选地,按照以下步骤完成将所述文本信息的数字音值逐一与依据关键词的数字音值预先构建的关键词树的节点数值进行匹配,直到匹配结果满足终止条件:
匹配所述文本信息的当前文字的数字音值与关键词树的节点的数值是否相同,若所述文本信息的数字音值与关键词树的节点的数值相同,依据关键词树的所述节点的辅助信息判断所述节点是否是终结节点,其中,所述辅助信息包括所述节点所包含的近音字、表明所述节点是否为终结节点的属性信息,所述节点对应的响应指令,以及所述响应指令对应的操作对象;
若所述节点不是终结节点,判断所述文本信息的各个文字是否匹配完,若匹配完,进入依据所述匹配结果得到相应的操作指令的步骤;
若未匹配完,更新所述当前文字的数字音值为下一文字的数字音值,进入匹配所述文本信息的当前文字的数字音值与关键词树的节点的数值是否相同的步骤。
另一方面,本申请还提供一种近音文本匹配装置,包括:
接收单元,用于接收文本信息;
数字音值获取单元,用于根据文本信息的区位码信息生成对应的数字音值,其中,所述文本信息中读音相近的文字对应的数字音值相同;
匹配单元,用于将所述文本信息的数字音值逐一与依据关键词的数字音值预先构建的关键词树的节点数值进行匹配,直到匹配结果满足终止条件,所述终止条件包括所述文本信息中的文字匹配完或匹配到所述关键词树中的可终止的节点;
操作指令生成单元,用于依据所述匹配结果生成相应的操作指令。
优选地,所述装置还包括:
字典表获取单元,用于依据文字的区位码信息,获取由文字对应的数字音值构成的数字音值字典表;
关键词树构建单元,用于依据关键词构建以所述关键词中文字对应的数字音值为节点的关键词树。
优选地,所述数字音值获取单元包括:
获取单元,用于获取文本信息中各个文字的区位码信息;
第一查找单元,用于从所述字典表获取单元获得的数字音值字典表中查找所述各个文字的区位码信息对应的数字音值。
优选地,所述获取单元包括:
计算单元,用于依据各个文字中GB2312编码中的ASCII码值计算得到所述各个文字的区位码信息;
或者,
第二查找单元,用于从预先存储的文字区位码表中查找各个文字对应的区位码信息。
优选地,所述匹配单元包括:
第一匹配单元,用于匹配所述文本信息的当前文字的数字音值与关键词树的节点的数值是否相同;
第一判断单元,用于若所述第一匹配单元得到所述文本信息的数字音值与关键词树的节点的数值相同的匹配结果,依据关键词树的所述节点的辅助信息判断所述节点是否是终结节点,其中,所述辅助信息包括所述节点所包含的近音字、表明所述节点是否为终结节点的属性信息,所述节点对应的响应指令,以及所述响应指令对应的操作对象;
第二判断单元,用于若第一判断单元得到所述节点不是终结节点,判断所述文本信息的各个文字是否匹配完,若匹配完,得到的匹配结果满足所述终止条件;
更新单元,用于若所述文本信息中的各个文字未匹配完,将所述当前文字的数字音值更新为下一个文字的数字音值,以使所述第一匹配单元匹配更新后的当前文字的数字音值与关键词树的节点的数值是否相同。
本发明实施例提供的近音文字匹配方法及装置,所述方法将接收到的文本信息中的各个文字转换为对应的数字音值后,与关键词树中的节点数值进行匹配,当匹配结果满足终止条件时,依据匹配结果得到对应的操作指令。由上述内容可知,该方法将汉字的读音转换为数值后,读音相近的汉字对应的数值相同,相当于减少了关键词树中节点的数量,从而缩短了查找关键词树需要的时间,实现快速查找关键词树,提高近音文字匹配的效率;而且,数值匹配相对于拼音匹配而言,程序设计更简单。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种近音文字匹配方法的流程示意图;
图2A为本发明另一种近音文字匹配方法的流程示意图;
图2B为本发明一种关键词树的示意图;
图3为本发明图2A对应的实施例中步骤S204的流程示意图;
图4为图2A对应的实施例中步骤S205的流程示意图;
图5为本发明实施例一种近音文字匹配装置的结构示意图;
图6为本发明实施例另一种近音文字匹配装置的结构示意图;
图7为本发明实施例数字音值获取单元的结构示意图;
图8为本发明实施例匹配单元的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例中技术方案作进一步详细的说明。
请参见图1,示出了本发明一种近音文字匹配方法的流程示意图,所述近音文字匹配方法应用于语音系统中的语音服务器。语音系统中客户端接收用户的语音信息,并将所述语音信息转换为对应的文本信息,然后将文本信息提供给语音服务器。由语音服务器根据所述文本信息转换为对应的操作指令。例如,语音服务器接收到的文本信息为“新浪”,则对应的操作指令为打开新浪网页面对应的URL(Uniform Resource Locator,统一资源定位符),即打开新浪网的网页。
所述近音文字匹配方法包括以下步骤:
S101,接收文本信息。其中,所述文本信息可以是来自客户端的语音信息转换得到,也可以是用户直接通过客户端输入得到。
S102,根据所述文本信息的区位码信息生成对应的数字音值。
具体实施时,汉字的GB2312编码中的一级汉字的顺序按照汉字的读音进行排序,按照上述排序规律,将读音相近的汉字划分成一个组,并为各个组进行编号,各个组的编号就是汉字对应的数字音值,因此,读音相近的汉字的数字音值通常相同。
S103,将所述文本信息的数字音值逐一与依据关键词的数字音值预先构建的关键词树的节点数值进行匹配,直到匹配结果满足终止条件。其中,所述终止条件包括:所述文本信息中的文字匹配完或匹配到所述关键词树中的可终止的节点。
其中,关键词是语音系统所关注的网络热词。例如,“搜索”、“新浪”、“百度”、“新浪微博”等网络常用词语。将所有关键词中各个文字对应的数字音值构建关键词树,该关键词树的节点是关键词的文字对应的数字音值。
按照所述文本信息所包含的文字的顺序,逐一与关键词树的节点进行匹配,当该文字的数字音值与关键词树的节点的数值相同时,然后在该节点的子节点中查找是否存在与所述文本信息中的下一个文字的数字音值相匹配的子节点,依次类推,当关键词树中没有匹配的节点时,继续查找与下一个文字的数字音值匹配的节点,直到匹配结果满足终止条件。其中,所述终止条件包括:所述文本信息中的文字匹配完,或者,当前匹配节点是可终止的节点。
所述文本信息包含一个文字或者多个文字,当包含一个文字时,从关键词树的根节点开始查找是否存在数值与该文字的数字音值相同的节点,无论存在与否,都结束匹配过程。若存在与该文字的数字音值相同的节点,即该文字与关键词树内的相关文字在读音上相近,也即匹配成功;若不存在与该文字的数字音值相同的节点,则关键词树内没有与该文字读音相近的相关文字。
当文本信息包含多个文字时,逐一扫描文本信息中的文字,并与关键词树中的节点匹配。例如,文本信息为“新浪”,首先根据文字“新”的数字音值从关键词树中查找到数值与该数字音值相同的节点,然后,在“新”对应节点的子节点中查找到文字“浪”的数字音值对应的子节点。文字“浪”是文本信息中的最后一个文字,因此,可以终止查找匹配过程。
S104,依据所述匹配结果得到相应的操作指令。
如果匹配结果表明所述文本信息的语句是合法语句,即关键词树中存在相应的关键词,且该关键词对应的节点是可终止的节点,则依据所述关键词产生相应的操作指令,例如文本信息为“新浪”或“新郎”对应的关键词树中的节点相同,且所述节点是可终止的节点,则两个词都被认为是合法,而且是近音等价词语,对应的操作指令均是打开新浪网页。
如果匹配结果表明所述文本信息的语句不合法或未查找到对应的关键词,则产生无效指令、或默认指令。
若当前扫描节点是可终止的节点,且按首次匹配命中或最长匹配优先原则确定当前匹配节点是最合理的终止节点,则得到与匹配结果相应的操作指令。其中,首次匹配命中即一次扫描就得到匹配成功的结果,延用上述的例子,文本信息“新郎”或“新浪”扫描一次关键词树就查找到相应的关键词,即首次匹配命中,对应的操作指令时打开新浪网的首页;
最长匹配优先原则是匹配结果中以匹配成功的文字数量最多的结果作为最终的匹配结果,下面举例说明最长匹配优先原则的情况,例如,文本信息是“打开新浪网的首页”,“打开”首先匹配成功,但是“打开”不是可终止的节点,需要继续扫描匹配,“新浪”匹配成功,且“浪”所在的节点是可终止的节点,但是,文本信息中还存在未扫描完的文字,需要继续匹配“网”,“网”所在的节点也是可终止的节点,“网”所在节点的子节点中不包含“的”字对应的数字音值,即“的”匹配不成功,则将上一个匹配成功、且可终止的节点作为终止节点,即“网”对应的节点作为终止节点,最终匹配结果是“打开新浪网”,对应的操作指令是使用默认的搜索引擎显示新浪网的页面。
本实施例提供的近音文字匹配方法,根据汉字的GB2312编码中的一级汉字的排列规律,将读音相近的汉字划分在一个区域内,并为各个区域编号,各个区域的编号即汉字的数字音值。本发明中,利用汉字的数字音值表征该汉字,因此,读音相近的汉字对应的数字音值相同。本申请的近音文字匹配方法,首先将接收到的客户端发送的文本信息中的各个汉字转换成对应的数字音值。然后将汉字的数字音值与预先构建的以汉字的数字音值为节点的关键词树中的节点的数值进行匹配,得到相应的匹配结果。这样,匹配过程仅仅是两个数值进行匹配,避免了采用汉字拼音匹配方式中逐个字母进行匹配,因此,缩短了查找关键词树所需的时间,实现快速查找关键词树,从而提高了近音文字匹配效率。而且,数值匹配相对于拼音匹配更简单,程序设计也更简单。
请参见图2A,示出了本申请实施例另一种近音文字匹配方法的流程示意图,与图1对应的实施例所不同的是,增加了构建关键词树的步骤,具体的,该方法包括以下步骤:
S201,根据文字的区位码信息,获取由文字对应的数字音值构成的数字音值字典表。
具体实施时,按照汉字的区位码信息中的排列顺序,将GB2312编码中的一级汉字(16区-55区的汉字)按照汉字的读音将读音相近的汉字划分成一个组,并为划分得到的所有组进行编码,例如“啊”-“阿”划分为1组,“埃”-“隘”划分为2组,“鞍”-“盎”划分为3组,依次类推得到所有的一级汉字对应的不同的组。汉字的数字音值即该汉字对应的组号,这些分组的编号构成数字音值字典表,字典表内存储的每个元素对应一个近音字组,每个元素均保存高低两个边界组对应的区位码,例如,1元素保存1组的近音字中的两个边界的汉字“啊”和“阿”对应的区位码信息。
S202,依据关键词和所述数字音值字典表构建以文字对应的数字音值为节点的关键词树。
具体实施时,关键词是语音系统所关注的网络热词,预先储存的关键词。按照关键词之间的关联性,构建关键词树,关键词树的节点为该节点对应汉字的数字音值。根据步骤S201得到的文字的数字音值字典表,查找关键词中各文字对应的数字音值,根据文字的数字音值构建关键词树。
请参见图2B,示出了包含“新浪网”的关键词树的示意图,图中关键词树的“294”对应的节点表示所有“xin”读音的文字,“294”节点的子节点中的“134”表示所有“lang”读音的文字,“134”对应的节点的子节点中的“270”节点表示所有“wang”读音的文字。每个节点均包含节点的辅助信息、响应指令及响应指令对应的操作对象等。需要说明的是,该图中“294”节点可能存在多个兄弟节点,图中未示出。
需要说明的是,步骤S201和S202还可以在步骤S203之后执行,而且,S201和S202也并非必须连续执行,只需保证先执行步骤S201,再执行步骤S202,例如,依次执行S201、S203、S202。
S203,接收文本信息。
S204,根据所述文本信息的区位码信息生成对应的数字音值。具体实施时,该步骤可以通过图3所示的方法实现,包括:
S301,获取文本信息中各个文字对应的区位码信息。
具体实施时,可以依据文本信息中的各个文字的GB2312编码中ASCII码值得到各个文字对应的区位码信息。也可以预先存储汉字的区位码表,进一步从区位码表中查找该汉字对应的区位码信息。其中,依据文本信息中的各个文字的GB2312编码中ASCII码值得到区位码信息,例如,汉字“啊”的GB2312编码是0xB0A1,其高位字节为0xB0,低位字节为0xA1。将高位字节的数值减去0xA0得到该汉字的区位号,0xB0-0xA0=16。将低位字节的数值减去0xA0得到该汉字所在区内的偏移量,即得到该汉字所在区内的位置号0xA1-0xA0=1。“啊”对应的区位码信息为1601,即“啊”是第16区内的第1个汉字。
S302,从所述数字音值字典表中查找关键词中各个文字对应的数字音值。
该步骤可以通过二分查找法快速定位该文字对应的区位码值所在数组的编号,该文字对应的区位码值应该在数组编号的高区位码值和低区位码值的范围内,所述数组编号即当前文字对应的数字音值。
S205,将所述文本信息的数字音值逐一与依据关键词的数字音值预先构建的关键词树的节点数值进行匹配,直到匹配结果满足终止条件。
本申请的一种实施例中,步骤S205可以通过图4所示的步骤实现,包括:
S401,判断关键词树中是否存在数值与所述文本信息中的当前文字的数字音值相同的节点,若存在,执行步骤S402;若不存在,执行步骤S403。
S402,依据所述关键词树中节点的辅助信息判断该节点是否是终结节点,若该节点是终结节点,则执行步骤S206;若该节点不是终结节点,则执行步骤S403。
所述节点的辅助信息包括节点所包含的近音字、表明所述节点是否为终结节点的属性信息,节点对应的响应指令,以及所述响应指令对应的操作对象等。该节点对应的每个近音字都包含上述的属性信息、响应指令及响应指令对应的操作对象。例如,接收到的文本信息是“搜索书包”其中,“搜索”是搜索类动词,其对应的是不可终止的属性信息,而且不再继续与关键词树匹配文本信息中的后续文字,直接将后续的文字默认为搜索的对象,本例中,将“书包”作为搜索对象,最终的匹配结果是“搜索书包”。又如,接收到的文本信息是“百度书包”,其中的“百度”是搜索类动词,后续的文字“书包”默认为搜索对象,最终的匹配结果是“百度书包”。
S403,判断所述文本信息中的文字是否匹配完,若匹配完,则执行步骤S206;否则,执行步骤S404。
判断所述文本信息中的所有文字是否均与关键词树中的节点进行了匹配,若是,表明文本信息中的所有文字均已匹配完,可以根据匹配结果得到相应的操作指令;若否,表明还存在未与关键词树中的节点进行匹配的文字,继续执行步骤S404。
S404,更新所述文本信息中的当前文字的数字音值为下一文字的数字音值,返回执行步骤S401。
例如,文本信息为“新浪”,首先将“新”作为当前文字,在关键词树中查找到与“新”的数字音值对应的节点,查找到与“新”对应的节点之后,将“浪”作为当前文字,继续从关键词树中查找相对应的节点,查找“浪”对应的节点时,从“新”对应节点的子节点中查找。
S206,依据所述匹配结果得到相应的操作指令。
延用“搜索书包”的例子,得到的操作指令是利用默认搜索引擎搜索“书包”;又如,接收到的文本信息是“百度书包”,对应的操作指令是利用百度搜索引擎搜索“书包”。再如,接收到的文本信息是“拜读”,扫描关键词树后,得到近音关键词“百度”确定该关键词是动作关键词,但是,文本信息中没有宾语对象,可以将其本身作为操作指令的对象,即打开百度网的页面;也可以是发现“拜读”与精确的关键词“百度”之间的文字差异,将“拜读”作为搜索对象,即按默认的搜索引擎搜索“拜读”。
本实施例提供的近音文字匹配方法,首先获得近音文字的数字音值构成的字典表,然后,依据字典表,查找关键词中各个文字对应的数字音值构建关键词树。再按照从客户端接收到的文本信息中各个文字的顺序,将各个文字的数字音值依次与关键词树中的节点的数值进行匹配,得到相应的匹配结果。这样,匹配过程仅仅是两个数值进行匹配,避免了采用汉字对应的拼音匹配的方式,因此,避免了拼音匹配方式中逐个字母进行匹配,因此,缩短了查找关键词树所需的时间,实现快速查找关键词树,从而提高了近音文字匹配效率。而且,数值匹配相对于拼音匹配更简单,程序设计也更简单。
相应于上述的近音文字匹配方法实施例,本申请还提供了近音文字匹配装置实施例。
请参见图5,示出了本申请实施例一种近音文字匹配装置的结构示意图,所述近音文字匹配装置应用于语音系统中的语音服务器中。
所述近音文字匹配装置包括:接收单元100、数字音值获取单元200、匹配单元300、操作指令生成单元400。
接收单元100,用于接收客户端发送的文本信息。
所述文本信息可以是客户端接收到的用户的语音信息,并将该语音信息转换得到的文本信息;文本信息也可以是用户直接通过客户端输入的文本信息。
数字音值获取单元200,用于根据文本信息的区位码信息生成对应的数字音值;其中,所述文本信息中读音相近的文字对应的数字音值相同。
具体实施时,预先将GB2312编码中的一级汉字按照汉字的读音划分成不同的组,并为各个组进行编号,各个组的编号就是汉字对应的数字音值,从而得到数字音值字典表。数字音值获取单元按照文字的区位码值查找数字音值字典表确定该文字对应的数字音值。
匹配单元300,用于将所述文本信息的数字音值逐一与依据关键词的数字音值预先构建的关键词树的节点数值进行匹配,直到匹配结果满足终止条件。
按照所述文本信息所包含的文字的顺序,逐一与关键词树的节点进行匹配,当该文字的数字音值与关键词树的节点的数值相同时,在该节点的子节点中查找是否存在与所述文本信息中的下一个文字的数字音值相匹配的子节点,依次类推,当关键词树中没有匹配的节点时,继续查找与下一个文字的数字音值匹配的节点,直到所述文本信息中的所有文字都查找完,或者,遇到可终止的节点。
操作指令生成单元400,用于依据所述匹配结果生成相应的操作指令。
如果匹配结果表明所述文本信息的语句是合法语句,即关键词树中存在相应的关键词,且该关键词对应的节点是可终止的节点。依据所述关键词产生相应的操作指令;如果匹配结果表明所述文本信息的语句不合法或未查找到对应的关键词,则产生无效指令、或默认指令。
本实施例提供的近音文字匹配装置,利用接收单元接收客户端发送的文本信息提供给数字音值获取单元,依据文本信息中文字的区位码值获取所述文本信息中文字对应的数字音值,并提供给匹配单元,逐一匹配所述文本信息的数字音值与关键词树的节点的数值,直到匹配结果满足终止条件,得到的匹配结果提供给操作指令生成单元,该单元依据所述匹配结果得打相应的操作指令。由上述内容可知,所述近音文字匹配装置通过匹配数值文字匹配,避免了采用汉字拼音匹配方式中逐个字母进行匹配,因此,缩短了查找关键词树所需的时间,实现快速查找关键词树,从而提高了近音文字匹配效率。而且,数值匹配相对于拼音匹配更简单。
请参见图6,示出了本申请实施例另一种近音文字匹配装置的结构示意图,与图5所示的结构不同的是,增设了字典表获取单元和关键词树构建单元。所述近音文字匹配装置包括:接收单元100、数字音值获取单元200、匹配单元300、操作指令生成单元400、字典表获取单元500、关键词树构建单元600。
字典表获取单元500,用于依据文字的区位码信息,获取由文字对应的数字音值构成的数字音值字典表。
按照汉字的区位码信息中的排列顺序,将GB2312编码中的一级汉字(16区-55区的汉字)按照汉字的读音将读音相近的汉字划分成一个组,并为划分得到的所有组进行编码,依次类推得到所有的一级汉字对应的不同的组,所有组的编号构成数字音值字典表。
关键词树构建单元600,用于依据关键词构建以所述关键词中文字对应的数字音值为节点的关键词树。
关键词是语音系统所关注的网络热词,预先储存的关键词。按照关键词之间的关联性,构建关键词树,关键词树的节点为该节点对应汉字的数字音值。依据字典表获取单元500得到的数字音值字典表,查找关键词中各文字对应的数字音值,根据文字的数字音值构建关键词树。
接收单元100,用于接收客户端发送的文本信息。
数字音值获取单元200,用于根据文本信息的区位码信息生成对应的数字音值;其中,所述文本信息中读音相近的文字对应的数字音值相同。
具体实施时,请参见图7,数字音值获取单元200可以包括获取单元210和第一查找单元220。
获取单元210,用于获取文本信息中各个文字的区位码信息。
本实施例中的获取单元210可以通过计算单元(图中未示出)实现,该计算单元可以依据各个文字中GB2312编码中额定ASCII码值计算得到所述各个文字的区位码信息;
在本发明的其他实施例中,获取单元210还可以通过第二查找单元(图中未示出)实现,该第二查找单元可以从预先存储的文字区位码表中查找各个文字对应的区位码信息。
第一查找单元220,用于利用所述各个文字的区位码信息从所述数字音值字典表查找所述区位码信息对应的数字音值。
匹配单元300,用于将所述文本信息的数字音值逐一与依据关键词的数字音值预先构建的关键词树的节点数值进行匹配,直到匹配结果满足终止条件。
请参见图8,匹配单元300可以包括第一匹配单元310、第一判断单元320、第二判断单元330、更新单元340。
第一匹配单元310,用于匹配所述文本信息的当前文字的数字音值与关键词树的节点的数值是否相同。
第一判断单元320,用于若所述第一匹配单元得到所述文本信息的数字音值与关键词树的节点的数值相同的匹配结果,依据关键词树的所述节点的辅助信息判断所述节点是否是终结节点,其中,所述辅助信息包括所述节点所包含的近音字、表明所述节点是否为终结节点的属性信息,所述节点对应的响应指令,以及所述响应指令对应的操作对象。
第二判断单元330,用于若第一判断单元得到所述节点不是终结节点,判断所述文本信息的各个文字是否匹配完,若匹配完,得到的匹配结果满足所述终止条件。
更新单元340,用于若所述文本信息中的各个文字未匹配完,将所述当前文字的数字音值更新为下一个文字的数字音值,以使所述第一匹配单元匹配更新后的当前文字的数字音值与关键词树的节点的数值是否相同。
操作指令生成单元400,用于依据所述匹配结果生成相应的操作指令。
本实施例提供的近音文字匹配装置,通过字典表获取单元得到GB2312编码中所有一级汉字对应的数字音值,关键词树构建单元依据数字音值字典表查找到关键词中文字对应的数字音值,并构建以数字音值为节点的关键词树。从而方便匹配单元通过匹配文本信息中的文字对应的数字音值与关键词树中节点的数值进行匹配,实现近音文字匹配,避免了采用汉字拼音匹配方式中逐个字母进行匹配,因此,缩短了查找关键词树所需的时间,实现快速查找关键词树,从而提高了近音文字匹配效率。而且,数值匹配相对于拼音匹配更简单。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种近音文字匹配方法,其特征在于,包括:
接收文本信息;
根据所述文本信息的区位码信息生成对应的数字音值,其中,所述文本信息中读音相近的文字对应的数字音值相同;
将所述文本信息的数字音值逐一与依据关键词的数字音值预先构建的关键词树的节点数值进行匹配,直到匹配结果满足终止条件,所述终止条件包括所述文本信息中的文字匹配完或匹配到所述关键词树中的可终止的节点;
依据所述匹配结果得到相应的操作指令。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据文字的区位码信息,获取由文字对应的数字音值构成的数字音值字典表;
依据关键词构建以所述关键词中文字对应的数字音值为节点的关键词树。
3.根据权利要求2所述的方法,其特征在于,根据所述文本信息的区位码信息生成对应的数字音值的步骤包括:
获取文本信息中各个文字的区位码信息;
从所述数字音值字典表中查找所述各个文字的区位码信息对应的数字音值。
4.根据权利要求3所述的方法,其特征在于,所述获取文本信息中各个文字的区位码信息的步骤包括:依据各个文字中GB2312编码中的ASCII码值计算得到所述各个文字的区位码信息。
5.根据权利要求1至4任一项所述的方法,其特征在于,按照以下步骤完成将所述文本信息的数字音值逐一与依据关键词的数字音值预先构建的关键词树的节点数值进行匹配,直到匹配结果满足终止条件:
匹配所述文本信息的当前文字的数字音值与关键词树的节点的数值是否相同,若所述文本信息的数字音值与关键词树的节点的数值相同,依据关键词树的所述节点的辅助信息判断所述节点是否是终结节点,其中,所述辅助信息包括所述节点所包含的近音字、表明所述节点是否为终结节点的属性信息,所述节点对应的响应指令,以及所述响应指令对应的操作对象;
若所述节点不是终结节点,判断所述文本信息的各个文字是否匹配完,若匹配完,进入依据所述匹配结果得到相应的操作指令的步骤;
若未匹配完,更新所述当前文字的数字音值为下一文字的数字音值,进入匹配所述文本信息的当前文字的数字音值与关键词树的节点的数值是否相同的步骤。
6.一种近音文本匹配装置,其特征在于,包括:
接收单元,用于接收文本信息;
数字音值获取单元,用于根据文本信息的区位码信息生成对应的数字音值,其中,所述文本信息中读音相近的文字对应的数字音值相同;
匹配单元,用于将所述文本信息的数字音值逐一与依据关键词的数字音值预先构建的关键词树的节点数值进行匹配,直到匹配结果满足终止条件,所述终止条件包括所述文本信息中的文字匹配完或匹配到所述关键词树中的可终止的节点;
操作指令生成单元,用于依据所述匹配结果生成相应的操作指令。
7.根据权利要求6所述的装置,其特征在于,还包括:
字典表获取单元,用于依据文字的区位码信息,获取由文字对应的数字音值构成的数字音值字典表;
关键词树构建单元,用于依据关键词构建以所述关键词中文字对应的数字音值为节点的关键词树。
8.根据权利要求7所述的装置,其特征在于,所述数字音值获取单元包括:
获取单元,用于获取文本信息中各个文字的区位码信息;
第一查找单元,用于从所述字典表获取单元获得的数字音值字典表中查找所述各个文字的区位码信息对应的数字音值。
9.根据权利要求8所述的装置,其特征在于,所述获取单元包括:
计算单元,用于依据各个文字中GB2312编码中的ASCII码值计算得到所述各个文字的区位码信息;
或者,
第二查找单元,用于从预先存储的文字区位码表中查找各个文字对应的区位码信息。
10.根据权利要求6至9任一项所述的装置,其特征在于,所述匹配单元包括:
第一匹配单元,用于匹配所述文本信息的当前文字的数字音值与关键词树的节点的数值是否相同;
第一判断单元,用于若所述第一匹配单元得到所述文本信息的数字音值与关键词树的节点的数值相同的匹配结果,依据关键词树的所述节点的辅助信息判断所述节点是否是终结节点,其中,所述辅助信息包括所述节点所包含的近音字、表明所述节点是否为终结节点的属性信息,所述节点对应的响应指令,以及所述响应指令对应的操作对象;
第二判断单元,用于若第一判断单元得到所述节点不是终结节点,判断所述文本信息的各个文字是否匹配完,若匹配完,得到的匹配结果满足所述终止条件;
更新单元,用于若所述文本信息中的各个文字未匹配完,将所述当前文字的数字音值更新为下一个文字的数字音值,以使所述第一匹配单元匹配更新后的当前文字的数字音值与关键词树的节点的数值是否相同。
CN201310476514.XA 2013-10-12 2013-10-12 近音文字匹配方法及装置 Active CN103577548B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310476514.XA CN103577548B (zh) 2013-10-12 2013-10-12 近音文字匹配方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310476514.XA CN103577548B (zh) 2013-10-12 2013-10-12 近音文字匹配方法及装置

Publications (2)

Publication Number Publication Date
CN103577548A true CN103577548A (zh) 2014-02-12
CN103577548B CN103577548B (zh) 2017-02-08

Family

ID=50049324

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310476514.XA Active CN103577548B (zh) 2013-10-12 2013-10-12 近音文字匹配方法及装置

Country Status (1)

Country Link
CN (1) CN103577548B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528420A (zh) * 2015-12-07 2016-04-27 北京金山安全软件有限公司 文字编码和译码方法、装置及电子设备
CN105824825A (zh) * 2015-01-06 2016-08-03 中国移动通信集团湖南有限公司 一种敏感数据识别方法和装置
WO2017012243A1 (zh) * 2015-07-20 2017-01-26 百度在线网络技术(北京)有限公司 语音识别方法、装置、终端设备及存储介质
CN107291850A (zh) * 2017-06-06 2017-10-24 贵阳朗玛信息技术股份有限公司 视频数据结构化方法及装置
CN108694186A (zh) * 2017-04-07 2018-10-23 阿里巴巴集团控股有限公司 数据发送方法及服务器应用、计算设备及计算机可读介质
CN109510904A (zh) * 2018-12-25 2019-03-22 携程旅游网络技术(上海)有限公司 呼叫中心外呼录音的检测方法及系统
CN109903766A (zh) * 2019-03-27 2019-06-18 北京奥特维科技有限公司 远场语音指令识别方法及装置
CN110444199A (zh) * 2017-05-27 2019-11-12 腾讯科技(深圳)有限公司 一种语音关键词识别方法、装置、终端及服务器

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758024A (en) * 1996-06-25 1998-05-26 Microsoft Corporation Method and system for encoding pronunciation prefix trees
CN1135482C (zh) * 1999-10-20 2004-01-21 无敌科技[西安]有限公司 中文近似语音搜寻方法
CN103092928B (zh) * 2012-12-31 2015-12-23 安徽科大讯飞信息科技股份有限公司 语音查询方法及系统
CN103049571A (zh) * 2013-01-04 2013-04-17 深圳市中兴移动通信有限公司 基于语音识别的索引菜单的方法、装置及其终端

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105824825A (zh) * 2015-01-06 2016-08-03 中国移动通信集团湖南有限公司 一种敏感数据识别方法和装置
CN105824825B (zh) * 2015-01-06 2019-10-18 中国移动通信集团湖南有限公司 一种敏感数据识别方法和装置
WO2017012243A1 (zh) * 2015-07-20 2017-01-26 百度在线网络技术(北京)有限公司 语音识别方法、装置、终端设备及存储介质
CN105528420A (zh) * 2015-12-07 2016-04-27 北京金山安全软件有限公司 文字编码和译码方法、装置及电子设备
CN108694186A (zh) * 2017-04-07 2018-10-23 阿里巴巴集团控股有限公司 数据发送方法及服务器应用、计算设备及计算机可读介质
CN110444199A (zh) * 2017-05-27 2019-11-12 腾讯科技(深圳)有限公司 一种语音关键词识别方法、装置、终端及服务器
CN110444199B (zh) * 2017-05-27 2022-01-07 腾讯科技(深圳)有限公司 一种语音关键词识别方法、装置、终端及服务器
CN107291850A (zh) * 2017-06-06 2017-10-24 贵阳朗玛信息技术股份有限公司 视频数据结构化方法及装置
CN109510904A (zh) * 2018-12-25 2019-03-22 携程旅游网络技术(上海)有限公司 呼叫中心外呼录音的检测方法及系统
CN109510904B (zh) * 2018-12-25 2020-10-27 携程旅游网络技术(上海)有限公司 呼叫中心外呼录音的检测方法及系统
CN109903766A (zh) * 2019-03-27 2019-06-18 北京奥特维科技有限公司 远场语音指令识别方法及装置
CN109903766B (zh) * 2019-03-27 2021-06-04 北京奥特维科技有限公司 远场语音指令识别方法及装置

Also Published As

Publication number Publication date
CN103577548B (zh) 2017-02-08

Similar Documents

Publication Publication Date Title
CN103577548B (zh) 近音文字匹配方法及装置
US10997370B2 (en) Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time
CN102866782B (zh) 一种提高整句生成效率的输入法和输入法系统
Almeman et al. Automatic building of arabic multi dialect text corpora by bootstrapping dialect words
CN111488468B (zh) 地理信息知识点抽取方法、装置、存储介质及计算机设备
CN107145481A (zh) 电子设备、存储介质、网页表单填充方法及装置
US10853569B2 (en) Construction of a lexicon for a selected context
CN111159990A (zh) 一种基于模式拓展的通用特殊词识别方法及系统
JP2007334534A (ja) 文字列入力装置、文字列入力方法、および、プログラム
CN111813923A (zh) 文本摘要方法、电子设备及存储介质
JP4266222B2 (ja) 単語翻訳装置およびそのプログラム並びにコンピュータ読み取り可能な記録媒体
JP5231484B2 (ja) 音声認識装置、音声認識方法、プログラム、及びプログラムを配信する情報処理装置
JP2016164708A (ja) 含意ペア拡張装置、そのためのコンピュータプログラム、及び質問応答システム
CN111859950A (zh) 一种自动化生成讲稿的方法
CN105718463A (zh) 关键字模糊匹配方法及装置
CN111026281B (zh) 一种客户端的词组推荐方法、客户端及存储介质
KR20120052591A (ko) 연속어 음성인식 시스템에서 오류수정 장치 및 방법
JP6261669B2 (ja) クエリ校正システムおよび方法
JP6584361B2 (ja) キーワード抽出装置、キーワード抽出方法及びキーワード抽出プログラム
CN113204613B (zh) 地址生成方法、装置、设备和存储介质
JP5114228B2 (ja) データ入力装置及びデータ入力方法
JP2016189154A (ja) 翻訳方法、装置、及びプログラム
JP6667875B2 (ja) 要約文作成モデル学習装置、要約文作成装置、要約文作成モデル学習方法、要約文作成方法、及びプログラム
KR101543024B1 (ko) 발음 기반의 번역 방법 및 그 장치
CN115587262B (zh) 基于语义增强的用户身份关联方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200421

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Alibaba (China) Co.,Ltd.

Address before: 100080, room 16, building 10-20, Building 29, Haidian District, Suzhou Street, Beijing

Patentee before: UC MOBILE Ltd.

TR01 Transfer of patent right