CN105138575A - 语音文本串的解析方法和装置 - Google Patents
语音文本串的解析方法和装置 Download PDFInfo
- Publication number
- CN105138575A CN105138575A CN201510456896.9A CN201510456896A CN105138575A CN 105138575 A CN105138575 A CN 105138575A CN 201510456896 A CN201510456896 A CN 201510456896A CN 105138575 A CN105138575 A CN 105138575A
- Authority
- CN
- China
- Prior art keywords
- regular expressions
- character string
- regular
- expressions matching
- structured
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/635—Filtering based on additional data, e.g. user or group profiles
- G06F16/636—Filtering based on additional data, e.g. user or group profiles by using biological or physiological data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Physiology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例提供一种语音文本串的解析方法和装置。所述方法包括:获取待解析的语音文本串;将所述语音文本串与预设的多个正则表达匹配模板进行匹配,获取匹配的正则表达匹配模板的信息,其中,所述正则表达匹配模板以结构化形式表达,在第一结构化标签中描述正则表达式的规则字符串序列,在至少一个第二结构化标签中表示所述规则字符串序列中相应的匹配字符串;输出所述匹配的正则表达匹配模板的信息。通过构建结构化形式的正则表达匹配模板的方式,使得正则表达式的表达和管理规范、简单。
Description
技术领域
本发明涉及语义分析技术,尤其涉及一种语音文本串的解析方法和装置。
背景技术
目前,基于语音识别的应用由于其使用便利性,已得到广泛的应用。用户在输入语音时通常以口语化的方式表达其意图,因此在将用户的语音转换为语音文本串后进行解析时,需要使用适于口语表达的解析方式。
规则匹配是口语化语义解析比较常用的方法,使用预先编制好的规则串与(语音转换后的)语音文本串进行字符串匹配。
现有的用于口语解析的正则表达式通常是以非常抽象的方式呈现出来的。例如,假设要解析发短信的命令,则需要这样编写规则:“(给)(.+)(发|回)(信息|短信)”或/和“(发|回)(信息|短信)(给)(.+)”,并将所述规则存入数据库。当用户语音录入“给刘德华发短信”时,在将所述语音转换为相应的文本串后,可匹配上前者的规则,进而给出解析结果。
目前的正则表达式的编写和维护存在以下缺点:
首先,正则表达式的编写规则抽象难懂,而且容易发生编写错误。
其次,现有的方案需要将关键词直接写入正则表达式中,例如“(信息|短信)”,而且很多正则表达式都包含同样的关键词。那么,当修改、添加、删除关键词的时候,就需要操作很多个正则表达式,非常繁琐。
再次,对于要提取的参数,现有的基于正则表达式的方法都是通过参数的顺序来表示,例如,在“(给)(.+)(发|回)(信息|短信)”中,用第二个参数来表示要提取的参数。这导致了每次编写正则表达式都要去数参数的顺序,容易出错。
最后,随着需要进行语义解析的领域的增加,要编写的正则表达式也越来越多,有效地管理和维护编写的正则表达式成为一个契待解决的问题。
发明内容
本发明的目的在于,提供一种语音文本串的解析方法和装置,通过结构化形式来表达和管理正则表达式,以有效地管理和维护编写的正则表达式。
根据本发明的一方面,提供一种语音文本串的解析方法,其特征在于,所述方法包括:获取待解析的语音文本串;将所述语音文本串与预设的多个正则表达匹配模板进行匹配,获取匹配的正则表达匹配模板的信息,其中,所述正则表达匹配模板以结构化形式表达,在第一结构化标签中描述正则表达式的规则字符串序列,在至少一个第二结构化标签中表示所述规则字符串序列中相应的匹配字符串;输出所述匹配的正则表达匹配模板的信息。
优选地,在所述第二结构化标签中还包括所述匹配字符串的替换字符串的信息。其中,在所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理中,对于任一匹配字符串,将所述语音文本串中相应的字符串与所述匹配字符串以及其替换字符串进行匹配。
优选地,在所述第一结构化标签中,所述正则表达式的规则字符串序列中待提取的参数以变量表达,并且在第三结构化标签中描述与待提取的参数相应的变量的信息。
优选地,所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理还包括:根据所述第一结构化标签中的变量从所述语音文本串提取符合相应的第三结构化标签中的描述的参数数据;所述输出所述匹配的正则表达匹配模板的信息的处理还包括:输出提取的参数数据。
优选地,在第四结构化标签中描述所述正则表达匹配模板表示的用户意图的数据。相应地,所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理还包括:提取与所述匹配的正则表达匹配模板相应的第四结构化标签的数据;所述输出所述匹配的正则表达匹配模板的信息的处理还包括:输出所述正则表达匹配模板表示的用户意图的数据。
所述结构化形式可以是XML语言格式,所述正则表达匹配模板可以是DOM树。
根据本发明的另一方面,还提供一种语音文本串的解析装置。所述装置包括:语音文本串获取单元,用于获取待解析的语音文本串;正则表达匹配单元,用于将所述语音文本串与预设的多个正则表达匹配模板进行匹配,获取匹配的正则表达匹配模板的信息,其中,所述正则表达匹配模板以结构化形式表达,在第一结构化标签中描述正则表达式的规则字符串序列,在至少一个第二结构化标签中表示所述规则字符串序列中相应的匹配字符串;正则表达输出单元,用于输出所述匹配的正则表达匹配模板的信息。
优选地,在所述第二结构化标签中还包括所述匹配字符串的替换字符串的信息。其中,正则表达匹配单元用于对于任一匹配字符串,将所述语音文本串中相应的字符串与所述匹配字符串以及其替换字符串进行匹配。
优选地,在所述第一结构化标签中,所述正则表达式的规则字符串序列中待提取的参数以变量表达,并且在第三结构化标签中描述与待提取的参数相应的变量的信息。
优选地,所述正则表达匹配单元还用于根据所述第一结构化标签中的变量从所述语音文本串提取符合相应的第三结构化标签中的描述的参数数据;所述正则表达输出单元还用于输出提取的参数数据。
优选地,在第四结构化标签中描述所述正则表达匹配模板表示的用户意图的数据;相应地,所述正则表达匹配单元还用于提取与所述匹配的正则表达匹配模板相应的第四结构化标签的数据;所述正则表达输出单元还用于输出所述正则表达匹配模板表示的用户意图的数据。
所述结构化形式可以是XML语言格式,所述正则表达匹配模板可以是DOM树。
根据本发明示例性实施例的语音文本串的解析方法和实现所述方法的装置通过构建结构化形式的正则表达匹配模板的方式,使得正则表达式的表达和管理规范、简单。通过结构化形式编写的规则也更为直观,容易理解。此外,基本的结构化标签可被重复利用,更提高了管理效率。
此外,通过例如XML可扩展标记语言构建和管理正则表达式,与其他编程语言或软件工具之间的兼容性强,使得如此编写的正则表达式可用性强。
附图说明
图1是示出根据本发明的基本构思编写的正则表达匹配模板的示例;
图2是示出根据本发明的示例性实施例一的语音文本串的解析方法的流程图;
图3是示出根据本发明的示例性实施例二的语音文本串的解析装置的逻辑框图。
具体实施方式
本发明的基本发明构思是,以结构化形式的正则表达匹配模板来描述正则表达式,使用结构化标签(第一结构化标签)描述正则表达式的,并且通过至少一个另一种结构化标签(第二结构化标签)来分别表示所述规则字符串序列中的各匹配字符串。这样,在结构化标签中描述的规则字符串序列直观、易懂,隐藏了所述规则字符串序列中的匹配字符串的复杂度,同时通过第二结构化标签表示的所述匹配字符串还可在多个正则表达匹配模板重复被使用,提高了正则表达式的可复用性和可维护性。
此外,使用变量来表达所述正则表达式的规则字符串序列中待提取的参数,并且还通过再另一种结构化标签(第三结构化标签)描述与待提取的参数相应的变量的信息。由此,通过正则表达匹配模板还可提取出输入的语音文本串中的参数数据,如变量名称(即参数名称)及其参数值,用户无需记住正则表达式中提取参数的位置,降低出错率。
在本文中以目前广泛使用的结构化描述形式的XML语言表达的正则表达匹配模板作为示例对本发明的示例性实施例进行描述。需要理解,本发明提出的正则表达匹配模板可使用任何可扩展的结构化表达形式来进行表达/描述,而不限于使用XML语言的方式。
图1是示出根据本发明的基本构思编写的正则表达匹配模板的示例,其示出用于表达发送信息的正则表达匹配模板。
参照图1,标签<template>定义的是所述正则表达匹配模板,其中的标签<pattern>(第一结构化标签)用于描述规则字符串序列“【发送】【短信】【给】【person】”,“【发送】”、“【短信】”、“【给】”等皆为所述正则表达匹配模板的匹配字符串。
标签<slot>(第二结构化标签)用于表示该正则表达匹配模板或其他正则表达匹配模板中的匹配字符串的信息。此外,第二结构化标签(如<slotname="发送"synx="发送|发|回"/>)还包括匹配字符串“【发送】”的替换字符串"发送|发|回"等,所述替换字符串可以是匹配字符串的同义词“发送”或与其相应的词“回”。这样,该正则表达匹配模板可用于匹配多个具有相似表达模式的语音文本串。
由于所述第二结构化标签独立于任何一个正则表达匹配模板而存在,因此,所述第二结构化标签可以在多个正则表达匹配模板当中重复被使用。
在此基础上,对于包含参数的正则表达,所述规则字符串序列还包括与待提取的参数相应的变量的信息(例如【person】)。相应地,标签<slotname="person"group="name"…/>(第三结构化标签)用于描述与待提取的参数相应的变量"person"的信息。
基于前述结构化表达的正则表达匹配模板,当输入的语音文本串为“发短信给玛丽”时,可匹配出标识为"SEND_MESSAGE_PERSON"的正则表达匹配模板,并且从所述语音文本串提取到变量为"person":“玛丽”的参数数据。
此外,在图1示出的正则表达匹配模板中还包括用于描述所述正则表达匹配模板表示的用户意图的数据的第四结构化标签<semantics>,即"send_message"。由此,针对例如口语化的用户输入,还可相应地获取关于用户意图的信息。
前述用于定义所述正则表达匹配模板的<template>以及其中的标签构成了一个DOM树,也就是说,所述正则表达匹配模板的结构化表示是DOM树结构。
由此可见,根据本发明的方面构思构建的结构化形式的正则表达方式(正则表达匹配模板)规范、相对简单;编写的规则也更为直观,容易理解;基本的结构化标签可被重复利用,提高了管理效率。
以下将参照图2和图3详细说明本发明的示例性实施例。
实施例一
图2是示出根据本发明的示例性实施例一的语音文本串的解析方法的流程图。
参照图2,在步骤S210,获取待解析的语音文本串。
所述语音文本串是从用户录入的语音识别出的文本数据。
在步骤S220,将所述语音文本串与预设的多个正则表达匹配模板进行匹配,获取匹配的正则表达匹配模板的信息。其中,如前所述,所述正则表达匹配模板以结构化形式表达,在第一结构化标签中描述正则表达式的规则字符串序列,在至少一个第二结构化标签中表示所述规则字符串序列中相应的匹配字符串。
在步骤S230,输出所述匹配的正则表达匹配模板的信息。
可选地,在所述第二结构化标签中还包括所述匹配字符串的替换字符串的信息。相应地,在步骤S220中所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理中,对于任一匹配字符串,将所述语音文本串中相应的字符串与所述匹配字符串以及其替换字符串进行匹配。例如,对于待解析的语音文本串“发短信给玛丽”,在与第一结构化标签<pattern>中的规则字符串序列进行匹配时,对于匹配字符串“发送”,将其与相应的第二结构化标签“<slotname="发送"synx="发送|发|回"/>”中的替换字符串“发送”、“发”、“回”分别进行匹配,匹配到“发”,则确定该匹配字符串找到匹配。
进一步地,在所述第一结构化标签中,可以变量表达所述正则表达式的规则字符串序列中待提取的参数,并且在第三结构化标签中描述与待提取的参数相应的变量的信息。
在前述的例子中,所述第一结构化标签“<pattern>【发送】【短信】【给】【person】</pattern>”中的“person”是用于提取参数的变量;第三结构化标签“<slotname="person"group="name"synx="?<name>张三|李四"/>”用于描述提取参数“name”的变量“person”的信息。
相应地,在步骤S220中,所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理还包括:根据所述第一结构化标签中的变量从所述语音文本串提取符合相应的第三结构化标签中的描述的参数数据。在步骤S230,还输出在步骤S220提取的参数数据。
返回前面的例子,对于待解析的语音文本串“发短信给玛丽”,通过图1中示出的正则表达匹配模板<template>中的规则字符串序列“【发送】【短信】【给】【person】”,可提取出参数“name”的值为“玛丽”。
此外,优选地,在所述正则表达匹配模板中,还在第四结构化标签中描述所述正则表达匹配模板表示的用户意图的数据。
相应地,步骤S220还包括:提取与所述匹配的正则表达匹配模板相应的第四结构化标签的数据;步骤S230还包括:输出所述正则表达匹配模板表示的用户意图的数据。
实施例二
图3是示出根据本发明的示例性实施例二的语音文本串的解析装置的逻辑框图。所述语音文本串的解析装置可用于执行实施例一的方法。
参照图3,所述语音文本串的解析装置包括语音文本串获取单元310、正则表达匹配单元320和正则表达输出单元330。
语音文本串获取单元310用于获取待解析的语音文本串。
正则表达匹配单元320用于将所述语音文本串与预设的多个正则表达匹配模板进行匹配,获取匹配的正则表达匹配模板的信息。其中,所述正则表达匹配模板以结构化形式表达,在第一结构化标签中描述正则表达式的规则字符串序列,在至少一个第二结构化标签中表示所述规则字符串序列中相应的匹配字符串。
正则表达输出单元330用于输出所述匹配的正则表达匹配模板的信息。
优选地,在所述第二结构化标签中还包括所述匹配字符串的替换字符串的信息。相应地,正则表达匹配单元320用于对于任一匹配字符串,将所述语音文本串中相应的字符串与所述匹配字符串以及其替换字符串进行匹配。
优选地,在所述第一结构化标签中,所述正则表达式的规则字符串序列中待提取的参数以变量表达,并且在第三结构化标签中描述与待提取的参数相应的变量的信息。
相应地,正则表达匹配单元320还用于根据所述第一结构化标签中的变量从所述语音文本串提取符合相应的第三结构化标签中的描述的参数数据。正则表达输出单元330还用于输出提取的参数数据。
优选地,在第四结构化标签中描述所述正则表达匹配模板表示的用户意图的数据。相应地,正则表达匹配单元320还用于提取与所述匹配的正则表达匹配模板相应的第四结构化标签的数据;正则表达输出单元330还用于输出所述正则表达匹配模板表示的用户意图的数据。
所述结构化形式是例如XML语言格式,所述正则表达匹配模板是DOM树。
综上所述,根据本发明示例性实施例的语音文本串的解析方法和实现所述方法的装置通过构建结构化形式的正则表达匹配模板的方式,使得正则表达式的表达和管理规范、简单。通过结构化形式编写的规则也更为直观,容易理解。此外,基本的结构化标签可被重复利用,更提高了管理效率。
此外,通过例如XML可扩展标记语言构建和管理正则表达式,与其他编程语言或软件工具之间的兼容性强,使得如此编写的正则表达式可用性强。
需要指出,根据实施的需要,可将本申请中描述的各个步骤/部件拆分为更多步骤/部件,也可将两个或多个步骤/部件或者步骤/部件的部分操作组合成新的步骤/部件,以实现本发明的目的。
上述根据本发明的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CDROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (12)
1.一种语音文本串的解析方法,其特征在于,所述方法包括:
获取待解析的语音文本串;
将所述语音文本串与预设的多个正则表达匹配模板进行匹配,获取匹配的正则表达匹配模板的信息,其中,所述正则表达匹配模板以结构化形式表达,在第一结构化标签中描述正则表达式的规则字符串序列,在至少一个第二结构化标签中表示所述规则字符串序列中相应的匹配字符串;
输出所述匹配的正则表达匹配模板的信息。
2.根据权利要求1所述的方法,其特征在于,在所述第二结构化标签中还包括所述匹配字符串的替换字符串的信息,
其中,在所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理中,对于任一匹配字符串,将所述语音文本串中相应的字符串与所述匹配字符串以及其替换字符串进行匹配。
3.根据权利要求2所述的方法,其特征在于,在所述第一结构化标签中,所述正则表达式的规则字符串序列中待提取的参数以变量表达,并且在第三结构化标签中描述与待提取的参数相应的变量的信息。
4.根据权利要求3所述的方法,其特征在于,所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理还包括:根据所述第一结构化标签中的变量从所述语音文本串提取符合相应的第三结构化标签中的描述的参数数据,
所述输出所述匹配的正则表达匹配模板的信息的处理还包括:输出提取的参数数据。
5.根据权利要求1~4中任一项所述的方法,其特征在于,在第四结构化标签中描述所述正则表达匹配模板表示的用户意图的数据,
所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理还包括:提取与所述匹配的正则表达匹配模板相应的第四结构化标签的数据,
所述输出所述匹配的正则表达匹配模板的信息的处理还包括:输出所述正则表达匹配模板表示的用户意图的数据。
6.根据权利要求5所述的方法,其特征在于,所述结构化形式是XML语言格式,所述正则表达匹配模板是DOM树。
7.一种语音文本串的解析装置,其特征在于,所述装置包括:
语音文本串获取单元,用于获取待解析的语音文本串;
正则表达匹配单元,用于将所述语音文本串与预设的多个正则表达匹配模板进行匹配,获取匹配的正则表达匹配模板的信息,其中,所述正则表达匹配模板以结构化形式表达,在第一结构化标签中描述正则表达式的规则字符串序列,在至少一个第二结构化标签中表示所述规则字符串序列中相应的匹配字符串;
正则表达输出单元,用于输出所述匹配的正则表达匹配模板的信息。
8.根据权利要求7所述的装置,其特征在于,在所述第二结构化标签中还包括所述匹配字符串的替换字符串的信息,
其中,正则表达匹配单元用于对于任一匹配字符串,将所述语音文本串中相应的字符串与所述匹配字符串以及其替换字符串进行匹配。
9.根据权利要求8所述的装置,其特征在于,在所述第一结构化标签中,所述正则表达式的规则字符串序列中待提取的参数以变量表达,并且在第三结构化标签中描述与待提取的参数相应的变量的信息。
10.根据权利要求9所述的装置,其特征在于,所述正则表达匹配单元还用于根据所述第一结构化标签中的变量从所述语音文本串提取符合相应的第三结构化标签中的描述的参数数据,
所述正则表达输出单元还用于输出提取的参数数据。
11.根据权利要求7~10中任一项所述的装置,其特征在于,在第四结构化标签中描述所述正则表达匹配模板表示的用户意图的数据,
所述正则表达匹配单元还用于提取与所述匹配的正则表达匹配模板相应的第四结构化标签的数据,
所述正则表达输出单元还用于输出所述正则表达匹配模板表示的用户意图的数据。
12.根据权利要求11所述的装置,其特征在于,所述结构化形式是XML语言格式,所述正则表达匹配模板是DOM树。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510456896.9A CN105138575B (zh) | 2015-07-29 | 2015-07-29 | 语音文本串的解析方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510456896.9A CN105138575B (zh) | 2015-07-29 | 2015-07-29 | 语音文本串的解析方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105138575A true CN105138575A (zh) | 2015-12-09 |
CN105138575B CN105138575B (zh) | 2017-09-05 |
Family
ID=54723924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510456896.9A Active CN105138575B (zh) | 2015-07-29 | 2015-07-29 | 语音文本串的解析方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105138575B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105786793A (zh) * | 2015-12-23 | 2016-07-20 | 百度在线网络技术(北京)有限公司 | 解析口语文本信息的语义的方法和装置 |
CN105786797A (zh) * | 2016-02-23 | 2016-07-20 | 北京云知声信息技术有限公司 | 一种基于语音输入的信息处理方法及装置 |
CN107085610A (zh) * | 2017-04-26 | 2017-08-22 | 温州市鹿城区中津先进科技研究院 | 一种智能化非结构化数据处理方法 |
CN107229638A (zh) * | 2016-03-24 | 2017-10-03 | 北京搜狗科技发展有限公司 | 一种文本信息处理方法及装置 |
CN107305555A (zh) * | 2016-04-20 | 2017-10-31 | 中国移动通信集团河北有限公司 | 数据处理方法及装置 |
CN109614463A (zh) * | 2018-10-24 | 2019-04-12 | 阿里巴巴集团控股有限公司 | 文本匹配处理方法及装置 |
CN109783821A (zh) * | 2019-01-18 | 2019-05-21 | 广东小天才科技有限公司 | 一种特定内容的视频的搜索方法及系统 |
CN110931014A (zh) * | 2019-12-13 | 2020-03-27 | 集奥聚合(北京)人工智能科技有限公司 | 基于正则匹配规则的语音识别方法及装置 |
CN111353292A (zh) * | 2020-02-26 | 2020-06-30 | 支付宝(杭州)信息技术有限公司 | 针对用户操作指令的解析方法及装置 |
CN111444721A (zh) * | 2020-05-27 | 2020-07-24 | 南京大学 | 一种基于预训练语言模型的中文文本关键信息抽取方法 |
CN113032779A (zh) * | 2021-02-04 | 2021-06-25 | 中国科学院软件研究所 | 一种基于行为参数布尔表达式规则的多行为联合匹配方法和装置 |
CN113408893A (zh) * | 2021-06-18 | 2021-09-17 | 中国农业银行股份有限公司 | 风险预警方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1512396A (zh) * | 2002-12-27 | 2004-07-14 | 联想(北京)有限公司 | 一种开放式自然语言模板的解析方法 |
WO2013106989A1 (zh) * | 2012-01-16 | 2013-07-25 | 中国科学院北京基因组研究所 | 一种字符串匹配的方法及装置 |
CN103546623A (zh) * | 2012-07-12 | 2014-01-29 | 百度在线网络技术(北京)有限公司 | 用于发送语音信息及其文本描述信息的方法、装置与设备 |
CN104021786A (zh) * | 2014-05-15 | 2014-09-03 | 北京中科汇联信息技术有限公司 | 一种语音识别的方法和装置 |
CN104572626A (zh) * | 2015-01-23 | 2015-04-29 | 北京云知声信息技术有限公司 | 语义模板自动生成方法、装置和语义分析方法、系统 |
-
2015
- 2015-07-29 CN CN201510456896.9A patent/CN105138575B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1512396A (zh) * | 2002-12-27 | 2004-07-14 | 联想(北京)有限公司 | 一种开放式自然语言模板的解析方法 |
WO2013106989A1 (zh) * | 2012-01-16 | 2013-07-25 | 中国科学院北京基因组研究所 | 一种字符串匹配的方法及装置 |
CN103546623A (zh) * | 2012-07-12 | 2014-01-29 | 百度在线网络技术(北京)有限公司 | 用于发送语音信息及其文本描述信息的方法、装置与设备 |
CN104021786A (zh) * | 2014-05-15 | 2014-09-03 | 北京中科汇联信息技术有限公司 | 一种语音识别的方法和装置 |
CN104572626A (zh) * | 2015-01-23 | 2015-04-29 | 北京云知声信息技术有限公司 | 语义模板自动生成方法、装置和语义分析方法、系统 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105786793A (zh) * | 2015-12-23 | 2016-07-20 | 百度在线网络技术(北京)有限公司 | 解析口语文本信息的语义的方法和装置 |
CN105786793B (zh) * | 2015-12-23 | 2019-05-28 | 百度在线网络技术(北京)有限公司 | 解析口语文本信息的语义的方法和装置 |
CN105786797A (zh) * | 2016-02-23 | 2016-07-20 | 北京云知声信息技术有限公司 | 一种基于语音输入的信息处理方法及装置 |
WO2017143672A1 (zh) * | 2016-02-23 | 2017-08-31 | 北京云知声信息技术有限公司 | 一种基于语音输入的信息处理方法及装置 |
CN105786797B (zh) * | 2016-02-23 | 2018-09-14 | 北京云知声信息技术有限公司 | 一种基于语音输入的信息处理方法及装置 |
CN107229638A (zh) * | 2016-03-24 | 2017-10-03 | 北京搜狗科技发展有限公司 | 一种文本信息处理方法及装置 |
CN107305555A (zh) * | 2016-04-20 | 2017-10-31 | 中国移动通信集团河北有限公司 | 数据处理方法及装置 |
CN107085610A (zh) * | 2017-04-26 | 2017-08-22 | 温州市鹿城区中津先进科技研究院 | 一种智能化非结构化数据处理方法 |
CN109614463B (zh) * | 2018-10-24 | 2023-02-03 | 创新先进技术有限公司 | 文本匹配处理方法及装置 |
CN109614463A (zh) * | 2018-10-24 | 2019-04-12 | 阿里巴巴集团控股有限公司 | 文本匹配处理方法及装置 |
CN109783821A (zh) * | 2019-01-18 | 2019-05-21 | 广东小天才科技有限公司 | 一种特定内容的视频的搜索方法及系统 |
CN110931014A (zh) * | 2019-12-13 | 2020-03-27 | 集奥聚合(北京)人工智能科技有限公司 | 基于正则匹配规则的语音识别方法及装置 |
CN111353292A (zh) * | 2020-02-26 | 2020-06-30 | 支付宝(杭州)信息技术有限公司 | 针对用户操作指令的解析方法及装置 |
CN111353292B (zh) * | 2020-02-26 | 2023-06-16 | 支付宝(杭州)信息技术有限公司 | 针对用户操作指令的解析方法及装置 |
CN111444721A (zh) * | 2020-05-27 | 2020-07-24 | 南京大学 | 一种基于预训练语言模型的中文文本关键信息抽取方法 |
CN111444721B (zh) * | 2020-05-27 | 2022-09-23 | 南京大学 | 一种基于预训练语言模型的中文文本关键信息抽取方法 |
CN113032779A (zh) * | 2021-02-04 | 2021-06-25 | 中国科学院软件研究所 | 一种基于行为参数布尔表达式规则的多行为联合匹配方法和装置 |
CN113032779B (zh) * | 2021-02-04 | 2024-01-02 | 中国科学院软件研究所 | 一种基于行为参数布尔表达式规则的多行为联合匹配方法和装置 |
CN113408893A (zh) * | 2021-06-18 | 2021-09-17 | 中国农业银行股份有限公司 | 风险预警方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN105138575B (zh) | 2017-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105138575A (zh) | 语音文本串的解析方法和装置 | |
US20180322396A1 (en) | Knowledge Process Modeling and Automation | |
Sloetjes et al. | Annotation by category-ELAN and ISO DCR | |
CN106970802B (zh) | 在领域特定语言中集成编程脚本语言的方法及装置 | |
EP1672537A2 (en) | Data semanticizer | |
CN102122280B (zh) | 一种智能提取内容对象的方法及系统 | |
JP2011186729A (ja) | データ処理装置 | |
CN105512105A (zh) | 语义解析方法和装置 | |
CN105095186A (zh) | 语义解析方法和装置 | |
JP6526470B2 (ja) | テキスト分析及び応答システムのための語彙意味パターンの事前構築方法 | |
US20150339269A1 (en) | System and method for generating flowchart from a text document using natural language processing | |
US20110060712A1 (en) | Method and system for design check knowledge construction | |
CN104199871A (zh) | 一种用于智慧教学的高速化试题导入方法 | |
CN110502227A (zh) | 代码补全的方法及装置、存储介质、电子设备 | |
US10223349B2 (en) | Inducing and applying a subject-targeted context free grammar | |
WO2023278052A1 (en) | Automated troubleshooter | |
CA3082110A1 (en) | Knowledge process modeling and automation | |
CN108170661B (zh) | 一种规则文本的管理方法及系统 | |
CN109325217B (zh) | 一种文件转换方法、系统、装置及计算机可读存储介质 | |
JP7309811B2 (ja) | データ注釈方法、装置、電子機器および記憶媒体 | |
CN109471957B (zh) | 一种基于统一标签的元数据转换方法及装置 | |
CN112582073B (zh) | 医疗信息获取方法、装置、电子设备和介质 | |
US20160335549A1 (en) | Knowledge process modeling and automation | |
CN116523041A (zh) | 装备领域知识图谱构建方法、检索方法、系统及电子设备 | |
KR20060066588A (ko) | 자연어를 온톨로지 기반 지식으로 변환하는 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |