CN107506434A - 基于人工智能分类语音输入文本的方法和装置 - Google Patents

基于人工智能分类语音输入文本的方法和装置 Download PDF

Info

Publication number
CN107506434A
CN107506434A CN201710728382.3A CN201710728382A CN107506434A CN 107506434 A CN107506434 A CN 107506434A CN 201710728382 A CN201710728382 A CN 201710728382A CN 107506434 A CN107506434 A CN 107506434A
Authority
CN
China
Prior art keywords
classification
text
grader
template
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710728382.3A
Other languages
English (en)
Inventor
梁川
梁一川
凌光
林英展
王文敏
谢泽颖
张寅�
徐威
周超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710728382.3A priority Critical patent/CN107506434A/zh
Publication of CN107506434A publication Critical patent/CN107506434A/zh
Priority to US16/054,970 priority patent/US10762901B2/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/193Formal grammars, e.g. finite state automata, context free grammars or word networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering
    • G10L2015/0633Creating reference templates; Clustering using lexical or orthographic knowledge sources
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Abstract

本申请实施例公开了基于人工智能分类语音输入文本的方法和装置。方法的一具体实施方式包括:获取用户语音查询的当前交互文本;采用词法分析器,分析当前交互文本,得到当前词法结构;判断当前词法结构是否命中分类器中各类别的模板;若当前词法结构命中分类器中各类别的模板,将当前词法结构对应的当前交互文本分类至所命中的模板所属的类别。该实施方式可以在语音智能交互服务中,较快对文本进行分类,有效减少人工标注的文本量级,提高标注效率。

Description

基于人工智能分类语音输入文本的方法和装置
技术领域
本申请涉及计算机技术领域,具体涉及计算机网络技术领域,尤其涉及基于人工智能分类语音输入文本的方法和装置。
背景技术
人工智能(Artificial Intelligence,简称AI)技术的快速发展为人们的日常工作和生活提供了便利。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能越来越多地融入到应用中,结合人工智能的应用可以准确地确定出信息的种类,并按照不同用户的需求将不同种类的信息推送给相应的用户。
随着人工智能的飞速发展,如何让机器能拥有和人类一样的智能,成了无数企业希望做到的事情。在这个背景下,我们希望机器能够与用户进行语音智能交互。在语音智能交互服务的初期,收集的用户文本语料通常不完善,如何对这些文本语料进行分类的冷启动,是语音智能交互服务需要面对的问题。目前的语音智能交互服务,在面对文本分类冷启动这一类问题时,都需要收集大量的文本语料,完成对文本语料的人工标注后,才能进行分类训练。
然而,目前的语音智能交互服务,无法在服务初期通过有效方式较快进行文本分类。此外,进行人工标注需要投入大量的标注人力,标注效率较低。
发明内容
本申请的目的在于提出一种改进的基于人工智能分类语音输入文本的方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请实施例提供了一种基于人工智能分类语音输入文本的方法,方法包括:获取用户语音查询的当前交互文本;采用词法分析器,分析当前交互文本,得到当前词法结构;判断当前词法结构是否命中分类器中各类别的模板;若当前词法结构命中分类器中各类别的模板,将当前词法结构对应的当前交互文本分类至所命中的模板所属的类别。
在一些实施例中,各类别的模板经由以下步骤确定:对于预定交互场景,获取预设的类别;获取各类别中出现频率高于预定频率的待泛化交互文本;接收人工对各类别的待泛化交互文本的泛化,得到各类别的模板。
在一些实施例中,方法还包括:若当前词法结构未命中分类器中各类别的模板,则将当前词法结构对应的当前交互文本分类至待分类类别。
在一些实施例中,方法还包括:获取待分类类别中出现频率高于预设频率的待处理交互文本;接收人工对待处理交互文本的分类操作;将待处理交互文本分类至分类器中对应分类操作的类别中。
在一些实施例中,将待处理交互文本分类至分类器中对应分类操作的类别中包括:若分类器中存在对应分类操作的类别,则直接将待处理交互文本分类至分类器中对应分类操作的类别中。
在一些实施例中,将待处理交互文本分类至分类器中对应分类操作的类别中包括:若分类器中不存在对应分类操作的类别,则在分类器中构建对应分类操作的类别;将待处理交互文本分类至分类器中对应分类操作的类别中。
在一些实施例中,方法还包括:接收人工对分类至分类器中各类别的待处理交互文本的泛化;根据泛化结果,更新分类器中各类别的模板。
第二方面,本申请实施例还提供了一种基于人工智能分类语音输入文本的装置,装置包括:当前文本获取单元,用于获取用户语音查询的当前交互文本;当前文本分析单元,用于采用词法分析器,分析当前交互文本,得到当前词法结构;命中模板判断单元,用于判断当前词法结构是否命中分类器中各类别的模板;当前文本分类单元,用于若当前词法结构命中分类器中各类别的模板,将当前词法结构对应的当前交互文本分类至所命中的模板所属的类别。
在一些实施例中,命中模板判断单元中各类别的模板经由以下单元确定:预设类别获取单元,用于对于预定交互场景,获取预设的类别;预定文本获取单元,用于获取各类别中出现频率高于预定频率的待泛化交互文本;预定文本泛化单元,用于接收人工对各类别的待泛化交互文本的泛化,得到各类别的模板。
在一些实施例中,装置还包括:当前文本待分类单元,用于若当前词法结构未命中分类器中各类别的模板,则将当前词法结构对应的当前交互文本分类至待分类类别。
在一些实施例中,装置还包括:待处理文本获取单元,用于获取待分类类别中出现频率高于预设频率的待处理交互文本;分类操作接收单元,用于接收人工对待处理交互文本的分类操作;待处理文本分类单元,用于将待处理交互文本分类至分类器中对应分类操作的类别中。
在一些实施例中,待处理文本分类单元进一步用于:若分类器中存在对应分类操作的类别,则直接将待处理交互文本分类至分类器中对应分类操作的类别中。
在一些实施例中,待处理文本分类单元进一步用于:若分类器中不存在对应分类操作的类别,则在分类器中构建对应分类操作的类别;将待处理交互文本分类至分类器中对应分类操作的类别中。
在一些实施例中,装置还包括:待处理文本泛化单元,用于接收人工对分类至分类器中各类别的待处理交互文本的泛化;类别模板更新单元,用于根据泛化结果,更新分类器中各类别的模板。
第三方面,本申请实施例提供了一种设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上任意一项基于人工智能分类语音输入文本的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上任意一项基于人工智能分类语音输入文本的方法。
本申请实施例提供的基于人工智能分类语音输入文本的方法和装置,首先获取用户语音查询的当前交互文本;之后,采用词法分析器,分析当前交互文本,得到当前词法结构;之后,判断当前词法结构是否命中分类器中各类别的模板;最后,若当前词法结构命中分类器中各类别的模板,将当前词法结构对应的当前交互文本分类至所命中的模板所属的类别。本实施例提供的基于人工智能分类语音输入文本的方法和装置,可以在语音智能交互服务中,较快对文本进行分类。
在部分实施例中,未命中分类器中各类别的模板的当前词法结构对应的当前交互文本分类至待分类类别,之后接收人工对出现频率高于预设频率的待处理交互文本的分类操作,将待处理交互文本分类至分类器中对应分类操作的类别中,有效减少人工标注的文本量级,提高标注效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是根据本申请的基于人工智能分类语音输入文本的方法的一个实施例的示意性流程图;
图2是根据本申请的基于人工智能分类语音输入文本的方法中更新分类器中各类别的模板的方法的一个实施例的示意性流程图;
图3是根据本申请实施例的基于人工智能分类语音输入文本的方法的一个应用场景的示意性流程图;
图4是根据本申请的基于人工智能分类语音输入文本的装置的一个实施例的示例性结构图;
图5是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了根据本申请的基于人工智能分类语音输入文本的方法的一个实施例的流程100。该基于人工智能分类语音输入文本的方法包括:
在步骤110中,获取用户语音查询的当前交互文本。
在本实施例中,运行基于人工智能分类语音输入文本的方法的电子设备可以获取用户的语音查询,之后可以对语音查询进行语音识别,从而得到当前交互文本;也可以直接获取预先由识别用户语音查询得到的当前交互文本。
在步骤120中,采用词法分析器,分析当前交互文本,得到当前词法结构。
在本实施例中,在获取用户语音查询的当前交互文本之后,可以采用词法分析器分析当前交互文本,从而得到当前词法结构。这里的词法分析器,可以为现有技术或未来发展的技术中用于提取当前词法结构的词法分析器,本申请对此不做限定。例如,可以采用词法分析器Lexparser(基于Lex的词法分析器,这里的Lex是LEXical compiler的缩写,是Unix环境下的工具,主要功能是生成一个词法分析器(scanner)的C源码,描述规则采用正则表达式(regular expression))来实现对当前交互文本的分析。
在步骤130中,判断当前词法结构是否命中分类器中各类别的模板。
在本实施例中,分类器中各类别的模板可以为预先针对分类器中的类别定义的模板。各类别的模板可以为人工定义的模板,也可以为从其它应用中导出的模板。这里的类别,可以由技术人员根据语音交互场景预先定义。例如,在车载语音交互场景下,可以定义导航类、指令类、音乐类等类别;在儿童语音交互场景下,可以定义儿歌类、故事类、古诗类、画像类等类别。
在本实施例的一些可选实现方式中,各类别的模板可以经由以下步骤确定:对于预定交互场景,获取预设的类别;获取各类别中出现频率高于预定频率的待泛化交互文本;接收人工对各类别的待泛化交互文本的泛化,得到各类别的模板。
在本实现方式中,各类别中出现频率高于预定频率的待泛化交互文本,是指人工收集的该类别的常用交互文本。泛化是指由具体的、个别的交互文本扩大为一般的交互文本。例如,针对画像类,常用交互文本的表达为“你”、“您”,可以泛化为“you”,“什么时候”、“啥时”等可以泛化为“when”,“出生”、“生日”等可以泛化为“birth”,这样就得到模板“you+when+birth”,之后可以将这些模板作为该类别分类的依据。在接收人工对各类别的待泛化交互文本的泛化时,还可以生成待泛化交互文本的词法结构与泛化的模板之间的泛化词表。
通过各类别的模板,可以对语音查询的当前交互文本进行分类,而不需要人工对各个可能的语音查询的当前交互文本进行标注。例如,针对语音查询的当前交互文本“你什么时候生日”,如果用户变换一个方式提问“您啥时出生”,若采用现有技术中的标注方法,如果不存在已标注的识别文本“您啥时出生”,就不能对其进行分类,而采用本申请的泛化得到的各类别的模板,就可以对其进行分类。
在步骤140中,若当前词法结构命中分类器中各类别的模板,将当前词法结构对应的当前交互文本分类至所命中的模板所属的类别。
在本实施例中,可以基于之前确定各类别的模板时生成的泛化词表,确定当前词法结构是否命中泛化词表。若命中,则代表该词法结构命中分类器中各类别的模板。此时,可以将该词法结构对应的当前交互文本分类至所命中的模板所属的类别。
可选地,在步骤150中,若当前词法结构未命中分类器中各类别的模板,则将当前词法结构对应的当前交互文本分类至待分类类别。
在本实施例中,通过将当前交互文本分类至待分类类别,以待后续处理。例如,可以在待分类类别中的交互文本满足处理条件时(例如达到一定数量时或间隔预定时长后),对待分类类别中出现频率高于预设频率的交互文本进行人工处理,从而有效地减少了人工标注的文本量级,提高了标注效率。这里的可选步骤150并非本实施例中必不可少的步骤,也可以在本申请的实施例中,包括步骤110至步骤140即可。
本申请的上述实施例提供的基于人工智能分类语音输入文本的方法,可以在语音智能交互服务中,较快地对当前交互文本进行分类,并且在一些可选方案中,可以将当前未能分类的交互文本分类至待分类类别,以待后续在待分类类别中的交互文本满足处理条件时(例如达到一定数量时或间隔预定时长后),处理待分类类别中的交互文本,从而有效地减少了人工标注的文本量级,提高了标注效率。
进一步地,请参考图2,图2示出了根据本申请的基于人工智能分类语音输入文本的方法中更新分类器中各类别的模板的方法的一个实施例的示意性流程。
如图2所示,该更新分类器中各类别的模板的方法200包括:
在步骤210中,获取待分类类别中出现频率高于预设频率的待处理交互文本。
在本实施例中,基于图1中所示的基于人工智能分类语音输入文本的方法运行一段时间之后,待分类类别中会包括一些未被分类的交互文本。在这些交互文本在满足处理条件时(例如达到一定数量时或间隔预定时长后),可以从这些未被分类的交互文本中,选择出现频率高于预设频率的交互文本作为待处理交互文本,也即用户经常会提问到的语音查询的文本,以待后续处理。应当理解,这里的预设频率,与步骤130的可选实现方式中的预定频率,可以为相同的频率,也可以为不同的频率,本申请对此不做限定。
在步骤220中,接收人工对待处理交互文本的分类操作。
在本实施例中,对于步骤210中得到的这些待处理交互文本,可以再次进行人工处理,分析所属类别并进行模板泛化,实现分类器的模板迭代,从而大大减少了人工标注的文本量级,提高了标注效率。
在步骤230中,将待处理交互文本分类至分类器中对应分类操作的类别中。
在本实施例中,在基于人工智能分类语音输入文本的方法运行的初期,各类别的模板会比较少,而随着方法的持续运行,用户语音查询对应的交互文本会逐步变多,此时可以对于这些逐步增多但并未找到分类的语音查询对应的交互文本,人工进行分类操作。
具体地,在进行分类操作时,可以根据分类器中是否存在对应分类操作的类别,来将待处理交互文本分类至分类器中对应分类操作的类别中:若分类器中存在对应分类操作的类别,则直接将待处理交互文本分类至分类器中对应分类操作的类别中。若分类器中不存在对应分类操作的类别,则在分类器中构建对应分类操作的类别;将待处理交互文本分类至分类器中对应分类操作的类别中。例如,在车载场景下,由于大量用户的提问涉及天气,可以增加“天气”这一类别。
在步骤240中,接收人工对分类至分类器中各类别的待处理交互文本的泛化。
在本实施例中,对于步骤230中重新进行分类操作的待处理交互文本,可以采用人工进行模板泛化。泛化的过程可以参考上述图1所示的基于人工智能分类语音输入文本的方法中进行模板泛化的过程,这里不再赘述。
在步骤250中,根据泛化结果,更新分类器中各类别的模板。
在本实施例中,根据步骤240中泛化的结果,若分类器中各类别的模板中不包含该泛化的结果,则将泛化的结果更新至各类别的模板中。例如,在车载场景下,由于大量用户的提问涉及天气,可以增加“天气”这一类别,并泛化“天气”这一类别中的待处理交互文本,更新“天气”这一类别的模板。
应当理解,上述在图1的基础上实现的图2的实施例,仅为本申请的示例性实施例,并不代表对本申请的限定。例如,在本申请的另一个实施例中,可以包括步骤110至步骤150,以及步骤210至步骤230即可。
本申请的上述实施例提供的基于人工智能分类语音输入文本的方法中更新分类器中各类别的模板的方法,可以在分类语音输入文本的过程中,持续升级分类器中的类别以及各类别的模板,有效减少人工标注的文本量级,提高标注效率。
以下结合图3,描述本申请实施例的基于人工智能分类语音输入文本的方法的示例性应用场景。
如图3所示,图3示出了根据本申请实施例的基于人工智能分类语音输入文本的方法的一个应用场景的示意性流程图。
如图3所示,本申请实施例的基于人工智能分类语音输入文本的方法300,可以运行于电子设备320中。
首先,电子设备320获取用户语音查询的当前交互文本301;之后,采用词法分析器302,分析当前交互文本301,得到当前词法结构303;之后,判断当前词法结构303是否命中分类器中各类别的模板304;之后,若当前词法结构303命中分类器中各类别的模板304,将当前词法结构303对应的当前交互文本301分类至所命中的模板所属的类别305;若当前词法结构303未命中分类器中各类别的模板304,则将当前词法结构对应的当前交互文本301分类至待分类类别306;之后,获取待分类类别306中出现频率高于预设频率的待处理交互文本,接收人工对待处理交互文本的分类操作,将待分类类别中的待处理交互文本分类至分类器中对应分类操作的类别307中,若分类器中不存在对应分类操作的类别,则在分类器中构建对应分类操作的类别(新构建类别308),将待处理交互文本分类至分类器中对应分类操作的类别中;之后,接收人工对分类至分类器中各类别的高频待处理交互文本309的泛化;之后,根据泛化结果,更新分类器中各类别的模板304。
其中,最初的各类别的模板304,可以由人工在预定的交互场景310中,根据预先确定的各类别,确定各类别的待泛化交互文本311,再对待泛化交互文本311进行人工泛化,从而得到最初的各类别的模板304。
本申请的上述应用场景中提供的基于人工智能分类语音输入文本的方法,在语音智能交互服务中,可以较快地对文本进行分类,并且可以在智能交互服务的过程中,持续升级分类器中的类别以及各类别的模板,从而有效减少人工标注的文本量级,提高标注效率。
进一步参考图4,作为对上述方法的实现,本申请实施例提供了一种基于人工智能分类语音输入文本的装置的一个实施例,该基于人工智能分类语音输入文本的装置的实施例与图1至图3所示的基于人工智能分类语音输入文本的方法的实施例相对应,由此,上文针对图1至图3中基于人工智能分类语音输入文本的方法描述的操作和特征同样适用于基于人工智能分类语音输入文本的装置400及其中包含的单元,在此不再赘述。
如图4所示,该基于人工智能分类语音输入文本的装置400包括:当前文本获取单元401、当前文本分析单元402、命中模板判断单元403以及当前文本分类单元404。
其中,当前文本获取单元401,用于获取用户语音查询的当前交互文本。当前文本分析单元402,用于采用词法分析器,分析当前交互文本,得到当前词法结构。命中模板判断单元403,用于判断当前词法结构是否命中分类器中各类别的模板。当前文本分类单元404,用于若当前词法结构命中分类器中各类别的模板,将当前词法结构对应的当前交互文本分类至所命中的模板所属的类别。
在本实施例的一些可选实现方式中,命中模板判断单元403中各类别的模板经由以下单元确定(图中未示出):预设类别获取单元,用于对于预定交互场景,获取预设的类别;预定文本获取单元,用于获取各类别中出现频率高于预定频率的待泛化交互文本;预定文本泛化单元,用于接收人工对各类别的待泛化交互文本的泛化,得到各类别的模板。
在本实施例的一些可选实现方式中,装置还包括:当前文本待分类单元405,用于若当前词法结构未命中分类器中各类别的模板,则将当前词法结构对应的当前交互文本分类至待分类类别。
在本实施例的一些可选实现方式中,装置还包括:待处理文本获取单元406,用于获取待分类类别中出现频率高于预设频率的待处理交互文本;分类操作接收单元407,用于接收人工对待处理交互文本的分类操作;待处理文本分类单元408,用于将待处理交互文本分类至分类器中对应分类操作的类别中。
在本实施例的一些可选实现方式中,待处理文本分类单元进一步用于:若分类器中存在对应分类操作的类别,则直接将待处理交互文本分类至分类器中对应分类操作的类别中。
在本实施例的一些可选实现方式中,待处理文本分类单元进一步用于:若分类器中不存在对应分类操作的类别,则在分类器中构建对应分类操作的类别;将待处理交互文本分类至分类器中对应分类操作的类别中。
在本实施例的一些可选实现方式中,装置还包括:待处理文本泛化单409元,用于接收人工对分类至分类器中各类别的待处理交互文本的泛化;类别模板更新单元410,用于根据泛化结果,更新分类器中各类别的模板。
本申请还提供了一种设备的实施例,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上任意一项所述的基于人工智能分类语音输入文本的方法。
本申请还提供了一种计算机可读存储介质的实施例,其上存储有计算机程序,该程序被处理器执行时实现如上任意一项所述的基于人工智能分类语音输入文本的方法。
下面参考图5,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统500的结构示意图。图5示出的终端设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的方法中限定的上述功能。
需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个单元、程序段、或代码的一部分,所述单元、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括当前文本获取单元、当前文本分析单元、命中模板判断单元和当前文本分类单元。这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,当前文本获取单元还可以被描述为“获取用户语音查询的当前交互文本的单元”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:获取用户语音查询的当前交互文本;采用词法分析器,分析当前交互文本,得到当前词法结构;判断当前词法结构是否命中分类器中各类别的模板;若当前词法结构命中分类器中各类别的模板,将当前词法结构对应的当前交互文本分类至所命中的模板所属的类别。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (16)

1.一种基于人工智能分类语音输入文本的方法,其特征在于,所述方法包括:
获取用户语音查询的当前交互文本;
采用词法分析器,分析所述当前交互文本,得到当前词法结构;
判断所述当前词法结构是否命中分类器中各类别的模板;
若所述当前词法结构命中分类器中各类别的模板,将所述当前词法结构对应的当前交互文本分类至所命中的模板所属的类别。
2.根据权利要求1所述的方法,其特征在于,所述各类别的模板经由以下步骤确定:
对于预定交互场景,获取预设的类别;
获取各所述类别中出现频率高于预定频率的待泛化交互文本;
接收人工对各所述类别的待泛化交互文本的泛化,得到各类别的模板。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述当前词法结构未命中分类器中各类别的模板,则将所述当前词法结构对应的当前交互文本分类至待分类类别。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述待分类类别中出现频率高于预设频率的待处理交互文本;
接收人工对所述待处理交互文本的分类操作;
将所述待处理交互文本分类至所述分类器中对应所述分类操作的类别中。
5.根据权利要求4所述的方法,其特征在于,所述将所述待处理交互文本分类至所述分类器中对应所述分类操作的类别中包括:
若所述分类器中存在对应所述分类操作的类别,则直接将所述待处理交互文本分类至所述分类器中对应所述分类操作的类别中。
6.根据权利要求4所述的方法,其特征在于,所述将所述待处理交互文本分类至所述分类器中对应所述分类操作的类别中包括:
若所述分类器中不存在对应所述分类操作的类别,则在所述分类器中构建对应所述分类操作的类别;
将所述待处理交互文本分类至所述分类器中对应所述分类操作的类别中。
7.根据权利要求4所述的方法,其特征在于,所述方法还包括:
接收人工对分类至所述分类器中各类别的待处理交互文本的泛化;
根据泛化结果,更新所述分类器中各类别的模板。
8.一种基于人工智能分类语音输入文本的装置,其特征在于,所述装置包括:
当前文本获取单元,用于获取用户语音查询的当前交互文本;
当前文本分析单元,用于采用词法分析器,分析所述当前交互文本,得到当前词法结构;
命中模板判断单元,用于判断所述当前词法结构是否命中分类器中各类别的模板;
当前文本分类单元,用于若所述当前词法结构命中分类器中各类别的模板,将所述当前词法结构对应的当前交互文本分类至所命中的模板所属的类别。
9.根据权利要求8所述的装置,其特征在于,所述命中模板判断单元中各类别的模板经由以下单元确定:
预设类别获取单元,用于对于预定交互场景,获取预设的类别;
预定文本获取单元,用于获取各所述类别中出现频率高于预定频率的待泛化交互文本;
预定文本泛化单元,用于接收人工对各所述类别的待泛化交互文本的泛化,得到各类别的模板。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括:
当前文本待分类单元,用于若所述当前词法结构未命中分类器中各类别的模板,则将所述当前词法结构对应的当前交互文本分类至待分类类别。
11.根据权利要求8所述的装置,其特征在于,所述装置还包括:
待处理文本获取单元,用于获取所述待分类类别中出现频率高于预设频率的待处理交互文本;
分类操作接收单元,用于接收人工对所述待处理交互文本的分类操作;
待处理文本分类单元,用于将所述待处理交互文本分类至所述分类器中对应所述分类操作的类别中。
12.根据权利要求11所述的装置,其特征在于,所述待处理文本分类单元进一步用于:
若所述分类器中存在对应所述分类操作的类别,则直接将所述待处理交互文本分类至所述分类器中对应所述分类操作的类别中。
13.根据权利要求11所述的装置,其特征在于,所述待处理文本分类单元进一步用于:
若所述分类器中不存在对应所述分类操作的类别,则在所述分类器中构建对应所述分类操作的类别;
将所述待处理交互文本分类至所述分类器中对应所述分类操作的类别中。
14.根据权利要求11所述的装置,其特征在于,所述装置还包括:待处理文本泛化单元,用于接收人工对分类至所述分类器中各类别的待处理交互文本的泛化;
类别模板更新单元,用于根据泛化结果,更新所述分类器中各类别的模板。
15.一种设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任意一项所述的基于人工智能分类语音输入文本的方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任意一项所述的基于人工智能分类语音输入文本的方法。
CN201710728382.3A 2017-08-23 2017-08-23 基于人工智能分类语音输入文本的方法和装置 Pending CN107506434A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710728382.3A CN107506434A (zh) 2017-08-23 2017-08-23 基于人工智能分类语音输入文本的方法和装置
US16/054,970 US10762901B2 (en) 2017-08-23 2018-08-03 Artificial intelligence based method and apparatus for classifying voice-recognized text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710728382.3A CN107506434A (zh) 2017-08-23 2017-08-23 基于人工智能分类语音输入文本的方法和装置

Publications (1)

Publication Number Publication Date
CN107506434A true CN107506434A (zh) 2017-12-22

Family

ID=60692484

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710728382.3A Pending CN107506434A (zh) 2017-08-23 2017-08-23 基于人工智能分类语音输入文本的方法和装置

Country Status (2)

Country Link
US (1) US10762901B2 (zh)
CN (1) CN107506434A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108538291A (zh) * 2018-04-11 2018-09-14 百度在线网络技术(北京)有限公司 语音控制方法、终端设备、云端服务器及系统
CN109446325A (zh) * 2018-10-22 2019-03-08 北京云雀智享科技有限公司 一种高正确率的自然语言分类器系统
CN109446300A (zh) * 2018-09-06 2019-03-08 厦门快商通信息技术有限公司 一种语料预处理方法、语料预标注方法及电子设备
CN109597888A (zh) * 2018-11-19 2019-04-09 北京百度网讯科技有限公司 建立文本领域识别模型的方法、装置
CN114882883A (zh) * 2022-05-31 2022-08-09 四川虹美智能科技有限公司 智能设备控制方法、装置及系统
US11848016B2 (en) 2018-08-07 2023-12-19 Huawei Technologies Co., Ltd. Voice control command generation method and terminal

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3906508B1 (en) * 2018-12-31 2024-03-13 Intel Corporation Securing systems employing artificial intelligence
CN110188199A (zh) * 2019-05-21 2019-08-30 北京鸿联九五信息产业有限公司 一种用于智能语音交互的文本分类方法
CN112700792B (zh) * 2020-12-24 2024-02-06 南京邮电大学 音频场景识别分类方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8195626B1 (en) * 2009-06-18 2012-06-05 Amazon Technologies, Inc. Compressing token-based files for transfer and reconstruction
CN103500195A (zh) * 2013-09-18 2014-01-08 小米科技有限责任公司 分类器更新方法、装置、系统及设备
CN103577476A (zh) * 2012-08-06 2014-02-12 腾讯科技(深圳)有限公司 网页浏览记录的处理方法及网页浏览装置
CN105183850A (zh) * 2015-09-07 2015-12-23 百度在线网络技术(北京)有限公司 基于人工智能的信息查询方法及装置
CN106328147A (zh) * 2016-08-31 2017-01-11 中国科学技术大学 语音识别方法和装置
CN106503184A (zh) * 2016-10-24 2017-03-15 海信集团有限公司 确定目标文本所属业务类别的方法及装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5642435A (en) * 1995-01-25 1997-06-24 Xerox Corporation Structured document processing with lexical classes as context
US6192360B1 (en) * 1998-06-23 2001-02-20 Microsoft Corporation Methods and apparatus for classifying text and for building a text classifier
WO2001090921A2 (en) * 2000-05-25 2001-11-29 Kanisa, Inc. System and method for automatically classifying text
JP3701197B2 (ja) * 2000-12-28 2005-09-28 松下電器産業株式会社 分類への帰属度計算基準作成方法及び装置
US6892189B2 (en) * 2001-01-26 2005-05-10 Inxight Software, Inc. Method for learning and combining global and local regularities for information extraction and classification
US6898737B2 (en) * 2001-05-24 2005-05-24 Microsoft Corporation Automatic classification of event data
US20030221163A1 (en) * 2002-02-22 2003-11-27 Nec Laboratories America, Inc. Using web structure for classifying and describing web pages
US7389230B1 (en) * 2003-04-22 2008-06-17 International Business Machines Corporation System and method for classification of voice signals
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US20090313217A1 (en) * 2008-06-12 2009-12-17 Iac Search & Media, Inc. Systems and methods for classifying search queries
KR101078864B1 (ko) * 2009-03-26 2011-11-02 한국과학기술원 질의/문서 주제 범주 변화 분석 시스템 및 그 방법과 이를 이용한 질의 확장 기반 정보 검색 시스템 및 그 방법
CN102141997A (zh) * 2010-02-02 2011-08-03 三星电子(中国)研发中心 智能决策支持系统及其智能决策方法
US9674331B2 (en) * 2012-06-08 2017-06-06 Apple Inc. Transmitting data from an automated assistant to an accessory
EP2851808A3 (en) * 2013-09-19 2015-04-15 Maluuba Inc. Hybrid natural language processor
KR101778679B1 (ko) * 2015-10-02 2017-09-14 네이버 주식회사 딥러닝을 이용하여 텍스트 단어 및 기호 시퀀스를 값으로 하는 복수 개의 인자들로 표현된 데이터를 자동으로 분류하는 방법 및 시스템
WO2017112813A1 (en) * 2015-12-22 2017-06-29 Sri International Multi-lingual virtual personal assistant
US20180204135A1 (en) * 2017-01-18 2018-07-19 Wipro Limited Systems and methods for improving accuracy of classification-based text data processing
EP3392780A3 (en) * 2017-04-19 2018-11-07 Tata Consultancy Services Limited Systems and methods for classification of software defect reports

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8195626B1 (en) * 2009-06-18 2012-06-05 Amazon Technologies, Inc. Compressing token-based files for transfer and reconstruction
CN103577476A (zh) * 2012-08-06 2014-02-12 腾讯科技(深圳)有限公司 网页浏览记录的处理方法及网页浏览装置
CN103500195A (zh) * 2013-09-18 2014-01-08 小米科技有限责任公司 分类器更新方法、装置、系统及设备
CN105183850A (zh) * 2015-09-07 2015-12-23 百度在线网络技术(北京)有限公司 基于人工智能的信息查询方法及装置
CN106328147A (zh) * 2016-08-31 2017-01-11 中国科学技术大学 语音识别方法和装置
CN106503184A (zh) * 2016-10-24 2017-03-15 海信集团有限公司 确定目标文本所属业务类别的方法及装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108538291A (zh) * 2018-04-11 2018-09-14 百度在线网络技术(北京)有限公司 语音控制方法、终端设备、云端服务器及系统
US11127398B2 (en) 2018-04-11 2021-09-21 Baidu Online Network Technology (Beijing) Co., Ltd. Method for voice controlling, terminal device, cloud server and system
US11848016B2 (en) 2018-08-07 2023-12-19 Huawei Technologies Co., Ltd. Voice control command generation method and terminal
CN109446300A (zh) * 2018-09-06 2019-03-08 厦门快商通信息技术有限公司 一种语料预处理方法、语料预标注方法及电子设备
CN109446300B (zh) * 2018-09-06 2021-04-20 厦门快商通信息技术有限公司 一种语料预处理方法、语料预标注方法及电子设备
CN109446325A (zh) * 2018-10-22 2019-03-08 北京云雀智享科技有限公司 一种高正确率的自然语言分类器系统
CN109446325B (zh) * 2018-10-22 2021-09-14 北京云雀智享科技有限公司 一种高正确率的自然语言分类器系统
CN109597888A (zh) * 2018-11-19 2019-04-09 北京百度网讯科技有限公司 建立文本领域识别模型的方法、装置
CN114882883A (zh) * 2022-05-31 2022-08-09 四川虹美智能科技有限公司 智能设备控制方法、装置及系统
CN114882883B (zh) * 2022-05-31 2023-07-25 合肥长虹美菱生活电器有限公司 智能设备控制方法、装置及系统

Also Published As

Publication number Publication date
US20190066675A1 (en) 2019-02-28
US10762901B2 (en) 2020-09-01

Similar Documents

Publication Publication Date Title
CN107506434A (zh) 基于人工智能分类语音输入文本的方法和装置
CN109036384B (zh) 语音识别方法和装置
CN107679039A (zh) 用于确定语句意图的方法和装置
CN107301170A (zh) 基于人工智能的切分语句的方法和装置
CN107103903B (zh) 基于人工智能的声学模型训练方法、装置及存储介质
CN107832305A (zh) 用于生成信息的方法和装置
CN107273503A (zh) 用于生成同语言平行文本的方法和装置
CN107491547A (zh) 基于人工智能的搜索方法和装置
CN106227721B (zh) 汉语韵律层级结构预测系统
CN107316083A (zh) 用于更新深度学习模型的方法和装置
CN107729319A (zh) 用于输出信息的方法和装置
CN107783960A (zh) 用于抽取信息的方法、装置和设备
CN108428446A (zh) 语音识别方法和装置
CN108932220A (zh) 文章生成方法和装置
CN107861954A (zh) 基于人工智能的信息输出方法和装置
CN108121800A (zh) 基于人工智能的信息生成方法和装置
CN110019782A (zh) 用于输出文本类别的方法和装置
CN109190124B (zh) 用于分词的方法和装置
CN110148400A (zh) 发音类型的识别方法、模型的训练方法、装置及设备
CN108197652A (zh) 用于生成信息的方法和装置
CN106776503A (zh) 文本语义相似度的确定方法及装置
CN108877782A (zh) 语音识别方法和装置
CN106921749A (zh) 用于推送信息的方法和装置
CN107169586A (zh) 基于人工智能的资源组合优化方法、装置及存储介质
CN107526809A (zh) 基于人工智能推送音乐的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171222

RJ01 Rejection of invention patent application after publication