CN116069916A - 旅游景点问答系统 - Google Patents
旅游景点问答系统 Download PDFInfo
- Publication number
- CN116069916A CN116069916A CN202310178519.8A CN202310178519A CN116069916A CN 116069916 A CN116069916 A CN 116069916A CN 202310178519 A CN202310178519 A CN 202310178519A CN 116069916 A CN116069916 A CN 116069916A
- Authority
- CN
- China
- Prior art keywords
- consultation
- matrix
- feature
- answer
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012545 processing Methods 0.000 claims abstract description 53
- 238000000034 method Methods 0.000 claims abstract description 47
- 239000013598 vector Substances 0.000 claims description 256
- 239000011159 matrix material Substances 0.000 claims description 156
- 230000011218 segmentation Effects 0.000 claims description 44
- 238000009223 counseling Methods 0.000 claims description 20
- 230000005284 excitation Effects 0.000 claims description 19
- 230000003993 interaction Effects 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 15
- 238000005728 strengthening Methods 0.000 claims description 15
- 230000002452 interceptive effect Effects 0.000 claims description 11
- 230000002787 reinforcement Effects 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 5
- 238000013135 deep learning Methods 0.000 abstract description 10
- 238000005516 engineering process Methods 0.000 abstract description 8
- 238000013473 artificial intelligence Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 9
- 238000007792 addition Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Machine Translation (AREA)
Abstract
公开了一种旅游景点问答系统,其将旅游景点的智能问答理解为特征匹配问题,具体地,采用基于深度学习的人工智能语义理解技术,以在将客户的咨询语音信号转换为咨询文本后,提取出所述咨询文本中基于全局的上下文语义特征信息以及备选答案的文本描述中基于全局的上下文语义特征信息,以此来建立两者的关联性特征分布,再利用分类器进行所述备选答案与所述游客自行是否相适配的分类处理,进而在两者相适配时返回所述备选答案的文本描述所对应的语音信号。这样,能够对于旅游景点的客户的咨询信号提供精准地语音答案回复。
Description
技术领域
本申请涉及智慧旅游领域,且更为具体地,涉及一种旅游景点问答系统。
背景技术
智慧旅游的研究是当前科研领域的一大研究热点。当前,国内外学者针对问答系统领域的研究做了很多相关工作,但是鲜有直接针对旅游行业进行研究的问答系统。因此,现有的旅游景点会配置大量的人工导游来进行讲解工作,虽然人工导游能满足游客的问答需求,但一个导游通常会带领一个游客团,并非所有游客的问答需求都能得到及时的满足。
因此,期待一种旅游景点问答系统。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种旅游景点问答系统,其将旅游景点的智能问答理解为特征匹配问题,具体地,采用基于深度学习的人工智能语义理解技术,以在将客户的咨询语音信号转换为咨询文本后,提取出所述咨询文本中基于全局的上下文语义特征信息以及备选答案的文本描述中基于全局的上下文语义特征信息,以此来建立两者的关联性特征分布,再利用分类器进行所述备选答案与所述游客自行是否相适配的分类处理,进而在两者相适配时返回所述备选答案的文本描述所对应的语音信号。这样,能够对于旅游景点的客户的咨询信号提供精准地语音答案回复。
相应地,根据本申请的一个方面,提供了一种旅游景点问答系统,其包括:咨询语音接收模块,用于获取由客户提供的旅游景点咨询语音信号;语音识别模块,用于对所述旅游景点咨询语音信号进行语音识别以得到咨询文本;咨询文本上下文理解模块,用于对所述咨询文本进行分词处理后通过基于转换器的上下文编码器以得到咨询语义特征向量;备选答案获取模块,用于获取备选答案的文本描述;备选答案上下文编码模块,用于对所述备选答案的文本描述进行分词处理后通过基于转换器的上下文编码器以得到备选答案语义特征向量;关联编码模块,用于对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵;交互强化模块,用于对所述关联特征矩阵进行基于可区分性物理激励的交互强化以得到校正后关联特征矩阵;分类模块,用于将所述校正后关联特征矩阵通过分类器以得到分类结果,所述分类结果用于表示备选答案是否与游客咨询相适配;以及反馈模块,用于响应于所述分类结果为备选答案与游客咨询相适配,返回与所述备选答案的文本描述对应的语音信号。
在上述旅游景点问答系统中,所述咨询文本上下文理解模块,包括:第一分词单元,用于对所述咨询文本进行分词处理以获得多个咨询词;第一词嵌入单元,用于将所述多个咨询词通过嵌入层以将所述多个咨询词中各个咨询词转化为咨询词嵌入向量以得到咨询词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个咨询词进行嵌入编码;第一上下文语义编码单元,用于将所述咨询词嵌入向量的序列输入所述基于转换器的上下文编码器以得到所述多个咨询特征向量;以及第一级联单元,用于将所述多个咨询特征向量进行级联以得到所述咨询语义特征向量。
在上述旅游景点问答系统中,所述第一上下文语义编码单元,进一步用于:将所述咨询词嵌入向量的序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述咨询词嵌入向量的序列中各个咨询词嵌入向量作为值向量分别进行相乘以得到所述多个咨询特征向量。
在上述旅游景点问答系统中,所述备选答案上下文编码模块,包括:第二分词单元,用于对所述备选答案的文本描述进行分词处理以获得多个备选答案词;第二词嵌入单元,用于将所述多个备选答案词通过嵌入层以将所述多个备选答案词中各个备选答案词转化为备选答案词嵌入向量以得到备选答案词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个备选答案词进行嵌入编码;第二上下文语义编码单元,用于将所述备选答案词嵌入向量的序列输入所述基于转换器的上下文编码器以得到所述多个备选答案特征向量;以及,第二级联单元,用于将所述多个备选答案特征向量进行级联以得到所述备选答案语义特征向量。
在上述旅游景点问答系统中,所述关联编码模块,进一步用于:以如下公式对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵;其中,所述公式为:,其中表示所述咨询语义特征向量量,表示所述备选答案语义特征向量,表示所述关联特征矩阵,表示矩阵相乘。
在上述旅游景点问答系统中,所述交互强化模块,进一步用于:以如下公式对所述关联特征矩阵进行基于可区分性物理激励的交互强化以得到所述校正后关联特征矩阵;
其中,所述公式为:
其中是所述关联特征矩阵,是所述校正后关联特征矩阵,和是预定超参数,和表示特征矩阵的按位置加法和减法,除法表示特征矩阵的每个位置除以相应值,且表示通过单个卷积层的卷积操作。
在上述旅游景点问答系统中,所述分类模块,包括:展开单元,用于将所述校正后关联特征矩阵按照行向量或者列向量展开为分类特征向量;全连接编码单元,用于使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,分类结果生成单元,用于将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。
根据本申请的另一方面,还提供了一种旅游景点问答方法,其包括:获取由客户提供的旅游景点咨询语音信号;对所述旅游景点咨询语音信号进行语音识别以得到咨询文本;对所述咨询文本进行分词处理后通过基于转换器的上下文编码器以得到咨询语义特征向量;获取备选答案的文本描述;对所述备选答案的文本描述进行分词处理后通过基于转换器的上下文编码器以得到备选答案语义特征向量;对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵;对所述关联特征矩阵进行基于可区分性物理激励的交互强化以得到校正后关联特征矩阵;将所述校正后关联特征矩阵通过分类器以得到分类结果,所述分类结果用于表示备选答案是否与游客咨询相适配;以及响应于所述分类结果为备选答案与游客咨询相适配,返回与所述备选答案的文本描述对应的语音信号。
在上述旅游景点问答方法中,所述对所述咨询文本进行分词处理后通过基于转换器的上下文编码器以得到咨询语义特征向量,包括:对所述咨询文本进行分词处理以获得多个咨询词;将所述多个咨询词通过嵌入层以将所述多个咨询词中各个咨询词转化为咨询词嵌入向量以得到咨询词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个咨询词进行嵌入编码;将所述咨询词嵌入向量的序列输入所述基于转换器的上下文编码器以得到所述多个咨询特征向量;以及,将所述多个咨询特征向量进行级联以得到所述咨询语义特征向量。
在上述旅游景点问答方法中,所述将所述咨询词嵌入向量的序列输入所述基于转换器的上下文编码器以得到所述多个咨询特征向量,包括:将所述咨询词嵌入向量的序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述咨询词嵌入向量的序列中各个咨询词嵌入向量作为值向量分别进行相乘以得到所述多个咨询特征向量。
在上述旅游景点问答方法中,所述对所述备选答案的文本描述进行分词处理后通过基于转换器的上下文编码器以得到备选答案语义特征向量,包括:对所述备选答案的文本描述进行分词处理以获得多个备选答案词;将所述多个备选答案词通过嵌入层以将所述多个备选答案词中各个备选答案词转化为备选答案词嵌入向量以得到备选答案词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个备选答案词进行嵌入编码;将所述备选答案词嵌入向量的序列输入所述基于转换器的上下文编码器以得到所述多个备选答案特征向量;以及,将所述多个备选答案特征向量进行级联以得到所述备选答案语义特征向量。
在上述旅游景点问答方法中,所述对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵,包括:以如下公式对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵;其中,所述公式为:,其中表示所述咨询语义特征向量量,表示所述备选答案语义特征向量,表示所述关联特征矩阵,表示矩阵相乘。
在上述旅游景点问答方法中,所述对所述关联特征矩阵进行基于可区分性物理激励的交互强化以得到校正后关联特征矩阵,包括:以如下公式对所述关联特征矩阵进行基于可区分性物理激励的交互强化以得到所述校正后关联特征矩阵;
其中,所述公式为:
其中是所述关联特征矩阵,是所述校正后关联特征矩阵,和是预定超参数,和表示特征矩阵的按位置加法和减法,除法表示特征矩阵的每个位置除以相应值,且表示通过单个卷积层的卷积操作。
在上述旅游景点问答方法中,所述将所述校正后关联特征矩阵通过分类器以得到分类结果,所述分类结果用于表示备选答案是否与游客咨询相适配,包括:将所述校正后关联特征矩阵按照行向量或者列向量展开为分类特征向量;使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。
根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的旅游景点问答方法。
根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的旅游景点问答方法。
与现有技术相比,本申请提供的旅游景点问答系统,其将旅游景点的智能问答理解为特征匹配问题,具体地,采用基于深度学习的人工智能语义理解技术,以在将客户的咨询语音信号转换为咨询文本后,提取出所述咨询文本中基于全局的上下文语义特征信息以及备选答案的文本描述中基于全局的上下文语义特征信息,以此来建立两者的关联性特征分布,再利用分类器进行所述备选答案与所述游客自行是否相适配的分类处理,进而在两者相适配时返回所述备选答案的文本描述所对应的语音信号。这样,能够对于旅游景点的客户的咨询信号提供精准地语音答案回复。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的旅游景点问答系统的框图。
图2为根据本申请实施例的旅游景点问答系统的架构示意图。
图3为根据本申请实施例的旅游景点问答系统中咨询文本上下文理解模块的框图。
图4为根据本申请实施例的旅游景点问答方法的流程图。
图5为根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述:如上述背景技术所言,现有的旅游景点会配置大量的人工导游来进行讲解工作,虽然人工导游能满足游客的问答需求,但一个导游通常会带领一个游客团,并非所有游客的问答需求都能得到及时的满足。因此,期待一种旅游景点问答系统。
目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、语音信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
近年来,深度学习以及神经网络的发展为旅游景点的智能问答提供了新的解决思路和方案。
相应地,考虑到旅游景点的智能问答这本质上是一个特征匹配分类的问题,也就是说,将客户的咨询语音的语义理解特征与备选答案的文本描述的语义理解特征进行关联性的特征匹配,以此来得到两者是否适配的分类结果。具体地,在本申请的技术方案中,采用基于深度学习的人工智能语义理解技术,以在将客户的咨询语音信号转换为咨询文本后,提取出所述咨询文本中基于全局的上下文语义特征信息以及备选答案的文本描述中基于全局的上下文语义特征信息,以此来建立两者的关联性特征分布,再利用分类器进行所述备选答案与所述游客自行是否相适配的分类处理,进而在两者相适配时返回所述备选答案的文本描述所对应的语音信号。这样,能够对于旅游景点的客户的咨询信号提供精准地语音答案回复,以在及时准确地得到咨询答案的同时节省人们大量的时间。
具体地,在本申请的技术方案中,首先,获取由客户提供的旅游景点咨询语音信号。接着,为了便于对于所述咨询语音信号进行语义理解,将所述旅游景点咨询语音信号进行语音识别以得到咨询文本。
然后,考虑到所述咨询文本是由多个词和数据项组成的语句,因此,为了能够对其进行准确地语义理解来得到所述咨询文本的语义信息,进一步对所述咨询文本进行分词处理后通过基于转换器的上下文编码器中进行编码,以提取出所述咨询文本中的各个词基于全局的高维语义关联特征,从而得到咨询语义特征向量。也就是,具体地,首先,对于所述咨询文本进行分词处理以避免后续进行语义特征提取时发生语义混乱;接着,再将使用词嵌入层进行分词处理后的各个词进行词嵌入化来映射为词嵌入向量以得到词嵌入向量的序列;然后,使用所述上下文编码器的转换器对所获得所述词嵌入向量的序列进行基于全局的上下文语义编码,以提取出所述咨询文本中各个词基于全局的上下文语义理解特征,从而生成多个咨询文本特征向量;进一步再将所述多个咨询文本特征向量进行级联以得到所述咨询语义特征向量。
进一步地,对于备选答案的文本描述,也将对其进行分词处理以避免词序混乱后,通过基于转换器的上下文编码器中进行编码处理,以提取出所述备选答案的文本描述中的各个词基于全局的上下文语义关联特征,即对于所述备选答案的文本描述中的各个词的基于全局的语义理解特征信息,从而得到得到备选答案语义特征向量。
接着,再对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵,以此来建立所述咨询语义特征与所述答案语义特征之间的关联性特征分布信息,并以此作为分类特征矩阵通过分类器中进行分类处理,来得到用于表示备选答案是否与游客咨询相适配的分类结果,进而响应于所述分类结果为备选答案与游客咨询相适配,返回与所述备选答案的文本描述对应的语音信号。这样,能够对于旅游景点的客户的咨询信号提供精准地语音答案回复,以在及时准确地得到咨询答案的同时节省人们大量的时间。
特别地,在本申请的技术方案中,对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码得到所述关联特征矩阵时,是将所述咨询语义特征向量和所述备选答案语义特征向量各个位置之间的特征值相乘以得到所述关联特征矩阵的每个位置的特征值。但是,由于所述咨询文本得到的所述咨询语义特征向量和所述备选答案得到的所述备选答案语义特征向量在沿向量的不同位置下具有不同的关联性,例如所述咨询语义特征向量的前段和所述备选答案语义特征向量的前段之间的关联性高,而所述咨询语义特征向量的前段和所述备选答案语义特征向量的后段之间的关联性高,这就导致所述关联特征矩阵中的某些位置的特征值相对于其它位置的特征值会具有更显著的重要性,因此,如果可以在分类任务中对于所述关联特征矩阵的特征值进行有效区分,显然可以提高分类结果的准确性。
因此,本申请的申请人对所述关联特征矩阵,例如记为进行基于可区分性物理激励的交互强化,具体为:
其中是强化后的关联特征矩阵,和是预定超参数,和表示特征矩阵的按位置加法和减法,除法表示特征矩阵的每个位置除以相应值,且表示通过单个卷积层的卷积操作。
这里,所述基于可区分性物理激励的交互强化用于在通过梯度下降的反向传播过程当中提升特征空间与分类问题的解空间之间的交互,其以类似物理激励的方式来提取和模仿可行特征(actionable feature),由此,使用通用目的的低维可导式物理激励方式,来获得具有梯度可区分性的可行特征的物理性表达,从而在训练过程中强化所述关联特征矩阵内的活跃部分,以提升强化后的关联特征矩阵在分类任务下的分类结果的准确性。这样,能够对于旅游景点的客户的咨询信号提供精准地语音答案回复,以在及时准确地得到咨询答案的同时节省人们大量的时间。
基于此,本申请提供了一种旅游景点问答系统,其包括:咨询语音接收模块,用于获取由客户提供的旅游景点咨询语音信号;语音识别模块,用于对所述旅游景点咨询语音信号进行语音识别以得到咨询文本;咨询文本上下文理解模块,用于对所述咨询文本进行分词处理后通过基于转换器的上下文编码器以得到咨询语义特征向量;备选答案获取模块,用于获取备选答案的文本描述;备选答案上下文编码模块,用于对所述备选答案的文本描述进行分词处理后通过基于转换器的上下文编码器以得到备选答案语义特征向量;关联编码模块,用于对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵;交互强化模块,用于对所述关联特征矩阵进行基于可区分性物理激励的交互强化以得到校正后关联特征矩阵;分类模块,用于将所述校正后关联特征矩阵通过分类器以得到分类结果,所述分类结果用于表示备选答案是否与游客咨询相适配;以及,反馈模块,用于响应于所述分类结果为备选答案与游客咨询相适配,返回与所述备选答案的文本描述对应的语音信号。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性系统:图1为根据本申请实施例的旅游景点问答系统的框图。如图1所示,根据本申请实施例的旅游景点问答系统100,包括:咨询语音接收模块110,用于获取由客户提供的旅游景点咨询语音信号;语音识别模块120,用于对所述旅游景点咨询语音信号进行语音识别以得到咨询文本;咨询文本上下文理解模块130,用于对所述咨询文本进行分词处理后通过基于转换器的上下文编码器以得到咨询语义特征向量;备选答案获取模块140,用于获取备选答案的文本描述;备选答案上下文编码模块150,用于对所述备选答案的文本描述进行分词处理后通过基于转换器的上下文编码器以得到备选答案语义特征向量;关联编码模块160,用于对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵;交互强化模块170,用于对所述关联特征矩阵进行基于可区分性物理激励的交互强化以得到校正后关联特征矩阵;分类模块180,用于将所述校正后关联特征矩阵通过分类器以得到分类结果,所述分类结果用于表示备选答案是否与游客咨询相适配;以及,反馈模块190,用于响应于所述分类结果为备选答案与游客咨询相适配,返回与所述备选答案的文本描述对应的语音信号。
图2为根据本申请实施例的旅游景点问答系统的架构示意图。如图2所示,首先,获取由客户提供的旅游景点咨询语音信号。接着,对所述旅游景点咨询语音信号进行语音识别以得到咨询文本。然后,对所述咨询文本进行分词处理后通过基于转换器的上下文编码器以得到咨询语义特征向量,同时,获取备选答案的文本描述。进而,对所述备选答案的文本描述进行分词处理后通过基于转换器的上下文编码器以得到备选答案语义特征向量。接着,对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵。然后,对所述关联特征矩阵进行基于可区分性物理激励的交互强化以得到校正后关联特征矩阵。进而,将所述校正后关联特征矩阵通过分类器以得到分类结果,所述分类结果用于表示备选答案是否与游客咨询相适配。最后,响应于所述分类结果为备选答案与游客咨询相适配,返回与所述备选答案的文本描述对应的语音信号。
在上述旅游景点问答系统100中,所述咨询语音接收模块110,用于获取由客户提供的旅游景点咨询语音信号。如上述背景技术所言,现有的旅游景点会配置大量的人工导游来进行讲解工作,虽然人工导游能满足游客的问答需求,但一个导游通常会带领一个游客团,并非所有游客的问答需求都能得到及时的满足。因此,期待一种旅游景点问答系统。
相应地,考虑到旅游景点的智能问答这本质上是一个特征匹配分类的问题,也就是说,将客户的咨询语音的语义理解特征与备选答案的文本描述的语义理解特征进行关联性的特征匹配,以此来得到两者是否适配的分类结果。具体地,在本申请的技术方案中,采用基于深度学习的人工智能语义理解技术,以在将客户的咨询语音信号转换为咨询文本后,提取出所述咨询文本中基于全局的上下文语义特征信息以及备选答案的文本描述中基于全局的上下文语义特征信息,以此来建立两者的关联性特征分布,再利用分类器进行所述备选答案与所述游客自行是否相适配的分类处理,进而在两者相适配时返回所述备选答案的文本描述所对应的语音信号。这样,能够对于旅游景点的客户的咨询信号提供精准地语音答案回复,以在及时准确地得到咨询答案的同时节省人们大量的时间。具体地,在本申请的技术方案中,首先,获取由客户提供的旅游景点咨询语音信号。
在上述旅游景点问答系统100中,所述语音识别模块120,用于对所述旅游景点咨询语音信号进行语音识别以得到咨询文本。语音识别技术,也被称为自动语音识别(Automatic Speech Recognition,ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。这里,为了便于对于所述咨询语音信号进行语义理解,将所述旅游景点咨询语音信号进行语音识别以得到咨询文本。
在上述旅游景点问答系统100中,所述咨询文本上下文理解模块130,用于对所述咨询文本进行分词处理后通过基于转换器的上下文编码器以得到咨询语义特征向量。考虑到所述咨询文本是由多个词和数据项组成的语句,因此,为了能够对其进行准确地语义理解来得到所述咨询文本的语义信息,进一步对所述咨询文本进行分词处理后通过基于转换器的上下文编码器中进行编码,以提取出所述咨询文本中的各个词基于全局的高维语义关联特征,从而得到咨询语义特征向量。也就是,具体地,首先,对于所述咨询文本进行分词处理以避免后续进行语义特征提取时发生语义混乱;接着,再将使用词嵌入层进行分词处理后的各个词进行词嵌入化来映射为词嵌入向量以得到词嵌入向量的序列;然后,使用所述上下文编码器的转换器对所获得所述词嵌入向量的序列进行基于全局的上下文语义编码,以提取出所述咨询文本中各个词基于全局的上下文语义理解特征,从而生成多个咨询文本特征向量;进一步再将所述多个咨询文本特征向量进行级联以得到所述咨询语义特征向量。
图3为根据本申请实施例的旅游景点问答系统中咨询文本上下文理解模块的框图。如图3所示,所述咨询文本上下文理解模块130,包括:第一分词单元131,用于对所述咨询文本进行分词处理以获得多个咨询词;第一词嵌入单元132,用于将所述多个咨询词通过嵌入层以将所述多个咨询词中各个咨询词转化为咨询词嵌入向量以得到咨询词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个咨询词进行嵌入编码;第一上下文语义编码单元133,用于将所述咨询词嵌入向量的序列输入所述基于转换器的上下文编码器以得到所述多个咨询特征向量;以及,第一级联单元134,用于将所述多个咨询特征向量进行级联以得到所述咨询语义特征向量。
具体地,在本申请实施例中,所述第一上下文语义编码单元133,进一步用于:将所述咨询词嵌入向量的序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述咨询词嵌入向量的序列中各个咨询词嵌入向量作为值向量分别进行相乘以得到所述多个咨询特征向量。
在上述旅游景点问答系统100中,所述备选答案获取模块140,用于获取备选答案的文本描述。进一步地,获取备选答案的文本描述以在后续进行备选答案的特征提取工作。
在上述旅游景点问答系统100中,所述备选答案上下文编码模块150,用于对所述备选答案的文本描述进行分词处理后通过基于转换器的上下文编码器以得到备选答案语义特征向量。同样地,对于备选答案的文本描述,也将对其进行分词处理以避免词序混乱后,通过基于转换器的上下文编码器中进行编码处理,以提取出所述备选答案的文本描述中的各个词基于全局的上下文语义关联特征,即对于所述备选答案的文本描述中的各个词的基于全局的语义理解特征信息,从而得到得到备选答案语义特征向量。
具体地,在本申请实施例中,所述备选答案上下文编码模块140,包括:第二分词单元,用于对所述备选答案的文本描述进行分词处理以获得多个备选答案词;第二词嵌入单元,用于将所述多个备选答案词通过嵌入层以将所述多个备选答案词中各个备选答案词转化为备选答案词嵌入向量以得到备选答案词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个备选答案词进行嵌入编码;第二上下文语义编码单元,用于将所述备选答案词嵌入向量的序列输入所述基于转换器的上下文编码器以得到所述多个备选答案特征向量;以及,第二级联单元,用于将所述多个备选答案特征向量进行级联以得到所述备选答案语义特征向量。
在上述旅游景点问答系统100中,所述关联编码模块160,用于对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵。也就是,对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵,以此来建立所述咨询语义特征与所述答案语义特征之间的关联性特征分布信息,并以此作为分类特征矩阵。
具体地,在本申请实施例中,所述关联编码模块160,进一步用于:以如下公式对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵;其中,所述公式为:,其中表示所述咨询语义特征向量量,表示所述备选答案语义特征向量,表示所述关联特征矩阵,表示矩阵相乘。
在上述旅游景点问答系统100中,所述交互强化模块170,用于对所述关联特征矩阵进行基于可区分性物理激励的交互强化以得到校正后关联特征矩阵。在本申请的技术方案中,对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码得到所述关联特征矩阵时,是将所述咨询语义特征向量和所述备选答案语义特征向量各个位置之间的特征值相乘以得到所述关联特征矩阵的每个位置的特征值。但是,由于所述咨询文本得到的所述咨询语义特征向量和所述备选答案得到的所述备选答案语义特征向量在沿向量的不同位置下具有不同的关联性,例如所述咨询语义特征向量的前段和所述备选答案语义特征向量的前段之间的关联性高,而所述咨询语义特征向量的前段和所述备选答案语义特征向量的后段之间的关联性高,这就导致所述关联特征矩阵中的某些位置的特征值相对于其它位置的特征值会具有更显著的重要性,因此,如果可以在分类任务中对于所述关联特征矩阵的特征值进行有效区分,显然可以提高分类结果的准确性。
具体地,在本申请实施例中,所述交互强化模块,进一步用于:以如下公式对所述关联特征矩阵进行基于可区分性物理激励的交互强化以得到所述校正后关联特征矩阵;
其中,所述公式为:
其中是所述关联特征矩阵,是所述校正后关联特征矩阵,和是预定超参数,和表示特征矩阵的按位置加法和减法,除法表示特征矩阵的每个位置除以相应值,且表示通过单个卷积层的卷积操作。
这里,所述基于可区分性物理激励的交互强化用于在通过梯度下降的反向传播过程当中提升特征空间与分类问题的解空间之间的交互,其以类似物理激励的方式来提取和模仿可行特征(actionable feature),由此,使用通用目的的低维可导式物理激励方式,来获得具有梯度可区分性的可行特征的物理性表达,从而在训练过程中强化所述关联特征矩阵内的活跃部分,以提升强化后的关联特征矩阵在分类任务下的分类结果的准确性。这样,能够对于旅游景点的客户的咨询信号提供精准地语音答案回复,以在及时准确地得到咨询答案的同时节省人们大量的时间。
在上述旅游景点问答系统100中,所述分类模块180,用于将所述校正后关联特征矩阵通过分类器以得到分类结果,所述分类结果用于表示备选答案是否与游客咨询相适配。也就是,以所述分类器对所述校正后关联特征矩阵进行类边界划分和确定,以得到所述分类结果。
具体地,在本申请实施例中,所述分类模块,包括:展开单元,用于将所述校正后关联特征矩阵按照行向量或者列向量展开为分类特征向量;全连接编码单元,用于使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,分类结果生成单元,用于将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。
在上述旅游景点问答系统100中,所述反馈模块190,用于响应于所述分类结果为备选答案与游客咨询相适配,返回与所述备选答案的文本描述对应的语音信号。这样,能够对于旅游景点的客户的咨询信号提供精准地语音答案回复,以在及时准确地得到咨询答案的同时节省人们大量的时间。
综上,基于本申请实施例的旅游景点问答系统100被阐明,其将旅游景点的智能问答理解为特征匹配问题,具体地,采用基于深度学习的人工智能语义理解技术,以在将客户的咨询语音信号转换为咨询文本后,提取出所述咨询文本中基于全局的上下文语义特征信息以及备选答案的文本描述中基于全局的上下文语义特征信息,以此来建立两者的关联性特征分布,再利用分类器进行所述备选答案与所述游客自行是否相适配的分类处理,进而在两者相适配时返回所述备选答案的文本描述所对应的语音信号。这样,能够对于旅游景点的客户的咨询信号提供精准地语音答案回复。
如上所述,根据本申请实施例的旅游景点问答系统100可以实现在各种终端设备中,例如用于旅游景点问答的服务器等。在一个示例中,根据本申请实施例的旅游景点问答系统100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该旅游景点问答系统100可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该旅游景点问答系统100同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该旅游景点问答系统100与该终端设备也可以是分立的设备,并且该旅游景点问答系统100可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性方法:图4为根据本申请实施例的旅游景点问答方法的流程图。如图4所示,根据本申请实施例的旅游景点问答方法,包括:S110,获取由客户提供的旅游景点咨询语音信号;S120,对所述旅游景点咨询语音信号进行语音识别以得到咨询文本;S130,对所述咨询文本进行分词处理后通过基于转换器的上下文编码器以得到咨询语义特征向量;S140,获取备选答案的文本描述;S150,对所述备选答案的文本描述进行分词处理后通过基于转换器的上下文编码器以得到备选答案语义特征向量;S160,对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵;S170,对所述关联特征矩阵进行基于可区分性物理激励的交互强化以得到校正后关联特征矩阵;S180,将所述校正后关联特征矩阵通过分类器以得到分类结果,所述分类结果用于表示备选答案是否与游客咨询相适配;以及,S190,响应于所述分类结果为备选答案与游客咨询相适配,返回与所述备选答案的文本描述对应的语音信号。
在一个示例中,在上述旅游景点问答方法中,所述对所述咨询文本进行分词处理后通过基于转换器的上下文编码器以得到咨询语义特征向量,包括:对所述咨询文本进行分词处理以获得多个咨询词;将所述多个咨询词通过嵌入层以将所述多个咨询词中各个咨询词转化为咨询词嵌入向量以得到咨询词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个咨询词进行嵌入编码;将所述咨询词嵌入向量的序列输入所述基于转换器的上下文编码器以得到所述多个咨询特征向量;以及,将所述多个咨询特征向量进行级联以得到所述咨询语义特征向量。
在一个示例中,在上述旅游景点问答方法中,所述将所述咨询词嵌入向量的序列输入所述基于转换器的上下文编码器以得到所述多个咨询特征向量,包括:将所述咨询词嵌入向量的序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述咨询词嵌入向量的序列中各个咨询词嵌入向量作为值向量分别进行相乘以得到所述多个咨询特征向量。
在一个示例中,在上述旅游景点问答方法中,所述对所述备选答案的文本描述进行分词处理后通过基于转换器的上下文编码器以得到备选答案语义特征向量,包括:对所述备选答案的文本描述进行分词处理以获得多个备选答案词;将所述多个备选答案词通过嵌入层以将所述多个备选答案词中各个备选答案词转化为备选答案词嵌入向量以得到备选答案词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个备选答案词进行嵌入编码;将所述备选答案词嵌入向量的序列输入所述基于转换器的上下文编码器以得到所述多个备选答案特征向量;以及,将所述多个备选答案特征向量进行级联以得到所述备选答案语义特征向量。
在一个示例中,在上述旅游景点问答方法中,所述对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵,包括:以如下公式对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵;其中,所述公式为:,其中表示所述咨询语义特征向量量,表示所述备选答案语义特征向量,表示所述关联特征矩阵,表示矩阵相乘。
在一个示例中,在上述旅游景点问答方法中,所述对所述关联特征矩阵进行基于可区分性物理激励的交互强化以得到校正后关联特征矩阵,包括:以如下公式对所述关联特征矩阵进行基于可区分性物理激励的交互强化以得到所述校正后关联特征矩阵;
其中,所述公式为:
其中是所述关联特征矩阵,是所述校正后关联特征矩阵,和是预定超参数,和表示特征矩阵的按位置加法和减法,除法表示特征矩阵的每个位置除以相应值,且表示通过单个卷积层的卷积操作。
在一个示例中,在上述旅游景点问答方法中,所述将所述校正后关联特征矩阵通过分类器以得到分类结果,所述分类结果用于表示备选答案是否与游客咨询相适配,包括:将所述校正后关联特征矩阵按照行向量或者列向量展开为分类特征向量;使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。
综上,本申请实施例的旅游景点问答方法被阐明,其将旅游景点的智能问答理解为特征匹配问题,具体地,采用基于深度学习的人工智能语义理解技术,以在将客户的咨询语音信号转换为咨询文本后,提取出所述咨询文本中基于全局的上下文语义特征信息以及备选答案的文本描述中基于全局的上下文语义特征信息,以此来建立两者的关联性特征分布,再利用分类器进行所述备选答案与所述游客自行是否相适配的分类处理,进而在两者相适配时返回所述备选答案的文本描述所对应的语音信号。这样,能够对于旅游景点的客户的咨询信号提供精准地语音答案回复。
示例性电子设备:下面,参考图5来描述根据本申请实施例的电子设备。图5为根据本申请实施例的电子设备的框图。如图5所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的旅游景点问答方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如旅游景点咨询语音信号等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括语音信号等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图5中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质:除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的旅游景点问答方法中的功能中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的旅游景点问答方法中的功能中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (7)
1.一种旅游景点问答系统,其特征在于,包括:咨询语音接收模块,用于获取由客户提供的旅游景点咨询语音信号;语音识别模块,用于对所述旅游景点咨询语音信号进行语音识别以得到咨询文本;咨询文本上下文理解模块,用于对所述咨询文本进行分词处理后通过基于转换器的上下文编码器以得到咨询语义特征向量;备选答案获取模块,用于获取备选答案的文本描述;备选答案上下文编码模块,用于对所述备选答案的文本描述进行分词处理后通过基于转换器的上下文编码器以得到备选答案语义特征向量;关联编码模块,用于对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵;交互强化模块,用于对所述关联特征矩阵进行基于可区分性物理激励的交互强化以得到校正后关联特征矩阵;分类模块,用于将所述校正后关联特征矩阵通过分类器以得到分类结果,所述分类结果用于表示备选答案是否与游客咨询相适配;以及反馈模块,用于响应于所述分类结果为备选答案与游客咨询相适配,返回与所述备选答案的文本描述对应的语音信号。
2.根据权利要求1所述的旅游景点问答系统,其特征在于,所述咨询文本上下文理解模块,包括:第一分词单元,用于对所述咨询文本进行分词处理以获得多个咨询词;第一词嵌入单元,用于将所述多个咨询词通过嵌入层以将所述多个咨询词中各个咨询词转化为咨询词嵌入向量以得到咨询词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个咨询词进行嵌入编码;第一上下文语义编码单元,用于将所述咨询词嵌入向量的序列输入所述基于转换器的上下文编码器以得到所述多个咨询特征向量;以及第一级联单元,用于将所述多个咨询特征向量进行级联以得到所述咨询语义特征向量。
3.根据权利要求2所述的旅游景点问答系统,其特征在于,所述第一上下文语义编码单元,进一步用于:将所述咨询词嵌入向量的序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及将所述自注意力特征矩阵与以所述咨询词嵌入向量的序列中各个咨询词嵌入向量作为值向量分别进行相乘以得到所述多个咨询特征向量。
4.根据权利要求3所述的旅游景点问答系统,其特征在于,所述备选答案上下文编码模块,包括:第二分词单元,用于对所述备选答案的文本描述进行分词处理以获得多个备选答案词;第二词嵌入单元,用于将所述多个备选答案词通过嵌入层以将所述多个备选答案词中各个备选答案词转化为备选答案词嵌入向量以得到备选答案词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个备选答案词进行嵌入编码;第二上下文语义编码单元,用于将所述备选答案词嵌入向量的序列输入所述基于转换器的上下文编码器以得到所述多个备选答案特征向量;以及第二级联单元,用于将所述多个备选答案特征向量进行级联以得到所述备选答案语义特征向量。
5.根据权利要求4所述的旅游景点问答系统,其特征在于,所述关联编码模块,进一步用于:以如下公式对所述咨询语义特征向量和所述备选答案语义特征向量进行关联编码以得到关联特征矩阵;其中,所述公式为:,其中表示所述咨询语义特征向量量,表示所述备选答案语义特征向量,表示所述关联特征矩阵,表示矩阵相乘。
6.根据权利要求5所述的旅游景点问答系统,其特征在于,所述交互强化模块,进一步用于:以如下公式对所述关联特征矩阵进行基于可区分性物理激励的交互强化以得到所述校正后关联特征矩阵;其中,所述公式为:
其中是所述关联特征矩阵,是所述校正后关联特征矩阵,和是预定超参数,和表示特征矩阵的按位置加法和减法,除法表示特征矩阵的每个位置除以相应值,且表示通过单个卷积层的卷积操作。
7.根据权利要求6所述的旅游景点问答系统,其特征在于,所述分类模块,包括:展开单元,用于将所述校正后关联特征矩阵按照行向量或者列向量展开为分类特征向量;全连接编码单元,用于使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及分类结果生成单元,用于将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310178519.8A CN116069916A (zh) | 2023-02-28 | 2023-02-28 | 旅游景点问答系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310178519.8A CN116069916A (zh) | 2023-02-28 | 2023-02-28 | 旅游景点问答系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116069916A true CN116069916A (zh) | 2023-05-05 |
Family
ID=86176746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310178519.8A Withdrawn CN116069916A (zh) | 2023-02-28 | 2023-02-28 | 旅游景点问答系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116069916A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116309446A (zh) * | 2023-03-14 | 2023-06-23 | 浙江固驰电子有限公司 | 用于工业控制领域的功率模块制造方法及系统 |
-
2023
- 2023-02-28 CN CN202310178519.8A patent/CN116069916A/zh not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116309446A (zh) * | 2023-03-14 | 2023-06-23 | 浙江固驰电子有限公司 | 用于工业控制领域的功率模块制造方法及系统 |
CN116309446B (zh) * | 2023-03-14 | 2024-05-07 | 浙江固驰电子有限公司 | 用于工业控制领域的功率模块制造方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110807332B (zh) | 语义理解模型的训练方法、语义处理方法、装置及存储介质 | |
CN110795945B (zh) | 一种语义理解模型训练方法、语义理解方法、装置及存储介质 | |
KR102316063B1 (ko) | 오디오 중의 키 프레이즈를 인식하기 위한 방법과 장치, 기기 및 매체 | |
CN110795552B (zh) | 一种训练样本生成方法、装置、电子设备及存储介质 | |
CN111931517B (zh) | 文本翻译方法、装置、电子设备以及存储介质 | |
CN110807333B (zh) | 一种语义理解模型的语义处理方法、装置及存储介质 | |
CN111401084A (zh) | 一种机器翻译的方法、设备以及计算机可读存储介质 | |
CN114676234A (zh) | 一种模型训练方法及相关设备 | |
CN113705315B (zh) | 视频处理方法、装置、设备及存储介质 | |
CN112699686A (zh) | 基于任务型对话系统的语义理解方法、装置、设备及介质 | |
CN114757176A (zh) | 一种获取目标意图识别模型的方法以及意图识别方法 | |
CN111739520B (zh) | 一种语音识别模型训练方法、语音识别方法、装置 | |
CN111538809A (zh) | 一种语音服务质量检测方法、模型训练方法及装置 | |
CN113761883A (zh) | 一种文本信息识别方法、装置、电子设备及存储介质 | |
CN116069916A (zh) | 旅游景点问答系统 | |
CN115129862A (zh) | 语句实体处理方法、装置、计算机设备及存储介质 | |
CN112633007B (zh) | 一种语义理解模型构建方法及装置、语义理解方法及装置 | |
CN113609873A (zh) | 翻译模型训练方法、装置及介质 | |
CN116629211B (zh) | 基于人工智能的写作方法及系统 | |
CN112257432A (zh) | 一种自适应意图识别方法、装置及电子设备 | |
CN116432705A (zh) | 文本生成模型构建、文本生成方法和装置、设备及介质 | |
CN116483314A (zh) | 一种自动化智能活动图生成方法 | |
CN112818688B (zh) | 文本处理方法、装置、设备及存储介质 | |
CN114510561A (zh) | 答案选择方法、装置、设备及存储介质 | |
CN114297353A (zh) | 数据处理方法、装置、存储介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20230505 |
|
WW01 | Invention patent application withdrawn after publication |