CN115391533A - 一种基于高速公路路况的意图识别和播报方法 - Google Patents
一种基于高速公路路况的意图识别和播报方法 Download PDFInfo
- Publication number
- CN115391533A CN115391533A CN202211025855.0A CN202211025855A CN115391533A CN 115391533 A CN115391533 A CN 115391533A CN 202211025855 A CN202211025855 A CN 202211025855A CN 115391533 A CN115391533 A CN 115391533A
- Authority
- CN
- China
- Prior art keywords
- intention
- user
- consultation
- key
- classification model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000013145 classification model Methods 0.000 claims abstract description 30
- 238000005516 engineering process Methods 0.000 claims abstract description 6
- 238000004364 calculation method Methods 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 230000017105 transposition Effects 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 4
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Library & Information Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于高速公路路况的意图识别和播报方法,包括以下步骤:收集高速公路坐席系统呼入的电话,并按咨询业务进行分类;按key‑intention形式分类标识来电用户意图,生成意图分类模型;收集咨询路况的录音文件,并对路况信息以及不同类型结构物的咨询信息进行分类,两类数据标记为structure‑type;提取各路段监控上报事件中的关键数据,然后按照structure‑type格式进行存储;据来电用户语句判别用户意图,然后从路况信息中选出与来电用户意图匹配的structure‑type,之后利用TTS技术将匹配的信息转化为智能语音,播报给用户。本发明一种基于高速公路路况的意图识别和播报方法,可充分考虑来电用户的咨询意图,让用户在第一时间获取路况信息,使用更加方便。
Description
技术领域
本发明属于汽车驾驶辅助技术领域,具体涉及一种基于高速公路路况的意图识别和播报方法。
背景技术
在高速公路日常运行过程中,高速公路突发事件信息通常只用于高速公路管理部门内部管理使用,无法实时便捷地为高速公路出行公众提供服务。公众往往都是处于先出行后知晓的情况,无法第一时间获取高速公路路况以便规划行程。为了提升高速公路的日常通行率以及公众满意率,本发明特结合NLP及TTS技术提出了一种高速公路路况的意图识别和播报方法。
NLP(Neuro-Linguistic Programming)是指神经语言程序学(身心语法程式学),即我们思维上及行为上的习惯,就如同电脑中的程序,可以透过更新软件而改变。
TTS是语音合成应用的一种,它将储存与电脑中的文件,如帮助文件或者网页,转换成自然语音输出。TTS可以帮助有视觉障碍的人阅读计算机上的信息,或者只是简单的用来增加文本文档的可读性。现在的TTS应用包包括语音驱动的邮件以及声音敏感系统,TTS经常与声音识别程序一起使用。
发明内容
有鉴于此,本发明的目的在于提供一种基于高速公路路况的意图识别和播报方法。本发明旨在解决公众驾驶出行无法第一时间获取高速公路路况,行程规划不便的问题。
为达到上述目的,本发明提供了一种基于高速公路路况的意图识别和播报方法,包括以下步骤:
S1.收集过去一段时间内高速公路坐席系统的呼入电话,并结合坐席情况将高速公路业务咨询划分为事故报警、事故求助、路况咨询以及ETC咨询;
S2.按照key-intention的形式对咨询业务的意图进行分类标识,生成基于bert模型的意图分类模型,所述key为咨询的业务类型,所述intention为与咨询业务对应的意图识别;
S3.收集过去一段时间内高速公路咨询电话中关于路况咨询的录音文件,将录音文件中咨询的路况信息分类为主线、服务区、收费站和隧道,将不同类型结构物的咨询信息分为拥堵、事故和慢行,并将两类数据标记为structure-type,所述structure为结构物类型标识,所述type为咨询的信息分类;
S4.提取各路段监控中心上报的事件中的关键数据,然后按照structure-type格式,以事件发生的顺序进行存储、记录;
S5.根据来电用户的语句,判别来电用户的意图,然后从高速公路上报的信息中选取与来电用户意图匹配的structure-type,之后利用TTS技术将匹配的信息转化为智能语音,播报给用户。
进一步,所述步骤S1和步骤S3中的一段时间为6个月。
进一步,所述步骤S3中,事件中的关键数据包括事件发生的位置以及事件类型。
进一步,所述步骤S5中,来电用户意图的判别有以下两种情况:
a.用户意图在步骤S2的意图分类模型范围内:通过意图分类模型判别用户意图;
b.用户意图在步骤S2的意图分类模型范围之外:将用户的语句转化为句向量,然后将用户的句向量和意图分类模型计算完成的语料的句向量做点乘,得到计算后的意图;
若计算后的意图与意图分类模型中的内容相似,且相似度大于一定阈值,则能通过意图分类模型判别用户意图;
若计算后的意图为新意图,在意图分类模型范围之外,则直接输出用户意图转人工服务。
进一步,所述步骤S2中的意图分类模型是通过Attention模型建立的,所述Attention的计算步骤如下:
第一步:将query和每个key进行相似度计算得到权重,所述query代表来电用户的查询,权重的计算表达式如下:
式中,Q代表query;Ki代表第i个key;T表示矩阵的转置,是矩阵的一种运算法则;Wa、va、Ua都是可学习参数;
第二步:使用softmax函数对第一步计算出的权重进行归一化处理,计算表达式如下;
第三部:将权重和相应的键值value加权求和得到attention,所述key=value,所述attention的计算表达式如下:
Attention(Q,K,V)=∑iaiVi
式中,Q代表query;K代表key;Vi为输入的关键值;ai代表第二步计算出来的权重。
进一步,所述来电用户意图的判别同样采用Attention模型,判断过程如下:识别用户语音key值,然后通过Attention模型进行计算、判别。
本发明的有益效果在于:
1.本发明提供了一种基于高速公路路况的意图识别和播报方法,结合NLP和TTS技术,建立了预制的意图分类模型和structure-type数据结构,充分考虑了来电用户咨询信息范围,提前预判,在接到咨询后,可第一时间进行反馈;来电用户的语句输入以及智能语音的输出过程中,均是提取关键的structure-type数据进行匹配,反馈给用户的信息更快、更准确。
2.本发明提供了一种基于高速公路路况的意图识别和播报方法,本发明采用Attention模型对收集的信息进行关注并充分学习吸收,Attention模型与传统的Seq2Seq模型相比,输出的结果更准确,更不易丢失文本信息。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究,对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
图1本发明一种基于高速公路路况的意图识别和播报方法的流程图;
图2是本发明attention函数计算的流程图。
具体实施方式
为使本发明的技术方案、优点和目的更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本申请的保护范围。
本发明提供了一种基于高速公路路况的意图识别和播报方法,包括以下步骤:
S1.收集过去6个月内高速公路坐席系统的呼入电话,并结合现有坐席实际情况将高速公路业务咨询详细划分为事故报警、事故求助、路况咨询以及ETC咨询。
S2.按照key-intention的形式对每种咨询业务的意图进行分类标识,生成基于bert模型的意图分类模型,其中key代表咨询的业务类型,intention代表与咨询业务对应的意图识别。
BERT是一种语言表示模型,BERT代表来自Transformer的双向编码器表示(Bidirectional Encoder Representations from Transformers)。BERT旨在通过联合调节所有层中的左右上下文来预训练深度双向表示。因此,只需要一个额外的输出层,就可以对预训练的BERT表示进行微调,从而为广泛的任务(比如回答问题和语言推断任务)创建最先进的模型,而无需对特定于任务进行大量模型结构的修改。
S3.收集过去6个月内高速公路日常咨询电话中关于路况咨询的录音文件,将录音文件中咨询的路况信息分类为主线、服务区、收费站和隧道,将不同类型结构物的咨询信息分为拥堵、事故和慢行,并将两类数据标记为structure-type,其中structure代表结构物类型标识,type代表咨询的信息分类。
S4.提取各路段监控中心上报的事件信息中的关键数据,关键信息包含事件发生的位置以及事件类型,然后按照structure-type格式,将事件按照发生的先后顺序进行存储、记录;
S5.根据来电用户的语句,判别来电用户的意图,之后提取进入流程控制模块的语句的structure-type,然后从高速公路上报的信息中选取与来电用户意图匹配的structure-type,之后利用TTS技术将匹配的信息转化为智能语音,播报给用户。
作为本实施例的一种优选,步骤S5中,来电用户意图的判别有以下两种情况:
a.来电用户意图在步骤S2的意图分类模型范围内时:通过意图分类模型判别用户意图;
b.来电用户意图在步骤S2的意图分类模型范围之外时:利用bert模型将用户的语句转化为句向量,然后将用户的句向量和意图分类模型计算完成的语料的句向量做点乘,得到计算后的最有可能的意图;
若计算后的意图与意图分类模型中的内容相似,且相似度大于一定阈值,则能通过意图分类模型判别用户意图;
若计算后的意图为新意图,在意图分类模型范围之外,则直接输出用户意图转人工服务。
作为本实施例的一种优选,步骤S2中的意图分类模型是通过Attention模型建立的,通过attention机制让模型对重要信息重点关注并充分学习吸收,Attention的计算步骤如下:
第一步:将query和每个key进行相似度计算得到权重,query代表来电用户的查询,计算相似度的函数有点积、拼接、感知机等,权重的计算表达式如下:
式中,Q代表query;Ki代表第i个key;T表示矩阵的转置,是矩阵的一种运算法则;Wa、va、Ua都是可学习参数。
第二步:使用softmax函数对第一步计算出的权重进行归一化处理,计算表达式如下;
第三部:将权重和相应的键值value加权求和得到attention,key=value,attention的计算表达式如下:
Attention(Q,K,V)=∑iaiVi
式中,Q代表query;K代表key;Vi为输入的关键值;ai代表第二步计算出来的权重。
作为本实施例的一种优选,来电用户意图的判别同样采用Attention模型,判断过程如下:识别实时呼入的用户语音key值,然后通过Attention模型进行计算,匹配出最接近的意图分类,如果是之前已经预置在意图分类模型里面的分类,则执行后续流程;如果是新的语句向量,则直接输出意图转为人工服务。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的保护范围当中。
Claims (6)
1.一种基于高速公路路况的意图识别和播报方法,包括以下步骤:
S1.收集过去一段时间内高速公路坐席系统的呼入电话,并结合坐席情况将高速公路业务咨询划分为事故报警、事故求助、路况咨询以及ETC咨询;
S2.按照key-intention的形式对咨询业务的意图进行分类标识,生成基于bert模型的意图分类模型,所述key为咨询的业务类型,所述intention为与咨询业务对应的意图识别;
S3.收集过去一段时间内高速公路咨询电话中关于路况咨询的录音文件,将录音文件中咨询的路况信息分类为主线、服务区、收费站和隧道,将不同类型结构物的咨询信息分为拥堵、事故和慢行,并将两类数据标记为structure-type,所述structure为结构物类型标识,所述type为咨询的信息分类;
S4.提取各路段监控中心上报的事件中的关键数据,然后按照structure-type格式,以事件发生的顺序进行存储、记录;
S5.根据来电用户的语句,判别来电用户的意图,然后从高速公路上报的信息中选取与来电用户意图匹配的structure-type,之后利用TTS技术将匹配的信息转化为智能语音,播报给用户。
2.根据权利要求1所述的一种基于高速公路路况的意图识别和播报方法,其特征在于:所述步骤S1和步骤S3中的一段时间为6个月。
3.根据权利要求1所述的一种基于高速公路路况的意图识别和播报方法,其特征在于:所述步骤S3中,事件中的关键数据包括事件发生的位置以及事件类型。
4.根据权利要求1所述的一种基于高速公路路况的意图识别和播报方法,其特征在于,所述步骤S5中,来电用户意图的判别有以下两种情况:
a.用户意图在步骤S2的意图分类模型范围内:通过意图分类模型判别用户意图;
b.用户意图在步骤S2的意图分类模型范围之外:将用户的语句转化为句向量,然后将用户的句向量和意图分类模型计算完成的语料的句向量做点乘,得到计算后的意图;
若计算后的意图与意图分类模型中的内容相似,且相似度大于一定阈值,则能通过意图分类模型判别用户意图;
若计算后的意图为新意图,在意图分类模型范围之外,则直接输出用户意图转人工服务。
5.根据权利要求1所述的一种基于高速公路路况的意图识别和播报方法,其特征在于,所述步骤S2中的意图分类模型是通过Attention模型建立的,所述Attention的计算步骤如下:
第一步:将query和每个key进行相似度计算得到权重,所述query代表来电用户的查询,权重的计算表达式如下:
式中,Q代表query;Ki代表第i个key;T表示矩阵的转置,是矩阵的一种运算法则;Wa、va、Ua都是可学习参数;
第二步:使用softmax函数对第一步计算出的权重进行归一化处理,计算表达式如下;
第三部:将权重和相应的键值value加权求和得到attention,所述key=value,所述attention的计算表达式如下:
Attention(Q,K,V)=∑iaiVi
式中,Q代表query;K代表key;Vi为输入的关键值;ai代表第二步计算出来的权重。
6.据权利要求4或5所述的一种基于高速公路路况的意图识别和播报方法,其特征在于,所述来电用户意图的判别同样采用Attention模型,判断过程如下:
识别用户语音key值,然后通过Attention模型进行计算、判别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211025855.0A CN115391533A (zh) | 2022-08-25 | 2022-08-25 | 一种基于高速公路路况的意图识别和播报方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211025855.0A CN115391533A (zh) | 2022-08-25 | 2022-08-25 | 一种基于高速公路路况的意图识别和播报方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115391533A true CN115391533A (zh) | 2022-11-25 |
Family
ID=84123362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211025855.0A Pending CN115391533A (zh) | 2022-08-25 | 2022-08-25 | 一种基于高速公路路况的意图识别和播报方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115391533A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117149983A (zh) * | 2023-10-30 | 2023-12-01 | 山东高速信息集团有限公司 | 基于高速公路业务智能对话的方法、装置及设备 |
-
2022
- 2022-08-25 CN CN202211025855.0A patent/CN115391533A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117149983A (zh) * | 2023-10-30 | 2023-12-01 | 山东高速信息集团有限公司 | 基于高速公路业务智能对话的方法、装置及设备 |
CN117149983B (zh) * | 2023-10-30 | 2024-02-27 | 山东高速信息集团有限公司 | 基于高速公路业务智能对话的方法、装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109801491B (zh) | 基于风险评估的智能导航方法、装置、设备及存储介质 | |
WO2022057712A1 (zh) | 电子设备及其语义解析方法、介质和人机对话系统 | |
CN107729309B (zh) | 一种基于深度学习的中文语义分析的方法及装置 | |
US11423280B2 (en) | Cognitive commuter assistant | |
US10146769B2 (en) | Determining safety risk using natural language processing | |
CN111914539B (zh) | 一种基于BiLSTM-CRF模型的航道通告信息提取方法及系统 | |
CN115391533A (zh) | 一种基于高速公路路况的意图识别和播报方法 | |
CN112084336A (zh) | 一种高速公路突发事件的实体提取和事件分类方法及装置 | |
Noor et al. | Predict Arrival Time by Using Machine Learning Algorithm to Promote Utilization of Urban Smart Bus | |
CN116450799B (zh) | 一种应用于交通管理服务的智能对话方法及设备 | |
Shenoi et al. | An efficient state detection of a person by fusion of acoustic and alcoholic features using various classification algorithms | |
CN114373443A (zh) | 语音合成方法和装置、计算设备、存储介质及程序产品 | |
Chuanxia et al. | Machine learning and IoTs for forecasting prediction of smart road traffic flow | |
CN106782496A (zh) | 一种基于语音和群智感知的人群数量监测方法 | |
CN113158062A (zh) | 一种基于异构图神经网络的用户意图识别方法及装置 | |
Yang et al. | Traffic event detection as a slot filling problem | |
CN210516214U (zh) | 一种基于视频及语音交互服务设备 | |
CN117272128A (zh) | 一种网约车平台的司乘纠纷判别方法 | |
CN116186288A (zh) | 一种基于地点和语义的知识图谱反馈方法 | |
KR102306932B1 (ko) | 민원 데이터를 이용한 위기 대응 방법 및 그 시스템 | |
CN115952362A (zh) | 一种用于社交媒体的自演化假消息检测方法 | |
Trujillo et al. | Design of emergency call record support system applying natural language processing techniques | |
Malta et al. | Multi-modal real-world driving data collection, transcription, and integration using Bayesian network | |
CN115620407A (zh) | 一种信息交流方法、装置及车辆 | |
US11941508B2 (en) | Dialog system with adaptive recurrent hopping and dual context encoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |