CN106504746A - 一种从语音数据中提取结构化交通路况信息的方法 - Google Patents

一种从语音数据中提取结构化交通路况信息的方法 Download PDF

Info

Publication number
CN106504746A
CN106504746A CN201610960201.5A CN201610960201A CN106504746A CN 106504746 A CN106504746 A CN 106504746A CN 201610960201 A CN201610960201 A CN 201610960201A CN 106504746 A CN106504746 A CN 106504746A
Authority
CN
China
Prior art keywords
information
traffic information
speech data
structuring
road
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610960201.5A
Other languages
English (en)
Other versions
CN106504746B (zh
Inventor
梁永杰
蒋晟
张志勇
黄艳明
杨喆
李全忠
何国涛
蒲瑶
张玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Original Assignee
Universal Information Technology (beijing) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universal Information Technology (beijing) Co Ltd filed Critical Universal Information Technology (beijing) Co Ltd
Priority to CN201610960201.5A priority Critical patent/CN106504746B/zh
Publication of CN106504746A publication Critical patent/CN106504746A/zh
Application granted granted Critical
Publication of CN106504746B publication Critical patent/CN106504746B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Traffic Control Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种从语音数据中提取结构化交通路况信息的方法,由以下步骤组成:获取包含所需路况信息的语音,并进行语音预处理;将预处理后的语音数据转写为文本,获得语音识别文本;对语音识别文本进行分词,并将分词结果进行词性标注;对分词后的文本进行筛选,将无用信息内容过滤掉;进行关键信息抽取;进行路段信息的聚合;进行路况信息聚合;进行路况信息后处理。本发明基于语音识别技术、自然语言处理技术,实现从语音数据提取结构化交通路况信息的方法,作为数据源补充现有的路况信息采集系统,可解决对于非交通流类路况信息的采集效果不佳的问题,更好地反映城市路面信息的效果。

Description

一种从语音数据中提取结构化交通路况信息的方法
技术领域
本发明涉及交通路况信息采集技术,尤其涉及一种从语音数据中提取结构化交通路况信息的方法。
背景技术
目前的道路交通信息采集技术,主要有浮动车交通信息采集、视频监控系统、基于微波、雷达等感应器的采集系统等。但是,上述采集方式主要采集目标为道路交通流信息,对于道路上的交通事故、路上障碍物、施工信息、交通管制等非交通流事件信息无法进行良好采集。而语音数据,如交通广播有覆盖面广(全国各主要城市均有交通广播)、时效性强、非交通流事件播报频率高等特点,合理应用能够对已有的交通路况信息采集系统进行良好补充。
目前的语音识别技术对中文标点符号的标注主要是通过设置门限值,判断静音时长来进行断句,通过对语气词进行分类来添加相关标点符号。但是,在广播中,主持人语速较快,标注效果较差,经常错误地将不同路况信息合并或同一路况信息分割;此外,断好的一句话中仍有多条路况信息混杂在一起,给信息提取带来很大不便。而一段语音经常包含数条路况信息,即若干地点描述词、事件词、方向词等信息点,容易混淆,故在提取关键信息后需要加入信息聚合才能获取最终的路况信息。
因此,针对以上方面,需要对现有技术进行有效创新。
发明内容
针对以上缺陷,本发明提供基于语音识别技术、自然语言处理技术,实现一种从语音数据(交通广播)提取结构化交通路况信息,作为数据源补充现有路况信息的采集系统,解决其对于非交通流类路况信息的采集效果不佳的问题,起到更好的反映城市路面信息的效果。
为实现上述目的,本发明采用以下技术方案:
一种从语音数据中提取结构化交通路况信息的方法,包括:
1)获取包含所需路况信息的语音,并进行语音预处理,该语音预处理包括转码、拼接;
2)将步骤1)预处理后的语音数据转写为文本,获得语音识别文本;
3)对步骤2)所获得的语音识别文本进行语义理解,输出路况信息,其中所述语义理解包括:
(i)对步骤2)所获得的语音识别文本进行分词,并将分词结果进行词性标注;
(ii)对分词后的文本进行筛选,将无用信息内容过滤掉;
(iii)进行关键信息抽取,基于上述分词,根据词语的词性抽取出关键信息,包括事件信息点和路段信息点;
(iv)进行路段信息的聚合,采用统计机器学习的方法,将从步骤(iii)中抽取的描述同一地点的各种信息聚合,由此得到若干路段信息;
(v)进行路况信息聚合,基于上述获得的路段信息、事件信息,采用统计机器学习的方法,将描述同一路况的地点、事件信息组合为一条完整的路况信息,由此获取若干条完整的路况信息。
其中,为了使得路况信息能更好地与路网融合,还包括将步骤(3)所输出的路况信息中的简称、俗称和标准的道路名相对应,以增加提取出的有效路况信息数量。
此外,还包括对步骤(1)预处理后的语音数据进行可以和路网融合的路况信息定义,定义项目包含发布时间、开始时间、解除时间、预计解除时间、道路名、方向、附属定位词、路段起点、路段终点、事件类型、事件描述、语音识别结果。
此外,还包括预先构建专业词库,包括道路名/POI词库、道路方向词库、事件词库、道路节点表,步骤(i)中所述的分词基于所述专业词库来进行。
此外,所述无用信息内容包括音乐、广告、闲聊。
此外,所述过滤通过决策树、K近邻、朴素贝叶斯、支持向量机或人工神经网络方法实施。
此外,所述路段信息点包括道路名/POI、方向、主辅路、路段起终点,所述事件信息点包括时间信息、交通限制类和特殊事件类信息。
此外,根据正则的方法抽取出所述时间信息。
此外,所述统计机器学习的方法基于支持向量机,将关系抽取问题抽象成分类问题,给出所有备选实体关系对,对其一一进行判断,采用相关概率值作为评分,以判断其关系。
此外,所述步骤(i)包括对非关键词进行基于统计的中文分词。
本发明所述的从语音数据中提取结构化交通路况信息的方法的有益效果为:该方法根据各个步骤且基于语音识别技术、自然语言处理技术,实现从语音数据提取结构化交通路况信息的方法,作为数据源补充现有的路况信息采集系统,可解决对于非交通流类路况信息的采集效果不佳的问题,更好地反映城市路面信息的效果。
附图说明
下面根据附图对本发明作进一步详细说明。
图1是本发明的一个实施方案的从语音数据中提取结构化交通路况信息的方法总体流程示意图;
图2是本发明的一个实施方案的从语音数据中提取结构化交通路况信息的方法的语义理解的示意图;
图3是本发明的一个实施方案的从语音数据中提取结构化交通路况信息的方法示例流程示意图。
具体实施方式
下面结合附图对本发明作进一步详细描述。
首先请参考图1,图1是本发明的一个实施方案的从语音数据中提取结构化交通路况信息的方法总体流程示意图,它概括地体现了本发明的主要实施步骤,包括:
步骤S110,获取包含所需路况信息的语音,并进行语音预处理,该语音预处理包括转码、拼接,相关技术已经很成熟,不再赘述。
步骤S120,将预处理后的语音数据转写为文本,获得语音识别文本,相关技术已经很成熟,不再赘述。
步骤S130,对经由步骤S120所获得的语音识别文本进行语义理解,输出路况信息。
步骤S140,路况信息后处理。由于广播中的道路名存在各种简称、俗称,为了路况信息能更好地与路网融合,故将简称、俗称和标准的道路名相对应,以增加提取出的有效路况信息数量。
除以上步骤外,还需要对步骤S120处理后的文本进行可以和路网融合的路况信息定义,定义项目包含发布时间、开始时间、解除时间、预计解除时间、道路名、方向、附属定位词、路段起点、路段终点、事件类型、事件描述、语音识别结果。
接下来请参考图2,图2是本发明的一个实施方案的从语音数据中提取结构化交通路况信息的方法的语义理解的示意图,根据图2,上述步骤S130进一步包含:
步骤S210,对经由步骤S120所获得的语音识别文本进行分词,并将分词结果进行词性标注,并对非关键词进行基于统计的中文分词。
由于我们要提取的信息点大多数是道路名\POI、方向词、主辅路、事件词等命名实体。目前中文分词的命名实体识别准确率可能存在不足,故可以预先构建上述实体的专业词库。
该专业词库包括道路名/POI词库、道路方向词库、事件词库、道路节点表,步骤(S210)中所述的分词可以基于该专业词库来进行的。
词性就是实体类型,目的是为了方便后续信息的提取。
由于在信息聚合时某些词,特别是动词如发生、导致等在后面的关系提取中有重要的作用,故对非关键词进行基于统计的中文分词。
步骤S220,对分词后的文本进行筛选,将无用信息内容过滤掉。
由于在交通广播播报中主要含有音乐、广告、闲聊、路况信息等内容。若不进行过滤,一方面对音乐、广告、闲聊的处理会降低系统性能,此外考虑到语音识别对音乐、广告等噪音较严重的识别准确率较低,若其中有地点、事件词的组合则容易产生路况信息误报。因此,需要对无用信息进行过滤。
这是一个较简单的分类问题,目前业界已经有较成熟的分类工具。常见的有决策树、K近邻、朴素贝叶斯、支持向量机、人工神经网络等方法。上述方法各有特点,根据实际应用中的效果选用,可以达到较好的筛选效果。
步骤S230,进行关键信息抽取,其中基于步骤S210中的分词,根据词语的词性抽取出关键信息,包括事件信息点和路段信息点。
所述路段信息点包括道路名/POI、方向、主辅路、路段起终点等,所述事件信息点包括时间信息、交通限制类和特殊事件类信息等。
其中所述时间信息是根据正则的方法抽取出的。
步骤S240,进行路段信息的聚合,由于语音识别出的文本无断句,则步骤S230中提取出的若干那地点信息词可能是分别描述不同地点的道路名、路段起终点、方向等信息,需要将描述同一地点的各种信息聚合,即所谓命名实体的关系抽取。采用的方法可以是统计机器学习的方法。经聚合后,可以得到若干路段信息。
步骤S250,进行路况信息的聚合,经过以上步骤,我们可以获得完整的路段信息、事件信息。接下来需要将描述同一路况的路段、事件信息聚合(即路段-事件关联)为一条完整的路况。思路同步骤S240相似,采用的方法也可以是统计机器学习的方法,聚合完成后就获取若干条完整的路况信息。
在步骤S240、步骤S250中,涉及到命名实体关系抽取。由于在广播播报人员有不同电台的播音员、路况编辑、交警、热心观众等多种人员,口语化严重,导致采用规则的方法一方面难以表述大多数路况表达方法;另一方面汉语变化种类繁多,规则维护起来十分繁杂,特别规则库的维护工作十分繁杂,新的规则不能对旧的规则造成影响,一致性难以保证,若采用不同规则权值不同来进行匹配则难以有一个良好的评判依据。故可以采用统计机器学习的方法来进行。
本方法选用的方法可基于支持向量机(Support Vector Machine,SVM)。其基本关系为将关系抽取问题抽象成分类问题,即给出所有备选实体关系对,对其一一进行判断,采用相关概率值作为评分,以判断其关系。如路段聚合,对于已经获得的两条道路(或POI),如[北三环,蓟门桥],可以将其关系分类为为道路-路段起点,路段起点-路段终点及无关三种关系(多分类);如[北三环,拥堵],可以将其分类为北三环是否拥堵两种关系(二分类)。通过人工标注一定数量的训练集,设计有效的提取特征,采用svm进行训练,获得预测模型,并使用其预测两命名实体之间的关系,即通过svm进行路段信息聚合、路段-事件关联。
图3是本发明的一个实施方案的从语音数据中提取结构化交通路况信息的方法示例流程示意图。
以上是本发明实施例所述的从语音数据中提取结构化交通路况信息的方法,广播中,主持人语速较快,断句效果较差,经常错误地将不同路况信息合并或同一路况信息分割;此外,在断好的一句话中仍有多条路况信息混杂在一起,给信息提取带来很大不便,在提取出信息点(路段、事件)以后,需要将有关联关系的路段、事件关联起来得到最终路况信息。
在实际应用中的示例(地点/事件聚合),具体流程如下:
假设获得的语音转写文本为:北三环拥堵西三环畅通另外南三环东向西拥堵西向东畅通;
抽取信息点,包括路段信息和事件信息;
可见其中路段信息包括:北三环、西三环、南三环东向西、南三环西向东
事件包括:拥堵、畅通、拥堵2、畅通2;
将路段信息和事件两两组合,构造所有的信息点关联关系对:
对每对关系对进行特征构造,特征包括事件词和路段的先后顺序、距离、中间是否有事件词、中间是否有其他POI、中间是否有分隔词、中间是否有特殊含义的动词/介词、是否符合一定的句式等;
通过训练出的模型进行预测,得到最终结果,将有关联关系的关系对保留,无关的关系对抛弃。这样就聚合得到了最终的路况信息。
上述对实施例的描述是为了便于该技术领域的普通技术人员能够理解和应用本案技术,熟悉本领域技术的人员显然可轻易对这些实例做出各种修改,并把在此说明的一般原理应用到其它实施例中而不必经过创造性的劳动。因此,本案不限于以上实施例,本领域的技术人员根据本案的揭示,对于本案做出的改进和修改,例如,对于个别流程步骤所采用的方式、工具等方面的更换,若没有产生超出本案之外的有益效果,则都应该在本案的保护范围内。

Claims (10)

1.一种从语音数据中提取结构化交通路况信息的方法,包括:
1)获取包含所需路况信息的语音,并进行语音预处理,该语音预处理包括转码、拼接;
2)将步骤1)预处理后的语音数据转写为文本,获得语音识别文本;
3)对步骤2)所获得的语音识别文本进行语义理解,输出路况信息,其中所述语义理解包括:
(i)对步骤2)所获得的语音识别文本进行分词,并将分词结果进行词性标注;
(ii)对分词后的文本进行筛选,将无用信息内容过滤掉;
(iii)进行关键信息抽取,基于上述分词,根据词语的词性抽取出关键信息,包括事件信息点和路段信息点;
(iv)进行路段信息的聚合,采用统计机器学习的方法,将从步骤(iii)中抽取的描述同一地点的各种信息聚合,由此得到若干路段信息;
(v)进行路况信息聚合,基于上述获得的路段信息、事件信息,采用统计机器学习的方法,将描述同一路况的地点、事件信息组合为一条完整的路况信息,由此获取若干条完整的路况信息。
2.根据权利要求1所述的从语音数据中提取结构化交通路况信息的方法,还包括将步骤(3)所输出的路况信息中的简称、俗称和标准的道路名相对应,以增加提取出的有效路况信息数量。
3.根据权利要求1所述的从语音数据中提取结构化交通路况信息的方法,还包括对步骤(2)处理后的文本进行可以和路网融合的路况信息定义,定义项目包含发布时间、开始时间、解除时间、预计解除时间、道路名、方向、附属定位词、路段起点、路段终点、事件类型、事件描述、语音识别结果。
4.根据权利要求1所述的从语音数据中提取结构化交通路况信息的方法,还包括预先构建专业词库,包括道路名/POI词库、道路方向词库、事件词库、道路节点表,步骤(i)中所述的分词基于所述专业词库来进行。
5.根据权利要求1所述的从语音数据中提取结构化交通路况信息的方法,其中所述无用信息内容包括音乐、广告、闲聊。
6.根据权利要求1所述的从语音数据中提取结构化交通路况信息的方法,其中所述过滤通过决策树、K近邻、朴素贝叶斯、支持向量机或人工神经网络方法实施。
7.根据权利要求1所述的从语音数据中提取结构化交通路况信息的方法,其中所述路段信息点包括道路名/POI、方向、主辅路、路段起终点,所述事件信息点包括时间信息、交通限制类和特殊事件类信息。
8.根据权利要求7所述的从语音数据中提取结构化交通路况信息的方法,其中根据正则的方法抽取出所述时间信息。
9.根据权利要求1所述的从语音数据中提取结构化交通路况信息的方法,其中所述统计机器学习的方法基于支持向量机,将关系抽取问题抽象成分类问题,给出所有备选实体关系对,对其一一进行判断,采用相关概率值作为评分,以判断其关系。
10.根据权利要求1所述的从语音数据中提取结构化交通路况信息的方法,其中所述步骤(i)包括对非关键词进行基于统计的中文分词。
CN201610960201.5A 2016-10-28 2016-10-28 一种从语音数据中提取结构化交通路况信息的方法 Active CN106504746B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610960201.5A CN106504746B (zh) 2016-10-28 2016-10-28 一种从语音数据中提取结构化交通路况信息的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610960201.5A CN106504746B (zh) 2016-10-28 2016-10-28 一种从语音数据中提取结构化交通路况信息的方法

Publications (2)

Publication Number Publication Date
CN106504746A true CN106504746A (zh) 2017-03-15
CN106504746B CN106504746B (zh) 2020-02-11

Family

ID=58321626

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610960201.5A Active CN106504746B (zh) 2016-10-28 2016-10-28 一种从语音数据中提取结构化交通路况信息的方法

Country Status (1)

Country Link
CN (1) CN106504746B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107123418A (zh) * 2017-05-09 2017-09-01 广东小天才科技有限公司 一种语音消息的处理方法及移动终端
CN107146620A (zh) * 2017-03-22 2017-09-08 北京晓数聚传媒科技有限公司 一种赛事状况数据展现方法和装置
CN107270922A (zh) * 2017-06-15 2017-10-20 北京航空航天大学 一种基于poi索引的交通事故空间定位方法
CN107481115A (zh) * 2017-08-18 2017-12-15 北京微影时代科技有限公司 一种在线购票方法及装置
CN107590172A (zh) * 2017-07-17 2018-01-16 北京捷通华声科技股份有限公司 一种大规模语音数据的核心内容挖掘方法及设备
CN108417209A (zh) * 2018-03-02 2018-08-17 国家电网公司华中分部 一种基于自然语言处理技术的电力调度语素抽取方法
CN109471936A (zh) * 2018-10-11 2019-03-15 上海叔本华智能科技有限公司 一种用于对设备维护信息进行特征分类的方法和系统
CN109754808A (zh) * 2018-12-13 2019-05-14 平安科技(深圳)有限公司 语音转换文字的方法、装置、计算机设备及存储介质
CN109766826A (zh) * 2019-01-08 2019-05-17 广东小天才科技有限公司 一种自动识别作业信息的方法及系统
CN110245352A (zh) * 2019-06-18 2019-09-17 北京智合大方科技有限公司 一种舆情热词分析方法及装置
CN110502738A (zh) * 2018-05-18 2019-11-26 阿里巴巴集团控股有限公司 中文命名实体识别方法、装置、设备和查询系统
CN110807070A (zh) * 2019-10-25 2020-02-18 普强信息技术(北京)有限公司 一种基于神经网络的路况信息提取方法
CN111739520A (zh) * 2020-08-10 2020-10-02 腾讯科技(深圳)有限公司 一种语音识别模型训练方法、语音识别方法、装置
CN112699669A (zh) * 2020-12-29 2021-04-23 医渡云(北京)技术有限公司 流性病学调查报告的自然语言处理、装置及存储介质
CN113381922A (zh) * 2020-03-09 2021-09-10 阿尔派株式会社 电子装置以及信息的再生控制方法
CN113971551A (zh) * 2021-12-27 2022-01-25 深圳至简天成科技有限公司 一种在线面试的实时评估方法及系统
CN117238277A (zh) * 2023-11-09 2023-12-15 北京水滴科技集团有限公司 意图识别方法、装置、存储介质及计算机设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104183144A (zh) * 2013-05-20 2014-12-03 北京百度网讯科技有限公司 一种实时路况信息生成方法和系统
CN104462600A (zh) * 2014-12-31 2015-03-25 科大讯飞股份有限公司 实现来电原因自动分类的方法及装置
CN105654947A (zh) * 2015-12-30 2016-06-08 中国科学院自动化研究所 一种获取交通广播语音中路况信息的方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104183144A (zh) * 2013-05-20 2014-12-03 北京百度网讯科技有限公司 一种实时路况信息生成方法和系统
CN104462600A (zh) * 2014-12-31 2015-03-25 科大讯飞股份有限公司 实现来电原因自动分类的方法及装置
CN105654947A (zh) * 2015-12-30 2016-06-08 中国科学院自动化研究所 一种获取交通广播语音中路况信息的方法及系统

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107146620A (zh) * 2017-03-22 2017-09-08 北京晓数聚传媒科技有限公司 一种赛事状况数据展现方法和装置
CN107123418A (zh) * 2017-05-09 2017-09-01 广东小天才科技有限公司 一种语音消息的处理方法及移动终端
CN107270922A (zh) * 2017-06-15 2017-10-20 北京航空航天大学 一种基于poi索引的交通事故空间定位方法
CN107270922B (zh) * 2017-06-15 2020-04-14 北京航空航天大学 一种基于poi索引的交通事故空间定位方法
CN107590172A (zh) * 2017-07-17 2018-01-16 北京捷通华声科技股份有限公司 一种大规模语音数据的核心内容挖掘方法及设备
CN107590172B (zh) * 2017-07-17 2020-06-05 北京捷通华声科技股份有限公司 一种大规模语音数据的核心内容挖掘方法及设备
CN107481115A (zh) * 2017-08-18 2017-12-15 北京微影时代科技有限公司 一种在线购票方法及装置
CN108417209A (zh) * 2018-03-02 2018-08-17 国家电网公司华中分部 一种基于自然语言处理技术的电力调度语素抽取方法
CN110502738A (zh) * 2018-05-18 2019-11-26 阿里巴巴集团控股有限公司 中文命名实体识别方法、装置、设备和查询系统
CN109471936A (zh) * 2018-10-11 2019-03-15 上海叔本华智能科技有限公司 一种用于对设备维护信息进行特征分类的方法和系统
CN109754808B (zh) * 2018-12-13 2024-02-13 平安科技(深圳)有限公司 语音转换文字的方法、装置、计算机设备及存储介质
CN109754808A (zh) * 2018-12-13 2019-05-14 平安科技(深圳)有限公司 语音转换文字的方法、装置、计算机设备及存储介质
CN109766826A (zh) * 2019-01-08 2019-05-17 广东小天才科技有限公司 一种自动识别作业信息的方法及系统
CN110245352A (zh) * 2019-06-18 2019-09-17 北京智合大方科技有限公司 一种舆情热词分析方法及装置
CN110807070A (zh) * 2019-10-25 2020-02-18 普强信息技术(北京)有限公司 一种基于神经网络的路况信息提取方法
CN113381922A (zh) * 2020-03-09 2021-09-10 阿尔派株式会社 电子装置以及信息的再生控制方法
CN113381922B (zh) * 2020-03-09 2024-02-27 阿尔派株式会社 电子装置以及信息的再生控制方法
CN111739520A (zh) * 2020-08-10 2020-10-02 腾讯科技(深圳)有限公司 一种语音识别模型训练方法、语音识别方法、装置
CN112699669A (zh) * 2020-12-29 2021-04-23 医渡云(北京)技术有限公司 流性病学调查报告的自然语言处理、装置及存储介质
CN112699669B (zh) * 2020-12-29 2022-11-11 医渡云(北京)技术有限公司 流行病学调查报告的自然语言处理方法、装置及存储介质
CN113971551A (zh) * 2021-12-27 2022-01-25 深圳至简天成科技有限公司 一种在线面试的实时评估方法及系统
CN117238277A (zh) * 2023-11-09 2023-12-15 北京水滴科技集团有限公司 意图识别方法、装置、存储介质及计算机设备
CN117238277B (zh) * 2023-11-09 2024-01-19 北京水滴科技集团有限公司 意图识别方法、装置、存储介质及计算机设备

Also Published As

Publication number Publication date
CN106504746B (zh) 2020-02-11

Similar Documents

Publication Publication Date Title
CN106504746A (zh) 一种从语音数据中提取结构化交通路况信息的方法
CN102968439B (zh) 一种推送微博的方法及装置
CN104268160A (zh) 一种基于领域词典和语义角色的评价对象抽取方法
CN107346340A (zh) 一种用户意图识别方法及系统
CN103942340A (zh) 一种基于文本挖掘的微博用户兴趣识别方法
CN103795612A (zh) 即时通讯中的垃圾和违法信息检测方法
CN103955505A (zh) 一种基于微博的事件实时监测方法及系统
CN109857869B (zh) 一种基于Ap增量聚类和网络基元的热点话题预测方法
CN105183717A (zh) 一种基于随机森林和用户关系的osn用户情感分析方法
Zhang et al. Semi-supervised discovery of informative tweets during the emerging disasters
Xu et al. Traffic event detection using twitter data based on association rules
CN112559747A (zh) 事件分类处理方法、装置、电子设备和存储介质
CN113064989B (zh) 一种交通舆情感知特征提取方法
Sasaki et al. Feasibility study on detection of transportation information exploiting Twitter as a sensor
CN103699568A (zh) 一种从维基中抽取领域术语间上下位关系的方法
CN110969836A (zh) 基于网络大数据的路况实时分析系统
Chen et al. Estimate of public environment-emotional index based on micro-blog data
Herwanto et al. Traffic condition information extraction from Twitter data
CN106909541A (zh) 一种跨领域公共舆情的自动识别、分类与上报的系统
CN115511280A (zh) 一种基于多模态数据融合的城市洪水韧性评价方法
Almohammad et al. Public twitter data and transport network status
CN110377845B (zh) 基于区间半监督lda的协同过滤推荐方法
JP6497657B2 (ja) 多数のコメントから地域固有コメントを抽出するコメント分類プログラム、サーバ及び方法
CN113821739B (zh) 本地事件检测方法、装置、设备和存储介质
CN109918579B (zh) 基于语义特性提取位置指示词的位置推断方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200311

Address after: 519000 room 105-58115, No. 6, Baohua Road, Hengqin New District, Zhuhai City, Guangdong Province (centralized office area)

Patentee after: Puqiang times (Zhuhai Hengqin) Information Technology Co.,Ltd.

Address before: 100085 Beijing, Haidian District, northeast Wang West Road, No. 4, building, software Plaza, C block, cloud base, 4 405A

Patentee before: PACHIRA TECHNOLOGY (BEIJING) CO.,LTD.

TR01 Transfer of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Method of Extracting Structured Traffic Information from Speech Data

Effective date of registration: 20230203

Granted publication date: 20200211

Pledgee: Bank of China Limited Hengqin Guangdong-Macao Deep Cooperation Zone Branch

Pledgor: Puqiang times (Zhuhai Hengqin) Information Technology Co.,Ltd.

Registration number: Y2023980032065

PE01 Entry into force of the registration of the contract for pledge of patent right