CN103853736A - 交通信息语音查询系统及其语音处理单元 - Google Patents

交通信息语音查询系统及其语音处理单元 Download PDF

Info

Publication number
CN103853736A
CN103853736A CN201210500663.0A CN201210500663A CN103853736A CN 103853736 A CN103853736 A CN 103853736A CN 201210500663 A CN201210500663 A CN 201210500663A CN 103853736 A CN103853736 A CN 103853736A
Authority
CN
China
Prior art keywords
voice
processing unit
user
information
audio processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210500663.0A
Other languages
English (en)
Inventor
魏金志
化永
许加升
范书睿
张高峰
于晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING PALMGO INFORMATION TECHNOLOGY CO., LTD.
Original Assignee
BEIJING PALMCITY TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING PALMCITY TECHNOLOGY Co Ltd filed Critical BEIJING PALMCITY TECHNOLOGY Co Ltd
Priority to CN201210500663.0A priority Critical patent/CN103853736A/zh
Publication of CN103853736A publication Critical patent/CN103853736A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种交通信息语音查询系统及其语音处理单元,属于动态交通信息领域。所述语音处理单元包括:自动语音识别模块,用于将用户语音信息转换为音节或字符串数据;语义分析模块,用于解释自动语音识别模块转换后的音节或字符串数据所代表的语义,生成查询指令;语音组织模块,用于将交通信息字符串数据转换成符合人类语言规则的字符串数据;语音转换模块,用于将转换后的字符串数据转换为语音信息输出。所述系统包括:通信单元、语音处理单元、处理单元及数据存储介质。本发明可以通过语音的方式进行实时交通信息的查询,并以简单易懂的道路交通状况描述方式进行语音播报,既保障驾车用户的行车安全,又满足用户了解实时交通信息的愿望。

Description

交通信息语音查询系统及其语音处理单元
技术领域
本发明涉及动态交通信息技术领域,特别涉及一种交通信息语音查询系统及其语音处理单元。
背景技术
当前,各种各样的移动通信终端(手机、pnd、车机等)和计算机已成为人们日常生活中必不可少的物品。移动通信终端用于实现人与人之间的或者人与网络设备间的通信,计算机用于存储各种有用的信息。随着技术的不断发展,通过移动通信终端获取信息越来越方便,并且移动通信终端的制造厂商和信息提供商都想方设法的提供更简洁的接入手段,更加丰富的信息内容以便用户查询。例如:越来越多的用户使用移动通信终端进行股票的查询、预定机票、火车票或酒店房间等。
在日常生活中堵车是非常普遍的,交通信息的使用也逐渐普及,大家出行时都会在互联网或者是手机和导航仪上通过交通信息查询软件进行查询,动态的交通信息通过数字广播、红外等无线通信方式传输并以地图的形式展现在用户的移动通信终端上。但现有技术都是通过硬件进行手动输入查询、屏幕提示显示查询信息的,用户必须要看很多的提示信息,并且如果输入的信息不准确还会造成查询结果的错误,其使用方式很不方便,同时给驾驶安全带来较大的隐患。
发明内容
有鉴于此,本发明的目的在于提供一种交通信息语音查询系统及其语音处理单元,用于实现交通信息的语音自动查询。
本发明提供了一种语音处理单元,包括:
自动语音识别模块,用于将用户语音信息转换为音节数据或字符串数据;
语义分析模块,用于解释经过所述自动语音识别模块转换后的音节数据或字符串数据所代表的语义,生成能够被计算机执行的查询指令;
语音组织模块,用于将根据用户请求生成的交通信息字符串数据转换成符合人类语言规则的字符串数据;
语音转换模块,用于将所述转换后符合人类语言规则的字符串数据转换为语音信息输出。
本发明还提供了一种交通信息语音查询系统,其特征在于,包括:
通信单元,用于通过通信网络、公共电话网络或者互联网获得用户的语音查询信息,以及通过语音方式向用户返回查询结果;
语音处理单元,用于将所述通信单元接收到的语音查询信息转换为查询指令,输入处理单元,以及将所述处理单元得到的查询结果转换为语音数据传送给所述通信单元;
处理单元,用于根据所述转换后的查询指令查找数据存储介质,将得到的查询结果传送给所述语音处理单元;
数据存储介质,用于存储动态路况信息、交通事件、文字路况以及图示路况,并且实时更新。
本发明可以通过语音的方式进行实时交通信息的查询,同时又以用户简单易懂的道路交通状况描述方式进行语音播报,既可以保障驾车用户的行车安全,又能满足用户了解实时交通信息的愿望。
附图说明
图1为本发明实施例提供的语音处理单元的结构示意图;
图2为本发明实施例中交通信息语音查询系统的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
图1为本发明实施例提供的交通信息语音查询系统中语音处理单元的结构示意图,该语音处理单元包括:
自动语音识别模块11,用于将用户语音信息转换为音节数据或字符串数据,输入语义分析模块12以获得用户的语义。根据模式匹配法来进行用户语音的识别:在训练阶段,将词汇表中的每一词依次说一遍,并且将其特征矢量作为模板存入模板库,同时建立对应的中文字符;在识别阶段,将输入语音的特征矢量依次与模板库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。
语义分析模块12,用于解释经过自动语音识别模块转换后的音节数据或字符串数据所代表的语义,生成能够被计算机执行的查询指令。
语义分析是采用HMM模型来实现的。语义分析中使用HMM模型主要解决3类问题:1.评估,计算生成出一个特定的观测序列概率;2.解码,推测生成出一个特定的观测序列的最大可能的隐状态序列;3.学习,在HMM模型不确定的条件下,根据一组可观测序列推测最可能的HMM模型。HMM模拟的是一种状态不能直接观测的系统。这些不能直接观测的隐状态与能够直接观测的显状态之间存在着密切关系。隐状态随时间发生状态改变,随之引发显状态的状态改变。HMM模型解决的问题即通过可观测状态序列获得隐状态相关信息的问题。对于语义分析而言,可以认为一个句型是一种HMM模型,可以通过训练一组相同句型的问句,得到一个最优的句型HMM模型,该模型为生成出训练模型的最大可能情况,因此得出相同句型的其他问句的可能性也较大,这个概率通过解决评估问题的方法获得。尽可能多的将交通信息类的问句训练成HMM模型,然后根据问句找到概率最大的句型,即完成语义分析的过程。
生成查询指令包括:语音转换成文字后,根据关键字的匹配,找到跟交通信息相关的词语,生成查询指令。例如:“学院路交通状况如何?”系统会将“学院路”和“交通状况”匹配出来并生成查询指令。系统中建有地名库,里面容纳了海量的道路名和POI等信息,供系统进行关键字的匹配。
语义分析模块12还能够纠正语音识别中的错误,以能够提供更好的人机互动方式,使用户不需要复杂的手工输入,就能够快速地输入需要执行的命令。纠正语音识别错误包括:由于语音识别受限于环境,比较嘈杂的环境中语音识别会受到影响,例如:用户所说的是“学院路交通状况如何?”但是由于嘈杂的环境识别成了“学院交通状况如何?”,“学院”可能是不存在的地名,这样的指令无法被交通信息语音查询系统所识别,这样就无法返回给用户想要的信息,用户体验很不好,基于此类情况,系统会根据地名库进行关键字的匹配把“学院”匹配成“学院路”,这样系统就会识别,可以正常地返回给用户所要查询的信息,提高用户的体验度。
语音组织模块13,用于将根据用户请求生成的交通信息的字符串数据转换成符合人类语言规则的字符串数据。由于交通信息语音查询系统返回信息的多样性,不可能将所有可能的反馈信息都预先存储起来,而系统反馈的查询结果字符串数据都是格式化的,不容易被人理解。这是因为,道路的描述方式往往会存在差异,一般情况下,道路可以描述成格式化的上行和下行,但是不同人对同一道路上行和下行方向的理解是不一样的,如果系统返回的交通信息不能描述出能让用户准确理解的文字,例如:“学院路,上行方向拥堵”,则不但会导致用户不容易理解,还会对用户体验度大打折扣。所以语音组织模块13会把道路的方向信息按照当地的习惯描述出来,例如:“学院路,南向北方向拥堵”,“机场高速,出京方向拥堵”,这样用户理解起来就会很容易。
语音转换模块14,用于将语音组织模块13转换后的字符串数据转换为语音信息输出。该模块利用语音合成TTS技术(又称文语转换技术)进行文字到语音的转换,它是将计算机自己产生的、或外部输入的文字信息转变为可以为用户听得懂的、流利的汉语口语输出的技术。TTS现在使用的很广泛,国内有很多提供TTS的公司。
当语音处理单元接收到语音信息后,经处理输出能够被计算机执行的查询命令;当查询命令执行完毕,计算机返回字符串形式的交通信息结果数据,则输入语音处理单元的语言组织模块处理后,再经过语音转换模块的处理,最后得到交通信息结果的语音数据。语音处理单元使用户和移动通信终端之间不需要复杂的手工输入,并且使用户更加清楚系统返回结果的含义。
在实际应用中,本实施例的语音处理单元可以设置于用户移动通信终端或者交通信息服务平台上,也可以独立于用户移动通信终端或交通信息服务平台,或者设置在与交通信息服务平台连接的网络设备上,例如在网关上加入语音处理单元,以实现用户使用语音进行查询的功能。
如果将语音处理单元设置于交通信息服务平台,则语音处理单元安装于该平台的通信单元与处理单元之间,将通信单元接收到的用户语音查询信息转换为能够被处理单元执行的查询命令形式;当处理单元检索数据存储介质(包括数据库、缓存等)查找到用户要查询的信息,则返回给语音处理单元;处理单元返回的数据都是字符串形式的,由语音处理单元将该字符串信息转换为语音信息,通过通信单元发给用户。
图2为本发明实施例中语音处理单元设置于交通信息服务平台时,交通信息语音查询系统的结构示意图,包括:
通信单元21,用于通过GSM/GPRS通信网络、公共电话网络或者互联网获得用户的语音查询信息,以及通过语音方式向用户返回查询结果。
语音处理单元22,用于将通信单元21接收到的语音查询信息转换为查询指令,输入处理单元23,以及将处理单元23得到的查询结果转换为语音数据通过通信单元21传送给用户。
处理单元23,用于根据所述转换后的查询指令查找数据存储介质,将得到的数据传送给语音处理单元22。
数据存储介质(包括数据库、缓存等)24,用于存储动态路况信息、交通事件、文字路况、图示路况等数据,并且实时更新。
基于以上交通信息语音查询系统的查询步骤包括:接收用户对所述交通信息的语音查询;将上述语音查询信息转换成能够被交通信息服务平台处理单元执行的查询指令;执行所述指令,检索得到字符串类型的交通信息;将上述交通信息转换成语音信息,并发送给用户。
另外,语音处理单元可以独立于所述交通信息服务平台,该语音处理单元接收从网络传输过来的语音查询信息,转换为相应的查询指令后,再传送给交通信息服务平台的通信单元,处理完成后语音处理单元接收通信单元传送的处理结果,将该结果转换为语音信息后再经由网络传送给用户。
语音处理单元也可以设置于用户移动通信终端与交通信息服务平台之间的网络设备上。在一个实施例中,语音处理单元可以安装于具有处理能力的交通信息服务平台的网关上,其接收用户移动通信终端的语音查询信息,将其转换为能够被交通信息服务平台处理单元执行的字符串数据,发送给交通信息服务平台的通信单元;当处理单元检索数据存储介质找到用户要查询的信息,则返回给通信单元;一般由处理器返回的数据都是字符串形式的,所以当语音处理单元接收到该字符串信息后,将其转换为语言信息,并通过网络发送给用户移动通信终端。
总之,以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (6)

1.一种语音处理单元,其特征在于,包括:
自动语音识别模块,用于将用户语音信息转换为音节数据或字符串数据;
语义分析模块,用于解释经过所述自动语音识别模块转换后的音节数据或字符串数据所代表的语义,生成能够被计算机执行的查询指令;
语音组织模块,用于将根据用户请求生成的交通信息字符串数据转换成符合人类语言规则的字符串数据;
语音转换模块,用于将所述转换后符合人类语言规则的字符串数据转换为语音信息输出。
2.根据权利要求1所述的语音处理单元,其特征在于,所述语义分析模块进一步用于纠正所述自动语音识别模块在语音识别中的错误。
3.根据权利要求1或2所述的语音处理单元,其特征在于,所述语音处理单元独立于用户移动通信终端及交通信息服务平台,用于接收从网络侧传输来的语音查询信息,转换为相应的查询指令后,再传送给交通信息服务平台,并接收查询结果,将该结果转换为语音信息后经由网络传送给用户。
4.根据权利要求1或2所述的语音处理单元,其特征在于,所述语音处理单元设置于用户移动通信终端与交通信息服务平台之间的网络设备上,用于接收用户移动通信终端的语音查询信息,将其转换为相应的查询指令后,发送给交通信息服务平台,并接收查询结果,将该结果转换为语音信息后经由网络传送给用户。
5.根据权利要求1或2所述的语音处理单元,其特征在于,所述语音处理单元设置于用户移动通信终端上。
6.一种交通信息语音查询系统,其特征在于,包括:
通信单元,用于通过通信网络、公共电话网络或者互联网获得用户的语音查询信息,以及通过语音方式向用户返回查询结果;
语音处理单元,用于将所述通信单元接收到的语音查询信息转换为查询指令,输入处理单元,以及将所述处理单元得到的查询结果转换为语音数据传送给所述通信单元;
处理单元,用于根据所述转换后的查询指令查找数据存储介质,将得到的查询结果传送给所述语音处理单元;
数据存储介质,用于存储动态路况信息、交通事件、文字路况以及图示路况,并且实时更新。
CN201210500663.0A 2012-11-29 2012-11-29 交通信息语音查询系统及其语音处理单元 Pending CN103853736A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210500663.0A CN103853736A (zh) 2012-11-29 2012-11-29 交通信息语音查询系统及其语音处理单元

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210500663.0A CN103853736A (zh) 2012-11-29 2012-11-29 交通信息语音查询系统及其语音处理单元

Publications (1)

Publication Number Publication Date
CN103853736A true CN103853736A (zh) 2014-06-11

Family

ID=50861402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210500663.0A Pending CN103853736A (zh) 2012-11-29 2012-11-29 交通信息语音查询系统及其语音处理单元

Country Status (1)

Country Link
CN (1) CN103853736A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107209549A (zh) * 2014-12-11 2017-09-26 万德实验室公司 能够实现可动作的消息传送的虚拟助理系统
CN109101655A (zh) * 2018-08-30 2018-12-28 山东高速股份有限公司 一种基于自然语言处理的高速信息语音自助查询系统及方法
CN109902430A (zh) * 2019-03-13 2019-06-18 上海车右智能科技有限公司 交通场景生成方法、装置、系统、计算机设备和存储介质
CN110161307A (zh) * 2019-06-21 2019-08-23 广东电网有限责任公司 一种基于语音控制的电表
CN110956958A (zh) * 2019-12-04 2020-04-03 深圳追一科技有限公司 搜索方法、装置、终端设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107209549A (zh) * 2014-12-11 2017-09-26 万德实验室公司 能够实现可动作的消息传送的虚拟助理系统
CN109101655A (zh) * 2018-08-30 2018-12-28 山东高速股份有限公司 一种基于自然语言处理的高速信息语音自助查询系统及方法
CN109902430A (zh) * 2019-03-13 2019-06-18 上海车右智能科技有限公司 交通场景生成方法、装置、系统、计算机设备和存储介质
CN110161307A (zh) * 2019-06-21 2019-08-23 广东电网有限责任公司 一种基于语音控制的电表
CN110956958A (zh) * 2019-12-04 2020-04-03 深圳追一科技有限公司 搜索方法、装置、终端设备及存储介质

Similar Documents

Publication Publication Date Title
CN109785828B (zh) 基于用户语音风格的自然语言生成
US10412206B1 (en) Communications for multi-mode device
US8032383B1 (en) Speech controlled services and devices using internet
US8560301B2 (en) Apparatus and method for language expression using context and intent awareness
CN110648553B (zh) 一种站点提醒方法、电子设备及计算机可读存储介质
US20050015197A1 (en) Communication type navigation system and navigation method
CN102439661A (zh) 用于车辆内自动交互的面向服务语音识别
US20130218563A1 (en) Speech understanding method and system
CN103853736A (zh) 交通信息语音查询系统及其语音处理单元
CN110232912A (zh) 语音识别仲裁逻辑
US8583441B2 (en) Method and system for providing speech dialogue applications
JP6597527B2 (ja) 音声認識装置および音声認識方法
CN109256125B (zh) 语音的离线识别方法、装置与存储介质
JP5616390B2 (ja) 応答生成装置、応答生成方法および応答生成プログラム
CN101206651A (zh) 车辆信息语音查询系统及方法
KR20130108173A (ko) 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법
US20190147855A1 (en) Neural network for use in speech recognition arbitration
CN111895991B (zh) 一种结合语音识别的室内定位导航方法
CN117216212A (zh) 对话处理方法、对话模型训练方法、装置、设备及介质
CN108447473A (zh) 语音翻译方法和装置
US10593323B2 (en) Keyword generation apparatus and keyword generation method
US20020072916A1 (en) Distributed speech recognition for internet access
CN108881508A (zh) 一种基于区块链的语音dns单元
CN101290770A (zh) 语音识别系统及方法
JP2001141500A (ja) 車載エージェント処理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: BEIJING PALMGO INFORMATION TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: BEIJING PALMCITY TECHNOLOGY CO., LTD.

Effective date: 20141217

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20141217

Address after: 100191 Beijing City, Haidian District Xueyuan Road No. 39 Building 9 layer solid

Applicant after: BEIJING PALMGO INFORMATION TECHNOLOGY CO., LTD.

Address before: 100191 Beijing City, Haidian District Xueyuan Road No. 39 Building 9 layer solid

Applicant before: Beijing PalmCity Technology Co., Ltd.

RJ01 Rejection of invention patent application after publication

Application publication date: 20140611

RJ01 Rejection of invention patent application after publication