CN103186607A - 分布式语音检索系统 - Google Patents

分布式语音检索系统 Download PDF

Info

Publication number
CN103186607A
CN103186607A CN 201110455844 CN201110455844A CN103186607A CN 103186607 A CN103186607 A CN 103186607A CN 201110455844 CN201110455844 CN 201110455844 CN 201110455844 A CN201110455844 A CN 201110455844A CN 103186607 A CN103186607 A CN 103186607A
Authority
CN
China
Prior art keywords
voice
phonetic
buffer storage
database
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201110455844
Other languages
English (en)
Inventor
李丕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DALIAN TTVI TECHNOLOGY Co Ltd
Original Assignee
DALIAN TTVI TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DALIAN TTVI TECHNOLOGY Co Ltd filed Critical DALIAN TTVI TECHNOLOGY Co Ltd
Priority to CN 201110455844 priority Critical patent/CN103186607A/zh
Publication of CN103186607A publication Critical patent/CN103186607A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种分布式语音检索系统,其特征在于包括:语音缓存检索服务器负责检索语音缓存,并更新缓存内关键词被访问的次数,语音缓存中存放的是被用户使用次数最多的关键词;语音最优化检索服务器的数据库中存放的是最优拼音字符串;语音拼音图检索服务器,语音拼音图检索服务器的数据库中存放的是语音文件的拼音图信息。该系统具有结构简单,处理速度快,处理效果好等特点。

Description

分布式语音检索系统
技术领域
本发明涉及一种分布式语音检索系统。
背景技术
要用计算机对视频节目中出现的人的语音、背景音乐等进行处理,将其转换成字符串或具有一定含义的数学形式。通常是将语音信息转化成一个拼音图。通过对拼音图执行搜索,可以得到这段语音中可能出现了那些词语,这些词语出现的概率有多大。拼音串被用来作为搜索拼音图的搜索条件。对于音乐,也可以通过对其波形特征的分析,得到音乐的旋律。经过以上手段处理后得到的数据被称为语音的特征数据。特征数据的数量往往是非常庞大的。在进行基于内容的语音检索时,往往面临着数据量庞大,检索效率低下的问题。必须设法解决。或者较少特征数据的数据量,或者采取特别方式缩小检索范围以提高检索速度。同时,基于内容的语音检索还存在无法准确匹配的问题。
发明内容
本发明针对以上问题的提出,而研制一种分布式语音检索系统。本发明采用的技术手段如下:
一种分布式语音检索系统,其特征在于包括:
语音缓存检索服务器,语音缓存检索服务器负责检索语音缓存,并更新缓存内关键词被访问的次数,语音缓存中存放的是被用户使用次数最多的关键词;
语音最优化检索服务器,语音最优化检索服务器的数据库中存放的是最优拼音字符串,在对一个语音文件进行分析后,会得到对应于各段语音的拼音图,然后,对拼音图执行图搜索算法,得到后验概率最高的若干拼音串,并将它们保存在XML文件中录入语音最优化数据库,当无法从语音缓存中检索到用户给出的关键词时,要检索语音最优化数据库,如果仍然得不到检索结果,则此次检索失败;
语音拼音图检索服务器,语音拼音图检索服务器的数据库中存放的是语音文件的拼音图信息。
还包括:语音缓存条目的添加,语音拼音图检索服务器还运行一个后台作业,该作业每隔10分钟调度一次;语音缓存的更新,当有新的语音节目被添加时,也就是新的XML文件录入数据库时,语音拼音图检索服务器还将启动一个更新操作,该操作首先远程访问语音缓存数据库中的缓存表,得到缓存表中所有的关键词,并以这些关键词为检索条件对新录入的语音节目所对应的所有拼音图执行搜索,将搜索到的结果即关键词出现在哪个节目、所属场景的开始和结束时间、所属镜头的开始和结束时间、关键词所在语音段本身的开始和结束时间和匹配概率更新到语音缓存数据库中。
本发明提供一种分布式语音检索系统,该系统包括一个语音缓存检索服务器,用于对热点语音信息进行保存、检索和维护。一个语音最优化检索服务器,用于对拼音图中后验概率最高的语音字符串进行保存、检索。一个语音拼音图检索服务器,用于对视频节目对应的语音拼音图进行保存、检索和维护。一个用于缓存条目生成、更新和替换的程序包。一组对外的查询和录入接口。
附图说明
图1为基于内容的语音检索系统模块图;
图2为基于内容的语音检索系统结构图;
图3为基于内容的语音检索流程图。
具体实施方式
如图1至图3所示的分布式语音检索系统分为如下几个模块:
语音缓存检索服务器;语音缓存检索服务器负责检索语音缓存,并更新缓存内关键词被访问的次数。语音缓存中存放的是被用户使用次数最多的关键词。初始,语音缓存中是空的。当用户发出检索请求后,首先执行对语音缓存的检索。如果缓存中某些条目的关键词字段与用户的检索条件关键词匹配,则将这些条目返回给用户,并更新这些条目的访问次数字段。如果语音缓存内没有与用户检索条件关键词匹配的条目,则要检索语音最优化数据库。同时,把这个在缓存中检索不到的关键词插入到队列表中。
语音最优化检索服务器;语音最优化检索服务器的数据库中存放的是最优拼音字符串。在对一个语音文件进行分析后,会得到对应于各段语音的拼音图。然后,对拼音图执行图搜索算法,得到后验概率最高的若干拼音串,并将它们保存在XML文件中录入语音最优化数据库。当无法从语音缓存中检索到用户给出的关键词时,要检索语音最优化数据库。如果仍然得不到检索结果,则此次检索失败。为了提高语音最优化检索的速度,要对此处存放的XML文档进行索引。只对XML中最有价值的部分,即拼音串部分,进行索引。使用XML的分段索引。
语音拼音图检索服务器;语音拼音图检索服务器的数据库中存放的是语音文件的拼音图信息。语音拼音图是对一段语音信息最全面的记录。但是,信息完整的代价就是大量的存储空间和低下的搜索效率。如果在数据库中保存拼音图的信息(图的节点和弧的信息),当需要检索一个拼音图时,再从数据库中读取这些信息交给外部的图搜索算法,则大量的时间都被浪费在了数据库读取数据和外部算法解析数据的操作上。为此,在拼音图XML文档录入数据库时,就将其中的拼音图信息提取出来,保存在一些外部文件中。此后,在需要搜索拼音图时,数据库的检索程序只需给出目标拼音图的出现位置(在哪个节目内的什么时间位置),然后根据这些位置确定存储相应的拼音图的文件的名字,再把这个文件名告知外部图搜索程序,图搜索程序直接去使用那个文件即可。这样,拼音图的读取操作放在了离线状态下完成,大大减少了在线操作所需的时间。
语音缓存条目的添加;语音拼音图检索服务器还运行一个后台作业。该作业每隔10分钟调度一次。作业首先远程访问语音缓存检索服务器上的队列表(这里存放有用户给出的但目前缓存中不存在的关键词),从队列表中取出所有关键词,并在语音拼音图数据库中检索这些关键词,将检索到的结果(即关键词出现在哪个节目、所属场景的开始和结束时间、所属镜头的开始和结束时间、关键词所在语音段本身的开始和结束时间和匹配概率)添加到缓存数据库中。最后,删除队列表中的相应关键词条目。通过上面的步骤,检索集群就离线的对用户给出的但缓存中不存在的关键词进行了全面的拼音图搜索。当此后该关键词再次被检索时,语音缓存就可以返回大量的优质的结果。
语音缓存的更新;当有新的语音节目被添加时,也就是新的XML文件录入数据库时,语音拼音图检索服务器还将启动一个更新操作。该操作首先远程访问语音缓存数据库中的缓存表,得到缓存表中所有的关键词,并以这些关键词为检索条件对新录入的语音节目所对应的所有拼音图执行搜索。将搜索到的结果即关键词出现在哪个节目、所属场景的开始和结束时间、所属镜头的开始和结束时间、关键词所在语音段本身的开始和结束时间和匹配概率更新到语音缓存数据库中。通过上面的操作,缓存中关键词的出现位置信息就可以保持最新。由于拼音图的搜索算法相对较为复杂,不能在数据库的存储过程中实现,因此使用外部高级语言程序实现拼音图搜索算法,并将其转换成动态链接库。该动态链接库中的核心搜索算法将与数据库中的函数绑定,这样,数据库内的检索程序就可以调用外部的拼音图搜索算法,使得二者可以协同工作,完成检索。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (2)

1.一种分布式语音检索系统,其特征在于包括:
语音缓存检索服务器,语音缓存检索服务器负责检索语音缓存,并更新缓存内关键词被访问的次数,语音缓存中存放的是被用户使用次数最多的关键词;
语音最优化检索服务器,语音最优化检索服务器的数据库中存放的是最优拼音字符串,在对一个语音文件进行分析后,会得到对应于各段语音的拼音图,然后,对拼音图执行图搜索算法,得到后验概率最高的若干拼音串,并将它们保存在XML文件中录入语音最优化数据库,当无法从语音缓存中检索到用户给出的关键词时,要检索语音最优化数据库,如果仍然得不到检索结果,则此次检索失败;
语音拼音图检索服务器,语音拼音图检索服务器的数据库中存放的是语音文件的拼音图信息。
2.根据权利要求1所述的一种分布式语音检索系统,其特征在于还包括:语音缓存条目的添加,语音拼音图检索服务器还运行一个后台作业,该作业每隔10分钟调度一次;语音缓存的更新,当有新的语音节目被添加时,也就是新的XML文件录入数据库时,语音拼音图检索服务器还将启动一个更新操作,该操作首先远程访问语音缓存数据库中的缓存表,得到缓存表中所有的关键词,并以这些关键词为检索条件对新录入的语音节目所对应的所有拼音图执行搜索,将搜索到的结果即关键词出现在哪个节目、所属场景的开始和结束时间、所属镜头的开始和结束时间、关键词所在语音段本身的开始和结束时间和匹配概率更新到语音缓存数据库中。
CN 201110455844 2011-12-30 2011-12-30 分布式语音检索系统 Pending CN103186607A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110455844 CN103186607A (zh) 2011-12-30 2011-12-30 分布式语音检索系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110455844 CN103186607A (zh) 2011-12-30 2011-12-30 分布式语音检索系统

Publications (1)

Publication Number Publication Date
CN103186607A true CN103186607A (zh) 2013-07-03

Family

ID=48677776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110455844 Pending CN103186607A (zh) 2011-12-30 2011-12-30 分布式语音检索系统

Country Status (1)

Country Link
CN (1) CN103186607A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810995A (zh) * 2012-11-13 2014-05-21 通用汽车环球科技运作有限责任公司 用于语音系统的调节方法和系统
CN107004407A (zh) * 2015-09-03 2017-08-01 谷歌公司 增强型语音端点确定
CN107665710A (zh) * 2016-07-27 2018-02-06 上海博泰悦臻网络技术服务有限公司 移动终端语音数据处理方法及装置
CN110289015A (zh) * 2019-05-27 2019-09-27 北京大米科技有限公司 一种音频处理方法、装置、服务器、存储介质及系统
CN111292750A (zh) * 2020-03-09 2020-06-16 成都启英泰伦科技有限公司 一种基于云端改善的本地语音识别方法
CN112420026A (zh) * 2019-08-23 2021-02-26 微软技术许可有限责任公司 优化关键词检索系统
CN113421542A (zh) * 2021-06-22 2021-09-21 广州小鹏汽车科技有限公司 语音交互方法、服务器、语音交互系统和存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810995A (zh) * 2012-11-13 2014-05-21 通用汽车环球科技运作有限责任公司 用于语音系统的调节方法和系统
US9564125B2 (en) 2012-11-13 2017-02-07 GM Global Technology Operations LLC Methods and systems for adapting a speech system based on user characteristics
CN107004407A (zh) * 2015-09-03 2017-08-01 谷歌公司 增强型语音端点确定
CN107665710A (zh) * 2016-07-27 2018-02-06 上海博泰悦臻网络技术服务有限公司 移动终端语音数据处理方法及装置
CN107665710B (zh) * 2016-07-27 2021-02-09 上海博泰悦臻网络技术服务有限公司 移动终端语音数据处理方法及装置
CN110289015A (zh) * 2019-05-27 2019-09-27 北京大米科技有限公司 一种音频处理方法、装置、服务器、存储介质及系统
CN110289015B (zh) * 2019-05-27 2021-09-17 北京大米科技有限公司 一种音频处理方法、装置、服务器、存储介质及系统
CN112420026A (zh) * 2019-08-23 2021-02-26 微软技术许可有限责任公司 优化关键词检索系统
CN111292750A (zh) * 2020-03-09 2020-06-16 成都启英泰伦科技有限公司 一种基于云端改善的本地语音识别方法
CN113421542A (zh) * 2021-06-22 2021-09-21 广州小鹏汽车科技有限公司 语音交互方法、服务器、语音交互系统和存储介质

Similar Documents

Publication Publication Date Title
CN101021856B (zh) 分布式语音检索系统
CN103186607A (zh) 分布式语音检索系统
US10277952B2 (en) Method and system for performing searches for television content using reduced text input
JP4173774B2 (ja) 重み付き編集距離に基づく例文の自動検索用システムおよび方法
CN102945237B (zh) 基于原始用户输入建议和细分用户输入的系统和方法
CN1552032B (zh) 数据库
US8051045B2 (en) Archive indexing engine
US8037105B2 (en) Computer apparatus
JP5509596B2 (ja) データ管理装置
US20040205044A1 (en) Method for storing inverted index, method for on-line updating the same and inverted index mechanism
US8010887B2 (en) Implementing versioning support for data using a two-table approach that maximizes database efficiency
WO2008141583A1 (fr) Procédé d'entrée de caractères, système d'entrée et procédé pour mettre à jour un lexique de mots
CN101136027B (zh) 用于数据库索引、搜索和数据检索的系统和方法
CN100458784C (zh) 在数字图书馆中所采用的检索系统和检索方法
JP2009540398A (ja) 音声ドキュメントに関する概念ベースのメディア間インデックス化および取り出し
CN101645093A (zh) 一种分类词库实现的方法和输入法客户端
CN112231321B (zh) 一种Oracle二级索引及索引实时同步方法
CN102629269A (zh) 一种嵌入式数据库的检索及存储方法
CN101620607A (zh) 全文检索方法及系统
CN107851108A (zh) 使用位向量搜索索引的匹配文档
US20070239656A1 (en) Removal of Database Query Function Calls
US20100332501A1 (en) System and method for on-demand indexing
KR20020089677A (ko) 문서 자동 분류 방법 및 이를 수행하기 위한 시스템
JPH05204983A (ja) リレーショナルデータベース処理装置および処理方法
US11055266B2 (en) Efficient key data store entry traversal and result generation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C05 Deemed withdrawal (patent law before 1993)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130703