CN106446051A - Eagle媒资深度搜索方法 - Google Patents

Eagle媒资深度搜索方法 Download PDF

Info

Publication number
CN106446051A
CN106446051A CN201610797504.XA CN201610797504A CN106446051A CN 106446051 A CN106446051 A CN 106446051A CN 201610797504 A CN201610797504 A CN 201610797504A CN 106446051 A CN106446051 A CN 106446051A
Authority
CN
China
Prior art keywords
information
matchmaker
search
eagle
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610797504.XA
Other languages
English (en)
Inventor
肖波
凌攀
李树辉
王福祥
尤莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xinaote Cloud Vision Technology Co Ltd
Original Assignee
Beijing Xinaote Cloud Vision Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xinaote Cloud Vision Technology Co Ltd filed Critical Beijing Xinaote Cloud Vision Technology Co Ltd
Priority to CN201610797504.XA priority Critical patent/CN106446051A/zh
Publication of CN106446051A publication Critical patent/CN106446051A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/41Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及网络技术领域,特别是一种Eagle媒资深度搜索方法,包括以下步骤,步骤S101:媒资信息提取,自动从音视频文件中提取出各类信息;步骤S102:创建标引库,将提取出的信息按照一定标准规范对文件进行自动标引,从而创建标引库;步骤S103:媒资搜索处理,对标引库内的音视图媒资信息进行搜索处理。采用上述方法后,本发明利用各类自动化处理技术,能从音视图文全媒体内容里提取出丰富的显性信息出来,并创建强大的标引库,让标引信息更加完整、更加精准、更加丰富;基于分布式云计算,采用全新的搜索方式,不仅能准确的找到相应的媒体内容,而且能做到视频的帧级精准定位。

Description

Eagle媒资深度搜索方法
技术领域
本发明涉及网络技术领域,特别是一种Eagle媒资深度搜索方法。
背景技术
目前,媒资搜索只能基于媒体名称、媒体类型等编目信息和文件创建者进行搜索,导致搜索方式单一,降低了搜索效率,甚至有些时候用户会找不到想要的搜索结果。
中国发明专利CN 103595597 A公开了一种媒体资源搜索的方法及设备,包括DLNA网络中的控制点设备接收用户输入的媒体资源搜索信息,所述媒体资源搜索信息包括媒体类型和媒体资源目标生成地;根据所述用户输入的媒体资源搜索信息,生成媒体搜索请求;将所述媒体搜索请求发送至媒体服务器,以使得媒体服务器中搜索与所述媒体资源搜索信息对应的媒体资源;接收所述媒体服务器发送的搜索结果。
发明内容
本发明需要解决的技术问题是提供一种从媒资文件中自动化提取搜索信息的方法。
为解决上述的技术问题,本发明的Eagle媒资深度搜索方法,包括以下步骤,
步骤S101:媒资信息提取,自动从音视频文件中提取出各类信息;
步骤S102:创建标引库,将提取出的信息按照一定标准规范对文件进行自动标引,从而创建标引库;
步骤S103:媒资搜索处理,对标引库内的音视图媒资信息进行搜索处理;
进一步的,所述步骤S101中自动从音视图文件中提取出信息采用截图服务、转场识别、图片DNA、声纹识别、语音识别和人脸识别。
更进一步的,所述步骤S101中提取出的信息包括关键帧图片、人脸信息、语音文本信息、声纹信息和图片DNA信息。
更进一步的,所述步骤S103中搜索处理方式包括音视频搜索、图片搜索和全文搜索。
更进一步的,所述步骤S103中音视频搜索、图片搜索和全文搜索均采用分布式多节点部署架构。
更进一步的,所述步骤S102中标引库采用mongoDB非关系型数据库进行存储,并采用ES创建索引文件。
更进一步的,所述步骤S103中对标引库内的音视频媒资信息的搜索处理包括比对、筛选和排序。
采用上述方法后,本发明利用各类自动化处理技术,能从音视图文全媒体内容里提取出丰富的显性信息出来,并创建强大的标引库,让标引信息更加完整、更加精准、更加丰富;基于分布式云计算,采用全新的搜索方式,不仅能准确的找到相应的媒体内容,而且能做到视频的帧级精准定位。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明Eagle媒资深度搜索方法的流程图。
图2为本发明Eagle媒资深度搜索方法的总体框架图。
图3为本发明Eagle媒资深度搜索方法媒资信息提取示意图。
图4为本发明Eagle媒资深度搜索方法分布式检索示意图。
具体实施方式
如图1所示,本发明的Eagle媒资深度搜索方法,包括以下步骤,
步骤S101:媒资信息提取,自动从音视频文件中提取出各类信息。Eagle的核心价值在于通过智能处理技术手段自动从音视图文件中提取出可理解、有意义、有价值的信息,并对文件进行自动标引,从而创建丰富海量的标引库。创建标引库所用到的技术手段包括:截图服务、图片DNA、声纹识别、语音识别、人脸识别等。如图3所示,最上层有统一信息采集管理服务,该服务负责接收应用层下发的采集任务,并对文件类型、合法性、完整性等进行校验,然后根据文件类型去自动调取不同的采集服务,例如:图片文件即调取图片DNA服务、人脸识别服务;音频文件调取声纹识别、语音识别服务;视频文件调用转场识别、截图、人脸识别、语音识别、声纹识别等,这样对应用层极大的简化了对接的复杂度。上述技术手段具体如下:
1)截图服务
截图服务主要用于视频关键帧的截取,从而为图像信息识别及关键帧精细化定位打好基础。截图服务处理速度为:超清10倍速、高清15倍速、标清22倍速、流畅30倍速,其截取画面的偏差基本为前后一帧。根据不用的应用场景和业务需求,图片截取的规则可以灵活设定,可以为1秒一帧、2秒一帧等。
2)转场识别
转场识别服务通过语音断句、声色变化、人脸识别等,将一定规律连续截取的图片过滤掉重复的无效的画面,这样不但减少了图片DNA比对的数据运算量,而且提高了搜索结果的精准性提供了用户体验。
3)图片DNA
图片DNA是对图片的色彩、形状等信息的描述,是图片特征值的唯一标识,主要用于图片之间的比对搜索。由于通过截图服务将图片做了规格统一,因此对截取的图片做DNA提取的速度与图片清晰度无关,平均为40倍速。图片的压缩、拉伸、亮度、色彩(例如:黑白处理、加上滤镜等)的任意调整对图片DNA比对的准确性影响不大;对于含有人脸图片的角度旋转,系统会自动做校正处理因此也不会影响其比对的准确性。
4)人脸识别
通过创建人脸模型来识别图片中所包含的人物信息,只需2张人物正面+侧面照即可准确描述一个人脸模型,通过对人脸64个特征点的学习及提取,可做到识别的结果与人物的年龄、胖瘦均无关。人脸识别的速度公有云服务约为1秒/张,私有云服务约为0.5秒/张,人脸识别的准确性(漏识率+正确性)为90%以上。
5)语音识别
语音识别服务主要用于将音视频的语音自动转化成文本信息,从而能基于文本搜索,并能精准定位到音视频的某一时间点上。语音识别的效率约为20倍速,对于中文普通话的识别准确性为:新闻类95%以上,综艺80%以上,电视剧70%以上,方言由于缺乏语音库暂不支持。6)声纹识别
声纹识别是生物识别技术的一种,各种声音在音色、音调、响度等特征差异均很大,因此声纹DNA是对一段声音波形特征值的唯一描述,就像人体DNA一样,主要用于音视频的比对搜索。声纹提取的速度约为60倍速,且与视频格式及清晰度无关,声纹比对能做到亿级数据量速度3秒内。
步骤S102:创建标引库,将提取出的信息按照一定标准规范对文件进行自动标引,从而创建标引库;如图2所示,标引库里的各类型媒体文件的标引信息如下:
视频文件:将视频文件分离成图像及音频,那么截取关键帧,则可得到时间点+截图+图片DNA+图片文本信息(eg:人物姓名、种族、性别、台标等信息);对于音频则可得到时间点+声纹DNA+语音文本信息等。
音频文件:利用声纹识别和语音识别技术可得到时间点+声纹DNA以及时间点+语音文本信息。
图片文件:通过人脸识别及OCR等技术可得到图片DNA+文本信息(同样包括:人物姓名、种族、性别、台标、字幕等)。
步骤S103:媒资搜索处理,对标引库内的音视图媒资信息进行搜索处理;如图4所示,所述步骤S103中搜索处理方式包括音视频搜索、图片搜索和全文搜索。所述音视频搜索、图片搜索和全文搜索均采用分布式多节点部署架构。所述步骤S103中对标引库内的音视频媒资信息的处理包括比对、筛选和排序,具体如下:
所有提取的标引信息均采用mongoDB非关系型数据库进行存储,并采用ES创建索引文件。所有的搜索方式(包括:图片DNA比对、声纹DNA比对、全文搜索)均采用分布式多节点部署架构,随着数据量的增加,会自动扩充服务器数量,保证搜索速度。
1)音视频搜索
音视频采用声纹比对服务进行搜索,通过ES搜索引擎技术进行处理,搜索速度平均3秒。其搜索的结果按相似度从高到低排序,并显示视频关键帧。为了提高比对的准确性,声纹提取时对长文件自动做分段处理,对不同格式的音频文件做统一格式转换。任意截取音视频文件的25秒以上的片段能准确搜索出来的概率为95%以上,而声音大小及噪音对比对准确性的影响较小。
2)图片搜索
图片搜索主要采用DNA比对技术查找相似图片,对于含有人脸的图片,会并行调用人脸识别服务提取人名信息,并显示相关的音视图文内容。除此之外,对于含有人脸图片的角度旋转,系统会自动做校正处理。由于图片DNA比对运算量较大,要保证无论多大数据量搜索速度平均3秒,Eagle采用了分布式计算。如架构图所示,在DNA比对节点服务器第一次启动时会去自动加载索引文件,以后会自动定时去请求将最近更新的索引文件加载到服务器缓存中,当单台服务器的索引文件达到一定阀值时,会自动扩展服务器数量。分布式管理服务采用zookeeper进行节点管理、数据同步、配置维护等工作,并监测各服务器运行状态。当有搜索任务请求时,统一的搜索引擎服务会将该任务下发至每个分布式搜索节点,由各个节点进行计算比对,并将比对的结果返回给统一搜索管理服务,由统一搜索管理服务将各个节点返回的结果进行综合筛选、去重、排序,并将最终结果返回给应用层。
3)全文搜索
全文搜索采用的是ES搜索引擎,通过维护扩展词库和停止词库,提高结果的准确性。除了基于编目信息外,Eagle能基于人脸识别后的人名信息以及语音识别后的文本信息进行全文搜索,除了将编目信息中命中的关键词高亮显示外,还能将人脸或者语音命中的时间点及截图显示出来,鼠标移上“人脸”或“语音”标识上可查看命中的关键词,点击可快速定位到该时间点查看相应内容。
虽然以上描述了本发明的具体实施方式,但是本领域熟练技术人员应当理解,这些仅是举例说明,可以对本实施方式做出多种变更或修改,而不背离发明的原理和实质,本发明的保护范围仅由所附权利要求书限定。

Claims (7)

1.一种Eagle媒资深度搜索方法,其特征在于,包括以下步骤,
步骤S101:媒资信息提取,自动从音视频文件中提取出各类信息;
步骤S102:创建标引库,将提取出的信息按照一定标准规范对文件进行自动标引,从而创建标引库;
步骤S103:媒资搜索处理,对标引库内的音视图媒资信息进行搜索处理。
2.按照权利要求1所述的Eagle媒资深度搜索方法,其特征在于:所述步骤S101中自动从音视图文件中提取出信息采用截图服务、转场识别、图片DNA、声纹识别、语音识别和人脸识别。
3.按照权利要求2所述的Eagle媒资深度搜索方法,其特征在于:所述步骤S101中提取出的信息包括关键帧图片、人脸信息、语音文本信息、声纹信息和图片DNA信息。
4.按照权利要求3所述的Eagle媒资深度搜索方法,其特征在于:所述步骤S103中搜索处理方式包括音视频搜索、图片搜索和全文搜索。
5.按照权利要求4所述的Eagle媒资深度搜索方法,其特征在于:所述步骤S103中音视频搜索、图片搜索和全文搜索均采用分布式多节点部署架构。
6.按照权利要求5所述Eagle媒资深度搜索方法,其特征在于:所述步骤S102中标引库采用mongoDB非关系型数据库进行存储,并采用ES创建索引文件。
7.按照权利要求6所述Eagle媒资深度搜索方法,其特征在于:所述步骤S103中对标引库内的音视频媒资信息的搜索处理包括比对、筛选和排序。
CN201610797504.XA 2016-08-31 2016-08-31 Eagle媒资深度搜索方法 Pending CN106446051A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610797504.XA CN106446051A (zh) 2016-08-31 2016-08-31 Eagle媒资深度搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610797504.XA CN106446051A (zh) 2016-08-31 2016-08-31 Eagle媒资深度搜索方法

Publications (1)

Publication Number Publication Date
CN106446051A true CN106446051A (zh) 2017-02-22

Family

ID=58163715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610797504.XA Pending CN106446051A (zh) 2016-08-31 2016-08-31 Eagle媒资深度搜索方法

Country Status (1)

Country Link
CN (1) CN106446051A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766571A (zh) * 2017-11-08 2018-03-06 北京大学 一种多媒体资源的检索方法和装置
CN108829765A (zh) * 2018-05-29 2018-11-16 平安科技(深圳)有限公司 一种信息查询方法、装置、计算机设备及存储介质
CN110110099A (zh) * 2019-04-12 2019-08-09 华勤通讯技术有限公司 一种多媒体文件检索方法及装置
CN110427498A (zh) * 2019-07-24 2019-11-08 新华智云科技有限公司 媒体信息的存储方法、装置、存储设备及存储介质
CN111008288A (zh) * 2019-12-25 2020-04-14 新华智云科技有限公司 基于媒资内容标注来实现媒资检索和显示的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110035403A1 (en) * 2005-12-05 2011-02-10 Emil Ismalon Generation of refinement terms for search queries
CN102650993A (zh) * 2011-02-25 2012-08-29 北大方正集团有限公司 音视频文件的索引建立和检索方法、装置及系统
CN103530652A (zh) * 2013-10-23 2014-01-22 北京中视广信科技有限公司 一种基于人脸聚类的视频编目方法、检索方法及其系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110035403A1 (en) * 2005-12-05 2011-02-10 Emil Ismalon Generation of refinement terms for search queries
CN102650993A (zh) * 2011-02-25 2012-08-29 北大方正集团有限公司 音视频文件的索引建立和检索方法、装置及系统
CN103530652A (zh) * 2013-10-23 2014-01-22 北京中视广信科技有限公司 一种基于人脸聚类的视频编目方法、检索方法及其系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766571A (zh) * 2017-11-08 2018-03-06 北京大学 一种多媒体资源的检索方法和装置
CN108829765A (zh) * 2018-05-29 2018-11-16 平安科技(深圳)有限公司 一种信息查询方法、装置、计算机设备及存储介质
CN110110099A (zh) * 2019-04-12 2019-08-09 华勤通讯技术有限公司 一种多媒体文件检索方法及装置
CN110427498A (zh) * 2019-07-24 2019-11-08 新华智云科技有限公司 媒体信息的存储方法、装置、存储设备及存储介质
CN111008288A (zh) * 2019-12-25 2020-04-14 新华智云科技有限公司 基于媒资内容标注来实现媒资检索和显示的方法

Similar Documents

Publication Publication Date Title
CN106156365B (zh) 一种知识图谱的生成方法及装置
US20200143289A1 (en) Systems and method for performing contextual classification using supervised and unsupervised training
CN107766371B (zh) 一种文本信息分类方法及其装置
CN106446051A (zh) Eagle媒资深度搜索方法
CN114465737B (zh) 一种数据处理方法、装置、计算机设备及存储介质
CN104504150A (zh) 新闻舆情监测系统
CN111274442B (zh) 确定视频标签的方法、服务器及存储介质
CN111078943B (zh) 一种视频文本摘要生成方法及装置
WO2015149533A1 (zh) 一种基于网页内容分类进行分词处理的方法和装置
CN104035975B (zh) 一种利用中文在线资源实现远程监督人物关系抽取的方法
CN106484767A (zh) 一种跨媒体的事件抽取方法
US20230032728A1 (en) Method and apparatus for recognizing multimedia content
CN111506794A (zh) 一种基于机器学习的谣言管理方法和装置
CN109299277A (zh) 舆情分析方法、服务器及计算机可读存储介质
CN114896305A (zh) 一种基于大数据技术的智慧互联网安全平台
CN102855317A (zh) 一种基于演示视频的多模式索引方法及系统
CN112464036B (zh) 一种违规数据的审核方法及装置
CN109697676B (zh) 基于社交群的用户分析及应用方法和装置
US20230004830A1 (en) AI-Based Cognitive Cloud Service
CN112149386A (zh) 一种事件抽取方法、存储介质及服务器
WO2019187842A1 (ja) 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム
WO2024193538A1 (zh) 视频数据处理方法、装置、设备及可读存储介质
CN116628328A (zh) 一种基于功能语义和结构交互的Web API推荐方法及装置
CN102789466B (zh) 一种提问标题质量判定方法、提问引导方法及其装置
CN107291952B (zh) 一种提取有意义串的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170222

WD01 Invention patent application deemed withdrawn after publication