CN111708902A - 一种多媒体数据采集方法 - Google Patents

一种多媒体数据采集方法 Download PDF

Info

Publication number
CN111708902A
CN111708902A CN202010527696.9A CN202010527696A CN111708902A CN 111708902 A CN111708902 A CN 111708902A CN 202010527696 A CN202010527696 A CN 202010527696A CN 111708902 A CN111708902 A CN 111708902A
Authority
CN
China
Prior art keywords
information
multimedia data
displaying
characters
sorting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010527696.9A
Other languages
English (en)
Inventor
曹畋
曾炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Xiaozhuang University
Original Assignee
Nanjing Xiaozhuang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Xiaozhuang University filed Critical Nanjing Xiaozhuang University
Priority to CN202010527696.9A priority Critical patent/CN111708902A/zh
Publication of CN111708902A publication Critical patent/CN111708902A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明公开一种多媒体数据采集方法,包括以下步骤:步骤10、获取多媒体数据并存储;步骤20、对获取的多媒体数据进行预处理;步骤30、对获取的多媒体数据进行错位纠正;步骤40、基于多媒体处理技术,检测并识别多媒体数据中的信息;步骤50、对采集到的多媒体数据信息进行校验;步骤60、形成多媒体数据包,储存并显示。本发明通过对多媒体数据的采集、信息提取和信息处理,以获得更准确的信息。

Description

一种多媒体数据采集方法
技术领域
本发明属于信息管理技术领域,具体涉及一种多媒体数据采集方法。
背景技术
随着计算机的飞速发展,数据采集技术已在通信、智能和网络仪器、测绘、探测、工业控制等领域广泛应用在生产过程中,要求较高的测量控制数据的技术很多,不仅如此,有很多其他的数据采集技术要求也是相当高,其中,多媒体数据采集技术就包含在这类采集技术中。目前,常规的多媒体数据采集采集面很窄且数据采集并不精准,这就导致最终得到的数据出现很大的误导性。
发明内容
本发明所要解决的技术问题便是针对上述现有技术的不足,提供一种多媒体数据采集方法,通过对多媒体数据的采集、信息提取和信息处理,以获得更准确的信息。
本发明所采用的技术方案是:一种多媒体数据采集方法,包括以下步骤:
步骤10、获取多媒体数据并存储;
步骤20、对获取的多媒体数据进行预处理;
步骤30、对获取的多媒体数据进行错位纠正;
步骤40、基于多媒体处理技术,检测并识别多媒体数据中的信息;
步骤50、对采集到的多媒体数据信息进行校验;
步骤60、形成多媒体数据包,储存并显示。
其中一个实施例中,所述的步骤20,具体如下:
对获取的文字信息进行去重和语义理解;
对获取的图片信息进行角度矫正、视角矫正和去除色彩干扰;
去除音频或视频中的杂音以及视频中的色彩干扰。
其中一个实施例中,所述的角度矫正和视角矫正时,设立中轴线,将图片中的信息以中轴线为标准进行旋转,保证图片中的信息与中轴线平齐。
其中一个实施例中,所述的步骤30,具体如下:
将获取的文字信息中错位或遗漏的部分根据文字间隙和语义关系将文字纠正或补充到正确位置;
将获取的图片信息中有遮挡或色彩脱落的部分根据整体色彩和整体图片涵义进行去除或补充;
将获取的音频信息中各种音频根据音效调整至合适的对应位置;
将获取的视频信息中各种音频、图像和文字根据音效和视效调整至对应位置。
其中一个实施例中,所述的步骤40,具体如下:
提取文字信息中的文字,整理并显示;
提取图形信息中的图像和文字,整理并显示;
将音频信息中的语言信息转换为文字,整理并显示,将音频信息中的环境声音经语言信息过滤后,截取后整理并显示;
提取视频信息中的图像和文字,整理并显示,将视频信息中的的语言信息转换为文字,整理并显示,将视频信息中的环境声音经语言信息过滤后,截取后整理并显示。
其中一个实施例中,将音频信息和视频信息中的的语言信息转换为文字时,音频中无法识别的语言信息根据语义进行补充,并将补充的内容进行特别标注。
其中一个实施例中,整理的多媒体信息以整理时间和设定的编号命名并储存。
其中一个实施例中,所述的步骤50,具体如下:
关联大数据,通过语义、整体色彩、整体图片色彩、音效和视效对采集到的多媒体数据信息进行比对,并将比对结果进行显示。
其中一个实施例中,还包括多媒体数据包查询步骤,具体如下:
选择时间段,输入整理时间、设定的编号命名或关键字,调取该多媒体数据包并显示。
其中一个实施例中,可对调取的多媒体数据包进行二次编辑,保持原有的多媒体数据包并将编辑后的多媒体数据包进行储存。
本发明的有益效果在于:
1、通过预处理、错位纠正、识别信息、校验、形成多媒体数据包和储存的方式,使得数据采集的方式更为合理,并且一定程度上保证数据采集的准确性;
2、本方法可调取已经采集到的多媒体数据包,对多媒体数据包有一定的追溯性。
具体实施方式
下面将结合具体实施例对本发明作进一步详细说明。
一种多媒体数据采集方法,包括以下步骤:
步骤10、获取多媒体数据并存储;
步骤20、对获取的多媒体数据进行预处理;
步骤30、对获取的多媒体数据进行错位纠正;
步骤40、基于多媒体处理技术,检测并识别多媒体数据中的信息;
步骤50、对采集到的多媒体数据信息进行校验;
步骤60、形成多媒体数据包,储存并显示。
本实施例中,所述的步骤20,具体如下:
对获取的文字信息进行去重和语义理解;
对获取的图片信息进行角度矫正、视角矫正和去除色彩干扰;
去除音频或视频中的杂音以及视频中的色彩干扰。
本实施例中,所述的角度矫正和视角矫正时,设立中轴线,将图片中的信息以中轴线为标准进行旋转,保证图片中的信息与中轴线平齐。
本实施例中,所述的步骤30,具体如下:
将获取的文字信息中错位或遗漏的部分根据文字间隙和语义关系将文字纠正或补充到正确位置;
将获取的图片信息中有遮挡或色彩脱落的部分根据整体色彩和整体图片涵义进行去除或补充;
将获取的音频信息中各种音频根据音效调整至合适的对应位置;
将获取的视频信息中各种音频、图像和文字根据音效和视效调整至对应位置。
本实施例中,所述的步骤40,具体如下:
提取文字信息中的文字,整理并显示;
提取图形信息中的图像和文字,整理并显示;
将音频信息中的语言信息转换为文字,整理并显示,将音频信息中的环境声音经语言信息过滤后,截取后整理并显示;
提取视频信息中的图像和文字,整理并显示,将视频信息中的的语言信息转换为文字,整理并显示,将视频信息中的环境声音经语言信息过滤后,截取后整理并显示。
本实施例中,将音频信息和视频信息中的的语言信息转换为文字时,音频中无法识别的语言信息根据语义进行补充,并将补充的内容进行特别标注。
本实施例中,整理的多媒体信息以整理时间和设定的编号命名并储存。
本实施例中,所述的步骤50,具体如下:
关联大数据,通过语义、整体色彩、整体图片色彩、音效和视效对采集到的多媒体数据信息进行比对,并将比对结果进行显示。
本实施例中,还包括多媒体数据包查询步骤,具体如下:
选择时间段,输入整理时间、设定的编号命名或关键字,调取该多媒体数据包并显示。
本实施例中,可对调取的多媒体数据包进行二次编辑,保持原有的多媒体数据包并将编辑后的多媒体数据包进行储存。
本发明通过预处理、错位纠正、识别信息、校验、形成多媒体数据包和储存的方式,使得数据采集的方式更为合理,并且一定程度上保证数据采集的准确性;本方法可调取已经采集到的多媒体数据包,对多媒体数据包有一定的追溯性。
以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (10)

1.一种多媒体数据采集方法,其特征在于,包括以下步骤:
步骤10、获取多媒体数据并存储;
步骤20、对获取的多媒体数据进行预处理;
步骤30、对获取的多媒体数据进行错位纠正;
步骤40、基于多媒体处理技术,检测并识别多媒体数据中的信息;
步骤50、对采集到的多媒体数据信息进行校验;
步骤60、形成多媒体数据包,储存并显示。
2.根据权利要求1所述的一种多媒体数据采集方法,其特征在于,所述的步骤20,具体如下:
对获取的文字信息进行去重和语义理解;
对获取的图片信息进行角度矫正、视角矫正和去除色彩干扰;
去除音频或视频中的杂音以及视频中的色彩干扰。
3.根据权利要求2所述的一种多媒体数据采集方法,其特征在于,所述的角度矫正和视角矫正时,设立中轴线,将图片中的信息以中轴线为标准进行旋转,保证图片中的信息与中轴线平齐。
4.根据权利要求1所述的一种多媒体数据采集方法,其特征在于,所述的步骤30,具体如下:
将获取的文字信息中错位或遗漏的部分根据文字间隙和语义关系将文字纠正或补充到正确位置;
将获取的图片信息中有遮挡或色彩脱落的部分根据整体色彩和整体图片涵义进行去除或补充;
将获取的音频信息中各种音频根据音效调整至合适的对应位置;
将获取的视频信息中各种音频、图像和文字根据音效和视效调整至对应位置。
5.根据权利要求1所述的一种多媒体数据采集方法,其特征在于,所述的步骤40,具体如下:
提取文字信息中的文字,整理并显示;
提取图形信息中的图像和文字,整理并显示;
将音频信息中的语言信息转换为文字,整理并显示,将音频信息中的环境声音经语言信息过滤后,截取后整理并显示;
提取视频信息中的图像和文字,整理并显示,将视频信息中的的语言信息转换为文字,整理并显示,将视频信息中的环境声音经语言信息过滤后,截取后整理并显示。
6.根据权利要求5所述的一种多媒体数据采集方法,其特征在于,将音频信息和视频信息中的的语言信息转换为文字时,音频中无法识别的语言信息根据语义进行补充,并将补充的内容进行特别标注。
7.根据权利要求5所述的一种多媒体数据采集方法,其特征在于,整理的多媒体信息以整理时间和设定的编号命名并储存。
8.根据权利要求1所述的一种多媒体数据采集方法,其特征在于,所述的步骤50,具体如下:
关联大数据,通过语义、整体色彩、整体图片色彩、音效和视效对采集到的多媒体数据信息进行比对,并将比对结果进行显示。
9.根据权利要求1所述的一种多媒体数据采集方法,其特征在于,还包括多媒体数据包查询步骤,具体如下:
选择时间段,输入整理时间、设定的编号命名或关键字,调取该多媒体数据包并显示。
10.根据权利要求9所述的一种多媒体数据采集方法,其特征在于,可对调取的多媒体数据包进行二次编辑,保持原有的多媒体数据包并将编辑后的多媒体数据包进行储存。
CN202010527696.9A 2020-06-04 2020-06-04 一种多媒体数据采集方法 Pending CN111708902A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010527696.9A CN111708902A (zh) 2020-06-04 2020-06-04 一种多媒体数据采集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010527696.9A CN111708902A (zh) 2020-06-04 2020-06-04 一种多媒体数据采集方法

Publications (1)

Publication Number Publication Date
CN111708902A true CN111708902A (zh) 2020-09-25

Family

ID=72540183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010527696.9A Pending CN111708902A (zh) 2020-06-04 2020-06-04 一种多媒体数据采集方法

Country Status (1)

Country Link
CN (1) CN111708902A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113239041A (zh) * 2021-05-13 2021-08-10 大连交通大学 一种计算机大数据处理的采集系统及方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106161873A (zh) * 2015-04-28 2016-11-23 天脉聚源(北京)科技有限公司 一种视频信息提取推送方法及系统
CN106340291A (zh) * 2016-09-27 2017-01-18 广东小天才科技有限公司 一种双语字幕制作方法及系统
US20180005037A1 (en) * 2016-06-29 2018-01-04 Cellular South, Inc. Dba C Spire Wireless Video to data
CN108924583A (zh) * 2018-07-19 2018-11-30 腾讯科技(深圳)有限公司 视频文件生成方法及其设备、系统、存储介质
CN109870706A (zh) * 2019-01-31 2019-06-11 深兰科技(上海)有限公司 一种路面标识的检测方法、装置、设备及介质
CN110475159A (zh) * 2018-05-10 2019-11-19 中兴通讯股份有限公司 多媒体信息的传输方法及装置、终端
CN110598217A (zh) * 2019-09-19 2019-12-20 广东小天才科技有限公司 一种点读内容的识别方法、装置、家教机及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106161873A (zh) * 2015-04-28 2016-11-23 天脉聚源(北京)科技有限公司 一种视频信息提取推送方法及系统
US20180005037A1 (en) * 2016-06-29 2018-01-04 Cellular South, Inc. Dba C Spire Wireless Video to data
CN106340291A (zh) * 2016-09-27 2017-01-18 广东小天才科技有限公司 一种双语字幕制作方法及系统
CN110475159A (zh) * 2018-05-10 2019-11-19 中兴通讯股份有限公司 多媒体信息的传输方法及装置、终端
CN108924583A (zh) * 2018-07-19 2018-11-30 腾讯科技(深圳)有限公司 视频文件生成方法及其设备、系统、存储介质
CN109870706A (zh) * 2019-01-31 2019-06-11 深兰科技(上海)有限公司 一种路面标识的检测方法、装置、设备及介质
CN110598217A (zh) * 2019-09-19 2019-12-20 广东小天才科技有限公司 一种点读内容的识别方法、装置、家教机及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113239041A (zh) * 2021-05-13 2021-08-10 大连交通大学 一种计算机大数据处理的采集系统及方法

Similar Documents

Publication Publication Date Title
CN107766371B (zh) 一种文本信息分类方法及其装置
US9384389B1 (en) Detecting errors in recognized text
US11966404B2 (en) Media names matching and normalization
TWI752455B (zh) 圖像分類模型訓練方法、影像處理方法、資料分類模型訓練方法、資料處理方法、電腦設備、儲存媒介
CN108363701B (zh) 命名实体识别方法及系统
CN106816151B (zh) 一种字幕对准方法及装置
CN109508458A (zh) 法律实体的识别方法及装置
CN111078979A (zh) 一种基于ocr和文本处理技术识别网贷网站的方法及系统
WO2022267454A1 (zh) 分析文本的方法、装置、设备及存储介质
CN111708902A (zh) 一种多媒体数据采集方法
CN112951233A (zh) 语音问答方法、装置、电子设备及可读存储介质
CN112256849A (zh) 模型训练方法、文本检测方法、装置、设备和存储介质
CN110737770B (zh) 文本数据敏感性识别方法、装置、电子设备及存储介质
CN106162328A (zh) 一种视频同步信息展示方法及系统
CN111611774A (zh) 一种运维操作指令安全分析方法、系统及存储介质
CN113609864B (zh) 一种基于工业控制系统的文本语义识别处理系统及方法
CN110941703A (zh) 一种基于机器学习和模糊规则的集成简历信息抽取方法
CN113569005B (zh) 一种基于数据内容的大规模数据特征智能化提取方法
CA2313496A1 (en) Method of standardizing address data
CN115203474A (zh) 一种数据库自动分类提取技术
CN113947066A (zh) 基于asr的文本比对方法、装置、电子设备及存储介质
CN109344155B (zh) 木材测量信息自动记录方法、装置、电子设备及存储介质
CN113157960A (zh) 相似数据获取的方法及装置、电子设备和计算机可读存储介质
Sheridan et al. Defacing music scores for improved recognition
Li et al. A retrieval system of vehicles based on recognition of license plates

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination