CN113742411B - 一种信息获取方法、装置、系统和计算机可读存储介质 - Google Patents

一种信息获取方法、装置、系统和计算机可读存储介质 Download PDF

Info

Publication number
CN113742411B
CN113742411B CN202111040268.4A CN202111040268A CN113742411B CN 113742411 B CN113742411 B CN 113742411B CN 202111040268 A CN202111040268 A CN 202111040268A CN 113742411 B CN113742411 B CN 113742411B
Authority
CN
China
Prior art keywords
audio
information
video data
data
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111040268.4A
Other languages
English (en)
Other versions
CN113742411A (zh
Inventor
王微
崔海悦
刘江
解斐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN202111040268.4A priority Critical patent/CN113742411B/zh
Publication of CN113742411A publication Critical patent/CN113742411A/zh
Application granted granted Critical
Publication of CN113742411B publication Critical patent/CN113742411B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Multimedia (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请公开了一种信息获取方法、装置、系统和计算机可读存储介质,该方法包括:获取音视频数据,对音视频数据进行分析,得到结构化信息;对结构化信息进行展示。通过上述方式,本申请能够满足用户快速获取重点信息的需求。

Description

一种信息获取方法、装置、系统和计算机可读存储介质
技术领域
本申请涉及信息处理技术领域,具体涉及一种信息获取方法、装置、系统和计算机可读存储介质。
背景技术
随着互联网技术的蓬勃发展,多媒体音视频信息的传播呈现了爆发式的增长;目前可以通过文本分类引擎,获取新闻中的主要话题,并通过基于机器学习的方法来判断该新闻是否为高价值新闻,但受限于语言的互通和音视频信息的浏览效率,使用不便。
发明内容
本申请提供一种信息获取方法、装置、系统和计算机可读存储介质,能够满足用户快速获取重点信息的需求。
为解决上述技术问题,本申请采用的技术方案是:提供一种信息获取方法,该方法包括:获取音视频数据,对音视频数据进行分析,得到结构化信息;对结构化信息进行展示。
为解决上述技术问题,本申请采用的另一技术方案是:提供一种信息获取装置,该信息获取装置包括互相连接的存储器和处理器,其中,存储器用于存储计算机程序,计算机程序在被处理器执行时,用于实现上述技术方案中的信息获取方法。
为解决上述技术问题,本申请采用的另一技术方案是:提供一种信息获取装置,该信息获取装置包括:采集模块、处理模块以及显示模块,采集模块用于获取音视频数据;处理模块与采集模块连接,用于对音视频数据进行分析,得到结构化信息;显示模块与处理模块连接,用于对结构化信息进行展示。
为解决上述技术问题,本申请采用的另一技术方案是:提供一种信息获取系统,该信息获取系统包括辅助平台,辅助平台用于获取音视频数据,对音视频数据进行分析,得到结构化信息;对结构化信息进行展示。
为解决上述技术问题,本申请采用的另一技术方案是:提供一种计算机可读存储介质,该计算机可读存储介质用于存储计算机程序,计算机程序在被处理器执行时,用于实现上述技术方案中的信息获取方法。
通过上述方案,本申请的有益效果是:先获取音视频数据,然后对音视频数据进行分析生成结构化信息,再对结构化信息进行展示,能够对音视频数据中的关键信息进行抽取,满足用户快速获取音视频数据中重点信息的需求。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
图1是本申请提供的信息获取方法一实施例的流程示意图;
图2是本申请提供的信息获取方法另一实施例的流程示意图;
图3是本申请提供的信息获取装置一实施例的结构示意图;
图4是本申请提供的信息获取装置另一实施例的结构示意图;
图5是本申请提供的信息获取系统一实施例的结构示意图;
图6是本申请提供的计算机可读存储介质一实施例的结构示意图。
具体实施方式
下面结合附图和实施例,对本申请作进一步的详细描述。特别指出的是,以下实施例仅用于说明本申请,但不对本申请的范围进行限定。同样的,以下实施例仅为本申请的部分实施例而非全部实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
需要说明的是,本申请中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了能够更好地掌握各种新闻,可以基于多媒体的多语种识别与翻译技术,建设一套多语种、跨渠道、高价值的信息获取系统,对全球多媒体信息进行处理和分析,同时可按照不同关注点进行自定义配置,从而提供及时、全面以及个性化的高价值信息服务,下面对本申请所提供的技术方案进行说明。
请参阅图1,图1是本申请提供的信息获取方法一实施例的流程示意图,该方法包括:
步骤11:获取音视频数据,并对音视频数据进行分析,得到结构化信息。
对音视频数据进行抽取处理,生成结构化信息;和/或将音视频数据转写成第一文本数据,并对第一文本数据进行抽取处理,生成结构化信息;具体地,抽取处理可采用相关技术中的数据/数据抽取技术实现。
在一具体的实施例中,对于获取到的音视频数据,可以采用机器学习的相关算法对该音视频数据进行特征提取、去重、过滤低价值信息、分类/聚类或结构化抽取等处理,生成结构化信息,实现自动分析出音视频数据中的高价值信息。
进一步地,结构化信息包括摘要信息,该摘要信息可以与人物进行链接,生成事件的标签信息,形成人物观点,标签信息包括新闻关键词标签,可以提取音视频数据中的时间、人物或事件等关键词汇,形成标签信息。
在其他实施例中,还可采用以下方案来方便用户方便、快速地了解各种新闻:
1)将音视频数据转写成第一文本数据。
可以从互联网实时获取不同的视频发布者发布的音视频数据,还可获取该音视频数据的发布时间,实现通过不同渠道获取不同来源的音视频数据,该音视频数据包括音频数据与视频数据。在获取到音视频数据之后,可以采用相关技术中的语音识别、图像识别或音/视频转写技术对音视频数据进行处理,以便将音频数据与视频数据转成相应的文字(即第一文本数据)。
2)对第一文本数据进行翻译处理,得到第一目标文本数据。
在获取到第一文本数据后,使用机器翻译算法对第一文本数据进行处理,生成第一目标文本数据,该第一目标文本数据可以包括音视频数据对应的文本信息或说话人的身份信息等,第一目标文本数据的语言为预设语言,预设语言为预先设置的语言,其可以为用户设置的语言类型或默认的语言类型;例如,用户可设置为用中文显示文字信息,或者建立地区与语言类型之间的对应关系,当检测到地区之后,将获取到的地区与对应关系相匹配,自动找到相适配的语言类型。
可以理解地,第一目标文本数据还包括与文本信息对应的时间信息,即每个文字对应的时间戳,因此可以根据第一目标文本数据中的文本信息重新定位至音视频数据中的相应位置,以便满足部分用户想要回放重听一次的需求。
3)将结构化信息与音视频数据的时间信息进行关联,以使得在获取到查询词后定位至音视频数据中与查询词匹配的时间位置。
在生成结构化信息之后,建立音视频数据的时间信息与结构化信息之间的联系,得到关联关系;当接收到用户输入的查询指令后,获取该查询指令中携带的查询词,该查询词与结构化信息中的某一信息相关联或至少部分相同,因此通过将查询词能够直接找到与该查询词相匹配的时间信息,使得音视频数据能够直接跳转至该时间信息所在的位置。例如,假设某一视频数据中结构化信息包括人物A的观点以及人物B的观点,与人物A的观点对应的时间信息为第T1秒,与人物B的观点对应的时间信息为第T2秒,查询词为人物A,则视频数据的播放开始时间直接跳转至第T1秒。
步骤12:对结构化信息进行展示。
在对当前获取到的音视频数据进行分析处理,生成相应的结构化信息后,可以将该结构化信息展示出来,比如:可以按人物时间进行展示,或者按事件标签时间展示,以方便用户查看。
在其他具体的实施例中,还可以考虑收集包括文本在内的全部新闻,并不限于音视频数据,比如:按照预设时间间隔获取音视频数据与第二文本数据;然后对第二文本数据进行翻译处理,得到第四目标文本数据,该第四目标文本数据的语言也为预设语言;然后对结构化信息与第一目标文本数据进行展示。可以理解地,在某些情况下,用户可能无法用眼阅读文字信息,因此为了方便用户使用,还可利用预设语言对第一目标文本数据与第四目标文本数据进行播报。
本实施例提供了一种处理互联网跨渠道数据、自动生成智能简报的方法,对重点关注的网站进行数据抓取,通过语种识别、语音识别和翻译技术,将多语种的音视频数据和文本数据转化为用预设语言显示的文本,支持多语种音视频数据到预设语言的文本数据的转换;而且可对音视频数据中的关键信息进行抽取,满足用户想要快速定位至音视频数据中重点信息的需求,实现智能检索,方便用户使用。
请参阅图2,图2是本申请提供的信息获取方法另一实施例的流程示意图,该方法包括:
步骤21:获取音视频数据,并将音视频数据转写成第一文本数据。
步骤22:对第一文本数据进行翻译处理,得到第一目标文本数据。
步骤21-步骤22与上述实施例中采用的方案相同,在此不再赘述。
步骤23:对第一目标文本数据进行去重处理,得到第二目标文本数据。
在获取到第一目标文本数据后,通过文本分类引擎对该第一目标文本数据进行分类处理,提取出第一目标文本数据中高价值的信息,并对提取出来的高价值信息进行去重,得到第二目标文本数据。
步骤24:对第二目标文本数据进行过滤处理,得到第三目标文本数据。
在获取到第二目标文本数据后,采用现有技术中的文本过滤方法对第二目标文本数据进行过滤处理,得到过滤后的文本数据(即第三目标文本数据),即去除第二目标文本数据中的无效信息或低价值的信息。
步骤25:对第三目标文本数据进行聚类/分类,得到划分结果。
采用文本分类方法或文本聚类方法对第三目标文本数据进行处理,得到划分结果,该划分结果包括至少一个聚类簇,每个聚类簇包含同一类型的文本信息,实现多种类型的数据信息的分类,比如:分成政治、财经、教育、娱乐或科技等类型的文本信息。
步骤26:对划分结果进行结构化抽取处理,得到结构化信息。
在获取到划分结果后,对于每个聚类簇均进行结构化抽取处理,以进一步筛选出重要的信息,生成结构化信息,该结构化信息包括摘要信息与标签信息。
在一具体的实施例中,可对音视频数据进行分析,得到标签信息;具体地,音视频数据包括语音、声纹、字幕或图像,对音视频数据进行说话人或话题等多维标签的自动标记,即标签信息包括音视频数据中说话人的信息或事件标签,通过对多源音视频数据中蕴含的多模态内容(比如:语音、声纹、字幕或画面等)进行智能分析(例如:人脸识别、手势识别或声纹识别等),实现音视频数据到结构化信息(比如:人物或话题等)的标签转换,并提供智能化辅助。进一步地,可对音视频数据对应的第四目标文本数据进行智能分析,去除冗余及低价值信息,自动形成摘要信息,辅助阅读;例如,通过文本分类引擎获取音视频数据中的主要话题,并通过有监督学习与无监督学习相结合的方式来判断该音视频数据中的信息是否为高价值信息,不符合高价值定义的数据便不进行展示,实现自动筛选人物和话题,并对内容进行标记,方便后续可触发快速定位。
在获取到标签信息之后,可以基于标签信息对音视频数据进行分割,得到至少两个音视频段,通过对标签信息的分析,标记出不同的关键词,实现了对音视频数据的智能分段;还可把每个说话人的视频整合到一起,实现说话人的自动切分,方便后续快速、精准查看及智能检索。
步骤27:建立事件标签与音视频数据中事件标签出现的时间之间的对应关系。
将事件标签与音视频数据中事件标签出现的时刻进行关联,建立二者之间的对应关系,得到对应表;具体地,事件标签包括多个标签,该对应表包括每个标签以及与该标签对应的时间,多个标签包括人物、话题、时间或关键词,话题包括事件或音视频数据/文本数据中出现频率较高的词语。
步骤28:在接收到操作指令后,基于操作指令与对应关系,调整音视频数据的播放开始时间。
操作指令包括查询指令,在接收到查询指令后,将查询指令携带的查询词与对应关系进行匹配,以使得音视频数据的播放开始时间跳转至与查询词对应的时间。
在接收到用户输入的查询指令后,对该查询指令进行解析,得到该查询指令中携带的查询词,该查询词可以与标签部分相同;然后将该查询词与对应表匹配,得到与该查询词对应的时间,以便用户打开音视频数据时,播放开始时间为与查询词相匹配的时间,即直接跳转至用户直接想要看的位置。
在其他实施例中,操作指令还可包括点击指令,响应于接收到点击指令(比如:用户在页面上点击相关视频的事件标签),将点击指令对应的事件标签与对应关系进行匹配,以使得音视频数据的播放开始时间跳转至与查询词对应的时间。
步骤29:对结构化信息进行展示。
可按照音视频数据中话题的类别或时间,对结构化信息进行展示;或者在接收到配置指令后,按照配置指令对结构化信息进行展示,支持按照版块或时间等维度进行结构化信息的可视化展现。
还可以在接收到音视频查看指令后,在显示界面上显示与音视频查看指令对应的音视频数据,即支持用户通过点击显示屏上的相应位置,进行原音视频数据的精准定位和查看。
上述方案能够支持多语种互联网音视频数据到预设语言的文本数据的转换,可以作为传统文本信息的有效补充,打破语言壁垒,提升数据来源的完整性,并可以针对政治、财经或科技等不同领域的信息进行针对优化,为后续的分析奠定基础,比如:对不同领域的历史大数据进行分析和引擎训练,从而实现机器学习;同时,变听为看,提升高价值信息的发现效率,节省用户查看新闻花费的时间。
在另一具体的实施例中,还可按照话题的类别对不同的音视频数据进行关联;通过对音视频内容的深度分析,能够自动形成人物关联知识图谱,挖掘价值信息源头与分析人物关系链,实现人物关联分析。在检测到新的音视频数据中存在与话题相同的话题后,生成推送信息;通过内容关联与智能推荐,自动推送与该音视频数据相关的信息,方便追踪了解音视频数据的相关背景或事件发展历程等,实现关联信息推送。
在另一具体的实施例中,还可构建话题、人物以及组织机构之间的数据库;然后在获取到新的音视频数据后,提取出新的音视频数据中的话题、人物以及组织机构,以对数据库进行更新,能够实时发现与音视频数据相关的关键词条,并自动提示,以类似百科词典的形式展示,辅助用户查阅相关背景知识,实现一键查阅的功能。
在其他具体的实施例中,针对持有移动终端(比如:手机或平板)的用户跨语言浏览网页的需求,开发高价值简报应用程序(Application,APP),帮助该用户理解页面文本内容及跨语言沟通交流,该简报APP可以实现:
(1)按人物、话题、时间或关键词等进行组合式检索,智能定位到音视频数据中的相关位置,且支持按照版块或时间等维度进行处理结果的可视化展现;依托于音视频数据的处理和结构化标签体系,满足对海量信息按照多种关键词及关键词组合进行多维度智能检索的需求;还可结合智能分段和音视频数据自动切分,实现对所检索的音视频数据的快速查看。
(2)定时形成每日概览和热点实时推送
A.每日概览
支持对过去24小时的全球多语种信息进行智能分析、信息聚合、智能去重以及智能排序;并可以基于预定义的个人配置,实现个性化的每日概览,帮助用户快速了解全球中的各种新闻,并支持通过点击进行原音视频数据的精准定位和查看;同时,还可按照不同场景下的浏览需求,形成极简版、标准版或详细版等不同浏览时长的版本。
B.人物言论跟踪
先按照时间顺序对与预设人物相关的音视频数据进行跟踪,生成跟踪数据;然后对跟踪数据进行分析,得到预设人物的观点信息,实现对特定人物言论和其被提及的言论的整合。
C.人物观点态势
在人物言论跟踪的基础上,面向特定话题,可以根据新闻中的关键词关联跟踪人物观点,实现特定人物的观点态势分析。
D.人物关联分析
通过对音视频数据的深度分析,自动形成人物关联知识图谱,挖掘价值信息源头、分析人物关系链。
E.重点话题关联分析
针对重点话题,自动关联、汇聚以及整合各方言论,并进行可视化展示,方便用户快速了解重点话题发展态势。
F.热点实时推送
支持热点新闻的实时推送,用户可以通过配置关注的事件及人物,实现精准的个性化推送。
本实施例所提供的技术方案能够对多源音视频数据中蕴含的语音、声纹、字幕或画面等信息进行智能分析,实现音视频数据到结构化信息的转换,并提供智能化辅助,方便用户快速了解音视频数据中的相关内容;还能够按人物、话题、时间或关键词等进行组合式检索,智能定位到音视频数据中的相关位置;而且支持按照版块或时间等维度进行结果的可视化展现,方便用户观看。
请参阅图3,图3是本申请提供的信息获取装置一实施例的结构示意图,信息获取装置30包括互相连接的存储器31和处理器32,存储器31用于存储计算机程序,计算机程序在被处理器32执行时,用于实现上述实施例中的信息获取方法。
请参阅图4,图4是本申请提供的信息获取装置另一实施例的结构示意图,信息获取装置40包括:采集模块41、处理模块42以及显示模块43。
采集模块41用于获取音视频数据。
处理模块42与采集模块41连接,其用于对音视频数据进行识别处理,得到第一文本数据;对第一文本数据进行翻译处理,得到第一目标文本数据,第一目标文本数据的语言为预设语言;对音视频数据进行分析,得到结构化信息;将结构化信息与音视频数据的时间信息进行关联,以使得在获取到查询词后定位至音视频数据中与查询词匹配的时间位置。
显示模块43与处理模块42连接,其用于对结构化信息进行展示。
请参阅图5,图5是本申请提供的信息获取系统一实施例的结构示意图,信息获取系统50包括互相连接的语音服务平台51与辅助平台52。
语音服务平台51用于对辅助平台52获取的音视频数据进行识别处理得到第一文本数据,并对第一文本数据进行翻译处理得到第一目标文本数据,第一目标文本数据的语言为预设语言。
在一具体的实施例中,语音服务平台51搭建在云端服务器上,语音服务平台51主要包含接入管理、集群管理以及引擎服务,接入管理作为外部调用统一入口,其包括能力调度、负载均衡、租户管理和权限管理四个模块,能力调度模块用于对语音识别、语音合成或机器翻译等核心能力进行统一管控/调度,保障用户大量并发的服务支撑,确保性能稳定。集群管理采用多地大规模分布式服务器,为所有应用提供技术能力和稳定性保障。引擎服务将语音识别、语音合成或机器翻译等核心引擎封装成相应网络服务部署在云端平台,接受应用方(比如:辅助平台52)的管理调度,实现对用户需求的响应。
辅助平台52还用于对音视频数据进行分析,得到结构化信息;将结构化信息与音视频数据的时间信息进行关联,以使得在获取到查询词后定位至音视频数据中与查询词匹配的时间位置;对结构化信息进行展示。
在一具体的实施例中,辅助平台52对网页上的音视频数据及文本数据进行爬取,调用语音服务平台51,完成语音识别、文本翻译或语音播报等功能,解决用户在浏览网页音/视频及文本时因语言不通带来的理解障碍,提供浏览效率。进一步地,考虑到用户使用的便捷性,辅助平台52以浏览器插件的形式实现,不改变用户原有的使用习惯,能够快速完成音视频数据及文本数据的转换工作,转换成用户能够理解的语言,方便用户使用。
继续参阅图5,信息获取系统50还包括一应用程序平台53,其与辅助平台52连接,帮助持有移动终端的用户理解页面文本内容,满足用户跨语言浏览网页的需求,该应用程序平台53与上述实施例中简报APP相同,在此不再赘述。
本实施例提供了一套多语种、跨渠道、高价值的简报系统,其包含语音服务平台、辅助平台以及应用程序平台,能够实现不同语种的音视频数据的识别以生成文本数据,将文本数据自动翻译成用户需要的语言;并且可针对每个音视频数据中的关键信息进行识别和定位,满足用户快速获取重点信息的需求。
请参阅图6,图6是本申请提供的计算机可读存储介质一实施例的结构示意图,计算机可读存储介质60用于存储计算机程序61,计算机程序61在被处理器执行时,用于实现上述实施例中的信息获取方法。
计算机可读存储介质60可以是服务端、U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本申请所提供的几个实施方式中,应该理解到,所揭露的方法以及设备,可以通过其它的方式实现。例如,以上所描述的设备实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (11)

1.一种信息获取方法,其特征在于,包括:
获取音视频数据,对所述音视频数据进行分析,得到结构化信息;
对所述结构化信息进行展示;
将所述结构化信息与所述音视频数据的时间信息进行关联,以使得在获取到查询词后定位至所述音视频数据中与所述查询词匹配的时间位置;
所述结构化信息包括摘要信息与标签信息,所述方法还包括:
对所述音视频数据进行分析,得到所述标签信息,所述音视频数据包括语音、声纹、字幕或图像,所述标签信息包括所述音视频数据中说话人的信息或事件标签;基于所述标签信息对所述音视频数据进行分割,得到至少两个音视频段;
其中,所述方法还包括:
按照时间顺序对与预设人物相关的音视频数据进行跟踪,生成跟踪数据;
对所述跟踪数据进行分析,得到所述预设人物的观点信息;
基于特定话题的关键词与所述预设人物的观点信息进行关联,以对所述预设人物的观点态势进行跟踪分析;
所述事件标签包括话题,所述方法还包括:
按照所述话题的类别对不同的所述音视频数据进行关联;
在检测到新的音视频数据中存在与所述话题相同的话题后,生成推送信息。
2.根据权利要求1所述的信息获取方法,其特征在于,所述对所述音视频数据进行分析,得到结构化信息的步骤,包括:
对所述音视频数据进行抽取处理,生成所述结构化信息;和/或
将所述音视频数据转写成第一文本数据,并对所述第一文本数据进行抽取处理,生成所述结构化信息。
3.根据权利要求2所述的信息获取方法,其特征在于,所述方法还包括:
对所述第一文本数据进行翻译处理,得到第一目标文本数据,所述第一目标文本数据的语言为预设语言。
4.根据权利要求3所述的信息获取方法,其特征在于,所述对所述第一文本数据进行抽取处理,生成所述结构化信息的步骤,包括:
对所述第一目标文本数据进行去重处理,得到第二目标文本数据;
对所述第二目标文本数据进行过滤处理,得到第三目标文本数据;
对所述第三目标文本数据进行聚类/分类,得到划分结果;
对所述划分结果进行结构化抽取处理,得到所述结构化信息。
5.根据权利要求1所述的信息获取方法,其特征在于,所述将所述结构化信息与所述音视频数据的时间信息进行关联,以使得在获取到查询词后定位至所述音视频数据中与所述查询词匹配的时间位置的步骤,包括:
建立所述事件标签与所述音视频数据中事件标签出现的时间之间的对应关系,所述事件标签还包括人物、时间或关键词;
在接收到操作指令后,基于所述操作指令与所述对应关系,调整所述音视频数据的播放开始时间。
6.根据权利要求5所述的信息获取方法,其特征在于,所述操作指令包括查询指令或点击指令,所述基于所述操作指令与所述对应关系,调整所述音视频数据的播放开始时间的步骤,包括:
响应于接收到查询指令,将所述查询指令携带的查询词与所述对应关系进行匹配,以使得所述音视频数据的播放开始时间跳转至与所述查询词对应的时间;或者
响应于接收到所述点击指令,将所述点击指令对应的事件标签与所述对应关系进行匹配,以使得所述音视频数据的播放开始时间跳转至与所述查询词对应的时间。
7.根据权利要求6所述的信息获取方法,其特征在于,所述方法还包括:
构建所述话题、所述人物以及组织机构之间的数据库;
在获取到新的音视频数据后,提取出所述新的音视频数据中的话题、人物以及组织机构,以对所述数据库进行更新。
8.根据权利要求6所述的信息获取方法,其特征在于,所述方法还包括:
按照所述音视频数据中话题的类别或所述时间,对所述结构化信息进行展示,或者在接收到配置指令后,按照所述配置指令对所述结构化信息进行展示;
在接收到音视频查看指令后,在显示界面上显示与所述音视频查看指令对应的音视频数据。
9.根据权利要求3所述的信息获取方法,其特征在于,所述方法还包括:
按照预设时间间隔获取所述音视频数据与第二文本数据;
对所述第二文本数据进行翻译处理,得到第四目标文本数据,所述第四目标文本数据的语言为所述预设语言;
对所述结构化信息与所述第一目标文本数据进行展示;
利用所述预设语言对所述第一目标文本数据与所述第四目标文本数据进行播报。
10.一种信息获取装置,其特征在于,包括互相连接的存储器和处理器,其中,所述存储器用于存储计算机程序,所述计算机程序在被所述处理器执行时,用于实现权利要求1-9中任一项所述的信息获取方法。
11.一种计算机可读存储介质,用于存储计算机程序,其特征在于,所述计算机程序在被处理器执行时,用于实现权利要求1-9中任一项所述的信息获取方法。
CN202111040268.4A 2021-09-06 2021-09-06 一种信息获取方法、装置、系统和计算机可读存储介质 Active CN113742411B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111040268.4A CN113742411B (zh) 2021-09-06 2021-09-06 一种信息获取方法、装置、系统和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111040268.4A CN113742411B (zh) 2021-09-06 2021-09-06 一种信息获取方法、装置、系统和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113742411A CN113742411A (zh) 2021-12-03
CN113742411B true CN113742411B (zh) 2024-05-31

Family

ID=78736220

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111040268.4A Active CN113742411B (zh) 2021-09-06 2021-09-06 一种信息获取方法、装置、系统和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113742411B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107147949A (zh) * 2017-05-05 2017-09-08 中广热点云科技有限公司 一种直播时移的播放进度操控方法及系统
CN109145152A (zh) * 2018-06-28 2019-01-04 中山大学 一种基于查询词的自适应智能生成图文视频缩略图方法
CN109274831A (zh) * 2018-11-01 2019-01-25 科大讯飞股份有限公司 一种语音通话方法、装置、设备及可读存储介质
CN111859195A (zh) * 2020-07-31 2020-10-30 北京字节跳动网络技术有限公司 一种信息展示方法、信息搜索方法及装置
CN113343108A (zh) * 2021-06-30 2021-09-03 中国平安人寿保险股份有限公司 推荐信息处理方法、装置、设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150314454A1 (en) * 2013-03-15 2015-11-05 JIBO, Inc. Apparatus and methods for providing a persistent companion device
CN109241330A (zh) * 2018-08-20 2019-01-18 北京百度网讯科技有限公司 用于识别音频中的关键短语的方法、装置、设备和介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107147949A (zh) * 2017-05-05 2017-09-08 中广热点云科技有限公司 一种直播时移的播放进度操控方法及系统
CN109145152A (zh) * 2018-06-28 2019-01-04 中山大学 一种基于查询词的自适应智能生成图文视频缩略图方法
CN109274831A (zh) * 2018-11-01 2019-01-25 科大讯飞股份有限公司 一种语音通话方法、装置、设备及可读存储介质
CN111859195A (zh) * 2020-07-31 2020-10-30 北京字节跳动网络技术有限公司 一种信息展示方法、信息搜索方法及装置
CN113343108A (zh) * 2021-06-30 2021-09-03 中国平安人寿保险股份有限公司 推荐信息处理方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A P2P streaming architecture supporting scalable media;Cruz, RS 等;《PEER-TO-PEER NETWORKING AND APPLICATIONS》;20150826;758-776 *
音视频图片信息识别监测技术研究;淡婷;;信息记录材料;20200601(06);93-94 *

Also Published As

Publication number Publication date
CN113742411A (zh) 2021-12-03

Similar Documents

Publication Publication Date Title
US11960526B2 (en) Query response using media consumption history
CN105677735B (zh) 一种视频搜索方法及装置
US10192544B2 (en) Method and system for constructing a language model
CN110430476B (zh) 直播间搜索方法、系统、计算机设备和存储介质
US20080201314A1 (en) Method and apparatus for using multiple channels of disseminated data content in responding to information requests
US20050038814A1 (en) Method, apparatus, and program for cross-linking information sources using multiple modalities
US20110087703A1 (en) System and method for deep annotation and semantic indexing of videos
KR20160107187A (ko) 검색 결과에서의 논리적인 질문 응답 기법
CN109558513B (zh) 一种内容推荐方法、装置、终端及存储介质
JP2013541793A (ja) マルチモード検索クエリー入力手法
US10216989B1 (en) Providing additional information for text in an image
Ang et al. LifeConcept: an interactive approach for multimodal lifelog retrieval through concept recommendation
KR101651963B1 (ko) 시공간 연관 정보 생성 방법, 이를 수행하는 시공간 연관 정보 생성 서버 및 이를 저장하는 기록매체
CN113407775B (zh) 视频搜索方法、装置及电子设备
Lian Innovative Internet video consuming based on media analysis techniques
Metze et al. Beyond audio and video retrieval: topic-oriented multimedia summarization
CN115827882A (zh) 一种基于多模态旅游大数据的知识图谱构建方法
CN110008314B (zh) 一种意图解析方法及装置
KR20220130863A (ko) 음성-텍스트 변환 영상 리소스 매칭 기반 멀티미디어 변환 콘텐츠 제작 서비스 제공 장치
CN113742411B (zh) 一种信息获取方法、装置、系统和计算机可读存储介质
CN110555202A (zh) 文摘播报的生成方法和设备
JP4755122B2 (ja) 画像辞書生成方法及び装置及びプログラム
Phang et al. Tools and technologies for enhancing access to audiovisual archives: The Singapore journey
CN111601164A (zh) 一种智能电视新闻推送方法及系统
CN111274960A (zh) 视频的处理方法、装置、存储介质和处理器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant