CN112612912A - 自动生成电影封面墙的方法和系统 - Google Patents

自动生成电影封面墙的方法和系统 Download PDF

Info

Publication number
CN112612912A
CN112612912A CN202110014460.XA CN202110014460A CN112612912A CN 112612912 A CN112612912 A CN 112612912A CN 202110014460 A CN202110014460 A CN 202110014460A CN 112612912 A CN112612912 A CN 112612912A
Authority
CN
China
Prior art keywords
media file
movie
name
character string
splicing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110014460.XA
Other languages
English (en)
Inventor
余锋
金凌琳
林晗
王超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dangqu Network Technology Hangzhou Co Ltd
Original Assignee
Dangqu Network Technology Hangzhou Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dangqu Network Technology Hangzhou Co Ltd filed Critical Dangqu Network Technology Hangzhou Co Ltd
Priority to CN202110014460.XA priority Critical patent/CN112612912A/zh
Publication of CN112612912A publication Critical patent/CN112612912A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

本申请涉及一种自动生成电影封面墙的方法和系统,其中,该自动生成电影封面墙的方法包括:获取本地媒体文件的文件名称,将该文件名称拆解为各元素,并拼接各元素,得到拼接字符串,其中,该拼接字符串包括媒体文件名称、版本信息和媒体文件集数,接着检测拼接字符串中的媒体文件名称是否有中文,在检测有中文的情况下,将中文翻译为拼音,得到最终的拼接字符串,最后通过最终的拼接字符串搜索与本地媒体文件对应的电影元数据,将该电影元数据作为本地媒体文件的电影封面墙。通过本申请,提高了信息提取准确率和封面墙匹配率。

Description

自动生成电影封面墙的方法和系统
技术领域
本申请涉及计算机领域,特别是涉及自动生成电影封面墙的方法和系统。
背景技术
随着信息技术的快速发展,多媒体技术也在不断的进步,基于人们对多媒体影音娱乐的要求越来越高,传统的影音播放形式已不能满足现代人的需求,如用户将存放有视频资源移动硬盘,U盘等外接存储设备接入到电视、电脑和投影仪等客户端,通过客户端播放器进行影片视频的播放,这样的播放形式会让列表内的文件以普通媒体文件的形式向用户展现,用户使用体验感并不好。
因此,为了解决这一问题,相关技术已公开了一种动态生成电影封面墙的方法及系统,其通过扫描媒体文件的相关信息,并在客户端内建立媒体库,寻找媒体库内与存储设备内对应的电影元数据,电影元数据包括电影的封面海报图片,电影主演,电影导演,电影风格信息等,将这些电影元数据以封面墙的形式匹配到外接存储设备的媒体文件上,使得用户在通过客户端浏览外接存储设备的媒体文件时,媒体文件以海报的形式向用户展现,并给用户提供多样的电影元数据。
然而,在实际使用过程中,用户存放在存储设备的媒体文件在很多情况下,其命名格式各样,客户端在扫描这些媒体文件时,无法很好的提取到有用的信息,经常提取一些错误的信息,从而导致后续的匹配出现错误,使得客户端给配置的封面墙与媒体文件的实际内容对应不上,如此反而给用户使用造成了困扰。
另一方面,目前的客户端在扫描提取存储设备内的媒体文件时,提取的只是媒体文件的名称,例如用户在存储设备内的媒体资源为电影时,提取的是电影的名称,通过获得电影名称,去媒体库或者互联网上寻找对应电影名称的电影元数据。然而,在很多情况下,相同的电影名称的电影不在少数,其电影元数据各不相同,系统无法准确的给该电影配上相应的电影元数据,例如,用户存储资源内的媒体文件为动画片《花木兰》,客户端在本地媒体库搜索“花木兰”时,回有若干个电影资源,很有可能将真人电影或者电视剧花木兰的海报等电影元数据给本地文件配上,这样就会出现匹配不准确。
目前针对相关技术中,在给本地媒体文件匹配电影封面墙的情况下,存在的由于信息提取不准确导致搜索到的电影数据与本地文件不匹配的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了自动生成电影封面墙的方法和系统,至少解决相关技术中在给本地媒体文件匹配电影封面墙的情况下,存在的由于信息提取不准确导致搜索到的电影数据与本地文件不匹配的问题。
第一方面,本申请实施例提供了一种自动生成电影封面墙的方法,所述方法包括:
获取本地媒体文件的文件名称;
将所述文件名称拆解为各元素,并拼接所述元素,得到拼接字符串,其中,所述拼接字符串包括媒体文件名称、版本信息和媒体文件集数;
检测所述拼接字符串中的所述媒体文件名称是否有中文,在检测有中文的情况下,将所述中文翻译为拼音,得到最终的拼接字符串;
通过所述最终的拼接字符串搜索与所述本地媒体文件对应的电影元数据,将所述电影元数据作为所述本地媒体文件的电影封面墙。
在其中一些实施例中,所述将所述文件名称拆解为各元素,并拼接所述元素,得到拼接字符串包括:
根据所述文件名称,截取所述版本信息或媒体文件集数前的字符;
将所述字符中的标点符号替换成空格,并拼接所述版本信息或所述媒体文件集数,得到所述拼接字符串。
在其中一些实施例中,在得到拼接字符串之后,所述方法包括:
检测所述拼接字符串中的所述媒体文件名称是否存在中文名称和英文名称;
在检测得到所述中文名称和所述英文名称都存在的情况下,删除所述中文名称,得到最终的拼接字符串。
在其中一些实施例中,通过所述最终的拼接字符串搜索与所述本地媒体文件对应的电影元数据包括:
通过所述最终的拼接字符串中的所述媒体文件名称、所述版本信息和所述媒体文件集数进行分级搜索,得到与所述本地媒体文件对应的电影元数据。
在其中一些实施例中,在通过所述最终的拼接字符串搜索与所述本地媒体文件对应的电影元数据时,搜索到多部同名电影的情况下,所述方法包括:
获取搜索到的所述多部同名电影的电影时长,将所述电影时长与所述本地媒体文件的电影时长进行对比,得到时长偏差;
获取所述时长偏差中最小的电影的电影元数据。
第二方面,本申请实施例提供了一种自动生成电影封面墙的系统,所述系统包括:
获取模块,用于获取本地媒体文件的文件名称;
拼接模块,用于将所述文件名称拆解为各元素,并拼接所述元素,得到拼接字符串,其中,所述拼接字符串包括媒体文件名称、版本信息和媒体文件集数;
检测模块,用于检测所述拼接字符串中的所述媒体文件名称是否有中文,在检测有中文的情况下,将所述中文翻译为拼音,得到最终的拼接字符串;
匹配模块,用于通过所述最终的拼接字符串搜索与所述本地媒体文件对应的电影元数据,将所述电影元数据作为所述本地媒体文件的电影封面墙。
在其中一些实施例中,所述拼接模块还用于根据所述文件名称,截取所述版本信息或媒体文件集数前的字符,
将所述字符中的标点符号替换成空格,并拼接所述版本信息或所述媒体文件集数,得到所述拼接字符串。
在其中一些实施例中,在得到拼接字符串之后,
所述检测模块还用于检测所述拼接字符串中的所述媒体文件名称是否存在中文名称和英文名称;
在检测得到所述中文名称和所述英文名称都存在的情况下,删除所述中文名称,得到最终的拼接字符串。
在其中一些实施例中,所述匹配模块还用于通过所述最终的拼接字符串中的所述媒体文件名称、所述版本信息和所述媒体文件集数进行分级搜索,得到与所述本地媒体文件对应的电影元数据。
在其中一些实施例中,所述匹配模块在通过所述文件拼接名称搜索与所述本地媒体文件对应的电影元数据时,搜索到多部同名电影的情况下,
获取搜索到的所述多部同名电影的电影时长,将所述电影时长与所述本地媒体文件的电影时长进行对比,得到时长偏差;
获取所述时长偏差中最小的电影的电影元数据。
相比于相关技术,本申请实施例提供的一种自动生成电影封面墙的方法,获取本地媒体文件的文件名称;将该文件名称拆解为各元素,并拼接各元素,得到拼接字符串,其中,该拼接字符串包括媒体文件名称、版本信息和媒体文件集数;检测拼接字符串中的媒体文件名称是否有中文,在检测有中文的情况下,将中文翻译为拼音,得到最终的拼接字符串;最后通过最终的拼接字符串搜索与本地媒体文件对应的电影元数据,将该电影元数据作为本地媒体文件的电影封面墙,解决了在给本地媒体文件匹配电影封面墙的情况下,存在的由于信息提取不准确导致搜索到的电影数据与本地文件不匹配的问题,提高了信息提取准确率,使得客户端搜索到的电影封面墙与本地媒体文件相匹配,提高用户体验感。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种自动生成电影封面墙的方法的应用环境示意图;
图2是根据本申请实施例的自动生成电影封面墙方法的流程图;
图3是根据本申请实施例的自动生成电影封面墙系统的结构框图;
图4是根据本申请实施例的电子设备的内部结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指大于或者等于两个。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
本申请提供的自动生成电影封面墙的方法,可以应用于如图1所示的应用环境中,图1是根据本申请实施例的一种自动生成电影封面墙的方法的应用环境示意图,如图1所示,其中,该应用环境的系统包括服务器10和智能设备终端11,其具有实现过程:服务器10获取本地媒体文件的文件名称,将该文件名称拆解为各元素,并拼接各元素,得到拼接字符串,其中,该拼接字符串包括媒体文件名称、版本信息和媒体文件集数,接着检测拼接字符串中的媒体文件名称是否有中文,在检测有中文的情况下,将中文翻译为拼音,得到最终的拼接字符串,最后通过最终的拼接字符串搜索与本地媒体文件对应的电影元数据,将该电影元数据作为本地媒体文件的电影封面墙,显示在智能设备终端11上,解决了在给本地媒体文件匹配电影封面墙的情况下,存在的由于信息提取不准确导致搜索到的电影数据与本地文件不匹配的问题,提高了信息提取准确率,使得客户端搜索到的电影封面墙与本地媒体文件相匹配,提高了匹配率和用户体验感。
本实施例提供了一种自动生成电影封面墙的方法,图2是根据本申请实施例的自动生成电影封面墙方法的流程图,如图2所示,该流程包括如下步骤:
步骤S201,获取本地媒体文件的文件名称,将该文件名称拆解为各元素,并拼接各元素,得到拼接字符串,其中,该拼接字符串包括媒体文件名称、版本信息和媒体文件集数。
可选的,本地媒体文件包括但不限于电影、电视剧等视频资源,用户将存储有本地媒体文件的移动硬盘或U盘等外界存储设备接入电视、电脑和投影仪等智能设备终端11,服务器10获取其中的本地媒体的文件名称,将该文件名称拆解为各元素,并拼接这些元素,得到拼接字符串,其中,该拼接字符串中的元素包括但不限于媒体文件名称、版本信息和媒体文件集数,这些元素用于搜索与本地媒体文件对应的电影元数据。可选的,版本信息包括但不限于媒体文件的发行时间、制作时间等。
在其中一些实施例中,服务器10获取本地媒体的文件名称,将该文件名称拆解为各元素,并拼接这些元素,得到拼接字符串,可以将得到的该拼接字符串作为本地媒体文件的新名称进行替换,得到新的文件名称,但是不妨碍后续通过拼接字符串中的各元素逐级搜索与本地媒体文件对应的电影元数据。
在其中一些实施例中,将文件名称拆解为各元素,并拼接这些各元素,得到拼接字符串包括:根据文件名称,截取版本信息或媒体文件集数前的字符,接着将该字符中的标点符号替换成空格后,将版本信息或媒体文件集数拼接在后面,得到拼接字符串。
优选的,根据文件名称,从前往后,截取版本信息,例如电影发行时间2004,或媒体文件集数,例如国外电视剧集:第一季第一集(S01E01),前面的字符,接着将该字符中的标点符号,如:“.”、“()”等符号替换为空格后,将版本信息或媒体文件集数拼接在后面,得到拼接字符串。例如,获取本地媒体文件的文件名称“The.Day.After.Tomorrow.2004.RERiP.1080P.BluRay.x264.DTS-WiKi”,将该文件名称拆解为各元素,截取版本信息2004前面的字符,即电影文件名称“The.Day.After.Tomorrow.”,接着将该字符中的标点符号“.”替换成空格,得到“The Day After Tomorrow”(末尾是有空格的),然后将版本信息2004拼接在后面,得到拼接字符串“The Day After Tomorrow 2004”(末尾没有空格)。
另一个实施例,获取本地媒体文件的文件名称“Raised.by.Wolves.2020.S01E01.Raised.by.Wolves.1080P.HMAX.WEB-DL.DD5.1.H.264-NGT.mkv”,将该文件名称拆解为各元素,截取媒体文件集数:第一季(S01)前面的字符,即“Raised.by.Wolves.2020.”,接着将该字符中的标点符号“.”替换成空格,得到“Raised by Wolves 2020”(末尾是有空格的),然后将媒体文件集数:第一季(S01)拼接在后面,得到拼接字符串“Raised by Wolves2020S01”(末尾没有空格)。
本实施例通过对文件名称进行元素拆解和拼接,有利于后续通过拼接字符串中的各类不同元素进行逐级搜索与本地媒体文件对应的电影元数据,提高信息提取的准确率。
步骤S202,检测拼接字符串中的媒体文件名称是否有中文,在检测有中文的情况下,将中文翻译为拼音,得到最终的拼接字符串。
可选的,本实施例将检测到的拼接字符串中的有中文的媒体文件名称,翻译为拼音,得到新的拼接字符串进行电影或各类媒体文件的元数据搜索,能有效提高搜索准确率,这主要是由于一些国外的电影或电视剧等媒体文件的名称,许多是音译过来的,且音译成的的中文也会经常有所不同,例如:由玛格丽特·米切尔创作的长篇小说《飘》,经电影改编后,影片名为《乱世佳人》,此外,网络上的一些国内的电影文件或电视剧等媒体文件的名称也可能会出现错别字,而上述这些问题都会导致直接通过中文搜索会出现偏差,无法准确匹配到与本地媒体文件对应的电影或其他媒体文件元数据,然而,将中文翻译为拼音,通过拼音进行搜索匹配,则会有效避免这些问题,提高封面墙的匹配率。
步骤S203,通过最终的拼接字符串搜索与本地媒体文件对应的电影元数据,将电影元数据作为本地媒体文件的电影封面墙,其中,搜索得到的不限于电影元数据,还包括其他媒体文件元数据,将搜索到的对应元数据作为本地媒体文件的封面墙。
优选的,本实施例通过最终的拼接字符串中的媒体文件名称、版本信息和媒体文件集数进行分级搜索,得到与本地媒体文件对应的电影元数据。例如,在搜索查找与本地媒体文件对应的电影元数据时,首先通过拼接字符串中的媒体文件名称,如“The Day AfterTomorrow”,在媒体库和互联网上进行搜索,筛选出多个同名电影时,接着,通过拼接字符串中的版本信息,如“2004”,对筛选到的多个同名电影进行搜索查找,如果还是筛选出多个资源,那么继续通过拼接字符串中的媒体文件集数对多个资源进行对比,寻找匹配资源的电影元数据作为该本地文件的封面墙;
然而,在实际情况下,通过上述分级搜索筛选后,依然存在多部同名电影,以及有些媒体文件,例如电影文件,只有媒体文件名称,并没有版本信息或媒体文件集数等信息的情况下,针对这类媒体文件,可以通过媒体文件时长进行筛选,优选的,本实施例中获取搜索到的多部同名电影的电影时长,将这些电影时长与本地媒体文件的电影时长进行对比,得到时长偏差,最后将时长偏差中最小的电影的电影元数据作为本地媒体文件的电影封面墙。
相比于相关技术中通过提取的单一信息进行电影墙的搜索匹配,本实施例通过拼接字符串中的媒体文件名称、版本信息和媒体文件集数进行分级搜索,并利用时长进行对比,寻找与本地媒体文件对应的电影元数据,能有效提高封面墙的匹配率。
通过上述步骤S201至步骤S203,相对于现有技术中,客户端在扫描本地媒体文件的信息时,无法很好的提取到有用的信息,经常提取一些错误的信息,从而导致后续的匹配出现错误,使得客户端给配置的封面墙与媒体文件的实际内容对应不上的问题。本实施例中服务器10获取本地媒体文件的文件名称,将该文件名称拆解为各元素,并拼接各元素,得到拼接字符串,其中,该拼接字符串包括媒体文件名称、版本信息和媒体文件集数,接着检测拼接字符串中的媒体文件名称是否有中文,在检测有中文的情况下,将中文翻译为拼音,得到最终的拼接字符串,最后通过最终的拼接字符串搜索与本地媒体文件对应的电影元数据,将该电影元数据作为本地媒体文件的电影封面墙,显示在智能设备终端11上,解决了在给本地媒体文件匹配电影封面墙的情况下,存在的由于信息提取不准确导致搜索到的电影数据与本地文件不匹配的问题,提高了信息提取准确率,使得客户端搜索到的电影封面墙与本地媒体文件相匹配,提高了封面墙匹配率和用户体验感。
在其中一些实施例中,在得到拼接字符串之后,检测拼接字符串中的媒体文件名称是否存在中文名称和英文名称,在检测得到中文名称和英文名称都存在的情况下,删除中文名称,得到最终的拼接字符串。
可选的,有些国外的媒体资源的文件名称,例如电影名称,会存在中英文都有的情况,由于通过中文搜索对应的封面墙的匹配率比较低,而且会存在步骤S202中提及的各种问题,因此,在检测到拼接字符串中的媒体文件名称既有中文名称也有英文名称时,直接将中文名称删除,通过英文名称进行搜索匹配,能有效提高匹配率。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例还提供了一种自动生成电影封面墙的系统,该系统用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图3是根据本申请实施例的自动生成电影封面墙系统的结构框图,如图3所示,该系统包括获取模块31、拼接模块32、检测模块33和匹配模块34:
获取模块31,用于获取本地媒体文件的文件名称;拼接模块32,用于将文件名称拆解为各元素,并拼接这些元素,得到拼接字符串,其中,拼接字符串包括媒体文件名称、版本信息和媒体文件集数;检测模块33,用于检测拼接字符串中的媒体文件名称是否有中文,在检测有中文的情况下,将中文翻译为拼音,得到最终的拼接字符串;匹配模块34,用于通过最终的拼接字符串搜索与本地媒体文件对应的电影元数据,将该电影元数据作为本地媒体文件的电影封面墙。
通过上述系统,获取模块31获取本地媒体文件的文件名称;拼接模块32通过对文件名称进行元素拆解和拼接,有利于后续通过拼接字符串中的各类不同元素进行逐级搜索与本地媒体文件对应的电影元数据,提高信息提取的准确率;检测模块33通过拼音进行搜索匹配,能有效避免文件名称匹配错误的问题,提高封面墙的匹配率;匹配模块34相比于相关技术中通过提取的单一信息进行电影墙的搜索匹配,本实施例通过拼接字符串中的媒体文件名称、版本信息和媒体文件集数进行分级搜索,并利用电影时长进行对比,寻找与本地媒体文件对应的电影元数据,能有效提高封面墙的匹配率。整个系统解决了在给本地媒体文件匹配电影封面墙的情况下,存在的由于信息提取不准确导致搜索到的电影数据与本地文件不匹配的问题,提高了信息提取准确率,使得客户端搜索到的电影封面墙与本地媒体文件相匹配,提高了封面墙匹配率和用户体验感。
在其中一些实施例中,拼接模块32还用于根据文件名称,截取版本信息或媒体文件集数前的字符,接着将该字符中的标点符号替换成空格后,将版本信息或媒体文件集数拼接在后面,得到拼接字符串。
可选的,本实施例中根据文件名称,从前往后,截取版本信息,例如电影发行时间2004,或媒体文件集数,例如国外电视剧集:第一季第一集(S01E01),前面的字符,接着将该字符中的标点符号替换为空格后,将版本信息或媒体文件集数拼接在后面,得到拼接字符串。
在其中一些实施例中,检测模块33还用于在得到拼接字符串之后,检测拼接字符串中的媒体文件名称是否存在中文名称和英文名称,在检测得到中文名称和英文名称都存在的情况下,删除中文名称,得到最终的拼接字符串。
可选的,有些国外的媒体资源的文件名称,例如电影名称,会存在中英文都有的情况,由于通过中文搜索对应的封面墙的匹配率比较低,而且会存在步骤S202中提及的各种问题,因此,在检测到拼接字符串中的媒体文件名称既有中文名称也有英文名称时,直接将中文名称删除,通过英文名称进行搜索匹配,能有效提高匹配率。
下面结合应用场景对本发明进行详细的说明。
本发明的目的是提供一种自动生成电影封面墙的方法和系统,在扫描本地文件时,通过提取最显著的相关信息,使得客户端在媒体库或者互联网搜索数据时,能够找到独一无二的电影元数据作为本地媒体文件的封面墙。
本实施例中的自动生成电影封面墙的技术方案的流程步骤包括:
S1,扫描本地媒体文件的相关数据,包括文件名称,媒体文件创建时间,媒体文件的格式;
S2,对文件名称进行拆解,将文件名称拆解为各个元素;
S3,对拆解的各个元素进行拼接,获得拼接字符串,拼接字符串包括电影名称,年份,集数等数据;
S4,检测拼接字符串中的电影名称是否为中文,若是中文,则将中文名称翻译为拼音,最终的拼接字符串中,电影名称为拼音。将中文翻译成拼音进行搜索时,准确率更高;
S5,通过最终的拼接字符串搜索与本地媒体文件对应的电影元数据,将该电影元数据作为本地媒体文件的电影封面墙。
本实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
另外,结合上述实施例中的自动生成电影封面墙的方法,本申请实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种自动生成电影封面墙的方法。
在一个实施例中,图4是根据本申请实施例的电子设备的内部结构示意图,如图4所示,提供了一种电子设备,该电子设备可以是服务器,其内部结构图可以如图4所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的数据库用于存储数据。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种自动生成电影封面墙的方法。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域的技术人员应该明白,以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种自动生成电影封面墙的方法,其特征在于,所述方法包括:
获取本地媒体文件的文件名称;
将所述文件名称拆解为各元素,并拼接所述元素,得到拼接字符串,其中,所述拼接字符串包括媒体文件名称、版本信息和媒体文件集数;
检测所述拼接字符串中的所述媒体文件名称是否有中文,在检测有中文的情况下,将所述中文翻译为拼音,得到最终的拼接字符串;
通过所述最终的拼接字符串搜索与所述本地媒体文件对应的电影元数据,将所述电影元数据作为所述本地媒体文件的电影封面墙。
2.根据权利要求1所述的方法,其特征在于,所述将所述文件名称拆解为各元素,并拼接所述元素,得到拼接字符串包括:
根据所述文件名称,截取所述版本信息或媒体文件集数前的字符;
将所述字符中的标点符号替换成空格,并拼接所述版本信息或所述媒体文件集数,得到所述拼接字符串。
3.根据权利要求1所述的方法,其特征在于,在得到拼接字符串之后,所述方法包括:
检测所述拼接字符串中的所述媒体文件名称是否存在中文名称和英文名称;
在检测得到所述中文名称和所述英文名称都存在的情况下,删除所述中文名称,得到最终的拼接字符串。
4.根据权利要求1所述的方法,其特征在于,通过所述最终的拼接字符串搜索与所述本地媒体文件对应的电影元数据包括:
通过所述最终的拼接字符串中的所述媒体文件名称、所述版本信息和所述媒体文件集数进行分级搜索,得到与所述本地媒体文件对应的电影元数据。
5.根据权利要求1所述的方法,其特征在于,在通过所述最终的拼接字符串搜索与所述本地媒体文件对应的电影元数据时,搜索到多部同名电影的情况下,所述方法包括:
获取搜索到的所述多部同名电影的电影时长,将所述电影时长与所述本地媒体文件的电影时长进行对比,得到时长偏差;
获取所述时长偏差中最小的电影的电影元数据。
6.一种自动生成电影封面墙的系统,其特征在于,所述系统包括:
获取模块,用于获取本地媒体文件的文件名称;
拼接模块,用于将所述文件名称拆解为各元素,并拼接所述元素,得到拼接字符串,其中,所述拼接字符串包括媒体文件名称、版本信息和媒体文件集数;
检测模块,用于检测所述拼接字符串中的所述媒体文件名称是否有中文,在检测有中文的情况下,将所述中文翻译为拼音,得到最终的拼接字符串;
匹配模块,用于通过所述最终的拼接字符串搜索与所述本地媒体文件对应的电影元数据,将所述电影元数据作为所述本地媒体文件的电影封面墙。
7.根据权利要求6所述的系统,其特征在于,
所述拼接模块还用于根据所述文件名称,截取所述版本信息或媒体文件集数前的字符,
将所述字符中的标点符号替换成空格,并拼接所述版本信息或所述媒体文件集数,得到所述拼接字符串。
8.根据权利要求6所述的系统,其特征在于,在得到拼接字符串之后,
所述检测模块还用于检测所述拼接字符串中的所述媒体文件名称是否存在中文名称和英文名称;
在检测得到所述中文名称和所述英文名称都存在的情况下,删除所述中文名称,得到最终的拼接字符串。
9.根据权利要求6所述的系统,其特征在于,
所述匹配模块还用于通过所述最终的拼接字符串中的所述媒体文件名称、所述版本信息和所述媒体文件集数进行分级搜索,得到与所述本地媒体文件对应的电影元数据。
10.根据权利要求6所述的系统,其特征在于,所述匹配模块在通过所述文件拼接名称搜索与所述本地媒体文件对应的电影元数据时,搜索到多部同名电影的情况下,
获取搜索到的所述多部同名电影的电影时长,将所述电影时长与所述本地媒体文件的电影时长进行对比,得到时长偏差;
获取所述时长偏差中最小的电影的电影元数据。
CN202110014460.XA 2021-01-06 2021-01-06 自动生成电影封面墙的方法和系统 Pending CN112612912A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110014460.XA CN112612912A (zh) 2021-01-06 2021-01-06 自动生成电影封面墙的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110014460.XA CN112612912A (zh) 2021-01-06 2021-01-06 自动生成电影封面墙的方法和系统

Publications (1)

Publication Number Publication Date
CN112612912A true CN112612912A (zh) 2021-04-06

Family

ID=75254090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110014460.XA Pending CN112612912A (zh) 2021-01-06 2021-01-06 自动生成电影封面墙的方法和系统

Country Status (1)

Country Link
CN (1) CN112612912A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102867042A (zh) * 2012-09-03 2013-01-09 北京奇虎科技有限公司 多媒体文件搜索方法及装置
CN103389976A (zh) * 2012-05-07 2013-11-13 宇龙计算机通信科技(深圳)有限公司 用于终端的搜索方法及系统
US20150074152A1 (en) * 2013-09-06 2015-03-12 Realnetworks, Inc. Metadata-based file-identification systems and methods
CN105828095A (zh) * 2016-05-13 2016-08-03 深圳市深智电科技有限公司 智能化高匹配率影库系统及影库匹配方法
CN109151495A (zh) * 2018-08-09 2019-01-04 广州精航电子有限公司 一种点播服务器及点播服务器多媒体文件更新方法、存储介质
CN110134801A (zh) * 2019-04-28 2019-08-16 福建星网视易信息系统有限公司 一种作品名称与多媒体文件的匹配方法及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103389976A (zh) * 2012-05-07 2013-11-13 宇龙计算机通信科技(深圳)有限公司 用于终端的搜索方法及系统
CN102867042A (zh) * 2012-09-03 2013-01-09 北京奇虎科技有限公司 多媒体文件搜索方法及装置
US20150074152A1 (en) * 2013-09-06 2015-03-12 Realnetworks, Inc. Metadata-based file-identification systems and methods
CN105828095A (zh) * 2016-05-13 2016-08-03 深圳市深智电科技有限公司 智能化高匹配率影库系统及影库匹配方法
CN109151495A (zh) * 2018-08-09 2019-01-04 广州精航电子有限公司 一种点播服务器及点播服务器多媒体文件更新方法、存储介质
CN110134801A (zh) * 2019-04-28 2019-08-16 福建星网视易信息系统有限公司 一种作品名称与多媒体文件的匹配方法及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
旁逸斜出: ""使用emby打造个人影视媒体库"", 《HTTPS://WWW.MIHU.LIVE/ARCHIVES/19/》 *

Similar Documents

Publication Publication Date Title
US8145648B2 (en) Semantic metadata creation for videos
US7788262B1 (en) Method and system for creating context based summary
CN109756751B (zh) 多媒体数据处理方法及装置、电子设备、存储介质
US20160364373A1 (en) Method and apparatus for extracting webpage information
WO2016008347A1 (zh) 版式文档的重排方法、系统及电子阅读终端
CN109558513B (zh) 一种内容推荐方法、装置、终端及存储介质
CN106156164B (zh) 资源信息处理方法和装置
US20120072831A1 (en) Method for creating a multi-lingual web page
JP5894149B2 (ja) Top−k処理を活用した意味の充実
CN107391499A (zh) 自动导入翻译方法、文字显示终端及计算机可读存储介质
CN103699674A (zh) 网页保存、网页打开方法及装置和网页浏览系统
CN110727417B (zh) 一种数据处理方法和装置
CN111314732A (zh) 确定视频标签的方法、服务器及存储介质
CN110753269B (zh) 视频摘要生成方法、智能终端及存储介质
CN109657121A (zh) 一种基于网络爬虫的Web页面信息采集方法及装置
CN109948334A (zh) 一种漏洞检测方法、系统及电子设备和存储介质
US20170272793A1 (en) Media content recommendation method and device
CN111729313A (zh) 语言的配置方法及装置、存储介质、电子装置
CN112860642A (zh) 一种庭审数据处理方法、服务器及终端
US20150161160A1 (en) Application Localization
CN103390064A (zh) 一种农家书屋的文献阅读互动系统
CN103473264A (zh) 一种应用于农家书屋文献阅读的笔记及快速重现方法
CN112612912A (zh) 自动生成电影封面墙的方法和系统
CN112650529A (zh) 可配置生成移动端app代码的系统及方法
CN116644246A (zh) 一种搜索结果展示方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210406

RJ01 Rejection of invention patent application after publication