CN110489381A - 外接资源的识别方法及系统 - Google Patents

外接资源的识别方法及系统 Download PDF

Info

Publication number
CN110489381A
CN110489381A CN201910597356.0A CN201910597356A CN110489381A CN 110489381 A CN110489381 A CN 110489381A CN 201910597356 A CN201910597356 A CN 201910597356A CN 110489381 A CN110489381 A CN 110489381A
Authority
CN
China
Prior art keywords
video
file
title
audio
file name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910597356.0A
Other languages
English (en)
Inventor
董玲玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING LEISHI TIANDI ELECTRONIC TECHNOLOGY Co Ltd
Original Assignee
BEIJING LEISHI TIANDI ELECTRONIC TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING LEISHI TIANDI ELECTRONIC TECHNOLOGY Co Ltd filed Critical BEIJING LEISHI TIANDI ELECTRONIC TECHNOLOGY Co Ltd
Priority to CN201910597356.0A priority Critical patent/CN110489381A/zh
Publication of CN110489381A publication Critical patent/CN110489381A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种外接资源的识别方法及系统,其中,该方法包括:获取外接设备中的视音频文件的文件名称;将所述视音频文件的文件名称进行非标准字符筛选,得到所述视音频文件的合法文件名称;根据预设检索规则,在所述标准影音文件名称列表中,选取与所述视音频文件的合法文件名称匹配度最高的至少一个标准影音文件名称,并按匹配度由高到底排序,得到备选列表;获取用户在所述备选列表中选择的标准影音文件名称,并将所述视音频文件的文件名称改为该标准影音文件名称;本发明实施例可以为外接资源快速匹配标准影音文件名称,以及于该标准影音文件名称所对应的其它扩展信息,提高了用户的体验。

Description

外接资源的识别方法及系统
技术领域
本发明涉及数据处理技术领域,特别是涉及一种外接资源的识别方法及系统。
背景技术
目前在市场中存在从U盘或外接设备添加电影或者资源播放的功能,但是无法匹配具体信息,用户在使用过程中会不清楚电影信息,无直观感受,造成体验感差。
具体的,现有技术中通过U盘添加电影或通过外接设备添加电影后需要对该添加的电影进行名称匹配,但通常是通过数据库检索或者用字段匹配实现的,但是这个需求的难度在于用户自己的资源电影名称有可能是简写甚至是缩写,还有可能有一些特殊符号等,不可能通过数据库查询,目前没有一种检索技术可以匹配目前的搜索需求。
发明内容
本发明实施例提供一种外接资源的识别方法及系统,通过数据筛选和分类匹配,实现数据的反查,以快速为外接资源匹配并替换为标准影音文件名称,提高用户的体验。
为达到上述目的,一方面,本发明实施例提供一种外接资源的识别方法,包括:
获取外接设备中的视音频文件的文件名称;
将所述视音频文件的文件名称进行非标准字符筛选,得到所述视音频文件的合法文件名称;
根据预设检索规则,在所述标准影音文件名称列表中,选取与所述视音频文件的合法文件名称匹配度最高的至少一个标准影音文件名称,并按匹配度由高到底排序,得到备选列表;
获取用户在所述备选列表中选择的标准影音文件名称,并将所述视音频文件的文件名称改为该标准影音文件名称。
可选的,所述获取外接设备中的视音频文件的文件名称,包括:
遍历所述外接设备中的所有文件;
根据文件格式,识别其中的视音频文件,并将所述视音频文件的文件名称保存至内存中。
可选的,将所述视音频文件的文件名称进行非标准字符筛选,得到所述视音频文件的合法文件名称,包括:
将所述视音频文件的文件名称中所包含的数字、字母、文字之外的字符筛除,得到仅包含数字、字母、和/或文字的合法文件名称。
可选的,当所述合法文件名称分为单字名称时,所述根据预设检索规则,在所述标准影音文件名称列表中,选取与所述视音频文件的合法文件名称匹配度最高的至少一个标准影音文件名称,并按匹配度由高到底排序,得到备选列表,包括:
在所述标准影音文件名称列表中,通过数据查询的模糊查询后,按字数由少到多排序,得到备选列表。
可选的,当所述合法文件名称分为多字名称时,所述根据预设检索规则,在所述标准影音文件名称列表中,选取与所述视音频文件的合法文件名称匹配度最高的至少一个标准影音文件名称,并按匹配度由高到底排序,得到备选列表,包括:
将所述多字名称按字数拆开,并保持所述多字名称的文字顺序,按字数由少至多组成多个字段;
根据所述多字名称的文字顺序,将所述字段按首字排序,并在该排序的基础上按字数从少至多排序,得到字段顺序;
根据所述字段顺序,依次进行模糊查询,并将查询结果根据匹配度以及冒泡排序的规则,得到备选列表。
另一方面,本发明实施例提供一种外接资源的识别系统,包括:
遍历单元,用于获取外接设备中的视音频文件的文件名称;
预处理单元,用于将所述视音频文件的文件名称进行非标准字符筛选,得到所述视音频文件的合法文件名称;
匹配单元,用于根据预设检索规则,在所述标准影音文件名称列表中,选取与所述视音频文件的合法文件名称匹配度最高的至少一个标准影音文件名称,并按匹配度由高到底排序,得到备选列表;
修改单元,用于获取用户在所述备选列表中选择的标准影音文件名称,并将所述视音频文件的文件名称改为该标准影音文件名称。
可选的,所述遍历单元,包括:
遍历子单元,用于遍历所述外接设备中的所有文件;
格式识别子单元,用于根据文件格式,识别其中的视音频文件,并将所述视音频文件的文件名称保存至内存中。
可选的,所述预处理单元,用于:
将所述视音频文件的文件名称中所包含的数字、字母、文字之外的字符筛除,得到仅包含数字、字母、和/或文字的合法文件名称。
可选的,所述匹配单元包括单字匹配子单元,用于当所述合法文件名称分为单字名称时,
在所述标准影音文件名称列表中,通过数据查询的模糊查询后,按字数由少到多排序,得到备选列表。
可选的,所述匹配单元包括多字匹配子单元,用于当所述合法文件名称分为多字名称时,进行匹配查询;该多字匹配子单元包括:
拆字模块,用于将所述多字名称按字数拆开,并保持所述多字名称的文字顺序,按字数由少至多组成多个字段;
排序模块,用于根据所述多字名称的文字顺序,将所述字段按首字排序,并在该排序的基础上按字数从少至多排序,得到字段顺序;
查询模块,用于根据所述字段顺序,依次进行模糊查询,并将查询结果根据匹配度以及冒泡排序的规则,得到备选列表。
上述技术方案具有如下有益效果:
本发明通过获取外接设备中的视音频文件的文件名称;将所述视音频文件的文件名称进行非标准字符筛选,得到所述视音频文件的合法文件名称;根据预设检索规则,在所述标准影音文件名称列表中,选取与所述视音频文件的合法文件名称匹配度最高的至少一个标准影音文件名称,并按匹配度由高到底排序,得到备选列表;获取用户在所述备选列表中选择的标准影音文件名称,并将所述视音频文件的文件名称改为该标准影音文件名称;通过上述方法,本发明实施例可以为外接资源快速匹配标准影音文件名称,以及于该标准影音文件名称所对应的其它扩展信息,提高了用户的体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一种外接资源的识别方法的流程示意图;
图2是本发明实施例一种外接资源的识别方法中的排序规则示意图;
图3是本发明实施例一种外接资源的识别方法中的排序的步骤的示意图;
图4是本发明实施例一种外接资源的识别系统的框图;
图5是本发明实施例一种外接资源的识别系统中,遍历单元201的结构框图;
图6是本发明实施例一种外接资源的识别系统中,匹配单元203的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有技术中,用户通过外接设备添加视音频文件时,用户无法更直观的了解该视音频文件的相关信息;且鉴于视音频文件名称不规范,人机交互终端甚至无法匹配该视音频文件的相关信息。基于此,本发明实施例提供一种外接资源的识别方法,将与该视音频文件的名称匹配度最高的信息提供给用户,以供用户选择。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,是本发明实施例一种外接资源的识别方法的流程示意图,如图示,包括:
步骤101,获取外接设备中的视音频文件的文件名称;
可选的,包括:
遍历所述外接设备中的所有文件;
根据文件格式,识别其中的视音频文件,并将所述视音频文件的文件名称保存至内存中。
比如,当用户将U盘或移动硬盘等外接设备插入机顶盒时,遍历该U盘或移动硬盘,通过文件格式,识别其中的视音频文件。如可选的,后缀名为.ISO的文件为蓝光电影,仅获取该蓝光电影的文件名称,将其保存到内存里等候进一步处理。当然,也可以是其它格式,或者同时选多个格式。
步骤102,将所述视音频文件的文件名称进行非标准字符筛选,得到所述视音频文件的合法文件名称;
可选的,包括:
将所述视音频文件的文件名称中所包含的数字、字母、文字之外的字符筛除,得到仅包含数字、字母、和/或文字的合法文件名称。
具体的,比如:
首先,将保存至内存的视音频文件的文件名称进行处理,去除无用字符(*、:、.、&等),可以通过正则表达式把所有包含非数字、字母、汉字等的都筛掉;
其次,将排行榜的数据按照这种去除规则,将所有去除特殊字符的合法文件名称存入movie_name_cut的字段。
步骤103,根据预设检索规则,在所述标准影音文件名称列表中,选取与所述视音频文件的合法文件名称匹配度最高的至少一个标准影音文件名称,并按匹配度由高到底排序,得到备选列表;
在进行该步骤之前,先将合法文件名称中的单字名称挑选出来,将其与多字合法文件名称分开处理。
当所述合法文件名称分为单字名称时,包括:
在所述标准影音文件名称列表中,通过数据查询的模糊查询后,按字数由少到多排序,得到备选列表。
可选的,直接用数据库查询的模糊查询movie_name_cut字段后按字数排序(从小到大),拿到字数小于5的前三位,就是一个字的匹配集合,然后以map集合的形式保存,key为原生数据,value为查询结果的集合(按字数从小到大排序)保存。
当所述合法文件名称分为多字名称时,包括:
将所述多字名称按字数拆开,并保持所述多字名称的文字顺序,按字数由少至多组成多个字段;
根据所述多字名称的文字顺序,将所述字段按首字排序,并在该排序的基础上按字数从少至多排序,得到字段顺序;
根据所述字段顺序,依次进行模糊查询,并将查询结果根据匹配度以及冒泡排序的规则,得到备选列表。
以下通过具体实例进行说明:
比如,文件名称为《爱情专一》。
一、拆成4个字:爱、情、专、一。
二、将第一个字爱通过模糊“like%查询字段%”查询出字数大于等于4的然后按字数排序找到前五个存入集合。
图2是本实施例的排序规则示意图,如图示,考虑优选顺序从低到高依次为:字数相同、含匹配字、匹配字个数、连续匹配个数。
如:
1.爱我别走
2.不得不爱
3.死了都要爱
4.爱就一个字
5.爱的就是你
三、将前2个字通过模糊“like%查询字段%”查询出字数大于等于4的然后按字数排序找到前五个,按顺序替代以上结合。
如,只找到了三个:
1.因为爱情
2.爱情转移
3.爱情呼叫转移
替换后的集合为:
1.因为爱情
2.爱情转移
3.爱就一个字
4.爱的就是你
5.爱情呼叫转移
以此,当数组为“爱情专”时,则没有检索结果了。
四、将结果存入首字优先度最高的集合中,然后还得保存一个连续最大长度值,接着就查第二个字开始,为了缩短查询时间,就直接模糊“like%查询字段%”查询第二个字+刚才记录的最大连续数字的文字(这样做的目的就是缩减时间,降低时间、空间的复杂度)如果有内容就按照排序替换第一次获得的数据集合,然后就查询刚才第二个字开始的字段+1的字段,以此类推,用替换的方式就可以获得连续度最大的集合,这个最大连续长度根据你查询结果为空就不处理然后进行下个查询(第3、4……),不为空就加1其中当最大连续长度大于剩余字数时就可以停止循环查询了,通过上述步骤基本就可以得到最大匹配度的集合(选最优的前3个共用户选择);
图3是本实施例的排序步骤示意图,结合图3,如上所述,最后得到的结果是:
1.爱情转移
2.爱情呼叫转移
用户选择《爱情呼叫转移》作为最终的结果,替换原名称。
步骤104,获取用户在所述备选列表中选择的标准影音文件名称,并将所述视音频文件的文件名称改为该标准影音文件名称。
以上,本发明实施例可以为外接资源快速匹配标准影音文件名称,以及于该标准影音文件名称所对应的其它扩展信息,提高了用户的体验。
另一方面,本发明实施例提供一种外接资源的识别系统,如图4所示,为该系统的结构框图,包括:
遍历单元201,用于获取外接设备中的视音频文件的文件名称;
可选的,如图5所示,所述遍历单元201,包括:
遍历子单元2011,用于遍历所述外接设备中的所有文件;
格式识别子单元2012,用于根据文件格式,识别其中的视音频文件,并将所述视音频文件的文件名称保存至内存中。
比如,当用户将U盘或移动硬盘等外接设备插入机顶盒时,遍历该U盘或移动硬盘,通过文件格式,识别其中的视音频文件。如可选的,后缀名为.ISO的文件为蓝光电影,仅获取该蓝光电影的文件名称,将其保存到内存里等候进一步处理。当然,也可以是其它格式,或者同时选多个格式。
预处理单元202,用于将所述视音频文件的文件名称进行非标准字符筛选,得到所述视音频文件的合法文件名称;
所述预处理单元202,用于:
将所述视音频文件的文件名称中所包含的数字、字母、文字之外的字符筛除,得到仅包含数字、字母、和/或文字的合法文件名称。
具体的,比如:
首先,将保存至内存的视音频文件的文件名称进行处理,去除无用字符(*、:、.、&等),可以通过正则表达式把所有包含非数字、字母、汉字等的都筛掉;
其次,将排行榜的数据按照这种去除规则,将所有去除特殊字符的合法文件名称存入movie_name_cut的字段。
匹配单元203,用于根据预设检索规则,在所述标准影音文件名称列表中,选取与所述视音频文件的合法文件名称匹配度最高的至少一个标准影音文件名称,并按匹配度由高到底排序,得到备选列表;
所述匹配单元还包括一识别子单元,用于先将合法文件名称中的单字名称挑选出来,将其与多字合法文件名称分开处理。
可选的,如图6所示,所述匹配单元203包括单字匹配子单元2031,用于当所述合法文件名称分为单字名称时,
在所述标准影音文件名称列表中,通过数据查询的模糊查询后,按字数由少到多排序,得到备选列表。
可选的,直接用数据库查询的模糊查询movie_name_cut字段后按字数排序(从小到大),拿到字数小于5的前三位,就是一个字的匹配集合,然后以map集合的形式保存,key为原生数据,value为查询结果的集合(按字数从小到大排序)保存。
可选的,如图6所示,所述匹配单元203包括多字匹配子单元2032,用于当所述合法文件名称分为多字名称时,进行匹配查询;该多字匹配子单元2032包括:
拆字模块,用于将所述多字名称按字数拆开,并保持所述多字名称的文字顺序,按字数由少至多组成多个字段;
排序模块,用于根据所述多字名称的文字顺序,将所述字段按首字排序,并在该排序的基础上按字数从少至多排序,得到字段顺序;
查询模块,用于根据所述字段顺序,依次进行模糊查询,并将查询结果根据匹配度以及冒泡排序的规则,得到备选列表。
以下通过具体实例进行说明:
比如,文件名称为《爱情专一》。
一、拆成4个字:爱、情、专、一。
二、将第一个字爱通过模糊“like%查询字段%”查询出字数大于等于4的然后按字数排序找到前五个存入集合。
如:
1.爱我别走
2.不得不爱
3.死了都要爱
4.爱就一个字
5.爱的就是你
三、将前2个字通过模糊“like%查询字段%”查询出字数大于等于4的然后按字数排序找到前五个,按顺序替代以上结合。
如,只找到了三个:
1.因为爱情
2.爱情转移
3.爱情呼叫转移
替换后的集合为:
1.因为爱情
2.爱情转移
3.爱就一个字
4.爱的就是你
5.爱情呼叫转移
以此,当数组为“爱情专”时,则没有检索结果了。
四、将结果存入首字优先度最高的集合中,然后还得保存一个连续最大长度值,接着就查第二个字开始,为了缩短查询时间,就直接模糊“like%查询字段%”查询第二个字+刚才记录的最大连续数字的文字(这样做的目的就是缩减时间,降低时间、空间的复杂度)如果有内容就按照排序替换第一次获得的数据集合,然后就查询刚才第二个字开始的字段+1的字段,以此类推,用替换的方式就可以获得连续度最大的集合,这个最大连续长度根据你查询结果为空就不处理然后进行下个查询(第3、4……),不为空就加1其中当最大连续长度大于剩余字数时就可以停止循环查询了,通过上述步骤基本就可以得到最大匹配度的集合(选最优的前3个共用户选择);
如上所述,最后得到的结果是:
1.爱情转移
2.爱情呼叫转移
用户选择《爱情呼叫转移》作为最终的结果,替换原名称。
修改单元204,用于获取用户在所述备选列表中选择的标准影音文件名称,并将所述视音频文件的文件名称改为该标准影音文件名称。
以上,本发明实施例可以为外接资源快速匹配标准影音文件名称,以及于该标准影音文件名称所对应的其它扩展信息,提高了用户的体验。
本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrative components),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。
本发明实施例中所描述的各种说明性的逻辑块,或单元都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。
在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种外接资源的识别方法,其特征在于,包括:
获取外接设备中的视音频文件的文件名称;
将所述视音频文件的文件名称进行非标准字符筛选,得到所述视音频文件的合法文件名称;
根据预设检索规则,在所述标准影音文件名称列表中,选取与所述视音频文件的合法文件名称匹配度最高的至少一个标准影音文件名称,并按匹配度由高到底排序,得到备选列表;
获取用户在所述备选列表中选择的标准影音文件名称,并将所述视音频文件的文件名称改为该标准影音文件名称。
2.根据权利要求1所述的方法,其特征在于,所述获取外接设备中的视音频文件的文件名称,包括:
遍历所述外接设备中的所有文件;
根据文件格式,识别其中的视音频文件,并将所述视音频文件的文件名称保存至内存中。
3.根据权利要求1所述的方法,其特征在于,将所述视音频文件的文件名称进行非标准字符筛选,得到所述视音频文件的合法文件名称,包括:
将所述视音频文件的文件名称中所包含的数字、字母、文字之外的字符筛除,得到仅包含数字、字母、和/或文字的合法文件名称。
4.根据权利要求1所述的方法,其特征在于,当所述合法文件名称分为单字名称时,所述根据预设检索规则,在所述标准影音文件名称列表中,选取与所述视音频文件的合法文件名称匹配度最高的至少一个标准影音文件名称,并按匹配度由高到底排序,得到备选列表,包括:
在所述标准影音文件名称列表中,通过数据查询的模糊查询后,按字数由少到多排序,得到备选列表。
5.根据权利要求1所述的方法,其特征在于,当所述合法文件名称分为多字名称时,所述根据预设检索规则,在所述标准影音文件名称列表中,选取与所述视音频文件的合法文件名称匹配度最高的至少一个标准影音文件名称,并按匹配度由高到底排序,得到备选列表,包括:
将所述多字名称按字数拆开,并保持所述多字名称的文字顺序,按字数由少至多组成多个字段;
根据所述多字名称的文字顺序,将所述字段按首字排序,并在该排序的基础上按字数从少至多排序,得到字段顺序;
根据所述字段顺序,依次进行模糊查询,并将查询结果根据匹配度以及冒泡排序的规则,得到备选列表。
6.一种外接资源的识别系统,其特征在于,包括:
遍历单元,用于获取外接设备中的视音频文件的文件名称;
预处理单元,用于将所述视音频文件的文件名称进行非标准字符筛选,得到所述视音频文件的合法文件名称;
匹配单元,用于根据预设检索规则,在所述标准影音文件名称列表中,选取与所述视音频文件的合法文件名称匹配度最高的至少一个标准影音文件名称,并按匹配度由高到底排序,得到备选列表;
修改单元,用于获取用户在所述备选列表中选择的标准影音文件名称,并将所述视音频文件的文件名称改为该标准影音文件名称。
7.根据权利要求6所述的系统,其特征在于,所述遍历单元,包括:
遍历子单元,用于遍历所述外接设备中的所有文件;
格式识别子单元,用于根据文件格式,识别其中的视音频文件,并将所述视音频文件的文件名称保存至内存中。
8.根据权利要求6所述的系统,其特征在于,所述预处理单元,用于:
将所述视音频文件的文件名称中所包含的数字、字母、文字之外的字符筛除,得到仅包含数字、字母、和/或文字的合法文件名称。
9.根据权利要求6所述的系统,其特征在于,所述匹配单元包括单字匹配子单元,用于当所述合法文件名称分为单字名称时,
在所述标准影音文件名称列表中,通过数据查询的模糊查询后,按字数由少到多排序,得到备选列表。
10.根据权利要求6所述的系统,其特征在于,所述匹配单元包括多字匹配子单元,用于当所述合法文件名称分为多字名称时,进行匹配查询;该多字匹配子单元包括:
拆字模块,用于将所述多字名称按字数拆开,并保持所述多字名称的文字顺序,按字数由少至多组成多个字段;
排序模块,用于根据所述多字名称的文字顺序,将所述字段按首字排序,并在该排序的基础上按字数从少至多排序,得到字段顺序;
查询模块,用于根据所述字段顺序,依次进行模糊查询,并将查询结果根据匹配度以及冒泡排序的规则,得到备选列表。
CN201910597356.0A 2019-07-04 2019-07-04 外接资源的识别方法及系统 Pending CN110489381A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910597356.0A CN110489381A (zh) 2019-07-04 2019-07-04 外接资源的识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910597356.0A CN110489381A (zh) 2019-07-04 2019-07-04 外接资源的识别方法及系统

Publications (1)

Publication Number Publication Date
CN110489381A true CN110489381A (zh) 2019-11-22

Family

ID=68545994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910597356.0A Pending CN110489381A (zh) 2019-07-04 2019-07-04 外接资源的识别方法及系统

Country Status (1)

Country Link
CN (1) CN110489381A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818937A (zh) * 2021-03-02 2021-05-18 广联达科技股份有限公司 Excel文件的识别方法、装置、电子设备及可读存储介质
CN114880430A (zh) * 2022-05-10 2022-08-09 马上消费金融股份有限公司 名称处理方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886052A (zh) * 2014-03-13 2014-06-25 北京时代今典传媒科技有限公司 一种处理dcp名称的方法、装置和影像管理系统
CN104978307A (zh) * 2015-06-25 2015-10-14 中铁四局集团有限公司 一种清单处理方法及装置
CN105243086A (zh) * 2015-09-08 2016-01-13 北京北大千方科技有限公司 一种车辆信息查询方法和装置
CN105245943A (zh) * 2015-09-28 2016-01-13 北京奇艺世纪科技有限公司 一种为本地视频文件匹配字幕文件的方法和装置
CN105468792A (zh) * 2016-01-13 2016-04-06 山东合天智汇信息技术有限公司 一种基于大数据的模糊查询方法及系统
CN107783950A (zh) * 2017-04-11 2018-03-09 平安医疗健康管理股份有限公司 药品说明书处理方法及装置
CN109492081A (zh) * 2018-10-30 2019-03-19 上海智臻智能网络科技股份有限公司 文本信息搜索和信息交互方法、装置、设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886052A (zh) * 2014-03-13 2014-06-25 北京时代今典传媒科技有限公司 一种处理dcp名称的方法、装置和影像管理系统
CN104978307A (zh) * 2015-06-25 2015-10-14 中铁四局集团有限公司 一种清单处理方法及装置
CN105243086A (zh) * 2015-09-08 2016-01-13 北京北大千方科技有限公司 一种车辆信息查询方法和装置
CN105245943A (zh) * 2015-09-28 2016-01-13 北京奇艺世纪科技有限公司 一种为本地视频文件匹配字幕文件的方法和装置
CN105468792A (zh) * 2016-01-13 2016-04-06 山东合天智汇信息技术有限公司 一种基于大数据的模糊查询方法及系统
CN107783950A (zh) * 2017-04-11 2018-03-09 平安医疗健康管理股份有限公司 药品说明书处理方法及装置
CN109492081A (zh) * 2018-10-30 2019-03-19 上海智臻智能网络科技股份有限公司 文本信息搜索和信息交互方法、装置、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818937A (zh) * 2021-03-02 2021-05-18 广联达科技股份有限公司 Excel文件的识别方法、装置、电子设备及可读存储介质
CN114880430A (zh) * 2022-05-10 2022-08-09 马上消费金融股份有限公司 名称处理方法及装置
CN114880430B (zh) * 2022-05-10 2023-07-18 马上消费金融股份有限公司 名称处理方法及装置

Similar Documents

Publication Publication Date Title
US9727572B2 (en) Database compression system and method
KR100466143B1 (ko) 파일 관리 방법, 콘텐츠 기록 장치, 콘텐츠 재생 장치 및콘텐츠 기록 매체
CN102110132B (zh) 统一资源定位符匹配查找方法、装置和网络侧设备
KR100387965B1 (ko) 사용자 적응적 멀티미디어 서비스 시스템
JP5147947B2 (ja) クエリ別検索コレクション生成方法およびシステム
KR101672349B1 (ko) 파일 클라우드 서비스 장치 및 방법
CN102722487A (zh) 文件管理方法和装置
CN106970958B (zh) 一种流文件的查询与存储方法和装置
CN109240607B (zh) 一种文件读取方法和装置
KR20130049111A (ko) 분산 처리를 이용한 포렌식 인덱스 방법 및 장치
CN104572952A (zh) 直播多媒体文件的识别方法及装置
CN106599111A (zh) 一种数据管理方法及存储系统
CN104035993A (zh) 电子书的存储检索方法、电子书管理系统、阅读系统
CN104750839A (zh) 一种数据推荐方法、终端及服务器
CN110489381A (zh) 外接资源的识别方法及系统
CN103268345A (zh) 影视数据的检索方法及装置
US20160239510A1 (en) Method for Extracting Useful Content from Setup Files of Mobile Applications
CN105893548A (zh) 命名方法以及终端
CN104462096A (zh) 舆情监测分析方法和装置
CN110290199A (zh) 内容推送方法、装置及设备
CN112307318B (zh) 一种内容发布方法、系统及装置
CN101770474A (zh) 一种基于历史检索记录检索的方法和装置
CN106446241A (zh) 使用书籍的isbn条码检索播放对应音频的方法及系统
CN101261645B (zh) 一种获取多层信息的方法和装置
CN111752941B (zh) 一种数据存储、访问方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191122

RJ01 Rejection of invention patent application after publication