CN113641635A - 文件排序方法、文件排序装置、电子设备和存储介质 - Google Patents
文件排序方法、文件排序装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN113641635A CN113641635A CN202110898274.7A CN202110898274A CN113641635A CN 113641635 A CN113641635 A CN 113641635A CN 202110898274 A CN202110898274 A CN 202110898274A CN 113641635 A CN113641635 A CN 113641635A
- Authority
- CN
- China
- Prior art keywords
- files
- file
- ending
- syllable
- starting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000012163 sequencing technique Methods 0.000 claims description 23
- 238000010586 diagram Methods 0.000 description 13
- 230000001427 coherent effect Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/122—File system administration, e.g. details of archiving or snapshots using management policies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种文件排序方法、文件排序装置、电子设备和存储介质,属于电子设备技术领域。文件排序方法,包括:在接收到N个文件的情况下,确定N个文件的文件类型;在N个文件中,有M个文件的文件类型相同的情况下,根据M个文件的文件类型,分别确定M个文件中每个文件的起始内容和结尾内容;根据起始内容和结尾内容,对M个文件进行排序。
Description
技术领域
本申请属于电子设备技术领域,具体涉及一种文件排序方法、文件排序装置、电子设备和存储介质。
背景技术
在相关技术中,对于实时通讯程序,用户可以一次性发送或接收多个文件,而由于网络环境、文件大小等实际情况的不同,多个文件的接收顺序是不确定的,导致用户按照固定顺序发送的文件,在接收时被乱序接收,用户体验不好。
发明内容
本申请实施例的目的是提供一种文件排序方法、文件排序装置、电子设备和存储介质,能够实现对接收到的多个文件进行自动排序,优化用户体验。
第一方面,本申请实施例提供了一种文件排序方法,包括:
在接收到N个文件的情况下,确定N个文件的文件类型;
在N个文件中,有M个文件的文件类型相同的情况下,根据M个文件的文件类型,分别确定M个文件中每个文件的起始内容和结尾内容;
根据起始内容和结尾内容,对M个文件进行排序。
第二方面,本申请实施例文件排序装置,包括:
获取模块,用于在接收到N个文件的情况下,确定N个文件的文件类型;
确定模块,用于在N个文件中,有M个文件的文件类型相同的情况下,根据M个文件的文件类型,分别确定M个文件中每个文件的起始内容和结尾内容;
排序模块,用于根据起始内容和结尾内容,对M个文件进行排序。
第三方面,本申请实施例提供了一种电子设备,包括处理器,存储器及存储在存储器上并可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第一方面的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,该可读存储介质上存储程序或指令,该程序或指令被处理器执行时实现如第一方面的方法的步骤。
第五方面,本申请实施例提供了一种芯片,该芯片包括处理器和通信接口,该通信接口和该处理器耦合,该处理器用于运行程序或指令,实现如第一方面的方法的步骤。
在本申请实施例中,根据接收到的多个文件的类型,对相同类型的文件进行归类,并基于接收到的文件的具体内容,具体为根据每个文件的起始内容和结尾内容,判断两个文件是否为“相邻”的文件。其中,如果一个文件的起始内容,和另一个相同类型的文件的结尾内容相似或连续,这可以判断这两个文件是相邻的文件,因此根据起始内容和结尾内容,对接收到的多个文件进行自动排序,得到的文件序列与用户读取文件的顺序相符合,有效地提高了用户体验。
附图说明
图1示出了根据本申请实施例的文件排序方法的流程图;
图2示出了根据本申请实施例的文件排序方法的界面示意图之一;
图3示出了根据本申请实施例的文件排序方法的界面示意图之二;
图4示出了根据本申请实施例的文件排序装置的结构框图;
图5示出了根据本申请实施例的电子设备的结构框图;
图6为实现本申请实施例的一种电子设备的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的文件排序方法、文件排序装置、电子设备和存储介质进行详细地说明。
在本申请的一些实施例中,提供了一种文件排序方法,图1示出了根据本申请实施例的文件排序方法的流程图,如图1所示,方法包括:
步骤102,在接收到N个文件的情况下,确定N个文件的文件类型;
步骤104,在N个文件中,有M个文件的文件类型相同的情况下,根据M个文件的文件类型,分别确定M个文件中每个文件的起始内容和结尾内容;
步骤106,根据起始内容和结尾内容,对M个文件进行排序。
在本申请实施例中,可以通过如社交软件、文件传输软件、下载软件或分享平添软件,接收一个或多个文件。如果一次性接收到了N个文件,则进一步判断N个文件的文件类型。其中,如果N个文件中,任意两个先后相邻接收到的文件的接收间隔,小于预设的间隔阈值,则认为这N个文件是“一次性”接收到的。
如果接收到的N个文件中,有M个文件的文件类型相同,如M个文件的文件类型均为文档,或M个文件的文件类型均为音频,又或M个文件的文件类型均为视频等,则根据这M个文件的起始内容和结尾内容,对这M个文件进行排序。
具体地,图2示出了根据本申请实施例的文件排序方法的界面示意图之一,图3示出了根据本申请实施例的文件排序方法的界面示意图之二,如图2所示,用户接收到3个文本文档,根据接收到的顺序,将这3个文档命名为文件1、文件2和文件3。在接收到这些文档后,根据用户的设置,可以自动对这3个文档进行排序,也可以通过用户的特定输入,如点击“排序”按钮,或“摇一摇”,比如摇晃手机来进行排序,排序后,如图3所示,3个文档将根据各自的起始内容和结尾内容,形成为新的文件序列,比如排序后3个文件的顺序为文件3、文件1、文件2。
其中,在排序时,可以依据一个文件A的起始内容,和另一个文件B的结尾内容的相似度、相关度等信息,文件A的起始内容和文件B的结尾内容是否是连续的内容。如果判断结果为是,也即文件A的起始内容和文件B的结尾内容是连续的内容,则说明文件A的开头应紧邻文件的结尾,此时将文件A顺次排序在文件B的后面。如果判断结果为否,即文件A的起始内容和文件B的结尾内容不连续,则继续获取文件C、文件D等,直到完成排序。
通过本申请实施例的文件排序方法,得到的文件序列符合用户的读取序列,即能够时用户在不进行手动排序的情况下,连续的获取文件中的具体内容。
本申请实施例根据接收到的多个文件的类型,对相同类型的文件进行归类,并基于接收到的文件的具体内容,具体为根据每个文件的起始内容和结尾内容,判断两个文件是否为“相邻”的文件。其中,如果一个文件的起始内容,和另一个相同类型的文件的结尾内容相似或连续,这可以判断这两个文件是相邻的文件,因此根据起始内容和结尾内容,对接收到的多个文件进行自动排序,得到的文件序列与用户读取文件的顺序相符合,有效地提高了用户体验。
在本申请的一些实施例中,文件类型为文档;
根据M个文件的文件类型,分别确定M个文件中的每个文件的起始内容和结尾内容,包括:
分别在M个文件中,确定起始语句和结尾语句;
根据起始内容和结尾内容,对M个文件进行排序,包括:
对起始语句和结尾语句进行语义识别,得到每个起始语句和每个结尾语句之间的语义关联度;
对M个文件进行排序,以使M个文件中的第一文档和第二文档先后排列,其中第一文档对应的目标结尾语句和第二文档对应的目标起始语句的关联度,高于目标结尾语句与M个文件中的全部第三文档的起始语句的关联度。
可选地,第三文档为M个文件中除第一文档和第二文档之外的文档,不同于第一文档和第二文档,第一文档和第二文档不同。
在本申请实施例中,在文件类型为文档时,即接收到的文件中,其主要内容是文字内容。对于这种情况,一个文档文件的起始内容具体为起始语句,结尾内容具体为结尾语句。
其中,起始语句可以是如文章标题、第一个正文段落、第一个句子等,结尾语句可以是文档中最后一段文字、最后一个句子,也可以是最后一个标题等。对每个文档文件的起始语句和结尾语句进行语义识别,并基于语音识别,判断各起始语句和各结尾语句之间的关联度,并基于关联度判断两个文档文件是否为首尾相接的。
举例来说,现识别到文档文件A、文档文件B和文档文件C。其中,文档文件A的起始语句为“是100公分”,文档B的结尾语句是“故事到这里就结束了”,文档C的结尾语句是“小明的身高”。
通过预设的语义识别模型,对这些语句进行语义识别和分析,通过判断这些语句之间是否能够构成通顺且连贯的句子,来判断两个语句之间的关联度。以上述文档文件A、B和C为例,文档B的结尾语句是“故事到这里就结束了”,文档文件A的起始语句“是100公分”,如果将文档文件A的起始语句连接到文档B的结尾语句之后,得到“故事到这里就结束了是100公分”的句子不通顺且不能明确表达含义,则判断文档B的结尾语句和文档文件A的起始语句的关联度低。
而如果将文档文件A的起始语句连接到文档C的结尾语句,则可以得到“小明的身高是100公分”的句子,这个句子相对通顺,且能够明确的表达其含义,因此判断文档文件A的起始语句和文档C的结尾语句的管理度高,此时判断文档A应当排序到文档C的后面。
本申请实施例通过对接收到的文档文件的起始语句和结尾语句进行语义识别,从而得到各起始语句和各结尾语句的关联度,基于关联度对文档文件进行排序,使得排序后的文档间语义连贯,符合用户的阅读需求。
在本申请的一些实施例中,文件类型为音频;
根据M个文件的文件类型,分别确定M个文件中的每个文件的起始内容和结尾内容,包括:
分别在M个文件中,确定第一起始音节和第一结尾音节;
根据起始内容和结尾内容,对M个文件进行排序,包括:
确定每个第一起始音节和第一结尾音节的音节信息,其中音节信息包括音量、音色和音调中的一种或多种;
根据音节信息,确定每个第一起始音节和每个第一结尾音节的第一相似度;
对M个文件进行排序,以使M个文件中的第一音频和第二音频先后排列,其中第一音频对应的第一结尾音节和第二音频对应的第一起始音节的第一相似度,高于第一结尾音节与M个文件中的全部第三音频的起始音节的相似度。
可选地,第三音频为M个文件中除第一音频和第二音频之外的音频,不同于第一音频和第二音频,第一音频和第二音频不同。
在本申请实施例中,在文件类型为音频时,即接收到的音频文件中,其主要内容是音频内容。对于这种情况,一个音频文件的起始内容具体为起始音节信息,结尾内容具体为结尾音节信息。
具体地,在确定接收到的文件中,有M个文件为音频文件时,通过音频识别软件,对每个音频文件的第一起始音节和第一结尾音节的音节信息进行识别,得到对应的音量信息、音色信息或音调信息。
进一步地,判断各第一起始音节信息和各第一结尾音节信息之间的相似度。其中,对于音频信息,无论其内容是语言还是音乐,一段连续且完整的音节中,其音频信息应当是相似的。比如,一端语音由于文件大小限制被分成了多个音频文件,而同一句话或同一段话的朗读者为同一个人,因此其音量、音色和音调是相近的。
同理,对于音乐,同一首歌或同一个曲子,即使其被中间截断,截断后的两部分的音量、音色和音调也是相近的,因此根据两个音频文件中,第一起始音节和第一结尾音节的相似度,可以判断出这两个音频文件是否为连续的音频文件。
举例来说,现识别到音频文件A、音频文件B和音频文件C。其中,音频文件A的第一起始音节信息与音频文件B的第一结尾音节信息之间的相似度为0.1,而音频文件A的第一起始音节信息与音频文件C的第一结尾音节信息之间的相似度为0.9,音频文件A的第一起始音节信息与音频文件C的第一结尾音节信息之间的相似度最高,因此将音频文件C和音频文件A先后排序。
本申请实施例通过对接收到的音频文件的起始音节信息和结尾音节信息的相似度进行判断,将相似度最高的结尾音节信息与起始音节信息先后相邻排序,使得排序后的音频文件间音频连贯,符合用户的收听需求。
在本申请的一些实施例中,文件类型为视频;
根据M个文件的文件类型,分别确定M个文件中的每个文件的起始内容和结尾内容,包括:
对M个文件进行分离,得到M个音频文件和对应的M个图像文件;
分别在M个音频文件中,确定第二起始音节和第二结尾音节;
分别在M个图像文件中,确定起始帧和结尾帧;
根据起始内容和结尾内容,对M个文件进行排序,包括:
根据第二起始音节的音节信息,和第二结尾音节的音节信息,确定每个第二起始音节和每个第二结尾音节的第二相似度;
根据起始帧的图像信息,和结尾帧的图像信息,确定每个起始帧和每个结尾帧的第三相似度;
对M个文件进行排序,以使M个文件中的第一视频和第二视频先后排列;
其中第二结尾音节和第二起始音节的第二相似度,高于第二结尾音节与M个文件中的全部第三视频的起始音节的相似度,或结尾帧和起始帧的第三相似度,高于结尾帧和M个文件中的全部第三视频的起始帧的相似度。
在本申请实施例中,文件类型为视频,其中,视频文件一般为封装格式,其中包括一个图像文件和一个音频文件。因此,在判断接收到的N个文件中,有M个视频文件的情况下,首先对M个视频文件进行解封和分离,得到M个图像文件,和与M个图像文件一一对应的M个音频文件。
对于其中的音频文件,与文件类型为音频时的排序方法类似,通过比较音频文件的起始音节的音频信息,和结尾音节的音频信息,识别每个音频文件的第二起始音节信息和每个文件的第二结尾音节信息的第二相似度。
进一步地,对于其中的图像文件,还可以进一步判断每个图像文件的起始帧和结尾帧的相似度。其中,“起始帧”可以是一个图像文件的第一帧,或前X个帧,同理,“结尾帧”可以是一个图像文件的最后一帧,或倒数X个帧。
确定各图像文件的起始帧,与各图像文件的结尾帧的第三相似度。具体地,识别每个起始帧的图像信息,和每个结尾帧的图像信息,其中图像信息可以包括亮度信息、对比度信息、图像主体内容信息等。其中,图像主体内容,可以通过基于卷积神经网络的图像识别模型,来识别图像帧的主体内容,如“蓝天”、“人像”或“动物”等。
其中,由于视频的帧率一般大于或等于24FPS,也即一秒有24张帧图像,因此相邻的两个帧图像的亮度、对比度和图像主体内容一般是相近的,两个帧图像之间,如果图像的主体内容相同,且亮度越接近、对比度越接近,则这两个帧图像之间的第三相似度越高。
在确定每个视频文件中,音频文件的第二起始音节和第二结尾音节之间的第二相似度,和图像文件的起始帧和结尾帧的第三相似度之后,根据第二相似度和第三相似度,对这些视频文件进行排序,排序之后,相邻的两个视频文件之间,其对应的音频文件的第二结尾音节信息,和后一个视频文件对应的音频文件的第二起始音节信息的第二相似度最高,同时,前一个视频文件对应的图像文件的结尾帧,和后一个图像文件对应的起始帧的第三相似度最高。
本申请实施例中,在对视频文件进行排序时,可以将视频文件分离成独立的图像文件和音频文件,并基于图像文件的起始帧和结尾帧之间的相似度进行排序,或基于音频文件的起始音节和结尾音节之间的相似度进行排序,使得排序后的视频文件前后连续,符合用户的观看需求。
在本申请的一些实施例中,在对M个文件进行排序之后,文件排序方法还包括:
确定目标文件格式;
整合M个文件,得到整合后的目标文件,其中目标文件的格式为目标文件格式。
在本申请实施例中,在对M个文件进行排序之后,还可以根据排序好的顺序,对这M个文件进行整合。具体地,可由用户手动指定,或预设一个文件格式,比如,对于文档文件,其整合后的文件格式可以为文本文档(如.txt或.doc等)或加密格式(如.pdf等),而对于音频文件,其整合后的文件可以为普通格式(如.WAV等)或压缩格式(如.MP3)等,对于视频文件,则可以封装为不同的格式(如.MP4或.avi等)。
在确定好目标文件格式之后,按照目标文件格式,对M个文件进行整合,如将M个文档文件整合为一个pdf文件,或将M个音频文件整合为一个MP3文件,又或将M个视频文件整合为一个MP4文件,并可以将整合后的文件进行保存或输出,从而便于用户阅读、收听或观看,提高用户体验。
在本申请的一些实施例中,提供了一种文件排序装置,图4示出了根据本申请实施例的文件排序装置的结构框图,如图4所示,文件排序装置400包括:
获取模块402,用于在接收到N个文件的情况下,确定N个文件的文件类型;
确定模块404,用于在N个文件中,有M个文件的文件类型相同的情况下,根据M个文件的文件类型,分别确定M个文件中每个文件的起始内容和结尾内容;
排序模块406,用于根据起始内容和结尾内容,对M个文件进行排序;
其中,N为大于1的整数,M小于或等于N。
在本申请实施例中,可以通过如社交软件、文件传输软件、下载软件或分享平添软件,接收一个或多个文件。如果一次性接收到了N个文件,则进一步判断N个文件的文件类型。其中,如果N个文件中,任意两个先后相邻接收到的文件的接收间隔,小于预设的间隔阈值,则认为这N个文件是“一次性”接收到的。
如果N个接收到的文件中,有M个文件的文件类型相同,如M个文件的文件类型均为文档,或M个文件的文件类型均为音频,又或M个文件的文件类型均为视频等,则根据这M个文件的起始内容和结尾内容,对这M个文件进行排序。
具体地,图2示出了根据本申请实施例的文件排序方法的界面示意图之一,图3示出了根据本申请实施例的文件排序方法的界面示意图之二,如图2所示,用户接收到3个文本文档,根据接收到的顺序,将这3个文档命名为文件1、文件2和文件3。在接收到这些文档后,如图3所示,根据用户的设置,可以自动对这3个文档进行排序,也可以通过用户的特定输入,如点击“排序”按钮,或“摇一摇”,比如摇晃手机来进行排序,排序后,3个文档将根据各自的起始内容和结尾内容,形成为新的文档序列,比如排序后3个文档的顺序为文件3、文件1、文件2。
其中,在排序时,可以依据一个文件A的起始内容,和另一个文件B的结尾内容的相似度、相关度等信息,文件A的起始内容和文件B的结尾内容是否是连续的内容。如果判断结果为是,也即文件A的起始内容和文件B的结尾内容是连续的内容,则说明文件A的开头应紧邻文件的结尾,此时将文件A顺次排序在文件B的后面。如果判断结果为否,即文件A的起始内容和文件B的结尾内容不连续,则继续获取文件C、文件D等,直到完成排序。
通过本申请实施例的文件排序方法,得到的文件序列符合用户的读取序列,即能够时用户在不进行手动排序的情况下,连续的获取文件中的具体内容。
本申请实施例根据接收到的多个文件的类型,对相同类型的文件进行归类,并基于接收到的文件的具体内容,具体为根据每个文件的起始内容和结尾内容,判断两个文件是否为“相邻”的文件。其中,如果一个文件的起始内容,和另一个相同类型的文件的结尾内容相似或连续,这可以判断这两个文件是相邻的文件,因此根据起始内容和结尾内容,对接收到的多个文件进行自动排序,得到的文件序列与用户读取文件的顺序相符合,有效地提高了用户体验。
在本申请的一些实施例中,文件类型为文档;
确定模块404,还用于分别在M个文件中,确定起始语句和结尾语句;对起始语句和结尾语句进行语义识别,得到每个起始语句和每个结尾语句之间的语义关联度;
排序模块406,还用于对M个文件中进行排序,以使M个文件中的第一文档和第二文档先后排序,其中第一文档对应的目标结尾语句和第二文档对应的目标起始语句的关联度,高于目标结尾语句与M个文件中的全部第三文档的起始语句的关联度。
在本申请实施例中,在文件类型为文档时,即接收到的文件中,其主要内容是文字内容。对于这种情况,一个文档文件的起始内容具体为起始语句,结尾内容具体为结尾语句。
其中,起始语句可以是如文章标题、第一个正文段落、第一个句子等,结尾语句可以是文档中最后一段文字、最后一个句子,也可以是最后一个标题等。对每个文档文件的起始语句和结尾语句进行语义识别,并基于语音识别,判断各起始语句和各结尾语句之间的关联度,并基于关联度判断两个文档文件是否为首尾相接的。
举例来说,现识别到文档文件A、文档文件B和文档文件C。其中,文档文件A的起始语句为“是100公分”,文档B的结尾语句是“故事到这里就结束了”,文档C的结尾语句是“小明的身高”。
通过预设的语义识别模型,对这些语句进行语义识别和分析,通过判断这些语句之间是否能够构成通顺且连贯的句子,来判断两个语句之间的关联度。以上述文档文件A、B和C为例,文档B的结尾语句是“故事到这里就结束了”,文档文件A的起始语句“是100公分”,如果将文档文件A的起始语句连接到文档B的结尾语句之后,得到“故事到这里就结束了是100公分”的句子不通顺且不能明确表达含义,则判断文档B的结尾语句和文档文件A的起始语句的关联度低。
而如果将文档文件A的起始语句连接到文档C的结尾语句,则可以得到“小明的身高是100公分”的句子,这个句子相对通顺,且能够明确的表达其含义,因此判断文档文件A的起始语句和文档C的结尾语句的管理度高,此时判断文档A应当排序到文档C的后面。
本申请实施例通过对接收到的文档文件的起始语句和结尾语句进行语义识别,从而得到各起始语句和各结尾语句的关联度,基于关联度对文档文件进行排序,使得排序后的文档间语义连贯,符合用户的阅读需求。
在本申请的一些实施例中,文件类型为音频;
确定模块404,还用于分别在M个文件中,确定第一起始音节和第一结尾音节;确定每个第一起始音节和第一结尾音节的音节信息,其中音节信息包括音量、音色和音调中的一种或多种;根据音节信息,确定每个第一起始音节和每个第一结尾音节的第一相似度;
排序模块406,还用于对M个文件进行排序,以使M个文件中的第一音频和第二音频先后排列,其中第一音频对应的第一结尾音节和第二音频对应的第一起始音节的第一相似度,高于第一结尾音节与M个文件中的全部第三音频对应的起始音节的相似度。
在本申请实施例中,在文件类型为音频时,即接收到的音频文件中,其主要内容是音频内容。对于这种情况,一个音频文件的起始内容具体为起始音节信息,结尾内容具体为结尾音节信息。
具体地,在确定接收到的文件中,有M个文件为音频文件时,通过音频识别软件,对每个音频文件的第一起始音节和第一结尾音节的音节信息进行识别,得到对应的音量信息、音色信息或音调信息。
进一步地,判断各第一起始音节信息和各第一结尾音节信息之间的相似度。其中,对于音频信息,无论其内容是语言还是音乐,一段连续且完整的音节中,其音频信息应当是相似的。比如,一端语音由于文件大小限制被分成了多个音频文件,而同一句话或同一段话的朗读者为同一个人,因此其音量、音色和音调是相近的。
同理,对于音乐,同一首歌或同一个曲子,即使其被中间截断,截断后的两部分的音量、音色和音调也是相近的,因此根据两个音频文件中,第一起始音节和第一结尾音节的相似度,可以判断出这两个音频文件是否为连续的音频文件。
举例来说,现识别到音频文件A、音频文件B和音频文件C。其中,音频文件A的第一起始音节信息与音频文件B的第一结尾音节信息之间的相似度为0.1,而音频文件A的第一起始音节信息与音频文件C的第一结尾音节信息之间的相似度为0.9,音频文件A的第一起始音节信息与音频文件C的第一结尾音节信息之间的相似度最高,因此将音频文件C和音频文件A先后排序。
本申请实施例通过对接收到的音频文件的起始音节信息和结尾音节信息的相似度进行判断,将相似度最高的结尾音节信息与起始音节信息先后相邻排序,使得排序后的音频文件间音频连贯,符合用户的收听需求。
在本申请的一些实施例中,文件类型为视频,文件排序装置400还包括:
分离模块408,用于对M个文件进行分离,得到M个音频文件和对应的M个图像文件;
确定模块404,还用于分别在M个音频文件中,确定第二起始音节和第二结尾音节;分别在M个图像文件中,确定起始帧和结尾帧;根据第二起始音节的音节信息,和第二结尾音节的音节信息,确定每个第二起始音节和每个第二结尾音节的第二相似度;根据起始帧的图像信息,和结尾帧的图像信息,确定每个起始帧和每个结尾帧的第三相似度;
排序模块406,还用于对M个文件进行排序,以使M个文件中的第一视频和第二视频先后排列;
其中第二结尾音节和第二起始音节的第二相似度,高于第二结尾音节与M个文件中的全部第三视频的起始音节的相似度,或结尾帧和起始帧的第三相似度,高于结尾帧和M个文件中的全部第三视频的起始帧的相似度。
在本申请实施例中,文件类型为视频,其中,视频文件一般为封装格式,其中包括一个图像文件和一个音频文件。因此,在判断接收到的N个文件中,有M个视频文件的情况下,首先对M个视频文件进行解封和分离,得到M个图像文件,和与M个图像文件一一对应的M个音频文件。
对于其中的音频文件,与文件类型为音频时的排序方法类似,通过比较音频文件的起始音节的音频信息,和结尾音节的音频信息,识别每个音频文件的第二起始音节信息和每个文件的第二结尾音节信息的第二相似度。
进一步地,对于其中的图像文件,还可以进一步判断每个图像文件的起始帧和结尾帧的相似度。其中,“起始帧”可以是一个图像文件的第一帧,或前X个帧,同理,“结尾帧”可以是一个图像文件的最后一帧,或倒数X个帧。
确定各图像文件的起始帧,与各图像文件的结尾帧的第三相似度。具体地,识别每个起始帧的图像信息,和每个结尾帧的图像信息,其中图像信息可以包括亮度信息、对比度信息、图像主体内容信息等。其中,图像主体内容,可以通过基于卷积神经网络的图像识别模型,来识别图像帧的主体内容,如“蓝天”、“人像”或“动物”等。
其中,由于视频的帧率一般大于或等于24FPS,也即一秒有24张帧图像,因此相邻的两个帧图像的亮度、对比度和图像主体内容一般是相近的,两个帧图像之间,如果图像的主体内容相同,且亮度越接近、对比度越接近,则这两个帧图像之间的第三相似度越高。
在确定每个视频文件中,音频文件的第二起始音节和第二结尾音节之间的第二相似度,和图像文件的起始帧和结尾帧的第三相似度之后,根据第二相似度和第三相似度,对这些视频文件进行排序,排序之后,相邻的两个视频文件之间,其对应的音频文件的第二结尾音节信息,和后一个视频文件对应的音频文件的第二起始音节信息的第二相似度最高,同时,前一个视频文件对应的图像文件的结尾帧,和后一个图像文件对应的起始帧的第三相似度最高。
本申请实施例中,在对视频文件进行排序时,可以将视频文件分离成独立的图像文件和音频文件,并基于图像文件的起始帧和结尾帧之间的相似度进行排序,或基于音频文件的起始音节和结尾音节之间的相似度进行排序,使得排序后的视频文件前后连续,符合用户的观看需求。
在本申请的一些实施例中,确定模块404,还用于确定目标文件格式;
文件排序装置400还包括:整合模块410,用于整合M个文件,得到整合后的目标文件,其中目标文件的格式为目标文件格式。
在本申请实施例中,在对M个文件进行排序之后,还可以根据排序好的顺序,对这M个文件进行整合。具体地,可由用户手动指定,或预设一个文件格式,比如,对于文档文件,其整合后的文件格式可以为文本文档(如.txt或.doc等)或加密格式(如.pdf等),而对于音频文件,其整合后的文件可以为普通格式(如.WAV等)或压缩格式(如.MP3)等,对于视频文件,则可以封装为不同的格式(如.MP4或.avi等)。
在确定好目标文件格式之后,按照目标文件格式,对M个文件进行整合,如将M个文档文件整合为一个pdf文件,或将M个音频文件整合为一个MP3文件,又或将M个视频文件整合为一个MP4文件,并可以将整合后的文件进行保存或输出,从而便于用户阅读、收听或观看,提高用户体验。
本申请实施例中的文件排序装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personaldigital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的文件排序装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为iOS操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的文件排序装置能够实现上述方法实施例实现的各个过程,为避免重复,这里不再赘述。
可选地,本申请实施例还提供一种电子设备500,图5示出了根据本申请实施例的电子设备的结构框图,如图5所示,包括处理器502,存储器504,存储在存储器504上并可在处理器502上运行的程序或指令,该程序或指令被处理器502执行时实现上述方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述的移动电子设备和非移动电子设备。
图6为实现本申请实施例的一种电子设备的硬件结构示意图。
该电子设备2000包括但不限于:射频单元2001、网络模块2002、音频输出单元2003、输入单元2004、传感器2005、显示单元2006、用户输入单元2007、接口单元2008、存储器2009、以及处理器2010等部件。
本领域技术人员可以理解,电子设备2000还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器2010逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图6中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器2010用于在接收到N个文件的情况下,确定N个文件的文件类型;在N个文件中,有M个文件的文件类型相同的情况下,根据M个文件的文件类型,分别确定M个文件中每个文件的起始内容和结尾内容;根据起始内容和结尾内容,对M个文件进行排序;
其中,N为大于1的整数,M小于或等于N。
可选地,文件类型为文档;处理器2010还用于分别在M个文件中,确定起始语句和结尾语句;对启起始语句和结尾语句进行语义识别,得到每个起始语句和每个结尾语句之间的语义关联度;将M个文件中的第一文档和第二文档相邻排序,以使第一文档对应的目标结尾语句和第二文档对应的目标起始语句相邻,其中目标结尾语句和目标起始语句的关联度最高。
可选地,文件类型为音频;处理器2010还用于确定每个第一起始音节和第一结尾音节的音节信息,其中音节信息包括音量、音色和音调中的一种或多种;根据音节信息,确定每个第一起始音节和每个第一结尾音节的第一相似度;将M个文件中的第一音频和第二音频相邻排序,以使第一音频对应的第一结尾音节和第二音频对应的第一起始音节相邻,其中第一结尾音节和第一起始音节的第一相似度最高。
可选地,文件类型为视频;处理器2010还用于对M个文件进行分离,得到M个音频文件和对应的M个图像文件;分别在M个音频文件中,确定第二起始音节和第二结尾音节;分别在M个图像文件中,确定起始帧和结尾帧;根据第二起始音节的音节信息,和第二结尾音节的音节信息,确定每个第二起始音节和每个第二结尾音节的第二相似度;根据起始帧的图像信息,和结尾帧的图像信息,确定每个起始帧和每个结尾帧的第三相似度;将M个文件中的第一视频和第二视频相邻排序,以使第一视频对应的第二结尾音节和第二视频对应的第二起始音节相邻,且第一视频对应的结尾帧和第二视频对应的起始帧相邻;其中第二结尾音节和第二起始音节的第二相似度最高,或结尾帧和起始帧的第三相似度最高。
可选地,处理器2010还用于确定目标文件格式;整合M个文件,得到整合后的目标文件,其中目标文件的格式为目标文件格式。
应理解的是,本申请实施例中,输入单元2004可以包括图形处理器(GraphicsProcessing Unit,GPU)20041和麦克风20042,图形处理器20041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。
显示单元2006可包括显示面板20061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板20061。用户输入单元2007包括触控面板20071以及其他输入设备20072。触控面板20071,也称为触摸屏。触控面板20071可包括触摸检测装置和触摸控制器两个部分。其他输入设备20072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器2009可用于存储软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器2010可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器2010中。
本申请实施例还提供一种可读存储介质,可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,处理器为上述实施例中的电子设备中的处理器。可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现上述方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的起始下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (10)
1.一种文件排序方法,其特征在于,包括:
在接收到N个文件的情况下,确定所述N个文件的文件类型;
在所述N个文件中,有M个文件的文件类型相同的情况下,根据所述M个文件的文件类型,分别确定所述M个文件中每个文件的起始内容和结尾内容;
根据所述起始内容和所述结尾内容,对所述M个文件进行排序;
其中,N为大于1的整数,M小于或等于N。
2.根据权利要求1所述的文件排序方法,其特征在于,所述文件类型为文档;
所述根据所述M个文件的文件类型,分别确定所述M个文件中的每个文件的起始内容和结尾内容,包括:
分别在所述M个文件中,确定起始语句和结尾语句;
所述根据所述起始内容和所述结尾内容,对所述M个文件进行排序,包括:
对所述起始语句和所述结尾语句进行语义识别,得到每个所述起始语句和每个所述结尾语句之间的语义关联度;
对所述M个文件进行排序,以使所述M个文件中的第一文档和第二文档先后排列,其中所述第一文档对应的目标结尾语句和所述第二文档对应的目标起始语句的关联度,高于所述目标结尾语句与所述M个文件中的全部第三文档的起始语句的关联度。
3.根据权利要求1所述的文件排序方法,其特征在于,所述文件类型为音频;
所述根据所述M个文件的文件类型,分别确定所述M个文件中的每个文件的起始内容和结尾内容,包括:
分别在所述M个文件中,确定第一起始音节和第一结尾音节;
所述根据所述起始内容和所述结尾内容,对所述M个文件进行排序,包括:
确定每个所述第一起始音节和所述第一结尾音节的音节信息,其中所述音节信息包括音量、音色和音调中的一种或多种;
根据所述音节信息,确定每个所述第一起始音节和每个所述第一结尾音节的第一相似度;
对所述M个文件进行排序,以使所述M个文件中的第一音频和第二音频先后排列,其中所述第一音频对应的第一结尾音节和所述第二音频对应的第一起始音节的第一相似度,高于所述第一结尾音节与所述M个文件中的全部第三音频的起始音节的相似度。
4.根据权利要求1所述的文件排序方法,其特征在于,所述文件类型为视频;
所述根据所述M个文件的文件类型,分别确定所述M个文件中的每个文件的起始内容和结尾内容,包括:
对所述M个文件进行分离,得到M个音频文件和对应的M个图像文件;
分别在所述M个音频文件中,确定第二起始音节和第二结尾音节;
分别在所述M个图像文件中,确定起始帧和结尾帧;
所述根据所述起始内容和所述结尾内容,对所述M个文件进行排序,包括:
根据所述第二起始音节的音节信息,和所述第二结尾音节的音节信息,确定每个所述第二起始音节和每个所述第二结尾音节的第二相似度;
根据所述起始帧的图像信息,和所述结尾帧的图像信息,确定每个所述起始帧和每个所述结尾帧的第三相似度;
对所述M个文件进行排序,以使所述M个文件中的第一视频和第二视频先后排列;
其中所述第二结尾音节和所述第二起始音节的第二相似度,高于所述第二结尾音节与所述M个文件中的全部第三视频的起始音节的相似度,或所述结尾帧和所述起始帧的第三相似度,高于所述结尾帧和所述M个文件中的全部第三视频的起始帧的相似度。
5.根据权利要求1所述的文件排序方法,其特征在于,在所述对所述M个文件进行排序之后,所述方法还包括:
确定目标文件格式;
整合所述M个文件,得到整合后的目标文件,其中所述目标文件的格式为所述目标文件格式。
6.一种文件排序装置,其特征在于,包括:
获取模块,用于在接收到N个文件的情况下,确定所述N个文件的文件类型;
确定模块,用于在所述N个文件中,有M个文件的文件类型相同的情况下,根据所述M个文件的文件类型,分别确定所述M个文件中每个文件的起始内容和结尾内容;
排序模块,用于根据所述起始内容和所述结尾内容,对所述M个文件进行排序;
其中,N为大于1的整数,M小于或等于N。
7.根据权利要求6所述的文件排序装置,其特征在于,所述文件类型为文档;
所述确定模块,还用于分别在所述M个文件中,确定起始语句和结尾语句;对所述起始语句和所述结尾语句进行语义识别,得到每个所述起始语句和每个所述结尾语句之间的语义关联度;
所述排序模块,还用于对所述M个文件中进行排序,以使所述M个文件中的第一文档和第二文档先后排序,其中所述第一文档对应的目标结尾语句和所述第二文档对应的目标起始语句的关联度,高于所述目标结尾语句与所述M个文件中的全部第三文档的起始语句的关联度。
8.根据权利要求6所述的文件排序装置,其特征在于,所述文件类型为音频;
所述确定模块,还用于分别在所述M个文件中,确定第一起始音节和第一结尾音节;确定每个所述第一起始音节和所述第一结尾音节的音节信息,其中所述音节信息包括音量、音色和音调中的一种或多种;根据所述音节信息,确定每个所述第一起始音节和每个所述第一结尾音节的第一相似度;
所述排序模块,还用于对所述M个文件进行排序,以使所述M个文件中的第一音频和第二音频先后排列,其中所述第一音频对应的第一结尾音节和所述第二音频对应的第一起始音节的第一相似度,高于所述第一结尾音节与所述M个文件中的全部第三音频对应的起始音节的相似度。
9.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至5中任一项所述方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至5中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110898274.7A CN113641635A (zh) | 2021-08-05 | 2021-08-05 | 文件排序方法、文件排序装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110898274.7A CN113641635A (zh) | 2021-08-05 | 2021-08-05 | 文件排序方法、文件排序装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113641635A true CN113641635A (zh) | 2021-11-12 |
Family
ID=78419765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110898274.7A Pending CN113641635A (zh) | 2021-08-05 | 2021-08-05 | 文件排序方法、文件排序装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113641635A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017020011A1 (en) * | 2015-07-30 | 2017-02-02 | Dolby Laboratories Licensing Corporation | Searching the results of an automatic speech recognition process |
CN112001312A (zh) * | 2020-08-21 | 2020-11-27 | 深圳传音控股股份有限公司 | 文档拼接方法、设备及存储介质 |
CN112307252A (zh) * | 2020-10-29 | 2021-02-02 | 维沃移动通信有限公司 | 文件处理方法、装置及电子设备 |
-
2021
- 2021-08-05 CN CN202110898274.7A patent/CN113641635A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017020011A1 (en) * | 2015-07-30 | 2017-02-02 | Dolby Laboratories Licensing Corporation | Searching the results of an automatic speech recognition process |
CN112001312A (zh) * | 2020-08-21 | 2020-11-27 | 深圳传音控股股份有限公司 | 文档拼接方法、设备及存储介质 |
CN112307252A (zh) * | 2020-10-29 | 2021-02-02 | 维沃移动通信有限公司 | 文件处理方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107766426B (zh) | 一种文本分类方法、装置及电子设备 | |
WO2022078102A1 (zh) | 一种实体识别方法、装置、设备以及存储介质 | |
CN106406806B (zh) | 一种用于智能设备的控制方法及装置 | |
US8724963B2 (en) | Method and system for gesture based searching | |
CN111465918B (zh) | 在预览界面中显示业务信息的方法及电子设备 | |
CN109144285B (zh) | 一种输入方法和装置 | |
CN110765294B (zh) | 图像搜索方法、装置、终端设备及存储介质 | |
CN110347866B (zh) | 信息处理方法、装置、存储介质及电子设备 | |
CN113589991A (zh) | 一种文本输入方法、装置、电子设备和存储介质 | |
CN111538830A (zh) | 法条检索方法、装置、计算机设备及存储介质 | |
CN114428842A (zh) | 一种扩充问答库的方法、装置、电子设备及可读存储介质 | |
CN113869063A (zh) | 数据推荐方法、装置、电子设备及存储介质 | |
CN113407775B (zh) | 视频搜索方法、装置及电子设备 | |
CN113163256B (zh) | 基于视频生成操作流程文件的方法及装置 | |
CN113641635A (zh) | 文件排序方法、文件排序装置、电子设备和存储介质 | |
CN115309487A (zh) | 显示方法、装置、电子设备和可读存储介质 | |
CN112653919B (zh) | 字幕添加方法及装置 | |
CN112261321B (zh) | 字幕处理方法、装置及电子设备 | |
CN114416664A (zh) | 信息显示方法、信息显示装置、电子设备和可读存储介质 | |
CN113593614A (zh) | 图像处理方法及装置 | |
CN112149653A (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN112417095A (zh) | 语音消息处理方法和装置 | |
JP5643545B2 (ja) | 通信端末およびメール読み上げ方法 | |
CN112764601B (zh) | 信息显示方法、装置及电子设备 | |
CN113660375B (zh) | 通话方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |