CN116992057A - 存储设备中多媒体文件的处理方法、装置和设备 - Google Patents

存储设备中多媒体文件的处理方法、装置和设备 Download PDF

Info

Publication number
CN116992057A
CN116992057A CN202310802920.4A CN202310802920A CN116992057A CN 116992057 A CN116992057 A CN 116992057A CN 202310802920 A CN202310802920 A CN 202310802920A CN 116992057 A CN116992057 A CN 116992057A
Authority
CN
China
Prior art keywords
service
file
multimedia file
identifier
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310802920.4A
Other languages
English (en)
Inventor
吴天昊
姚洁
牛铮
施鹏
裴中佑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202310802920.4A priority Critical patent/CN116992057A/zh
Publication of CN116992057A publication Critical patent/CN116992057A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range

Abstract

本公开提供了一种存储设备中多媒体文件的处理方法、装置和设备,涉及人工智能技术领域,具体涉及自然语言处理、深度学习、云服务等技术领域。具体实现方案为:接收服务请求;在服务请求中未包含服务标识的情况下,确定存储设备对应的显示界面中当前显示的页面的类型;根据该页面类型,确定并显示第一候选服务标识;在检测到第一服务标识被选中的情况下,基于第一服务标识关联的第一服务,对当前页面中显示的第一多媒体文件进行处理。由此,通过基于显示界面显示的页面的类型,为用户提供可用的候选服务,并基于选中的服务标识智能地对存储设备页面中的多媒体文件进行处理,实现了对多媒体文件的自动处理,提高了文件处理的效率,节省了用户时间。

Description

存储设备中多媒体文件的处理方法、装置和设备
技术领域
本公开涉及人工智能领域,具体涉及自然语言处理、深度学习、云服务等技术领域,尤其涉及存储设备中多媒体文件的处理方法、装置和设备。
背景技术
存储设备,是可以向用户提供文件的存储、访问、备份、共享等文件管理功能的设备,比如网盘、云盘、硬盘、闪存卡、U盘等等。
目前,在用户需要对存储设备中多媒体文件进行处理时,用户需要人工对该多媒体文件进行浏览并相应地处理,然而,人工处理需要耗费大量时间,使得用户体检较差,因此需要一种更方便快捷地处理存储设备中多媒体文件的方法。
发明内容
本公开提供了一种用于存储设备中多媒体文件的处理方法、装置和设备。
根据本公开的第一方面,提供了一种存储设备中多媒体文件的处理方法,包括:接收服务请求;在所述服务请求中未包含服务标识的情况下,确定存储设备对应的显示界面中当前显示的页面的类型;根据所述当前显示的页面的类型,确定并显示第一候选服务标识;在检测到第一服务标识被选中的情况下,基于所述第一服务标识关联的第一服务,对所述当前的页面中显示的第一多媒体文件进行处理。
根据本公开的第二方面,提供了一种存储设备中多媒体文件的处理装置,包括:第一接收模块,用于接收服务请求;第一确定模块,用于在所述服务请求中未包含服务标识的情况下,确定存储设备对应的显示界面中当前显示的页面的类型;第一显示模块,用于根据所述当前显示的页面的类型,确定并显示第一候选服务标识;第一处理模块,用于在检测到第一服务标识被选中的情况下,基于所述第一服务标识关联的第一服务,对所述当前的页面中显示的第一多媒体文件进行处理。
根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面所述的存储设备中多媒体文件的处理方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如第一方面所述的存储设备中多媒体文件的处理方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的存储设备中多媒体文件的处理方法。
本公开提供的存储设备中多媒体文件的处理方法、装置和设备,存在如下有益效果:
在本公开中,首先接收服务请求,在服务请求中未包含服务标识的情况下,确定存储设备对应的显示界面中当前显示的页面的类型,然后根据该页面类型,确定并显示第一候选服务标识,之后在检测到第一服务标识被选中的情况下,基于第一服务标识关联的第一服务,对当前页面中显示的第一多媒体文件进行处理。由此,通过基于显示界面显示的页面的类型,为用户提供可用的候选服务,并基于选中的服务标识智能地对存储设备页面中的多媒体文件进行处理,实现了对多媒体文件的自动处理,提高了文件处理的效率,节省了用户时间。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开一实施例提供的一种存储设备中多媒体文件的处理方法的流程示意图;
图2是本公开一对话界面的示意图;
图3是根据本公开又一实施例提供的一种存储设备中多媒体文件的处理方法的流程示意图;
图4是根据本公开又一实施例提供的一种存储设备中多媒体文件的处理方法的流程示意图;
图5是本公开一显示界面的示意图;
图6是根据本公开又一实施例提供的一种存储设备中多媒体文件的处理方法的流程示意图;
图7是本公开一对话界面的示意图;
图8中根据本公开又一实施例提供的一种存储设备中多媒体文件的处理方法的流程示意图;
图9是本公开一对话界面的示意图;
图10是根据本公开一实施例提供的一种存储设备中多媒体文件的处理装置的流程示意图;
图11是根据本公开又一实施例提供的一种存储设备中多媒体文件的处理装置的流程示意图;
图12是用来实现本公开实施例的存储设备中多媒体文件的处理方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开涉及人工智能领域,具体涉及自然语言处理、深度学习、云服务等技术领域。
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
自然语言处理(Natural Language Processing),英文缩写为NLP,它是令计算机可以像人类一样理解自然语言,从而使计算机能够处理文本、语音和图像等数据,实现智能交互并解决自然语言处理相关的问题,如文本分析、信息检索、情感分析等等。
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
云服务(cloud services)是一种基于互联网通过云计算技术提供的各种服务的模式,可以提供各种计算机资源,包括计算力、存储、数据库、网络和软件等,使用户能够通过互联网访问这些资源。
本公开的技术方案中,所涉及的用户个人信息的获取、存储和应用等处理,均符合相关法律法规的规定,且不违背公序良俗。
下面参考附图描述本公开实施例的存储设备中多媒体文件的处理方法、装置和设备。
其中,需要说明的是,本实施例的存储设备中多媒体文件的处理方法的执行主体为存储设备中多媒体文件的处理装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在电子设备中,电子设备可以为任一具有计算能力的设备,例如可以为个人电脑(Personal Computer,简称PC)、移动终端、服务器等,移动终端例如可以为车载设备、手机、平板电脑、个人数字助理、穿戴式设备、智能音箱等具有各种操作系统、触摸屏和/或显示屏的硬件设备。本公开实施例中存储设备中多媒体文件的处理装置可以为具有文件处理功能的服务机器人,该服务机器人可以嵌入在电子设备的存储设备中,以使得电子设备可以执行文件处理功能。因此,本公开以下实施例中以执行主体为嵌入在存储设备中的服务机器人为例进行说明。
图1是根据本公开一实施例提供的一种存储设备中多媒体文件的处理方法的流程示意图。
如图1所示,该存储设备中多媒体文件的处理方法包括:
步骤101,接收服务请求。
本公开中,当用户想要在存储设备中对多媒体文件进行处理来获取信息时,可以向存储设备中嵌入的服务机器人发送服务请求,来实现对多媒体文件的智能处理,该服务请求可以是触发控件、输入标识符等方式触发的,本公开对此不做限定。
在一些可能的实现形式中,服务机器人可以在监测到存储设备对应的显示界面中的预设控件被触发的情况下,确定接收到服务请求。
其中,预设控件,可以是指用于启动服务机器人的控件。
本公开实施例中,用户可以在存储设备中任一包含预设控件的显示界面中,通过点击预设控件启动服务机器人,从而服务机器人可以接收到服务请求。
或者,服务机器人也可以在通过预设的输入框接收到第一标识符的情况下,确定接收到服务请求。
其中,预设的输入框,可以是预设在能够与服务机器人进行对话的对话界面中的输入框,也可以是存储设备显示界面中能够调用服务机器人的输入框等等,本公开对此不做限定。
其中,第一标识符是指可以用于调起功能选择器的符号。例如,第一标识符可以是“/”。功能选择器可以包含多个文件处理功能对应的服务标识,可以理解的是,在功能选择器中可调用的功能,可以根据实际需求进行自定义,以满足存储设备用户个性化定义功能选择器中功能的需求。
本公开实施例中,用户可以在与服务机器人的对话界面上预设的输入框中,输入第一标识符“/”,从而服务机器人在检测到第一标识符后可以接收到服务请求。
或者,也可以在收到的输入数据中包含预设字符的情况下,确定接收到服务请求,其中,输入数据为文本数据或音频数据。
其中,预设字符,是指预设在服务机器人中可以调用文件处理功能的字符,例如,预设字符可以是“服务”,当用户输入“视频处理服务”或“文本处理服务”时,由于输入数据包含“服务”字样,从而服务机器人可以识别后确定接收服务请求,调用相应文件处理功能等等,本公开对此不做限定。
需要说明的是,输入数据可以是在对话界面上的输入框中以文本的形式发送的,或者也可以通过点击对话界面上的语音控件,调起服务机器人的语音输入口,并通过语音输入口输入对应的语音,从而服务机器人可以接收到服务请求。
本公开实施例中,可以通过多种方式接收服务请求,从而提高了接收针对多媒体文件进行处理的服务请求的效率,使得用户可以采取最适合自己的方式发送请求,提高了用户的体验。
步骤102,在服务请求中未包含服务标识的情况下,确定存储设备对应的显示界面中当前显示的页面的类型。
其中,服务标识,是指可以识别到唯一服务的信息。显示页面的类型,可以为视频播放页面、音频播放页面、文件显示页面、多媒体文件列表页面等中的任意一项,本公开对此不做限定。由于不同类型的显示页面,显示的多媒体文件类型不同,而存储设备为不同类型的多媒体文件提供的服务可能不同,从而可以通过确定当前显示页面的类型,确定页面中多媒体文件的类型,为针对性地提供候选服务标识提供了条件。
本公开实施例中,服务请求也可以包含服务标识,此时服务机器人接收到服务请求后,就可以基于服务标识关联的服务对存储设备当前的显示页面中的多媒体文件进行处理。
步骤103,根据当前显示的页面的类型,确定并显示第一候选服务标识。
其中,第一候选服务标识,是指在不同类型的显示页面中,可选的一个或多个服务标识,可以包括文件摘要生成服务、文件改写服务、文件总结服务、文件分割服务、文件关键信息定位服务、图片生成服务、多文件融合服务,文件类型转换服务,文件搜索服务和文件知识点提取服务等中的至少一项,本公开对此不做限定,以方便用户根据处理需求来选择对多媒体文件所进行的处理服务。
需要说明的是,文件摘要生成服务可以调用具有文件生成功能的生成式语言模型,通过该生成式语言模型对多媒体文件进行信息提取及摘要生成。文件改写服务可以调用具有文件改写功能的生成式语言模型,通过该生成式语言模型对多媒体文件进行内容改写。文件总结服务可以调用具有文件总结功能的生成式语言模型,通过该生成式语言模型对多媒体文件进行关键内容概括。文件分割服务可以按照多媒体文件的内容,将该文件智能分成多个不同主题的段落。文件关键信息定位服务可以在多媒体文件中确定目标关键词的位置,或者也可以搜索图片中的人物在视频文件中出现的帧等等,本公开对此不做限定。图片生成服务可以根据用户需求通过图片生成模型获取目标类型的图片。多文件融合服务可以调用具有文件融合功能的生成式语言模型中,通过该生成式语言模型对多个多媒体文件进行融合。文件类型转换服务可以将一个或多个多媒体文件的类型进行转换,如将视频文件转换为音频文件等等。文件搜索服务可以根据用户输入的信息在存储设备中搜索相关联文件。文件知识点提取服务可以调用具有知识点提取功能的生成式语言模型,通过该生成式语言模型对多媒体文件进行知识点提取。
本公开中,不同类型的页面对应的第一候选服务标识可能是不同的。例如,当显示页面的类型为视频播放页面,此时可以对视频进行摘要提取、分割、截图等,因此对应地该类型确定的第一候选服务标识可以是文件摘要生成服务、文件分割服务、图片生成服务等。或者,当显示页面的类型为多媒体文件列表页面,此时可以将列表中的多个文件进行融合,或者在列表中查找目标多媒体文件等,因此该类型确定的第一候选服务标识可以是多文件融合服务、文件搜索服务等等,本公开对此不做限定。
在一些可能的实现形式中,可以在对话界面中显示第一候选服务标识。或者,也可以在预设的弹窗中显示第一候选服务标识,其中,弹窗显示窗口所在的显示层位于显示界面所在的显示层之上。从而可以提高显示页面的可用性,更有效直观地向用户展示确定的第一候选服务标识,进一步提高了用户的体验。
其中,对话界面是指在服务机器人与用户进行对话的过程中使用的界面。
在一些可能的实现形式中,可以根据待显示的第一候选服务标识的数量,确定目标显示模式,然后基于目标显示模式,显示第一候选服务标识。从而可以根据实际情况调整显示模式,有效避免了当第一候选服务标识数量过多时,由于显示模式不合理引起的操作误差。
其中,目标显示模式可以包括目标显示区域,目标显示区域的尺寸,第一候选服务标识的显示样式,显示界面中包含的第一候选服务标识的数量等中的至少一项,本公开对此不做限定。从而通过多样的显示模式,在显示第一候选服务标识结果时,提高了界面整体的协调性和美观性。
需要说明的是,第一候选服务标识的显示样式,可以包括字体大小等等,本公开对此不做限定。
在一些可能的实现形式中,第一候选服务标识可能有多个,则需要对这多个第一候选服务标识的显示顺序进行排序,因此可以基于存储设备所属用户的历史使用信息,确定每个第一候选服务的权重,然后基于每个第一候选服务的权重,确定多个第一候选服务标识的显示顺序,之后再依据多个第一候选服务标识的显示顺序,显示多个第一候选服务标识。使得可以根据用户对各服务的历史使用频率,确定用户的服务偏好顺序,从而优化了用户的使用感受,为提升多媒体文件的处理效率提供了条件。
本公开实施例中,调取存储设备所属用户对各个第一候选服务的历史使用情况,历史使用频次越高,其对应的第一候选服务的权重越大,从而可以根据各个第一候选服务的权重大小,将其关联的第一候选服务标识进行排序,再依据排序结果将第一候选服务标识显示出来。
步骤104,在检测到第一服务标识被选中的情况下,基于第一服务标识关联的第一服务,对当前的页面中显示的第一多媒体文件进行处理。
其中,第一多媒体文件,可以是一个或多个视频、音频等,本公开对此不做限定。
本公开实施例中,用户可以在第一候选服务标识的显示列表中根据自身需求点击目标的第一候选服务标识,从而服务机器人可以检测到选中的第一服务标识,并基于该第一服务标识关联的第一服务对当前的页面中显示的第一多媒体文件进行处理。
本公开实施例中,可以将对当前页面中显示的第一多媒体文件进行处理后得到的结果,在对话界面中以回复消息或发送文件的方式发给用户,从而用户可以得到该第一多媒体文件的处理结果。
举例说明,图2为本公开一对话界面的示意图。如图2中的a图所示,其中A为当前显示页面,用户在与服务机器人的对话界面中的输入框中输入第一标识符“/”后,对话界面显示功能选择器,由于当前的显示页面的类型为视频播放页面,则该功能选择器中的第一候选服务标识可以为文件摘要生成服务、文件分割服务、图片生成服务。如图2中的b图所示,当用户选定文件摘要生成服务作为第一服务标识时,服务机器人对当前页面中的视频文件进行摘要生成,并将生成的摘要结果在对话界面中发送给用户。
本公开实施例提供的存储设备中多媒体文件的处理方法,首先接收服务请求,在服务请求中未包含服务标识的情况下,确定存储设备对应的显示界面中当前显示的页面的类型,然后根据该页面类型,确定并显示第一候选服务标识,之后在检测到第一服务标识被选中的情况下,基于第一服务标识关联的第一服务,对当前页面中显示的第一多媒体文件进行处理。由此,通过基于显示界面显示的页面的类型,为用户提供可用的候选服务,并基于选中的服务标识智能地对存储设备页面中的多媒体文件进行处理,实现了对多媒体文件的自动处理,提高了文件处理的效率,节省了用户时间。
图3是根据本公开又一实施例提供的一种存储设备中多媒体文件的处理方法的流程示意图。
如图3所示,该存储设备中多媒体文件的处理方法可以包括:
步骤301,接收服务请求。
步骤302,在服务请求中未包含服务标识的情况下,确定存储设备对应的显示界面中当前显示的页面的类型。
步骤303,根据当前显示的页面的类型,确定并显示第一候选服务标识。
上述步骤301—步骤303的具体实现形式,可以参考本公开上述实施例的详细描述,此处不再赘述。
步骤304,在检测到第一服务标识被选中的情况下,基于第一服务标识及第一多媒体文件的标识,对存储设备中的文件进行遍历。
本公开实施例中,存储设备中可能储存有历史针对当前显示页面中的第一多媒体文件处理后生成的文件,因此在确定第一服务标识后,可以对存储设备中的文件进行遍历,以查找与第一服务标识及第一多媒体文件的标识相关联的文件。
步骤305,在存储设备中未包含与第一服务标识及第一多媒体文件的标识匹配的目标文件的情况下,基于第一服务标识关联的第一服务,对当前的页面中显示的第一多媒体文件进行处理。
其中,目标文件,是指存储在存储设备中,历史对第一多媒体文件进行第一服务标识关联的第一服务操作后生成的文件。
在一些可能的实现形式中,也可以在存储设备中包含与第一服务标识及第一多媒体文件的标识匹配的目标文件的情况下,在显示界面或对话界面中显示目标文件。或者,也可以在显示界面或对话界面显示目标文件关联的访问链接,当检测到访问链接被触发后,可在存储设备的显示界面上显示目标文件。从而通过将存储设备中与第一服务标识及第一多媒体文件的标识匹配的目标文件或其对应的访问链接显示出来,可以减少对多媒体文件进行在线处理的等待时间,提高多媒体文件的处理效率。
本公开实施例中,服务机器人在确定对当前显示页面中的多媒体文件进行处理的第一服务标识后,可以先在存储设备中查找是否包含相对应的历史生成文件,在确认不包含与第一服务标识及第一多媒体文件的标识相匹配的文件后再对第一多媒体文件进行处理,有效避免了对多媒体文件进行重复操作的情况,为提高处理效率提供了条件,节省了存储设备的储存空间。
步骤306,在显示界面或对话界面中显示基于第一服务处理后的目标文件。
本公开实施例中,服务机器人可以将第一多媒体文件基于第一服务处理后生成的目标文件在显示界面或对话界面中显示出来,以作为第一多媒体文件的处理结果发送给用户,使得用户可以在与服务机器人的交互过程中获取多媒体文件的处理结果,减少了用户获取多媒体文件的处理结果的时间。
在一些可能的实现形式中,可以将目标文件与第一服务标识及第一多媒体文件的标识关联存入存储设备中,从而在处理第一多媒体文件时,可以在存储设备中确认是否有对应的历史生成文件,为避免服务机器人对多媒体文件进行重复处理操作提供了条件,进一步提高了多媒体文件的处理效率。
步骤307,在接收到针对目标文件的编辑指令的情况下,基于编辑指令对目标文件进行更新。
本公开实施例中,用户可以根据需要对智能生成的目标文件进行调整,当用户点击目标文件所在界面中的编辑控件时,服务机器人可以接收到针对目标文件的相应的编辑指令,从而基于该指令对目标文件进行更新。
需要说明的是,在本公开中,既可以对存储设备中历史生成的目标文件进行编辑,也可以对基于第一服务标识关联的第一服务,对当前的页面中显示的第一多媒体文件进行处理后生成的目标文件进行编辑,本公开对此不做限定。
步骤308,将更新后的文件与第一服务标识及第一多媒体文件的标识关联存入存储设备中。
本公开实施例中,可以根据用户需求对智能处理生成的目标文件进行调整,并将更新后的目标文件与其对应标识关联存储在存储设备中,使得多媒体文件的处理结果更能符合用户需求,进一步优化了存储设备处理多媒体文件的使用体验,提高了存储设备储存文件作为多媒体文件处理结果的可靠性。
在本实施例中,首先接收服务请求,在服务请求中未包含服务标识的情况下,确定存储设备对应的显示界面中当前显示的页面的类型,然后根据当前显示的页面的类型,确定并显示第一候选服务标识,之后在检测到第一服务标识被选中的情况下,基于第一服务标识及第一多媒体文件的标识,对存储设备中的文件进行遍历,并且在存储设备中未包含与第一服务标识及第一多媒体文件的标识匹配的目标文件的情况下,基于第一服务标识关联的第一服务,对当前的页面中显示的第一多媒体文件进行处理,然后再在显示界面或对话界面中显示基于第一服务处理后的目标文件,之后再在接收到针对目标文件的编辑指令的情况下,基于编辑指令对目标文件进行更新,并将更新后的文件与第一服务标识及第一多媒体文件的标识关联存入存储设备中。由此,通过查找存储设备中的文件是否与第一服务标识及第一多媒体文件的标识匹配,基于匹配结果得到第一多媒体文件处理后的目标文件,并实现了对目标文件的编辑及关联标识储存的更新,从而,提高了文件处理的效率,优化了存储设备用户的使用体验。
图4是根据本公开又一实施例提供的一种存储设备中多媒体文件的处理方法的流程示意图。
如图4所示,该存储设备中多媒体文件的处理方法可以包括:
步骤401,在监测到存储设备的存储服务被调用的情况下,获取新存入存储设备中的第二多媒体文件。
在本公开中,为了减少多媒体文件在线处理的等待时间,可以在用户将新的多媒体文件存入存储设备时,就对该文件进行处理。
步骤402,确定第二多媒体文件的类型。
其中,第二多媒体文件的类型可以是视频、音频等等,本公开对此不做限定。
步骤403,基于与第二多媒体文件的类型关联的服务,对第二多媒体文件进行处理,获取对应的处理结果文件。
本公开实施例中,可以获取对不同类型的多媒体文件采取服务的历史记录,来确定第二多媒体文件的类型关联的服务。或者,也可以基于预设在服务机器人中的文件类型与服务的关联关系,来确定第二多媒体文件的类型关联的服务。
本公开实施例中,第二多媒体文件可能关联多个服务,此时可以基于每个服务分别对第二多媒体文件进行处理,以获取对应的多个处理结果文件。
步骤404,将处理结果文件与关联的服务标识、及第二多媒体文件的标识关联存入存储设备中。
上述步骤404的具体实现形式,可以参考本公开上述实施例的详细描述,此处不再赘述。
步骤405,在接收到针对第二多媒体文件的显示请求的情况下,获取第二多媒体文件,及第二多媒体文件的标识关联的处理结果文件的文件标识。
其中,文件标识可以为文件标题、摘要、链接等等,本公开对此不做限定。
本公开实施例中,可以当用户点击储存在存储设备中的第二多媒体文件时,接收到针对第二多媒体文件的显示请求。或者,也可以用户在对话界面发送类似于“播放XXX多媒体文件”等内容,从而服务机器人就可以接收到针对第二媒体文件的显示请求等等,本公开对此不做限定。
步骤406,在显示界面的第一区域中显示第二多媒体文件,并在显示界面的第二区域中显示处理结果文件的文件标识。
举例说明,图5为本公开一显示界面的示意图,如图5所示,其中,B为第一区域,C为第二区域。根据用户发送的显示请求,将相应的第二多媒体文件显示在第一区域中。同时获取储存在存储设备中对于该第二多媒体文件的各个处理结果文件,将其文件标识显示在第二区域中,可能是文件标识1、文件标识2、文件标识3……,显示的文件标识数量可以不是固定的,可以是根据用户需求确定的,也可以是根据第二多媒体文件的类型关联的服务数量来确定的,本公开对此不做限定。
在本实施例中,首先在监测到存储设备的存储服务被调用的情况下,获取新存入存储设备中的第二多媒体文件,然后确定第二多媒体文件的类型,并基于与第二多媒体文件的类型关联的服务,对第二多媒体文件进行处理,获取对应的处理结果文件,之后将处理结果文件与关联的服务标识、及第二多媒体文件的标识关联存入存储设备中,然后在接收到针对第二多媒体文件的显示请求的情况下,获取第二多媒体文件,及第二多媒体文件的标识关联的处理结果文件的文件标识,在显示界面的第一区域中显示第二多媒体文件,并在显示界面的第二区域中显示处理结果文件的文件标识。由此,通过对新的多媒体文件根据其类型提前进行处理,使得为减少多媒体文件在线处理的等待时间提供了条件,并且在接收到显示请求时直接在存储设备中获取并显示相应多媒体文件的处理结果文件,进一步提高了多媒体文件的处理效率,节省了用户时间。
图6是根据本公开又一实施例提供的一种存储设备中多媒体文件的处理方法的流程示意图。
如图6所示,该存储设备中多媒体文件的处理方法可以包括:
步骤601,在检测到第三多媒体文件被选中的情况下,确定预设的输入框中包含的第二标识符的数量。
其中,第二标识符,是指可以用于在显示界面或对话界面中调用文件选择器的符号,例如,第二标识符可以为“+”或“@”。
在本公开中,用户可以在已选定至少一个多媒体文件的基础上,通过在对话界面中的输入框中输入第二标识符来选中另一个多媒体文件,从而实现对多个多媒体文件进行联合处理,比如将多个多媒体文件进行合并等。
由于对单个多媒体文件进行处理的服务,与对多个多媒体文件进行联合处理的服务可能不同,因此,本公开中为了可以更加准确的为用户提供候选服务,服务机器人可以在每检测到一个第三多媒体文件被选中的情况下,都对输入框中包含的第二标识符的数量进行一次检测。
步骤602,根据第二标识符的数量及第三多媒体文件的类型,确定并显示第二候选服务标识。
本公开实施例中,可以先根据第二标识符的数量,确定可选的第二候选服务标识。例如,当第二标识符的数量大于2时,第二候选服务标识对应的服务应满足可以对多个多媒体文件处理的条件。然后在根据选中的第三多媒体文件的类型,例如视频、音频、文本等等,来确定第二候选服务标识。或者,也可以先根据第三多媒体文件的类型进行筛选,后根据第二标识符的数量进行再筛选,来确定第二候选服务的标识,本公开对此不做限定。
步骤603,在检测到第二服务标识被选中的情况下,基于第二服务标识关联的第二服务,对第三多媒体文件及已选中的其余多媒体文件进行处理。
需要说明的是,服务机器人在确定并显示第二候选服务标识后,用户可以并不进行服务选择,而继续在输入框中输入其他标识符,比如继续输入第二标识符,以继续进行多媒体文件的选择等等。之后服务机器人,可以基于用户的输入,继续进行候选文件推荐或候选服务推荐等,本公开对此不做限定。
上述步骤603的具体实现形式,可以参考本公开上述任一实施例的详细描述,此处不再赘述。
举例说明,图7为本公开一对话界面的示意图,第二标识符为“+”。如图7所示,在对话界面中的输入框中已输入“+XXX某”的情况下,若用户再输入一个第二标识符“+”,则服务机器人就可以在对话界面上显示文件选择器,其中,文件选择器包括当前存储设备空间中多个多媒体文件各自对应的文件标识。此时,若用户选定文件选择器中的“XXX某某”作为第三多媒体文件,此时服务机器人就可以确定输入框中包含的第二标识符“+”的数量为2,从而就可以在功能选择器中显示与“2”个“+”及“XXX某”、“XXX某某”关联的第二候选服务标识,比如“PDF文件合并服务”、“word文件对比服务”等等,并在用户选定了某一第二服务的情况下,基于选定的第二服务标识关联的第二服务对多个多媒体文件进行处理。
其中,需要说明的是,图7中仅示例出了部分多媒体文件标识,对应地,还可以通过对向下滑动文档选择器所对应的界面的方式来查看多媒体文件标识,或者,在文档选择器上显示有滑动条,可通过操作滑动条的方式来查看文档选择器中的其他多媒体文件标识,该实施对此不作具体限定。
在本实施例中,在检测到第三多媒体文件被选中的情况下,首先确定预设的输入框中包含的第二标识符的数量,然后根据第二标识符的数量及第三多媒体文件的类型,确定并显示第二候选服务标识,之后在检测到第二服务标识被选中的情况下,基于第二服务标识关联的第二服务,对第三多媒体文件及已选中的其余多媒体文件进行处理。由此,可以对存储设备中储存的多个多媒体文件进行联合处理,进一步丰富了对多媒体文件处理的多样性。
图8是根据本公开又一实施例提供的一种存储设备中多媒体文件的处理方法的流程示意图。
如图8所示,该存储设备中多媒体文件的处理方法可以包括:
步骤801,接收多媒体文件生成请求,其中,生成请求中包含参考信息及目标多媒体文件的类型。
其中,多媒体文件生成请求,可以是图片生成请求、文本生成请求等等,从而可以确定目标多媒体文件的类型。参考信息,可能是关键词,也可能是对图片的描述信息等等。本公开对此不做限定。
本公开实施例中,用户可以在对话界面向服务机器人发送对话内容,例如“帮我生成一个XX图”,从而服务机器人可以接收到多媒体文件生成请求。
步骤802,将存储设备中存储的与目标多媒体文件的类型相同的多媒体文件确定为参考多媒体文件。
举例说明,当生成请求中的目标多媒体文件的类型为风景图时,服务机器人可以先获取存储设备中储存的风景图作为多媒体文件生成的风格参考等等,本公开对此不做限定。通过确定多媒体参考文件,可以为生成更加符合用户风格喜好的多媒体文件提供条件,提高多媒体文件的生成效率。
步骤803,基于参考多媒体文件及参考信息,生成目标多媒体文件的类型对应的多媒体文件。
本公开实施例中,可以根据参考多媒体文件及参考信息,调用预设在服务机器人中的生成模型,以得到目标多媒体文件的类型对应的多媒体文件。
举例说明,如图9所示,图9是本公开一对话界面的示意图,用户在对话界面中向服务机器人发送“帮我生成一个风景图”,从而服务机器人可以接收到用户生成请求,并提取内容中的参考信息为“风景”,目标多媒体文件的类型为“风景图片”,然后以存储设备中存储的与目标多媒体文件的类型相同的多媒体文件作为参考,生成目标多媒体文件的类型对应的多媒体文件,并在对话界面中将生成结果发送给用户。
参照上述示例,服务机器人在生成风景图时,还可以基于用户在存储设备中已储存的风景图的内容生成新的风景图,例如,用户已储存的风景图多为春季图片,那么服务机器人就可以生成新的春季相关图片作为生成结果发送给用户。或者用户已储存的风景图多为包含花草的图片,那么服务机器人就可以生成花草相关的风景图作为生成结果发送给用户。
在本实施例中,首先接收多媒体文件生成请求,其中,生成请求中包含参考信息及目标多媒体文件的类型,然后将存储设备中存储的与目标多媒体文件的类型相同的多媒体文件确定为参考多媒体文件,之后再基于参考多媒体文件及参考信息,生成目标多媒体文件的类型对应的多媒体文件。由此,使得嵌入存储设备的服务机器人可以实现生成多媒体文件的功能,进一步提高了存储设备的功能多样性。
为了实现上述实施例,本公开实施例还提供一种存储设备中多媒体文件的处理装置。
图10是根据本公开一实施例提供的一种存储设备中多媒体文件的处理装置的结构示意图。
如图10所示,该存储设备中多媒体文件的处理装置1000可以包括:第一接收模块1001、第一确定模块1002、第一显示模块1003和第一处理模块1004,其中:
第一接收模块1001,用于接收服务请求。
第一确定模块1002,用于在服务请求中未包含服务标识的情况下,确定存储设备对应的显示界面中当前显示的页面的类型。
第一显示模块1003,用于根据当前显示的页面的类型,确定并显示第一候选服务标识。
第一处理模块1004,用于在检测到第一服务标识被选中的情况下,基于第一服务标识关联的第一服务,对当前的页面中显示的第一多媒体文件进行处理。
其中,需要说明的是,前述对存储设备中多媒体文件的处理方法实施例的解释说明也适用于本实施例,本实施对此不再赘述。
本公开实施例提供的存储设备中多媒体文件的处理方法,首先接收服务请求,在服务请求中未包含服务标识的情况下,确定存储设备对应的显示界面中当前显示的页面的类型,然后根据该页面类型,确定并显示第一候选服务标识,之后在检测到第一服务标识被选中的情况下,基于第一服务标识关联的第一服务,对当前页面中显示的第一多媒体文件进行处理。由此,通过基于显示界面显示的页面的类型,为用户提供可用的候选服务,并基于选中的服务标识智能地对存储设备页面中的多媒体文件进行处理,实现了对多媒体文件的自动处理,提高了文件处理的效率,节省了用户时间。。
在本公开的一些实施例中,图11是根据本公开又一实施例提供的一种存储设备中多媒体文件的处理装置的结构示意图。如图11所示,该存储设备中多媒体文件的处理装置1200可以包括:第一接收模块1101、第一确定模块1102、第一显示模块1103、第一处理模块1104、第一获取模块1105、第二确定模块1106、第二处理模块1107、存储模块1108、第二获取模块1109、第二显示模块1110、第三确定模块1111、第四确定模块1112、第三处理模块1113、第二接收模块1114、第五确定模块1115、生成模块1116;其中,第一显示模块1103,包括:第一确定单元11031、第一显示单元11032、第二确定单元11033、第三确定单元11034、第二显示单元11035。第一处理模块1104,包括:更新单元11041、存储单元11042。
在本公开的一些实施例中,第一接收模块1101,具体用于:
在监测到存储设备对应的显示界面中的预设控件被触发的情况下,确定接收到服务请求;或者,
在通过预设的输入框接收到第一标识符的情况下,确定接收到服务请求;或者,
在收到的输入数据中包含预设字符的情况下,确定接收到服务请求,其中,输入数据为文本数据或音频数据。
在本公开的一些实施例中,页面的类型为以下任一项:视频播放页面,音频播放页面,文件显示页面,多媒体文件列表页面。
在本公开的一些实施例中,第一接收模块1101,具体用于:在对话界面中显示第一候选服务标识;或者,
在预设的弹窗中显示第一候选服务标识,其中,弹窗显示窗口所在的显示层位于显示界面所在的显示层之上。
在本公开的一些实施例中,第一显示模块1103,包括:
第一确定单元11031,用于根据待显示的第一候选服务标识的数量,确定目标显示模式;
第一显示单元11032,用于基于目标显示模式,显示第一候选服务标识。
在本公开的一些实施例中,目标显示模式包括以下至少一项:目标显示区域,目标显示区域的尺寸,第一候选服务标识的显示样式,显示界面中包含的第一候选服务标识的数量。
在本公开的一些实施例中,第一显示模块1103,包括:
第二确定单元11033,用于基于存储设备所属用户的历史使用信息,确定每个第一候选服务的权重;
第三确定单元11034,用于基于每个第一候选服务的权重,确定多个第一候选服务标识的显示顺序;
第二显示单元11035,用于依据多个第一候选服务标识的显示顺序,显示多个第一候选服务标识。
在本公开的一些实施例中,第一处理模块1104,具体用于:
基于第一服务标识及第一多媒体文件的标识,对存储设备中的文件进行遍历;
在存储设备中未包含与第一服务标识及第一多媒体文件的标识匹配的目标文件的情况下,基于第一服务标识关联的第一服务,对当前的页面中显示的第一多媒体文件进行处理。
在本公开的一些实施例中,第一处理模块1104,具体用于:
在显示界面或对话界面中显示基于第一服务处理后的目标文件。
在本公开的一些实施例中,第一处理模块1104,具体用于:
将目标文件与第一服务标识及第一多媒体文件的标识关联存入存储设备中。
在本公开的一些实施例中,第一处理模块1104,具体用于:
在存储设备中包含与第一服务标识及第一多媒体文件的标识匹配的目标文件的情况下,在显示界面或对话界面中显示目标文件,或者,在显示界面或对话界面显示目标文件关联的访问链接。
在本公开的一些实施例中,第一处理模块1104,包括:
更新单元11041,用于在接收到针对目标文件的编辑指令的情况下,基于编辑指令对目标文件进行更新;
存储单元11042,用于将更新后的文件与第一服务标识及第一多媒体文件的标识关联存入存储设备中。
在本公开的一些实施例中,装置还包括:
第一获取模块1105,用于在监测到存储设备的存储服务被调用的情况下,获取新存入存储设备中的第二多媒体文件;
第二确定模块1106,确定第二多媒体文件的类型;
第二处理模块1107,用于基于与第二多媒体文件的类型关联的服务,对第二多媒体文件进行处理,获取对应的处理结果文件;
存储模块1108,用于将处理结果文件与关联的服务标识、及第二多媒体文件的标识关联存入存储设备中。
在本公开的一些实施例中,装置还包括:
第二获取模块1109,用于在接收到针对第二多媒体文件的显示请求的情况下,获取第二多媒体文件,及第二多媒体文件的标识关联的处理结果文件的文件标识;
第二显示模块1110,用于在显示界面的第一区域中显示第二多媒体文件,并在显示界面的第二区域中显示处理结果文件的文件标识。
在本公开的一些实施例中,装置还包括:
第三确定模块1111,用于在检测到第三多媒体文件被选中的情况下,确定预设的输入框中包含的第二标识符的数量;
第四确定模块1112,用于根据第二标识符的数量及第三多媒体文件的类型,确定并显示第二候选服务标识;
第三处理模块1113,用于在检测到第二服务标识被选中的情况下,基于第二服务标识关联的第二服务,对第三多媒体文件及已选中的其余多媒体文件进行处理。
在本公开的一些实施例中,装置还包括:
第二接收模块1114,用于接收多媒体文件生成请求,其中,生成请求中包含参考信息及目标多媒体文件的类型;
第五确定模块1115,用于将存储设备中存储的与目标多媒体文件的类型相同的多媒体文件确定为参考多媒体文件;
生成模块1116,用于基于参考多媒体文件及参考信息,生成目标多媒体文件的类型对应的多媒体文件。
在本公开的一些实施例中,第一候选服务标识包括以下至少一种:文件摘要生成服务、文件改写服务、文件总结服务、文件分割服务、文件关键信息定位服务、图片生成服务、多文件融合服务,文件类型转换服务,文件搜索服务和文件知识点提取服务。。
可以理解的是,本实施例附图11中的存储设备中多媒体文件的处理装置1100与上述实施例中存储设备中多媒体文件的处理装置1000,第一接收模块1101与上述实施例中的第一接收模块1001,第一确定模块1102与上述实施例中的第一确定模块1002,第一显示模块1103与上述实施例中的第一显示模块1003,第一处理模块1104与上述实施例中的第一处理模块1004,可以具有相同的功能和结构。
需要说明的是,前述对存储设备中多媒体文件的处理方法实施例的解释说明也适用于本实施例中的存储设备中多媒体文件的处理装置,此处不再赘述。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图12示出了可以用来实施本公开的实施例的示例电子设备1200的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图12所示,该电子设备1200可以包括计算单元1201,其可以根据存储在只读存储器(ROM)1202中的计算机程序或者从存储单元1208加载到随机访问存储器(RAM)1203中的计算机程序,来执行各种适当的动作和处理。在RAM 1203中,还可存储设备1200操作所需的各种程序和数据。计算单元1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(I/O)接口1205也连接至总线1204。
设备1200中的多个部件连接至I/O接口1205,包括:输入单元1206,例如键盘、鼠标等;输出单元1207,例如各种类型的显示器、扬声器等;存储单元1208,例如磁盘、光盘等;以及通信单元1209,例如网卡、调制解调器、无线通信收发机等。通信单元1209允许设备1200通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1201可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1201的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1201执行上文所描述的各个方法和处理,例如存储设备中多媒体文件的处理方法。例如,在一些实施例中,存储设备中多媒体文件的处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1208。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1202和/或通信单元1209而被载入和/或安装到设备1200上。当计算机程序加载到RAM 1203并由计算单元1201执行时,可以执行上文描述的存储设备中多媒体文件的处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元1201可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行存储设备中多媒体文件的处理方法。
本文中以上描述的装置和技术的各种实施方式可以在数字电子电路装置、集成电路装置、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上装置的装置(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程装置上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储装置、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储装置、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行装置、装置或设备使用或与指令执行装置、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体装置、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的装置和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的装置和技术实施在包括后台部件的计算装置(例如,作为数据服务器)、或者包括中间件部件的计算装置(例如,应用服务器)、或者包括前端部件的计算装置(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的装置和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算装置中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将装置的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机装置可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云服务服务器或云主机,是云服务服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。服务器可以是云服务器,也可以为分布式装置的服务器,或者是结合了区块链的服务器。
其中,需要说明的是,人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云服务、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (37)

1.一种存储设备中多媒体文件的处理方法,包括:
接收服务请求;
在所述服务请求中未包含服务标识的情况下,确定所述存储设备对应的显示界面中当前显示的页面的类型;
根据所述当前显示的页面的类型,确定并显示第一候选服务标识;
在检测到第一服务标识被选中的情况下,基于所述第一服务标识关联的第一服务,对所述当前的页面中显示的第一多媒体文件进行处理。
2.如权利要求1所述的方法,其中,所述接收服务请求,包括:
在监测到所述存储设备对应的显示界面中的预设控件被触发的情况下,确定接收到所述服务请求;或者,
在通过预设的输入框接收到第一标识符的情况下,确定接收到所述服务请求;或者,
在收到的输入数据中包含预设字符的情况下,确定接收到所述服务请求,其中,所述输入数据为文本数据或音频数据。
3.如权利要求1所述的方法,其中,所述页面的类型为以下任一项:视频播放页面,音频播放页面,文件显示页面,多媒体文件列表页面。
4.如权利要求1所述的方法,其中,所述显示第一候选服务标识,包括:
在对话界面中显示所述第一候选服务标识;或者,
在预设的弹窗中显示所述第一候选服务标识,其中,所述弹窗显示窗口所在的显示层位于所述显示界面所在的显示层之上。
5.如权利要求4所述的方法,其中,所述显示第一候选服务标识,包括:
根据待显示的第一候选服务标识的数量,确定目标显示模式;
基于所述目标显示模式,显示所述第一候选服务标识。
6.如权利要求5所述的方法,其中,所述目标显示模式包括以下至少一项:目标显示区域,目标显示区域的尺寸,第一候选服务标识的显示样式,显示界面中包含的第一候选服务标识的数量。
7.如权利要求1所述的方法,其中,第一候选服务标识为多个,所述显示第一候选服务标识,包括:
基于所述存储设备所属用户的历史使用信息,确定每个第一候选服务的权重;
基于每个所述第一候选服务的权重,确定所述多个第一候选服务标识的显示顺序;
依据所述多个第一候选服务标识的显示顺序,显示所述多个第一候选服务标识。
8.如权利要求1-7任一所述的方法,其中,所述基于所述第一服务标识关联的第一服务,对所述当前的页面中显示的第一多媒体文件进行处理,包括:
基于所述第一服务标识及所述第一多媒体文件的标识,对所述存储设备中的文件进行遍历;
在所述存储设备中未包含与所述第一服务标识及所述第一多媒体文件的标识匹配的目标文件的情况下,基于所述第一服务标识关联的第一服务,对所述当前的页面中显示的第一多媒体文件进行处理。
9.如权利要求8所述的方法,其中,在所述基于所述第一服务标识关联的第一服务,对所述当前的页面中显示的第一多媒体文件进行处理之后,还包括:
在所述显示界面或对话界面中显示基于所述第一服务处理后的目标文件。
10.如权利要求9所述的方法,其中,在所述基于所述第一服务标识关联的第一服务,对所述当前的页面中显示的第一多媒体文件进行处理之后,还包括:
将所述目标文件与所述第一服务标识及所述第一多媒体文件的标识关联存入所述存储设备中。
11.如权利要求8所述的方法,其中,在所述对所述存储设备中的文件进行遍历之后,还包括:
在所述存储设备中包含与所述第一服务标识及所述第一多媒体文件的标识匹配的目标文件的情况下,在所述显示界面或对话界面中显示所述目标文件,或者,在所述显示界面或所述对话界面显示所述目标文件关联的访问链接。
12.如权利要求9或11所述的方法,其中,在所述显示所述目标文件之后,还包括:
在接收到针对所述目标文件的编辑指令的情况下,基于所述编辑指令对所述目标文件进行更新;
将更新后的文件与所述第一服务标识及所述第一多媒体文件的标识关联存入所述存储设备中。
13.如权利要求8所述的方法,其中,还包括:
在监测到存储设备的存储服务被调用的情况下,获取新存入所述存储设备中的第二多媒体文件;
确定所述第二多媒体文件的类型;
基于与所述第二多媒体文件的类型关联的服务,对所述第二多媒体文件进行处理,
获取对应的处理结果文件;
将所述处理结果文件与所述关联的服务标识、及所述第二多媒体文件的标识关联存入所述存储设备中。
14.如权利要求13所述的方法,其中,还包括:
在接收到针对所述第二多媒体文件的显示请求的情况下,获取所述第二多媒体文件,及所述第二多媒体文件的标识关联的处理结果文件的文件标识;
在所述显示界面的第一区域中显示所述第二多媒体文件,并在所述显示界面的第二区域中显示所述处理结果文件的文件标识。
15.如权利要求1-7任一所述的方法,其中,还包括:
在检测到第三多媒体文件被选中的情况下,确定预设的输入框中包含的第二标识符的数量;
根据所述第二标识符的数量及所述第三多媒体文件的类型,确定并显示第二候选服务标识;
在检测到第二服务标识被选中的情况下,基于所述第二服务标识关联的第二服务,对所述第三多媒体文件及已选中的其余多媒体文件进行处理。
16.如权利要求1-7任一所述的方法,其中,还包括:
接收多媒体文件生成请求,其中,所述生成请求中包含参考信息及目标多媒体文件的类型;
将所述存储设备中存储的与所述目标多媒体文件的类型相同的多媒体文件确定为参考多媒体文件;
基于所述参考多媒体文件及所述参考信息,生成所述目标多媒体文件的类型对应的多媒体文件。
17.如权利要求1-7任一所述的方法,其中,所述第一候选服务标识包括以下至少一种:文件摘要生成服务、文件改写服务、文件总结服务、文件分割服务、文件关键信息定位服务、图片生成服务、多文件融合服务,文件类型转换服务,文件搜索服务和文件知识点提取服务。
18.一种存储设备中多媒体文件的处理装置,包括:
第一接收模块,用于接收服务请求;
第一确定模块,用于在所述服务请求中未包含服务标识的情况下,确定所述存储设备对应的显示界面中当前显示的页面的类型;
第一显示模块,用于根据所述当前显示的页面的类型,确定并显示第一候选服务标识;
第一处理模块,用于在检测到第一服务标识被选中的情况下,基于所述第一服务标识关联的第一服务,对所述当前的页面中显示的第一多媒体文件进行处理。
19.如权利要求18所述的装置,其中,所述第一接收模块,用于:
在监测到所述存储设备对应的显示界面中的预设控件被触发的情况下,确定接收到所述服务请求;或者,
在通过预设的输入框接收到第一标识符的情况下,确定接收到所述服务请求;或者,
在收到的输入数据中包含预设字符的情况下,确定接收到所述服务请求,其中,所述输入数据为文本数据或音频数据。
20.如权利要求18所述的装置,其中,所述页面的类型为以下任一项:视频播放页面,音频播放页面,文件显示页面,多媒体文件列表页面。
21.如权利要求18所述的装置,其中,所述第一显示模块,用于:
在对话界面中显示所述第一候选服务标识;或者,
在预设的弹窗中显示所述第一候选服务标识,其中,所述弹窗显示窗口所在的显示层位于所述显示界面所在的显示层之上。
22.如权利要求21所述的装置,其中,所述第一显示模块,包括:
第一确定单元,用于根据待显示的第一候选服务标识的数量,确定目标显示模式;
第一显示单元,用于基于所述目标显示模式,显示所述第一候选服务标识。
23.如权利要求22所述的装置,其中,所述目标显示模式包括以下至少一项:目标显示区域,目标显示区域的尺寸,第一候选服务标识的显示样式,显示界面中包含的第一候选服务标识的数量。
24.如权利要求18所述的装置,其中,第一候选服务标识为多个,所述第一显示模块,包括:
第二确定单元,用于基于所述存储设备所属用户的历史使用信息,确定每个第一候选服务的权重;
第三确定单元,用于基于每个所述第一候选服务的权重,确定所述多个第一候选服务标识的显示顺序;
第二显示单元,用于依据所述多个第一候选服务标识的显示顺序,显示所述多个第一候选服务标识。
25.如权利要求18-24任一所述的装置,其中,所述第一处理模块,用于:
基于所述第一服务标识及所述第一多媒体文件的标识,对所述存储设备中的文件进行遍历;
在所述存储设备中未包含与所述第一服务标识及所述第一多媒体文件的标识匹配的目标文件的情况下,基于所述第一服务标识关联的第一服务,对所述当前的页面中显示的第一多媒体文件进行处理。
26.如权利要25所述的装置,其中,所述第一处理模块,还用于:
在所述显示界面或对话界面中显示基于所述第一服务处理后的目标文件。
27.如权利要求26所述的装置,其中,所述第一处理模块,还用于:
将所述目标文件与所述第一服务标识及所述第一多媒体文件的标识关联存入所述存储设备中。
28.如权利要求25所述的装置,其中,所述第一处理模块,还用于:
在所述存储设备中包含与所述第一服务标识及所述第一多媒体文件的标识匹配的目标文件的情况下,在所述显示界面或对话界面中显示所述目标文件,或者,在所述显示界面或所述对话界面显示所述目标文件关联的访问链接。
29.如权利要求26或28所述的装置,其中,所述第一处理模块,包括:
第一更新单元,用于在接收到针对所述目标文件的编辑指令的情况下,基于所述编辑指令对所述目标文件进行更新;
第一存储单元,用于将更新后的文件与所述第一服务标识及所述第一多媒体文件的标识关联存入所述存储设备中。
30.如权利要求25所述的装置,其中,还包括:
第一获取模块,用于在监测到所述存储设备的存储服务被调用的情况下,获取新存入所述存储设备中的第二多媒体文件;
第二确定模块,确定所述第二多媒体文件的类型;
第二处理模块,用于基于与所述第二多媒体文件的类型关联的服务,对所述第二多媒体文件进行处理,获取对应的处理结果文件;
存储模块,用于将所述处理结果文件与所述关联的服务标识、及所述第二多媒体文件的标识关联存入所述存储设备中。
31.如权利要求30所述的装置,其中,还包括:
第二获取模块,用于在接收到针对所述第二多媒体文件的显示请求的情况下,获取所述第二多媒体文件,及所述第二多媒体文件的标识关联的处理结果文件的文件标识;
第二显示模块,用于在所述显示界面的第一区域中显示所述第二多媒体文件,并在所述显示界面的第二区域中显示所述处理结果文件的文件标识。
32.如权利要求18-24任一所述的装置,其中,还包括:
第三确定模块,用于在检测到第三多媒体文件被选中的情况下,确定预设的输入框中包含的第二标识符的数量;
第四确定模块,用于根据所述第二标识符的数量及所述第三多媒体文件的类型,确定并显示第二候选服务标识;
第三处理模块,用于在检测到第二服务标识被选中的情况下,基于所述第二服务标识关联的第二服务,对所述第三多媒体文件及已选中的其余多媒体文件进行处理。
33.如权利要求18-24任一所述的装置,其中,还包括:
第二接收模块,用于接收多媒体文件生成请求,其中,所述生成请求中包含参考信息及目标多媒体文件的类型;
第五确定模块,用于将所述存储设备中存储的与所述目标多媒体文件的类型相同的多媒体文件确定为参考多媒体文件;
生成模块,用于基于所述参考多媒体文件及所述参考信息,生成所述目标多媒体文件的类型对应的多媒体文件。
34.如权利要求18-24任一所述的装置,其中,所述第一候选服务标识包括以下至少一种:文件摘要生成服务、文件改写服务、文件总结服务、文件分割服务、文件关键信息定位服务、图片生成服务、多文件融合服务,文件类型转换服务,文件搜索服务和文件知识点提取服务。
35.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-17中任一项所述的方法。
36.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-17中任一项所述的方法。
37.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-17中任一项所述的方法。
CN202310802920.4A 2023-06-30 2023-06-30 存储设备中多媒体文件的处理方法、装置和设备 Pending CN116992057A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310802920.4A CN116992057A (zh) 2023-06-30 2023-06-30 存储设备中多媒体文件的处理方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310802920.4A CN116992057A (zh) 2023-06-30 2023-06-30 存储设备中多媒体文件的处理方法、装置和设备

Publications (1)

Publication Number Publication Date
CN116992057A true CN116992057A (zh) 2023-11-03

Family

ID=88525681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310802920.4A Pending CN116992057A (zh) 2023-06-30 2023-06-30 存储设备中多媒体文件的处理方法、装置和设备

Country Status (1)

Country Link
CN (1) CN116992057A (zh)

Similar Documents

Publication Publication Date Title
CN113657100B (zh) 实体识别方法、装置、电子设备及存储介质
US11019012B2 (en) File sending in instant messaging application
CN113407850B (zh) 一种虚拟形象的确定和获取方法、装置以及电子设备
CN116737908A (zh) 知识问答方法、装置、设备和存储介质
CN116303962A (zh) 对话生成方法、深度学习模型的训练方法、装置和设备
CN112506359B (zh) 输入法中候选长句的提供方法、装置及电子设备
CN108509442B (zh) 搜索方法和装置、服务器以及计算机可读存储介质
CN115879469B (zh) 文本数据处理方法、模型训练方法、装置及介质
CN117171296A (zh) 信息获取方法、装置和电子设备
WO2023142451A1 (zh) 工作流生成方法、装置、电子设备
CN114880498B (zh) 事件信息展示方法及装置、设备和介质
CN113873323B (zh) 视频播放方法、装置、电子设备和介质
CN113190154B (zh) 模型训练、词条分类方法、装置、设备、存储介质及程序
CN112860626B (zh) 一种文档排序方法、装置及电子设备
CN112231336B (zh) 识别用户的方法、装置、存储介质及电子设备
CN116992057A (zh) 存储设备中多媒体文件的处理方法、装置和设备
CN114118937A (zh) 基于任务的信息推荐方法、装置、电子设备及存储介质
CN108092875B (zh) 一种表情提供方法、介质、装置和计算设备
CN112989066A (zh) 数据处理方法和装置、电子设备、计算机可读介质
CN114501112B (zh) 用于生成视频笔记的方法、装置、设备、介质和产品
CN112783507B (zh) 数据引流回放方法、装置、电子设备及可读存储介质
CN114281981B (zh) 新闻简报的生成方法、装置和电子设备
CN115905490B (zh) 人机交互对话方法、装置以及设备
CN113377922B (zh) 用于匹配信息的方法、装置、电子设备以及介质
CN116257690A (zh) 一种资源推荐方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination