CN104298478B - 基于文件名对存储库动作的推断 - Google Patents

基于文件名对存储库动作的推断 Download PDF

Info

Publication number
CN104298478B
CN104298478B CN201410339081.8A CN201410339081A CN104298478B CN 104298478 B CN104298478 B CN 104298478B CN 201410339081 A CN201410339081 A CN 201410339081A CN 104298478 B CN104298478 B CN 104298478B
Authority
CN
China
Prior art keywords
file
filename
thesaurus
deduction
action
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410339081.8A
Other languages
English (en)
Other versions
CN104298478A (zh
Inventor
P.R.巴斯蒂德
M.E.布鲁姆霍尔
D.B.哈里斯
陆芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN104298478A publication Critical patent/CN104298478A/zh
Application granted granted Critical
Publication of CN104298478B publication Critical patent/CN104298478B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/185Hierarchical storage management [HSM] systems, e.g. file migration or policies thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • G06F16/166File name conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

响应于检测到对文件到文件存储库的文件上载请求,使用文本分析技术来推断包含文件的文件名的字符的子集的至少一个文件名元数据标记。从文件的文件名的字符提取至少一个推断的文件名元数据标记,而且将所提取的至少一个推断的文件名元数据标记映射到至少一个存储库上载处理动作。与对文件到文件存储库的文件上载请求相关联地运行至少一个存储库上载处理动作。

Description

基于文件名对存储库动作的推断
技术领域
本发明涉及文件名管理。更具体地,本发明涉及基于文件名对存储库动作的推断。
背景技术
用户可以使用由计算设备运行的应用来创建文件。用户使用应用所创建的文件可以包括基于文本的、图形的、可运行的、以及其它形式的文件。文件以创建或更新文件的一个或多个用户所指定的文件名来命名以用于存储。文件可以本地存储在运行应用的计算设备上,或者可以远程存储在文件存储库中。
发明内容
一种方法包括:响应于检测到对文件到文件存储库的文件上载请求,由处理器使用文本分析技术来推断包含文件的文件名的字符的子集的至少一个文件名元数据标记;从文件的文件名的字符提取至少一个推断的文件名元数据标记;将所提取的至少一个推断的文件名元数据标记映射到至少一个存储库上载处理动作;以及与对文件到文件存储库的文件上载请求相关联地运行至少一个存储库上载处理动作。
一种系统包括:文件存储库;以及处理器,其被编程为:响应于检测到对文件到文件存储库的文件上载请求,使用文本分析技术来推断包含文件的文件名的字符的子集的至少一个文件名元数据标记;从文件的文件名的字符提取至少一个推断的文件名元数据标记;将所提取的至少一个推断的文件名元数据标记映射到至少一个存储库上载处理动作;以及与对文件到文件存储库的文件上载请求相关联地运行至少一个存储库上载处理动作。
一种计算机程序产品包括以其具体实现了计算机可读程序代码的计算机可读存储介质,其中当该计算机可读程序代码在计算机上被运行时使得计算机:响应于检测到对文件到文件存储库的文件上载请求,使用文本分析技术来推断包含文件的文件名的字符的子集的至少一个文件名元数据标记;从文件的文件名的字符提取至少一个推断的文件名元数据标记;将所提取的至少一个推断的文件名元数据标记映射到至少一个存储库上载处理动作;以及与对文件到文件存储库的文件上载请求相关联地运行至少一个存储库上载处理动作。
附图说明
图1是根据本主题的实施例的用于基于文件名推断存储库动作的系统的实现方式的示例的框图。
图2是根据本主题的实施例的能够执行基于文件名推断存储库动作的核心处理模块200的实现方式的示例的框图。
图3是根据本主题的实施例的基于文件名推断存储库动作的过程的实现方式的示例的流程图。
图4A是根据本主题的实施例的基于文件上载和文件下载的、基于文件名推断存储库动作的过程内的初始处理的实现方式的示例的流程图。
图4B是根据本主题的实施例的基于文件上载和文件下载的、基于文件名推断存储库动作的过程内的附加处理的实现方式的示例的流程图。
具体实施方式
下面阐述的示例表示了使本领域的技术人员能够实施本发明的必要信息并且例示了实施本发明的最佳实施例。在依据附图阅读以下描述之时,本领域技术人员将了解本发明的构思,并将认识到本文未具体提出的这些构思的应用。应当理解,这些构思和应用都落入本公开和权利要求书的范围之内。
本文描述的主题提供了基于文件名对存储库动作的推断。在协作/社交文件编辑和文件开发环境内的文件管理可以通过基于元数据执行配置的动作来改善,所述元数据是在向/从共享的文件存储库上载文件和下载文件期间实时地从文件名的字符推断/暗示的。基于文件名对存储库动作的推断(本文中可替换地,“推断的存储库动作”)可以包括响应于文件上载和文件下载而执行的文件重命名和其它配置的处理动作。除了响应于文件管理活动的文件重命名之外,推断的存储库动作还可以包括许多形式的处理,如下面更详细地描述的。互补的推断的存储库动作可以被配置用于存储文件(例如,文件上载)和从存储装置检索文件(例如,文件下载)中的任一者或两者。
作为初步的示例,在文件上载期间文件重命名的配置的推断的存储库动作可以被指定为识别文件名内的“推断的元数据”(例如,特定于用户的文件名方面),以从文件名或文件的内容提取推断的元数据,并且存储文件,其中推断的元数据从文件名中删除并与存储库内的文件名分开地与文件相关联。相反,或者作为补充,在正从存储装置检索文件的情况下,推断的存储库动作可以包括重新映射先前推断和提取的元数据,以及将推断的元数据添加回文件名,以使得用户可以再次识别具有由用户指定的文件名的文件。
提取的推断的元数据还可以被映射到适合给定的实现方式的其它推断的存储库动作。(一个多个)推断的存储库动作可以被运行以修改文件名和/或执行其它系统动作,如下面更详细地描述的。一个或多个推断的存储库动作可以被配置用于文件下载操作,所述文件下载操作可以是文件上载推断的存储库动作的互补(例如,将特定于用户的文件名方面添加回文件名)。额外地或可替换地,用于下载的一个或多个推断的存储库动作可以独立于文件上载推断的存储库动作。
除了文件名重命名之外的额外的推断的存储库动作可以包括响应于文件管理活动的多种形式的处理。例如,推断的存储库动作可以包括响应于文件管理活动通知一个或多个用户的指定通知推断的存储库动作,如下面更详细地描述的。额外地,版本控制、用户缩写指定(user initial designation)、用户配置文件标识符(user profileidentifier)、组织详情、优先级指定(priority designation)、日期修改、委托详情和控制、访问控制列表权限、共享指定(sharing designation)、草稿状态(draft status)、和其它推断的存储库动作都可以被执行。另外,推断的存储库动作可以以双向和互补的方式来执行,从而在文件被存储和检索时分别执行相应的映射。
为了描述关于文件名的推断的存储库动作的示例,将使用诸如“file1-v1Temp-jEdits.doc”的文件名,其中文件名的“-v1Temp-jEdits”部分表示用户指定的文件扩展名。当这样的文件存储在诸如存储库中时,用户指定的文件扩展名(例如,“-v1Temp-jEdits”)可以从文件名中提取以作为元数据。文件可以被重命名为“file1.doc”,而且元数据“-v1Temp-jEdits”可以与重命名的文件相关联地存储。元数据可以被划分并存储为单独的元素(例如,“v1Temp”和“jEdits”可以是分开的元数据元素),或者元数据可以被存储为统一的元数据元素。继续同一示例,在同一用户从存储库检索存储的文件“file1.doc”时,推断的存储库动作可以被实现为将该文件重命名为原来的用户指定的文件名“file1-v1Temp-jEdits.doc”以供用户在本地使用。
应当注意,用于重命名文件的推断的元数据提取和重新映射的双向推断的存储库动作的处理对于给定文件的每个用户而言可以是不同的,并且可以由用户或组织指定。在配置之时,用于重命名文件的元数据提取和重新映射的双向推断的存储库动作可以在没有用户干预的情况下执行。
针对推断的存储库动作的用户偏好可以被配置为用户推断的存储库动作偏好,并且还可以适合给定的实现方式地被配置在用户推断的存储库动作配置文件内。此外,学习算法和组织推断的存储库动作策略(例如,将被应用于整个组织、部门等的策略)可以被利用和配置以管理用于文件上载和文件下载二者的推断的存储库动作处理。推断的存储库动作偏好/策略可以被用来基于从文件的文件名的字符的子集推断的一个或多个文件名元数据标记来实时推导存储库处理动作。
此外,关于在文件下载时的文件名修改,(例如,个人的或组织的)推断的存储库动作偏好/策略可以被配置为例如,限制被置于/映射到文件名中的推断的元数据项的量或数目。例如,在推断的元数据的其它元素(例如,组织名称)可用的情况下,添加到文件名中的推断的元数据可以被限制为版本、所有者和日期。因此,在先前推断和提取的元数据的若干元素可用的情况下,推断的元数据的全部或一部分可以在下载时被映射到文件名中。
出于本描述的目的,术语“上载”和“存储”将各自表示存储到文件系统或存储库的事件。类似地,术语“下载”和“检索”将各自表示从文件系统或存储库获取存储的文件的事件。
下面初始的示例都是从检测来自多个用户的文件上载和文件下载请求的文件共享系统的推断存储库处理动作模块的角度呈现的。推断存储库处理动作模块响应于检测到文件上载和文件下载请求而执行处理,如以上和下面更详细地描述的。
应当理解,虽然下面某些示例推断的存储库动作的初始描述是相对于文件上载操作呈现的,但是为了避免过度冗余,下面对示例推断的存储库动作的描述也将用作上载和下载推断的存储库动作的基础。要理解,对于下面描述的实现用于文件上载的任何推断的存储库动作,可以适合给定的实现方式地并且适合给定的推断的存储库动作地执行对于文件下载的互补的或可替换的处理。基于文件上载和文件下载,本技术在用户或组织的(一个或多个)偏好的用户界面中呈现文件/文件名。
关于文件上载操作,响应于检测到文件上载请求,推断存储库处理动作模块可以关于检测到的动作是否是文件替换动作或者检测到的动作是否是存储正在上载的新的文件进行确定。
如果检测到的动作是替换文件,则处理继续替换该文件。相反,如果检测到的动作是存储正在上载的新的文件时,推断存储库处理动作模块确定任何相关的文件是否已经存在于被管理的存储装置中。如果任何相关的文件已经存在于被管理的存储装置中,则推断存储库处理动作模块向用户呈现将新的上载的文件与现有的文件合并的选项。
下面的分析可以由推断存储库处理动作模块实现以识别和提取可用来发现/识别相关文件的推断的元数据(例如,可替换地在本文中被称为“推断的标记”或“推断的文件名元素”)和/或可用来修改用于识别相关文件的相关文件搜寻范围的推断的标记/元数据。推断存储库处理动作模块可以分析和提取文件名的推断的文件名元素/标记(例如,“file1”、“v1Temp”和“jEdits”)。
此外,关于文本分析技术,自然语言处理技术、可用于模式匹配的正则表达式、定制/集成的文本提取例程、或其它标记/元数据提取技术都可以被用来分析文件名的文本,并从文件名提取标记/元数据。文件名然后可以被修改以删除推断的元数据。
提取的文件名元数据标记然后可以被映射到推断的存储库动作。为了在上面的描述上扩展,在推断的存储库动作包括响应于文件管理活动通知一个或多个用户的“指定通知推断的存储库动作”的情况下,可以由推断存储库处理动作模块利用缩写和文件共享指定或文件共享权限的组合向一个或多个用户通知由文件管理动作所采取的(一个或多个)动作。
此外,在推断的存储库动作包括“版本控制推断的存储库动作”的情况下,处理可以被执行来修改存储库中的文件的版本号(例如,“v1”、“version1(版本1)”、“v3”)。在文件的先前的版本号没有改变的情况下,版本标识符不递增。
在推断的存储库动作包括“用户缩写指定推断的存储库动作”的情况下,处理可以被执行来建议添加作者或归属作者资格。推断存储库处理动作模块可以扫描在线社交网络或(一个或多个)协作列表(例如,电子邮件组/列表等)或者可以扫描文件管理系统以识别相关的缩写(例如,“jd”或其它缩写)。
在推断的存储库动作包括“用户配置文件标识符推断的存储库动作”的情况下,处理可以被执行来自动设置一个或多个相关联的访问控制列表。推断存储库处理动作模块可以扫描在线社交网络以识别相关的配置文件网络(例如,“jDoe”)。
类似地,在推断的存储库动作包括“组织详情推断的存储库动作”的情况下,处理可以被执行来将文件归属到文件夹或文件的集合(例如,“company name(公司名称)”等)。在推断的存储库动作包括“优先级指定推断的存储库动作”的情况下,处理可以被执行来修改文件的任何视图中的排序优先级(例如,“HIGH(高)”、“IMMEDIATE ACTION(立即动作)”等)。在推断的存储库动作包括“日期修改推断的存储库动作”的情况下,处理可以被执行来修改日期(例如,到期日期)或编辑日期,或者修改日期格式(例如,“31MAR”、“MAR31”、“MARCH31”、“Q3”、“1H”等)。在推断的存储库动作包括“委托详情和控制推断的存储库动作”的情况下,处理可以被执行来自动将一个或多个用户添加到文件访问控制列表(例如,“FORjDoe”)。在推断的存储库动作包括“访问控制列表权限推断的存储库动作”的情况下,处理可以被执行来将一个或多个用户添加到具有设置的访问级别的文件(例如,“For Review(供审阅)”、“review=reader(审阅=读者)”等)。在推断的存储库动作包括“共享指定推断的存储库动作”的情况下,处理可以被执行来自动将一个或多个用户添加到访问控制列表(例如,“Share with jDoe(与jDoe共享)”)。在推断的存储库动作包括“草稿状态推断的存储库动作”的情况下,处理可以被执行来暂停版本控制/修订操作,或暂时重复新的版本号(例如,“DRAFT(草稿)”,“FINAL Draft(最终稿)”等)。应当理解,可以响应于文件上载或文件下载活动而执行的其它形式的推断的存储库动作都是可能的,并且所有这样的推断的存储库动作都被认为在本主题的范围之内。
在具有以上对若干可能的推断的存储库动作的描述的情况下,对互补的文件下载动作进行描述。要理解,对于下面的描述,可以执行互补的推断的存储库动作。以上对示例推断的存储库动作的描述足以允许对文件下载的互补处理的描述。
关于文件下载操作,响应于检测到文件下载请求,推断存储库处理动作模块可以对将被应用到正在下载的文件的任何配置的用户或组织所偏好的推断的存储库动作进行确定。推断存储库处理动作模块将对象的先前推断和提取的元数据的至少一个子集映射到文件名中。如上所述,推断存储库处理动作模块可以利用任何配置的限制或选择操作以按照用户和/或各组织内所偏好的来修改文件名,而且先前推断和提取的元数据的全部或一部分可以在下载时被映射到文件名中。推断存储库处理动作模块按照各偏好/配置文件所配置的来修改下载的文件的名称。推断存储库处理动作模块向文件提供修改后的文件名,而且文件可以被存储到用户的计算设备上的本地存储装置中以供使用以及在用户或组织的偏好的用户界面/应用内进行编辑。
应当注意,如果针对各个用户的(一个多个)偏好没有现有的元数据,则推断存储库处理动作模块可以利用“faux”或默认条目来修改下载。默认条目可以由用户修改以适合用户的偏好,并且在随后上载之时,针对用户的元数据可以被推断、提取、并且与文件相关联地存储以供在随后的文件下载期间使用。
此外,在高速缓存可用且被利用的系统中,推断存储库处理动作模块可以默认为适合给定的实现方式的文件所有者、访问控制列表、或组织偏好的推断的存储库动作。在这样的实现方式中,推断存储库处理动作模块可以自动将时间元素插入到文件名中,以便提高对于高速缓存和高速缓存管理的请求。
推断存储库处理动作模块还可以记录或监视下载请求,并且可以认识到用户先前下载了与他们正请求的文件相同的文件的情形。在这种情形下,推断存储库处理动作模块可以向用户呈现消息,该消息指示该文件先前被下载(例如,“你先前将这个文件下载为XYZ-v1.odt”)。可以向用户呈现停止或继续下载的选项。
下面描述可用于实现本技术的若干额外的可配置的操作。一个可配置的操作可以包括控制对系统的访问的策略和管理特征的实现方式。额外地,一个可配置的操作可以包括控制对系统的使用和访问的安全和隐私功能的实现方式。另一个可配置的操作可以包括将文件名元数据的映射扩展到以上和下面更详细地描述的动作的机器学习技术的实现方式。此外,可配置的操作可以包括文件名元数据到动作的新的或增强的映射的实现方式。另一可配置的操作可以包括全球语言文件名容量(例如,用于法语、英语等的文件名容量)的实现方式。此外,可配置的操作可以包括实现内置的机器翻译工具,在文件名翻译期间,当在该过程中利用不同的语言更新文件名和版本号时可以利用该内置的机器翻译工具。另一可配置的操作可以包括用于文件名不具有要被推断/提取的任何元数据的情形的文件名分析的决策过程,以及分析文件内容以暗示和提取适用于文件名增加用途的相关详情/元数据的实现方式。另一可配置的操作可以包括作为推断的存储库动作的一部分的、推断的委托特征(例如,委托特定个人进行进一步动作)的实现方式。此外,可配置的操作可以包括为推断/提取的元数据配置存储持续时间和为过期元数据配置到期时间的策略的实现方式。额外的可配置的操作可以包括修改在线文件存储库的视图,以示出用户的推断的视图偏好,而不是示出存储的删除了元数据的文件名(例如,针对文件并在存储库的示出文件名的视图内,用户1输入初始版本和标题)。又一可配置的操作可以包括基于用户上载的文件对视图进行改变。对视图的改变可以是作为一次性动作基于元数据设置的,或者对视图的改变可以是在新的文件被上载时的连续的重访(例如,一次性的或依赖于系统中文件名的改变)。另一可配置的操作可以包括“按需”、“异步”、“同步”、或者以批处理模式运行推断的存储库动作的操作。额外地,可配置的操作可以包括使能用于其它应用的应用入口点以代表其他用户利用推断/提取的元数据,诸如例如,从而使能客户关系管理(customerrelationship management,CRM)系统的入口点以访问文件,并且使用CRM系统的(一个或多个)用户的(一个或多个)偏好视图来提供被命名的文件。另一可配置的操作可以包括自动运行推断的存储库动作,或提示用户确认对推断的存储库动作的运行以及响应于用户的确认而运行推断的存储库动作。额外的可配置的操作可以包括识别文档生命周期中的文档的状态以作为推断的元数据处理的一部分。此外,可配置的操作可以包括保密标志的实现方式和动态安全的实现方式。
如从上面的描述可以看出的,许多可配置的操作可以被实现。每个可配置的操作可以与其它可配置的操作一起组合和/或配置,或者可以适合给定的实现方式地被分开实现和/或配置。许多其它可配置的操作是可能的并且所有这样的可配置的操作被认为在本主题的范围之内。
应当注意,本主题的构思是在认识到与常规的文件名管理相关联的某些限制的情况下产生的。例如,据观察,对在线文件存储库使用的增加以及在线协作的增加已经导致在线存储库内存储的文件/条目的显著增加。额外地,据观察,当用户使用存储的文件/条目在业务过程内协作时,在存储库内命名的被存储的文件/条目与协作用户的专门工作流状态不相关,而且不代表用户所使用的业务流程的当前状态。此外,据观察,在单个文件在存储库内具有被不同的用户不同地命名的多个版本或重复,并且常常在被存储的文件名内捕获不对业务处理添加价值的信息的情况下,相关性的缺乏被复合。额外地,据观察,文件中的元数据或文档管理系统版本信息与用户指定的文件名版本信息之间的不一致是用户文件名操纵所导致的。例如,据观察,常规的文档管理系统可以指示文件处于版本一(1),而由用户指定的文件名可以被命名为诸如“filename_usernameEdits_v2.doc”。此外,据观察,由于用户命名不一致,相同文件的多个实例可以被存储在存储库中,这种冗余不必要地减少了这样的存储库的存储容量。鉴于这若干个观察,确定利用文件名修改来抽象文件名信息以用于存储、使用抽象的文件名信息进行互补的文件名修改以用于使用/编辑的统一途径将提高存储库文件名管理和与业务流程的文件名相关性以及用户协作。本主题通过提供基于文件名对存储库动作的推断来提高存储库文件名管理,如上面和下面更详细地描述的。因此,通过使用本技术可以获得提高的存储库效用和文件名与用户文件操作的相关性。
本文所述的基于文件名对存储库动作的推断可以实时地执行,以允许迅速的双向上载和下载推断的元数据识别、提取和抽象、以及基于推断的元数据的双向文件名修改。出于本描述的目的,实时将包括足够短的以为所述主题的用户可接受的信息处理提供合理响应时间的持续时间的任何时间帧。额外地,术语“实时”将包括通常称为“近乎实时”的时间帧—一般指的是足够短的以为所述主题的用户可接受的按需信息处理提供合理响应时间的持续时间的任何时间帧(例如,在几分之一秒内或在几秒内)。这些术语虽然难以精确定义,但本领域的普通技术人员会很好地领会。
图1是用于基于文件名推断存储库动作的系统100的实现方式的示例的框图。计算设备_1 102至计算设备_N104经由网络106与若干其它设备通信。其它设备包括服务器_1108至服务器_M110以及文件存储库112。文件存储库112可以包括一个或多个物理设备(其可以是自管理的文件服务器类型设备),并且因此可以包括一个或多个独立或分布式文件存储库。额外地或可替换地,文件存储库112可以适合给定的实现方式地由服务器_1 108至服务器_M110中的一个或多个管理。图1内所示的任何设备可以根据可用作如上面和下面更详细地描述的用于基于文件名推断存储库动作的共享文件系统来实现和参与。
如将与图2至图4B相关联地更详细地描述的,计算设备_1 102至计算设备_N104、服务器_1 108至服务器_M110、以及文件存储库112(其被配置为存储库和文件服务器)各自可以提供自动的基于文件名对存储库动作的推断。自动的基于文件名对存储库动作的推断基于双向上载和下载推断的元数据识别、提取和抽象,以及基于推断的元数据标记的双向文件名修改。因此,本技术可以适合给定的实现方式地在用户计算设备或服务器设备等级处实现。本主题的实现方式存在各种可能性,并且所有这样的可能性被认为在本主题的范围之内。
为了进一步阐述系统100的子系统的示例粒度,一个或多个系统用户可以在系统100内被配置为文件或文件集的“所有者”或“管理者”,而且其他系统用户/参与者可以被配置为文件或文件集的“用户”。此外,服务器_1 108至服务器_M110中的一个或多个、和/或文件存储库112可以被配置为可由系统用户访问的文件共享子系统/服务。服务器_1 108至服务器_M110中的同一服务器或另一服务器可以被配置为社交网络子系统,该社交网络子系统管理系统100内的用户并允许系统用户之间的协作和网络交互。文件名修改子系统或模块可以被配置为代表系统用户处理双向文件名修改和其它推断的存储库动作。文件名修改子系统或模块还可以包括存储子系统或者与存储可用来实现本技术的文件共享模型和参数的存储子系统(例如,文件存储库112)接口,并且还可以包括用于向社交网络的用户通知任何实现的文件共享改变的通知子系统。用于功能粒度划分的许多其它可能性是可能的,并且所有这样的可能性被认为在本主题的范围之内。
应当注意,与图1相关联地描述的各计算设备中的任何计算设备可以是或者通过用户能力将各计算设备移动到不同位置,或者通过各计算设备与便携式平台(诸如飞机、火车、汽车或其它移动车辆)的关联的便携式计算设备。还应当注意,各计算设备可以是能够如上面和下面更详细地描述地处理信息的任何计算设备。例如,各计算设备可以包括诸如个人计算机(例如,台式计算机、膝上型计算机等)或手持设备(例如,蜂窝电话、个人数字助理(PDA)、电子邮件设备、音乐记录或重放设备、平板计算设备、电子书阅读设备等)、网络服务器、应用服务器或其它数据服务器设备等的设备,或者能够如上面和下面更详细描述地处理信息的任何其它设备。
网络106可以包括适合于预期目的的任何形式的互连,包括私人或公共网络(例如分别为内部网或因特网)、直接模块间互连、拨号、无线、或能够互连各设备的任何其它互连机制。
文件存储库112可以包括本地或远程文件服务器、网络附加存储装置(networkattached storage)、或任何其它存储类型的设备。因此,文件存储库112可以被实现为适合给定的实现方式。
图2是能够执行基于文件名对存储库动作的推断的核心处理模块200的实现方式的示例的框图。核心处理模块200可以适合给定的实现方式地或者与计算设备_1 102至计算设备_N104相关联,或者与服务器_1 108到服务器_M110相关联、或者与文件存储库112相关联。因此,核心处理模块200在本文中被一般地描述,可是要理解,核心处理模块200内的组件的实现方式的许多变化是可能的并且所有这样的变化都在本主题的范围之内。
此外,与每个实现方式相关联地,核心处理模块200可以基于推断的元数据提供对上载和下载文件名修改的不同的和互补的处理,并且可以基于推断的元数据提供对推断的存储库动作的不同的和互补的处理。因此,对于下面的任意示例,要理解相对于与另一设备相结合地描述的任何一个设备所描述的功能的任意方面(例如,发送等)应被理解为同时描述其它相应设备的功能(例如,接收等)。
中央处理单元(CPU)202在核心处理模块200内提供计算机指令运行、计算和其它功能。显示器204给核心处理模块200的用户提供视觉信息,而输入设备206为用户提供输入功能。
显示器204可以包括任何显示设备,诸如阴极射线管(CRT)、液晶显示器(LCD)、发光二极管(LED)、电子墨水显示器(electronic ink display)、投影仪、触摸屏或者其它显示元件或面板。输入设备206可以包括计算机键盘、小键盘、鼠标、笔、操纵杆、触摸屏、或用户可以通过其与显示器204上的信息交互并响应于该信息的任何其它类型的输入设备。
通信模块208提供允许核心处理模块200与系统100内的其它模块通信的互连功能。通信模块208可以包括适合于给定的实现方式的可用来提供互连功能的任何电、协议和协议转换功能。
存储器210包括推断的元数据和推断的动作配置存储区域212,其在核心处理模块200内存储用于上载和下载文件名修改的偏好和配置文件(例如,用户和/或组织偏好和配置文件)、以及其它配置信息。文件名和推断的动作处理存储区域214提供存储装置以用于提取推断的/暗示的文件元数据、用于配置的推断的存储库动作的处理、以及用于与上载和下载操作相关联的文件名的修改。
要理解,存储器210可以包括适合于预期目的的易失性和非易失性存储器的任意组合,适当地为分布式的或本地的,并且可以包括在本示例中为了例示的目的而未图示的其它存储器段。例如,存储器210可以包括代码存储区域、操作系统存储区域、代码运行区域和数据区域,而不偏离本主题的范围。
推断存储库处理动作模块216也被图示出。推断存储库处理动作模块216在文件上载操作期间提供从文件名的元数据/标记识别和提取,并且基于提取的元数据/标记推断要执行的存储库动作。推断存储库处理动作模块216在文件下载操作期间还提供推断的元数据/标记到文件名中的映射以及插回,并基于重新插入的元数据/标记推断要执行的存储库动作。推断存储库处理动作模块216实现核心处理模块200的自动的基于文件名对存储库动作的推断。
还应当注意,推断存储库处理动作模块216可以形成所描述的其它电路的一部分,而不偏离本主题的范围。此外,推断存储库处理动作模块216可以可替换地被实现为存储在存储器210内的应用,在这样的实现方式中,推断存储库处理动作模块216可以包括由CPU202运行的、用于执行本文描述的功能的指令。CPU202可以运行这些指令,以提供上面和下面更详细地描述的核心处理模块200的处理功能。推断存储库处理动作模块216可以形成中断服务例程(interrupt service routine,ISR)的一部分、操作系统的一部分、浏览器应用的一部分、或者分开的应用的一部分,而不偏离本主题的范围。
在与核心处理模块200相关联的图2内再次示出了文件存储库112。因此,文件存储库112可以适合给定的实现方式地、在不使用网络连接性的情况下可操作地耦合到核心处理模块200。
CPU202、显示器204、输入设备206、通信模块208、存储器210、推断存储库处理动作模块216、以及文件存储库112经由互连组件218互连。互连218可以包括系统总线、网络、或能够出于各个目的向各组件提供适当互连的任何其它互连。
虽然为了便于例示和描述的目的,图2内图示出的不同的模块被示为组件级模块,但是应当注意,这些模块可以包括用于执行上面和下面更详细地描述的各模块的功能的任何硬件、(一个或多个)编程处理器、和存储器。例如,模块可以包括专用集成电路(ASIC)、处理器、天线、和/或分立的集成电路形式的附加控制器电路,以及用于执行与各模块相关联的通信和电气控制活动的组件。此外,模块可以适当地包括中断级、堆栈级和应用级模块。此外,模块可以包括用于存储、运行和数据处理的任何存储器组件,以用于执行与各模块相关联的处理活动。模块也可以形成所描述的其它电路的一部分或者可以被组合,而不偏离本主题的范围。
额外地,虽然核心处理模块200利用所述的某些组件图示并具有所述的某些组件,但是其它模块和组件可以与核心处理模块200相关联而不偏离本主题的范围。额外地,应当注意,虽然为了便于例示将核心处理模块200描述为单个设备,但是核心处理模块200内的组件可以是同地协作的或分布式的并且经由网络互连,而不偏离本主题的范围。对于分布式布置,显示器204和输入设备206可以位于销售点设备、资讯站或其它位置处,而CPU202和存储器210可以位于本地或远程服务器。核心处理模块200的组件的许多其它可能的布置是可能的,并且它们都被认为在本主题的范围之内。还应当理解,虽然出于示例的目的将文件存储库112图示为分开的组件,但是存储在文件存储库112内的信息也/可替换地可以存储在存储器210内,而不偏离本主题的范围。因此,核心处理模块200可以采取许多形式,并且可以与许多平台相关联。
下面描述的图3至图4B代表可以由诸如核心处理模块200的设备运行以执行与本主题相关联的自动的基于文件名推断存储库动作的示例过程。示例过程的许多其它变化是可能的,并且全部都被认为在本主题的范围之内。示例过程可以由诸如推断存储库处理动作模块216之类的模块执行,和/或由与这样的设备相关联的CPU202运行。应当注意,出于便于例示的目的,在下面描述的示例过程内没有图示出超时过程和其它错误控制过程。然而,要理解,所有这些过程都被认为在本主题的范围之内。此外,所描述的过程可以被组合,所描述的处理的序列可以被改变,而且额外的处理可以被添加或删除而不偏离本主题的范围。
图3是基于文件名推断存储库动作的过程300的实现方式的示例的流程图。在块302处,过程300响应于检测到对文件到文件存储库的文件上载请求,由处理器使用文本分析技术来推断包含文件的文件名的字符的子集的至少一个文件名元数据标记。在块304处,过程300从文件的文件名的字符提取至少一个推断的文件名元数据标记。在块306处,过程300将所提取的至少一个推断的文件名元数据标记映射到至少一个存储库上载处理动作。在块308处,过程300与对文件到文件存储库的文件上载请求相关联地运行至少一个存储库上载处理动作。
图4A至图4B图示了基于文件上载和文件下载的、基于文件名推断存储库动作的过程400的实现方式的示例的流程图。图4A图示了过程400内的初始处理。在判定点402处,过程400关于是否已检测到文件上载操作,诸如到文件存储库112的文件上载,进行确定。响应于在判定点402处确定尚未检测到文件上载操作,过程400在判定点404处关于是否已检测到文件下载操作,诸如来自文件存储库112的文件下载,进行确定。响应于在判定点404确定尚未检测到文件下载操作,过程400返回到判定点402,并如上所述地进行重复。
返回到判定点402的描述,响应于确定已检测到文件上载操作,过程400在框406处使用文本分析技术分析文件名的文本。如上所述,诸如自然语言处理、可用于模式匹配的正则表达式、和定制/集成的文本提取例程的文本分析技术,或者其它标记/元数据提取技术都可以被用来分析文件名的文本,并从文件名提取标记/元数据。
在框408处,过程400从所分析的文件名的字符的一个或多个子集推断一个或多个文件名元数据标记。在框410处,过程400从文件的文件名的字符提取至少一个推断的文件名元数据标记。在框412处,过程400识别与存储库相关联的推断的存储库动作策略。应当注意,推断的存储库动作策略可以被划分成一个或多个策略,例如推断的存储库动作上载策略和推断的存储库动作下载策略。在推断的存储库动作策略被划分的情况下,在框412处的处理可以识别推断的存储库动作上载策略。
在框414处,过程400在各推断的存储库动作策略内识别与所提取的(一个或多个)推断的文件名元数据标记相关联的一个或多个推断的存储库上载处理动作。例如,一个或多个推断的存储库上载动作可以包括例如,适合给定的实现方式地创建和更新具有文件版本信息、用户缩写、用户配置文件标识符、组织配置文件标识符、动作优先级、日期、委托详情、访问控制列表权限、文件共享指定、草稿状态、通知的元数据或者与存储库相关联的其它元数据来中的至少一个的动作。
在判定点416处,过程400关于一个或多个推断的存储库上载处理动作中是否包括文件名更新进行确定。响应于确定一个或多个推断的存储库上载处理动作中包括文件名更新,过程400在框418处基于在从文件名的字符提取至少一个推断的文件名元数据标记之后剩余的文件名来形成更新的文件名。在框420处,过程400完成文件上载并且将使用更新的文件名的文件存储到文件存储库。在框422处,过程400将提取的至少一个推断的文件名元数据标记与存储库中存储的文件相关联。因此,文件名可以被修改以提取元数据标记,而且元数据标记可以与存储库内的文件相关联地被保存。
响应于在框422处完成提取的至少一个推断的文件名元数据标记与存储库中存储的文件的关联,或者响应于在判定点416处确定一个或多个推断的存储库上载处理动作中没有包括文件名更新,过程400在判定点424处关于一个或多个其它的推断的存储库动作是否被配置为与文件上载操作相关联地运行进行确定。如上所述,额外的推断的存储库动作可以包括例如,适合给定的实现方式地创建和/或更新具有文件版本信息、用户缩写、用户配置文件标识符、组织配置文件标识符、动作优先级、日期、委托详情、访问控制列表权限、文件共享指定、草稿状态、通知的元数据或者与存储库相关联的其它元数据。
响应于在判定点424处确定一个或多个其它的推断的存储库动作被配置为与文件上载操作相关联地运行,过程400在框426处运行其它配置的推断的存储库动作。为了节省绘图空间,这些示例动作中的每一个的判定点和处理没有单独列出,但是要被理解为形成图4A内的框426处所示的处理的一部分。
响应于在框426处运行其它配置的推断的存储库动作,或者响应于在判定点424处确定其它推断的存储库动作没有被配置为与文件上载操作相关联地运行,过程400返回到判定点402并如上所述进行重复。
返回到判定点404的描述,响应于确定已检测到文件下载操作,诸如对来自文件存储库112的文件的文件下载请求,过程400转变到与图4B相关联地示出和描述的处理。
图4B图示了基于文件上载和文件下载的、与用于基于文件名推断存储库动作的过程400相关联的附加处理。在框428处,过程400识别与存储在文件存储库中的文件相关联的至少一个推断的文件名元数据标记。在框430处,过程400识别与存储库相关联的推断的存储库动作策略。如上面提到的,推断的存储库动作策略可以被划分成一个或多个策略,例如推断的存储库动作上载策略和推断的存储库动作下载策略。在推断的存储库动作策略被划分的情况下,在框430处的处理可以识别推断的存储库动作下载策略。
在框432处,过程400将所识别的与在文件存储库中的文件相关联的至少一个推断的文件名元数据标记映射到至少一个推断的存储库下载处理动作。与上载处理一样,推断的存储库下载动作可以包括例如,适合给定的实现方式地识别和映射元数据中的至少一个的动作,所述元数据是与文件版本信息、用户缩写、用户配置文件标识符、组织配置文件标识符、动作优先级、日期、委托详情、访问控制列表权限、文件共享指定、草稿状态、通知相关联的元数据或者与存储库相关联的其它元数据。
在判定点434处,过程400关于一个或多个推断的存储库下载处理动作中是否包括文件名更新进行确定。响应于确定一个或多个推断的存储库下载处理动作中包括文件名更新,过程400在判定点436处,例如根据识别的推断的存储库动作策略,关于是否已配置对(一个或多个)推断的文件名元数据标记到文件名的映射的限制进行确定。例如,可以配置文件名长度限制或者在下载期间将被映射到文件的文件名中的配置的元数据标记的数目。另外,这种限制可以针对个别用户或组织(例如,按部门)配置,或以其它方式配置以适合于给定的实现方式。
响应于在判定点436处确定已配置对(一个或多个)推断的文件名元数据标记到文件名的映射的限制,过程400在框438处在推断的文件名元数据标记到文件名中的映射的任何配置的(一个或多个)限制内,将(一个或多个)推断的文件名元数据标记映射到文件的文件名中。响应于在判定点436处确定尚未配置对(一个或多个)推断的文件名元数据标记到文件名的映射的限制,过程400在框440处将所有的(一个或多个)推断的文件名元数据标记映射到文件名中。响应于在框438和框440之一处完成各推断的元数据标记到文件名的映射,过程400在框442处修改文件名以并入映射的(一个或多个)推断的文件名元数据标记。
响应于在框442处修改文件名以并入映射的(一个或多个)推断的文件名元数据标记,或者响应于在判定点434处确定一个或多个推断的存储库下载处理动作中没有包括文件名更新,过程400在判定点444关于一个或多个其它推断的存储库动作是否被配置为与文件下载操作相关联地运行进行确定。如上所述,额外的推断的存储库动作可以包括例如,适合给定的实现方式地识别和/或映射与文件版本信息、用户缩写、用户配置文件标识符、组织配置文件标识符、动作优先级、日期、委托详情、访问控制列表权限、文件共享指定、草稿状态、通知相关联的元数据或者与存储库相关联的其它元数据。
响应于在判定点444确定一个或多个其它推断的存储库动作被配置为与文件下载操作相关联地运行,过程400在框446处运行其它配置的推断的存储库动作。为了节省绘图空间,这些示例动作中的每一个的判定点和处理没有单独列出,但是要理解为形成图4B内的框446处所示的处理的一部分。
响应于在框446处运行其它配置的推断的存储库动作,或者响应于在判定点444处确定一个或多个其它推断的存储库动作没有被配置为与文件下载操作相关联地运行,过程400在框448处下载文件。应当注意,如果一个或多个推断的存储库处理动作修改了文件名,则可以利用修改的文件名下载文件,或者可以利用存储库内存储的文件名下载文件。过程400返回到与上面图4A的判定点402相关联地描述的处理并且如上所述地进行重复。
因此,过程400处理针对文件存储库的文件上载和文件下载操作二者。过程400在上载处理期间从文件的文件名的字符的子集推断元数据。推断的元数据被从文件名中删除并与存储库中的文件相关联地存储,而且推断的元数据可以调用各种推断的存储库处理上载动作。响应于下载操作,推断的元数据可以被映射回文件名,以便用户再次看到用户在上载时使用的相同文件名。推断的元数据可以在下载期间被再次使用,以调用各种推断的存储库处理下载动作。各种推断的存储库处理下载动作可以互补于或独立于各种推断的存储库处理上载动作。
如以上与图1至图4B相关联地描述的,示例系统和过程提供了基于文件名对存储库动作的推断。与基于文件名对存储库动作的推断相关联的许多其它变体和额外的动作是可能的,并且全部都被认为在本主题的范围之内。
本领域技术人员将认识到,在考虑以上教导之时,以上某些示例是基于使用诸如CPU202之类的编程处理器的。然而,本发明并不限于这样的示例实施例,因为其它实施例可以使用诸如专用硬件和/或专用处理器之类的硬件组件等同物来实现。类似地,通用计算机、基于微处理器的计算机、微控制器、光学计算机、模拟计算机、专用处理器、专用电路和/或专用硬连线逻辑可以被用于构造可替换的等同实施例。
所属技术领域的技术人员知道,本发明的各个方面可以实现为系统、方法或计算机程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的示例(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
下面将参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。
也可以把这些计算机程序指令存储在计算机可读存储介质中,这些指令使得计算机、其它可编程数据处理装置以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品(article of manufacture)。
计算机程序指令还可以被加载到计算机、其它可编程数据处理装置或者其它设备上,以使得在计算机、其它可编程装置或其它设备上执行一系列的操作步骤,以产生计算机实现的过程,从而在计算机或其它可编程装置上运行的指令提供用于实现在流程图和/或框图的一个或多个方框中指定的功能/动作的过程。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
适合存储和/或运行程序代码的数据处理系统将包括直接或通过系统总线间接耦合到存储器元件的至少一个处理器。存储器元件可以包括在程序代码的实际运行期间采用的本地存储器、大容量存储装置、和提供对至少一些程序代码的临时存储,以便减少在运行期间必须从大容量存储装置中检索代码的次数的高速缓冲存储器。
输入/输出或I/O设备(包括但不限于键盘、显示器、定位设备等)可以或直接或通过中介I/O控制器耦合到系统。
网络适配器也可以耦合到系统,以使数据处理系统能够通过中介专用或公用网络耦合到其它数据处理系统或远程打印机或者存储设备。调制解调器、电缆调制解调器和以太网卡仅仅是几种当前可用类型的网络适配器。
本文所使用的术语只是为了描述具体实施例的目的而无意限制本发明。如本文所使用的,单数形式“一”、“一个”也有意包括复数形式,除非上下文另有明确指示。还将理解,术语“包括”当在本说明书中使用,指定存在所陈述的特征、整体、步骤、操作、元件、和/或组件,但不排除存在或附加一个或多个其它特征、整体、步骤、操作、元件、组件、和/或它们的群体。
权利要求书中的所有装置或步骤以及功能元件的相应结构、材料、动作以及等价物有意包括用于结合其它所要求保护的元件执行如具体要求保护的功能的任何结构、材料或动作。呈现本发明的描述是为了例示和描述的目的,但不是穷尽性的或使本发明限于所公开的形式。对本领域普通技术人员来说,许多修改和变化将是明显的,但不偏离本发明的范围和精神。选择和描述实施例是为了最佳地解释本发明的原理和实际应用,并使其它本领域普通技术人员能够针对如适于设想的特定用途地作出各种修改的各种实施例理解本发明。

Claims (14)

1.一种文件处理系统,包括:
文件存储库;以及
处理器,其被编程为:
响应于检测到对文件到文件存储库的文件上载请求,使用文本分析技术来推断包含文件的文件名的字符的子集的至少一个文件名元数据标记;
从文件的文件名的字符提取至少一个推断的文件名元数据标记;
将所提取的至少一个推断的文件名元数据标记映射到至少一个存储库上载处理动作;以及
与对文件到文件存储库的文件上载请求相关联地运行至少一个存储库上载处理动作。
2.如权利要求1所述的系统,其中,在被编程为将所提取的至少一个推断的文件名元数据标记映射到至少一个存储库上载处理动作的过程中,所述处理器被编程为:
识别与文件存储库相关联的推断的存储库动作策略;以及
识别与所提取的至少一个推断的文件名元数据标记相关联的至少一个存储库上载处理动作。
3.如权利要求1所述的系统,其中,在被编程为与对文件到文件存储库的文件上载请求相关联地运行至少一个存储库上载处理动作的过程中,所述处理器被编程为:
基于在从文件名的字符提取至少一个推断的文件名元数据标记之后剩余的文件名来形成更新的文件名;
将使用更新的文件名的文件存储到文件存储库;以及
将提取的至少一个推断的文件名元数据标记与存储库中存储的文件相关联。
4.如权利要求1所述的系统,其中,所述至少一个存储库上载处理动作包括创建和更新元数据中的至少一个的动作,所述元数据是从包括以下各项的组中选择的:
文件版本信息、用户缩写、用户配置文件标识符、组织配置文件标识符、动作优先级、日期、委托详情、访问控制列表权限、文件共享指定、草稿状态和通知。
5.如权利要求1所述的系统,其中,所述处理器还被编程为:
检测对存储在文件存储库中的文件的文件下载请求;
识别与存储在文件存储库中的文件相关联的至少一个推断的文件名元数据标记;
将所识别的与存储在文件存储库中的文件相关联的至少一个推断的文件名元数据标记映射到至少一个存储库下载处理动作;以及
与对存储在文件存储库中的文件的文件下载请求相关联地运行至少一个存储库下载处理动作。
6.如权利要求5所述的系统,其中,在被编程为与对存储在文件存储库中的文件的文件下载请求相关联地运行至少一个存储库下载处理动作的过程中,所述处理器被编程为:
将所识别的至少一个推断的文件名元数据标记映射到文件的文件名的字符中;
修改文件的文件名以将所映射的至少一个推断的文件名元数据标记并入文件的文件名的字符中;以及
响应于检测到的文件下载请求,下载具有修改的文件名的文件。
7.如权利要求6所述的系统,其中,在被编程为将所识别的至少一个推断的文件名元数据标记映射到文件的文件名的字符中的过程中,所述处理器被编程为:
识别与文件存储库相关联的推断的存储库动作策略;
根据所识别的推断的存储库动作策略,确定所识别的至少一个推断的文件名元数据标记到文件的文件名的字符中的映射的至少一个限制;
在所确定的至少一个限制内,将所识别的至少一个推断的文件名元数据标记映射到文件的文件名的字符中;以及
修改文件名以将所映射的至少一个推断的文件名元数据标记并入文件的文件名的字符中。
8.一种文件处理方法,包括:
响应于检测到对文件到文件存储库的文件上载请求,由处理器使用文本分析技术来推断包含文件的文件名的字符的子集的至少一个文件名元数据标记;
从文件的文件名的字符提取至少一个推断的文件名元数据标记;
将所提取的至少一个推断的文件名元数据标记映射到至少一个存储库上载处理动作;以及
与对文件到文件存储库的文件上载请求相关联地运行至少一个存储库上载处理动作。
9.如权利要求8所述的方法,其中,将所提取的至少一个推断的文件名元数据标记映射到至少一个存储库上载处理动作包括:
识别与文件存储库相关联的推断的存储库动作策略;以及
识别与所提取的至少一个推断的文件名元数据标记相关联的至少一个存储库上载处理动作。
10.如权利要求8所述的方法,其中,与对文件到文件存储库的文件上载请求相关联地运行至少一个存储库上载处理动作包括:
基于在从文件名的字符提取至少一个推断的文件名元数据标记之后剩余的文件名来形成更新的文件名;
将使用更新的文件名的文件存储到文件存储库;以及
将提取的至少一个推断的文件名元数据标记与存储库中存储的文件相关联。
11.如权利要求8所述的方法,其中,所述至少一个存储库上载处理动作包括创建和更新元数据中的至少一个的动作,所述元数据是从包括以下各项的组中选择的:
文件版本信息、用户缩写、用户配置文件标识符、组织配置文件标识符、动作优先级、日期、委托详情、访问控制列表权限、文件共享指定、草稿状态和通知。
12.如权利要求8所述的方法,还包括:
检测对存储在文件存储库中的文件的文件下载请求;
识别与存储在文件存储库中的文件相关联的至少一个推断的文件名元数据标记;
将所识别的与存储在文件存储库中的文件相关联的至少一个推断的文件名元数据标记映射到至少一个存储库下载处理动作;以及
与对存储在文件存储库中的文件的文件下载请求相关联地运行至少一个存储库下载处理动作。
13.如权利要求12所述的方法,其中,与对存储在文件存储库中的文件的文件下载请求相关联地运行至少一个存储库下载处理动作包括:
将所识别的至少一个推断的文件名元数据标记映射到文件的文件名的字符中;
修改文件的文件名以将所映射的至少一个推断的文件名元数据标记并入文件的文件名的字符中;以及
响应于检测到的文件下载请求,下载具有修改的文件名的文件。
14.如权利要求13所述的方法,其中,将所识别的至少一个推断的文件名元数据标记映射到文件的文件名的字符中包括:
识别与文件存储库相关联的推断的存储库动作策略;
根据所识别的推断的存储库动作策略,确定关于将所识别的至少一个推断的文件名元数据标记映射到文件的文件名的字符中的至少一个限制;
在所确定的至少一个限制内,将所识别的至少一个推断的文件名元数据标记映射到文件的文件名的字符中;以及
修改文件名以将所映射的至少一个推断的文件名元数据标记并入文件的文件名的字符中。
CN201410339081.8A 2013-07-16 2014-07-16 基于文件名对存储库动作的推断 Active CN104298478B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/942,769 US9460107B2 (en) 2013-07-16 2013-07-16 Filename-based inference of repository actions
US13/942,769 2013-07-16

Publications (2)

Publication Number Publication Date
CN104298478A CN104298478A (zh) 2015-01-21
CN104298478B true CN104298478B (zh) 2017-11-21

Family

ID=52318225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410339081.8A Active CN104298478B (zh) 2013-07-16 2014-07-16 基于文件名对存储库动作的推断

Country Status (2)

Country Link
US (3) US9460107B2 (zh)
CN (1) CN104298478B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9460107B2 (en) 2013-07-16 2016-10-04 International Business Machines Corporation Filename-based inference of repository actions
US20150356508A1 (en) * 2014-06-06 2015-12-10 International Business Machines Corporation Collaboration using extensible state sharing
US20160065647A1 (en) * 2014-08-26 2016-03-03 Sandeep VENKATESH System and method for enabling downloading of files
US10133791B1 (en) * 2014-09-07 2018-11-20 DataNovo, Inc. Data mining and analysis system and method for legal documents
CN105812352B (zh) * 2016-02-23 2019-07-19 四川长虹电器股份有限公司 用于cm的远程访问控制列表生成及数据包处理方法
US10033686B2 (en) * 2016-05-23 2018-07-24 Oath Inc. Computerized system and method for automatically creating and communicating media streams of digital content
BE1023607B1 (fr) * 2016-12-22 2017-05-15 Valipat Sa Methode et systeme de collecte de documents numeriques a partir d’une pluralite de source
CN108334292A (zh) * 2017-01-20 2018-07-27 三纬国际立体列印科技股份有限公司 打印机的成型材数据存取保护方法
CN107657020A (zh) * 2017-09-27 2018-02-02 上海斐讯数据通信技术有限公司 一种海量小文件快速识别处理的方法及系统
CN111602198B (zh) * 2017-12-20 2023-03-31 萨罗尼科斯贸易与服务一人有限公司 可用于选择多媒体内容的读取和再现的系统、设备和方法
US11119979B2 (en) * 2018-07-30 2021-09-14 International Business Machines Corporation Content based recommendations of file system save locations
US10896150B2 (en) * 2018-09-24 2021-01-19 International Business Machines Corporation Predicting need to rename obscurely named documents
US11394813B1 (en) * 2019-07-10 2022-07-19 Ethernovia Inc. Protocol independent data unit forwarding
ES2966018T3 (es) * 2020-02-20 2024-04-17 Boeing Co Repositorio inteligente basado en metadatos relacionales
CN115134164B (zh) * 2022-07-18 2024-02-23 深信服科技股份有限公司 一种上传行为检测方法、系统、设备及计算机存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101582064A (zh) * 2008-05-15 2009-11-18 阿里巴巴集团控股有限公司 一种大数据量数据处理方法及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7818456B2 (en) * 2004-06-24 2010-10-19 International Business Machines Corporation Method and system for processing a file attached to an electronic document
US20070136328A1 (en) * 2005-11-25 2007-06-14 International Business Machines Corporation System and method for managing files to be attached to and detached from an electronic document
US8195715B2 (en) 2006-01-27 2012-06-05 Elsevier, Inc. Systems and methods for saving and applying user-specified file naming conventions
EP2453367B1 (en) 2010-11-16 2014-02-12 BlackBerry Limited Automatic file naming on a mobile device
US20130304777A1 (en) * 2012-05-09 2013-11-14 Google Inc. Mapping metadata on import of a music library
US9619487B2 (en) * 2012-06-18 2017-04-11 International Business Machines Corporation Method and system for the normalization, filtering and securing of associated metadata information on file objects deposited into an object store
US9460107B2 (en) 2013-07-16 2016-10-04 International Business Machines Corporation Filename-based inference of repository actions

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101582064A (zh) * 2008-05-15 2009-11-18 阿里巴巴集团控股有限公司 一种大数据量数据处理方法及系统

Also Published As

Publication number Publication date
US10262008B2 (en) 2019-04-16
CN104298478A (zh) 2015-01-21
US20150026225A1 (en) 2015-01-22
US9460108B2 (en) 2016-10-04
US20160357781A1 (en) 2016-12-08
US9460107B2 (en) 2016-10-04
US20150026226A1 (en) 2015-01-22

Similar Documents

Publication Publication Date Title
CN104298478B (zh) 基于文件名对存储库动作的推断
US20210026613A1 (en) Data model api for live applications in a cloud collaboration platform
CN102999482B (zh) 用于管理协作文档的技术
US10511653B2 (en) Discussion-based document collaboration
CN102982083B (zh) 跨分层级别的规则继承
Hutchinson Natural language processing and machine learning as practical toolsets for archival processing
CN107787491A (zh) 用于重新使用文档中的内容的文档存储
CN106716402A (zh) 以实体为中心的知识发现
CN103246748B (zh) 自动管理文件描述符的技术
CN107533633A (zh) 利用学习程序用于数据操纵
US20200301566A1 (en) Environmental context based emoji selection in computing devices
CN103473256A (zh) 利用域专用语言来定义内容保留规则
WO2021188204A1 (en) Storage and automated metadata extraction using machine teaching
US20150332287A1 (en) Social customer relationship management opportunity templating
CN110249356A (zh) 一种用户定义的erp功能的共享方法及系统
WO2021188209A1 (en) Interface for machine teaching modeling
WO2022020005A1 (en) Enterprise knowledge graphs using user-based mining
CN108205564B (zh) 知识体系构建方法及系统
US20200202300A1 (en) Intelligent document management in computing systems
CN110308926A (zh) 软件信息展示方法、装置、计算机装置及计算机存储介质
CN115543428A (zh) 一种基于策略模板的模拟数据生成方法和装置
CN106030572A (zh) 与外部内容项的经编码的关联
EP4182855A1 (en) Annotations for enterprise knowledge graphs using multiple toolkits
Sudar et al. DUCES: A Framework for Characterizing and Simplifying Mobile Deployments in Low-Resource Settings
Angelopoulos et al. Small fish in a big pond: An architectural approach to users privacy, rights and security in the age of big data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant