CN101729440B - 发送文件的以及接收文件的设备与方法 - Google Patents

发送文件的以及接收文件的设备与方法 Download PDF

Info

Publication number
CN101729440B
CN101729440B CN2008101732707A CN200810173270A CN101729440B CN 101729440 B CN101729440 B CN 101729440B CN 2008101732707 A CN2008101732707 A CN 2008101732707A CN 200810173270 A CN200810173270 A CN 200810173270A CN 101729440 B CN101729440 B CN 101729440B
Authority
CN
China
Prior art keywords
path
file
tag
node
label vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008101732707A
Other languages
English (en)
Other versions
CN101729440A (zh
Inventor
裘民民
刘世霞
丁宏伟
董进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CN2008101732707A priority Critical patent/CN101729440B/zh
Priority to KR1020090077010A priority patent/KR101104039B1/ko
Priority to US12/608,482 priority patent/US8244734B2/en
Publication of CN101729440A publication Critical patent/CN101729440A/zh
Priority to US13/475,212 priority patent/US20120233189A1/en
Application granted granted Critical
Publication of CN101729440B publication Critical patent/CN101729440B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/44Star or tree networks

Abstract

发送文件的以及接收文件的设备与方法。接收文件的设备包含:接收装置,被配置为接收文件,和与所述文件相关的至少一个标签路径;路径选择装置,被配置为从候选路径中选择最低层节点的标签向量与每个所述标签路径的最高层节点的标签向量间的相似度超过预定阈值的至少一个路径,以作为存储路径;和存储装置,被配置为将所述文件存储在所述存储路径中。

Description

发送文件的以及接收文件的设备与方法
技术领域
本发明涉及网络环境下计算机间的文件交换,尤其涉及发送文件的设备与方法,以及接收文件的设备与方法。
背景技术
基于计算机网络的应用正日益普及。文件交换频繁发生在各种计算机网络应用中,例如,万维网(World Wide Web)文件上传和下载、诸如IBMSametime、Microsoft Windows Live Messenger、Google Talk的即时消息应用中的文件传送、诸如Microsoft Outlook的电子邮件应用中附件的传送、诸如EMULE、BT的P2P应用中的文件下载、等等。
在当前的文件交换中,无论是预先设定还是即时选择,作为接收方的用户需要为接收的文件选择存储目录。虽然用户可能建立了有特定含义的目录结构,但除非用户干预,否则用户使用的接收文件的设备无法根据文件自身的特征自动选择与文件匹配的存储目录。此外,即使有用户干预,由于一时难以了解所接收文件的细节,用户难以选择与文件相适应的存储目录。而且,用户干预会降低文件交换的效率。
发明内容
本发明的一个目的是提供一种发送文件的设备与方法、以及接收的设备与方法,使得能够自动为文件选择合理的存储目录,从而提高文件交换的效率。
在本发明的一个实施例中,用于接收文件的设备包含:接收装置,被配置为接收文件和与所述文件相关的至少一个标签路径;路径选择装置,被配置为从候选路径中选择最低层节点的标签向量与每个所述标签路径的最高层节点的标签向量间的相似度超过预定阈值的至少一个路径,以作为存储路径;存储装置,被配置为将所述文件存储在所述存储路径中。
在本发明的一个实施例中,接收文件的方法包含:接收文件和与所述文件相关的至少一个标签路径;从候选路径中选择最低层节点的标签向量与每个所述标签路径的最高层节点的标签向量间的相似度超过预定阈值的至少一个路径,以作为存储路径;将所述文件存储在所述存储路径中。
在本发明的一个实施例中,用于发送文件的设备包含:路径获得装置,被配置为针对要发送的文件在分层树形结构中的路径,获得路径中每个节点的标签向量,并生成所述文件的标签路径;发送装置,被配置为发送所述标签路径和所述文件。
在本发明的一个实施例中,发送文件的方法包含:针对要发送的文件在分层树形结构中的路径,获得路径中每个节点的标签向量,并生成所述文件的标签路径;发送所述标签路径和所述文件。
在本发明的实施例中,标签路径提供了有关接收的文件的信息,并且根据标签路径来选择文件的存储路径。这使得能够自动地为所接收文件选择合理的存储目录,从而提高文件交换的效率。
附图说明
参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。在附图中,相同的或对应的技术特征或部件将采用相同或对应的附图标记来表示。
图1是示出了基于文件系统目录结构的文件组织结构的示意图。
图2示出了基于文件系统目录结构的文件组织结构的一个具体示例。
图3示出了根据本发明实施例的文件发送设备的框图。
图4示出了根据本发明实施例的文件发送方法的流程图。
图5示出了根据本发明实施例的文件接收设备的框图。
图6示出了根据本发明实施例的文件接收方法的流程图。
图7示出了一个示例性的文件组织结构。
图8示出了根据本发明优选实施例的选择候选路径的方法的流程图。
图9是示出其中实现本发明的计算机的示例性结构的框图。
具体实施方式
下面参照附图来说明本发明的实施例。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。
例如Web的网络环境,为公众提供了大量文件资源。为了便于检索、识别这些文件,网络环境为文件维护标签。标签是反映文件特征的关键字。例如在基于web 2.0的博客(BLOG)应用中,可以为博客的内容,例如日志、所链接页面、文件等等附加标签,以标明其涉及的主题、分类等等。在博客应用中,可以由管理员指定标签,也可以由浏览者定义或推荐标签。
为方便管理文件,通常将文件组织到分层树形结构中。分层树形结构的例子,包括文件系统的目录结构、基于统一资源标识符(URL)的树形结构、分类树形结构(参见William A.Snow等人的美国专利US 6,185,550,“method and apparatus for classifying documents within a classhierarchy creating term vector,term file and relevance ranking”)、等等。
图1是示出了基于文件系统目录结构的文件组织结构的示意图。
如图1所示,文件系统采用分层树形目录结构,其中LxDy表示文件系统中第x层的第y个目录,LxFy表示文件系统中第x-1层的一个目录下的第y个文件。目录可以作为父目录而拥有子目录。图1中用有向箭头指示出父目录与其子目录间的关系。目录中的文件具有标签。
在本发明的实施例中,文件可以具有不止一个标签。文件和目录可具有标签向量。文件的标签向量是指该文件的所有标签的集合。目录的标签向量是该目录中所有文件和所有直接子目录(如果有的话)的所有标签的合集。当创建目录时,为避免目录的标签向量为空集,可以向其标签向量中添加缺省标签,或添加取自目录名的文字作为标签。
图2示出了基于本发明的文件系统的目录结构的一个具体示例。
图2示出了目录200、210、211、222,目录210中的文件220、221和目录222中的文件230、231。目录200、210、211、222各自的标签向量分别为TV200、TV210、TV211、TV222。文件220、221、230、231各自的标签向量分别为TV220、TV221、TV230、TV231。
在基于统一资源标识符(URL)的树形结构中,域类似于目录。域的标签向量是该域中所有文件和所有直接子域(如果有的话)的所有标签的合集。当创建域时,为避免域的标签向量为空集,可以向其标签向量中添加缺省标签,或添加取自域名的文字作为标签。
在分类树形结构中,分类类似于目录。分类的标签向量是该分类中所有文件和所有直接子分类(如果有的话)的所有标签的合集。当创建分类时,为避免分类的标签向量为空集,可以向其标签向量中添加缺省标签,或添加取自分类名的文字作为标签。
下文中,将以文件系统的目录结构为例对本发明的实施例进行说明。但应注意,本发明的实施例同样适用于其它分层树形文件组织结构。
可以采用与博客应用中所采用的类似的技术,来针对文件和目录维护标签,例如设定、添加、删除、修改、存储和检索标签。可采用各种技术存储和检索文件和目录的标签。例如,可以通过与文件和目录对应的缺省文件来存储和检索标签,或者可通过数据库或电子表格等等存储和检索标签。当发生文件和目录的变更,例如添加、删除、移动、变更文件名、目录名等时,或当变更文件和目录的标签向量时,文件系统刷新目录结构中受影响的目录的标签向量。
用户在建立目录结构时,通常遵循一定的模式。具体地,用户通常认为目录代表一个分类,子目录和文件代表分类的子分类。可以将分类理解为概念,而子分类是概念的下位概念。可以通过外延来定义概念,而文件和目录的标签向量则可用作外延来定义概念。如前所述,目录的标签向量是该目录中所有文件和所有直接子目录(如果有的话)的所有标签的合集。如图2的示例中所示的那样,父目录与其中的文件和子目录(如果有的话)的标签向量之间,一般具有上位概念和下位概念的关系。
图3示出了根据本发明实施例的文件发送设备300的框图。
如图3所示,文件发送设备300包括路径获得装置302和发送装置303。取决于具体的文件交换应用,文件发送设备300可具有相应的实现形式。例如,在WEB文件下载应用中,文件发送设备300可被包含在WEB服务器中;在电子邮件或即时消息应用中,文件发送设备300可被包含在电子邮件客户端或即时消息客户端中。
在确定了要发送的文件情况下,路径获得装置302能够得到该文件在文件系统中的文件路径(即在文件组织结构中的路径)。针对该文件路径,路径获得装置302获得文件路径中每个节点的标签向量。对于文件路径而言,节点代表文件路径中包含的各个层次的目录。优选地,节点也可以代表文件本身。路径获得装置302利用各个节点的标签向量,遵循文件路径中节点的顺序,生成文件的标签路径。标签路径可以被视为通过用标签向量替换文件路径中的相应节点而获得的路径。例如,图2所示的文件220的标签路径可以是“(Entertainment,Movie,Titanic,Roman,AVI,Andy,Jacky,Music,Yesterday,Tomorrow,MP3,Cind,Wind)\(Movie,Titanic,Roman,AVI,Andy,Jacky)\(Titanic,Movie,AVI,Andy)”,这对应于节点也代表文件本身的情况,或者“(Entertainment,Movie,Titanic,Roman,AVI,Andy,Jacky,Music,Yesterday,Tomorrow,MP3,Cind,Wind)\(Movie,Titanic,Roman,AVI,Andy,Jacky)”,这对应于节点只代表目录的情况。
如图3所示,路径获得装置302根据文件路径的各个节点从标签数据库301获得相应的标签向量。标签数据库301以与节点(在本实施例中为文件或目录)关联的方式存储节点的相应标签向量,使得能够根据节点检索到相应的标签向量。在标签向量被存储在文件系统中的情况下,路径获得装置302也可以从文件系统中获得标签向量。
可选地,标签数据库301也可以存储文件的标签路径。在这样的情况下,路径获得装置302可以根据要发送的文件从标签数据库301直接获得文件的标签路径。例如,在用户上传文件以供其它人下载的应用中,当用户上传文件时,还上传文件的标签路径,即用户本地的标签路径,并由标签数据库301记录。或者,也可以通过人工或自动输入标签路径来配置标签数据库301。
发送装置303发送由路径获得装置302获得的标签路径和文件。可以通过各种方式来发送标签路径。例如,可以在通信协议中规定用于传送标签路径的过程、将标签路径作为文件(例如,电子邮件应用的附件)来传送、按照规定格式将标签路径包含为文件的一部分、等等。
可选地,可以在发送文件之前发送标签路径,以便接收方能够预先根据标签路径选择文件路径。
一个文件可以有不止一个标签路径与其相关。例如在如前所述的用户上传文件以供其它人下载的应用中,当不同用户上传相同文件时,也上传用户本地的标签路径。标签数据库301可记录与文件相关的不同标签路径。来自不同用户的标签路径反映了对相同文件的存放位置的不同选择,能够为其它用户确定存放位置提供更多的参考。在这样的情况下,路径获得装置302可获得这些标签路径中的任意或全部,而发送装置303则将所获得的标签路径传送出去。
图4示出了根据本发明实施例的文件发送方法的流程图。
如图4所示,方法从步骤401开始。在步骤402,根据要发送的文件在文件系统中的文件路径(即在文件组织结构中的路径),获得(例如从标签数据库、文件系统等等中)文件路径中各节点的标签向量。在步骤403,利用各个节点的标签向量,遵循文件路径中节点的顺序,生成文件的标签路径。在步骤404,发送所获得的标签路径。在步骤405,发送文件。方法在步骤406结束。
如前所述,一个文件可以有不止一个标签路径。在这样的情况下,可获得这些标签路径中的任意或全部,并将所获得的标签路径传送出去。
图5示出了根据本发明实施例的文件接收设备500的框图。
如图5所示,文件接收设备500包括接收装置503、路径选择装置502和存储装置504。取决于具体的文件交换应用,文件接收设备500可具有相应的实现形式。例如,在WEB文件下载应用中,文件接收设备500可被包含在WEB浏览器中;在电子邮件或即时消息应用中,文件接收设备500可被包含在电子邮件客户端或即时消息客户端中。
接收装置503接收文件和与文件相关的标签路径。接收装置503可以接收一个或多个与文件相关的标签路径。后文将表明,更多的标签路径可增加接收方选择更合适的存储路径的机会。
路径选择装置502根据接收的标签路径,从文件系统505的候选路径中选择合适的路径,以作为存储路径。
由于是用于存储文件的,这里的候选路径的节点表示目录,而非文件本身。候选路径或候选存储路径,可以包括文件系统505的所有可能路径,或预定目录范围内的所有可能路径。在标签数据库501也管理有路径信息,即存储上述所有可能路径的情况下,有关候选路径的信息可从标签数据库501中获得。可选地,路径选择装置502也可以直接从文件系统505获得有关候选路径的信息。
路径选择装置502从所有候选路径中,选择这样的候选路径作为存储路径:该候选路径中最低层节点的标签向量与标签路径的最高层节点的标签向量间的相似度超过预定阈值。
路径选择装置502可以根据候选路径的各个节点从标签数据库501获得相应的标签向量。在标签向量被存储在文件系统中的情况下,路径选择装置502也可以从文件系统中获得标签向量。
如前所述,标签路径可以通过各种方式传送。路径选择装置502可以根据所采用的传送方式相应地提取标签路径。
可以有各种方法来度量标签向量之间的相似度。例如,可以简单地用两个标签向量间的公共标签的数目代表相似度,或可以用公共标签数目与两个标签向量的合集的标签数目的比值来代表相似度。也可以基于向量空间模型、支持向量机模型(SVM)、高斯混合模型(GMM)等方法来度量相似度。
下面结合图7说明路径选择装置502选择存储路径的一个例子。图7示出了一个示例性的目录结构。假设接收装置503接收的文件是娱乐方面的MP3文件,并且接收的标签路径为“(entertainment,MP3)\(MP3)”。假设候选路径的范围如图7所示,采用简单的公共标签数目来度量相似度,并且预定阈值为1个公共标签。在图7所示的所有候选路径中,候选路径“archive\entertainment”的最低层节点711的标签向量TV711“(entertainment,movie,MP3)”与标签路径“(entertainment,MP3)\(MP3)”中最高层的标签向量“(entertainment,MP3)”之间,存在2个公共标签。可以看出,在这个例子中,路径选择装置502只可能选择候选路径“archive\entertainment”作为存储路径。
文件的标签路径反映了文件的概念,即分类结构。了解文件的分类结构有助于更加合理地为文件选择存储路径。具体地,通过标签路径可以了解文件所属的上位分类。当选择存储路径时,可以优先选择更符合上位分类的目录,以避免选择与文件特征不相关的存储路径。例如,假设文件是娱乐方面的MP3文件,其标签路径为“(entertainment,MP3)\(MP3)”。另外,假设接收方的文件系统中有图7所示的目录结构,该目录结构中,包括目录700、710、711和文件721、722,它们的标签向量依次分别为TV700、TV710、TV711和TV721、TV722。
如图中可见,目录710和711都与MP3相关。如果只根据文件的标签向量来选择存储路径,则有可能选择目录710作为存储路径,而这是不合适的,因为目录710在分类上代表课程(lesson),而与娱乐(entertainment)无关。
然而,要是考虑了上位分类,就不会选择目录710。
回到图5,存储装置504将接收装置503接收的文件存储在文件系统505的由路径选择装置502选择的存储路径中。
图6示出了根据本发明实施例的文件接收方法的流程图。
如图6所示,方法从步骤601开始。在步骤602,接收文件和与文件相关的标签路径。可以接收一个或多个与文件相关的标签路径。更多的标签路径可增加接收方选择更合适存储路径的机会。在步骤603,从文件系统的候选路径中,选择这样的路径作为存储路径:该候选路径中最低层节点的标签向量与标签路径的最高层节点的标签向量间的相似度超过预定阈值。在步骤604,将接收的文件存储在文件系统的所选存储路径中。在步骤605,方法结束。
在前面的实施例中,标签路径中只有最高层节点的标签向量被用于选择候选路径。如果能够参考更多节点的标签向量来进行选择,则会选择出更加准确地反映分类的存储路径。
在一个优选实施例中,由路径选择装置502或通过步骤603选择满足下述条件的候选路径作为存储路径:
(1)对于标签路径的每个节点,所选路径中存在与其相应的节点;
(2)标签路径中相邻节点间的层次顺序与所选路径中相应节点间的层次顺序一致;并且
(3)标签路径的每个节点与所选路径中相应节点间的相似度大于所述每个节点之下的任何节点与其相应节点间的相似度。
在这个优选实施例中,可以通过各种方法来选择候选路径。例如,可以逐个确定每个候选路径是否满足上述条件,直至发现满足条件的候选路径。或者,可以分别用条件(1)、(2)、(3)中的任意条件逐步筛选出满足条件的候选路径。优选地,可以通过图8所示的方法来选择满足上述条件的候选路径。
图8示出了根据本发明优选实施例的选择候选路径的方法的流程图。
如图8所示,方法从步骤801开始。在步骤802,令A=0,B=0,其中A指示文件系统的层次树形目录结构中的层次,A=0表示最高层,B指示标签路径中的节点层次,B=0表示最高层。在步骤803,计算目录结构中层次A的每个目录的标签向量与标签路径中层次B的标签向量间的相似度,并且令最高相似度为v1,具有最高相似度的目录为X1。在步骤804,确定目录X1是否具有子目录。如果没有子目录,则在步骤805确定对应于目录X1的路径为要选择的候选路径,并且方法在步骤812结束。如果有子目录,则方法前进到步骤806。在步骤806,计算目录结构中层次A+1的每个目录的标签向量与标签路径中层次B的标签向量间的相似度,并且令最高相似度为v2,具有最高相似度的目录为X2。在步骤807,确定是否v2大于或等于v1。如果是,则在步骤808,令A=A+1,并且返回步骤803。如果不是,则在步骤809,确定B是否为标签路径的最低层。如果是,则在步骤810确定对应于目录X1的路径为要选择的候选路径,并且方法在步骤812结束。如果不是,则在步骤811,令B=B+1,并且返回步骤803。
下面以图2示出的目录结构为例来说明图8所示的方法。这里,采用向量空间模型来度量相似度。对于一个目录D,用权重向量(k1,k2,…,kN)表示目录D的标签向量(s1,s2,…,sN),其中ki为非负数,表示相应标签si的权重。下文中,在以目录D为根的目录树中,si在所有文件和空目录的标签向量中出现的次数被称为频率。根据下式计算权重ki
Figure G2008101732707D00091
根据下式计算权重向量T1=(k1,k2,…,kN)和T2=(k1′,k2′,…,kN′),即其所表示的标签向量间的相似度γ(T1,T2):
γ ( T 1 , T 2 ) = k 1 k 1 ′ + k 2 k 2 ′ + . . . + k N k N ′ k 1 2 + k 2 2 + . . . + k N 2 · k 1 ′ 2 + k 2 ′ 2 + . . . + k N ′ 2
这里,所接收文件的标签路径为“(Download,newsong,MP3,Movie,AVI,Wind,Jack,Cind)\(newsong,MP3,Wind,Jack)\(newsong,MP3,Wind)”。令TV1表示标签向量(Download,newsong,MP3,Movie,AVI,Wind,Jack,Cind),TV2表示标签向量(newsong,MP3,Wind,Jack),TV3表示标签向量(newsong,MP3,Wind)。TV1中的标签MP3和AVI的频率为2,TV2中标签MP3的频率为2。TV1、TV2、TV3中其它标签的频率为1。
经过步骤802,A=0并且B=0。经过步骤803,得到v1=γ(TV1,TV200)=0.709,X1为目录200。在步骤804确定X1有子目录。经过步骤806,计算γ(TV1,TV210)=0.454,v2=γ(TV1,TV211)=0.571。在步骤807确定v1>v2。在步骤809确定层次B不是最低层。在步骤811使B=1。于是返回步骤803。再次经过步骤803,得到v1=γ(TV2,TV200)=0.468,X1为目录200。在步骤804确定X1有子目录。经过步骤806,计算γ(TV2,TV210)=0,v2=γ(TV2,TV211)=0.707。在步骤807确定v1<v2。在步骤808使A=1。于是返回步骤803。再次经过步骤803,得到v1=γ(TV2,TV211)=0.707,X1为目录211。在步骤804确定X1有子目录。经过步骤806,得到v2=γ(TV2,TV222)=0.734。在步骤807确定v1<v2。在步骤808使A=2。于是返回步骤803。再次经过步骤803,得到v1=γ(TV2,TV222)=0.734,X1为目录222。在步骤804确定X1没有子目录,于是方法结束。因此目录222的路径“Entertainment\Music\MP3”为选择的存储路径。
在上述实施例中,可能存在不止一个满足选择条件的候选路径。在这种情况下,可根据预定策略来进行选择。例如,可以简单地选择第一个满足条件的候选路径、随机选择一个满足条件的候选路径、选择目录层次最多的候选路径、选择特定节点的标签向量(例如,候选路径中最低层节点的标签向量与标签路径的最高层节点的标签向量)间相似度最高的候选路径、等等。可选地,路径选择装置502可以包括用户选择接口(未示出)。当存在多个路径可供路径选择装置选择,即满足选择条件时,用户选择接口向用户显示所述多个路径中的至少两个,并将用户选择的一个路径作为存储路径。在另一个可选实施例中,当存在多个路径可供路径选择装置选择,即满足选择条件时,路径选择装置502可以将这些满足选择条件的路径均选择作为存储路径。
按照一个实施例,接收装置503在接收文件之前接收标签路径。路径选择装置502先根据标签路径选择出存储路径。接收装置503再接收文件并将文件存储在选择的存储路径中。
本发明的设备和方法实现环境如图9所示。
在图9中,中央处理单元(CPU)901根据只读映射数据(ROM)902中存储的程序或从存储部分908加载到随机存取映射数据(RAM)903的程序执行各种处理。在RAM 903中,也根据需要存储当CPU 901执行各种处理等等时所需的数据。
CPU 901、ROM 902和RAM 903经由总线904彼此连接。输入/输出接口905也连接到总线904。
下述部件连接到输入/输出接口905:输入部分906,包括键盘、鼠标等等;输出部分907,包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等等,和扬声器等等;存储部分908,包括硬盘等等;和通信部分909,包括网络接口卡比如LAN卡、调制解调器等等。通信部分909经由网络比如因特网执行通信处理。
根据需要,驱动器910也连接到输入/输出接口905。可拆卸介质911比如磁盘、光盘、磁光盘、半导体映射数据等等根据需要被安装在驱动器910上,使得从中读出的计算机程序根据需要被安装到存储部分908中。
在通过软件实现上述步骤和处理的情况下,从网络比如因特网或存储介质比如可拆卸介质911安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图9所示的其中存储有程序、与方法相分离地分发以向用户提供程序的可拆卸介质911。可拆卸介质911的例子包含磁盘、光盘(包含光盘只读映射数据(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)和半导体映射数据。或者,存储介质可以是ROM 902、存储部分908中包含的硬盘等等,其中存有程序,并且与包含它们的方法一起被分发给用户。
在前面的说明书中参照特定实施例描述了本发明。然而本领域的普通技术人员理解,在不偏离如权利要求书限定的本发明的范围的前提下可以进行各种修改和改变。

Claims (16)

1.一种用于接收文件的设备,包括:
接收装置,被配置为接收文件和与所述文件相关的至少一个标签路径,其中,标签路径是通过用标签向量替换文件路径中的相应节点而获得的路径,其中,替换代表文件的相应节点的标签向量是所代表文件的所有标签的集合,替换代表目录的相应节点的标签向量是所代表目录中所有文件和所有直接子目录的所有标签的集合;
路径选择装置,被配置为从候选路径中选择最低层节点的标签向量与每个所述标签路径的最高层节点的标签向量间的相似度超过预定阈值的至少一个路径,以作为存储路径;和
存储装置,被配置为将所述文件存储在所述存储路径中。
2.如权利要求1所述的用于接收文件的设备,其中,所述接收装置进一步被配置为在接收文件之前接收所述标签路径,以供选择存储路径。
3.如权利要求1所述的用于接收文件的设备,其中,所述路径选择装置进一步被配置为选择层次最多的路径,以作为存储路径。
4.如权利要求1所述的用于接收文件的设备,其中,所述路径选择装置进一步被配置为选择相似度最高的路径,以作为存储路径。
5.如权利要求1所述的用于接收文件的设备,其中,所述路径选择装置进一步被配置为选择这样的路径作为存储路径:
对于标签路径的每个节点,所选路径中存在与该节点相应的节点;
标签路径中相邻节点间的层次顺序与所选路径中相应节点间的层次顺序一致;并且
标签路径的每个节点与所选路径中相应节点间的相似度大于所述每个节点之下的任何节点与其相应节点间的相似度。
6.如前述权利要求中任何一个所述的用于接收文件的设备,其中,所述路径选择装置包括用户选择接口,被配置为当存在多个路径可供路径选择装置选择时,向用户显示所述多个路径中的至少两个,并将用户选择的一个路径作为存储路径。
7.一种接收文件的方法,包括:
接收文件和与所述文件相关的至少一个标签路径,其中,标签路径是通过用标签向量替换文件路径中的相应节点而获得的路径,其中,替换代表文件的相应节点的标签向量是所代表文件的所有标签的集合,替换代表目录的相应节点的标签向量是所代表目录中所有文件和所有直接子目录的所有标签的集合;
从候选路径中选择最低层节点的标签向量与每个所述标签路径的最高层节点的标签向量间的相似度超过预定阈值的至少一个路径,以作为存储路径;和
将所述文件存储在所述存储路径中。
8.如权利要求7所述的接收文件的方法,其中,在接收文件之前接收标签路径,以供选择存储路径。
9.如权利要求7所述的接收文件的方法,其中,所述选择包括选择层次最多的路径,以作为存储路径。
10.如权利要求7所述的接收文件的方法,其中,所述选择包括选择相似度最高的路径,以作为存储路径。
11.如权利要求7所述的接收文件的方法,其中,所述选择包括选择这样的路径作为存储路径:
对于标签路径的每个节点,所选路径中存在与其相应的节点;
标签路径中相邻节点间的层次顺序与所选路径中相应节点间的层次顺序一致;并且
标签路径的每个节点与所选路径中相应节点间的相似度大于所述每个节点之下的任何节点与其相应节点间的相似度。
12.如权利要求7至11中任何一个所述的接收文件的方法,其中,所述选择包括:
当存在多个路径可供路径选择装置选择时,向用户显示所述多个路径中的至少两个,并将用户选择的一个路径作为存储路径。
13.一种用于发送文件的设备,包括:
路径获得装置,被配置为针对要发送的文件在分层树形结构中的路径,获得路径中每个节点的标签向量,并生成所述文件的标签路径,其中,代表文件的节点的标签向量是所代表文件的所有标签的集合,代表目录的节点的标签向量是所代表目录中所有文件和所有直接子目录的所有标签的集合,并且其中,标签路径是通过用标签向量替换在分层树形结构中的相应节点而获得的路径;和
发送装置,被配置为发送所述标签路径和所述文件。
14.如权利要求13所述的用于发送文件的设备,其中,所述发送装置进一步被配置为在发送文件之前发送标签路径。
15.一种发送文件的方法,包括:
针对要发送的文件在分层树形结构中的路径,获得路径中每个节点的标签向量,并生成所述文件的标签路径,其中,代表文件的节点的标签向量是所代表文件的所有标签的集合,代表目录的节点的标签向量是所代表目录中所有文件和所有直接子目录的所有标签的集合,并且其中,标签路径是通过用标签向量替换在分层树形结构中的相应节点而获得的路径;和
发送所述标签路径和所述文件。
16.如权利要求15所述的发送文件的方法,其中,在发送文件之前发送标签路径。
CN2008101732707A 2008-10-31 2008-10-31 发送文件的以及接收文件的设备与方法 Expired - Fee Related CN101729440B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN2008101732707A CN101729440B (zh) 2008-10-31 2008-10-31 发送文件的以及接收文件的设备与方法
KR1020090077010A KR101104039B1 (ko) 2008-10-31 2009-08-20 파일 전송 장치 및 방법, 및 파일 수신 장치 및 방법
US12/608,482 US8244734B2 (en) 2008-10-31 2009-10-29 Apparatus and method for transmitting file and apparatus and method for receiving file
US13/475,212 US20120233189A1 (en) 2008-10-31 2012-05-18 Transmitting and receiving a file in a network environment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101732707A CN101729440B (zh) 2008-10-31 2008-10-31 发送文件的以及接收文件的设备与方法

Publications (2)

Publication Number Publication Date
CN101729440A CN101729440A (zh) 2010-06-09
CN101729440B true CN101729440B (zh) 2012-12-05

Family

ID=42132788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101732707A Expired - Fee Related CN101729440B (zh) 2008-10-31 2008-10-31 发送文件的以及接收文件的设备与方法

Country Status (3)

Country Link
US (2) US8244734B2 (zh)
KR (1) KR101104039B1 (zh)
CN (1) CN101729440B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9098311B2 (en) 2010-07-01 2015-08-04 Sap Se User interface element for data rating and validation
US8443003B2 (en) * 2011-08-10 2013-05-14 Business Objects Software Limited Content-based information aggregation
CN103164463B (zh) * 2011-12-16 2017-03-22 国际商业机器公司 推荐标签的方法和装置
CN105991729B (zh) * 2015-02-12 2019-12-31 Oppo广东移动通信有限公司 一种安装包下载方法及服务器
KR20170028662A (ko) 2015-09-04 2017-03-14 자화전자(주) 고속전송 안테나용 fccl 제조방법 및 고속전송 안테나용 fccl
CN108984557A (zh) * 2017-05-31 2018-12-11 南宁富桂精密工业有限公司 文件保存方法、服务器及计算机可读存储介质
CN114064571A (zh) * 2020-07-31 2022-02-18 华为技术有限公司 一种确定文件存储位置的方法、装置及终端

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1988535A (zh) * 2005-12-23 2007-06-27 腾讯科技(深圳)有限公司 文件存储同步方法、系统及客户端
CN101183367A (zh) * 2007-01-23 2008-05-21 腾讯科技(深圳)有限公司 一种利用标签管理文件的方法、即时通信客户端及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3168756B2 (ja) * 1993-02-24 2001-05-21 ミノルタ株式会社 電子メールシステムのメール管理方法
US6055540A (en) * 1997-06-13 2000-04-25 Sun Microsystems, Inc. Method and apparatus for creating a category hierarchy for classification of documents
US7039642B1 (en) 2001-05-04 2006-05-02 Microsoft Corporation Decision-theoretic methods for identifying relevant substructures of a hierarchical file structure to enhance the efficiency of document access, browsing, and storage
US7370281B2 (en) * 2002-02-22 2008-05-06 Bea Systems, Inc. System and method for smart drag-and-drop functionality
US7289973B2 (en) * 2002-12-19 2007-10-30 Mathon Systems, Inc. Graphical user interface for system and method for managing content
TWM288269U (en) * 2005-09-29 2006-03-01 Link Treasure Ltd One-hand controlled seat inclination structure for baby trolley
KR100816934B1 (ko) * 2006-04-13 2008-03-26 엘지전자 주식회사 문서검색 결과를 이용한 군집화 시스템 및 그 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1988535A (zh) * 2005-12-23 2007-06-27 腾讯科技(深圳)有限公司 文件存储同步方法、系统及客户端
CN101183367A (zh) * 2007-01-23 2008-05-21 腾讯科技(深圳)有限公司 一种利用标签管理文件的方法、即时通信客户端及系统

Also Published As

Publication number Publication date
KR20100048867A (ko) 2010-05-11
CN101729440A (zh) 2010-06-09
US8244734B2 (en) 2012-08-14
KR101104039B1 (ko) 2012-01-06
US20100114996A1 (en) 2010-05-06
US20120233189A1 (en) 2012-09-13

Similar Documents

Publication Publication Date Title
CN101729440B (zh) 发送文件的以及接收文件的设备与方法
CN102713965B (zh) 数据源的可缩放主题聚集
CN108776699B (zh) 一种气象数据和卫星遥感数据处理方法及装置
US9654415B2 (en) Information processing system, management server group, and server management program
CN102082818B (zh) 基于云存储的图形化和结构化数据存储及管理方法和系统
CN104615606B (zh) 一种Hadoop分布式文件系统及其管理方法
CN107026876B (zh) 一种文件数据访问系统及方法
CN101692238A (zh) 媒体文件的自动选择
CN104156390A (zh) 一种评论推荐方法和系统
CN102480397A (zh) 访问互联网页面的方法及设备
US20130346537A1 (en) Storage optimization technology
WO2006074007A2 (en) System and method for metadata-based distribution of content
CN110347651A (zh) 基于云存储的数据同步方法、装置、设备及存储介质
CN106331075A (zh) 用于存储文件的方法、元数据服务器和管理器
CN109508319A (zh) 一种3d跨平台资源管理系统和方法
CN103617199A (zh) 一种操作数据的方法和系统
CN110019048A (zh) 基于MongoDB的文件处理方法、装置、系统及服务器
CN106131113A (zh) 一种资源下载方法、装置、系统以及资源服务器
CN108347459A (zh) 一种云端数据快速存储方法及装置
CN112132954A (zh) 一种面向三维激光点云实体对象的分布式管理方法及系统
CN109033238A (zh) 电子地图集系统的数据生产、组织、存储及访问方法
CN102870115A (zh) 网盘文件存储方法及服务器
KR101732400B1 (ko) 상호 연결된 스마트 공간들에 서비스들의 발견을 위한 방법 및 시스템
CN109062500A (zh) 一种元数据管理服务器、数据存储系统及数据存储方法
KR101748245B1 (ko) 3d 프린팅 데이터 서비스 제공 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121205

Termination date: 20201031

CF01 Termination of patent right due to non-payment of annual fee