CN101681363A - 用于编辑和分类文档的系统和技术 - Google Patents

用于编辑和分类文档的系统和技术 Download PDF

Info

Publication number
CN101681363A
CN101681363A CN200880008887A CN200880008887A CN101681363A CN 101681363 A CN101681363 A CN 101681363A CN 200880008887 A CN200880008887 A CN 200880008887A CN 200880008887 A CN200880008887 A CN 200880008887A CN 101681363 A CN101681363 A CN 101681363A
Authority
CN
China
Prior art keywords
classified information
document
edit instruction
information set
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880008887A
Other languages
English (en)
Inventor
S·M·韦斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Primatech Corp
Original Assignee
Primatech Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Primatech Corp filed Critical Primatech Corp
Publication of CN101681363A publication Critical patent/CN101681363A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

描述了确定与文档相关联的信息的计算机系统的实施方式。在操作中,此计算机系统接收文档(诸如图像)。然后,计算机系统使用图像处理软件来确定与文档相关联的第一编辑指令和分类信息集合。接着,计算机系统接收与文档相关联的第二编辑指令和分类信息集合。注意,第二编辑指令和分类信息集合是由个人群组生成的,并且包括对第一编辑指令和分类信息集合的修改和添加。

Description

用于编辑和分类文档的系统和技术
技术领域
本发明涉及用于组织文档的系统和技术。更具体地,本发明涉及用于确定文档的编辑指令和分类信息的技术。
背景技术
新近的技术进展使得个人和组织可以远程访问日益增多的信息量。例如,网络(诸如互联网)和现代的搜索引擎允许个人从大型数据库或文档储存库(包括来自多个web页面和网站的内容)中取回信息(此后称为“文档”)。
随着文档数量以及各种内容类型的与日俱增,对于个人和组织而言,避免在搜索这些文档储存库期间信息过载变得越发困难。解决此问题的一种方式是基于估计的文档中信息的相关度来限制提供给个人或组织的文档数量。例如,响应于搜索查询,大多数搜索引擎返回与搜索查询密切匹配的一个或多个文档的摘录或子集(此后称为“结果”),其包括:搜索查询中的或与搜索查询相关联的字、词语、关键词、短语、同义词和/或释义(此后统称为关键词)。此外,大多数搜索引擎基于用户简档来定制或个性化结果,用户简档包括用户定义的兴趣(诸如文档类别)以及以前用户搜索的概要。注意,提供结果的能力既涉及识别相关文档又涉及识别这些文档中的相关位置。在内容为字母数字或文本格式的情况中,关键词可以提供必要的分类信息,有助于组织(并由此搜索)储存库中的文档。
遗憾的是,这些技术对于文本之外的其他内容类型(诸如图像和视频)都不太有效,因为关键词不足以识别相关文档或这些文档中的相关位置。而且,当感兴趣的内容本质上是主观的和/或动态的(也即,随时间变化)(诸如时尚或流行文化)时,则更加困难。因此,通过名流或模特的照片来归类从而确定哪些照片和/或给定照片的哪些部分是个人当前感兴趣的,可能会比较困难。
因此需要一种改进的技术以用于组织文档,而不存在上述问题。
发明内容
本发明的一种实施方式提供一种确定与文档相关联的信息的计算机系统。在操作期间,此计算机系统接收文档(诸如图像)。然后,计算机系统使用图像处理软件来确定与所述文档相关联的第一编辑指令和分类信息集合。接着,计算机系统接收与所述文档相关联的第二编辑指令和分类信息集合。注意,第二编辑指令和分类信息集合是由个人群组生成的,其包括对第一编辑指令和分类信息集合的修改和添加。
在有些实施方式中,第二编辑指令和分类信息集合包括与至少一些所述文档相关联的主观评论。
在有些实施方式中,所述个人群组与提供接收所述文档以及确定所述第一编辑指令和分类信息集合的所述计算机系统的组织具有雇佣关系。注意,所述个人群组可以是所述组织外部的人员。
在有些实施方式中,所述计算机系统检测和/或纠正所述第一编辑指令和分类信息集合和/或所述第二编辑指令和分类信息集合中的错误。
在有些实施方式中,图像包括在时尚秀和/或展会上拍摄的照片。
在有些实施方式中,第一编辑指令和分类信息集合和/或第二编辑指令和分类信息集合中的所述分类信息包括服装的颜色和/或类型。
在有些实施方式中,第一编辑指令和分类信息集合和/或第二编辑指令和分类信息集合中的所述编辑指令包括剪切指令。例如,与第二编辑指令和分类信息集合相关联的用于第一文档的剪切指令可以包括由所述个人群组中的人员生成的剪切指令的历史。而且,用于所述第一文档的编辑指令和分类信息可以包括来自所述个人群组中的人员的不同贡献。
在有些实施方式中,计算机系统基于与第二文档相关联的分类信息在层级数据结构中存储所述第二文档以及相关联的编辑指令。注意,所述层级数据结构可以包括类别和文档群组。而且,基于与所述第二文档相关联的分类信息,可以将所述第二文档指派给一个或多个类别以及一个或多个文档群组。在有些实施方式中,进一步基于接收第二文档的时间或者与第二文档相关联的地理位置,将第二文档指派给一个或多个类别。
在有些实施方式中,计算机系统或者一个或多个个人接受或拒绝与所述第一编辑指令和分类信息集合和/或所述第二编辑指令和分类信息集合相关联的、用于第三文档的编辑指令和分类信息。
在有些实施方式中,计算机系统从客户端接收对信息的请求,以及基于所述请求识别所述文档的子集。注意,可以基于与所述文档子集相关联的分类信息来识别所述文档的子集,其中此文档子集与第二编辑指令和分类信息集合相关联。然后,计算机系统将所述文档子集以及所述第二编辑指令和分类信息集合中相关联的编辑指令提供给客户端。此外注意,这些相关联的编辑指令定义了可以显示所述文档子集的格式。
另一实施方式提供了用于结合计算机系统使用的计算机程序产品。
另一实施方式提供了用于执行至少一些前述操作的方法。
附图说明
图1是示出了根据本发明的一种实施方式,包括联网在一起的计算机和服务器的系统的框图。
图2是示出了根据本发明的一种实施方式,用于确定与文档相关联的信息的方法的流程图。
图3是示出了根据本发明的一种实施方式,用于确定与文档相关联的信息的方法的流程图。
图4是示出了根据本发明的一种实施方式的计算机系统的框图。
图5是示出了根据本发明的一种实施方式的计算机的框图。
图6是示出了根据本发明的一种实施方式的数据结构的框图。
图7是示出了根据本发明的一种实施方式的数据结构的框图。
注意,贯穿全部附图,类似的参考标记指代相应的部分。
具体实施方式
提供以下描述以使得本领域任何技术人员能够制造和使用本发明,其中在特定应用及其需求的上下文中提供此描述。对所公开的实施方式的各种变形对于本领域技术人员来说将是很明显的,并且此处所定义的通用原理可以应用到其他实施方式和应用,而不偏离本发明的精神和范围。因此,其意图不在于将本发明限制在所示出的实施方式,而是按照与此处所公开的原理和特征相一致的最宽广的范围。
描述了系统、方法以及与系统一起使用的计算机程序产品(也即,软件)的实施方式。这些系统、软件和过程可以用来确定用于文档(诸如图像和/或视频)的分类信息和/或编辑指令。这种分类信息和/或编辑指令可以协助在层级数据库或数据结构中组织文档,由此使得个人和/或组织(诸如搜索引擎的用户)能够识别和访问这些文档中的相关内容(也即,感兴趣的内容)。例如,用户可以提供包括或与一个或多个关键词相关联的搜索查询,并且可以基于分类信息与包括一个或多个关键词的布尔表达式的匹配来提供文档。
在一种示例性实施方式中,文档包括照片,其包括主观内容(诸如在一个或多个时尚秀中模特的图像)。可以使用图像处理软件来确定用于这些文档的初始分类信息和/或编辑指令。例如,此软件可以确定文档中服装的颜色或类型(诸如成衣、纹理和/或面料),并且可以使用一组编辑或剪切指令来指定给定文档中各个感兴趣的特征的位置(诸如服装类型的位置)。注意,编辑指令可以指定给定文档的显示格式,并且这些指令可以与给定文档存储在一起以供随后在显示给定文档时使用。
继而,个人群组可以对初始分类信息和/或编辑指令进行检查以及(如果需要的话)修改或添加。这些人员可以与提供系统和/或维护文档的层级数据结构的组织具有雇佣关系。在一种示例性实施方式中,个人群组包括对文档中的主观内容具有专业技术的外界或外部承包人。注意,个人群组中的多个人员可以分别检查和/或修改与给定文档相关联的当前的分类信息和/或编辑指令。而且,可以维护不同人员做出的不同修改的记录。这可以允许在随后的修改检查期间,由一个或多个人员(其可以属于或者不属于所述个人群组)和/或使用软件来接受、纠正和/或拒绝部分或全部的修改和/或添加。此外,在有些实施方式中,使用质量控制软件来检测和/或纠正分类信息和/或编辑指令中的错误。
通过使用基于计算机和/或基于人类的文档分析,此方法可以协助灵活地确定主观的和/或动态的(也即,随时间变化)感兴趣的内容。在有些实施方式中,通过为给定文档确定和存储分类信息和/或编辑指令的多个版本,可以动态地调整在给定文档中识别的感兴趣的内容。例如,与给定搜索查询的匹配可以基于匹配得分。可以使用给定文档的分类信息与给定搜索查询中或相关联的关键词之间的匹配的加权和来确定此匹配得分。随着品味或品味感知的发展,返回的匹配可以通过改变权重来修订。注意,在有些实施方式中,系统中由人员(诸如个人群组中的人员)执行的一个或多个操作可以使用软件来执行,例如基于利用人员以前的动作或决策而训练的试探性模型。
这些技术可以至少部分地实现为:单机软件应用;另一应用中的程序模块或子例程,和/或在使用网络实现的客户端-服务器环境中实现。而且,此类程序可以被配置在客户端计算机上执行,客户端计算机诸如个人计算机、膝上型计算机、蜂窝电话、PDA或能够操纵计算机可读数据的其他设备,或者在通过网络(诸如互联网、内联网、LAN、WAN、MAN、或网络组合、或支持计算系统之间的通信的其他技术)的两个或更多计算系统之间执行。因此,文档以及相关联的分类信息和/或编辑指令可以存储在本地(例如,在本地计算机上)和/或远程存储(例如,在经由网络而访问的计算机或服务器上)。
现在描述用于编辑和分类文档的系统、设备和过程的实施方式。具体地,图1给出了示出根据本发明的一种实施方式、包括联网在一起的计算机和服务器的系统100的框图。在此系统内,计算机110(或计算机系统)可以实现或执行远程访问内容编辑(RACE)软件。如下文所描述的,此软件可以协助可扩展系统对经由网络112从一个或多个文档提供方114(诸如摄影服务)接收的文档(此后称为图像)进行组织。在有些实施方式中,这些图像与以下相关联:时尚秀中的模特、展会、产品、设计、名流、流行文化和/或新闻(诸如有线服务图像)。
使用RACE软件,计算机110可以确定这些图像的初始分类信息和/或编辑指令。例如,图像处理模块(或单独的图像处理应用)可以使用空间滤波器和/或频率滤波器来确定初始分类信息和/或编辑指令。在有些实施方式中,图像是一个或多个时尚秀中的模特的图像,并且分类信息包括与这些文档中的至少一些相关联的属性。注意,类别至少部分地可以是主观的,诸如:服装类型或成衣类型、服装裁剪或缝制、服装颜色、服装面料、服装纹理和/或生活风格信息(诸如何时适合穿着该服装或该服装的目标群体)。在一种示例性实施方式中,类别包括:配件、运动装、女装、女装衬衫/衬衣、外套/外衣、色彩灵感、牛仔、礼服、饰品、晚装、面料灵感、图形、横条、夹克、针织衫/T恤、皮革/绒面革/皮草、长裤/短裤、印花、裙装、套装、毛衫和/或内衣。
此外,在有些实施方式中,编辑指令包括用于图像中的至少一些的剪切指令。注意,用于给定图像的剪切指令可以指定对应于给定图像的一个或多个部分的坐标(诸如中心加边界)。从而,图像处理模块或软件可以识别给定图像中多个可能感兴趣的部分。
在有些实施方式中,诸如在图像包括主观内容的实施方式中,可能需要提炼、添加和/或修改初始分类信息和/或编辑指令。这可以由使用网络112访问图像文件的个人群组118中的一个或多个人员116来执行。例如,给定人员可以从RACE软件提供的一堆描述词中选择一个或多个属性或类别以与一个或多个图像相关联。在一种示例性实施方式中,给定人员使用指点设备(诸如鼠标)来点击属性,将其拖拽至所显示的图像,然后释放,从而定义这种关联。
注意,人员116可以与提供系统100所协助的RACE软件和/或服务的组织具有雇佣关系(例如,人员116可以是时尚界里的自由职业者)。然而,如前面所提到的,在有些实施方式中,另一软件模块或应用可以执行由人员116实现的至少部分操作。例如,修改可以基于利用一个或多个人员116以前的动作或决策而训练的试探性模型。
还要注意,多个人员116可以在一定时间间隔期间修改与给定图像相关联的分类信息和/或编辑指令。而且,RACE软件可以跟踪和/或存储由这些多个人员提供的针对给定文档的不同修改和/或主观评论。例如,用于给定文档的分类信息可以包括与做出修改的人员相关联的元数据。在有些实施方式中,可以在计算机110上或者在可以使用网络112来访问的其他计算机或服务器上存储用于给定图像的不同剪切指令的历史。
在人员116提供修改之后或同时,系统100可以检测并且(如果需要的话)纠正用于图像的分类信息和/或编辑指令中的错误。在有些实施方式中,在计算机110上运行的质量控制模块或应用执行这些功能。然而,在有些实施方式中,一个或多个人员(其可以属于群组118或者不属于群组118)执行检测和/或纠正操作。而且,在有些实施方式中,可以使用其他的软件模块或应用。注意,此模块或应用可以基于利用一个或多个人员以前的动作或决策而训练的试探性模型。
在此质量控制过程期间,可以接受、改变和/或拒绝一个或多个人员116针对一个或多个图像提供的添加、修改和/或评论。例如,可以拒绝人员116之一针对多个图像提供的部分或全部修改和/或评论。在这种情况下,可以删除所拒绝的改变。
继而可以基于用于图像的所接受的分类信息和/或编辑指令在关系型或层级数据库或数据结构中组织和存储(本地地和/或远程地)这些图像。给定图像可以与其相关联的编辑指令一起存储,也即,可以存储整个图像。此方式可以允许随后在一个或多个客户端计算机120上基于编辑指令来显示图像的多个版本(例如,在呈现时,给定图像可以是经过剪切的)。其还允许在将来根据需要来改变编辑指令。
注意,数据结构可以包括图像组(此后称为批次),并且可以将图像指派给一个或多个类别和/或一个或多个批次。对于给定图像,这种指派可以包括给定图像的完整副本或指向给定图像的副本的指针。在有些实施方式中,给定图像还基于以下被指派给给定类别和/或给定批次:接收给定图像的时间;产生给定图像的时间(诸如何时拍摄的照片);和/或与给定图像相关联的地理位置(诸如拍摄照片的地点)。例如,T台图像(其可以是一个类别)可以根据时尚秀发布的城市和/或图像接收到的日期(其继而可以定义一个或多个批次)来划分。
注意,可以选择批次以便保持图像组的大小可管理。在一种示例性实施方式中,给定批次可以包括500-1000张T台图像或100张展会图像。在另一示例中,类别是2006年秋季,并且存在对应于不同服装类型的多个子类别。此外,可以有标题为New York1的批次,以及多个子批次,诸如New York1(女装)、New York1(外套)等等。因此,类别/子类别和批次/子批次可以组成彼此交互的两个平面树或层级,也即,在数据结构中可以有两条父-子关系路径。
计算机120的一个或多个用户可以基于分类信息来访问所存储的图像以及相关联的编辑指令。例如,给定用户使用搜索引擎而提供的搜索查询中的或与其相关联的一个或多个关键词可以匹配一个图像集的分类信息。
一旦识别出这种图像集,RACE或其他软件可以向给定用户提供图像、相关联的编辑指令和/或分类信息。该用户(诸如百货商场的顾客、时尚设计师或杂志出版人)可以使用此信息来指导时尚设计、购置和/或杂志出版。在有些实施方式中,给定用户就此服务向RACE软件和/或数据结构的提供方付费。
在有些实施方式中,可以在客户端计算机120中的给定客户端计算机处接收图像,并且可以使用浏览器来呈现一个或多个图像。注意,在有些实施方式中,RACE软件在提供图像之前,例如通过将图像变换到其他格式来递送图像。而且,在有些实施方式中,图像集被提供为批次,也即作为一个大文件。此文件可以是压缩的(例如,使用联合图像专家组压缩技术),并且此压缩可以保留数据结构中的层级或目录信息。当在客户端计算机上对此文件解压缩之后,此目录信息可以用来划分或细分该文件。
如前面所提到的,系统1000中的软件应用可以是单机应用或者可以嵌入在其他应用中(诸如软件模块)。而且,在有些实施方式中,人员116和/或客户端计算机120的用户可以使用与RACE软件相关的、嵌入在web页面的工具(再次,其可以作为单机应用或作为其他应用的一部分)。此web页面可以由计算机110经由网络112来提供。在一种示例性实施方式中,这些工具包括用JavaScriptTM(也即,所得税准备工具包括含有JavaScript指令的程序或过程)、ECMAScript(欧洲计算机制造商协会国际发布的规范)、VBScriptTM(微软公司的商标)或任何其他客户端或服务器侧脚本语言编写的一个或多个软件模块或包。换言之,这些工具可以包括这样的程序或过程,其含有JavaScript、ECMAScript指令、VBScript指令或适合于由系统100中的计算机和/或服务器上的浏览器或其他客户端应用呈现的其他编程语言的指令。
注意,系统100中包括的材料可以是具有敏感性的。因而,在有些实施方式中,人员116和/或客户端计算机120的用户可以提供一个或多个安全令牌(例如PIN码、用户名称、和/或口令),以便使用RACE软件和/或访问存储的图像、分类信息和/或编辑指令。此外,在有些实施方式中,存储的文件、存储的信息、和/或通过网络112传送的数据是加密的。例如,通信可以利用诸如超文本传送协议安全(HTTPS)之类的协议。而且,在有些实施方式中,系统100包括更少的或附加的组件,两个或更多组件可以合并成单个组件,和/或一个或多个组件的位置可以改变。
现在讨论用于编辑和分类文档的方法。更具体地,图2给出了示出根据本发明的一种实施方式、用于确定与文档相关联的信息的方法200的流程图。在此方法中,计算机120中的第一计算机向服务器计算机212提供文档(214)。服务器计算机212接收这些文档(216)。然后,服务器计算机212确定用于文档的编辑指令和分类信息(218),并且基于分类信息存储这些文档(220)。
之后,服务器计算机212向计算机210中的第二计算机提供文档、编辑指令和/或分类信息(222)。注意,通常第二计算机可以与第一计算机不同。此第二计算机接收这些文档、编辑指令和/或分类信息(224)。然后,第二计算机(或使用第二计算机的人员)修改编辑指令和/或分类信息(226),并且将修改后的编辑指令和/或分类信息提供给服务器计算机212(228)。接着,服务器计算机212接收修改后的编辑指令和/或分类信息(230),并且可选地基于修改后的分类信息来存储这些文档中的一个或多个(232)。
系统100(图1)的客户端可以使用计算机210中的第三计算机来提供请求(234)。注意,通常第三计算机可以不同于方法200中的其他计算机。服务器计算机212接收该请求并且识别文档的子集(236)。然后,服务器计算机212提供该文档的子集以及相关联的编辑指令(238)。接着,第三计算机接收文档的子集以及相关联的编辑指令(240),并且以基于编辑指令的格式来呈现此文档子集。
图3给出了示出根据本发明的一种实施方式、用于确定与文档相关联的信息的方法300的流程图。在此方法中,系统(诸如图1的系统100)接收文档(310)。注意,这些文档可以包括图像。然后,在系统的计算机上执行的图像处理软件确定与文档相关联的第一编辑指令和分类信息集合(312)。
接着,系统接收与文档相关联的第二编辑指令和分类信息集合(314)。注意,第二编辑指令和分类信息集合可以由个人群组来生成,并且可以包括对第一编辑指令和分类信息集合的修改和/或添加。
在有些实施方式中,计算机可选地检测和/或纠正第一编辑指令和分类信息集合和/或第二编辑指令和分类信息集合中的错误(316)。而且,在有些实施方式中,系统可选地接受或拒绝与第一编辑指令和分类信息集合和/或第二编辑指令和分类信息集合相关联的、用于给定文档的编辑指令和/或分类信息(318)。
此外,系统基于与给定文档相关联的分类信息在层级数据结构中存储给定文档,其中给定文档与第二编辑指令和分类信息集合相关联(320)。而且,在有些实施方式中,系统一次或多次地重复接收(314)、检测和/或纠正(316)、接受或拒绝(318)和/或存储(320)操作。
注意,在有些实施方式中,在方法200(图2)和/或方法300(图3)中可以有附加的或更少的操作,操作的顺序可以改变,并且两个或更多操作可以合并成单个操作。
现在描述计算机或服务器(诸如图1的计算机110)的实施方式。更具体地,图4给出了示出根据本发明的一种实施方式的计算机系统400的框图。计算机系统400包括一个或多个处理器410、通信接口412、用户接口414以及将这些部件耦合在一起的一个或多个信号线422。注意,一个或多个处理器410可以支持并行处理和/或多线程操作,通信接口412可以具有永久通信连接,一个或多个信号线422可以构成通信总线。而且,用户接口414可以包括:显示器416、键盘418和/或指点器420(诸如鼠标)。
计算机系统400中的存储器424可以包括易失性存储器和/或非易失性存储器。更具体地,存储器424可以包括:ROM、RAM、EPROM、EEPROM、闪存、一个或多个智能卡、一个或多个磁盘存储设备、和/或一个或多个光存储设备。存储器424可以存储操作系统426,其包括用于处理各种基本系统服务以执行硬件相关的任务的过程(或指令集合)。尽管在计算机系统400中未明确指示,但是在某些实施方式中,操作系统426包括web浏览器。存储器424也可以在通信模块428中存储过程(或指令集合)。这些通信过程可以用于与一个或多个计算机和/或服务器通信,包括相对于计算机系统400位于远程的计算机和/或服务器。
存储器424还可以包括多个程序模块(或指令集合),包括:图像处理模块430(或指令集合)、搜索模块432(或指令集合)以及质量控制模块440(或指令集合)。此外,存储器424可以包括包含有文档434以及相关联的编辑指令436和分类信息438的数据结构。注意,搜索模块432可以基于接收到的搜索查询中的或与其相关联的关键词442来识别和返回结果(诸如文档434的子集)。
而且,在有些实施方式中,存储器424包括可选的格式化模块444(或指令集合)和/或可选的加密模块446(或指令集合)。注意,可选的格式化模块444可以用于改变存储在存储器424中的一个或多个文档434和/或相关联的信息的格式。
存储器424的各种模块中的指令可以通过以下语言实现:高级过程语言、面向对象编程语言和/或汇编或机器语言。编程语言可以被编译或解释,也即,可配置或配置成由一个或多个处理单元410来执行。
尽管将计算机系统400示出为具有多个分立部件,但是图4的意图在于对可以提供给计算机系统400的各种特征的功能性描述,而不是此处所描述的实施方式的结构示意。在实践中,如本领域普通技术人员可以认识到的那样,计算机系统400的功能可以分布在大量服务器或计算机上,服务器或计算机的各种群组执行这些功能的特定子集。在有些实施方式中,计算机系统400的部分或全部功能可以通过一个或多个ASIC和/或一个或多个数字信号处理器(DSP)来实现。
计算机系统400可以包括更少的或附加的部件,两个或更多部件可以合并成单个部件,和/或一个或多个部件的位置可以改变。在有些实施方式中,如本领域所公知的,计算机系统400的功能可以大部分在硬件中实现,小部分在软件中实现,或者可以小部分在硬件中实现而大部分在软件中实现。
图5给出了示出根据本发明一个实施方式的计算机500(诸如图1中的计算机120之一,或图1中的人员116之一使用的计算机)的框图。计算机500可以包括一个或多个数据处理器或中央处理单元(CPU)510、用于与其他计算机、服务器和/或客户端通信的通信接口512、用户接口514、存储器524以及将这些部件相互耦合的一个或多个信号线522。注意,一个或多个处理单元510可以支持并行处理和/或多线程操作,通信接口512可以具有永久通信连接,一个或多个信号线522可以构成通信总线。而且,用户接口514可以包括:显示器516、键盘518和/或指示器520(诸如鼠标)。
计算机500中的存储器524可以包括易失性存储器和/或非易失性存储器。更具体地,存储器524可以包括:ROM、RAM、EPROM、EEPROM、闪存、一个或多个智能卡、一个或多个磁盘存储设备、和/或一个或多个光存储设备。存储器524可以存储操作系统526,其包括用于处理各种基本系统服务以执行硬件相关的任务的过程(或指令集合)。存储器524也可以在通信模块528中存储过程(或指令集合)。这些通信过程可以用于与一个或多个计算机和/或服务器通信,包括相对于计算机500位于远程的计算机和/或服务器。此外,通信过程可以用于与实现搜索引擎的计算机系统通信。
存储器524还可以包括多个程序模块(或指令集合),包括:图形模块530(或指令集合)和浏览器模块532(或指令集合)。而且,浏览器模块532可以包括嵌入式搜索引擎工具534(或指令集合)和/或嵌入式编辑和分类工具536(或指令集合)。注意,嵌入式搜索引擎工具534可以由位于远程的搜索引擎来提供。此工具可以执行以下功能:监控用户接口514的用户输入;使用通信模块528传输用户请求(诸如搜索查询);使用通信模块528接收搜索结果(诸如文档或图像);以及使用显示器516以适当格式(诸如由与文档或图像相关联的编辑指令所指定的格式)显示这些结果的至少一些结果。
而且,在有些实施方式中,存储器524包括一个或多个存储web页面和/或文档538,并且可选地包括加密模块540(或指令集合)。
注意,计算机500可以包括更少的或附加的部件,两个或更多部件可以合并成单个部件,和/或一个或多个部件的位置可以改变。例如,在计算机500耦合至本地服务器的实施方式中,存储器524中的一个或多个模块和/或应用可以存储在与用户位于不同位置的服务器计算机中。此外,各种模块和/或子模块可以重新安排和/或组合。
现在讨论可以在系统100(图1)、计算机系统400(图4)和/或计算机500中使用的数据结构。具体地,图6提供了示出了根据本发明的一个实施方式的数据结构600的框图。此数据结构可以包括与文档610相关联的信息。而且,对于给定文档(诸如文档610-1),数据结构600可以包括编辑指令612-1,分类信息614-1,以及与文档610-1相关联的类别616-1,子类别618-1,和/或批次620-1。
图7提供了示出了根据本发明的一个实施方式的数据结构700的框图。此数据结构可以包括描述词710(诸如图6中的类别616)。具体地,描述词710可以包括服装类型,诸如:配件712、运动装714、女装716、女装衬衫/衬衣718、外套/外衣720、色彩灵感722、牛仔724、礼服726、饰品728和/或晚装730。
注意,在数据结构600和/或700的有些实施方式中,可以有更少或附加的部件。而且,两个或更多部件可以合并成单个部件,和/或一个或多个部件的位置可以改变。
尽管前述讨论使用了图像(诸如,时尚图像)作为示意性示例,但是系统、过程和技术的实施方式可以应用于组织其他类型的文档和/或内容。具体地,这些技术可以协助确定分类信息以及识别文档(诸如照片、文本、语音、影片、视频等等)中的内容,其中文档包括流行文化或其他主观领域中具有主观价值或相关度的信息。注意,在有些实施方式中,此主观价值随着时间是动态的。而且,当向系统(诸如图1的系统100)提供请求和/或搜索查询时,可以提供所组织的文档的子集。因此,这些技术非常适合于结合搜索引擎(包括在互联网和/或内联网上实现的)一起使用。
仅出于示意性和描述的目的提供了本发明实施方式的前述描述。这些描述的意图不在于穷尽或限制本发明于所公开的形式。因此,很多变形和改变对于本领域技术人员将是很明显的。而且,上述公开的意图不在于限制本发明。本发明的范围由所附权利要求限定。

Claims (20)

1.一种用于确定与文档相关联的信息的方法,包括:
接收文档,其中所述文档包括图像;
使用图像处理软件来确定与所述文档相关联的第一编辑指令和分类信息集合;以及
接收与所述文档相关联的第二编辑指令和分类信息集合,其中所述第二编辑指令和分类信息集合是由个人群组生成的,并且其包括对所述第一编辑指令和分类信息集合的修改和添加。
2.如权利要求1的方法,其中所述第二编辑指令和分类信息集合包括与至少一些所述文档相关联的主观评论。
3.如权利要求1的方法,其中所述个人群组与提供接收所述文档以及确定所述第一编辑指令和分类信息集合的系统的组织具有雇佣关系。
4.如权利要求3的方法,其中所述个人群组是所述组织外部的人员。
5.如权利要求1的方法,还包括检测所述第一编辑指令和分类信息集合或所述第二编辑指令和分类信息集合中的错误。
6.如权利要求5的方法,还包括纠正所述错误。
7.如权利要求1的方法,其中所述图像包括在时尚秀上拍摄的照片。
8.如权利要求1的方法,其中所述图像包括在展会上拍摄的照片。
9.如权利要求1的方法,其中所述第一编辑指令和分类信息集合或所述第二编辑指令和分类信息集合中的所述分类信息包括颜色。
10.如权利要求1的方法,其中所述第一编辑指令和分类信息集合或所述第二编辑指令和分类信息集合中的所述分类信息包括服装的类型。
11.如权利要求1的方法,其中所述第一编辑指令和分类信息集合或所述第二编辑指令和分类信息集合中的所述编辑指令包括剪切指令。
12.如权利要求11的方法,其中与所述第二编辑指令和分类信息集合相关联的用于给定文档的所述剪切指令包括由所述个人群组中的人员生成的所述剪切指令的历史。
13.如权利要求1的方法,其中与所述第二编辑指令和分类信息集合相关联的用于给定文档的所述编辑指令和分类信息包括来自所述个人群组中的人员的不同贡献。
14.如权利要求1的方法,还包括接受或拒绝与所述第一编辑指令和分类信息集合或所述第二编辑指令和分类信息集合相关联的、用于给定文档的编辑指令和分类信息。
15.如权利要求1的方法,还包括基于与给定文档相关联的分类信息,在层级数据结构中存储所述给定文档以及所述第二编辑指令和分类信息集合中相关联的编辑指令,其中所述给定文档与所述第二编辑指令和分类信息集合相关联。
16.如权利要求15的方法,其中所述层级数据结构包括类别和文档群组,其中基于与所述给定文档相关联的分类信息,将所述给定文档指派给给定类别以及一个或多个文档群组,并且其中所述给定文档与所述第二编辑指令和分类信息集合相关联。
17.如权利要求16的方法,其中进一步基于接收所述给定文档的时间或者与所述给定文档相关联的地理位置,将所述给定文档指派给所述给定类别。
18.如权利要求1的方法,还包括:
从客户端接收对信息的请求;
基于所述请求来识别所述文档的子集,其中基于与所述文档的子集相关联的分类信息来识别所述文档的子集,所述文档的子集与所述第二编辑指令和分类信息集合相关联;以及
将所述文档的子集以及所述第二编辑指令和分类信息集合中相关联的编辑指令提供给客户端;以及
其中所述相关联的编辑指令定义了将要显示所述文档的子集的格式。
19.一种用于结合计算机系统使用的计算机程序产品,所述计算机程序产品包括计算机可读存储介质以及嵌入在其中的计算机程序机制,其用于配置所述计算机系统,所述计算机程序机制包括:
用于接收文档的指令,其中所述文档包括图像;
用于使用图像处理软件来确定与所述文档相关联的第一编辑指令和分类信息集合的指令;以及
用于接收与所述文档相关联的第二编辑指令和分类信息集合的指令,其中所述第二编辑指令和分类信息集合是由个人群组生成的,并且其包括对所述第一编辑指令和分类信息集合的修改和添加。
20.一种计算机系统,包括:
处理器;
存储器;
程序模块,其中所述程序模块存储在所述存储器中并且配置用于由所述处理器执行,所述程序模块包括:
用于接收文档的指令,其中所述文档包括图像;
用于使用图像处理软件来确定与所述文档相关联的第一编辑指令和分类信息集合的指令;以及
用于接收与所述文档相关联的第二编辑指令和分类信息集合的指令,其中所述第二编辑指令和分类信息集合是由个人群组生成的,并且其包括对所述第一编辑指令和分类信息集合的修改和添加。
CN200880008887A 2007-03-21 2008-03-07 用于编辑和分类文档的系统和技术 Pending CN101681363A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/726,427 US7992082B2 (en) 2007-03-21 2007-03-21 System and technique for editing and classifying documents
US11/726,427 2007-03-21
PCT/US2008/056200 WO2008115713A2 (en) 2007-03-21 2008-03-07 System and technique for editing and classifying documents

Publications (1)

Publication Number Publication Date
CN101681363A true CN101681363A (zh) 2010-03-24

Family

ID=39766703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880008887A Pending CN101681363A (zh) 2007-03-21 2008-03-07 用于编辑和分类文档的系统和技术

Country Status (4)

Country Link
US (2) US7992082B2 (zh)
EP (1) EP2126742A2 (zh)
CN (1) CN101681363A (zh)
WO (1) WO2008115713A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110928846A (zh) * 2018-09-19 2020-03-27 国际商业机器公司 在混合安全环境中分割、编辑和传输安全文档
CN114026822A (zh) * 2019-05-30 2022-02-08 微软技术许可有限责任公司 使用客户端计算进行文档处理

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8515912B2 (en) 2010-07-15 2013-08-20 Palantir Technologies, Inc. Sharing and deconflicting data changes in a multimaster database system
US8688749B1 (en) 2011-03-31 2014-04-01 Palantir Technologies, Inc. Cross-ontology multi-master replication
US7992082B2 (en) * 2007-03-21 2011-08-02 Primatech Corporation System and technique for editing and classifying documents
US8285706B2 (en) * 2009-06-10 2012-10-09 Microsoft Corporation Using a human computation game to improve search engine performance
WO2013009770A1 (en) * 2011-07-12 2013-01-17 Inkling Systems, Inc. Workflow system and method for creating, distributing and publishing content
US9317496B2 (en) 2011-07-12 2016-04-19 Inkling Systems, Inc. Workflow system and method for creating, distributing and publishing content
US10534842B2 (en) 2011-07-12 2020-01-14 Inkling Systems, Inc. Systems and methods for creating, editing and publishing cross-platform interactive electronic works
WO2013100350A1 (en) 2011-12-28 2013-07-04 Samsung Electronics Co., Ltd. Image processing apparatus, upgrade apparatus, display system including the same, and control method thereof
US8782004B2 (en) 2012-01-23 2014-07-15 Palantir Technologies, Inc. Cross-ACL multi-master replication
CA2822147A1 (en) * 2012-07-26 2014-01-26 Symbility Solutions Inc. Claims-underwriting integration system and method
US9081975B2 (en) * 2012-10-22 2015-07-14 Palantir Technologies, Inc. Sharing information between nexuses that use different classification schemes for information access control
US9501761B2 (en) 2012-11-05 2016-11-22 Palantir Technologies, Inc. System and method for sharing investigation results
US8886601B1 (en) 2013-06-20 2014-11-11 Palantir Technologies, Inc. System and method for incrementally replicating investigative analysis data
CN104615601A (zh) * 2013-11-04 2015-05-13 英业达科技有限公司 基于网页的记录系统及其方法
US9569070B1 (en) 2013-11-11 2017-02-14 Palantir Technologies, Inc. Assisting in deconflicting concurrency conflicts
US9009827B1 (en) 2014-02-20 2015-04-14 Palantir Technologies Inc. Security sharing system
CA2951549A1 (en) * 2014-06-09 2015-12-17 Atomic Reach Inc. System and method for content intake, scoring and distribution
US10572496B1 (en) 2014-07-03 2020-02-25 Palantir Technologies Inc. Distributed workflow system and database with access controls for city resiliency
JP6672668B2 (ja) * 2015-09-28 2020-03-25 富士ゼロックス株式会社 画像処理装置及びプログラム
US10621198B1 (en) 2015-12-30 2020-04-14 Palantir Technologies Inc. System and method for secure database replication
US10262053B2 (en) 2016-12-22 2019-04-16 Palantir Technologies Inc. Systems and methods for data replication synchronization
US10068002B1 (en) 2017-04-25 2018-09-04 Palantir Technologies Inc. Systems and methods for adaptive data replication
US10430062B2 (en) 2017-05-30 2019-10-01 Palantir Technologies Inc. Systems and methods for geo-fenced dynamic dissemination
US11030494B1 (en) 2017-06-15 2021-06-08 Palantir Technologies Inc. Systems and methods for managing data spills
US10380196B2 (en) 2017-12-08 2019-08-13 Palantir Technologies Inc. Systems and methods for using linked documents
US10915542B1 (en) 2017-12-19 2021-02-09 Palantir Technologies Inc. Contextual modification of data sharing constraints in a distributed database system that uses a multi-master replication scheme
US20230274024A1 (en) * 2022-02-25 2023-08-31 BeeKeeperAI, Inc. Systems and methods for dataset selection optimization in a zero-trust computing environment

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030040985A1 (en) * 1999-08-25 2003-02-27 Kensaku Yukino Digital contents automatic preparation system and recording medium with automatically prepared digital contents recorded thereon
US7783154B2 (en) 1999-12-16 2010-08-24 Eastman Kodak Company Video-editing workflow methods and apparatus thereof
US20090083653A1 (en) * 2000-06-23 2009-03-26 Makoff Jeffrey T System for facilitating remote digital image manipulation services
WO2004057439A2 (en) * 2002-05-31 2004-07-08 University Of Utah Research Foundation System and method for visual annotation and knowledge representation
US20050289461A1 (en) * 2003-05-23 2005-12-29 Manoel Amado System and method for digital content processing and distribution
US20060217994A1 (en) * 2005-03-25 2006-09-28 The Motley Fool, Inc. Method and system for harnessing collective knowledge
US20060224964A1 (en) * 2005-03-30 2006-10-05 Microsoft Corporation Method, apparatus, and system of displaying personal digital media according to display characteristics
US20070150368A1 (en) * 2005-09-06 2007-06-28 Samir Arora On-line personalized content and merchandising environment
US7934160B2 (en) * 2006-07-31 2011-04-26 Litrell Bros. Limited Liability Company Slide kit creation and collaboration system with multimedia interface
US7809602B2 (en) * 2006-08-31 2010-10-05 Opinionlab, Inc. Computer-implemented system and method for measuring and reporting business intelligence based on comments collected from web page users using software associated with accessed web pages
US7992082B2 (en) * 2007-03-21 2011-08-02 Primatech Corporation System and technique for editing and classifying documents

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110928846A (zh) * 2018-09-19 2020-03-27 国际商业机器公司 在混合安全环境中分割、编辑和传输安全文档
CN110928846B (zh) * 2018-09-19 2024-02-27 国际商业机器公司 在混合安全环境中分割、编辑和传输安全文档
CN114026822A (zh) * 2019-05-30 2022-02-08 微软技术许可有限责任公司 使用客户端计算进行文档处理
CN114026822B (zh) * 2019-05-30 2023-09-22 微软技术许可有限责任公司 使用客户端计算进行文档处理

Also Published As

Publication number Publication date
EP2126742A2 (en) 2009-12-02
WO2008115713A3 (en) 2008-12-18
US9158793B2 (en) 2015-10-13
US20080235575A1 (en) 2008-09-25
WO2008115713A2 (en) 2008-09-25
US20110252296A1 (en) 2011-10-13
US7992082B2 (en) 2011-08-02

Similar Documents

Publication Publication Date Title
CN101681363A (zh) 用于编辑和分类文档的系统和技术
US7743045B2 (en) Detecting spam related and biased contexts for programmable search engines
US7693830B2 (en) Programmable search engine
US8756210B1 (en) Aggregating context data for programmable search engines
KR101886161B1 (ko) Ai 기반 개인 의류 토탈 관리 서비스 제공 방법
US8320707B2 (en) System and method for use of images with recognition analysis
US20160299983A1 (en) Programmable search engines
US8386914B2 (en) Enhanced document browsing with automatically generated links to relevant information
US7542610B2 (en) System and method for use of images with recognition analysis
US20070038603A1 (en) Sharing context data across programmable search engines
JP2022534933A (ja) ウェブ構築システムサービスにユーザフィードバックを統合するシステム及び方法
JP2001243256A (ja) ウェブ広告に基づく内容表示方法及び装置と、内容表示プログラム
TW201118620A (en) Systems and methods for providing advanced search result page content
TW201202980A (en) Infinite browse
CN104584033A (zh) 在线商店中的交互式服装搜索
US20230153366A1 (en) System and method for improved searching across multiple databases
WO2007041647A2 (en) System and method for use of images with recognition analysis
Wara A Framework for Fashion Data Gathering, Hierarchical-Annotation and Analysis for Social Media and Online Shop: TOOLKIT FOR DETAILED STYLE ANNOTATIONS FOR ENHANCED FASHION RECOMMENDATION
Han Extracting News from Server Side Databases by Query Interfaces
CN113377367A (zh) 数据收集方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20100324