CN108369578A - 基于先前文档的自动模板生成 - Google Patents

基于先前文档的自动模板生成 Download PDF

Info

Publication number
CN108369578A
CN108369578A CN201780004207.8A CN201780004207A CN108369578A CN 108369578 A CN108369578 A CN 108369578A CN 201780004207 A CN201780004207 A CN 201780004207A CN 108369578 A CN108369578 A CN 108369578A
Authority
CN
China
Prior art keywords
document
user
component
template
subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780004207.8A
Other languages
English (en)
Other versions
CN108369578B (zh
Inventor
J·S·马森
S·D·德塞
T·A·埃斯特拉达
M·E·凯斯林
Y·B·李
A·A·维尔登
E·J·多明格斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN108369578A publication Critical patent/CN108369578A/zh
Application granted granted Critical
Publication of CN108369578B publication Critical patent/CN108369578B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2272Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Document Processing Apparatus (AREA)
  • Processing Or Creating Images (AREA)

Abstract

提供了基于与用户相关联的文档中的辨识的组成元素模式的、文档模板的自动生成。对于特定用户或对于用户组而言,文档中使用的组成元素通常是独特的。自动模板生成系统检测与用户相关联的文档中的组成元素模式,以及生成并提供一个或多个有用且相关的模板,所述模板包括与先前创建的文档中使用的组成元素的子集相一致的组成元素。基于与用户相关联的文档中的组成元素模式来生成文档模板改善了用户体验,减少了为重用文档之间的组成元素而对带宽、存储器和处理能力的使用。另外,提供用户相关模板有助于确保跨由用户创建的文档的一致性。

Description

基于先前文档的自动模板生成
背景技术
用户经常创建具有类似的总体结构的文档,例如具有重复出现的内容和/或相似格式的文档。通常,对于特定用户或对于用户组而言,结构是独特的。例如,用户可能是大学生,其教授对他们课程的工作格式有要求。对于每项新作业,用户可以通过微调格式以匹配特定的课程的要求来着手。用户可以从空白文档开始并建立格式,或者使用先前的作业作为模板以试图具有一致的格式。
或者,作为另一示例,用户可以产生具有特定结构的合规文档,并且可以包括在文档之间共享的样板语言。当创建新文档时,用户可以将现有文档的部分剪切并粘贴到新文档中。如可以领会的,建立具有个别属性的每个新文档或从现有文档手动组织文档可能是乏味的、耗时的,并且可能容易出现人为错误。另外,计算设备需要另外的处理步骤以根据用户的输入来安排每个新文档的格式。
模板是预先构建的文档类型,其包括各种组成元素,例如样式集合、格式设置和内容。当在应用中打开时,模板创建其自身的副本,用户可以在其中输入他们自己的信息,以代替利用各种组成元素重复创建新文档。各种预先构建的模板可以与应用一起被预先安装,或者可以是可供下载的。在一些应用中,用户能够创建和保存自定义模板,所述自定义模板可以用于创作未来的文档。
发明内容
提供本概括是为了以简要形式介绍以下在详细描述部分中进一步描述的对构思的选择。本概括不旨在标识所要求保护的主题的关键特征或基本特征,也不旨在帮助确定所要求保护的主题的范围。
为了在创建文档时改善计算设备的效率并改善其上的用户体验,本文公开的系统、方法和计算机存储介质提供了基于辨识的重复出现的组成元素的、文档模板的生成。自动模板生成方法和系统检测与用户相关联的文档中的组成元素模式,以及生成并向用户提供一个或多个有用且相关的模板,所述模板包括与先前创建的文档中使用的组成元素的子集相一致的组成元素。
示例被实现为计算机过程、计算系统或者诸如设备、计算机程序产品或计算机可读介质之类的制品。根据一方面,该计算机程序产品是可由计算机系统读取并且编码用于执行计算机过程的指令的计算机程序的计算机存储介质。
在以下附图和描述中阐述了一个或多个方面的细节。通过阅读以下详细描述和查看相关联的附图,其他特征和优点将显而易见。应当理解的是,以下详细描述只是解释性的,而并不对权利要求进行限制。
附图说明
并入本公开内容并构成其一部分的附图示出了各个方面。在附图中:
图1是对示例性创作环境的图示,其中,可以实践基于辨识的重复出现的组成元素的自动文档模板生成;
图2是用于基于辨识的重复出现的组成元素的自动文档模板生成的示例性方法中的数据流的图形表示;
图3是示出自动模板生成系统从其辨识用于生成文档模板的重复出现的组成元素的示例性文档的图示;
图4A是示出用于在示例性计算设备上显示自动生成的文档模板的用户界面的图示;
图4B是示出用于在另一示例性计算设备上显示自动生成的文档模板的用户界面的图示;
图5是示出基于自动生成的文档模板创建的示例性文档的图示;
图6是示出示例性自动模板生成系统的组件的框图;
图7是示出用于基于辨识的重复出现的组成元素的自动文档模板生成的示例性方法中涉及的一般阶段的流程图;
图8是示出计算设备的示例性物理组件的框图;
图9A和图9B是移动计算设备的框图;以及
图10是分布式计算系统的框图。
具体实施方式
以下详细描述参考了附图。只要可能,在附图中使用相同的附图标记,并且以下描述参考相同或相似的元素。虽然示例可能被描述,但是修改、改编和其他实施方式也是可能的。例如,可以对附图示出的元素进行替换、添加或修改,并且可以通过对所公开的方法进行替换、重新排序或添加阶段来修改本文描述的方法。因此,以下详细描述不是限制性的,相反,适当的范围由所附权利要求所定义。示例可以采用硬件实施方式、或者完全软件的实施方式、或者组合软件和硬件方面的实施方式的形式。因此,以下详细描述不应被认为是限制性的。
本公开内容的方面针对用于基于辨识的重复出现的组成元素的自动文档模板生成的方法、系统和计算机存储介质。图1是示出其中可以实践基于辨识的重复出现的组成元素的自动文档模板生成的示例性创作环境100的框图。示例性创作环境100包括由用户102使用的采用以下形式的至少一个客户端计算设备104a-n(统称为104):桌上型计算机、膝上型计算机、平板计算机、手持式计算设备、移动通信设备、可穿戴设备、游戏设备等。
示例性创作环境100包括在计算设备104上执行的至少一个应用106。应用106可以是各种类型的应用或应用套件中的一个应用,例如但不限于:文字处理应用、电子表格应用、幻灯片演示应用、绘图或计算机辅助制图应用、电子邮件和联系人应用、笔记应用等。在一些示例中,应用106是被本地地存储在计算设备104上的胖客户端应用。在其他示例中,应用是驻留在可通过网络140访问的远程服务器(例如,网络应用服务器)上的瘦客户端应用106(即,网络应用),所述网络140例如互联网、内联网、局域网、广域网或其组合。瘦客户端应用106可以被托管在浏览器控制的环境中或者以浏览器支持的语言编码并且依赖于用户代理(例如,常见的网络浏览器),以呈现在计算设备104上可执行的应用106。
此外,应用106操作用于接收包括文档108的至少一部分的输入数据。应用106还被配置为与自动模板生成系统110进行通信,示出了被优化为自动辨识与用户102相关联的多个存储的文档108a-n中的重复出现的组成元素,以及基于辨识的重复出现的组成元素为用户102生成并提供一个或多个文档模板120a-n(统称为120)的软件模块或系统。
对于特定用户102或对于用户组(例如,同事、相同课程的学生等)而言,文档108中使用的组成元素通常是独特的。例如,用户102或用户组通常创建具有相同或相似组成元素(例如,文档级格式(例如,页面布局)、文本格式和内容部分)的文档108。因此,自动模板生成系统110能够检测与用户102相关联的文档108中的组成元素模式,以向用户102提供包括对用户102有用的组成元素的子集的模板120。基于与用户102相关联的文档108中的组成元素模式来生成文档模板120改善了用户体验,减少了为重用文档108之间的组成元素而对带宽、存储器和处理能力的使用。例如,代替利用用户102偏好或要求的各种组成元素重复创建新文档108,或代替手动创建期望的模板,自动模板生成系统110自动向用户102提供与用户102相关的一个或多个文档模板120。另外,提供用户相关模板120有助于确保跨由用户102创建的文档108的一致性。如可以领会的,提供专门针对用户需求定制的模板减少了重做时间;用户能够在从头创建文档108或重做现有文档108方面节省时间和步骤,从而减少用户输入量以及计算设备104处理用户输入所需的处理功率。
在一些示例中,自动模板生成系统110在服务器112上运行。服务器112与数据库114通信,所述数据库114存储文档108,自动模板生成系统110从所述文档108构造内容块的索引118,从所述内容块分析组成元素以识别用于自动创建一个或多个文档模板120的重复出现和其他趋势。例如,当文档108在云计算环境中被创作(例如,经由网络界面或瘦客户端)时,自动模板生成系统110从位于云中(例如,存储在由服务器112管理的数据库114或存储器存储设备中)的文档108、本地于用户定位(例如,存储在由计算设备104管理的数据库114或存储器存储设备中)的文档108以及位于与计算设备104通信的本地或企业网络的设备部分上(例如,存储在由不同计算设备104或者本地或企业服务器(例如,文档管理系统)管理的数据库114或存储器存储设备中)的文档108构造内容块的索引118和格式属性。
服务器112可以位于远离计算设备104的本地网络处,例如作为云服务器,在这种情况下,网络140表示互联网或虚拟专用网络(VPN)或其他直接的数据链路。服务器112还可以作为计算设备104的本地网络的一部分定位,在这种情况下,网络140表示用于实体(例如,公司、大学、政府机构)的局域网(LAN)或专用分布式网络。服务器112将自动模板生成系统110提供给授权用户,以及在网络140上接收通信以构建索引118并创建和提供与那些授权用户102相关的文档模板120。
现在参考图2,示出了用于基于示例性创作环境中的辨识的重复出现的组成元素的、文档模板120的自动生成的示例性方法中的数据流200的图形表示。示例性数据流200在202处开始,其中,计算设备104从用户102接收用于创建文档108的输入。例如,用户102可以通过添加、移除、重新定位来与内容和格式元素交互并修改内容和格式元素,或以其他方式修改文档108的内容或格式属性。内容或格式属性可以经由各种输入方法被添加、移除或修改,所述各种输入方法例如依赖于鼠标、键盘和遥控器的输入方法以及自然用户界面(NUI)方法,所述NUI方法使得用户能够以“自然”方式与设备交互,例如经由语音识别、触摸和触笔识别、屏幕上和屏幕附近二者的姿势识别、空中姿势、头部和眼睛跟踪、语音和言语、视觉、触摸、悬停、姿势和机器智能。
示例性数据流200继续到204,其中,文档108被存储在数据库114中。在一些示例中,数据库114本地于用户定位(例如,由计算设备104管理的数据库114或存储器存储设备)。在其他示例中,数据库114位于作为与计算设备104通信的本地或企业网络的一部分的设备上(例如,由不同计算设备104或者本地或企业服务器(例如,文档管理系统)管理的数据库114或存储器存储设备)。在其他示例中,数据库114位于云中(例如,由服务器112管理的数据库114或存储器存储设备)。如将领会的,服务器112和数据库114可以是分布式系统的一部分,并且由众多个别的计算系统组成,并且多个客户端设备104可以与用于基于辨识的重复出现的组成元素的自动文档模板120生成的自动模板生成系统110进行通信。
示例性数据流200继续到206,其中,自动模板生成系统110智能地扫描与用户102相关联的文档108的语料库,以及辨识文档108的语料库的组成元素的趋势和模式。根据一些方面,文档108的语料库被存储在数据库114中。在一些示例中,用户102或自动模板生成系统110可以指定可以从其提取文档108的数据库114或数据库114的部分,并且还可以指定具体的文档。例如,用户102或自动模板生成系统110可以指定相关联的在线存储服务(例如,可从华盛顿州雷蒙德市的微软公司获得的云存储解决方案)作为数据库114。用户102或自动模板生成系统110还可以将本地于计算设备104的或连接到网络140的硬盘驱动器、文件夹或文件指定为数据库114。
用户102或自动模板生成系统110还可以将与用户102或用户102的同事相关联的云或本地存储装置指定为数据库114。例如,自动模板生成系统110可以使用搜索和发现服务(例如,也可从华盛顿州雷蒙德市的微软公司获得的DELVETM管理工具)来发现组织中的人之间的联系,并且定位用户102的同事的文件、文件夹和驱动器以针对识别用于自动创建一个或多个文档模板120的重复出现和其他趋势进行分析。
根据各个方面,自动模板生成系统110操作用于智能地扫描文档108的语料库,以及对文档内容、内容格式和文档级格式进行索引。例如,自动模板生成系统110构造内容块的索引118,格式属性和页面布局属性。在一些示例中,自动模板生成系统110读取标记语言标签(例如,可扩展标记语言(XML)标签),以区分与文档108内的内容相关联的位置或级别(例如,标题、页眉、正文、页脚、脚注、尾注)。
示例性数据流200继续到208,其中,自动模板生成系统110分析索引118以识别文档内容或格式属性中的趋势。在一些示例中,自动模板生成系统110应用结构、统计和语言技术来辨别内容的类型以及文档108的内容和结构之间的关系。根据一方面,自动模板生成系统110识别文档108中的组成元素的子集。例如,若干文档108可能具有格式一致的标题、一致的内容片段,但格式不一致的页面编号。自动模板生成系统110操作用于识别一致的组成趋势(例如,标题的格式、内容片段)。在一些示例中,自动模板生成系统110将与文档108相关联的其他信息与与识别的相配组成元素进行分析和比较,以将识别的组成元素的子集按优先顺序排列。例如,其他信息可以包括基于文档108的年龄的年龄因素或基于作者与用户102的关系的相关因素(例如,当分析用户的同事的文档108时)。
作为示例并参考图3,特定用户102(Alex Smith)是其课程作业包括写大量论文(即,文档108a-c)的学生。他的老师中的每一者都可能对工作的格式有不同的要求。例如并且如图3示出的,第一门课(哲学201)的老师可能要求他/她的学生在作业上包括右对齐标题,所述标题包括学生姓名304、课程306、课程时段308和日期310。老师还可能针对每份论文要求双倍行距、左对齐并有一英寸页边距,包括居中并采用粗体字体的题目312,并包括居中并在页面底部处的页码316。其他课程的老师可能有不同的要求。
对于Alex(即,用户102)为他的课程写的第一组若干论文(即,文档108),他可以通过调整格式以匹配特定的课程的要求来着手创建每个新论文(即,文档108)。Alex(即,用户102)还可以使用他个人偏好使用的某些格式属性和样式,例如某字型。随着Alex(即,用户102)创建论文(即,文档108),并且随着论文被存储在数据库114中,自动模板生成系统110扫描并索引论文(即,文档108)的内容和格式特性。自动模板生成系统110然后执行对索引118的分析,以及识别文档108之间的组成元素的相配子集。
仍然参考图3示出的示例300,自动模板生成系统110识别出由Alex(即,用户102)创作的三个文档108a、b、c包括内容的相配部分。例如,自动模板生成系统110在三个文档108a、b、c的第一行上识别出相同文本“Alex Smith”(即,名字304a、b、c),在三个文档108a、b、c的第二行上识别出相同文本“哲学201”(即,课306a、b、c),并且在三个文档108a、b、c的第三行上识别出相同文本“第三时段”(即,课程时段308a、b、c)。自动模板生成系统110还在三个文档108a、b、c的第四行上识别出<日期>标签(即,日期310a、b、c)。在理解了用户正在录入的数据的类型是日期310时,<日期>标签可以由用户102插入,可以由用于创作文档108的应用106自动插入,或者可以在进行索引或分析时由自动模板生成系统110识别并自动插入。自动模板生成系统110还识别与三个文档108a、b、c中的相配内容相关联的相同格式属性(例如,右对齐、双倍行距)。
继续该示例,自动模板生成系统110识别出由Alex(即,用户102)创作的三个文档108a、b、c还包括另外的相配组成元素。例如,自动模板生成系统110识别出三个文档108a、b、c中的包括变化的文本内容但是具有相同的格式样式(例如,居中、粗体、12pt字体)的题目标题312a、b、c。自动模板生成系统110还识别另外的相配组成元素,例如页面布局、对齐、间距、页边距、缩进、页面编号、字型等。
再次参考图2,当跨多个文档108的相配组成元素集被辨识时,示例性数据流200继续到210,其中,自动模板生成系统110基于所辨识的组成元素集来生成一个或多个文档模板120。根据示例,模板120是预先构建的文件,其包括各种组成元素,例如新文档108可以基于的样式集合、格式设置、文档级格式设置和内容。根据示例,自动模板生成系统110操作用于使用XML标签构造模板120,以根据模式(schema)向所辨识的相配组成元素集中的内容或格式元素给予各种结构和关系意义。自动模板生成系统110操作用于根据组成元素从其中识别的文档108来区分被包括在文档模板120中的内容或格式元素以及与文档模板120内的内容或格式元素相关联的位置或级别(例如,标题、页眉、正文、页脚、脚注、尾注)。
示例性数据流200继续到212,其中,自动模板生成系统110将生成的文档模板120提供给用户102。例如,应用106还生成用于向用户102显示除了任何其他预先存在的模板之外的自动生成的文档模板120的用户界面(UI)201。根据示例,当用户102在计算设备104上打开应用106时,除了任何其他预先存在的模板之外,自动生成的文档模板120例如经由应用编程接口(API)调用被暴露给应用106。在图4A和4B示出了显示在示例性计算设备104上的示例性UI 201。在一些示例中,多个文档108中的一个或多个文档108的图像也可以被显示给用户,从所述多个文档108中选择的组成元素的子集被包括在自动生成的文档模板120中。
再次参考图2,示例性数据流200继续到214,其中,用户102从UI 201中选择自动生成的文档模板120。例如,可以经由鼠标选择、击键录入、触摸屏录入、语音或其他音频录入、姿势录入等来接收对自动生成的文档模板120的选择。
示例性数据流200继续到216,其中,新文档108基于被包括在所选择的自动生成的文档模板120中的组成元素被创建。例如,当用户102创建新文档108时,应用106将新文档108基于模板120。如果用户102在创建新文档108时未指定特定模板120,或者如果用户102使用空白文档模板,则新文档108基于默认模板,所述默认模板包括诸如字体、字体大小、文件内容等的默认设置。在选择了自动生成的文档模板120时,文档108继承存在于所选择的模板120中的组成元素。如以上描述的,通过提供自动生成的用户相关文档模板120,用户102能够在从头创建文档108或重做现有文档108方面节省时间和步骤,从而减少用户输入量和计算设备104处理用户输入所需的处理功率。另外,跨由用户102创建的文档108的一致性被确保。
根据一方面,当文档模板120被选择并且被用于创建新文档108时,用户102可以修改模板的一些组成元素。例如,用户102可以修改内容、内容格式或文档级格式。因此,在一些示例中,可以对组成元素的修改进行索引和分析。当趋势被识别出时,例如当用户102对给定的模板120的组成元素进行相同的修改时,自动模板生成系统110操作用于基于所识别的趋势来修改模板120或生成新模板120。
继续以上描述的由学生Alex(即,用户102)创建的论文(即,文档108)的示例,可以基于跨由Alex创建的多个文档108一致的组成元素的识别的子集来自动为Alex创建文档模板120。自动生成的文档模板120在UI 201中被显示给Alex(即,用户102),所述UI 201例如图4A和图4B示出的示例性UI。在选择了自动生成的文档模板120时,新文档108被创建,其中,新文档108继承存在于所选择的自动生成的文档模板120中的组成元素。
参考图5,示出了新文档108的示例,所述新文档108包括基于跨由Alex创建的多个文档108一致的组成元素的识别的子集而针对Alex存在于自动生成的文档模板120中的各种组成元素。由新文档108继承的组成元素的子集的示例包括各种内容片段,例如文档108的第一行上的文本“Alex Smith”(即,名字304)、文档108的第二行上的文本“哲学201”(即,课程306)和文档108的第三行上的文本“第三时段”(即,课程时段308)。由自动模板生成系统110识别的组成元素的示例性子集还包括文档108的第四行上的<日期>标签(即,日期310)和各种占位符502,例如用于题目标题312的占位符和用于文档108的正文中的文本内容的一部分的占位符502。例如,当自动模板生成系统110识别相配格式元素但具有与数据元素相关联的变化的内容时,自动模板生成系统110操作用于插入包括所识别的相配格式属性的占位符502和用户能够输入不同内容到其中的输入区域。例如,用于题目标题312的占位符502包括图3示出的文档108a、b、c的题目标题312a、b、c的格式属性(例如,居中、粗体、12pt字体)。其他示例性占位符502可以包括图片占位符、表格占位符、图表占位符等。由自动模板生成系统110识别并且基于自动生成的文档模板120被包括在示例性文档108中的组成元素的示例性子集还包括其他格式属性,例如对齐、间距、页边距、缩进、页面编号等。如应当领会的,关于图3-5示出并在以上描述的示例是示例性的,而并不限制自动模板生成系统110的方面和示例。
现在参考图6,示出了示例性自动模板生成系统110的各种组件的框图。根据示例,自动模板生成系统110包括:至少一个处理器602和存储代码606的存储器604,所述代码606可由处理器602执行以使文档检索器608从数据库114中检索文档108;索引器610,其用于提取并索引从检索出的文档108提取的内容和格式元素;趋势分析器612,其用于辨识与用户102相关联的文档108之中的重复出现的组成元素的趋势和模式;以及模板创建器614,其使用组成元素的辨识的子集来构造文档模板120,所述组成元素可以包括内容元素、格式元素(例如,包括文档级格式元素)、或者内容元素和格式元素的组合。
文档检索器608示出了用于操作用于从数据库114检索文档108的软件模块、系统或设备。如以上描述的,数据库114存储文档108的语料库。在一些示例中,数据库114本地于用户定位(例如,由计算设备104管理的数据库114或存储器存储设备)。在其他示例中,数据库114位于作为与计算设备104通信的本地或企业网络的一部分的设备上(例如,由不同计算设备104或者本地或企业服务器(例如,文档管理系统)管理的数据库114或存储器存储设备)。在其他示例中,数据库114位于云中(例如,由服务器112管理的数据库114或存储器存储设备)。
在一些示例中,文档检索器608操作用于检索特定文档108。在其他示例中,文档检索器608操作用于检索被存储在特定数据库114或数据库114的部分中的文档108。在一些示例中,文档检索器608操作用于从如数据库114那样本地于计算设备104或连接到网络140的硬盘驱动器、文件夹或文件中检索文档108。文档检索器608可以检索批量的文档108,或者可以检索单个文档108。
索引器610示出了操作用于智能地扫描由文档检索器608检索的文档108,从文档108中发现并提取组成元素(例如,内容、内容格式元素和文档级格式元素),以及对索引118中的组成元素进行索引的软件模块、系统或设备。
趋势分析器612示出了操作用于分析索引118以进行比较,识别与用户102相关联的文档108之中的重复出现的组成元素的趋势和模式,以及确定组成元素的有意义的子集以用于构造与用户102相关且对其有用的文档模板120的软件模块、系统或设备。例如,趋势分析器612操作用于识别多个文档108中的特定内容(例如,文本内容、理解的字符串类型、图像、表格、图表)的重复包括、对特定的格式属性的重复使用、包括多个文档108中的内容格式和文档级格式(例如,对齐、间隔、页边距、缩进、页面编号、页眉、页脚、列、字型、字体大小)、以及内容和格式属性的组合。
模板创建器614示出了操作用于从由趋势分析器612识别的组成元素的有意义的子集来构造文档模板120的软件模块、系统或设备。当多个子集被识别时,模板创建器614操作用于构造多个文档模板120。在一些示例中,模板创建器614使用XML标签来构造模板120,以根据模式向所辨识的相配组成元素集中的内容或格式元素给予各种结构和关系意义。
图7是示出用于基于辨识的重复出现的组成元素的自动文档模板生成的示例性方法700中涉及的一般阶段的流程图。现在参考图7,方法700从开始操作702处开始,并前进到操作704,其中,计算设备104的用户102使用应用106来创建多个文档108并将文档108存储在数据库114中。多个文档108包括各种内容片段和各种格式元素。多个文档108中的每一者的创建可以在时间段上的不同时间处发生。文档108可以包括文字处理文档、电子表格、幻灯片演示文档、电子邮件文档、笔记记录文档等。
方法700前进到操作706,其中,文档检索器608从数据库114检索文档108,并且索引器610对索引118中的文档108的内容和格式元素进行索引。在一些示例中,索引器610读取标记语言标签(例如,可扩展标记语言(XML)标签),以区分与文档108内的内容和格式相关联的位置或级别(例如,标题、页眉、正文、页脚、脚注、尾注)以用于对内容和格式元素进行索引。
方法700前进到操作708,其中,趋势分析器612分析索引118,以及识别文档108之间的相配组成元素。趋势分析器612还确定组成元素(例如,内容元素、格式元素)的有意义的子集,以用于构造与用户102相关且对其有用的文档模板120。
方法700前进到操作710,其中,模板创建器614从由趋势分析器612识别的组成元素的有意义的子集来构造文档模板120。
在操作712处,一个或多个文档模板120或一个或多个文档模板120的表示在计算设备104上的UI 201中被显示。根据示例,当用户102在计算设备104上打开应用106以创建新文档108时,应用106向自动模板生成系统110请求可用的模板120。作为响应,自动模板生成系统110将可用的模板120或可用的模板的子集(包括自动生成的用户相关模板120)提供给应用106以便在UI 201中显示。在一些示例中,自动模板生成系统110提供可用的模板120或可用的模板的子集的表示(例如,缩略图或预览图像)。根据一方面,相同的模板120在用户102使用的所有计算设备104上(例如,在诸如电话或平板电脑之类的移动设备,或者由用户102使用的桌上型、膝上型或其他类型的计算设备上)可用。
方法700前进到操作714,其中,对自动生成的模板120的选择的指示被接收。例如,用户102可以使用各种输入单元(例如,鼠标选择、击键录入、触摸屏录入、语音或其他音频录入、姿势录入)之一以用于选择期望的自动生成的模板120。
在操作716处,新文档108基于被包括在所选择的自动生成的文档模板120中的组成元素被创建。换言之,文档108继承了存在于所选择的模板120中的组成元素。在一些示例中,应用106可以针对所选择的自动生成文档模板120向自动模板生成系统110进行调用,如果其尚未被接收到的话(例如,如果预览图像在操作712处被发送)。用户102能够在新文档108的几乎任何地方开始,而不必担心建立格式细节。例如并且返回参照Alex的示例,当他的老师指派下一论文时,Alex(即,用户102)不必挖掘他的课程大纲以找到所需的格式要求;他先前使用的格式属性被自动地提供给他,从而节省了时间并为Alex提供了更好的用户体验。
在操作716处,用户102可以将另外的内容添加到文档108。在一些示例中,如果自动生成的文档模板120包括一个或多个占位符502,则用户102可以输入内容,并且与占位符502相关联的格式属性被应用于所添加的内容。
方法700继续到操作718,其中,文档108被保存并被存储在数据库114中。方法700可以返回到操作706,其中,新文档108被分析和索引。例如,用户102可以对模板120的一个或多个组成元素进行改变,例如对内容、内容格式或文档级格式的改变。因此,可以对组成元素的修改进行索引和分析。在一些示例中,当趋势被识别时,例如当用户102对给定的模板120的组成元素进行相同的修改时,自动模板生成系统110操作用于基于所识别的趋势来修改模板或生成新模板。
在可选操作720处,自动模板生成系统110分析自动生成的模板120的相关性。例如,自动模板生成系统110例如,自动模板生成系统110可以确定相关性分数并将其与自动生成的文档模板120相关联,使得当针对对于给定的用户102可用的模板120,自动模板生成系统110被进行调用时,最相关的文档模板120被提供以便在UI 201中显示。方法700在操作798处结束。
虽然实施方式已在与结合在计算机上的操作系统上运行的应用程序一起执行的程序模块的一般上下文中被描述,但本领域的技术人员将认识到,一些方面也可以结合其他程序模块被实施。通常,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。
本文描述的方面和功能可以经由众多计算系统来操作,包括但不限于桌上型计算机系统、有线和无线计算系统、移动计算系统(例如,移动电话、上网本、平板或平板型计算机、笔记本计算机和膝上型计算机)、手持式设备、多处理器系统、基于微处理器或可编程的消费者电子产品、小型计算机和大型计算机。
另外,根据一方面,本文描述的方面和功能在分布式系统(例如,基于云的计算系统)上操作,其中,应用功能、存储器、数据存储和检索以及各种处理功能在分布式计算网络(例如,互联网或内联网)上彼此远程地操作。根据一方面,用户界面和各种类型的信息经由机载计算设备显示器或经由与一个或多个计算设备相关联的远程显示单元被显示。例如,用户界面和各种类型的信息在用户界面和各种类型的信息被投影到的墙表面上被显示和交互。与用其实践实施方式的众多计算系统的交互包括:击键录入、触摸屏录入、语音或其他音频录入、姿势录入等,其中,相关联的计算设备配备有用于捕获和解释用于控制计算设备的功能的用户姿势的检测(例如,相机)功能。
图8-10和相关联的描述提供了对在其中示例被实践的各种操作环境的讨论。然而,关于图8-10示出和讨论的设备和系统仅用于示例和说明的目的,而并不限制被用于实践本文描述的方面的大量计算设备配置。
图8是示出利用其实践本公开内容的示例的计算设备800的物理组件(即,硬件)的框图。在基本配置中,计算设备800包括至少一个处理单元802和系统存储器804。根据一方面,取决于计算设备的配置和类型,系统存储器804包括但不限于易失性存储器(例如,随机存取存储器)、非易失性存储器(例如,只读存储器)、闪速存储器或这样的存储器的任意组合。根据一方面,系统存储器804包括操作系统805和适于运行软件应用850的一个或多个程序模块806。根据一方面,系统存储器804包括自动模板生成系统110。例如,操作系统805适于控制计算设备800的操作。此外,一些方面结合图形库、其他操作系统或任何其他应用程序被实践,并且不限于任何特定应用或系统。该基本配置在图8中由虚线808内的那些组件示出。根据一方面,计算设备800具有另外的特征或功能。例如,根据一方面,计算设备800包括另外的数据存储设备(可移除和/或不可移除的),例如磁盘、光盘或磁带。图8中由可移除存储设备809和不可移除存储设备810示出了这样的另外的存储装置。
如上所述,根据一方面,多个程序模块和数据文件被存储在系统存储器804中。当在处理单元802上执行时,程序模块806(例如,自动模板生成系统110)执行包括但不限于图7示出的方法700的一个或多个阶段的过程。根据一方面,其他程序模块根据示例被使用并且包括诸如电子邮件和联系人应用、文字处理应用、电子表格应用、数据库应用、幻灯片演示应用、绘图或计算机辅助应用程序等的应用。
根据一方面,一些方面在包括分立电子元件、包含逻辑门的封装或集成电子芯片、使用微处理器的电路的电气电路中或包含电子元件或微处理器的单个芯片上被实践。例如,一些方面经由其中图8示出的每个或许多组件被集成到单个集成电路上的片上系统(SOC)被实践。根据一方面,这样的SOC设备包括一个或多个处理单元、图形单元、通信单元、系统虚拟化单元和各种应用功能,他们中的全部作为单个集成电路被集成(或“烧录”)到芯片衬底上。当经由SOC进行操作时,本文描述的功能经由单个集成电路(芯片)上的与计算设备800的其他组件集成的专用逻辑单元被操作。根据一方面,使用能够执行逻辑运算的其他技术来实践本公开内容的一些方面,所述逻辑运算例如与(AND)、或(OR)和非(NOT),所述其他技术包括但不限于机械技术、光学技术、流体技术和量子技术。另外,一些方面在通用计算机内或任何其他电路或系统中被实践。
根据一方面,计算设备800具有诸如键盘、鼠标、笔、声音输入设备、触摸输入设备等的一个或多个输入设备812。根据一方面,诸如显示器、扬声器、打印机等的输出设备814也被包括。上述设备是示例,并且其他设备可以被使用。根据一方面,计算设备800包括允许与其他计算设备818通信的一个或多个通信连接816。合适的通信连接816的示例包括但不限于射频(RF)发射机、接收机和/或收发机电路;通用串行总线(USB)、并行和/或串行端口。
如本文使用的术语计算机可读介质包括计算机存储介质。计算机存储介质包括以用于存储信息(例如,计算机可读指令、数据结构或程序模块)的任何方法或技术实现的易失性和非易失性、可移除和不可移除介质。系统存储器804、可移除存储设备809和不可移除存储设备810都是计算机存储介质示例(即,存储器存储装置)。根据一方面,计算机存储介质包括:RAM、ROM、电可擦除可编程只读存储器(EEPROM)、闪速存储器或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光存储装置、磁带盒、磁带、磁盘存储装置或其他磁存储设备,或者可用于存储信息并且可由计算设备800访问的任何其他制品。根据一方面,任何这样的计算机存储介质是计算设备800的一部分。计算机存储介质不包括载波或其他传播的数据信号。
根据一方面,通信介质通过计算机可读指令、数据结构、程序模块或经调制的数据信号(例如,载波或其他传输机制)中的其他数据被体现,并且包括任何信息递送介质。根据一方面,术语“经调制的数据信号”描述具有以对信号中的信息进行编码的方式设置或改变的一个或多个特性的信号。通过示例而非限制的方式,通信介质包括诸如有线网络或直接有线连接之类的有线介质,以及诸如声学、射频(RF)、红外线和其他无线介质之类的无线介质。
图9A和图9B示出了利用其可以实践一些方面的移动计算设备900,例如移动电话、智能电话、平板个人计算机、膝上型计算机等。参考图9A,示出了用于实现一些方面的移动计算设备900的示例。在基本配置中,移动计算设备900是具有输入元件和输出元件二者的手持式计算机。移动计算设备900通常包括显示器905和允许用户将信息录入到移动计算设备900中的一个或多个输入按钮910。根据一方面,移动计算设备900的显示器905充当输入设备(例如,触摸屏显示器)。如果被包括,则可选的侧输入元件915允许进一步的用户输入。根据一方面,侧输入元件915是旋转开关、按钮或任何其他类型的手动输入元件。在替代示例中,移动计算设备900包括更多或更少的输入元件。例如,在一些示例中,显示器905可以不是触摸屏。在替代示例中,移动计算设备900是便携式电话系统,例如蜂窝电话。根据一方面,移动计算设备900包括可选的按键板935。根据一方面,可选按键板935是物理按键板。根据另一方面,可选按键板935是在触摸屏显示器上生成的“软”按键板。在各个方面,输出元件包括用于示出图形用户界面(GUI)、视觉指示器920(例如,发光二极管)和/或音频换能器925(例如,扬声器)的显示器905。在一些示例中,移动计算设备900包括用于向用户提供触觉反馈的振动换能器。在又一示例中,移动计算设备900包括用于向外部设备发送信号或从外部设备接收信号的输入和/或输出端口,例如音频输入(例如,麦克风插孔)、音频输出(例如,耳机插孔)和视频输出(例如,HDMI端口)。在又一示例中,移动计算设备900包括用于向外部设备发送信号或从外部设备接收信号的外围设备端口940,例如音频输入(例如,麦克风插孔)、音频输出(例如,耳机插孔)和视频输出(例如,HDMI端口)。
图9B是示出移动计算设备的一个示例的架构的框图。换言之,移动计算设备900包括系统(即,架构)902以实现一些示例。在一个示例中,系统902被实现为能够运行一个或多个应用(例如,浏览器、电子邮件、日历、联系人管理器、消息传送客户端、游戏和媒体客户端/播放器)的“智能电话”。在一些示例中,系统902被集成为计算设备,例如集成的个人数字助理(PDA)和无线电话。
根据一方面,一个或多个应用程序950被加载到存储器962中,并且在操作系统964上或者与操作系统964相关联地运行。应用程序的示例包括电话拨号程序、电子邮件程序、个人信息管理(PIM)程序、文字处理程序、电子表格程序、互联网浏览器程序、消息传送程序等。根据一方面,自动模板生成系统110被加载到存储器962中。系统902还包括存储器962内的非易失性存储区域968。非易失性存储区域968用于若存储系统902断电则不应当丢失的持久信息。应用程序950可以使用非易失性存储区域968中的信息以及将信息存储在非易失性存储区域968中,所述信息例如由电子邮件应用使用的电子邮件或其他消息等。同步应用(未示出)也驻留在系统902上,并且被编程为与驻留在主计算机上的相应的同步应用进行交互,以使存储在非易失性存储区域968中的信息与存储在主计算机处的相应信息保持同步。如应当领会的,其他应用可以被加载到存储器962中并且在移动计算设备900上运行。
根据一方面,系统902具有电源970,所述电源970被实现为一个或多个电池。根据一方面,电源970还包括外部电源,例如补充或再充电电池的AC适配器或电动对接支架(powered docking cradle)。
根据一方面,系统902包括执行发送和接收射频通信功能的无线单元972。无线单元972经由通信运营商或服务提供商促进系统902与“外部世界”之间的无线连接性。去往和来自无线单元972的传输是在操作系统964的控制下进行的。换言之,由无线单元972接收的通信可以经由操作系统964传播到应用程序950,反之亦然。
根据一方面,视觉指示符920用于提供视觉通知,并且/或者音频接口974用于经由音频换能器925产生可听见的通知。在示出的示例中,视觉指示器920是发光二极管(LED),并且音频换能器925是扬声器。这些设备可以直接耦合到电源970,使得当被激活时,即使处理器960和其他组件可能关闭以保存电池功率,他们仍然在由通知机制规定的持续时间内保持开启。LED可以被编程为无限期地保持开启,直到用户采取措施以指示设备的开机状态为止。音频接口974用于向用户提供可听见的信号并从用户接收可听见的信号。例如,除了耦合到音频换能器925之外,音频接口974还可以耦合到麦克风以接收可听见的输入,例如以促进电话交谈。根据一方面,系统902还包括视频接口976,其实现车载相机930的记录静止图像、视频流等的操作。
根据一方面,实现系统902的移动计算设备900具有另外的特征或功能。例如,移动计算设备900包括另外的数据存储设备(可移除和/或不可移除的),例如磁盘、光盘或磁带。这样的另外的存储装置在图9B中由非易失性存储区域968示出。
根据一方面,由移动计算设备900生成或捕获并经由系统902存储的数据/信息被本地地存储在移动计算设备900上,如以上描述的。根据另一方面,数据被存储在可由设备经由无线单元972或可经由移动计算设备900和与移动计算设备900相关联的单独计算设备(例如,分布式计算网络(例如,互联网)中的服务器计算机)之间的有线连接访问的任意数量的存储介质上。如应当领会的,这样的数据/信息可通过移动计算设备900经由无线单元972或经由分布式计算网络访问。类似地,根据一方面,根据众所周知的数据/信息传输和存储手段(包括电子邮件和协作式数据/信息共享系统),这样的数据/信息容易在计算设备之间传输以用于存储和使用。
图10示出了系统1000的架构的一个示例,所述系统1000用于提供如以上描述的基于与用户102相关联的文档108中的辨识的组成元素模式的、文档模板120的生成。被开发、与自动模板生成系统110交互或与自动模板生成系统110相关联地被编辑的内容能够被存储在不同的通信信道或其他存储类型中。例如,可以使用目录服务1022、网络门户1024、邮箱服务1026、即时消息传送存储装置1028或社交网站1030来存储各种文档。如本文描述的,自动模板生成系统110操作用于使用这些类型的系统或类似系统中的任一者来提供自动生成的用户相关文档模板120。根据一方面,服务器1020将自动模板生成系统110提供给客户端1005a、b、c。作为一个示例,服务器1020是在网络上提供自动模板生成系统110的网络服务器。服务器1020通过网络1040在网络上将自动模板生成系统110提供给客户端1005。例如,客户端计算设备被实现和体现在个人计算机1005a、平板计算设备1005b或移动计算设备1005c(例如,智能电话)或其他计算设备中。客户端计算设备的这些示例中的任一者操作用于从存储装置1016获得内容。
以上参考根据一些方面的方法、系统和计算机程序产品的框图和/或操作说明来描述实施方式。框中记录的功能/动作可以不按照如任何流程图中示出的顺序发生。例如,取决于所涉及的功能/动作,连续示出的两个框实际上可以基本上同时执行,或者这些框有时可以以相反的顺序执行。
本申请中提供的对一个或多个示例的描述和说明并非旨在以任何方式限制或约束如所要求保护的范围。本申请中提供的方面、示例和细节被认为足以传达所有物并使其他人能够实现和使用最佳模式。实施方式不应当被解释为限于本申请中提供的任何方面、示例或细节。无论是以组合形式还是单独地示出和描述,各种特征(结构的和方法的二者)旨在被选择性地包括或省略以产生具有特定特征集的示例。已被提供本申请的描述和说明,本领域技术人员可以设想不偏离更宽的范围的落入本申请中体现的总体发明构思的更宽的方面的精神内的变型、修改和替代实例。

Claims (15)

1.一种用于改善提供与用户相关的文档模板的计算机设备中的效率的计算机实现的方法,其包括:
检索被存储在数据库中的多个文档以对组成元素进行索引;
对所述多个文档的组成元素进行索引;
分析所述索引以识别与所述用户相关联的文档中的组成元素的趋势;
当与用户相关联的多个文档中的组成元素的子集的趋势被识别时,创建包括所述组成元素的子集的文档模板;以及
提供所述文档模板以便在用户界面中显示。
2.如权利要求1所述的计算机实现的方法,还包括:
接收对所述文档模板的选择的指示;以及
基于所选择的文档模板创建新文档,其中,所述新文档继承所述组成元素的子集。
3.如权利要求2所述的计算机实现的方法,还包括:
将所述新文档存储在数据库中以对组成元素进行索引;
对所述新文档的组成元素进行索引;
分析所述索引以识别从给定的文档模板创建的文档中的组成元素的变化趋势;
当从所述给定的文档模板创建的多个文档中的组成元素的子集的变化趋势被识别时,根据所识别的所述组成元素的子集的变化趋势来修改所述给定的文档模板;以及
提供经修改的文档模板以便在所述用户界面中显示。
4.如权利要求1所述的计算机实现的方法,其中,对所述多个文档的组成元素进行索引包括对内容和格式元素进行索引。
5.如权利要求1所述的计算机实现的方法,其中,分析所述索引以识别与所述用户相关联的文档中的组成元素的趋势包括:分析所述索引以识别具有变化的内容的相配格式元素的子集。
6.如权利要求5所述的计算机实现的方法,其中,创建包括所述组成元素的子集的文档模板包括创建包括占位符的文档模板,其中,所述占位符包括所识别的相配内容或文档级格式元素以及所述用户能够输入内容到其中的输入区域。
7.如权利要求1所述的计算机实现的方法,其中,分析所述索引以识别与所述用户相关联的文档中的组成元素的趋势包括:分析所述索引以识别由所述用户或所述用户的同事创作的文档中的组成元素的趋势。
8.如权利要求6所述的计算机实现的方法,其中,检索被存储在数据库中的多个文档包括:
发现所述用户和所述用户的同事之间的联系;
定位所述用户的同事的文件、文件夹和驱动器以检索所述多个文档;以及
检索所述多个文档。
9.一种用于改善提供与用户相关的文档模板的计算机设备中的效率的系统,其包括:
处理器;以及
存储器,其包括指令,所述指令在由所述处理器执行时可操作为提供自动模板生成系统,所述自动模板生成系统包括:
文档检索器,其操作用于检索被存储在数据库中的多个文档;
索引器,其操作用于对所检索的多个文档的组成元素进行索引,其中,所述组成元素包括内容和格式元素;
趋势分析器,其操作用于分析所述索引以识别与所述用户相关联的文档中的组成元素的趋势;以及
模板创建器,其操作用于在与用户相关联的多个文档中的组成元素的子集的趋势被识别时创建与所述用户相关的文档模板,其中,所述文档模板包括所述组成元素的子集。
10.如权利要求9所述的系统,其中,所述自动模板生成系统还操作用于:
接收对所述文档模板的选择的指示;以及
基于所选择的文档模板创建新文档,其中,所述新文档继承所述组成元素的子集。
11.如权利要求9所述的系统,其中,在分析所述索引以识别与所述用户相关联的文档中的组成元素的趋势时,所述趋势分析器还操作用于分析所述索引以识别以下各项中的至少一项:
内容的相配子集;
内容格式元素的相配子集;以及
文档级格式元素的相配子集。
12.如权利要求9所述的系统,其中,在分析所述索引以识别与所述用户相关联的文档中的组成元素的趋势时,所述趋势分析器操作用于分析所述索引以识别具有变化的内容的相配内容或文档级格式元素的子集。
13.如权利要求10所述的系统,其中,在创建包括所述组成元素的子集的文档模板时,所述模板创建器操作用于创建包括占位符的文档模板,其中,所述占位符包括所识别的相配格式元素和所述用户能够输入内容到其中的输入区域。
14.如权利要求9所述的系统,其中,在检索被存储在数据库中的多个文档时,所述文档检索器操作用于:
识别所述用户和所述用户的同事之间的联系;
定位所述用户的同事的文件、文件夹和驱动器以检索所述多个文档;以及
检索所述多个文档。
15.一种包括指令的计算机可读存储设备,所述指令当由处理器执行时可操作为执行包括以下步骤的步骤:
检索被存储在数据库中的多个文档以对组成元素进行索引;
对所述多个文档的组成元素进行索引,其中,所述组成元素包括内容和格式元素;
分析所述索引以识别与所述用户相关联的文档中的组成元素的趋势;
当与用户相关联的多个文档中的组成元素的子集的趋势被识别时,创建包括所述组成元素的子集的文档模板;以及
提供所述文档模板以便在用户界面中显示。
CN201780004207.8A 2016-02-01 2017-01-30 基于先前文档的自动模板生成方法、系统及计算机可读存储设备 Active CN108369578B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662289509P 2016-02-01 2016-02-01
US62/289,509 2016-02-01
US15/191,456 2016-06-23
US15/191,456 US9922022B2 (en) 2016-02-01 2016-06-23 Automatic template generation based on previous documents
PCT/US2017/015536 WO2017136249A1 (en) 2016-02-01 2017-01-30 Automatic template generation based on previous documents

Publications (2)

Publication Number Publication Date
CN108369578A true CN108369578A (zh) 2018-08-03
CN108369578B CN108369578B (zh) 2022-05-10

Family

ID=59385622

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780004207.8A Active CN108369578B (zh) 2016-02-01 2017-01-30 基于先前文档的自动模板生成方法、系统及计算机可读存储设备

Country Status (4)

Country Link
US (1) US9922022B2 (zh)
EP (1) EP3411804B1 (zh)
CN (1) CN108369578B (zh)
WO (1) WO2017136249A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273117A (zh) * 2017-05-25 2017-10-20 深圳市彬讯科技有限公司 一种编程友好型的敏捷代码自动生成系统
CN107291450A (zh) * 2017-05-25 2017-10-24 深圳市彬讯科技有限公司 一种编程友好型的敏捷代码自动生成方法
CN109783782A (zh) * 2018-12-14 2019-05-21 平安科技(深圳)有限公司 电子合同模板的生成方法、设备、存储介质及装置
CN112084753A (zh) * 2020-09-14 2020-12-15 苏州七星天专利运营管理有限责任公司 一种文档辅助编辑的方法和系统
CN112784563A (zh) * 2020-01-16 2021-05-11 珠海金山办公软件有限公司 一种文档样式的设置方法、装置及电子设备
CN112784539A (zh) * 2019-11-11 2021-05-11 珠海金山办公软件有限公司 一种自动生成文档样式集的方法及装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10839149B2 (en) 2016-02-01 2020-11-17 Microsoft Technology Licensing, Llc. Generating templates from user's past documents
US10417341B2 (en) 2017-02-15 2019-09-17 Specifio, Inc. Systems and methods for using machine learning and rules-based algorithms to create a patent specification based on human-provided patent claims such that the patent specification is created without human intervention
US11593564B2 (en) * 2017-02-15 2023-02-28 Specifio, Inc. Systems and methods for extracting patent document templates from a patent corpus
US10296307B2 (en) * 2017-05-16 2019-05-21 International Business Machines Corporation Method and system for template extraction based on source code similarity
US20190057074A1 (en) * 2017-08-16 2019-02-21 Michael Carey Patent automation system
US10846526B2 (en) 2017-12-08 2020-11-24 Microsoft Technology Licensing, Llc Content based transformation for digital documents
US11263396B2 (en) * 2019-01-09 2022-03-01 Woodpecker Technologies, LLC System and method for document conversion to a template
US11269835B2 (en) * 2019-07-11 2022-03-08 International Business Machines Corporation Customization and recommendation of tree-structured templates
US10956659B1 (en) * 2019-12-09 2021-03-23 Amazon Technologies, Inc. System for generating templates from webpages
JP7409104B2 (ja) * 2020-01-20 2024-01-09 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
US11468228B2 (en) * 2021-01-28 2022-10-11 Microsoft Technology Licensing, Llc Content frames for productivity applications

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101158938A (zh) * 2007-11-23 2008-04-09 北京大学 一种基于模板节的表格快速生成系统及方法
US20100313119A1 (en) * 2009-06-05 2010-12-09 Microsoft Corporation In-line dynamic text with variable formatting
CN102722519A (zh) * 2011-03-28 2012-10-10 微软公司 使用增强的内容控件来创建结构化文档模板的技术
US20130097168A1 (en) * 2009-12-09 2013-04-18 International Business Machines Corporation Method to identify common structures in formatted text documents
CN104933020A (zh) * 2015-07-17 2015-09-23 北京奇虎科技有限公司 基于模板生成目标文档的方法及装置

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4139901A (en) * 1977-05-04 1979-02-13 Teknekron, Inc. Document storage and retrieval system
US6353840B2 (en) * 1997-08-15 2002-03-05 Ricoh Company, Ltd. User-defined search template for extracting information from documents
US6189002B1 (en) * 1998-12-14 2001-02-13 Dolphin Search Process and system for retrieval of documents using context-relevant semantic profiles
US20020002563A1 (en) * 1999-08-23 2002-01-03 Mary M. Bendik Document management systems and methods
CA2285877A1 (en) * 1999-10-15 2001-04-15 Ibm Canada Limited-Ibm Canada Limitee System and method for capturing document style by example
US6351755B1 (en) * 1999-11-02 2002-02-26 Alta Vista Company System and method for associating an extensible set of data with documents downloaded by a web crawler
US7149347B1 (en) * 2000-03-02 2006-12-12 Science Applications International Corporation Machine learning of document templates for data extraction
US20070028166A1 (en) * 2002-04-10 2007-02-01 Allen Hundhausen System and processes for dynamic document construction
US7337126B2 (en) * 2001-08-23 2008-02-26 International Business Machines Corporation Method, apparatus and computer program product for technology comparisons
DK1288792T3 (da) * 2001-08-27 2012-04-02 Bdgb Entpr Software Sarl Fremgangsmåde til automatisk indeksering af dokumenter
US6832219B2 (en) * 2002-03-18 2004-12-14 International Business Machines Corporation Method and system for storing and querying of markup based documents in a relational database
US6946715B2 (en) * 2003-02-19 2005-09-20 Micron Technology, Inc. CMOS image sensor and method of fabrication
US7225401B2 (en) * 2002-07-23 2007-05-29 Xerox Corporation Case-based system and method for generating a custom document
US7519607B2 (en) * 2002-08-14 2009-04-14 Anderson Iv Robert Computer-based system and method for generating, classifying, searching, and analyzing standardized text templates and deviations from standardized text templates
US7505984B1 (en) * 2002-12-09 2009-03-17 Google Inc. Systems and methods for information extraction
US7739133B1 (en) * 2003-03-03 2010-06-15 Trover Solutions, Inc. System and method for processing insurance claims
US7246311B2 (en) * 2003-07-17 2007-07-17 Microsoft Corporation System and methods for facilitating adaptive grid-based document layout
US20050154701A1 (en) * 2003-12-01 2005-07-14 Parunak H. Van D. Dynamic information extraction with self-organizing evidence construction
WO2005062807A2 (en) * 2003-12-19 2005-07-14 Business Objects, S.A. Using data filter to deliver personalized data from a shared document
DE602005019931D1 (de) * 2004-01-23 2010-04-29 Oce Tech Bv Druckertreiber mit automatischer Generation von Musterkonfigurationen
JP2005209071A (ja) 2004-01-26 2005-08-04 Seiko Epson Corp テンプレート生成装置
JP4572669B2 (ja) * 2004-03-31 2010-11-04 セイコーエプソン株式会社 レイアウトルール生成システム、レイアウトシステム及びレイアウトルール生成方法並びにレイアウトルール生成プログラム
US8719699B2 (en) * 2004-05-26 2014-05-06 Typefi Systems Pty. Ltd. Dynamic positioning of components using document templates
JP2006091994A (ja) * 2004-09-21 2006-04-06 Toshiba Corp 文書情報処理装置および方法、文書情報処理プログラム
US7631004B2 (en) * 2004-10-08 2009-12-08 Microsoft Corporation Systems and methods for creating a template from an existing file
US20060224952A1 (en) * 2005-03-30 2006-10-05 Xiaofan Lin Adaptive layout templates for generating electronic documents with variable content
US7433869B2 (en) * 2005-07-01 2008-10-07 Ebrary, Inc. Method and apparatus for document clustering and document sketching
EP1748365A1 (en) 2005-07-27 2007-01-31 Hewlett-Packard Development Company, L.P. Document Template Generation
US20070079236A1 (en) * 2005-10-04 2007-04-05 Microsoft Corporation Multi-form design with harmonic composition for dynamically aggregated documents
WO2007090873A2 (en) * 2006-02-09 2007-08-16 Leiden University Oxidoreductases and processes utilising such enzymes
US7676465B2 (en) * 2006-07-05 2010-03-09 Yahoo! Inc. Techniques for clustering structurally similar web pages based on page features
GB2443445A (en) * 2006-10-30 2008-05-07 Hewlett Packard Development Co Remote document construction using templates and variable data
US9514117B2 (en) * 2007-02-28 2016-12-06 Docusign, Inc. System and method for document tagging templates
US7720885B2 (en) * 2007-04-04 2010-05-18 Microsoft Corporation Generating a word-processing document from database content
JP5069552B2 (ja) * 2007-12-25 2012-11-07 株式会社リコー 光学ユニットおよび画像読取装置ならびに画像形成装置
JP4536127B2 (ja) 2008-05-09 2010-09-01 有限会社アイ・アール・ディー 情報処理装置、情報処理方法、およびプログラム
US8606796B2 (en) * 2008-09-15 2013-12-10 Kilac, LLC Method and system for creating a data profile engine, tool creation engines and product interfaces for identifying and analyzing files and sections of files
US8311330B2 (en) * 2009-04-06 2012-11-13 Accenture Global Services Limited Method for the logical segmentation of contents
US8176412B2 (en) * 2009-08-25 2012-05-08 International Business Machines Corporation Generating formatted documents
CN102597991A (zh) * 2009-09-26 2012-07-18 哈米什·奥格尔维 文档分析与关联系统及方法
US8739030B2 (en) * 2010-03-10 2014-05-27 Salesforce.Com, Inc. Providing a quote template in a multi-tenant database system environment
US8650195B2 (en) * 2010-03-26 2014-02-11 Palle M Pedersen Region based information retrieval system
US20110258535A1 (en) * 2010-04-20 2011-10-20 Scribd, Inc. Integrated document viewer with automatic sharing of reading-related activities across external social networks
US8612440B2 (en) * 2010-04-21 2013-12-17 Xerox Corporation Computer based method and system for generating custom dynamic templates
US10311114B2 (en) * 2010-06-17 2019-06-04 Google Llc Displaying stylized text snippets with search engine results
WO2012039723A1 (en) * 2010-09-26 2012-03-29 Hewlett-Packard Development Company Generating variable document templates
WO2012158649A2 (en) * 2011-05-14 2012-11-22 Luca Anastasia Maria System and method for objective assessment of learning outcomes
WO2012160499A1 (en) * 2011-05-23 2012-11-29 Strangeloop Networks, Inc. Optimized rendering of dynamic content
US20130246231A1 (en) * 2012-03-19 2013-09-19 Microsoft Corporation Financial dimension default templates
US9582483B2 (en) * 2012-07-13 2017-02-28 Xerox Corporation Automatically tagging variable data documents
US20140281930A1 (en) * 2013-03-15 2014-09-18 Fuji Xerox Co., Ltd. System and methods for creating printouts that may be manipulated by mfd
US20140344952A1 (en) * 2013-05-14 2014-11-20 Google Inc. Indexing and searching documents with restricted portions
US9785671B2 (en) * 2013-07-15 2017-10-10 Capricorn Holdings Pte. Ltd. Template-driven structured query generation
US9235758B1 (en) * 2014-06-30 2016-01-12 Adobe Systems Incorporated Robust method to find layout similarity between two documents
WO2016054196A1 (en) * 2014-10-01 2016-04-07 Docurated, Inc. Document curation system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101158938A (zh) * 2007-11-23 2008-04-09 北京大学 一种基于模板节的表格快速生成系统及方法
US20100313119A1 (en) * 2009-06-05 2010-12-09 Microsoft Corporation In-line dynamic text with variable formatting
US20130097168A1 (en) * 2009-12-09 2013-04-18 International Business Machines Corporation Method to identify common structures in formatted text documents
CN102722519A (zh) * 2011-03-28 2012-10-10 微软公司 使用增强的内容控件来创建结构化文档模板的技术
CN104933020A (zh) * 2015-07-17 2015-09-23 北京奇虎科技有限公司 基于模板生成目标文档的方法及装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291450A (zh) * 2017-05-25 2017-10-24 深圳市彬讯科技有限公司 一种编程友好型的敏捷代码自动生成方法
CN107273117A (zh) * 2017-05-25 2017-10-20 深圳市彬讯科技有限公司 一种编程友好型的敏捷代码自动生成系统
CN107273117B (zh) * 2017-05-25 2021-04-09 土巴兔集团股份有限公司 一种编程友好型的敏捷代码自动生成系统
CN107291450B (zh) * 2017-05-25 2021-04-09 土巴兔集团股份有限公司 一种编程友好型的敏捷代码自动生成方法
CN109783782A (zh) * 2018-12-14 2019-05-21 平安科技(深圳)有限公司 电子合同模板的生成方法、设备、存储介质及装置
CN109783782B (zh) * 2018-12-14 2024-05-07 平安科技(深圳)有限公司 电子合同模板的生成方法、设备、存储介质及装置
CN112784539A (zh) * 2019-11-11 2021-05-11 珠海金山办公软件有限公司 一种自动生成文档样式集的方法及装置
CN112784563B (zh) * 2020-01-16 2023-11-28 珠海金山办公软件有限公司 一种文档样式的设置方法、装置及电子设备
CN112784563A (zh) * 2020-01-16 2021-05-11 珠海金山办公软件有限公司 一种文档样式的设置方法、装置及电子设备
CN112084753A (zh) * 2020-09-14 2020-12-15 苏州七星天专利运营管理有限责任公司 一种文档辅助编辑的方法和系统
CN113312884A (zh) * 2020-09-14 2021-08-27 苏州七星天专利运营管理有限责任公司 一种文档辅助编辑的方法和系统
CN113221516B (zh) * 2020-09-14 2021-11-30 苏州七星天专利运营管理有限责任公司 一种文档辅助编辑的方法和系统
CN113312884B (zh) * 2020-09-14 2022-02-08 苏州七星天专利运营管理有限责任公司 一种文档辅助编辑的方法和系统
CN113221516A (zh) * 2020-09-14 2021-08-06 苏州七星天专利运营管理有限责任公司 一种文档辅助编辑的方法和系统
CN112084753B (zh) * 2020-09-14 2021-06-29 苏州七星天专利运营管理有限责任公司 一种文档辅助编辑的方法和系统

Also Published As

Publication number Publication date
WO2017136249A1 (en) 2017-08-10
US20170220544A1 (en) 2017-08-03
EP3411804B1 (en) 2022-09-28
EP3411804A1 (en) 2018-12-12
CN108369578B (zh) 2022-05-10
US9922022B2 (en) 2018-03-20

Similar Documents

Publication Publication Date Title
CN108369578A (zh) 基于先前文档的自动模板生成
US10839149B2 (en) Generating templates from user&#39;s past documents
CN109219824B (zh) 利用用户访问权限来自动共享文档
US10515145B2 (en) Parameterizing and working with math equations in a spreadsheet application
US10635746B2 (en) Web-based embeddable collaborative workspace
US10997364B2 (en) Operations on sound files associated with cells in spreadsheets
US10108615B2 (en) Comparing entered content or text to triggers, triggers linked to repeated content blocks found in a minimum number of historic documents, content blocks having a minimum size defined by a user
US10984186B2 (en) Smart electronic mail and messaging templates
US20200257852A1 (en) Parameterizing and working with math equations in a spreadsheet application
US10025979B2 (en) Paragraph property detection and style reconstruction engine
US10409779B2 (en) Document sharing via logical tagging
US11354489B2 (en) Intelligent inferences of authoring from document layout and formatting
WO2018017378A1 (en) Extracting actionable information from emails
CN110199274A (zh) 用于自动化查询回答生成的系统和方法
US11036356B2 (en) Service backed digital ruled paper templates
US10540432B2 (en) Estimated reading times
WO2023129348A1 (en) Multidirectional generative editing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant