CN1624686B - 用于语义速记的系统和方法 - Google Patents

用于语义速记的系统和方法 Download PDF

Info

Publication number
CN1624686B
CN1624686B CN2004100980294A CN200410098029A CN1624686B CN 1624686 B CN1624686 B CN 1624686B CN 2004100980294 A CN2004100980294 A CN 2004100980294A CN 200410098029 A CN200410098029 A CN 200410098029A CN 1624686 B CN1624686 B CN 1624686B
Authority
CN
China
Prior art keywords
text
semantic
local
notes
short notes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2004100980294A
Other languages
English (en)
Other versions
CN1624686A (zh
Inventor
M·戴梅特曼
C·布伦
A·马克斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of CN1624686A publication Critical patent/CN1624686A/zh
Application granted granted Critical
Publication of CN1624686B publication Critical patent/CN1624686B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

一种方法和设备将诸如短笔记的输入数据转换为全局文本实现以便提供语义一致且符合语法的文本。在各个示例性实施例中,用户将短笔记输入到计算机系统中,所述计算机系统将局部文本实现与所述短笔记相关联。随后,所述用户可以选择适当的局部文本实现,所述适当的局部文本实现可以被转换为语义一致且符合语法的文本或全局文本实现。

Description

用于语义速记的系统和方法
技术领域
本发明涉及包括将短笔记(note)自动转换为语义一致的文本。
背景技术
学生、专业人士、民意调查者和呼叫中心或用户服务中心的雇员常常没有足够的时间记下完整的、形式合格(well-formed)的句子来描述口头传到他们的信息。作为替代,在会话、演讲或其它口头交互进行过程中,这些人通常草草记下几个能够表达基本事实的关键字或短笔记。速记法是在口头交流期间采用速记并且随后将速记笔记转换为完整的书面文本或口头交流的转录的技术或方法。
常常希望加快将速记转换为完整的书面文本的过程,以致可以迅速地记录或发表口头讯息。例如,美国专利申请公布No.2002/0089470A1公开了一种实时互联网转录陈述系统,所述陈述系统生成实况陈述的实时转录。然而,将口头讯息转换为转录常常不能形成形式合格的句子。另外,这些实时转录系统只提供原始信息。这些实时转录系统没有以压缩的、语义一致且符合语法的文本或形式合格的句子来概括信息以便迅速并有效地把信息传达给听众或公众。
另外,能够产生所述笔记首先取决于将复杂的概念结构同可被称为“语义缩写”相关联的惯例。这些惯例常常由公众共享。传递重现类型信息的公众越紧并且需要越频繁,这种编码就越高效。
常规的实时转录系统不能高效地传递重现类型的信息,这是因为这些系统接收原始信息并直接将所接收的原始信息转换为文本。常规的实时转录系统不能认出重现信息和所有的这些惯例。因此,希望能够将短笔记转换为完整的语法文本,以致个人能够接收口头所传递的信息的简明、形式完好的句子形式的完整的文本概要。
另一技术是在受控文档编辑(Controlled Document Authoring)领域。典型地,这些系统的用户在存在于使用用户语言的文档的展开文本中的活动字段中选择可能的语义选项。这些选择反复地细化所述文档内容直到其是完整的。然后,所述系统可以将所述文档翻译为多种语言。这样一种受控文档的编辑系统是多语言文档编辑(MDA)系统,如在关于自然语言生成的第一国际会议(INLG’2000)-MitzpeRamon,Israel,2000的会议记录上由Caroline Brun、Marc Dymetman和Veronika Lux所发表的“Document Structure and MultilingualText Authoring”;Aurélien Max(Max)在EACL′03学生调查研讨会-Budapest,Hungary,2003的会议记录中所发表的“ReversingControlled Document Authoring to Normalize Documents”;和Aurélien Max和Marc Dymetman(Max和Dymetman)在用于信息访问的使用(和获得)语言学(和世界)知识AAAI 2002春季研究会-Stanford大学,美国,2002上发表的“Document Content Analysis throughInverted Generation”,这里将其每一个全部引入以供参考。
上述的这些MDA系统依靠形式机制(一种统一语法)以几种语言或书写风格来描述形式合格的语义表示和它们的文本的实现。这些规范被限制在所公开的具体领域,对于这些领域,文档内容的相对完整的建模是可能的,诸如药物活页、实验报告、分类添加等等。这种规范还可被用作枚举机制,其确定性地产生形式合格的语义表示及其全局文本的实现。然而,在这些MDA系统中,在枚举过程中,采用通过与不同可能的路径相关联的菜单选择来请用户回答问题,来产生全局文本实现(global text realization)。这在所引入的出版物中已有所讨论。
然而,这种MDA系统要求用户在显示屏上选择活动的字段以便完成合乎语法的句子。包含活动字段的句子或短语以特定次序出现。这些活动字段具有固定数目的选项,其取决于先前的选择。在会话、演讲或其它口头交互期间,说话人-例如同客户服务代表讲话的用户做出陈述,但是其陈述的次序不一定与他所做的陈述在所述多语言文档编辑系统的图形用户界面上出现的次序相同。所述用户也许不会选择适当的活动字段和/或在活动字段中的参数可能受到了太大的限制。
发明内容
提供了系统和方法,用于将输入数据转换为语义一致且符合语法的文本。
分别提供了系统和方法,用于分析输入数据并且将输入数据同其它数据相关联。
分别提供了系统和方法,用于将输入数据同所存储数据相关联。
分别提供了系统和方法,用于根据输入数据和其它数据-诸如所存储数据的关联来产生全局文本实现分别提供了系统和方法。其它数据可以包括局部文本实现。
还提供了具有计算机可用介质的计算机程序产品,其具有用于将短笔记转换为全局文本实现的计算机可读程序代码。
可以将短笔记或关键字转换为语义一致且符合语法的文本。所述短笔记或关键字对听众或公众来说可以是有意义的,并且可以包括语义缩写,所述语义缩写可用于形成语义一致且符合语法的文本。可以将所述短笔记和/或符合语义的文本输出到输出设备,诸如显示设备,打印设备,音响设备等等。
可以通过在多个局部文本实现和短笔记之间执行模糊匹配来产生全局文本实现,以便提供与每个短笔记相关联的至少一个局部文本实现。
可以用与其相关联的至少一个局部文本实现输出短笔记。
可以选择与每个短笔记相关联的一个局部文本实现,并且产生基于所选择的短笔记的全局文本实现。
可以根据所述语义表示为每个所选择的相关联的文本实现产生全局文本实现。
通过确认每个局部文本实现,检索相关联的语义表示并且根据所述语义表示产生全局文本实现,来为每个所选择的相关联的文本实现确定语义表示。
可以在多个局部文本实现和短笔记之间执行模糊匹配,以便提供与每个短笔记相关联的至少一个局部文本实现,其中向与每个短笔记相关联的每个局部文本实现赋予一个等级。可以依照给每个局部文本实现所赋予的等级,来输出所述局部文本实现。
可以在多个局部文本实现和短笔记之间执行模糊匹配,以便提供与每个短笔记相关联的至少一个局部文本实现,包括为每个短笔记确定一个描述符,为每个局部文本实现提供描述符,确定在短笔记的描述符和局部文本实现的描述符之间的模糊相似性度量,并且根据模糊相关性度量把描述符分成等级,以便输出与描述符相关联的局部文本实现。
提供了系统和方法,用于处理输入数据以便提供全局文本实现。
分别提供了系统和方法,用于使用语义语法来产生语义结构。
分别提供了系统和方法,用于根据所述语义结构用第一实现语法生成多个局部文本实现。
分别提供了系统和方法,用于把所接收的短笔记输入数据与多个局部文本实现的实例相匹配,以便定义一个最终的语义结构。
分别提供了系统和方法,用于根据所述最终的语义结构用第二实现语法生成全局文本实现。
在下列详细说明中将描述或表现这些及其他特征和优点。
附图说明
参考下列图详细描述各个示例性实施例,其中:
图1是用于执行语义速记(semantic stenography)的语义速记系统的一个示例性实施例;
图2是一个功能性的框图,其举例说明了从短笔记到全局文本实现的数据流的总体次序;
图3是概括地描述了用于将笔记转换为语义一致且符合语法的文本的方法的一个示例性实施例的流程图;
图4是以更多细节概括地描述了将局部文本实现与短笔记相关联的步骤的一个示例性实施例的流程图;
图5是以更多细节概括地描述了使用局部文本实现的语义表示来产生全局文本实现的步骤的一个示例性实施例的流程图;
图6是一个展示由用户输入的短笔记的图形用户界面的示例性实施例;
图7是一个展示与每个短笔记相关联的一个或多个局部文本实现的图形用户界面的示例性实施例;
图8是一个展示与每个短笔记相关联的、所选择的局部文本实现的图形用户界面的示例性实施例;
图9是一个展示从所述短笔记和局部文本实现产生的一个示例性全局文本实现或语义一致且符合语法的文本的图形用户界面的示例性实施例;和
图10是一个举例说明了笔记转换系统的示例性的实施例的功能性的框图。
具体实施方式
图1举例说明了用于执行语义速记的示例性的语义速记系统10。所述语义速记系统在适于执行指令的任何计算设备上操作,所述指令依照用于执行本系统的各个方法来进行操作。用于操作图1中的实施例的方法并非是确定性的。做为选择,可以使用可采纳的搜索技术来执行最优化,所述搜索技术在上述引入的出版物中已经公开。更具体地说,图1举例说明了语义速记系统10的概念视图,在语义速记系统10中,用户提供短笔记12,以及可选地提供用户输入14。每个短笔记包括一个或多个关键字,其中每个关键字可以是两个或更多关键字的一个分组。作为输出,所述语义速记系统10提供全局文本实现16,所述全局文本实现16代表与所述短笔记12相关的形式合格的段落,所述短笔记12在语言上不是合于语法的。例如,表1下面最左边的栏阐述了短笔记12的例子,并且表2最右边的栏阐述了全局文本实现16的例子。
表1
短笔记    局部文本实现           语义表示
管理助手  工作提供是管理助手     <job_offer>
                                   <job_description>administrative_assistant
                                   </job_description>
Global-   雇佣公司的名字是       <company>GlobalModest</company>
Modest    GlobalModest
Laval     工作地点在法国的Laval  <job_location>laval_france<job_location>
CDD       合同类型是CDD          <contract_type>cdd</contract_type>
1年       合同持续期1年          <contract_duration>one_year</contract_duration>
立即      职位要立即上任         <starting_date>immediate<starting_date>
                                 <tasks>
约定      工作包括处理约定          <task>appointments</task>
电话      工作包括应答电话          <task>telephone</task>
日常信函  工作包括准备日常信函       <task>write_routine_letters</task>
文件系统  工作包括处理文件系统       <task>filing_system_handle</task>
其它      工作包括其它杂项任务       <task>misc_duties</task>
                                  </tasks>
学士+2     要求至少bac+2          <study_level/>bac_plus2<study_level>
2年经验    要求至少已有2年经验    <experience_length>2_years</experience_length>
Word       要求Word特别擅长       <computer_skills>
                                    <computer_skills>
                                      <cs_program>Word</cs_program>
                                      <cs_level>excellent</cs_level>
                                      <cs_requirement>required</cs_requirement>
                                  <computer_skills>
Outlook    要求Outlook特别擅长    <computer_skills>
                                  <cs_program>Outlook</cs_program>
                                    <cs_level>excellent</cs_level>
                                    <cs_requirement>required</cs_requirement>
                                  <computer_skills>
法语      要求流利的法语          <language_skills>
                                     <language_skills>
                                     <ls_idiom>French</ls_idiom>
                                       <ls_level>fluent</ls_level>
                                       <ls_requirement>required</ls_requirement>
                                  <language_skills>
英语      要求流利的英语          <language_skills>
                                     <language_skills>
                                     <ls_idiom>English</ls_idiom>
                                       <ls_level>fluent</ls_level>
                                       <ls_requirement>required</ls_requirement>
                                  <language_skills>
加上意大  最好掌握意大利语        <language_skills>
                                     <language_skills>
                                     <ls_idiom>Italian</ls_idiom>
利语                                   <ls_level>good</ls_level>
                                       <ls_requirement>desirable</ls_requirement>
                                     <language_skills>
                                  <language_skills>
                                  </job_offer>
表2
语义表示                                                       全局文本实现
<job_offer>
   <job_description>administrative_assistant<job_description>  GlobalModest正在为其在
   <company>GlobalModest</company>
   <job_location>laval_france</job_location>                   法国Laval办公室寻找一位
   <contract_type>cdd</contract_type>
   <contract_duraction>one_year</contract_duration>            管理助手。该职位是CDD,要
   <starting_date>immediate</starting_date>                   
                                                               立即上任并为期1年。
<tasks>
   <task>appointments</task>                                   主要工作是安排约定的时
   <task>telephone</task>
   <task>write routine letters</task>                          间,应答电话,准备日常信
   <task>filing_system_handle</task>
   <task>misc_duties</task>                                    函,管理并维护文件系统并
<tasks>                                                        且执行各种其它杂项事务。
<experience_length>2_years</experience_length>
   <computer_skills>                                 候选者需至少Bac+2,至少
     <computer_skili>
      <cs_program>Word</cs_program>                  有两年在类似职位的工作经
      <cs_level>excellent</cs_level>
       <cs_requirement>required</cs_requirement>     验,并且在Word和Outlook
   <computer_skills>
   <computer_skill>                                  方面特别擅长。
      <cs_program>Outlook</cs_program>
      <cs_level>required</cs_level>
       <cs_requirement>required</cs_requirement>
   </computer_skills>
</computer_skills>
<language_skills>
   <language_skill>                                  需要流利的法语和英语,最
   <ls_idiom>French</ls_idiom>
    <ls_level>fluent</ls_level>                      好掌握意大利语
    <ls_requirement>required</ls_requirement>
<language_skill>
<language_skill>
   <ls_idiom>English</ls_idiom>
    <ls_level>fluent</ls_level>
    <ls_requirement>required</ls_requirement>
<language_skill>
<language_skill>
   <ls_idiom>Italian</ls_idiom>
     <ls_level>good</ls_level>
     <ls_requirement>desirable</ls_requirement>
<language_skill>
<language_skilsl>
</job_offer>
为了根据短笔记12产生全局文本实现16,所述系统10利用语义语法18,所述语义语法18可以用来产生许多合于语法的语义结构20的集合,所述语义结构例如可以以树的形式来表示。表1最右边的栏示出了语义结构20的许多可能表示之一的例子。局部实现语法22可以用来根据语义结构20生成局部文本实现24,并且全局实现语法26可以用来生成全局文本实现16。在表1的中间栏示出了局部文本实现的例子。一般地说,所述语义语法18由用于枚举语义结构的语义语法对象组成,并且局部和全局实现语法22和26分别由用于将语义输入转换为或者是局部(例如,句子片段)或者是全局(例如,段落)的文本的实现语法对象组成。
图2举例说明了总体次序,由所述系统10按照这个次序来使用表1和2中的数据。最初在A,使用(来自图1中的语义结构20的)语义表示来生成局部文本实现(图1中在24示出)。在B,所述文本实现与短笔记(图1中在12处示出)相匹配。在C,所匹配的局部文本实现向回引用语义表示,在D使用所述语义表示来生成全局文本实现。
操作中,当接收采用短笔记12形式的输入时,最初在28,所述系统10在30指示所述语义语法18来产生下一(当前)语义结构20。一旦产生当前语义结构20,就指示所述局部实现语法22使用当前语义结构20来产生局部文本实现24。随后在32,在32最大化局部文本实现24和短笔记12之间的接近度。在一个实施例中,通过在30产生不同的语义结构20(具有相应的局部文本实现24)来识别并记录最佳匹配34,从而实现接近度最大化,所述最佳匹配34是局部文本实现24和它们相应的语义结构20的集合,所述语义结构20与所述短笔记12最接近地匹配。也就是说,当在32识别出局部文本实现24与短笔记12具有预先确定级别的相似性时,将局部文本实现24与对它们的语义结构20的引用一起记录为最佳匹配34。
在32一旦在局部文本实现24和所述短笔记12之间发生足够级别的匹配,在36可以请求来自用户的输入,以便在不同的局部文本实现之间作出选择,所述不同的局部文本实现相似地接近于一个或多个短笔记(即,与所述一个或多个短笔记具有相似的匹配度)。如果提供多个未定的匹配以供用户在14选择,所述匹配取决于不相关的语义结构,那么当在36选择冲突的局部文本实现时,在一个实施例中的所述系统10从那些用户可用的语义结构中删除不相关的语义结构。一旦定义了最终的语义结构(该最终语义结构在用户在14深信不疑地选择了全部的最佳匹配时加以定义),那么通过将全局实现语法26应用到所述最终语义结构来在38产生全局文本实现16。
图3是概要地描述一个用于将笔记转换为语义一致且符合语法的文本或全局文本实现的示例性方法的流程图,所述笔记在公众(即,具体领域)内是有意义的,当同广大听众交流时,所述语义一致且符合语法的文本或所述全局文本实现是可用的,所述语义一致且符合语法的文本或所述全局文本实现不参与用于所述公众的缩写惯例。用于将短笔记转换为全局文本实现的方法在步骤S110开始,在那里用户或操作者将诸如短笔记的输入数据输入到计算设备中,所述计算设备可以在显示屏上的图形用户界面中显示所述短笔记。控制继续至步骤S120,在那里执行短笔记和局部文本实现的列表之间的模糊匹配,以便将局部文本实现与短笔记相关联。接下来,在步骤S130和S140,显示与局部文本实现相关联的短笔记,以便在存在十分接近要求用户输入的匹配的情况下,用户进行复查和/或修改。做为选择,如果没有要求用户输入,那么控制前进到步骤S150。优选地,为所述用户或操作者高亮显示等级最高的潜在的局部文本实现。
如果要求用户输入,那么控制继续至步骤S145,在那里所述用户或操作者选择局部文本实现,所述局部文本实现在步骤S150被转换为与所述局部文本实现相关联的语义表示。这些语义表示可以由现有的文档编辑系统提供。接下来,在步骤S160,可以由现有的文档编辑系统产生与所述语义表示相关联的全局文本实现。接下来,在步骤S170,该过程通过输出所述全局文本实现(语义一致且符合语法的文本)而结束。
图4示出了以更多的细节概括地描述将局部文本实现与短笔记相关联的步骤的流程图,包括执行短笔记的列表和局部文本实现的列表之间的模糊匹配,例如,如在图3的步骤S120中所阐述。所述模糊匹配过程在步骤S121开始并且继续至步骤S122,在那里为每个局部文本实现提供描述符或语义表示。控制继续至步骤S123,在那里为每个短笔记提供描述符或语义表示。一个MDA系统或其它受控文档编辑系统可以提供这些描述符或语义表示。
控制继续至步骤S124,在那里例如通过将每个短笔记的描述符或语义表示同所述局部文本实现的描述符或语义表示相比较,来产生模糊相关性度量。该相似性可以通过计算在短笔记和任何局部实现之间的语义距离来提供。可以使用已知的或今后开发的技术来实现这些,例如那些阐述在统计自然语言处理基础-Christopher D.Manning和Hinrich Schutze-第15章,MIT出版社,1999中的技术,在此将其全文引入以供参考。
例如,为每个局部文本实现和每个短笔记提供描述符。通过将每个短笔记的描述符与所述潜在局部文本实现的描述符相比较,来度量短笔记和潜在局部文本实现之间的语义距离。该度量通常用来确定短笔记和所有潜在局部文本实现之间的匹配,所述潜在局部文本实现具大于某个预先确定的阈值的相似性。为了避免搜索可能局部文本实现相对于所述MDA语法或其它受控文档编辑系统语法的整个空间,已知的或今后开发的可采纳的搜索技术-诸如那些阐述在人工智能的本质-Matt Ginsberg-第4章,Morgan Kaufmann,1993中的技术(在此将其全文引入以供参考)可以被加以利用,以致只有数目小的所述潜在局部文本实现才将能够与一个特定短笔记之间具有一个大于阈值的相似性。然而,其它短笔记也可用来把与每个短笔记相关联的潜在局部文本实现的数目降低为易管理的数目。
除在步骤S124识别每个短笔记的局部文本实现之外,还可以根据所述相似性度量为每个潜在局部文本实现赋予一个等级,这与在步骤S125中一样。与每个短笔记相关联的潜在局部文本实现的等级排列可以从最高(最可能潜在的局部文本实现)到最低(最不可能潜在的局部文本实现)。所述过程结束并且控制回到步骤S130。
图5举例说明了以更多的细节概括地描述用于确定语义表示的步骤的流程图,所述语义表示与每个选择的局部文本实现相关联,如在图3中步骤S160阐述。所述过程在步骤S161开始,并且继续至步骤S162,在那里例如从存储器提供所述语义表示。控制继续至步骤S163,在那里检索与每个局部文本实现相关联的语义表示。接下来,在步骤S164,根据所述局部文本实现产生完整的语义表示。这些语义表示可以由所述现有的MDA系统提供,以致根据所述局部文本实现产生一个完整的语义表示,例如如在表1和2中所示的。做为选择,语义表示可以由另一受控文档编辑系统提供,或添加。所述过程结束并且控制回到步骤170。
图6示出了示例性图形用户界面100,包括工具条105,请求输入输入数据的请求110,和用于显示输入数据的窗口120,所述输入数据诸如由用户或操作者输入的短笔记。这些短笔记可以被称为关键字,这些关键字可以被理解成对于听众或公众而言是有意义的。由公众使用的短笔记或关键字的数目是不受限制的,并且所述短笔记或关键字可以以任意次序输入。例如,在全体工作人员或职业介绍机构的公众中,存在具有呼叫中心的因特网职业介绍机构,在那里所述因特网职业介绍机构的雇员接收来自潜在雇主的电话并且在可搜寻的因特网网站上投递职位。一个呼叫中心的雇员可能输入短笔记或关键字,然后由如图6所示的图形用户界面100显示所述短笔记或关键字。短笔记或关键字可以使用各种输入设备输入,并且可以显示在输出设备上,所述输出设备诸如一个显示设备。
在一个行业中,某些短笔记或关键字对于全体工作人员和职业介绍机构来说是通用的,诸如雇主的姓名、工作名称、职位的所在地、雇用的持续时间、职位的职责、所要求或优选的教育、所期望的经验年限、所要求计算机软件技能、所要求的语言技能和所期望的语言技能。输入所述短笔记的所采用的次序是不固定或是不重要的。此外,所述操作者可以输入任意数目的短笔记,这是因为所述匹配是根据所述实际的输入数据而不是根据指定的字段或条目的次序来执行的。
所述图形用户界面100包括窗口120,在该窗口中显示有示例性的短笔记“GlobalModest”121、“管理助手”122、“Laval”123、“CDD即任1年”124,“约定、电话、简单信函、文件、杂项”125、“bac+2”126、“2年经验”127、“Word、Outlook”128、“法语,英语”129和“在加上意大利语”130。
在用户输入所述短笔记之后,所述短笔记与局部文本实现相关联。图7举例说明了示例性图形用户界面200,所述图像用户界面具有工具条205、让操作者根据两个栏表220确认局部文本实现的请求210,所述两个栏表包括短笔记栏230和局部文本实现栏250。如图7所示,短笔记231-248对应于局部文本实现251-268。每个短笔记与一个或多个局部文本实现相关联,所述局部文本实现处于可能的局部文本实现之间,所述可能的局部文本实现由所述文档编辑系统为其所能够表示的局部语义结构的范围而产生。例如,短笔记“管理助手”231与在块251中的一个局部文本实现相关联,框251的题目是“工作提供是管理助手”251a。诸如“Laval”233的短笔记可以有与之相关联的一个以上的局部文本实现。如块253所示,两个局部文本实现“工作地点在Laval,魁北克”253a和“工作地点在Laval,法国”253b都与所述短笔记“Laval”233相关联。根据许多因素,诸如:在笔记文本和局部实现文本之间的相似性度量、引用一个给定公司的频率、连同他们的群众统计的城市的数据库和类似的信息,为每个局部文本实现赋予一个等级。例如,向所述局部文本实现“工作地点在Laval,魁北克”253a赋予一个比所述局部文本实现“工作地点在Laval,法国”更高的等级,在图2中按照“工作地点在Laval,魁北克”253a的次序和高亮度示出。然而,所述图形用户界面200允许所述用户选择适当的局部文本实现。如果“工作地点是Laval,魁北克”253a和“工作地点是Laval,法国”253b都不是正确的,那么所述用户或操作者可以选择“其它”253c并且输入所希望的局部文本实现。
图8举例说明了一个例子,在该例子中,所述用户或操作者已经例如通过高亮度显示所述适当的选择来完成他或她所选择。每个局部文本实现在结构上与相对于所述编辑系统的局部语义表示相关联,如表1所示(所述表的行)。总起来说,这些局部语义表示形成全局语义表示(所述表1的最后一栏)。
在将所述局部文本实现转换为全局语义表示之后,如表1所示,所述文档编辑系统就被调用来根据该语义表示产生全局文本实现。所述结果在表2中示出。
图9举例说明了图形用户界面400,该图形用户界面示出了工具条405,用于表示一个显示所述短笔记的所述全局文本实现430的窗口420的标题410,所述短笔记由所述用户或操作者通过应用所述全局实现语法来输入,如上所述。
图10示出了示例性的计算系统500,所述计算系统将短笔记或关键字转换为符号语义的语法文本或全局文本实现。如图10所示,所述计算系统500包括通过一个或多个通信链路580互连的输入/输出接口510、控制器520、存储器530、笔记/实现匹配电路、例程或应用540、GUI生成电路、例程或应用550、笔记/实现链路电路、例程或应用560和文本生成实现电路、例程或应用570。所述通信链路580可以是数据总线或任何其它的分配网络。类似地,所述存储器530可以是任何用于临时或无限期地储存数据、程序等等的结构性装置。
所述存储器530包括笔记部分531、局部文本实现部分532、文本实现部分533和匹配实现部分534。用户或操作者可以提供诸如短笔记的输入数据,或经由用户输入设备502作出选择,用户输入设备502经由所述输入/输出接口510与系统500通信。所述输入设备502可以是向计算机系统500提供电信号的任何类型的设备。所述计算机系统500可以向一个或多个输出设备504输出信号。所述计算机系统500例如可以访问数据源600或向数据接收器610发送数据。通常,所述数据接收器610可以是能够输出或存储所述产生的、处理的图像数据的任何设备。
一旦经由所述输入设备502输入短笔记,那么所述笔记就被存储在存储器530的笔记部分531。然后,所述控制器520能访问存储在所述笔记部分531的短笔记以便处理。由所述控制器520激活或执行所述GUI生成电路、例程或应用550来在输出设备504上显示所述短笔记,并且允许所述用户编辑该短笔记。各种其它电路、例程或应用也可用于所述系统500,诸如声音产生并识别电路、例程或应用。
由所述控制器520激活或执行所述笔记/实现匹配电路、例程或应用540来将存储在例如所述笔记部分531的所述短笔记与多个语义表示和/或存储在例如所述局部文本实现部分532中的局部文本实现相匹配。所述匹配实现部分534可以临时存储与每个短笔记相关联的局部文本实现和与每个局部文本实现相关联的等级。所述GUI生成电路、例程或应用550使所述控制器520为用户或操作者在输出设备504上显示所述短笔记、与每个短笔记相关联的局部文本实现以及全局文本实现。
所述笔记/实现链路、例程或应用560使所述控制器520处理所选择的局部文本实现,所述选择的局部文本实现是从操作者接收的,所述选择的局部文本实现由操作者通过所述用户输入设备502和输入输出接口510而输入。所述文本实现电路、例程或应用570使所述控制器520处理所选择的局部文本实现,以便提供全局文本实现,所述全局文本实现然后被存储在所述文本实现部分533中和/或显示在输出设备504上。
用于将诸如短笔记的输入数据转换为语义一致且符合语法的文本或全局文本实现的系统和方法,可以在能够实现在图2-5中示出的流程图的步骤的可编程的通用计算机或任何其它设备上实现。
尽管可以使用这种语义表示,但是所述系统和方法不因此而受限制。其它类型的语义表示也可以代替或添加到用于所描述的MDA系统中的所述语义表示。
局部文本实现可以存储在存储器或存储设备中,并且可以和各种语义表示联合。从而,所述短笔记或其它输入数据可以与可能的语义结构或表示相关联,以便产生所述全局文本实现。所述语义表示也可以存储在存储器或存储设备中。
一旦接收到输入数据,就可以执行模糊匹配过程,以便识别潜在的局部文本实现语句并且将所述潜在的局部文本实现与所述输入数据相关联。所述局部文本实现可以与语义结构相关联。可以使用各种技术来执行所述模糊匹配,所述技术诸如是引入到上面出版物中所讨论的那些。然而,所述模糊匹配过程并不局限于这种技术。所述模糊匹配过程可以考虑所述输入数据的同义词,输入数据文本和特定字或输入数据的缩写的情报或描述。当一个以上的局部文本实现可以与短笔记相关联时,可以对所述局部文本实现分出等级。
可以允许操作者或用户选择所想要的局部文本实现。例如,用户可以使用输入设备根据与短笔记相关联的局部文本实现的显示列表或菜单来选择局部文本实现。所述列表或菜单可以包括选择,所述选择允许所述用户输入他或她自己的局部文本实现。
可以基于所选择的局部文本实现的语义描述从所选择的局部文本实现产生全局文本实现。

Claims (2)

1.一种用于处理输入数据的方法,包括:
接收短笔记输入数据;
使用语义语法来产生语义结构;
根据所述语义结构用局部实现语法来生成多个局部文本实现;
将所述短笔记输入数据与多个局部文本实现中的一些相匹配以便定义最终的语义结构;并且
根据所述最终的语义结构用全局实现语法来生成全局文本实现。
2.一种用于处理输入数据的系统,包括:
输入设备,用于接收短笔记输入数据;
语义语法发生器,用于使用语义语法来产生语义结构;
局部文本实现发生器,用于根据所述语义结构用局部实现语法来生成多个局部文本实现;
处理器,用于将所述短笔记输入数据与多个局部文本实现相匹配以便定义最终的语义结构;和
所述处理器根据所述最终的语义结构用全局实现语法来生成全局文本实现。
CN2004100980294A 2003-12-05 2004-12-03 用于语义速记的系统和方法 Expired - Fee Related CN1624686B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/727614 2003-12-05
US10/727,614 US7383171B2 (en) 2003-12-05 2003-12-05 Semantic stenography using short note input data

Publications (2)

Publication Number Publication Date
CN1624686A CN1624686A (zh) 2005-06-08
CN1624686B true CN1624686B (zh) 2010-04-28

Family

ID=34633517

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004100980294A Expired - Fee Related CN1624686B (zh) 2003-12-05 2004-12-03 用于语义速记的系统和方法

Country Status (5)

Country Link
US (1) US7383171B2 (zh)
JP (1) JP4383328B2 (zh)
CN (1) CN1624686B (zh)
BR (1) BRPI0405386A (zh)
CA (1) CA2488961C (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070282813A1 (en) * 2006-05-11 2007-12-06 Yu Cao Searching with Consideration of User Convenience
US9043197B1 (en) * 2006-07-14 2015-05-26 Google Inc. Extracting information from unstructured text using generalized extraction patterns
US20080195371A1 (en) * 2007-02-09 2008-08-14 Brown Robert J Apparatus and Method to Syncronously Decode a Stenographic Input into Two or More Different Language Streaming Text Outputs
JP2008233990A (ja) * 2007-03-16 2008-10-02 Fuji Electric Systems Co Ltd 入力画面処理装置、端末、および、コールセンター業務管理システム
US8671096B2 (en) * 2008-10-24 2014-03-11 International Business Machines Corporation Methods and apparatus for context-sensitive information retrieval based on interactive user notes
US8150859B2 (en) * 2010-02-05 2012-04-03 Microsoft Corporation Semantic table of contents for search results
US8260664B2 (en) * 2010-02-05 2012-09-04 Microsoft Corporation Semantic advertising selection from lateral concepts and topics
US8903794B2 (en) * 2010-02-05 2014-12-02 Microsoft Corporation Generating and presenting lateral concepts
US8983989B2 (en) * 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
US20110231395A1 (en) * 2010-03-19 2011-09-22 Microsoft Corporation Presenting answers
CN102918587B (zh) * 2010-03-30 2014-11-05 Nvoq股份有限公司 能够将听写代号短语转录成标准词组的分层快速注解
JP5156047B2 (ja) * 2010-03-31 2013-03-06 株式会社東芝 キーワード提示装置、方法及びプログラム
WO2017044134A1 (en) * 2015-09-11 2017-03-16 Hewlett Packard Enterprise Development Lp Human-readable cloud structures
CN114281948A (zh) * 2021-12-30 2022-04-05 安徽听见科技有限公司 一种纪要确定方法及其相关设备
CN114254158B (zh) * 2022-02-25 2022-06-10 北京百度网讯科技有限公司 视频生成方法及其装置、神经网络的训练方法及其装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5873107A (en) * 1996-03-29 1999-02-16 Apple Computer, Inc. System for automatically retrieving information relevant to text being authored
CN1311881A (zh) * 1998-06-04 2001-09-05 松下电器产业株式会社 语言变换规则产生装置、语言变换装置及程序记录媒体

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4041467A (en) 1975-11-28 1977-08-09 Xerox Corporation Transcriber system for the automatic generation and editing of text from shorthand machine outlines
US4632578A (en) 1981-04-03 1986-12-30 Digitext, Inc. Computerized printing system
US4566065A (en) 1983-04-22 1986-01-21 Kalman Toth Computer aided stenographic system
IE59659B1 (en) 1985-11-07 1994-03-09 Digitext Inc Stenographic translation system
US4858170A (en) 1986-10-24 1989-08-15 Dewick Sr Robert S Shorthand notation and transcribing method
NL8700410A (nl) 1987-02-19 1988-09-16 Philips Nv Tekstbewerkingsinrichting voor stenografisch typen.
JPH063593B2 (ja) 1987-10-23 1994-01-12 株式会社日立製作所 手書き速記文字変換装置
JPH02297188A (ja) * 1989-03-14 1990-12-07 Sharp Corp 文書作成支援装置
JP2895184B2 (ja) * 1990-08-22 1999-05-24 株式会社日立製作所 文書処理システム及び文書処理方法
US5477451A (en) 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
US5466072A (en) 1992-01-17 1995-11-14 Stenograph Corporation Method and apparatus for recording and translating shorthand notes
AU4371193A (en) 1992-05-07 1993-11-29 Chein-Hwa S Tsao Keyed language translator
JPH05324702A (ja) 1992-05-20 1993-12-07 Fuji Xerox Co Ltd 情報処理装置
ES2101613B1 (es) 1993-02-02 1998-03-01 Uribe Echebarria Diaz De Mendi Metodo de traduccion automatica interlingual asistida por ordenador.
US5523945A (en) * 1993-09-17 1996-06-04 Nec Corporation Related information presentation method in document processing system
WO1995017729A1 (en) 1993-12-22 1995-06-29 Taligent, Inc. Input methods framework
US6041292A (en) 1996-01-16 2000-03-21 Jochim; Carol Real time stenographic system utilizing vowel omission principle
JPH09231224A (ja) 1996-02-26 1997-09-05 Fuji Xerox Co Ltd 言語情報処理装置
EP0841624A1 (en) * 1996-11-08 1998-05-13 Softmark Limited Input and output communication in a data processing system
US6091956A (en) 1997-06-12 2000-07-18 Hollenberg; Dennis D. Situation information system
JPH11120487A (ja) 1997-10-21 1999-04-30 Toyota Motor Corp 移動体端末装置、情報提供装置、情報提供システム、情報提供方法及び移動体端末装置のためのプログラムを記録した媒体
US6345243B1 (en) 1998-05-27 2002-02-05 Lionbridge Technologies, Inc. System, method, and product for dynamically propagating translations in a translation-memory system
GB2341052B (en) 1998-08-26 2003-05-14 Nokia Mobile Phones Ltd Wireless communication terminal
US20020010574A1 (en) * 2000-04-20 2002-01-24 Valery Tsourikov Natural language processing and query driven information retrieval
WO2002077971A1 (en) 2000-11-22 2002-10-03 Williams Communications, Llc Real time internet transcript presentation system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5873107A (en) * 1996-03-29 1999-02-16 Apple Computer, Inc. System for automatically retrieving information relevant to text being authored
CN1311881A (zh) * 1998-06-04 2001-09-05 松下电器产业株式会社 语言变换规则产生装置、语言变换装置及程序记录媒体

Also Published As

Publication number Publication date
US20050125219A1 (en) 2005-06-09
JP2005174325A (ja) 2005-06-30
JP4383328B2 (ja) 2009-12-16
CA2488961C (en) 2011-01-04
BRPI0405386A (pt) 2005-08-30
CA2488961A1 (en) 2005-06-05
US7383171B2 (en) 2008-06-03
CN1624686A (zh) 2005-06-08

Similar Documents

Publication Publication Date Title
Reiter et al. Building applied natural language generation systems
Levy Computer-assisted language learning: Context and conceptualization
CN1624686B (zh) 用于语义速记的系统和方法
US6910027B2 (en) System and method of knowledge architecture
US20180107940A1 (en) Artificial intelligence method and apparatus
WO2004102422A1 (en) A system of interactive dictionary
EP3404555A1 (en) Speech converter
Mejía et al. A survey on mathematical software tools for visually impaired persons: A practical perspective
Feblowitz et al. IBM scenario planning advisor: a neuro-symbolic ERM solution
Amery et al. Developing augmentative and alternative communication systems in languages other than English: a scoping review
WO2022271385A1 (en) Automatic generation of lectures derived from generic, educational or scientific contents, fitting specified parameters
Kaczmarek et al. Computer-assisted sign language translation: a study of translators’ practice to specify CAT software
Hanke et al. Exploring regional variation in the DGS Corpus
AL-Hagbani et al. Support of existing chatbot development framework for Arabic language: a brief survey
Zhekova et al. Automated Extraction of Values of Quantitative Indicators to a Quality Evaluation System Using Natural Language Analysis Tools.
Aunimo Enhancing reliability and user experience in conversational agents
Jänicke Teaching on the intersection of visualization and digital humanities
Asselborn et al. Fine-tuning BERT Models on Demand for Information Systems Explained Using Training Data from Pre-modern Arabic.
Eisele et al. Towards a road map on human language technology: natural language processing
Knapp A new approach to CALL content authoring
Edwards et al. Non-visual representation of mathematical information
US20230214782A1 (en) Intelligent assistant that finds availability, coordinates and decides on meetings between 2 or more entities
Hegde et al. Automated government form filling for aged and monolingual people using interactive tool
Dash et al. Corpus and Future Indian Needs
KURZE¹ et al. New approaches for accessing different classes of graphics by blind people

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100428

Termination date: 20181203