CN101300573A - 使用快速序列呈现技术传送信息的系统、设备和方法 - Google Patents

使用快速序列呈现技术传送信息的系统、设备和方法 Download PDF

Info

Publication number
CN101300573A
CN101300573A CNA2006800404969A CN200680040496A CN101300573A CN 101300573 A CN101300573 A CN 101300573A CN A2006800404969 A CNA2006800404969 A CN A2006800404969A CN 200680040496 A CN200680040496 A CN 200680040496A CN 101300573 A CN101300573 A CN 101300573A
Authority
CN
China
Prior art keywords
user
content
target
rapid serial
presents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800404969A
Other languages
English (en)
Inventor
乔舒亚·F·克雷格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of CN101300573A publication Critical patent/CN101300573A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B17/00Teaching reading
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B17/00Teaching reading
    • G09B17/04Teaching reading for increasing the rate of reading; Reading rate control
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/04Electrically-operated educational appliances with audible presentation of the material to be studied

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

一种增强的快速序列呈现技术,其可以利用字典和/或规则组来改进在产生用于快速序列呈现的目标和相应描述符的过程中进行的判定。目标可以包括单个词语、一组词语、音频分量、视频分量、图像分量和/或触觉分量。可以采用该内容的语法和/或语义分析,以说明词语使用的方式。呈现信息的顺序可以考虑特定的用户正在访问信息的背景。可以利用反馈信息来动态地调整呈现的展现,以及定制用于特定用户的呈现。可以提供编辑工具以允许用户修改呈现。在呈现中可以包括广告。

Description

使用快速序列呈现技术传送信息的系统、设备和方法
技术领域
本发明通常涉及使用增强的快速序列呈现技术呈现信息。
背景技术
在二十世纪初,机器阅读器的想法最初随着视速仪(tachistoscope)的概念涌现出来,视速仪通常的定义是一种以快速演替投射(project)词和图像以测试视觉通过提高理解来帮助信息吸收和学习的设备。视速仪是利用这样的圆柱体建成的,所述圆柱体具有通过背光而从该圆柱体看到的词和图像,允许在视觉上处理投影。
当认知科学在二十世纪七十年代期间开始作为研究领域赢得认可的时候,一种被称作快速序列视觉呈现的并行技术涌现出来。快速序列视觉呈现,通常以首字母缩写RSVP表示,其允许研究人员通过在固定的位置上显示符号、图像或者词一段时间,继之以相继的符号、图像或者词,去测试许多类型的可视信息处理。
虽然RSVP技术已经赋予研究注意力、记忆和学习的科学家以获得深入了解包括注意力、记忆和学习的认知过程的机会,但RSVP尚未赋予普通人在其日常的信息吸收中直接益处,即使有也没多少。一些公司已经试着通过利用快速序列视觉呈现作为阅读系统来提高阅读速度和理解去解决这个问题,然而,尽管付出了许多努力,但仍没有解决人们常常报告的在使用RSVP显示文本时感觉不舒服这一基本问题。在认知学科方面的研究已经表明如果使用当前的文本显示的RSVP技术,用户仍然优选正常阅读的方法而不是RSVP。
美国专利No.6,056,551(Marasco,2000年5月2日颁布)作为参考资料整体结合在此处,其要求保护并提供了提高阅读速度和用户理解的方法。Marasco明白使用词的分组(word group)来以快速演替(rapidsuccession)显示文字的重要性,但是这种技术是通过几乎全速阅读过程教导的,其强调在词的分组方面的阅读,而不是重新聚焦在每个词上,从而通过需要更少的眼球运动(称作扫视,其通常维持10-80毫秒,期间没有有效地执行阅读)来提高阅读时间。
美国专利No.4,845,645(Matin,1987年8月28日颁布)作为参考资料整体结合在此处,其产生一种以实时快速的时间上的演替在一个空间位置上呈现数据的显示系统和方法。可以想象,对于核电站、军用设备和空中交通控制器的操作者,没有提供补偿对于不同理解模式的处理时间。此外,还对在100至450毫秒之间的显示时间主张了权利,这个参数并未考虑可以40毫秒那么快出现的语言处理。
借助于诸如提供各种程度的功能性和完善程度的Acereader、Bailando和BuddyBuzz的产品,已经提出和实现了数种类型的RSVP文本显示系统。虽然一些RSVP实施方式仅仅显示文本的每个词固定的时间量,并且在适宜的点上(例如,在逗号上或者在句子的结尾处)增加延迟,但其它的RSVP实施方式试图通过基于下述内容选择用于每个词或者短语的显示特征(例如,显示时间、字体、字体大小、字体效果、颜色等等)来改善用于RSVP用户的舒适程度,诸如基于:在文本中已经遇到的词的次数(例如,一个词可以在第一次遇到时显示较长的时间量,并且后来的该词显示较短的时间量),词长(例如,与较短的词相比较,较长的词可以显示更长的时间量),词频(例如,可以基于每个词的测量的在文本内容中的使用频率,来使用词频字典来分配权重给每个词,例如参见Oquist所著Adaptive Rapid Serial Visual Presentation(自适应快速序列视觉呈现),2001,其作为参考资料整体结合在此处),以及词类型(例如,与介词相比固有名称可以显示更长的时间量,例如参见Kanellos所著Reading phone text one word at a time,2005年7月13日,其作为参考资料整体结合在此处)。Wong所著的Visible Language Workshop论文作为参考资料整体结合在此处,其论述了文本的动态视觉处理作为书面语言的扩展,并且认识到情绪质量(emotional quality)和语音音调的范围可以经由排印形式(例如,字体、字重、颜色)的处理来传达,以及还认识到,电子媒介通过使排印形式能够实时地按照作者的表达或者读者的相互作用动态地在大小、颜色和位置方面改变而扩展了表达的可能性。令人遗憾地,这样的实施方式没有说明人们实际上处理词的方式,因此,通常在用户舒适程度方面没有提供实质上的改善。
改善RSVP用户的舒适程度的其它的尝试包括各种类型的接口,经由其用户可以控制呈现的展现(rendering),诸如,文本显示的总体速度(例如,加快或者减慢),和暂停和回倒该显示的能力(例如参见Williams,RSVP User’s Guide(RSVP用户指导),1999年,其作为参考资料整体结合在此处)。一些建议结合“familiar metaphor(常见手段)”,诸如,通过模拟驾驶车辆或者开飞机的控制,来控制RSVP显示(例如参见2003年2月4日颁布给Back等等的美国专利No.6,515,690;Back等人所著的“AirBook:force-free interaction with dynamic text in an assistive reading device”;和Back等人所著的“Speeder Reader:An Experiment in the Future of Reading”,所有的这些作为参考资料整体结合在此处)。其它的建议包括监视眼球运动,并且自动地调整RSVP显示,例如,如果用户从屏幕转移目光则放慢显示速度(例如参见Akervall所著的“Smart Bailando Eye controlled RSVP on handhelds”,2002年,其作为参考资料整体结合在此处)。总的来说,这些改善舒适程度的尝试并不太成功,因为它们不是对于用户而言是困难的,就是不切实际的(例如,眼睛监视建议需要两个照像机,在小的便携式用户设备上这是不实际的;类似地,模拟驾驶或者飞行的输入设备对于小的便携式用户设备的使用是不实际的)。
近来,特别关注于为具有小的显示屏幕的用户设备(诸如,移动电话、个人数字助理、个人计算机、传呼机、视频游戏机、腕表等等)设计的RSVP实施方案,尤其是因为这样的设备通常不便用于文本显示(例如参见,Muter所著的“Interface Design and Optimization of Reading of Continuous Text”,1996;Goldstein等人所著的“Enhancing the Reading Experience:Using Adaptive and Sonified RSVP for Reading on Small Displays”;Castelhano等人所著的“Optimizing the reading of electronic text using rapid serial visual presentation(2001)”;Sicheritz所著的“Applying the Rapid Serial Visual Presentation Technique to Small Screens”;Chittaro所著的“Visualizing Information on Mobile Devices”,2006年3月;Johnson所著的“Opus:Composing and Exploring Dynamic Typography”;以及Fogg等人的美国公布专利申请No.2006/0100984,所有这些作为参考资料整体结合在此处)。此外,还关注于RSVP用于在用户设备上导航应用的使用,诸如,经由蜂窝电话、PDA或者网络浏览器的多种菜单滚动(例如参见,de Bruijn等人所著的“RSVP Brower -Web Browsing on Small Screen Devices”,其作为参考资料整体结合在此处;和de Bruijn等人所著的“Rapid Serial Visual Presentation”,其作为参考资料整体结合在此处)。在这里,表示各种选项的图标可以顺序地显示给用户,并且当相应的图标正在被显示时用户可以例如通过“点击”来选择选项,而不需要用户滚动菜单选项的列表(例如,使用鼠标或者滚动轮)。
在供便携式用户设备使用的RSVP的背景下,某些建议的系统包括后端服务器,其将文本内容转换为标记语言文件,并且将该标记语言文件发送给用户设备用于呈现,(例如参见,Oquist所著的“Adaptive Rapid Serial Visual Presentation”,2001年,其作为参考资料结合在此;和Fogg等人的美国公布专利申请No.2006/0100984,其作为参考资料结合在此)。
因此,即使基本的RSVP概念已经大约数十年,并且存在许多的近来改进RSVP的尝试,但令人惋惜的,RSVP实施方案对于大量的信息消费来说仍然是不够的。
发明内容
根据本发明一个方面,提供了一种使用快速序列呈现技术向用户传送电子信息内容的方法。该内容的特点在于词语(term)的序列。该方法包括保持多个规则组,规则组的每个定义用于至少部分地基于词语的属性产生用于词语的快速序列呈现的目标和描述符的规则,每个规则组被定制用于特定的用户和特定类型的内容中的至少一个;基于用户规范和内容类型的至少一个,从多个规则组之中选择规则组;访问字典以获得与至少一些词语有关的量化属性;和使用选择的规则组和从字典中获得的量化属性,产生用于词语的快速序列呈现的目标和相应描述符的序列。描述符定义用于在展现快速序列呈现期间输出目标的特征。
在各种替换实施例中,目标可以包括单个词语、一组词语、音频分量、视频分量、图像分量、和/或触觉分量。从字典中获得的属性可以包括心理语言学属性。该字典可以是例如基于用户选择或者内容的类型从多个字典中选择出来的。
用于选择字典和/或规则组的内容的类型可以利用由用户提供的搜索词语或者内容的分析来确定。用于选择字典和/或规则组的用户选择可以在用户描述文件(consumer profile)中或者作为来自用户的输入而提供。
可以通过对于语法和语义的至少一个分析内容,和至少部分地基于这样的分析产生目标和相应描述符的序列,来产生目标和相应描述符的序列。替换地,或者另外地,目标和相应描述符的序列可以至少部分地基于用户描述文件产生,用户描述文件可以包括由用户提供的偏好信息和/或表征用户对快速序列呈现感受的反馈信息。该反馈信息可以包括与在展现快速序列呈现期间监视的用户的潜在的生理情况有关的信息,和/或与在展现快速序列呈现期间的用户输入有关的信息。
在产生目标和相应描述符的序列之后,可以提供编辑工具以使得用户能够修改目标和相应描述符的序列。该修改可以包括诸如:将多个目标转换为单个目标,将单个目标转换为多个独立的目标,定义用于输出目标的特征,插入附加的目标,和除去目标。
可以在该快速序列呈现开始时包括一个或多个广告。广告的数目可以根据对于快速序列呈现向用户收费的价格来选择。
目标和相应描述符的产生可以考虑在其内用户正在访问该内容的背景(context),使得可以基于该背景以不同的顺序呈现该内容。为此,该目标和相应描述符的产生可以包括:基于用于快速序列呈现的背景确定将内容的不同部分传送给用户的顺序,和至少部分地基于所确定的顺序和背景产生目标和相应描述符。
根据本发明的另一个方面,提供了一种使用快速序列呈现技术传送电子信息内容给用户的方法。该内容的特点在于词语的序列。该方法包括访问字典以获得与至少一些词语有关的心理语言学(psycholinguistic)属性,和使用相关的心理语言学属性产生用于词语的快速序列呈现的目标和相应描述符的序列。该描述符定义用于在展现快速序列呈现期间输出这些目标的特征。
根据本发明的另一个方面,提供了一种使用快速序列呈现技术传送电子信息内容给用户的方法。该内容的特点在于词语的序列。该方法包括保持多个规则组,规则组的每一个定义用于产生供词语的快速序列呈现的目标和描述符的规则,每个规则组定制用于特定的用户和特定类型的内容中的至少一个;基于用户规范和内容类型的至少一个,从多个规则组之中选择规则组;和利用选择的规则组,产生用于词语的快速序列呈现的目标和相应描述符的序列。描述符定义用于在展现快速序列呈现期间输出所述目标的特征。
根据本发明的另一个方面,提供了用于产生电子信息内容的快速序列呈现的装置。该内容的特点在于词语的序列。该装置包括用于允许经通信网络通信的网络接口;用于记忆多个规则组的数据库,规则组的每一个定义用于至少部分地基于词语的属性产生用于词语的快速序列呈现的目标和描述符的规则,每个规则组被定制用于特定的用户和特定类型的内容的至少一个;呈现发生器,其与数据库和网络接口通信,用于产生快速序列呈现,该呈现发生器被配置来基于用户规范和内容类型的至少一个从多个规则组之中选择规则组;访问字典以获得与至少一些词语有关的量化属性;和使用所选择的规则组和从字典中获得的量化属性,产生用于词语的快速序列呈现的目标和相应描述符的序列。描述符定义用于在展现快速序列呈现期间输出目标的特征。
该字典可以存储在数据库中,或者可以经由网络接口通过通信网络访问。所述目标可以包括单个词语、一组词语、音频分量、视频分量、图像分量、和/或触觉分量。该字典可以包括用于至少一些词语的心理语言学属性。该呈现发生器可以被配置来基于用户选择和内容类型的至少一个,从多个字典之中选择字典,其中字典的每一个被定制用于特定的用户和特定类型的内容的至少一个。该呈现发生器可以被配置来就语法和语义的至少一个分析内容,和至少部分地基于该分析产生目标和相应描述符的序列。该呈现发生器可以被配置来至少部分地基于用户描述文件,产生目标和相应描述符的序列,该用户描述文件包括由用户提供的偏好信息和表征用户对快速序列呈现体验的反馈信息的至少一个。该用户描述文件可以存储在数据库中。
该装置可以进一步包括与数据库、网络接口和呈现发生器通信的网络服务器,用于下列中的至少其一:经由网络接口获得内容,经由网络接口发送快速序列呈现给用户设备,和配置呈现发生器。
另外地,或者做为选择,该装置可以包括用于允许用户修改所述目标和相应描述符的序列的编辑工具。该修改可以包括:将多个目标转换为单个目标,将单个目标转换为多个独立的目标,定义用于输出目标的特征,插入附加的目标,和除去目标。
根据本发明的另一个方面,提供了一种展现快速序列呈现给用户的方法。该快速序列呈现包括目标和相应描述符的序列。该方法包括:根据相应描述符在用户设备上输出目标;在该输出的同时监视用户的潜在的生理情况;分析该潜在的生理情况以推断用户对于快速序列呈现的情绪状态;和基于推断的用户的情绪状态,动态地调整后续的目标的输出。
该潜在的生理情况可以包括诸如:心率,血流,脑波,电信号,皮肤电反应(galvanic skin response),呼吸,和体温。与潜在的生理情况有关的反馈信息可以被传送给呈现服务器,供在产生用于用户的后续的快速序列呈现中使用。根据本发明的另一个方面,提供了用于展现快速序列呈现给用户的装置。该快速序列呈现包括目标和相应描述符的序列。该装置包括用于允许在通信网络上通信的网络接口,经其接收该快速序列呈现;至少一个输出;生理传感器;和呈现播放器,其与网络接口、所述至少一个输出和生理传感器通信,该呈现播放器被配置来根据相应描述符使用所述至少一个输出来输出目标;同时利用生理传感器监视用户的潜在的生理情况;分析潜在的生理情况以推断用户对于快速序列呈现的情绪状态;和基于推断的用户的情绪状态,动态地调整后续的目标的输出。
所述至少一个输出可以包括诸如显示屏、音频输出和触觉输出。该潜在的生理情况可以包括诸如以下:心率,血流,脑波,电信号,皮肤电反应,呼吸和体温。该呈现播放器可以被配置来经由网络接口将与潜在的生理情况有关的反馈信息传送给呈现服务器,供在产生用于用户的后续的快速序列呈现中使用。该装置可以进一步包括与网络接口和呈现播放器通信的浏览器。该呈现播放器可以与网络浏览器集成。该装置可以进一步包括与呈现播放器通信的至少一个输入,经由其用户可以手动地控制目标的输出的各个方面。
根据本发明的另一个方面,提供了一种快速序列呈现系统,其包括:用于为用户产生快速序列呈现的服务器;和与服务器通信的用户设备,用于将快速序列呈现展现给用户,其中该用户设备被配置来传送反馈信息给服务器,该反馈信息表征用户对快速序列呈现的体验,和其中服务器被配置来在产生用于用户的后续的快速序列呈现的过程中使用该反馈信息。
根据本发明的另一个方面,提供了一种使用快速序列呈现技术将电子信息内容呈现给用户的方法。该方法包括记录该内容的阅读;分析记录的阅读以识别言语特征(verbal characteristics);将内容分析为词语的序列;和使用所述言语特征产生目标和相应描述符的序列,使得目标的快速序列视觉呈现将至少部分地模拟所述言语特征。
根据本发明的另一个方面,提供了一种方法,其中可以基于用户愿意观看的广告的数目来对内容的访问向用户收取不同的费用。该方法通常可以应用于在线内容,并且不局限于与快速序列呈现一起使用。因此,例如,该方法可以与电子图书、报纸文章等等结合使用。
应当注意到,本发明不局限于以上所述的方面。
附图说明
从下面参考伴随的附图对其进一步的描述中,将更加充分地理解本发明的前述内容和优点,在附图中:
图1是描述根据本发明示范实施例的RSP系统的示意图;
图2是示出根据本发明示范实施例的RSP服务器的相关部件的示意方框图;
图3是示出根据本发明示范实施例的RSP发生器的相关部件的示意方框图;
图4是示出根据本发明示范实施例的数据库的可能的内容的示意框图;
图5是示出根据本发明示范实施例的用户设备的相关部件的示意框图;
图6是根据本发明示范实施例用于产生目标和相应描述符的逻辑流程图;
图7是根据本发明示范实施例用于使用包含心理语言学属性的字典的逻辑流程图;
图8是根据本发明示范实施例用于使用规则组的逻辑流程图;
图9是根据本发明示范实施例的用于文字到语音的逻辑流程图;和
图10是根据本发明示范实施例的用于生物反馈的逻辑流程图。
具体实施方式
定义
如在本说明书和所附权利要求中所使用的,除非背景另有需要之外,以下的术语将具有所表示的含义:
“内容”是要呈现给用户的电子信息。内容可以包括诸如:存储的信息文件、流化的信息、网页、电子图书等等。在线数据库,诸如wikipedia,可以呈现内容。
“词语”是从内容分析来的信息“量子”(quantum),诸如,词或者短语。实质上,内容可以表征为词语的序列。
“目标”是作为单元要呈现给用户作为快速序列呈现的一部分的信息。目标通常是从内容中得出的,并且可以包括例如单个词语或者一组词语。在快速序列呈现中也可以包括附加的目标,诸如,插入的文本、音频、视频、图像和触觉信息。
“描述符”定义用于在快速序列呈现期间呈现目标的一个或多个特征。描述符可以定义任何数目的排印和显示属性,诸如字体、字体大小、字形/效果(例如,粗体、下划线、斜体)、字体颜色、显示位置、显示方向、显示持续时间等等。描述符可以对目标的不同部分定义不同特征,例如,第一个词粗体、第二个词绿色、第三个词处于不同字体。描述符可以是XML类标签的形式。
“快速序列呈现”或者“RSP”是快速序列视觉呈现(RSVP)的扩展,其包括增强的文本显示能力,并且也可以包括音频、视频和触觉分量。
术语“快速序列呈现”可用于表示能够在用户设备上展现的目标和相应描述符的序列的编译。快速序列呈现通常包括,虽然不是必须包括,用于每个目标的至少一个描述符。快速序列呈现可以包括用于单个目标的多个描述符,并且可以包括不与任何特定目标有关的独立的描述符。快速序列呈现可以是以标记语言文件(例如,使用XML类语法)或者其它的电子文档的形式。
术语“快速序列呈现”也可以用于表示在用户设备上编译的实际展现。
“用户设备”是能够展现快速序列呈现的设备。用户设备典型地至少包括显示屏(例如,CRT、LCD、等离子屏幕),在其上可以显示可视信息(例如,文本、视频、图像信息),但是也可以包括其它的分量,诸如用于产生可听信号的音频输出(例如,扬声器或者蜂鸣器),或者用于产生触觉信号的触觉输出(例如,振动器或者可动部件,例如,如美国专利No.5,989,099中那样,其作为参考资料整体结合在此)。用户设备可以是固定的或者移动的。移动用户设备的某些例子包括移动电话、个人数字助理、个人计算机、传呼机、视频游戏、数字式手表等等。固定的用户设备的某些例子包括台式计算机、电视监视器、电话亭(kiosk)、自动柜员机等等。并不要求用户设备支持所有类型的目标和描述符的展现。例如,没有触觉输出的用户设备可以忽略传送触觉信号的目标/描述符。
根据由描述符指定的呈现特征通过在用户设备上串行地输出目标的序列而在用户设备上“展现”快速序列呈现。在展现快速序列呈现期间,虽然该描述符可以指定不同的方向、位置、或者用于某些文本信息的其它显示属性,但文本信息通常在显示屏上的单个的预定位置处显示。
“字典”是表征至少一些词语的信息的数据库。在字典中的每个词语可以与多种属性相关,包括语言学和心理语言学属性。每个属性典型地被分配以量化的值。示范的字典包括Medical Research Council(MRC)Psycholinguistic Database(医学研究委员会心理语言学数据库)和Oxford Psycholinguistic Database(牛津心理语言学数据库),其定义了26个语言学和心理语言学属性,通过这些属性词语可以被表征。在Wilson所著的“MRC Psycholinguistic Database:Machine Usable Dictionary.Version 2.0”,Oxford University Computing Service,1987,其可以在http://www.psy.uwa.edu.au/mrcdatabase/mrc2.html获得(在下文中称之为“MRC2字典文档”),其内容作为附录A在此附上,并且由此作为参考资料整体结合在此处。“语言学属性”包括诸如:词中字母数目、词中音素(phoneme)数目、词中音节数目、Kucera和Francis书写频率、Kucera和Francis类别数目、Kucera和Francis采样数目、Thorndike-Lorge频率、Brown言语频率、类型、词类(part of speech)(SOED语法分类)、词类(Jones发音词典语法分类)、alphasyllable、状态、变体音素、大写、不规则复数、实词(actual word)、音标、编辑的音标、和重音模式;“心理语言学属性”包括诸如:熟悉度、具体性、形象度、平均Colerado意义、平均Pavio意义和获取的年龄。这些语言学和心理语言学属性的描述可以在MRC2字典文档中找到。应当注意到,字典不需要(并且典型地没有)包括对于每个词语的每个属性的量化的值。特定的RSP实施方案可以支持多个字典,其被配置用于特定的用途,诸如,用于不同类型的内容或者不同的用户。可以生成自定义字典专用于RSP,并且具有新的或者修改了的类型的心理语言学属性反映用户的RSP体验。字典可以包括定义词、短语、声音、图像和触觉信号之间相互作用的条目。字典可以包括供当词语没有在字典中或者用于特定的词语的参考属性未被量化的时候使用的一个或多个默认条目。
“规则组”是用于将词语转换为目标和相关的描述符序列的一组规则。对于不同的用户和/或不同类型的内容可以有不同的规则组。
“潜在的生理情况”是用户的生理情况,其外表上不是明显的但是能够被监视和量化,以便推断在快速序列呈现期间用户的情绪状态。生理参数可以包括诸如心率、血流、脑波、电信号、皮肤电反应、呼吸、体温及其他潜在的生理情况,但是,不包括诸如外表上可以观察的眼球运动和眨眼之类。
引言
本发明的实施例对传统的快速序列视觉呈现(RSVP)技术和实现方案提供许多的增强。例如,将内容转换为目标和描述符可以利用心理语言学信息,以便说明人们处理某些词语的方式。可以采用规则组来对于不同的用户或者对于不同类型的内容不同地处理内容。用户描述文件可用于向特定的用户或者用户组定制快速序列呈现。讨论了用于生成快速序列呈现的技术,其模拟阅读文本内容。还讨论了用于基于潜在的生理情况动态地调整快速序列呈现的展现的技术,该潜在的生理情况推断用户的情绪状态。有关用户的信息(诸如,潜在的生理情况及其他量度)可以由用户设备采集,并且传送给中央服务器,使得在生成用于用户的后续的快速序列呈现期间,能够跟踪和使用用户偏好。这些和其它的增强在下面进一步论述。
图1是描述根据本发明示范实施例的RSP系统100的示意图。在这个例子中,RSP服务器102经通信网络104与各种用户设备106和各种内容提供者108通信。RSP服务器102典型地通过在不同的时间上从内容提供者108下载内容,和/或从内容提供者108接收内容流,从内容服务器108获得内容。RSP服务器104例如以类似XML文件的形式产生快速序列呈现。RSP服务器104可以实时产生特定的快速序列呈现(例如,当接收流化的内容时),或者可以根据需要产生快速序列呈现(例如,在从用户设备108接收用于指定的信息的请求)。RSP服务器104可以本地地存储快速序列呈现,和/或可以经通信网络104将快速序列呈现传送给各种用户设备106。用户设备108在用户控制下或者在适当时展现该快速序列呈现。
应当注意到,该通信网络104不意欲表示任何特定的网络,而是意欲表示任何一个或多个通信网络,各种设备通过其或者经由其通信。该通信网络104不需要是单一连续网络,而是可以包括多个不同的网络。因此,该通信网络104可以包括公共的和/或专用的网络,包括因特网,并且可以包括能够传送信息往返于通信设备的无线(例如,蜂窝电话、黑莓、蓝牙、卫星)或者有线(例如,PSTN、电缆调制解调器、DSL)网络。
在RSP系统100的工作期间,用户设备106可以发送用于指定内容的请求给RSP服务器102。例如,该用户设备106可以请求特定的文档、网页或者用于数据库查询的搜索词语。假设指定的内容没有本地地存储在RSP服务器102上,则RSP服务器102与适当的内容提供者108交互,以获得指定的内容。一旦从适当的内容提供者108收到指定的内容,则该RSP服务器102处理该内容,并且产生适当的快速序列呈现,然后其被传送给请求的用户设备108。该快速序列呈现然后可用于展现给该用户。
在一个示范的实施例中,该RSP服务器102将保持远程数据库的本地拷贝。特别地,该RSP服务器102将来自远程数据库的信息周期性地复制到本地拷贝,以便保持与远程数据库某种程度的同步。通过该数据库的本地拷贝将满足由用户设备108进行的对数据库的访问。
于是,实质上,该RSP服务器102起集线器(hub)的作用,其用于:发送对于内容的请求,接收内容,接收偏好的观看方法和规则组,将内容引用到字典,取引用给字典或多个字典后的内容并应用规则组,经由标记语言分配描述符,传送文件给用户设备,保存用户信息和描述文件,保存用户反馈,引用用户反馈,操纵用户设备的生理传感器等等。在这个例子中,该RSP服务器102与用户设备分离,但是,该RSP服务器功能中的某些或者全部可以集成进该用户设备中。
图2是示出根据本发明示范实施例的RSP服务器102的相关部件的示意框图。尤其地,该RSP服务器102包括网络接口202、RSP发生器204、网络服务器206、数据库208和操作系统210。
网络服务器206操作作为接口,经由其用户可以使RSP发生器204操作个性化(例如,通过更新用户描述文件和选择规则组),并且以快速序列呈现的形式获得内容。为此,该网络服务器206经由网络接口202从用户设备108接收请求,获得和存储内容(如果不是本地可用的话),调用RSP发生器204以将内容转换为快速序列呈现,并且经由网络接口202将完整的快速序列呈现分发给用户设备108。该网络服务器206在数据库208中存储信息(诸如,用户描述文件和内容),以供RSP发生器204使用。该网络服务器206也可以从用户设备108接收关于用户偏好、行动和测量的行为的反馈信息,并且在数据库208中存储这样的信息以供RSP发生器204使用。
RSP发生器204负责将内容转换为快速序列呈现的职责。为此,该RSP发生器204典型地从数据库208获得内容,并且将该内容转换为快速序列呈现。作为该转换过程的一部分,该RSP发生器204可以访问字典、规则组、和/或存储在数据库208中的用户描述文件。该RSP发生器204在数据库208中存储完整的快速序列呈现,用于通过网络服务器206传送给用户设备108。
该数据库208存储内容、字典、规则组、用户描述文件、完整的快速序列呈现和其它的相关的信息,以便由RSP发生器204和网络服务器206使用。该数据库208可以集成到RSP服务器102,或者外部地附着在RSP服务器102(例如,外部盘驱动器、存储区域网络,或者网络附加的存储器)。
该网络接口202提供了这样的管道,即,经由其RSP发生器204和网络服务器206在通信网络104上发送和接收信息。该网络接口202可以包括LAN接口、WAN接口或者其他类型的接口。
操作系统210是适当的操作系统,其提供用于RSP服务器102的通用操作环境。该操作系统210和相关软件在适当的处理器上运行(例如,在英特尔处理器上运行的Windows XP)。虽然本发明不局限于任何特定的操作系统或者处理器,该服务器可以利用64位双处理器以增强性能。所预想的是,该服务器将包括至少2GB的RAM,和至少500GB的存储(例如,250GB用于实时的数据库,和至少250GB用于数据库的保持、备份和转储(dumping)),同样,本发明不局限于任何特定的类型或者存储量。
图3是示出根据本发明示范实施例的RSP发生器204的相关部件的示意框图。尤其地,该RSP发生器204包括请求操作器302、请求管理器304、请求处理器306、分析器308和XML生成器310。
该请求操作器接收进来的请求,得到请求的信息主体,并且将该信息发送给请求管理器。当请求管理器处理该信息的时候,然后,其将具有XML标签的该信息发送给请求操作器,该请求操作器将该标记的信息发送给客户。该请求管理器接收内容,并且借助于伴随的处理器请求将其分析为XML,该请求管理器也验证该请求。该请求处理器(或多个请求处理器)接收处理器请求,并且发送操作以及请求参数给处理器,该处理器产生响应。该XML分析器接收内容,并且根据定义的方案产生处理器请求。该XML生成器反转XML分析器的处理过程,接收处理器请求,并且产生XML内容。
图4是示出根据本发明示范实施例的数据库208的可能的内容的示意框图。尤其地,该数据库208包括本地存储的内容402(例如,远程数据库的本地拷贝),一个或多个字典404,各种规则组406,用户描述文件408,和完整的RSP文件410。
图5是示出根据本发明示范实施例的用户设备108的相关部件的示意框图。尤其地,该用户设备108包括网络接口502、RSP播放器504、网络浏览器506、数据库508、操作系统510、显示屏512、可选的音频输入/输出514、可选的触觉输出516、可选的生理传感器518、和用户输入520。
该网络浏览器506提供到RSP服务器102的主接口。特别地,该网络浏览器506发送请求给RSP服务器102,并且经网络接口510从RSP服务器102接收回完整的快速序列呈现。该网络浏览器506在数据库508中存储该快速序列呈现,用于由RSP播放器504访问。该网络浏览器506也将其它的信息,诸如反馈信息,转发给该RSP服务器102。该网络浏览器506调用RSP播放器504以展现快速序列呈现。
通过解释各种目标和描述符,并且产生适当的输出信号给显示屏512、可选的音频输出514和可选的触觉输出516,该RSP播放器504展现快速序列呈现。该RSP播放器504还经由用户输入520、可选的音频输入514和生理传感器518接收各种输入信号,以用于,尤其地,用于控制快速序列呈现的展现。例如,用户可以手动地减慢、加快、暂停或者回倒(rewind)该展现,或者RSP播放器504可以基于来自生理传感器518的输入的分析自动地调整展现。
该网络接口502可以是无线接口或者其它的接口,经由其用户设备502与RSP服务器102通信。
该操作系统510是适当的操作系统,其提供用于用户设备108的通用操作环境。
以下是从用户设备108到RSP服务器102用于示范的数据库搜索的示例请求(例如,在wikipedia中):
<Request>
  <Session>876ASDFSAF67969ASDF</Session><!-Optional-->
      <Operation id=″1″name=″searchText″title=monkey″
startIndex=″1″itemCount=″5″/>
      <Operation id=″2″name=″getLinks″title=″monkey″
startIndex=″1″itemCount=″5″/>
      <Operation id=″3″name=″getReferences″title=″monkey″
startIndex=″1″itemCount=″5″/>
      <Operation id=″4″name=″getImages″title=″monkey″
startIndex=″1″itemCount=″5″size=″100×100″/>
      <Operation id=″5″name=″Today′s featured image″/>
      <!-and so forth->
</Request>
在以上的请求中,首先其确认用户连接到服务器并且准备搜索。一旦输入检索词语并且发送给该服务器,该客户请求在数据库的不同领域的每个中搜索。搜索文本被以寻找确认的条目标题和存在于该内容之中的具有检索词语标题的附加条目。搜索链接(Link)标题以在链接中寻找匹配的数据库条目,然后搜索参考页面,然后被缩放到客户正在操作的一般用户设备的屏幕大小的图像,然后附加的类别,诸如条目标题、专题文章等等。
以下是从RSP服务器102到用户设备108用于上述数据库搜索的示例响应:
<Response>
    <Session>876ASDFSAF67969ASDF</Session><!-Optional->
    <Operation id=″1″name=″searchText″title=″monkey″
tartIndex=″1″itemCount=″5″>
           <Item index=″1″title=″monkey″description″″/>
           <Item index=″2″title=″monkey″description″″/>
           <Item index=″3″title=″monkey″description″″/>
           <Item index=″4″title=″monkey″description″″/>
           <Item index=″5″title=″monkey″description″″/>
      </Operation>
      <Operation id=″2″name=″getLinks″title=″monkey″
startIndex=″1″itemCount=″5″>
           <Link index=″1″url=″″/>
           <Link index=″2″url=″″/>
           <Link index=″3″url=″″/>
           <Link index=″4″url=″″/>
           <Link index=″5″url=″″/>
      </Operation>
      <Operation id=″3″name=″getReferences″title=″monkey″
startIndex=″1″itemCount=″5″>
          <Reference index=″1″paramsHere=″″/>
          <Reference index=″2″paramsHere=″″/>
          <Reference index=″3″paramsHere=″″/>
          <Reference index=″4″paramsHere=″u/>
          <Reference index=″5″paramsHere=″″/>
      </Operation>
      <Operation id=″4″name=″getImages″title=″monkey″
startIndex=″1″itemCount=″5″size=″100×100″>
          <Image index=″1″>binarydatahere</Image>
          <Image index=″2″>binarydatahere</Image>
          <Image index=″3″>binarydatahere</Image>
          <Image index=″4″>binarydatahere</Image>
          <Image index=″5″>binarydatahere</Image>
      </Operation>
      <Operation id=″5″name=″today′sfeatureimage″>
          <!-set params on our behalf->
      </Operation>
      <!-and so forth->
</Response>
以上的响应是服务器运行代码以处理进行数据库的不同领域搜索的确认的匹配。该响应被从文章标题开始发送回该客户设备。然后,匹配的链接被发送回该客户。然后,匹配的引用,然后,图像,被以二进制方式发送回以供客户屏幕显示并缩放大小以适于客户屏幕,并且经由数据库中所有一般领域的数据继续进行。
产生快速序列呈现
在本发明的实施例中,可以单独地或者组合使用各种技术,以产生具有改进的特征的快速序列呈现,期望其给用户提供更加舒适的体验。
在某些实施例中,可以参考一个或多个字典,以便获得用于各种词语的语言学和心理语言学属性。尤其是,心理语言学属性允许以考虑了人们实际上如何处理特定的词的方式产生目标和相应描述符。
在其它的实施例中,各种规则组可用于产生目标和相关的描述符。规则组可以定制用于特定的用户和/或特定类型的内容,并且可以涉及从字典中获得的值,以便指示应该如何应用字典信息。因此,不同的字典和规则组可以应用于不同的用户、不同类型的内容,甚至内容的不同部分。
在再一个实施例中,该内容可以在句法上和/或语义上分析,以便产生目标和相关的描述符,其考虑了在该内容中这些词使用的方式。因此,例如,相同的词可以在两个不同的背景下不同地对待。
在再一个实施例中,用户描述文件可用于进一步定制用于特定的用户的快速序列呈现。用户描述文件可以包括诸如由用户提供的偏好信息(例如,优选的阅读速度、字典、规则组等等,其可以进一步被指定用于不同类型的内容),以及表征用户对快速序列呈现的体验的反馈信息(例如,与在快速序列呈现的展现期间监视的用户的潜在的生理情况有关的信息,和与在快速序列呈现的展现期间用户输入有关的信息)。目标和相应描述符的产生可以考虑用户描述文件信息,以便为该用户定制快速序列呈现。
在另一个实施例中,可以根据用于快速序列呈现的背景确定将内容呈现给用户的顺序,并且可以至少部分地基于所确定的顺序和该背景产生目标和相应描述符。例如,一篇有关特定的药物的文章可能具有与药的类别、药的历史(例如,谁以及如何发现它)、许可使用、禁忌症、剂量给药、副作用、药物相互作用、给药过量的标记和给药过量补救有关的部分。响应有关特定的药物的常规的询问,快速序列呈现可以从许可使用/禁忌症和剂量给药信息开始,继之以其它的信息。但是,响应从毒物控制中心接收的询问,快速序列呈现可以从给药过量的标记和给药过量补救开始。上述的上下文的处理很可能改善用户的舒适程度,因为用户不需要阅读不相关的信息或者快速向前掠过不相关的信息。
因此,在本发明的多种实施例中,可以使用选择的字典、选择的规则组、句法上和/或语义上分析、用户描述文件和基于背景确定的输送顺序的至少一个来产生目标和相应描述符。字典和规则组可以由用户指定(例如,经由用户描述文件,或者在请求信息的时候),或者根据内容的类型选择(其可以例如通过分析内容或者从由用户提供的检索词语中推断内容的类型来确定)。
在已经产生了用于快速序列呈现的目标和相应描述符之后,可以给用户以手动地调整该快速序列呈现的机会。特别地,可以提供编辑工具以允许用户去改变目标和相应描述符的序列。这样的修改可以包括诸如:将多个目标转换为单个目标,将单个目标转换为多个独立的目标,定义/改变用于输出目标的特征(例如,改变目标将被显示的时间量),插入附加的目标(例如,空白屏、音频分量、视频分量、触觉分量),和除去目标。
图6是根据本发明示范实施例的用于产生目标和相应描述符的逻辑流程图。在模块602中,可以基于用于快速序列呈现的背景确定将内容的各种部分传送给用户的顺序。在模块604中,可以确定内容的类型。在模块606中,可以从多个规则组中选择规则组。在模块608中,可以从多个字典中选择字典。在模块610中,可以访问该字典以获得与至少一些内容词语有关的属性。在模块612中,可以从句法上和/或语义上分析该内容。在模块614中,可以使用选择的字典、选择的规则组、内容的句法上和/或语义上的分析、用户描述文件和基于背景确定的输送顺序中的至少一个,来产生目标和相应描述符的序列。在模块616中,可以提供编辑工具以允许用户修改该呈现。
应当注意到,本发明的实施例可以结合由模块602、604、606、608、610和612表示的一个或多个单元,来产生用于快速序列呈现的目标和相应描述符的序列。例如,可以使用规则组而无需字典,可以使用的包含心理语言学信息的字典而无需规则组,可以选择字典和/或规则组而可以需要或者不需要确定内容类型,等等。因此,本发明的实施例可以包括这些单元的许多不同的组合和置换。
字典
Oquist所著的“Adaptive Rapid Serial Visual Presentation(2001)”(自适应的快速序列视觉呈现(2001)),在上文中作为参考资料结合在此,其公开了用于使用自适应RSVP技术在小屏幕上呈现文本的两种不同算法,即,内容自适应算法和背景自适应算法。该内容自适应算法使用词数、字符数、包括分隔符的平均字长和速度(以每分钟字数计)来计算可变的曝露时间。该背景自适应算法使用来自内容适应算法的时间、在块(chunk)中该词的词频、和在露出的句子中该块的位置。在背景自适应算法中,在词频的字典中查阅块中的每个词,并且给每个词分配权重,据此,使得如果该词是常见的,其接收低于1的权重(即,其被显示较短的时间量),而如果其是罕见的或者不在该字典中,其接收高于1的权重(即,其被显示较长的时间量)。在背景自适应算法中词频字典的使用假设了经常使用的词比不经常使用的词可以更迅速地由用户处理,因而可以显示较短的时间。事实上,词处理不仅受到词的熟悉度和它们在句子中的位置的影响,而且还受到其它的感知(即,心理语言学属性)影响。因此,例如,可以是以下的情形,即,特定的经常使用的词实际上比不经常使用的词需要更多的处理时间,因而应当显示更长的时间量。Oquist不考虑上述的心理语言学属性。
因此,在本发明的某些实施例中,包含心理语言学信息的字典被引用,以获得用于某些词的心理语言学属性。使用从该字典中获得的心理语言学属性将词语转换为目标和相应描述符。该服务器可以保持多个字典以用于不同的用户和/或不同类型的内容。当将词语转换为目标和描述符的时候,心理语言学信息的使用通常允许进行更好的决定,结果形成能够更好地以反映用户可能如何处理该信息的方式呈现信息的快速序列呈现。例如,人们当然可以预见这样的情形,其中需要显示两个词,其中已经发现第一个比第二个更加频繁地使用,但是,还发现其与另一个相比是不具体的。在这样的情况下,单独使用语言学属性,诸如“词频”,将仅仅示出第一个词应当比第二个词显示更短的时间量,这里额外考虑心理语言学属性“具体度”则可能建议实际上该第一个词应当比第二个词显示更长的时间量。
图7是根据本发明示范的实施例用于使用包含心理语言学属性的字典的逻辑流程图。在模块702中,该内容被分析为词语的序列。在模块704中,访问字典以获得与至少一些词语有关的心理语言学属性。在模块706中,利用相关的心理语言学属性将这些词语转换为目标和相应描述符的序列。该字典可以基于内容的类型从多个字典中选择出来,例如,通过由用户提供的检索词语确定内容的类型或者通过分析该内容以确定内容的类型。做为选择,该字典可以基于例如在用户描述文件中或者在从用户接收的输入中提供的用户选择从多个字典中选择出来。
应当注意到,不同的字典可以应用于不同的用户和/或不同类型的内容。字典可以由用户选择,或者可以由RSP服务器102自动地选择。该字典可以经通信网络104访问,或者可以由RSP服务器102在本地保存。
规则组
在本发明的某些实施例中,当将词语转换为目标和相应的标签的时候,可以采用一个或多个规则组。规则组是具有规则的列表的文件,所述规则被应用于分配给在字典或者内容中的条目的变量(variables)。规则组提供:词语的类型或者准确的词语;以及分配的结果(outcome),如果该词语出现在一份内容内则将所述分配的结果分配给该词语。规则组可以提供一般的类别,例如熟悉度等级,以及音节的数目,条目的背景,等等。当对于一个词语存在多个规则的时候,这里每个规则分配一结果,参考规则的优先权查找在该规则组内哪个规则优先。
如上所述,可以保持个规则组,并且每个规则组配置用于特定的用户和/或内容的类型。应用于给定内容的规则组可以由用户例如作为用户输入或者在用户描述文件中指定。做为选择,可以基于内容的类型,例如,如通过由用户提供的检索词语或者内容本身的分析而确定的内容的类型,由RSP服务器102选择规则组。
规则组可以具有不同的间隔程度(levels of granularity),例如,用于每个词的规则,用于句子间相互作用的规则,等等。规则组可以包括用于范例语句(model sentence)或者短语结构的规则,使得可以根据相应的规则来操作匹配特定的范例的文本。当规则组与字典结合使用的时候,该规则组典型地涉及用于可以从该字典中获得的属性的值或者值的范围。例如,规则组可以具有基于心理语言学属性“具体度”的规则(例如,如果具体度<x,则将词显示较长的时间量;如果具体度>=x,则将词显示较短的时间量)。规则组可以包括用于将词分组和用于确定这些词的分组应显示的时间量(例如,从每个独立的词被显示的时间量计算的)的规则/过滤器。可以提供特殊规则(或者单独的规则组)以处理诸如排印错误、首字母缩写、不同的语言的词和在内容中遇到的其它的异常。
图8是根据本发明示范实施例使用规则组的逻辑流程图。在模块802中,多个规则组被保持,这里该规则组的每个定义用于产生用于不同类型内容的目标和描述符的规则。在模块804中,基于用户选择或者内容的类型从多个规则组中选择规则组。在模块806中,该内容被分析为词语的序列。在模块808中,使用所选择的规则组将这些词语转换为目标和相应描述符的序列。
以下是根据本发明示范实施例的用于rules.ini的有效过滤器列表,其接受整数值:
最小字母
最小音素
最小音节
最小Kucera Francis频率
最小Kucera Francis类别
最小Kucera Francis样本
最小Thorndike Lorge频率
最小Brown言语频率
最小熟悉度
最小具体度
最小形象化度
最小Colerado意义
最小Pavio意义
最小获取年龄
最大字母
最大音素
最大音节
最大Kucera Francis频率
最大Kucera Francis种类
最大Kucera Francis样本
最大Thorndike Lorge频率
最大Brown言语频率(verbal frequency)
最大熟悉度
最大具体度
最大形象化度
最大Colerado意义
最大Pavio意义
最大获取年龄
以下是根据本发明示范实施例用于rules.ini的额外的过滤器列表:
Word Type
Valid Values:‘None’,‘2’,‘Q’or’2,Q’(without the quotes)有关这些值的含义的更多信息,请查阅MRC2字典文档。
词类过滤器(Part Of Speech Filter)
一个或多个以下值的逗号隔开的列表:
名词
形容词
动词
副词
介词
连词
代词
感叹词
过去分词
其他
发音字典过滤器(Pronoucing Dictionary Filter)
一个或多个以下值的逗号隔开的列表:
名词
形容词
动词
其他
Alphasyllable过滤器
一个或多个以下值的逗号隔开的列表:
缩写
后缀
前缀
用连字符连接的
多词
状态过滤器(Status Filter)
一个或多个以下值的逗号隔开的表:
方言
外来的
古代的
口语的
大写的
错误的
谬论
临时造的词
废词
诗意的
罕见的
修辞的
专业的
标准
标准以下的
varientPhoneme(变体音素)
Valid Values:One of‘None’,‘B’,‘O’,‘B,O’(withough thequotes)(有效值:“None”、“B”、“O”、“B,O”中的一个(没有引号))
有关这些值的含义的更多信息,请查阅MRC2字典文档。
writtenCapitalised
Valid Values:‘True’or‘False’(without the quotes)(有效值:“真”或“假”(没有引号))
irregularPlural
有效值:“None”或者字母“Z”、“Y”、“B”、“N”、“P”的任意组合(没有引号)
有关这些值的含义的更多信息,请查阅MRC2字典文档。
以下是根据本发明示范实施例的用于rules.ini的格式说明符的列表:
Figure A20068004049600401
Bold=True
将以粗体显示匹配的词。
Figure A20068004049600402
Color=colorstring
将该词的显示颜色设置为指定的colorstring。
该colorstring可以是任何有效的HTML4颜色规范。
有效值的例子:红色、绿色、蓝色、水绿色、黑色、#ffeedd。
Delay=n
将该词的显示延迟设置为浮点值n。
通常地,对于每个x,“Delay=x”等效于“
Figure A20068004049600405
Speed=1/x”,反之亦然。
Figure A20068004049600411
Font=fontname
将使用具有给定的fontname的字体显示匹配的词。
Figure A20068004049600412
Italics=True
将以斜体风格显示匹配的词。
Figure A20068004049600413
Size=n
将以字体大小n显示匹配的词。有效值是在1和7之间。
Speed=n
将词的显示速度设置为浮点值n。
Figure A20068004049600415
Underline=True
将匹配的词显示为下划线的。
Figure A20068004049600416
Align=aligntype
指定显示窗口内的文本对准。可能的值包括:左、右、中心、对齐(justify)。
以下是根据本发明示范实施例的用于在rules.ini中[Default]中的“Additive Delay Rule(添加的延迟规则)”的有效值的列表:
rightmost(最右边)
取最右边词的延迟值。
Leftmost(最左边)
取最左边的词的延迟值。
limit:n
取在浮点值“n”和所有词的延迟的总和之间的最小数。
limit:max*n
相当于“limit x”,这里x=n*(在延迟值中的最大值)
例如,如果一组三个词的延迟列表是[2,4,5],使用“limit:max*1.5”的添加的延迟规则将相当于“limit:7.5”(5是在延迟值中的最大值,并且5*1.5=7.5)。
subtract:n2、n3、n4、...
对于长度1的延迟列表,将使用如下的添加的延迟值计算:((延迟的总和)-n1)
例如,利用“subtract:1,1.5”的添加的延迟规则
对于延迟列表[2,2.5,3],该延迟列表的长度是3,因此,该减去的值将是n3=1.5,并且计算的延迟值将是:
(2+2.5+3)-1.5=6
multiply:n2、n3、n4、...
对于长度1的延迟列表,将使用如下的添加的延迟值计算:((延迟的总和)*n1)
例如,使用“multiply:0.8,0.75,0.7”的添加的延迟规则
对于延迟列表[2,2.5,3],该延迟列表的长度是3,因此,该乘数将是n3=0.75,并且计算的延迟值将是:(2+2.5+3)*0.75=5.625。
以下是第一示范规则组。该默认规则组指定用于最小(12)和最大(16)个字母被作为一个单位显示的原则(如果这些原则不能满足,那么RSP服务器102将生成尽可能接近于这些原则的目标),指定要分配给词分组的最大添加的延迟值为与不超过具有最大显示速度的词相关的显示速度的两倍,并且指定默认字体大小为6。下一规则组指定:被确定为在“方言”类别中的词将以具有超过其他颜色应用的优先次序以黑色显示。下一规则组指定:名词将以蓝色显示,并且将被分配缺省值1的0.85倍的显示速度。下一规则组指定:动词和副词将以红色显示,并且将被分配缺省值1的1.30倍的显示速度。下一规则组指定:具有超过五个字母的词将被以黑色显示。下一规则组指定:形容词将以粗体显示,并且将被分配缺省值1的1.4倍的显示速度。最后的规则组(其具有最低的优先次序)指定:动词将被加下划线。
[default]
最小字母=12
最大字母=16
添加的延迟规则=limit:max*2
@size=6
[第一规则名称]
状态过滤器=方言
Figure A20068004049600431
Color=黑色
[第二规则名称]
词类过滤器=名词
Figure A20068004049600432
Color=蓝色
Figure A20068004049600433
Speed=0.85
[规则名称3]
词类过滤器=动词、副词
Figure A20068004049600434
Color=红色
Speed=1.30
[规则名称4]
最小字母=5
Figure A20068004049600436
color=黑色
[规则名称5]
词类过滤器=形容词
Bold=True
Figure A20068004049600442
speed=1.4
[规则名称6]
词类过滤器=动词
Figure A20068004049600443
Underline=True
因此,例如,如果以上所述的规则组被应用于词的分组“the quickfox”,词“the”将以黑色显示,并且将分配1的默认显示速度,词“quick”将以粗体显示,并且将分配1.4的显示速度(基于[规则名称5]),并且词“fox”将以蓝色显示,而且将分配0.85的显示速度(基于[第二个规则名称])。用于三个词的显示速度合计达3.25,但是,词的分组作为一个单元将被分配2.8的显示速度(即,基于[default]添加的延迟规则)2倍于最大显示速度1.4)。
以下是第二示范规则组,其中对于不同词类指定显示速度。具体地,显示速度被指定如下:名词=1.0,形容词=1.4,动词=1.3,副词=1.4,介词=1.0,连词=8,代词=9,感叹词=1.5,过去分词=1.5,其它的词以1.0显示,但是转为红色。通过将这些值调整为用户的偏好和显示的内容,这个规则组可以起用于开发用户的用户描述文件的良好基础的作用。
[第一规则名称]
词类过滤器=名词
Figure A20068004049600444
Speed=1.0
[第二规则名称]
词类过滤器=形容词
Figure A20068004049600451
Speed=1.4
[第三规则名称]
词类过滤器=动词
Figure A20068004049600452
Speed=1.3
[第四规则名称]
词类过滤器=副词
Figure A20068004049600453
Speed=1.4
[第五规则名称]
词类过滤器=介词
Figure A20068004049600454
Speed=1.0
[第六规则名称]
词类过滤器=连接词
Figure A20068004049600455
Speed=.8
Italics=True
[第七规则名称]
词类过滤器=代词
Figure A20068004049600457
Speed=.9
[第八规则名称]
词类过滤器=感叹词
Figure A20068004049600458
Speed=1.5
[第九规则名称]
词类过滤器=过去分词
Speed=1.5
[第十规则名称]
词类过滤器=其他
Figure A20068004049600462
Speed=1.0
Figure A20068004049600463
Color=红色
以下是第三示范规则组。该默认规则组指定用于在词的分组中最少(12)个字母,在词的分组中最大(16)个字母,以及默认字体大小的原则。下一规则组指定大写词将被加下划线,并且将被分配0.85的显示速度。下一规则组指定在显示窗口内文本的右对齐。下一规则组指定具有大于或等于12的“获取的年龄”值的词被分配1.5的显示速度。下一规则组指定单音节词将被以绿色斜体显示,并且将被分配0.6的显示速度。下一规则组指定在分组中第二个词延迟值将被加倍。最后的规则组指定词的分组将被分配等于单独的词显示速度的总和减去0.8的显示速度。
[default]
最小字母=12
最大字母=16
@size=6
[第一规则名称]
WrittenCapitalised=True
Figure A20068004049600464
Speed=.85
Figure A20068004049600465
Underline=True
[第二规则名称]
Figure A20068004049600466
Align=右
[第三规则名称]
最小获取年龄=12
Figure A20068004049600471
Speed=1.5
[第四规则名称]
最大音节=1
Speed=.6
Figure A20068004049600473
Color=绿色
Figure A20068004049600474
Italics=True
[第五规则名称]
添加的延迟规则=multiply:1,2,1
[第六规则名称]
添加的延迟规则=subtract:.8
以下是第四示范规则组。该默认规则组指定用于在词的分组中最小(12)个字母,在词的分组中最大(16)个字母,以及默认字体大小的原则。下一规则组指定熟悉度值大于或等于500的词被分配0.75的显示速度。下一规则组指定具有小于或等于400的具体度值的词被分配0.84的显示速度(具体度涉及用户理解内容的能力,不那么具体的词可能是“真理”,而更加具体的词是“铅笔”)。下一规则组指定熟悉度值小于或等于499的词被分配1.3的显示速度。下一规则组指定代词将被分配1.3的显示速度。最后的规则组指定处于它们的复数形式(z),单数形式(y),或者其单数和复数形式两者(b)的不规则复数将以红色的粗体显示,并且将被分配1.3的显示速度。
[Default]
最小字母=12
最大字母=16
size=10
[第一规则名称]
最小熟悉度=500
Figure A20068004049600482
Speed=.75
[第二规则名称]
最大具体度=400
Speed=.84
[第三规则名称]
最大熟悉度=499
Speed=1.3
[第四规则名称]
词类过滤器=代词
Figure A20068004049600485
Speed=1.3
[第五规则名称]
irregularplural=zyb
Bold=True
Color=红色
Figure A20068004049600488
Speed=1.3
以下是第五示范规则组。该默认规则组指定用于在词的分组中最小(12)个字母,在词的分组中最大(18)个字母,以及默认字体大小的原则。下一规则组指定具有形象度值小于或等于200的词被分配1.8的显示速度。下一规则组指定Brown言语频率值小于或等于40的词被分配1.4的显示速度。下一规则组指定Thorndike Lorge频率值大于或等于60的词被分配0.9的显示速度。下一规则组指定具有四个音节或以上的词将被分配1.6的显示速度。下一规则组指定具有词类型值“2,q”的词将以斜体显示。下一规则组指定动词将以蓝色显示。接下来两个规则组指定其特征为“谬论”或者“低于标准”的词将以红色显示。这样的规则组例如对于不熟练的语言使用者可能是有用的,其对于不经常使用的词、较长的词、很难想象的词、和具有低意义等级的词需要额外的时间。
[Default]
最小字母=12
最大字母=18
Figure A20068004049600491
size=6
[第一规则名称]
最大形象度=200
Figure A20068004049600492
Speed=1.8
[第二规则名称]
最大Brown言语频率=40
Figure A20068004049600493
Speed=1.4
[第三规则名称]
最小Thorndike Lorge频率=60
Figure A20068004049600494
Speed=.9
[第四规则名称]
最小音节=4
Figure A20068004049600495
Speed=1.6
[第五规则名称]
词类型=2,q
Figure A20068004049600501
Italics=True
[第六规则名称]
词类过滤器=动词
Figure A20068004049600502
Color=蓝色
[第七规则名称]
状态过滤器=谬论(Nonsense)
Figure A20068004049600503
Color=红色
[第八规则名称]
状态过滤器=标准以下的(substandard)
Color=红色
以下是第六示范规则组,其产生具有规则的延迟的快速序列视觉呈现,其对于每个目标是一样的,但是,在10-20个字母块内。同样地,该字体大小被指定,并且字体被指定。
最小字母=10
最大字母=20
Figure A20068004049600505
size=18
front=Times New Roman
应当注意到,在本发明的示范实施例中,显示速度(即,
Figure A20068004049600507
Speed)值是相对于1的值的,其表示由用户选择或者为用户选择的额定的显示速度。例如,如果
Figure A20068004049600508
Speed=0.85,那么该显示速度将是额定的显示速度的85%;如果
Figure A20068004049600509
Speed=1.25,那么该显示速度将是额定的显示速度的125%。
在本发明的示范实施例中,规则组是“可以插入的”,使得RSP发生器102实质上将所选择的规则组插入进该逻辑,并且应用指定的规则。
应当注意到,用于如上所述的规则组的过滤器、区分符(specifier)和整个语法仅仅是示范性的。本发明并不限于任何特定的类型或形式的过滤器、过滤器值、区分符、区分符值、语法、或者其它的规则组规范。因此,例如,可以包括额外的结构来指定精确值或者值的范围,而不是最小值和最大值(例如,可以具有用于“具体度=n”和/或“具体度=[n1,n2]”的结构,这里n1是范围的下限而n2是该范围的上限,而不是“最小具体度”和“最大具体度”,或者除了“最小具体度”和“最大具体度”之外还可以具有)。此外,可以定义多种机制以用于隐含地或者明确地定义在各种规则之中的优先次序。
编辑工具
编辑工具可用于生成或者修改快速序列呈现。为了生成快速序列呈现,编辑工具通常将内容解析为词语的序列,并且将每个词语与默认特征组相关联。该词语被呈现给该用户,并且用户被赋予改变所述呈现的多种特征的能力,诸如,词的分组和显示特性。用户还被赋予将额外的目标增加到该呈现的能力,例如,音频分量、视频分量、图像分量、触觉分量或者空白屏。类似地,在产生目标和相应描述符的序列之后,可以将该编辑工具呈现给该用户,以便给该用户提供手动地编辑该呈现的机会。
语音到文字
Wong所著的“Visible Language Workshop”论文作为参考资料整体结合在此处,其论述了作为书面语言的扩展的文本的动态可视处理。Wong将“排印”定义为用于丰富的视觉通信的书面语言的可视处理。Wong认识到,可以通过排印形式(例如,字样、字重(weight)、颜色)的处理输送的情感质量和语音音调的范围,并且还认识到,通过允许排印形式根据作者的表达或者读者的实时互动来动态地改变大小、颜色和位置,电子介质扩展表达的可能性。描述了称作“exPress”的软件工具和相关的脚本语言(scripting language),其允许操纵排印的属性,诸如,大小、权重、位置、透明度、颜色、动态排印变化(例如,词在大小方面增长或者随着时间而移动)。该exPress工具允许控制呈现信息的速度,使得例如二个语音音调可以使用不同的节奏在视觉上地表示。
理论上,Wong的exPress工具允许用户生成RSVP,其模拟文字将被用言辞表达的方式。但是,在实践中,产生这样的RSVP是很难的。因此,在本发明的某些实施例中,读取并记录文本内容,分析记录的阅读以识别言语特征(例如,语音变化,词间断,分贝强度,和音节重音),该文本内容被解析为词的序列,并且使用该言语特征从这些词产生目标和相应的标签的序列,使得目标的快速序列视觉呈现将至少部分地模拟该言语特征。在某些情况下,作为轻松的阅读体验,人们口头上比可以在视觉上感知的更快地念词。对于过短的词,RSP服务器102通常将调整视觉呈现的速度,以在快速序列呈现中补充阅读过程。
这种文本到语音技术的一种可能的应用是用于将言语消息(例如,语音邮件)转换为用于便携式用户设备的文本消息。
图9是根据本发明示范实施例的用于文字到语音的逻辑流程图。在模块902中,记录内容的阅读。在模块904中,记录的阅读被分析以识别言语特征。在模块906中,该内容被解析为词语的序列。在模块908中,使用言语特征产生目标和相应描述符的序列,使得该目标的快速序列视觉呈现将至少部分地模拟该言语特征。
生物反馈
Akervall所著的“Smart Bailando Eye controlled RSVP on handhelds(2002)”作为参考资料结合在上面,其公开了一种部分地由眼睛位置控制的RSVP播放器。一对照像机监视用户的面部和眼睛的位置,并且基于眼球运动动态地控制RSVP呈现。例如,如果用户从屏幕转移目光,可以临时地降低文字呈现的速度。如在该文章中论述的,监视眼睛位置可能是很难的,因为其依靠两个照像机,并且也在很大程度上依靠用户保持固定不动。虽然一些用户设备包括单个照像机,但极少数(如果有的话)包括两个照像机,并且由于空间和成本约束两者,将两个照像机结合进大多数的用户设备中通常是不实际的。因此,眼睛控制RSVP呈现是不实际的。
因此,在本发明的某些实施例中,将生理传感器结合进用户设备中。该生理传感器可用于监视该用户的潜在的生理情况,诸如,心率、血流、脑波、电信号、皮肤电反应、呼吸、体温和其它潜在的生理情况。分析该生理情况以推断用户关于关于该呈现的情绪状态。该生理情况和/或有关该推断的情绪状态的信息可以由用户设备108在本地使用,以动态地调整该诚信,和/或可以发送回RSP服务器102,供在产生用于该用户后续的呈现中使用。
在一个示范实施例中,该生理传感器可以包括红外线换能器,该用户将手指放置在其上。该红外线换能器典型地放置在用户的一个手指在用户设备(例如,当持有蜂窝电话或者PDA时)的正常操作期间通常地放置的位置上。该红外线换能器可用于监视用户的心率、血流等等。做为替换,或者另外地,该传感器可以包括一个或多个用于产生和/或测量电信号的电极,诸如用于测量用户的皮肤电反应。做为替换,或者另外地,该传感器可以包括用于监视从用户发出的脑波或者其它的电磁活动的天线。做为替换,或者另外地,该传感器可以包括用于测量用户的体温的温度计。
图10是根据本发明示范实施例的用于生物反馈的逻辑流程图。在模块1002中,在用户设备上根据相应的描述符输出所述目标。在模块1004中,同时地,监视该用户的潜在的生理情况。在模块1006中,分析该潜在的生理情况以推断用户关于该快速序列呈现的情绪状态。在模块1008中,基于推断的用户的情绪状态动态地调整后续的目标的输出。在模块1010中,与潜在的生理情况有关的反馈信息可以传送给该呈现服务器,供在产生用于该用户的后续的快速序列呈现中使用。
嵌入在浏览器中的RSVP播放器
在本发明的某些实施例中,RSP播放器被嵌入在网络浏览器中。在这样的实施例中,用户通常使用网络浏览器去查找所关心的信息。该用户然后可以使用RSP突出显示显示该部分,然后右击去访问RSP控制屏幕,或者点击菜单栏上的预览按钮,这里小的RSVP目标位置将显示文本和额外的按钮,其将RSVP处理为大屏幕或者全屏幕观看。RSP播放器可以类似地与其它的应用程序集成,诸如字处理器。该RSP播放器可以将音频分量、视频分量、图像分量或者触觉分量增加给该呈现。该集成的RSP播放器可以包括这样的机制,通过其用户可以在快速序列呈现和传统的文本显示模式之间转换。
嵌入的广告
由于移动设备逐渐地变为更加普遍,用于这些移动设备的内容的销售也已经变为更加普遍。移动设备的主要的限制之一是其屏幕大小。屏幕大小的限制对于设法使其广告在移动设备上观看的广告者而言是一种阻碍。本发明的实施例通过将广告结合进快速序列呈现中可以提供通向这个目前尚未开发的在移动设备上作广告的市场的入口。例如,在该快速序列呈现的开始可以包括许多的广告。对于快速序列呈现向用户收费的价格可以根据用户乐意观看的广告的数目而定。例如,如果用户不愿意观看广告,则可能全价收费,而对于增加的广告的数目则可能提高折扣。可以提供多种机制以确保用户实际观看了广告,例如通过要求用户在广告之后预定的时间量内采取动作(例如,点击鼠标)。
结论
虽然RSP是着眼于小屏幕用户设备开发的,但本发明不局限于这样的应用,并且如下所述的RSP技术同样可以应用于较大屏幕设备,这尤其对于具有减退的视力、诵读困难、无学习能力和其它情形的人们可能是有用的。
应当注意到,在此使用了逻辑流程图来论证本发明的各方面,并且这不应该被解释为将本发明限制于任何特定的逻辑流程或逻辑实施方案。所描述的逻辑可以被分为不同的逻辑块(例如,程序、模块、功能或者子例程)而不改变整个结果或者脱离本发明的实际的范围。经常地,逻辑单元可以以不同顺序增加、修改、省略、执行,或者使用不同的逻辑结构实现(例如,逻辑门、循环基元(looping primitives)、条件逻辑和其它的逻辑结构),而不改变整个结果或者脱离本发明的实际的范围。
本发明可以以许多不同的形式实现,包括,但是决不限于,与处理器(例如,微处理器、微型控制器、数字信号处理器或者通用计算机)使用的计算机程序逻辑,与可编程序逻辑设备(例如,现场可编程门阵列(FPGA)或者其它PLD)使用的可编程逻辑,分立元件,集成电路(例如,专用集成电路(ASIC)),或者包括其任何组合的任何其它装置。在本发明的典型的实施例中,RSP发生器204和RSP播放器504被利用JDK1.5.0.6以Java实现。
实现先前在此描述的功能性的所有或者一部分的计算机程序逻辑可以以各种形式实现,包括,但是决不限于,源代码形式、计算机可执行形式,和各种中间形式(例如,由汇编器、编译器、链接器或者定位器产生的形式)。源代码可以包括以与各种操作系统或者操作环境一起使用的各种编程语言(例如,目标代码(object code)、汇编语言,或者高级语言,诸如,Fortran,C,C++,JAVA,或HTML)的任何一个实现的一系列的计算机程序命令。该源代码可以定义和使用各种数据结构和通信消息。该源代码可以是以计算机可执行形式(例如,经由解译器),或者该源代码可以被转换(例如,经由翻译器、汇编器或者编译器)为计算机可执行形式。
该计算机程序可以以任何形式(例如,源代码形式、计算机可执行形式,或者中间形式)或者永久地或者短暂地安装在实体的存储介质中,诸如,半导体存储器设备(例如,RAM、ROM、PROM、EEPROM,或者闪速可编程RAM),磁存储器设备(例如,磁盘或者硬盘),光存储器设备(例如,CD-ROM),PC卡(例如,PCMCIA卡),或者其它存储设备。该计算机程序可以以任何形式置于可使用各种通信技术的任何一种发送给计算机的信号中,所述通信技术包括,但是决不限于,模拟技术、数字技术、光学技术、无线技术(例如,蓝牙)、联网技术和网际互连技术。该计算机程序可以以任何形式分发,如带有伴随的打印或者电子文档的可移动存储介质(例如,收缩包装的软件),随计算机系统预加载(例如,在系统ROM或者硬盘上),或者经通信系统(例如,因特网或者万维网)从服务器或者电子公告板分发。
实现在此先前描述的功能性的全部或者部分的硬件逻辑(包括与可编程序逻辑设备一起使用的可编程逻辑)可以使用传统的手工方法设计,或者可以使用各种工具电子地设计、捕获、模拟、或者归档,所述工具诸如计算机辅助设计(CAD)、硬件描述语言(例如,VHDL或者AHDL),或者PLD程序语言(例如,PALASM,ABEL或者CUPL)。
可编程逻辑可以永久地或者短暂地安装在实体存储介质中,诸如,半导体存储器设备(例如,RAM、ROM、PROM、EEPROM,或者闪速可编程RAM),磁存储器设备(例如,磁盘或者硬盘),光存储器设备(例如,CD-ROM),或者其它存储设备。该可编程逻辑可以置于可使用各种通信技术的任何一个发送给计算机的信号中,所述通信技术包括,但是决不限于,模拟技术、数字技术、光技术、无线技术(例如,蓝牙)、联网技术和网际互连技术。该可编程逻辑可以以任何形式分发,如带有伴随的打印或者电子文档的可移动存储介质(例如,收缩包装的软件),随计算机系统预加载(例如,在系统ROM或者硬盘上),或者经通信系统(例如,因特网或者万维网)从服务器或者电子公告板分发。
本发明可以以其他特定的形式实施而不脱离本发明的实际范围。所描述的实施例在各方面都被认为仅是说明性的而不是限制性的。
附录A
MRC心理语言学数据库:机器可用字典,版本2.00
信息分类科学和工程研究理事会Rutherford Appleton实验室Chilton,Didcot,Oxon,OX11 0QX Michael Wilson,1987年4月1日
                                                          
MRC机器可用字典。版本2.00
MRC心理语言学数据库版本1被作为在线服务提供(参见Coltheart,1981b)。该服务利用三个文件和若干访问程序。第一个文件是词典,第二个和第三个文件是来自爱丁堡辞典(Edinburgh Thesaurus)的词联想标准的集合。该服务现已中断。
第二版本的MRC心理语言学数据库正在作为计算机可用资源而不是作为服务提供。来自该数据库的字典文件的更新的版本(在这里称为MRC2.DCT)正在被与一些程序一起提供用于公共研究应用,该程序可以访问该字典或者作为模拟匹配用户特定的需要的程序例子使用。这个数据库字典不同于其它的机器可用字典之处在于,其不仅包括语法信息,而且还包括用于条目的心理学数据(参见Amsler,1984,对其他机器可读字典的综述)。其也不同于最常规的字典,不同之处在于其不是试图现时提供任何的语义信息。其被设计成对心理语言学家在选择用于测试的激励材料方面是有用处的;供研究人员在人工智能方面作为自然语言处理和认知模拟需要的信息源使用;和供想要在文本处理器的设计中使用词的列表和语法信息的计算机科学家使用。
该MRC心理语言学数据库:机器可用字典和应用程序,可以从Oxford Text Archive获得用于研究目的,其列表上1054项,需付标定的费用以涵盖处理成本。其地址是:
Oxford Text Archive(牛津大学文本档案)
Oxford University Computing Service(牛津大学计算业务)
13Banbury Road,
Oxford OX2 6NN
U.K.
电话:Oxford(0865)56721
JANET电子邮件地址:ARCHIVE@UK.AC.OX.VAX3。
                                                     
机器可用字典文件。
该文件包含150837个词,并且提供有关大约26个不同语言特性的信息,尽管并非对于150837个词的每个有关每个特性的信息都是可用的:例如,还没有人收集关于这样的大型词集合的形象度等级(imagery rating),并因而仅仅9240个词拥有形象度等级。
该字典文件不包含对于它是原创(original)的任何信息,但却是通过合并有限利用率的许多小的数据库而汇编成的:
●Dolby,Resnikoff和MacMurray的磁带字典(1963),其是通过与取来自Shorter Oxford Englsih Dictionary所有左对准的粗体字样的词以及由该字典给出的词类而产生的。此外,词是取自Cornell大学具有20,000个通常使用的词的磁带,并且用于所有这些词的词类在Webster’s New International Dictionary的第三版中找到。
●Edinburgh Associative Thesaurus(Kiss,Armstrong,Milroy和Piper,1973);
●Colerado Norms(Toglia和Battig,1978);
●Pavio Norms(未出版,这些是Pavio、Yuille和Madigan标准的扩展,1968);
●Gilhooly-Logie norms(Gilhooly和Logie,1980);
●Kucera-Francis written frequency count(书写频数)(Kucera和Francis,1967);
●Thorndike-Lorge书写频数(Thorndike和Lorge,1944;L计数);
●来自Daniel Jones’Pronouncing Dictionary of English Language的音标法,第12版(参见Guierre,1966)。
●来自Oxford Advanced Learner’s Dictionary(Mitton,1986)的机器可用版本的2500个固有名称,其被增加到该字典的出版的版本中,并且未被牛津大学出版社所持有的版权覆盖。
●来自London-Lund Corpus of English Conversation的用于英语口语的频数(Svartvik和Quirk,1980;Brown,1984)。
该字典文件通常地占用11兆字节作为连续的纯文本文件。该文件的每行表示用于一个词的字段。最长的条目是130个字符;例如
040320021615167000000093057530228435500000 JJ SABLE|eI/bl|eIbl|20
该字典文件的构成在表1中进行了概括,其指定在条目中描述的语言学参数。表1的第一列表示在包含该数据的文件中的列/字段。最后的四个参数被保持在由|字符分隔的可变长度字段中。第二列表示在程序和文档中的其它地方使用的数据字段的名称。第三列指定语言学特性的标识,而第四列表示在该数据库中有关特定的语言学特性的信息是可用的词的数目。最初的十四个特性被作为数值存储在文件中。对于这些特性,出现计数(occurrence count)指的是非零条目的数目。
表1.字典文件
  列   名称   特性   出现
  1-2   NLET   在该词中字母的数目   150837
  3-4   NPHON   在该词中音素的数目   38438
  5   NSYL   在该词中音节的数目   89402
  6-10   K-F-FREQ   Kucera和Francis书写频率   29778
  11-12   K-F-NCATS   Kucera和Francis种类的数目   29778
  13-15   K-F-NSAMP   Kucera和Francis样本数   29778
  16-21   T-L-FREQ   Thorndike-Lorge频率   25308
  22-25   BROWN-FREQ   Brown言语频率   14529
  26-28   FAM   熟悉度   9392
  29-31   CONC   具体度   8228
  32-34   IMAG   形象度   9240
  35-37   MEANC   Mean Colerado Meaningfulness   5450
  38-40   MEANP   Mean Pavio Meaningfulness   1504
  41-43   AOA   获取的年龄   3503
  44   TQ2   类型   44976
  45   WTYPE   词类   150769
  46   PDWTYPEPD   词类   38390
  47   ALPHSYL   Alphasyllable   15938
  48   STATUS   状态   89550
  49   VAR   Varient Phoneme(变体音素)   1445
  50   CAP   Written Capitalised(大写)   4585
  51   IRREG   Irregular Plural(不规则复数)   23111
  |   WORD   The actual word(实体词)   150837
  |   PHON   Phonetic Transcription(音标)   38420
  |   DPHON   Edited Phonetic Transcription(编辑的音标)   136982
  |   STRESS   Stress Pattern(重音模式)   38390
在表1中列出的一些参数是显而易见的,其它需要解释如下:
NLET
在表2中示出WORD字段中按照它们包含的字母的数目的条目的分布。
表2.由NLET给出的词长的分布
  出现的数目   NLET
  31   1
  168   2
  1342   3
  4719   4
  10199   5
  16818   6
  21118   7
  22302   8
  20426   9
  16409   10
  11697   11
  7566   12
  4451   13
  2342   14
  1158   15
  479   16
  250   17
  81   18
  32   19
  14   20
  4   21
  1   22
  2   23
NPHON
在表3中示出在WORD字段中按照它们包含的音素的数目的条目的分布。
NSYL
在表4中示出在WORD字段中按照它们包含的音节的数目的条目的分布。
K-F-FREQ,K-F-NCATS,K-F-NSAMP
这些的第一个涉及在以Kucera和Francis的标准(1967)给出的词的出现频率。在该文件中最大频率是69971,最小值是0。K-F-NCATS和K-F-NSAMP的含义由Kucera和Francis定义(1967)。
表3.由NPHON给出的音素计数的分布
  出现的数目  NPHON
  109060   0
  32   1
  276   2
  1442   3
  3396   4
  4561   5
  4985   6
  4691   7
  4199   8
  3317   9
  2429   10
  1536   11
  862   12
  450   13
  206   14
  110   15
  42   16
  9   17
  3   18
  3   19
表4.由NSYL给出的音节计数的分布
  出现的数目   NSYL
  58081   0
  12485   1
  32837   2
  27751   3
  14159   4
  4530   5
  856   6
  134   7
  14   8
  1   9
T-L-FREQL
这是作为以Thorndike和Lorge的L计数(1942)给出的出现频率。如果你计划使用这个频数,建议你阅读在Thorndike-Lorge书中有关其的细节。例如,具有规则复数的单数词的频率值包括复数形式的频率,并且对于其他种类的派生来说也是如此。
BROWN-FREQ
这代表在由Brown从London-Lund Corpus of English Conversation中推导出的口语(1984)中的出现频率。在WORD字段中对于8985个不同的串存在14529个条目。这些条目的范围是0-6833,具有35的平均值和252的标准偏差。
FAM
这代表“printed familiarity(排印的熟悉度)”。该FAM值源自于合并三个组熟悉度标准:Pavio(未出版),Toglia和Battig(1978)以及Gilhooly和Logie(1980)。通过在MRC心理语言学数据库用户手册(Coltheart,1981a)的附录2中详细描述了合并这三组标准的方法。这个方法可能不会受到所有人的认可。FAM值处于100至700的范围,最大输入657,平均值488,以及标准偏差99:注意,它们是整数值(在原始标准中,等效范围是1.00至7.00)。
CONC
这是具体度,并且其也源自于Pavio、Colerado和Gilhooly-Logie标准的合并:合并的细节在MRC心理语言学数据库用户手册(Coltheart,1981a)的附录2中给出。CONC值是在范围100至700中的整数(最小:158;最大670;平均438;s.d.120)。
IMAG
这是形象度,是从以上涉及的三组标准的合并中导出的,并且具有在范围100至700中的值(最小129;最大669;平均450;s.d.108)。
MEANC
这些是来自Toglia和Battig(1978)的意义等级,乘以100以产生从100至700的范围(最小127;最大667;平均值415;s.d.78)。
MEANP
这是来自Pavio标准(未出版)的意义度,乘以100以产生从100至700的范围。该两组意义等级没有被合并,因为其相关性低(仅仅+.529),并且用于两组标准所共有的一组词的平均值是非常地低的(参见Toglia和Battig,1978,表2)。
这些区别是由于在对主语的指令方面的差别(differences in theinstruction to subjects)。因此,两组意义等级是不可比的,从而保持分开(最小192;最大922;平均600;s.d.107)。
AOA
这是来自Gilhooly和Logie的标准(1980)的获取年龄,其乘以100以产生从100至700的范围(最小125;最大697;平均值405;s.d.120)。
TQ2
当TQ2具有值Q(40810次出现)的时候,这个词是另一个词派生的变体。
WTYPE
这是如在由Dolby、Resnikoff和MacMurray汇编的SOED数据库(1963)中表示的语法分类。存在如表5所示编码的十个不同的语法类别。
表5.用于WTYPE的语法分类代码
  语法分类   代码   发生
  名词   N   77355
  形容词   J   25547
  动词   V   30725
  副词   A   4243
  介词   R   230
  连接词  C   108
  代词  U   134
  感叹词  I   352
  过去分词  P   5939
  其他  O   6136
PDWTYPE
当你对语法类别感兴趣的时候,WTYPE有时可能不是令人满意的。例如,词FREEZE和HARASS根据WTYPE是名词(以及动词),并且实际上当在SOED或者Webster’s中查它们的时候,它们被描述为名词。如果你想要避免这样深奥的用法时,PDWTYPE可能是有用的。其指的是在Jone’s Pronoucing Dictionary(Jones,1963)中给出的语法类别,并且不考虑词的非常罕见的使用。但是,PDWTYPE仅仅使用四个类别,不是十个:这四个是名词(N,22061次出现),动词(V,6333次出现),形容词(J,8817次出现)及其他(O,1179次出现)。从WTYPE到PDWTYPE的映射在表6中示出。
表6.从WTYPE到PDWTYPE的映射
  发生  WTYPE   PDWTYPE
  3751   A
  492   A   O
  47   C
  61   C   O
  261   I
  91   I   O
  16730   J
  8817   J   J
  55294  N
  22061  N  N
  5785  O
  351  O  O
  5939  P
  115  R
  115  R  O
  65  U
  69  U  O
  24392  V
  6333  V  V
ALPHSYL
如果这个=A,那么该词是缩略语(130次出现);如果是S,该词是后缀(282次出现);如果是P,则是前缀(1374次出现);如果是H,该词是以连字符连接的(13716次出现);如果是T,则是多个词的短语单元(436次出现)。对于所有这些类别,NSYL=0。对于所有其它的词,ALPHYSL为空(blank)。
STATUS
STATUS的15个可能的类别在表7中列出;这些是在从ShorterOxford English Dictionary推导出的Dolby数据库(Dolby等人,1963)中给出的,并且细读表7将使这些类别的含义充分清楚。
表7.STATUS的可能值
  词的状态   代码  发生
  方言   D  2780
  外来的   F  6003
  古代的   A  959
  口语的   Q  405
  大写的   C  2
  错误的   N  0
  谬论   E  62
  临时造的词   W  33
  废词   O  10549
  诗意的   P  183
  罕见的   R  2756
  修辞的   H  22
  专业的   $  7731
  标准   S  58065
  标准以下的   Z  0
VAR
这指的是具有相同的拼写但是具有不同的发音和语法分类的词。当发音仅仅在重音不同(例如,反对,侮辱)的时候,VAR=O(212次出现)。当发音在音素上不同(例如,温和,辱骂)的时候,VAR=B(1233次出现)。
CAP
如果这=C,那么该词被以字首大写地正常书写。这可以用作专有名词的指示符,诸如人、城镇、州和国家的名称。
IRREG
这涉及词的复数。在IRREG=Z的情况下,该词是复数(17441次出现),这可以与TQ2结合使用以选择不规则形式;在IRREG=Y的情况下,该词是单数形式(1024次出现);在IRREG=B的情况下,该词是单数和复数形式两者(151次出现);在IRREG=N的情况下,该词没有复数形式(4407次出现);在IRREG=P的情况下,该词是复数但当作单数(88次出现)。
WORD
该字典是通过这些串的ascii序列排序的。虽然在该字典中存在150837个词条,但仅仅存在115331个不同的串(string)。同形异义词的分布如下:
  条目数   词数
  1   94225
  2   22132
  3   2967
  4   703
  5   96
  6   20
  7   5
PHON和DPHON
第12版的Daniel Jones’s Pronoucing Dictionary(Jones,1963)由L.Guierre教授转换到磁带(Guierre,1966)。这些在PHON字段中用作音标的基础。在这个磁带上使用的音标符号(phonetic symbols)被根据来自Roger Mitton(参见Mitton,1986)的建议调整,以遵循用于机器可读音标的英国Alvey标准(Wells,1986)。在来自由Quinlan(1986)生成的Coltheart(1981a)使用的音标符号方面的变化包括:使浊音变清音的辅音已经被叠入其浊音的等效(voiced equivalent);Coltheart(1981a)涉及符号3,其已经被丢弃(ditched)因为没有发现有出现;I(和U(已经被分别地映射为I和U。目前在PHON字段中使用的符号是“/”字符,以表示音节边界,以及表8之中所呈现的那些,在可排印的情况下其具有国际音标字母等效。该DPHON字段使用这些符号而没有音节区别符,但是,包括跟随该音标的TQ2符号。DPHON还包括以下三种字符:-+R。连字符用来在以连字符连接的拼写中表示连字符。“R”字符用于表示在以连字符连接的词(hyphenated words)的第一部分中最后的R,其仅在以连字符连接的词的第二部分以元音开始的情况下是发声的。“+”标记用于表示在没有空格(由ALPHSYL=T表示的)或者连字符(由ALPHSYL=H表示的)书写的合成名词的两个部分之间的分隔。
表8.字典中使用的音标符号
Figure A20068004049600711
参考资料
Amsler,R.A.(1984)。Machine-Readable Dictionaries(机器可读字典)。在M.E.Williams(Ed.)中,Annual Review of Information Science andTechnology(ARIST),19,161-209。American Society for InformationScience(ASIS);Knowledge Industry Publications,Inc.。
Brown,G.D.A.(1984)。A frequency count of 190,000 words in theLondon-Lund Corpus of English Conversation.Behavioural ResearchMethods Instrumentation and Computers,16(b),502-332。
Coltheart,M.(1981a)。The MRC Psycholinguistic Database:Version1(MRC心理语言学数据库用户手册:版本1)。[这是现在很难找到“内部”产品。MikeWilson已经在线提供OCR抄本]。
Coltheart,M.(1981b)。The MRC Psycholinguistic Database(MRC心理语言学数据库)。Quarterly Journal of Experimental Psychology(实验心理学季刊),33A,497-505。
Dolby,J.L,Resnikoff,H.L.和MacMurray,F.L.(1963)。A tapedictionary for linguistic experiments(用于语言学实验的磁带字典).InProceedings of American Federation of information processing societies:Fall Joint Computer Conferences,卷24。Baltimore,MD:Spartan Books,419-23。
Gilhooly,KJ.和Logie,R.H.(1980)。Age of acquisition,imagery,concreteness,familiarity and ambiguity measures for 1944 words.Behaviour Research Methods and Instrumentation,12,395-427。
Guierre,L.(1966).Un codage des mots anglais en vue de l′analyseautomatique de leur structure phonetique.Etudes de linguistique appliquee,4,48-64.
Kiss,G.R.,Armstrong,C,Milroy,R.and Piper,J(1973).Anassociative thesaurus of English and its computer analysis.In Aitkin,A.J.,Bailey,R.W.,and Hamilton-Smith,N.(Eds.),The computer and LiteraryStudies.Edinburgh:University Press.
Kucera and Francis,W.N.(1967).Computational Analysis ofPresent-Day American English.Providence:Brown University Press.
Mitton,R.(1986).A description of the files CUVOALD.DAT andCUV2.DAT.The machine usable form of the Oxford Advanced Learner′sDictionary.The Oxford Text Archive:Oxford,U.K.
Pavio,A.,Yuille,J.C .and Madigan,S.A.(1968).Concreteness,imagery and meaningfulness values for 925 words.Journal ofExperimental Psychology Monograph Supplement,76(3,part2).
Quinlan,P.(1986).Description of machine-readable dictionaryfiles.Report.Dept.Of Psychology,Birkbeck College,London.
Svartik,J.And Quirk,R.(1980).A Corpus of English Conversation.Lund:Gleerup.
Thorndike,E.L.and Lorge,I.(1944).The Teacher′s Word Book of30,000 Words.New York:Teachers College,Columbia University.
Toglia,M.P.and Battig,W.R.(1978).Handbook of Semantic WordNorms.New York:Erlbaum.
Wells,J.W.(1986).A standardised machine-readable phonetic notation.In Proceedings of the IEE conference on speech input/output:techniquesand applications.London,Easter 1986.
Contents of file mrcs2.doc(distributed with MRC PsycholinguisticDatabase)Edited/Hyperized March 6 1997,Craig Clark,UWA Psychology
Web Manager/mrc2.html/web(@),psy.uwa.edu.au

Claims (45)

1.一种使用快速序列呈现技术传送电子信息内容给用户的方法,该内容以词语的序列为特征,该方法包括:
保持多个规则组,规则组的每一个定义用于至少部分地基于所述词语的属性产生用于所述词语的快速序列呈现的目标和描述符的规则,每个规则组被定制用于特定的用户和特定类型的内容的至少其一;
基于用户规范和内容类型的至少一个,从所述多个规则组之中选择规则组;
访问字典以获得与至少一些所述词语相关的量化的属性;和
使用所选择的规则组和从字典中获得的量化的属性,产生用于所述词语的快速序列呈现的目标和相应描述符的序列,所述描述符定义用于在展现快速序列呈现期间输出目标的特征。
2.根据权利要求1的方法,其中每个目标包括以下的至少一个:
单个词语;
一组词语;
音频分量;
视频分量;
图像分量;和
触觉分量。
3.根据权利要求1的方法,其中基于内容的类型选择规则组包括:
基于由用户提供的搜索词语和内容的分析的至少一个确定内容的类型;和
基于所确定的内容的类型选择规则组。
4.根据权利要求1的方法,其中基于用户选择来选择规则组包括以下的至少一个:
基于用户描述文件选择规则组;和
接收标识所选择的规则组的、来自用户的输入。
5.根据权利要求1的方法,其中从字典中获得的属性包括用于至少一些词语的心理语言学属性。
6.根据权利要求1的方法,进一步包括:
基于用户选择和内容类型的至少一个,从多个字典之中选择字典,其中所述字典的每一个被定制用于特定的用户和特定类型的内容的至少一个。
7.根据权利要求6的方法,其中基于内容的类型选择字典包括:
基于由用户提供的搜索词语和内容的分析的至少一个确定内容的类型;和
基于所确定的内容的类型选择字典。
8.根据权利要求6的方法,其中基于用户选择来选择字典包括以下的至少一个:
基于用户描述文件选择字典;和
接收标识所选择的字典的、来自用户的输入。
9.根据权利要求1的方法,其中产生目标和相应描述符的序列进一步包括:
对于语法和语义的至少一个分析内容;和
至少部分地基于该分析产生所述目标和相应描述符的序列。
10.根据权利要求1的方法,其中产生目标和相应描述符的序列进一步包括:
至少部分地基于用户描述文件产生所述目标和相应描述符的序列,所述用户描述文件包括由用户提供的偏好信息和表征用户对快速序列呈现的体验的反馈信息中的至少一个。
11.根据权利要求10的方法,其中所述反馈信息包括以下的至少一个:
与在展现快速序列呈现期间监视的用户的潜在的生理情况有关的信息;和
与在展现快速序列呈现期间的用户输入有关的信息。
12.根据权利要求1的方法,进一步包括:
提供编辑工具,该编辑工具使得用户能够修改所述目标和相应描述符的序列,所述修改包括以下的至少一个:
将多个目标转换为单个目标;
将单个目标转换为多个独立的目标;
定义用于输出目标的特征;
插入附加的目标;和
除去目标。
13.根据权利要求1的方法,进一步包括:
在快速序列呈现开始处包括多个广告,广告的数目按照对于快速序列呈现向用户收费的价格来选择。
14.根据权利要求1的方法,其中产生所述目标和相应描述符包括:
基于用于快速序列呈现的背景确定将内容的不同部分传送给用户的顺序;和
至少部分地基于所确定的顺序和背景产生所述目标和相应描述符。
15.一种使用快速序列呈现技术传送电子信息内容给用户的方法,该内容以词语的序列为特征,该方法包括:
访问字典以获得与至少一些词语相关的心理语言学属性;和
使用所述相关的心理语言学属性产生用于词语的快速序列呈现的目标和相应描述符的序列,所述描述符定义用于在展现快速序列呈现期间输出目标的特征。
16.根据权利要求15的方法,进一步包括:
基于用户选择和内容类型的至少一个从多个字典之中选择字典,其中所述字典的每一个被定制用于特定的用户和特定类型的内容的至少一个。
17.根据权利要求16的方法,其中基于内容的类型选择字典包括:
基于由用户提供的搜索词语和内容的分析中的至少一个确定内容的类型;和
基于所确定的内容的类型选择字典。
18.根据权利要求16的方法,其中基于用户选择来选择字典包括以下的至少一个:
基于用户描述文件选择字典;和
接收标识所选择的字典的、来自用户的输入。
19.一种使用快速序列呈现技术传送电子信息内容给用户的方法,该内容以词语的序列为特征,该方法包括:
保持多个规则组,规则组的每一个定义用于产生用于所述词语的快速序列呈现的目标和描述符的规则,每个规则组被定制用于特定的用户和特定类型的内容的至少一个;
基于用户规范和内容类型的至少一个从所述多个规则组之中选择规则组;和
使用所选择的规则组,产生用于所述词语的快速序列呈现的目标和相应描述符的序列,所述描述符定义用于在展现快速序列呈现期间输出目标的特征。
20.根据权利要求19的方法,其中基于内容的类型选择规则组包括:
基于由用户提供的搜索词语和内容的分析的至少一个确定内容的类型;和
基于所确定的内容的类型选择规则组。
21.根据权利要求19的方法,其中基于用户选择来选择规则组包括以下的至少一个:
基于用户描述文件选择规则组;和
接收标识所选择的规则组的、来自用户的输入。
22.用于产生电子信息内容的快速序列呈现的装置,该内容以词语的序列为特征,该装置包括:
网络接口,用于允许经通信网络通信;
数据库,用于存储多个规则组,规则组的每一个定义用于至少部分地基于所述词语的属性产生用于词语的快速序列呈现的目标和描述符的规则,每个规则组被定制用于特定的用户和特定类型的内容的至少一个;和
呈现发生器,其与所述数据库和网络接口通信,用于产生所述快速序列呈现,该呈现发生器被配置来:基于用户规范和内容类型的至少一个,从所述多个规则组之中选择规则组;访问字典以获得与至少一些词语相关的量化的属性;和使用所选择的规则组和从字典中获得的量化的属性,产生用于所述词语的快速序列呈现的目标和相应描述符的序列,所述描述符定义用于在展现快速序列呈现期间输出目标的特征。
23.根据权利要求22的装置,其中所述字典存储在所述数据库中。
24.根据权利要求22的装置,其中经由网络接口经通信网络访问所述字典。
25.根据权利要求22的装置,其中每个目标包括以下的至少一个:
单个词语;
一组词语;
音频分量;
视频分量;
图像分量;和
触觉分量。
26.根据权利要求22的装置,其中从字典中获得的属性包括用于至少一些词语的心理语言学属性。
27.根据权利要求22的装置,其中所述呈现发生器被配置来基于用户选择和内容类型的至少一个从多个字典之中选择字典,其中所述字典的每一个被定制用于特定的用户和特定类型的内容的至少一个。
28.根据权利要求22的装置,其中所述呈现发生器被配置来对于语法和语义的至少一个分析内容,和至少部分地基于该分析产生所述目标和相应描述符的序列。
29.根据权利要求22的装置,其中所述呈现发生器被配置来至少部分地基于用户描述文件产生所述目标和相应描述符的序列,所述用户描述文件包括由用户提供的偏好信息和表征用户对快速序列呈现的体验的反馈信息的至少一个。
30.根据权利要求29的装置,其中所述用户描述文件被存储在所述数据库中。
31.根据权利要求22的装置,进一步包括:
网络服务器,其与数据库、网络接口和呈现发生器通信,用于以下的至少其一:经由网络接口获得内容,经由网络接口传送所述快速序列呈现到用户设备,和配置呈现发生器。
32.根据权利要求22的装置,进一步包括:
编辑工具,用于使用户能够改变所述目标和相应描述符的序列,该修改包括以下的至少一个:
将多个目标转换为单个目标;
将单个目标转换为多个独立的目标;
定义用于输出目标的特征;
插入附加的目标;和
除去目标。
33.一种将快速序列呈现展现给用户的方法,该快速序列呈现包括目标和相应描述符的序列,该方法包括:
根据相应的描述符在用户设备上输出目标;
与该输出同时地监视用户的潜在的生理情况;
分析所述潜在的生理情况以推断用户对于快速序列呈现的情绪状态;和
基于推断的用户的情绪状态动态地调整后续目标的输出。
34.根据权利要求33的方法,其中所述潜在的生理情况包括以下的至少一个:
心率;
血流;
脑波;
电信号;
皮肤电反应;
呼吸;和
体温。
35.根据权利要求33的方法,进一步包括:
将与所述潜在的生理情况有关的反馈信息传送给呈现服务器,供在产生用于用户的后续的快速序列呈现中使用。
36.用于将快速序列呈现展现给用户的装置,该快速序列呈现包括目标和相应描述符的序列,该装置包括:
网络接口,用于允许经通信网络通信,和经其接收快速序列呈现;
至少一个输出;
生理传感器;和
呈现播放器,其与所述网络接口、至少一个输出和生理传感器通信,所述呈现播放器被配置来:根据相应的描述符使用所述至少一个输出来输出目标;同时使用生理传感器监视用户的潜在的生理情况;分析所述潜在的生理情况以推断用户对于快速序列呈现的情绪状态;和基于所推断的用户的情绪状态,动态地调整后续目标的输出。
37.根据权利要求36的装置,其中所述至少一个输出包括以下的至少一种:
显示屏;
音频输出;和
触觉输出。
38.根据权利要求36的装置,其中所述潜在的生理情况包括以下的至少一种:
心率;
血流;
脑波;
电信号;
皮肤电反应;和
呼吸。
39.根据权利要求36的装置,其中所述呈现播放器被配置来经由网络接口将与所述潜在的生理情况有关的反馈信息传送给呈现服务器,供在产生用于用户的后续的快速序列呈现中使用。
40.根据权利要求36的装置,进一步包括:
网络浏览器,其与网络接口和呈现播放器通信。
41.根据权利要求40的装置,其中所述呈现播放器与所述浏览器集成在一起。
42.根据权利要求36的装置,进一步包括:
至少一个输入,其与所述呈现播放器通信,经由其用户能够手动地控制所述目标的输出的不同方面。
43.一种快速序列呈现系统,包括:
服务器,用于产生用于用户的快速序列呈现;和
与服务器通信的用户设备,用于将快速序列呈现展现给用户,其中所述用户设备被配置来传送反馈信息给服务器,该反馈信息表征用户对快速序列呈现的体验,以及其中服务器被配置来在产生用于用户的后续的快速序列呈现中使用该反馈信息。
44.根据权利要求43的系统,其中所述反馈信息包括以下的至少一种:
与在展现快速序列呈现期间监视的用户的潜在的生理情况有关的信息;和
与在展现快速序列呈现期间的用户输入有关的信息。
45.一种使用快速序列呈现技术将电子信息内容呈现给用户的方法,该方法包括:
记录内容的阅读;
分析记录的阅读以识别言语特征;
将内容解析为词语的序列;和
使用所述言语特征产生目标和相应描述符的序列,使得所述目标的快速序列视觉呈现将至少部分地模拟所述言语特征。
CNA2006800404969A 2005-08-29 2006-08-29 使用快速序列呈现技术传送信息的系统、设备和方法 Pending CN101300573A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US71266505P 2005-08-29 2005-08-29
US60/712,665 2005-08-29

Publications (1)

Publication Number Publication Date
CN101300573A true CN101300573A (zh) 2008-11-05

Family

ID=37809408

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800404969A Pending CN101300573A (zh) 2005-08-29 2006-08-29 使用快速序列呈现技术传送信息的系统、设备和方法

Country Status (8)

Country Link
US (1) US20070061720A1 (zh)
EP (1) EP1929408A2 (zh)
CN (1) CN101300573A (zh)
AU (1) AU2006285040A1 (zh)
BR (1) BRPI0615273A2 (zh)
CA (1) CA2624240A1 (zh)
IL (1) IL189881A0 (zh)
WO (1) WO2007027596A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104461507A (zh) * 2014-11-10 2015-03-25 吴涛军 信息片段的组织、呈现、用户响应以及多信息片段协同
US9906611B2 (en) 2015-09-21 2018-02-27 International Business Machines Corporation Location-based recommendation generator
CN111124197A (zh) * 2018-10-31 2020-05-08 北京国双科技有限公司 多文件的上传排序方法及装置

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090066722A1 (en) * 2005-08-29 2009-03-12 Kriger Joshua F System, Device, and Method for Conveying Information Using Enhanced Rapid Serial Presentation
US7596745B2 (en) * 2005-11-14 2009-09-29 Sun Microsystems, Inc. Programmable hardware finite state machine for facilitating tokenization of an XML document
US20070173699A1 (en) * 2006-01-21 2007-07-26 Honeywell International Inc. Method and system for user sensitive pacing during rapid serial visual presentation
US20070185601A1 (en) * 2006-02-07 2007-08-09 Apple Computer, Inc. Presentation of audible media in accommodation with external sound
US7813817B2 (en) * 2006-05-19 2010-10-12 Westinghouse Electric Co Llc Computerized procedures system
CA2679094A1 (en) * 2007-02-23 2008-08-28 1698413 Ontario Inc. System and method for delivering content and advertisements
US20080215966A1 (en) * 2007-03-01 2008-09-04 Microsoft Corporation Adaptive server-based layout of web documents
IL184180A0 (en) * 2007-06-24 2007-10-31 Mobile App Ltd User interface and method for displaying text
US20090136098A1 (en) * 2007-11-27 2009-05-28 Honeywell International, Inc. Context sensitive pacing for effective rapid serial visual presentation
JP5340584B2 (ja) 2007-11-28 2013-11-13 インターナショナル・ビジネス・マシーンズ・コーポレーション 電子メッセージの読解を支援する装置及び方法
US8059136B2 (en) * 2007-12-11 2011-11-15 Honeywell International Inc. Hierarchichal rapid serial visual presentation for robust target identification
US20090222406A1 (en) * 2008-02-29 2009-09-03 Allred Alan C Method for indexing, searching and retrieving patient information from a picture archive and communications system
US20110117969A1 (en) * 2009-11-17 2011-05-19 Research In Motion Limited Mobile wireless communications device displaying textual content using rapid serial visual presentation and associated methods
US20110115819A1 (en) * 2009-11-17 2011-05-19 Research In Motion Limited Mobile wireless communications device displaying textual content by varying fonts using rapid serial visual presentation and associated methods
EP2323357A1 (en) 2009-11-17 2011-05-18 Research In Motion Limited A mobile wireless communications device displaying textual content using rapid serial visual presentation and associated methods
CA2803047A1 (en) * 2010-07-05 2012-01-12 Cognitive Media Innovations (Israel) Ltd. System and method of serial visual content presentation
TW201205432A (en) * 2010-07-29 2012-02-01 Pegatron Corp Electronic book and annotation displaying method thereof
US20120284332A1 (en) * 2010-11-03 2012-11-08 Anantha Pradeep Systems and methods for formatting a presentation in webpage based on neuro-response data
FI20100380L (fi) * 2010-11-17 2012-05-18 Icergo Oy Menetelmä esittää luettavaa informaatiota digitaalisella näyttötaululla
CN103999028B (zh) * 2011-05-23 2018-05-15 微软技术许可有限责任公司 不可见控件
DE102012202407B4 (de) * 2012-02-16 2018-10-11 Continental Automotive Gmbh Verfahren zum Phonetisieren einer Datenliste und sprachgesteuerte Benutzerschnittstelle
US9569986B2 (en) 2012-02-27 2017-02-14 The Nielsen Company (Us), Llc System and method for gathering and analyzing biometric user feedback for use in social media and advertising applications
US9483109B2 (en) 2012-07-12 2016-11-01 Spritz Technology, Inc. Methods and systems for displaying text using RSVP
US9552596B2 (en) 2012-07-12 2017-01-24 Spritz Technology, Inc. Tracking content through serial presentation
US8903174B2 (en) * 2012-07-12 2014-12-02 Spritz Technology, Inc. Serial text display for optimal recognition apparatus and method
US20140189586A1 (en) * 2012-12-28 2014-07-03 Spritz Technology Llc Methods and systems for displaying text using rsvp
WO2014043149A1 (en) * 2012-09-12 2014-03-20 The Schepens Eye Research Institute, Inc. Measuring information acquisition using free recall
TWI508057B (zh) * 2013-07-15 2015-11-11 Chunghwa Picture Tubes Ltd 語音辨識系統以及方法
KR102287905B1 (ko) * 2013-11-01 2021-08-09 삼성전자주식회사 멀티미디어 기기, 온라인 교육 시스템 및 이들의 컨텐츠 제공 방법
US11748396B2 (en) * 2014-03-13 2023-09-05 D2L Corporation Systems and methods for generating metadata associated with learning resources
US20150348072A1 (en) * 2014-05-29 2015-12-03 Mastercard International Incorporated Method and system for selecting a target audience
JP2017525071A (ja) * 2014-06-17 2017-08-31 スプリッツ テクノロジー,インコーポレーテッド 中国語および関連言語向けに最適化された逐次テキスト表示
US9936250B2 (en) 2015-05-19 2018-04-03 The Nielsen Company (Us), Llc Methods and apparatus to adjust content presented to an individual
US11113325B2 (en) * 2017-09-12 2021-09-07 Getgo, Inc. Techniques for automatically analyzing a transcript and providing interactive feedback pertaining to interactions between a user and other parties
US20220180221A1 (en) * 2020-12-03 2022-06-09 International Business Machines Corporation Augmenting a presentation based on a predicted user knowledge background

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5802533A (en) * 1996-08-07 1998-09-01 Walker; Randall C. Text processor
US6190314B1 (en) * 1998-07-15 2001-02-20 International Business Machines Corporation Computer input device with biosensors for sensing user emotions

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104461507A (zh) * 2014-11-10 2015-03-25 吴涛军 信息片段的组织、呈现、用户响应以及多信息片段协同
CN104461507B (zh) * 2014-11-10 2018-09-11 吴涛军 信息片段的组织、呈现、用户响应以及多信息片段协同
US9906611B2 (en) 2015-09-21 2018-02-27 International Business Machines Corporation Location-based recommendation generator
CN111124197A (zh) * 2018-10-31 2020-05-08 北京国双科技有限公司 多文件的上传排序方法及装置

Also Published As

Publication number Publication date
US20070061720A1 (en) 2007-03-15
EP1929408A2 (en) 2008-06-11
WO2007027596A3 (en) 2007-12-21
WO2007027596A2 (en) 2007-03-08
AU2006285040A1 (en) 2007-03-08
BRPI0615273A2 (pt) 2011-05-17
IL189881A0 (en) 2008-08-07
CA2624240A1 (en) 2007-03-08

Similar Documents

Publication Publication Date Title
CN101300573A (zh) 使用快速序列呈现技术传送信息的系统、设备和方法
US20210065569A1 (en) System and method for providing an interactive visual learning environment for creation, presentation, sharing, organizing and analysis of knowledge on subject matter
JP4790119B2 (ja) テキストプロセッサ
US8744855B1 (en) Determining reading levels of electronic books
US20160147891A1 (en) Building a Topical Learning Model in a Content Management System
US20180366013A1 (en) System and method for providing an interactive visual learning environment for creation, presentation, sharing, organizing and analysis of knowledge on subject matter
US20110097693A1 (en) Aligning chunk translations for language learners
US20240054168A1 (en) Systems and methods for determining credibility at scale
Tsonos et al. Modeling Reader′ s Emotional State Response on Document′ s Typographic Elements
Forstall et al. Evidence of intertextuality: investigating Paul the Deacon's Angustae Vitae
AlShaikh et al. The implementation of the cognitive theory of multimedia learning in the design and evaluation of an AI educational video assistant utilizing large language models
CN1447265A (zh) 将文字型语句转变为相应的动画卡通的基本方法
US11775735B2 (en) Reading proficiency system and method
CN116561275A (zh) 对象理解方法、装置、设备及存储介质
Heflin AI-generated literature and the vectorized word
Daoust et al. JSREAL: A text realizer for web programming
US11188584B1 (en) Customized summarization of media content
Yang et al. A semantic similarity analysis of multiple English translations of The Analects: Based on a natural language processing algorithm
KR20220118703A (ko) 머신러닝 기반 온라인 쇼핑 리뷰 감정 예측 시스템 및 방법
Gallon The language of technical communication
Hall Participatory Design in Digital Language Documentation: A Web Platform Approach
US11699023B2 (en) Producing automated sensory content and associated markers in HTML document publishing
Gibbon et al. Spoken Language Characterization
Nazemi Non-visual representation of complex documents for use in digital talking books
Holzschlag Using XHTML

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20081105