CN1853180A - 语义知识提取、管理、捕获、共享、发现、交付、表示之系统与方法 - Google Patents

语义知识提取、管理、捕获、共享、发现、交付、表示之系统与方法 Download PDF

Info

Publication number
CN1853180A
CN1853180A CNA2004800099806A CN200480009980A CN1853180A CN 1853180 A CN1853180 A CN 1853180A CN A2004800099806 A CNA2004800099806 A CN A2004800099806A CN 200480009980 A CN200480009980 A CN 200480009980A CN 1853180 A CN1853180 A CN 1853180A
Authority
CN
China
Prior art keywords
semantic
user
request
information
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004800099806A
Other languages
English (en)
Inventor
诺萨·奥莫圭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nervana Inc
Original Assignee
Nervana Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nervana Inc filed Critical Nervana Inc
Publication of CN1853180A publication Critical patent/CN1853180A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/329Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the application layer [OSI layer 7]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging

Abstract

本发明的目的在于用于知识检索、管理、交付和表示的完整实现框架和由此引起的方法。该系统包括负责添加、维护特定领域的语义信息的第一服务器组件,以及第二服务器组件,第二服务器组件存储与其一起运行的第一服务器组件使用的语义和其他知识,以便经由通信介质向在表示平台上运行的客户机提供语境和时间制约的语义信息检索服务。借助该系统,给定层次上的所有对象或事件均是彼此语义关联的活动智能体,并代表返回数据对象的查询(由基础操作码组成),其中根据预定的可定制的主题(即“外壳”)向客户显示数据对象。该系统为客户提供定制和“混合”智能体和基础关联查询的各种方法,以便优化最后得到的信息的表示。

Description

语义知识提取、管理、捕获、共享、发现、交付、表示之系统与方法
发明人
诺萨·欧莫贵
优先权主张
本申请就2004年2月17日呈递之美国申请第10/781,053号主张优先权;该申请系2002年6月24日呈递之美国申请第10/179,651号的部分延续;10/179,651申请就2002年2月28日呈递之美国临时申请第60/360,610号和2001年6月22日呈递之美国临时申请第60/300,385号主张优先权。本申请亦就2003年2月14日呈递之美国临时申请第60/447,736号主张优先权。本申请亦就2002年6月24日呈递之PCT/US02/20249主张优先权。本申请亦就同于2004年2月14日呈递之PCT/US2004/004380(律师参照编号NERV-11-1012)和美国申请第10/779,533号(律师参照编号NERV-1-1005)主张优先权。前述全部申请均特此经援引而完整收入,如同已于此完全阐明。
版权声明
本披露受美国和国际版权法保护。诺萨·欧莫贵(Nosa Omoigui)版权所有,2002-2004年。保留一切权利。本专利文件之披露之一部分包含受版权保护资料。版权拥有人不反对任何人对如专利商标局专利文件或记录所显示之专利文件或专利披露进行摹真复制,但除此之外保留一切版权。
发明领域
本发明在广义上与计算机相关,更具体地说则与信息管理和研究系统相关。
发明背景
本发明之总体背景于本人之共同待决母申请(2002年6月24日呈递之美国申请第10/179,651号)中描述,该申请经援引而收入于此,并且本申请是该申请的一个部分延续。
发明概括
本发明部分指向一依语义集成的知识提取、管理、交付、表示系统;该系统如本人的共同待决母申请(2002年6月24日呈递之美国申请第10/179,651号)中所更完整描述。本发明与系统包括如下面详细描述中所更完整描述之若干附加改进特征、增强项和(或)性质,包括但不限于实体、配置文件、语义线程。
图示简述
本发明的最佳和替代实施方式于后面参照下列图示而详加描述。
图1系专利审查员进行一项现有技艺搜索之情景的屏幕抓图概览且图2是图1中某对话框的放大;该屏幕抓图为在Pharmaceuticals{制药业}分类法中出现的“Magnetic Resonance Imaging”{磁共振成象}。
图3显示可共享灵巧请求系统交互作用;即封装带有灵巧请求之SQML缓冲区的二进制文档格式,并且说明扩展名处理器如何打开文档。
图4A为文档文件的一个部分屏幕抓图。
图4B显示图4A之两个.REQ文档示例(标题为‘Headlines onReuters Related to My Research Report(Live)’{与我的研究报告相关的路透社大标题(实时)}和‘Headlines on Reuters(as of January 212003,08 17AM)’{路透社大标题(截至2003年1月21日上午08:17)});该扩展名在Windows外壳程序中有已注册的关联。
图5例举了文本转为语音对象外壳和显示了正在由某文本转为语音对象外壳转换的电子邮件。
图6例举了一文本转为语音请求外壳。
图7例举了一制药公司示例的知识造型。
图8例举了客户端部件集成与交互作用作业流程。
图9至图11显示类别对话框的三个不同视图。
图12和图13显示了操作中卷宗灵巧镜头的样本屏幕抓图。
图14反映了服务器端语义查询处理器如何处理输入的(由SQML表示的)语义查询。
图15例举了显示两个配置文件(名称为“My Profile”{我的配置文件}的默认配置文件和名称为“Patents”{专利}的配置文件)的语义浏览器。请观察用户如何能够无干扰地利用这两个配置文件在其知识世界中定位。
图16A-C举例说明了用户将如何配置配置文件(如要创建配置文件,用户将使用“创建配置文件向导”;该配置文件之后可如他图所示使用属性表来加以修改)。
图17展示了用户在使用“创建请求向导”创建请求时将如何选取配置文件。
图18为‘Smart Styles’{灵巧风格}对话框的一个屏幕抓图,其中例举了一些前述操作与特征。
图19例举了“灵巧请求观察”对话框。
图20例举了一个显示Filtered Smart Requests(e.g.,.Headlineson Wireless){已过滤的灵巧请求(例如关于无线的大标题)}的观察窗口。图20是具有Current Smart Request Title(e.g.,″BreakingNews″){当前灵巧请求标题(例如“突发新闻”)}的观察窗口之一个例证。
图21例举了语义浏览器中显示的实体视图。
图22A和22B显示了知识社区订阅的用户界面。
图23例举了一个语义线程对象及其语义链接。
图24至46B为更多的屏幕抓图,进一步例举了有关功能、选项、操作。
图47是制药与生物技术业的一个样本语义图象(DNA)。
图48是突发新闻语境模板的一个依语义适当之图象视觉化例证。
图49为一个视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(大标题)。
图50为一个视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(两个人在一张写字台上工作)。
图51例举了一个语义“新闻人物”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
图52例举了一个语义“即将发生事件”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
图53为一个视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(有盖培养皿)。
图54例举了一个语义“历史”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
图55例举了一个语义视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(宇宙飞船)。
图56例举了一个语义“最佳匹配”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
图57例举了一个语义视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(咖啡)。
图58例举了就“经典作品”而言灵巧砂漏、填空页面、转换效果、背景chrome等等的一个语义适当样本图象(汽车)。
图59例举了一个依语义适当的“推荐”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等之语境或应用程序元件的样本图象(竖大拇指)。
图60例举了一个语义“今天”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等元件的样本图象。
图61例举了一个语义“带注解项目”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
图62例举了一个语义视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
图63例举了一个语义“专家”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
图64例举了一个语义“地点”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
图65例举了一个语义“混合器”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
图66至84例举了下列信息对象类型的语义视觉化:文档、书籍、杂志、演示文稿、履历、电子表格、文本、网页、白皮书、电子邮件、电子邮件注解、电子邮件分发名单、事件、会议、多媒体、在线课程、人员、顾客、用户。
图85例举了一个语义“时间线”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
                           最佳实施方式详细描述
                                  目录
A.附加说明性情景............................................................8
  1.专利审查员现有技艺搜索工具..............................................8
  2.生物科技公司研究情景...................................................12
B.本信息神经系统之目前最佳实施方式的主题...................................17
  1.灵巧选择镜头概述.......................................................18
  2.粘贴人物对象概述.......................................................20
  3.保存与共享灵巧请求概述.................................................22
  4.保存与共享灵巧快照概述.................................................23
  5.虚拟知识社区...........................................................24
  6.实现时间制约语义查询...................................................24
  7.文本转为语音外壳概述...................................................25
  8.语言翻译外壳...........................................................28
  9.类别作为用户体验中的第一类对象.........................................29
  10.分类注解..............................................................29
  11.附加的语境模板........................................................29
  12.导入和导出用户状态....................................................30
  13.本地灵巧请求..........................................................31
  14.综合定位..............................................................31
  15.已访问结果提示........................................................32
  16.知识联盟..............................................................33
  17.匿名注解与发表........................................................36
  18.语义浏览器中的离线支持................................................36
  19.语义浏览器中保证的跨平台支持..........................................37
  20.知识造型..............................................................37
  21.KIS清仓规则...........................................................38
  22.客户端部件集成与交互作用作业流程......................................38
  23.类别对话框用户界面规范................................................40
  24.客户程序协助的服务器数据一致性检查....................................42
  25.客户端重复检测........................................................43
  26.客户端虚拟结果光标....................................................44
  27.虚拟单一登录..........................................................44
  28.名字空间对象动作矩阵..................................................46
  29.动态端到端本体分类或分类法更新与同步..................................48
  30.调用卷宗(指南)查询....................................................49
  31.知识社区(代理)语义....................................................50
  32.动态本体分类和分类法映射..............................................50
  33.语义警报优化..........................................................51
  34.语义“新闻”图象......................................................51
  35.动态选择语义图象......................................................52
  36.动态知识社区(代理)联系人成员..........................................52
  37.综合性全部文本关键词与短语索引编制....................................53
  38.语义“标记对象为已读”................................................54
  39.多重选择对象镜头......................................................55
  40.基于本体分类的过滤和垃圾邮件管理......................................55
  41.结果提炼..............................................................55
  42.信息仓库的语义管理....................................................57
  43.计算尺过滤器用户界面..................................................58
C.服务器端语义查询处理器规范...............................................59
  1.概述...................................................................59
  2.语义关联度分值.........................................................60
  3.语义关联度过滤器.......................................................60
  4.时间制约过滤器.........................................................61
  5.知识类型语义查询实现...................................................61
D.信息神经系统的可扩展客户端用户配置文件规范...............................67
E.信息神经系统的灵巧风格规范...............................................69
  1.灵巧风格概述...........................................................69
  2.暗示和动态灵巧风格的属性...............................................70
F.信息神经系统的灵巧请求观察规范...........................................72
  1.概述...................................................................72
  2.请求观察清单与群组.....................................................72
  3.通知管理器.............................................................76
  4.观察群组监视器.........................................................76
  5.观察窗格...............................................................77
  6.观察窗口...............................................................77
  7.观察清单补遗...........................................................79
G.信息神经系统的实体规范...................................................79
  1.引言...................................................................79
  2.组合(或实体集合).......................................................85
  3.示例情景...............................................................85
H.信息神经系统的知识社区浏览与订阅规范.....................................86
I.信息神经系统的客户端语义查询文档规范.....................................87
  1.语义查询标注语言(SQML)概述.............................................87
  2.SQML生成..............................................................100
  3.SQML解析..............................................................100
J.信息神经系统的语义客户端运行时控件API规范...............................101
  1.介绍Nervana语义运行时控件——概述.....................................101
  2.Nervana语义运行时控件API..............................................101
  3.电子邮件控件API.......................................................112
  4.人物控件API...........................................................114
  5.系统控件事件..........................................................117
K.信息神经系统的安全保障规范..............................................119
  1.授权..................................................................119
  2.人员群组..............................................................125
  3.身份元数据联盟........................................................126
  4.访问管制..............................................................127
L.信息神经系统的深层信息规范..............................................134
M.信息神经系统的创建请求向导规范..........................................141
N.信息神经系统的创建配置文件向导规范......................................143
O.信息神经系统的创建请求书签规范..........................................144
  1.介绍创建书签向导......................................................144
  2.情景..................................................................145
  3.智能发表工具元数据建议与维护..........................................145
P.信息神经系统的语义线程规范..............................................146
  1.语义线程..............................................................146
  2.语义线程会话..........................................................149
  3.语义线程管理..........................................................149
Q.示例屏幕抓图............................................................150
R.信息神经系统的语义查询定义和视觉化规范..................................150
  1.语义图象与运动........................................................150
  2.灵巧砂漏..............................................................155
  3.视觉化——语境模板....................................................156
在一当前最佳实施方式中,本系统同时采纳了本人之母申请和本部分延续中描述的特征与功能。
A.附加说明性情景
下列情景有助于解释本系统的效用和操作,并且因此将令其余详细描述脉络更清楚也较易理解。
1.专利审查员现有技艺搜索工具
在很大程度上由于专利商标局收费的挪作他用,美国专利审查员面临着用很短的时间完成对现有技艺进行健全搜索的很大压力。此外,审查员们可用的研究工具尽管在过去若干年里已有大幅度改善,但仍有许多不足之处。其中一项不足在于,绝大多数研究工具均基于文本而非含义。因此,举例来说,专利商标局网站上的搜索工具将搜索有关文档中特定字段内的特定词。与此相似,Google上的高级搜索工具让审查员能够找到包含特定字词或特定词组的文档,或者找到不包含特定词或词组的文档。可是,在这两种情况下,搜索引擎均不允许审查员基于含义找到文档。因此,举例来说,倘若现有某相关参考文献,其中阐述了在本质上相同的构思但使用了与所查询者完全不同的词(例如某同义词,或更糟糕地使用了某同义短语),则即使该参考文献预期存在,却依然可能不被发现。审查员即使能够花时间想象和搜索该发明之关键词的每个可能同义词或甚至同义短语,依然有可能漏掉一些参考文献;因为有时相同的构思可能完全不用任何相同词地表述,并且有时同义构思未被简洁地压缩成一个短语,而是散布于多个句子或段落中。
这是因为词语并不象数字那样表达或暗示一对一的含义。换言之,某些含义能够用若干不同词或实质上无限多的词组加以表达或暗示;并且反言之,某些词或词组能够表达或暗示若干不同的含义。尽管有此无穷大的多对多可能性网,在绝大多数时候,人类能够以起码是可以容忍的有效性离析出(借助于语境、经验、推理、推论、演绎、判断、学习等等)很可能的含义。现有技艺计算机自动化搜索工具(例如专利商标局网站、或Google、或Lexis)则无此能力。本人发明之目前最佳实施方式,由于能够基于含义进行搜索,在相当程度上填补了这一空白。
举例来说,使用本发明之最佳实施方式的一些搜索功能,审查员将能够进行搜索,并且无需投入比目前更多的努力或时间而获得与专利性相关的结果,即使这些结果并不包含与该审查员所选关键词相同的任何一个词。因此,这一系统由于能够基于含义找到参考文献,所获得之与审查员任务相关的结果是现有系统一般无法得到的。
同样基于含义,它能够排除无关参考文献,即使该等文献包含与搜索要求相同的关键词或词组。换言之,现有技艺中的一个问题是错误肯定问题;搜索引擎仅仅因为具有相同的关键词而“认为”是相关的结果,而事实上却完全无关;因为对语境的认真审视会发现,该关键词实际表达或暗示了某个无关的概念。因此,审查员必须浪费时间来大海捞针。
与此对照,使用本发明之最佳实施方式的一些搜索功能,相关搜索结果的密度会大幅度提高,因为本系统足够“智能化”,能够忽略尽管有相同的关键词却并不相关的结果。诚然,它在这方面的不完美就如同人类在这方面的完美一样。但是,它在过滤无关结果上比当前系统要有效得多,并且在这方面就功能或实用而言都更象一位聪明的研究助手,而不仅仅是基于关键词的搜索引擎。因此,使用本系统,审查员能够用短得多的时间完成好得多的搜索。举例来说,以这种方式使用本系统的具体技巧如下:
假设某审查员被分派去审查某项申请,其内容涉及一种解释磁共振数据的更准确方法和由此生成更准确诊断图象的计算机软件。为了使用本发明之最佳实施方式的搜索功能搜索相关的现有技艺,该审查员将:
a.使用创建实体向导,创建一个“主题”实体;该主题实体带有“磁共振成象”出现于其中之多种语境中的相关类别。作为一个示例,图1和图2显示了在制药业分类法中出现的“Magnetic ResonanceImaging{磁共振成象}”。请注意,该类别出现于若干个语境中。将相关类别加入此实体并应用“OR{或}”运算。从本质上说,这相当于将实体“Magnetic Resonance Imaging”(如它与您的具体任务相关联)定义为等同于根据要审查的专利申请在适当语境中出现的全部磁共振成象。。
b.将此新实体命名为“Magnetic Resonance Imaging”以及或许还有“成象”和“诊断”或这些词语的某些变化和组合。
c.将此“Magnetic Resonance Imaging”主题实体拖放到欲用配置文件(该配置文件最好配置为包括“专利数据库”知识社区)中的卷宗(特殊智能体或默认知识请求)图标上。如此就会启动一个新的卷宗请求或智能体,从而显示每个特殊智能体(语境模板)。每个特殊智能体均与适当默认谓词一起如下显示:
·All Bets on Magnetic Resonance Imaging{关于磁共振成象的所有匹配}
·Best Bets on Magnetic Resonance Imaging{关于磁共振成象的最佳匹配}
·Breaking News on Magnetic Resonance Imaging{关于磁共振成象的突发新闻}
·Headlines on Magnetic Resonance Imaging{关于磁共振成象的大标题}
·Random Bets on Magnetic Resonance Imaging{关于磁共振成象的随机匹配}
·Experts in Magnetic Resonance Imaging{磁共振成象领域的专家}
·Newsmakers in Magnetic Resonance Imaging{磁共振成象领域的新闻人物}
·Interest Group in Magnetic Resonance Imaging{磁共振成象领域的兴趣群体}
·Conversations on Magnetic Resonance Imaging{关于磁共振成象的会话}
·Annotations on Magnetic Resonance Imaging{关于磁共振成象的注解}
·Annotated Items on Magnetic Resonance Imaging{关于磁共振成象的带注解项目}
·Upcoming Events on Magnetic Resonance Imaging{关于磁共振成象的即将发生事件}
·Popular Items on Magnetic Resonance Imaging{关于磁共振成象的流行项目}
·Classics on Magnetic Resonance Imaging{关于磁共振成象的经典作品}
d.或者,该请求也能够通过使用创建请求向导来创建。如要这样做,选取卷宗语境模板,然后选取“专利数据库”知识社区作为该请求的知识源。或者,您能够配置配置文件以包括“专利数据库”知识社区,然后只需为该请求使用选定的配置文件。单击下一步,向导会基于该请求的语义聪明地为该请求建议一个名称。向导也会基于“Magnetic Resonance Imaging”“主题”实体的语义选取适当默认谓词。因为向导知道该实体是一个“主题”,它选取在合适的语境中合乎情理的正确实体。单击完成,向导会编译此查询,发送SQML给选定配置文件内的KIS,然后显示结果。
在前述例子中,查询结果最终可能得自任何来源。理想的情况是,一些结果来自万维网,一些在专利商标局内联网上找到,还有一些或许来自其他专属外联网。不管原始文档的范围或起源为何,通过使用本系统,它们都已得到自动处理,并且由本系统自动“阅读”和“理解”;因此在审查员的查询开始,并且依照语义,以及依照语境,加以“阅读”和“理解”后,本系统会找到全部相关且只限相关的结果。再重申一次,这并非完美无缺,但比任何现有系统要准确得多。也请注意,本系统不依赖于对有关文档的预先人工标记或分类。这样做尽管将对准确度有所裨益,但由于人力耗费巨大,所以不仅会完全抵消在线研究的长处,而且由于新文档的增加速度而根本不实用。
在此情景中,审查员可能也想要利用本发明之最佳实施方式的更多特征。举例来说,审查员可能想要按如下方式咨询专利商标局内部的专家,或查阅专利商标局以外专家所著文献(请注意,磁共振成象领域的专家已包括在关于磁共振成象的卷宗内;然而,审查员可能想要为专家建立一个单独的请求以单独追踪,将它保存为一个“请求文档”,用电子邮件寄给同行等等)。如要找到所有磁共振成象领域的专家:
a.遵循上面第1-4步。
b.将“Magnetic Resonance Imaging{磁共振成象}”实体拖放到欲用配置文件中的专家(特殊智能体或默认知识请求)图标上。如此就会自动启动一个新请求或智能体,其标题已适当地定为“Experts inMagnetic Resonance Imaging{磁共振成象领域的专家}”。语义浏览器选取适当默认谓词“in{领域的}”,因为它“知道”该实体是一“主题”实体且该语境模板是一个“人员”模板(专家)。如此一来,默认谓词系基于这两个自变量的交叉点(“in”)而选取,因为这是合乎情理的。
2.生物科技公司研究情景
生物科技公司涉及大量的研究工作,不仅是实验室研究,还包括对其公司内外他人成果的研究。不幸的是,此类公司可用的研究工有许多不足之处。专属服务可以提供与语境相关且有用的结果,但此类服务本身所采用的工具也十分简陋,所以大量依赖于索引编制和人工努力,以及对昂贵的专业杂志的订阅,因而收费非常高昂且结果不如本系统准确。在另一方面,生物科技研究人员能够使用成本低廉的Google,但Google具有前述基于关键词之系统的所有局限性。
与此相对,利用本发明之最佳实施方式的搜索特征进行搜索,生物科技研究人员能够更高效率地找到更相关的结果。更具体地说,该研究人员可按如下方式使用本系统。例如,假设某些研究人员想要找到营销或研究领域的任何人关于基因组学和解剖学的大标题,他们可以按下列方式进行:
a.使用向导,用关键词“Marketing Research{营销研究}”启动一个分发名单的信息类型请求或智能体。
b.选取营销分发名单结果,单击“保存为实体”——如此可将此对象保存为一个“团队”实体(因为语义浏览器“知道”该原始对象是一个分发名单,所以“团队”实体在此语境中是合乎情理的)。
c.选取研究分发名单结果,单击“保存为实体”——如此可将此对象保存为一个“团队”实体(因为语义浏览器“知道”该原始对象是一个分发名单)。
d.使用创建实体向导,创建一个新的“团队”实体并选取“Marketing{营销}”和“Research{研究}”团队实体作为成员。将该新实体命名为“Marketing or Research{营销或研究}”。
e.使用创建请求向导,选取大标题语境模板,然后选取“Marketing or Research”实体作为一个过滤器。此外,选取基因组学类别和解剖学类别,然后选取“AND{与}”运算符。单击下一步——向导会基于该请求的语义聪明地为该请求建议一个名称。向导也会基于“Marketing or Research”团队实体的语义选取适当默认谓词(“byanyone in{按......领域任何人的}”)。因为向导知道该实体是一个“团队”,它会按照默认规定选取“by anyone in”,因为这是合乎情理的。单击完成,向导会编译此查询,发送SQML给选定配置文件内的KIS,然后显示结果。
此外,这些研究人员可能想要找到营销或研究领域的所有专家:
a.遵循上面第1-4步。
b.将“Marketing or Research”实体拖放到欲用配置文件中的专家(特殊智能体或默认知识请求)图标上。如此就会启动一个新请求或智能体,其标题已适当地定为“Experts in Marketing or Research{营销或研究领域的专家}”。语义浏览器选取适当默认谓词“in”,因为它“知道”该实体是一“团队”实体且该语境模板是一个“人员”模板(专家)。如此一来,默认谓词系基于这两个自变量的交叉点(“in”)而选取,因为这是合乎情理的。
倘若研究人员预期重开此研究,或加以补充,或日后分析其结果,他们可能想要如下所示就营销或研究建立一个卷宗:
a.遵循上面第1-4步。
b.将“Marketing or Research”实体拖放到欲用配置文件中的卷宗(特殊智能体或默认知识请求)图标上。如此就会启动一个新的卷宗请求或智能体,从而显示每个特殊智能体(语境模板)。每个特殊智能体均与适当默认谓词一起如下显示:
·All Bets by anyone in Marketing or Research{按营销或研究领域任何人的所有匹配}
·Best Bets by anyone in Marketing or Research{按营销或研究领域任何人的最佳匹配}
·Breaking News by anyone in Marketing or Research{按营销或研究领域任何人的突发新闻}
·Headlines by anyone in Marketing or Research{按营销或研究领域任何人的大标题}
·Random Bets by anyone in Marketing or Research{按营销或研究领域任何人的随机匹配}
·Experts in Marketing or Research{营销或研究领域的专家}
·Newsmakers in Marketing or Research{营销或研究领域的新闻人物}
·Interest Group in Marketing or Research{营销或研究领域的兴趣群体}
·Conversations involving anyone in Marketing or Research{涉及按营销或研究领域任何人的会话}
·Annotations by anyone in Marketing or Research{按营销或研究领域任何人的注解}
·Annotated Items by anyone in Marketing or Research{按营销或研究领域任何人的带注解项目}
·Upcoming Events by anyone in Marketing or Research{按营销或研究领域任何人的即将发生事件}
·Popular Items by anyone in Marketing or Research{按营销或研究领域任何人的流行项目}
·Classics by anyone in Marketing or Research{按营销或研究领域任何人的经典作品}
研究人员可能有兴趣找到“Breaking News on my Competitors{关于我的竞争对手的突发新闻}”,并且将采取如下行动:
a.针对每个竞争对手,使用创建实体向导创建一个新的“competitor{竞争对手}”实体(在“公司”项下)。视需要选取合适的过滤器。举例来说,倘若某竞争对手具有广为人知的英文名称——例如“Groove”,其实体应包括该公司的业务类别、还有关键词。
b.使用创建实体向导,创建一个组合(实体集合),然后加入您在第a步中创建的所有竞争对手实体。将此实体集合命名为“我的竞争对手”。
c.使用创建请求向导,选取突发新闻语境模板并加入您在第b步中创建的组合(实体集合)作为过滤器。保留默认谓词选择。单击“下一步”,向导会使用该默认谓词(“Breaking News on My Competitors{关于我的竞争对手的突发新闻})聪明地为该请求建议一个名称。单击完成,向导启动一个名为“Breaking News on My Competitors”的新请求或智能体。
此外,这些研究人员可能想要随时了解新情况。他们能够以如下方式指示本系统就“关于我的竞争对手的突发新闻”通知他们:
a.如前所述创建“Breaking News on My Competitors{关于我的竞争对手的突发新闻}”请求。
b.将此请求加入请求监视列表。语义浏览器现在将显示一个监视窗格(例如滚动条),其中出示“Breaking News on My Competitors”。使用通知管理器,您也能够在该请求或智能体有新的结果时,指示语义浏览器经由电子邮件、即时传讯、文本传讯等手段发送通知。
此外,研究人员可能希望保持竞争对手的记录以备日后查考,并且不断更新这些记录。本系统将创建和更新此等记录,做法为研究人员通过如下所述指示本系统显示关于我们的每个竞争对手的卷宗集合:
a.如前面4a所述,为您的每个竞争对手创建实体。
b.就每个竞争对手实体,通过将该实体拖到欲用配置文件的卷宗图标上,创建一个关于该竞争对手的卷宗,如此就创建一个关于该竞争对手的卷宗。
c.使用创建请求向导,创建一个新的请求集合(混合器),并且将在第b步创建的每个卷宗请求加入该集合(您也能够在创建了请求之后,将它拖放到该集合上,从而进一步充实该集合)。单击下一步,向导会聪明地为该请求集合建议一个名称。单击完成,向导启动一个包含该等单个卷宗的请求集合。您于是可以将该请求集合加入收藏夹,并且每日开启以获得丰富且相关的竞争对手情报。
研究人员可能想要回顾特定卷宗,并且能够通过指示本系统显示关于首席执行官的卷宗(例如命名为John Smith)达到此目的:
a.使用向导,用关键词“John Smith”启动一个人员的信息类型请求或智能体。
b.选取其结果,单击“保存为实体”——如此可将此对象保存为一个“人物”实体(因为语义浏览器“知道”该原始对象是一个人物,因此“人物”实体在此语境中是合乎情理的)。
c.使用创建请求向导,选取卷宗语境模板,然后选取“JohnSmith”实体作为一个过滤器。单击下一步,向导会基于该请求的语义聪明地为该请求建议一个名称。向导也会基于“John Smith”人物实体的语义选取适当默认谓词。单击完成,向导会编译此查询,发送SQML给选定配置文件内的KIS,然后显示如下结果(作为子查询或智能体):
·All Bets by John Smith{按约翰·史密斯的所有匹配}
·Best Bets by John Smith{按约翰·史密斯的最佳匹配}
·Breaking News by John Smith{按约翰·史密斯的突发新闻}
·Headlines by John Smith{按约翰·史密斯的大标题}
·Random Bets by John Smith{按约翰·史密斯的随机匹配}
·Experts like John Smith{类似约翰·史密斯的专家}(这会发回专长类别与约翰·史密斯相同的那些专家)
·Newsmakers like John Smith{类似约翰·史密斯的新闻人物}(这会发回在约翰·史密斯最近“撰写新闻”的相同类别中最近“撰写新闻”的新闻人物)
·Interest Group like John Smith{类似约翰·史密斯的兴趣群体}(这会发回在约翰·史密斯最近显出兴趣的相同类别中最近显出兴趣的人员——在某时间段内(本最佳实施方式中为2-3个月))
·Conversations involving John Smith{涉及约翰·史密斯的会话}
·Annotations by John Smith{按约翰·史密斯的注解}
·Annotated Items by John Smith{按约翰·史密斯的带注解项目}
·Upcoming Events by John Smith{按约翰·史密斯的即将发生事件}
·Popular Items by John Smith{按约翰·史密斯的流行项目}
·Classics by John Smith{按约翰·史密斯的经典作品}
前述情景举例说明了本系统的操作。本系统本身在下面有更详细的描述。
B.本信息神经系统之目前最佳实施方式的主题
自前面援引的本人同时在申请中的母申请和之前的临时申请呈递以来,已开发出若干改进、增强及变化。其中一些乃是对之前包括在母申请内之特征的改进或澄清,一些则为本系统的全新特征,这些在下面列出和描述,它们并非按照重要程度或任何特定顺序排列。尽管本发明之最佳实施方式将允许用户单独或联合使用下述任何该等特征与改进,但是就本发明之实行而言,任何单个特征或多个特征之特定组合均非必需。
此外,本申请使用了如本人母申请第10/179,651号中所定义的相同术语,并且除非本申请之语境明确表明相反意义,本申请通篇之描述应与本人母申请之定义、术语、插图共同阅读。
1.灵巧选择镜头概述
灵巧选择镜头与信息神经系统信息媒体的灵巧镜头特征相似。在此情况下,用户能够在对象内选择文本,镜头将使用选定的文本作为对象而加以应用(随着选择的改变动态生成新的“图象”)。以此方式,用户能够将镜头应用于对象元数据的某个可配置子集,而非局限于要么将镜头应用于整个对象,要么不用于任何对象。这项特征与已加载语境的选择光标或动词相似。举例来说,用户能够在演示程序中选取一段文本,并且在该文本所处的对象上单击“粘贴为镜头”。演示程序于是用如下所示的方法调用将该文本传递给客户程序运行时部件(例如某个ActiveX对象):
bstrSRML=GetSRMLForText(bstrText);
此调用于是发回一个封装该自变量文本的临时SRML缓冲区。演示程序于是将调用一个如下方法:
bstrSQML =GetQueryForSmartLensOnObject(bstrSRMLObject);
此方法由剪贴板获得SQML,为该对象接收自变量SRML,并且动态创建新的SQML(使用默认谓词“relevant to{相关于}”),其中包括该SRML内的资源作为该SQML中的一个链接。此方法于是发回新的SQML。演示程序于是调用方法:
ProcessSemanticQuery(bstrSQML);
此方法传递生成的镜头SQML,然后最好是不同时地提取其结果和SRML结果中的项目数目。如需此调用的详细资料,请参阅“信息神经系统语义运行时OCX”规范。演示程序于是显示一个预览窗口(或基于现用外壳的等同物),其中出现如下内容:
[镜头智能体标题]
Found 23 items{找到23个项目}
[预览对象1]
[预览窗口控制项]
其中“镜头智能体标题”是剪贴板上该智能体的标题。如需预览窗口(和预览窗口控制项)的详细资料,请参阅本人的母申请第10/179,651号。
在最佳实施方式中,此预览窗口将:
·在一个计时器到时后消失(或许为500毫秒)——一旦鼠标移动,该计时器最好重置(这将避免在用户围绕相同区域移动鼠标时窗口闪动)。
·(最终)慢慢隐去。
最佳实施方式也具有下列特征:
1.每对象一个选择范围而每结果集合多个选择为最佳选项。否则,如要为每选择每对象(而非为每对象)显示多个镜头图标,本系统将造成令人困惑的用户体验和复杂的用户界面。
2.未完成的镜头查询请求(即那些正常的SQML查询,尽管带有与该智能体镜头一致的动态生成SQML)在演示程序不再需要时(例如,当演示程序定位至新页面,或者当我们为某对象请求新的镜头时)应被取消。在任何情况下,由于镜头查询很可能一次只要求几个对象,此等取消从性能(或带宽)的角度来看并非至关重要。即使该等查询未被取消,演示程序仍可能忽略有关结果。无论如何,由于演示程序也必须处理陈旧的结果,即将其丢弃,因此演示程序将必须这么做(无论镜头查询是否也被取消)。在演示程序发出取消请求和取消实际完成之间将有一个延迟。由于一些结果会在这段时间内渗入,它们因而需要被丢弃。因此,本最佳实施方式具有异步取消实现,即软件组件已设计为始终准备忽略不良或陈旧的结果。
3.演示程序最好同时有图标(表明当前镜头请求状态)和工具提示:当用户悬停在某对象上或单击该对象时,演示程序能够提供一个工具提示:“请求镜头信息”(或类似文本)。在信息返回时,悬停将显示“找到23个对象”提示且单击将显示有关结果。在结果到达时,如果预览窗口还在,此插空工具提示可被转换为预览窗口。
此外请注意,与灵巧镜头相似,灵巧选择镜头能够应用于并非文本元数据的对象。例如,灵巧选择镜头能够应用于图象、视频、音频流片段或其他元数据。在这些场合,演示程序将发回与该数据类型和“选择区域”一致的适当SRML。此区域可为图象或视频上的一块,或音频流中的一个时间跨度。灵巧镜头功能的其余部分将如上所述应用,合适的SQML将基于该SRML而生成(该SRML则将基于镜头下面数据类型的方案)。
2.粘贴人物对象概述
信息神经系统(再次重申,这是对我们目前最佳实施方式之特定方面的当前简称之一)也支持‘人物’对象(人员、用户、顾客等等)的拖放或复制与粘贴。目前至少有两个情景可以说明最佳实施方式在此场合的操作:
1.将一个人物对象粘贴在一个代表该人出自其中之知识社区(或代理)的灵巧请求上。在这种情况下,服务器的语义查询处理器只是使用该人物作为自变量解析来自客户程序的SQML。例如,倘若用户将某人物‘Joe’粘贴(或拖放)到一个灵巧请求‘Headlines onReuters’{路透社的大标题},客户程序将使用附加自变量新建一个灵巧请求。路透社信息神经系统Web服务于是将通过发回由‘Joe’发表或加注的所有大标题来满足这一请求。在此情况下,服务器本质上将应用就此情景而言合乎情理的适当默认谓词(‘published or annotatedby’{由......发表或加注的})。
2.将一个人物对象粘贴在一个代表该人不出自其中之知识社区(或代理)的灵巧请求上。在这种情况下,由于该人物对象不在目的知识社区(在其SMS上)的语义网络中,服务器的语义查询处理器将无法让该人物自变量合乎情理。这样一来,服务器必须以某种不同方式解析该人物自变量,例如使用该人属于专家(在最佳实施方式中)或新闻人物的类别。比如,就前例而言,倘若用户将某人物‘Joe’到粘贴(或拖放)一个灵巧请求‘Headlines on Reuters’且Joe不是路透社知识社区的一个人物,路透社Web服务(在最佳实施方式中)必须发回“relevant to Joe′s expertise”{与Joe之专长相关的}大标题。此实施方式于是将要求在发送SQML给目的Web服务前采取两次通过方式。首先,它必须向该人所属知识社区征询代表该人之专长的“代表数据(SRML)”。Web服务按如下方式满足此请求:
a.查询该人物对象被粘贴到或放下的知识社区(例如路透社)之语义域信息;该信息包括和(或)表示该社区的具体分类法和本体分类。注意,可能同时存在若干个语义域。
b.向人物对象出自其中的知识社区查询该人物对象的语义域信息。
c.如果这些语义域相同或至少有一个共同语义域,客户程序则向该人出自其中的知识社区查询该人的专长类别。客户程序于是用这些类别作为自变量构建SQML并将这个SQML传递给该人被粘贴到或放下的知识社区。
如果这些语义域不同或没有至少一个共同语义域,客户程序向该人出自其中的知识社区查询属于该人为专家之类别的若干对象。在最佳实施方式中,此实现应选用准确表示专长类别之对象的足够大数目(此数目最好基于实验而决定)。在此情况下选取对象的原因,在于目的Web服务将不理解该人出自其中的知识社区之类别,因而无法将该等类别映射到自己的类别上。或者也可使用类别映射器(经由互联网上的某中央Web服务)将不同知识社区的类别相互映射。在此情况下,目的知识社区会总是将类别作为SQML的组成部分而传递,即使它并不理解那些类别。该知识社区于是将使用类别映射器Web服务将这些类别映射到内部类别。类别映射器Web服务将有解析类别的方法以及发表类别映射的方法。
3.保存与共享灵巧请求概述
信息神经系统语义浏览器(信息智能体或图书馆员)的用户也将能够把灵巧请求保存到磁盘上,作为附件进行电子邮寄,或者经由即时传讯软件(也是作为附件)或其他手段共享。客户应用程序将显露把灵巧请求作为可共享文件加以保存的方法。客户应用程序也将显露把灵巧请求文档作为电子邮件或即时传讯软件之附件而共享的方法。
可共享灵巧请求文档是一个封装SQML(经由二进制格式的加密流)的二进制文档。它提供了对语义查询的安全、串行化表示;该表示除其他特征外,亦能够保护完整性和帮助保护该详述的知识财产。举例来说,该查询本身可能包含研究人员雇主的商业机密;该等机密一旦披露,可能令竞争对手能够反向工程关键竞争信息,从而损害该公司。此保护可用若干种方式实现,包括通过对该语义查询的XML版本(SQML)进行强加密或利用强大的单向散列。此可共享文档具有表示请求的扩展名(.REQ)。客户机操作系统上的一个扩展名处理器会得到安装以表示此扩展名。在有此扩展名的文档被打开时,该扩展名处理器会被调用以打开该文档。扩展名处理器通过由加密流中提取SQML而打开该文档,然后在语义名字空间中用该SQML创建一个灵巧请求。处理器于是在语义名字空间中打开该灵巧请求。
当语义名字空间中的某个灵巧请求被保存时,或者倘若用户想要将其作为电子邮件附件发送时,客户程序用二进制.REQ格式将表示该灵巧请求的SQML串行化,并将其保存在要求的目录路径或打开电子邮件客户程序并将该.REQ文档作为附件。
图3显示封装带有灵巧请求之SQML缓冲区的二进制文档格式,并且说明扩展名处理器如何打开该文档。类似模式也能够用于共享结果(经由SRML)。在此情况下,二进制文档将用于封装SRML,而非前述的SQML。
图4A和4B显示两个.REQ文档例子(标题为‘Headlines onReuters Related to My Research Report(Live)’{与我的研究报告相关的路透社大标题(实时)}和‘Headlines on Reuters(as of January 212003,08 17AM)’{路透社大标题(截至2003年1月21日上午08:17)});该扩展名在Windows外壳程序中有已注册的关联。第一个请求为‘实时’,第二个则是特定时间的一个快照(两者均为有时间限制的请求)。请注意,操作系统已将语义浏览器应用程序(Nervana图书馆员)与此文档关联。在打开此文档时,语义查询会在该应用程序中打开。
·保存与共享实体——与上面相同的过程也适用于此目的,区别仅为使用.ENT扩展名表示实体。在实体文档被调用时,Nervana图书馆员软件会在浏览器中打开该实体SQML。
·扩展名属性表——这将在语义环境中创建一个暂时的灵巧请求或实体(取决于文档种类),并且显示灵巧请求或实体的属性表。
·扩展名工具提示——这将在用户悬停在图书馆员文档(.REQ请求或.ENT实体)上时显示一个有用的工具提示。
4.保存与共享灵巧快照概述
信息神经系统也支持对本发明人称为“灵巧快照”之内容的共享。灵巧快照是一个时间已冻结的灵巧请求。这将令用户想要共享某灵巧请求但不让它为“实时”的情景成为可能。例如,按照默认规定,倘若用户与同行共享灵巧请求“与此文档相关的路透社突发新闻”,该同行将看到该灵巧请求的实时结果(基于“当前时间”)。然而,倘若该用户想要共享“与此文档相关的路透社[当前]突发新闻”,则将采用一个灵巧快照。
灵巧快照与灵巧请求相同(也用SQML查询文档表示),但SQML文档的“属性”部分包含将它标记为快照的属性(QUERYATTRIBUTES_SNAPSHOT旗标)。此SQML文档的创建日期/时间也存储于此SQML内(如前所述,SQML方案包含记录创建日期/时间的字段)。在用户表明想要共享灵巧请求时,用户界面(语义浏览器、信息智能体或图书馆员)会提示该人,询问他(她)是要共享灵巧请求还是要共享灵巧快照。如果用户表明为灵巧请求,则前述(第3部分)过程将被采用。如果用户表明为灵巧快照,二进制文档将用已编辑的SQML(包括快照属性)填充,前述过程的其余部分将得到执行。
一旦收件人(经由电子邮件、即时传讯等等)收到此二进制文档,在打开此文件时,扩展名处理器将会打开此文档并(如前所述)在语义名字空间中加入一个灵巧请求条目。在收件人打开此灵巧请求时,客户程序的语义查询处理器会(如前所述)将经过处理的SQML发送至服务器的XML Web服务。服务器语义查询处理器于是处理此SQML且通过调用相对与SQML创建日期/时间的语义查询而符合其快照属性。如此一来,查询结果就会对应于原始日期/时间,因而符合寄件人的意图。
5.虚拟知识社区
虚拟知识社区(代理)是指信息神经系统的一项特征;该特征允许知识社区出版商让所发表的一群服务器看上去象是一部服务器。例如,路透社可能有按行业划分的路透社知识社区(针对制药、油气、制造、金融服务等等),但也可选择显露一个‘路透社’知识社区。如要这样做,路透社将发表与宣布该虚拟知识社区的SQML(而不是XML Web服务之WSDL的URL)。此SQML将包含实际知识社区之WSDL的一个混合器(或集合)。语义浏览器于是将拾取此SQML并显示该知识社区的一个图标(好象是一个单一服务器)。在该知识社区上的任何动作将被传播到此SQML内的每个服务器。倘若有关用户没有采取该动作的权限,该Web服务呼叫将会因此而失败,否则该动作将得到执行(与用户人工创建包含这些知识社区的一个混合器并无区别)。
6.实现时间制约语义查询
时间制约语义查询最好以某种聪明方式实现,以照顾到有关知识社区(代理)的知识生成速度。例如,每秒钟收到10个文档之服务器上的‘突发新闻’与每月收到10个文档之服务器上的‘突发新闻’并不相同。因此,服务器上的语义查询处理器最好根据信息在该服务器上积聚的速度调整其对时间制约语义查询的处理。一般经验法则可用于实现这一目的,例如:
·最新的N个对象;其中N将基于每分钟的新对象数目而得到调整。
·过去N分钟内收到的全部对象且对象数目有一上限(即min(上限、过去N分钟内收到的全部对象))。
N亦可基于查询是否为大标题或突发新闻而加以调整。在最佳实施方式中,新闻人物查询最好以与大标题相同的时间制约参数实现。
7.文本转为语音外壳概述
文本转为语音在对象一级和请求一级实现。在对象一级,对象外壳运行一个脚本以接收对象的SRML、解释该SRML、然后将(SRML字段内)有选择的文本块传递给文本转为语音引擎(例如,使用Microsoft Windows Speech SDK)以生成语音输出。
图5为说明文本转为语音对象外壳的图示。在执行时,图5所示的传递途径会导致下列语音输出:
1.Reading Email Message{读出电子邮件}
2.适当延迟
3.Message From Nosa Omoigui{自诺萨·欧莫贵的邮件}
4.适当延迟
5.Message Sent to John Smith{致约翰·史密斯的邮件}
6.适当延迟
7.Message Copied To Joe Somebody{抄送乔某人}
8.适当延迟
9.Message Subject Is Web services are software buildingblocks used for distributed computing{邮件主题为Web服务是分布式计算所用的软件构件}
10.适当延迟
11.Message Summary is Web services{邮件概括为Web服务}
12.适当延迟
13.[选用]Message Body is Web services are software buildingblocks used for distributed computing{邮件正文为Web服务是分布式计算所用的软件构件}
此例假定了如下的语音外壳模板:
1.Reading Email Message{读出电子邮件}
2.适当延迟
3.Message From<邮件作者名字>
4.适当延迟
5.Message Sent to<邮件发送:收件人名字>
6.适当延迟
7.Message Copied To<邮件抄送:收件人名字>
8.适当延迟
9.Message Subject Is<邮件主题文本>
10.适当延迟
11.Message Summary is<邮件正文概括>
12.适当延迟
13.[选用]Message Body is<邮件正文>
其他模板亦可用于转换成易于理解且传达了被转换对象类型之语义的语音。与上面所示之(用于电子邮件)的例子相似,有关实现应针对所有信息对象类型使用适当的文本转为语音模板,从而捕获该等对象类型的语义。
在请求一级,语义浏览器的演示引擎(演示程序)载入一个外壳;该外壳负责接收所有要转换之当前对象(基于用户选定的光标位置)的SRML和为每个对象光标文本转为语音对象外壳。这在本质上是针对每个要转换的XML对象依次重复文本转为语音动作。
电子邮件对象(SRML)
对象解释引擎(对象外壳)
文本转为语音引擎
From:Nosa Omoigui{自:诺萨·欧莫贵}
To:John Smith{致:约翰·史密斯}
Cc:Joe Somebody{抄送:乔某人}
Subject:Web services{主题:Web服务}
Summary:Web services are software building blocks used fordistributed computing{概括:Web服务是分布式计算所用的软件构件}
Body:Web services...{正文:Web服务......}
语音输出
Reading Email Message{读出电子邮件}
延迟
语音输出
Message From Nosa Omoigui{自诺萨·欧莫贵的邮件}
延迟
语音输出
Message Sent To John Smith{致约翰·史密斯的邮件}
延迟
语音输出
Message Copied To Joe Somebody{抄送乔某人}
延迟
Message Subject is Web services are software building blocksused for distributed computing{邮件主题为Web服务是分布式计算所用的软件构件}
语音输出
延迟
语音输出
Message Summary is Web services{邮件概括为Web服务}
延迟
语音输出
Message Summary is Web services{邮件概括为Web服务}
图6展示了若干电子邮件对象经由某请求外壳在语义浏览器中的呈现。
From:Nosa Omoigui{自:诺萨·欧莫贵}
To:John Smith{致:约翰·史密斯}
Cc:Joe Somebody{抄送:乔某人}
Subject:Web services{主题:Web服务}
Summary:Web services are software building blocks used fordistributed computing{概括:Web服务是分布式计算所用的软件构件}
Body:Web services...{正文:Web服务......}
电子邮件对象1
对象外壳(对象1)
电子邮件对象2
电子邮件对象3
电子邮件对象N
8.语言翻译外壳
语言翻译外壳的实现与文本转为语音外壳相似,区别只是沿语言轴进行转换。XSLT外壳(灵巧风格)能够调用某软件引擎以自动进行实时语言翻译,然后生成用Unicode(每字符16位)编码的XML以照顾到各种不同语言。生成最终表示输出的XSLT转换于是将使用就已翻译的XML之内容而言适当的字符集再现其输出。
语言不可知的语义查询
语义查询也可以语言不可知的方式调用。这可通过具有一个翻译层(SQML语言翻译器)来实现;该翻译层将语义浏览器生成的SQML翻译成适合KDS(或KBS)解释的形式;该KDS(或KBS)则有一个已种植一种或多种语言的知识域本体分类。SQML语言翻译器翻译由谓词(例如关键词、文本、类别等等)涉及的对象,然后发送至服务器端语义查询处理器进行解释。其结果于是由语言翻译外壳翻译回原始语言。
9.类别作为用户体验中的第一类对象
这是指用于向最终用户显露知识社区之类别的一项特征。最终用户将能够把类别作为某种信息类型而发出查询,例如‘Web服务’。该元数据于是将在语义浏览器中显示,如同任何第一类信息对象类型一样。视觉化、动态链接、语境调色板等等也将利用类别对象作为中心点而可供使用。当用户想要开始于类别,然后用它作为动态定位的中心点,而不是开始于以该类别作为参数的灵巧请求(灵巧智能体)时,这项特征就会有用。
10.分类注解
分类注解按照第一类对象的类别而分类。用户将能够对直接注解类别,从而模拟映射到类别的电子邮件名单。然而,倘若有许多类别(例如在制药业),则不建议这样做;因为信息能够属于许多类别,并且用户应该不必思考哪个类别需要注解,用户应该将该注解直接发布给知识社区,它将在那里被自动分类,或者用户应该注解诸如文档或电子邮件等比类别更多语境脉络的对象。
11.附加的语境模板
1.专家——专家特征在本人母申请第10/179,651号中被指明为一个特殊智能体。读者由该申请亦应了解,专家特征也可与语境模板部分共同工作。专家属于语境模板,并且如其名称所暗示,指明在一个或多个主题或语境(由PREDICATETYPEID_EXPERTON谓词表明)上有专长的人士。
2.兴趣群体——系指语境模板,并且如其名称所暗示,指明在一个或多个主题或语境(由PREDICATETYPEID_INTERESTIN谓词表明)上有兴趣(但未必有专长)的人员。此语境模板发回曾对语义网络的任何语义类别表示兴趣的人员。一个非常真实世界的情景将使专家发回有答案的人员,并且使兴趣群体发回有问题(或答案)的人员结果。在最佳实施方式中,这通过发回曾经撰写特定信息之人士的结果而实现;该等信息已在语义网络中使用为KIS配置的知识域进行分类。在本质上,此语境模板向用户呈现动态、语义兴趣社区。这是一个非常强大的语境模板。目前,绝大多数机构使用电子邮件分发名单(或类似手段)来表明兴趣社区。然而,这些名单不仅难于维持,而且需要管理员人工追踪(或猜测)机构中的哪些人最好属于这些名单。但是借助于兴趣群体语境模板,这些“名单”现在变成聪明和按语义的(类似于“灵巧分发名单”)。它们亦有语境脉络;这正是人工电子邮件分发名单所缺乏的特征。
与其他语境模板相似,兴趣群体语境谓词接着也由服务器端语义查询处理器加以解释。这就允许诸如“关于XML的兴趣群体”或“关于生物信息学的兴趣群体”等强劲查询。同样,这将允许诸如“关于我的本地文档的兴趣群体”和“关于我的竞争对手(一个实体)的兴趣群体)”等查询(经由拖放和(或)灵巧复制与粘贴)。兴趣群体语境模板也成为卷宗(或指南)语境模板的一部分(卷宗(或指南)语境模板显示每个语境模板的全部特殊智能体并将它们作为主智能体或请求的子查询载入)。
在最佳实施方式中,语境模板在检测“兴趣领域”时应有一个时间限制,例如三个月。这里的逻辑是,倘若有关用户在过去三个月内没有撰写与特定SQML过滤器(如果有)语义相关的任何信息(最常见者为电子邮件),则该用户要么对该类别(或类别群)没有兴趣,要么曾有兴趣但目前不再有兴趣。
3.我的项目的注解——此为一个语境模板;它是注解的一个变种,由主叫用户发表的项目进一步过滤。这将允许该用户专门监视对他(她)已发布或注解之项目的反馈。
12.导入和导出用户状态
语义浏览器将支持用户状态的导入和导出。用户能够将其个人状态保存成文档和将该文档导出到另一台机器;反之亦然。此状态将包括关于下列内容的信息(和元数据):
·默认用户状态(例如计算机熟练程度、默认兴趣领域、默认工作角色、默认灵巧风格等等)
·配置文件
·实体(按配置文件)
·灵巧请求(按配置文件)
·本地请求(按配置文件)
·已订阅的知识社区(按配置文件)
语义浏览器将显示用户界面(很可能为某个向导),从而允许用户选取要导入或导出的用户状态类型。此用户界面也将询问用户是否包括身份和(或)登录信息。当此用户界面被调用时,语义浏览器会将用户状态串行化到一个XML文档内,其中包含相应于所有用户状态类型之元数据的字段。在此XML文档被导入时,语义浏览器将在XML文档节点中定位并在客户程序环境中添加和设置相应于该XML文档中节点的用户状态类型。
13.本地灵巧请求
本地灵巧请求令用户可使用取自某知识社区(代理)的类别浏览本地信息。倘若收到的是分类本地请求,语义客户程序将从本地硬盘、电子邮件仓库等提取元数据(包括概括)并将这些元数据存储在语义元数据仓库(SMS)的本地版本中。客户程序将此XML元数据(按对象)发送至某知识社区进行分类(经由其XML Web服务)。该知识社区于是发回类别分配元数据。客户程序于是更新本地语义网络(经由本地SMS),并且如同服务器一样对语义查询做出响应。此特征本质上能够在没有本地服务器的情况下提供本地服务器之功能。
14.综合定位
综合定位不仅允许用户在演示程序内动态定位(在右侧的主结果窗格内),而且将定位与左侧的外壳程序扩展名定位综合。这在本质上合并了两个堆栈。在最佳实施方式中,这通过事件信令来实现。当演示程序想要动态定位到一新请求时,它引发指明当前浏览器视图之GUID的某种状态。该GUID与某个注册表项对应;该项亦有称为‘Navigation Event’{定位事件}、‘Next Namespace Object ID’{下一名字空间对象标识}、‘Next Path’{下一路径}的字段。‘Navigation Event’字段内有一DWORD值,指向在当前浏览器视图被载入时由该视图创建的一个事件句柄。当演示程序想要定位到一新请求时,它在语义环境中创建该请求并高速缓存发回的该请求之ID;然后动态获得该请求的适当名字空间路径(取决于该请求的信息或语境类型)并也加以高速缓存。它于是用这两个数值设置两个字段(‘Next Namespace ObjectID’和‘Next Path’)。然后它设置‘Navigation Event’(在Windows中,这通过调用名称为‘SetEvent’的Win32 API来完成)。
为了抓住该定位事件,浏览器视图在首次开始时会开始一个工作者线程。此线程等待该定位事件(并且也同时等待一关机事件,该事件在浏览器视图被终止时得到信号,在Windows中,这通过调用名称为‘WaitForMultipleObjects’的Win32 API来完成)。如果收到该定位事件的信号,该‘等候’API会返回,表明收到该定位事件的信号。该工作者线程于是会查阅注册表以提取定位状态(对象标识和路径)。它于是调用外壳程序浏览器以定位至此对象标识和路径(在Windows中,做法为提取一‘PIDL’,然后从实现IShellView之外壳程序视图实例调用IShellBrowser::BrowseTo)。
15.已访问结果提示
Nervana语义浏览器令用户能够以思考的速度在知识空间中动态定位。用户能够沿语境轴、信息轴或时间轴定位。然而,在用户定位过程中,他(她)可能看到重复的信息。例如,用户能够由某本地文档定位到‘突发新闻’,然后由‘突发新闻’结果对象之一定位到‘大标题’。可是就语义而言,一些大标题可能与突发新闻重叠(尤其是那些不久以前的新闻)。这相当于在浏览Web时由不同的‘角度’一次又一次找到相同的页面。
Nervana语义浏览器通过使用最近呈现结果的本地高速缓存来解决此重复性问题。演示程序于是通过用不同颜色或其他用户界面机制显示结果,向用户指明重复的结果。此本地高速缓存会老化(最好是在若干小时或典型‘浏览体验’之测定时间后)。旧的条目将被清除,并且此高速缓存在经过足够长时间后将最终重置。
或者,倘若用户选择,重复的结果可被弃置而完全不出现。具体地说,语义浏览器也通过在演示程序中再现结果之前删除重复结果而处理重复的结果——例如,倘若具有相同元数据的对象在不同的知识社区(代理)上出现。语义浏览器将通过进行元数据比较而检测此现象。对于诸如文档和电子邮件等未结构化的数据,语义浏览器将比较概括,如果概括完全相同,则文档也很可能相同(虽然尤其是对于很长的文档来说,这一点无法绝对保证)。
16.知识联盟
客户端知识联盟
客户端知识联盟允许用户联合多个知识社区和如同结果出自一个地方那样地使用有关结果(此联盟特征已在本人母申请第10/179,651号中描述)。在最佳实施方式中,此等客户端知识联盟的实现系通过由语义浏览器随着出自不同(加盟的)KIS之结果到达而将这些结果加以合并。
服务器端知识联盟
服务器端知识联盟是允许外部知识在某知识社区范围内得到联合的技术。例如,许多公司依赖于诸如路透社等外部内容提供者向其供应信息。可是在信息神经系统中可能出现与注解、个人出版物等相关的安全保障与隐私等问题。许多企业客户不希望将敏感的注解存储在由外部内容提供者持有和管理的远程服务器上。
为解决这个问题,外部内容提供者将用一个KIS元数据高速缓存提供其内容;该高速缓存将由用户公司持有与管理。例如,路透社将向诸如英特尔等客户提供其内容,但英特尔将持有和管理该KIS。英特尔KIS将经过路透社KIS(由此链接至KIS服务器)或路透社DSA。这样一来,敏感的英特尔注解可使用路透社内容作为语境而当作“贴条”发表,同时英特尔将依然保持对其敏感数据的控制。
联合注解
联合注解是一项非常强大的特征;它令用户可注解来自一个代理或服务器(KIS)的某项目,并用另一个服务器上类似“贴条”的注释(和/或附件)对该对象进行注解。举例来说,某服务器(称为服务器A)可能不支持注解(这可由管理员配置,并且对于没有信任域和可核实身份的互联网服务器可能属于常见情况)。用户可能从服务器A获得一份文档(或任何其他语义结果),但可能想要在支持注解的一个或多个代理(KIS)(较通常为有信任域和可核实身份的内联网或外联网代理)上注解该对象。在此情况下,注解电子邮件将包括要加注之对象的URI(该电子邮件及其附件将包含注解本身)。当服务器经过其系统收件箱且收到该电子邮件注解时,它会扫描该注解之已编码的“致”或“主题”字段并提取要注解之对象的URI。倘若该URI指向一个不同的服务器,服务器于是调用至那部服务器的一个XML Web服务呼叫(如果它有权访问),以获得该对象的SRML元数据。服务器于是将该SRML元数据加入其语义元数据仓库(SMS),并将取自该电子邮件注解的适当语义链接加入该SRML对象。这之所以非常强劲,因为它意味着该代理的用户于是不仅可以查看此注解,而且能够按语义找到该带注解的对象,尽管该对象来自不同的服务器。
倘若(用于加注的)目的服务器对要加注对象所驻留的服务器没有访问权,目的服务器会通知客户程序,客户程序于是由(该对象所驻留的)服务器取得该SRML并将完整的SRML发回至(用于加注的)目的服务器。本实施方式在本质上意味着客户程序必须首先解除对URI的参照并将SRML发送给目的服务器,而不是要目的服务器自行试图解除对URI的参照。这一方式将CPU和I/O负载分散到所有客户机上(因为这些客户机需要完成下载和解除URI对SRML的参照),所以就性能而言也是优越的。
联合注解的语义警报
按照相同方式,语义浏览器将定期(例如每分钟)轮询当前查看的用户配置文件中的每个KIS,以找到与每个当前查看的对象相关的“突发新闻”;语义浏览器也将针对注解采取同样行动。在本质上,这好象轮询每个当前显示的对象是否“刚刚被注解”。就未联合的注解(即与所注解的对象有强大语义链接的那些注解)而言,这是对包含已注解对象的KIS的直接SQML呼叫。然而,就联合注解而言,此过程会稍微复杂一些,因为尽管包含某对象的KIS不支持注解或不包含该特定对象的注解,该对象的某个副本可能已在不同的KIS得到注解。
在此情况下,针对正在显示的每个对象,语义浏览器将轮询所选定配置文件中的每个KIS并传递该对象的URI,从而“询问”该KIS该对象在其上是否已被注解。这样一来,语义警报甚至可针对联合注解而生成。
注解提示
这是指一项特征,在此KIS会发回一个语境属性,指明某对象已被加注。这可在KIS检测到注解(通常是从系统收件箱)和更新语义网络时高速缓存。此语境属性于是可用于优化性能,因为对于那些具有此属性集的对象来说,客户程序将不必再次查询KIS以了解该对象是否已经加注。这意味着通过高速缓存该对象的状态来避免对KIS的额外(且不必要)的往返呼叫。
对注解的另一种看法
想像信息神经系统的简单和语义注解特征之一种有趣方式是:现在用户知识世界的每个对象、项目或结果都将有其自己的语境收件箱。这样一来,倘若用户查看某个对象,与该对象之语境关联的收件箱就始终可供查看。
联合知识社区的类别命名与标识(URI)
这是指如何在联合知识社区中命名类别。例如,部署在Intel{英特尔}的Reuters{路透社}知识社区将被命名为Reuters@Intel,其类别将有诸如‘Reuters@Intel/InformationTechnology/Wireless/80211’{Reuters@Intel/信息技术/无线/80211}的名称。在最佳实施方式中,每个类别将由至少下列性质限定:
·知识域ID——这是一个全球唯一的标识符,用于唯一地识别该类别所属的知识域
·名称——这是该类别的名称
·路径——这是该类别的完整分类法路径
在最佳实施方式中,类别的知识域ID(而不是名称)最好用于类别URI内;这是因为在知识域的演变过程中,类别可能被重新命名(但标识符应保持不变)。最佳实施方式中类别URI的一例为:
nerv://c9554bce-aedf-4564-81f7-48432bf8e5a0?type=category&path=Information Technology/Wireless/80211
在此例中,知识域标识符为c9554bce-aedf-4564-81f7-48432bf8e5a0,URI类型为“category”{类别},类别路径为“Information Technology/Wireless/80211”。
17.匿名注解与发表
语义浏览器将允许用户在知识社区(代理)中匿名注解与发表。在此模式下,(带有该用户身份的)元数据将得到完整储存,但带有表明出版商希望保持匿名的旗标。这样一来,推理机能够使用完整的元数据进行推断,对关于出版商的请求将不会揭示其身份。或者,管理员也将能够配置知识社区(代理),从而令推理机无法使用匿名注解或发表内容进行推断。
18.语义浏览器中的离线支持
语义浏览器也将具有离线支持能力。浏览器将为每个远程呼叫建立一个高速缓存。此高速缓存将包含XML数据的条目。这可为SRML或因对XML Web服务的呼叫而发回的任何其他数据。语义浏览器会给每个呼叫一个唯一的签名,并且此签名被用于散列入该XML数据。例如,语义查询由其SQML加以散列。其他远程呼叫使用方法名称、自变量名称及自变量数据进行散列。
就对XML Web服务的每个呼叫而言,语义运行时客户程序将提取该呼叫的签名,然后将此签名映射到本地高速缓存中的某个条目。倘若浏览器(或系统)当时离线,该客户程序将发回高速缓存中的XML数据(如果存在)。如果它不存在,客户程序将向呼叫者(很可能是演示程序)发回一个错误。如果浏览器在线,该客户程序将从XMLWeb服务提取XML数据,并且通过用由该签名散列指明的文件路径重写该文件条目的之前内容来更新高速缓存。这需要假设该远程呼叫实际上是成功的;即使系统或浏览器在线,由于网络流量和其他情况,此呼叫未必成功。在这种情况下,高速缓存不会被重写(它只在有新数据时才会被重写,并且不会被先行清除)。
19.语义浏览器中保证的跨平台支持
概述
如在本人的母申请(第10/179,651号)中所讨论,信息神经系统能够以跨平台的方式实现。在可能的情况下最好采用标准协议,并且Web服务层应使用可互操作的Web服务标准和避免专属实现方式。在本质上,对这方面的测试是语义浏览器不必“知道”其与之对话的知识社区(或代理)Web服务是否是在特定平台上运行。举例来说,语义浏览器不必知道其与之对话的Web服务是在Microsoft公司的.NETTM平台或Sun公司的J2EE平台(这只是两个专属应用服务器的例子)还是在Linux或任何其他“开放源码”服务器上运行。知识社区Web服务和客户机-服务器协议应采用由诸如.NETTM和J2EETM等不同Web服务实现方式所通常支持的Web服务标准。
在理想世界里,各厂商的Web服务实现方式将认可和遵从同一套公用标准。然而,现实世界可能并非如此,至少目前还不是。倘若语义浏览器必须应付不同Web服务实现方式的独有功能性,知识社区方案最好扩展为包括一个指明Web服务平台实现方式的字段。例如,知识社区的.NETTM实现在发表时最好带有一个指明所用平台为.NETTM的字段。J2EETM亦然。这样一来,语义浏览器在提取知识社区的元数据时,无论是经由WSDL URL直接从该知识社区,还是经由多点广播、企业目录(例如LDAP)、全球知识社区目录等等收到通知,都将可以访问此字段。
语义浏览器于是能够根据知识社区的运行平台来发出因平台而异的呼叫。这不是推荐的方法;然而倘若绝对有必要发出因平台而异的呼叫,则在最佳实施方式中最好采用此模式。
20.知识造型
知识造型指企业部署信息神经系统的推荐方式。这包含部署若干KIS服务器(按高层知识域)和一个(或最多几个)存放相关本体分类和分类法的KDS(前为KBS)。KIS服务器最好按域部署,从而既不会过于狭窄以至于没有足够的知识共享定位与推理可能性,也不会过于广泛以至于扩展能力(数据库和(或)推理机所需的存储和CPU处理能力)成为问题。诚然,具体平衡点将因软硬件技术的演进而随时间移动,并且本最佳实施方式并不取决于特定平衡点。此外,KIS服务器的部署最好令访问管制在服务器一级成为必要(从而获得较高程度的安全保障),而不是在由多个群组共用同一个KIS时于群组一级施加访问管制。例如,大型制药公司可能有一个供全公司使用的肿瘤学知识社区KIS,以及另一个供进行最先进研发和申请战略专利的研究人员使用的KIS。这两个KIS可能会经过相同的信息源,但第二个KIS由于只供研发群组的用户访问使用,因而将更为安全。此外,这些研究人员的发表内容和注解可选择设定为在公司范围的KIS上无法查阅。
图7例举了制药公司的可能知识体系结构。如7图所示,KDS能够服务如下所列的若干个附属KIS:
客户机
知识综合服务器1(肿瘤学)
知识综合服务器2(药理学)
知识综合服务器3(生物工艺学)
知识综合服务器4(心脏病学)
知识域服务器(制药业)
21.KIS清仓规则
知识综合服务器(KIS)将允许管理员设置‘清仓’规则以清除陈旧元数据。如此将防止KIS上的SMS无限膨胀。此等规则可为简单的清除超过特定时限(依照公司保留旧数据的政策在2-5年之间)且没有任何注解和未标记为收藏(或已评定)的任何元数据。
22.客户端部件集成与交互作用作业流程
本系统的客户端部件,以及作业流程交互作用或使用模式,均可按若干不同步骤或序列集成。在目前的最佳实施方式中,作业流程与部件集成将如下实现:
1)外壳程序:用户经由用户界面定位或向导隐含地创建一个SQML查询(即智能体)。
2)外壳程序:用户打开某个智能体(经由树状或文件夹视图)。
3)该查询缓冲区被保存为一个文件;并且该智能体的一个注册表项会得到创建。
a)注册表项包含:智能体名、创建日期、智能体(请求)GUID、SQML路径、注释、名字空间对象类型(代理、智能体、混合器等等)、属性
4)外壳程序:该请求被交给演示程序:
a)一个注册表请求GUID条目得到创建,其中包含生成该请求的名字空间路径和SQML文件URL。
b)浏览器由命令行http://PresenterPage.html#RequestGUIDhttp://presenterpage.html/初始化和打开。演示程序载入该网页中包含的默认Chrome。
c)演示程序页面载入演示程序二进制行为和语义运行时OCX。
5)演示程序:载入SQML并经由查询管理器发出请求。
a)解析请求GUID以取得SQML文件路径。
b)将SQML文件载入缓冲区,创建资源处理器请求,将这些请求传递给资源处理器,等候和收集结果,在此概括本地资源。所有概括均沿这两条路径之一:概括由此文件路径指明的文档,或者概括此文本(从剪贴板、Outlook、Exchange等处提取)。这两条路径均会生成具有相同形式的概括,适合于包括在向语义服务器XML Web服务发出的请求内。
c)将SQML文件编译到单个服务器请求缓冲区内,包括前述任何资源概括。
d)通过调用语义运行时客户程序查询管理器来发起服务器请求。
6)查询管理器:监视服务器请求并针对数据做出回叫,也发出请求完成或超时事件的信号。回叫将进入演示程序,这意味着过程间传讯要传递XML。
7)演示程序:接收数据并载入适当外壳:
a)接收缓冲区内的SRML数据;这将递次发生。
b)确定是否有与此智能体关联的优先外壳(灵巧风格),否则选取默认外壳。
c)将SRML经由XSLT转换成优先外壳格式。随着结果的进入,此为结果树的多段作业(根为列表,然后是对象,再后是深层/镜头/BN信息)。
d)在目标DIV内用页面显示结果。此目标是行为本身的一个自变量且由根页面定义。
8)演示程序:调用语义运行时以填充语境面板(按语境模板)、深层信息、灵巧复制与粘贴,以及其他语义命令。演示程序亦载入灵巧风格;该风格于是载入与该请求的语义一致的语义图象、运动等等。
图8例举了前述之目前优先客户端部件集成与交互作用作业流程。
23.类别对话框用户界面规范
C.a.概述
类别对话框令用户可由属于某个知识域的类别文件夹(或分类法)中选取一个或多个类别。尽管在特定情况下所部署者可多可少,但是在最佳实施方式中,此对话框具有下列全部用户界面控制项:
1.Profile{配置文件}——这令用户可选取一个配置文件,借以基于已配置的兴趣领域过滤类别文件夹(或分类法)。例如,假设某配置文件将兴趣领域设置为“健康与医药”,选取该配置文件将只显示属于“健康与医药”兴趣领域的那些类别文件夹(例如,制药、医疗保健、基因)。这个控制项令用户可将注意力集中在与其知识域相关的分类法,而不必看到其他域的分类法。
2.Area of Interest{兴趣领域}——这令用户可选取具体的兴趣领域。按照默认规定,这个组合框设置为“My Areas of Interest{我的兴趣领域}”,而配置文件组合框则设置为“All Profiles{所有配置文件}”。这样一来,此对话框将显示所有配置文件之所有兴趣领域的类别文件夹。然而,通过使用“兴趣领域”组合框,用户能够直接指定一个用于过滤类别文件夹的兴趣领域,而无论其配置文件中有哪些兴趣领域。
3.Publisher Domain Zone/Name{出版商域区/名称}——这令用户可选取分类法出版商的域区和名字,其好处在于区分可能有名称冲突的出版商。在最佳实施方式中,出版商域名使用DNS命名方案(例如,IEEE.org、Reuters.com)。域区令用户可选取域名的范围。在最佳实施方式中,其选项为互联网、内联网、外联网。域区选择可进一步区分已发表的类别文件夹(或分类法)。一种相当常见的情况是大企业内的某个部门有其自己的内部分类法。在此情况下,该部门将获分内联网域区且将有自己的域名;例如Intranet\Marketing{内联网\营销}或Intranet\Sales{内联网\销售}。
4.Category Folder{类别文件夹}——这令用户可选取某个类别文件夹或分类法。在做出此选择时,类别树状视图中会显示选定类别文件夹的类别。
5.Search categories{搜索类别}——这令用户可输入一个或多个关键词,用于过滤当前显示的类别。例如,制药业研究人员能够选取制药业分类法,然后输入关键词“解剖学”,从而只显示该分类法中包含关键词“解剖学”的条目。
6.“Remember{记住}”复选框——这令用户可指定此对话框在退出时是否应“记住”最后一次搜索。倘若用户想要由同一个类别文件夹使用同一个关键词过滤进行多次基于类别的相似搜索或请求,这项功能就会很有用。
7.Search Options{搜索选项}——这些控制项令用户可指定此对话框应如何解释关键词。这些选项令用户可选择关键词是否应该用于分类法树内每个条目的整个分层结构,还是只用于这些条目的[终结]名称。例如,分类法条目“解剖学\细胞\嗜铬细胞”将包括在分层结构过滤结果内,因为该分层结构包含“解剖学”一词。但是,它将被名称过滤剔除,因为其终结名称(“嗜铬细胞”)不包括“解剖学”一词。
此外,这些搜索选项还令用户可选取此对话框是否应检查所有关键词、任何关键词或准确短语。
8.Categories{类别}树状视图——此树状视图显示分类法分层结构,并且令用户可选取一个或多个项目以加入创建请求向导或作为新的卷宗(指南)请求或智能体而打开。此用户界面出于性能考虑而将类别分层结构分成“类别页”。此用户界面允许用户使用按钮和滑动控制在这些页面中定位,并有一个“取消全选”按钮用于取消对当前选定之分类法项目的选取。
9.Explore{探索}按钮——这是此对话框的主请求按钮。当此对话框由创建请求向导启动时,此按钮被重新命名为“Add{增加}”且将选定项目增加到该向导的“过滤器”属性页。当此对话框由应用程序直接启动时,此按钮标记为“Explore”且在单击时启动关于选定类别的一个卷宗请求。倘若用户有多个配置文件或倘若多个分类法类别被选定,此对话框会启动另一个对话框,即“Explore Categories Options{探索类别选项}”对话框,以提示用户选取用于启动卷宗的配置文件和(或)供算子在将该等类别用做卷宗的过滤器时使用(AND{与}或OR{或})。
上述特征如图9至图11所示,其中显示了探索类别对话框的三个不同视图。
24.客户程序协助的服务器数据一致性检查
在服务器(KIS)经过知识源的过程中,有时会出现服务器的元数据高速缓存与这些来源本身不同步的问题。例如,该KIS上的web爬虫在定期经过Web时,可能在语义元数据仓库(SMS)中添加已过时的项目。在此情况下,客户程序在试图调用该源URI时将收到404错误讯息。就具有监视能力的数据源适配器(DSA)(例如能够监视变更的文件共享)而言,这不会有很大问题,因为KIS很可能会与知识源同步。然而,对于诸如网站等不具备监视或变更通知服务的来源,这就可能造成值得担忧的问题。
本人的母申请(第10/179,651号)描述了KIS如何能够使用一致性检查器(CC)从SMS中定期清除陈旧条目。然而在某些场合,由于CC必须定期扫描整个SMS和确定已编制索引的对象依然存在,此方式可能损害性能。本发明之这项特征的一个替代实施方式是由客户程序(语义浏览器)在收到404错误时通知服务器。为此目的,语义浏览器将必须为用户“打开”的每个结果跟踪何时收到404错误。就Web文档而言,甚至在用户打开结果之前,客户程序就能够在显示结果时轮询HTTP标头。在此情况下,倘若源web服务器报告了404错误(对象没有找到),客户程序应向KIS报告此事。
在KIS收到客户程序的“404报告”时,它会聪明地决定这是否意味着该对象已不再可用。KIS不能任意删除该对象,因为该404错误可能出于某个Web服务器的断续故障(例如,该Web服务器上的目录可能被暂时停用)。KIS于是应自己尝试不同时地下载该对象(或至少是Web对象的HTTP标头)若干次(例如5次)。如果所有尝试均为失败,KIS于是可断定该对象不再可用并将它从SMS中删除。如果在KIS处理此下载的过程中,另一个客户程序报告了相同对象的404错误,KIS应忽略该报告(因为这是冗余的)。
此替代方法或可大致形容为懒惰的一致性检查。在某些场合,这可能因其长处而优先获选。
25.客户端重复检测
服务器(KIS)通过在将新对象加入语义元数据仓库(SMS)前检查源URI进行重复检测。然而出于性能考虑,有时不由服务器进行严格的重复检测更为有利。在此类情况下,重复检测最好在客户端进行。此外,由于客户程序会联合来自若干个KIS的结果,它可能由不同的KIS获得重复结果。如此一来,客户程序也进行重复检测将是有利的。
在最佳实施方式中,客户程序会删除肯定重复和标记可能重复的对象。肯定重复是指具有相同URI、上次修改时间戳记、概括或概念、大小的对象。可能重复是指具有相同概括或概念但URI、上次修改时间或大小不同的对象。对于概括提取有困难的对象,则建议也使用标题来查找可能重复(也就是说,具有相同概括但不同标题的对象不被视为可能重复,因为概括可能并非对象内容的可靠指标)。此外,倘若概括或概念提取有困难(为了检测语义重叠或冗余),语义浏览器能够将文件大小检查限制为正负N%(例如5%);例如,具有相同概括或概念但不同URI、上次修改时间或大小的对象,如果其文件大小与就冗余性检查而加以比较的对象之文件大小相差不超过5%,则被视为很可能的重复而不合格。
26.客户端虚拟结果光标
当用户配置文件订阅了多个知识社区(代理)时,客户程序(语义浏览器)也向用户提供无缝隙用户体验。语义浏览器最好如同使用一个来源那样地呈现结果。同样,浏览器最好向用户呈现一个定位光标,即随着用户对页面的滚动,语义浏览器会重新查询KIS以获得更多的结果。在最佳实施方式中,语义浏览器保持一个足够大的结果高速缓存,从而避免频繁的再查询。例如,该高速缓存可被初始化为容纳5-10次滚动(页)的结果。高速缓存大小最好基于内存考虑而有一上限。随着光标的前进(或后退),浏览器会检查当前页在高速缓存中是否存在。如果在高速缓存中存在,浏览器会展示高速缓存中的结果;否则将再查询KIS以获得更多的结果,然后将这些结果加入高速缓存。
此高速缓存可设计为无限制增长或为一滑动窗口。前者的长处在于实现简单,而短处则为可能消耗大量内存。后者为本最佳实施方式所采用,其长处为较低的内存消耗和更高的高速缓存一致性,但代价为较复杂的实现。若采用滑动窗口,语义浏览器将清除不在该窗口(例如最后N(5-10)页而非其他实施方式的所有页)内的结果。
27.虚拟单一登录
客户程序(语义浏览器)在就用户订阅的知识社区(代理)进行身份验证上也向用户提供无缝隙用户体验。它经由本发明人称为“虚拟单一登录”的特征达到此目的。此模式涉及在语义浏览器就知识社区对用户进行身份验证时,用户不必为每个知识社区输入其用户名和密码。一般说来,用户将有几个用户名和密码,但可能是许多知识社区的成员(尤其是在公司内部基于部门或小组的访问,以及在基于互联网的知识社区)。这样一来,知识社区数目与验证凭据数目(每用户)之比率就很可能相当高。
借助于虚拟单一登录,用户以独立于服务器(知识社区)的方式向语义浏览器说明其登录凭据。语义浏览器在凭据高速缓存表(CCT)中储存这些凭据。CCT具有如下所示栏目:
帐号    用户    密码    知识社区条目列表
名名
·帐号名——此乃该账户的一个友好名称
·用户名——此乃登录用户名(例如电子邮件地址)
·密码——此乃已用安全专用密钥加密储存的密码
·知识社区条目列表(KCEL)——此乃使用此账户之凭据验证用户身份的知识社区名单
当用户第一次试图订阅某知识社区时(或以某种其他方式访问该知识社区,例如获得该社区之属性),语义浏览器会提示用户输入其密码,然后尝试使用得到的凭据登录该服务器。如果登录成功,语义浏览器会用得到的凭据创建一个新的CCT条目(CCTE),并且就此新CCT条目将该社区加入知识社区条目列表(KCEL)。
对于每次后续订阅尝试,语义浏览器会查阅CCT,以了解用户想要订阅的知识社区是否已就任何CCTE存在于KCEL内。如果存在,语义浏览器会提取该CCTE的凭据并使用该等凭据将用户登录。这样一来,用户就不必重复输入其登录凭据。
请注意,当操作系统已经登录到某个域上时,语义浏览器也支持传递验证。例如,倘若某台Windows计算机已经登录到某个NT(或Active Directory)域上,客户端Web服务代理也包括试图登录到某个知识社区的默认凭据。在最佳实施方式中,用户提供的附加凭据最好经由SOAP安全头传递(经由Web Services Security(WS-Security)或类似方案)。如需WS-Security和在SOAP头内传递验证信息的详细资料,请参阅http://www.oasis-open.org/committees/download.php/3281/WSS-SOAPMessageSecurity-17-082703-merged.pdf。
语义浏览器显露了一项属性,从而令用户可指明在某CCTE的KCEL是空的时,该CCTE的凭据最好是得到清除还是应该保存。在最佳实施方式中,除非用户另有指示,该等凭据按默认规定最好得到保存。如果用户想要清除该等凭据,那么在某知识社区不再为浏览器内的任何配置文件所订阅时,知识社区应从该知识社区存在其中的CCTE中删除。如果在将该知识社区从CCTE的KCEL中删除后,该CCTE变成空的,则该CCTE最好由CCT中删除。
如同本应用程序中的许多特征一样,虚拟单一登录特征能够用于并非本人之信息神经系统或虚拟图书馆员的其他应用程序。举例来说,此特征能够被任何必须登录到不止一个域的计算机用户采用。
28.名字空间对象动作矩阵
下表显示在名字空间对象被复制和粘贴到其他名字空间对象上时语义浏览器调用的动作。
目的→来源↓ 实体 组合(实体集合) 对象(结果) 配置文件 默认配置文件 请求 卷宗(指南)   知识社区(代理)   应用程序(根图标)
  实体   对象镜头(卷宗)  复制  对象镜头(卷宗)   复制   复制   查询   卷宗查询   卷宗查询(自知识社区)   不适用(在替代实施方式中作为默认配置文件内的书签
目的→来源↓ 实体 组合(实体集合) 对象(结果) 配置文件 默认配置文件 请求 卷宗(指南)   知识社区(代理)   应用程序(根图标)
  打开)
  组合(实体集合)   对象镜头(卷宗)   复制(副本)   对象镜头(卷宗)   复制   复制   查询   卷宗查询   卷宗查询(自知识社区)   不适用(在替代实施方式中作为默认配置文件内的书签打开)
  对象(结果)   对象镜头(卷宗)   对象镜头(卷宗)   对象镜头(卷宗)   复制(书签)   复制(书签)   查询   卷宗查询   卷宗查询(自知识社区)   (作为默认配置文件内的书签打开)
  配置文件   不适用   不适用   不适用   不适用   不适用   不适用   不适用   不适用   不适用
  默认配置文件   不适用   不适用   不适用   不适用   不适用   不适用   不适用   不适用   不适用
  请求   灵巧镜头   灵巧镜头   灵巧镜头   复制   复制   智能体镜头   卷宗智能体镜头   卷宗智能体镜头(自知识社区)   复制(至默认配置文件)
  卷宗(指南)   卷宗灵巧镜头   卷宗灵巧镜头   卷宗灵巧镜头   复制   复制   卷宗智能体镜头   卷宗智能体镜头   卷宗智能体镜头(自知   复制(至默认配置文件)
目的→来源↓ 实体 组合(实体集合) 对象(结果) 配置文件 默认配置文件 请求 卷宗(指南)   知识社区(代理)  应用程序(根图标)
  识社区)
  知识社区(代理)   卷宗灵巧镜头(自知识社区)   卷宗灵巧镜头(自知识社区)  卷宗灵巧镜头(自知识社区)   复制(订阅)   复制(订阅)   卷宗智能体镜头(自知识社区)   卷宗智能体镜头(自知识社区)   卷宗智能体镜头(自源知识社区)  复制(订阅)至默认配置文件
29.动态端到端本体分类或分类法更新与同步
信息神经系统将支持本体分类与分类法的动态更新。由Nervana发表(或由第三方本体分类出版商提供给Nervana)的知识域插件将存放在Nervana Web域(Nervana.com)上的某个中央Web服务(本体分类站)。每个KDS于是将使用某Web服务呼叫(对于其每个知识域插件,由该插件的URI或某全球唯一的标识符指明)定期轮询该中央Web服务,并且将“询问”该Web服务该插件是否已经更新。Web服务将使用该本体分类的上次修改时间戳记来确定该插件是否已经更新。如果该插件已经更新,Web服务会将新的本体分类文件发回给主叫KDS。该KDS于是更换其本体分类文件。
倘若KDS在更新时正在运行,除非它支持文件变更通知和重新载入本体分类(此为推荐的实现方式),否则通常将暂停服务以更换该文件。
每个KIS也必须轮询所连接的每个KDS,从而“询问”该KDS其本体分类是否已改变。在最佳实施方式中,KIS应轮询KDS而不是该中央的Web服务,以免KDS具有不同的本体分类版本。KDS也使用知识域插件的上次修改时间戳记来确定本体分类是否已改变,并且告知KIS。如果本体分类已改变,KIS需要相应更新语义网络。在最佳实施方式中,它将删除不在本体分类之新版本中的类别之语义链接,以及基于本体分类的新版本添加或修改语义链接。在替代实施方式中,它将清除语义网络并重新编制索引。
客户程序于是轮询所订阅的每个KIS,以确定其(直接经由该中央Web服务或经由KIS)订阅的分类法是否已改变。KIS经由XMLWeb服务显示一种方法,藉此客户程序可确定分类法是否已改变(利用分类法或本体分类插件文件的上次修改时间戳记)。倘若分类法已改变,客户程序需要更新类别对话用户界面(和其他基于用户界面的分类法从属部件),从而显示新的分类法。
对于中央发表(例如经由Nervana)的分类法,客户程序应轮询该中央Web服务以更新分类法。
利用此模式,客户程序、KIS、KDS、中央分类法或本体分类站将可保持同步。
30.调用卷宗(指南)查询
卷宗语义查询处理
卷宗(指南)查询的调用,最好是由客户端语义查询处理器通过解析该请求或智能体的SQML并用每个特殊智能体(语境模板)语境谓词(例如,All Bets{所有匹配}、Best Bets{最佳匹配}、Breaking News{突发新闻}、Headlines{大标题}、Random Bets{随机匹配}、Newsmakers{新闻人物}等等)取代卷宗语境谓词。每个查询(每语境模板)于是如同单个查询那样经由查询处理器调用。这样一来,用户在卷宗一级操作,而语义浏览器则在幕后将卷宗映射到单个查询。
举例来说,“Dossier on Category C”{关于类别C的卷宗}之SQML将得到解析,并且将会生成下列新SQML查询:
·All Bets on Category C{关于类别C的所有匹配}
·Best Bets on Category C{关于类别C的最佳匹配}
·Breaking News on Category C{关于类别C的突发新闻}
·Headlines on Category C{关于类别C的大标题}
·Random Bets on Category C{关于类别C的随机匹配}
·Newsmakers on Category C{关于类别C的新闻人物}
·等等
客户端语义查询处理器保留除语境谓词外的所有其他谓词。这样一来,这些过滤器将与前例保持一致。
卷宗灵巧镜头
如同信息神经系统中的其他请求或智能体一样,卷宗(指南)能够用做灵巧镜头(就如同它们如何能够作为拖放、灵巧复制与粘贴等的目标一样)。在此情况下,此灵巧镜头会显示一个“卷宗预览窗口”,其中有每个语境模板(特殊智能体)的区域、选项卡或框架。图12和图13中包括了显示卷宗灵巧镜头之用户界面的卷宗样本屏幕抓图。
卷宗屏幕抓图
31.知识社区(代理)语义
下面描述在语义浏览器中的语义名字空间或环境之语境内知识社区(代理)的语义:
1.选取一个知识社区——这就打开来自该知识社区的一个卷宗请求。在本质上,此卷宗等同于该知识社区的“主页”。
2.拖放(文档、文本、实体、关键词等)到某个知识社区——这就(使用默认谓词)打开来自该知识社区之关于该对象的一个卷宗请求或智能体。
3.复制知识社区到剪贴板——如此就选取知识社区作为灵巧镜头。当用户在某个结果或实体上悬停时,语义浏览器显示此灵巧镜头;方法为在光标下面出示知识社区名和知识社区的配置文件名并随后在镜头预览窗格内打开该知识社区关于镜头下对象的一个卷宗。
4.订阅某知识社区——当某知识社区初次被订阅时,语义浏览器会将该知识社区的电子邮件地址加入本地电子邮件联系人名单(例如在Microsoft Outlook或Outlook Express中)。这就令用户可通过向该知识社区发送电子邮件(经由集成的联系人名单)而轻易地在该知识社区发表知识。与此相仿,当所有配置文件均取消对该知识社区的订阅时,语义浏览器会询问用户是否应该将该知识社区从本地电子邮件联系人名单中删除。
32.动态本体分类和分类法映射
使用分类法和本体分类的难题之一,在于如何将一个分类法或本体分类的语义映射到另一个上。信息神经系统使用以下算法达到此目的:
每个KDS将负责本体分类映射(经由一个本体分类映射器(OM)),并且将使用一个本体分类映射表(OMT)来定期更新中央Web服务(本体分类站)。此更新是双向的:KDS将定期由中央Web服务更新其本体分类和分类法,并且发送OMT的更新至中央Web服务。每个OMT都是不同的,但中央本体分类站会将所有OMT合并成一个主OMT。分类映射器将营造一致的用户体验,因为用户不必由总分类法中选取所有相关但重叠的项目。语义浏览器将自动处理这个事项。KIS对该映射器一无所知,但将由KDS得到映射的结果,并且于是将使用这些结果来更新语义网络。
然而,KDS和KIS管理员仍将需要基于每个本体分类或分类法的质量(本体分类映射仅仅是映射本体分类,而不会加以改善),负责选取合适的KDS本体分类插件。
33.语义警报优化
语义浏览器中的语义警报能够通过采用下列规则(按顺序)加以优化:
就给定过滤器而言(例如:结果、文档、文本、关键词、实体):
1.首先查看有无大标题。
2.如果有大标题,查看有无突发新闻和新闻人物。
这是因为在最佳实施方式中,大标题的实现与突发新闻相似,但时间窗口更大。因此倘若没有大标题(在最佳实施方式中),就不会有突发新闻。此外在最佳实施方式中,新闻人物是通过发回大标题的作者而实现。因此倘若没有大标题,就不会有新闻人物。
34.语义“新闻”图象
Corbis(http://www.corbis.com)和Getty Images(http://www.gettyimages.com)均有不断更新的“新闻”图象。信息神经系统能够将这些图象用做不仅受语境制约且“新鲜”的语义图象。这在保持用户界面有趣且常新上可能是有利的。例如,“关于萨斯病的突发新闻”不仅能够显示制药业图象,也可以使用诸如医生对萨斯病爆发做出反应的照片。
35.动态选择语义图象
语义图象能够使用下列规则动态且聪明地选取:
1.如果当前显示的名字空间对象是一个请求,解析该对象的SQML以获得类别。如果有类别,将它们发送到(存放语义图象的)中央Web服务,以获得与这些类别相关的图象。此外,将请求类型(例如:类似所有匹配和大标题的知识类型,或诸如演示等信息类型)发送到中央Web服务,以发回与请求类型一致的图象。
2.如果该名字空间对象不是请求,发送当前配置文件(如果有)的兴趣领域到中央Web服务。该Web服务于是发回与该配置文件的兴趣领域一致的语义图象。如果配置文件没有已配置的兴趣领域,发送应用程序(语义浏览器)的兴趣领域。如果应用程序没有已配置的兴趣领域,发送一个空字符串至中央Web服务;此时中央Web服务会发回普通图象(例如带品牌的图象)。
36.动态知识社区(代理)联系人成员
知识社区(代理)具有成员(拥有对该社区之读取、写入或读写权限的用户)和联系人。联系人是与该社区相关但未必属于成员的用户。举例来说,大型企业中的某部门知识社区很可能让该部门的成员作为该知识社区的成员,而让该企业的全体员工作为联系人。联系人的用途在于允许知识社区的成员找到与该知识社区语义相关但并非其成员的用户。知识社区可能为由联系人发送的内容编制语义索引,此时这个索引将包括那些联系人,尽管他们并非该知识社区的成员。
考虑这一点的另一个方法是真实世界的知识社区往往有核心成员和外围成员。核心成员是该社区中非常活跃的用户,而外围成员则包括“其他”用户,例如知识爱好者、偶有贡献者、潜在新成员,甚至包括其他相关社区的成员。
借助于信息神经系统中的动态知识社区联系人成员,KIS将在“看到后随时”(换言之,在它为包括并非成员的新用户之电子邮件编制索引时)将用户加入其在语义元数据仓库(SMS)中的联系人表和语义网络。这就令社区可以扩充其联系人名单,但同时区别成员和联系人,并且在操作本系统时(例如执行搜索等等)理解此区别的语义重要性。
37.综合性全部文本关键词与短语索引编制
KIS也编制作为语义网络第一类成员的概念(关键短语)和关键短语的索引。这能够以独立于域的方式如下进行:
对于每个要加入语义网络的新对象(例如文档):
1.从该对象的正文中提取概念(关键短语)。
2.对于每个概念,用对象类型ID OBJECTTYPEID_CONCEPT将该概念加入语义网络。用该新对象作为主语和该新概念对象作为宾语,在“语义链接”表中加入一个带有谓词PREDICATETYPEID_CONTAINSCONCEPT的语义链接。
3.对于当前概念,从概念关键短语中提取关键词,并且用对象类型ID OBJECTTYPEID_KEYWORD将每个关键词加入语义网络。并且,用该新对象作为主语和该新关键词对象作为宾语,在“语义链接”表中加入一个带有谓词PREDICATETYPEID_CONTAINSKEYWORD的语义链接。
根据该对象之方案的结构对其标题和其他元标签重复上述步骤。
尽管有些实施方式不需要综合性全部文本索引编制,但是此特征由于提供若干项有用的长处,因此已包括在目前最佳实施方式中。
1.它允许实现语义过滤器(在SQML中)的一致模式。用户能够添加类别、文档、实体、关键词作为过滤器,并且这些过滤器被一致地(作为子查询)应用于语义网络。
2.尤其是它支持实体的语义查询处理。实体可用类别加以定义,并且能够用关键词进一步限定(当有关关键词在不同语境中可能意指不同事情时消除这些关键词的歧义)。综合性全部文本索引编制允许KIS语义查询处理器(SQP)无缝隙解释实体,即通过对语义网络应用带有类别和关键词或概念的必要子查询。
3.一般说来,综合性全部文本索引编制可以导致无缝隙且一致的数据与查询模式。
38.语义“标记对象为已读”
在某些情况下,KIS可能没有以按对象的方式储存人员与对象间语义链接的资源。此外,基于语义的冗余性与按对象的冗余性(例如电子邮件)不同。举例来说,电子邮件客户程序允许用户将某电子邮件选取为已读或未读;这通常由与该电子邮件一起储存在邮件服务器上的某个旗标实现。然而,由于电子邮件不是语义系统,服务器上相似或相同的邮件不会同样标记;无论是否存在语义冗余性,用户都必须分别标记每个邮件。
在信息神经系统中,用户能够与电子邮件并无不同地将对象标记为已读。然而在此情况下,语义浏览器从该对象中提取概念并告知请求配置文件中的所有KIS该等“概念”已被读取。KIS于是经由其所配置的KDS动态地将该等概念映射到类别,并且在属于那些类别的对象上加一旗标(在最佳实施方式中),以及(或者)将带有在相应于该等概念的类别和链接到该等类别的所有对象之间的一个带有谓词PREDICATETYPEID_VIEWEDCATEGORY之语义链接的一个旗标加到语义网络上。在最佳实施方式中,KIS应只标记超过(对于源概念)链接强度阈值的那些类别。如此就确保只有与原始对象语义关系密切的那些对象(在最佳实施方式中)和(或)类别会被标记。
当语义浏览器经由KIS标记该对象时,KIS应发回一个旗标以表明网络是否已经更新(倘若该对象没有任何“强”类别或者倘若没有其他对象共用相同的“强”类别,则可能不会做出改变)。倘若请求配置文件中的至少一个KIS表明网络已经更新,语义浏览器应刷新该请求或智能体。语义浏览器能够显示一项属性,从而令用户可表明他(她)希望KIS只发回未读对象或所有对象(已读或未读)。若为所有对象,浏览器应区分显示未读对象(如同电子邮件客户程序用粗体显示未读邮件那样)。语义浏览器中的表示层于是应使用适当的字体和(或)颜色显示已读和未读对象,从而提供清晰的视觉区分。
39.多重选择对象镜头
多重选择对象镜头是本人母申请中所描述之对象镜头的替代实现。在该实施方式中,对象镜头系经由灵巧复制与粘贴调用,也就是把某个对象粘贴到另一对象上将调用具有适当默认谓词的对象镜头。其益处在于令用户可跨语义浏览器的不同实例、跨多个配置文件、以及由其他环境(例如文件系统、文本处理器、电子邮件客户程序等等)复制对象。
在当前最佳实施方式中,此对象镜头是一个卷宗镜头(语境谓词为一卷宗,过滤器为源对象和目标对象,配置文件为源对象显示所在的配置文件)。
多重选择而非复制与粘贴也可用于调用对象镜头。语义浏览器将允许用户选取多个对象(结果)。该用户于是可通过点击某个按钮(或替代用户界面对象)而就选定的对象调用对象镜头。在此情况下,一个带有卷宗语境谓词的卷宗镜头将会显示(在某预览窗格内),过滤器为该等选定的对象,当前配置文件则为请求配置文件。
40.基于本体分类的过滤和垃圾邮件管理
KIS(知识综合服务器)将只在语义元数据仓库(SMS)中添加特定对象;即该等对象属于来自该KIS已经(经由一个或多个KDS)得到配置之知识域的至少一个类别。这在本质上意味着KIS不会为它“不懂”的对象编制索引。对此的例外是KIS将为来自系统收件箱的所有对象编制索引,因为该收件箱有时包含针对个人社区的出版物和注解;该等出版物和注解可能相关但不总是语义相关。
此基于本体分类进行过滤的模式之一项副作用是垃圾邮件管理——基于本体分类的索引编制将有效地防止垃圾邮件被编入索引和得到储存。倘若用户使用语义浏览器而非其收件箱查看电子邮件,则只有经过语义过滤的电子邮件将可通过。
41.结果提炼
请求或智能体的结果可经由更多的过滤器和谓词进一步提炼。举例来说,关于生物信息学的大标题请求或智能体可用针对生物信息学之特定领域的关键词进一步提炼。这样一来,最终用户能够使用该请求或智能体作为基础,进一步缩小结果集合。此外,对于时间制约的请求,用户能够指定一个取代默认时间窗口的时间窗口。举例来说突发新闻的默认时间请求可能已设置为3小时。用户(除按配置文件或在应用程序范围内改变默认值外)应能够利用某种适当的用户界面机制(例如一范围介于1至24小时的滑标),就特定请求或智能体取代此默认设置。这也同样适用于大标题和新闻人物(例如一范围介于1日至1星期的滑标)。
一旦用户指定过滤器取代,语义浏览器会针对请求配置文件中的每个KIS调用XML Web服务呼叫,并且将该取代自变量作为该呼叫的一部分传递。如果存在取代自变量,Web服务使用那些数值而不是默认过滤器数值。这同样适用于附加过滤器(例如关键词),这些将作为附加自变量传递给Web服务且Web服务将适当应用附加子查询,从而进一步过滤该智能体或请求SQML中指定的查询(换言之,SQML会一如既往地传递,但除此之外,过滤器取代和附加过滤器也会得到传递)。
过滤器取代的一个很好例证将是最佳匹配。最佳匹配的默认语义关联强度可能设置为90%(在最佳实施方式中)。然而就给定请求或智能体而言,用户可能想要看到跨某语义关联度范围的“匹配”。显露一关联度用户界面控制(例如一范围介于0%至100%的滑标)即可允许这样做。这实质上相当于令用户可将最佳匹配在“所有匹配”(0%)和“理想匹配”(100%)之间随时改变。
包含多个过滤轴的语境模板(特殊智能体)实现之实施方式亦应采用某种混合模式。例如,突发新闻也可采用25%关联度过滤器,大标题和新闻人物或可采用50%关联度过滤器(突发新闻之所以具有较低的关联度阈值,是因而它的时间制约阈值较高,因而关联度阈值能够放宽)。在此情况下,语义浏览器应显露一些用户界面控制项,令用户可跨这两个轴提炼特殊智能体(一个时间制约滑标和一个关联度滑标)。
借助于卷宗,语义浏览器能够显示卷宗中出现的每个特殊智能体的用户界面控制项,主卷宗窗格能够显示所有用户界面控制项(改变任何用户界面控制项则将刷新该特殊智能体的卷宗子请求)。此外,倘若该卷宗就每个特殊智能体而言有选项卡,每个选项卡可有该选项卡针对该特殊智能体的用户界面控制项。
42.信息仓库的语义管理
信息神经系统亦能够用于管理信息仓库,例如个人电子邮件收件箱、个人联系人名单、个人事件日历、桌面文件系统(例如本地和网络文件的Microsoft Windows资源管理器文件系统),以及诸如文件共享、内容管理系统、网站等其他仓库。
对于客户机上的仓库(例如电子邮件收件箱和文件系统),语义浏览器的客户程序运行时应定期经由某编程接口轮询该仓库,以查看其中的项目是否已成为冗余、陈旧或无意义。这将解决人们当今面临的一个问题,即电子邮件收件箱日益膨胀且充斥着可能已经“失去意义和关联性”的陈旧邮件。然而,由于用户必须面对的巨大信息量,许多计算机用户正在失去自行管理其电子邮件收件箱的能力,因而导致陈旧且或许无关的邮件大量堆积,不仅占用储存空间,而且令找到有关的邮件和项目更加困难。
客户程序运行时应列举用户信息仓库中的项目,从这些项目(例如从电子邮件正文和从本地文档)中提取概念,并且将这些概念发送给用户配置文件中的KIS。在一替代实施方式中,唯有默认配置文件应被使用。客户程序于是在本质上“询问”用户订阅的KIS该等项目对这些KIS来说是否有任何意义。在最佳实施方式中,客户程序应采用如下的启发式规则:
1.首先,查看有无冗余性——通过标记(或删除)重复的电子邮件项目、具有相同概念和概括(但也许有不同标题或文件大小)的重复文档。客户程序应要么删除重复项目(用户可配置),要么通过将该等项目移动到电子邮件客户程序或桌面机内的某专用文件夹(用户可配置)而标记这些项目。
2.下一步,对于不重复项目,客户程序应查看是否无意义或不相关。首先,客户程序应通过查看电子邮件项目、文档或其他对象的上次修改时间,只检查“旧于”N日(例如30日)的项目。对于符合条件的项目,提取所包含的概念并就该用户的所有配置文件(或替代实施方式中的默认配置文件)中的每个KIS呼叫XML Web服务。
3.对于很旧的项目(例如旧于180日),客户程序应向XML Web服务指定一个很低的保存意义阈值(例如25%)。这在本质上相当于删除(或标记)很旧且意义很弱的那些项目。
4.对于相当旧的项目(例如旧于90日但新于180日),客户程序应指定一个很低的保存阈值(例如10%)。这相当于删除(或标记)相当旧且意义很弱的那些项目。
5.对于旧项目(但不太旧,例如旧于1日但新于30日),客户程序应指定一个很低的保存阈值(例如0%)。这相当于根据该用户的配置文件,删除(或标记)旧(却不太旧)但无意义的那些项目。
本最佳实施方式的此方面或特征之模式,通过对较新的项目施加较高的语义阈值(因此保存可能大体上——尽管并非完全——无意义但相当新的项目),在本质上平衡了语义制约和语义制约。举例来说,相当新近的电子邮件线索可能在意义上很弱,但客户程序还是应当加以保存,因为其新近性也是关联性的一个迹象。然而,随着这些邮件的“老化”,客户程序就可安全地将之删除(或标记为删除)。
此模式亦能够应用于管理本地文件系统上的文档。此模式能够延伸到内容管理系统、文档库等等;方法为配置一个信息仓库监视器(ISM)以监视此类系统(经由对信息神经系统XML Web服务的呼叫),以及将ISM配置为带有KIS,而该等KIS已配置为带有KDS,并且该等KDS具备与欲进行语义管理的库之域一致的本体分类。这项特征通过语义管理内容管理系统和确保随时间的流逝只有相关项目在那些系统上得到保存,将节省储存空间和储存与维护成本。
43.计算尺过滤器用户界面
语义浏览器中的提炼窗格令用户可“在结果中搜索”。用户将能够添加更多关键词、指定日期范围等等。日期范围能够以类似计算尺的方式实现。移动计算尺上的一个面板将移动日期下限,而移动另一个面板则将移动日期上限。然后可以添加用于控制时间边界的其他面板,移动时间和日期面板将施加日期和时间约束。亦可添加控制其他过滤轴的面板。
D.服务器端语义查询处理器规范
1.概述
本节描述了服务器端语义查询处理器(SQP)如何解析SQML查询的一个当前最佳实施方式。在给定服务器上,查询可被分解成若干个部件:
a.语境(文档、关键词、实体、组合(或实体集合))。
b.语境或知识模板(或特殊智能体)或信息模板——这描述有关请求是否属于知识类型(例如突发新闻、会话、新闻人物或流行项目)或特定信息类型(例如文档、电子邮件)。
在客户端,语义查询由语境、请求(或智能体)类型、知识社区(或代理)的三角形构成。客户程序向该请求所处的配置文件中的所有知识社区发出表示该语义查询的SQML。客户程序一次要求几个结果,然后汇集来自一个或多个服务器的结果。
服务器端语义查询处理器将语义查询细分成若干个子查询,然后加以应用(在最佳实施方式中经由SQL内部联结或子查询)。此类子查询为:
1.请求类型子查询——这表示取决于请求类型的子查询(语义或非语义),例如语境(知识)类型(例如所有匹配、最佳匹配、大标题)和信息类型(例如常规文档、演示文稿、网页、电子表格等等)。
2.语义语境子查询——这表示由客户程序所传递之语境(过滤器)导出的语义子查询(例如由客户程序发送或由关键词或文本经语义词汇提取的类别)。
3.非语义语境子查询——这表示由客户程序所传递之语境(过滤器)导出的非语义子查询(例如未经语义词汇提取而映射至基于本体分类之类别的关键词)。
4.访问管制子查询——这表示用于滤除语义元数据仓库(SMS)中主叫用户无权访问的那些项目的子查询。详细资料请参阅“安全保障”规范。
前述步骤已在图14(服务器端语义查询处理器部件)中展示。图14反映了服务器端语义查询处理器如何处理输入的(由SQML表示的)语义查询。
2.语义关联度分值
语义关联度分值定义了概念提取引擎发回的标准化得分。它将文本“斑点”的给定术语映射到给定本体分类的一个或多个类别上。在项目被加入语义网络时,此分值被加入语义网络(在“SemanticLinks”表的“LinkStrength”字段内)。
3.语义关联度过滤器
关联度过滤器与关联度分值不同(的确,两者通常将被合并)。关联度过滤器表明SQP如何依语义解释语境(附注:在当前最佳实施方式中,此过滤在此情况下始终依语义进行)。关联度过滤器有两种:高和低。当有高关联度过滤器时,SQP将包括一个作为类别和术语之交叉点的子查询。例如,关键词“XML”的语境将解释为:类别与XML相同且包括关键词“XML”的项目。这在能够发生的基于本体分类之语义过滤中属于最高程度。然而,倘若语义网络(或语义元数据仓库(SMS))中有依语义与该语境等同但不包含共同关键词或术语的对象,则可能导致信息丢失。例如,上述查询将会错过类别与XML相同但包括关键词“Extensible Markup Language”{可扩展标记语言,XML的英文全称}的项目。低关联度过滤器将只包括与该语境类别相同的对象;但与高关联度过滤器的不同之处在于不包括附加的关键词等同约束。
有鉴于此,关联度过滤器最好只用于创建子查询“桶”;这些桶于是用于排列结果。例如,SQP在过滤语义网络时可能决定让高关联度过滤器优先于低关联度过滤器,但将依然发回这两者的结果(重复者已删除),从而有助于保证在最终的语义过滤中同义词不会被剔除。
4.时间制约过滤器
时间制约过滤器决定着语义子查询的时间关键程度。它有两个程度:高和低。高过滤器意味着极为时间关键,默认值为3小时(这已考虑到午餐休息和离开办公桌等的时间)。低过滤器意味着适度时间关键,默认值为12小时。
5.知识类型语义查询实现
在本申请全文中,特定知识类型由贴切的简称指代;其中一些简称由申请人用做或可能用做商标。本节更详细地解释其中一些简称的性质和功能。
E.a.All Bets{所有匹配}
对于“All Bets”查询,服务器将发回语义元数据仓库内的所有项目。如果SQML有过滤器,这些过滤器将经由无语义链接强度阈值的内部子查询施加。例如,All Bets on Topic A{关于主题A的所有匹配}将发回与主题A有任何关联(无论强关联或勉强关联)的全部项目。
F.b.Random Bets{随机匹配}
在最佳实施方式中,就“Random Bets”查询而言,服务器会将发回语义元数据仓库内的所有项目(如同“所有匹配”一般),但将随机排列结果。如果SQML有过滤器,这些过滤器将经由无语义链接强度阈值的内部子查询施加。例如,Random Bets on Topic A{关于主题A的随机匹配}将发回与主题A有任何关联(无论关联或勉强关联)的全部项目(随机排列)。
G.c.Breaking News{突发新闻}
如果服务器有用户状态,突发新闻能够以很聪明的方式实现。下表例举了服务器在跟踪用户已阅读的项目(和/或类别)时的突发新闻之当前最佳排名与优先级确定:
  优先级   子查询名称   时间制约过滤器   语义关联度过滤器   主排序轴   次排序轴
  1   突发未读语义新闻   低   高   创建时间   语义关联度分值
  2   突发未读语义新闻   低   低   创建时间   语义关联度分值
  3   突发已读语义新闻   高   高   创建时间   语义关联度分值
  4   突发已读语义新闻   高   低   创建时间   语义关联度分值
在最佳实施方式中,服务器以如下方式处理针对突发新闻的SQML(经由突发新闻语境谓词):
1.所有突发新闻均使用一个子查询过滤;该子查询发回的新闻必须“新于”N小时(或天、或月,可配置),如此就施加关键时间制约限制。
2.突发新闻总是依语义的。
3.在最佳实施方式中,语义网络管理器(SNM)应更新语义网络以指明每位用户对每个类别的“上次阅读时间”。此时间于是为子查询用于检查新闻是否已被阅读(按类别或按对象,按类别为最佳实施方式,因为对象不会缩放)。
4.优先权将给予用户该尚未“阅读”的新闻项目(这由将SemanticLinks表内的上次阅读时间与将“用户”和“类别”链接的语义链接类型相比较而实现)。
5.语义优先级确定方案的含意在于用户可能首先获得“较旧”的突发新闻,因为该新闻依语义更为相关;而“较迟”获得“较新”的突发新闻,因为该新闻依语义较不相关。这就导致一种关联度与时间制约的混合优先级确定方案。
6.主排序轴(创建时间)保证了结果按新鲜度过滤。次排序轴(关联度分值)用于打破并列局面并保证主要基于关联度来区分同样新鲜的结果。
7.突发新闻固有警报可通过将突发新闻优先级限制为2和将优先级1与优先级时间制约过滤器改变为高在客户程序上实现。这样一来,唯有很新鲜的(高和低语义关联度过滤器之)突发未读语义新闻将被发回。这样做是有好处的,因为此警报应有比突发新闻请求(或智能体)更高的打断阈值,因为它是默示而非明示的。
8.未读突发新闻具有比已读突发新闻高的优先级,因为用户很可能对还没有看到的内容更感兴趣。
9.未读突发新闻具有比已读突发新闻低的时间制约过滤器,因为与较新但已看过的新闻相比,用户很可能更能容忍较旧但尚未看过的新闻。
在某些情况下,服务器可能没有用户状态(和“已读”信息)。在此情况下,下面是对突发新闻的一种简单实现:
1.按照默认规定(无过滤器),突发新闻应只发回新于N小时(默认值为3小时)的项目。
2.倘若SQML中有至少一个过滤器,突发新闻应对外围子查询施加时间制约过滤器(3小时),并且对内部子查询施加有适当强度的关联度过滤器(由SemanticLinks表)。在最佳实施方式中,这应相应于50%的关联度分值(和链接强度)。例如,关于主题A的突发新闻所发回的项目应为在过去3小时内发布且属于由主题A表示的一个或多个类别且关联度分值至少为50%。这将避免错误肯定项目,例如与主题A勉强沾边的项目。
H.d.Headlines{大标题}
与突发新闻相同(只是时间制约限制较为宽松,例如高过滤器为12小时而不是3小时,低过滤器为1日而不是12小时)。在简单实现中,时间制约限制为1日。这也可在星期一时改为3日,从而动态处理周末(将日数改为“工作日数”)。
I.e.Newsmakers{新闻人物}
新闻人物的处理方式与大标题相同,只是SQP发回大标题项目的作者而不是该项目本身。
J.f.Best Bets{最佳匹配}
如本人的母申请(第10/179,651号)所描述,最佳匹配是通过对带有“属于类别的”谓词的语义链接强度施用一过滤器来实现。首选默认值为90%,但客户程序(依照用户的选择)可经由透过XML Web服务而传递的某个自变量随时更改此数值。最佳匹配由对象表和SemanticLinks表之间的一个SQL内部联结实现,并且只联结SemanticLinks表内具有“属于类别的”谓词和LinkStrength大于90%(默认值)的表行。当要处理的SQML包含过滤器时(例如关键词、文本、实体等等),服务器端语义查询处理器也必须调用一个子查询;该子查询时是一个映射到欲用过滤器的SQL内部联结。在最佳实施方式中,这个子查询应也包括一“最佳匹配”过滤器。
在最佳实施方式中,对于绝大多数用户来说,有利且较好的是外围子查询,以及内部子查询,为最佳匹配。为了例证这点,“Best Betson Topic A{关于主题A的最佳匹配}”依语义与“Best Bets that arealso relevant to Topic A{也与主题A相关的最佳匹配}”是不同的。在第一例中,唯有“关于”主题A的最佳匹配将被发回(通过在内部子查询上应用“最佳匹配”语义过滤器)。与此相反,第二例则将发回关于与主题A可能有任何牵连之任何内容的最佳匹配。如此一来,第二例就可能发回错误肯定结果,因为举例来说,关于主题A是最佳匹配但关于主题B是“弱匹配”的文档将被发回;这与该查询的语义或假定的希望结果是不一致的。将“最佳匹配”过滤器扩展到不只是外围子查询,还有所有内部子查询,将防止这一问题的发生。如果SQML包含过滤器,其他查询实现也能够遵循此规则(基于主查询的语义应用合适的子查询)。
K.g.其他知识类型的查询实现
其他知识类型以与上述相似的方式实现(经由合适的谓词)。下面描述了若干例子。
信息类型语义查询实现
所有信息类型语义查询实现都能够遵循且最好(但不一定)遵循相同的模式:SQP只发回特定对象,即具有相应于所请求信息类型的对象类型标识符的那些对象。一个例子是“信息类型\演示文稿”。在SQP解析接到客户程序发出的SQML时,它会从该SQML中提取这个属性并将此属性映射到某对象类型标识符;然后调用带有针对该对象类型标识符的附加过滤器的一个SQL查询。对于可能跨若干单个信息类型的特殊信息类型(例如“信息类型\所有文档”),SQP将该请求映射到一组对象类型标识符上,并且调用带有此附加过滤器的一个SQL查询。
语境语义查询实现
当客户程序发出包含(在客户机上从文本或文档中提取的)概念之SQML时,服务器端SQP在生成与其对应的子查询前,必须首先依语义解释该语境。为此,服务器将这些概念发送到它(为欲用的知识社区或代理)而得到配置的所有KDS(KBS)进行语义分类。服务器在接到这些类别后,最好在生成适当子查询之前确定其中哪些类别足够“强”因而将被用做过滤器。
此“过滤器强度”判定是有利的,因为倘若该语境是一篇相当长的文档,该文档可能包含数千概念和类别。这样一来,该文档的“代表性语义”或许只需该文档内所有概念与类别的某个子集即可包含。将所有类别映射到子查询将发回可能把用户弄糊涂的结果,用户很可能对该文档所包含的内容有某种“感觉”,那么倘若他(她)看到与该文档中某些弱概念相关的结果,则可能无法将该等结果与该文档的语境对号。因此在最佳实施方式中,服务器端SQP选择只将“强类别”应用于子查询。此等类别的语义强度应不低于50%。这样一来,唯有那些在语义语境中表现强劲的类别将被应用于子查询。子查询的实现于是将遵循上述规则,取决于该查询是否包含语境谓词、基于知识类型、信息类型等等。
语义词汇提取实现
如本人的母申请所描述,服务器端语义查询处理器负责完成语义词汇提取,以基于一个或多个域本体分类将关键词、文本、概念映射到类别上。达到此目的的方式之一是通过调用至其已得到配置之一个或多个KDS或KBS的XML Web服务呼叫,从而获得该等类别;然后将这些类别映射到其语义网络上。这种词汇提取形式比基于关键词变化(例如单数和复数变化、时态变化等等)的词汇提取更加优越,因为它也包含基于含义而滋生之因域而异的语义映射,而不仅仅是基于关键词的词汇提取。
在当前最佳实施方式中,KIS在每次收到需要进一步语义解释的SQML时都会呼叫KDS或KBS。然而,倘若KDS或KBS驻留在不同的服务器上,倘若网络连接不够快,或者倘若KDS或KBS忙于处理许多请求,这就可能导致延迟。在此情况下,KIS也能够实现一个语义词汇提取高速缓存。此高速缓存将关键词和概念映射到用URI完全限定的类别(令它们全球唯一)。当服务器端语义查询处理器收到包含(比如由客户端语义查询处理器从客户机上文档中提取的)关键词、文本或概念的SQML时,它首先检查该高速缓存,以了解该等关键词是否已经得到语义词汇提取。如果有高速缓存击中,SQP只需由高速缓存获取该等类别并将它们经由SQL查询映射到语义网络。如果没有高速缓存击中(即该语境不在高速缓存内),它于是呼叫KDS或KBS以完成语义分类;然后接收结果,将结果映射到唯一的类别URI,并且将该条目加入高速缓存(用该语境作为散列码)。注意,即使该语境不映射到任何类别,“缺乏类别”最好也得到高速缓存。换言之,该语境将作为没有类别的高速缓存条目而加入。这样一来,服务器亦能够快速确定给定语境没有任何类别而不必每次呼叫KDS或KBS来发现。
高速缓存管理
SQP也能够管理语义词汇提取高速缓存。它出于两个原因而必须如此:首先,防止此高速缓存不受控制地膨胀和消耗过多的系统资源(在使用基于堆的散列表时尤其是内存);其次,倘若KIS配置被改变(例如添加或删除知识域),此高速缓存最好得到清除,因为其中的条目现在可能陈旧。第一个情景可通过指定高速缓存条目的最大数目来解决。在最佳实施方式中,SQP会高速缓存当前由该高速缓存消耗的内存容量和由内存使用情况规定的高速缓存限值。举例来说,管理员可能将高速缓存最大容量设置为64MB。为了简化实现,这可对应到项目的大约数目(例如通过将最大内存用量除以高速缓存条目大小的估计值)。
对于每个新条目,如果尚未达到高速缓存限值,SQP则只需将该条目加入到高速缓存中。然而,如果已经达到高速缓存限值,SQP(在最佳实施方式中)应从高速缓存中清除最早加入的项目。在最佳实施方式中,这可通过保持一个项目队列来实现。该队列将与实现该高速缓存本身的散列表(使用语境作为键来快速查找)保持同步。在SQP需要从该高速缓存中清除项目以释放空间时,它会从该最早加入队列中剔除一个项目,并且也从散列表(使用语境作为键)中删除相应项目。这样一来,新鲜的项目将比较旧的项目更容易导致高速缓存击中。如此将造成用户在客户机上的更快速体验,因为在用户每次打开智能体、请求或查询时,已保存的智能体、请求或查询的语境将得到高速缓存且可被快速查找。将会具有相同语境(但有不同知识类型)的卷宗(指南)查询也是如此,客户程序将就相同语境请求每个知识类型;并且由于该语境将被高速缓存,每个子查询的执行就会较快。
L.信息神经系统的可扩展客户端用户配置文件规范
M.概述
可扩展客户端用户配置文件允许语义浏览器的用户针对不同的职责、知识源、身份、角色、工作风格等等具有不同的状态。这实质上令用户可为不同的情景创建不同的“知识世界”。例如,某位制药业研究人员可能有一个默认配置文件,其中包含与其工作相关的所有知识来源。如本人母申请第10/179,651号所描述,出自其中每个来源的SRML将在客户程序上合并,从而令用户可以无间断地查看所有结果,就好象它们都出自同一个来源。然而,该研究人员或许想要单独跟踪专利。倘若是这样,该研究人员将能够创建一个单独的“专利”配置文件,并且包括那些与专利有关的知识社区(代理)(例如美国专利局数据库、欧盟专利数据库等等)。
再比如,用户或许想要创建一个‘工作’配置文件和一个‘家庭’配置文件。许多投资分析师跟踪多个行业的公司。借助于语义浏览器,他们可为所跟踪的每个行业创建一个配置文件。咨询顾问往往需要在不同项目(和行业)之间转换,因而可能想要保存为每个项目创建的请求和实体。配置文件也可用来处理此情景。
配置文件包含下列用户状态:
·名称/描述——该配置文件的描述性名称。
·一个或多个知识社区(代理),指明请求(智能体)将调用之知识源(在KIS上运行)。
·身份信息——用户名(目前用该用户的电子邮件地址表示)和密码。
·兴趣领域或收藏类别——这用于向该用户建议信息社区(代理)(通过比较具有相同或相似类别的信息社区),以及作为用此配置文件创建的请求的一个默认查询过滤器。
·灵巧风格——灵巧风格将按照默认规定就用此配置文件创建的请求和实体而得到使用。
·默认旗标——指明该配置文件是否是默认配置文件。当用户希望创建请求和实体、浏览信息社区等时,默认配置文件会按照默认规定被启用。除非用户明确选取不同的配置文件,否则将使用默认配置文件。
配置文件可被创建、删除、修改、重新命名。然而在最佳实施方式中,默认配置文件不可被删除,因为本系统必须始终有至少一个配置文件。替代实施方式则不必如此。
语义浏览器内的所有对象最好都在配置文件的语境中打开。例如,对于在某个配置文件中创建的灵巧请求,客户机语义查询处理器在运行时将使用该配置文件的属性(特别是该配置文件中已订阅的知识社区(代理))来调用该请求。这就允许用户基于请求的知识特征将该请求与特定配置文件关联或用该配置文件限定该请求(更典型的则是用户希望为该请求使用的知识源)。
图15例举了显示两个配置文件的语义浏览器(名称为“MyProfile”{我的配置文件}的默认配置文件15A和名称为“Patents”{专利}的15B)。请观察用户如何能够无干扰地利用这两个配置文件在其知识世界中定位。
图16A-C举例说明了用户如何配置一个配置文件(如要创建配置文件,用户将使用“创建配置文件向导”;然后可如图所示使用属性表来修改该配置文件)。
图17展示了用户在使用“创建请求向导”创建请求时将如何选取配置文件。
N.信息神经系统的灵巧风格规范
1.灵巧风格概述
应用于某种风格主题的色彩主题和动画主题,由此得到“灵巧风格”。“灵巧”在此语境中意指该风格会适应和响应其请求的情绪、语境窗格、预览模式、手持设备模式、实况模式、幻灯片放映模式、屏幕保护程序模式、混合器与收集模式、辅助功能、用户设置识别,并且可能还有本系统内其他变量(见下)。可能的风格有无限的数目和种类或“类别”。最佳实施方式包括至少下列风格类别:
1.微妙——用于由任务主导的工作效率。
2.温和——用于由任务主导的工作效率,带有一些演示效果。
3.兴奋——令人兴奋的效果(同样适合于首要和次要机器,以及用于非活动Nervana窗口——例如背景中或停放在状态栏上的Nervana客户程序窗口)。
4.超兴奋(非常适合有助于工作效率的灵巧屏幕保护程序,例如次要机器——当用户在使用其首要机器时)。
5科幻(科幻影迷的福音,非常适合无需考虑工作效率的灵巧屏幕保护程序,例如当用户离开办公桌时)。
风格、色彩、动画等主题,可变且无限,由Nervana或许还有用户和(或)其他厂家外壳作者制作。
2.暗示和动态灵巧风格的属性
a.情绪——灵巧风格必须传达请求的情绪(即该请求是传递给灵巧风格的一个参数)。这将涉及传达灵巧请求之依语义通知或依语义决定之属性的语义图象、语义运动、视觉化等等(语境模板或信息类型,类别,无论是否有过滤器(例如本地文档),该等过滤器的信息类型等等)。
b.语境窗格——例如深层信息窗格(按对象)、语境预览窗格、可停放语境画中画观察群组或窗格等等。
c.预览模式——每个灵巧风格都必须能够预览显示其结果(在一个小窗口内)。
d.手持设备模式——每个灵巧风格都必须能够针对手持设备优化显示其结果。
e.实况模式——每个灵巧风格都必须具有一个“实况”模式,用于显示实时语义视觉化(按对象)。这可在启用或停用之间切换(例如倘若用户不欲使用实时语义视觉化,或者欲节省由实时Web服务调用而导致的每对象带宽)。
f.幻灯片放映模式——每个灵巧风格最好都必须能够“播放”请求的结果——如同实况流。
g.屏幕保护程序模式——每个灵巧风格最好都必须能够如同屏幕保护程序那样地“播放”请求的结果。这是幻灯片放映模式的一个变种,只是采用全屏幕或剧场模式。
h.混合器或集合模式——如果所显示的请求系一混合器或集合,则每个灵巧风格最好都必须适当改变其用户界面。
i.辅助功能——每个灵巧风格最好都必须支持辅助功能。
j.用户设置识别——Nervana图书馆员程序将允许用户指明自己是初学者、中级用户或高级用户,以及其各自的职能(研发、销售、营销、高级经理等等)。每个灵巧风格最好都会在适当时考虑这些职能(或受其影响)。
·每个灵巧风格最好对请求的语义负责且与之一致,从而识别(或辨认或感知)且于是视觉化(或表示或描述或展示,与用户值得注意之内容一致):
·当前请求的情绪(包括语义图象、运动、chrome等等)
·当前请求中项目数的改变
·每个对象的情绪(内在地)
·每个对象之语境的情绪(大标题、突发新闻、专家等等)
·二元或绝对事项与特征(例如,有突发新闻,或是没有?共有多少个专家?多少条大标题?),而不是程度不同或处于某个梯度或连续体上
·如果该特征处于某个梯度或连续体上,感知在其上的相对位置(例如突发新闻的突发程度有多高?大标题的关键程度有多高?专家的专长水平如何等等?)
·每个对象之语境的改变(有新的突发新闻,有新的注解等等)
·正在显示的每个对象之相对关键性(不同尺寸的查看端口,不同的字体,不同的chrome等等)
·请求定位与“载入”状态(引进正载入的新请求之情绪的填空部分)
·任何单个画中画窗口的所有属性(用动画控制作成动画)
·新画中画窗口的添加(到画中画窗口调色板上)
·画中画窗口的任何大小调整、移动、停放
·任何预览窗口(例如语境调色板、每个对象的“视觉化用户界面”、日程表等等)
·与所有前述情绪和通知之视觉化一致的声音(全部包括)
图18为‘Smart Styles’{灵巧风格}对话框的一个屏幕抓图,其中例举了一些前述操作与特征。如该图所示,此对话框令用户可以跨Style classes{风格类别}、Style themes{风格主题}、Color themes{色彩主题}、Animation themes{动画主题}浏览灵巧风格。Preview{预览}窗口向用户显示了对当前选定之灵巧风格的预览。
O.信息神经系统的灵巧请求观察规范
1.概述
灵巧请求观察是指信息神经系统的一项特征。该特征令语义浏览器(信息智能体或图书馆员)的用户可以平行监视(或“观察”)灵巧请求。这是一项很有利的特征,因为它可通过允许用户同时跟踪若干个请求而提高工作效率。
此特征在客户端语义运行时、语义浏览器及外壳中实现;允许以可配置的方式观察灵巧请求(经由类似于电视机画中画功能的机制);最好采用下列一个或多个软件组件:
1.请求观察清单(RWL)
2.请求观察群组
3.通知管理器(NM)
4.观察群组监视器(WLM)
5.观察窗格
6.观察窗口
2.请求观察清单与群组
请求观察清单是客户程序运行时管理的一个灵巧请求(或灵巧智能体)清单。此清单实质上由用户想要监视的灵巧请求构成。请求观察清单包含一系列条目,即具有下列数据结构的请求观察清单条目(RWLE):
  字段名   字段类型   字段描述
  RequestID   GUID   灵巧请求的唯一标识符
  Notification Referen ceCount   DWORD   此引用计数指明通知管理器是否应跟踪此灵巧请求是否有“新”对象
 RequestViewInstanceID   GUID   “拥有”RWLE之灵巧请求视图实例的唯一标识符。这用于动态添加且针对具体浏览器实例的RWLE,例如已分类的大标题、突发新闻、新闻作者(见下)。对于用户人工添加或经由非分类的请求观察规则(RWR)添加的系统范围RWLE(见下),此条目将初始化为NULL。
 LastUpdateTime   日期/时间   通知管理器上次更新请求结果计数的日期/时间
 RequestResultsCount   DWORD   该灵巧请求中的结果数目
 LastResultTime   日期/时间   最新发表之结果的日期/时间
请求观察清单(RWL)包含RWLE结构的一个阵列或矢量。请求观察清单管理器负责管理RWL。语义浏览器提供一个用户界面,令用户可在RWL内添加灵巧请求,此用户界面与RWLM对话以在RWL内添加和删除RWLE。此RWL由客户端语义运行时集中储存(和保持)(要么作为基于XML文件的表示,要么在诸如Windows注册表的仓库内)。
RWL也能够利用请求观察群组进行充填。请求观察群组赋予用户监视一组灵巧请求的手段,并且提供了用户让语义浏览器基于可配置的标准自动充填RWL的简单途径。请求观察群组至少有两类:自动请求观察群组和手动请求观察群组。自动请求观察群组是由语义浏览器基于选定之配置文件、当前显示请求之配置文件等等而动态充填的群组。手动请求观察群组令用户可人工充填某个灵巧请求群组(常规灵巧请求或混合器),从而作为一个集合加以监视。手动请求观察群组也令用户可添加支持的语境类型(例如文档、类别、文本、关键词、实体等等)——在此情况下,本系统将由过滤器动态生成语义查询(SQML)并将由此得到的查询加入手动请求观察群组。这就令用户不必首先基于一个或多个过滤器创建时间制约请求,然后再将这些过滤器加入观察群组——因此用户能够将注意力集中在过滤器上,其余部分由本系统完成。
用户将能够添加下列类型的自动RWG(为一个或多个可配置的配置文件,包括如图19之灵巧请求观察对话框中所示的“AllProfiles”{所有配置文件}:
1.Breaking News{突发新闻}——这会告知语义浏览器将突发新闻灵巧请求自动加入(选定配置文件的)RWL。
2.Headlines{大标题}——这会告知语义浏览器将大标题灵巧请求自动加入(选定配置文件的)RWL。
3.Newsmakers{新闻作者}——这会告知语义浏览器将新闻作者灵巧请求自动加入(选定配置文件的)RWL。
4.Categorized Breaking News{分类突发新闻}——这会告知语义浏览器将分类突发新闻灵巧请求自动加入(语境配置文件的)RWL。语义浏览器将动态添加具有对应于当前显示之灵巧请求(及语境或当前配置文件)的每个子类别之类别过滤器的灵巧请求——如果当前显示的灵巧请求具有类别。举例来说,倘若灵巧请求“Breaking Newsabout Technology{关于技术的突发新闻}”目前在语义浏览器的某个实例中显示,并且倘若类别“Technology{技术}”有5个子类别(例如Wireless{无线}、Semiconductors{半导体}、Nanotechnology{纳米技术}、Software{软件}、Electronics{电子学}),那么当此当前灵巧请求被载入时,下列灵巧请求会被动态加入RWL:
·Breaking News about Technology.Wireless[<语境配置文件名>]
·Breaking News about Technology.Semiconductors[<语境配置文件名>]
·Breaking News about Technology.Nanotechnology[<语境配置文件名>]
·Breaking News about Technology.Software[<语境配置文件名>]
·Breaking News about Technology.Electronics[<语境配置文件名>]
这些条目的RWLE也将使用当前语义浏览器实例的RequestViewInstanceID加以初始化。倘若用户定位到一个新的灵巧请求,前面载入的灵巧请求之分类突发新闻将被从RWL中删除;一个新的分类突发新闻清单将为该新灵巧请求而添加,并且使用与该新灵巧请求视图对应的新RequestViewInstanceID加以初始化。这样就营造了一种灵巧用户体验;在此(子类别的)分类突发新闻将基于当前显示的请求而动态显示。用户于是能够将分类突发新闻灵巧请求作为一个观察群组或集合加以监视。
5.Categorized Headlines News{分类大标题}——这会告知语义浏览器将分类大标题灵巧请求自动加入(语境配置文件的)RWL。这与分类突发新闻相似,只是在此情况下使用的是大标题。用户于是能够将分类大标题灵巧请求作为一个观察群组或集合而加以监视。
6.Categorized Newsmakers News{分类新闻作者}——这会告知语义浏览器将分类新闻作者灵巧请求自动加入(语境配置文件的)RWL。这与分类突发新闻相似,只是在此情况下使用的是新闻作者。用户于是能够将分类新闻作者灵巧请求作为一个观察群组或集合而加以监视。
7.My Favorite Requests{我的收藏夹请求}——这会告知语义浏览器将所有收藏夹灵巧请求自动加入(选定配置文件的)RWL。这令用户可将其所有收藏夹灵巧请求作为一个群组而加以观察或监视。
8.My Favorite Breaking News{我的收藏夹突发新闻}——这会告知语义浏览器将所有收藏夹突发新闻灵巧请求自动加入(选定配置文件的)RWL。这令用户可将其所有收藏夹突发新闻灵巧请求作为一个群组而加以观察或监视。
9.My Favorite Headlines{我的收藏夹大标题}——这会告知语义浏览器将所有收藏夹大标题灵巧请求自动加入(选定配置文件的)RWL。这令用户可将其所有收藏夹大标题灵巧请求作为一个群组而加以观察或监视。
10.My Favorite Newsmakers{我的收藏夹新闻作者}——这会告知语义浏览器将所有收藏夹新闻作者灵巧请求自动加入(选定配置文件的)RWL。这令用户可将其所有收藏夹新闻作者灵巧请求作为一个群组而加以观察或监视。
请求观察群组管理器用户界面
图19例举了最佳实施方式之语义浏览器的“灵巧请求观察”对话框。此对话框的上半部分用于添加自动观察群组。用户能够选取自动观察群组类型和配置文件类型(“All Profiles”{所有配置文件}、“Contextual Profile”{语境配置文件}、以及配置文件的实际名称)并将它们加入自动观察群组清单。用户也能够删除自动观察群组。此对话框的下半部分用于在手动观察群组中添加和删除灵巧请求。
3.通知管理器
在最佳实施方式中,通知管理器(NM)是语义运行时客户程序的一个部件,用于监视RWL中的灵巧请求。NM具有一个线程,负责定期调用RWL中的每个灵巧请求(经由客户机语义查询处理器)并且用“结果计数”和“上次更新时间”来更新RWLE。在最佳实施方式中,NM最好每隔5-30秒调用一次灵巧请求。取决于RWL的大小,NM能够聪明地调整请求检查的周期或频率(从而尽量减少带宽用量和对Web服务缩放能力的影响)。
对于时间制约灵巧请求(例如突发新闻、大标题、新闻作者),NM在调用该灵巧请求时最好不带任何附加时间过滤器。然而,对于(例如信息类型而非语境类型或诸如收藏夹和推选等非时间制约语境模板的)非时间制约请求,NM最好为带有时间过滤器(例如过去10分钟)的灵巧请求调用查询。
4.观察群组监视器
在最佳实施方式中,语义运行时客户程序管理着本发明人所称的观察群组监视器(WGM)。对于用户已加入观察群组清单中的每个观察群组,客户程序会创建一个观察群组监视器。观察群组监视器负责跟踪其观察群组中每个请求之新结果的数目。观察群组监视器会为该观察群组中具有新结果的RWLE创建一个队列,并且为了尽可能提高这些结果的新鲜度而管理此队列。WGM会定期轮询NM,以了解其观察群组中的每个请求是否有新结果。如果有的话,它会基于该请求的“最后结果时间”将该请求加入队列。此举的用意在于依照以最新的结果为首的原则排定请求的优先级。演示程序中运行之当前显示的可视风格(外壳)于是将调用语义运行时OCX以令WGM队列中的请求出列。这样一来,请求观察用户界面将与新结果的存在和结果的新鲜度一致。一旦当前显示的请求中没有更多的结果,该灵巧风格将令WGM队列中的下一个请求出列。
5.观察窗格
观察窗格(WP)是指在演示程序中(与主结果窗格一起)显示的一个面板,其中包含用户之观察群组的可视表示。WP令用户可速览每个观察群组,以了解其请求是否有新的结果。WP也可令用户改变显示每个观察群组之实时状态的当前视图。目前已定义的有下列视图:
·平铺视图——显示观察群组的标题及其所有灵巧请求的新结果总数。
·滚动条视图——显示观察群组所有灵巧请求的新结果总数,并且用一个动画依次显示每个灵巧请求的新结果数目(如同滚动条一般)。
·预览视图——与滚动条视图相似;只是在滚动条中除显示新结果的数目外,亦显示每个灵巧请求的最新结果。
·深层视图——在此视图中,WP在显示观察群组所有灵巧请求之新结果总数的同时,亦用滚动条显示每个灵巧请求的新结果数目和每个灵巧请求之所有新结果的幻灯片放映。
6.观察窗口
WP也令用户可观察某观察群组。用户可通过选取WP中的某个观察群组并将它拖到主结果窗格(或用类似方法)来达到此目的。如此就可形成一个观察窗口(WW)。此WW与电视的画中画功能在外观或布局上相似,但在若干方面不同;其中最引人注目的是在此情况下所显示的内容由语义请求和结果构成,而不是正在“观看”的电视频道。诚然,生成此内容的基本技术也大为不同。WW可在任何前述视图中显示。然而当WW在深层视图中出现时,WW的查看控制项就会显示。目前已定义的有下列控制项:
·钉住请求——这令用户可钉住观察群组中的特定请求。WW将一直(循环)显示已钉住请求的新结果,而在只要当前请求继续被钉住就不会前进到该观察群组中的其他请求。
·对换请求——这令用户可将当前显示的请求与语义浏览器中出现的主请求对换。灵巧风格将调用OCX上的一个方法,从而用该被对换请求(由其SQML缓冲区加以散列)创建一个暂时请求,并且于是定位到该请求且同时通知演示程序现在在其位置显示该主请求(在WW内)。
·停止、播放、查找、快进、倒退、读写、加速——这些功能令用户可停止、播放、查找、快进、倒退或加速“观察群组请求流”。例如,快进将由当前显示的请求前进若干个请求。
·结果控制项——这令用户可控制观察群组中每个请求的结果。该等结果在本质上是一种流中流,并且这将也令用户可控制当前观察群组中当前请求的结果。
·自动显示模式——如此将在没有要显示的结果时自动隐去WW和在有新结果时让它淡入。这样一来,用户由于知道在有新的语义结果时观察窗口将会淡入,就可最大限度地利用其屏幕空间。这项特征也令用户可在依个人和语义方式的信息交互作用中管理其注意力。
·停放、关闭、最小化、最大化——这些特征,如其名称所暗示,令用户可停放、关闭、最小化或最大化观察窗口。图20例举了一个显示Filtered Smart Requests(e.g.,.Headlines on Wireless){已过滤的灵巧请求(例如关于无线的大标题)}的观察窗口。图20是具有CurrentSmart Request Title(e.g.,″Breaking News″){当前灵巧请求标题(例如“突发新闻”)}的观察窗口之一个例证。
7.观察清单补遗
在用户界面中,观察清单可被命名为“新闻观察”。用户将被要求在“新闻观察”中添加和删除请求、对象、关键词、文本、实体等等。“新闻观察”可用一个报摊观察窗格进行查看。这将为用户的请求和动态创建的请求(经由在观察清单中加入对象,以及由运行时使用那些对象作为过滤器而动态创建)提供了一个以空间为主导的视图,类似于人们在图书馆和书店中看到的书报架。
P.信息神经系统的实体规范
1.引言
实体是信息神经系统最佳实施方式的一个很有力特征。实体令用户可创建与其日常工作方式对应的语境定义。实体的例子包括:
  1.人员   7.会议
  2.团队   8.组织
  3.行动项目   9.合伙人
  4.公司   10.产品
  5.竞争对手   11.项目
  6.顾客   12.主题
此外还有针对具体行业的实体。例如在制药业,实体可能包括药物、药物相互作用问题、专利、食药局临床试验等等。实体在本质上是属于灵巧语境对象的语义封套。实体可如同任何其他灵巧对象那样地被拖放,但由SQML而不是SRML表示(即实体是一个查询对象,因为它具有丰富得多的语义)。实体可作为灵巧请求的参数而包括在内。
用户根据其任务创建实体。实体在最佳实施方式中包含至少下列信息(在替代实施方式中可能包含更多或更少的信息):
1.名称/描述——对实体的一个友好的描述性名称。
2.实体的类别——基于标准的跨行业分类法或纵向或具体公司的分类法。
3.语境资源——这可能包括关键词、本地文档、互联网文档或灵巧对象(例如人员)。
实体可在语义浏览器中打开、可用作定位的中心点、可用做灵巧请求(例如,关于我的项目的大标题)的参数、可被拖放、可被复制与粘贴、可与灵巧镜头共用、可用灵巧风格视觉化、可用作固有警报的基础、可保存为.ENT文档、可用电邮发送和共享等等。换句话说,实体是第一类灵巧对象。
语义运行时客户程序通过将实体的丰富元数据附加在有关请求上以创建一个参照该实体的新丰富SQML来动态创建SQML。
实体最好也具有其他强力特征:
1.就主题而言,实体令用户可创建其自用的分类法(而不必完全屈就或受限于严格定义且因此未必与该用户之具体请求语境刚好对应的公用分类法)。分类法的问题在于任何分类法都永远无法适合于即使是同一组织内每个人的需要。语境是非常个人化的,而实体令用户可创建自用分类法。例如,假设狗主人史蒂夫有一条名叫克什米尔的(拳师种)狗。对于(除史蒂夫外的)其他每个人来说,克什米尔可(依分类法)表达为:
活物
 动物
    哺乳动物
       狗
         拳师种
            克什米尔
可是对于史蒂夫来说,克什米尔亦是:
我心爱的
 我的宠物
    克什米尔
然而对于史蒂夫的兽医来说,克什米尔是:
我的客户
 我的狗
    我的身体健康的狗
       克什米尔
如果(独立的)分类法被用于“定义”克什米尔,上述三个分类法都无法让大众、史蒂夫、史蒂夫的兽医满意。而借助于实体,史蒂夫就能够基于“克什米尔对他意味着什么”来创建一个“克什米尔”实体。其他每个人,以及史蒂夫的兽医,亦能同样办理。因此,实体令用户能够创建专用主题来作为广义分类法的延伸。
再举一个例子,某大制药公司的一位制药业研究人员或许在进行一项关于基因组学的绝密新项目(定名为“基因项目”)。由于“基因项目”是一个内部项目,它很可能不存在于本人发明之本最佳实施方式的语义浏览器所能够使用的公用分类法内。然而,该研究人员能够创建一个定名为“基因项目”且类型为项目的实体,于是能够通过将其范围设定为(在广义分类法中存在的)基因组学来初始化此实体,并且然后用关键短语“基因项目”(使用AND{与}运算符)对其进行限定。这实质上相当于将“基因项目”定义为关于基因组学且有短语“基因项目”的任何内容。这就施加了比仅使用关键词“基因项目”(这可能发回包含“项目”一词但与基因组学毫无瓜葛的结果)要严格得多的语境。通过定义范围为基因组学但带有一具体限定词的一个自用主题“基因项目”,该研究人员现在就有了精确得多且属于个人的语境。此实体于是能够被拖放、复制与粘贴等等以创建请求(例如“关于基因项目的专家”)。在运行时,服务器端语义查询处理器(通过将SQML映射到语义网络)会将此请求解释为“属于基因组学类别与包含短语‘基因项目’之任何信息的专家”。
2.实体也令用户可创建动态分类法,公用分类法是相当静止不动的且不会经常更新。借助于实体,用户能够以思考的速度动态“延伸”其自用的分类法。知识将以思考的速度传递。实体令用户可以其思考或意识流动的速度创建语境,这是非常有意义的。例如,用户能够为新排定的会议、新发现的大型会议、新顾客、新发现的竞争对手等等创建实体,全部以思考的速度。分类法在这方面则无能为力。
3.分类法假定主题是语境的唯一来源。借助于实体,用户能够创建包括但不限于主题的抽象语境定义,例如人员、团队、事件、公司等等。实体可能最终“演进”成某分类法中的主题(假以时日且随着那些实体“声望渐隆”或“臭名远扬”),但在“短期”内,实体令用户可创建尚未(或者可能永远不会)演进为成熟分类条目的语境。例如Nervana(我们公司)起初只是一个实体(仅为其自己和几个员工所知),但随着我们成长和吸引公众注意,作为一个实体我们正在演进成公用分类法中的一个主题。借助于实体,用户不必等候语境(例如Nervana)“最终成为”主题。
4.实体令用户可创建本发明人所称的“复合语境”。这方面的一个例子是会议。会议通常涉及若干位与会者;他们持有与讨论主题相关的文档、演讲幻灯片和(或)分发资料。利用信息神经系统的实体,用户能够创建一个捕获该会议之语义的“会议”语境。利用创建实体向导,用户能够指定该实体为一个会议,然后指定语义过滤器。请设想一个项目会议例子:该会议有五位与会者和两份分发文档及一份演讲幻灯片。会议的演讲者可能想要创建一个实体,从而跟踪与此会议具体相关的知识。例如,他(她)这么做可能是想要确定何时安排后续会议或跟踪与该会议相关的具体行动项目。为了创建此实体,该用户将与会者的电子邮件地址、分发文档、还有演讲内容加入到实体过滤器定义。该用户于是将已创建的实体保存在语义名字空间或环境中。该用户因此在日后能够用新的或删除的过滤器(和(或)新名称与描述)编辑此实体;例如,倘若他(她)发现与该会议相关的新文档。当该用户将此实体拖放或包括在某请求或智能体内时,语义浏览器就会编译此实体并将它包括在一个带有子查询的主SQML内;该等子查询也会传递给XML Web服务进行解释。服务器端语义查询处理器于是通过构建一系列SQL子查询(或等同物)和将这些查询与也使用SQL子查询生成的实体子查询结合,而处理此复合SQML。
用户能够使用AND{与}或OR{或}运算符来指明应如何应用实体过滤器。例如,该用户能够指明该会议(依语义)是该等与会者的会议AND在会议中分发的该等文档与幻灯片。当此实体在客户机和服务器处得到编译时,该SQML等同物被用于解释此实体(使用希望的运算符)。这是很了不得的。它意味着该用户能够定义一个定名为“项目会议”的实体,并且将该实体拖放到名称为“突发新闻”的特殊智能体上。这就会创建一个名称为“关于项目会议的突发新闻”的请求(带有参照该实体之标识符的适当SQML);该请求于是在传递给服务器进行解释前将被编译成子SQML。服务器于是对此实体中的条目应用默认谓词(基于就该对象而言什么是“合乎情理的”)。在此特定例子中,由于该实体的定义,服务器将只发回:
由全体与会者制造并且依语义与所有文档和幻灯片相关的突发新闻
例如,这将只发回涉及该会议之全体与会者且依语义与该会议中分发之所有资料相关的会话或线索。这正好是该用户(在此情况下)想要的;并且语义浏览器将令用户能够构建相当复杂的查询。
即使更复杂的查询亦是可能的。实体能够包括其他实体以允许复合实体。例如,倘若某个团队的全体人员都与该会议有关,演讲人可能想要创建一个实体,其中包含那些人员的一个电子邮件分发名单。在此情况下,该用户可能会搜索信息神经系统以找到该分发名单,然后将结果保存为一个实体。浏览器将允许用户把结果保存为实体,并且将基于结果类型而自动创建属于“合乎情理的”默认实体类型的实体。例如,倘若该用户将一个文档结果保存为一个实体,语义浏览器将创建一个“主题”实体。如果该用户将一个人物结果保存为一个实体,语义浏览器将创建一个“人物”实体。如果该用户将一份电子邮件分发名单保存为一个实体,语义浏览器将创建一个“团队”实体。
在此例中,该用户能够将一个人物结果保存为人物实体,然后将该实体拖放到项目会议实体上。映射到与会者之电子邮件分发名单的团队实体能够被拖放到项目会议实体上。用户于是能够创建一个称为“关于项目会议的大标题”且包括该实体的请求。语义查询处理器于是将(使用适当默认谓词)发回由该电子邮件分发名单中任何人撰写且依语义与该会议中分发之所有资料相关的大标题。与此相似,关于项目会议的卷宗(指南)将发回关于该会议的所有匹配、关于该会议的最佳匹配、关于该会议的专家等等。
请注意,此等包含其他实体的复合实体将由客户端语义一致性检查器进行参照完整性检查。换句话说,倘若实体A参照实体B,而用户试图删除实体B,语义浏览器将检测到此情形并告知该用户实体B有一个未清除的参照。如果该用户依然将实体B删除,实体A中的参照(以及对实体B的任何其他参照)将被删除。或者在某些实施方式中,由于某组织内与该实体关联之其他的许可,该用户将被禁止(无论是否被告知)删除实体B。举例来说,雇主能够出于风险管理目的而监视员工的活动,就如同某些公司对电子邮件的监视一样,只是潜在的效力要强大得多(当然,适当的方针和隐私考虑将必须得到解决)。同一过程也适用于请求集合(混合器)、组合(实体集合——见下),以及语义名字空间或环境中的其他复合项目(可能参照名字空间或环境中其他项目的项目)。
5.流行实体也能够由知识社区的成员共享。类似于语义浏览器内的其他项目(例如请求或知识社区(代理)),实体能够保存为文件(从而令用户能够日后打开或将该等实体电邮给同事,或者将它们保存在中央文件共享系统上等等)。一个常见的情景是:企业的总公司图书馆员负责创建对应于内部项目、会议、研讨会、任务及其他有意义的重要企业知识项目之实体。此等实体于是将保存在某文件共享系统或其他共享机制(例如门户或网站)上或某知识社区(代理)上。该组织内的知识工作者于是将能够使用这些实体。随着这些实体在在最佳实施方式中得到更新,图书馆员能够且将自动编辑其语境,并且用户将能够针对新的实体进行刷新或与之同步。实体亦能够以对等方式在不同用户之间共享。这类似于合法的对等音乐文件共享;但在此共享的并非音乐,而是促进含义或更有意义之交流的语境。
2.组合(或实体集合)
组合是一种特殊类型的实体,其中包含多个实体的集合。在最佳实施方式中,为了尽量降低复杂性和减少混淆(至少就命名法或术语而言),尽管实体能够有任意大小或组成,并且组合能够包含任意类型或数目的实体,但是组合将不包含其他组合。组合令用户可将一组实体作为一个单元来管理。组合属于第一类实体且因此具有实体的全部前述特征。当组合被用作灵巧请求中的参数时,OR{或}限定词会(按照默认规定)应用于其包含的实体。换句话说,假设组合P包含实体E1和实体E2,标题为‘关于P的大标题’将作为‘关于E1或E2的大标题’。用户能够针对个别灵巧请求更改此设定(至AND{与}限定词)。
3.示例情景
重申一次,在审阅下面诸情景时请不要忘记,从概念上说本系统能够收集更相关的信息之部分原因,在于它“知道”谁在要求此信息,并且“懂得”该人或群组是谁,以及他们可能对哪种信息感兴趣。当然,严格说来,本系统不具备完整人类意义的感知或自我了解能力,并且上一句中引号内的动词属于概念性隐喻或明喻。尽管如此,就运作和结果而言,它以前所未有的程度模仿了理解与知识;其部分原因在于它是基于识得语义的体系结构和执行。
这点可用一个简略的对比来举例说明:倘若两个非常不同的人在完全相同的时间于诸如Google的某个搜索引擎中输入完全相同的搜索内容,他们将得到完全相同的结果。与此对照,利用本当前系统的最佳实施方式,倘若相同的两个人经由某实体输入相同的请求,他们将得到经过剪裁的不同结果,从而使结果与其中每个人相关。
为了认识此特征的一些潜在能力,值得注意的是尽管本系统或实体“知道”谁发出查询,但是这些实体并不依赖于用户通知它们此知识和经常向它们提供更新和通知(尽管用户信息可被随时供应和加以考虑)。否则的话,本系统将因人力耗费巨大而在许多场合不再有效率和有用;人们将实在忙不过来。如本申请及其母申请各处所解释,该等实体而是通过推理和由特征得出的语义来“知道”要求者是谁;而那些特征有时由他人提供,有时由其他请求和类似来源得到、导出或收集。
实体应用的一些示例情景:
1.某个制药业‘专利’实体可能包括该专利的类别、相关关键词、相关文档。
2.中情局的一位特工可能创建一个‘恐怖分子’实体来跟踪恐怖分子。这可能包括关于恐怖活动的类别、可疑的银行汇款、可疑的武器销售、机密文档、关键词,以及信息社区里的恐怖活动专家。
3.找到关于昨日会议的所有突发新闻
4.找到关于我的任何竞争对手的大标题(这是通过创建竞争对手实体,然后用这些实体作为参数并就每个谓词使用OR{或}限定词来创建一个灵巧请求。)
5.找到关于我的投资组合公司的专家(创建单个实体,创建包含这些实体的一个组合,然后创建一个具有‘专家’语境模板且使用此组合作为一个自变量的灵巧请求。)
6.建立一个关于我的竞争对手的卷宗(指南)(创建单个竞争对手实体,创建包含这些实体的一个组合,然后创建一个具有‘卷宗’(‘指南’)语境模板且使用此组合作为一个自变量的灵巧请求。)图21为在语义浏览器(左边)显示的实体视图。
Q.信息神经系统的知识社区浏览与订阅规范
R.概述
Nervana语义浏览器将允许用户就给定配置文件订阅和退订知识社区(代理)。这些知识社区将在语义环境中该配置文件条目下随时可供该用户使用。此外,每当使用同一个配置文件创建的任何请求之结果在显示时,这些知识社区将会按照默认规定就固有警报、语境面板等等得到查询。
语义环境包括指明每个配置文件已订知识社区的状态。客户端语义查询处理器(SQP)针对由给定配置文件之请求的结果而启动的动态请求利用此信息(SQP将向语义运行时客户程序询问该配置文件的知识社区且然后适当地向那些知识社区发出XML Web服务呼叫)。
图22A和22B显示了知识社区订阅和退订的用户界面。此对话框具有多个组合框,令用户可依配置文件过滤,可按照行业和兴趣领域、关键词、发表点(所有发表点、局域网、企业目录、全球知识社区目录)、创建时间(任何时间、今天、昨天、本周、上周)查看所有、新、已订、建议、未订的社区。语义运行时客户程序会使用这些过滤器查询(每个发表点的)发表点端点监听器,然后收集结果并在结果窗格中加以显示。用户也能够在结果窗格中使用一组合框来查看每个知识社区的类别。图22B展示了知识社区对话框的下部。
S.信息神经系统的客户端语义查询文档规范
1.语义查询标注语言(SQML)概述
在当前最佳实施方式中,Nervana语义DHTML行为系一Internet Explorer DHTML行为。在客户程序看来,该行为是它就查询文档而言所理解的一切。客户程序以与文字处理器打开‘文本和复合文档’相似的方式打开‘查询文档’。Nervana客户程序主要负责处理Nervana语义查询文档和再现结果。Nervana语义查询文档用Nervana语义查询标注语言(SQML)的形式表达和存储。该形式就好象“语义文件格式”。
在最佳实施方式中,SQML语义文件格式包括下列部分:
·Head——‘头’标签,与HTML相似,包括描述文档的标签。
·Title——文档的标题。
·Comments——文档的注释。
·UserName——文档创建者的用户名。
·SystemName——文档创建时所在设备的系统名。
·Subject——文档的主题。
·Creator——文档的创建者。
·Company——文档创建的所在公司。
·RequestType——指明请求的类型,这可为“灵巧请求”(指明对一个或多个信息社区Web服务的请求)或“无智请求”(指明对一个或多个本地或网络资源的请求)。
·ObjectType——完全限定由该查询发回之对象的类型。
·URI——文档的位置。
·CreationTime——文档的创建时间。
·LastModifiedTime——文档的上次修改时间。
·LastAccessedTime——文档的上次访问时间。
·Attributes——文档的属性(如果有)。
·RevisionNumber——文档的修订版本号。
·Language——文档的语言。
·版本——指明该查询的版本。这就令Web服务的语义查询处理器可以发回带有不同版本的结果。例如,某版本的浏览器能够使用查询的V1,另一个版本能够使用V2。这就令Web服务可在资源一级(例如为智能体)和在链接一级提供向后兼容性。
·Targets——指明作为查询文档目标的信息社区Web服务之名称和URL。
·Type——指明目标类型。这可为“targetentries”{目标条目},此时该标签包括指明实际Web服务目标的子标签;或者为“allsubscribedtargets”{所有已订目标},此时查询处理器会使用所有已经订阅的信息社区。
·Categories——指明查询文档所参照的类别URL之清单。每个“类别”条目都包含一个名称属性和一个URI属性,用于指明该类别出自其中的知识域服务器(KDS)之URL。
·Type——指明类别类型。这可为“categoryentries”{类别条目},此时该条目指向类别条目的清单;或可为“allcategories”{所有类别},这会向信息社区Web服务请求所有类别;或可为“myfavoritecategories”{我的收藏类别},此时查询处理器会得到用户之收藏类别且于是生成包含这些类别的已编译SQML(此已编译的SQML于是被发送给服务器)。
·Query——此为查询文档之所有主查询条目的母标签
·Resource——对要查询的‘无智’资源的参照,例如文件路径、URL、高速缓存条目标识符等等。这将由解释器映射到实际资源管理器部件。
·Type——资源参照的类型,用名字空间限定。已定义的资源参照类型之例有:nervana:url(这表明资源参照是一形成良好的标准互联网URL,或者一个诸如‘agent://...’的自定义Nervana URL),nervana:filepath(这表明资源参照是文件系统上某文件或目录的路径),以及nervana:namespaceref(这表明该资源来自客户端语义名字空间)。
·Uri——指明资源的通用资源标识符。倘若为路径和互联网URL,这指明该URL本身。倘若为名字空间条目,这指明该条目的GUID标识符。
·Mid——指明元数据标识符。此标识符由SQML解释器用于将资源与文档的元数据部分对应。此元数据标识符被映射到元数据部分内的相同标识符。
·Args——指明资源标识符的自变量。
·Links——指明对语义链接(只限“目标”)的参照
·Type——指明链接类型。这可为“linkentries”{链接条目},指明该等链接为明示条目。
·LinkEntries——指明链接条目的详细资料。
·Predicate——指明该链接的谓词类型。例如,谓词“nervana:relevantto”表明该查询为“由资源R发回与对象O相关的所有对象”,其中R和O分别为规定的资源和对象。其他谓词例子包括nervana:reportsto、nervana:teammateof、nervana:from、nervana:to、nervana:cc、nervana:bcc、nervana:attachedto、nervana:sentby、nervana:sentto、nervana:postedon、nervana:containstext等等。
·Type——指明在‘Link’{链接}标签中指明之对象参照的类型。例子包括诸如xml:string、xml:integer的标准XML数据类型,Nervana的等同数据类型,诸如nervana:datetimeref的Nervana自定义类型(这可指向诸如‘今天’和‘明天’的对象参照),以及指向Nervana能够作为语义XML对象而处理之对象的任何标准互联网URL(HTTP、FTP等等)或Nervana URL(objects://等等)。
·Metadata——包含对元数据条目的参照。
·MetadataEntry——指明元数据条目的详细资料。
·Mid——指明元数据标识符(GUID)。
·Value——指明元数据本身。
例如:文档(信息或基于语境)
<?xml version="1.0"encoding="utf-8"?>
<sqml>
<head
  requesttype="smart request"
  objecttype="context\headlines"
  uri="c:\foo's\bar.pdf"
  creationtime="foo"
  lastmodifiedtime="foo"
  lastaccessedtime="foo"
  attributes="0"
  revisionnumber="0"
  language="foo"
  version="foo"/>
  <title>foo</title>
  <comments>foo</comments>
  <username>foo</username>
  <systemname>foo</systemname>
  <subject>foo</subject>
 <creator>foo</creator>
 <company>foo</company><targets>
 <target
    name="Marketing"
    reftype="uri"
    ref="kisp://marketing/default.wsdl"
 />
 <target
    name="Research"
    reftype="uri"
    ref="kisp://research/default.wsdl"
 /></targets><categories>
<category
      name="reuters\pharmaceuticals\biotechnology"
  reftype="uri"
  ref="kdsp://reuters.com/categories.wsdl?id=45"/><category
  name="reuters\pharmaceuticals\life_sciences"
  reftype="uri"
  ref="kdsp://reuters.com/categories.wsdl?id=57"/></categories>/><resources><resource   name="foo"type="information\documents\general document"reftype="nervana:filepath"ref="file://c:\bar.doc"mid="7886e4a0-55d9-45ac-a084-97adc6fffd0f"args=""/><resourcename="foo"type="information\all information"reftype="nervana:url"ref="file://c:\bar.doc"mid="01fc64a3-c068-4339-bc97-17e5ff37e93f"args=""/><resourcename="foo"type="information\all information"reftype="nervana:folderpath"ref="file://c:\"mid="f8cc39c3-e4f0-4a29-be2a-d2faf36eb3a0"args="includesubfolders=true"/><resourcename="foo"type="information\documents\general document"reftype="nervana:url"ref="http://www.bar.com/doc.htm"mid="f8cc39c3-e4f0-4a29-be2a-d2faf36eb3a0"   args=""/><resourcename="foo"type="information\documents\general document"reftype="nervana:url"ref="ftp://gate.com/doc.txt"mid="f8cc39c3-e4f0-4a29-be2a-d2faf36eb3a0"args=""/><resourcename="foo"type="information\documents\general document"reftype="nervana:filepath"ref="file://\\servers\server\file.pdf"mid="1b870a25-4e98-45d8-a444-f0283a495357"args=""/><resourcename="foo"type="information\documents\text document"reftype="nervana:text"ref=""mid="7886e4a0-55d9-45ac-a084-97adc6fffd0f"args=""/><resourcename="foo"type="information\documents\general document"   reftype="nervana:cacheentry"ref="ef9c90ea-282d-46d6-b355-ac8a4fc2f3e5"mid=""args=""/><resourcename="foo"type="information\email\email message"reftype="nervana:url"ref="request://email.all@ibm.com"mid=""args=""/><resourcename="foo"type="information\email\email annotation"reftype="nervana:url"ref="objects://rad.com/agency.asp"mid=""args=""/><resourcename="foo"type="information\documents\general document"reftype="nervana:url"ref="objects://rad.com/agency.asp"mid=""args=""/>
<resource
  name="foo"
  type="information\documents\general document"
  reftype="nervana:url"
  ref="objects://rad.com/agency.asp"
  mid=""
  args=""
/>
<resource
  name="foo"
  type="information\documents\general document"
  reftype="nervana:url"
  ref="request://documents.all@intel.com"
  mid=""
  args=""/></resources><links><link
  operator="and"
  predicate="nervana:relatedto"
  name="foo"
  type="information\documents\general document"
  reftype="nervana:filepath"
  ref="file://c:\foo.doc"
  mid="7886e4a0-55d9-45ac-a084-97adc6fffd0f"
  args=""
/>
<link   operator="and"predicate="nervana:contains"name="foo"type="information\documents\general document"reftype="nervana:text"ref=""mid="46ea76cb-1383-4885-af6f-0e0fc6a66896"args=""/><linkoperator="and"predicate="nervana:postedon"name="foo"type="types\datetime"reftype="nervana:datetimeref"ref=""mid="3fa64c3c-4754-4380-91b5-521299036c62"args=""/><link
  operator="and"predicate="nervana:relatedto"name="foo"type="information\documents\general document"reftype="nervana:url"ref="kisp://98@in.com/m.asp"mid="c2649c39-a1c3-4ca8-ae8d-c85c04372e9a"args=""/>   <link
  operator="and"
  predicate="nervana:isofpriority"
  name="foo"
  type="types\priority"
  reftype="nervana:priority"
  ref=""
  mid="69bbc048-98c8-4f76-8edf-5a00ce91c183"
  args=""/></links>
<metadata><metadataentry
 mid="7886e4a0-55d9-45ac-a084-97adc6fffd0f"
 reftype="uri"
 ref="file://c:\foo\bar.pdf"/>
 <value>
   <document>
     <title>scenario modelling</title>
     <type>text</type>
     <format>application/pdf</format>
     <filepath>c:\foo\bar.pdf</filepath>
     <shortfilename>bar.pdf</shortfilename>
     <creationtime>foo</creationtime>
     <lastmodifiedtime>foo</lastmodifiedtime>
     <lastaccessedtime>foo</lastaccessedtime>
     <attributes>0</attributes>
     <size>0</size>
     <subject>foo</subject>
         <creator>foo</creator>
         <manager>foo</manager>
         <company>foo</company>
         <category>foo</category>
         <keywords>foo</keywords>
         <comments>foo</comments>
         <hlinkbase>foo</hlinkbase>
         <template>foo</template>
         <lastsavedby>foo</lastsavedby>
         <revisionnumber>0</revisionnumber>
         <totaleditingtime>foo</totaleditingtime>
         <numpages>0</numpages>
         <numparagraphs>0</numparagraphs>
         <numlines>0</numlines>
         <numwords>0</numwords>
         <numcharacters>0</numcharacters><numcharacterswithspaces>0</numcharacterswithspaces>
         <numbytes>0</numbytes>
         <language>foo</language>
         <version>foo</version>
         <abstract>foo</abstract>
       </document>
    </value>
  />
  <metadataentry
    mid="bfcb12b4-70bb-473a-847c-ebffe187828f"
    reftype="uri"
    ref="file://c:\foo\bar.pdf"/><value><email>
<title>scenario modelling</title>
<type>text</type>
<format>application/pdf</format>
<filepath>c:\foo\bar.pdf</filepath>
<shortfilename>bar.pdf</shortfilename>
<creationtime>foo</creationtime>
<lastmodifiedtime>foo</lastmodifiedtime>
<lastaccessedtime>foo</lastaccessedtime>
<attributes>0</attributes>
<size>0</size>
<subject>foo</subject>
<creator>foo</creator>
<manager>foo</manager>
<company>foo</company>
<category>foo</category>
<keywords>foo</keywords>
<comments>foo</comments>
<hlinkbase>foo</hlinkbase>
<template>foo</template>
<lastsavedby>foo</lastsavedby>
<revisionnumber>0</revisionnumber>
<totaleditingtime>foo</totaleditingtime>
<numpages>0</numpages>
<numparagraphs>0</numparagraphs>
<numlines>0</numlines>
<numwords>0</numwords>
<numcharacters>0</numcharacters>   <numcharacterswithspaces>0</numcharacterswithspaces>
            <numbytes>0</numbytes>
            <language>foo</language>
            <version>foo</version>
            <abstract>foo</abstract>
         </email>
      </value>
   />
    </metadata>
</sqml>
2.SQML生成
SQML最好由若干可能方式的一个或多个生成:
·通过创建一个灵巧请求
·通过创建一个本地请求
·通过创建一个实体
·通过在语义浏览器中打开一个或多个本地文档
·通过客户程序(动态地)——作为拖放动作、灵巧复制与粘贴、固有警报、语境面板与链接调用等等的响应
3.SQML解析
在某些场合的某些实施方式中,在客户机上创建的SQML可能已可(实时)远程消费——由服务器的XML Web服务或在另一个机器地点创建。这在当该SQML参照诸如(由语义环境中的唯一标识符所识别的)文档、实体或灵巧请求等本地语境时尤其可能发生。1在最佳实施方式中,客户程序通常创建远程消费就绪的SQML。这最好通过高速缓存该文档之元数据部分内所有参照的元数据来实现。这样做之所以最好,是因为在该查询被调用时,该参照指向的资源或对象可能已不复存在。例如,某用户可能将互联网上的某个文档拖放到一——————————————1混合器(或集合)包含对灵巧请求的参照。灵巧请求上,从而生成一个新的相关请求。客户程序会由该链接提取元数据(包括概括)并将该元数据插入SQML。由于对查询的解析只使用元数据,一旦将元数据插入SQML文档,该查询就可供使用。然而,该对象所参照的链接在该用户找到后的下一日可能不复存在。在此等情况下,即使在该链接可能已不存在时,倘若该用户调用该相关请求,由于元数据已经缓存于SQML内,该请求依然可用。
客户机SQML解析器会对SQML内的元数据进行“懒惰”更新。在该请求被调用时,解析器会试图更新所有参数(资源等等)的元数据,以应对用于创建该相关请求的对象在创建后可能已经改变的情形。倘若该对象不存在,客户程序将使用其已有的元数据;否则将更新元数据和使用更新后的元数据。这样一来,即使该对象已被删除,但用户体验不会被打断,除非该用户实际试图打开该元数据出自其中的对象。
T.信息神经系统的语义客户端运行时控件API规范
1.介绍Nervana语义运行时控件——概述
在最佳实施方式中,Nervana语义运行时控件是一ActiveX控件;它显露用于利用Nervana语义用户体验显示语义数据的属性和方法。与Nervana语义用户体验的要求一致,此控件将主要由接收XML数据(使用SRML方案)和生成DHTML+TIME或SVG输出的XSLT外壳调用。在此实施方式中,Nervana控件实质上“封装”XSLT外壳坐落于其上的“SDK”,从而产生由语义内容带动的用户体验。下面列出的API展示了将由最佳实施方式中之最终API集显露或可供使用的功能性。
2.Nervana语义运行时控件API
U.a.EnumObjectsInNamespacePath
简介
EnumObjectsInNamespacePath方法发回名字空间路径中的对象。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法以打开某个名字空间路径,从而令用户可从语义浏览器内在名字空间中定位。
PROTOTYPE
SCODE
EnumObjectsInNamespacePath(
[in]BSTR Path,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
V.b.CompileSemanticQueryFromBuffer
简介
CompileSemanticQueryFromBuffer方法打开一个SQML缓冲区且将它编译成一个或多个执行就绪的SQML缓冲区。例如,包含一个混合器的SQML文件将被编译成表示各混合器条目的多个SQML缓冲区。倘若该混合器包含有多个混合器,该等混合器将被展开且就所包含的每个混合器将会发回一个SQML缓冲区。已编译的或“执行就绪的”SQML缓冲区是可由代理依语义处理的缓冲区。这意味着具有来自多个代理之智能体的混合器将令其SQML被编译成多个缓冲区;该等缓冲区具有来自每个代理的适当SQML。
附注:如果该缓冲区已被编译,此方法会发回S_FALSE且发回自变量将被忽略。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法以编译某个SQML缓冲区和检索生成的可以执行之“已编译码”。在典型情景中,该应用程序或外壳将编译一个SQML缓冲区,然后准备它希望每个单独SQML查询坐落的框架窗口。它于是能够通过调用OpenSemanticQueryFromBuffer且然后让结果在该等框架中显示来发出单独的SQML语义呼叫。
PROTOTYPE
SCODE
CompileSemanticQueryFromBuffer(
[in]BSTR SQMLBuffer,
[in]DWORD Flags,
[out]DWORD*pdwNumCompiledBuffers,
[out]BSTR *pbstrCompiledBuffers);
W.c.OpenSemanticQueryFromBuffer
简介
OpenSemanticQueryFromBuffer方法打开某个SQML缓冲区且异步地在DOM上启动XML结果(用SRML),由此某Nervana外壳能够沉下该事件。请注意在本实施方式中,该SQML必须是“已编译的”且执行就绪。如果该SQML并非执行就绪,此调用将失败。如要编译SQML缓冲区,请调用CompileSemanticQueryFromBuffer。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法以打开某个已编译的SQML缓冲区。
PROTOTYPE
SCODE
OpenSemanticQueryFromBuffer(
[in]BSTR SQMLBuffer,
[in]DWORD Flags,
[out]GUID*pQueryID);
X.d.GetSemanticQueryBufferFromFile
简介
GetSemanticQueryBufferFromFile方法打开某个SQML文件,并且发回缓冲区内容。该缓冲区于是可被编译和(或)打开。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法以将某个SQML文件转换成缓冲区以供处理。
PROTOTYPE
SCODE
GetSemanticQueryBufferFromFile(
[in]BSTR SQMLFilePath,
[in]DWORD FileOpenFlags,
[out]BSTR*pbstrSQMLBuffer);
Y.e.GetSemanticQueryBufferFromNamespace
简介
GetSemanticQueryBufferFromNamespace方法打开某个名字空间对象并检索其SQML缓冲区。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳在已可取得名字空间对象的标识符和路径时将调用此方法来打开SQML缓冲区。
Z.PROTOTYPE
AA.SCODE
GetSemanticQueryBufferFromNamespace(
[in]GUID ObjectID,
[in]BSTR Path,
[out]BSTR*pbstrSQMLBuffer);
BB.f.GetSemanticQueryBufferFromURL
简介
GetSemanticQueryBufferFromURL方法在一SQML缓冲区内包裹URL并发回该缓冲区。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法以将某个任何类型的URL转换成SQML。这可包括文件路径、HTTP URL、FTP URL、Nervana代理对象URL(以“wsobject://”为前缀)或Nervana代理URL(以“wsagency://”为前缀)。
PROTOTYPE
SCODE
GetSemanticQueryBufferFromURL(
[in]BSTR URL,
[out]BSTR*pBuffer);
CC.g.GetSemanticQueryBufferFromClipboard
简介
GetSemanticQueryBufferFromClipboard方法将剪贴板内容转换成SQML并发回该缓冲区。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法,以便从剪贴板获得一个语义查询。应用程序于是能够载入此查询缓冲区。
PROTOTYPE
SCODE GetSemanticQueryBufferFromClipboard([out] BSTR*pBuffer);
DD.h.Stop
简介
Stop方法会停止当前打开的请求。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法以停止刚刚发出的载入请求。
PROTOTYPE
SCODE Stop([in] GUID QueryID);
EE.i.Refresh
简介
Refresh方法会刷新当前打开的请求。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法以刷新当前已载入的请求。
PROTOTYPE
SCODE Refresh([in] GUID QueryID);
FF.j.CreateNamespaceObject
简介
CreateNamespaceObject方法创建一个名字空间对象并发回其GUID。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳在一个新的查询文档被打开时通常将调用此方法以创建一个暂时的名字空间对象。
PROTOTYPE
SCODE
CreateNamespaceObject(
[in]BSTR Name,
[in]BSTR Description,
[in]BSTR QueryBuffer,
[in]LONG AgentObjectType,
[in]LONG Attributes,
[in]LONG NamespaceObjectType,
[out]GUID*pObjectID);
GG.k.DeleteNamespaceObject
简介
DeleteNamespaceObject方法删除名字空间对象。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳通常将调用此方法以删除暂时的名字空间对象。
PROTOTYPE
SCODE DeleteNamespaceObject([in] GUID ObjectID);
HH.l.CopyObject
简介
CopyObject方法使用某种专属SQML剪贴板格式将语义对象作为SQML缓冲区复制到剪贴板上。此对象于是能够为相关语义查询而“粘贴”到智能体上,或者用作其他对象或智能体上的镜头。
用法情景
当用户单击某对象之弹出菜单中的“复制”菜单选项时,Nervana外壳通常将调用CopyObject方法。
PROTOTYPE
SCODE CopyObject([in] BSTR ObjectSRML);
II.m.CanObjectBeAnnotated
简介
CanObjectBeAnnotated方法检查给定对象是否能够注解。
用法情景
Nervana外壳通常将调用CanObjectBeAnnotated方法来确定是否显示指明“注解”命令的用户界面。
PROTOTYPE
SCODE CanObjectBeAnnotated([in] BSTRbstrObjectSRML);
JJ.n.AnnotateObject
简介
AnnotateObject方法会调用当前已安装的电子邮件客户程序并初始化该程序,从而向给定对象出自其中的代理之电子邮件智能体发送对该对象的电子邮件注解。
用法情景
当用户单击某对象之弹出菜单中的“注解”菜单选项时,Nervana外壳通常将调用AnnotateObject方法。
PROTOTYPE
SCODE AnnotateObject([in] BSTR bstrObjectSRML);
KK.o.CanObjectBePublished
简介
CanObjectBePublished方法检查给定对象是否能够发表。
用法情景
Nervana外壳通常将调用CanObjectBePublished方法来确定是否显示指明“发表”命令的用户界面。
PROTOTYPE
SCODE CanObjectBePublished([in] BSTRbstrObjectSRML);
LL.p.PublishObject
简介
PublishObject方法会调用当前已安装的电子邮件客户程序并初始化该程序,从而向给定对象出自其中的代理之电子邮件智能体发送对该对象的电子邮件出版物。
用法情景
当用户单击某对象之弹出菜单中的“发表”菜单选项时,Nervana外壳通常将调用PublishObject方法。
PROTOTYPE
SCODE AnnotateObject([in] BSTR bstrObjectSRML);
MM.q.OpenObjectContents
简介
OpenObjectContents方法使用某个适当的查看器打开对象。例如,电子邮件对象将在电子邮件客户程序中打开,文档将在浏览器中打开,等等。
用法情景
当用户单击某对象之弹出菜单中的“打开”菜单选项时,Nervana外壳通常将调用OpenObjectContents方法。
PROTOTYPE
SCODE OpenObjectContents([in] BSTR ObjectSRML);
NN.r.SendEmailToPersonObject
简介
SendEmailToPersonObject用于向人物或顾客对象发送电子信件。此方法打开电子邮件客户程序并用该人物或顾客对象的电子邮件地址初始化该程序。
用法情景
当用户单击某人物或顾客对象之弹出菜单中的“发送电子邮件”菜单选项时,Nervana外壳通常将调用SendEmailToPersonObject方法。
PROTOTYPE
SCODE SendEmailToPersonObject([in] BSTRObjectSRML);
OO.s.GetObjectAnnotations
简介
GetObjectAnnotations方法用于获得对象在其出自其中之代理上的注解。
用法情景
Nervana外壳在想要显示某对象具有之注解的标题时,例如在弹出菜单内,或者在想要在一窗口内显示该等注解时,通常将调用GetObjectAnnotations方法。
PROTOTYPE
SCODE
GetObjectAnnotations(
[in]BSTR ObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
PP.t.IsObjectMarkedAsFavorite
简介
IsObjectMarkedAsFavorite方法用于检查对象在其出自其中之代理上是否已标记为收藏。
用法情景
Nervana外壳通常将调用IsObjectMarkedAsFavorite方法来确定要显示哪个用户界面——“标记为收藏”命令或“不再标记为收藏”命令。倘若该对象不能标记为收藏(例如,倘若它不是起源于某个代理),错误代码E_INVALIDARG将被发回。
PROTOTYPE
SCODE
IsObjectMarkedAsFavorite(in] BSTR ObjectSRML);
QQ.u.MarkObjectAsFavorite
简介
MarkObjectAsFavorite方法用于将对象标记为是其出自其中之代理上的收藏。
用法情景
当用户单击“标记为收藏”命令时,Nervana外壳通常将调用MarkObjectAsFavorite方法。
PROTOTYPE
SCODE
MarkAsFavorite(in] BSTR ObjectSRML);
RR.v.UnmarkObjectAsFavorite
简介
UnmarkObjectAsFavorite方法用于将对象不再标记为是其出自其中之代理上的收藏。
用法情景
当用户单击“不再标记为收藏”命令时,Nervana外壳通常将调用UnmarkObjectAsFavorite方法。
PROTOTYPE
SCODE
UnmarkAsFavorite(in] BSTR ObjectSRML);
SS.w.IsSmartAgentOnClipboard
简介
IsSmartAgentOnClipboard方法用于检查灵巧智能体是否已复制到剪贴板上。
用法情景
Nervana外壳在想要切换用户界面以显示“粘贴”图标时或在“粘贴”命令被调用时,通常将调用IsSmartAgentOnClipboard方法。
PROTOTYPE
SCODE
IsSmartAgentOnClipboard();
TT.x.GetSmartLensQueryBuffer
简介
GetSmartLensQueryBuffer方法用于获得灵巧镜头的查询缓冲区。它将发回特定查询的SQML;该查询代表关于剪贴板上灵巧智能体的对象且在语义上与给定对象相关。
用法情景
当用户单击“粘贴为灵巧镜头”以便从剪贴板上的灵巧智能体调用灵巧镜头时,Nervana外壳通常将调用GetSmartLensQueryBuffer方法。
PROTOTYPE
SCODE
GetSmartLensQueryBuffer(
[in]BSTR ObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
UU.y.OpenObjectContents
简介
OpenObjectContents方法使用某个适当的查看器打开对象。例如,电子邮件对象将在电子邮件客户程序中打开,文档将在浏览器中打开,等等。
用法情景
当用户单击某对象之弹出菜单中的“打开”菜单选项时,Nervana外壳通常将调用OpenObjectContents方法。
PROTOTYPE
SCODE OpenObjectContents([in] BSTR ObjectSRML);
Part
3.电子邮件控件API
VV.a.Email_GetFromLinkObjects
简介
Email_GetFromLinkObjects方法用于由电子邮件对象出自其中之代理获得该对象之“From”{自}链接的元数据。
用法情景
Nervana外壳在想要由某电子邮件对象定位到“From”清单时,或者在想要显示该“From”清单中人名的弹出菜单时,通常将调用Email_GetFromLinkObjects方法。
PROTOTYPE
SCODE
Email_GetFromLinkObjects(
[in]BSTR EmailObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
WW.b.Email_GetToLinkObjects
简介
Email_GetFromLinkObjects方法用于由电子邮件对象出自其中之代理获得该对象之“To”{致}链接的元数据。
用法情景
Nervana外壳在想要由某电子邮件对象定位到“To”清单时,或者在想要显示该“To”清单中人名的弹出菜单时,通常将调用Email_GetToLinkObjects方法。
PROTOTYPE
SCODE
Email_GetToLinkObjects(
[in]BSTR EmailObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
XX.c.Email_GetCcLinkObjects
简介
Email_GetCcLinkObjects方法用于由电子邮件对象出自其中之代理获得该对象之“CC”{抄送}链接的元数据。
用法情景
Nervana外壳在想要由某电子邮件对象定位到“CC”清单时,或者在想要显示该“CC”清单中人名的弹出菜单时,通常将调用Email_GetCcLinkObjects方法。
PROTOTYPE
SCODE
Email_GetCcLinkObjects(
[in]BSTR EmailObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
YY.d.Email_GetBccLinkObjects
简介
Email_GetBccLinkObjects方法用于由电子邮件对象出自其中之代理获得该对象之“BCC”{密件抄送}链接的元数据。
用法情景
Nervana外壳在想要由某电子邮件对象定位到“BCC”清单时,或者在想要显示该“BCC”清单中人名的弹出菜单时,通常将调用Email_GetBccLinkObjects方法。
PROTOTYPE
SCODE
Email_GetBccLinkObjects(
[in]BSTR EmailObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
ZZ.e.Email_GetAttachmentLinkObjects
简介
Email_GetAttachmentLinkObjects方法用于由电子邮件对象出自其中之代理获得该对象之“Attachment”{附件}链接的元数据。
用法情景
Nervana外壳在想要由某电子邮件对象定位到“Attachments”清单时,或者在想要显示该“Attachments”清单中附件标题的弹出菜单时,通常将调用Email_GetAttachmentLinkObjects方法。
PROTOTYPE
SCODE
Email_GetAttachmentLinkObjects(
[in]BSTR EmailObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
4.人物控件API
AAA.a.Person_GetDirectReports
简介
Person_GetDirectReports方法用于由人物对象出自其中之代理获得该对象之“直接下级”链接的元数据。
用法情景
Nervana外壳在想要由某人物对象定位到“直接下级”链接时,或者在想要显示该“直接下级”清单中直接下级姓名的弹出菜单时,通常将调用Person_GetDirectReports方法。
PROTOTYPE
SCODE
Person_GetDirectReports(
[in]BSTR EmailObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
BBB.b.Person_GetDistributionLists
简介
Person_GetDistributionLists方法用于由人物对象出自其中之代理获得该对象之“分发名单成员”链接的元数据。
用法情景
Nervana外壳在想要由某人物对象定位到“分发名单成员”链接时,或者在想要显示该人为成员的分发名单之名称的弹出菜单时,通常将调用Person_GetDistributionLists方法。
PROTOTYPE
SCODE
Person_GetDistributionLists(
[in]BSTR PersonObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
CCC.c.Person_GetInfoAuthored
简介
Person_GetInfoAuthored方法用于由人物对象出自其中之代理获得该对象之“该人所撰信息”链接的元数据。
用法情景
Nervana外壳在想要由某人物对象定位到“该人所撰信息”链接时,或者在想要显示该人撰写之时间关键或最近信息的预览窗口时,通常将调用Person_GetInfoAuthored方法。
PROTOTYPE
SCODE
Person_GetInfoAuthored(
[in]BSTR PersonObjectSRML,
[in]BOOL SemanticQuery,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
DDD.d.Person_GetInfoAnnotated
简介
Person_GetInfoAnnotated方法用于由人物对象出自其中之代理获得该对象之“该人所注信息”链接的元数据。
用法情景
Nervana外壳在想要由某人物对象定位到“该人所注信息”链接时,或者在想要显示该人注解之时间关键或最近信息的预览窗口时,通常将调用Person_GetInfoAnnotated方法。
PROTOTYPE
SCODE
Person_GetInfoAnnotated(
[in]BSTR PersonObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
EEE.e.Person_GetAnnotationsPosted
简介
Person_GetAnnotationsPosted方法用于由人物对象出自其中之代理获得该对象之“该人张贴之注解”链接的元数据。
用法情景
Nervana外壳在想要由某人物对象定位到“该人张贴之注解”链接时,或者在想要显示该人张贴之时间关键或最近注解的预览窗口时,通常将调用Person_GetAnnotationsPosted方法。
PROTOTYPE
SCODE
Person_GetAnnotationsPosted(
[in]BSTR PersonObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
FFF.f.Person_SendEmailTo
简介
Person_SendEmailTo方法用于向某人物或顾客对象发送电子信件。此方法打开电子邮件客户程序并用该人物或顾客对象的电子邮件地址初始化该程序。
用法情景
当用户单击某人物或顾客对象之弹出菜单中的“发送电子邮件”菜单选项时,Nervana外壳通常将调用Person_SendEmailTo方法。
PROTOTYPE
SCODE Person_SendEmailTo([in] BSTR ObjectSRML);
5.系统控件事件
GGG.a.事件:OnBeforeQuery
简介
OnBeforeQuery事件于该控件在向与当前语义请求一致的资源发出查询前被启动。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳如果想要取消某查询或在发出该查询前高速缓存状态,将沉下此事件。
PROTOTYPE
VOID
OnBeforeQuery(
[in]GUID QueryID,
[in]BSTR QueryBuffer,
[in]DWORD QueryMask,
[in]DWORD Flags,
[out]BOOL *Cancel);
HHH.b.事件:OnQueryBegin
简介
OnQueryBegin事件于该控件在向与当前语义请求一致的某个资源发出第一个查询时被启动。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳如果想要在该查询进行中高速缓存状态或显示状态信息,将沉下此事件。
PROTOTYPE
VOID
OnQueryBegin([in]GUID ObjectID);
III.c.事件:OnQueryComplete
简介
OnQueryComplete事件于该控件在向与当前语义请求一致的资源发出查询前被启动。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳如果想要取消某查询或在发出该查询前高速缓存状态,将沉下此事件。
PROTOTYPE
VOID
OnQueryComplete([in]GUID QueryID);
JJJ.d.事件:OnQueryResultsAvailable
简介
OnQueryResultsAvailable事件在有某异步方法调用的可用结果时被启动。此事件指明请求GUID,藉此调用者能够唯一地识别生成该响应的具体方法调用。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将沉下此事件以获得对此控件上方法调用的响应。
PROTOTYPE
VOID
OnQueryResultsAvailable(
[in]GUID QueryID,
[in]SCODE QueryResult,
[in]BSTR Results,
[in]DWORD NumResults,
[in]DWORD QueryMask,
[in]VARIANT ResultsParam);
KKK.e.附录A
查询掩码值
#define QM_RESULTS   0x01
#define QM_RESULTCOUNT  0x02
#define QM_NEWRESULTS   0x04
#define QM_NEWRESULTCOUNT  0x08
#define QM_DEFAULT   (QM_RESULTS)
示例:
Person_GetInfoAuthored(
PersonObjectSRML,
QM_RESULTS|QM_RESULTCOUNT,
&QueryRequestGuid);
LLL.信息神经系统的安全保障规范
1.授权
简介
‘人员’DSA将用某LDAP目录URL和群组名初始化。‘用户’DSA也将用某LDAP目录URL和群组名初始化。一般说来,‘用户’将是‘人员’的一个子集。例如,某制药公司可能为不同的制药类别(例如生物技术、生命科学、药理学等等)安装一部KIS。其中每个类别将有一组知识丰富或感兴趣的用户。然而,此KIS也将该公司的全体员工加入‘人员’群组。这将令此KIS的用户能够找到整个员工群体的成员,即使该等成员并非此KIS的用户。此外,推理机将能够由该公司的人员——而不必只是此KIS的用户——推断出具有语义链接的专长。
这对于在KIS一级的访问管制亦是有利的,这将补充由应用服务器在Web服务层提供的访问管制。用户群组将包含有权访问此KIS知识的人员。然而,人员群组将包含与此KIS知识相关的人员,即便那些人无权访问此KIS。
人员DSA和用户DSA都将充填语义元数据仓库(SMS)中的人员表和适当地指明对象类型标识符。请注意,密码最好不要存储于SMS中的人员表内。
用户DSA也充填用户身份验证表(UAT)。这是一个内存中的散列表,由此将用户名与密码对应。服务器的Web服务将实现IPasswordProvider界面或等同功能。PasswordProvider对象的实现将发回与特定用户名对应的密码。下面的C#例子展示了这一点:
namespace WSDK_Security

    {

    public class PasswordProvider:
Microsoft.WSDK.Security.IpasswordProvider

    {

         public string GetPassword(string username)

         {

             return"opensezme";

         }

    }
下面的C#码显示了Web服务如何能够在用户身份得到验证后检索用户信息:
using System;

  using System.Collections;

  using System.ComponentModel;

  using System.Data;

  using System.Diagnostics;

  using System.Web;

  using System.Web.Services;

  using Microsoft.WSDK.Security;

  using Microsoft.WSDK;

  namespace WSDK_Security

  {

    public class Service1:System.Web.Services.WebService

    {

       [WebMethod]

       public string PersonalHello()

       {

          string response="";

          SoapContext requestContext =
HttpSoapContext.RequestContext;

          if(requestContext==null)

          {

              throw new ApplicationException("Non-SOAP
request.");

          }

          foreach (SecurityToken tok in
        <!-- SIPO <DP n="121"> -->
        <dp n="d121"/>
requestContext.Security.Tokens)

             {

                if(tok is UsernameToken)

                {

                    response += "Hello"+
((UsernameToken)tok).Username;

                }

           }

           return response;

        }

     }

  }
Nervana Web服务于是能够用主叫用户名呼叫服务器语义运行时。运行时于是将这与SQL对应并使用适当过滤器发出语义查询。
就Nervana ASP.NET应用程序而言,以下条目将作为Web.config文件中母配置元件的一个子元件而加入:
<microsoft.wsdk>
  <security>
    <passwordProvider
      type="WSDK_Security.PasswordProvider,WSDK-Security"/>
   </security>
</microsoft.wsdk>
MMM.a.客户端授权请求
为了为有关请求创建一个UsernameToken,Nervana客户程序必须将用户名和密码作为该SOAP请求的组成部分而传递。Nervana客户程序能够作为该请求的组成部分传递多个令牌,对于用户之身份为跨多个验证提供者而联合者的情况最好如此。Nervana客户程序将集合该用户已提供的所有用户帐号信息(包括用户名和密码信息),将这些信息转换成WS-Security令牌,然后发出SOAP请求。客户程序码看上去将如下所示(参考:http://www.msdn.microsoft.com):
localhost.Service1 proxy=new localhost.Service1();
UsernameToken clearTextToken
    =new UsernameToken("Joe",
                       "opensezme",
                       PasswordOption.SendHashed);
proxy.RequestSoapContext.Security.Tokens.Add(clearTextToken);
label1.Text=proxy.PersonalHello();
NNN.b.在服务器上验证UsernameToken
(http://msdn.microsoft.com/library/default.asp?url=/library/en-us/dnwssecur/html/wssecwithwsdk.asp)
尽管WSDK会核实安全头语法和针对密码提供者提供的密码检查密码散列,但是我们最好对请求再进行一些额外核实。例如,倘若收到的UsernameToken不包括密码元件,WSDK将不呼叫密码提供者。如果没有要检查的密码,就没有理由要呼叫密码提供者。这意味着我们需要自己核实该UsernameToken的格式。
另一个可能是请求中包括了不止一个UsernameToken元件。WS-Security提供对一个请求内包含可用于不同目的之任意数目令牌的支持。
上面的代码可为Nervana Web方法加以修改,以核实UsernameToken包括一个散列的密码且只接受具有单一UsernameToken的接收请求。以下为修改后的代码。
[WebMethod]

  public string ProcessSemanticQuery(string Query)

  {

     SoapContext requestContext=
HttpSoapContext.RequestContext;
        <!-- SIPO <DP n="123"> -->
        <dp n="d123"/>
      if(requestContext==null)

      {

          throw new ApplicationException("Non-SOAP request.");

      }

      if(requestContext.Security.Tokens.Count==1)

      {

         foreach (SecurityToken tok in
requestContext.Security.Tokens)

         {

             if(tok is UsernameToken)

             {

                 UsernameToken UserToken=
(UsernameToken)tok;

               if(UserToken.PasswordOption

                  ==PasswordOption.SendHashed)

               {

                  return ProcessSemanticQueryInternal(Query,
UserToken.Username);

               }

               else

               {

                  throw new SoapException(

                      "Invalid UsernameToken password
type.",

                      SoapException.ClientFaultCode);

               }

           }

           else

           {
        <!-- SIPO <DP n="124"> -->
        <dp n="d124"/>
                   throw new SoapException(

                      "UsernameToken security token required.",

                      SoapException.ClientFaultCode);

                }

         }

     }

     else

     {

         throw new SoapException(

             "Request must have exactly one security token.",

             SoapException.ClientFaultCode);

     }

      return null;

  }
2.人员群组
KIS将包括人员群组的元数据。此类群组与现代操作系统中的用户群组并无不同。人员群组将为Nervana第一类对象(即它将继承对象类)。此外,人员群组方案将如下所示:
  字段名   字段类型   描述
  ObjectID   String   人员群组的对象标识符
  Name   String   人员群组的名称
  Description   String   人员群组的描述
  URI   String   人员群组的URL——这将唯一地识别该群组且在最佳实施方式中将为LDAP URI。
在绝大多数情况下,人员群组将映射到目录系统(例如LDAP)中的用户群组。例如,KIS服务器管理员将令KIS爬过用户群组的某个可配置集合。一个人员DSA将爬过用户群组和充填SMS中的人员群组表和用户表。人员DSA将执行下列操作:
·创建该群组(如果在SMS中没有)或更新该群组(如果存在)的元数据。
·列举该群组内的所有用户(在来源处——在最佳实施方式中为一LDAP目录)。
·针对该群组内的所有用户,创建人员对象(或在该等对象已存在于SMS内时更新元数据)。
·通过(使用BELONGS_TO_GROUP语义链接类型)将人员对象映射到群组对象,更新语义网络(经由SMS中的‘SemanticLinks’表)。这就确保SMS具有捕获群组成员信息(除群组和用户本身外)的语义链接。
3.身份元数据联盟
身份元数据联盟(IMF)是指一项特征;在此部署在互联网上的某个信息社区(代理)只为公司或个人顾客服务。例如,路透社可能为所有依赖于其专属内容的公司顾客设立一个信息社区。在这种多个顾客(很可能属于同一行业)共用一个信息社区的情况下,路透社将在SMS为每个顾客建立一个群组。然而,为了使人员元数据可供使用,每个顾客都将不得不让路透社持有其公司目录的镜像。这将带来多种问题,尤其是在安全保障和隐私方面。公司大概不会愿意允许外部内容提供者访问其员工的元数据。IMF通过让基于互联网的信息社区(代理)只保存足够进行用户身份验证的元数据,解决了这个问题。例如,路透社将只在其SMS中储存其公司顾客之用户的登录信息。当语义浏览器收到包含此等不完整元数据的SRML时,客户程序将向企业目录发出另一个查询(经由LDAP访问或在企业目录元数据是通过某Web服务提供时经由UDDI)以取得该用户的完整元数据。此举之所以可能,是因为该外部存放的元数据将具有身份信息;并且该信息可用于获取其余元数据。由于客户程序是在该企业的防火墙内获得其余元数据,敏感的公司元数据就不必与外界共享。
4.访问管制
OOO.a.访问管制方针
在最佳实施方式中,KIS将包括和执行访问管制语义。KIS采取“默认访问权”方针。默认访问权在此意指KIS将授权主叫用户访问SMS中的任何元数据,但禁止访问的情形除外。如此一来,本系统能够扩展为提供新的拒绝形式,而不是新的访问形式。此外,这隐含着倘若没有拒绝的理由,用户将获授访问权(这就导致一种较简洁的访问管制模式)。
KIS将具有一个访问管制管理器(ACM)。此ACM主要负责生成拒绝语义查询(DSQ)。SQP会将此DSQ附加到其针对来自客户程序之给定语义请求的查询上。ACM将显露以下方法(C#示例):
String GetDenialSemanticQuery(String CallingUserName)
此方法最好接受主叫用户名并发回一个封装例外对象的SQL查询(或等同物)。这些是SQP不得发回给主叫用户的对象(即该用户没有访问权的对象)。
SQP于是构建一个如下所示之包括该拒绝查询的最终原始查询:
Aggregate Raw Query AND NOT IN(Denial Query)
例如,假设该聚集原始查询为:
SELECT OBJECTID FROM OBJECTS WHEREOBJECTTYPEID=5,
且该拒绝查询为:
SELECT OBJECTID FROM OBJECTS WHEREOWNERUSERNAME<>‘JOHNDOE’,
最终原始查询(这是SQP最终将执行和串行化成SRML以发回给主叫用户的查询)将为:
SELECT OBJECTID FROM OBJECTS WHEREOBJECTTYPEID=5 AND NOT IN
(SELECT OBJECTID FROM OBJECTS WHEREOWNERUSERNAME<>‘JOHNDOE’)
这在语义上大概相当于:
“选取对象类型标识符为5但不属于非由John Doe拥有之对象清单的所有对象。”
而这在语义上又大概相当于:
“选取对象类型标识符为5且由John Doe拥有的所有对象。”
PPP.b.访问管制常规
由语义查询处理器(SQP)处理的每个语义查询将包含一个访问管制检查。这将保证主叫用户只收到其有权访问的元数据。SQP在处理语义查询时将采用下列访问管制规则:
1.倘若查询是针对‘人员’对象(人员、用户、顾客、专家、新闻作者等等),发回的‘人员’对象最好必须要么:
·包括主叫用户,要么
·包括与主叫用户同属至少一个人员群组且由主叫用户或系统拥有的人员
相应的拒绝查询最好对应于以下规则:发回的对象必须满足下列条件:
·不是主叫用户+
·非由主叫用户或系统拥有+
·具有与主叫用户不同属任何人员群组的人员
拒绝查询SQL示例
下面的SQL举例说明了将由ACM生成且由SQP附加以执行访问管制方针的访问管制拒绝查询。在此例中,主叫用户的名字是‘JOHNDOE’。
SELECT OBJECTID FROM OBJECTS WHERE
OWNERUSERNAME<>‘JOHNDOE’OR
OWNERUSERNAME<>‘SYSTEM’OR
WHERE OBJECTID NOT IN(SELECT OBJECTID FROMPEOPLE WHERE NAME=‘JOHNDOE’)OR
WHERE OBJECTID NOT IN
(SELECT OBJECTID FROM SEMANTICLINKS WHERE
OBJECTTYPEID=“PERSON ANDPREDICATETYPEID=‘BELONGS_TO_GROUP’AND SUBJECTIDIN(SELECT SUBJECTID FROM SEMANTICLINKS WHEREOBJECTID IN(SELECT OBJECTID FROM PEOPLE WHERENAME=‘JOHNDOE’))
2.倘若查询是针对非人员对象(文档、电子邮件、事件等等),发回的对象最好必须:
·由主叫用户或系统用户拥有,并且
·是以主叫用户作为对象之某语义链接的主题,或者
·是以主叫用户作为主题之某语义链接的对象,或者
·是以与主叫用户同属至少一个人员群组之某人作为对象之某语义链接的主题,或者
·是以与主叫用户同属至少一个人员群组之某人作为主题之某语义链接的对象
相应的拒绝查询最好对应于以下规则:发回的对象必须满足下列条件:
·非由主叫用户拥有+
·非由系统用户拥有+
·不是以主叫用户作为对象之某语义链接的主题+
·不是以主叫用户作为主题之某语义链接的对象+
·不是以与主叫用户同属至少一个人员群组之某人作为对象之某语义链接的主题+
·不是以与主叫用户同属至少一个人员群组之某人作为主题之某语义链接的对象
拒绝查询SQL示例
下面的SQL举例说明了将由ACM生成且由SQP附加以执行访问管制方针的访问管制拒绝查询。在此例中,主叫用户的名字是‘JOHNDOE’。
SELECT OBJECTID FROM OBJECTS WHEREOWNERUSERNAME<>‘JOHNDOE’OR
OWNERUSERNAME<>‘SYSTEM’OR
OBJECTID NOT IN(SELECT OBJECTID FROMSEMANTICLINKS WHERE
OBJECTTYPEID=“PERSON’AND OBJECTID IN(SELECTOBJECTID FROM PEOPLE WHERE NAME=‘JOHNDOE’)OR
WHERE OBJECTID NOT IN(SELECT OBJECTID FROMSEMANTICLINKS INNER JOIN PEOPLE WHERESEMANTICLINKS.SUBJECTTYPEID=‘PERSON’ANDSEMANTICLINKS.SUBJECTID=PEOPLE.OBJECTID)OR
OBJECTID NOT IN(SELECT OBJECTID FROMSEMANTICLINKS WHERE OBJECTTYPEID=‘PERSON’ANDPREDICATETYPEID=‘BELONGS_TO_GROUP’AND SUBJECTIDIN(SELECT SUBJECTID FROM SEMANTICLINKS WHEREOBJECTID IN(SELECT OBJECTID FROM PEOPLE WHERENAME=‘JOHNDOE’))OR
OBJECTID NOT IN(SELECT OBJECTID FROMSEMANTICLINKS WHERE OBJECTTYPEID=‘PERSON’ANDPREDICATETYPEID=‘BELONGS_TO_GROUP’AND OBJECTIDIN(SELECT OBJECTID FROM PEOPLE WHERENAME=‘JOHNDOE’))
合并拒绝查询SQL示例
通过合并这两条规则,ACM向SQP发回用于访问拒绝的以下合并查询:
SELECT OBJECTID FROM OBJECTS WHERE
OWNERUSERNAME<>‘JOHNDOE’OR
OWNERUSERNAME<>‘SYSTEM’OR
OBJECTID NOT IN(SELECT OBJECTID FROM PEOPLEWHERE NAME=‘JOHNDOE’)OR
OBJECTID NOT IN(SELECT OBJECTID FROMSEMANTICLINKS WHERE
OBJECTTYPEID=“PERSON ANDPREDICATETYPEID=‘BELONGS TO GROUP’AND SUBJECTIDIN(SELECT SUBJECTID FROM SEMANTICLINKS WHEREOBJECTID IN(SELECT OBJECTID FROM PEOPLE WHERENAME=‘JOHNDOE’))OR
OBJECTID NOT IN(SELECT OBJECTID FROMSEMANTICLINKS WHERE OBJECTTYPEID=“PERSON’ANDOBJECTID IN(SELECT OBJECTID FROM PEOPLE WHERENAME=‘JOHNDOE’)OR
OBJECTID NOT IN(SELECT OBJECTID FROMSEMANTICLINKS INNER JOIN PEOPLE ONSEMANTICLINKS.SUBJECTTYPEID=‘PERSON’ANDSEMANTICLINKS.SUBJECTID=PEOPLE.OBJECTID)OR
OBJECTID NOT IN(SELECT OBJECTID FROMSEMANTICLINKS WHERE OBJECTTYPEID=‘PERSON’ANDPREDICATETYPEID=‘BELONGS_TO_GROUP’AND SUBJECTIDIN(SELECT SUBJECTID FROM SEMANTICLINKS WHEREOBJECTID IN(SELECT OBJECTID FROM PEOPLE WHERENAME=‘JOHNDOE’))OR
OBJECTID NOT IN(SELECT OBJECTID FROMSEMANTICLINKS WHERE OBJECTTYPEID=‘PERSON’ANDPREDICATETYPEID=‘BELONGS_TO_GROUP’AND OBJECTIDIN(SELECT OBJECTID FROM PEOPLE WHERENAME=‘JOHNDOE’))
示例情景
例如,路透社代理(KIS)可能有路透社服务之每个企业顾客的人员群组。该代理将有一共用信息库(路透社内容),但将按企业顾客有一些人员群组。这些群组可能包括竞争对手,因此最好确保知识的流动、生成、推理不会跨越竞争对手边界。例如,A公司的员工必须不会直接从与A公司竞争的B公司之员工处获得知识,亦必须不会间接(经由推理)获得知识。A公司的员工必须无法就由B公司员工注解的项目获得推荐。或者A公司的员工必须无法找到为B公司工作的专家。当然,这里假定A公司和B公司并非某种形式的合作伙伴(在此情况下,这两家公司可能希望共享知识)。对于知识合作伙伴,路透社将创建一个包括A公司和B公司之人员群组的人员群组(很可能经由LDAP)。路透社KIS于是将包括这些人员群组:A公司、B公司、A和B两公司。SMS也将包括A公司和B公司中属于这些群组之人员的元数据(经由“属于群组”语义链接类型)。借助于此程序,前述规则将保证知识会在A公司和B公司之间得到共享。
QQQ.c.注解的访问管制规则
就注解而言,主叫用户将编辑语义网络,而不是查询之。在此情况下,下列为适用的规则:
1.倘若要注解的对象是某个人物对象,该对象最好必须是:
·主叫用户,或者
·与主叫用户同属至少一个人员群组且由主叫用户或系统拥有的某人
2.倘若要注解的对象是某个非人物对象(例如文档、电子邮件、事件等等),该对象最好必须是:
·由主叫用户拥有
·由系统拥有
拒绝查询SQL示例
下面的SQL举例说明了将由ACM生成(用于检查注解的访问管制)且由SQP附加以执行访问管制方针的访问管制拒绝查询。在此例中,主叫用户的名字是‘JOHNDOE’。
SELECT OBJECTID FROM OBJECTS WHERE
OWNERUSERNAME<>‘JOHNDOE’OR
OWNERUSERNAME<>‘SYSTEM’OR
OBJECTID NOT IN(SELECT OBJECTID FROM PEOPLEWHERE NAME=‘JOHNDOE’)OR
OBJECTID NOT IN(SELECT OBJECTID FROMSEMANTICLINKS WHERE OBJECTTYPEID=‘PERSON’ANDPREDICATETYPEID=‘BELONGS_TO_GROUP’AND OBJECTIDIN(SELECT OBJECTID FROM SEMANTICLINKS WHEREOBJECTID IN(SELECT OBJECTID FROM PEOPLE WHERENAME=‘JOHNDOE’))
访问管制执行
ACM负责执行对注解和KIS上其他写入作业的访问管制。KISXML Web服务显露一个如下所示的注解方法(C#示例):
AnnotateObject(String CallingUserName,String ObjectID);
此方法调用ACM以获得拒绝查询,然后创建一个如下所示的最终查询:
Annotation Object Query AND NOT IN(Denial Query)
在最佳实施方式中,注解对象查询总是具有如下形式:
SELECT OBJECTID FROM OBJECTS WHEREOBJECTID=ObjectID,
其中ObjectID是给AnnotateObject方法的自变量。
ACM于是构建一个最终访问管制查询SQL并使用此SQL进行访问管制检查。由于ACM不必发回该SQL,因此它只是直接调用之以进行访问管制检查。此外,由于这是一项二元检查(访问或不许访问),ACM只检查拒绝查询是否发回至少一行。例如,最终查询可能如下所示:
SELECT OBJECTID FROM OBJECTS WHERE OBJECTID=ObjectID AND NOT IN(SELECT OBJECTID FROM OBJECTSWHERE OWNERUSERNAME<>‘JOHNDOE’)
ACM于是运行这个查询(经由SQL查询处理器)并询问结果集内的行数。如果有一行的话,访问会被准许,否则访问被拒绝。此模式以此方式实现,是为了与拒绝查询模式保持一致(ACM总会构建一个拒绝查询并用此来作为所有访问管制检查的基础)。
RRR.信息神经系统的深层信息规范
SSS.深层信息概述
简介
在最佳实施方式中,Nervana‘深层信息’工具的目标在于为Nervana信息对象提供语境制约的似报道信息。深层信息实质上向提供Nervana用户在给定语境中否则将会错过的信息。如果做一个粗糙比较的话,深层信息就如同在MTV频道播放的音乐节目上显示的语境信息(显示关于当前艺术家、当前歌曲、以及在某些时候该歌曲中当前乐器的信息)。
‘深层信息’中的‘深层’是指语境信息将经常在对象出自其中的代理上之语义网络中横跨多个“跳跃”。‘深层信息’由可为无格式文本元数据或带有语义查询链接(经由SQML)之元数据的‘深层信息块’构成。
在最佳实施方式中有至少五种深层信息块:
1.基本语义链接块
2.语境模板块
3.琐事块
4.配对块
5.递归块
TTT.a.基本语义链接块
借助于基本语义链接事实,深层信息块只是传达当前对象的某个语义链接。这些块包含距离为1的语义链接。此情况与由‘链接’语境或任务窗格将显示的内容有重叠。例如:
·帕特里克·施米茨的直接上级是诺萨·欧莫贵
·帕特里克·施米茨有5个直接下级
·帕特里克·施米茨曾注解47个对象
·帕特里克·施米茨曾撰写13个对象
·帕特里克·施米茨曾收到56个电子邮件抄件
UUU.b.语境模板块
语境模板块会基于手头的信息显示每个相关语境模板的语境信息。这些块与将在每类语境模板的语境条或语境面板中显示的内容相同。例如:
·帕特里克·施米茨曾投递3条突发新闻项目
·帕特里克·施米茨曾发表14项经典作品
·帕特里克·施米茨曾撰写7条大标题
·帕特里克·施米茨现参与13项讨论
·帕特里克·施米茨是关于356个对象的新闻作者
VVV.c.琐事块
就代理上的所有电子邮件对象而言:
·史蒂夫·贾金斯出现在所有电子邮件的“致”名单上
·史蒂夫·贾金斯答复了其中的23%
·帕特里克·施米茨注解了其中的50%
·这里面只有3个的线程深度大于2
就代理上的所有人员对象而言:
·帕特里克·施米茨曾向其中的47%发送电子邮件
·其中的14%是诺萨·欧莫贵的直接下属
·萨莉·史密斯曾与其中的85%进行过讨论
·其中的12%是关于至少一个主题的新闻作者
·所有人本星期都曾参与过至少一次讨论
·其中的33%是关于至少一个主题的专家
·其中的8%是关于超过三个主题的专家
就代理上的给定分发名单而言:
·史蒂文·贾金斯向此名单投递的电子邮件最多
·莎拉·特伦特在此名单上答复的电子邮件最多
·诺萨·欧莫贵从未向此名单投递电子邮件
·帕特里克·施米茨本月曾向此名单投递87条电子邮件
·理查德·诺沃特尼今年曾向此名单投递345条电子邮件
就代理上的所有分发名单而言:
·史蒂文·贾金斯向所有名单投递的电子邮件最多
·丽莎·黑伯伦只答复了这些名单上2%的电子邮件
·诺萨·欧莫贵从未向任何名单投递电子邮件
·帕特里克·施米茨至少每星期一次向所有名单投递
·理查德·诺沃特尼曾在3个名单上投递邮件
就代理上的所有信息对象而言:
·史蒂文·贾金斯一直是最多产的发表者(他发表了其中的5%)
·萨莉·史密斯一直是最多产的注解者(她注解了其中的2%)
·诺萨·欧莫贵一直是最活跃的新闻作者
·帕特里克·施米茨具有合计最多的专长
·史蒂夫·贾金斯就今年发表的信息而言具有最多的专长
·加文·施米茨参与过最多的讨论(其中的12%)
·理查德·诺沃特尼本月参与过最多的讨论(其中的18%)
WWW.d.配对块
XXX.人物对人物
基于语义链接
·帕特里克·施米茨曾发送邮件给13个人
·47个人曾经与帕特里克·施米茨一同出现在“致”名单上
·47个人曾经与帕特里克·施米茨一同出现在“抄送”名单上
·在帕特里克·施米茨发送的电子邮件中总共曾提及89个人
·24个人曾在帕特里克·施米茨注解的相同信息上注解
·3个人在帕特里克·施米茨属于的所有分发名单上
·29个人在帕特里克·施米茨属于的至少一个分发名单上
基于语境模板
·12个人在与帕特里克·施米茨相同的信息类别上具有专长
·14个人和帕特里克·施米茨属于相同信息项目的新闻作者
·27个人在与帕特里克·施米茨讨论
YYY.信息对人物
基于语义链接
·这条信息项目是帕特里克·施米茨投递的
·这条信息项目是史蒂夫·贾金斯撰写的
·这条信息项目曾抄送给2个人
·3个人曾注解这条信息项目
基于语境模板(与语境模板块相似)
·关于这条信息项目有4位专家
·关于这条信息项目有27位新闻作者
ZZZ.信息对信息
基于语境模板(与语境模板块相似)
·相关的‘所有匹配’有578个
·相关的‘最佳匹配’有235个
·相关的突发新闻有4个
·相关的大标题有46个
基于语义链接(经由人员)
·21条信息项目具有与这条相同的专家
·23条信息项目具有与这条相同的新闻作者
·34条信息项目由投递这条的同一个人投递
·34条信息项目由撰写这条的同一个人撰写
·44条信息项目由注解这条的人员注解
AAAA.e.递归块
借助于递归块,关于当前信息块之主题的深层信息显示会形成某种语境分层结构。系统于是基于该主题的对象类型递归显示有关块。利用递归块,本系统实质上是由源对象开始,探索语义网络并沿着该网络的路径不断显示块。探索最好停止在与资源限制一致且基于用户反馈的深度。
递归块也可想像成企业组织结构图的语境版本。然而,借助于信息神经系统中的深层信息,与其说浏览信息树,用户将能够浏览知识树。举例来说,假设某用户选取了一个对象,并且如下所示的树状视图将出现:
以文档为语境的示例:
[+]关于‘文档标题’的新闻作者
[+]加文·施米茨
    [+]直接上级->
       [+]史蒂夫·贾金斯
          [+]类似史蒂夫·贾金斯的专家->
             [+]诺萨·欧莫贵
             [+]帕特里克·施米茨
          [+]类似史蒂夫·贾金斯的兴趣群体->
             [+]帕特里克·施米茨
                ...
             [+]查克·詹森
                ...
      [+]直接下级->
         [+]乔·威廉斯
            [+]直接下级
            [+]类似乔·威廉斯的兴趣群体-?
     [+]理查德·诺沃特尼
        ...
     [+]诺萨·欧莫贵
   ...
[+]兴趣群体
[+]专家
以电子邮件为语境的示例:
[+]电子邮件自:
 [+]诺萨·欧莫贵
    [+]类似诺萨·欧莫贵的专家
       ...
[+]电子邮件致
 [+]查克·詹森
    [+]类似查克·詹森的专家
        ...
[+]电子邮件抄送:
 [+]理查德·诺沃特尼
    [+]类似理查德·诺沃特尼的专家
       ...
[+]电子邮件附件:
 foo.doc
    [+]关于foo.doc的专家
       [+]加文·施米茨
          [+]类似加文·施米茨的新闻作者
              ...
[+]关于‘电子邮件标题’的新闻作者
     ...
以会话对象为语境的示例:
[+]会话参与者
 [+]史蒂夫·贾金斯
    [+]类似史蒂夫·贾金斯的兴趣群体......
       ...
 [+]诺萨·欧莫贵
    [+]类似诺萨·欧莫贵的兴趣群体
       ...
[+]关于‘会话标题’的专家
 [+]理查德·诺沃特尼
    [+]类似理查德·诺沃特尼的兴趣群体
       ...
请注意在前例中对默认谓词的使用,例如在将人员主题与人员对象链接时使用了谓词“类似”(例如,类似理查德·诺沃特尼的兴趣群体)。
以下为另一个递归块示例:
[+]这个电子邮件由帕特里克·施米茨撰写
[+]帕特里克·施米茨的直接上级是诺萨·欧莫贵
[+]诺萨·欧莫贵有6个直接下级
     [+]史蒂夫·贾金斯......
   [+]史蒂夫·贾金斯投递了......
     [+]史蒂夫·贾金斯是关于.....的专家
[+]史蒂夫·贾金斯是关于.....的新闻作者
[+]史蒂夫·贾金斯曾参阅6个讨论
   [等等]
     [+]理查德·诺沃特尼.....
     [+][其余6个直接下级]
  [+]诺萨·欧莫贵注解了13个对象.....
     [+][关于这13个对象的更多语境模板块]
  [+]诺萨·欧莫贵撰写了278个对象
[+]诺萨·欧莫贵注解了23个项目         [...]
[+]帕特里克·施米茨有5个直接下级
   [+]约翰·多伊......
    [+]基于该等直接下级的更多原生块
[+]帕特里克·施米茨曾注解47个对象
在最佳实施方式中,递归块将最常由语义浏览器中每个结果对象旁边的钻取窗格显示。这将允许用户选取某个结果对象,然后递归且依语义地“探索”该对象(如上面所举例说明)。
此外,深层信息钻取树状视图的每个标题项目将有链接到某个请求(例如,类似史蒂夫·贾金斯的专家),并且每个结果将有链接到某个实体。举例来说,用户将能够由深层信息树状视图的任何位置(依语义)“定位”到“人物”帕特里克·施米茨。用户于是将能够查看关于帕特里克·施米茨的卷宗,复制帕特里克·施米茨,以及粘贴到比如突发新闻上,从而打开一个称为“按帕特里克·施米茨的突发新闻”之请求。请再次注意基于人物主题对默认谓词的使用(“按”)。
最佳实施方式演示程序深层信息树状视图(在语义浏览器中的语义运行时API支持下)将记录哪些链接是请求、哪些链接是结果对象;这样一来,当用户单击树状视图的某个链接时,它就能聪明地解释该用户的意图(它将定位到某个请求或实体)。
BBBB.信息神经系统的创建请求向导规范
CCCC.介绍创建请求向导
概述
最佳实施方式创建请求(或灵巧智能体)向导令用户可轻易且直观地创建新请求;此等请求用于表示要向一个或多个知识源(运行知识综合服务)发出的语义查询。
向导第1页:Select a Profile and Request Type{选取配置文件和请求类型}:此页令用户可选取用于创建请求的配置文件,以及他(她)想要创建之请求的类型。此类型可为卷宗(指南),这将创建一个包含针对每个语境模板(基于此请求中指明的过滤器)之子请求的请求;知识类型(相应于诸如最佳匹配、大标题、专家、新闻作者等语境模板);信息类型(相应于演示文稿、一般文档等类型);以及属于混合器且令用户可将若干个请求视为一个凝聚单元的请求集合。参见图17A。
向导第2页:选取知识社区(代理):此页令用户可选取此请求应从中获得知识的知识社区(在知识综合服务器(KIS)上运行)。用户能够指明此请求应使用选定配置文件中已配置的那些知识社区,或选取特定知识社区。参见图17B。
向导第3页:选取过滤器:此页令用户可选取此请求中要包括的过滤器。过滤器可包括一个或多个关键词、文本、类别、本地文档、Web文档、电子邮件地址(用于人员过滤器)、实体。替代实施方式将支持其他过滤器类型。此属性页也令用户可选取应用特定过滤器时使用的谓词。将得到显露的最常用谓词最好是“Relevant to”{相关于}。与该过滤器类型一致的其他谓词可被显露(例如,对于经由某电子邮件地址或实体参照某人物的过滤器来说,如果请求的类型不是‘人员’则将使用默认谓词“BY”{按}——例如Headlines BY John Smith{按约翰·史密斯的大标题},如果请求的类型是‘人员’则将使用默认谓词“LIKE”{类似}——例如Experts LIKE John Smith{类似约翰·史密斯的专家})。此属性页也令用户可选取应用这些过滤器时的运算。两个最常用的运算符为AND{与}(在此情况下唯有通过全部过滤器的结果会被发回)和OR{或}(在此情况下通过任何过滤器的结果都会被发回)。参见图17C。
向导第4页:Name and describe this request{命名和描述此请求}:此页令用户可为此请求输入一个名称和描述。向导会基于此请求的语义自动为此请求建议一个名称和描述,例如:
1.Headlines on Security AND on Application DevelopmentAND on Web Services{关于安全保障与关于应用程序开发与关于Web服务的大标题}。
2.Experts from R&D on Encryption Techniques OR on UserInterface Design,etc.{出自研发且关于加密技术或关于用户界面设计等等的专家}。
3.Presentations on Artificial Intelligence{关于人工智能的演示文稿}。
4.Dossier on Data Mining AND on Web Development{关于数据挖掘与关于Web开发的卷宗}。参见图17D。
用户将可取代建议的名称或描述。这些建议将基于名称和描述的最大长度限制按需要截短。
语义浏览器也经由一个属性表显露现有请求的属性。这令用户可“编辑”该请求。此属性表显露与向导相同的用户界面,只是其字段会基于该请求的语义(通过去串行化该请求的SQML表示)得到初始化。参见图17E。
DDDD.信息神经系统的创建配置文件向导规范
EEEE.介绍创建配置文件向导
概述
创建配置文件向导令用户可轻易且直观地创建新的用户配置文件。
向导第1页:Select your areas of interest{选取您的兴趣领域}:此页令用户可选取其兴趣领域。这就令语义浏览器可获得关于此用户之知识兴趣(例如他(她)工作所在的行业)的一些高层信息。此信息于是用于精简类别对话框中的类别选择,推荐已配置为具有与此用户之兴趣领域一致的知识域的新知识社区(代理)等等。参见图45A。
向导第2页:Select your knowledge communities{选取您的知识社区}:令用户可为此配置文件订阅知识社区。这就令语义浏览器可以“知道”在为此配置文件创建请求后,该等请求需向哪些知识源发出。语义浏览器在调用视觉化、语义警报、灵巧镜头(当该镜头是给定配置文件的某个请求或智能体时)、对象镜头(当目标对象是出自给定配置文件的某个结果时)、当用户拖放(或复制与粘贴)对象到给定配置文件的某个请求或智能体上时等等,也会使用此配置文件中的知识社区。参见图45B。
向导第3页:Name and describe this profile{命名和描述此配置文件}:此页令用户可为此配置文件输入一个名称和描述。此页令用户可指明此配置文件是否最好被指定为默认配置文件。当用户使用语义浏览器的任何操作中未明确指定配置文件时,默认配置文件将得到使用(例如,将文档由文件系统拖放到代表语义浏览器的图标上将用该文档从默认配置文件打开一个书签,而将文档拖放到代表特定配置文件的图标上将用该配置文件打开一个书签)。参见图45C。
FFFF.信息神经系统的创建请求书签规范
1.介绍创建书签向导
概述
创建书签(或本地或无智请求智能体)向导轻易且直观地创建新的书签(本地或无智请求)以在语义浏览器中查看本地或Web文档、实体等等;由此他(她)能够使用系统的工具箱(即拖放、灵巧复制与粘贴、灵巧镜头、灵巧警报、视觉化等等)。
向导第1页:选取配置文件和请求类型:此页令用户可选取用于创建书签的配置文件,以及在此书签中添加和删除项目。参见图46A。
向导第2页:Name and describe this bookmark {命名和描述此书签}:此页令用户可为此书签输入一个名称和描述。向导会基于此书签中的项目自动为此书签建议一个名称和描述,例如:
·Document 1,Document 2,and Document 3{文档1、文档2、文档3}
·Documents Matching′Encryption′{与‘加密’相匹配的文档}
·Documents in the Folder′My Documents′and Subfolders{‘我的文档’文件夹和子文件夹中的文档}
·Nervana Presentation(July 2003).ppt AND DocumentsMatching″Security″in the Folder′My Documents′and Subfolders{Nervana Presentation(July 2003))}.ppt与‘我的文档’文件夹和子文件夹中与‘安全’相匹配的文档}
用户将可取代建议的名称或描述。这些建议将基于名称和描述的最大长度限制按需要截短。参见图46B。
2.情景
向我出示关于蛋白质工程的所有演示文稿
使用创建请求向导,选取Presentations{演示文稿}信息类型(在Documents\Presentations内),然后选取Protein Engineering {蛋白质工程}类别作为过滤器。单击下一步,向导会基于该请求的语义聪明地为该请求建议一个名称(Presentations on Protein Engineering{关于蛋白质工程的演示文稿})。向导也会选取适当默认谓词。单击完成,向导会编译此查询,发送SQML给选定配置文件内的KIS,然后显示结果。
3.智能发表工具元数据建议与维护
尽管信息神经系统不依赖于由发表工具(例如文档的作者)储存的元数据,令此等元数据可用且可靠或许是有利的。现有技艺的一个问题在于发表工具(例如Microsoft Word、Adobe Acrobat等等)不会聪明地管理元数据之创建与维护过程。以下是本发明之最佳实施方式能够用于改善元数据创建与维护过程的一些方式:
a.在用户创建一个新文档时,将该作者的电子邮件地址(这可编程为从用户的电子邮件客户程序中检索,并且倘若该用户有若干个地址,发表工具应询问用户要使用哪个地址)加入该文档的元数据头内(而不仅仅是作者的姓名)。这是因为电子邮件地址提供好得多的唯一性(例如,可能有数以百万计的人在使用‘约翰·史密斯’这个名字,因此此等数据在文档元数据中的出现就并非那么有用)。请注意,元数据头能够使用的一个可能电子邮件地址可从已登录用户的单一登录账户(例如Microsoft PassportTM)中检索。
b.在此文档被编辑时,倘若当前用户并非文档的作者(如元数据头中指明),该用户会被询及是否想要相应更改元数据头。如此就提供了智能元数据维护的某种基本形式。
此模式能够应用于多种不同的对象类型和元数据字段,只要发表工具能够确认该等字段(例如当前已登录用户的姓名和电子邮件地址)。
GGGG.信息神经系统的语义线程规范
1.语义线程
概述
在最佳实施方式中,语义线程属于KIS语义网络中代表注解或会话线程的对象。这些线程与常规电子邮件线程的不同之处在于,它们亦是语义线程,即它们具有对象标识符和类型标识符(OBJECTTYPEID_THREAD标识符)针对具体线程的语义链接,它们经由一个或多个基于本体分类的知识域传达含义,并且它们支持动态链接。此外,因为它们是信息神经系统中的第一类对象,它们能够被查询、复制、粘贴、拖动、放下,以及与灵巧镜头和对象镜头共用。图23例举了一个语义线程对象及其语义链接。
由于语义线程对象属于语义网络和整个信息神经系统的第一类成员,它如同此系统中的其他对象一样可得到处理、表示、查询。举例来说,语义浏览器将允许用户由人物对象定位到该人物曾经参与的所有线程(经由“Participant”{参与者}——利用PREDICATETYPEID_PARTICIPANTOFTHREAD谓词类型标识符)。该用户于是能够由此线程定位到其所有参与者(人员),并且随之继续动态定位。再举一例,线程对象亦可能是给定语境(或无语境,倘若没有指定)中的最佳匹配。
在最佳实施方式中,语义线程对象也传达含义。这样做是有利的,因为这意味着线程能够经由系统中的语义查询发回。例如,“给我找到关于主题A和主题B的所有线程”。如同对诸如文档的其他对象一样,KIS会保持语义线程的语义链接。然而,由于语义线程可能参照多个对象,特定线程的语义随该线程包含的对象一起演进。举例来说,某线程可能开始于一个主题,但很快就演进到包含其他主题。电子邮件线程的终结“语义域”可能与其开始时所在者截然不同,即参与者提出新看法、新信息被加入此线程、电子邮件附件可能被加入此线程等等,全都基于含义。
KIS管理着语义线程的“语义演进”。它通过在线程中添加语义链接以“跟踪”该线程的内容来达到此目的。例如,假设某线程在开始时有一个文档和一个注解,KIS会为这两者分别添加一个至该文档和该注解所属类别的语义链接。换言之,该线程可被宣称具有与其所包含的该文档和注解相同的语义。倘若另一个注解被添加到此线程上(例如,假设某个用户注解了第一个注解),KIS会为已由此线程链接至的该新注解之类别计算新链接强度。KIS最好如此进行,因为该新注解能够用特定看法削弱或加强整个线程的语义。然而,对此线程已经链接的类别之语义链接强度的修改最好逐类别进行,因为如同其他对象一样,此线程可能属于具有不同强度的多个类别。新的链接强度能够用至少两种方式计算:在一个简单实施方式中将使用与此线程链接之类别的所有链接强度之平均值。但是这样做有其不利之处,即该线程中如果有太多的弱强度项目,则整个线程的“表象”(在KIS语义查询处理器看来)语义可能遭到侵蚀。一个替代实施方式则使用最大链接强度。但是这样做亦有其不利之处,因为即使该线程“已经转移到”新的域或类别,其语义可能继续固定在旧的域或类别上。而从加权平均的角度来看,这很可能随着线程大小的增长而发回令人迷惑的结果。
在最佳实施方式中,KIS最好计算与该线程链接之类别之所有链接强度的加权平均值,此新加权平均值成为链接强度。此加权平均值最好用该线程中每个对象内的概念数目进行计算。这样做的益处在于,相对于该线程中“依语义较密集的”对象(例如电子邮件附件或长邮件),“依语义较轻”的对象(例如短邮件)不会侵蚀该线程的语义。在最佳实施方式中最好使用概念数目而非大小,因为对象大小就该对象的概念权重而言是可靠性较差的指标。例如,某文档可能包含图象或可能包括与关键短语或概念不能很好对应的大量信息。
此计算的权重最好也包括条目添加的时间(藉此相对于较新项目“老化”较旧项目的语义)。此权重于是与链接强度相乘,对所有乘积求和,然后除以条目数目。亦可使用其他加权方案。
以下规则适用于将新项目加入语义网络和加入某语义线程:
1.对要加入该线程的该新项目进行分类
2.对发回之类别清单中已在该语义线程上的每个类别
{
·计算新的加权平均链接强度
·更新由该语义线程对象伸出的类别语义链接
}
3.对发回之类别清单中尚未在该语义线程上的每个类别
{
·指定链接强度
·添加由该语义线程对象伸出的类别语义链接
}
该加权平均链接强度计算如下:
其中Ci是对象i的归一化概念数目(介于0至1),N是该线程中的对象数目(包括该新对象)。该归一化概念数目是通过将每个对象的概念数目(由知识域管理器(KDM)提取)除以该线程中最大对象(包括该新对象)的概念数目得到。
如果某个语义线程包含标准的固有(且未经编辑的)电子邮件线程,KIS会以不同方式修改语义网络。这是因为绝大多数电子邮件客户程序会在最新的电子邮件中包括构成该线程的所有以往电子邮件。这样一来,在此情况下KIS最好只使用最新电子邮件作为整个线程的代表。为此,KIS最好对最新电子邮件进行分类,然后用相应于新类别和链接强度的新语义链接取代该线程对象中(相关于类别的)所有以往语义链接。
对于非电子邮件线程(举例来说,基于对语义网络中某个现有对象之某个注解而形成的线程),则应采用前面描述的模式。或者,KIS可维持一个聚集线程文档(ATD),然后将该文档分类。此文档应包含该线程中对象的文字,大致类似于电子邮件在同一个线程内包含以往邮件文字的方式。
在新对象被加入该线程时,KIS最好更新语义元数据仓库(SMS)中该线程对象的上次修改时间。
2.语义线程会话
信息神经系统语义线程会话是一种特殊形式的语义线程。会话实质上是不止一个参与者的语义线程。语义线程会话的对象类型标识符为OBJECTTYPEID_THREADCONVERSATION。
KIS会基于线程中的参与者数目而创建一个线程,并且能够立即将线程创建为线程会话。或者,KIS能够在检测到更多参与者时将该线程“升级”为会话。
3.语义线程管理
下面的伪码举例说明了KIS如何在语义网络中添加优先线程和会话:
1.如果检测到单个电子邮件且该邮件是某现有线程对象的成员
{
·将这个新的电子邮件对象添加到该线程上并更新语义网络
·如果该线程有不止一个参与者,将其对象类型标识符更改为OBJECTTYPEID_THREADCONVERSATION
}
2.如果检测到电子邮件线程
{
·创建一个新的线程对象并更新语义网络
·如果该线程有不止一个参与者,将其对象类型标识符更改为OBJECTTYPEID_THREADCONVERSATION
}
3.如果检测到某现有对象的电子邮件注解
{
·将该注解添加到语义网络
·如果被注解的对象本身不是注解
{
·创建一个新的线程对象并更新语义网络
}
否则
{
·将此新注解加入到包含该被注解对象(即该现有注解)的线程中并更新语义网络
·如果该更新的线程有不止一个参与者,将其对象类型标识符更改为OBJECTTYPEID_THREADCONVERSATION
}
}
HHHH.示例屏幕抓图
图24-44B为更多的屏幕抓图,进一步举例说明了上面讨论的功能、选项、操作。
IIII.信息神经系统的语义查询定义和视觉化规范
1.语义图象与运动
JJJJ.a.概述
就Nervana语义用户体验而言,语义图象与运动能够是最佳实施方式中有利的组成部分。换句话说,在将语义图象或运动元数据存储于Nervana代理(信息社区)且经由Nervana XML Web服务访问的实施方式,用户对本系统的体验能够得到增强。在该实施方式中,最终用户将可经由Nervana而对其图象享有受语境和时间制约的语义访问。仅出于举例目的,请设想在电子邮件上使用Getty Images(或Corbis)智能体作为灵巧镜头——当被调用时,这将打开依语义与该邮件相关的图象。或者设想将某个文档从您的硬盘驱动器拖放到Getty智能体上,从而查看依语义相关的图象。这将需要具有(与某图象方案一致的)图象元数据。Nervana工具箱将保持不变,我们仅仅是为图象添加了一个新信息对象类型。此外还有针对语义图象的语义外壳,即不同的视图、缩略图、幻灯片放映、过滤、聚集等等。如需语义图象的示例,请访问:
http://creative.gettyimages.com/source/search/resultsmain.asp?source=advSearch&hdnSync=Medicine%7E0%2C12%2C449%2C3%2C15%2C1%2C0%2C0%2C0%2C12287%2C0%2C7%2C14%2C6%2C3%2C3%2C0%2C12%2C449%2Cen%2Dus&UQR=tfxfwz
泛泛地说,语义视觉化的属性将依若干不同的变量而变化。这些变量中时常会有语境,包括要调用之系统特征或属性的语境。在下面若干节中将列出和(或)描述影响语义判断的一些语境变量。在许多场合下,语义视觉化的变量或决定因素将有重叠或共同之处;但在某些情况下,该等考虑因素和考虑因素组合对于该特定情形来说将是独一无二的。
KKKK.b.针对具体行业的语义图象与运动
针对具体行业的语义图象与运动是能够用作(并且在最佳实施方式中已经用作)(与行业对应的)一个或多个类别语义结果的表示氛围之组成部分的图象与运动。例如,请访问http://www.corbis.com和http://www.gettyimages.com,并用下面列出的关键词(该等字词经过聚集后可基于行业标准的分类法与目标行业对应)进行搜索。这些图象与运动也能够用作(映射到语境模板和类别的)语境和类别外壳的背景、过滤器效果、变换、动画。此外,这些图象与运动可用作由其中一些图象中提取的运动路径之视觉效果,从而得到优越的屏幕保护程序。举例来说,请想像这样一个外壳:它沿由此类语义图象之一中提取的运动路径显示元数据和视觉化效果(例如,在一个灯泡内转动的元数据——用于“电力”工业),以及chrome和其他环绕图象与动画等等。其他有针对具体行业之图象与运动的行业可能包括:
  ·制药   ·电信   ·航空
  ·医药   ·电信设备   ·零售
  ·医疗保健   ·电信服务   ·时装
  ·生命科学   ·电信技术   ·广告
  ·生物技术   ·电信法规   ·航空航天
  ·油气   ·烟草   ·国防
  ·化工   ·汽车   ·农业企业
  ·能源   ·汽车   ·农业
  ·电力   ·保险   ·饮料
  ·供气   ·咨询   ·企业服务
  ·供水   ·信息技术   ·电子商业
  ·娱乐   ·技术   ·食品
  ·环境服务   ·计算机设备   ·森林产品
  ·出版   ·计算机制造商   ·医疗保健提供者
  ·房地产   ·计算   ·酒店
  ·金融   ·半导体   ·互联网
  ·经纪   ·纳米技术   ·法律
  ·金融服务   ·公家机关   ·法律
  ·银行   ·政府   ·制造
  ·消费者   ·国土安全   ·营销
  ·消费产品   ·旅行   ·媒体
  ·消费者服务   ·旅游   ·联网
  ·通信   ·交通
举例来说,假设用户启动了一个请求或智能体:关于生物信息学或关于蛋白质工程的大标题,语义浏览器会将该SQML中与生物技术相关的类别映射到生物技术业的一组图象上;然后作为该请求或智能体之结果的外壳之组成部分,显示一个或多个图象(由此提供令人愉快的用户体验和可视地传达该请求或智能体的“情绪”)。
图101是制药与生物技术业的一个样本语义图象(优美的DNA螺旋重叠在左边的人脸和右边的化学图表上。承蒙Corbis网站许可使用)。
这也同样适用于信息类型和语境模板。外壳将基于语境或信息类型和类别或本体分类智慧行事,并且以智能的方式跨这些属性混合与匹配语义图象与运动。例如,标题为“关于无线技术的大标题”的智能体可有chrome(和/或一个灵巧砂漏——见下),其中显示在“大标题”图象与运动和“无线”图象与运动之间转换的基于图象与运动之动画。标题为“关于无线的混合器和关于半导体的突发新闻和由我的群组中任何人发出的与产品规格相关的电子邮件”之混合器可有chrome(和/或一个灵巧砂漏),其中显示在“大标题”、“新闻”、“无线”、“半导体”之间转换的图象与运动。
演示程序的查询处理器能够列举全部语境模板与信息类型和所有类别(由智能体或混合器SQML),并且相应设置chrome动画。
就信息类型而言,输入下列搜索(例如在Corbis和Getty上):
  ·文档   ·在线学习
  ·电子邮件   ·人员
  ·书籍   ·用户
  ·杂志   ·顾客
  ·多媒体
此外,就语境模板而言,输入下列搜索:
  ·大标题   ·收藏夹
  ·新闻   ·地点
  ·发现   ·时间(就“时间线”和“即将发生事件”而言)
  ·会话   ·时间表
  ·专家   ·约会
此外,请注意语义图象与运动最好不要完全随机,但最好也不要出自某个合订的组合。此等图象/运动最好经过精心选取且然后由外壳在选定的集合中随机挑选,但最好不是由诸如Corbis或Getty Images的整个图片集中随机选取。否则可能遇到无聊的图象、卡通,以及可能令人不快或不适当的图象。此外,有些指导方针最好依外壳主题是否处于微妙、温和、兴奋或超兴奋模式而变化。在微妙模式下,外壳可能决定为每个视觉化中心点选取一个图象/运动。而在其他模式下,这很可能会导致乏味的用户体验。
在低调模式下。外壳或可将某个语义图象/运动用作chrome的一部分,这与PowerPoint幻灯片组的背景并无二致(例如经过α混色)。语义图象/运动亦能够用于在灵巧砂漏(见下)中和作为视觉化的组成部分(在语境条、面板或调色板上)。就视觉化语境和信息类型而言,语义图象/运动最好经过精心挑选,从而可清楚地表明该信息类型或语境。此外,选择模式亦可成为一项外壳属性。
另外,每个外壳所用之语义图象/运动的可能数目可能需要有个上限,这取决于在什么地方显示该等图象/运动。然而在某些情景中,这可能并非必需。例如,混合器外壳可能随着用户在混合器结果中的定位(从页面到页面或从智能体到智能体),而在chrome背景之间转换,以便与来自该混合器的当前显示内容保持一致。这亦可成为一项外壳属性。
LLLL.c.客户端语义图象与运动高速缓存
演示程序具有一个可扩展灵巧客户端高速缓存,其中有下载的和(于安装时)储存在客户机上的语义图象与运动。外壳于是能够在这些已预先缓存的图象与运动中挑选。图象/运动的预缓存可基于用户(自己选择)的收藏类别和兴趣领域,这将映射到目标行业。外壳于是能够用对图象服务器(某个显露服务器端图象/运动的XML Web服务,由Nervana或诸如Corbis或Getty Images的第三方提供)的请求式图象查询来补充该等已预缓存的语义图象/运动。
演示程序也将智慧行事和具有某种偏好功能,从而令最新下载的图象/运动先于较旧者得到选取(作为一种打破平局的手段)。与每个图象/运动一同高速缓存的还有一个“用量计数”,演示程序用此计数就显示哪些图象/运动与何时显示进行过滤。此“负载均衡分配”将导致更新鲜且不重复的用户体验。
此高速缓存最好按照需求进行充填(基于用户的语义查询),例如,对于波音公司的用户计算机来说,预缓存制药图象/运动是毫无意义的。高速缓存容量最好也有上限,并且图象高速缓存管理器最好使用某LRU算法或等同算法清除“旧的”和“未用的”图象。这样一来,此高速缓存就能与用户的智能体使用模式和收藏夹智能体清单保持“语义同步”。
2.灵巧砂漏
Nervana演示程序为提供“语义用户体验”而做出的多数呼叫将为向XML Web服务的远程呼叫。因此,在用户界面上将有不可预知且可能极长的延迟。人们能够预期企业内部会有可观的带宽和服务器处理能力,但Nervana用户界面仍然必须针对方法调用中的未知等待时间做出“计划”。
当今操作系统存在的问题之一是对磁盘或网络的不限时I/O呼叫。某些中央处理器作业也有相当长的延迟。在Windows和苹果机用户界面中,用户由某“等待”光标——通常具有“砂漏”的形状——而得知延迟的存在。
在最佳实施方式中,演示程序将具有语义提示(经由直接访问SQML“方法调用”),并且藉此能够显示“灵巧或语义砂漏”的等同内容。这可为显示“正在载入”或某些其他效果的一个中间页面。此外,演示程序能够通过读取该SQML以获得关于该查询所表示的类别和信息类型或语境模板之提示,来传达该查询的语义。演示程序于是能够使用该等提示来显示与该查询一致的语义图象和文本,尽管它尚未收到结果。查询的提示越多,该砂漏就越智慧。该“正在载入”页面于是能够传递“即将来到的是什么”气氛——甚至在实际结果由Web服务到达和由演示程序合并(演示程序)以获得最终结果之前。
此“灵巧砂漏”不仅能够在主结果窗格上显示,或许也可在灵巧镜头气球弹出窗口和内插预览窗口(实质上在对Web服务的每个呼叫点和“焦点”处)上出现。演示程序能够通过在显示“砂漏”前等候查询超时(或许在若干百毫秒之后——有关实现应借助于合用性测试来获得此数字)而智慧行事。
3.视觉化——语境模板
引言
语境模板是情景带动的信息查询模板,用于与信息访问和提取的具体语义模型对应。语境模板在本质上可想像成个人用数字语义信息提取“通道”,用于通过采用预定义的语义模板向用户递送信息。语境模板最好跨一个或多个代理而聚集信息。
下面描述的是已定义的语境模板。指向多种类型语义信息之综合和分发的更多语境模板正在得到考虑(例如与情绪相关的语境模板,例如“愤怒”、“悲伤”等等;以及地点、机动性、周围条件、用户任务等等的语境模板)。
突发新闻
突发新闻语境模板就插入其传递语义信息的方式而言,可类比为CNN{有线新闻网}的“Breaking News”{突发新闻}节目之个人化数字版本。此语境模板令用户可访问一个或多个代理上极为时间关键的信息;该等信息将根据信息创建或发表时间和一个定义信息关键性的可配置时间长度来排序。
图102是突发新闻语境模板的一个依语义适当之图象视觉化示例。
突发新闻——样本对象和语境条视觉化
下面列出了就突发新闻语境而言适当的视觉化样本或代表元件。如最佳实施方式中的所有视觉化(或其部件)一样,“情绪”或语义感觉就指定语境而言将是适当的。如果作一个很粗糙的类比的话,视觉化对于应用程序内语境的适当性,就如同“道具”必须适合电影剧本中特定场景一样。这将不仅适用于此特定对象和语境条的视觉化,也适用于最佳实施方式中的所有视觉化。
1.以即将到来的突发新闻项目总数为背景,显示最新或即将发表之突发新闻项目之发表或预定时间的走动时钟
2.在语义图象上显示最新或即将发表之突发新闻项目之发表或预定时间的走动时钟
3.在语义图象和突发新闻项目的总数上显示最新或即将发表之突发新闻项目之发表或预定时间的走动时钟
4.在素背景上显示最新或即将发表之突发新闻项目之发表或预定时间的走动时钟
5.在不同背景上(依序)显示所有突发新闻之发表或预定时间的不走动时钟
6.在不同背景上显示最新或即将发表之突发新闻项目之发表或预定时间的日历视图
7.在不同背景上(依序)显示所有突发新闻之发表或预定时间的日历视图
8.缩放的字体大小——取决于最新或即将发表之突发新闻项目的发表或预定时间
9.缩放的字体大小——取决于突发新闻项数
10.动画字体(例如,闪烁提示、转动文本、沿路径运动的文本等等),其动画速率取决于最新或即将发表之突发新闻项目的发表或预定时间
11.动画字体(例如,闪烁提示、转动文本、沿路径运动的文本等等),其动画速率取决于突发新闻项数
12.变化的字体颜色——取决于最新或即将发表之突发新闻项目的发表或预定时间
13.变化的字体颜色——取决于突发新闻项数
14.突发新闻语义图象的动画图形或等同内容
15.突发新闻项数
16.依序动画显示的突发新闻项目标题(清单视图)
17.依序动画显示的突发新闻项目标题和详细资料(平铺视图)
18.围绕对象沿一轨道运动路径移动的语义图象/运动
19.在语义图象/运动上显示项数的气球弹出窗口
20.在带有语义图象/运动动画的素背景上显示项数的气球弹出窗口
大标题
大标题新闻语境模板就其传递语义信息的方式而言,可类比为CNN{有线新闻网}的“Headline News”{大标题新闻}节目之个人化数字版本。此语境模板令用户可访问一个或多个代理上的信息大标题;该等大标题将根据信息创建或发表时间和一个定义信息“新鲜度”的可配置时间长度或项数来排序。举例来说,CNN的“大标题新闻”节目(昼夜不停地)每隔30分钟显示大标题。在一最佳实施方式中,大标题语境模板将作为服务器上的一个SQL查询而实现;该查询具有依序串联在一起的下列子查询:今天发表的推荐、今天发表的收藏夹项目、今天发表的最佳匹配、今天和明天的即将发生事件、今天发表的带注解项目。
所有子查询都最好依发表日期/时间排序,然后串联在一起。更多的过滤器将基于SQML中的谓词清单得到应用。图103所示为一个大标题视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象,举例说明了前述原则。
会话语境模板
会话语境模板就插入其传递语义信息的方式而言,可类比为CNN{有线新闻网}的“Crossfire”{众矢之的}节目之个人化数字版本。与使用会话和辩论作为信息分发语境的“众矢之的”节目相似,在最佳实施方式中,会话语境模板跟踪相关信息的电子邮件投递、注解、线程。
会话语境模板包括下列信息对象类型:
1.线程深度至少为一的电子邮件(对某电子邮件的电子邮件回复)
2.线程深度至少为一的注解(对某对象之某注解的注解)
3.互联网新闻投递(对某新闻投递的新闻投递答复)
此查询将按线程深度排序。更多的过滤器将基于SQML中的谓词清单得到应用。此外,语境外壳应按线程显示信息项目。
图104所示为一个视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(两个人在一张写字台上工作)
会话语境——样本对象和语境条视觉化
下面是一份相应于指明语境(在括号内)依语义适当之视觉化元件的考虑因素或特征清单。
1.图象/运动的动画图形(图标和语境指南视图)
2.素背景上的最大线程深度(图标和语境指南视图)
3.语义图象/运动上的最大线程深度(图标和语境指南视图)
4.依序动画显示的会话标题(清单视图)
5.依序动画显示的会话标题和详细资料(平铺视图)
6.素背景上的会话数目(图标和语境指南视图)
7.语义图象/运动上的会话数目(图标和语境指南视图)
新闻人物语境模板
新闻人物语境模板就插入其传递语义信息的方式而言,可类比为NBC{全国广播公司}的“Meet the Press”{面对媒体}节目之个人化数字版本。在此情况下,侧重点在于“新闻人物”,而不是新闻本身或会话。用户使用发回的人员作为信息对象中心点在网络中定位。新闻人物语境模板可被视为大标题语境模板,最好带有“人员”或“用户”对象类型过滤器,以及“authored by”{由......撰写}、“possibly authoredby”{可能由......撰写}、“hosted by”{由......主持}、“annotatedby”{由......注解}、“expert on”{关于......的专家}等等谓词(将人员与信息关联的谓词)。“relevant to”{相关于}默认谓词最好用于替代所有针对具体相关性的谓词。相关信息(例如新闻人物)系依照“他们制造的新闻”(例如大标题)的顺序进行排序。
此查询将按大标题数排序。更多的过滤器将基于SQML中的谓词清单得到应用。
图105例举了一个语义“新闻人物”视觉化或灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(橄榄球锦标赛)
新闻人物——样本对象和语境条视觉化
1.会话中在讲话的两个人头之动画图形(图标和语境指南视图)
2.图象/运动的动画图形(图标和语境指南视图)
3.新闻人物的总数(图标和语境指南视图)
4.语义图象/运动上的新闻人物总数(图标和语境指南视图)
5.依序动画显示的新闻人物姓名(清单视图)
6.依序动画显示的新闻人物姓名和详细资料(平铺视图)
即将发生事件语境模板
即将发生事件语境模板(及其因此得到的特殊智能体)可类比传达关于即将发生事件之信息的特殊节目之个人化数字版本,例如关于“世界职业棒球大赛”、“NBA篮球决赛”、“世界杯足球决赛”等事件的特别节目。这在知识工作者情景中的等同情形是某用户想要监视与一个或多个类别、文档或其他信息中心点相关的所有即将发生之行业事件。即将发生事件语境模板最好与大标题语境模板完全相同,但是只有即将发生事件会通过过滤器并得到显示(最好使用表明事件和时间关键性的某个依语义适当的“语境外壳”)。发回的对象最好依照时间关键性排序且以最早的即将发生事件为首。
图106例举了一个语义“即将发生事件”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(预约夹)。
即将发生事件——样本对象和语境条视觉化
1.在即将发生事件之总数的背景上显示距离下一个事件之时间的走动时钟(图标和语境指南视图)
2.在语义图象/运动上显示距离下一个事件之时间的走动时钟(图标和语境指南视图)
3.在语义图象/运动和即将发生事件之总数上显示距离下一个事件之时间的走动时钟(图标和语境指南视图)
4.在素背景上显示距离下一个事件之时间的走动时钟(图标和语境指南视图)
5.在不同背景上(依序)显示距离所有即将发生事件之时间的不走动时钟(图标和语境指南视图)
6.在不同背景上显示下一个即将发生事件之预定时间的日历视图(图标和语境指南视图)
7.在不同背景上(依序)显示所有即将发生事件之预定时间的日历视图(图标和语境指南视图)
8.显示日历运动的动画图形(图标和语境指南视图)
9.图象/运动(例如日程簿)的动画图形(图标和语境指南视图)
10.语义图象/运动上的即将发生事件总数(图标和语境指南视图)
11.素背景上的即将发生事件总数(图标和语境指南视图)
12.依序动画显示的即将发生事件标题(清单视图)
13.依序动画显示的即将发生事件标题和详细资料(平铺视图)
发现
发现语境模板可类比为“Discovery Channel”{发现频道}的个人化数字版本。在此情况下,侧重点为关于特定主题的“纪录片”。发现语境模板通过随机选择与给定类别集合有关且在预定的可配置时期内投递的信息对象,模拟信息的智能聚集。语义权重而非时间是确定信息排序或表示的优先考虑因素。此语境模板可通过用分类谓词的语义链接强度过滤所有信息类型来实现。在此情况下,该过滤器的选择条件应比‘最佳匹配’过滤器宽松——该过滤器就过滤而言介于‘最佳匹配’和‘全部项目’之间某处。
图107为一个“发现”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(有盖培养皿)。
发现——样本对象和语境条视觉化
1.图象/运动(例如,望远镜、宇宙飞船、海上的老船)的动画图形(图标和语境指南视图)
2.依序动画显示的前N个信息项目标题(清单视图)
3.依序动画显示的前N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.项目总数(图标和语境指南视图)
历史
历史语境模板可类比为“History Channel”{历史频道}的个人化数字版本。在此情况下,侧重点在于不仅分发关于特定主题的信息,而且是在历史的语境中进行。就此模板而言,优先轴为类别和时间。历史语境模板与发现语境模板相似,但进一步与某“最小年龄限制”呼应。其参数最好与发现语境模板相同,只是用“最小年龄限制”参数(或某个选用的“历史时间跨度”)取代“最大年龄限制”参数。此外,发回的对象最好基于其在本系统中的年龄或其自创建以来的年龄反向或随机顺序排列。
图108例举了一个语义“历史”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(战争纪念碑)。
历史——样本对象和语境条动画视觉化
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最老(或随机)的N个信息项目标题(清单视图)
3.依序动画显示最老(或随机)的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
全部项目
全部项目语境模板代表着基于语义或基于关键词或文本搜索发回任何相关信息的语境。在此情况下,侧重点在于分发与该语境哪怕只是沾边的信息。全部项目语境模板的主轴最好为起码的关联可能性。在最佳实施方式中,为了发回可能相关之结果的最广泛集合或世界,全部项目语境模板同时采用语义查询和基于文本的查询。
图109例举了一个语义视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(太空)。
全部项目——视觉化与样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
最佳匹配
最佳匹配语境模板语境模板(及其因此得到的特殊智能体)代表着只发回高度相关信息的语境。在一最佳实施方式中,其侧重点在于分发被视为高度相关且依语义重要的信息。就这个语境模板而言,主轴为关联度。最佳匹配语境模板实质上采用语义查询且将不使用基于文本的查询,因为它无法保证基于文本之查询的关联度。最佳匹配语境模板最好用某个类别过滤器或关键词初始化。如果指定了关键词,服务器会动态完成分类。结果最好基于关联度分值或由该对象至该类别过滤器之“属于类别的”语义链接之强度排序。
图110例举了一个“最佳匹配”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(显微镜)。
最佳匹配视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
收藏夹
收藏夹语境模板(及其因此得到的特殊智能体)代表着只发回“收藏夹”或“流行”信息的语境。在此情况下,侧重点为分发已由他人认可且获得好评的信息。在最佳实施方式中,收藏夹语境模板的轴包括领导人兴趣程度、有关对象受到的“评论”,以及该对象之注解线程的深度。在一个实施方式中,收藏夹语境模板只发回具有“收藏夹”语义链接的信息,并且其排序将通过计数该对象获得的“投票”数(基于此语义链接)。
图111例举了一个语义视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(咖啡与甜点)。
收藏夹视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
经典作品
最佳匹配语境模板(及其因此得到的特殊智能体)代表着只发回具有公认价值之信息的语境。与收藏夹语境模板相似,在此的侧重点为分发已由他人认可且获得好评的信息。就此语境模板而言,优先轴包括历史语境、领导人兴趣程度、有关对象受到的“评论”,以及该对象之注解线程的深度。经典作品语境模板最好基于收藏夹语境模板实现,但具有另加的最小年龄限制和投票分值,实质上起着“老东西收藏夹”语境模板的作用。
图112例举了就“经典作品”而言灵巧砂漏、填空页面、转换效果、背景chrome等等的一个语义适当样本图象(汽车)。
经典作品视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
推荐
推荐语境模板代表着发回“推荐的”信息(或有关代理推断用户将会感兴趣的信息)之语境。推荐将通过在“SemanticLinks”表上添加“推荐”语义链接和通过挖掘用户指明的收藏语义链接来插入。推荐最好利用诸如机器学习和协作过滤等方法。此语境模板的侧重在于分发用户很可能会感兴趣但或许尚未看到的信息。就这个语境模板而言,主轴最好包括兴趣可能性和新鲜度。
图113例举了一个依语义适当的“推荐”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等之语境或应用程序元件的样本图象(竖大拇指)。
推荐视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
今天
今天语境模板代表着发回“今天”投递或举行(就事件而言)之信息的语境。此语境模板的侧重点最好是分发被视为基于“今天”过滤器来确定新鲜度时为当前的信息。
图114例举了一个语义“今天”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等元件的样本图象。
“今天视觉化”——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
带注解项目
带注解项目语境模板代表着发回带注解信息的语境。此语境模板的侧重点在于分发因一个或多个用户曾经注解而很可能重要的信息。
图115例举了一个语义“带注解项目”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
“带注解项目”视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
注解
注解语境模板代表着发回带注解信息的语境。此语境模板的侧重点在于分发属于注解的信息。
图116例举了一个语义视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(钉在公告牌上的便条)。
“注解”视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
专家
图117例举了一个语义“专家”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(教授)。
“专家”视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个专家姓名(清单视图)
3.依序动画显示最近的N个专家姓名和详细资料(平铺视图)
4.语义图象/运动上的专家总数(图标和语境指南视图)
5.素背景上的专家总数(图标和语境指南视图)
地点
图118例举了一个语义“地点”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(巴黎)。
“地点”视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个地名(清单视图)
3.依序动画显示最近的N个地名和详细资料(平铺视图)
4.语义图象/运动上的地点总数(图标和语境指南视图)
6.素背景上的地点总数(图标和语境指南视图)
混合器
图119例举了一个语义“混合器”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(混合机)。
“混合器”视觉化——样本图标动画
1.语义图象/运动的动画图形或等同内容
2.工作中的混合器或混合机之动画图形
3.依序动画显示的混合器项目标题(清单视图)
4.依序动画显示的混合器项目标题和详细资料(平铺视图)
5.语义图象/运动上的项目总数(图标和语境指南视图)
6.素背景上的项目总数(图标和语境指南视图)
信息对象类型
图120至138例举了下列信息对象类型的语义视觉化:文档、书籍、杂志、演示文稿、履历、电子表格、文本、网页、白皮书、电子邮件、电子邮件注解、电子邮件分发名单、事件、会议、多媒体、在线课程、人员、顾客、用户。
表示外壳类型
时间线
图139例举了一个语义“时间线”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
“时间线”视觉化——样本对象和语境条动画
1.在不同背景上显示信息项目之生效时间(发表时间、预定时间等等)的日历视图(图标和语境指南视图)
2.在不同背景上(依序)显示所有信息项目之生效时间的日历视图(图标和语境指南视图)
3.显示日历运动的动画图形(图标和语境指南视图)
4.图象/运动(例如时间扭曲图象/运动)的动画图形(图标和语境指南视图)
5.语义图象/运动上的信息项目总数(图标和语境指南视图)
6.素背景上的信息项目总数(图标和语境指南视图)
7.依序动画显示的信息项目标题(清单视图)
8.依序动画显示的信息项目标题和详细资料(平铺视图)
9.具有依生效日期或时间而充填之项目的滚动、线性时间线控制
10.依生效日期或时间排序的动画时间线滚动条
MMMM.语义视觉化的效力。
关于视觉化的最后注释。最佳实施方式不只依语义搜索信息,而且不只依语义组织和存储此信息,还依语义表示该等信息。此外,该表示不只是在信息之序列、组织、关系上依语义进行,而且在视觉上也如此;正如前述视觉化所部分地意图传达。如此一来,用户就会在理解由系统表示的信息时得到协助;这大体上类似电影观众由灯光、服装、音乐及整套道具或场景协助理解对话的含义。换句话说,这些视觉化,以及由最佳实施方式所表示或管理或其中存在的其他一切,均用于传达有意义的信息;或者更恰当的话,用于有意义地传达信息。含义是最佳实施方式的统一主题,它弥漫在本系统之设计与设计各处,以及构成本系统的每个组成部件。
尽管本发明的最佳和一些替代实施方式已如前所注明地加以举例说明和描述,许多改动可不背离本发明之精神和范围的作出。因此,本发明之范围不受最佳实施方式之披露限制,而是应通过参照下列权利要求而完全确定。
                     附录A:
     用于知识检索、管理、交付和表示的系统和方法
技术领域
本发明一般涉及信息管理系统,更确切地说,涉及用于知识检索、管理、交付和表示的完整无缝实现框架和由此引起的方法。
背景技术
目前,人们普遍人为知识是世界上的组织机构的核心资产,并且是竞争的利器。在当今广泛联系的基于信息的世界上,知识工人必须能够使用进行更好、更快、更有知识的决策时所需的知识,以提高其生产率,改善客户关系,并使其业务更有竞争性。另外,行业观察员也在吹捧“敏捷”和“实时企业”为信息经济具有的重要的商业目标。
许多组织开始认识到为改善产品和客户服务而在其组织内传播知识的价值,以及具有受过良好培训的劳动力的价值。投资企业正在进行的电子学习和企业培训就是证据。公司也开始投资于内容管理,搜索,协作和商业智能工具。同时,公司在数字化其商务过程,特别是有关获得并保留客户的商务过程方面花费了大量资源。
然而,许多知识/学问和客户关系资产仍然是在不了解彼此的语言的各种知识库中存储的,因此,作为信息孤岛进行管理和交互。同样,许多组织叫做“知识”的知识仅仅是数据和信息。在很大程度上,信息经济是努力寻找用来提供语境、含义以及有效使用越来越多的数据和信息的方式。或者,换句话说,是将大量现有数据和信息转换为可用知识。
信息能够以各种形式使用,如报纸、书籍、无线或电视媒体,可以采取电子形式,具有各种扩散程度。信息管理和访问随计算机和计算机网络的使用动态改变。网络计算机系统提供对该系统中的任意位置保存的信息的访问。用户只需建立与该网络的必要连接,提供适当的授权并确定需要访问的信息。
随着因特网的出现,进一步改善了信息访问,因特网连接不同地理区域的大量计算机,从而提供对大量信息的访问。在因特网上提供信息的最广泛的传播方法是借助万维网。Web包括与因特网相连的计算机或Web服务器的子集,其中计算机或Web服务器通常运行超文本传输协议(HTTP),文件传输协议(FTP),GOPHER或其他服务器。Web服务器为网页或网站的主机。使用诸如原始超文本标注语言(HTML),或更新的扩展标注语言(XML),抑或标准通用标注语言(SGML)之类的一种或多种语言,对网页进行编码。本文引用上述语言的公开规范作为参考。借助微软公司的Internet Explorer或网景公司的Navigator之类web浏览软件,因特网用户可以访问采用以上格式语言的网页。
在很大程度上,Web是基于句法和结构而不是基于语境和语义组织起来的。因此,通过借助搜索引擎和Web目录访问信息。当前的搜索引擎使用关键字以及依赖于文本或基本主题信息和目录索引的对应搜索技术,缺少关联的语境和语义信息。不幸的是,此类搜索方法产生数以千计的没有答复的结果;与行动知识相反的文档。为了专注于查询并改进搜索结果的关联性,人们开发了更高级的搜索技术。许多技术依赖用户的历史搜索趋势,设想所需的信息。作为选择,其他搜索技术依靠对网站进行分类,进一步将搜索结果集中于最相关的领域。不管何种搜索技术,可搜索信息的基础构造是索引驱动的,而不是语境驱动的。与文档关联的文本信息的频率或类型确定与该文档的主题的属性不同的搜索结果,以及此类属性与用户的语境联系起来的方式。结果依然模糊,并且不能有效使用web作为获取行动知识的工具。
如今,在世界上的企业中,Web是知识工人的信息平台。但存在以下问题。众所周知,Web是数据和信息的平台,其用户在“知识”级上操作。断开是非常基本的,并且毫不夸张。Web在很大部分上实现了“信息就在指尖”的梦想。然而,知识工人要求“知识就在指尖”而不仅仅是“信息就在指尖”。不幸的是,当今的知识工人使用Web来浏览、搜索文档—编辑数据和信息—而不是与其查询关联的实际知识。要获得经过改进的知识,需要提供适当的语境,含义以及对数据和信息的有效访问,所有这些都是传统Web缺少的。
为了实现“知识就在指尖”的目标,人们进行了各种努力。一个例子是称为语义Web的用于信息组织和分发的新概念。语义Web是当今Web的扩展,其中信息具有明确定义的含义,能够使计算机和人员更好地协同工作。尽管从概念上在支持改进语境,含义和对因特网上的信息的访问方面前进了一大步,但语义Web尚未找到能够做到其规定潜能的成功实现。
当今的Web和语义Web均不能提供允许用户获取行动知识的适当语境,含义以及对数据和信息的有效访问。部分问题涉及当今的Web与人们设想的语义Web的构造方式,换句话说,涉及其技术层。正如图1所示,当今的Web是一个超文本媒体,提供三个技术层,包括没有语境制约、时间制约的“哑”链接。称为“语义超媒体”的语义Web的概念化,提供五个技术层,如图2所示。正如下面将要详细说明的那样,每个技术层结构都有严重的局限性。
另外,为提供用于知识检索,管理和交付的完整无缝实现框架和由此引起的方法,必须在综合信息管理系统中提供各种属性。上述属性的非穷尽列表包括:语义/含义;语境制约;时间制约;自动和智能发现能力;动态链接;用户控制的导航和浏览;参与网络的非HTML和本地文档;灵巧传送所显示信息之语义的灵活表示;逻辑,推理和推论;灵活的用户驱动的信息分析;灵活的语义查询;读/写支持;注释;“信任网”;信息包(“混合器”);语境模板,以及面向用户的信息聚集。以下将在当今的Web和语义Web的上下文中,论述每个属性。
语义/含义
当今的Web缺少作为平台的本质的语义和用户体验。网页仅仅传送文本和图形数据,不传送所包含的数据的语义。因此,用户不能发出类似自然语言之类的语义查询—例如,“find me all books lessthan hundred pages long,about Latin Jazz,and published in the lastfive years(查找最近五年出版的有关拉丁爵士的页数少于100页的所有书籍)”。为了能够处理此类查询,网站或搜索引擎必须“知道”它包含的书籍,并且必须能够根据查询请求的语义,以智能方式过滤其内容。此类查询在当今的Web上是不可能的。用户被迫依赖于基于文本的搜索。此类搜索通常导致信息过载或信息损失,因为用户被迫挑选可能与信息库中的文本不匹配的搜索项。在上述示例中,用户可能挑选搜索项“Books Latin Jazz”,并希望搜索引擎能够进行连接。通常由用户独立过滤搜索结果。同时,基于文本的搜索意味着搜索项可能传送相同含义。在以上示例中,在处理搜索查询时可能忽略诸如“Books on South or Central American Jazz”或“Publications on Jazzfrom Latino Lands”之类的搜索项的搜索结果。
并且缺少语义意味着当今的Web不允许用户根据人类的思维方式进行导航。例如,用户可能希望使用组织结构来导航公司内联网。例如,从人员到其创建的文档,到该文档方面的专家,到此类专家的直接报告,到直接报告为其成员的分发列表,到分发列表的成员,到此类成员创建的文档等。上述“web”是语义的,并且是基于实际信息分类(“事物”)的,而不仅仅是像当今Web那样的“页面”。
缺少语义还有其他含义。首先,它意味着Web是不可编程的。借助语义,灵巧智能体可以消耗Web,灵巧智能体可以了解网页和链接的意义,然后进行推理,提出建议。对于当今的Web,能够进行推理的唯一“智能体”是人脑。同样,Web并未使用计算机的巨大处理能力—因为计算机不了解其表示方式。
缺少语义意味着信息是不可操作的。搜索引擎不“理解”其输出的结果。同样,在用户收到搜索结果后,他或她需要“靠他自己”。同时,web浏览器不“理解”它所显示的信息,也不能利用该信息做某些聪明事情。借助适当位置的语义,灵巧显示将“了解”一个事件就是一个事件,并可能做感兴趣的事情,例如检查该事件是否已经在用户的日历中,显示空闲/忙碌信息,或者允许用户自动将该事件插入到他/她的日历中,从而使该信息可操作。不带语义的信息是不可操作的,或者可能需要推测语义,从而导致使人不愉快的用户体验。
语义Web试图通过利用良好定义的语义对信息进行编码,解决当今Web的语义/含义限制。语义Web上的网页包括元数据以及与其他元数据的语义链接,从而允许搜索引擎执行更智能、更精确的搜索。另外,语义Web包括知识表示使用的本体分类,从而允许语义搜索引擎根据含义而不仅仅是根据文本解释搜索项。例如,在上一个示例中,可能在语义网站上使用Latin Jazz(拉丁爵士)本体分类,从而网站上的搜索引擎能够“了解”搜索项“Books on South or CentralAmerican Jazz”或“Publications on Jazz from Latino Lands”与搜索项“Books on Latin Jazz”具有相同的含义。尽管从概念上克服了当今Web的许多不足,但是迄今为止还没有成功实现为规定语境制约和时间制约之类的附加特性而提供语境和含义(特别包括必要的语义链接,本体分类等)的良好定义的数据模型。
语境制约
当今的Web缺乏语境制约。缺乏语境暗示当今的Web不是针对个人的。例如,可访问存储器中的文档是独立的、静态的,因此是愚蠢的。与该文档的主题有关的信息已经公布,正在用新方式公布,或将要公布。然而,由于存储器中的文档是静态的,所以无法以实时方式将其主题和有关信息动态关联起来。换句话说,用户无法以实时方式将其私有语境和外部信息动态联系起来。构成语境的信息源(如文档)位于自己的信息岛上,完全与其他有关信息源隔离。从而导致信息和生产率损失。
其主要原因在于当今的Web是一个面向表示的媒体,目的是向哑客户机(如远程计算机)提供信息视图。事实上,客户机在用户体验中不发挥作用,仅仅显示服务器吩咐的内容。即使在存在客户端代码(如Java小应用程序和ActiveX控件)的情况下,控件通常做一件特定事情,并且不具有与远程服务器的协同操作,以至客户机上的代码与服务器上代码进行配合。
从生产率的观点看,其含义是知识工人和信息消费者完全受信息作者的支配。如今,知识工人具有需要维护、更新的门户,以提供公司信息、外部数据等的定制视图。然而,这仍然很有限,因为如果什么也不能把其任务语境中的有关信息和该用户有权使用的信息以动态方式智能联系起来,则知识工人是完全无用的。
如果知识工人没有看到其门户上的有关信息的链接,或者如果其朋友或同事没有发送其链接的电子邮件,则信息将丢失;信息没有联系起来或适应用户语境或显示该信息的语境。同样,仅仅通知用户整个门户有新的可用数据并将其推送到其本地硬盘上是不够的。它缺少带有语境制约警报通知的定制表示。
当语义Web启动语境制约时,也会遭受与当今Web相同的限制。在语义Web上,用户同样受信息作者的支配。将创作语义Web本身,但是创作过程包含语义。因此,在很大程度上,用户仍然需要靠自己定位并评价可用信息的关联性。作为独立实体的语义Web不能动态连接其他信息源。
时间制约
当今的Web缺乏时间制约。Web平台(如浏览器)为仅仅显示信息的哑软件,并不关心信息的时间制约。用户推测时间制约或不使用时间制约。导致生产率的巨大损失,因为Web平台不能以实时方式进行时间制约连接。尽管某些网站专注于提供时间制约信息,例如为预定日期内的信息建立索引,但Web浏览器本身完全不懂时间制约。而是各网站在其特有信息岛上显示的信息中包含时间制约。换句话说,没有关于Web链接的时间轴。
就像当今的Web那样,语义Web也没有解决时间制约。语义Web可以具有不对时间进行内部化处理的语义链接。主要因为语义Web暗中不懂解决语境制约和时间制约的软件Web服务。
自动和智能发现能力
当今的Web缺乏以智能方式自动发现新创建的信息的能力。当前无法了解今天或昨天重新启动的网站。除非通知用户,或者在用户进行搜索时偶然发现新的网站,他或她可能没有是否存在新网站或网页的线索。企业中也存在相同问题。在内联网上,知识工人无法了解新网站何时出现,除非利用外部手段通知。Web平台本身不懂通告或发现。另外,没有用来确定用户的任务语境或当前信息空间内的新网站或网页的语境制约发现。
就像当今的Web那样,语义Web没有解决自动发现能力的缺乏。语义网站遭受相同的问题—用户或者从外部信息源中找出存在的新信息源,或者在进行搜索时自行发现。
动态链接
当今的Web使用纯网络或图形“数据结构”作为其信息模型。每个网页代表网络中的一个节点,每个网页可以包含该网络中其他节点的链接。在各网页中手工创作各链接。存在以下问题:首先,必须维护网络以使网络具有持续不断的价值。如果不更新网页,或者如果网页或网站作者没有适时向其网页添加链接的规定,则网络将失去价值。本质上,当今的Web容易有死链接,废弃链接当。纯网络或图形信息模型的另一个问题是,信息消费者受网页或网站的支配,而不是控制网页或网站。换句话说,如果网页或网站不包含任何链接,则用户无法追索查找有关信息。搜索引擎没有什么帮助,因为它们仅仅返回进入该网络的网页或节点。网络本身没有任何独立性或动态链接能力。因此,搜索引擎很可能返回其本身没有链接或其链接为死链接、陈旧链接或无关链接的网页的链接。在用户获得搜索结果后,用户要依靠自己,并且完全受返回网页的作者是否在该网页中插入有关时间制约链接的支配。
语义Web遭受与当今Web相同的问题,因为语义Web仅仅是当今的Web加语义。即使用户能够在语义上导航网络(他们不需要Web),他们仍然受创作信息的方式的支配。换句话说,语义Web同样依靠作者的规定,因此遭受与当今Web相同的问题。如果语义Web包括带有本体分类和元数据的网页,但这些网页没有得到良好的维护或者不包含其他有关资源的链接,则用户仍然不能获得当前的链接和其他信息。正如预期的那样,语义Web并不是一个灵巧的,动态的,自创作的自愈网络。
用户控制的导航和浏览
就当今的Web来说,用户不能控制导航和浏览体验,而是完全受网页以及创作网页之链接(如果有的话)的方式的支配。正如参照图3所示的现有技术那样,当今的Web包括“哑链接”,即完全依赖于不断维护才能导航的静态创作的通用链接。
语义Web遭受与当今Web相同的问题,即没有用户控制的浏览。正如参照图4所示的现有技术那样,语义Web包括“哑链接”,还包括语义信息和元数据。然而,语义Web链接同样依赖于不断维护才能导航。
参与网络的非HTML和本地文档
当今Web的另一个问题是只有按HTML方式创作的文档才能参与Web,并且这些文档必须包含链接。其含义是诸如非HTML文档(如PDF,Microsoft Word,PowerPoint和Excel文档等)—特别是用户硬盘上的文档—之类的其他信息对象无法分享与网络中的其他对象相链接带来的好处。这非常受限,因为非HTML格式的、不包含链接的信息对象之间可能有语义关联性。
另外,搜索引擎不返回全部信息领域的结果,因为标准web爬虫不能访问web上的大量可用内容。包括数据库中存储的内容,没有索引的文件仓库,订阅站,本地机和设备,有专有权的文件格式(Microsoft Office文档和电子邮件),以及非文本的多媒体文件。这些内容组成因特网上大量不可访问的内容,称为公司内的“无形内联网”。当今的Web服务器不提供解决该问题的web爬虫工具。
语义Web也遭受上述限制。它不能访问数百万早已存在的非HTML文档,特别是用户硬盘上的文档。其含义是不能将没有RDF元数据等价物或代理的文档动态链接到网络。
灵巧传送所显示信息之语义的灵活表示
当今的Web不允许用户定制网站或网页,即“更换外壳”。这是因为当今的Web服务器返回的信息已经进行过格式化,以便浏览器显示。终端用户不能根据不同标准(如信息的类型,不动产的可用量等),灵活选择显示信息的最佳方法。
语义Web没有解决灵活表示问题。尽管语义网站在概念上使用RDF和本体分类,但它仍然向浏览器发送HTML。本质上,语义Web不向特定用户提供表示授权。同样,从当今Web平台的观点看,语义网站仍然不允许用户进行灵活表示。此外,尽管行业动向趋向XML,但是只有新平台才能规定从表示中分离数据,并定义使数据可编程的准则。创建语义Web内容的作者或者返回XML并完全避免与表示有关的问题,或者专注于用于表现的单一表示风格(垂直行业情景)。两种方法都不允许语义Web实现最佳程度的知识分发。
逻辑,推理和推论
由于当今的Web没有任何语义、元数据或知识表示,所以计算机不能通过使用逻辑推理处理网页来推测新链接,发布通知等。当今的Web是为人类消费而不是为计算机消费而设计建造的。同样,不靠诸如屏幕摘录之类的试图抽取元数据并应用逻辑和推理的不可靠技术,当今的Web就不可能对信息结构起作用。
尽管语义Web在概念上使用元数据和含义提供其编码信息可由计算机处理的网页和网站,但是当前没有能够成功完成以上计算机处理的装置,也没有说明信息消费者或生产者能够受益的新的经过改进的情景。
灵活的用户驱动的信息分析
当今的Web缺乏用户驱动的信息分析。当今的Web不允许用户使用不同的过滤器和条件显示链接的不同“视图”。例如,Web搜索引擎不允许用户在不同情景下测试搜索结果。用户不能使用不同的中心点查看结果,中心点如信息类型(如文档,电子邮件等),语境(如“标题”,“最好的办法”等),类别(如“无线”,“技术”等)。
尽管提供更高程度的灵活信息分析,但语义Web并未描述为提供灵活分析而使其表示层采用交互方式与Web本身进行交互的方法。
灵活的语义查询
当今的Web只允许依赖特定网站之模式的基于文本的查询。这些查询缺乏灵活性。当今的Web不允许用户发布接近自然语言或包含语义和本地语境的查询。例如,当今的Web不支持诸如“Find me allemail messages written by my boss or anyone in research and whichrelate to this specification on my hard disk”之类的查询。
通过使用元数据和本体分类,概念上的语义Web允许用户发布比当今Web更灵活的查询。例如,用户能够发布诸如“Find me all emailmessages written by my boss or anyone in research”之类的查询。然而,用户不能包含本地语境。另外,语义Web没有定义用户不使用自然语言查询Web的简便方式。自然语言技术是一种选择,但完全不是一种可靠技术。同样,要求接近自然语言的查询用户界面不依靠自然语言。语义Web没有解决该问题。
读/写支持
当今的Web是只读Web。例如,如果用户遇到死链接(如“404”错误),则他们不能通过将该链接指向用户熟知的最新目标来“修复”链接。这可能是限制性的,特别是用户可能有与他人分享的重要知识,并且用户拥有关于网络表示方式和演化方面的输入时。
尽管语义Web在概念上考虑了由独立参与应用程序提供的读/写情景,但是目前并没有提供该能力的装置。
注释
当今的Web明显不支持注释。尽管某些特定网站支持注释,但是以非常有限的自持方式支持注释。当今的Web媒体本身不访问注释。换句话说,用户不可能给链接加注解或他们可以使用的附加信息。从而导致潜在的信息损失。
尽管语义Web在概念上考虑了以安全约束为条件在系统中嵌入注释,但是目前并没有提供该能力的装置。
“信任网”
当今的Web没有在Web中无缝集成身份认证、访问控制和授权,其中集成身份认证、访问控制和授权的Web称为“信任网”。例如,对于信任网,用户能够发表声明,修复/更新Web的链接,并在此类操作中内置访问控制限制。在当今的Web上,缺乏信任意味着Web服务仍然是孤岛,必须实现专有的用户签署授权,访问控制或支付系统。由于担心隐私,所以在第三方的服务器上集中上述信息的宏伟计划遭到消费者和厂商的不信任。为了访问丰富的内容,资产用户必须单独登录,并提供各网站的身份信息。
尽管语义Web在概念上考虑了信任网,但是目前并没有提供该能力的装置。
信息包(混合器)
当今的Web和语义Web都不允许用户通过组合可能有分歧的语义信息的特征生成重叠结果(例如,创建定制的个人报纸或电视频道),作为整体处理有关语义信息。
语境模板
当今的Web和语义Web都不允许用户独立创建并映射到用于信息访问和检索的特别熟悉的语义模型。
面向用户的信息聚集
当今的Web不支持面向用户的信息聚集。在一个浏览器会话的语境内,用户每次只能访问一个网站或一个搜索引擎。同样,即使存在与用户正在查看的信息有关的其他信息源的语境或时间制约信息,也不能在用户任务的当前语境中以整体方式显示此类信息源。
语义Web也缺乏面向用户的信息聚集。媒体本身为当今Web的扩展。同样,用户每次只能访问一个网站或一个搜索引擎,并且不能以语境或时间制约方式聚集信息仓库中的信息。
考虑到不断增长的对“知识就在指尖”的需求以及以上说明的当今Web和概念上的语义Web的不足之处,需要一种用于知识检索、管理和交付的全新系统和方法。
发明内容
发明的部分目的在于用于知识检索、管理、交付和表示的完整无缝实现框架和由此引起的方法。该系统包括由若干组件组成的服务器,所述组件协同工作,以便经由通信介质,向操作表示平台的客户提供语境和时间制约的语义信息检索服务。服务器包括第一服务器组件,负责添加并维护特定领域的语义信息或智能。第一服务器组件最好包括旨在提供以下各项的结构或方法:语义网络,语义数据收集器,语义网络一致性检查器,推理机,语义查询处理器,自然语言分析程序,电子邮件知识智能体和知识领域管理器。服务器还包括第二服务器组件,该组件充当特定领域信息的主机,利用特定领域信息对语义信息进行分等分类。第一和第二服务器组件协同工作,并且可以在物理上进行集成或分离。
在该系统内,指定层次内的所有对象或事件为彼此有语义关系的活动智能体,并代表返回数据对象的查询(由基础操作码组成),以便根据预定的定制主题或“外壳”向客户显示。该系统为客户提供用于定制和“混合”智能体的各种方法,以及用于优化结果信息之显示的基础关联查询。
本发明的端到端系统体系结构,经由独立的语义Web平台,或者经由提供附加SDK层的本发明修改过的传统Web门户(如当今的Web访问浏览器),提供不同知识信息源之间的多个客户访问通信手段,其中附加SDK层支持与定制客户的计划性集成。
本发明的方法在于整个系统的操作方面,包括知识检索、管理、交付和表示。该方法最好包括:包含信息源的信息,语义链接信息源的信息,维护语义链接信息的主体的语义属性,根据用户查询交付请求的语义信息,以及根据可定制的用户首选项显示语义信息。本发明的方法的选择实施方式的目的在于,代表查询的智能体的操作,其中与服务器端和客户端的应用程序一起使用查询,以便支持能够生成语义关联信息的更有效的基于推理的查询。
附图说明
以下参照附图详细说明本发明的最佳实施方式或选择实施方式,其中附图为:
图1是一张表格,表示当今Web的技术层。
图2是一张表格,表示概念上的语义Web的技术层。
图3表示用户导航到当今Web中的链接。
图4表示用户导航到概念上的语义Web中的链接。
图5是一个屏幕快照,表示根据本发明的示例信息智能体结果窗格。
图6表示当今Web与本发明的信息神经系统的技术平台堆栈。
图7表示本发明的系统的概览。
图8表示本发明的信息神经系统的端到端系统体系结构。
图9表示本发明的信息神经系统的知识综合服务器(KIS)的系统体系结构。
图10表示当今Web的高级描述平台层与本发明的信息神经系统中的等价物(如果适用的话)之间的比较。
图11表示信息神经系统的最佳实施方式以及本发明的异类跨平台语境。
图12-14表示根据本发明之最佳实施方式的混合器向导用户界面的典型屏幕快照。
图15为突发新闻智能体用户界面的典型窗格。
图16表示本发明的打开智能体对话框的最佳实施方式。
图17-19表示包含打开智能体对话框的示例语义环境的树视图。
图20表示本发明的最佳实施方式的智能体模式。
图21表示本发明的最佳实施方式的AgentTypeID。
图22表示本发明的最佳实施方式的AgentQueryTypeID。
图23表示与智能体名称相应的示例语义查询,说明在本发明的KIS上配置服务器端智能体的方式。
图24表示本发明的KIS的概览。
图25表示根据本发明的专注于企业环境的示例语义网络。
图26是一张表格,表示根据本发明的对象类型的最佳模式。
图27表示本发明的SemanticLink表。
图28是一张表格,表示本发明的最佳实施方式的谓词类型ID。
图29是一张表格,表示根据本发明创建的最佳用户对象模式。
图30是一张表格,表示与用户(人物)对象模式关联的MailingAddressTypeID。
图31是一张表格,表示根据本发明创建的最佳类别对象模式。
图32是一张表格,表示根据本发明创建的最佳文档对象模式。
图33表示最佳实施方式的印刷介质类型ID。
图34表示最佳FORMATTYPEID。
图35表示根据本发明创建的最佳电子邮件信息列表对象模式。
图36和37为典型表格,分别表示本发明的最佳实施方式的电子邮件分发列表和电子邮件公用文件夹对象模式。
图38表示本发明的最佳PublicFolderTypeID。
图39表示根据本发明创建的最佳事件对象模式信息列表对象模式。
图40表示本发明的最佳实施方式的事件类型。
图41表示根据本发明创建的最佳媒体对象模式信息列表对象模式。
图42表示本发明的最佳实施方式的媒体类型。
图43-45表示附加示例,说明在本发明的最佳实施方式中对对象进行分类以及使用对象的方式。
图46是一个对象图,表示原始电子邮件XML元数据到本发明的语义网络的映射。
图47-53为典型屏幕快照,表示KIS管理的智能体的各个方面。
图54为示例用户界面,表示在信息智能体结果窗格中显示的信息对象。
图55表示与内部语义链接关联的气球弹出示例,说明根据本发明的电子邮件示例。
图56表示与本发明的动词用户界面关联的气球弹出示例。
图57表示与本发明的深层信息模式用户界面关联的气球弹出示例。
图58和59表示根据本发明的典型语义环境。
图60-68提供根据本发明的最佳实施方式的信息智能体的典型屏幕快照。
图69-71提供与本发明的信息智能体的灵巧镜头特征关联的典型气球弹出菜单。
图72表示与图71所示的气球弹出菜单不同的示例,说明两个对象的相关性度量。
图73-75为示例表格,表示使用灵巧镜头时的行为以及包含对象类型谓词的关系。
图76为用户界面示例,表示根据本发明的语义结果播放/预览控制。
图77为用户界面示例,表示混合器的语义结果。
图78和79表示本发明的典型功能性映射。
图80为用户界面,说明根据本发明的智能体结果和相应的语境调色板。
图81表示根据本发明的灵巧建议弹出语境结果窗格示例。
图82为一张表格,表示本发明的信息神经系统的技术层。
图83表示根据本发明的最佳实施方式的动态链接以及用户控制的导航和浏览。
具体实施方式
参考文献
本文引用附录作为参考。附录包含说明本发明的最佳实施方式的典型编码。
本发明的详细说明书的目录
A.定义
B.概述
1.发明背景
2.价值主张
3.当今的“信息”Web对本发明的信息神经系统
C.系统体系结构和技术考虑
1.系统概述
2.系统体系结构
3.技术堆栈
4.系统异质性
5.安全性
6.效率考虑
D.系统组件和操作
1.代理和智能体
a.代理
b.智能体
2.知识综合服务器
                   a.语义网络
                   b.语义数据收集器
                   c.语义网络一致性检查器
                   d.推理机
                   e.语义查询处理器
                   f.自然语言分析程序
                   g.电子邮件知识智能体
                   h.知识领域管理器
                   i.其他组件
3.知识库服务器
4.信息智能体(语义浏览器平台)
                   a.概述
                   b.客户机配置
                   c.客户机框架规范
                   d.客户机框架
                   e.语义查询文档
                   f.语义环境
                   g.语义环境管理器
  h.环境浏览器(语义浏览器或信息智能体(Information
                 AgentTM))
               i.附加应用程序特征
5.在本发明中提供语境
                  a.语境模板
                  b.语境外壳
                  c.外壳模板
                  d.默认谓词
                  e.语境谓词
                  f.语境属性
                  g.语境调色板
                  h.内部警报
                  i.灵巧建议
6.本发明的属性益处
E.情景
1.利用本发明的语义查询示例
2.商业问题
3.形势
本发明的详细说明书
A.定义
ActionScript。Macromedia Flash的脚本语言。双向通信协助用户创建交互电影。参见http://www.macromedia.com/support/flash/action_scripts/actionscript_tutorial/。
代理。知识综合服务器(KIS)的指定实例,为网站的语义等价物。
代理目录。存储不同代理的元数据信息的目录,允许客户添加、移动、搜索、浏览其中存储的代理。可以在诸如LDAP或MicrosoftActive Directory之类的目录上发布代理。也可以在特别为代理创建的专有目录上发布代理。
智能体。为特定语义对象类型(如文档,电子邮件,人员等),语境(如标题,会话等)或混合器返回XML信息的语义过滤器查询。
·混合器(BlenderTM)或复合智能体(Compound AgentTM)。包含其他智能体并允许用户(在客户端混合器的情况下)或代理管理员(在服务器端混合器的情况下)创建查询的智能体的商标名称,其中查询生成的结果为所包含智能体的结果的并集或交集。在客户端混合器的情况下,可使用不同视图生成结果(在不同框架中显示混合器中的每个智能体,显示越过所包含智能体的特定对象类型的所有对象等)。
·突发新闻智能体(Breaking News AgentTM)。用户特别标记有时间临界指示的灵巧智能体的商标名称。用户可以将任一灵巧智能体标记为突发新闻智能体。然后在用户的语义环境中存储该属性。如果存在与所显示的信息有关的突发新闻,则突发新闻智能体最好显示警报。
·默认智能体(Default AgentTM)。向用户提供的用户无法修改的标准智能体的商标名称。
·域智能体(Domain AgentTM)。属于某个语义域的智能体的商标名称。利用引用“类别”表的智能体查询进行初始化。
·哑智能体(Dumb AgentTM)。没有代理并引用本地信息(本地硬盘上的信息),网络共享信息或Web链接信息或URL信息的智能体的商标名称。利用哑智能体将非灵巧砂箱(如文件系统或因特网)中的信息项(如文档),加载到灵巧砂箱中(经过信息智能体(语义浏览器)的信息神经系统)。
·电子邮件智能体(Email AgentTM)或电子邮件知识智能体(Email Knowledge AgentTM)。公用智能体的商标名称,用于发布信息或给信息加注释并共享有关代理的知识。
·收藏夹智能体(Favorite AgentTM)。用户表示其喜爱的或经常访问的智能体的商标名称。
·公用智能体(Public AgentTM)。由系统管理员创建管理的智能体的商标名称。
·私有或本地智能体(Local AgentsTM)。由用户创建管理的智能体的商标名称。
·搜索智能体(Search AgentTM)。为了调用有关灵巧智能体的附加的基于文本的查询过滤器,通过利用关键字搜索语义环境,或者通过搜索现有灵巧智能体创建的灵巧智能体的商标名称。
·简单或标准智能体(Standard AgentTM)。封装有结构化的非语义查询(如来自本地文件系统或数据源)的独立智能体的商标名称。
·灵巧智能体(Smart AgentTM)。封装有结构化的语义查询的独立智能体的商标名称,其中语义查询经由XML Web服务引用代理。
·特殊智能体(Special AgentTM)。根据语境模板创建的灵巧智能体的商标名称。
智能体发现。本发明的信息介质的属性,允许用户轻而易举地自动发现其他用户(朋友或同事)创建的新的服务器端智能体或客户端智能体。参见“发现能力”。
注释。记录、注解或解释,用于向信息对象添加个人语境。在最佳实施方式中,注释为与限定对象相链接的电子邮件信息,可以具有附件(就像普通电子邮件信息那样)。另外,注释为系统中的第一类信息对象,可以为其本身添加注释,由此导致带有线索的注释或注释树,其初始对象为树根。
应用编程接口(API)。定义软件程序员使用特定计算机功能的方式。存在用于窗口系统,文件系统,数据库系统,网络系统和其他系统的API。
日历访问协议(CAP)。因特网协议,允许用户以数字方式访问基于iCalendar标准的日历库。
复合智能体管理器(Compound Agent ManagerTM)。智能体组件的商标名称,允许用户通过添加/删除智能体,创建/删除复合智能体并进行管理。
语境。围绕特定项目的信息,提供含义,用不同的方法协助信息消费者解释项目,查找与该项目有关的其他相关信息。
语境结果窗格。显示基于语境的查询结果的结果窗格。包括语境调色板,灵巧镜头,深层信息等的结果。参见“结果窗格”。
语境制约(context-sensitivity)。信息介质的属性,能够以智能方式动态感知所提供的所有信息的语境,提供给定语境的附加相关信息。语境制约系统或介质理解其提供的信息的语义,提供适当的行为(根据用户的操作,以主动或被动方式),以便提供其正确语境中的信息(固有或相关)。
语境模板(Context TemplateTM)。情景驱动的信息查询模板的商标名称,映射到特别熟悉的语义模型,以便进行信息访问和检索。例如,最佳实施方式中的“标题”模板具有与交付的“标题”一致的参数(其中最关心的新鲜度和似然度为检索的主轴)。“即将发生的事件”模板具有与交付的“即将发生的事件”一致的参数。等等。本质上,可以将语境模板类推到个人数字语义信息检索“频道”,后者通过使用众所周知的语义模板向用户交付信息。
深层信息(Deep InformationTM)。使信息智能体能够显示与信息对象有关的内部语境信息的本发明的某种特征的商标名称。语境信息包含从该对象的起源代理的语义网络中挖掘的信息。
发现能力。本发明的信息介质的能力,以智能方式主动使用户了解(看见)信息,不需要用户直接查找信息。
域智能体向导(Domain Agent WizardTM)。系统组件及其用户界面的商标名称,允许代理管理员创建并管理域智能体。
DOTNET(.NET)。Microsoft_.NET是一套Microsoft软件技术,用于连接信息、人员、系统和设备。通过使用XML Web服务进行软件集成,XML Web服务为许多小的、分离的积木应用程序,通过因特网互相连接,并与其他更大的应用程序连接。.NET连接的软件便于创建、集成XML Web服务。参见http://www.microsoft.com/net/defined/default.asp。
动态链接(Dynamic LinkingTM)。本发明的信息神经系统的能力的商标名称,允许用户以思考速度从语义上动态链接信息,即使此类信息项本身不包含链接。由于使用具有内部行为的灵巧对象并使用信息代理的XML Web服务中内嵌的递归智能,所以语义网络中的每个节点比普通链接(即当今Web上的节点或概念上的语义Web上的节点)更灵巧。换句话说,本发明的灵巧虚拟网(即Web)中的每个节点可以链接到其他节点,不依赖创作。每个节点都有行为,通过拖放和灵巧复制/粘贴能够动态链接到代理和灵巧智能体,创建语义环境中的代理的链接,响应灵巧智能体的镜头请求创建新链接,包括动态创建有关其代理之语境和时间制约信息之链接的内部警报,包括突发新闻的提示(其中该节点能够自动链接到名字空间中的突发新闻智能体),构成允许用户查找新链接的深层信息的基础等。因此,本发明的用户不受元数据作者的支配。当用户到达网络中的某个节点时,用户有许多以自动方式动态导航的语义手段—使用语境,时间,关联的灵巧代理和智能体等。
电子邮件XML对象。具有“电子邮件”信息对象类型的信息对象。XML对象具有“电子邮件”SRML模式(使用XML)。
环境浏览器。参见信息智能体。
收藏夹智能体管理器(Favorite Agents ManagerTM)。系统组件和用户界面元件的商标名称,允许代理管理员管理服务器端的收藏夹智能体。
Flash。Macromedia Flash用户界面平台,支持开发人员和内容作者在其内容中嵌入复杂图形和动画。参见http://www.macromedia.com/flash。
Flash MX.Macromedia Flash MX是一种文本、图形、动画设计与开发环境,适合于创建用于因特网的各种高冲击力的内容和丰富的应用程序。参见http://www.macromedia.com/software/flash/productinfo/product_overview/。
全球代理目录(Global Agency DirectoryTM)。在因特网(或其他全球网)上运行的代理目录的实例的商标名称。全球代理目录允许用户使用其信息智能体(直接在其语义环境中)查找、搜索、浏览基于因特网的代理。参见“代理目录”。
HTTP。超文本传输协议(HTTP),为分布式协同超媒体信息系统的应用层协议。它是一种普通的没有状态的协议,除用于超文本以外,通过扩展其请求方法、错误代码和标题,可用于许多任务,如名称服务器和分布式对象管理系统。HTTP的一个特征是键入并协商数据表示,允许系统独立构建需要传送的数据。参见http://www.w3.org/Protocols/和http://www.w3.org/Protocols/Specs.html。
推理机(Inference EngineTM)。本发明的方法的商标名称,观察模式和数据,通过推理得出有关逻辑结论。最好利用推理规则(一组预定的启发式规则)向本发明的语义网络添加语义链接。
信息。传递知识的内容和数据的关联性和智能的定量或定性度量。
信息智能体(Information AgentTM)。本发明的语义客户机或浏览器的商标名称,提供来自多个信息源、信息类型和模板的行动信息(知识)的语境和时间制约交付和陈述,允许跨越不同仓库的信息的动态链接。
信息神经系统(Information Nervous SystemTM)。本发明的动态的、自创作的语境和时间制约信息系统,允许用户以思考速度智能地、动态地链接信息,并带有语境和时间制约,以便最大程度地获取并使用用于手边任务的知识。
信息对象(Information ObjectTM)(信息项或信息包)。在指定语境中传递知识的特定类型的信息单位的商标名称。
信息对象中心点(Information Object PivotTM)。信息对象的商标名称,供用户作为在相同语境中查找其他相关信息的导航中心点。
信息对象类型。参见对象类型。
聪明智能体。为解决复杂问题而代表用户查找过滤信息,协商服务,使复杂任务自动化,或与其他软件智能体协作的软件智能体。按照定义,智能体必须是自治的,换句话说,无需用户干预就能自由执行。另外,智能体必须能够与其他软件或人类智能体进行通信,并且必须能够感知并监控智能体驻留的环境。参见http://www.findarticles.com/cf_dls/m0FWE/7_4/64694222/p1/article.jhtml。
因特网日历和日程安排(iCalendar)。支持部署用于因特网的互操作日历和日程安排服务的协议。该协议提供通过因特网公开交换日历和日程安排信息的通用格式的定义。
因特网消息访问协议(IMAP)。一种通信机制,供邮件客户与邮件服务器进行交互,并操纵服务器上的邮箱。当前最流行的邮件访问协议或许是邮局协议(POP),该协议提出远程邮件访问需求。IMAP提供POP的超集,允许更复杂的交互,规定比POP模型更有效的访问。参见http://www-smi.stanford.edu/projects/imap/ml/imap.html。
内部语义链接(Intrinsic Semantic LinkTM)。为特定信息对象之模式固有的语义链接的商标名称。例如,电子邮件信息对象具有诸如“发件人”、“收件人”、“抄送”、“密件抄送”和“附件”之类的源于对象本身并在电子邮件信息对象类型之模式中定义的内部链接。
信息岛。与可能包含有关语义关联的语境和时间制约信息但有关信息与其他语境分离的其他仓库隔离的信息仓库。
J2EE。JavaTM2平台企业版(J2EE),用于开发多层企业应用。通过向组件提供一组服务,并且通过自动处理应用行为的许多细节,J2EE使企业应用基于标准的模块组件。参见http://java.sun.com/j2ee/overview.html。
知识。以语境和时间制约方式表示的信息。使得信息消费者可以向信息学习并运用该信息,以便做出有利于有关任务的更聪明、更及时的决策。
知识智能体(Knowledge AgentTM)。参见信息智能体。
知识库服务器(Knowledge Base ServerTM(KBS))。存储知识综合服务器(KIS)的知识的服务器的商标名称。
知识领域管理器(Knowledge Domain ManagerTM(KDM))。知识综合服务器的某个组件的商标名称,负责添加和维护语义网络上特定领域的知识。
知识综合服务器(Knowledge Integration ServerTM(KIS))。从语义上将不同信息源的数据综合为语义网络的服务器的商标名称,可以作为服务器端的智能体和XML Web服务的主机,其中服务器端的智能体提供对网络的访问,而XML Web服务提供对该服务器上的知识的语境和时间制约访问。
知识Web(Knowledge WebTM)。参见信息神经系统。
自由联盟。自由联盟的梦想是实现如下网络世界,即个人和企业能够更轻松地进行交易,同时保护至关重要的身份信息的隐私和安全性。为实现其梦想,自由联盟寻求建立贯穿开放技术规范的联合网络身份的开放标准。参见http://www.projectliberty.org/index.html。
轻量目录访问协议(LDAP)。用于访问公用目录信息的技术。大部分面向网络的中间件都包含LDAP。作为一种开放的厂商中立的标准,LDAP提供用于集中存储和管理信息的扩展体系结构,这正是当今的分布式系统和服务所需要的。目前,大部分网络操作系统,群件甚至是压缩封装的网络应用程序都支持LDAP。参见http://publib-b.boulder.ibm.com/Redbooks.nsf/RedbookAbstracts/sg244986.html?Open。
链接模板(Link TemplateTM)。参见语境模板。
本地语境。本地语境指用户可以访问的客户端信息对象和智能体。包括语义环境中的智能体,本地文件,文件夹,用户的电子邮件收件箱中的电子邮件,用户的收藏夹和最近访问的网页,最新网页,当前打开的文档,以及描述该用户的最新任务、位置、时间或其他条件的其他信息对象。
含义。信息的行为的属性,允许信息的消费者根据其相关信息内容(与其文本或数据不同)进行定位并导航到含义,并且以语境和时间制约方式影响含义,以便最大程度地使用信息。
元数据。“关于数据的数据”。包括完整描述信息对象的数据字段,链接和属性。
自然语言分析程序。分析和解释软件组件,理解自然语言查询并能将其转化为结构化的语义信息查询。
NervanaTM。带有专有权的信息神经系统信息介质/平台的端到端实现的商标名称。该名称还定义资源类型和谓词名称限定词的有专有权的名字空间。
.NET护照。Microsoft.NET护照为一组基于Web的服务,专注于因特网和联机购买。.NET护照为用户提供其数目不断增长的参与站点的单一签名(SSI)和快速购买能力,从而减少用户需要牢记或需要重新输入的信息量。.NET护照为大量用户提供高质量的联机体验,使用强有力的加密技术—如安全套接字层(SSL)和三元数据加密标准(3DES)算法—进行数据保护。隐私为基本优先权,所有参与网站都要签订合同,允诺张贴并遵循符合行业公认准则的隐私策略。
网络影响。当其他用户的数目影响特定用户的产品或服务价值时,存在网络影响。电话业务就是一个明显例子。电话业务对用户的价值为其他用户的数目的函数。很少有人会对未与他人连接的电话机感兴趣,大多数人会为与国内网络而非与本地网络相连的电话业务评定更高价值。同样,多数计算机用户都很珍视能与其他用户轻松交换信息的计算机系统。
因此,网络影响为产生正反馈效应的需要面的外部效应,成功产品将更加成功。这样,网络影响类似于供方的大规模经济的效益。当公司增加产量时,规模经济导致更低的平均成本,从而公司能够进一步降低价格,获得竞争对手的业务。继续扩张导致更低的平均成本,从而有能力采取更低价格。同样,来自网络影响的正反馈依赖早先的成功。例如,在计算机行业中,如果其他方面均相同,则用户会支付更多货款选择更流行的计算机系统,如果两个竞争系统的价格和其他功能均相同,则会选择安装基数更大的系统。参见http://www.ei.com/publications/1996/fall1.htm。
网络新闻传输协议(NNTP)。通过在ARPA因特网社区中使用可靠的基于流的新闻传输,分发、查询、检索和张贴新闻报道文章的协议。NNTP的目的是在中央数据库中存储新闻报道文章,从而订户仅仅选择希望阅读的条目。同时提供索引、交叉引用以及过时消息的废止。
通告。通告为信息智能体或代理发送的警报,指示用户存在有关某个智能体(客户端智能体或服务器端智能体)的新信息。用户可以请求其语义环境中的智能体发送通告。用户可以指示他们已经收到通告。通告源(客户机或服务器)为用户和智能体存储用于表示用户确认该智能体之通告的时间的信息。通告源轮询智能体,以检查自上次确认时间以来是否有新信息。如果有的话,则通告源警告用户。可利用电子邮件、寻呼机、语音或诸如Microsoft.NET警报服务之类的定制警报机制,发送警报。用户可以选择用于全部通告源(客户机或服务器)的首选通告机制—应用于通告源上的所有智能体—以每智能体为基础(重载通告源上的指定首选项)。
对象。参见信息对象。
对象类型。与信息关联的标识,允许消费者理解信息的特性,解释其内容,预测信息起作用的方式,并根据对象类型在真实世界中的联系方式,将其链接到其他有关信息项。示例包括文档,事件,电子邮件信息,人员等。
本体分类(存在论)。基于基本品质而定的知识的分层结构。本体分类为概念化的显式说明。该术语是从哲学借用的,在哲学中,“存在论”是存在的系统说明。对于人工智能系统,“存在”就能表示。当采用陈述形式表示领域知识时,可以表示的对象集称为论域。在基于知识的程序表示知识的代表词汇中,反映对象集和它们之间的可描述关系。因此,在人工智能的上下文中,通过定义一组有代表性的术语,描述程序的本体分类。在上述本体分类中,定义把论域中的实体的名称(例如:类,关系,函数或其他对象)和描述名称含义的人类可读文本以及约束这些术语之解释和合适用途的正式公理联系起来。形式上,本体分类为逻辑理论的语句。
本体分类的主体是研究某些领域中存在或可能存在的事物的类别。从为了谈论领域D而使用语言L的观点来看,称为本体分类的研究成果为感兴趣的领域D中假定存在的事物的类型的目录。当使用语言L讨论领域D中的主题时,本体分类中的类型代表语言L的谓词,词义,或概念与关系类型。参见http://www-ksl.stanford.edu/kst/what-is-an-ontology.html和http://users.bestweb.net/~sowa/ontology/。
谓词。谓词为其结果代表条件的真假值的属性或链接。例如,谓词“authored by”把人员和信息对象链接起来,指示人员是否创作该对象。
演示程序(PresenterTM)。本发明的信息智能体(语义浏览器)中的组件,处理语义查询处理器(最好解释SQML)的结果集合和显示。演示程序处理布局管理,聚集,导航,外壳管理,语境调色板的显示,交互和动画等。
RDF。资源描述框架(RDF),是处理元数据的基础;它提供应用程序之间的互操作性,其中应用程序通过Web交换机器可以理解的信息。RDF强调能够自动处理Web资源的功能。RDF利用指定的属性和属性值,定义用于描述资源之间的关系的简单模型。可以将RDF属性看作资源属性,在这种意义上,相当于传统的属性值对。RDF属性还代表资源之间的关系。因此,RDF数据模型类似实体关系图。
RDF能够用于各种应用领域中,包括:在提供更强的搜索引擎能力的资源发现中;为推动知识共享和交换,利用软件智能体描述特定网站、网页或数字图书馆的可用内容和内容关系的目录编撰处理中;在内容分级中;为描述网页的知识产权,为表示用户的隐私参数选择以及网站的隐私策略,而描述代表单一逻辑“文档”的网页集合时。带有数字签名的RDF最好为构造用于电子商务、协同和其他应用的“信任网”的组件。参见http://www.w3.org/TR/PR-rdf-syntax/和http://www.w3.org/TR/rdf-schema/。
RDFS。RDF模式的首字母缩写词。资源描述社区需要对某类资源说某些事物的能力。例如,为了描述参考数目资源,包含“作者”、“书名”和“主题”在内的描述性属性是常见的。对于数字证书,通常需要诸如“校验和”和“授权”之类的属性。在RDF的语境中定义以上属性及其相应语义的声明,作为RDF模式。模式不仅定义资源的属性(如书名,作者,主题,尺寸,颜色等),而且定义所描述的资源的种类(书籍,网页,人员,公司等)。参见http://www.w3.org/TR/rdf-schema/。
结果窗格(Results PaneTM)。信息智能体(语义浏览器)内的图形显示区的商标名称,显示SQML查询的结果。参见图5,该图为示例信息智能体屏幕快照,表示服务器端的智能体,可选的播放控制/导航/过滤器工具栏,“服务器端的智能体对话框”(允许用户浏览并打开服务器端的智能体),和来自服务器端的智能体的示例结果(具有“文档”信息对象类型)。
语义。内涵意义。
语义环境(Semantic EnvironmentTM)。指用户本地机器上存储的所有数据,还有代理服务器(如预订的服务器端的代理,服务器端的收藏夹智能体等)上用户特有的数据。客户端状态包括近来收藏的智能体以及身份认证和授权信息(如各种代理的用户名和密码),还有每个客户端(用户创建的)智能体的SQML文件和缓冲器。最好对信息智能体进行配置,以便在自动删除它们之前的设定时间量内存储智能体,添加到“收藏夹”列表中的智能体除外。例如,用户可以配置信息智能体以保存智能体两周。此时,从系统中自动清除超过两周的智能体,并相应调整语义环境。语义环境用于语境调色板(语境调色板使用“最近”和“收藏夹”列表中的代理,以便预测用户希望从中查看语境的默认代理)。
语义环境管理器(Semantic Environment ManagerTM)。管理语义环境(在信息智能体中)的所有本地状态的软件组件的商标名称。包括存储并管理所有客户端智能体的元数据(以及历史和收藏的智能体子表),每个智能体状态(如智能体外壳,智能体首选项等),通告管理,代理浏览(在代理目录上),经由多点传送和对等广播协议监听代理,允许用户经由语义浏览器(经由树视图,“打开智能体”对话框,以及结果窗格)浏览语义环境的服务。
语义数据收集器(Semantic Data GathererTM(SDG))。知识综合服务器(KIS)使用的XML Web服务的商标名称,经由语义元数据仓库(SMS),添加、移动、更新语义网络中的条目。
语义元数据仓库(Semantic Metadata StoreTM(SMS))。KIS上的软件组件的商标名称,利用每个主对象类型都有表格的数据库(如SQLServer,Oracle,DB2)存储KIS上的所有元数据。
语义网络。经由语义元数据仓库上数据库表,以语义方式把与模式关联的对象链接起来的系统和方法。
语义网络一致性检查器(Semantic Network ConsistencyCheckerTM)。在本发明的代理上运行的软件组件的商标名称,其任务是维护语义网络的完整性和一致性。检查器周期运行,确保“SemanticLinks”表中的条目存在于本地对象表中,“objects”表中的条目存在于本地对象表中,以及语义元数据仓库中的所有条目存在于从中收集这些条目的仓库中。
语义查询。包括含义,语境,时间制约,语境模板以及接近自然语言的华美语言的查询。比简单的基于关键字的查询更强大,因为它们是语境和时间制约的,包括含义和语义。
语义查询标注语言(SQML)。本发明使用的有专有权的基于XML的查询语言,用于定义、存储、解释和执行客户端语义查询。SQML包括定义查询的标记,并引用代理XML Web服务(经由资源标识符和URL),其中查询从诸如文件、文件夹、应用知识库之类的不同资源(代表数据源)中获取其数据。另外,SQML包括支持语义过滤(经由定制链接和谓词)的标记和参数,其中标记指示从资源中查询和过滤数据的方式,而参数指示查询资源和过滤结果的方式。特别地,参数可以包括对本地或远程语境的引用。运行时由客户端SQP将语境参数分解为XML元数据。然后,以方法调用的方式,将XML元数据传递给适当资源(如代理的XML Web服务),连同对资源的引用以及指示资源(如代理的XML Web服务)分解查询之方式的语义链接和谓词。SQML对信息神经系统就像HTML对当今的Web一样。其主要区别在于,SQML定义语义查询规则,而HTML定义超文本表示规则。然而,SQML更高级,因为它支持客户根据现有查询递归创建新的语义查询(通过创建带有从现有SQML查询导出的新链接的新的SQML),例如,经由拖放和灵巧复制/粘贴,灵巧镜头,语境模板和调色板等。另外,由于SQML没有定义表示规则,所以能够以多种方式表示语义查询的结果,通过使用“外壳”,根据用户的首选项、兴趣、条件或语境,得到结果(SRML格式)生成表示。此外,SQML可包含抽象链接和谓词,如引用或使用语境模板的链接和谓词。然后,资源(如代理的XML Web服务)将SQML分解为适当的查询格式(如SQL或等价物,在代理的XML Web服务情况下),接着,调用“实际”查询,以生成结果(随后解决用户的语境或语境模板)。同样,SQML缓冲器或文件可以引用多种资源(和代理),从而使客户能够以集合方式查看结果(如基于语境或时间制约),而不是基于数据源—这正是本发明的强大功能,支持用户控制的浏览和信息聚集(参见以下两节)。最后,每个客户端智能体都有一个SQML定义和文件,就像每个网页都有HTML文件一样。
语义查询处理器(Semantic Query ProcessorTM(SQP))。服务器端语义查询处理器(在最佳实施方式中为XML Web服务)的商标名称,它接受SQML并将其转换为SQL(在最佳实施方式中),然后返回结果作为XML。在知识综合服务器(KIS)上,SQP为本发明的语义网络的主入口点,负责响应KIS客户的语义查询。在该服务器上,为处理客户发送的用SQML表示的语义查询的软件组件。在客户机上,客户端SQP接受聚集SQML,然后将其编译或映射为发送给服务器(或代理)XML Web服务的SQML查询。
语义结果标注语言(SRML)。本发明使用的带有专有权的基于XML的数据模式和格式,用来定义、存储、解释和表示语义结果。在客户机上,经由语义资源处理程序,从SQP返回SRML,其中语义资源处理程序解释、格式化查询请求,然后发送给语义数据源。语义数据源包括代理的XML Web服务,本地文件,本地文件夹,来自本地或远程应用程序(如Microsoft Outlook电子邮件应用程序的收件箱)的定义数据源等。响应客户的语义查询,XML Web服务向客户返回SRML。这样,XML Web服务不再“关心”在客户机上显示结果的方式。这正是与当今的Web和语义Web的不同之处,在当今的Web和语义Web中,服务器返回已经格式化的HTML供客户机显示,客户机仅仅显示表示数据(表示语义数据)并且不能定制数据的表示。在本发明中,两台客户机能够根据任意一台客户机的用户选择或采用的“外壳”,以完全不同的方式描绘相同的SRML。“外壳”将SRML转换为可以显示的格式,如XHTML,DHTML+TIME,SVG,Flash MX等。
SRML是一种元模式,意思是包含不同信息对象类型(如文档,电子邮件,人员,事件等)的数据的容器格式。SRML文件或缓冲器可以包含每种对象类型的缠绕在一起的结果。合式SRML将包含与SRML代表的语义结果中包含的信息对象类型的模式一致的合式XML文档部分。参见附录中的示例A。
语义Web。当今Web的扩展,信息具有良好定义的含义,使计算机和用户能够更协调地工作。参见Tim Berners-Lee,JamesHendler,Ora Lassila,The Semantic Web,Scientific American,May 2000。
对许多团体而言,把机器可以理解的数据放到当今的Web上的装置正成为重要优先项目。只有Web成为自动工具和人类能够共享数据并能处理数据的地方,Web才能发挥其全部潜能。鉴于Web可以估计,未来的程序必须能够共享数据和处理数据,即使这些程序是在完全独立的情况下设计的。语义Web是概念上的梦想:企图以机器可以使用的方式定义并链接Web上数据,不仅仅是为了显示,而是为了自动化,综合并重用不同应用程序上的数据。参见http://www.w3.org/2001/sw/。
会话通知协议(SAP)。为了协助通知多点传送的多媒体会议和其他多点传送的会话,并且为了向预期的参与者传送相关的会话设置信息,可以使用分布式会话目录。会话目录的实例周期多点传送包含会话描述的数据包,其他会话目录接收此类通知,从而潜在的远程参与者可以使用该会话描述启动参与会话所需的工具。
在其最简形式中,上述处理包括以周期方式多点传送描述特定会话的会话通知数据包。为接收SAP,接收机仅仅监听公知的多点传送地址和端口。使用会话描述协议(ftp://ftp.isi.edu/in-notes/rfc2327.txt)描述会话。当接收机收到会话通知数据包时,只需对SDP报文进行解码,然后为用户显示会话信息。相同会话描述报文的重复间隔依赖于要通知的会话数(特定范围内的每个发送方均能听到相同范围内的其他发送方),以至特定范围内的会话通知使用的带宽大致为常数。如果某个接收机已经监听了规定时间,但没有听到会话通知,则该接收机断定会话已被删除,不再存在。规定期限基于接收机对发送方的发送频率的估计。
参见http://www.faqs.org/rfcs/rfc2974.html,http://www.video.ja.net/mice/archive/sdr_docs/node1.html,ftp://ftp.isi.edu/in-notes/rfc2327.txt。
简单邮件传输协议(SMTP)。为可靠、有效地传输邮件而设计的协议。SMTP不依赖特殊的传输子系统,仅仅需要一个可靠有序的数据流通道。SMTP的重要特征是能够中继穿越传输环境的邮件。参见http://www.ietf.org/rfc/rfc0821.txt。
外壳(skin)。表示模板,用于以每智能体为基础定制用户体验,或定制整体布局(独立于智能体),或对象(基于信息对象类型),语境(基于语境模板),混合器(为混合器的智能体)的表示,适用于语义域名/路径或本体分类,以及其他考虑。每个智能体包括一个外壳,各外壳均有参数的XML元数据表示,用于定制代表信息对象(布局外壳)的XML结果的布局,例如,是否用动画表示以上结果,显示每个结果的方式,包括表示的对象类型(对象外壳),风格,颜色,图形,过滤器,变换,影响,指示当前结果之本体分类的动画(本体分类外壳),指示当前结果之语境模板的风格(语境外壳),以及指示从混合器中查看导航结果之方式的风格(即混合器外壳)。
灵巧镜头(Smart LensTM)。本发明的带有专有权的特征的商标名称,允许用户选择某个灵巧智能体或对象作为查看其他对象或智能体的语境。接着,镜头显示元数据,链接和结果预览,预览为用户提供调用语境时预期出现的指示。本质上,灵巧镜头显示“潜在查询”的结果。灵巧镜头允许用户快速预览语境结果,无需实际调用查询(从而提高其生产率)。另外,灵巧镜头能够显示与语境一致的视图,正在使用的中心点,模板和预览窗口,从而允许用户在调用查询前用不同方式分析语境。
灵巧虚拟网(Smart Virtual WebTM)。本发明的属性的商标名称,用于综合语义,语境制约,时间制约以及物力,以使用户浏览动态的,虚拟的,“实时的”,用户能够控制并进行定制的用户控制的Web。这正是与当今的Web和概念上的语义Web的不同之处,二者均使用手工创作的网络,其中在该网络中,用户受网络上的信息的作者的支配。
结构查询语言(SQL)。发音为“ess-que-el”。SQL用于与数据库通信。根据ANSI(美国国家标准协会),SQL为关系数据库管理系统的标准语言。使用SQL语句完成更新数据库数据或从数据库中检索数据之类的任务。使用SQL的某些常见的关系数据库管理系统有:Oracle,Sybase,Microsoft SQL Server,Access,Ingres等。尽管大部分数据库系统均使用SQL,但是大部分系统都有只能在其系统上使用的其特有的附加专有扩展。然而,可以使用诸如Select、Insert、Update、Delete、Create和Drop之类的标准SQL命令,完成与数据库有关的几乎所有操作。
SQL同关系数据库一起工作。关系数据库在表(关系)中存储数据。数据库为表的集合。表由记录列表组成,表中的每条记录最好包含相同结构,每条记录具有固定数目的指定类型的“字段”。
参见http://www.sqlcourse.com/intro.html和http://www.dcs.napier.ac.uk/~andrew/sql/0/w.htm。
可缩放的矢量图形(SVG)。用于描述二维XML图形的语言。SVG提供三类图形对象:矢量图形形状(如由直线和曲线组成的路径),图像和文本。可以对图形对象进行分组,设计,变形或复合为先前绘制的对象。文本可以在适合于应用程序的任何XML名字空间中,从而增强对SVG图形的搜索能力和访问能力。其特征包括嵌套变形,剪裁路径,alpha掩码,滤波效应,模板对象和延伸性。SVG图画可以是动态的,交互的。包括完整XML DOM的SVG的文档对象模型(DOM),通过脚本提供直接有效的的矢量图形动画。可以给任何SVG图形对象指派诸如onmouseover和onclick之类的各种事件处理程序。由于其兼容性以及其他Web标准的影响,在同一网页内,可同时对不同名字空间内的SVG成分和其他XML成分实现诸如脚本之类的功能。参见http://www.w3.org/Graphics/SVG/Overview.htm8。
分类学。一种组织结构,将部门分为组或类别。
时间制约。信息介质的属性,当信息在时间上最相关时,交付并显示信息。例如,新鲜度为指示时间制约的一个属性。另外,交付并显示即将发生的事件(根据定义,即将发生的事件的时间制约的)以及显示事件的时间临界值的方式都是时间制约介质的属性。
当今的Web。指我们熟知的万维网。当今的Web为世界上的所有超文本服务器(HTTP服务器),超文本服务器为能够将文本,图形,声音文件等链接起来的服务器。超文本仅仅是表示信息的一种非线性方式。超文本的读者可以沿自己的路径前进,创建自己的顺序或材料中的意义,而不是按照作者、编辑或出版商设计的顺序进行阅读或学习。通过创建信息之间的“链接”实现上述处理。提供链接的目的是用户能够“跳转”到正在讨论的特定主题的其他信息(可能具有更多链接,从而将每个读者引向不同方向)。超文本介质可以包含图片,声音和视频,从而提供表示信息的多媒体方法,也称为超媒体。参见http://www.w3.org/History.html和http://www.umassd.edu/Public/People/KAmaral/Thesis/hypertext.html。
多点传送生存时间(TTL)。多点传送路由协议使用数据报的字段,确定要转发的给定多点传送数据包与发送主机的“距离范围”。多点传送数据报的默认TTL为1,导致多点传送数据包只能到达本地网络上的其他主机。可以使用setsockopt(2)调用来改变TTL。当TTL的值增加时,路由器将扩大转发多点传送数据包的跳数。为了提供更有意义的范围控制,多点传送路由器通常根据TTL字段对转发处理实施以下“阈值”:
·0限于同一主机
·1限于同一子网
·32限于同一站点
·64限于同一区域
·128限于同一大陆
·255没有限制
参见http://www.isl.org/projects/eies/mbone/mbone27.htm。
用户状态。指用户创建的或者需要在客户机或服务器上高速缓冲的用户的首选项,收藏夹或其他个人信息的所有状态。客户端用户状态包括身份认证证书信息,用户的智能体列表(以及包含该智能体的SQML查询在内的所有元数据),本地智能体,配置选项,诸如外壳之类的首选项等。本质上,客户端用户状态为用户的语义环境的持久形式。服务器端用户状态包括以下信息,用户的收藏夹智能体,预订的智能体,默认智能体,服务器上信息对象的语义链接(如,“收藏夹”链接)等。服务器端用户状态为服务器的选项,但最好支持该选项。服务器最好支持用户登录和“人员”对象类型(即使没有服务器端智能体),因为诸如收藏夹、建议之类的功能以及诸如“制造新闻的事件”、“专家”、“建议”、“收藏夹”和“古典”之类的语境模板需要它们。
虚拟信息对象类型(Virtual Information Object TypeTM)。对象类型的商标名称,不映射到不同对象类型,然而用户对其语义感兴趣。
虚拟参数(Virtual ParameterTM)。变量,参数,自变量或名称的商标名称,语义查询处理器在运行时进行动态解释。允许代理管理员存储引用虚拟名称的智能体,当调用查询时,将虚拟名称转换为实际的相关项。
信任网。语义Web研究社区成员杜撰的术语,指语义Web用户用来验证断言和声明的授权链。根据数学和密码学方面的成果,数字签名提供某人书作(或同意)某个文件或声明的证据。用户最好对其全部RDF声明进行数字签名。这样,用户可以确信是他们书写的(或至少保证其真实性)。用户只需告知程序信任谁的签名。每个用户可以设置他自己的信任级别(paranoia),计算机确定信任多少读取内容。
例如,借助信任网,用户告知计算机他信任他最好的朋友Robert。Robert恰巧是网络上非常受欢迎的男孩,并且信任很多人。他信任的所有人又信任其他人。每个信任均是某种程度的信任(Robert完全信任Wendy,很少信任Sally)。除信任之外,可以考虑不信任级别的因素。如果用户的计算机发现一个没有人明确信任的文件,但是也没有人说它完全是假的,则对该信息的信任要比许多人说其是假信息的信息的信任要多一点。在确定信息的可信任度时,计算机考虑所有因素。计算机最好将所有此类信息组合为一个简单显示(拇指向上/拇指向下)或一个复杂解释(描述包含的所有各种信息因素)。参见http://blogspace.com/rdf/SwartzHendler。
Web服务互操作性(WS-I)。特许的开放行业组织,旨在促进跨平台、操作系统和编程语言的Web服务。该组织影响行业和标准组织,通过提供用于开发Web服务解决方案的指导、最优方法和资源,回应用户的需求。参见http://www.ws-i.org。
Web服务安全性(WS-安全性)。SOAP报文增强,通过报文完整性,报文机密性和单一报文身份认证,提供保护质量。这些机制用于提供各种安全模型和加密技术。WS-安全性还提供把安全令牌和报文关联起来的通用机制。WS-安全性不需要特殊类型的安全令牌。它是可扩展的(如,支持多种安全令牌格式)。例如,客户可以提供身份证据,并证明他们有特定的商务证书。另外,WS-安全性描述了二进制安全令牌的编码方法。特别地,该规范描述了X.509证书和Kerberos许可的编码方法,以及包含不透明加密密钥的方法。该规范还包括扩展机制,用于进一步描述报文所包含的证书的特征。参见http://msdn.microsoft.com/library/default.asp?url=/library/en-us/dnglobspec/html/ws-security.asp。
扩展标注语言(XML)。Web上的结构文档和数据的通用格式。结构数据包括诸如电子表格、地址薄、配置参数、财务事项和技术图纸之类的数据。XML为一组规则(也可以看作指导方针或约定),用于设计对数据进行结构化处理的文本格式。XML不是编程语言,不是程序员也可以使用学习XML。XML使计算机更容易生成数据,读取数据,并确保数据结构是明确的。XML避免语言设计中的常见缺陷:它是可扩展的,平台独立的,并且支持国际化和本地化。XML完全服从Unicode。参见http://www.w3.org/XML/1999/XML-in-10-points。
XML Web服务(也称为“Web服务”)。在向用户提供动态的语境驱动的信息过程中包含的不同软件应用程序之间,提供标准通信方法的服务。更多具体定义包括:
1.利用能够用XML人工制品定义、描述和发现其接口和绑定的URI标识软件应用程序。经由基于因特网的协议,支持与使用基于XML的报文的其他软件应用程序进行直接交互。
2.应用程序是作为服务交付的,可以与使用因特网标准的其他Web服务进行集成。它是采用URL编址的资源,通过编程向希望使用该资源的客户返回信息。使用的主要通信协议为简单对象访问协议(SOAP),一般为HTTP上的XML。
3.可编程的应用逻辑,可使用标准因特网协议访问。Web服务把基于组件的开发方式和Web组合起来。和组件一样,Web服务代表可以重用的黑箱功能,不需要考虑服务的实现方式。和目前的组件技术不同,不能通过诸如DCOM、RMI或IIOP之类的特定对象模型协议访问Web服务。而是通过无处不在的Web协议(如HTTP)和数据格式(如XML)访问Web服务。
参见http://www.xmlwebservices.cc/,http://www.perfectxml.com/WebSvc1.asp和http://www.w3.org/2002/ws/arch/2/06/wd-wsa-reqs-20020605.html。
XQuery。一种查询语言,使用XML的结构以智能方式表示对各类数据的查询,不论是以XML格式存储的数据,还是通过中间件视为XML格式的数据。参见http://www.w3.org/TR/xquery/和http://www-106.ibm.com/developerworks/xml/library/x-xquery.html。
XPath。为XSL变换(http://www.w3.org/TR/XSLT)和XPointer(http://www.w3.org/TR/xpath#XPTR)之间共享的功能性提供通用句法和语义所进行的努力的结果。XPath的主要目的是访问XML[XML]文档的各个部分。为了支持上述主要目的,它还提供用于处理字符串,整数和布尔值的基本功能。XPath使用简洁的非XML句法,以方便在URI和XML属性值内使用XPath。XPath在XML文档的抽象逻辑结构上而不是在其表面句法上运行。就像在URL中那样,XPath根据其使用的路径符号获得其名称,以便导航通过XML文档的层次结构。
除用于寻址之外,还将XPath设计成具有用于匹配(测试节点是否与模式匹配)的自然子集;在XSLT中描述XPath的上述用途。XPath把XML文档的模型表示为节点树。有不同类型的节点,包括单元节点,属性节点和文本节点。XPath定义用来计算每类节点的串值的方法。某些类型的节点也有名称。XPath完全支持XML名字空间(http://www.w3.org/TR/xpath#XMLNAMES)。因此,把节点的名称的模型表示为由本地部分和可能为空的名字空间URI组成的配对;称为(http://www.w3.org/TR/xpath#dt-expanded-name)。参见http://www.w3.org/TR/xpath#XPTR。
XSL。XML的样式表语言,包括规定格式的XML词汇。参见http://www.w3.org/TR/xslt11/。
XSLT。供XSL使用,用来描述将某个文档变换为使用格式词汇的另一个XML文档的方法。参见http://www.w3.org/TR/xslt11/。
B.概述
1.发明背景
人们误以为信息访问的圣杯是供应自然语言搜索能力。信息访问的现有技术主要集中于改善搜索或访问信息的界面,以优化信息检索。其主要假定是,提供信息的自然语言界面将完全解决用户的信息访问问题,并结束用户查找信息时受到的挫折。
然而,实际上在现实世界中,人们获取知识的方式包含许多分析轴心。一个例子是语境。人们了解许多事情只是因为他们此时就在某个位置。如果那时他们不在那个位置,他们将不了解其实他们了解的事情,或者根本不想了解。利用自然语言搜索已知事情的能力无助于揭示与特定时间地点有关的知识。绝对没有构成用于查询所需信息的正确查询的自然参数。
难题是人们不能寻找他甚至也许不知道直到事后才有值的事物。换句话说,人们不能查询他们不知道他们不知道什么,或查找他们希望知道他们不知道什么。本发明的语境制约,时间制约,发现,动态连接,用户控制的浏览,用户的“语境环境”,灵活表示,语境外壳,语境属性,语境调色板(根据语境模板提出有关的语境和时间制约信息)以及其他方面承认并改正现有信息系统的主要不足。
例如,人们在其藏书室内有许多CD(由此增加音乐“知识”),因为他们参加某些聚会并与某些人交谈。在那些聚会中,那些人与该人说起过那些CD,从而增加了该人的音乐知识。作为另一个例子,某人根据在某个航班上恰巧坐在它旁边的之前并不认识的陌生人的建议,购买一本书(如果阅读的话,将增加该人有关该书的特定主题的知识)。在现实世界中,人们获取知识并不仅仅基于他们阅读和搜索的内容,而且也基于他们的朋友,与其配合的人员以及信任其判断的人员。可以论证,对于知识传播或知识获取而言,“知识环境”和检索模型(无论是数字的还是模拟的)一样关键,如果不是更关键的话。
本发明在数字世界中真实反映现实世界的每个知识获取情景。生成的信息神经系统(Information Nervous SystemTM)为完成大部分工作的介质,但情景非常清楚地映射到模拟(现实)世界。当今Web和语义Web的自然语言搜索技术不认可传播知识和获取知识的许多方式,最终使它们变得无效。本发明说明人类获取知识的各种方法—不依赖用于信息交付的实际技术。
例如,总是存在语境,总是存在时间。同样,总是有发现的意愿,总是需要动态链接信息并拥有用户控制。总是存在某些语境模板,纵使出现在不同介质中,包括“古典”,“历史”,“时间线”,“即将发生的事件”,“标题”。这些模板在因特网、当今的Web、电子邮件和电子学习形成前就存在。然而,在本发明之前,电子介质没有能力集中于知识交付的模式、协议和表示,映射到与实际信息类型、语义连接和元数据等不同的现实世界情景(例如,经由语境模板,语境制约,时间制约,动态链接,灵活表示,语境外壳,语境属性等)。始终存在新的信息类型。但是知识传播和知识获取的轴心(如语境模板)一直并且将永远都是相同的。本发明捕获上述真实性。
另外,本发明提供通过偶然发现有价值物品的才能传播知识的能力。在现实世界中,偶然发现有价值物品的才能在知识获取中扮演重要角色,它是知识交付的最好方式。通过支持语境,时间,语境模板等,本发明使用户能够以偶然发现方式(即使以智能方式)获取信息。
使用诸如Web之类的严格静态结构的信息模型或介质已失灵,因为它们假定存在创作的“网络”或“Web”,并且不能说明知识信息的各种轴心。此类信息模型不是用户集中的,不包含语境、时间、物力和模板,不映射到现实世界的知识获取和传播情景。本发明将信息损失降到最低程度,并使信息保持达到最大程度,即使不存在Web本身,即使不使用自然语言来查找信息。这是可能的,因为和现有的信息访问介质不同,本发明的最佳实施方式集中于包含语境、时间、物力和模板(为了终端用户和内容制作商的利益)的知识传播模型,而不是集中于特定的访问界面,或者基于静态数据模型的信息资源的链接(语义或非语义),抑或基于人的创作。在许多情景中,Web(语义或非语义)必定是一种导航手段,但不足以成为知识传播和知识获取的手段。本发明的信息神经系统包括在本发明中描述的“知识轴心”(包括但不限于基于链接的导航),并且以智能方式无缝集成,以方便知识的传播和获取,有益于知识转让的各参与方。
2.价值主张
今天,必须将知识“手工硬编码”为数字构造的信息结构,无论是用于企业,消费者,还是普通调查人口。如果没有正确创作和分发,则无人知道它的存在,无人知道它与其他情报源的关联方式,无人知道如何以正确的方式实时对它起作用。主要原因在于没有将当今的Web设计为知识平台。它被设计成一个表示平台,故意设计成哑的,静态的,被动的。今天,知识工人—试图通过添加语境和含义使用信息的人员—受知识作者的支配。
知识交互的重要方面是使知识工人能够以非常直观的方式,以他们希望作决策并对知识起作用的速度,在知识空间内导航。换句话说,知识工人不会“以为”电子学习岛屿与组织内的文件,包含客户反馈的电子邮件,媒体文件,即将举行的视频会议,近期参加的会议,新闻组中存储的信息,或有关书籍是分离的。首选情况是移交信息“类型”和“资源”,以便创建以语义方式穿过上述岛屿的“无缝知识体验”。
在创建知识体验中,最好能够集成跨越内容提供商、伙伴、供应商、客户和种族边界的知识资产。例如,在企业情景中,没有哪个组织有保持竞争性所需的全部知识。知识就在行业报告、咨询公司和投资银行的研究档案和诸如ReutersTM和BloombergTM之类的媒体公司中。所有这些构成“知识”。为定期培训用户而部署电子学习知识库是不够的。用户应始终访问智能语境与其现行任务关联的适当位置的各种信息源中的知识。
所有这些都需要今天尚未实现的智能层和主动性。今天,企业使用诸如内联网和因特网之类的信息门户作为向其雇员传播信息的方式。然而,这是远远不够的,因为它只能提供表示层集成。这类似于为保持最新信息而预订时事通讯,而不是利用智能体管理您的信息,帮助您实时发现新信息,帮助您捕获信息并与同事共享信息。
要实现所需的知识交互层,需要在后台工作的智能体,该智能体根据其配置文件进行推理、学习、推测、匹配用户,捕获新知识并自动演绎新知识,联合外部信息源中的知识以便成为知识体验的无缝部分。这需要知识资产的语义综合,从而它们全部有意义,而不是仅仅提供基本的表示层综合和文档搜索。上述实现框架以及由此生成的介质必须提供实时灵活的发现和推荐服务,从而语境和时间制约信息才会“受到尊敬”,知识工人才能更有效率,做得更多更快。最后,该系统必须以即插即用的方式与现有信息源一起工作,必须无缝地自动分选并集成已知的知识资产,必须在知识本身中内嵌知识工具,因此给知识资产增加了另一个“维数”。
本发明的目的是与当今Web(或任何其他表示层)共存的智能、主动、实时知识平台。结合使用本发明将允许知识工人控制其知识体验,因为创作(通过“连接”)是以智能、动态、自动方式并以思考速度进行的。
3.当今的“信息”Web对本发明信息神经系统
对于当今的Web环境,在将结构数据转换为服务器上的HTML时会丢失所提供的信息的语义,这意味着在用户有机会与对象交互前已经剥去了对象的“知识”。另外,当今的Web是基于作者“信以为真”的信息导航和信息消费方式,在服务器上创作和“硬编码”的。用户只能消费原样提供给他们的信息。
本发明增加当今基于HTML的Web环境并不支持的智能层和定制层。本发明提供灵巧知识对象的基于XML的动态Web而不是哑网页,其中在服务器和客户机之间保留对象的语义,从而给予用户更多权限控制其知识体验。另外,借助本发明的Web,知识工人能够按照自己的主张消费信息并对信息起作用,因为他们将通过“动态链接”和“用户控制的浏览”交互创作其自己的知识体验。
本发明的信息智能体(语义浏览器)的目的是与当今的Web共存,与各方面的私有和公用内联网以及因特网进行集成。图6总结当今Web与本发明的信息神经系统的技术平台堆栈。参照图6,当今Web的堆栈的最底层有结构信息源(包括诸如数据库中存储的数据之类的信息)和非结构信息源(包括诸如文档,电子邮件信息之类的信息)。以截然不同的方式处理两层上的信息。在信息索引层上不使用语义,而是使用基于关键字的搜索引擎。逻辑层主要包括数据库,数据库提供用于搜索、规则、视图和触发器等的编程能力。应用层包括服务器端脚本,后者根据用户的输入驱动电子商务。在最顶层(即表示层),当今的Web有表示信息(以网页的形式),通过带有Web平台(如浏览器)的门户显露表示信息。
除重叠的处理层之外,本发明以保留基础信息源的语义的方式,特殊处理来自最底操作层的信息。在结构和非结构信息源层上,系统10统一处理信息,重视与该信息关联的元数据和语义。在信息索引层上,从非结构信息源中抽取信息元数据和语义。系统10增加了当今Web所没有的三个附加平台层:知识索引和分类层,从语义上对结构和非结构信息源中的信息进行编码;知识表示层,在该层内创建联系,以维护知识对象的自修正或自愈语义网络;以及知识本体分类和推理层,在该层内推测语义网络中的新连接和属性。在逻辑层创建知识库,知识库从语义级上提供可编程能力。在应用层,与知识库联合使用服务器端脚本。此类脚本根据用户的输入动态生成知识对象,可以包含用于检索、通知和逻辑的语义命令。同时,该层可以包含用于优化处理语义用户输入的灵巧智能体。系统10的表示层保留从最底层追踪的语义。该层上的表示是根据客户计算机系统动态生成的,是完全可以定制的。
通过维护,综合使用各技术层上的语义,本发明创建行动“对象”的虚拟Web,直接相当于与其物理(实际)交互的“事物”,换句话说,就像常见的“语境模板”。与作为文档的哑Web的当今Web不同,本发明规定具有属性和关系的行动对象的灵巧虚拟Web,其中事件能够动态引起虚拟Web的其他部分的改变。
本发明提供可编程的Web。和作为文档的哑Web的当今Web不同,本发明的Web是可编程的,类似于数据库—能够处理逻辑和规则,并且能够发起事件。
当今的Web是为人类编码的,因此主要集中于表示静态信息,而本发明的虚拟Web主要是为机器编码的,纵使最终呈现给作为知识交付链之末端的人类。本发明提供具有智能的学习Web。这意味着本发明的虚拟Web能够学习新连接,并随着时间的推移越来越聪明。Web是动态的、虚拟的和自创作的,通过以智能方式主动创建当今Web不能提供的语义连接,为知识工人提供更多能力,从而减少并最终消除信息损失。
本发明的Web是自愈Web。和必须由文档作者进行手工维护的当今web不同,本发明提供由机器进行自维护的Web。此项功能校正断开的链接,因为Web将自动修复网络中的断开。
最后,正如以下将要详细说明的那样,本发明的不同实施方式包含以上描述的某些或全部知识获取轴心,以便在专注于当今Web和概念上的语义Web的现有系统上,提供真正的优势。
C.系统体系结构和技术考虑
1.系统概述
本发明专注于用于知识检索、管理和交付的系统和方法。用商标名称信息神经系统(Information Nervous SystemTM)表示该系统和方法。参照图7,在最上层,系统10包括由若干组件组成的服务器20,所述组件进行合作,以便通过诸如因特网或内联网之类的通信介质40,向在表示平台(如浏览器)上运行的客户机30提供语境和时间制约的语义信息检索服务。服务器组件最好包括知识综合服务器(KIS)50和知识库服务器(KBS)80,二者可以在物理上进行集成或分离。在该系统内,指定层次上的所有对象或事件为语义上彼此相关的活动智能体90,并代表查询(由基础操作码组成),查询返回数据对象,以便根据预定的定制主题或“外壳”呈现给客户。该系统注视各种应用程序,供客户定制和“混合”智能体的各种方法以及用于优化表示结果信息的有关基础查询。以下详细说明本发明的系统10的各个首选组件以及组件之间的相互作用。
2.系统体系结构
参照图8说明本发明的信息神经系统的端到端系统体系结构。图8说明本发明在信息神经系统XML Web服务(KIS)和灵巧智能体之间提供多种客户访问通信手段的方式。在最佳实施方式中,通过信息智能体进行通信。在选择实施方式中,通过企业知识门户(如,当今的Web访问浏览器)有计划地进行通信,或者通过能够与定制客户按计划进行综合的SDK层,进行通信。
参照图9说明信息神经系统的KIS的系统体系结构及其组件。以下详细说明此类组件。
3.技术堆栈
通过参考图10所示的技术堆栈,进一步强调当今的Web与概念上的语义Web之间的主要区别。图10为当今Web的高级描述平台层与本发明的信息神经系统中的等价物(如果适用的话)的并排比较。图10说明将当今Web中的情景映射到某些实例的信息神经系统中的情景的方法,由此为用户提供逻辑迁移通路,该图同时突出显示当今Web中不存在的信息神经系统的各个方面。
4.系统异质性
异质性为本发明的优势。在最佳实施方式中,KIS代理XML Web服务是可移植的。这意味着它支持诸如XML、XML Web服务之类的可互操作的开放标准(如,使用用于互操作的WS-I标准),数据存储和访问标准(如SQL和ODBC/JDBC)以及DSA从中收集数据的信息仓库的标准协议(如LDAP,SMTP,HTTP等)。
例如,在最佳实施方式中,KIS(其上某个代理正在运行)能够:
·从LDAP仓库中收集其“人员”元数据(使用LDAP DSA)。从而支持微软公司的Windows 2000 Active Directory,Sun公司的Directory Server以及支持LDAP的其他目录产品。最好具有使用特定平台的API收集“人员”元数据的特定平台的Active Directory DSA。
·从SMTP仓库中收集电子邮件元数据(对于任意信息源中的电子邮件或对于系统收件箱)。从而支持Microsoft Exchange,LotusNotes以及其他电子邮件服务器(支持SMTP)。最好具有特定平台的Microsoft Exchange Email DSA或Lotus Notes Email DSA。
·从支持诸如iCalendar之类的开放标准并使用诸如日历访问协议(CAP)之类的协议的日历仓库中,收集“事件”元数据,从而支持能够支持iCalendar或CAL协议标准的任何事件仓库。最好具有特定平台的Microsoft Exchange Calendar(或事件)DSA,Lotus NotesCalendar DSA等。
在选择实施方式中,可以配置KIS代理以抽取专有知识库中存储的元数据(经由适当的DSA)。
为实现异质性,在最佳实施方式中,对客户机服务器通信,系统10使用以互操作方式(跨平台)工作的XML Web服务标准。包括用于SOAP,XML,Web服务安全性(WS-安全性),Web服务高速缓冲(WS-高速缓冲)等的开放的可互操作的标准。
在本发明的最佳实施方式中,语义浏览器(也用商标名称信息智能体(Information AgentTM)表示)能够在诸如Windows、.NET、J2EE、Unix之类的不同环境中跨平台运行。这种能力与语义用户体验的观念是一致的,用户不关心也不会关心浏览器在什么“平台”上运行,代理(服务器)在什么平台上运行。本发明的语义浏览器为用户提供一致的体验,而不管它们是与Windows(或.NET)服务器“交谈”还是与J2EE服务器“交谈”。在安装或使用基于平台的客户机时,不要求用户采取任何额外步骤,其中与用户进行交互的代理在平台上运行。
信息智能体最好使用开放标准用于其外壳和其他表示效果。包括诸如XSLT和SVG之类的标准,以及可以跨平台工作的专有表示格式(如适当版本的Flash MX/ActionScript)。
参照图11说明本发明的信息神经系统的最佳实施方式的异类端到端实现示例。图11表示信息神经系统的最佳实施方式以及本发明的异类跨平台语境。以下详细说明图11所示的组件。
5.安全性
信息神经系统的最佳实施方式支持各方面的安全性:身份认证,授权,审计,数据保密,数据完整性,可用性,以及不可否认性。通过使用诸如WS-安全性之类的标准实现安全性,WS-安全性提供为XML Web服务应用程序提供安全平台。最好经由XML Web服务协议栈中的安全标准,在协议层处理安全性。包括从客户机(语义浏览器)到服务器(代理)的加密方法调用,对数字签名的支持,在授权访问代理的语义网络和XML Web服务方法前对调用用户进行身份认证等。
本发明的最佳实施方式支持本地(客户端)证书管理。最好通过要求用户输入他们在多个代理(内联网内)或因特网上使用的用户名和密码的列表,实现该处理。语义浏览器从可能具有该用户的不同认证证书的多个代理中聚集信息。作为选择,支持的认证证书包括通用模式,如使用用户名和密码的基础认证,SSL上的基础认证,微软公司的.NET护照认证服务,新的自由联盟认证服务,SSL上的客户证书,摘要认证以及集成Windows认证(在Windows环境中使用)。
在最佳实施方式中,借助在客户机高速缓冲的用户证书,语义浏览器通过检查支持的认证级别以及该代理的模式(为该代理的模式的一部分),使用指定代理的适当证书。例如,如果代理支持集成Windows认证,则语义浏览器利用当前用户的登录句柄或其他标识符,调用XML Web服务方法。如果代理仅仅支持SSL上的基础认证,则语义浏览器或者传送用户名和密码,或者传送登录句柄的高速缓冲副本(如果客户先前进行过登录并且登录句柄尚未期满),以便登录。最佳实施方式使用KIS上的登录句柄高速缓冲、老化或期满之类的技术,以便加速认证处理(和登录句柄查找),并且通过预防劫持的登录句柄,提供更多安全性。
代理XML Web服务最好支持不同的认证模式,或者以隐含方式(如果服务器操作系统或应用服务器本身支持此功能),或者利用XML Web服务本身在应用层进行支持。KIS代理的XML Web服务的选择实施方式最好使用多种认证模式,如基础认证,SSL上的基础认证,摘要,集成Windows认证,SSL上的客户证书,以及集成.NET护照认证。
6.效率考虑
客户端和服务器端的查询和对象高速缓冲。本发明规定查询高速缓冲,后者负责高速缓冲查询以便快速访问。在客户机上,客户端查询缓冲高速缓冲带有指定参数的SQML查询的结果。最好对高速缓冲进行配置,以便在预定时间量(如,几分钟)后清除其内容。最好通过建立系统使用率模型并得出高速缓冲期限的最佳值来设置时间量。也可以考虑其他参数,如代理上的数据达到速度(关于每代理高速缓冲,是另一种实现选择),用户的使用率模型(如导航速率)等。
高速缓冲能够改善性能,因为在用户导航语义环境时,客户机不需要访问最近使用的服务器。在最佳实施方式中,客户机使用标准XML Web服务高速缓冲技术(如WS-高速缓冲)。另外,在客户机上,最好有对象高速缓冲。该高速缓冲存储器高速缓冲每个SQML资源的结果,并利用资源引用(如文件路径,URL等)做标记。从而优化SQML处理,因为客户机能够直接从对象高速缓冲中获取SQML资源的XML元数据,无需访问资源本身。资源可能为本地文件系统,本地语义查询(如Microsoft Outlook)或代理的XML Web服务。就像查询高速缓冲一样,可以配置对象高速缓冲,以便在规定时间量(如几分钟)后清除其内容。
在选择实施方式中,在服务器上,服务器端的查询高速缓冲存储器高速缓冲XML参数的类别结果。从而加速查询响应时间,因为服务器不要求KDM对每个查询请求的XML参数加以分类(经由KBS的一个或多个实例,其中KIS被配置为从中获取其领域知识)。另外,服务器可以高速缓冲从客户机接收的SQML参数的SQL等价物。从而加速查询响应时间,因为服务器不需要在收到客户机的请求时,每次都将SQML参数转换为SQL。在最佳实施方式中,使用更进取的客户端高速缓冲,避免服务器端的高速缓冲,除非它能明显改善性能。这是因为客户端高速缓冲的伸缩性要好于服务器端高速缓冲的伸缩性,原因在于客户机根据本地语境高速缓冲请求。
虚拟分布式查询。本发明使用虚拟分布式查询。这与其“动态链接”和“用户控制的浏览”功能是一致的。该系统不需要链接该系统之所有元数据的静态网络,或存储该系统之所有元数据的大量独立数据库。从而不需要手工创作以及本地或全局范围上的维护。另外,不需要集成(或通用)存储器,其中在该存储器中,要求在一个元数据存储器中存储所有元数据,并通过一个数据库查询接口(如SQL)访问所有元数据。相反,通过使用XML Web服务,本发明使用“动态访问”的操作方法,以便将查询动态分配给各种代理(以语境和时间制约方式),并在客户机上采用相容的用户友好方式聚集查询结果。
D.系统组件和操作
1.代理和智能体
本发明提出使用代理和智能体检索、管理和交付知识的独特方法。
                       a.代理
在本发明的最佳实施方式中,代理为知识综合服务器(KIS)50的实例,并且是网站的发明等价物。最好将代理安装为Web应用程序(在Web服务器上),以暴露XML Web服务。代理最好包括代理管理器。在本发明的最佳实施方式中,代理有以下基本组件:
·标志,指示代理是否支持或要求认证(或二者)。如果代理要求认证,则该代理要求基本用户信息和密码,并存储有关其支持的认证类型的信息。对存储用户信息的代理而言,该代理还要求用户预订信息(预订特定代理的智能体)。
·语义对象(文档,电子邮件信息等)的结构存储—相当于相应类的模式。
·响应语义查询的运行时组件—该组件向调用应用程序返回XML,为语义浏览器的所有信息检索功能提供系统服务。
服务器端用户状态。在本发明的最佳实施方式中,代理支持服务器端用户状态,后者联合包括“人员”元数据和用户认证的有关概念。服务器端用户状态方便本发明的许多实现细节,包括:用户收藏夹的存储(按照人员对象和信息对象之间的语义链接);为生成新链接(如建议)、注释(将用户的注释映射到信息对象)而收藏的推理;以及基于语义链接的“专家”的推理,其中语义链接将用户映射到信息(如张贴的电子邮件,注释等)。最好与诸如“专家”、“收藏夹”、“建议”和“制造新闻的事件”之类的语境模板一起使用服务器端用户状态。
客户端用户状态。信息智能体(语义浏览器)最好支持本地客户端用户状态的漫游。包括用户的语义环境和用户的证书(安全传送的)。在最佳实施方式中,用户能够轻而易举地将器客户端用户状态导出到另一台机器上,以便将其语义环境复制到另一台机器上。最好通过将用户的智能体列表(最近使用的和收藏的),智能体的元数据(包括SQML缓冲器),用户的本地安全证书等转换为XML格式,实现以上处理,其中XML格式串行化所有状态,并能够容易地转移状态。作为选择,可以开发用于所有本地客户端用户状态的XML模式。在服务器上高速缓冲用户状态并使用常见的同步技术同步用户状态也有助于漫游。语义浏览器最好下载所有客户端用户状态并将所有客户端用户状态上载到服务器上,而不是在本地存储状态(在XML文件中或在Windows注册表之类的专有存储格式中)。
                      b.智能体
智能体为本发明的语义网络的主入口点。智能体最好包括语义过滤器查询,后者返回特定语义对象类型(如文档,电子邮件,人员等)的XML信息。换句话说,最好利用特定对象类型(以下说明)配置智能体。也可以利用语境模板(以下说明)配置智能体。此时,查询将返回对象类型,但是包含语境模板的语义。例如,将按照时间和关联性,对利用“标题”语境模板配置的智能体进行分类。也可以利用智能体来过滤通知、警报和通告。可以给智能体命名。然而,在本发明的最佳实施方式中,大部分智能体的命名格式为:
<Agentobjecttype>.<semanticqualifier>.<semanticqualifier>
可随意给智能体命名。然而,智能体名称的例子包括:
All.All
Email.All
Documents.Technology.Wireless.80211B.All
Events.Upcoming.NextThirtyDays.All
存在遵循不同命名约定(见下文)的域智能体(见下文)。在本发明的语义浏览器中,完全合格的域智能体名称具有以下格式:
<Agentobjecttype>.<semanticdomainname>.<categoryname>[Agency=<Agency url>,kb=<kb url>]
例如,利用带有语义域名industries.informationtechnology的知识库ABC.com/kb.asp中的类别wireless.all配置的代理http://research.Agency.asp上的电子邮件域智能体的全名为:
Email.Industries.Information Technology.Wireless.All[Agency=http://research/Agency.asp,kb=“http://abccorp.com/kb.asp”
本发明的语义浏览器最好是可配置的,以便只使用智能体名或包括“Agency”和“kb”限定符。
智能体类型。在服务器20上创建三种主要类型的智能体:标准智能体,复合智能体和域智能体。标准智能体为封装结构化的非语义查询,即没有领域知识(或本体分类/分类映射)的独立智能体。例如,在服务器上,智能体All.PostedToday.All为一个简单智能体,通过根据CreationTime属性过滤所有对象解析该智能体。标准智能体也可以更复杂。例如,智能体All.PostedByAnyMemberOfMyTeam.All可以分解为包含对象表和用户表的连接和子查询操作的复杂查询(见下文)。
复合智能体包含其他智能体,并允许代理管理员创建其查询结果为所包含代理之结果的并集或交集(取决于配置)的查询。复合智能体也可以包含其他复合智能体。在最佳实施方式中,复合智能体包含来自同一代理的智能体。然而,本发明期望集成不同代理的智能体。例如,通过复合以下智能体可以创建复合智能体All.Technology.Wireless.All:
·Documents.Technology.Wireless.All
·Email.Technology.Wireless.All
·People.Experts.Technology.Wireless.All
如上所述,域智能体为属于某个语义域的智能体。就像其他智能体那样,利用智能体查询初始化域智能体。然而,此类查询包括CATEGORIES表,利用知识域管理器(见下文)填充CATEGORIES表。尽管本发明的最佳实施方式使用其专有本体分类与私有语义环境对应的KBS 80,但是本发明期待完全支持本体分类交换标准,该标准能够将一个代理连接到一个或多个定制的私有KBS,如组织内的私有KBS,其中利用该组织的专有本体分类对代理预先进行初始化。
域智能体的一个例子是Email.Technology.Wireless.All。该智能体是利用以下知识源URL创建的:
category://technology.wireless.all@ABC.com/marketingknowledge.asp
知识源URL相当于在ABC.com/marketingknowledge.asp Web服务上安装的知识库上的默认域的Technology.Wireless.All类别。将其解析为以下HTTP URL:http://ABC.com/marketingknowledge.asp?category=“technology.wireless.all”。在本例中,完全合格的类别URL可能为:
category://technology.wireless.all@abccorp.com/marketingknowledge.asp?semanticdomainname=“InformationTechnology”
此时,利用域名限制类别URL。
最好通过域智能体向导创建域智能体,代理管理员能够从KBS 80向本发明的语义网络添加域智能体。域智能体向导允许用户创建特定类别的域智能体(使用类别URL),或完整语义域名的域智能体。在后一种情况中,最好对代理进行配置,以便向KBS上的语义域中添加新类别时,自动创建域智能体。该功能使域和类别仍然是动态的,因此能够随着时间的推移自适应用户的需求。当按照上述方式管理域智能体时,代理是可配置的,从而删除已不在语义域中的智能体。本质上,在该方式中,使域智能体和CATEGORIES表同步(再用下文说明的知识领域管理器同步CATEGORIES表和有关KBS中的CATEGORIES列表)。
利用结构查询初始化域智能体,其中结构查询根据类别名或URL过滤智能体管理的数据。在该情况中,结构查询和标准智能体的查询相同。用于类别智能体的组合查询的例子为:
SELECT OBJECT FROM OBJECTS WHERE OBJECTID IN(SELECT OBJECTID FROM SEMANTICLINKS WHEREPREDICATETYPEID=50 AND SUBJECTID=1000 AND OBJECTIDIN(SELECT OBJECTID FROM CATEGORIES WHERE URL LIKEcategory://technology.wireless.all@ABC.com/kb.asp?domain=“marketing”))
在本例中,假设“属于类别(belongs to the category)”谓词类型ID的值为50,类别objectid的值为1000。可以将该查询翻译为以下英文:
Select all the objects in the Agency that belong to the categorywhose object has an objectid value of 1000 and whose URL iscategory://technology.wireless.all@abccorp.com/kb.asp?domain=“marketing”
再翻译为:
Select all the objects in the Agency of the categorycategory://technology.wireless.all@abccorp.com/kb.asp?domain=“marketing”
域智能体向导询问用户是根据短类别名命名该智能体,还是根据更加友好的完全合格的类别名命名该智能体。后一种情况的例子为:Marketing.Technology.Wireless.All[@ABC]。完全合格的域智能体命名约定为:
<objecttypename>.<semanticdomainname>.<categoryname>.all[@KB Name]。
在本例中,域智能体的名称为:
Email.Marketing.Technology.Wireless.All[@ABC]。
混合器。混合器为用户的个人超智能体。用户可以创建混合器,向混合器中添加智能体(通过代理)或删除混合器中的代理。这类似于有其特有“个人代理”的用户。最好只在系统客户机上调用混合器,因为它们包含来自多个代理的智能体。本发明的客户机聚集来自混合器的智能体的所有对象,并以适当方式表示它们。混合器最好包括其他类型的智能体的所有操作特征,如拖放,灵巧镜头(见下文)。混合器可以包含任意类型的智能体(如标准智能体,搜索智能体,特殊智能体以及其他混合器)。
本发明提供混合器向导,混合器向导为一个用户界面,目的是方便创建混合器的用户。图12-14表示根据本发明之最佳实施方式的混合器向导用户界面的各个方面的典型屏幕快照。图12为示例信息智能体屏幕快照,表示示例语义环境的树视图,以及允许用户创建、管理新混合器的“添加混合器”向导的示例。图13表示添加混合器向导的第二个页面,在该页面中,用户输入混合器的名称和说明,选择信息对象类型过滤器(可选)。图14表示根据本发明之最佳实施方式的示例添加混合器向导的第三个页面。在本例中,用户将语义环境中的智能体添加到混合器中,或从混合器中删除语义环境中的智能体。当选择“添加智能体”选项时,显示“打开智能体”对话框,在该对话框中,用户可以将新智能体,混合器或代理添加到新混合器中。
突发新闻智能体。突发新闻智能体为特别标记的灵巧智能体。除具有代理管理员定义的时间制约的选项之外,用户还具有用来指示哪些智能体引用需要他警觉的信息的选项。如果有涉及突发新闻智能体的突发新闻,则正在显示的信息将显示警报。例如,用户能够创建“路透社今天公布的所有公文”或“未来24小时内在西雅图举行的与计算机技术有关的所有事件”智能体,作为突发新闻智能体。该功能以单独方式起作用,因为每个突发新闻智能体都是个人的(“突发”是主观的,并且取决于用户)。例如,位于西雅图的用户或许希望知道未来24小时内在西雅图的事件,未来一周内(期间他可以找到便宜航班)在西海岸的事件,未来14天内在美国的事件(预先注意大部分美国航线以定购价格适中的横穿大陆的航班),下月在欧洲的事件(可能因为他需要该时间量来预定旅馆),以及未来六个月内在世界各地的事件。
在最佳实施方式中,本发明通过查询每个突发新闻智能体,或者通过查询“突发新闻”语境模板,自动检查突发新闻的语义环境。对语义浏览器窗口中显示的所有对象进行该处理。如果突发新闻智能体指示有突发新闻,则信息智能体对象通过使窗口闪烁,或者通过显示明确表示存在与该对象有关的警报的用户界面,覆盖上述指示。当用户单击突发新闻图标时,显示突发新闻窗格或“突发新闻”语境模板的语境调色板,从而用户能够看见突发新闻,选择突发新闻智能体(如果有多个带有突发新闻的智能体的话),选择谓词和其他选项。图15表示突发新闻智能体用户界面的典型窗格。该示例用户界面说明语境结果窗格中的弹出菜单。该示例表示与灵巧镜头(智能体-对象)弹出语境结果窗格(以下论述)类似的语境窗格,只是智能体为突发新闻智能体。
默认智能体。在选择实施方式中,各代理暴露默认智能体的一个列表。默认智能体类似于网站上的默认页面;代理的作者确定他们希望用户始终看到的智能体。作为选择,在客户机上,当用户单击信息智能体的环境的根(相当于“主智能体”,如当今Web浏览器上“主页”的等价物)时,调用默认智能体。用户也可以配置组合的默认智能体。
默认的特殊(或语境)智能体。在最佳实施方式中,客户机或代理支持默认的特殊或语境智能体,后者映射到语境模板(以下论述)。此类智能体最好使用不带过滤器的适当语境模板。例如,称为“今天(Today)”的默认的特殊智能体返回今天张贴的“最近”和“收藏夹”列表内的(或代理的配置列表上的)所有代理的所有项目。在另一个例子中,称为“多样性(Variety)”的默认的特殊智能体显示与“多样性”语境模板相对应的语义环境内的每个代理的结果的随机集合。
默认的特殊智能体最好作为大部分用户熟悉本发明的信息神经系统的起点。另外,默认的特殊智能体保持与灵巧智能体相同的功能性,例如使用拖放,复制/粘贴,灵巧镜头,深层信息等。
水平决策智能体。在最佳实施方式中,为客户机使用的协助用户交互的智能体,包括:
·日程表智能体:日程表智能体根据特定用户希望参加活动的概率,以智能方式对事件进行排序。
·会议随动智能体:当需要举行过去举行的会议的随动会议时,会议随动智能体以智能方式通知用户。推理机(见下文)监视有关的语义活动,以确定是否出现保证举行随动会议的足够变更。用户最好使用先前的会议对象作为查找有关知识变更(如新文档,希望参加会议的新人等)的信息对象中心点。
·任务随动智能体。任务随动智能体响应用户执行的任务(如阅读文档,在其日历中添加事件等),向用户发送建议。该智能体确保用户具有稳定的随动系统。建议是基于用户的配置文件的,该智能体最好使用协同过滤来确定建议。
·客户随动智能体。客户随动智能体根据客户活动向用户发送通知。该智能体以智能方式确定用户需要注意的时间(根据从用户那里接收的电子邮件,帮助用户服务的新文档等)。
公用对本地智能体。代理管理员创建的智能体为“公用智能体”。用户创建和管理的智能体为“本地智能体”。本地智能体通过SQML可以引用远程代理,其中SQML包含对代理XML Web服务URL的引用;或者本地智能体可以引用本地代理,其中本地代理运行带有本地元数据仓库的KIS的本地实例。
保存的智能体—用户的我的智能体列表。在最佳实施方式中,用户能够保存调用的智能体的副本或查询结果作为本地智能体。例如,用户可以将其硬盘上的文档拖放到智能体文件夹中,以生成语义关系查询。用户能够将该结果另存为名为“Documents.Technology.Wireless.RelatedToMyDocument”的智能体。从而用户能够导航到该智能体查看个人化的语义查询。然后用户能够使用该智能体创建新的个人智能体等等。可以向代理“公布”个人智能体。其他用户最好能够发现该智能体,并预订该智能体。
在最佳实施方式中,利用“另存为智能体”按钮创建本地智能体,每当显示语义关系查询结果时,客户机上总是出现该按钮。类似于用户保存新文档。在保存智能体后,将其添加到用户的我的智能体列表中。智能体根据存储该智能体的代理的语义域,响应语义查询。本质上,对智能体的语义查询类似于询问智能体是否“理解该查询”。智能体尽其“理解”响应查询。作为另一个例子,管理“人员”的智能体根据其语义域内的人员到该域内的类别的内部映射,响应寻找文档专家的语义查询。
作为选择,可以配置系统客户机以使用非语义查询。此时,代理将使用从查询中抽取的关键字。所有智能体均支持非语义查询。在属于某个语义域的代理上,最好只有一个智能体支持语义查询。换句话说,语义搜索使搜索降级。
每个智能体均具有指示其是否“灵巧”的属性。如果代理属于某个语义域,则最好在该代理上创建灵巧智能体。另外,灵巧智能体仅仅返回其完全“理解”的对象。在最佳实施方式中,在安装智能体时,代理管理员可以选择安装许多默认的灵巧智能体,包括:
·All.Understood.All
·Documents.Understood.All
·Email.Understood.All
例如,Email.Understood.All仅仅返回该代理能够基于其语义域(或本体分类)从语义上理解的电子邮件对象。
本发明最好包括供用户显示所有对象或仅仅显示代理理解的对象的能力。
搜索智能体。搜索智能体为利用搜索字符串初始化的智能体。在最佳实施方式中,请求时,客户机发出搜索请求。搜索智能体是可配置的,从而搜索语境环境的任意部分,包括:
·经常使用的智能体
·最近使用的智能体
·最近创建的智能体
·收藏夹
·所有[保存的]智能体
·删除的智能体
·局域网上的智能体
·全局代理目录上的智能体
·用户定制的代理目录上的智能体
·整个语义环境内的所有智能体
客户机基于搜索智能体的范围发出搜索请求。如果用户表示希望搜索覆盖整个语义环境,则客户机向语义环境管理器(见下文)中的所有智能体,以及局域网、全局代理目录和用户定制的代理目录上的所有智能体,发出请求。
服务器端的收藏夹智能体。在另一种选择实施方式中,支持用户状态的代理支持收藏夹代理。在类似当今Web的语境中,网站允许用户定制其喜爱的链接,股票等。最初查询时,代理同时显示其默认智能体以及调用用户的收藏夹智能体(如果有用户状态的话)。
灵巧智能体。灵巧智能体为封装结构化语义查询的独立智能体,其中语义查询经由XML Web服务引用代理。在最佳实施方式中,客户机上的用户借助“创建灵巧智能体”向导创建、编辑灵巧智能体,该向导允许用户通过打开智能体对话框浏览语义环境,添加指定代理的链接。本质上,这相当于用户从用户界面中创建SQML查询。在最佳实施方式中,用户界面只允许用户添加相同代理资源的链接。然而,除特殊代理和混合器(最好是跨代理的)之外,用户可以创建跨越代理的相同类别的智能体。用户界面允许用户添加使用现有灵巧智能体的链接作为信息对象中心点,前提是该灵巧智能体引用当前查询的相同代理。图16表示打开智能体对话框的最佳实施方式,其用户界面控制选择链接(谓词)模板,链接和对象。图17-19表示包含打开智能体对话框的示例语义环境的树视图。图17表示允许用户浏览语义环境并打开智能体的打开智能体对话框。图18表示导航语义环境内的代理的方式以及带有“小型预览”视图的“打开智能体”对话框。图19表示工具栏上的“打开”工具,表示从语义环境中打开智能体或通过创建哑智能体而向语义环境导入正式信息(如从文件系统中)的新选项。
本质上,链接模板允许用户导航使用预定过滤器的现行对象类型的谓词,从而用户能够避免仔细查看该对象类型的所有谓词。链接模板的例子包括:
·所有
·突发新闻(引用时间制约的链接,如“最近张贴的”)
·分类
·肯定的(非随机链接)
·可能的(随机链接)
·注释
在最佳实施方式中,打开智能体对话框允许用户选择“链接到”的对象,并依赖对象的类型,允许用户浏览对象(如,如果对象为日期/时间,则从日历控件中浏览,如果对象为文本,则从文本框中浏览,如果对象为文件或文件夹路径,则从文件系统中浏览)。该向导用户界面还允许用户预览查询结果。利用当前的谓词列表创建临时SQML条目,然后加载到向导对话框的小型浏览器窗口内。用户能够添加/删除谓词,并且具有以下选项,即表示他希望对该谓词进行并集(OR)或交集(AND)运算的选项。该用户界面还检验重复的谓词。
在用户完成利用向导创建灵巧智能体后,将灵巧智能体添加到语义环境中,并利用关联的对象条目保存SQML。在最佳实施方式中,用户可使用智能体属性检查属性表浏览该灵巧智能体。从而用户能够查看简单的语义环境属性(如名称,说明,创建时间等),查看资源URL(正在查询的代理的XML Web服务的WSDL URL)以及谓词列表。用户可以编辑属性表中的列表。
默认的灵巧智能体。默认的灵巧智能体类似于默认的特殊智能体,只是它基于信息对象类型而不是基于语境模板。例如,“文档”将返回该用户的语义环境中的所有代理的所有文档,而“电子邮件”将返回该用户的语义环境中的所有电子邮件信息。
特殊智能体。特殊智能体为用户基于语境模板(见下文)创建的灵巧智能体。最好利用智能体名称初始化特殊智能体,即使没有特定智能体引用。例如,可以创建特殊智能体“Email.Technology.Wireless.All”,即使语义环境中没有该名称的智能体。和搜索智能体一样,特殊智能体为在语义环境的任意部分上搜索其名称的智能体的作用域。在最佳实施方式中,在用户调用特殊智能体时,客户机搜索具备其名称的智能体。在发现该名称的智能体时,客户机调用该智能体。
在最佳实施方式中,用户输入和语境模板一致的参数,参数表示类别过滤器和查询的代理。可使用打开智能体对话框手工输入参数,或者用户表明他们希望查询“最近”的代理,“喜爱”的代理。在选择实施方式中,用户可以选择为所选代理之并集或交集中的类别(如果需要的话),或全局代理目录中的所有类别。在另一种选择实施方式中,用户能够选择信息类型(与语境模板不同)和搜索关键字(与谓词或类别不同)。
默认的特殊智能体。在最佳实施方式中,系统客户机安装默认的特殊智能体,后者映射到所有支持的语境模板。例如,在最佳实施方式中,默认的特殊智能体包括:
标题
突发新闻
会话
制造新闻的事件
即将发生的事件
发现
历史
所有办法
最好的办法
专家
收藏夹
古典
建议
今天
多样性
时间线
即将发生的事件
指南
定制的特殊智能体。与用户创建的特殊智能体相反,定制的特殊智能体为特别开发、签署的特殊智能体,目的是保证特殊智能体是可靠的,安全的,并具有高性能。本发明提供插件层,以允许组织和开发人员创建其特有的定制混合器。定制混合器的一个例子为“和最近使用的文档或电子邮件有关的All.CriticalPriority.All”。利用以下带有资源项的SQML文件实现定制混合器:
<resource type=“nervana:url”
agent://all.criticalpriority.all@localhost>
<link predicate=“nervana:relevantto”
type=“nervana:localsemanticref”
recentdocuments>
</link>
<link operator=“or”
type=“nervana:localsemanticref”
recentemail>
</link>
</resource>
在最佳实施方式中,演示程序(见下文)在本地解析该“链接”项,并向其XML参数与最新文档或电子邮件信息相对应的目标资源发起XML Web服务请求。从而目标智能体专注于响应仅仅带有XML过滤器的语义查询,而无需了解与过滤器起源有关的语义。在选择实施方式中,诸如以上示例之类的定制混合器为默认的智能体。
垂直决策智能体。垂直决策智能体为向垂直行业情景提供决策支持的智能体。
智能体模式。智能体在指定参数的范围内运行,并表现出组成智能体模式的预定特征。适用本发明之技术的智能体模式可以有非常大的不同。例如,图20表示本发明的最佳实施方式的智能体模式。本发明特别期望增加其他字段。例如,可以向智能体模式添加类别URL(或路径)和语境模板名称字段,以便客户机和服务器快速访问智能体代表的类别或语境模板(如果适用的话)。这有助于语义环境管理器提供智能体的不同视图(按照类别,按照语境等)。从而补充智能体的SQML中存在的字段(借助属性和/或谓词表示的)。图21表示最佳实施方式包含的AgentTypeID。图22表示最佳实施方式包含的AgentQueryTypeID。
在最佳实施方式中,使用SQL查询格式。然而,诸如XQL、XQuery之类的多种查询格式均在本发明的范围内。
KIS 50最好在与该模式相对应的数据仓库中存储智能体表(用于服务器端的智能体)。图23表示与智能体名称相对应的示例语义查询,说明在本发明的KIS上配置服务器端智能体的方式。
正如下面详细说明的那样,智能体可以包含其特有的外壳(可选)。将智能体外壳表示为XSLT文件的URL或等价的Flash MX或ActionScript。如果没有指定智能体的外壳URL,则推测该智能体的对象类型的默认外壳。
智能体查询规则。必须规定每个服务器端智能体查询都要返回OBJECTID列。每个表都有此列,因为该列把对象表和用于导出对象类型的表连接起来。以下详细说明对象和其他表。
因为每个智能体查询都能构成子查询、级联查询或连接的基础,所以各查询最好遵循该格式。例如,News.All的查询可能为“SELECTOBJECTID FROM NEWS”(其中NEWS为存储新闻报道文章的元数据的表的名称,具有新闻(news)模式)。因此,服务器10使用该查询作为复杂查询的一部分。例如,如果用户将某个文档拖放到智能体上,则服务器可能按以下方式执行查询:
SELECT OBJECTID FROM NEWS WHERE OBJECTID IN(SELECT OBJECTID FROM SEMANTICLINKS WHERESUBJECTID IN(50,67,89)AND LINKSCORE>90)
本例假设文档的分类属于具有对象标识符50,67和89的CATEGORIES表中的类别,并且假设链接概率0.9为确定某篇文档属于某个类别的阈值。在本例中,文档作为News.All查询的过滤器,查询文本作为复杂查询的一部分。
通过拥有一致的查询标准,使语义查询处理器能够在最终提交查询前合并查询。例如,对语义查询处理器的每个调用必须指出返回结果的对象类型。然后,查询处理器返回与请求的对象类型的模式一致的XML信息。换句话说,查询处理器最好返回特定模式的结果进行显示。在语义层存储各查询(以返回OBJECTID)。为了使用上一个例子,当用户调用News.All智能体时,浏览器调用有关代理XML Web服务的查询处理器。接着,查询处理器调用该查询,并利用“新闻报道文章(News Articie)”对象类型进行过滤:
SELECT*FROM NEWS WHERE OBJECTID IN(SELECTOBJECTID FROM NEWS)
该查询返回新闻模式的所有字段。浏览器(通过演示程序)使用智能体外壳或用户指定外壳(将重载智能体外壳)的XSLT(或诸如Flash MX或ActionScript之类的表示工具)显示该信息。
查询虚拟参数。智能体查询最好包含特殊的虚拟参数。典型例子可能包括:‘%USERNAME%。在本例中,语义查询处理器(SQP)在调用查询前将虚拟参数解析为实参。利用以下SQL查询配置智能体People.MyTeam.All:
SELECT*FROM USERS WHERE Division IN(SELECTDivision FROM USERS WHERE Name LIKE%USERNAME%)
在本例中,智能体名称包括“MyTeam”,虽然该智能体可应用于任何用户。SQP将变量%USERNAME%解析为实际调用用户的名称。将SQL调用解析为:
SELECT*FROM USERS WHERE Division IN(SELECTDivision FROM USERS WHERE Name LIKE JohnDoe)
在本例中,假设JohnDoe为调用者的用户名。
简单智能体搜索。每个智能体均支持简单搜索功能性。在最佳实施方式中,用户能够右键单击信息智能体中的灵巧智能体,然后单击“搜索”。由此引出供用户输入搜索文本的对话框。从而创建带有关联谓词(如,nervana:contains)的适当SQML。本发明提供一种简单快速的方式,供用户搜索智能体(并由此创建智能体),而无需仔细查看“创建灵巧智能体”向导并选择“包含文本(contains text)”谓词(作为选择,能够收到相同结果)。
代理智能体视图。本发明的选择实施方式包括代理智能体视图。代理智能体视图为根据预定标准过滤智能体的查询。例如,智能体视图“文档(Documents)”仅仅返回管理文档语义类的对象的智能体。智能体视图“路透社新闻(Reuters News)”返回用于管理路透社为出版商的新闻对象的智能体列表。为了给用户提供导航智能体的轻松方式,代理智能体视图是非常重要的。代理管理员能够创建/删除智能体视图。
智能体发布和共享。最佳实施方式使智能体的发布和共享更加轻松。最好通过将语义环境串行化为包含最近使用和收藏的智能体、其模式和其SQML缓冲器等的XML文档,并将该文档发布到发布点上,实现上述处理。也可以将该XML文档用电子邮件发送给同事和朋友,以方便本地(用户创建的)智能体的传播和共享。类似于当今发布网页的方式,以及通过利用电子邮件发送链接和附件共享web URL和链接的方式。
2.知识综合服务器
知识综合服务器(KIS)50为系统10的服务器端装置的核心。KIS从语义上将来自各种信息源的数据集成为一个语义网络,并存储提供网络访问的智能体。KIS还存储语义XML Web服务,以便客户经由智能体访问语义网络。对用户而言,可以将KIS安装视为代理。最好利用以下属性初始化KIS:
·代理名称。代理的名称(如“ABC”)
·代理友好名称。代理的全名(如“ABC公司”)
·代理说明。代理的说明
·代理系统用户名。代理的用户名。利用安装代理的企业目录(或网站)上的用户表示各代理。利用系统用户名存储系统收件箱(用户通过系统收件箱向代理发布文档,电子邮件和注释)。为了进行认证,必须在有权使用系统用户帐号的服务器上安装代理。
·代理认证支持级别。表示代理是否支持或要求用户认证。可以将代理配置为:不支持认证(此时,对所有用户开放,并且没有任何用户状态);支持但不要求认证;以及要求认证,此时最好指出认证加密类型。
·代理用户目录类型。表示代理对用户进行认证并从中获取其用户信息的用户目录的类型。例如,可能为LDAP目录,MicrosoftExchange 2000 User Directory,或Windows 2000 Active Directory上的Lotus Notes User Directory等。
·代理用户目录名。表示代理用户目录的服务器名(如MicrosoftExchange 2000服务器名)。
·代理用户域名。表示用于认证目的的用户域的名称。该字段是可选的,并且只有代理支持认证时才包含该字段。
·代理用户组名。表示用于认证目的的用户组的名称。例如,可以利用域名“US Employees”和组名“Marketing”初始化代理。此时,代理将首先检查用户名以确保该用户为用户组的成员,然后将认证请求转发到用户目录类型指示的用户目录认证装置。如果调用用户不是用户组的成员,则拒绝该认证请求。只有代理支持认证时,该字段才有效。
·数据仓库连接名。表示数据库连接的名称。例如,可以表示为Windows上的ODBC连接名(或JDBC名等)。KIS使用连接名表示的数据库来存储、更新和维护其数据表(见下文)。
·动态属性求值。代理XML Web服务最好暴露方法,以返回动态属性,如服务器当前支持或“理解”的语义域路径的列表。从而用户能够利用支持的语义域路径或本体分类/分类,浏览客户机上的代理。
正如参照图24说明的那样,KIS 50最好包括以下重要组件:语义网络52,语义数据收集器54,语义网络一致性检查器56,推理机58,语义查询处理器60,自然语言分析程序62,电子邮件知识智能体64以及知识领域管理器66。
                    a.语义网络
语义网络为KIS的核心数据组件。语义网络经由数据库表,以语义方式把本发明的定义模式的对象链接起来。语义网络包括模式和语义元数据仓库(SMS)。语义网络最好包括两种数据模式:对象和SemanticLinks。基于系统需求和企业要求,可以包括附加数据模式。SMS最好为标准数据库(SQL Server,Oracle,DB2等),在数据库中存储所有语义数据,并通过数据库表进行更新。SMS最好包括各主要对象类型(以下说明)的数据表。
例如,参照图25说明以企业环境为目标的简单语义网络,图25表示本发明的商业用户之间的关系,以及知识检索、管理、交付和表示的各种信息源和结果。
对象。对象表包含语义网络中的全部对象。可以把“对象”看作导出各种语义对象类型的“基类”。参照图26说明对象类型的最佳模式。ObjectID为标记语义网络中的对象的唯一标识符。系统中的每个对象均有一个模式,模式为对象模式的扩充。作为选择,语义对象类型(如文档,电子邮件,事件等)只有ObjectID字段。在调用查询时,查询处理器聚集对象表和特定语义表中的信息,以形成最终结果。前一种方法(使每种模式为对象模式的扩充)导致更好的运行时性能,因为能够避免连接。然而,后一种方法尽管计算开销更大,但是存储空间浪费较少。ObjectTypeID最好为解析为字符串的数字,字符串描述对象类型的层次结构,如“documents\documents”;“documents\analystbriefs”和“events\meetings”。
SourceID表示从中收集对象的语义数据适配器(SDA)的标识符。语义数据收集器(SDG)使用该信息周期检查对象是否仍然存在,其方法是请求从中检索对象的SDA中的状态信息。
SemanticLinks。SMS最好包括存储语义链接的SemanticLinks模式(和相应的数据库表)。这些链接给SMS的其他数据表中的对象作注解,最好构成语义网络的数据模型。每个语义链接具有一个语义链接ID。SemanticLinks表最好包括参照图27说明的字段名和类型。SubjectID和SubjectTypeID为发起链接的对象的对象ID和对象类型ID。ObjectID和ObjectTypeID为链接到的对象的对象ID对象类型ID。LinkScore最好在0到100之间,以概率方式表示链接的语义强度。以上字段仅仅是代表性的;可以根据特定对象类型以及用户希望的语义链接设想更多谓词。本发明的最佳实施方式提供图28所示的谓词类型ID。本发明期望增加其他谓词类型ID。
例如,利用与用户表中的Steve的ID相对应的主题ID,谓词类型PREDICATETYPEID_REPORTSTO(见下表),用户表中的Patrick的对象ID,链接分值100(表示该链接为“事实”,并且该链接不是随机的)以及限定该链接的参考日期,在数据表中表示语义链接“Stevereports to Patrick(史蒂夫向帕特里克报告)”。
KIS创建,更新,维护每种对象类型的数据库表(经由SMS)。以下各项说明主要对象类型和派生对象类型的首选(非专用)列表:
·人员
·用户
·客户
·类别
·文档
·分析简报
·分析报告
·案例研究
·白皮书
·公司简介
·电子书
·电子期刊
·电子邮件信息
·电子邮件注释
·电子邮件新闻张贴
·电子邮件分发列表
·电子邮件公用文件夹
·电子邮件公用文件夹新闻组
·新闻报道文章
·事件
·会议
·公司活动
·行业活动
·电视活动
·无线电广播活动
·印刷媒体活动
·联机大会
·文艺和娱乐活动
·联机课程
·媒体
·书籍
·期刊
·多媒体
·联机广播
·联机会议
对象类型最好为诸如层次路径的明确表示。可以扩充路径,例如用“受限会议”扩充“事件\会议”,如“事件\会议\公司会议”。模式模型可以无限扩充和配置。
虚拟信息对象类型。虚拟信息对象类型为没有映射到不同对象类
型但用户对其语义感兴趣的对象类型。一个例子是“客户电子邮件”对象类型,它是从“电子邮件”对象类型导出的。该对象类型是“虚拟的”,因为它没有不同的模式,因而在KIS上的SMS中没有不同的数据表。相反,它使用SMS上的“电子邮件”数据表,因为它是从“电子邮件”对象类型导出的。尽管它不是截然不同的对象类型,但是用户对浏览和搜索“客户电子邮件”感兴趣,好像它确实不同一样。
在最佳实施方式中,通过在SMS上的适当表中存储元数据,实现虚拟对象类型(此时,使用“电子邮件”数据表,因为对象类型是从“电子邮件”导出的)。然而,该对象类型的查询的解析过程与不同对象类型的正规查询的解析过程不同。当服务器SQP收到虚拟信息对象类型(如“客户电子邮件”)的语义查询请求(经由XML Web服务)时,通过连接共同组成该对象类型的数据表,解析该请求。例如,在最佳实施方式中,对于“客户电子邮件”,服务器利用SQL子查询解析该查询:
SELECT OBJECTID FROM EMAIL WHERE OBJECTID IN(SELECT OBJECTID FROM CUSTOMERS WHEREEMAILADDRESS IN(SELECT EMAILADDRESS FROM EMAIL)
该查询相当于“Select all objects from the Email table that havean email address value that is also in the Customers table(选择其电子邮件地址也在客户表中的电子邮件表中的所有对象)”。该查询假设“客户电子邮件”指客户发送或发送给客户的电子邮件。虚拟对象类型的其他定义也是可行的,其查询解析最好与其定义一致。SQP最好将以上子查询应用于“客户电子邮件”的所有查询。本质上,以上子查询过滤发件人为客户的电子邮件信息的电子邮件表。从而向用户返回所需结果,造成存在“客户电子邮件”表的假象,而实际并不存在该表。
本发明期望与各对象类型关联的多种模式。其他模式还在开发中,这些模式对本发明有类似的适用性。例如,可利用都柏林核心(DublinCore)模式(http://www.cis.ohio-state.edu/cgi-bin/rfc/rfc2413.html)和其他行业标准模式中的字段,扩展“文档”模式。在另一个例子中,“新闻报道文章”模式可以为NewsML模式(http://www.newsml.org)的扩展。举例来说,参照图29说明根据本发明创建的最佳用户对象模式。所有模式最好把对象模式的字段作为同一子集。与用户(人员)对象模式关联的MailingAddressTypeID最好包括参照图30说明的对象模式。
举例来说,参照图31说明根据本发明创建的最佳类别对象模式。
举例来说,参照图32说明根据本发明创建的最佳文档对象模式。“DocumentCategory”字段系指用文档(按文档数据源)标记的专有类别,而不是KIS本身管理的语义类别。“DocumentFormatTypeID”字段系指文档的类型。图33表示最佳实施方式的印刷介质类型ID,图34表示最佳FORMATTYPEID。
举例来说,参照图35说明根据本发明创建的最佳电子邮件信息列表对象模式。电子邮件优先级最好为0,1或2,对应于低优先级,普通优先级和高优先级。EmailTypeID最好包括EMAILTYPEID_EMAIL,EMAILTYPEID_NEWSPOSTING和EMAILTYPEID_EMAILANNOTATION(其值为1,2和3)。图36和37为示范表,分别表示本发明之最佳实施方式的电子邮件分发列表和电子邮件公用文件夹对象模式。在最佳实施方式中,PublicFolderTypeID包括图38所示的字段。
举例来说,参照图39说明根据本发明创建的最佳事件对象模式信息列表对象模式。图40表示本发明的最佳实施方式的事件类型。
举例来说,参照图41说明根据本发明创建的最佳介质对象模式信息列表对象模式。图42表示本发明的最佳实施方式的介质类型。
例如,图43-45表示附加示例,说明在本发明的最佳实施方式中对对象进行分类以及使用对象的方式。图43表示根对象容器类型。图44表示限定对象类型的层次模式。图45表示固有容器对象类型谓词的示例。除人员(Person)和客户(Customer)类型之外的所有类型最好继承根类型“所有信息(All Information)”的所有谓词。本发明提供固有容器对象类型谓词模板,包括:全部(All);突发新闻(BreakingNews);分类(Categorization);作者(Author);注释(Annotations);肯定链接(Definite Links);随机链接(Probabilistic Links)和通用(Popular)。
                    b.语义数据收集器
在最佳实施方式中,语义数据收集器(SDG)负责经由SMS添加,删除,更新语义网络中的条目。SDG包括一列XML Web服务引用。它们构成信息源抽取层(ISAL)。初始化每个引用以便经由数据源适配器(DSA)收集数据。数据源适配器为从给定对象类型的本地或远程语义数据源中收集信息的XML Web服务。它返回与数据源中的对象条目相对应的XML。所有DSA最好支持相同接口,其中SDG经由该接口收集XML数据。该接口包括以下方法:
●检索指定开始和结束索引的对象(如对象0到49)的XML元数据。
●检查特定日期/时间(根据DSA的时钟)以来是否添加/删除过对象。
●提取特定日期/时间(根据DSA的时钟)以来添加/删除的对象的XML元数据。
●检查对象是否仍然在语义数据源中—通过检查该对象(作为参数传递)的XML元数据。
如果DSA XML Web服务的每个调用都没有状态,则API应包含信息,最好借助于带有命令参数的字符串,以限定请求。例如,电子邮件收件箱的DSA包括要收集其收件箱的用户的用户名之类的参数。网站或文档存储器的DSA必须包括要搜索的URL或目录路径的信息。
要求每个DSA按照其对象类型的方式检索信息。因为必须实现特定对象类型的DSA,所以当SDG调用DSA的收集器时,期望用于该对象类型的模式的XML。
SDG负责维护SMS(语义网络)中所有数据库表的完整性和一致性。在本实施方式中,SDG也称为语义网络管理器(SNM)。数据库表最好不包含冗余或陈旧条目。因为SDG检索公知模式的对象,所以理解每个对象类型的语义,并且SDG维护数据表的一致性。例如,SDG最好不向DOCUMENTS表添加冗余的文档XML元数据。SDG使用文档的语义来检查冗余性。在最佳实施方式中,通过比较作者,创建日期/时间,文件路径等,实现该处理。同时,SDG对其他表(如EVENTS,CUSTOMERS,NEWS等)执行该检查。例如,通过检查标题,位置和日期/时间,SDG检查事件的冗余性。相应维护其他数据表。并且SDG必须更新已经改变的数据库表中的对象。
同样,SDG最好负责清除数据库表。SDG周期查询DSA,以确定DSA管理的每个数据表中的所有对象是否仍然存在。例如,对检索文档的DSA而言,SDG将XML元数据传送给DSA Web服务,然后查询对象是否存在。DSA试图打开该文档的URL。如果该文档已不存在,则DSA会向SDG作出说明。DSA而不是SDG负责对象确认,以避免数据源特有的安全性限制。例如,可能存在阻止远程访问本地资源的数据源限制。此时,只有DSA XML Web服务(相对于数据源而言,最好在本地运行)才能访问数据源。作为选择,某些DSA可能在与SDG和其他服务器组件并排的代理服务器上运行,并且远程检索其数据。
利用DSA处理对象确认还能提供附加效率和安全性,因为DSA能够阻止SDG了解打开各数据源检查对象是否存在的方法的细节。因为DSA需要了解此类细节(因为它从数据源中检索XML数据,因此有数据源特有的代码),所以DSA更适合处理此任务。
SDG最好维护指向DSA XML Web服务URL的收集器列表。KIS管理员能够从SDG收集器列表中添加,删除,更新DSA条目。最好利用以下各项配置各收集器列表条目:
1.DSA的名称和引用的XML Web服务。其本质系指数据源和对象类型的组合,以及引用的实现DSA的XML Web服务(如经由WSDL web服务URL)。例子包括:
a.Microsoft Exchange 2000 Email DSA。该DSA从Microsoft Exchange 2000收件箱或公用文件夹中收集电子邮件XML元数据
b.Microsoft Exchange 2000 Calendar DSA。该DSA从Microsoft Exchange 2000日历中收集事件XML元数据
c.Microsoft Exchange 2000 Users DSA。该DSA从Microsoft Exchange 2000目录中收集用户/人员XML元数据
d.Microsoft Exchange 2000 Email Distribution List DSA。该DSA从Microsoft Exchange 2000目录中收集电子邮件分发列表元数据
e.Lotus Notes收件箱。该DSA从Lotus Notes收件箱或公用文件夹中收集电子邮件XML元数据
f.Siebel CRM数据库。该DSA从Siebel CRM系统中收集客户XML元数据
g.网站。该DSA从网站中收集文档XML元数据
h.文件目录或共享。该DSA从文件目录或共享中收集文档XML元数据
i.Saba电子学习LMS仓库。该DSA从Saba学习管理系统(LMS)仓库中收集电子学习XML元数据
j.Microsoft Sharepoint Document DSA。该DSA从Microsoft Sharepoint服务器工作区中收集文档XML元数据
k.路透社新闻报道仓库。该DSA从路透社新闻报道文章仓库中收集新闻报道文章XML元数据
2.DSA收集器条目的说明。
3.表示DSA之初始化信息的字符串。
4.收集器日程表—表示SDG为收集XML元数据而“搜索”DSA的频率。
在最佳实施方式中,利用用户目录域和组名初始化代理。此时,SDG最好自动输入用户目录DSA的收集器列表条目。例如,如果利用域名为“Foo”,地址薄或组名为“Everyone”的Exchange 2000 UserDirectory配置代理,则SDG创建带有Exchange 2000 Users DSA(利用以上参数进行初始化处理)收集器列表条目。作为选择,可以配置代理以从电子邮件应用服务器(如Microsoft Exchange或Lotus Notes)中获得其用户目录。SDG利用系统用户的电子邮件收件箱和日历DSA(以及以下说明的电子邮件知识智能体),初始化收集器列表条目。利用默认值初始化三个收集器列表条目DSA(用户,收件箱和日历)。最好利用收件箱存储代理电子邮件发布和注释,利用日历DSA存储用户张贴到代理上的事件。代理管理员可以添加其他定制DSA。
同时,SDG记录SDA报告的向数据源中添加对象或从数据源中删除对象的最后时间。日期/时间信息最好基于SDA的时钟。每当SDA报告有新数据或删除数据时,SDG总会更新SDA条目内的日期/时间信息,并收集SDA内的所有新信息或删除信息。然后SDG更新数据库表。
SDG最好把从SDA接收的XML信息映射到本发明的语义网络。SDG在SMS的数据库表中存储所有XML元数据。另外,SDG语法分析从SDA接收的XML,并且如果必要的话,将语义链接映射到特定XML字段。如果XML包含将对象“链接”起来的信息,则SDG添加或更新语义链接。例如,电子邮件对象的模式最好包含字段“发件人”,“收件人”,“抄送”,“密件抄送”和“附件”。关于“发件人”,“收件人”,“抄送”和“密件抄送”栏,XML中的字段系指电子邮件地址(利用诸如“;”,“,”或空格之类的分隔符进行分隔)。关于“附件”栏,该字段指附加到电子邮件中的文件的文件路径(利用诸如“,”之类的分隔符进行分隔)。将原始XML存储到EMAIL数据库表以及其他栏中。另外,SDG语法分析电子邮件对象的字段,增加与上述字段之内容标识的其他对象的语义链接。例如,如果“收件人”字段包含“john@foo.com”并且附件字段包含字符串“c:\foo.doc,c:\bar.doc”,则SDG将按以下方式处理该电子邮件:
1.查找带有电子邮件地址“john@foo.com”的USERS表中的所有对象。同时,搜索FROM,TO,CC和BCC字段中带有电子邮件地址的其他USER对象。
2.如果发现任何对象,则向SEMANTICLINKS表添加语义链接条目,其中电子邮件对象id作为主题,以及适当的谓词类型id。此时,谓词PREDICATETYPEID_CREATOR指电子邮件信息的发起人。利用谓词PREDICATETYPEID_SENTTO链接电子邮件对象以及电子邮件XML元数据中的“收件人”字段的内容所指的USER对象。同样,利用谓词PREDICATETYPEID_COPIEDTO和PREDICATETYPEID_BLINDCOPIEDTO链接“抄送”和“密件抄送”字段中的对象。
关于附件,SDG抽取附加文档的XML元数据。如果SMS(换句话说,语义网络)中已经存在带有该文件路径的XML对象,则SDG将更新元数据。如果XML对象已不存在,则SDG利用XML元数据创建新的文档对象。SDG将向SEMANTICLINKS表添加条目,其中电子邮件对象ID为主题,新文档的对象ID为主题,以及谓词PREDICATETYPEID_ATTACHEDTO。从而用户能够从电子邮件信息导航到其附件,然后使用附件作为中心点继续浏览语义网络,例如通过使用诸如灵巧镜头(以下论述)之类的语义工具。
如果SDG没有找到与XML字段中的条目匹配的用户对象,在SDG不创建任何对象。最好在将用户手工添加到代理上时,SDG从目录SDA中收集信息。代理管理员最好借助于代理属性上的用户组,将用户添加到代理上。
以下说明将原始电子邮件XML元数据映射到语义网络的示例。
<email from=“john@foo.com“
  to=“nosa@nervana.net“
  cc=“steve@nervana.net“
  bcc=“patrick@nervana.net”
  subject=“Meeting this Friday”
  body=“Let us meet on Friday at 2pm”
  attachments=“c:\foo.doc;c:\bar.htm”>
</email>
被转换为图46所示的对象图。
                c.语义网络一致性检查器
语义网络一致性检查器(CC)补充SDG执行的一致性检查。如上所述,SDG通过阻止(从不同数据源中)向语义网络中添加冗余条目,维护数据库表的一致性。同时,CC确保OBJECTS和SEMANTICLINKS表的一致性。CC周期检查OBJECTS表以确保原表中存在每个对象(最好通过检查OBJECTID字段值)。例如,OBJECTS表中的文档对象条目最好也DOCUMENTS表中(有相同对象ID)。CC删除原表(DOCUMENTS,EVENTS,EMAIL等)中没有相应对象的OBJECTS表中的所有对象,反之亦然。
CC还负责维护SEMANTICLINKS表的一致性。该数据表的语义如下:如果其主体(链接自(linked from))或其对象(链接到(linkedto))不存在,则语义链接不存在。作为说明,假设对象A链接到B,并具有谓词P,如果删除A或B,则应删除该链接。CC周期检查SEMANTICLINKS表。如果主题或对象已删除,则CC删除语义链接条目。
可以采取KIS本身中的代码的方式,或者作为数据库级的存储过程或约束,实现一致性检查。
                       d.推理机
推理机负责向语义网络添加语义链接。推理机使用由一组启发式组成的推理规则,基于正在进行的语义活动添加语义链接。最好允许推理机删除语义链接。决策智能体(以下说明)使用推理机协助知识工人作决策。
推理机通过挖掘语义网络并基于似然推理添加新的语义链接起作用。例如,推理机最好监控语义网络,观察其发送电子邮件的方式,所发送的电子邮件的类型以及发件人。推理机根据该信息,推测与推理机的监控范围内的各种主题类别有关的背景资料,如用户的专长。例如,推理机添加带有谓词PREDICATETYPEID_EXPERTON的语义链接,以表示用户为特定类别方面的专家。此时,主体为用户对象,而对象为类别对象。为了推理,最好对推理机进行配置,以便观察至少某个时段(如两周)内的语义活动,或者只有用户发送预定数目的信息或创作某个数目的文档后,才推测链接。推理机通过统计PREDICATETYPEID_CREATOR和PREDICATETYPEID_CONTRIBUTOR链接,推测新链接。
例如,推理机推测用户为某个类别方面的专家,如果:
●在他们写作的所有类别的电子邮件信息中,此类别为前N(可配置)个类别中的一个。
●他们每星期写作同一类别方面的电子邮件的平均数为M(可配置)或更多。
●在前P(可配置)个月中,他们写作了至少O(可配置)封电子邮件。
可以设想能够精确推测以上数据的更复杂的推理模型。例如,可以使用概率分布和统计相关性模型。最好随时间推移开发每种情景的模型。
推理机还负责删除其曾经添加的链接。例如,如果雇员变动工作,则他可能“不再”是特定类别方面的专家(相对于其他雇员)。在推理机发现此变动后(如通过观察电子邮件模式),删除表示此人为该类别方面的专家的语义链接。
推出的语义链接对包含概率语义查询的情景很重要。例如,在本发明的一种实施方式中,通过使用信息智能体,用户将其文件系统中的某篇文档拖放到智能体(如People.Research.All)上。此时,用户希望了解研究部门中为该文档方面的专家的人员。接着,浏览器调用SQML查询,其中智能体为资源(或主体),谓词nervana:experton,文档路径为对象。然后,演示程序检索该文档的XML元数据,调用驻留在存储该智能体的代理上的XML Web服务,其中谓词ID和文档的XML元数据作为参数。代理上的服务器端语义查询处理器处理XML Web服务调用,将该调用翻译为与语义网络的数据模型一致的SQL查询。在本例中,最好将该调用解析为:
1.对KDM中的所有语义域条目,调用相应的KBS对文档进行分类。
2.将返回的类别映射到语义网络中的类别对象(通过比较URL)。
3.通过使用People.Research.All智能体的查询作为子查询,调用查询。
在本例中,最终查询为:
SELECT*FROM USERS WHERE DEPARTMENT LIKE“RESEARCH”AND OBJECTID IN(SELECT OBJECTID FROMSEMANTICLINKS WHERE OBJECTTYPEID=32 ANDPREDICATETYPEID=98 AND SUBJECTID IN(SELECTOBJECTID AS SUBJECTID FROM CATEGORIES WHEREOBJECTID IN(34,56,78))AND LINKSCORE>90)
该查询假设用户对象类型的对象类型ID为32,PREDICATETYPEID_EXPERTON的谓词类型ID值为98,文档属于对象ID为34,56和78的类别,语义链接分值的阈值为90。
              e.服务器端语义查询处理器
服务器端语义查询处理器(SQP)响应KIS的客户机的语义查询。SQP最好为KIS(或代理)上的语义网络的主入口点。通过代理的XML Web服务暴露SQP。SQP利用语义链接过滤器(见下文)处理直接智能体语义查询和普通(客户机生成的)语义查询。对于带有服务器端智能体过滤器的查询,信息智能体将智能体名称和对象索引参数传递给要调用的SQP。例如,浏览器可能请求智能体Documents.Technology.Wireless.All上的对象0-24。在本例中,SQP查找智能体表中的智能体查询,然后在存储语义元数据仓库(SMS)的数据库上调用该查询。最好以SQL或诸如XQuery或XQL之类的其他公知查询格式存储智能体查询。SQP可以将查询格式转换为数据库(存储所有数据表)理解的格式。因为大部分商用数据库理解SQL,所以最好采用该格式作为默认的智能体查询格式。
智能体查询最好遵循上述查询规则。因此,查询返回对象ID而非智能体的对象类型的模式字段。在上述示例中,Documents.Technology.Wireless.All调用智能体查询“SELECTOBJECTID FROM DOCUMENTS WHERE…”。SQP负责发出用智能体查询过滤过的查询,但是智能体查询返回对象类型的实际元数据(此时,“文档”对象类型)。在本例中,查询为:
SELECT*FROM DOCUMENTS WHERE OBJECTID IN(SELECT OBJECTID FROM DOCUMENTS WHERE…)
该查询返回其对象ID与原始智能体查询中的对象ID匹配的所有对象的“文档”模式的数据列。SQP审查数据库查询的元数据结果,通过使用智能体的对象类型的适当模式(此时,“文档”),将其翻译为合式XML。如果数据库支持原始XML检索,则SQP通过要求数据库提供XML结果对查询进行优化。从而导致更好的性能,因为SQP无需执行额外的翻译步骤。SQP经由代理的XML Web服务将XML回传给调用程序。
SQP最好能够处理语义浏览器(或XML Web服务的其他客户机)传递的更复杂的查询。例如,此类查询可以采取以下XML Web服务API的形式:
String
InvokeSemanticQuery(
      Integer    BeginIndex,
      Integer    EndIndex,
      String     AgentName,
      Integer    NumberOfLinks,
      String     OperatorNames[],
      String     LinkPredicateNames[],
      String     LinkTypeNames[]
      String     LinkObjects[]);
在本例中,符号“[]”指数组。该API采用基于零的开始索引,基于零的结束索引,可选的智能体名称,表示语义链接数的整数,运算符名称数组,链接谓词名称数组,链接类型名称数组,以及指向链接对象的字符串数组。如果智能体名称为NULL(“”),则SQP“按原样”处理查询;没有预想的智能体过滤器。相当于查询是完全由客户机生成的。数组是变长数组,因为参数NumberOfLinks表示每个数组的大小。运算符名称包括有效的预定运算符,包括逻辑运算符,用于限定限定SQL或其他查询格式的查询。例子包括term:or和term:and。链接谓词名称可以包括一个或多个预定谓词(如,term:relevantto,term:reportsto,term:sentto,term:annotates,term:annotatedby,term:withcontext等)。链接类型名称表示链接对象的类型。常见示例包括term:url和term:object。关于term:url,链接对象字符串系指包含objects://…或Agent://…的合式URL。关于term:object,参数为指向本发明定义的对象的合式XML元数据指令。最好从客户机或从另一个代理那里解析该对象。该API返回包含XML结果的字符串(除XML Web服务方法调用本身的返回值之外)。
例如,对带有以下数据的SQML,
<resource type=“term:url”
         Agent://all.criticalpriority.all@abc.com/Agency.asp>
<link    predicate=“term:relevantto”
         type=“term,:object”
         object://4576>
</link>
<link    operator=“or”
         predicate=“term:intersects”
         type=“term:url”
         Agent://email.wireless.all@abc.com/Agency.asp>
</link>
</resource>
在位于abc.com/Agency.asp上的Web服务上的代理上,解析为:
InvokeSemanticQuery(
0,
24,
“all.criticalpriority.all”,
2,
{“term:and”,“term:or”},
{“term:relevantto”,“term:intersects”},
{“term:object”,“term:url”},
{                                                 “object://4576”,“Agent://email.wireless.all@abc.com/Agency.asp”});
最好将其解析为SQL查询:
SELECT TOP 25*OBJECTS WHERE OBJECTID IN(SELECTOBJECTID FROM OBJECTS WHERECREATIONDATETIME=’02/26/02’AND(OBJECTID[RELATEDTO][OBJECT WITH ID 4576])AND OBJECTID IN(SELECT OBJECTSFROM EMAIL WHERE CATEGORY[IS]‘WIRELESS’)
该SQL示例使用简写说明SQP生成的查询类型。SQP检索XML,然后返回给调用程序。XML采取SRML(语义结果标注语言)的形式,为本发明的最佳实施方式中的语义查询结果的XML原模式定义。附录中的示例A为示例SRML语义结果缓冲器或文档。本例为代理响应语义查询返回的XML示例。客户机外壳取得上述结果,根据外壳和智能体(对象外壳/语境外壳/混合器外壳)的属性,可用显示区域,禁用考虑以及其他外壳属性,生成表示形式(使用XSLT和/或script)。
                  f.自然语言分析程序
自然语言分析程序(NLP)最好将自然语言文本转换为SQP理解的API调用或数据库能够处理的原始SQL(或类似查询格式)。直接从语义浏览器,或经由电子邮件知识智能体(见下文)由电子邮件,向自然语言分析程序传递文本。
                 g.电子邮件知识智能体
KIS最好包括一个基本发布组件,称为电子邮件知识智能体(或企业信息智能体(EIA))。本质上,该智能体起数字雇员的作用,并且最好包括一个唯一电子邮件地址(如代理管理员选择的自定义名称)。电子邮件知识智能体通过添加发布信息和共享知识的“点火遗忘(Fireand Forget)”方法,补充诸如Microsoft Office、SharePoint之类的现有发布工具。当人们发布并不知道谁会对其感兴趣的信息时,该智能体特别有用。
在本发明的最佳实施方式中,用户向电子邮件知识智能体发送电子邮件,以发布注解,注释,文档,附件等。电子邮件知识智能体从电子邮件中抽取含义,然后将其添加到语义网络中。通过诸如拖放和灵巧镜头(以下说明)之类的其他平台表示工具的智能体,其他用户能够访问发布的信息。
电子邮件知识智能体为代理管理员创建的系统组件。在首次安装服务器时,指定系统用户名。系统用户最好相当于企业电子邮件系统(如Microsoft Exchange,Lotus Notes)中的电子邮件用户。在本实施方式中,电子邮件智能体有其特有的邮箱,日历,地址薄等。后者又相当于系统用户的电子邮件服务器上的对象。在安装服务器时,KIS安装系统收件箱的适当DSA(取决于电子邮件应用程序)。KIS最好在SDG中自动添加一个收集器列表条目,表示将周期搜索系统收件箱查找电子邮件。
因为电子邮件知识智能体为第一类电子邮件地址,所以它还充当通知源和查询源(用于自然语言和即时消息)。最好利用电子邮件知识智能体发送代理的通知(表示有用户感兴趣的新的有关信息)。电子邮件知识智能体可以接收用户的电子邮件作为自然语言查询。由SQP对这些消息进行语法分析和处理。最好将XML结果发送给用户,作为利用XSLT处理自然语言查询的XML结果生成的HTML文件(带有适当的默认外壳)。
因为电子邮件知识智能体为常见组件或“雇员”,所以代理管理员最好将该地址添加到分发列表中。上述步骤允许SDG从语义上编排分发列表中所有电子邮件的索引,从而通过将电子邮件知识智能体无缝地集成到对用户有用的分发列表中,填充语义网络。这绝对是一种将本发明的数字信息神经系统与组织内的人员的工作方式无缝集成起来的最好方式。
注释。最好使用电子邮件知识智能体发布注释。在本发明中,注释最好为电子邮件信息。在最佳实施方式中,注释对象类型为电子邮件对象类型的子类。因此用户能够使用电子邮件(通常为最常见的发布工具)给语义浏览器内的对象作注解。用户能够给对象作注解,并向注释添加附件。KIS上的SDG从语义上编排附件的索引。由此创建可能存在的情景,例如,用户能够从文档导航到注释,导航到其文档附件,导航到有关路透社的报道文章,导航到下星期开始的行业活动。
从语义上编排电子邮件的索引的过程(通过将电子邮件XML模式映射到语义网络)同样适用于注释。然而,对于本发明之最佳实施方式中的注释,还需要附加处理。特别地,当用户单击语义浏览器(以下说明)的演示窗口中的对象上的“注释”时,浏览器将注册的电子邮件客户程序(如Microsoft Outlook,Microsoft Outlook Express等)加载到本地机上。利用存储该对象的代理的系统用户的地址,填充“收件人”字段,利用特殊字符串,如“annotation:object=[objectid]”填充主题字段。当电子邮件到达电子邮件知识智能体的收件箱时,电子邮件收件箱的DSA获得电子邮件(如通过服务器事件)。SDG通过接收事件,从DSA中检索新电子邮件的XML元数据,或者在下次向DSA请求更多数据时从DSA中检索。在最佳实施方式中,轮询处理经常发生。DSA返回电子邮件对象的XML元数据,完全忘了该电子邮件对象引用电子邮件对象类型或注释对象类型这一事实。SDG处理电子邮件XML元数据,检查“主题”字段。当SDG“看到”前缀“annotation:”,它知道该电子邮件实际上为注释,并从主题文本中抽取对象ID参数。SDG更新剩余电子邮件信息的语义网络(将每条信息添加到OBJECTS和EMAIL表中,添加“发件人”、“收件人”、“抄送”、“密件抄送”和“附件”字段的语义链接,如果必要的话)。在最佳实施方式中,SDG执行额外步骤。特别地,它添加语义链接条目,把电子邮件对象和主题文本中的对象ID参数标识的对象链接起来(带有谓词PREDICATETYPEID_ANNOTATES)。
就本发明而言,把注释看作是带有谓词的另一个语义链接。因此,所有语义特征都适用于注释,如经由语义链接,语义查询的语义导航。例如,用户可以查询最近六个月内小组成员书写的所有注释。例如,通过将智能体Annotations.All拖放到智能体People.MyTeam.All上并存储结果,或者通过创建一个灵巧智能体,而该智能体又调用“创建灵巧智能体”向导创建查询,在语义浏览器中实现上述处理。
                  h.知识领域管理器
知识领域管理器为KIS的组件,负责添加和维护语义网络上特定领域的智能。本质上,KDM利用领域智能“注解”语义网络。利用与知识库服务器(KBS)的一个或多个实例关联的URL初始化KDM,KBS有效存储一个或多个语义域的“知识”。KBS具有与其支持的各语义域的分类法相对应的本体分类和类别。另外,带有语义域(与KBS相连)的智能体响应语义查询。如果智能体不属于某个语义域,则它不代表语义查询(需要本题分类或分类法)。相反,它只响应基于关键字的查询(即使它仍然提供语境和时间制约的检索服务,但是可用语境的有限的)。
KDM中的每个条目均是一个语义域条目。语义域条目具有KBS的URL和语义域名称。语义域名称映射到KBS上的特定本体分类。在本发明的最佳实施方式中,语义域名称遵循以下约定:
<顶级域名>\<二级域名>……
语义域名称的例子包括:
●Industries
●Industries\Pharmaceuticals\LifeScienees
●Industries\InformationTechnology
●General\Sports.Basketball\NBA
●General\Sports.Basketball\CBA
作为选择,可以将语义域名称称为“域路径”,只要它们是完全限定的。通过在路径的开始添加因特网域名前缀,实现完全限定。前缀表示语义域的“拥有者”或“源”。例如,“Nervana.NET\Industries\Pharmaceuticals”系指与因特网域名“NERVANA.NET”相应的语义域“Industries\Pharmaceuticals”。在另一个例子中,“Reuters.com\Sports\Basketball”系指“Reuters.com”上的“Sports\Basketball”。通过使用该方法,在全球范围内保持域名和路径的唯一性。
知识领域管理器(KDM)周期请求知识领域内的各个类别的域条目列表内的各KBS。最好将KDM实现为KIS上的XML Web服务。KDM包括各语义域条目的配置选项。这些选项中的一个选项包括:KDM利用与语义域条目相应的特定领域智能更新语义网络的日程安排。例如,代理管理员可(经由KIS)将KDM配置为:在每天的下午1点搜索KBS上的语义域。更新日程安排应与管理员认为的KBS上的本体分类或分类的变更频率一致。
KIS最好周期调用KDM,并要求它更新CATEGORIES表。在最佳实施方式中,KDM调用KBS(经由XML Web服务API调用),以获得语义域条目中语义域名称的更新类别,后者相当于特定分类。以下为API调用的一个例子:GetCategoriesForSemanticDomain(String SemanticDomainName)。KBS返回该语义域名称引用的语义域中所有类别的基于XML的列表。该XML列表与以上说明的CATEGORIES模式一致(类别URL,名称,说明,KBS URL和语义域名称)。KDM利用该信息更新CATEGORIES表。对于表中已经存在的类别条目,KDM更新名称和说明。对于新条目,KDM向对象管理器请求新的对象ID,然后分配给该类别条目。在最佳实施方式中,由于类别为“对象”,所以它是从对象(Object)类型继承的,因此有对象ID。
通过在检查类别条目的URL后删除未在新列表中出现的CATEGORIES表中的条目,并获得有关的KBS URL和语义域名称,KDM把CATEGORIES表同步为KBS(特定语义域)上的CATEGORIES列表。如果从KIS中删除某个语义域条目,则KDM删除带有相应语义域名称和KBS URL的所有类别条目。本质上,类似于使代理摆脱现有知识。
KDM基于其语义域条目,周期对语义网络中的所有“知识对象”进行分类。当SDG向语义网络中添加新对象时,SDG请求KDM对该对象进行分类。KDM列举其语义域条目内的所有KBS实例,利用对象的XML作为参数,调用XML Web服务调用。在最佳实施方式中,KBS返回XML缓冲器中的结果,类似于:
<results>
<result categoryurl=“category://foo”
score=“91”>
<result categoryurl=“category://bar”
score=“93”>
<result categoryurl=“category://foobar”
score=“100”>
</results>
该信息表示KBS上的语义域内的所有类别的XML对象的语义分类权重。在本发明的最佳实施方式中,利用阈值(0-100)初始化语义域条目,阈值表示KDM应请求KBS的最小权重。KBS返回超过预定阈值的分值。KDM基于其分类结果给语义网络作注解。通过利用该结果中的类别的对象ID添加或更新谓词类型ID为“belongs tocategory”的语义链接,实现上述处理。KDM将更新SEMANTICLINKS表。例如,假设要分类的对象的对象ID值为56,则更新查询为:
UPDATE SEMANTICLINKS SET LINKSCORE=91 WHEREOBJECTID=56 AND PREDICATETYPEID=67 AND SUBJECTIDIN(SELECT OBJECTID AS SUBJECTID FROM CATEGORIESWHERE URL LIKE“CATEGORY://FOO”)
KDM周期扫描所有“知识对象”(文档,新闻报道文章,事件,电子邮件等,最好不包括诸如人员之类的对象),并进行分类。该过程最好出现,即使先前已将语义网络中的某个对象分类为可能已经变得“更灵巧”的KBS,并因此提供更高级的分类。此时,结果不能改变,即使相同分类请求是重复的。例如,如果KBS上的本体分类已更新,将出现以上情况。因此,在最佳实施方式中,当语义数据收集器向语义网络中添加对象时进行分类处理,并且定期进行分类处理,以确保语义网络具有最新的领域知识。
                       i.其他组件
收藏夹智能体管理器。在支持用户状态的代理上,收藏夹智能体管理器管理每个用户的收藏夹智能体列表。在最佳实施方式中,收藏夹智能体管理器在UserFavoriteAgents表中存储用户名到收藏夹智能体的映射。
复合智能体管理器。复合智能体管理器管理复合智能体的创建,删除和更新。如上所述,复合智能体是由系统中的其他智能体组成的智能体,对复合智能体进行初始化以返回所包含智能体的查询结果的并集或交集。复合智能体管理器管理系统中的所有复合智能体,并通过CompoundAgentMap表,将复合智能体映射到它们所包含的智能体。
复合智能体管理器暴露所有功能,以创建复合智能体,删除/重命名智能体,向其添加智能体或删除其中的智能体,以及需要并集或交集运算。可以将复合智能体添加到其他复合智能体中。调用时,语义查询处理器向复合智能体管理器请求复合查询。复合智能体管理器导航通过其智能体映射图,返回它包含的所有智能体的所有查询的复合查询。如果智能体已删除,则复合智能体“拾取”调用时的新状态,忽略智能体查询。换句话说,只组合仍然存在的智能体的查询。如果复合智能体观察到其某个智能体已被删除,则它将从映射中删除该条目。
用户配置文件管理器。用户配置文件管理器(UPM)最好使用推理机以行动为基础推测用户的配置文件。UPM基于用户对其明确首选项的反馈,给语义网络作注解。在最佳实施方式中,该过程包括使用谓词PREDICATEID_ISINTERESTEDIN。UPM推测语义链接,并利用谓词PREDICATEID_ISLIKELYTOBEINTERESTEDIN给语义网络作注解。利用对PREDICATEID_ISLIKELYTOBEINTERESTEDIN谓词的语义网络的查询,限定该用户的所有查询结果。查询结果是基于用户习惯的,因为推理机会随时间推移获知用户的习惯。
作为选择,可以利用用户状态仓库(USS)中存储的用户配置文件信息配置UPM。该信息为在客户机手工输入的表示用户首选项的信息。将该信息传送到与用户交互的服务器,并进行保存。首选项依赖不同模式。例如,对于文档,该模式可能基于首选类别。对于电子邮件信息,该模式可能基于首选类别,作者或附件。这只是多个示例中的两个例子。UPS基于在USS中手工输入的信息,给语义网络作注解。
服务器通知管理器。服务器通知管理器(SNM)负责对服务器端的通知进行批处理,然后将其转发给用户。在最佳实施方式中,用户登记智能体级的服务器端通知。每个智能体均能够触发其查询结果的通知。服务器通知管理器确定过滤查询结果的方法,并对其进行格式化,以便通过电子邮件,语音,寻呼机或任何其他通知机制,如Microsoft.NET警报通知服务,传送查询结果。服务器通知管理器维护有关用户“读取”通知的最后时间方面的信息。最好经由用户界面从客户机中指示该信息。对特定用户而言,只有自上次“读取”时间以来智能体上有新信息时,SNM才通知用户。
智能体发现。通过使用基于多点传送的智能体发现,每个代理发送表示其在本地多点传送网络上出现的多点传送通知。代理管理员设置多点传送TTL。本发明最好使用带有公知端口9875并且其TTL为255的会话通知协议(SAP),或带有自定义TTL的专有通知端口。有关SAP的详细信息,请参见http://sunsite.cnlab-switch.ch/ftp/doc/standard/rfc/29xx/2974,本文引用该信息作为参考。
信息智能体最好包括接收SAP通知的监听组件。在最佳实施方式中,以XML的方式发送通知,并包括以下信息
●服务器ID(为唯一标识符)
●服务器URL(为代理的XML Web服务的HTTP URL)
●通知周期(T)—表示通知之间的时间
●自上个通知和上个智能体创建时间(基于代理的时钟)以来,代理中是否有新智能体
各代理发送XML通知,并使用前向纠错(FEC)或前向除错对数据包进行编码。从而系统不会丢失数据包。作为选择,可以将代理配置成以连续方式多次发送XML通知(每通知)。
信息智能体多点传送监听装置向语义环境管理器暴露目录之类的语义。监听装置聚集从中接收通知的代理的所有XML通知。同时高速缓冲最后从代理那里接收通知的时间。监听装置标记它认为不活动的的代理。如果在经过该代理的通知周期后未听到该代理,则进行以上处理。可以配置监听装置,以便在标记不活动代理前等待几个周期。从而能够处理丢失通知(如由于通信拥塞)的情况。每当监听装置收到通知时,总会更新语义环境管理器中的代理列表。
语义环境管理器定期询问监听装置是否有新智能体。语义环境管理器检查代理列表,询问各活动代理是否有新智能体。语义环境管理器利用本地保存的该代理的最后一个智能体的创建时间,以及基于该代理之时钟的当前时间,限定该请求。代理回答并发送最后一个智能体的创建时间的新值。语义环境管理器在代理条目中高速缓冲该值。如果有新智能体,则浏览器借助对话框通知用户,并询问用户是否希望查看新智能体。
本发明还支持使用对等智能体发现的代理通知。在该模型中,或者将通知发送到所有客户机都会检查的目录服务器,或者通过标准对等发布协议直接发送给客户机。
图47-53为典型屏幕快照。表示KIS管理的智能体的各个方面。图47-50表示示例KIS代理管理器,说明服务器端智能体视图和服务器端智能体。图51进一步表示示例管理用户界面组件,用于管理SDG(搜索)任务,系统任务(如推理机),系统智能体电子邮件(如收件箱),日历和联系人DSA以及所有SMS数据表(对象,语义链接,类别等)。图52表示KIS代理管理器中本发明的“服务器属性”对话框示例。该对话框表示服务器管理员设置服务器属性的方法,服务器属性如服务器名,显示名称,SMS数据仓库属性,KDM属性(如知识领域路径)以及用户DSA属性。图53表示最佳实施方式的KIS代理管理器中的“服务器统计数字”对话框示例。该对话框表示显示的统计数字,如服务器端智能体(标准智能体和混合器)的总数,服务器端标准智能体的总数,服务器端混合器的总数,服务器端智能体视图的总数,服务器端智能体预订的总数,服务器上存储的信息对象的总数,语义链接的总数,服务器(代理)上的用户的总数,以及用户组的总数。
3.知识库服务器
知识库服务器(KBS)为存储KIS的知识的服务器。在大部分应用中,会部署KIS的许多实例,但是只会为给定组织部署很少(或一台)KBS。原因在于可以重用KBS(它们是特定领域的,但是是数据独立的)。例如,药品公司可能部署一台用药品本体分类初始化的KBS,但是安装许多KIS;可能每部门或每组一台。KIS最好包括以下组件:
1.与一个或多个语义(知识)域相对应的一个或多个本体分类。语义域涉及使用语义域名称。该名称系指语义层次结构内的域路径。例子为Industries.Technology,Industries.Pharmaceuticals.LifeSciences和General.Sports.Basketball。如上所述,名称或路径可以是全球唯一限定的(如带有因特网域名)。
2.与支持的语义域相对应的一个或多个分类法。分类法包含类别名的层次结构。
3.分类引擎,该引擎获取要进行分类的一块文本XML以及语义域名称,返回文本或XML所属域中的类别,连同分类分值(范围为0-10,最好为0-100)。
4.暴露API的XML Web服务,以添加新支持的语义域(和相应的本体分类和分类法),列举指定语义域的类别,以及对文本或XML数据块分类。
5.引用其他KBS的XML Web服务,其中该KBS从其他KBS那里获取其知识。在此方式中,该KBS充当代理服务器。可以初始化该KBS,以充当代理服务器,并从其他KBS那里获取其支持的语义域,本体分类以及分类法。
如上所述,KIS(通过KDM)定期向KBS发送XML对象,以便针对指定语义域进行分类。
4.信息智能体(语义浏览器平台)
                        a.概述
在本发明的信息智能体的最佳实施方式中,系统客户机包括提供语义用户体验的语义浏览器组件和用户界面。在最佳实施方式中,信息智能体提供以下高级服务:
●使用户有权通过本地或远程信息智能体检索语境和时间制约语义信息。
●允许用户发现智能体通过本发明的XML Web服务暴露出来的本地和远程代理上的信息。最好将该信息分类为众所周知的语义类,如文档,电子邮件,电子邮件分发列表,人员,事件,多媒体和客户。
●允许用户浏览通过本发明的智能体发现的信息的语义视图。
●允许用户向代理发布信息。
●允许用户把其硬盘,本地网络或特定代理上的信息与在不同代理的智能体上发现的信息动态链接起来。这有助于动态电子链接和用户控制的浏览。
本发明的信息智能体的优势在于,用户打开智能体的方式类似于用户从其文件系统名字空间中打开文档的方式。信息智能体有其打开信息的语义“世界”的特有环境。例如,ABC公司有一个内部KIS代理,后者有用于内部文档,电子邮件等的智能体。另外,第三方在因特网上部署代理,以保存有关行业报告,行业活动方面的信息。在本发明的最佳实施方式中,ABC公司的雇员打开智能体以发现因特网上与其工作有关的信息,以及其语义与ABC公司的内部信息或与ABC公司有关的外部信息关联的信息。
                     b.客户机配置
在最佳实施方式中,系统客户机能够从语义上链接在本地以及在远程代理上发现的信息。最好通过使用由全局代理目录中的代理,局域网上代理(通过多点传送或对等发布系统进行发布)以及使用智能体发现的定制代理目录上的代理组成的暴露语义环境,实现以上处理。首选客户机配置基于具有智能体和本地代理的框架,并且包括语义环境管理器,后者管理本地保存的智能体和收藏夹智能体,本质为历史和收藏夹(比喻)的结合。语义环境管理器使用语义环境内的语义查询文档,以通过语义环境浏览器向用户呈现知识。客户机配置还包括智能体发现信息(如代理列表,代理目录信息等)。
                    c.客户机框架规范
概述。客户机框架规范提供信息智能体用户界面的服务基础设施,定义基本服务和界面,包括核心用户界面组件,以及为信息智能体的用户界面的主积木构件提供可扩展可配置的环境。本节描述根据本发明之最佳实施方式的客户机框架规范。框架核心定义基本服务,配置,首选项和安全机制。核心用户界面组件定义支持服务器和智能体配置,控制和调用,以及语义浏览器框架之某些配置的用户界面服务和模块。以Windows Shell扩展和关联用户界面(以下说明)的方式,实现核心用户界面组件。语义浏览器框架提供基础查询和结果管理服务,以及结果表示的框架。与语义对象表示有关的用户界面的特性最好是可配置的,可扩展的;甚至提供默认的表示支持作为预先安装的“扩展”。最好以当今Web中使用的现有平台(如Internet Explorer)的一组行为扩展的方式,实现语义浏览器框架,该框架影响支持的XML,XSLT,HTML/CSS和DOM功能性。
语境。客户机框架依赖本发明的语义服务组件,包括语义查询支持,语境和时间制约语义处理,以及链接信息等。最好以shell扩展和平台(如Internet Explorer)扩展的方式,构造客户机框架,该框架在现有工具和环境的语境中,为用户提供功能性。例如,可以将信息智能体实现为Shell扩展(该实现方式扩展Windows Shell,使用标准资源管理器视图和用户界面模型)。在选择实施方式中,本发明同样适用于独立语义浏览器应用。
需求。客户机框架的首要需求涉及灵活性和扩展性。从而确保快速适应用户界面,因为存在更多信息对象类型,用户配置文件等。包括的需求为:
●提供对外壳的支持,以管理查询结果的完整集合。
●考虑到各种方法,包括列表,数据表,定时滑块等。
●提供屏幕保护程序(或等价物)模式。
●对能够与对象类关联起来的外壳提供支持。
●确保存在能够处理所有类的默认外壳。
●外壳应像XSLT一样简单,但是应支持脚本,甚至可能支持代码(带有适当安全性限制)。
●支持在结果视图中浏览语义环境(补充智能体树视图),包括智能体(灵巧智能体,哑智能体和特殊智能体),代理和混合器。
●提供组件之间的合式界面,确保所有通信必须通过框架进行。
●提供遍及整个框架的可靠的安全模型。
                      框架核心
语义环境管理器(SEM)。SEM管理智能体,混合器以及用户本机上的代理的创建,删除,更新和浏览。另外,SEM负责监听代理多点传送通知,浏览企业目录上的代理(如通过LDAP),浏览定制目录上的代理,以及浏览全局代理目录上的代理。
SEM包括用于存储该系统上的每个智能体之元数据的存储层,元数据包括所有的智能体属性(如智能体名称,说明,创建时间,最后使用时间),智能体类型(灵巧智能体,哑智能体,特殊智能体),智能体代表的信息对象类型(对于根据信息类型创建的智能体),智能体代表的语境类型(对于特殊智能体或根据语境模板创建的智能体),智能体的属性,代表智能体外壳(包括过滤器/排序首选项和其他表示模式)的XSLT引用或其他脚本文件,通知信息和方法(如果请求智能体的话),以及智能体的SQML查询的缓冲器或文件路径/URL。信息智能体(语义浏览器)可以在本地数据库中,诸如Windows注册表之类的存储结构中,或在本地文件系统上XML文件中,存储上述智能体元数据。
同时,SEM使用智能体属性表示智能体是否为收藏夹智能体。另外,SEM自动删除已不是收藏夹智能体并且超过可配置时间界限(如两周)的智能体。
信息智能体的Shell扩展和其他组件(如工具栏打开智能体对话框)使用SEM提供智能体创建,删除,浏览,更新,以及通过其用户界面管理智能体。
首选项管理器。该组件管理所有客户端首选项,提供坚持首选项的服务,与服务器进行所需通信以共享首选项或支持漫游,以及支持设置与获取其他组件的首选项值。该组件具有关联用户界面以及某些更具体的首选项用户界面组件。首选项被划分为子组件,并且可以抽取关联客户类的首选项。包括:
●核心首选项。包括基本配置,如用户配置文件和个人信息。
●外壳首选项。把首选外壳和对象类,以及首选列表外壳和屏幕保护程序外壳联系起来。可能有附加的与外壳有关的首选项设置。
该组件还管理本地可用的外壳的设置。最好通过该组件管理可下载外壳。
通知管理器。通知提供用来指示用户给定灵巧智能体上有新的可用信息的方法。用户可配置特殊的灵巧智能体,以支持或提供通知(大部分灵巧智能体的默认状态为OFF),也可以配置向用户提供通知的方法。由通知用户界面组件提供通知。
通知管理器负责管理后台,轮询灵巧智能体的适当集合的查询。活动信息管理器是一个类似组件,该组件向结果浏览器提供类似服务。
通知管理器收集有通知标记的灵巧智能体的列表,定期轮询关联服务器获取新信息。“新”的定义是“自上次轮询[或查询]以来”。每当轮询应答时,总是包括通知管理器必须坚持的与智能体关联的时戳指示器。
最好以与智能体树视图协调的方式,实现与配置通知管理器关联的用户界面。从而支持通知(例如,各灵巧智能体的“通知”弹出菜单选项)。通知管理器还支持其他选择,以便有新结果时通知用户。某些选项包括智能体树视图中的智能体的显示风格(如粗体,彩色等),提示对话框,音频通知或更吸引人的操作,如电子邮件,IM或SMS通知。
客户端安全性。客户端安全性问题涉及扩展代码和外壳。外壳最好为XSLT,但是也可以支持脚本。另外,生成的HTML可以包括对ActiveX组件和行为的引用。表示砂箱包括防止外壳通过脚本运行潜在恶意代码的安全性限制。例如,完全不接受任何未签名代码(包括ActiveX和DHTML行为)。
最好对发布界面(外壳)隐藏与代理的所有客户机服务器通信,其中第三方可以自定义发布界面以提供定制外壳。通过隔离主要客户机运行时外部的功能性,能够降低危及安全的风险。
                    核心用户界面组件
智能体树视图。为Shell扩展树视图,支持大量控制和调用智能体的核心用户界面。
语义环境浏览用户界面。提供允许用户浏览语义环境的用户界面。一个例子是“打开智能体”对话框。为智能体树视图的补充,智能体树视图显示名字空间的层次视图(见屏幕快照)。
智能体检查器。提供查看属性或编辑(在用户创建的灵巧智能体情况下)各个智能体,混合器或代理的用户界面。
浏览器主机。最好为语义浏览器核心(如Internet Explorer浏览器运行时)上的“封装器”,能够在智能体树视图中表示智能体,代理和混合器的自定义视图。本身最好没有任何用户界面,只是Shell扩展和浏览器框架之间的桥接组件。该组件负责协调某些浏览器功能性与Windows Shell用户界面,特别包括导航(后退/前进)机制,以便提供无缝“后退/前进”用户体验(其中用户只需处理“后退/前进”历史列表)。
核心首选项UI。提供与语境环境,服务器,角色和智能体管理,以及其他首选项设置有关的首选项的用户界面。最好包括原始属性表对话框,可能根据功能区划分为独立表格。在最佳实施方式中,为选项卡对话框用户界面。
外壳首选项UI。提供与外壳管理有关的首选项的用户界面。最好为属性表对话框。以列表方式提供可用外壳列表,以便选择。该用户界面允许用户设置与默认外壳不同的外壳。最好允许用户将当前外壳设置为默认外壳。对于每个智能体的外壳首选项,最好允许用户选择当前选择的或已经打开的智能体的外壳。
通知UI。最好以与智能体树视图协调的方式,实现与配置通知管理器关联的用户界面。通知管理器还支持其他选择,以便有新结果时通知用户。某些选项包括智能体树视图中的智能体的显示风格(如粗体,彩色等),提示对话框,音频通知或更吸引人的操作,如电子邮件,IM或SMS通知。在最佳实施方式中,用户界面应包括选项卡对话框(或等价物),以允许用户选择上述通知模式(等等)。
屏幕保护程序。用户界面最好提供结果浏览器的特殊模态,作为屏幕保护程序,采用电影院模式的展示填充屏幕。在最佳实施方式中,应使用特殊外壳作为屏幕保护程序模式。上述外壳能够强调占据更大屏幕区域的动态显示,但是也可以使用更大的字体和间隔更大的布局。
                       浏览器框架
结果浏览器。结果浏览器负责显示查询结果,以及打开的本地资源方面的信息。结果浏览器最好从查询管理器获得一个或多个XML文件,然后将其合并为代表对象列表的单一XML文件。作为初始步骤,可以对列表本身进行过滤或分类。利用处理列表的外壳的特殊类(XSLT变换表,可能包括某些脚本)变换作为结构的列表。列表外壳创建基本DHTML(或诸如此类)结构,如列表,表或定时序列。对象外壳管理提供各对象实例之信息的各个DHTML项。列表外壳可以处理各对象外壳的分发(将对象类映射到外壳),但是为简单起见,结果浏览器最好提供对象类到外壳的默认映射。
用户可能更喜欢特定表示形式,并且可能选择默认外壳(用于列表和用于对象类的外壳)。原始查询(即SQML)也可能包含表示使用哪些外壳的参数(特别是列表外壳)。将这些参数连同结果一起传送给结果浏览器。结果浏览器使用外壳管理器工具选择要应用的正确外壳。可以使用不同规则来组合用户首选项和智能体(作者)首选项,区分其优先次序。
如果查询结果是由许多不同XML文件组成的,则结果浏览器必须将其合并为单一XML文档,以提供无缝用户体验。最佳实施方式规定动态处理附加结果。最好通过使用不同模板或XSLT模板内的脚本方法,实现动态更新方式。作为选择,列表外壳可能需要某种行为(或本地运行时组件),以管理在不干扰用户语境的情况下向文档添加对象的逻辑。
查询管理器(或客户端语义查询处理器)。查询管理器负责处理与服务器的通信,请求信息,以及收集XML结构。将由此生成的XML传送给结果浏览器,以向用户显示。
查询管理器最好提供支持灵巧镜头功能性的服务。请求灵巧镜头时,将采用XML格式返回的结果传送给结果浏览器,最好带有标记以指示它们为给定对象的灵巧镜头结果。查询管理器最好包括以下子组件,子组件提供实现查询请求的各种服务。
●SQML解释程序。该组件必须将传送的SQML分解为一组请求,可能带有链接资源。每个请求或资源链接解析为带有关联协议(如HTTP,或诸如outlook:或document:之类的多个本地伪协议中的一个协议)的资源,然后分发给关联协议处理程序。给定的SQML文件可能包括网络和本地资源类型的混合。
●资源处理程序管理器。最好为资源处理程序的中心登记机制。它是把协议以及伪协议和处理程序联系起来的最低层,它简化资源请求的分发。
●资源处理程序。为封装给定“服务器”资源的访问细节的组件。资源处理程序不解析任何链接资源。最好是SQML解释程序的职责(即,SQML解释程序将具有已经解析的链接资源,并提供关联元数据作为该处理程序的部分资源请求)。当资源是语义Web服务时,该组件最好通过http绑定请求,然后发出请求。当资源为本地资源(如document:或Outlook:资源)时,资源处理程序直接处理资源。对于文档,资源处理程序将文档(file:URL)传送到语义抽取,概括和分类引擎,以抽取元数据。对于电子邮件,资源处理程序从交换服务器或本地.PST文件中抽取信息。请注意,当存在本地资源上的链接时,本地资源处理程序必须执行过滤结果的处理,以获得语义关联度。可以定制处理程序以获得高效率,但是一个通用集中关联度引擎将提供大部分服务。
●关联度引擎。提供收集逻辑的场所,以比较对象的关联度。比较最好依赖于有关模式的混合,然而其他方面却是一项简单操作—给定两个对象,提供关联度度量。
过滤器/分类管理器。过滤器/分类管理器支持对提供给结果浏览器的结果列表进行过滤和分类。过滤器/分类管理器控制过滤器/分类首选项组件的服务,以获得当前设置的用户首选项。该组件的主要功能是决定通用首选项,每个智能体的首选项,以及实际结果中定义的任意设置(可能支持也可能不支持)。当用户改变当前应用的过滤器和分类时,过滤器/分类首选项组件通知该组件。由于关联用户界面为与Shell扩展关联的工具栏的一部分(即,其右窗格视图),但是功能应用出现在结果浏览器空间内,所以控制通常是间接的。
镜头方式。调用灵巧镜头时,结果浏览器必须生成用户所选对象的镜头请求(查询)。该查询是异步的,从而用户能够选择各种对象的灵巧镜头查询,查看返回的结果。建议的用户界面为,保留灵巧镜头图标的某些“不动产”。当处于灵巧镜头方式并且用户单击(或悬停在)灵巧镜头图标(上)时,发出查询,此时图标改变以表示正在进行查询。当返回结果时,由结果浏览器和外壳中的专用灵巧镜头模板进行处理,并且对象的灵巧镜头图标改变以表示结果可用。再次单击图标或在图标上悬停将以外壳特有的方式显示灵巧镜头结果(参见示例灵巧镜头窗格用户界面)。如果能够足够快地返回查询,则整个功能就像通过悬停或单击激活的弹出窗口一样。
深层信息视图。如果深层信息在原始结果中不可用,则该组件生成关联查询。该查询最好是异步的。当向结果浏览器返回结果时,通过适当外壳对结果进行处理(使用每个外壳的特殊深层信息模板),将由此生成的HTML并到关联对象内的结果文档中。该模式的主要外壳将深层信息部分插入到该对象的HTML中,从而结果浏览器了解将该结果合并到何处。当深层信息可用时(或者作为原始结果的一部分,或者响应深层信息查询),外壳或者直接显示或者指示存在深层信息,并且某些外壳定义的用户界面允许用户启用显示(如作为弹出窗口)。
语境信息管理器。对于结果浏览器中当前显示的对象,最好在默认情况下提供某些通知。将向用户提供两类新(或附加)信息:
1.自用户发出原始请求以来,添加到服务器的附加结果。对诸如标题或有效电子邮件线索之类的事物特别有用。结果浏览器通过把新对象插入到视图中,处理该结果。
2.用户感兴趣的语境模板和有关信息。通过使用特定对象作为语境,额外查询特定智能体(灵巧智能体,特殊智能体,混合器或代理)生成以上语境模板和有关信息。对该结果的处理类似于对深层信息视图和灵巧镜头方式结果的处理,即处理查询返回的XML,将由此生成的HTML插入到该对象的现有HTML中。外壳控制显示机制和UI。有关信息的一个例子是与对象关联的“突发新闻”。
外壳管理器。维护列表外壳,对象外壳的用户首选项,以及列表和对象外壳之间的从属性(某些对象外壳只对给定列表外壳有意义)。外壳管理器还维护每个外壳的参数,参数表示外壳的约束,如需要的屏幕不动产,或最适合的模态。最好内置大量智能,以帮助结果浏览器选择针对许多屏幕和窗口大小约束,模态,可访问性,语言以及其他约束的外壳。最初版本很可能非常简单。
外壳模板。描述外壳的结构,以及在结果浏览器内应用外壳的方式。外壳最好为XSLT模板,该模板将结果XML转换为XHTML(和/或SVG之类的其他语言)抑或Flash MX和ActionScript之类的专有表示平台。也可以将模板插入到CSS样式之类的样式信息中。鉴于安全原因,由此生成的表示代码(如XHTML)可以限制包含的代码。结果浏览器中的框架代码调用外壳。最佳实施方式包括以下外壳类:
●列表外壳(或布局外壳)。利用列表外壳将查询返回的对象列表转换为某些综合表示结构。可能为简单列表,表,或幻灯片的定时序列。列表外壳不是模式或对象特有的,尽管它们只支持某些外壳,但是可以在关联表示形式定义的约束内起作用。例如,定义数据表布局的列表外壳可以需要能够在小正方形内展现信息的对象外壳。
●对象外壳。对象外壳为模式特有的,生成给定信息对象类(或信息类)的各个对象的表示。它能够定义通用超类(或任何其他超类)的外壳,充当各种派生类或子类(可能通过省略某些细节)的默认外壳。
●语境外壳。语境外壳依靠特定语境模板,生成能够有效表达模板指示的语境的表示。
●混合器外壳。混合器外壳的目的是显示混合器的结果。此类外壳允许用户通过混合器内包含的智能体,通过信息对象类型,或通过显示所有结果好像它们来自同一数据源一样的合并视图,查看结果。
外壳最好通过处理约束(作为参数静态传送或利用浏览器核心本身内的事件动态传送约束),建立诸如模态和表示显示区域之类的约束的模型。最好通过强制列表外壳指定可接受的对象外壳,实现上述处理。在选择方法中,可以针对给定列表外壳设计对象外壳,结果浏览器/外壳管理器选择当前列表外壳的对象外壳。
列表外壳细节。用户可以选择当前视图的单一列表外壳,并作为默认设置。可以把列表外壳与各智能体关联起来,此时通用默认设置是重载。结果浏览器调用列表外壳处理结果列表,尽管列表外壳实际上并不处理各个对象。它在框架表示中创建某些总对象(per-object)实例(如序列中的定时项,表中的单元格,或列表中的项目),然后对象外壳填充细节。
对象外壳细节。对象外壳将特定模式转换为XHTML。通过在查询结果XML上调用结果浏览器的关联模板(通过DOM),然后通过DOM接口将生成的XHTML插入到结果文档中,支持诸如深层信息和语境模板信息之类的事物的异步查询结果。对象外壳内最好有若干单独模板,包括:
●主要模式模板。为生成XHTML的主要部分,用于默认显示。必须创建深层信息,灵巧镜头信息,语境模板信息内容的封装器,以及供用户控制关联显示的脚本。
●深层信息模板。该模板处理深层信息的元信息。可以为原始结果内的内插深层信息调用该模板,或调用该模板处理异步请求深层信息。无论何种方式,最好都生成某种形式的XHTML,并在深层信息的封装器下插入。插入可能出现在内插深层信息的XSLT中,并且通过深层信息查询结果的DOM插入实现插入。
●语境信息模板。该模板处理语境信息查询结果的结果信息。它生成某种形式的XHTML,在活动信息的封装器下进行插入。通过深层信息查询结果的DOM插入实现插入。
●灵巧镜头信息模板。该模板处理灵巧镜头查询结果的结果信息。它生成某种形式的XHTML,在活动信息的封装器下进行插入。通过深层信息查询结果的DOM插入实现插入。
在最佳实施方式中,模板不能修改XHTML的其他内容(即使对于同一对象),因此需要结果浏览器协调用户界面变更,用户界面变更指示深层信息、活动信息或灵巧镜头结果何时可用。该框架需要使用某些图标(还用于一致性),用于具有正式名称或组件类型的对象,从而结果浏览器能够在需要时查找并修改它们。另外,结果浏览器可以创建事件,并发起事件以指示状态改变。模板生成的脚本可以响应这些事件,并显示关联信息。
默认外壳。在最佳实施方式中,提供一组默认外壳。最好包括基础对象类的外壳,以及允许多种查询结果视图的列表外壳的小集合。首选列表外壳包括:
●详细列表显示(类似Windows资源管理器详细资料视图)
●表格图标视图(类似Windows资源管理器图标视图,但更丰富)
●定时表示视图。
                     e.客户机框架
在最佳实施方式中,系统客户机包括Shell扩展,演示程序,以及演示程序用来显示带有语境和含义的信息的外壳。
Shell扩展。资源管理器Shell扩展为利用定制代码扩展WindowsShell的Microsoft Windows软件组件。Shell扩展允许语义查询使用Shell作为定制客户机,并提供以下服务:清楚地集成桌面,文件系统,Internet Explorer等。默认shell扩展的例子包括“我的文档”,“我的电脑”,“我的网络位置”,“回收站”和“Internet Explorer”。
在本发明的最佳实施方式中使用Shell扩展具有以下优点:
1.它以非常清楚的方式提供用户体验,与知识工人当前浏览信息的方式无缝集成。反过来,能够避免开发专有客户机,提供与MicrosoftInternet Explorer,“我的文档”等的非标准集成。
2.它包含当今的Web,它提供将当今Web中的内容移植到本发明的信息神经系统的移植路径。例如,用户更喜欢将文档从其硬盘(经由Microsoft资源管理器)或从因特网(经由Internet Explorer)拖放到本发明的Shell扩展的远程智能体上。对专有客户机而言,不仅困难,而且也不直观。然而,本发明设想到专有客户机的可移植性,或者到非Windows操作系统和非个人计算设备之操作系统上的Shell扩展的等价物的可移植性。
本发明的Shell扩展提供用户的语义环境的视图(如历史,收藏夹和其他视图)。在最佳实施方式中,Shell扩展规定:
1.允许用户在语义浏览器的语义环境上打开智能体,文档,文件夹或地址。对于智能体,客户机显示定制的“打开智能体”对话框,后者允许用户浏览语义浏览器的语义环境。最好包括用户的我的智能体列表中的智能体,全局代理目录上的代理,局域网上的代理(经由多点传送宣布),以及用户配置的定制代理目录上的代理。[INSERTRELEVANT SCREEN SHOTS ON UI]打开显示智能体的查询结果的客户机中的智能体结果。打开文档会打开与文档对象类型之模式一致的文档的XML元数据。打开文件夹会打开文件系统文件夹的XML元数据。用户能够通过文件夹本身打开文件夹的目录或深层目录。打开地址允许用户输入需要由客户机框架打开的地址。包括URL(打开文档的XML元数据),文件系统上的文档,代理或对象(参见下文中的“URL命名约定”)。关于智能体,输入智能体URL的方式为:Agent://<智能体名称>@<代理名称>.<域名>。类似于HTTP URL的命名约定http://<URL>。此时,前缀Agent://是必需的,因为打开地址选项可打开任意地址。关于“打开智能体”选项,用户无需添加前缀;客户机框架自动规范化URL以包含前缀。类似于用户在当今的浏览器中输入不带限定前缀http://的www.foo.com。
期待客户机允许用户打开其他对象,如Microsoft Outlook.PST文件。
2.允许用户浏览,预订,取消预订支持用户状态的给定代理上的智能体。
3.允许用户将调用的智能体或语义查询结果保存到我的智能体列表中。
4.允许用户创建混合器,向混合器中添加智能体或从混合器中删除智能体(包括通过拖放)。
5.自上次检查以来,当任意代理目录(例如,全局代理目录,本地多点传送网络或任何定制代理目录)上有新代理时,通知用户。
6.自上次检查以来,当任意特定代理上有新智能体时,通知用户。
7.对语义环境中的对象的关系语义查询,提供拖放访问。Shell扩展允许用户把语义环境(或本地驱动器,网上邻居,内联网,或因特网)上的文档,拖放到智能体代表的shell文件夹上。从而触发对给定代理的XML Web服务的远程过程调用,其中文档元数据作为参数。
8.对复制到系统剪贴板上的对象提供“粘贴”访问。本发明使用系统剪贴板,允许用户复制任意对象以便随后访问。另外,剪贴板允许用户从其他应用程序中复制对象,如Microsoft Office应用程序(如Outlook中的电子邮件),从多媒体应用程序中复制对象,并且从任何应用程序中复制数据。
9.允许用户选择某个智能体作为灵巧镜头。灵巧镜头允许用户基于智能体或能够复制到系统剪贴板上的任意对象的语境,查看结果视图中的对象。例如,通常,如果文档对象在结果视图中并且用户将鼠标悬停到表示该对象的链接上,则显示对象元数据。然而,如果选择灵巧镜头(如通过将其粘贴到结果表格上),并且用户将鼠标悬停到该对象上,则显示与灵巧镜头中的对象以及光标下面的对象有关的信息。例如,如果用户把“People.Research.All”复制到剪贴板上并粘贴为灵巧镜头,则当把鼠标悬停到文档上时,将按以下方式在气球弹出框中显示元数据:“在People.Research.All中找到15名该文档方面的专家(Found 15 people in People.Research.All that are experts on thisdocument)”。其他例子为“找到3名可能写作该文档的人员(Found 3people that might have written this document)”和“找到78封与People.Research.All中的人员张贴的对象有关的电子邮件(Found 78email messages relating to this object posted by people inPeople.Research.All)”。用户决定是否调用气球弹出框中的元数据的任何链接。在选择实施方式中,可以利用工具条显示弹出框,而不需要气球。当把灵巧镜头粘贴到剪贴板上时,Shell扩展最好与系统进行通信,并改变鼠标光标以反映所选智能体的名称。灵巧镜头最好具有全局作用域,因为它是从剪贴板上复制的。换句话说,Windows资源管理器和Internet Explorer的所有实例均能“看到”灵巧镜头,并响应其操作。在最佳实施方式中,信息智能体工具栏中有灵巧镜头工具,该工具应用于剪贴板上的对象(如智能体或其他对象)。在默认情况下,当在该系统中单击链接时,可取消选择灵巧镜头工具。用户最好能够“钉住”灵巧镜头。当钉住灵巧镜头时,灵巧镜头保持活动直至用户明确取消选择灵巧镜头。在最佳实施方式中,要钉住灵巧镜头,用户需要选择工具栏上的“粘贴为灵巧镜头并钉住”工具。
10.允许用户从Shell扩展中“按虚线剪切”智能体的结果,然后在桌面上的停泊视图中进行显示。在该视图中,智能体结果浏览窗口充当语义收录器。该功能允许用户在继续做其他工作时连续显示语义信息。
11.允许用户将智能体作为屏幕保护程序。
12.允许用户浏览并调用全局代理目录上的可用外壳。
演示程序。演示程序为一组本地组件(如浏览器插件),该组组件从脚本(或其他插件)中取出语义查询,然后传送给KIS代理XML Web服务。本发明翻译语义查询的结果,将XML传送到其他行为或脚本以便最终向用户展示。
在最佳实施方式中,Shell扩展利用SQML文件作参数调用演示程序。系统最好直接与XML Web服务通信。系统解析SQML文件并进行调用,以打开本地或远程信息源中的XML信息(通过SQML文件涉及的代理上的XML Web服务)。作为选择,如果将智能体URL传送给系统,则演示程序通过调用存储该智能体的代理的XML Web服务,直接打开URL。在最佳实施方式中,系统调用带有适当语义对象类型的适当方法。默认语义对象类型的例子为SEMANTICOBJECTYPEID_EVENT,SEMANTICOBJECTTYPEID_EMAILMESSAGE等,在头文件(semanticruntime.h)中进行定义。最佳实施方式允许通过RegisterSemanticObjectType API注册新的语义对象类型。代理上的语义查询处理器返回使用语义对象类型作为过滤器的适当XML结果。
在最佳实施方式中,根据本发明的外壳(见下文)使用XSLT(和/或脚本)将框架返回的XML(途经XML Web服务)转换为DHTML。Shell扩展允许用户为当前的查询选择新外壳。
外壳最好为对象类型特有的,语境模板特有的(用于特殊智能体)或混合器特有的(用户混合器)。可以根据语义域名称/路径或智能体的本体分类,并根据诸如用户的角色,条件,位置之类的其他属性,定制外壳。利用默认外壳配置代理上的各个智能体。本发明进一步设想可发布到根代理(如,全局代理目录上的代理)上的定制外壳。客户最好从公告智能体的代理上或从中心服务器(如全局代理目录)上下载外壳,然后应用于当前表示。作为选择,客户机包括用户首选项,以忽略智能体外壳或将其限制在部分用户界面内。
在最佳实施方式中,除外壳类型(如对象外壳,列表/布局外壳,语境外壳,混合器外壳等)之外,可以按以下方式对外壳分类:
●设计模板外壳
●颜色模板外壳
●动画模板外壳
语义外壳最好是交互的,除非作为“按虚线剪切(见上)”的一部分或屏幕保护程序的方式显示语义外壳时。每个外壳均允许用户定位到“语义表示”内的特定位置。例如,如果外壳最初只显示前25项,则外壳必须有查找条(或其他用户界面机制),以允许用户定位到下25项,快进,反绕等。某些外壳具有“实时方式”选项。在该方式中,外壳从XML Web服务中连续提取新对象(通过弹出)。外壳负责根据所需对象的模式轮询XML Web服务,获取新信息。在最佳实施方式中,不通知客户机,因为鉴于伸缩性,代理不维护任何客户机特有状态。
作为选择,外壳可包含实时方式。这些外壳必须是智能的,因为它们必须基于优先级轮转(即,提交,订制或突出显示)对象。例如,如果演示程序重放用于指示代理上张贴了新对象的信息,则外壳立即显示/记录/突出显示该信息,并继续展示剩余对象。演示程序确定排序,外壳处理不同分类和过滤器设置下的动态性。从而使人感觉到语义表示是实时发生的。在最佳实施方式中,当存在允许用户利用外壳进行访问的新数据时,出现上述情况。如果列表是按时间分类的,则实时表示会使用户感到迷惑,因为用户界面跳到交互模式。某些模式(如屏幕保护程序模式)中的用户首选项自动复位外壳,以显示新数据(如,当在列表顶部插入新数据时,滚动到分类列表的顶部)。
在选择实施方式中,将外壳设计为根据可用显示窗口的数量定制其显示。例如,当显示窗口较小时,通过通过使用淡入淡出显示信息,外壳可以从静态模式变为动态模式。外壳最好为依赖预期用户交互级别的模态。例如,屏幕保护程序与浏览器的工作方式不同;同样,停泊视图也不同(不仅因为它较小,而且因为假定它是背景视图而不是用户交互的焦点)。当最小化或隐藏视图时,可以使用备择方式(特别是为了指示新信息时)。例子是语音通知,类似于提醒的警报,启动条闪烁(类似于outlook提醒)。可使用智能体发送电子邮件,电话或即时消息(IM)通知。在选择实施方式中,本发明设想在网站是进行张贴的智能体(如,用于事件日历的自动HTML内容生成)。
作为选择,外壳可以生成音频视频信息。例如,文本语音外壳能够读出电子邮件对象。该功能对残疾用户,车载计算机用户以及其他用途,有非常大的潜在价值。
在最佳实施方式中,外壳框架暴露以下服务:
1.打开基于SQML的语义查询的方法。可能的本地SQML文档,智能体等。
2.直接打开智能体URL的方法。
3.浏览信息智能体语义环境的方法。
4.与使用自定义剪贴板格式的系统剪贴板进行对接的方法。
5.坚持指定查询或指定语义类ID的当前外壳的方法。
外壳。如上所述,外壳为以每智能体为基础定制用户体验的表示模板。在最佳实施方式中,外壳为中心服务器上存储的XSLT模板和/脚本。根据本发明的外壳最好生成XHTML+TIME代理(例如,对于演示程序显示,文本语音,经由插件的结构矢量图(SVG)等)并访问各种系统服务。在最佳实施方式中,外壳支持以下功能:
1.显示与所显示的对象的XML模式相对应的某些或所有字段。作为选择,外壳为用户提供唯一区分返回集合中的对象的方法,或者为用户提供常规访问方法,如文件名,URL或人名(用于人员)。
2.显示用来指示主代理是否理解该对象的用户界面。各对象最好包括一个指示该信息的“理解(understood)“字段。
3.对于语义对象类型SEMANTICOBJECTTYPE_OBJECT,外壳选择显示原始对象元数据,或显示原始对象代表的特定类的对象的XML模式的元数据。对于用来显示引用原始对象之查询的特定类的XML模式的外壳,外壳必须“灵巧”,以便在不同窗格中显示特定类的信息。实现该处理的最好方式是使用框架,选项卡或其他用户界面技术。由于每个语义查询均指向原始对象,所以外壳或者加载带有过滤器SEMANTICOBJECTTYPE_OBJECT的查询(只是返回原始对象),或者加载所需的对象类型ID。在最佳实施方式中,为了准备显示带有许多类的原始对象的对象列表,外壳应首先:
●获取对象查询。
●对每个语义对象类型,确定指定对象类型的智能体资源中存在多少对象。通过调用代理XML Web服务方法GetNumObjectsOfClassInAgent,获得对象数,其中智能体URL的对象类型ID名称(电子邮件,文档,事件等)作为参数。XML Web服务返回智能体中满足对象类型ID过滤器的对象数。
●根据智能体查询中对象类型数,外壳显示适合该对象类型数的框架或其他用户界面。在最佳实施方式中,当外壳准备加载对象类型特有的元数据时,调用代理的XML Web服务方法ExecuteSemanticQuery,其中智能体URL和语义对象类型作为参数。
4.当用户在对象上悬停时,可显示对象的更多元数据。
5.如果选择灵巧智能体灵巧镜头,则本发明的信息智能体显示语境元数据,后者其对象在鼠标下的灵巧镜头内的对象。在一种实施方式中,灵巧镜头应用于在演示程序内显示的对象。在选择实施方式中,本发明允许在其他应用程序(如Microsoft Office应用程序,桌面等)中调用灵巧镜头。包括安装系统挂钩函数以跟踪鼠标,并且当鼠标在该系统内移动时,调用灵巧镜头应用程序。对所有鼠标事件调用“挂钩函数”,并且挂钩函数捕获鼠标。作为选择,可以以异步方式调用灵巧镜头。在本实施方式中,每当演示程序显示新结果时,总要检查剪贴板,以查看是否存在语义灵巧镜头信息。在异步实施方式中,演示程序自动捕捉其视图内所有对象的全部灵巧镜头结果。在每个对象旁边显示一个图标,表示存在与特定语境有关的信息。在最佳实施方式中,用户能够调用视图内任何对象的灵巧镜头。
6.突发信息。每个对象最好显示一个用来表示是否存在与该对象有关的“突发信息”的用户界面。为“突发新闻”的语义等价物。最好提供该用户界面以指示信息的临界性,如果用户不希望看到该信息,则无需插入。例如,可以将该用户界面表示为在该对象显示窗口的一角慢速闪烁的图标。当用户悬停在该图标上,显示有关“突发信息”的元数据。在最佳实施方式中,利用隐含的特殊智能体实现“突发信息”,其中特殊智能体调用使用突发新闻语境模板的所有智能体。
7.最好能够利用用来表示对象是否有注释的用户界面显示每个对象。该信息包含在所有对象的所有查询结果的某个字段中。
8.最好能够利用用来表示是否存在特定语境模板或客户机上的特殊智能体的有关信息的用户界面表示显示每个对象。最好包括用户创建的特殊智能体和默认的特殊智能体(如客户机安装的智能体)。在最佳实施方式中,显示语境模板的语境调色板,其中用户选择显示一个或多个语境调色板,隐藏,或滚动(以导航到语境调色板)等。下文详细论述语境模板和语境调色板。在选择实施方式中,代理优先级最好包括:
●临界优先级。为最高优先级。例如,对于给定文档,如果刚刚张贴了有关电子邮件(在本例中为几分钟),或者即将发生的事件即将来临,则此标志为TRUE(在代理上)。
●高优先级。为下一个最高优先级。用户界面反馈最好清楚表示该优先级为高优先级以引起用户的注意,但是返回不能非常冒昧。该优先级对不同用户是不同的,例如,如果事件为用户的本地事件,则其优先级高于远程事件的优先级(特别地,如果远程用户无法参与该事件时)。
●中优先级。仅仅表示如果用户有时间的话应查看有关信息。用户界面返回必须清楚表达。
●低优先级。表示存在有密切关系的有关信息,但不是最新信息。
默认情况下,最好在客户机上安装四个优先级虚拟混合器。混合器自动聚集我的代理列表中的每个代理上的对应优先级智能体中的信息。每个代理上最好存在默认的优先级智能体。在最佳实施方式中,关系语义查询考虑语境和用户。
在最佳实施方式中,对于每个语境模板(或当前选择的语境模板),演示程序都要列举用户添加到我的收藏夹代理列表或最近使用的代理中的代理,并使用动态生成的SQML查询适当代理,以便根据语境模板查找是否存在与当前对象有关的对象。如果不能访问收藏夹列表或最近使用列表中的代理,则用户界面最好通过忽略该代理进行透明处理。在最佳实施方式中,在默认情况下,通过编排当前选择的对象的SRML的SQML的索引,并将SQML中的资源作为链接过滤器插入到语境模板的SQML中(最好使用默认谓词“有关(relevant to)”),创建动态生成的SQML。从而以智能方式处理当前选择的对象的对象类型到显示的语境调色板的语义的映射。例如,如果当前选择的对象为文档,则标题语境调色板根据标题语境调色板的SQML的出处使用SQML。语义环境中的每个代理使用默认谓词从语义上处理由此生成的SQML。在另一个例子中,如果选择的对象为人员,则标题调色板显示与该人有关的标题,如由该人创作或注释的“标题”。作为选择,如果当前选择的对象为文档或电子邮件,则SQML(带有默认谓词)生成表示各代理的语义关联标题的语义结果。最好在语境调色板中显示以上结果。同样应用于其他语境调色板(如古典,制造新闻的事件等)。
对于人员对象,优先级标志最好指该人张贴的对象或该人创作或保存的对象。在本例中,最好仅仅使用带有语义唯一性的元数据字段进行推定(如,该人的电子邮件地址)。
9.每个对象最好显示包括许多操作选项的用户界面。举例来说,图54为一个示例用户界面,说明在信息智能体(语义浏览器)结果窗格中显示的信息对象。图54表示气球弹出框(用于对象的元数据)以及允许用户调用工具选项的该对象上的用户界面图标,工具选项如建议语境窗格,突发新闻语境窗格,动词弹出菜单等。附加和其他用户界面选项包括:
●内部语义链接。为对象的语义类固有的链接。如果没有内部语义链接,则无需显示任何事物。例如,最佳实施方式的电子邮件对象包括以下内部语义链接:
1.    From List->
1.             Person A
2.    To List->
1.             Person B
2.             Person C
3.    Cc List->
1.             Person D
2.             Person E
4.    Bcc List->
1.             Person F
2.             Person G
5.    Attachments->
1.             Document 1
2.             Document 2
3.             Document 3
在最佳实施方式中,当用户调用任何语义链接时,客户机提取关联对象(而不是对象本身)的元数据。从而用户能够浏览原始对象各方面的语义信息。外壳最好调用代理的XML Web服务,其中代理存储带有适当方法的对象。在最佳实施方式中,该方法的形式为:ISemanticRuntimeService::LoadNativeSemanticLink。本实施方式包括语义类ID,语义链接的名称,参数名称,以及参数的字符串形式。例如,要“导航”到第三个附件(采用基于零的索引),外壳应调用LoadNativeSemanticLink(SEMANTICCLASS_EMAILMESSAGE,“Attachments”,“Index”,2)。由此生成SQML,SQML表示关系语义查询,创建具有该SQML的新的临时灵巧智能体,并加载灵巧智能体。以上说明首选的语义导航。该过程是递归的(可选)。用户可以使用任何新对象和中心点,导航离开新结果。
图55表示与内部语义链接关联的气球弹出示例,说明根据本发明的电子邮件示例。在该示例用户界面中,当用户选择结果窗格中的信息对象上的“内部链接”图标时,显示弹出菜单。该示例说明用户看到的电子邮件对象的内部语义链接。在最佳实施方式中,当用户点击菜单选项时,弹出菜单项目调用新的SQML查询(适当资源和谓词链接)。创建显示查询结果的新的临时智能体(带有SQML)。用户能够将该智能体保存到其收藏夹列表中。同时,新结果显示内部语义链接,语境模板等,从而支持用户控制的浏览,即用户能够根据语义导航信息。原有动词的可选配置和功能性如下:
All Information:
查找代理的相关信息(只有来自代理的时候)
查找代理的可能相关信息(只有来自代理的时候)
Open Annotations->
All
Annotation 1
Annotation 2
Annotation 2
EMAIL:+=
From List->
Person A
To List->
Person B
Person C
Cc List->
Person D
Person E
Bcc List->
Person F
Person G
Attachments->
Document 1
Document 2
Document 3
PERSON:
Reports To->
Direct Reports->
Member of Distribution Lists->
Information Authored By->
Information Annotated By->
Information with categories of which this person is an expert->
CUSTOMER:
Information Authored By->
●注释。最好允许用户导航到当前对象的所有注释的摘要视图。在最佳实施方式中,外壳通过调用ISemanticRuntimeService::EnumAnnotations(对象元数据作为参数)显示所有注释。返回包含注释对象之元数据的属性表的XML表示。外壳最好显示正在显示的注释摘要的某些表示(如注释的名称或标题)。当用户调用注释链接时,外壳显示注释对象的元数据。上述功能最好来自客户机上应用的过滤器。作为选择,可以将上述功能创建为智能体。本发明的上述方面进一步说明语义导航。最好使用“注释”查询的SQML表示加载注释。从而创建带有SQML的新的灵巧智能体。然后将灵巧智能体添加到“最近使用”的列表中并加载(或导航到)。该处理是递归的(可选)。用户可使用新显示的注释作为中心点进行导航。
●相关对象。在最佳实施方式中,允许用户使用当前对象作为信息对象中心点查找用户的我的代理列表中包含的各代理的相关信息。无需求助复制/粘贴,也无需依靠Shell扩展用户界面,就能实现上述处理。在最佳实施方式中,用户界面弹出框按以下格式显示信息:
Find Related Objects→
All my agencies→
Agency Foo→
All.All
All.Understood.All
All.CriticalPriority.All
All.HighPriority.All
All.MediumPriority.All
All.LowPriority.All
All.MyFavorites.All
All.Recommended.All
Agencies that understand this object→
Agency Bar→
All.All
All.Understood.All
All.CriticalPriority.All
All.HighPriority.All
All.MediumPriority.All
All.LowPriority.All
All.MyFavorites.All
All.Recommended.All
演示程序只是通过列举本地注册的代理用户获得“所有我的代理”列表。演示程序通过“询问”每个本地注册代理是否理解正在讨论的对象,返回“理解该对象的代理”列表。演示程序将该对象的XML表示传送给代理,后者试图从语义上处理XML表示。该代理返回用来表示是否理解该对象的标志。演示程序通过排除其上存储有该对象本身的代理,对返回列表进行优化,因为每个对象均具有用来表示代理是否理解其内容的字段。
●动词。允许用户调用直接与当前对象有关的任何操作。例如,文档或电子邮件具有“打开(Open)”动词。用于打开字处理器或电子邮件客户程序并显示信息。事件可以有“添加到Outlook日历(Add toOutlook Calendar)”动词。在最佳实施方式中,系统框架在客户机上调用动词,最好是特定类的动词。代理不需要对动词有任何了解。在本发明的最佳实施方式中,每个对象有几个动词。最好首先在弹出菜单中显示以上动词。在最佳实施方式中,动词包括:
1.注释(Annotate)。当用户调用该动词时,外壳最好与客户机运行时进行通信,然后调用注释方法。该方法启动带有适当主题行的默认电子邮件客户程序(其中代理对主题行进行语法分析以解释注释)。用户发送普通电子邮件作为该对象的注释。作为选择,电子邮件注释包括构成语义链接的附件。从而用户能够从一个对象(如文档)导航到其注释,到其附件,到外部内容源(如,通过灵巧镜头)。也支持其他实施方式的注释,如,基于简单表格的注释或基于对话框的注释。但是电子邮件提供最丰富的语义。
2.复制(Copy)。将对象XML复制到系统剪贴板上。
3.隐藏(Hide)。表示用户没有兴趣查看该对象。
4.打开(Open)。利用正在打开的链接限制该动词。例如,对于文档,可以显示“打开文档(Open Document)”。对于电子邮件,可以显示“打开电子邮件(Open Email)”。对于链接的MIME类型,客户机利用系统中注册的默认应用程序打开对象。在选择实施方式中,本发明支持其他相关打开动词形式,如“打开方式…(Open with…)”,允许用户利用特定应用程序打开对象。
5.标记为收藏夹(Mark as Favorite)。如果代理支持用户状态并且该对象不是收藏夹对象,则显示该动词。
6.取消标记为收藏夹(Unmark as Favorite)。如果代理支持用户状态并且该对象是收藏夹对象,则显示该动词。
图56表示与根据本发明的动词用户界面关联的气球弹出框的示例。在示例用户界面中,当用户单击结果窗格中显示的信息对象上的“动词”图标时,显示弹出菜单。该菜单表示基于对象类型(如文档,电子邮件,人员等)的信息对象的有关支持操作。原有动词的选择配置和功能如下:
所有信息(All Information):
●Annotate(打开Outlook;如果该对象来自代理,则将代理的电子邮件智能体地址填充到“收件人”字段;否则,保持“收件人”字段空白,从而用户能够指示用于对象注释联合的代理。如果对象不是来自代理,则将对象附加到电子邮件中,或者作为URL或者作为完整附件)。
●Copy
●Open
●Mark as Favorite(存储在客户机上)
●Unmark as Favorite
PERSONAND CUSTOMER:+=“Send Email”
10.当外壳加载新查询或一个或多个对象的元数据时,外壳最好调用带有查询或元数据的框架。在最佳实施方式中,外壳不支持查询,而是将查询传送给管理结果的演示程序运行时。
11.深层信息(或表示)方式。本发明的选择实施方式提供支持深层表示方式的外壳。在本实施方式中,外壳显示用来表示是否存在当前对象的有关信息的用户界面。外壳还显示描述该信息的文本。例如,对于给定的文档对象,外壳显示带有文本“Jane Doe最近张贴的与该对象有关的电子邮件:<电子邮件摘要>(Jane Doe posted the mostrecent email message that relates to this object:<summary of emailmessage>)”的弹出框。在本实施方式中,外壳显示特定信息的细节,如最近张贴的有关对象或最迫切的即将来临的对象。作为选择,外壳可以显示用户感兴趣的其他“事实”或推测数据。例子包括:
●Lisa Heilborn最近张贴的有关文档:<摘要>(LisaHeilborn recently posted a related document:<summary>)
●该文档最可能的作者为<foo>(The most likely author ofthis document is<foo>)
●Steve Judkins向Patrick Schmitz报告。Patrick张贴了与此有关的54个临界优先级对象。(Steve Judkins reports to PatrickSchmitz.Patrick has posted 54 critical priority objects that relate tothis one.)
●该文档可能有3个专家:<姓名>(This document has 3likely experts:<names>)
●Yuying Chen关于该文档方面的专门知识最多。(YuyingChen appears to have the most expertise on this document.)
本发明框架暴露供外壳用来获取信息的许多“语义深度”级别。可以配置灵巧镜头以支持深层表示方式。换句话说,在最佳实施方式中,在对象上调用灵巧镜头返回与以上所示信息类似的深层信息。外壳在对象显示窗口的一角显示一个图标。用户能够点击该图标,以显示“深层信息”。作为选择,可以以异步方式提取“深层信息”的元数据。
图57表示与根据本发明的深层信息方式用户界面关联的气球弹出框的示例,作为语境结果窗格提供的结果。在本例中,用户能够选择用来过滤显示何种深层信息的深层信息的模板,选择查看深层信息的“故事”,以及语义环境中的对象(如“Steve Judkins”人员对象,“experts”语境模板结果对象,使用“direct reports”谓词过滤器的“direct reports”对象)的语义(SQML)链接,等。另外,用户可以选择使用预览播放器/控制预览适当位置的语义查询的结果。
                    e.语义查询文档
从客户机的观点看,它理解的每件事都是一个查询文档。在本发明中,客户机打开“查询文档”的方式与字处理器打开“文本和复合文档”的方式类似。客户机主要负责处理语义查询文档,绘制结果。最好以语义查询标注语言(SQML)的方式,表示并存储语义查询文档。类似于“语义文件格式”。在最佳实施方式中,SQML语义文件格式包括:
●Head。Head标记包括描述文档的标记。
●Head:Title—表示文档的标题。
●Filters。演示程序使用“filters”标记中的条目过滤所有返回对象。作为选择,上述条目包括对象类型名称(文档,事件,电子邮件等)。如果没有指定过滤器,则不过滤对象。该标记有一个限定符,表示包含条目还是排除条目。如果是冗余条目的话(同时利用“include”和“exclude”标记表示),则解释程序排除此类条目(即,如果是连接的话,则假定“排除”)。
●Attributes。该标记表示文档的属性。
●Skins。为与外壳有关的所有条目的父标记。
●skin:<objecttypename>。包含供外壳用来管理“对象类型名称”指示的对象类型的对象的信息。对于其SQML文档中没有相应外壳条目的对象而言,演示程序使用默认智能体外壳。选项最好包括:
●skin:<objecttypename>:color。具有与该文档一起使用的颜色模板的信息。主要条目是XSLT URL。
●skin<obj ecttypename>:design。具有与该文档一起使用的设计模板的信息。主要条目是XSLT URL。
●skin:<objecttypename>:animation。具有与该文档一起使用的动画模板的信息。主要条目是XSLT URL。
●Query。为查询文档的所有主查询条目的父标记,包括:
●Resource。正在查询的资源的引用。例子包括文件路径,URL,高速缓冲条目标识符等。解释程序将其映射到实际资源管理器组件。
●resource:type。资源引用的类型,利用名字空间进行限定。已经定义的资源引用类型的例子为:nervana:url(表示资源引用为合式的标准因特网URL或定制URL,如“agent://…”)和nervana:filepath(表示资源引用为文件系统上的文件或目录的路径)。
●resource:arg。表示可选字符串,当解释程序将资源引用转换为实际资源时,将字符串传送给资源。为可执行文件的命令行参数的等价物。请注意,某些资源可能将该参数解释为rref的一部分,而不是rref参数的一部分。例如,标准URL可以在URL本身的尾部传送rref参数(前缀为“?”标记)。
●resource:version。见下文。
●resource:link。所有链接标记。
●resource:link:predicate。表示链接的谓词类型。例如,谓词nervana:relevantto表示查询为“返回与对象O有关的资源R中的所有对象”,其中R和O分别为指定资源和对象。谓词的其他例子包括nervana:reportsto,nervana:teammateof,nervana:from,nervana:to,nervana:cc,nervana:bcc,nervana:attachedto,nervana:sentby,nervana:sentto,nervana:postedon,nervana:containstext等。
●resource:link。This indicates the reference to the object ofthe semantic link.
●resource:link:type。表示“oref”标记中指示的对象引用的类型。例子包括:标准XML数据类型,包括xml:string,xml:integer;定制类型,包括nervana:datetimeref(系指诸如“今天”和“明天”之类的对象引用);以及标准因特网URL(HTTP,FTP等)或系统URL(objects://等),指本发明能够作为XML对象进行处理的对象。
●resource:link:version。表示资源语义链接的版本。允许代理的语义查询处理器返回版本结果。例如,某一版本的语义浏览器可使用V1查询,而另一个版本可使用V2。从而允许代理在资源级(如智能体)和在链接级提供向后兼容性。
●Query Type。表示SQML缓冲文件代表的查询(或智能体)的类型。在最佳实施方式中,包括智能体,代理,特殊智能体和混合器。
●Query Return Type。表示查询返回的对象类型(如文档,电子邮件,标题,古典等)。作为选择,也可以表示信息对象类型,语境模板等的名称。
例如,附录中的示例B说明根据本发明的语义查询文档。
在最佳实施方式中,演示程序包括一个SQML解释程序。当演示程序打开SQML文件时,最好解释该文件,其方法是:首先进行语法分析,确认,创建一个主入口表,然后在入口表中执行条目。实际上,在执行前需要“编译”SQML文件,类似语言编译器首先将源代码编译为目标模块,在与其他模块链接后执行。关于SQML解释程序,该过程包括通过引用加载其他SQML文件(可选)。该过程最好不循环。客户机使用“<skin>”标记中的XSLT模板(如果可用并且默认外壳或智能体外壳没有重载的话),以显示各声明对象类型的信息。利用该对象类型的默认外壳,对于单一智能体条目而言,利用智能体的外壳(如果指定智能体的话),显示没有声明外壳的所有返回对象。
在选择实施方式中,即使在打开语义查询文档后,客户机也可以加载新外壳显示各对象类型。在本实施方式中,“<skin>”标记最好通知客户机哪个外壳加载查询。在本实施方式中,指定外壳最好适合声明的对象类型。
在最佳实施方式中,框架在两个阶段中执行文档:确认阶段和执行阶段。对于确认阶段,解释程序首先构建主语义入口表。该表的关键字字段为资源URL,其他字段包括运算符,资源,资源类型,谓词,谓词类型和链接。在向表中添加条目时,解释程序排除所有冗余条目。同时,在向表中添加URL前,解释程序最好对所有URL进行正则化。例如,认为URL“http://www.abccorp.com”和“www.abecorp.com/”是相同的,因为它们有相同的正则形式。解释程序构建并维护一个单独的SQML引用表。此表包括SQML文件的正则路径。当解释程序加载原始SQML文件时,把正则文件路径添加到引用表中。如果SQML文件指向本身,则解释程序忽略该条目,或返回错误。如果SQML文件指向另一个SQML资源,则将新文件添加到引用表中。然后递归加载新资源,并重复该过程。在处理过程中,如果解释程序遇到已经在引用表中的SQML条目,则解释程序向调用程序返回错误(表示SQML文档中有递归循环)。当解释程序在文档图路径内发现更多资源时,将它们添加到给定资源的主入口表中。将给定资源的链接动态添加到入口表中该资源的条目上。因此,解释程序有效展平该图内各种资源的文档链接图。
接着,解释程序进行到执行阶段。在该阶段中,解释程序复审语义入口表,以异步方式,或以顺序方式,执行所有资源查询。然后根据资源类型处理各种资源。例如,对于文件资源,打开该文件的属性元数据,并显示元数据。对于引用理解类型的HTTP资源(如文档),解释程序下载该URL,进行抽取和显示处理。对于智能体资源,调用每个智能体的XML Web服务,以XML参数的方式传送链接,其中利用运算符限定各链接。在最佳实施方式中,跨越文档边界的链接的运算符总是AND。换句话说,解释程序对没有声明的相同资源的所有链接进行“与”运算,因为认为递归查询是过滤器。解释程序对代表资源的组件的查询次数,与智能体资源的数目相同。对于各链接,解释程序通过把链接转换为适合于资源处理的查询,解析链接。例如,对于带有以下属性的链接的智能体,
<predicate>nervana:relevantto</predicate>
<oref>c:\foo.doc</oref>
<oreftype>nervana:filepath</oreftype>
通过抽取该对象的XML元数据(如c:\foo.doc),然后利用XML作为参数调用智能体资源的XML Web服务,进行解析。由此说明将本地语境解析为服务器能够理解并进行处理的普通(基于XML的)查询的方法。
为了对查询进行优化,代理XML Web服务暴露用于传送运算符(and,or等)作为限定符的参数的方法。解释程序最好调用一次带有全部链接参数的智能体资源的XML Web服务。
语义查询实现情景。以下为典型情景,说明根据本发明之最佳实施方式的语义查询文档的实现和操作。
情景1:加载SQML文档。客户创建一个临时文件,将其写入到含有简单本地HTML页面之属性的缓冲器中。该页面包括客户机框架组件(如,ActiveX控件,Java小应用程序,Internet Explorer行为等)。利用打开SQML文件的组件和标识信息智能体实例的唯一ID初始化该页面。组件本身打开SQML文件。换句话说,客户机框架告诉插件打开何种SQML查询文档。插件通过按上述方式进行解释,打开语义查询文档。
情景2:打开文档。客户打开标准对话框,后者允许用户选择要打开的文件。利用标准文件扩展名(如,PDF,DOC,HTM等)初始化对话框。当用户选择文档时,对话框返回所有打开文档的列表。客户创建一个新的SQML文件,添加带有打开文件之路径的资源条目。给新的SQML文件指定唯一名称(最好基于全局唯一标识符(GUID))。由于是临时文件,所以最好不向用户暴露其名称。该方法转到上述情景1。
情景3:打开文档中的文件夹。客户创建一个SQML文件(按上述方式),利用资源条目file://<folderpath>?includesubfolders=(true|false)进行初始化。通过列举该文件夹中的所有文档,并显示该文档的元数据,加载SQML文件(如情景1)。
情景4:另存为智能体。客户打开允许用户设置智能体名称的对话框。客户将语义环境(见下文)中的智能体重命名为新名称。正在保存的智能体可能是临时的,或者可能已经用不同名称保存信息智能体最好提出智能体名称。
情景5:保存到混合器。客户打开允许用户选择混合器的对话框。该对话框最好允许用户创建一个新混合器。当选择混合器时,客户打开混合器的SQML文件变为SQML对象模型,添加新条目(当前加载的SQML文件)。然后将当前条目的引用数加1。
情景6:拖放。客户创建并打开带有单一资源条目的SQML文件,例如,类似于:
<resource type=“nervana:url”>
agent://documents.all@abccorp.com
<link predicate=“nervana:relevantto”
type=“nervana:filepath”
c:\foo.doc
</link>
</resource>
本例假设将表示“c:foo.doc”的图标,拖放到引用智能体“agent://documents.all@abccorp.com”的信息智能体中的图标上。
情景7:多重拖放。客户创建并打开带有单一资源条目的SQML文件,例如,类似于:
<resource type=“nervana:url”>
agent://documents.all@abccorp.com
<link predicate=“nervana:relevantto”
type=“nervana:filepath”
c:\foo1.doc
</link>
<link type=“nervana:filepath”
operator=“or”
predicate=“nervana:relevantto”
c:\foo2.doc
</link>
<link type=“nervana:filepath”>
operator=“or”
predicate=“nervana:relevantto”
type“nervana:filepath”
</link>
</resource>
本例假设将代表“c:\foo1.doc”,“c:\foo2.doc”和“c:\foo3.doc”个的多个图标拖放到引用智能体“agent://documents.all@abccorp.com”的信息智能体中的图标上。同时,本例假设用户表示他们需要针对智能体资源的语义查询的并集。
情景8:灵巧镜头。当在信息智能体中选择灵巧镜头时,信息智能体指示语义环境管理器(见下文)已经为信息智能体标识符选择了灵巧镜头。当外壳注意到鼠标在某个对象上时(例如,通过文档对象模型(DOM)中的“onmouseover”事件),首先调用演示程序查明信息智能体是否处于灵巧镜头模式。客户机框架通过询问语义环境管理器该标识符的信息智能体是否处于灵巧镜头模式,完成以上确定。由于语义环境管理器高速缓冲来自信息智能体本身的信息,所以它能代表信息智能体回答上述问题。如果信息智能体处于灵巧镜头模式,则客户机框架最好通过语义环境管理器从系统剪贴板中获取SQML缓冲。这是因为灵巧镜头为虚拟“粘贴”,由于灵巧镜头从剪贴板中获得其信息。换句话说,可以将复制到剪贴板上的任意对象或智能体(甚至是普通文本)作为灵巧镜头。框架获得SQML缓冲,实例化SQML缓冲中的各种资源的资源组件。客户机框架调用资源APIGetInformationForSmartLens,后者将当前显示的对象的XML信息传送给资源。所有资源最好向客户机框架返回灵巧镜头元数据。各种资源最好返回灵巧镜头信息块列表格式的元数据。各信息块包含一个文本项和一个查询缓冲器列表(采用SQML格式)。文本项包含简单文本或定制文本格式,例如,类似于:
Steve reports to<A>Patrick</A>.Patrick posted<A>54critical-priority messages</A>relating to this one.
每个“<A>”标记对最好包括信息块中的一个对应SQML查询缓冲。客户机框架将该文本格式化为DHTML(或类似表示格式),以便在信息智能体中显示(如,作为一个气球弹出框或其他用户界面,最好不要妨碍或隐藏其上有鼠标的对象)。客户机框架显示含有“<A>”和“</A>”标记的链接(类似于HTML链接)的用户界面。当调用链接时,客户机框架调用语义环境管理器创建一个新的高速缓冲条目。语义环境管理器指出该条目中存储的文件路径。客户机框架将点击的<A>标记的SQML缓冲写入到该文件中。客户机框架将SQML文档推送到语义环境管理器中,然后将SQML加载到信息智能体中(通过动态HTML)。由于语义环境管理器包括该SQML文档作为当前文档,所以用户能够通过信息智能体中的“保存”按钮保存该文档(如“另存为智能体”或“保存到混合器中”)。例如,灵巧镜头能够显示的信息如下:
The Agent Email.Technology.All@Marketing has a total of 300objects that relate to this object.Critical Priority:5 objects,HighPriority:50 objects,Medium Priority:100 objects,Low Priority:145objects.
在最佳实施方式中,如果用户没有点击气球内的任何链接,则不创建SQML文档并且不向语义环境添加任何内容。这是因为灵巧镜头最好仅仅代表“潜在查询”。
在最佳实施方式中,能够以灵巧镜头的方式调用SQML中包含的任何信息(如智能体,人员,文档,标题,古典,代理,文本,HTTPURL,FTP URL,文件系统的文件,文件系统的文件夹,诸如MicrosoftOutlook之类的电子邮件应用程序的电子邮件URL,电子邮件文件夹URL等)。例如,用户能够将基于文本的应用程序中的普通文本复制到剪贴板上。如果用户进入信息智能体并选择灵巧镜头,则调用该文本的SQML版本作为灵巧镜头(通过“文档”资源)。如果把“文本灵巧镜头”悬停到文档对象上,则代表文本灵巧镜头的文档资源选择显示相似性系数,向用户显示灵巧镜头对象和鼠标下的对象之间的相似性。如果鼠标下的对象为人员对象,则文档资源“询问”代表该人员对象的智能体该智能体是否为文本所包含的信息方面的专家。作为选择,灵巧镜头可以显示与该文本有关的该人创作的相似文档或电子邮件的链接。
情景9:复制与粘贴。
复制:当在语义环境中调用复制命令时,客户机框架将SQML缓冲复制到带有定制剪贴板格式的系统剪贴板上。从而确保其他应用程序(如Microsoft Word,Excel,记事本等)不识别此格式并试图粘贴该信息。SQML缓冲最好与正在复制的对象的语义一致。例如,将正在演示程序中显示的对象的复制操作复制为带有适当资源类型以及元数据之来源URL的资源。复制代表智能体的图标会复制该智能体的URL或引用语义环境中的该智能体之条目的高速缓冲条目。复制桌面应用程序(如Microsoft Outlook)的信息会复制其资源类型引用源应用程序并且URL指向该应用程序内的对象的SQML。最好在运行时由解释程序将上述URL解析为该应用程序内的对象。例如,复制需要复制到语义环境中的Outlook中的电子邮件将创建以下资源项:
<resource type=”nervana:outlookemailmessage”>
outlook://file://c:\temp\foo.html
</resource>
粘贴:当调用粘贴命令时,客户机框架基于正在粘贴的信息的剪贴板格式,创建一个SQML文件。例如,如果剪贴板包含文件路径,则SQML文件包含带有该文件路径的对象的链接(从调用粘贴操作的资源开始)。按上述方式打开该文件。如果剪贴板格式为URL,则该对象为URL对象类型。如果该格式为普通文本,则该对象包含实际文本,在本例中,文本的资源类型为nervana:text。作为选择,客户机框架创建一个临时缓冲条目,在该条目中存储文本(如作为.TXT文件),并存储引用文件路径和对象类型(在本例中,对象类型为nervana:filepath)的SQML对象。当调用解释程序时,创建文本的XML元数据版本并调用带有XML链接参数的资源。如果剪贴板格式为本发明的SQML剪贴板格式,则执行类似处理,只是创建文件时其扩展名为.SQM(或.SQML)。指示解释程序该对象为SQML文件而不是普通文本文件。
                       f.语义环境
本发明的语义环境的最佳实施方式提供用户可经由信息智能体使用的每个智能体和代理的视图。最好包括保存到收藏夹“我的智能体”列表中的智能体,最近使用的智能体,本地代理上的智能体,以及远程代理上的智能体。远程代理包括通过局域网上的多点传送宣布其存在的代理,全局代理目录上的可用代理,以及定制代理目录上的可用代理。通过调用其URL,可以将智能体动态添加到语义环境中。在最佳实施方式中,语义环境层次结构具有附录中示例C所示的模式。最好将“最近使用的”,“最近创建的”智能体折叠为“最近的智能体”。作为选择,可以添加“所有智能体”,“已删除智能体”和“定制视图”。
代理视图允许用户在主视图中按代理查看所有智能体。对象类型视图允许用户查看利用对象类型过滤后的相同智能体。其他视图按类似方式运行,如“按语境”(基于语境模板)和“按时间”。语义环境合并“收藏夹”记号与“历史”记号。作为选择,语义环境动态添加管理的视图,如“最近使用的智能体”等。最好利用在语义环境管理器(见下文)内运行的代码更新上述视图。
图58和59表示根据本发明的典型语义环境。插入到语义环境中的图标包括:
应用程序
所有容器对象类型
所有文档文件类型
突发新闻智能体图标限定符(如惊叹号)
特殊智能体图标限定符(如晕圈)
各对象类型的标准智能体
代理
智能体视图容器
我的智能体
突发新闻智能体
收藏夹智能体
特殊智能体
最近使用的智能体
快照。用户最好能够保存语义环境的快照。本质上,语义环境快照为语义环境的状态的基于时间的缓冲。在最佳实施方式中,快照包括带有以下信息的本地存储状态:
●保存快照时有新智能体的所有代理。
●各代理的最后一个智能体的创建时间(基于代理的时钟)。
●各代理的当前时间(基于代理的时钟)。
用户最好能够访问快照。信息智能体过滤语义环境以便仅仅显示快照列表中的代理,以及在各代理的最后一个智能体的创建时间和快照时间之间创建的各个代理中的智能体。
                   g.语义环境管理器
本发明提供语义环境管理器,后者暴露用于管理语义环境对象的API。在最佳实施方式中,管理的语义环境对象主要包括经由SQML缓冲器的智能体引用。语义环境管理器还暴露用于导航语义环境的API。在最佳实施方式中,语义环境管理器允许信息智能体的实例进行以下处理:
1.在语义环境管理器中进行注册。语义环境管理器最好维护有关全部公开信息智能体实例的信息。进行上述处理的原因在于,许多服务(如剪贴板访问,灵巧镜头访问等)都是通过shell扩展应用程序和在浏览器控件内运行的演示程序组件实现的。例如,当演示程序将一个新的SQML文档加载到显示区域时,需要获得语义环境管理器的缓冲条目。它请求语义环境管理器创建给定SQML缓冲的新的缓冲条目。语义环境管理器创建该缓冲条目,将SQML缓冲写入到与该条目相对应的文件路径中,创建利用指向该缓冲条目的ActiveX控件、动态HTML行为、Java小应用程序(或等价客户机运行时引擎)进行初始化的临时HTML文件,向演示程序返回缓冲条目标识符以及临时HTML文件的文件路径。例如,在最佳实施方式中,可以将临时HTML文件命名为:
c:\windows\temp\nervana_39fc54bc-81e5-4954-8cef-3d1a54935a0d.htm
其中39fc54bc-81e5-4954-8cef-3d1a54935a0d为缓冲条目标识符。包含的信息智能体自动检测加载的新文档(通过包含的信息智能体控件中的事件)。当用户单击“保存”(如“另存为智能体”或“保存到混合器”)时,包含的信息智能体能够响应。当用户单击“另存为”时,信息智能体获取当前文档的文件路径,根据文件路径获取缓冲条目标识符(因为文件路径的一部分是用标识符命名的),显示缓冲条目的元数据(名称,描述等),从而完成处理。作为选择,信息智能体请求语义环境管理器利用新名称再次保存该缓冲条目。信息智能体向语义环境管理器注册(最好在启动时)智能体实例的进程ID。语义环境管理器为该信息智能体分配一个新标识符,并存储信息智能体实例的元数据(如当前是否处于灵巧镜头模式)。信息智能体存储该标识符。信息智能体最好在每次调用时向语义环境管理器传送该标识符。信息智能体利用该标识符初始化演示程序。在最佳实施方式中,每当客户机框架需要跨应用程序服务时,总是利用该标识符调用语义环境管理器。语义环境管理器存储信息智能体实例的进程标识符,以便在信息智能体进程终止时碎片收集所有信息智能体条目。语义环境管理器最好完成以上处理,以便删除信息智能体条目,因为信息智能体可能不“知道”何时终止。
2.向语义环境添加新智能体引用。最好在数据库、文件系统或系统存储区(如Windows注册表)中存储智能体引用条目。在最佳实施方式中,各语义环境条目包含:
a.标识符。唯一标识语义环境中的智能体。
b.名称。标识智能体的名称。在创建新智能体时,信息智能体设置一个默认智能体名称。基于创建方式设置智能体名称。例如,如果将文档“foo”复制粘贴到智能体“bar”上,则信息智能体可能创建一个与“foo”(当前时间)有关的名为“bar”的临时智能体。存储当前时间的目的是唯一命名该智能体(如果用户重新发起同一查询时)。需要时,用户能够重命名智能体。
c.查询缓冲。标识包含该智能体的SQML的缓冲。
d.类型。标识智能体类型(如标准智能体,混合器,搜索智能体,特殊智能体等)。
e.创建时间。标识创建智能体条目的时间。
f.LastModifiedTime。标识最后修改智能体条目的时间。
g.LastUsedTime。标识最后使用智能体条目的时间。
h.UsageCount。标识智能体用作独立智能体,过滤器或灵巧镜头的次数。
i.属性。有智能体属性(如,正常,临时,虚拟和标记为删除)。如果该条目为临时的,意味着用户尚未明确另存为本地智能体。当用户使用拖放操作组成复合查询而并不将中间查询另存为智能体时,最好使用临时条目。当用户将查询另存为智能体时,信息智能体复位临时标志,以标识该查询条目现为永久条目。
j.ReferenceCount。标识其他智能体和混合器引用该智能体的次数。在创建新智能体条目时,将该值初始化为0。
3.从语义环境中删除智能体。最好分两个阶段完成。可以将智能体标记为删除,此时语义环境管理器设置一个标志,标识该智能体条目在“回收站”中。可以永久删除智能体条目,此时同时从缓冲中删除该条目。
4.更改语义环境中的智能体的属性(例如,当用户保存智能体时,复位智能体的临时标志)。
5.重命名语义环境中的智能体。
6.列举高速缓冲以检索与以下各项对应的条目:
a.所有智能体
b.已经删除的智能体
c.最常使用的智能体
d.最近使用的智能体
e.最近创建的智能体
f.在上述视图下面的各对象类型的过滤器(如文档,电子邮件,事件等)
g.存储上述视图中的智能体的代理的过滤器,代理上的对象类型的过滤器,以及适合上述视图的智能体(文档,电子邮件等)
h.基于语境模板的特殊智能体的过滤器(如标题,古典,制造新闻的事件等)
对于上述列举和视图的示例,图12-14和17-19表示语义环境树视图。
7.基于经由信息智能体的实例调用更新的计数过滤智能体列表。信息智能体的各个实例最好与一个语义环境管理器通信。这样,更新是面向用户的,而不是面向会话的。例如,如果用户打开某个信息智能体中的智能体,则该智能体条目将出现在另一个信息智能体中的最近使用的智能体视图中。语义环境管理器维护以下信息,即各智能体的使用次数,最后使用各智能体的时间等。它过滤所有智能体。例如,基于最好使用计数的N个智能体,过滤最常使用的智能体,其中N是可配置的,并且只在某个稳定等待周期后(如总使用计数大于Y之后)才进行过滤,其中Y也是可配置的,例如,基于两周内智能体使用的预期数值进行直观推断。基于使用时间过滤最近使用的智能体,以每智能体为基础存储使用时间,并且每次使用智能体时由信息智能体的实例进行更新。基于智能体的创建时间过滤最近创建的智能体。通过检查各智能体上的“标记为删除”标志,过滤删除的智能体。通过检查各智能体上的“标记为收藏夹”标志,过滤收藏夹智能体。对上述父视图的每个视图,使用简单过滤器填充基础视图。通过检查父视图中返回的各智能体,并从中抽取唯一代理,填充代理视图。通过基于智能体对象类型(如文档,电子邮件,事件等)过滤智能体,填充其中显示的每个代理下面的对象类型视图。通过仅仅显示具有“混合器”类型的智能体,过滤混合器视图。使用智能体对象类型直接过滤对象类型视图。“我的代理”视图显示本地代理。本地代理下面的每个视图最好为使用该代理上的各可用智能体过滤后的对象类型视图。通过仅仅过滤特殊智能体(最好是利用语境模板创建的智能体)并检查语境名称(如标题,古典等),填充“按语境”视图。
8.维护语义环境中智能体的引用计数。调用组件(信息智能体)负责将文档条目的引用计数加1或减1。信息智能体最好通过拖放或复制粘贴操作完成上述处理。换句话说,其创建的新查询引用现有智能体的操作。
9.清空语义环境。删除所有智能体。
10.执行碎片收集。语义环境管理器自动删除所有旧(和临时)智能体。可以配置缓冲,以记录直到某个时期的智能体的历史。例如,如果将缓冲配置为仅仅维护智能体两周内的信息,则它周期检查超过两周的临时智能体。如果发现此类智能体,则自动删除引用计数为零的智能体条目。最好当信息智能体创建新缓冲条目,但并未创建引用它的另一个条目(智能体或混合器)时,进行上述处理。换句话说,信息智能体执行中间链接的链接跟踪(以避免复杂性)。
作为选择,语义环境管理器执行深度碎片收集。按可配置时间表周期进行上述处理。这适用于引用计数大于零但由于删除其他条目时没有维护链接而造成没有实际引用的条目。将该功能加到最佳实施方式中,以便将复杂性降到最低程度,因为在保存或编辑智能体和混合器时,信息智能体最好不跟踪智能体和混合器之间的引用。在选择实施方式中,在调用智能体时,演示程序执行懒惰智能体链接跟踪。客户机框架忽略已经从语义环境中删除的所有引用,类似于某个链接已删除时网页返回404错误(找不到文件)。换句话说,本发明为不完整查询的情况作好准备。例如,一种可能情景为:
混合器B1->引用混合器B2->引用智能体A1->引用智能体A2
此时,各条目的引用计数为1,即使引用链的引用计数为4。同样,即使引用计数大于零,也可能有陈旧条目。对于进行碎片收集处理的各条目,碎片收集程序搜索所有SQML文档中的条目引用。如果没有发现引用,则删除该条目(如果是临时条目并且超过时间限制的话)。
11.处理通知管理。用户能够登记语义环境中任何智能体(如保存的智能体或本地智能体,标准智能体,混合器等)的通知。在最佳实施方式中,通知方法包括发送电子邮件,及时消息,寻呼消息,电话消息等。语义环境管理器包括一个通知管理器(见下文),后者管理用户经由信息智能体发送的通知请求。通知管理器存储通知请求列表。通知请求最好包括语义环境对象ID(标识智能体),通知的类型(电子邮件,IM等)以及目的地,如电子邮件地址等。通知管理器周期轮询通知请求列表中的各个智能体,“询问”是否有任何新对象。同时,通知管理器传送“最后请求时间”(基于目的地智能体的时钟)。智能体用新对象的数目表示回答(通过调用其存储的查询,并回传自“最后请求时间”以来创建的查询结果中的对象数目)。智能体用当前时间(基于其时钟)表示回答。通知管理器存储智能体的时间,以避免时间同步问题。作为选择,客户机和所有代理使用同一时间服务器(时间Web服务)获取时间,以确保所有时间比较是按相同比例进行的。
代理目录。在最佳实施方式中,语义环境管理器最好维护各代理“目录”的代理列表。多点传送网络最好将语义环境管理器看作代理目录。在最佳实施方式中,有一个默认的全局代理目录,将其URL配置为公用系统上的XML Web服务。XML Web服务存储所有登记代理的缓冲(最好带有上述信息,包括ID,URL等)。XML Web服务暴露方法,以允许代理登记其在代理目录上的出现。XML Web服务过滤冗余条目。XML Web服务还暴露方法,以允许用户列举代理目录上的所有代理。语义环境管理器按此方式列举目录。信息智能体最好将代理目录看作语义环境的扩展,允许用户浏览并打开代理目录上列出的代理上的智能体。用户最好能够向内部网络上安装的定制代理目录中添加URL。本发明企图创建并集成可定制的代理目录。本质上,当网络不支持多点传送(由于带宽储备原因)或广域网上的某些子网不支持多点传送时,该方法作为使用多点传送进行发现的选择。
       h.环境浏览器(语义浏览器或信息智能体TM)
环境浏览器(即信息智能体)存储普通Web浏览器组件(如Internet Explorer ActiveX控件),并且主要负责获取SQML文件和通过演示程序绘制结果。在最佳实施方式中,通过打开利用SQML文件的SQML文档缓冲条目的引用初始化的本地HTML文件,实现上述处理。HTML文件通过控件(如ActiveX,Java,Internet Explorer行文等),加载演示程序。该控件从缓冲中(经由语义环境管理器)检索SQML文档,然后按上述方式加载SQML文件。当控件接收到来自资源的表示能够将该对象转换为XHTML(或等价表示格式,最好通过当前的XSLT和/或基于脚本的外壳,并推入DOM进行表示)时,将对象添加到Web浏览器文档对象模型(DOM)中。信息智能体允许用户打开SQML文件或缓冲中的条目(经由缓冲ID)。同时,信息智能体允许用户前进和后退,导航堆栈内的第一个文档(类似于当今Web浏览器中的“前进”,“后退”和“主页”选项,其区别在于:与HTML和其他文档不同,此时打开SQML文档是为了解释和显示(结果))。
图60-68表示根据本发明的最佳实施方式的信息智能体的典型屏幕快照。图60表示语义环境,说明工具栏弹出菜单选项,其工具允许用户将本地搜索结果导入到语义环境中,例如经由哑智能体,以创建新的特殊智能体,新混合器或新的本地代理。作为选择,可以将此类工具折叠为一个调用向导的工具按钮,其中用户能够从向导中选择智能体的种类(哑智能体,灵巧智能体,特殊智能体)或希望创建的代理。图61表示允许用户利用关键字搜索语义环境的示例对话框。从而创建新的灵巧智能体(带有适当SQML)。用户最好能够定制新的灵巧智能体的名称,并添加可选描述。图62表示工具栏的“保存”工具弹出菜单选项,该选项允许用户将新建的或打开的智能体永久保存到语义环境中(保存到“收藏夹”列表中),或者将该智能体保存到混合器中。图63表示工具栏的灵巧镜头工具菜单选项,该选项允许用户调用灵巧镜头(基于灵巧智能体或剪贴板上的现有对象)。从而通知演示程序用户希望使用剪贴板内容作为灵巧镜头。演示程序最好自动调用用户将鼠标悬停到其上的任何对象的灵巧镜头功能。同时,该菜单表示“粘贴为灵巧镜头并钉住”选项,该选项保持灵巧镜头打开(甚至越过智能体导航)直至用户明确关闭灵巧镜头。图64表示“打开智能体”对话框的示例视图,说明用户从语义环境中打开服务器端智能体并更改环境“视图”(如大图标,小图标,列表等)的方式。图65表示标准窗口“打开”对话框,说明用户将文件系统中的“普通”文档导入到信息神经系统之语义环境中的方法。创建引用该文档的哑智能体。当调用哑智能体时,在信息智能体中打开该文档,并启用该文档的所有语义工具(如灵巧复制粘贴,语境模板等)。以上说明浏览器使文件系统上的普通“愚蠢”文档在语义上变得“灵巧”的方法。图66表示定制的“打开文件夹中的文档”对话框,该对话框允许用户搜索本地文件系统上的文件夹中的文档,并将其导入到语义环境中。从而通过经由信息神经系统的语义工具(如灵巧复制粘贴,语境模板等)“暴露”它们,使得上述文档变得“灵巧”。图67表示用户选择浏览选项时显示的“浏览文件夹”对话框。从而允许用户选择要打开的文件夹(从本地文件系统中)。图68表示“添加混合器”向导页面,该向导允许用户选择是创建标准混合器还是创建虚拟混合器。
                   i.附加应用程序特征
应用程序菜单扩展和其他框架特征。系统客户机最好安装支持计划性扩展但并不支持将数据复制到剪贴板上的应用程序的菜单扩展。此类应用程序包括诸如Microsoft Windows Media Player和MicrosoftOutlook(用于电子邮件标题)之类的应用程序。在最佳实施方式中,菜单扩展读取“复制”。系统将选定对象作为XML对象复制到Windows系统剪贴板上。例如,电子邮件Microsoft Outlook的系统插件将选定的电子邮件对象复制为电子邮件XML对象。对于已经支持剪贴板的应用程序而言,不需要扩展。
服务器端收藏夹对象。在支持用户状态的代理上,用户能够将对象标记为“收藏夹”。在将对象标记为收藏夹时,演示程序调用该代理的XML Web服务上的方法。XML Web服务添加用户对象与正在讨论的对象之间的语义链接。在最佳实施方式中,用户能够经由All.MyFavorites.All默认智能体查看收藏夹对象。该智能体返回标记为收藏夹的所有智能体。代理管理员能够创建子智能体,如All.MyFavorites.Technology.XML.All。
演示程序允许用户标记和取消标记收藏夹,这也是重新定义服务器和代理导出的结构的一种方法。当用户查看感兴趣的对象但不希望立即导航到此类对象时,使用“收藏夹”情景非常有用。作为选择,代理可使用收藏夹功能向用户推荐对象。在最佳实施方式中,可通过All.Recommended.All智能体检索推荐的对象。代理主要根据用户标记为收藏夹的对象推荐对象。服务器端收藏夹最好与“收藏夹”,古典和推荐语境模板一起使用。
智能体屏幕保护程序。本发明的最佳实施方式允许用户选择任何预订智能体作为屏幕保护程序。最好警告用户智能体可能暴露敏感数据,并允许用户确定使用特定智能体作为屏幕保护程序是否安全。在最佳实施方式中,系统客户机能够加载任何预订智能体作为屏幕保护程序。在选择实施方式中,用户可以组合智能体以提供所需的屏幕保护程序表示。作为选择,屏幕保护程序可以为一个结构化外壳,后者包括显示的相似智能体,如在屏幕的四个象限内显示的相似智能体。
智能体-智能体灵巧镜头。在选择实施方式中,系统客户机支持使用灵巧镜头(或者通过智能体或者通过混合器进行调用)作为调用另一个智能体或混合器的语境。例如,用户可以选择All.CriticalPriority.All,并希望使用该智能体作为灵巧镜头浏览All.Understood.All,以便找出作为临界优先级并且目的代理理解的所有对象。
灵巧镜头示例用户界面说明。图69-71表示与根据本发明的信息智能体的灵巧镜头功能关联的典型气球弹出菜单。图69表示利用灵巧智能体作为灵巧镜头的语境结果窗格中的气球弹出菜单示例。当用户选择信息对象上的灵巧镜头图标时,显示弹出窗口。本例说明题目为“路透社发布的与[我的Nervana UI规范]有关的文档”的灵巧智能体在剪贴板上,并“粘贴”为题目为“Yuying’s Thoughts on the NervanaUI”的电子邮件对象上的灵巧镜头的情况。图70表示利用对象作为灵巧镜头(并“悬停”到智能体上)的语境结果窗格中的气球弹出菜单示例。本例说明灵巧镜头是隐含的(A[灵巧镜头]B=B[灵巧镜头]A)。该语境窗格的结果部分与图69所示的示例相同,表示最佳实施方式中的灵巧镜头是隐含的。图71表示利用信息对象作为灵巧镜头并且信息对象作为透镜的语境结果窗格中的气球弹出菜单示例。在本例中,已经将题目为“我的Nervana UI规范”的对象复制到剪贴板(其SQML表示)上,并粘贴为题目为“Yuying’s Thoughts on the Nervana UI”(电子邮件对象)的另一个对象(在结果窗格中)上的灵巧镜头。在本例中,用户有权选择其语义与文档和电子邮件之组合一致的谓词。图72表示图71的气球弹出菜单的变体的示例,说明两个对象(灵巧镜头对象和“透镜”对象)的关联度度量,在本例中分别用百分比和条形图表示。
图73-75为示例表格,说明使用灵巧镜头时的行为和包含对象类型谓词的关系。图73表示所有信息的智能体-对象情景,其中灵巧镜头行为是可交换的,例如,A[灵巧镜头]B=B[灵巧镜头]A。图74-75分别表示文档和电子邮件的对象-对象情景,其中灵巧镜头行为是可交换的,例如,A[灵巧镜头]B=B[灵巧镜头]A。
混合器外壳用户界面说明。图76为用户界面示例,说明语义结果播放/预览控件。信息智能体演示程序最好该该控件附加到各结果窗格中。播放/预览控件允许用户导航结果窗格内的结果,使结果富有生气(播放,停止,暂停,改变,加速等),以及过滤结果(例如,在混合器结果的情况下)。图77为用户界面示例,说明混合器的语义结果。在本例中,混合器外壳具有显示区域的保留部分作为混合器中各智能体的独立画面,并且每个画面附加一个播放/预览控件,从而允许用户独立导航,控制并使混合器中各智能体的结果富有生气。作为选择,混合器外壳可以显示混合器中所有智能体的合并结果(附加一个播放/预览控件),可以在与信息对象类型相应的画面中显示结果。
多重拖放。在选择实施方式中,系统客户机允许用户从桌面上选择多个文档或文件夹,将其作为智能体或混合器上的关系查询的基础。从而允许用户使用多个文档作为精致工具进一步精致查询。例如,用户可以选择指示他们需要结果的并集还是需要结果的交集(使用各文档作为过滤器)。由此创建带有一种资源(在其上拖动链接的对象)和多个链接(每个文档一个或拖动对象)的SQML文件。客户机的SQP通过检索所有对象过滤器的XML元数据,并利用XML参数调用目的灵巧智能体的XML Web服务,进行解释。在最佳实施方式中,代理的XML Web服务对XML元数据参数进行分类,形成查询的正确SQL表示,并返回结果。
URL快捷方式约定。本发明的代理能够共享Internet Web,因为已经将Internet Web安装为Web应用程序。因此,可以使用Web的命名方案(如普通HTTP URL)表示代理。在最佳实施方式中,本发明暴露信息智能体的语义环境特有的快捷方式命名约定和URL。
●智能体快捷方式URL约定。智能体快捷方式URL约定为:
agent://<agentname>@<agencyurl>?start=<start>&end=<end>&skin=<skin urlL>
调用时,最好映射到完全限定的HTTP URL,如:
http://<path to Agency ASP;or
CGI script>?agentname=<agentname>&start=<start>&end=<end>&skin=<SkinUrl>
智能体快捷方式URL约定的一个例子为:
agent://email.technology.wireless.all@marketing.abccorp.com?start=0&end=25&skin=http://www.nervana.net/skins/email/abcemailskin.xslt
客户机按以下方式解析该URL:启动Web服务代理,打开WSDL文件http://abc.com/nervanaroot/webservice.wsdl并向Web服务请求名为“Marketing”的代理的统计数字。对于HTTP访问,将其解析为ASP或CGI路径。例如:
http://abccorp.com/marketingagency.asp?urltype=agent&agentname=email.technology.wireless.all&start=0&end=25&skin=http://www.nervana.net/skins/email/abccorpemailskin.xslt
Start参数表示首先返回基于零的起始索引对象。End参数表示结束索引。外壳URL是选项。如果没有指定外壳URL,则客户机加载带有默认外壳的智能体。
利用agent://<agentname>@localhost访问本地存储的智能体。例如:agent://Documents.[Related to My Business Plan]@localhost将加载名为“Documents.[Related to My Business Plan]”的本地保存的智能体(在我的智能体中)。
●代理URL约定:例子如下:
agency://<agencyname>.<domainname>?query=getproperties|getstats|getagents@agentviewfilter=<agentviewfilter>&agentnamecontainsfilter=<agentnamecontainsfilter>&agenttypefilter=<agenttypefilter>&agentobjecttypefilter=<agentobjecttypefilter>
在本例中,查询参数为“getproperties”。该URL检索代理本身的属性(如名称,显示名称,是本地代理还是远程代理等)。作为选择,如果属性为“getstats”,则该URL检索代理的统计数字(智能体的总数,标准智能体的数目,复合智能体的数目,域智能体的数目,对象的总数,文档对象的数目,电子邮件对象的数目等)。在最佳实施方式中,getproperties标志是默认的,意味着如果没有指定其他参数则检索属性。如果已指定getproperties参数或getstats参数,则最好不再指定其他参数。
Agentviewfilter参数是选项,允许调用程序指定限制搜索范围的智能体视图。例如,可以在服务器上安装智能体视图“Reuters News”,以便仅仅返回用于管理路透社的新闻对象的智能体。Agentnamecontainsfilter参数是选项,允许用户利用智能体名称的搜索串过滤结果。Agenttypefilter是选项,允许用户基于智能体类型(标准智能体,复合智能体或域智能体)过滤智能体。Agentobjecttypefilter参数是选项,允许用户利用智能体管理的对象类型(如电子邮件,文档,人员等)过滤结果。例子包括:
agency://sales.boeing.com?query=getstats(对应于HTTP URLhttp://boeing.com/salesagency.asp?urltype=agency&query=getstats)
agency://sales.boeing.com?agenttypefilter=standard&agentobjecttypeidfilter=events(对应于HTTP URL
http://boeing.com/salesagency.asp?urltype=agency&agenttypefilter=standard&agentobjecttypeidfilter=events)
●对象URL约定。客户机可直接访问代理对象。URL约定为:
objects://<querystring><agencyname>.<domainname>?querytype=<objectid|searchstring>&objecttypefilter=<objecttypefilter>
Objecttypefilter参数是选项,用于利用对象类型过滤返回结果。列举已知对象类型(如document,email,event等)。例子包括:
objects://34547848@support.attwireless.com?querytype=objectid将返回objectid为34547848的对象。
objects://80211@support.attwireless.com?querytype=searchstring&objecttype=email将返回与查询串“80211”匹配的电子邮件对象。
●类别URL约定。该URL约定为:
category://<<categoryname>@<kbsurl>?semanticdomainname=<semanticdomainname>
Semanticdomainname参数是选项。在最佳实施方式中,如果省略该参数,则选择KBS的默认域。例子如下:
category://technology.wireless.all@abccorp.com/marketingknowledge.asp
对应于在abccorp.com/marketingknowledge.asp web服务上安装的知识库上的默认域的“Technology.Wireless.All”类别。将其解析为以下HTTP URL:http://abccorp.com/marketingknowledge.asp?category=“technology.wireless.all”该类别URL的完全限定版本的例子为:
category://technology.wireless.all@abccorp.com/marketingknowledge.asp?semanticdomainname=“/InformationTechnology”
共享和漫游客户信息。在最佳实施方式中,通过经由电子邮件,及时消息等发送智能体(包括混合器),用户能够与他人共享智能体。本地信息用户最好能够在本地存储智能体信息,或使信息漫游(例如,经由Windows 2000支持的AbccorpliMirror在部门内漫游,经由全局代理目录上的专有XML Web服务(使用密码进行身份验证),或通过与Microsoft.NET My Service进行集成,其中后者使用MicrosoftPassport身份服务)。
本地代理。系统客户机最好允许用户创建并向“我的代理”列表添加本地代理,其中本地代理运行KIS的本地实例。在本实施方式中,客户机允许用户删除个人代理。
用户体验一致性和非破坏性。本发明的信息智能体(语义浏览器)提供一致的、非破坏性的用户体验。换句话说,信息智能体与当今的Web浏览器无缝共存。诸如“后退”,“前进”,“主页”,“停止”,“刷新”和“打印”之类的工具最好与当今Web浏览器的工作方式相同,从而不会使用户感到混乱。许多工具得以保留,虽然其功能性不同。另外,最好向工具栏和菜单选项添加新工具,以反映语义浏览器的新功能(通过观察屏幕快照上的工具栏可以看到)。
图78和79表示本发明的典型功能映射,说明在保持隐喻一致性的情况下向用户引入新功能的最佳映射。图78为当今Web浏览器与本发明的信息智能体的最佳实施方式的默认用户界面工具集的比较结果。图79为文件系统Microsoft资源管理器/文档查看器与本发明的信息智能体的最佳实施方式的默认用户界面工具集的比较结果。
5.在本发明中提供语境
                      a.语境模板
本发明提供语境模板,即情景驱动的信息查询模板,该模板映射到信息访问和检索的特定语义模型。本质上,可以将语境模板看做个人数字语义信息检索“通道”,该通道通过使用最佳语义模板向用户交付信息。在最佳实施方式中,语义浏览器30允许用户通过使用语境模板初始化智能体的属性来创建新的“特殊智能体”。语境模板最好聚集一个或多个代理的信息。
举例来说,本发明定义以下语境模板。旨在综合、分发各类语义信息的附加语境模板均在本发明的范围内(例子包括与“生气”、“悲伤”之类的情绪有关的语境模板;用于位置,移动性,环境条件,用户任务等的语境模板)。
“标题”语境模板。标题语境模板(以及由此生成的特殊智能体)在传递语义信息方面,类似于CNN的“标题新闻”节目的个人数字版本。语境模板允许用户访问一个或多个代理的信息标题,其中根据信息创建或发布时间以及定义信息“新鲜度”的可配置时间量对代理进行分类。例如,CNN的“标题新闻”显示每隔30分钟的标题(昼夜不停)。在最佳实施方式中,本发明的信息智能体30允许用户使用以下过滤器和参数创建标题特殊智能体:
●信息对象中心点。由此生成的混合器显示与此类对象有关的结果。为可选参数。如果没有指定该参数,则显示整个代理的标题(没有任何基于对象的过滤器)。
●预定“新鲜度”周期。如30分钟,1小时等。
●谓词。定义信息对象中心点链接到检索信息的方式。例子为:“related to”,“possibly related to”(使用基于文本的搜索),“authored”(在person对象的情况下),“possibly authored”,“has expertise on”等。在默认情况下,使用默认谓词“relevant to”。代理通过以智能方式将默认谓词映射到特定谓词,解析默认谓词。
●代理。包括在其上检查标题的代理。必须指定至少一个代理,可以指定的代理的数目没有限制。用户可以指示是否使用“最近”和/或“收藏夹”列表中的所有代理。
●类别列表。如“Technology.Wireless.All”。作为查询的附加过滤器。
除新鲜度之外,标题语境模板最好包括结果项目的“热度”,以确定结果的排序。通过查询代理查找该代理上语义关联的对象数目,实现该处理,其中该对象数目为体现对象主题的“热度”的合适指示器。另外,最好按新鲜度对返回对象(或项目)进行分类。
例如,附录中的示例D说明最佳实施方式的标题语境模板的SQML输出。在本例中,语境模板检索四个不同代理(marketing,research,sales和human resources)的所有信息,其中新鲜度时间间隔为30分钟,谓词为“relevant to”(表示语义查询)。在最佳实施方式中,关于所有语境模板,本例的SQML可以构成灵巧镜头,灵巧复制粘贴,拖放以及语义工具箱中的其他工具的基础。
“突发新闻”语境模板。突发新闻语境模板(以及由此生成的特殊智能体)在传递语义信息方面,类似于中断正常节目的CNN的“突发新闻”节目插播的个人数字版本。和CNN的“突发新闻”插播一样,该语境模板允许用户访问一个或多个代理的“突发的”、时间紧急信息,最好按信息创建或发布时间或事件发生时间(在事件情况中)对代理进行分类,代理具有定义新鲜度的可配置时间量,以及定义事件的时间临界的可配置的“最后期限”。例如,可以定义语境模板以过滤前一小时张贴的信息对象,或下一天举行的活动。
在最佳实施方式中,突发新闻语境模板与突发新闻智能体不同。语境模板为定义向一个或多个代理传送的静态查询参数的模板。突发新闻智能体为用户创建的灵巧智能体,实质上是用户创建的,用户定制的。例如,基于突发新闻语境模板的突发新闻特殊智能体可以通知用户与本地文档(或任何其他本地语境,如果指定的话)有关的在前一小时张贴的信息对象,或者在下一天举行的活动。但突发新闻智能体使用户能够灵活接收“我的组员汇报的无线技术方面的、未来24小时内在西雅图或波特兰举行的、与硬盘上的文档有关的活动的”警告。与突发新闻语境模板相比,突发新闻智能体能够为用户提供更大的灵活性和更多个性化。突发新闻语境模板的优点在于,通过使用限定参数作为特定用户的“突发”界限,形成内部警报的基础。
“会话”语境模板。会话语境模板(以及由此生成的特殊智能体)在传递语义信息方面,类似于CNN的“交叉射击”节目的个人数字版本。和使用会话和辩论作为信息分发语境的“交叉射击”一样,在最佳实施方式中,会话特殊智能体跟踪电子邮件张贴,注释和有关信息的线索。可以将会话语境模板看做利用电子邮件对象类型过滤的的标题语境模板。除“标题”参数之外,会话语境模板最好(但可选)包含以下参数:
●返回的最小线索长度。用户选择指示他只需要带有至少一个回复,两个回复等的电子邮件线索。在许多情况中,线索数目提供语义重要性的指示。默认值为零。
●分发列表过滤器。用户选择限制返回电子邮件为“发件人”,“收件人”,“抄送”或“密件抄送”行上的一个或多个分发列表的成员。从而允许用户监视首选小组,部门等的辩论。
●分发行过滤器。用户选择限制返回电子邮件为“发件人”,“收件人”,“抄送”或“密件抄送”行上的过滤电子邮件地址。基于新鲜度或基于会话线索的深度对返回项目进行分类。
“制造新闻的事件”语境模板。制造新闻的事件语境模板(以及由此生成的特殊智能体)在传递语义信息方面,类似于NBC的“新闻会客室”节目的个人数字版本。此时,强调“新闻人物”,而不是新闻本身或会话。用户使用返回的人物作为信息对象中心点导航网络。可以将制造新闻的事件语境模板看做标题语境模板,最好带有“People”和“Users”对象类型过滤器,以及“authored by”,“possibly authored by”,“hosted by”,“annotated by”,“expert on”等谓词(把人物和信息关联起来的谓词)。最好使用“relevant to”默认谓词覆盖所有有密切关系的特殊谓词。基于“他们制造的新闻”的次序,如标题,对有关信息(如制造新闻的事件)的排序次序进行分类。除标题语境模板参数之外,制造新闻的事件语境模板最好包括以下可选参数:
●分发列表过滤器。用户选择限制返回电子邮件为“发件人”,“收件人”,“抄送”或“密件抄送”行上的一个或多个分发列表的成员。从而允许用户监视首选小组,部门等的辩论。
●分发行过滤器。用户选择限制返回电子邮件为“发件人”,“收件人”,“抄送”或“密件抄送”行上的过滤电子邮件地址。
“即将发生的事件”语境模板。即将发生的事件语境模板(以及由此生成的特殊智能体)在传递即将发生的事件信息方面,类似于特殊节目的个人数字版本。例子包括诸如“世界丛书”,“NBA决赛”,“足球世界杯决赛”之类的特殊活动。知识工人情景中的等价物是希望监视与一个或多个类别、文档或其他信息对象中心点有关的所有即将发生的行业活动的用户。即将发生的事件语境模板最好与标题语境模板相同,只是过滤并显示即将发生的事件(最好使用包含事件和时间临界值的语义正确的“语境外壳”)。最好基于时间临界值对返回对象分类,首先列出最紧急的事件。
“发现”语境模板。发现语境模板(以及由此生成的特殊智能体)类似于“发现频道”的个人数字版本。此时,强调有关特定主题的“记录”。和“标题新闻”情况不同,语义信息访问和检索的主轴不是时间。相反,它是一个或多个类别,以智能方式聚集该类别周围的信息。在本发明的最佳实施方式中,发现语境模板通过随机选择与给定类别集合有关并且在预定的可配置时限内张贴的信息对象,模拟信息的智能聚集。尽管存在可选的可配置时限,最好考虑与时间不同的语义权重,以确定信息的排序或显示方式。本发明考虑了使用不同主轴,例如,正在“发现”的类别的语义权重,时间,随机性,或所有主轴的组合(很可能增加“发现”的效力)。发现语境模板最好具有与标题语境模板相同的参数,只是利用可选最大期限界限代替新鲜度时间间隔,最大期限界限表示智能体返回的信息(粘贴到代理上)的最大期限。
“历史”语境模板。历史语境模板(以及由此生成的特殊智能体)类似于“历史”频道的个人数字版本。此时,强调分发信息,不仅是特定主题的信息,而且带有历史语境。对于该模板,最佳主轴为类别和时间。历史语境模板类似于发现语境模板,进一步与“最小期限界限”相呼应。该参数最好与发现语境模板的参数相同,只是利用“最小期限界限”参数(或可选“历史时间间隔”参数)替换“最大期限界限”参数。另外,最好基于自创建以来的系统内的期限或其期限,按相反次序对返回对象分类。
“所有措施”语境模板。所有措施语境模板(以及由此生成的特殊智能体)代表返回任何信息的语境,该信息或者基于语义相关,或者基于关键字或基于文本的搜索相关。此时,强调分发信息,甚至是与该语境远程相关的信息。所有措施语境模板的主轴最好仅仅是关联度的可能性。在最佳实施方式中,所有措施语境模板同时使用语义和基于文本的查询,以便返回有关结果的最可能的集合。
“最好的措施”语境模板。最好的措施语境模板(以及由此生成的特殊智能体)代表仅仅返回高度相关信息的语境。在最佳实施方式中,强调分发高度关联并且语义重要的的信息。对于该语境模板,主轴是关联度。本质上,最好的措施语境模板使用语义查询而不使用基于文本的查询,因为后者不能保证基于文本的查询结果的关联度。最好利用类别过滤器或关键字初始化最好的措施语境模板。如果指定关键字,则由服务器动态进行分类。最好基于关联度分值,或从对象到类别过滤器的“belongs to category”语义链接的强度,对结果分类。
“收藏夹”语境模板。收藏夹语境模板(以及由此生成的特殊智能体)代表返回“收藏夹”或“通用”信息的语境。此时,强调分发他人认可并且得到公认的信息。在最佳实施方式中,收藏夹语境模板的主轴包括读者身份兴趣的级别,对象收到的“评论”,以及该对象上的注释线索的深度。在一种实施方式中,收藏夹语境模板仅仅返回具有“favorites”语义链接的信息,并且通过计算对象的“选票”数进行分类(基于该语义链接)。
“古典”语境模板。古典语境模板(以及由此生成的特殊智能体)代表返回“古典”信息或具有公认价值的信息的语境。和收藏夹语境模板一样,强调分发他人认可并且得到公认的信息。对于该语境模按,首选主轴包括历史语境,读者身份兴趣,对象收到的“评论”以及该对象上的注释线索的深度。最好基于收藏夹语境模板实现古典语境模板,但是带有附加的最小期限界限过滤器,其实质是“老收藏夹”语境模板。
“建议”语境模板。建议语境模板(以及由此生成的特殊智能体)代表返回“建议”信息或代理推测用户感兴趣的信息的语境。通过向“SemanticLinks”表添加“recommendation”语义链接,并挖掘用户指示的收藏夹语义链接,插入建议。最好使用机器学习和协同过滤之类的技术提出建议。该语境模板强调分发用户可能感兴趣但用户并未看到的信息。对于该语境模板,主轴最好包括兴趣的可能性和新鲜度。在最佳实施方式中,通过生成具有PREDICATETYPEIDISLIKELYTOBEINTERESTEDIN谓词作为语义环境中的代理上的主谓词过滤器的SQML,实现该语境模板。
“今日”语境模板。今日语境模板(以及由此生成的特殊智能体)代表返回“今日”张贴或举行(在事件情况中)的信息的语境。该语境模板强调分发被认为是当前信息的信息,其中基于“今日”过滤器确定新鲜度。在最佳实施方式中,今日语境模板结果为标题语境模板结果的子集,其中显示“今日”张贴的结果和“今日”举行的活动。
“多样性”语境模板。多样性语境模板(以及由此生成的特殊智能体)代表返回随机信息的语境。该语境模板强调分发随机信息,以便用户获得各种可能的信息项目。在最佳实施方式中,主轴为随机性,虽然“随机”项目在语义上与查询过滤器有关(使用“relevant to”谓词)。
                       b.语境外壳
本发明包括称为“语境外壳”的特殊种类的外壳。语境外壳包括表示信息,后者传送它们代表的语境的语义。例如,今日语境模板的语境外壳可以显示其时钟指向午夜的背景或过滤器效果,或“今日”的其他表示。在另一个例子中,多样性语境模板的语境外壳可以显示变换效果,如随机落下的保龄球(表示结果的随机性);突发新闻语境模板可以显示带有闪烁文本,救护车红灯等的效果和灯光动画,以指示语境的临界性;以及历史语境模板可以显示表示“年龄”的图形,如老式车,时钟等。
语境外壳最好“尊重”正在显示的对象类型的表示模板。例如,除表示语境模板的图形之外,可利用表示邮票或邮车的背景显示电子邮件对象。由于某些语境模板穿过代理—因此穿过本体分类—所以无需显示表示本体分类的任何信息(如行业信息)。然而,利用类别过滤器初始化的语境外壳最好表示该语境模板的类别或本体分类。通常,利用象征行业或本体分类流派的图形元素(和过滤器,变换等)表示语境外壳。例如,药品语境模板可以有表示实验室设备的过滤器效果;油气语境外壳可以显示石油钻塔的图片;以及运动语境外壳运动齿轮等的图片。
                      c.外壳模板
本发明允许用户根据手边的任务选择不同种类的外壳。灵活表示的含义是用户能够基于当前任务选择最好的表示模式。例如,当用户在其主机上工作,并且生产率非常重要而效果并不重要时,用户可以选择一个精细外壳。当生产率很重要,而效果也同样重要时,用户可以选择一个适中外壳。对于辅助机器之类的情景,例如当用户在其周围视觉内查看信息,并且用来警告突发新闻的文本语音之类的功能很重要时,用户可以选择一个令人兴奋的外壳。令人兴奋的外壳的特征可以是动画,诸如深层信息效果之类的情节串连图板,在运动轨迹上显示的对象,以及其他效果。最好与屏幕保护程序一起使用令人兴奋的外壳。外壳选择最好是用户可定义的。
                      d.默认谓词
在最佳实施方式中,每个对象类型包括一个把该对象类型与其他对象类型联系起来的默认谓词。从而为用户提供把对象动态联系起来的直观方法,无需单独评估用于语义链接的谓词。例如,从文档对象到返回文档的智能体的拖放操作可以具有谓词“Related To”和“Possibly Related To”。当把文档对象拖放到文档智能体上时,本发明的语义浏览器显示一个弹出菜单选项,该选项允许用户选择用于语义查询的谓词。在选择实施方式中,可以包含其他有关弹出菜单,例如,允许用户选择链接或谓词模板的第一弹出菜单;显示所选模板的实际谓词的子弹出菜单。最好将默认谓词插入到从其调用查询的动态生成的SQML中。
例如,默认谓词可以为“relevant to”。该谓词映射到一个查询,该查询返回与所拖动对象有关的文档智能体中的信息。在此情况中,具有默认谓词的优点在于,本发明的语义浏览器可以显示名为“打开”的弹出菜单选项,进而调用使用该谓词的查询。语义浏览器也可以显示名为“从链接开始(Open with Link)”的弹出菜单选项,该选项具有带有特定谓词的子菜单选项。默认谓词使得系统更容易使用,因为用户能够使用动态链接浏览系统,了解默认谓词为提供源对象的敏感选项,了解目标智能体或对象。
除在拖放情景中使用之外,默认谓词也可以在灵巧镜头,灵巧复制粘贴等操作中使用。在给定语境下,可以用类推法说明默认谓词,以使返回“正确事物”的灵巧链接退化。默认谓词最好为“relevant to”,后者生成“正确事物”作为一个语义距离的适当查询结果。在选择实施方式中,默认谓词可以为若干特定谓词的混合。例如,文档人物拖放,复制或粘贴,灵巧镜头的默认谓词可以为“relevant to”,并且KIS代理XML Web服务可以将其解释为包括“authored”,“expert on”和“annotated”谓词的层叠查询。换句话说,本发明灵活解释“relevance”,并且“relevance”包括合并不同谓词。
默认谓词允许用户快速有效地导航系统,并且不需要什么推理能力。默认谓词为系统提供简单性,并使其使用直观。另外,用户会对默认谓词感到舒适,因为用户已经习惯调用当今Web上的HTML链接,其中当今Web只有一个谓词“调用”。
                       e.语境谓词
语境谓词为在高级抽象层上定义的谓词,语境谓词映射到语境模板的有关子集。语境谓词允许用户基于语境模板而不是基于低级系统谓词选择谓词过滤器。当利用语境谓词调用查询时,利用语境模板的过滤器参数过滤包含的SQML会生成一个新的SQML查询。例如,语境谓词“最好的措施(Best Bets)”映射到同一名称的语境模板,利用为“最好的措施”(通常为语义查询而不是基于文本的查询返回的项目)的信息对象过滤查询。同样,突发新闻语境谓词基于是否限定突发新闻语境模板的过滤条件过滤项目。通常,对和语境模板一致的对象类型应用语境谓词(例如,语境谓词“Experts”和“Newsmakers”仅仅对返回“Person(人员)”对象的查询有效)。
                        f.语境属性
语境属性为高速缓冲的“虚拟属性”,作为代理向客户机返回的各XML对象的一部分。这些属性是动态的,因为它们反映显示结果的当前语境。例如,在相关时,将语境属性“最好的措施”附加到满足当前查询的SQML中的语义查询过滤器的各XML结果中。带有默认谓词的语义查询的结果可能同时包括语义和非语义(基于文本的查询)结果。处理该查询的代理可以高速缓冲作为“最好的措施”的XML结果的语境属性,其方法是在结果对象作为过滤器的SQML上运行语义子查询。此时,“Object”和导出类型的模式应包括各有关语境模板的属性字段(如“Best Bet”属性,“Headline”属性等)。这是首选实施方式。作为选择,语义浏览器调用代理,作为参数传送各XML对象,并“询问”该对象是否满足语境属性。其他例子为用来表示是否将对象限定为当前查询语境中的“标题”的标题语境属性,“古典”属性等。语义浏览器应显示是否设置语境属性的用户界面。
语境属性比现有系统更有优势,因为它们使系统的使用更容易。例如,用户可以执行拖放操作,以生成同时包含语义和非语义查询过滤器的关系查询(正如代理收到客户机的SQML参数时进行的处理那样)。在一种实施方式中,浏览器“询问”用户是否需要概括查询或“最好的措施”查询。在此方式中,用户在发出查询前有效应用附加过滤器。作为选择,和语义浏览器相呼应的代理最好返回概括查询的结果,并利用语境属性限定各结果,相应用户界面表示各结果对象为“概括”结果还是“最好的措施”结果。这同样适用于诸如“Person”对象类型之类的其他对象类型。对于当前语境,浏览器可以发出概括查询,并利用各返回“Person”对象是否为“author”,“expert”或“annotator”限定结果(借助代理的帮助),而不是由用户指示Person智能体的关系查询应返回“authors”,“experts”还是“annotators”。
                     g.语境调色板
语境调色板为本发明的强大功能,包括动态调用语义浏览器内的当前选定对象的语境模板。本质上,最好在用户选择结果窗格内的对象时,自动调用并显示语境调色板。语境调色板使用户能够总是拥有当前显示结果的语境。另外,语义浏览器不断刷新当前选定对象的调色板,从而确保该对象的语境总是最新的。在最佳实施方式中,通过触发刷新操作的定时器,或者通过查询语境调色板的SQML查询处理器自上次刷新调色板以来是否有任何新对象,完成上述处理。
在最佳实施方式中,语境调色板内显示的结果为“头等”信息对象,类似于主结果窗格中显示的信息对象。换句话说,最好与本发明的所有语义工具,如灵巧复制粘贴,灵巧镜头,深层信息等一起使用语境调色板。这同样适用于在本发明的其他语境窗格中显示的结果。
本发明最好包括以下语境调色板。在最佳实施方式中,用户有权“滚动”选定对象的不同语境调色板。包含的不同附加语境调色板需要预先考虑,可以并行添加语境调色板。
“标题”语境调色板。该调色板使用标题语境模板并采用SQML,所述SQML具有带有当前选定对象的附加链接的标题语境模板的SQML,以及对象类型组合的默认谓词。特别地,该SQML为映射到语义环境中的所有收藏夹智能体或最近使用的智能体的切断资源。用户配置生成语境调色板时是否使用收藏夹智能体,或最近使用的智能体,抑或二者。另外,标题语境调色板也是可配置的,以显示不带过滤器的标题,用于要显示的对象数或“新鲜度”期限。此时,调色板允许用户导航按发布时间或张贴时间分类的所有关系结果。
“突发新闻”语境调色板。包含与当前选定对象链接的、使用对象类型组合的默认谓词的语义环境中各突发新闻智能体的关系结果。另外,显示默认突发新闻语境调色板的结果。本发明的语义浏览器动态生成其资源或链接组合数与突发新闻智能体数相同的SQML,其中附加链接具有默认谓词以及当前选定对象的资源限定符(文件路径,文件夹路径,object://URL等)。本发明的语义浏览器调用生成的SQML查询,并为调色板窗口加载SRML结果。突发新闻语境调色板最好包含导航控件,以允许用户导航语境调色板内的结果。
“会话”语境调色板。类似于标题语境调色板,只是使用会话语境模板。
“制造新闻的事件”语境调色板。类似于标题语境调色板,只是使用制造新闻的事件语境模板。
“即将发生的事件”语境调色板。类似于标题语境调色板,只是使用即将发生的事件语境模板。
“发现”语境调色板。类似于标题语境调色板,只是使用发现语境模板。
“历史”语境调色板。类似于标题语境调色板,只是使用历史语境模板。
“所有措施”语境调色板。类似于标题语境调色板,只是使用所有措施语境模板。
“最好的措施”语境调色板。类似于标题语境调色板,只是使用最好的措施语境模板。
“收藏夹”语境调色板。类似于标题语境调色板,只是使用收藏夹语境模板。
“古典”语境调色板。类似于标题语境调色板,只是使用古典语境模板。
“建议”语境调色板。类似于标题语境调色板,只是使用建议语境模板。
“今日”语境调色板。类似于标题语境调色板,只是使用今日语境模板。
“多样性”语境调色板。类似于标题语境调色板,只是使用多样性语境模板。
“时线”语境调色板。该语境调色板最好包含标题,最好的措施,历史和即将发生的事件语境调色板的合并结果。时线语境调色板最好允许用户基于当前选定对象导航语义时线上的所有对象。时线包含基于其发布/张贴时间的信息项目,基于其约定时间的事件项目等。本质上,借助时线语境调色板,用户能够使用时间作为信息传播的主轴,导航有关(或其他语义关联)对象。
“指南”语境调色板。本发明的最佳实施方式包括一个统一的指南语境调色板。该语境调色板组合所有语境调色板。换句话说,指南语境调色板中的每个窗口对应于其他系统语境调色板的每个调色板的一个结果。指南语境调色板的用户界面允许用户滚动各窗口中各语境调色板的的结果,或使用诸如淡入/淡出之类的动画技术使结果富有生气。指南语境调色板的首选用途是在最小查看空间中查看当前选定对象的语境。在最佳实施方式中,用户选择以并排方式(垂直,水平,对角线等),停泊方式,或以其他排列格式,查看所有语境调色板。
语境调色板用户界面。最好能够基于当前显示的智能体的布局外壳配置语境调色板的用户界面。在最佳实施方式中,可以将语境调色板停泊到结果窗格的左部,右部,上部或底部。可以折叠语境调色板,以便以最小化方式插入到显示区域中,然后动态展开为全视图。外壳允许将语境调色板窗口调整为可变大小,或预先设置的固定大小。作为选择,某些外壳能够使语境调色板结果富有生气。
例如,图80为用户界面,表示智能体结果以及相应的语境调色板。在该例中,将若干语境调色板折叠起来,并将语境调色板垂直停泊到显示区(即结果窗格)的右侧。
                      h.内部警报
在最佳实施方式中,除突发新闻智能体之外,本发明还提供内部警报。尽管在概念上类似于突发新闻智能体,但内部警报的操作根本不同。关于突发新闻智能体,本发明在轮询用户指定的各突发新闻智能体并查询各智能体以查明是否存在与当前的突发对象有关的事物后,用信号通知用户突发新闻通告。内部警报不要求用户指定突发新闻智能体,或执行任何操作以引入突发新闻通告。当内部存在与待解决的对象有关的事件时,在用户界面(所有当前显示的对象)上自动用信号通知内部警报。例如,如果当前对象为文档,则本发明轮询该文档来自的代理,询问该代理最近是否在该代理上张贴了与该对象有关的信息。如果当前对象为人员,则本发明轮询代理,询问此人最近是否发送过电子邮件,最近是否张贴过文档,最近是否给文档作过注解,最近是否加入过或退出过分发列表等。从而允许用户拥有采取时间制约方式的对象的本机语境内的适当信息。
在最佳实施方式中,内部警报的默认实现仅仅轮询该对象来自的代理。其优点是简化用户界面;如果用户希望执行跨代理查询,则他可以选择拖放,复制粘贴等,以调用关系查询。在选择实施方式中,内部警报将轮询多个代理,包括除该对象来自的代理,以努力定位突发新闻通告。
在选择实施方式中,可以配置本发明以维护用户是否访问对象的信息。类似于电子邮件服务器记录用户读取的电子邮件。在代理支持每对象每用户服务器端状态的实施方式中,内部警报永远是准确的,因为只有代理上存在与用户没有访问或没有读取过的正在讨论的对象关联的信息时,代理才表示存在“内部突发新闻”。该选择方式最好为SQML查询上的附加过滤器的完成装置。
该实施方式需要的每对象每用户服务器端状态选择具有许多缺点,特别是具有大量信息并且有大量用户的代理(如基于因特网的代理)。在该情况中,如果维持每对象和每用户的状态,则该系统不能很好地缩放。
在代理不支持每对象每用户服务器端状态的选择实施方式中,可以利用内部警报的静态新鲜度期限配置代理。例如,可以将服务器的新鲜度期限配置为30分钟,此时,如果在与查询中的对象有关的新对象到达后的30分钟内收到内部警报查询,则服务器作出肯定应答。在最佳实施方式中,KIS代理维护平均信息到达率方面的信息。这样,比较繁忙的服务器的新鲜度期限将低于很少收到新信息的服务器的期限。此种实施方式不如记录每对象每用户状态的服务器准确,因为平均到达率只能生成是否用信号通知警报的近似值。此种实施方式将导致减少的信息损失。在最佳实施方式中,本发明选择以非侵入方式用信号通知内部警报,其中非侵入方式暗示其概率性质(即警报只是最好的猜测)。
                       i.灵巧建议
灵巧建议代表使用对象作为信息对象中心点的语义网络的语义查询,用于推测的语义链接。例如,推理机基于用户过去参加的活动,他们参加了与该活动有关的许多电子邮件会话的事实,推测用户可能参加某个活动。例如,在最佳实施方式中,可以在诸如图81所示的灵巧建议弹出语境结果窗格中获得此类信息。类似于用户以建议语境模板为背景查看给定对象。
在最佳实施方式中,每个链接是由对象外壳或特殊建议信息窗格外壳生成的,并链接到包含推测的语义链接的谓词的SQML。
6.本发明的属性益处
本发明的信息神经系统提供对数据和信息的适当语境,含义和有效访问,以允许用户获取行动知识。相对于当今的Web和概念上的语义Web,信息神经系统的许多优点源于使用图82所示的技术层。本发明的各种实施方式说明其优点,因为生成用于知识检索,管理和交付的完整无缝实现框架和由此引起的方法需要有关属性,包括语义/含义;语境制约;时间制约;自动和智能发现能力;动态链接;用户控制的导航和浏览;参与网络的非HTML和本地文档;灵巧传送所显示信息之语义的灵活表示;逻辑,推理和推论;灵活的用户驱动的信息分析;灵活的语义查询;读/写Web;注释;“信任网”;信息包(“混合器”);语境模板,以及面向用户的信息聚集。
语义/含义
本发明采用语义链接,本体分类,以及使用XML的其他意义明确的数据模型。因此,上述代理具有语义网站的能力,因为其信息包含语义。另外,通过提供含义作为XML Web服务的固有部分,进一步提供与主题信息关联的语境制约,时间制约。
语境制约
上述智能系统智能体监视用户的私有语境,并且当存在与特定语境有关的信息源上的有关信息时,自动警告用户。例如,特定语境包括:
●我的文档
●我的Web门户
●我的收藏夹网站
●我的电子邮件
●我的联系人
●我的日历
●我的客户
●我的音乐
●我的位置
●“本”文档
●“本”网站/网页
●“本”电子邮件
●“本”联系人
●我的日历中的“本”事件
●“本”客户
●“本”音乐曲目,唱片或播放列表
本发明通过使用与服务器10关联的信息智能体以及通过语义浏览器30和关联的XML Web服务,提供语境制约用户体验。例如,用户将“我的文档”,“我的电子邮件”等中的信息(从诸如文件系统,Microsoft Outlook之类的应用程序孤岛),自动连接到具有语义关联信息的远程信息源。通过诸如上述新查询工具之类的驻留在语义网络顶部的应用程序级的创新,如拖放,灵巧镜头,灵巧复制粘贴等,用户能够以实时方式实现连接。同时,可以独立于语义网络使用此类应用程序工具,例如集成到当今Web的现有浏览器中。
在最佳实施方式中,本发明的KIS将语义Web或带有语义标注的其他知识库的语义信息抽取到(最好通过RDF插件)语义网络中。作为选择,本发明的系统10可以在没有语义Web的情况下存在。在该情况中,KIS根据系统管理员选择的数据源(如电子邮件,文档等),构建其特有的语义网络(如私有语义web)。本发明的系统10能够利用带有语义后端的实际语义应用程序(可选择包括语义Web)。因此,系统10通过集成客户端应用程序(包括专有语义浏览器30),位置跟踪工具,以及专有XML Web服务(语义Web没有描述),提供语境制约。更准确地说,尽管概念语义Web描述了语义链接和知识表示的体系结构,但并没有解决情景和使用XML Web服务来提供语境制约,时间制约,动态链接,语境模板,语境调色板等创新。相反,本发明通过语义数据模型和语义网络解决语义链接,并且通过集成专有XMLWeb服务提供用于语境制约,时间制约,语义查询,动态链接,语境模板,语境调色板等的软件服务。
时间制约
本发明具有时间制约的固有概念。例如,通过提供与突发新闻智能体,突发新闻语境模板,突发新闻语境调色板和内部警报之类的时间制约有关的功能,本发明说明作为语义和表示中的元素的时间的重要性。尽管并不绝对正确,但是一般而言旧信息并不像信息那样重要。例如,当CNN中断新闻广播披露突发新闻时,基于语义的组合(要显示的突发新闻的关联度)和该新闻确实是突发新闻的事实进行中断。Web作者明确插入时间优先分析的罕见情况除外,当今的Web和概念语义Web完全缺乏作为警报和表示主轴的时间制约要素。
本发明允许用户选择灵巧智能体作为突发新闻智能体。当存在突发新闻智能体的有关突发新闻时,正在显示的信息将显示警报。例如,借助本发明,用户能够创建以下智能体:“路透社今天公布的所有公文”或“未来24小时内在西雅图举行的与计算机技术有关的所有活动”作为突发新闻智能体。由于上述智能体为个人的(“突发”是主观的并取决于用户),所以浏览器提供独特的个体支持。在另一个例子中,位于西雅图的用户能够获悉未来24小时内在西雅图的事件,未来一周内(期间他可以找到便宜航班)在西海岸的事件,未来14天内在美国的事件(预先注意大部分美国航线以定购价格适中的横穿大陆的航班),下月在欧洲的事件(可能因为他需要该时间量来预定旅馆),以及未来六个月内在世界各地的事件。
本发明还支持突发新闻语境模板,其中用户基于该模板创建突发新闻智能体。另外,本发明支持突发新闻语境调色板,该调色板允许用户在“突发新闻”的基于模板的定义的语境中查看所有显示的结果,从而以智能方式无缝集成语境和时间制约。
本发明还提供强大的个人历史家工具,以进行历史分析。通过使用浏览历史,过去的事件和文档创建时间,系统10能够补偿错误存储,方法是重新调用事件的细节,例如显示查询“出席从6/1/98到6/1/99的设计会议的同事”的结果。作为选择,该系统可以查找事件的群集。例如,调查员可以寻找“从7/1/01到9/11/01期间与航空股票有关的市场交易大于$10M的所有股票”或“显示在该事件的十日窗口内创建的所有文档”。
自动和智能发现能力
本发明的系统10具有发现的固有概念。在最佳实施方式中,KIS自动宣布其在本地多点传送网络,企业目录(如LDAP目录或Windows2000 Active Directory),对等网络或其他系统上的出现。理论上,语义浏览器30周期监听多点传送或对等通告,检查企业目录或全局代理目录。同时,浏览器允许用户按分层方式导航系统,以定位附加代理。这样,当新代理可用或者现有代理期满时,通知用户。当可以通过名字空间使用新代理时,本发明的语义浏览器最好立即通知用户,并且周期检查通告和目录存在。
对等方式允许系统10伸缩,并自动填充企业目录而无需任何集中维护(对组织而言,集中管理需要大量费用)。该系统最好使用计划性查询获取服务器的新类,从而不再需要Web日志。
动态链接
通过采用具有固有行为的灵巧对象,系统10具有超越当今Web和语义Web的根本优势。该系统在各代理的XML Web服务中内嵌行为特征,从而语义网络中的各节点比当今Web或语义Web上的普通链接或节点更聪明。换句话说,在最佳实施方式中,本发明的语义网络中的各节点链接到其他节点,不依赖创作。每个节点均具有动态链接到代理的行为。同时,灵巧智能体提供诸如拖放和灵巧复制粘贴之类的附加功能,创建语义环境中的代理的链接,响应灵巧智能体的镜头请求以创建新链接,包括动态创建其代理上的时间制约信息的链接的内部警报,包括突发新闻的提示(其中节点能够自动链接到名字空间中的突发新闻智能体)等。上述功能显著提高了用户查找、导航新链接的能力。当用户到达网络中的某个节点时,该用户具有动态导航和自动使用灵巧代理和智能体的语境、时间的关联度的许多语义方法。通过使网络中的各节点更聪明,整个语义网络成为一个灵巧,虚拟,自愈和自创作的网络。
本发明的动态链接技术允许用户发出跨越本地/远程信息界限的查询。例如,本发明(最好通过使用SQML技术)允许用户发出以下查询:“Find me all email messages written by my boss or anyone inresearch and which relate to this specification on my hard disk(查找我的老板或研究人员书写的与我的硬盘上的说明书有关的所有电子邮件)”。客户端查询处理技术(最好通过SQML)允许上述灵活查询,因为该处理器把来自客户机的元数据和处理关系查询的远程XMLWeb服务联系起来。
灵巧和动态信息传播。本发明提供的动态链接提供智能信息传播。因为与当今Web和语义Web相比,可以从更多主轴开始导航语义网络,所以信息共享和传播变得更有效,并将信息损失降到最低程度。
用户控制的导航和浏览
与静态链接导致浏览“死胡同”的当今Web和语义Web不同,本发明的动态链接属性考虑了连续语义浏览。对于当今Web和语义Web,用户通常浏览到预期位置或实际到达没有任何可用链接的死胡同。对于动态链接,用户能够及时依靠信息空间的性质无限期地继续浏览,因为节点本身包含动态更新链接的智能。
例如,通过无缝集成本发明提供的链接和语义XML Web服务,用户将文件、链接等拖放到灵巧智能体上,以创建新的灵巧智能体。最好递归进行上述处理。反过来,可以使灵巧智能体成为突发新闻智能体(如果合适的话)。表示中的其他节点显示提示,后者表示突发新闻智能体上是否有突发新闻。继续该示例,可以将突发新闻智能体查询的结果作为灵巧镜头,后者显示更多结果。所述结果最好包括为用户提供通过网络的语境和时间制约路径的内部警报。可以将后续结果复制粘贴到任何代理上,或拖放到其他灵巧智能体上。
在最佳实施方式中,本发明的动态链接适用于语义“沙箱”内的对象(在系统10的环境中并且在语义浏览器30内显示的对象)以及可动态添加到该环境中的外部对象。从而提供了从现有文档(文件系统,当今Web或其他环境上的文档)到本发明的系统10的无缝动态移植路径。
图83表示根据本发明的最佳实施方式的动态链接和用户控制的导航和浏览。请注意,为本例起见,“灵巧链接”指本发明的动态可编程语义链接。
参与网络的非HTML和本地文档
本发明不要求首先将文档编码为RDF或XML然后再包含到网络中。相反,KIS(或代理服务器)自动抽取所有种类文档的元数据,然后添加到语义网络中。另外,客户端动态链接,最好经由诸如拖放,灵巧复制粘贴和灵巧镜头之类的功能,确保将各种类型的本地文档链接到该网络,从而增加了网络的价值和范围。本发明自动抽取本地文档的元数据,然后调用KIS(经由其XML Web服务)以检索语义关联信息。因此,该网络不排除本地文档。本发明使用户能够将哑环境(如当今Web或文件系统)上的文档拖放到系统10上,由此提供语义智能。当元数据在系统10内之后,可以对对象使用诸如语义镜头,灵巧复制粘贴之类的语义工具。同时,直接支持从用户的文件系统和当今Web到系统10的拖放操作。
灵巧传送所显示信息之语义的灵活表示
本发明使用户能够灵活表示。由于XML Web服务送还XML而不是HTML,并且由于表示是在客户机上动态生成的,所有用户选择查看语义信息的不同“外壳”。外壳最好将XML转换为适合表示的格式(如XHTML+TIME,SVG等),从而允许用户基于各种显示技术的能力动态选择外壳。例如,SVG具备XHTML+TIME不具备的许多功能,反之亦然。用户能够选择其情景最适合SVG的SVG外壳。作为选择,用户能够选择适合其他情景的XHTML+TIME。
作为本发明一部分的外壳的灵活性规定附加情形中的应用。在各种选择实施方式中,用户能够使用文本语音外壳,该外壳可以在与主机(第一机器)并存的辅助机器上运行语义浏览器30,以帮助盲人用户;适合当前视见区大小的可动态调整大小的外壳(从而允许用户调整窗口的大小,同时保持令人愉快的用户体验);检查本地状态以显示语义提示的外壳(例如,在事件信息情况中的用户日历,例如,空闲/忙碌信息);显示内插预览窗口的外壳,其中内插预览窗口节省用户导航时间提高生产率;显示内部警报,突发新闻,深层信息,灵巧建议,固有链接,镜头信息等的不同定制提示的外壳。允许用户选择与灵巧屏幕保护程序一起使用的外壳,例如当用户希望查看屏幕保护程序模式中的智能体时。在选择实施方式中,系统10支持语境模板(见上文)外壳,语境模板如标题,制造新闻的事件,会话等。
由于考虑了灵活表示,所以本发明允许用户基于当前任务选择最好的表示模式。例如,当用户在生产率比审美效果更优先的主机上工作时可以选择一个精细外壳。当生产率很重要,但也需要效果时,用户可以选择一个适中外壳。对于辅助机器之类的情景,例如当用户在其周围视觉内查看信息,并且要求用来警告突发新闻的文本语音之类的功能时,用户可以选择一个令人兴奋的外壳。令人兴奋的外壳的特征可以是动画,诸如深层信息效果之类的情节串连图板,在运动轨迹上显示的对象,以及其他效果。
另外,可以将根据本发明的外壳选择配置为包含或排除对象类型过滤器。例如,可以将外壳配置为仅仅包含“文档”但排除“分析报告”。由于外壳获取XML结果以确定最终表示,所以外壳能够基于返回对象的对象类型(或其他属性)的检查结果来包含或排除XML(SRML)结果中的对象。
逻辑,推理和推论
本发明规定逻辑,推理和推论。KIS代理上的语义数据模型最好通过语义网络的数据库处理,语义查询到SQL或用于逻辑处理的其他数据库查询语言的转换,提供逻辑支持。另外,本发明的系统10最好包括推理机,以推测诸如特定类别或信息项目方面的专家,建议,概率链接(如某人撰写某文档的概率)之类的链接。如上所述,根据本发明的推理机最好观察语义网络,挖掘语义网络以推测新的语义链接,并在SemanticLinks表中表示作为结果的链接。
灵活的用户驱动的信息分析
本发明提供对客户机上灵活信息分析的本机支持。本发明的演示程序最好采用灵巧镜头,以允许用户在发出语义查询前预览该查询的结果。用户能够改变有关谓词和其他过滤器,以预览结果。在选择实施方式中,用户可以选择调用查询并使用该查询作为新的子查询的基础,如果需要的话。
灵活的语义查询
本发明允许用户发出非常灵活的语义查询。用户能够将本地语境合并到查询中,例如通过使用诸如“relates to this document on myhard drive(与我的硬盘上的本文档有关)”之类的过滤器。当今Web和语义Web均没有考虑该功能。另外,本发明最好包括利用专有语义查询语言(SQML)之引用的灵巧智能体,包含本地和远程资源,谓词,类别引用和对象。本发明最好包括易于使用的用户界面,以便使用简单的向导模型创建、编辑灵巧智能体(代表语义查询)。如上所述,通过递归拖放操作,系统10允许语义查询成为新查询的基础,例如,可以将文档或HTML链接拖放到现有或新的灵巧智能体上,从而创建继承性的新的灵巧智能体。作为选择,可以将灵巧智能体用作镜头,可以在其上粘贴对象以形成新的语义查询,并且可以添加到混合器中,混合器本身为语义查询容器,反过来,可以过滤混合器从而创建子混合器或子智能体容器。
读/写支持
本发明的系统10提供读/写功能支持,方法是提供允许用户直接向语义网络发布信息的XML Web服务。可以为任何文档,注释,或改正损坏链接或提供新链接的语义链接。所有这些均服从XML Web服务和操作系统层的安全性限制。系统10使用位于XML Web服务层下面的操作系统或应用服务器的身份认证,访问控制和其他服务。最好使用安全服务保护对语义网络的读写访问。
注释
本发明包括对注释的固有支持。有一个特殊谓词“Annotated By”,该谓词定义人员(person)对象和任何其他信息对象(如文档,电子邮件张贴,联机课程等)之间的注释语义链接。系统10包括注释的表示层支持,方法是允许用户经由内部链接,灵巧镜头等导航到注释。本发明包含注释的方式提供现有技术的优势(如放在适当位置的注释技术,该技术把注释作为它注解的信息对象的一部分)。在本发明的最佳实施方式中,注释为“头等”信息对象。意味着注释可以为链接的起点和终点,可以“聚焦”(使用灵巧镜头),可以复制和粘贴(使用灵巧复制粘贴)等。本发明向本发明的所有语义工具暴露注释,从而有助于获得比标准注释技术更强大的用户体验。另外,本发明的注释与语境模板一起使用。因此,推理机能够使用它们以使系统更聪明。另外,系统10通过向代理的电子邮件智能体发送特殊格式的电子邮件(带有限定消息正文),提供用于注释对象的独特的易于使用的方法。
“信任网”
本发明经由XML Web服务提供“信任网”。该服务认证希望更新语义网络,发表声明或修复/更新链接的用户。从而按次付费内容的注册订户可以通过KIS代理获得丰富内容。当用户能够利用同一平台工具无缝导航许多丰富的内容源时,会增加整个网络的价值。
信息包(混合器)
本发明规定信息包,即“混合器”。混合器为包含灵巧智能体的语义查询引用的语义容器。从而允许用户整体处理有关语义信息。用户能够分别查看混合器内的各个智能体,或查看整个混合器,好像混合器内的信息来自一个聚集智能体一样。最好通过调用XML Web服务驱动各智能体实现上述处理。在最佳实施方式中,用户将对象拖放到混合器上以创建子混合器。最好递归实现该处理。可以创建、删除和编辑混合器。用户可以向混合器中添加灵巧智能体或从混合器中删除灵巧智能体。
可以将混合器看做包含不同部分的个人报纸的数字等价物。例如:今日美国、纽约时报、华尔街日报等包含诸如新闻、商务、体育、生活/娱乐之类的不同部分。各部分对应于混合器中一个灵巧智能体,整份报纸对应于混合器。可以将本发明提供的灵活查看和导航看做能够全部顺序翻阅各报纸部分(每次一份)的用户的数字等价物,或从每部分的第一页开始,然后是每部分的第二页,…,翻阅整份报纸的用户的数字等价物。
语境模板
正如上面详细说明的那样,本发明提供语境模板,语境模板为情景驱动的信息查询模板,后者映射到信息访问和检索的特定语义模型。本质上,可以将语境模板看做利用预定语义模板向用户交付信息的个人数字语义信息检索“通道”。在最佳实施方式中,语义浏览器30允许用户创建新的混合器或特殊智能体,方法是使用语境模板初始化智能体的属性。语境模板最好聚集一个或多个代理的信息。另外,最好与语境调色板一起使用语境模板,以便提供所显示的或用户选择的任何信息对象的智能的、动态的、适当的语境。
面向用户的信息聚集
本发明具有面向用户的信息聚集的固有支持。此类情景使用户能够查看语境和时间制约信息,好像它们来自一个信息源,即使它们穿过信息知识库。通过提供面向用户的计算,提供比当今Web和概念语义Web更丰富的用户体验,其中在确定语境正确时机为用户提供正确信息,而不考虑信息源。信息智能体动态聚集跨越信息源的信息,方法是经由SQML使用客户端语义查询,然后聚集来自不同代理的SQML响应的XML结果。
E.情景
以下提供在不同实际情况中应用的本发明的最佳或选择实施方式的操作的典型情景。
1.利用本发明的语义查询示例
a.查找与文件路径c:\spec.doc上的说明书有关的所有语境
将代表文档的图标拖放到代表信息智能体的图标上。在语义浏览器中打开该文件,显示语境调色板。在最佳实施方式中,包括以下语境调色板的部分或全部:标题,发现,制造新闻的事件,即将发生的事件,时线,会话,多样性,古典,最好的措施,今日,突发新闻等。上述调色板包括名字空间中“最近”和“收藏夹”列表中的代理的有关语境。
b.查找具有无线技术专长的称呼为“R&D”的代理上所有专家
在创建智能体时,启动“新建灵巧智能体”向导,选择“使用语境模板”选项。从“选择代理”对话框中选择“R&D”代理,从类别浏览器中选择称为“无线”的类别。打开新建的灵巧智能体。
c.查找与当前查看的网页上的链接有关的路透社的所有信息
将该链接拖放到代表“路透社”的代理图标上。创建称呼为“Information on Reuters relevant to[link title](与[链接标题]有关的路透社的所有信息)”的新的灵巧智能体,在信息智能体中打开该智能体。
d.查找与当前网页上的链接有关并且与文件路径c:\spec.doc上的说明书有关的路透社的所有信息
将代表该文档的图标拖放到上面创建的智能体(“All informationon Reuters relevant to[link title]”)上。从而创建称呼为“Informationon Reuters relevant to[link title]and relevant to spec.doc(与[链接标题]有关并与spec.doc有关的路透社的信息)”的新的灵巧智能体。这表示用户控制的浏览和动态链接。
e.查找与上一个查询返回的路透社代理上的第一篇文章有关的称呼为“市场营销”的内部代理上所有电子邮件
突出显示路透社文章对象,单击“动词”按钮。显示弹出菜单。选择“复制”。查找代表名为“市场营销”的代理的图标(在Shell扩展树视图上)。右键单击该图标。单击“粘贴”。创建并打开称呼为“Information on‘Marketing’relevant to [Reuter’s article title](与[路透社的文章题目]有关的“市场营销”上的信息)”的新的灵巧智能体。集中在显示电子邮件对象的结果窗口中的框架上。
                 f.导航到电子邮件的作者
突出显示电子邮件对象并点击“链接”按钮。显示表示内部链接的弹出菜单。导航到名为“发件人:”的菜单项目上。显示表示电子邮件对象的“发件人”行上的人员对象的弹出菜单。选择所需的对象。在表示创作该电子邮件对象的人员的元数据的信息智能体中,打开新的灵巧智能体。同时在语境调色板中显示该人的语境。用户能够使用人员对象或其语境(在任意语境调色板上)继续浏览。
               g.导航到电子邮件中的附件
突出显示电子邮件对象并点击“链接”按钮。显示表示电子邮件对象的内部链接的弹出菜单。导航到名为“附件”的菜单项目上。显示表示附件名称的弹出菜单。选择所需附件。在信息智能体窗口中打开该附件作为新的灵巧智能体。在语境调色板中显示附件的语境。
   h.查找与附件有关的“能源工业事件”代理上的所有事件
突出显示附件对象并点击“动词”按钮。显示弹出菜单。选择“复制”。查找代表名为“能源工业事件”的代理的图标(在Shell扩展树视图上)。右键单击该图标。单击“粘贴”。创建并打开名为“Informationon Energy Industry Events relevant to[email attachment title](与[电子邮件附件名称]有关的能源工业事件上的信息)”的新的灵巧智能体。
        i.使用路透社作为语境浏览“我的文档”文件夹
在信息智能体中,选择“打开文件夹中的文档”。作为选择,将“我的文档”文件夹拖放到代表信息智能体的图标上。指出是否包含子文件夹。从而创建并打开名为“我的文档”的新的哑智能体。点击该智能体时,在信息智能体中打开该文件夹中该文档的元数据。当选择某个文档时,显示该文档的语境调色板。要使用路透社作为语境浏览该文档,用户查找代表路透社代理的图标,右键单击该图标,然后单击“复制”。用户将鼠标悬停到在信息智能体中表示文档元数据的任意结果上,选择表示灵巧镜头的图标。显示灵巧镜头窗口,显示关系查询的结果上的信息。除最近张贴的项目之类的信息之外,还显示与所显示的文档有关的在路透社代理上找到的项目数。另外,显示预览控件,以便用户预览适当位置的结果。用户能够选择点击结果,以打开代表新的关系查询的智能体。此后,使用语境调色板显示结果中的第一对象的语境。
j.当存在与XML技术有关并且与本文档有关的突发新闻时,利用电子邮件,语音或寻呼机发出通知
使用“突发新闻”语境并使用“XML”类别作为类别过滤器创建新的灵巧智能体。将代表本文档的图标拖放到该智能体上。从而创建带有适当名称的新的灵巧智能体。转到信息智能体中的“选项”菜单,在通知部分输入正确信息(您的电子邮件地址,寻呼号,电话号码等)。右键单击灵巧智能体,然后选择“通知”。
2.商业问题
                      a.信息访问
当今的Web。John Head-Master在FastServe公司工作,FastServe是一家位于圣地亚哥的市场营销咨询服务公司。他每天都去工作,启动他的Web浏览器。这一天,他决定浏览公司网站以查看是否能够发现新的有趣的信息。浏览器主页设置(使用企业信息门户)为公司主页。公司主页上有公司内不同部门的主页的链接。John导航到此类链接,并从此处开始点击链接。不久他就感到很泄气,因为他知道他不能导航到很多信息源,仅仅因为他不了解选取何种路径。最后他放弃了。
信息神经系统。John启动他的信息智能体(语义浏览器)。从而打开主智能体。在该页面上,他看到与产品,产品分组,报告,公司活动,联机课程以及视频演示相对应的知识链接列表。他把鼠标悬停到“产品分组”链接上。气球弹出框自动出现,表示产品分组的数目以及有关该链接的其他数据。接着他打开链接。利用可定制的外观(即“外壳”)显示产品分组对象的列表。然后,他把鼠标悬停到第一个对象上。该链接上立即出现带有以下操作的弹出菜单:“显示成员”,“列出类似的产品分组”以及“预订分组事件”。他点击“预订分组事件”,因此会用电子邮件(经由企业信息智能体)通知他与该产品分组有关的所有事件。接着,他点击“显示成员”。从而打开带有对应人员图标的新的“知识页面”。他将鼠标悬停到小组指导员Susan的图标上。从而出现气球弹出框,显示有关Susan的信息。然后出现带有以下动作的右键单击菜单:“报告给”,“列出直接报告”,“成员”,“创作的文档”和“最近出席的会议”。John选择“最近出席的会议”。从而打开带有会议对象的新的知识页面。接着,John把鼠标悬停到该对象上继续浏览。
这时,John决定搜索他前一天遇到的同事。他输入“WilburJones”。从而返回与Wilbur相对应的人员对象。接着John使用Wilbur作为信息知识中心点继续浏览。
最后,John认识到Wilbur没有他(John)需要的信息。因此John在信息智能体的搜索框中输入以下查询:“List all online courses anddocuments that relate to the upcoming 2002 sales meeting(列出与即将举行的2002销售会议有关的所有联机课程和文档)”。信息智能体(经由电子邮件智能体)返回与知识查询一致的可操作的联机课程和文档的列表。
               b.知识驱动的客户关系管理
客户触点。AnySoft是一家软件厂商,有采用100种不同语言的50种产品。他们利用其网站(anysoft.com)向其客户提供最新信息。然而,客户抱怨其网站难以导航,并且他们发现很难查找产品信息,很难预订通告。
通过部署基于本发明之实施方式的信息神经系统,AnySoft部署了能够与其现有网站共存的信息神经系统。可以从主页或搜索栏中访问信息智能体。现在,客户能够更直观地导航网站,查找产品,有关白皮书,公告,新闻稿,公司活动等。现在,客户能够发出返回可自导航和可操作知识对象的自然语言查询。该功能独自使得客户有权使用其指尖知识。同时,客户现在能够从其手持设备上使用自然语言导航AnySoft.com网站。
客户反馈和跟踪。Comp-Mart是一家有许多销售渠道的计算机外设转售商。该公司从其网站,其呼叫中心,其直销人员,其电话销售代理商那里获取客户反馈。反馈为文档和电子邮件。该公司发现以下问题,公司没有将客户反馈正确发送到需要该信息的人员。产品开发雇员向管理部门抱怨他们很难把客户反馈集成到产品开发过程中,因为他们不了解从何处查找有关信息,因为组织内没有共享关键知识。
借助适当位置的信息神经系统,现在能够将包含客户反馈的电子邮件从语义上集成到公司的语义环境中。本发明的KIS自动添加客户反馈电子邮件和诸如文档、项目以及加工有关产品的雇员之类的语义对象之间的语义链接。客户反馈以智能方式在知识空间中的正确位置“冒泡”。电子邮件智能体向可能对读取客户反馈电子邮件感兴趣的人员发送周期通知。
同时,借助信息神经系统,客户成为信息知识中心点。从而能够更快速、更容易地对客户反馈做出反应,跟踪组织内与客户有关的知识。信息神经系统自动利用有关电子邮件、文档或类似客户给客户对象作注解。这样,可经由电子邮件转发该客户的链接,并且同事能够由此导航有关信息。可以搜索、浏览客户对象。
              c.知识驱动的直销/现场服务
Marsha Mindset为JustInTime支持服务的客户服务代理,JustInTime支持服务为位于密苏里州堪萨斯城的一家计算机服务公司。Marsha拜访堪萨斯城地铁区域周围的客户,并始终携带她的无线PDA,以便在遇到困难时随时向支持总部发送电子邮件。JustInTime最近部署了KIS和电子邮件智能体。现在,每逢她有支持问题时,Marsha总能向电子邮件智能体发送电子邮件,并使用自然语言询问问题。电子邮件智能体利用直接答案或利用“知识链接”回复她的电子邮件,其中知识链接允许Marsha立即访问有关支持电子邮件,文档,或接通可以给其发送电子邮件或给其打电话的人员。同时,JustInTime直销人员可以在向客户现场销售解决方案时使用本发明的技术。销售代表携带无线PDA,并向电子邮件智能体发送请求。
                      d.案例学习
公司培训,知识转让和共享。WaveGen是一家生物技术公司,向全美国的医生提供“照管照料”解决方案。该公司最近部署了Saba学习管理系统平台以培训其雇员(特别是其销售代表)。从而降低旅行费用,并使公司的销售人员能够进行更好的准备,以便为国内不同卫生保健领域的医生服务。同时协助公司的研究人员定期获悉生物技术研究领域的最新发现。
该公司还有存储宝贵知识源的其他软件资产。该公司部署了存储文档和媒体文件的内容管理解决方案,用于电子邮件的MicrosoftExchange,以及用于联机会议的协同软件。然而,该公司已经注意到知识转让不是很有效,因为没有通过所有解决方案进行集成。销售代表指出他们没有协助他们向医生推销公司产品所需的发现组织内外的重要知识源的工具。普遍使用企业信息门户通知销售人员即将来临的联机课程和重要活动。然而,销售代表抱怨大量知识(电子邮件,文档中存储的知识)并未引起其注意,因为没有人知道谁需要这些知识。
另外,销售代表使用Microsoft Outlook在其日历中添加即将来临的与医生的约会。然而,他们抱怨他们只能获得约会提示,并且在拜访医生前不能帮助他们自动获得能更有效地销售产品的更多信息。
WaveGen最近部署了基于本发明之技术的信息智能体。该公司部署了KIS和电子邮件智能体,简化智能信息联系和行程安排,以帮助其销售和研究小组为服务客户和改进产品而做更好的决策。通过使用信息智能体,销售人员不仅能够立即访问文档,而且能够访问其手边任务直接依赖的“知识对象”。例如,销售代表现在具有“DoctorJones”作为XML对象的智能体。这不是文档或网页。相反,它的客户的语义表示。因此销售代表可以查看诸如“最近的电子邮件”,“有关文档”,“属性”,“重要日期”或“有关的即将来临的联机课程”之类的语义链接。这样,客户成为销售智能体导航内部Web的中心点。此类链接可能根据文件共享,电子邮件存储,Microsoft Exchange等生成结果。销售代表可以根据与销售代表的任务有关的语义关系发现新知识,而不是搜索或导航作为信息岛的知识源。
这样,销售代表能够拥有就在销售代表指尖的更强大的知识,从而能够提供更好的客户服务。以上知识源自同事,其他销售代理商发布的文档,可能并不知道其存在的分发列表上发送的电子邮件等。KIS通过自动构造所有不同信息源的语义联系,完成灵巧处理。销售代表可以用电子邮件将该“页面”传送给同事。从而成为非常强大的知识共享形式,因为同事能够使用相同的“Dr.Jones”中心点导航信息智能体。
电子邮件智能体还允许销售代表借助自然语言发出知识查询。查询结果是从推理机导出的,并且可能基于从现有知识中推断出的知识。本发明的信息神经系统的强大功能在于:知识转让、共享和发现均是基于语义网络自动发生的。
3.形势
             a.语义信息发现,检索和导航
Joe知识工人启动信息智能体(本发明的基于XML的语义浏览器)。当他登录时,利用表示语义内联网上有新的可用智能体的对话框提示该用户。接着,他看到组织内外的智能体列表,可能包括:
●Documents.Technology.All
●Documents.Marketing.All
●People.Divisions.Sales.All
●People.Division.Sales.Managers
●OnlineCourses.Sales.101
●OnlineCourses.Technology.XML.101
●Meetings.ThisWeek.All
●Meetings.LastWeek.All
●Books.Computers.Programming.All
●Newsgroups.Microsoft.Public.Soap
●Email.Mine.All
●Email.Mine.ProjectX.All
●Events.Technology.Wireless.All
●Reports.Gartner.Software.All
●Reports.IDC.All
●Videos.ExecutivePresentations.All
接着他选择Meetings.ThisWeek.All。信息智能体显示代表他本周出席的会议的对象列表。此信息来自Microsoft Exchange,但并不暴露给他。然后Joe把鼠标悬停到第一个会议对象的链接上。从而显示一个气球弹出框,表示内联网上刚刚有一门新的培训课程。该气球还表示有一份可能与Joe有关的IDC方面的新报告。除气球之外,还可以在该对象的右侧显示一个弹出菜单。该菜单具有以下动词:
●List participants
●List possible replacement participants
●Show Related Objects->
●On News.Reuters.MarketForecasts.All
●On Documents.Technology.All
●On Events.Corporate.Today.All
●Subscribe for follow-up
Joe选择“Subscribe for follow-up(预订跟踪)”。由此联系服务器上的会议跟踪智能体。该智能体向参会者发送有关信息的周期更新。或者通过浏览器或者通过电子邮件完成该处理。接着Joe选择Events.Corporate.Today.All上的有关对象。由此显示事件信息对象列表。Joe将鼠标悬停到第一个对象上,显示一个弹出菜单。然后Joe选择“Add to calendar(添加到日历)”将该事件添加到他的日历中。接着,Joe决定他希望查找与公司活动有关的所有行业活动。因此,他将该对象拖动到智能体Events.Technology.All上,然后释放鼠标。当释放鼠标时,浏览器加载Events.Technology.All中与他拖动的公司活动对象有关的信息对象(通过网站和其他信息岛)。
下星期,Joe收到电子邮件智能体的电子邮件。在该电子邮件中,智能体通知Joe它注意到将该事件添加到其日历中的每个人都观看了公司媒体服务器上的公司培训视频资料。该电子邮件包含一个XML链接,该链接将Joe带回到信息智能体。接着浏览器显示视频的元数据。弹出菜单上的一个选项为“Watch Video(观看视频)”。Joe选择该选项并观看视频。
下次Joe登录到工作站时,他注意到有新智能体。因此,他预订Books.Ebay.Computers.All并将其添加到我的智能体列表中。本发明的实施方式自动将该智能体添加到Joe的语义环境中。信息智能体执行隐含查询并提供包含该智能体的建议(按关联度和时间制约排列)。接着他点击该智能体,在结果窗格中显示语义信息对象(代表书籍)。当他把鼠标悬停到某个对象上时,立即显示一个弹出气球,警告他有一个该书作者主持的相关行业会议。当他点击弹出链接时,将该事件对象加载到浏览器中,包括允许他将该事件添加到他的日历(或者为Microsoft Outlook,或者为基于因特网的日历,如MSN日历(可通过微软公司的HailStorm Web服务进行访问),AOL日历等)中的动词。
情景说明。以上情景说明知识工人借助本发明访问“联合知识”的方式。在本例中,Joe的公司已经把Gartner,IDC,Reuters,Ebay等的知识智能体“导入”其知识空间中。同样,以上智能体自动将知识添加到公司的语义网络中。以上情景还说明Joe借助直观命名的灵巧智能体获得整个组织的知识空间的“对象模型”视图的方式。Joe能够使用上述智能体“进入”语义环境,然后由此开始导航。所有信息对象均是实时交付的,并且是可操作的(带有在适当位置显示的关联动词)。这样,Joe无需关心对象来自什么信息岛,它们是哪些应用程序生成的。
以上情景还说明Joe发现新信息和发现新智能体的方式。以上情景说明活动中的知识协作—经由协作过滤—其中信息智能体基于它观察到的公司内的其他雇员的活动,向Joe提出建议。
最后,以上情景说明接近有意义的语境时自动使时间制约信息引起用户的注意的方式。电子邮件智能体自动把Ebay的书籍和即将来临的行业活动联系起来,推测并分配该活动(事件)的关联度和时间制约排列,确定该活动是否足够紧急,以确保通过语义浏览器中的警报立即显示信息。
                b.对等知识共享和捕获
Nancy苦工在一家拥有40,000雇员的财富500强企业内工作。她预订大量网站,拥有其朋友或同事用电子邮件转发的信息。她刚刚获得伙伴公司中某人发送的一批文档,她希望在组织内共享该信息。她将该文档发送到她是成员的所有分发列表上。企业信息智能体也是以上列表的一个成员(在安装服务器时,智能体将其本身添加到所有公用分发列表中)。当智能体收到该信息时,对其进行分类,然后将其添加到语义网络中。然后推理机获得该信息。
几千同事并不是Nancy向其转发文档的分发列表上的成员。然而,它们都使用综合器,并且他们全部预订了Email.Public.All智能体。当他们浏览知识网的其他有关部分时,会显示一个气球弹出框,表示Email.Public.All智能体上有新的相关电子邮件。同事打开该智能体,从而显示电子邮件对象。电子邮件项目上的一个菜单项为“Showdistribution lists to which message was forwarded(显示消息转发到的分发列表)”。同事选择该选项,在浏览器中显示分发列表信息对象。接着同事把鼠标悬停到分发列表上,显示一个弹出菜单项。第一项为“Show Members(显示成员)”。第二项为“Join(加入)”。然后同事加入该分发列表。
情景说明。以上情景说明经由电子邮件发布、共享和捕获信息的方式,以及其他同事通过使用语义网络从不同但有关“知识角度”查找该信息(以及并不了解其存在的分发列表)的方式。以上情景说明完全无缝并且不要求用户向知识库公开信息也不要求用户本身对信息进行分类的对等知识共享。借助本发明的某些实施方式,所有处理均是在后台自动发生的,并且知识在有关位置“冒泡”。
如上所述,尽管举例说明描述了本发明的最佳实施方式和选择实施方式,但是可以做出许多更改而并不背离本发明的实质和范围。因此,公开的最佳实施方式或选择实施方式并不限制本发明的范围。
附录
                           典型编码规范示例A-SRML文档<?xml version=“1.0”encoding=“utf-8”?><srml xmlns=“http://schemas.nervana.net/srml”xmlns:n=“http://schemas.nervana.net/srml”
 xmlns:rdf=“http://rdfland.org”xmlns:dc=“http://dcland.org”dummyarg=“hello”>
 <results content=“new”>
    <queryref guid=“12345678-1234-1234-1234-123456789ABC”/>
    <document>
      <objectref guid=“12345678-0000-1234-1234-123456789ABC”/>
      <rdf:Description>
         <dc:title>Nsync-A Constraint Based Toolkit for Multimedia</dc:title>
         <dc:creator>Brian Bailey</dc:creator>
         <dc:creator>Joseph A.Konstan</dc:creator>
         <dc:description>
           <n:abstract>Nsync(pronounced‘in-sync’)is a declarative
             synchronization toolkit,implemented entirely in Tcl,designed to ease
             the complexity of designing innovative,interactive multimedia
             applications.</n:abstract>
         </dc:description>
         <dc:date>2001-07-02</dc:date>
         <dc:type>text</dc:type>
         <dc:format>application/pdf</dc:format>
         <dc:language>en</dc:language>
         <dc:identifier>bailey97nsync.pdf</dc:identifier>
      </rdf:Description>
      <size>84957</size>
    </document>
    <document>
      <objectref guid=“12345678-0001-1234-1234-123456789ABC”/>
      <rdf:Description>
         <dc:title>A Comparison of Streams and Time Advance As Paradigms for
           Multimedia Systems</dc:title>
         <dc:creator>Roger B.Dannenberg and Dean Rubine</dc:creator>
         <dc:description>
           <n:abstract>A common model for multimedia systems is the stream,an
        abstraction representing the flow of continuous time-dependent data
        such as audio samples and video frames.</n:abstract>
  </dc:description>
  <dc:date>2001-07-0218:48</dc:date>
  <dc:identifier>dannenberg94comparison.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>55421</size></document><document><objectref guid=“12345678-0002-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Do You Have the Time?Composition and Linking in Time-based
    Hypermedia</dc:title>
  <dc:creator>Lynda Hardman,et al.</dc:creator>
  <dc:description>
    <n:abstract>In this paper we discuss the concept of presentation time-
      the timing of the individual parts of a presentation and the temporal
      relations among them.</n:abstract>
  </dc:description>
  <dc:date>2001-06-2916:57</dc:date>
  <dc:identifier>hardman99do.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:formart>
  <dc:language>en</dc:language></rdf:Description><size>266873</size></document><document><objectrefguid=“12345678-0003-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Interval-based conceptual models</dc:title>
  <dc:creator>Little and Ghafoor</dc:creator>
  <dc:date>2001-07-0218:52</dc:date>
  <dc:identifier>little93intervalbased.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>364367</size></document><document><objectref guid=“12345678-0004-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Efficient Generation of Motion Transitions using Spacetime
    Constraints</dc:title>
  <dc:creator>Charles Rose</dc:creator>
  <dc:description>
    <n:abstract>This paper describes the application of space time
       constraints to creating transitions between segments of human body
       motion.</n:abstract>
  </dc:description>
  <dc:date>2001-06-2917:22</dc:date>
  <dc:identifier>rose96efficient.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>1217898</size></document><document><objectref guid=“12345678-0005-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>MODELING TECHNIQUES FOR HYTIME</dc:title>
  <dc:creator>Lloyd Rutledge</dc:creator>
  <dc:description>
    <n:abstract>Hypermedia/Time-based Structuring Language(HyTime)
       defines constructs for representing general hypermedia document
       concepts.</n:abstract>
  </dc:description>
  <dc:date>2001-06-2917:07</dc:date>
  <dc:identifier>rutledge95modeling.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language>   </rdf:Description><size>129404</size></document><document><objectref guid=“12345678-0006-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>The Compositional Specifcation of Timed Systems</dc:title>
  <dc:creator>Joseph Sifakis</dc:creator>
  <dc:description>
    <n:abstract>In this tutorial,we present an overview of existing
        executable timed formalisms with a global notion of time,by putting
        emphasis on problems of compositional description.</n:abstract>
  </dc:description>
  <dc:date>2001-07-0211:37</dc:date>
  <dc:identifier>the-compositional-specification-of.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>132810</size></document><document><objectref guid=“12345678-0007-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>A Simple,Intuitive Hypermedia Synchronization Model and its
    Realization in the Browser/Java Environment</dc:title>
  <dc:creator>Jin Yu</dc:creator>
  <dc:description>
    <n:abstract>This paper presents a simple and intuitive hypermedia
        synchronization model-the Media Relation Graph
        (MRG)</n:abstract>
  </dc:description>
  <dc:date>2001-07-0211:55</dc:date>
  <dc:identifier>yu98simple.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>288218</size></document><document><objectref guid=“12345678-0008-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>A Continuous Media Player</dc:title>
  <dc:creator>Lawrence A.Rowe and Brian C.Smith</dc:creator>
  <dc:description>
     <n:abstract>The design and implementation of a continuous media
       player for Unix workstations is described.</n:abstract>
  </dc:description>
  <dc:date>2001-06-2917:08</dc:date>
  <dc:identifier>a-continuous-media-player.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>231817</size></document><document><objectref guid=“12345678-0009-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Multimedia Documents with Elastic Time</dc:title>
  <dc:creator>Michelle Y.Kim</dc:creator>
  <dc:description>
    <n:abstract>We present the elastic time model for multimedia
        documents.</n:abstract>
  </dc:description>
  <dc:date>2001-07-0212:07</dc:date>
  <dc:identifier>p143-kim.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>272532</size></document><document><objectref guid=“12345678-000A-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Clock Hierarchies:An Abstraction for Grouping and Controlling
    Media Streams</dc:title>
  <dc:creator>Kurt Rothermel</dc:creator>
  <dc:description>
    <n:abstract>In this paper,we propose a set of powerful abstractions for
        controlling and synchronizing continuous media streams in distributed
        environments.</n:abstract>
  </dc:description>
  <dc:date>2001-07-0218:51</dc:date>
  <dc:identifier>rothermel96clock.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>93052</size></document><document><objectrefguid=“12345678-000B-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Temporal Relations in Multimedia Objects:WWW Presentation from
    HyTime Specification</dc:title>
  <dc:creator>Maria da Graca C.Pimentel</dc:creator>
  <dc:description>
    <n:abstract>Initially,this paper discusses the use of HyTime for the
        specification of binary temporal relations.Next,the paper discusses
        an approach to the automatic transformation of the HyTime
        synchronization specifications into elements to be presented in the
        context of the World Wide Web environment.</n:abstract>
  </dc:description>
  <dc:date>2001-06-2916:48</dc:date>
  <dc:identifier>temporal-relations-in-multimedia.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>102862</size></document><document><objectref guid=“12345678-000C-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Event and Action Representation and Composition for multimedia
    application scenario modelling.</dc:title>
  <dc:creator>M.Vazirgiannis</dc:creator>
  <dc:description>
    <n:abstract>In this paper we present a model for the representation of
        multimedia applications based on the scenario concept.</n:abstract>
  </dc:description>
  <dc:date>2001-07-0211:43</dc:date>
  <dc:identifier>vazirgiannis96event.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>387575</size></document><document><objectref guid=“12345678-000D-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Representing Time in Multimedia Systems</dc:title>
  <dc:creator>Thomas Wahl,Kurt Rothermel</dc:creator>
  <dc:description>
    <n:abstract>This paper evaluates and classifies a selection of the most
        common existing models applying fundamental statements of the time
        theory and temporal logic.</n:abstract>
  </dc:description>
  <dc:date>2001-06-2916:49</dc:date>
  <dc:identifier>wahl93representing.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>67658</size></document><document><objectref guid=“12345678-000E-1234-1234-123456789ABC”/><rdf:Description>
 <dc:title>Nsync-A Toolkit for Building Interactive Multimedia
   Presentations</dc:title>
 <dc:creator>Brian Bailey</dc:creator>
  <dc:description>
    <n:abstract>We have developed a multimedia synchronization toolkit,
        called Nsync(pronounced‘in-sync’),to address the complicated
        issues inherent in designing flexible,interactive multimedia
        presentations.</n:abstract>
  </dc:description>
  <dc:date>2001-06-2917:09</dc:date>
  <dc:identifier>bailey98nsync.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>115592</size></document><document><objectref guid=“12345678-000F-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Issues in Temporal Representation of Multimedia
    Documents</dc:title>
  <dc:creator>Nabil Layaida</dc:creator>
  <dc:description>
    <n:abstract>We present in this position paper a set of relevant issues that
        may help in the design of multimedia document representation.These
        are based on our experience in designing and implementing an
        authoring and browsing tool called MADEUS.</n:abstract>
  </dc:description>
  <dc:date>2001-07-0211:54</dc:date>
  <dc:identifier>issues-in-temporal-representation.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>17348</size></document><document><objectref guid=“12345678-0010-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Spatio-temporal composition in multimedia applications</dc:title>
  <dc:creator>Dr.Michael Vazirgiannis</dc:creator>
  <dc:description>
    <n:abstract>The motivation for this research work is the lack of a
        complete declarative way for representative spatio-temporal
        composition of objects in the current multimedia document standards
        and authoring tools.</n:abstract>
  </dc:description>
  <dc:date>2001-07-0211:43</dc:date>
  <dc:identifier>spatio-temporal-composition-in.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>89176</size></document><document><objectref guid=“12345678-0011-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>An Object-Oriented Framework for the Integration of Interactive
    Animation Techniques</dc:title>
  <dc:creator>Robert C.Zeleznik,et al.</dc:creator>
  <dc:description>
    <n:abstract>We present an interactive modeling and animation system
        that facilitates the integration of a variety of simulation and animation
        paradigms.</n:abstract>
  </dc:description>
  <dc:date>2001-06-2916:30</dc:date>
  <dc:identifier>zeleznik91objectoriented.pdf</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/pdf</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>133440</size></document><document><objectref guid=“12345678-0012-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Dealing with Synchronization and Timing Variability in the Playback
    of Interactive Session Recordings</dc:title>
  <dc:creator>Nelson R.Manohar</dc:creator>
 <dc:description>
   <n:abstract>In this paper,we describe scheduling and synchronization
       support for a novel multimedia document,referred to as a session
       object.</n:abstract>
  </dc:description>
  <dc:date>2001-07-0216:30</dc:date>
  <dc:identifier>p45-manohar.htm</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>text/html</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>99000</size></document><document><objectref guid=“12345678-0013-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Multimedia Made Easy Through DirectAnimation</dc:title>
  <dc:description>
    <n:abstract>This paper describes Microsoft DirectAnimation,the
        component of the DirectX API family that provides animation and
        integrated media support for Web pages,CD-ROM titles,and
        multimedia applications.</n:abstract>
  </dc:description>
  <dc:date>1998-10-0216:30</dc:date>
  <dc:identifier>DirectAnimation.doc</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/msword</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>152000</size></document><document><objectref guid=“12345678-0014-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Windows Media Technologies</dc:title>
  <dc:description>
    <n:abstract>This paper gives a technical overview of the streaming
        media components of the Windows Media Technologies:Windows
        NT Server NetShow Services,NetShow Theater Server and the
         Microsoft Windows Media Player.</n:abstract>
  </dc:description>
  <dc:date>1998-07-0216:30</dc:date>
  <dc:identifier>NetShow3.doc</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/msword</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>631000</size></document><document><objectref guid=“12345678-0015-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Integrating Timing into XML Documents</dc:title>
  <dc:creator>Patrick Schmitz</dc:creator>
  <dc:date>2000-07-0216:30</dc:date>
  <dc:identifier>IntegratingTiming WithXML.ppt</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>powerpoint</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>195000</size></document><document><objectref guid=“12345678-0016-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>The SMIL 2.0 Timing and Synchronization model</dc:title>
  <dc:creator>Patrick Schmitz</dc:creator>
  <dc:description>
    <n:abstract>A powerful,flexible model is needed to unify scheduling,
        interaction,advanced control for animation,and runtime
        synchronization management.SMIL 2.0 defines a language and
        semantic model that addresses these needs.</n:abstract>
  </dc:description>
  <dc:date>2001-07-0216:30</dc:date>
  <dc:identifier>SMILTimingForTheWeb.doc</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>application/msword</dc:format>
  <dc:language>en</dc:language>   </rdf:Description><size>175000</size></document><document><objectref guid=“12345678-0017-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>A Unified Model for Representing Timing in XML
    Documents</dc:title>
  <dc:creator>Patrick Schmitz</dc:creator>
  <dc:description>
    <n:abstract>We need to provide a common model for timing so that
        authors are not forced to learn and remember different models for
        different document types or different authoring
        scenarios.</n:abstract>
  </dc:description>
  <dc:date>2001-07-0216:30</dc:date>
  <dc:identifier>TimingIntegrationPositionPaper.htm</dc:identifier>
  <dc:type>text</dc:type>
  <dc:format>text/html</dc:format>
  <dc:language>en</dc:language></rdf:Description><size>10000</size></document><email><objectref guid=“12345678-0018-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Some ideas on the Nervana client</dc:title>
  <dc:creator>Patrick Schmitz</dc:creator>
  <dc:date>2002-04-0410:30</dc:date>
  <dc:type>text</dc:type>
  <dc:format>text</dc:format>
  <dc:language>en</dc:language>
  <dc:identifier>outlook:fooBar WhoKnows123xyz</dc:identifier></rdf:Description><subject>Some ideas on the Nervana client</subject><from>Patrick Schmitz[cogit@ludicrum.org]</from><to>Nosa Omoigui[nosa@nervana.net]</to><to>Steven Judkins[stevenj007@hotmail.com]</to><cc>Omoigui,Eghosa D[eghosa.d.omoigui@intel.com]</cc>   <cc>Jerome Beard [jbeard@picsmart.net]</cc><size>434</size></email><email><objectref guid=“12345678-0019-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>FW:The Next Web(Business Week)</dc:title>
  <dc:creator>Nosa Omoigui</dc:creator>
  <dc:description>
    <n:abstract>On the other hand,partly because the industry is acutely
        aware of EDI’s problems and limitations,executives are optimistic.
        “It’ll be a chicken-or-egg situation until a killer app comes along--but
        I’m very confident that that will happen,”says W.Daniel Hillis,a
        supercomputer pioneer who now heads startup Applied Minds
        Inc.</n:abstract>
  </dc:description>
  <dc:date>2002-02-2513:44</dc:date>
  <dc:type>text</dc:type>
  <dc:format>text</dc:format>
  <dc:language>en</dc:language>
  <dc:idcntifier>outlook:fooBarWhoKnows123xyz</dc:identifier></rdf:Dcscription><subject>FW:The Next Web(Business Week)</subjcct><from>Nosa Omoigui[nosa@nervana.net]</from><to>Patrick Schmitz[cogit@ludicrum.org]</to><to>Steven Judkins[stevenj007@hotmail.com]</to><to>Omoigui,Eghosa D[eghosa.d.omoigui@intel.com]</to><to>EghosaO@aol.com</to><to>ChereceO@aol.com</to><to>Jerome Beard [jbeard@picsmart.net]</to><cc>Nosa Omoigui[nosa@nervana.net]</cc><size>434</size></email><email><objectref guid=“12345678-001A-1234-1234-123456789ABC”/><rdf:Description>
  <dc:title>Software’s Giants Gird for Upheaval[Fortune]</dc:title>
  <dc:creator>EghosaO@aol.com</dc:creator>
  <dc:description>
           <n:abstract>A vague new thing called web services is stirring up new
               battles among Microsoft,Oracle,IBM,and all of software’s biggest
               names.</n:abstract>
        </dc:description>
        <dc:date>2002-03-0213:41</dc:date>
        <dc:type>text</dc:type>
        <dc:format>text</dc:format>
        <dc:language>en</dc:language>
        <dc:identifier>outlook:fooBarWhoKnows123xyz</dc:identifier>
     </rdf:Description>
     <subject>Software’s Giants Gird for Upheaval[Fortune]</subject>
     <from>EghosaO@aol.com</from>
     <to>Nosa Omoigui[nosa@nervana.net]</to>
     <to>cogit@ludicrum.org</to>
     <to>lisah@stanfordalumni.org</to>
     <to>stevenj007@hotmail.com</to>
     <size units=“KB”>13</size>
  </email></results></srml>
示例B-语义查询文档
<?xml version=“1.0”encoding=“utf-8”?>
<sqml>
<head title=“foo”></head>
        <filters>
                <include>
                        <type class=“nervana:objecttype”>
                                documents
                        </type>
                </include>
        </filters>
        <attributes></attributes>
        <skins>
                <documents
                        color=“http://nervana.net/dc.xslt”
                        design=“http://nervana.net/dd.xslt”
                        animation=“http://nervana.net/da.xslt”>
                </documents>
                <email
                        color=“http://nervana.net/ec.xslt”
                        design=“http://nervana.net/ed.xslt”
                        animation=“http://nervana.net/ea.xslt”>
                </email>
        </skins>
        <query>
                <resource type=“nervana:filepath”>
                        c:\foo.doc
                </resource>
                <resource type=“nervana:url”>
                        file://c:\bar.doc
                </resource>
                <resource type=“nervana:url”>
                        file://c:?includesubfolders=true
                </resource>
                <resource type=“nervana:url”>
                        http://www.bar.com/doc.htm
                </resource>
                <resource type=“nervana:url”>
                        ftp://gate.com/doc.txt
                </resource>
                <resource type=“nervana:url”>
                        \\servers\server\file.pdf
                </resource>
                <resource type=“nervana:text”arg=“contains=fox”>
                        The quick brown fox
                </resource>
                <resource type=“nervana:cacheentry”>
                        ef9c90ea-282d-46d6-b355-ac8a4fc2f3e5
                        <link predicate=“nervana:relatedto”
                                type=“nervana:url”>
                                c:\foo.doc
                        </link>
                </resource>
                <resource type=“nervana:url”>
                        agent://email.all@ibm.com
                </resource>
                <resource type=“nervana:url”>
                        objects://rad.com/agency.asp
                        <link predicate=“nervana:containstext”
                                type=“xml:string”>
                                80211
                        </link>
                </resource>
                <resource type=“nervana:url”>
                        objects://rad.com/agency.asp
                        <link predicate=“nervana:postedon”
                                type=“nervana:datetimeref”>
                                today
                        </link>
                </resource>
                <resource type=“nervana:url”>
                        objects://rad.com/agency.asp
                        <link predicate=“nervana:postedon”
                                type=“xml:datetime”>
                                 01-10-2002
                        </link>
                        <link operator=“or”
                                predicate=“nervana:postedbefore”
                                type=“xml:datetime”>
                                01-11-2002
                        </link>
                </resource>
                <resource type=“nervana:url”>
                        agent://documents.all@abccorp.com
                        <link predicate=“nervana:relatedto”
                                type=“nervana:url”>
                                objects://98@in.com/m.asp
                        </link>
                        <link operator=“and”
                                predicate=“nervana:isofpriority”
                                type=“nervana:priority”>
                                criticalpriority
                        </link>
                </resource>
        </query></sqml>
示例C-语义环境层次
Information Agent(the root of the Semantic Environment)
        My Agents
              Frequently Used Agents
                      Agencies
                             Agency A1
                                    Documents
                                          Documents.All
                                          Documents.CriticalPriority.All
                                    Email
                                          Email.Technology.Wireless.All
                                    Annotations
                                          Annotations.RecentlyPosted.PastOneDay.All
                                    People
                                          People.Research.All
                                    Events
                                          Events.All
                                          Events.Upcoming.NextOneDay.All
                             Agency A2
                                    Documents
                                          Documents.Technology.XML.XPath.All
                                    Email
                                          Email.Favorites.All
                                    E-Learning Courses
                                          ELearning.All
                             Agency A3
                                    News Articles
                                          News.Technology.Semiconductors.All
                             …
                             Agency AN…
              Recently Used Agents
                      [Similar hierarchy as above but for recently used Agents]
              Recently Created Agents
                      [Similar hierarchy as above but for recently created Agents]
              Favorite Agents
                      [Similar hierarchy as above but for Agents marked by the user as favorites]
              AllAgents
                      [Similar hierarchy as above but for all Agents in the My Agents list]
              Deleted Agents
                      [Similarhierarchy as above but for Agents marked for deletion]
              …Custom View
                      [Similar hierarchy as above but for Agents consistent with the custom view]
示例D-标题语境模板的SQML输出
<?xml version=“1.0”encoding=“utf-8”?>
<sqml>
   <head title=“foo”type=“all information”></head>
      <filters>
           <include>
                      <type class=“nervana:objecttype”>
                      all information
                      </type>
           </include>
      </filters>
   <query>
      <resource type=“nervana:Agency”>
              wsAgency://marketing.com/Agency.wsdl
              <link predicate=“nervana:postedinthelast”
                      type=“nervana:time:minutesref”>
                               30
                      </link>
              <link predicate=“nervana:relevantto”
                      type=“nervana:sqml”>
                               [object sqml]
                      </link>
              </resource>
      <resource type=“nervana:Agency”>
              wsAgency://research.com/Agency.wsdl
              <link predicate=“nervana:postedinthelast”
                      type=“nervana:time:minutesref”>
                               30
                      </link>
              <link predicate=“nervana:relevantto”
                      type=“nervana:sqml”>
                               [object sqml]
                      </link>
              </resource>
      <resource type=nervana:Agency”>
              wsAgency://sales.com/Agency.wsdl
              <link predicate=“nervana:postedinthelast”
                      type=“nervana:time:minutesref”>
                               30
                      </link>
              <link predicate=“nervana:relevantto”
                      type=“nervana:sqml”>
                               [object sqml]
                      </link>
              </resource>
      <resource type=“nervana:Agency”>
              wsAgency://humanresources.com/Agency.wsdl
              <link predicate=“nervana:postedinthelast”
                      type=“nervana:time:minutesref”>
                               30
                      </link>
              <link predicate=“nervana:relevantto”
                      type=“nervana:sqml”>
                               [object sqml]
                      </link>
              </resource>
      </query></sqml>
1.一种知识提取、管理、交付及表示用系统,包括:
一部可编程为保持语义信息的服务器;
一部提供一用户界面以供用户与该服务器通信的客户机;以及
其中该服务器之处理器工作以完成如下步骤:
由信息源获取信息;
依语义确定该信息的一个或多个语义属性;以及
基于一个或多个该等语义属性响应用户的查询。
2.权利要求1的系统,其中该第一服务器进一步包括旨在提供下列至少一项的结构或方法:一语义网络、一语义数据搜集器、一语义网络一致性检查器、一推理机、一语义查询处理器、一自然语言解析器、一电子邮件知识智能体或一知识域管理器。
3.权利要求1的系统,其中:
该信息包含对象或事件;并且
该等对象或事件的语义属性由现用智能体表示以依语义链接到该等查询的语义和属性。
4.一种知识提取、管理、交付及表示用方法,以与一编程为添加、维持、托管用于对语义信息进行分类之针对具体域的信息之服务器系统共用;该方法包括:
由信息源获取信息;
对来自该等信息源之该信息进行依语义链接;
维持该已依语义链接之信息的语义属性;
基于用户查询交付请求的语义信息;以及
根据可自定的用户首选项表示语义信息。
本发明的目的在于用于知识检索、管理、交付和表示的完整实现框架和由此引起的方法。该系统包括负责添加、维护特定领域的语义信息的第一服务器组件,以及第二服务器组件,第二服务器组件存储与其一起运行的第一服务器组件使用的语义和其他知识,以便经由通信介质向在表示平台上运行的客户机提供语境和时间制约的语义信息检索服务。借助该系统,给定层次上的所有对象或事件均是彼此语义关联的活动智能体,并代表返回数据对象的查询(由基础操作码组成),其中根据预定的可定制的主题(即“外壳”)向客户显示数据对象。该系统为客户提供定制和“混合”智能体和基础关联查询的各种方法,以便优化最后得到的信息的表示。
Figure A20048000998003701
图1
Figure A20048000998003702
图2
图3
图4
Figure A20048000998003721
图5
图6
Figure A20048000998003741
图7
图8
图9
Figure A20048000998003771
图10
图11
Figure A20048000998003791
图12
Figure A20048000998003801
图13
Figure A20048000998003811
图14
图15
图16
图17
Figure A20048000998003851
图18
图19
Figure A20048000998003871
图20
Figure A20048000998003872
图21
图22
图23
Figure A20048000998003891
图25
Figure A20048000998003901
图26
Figure A20048000998003902
图27
图28
Figure A20048000998003921
图29
Figure A20048000998003922
图29A
Figure A20048000998003931
图29B
Figure A20048000998003932
图30
Figure A20048000998003941
图31
图32
Figure A20048000998003951
图33
Figure A20048000998003952
图34
Figure A20048000998003961
图35
Figure A20048000998003962
图36
Figure A20048000998003971
图37
Figure A20048000998003972
图38
图39
图40
Figure A20048000998003982
图41
Figure A20048000998003991
图42
图43
图44
Figure A20048000998004011
图45
Figure A20048000998004012
图45A
Figure A20048000998004021
图45B
Figure A20048000998004031
图46
Figure A20048000998004041
图47
图48
图49
Figure A20048000998004071
图50
Figure A20048000998004081
图51
图52
图53
Figure A20048000998004111
图54
Figure A20048000998004121
图55
Figure A20048000998004122
图56
图57
图58
Figure A20048000998004151
图59
Figure A20048000998004161
图60
Figure A20048000998004171
图61
图62
Figure A20048000998004191
图63
图64
Figure A20048000998004211
图65
图66
图67
图68
图69
图70
Figure A20048000998004271
图71
Figure A20048000998004272
图72
图73
图74
Figure A20048000998004301
图75
图76
Figure A20048000998004321
图77
Figure A20048000998004331
图78
图79
Figure A20048000998004342
图79A
Figure A20048000998004351
图79B
Figure A20048000998004361
图79C
图79D
Figure A20048000998004381
图79E
Figure A20048000998004391
图80
图81
图82
Figure A20048000998004421
图83
                         附录B:
信息神经系统的附加发明
1.灵巧选择镜头概述
灵巧选择镜头与信息神经系统信息媒体的灵巧镜头特征相似。在此情况下,用户能够在对象内选择文本,镜头将使用选定的文本作为对象而加以应用(随着选择的改变动态生成新的“图象”)。以此方式,用户能够将镜头应用于对象元数据的某个可配置子集,而非局限于要么将镜头应用于整个对象,要么不用于任何对象。这项特征与已加载语境的选择光标或动词相似。举例来说,用户能够在演示程序中选取一段文本,并且在该文本所处的对象上单击“粘贴为镜头”。演示程序于是用如下所示的方法调用将该文本传递给客户程序运行时部件(例如某个ActiveX对象):
bstrSRML=GetSRMLForText(bstrText);
此调用于是发回一个封装该自变量文本的临时SRML缓冲区。演示程序于是将调用一个如下方法:
bstrSQML=GetQueryForSmartLensOnObject(bstrSRMLObject);
此方法由剪贴板获得SQML,为该对象接收自变量SRML,并且动态创建新的SQML(使用默认谓词“relevant to{相关于}”),其中包括该SRML内的资源作为该SQML中的一个链接。此方法于是发回新的SQML。演示程序于是调用方法:
ProcessSemanticQuery(bstrSQML);
此方法传递生成的镜头SQML,然后最好是不同时地提取其结果和SRML结果中的项目数目。如需此调用的详细资料,请参阅“信息神经系统语义运行时OCX”规范。演示程序于是显示一个预览窗口(或基于现用外壳的等同物),其中出现如下内容:
[镜头智能体标题]
Found 23items{找到23个项目}
[预览对象1]
[预览窗口控制项]
其中“镜头智能体标题”是剪贴板上该智能体的标题。如需预览窗口(和预览窗口控制项)的详细资料,请参阅本人的母申请第10/179,651号。
在最佳实施方式中,此预览窗口将:
●在一个计时器到时后消失(或许为500毫秒)——一旦鼠标移动,该计时器最好重置(这将避免在用户围绕相同区域移动鼠标时窗口闪动)。
●(最终)慢慢隐去。
最佳实施方式也具有下列特征:
3.每对象一个选择范围而每结果集合多个选择为最佳选项。否则,如要为每选择每对象(而非为每对象)显示多个镜头图标,本系统将造成令人困惑的用户体验和复杂的用户界面。
4.未完成的镜头查询请求(即那些正常的SQML查询,尽管带有与该智能体镜头一致的动态生成SQML)在演示程序不再需要时(例如,当演示程序定位至新页面,或者当我们为某对象请求新的镜头时)应被取消。在任何情况下,由于镜头查询很可能一次只要求几个对象,此等取消从性能(或带宽)的角度来看并非至关重要。即使该等查询未被取消,演示程序仍可能忽略有关结果。无论如何,由于演示程序也必须处理陈旧的结果,即将其丢弃,因此演示程序将必须这么做(无论镜头查询是否也被取消)。在演示程序发出取消请求和取消实际完成之间将有一个延迟。由于一些结果会在这段时间内渗入,它们因而需要被丢弃。因此,本最佳实施方式具有异步取消实现,即软件组件已设计为始终准备忽略不良或陈旧的结果。
3.演示程序最好同时有图标(表明当前镜头请求状态)和工具提示:当用户悬停在某对象上或单击该对象时,演示程序能够提供一个工具提示:“请求镜头信息”(或类似文本)。在信息返回时,悬停将显示“找到23个对象”提示且单击将显示有关结果。在结果到达时,如果预览窗口还在,此插空工具提示可被转换为预览窗口。
此外请注意,与灵巧镜头相似,灵巧选择镜头能够应用于并非文本元数据的对象。例如,灵巧选择镜头能够应用于图象、视频、音频流片段或其他元数据。在这些场合,演示程序将发回与该数据类型和“选择区域”一致的适当SRML。此区域可为图象或视频上的一块,或音频流中的一个时间跨度。灵巧镜头功能的其余部分将如上所述应用,合适的SQML将基于该SRML而生成(该SRML则将基于镜头下面数据类型的方案)。
2.粘贴人物对象概述
信息神经系统(再次重申,这是对我们目前最佳实施方式之特定方面的当前简称之一)也支持‘人物’对象(人员、用户、顾客等等)的拖放或复制与粘贴。目前至少有两个情景可以说明最佳实施方式在此场合的操作:
1.将一个人物对象粘贴在一个代表该人出自其中之知识社区(或代理)的灵巧请求上。在这种情况下,服务器的语义查询处理器只是使用该人物作为自变量解析来自客户程序的SQML。例如,倘若用户将某人物‘Joe’粘贴(或拖放)到一个灵巧请求‘Headlines onReuters’{路透社的大标题},客户程序将使用附加自变量新建一个灵巧请求。路透社信息神经系统Web服务于是将通过发回由‘Joe’发表或加注的所有大标题来满足这一请求。在此情况下,服务器本质上将应用就此情景而言合乎情理的适当默认谓词(‘published or annotatedby’{由……发表或加注的})。
2.将一个人物对象粘贴在一个代表该人不出自其中之知识社区(或代理)的灵巧请求上。在这种情况下,由于该人物对象不在目的知识社区(在其SMS上)的语义网络中,服务器的语义查询处理器将无法让该人物自变量合乎情理。这样一来,服务器必须以某种不同方式解析该人物自变量,例如使用该人属于专家(在最佳实施方式中)或新闻人物的类别。比如,就前例而言,倘若用户将某人物‘Joe’到粘贴(或拖放)一个灵巧请求‘Headlines on Reuters’且Joe不是路透社知识社区的一个人物,路透社Web服务(在最佳实施方式中)必须发回“relevant to Joe′s expertise”{与Joe之专长相关的}大标题。此实施方式于是将要求在发送SQML给目的Web服务前采取两次通过方式。首先,它必须向该人所属知识社区征询代表该人之专长的“代表数据(SRML)”。Web服务按如下方式满足此请求:
a.查询该人物对象被粘贴到或放下的知识社区(例如路透社)之语义域信息;该信息包括和(或)表示该社区的具体分类法和本体分类。注意,可能同时存在若干个语义域。
b.向人物对象出自其中的知识社区查询该人物对象的语义域信息。
c.如果这些语义域相同或至少有一个共同语义域,客户程序则向该人出自其中的知识社区查询该人的专长类别。客户程序于是用这些类别作为自变量构建SQML并将这个SQML传递给该人被粘贴到或放下的知识社区。
如果这些语义域不同或没有至少一个共同语义域,客户程序向该人出自其中的知识社区查询属于该人为专家之类别的若干对象。在最佳实施方式中,此实现应选用准确表示专长类别之对象的足够大数目(此数目最好基于实验而决定)。在此情况下选取对象的原因,在于目的Web服务将不理解该人出自其中的知识社区之类别,因而无法将该等类别映射到自己的类别上。或者也可使用类别映射器(经由互联网上的某中央Web服务)将不同知识社区的类别相互映射。在此情况下,目的知识社区会总是将类别作为SQML的组成部分而传递,即使它并不理解那些类别。该知识社区于是将使用类别映射器Web服务将这些类别映射到内部类别。类别映射器Web服务将有解析类别的方法以及发表类别映射的方法。
3.保存与共享灵巧请求概述
信息神经系统语义浏览器(信息智能体或图书馆员)的用户也将能够把灵巧请求保存到磁盘上,作为附件进行电子邮寄,或者经由即时传讯软件(也是作为附件)或其他手段共享。客户应用程序将显露把灵巧请求作为可共享文件加以保存的方法。客户应用程序也将显露把灵巧请求文档作为电子邮件或即时传讯软件之附件而共享的方法。
可共享灵巧请求文档是一个封装SQML(经由二进制格式的加密流)的二进制文档。它提供了对语义查询的安全、串行化表示;该表示除其他特征外,亦能够保护完整性和帮助保护该详述的知识财产。举例来说,该查询本身可能包含研究人员雇主的商业机密;该等机密一旦披露,可能令竞争对手能够反向工程关键竞争信息,从而损害该公司。此保护可用若干种方式实现,包括通过对该语义查询的XML版本(SQML)进行强加密或利用强大的单向散列。此可共享文档具有表示请求的扩展名(.REQ)。客户机操作系统上的一个扩展名处理器会得到安装以表示此扩展名。在有此扩展名的文档被打开时,该扩展名处理器会被调用以打开该文档。扩展名处理器通过由加密流中提取SQML而打开该文档,然后在语义名字空间中用该SQML创建一个灵巧请求。处理器于是在语义名字空间中打开该灵巧请求。
当语义名字空间中的某个灵巧请求被保存时,或者倘若用户想要将其作为电子邮件附件发送时,客户程序用二进制.REQ格式将表示该灵巧请求的SQML串行化,并将其保存在要求的目录路径或打开电子邮件客户程序并将该.REQ文档作为附件。
以下的图1显示封装带有灵巧请求之SQML缓冲区的二进制文档格式,并且说明扩展名处理器如何打开该文档。类似模式也能够用于共享结果(经由SRML)。在此情况下,二进制文档将用于封装SRML,而非前述的SQML。
          图3
以下的图2显示两个.REQ文档例子(标题为‘Headlines onReuters Related to My Research Report(Live)’{与我的研究报告相关的路透社大标题(实时)}和‘Headlines on Reuters (as of January 212003,08 17AM)’{路透社大标题(截至2003年1月21日上午08:17)});该扩展名在Windows外壳程序中有已注册的关联。第一个请求为‘实时’,第二个则是特定时间的一个快照(两者均为有时间限制的请求)。请注意,操作系统已将语义浏览器应用程序(Nervana图书馆员)与此文档关联。在打开此文档时,语义查询会在该应用程序中打开。
Figure A20048000998004491
Figure 2:Screenshot showing two saved semantic request documents{onelive and one snapshot}
●保存与共享实体——与上面相同的过程也适用于此目的,区别仅为使用.ENT扩展名表示实体。在实体文档被调用时,Nervana图书馆员软件会在浏览器中打开该实体SQML。
●扩展名属性表——这将在语义环境中创建一个暂时的灵巧请求或实体(取决于文档种类),并且显示灵巧请求或实体的属性表。
●扩展名工具提示——这将在用户悬停在图书馆员文档(.REQ请求或.ENT实体)上时显示一个有用的工具提示。
4.保存与共享灵巧快照概述
信息神经系统也支持对本发明人称为“灵巧快照”之内容的共享。灵巧快照是一个时间已冻结的灵巧请求。这将令用户想要共享某灵巧请求但不让它为“实时”的情景成为可能。例如,按照默认规定,倘若用户与同行共享灵巧请求“与此文档相关的路透社突发新闻”,该同行将看到该灵巧请求的实时结果(基于“当前时间”)。然而,倘若该用户想要共享“与此文档相关的路透社[当前]突发新闻”,则将采用一个灵巧快照。
灵巧快照与灵巧请求相同(也用SQML查询文档表示),但SQML文档的“属性”部分包含将它标记为快照的属性(QUERYATTRIBUTES_SNAPSHOT旗标)。此SQML文档的创建日期/时间也存储于此SQML内(如前所述,SQML方案包含记录创建日期/时间的字段)。在用户表明想要共享灵巧请求时,用户界面(语义浏览器、信息智能体或图书馆员)会提示该人,询问他(她)是要共享灵巧请求还是要共享灵巧快照。如果用户表明为灵巧请求,则前述(第3部分)过程将被采用。如果用户表明为灵巧快照,二进制文档将用已编辑的SQML(包括快照属性)填充,前述过程的其余部分将得到执行。
一旦收件人(经由电子邮件、即时传讯等等)收到此二进制文档,在打开此文件时,扩展名处理器将会打开此文档并(如前所述)在语义名字空间中加入一个灵巧请求条目。在收件人打开此灵巧请求时,客户程序的语义查询处理器会(如前所述)将经过处理的SQML发送至服务器的XML Web服务。服务器语义查询处理器于是处理此SQML且通过调用相对与SQML创建日期/时间的语义查询而符合其快照属性。如此一来,查询结果就会对应于原始日期/时间,因而符合寄件人的意图。
5.虚拟知识社区
虚拟知识社区(代理)是指信息神经系统的一项特征;该特征允许知识社区出版商让所发表的一群服务器看上去象是一部服务器。例如,路透社可能有按行业划分的路透社知识社区(针对制药、油气、制造、金融服务等等),但也可选择显露一个‘路透社’知识社区。如要这样做,路透社将发表与宣布该虚拟知识社区的SQML(而不是XML Web服务之WSDL的URL)。此SQML将包含实际知识社区之WSDL的一个混合器(或集合)。语义浏览器于是将拾取此SQML并显示该知识社区的一个图标(好象是一个单一服务器)。在该知识社区上的任何动作将被传播到此SQML内的每个服务器。倘若有关用户没有采取该动作的权限,该Web服务呼叫将会因此而失败,否则该动作将得到执行(与用户人工创建包含这些知识社区的一个混合器并无区别)。
6.实现时间制约语义查询
时间制约语义查询最好以某种聪明方式实现,以照顾到有关知识社区(代理)的知识生成速度。例如,每秒钟收到10个文档之服务器上的‘突发新闻’与每月收到10个文档之服务器上的‘突发新闻’并不相同。因此,服务器上的语义查询处理器最好根据信息在该服务器上积聚的速度调整其对时间制约语义查询的处理。一般经验法则可用于实现这一目的,例如:
●最新的N个对象;其中N将基于每分钟的新对象数目而得到调整。
●过去N分钟内收到的全部对象且对象数目有一上限(即min(上限、过去N分钟内收到的全部对象))。
N亦可基于查询是否为大标题或突发新闻而加以调整。在最佳实施方式中,新闻人物查询最好以与大标题相同的时间制约参数实现。
7.文本转为语音外壳概述
文本转为语音在对象一级和请求一级实现。在对象一级,对象外壳运行一个脚本以接收对象的SRML、解释该SRML、然后将(SRML字段内)有选择的文本块传递给文本转为语音引擎(例如,使用Microsoft Windows Speech SDK)以生成语音输出。
图5为说明文本转为语音对象外壳的图示。在执行时,图5所示的传递途径会导致下列语音输出:
1.Reading Email Message{读出电子邮件}
2.适当延迟
3.Message From Nosa Omoigui{自诺萨·欧莫贵的邮件}
4.适当延迟
5.Message Sent to John Smith{致约翰·史密斯的邮件}
6.适当延迟
7.Message Copied To Joe Somebody{抄送乔某人}
8.适当延迟
9.Message Subject Is Web services are software buildingblocks used for distributed computing{邮件主题为Web服务是分布式计算所用的软件构件}
10.适当延迟
11.Message Summary is Web services{邮件概括为Web服务}
12.适当延迟
13.[选用]Message Body is Web services are software buildingblocks used for distributed computing{邮件正文为Web服务是分布式计算所用的软件构件}
此例假定了如下的语音外壳模板:
1.Reading Email Message{读出电子邮件}
2.适当延迟
3.Message From<邮件作者名字>
4.适当延迟
5.Message Sent to<邮件发送:收件人名字>
6.适当延迟
7.Message Copied To<邮件抄送:收件人名字>
8.适当延迟
9.Message Subject Is<邮件主题文本>
10.适当延迟
11.Message Summary is<邮件正文概括>
12.适当延迟
13.[选用]Message Body is<邮件正文>
其他模板亦可用于转换成易于理解且传达了被转换对象类型之语义的语音。与上面所示之(用于电子邮件)的例子相似,有关实现应针对所有信息对象类型使用适当的文本转为语音模板,从而捕获该等对象类型的语义。
在请求一级,语义浏览器的演示引擎(演示程序)载入一个外壳;该外壳负责接收所有要转换之当前对象(基于用户选定的光标位置)的SRML和为每个对象光标文本转为语音对象外壳。这在本质上是针对每个要转换的XML对象依次重复文本转为语音动作。
Figure A20048000998004531
            图5
以下的图4展示了若干电子邮件对象经由某请求外壳在语义浏览器中的呈现。
8.语言翻译外壳
语言翻译外壳的实现与文本转为语音外壳相似,区别只是沿语言轴进行转换。XSLT外壳(灵巧风格)能够调用某软件引擎以自动进行实时语言翻译,然后生成用Unicode(每字符16位)编码的XML以照顾到各种不同语言。生成最终表示输出的XSLT转换于是将使用就已翻译的XML之内容而言适当的字符集再现其输出。
9.类别作为用户体验中的第一类对象
这是指用于向最终用户显露知识社区之类别的一项特征。最终用户将能够把类别作为某种信息类型而发出查询,例如‘Web服务’。该元数据于是将在语义浏览器中显示,如同任何第一类信息对象类型一样。视觉化、动态链接、语境调色板等等也将利用类别对象作为中心点而可供使用。当用户想要开始于类别,然后用它作为动态定位的中心点,而不是开始于以该类别作为参数的灵巧请求(灵巧智能体)时,这项特征就会有用。
10.分类注解
分类注解按照第一类对象的类别而分类。用户将能够对直接注解类别,从而模拟映射到类别的电子邮件名单。然而,倘若有许多类别(例如在制药业),则不建议这样做;因为信息能够属于许多类别,并且用户应该不必思考哪个类别需要注解,用户应该将该注解直接发布给知识社区,它将在那里被自动分类,或者用户应该注解诸如文档或电子邮件等比类别更多语境脉络的对象。
11.附加的语境模板
1.专家——专家特征在本人母申请第10/179,651号中被指明为一个特殊智能体。读者由该申请亦应了解,专家特征也可与语境模板部分共同工作。专家属于语境模板,并且如其名称所暗示,指明在一个或多个主题或语境(由PREDICATETYPEID_EXPERTON谓词表明)上有专长的人士。
2.我的项目的注解——此为一个语境模板;它是注解的一个变种,由主叫用户发表的项目进一步过滤。这将允许该用户专门监视对他(她)已发布或注解之项目的反馈。
12.导入和导出用户状态
语义浏览器将支持用户状态的导入和导出。用户能够将其个人状态保存成文档和将该文档导出到另一台机器;反之亦然。此状态将包括关于下列内容的信息(和元数据):
●默认用户状态(例如计算机熟练程度、默认兴趣领域、默认工作角色、默认灵巧风格等等)
●配置文件
●实体(按配置文件)
●灵巧请求(按配置文件)
●本地请求(按配置文件)
●已订阅的知识社区(按配置文件)
语义浏览器将显示用户界面(很可能为某个向导),从而允许用户选取要导入或导出的用户状态类型。此用户界面也将询问用户是否包括身份和(或)登录信息。当此用户界面被调用时,语义浏览器会将用户状态串行化到一个XML文档内,其中包含相应于所有用户状态类型之元数据的字段。在此XML文档被导入时,语义浏览器将在XML文档节点中定位并在客户程序环境中添加和设置相应于该XML文档中节点的用户状态类型。
13.本地灵巧请求
本地灵巧请求令用户可使用取自某知识社区(代理)的类别浏览本地信息。倘若收到的是分类本地请求,语义客户程序将从本地硬盘、电子邮件仓库等提取元数据(包括概括)并将这些元数据存储在语义元数据仓库(SMS)的本地版本中。客户程序将此XML元数据(按对象)发送至某知识社区进行分类(经由其XML Web服务)。该知识社区于是发回类别分配元数据。客户程序于是更新本地语义网络(经由本地SMS),并且如同服务器一样对语义查询做出响应。此特征本质上能够在没有本地服务器的情况下提供本地服务器之功能。
14.综合定位
综合定位不仅允许用户在演示程序内动态定位(在右侧的主结果窗格内),而且将定位与左侧的外壳程序扩展名定位综合。这在本质上合并了两个堆栈。在最佳实施方式中,这通过事件信令来实现。当演示程序想要动态定位到一新请求时,它引发指明当前浏览器视图之GUID的某种状态。该GUID与某个注册表项对应;该项亦有称为‘Navigation Event’{定位事件}、‘Next Namespace Object ID’{下一名字空间对象标识}、‘Next Path’{下一路径}的字段。‘Navigation Event’字段内有一DWORD值,指向在当前浏览器视图被载入时由该视图创建的一个事件句柄。当演示程序想要定位到一新请求时,它在语义环境中创建该请求并高速缓存发回的该请求之ID;然后动态获得该请求的适当名字空间路径(取决于该请求的信息或语境类型)并也加以高速缓存。它于是用这两个数值设置两个字段(‘Next Namespace ObjectID’和‘Next Path’)。然后它设置‘Navigation Event’(在Windows中,这通过调用名称为‘SetEvent’的Win32 API来完成)。
为了抓住该定位事件,浏览器视图在首次开始时会开始一个工作者线程。此线程等待该定位事件(并且也同时等待一关机事件,该事件在浏览器视图被终止时得到信号,在Windows中,这通过调用名称为‘WaitForMultipleObjeets’的Win32 API来完成)。如果收到该定位事件的信号,该‘等候’API会返回,表明收到该定位事件的信号。该工作者线程于是会查阅注册表以提取定位状态(对象标识和路径)。它于是调用外壳程序浏览器以定位至此对象标识和路径(在Windows中,做法为提取一‘PIDL’,然后从实现IShellView之外壳程序视图实例调用IShellBrowser::BrowseTo)。
15.已访问结果提示
Nervana语义浏览器令用户能够以思考的速度在知识空间中动态定位。用户能够沿语境轴、信息轴或时间轴定位。然而,在用户定位过程中,他(她)可能看到重复的信息。例如,用户能够由某本地文档定位到‘突发新闻’,然后由‘突发新闻’结果对象之一定位到‘大标题’。可是就语义而言,一些大标题可能与突发新闻重叠(尤其是那些不久以前的新闻)。这相当于在浏览Web时由不同的‘角度’一次又一次找到相同的页面。
Nervana语义浏览器通过使用最近呈现结果的本地高速缓存来解决此重复性问题。演示程序于是通过用不同颜色或其他用户界面机制显示结果,向用户指明重复的结果。此本地高速缓存会老化(最好是在若干小时或典型‘浏览体验’之测定时间后)。旧的条目将被清除,并且此高速缓存在经过足够长时间后将最终重置。
或者,倘若用户选择,重复的结果可被弃置而完全不出现。具体地说,语义浏览器也通过在演示程序中再现结果之前删除重复结果而处理重复的结果——例如,倘若具有相同元数据的对象在不同的知识社区(代理)上出现。语义浏览器将通过进行元数据比较而检测此现象。对于诸如文档和电子邮件等未结构化的数据,语义浏览器将比较概括,如果概括完全相同,则文档也很可能相同(虽然尤其是对于很长的文档来说,这一点无法绝对保证)。
16.知识联盟
服务器端知识联盟
服务器端知识联盟是允许外部知识在某知识社区范围内得到联合的技术。例如,许多公司依赖于诸如路透社等外部内容提供者向其供应信息。可是在信息神经系统中可能出现与注解、个人出版物等相关的安全保障与隐私等问题。许多企业客户不希望将敏感的注解存储在由外部内容提供者持有和管理的远程服务器上。
为解决这个问题,外部内容提供者将用一个KIS元数据高速缓存提供其内容;该高速缓存将由用户公司持有与管理。例如,路透社将向诸如英特尔等客户提供其内容,但英特尔将持有和管理该KIS。英特尔KIS将经过路透社KIS(由此链接至KIS服务器)或路透社DSA。这样一来,敏感的英特尔注解可使用路透社内容作为语境而当作“贴条”发表,同时英特尔将依然保持对其敏感数据的控制。
联合知识社区的类别命名
这是指如何在联合知识社区中命名类别。例如,部署在Intel{英特尔}的Reuters{路透社}知识社区将被命名为Reuters@Intel,其类别将有诸如‘Reuters@Intel/Information Technology/Wireless/80211’{Reuters@Intel/信息技术/无线/80211}的名称。
17.匿名注解与发表
语义浏览器将允许用户在知识社区(代理)中匿名注解与发表。在此模式下,(带有该用户身份的)元数据将得到完整储存,但带有表明出版商希望保持匿名的旗标。这样一来,推理机能够使用完整的元数据进行推断,对关于出版商的请求将不会揭示其身份。或者,管理员也将能够配置知识社区(代理),从而令推理机无法使用匿名注解或发表内容进行推断。
18.语义浏览器中的离线支持
语义浏览器也将具有离线支持能力。浏览器将为每个远程呼叫建立一个高速缓存。此高速缓存将包含XML数据的条目。这可为SRML或因对XML Web服务的呼叫而发回的任何其他数据。语义浏览器会给每个呼叫一个唯一的签名,并且此签名被用于散列入该XML数据。例如,语义查询由其SQML加以散列。其他远程呼叫使用方法名称、自变量名称及自变量数据进行散列。
就对XML Web服务的每个呼叫而言,语义运行时客户程序将提取该呼叫的签名,然后将此签名映射到本地高速缓存中的某个条目。倘若浏览器(或系统)当时离线,该客户程序将发回高速缓存中的XML数据(如果存在)。如果它不存在,客户程序将向呼叫者(很可能是演示程序)发回一个错误。如果浏览器在线,该客户程序将从XMLWeb服务提取XML数据,并且通过用由该签名散列指明的文件路径重写该文件条目的之前内容来更新高速缓存。这需要假设该远程呼叫实际上是成功的;即使系统或浏览器在线,由于网络流量和其他情况,此呼叫未必成功。在这种情况下,高速缓存不会被重写(它只在有新数据时才会被重写,并且不会被先行清除)。
19.语义浏览器中保证的跨平台支持
概述
如在本人的母申请(第10/179,651号)中所讨论,信息神经系统能够以跨平台的方式实现。在可能的情况下最好采用标准协议,并且Web服务层应使用可互操作的Web服务标准和避免专属实现方式。在本质上,对这方面的测试是语义浏览器不必“知道”其与之对话的知识社区(或代理)Web服务是否是在特定平台上运行。举例来说,语义浏览器不必知道其与之对话的Web服务是在Microsoft公司的.NETTM平台或Sun公司的J2EE平台(这只是两个专属应用服务器的例子)还是在Linux或任何其他“开放源码”服务器上运行。知识社区Web服务和客户机-服务器协议应采用由诸如.NETTM和J2EETM等不同Web服务实现方式所通常支持的Web服务标准。
在理想世界里,各厂商的Web服务实现方式将认可和遵从同一套公用标准。然而,现实世界可能并非如此,至少目前还不是。倘若语义浏览器必须应付不同Web服务实现方式的独有功能性,知识社区方案最好扩展为包括一个指明Web服务平台实现方式的字段。例如,知识社区的.NETTM实现在发表时最好带有一个指明所用平台为.NETTM的字段。J2EETM亦然。这样一来,语义浏览器在提取知识社区的元数据时,无论是经由WSDL URL直接从该知识社区,还是经由多点广播、企业目录(例如LDAP)、全球知识社区目录等等收到通知,都将可以访问此字段。
语义浏览器于是能够根据知识社区的运行平台来发出因平台而异的呼叫。这不是推荐的方法;然而倘若绝对有必要发出因平台而异的呼叫,则在最佳实施方式中最好采用此模式。
20.知识造型
知识造型指企业部署信息神经系统的推荐方式。这包含部署若干KIS服务器(按高层知识域)和一个(或最多几个)存放相关本体分类和分类法的KDS(前为KBS)。KIS服务器最好按域部署,从而既不会过于狭窄以至于没有足够的知识共享定位与推理可能性,也不会过于广泛以至于扩展能力(数据库和(或)推理机所需的存储和CPU处理能力)成为问题。诚然,具体平衡点将因软硬件技术的演进而随时间移动,并且本最佳实施方式并不取决于特定平衡点。此外,KIS服务器的部署最好令访问管制在服务器一级成为必要(从而获得较高程度的安全保障),而不是在由多个群组共用同一个KIS时于群组一级施加访问管制。例如,大型制药公司可能有一个供全公司使用的肿瘤学知识社区KIS,以及另一个供进行最先进研发和申请战略专利的研究人员使用的KIS。这两个KIS可能会经过相同的信息源,但第二个KIS由于只供研发群组的用户访问使用,因而将更为安全。此外,这些研究人员的发表内容和注解可选择设定为在公司范围的KIS上无法查阅。
以下的图5例举了制药公司的可能知识体系结构。如5图所示,KDS能够服务如下所列的若干个附属KIS:
Figure A20048000998004611
                    图7
21.KIS清仓规则
知识综合服务器(KIS)将允许管理员设置‘清仓’规则以清除陈旧元数据。如此将防止KIS上的SMS无限膨胀。此等规则可为简单的清除超过特定时限(依照公司保留旧数据的政策在2-5年之间)且没有任何注解和未标记为收藏(或已评定)的任何元数据。
22.客户端部件集成与交互作用作业流程
1)外壳程序:用户经由用户界面定位或向导隐含地创建一个SQML查询(即智能体)。
2)外壳程序:用户打开某个智能体(经由树状或文件夹视图)。
3)该查询缓冲区被保存为一个文件;并且该智能体的一个注册表项会得到创建。
a)注册表项包含:智能体名、创建日期、智能体(请求)GUID、SQML路径、注释、名字空间对象类型(代理、智能体、混合器等等)、属性
4)外壳程序:该请求被交给演示程序:
a)一个注册表请求GUID条目得到创建,其中包含生成该请求的名字空间路径和SQML文件URL。
b)浏览器由命令行http://PresenterPage.html#RequestGUIDhttp://presenterpage.html/初始化和打开。演示程序载入该网页中包含的默认Chrome。
c)演示程序页面载入演示程序二进制行为和语义运行时OCX。
5)演示程序:载入SQML并经由查询管理器发出请求。
a)解析请求GUID以取得SQML文件路径。
b)将SQML文件载入缓冲区,创建资源处理器请求,将这些请求传递给资源处理器,等候和收集结果,在此概括本地资源。所有概括均沿这两条路径之一:概括由此文件路径指明的文档,或者概括此文本(从剪贴板、Outlook、Exchange等处提取)。这两条路径均会生成具有相同形式的概括,适合于包括在向语义服务器XML Web服务发出的请求内。
c)将SQML文件编译到单个服务器请求缓冲区内,包括前述任何资源概括。
d)通过调用语义运行时客户程序查询管理器来发起服务器请求。
6)查询管理器:监视服务器请求并针对数据做出回叫,也发出请求完成或超时事件的信号。回叫将进入演示程序,这意味着过程间传讯要传递XML。
7)演示程序:接收数据并载入适当外壳:
a)接收缓冲区内的SRML数据;这将递次发生。
b)确定是否有与此智能体关联的优先外壳(灵巧风格),否则选取默认外壳。
c)将SRML经由XSLT转换成优先外壳格式。随着结果的进入,此为结果树的多段作业(根为列表,然后是对象,再后是深层/镜头/BN信息)。
d)在目标DIV内用页面显示结果。此目标是行为本身的一个自变量且由根页面定义。
8)演示程序:调用语义运行时以填充语境面板(按语境模板)、深层信息、灵巧复制与粘贴,以及其他语义命令。演示程序亦载入灵巧风格;该风格于是载入与该请求的语义一致的语义图象、运动等等。
以下的图6例举了客户端部件集成与交互作用作业流程。
                         图8
深层信息概述
简介
在最佳实施方式中,Nervana‘深层信息’工具的目标在于为Nervana信息对象提供语境制约的似报道信息。深层信息实质上向提供Nervana用户在给定语境中否则将会错过的信息。如果做一个粗糙比较的话,深层信息就如同在MTV频道播放的音乐节目上显示的语境信息(显示关于当前艺术家、当前歌曲、以及在某些时候该歌曲中当前乐器的信息)。
‘深层信息’中的‘深层’是指语境信息将经常在对象出自其中的代理上之语义网络中横跨多个“跳跃”。‘深层信息’由可为无格式文本元数据或带有语义查询链接(经由SQML)之元数据的‘深层信息块’构成。
在最佳实施方式中有至少五种深层信息块:
1.基本语义链接块
2.语境模板块
3.琐事块
4.配对块
5.递归块
NNNN.基本语义链接块
借助于基本语义链接事实,深层信息块只是传达当前对象的某个语义链接。这些块包含距离为1的语义链接。此情况与由‘链接’语境或任务窗格将显示的内容有重叠。例如:
●帕特里克·施米茨的直接上级是诺萨·欧莫贵
●帕特里克·施米茨有5个直接下级
●帕特里克·施米茨曾注解47个对象
●帕特里克·施米茨曾撰写13个对象
●帕特里克·施米茨曾收到56个电子邮件抄件
OOOO.语境模板块
语境模板块会基于手头的信息显示每个相关语境模板的语境信息。这些块与将在每类语境模板的语境条或语境面板中显示的内容相同。例如:
●帕特里克·施米茨曾投递3条突发新闻项目
●帕特里克·施米茨曾发表14项经典作品
●帕特里克·施米茨曾撰写7条大标题
●帕特里克·施米茨现参与13项讨论
●帕特里克·施米茨是关于356个对象的新闻作者
PPPP.琐事块
就代理上的所有电子邮件对象而言:
●史蒂夫·贾金斯出现在所有电子邮件的“致”名单上
●史蒂夫·贾金斯答复了其中的23%
●帕特里克·施米茨注解了其中的50%
●这里面只有3个的线程深度大于2
就代理上的所有人员对象而言:
●帕特里克·施米茨曾向其中的47%发送电子邮件
●其中的14%是诺萨·欧莫贵的直接下属
●萨莉·史密斯曾与其中的85%进行过讨论
●其中的12%是关于至少一个主题的新闻作者
●所有人本星期都曾参与过至少一次讨论
●其中的33%是关于至少一个主题的专家
●其中的8%是关于超过三个主题的专家
就代理上的给定分发名单而言:
●史蒂文·贾金斯向此名单投递的电子邮件最多
●莎拉·特伦特在此名单上答复的电子邮件最多
●诺萨·欧莫贵从未向此名单投递电子邮件
●帕特里克·施米茨本月曾向此名单投递87条电子邮件
●理查德·诺沃特尼今年曾向此名单投递345条电子邮件
就代理上的所有分发名单而言:
●史蒂文·贾金斯向所有名单投递的电子邮件最多
●丽莎·黑伯伦只答复了这些名单上2%的电子邮件
●诺萨·欧莫贵从未向任何名单投递电子邮件
●帕特里克·施米茨至少每星期一次向所有名单投递
●理查德·诺沃特尼曾在3个名单上投递邮件
就代理上的所有信息对象而言:
●史蒂文·贾金斯一直是最多产的发表者(他发表了其中的5%)
●萨莉·史密斯一直是最多产的注解者(她注解了其中的2%)
●诺萨·欧莫贵一直是最活跃的新闻作者
●帕特里克·施米茨具有合计最多的专长
●史蒂夫·贾金斯就今年发表的信息而言具有最多的专长
●加文·施米茨参与过最多的讨论(其中的12%)
●理查德·诺沃特尼本月参与过最多的讨论(其中的18%)
QQQQ.配对块
a.人物对人物
基于语义链接
●帕特里克·施米茨曾发送邮件给13个人
●47个人曾经与帕特里克·施米茨一同出现在“致”名单上
●47个人曾经与帕特里克·施米茨一同出现在“抄送”名单上
●在帕特里克·施米茨发送的电子邮件中总共曾提及89个人
●24个人曾在帕特里克·施米茨注解的相同信息上注解
●3个人在帕特里克·施米茨属于的所有分发名单上
●29个人在帕特里克·施米茨属于的至少一个分发名单上
基于语境模板
●12个人在与帕特里克·施米茨相同的信息类别上具有专长
●14个人和帕特里克·施米茨属于相同信息项目的新闻作者
●27个人在与帕特里克·施米茨讨论
b.信息对人物
基于语义链接
●这条信息项目是帕特里克·施米茨投递的
●这条信息项目是史蒂夫·贾金斯撰写的
●这条信息项目曾抄送给2个人
●3个人曾注解这条信息项目
基于语境模板(与语境模板块相似)
●关于这条信息项目有4位专家
●关于这条信息项目有27位新闻作者
c.信息对信息
基于语境模板(与语境模板块相似)
●相关的‘所有匹配’有578个
●相关的‘最佳匹配’有235个
●相关的突发新闻有4个
●相关的大标题有46个
基于语义链接(经由人员)
●21条信息项目具有与这条相同的专家
●23条信息项目具有与这条相同的新闻作者
●34条信息项目由投递这条的同一个人投递
●34条信息项目由撰写这条的同一个人撰写
●44条信息项目由注解这条的人员注解
RRRR.递归块
借助于递归块,关于当前信息块之主题的深层信息显示会形成某种语境分层结构。系统于是基于该主题的对象类型递归显示有关块。利用递归块,本系统实质上是由源对象开始,探索语义网络并沿着该网络的路径不断显示块。探索最好停止在与资源限制一致且基于用户反馈的深度。
以下为一个递归块示例:
[+]这个电子邮件由帕特里克·施米茨撰写
[+]帕特里克·施米茨的直接上级是诺萨·欧莫贵
[+]诺萨·欧莫贵有6个直接下级
      [+]史蒂夫·贾金斯……
   [+]史蒂夫·贾金斯投递了……
      [+]史蒂夫·贾金斯是关于……的专家
[+]史蒂夫·贾金斯是关于……的新闻作者
[+]史蒂夫·贾金斯曾参阅6个讨论
    [等等]
     [+]理查德·诺沃特尼……
     [+][其余6个直接下级]
   [+]诺萨·欧莫贵注解了13个对象……
     [+][关于这13个对象的更多语境模板块]
   [+]诺萨·欧莫贵撰写了278个对象
[+]诺萨·欧莫贵注解了23个项目[…]
[+]帕特里克·施米茨有5个直接下级
   [+]约翰·多伊……
   [+]基于该等直接下级的更多原生块
[+]帕特里克·施米茨曾注解47个对象
信息神经系统的安全保障规范
1.授权
简介
‘人员’DSA将用某LDAP目录URL和群组名初始化。‘用户’DSA也将用某LDAP目录URL和群组名初始化。一般说来,‘用户’将是‘人员’的一个子集。例如,某制药公司可能为不同的制药类别(例如生物技术、生命科学、药理学等等)安装一部KIS。其中每个类别将有一组知识丰富或感兴趣的用户。然而,此KIS也将该公司的全体员工加入‘人员’群组。这将令此KIS的用户能够找到整个员工群体的成员,即使该等成员并非此KIS的用户。此外,推理机将能够由该公司的人员——而不必只是此KIS的用户——推断出具有语义链接的专长。
这对于在KIS一级的访问管制亦是有利的,这将补充由应用服务器在Web服务层提供的访问管制。用户群组将包含有权访问此KIS知识的人员。然而,人员群组将包含与此KIS知识相关的人员,即便那些人无权访问此KIS。
人员DSA和用户DSA都将充填语义元数据仓库(SMS)中的人员表和适当地指明对象类型标识符。请注意,密码最好不要存储于SMS中的人员表内。
用户DSA也充填用户身份验证表(UAT)。这是一个内存中的散列表,由此将用户名与密码对应。服务器的Web服务将实现IPasswordProvider界面或等同功能。PasswordProvider对象的实现将发回与特定用户名对应的密码。下面的C#例子展示了这一点:
  namespace WSDK_Security

  {

  public class PasswordProvider:Microsoft.WSDK.Security.
IpasswordProvider

  {

       public string GetPassword(string username)

       {

            return″opensezme″;

       }

  }
下面的C#码显示了Web服务如何能够在用户身份得到验证后检索用户信息:
  using System;

  using System.Collections;

  using System.ComponentModel;

  using System.Data;

  using System.Diagnostics;

  using System.Web;

  using System.Web.Services;

  using Microsoft.WSDK.Security;

  using Microsoft.WSDK;

  namespace WSDK_Security

  {

     public class Service1:System.Web.Services.WebService

     {

        [WebMethod]

        public string PersonalHello()

        {

           string response=″″;

           SoapContext requestContext=HttpSoapContext.RequestContext;

           if(requestContext==null)

           {

               throw new ApplicationException(″Non-SOAP request.″);

           }

           foreach(SecurityToken tok in requestContext.Security.Tokens)

           {

               if(tok is UsernameToken)

               {
        <!-- SIPO <DP n="468"> -->
        <dp n="d468"/>
               response+=″Hello″+((UsernameToken)tok).Username;

            }

        }

        return response;

      }

    }
   }
Nervana Web服务于是能够用主叫用户名呼叫服务器语义运行时。运行时于是将这与SQL对应并使用适当过滤器发出语义查询。
就Nervana ASP.NET应用程序而言,以下条目将作为Web.config文件中母配置元件的一个子元件而加入:
<microsoft.wsdk>
  <security>
    <passwordProvider
      type=″WSDK_Security.PasswordProvider,WSDK-Security″/>
  </security>
</microsoft.wsdk>
A.客户端授权请求
为了为有关请求创建一个UsernameToken,Nervana客户程序必须将用户名和密码作为该SOAP请求的组成部分而传递。Nervana客户程序能够作为该请求的组成部分传递多个令牌,对于用户之身份为跨多个验证提供者而联合者的情况最好如此。Nervana客户程序将集合该用户已提供的所有用户帐号信息(包括用户名和密码信息),将这些信息转换成WS-Security令牌,然后发出SOAP请求。客户程序码看上去将如下所示(参考:http://www.msdn.microsoft.com):
localhost.Service1 proxy=new localhost.Service1();
UsernameToken clearTextToken
    =new UsernameToken(″Joe″,
                          ″opensezme″,
                          PasswordOption.SendHashed);
proxy.RequestSoapContext.Security.Tokens.Add(clearTextToken);
label1.Text=proxy.PersonalHello();
B.在服务器上验证UsernameToken
(http://msdn.microsoft.com/library/default.asp?url=/library/en-us/dnwssecur/html/wssecwithwsdk.asp)
尽管WSDK会核实安全头语法和针对密码提供者提供的密码检查密码散列,但是我们最好对请求再进行一些额外核实。例如,倘若收到的UsernameToken不包括密码元件,WSDK将不呼叫密码提供者。如果没有要检查的密码,就没有理由要呼叫密码提供者。这意味着我们需要自己核实该UsernameToken的格式。
另一个可能是请求中包括了不止一个UsernameToken元件。WS-Security提供对一个请求内包含可用于不同目的之任意数目令牌的支持。
上面的代码可为Nervana Web方法加以修改,以核实UsernameToken包括一个散列的密码且只接受具有单一UsernameToken的接收请求。以下为修改后的代码。
  [WebMethod]

  public string ProcessSemanticQuery(string Query)

  {

     SoapContext requestContext=HttpSoapContext.RequestContext;

     if(requestContext==null)

     {

         throw new ApplicationException(″Non-SOAP request.″);

     }

     if(requestContext.Security.Tokens.Count==1)

     {

         foreaeh(SecurityToken tok in requestContext.Security.Tokens)
        <!-- SIPO <DP n="470"> -->
        <dp n="d470"/>
  {

    if(tok is UsernameToken)

    {

        UsernameToken UserToken=(UsernameToken)tok;

        if(UserToken.PasswordOption

            ==PasswordOption.SendHashed)

        {

         return ProcessSemanticQueryInternal(Query,UserToken.Username);

        }

        else

        {

            throw new SoapException(

                ″Invalid UsernameToken password type.″,

                SoapException.ClientFaultCode);

        }

    }

    else

    {

        throw new SoapException(

           ″UsernameToken security token required.″,

           SoapException.ClientFaultCode);

    }

  }
}
else
{
   throw new SoapException(

     ″Request must have exactly one security token.″,

     SoapException.ClientFaultCode);
        <!-- SIPO <DP n="471"> -->
        <dp n="d471"/>
      }

       return null;

  }
2.人员群组
KIS将包括人员群组的元数据。此类群组与现代操作系统中的用户群组并无不同。人员群组将为Nervana第一类对象(即它将继承对象类)。此外,人员群组方案将如下所示:
 字段名   字段类型   描述
 ObjectID   String   人员群组的对象标识符
 Name   String   人员群组的名称
 Description   String   人员群组的描述
 URI   String   人员群组的URL——这将唯一地识别该群组且在最佳实施方式中将为LDAP URI。
在绝大多数情况下,人员群组将映射到目录系统(例如LDAP)中的用户群组。例如,KIS服务器管理员将令KIS爬过用户群组的某个可配置集合。一个人员DSA将爬过用户群组和充填SMS中的人员群组表和用户表。人员DSA将执行下列操作:
●创建该群组(如果在SMS中没有)或更新该群组(如果存在)的元数据。
●列举该群组内的所有用户(在来源处——在最佳实施方式中为一LDAP目录)。
●针对该群组内的所有用户,创建人员对象(或在该等对象已存在于SMS内时更新元数据)。
●通过(使用BELONGS_TO_GROUP语义链接类型)将人员对象映射到群组对象,更新语义网络(经由SMS中的‘SemanticLinks’表)。这就确保SMS具有捕获群组成员信息(除群组和用户本身外)的语义链接。
3.身份元数据联盟
身份元数据联盟(IMF)是指一项特征;在此部署在互联网上的某个信息社区(代理)只为公司或个人顾客服务。例如,路透社可能为所有依赖于其专属内容的公司顾客设立一个信息社区。在这种多个顾客(很可能属于同一行业)共用一个信息社区的情况下,路透社将在SMS为每个顾客建立一个群组。然而,为了使人员元数据可供使用,每个顾客都将不得不让路透社持有其公司目录的镜像。这将带来多种问题,尤其是在安全保障和隐私方面。公司大概不会愿意允许外部内容提供者访问其员工的元数据。IMF通过让基于互联网的信息社区(代理)只保存足够进行用户身份验证的元数据,解决了这个问题。例如,路透社将只在其SMS中储存其公司顾客之用户的登录信息。当语义浏览器收到包含此等不完整元数据的SRML时,客户程序将向企业目录发出另一个查询(经由LDAP访问或在企业目录元数据是通过某Web服务提供时经由UDDI)以取得该用户的完整元数据。此举之所以可能,是因为该外部存放的元数据将具有身份信息;并且该信息可用于获取其余元数据。由于客户程序是在该企业的防火墙内获得其余元数据,敏感的公司元数据就不必与外界共享。
4.访问管制
A.访问管制方针
在最佳实施方式中,KIS将包括和执行访问管制语义。KIS采取“默认访问权”方针。默认访问权在此意指KIS将授权主叫用户访问SMS中的任何元数据,但禁止访问的情形除外。如此一来,本系统能够扩展为提供新的拒绝形式,而不是新的访问形式。此外,这隐含着倘若没有拒绝的理由,用户将获授访问权(这就导致一种较简洁的访问管制模式)。
KIS将具有一个访问管制管理器(ACM)。此ACM主要负责生成拒绝语义查询(DSQ)。SQP会将此DSQ附加到其针对来自客户程序之给定语义请求的查询上。ACM将显露以下方法(C#示例):
String GetDenialSemanticQuery(String CallingUserName)
此方法最好接受主叫用户名并发回一个封装例外对象的SQL查询(或等同物)。这些是SQP不得发回给主叫用户的对象(即该用户没有访问权的对象)。
SQP于是构建一个如下所示之包括该拒绝查询的最终原始查询:
Aggregate Raw Query AND NOT IN(Denial Query)
例如,假设该聚集原始查询为:
SELECT OBJECTID FROM OBJECTS WHEREOBJECTTYPEID=5,
且该拒绝查询为:
SELECT OBJECTID FROM OBJECTS WHEREOWNERUSERNAME<>‘JOHNDOE’,
最终原始查询(这是SQP最终将执行和串行化成SRML以发回给主叫用户的查询)将为:
SELECT OBJECTID FROM OBJECTS WHEREOBJECTTYPEID=5 AND NOT IN
(SELECT OBJECTID FROM OBJECTS WHEREOWNERUSERNAME<>‘JOHNDOE’)
这在语义上大概相当于:
“选取对象类型标识符为5但不属于非由John Doe拥有之对象清单的所有对象。”
而这在语义上又大概相当于:
“选取对象类型标识符为5且由John Doe拥有的所有对象。”
B.访问管制常规
由语义查询处理器(SQP)处理的每个语义查询将包含一个访问管制检查。这将保证主叫用户只收到其有权访问的元数据。SQP在处理语义查询时将采用下列访问管制规则:
1.  倘若查询是针对‘人员’对象(人员、用户、顾客、专家、新闻作者等等),发回的‘人员’对象最好必须要么:
●包括主叫用户,要么
●包括与主叫用户同属至少一个人员群组且由主叫用户或系统拥有的人员
相应的拒绝查询最好对应于以下规则:发回的对象必须满足下列条件:
●不是主叫用户+
●非由主叫用户或系统拥有+
●具有与主叫用户不同属任何人员群组的人员
拒绝查询SQL示例
下面的SQL举例说明了将由ACM生成且由SQP附加以执行访问管制方针的访问管制拒绝查询。在此例中,主叫用户的名字是‘JOHNDOE’。
  SELECT OBJECTID FROM OBJECTS WHEREOWNERUSERNAME<>‘JOHNDOE’OROWNERUSERNAME<>‘SYSTEM’ORWHERE OBJECTID NOT IN(SELECT OBJECTID FROM PEOPLE WHERENAME=‘JOHNDOE’)ORWHERE OBJECTID NOT IN(SELECT OBJECTID FROM SEMANTICLINKS WHEREOBJECTTYPEID=″PERSON AND PREDICATETYPEID=‘BELONGS_TO_GROUP’ANDSUBJECTID IN(SELECT SUBJECTID FROM SEMANTICLINKS WHERE OBJECTID IN(SELECT OBJECTID FROM PEOPLE WHERENAME=‘JOHNDOE’))
2.倘若查询是针对非人员对象(文档、电子邮件、事件等等),发回的对象最好必须:
●由主叫用户或系统用户拥有,并且
●是以主叫用户作为对象之某语义链接的主题,或者
●是以主叫用户作为主题之某语义链接的对象,或者
●是以与主叫用户同属至少一个人员群组之某人作为对象之某语义链接的主题,或者
●是以与主叫用户同属至少一个人员群组之某人作为主题之某语义链接的对象
相应的拒绝查询最好对应于以下规则:发回的对象必须满足下列条件:
●非由主叫用户拥有+
●非由系统用户拥有+
●不是以主叫用户作为对象之某语义链接的主题+
●不是以主叫用户作为主题之某语义链接的对象+
●不是以与主叫用户同属至少一个人员群组之某人作为对象之某语义链接的主题+
●不是以与主叫用户同属至少一个人员群组之某人作为主题之某语义链接的对象
拒绝查询SQL示例
下面的SQL举例说明了将由ACM生成且由SQP附加以执行访问管制方针的访问管制拒绝查询。在此例中,主叫用户的名字是‘JOHNDOE’。
  SELECT OBJECTID FROM OBJECTS WHERE OWNERUSERNAME<>‘JOHNDOE’OROWNERUSERNAME<>‘SYSTEM’OROBJECTID NOT IN(SELECT OBJECTID FROM SEMANTICLINKS WHEREOBJECTTYPEID=″PERSON’AND OBJECTID IN(SELECT OBJECTID FROM PEOPLEWHERE NAME=‘JOHNDOE’)ORWHERE OBJECTID NOT IN(SELECT OBJECTID FROM SEMANTICLINKS INNER JOINPEOPLE WHERE SEMANTICLINKS.SUBJECTTYPEID=‘PERSON’ANDSEMANTICLINKS.SUBJECTID=PEOPLE.OBJECTID)OROBJECTID NOT IN(SELECT OBJECTID FROM SEMANTICLINKS WHEREOBJECTTYPEID=‘PERSON’AND PREDICATETYPEID=‘BELONGS_TO_GROUP’ANDSUBJECTID IN(SELECT SUBJECTID FROM SEMANTICLINKS WHERE OBJECTID IN(SELECT OBJECTID FROM PEOPLE WHERE NAME=‘JOHNDOE’))OROBJECTID NOT IN(SELECT OBJECTID FROM SEMANTICLINKS WHEREOBJECTTYPEID=‘PERSON’AND PREDICATETYPEID=‘ELONGS_TO_GROUP’ANDOBJECTID IN(SELECT OBJECTID FROM PEOPLE WHERE NAME=‘JOHNDOE’))
合并拒绝查询SQL示例
通过合并这两条规则,ACM向SQP发回用于访问拒绝的以下合并查询:
 SELECT OBJECTID FROM OBJECTS WHEREOWNERUSERNAME<>‘JOHNDOE’OROWNERUSERNAME<>‘SYSTEM’OROBJECTID NOT IN(SELECT OBJECTID FROM PEOPLE WHERE NAME=‘JOHNDOE’)OROBJECTID NOT IN(SELECT OBJECTID FROM SEMANTICLINKS WHERE
  OBJECTTYPEID=″PERSON AND PREDICATETYPEID=‘BELONGS_TO_GROUP’ANDSUBJECTID IN(SELECT SUBJECTID FROM SEMANTICLINKSWHERE OBJECTID IN(SELECT OBJECTID FROM PEOPLE WHERE NAME=‘JOHNDOE’))OROBJECTID NOT IN(SELECT OBJECTID FROM SEMANTICLINS WHEREOBJECTTYPEID=″PERSON’AND OBJECTID IN(SELECT OBJECTID FROM PEOPLEWHEERE MAME=‘JOHNDOE’)OROBJECTID NOT IN(SELECT OBJECTID FROM SEMANTICLINKSINNER JOIN PEOPLEON SEMANTICLINKS.SUBJECTTYPEID=‘PERSON’AND SEMANTICLINKS.SUBJECTID=PEOPLE.OBJECTID)OROBJECTID NOT IN(SELECT OBJECTID FROM SEMANTICLINKS WHEREOBJECTTYPEID=‘PERSON’AND PREDICATETYPEID=‘BELONGS TO GROUP’ANDSUBJECTID IN(SELECT SUBJECTID FROM SEMANTICLINKS WHERE OBJECTID IN(SELECT OBJECTID FROM PEOPLE WHERE NAME=‘JOHNDOE’))OROBJECTID NOT IN(SELECT OBJECTID FROM SEMANTICLINKS WHEREOBJECTTYPEID=‘PERSON’AND PREDICATETYPEID=‘BELONGS_TO_GROUP’ANDOBJECTID IN(SELECT OBJECTID FROM PEOPLE WHERE NAME=‘JOHNDOE’))
示例情景
例如,路透社代理(KIS)可能有路透社服务之每个企业顾客的人员群组。该代理将有一共用信息库(路透社内容),但将按企业顾客有一些人员群组。这些群组可能包括竞争对手,因此最好确保知识的流动、生成、推理不会跨越竞争对手边界。例如,A公司的员工必须不会直接从与A公司竞争的B公司之员工处获得知识,亦必须不会间接(经由推理)获得知识。A公司的员工必须无法就由B公司员工注解的项目获得推荐。或者A公司的员工必须无法找到为B公司工作的专家。当然,这里假定A公司和B公司并非某种形式的合作伙伴(在此情况下,这两家公司可能希望共享知识)。对于知识合作伙伴,路透社将创建一个包括A公司和B公司之人员群组的人员群组(很可能经由LDAP)。路透社KIS于是将包括这些人员群组:A公司、B公司、A和B两公司。SMS也将包括A公司和B公司中属于这些群组之人员的元数据(经由“属于群组”语义链接类型)。借助于此程序,前述规则将保证知识会在A公司和B公司之间得到共享。
C.注解的访问管制规则
就注解而言,主叫用户将编辑语义网络,而不是查询之。在此情况下,下列为适用的规则:
1.倘若要注解的对象是某个人物对象,该对象最好必须是:
●主叫用户,或者
●与主叫用户同属至少一个人员群组且由主叫用户或系统拥有的某人
2.倘若要注解的对象是某个非人物对象(例如文档、电子邮件、事件等等),该对象最好必须是:
●由主叫用户拥有
●由系统拥有
拒绝查询SQL示例
下面的SQL举例说明了将由ACM生成(用于检查注解的访问管制)且由SQP附加以执行访问管制方针的访问管制拒绝查询。在此例中,主叫用户的名字是JOHNDOE’。
 SELECT OBJECTID FROM OBJECTS WHEREOWNERUSERNAME<>‘JOHNDOE’OROWNERUSERNAME<>‘SYSTEM’OROBJECTID NOT IN(SELECT OBJECTID FROM PEOPLE WHERE NAME=‘JOHNDOE’)OROBJECTID NOT IN(SELECT OBJECTID FROM SEMANTICLINKS WHEREOBJECTTYPEID=‘PERSON’AND PREDICATETYPEID=‘BELONGS_TO_GROUP’ANDOBJECTID IN(SELECT OBJECTID FROM SEMANTICLINKS WHERE OBJECTID IN(SELECT OBJECTID FROM PEOPLE WHERE NAME=‘JOHNDOE’))
访问管制执行
ACM负责执行对注解和KIS上其他写入作业的访问管制。KISXML Web服务显露一个如下所示的注解方法(C#示例):
AnnotateObject(String CallingUserName,String ObjectID);
此方法调用ACM以获得拒绝查询,然后创建一个如下所示的最终查询:
Annotation Object Query AND NOT IN(Denial Query)
在最佳实施方式中,注解对象查询总是具有如下形式:
SELECT OBJECTID FROM OBJECTS WHEREOBJECTID=ObjectID,
其中ObjectID是给AnnotateObject方法的自变量。
ACM于是构建一个最终访问管制查询SQL并使用此SQL进行访问管制检查。由于ACM不必发回该SQL,因此它只是直接调用之以进行访问管制检查。此外,由于这是一项二元检查(访问或不许访问),ACM只检查拒绝查询是否发回至少一行。例如,最终查询可能如下所示:
SELECT OBJECTID FROM OBJECTS WHERE OBJECTID=ObjectID AND NOT IN(SELECT OBJECTID FROM OBJECTSWHERE OWNERUSERNAME<>‘JOHNDOE’)
ACM于是运行这个查询(经由SQL查询处理器)并询问结果集内的行数。如果有一行的话,访问会被准许,否则访问被拒绝。此模式以此方式实现,是为了与拒绝查询模式保持一致(ACM总会构建一个拒绝查询并用此来作为所有访问管制检查的基础)。信息神经系统的语义查询定义和视觉化规范
1.语义图象与运动
A.概述
就Nervana语义用户体验而言,语义图象与运动能够是最佳实施方式中有利的组成部分。换句话说,在将语义图象或运动元数据存储于Nervana代理(信息社区)且经由Nervana XML Web服务访问的实施方式,用户对本系统的体验能够得到增强。在该实施方式中,最终用户将可经由Nervana而对其图象享有受语境和时间制约的语义访问。仅出于举例目的,请设想在电子邮件上使用Getty Images(或Corbis)智能体作为灵巧镜头——当被调用时,这将打开依语义与该邮件相关的图象。或者设想将某个文档从您的硬盘驱动器拖放到Getty智能体上,从而查看依语义相关的图象。这将需要具有(与某图象方案一致的)图象元数据。Nervana工具箱将保持不变,我们仅仅是为图象添加了一个新信息对象类型。此外还有针对语义图象的语义外壳,即不同的视图、缩略图、幻灯片放映、过滤、聚集等等。如需语义图象的示例,请访问:
http://creative.gettyimages.com/source/search/resultsmain.asp?source=advSearch&hdnSync=Medicine%7E0%2C12%2C449%2C3%2C15%2C1%2C0%2C0%2C0%2C12287%2C0%2C7%2C14%2C6%2C3%2C3%2C0%2C12%2C449%2Cen%2Dus&UQR=tfxfwz
B.针对具体行业的语义图象与运动
针对具体行业的语义图象与运动是能够用作(并且在最佳实施方式中已经用作)(与行业对应的)一个或多个类别语义结果的表示氛围之组成部分的图象与运动。例如,请访问http://www.corbis.com和http://www.gettyimages.com,并用下面列出的关键词(该等字词经过聚集后可基于行业标准的分类法与目标行业对应)进行搜索。这些图象与运动也能够用作(映射到语境模板和类别的)语境和类别外壳的背景、过滤器效果、变换、动画。此外,这些图象与运动可用作由其中一些图象中提取的运动路径之视觉效果,从而得到优越的屏幕保护程序。举例来说,请想像这样一个外壳:它沿由此类语义图象之一中提取的运动路径显示元数据和视觉化效果(例如,在一个灯泡内转动的元数据——用于“电力”工业),以及chrome和其他环绕图象与动画等等。其他有针对具体行业之图象与运动的行业可能包括:
  ●制药   ●电信   ●航空
  ●医药   ●电信设备   ●零售
  ●医疗保健   ●电信服务   ●时装
  ●生命科学   ●电信技术   ●广告
  ●生物技术   ●电信法规   ●航空航天
  ●油气   ●烟草   ●国防
  ●化工   ●汽车   ●农业企业
  ●能源   ●汽车   ●农业
  ●电力   ●保险   ●饮料
  ●供气   ●咨询   ●企业服务
  ●供水   ●信息技术   ●电子商业
  ●娱乐   ●技术   ●食品
  ●环境服务   ●计算机设备   ●森林产品
  ●出版   ●计算机制造商   ●医疗保健提供者
  ●房地产   ●计算   ●酒店
  ●金融   ●半导体   ●互联网
  ●经纪   ●纳米技术   ●法律
  ●金融服务   ●公家机关   ●法律
  ●银行   ●政府   ●制造
  ●消费者   ●国土安全   ●营销
  ●消费产品   ●旅行   ●媒体
  ●消费者服务   ●旅游   ●联网
  ●通信   ●交通
这也同样适用于信息类型和语境模板。外壳将基于语境或信息类型和类别或本体分类智慧行事,并且以智能的方式跨这些属性混合与匹配语义图象与运动。例如,标题为“关于无线技术的大标题”的智能体可有chrome(和/或一个灵巧砂漏——见下),其中显示在“大标题”图象与运动和“无线”图象与运动之间转换的基于图象与运动之动画。标题为“关于无线的混合器和关于半导体的突发新闻和由我的群组中任何人发出的与产品规格相关的电子邮件”之混合器可有chrome(和/或一个灵巧砂漏),其中显示在“大标题”、“新闻”、“无线”、“半导体”之间转换的图象与运动。
演示程序的查询处理器能够列举全部语境模板与信息类型和所有类别(由智能体或混合器SQML),并且相应设置chrome动画。
就信息类型而言,输入下列搜索(例如在Corbis和Getty上):
  ●文档   ●在线学习
  ●电子邮件   ●人员
  ●书籍   ●用户
  ●杂志   ●顾客
  ●多媒体
此外,就语境模板而言,输入下列搜索:
  ●大标题   ●收藏夹
  ●新闻   ●地点
  ●发现   ●时间(就“时间线”和“即将发生事件”而言)
  ●会话   ●时间表
  ●专家   ●约会
此外,请注意语义图象与运动最好不要完全随机,但最好也不要出自某个合订的组合。此等图象/运动最好经过精心选取且然后由外壳在选定的集合中随机挑选,但最好不是由诸如Corbis或Getty Images的整个图片集中随机选取。否则可能遇到无聊的图象、卡通,以及可能令人不快或不适当的图象。此外,有些指导方针最好依外壳主题是否处于微妙、温和、兴奋或超兴奋模式而变化。在微妙模式下,外壳可能决定为每个视觉化中心点选取一个图象/运动。而在其他模式下,这很可能会导致乏味的用户体验。
在低调模式下。外壳或可将某个语义图象/运动用作chrome的一部分,这与PowerPoint幻灯片组的背景并无二致(例如经过α混色)。语义图象/运动亦能够用于在灵巧砂漏(见下)中和作为视觉化的组成部分(在语境条、面板或调色板上)。就视觉化语境和信息类型而言,语义图象/运动最好经过精心挑选,从而可清楚地表明该信息类型或语境。此外,选择模式亦可成为一项外壳属性。
另外,每个外壳所用之语义图象/运动的可能数目可能需要有个上限,这取决于在什么地方显示该等图象/运动。然而在某些情景中,这可能并非必需。例如,混合器外壳可能随着用户在混合器结果中的定位(从页面到页面或从智能体到智能体),而在chrome背景之间转换,以便与来自该混合器的当前显示内容保持一致。这亦可成为一项外壳属性。
C.客户端语义图象与运动高速缓存
演示程序具有一个可扩展灵巧客户端高速缓存,其中有下载的和(于安装时)储存在客户机上的语义图象与运动。外壳于是能够在这些已预先缓存的图象与运动中挑选。图象/运动的预缓存可基于用户(自己选择)的收藏类别和兴趣领域,这将映射到目标行业。外壳于是能够用对图象服务器(某个显露服务器端图象/运动的XML Web服务,由Nervana或诸如Corbis或Getty Images的第三方提供)的请求式图象查询来补充该等已预缓存的语义图象/运动。
演示程序也将智慧行事和具有某种偏好功能,从而令最新下载的图象/运动先于较旧者得到选取(作为一种打破平局的手段)。与每个图象/运动一同高速缓存的还有一个“用量计数”,演示程序用此计数就显示哪些图象/运动与何时显示进行过滤。此“负载均衡分配”将导致更新鲜且不重复的用户体验。
此高速缓存最好按照需求进行充填(基于用户的语义查询),例如,对于波音公司的用户计算机来说,预缓存制药图象/运动是毫无意义的。高速缓存容量最好也有上限,并且图象高速缓存管理器最好使用某LRU算法或等同算法清除“旧的”和“未用的”图象。这样一来,此高速缓存就能与用户的智能体使用模式和收藏夹智能体清单保持“语义同步”。
2.灵巧砂漏
Nervana演示程序为提供“语义用户体验”而做出的多数呼叫将为向XML Web服务的远程呼叫。因此,在用户界面上将有不可预知且可能极长的延迟。人们能够预期企业内部会有可观的带宽和服务器处理能力,但Nervana用户界面仍然必须针对方法调用中的未知等待时间做出“计划”。
当今操作系统存在的问题之一是对磁盘或网络的不限时I/O呼叫。某些中央处理器作业也有相当长的延迟。在Windows和苹果机用户界面中,用户由某“等待”光标——通常具有“砂漏”的形状——而得知延迟的存在。
在最佳实施方式中,演示程序将具有语义提示(经由直接访问SQML“方法调用”),并且藉此能够显示“灵巧或语义砂漏”的等同内容。这可为显示“正在载入”或某些其他效果的一个中间页面。此外,演示程序能够通过读取该SQML以获得关于该查询所表示的类别和信息类型或语境模板之提示,来传达该查询的语义。演示程序于是能够使用该等提示来显示与该查询一致的语义图象和文本,尽管它尚未收到结果。查询的提示越多,该砂漏就越智慧。该“正在载入”页面于是能够传递“即将来到的是什么”气氛——甚至在实际结果由Web服务到达和由演示程序合并(演示程序)以获得最终结果之前。
此“灵巧砂漏”不仅能够在主结果窗格上显示,或许也可在灵巧镜头气球弹出窗口和内插预览窗口(实质上在对Web服务的每个呼叫点和“焦点”处)上出现。演示程序能够通过在显示“砂漏”前等候查询超时(或许在若干百毫秒之后——有关实现应借助于合用性测试来获得此数字)而智慧行事。
3.视觉化——语境模板
引言
语境模板是情景带动的信息查询模板,用于与信息访问和提取的具体语义模型对应。语境模板在本质上可想像成个人用数字语义信息提取“通道”,用于通过采用预定义的语义模板向用户递送信息。语境模板最好跨一个或多个代理而聚集信息。
下面描述的是已定义的语境模板。指向多种类型语义信息之综合和分发的更多语境模板正在得到考虑(例如与情绪相关的语境模板,例如“愤怒”、“悲伤”等等;以及地点、机动性、周围条件、用户任务等等的语境模板)。
突发新闻
突发新闻语境模板就插入其传递语义信息的方式而言,可类比为CNN{有线新闻网}的“Breaking News”{突发新闻}节目之个人化数字版本。此语境模板令用户可访问一个或多个代理上极为时间关键的信息;该等信息将根据信息创建或发表时间和一个定义信息关键性的可配置时间长度来排序。
Figure A20048000998004881
突发新闻——样本对象和语境条视觉化
1.以即将到来的突发新闻项目总数为背景,显示最新或即将发表之突发新闻项目之发表或预定时间的走动时钟
2.在语义图象上显示最新或即将发表之突发新闻项目之发表或预定时间的走动时钟
3.在语义图象和突发新闻项目的总数上显示最新或即将发表之突发新闻项目之发表或预定时间的走动时钟
4.在素背景上显示最新或即将发表之突发新闻项目之发表或预定时间的走动时钟
5.在不同背景上(依序)显示所有突发新闻之发表或预定时间的不走动时钟
6.在不同背景上显示最新或即将发表之突发新闻项目之发表或预定时间的日历视图
7.在不同背景上(依序)显示所有突发新闻之发表或预定时间的日历视图
8.缩放的字体大小——取决于最新或即将发表之突发新闻项目的发表或预定时间
9.缩放的字体大小——取决于突发新闻项数
10.动画字体(例如,闪烁提示、转动文本、沿路径运动的文本等等),其动画速率取决于最新或即将发表之突发新闻项目的发表或预定时间
11.动画字体(例如,闪烁提示、转动文本、沿路径运动的文本等等),其动画速率取决于突发新闻项数
12.变化的字体颜色——取决于最新或即将发表之突发新闻项目的发表或预定时间
13.变化的字体颜色——取决于突发新闻项数
14.突发新闻语义图象的动画图形或等同内容
15.突发新闻项数
16.依序动画显示的突发新闻项目标题(清单视图)
17.依序动画显示的突发新闻项目标题和详细资料(平铺视图)
18.围绕对象沿一轨道运动路径移动的语义图象/运动
19.在语义图象/运动上显示项数的气球弹出窗口
20.在带有语义图象/运动动画的素背景上显示项数的气球弹出窗口
大标题
大标题新闻语境模板就其传递语义信息的方式而言,可类比为CNN{有线新闻网}的“Headline News”{大标题新闻}节目之个人化数字版本。此语境模板令用户可访问一个或多个代理上的信息大标题;该等大标题将根据信息创建或发表时间和一个定义信息“新鲜度”的可配置时间长度或项数来排序。举例来说,CNN的“大标题新闻”节目(昼夜不停地)每隔30分钟显示大标题。在一最佳实施方式中,大标题语境模板将作为服务器上的一个SQL查询而实现;该查询具有依序串联在一起的下列子查询:今天发表的推荐、今天发表的收藏夹项目、今天发表的最佳匹配、今天和明天的即将发生事件、今天发表的带注解项目。
所有子查询都最好依发表日期/时间排序,然后串联在一起。更多的过滤器将基于SQML中的谓词清单得到应用。
下图所示为一个大标题视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象,举例说明了前述原则。
Figure A20048000998004911
会话语境模板
会话语境模板就插入其传递语义信息的方式而言,可类比为CNN{有线新闻网}的“Crossfire”{众矢之的}节目之个人化数字版本。与使用会话和辩论作为信息分发语境的“众矢之的”节目相似,在最佳实施方式中,会话语境模板跟踪相关信息的电子邮件投递、注解、线程。
会话语境模板包括下列信息对象类型:
1.线程深度至少为一的电子邮件(对某电子邮件的电子邮件回复)
2.线程深度至少为一的注解(对某对象之某注解的注解)
3.互联网新闻投递(对某新闻投递的新闻投递答复)
此查询将按线程深度排序。更多的过滤器将基于SQML中的谓词清单得到应用。此外,语境外壳应按线程显示信息项目。
下图所示为一个视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(两个人在一张写字台上工作)
会话语境——样本对象和语境条视觉化
1.图象/运动的动画图形(图标和语境指南视图)
2.素背景上的最大线程深度(图标和语境指南视图)
3.语义图象/运动上的最大线程深度(图标和语境指南视图)
4.依序动画显示的会话标题(清单视图)
5.依序动画显示的会话标题和详细资料(平铺视图)
6.素背景上的会话数目(图标和语境指南视图)
7.语义图象/运动上的会话数目(图标和语境指南视图)
新闻人物语境模板
新闻人物语境模板就插入其传递语义信息的方式而言,可类比为NBC{全国广播公司}的“Meet the Press”{面对媒体}节目之个人化数字版本。在此情况下,侧重点在于“新闻人物”,而不是新闻本身或会话。用户使用发回的人员作为信息对象中心点在网络中定位。新闻人物语境模板可被视为大标题语境模板,最好带有“人员”或“用户”对象类型过滤器,以及“authored by”{由......撰写}、“possibly authoredby”{可能由......撰写}、“hosted by”{由......主持}、“annotatedby”{由......注解}、“expert on”{关于......的专家}等等谓词(将人员与信息关联的谓词)。“relevant to”{相关于}默认谓词最好用于替代所有针对具体相关性的谓词。相关信息(例如新闻人物)系依照“他们制造的新闻”(例如大标题)的顺序进行排序。
此查询将按大标题数排序。更多的过滤器将基于SQML中的谓词清单得到应用。
下图例举了一个语义“新闻人物”视觉化或灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(橄榄球锦标赛)
Figure A20048000998004931
新闻人物——样本对象和语境条视觉化
1.会话中在讲话的两个人头之动画图形(图标和语境指南视图)
2.图象/运动的动画图形(图标和语境指南视图)
3.新闻人物的总数(图标和语境指南视图)
4.语义图象/运动上的新闻人物总数(图标和语境指南视图)
5.依序动画显示的新闻人物姓名(清单视图)
6.依序动画显示的新闻人物姓名和详细资料(平铺视图)
即将发生事件语境模板
即将发生事件语境模板(及其因此得到的特殊智能体)可类比传达关于即将发生事件之信息的特殊节目之个人化数字版本,例如关于“世界职业棒球大赛”、“NBA篮球决赛”、“世界杯足球决赛”等事件的特别节目。这在知识工作者情景中的等同情形是某用户想要监视与一个或多个类别、文档或其他信息中心点相关的所有即将发生之行业事件。即将发生事件语境模板最好与大标题语境模板完全相同,但是只有即将发生事件会通过过滤器并得到显示(最好使用表明事件和时间关键性的某个依语义适当的“语境外壳”)。发回的对象最好依照时间关键性排序且以最早的即将发生事件为首。
下图例举了一个语义“即将发生事件”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(预约夹)。
即将发生事件——样本对象和语境条视觉化
1.在即将发生事件之总数的背景上显示距离下一个事件之时间的走动时钟(图标和语境指南视图)
2.在语义图象/运动上显示距离下一个事件之时间的走动时钟(图标和语境指南视图)
3.在语义图象/运动和即将发生事件之总数上显示距离下一个事件之时间的走动时钟(图标和语境指南视图)
4.在素背景上显示距离下一个事件之时间的走动时钟(图标和语境指南视图)
5.在不同背景上(依序)显示距离所有即将发生事件之时间的不走动时钟(图标和语境指南视图)
6.在不同背景上显示下一个即将发生事件之预定时间的日历视图(图标和语境指南视图)
7.在不同背景上(依序)显示所有即将发生事件之预定时间的日历视图(图标和语境指南视图)
8.显示日历运动的动画图形(图标和语境指南视图)
9.图象/运动(例如日程簿)的动画图形(图标和语境指南视图)
10.语义图象/运动上的即将发生事件总数(图标和语境指南视图)
11.素背景上的即将发生事件总数(图标和语境指南视图)
12.依序动画显示的即将发生事件标题(清单视图)
13.依序动画显示的即将发生事件标题和详细资料(平铺视图)
发现
发现语境模板可类比为“Discovery Channel”{发现频道}的个人化数字版本。在此情况下,侧重点为关于特定主题的“纪录片”。发现语境模板通过随机选择与给定类别集合有关且在预定的可配置时期内投递的信息对象,模拟信息的智能聚集。语义权重而非时间是确定信息排序或表示的优先考虑因素。此语境模板可通过用分类谓词的语义链接强度过滤所有信息类型来实现。在此情况下,该过滤器的选择条件应比‘最佳匹配’过滤器宽松——该过滤器就过滤而言介于‘最佳匹配’和‘全部项目’之间某处。
下图为一个“发现”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
Figure A20048000998004971
发现——样本对象和语境条视觉化
1.图象/运动(例如,望远镜、宇宙飞船、海上的老船)的动画图形(图标和语境指南视图)
2.依序动画显示的前N个信息项目标题(清单视图)
3.依序动画显示的前N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.项目总数(图标和语境指南视图)
历史
历史语境模板可类比为“History Channel”{历史频道}的个人化数字版本。在此情况下,侧重点在于不仅分发关于特定主题的信息,而且是在历史的语境中进行。就此模板而言,优先轴为类别和时间。历史语境模板与发现语境模板相似,但进一步与某“最小年龄限制”呼应。其参数最好与发现语境模板相同,只是用“最小年龄限制”参数(或某个选用的“历史时间跨度”)取代“最大年龄限制”参数。此外,发回的对象最好基于其在本系统中的年龄或其自创建以来的年龄反向或随机顺序排列。
图108例举了一个语义“历史”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
Figure A20048000998004981
历史——样本对象和语境条动画视觉化
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最老(或随机)的N个信息项目标题(清单视图)
3.依序动画显示最老(或随机)的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
全部项目
全部项目语境模板代表着基于语义或基于关键词或文本搜索发回任何相关信息的语境。在此情况下,侧重点在于分发与该语境哪怕只是沾边的信息。全部项目语境模板的主轴最好为起码的关联可能性。在最佳实施方式中,为了发回可能相关之结果的最广泛集合或世界,全部项目语境模板同时采用语义查询和基于文本的查询。
下图例举了一个语义视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(太空)。
全部项目——视觉化与样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
最佳匹配
最佳匹配语境模板语境模板(及其因此得到的特殊智能体)代表着只发回高度相关信息的语境。在一最佳实施方式中,其侧重点在于分发被视为高度相关且依语义重要的信息。就这个语境模板而言,主轴为关联度。最佳匹配语境模板实质上采用语义查询且将不使用基于文本的查询,因为它无法保证基于文本之查询的关联度。最佳匹配语境模板最好用某个类别过滤器或关键词初始化。如果指定了关键词,服务器会动态完成分类。结果最好基于关联度分值或由该对象至该类别过滤器之“属于类别的”语义链接之强度排序。
图110例举了一个“最佳匹配”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
最佳匹配视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
收藏夹
收藏夹语境模板(及其因此得到的特殊智能体)代表着只发回“收藏夹”或“流行”信息的语境。在此情况下,侧重点为分发已由他人认可且获得好评的信息。在最佳实施方式中,收藏夹语境模板的轴包括领导人兴趣程度、有关对象受到的“评论”,以及该对象之注解线程的深度。在一个实施方式中,收藏夹语境模板只发回具有“收藏夹”语义链接的信息,并且其排序将通过计数该对象获得的“投票”数(基于此语义链接)。
图111例举了一个语义视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(咖啡与甜点)。
Figure A20048000998005021
收藏夹视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
经典作品
最佳匹配语境模板(及其因此得到的特殊智能体)代表着只发回具有公认价值之信息的语境。与收藏夹语境模板相似,在此的侧重点为分发已由他人认可且获得好评的信息。就此语境模板而言,优先轴包括历史语境、领导人兴趣程度、有关对象受到的“评论”,以及该对象之注解线程的深度。经典作品语境模板最好基于收藏夹语境模板实现,但具有另加的最小年龄限制和投票分值,实质上起着“老东西收藏夹”语境模板的作用。
图112例举了就“经典作品”而言灵巧砂漏、填空页面、转换效果、背景chrome等等的一个语义适当样本图象(汽车)。
Figure A20048000998005031
经典作品视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
推荐
推荐语境模板代表着发回“推荐的”信息(或有关代理推断用户将会感兴趣的信息)之语境。推荐将通过在“SemanticLinks”表上添加“推荐”语义链接和通过挖掘用户指明的收藏语义链接来插入。推荐最好利用诸如机器学习和协作过滤等方法。此语境模板的侧重在于分发用户很可能会感兴趣但或许尚未看到的信息。就这个语境模板而言,主轴最好包括兴趣可能性和新鲜度。
图113例举了一个依语义适当的“推荐”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等之语境或应用程序元件的样本图象(竖大拇指)。
Figure A20048000998005041
推荐视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
今天
今天语境模板代表着发回“今天”投递或举行(就事件而言)之信息的语境。此语境模板的侧重点最好是分发被视为基于“今天”过滤器来确定新鲜度时为当前的信息。
图114例举了一个语义“今天”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等元件的样本图象。
Figure A20048000998005051
“今天视觉化”——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
带注解项目
带注解项目语境模板代表着发回带注解信息的语境。此语境模板的侧重点在于分发因一个或多个用户曾经注解而很可能重要的信息。
图115例举了一个语义“带注解项目”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
Figure A20048000998005061
“带注解项目”视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
注解
注解语境模板代表着发回带注解信息的语境。此语境模板的侧重点在于分发属于注解的信息。
图116例举了一个语义视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(钉在公告牌上的便条)。
Figure A20048000998005071
“注解”视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个信息项目标题(清单视图)
3.依序动画显示最近的N个信息项目标题和详细资料(平铺视图)
4.语义图象/运动上的项目总数(图标和语境指南视图)
5.素背景上的项目总数(图标和语境指南视图)
专家
图117例举了一个语义“专家”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(教授)。
Figure A20048000998005081
“专家”视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个专家姓名(清单视图)
3.依序动画显示最近的N个专家姓名和详细资料(平铺视图)
4.语义图象/运动上的专家总数(图标和语境指南视图)
5.素背景上的专家总数(图标和语境指南视图)
地点
图118例举了一个语义“地点”视觉化——灵巧砂漏、转换效果、背景chrome等等的样本图象(巴黎)。空页面、
Figure A20048000998005091
“地点”视觉化——样本对象和语境条动画
1.语义图象/运动的动画图形或等同内容
2.依序动画显示最近的N个地名(清单视图)
3.依序动画显示最近的N个地名和详细资料(平铺视图)
4.语义图象/运动上的地点总数(图标和语境指南视图)
6.素背景上的地点总数(图标和语境指南视图)
混合器
图119例举了一个语义“混合器”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象(混合机)。
Figure A20048000998005101
“混合器”视觉化——样本图标动画
1.语义图象/运动的动画图形或等同内容
2.工作中的混合器或混合机之动画图形
3.依序动画显示的混合器项目标题(清单视图)
4.依序动画显示的混合器项目标题和详细资料(平铺视图)
5.语义图象/运动上的项目总数(图标和语境指南视图)
6.素背景上的项目总数(图标和语境指南视图)
信息对象类型
图120至138例举了下列信息对象类型的语义视觉化:文档、书籍、杂志、演示文稿、履历、电子表格、文本、网页、白皮书、电子邮件、电子邮件注解、电子邮件分发名单、事件、会议、多媒体、在线课程、人员、顾客、用户。
Documents
Figure A20048000998005111
Books
Magazines
Figure A20048000998005131
Presentations
Figure A20048000998005141
Resumes
Spreadsheets
Text
Web Pages
White Papers
Figure A20048000998005191
Email
Email Annotations
Email Distribution Lists
Figure A20048000998005221
Events
Figure A20048000998005231
Meetings
Figure A20048000998005241
Multimedia
Figure A20048000998005251
Online Courses
People
Figure A20048000998005271
Customers
Figure A20048000998005281
Users
Figure A20048000998005291
表示外壳类型
时间线
图139例举了一个语义“时间线”视觉化——灵巧砂漏、填空页面、转换效果、背景chrome等等的样本图象。
“时间线”视觉化——样本对象和语境条动画
1.在不同背景上显示信息项目之生效时间(发表时间、预定时间等等)的日历视图(图标和语境指南视图)
2.在不同背景上(依序)显示所有信息项目之生效时间的日历视图(图标和语境指南视图)
3.显示日历运动的动画图形(图标和语境指南视图)
4.图象/运动(例如时间扭曲图象/运动)的动画图形(图标和语境指南视图)
5.语义图象/运动上的信息项目总数(图标和语境指南视图)
6.素背景上的信息项目总数(图标和语境指南视图)
7.依序动画显示的信息项目标题(清单视图)
8.依序动画显示的信息项目标题和详细资料(平铺视图)
9.具有依生效日期或时间而充填之项目的滚动、线性时间线控制
10.依生效日期或时间排序的动画时间线滚动条
信息神经系统的语义客户端运行时控件API规范
1.介绍Nervana语义运行时控件——概述
在最佳实施方式中,Nervana语义运行时控件是一ActiveX控件;它显露用于利用Nervana语义用户体验显示语义数据的属性和方法。与Nervana语义用户体验的要求一致,此控件将主要由接收XML数据(使用SRML方案)和生成DHTML+TIME或SVG输出的XSLT外壳调用。在此实施方式中,Nervana控件实质上“封装”XSLT外壳坐落于其上的“SDK”,从而产生由语义内容带动的用户体验。下面列出的API展示了将由最佳实施方式中之最终API集显露或可供使用的功能性。
2.Nervana语义运行时控件API
A.EnumObjectsInNamespacePath
简介
EnumObjectsInNamespacePath方法发回名字空间路径中的对象。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法以打开某个名字空间路径,从而令用户可从语义浏览器内在名字空间中定位。
PROTOTYPE
SCODE
EnumObjectsInNamespacePath(
[in]BSTR Path,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
B.CompileSemanticQueryFromBuffer
简介
CompileSemanticQueryFromBuffer方法打开一个SQML缓冲区且将它编译成一个或多个执行就绪的SQML缓冲区。例如,包含一个混合器的SQML文件将被编译成表示各混合器条目的多个SQML缓冲区。倘若该混合器包含有多个混合器,该等混合器将被展开且就所包含的每个混合器将会发回一个SQML缓冲区。已编译的或“执行就绪的”SQML缓冲区是可由代理依语义处理的缓冲区。这意味着具有来自多个代理之智能体的混合器将令其SQML被编译成多个缓冲区;该等缓冲区具有来自每个代理的适当SQML。
附注:如果该缓冲区已被编译,此方法会发回S_FALSE且发回自变量将被忽略。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法以编译某个SQML缓冲区和检索生成的可以执行之“已编译码”。在典型情景中,该应用程序或外壳将编译一个SQML缓冲区,然后准备它希望每个单独SQML查询坐落的框架窗口。它于是能够通过调用OpenSemanticQueryFromBuffer且然后让结果在该等框架中显示来发出单独的SQML语义呼叫。
PROTOTYPE
SCODE
CompileSemanticQueryFromBuffer(
[in]BSTR SQMLBuffer,
[in]DWORD Flags,
[out]DWORD*pdwNumCompiledBuffers,
[out]BSTR*pbstrCompiledBuffers);
C.OpenSemanticQueryFromBuffer
简介
OpenSemanticQueryFromBuffer方法打开某个SQML缓冲区且异步地在DOM上启动XML结果(用SRML),由此某Nervana外壳能够沉下该事件。请注意在本实施方式中,该SQML必须是“已编译的”且执行就绪。如果该SQML并非执行就绪,此调用将失败。如要编译SQML缓冲区,请调用CompileSemanticQueryFromBuffer。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法以打开某个已编译的SQML缓冲区。
PROTOTYPE
SCODE
OpenSemanticQueryFromBuffer(
[in]BSTR SQMLBuffer,
[in]DWORD Flags,
[out]GUID*pQueryID);
D.GetSemanticQueryBufferFromFile
简介
GetSemanticQueryBufferFromFile方法打开某个SQML文件,并且发回缓冲区内容。该缓冲区于是可被编译和(或)打开。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法以将某个SQML文件转换成缓冲区以供处理。
PROTOTYPE
SCODE
GetSemanticQueryBufferFromFile(
[in]BSTR SQMLFilePath,
[in]DWORD FileOpenFlags,
[out]BSTR*pbstrSQMLBuffer);
E.GetSemanticQueryBufferFromNamespace
简介
GetSemanticQueryBufferFromNamespace方法打开某个名字空间对象并检索其SQML缓冲区。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳在已可取得名字空间对象的标识符和路径时将调用此方法来打开SQML缓冲区。
PROTOTYPE
SCODE
GetSemanticQueryBufferFromNamespace(
[in]GUID ObjectID,
[in]BSTR Path,
[out]BSTR*pbstrSQMLBuffer);
F.GetSemanticQueryBufferFromURL
简介
GetSemanticQueryBufferFromURL方法在一SQML缓冲区内包裹URL并发回该缓冲区。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法以将某个任何类型的URL转换成SQML。这可包括文件路径、HTTP URL、FTP URL、Nervana代理对象URL(以“wsobject://”为前缀)或Nervana代理URL(以“wsagency://”为前缀)。
PROTOTYPE
SCODE
GetSemanticQueryBufferFromURL(
[in]BSTR URL,
[out]BSTR*pBuffer);
G.GetSemanticQueryBufferFromClipboard
简介
GetSemanticQueryBufferFromClipboard方法将剪贴板内容转换成SQML并发回该缓冲区。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法,以便从剪贴板获得一个语义查询。应用程序于是能够载入此查询缓冲区。
PROTOTYPE
SCODE GetSemanticQueryBufferFromClipboard([out]BSTR*pBuffer);
H.Stop
简介
Stop方法会停止当前打开的请求。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法以停止刚刚发出的载入请求。
PROTOTYPE
SCODE Stop([in]GUID QueryID);
I.Refresh
简介
Refresh方法会刷新当前打开的请求。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将调用此方法以刷新当前已载入的请求。
PROTOTYPE
SCODE Refresh([in]GUID QueryID);
J.CreateNamespaceObject
简介
CreateNamespaceObject方法创建一个名字空间对象并发回其GUID。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳在一个新的查询文档被打开时通常将调用此方法以创建一个暂时的名字空间对象。
PROTOTYPE
SCODE
CreateNamespaceObject(
[in]BSTR Name,
[in]BSTR Description,
[in]BSTR QueryBuffer,
[in]LONG AgentObjectType,
[in]LONG Attributes,
[in]LONG NamespaceObjectType,
[out]GUID*pObjectID);
K.DeleteNamespaceObject
简介
DeleteNamespaceObject方法删除名字空间对象。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳通常将调用此方法以删除暂时的名字空间对象。
PROTOTYPE
SCODE DeleteNamespaceObject([in]GUID ObjeetID);
L.CopyObject
简介
CopyObject方法使用某种专属SQML剪贴板格式将语义对象作为SQML缓冲区复制到剪贴板上。此对象于是能够为相关语义查询而“粘贴”到智能体上,或者用作其他对象或智能体上的镜头。
用法情景
当用户单击某对象之弹出菜单中的“复制”菜单选项时,Nervana外壳通常将调用CopyObject方法。
PROTOTYPE
SCODE CopyObject([in]BSTR ObjectSRML);
M.CanObjectBeAnnotated
简介
CanObjectBeAnnotated方法检查给定对象是否能够注解。
用法情景
Nervana外壳通常将调用CanObjectBeAnnotated方法来确定是否显示指明“注解”命令的用户界面。
PROTOTYPE
SCODE CanObjectBeAnnotated([in]BSTR bstrObjectSRML);
N.AnnotateObject
简介
AnnotateObject方法会调用当前已安装的电子邮件客户程序并初始化该程序,从而向给定对象出自其中的代理之电子邮件智能体发送对该对象的电子邮件注解。
用法情景
当用户单击某对象之弹出菜单中的“注解”菜单选项时,Nervana外壳通常将调用AnnotateObject方法。
PROTOTYPE
SCODE AnnotateObject([in]BSTR bstrObjectSRML);
O.CanObjectBePublished
简介
CanObjectBePublished方法检查给定对象是否能够发表。
用法情景
Nervana外壳通常将调用CanObjectBePublished方法来确定是否显示指明“发表”命令的用户界面。
PROTOTYPE
SCODE CanObjectBePublished([in]BSTR bstrObjectSRML);
P.PublishObject
简介
PublishObject方法会调用当前已安装的电子邮件客户程序并初始化该程序,从而向给定对象出自其中的代理之电子邮件智能体发送对该对象的电子邮件出版物。
用法情景
当用户单击某对象之弹出菜单中的“发表”菜单选项时,Nervana外壳通常将调用PublishObject方法。
PROTOTYPE
SCODE AnnotateObject([in]BSTR bstrObjectSRML);
Q.OpenObjectContents
简介
OpenObjectContents方法使用某个适当的查看器打开对象。例如,电子邮件对象将在电子邮件客户程序中打开,文档将在浏览器中打开,等等。
用法情景
当用户单击某对象之弹出菜单中的“打开”菜单选项时,Nervana外壳通常将调用OpenObjectContents方法。
PROTOTYPE
SCODE OpenObjectContents([in]BSTR ObjectSRML);
R.SendEmailToPersonObject
简介
SendEmailToPersonObject用于向人物或顾客对象发送电子信件。此方法打开电子邮件客户程序并用该人物或顾客对象的电子邮件地址初始化该程序。
用法情景
当用户单击某人物或顾客对象之弹出菜单中的“发送电子邮件”菜单选项时,Nervana外壳通常将调用SendEmailToPersonObject方法。
PROTOTYPE
SCODE SendEmailToPersonObject([in]BSTR ObjectSRML);
S.GetObjectAnnotations
简介
GetObjectAnnotations方法用于获得对象在其出自其中之代理上的注解。
用法情景
Nervana外壳在想要显示某对象具有之注解的标题时,例如在弹出菜单内,或者在想要在一窗口内显示该等注解时,通常将调用GetObjectAnnotations方法。
PROTOTYPE
SCODE
GetObjectAnnotations(
[in]BSTR ObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
T.IsObjectMarkedAsFavorite
简介
IsObjectMarkedAsFavorite方法用于检查对象在其出自其中之代理上是否已标记为收藏。
用法情景
Nervana外壳通常将调用IsObjectMarkedAsFavorite方法来确定要显示哪个用户界面——“标记为收藏”命令或“不再标记为收藏”命令。倘若该对象不能标记为收藏(例如,倘若它不是起源于某个代理),错误代码E_INVALIDARG将被发回。
PROTOTYPE
SCODE
IsObjectMarkedAsFavorite(in]BSTR ObjectSRML);
U.MarkObjectAsFavorite
简介
MarkObjectAsFavorite方法用于将对象标记为是其出自其中之代理上的收藏。
用法情景
当用户单击“标记为收藏”命令时,Nervana外壳通常将调用MarkObjectAsFavorite方法。
PROTOTYPE
SCODE
MarkAsFavorite(in]BSTR ObjectSRML);
V.UnmarkObjectAsFavorite
简介
UnmarkObjectAsFavorite方法用于将对象不再标记为是其出自其中之代理上的收藏。
用法情景
当用户单击“不再标记为收藏”命令时,Nervana外壳通常将调用UnmarkObjectAsFavorite方法。
PROTOTYPE
SCODE
UnmarkAsFavorite(in]BSTR ObjectSRML);
W.IsSmartAgentOnClipboard
简介
IsSmartAgentOnClipboard方法用于检查灵巧智能体是否已复制到剪贴板上。
用法情景
Nervana外壳在想要切换用户界面以显示“粘贴”图标时或在“粘贴”命令被调用时,通常将调用IsSmartAgentOnClipboard方法。
PROTOTYPE
SCODE
IsSmartAgentOnClipboard();
X.GetSmartLensQueryBuffer
简介
GetSmartLensQueryBuffer方法用于获得灵巧镜头的查询缓冲区。它将发回特定查询的SQML;该查询代表关于剪贴板上灵巧智能体的对象且在语义上与给定对象相关。
用法情景
当用户单击“粘贴为灵巧镜头”以便从剪贴板上的灵巧智能体调用灵巧镜头时,Nervana外壳通常将调用GetSmartLensQueryBuffer方法。
PROTOTYPE
SCODE
GetSmartLensQueryBuffer(
[in]BSTR ObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
Y.OpenObjectContents
简介
OpenObjectContents方法使用某个适当的查看器打开对象。例如,电子邮件对象将在电子邮件客户程序中打开,文档将在浏览器中打开,等等。
用法情景
当用户单击某对象之弹出菜单中的“打开”菜单选项时,Nervana外壳通常将调用OpenObjectContents方法。
PROTOTYPE
SCODE OpenObjectContents([in]BSTR ObjectSRML);
Part
3.电子邮件控件API
A.Email_GetFromLinkObjects
简介
Email_GetFromLinkObjects方法用于由电子邮件对象出自其中之代理获得该对象之“From”{自}链接的元数据。
用法情景
Nervana外壳在想要由某电子邮件对象定位到“From”清单时,或者在想要显示该“From”清单中人名的弹出菜单时,通常将调用Email_GetFromLinkObjects方法。
PROTOTYPE
SCODE
Email_GetFromLinkObjects(
[in]BSTR EmailObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
B.Email_GetToLinkObjects
简介
Email_GetFromLinkObjects方法用于由电子邮件对象出自其中之代理获得该对象之“To”{致}链接的元数据。
用法情景
Nervana外壳在想要由某电子邮件对象定位到“To”清单时,或者在想要显示该“To”清单中人名的弹出菜单时,通常将调用Email_GetToLinkObjects方法。
PROTOTYPE
SCODE
Email_GetToLinkObjects(
[in]BSTR EmailObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
C.Email_GetCcLinkObjects
简介
Email_GetCcLinkObjects方法用于由电子邮件对象出自其中之代理获得该对象之“CC”{抄送}链接的元数据。
用法情景
Nervana外壳在想要由某电子邮件对象定位到“CC”清单时,或者在想要显示该“CC”清单中人名的弹出菜单时,通常将调用Email_GetCcLinkObjects方法。
PROTOTYPE
SCODE
Email_GetCcLinkObjects(
[in]BSTR EmailObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
D.Email_GetBccLinkObjects
简介
Email_GetBccLinkObjects方法用于由电子邮件对象出自其中之代理获得该对象之“BCC”{密件抄送}链接的元数据。
用法情景
Nervana外壳在想要由某电子邮件对象定位到“BCC”清单时,或者在想要显示该“BCC”清单中人名的弹出菜单时,通常将调用Email_GetBccLinkObjects方法。
PROTOTYPE
SCODE
Email_GetBccLinkObjects(
[in]BSTR EmailObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
E.Email_GetAttachmentLinkObjects
简介
Email_GetAttachmentLinkObjects方法用于由电子邮件对象出自其中之代理获得该对象之“Attachment”{附件}链接的元数据。
用法情景
Nervana外壳在想要由某电子邮件对象定位到“Attachments”清单时,或者在想要显示该“Attachments”清单中附件标题的弹出菜单时,通常将调用Email_GetAttachmentLinkObjects方法。
PROTOTYPE
SCODE
Email_GetAttachmentLinkObjects(
[in]BSTR EmailObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
4.人物控件API
A.Person_GetDirectReports
简介
Person_GetDirectReports方法用于由人物对象出自其中之代理获得该对象之“直接下级”链接的元数据。
用法情景
Nervana外壳在想要由某人物对象定位到“直接下级”链接时,或者在想要显示该“直接下级”清单中直接下级姓名的弹出菜单时,通常将调用Person_GetDirectReports方法。
PROTOTYPE
SCODE
Person_GetDirectReports(
[in]BSTR EmailObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
B.Person_GetDistributionLists
简介
Person_GetDistributionLists方法用于由人物对象出自其中之代理获得该对象之“分发名单成员”链接的元数据。
用法情景
Nervana外壳在想要由某人物对象定位到“分发名单成员”链接时,或者在想要显示该人为成员的分发名单之名称的弹出菜单时,通常将调用Person_GetDistributionLists方法。
PROTOTYPE
SCODE
Person_GetDistributionLists(
[in]BSTR PersonObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
C.Person_GetInfoAuthored
简介
Person_GetInfoAuthored方法用于由人物对象出自其中之代理获得该对象之“该人所撰信息”链接的元数据。
用法情景
Nervana外壳在想要由某人物对象定位到“该人所撰信息”链接时,或者在想要显示该人撰写之时间关键或最近信息的预览窗口时,通常将调用Person_GetInfoAuthored方法。
PROTOTYPE
SCODE
Person_GetInfoAuthored(
[in]BSTR PersonObjectSRML,
[in]BOOL SemanticQuery,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
D.Person_GetInfoAnnotated
简介
Person_GetInfoAnnotated方法用于由人物对象出自其中之代理获得该对象之“该人所注信息”链接的元数据。
用法情景
Nervana外壳在想要由某人物对象定位到“该人所注信息”链接时,或者在想要显示该人注解之时间关键或最近信息的预览窗口时,通常将调用Person_GetInfoAnnotated方法。
PROTOTYPE
SCODE
Person_GetInfoAnnotated(
[in]BSTR PersonObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
E.Person_GetAnnotationsPosted
简介
Person_GetAnnotationsPosted方法用于由人物对象出自其中之代理获得该对象之“该人张贴之注解”链接的元数据。
用法情景
Nervana外壳在想要由某人物对象定位到“该人张贴之注解”链接时,或者在想要显示该人张贴之时间关键或最近注解的预览窗口时,通常将调用Person_GetAnnotationsPosted方法。
PROTOTYPE
SCODE
Person_GetAnnotationsPosted(
[in]BSTR PersonObjectSRML,
[in]LONG QueryMask,
[out]BSTR*pQueryRequestGuid);
F.Person_SendEmailTo
简介
Person_SendEmailTo方法用于向某人物或顾客对象发送电子信件。此方法打开电子邮件客户程序并用该人物或顾客对象的电子邮件地址初始化该程序。
用法情景
当用户单击某人物或顾客对象之弹出菜单中的“发送电子邮件”菜单选项时,Nervana外壳通常将调用Person_SendEmailTo方法。
PROTOTYPE
SCODE Person_SendEmailTo([in]BSTR ObjectSRML);
5.系统控件事件
A.事件:OnBeforeQuery
简介
OnBeforeQuery事件于该控件在向与当前语义请求一致的资源发出查询前被启动。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳如果想要取消某查询或在发出该查询前高速缓存状态,将沉下此事件。
PROTOTYPE
VOID
OnBeforeQuery(
[in]GUID QueryID,
[in]BSTR QueryBuffer,
[in]DWORD QueryMask,
[in]DWORD Flags,
[out]BOOL *Cancel);
B.事件:OnQueryBegin
简介
OnQueryBegin事件于该控件在向与当前语义请求一致的某个资源发出第一个查询时被启动。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳如果想要在该查询进行中高速缓存状态或显示状态信息,将沉下此事件。
PROTOTYPE
VOID
OnQueryBegin([in]GUID ObjectID),
C.事件:OnQueryComplete
简介
OnQueryComplete事件于该控件在向与当前语义请求一致的资源发出查询前被启动。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳如果想要取消某查询或在发出该查询前高速缓存状态,将沉下此事件。
PROTOTYPE
VOID
OnQueryComplete([in]GUID QueryID),
D.事件:OnQueryResultsAvailable
简介
OnQueryResultsAvailable事件在有某异步方法调用的可用结果时被启动。此事件指明请求GUID,藉此调用者能够唯一地识别生成该响应的具体方法调用。
用法情景
Nervana客户机应用程序(例如语义浏览器)或Nervana外壳将沉下此事件以获得对此控件上方法调用的响应。
PROTOTYPE
VOID
OnQueryResultsAvailable(
[in]GUID QueryID,
[in]SCODE QueryResult,
[in]BSTR Results,
[in]DWORD NumResults,
[in]DWORD QueryMask,
[in]VARIANT ResultsParam);
E.附录A
查询掩码值
#define QM_RESULTS 0x01
#define QM_RESULTCOUNT 0x02
#define QM_NEWRESULTS 0x04
#define QM_NEWRESULTCOUNT 0x08
#define QM_DEFAULT(QM_RESULTS)
示例:
Person_GetInfoAuthored(
PersonObjectSRML,
QM_RESULTS|QM_RESULTCOUNT,
&QueryRequestGuid);
信息神经系统的灵巧请求观察规范
1.概述
灵巧请求观察是指信息神经系统的一项特征。该特征令语义浏览器(信息智能体或图书馆员)的用户可以平行监视(或“观察”)灵巧请求。这是一项很有利的特征,因为它可通过允许用户同时跟踪若干个请求而提高工作效率。
此特征在客户端语义运行时、语义浏览器及外壳中实现;允许以可配置的方式观察灵巧请求(经由类似于电视机画中画功能的机制);最好采用下列一个或多个软件组件:
1.请求观察清单(RWL)
2.请求观察群组
3.通知管理器(NM)
4.观察群组监视器(WLM)
5.观察窗格
6.观察窗口
2.请求观察清单与群组
请求观察清单是客户程序运行时管理的一个灵巧请求(或灵巧智能体)清单。此清单实质上由用户想要监视的灵巧请求构成。请求观察清单包含一系列条目,即具有下列数据结构的请求观察清单条目(RWLE):
  字段名   字段类型   字段描述
  RequestID   GUID   灵巧请求的唯一标识符
  Notification ReferenceCount   DWORD   此引用计数指明通知管理器是否应跟踪此灵巧请求是否有“新”对象
  RequestViewInstanceID   GUID   “拥有”RWLE之灵巧请求视图实例的唯一标识符。这用于动态添加且针对具体浏览器实例的RWLE,例如已分类的大标题、突发新闻、新闻作者(见下)。对于用户人工添加或经由非分类的请求观察规则(RWR)添加的系统范围RWLE(见下),此条目将初始化为NULL。
  LastUpdateTime   日期/时间   通知管理器上次更新请求结果计数的日期/时间
  RequestResultsCount   DWORD   该灵巧请求中的结果数目
  LastResultTime   日期/时间   最新发表之结果的日期/时间
请求观察清单(RWL)包含RWLE结构的一个阵列或矢量。请求观察清单管理器负责管理RWL。语义浏览器提供一个用户界面,令用户可在RWL内添加灵巧请求,此用户界面与RWLM对话以在RWL内添加和删除RWLE。此RWL由客户端语义运行时集中储存(和保持)(要么作为基于XML文件的表示,要么在诸如Windows注册表的仓库内)。
RWL也能够利用请求观察群组进行充填。请求观察群组赋予用户监视一组灵巧请求的手段,并且提供了用户让语义浏览器基于可配置的标准自动充填RWL的简单途径。请求观察群组至少有两类:自动请求观察群组和手动请求观察群组。自动请求观察群组是由语义浏览器基于选定之配置文件、当前显示请求之配置文件等等而动态充填的群组。手动请求观察群组令用户可人工充填某个灵巧请求群组(常规灵巧请求或混合器),从而作为一个集合加以监视。手动请求观察群组也令用户可添加支持的语境类型(例如文档、类别、文本、关键词、实体等等)——在此情况下,本系统将由过滤器动态生成语义查询(SQML)并将由此得到的查询加入手动请求观察群组。这就令用户不必首先基于一个或多个过滤器创建时间制约请求,然后再将这些过滤器加入观察群组——因此用户能够将注意力集中在过滤器上,其余部分由本系统完成。
用户将能够添加下列类型的自动RWG(为一个或多个可配置的配置文件,包括如图19之灵巧请求观察对话框中所示的“AllProfiles”{所有配置文件}:
1.Breaking News{突发新闻}——这会告知语义浏览器将突发新闻灵巧请求自动加入(选定配置文件的)RWL。
2.Headlines{大标题}——这会告知语义浏览器将大标题灵巧请求自动加入(选定配置文件的)RWL。
3.Newsmakers{新闻作者}——这会告知语义浏览器将新闻作者灵巧请求自动加入(选定配置文件的)RWL。
4.Categorized Breaking News{分类突发新闻}——这会告知语义浏览器将分类突发新闻灵巧请求自动加入(语境配置文件的)RWL。语义浏览器将动态添加具有对应于当前显示之灵巧请求(及语境或当前配置文件)的每个子类别之类别过滤器的灵巧请求——如果当前显示的灵巧请求具有类别。举例来说,倘若灵巧请求“Breaking Newsabout Technology{关于技术的突发新闻}”目前在语义浏览器的某个实例中显示,并且倘若类别“Technology{技术}”有5个子类别(例如Wireless{无线}、Semiconductors{半导体}、Nanotechnology{纳米技术}、Software{软件}、Electronics{电子学}),那么当此当前灵巧请求被载入时,下列灵巧请求会被动态加入RWL:
●Breaking News about Technology.Wireless[<语境配置文件名>]
●Breaking News about Technology.Semiconductors[<语境配置文件名>]
●Breaking News about Technology.Nanotechnology[<语境配置文件名>]
●Breaking News about Technology.Software[<语境配置文件名>]
●Breaking News about Technology.Electronics[<语境配置文件名>]
这些条目的RWLE也将使用当前语义浏览器实例的RequestViewInstanceID加以初始化。倘若用户定位到一个新的灵巧请求,前面载入的灵巧请求之分类突发新闻将被从RWL中删除;一个新的分类突发新闻清单将为该新灵巧请求而添加,并且使用与该新灵巧请求视图对应的新RequestViewInstanceID加以初始化。这样就营造了一种灵巧用户体验;在此(子类别的)分类突发新闻将基于当前显示的请求而动态显示。用户于是能够将分类突发新闻灵巧请求作为一个观察群组或集合加以监视。
5.Categorized Headlines News{分类大标题}——这会告知语义浏览器将分类大标题灵巧请求自动加入(语境配置文件的)RWL。这与分类突发新闻相似,只是在此情况下使用的是大标题。用户于是能够将分类大标题灵巧请求作为一个观察群组或集合而加以监视。
6.Categorized Newsmakers News{分类新闻作者}——这会告知语义浏览器将分类新闻作者灵巧请求自动加入(语境配置文件的)RWL。这与分类突发新闻相似,只是在此情况下使用的是新闻作者。用户于是能够将分类新闻作者灵巧请求作为一个观察群组或集合而加以监视。
7.My Favorite Requests{我的收藏夹请求}——这会告知语义浏览器将所有收藏夹灵巧请求自动加入(选定配置文件的)RWL。这令用户可将其所有收藏夹灵巧请求作为一个群组而加以观察或监视。
8.My Favorite Breaking News{我的收藏夹突发新闻}——这会告知语义浏览器将所有收藏夹突发新闻灵巧请求自动加入(选定配置文件的)RWL。这令用户可将其所有收藏夹突发新闻灵巧请求作为一个群组而加以观察或监视。
9.My Favorite Headlines{我的收藏夹大标题}——这会告知语义浏览器将所有收藏夹大标题灵巧请求自动加入(选定配置文件的)RWL。这令用户可将其所有收藏夹大标题灵巧请求作为一个群组而加以观察或监视。
10.My Favorite Newsmakers{我的收藏夹新闻作者}——这会告知语义浏览器将所有收藏夹新闻作者灵巧请求自动加入(选定配置文件的)RWL。这令用户可将其所有收藏夹新闻作者灵巧请求作为一个群组而加以观察或监视。
请求观察群组管理器用户界面
下面的图例举了最佳实施方式之语义浏览器的“灵巧请求观察”对话框。此对话框的上半部分用于添加自动观察群组。用户能够选取自动观察群组类型和配置文件类型(“All Profiles”{所有配置文件}、“Contextual Profile”{语境配置文件}、以及配置文件的实际名称)并将它们加入自动观察群组清单。用户也能够删除自动观察群组。此对话框的下半部分用于在手动观察群组中添加和删除灵巧请求。
Figure A20048000998005541
Figure 2:The“Smart Request Watch”Dialog Box
3.通知管理器
在最佳实施方式中,通知管理器(NM)是语义运行时客户程序的一个部件,用于监视RWL中的灵巧请求。NM具有一个线程,负责定期调用RWL中的每个灵巧请求(经由客户机语义查询处理器)并且用“结果计数”和“上次更新时间”来更新RWLE。在最佳实施方式中,NM最好每隔5-30秒调用一次灵巧请求。取决于RWL的大小,NM能够聪明地调整请求检查的周期或频率(从而尽量减少带宽用量和对Web服务缩放能力的影响)。
对于时间制约灵巧请求(例如突发新闻、大标题、新闻作者),NM在调用该灵巧请求时最好不带任何附加时间过滤器。然而,对于(例如信息类型而非语境类型或诸如收藏夹和推选等非时间制约语境模板的)非时间制约请求,NM最好为带有时间过滤器(例如过去10分钟)的灵巧请求调用查询。
4.观察群组监视器
在最佳实施方式中,语义运行时客户程序管理着本发明人所称的观察群组监视器(WGM)。对于用户已加入观察群组清单中的每个观察群组,客户程序会创建一个观察群组监视器。观察群组监视器负责跟踪其观察群组中每个请求之新结果的数目。观察群组监视器会为该观察群组中具有新结果的RWLE创建一个队列,并且为了尽可能提高这些结果的新鲜度而管理此队列。WGM会定期轮询NM,以了解其观察群组中的每个请求是否有新结果。如果有的话,它会基于该请求的“最后结果时间”将该请求加入队列。此举的用意在于依照以最新的结果为首的原则排定请求的优先级。演示程序中运行之当前显示的可视风格(外壳)于是将调用语义运行时OCX以令WGM队列中的请求出列。这样一来,请求观察用户界面将与新结果的存在和结果的新鲜度一致。一旦当前显示的请求中没有更多的结果,该灵巧风格将令WGM队列中的下一个请求出列。
5.观察窗格
观察窗格(WP)是指在演示程序中(与主结果窗格一起)显示的一个面板,其中包含用户之观察群组的可视表示。WP令用户可速览每个观察群组,以了解其请求是否有新的结果。WP也可令用户改变显示每个观察群组之实时状态的当前视图。目前已定义的有下列视图:
●平铺视图——显示观察群组的标题及其所有灵巧请求的新结果总数。
●滚动条视图——显示观察群组所有灵巧请求的新结果总数,并且用一个动画依次显示每个灵巧请求的新结果数目(如同滚动条一般)。
●预览视图——与滚动条视图相似;只是在滚动条中除显示新结果的数目外,亦显示每个灵巧请求的最新结果。
●深层视图——在此视图中,WP在显示观察群组所有灵巧请求之新结果总数的同时,亦用滚动条显示每个灵巧请求的新结果数目和每个灵巧请求之所有新结果的幻灯片放映。
6.观察窗口
WP也令用户可观察某观察群组。用户可通过选取WP中的某个观察群组并将它拖到主结果窗格(或用类似方法)来达到此目的。如此就可形成一个观察窗口(WW)。此WW与电视的画中画功能在外观或布局上相似,但在若干方面不同;其中最引人注目的是在此情况下所显示的内容由语义请求和结果构成,而不是正在“观看”的电视频道。诚然,生成此内容的基本技术也大为不同。WW可在任何前述视图中显示。然而当WW在深层视图中出现时,WW的查看控制项就会显示。目前已定义的有下列控制项:
●钉住请求——这令用户可钉住观察群组中的特定请求。WW将一直(循环)显示已钉住请求的新结果,而在只要当前请求继续被钉住就不会前进到该观察群组中的其他请求。
●对换请求——这令用户可将当前显示的请求与语义浏览器中出现的主请求对换。灵巧风格将调用OCX上的一个方法,从而用该被对换请求(由其SQML缓冲区加以散列)创建一个暂时请求,并且于是定位到该请求且同时通知演示程序现在在其位置显示该主请求(在WW内)。
●停止、播放、查找、快进、倒退、读写、加速——这些功能令用户可停止、播放、查找、快进、倒退或加速“观察群组请求流”。例如,快进将由当前显示的请求前进若干个请求。
●结果控制项——这令用户可控制观察群组中每个请求的结果。该等结果在本质上是一种流中流,并且这将也令用户可控制当前观察群组中当前请求的结果。
●自动显示模式——如此将在没有要显示的结果时自动隐去WW和在有新结果时让它淡入。这样一来,用户由于知道在有新的语义结果时观察窗口将会淡入,就可最大限度地利用其屏幕空间。这项特征也令用户可在依个人和语义方式的信息交互作用中管理其注意力。
●停放、关闭、最小化、最大化——这些特征,如其名称所暗示,令用户可停放、关闭、最小化或最大化观察窗口。图20例举了一个显示Filtered Smart Requests(e.g.,.Headlines on Wireless){已过滤的灵巧请求(例如关于无线的大标题)}的观察窗口。
下图示出观察窗口之一个例证。
Figure A20048000998005571
Figure 3:An Illustration of the Watch Window
信息神经系统的灵巧风格规范
1.灵巧风格概述
应用于某种风格主题的色彩主题和动画主题,由此得到“灵巧风格”。“灵巧”在此语境中意指该风格会适应和响应其请求的情绪、语境窗格、预览模式、手持设备模式、实况模式、幻灯片放映模式、屏幕保护程序模式、混合器与收集模式、辅助功能、用户设置识别,并且可能还有本系统内其他变量(见下)。可能的风格有无限的数目和种类或“类别”。最佳实施方式包括至少下列风格类别:
1.微妙——用于由任务主导的工作效率。
2.温和——用于由任务主导的工作效率,带有一些演示效果。
3.兴奋——令人兴奋的效果(同样适合于首要和次要机器,以及用于非活动Nervana窗口——例如背景中或停放在状态栏上的Nervana客户程序窗口)。
4.超兴奋(非常适合有助于工作效率的灵巧屏幕保护程序,例如次要机器——当用户在使用其首要机器时)。
5科幻(科幻影迷的福音,非常适合无需考虑工作效率的灵巧屏幕保护程序,例如当用户离开办公桌时)。
风格、色彩、动画等主题,可变且无限,由Nervana或许还有用户和(或)其他厂家外壳作者制作。
2.暗示和动态灵巧风格的属性
a.情绪——灵巧风格必须传达请求的情绪(即该请求是传递给灵巧风格的一个参数)。这将涉及传达灵巧请求之依语义通知或依语义决定之属性的语义图象、语义运动、视觉化等等(语境模板或信息类型,类别,无论是否有过滤器(例如本地文档),该等过滤器的信息类型等等)。
b.语境窗格——例如深层信息窗格(按对象)、语境预览窗格、可停放语境画中画观察群组或窗格等等。
c.预览模式——每个灵巧风格都必须能够预览显示其结果(在一个小窗口内)。
d.手持设备模式——每个灵巧风格都必须能够针对手持设备优化显示其结果。
e.实况模式——每个灵巧风格都必须具有一个“实况”模式,用于显示实时语义视觉化(按对象)。这可在启用或停用之间切换(例如倘若用户不欲使用实时语义视觉化,或者欲节省由实时Web服务调用而导致的每对象带宽)。
f.幻灯片放映模式——每个灵巧风格最好都必须能够“播放”请求的结果——如同实况流。
g.屏幕保护程序模式——每个灵巧风格最好都必须能够如同屏幕保护程序那样地“播放”请求的结果。这是幻灯片放映模式的一个变种,只是采用全屏幕或剧场模式。
h.混合器或集合模式——如果所显示的请求系一混合器或集合,则每个灵巧风格最好都必须适当改变其用户界面。
i.辅助功能——每个灵巧风格最好都必须支持辅助功能。
j.用户设置识别——Nervana图书馆员程序将允许用户指明自己是初学者、中级用户或高级用户,以及其各自的职能(研发、销售、营销、高级经理等等)。每个灵巧风格最好都会在适当时考虑这些职能(或受其影响)。
●每个灵巧风格最好对请求的语义负责且与之一致,从而识别(或辨认或感知)且于是视觉化(或表示或描述或展示,与用户值得注意之内容一致):
●当前请求的情绪(包括语义图象、运动、chrome等等)
●当前请求中项目数的改变
●每个对象的情绪(内在地)
●每个对象之语境的情绪(大标题、突发新闻、专家等等)
●二元或绝对事项与特征(例如,有突发新闻,或是没有?共有多少个专家?多少条大标题?),而不是程度不同或处于某个梯度或连续体上
●如果该特征处于某个梯度或连续体上,感知在其上的相对位置(例如突发新闻的突发程度有多高?大标题的关键程度有多高?专家的专长水平如何等等?)
●每个对象之语境的改变(有新的突发新闻,有新的注解等等)
●正在显示的每个对象之相对关键性(不同尺寸的查看端口,不同的字体,不同的chrome等等)
●请求定位与“载入”状态(引进正载入的新请求之情绪的填空部分)
●任何单个画中画窗口的所有属性(用动画控制作成动画)
●新画中画窗口的添加(到画中画窗口调色板上)
●画中画窗口的任何大小调整、移动、停放
●任何预览窗口(例如语境调色板、每个对象的“视觉化用户界面”、日程表等等)
●与所有前述情绪和通知之视觉化一致的声音(全部包括)
下图为‘Smart Styles’{灵巧风格}对话框的一个屏幕抓图,其中例举了一些前述操作与特征。如该图所示,此对话框令用户可以跨Style classes{风格类别}、Style themes{风格主题}、Color themes{色彩主题}、Animation themes{动画主题}浏览灵巧风格。Preview{预览}窗口向用户显示了对当前选定之灵巧风格的预览。
Figure 1:Smart Styles Dialog Box
信息神经系统的客户端语义查询文档规范
1.语义查询标注语言(SQML)概述
在当前最佳实施方式中,Nervana语义DHTML行为系一Internet Explorer DHTML行为。在客户程序看来,该行为是它就查询文档而言所理解的一切。客户程序以与文字处理器打开‘文本和复合文档’相似的方式打开‘查询文档’。Nervana客户程序主要负责处理Nervana语义查询文档和再现结果。Nervana语义查询文档用Nervana语义查询标注语言(SQML)的形式表达和存储。该形式就好象“语义文件格式”。
在最佳实施方式中,SQML语义文件格式包括下列部分:
●Head——‘头’标签,与HTML相似,包括描述文档的标签。
●Title——文档的标题。
●Comments——文档的注释。
●UserName——文档创建者的用户名。
●SystemName——文档创建时所在设备的系统名。
●Subject——文档的主题。
●Creator——文档的创建者。
●Company——文档创建的所在公司。
●RequestType——指明请求的类型,这可为“灵巧请求”(指明对一个或多个信息社区Web服务的请求)或“无智请求”(指明对一个或多个本地或网络资源的请求)。
●ObjectType——完全限定由该查询发回之对象的类型。
●URI——文档的位置。
●CreationTime——文档的创建时间。
●LastModifiedTime——文档的上次修改时间。
●LastAccessedTime——文档的上次访问时间。
●Attributes——文档的属性(如果有)。
●RevisionNumber——文档的修订版本号。
●Language——文档的语言。
●版本——指明该查询的版本。这就令Web服务的语义查询处理器可以发回带有不同版本的结果。例如,某版本的浏览器能够使用查询的V1,另一个版本能够使用V2。这就令Web服务可在资源一级(例如为智能体)和在链接一级提供向后兼容性。
●Targets——指明作为查询文档目标的信息社区Web服务之名称和URL。
●Type——指明目标类型。这可为“targetentries”{目标条目},此时该标签包括指明实际Web服务目标的子标签;或者为“allsubscribedtargets”{所有已订目标},此时查询处理器会使用所有已经订阅的信息社区。
●Categories——指明查询文档所参照的类别URL之清单。每个“类别”条目都包含一个名称属性和一个URI属性,用于指明该类别出自其中的知识域服务器(KDS)之URL。
●Type——指明类别类型。这可为“categoryentries”{类别条目},此时该条目指向类别条目的清单;或可为“allcategories”{所有类别},这会向信息社区Web服务请求所有类别;或可为“myfavoritecategories”{我的收藏类别},此时查询处理器会得到用户之收藏类别且于是生成包含这些类别的已编译SQML(此已编译的SQML于是被发送给服务器)。
●Query——此为查询文档之所有主查询条目的母标签
●Resource——对要查询的‘无智’资源的参照,例如文件路径、URL、高速缓存条目标识符等等。这将由解释器映射到实际资源管理器部件。
●Type——资源参照的类型,用名字空间限定。已定义的资源参照类型之例有:nervana:url(这表明资源参照是一形成良好的标准互联网URL,或者一个诸如‘agent://...’的自定义Nervana URL),nervana:filepath(这表明资源参照是文件系统上某文件或目录的路径),以及nervana:namespaceref(这表明该资源来自客户端语义名字空间)。
●Uri——指明资源的通用资源标识符。倘若为路径和互联网URL,这指明该URL本身。倘若为名字空间条目,这指明该条目的GUID标识符。
●Mid——指明元数据标识符。此标识符由SQML解释器用于将资源与文档的元数据部分对应。此元数据标识符被映射到元数据部分内的相同标识符。
●Args——指明资源标识符的自变量。
●Links——指明对语义链接(只限“目标”)的参照
●Type——指明链接类型。这可为“linkentries”{链接条目},指明该等链接为明示条目。
●LinkEntries——指明链接条目的详细资料。
●Predicate——指明该链接的谓词类型。例如,谓词“nervana:relevantto”表明该查询为“由资源R发回与对象O相关的所有对象”,其中R和O分别为规定的资源和对象。其他谓词例子包括nervana:reportsto、nervana:teammateof、nervana:from、nervana:to、nervana:cc、nervana:bcc、nervana:attachedto、nervana:sentby、nervana:sentto、nervana:postedon、nervana:containstext等等。
●Type——指明在‘Link’{链接}标签中指明之对象参照的类型。例子包括诸如xml:string、xml:integer的标准XML数据类型,Nervana的等同数据类型,诸如nervana:datetimeref的Nervana自定义类型(这可指向诸如‘今天’和‘明天’的对象参照),以及指向Nervana能够作为语义XML对象而处理之对象的任何标准互联网URL(HTTP、FTP等等)或Nervana URL(objects://等等)。
●Metadata——包含对元数据条目的参照。
●MetadataEntry——指明元数据条目的详细资料。
●Mid——指明元数据标识符(GUID)。
●Value——指明元数据本身。
例如:文档(信息或基于语境)
<?xml version=″1.0″encoding=″utf-8″?>
<sqml>
<head
    requesttype=″smart request″
    objecttype=″context\headlines″
    uri=″c:\foo’s\bar.pdf″
    ereationtime=″foo″
    lastmodifiedtime=″foo″
    lastaccessedtime=″foo″
    attributes=″0″
    revisionnumber=″0″
    language=″foo″
    version=″foo″/>
    <title>foo</title>
    <comments>foo</comments>
    <username>foo</username>
    <systemname>foo</systemname>
    <subject>foo</subject>
    <creator>foo</creator>
    <company>foo</company>
<targets>
    <target
        name=″Marketing″
        reftype=″uri″
        ref=″kisp://marketing/default.wsdl″
    />
    <target
        name=″Research″
        reftype=″uri″
        ref=″kisp://research/default.wsdl″
    />
</targets>
<categories>
    <category
        name=″reuters\pharmaceuticals\biotechnology″
    reftype=″uri″
    ref=″kdsp://reuters.com/categories.wsdl?id=45″
    />
    <category
        name=″reuters\pharmaceuticals\life_sciences″
        reftype=″uri″
        ref=″kdsp://reuters.com/categories.wsdl?id=57″
    />
</categories>
/>
<resources>
    <resource
        name=″foo″
        type=″information\documents\general document″
        reftype=″nervana:filepath″
        ref=″file://c:\bar.doc″
        mid=″7886e4a0-55d9-45ac-a084-97adc6fffd0f″
        args=″″
    />
    <resource
        name=″foo″
        type=″information\all information″
        reftype=″nervana:url″
        ref=″file://c:\bar.doc″
        mid=″01fc64a3-c068-4339-bc97-17e5ff37e93f″
        args=″″
    />
    <resource
        name=″foo″
        type=″information\all information″
        reftype=″nervana:folderpath″
    ref=″file://c:\″
    mid=″f8cc39c3-e4f0-4a29-be2a-d2faf36eb3a0″
    args=″includesubfolders=true″
/>
<resource
    name=″foo″
    type=″information\documents/general document″
    reftype=″nervana:url″
    ref=″http://www.bar.com/doc.htm″
    mid=″f8cc39c3-e4f0-4a29-be2a-d2faf36eb3a0″
    args=″″
/>
<resource
    name=″foo″
    type=″information\documents\general document″
    reftype=″nervana:url″
    ref=″ftp://gate.com/doc.txt″
    mid=″f8cc39c3-e4f0-4a29-be2a-d2faf36eb3a0″
    args=″″
/>
<resource
    name=″foo″
    type=″information\documents\general document″
    reftype=″nervana:filepath″
    ref=″file://\\servers\server\file.pdf″
    mid=″1b870a25-4e98-45d8-a444-f0283a495357″
    args=″″
/>
<resource
    name=″foo″
    type=″information\documents\text document″
    reftype=″nervana:text″
    ref=″″
    mid=″7886e4a0-55d9-45ac-a084-97adc6fffd0f″
    args=″″
/>
<resource
    name=″foo″
    type=″information\documents\general document″
    reftype=″nervana:cacheentry″
    ref=″ef9c90ea-282d-46d6-b355-ac8a4fc2f3e5″
    mid=″″
    args=″″
/>
<resource
    name=″foo″
    type=″information\email\email message″
    reftype=″nervana:url″
    ref=″request://email.all@ibm.com″
    mid=″″
    args=″″
/>
<resource
    name=″foo″
    type=″information\email\email annotation″
    reftype=″nervana:url″
    ref=″objects://rad.com/agency.asp″
    mid=″″
        args=″″
    />
    <resource
        name=″foo″
        type=″information\documents\general document″
        reftype=″nervana:url″
        ref=″objects://rad.com/agency.asp″
        mid=″″
        args=″″
    />
    <resource
        name=″foo″
        type=″information\documents\general document″
        reftype=″nervana:url″
        ref=″objects://rad.com/agency.asp″
        mid=″″
        args=″″
    />
    <resource
        name=″foo″
        type=″information\documents\general document″
        reftype=″nervana:url″
        ref=″request://documents.all@intel.com″
        mid=″″
        args=″″
    />
</resources>
<links>
    <link
    operator=″and″
    predicate=″nervana:relatedto″
    name=″foo″
    type=″information\documents\general document″
    reftype=″nervana:filepath″
    ref=″file://c:\foo.doc″
    mid=″7886e4a0-55d9-45ac-a084-97adc6fffd0f″
    args=″″
/>
<link
    operator=″and″
    predicate=″nervana:contains″
    name=″foo″
    type=″information\documents\general document″
    reftype=″nervana:text″
    ref=″″
    mid=″46ea76cb-1383-4885-af6f-0e0fc6a66896″
    args=″″
/>
<link
    operator=″and″
    predicate=″nervana:postedon″
    name=″foo″
    type=″types\datetime″
    reftype=″nervana:datetimeref″
    ref=″″
    mid=″3fa64c3c-4754-4380-91b5-521299036c62″
    args=″″
/>
    <link
            operator=″and″
        predicate=″nervana:relatedto″
        name=″foo″
        type=″information\documents\general document″
        reftype=″nervana:url″
        ref=″kisp://98@in.com/m.asp″
        mid=″c2649c39-a1c3-4ca8-ae8d-c85c04372e9a″
        args=″″
    />
    <link
        operator=″and″
        predicate=″nervana:isofpriority″
        name=″foo″
        type=″types\priority″
        reftype=″nervana:priority″
        ref=″″
        mid=″69bbc048-98c8-4f76-8edf-5a00ce91c183″
        args=″″
    />
</links>
<metadata>
<metadataentry
    mid=″7886e4a0-55d9-45ac-a084-97adc6fffd0f″
    reftype=″uri″
    ref=″file://c:\foo\bar.pdf″/>
    <value>
        <docu ment>
            <title>scenario modelling</title>
             <type>text</type>
             <format>application/pdf</format>
             <filepath>c:\foo\bar.pdf</filepath>
             <shortfilename>bar.pdf</shortfilename>
             <creationtime>foo</creationtime>
             <lastmodifiedtime>foo</lastmodifiedtime>
             <lastaccessedtime>foo</lastaccessedtime>
             <attributes>0</attributes>
             <size>0</size>
             <subject>foo</subject>
             <creator>foo</creator>
             <manager>foo</manager>
             <company>foo</company>
             <category>foo</category>
             <keywords>foo</keywords>
             <comments>foo</comments>
             <hlinkbase>foo</hlinkbase>
             <template>foo</template>
             <lastsavedby>foo</lastsavedby>
             <revisionnumber>0</revisionnumber>
             <totaleditingtime>foo</totaleditingtime>
             <numpages>0</numpages>
             <numparagraphs>0</numparagraphs>
             <numlines>0</numlines>
             <numwords>0</numwords>
             <numcharacters>0</numcharacters>
<numcharacterswithspaces>0</numcharacterswithspaces>
             <numbytes>0</numbytes>
        <language>foo</language>
        <version>foo</version>
        <abstract>foo</abstract>
        </document>
    </value>
/>
<metadataentry
    mid=″bfcb12b4-70bb-473a-847c-ebffe187828f″
    reftype=″uri″
    ref=″file://c:\foo\bar.pdf″/>
    <value>
    <email>
        <title>scenario modelling</title>
        <type>text</type>
        <format>application/pdf</format>
        <filepath>c:\foo\bar.pdf</filepath>
        <shortfilename>bar.pdf</shortfilename>
        <creationtime>foo</creationtime>
        <lastmodifiedtime>foo</lastmodifiedtime>
        <lastaccessedtime>foo</lastaccessedtime>
        <attributes>0</attributes>
        <size>0</size>
        <subject>foo</subject>
        <creator>foo</creator>
        <manager>foo</manager>
        <company>foo</company>
        <category>foo</category>
        <keywords>foo</keywords>
        <comments>foo</comments>
             <hlinkbase>foo</hlinkbase>
             <template>foo</template>
             <lastsavedby>foo</lastsavedby>
             <revisionnumber>0</revisionnumber>
             <totaleditingtime>foo</totaleditingtime>
             <numpages>0</numpages>
             <numparagraphs>0</numparagraphs>
             <numlines>0</numlines>
             <numwords>0</numwords>
             <numcharacters>0</numcharacters>
<numcharacterswithspaces>0</numcharacterswithspaces>
             <numbytes>0</numbytes>
             <language>foo</language>
             <version>foo</version>
             <abstract>foo</abstract>
          </email>
      </value>
   />
   </metadata>
</sqml>
2.SQML生成
SQML最好由若干可能方式的一个或多个生成:
●通过创建一个灵巧请求
●通过创建一个本地请求
●通过创建一个实体
●通过在语义浏览器中打开一个或多个本地文档
●通过客户程序(动态地)——作为拖放动作、灵巧复制与粘贴、固有警报、语境面板与链接调用等等的响应
3.SQML解析
在某些场合的某些实施方式中,在客户机上创建的SQML可能已可(实时)远程消费——由服务器的XML Web服务或在另一个机器地点创建。这在当该SQML参照诸如(由语义环境中的唯一标识符所识别的)文档、实体或灵巧请求等本地语境时尤其可能发生。2在最佳实施方式中,客户程序通常创建远程消费就绪的SQML。这最好通过高速缓存该文档之元数据部分内所有参照的元数据来实现。这样做之所以最好,是因为在该查询被调用时,该参照指向的资源或对象可能已不复存在。例如,某用户可能将互联网上的某个文档拖放到一灵巧请求上,从而生成一个新的相关请求。客户程序会由该链接提取元数据(包括概括)并将该元数据插入SQML。由于对查询的解析只使用元数据,一旦将元数据插入SQML文档,该查询就可供使用。然而,该对象所参照的链接在该用户找到后的下一日可能不复存在。在此等情况下,即使在该链接可能已不存在时,倘若该用户调用该相关请求,由于元数据已经缓存于SQML内,该请求依然可用。
客户机SQML解析器会对SQML内的元数据进行“懒惰”更新。在该请求被调用时,解析器会试图更新所有参数(资源等等)的元数据,以应对用于创建该相关请求的对象在创建后可能已经改变的情形。倘若该对象不存在,客户程序将使用其已有的元数据;否则将更新元数据和使用更新后的元数据。这样一来,即使该对象已被删除,但用户体验不会被打断,除非该用户实际试图打开该元数据出自其中的对象。
信息神经系统的实体规范
1.引言
实体是信息神经系统最佳实施方式的一个很有力特征。实体令用户可创建与其日常工作方式对应的语境定义。实体的例子包括:
2混合器(或集合)包含对灵巧请求的参照。
  1.人员   7.会议
  2.团队   8.组织
  3.行动项目   9.合伙人
  4.公司   10.产品
  5.竞争对手   11.项目
  6.顾客   12.主题
此外还有针对具体行业的实体。例如在制药业,实体可能包括药物、药物相互作用问题、专利、食药局临床试验等等。实体在本质上是属于灵巧语境对象的语义封套。实体可如同任何其他灵巧对象那样地被拖放,但由SQML而不是SRML表示(即实体是一个查询对象,因为它具有丰富得多的语义)。实体可作为灵巧请求的参数而包括在内。
用户根据其任务创建实体。实体在最佳实施方式中包含至少下列信息(在替代实施方式中可能包含更多或更少的信息):
1.名称/描述——对实体的一个友好的描述性名称。
2.实体的类别——基于标准的跨行业分类法或纵向或具体公司的分类法。
3.语境资源——这可能包括关键词、本地文档、互联网文档或灵巧对象(例如人员)。
实体可在语义浏览器中打开、可用作定位的中心点、可用做灵巧请求(例如,关于我的项目的大标题)的参数、可被拖放、可被复制与粘贴、可与灵巧镜头共用、可用灵巧风格视觉化、可用作固有警报的基础、可保存为.ENT文档、可用电邮发送和共享等等。换句话说,实体是第一类灵巧对象。
语义运行时客户程序通过将实体的丰富元数据附加在有关请求上以创建一个参照该实体的新丰富SQML来动态创建SQML。
2.组合(或实体集合)
组合是一种特殊类型的实体,其中包含多个实体的集合。在最佳实施方式中,为了尽量降低复杂性和减少混淆(至少就命名法或术语而言),尽管实体能够有任意大小或组成,并且组合能够包含任意类型或数目的实体,但是组合将不包含其他组合。组合令用户可将一组实体作为一个单元来管理。组合属于第一类实体且因此具有实体的全部前述特征。当组合被用作灵巧请求中的参数时,OR{或}限定词会(按照默认规定)应用于其包含的实体。换句话说,假设组合P包含实体E1和实体E2,标题为‘关于P的大标题’将作为‘关于E1或E2的大标题’。用户能够针对个别灵巧请求更改此设定(至AND {与}限定词)。
3.示例情景
实体应用的一些示例情景:
1.某个制药业‘专利’实体可能包括该专利的类别、相关关键词、相关文档。
2.中情局的一位特工可能创建一个‘恐怖分子’实体来跟踪恐怖分子。这可能包括关于恐怖活动的类别、可疑的银行汇款、可疑的武器销售、机密文档、关键词,以及信息社区里的恐怖活动专家。
3.找到关于昨日会议的所有突发新闻
4.找到关于我的任何竞争对手的大标题(这是通过创建竞争对手实体,然后用这些实体作为参数并就每个谓词使用OR{或}限定词来创建一个灵巧请求。)
5.找到关于我的投资组合公司的专家(创建单个实体,创建包含这些实体的一个组合,然后创建一个具有‘专家’语境模板且使用此组合作为一个自变量的灵巧请求。)
下图为在语义浏览器(左边)显示的实体视图。
信息神经系统的可扩展客户端用户配置文件规范
概述
可扩展客户端用户配置文件允许语义浏览器的用户针对不同的职责、知识源、身份、角色、工作风格等等具有不同的状态。这实质上令用户可为不同的情景创建不同的“知识世界”。例如,某位制药业研究人员可能有一个默认配置文件,其中包含与其工作相关的所有知识来源。如本人母申请第10/179,651号所描述,出自其中每个来源的SRML将在客户程序上合并,从而令用户可以无间断地查看所有结果,就好象它们都出自同一个来源。然而,该研究人员或许想要单独跟踪专利。倘若是这样,该研究人员将能够创建一个单独的“专利”配置文件,并且包括那些与专利有关的知识社区(代理)(例如美国专利局数据库、欧盟专利数据库等等)。
配置文件包含下列用户状态:
●名称/描述——该配置文件的描述性名称。
●一个或多个知识社区(代理),指明请求(智能体)将调用之知识源(在KIS上运行)。
●身份信息——用户名(目前用该用户的电子邮件地址表示)和密码。
●兴趣领域或收藏类别——这用于向该用户建议信息社区(代理)(通过比较具有相同或相似类别的信息社区),以及作为用此配置文件创建的请求的一个默认查询过滤器。
●灵巧风格——灵巧风格将按照默认规定就用此配置文件创建的请求和实体而得到使用。
●默认旗标——指明该配置文件是否是默认配置文件。当用户希望创建请求和实体、浏览信息社区等时,默认配置文件会按照默认规定被启用。除非用户明确选取不同的配置文件,否则将使用默认配置文件。
配置文件可被创建、删除、修改、重新命名。
信息神经系统的知识社区浏览与订阅规范
概述
Nervana语义浏览器将允许用户就给定配置文件订阅和退订知识社区(代理)。这些知识社区将在语义环境中该配置文件条目下随时可供该用户使用。此外,每当使用同一个配置文件创建的任何请求之结果在显示时,这些知识社区将会按照默认规定就固有警报、语境面板等等得到查询。
语义环境包括指明每个配置文件已订知识社区的状态。客户端语义查询处理器(SQP)针对由给定配置文件之请求的结果而启动的动态请求利用此信息(SQP将向语义运行时客户程序询问该配置文件的知识社区且然后适当地向那些知识社区发出XML Web服务呼叫)。
下图显示了知识社区订阅和退订的用户界面。此对话框具有多个组合框,令用户可依配置文件过滤,可按照行业和兴趣领域、关键词、发表点(所有发表点、局域网、企业目录、全球知识社区目录)、创建时间(任何时间、今天、昨天、本周、上周)查看所有、新、已订、建议、未订的社区。语义运行时客户程序会使用这些过滤器查询(每个发表点的)发表点端点监听器,然后收集结果并在结果窗格中加以显示。用户也能够在结果窗格中使用一组合框来查看每个知识社区的类别。
Figure1:Information Communities Dialog Box
Figure A20048000998005851
Figure A20048000998005861
Figure A20048000998005871
Figure A20048000998005881
Figure A20048000998005891
Figure A20048000998005901
Figure A20048000998005911
Figure A20048000998005941
Figure A20048000998005951
Figure A20048000998005961
Figure A20048000998005991
Figure A20048000998006001
Figure A20048000998006021
Figure A20048000998006041
Figure A20048000998006071
Figure A20048000998006081
Figure A20048000998006101
Figure A20048000998006111
Figure A20048000998006121
Figure A20048000998006131
Figure A20048000998006151
Figure A20048000998006171
Figure A20048000998006181

Claims (6)

1.用于知识检索,管理,交付和表示的系统,所述系统包括:
第一服务器,可以对第一服务器进行编程以添加并维护特定领域的语义信息;
与第一服务器通信的第二服务器,可以对第二服务器进行编程以存储用来对语义信息进行分组分类的特定领域信息;
提供用户界面的客户机,用户界面供用户与第一和第二服务器通信;以及
其中第一和第二服务器的处理器一起运行以执行以下步骤:
保护信息源的信息;
按照语义链接信息源的信息;
维护语义链接的信息的语义属性;
根据用户查询交付请求的语义信息;以及
根据可定制的用户首选项显示语义信息。
2.权利要求1的系统,其中第一服务器还包括旨在提供至少一个下述项目的结构和方法:语义网络,语义数据收集器,语义网络一致性检查器,推理机,语义查询处理器,自然语言分析程序,电子邮件知识智能体或知识领域管理器。
3.权利要求1的系统,其中:
来自信息源的信息包括对象或事件;以及
对象或事件为彼此语义关联的活动智能体,并代表返回数据对象的查询,其中根据预定主题显示数据对象。
4.权利要求3的系统,其中用户可以定制据此显示数据对象的预定主题。
5.权利要求1的系统,其中客户机交付并显示由用户查询产生的语义信息。
6.用于知识检索,管理,交付和表示的方法,用于与服务器系统一起使用,其中可以对服务器系统进行编程以添加,维护并存储用来对语义信息进行分组分类的特定领域信息,所述方法包括:
保护信息源的信息;
按照语义链接信息源的信息;
维护语义链接的信息的语义属性;
根据用户查询交付请求的语义信息;以及
根据可定制的用户首选项显示语义信息。
CNA2004800099806A 2003-02-14 2004-02-17 语义知识提取、管理、捕获、共享、发现、交付、表示之系统与方法 Pending CN1853180A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US44773603P 2003-02-14 2003-02-14
US60/447,736 2003-02-14

Publications (1)

Publication Number Publication Date
CN1853180A true CN1853180A (zh) 2006-10-25

Family

ID=32908491

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004800099806A Pending CN1853180A (zh) 2003-02-14 2004-02-17 语义知识提取、管理、捕获、共享、发现、交付、表示之系统与方法

Country Status (10)

Country Link
EP (1) EP1599811A4 (zh)
JP (1) JP2006522388A (zh)
KR (1) KR20060004909A (zh)
CN (1) CN1853180A (zh)
AU (1) AU2004213986A1 (zh)
BR (1) BRPI0407451A (zh)
CA (1) CA2555280A1 (zh)
EA (1) EA200501304A1 (zh)
MX (1) MXPA05008670A (zh)
WO (1) WO2004075466A2 (zh)

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102185917A (zh) * 2011-04-29 2011-09-14 深圳市五巨科技有限公司 一种服务器适配移动终端的方法及系统、服务器适配装置
CN102609819A (zh) * 2012-02-16 2012-07-25 华为软件技术有限公司 一种信息展现系统
CN102737052A (zh) * 2011-04-12 2012-10-17 国际商业机器公司 一种用于处理输入的方法和系统
CN102762955A (zh) * 2010-01-22 2012-10-31 高通股份有限公司 位置知悉式推荐引擎
CN103605646A (zh) * 2012-06-29 2014-02-26 卡西欧计算机株式会社 输入支持装置和输入支持方法
CN103729112A (zh) * 2014-01-10 2014-04-16 百度在线网络技术(北京)有限公司 显示信息的方法和装置
CN104321797A (zh) * 2012-05-23 2015-01-28 李青锺 内容合作作业的收益分配方法
CN104639987A (zh) * 2015-01-29 2015-05-20 联发科技(新加坡)私人有限公司 被控终端及其信息提供方法
CN105052105A (zh) * 2012-11-01 2015-11-11 微软技术许可有限责任公司 为不同服务器间的单一登录使用x.509验证
WO2015176526A1 (zh) * 2014-05-23 2015-11-26 邓寅生 基于关系叠加组合的文档的标识、关联、搜索及展现的系统
CN105141668A (zh) * 2015-07-31 2015-12-09 中冶南方工程技术有限公司 一种基于分布式多智能体的数据同步方法
CN105393263A (zh) * 2013-07-12 2016-03-09 微软技术许可有限责任公司 计算机-人交互式学习中的特征完成
CN105740471A (zh) * 2016-03-14 2016-07-06 燕山大学 一种可动态查询论文收录状态的智能方法
CN106326300A (zh) * 2015-07-02 2017-01-11 富士通株式会社 信息处理方法以及信息处理设备
CN106845645A (zh) * 2008-05-01 2017-06-13 启创互联公司 用于用户驱动的语义网络和媒体合成的动态产生的方法、系统和计算机程序
CN106886543A (zh) * 2015-12-16 2017-06-23 清华大学 结合实体描述的知识图谱表示学习方法和系统
CN107862081A (zh) * 2017-11-29 2018-03-30 四川无声信息技术有限公司 网络信息源查找方法、装置及服务器
CN109256029A (zh) * 2018-09-12 2019-01-22 广州小鹏汽车科技有限公司 一种地点属性的自动设置方法及装置
CN109299400A (zh) * 2018-09-06 2019-02-01 北京奇艺世纪科技有限公司 一种观点抽取方法、装置及设备
CN109492208A (zh) * 2018-10-12 2019-03-19 天津字节跳动科技有限公司 文档编辑方法及其装置、设备、存储介质
CN109661675A (zh) * 2016-07-08 2019-04-19 艾赛普公司 使用用于客户支持的语义处理
CN109858036A (zh) * 2019-02-26 2019-06-07 科大讯飞股份有限公司 一种文书划分方法及装置
CN109886610A (zh) * 2016-02-29 2019-06-14 飞救医疗科技(北京)有限公司 一种协同工作与质量控制方法与系统
CN110048936A (zh) * 2019-04-18 2019-07-23 合肥天毅网络传媒有限公司 一种语义关联词判断垃圾邮件的方法
CN110222017A (zh) * 2019-05-13 2019-09-10 北京百度网讯科技有限公司 实时数据的处理方法、装置、设备及计算机可读存储介质
CN110347839A (zh) * 2019-07-18 2019-10-18 湖南数定智能科技有限公司 一种基于生成式多任务学习模型的文本分类方法
CN110728389A (zh) * 2019-10-21 2020-01-24 中国民航信息网络股份有限公司 一种跨预定系统的机票订单处理方法、装置及系统
CN110727760A (zh) * 2019-09-08 2020-01-24 天津大学 一种对大规模知识图谱进行分布式正则路径查询的方法
CN110781685A (zh) * 2019-10-18 2020-02-11 四川长虹电器股份有限公司 基于用户反馈自动标注语义分析结果正误性的方法
CN111049723A (zh) * 2018-10-15 2020-04-21 广州虎牙信息科技有限公司 消息推送方法、消息管理系统、服务器及计算机存储介质
CN111209028A (zh) * 2020-01-07 2020-05-29 京东数字科技控股有限公司 一种数据处理方法、装置、电子设备及存储介质
CN111392296A (zh) * 2020-04-14 2020-07-10 重庆市环卫集团有限公司 一种用于垃圾转运站的智慧收运系统
CN112989239A (zh) * 2016-03-17 2021-06-18 谷歌有限责任公司 混合的客户端-服务器数据提供的方法
CN113312656A (zh) * 2021-07-29 2021-08-27 阿里云计算有限公司 数据轮转方法、装置、设备及系统
CN113657121A (zh) * 2021-09-03 2021-11-16 四川大学 一种日志变量语义标注方法
CN114398442A (zh) * 2022-01-25 2022-04-26 中国电子科技集团公司第十研究所 一种基于数据驱动的情报处理系统
CN115357581A (zh) * 2022-08-19 2022-11-18 筑智建科技(重庆)有限公司 一种海量bim数据的分布式存储方法
US11720346B2 (en) 2020-10-02 2023-08-08 International Business Machines Corporation Semantic code retrieval using graph matching
US11790376B2 (en) 2016-07-08 2023-10-17 Asapp, Inc. Predicting customer support requests

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7698270B2 (en) 2004-12-29 2010-04-13 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
US7849090B2 (en) 2005-03-30 2010-12-07 Primal Fusion Inc. System, method and computer program for faceted classification synthesis
US10002325B2 (en) 2005-03-30 2018-06-19 Primal Fusion Inc. Knowledge representation systems and methods incorporating inference rules
US9177248B2 (en) 2005-03-30 2015-11-03 Primal Fusion Inc. Knowledge representation systems and methods incorporating customization
US9378203B2 (en) 2008-05-01 2016-06-28 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
US8849860B2 (en) 2005-03-30 2014-09-30 Primal Fusion Inc. Systems and methods for applying statistical inference techniques to knowledge representations
US9104779B2 (en) 2005-03-30 2015-08-11 Primal Fusion Inc. Systems and methods for analyzing and synthesizing complex knowledge representations
US7856446B2 (en) 2005-12-27 2010-12-21 Baynote, Inc. Method and apparatus for determining usefulness of a digital asset
US8495147B1 (en) 2006-07-13 2013-07-23 Avaya Inc. Threading of mixed media
US7685199B2 (en) * 2006-07-31 2010-03-23 Microsoft Corporation Presenting information related to topics extracted from event classes
EP1895505A1 (en) 2006-09-04 2008-03-05 Sony Deutschland GmbH Method and device for musical mood detection
KR100882582B1 (ko) * 2006-12-20 2009-02-12 한국과학기술정보연구원 시맨틱 웹 기반 연구정보 서비스 시스템 및 그 방법
US7930263B2 (en) 2007-01-12 2011-04-19 Health Information Flow, Inc. Knowledge utilization
AU2008206570A1 (en) * 2007-01-16 2008-07-24 Timmins Software Corporation Systems and methods for analyzing information technology systems using collaborative intelligence
WO2008090859A1 (ja) * 2007-01-22 2008-07-31 Sony Corporation 情報処理装置および方法、並びにプログラム
US8204856B2 (en) 2007-03-15 2012-06-19 Google Inc. Database replication
US8638319B2 (en) 2007-05-29 2014-01-28 Livescribe Inc. Customer authoring tools for creating user-generated content for smart pen applications
JP2010536102A (ja) 2007-08-08 2010-11-25 ベイノート,インク. コンテキストに基づくコンテンツレコメンデーションの方法及び装置
KR100913441B1 (ko) * 2007-08-20 2009-09-03 한국과학기술원 자원의 시맨틱 공간 매핑을 이용한 시맨틱 자원 검색 방법
KR100918503B1 (ko) * 2008-01-21 2009-09-24 윤재민 웹사이트 링크정보를 이용한 웹페이지 정보 전달 방법 및 그 시스템
US9361365B2 (en) * 2008-05-01 2016-06-07 Primal Fusion Inc. Methods and apparatus for searching of content using semantic synthesis
US8676732B2 (en) 2008-05-01 2014-03-18 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
US9589381B2 (en) 2008-06-12 2017-03-07 Microsoft Technology Licensing, Llc Copying of animation effects from a source object to at least one target object
CN106250371A (zh) 2008-08-29 2016-12-21 启创互联公司 用于利用现有的域定义来进行语义概念定义和语义概念关系综合的系统和方法
CA2735160A1 (en) * 2008-08-29 2010-03-04 The Administrators Of The Tulane Educational Fund Copyright status determination system and method
CA2639438A1 (en) * 2008-09-08 2010-03-08 Semanti Inc. Semantically associated computer search index, and uses therefore
US9524506B2 (en) 2011-10-21 2016-12-20 Bigmachines, Inc. Methods and apparatus for maintaining business rules in a configuration system
WO2010089248A1 (en) 2009-02-03 2010-08-12 International Business Machines Corporation Method and system for semantic searching
KR101072147B1 (ko) * 2009-02-10 2011-10-10 경북대학교 산학협력단 블로그 포스트를 온톨로지 기반 정보로 변환하는 방법 및 그 시스템
US20110041052A1 (en) * 2009-07-14 2011-02-17 Zoomii, Inc. Markup language-based authoring and runtime environment for interactive content platform
US9292855B2 (en) 2009-09-08 2016-03-22 Primal Fusion Inc. Synthesizing messaging using context provided by consumers
US9262520B2 (en) 2009-11-10 2016-02-16 Primal Fusion Inc. System, method and computer program for creating and manipulating data structures using an interactive graphical interface
US20110178860A1 (en) * 2010-01-15 2011-07-21 Imrey G Christopher System and method for resolving transactions employing goal seeking attributes
KR101146510B1 (ko) * 2010-05-20 2012-05-25 소프트포럼 주식회사 Synk 데이터베이스 암호화 시스템 및 그 방법
US9235806B2 (en) 2010-06-22 2016-01-12 Primal Fusion Inc. Methods and devices for customizing knowledge representation systems
US10140619B2 (en) * 2010-06-22 2018-11-27 Sizmek Technologies, Inc. Dynamic creative creation and delivery
US10474647B2 (en) 2010-06-22 2019-11-12 Primal Fusion Inc. Methods and devices for customizing knowledge representation systems
US10002335B2 (en) 2011-01-06 2018-06-19 Cardinal Logistics Management Corporation Dynamic workflow for remote devices
US11294977B2 (en) 2011-06-20 2022-04-05 Primal Fusion Inc. Techniques for presenting content to a user based on the user's preferences
US9098575B2 (en) 2011-06-20 2015-08-04 Primal Fusion Inc. Preference-guided semantic processing
US9098502B1 (en) 2012-11-16 2015-08-04 Google Inc. Identifying documents for dissemination by an entity
US10439969B2 (en) * 2013-01-16 2019-10-08 Google Llc Double filtering of annotations in emails
US10223637B1 (en) 2013-05-30 2019-03-05 Google Llc Predicting accuracy of submitted data
KR101503463B1 (ko) * 2013-09-25 2015-03-19 목포대학교산학협력단 가중치평균을 이용한 선박 내부 모니터링 방법
US9836765B2 (en) 2014-05-19 2017-12-05 Kibo Software, Inc. System and method for context-aware recommendation through user activity change detection
KR102464337B1 (ko) * 2014-09-25 2022-11-07 오라클 인터내셔날 코포레이션 멀티테넌트 어플리케이션 서버 환경에서 파티션 식별자들의 결정을 위한 시스템 및 방법
US10042619B2 (en) 2015-08-25 2018-08-07 Cognizant Technology Solutions India Pvt. Ltd. System and method for efficiently managing enterprise architecture using resource description framework
US11403418B2 (en) * 2018-08-30 2022-08-02 Netskope, Inc. Enriching document metadata using contextual information
JP6960218B2 (ja) * 2016-11-18 2021-11-05 株式会社ベネッセスタイルケア サービス支援システム、サービス支援方法及びプログラム
KR101869618B1 (ko) * 2016-12-29 2018-06-20 (주) 쓰리웨어 맞춤형 뉴스컨텐츠 제공시스템
KR101904643B1 (ko) 2017-02-09 2018-10-05 한국기술교육대학교 산학협력단 의사결정트리를 이용한 기사 생성 방법
JP6667876B2 (ja) * 2017-04-26 2020-03-18 サイレックス・テクノロジー株式会社 基地局、基地局システム、及び、通信方法
KR102457568B1 (ko) * 2017-09-29 2022-10-21 삼성전자주식회사 입력된 정보와 관련된 이미지를 제공하기 위한 전자 장치 및 그의 동작 방법
US11630824B2 (en) * 2018-10-16 2023-04-18 Shimadzu Corporation Document search method and document search system
US11153400B1 (en) * 2019-06-04 2021-10-19 Thomas Layne Bascom Federation broker system and method for coordinating discovery, interoperability, connections and correspondence among networked resources
US11805151B2 (en) 2019-08-29 2023-10-31 Fraudmarc Inc. Low-latency, outbound message monitoring, control, and authentication
US20230205800A1 (en) * 2020-06-21 2023-06-29 Eliahu Kadoori AVIVI System and method for detection and auto-validation of key data in any non-handwritten document
KR102542394B1 (ko) 2020-12-09 2023-06-13 주식회사 이앤지테크 고객맞춤형 여행 스케줄링 가상현실 플랫폼 시스템 및 그 구동방법
US11272888B1 (en) * 2021-06-22 2022-03-15 Nft Ip Holdings Llc Devices and systems that measure, quantify, compare, package, and capture human content in databases
US20230004719A1 (en) * 2021-06-30 2023-01-05 Earley Information Science, Inc. Digital data processing systems and methods for multi-domain digital content retrieval and generation with dead-end prevention
WO2023278682A1 (en) * 2021-06-30 2023-01-05 Earley Information Science, Inc. Multi-bot digital content retrieval and generation systems

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240407B1 (en) * 1998-04-29 2001-05-29 International Business Machines Corp. Method and apparatus for creating an index in a database system
US6418448B1 (en) * 1999-12-06 2002-07-09 Shyam Sundar Sarkar Method and apparatus for processing markup language specifications for data and metadata used inside multiple related internet documents to navigate, query and manipulate information from a plurality of object relational databases over the web
US6311194B1 (en) * 2000-03-15 2001-10-30 Taalee, Inc. System and method for creating a semantic web and its applications in browsing, searching, profiling, personalization and advertising
WO2003001413A1 (en) * 2001-06-22 2003-01-03 Nosa Omoigui System and method for knowledge retrieval, management, delivery and presentation

Cited By (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845645A (zh) * 2008-05-01 2017-06-13 启创互联公司 用于用户驱动的语义网络和媒体合成的动态产生的方法、系统和计算机程序
CN106845645B (zh) * 2008-05-01 2020-08-04 启创互联公司 用于产生语义网络和用于媒体合成的方法及系统
US11868903B2 (en) 2008-05-01 2024-01-09 Primal Fusion Inc. Method, system, and computer program for user-driven dynamic generation of semantic networks and media synthesis
CN102762955A (zh) * 2010-01-22 2012-10-31 高通股份有限公司 位置知悉式推荐引擎
CN102737052A (zh) * 2011-04-12 2012-10-17 国际商业机器公司 一种用于处理输入的方法和系统
CN102185917A (zh) * 2011-04-29 2011-09-14 深圳市五巨科技有限公司 一种服务器适配移动终端的方法及系统、服务器适配装置
CN102609819A (zh) * 2012-02-16 2012-07-25 华为软件技术有限公司 一种信息展现系统
CN104321797A (zh) * 2012-05-23 2015-01-28 李青锺 内容合作作业的收益分配方法
CN103605646A (zh) * 2012-06-29 2014-02-26 卡西欧计算机株式会社 输入支持装置和输入支持方法
CN103605646B (zh) * 2012-06-29 2017-06-06 卡西欧计算机株式会社 输入支持装置和输入支持方法
CN105052105A (zh) * 2012-11-01 2015-11-11 微软技术许可有限责任公司 为不同服务器间的单一登录使用x.509验证
CN105393263A (zh) * 2013-07-12 2016-03-09 微软技术许可有限责任公司 计算机-人交互式学习中的特征完成
US10372815B2 (en) 2013-07-12 2019-08-06 Microsoft Technology Licensing, Llc Interactive concept editing in computer-human interactive learning
US11023677B2 (en) 2013-07-12 2021-06-01 Microsoft Technology Licensing, Llc Interactive feature selection for training a machine learning system and displaying discrepancies within the context of the document
CN105393263B (zh) * 2013-07-12 2018-01-09 微软技术许可有限责任公司 计算机‑人交互式学习中的特征完成
CN103729112A (zh) * 2014-01-10 2014-04-16 百度在线网络技术(北京)有限公司 显示信息的方法和装置
WO2015176526A1 (zh) * 2014-05-23 2015-11-26 邓寅生 基于关系叠加组合的文档的标识、关联、搜索及展现的系统
US10719560B2 (en) 2014-05-23 2020-07-21 Yinsheng DENG System for identifying, associating, searching and presenting documents based on relation combination
CN104639987A (zh) * 2015-01-29 2015-05-20 联发科技(新加坡)私人有限公司 被控终端及其信息提供方法
CN106326300A (zh) * 2015-07-02 2017-01-11 富士通株式会社 信息处理方法以及信息处理设备
CN105141668B (zh) * 2015-07-31 2018-09-25 中冶南方工程技术有限公司 一种基于分布式多智能体的数据同步方法
CN105141668A (zh) * 2015-07-31 2015-12-09 中冶南方工程技术有限公司 一种基于分布式多智能体的数据同步方法
CN106886543B (zh) * 2015-12-16 2020-01-17 清华大学 结合实体描述的知识图谱表示学习方法和系统
CN106886543A (zh) * 2015-12-16 2017-06-23 清华大学 结合实体描述的知识图谱表示学习方法和系统
CN109886610A (zh) * 2016-02-29 2019-06-14 飞救医疗科技(北京)有限公司 一种协同工作与质量控制方法与系统
CN109886610B (zh) * 2016-02-29 2023-04-07 飞救医疗科技(北京)有限公司 一种协同工作与质量控制方法与系统
CN105740471A (zh) * 2016-03-14 2016-07-06 燕山大学 一种可动态查询论文收录状态的智能方法
CN112989239A (zh) * 2016-03-17 2021-06-18 谷歌有限责任公司 混合的客户端-服务器数据提供的方法
US11615422B2 (en) 2016-07-08 2023-03-28 Asapp, Inc. Automatically suggesting completions of text
CN109661675A (zh) * 2016-07-08 2019-04-19 艾赛普公司 使用用于客户支持的语义处理
US11790376B2 (en) 2016-07-08 2023-10-17 Asapp, Inc. Predicting customer support requests
US10733614B2 (en) 2016-07-08 2020-08-04 Asapp, Inc. Assisting entities in responding to a request of a user
CN109661675B (zh) * 2016-07-08 2020-05-05 艾赛普公司 使用用于客户支持的语义处理
CN107862081B (zh) * 2017-11-29 2021-07-16 四川无声信息技术有限公司 网络信息源查找方法、装置及服务器
CN107862081A (zh) * 2017-11-29 2018-03-30 四川无声信息技术有限公司 网络信息源查找方法、装置及服务器
CN109299400A (zh) * 2018-09-06 2019-02-01 北京奇艺世纪科技有限公司 一种观点抽取方法、装置及设备
CN109256029B (zh) * 2018-09-12 2021-09-03 广州小鹏汽车科技有限公司 一种地点属性的自动设置方法及装置
CN109256029A (zh) * 2018-09-12 2019-01-22 广州小鹏汽车科技有限公司 一种地点属性的自动设置方法及装置
CN109492208B (zh) * 2018-10-12 2023-06-23 天津字节跳动科技有限公司 文档编辑方法及其装置、设备、存储介质
CN109492208A (zh) * 2018-10-12 2019-03-19 天津字节跳动科技有限公司 文档编辑方法及其装置、设备、存储介质
CN111049723A (zh) * 2018-10-15 2020-04-21 广州虎牙信息科技有限公司 消息推送方法、消息管理系统、服务器及计算机存储介质
CN109858036B (zh) * 2019-02-26 2023-07-28 科大讯飞股份有限公司 一种文书划分方法及装置
CN109858036A (zh) * 2019-02-26 2019-06-07 科大讯飞股份有限公司 一种文书划分方法及装置
CN110048936A (zh) * 2019-04-18 2019-07-23 合肥天毅网络传媒有限公司 一种语义关联词判断垃圾邮件的方法
CN110222017A (zh) * 2019-05-13 2019-09-10 北京百度网讯科技有限公司 实时数据的处理方法、装置、设备及计算机可读存储介质
CN110222017B (zh) * 2019-05-13 2021-09-21 北京百度网讯科技有限公司 实时数据的处理方法、装置、设备及计算机可读存储介质
CN110347839A (zh) * 2019-07-18 2019-10-18 湖南数定智能科技有限公司 一种基于生成式多任务学习模型的文本分类方法
CN110727760A (zh) * 2019-09-08 2020-01-24 天津大学 一种对大规模知识图谱进行分布式正则路径查询的方法
CN110727760B (zh) * 2019-09-08 2023-11-07 天津大学 一种对大规模知识图谱进行分布式正则路径查询的方法
CN110781685A (zh) * 2019-10-18 2020-02-11 四川长虹电器股份有限公司 基于用户反馈自动标注语义分析结果正误性的方法
CN110728389A (zh) * 2019-10-21 2020-01-24 中国民航信息网络股份有限公司 一种跨预定系统的机票订单处理方法、装置及系统
CN110728389B (zh) * 2019-10-21 2023-11-10 中国民航信息网络股份有限公司 一种跨预定系统的机票订单处理方法、装置及系统
CN111209028A (zh) * 2020-01-07 2020-05-29 京东数字科技控股有限公司 一种数据处理方法、装置、电子设备及存储介质
CN111392296A (zh) * 2020-04-14 2020-07-10 重庆市环卫集团有限公司 一种用于垃圾转运站的智慧收运系统
CN111392296B (zh) * 2020-04-14 2021-03-09 重庆市环卫集团有限公司 一种用于垃圾转运站的智慧收运系统
US11720346B2 (en) 2020-10-02 2023-08-08 International Business Machines Corporation Semantic code retrieval using graph matching
CN113312656A (zh) * 2021-07-29 2021-08-27 阿里云计算有限公司 数据轮转方法、装置、设备及系统
CN113657121B (zh) * 2021-09-03 2023-04-07 四川大学 一种日志变量语义标注方法
CN113657121A (zh) * 2021-09-03 2021-11-16 四川大学 一种日志变量语义标注方法
CN114398442A (zh) * 2022-01-25 2022-04-26 中国电子科技集团公司第十研究所 一种基于数据驱动的情报处理系统
CN114398442B (zh) * 2022-01-25 2023-09-19 中国电子科技集团公司第十研究所 一种基于数据驱动的情报处理系统
CN115357581A (zh) * 2022-08-19 2022-11-18 筑智建科技(重庆)有限公司 一种海量bim数据的分布式存储方法
CN115357581B (zh) * 2022-08-19 2023-05-05 筑智建科技(重庆)有限公司 一种海量bim数据的分布式存储方法

Also Published As

Publication number Publication date
AU2004213986A1 (en) 2004-09-02
WO2004075466A3 (en) 2004-10-28
EP1599811A2 (en) 2005-11-30
BRPI0407451A (pt) 2006-02-07
MXPA05008670A (es) 2005-11-17
JP2006522388A (ja) 2006-09-28
KR20060004909A (ko) 2006-01-16
EA200501304A1 (ru) 2006-08-25
EP1599811A4 (en) 2008-02-06
CA2555280A1 (en) 2004-09-02
WO2004075466A2 (en) 2004-09-02

Similar Documents

Publication Publication Date Title
CN1853180A (zh) 语义知识提取、管理、捕获、共享、发现、交付、表示之系统与方法
CN1647070A (zh) 用于知识检索、管理、交付和表示的系统和方法
Guha et al. Schema. org: Evolution of Structured Data on the Web: Big data makes common schemas even more necessary.
CN1300677C (zh) 分布式计算服务平台
US9189479B2 (en) Semantic web portal and platform
US20140281850A1 (en) System and method of content stream utilization
US20070081197A1 (en) System and method for semantic knowledge retrieval, management, capture, sharing, discovery, delivery and presentation
AU2001268674A1 (en) Distributed computing services platform
Messerschmitt Networked applications: a guide to the new computing infrastructure
Swan et al. LINKING UK REPOSITORIES: Technical and organisational models to support user-oriented services across institutional and other digital repositories. SCOPING STUDY REPORT
Constantopoulos et al. On information organization in annotation systems
Toma et al. Enabling scalable multi-channel communication through semantic technologies
Carpenter The scholarly record of the future: A technologist's perspective
Baladrón et al. Service discovery suite for user-centric service creation
Quiroga et al. Communities of practice: increasing social capital through the integration of digital libraries, filtering, ontologies and social networking
McKiernan Scholar-based innovations in publishing. Part III: Organizational and national initiatives
Godby et al. Library Standards and the Semantic Web
Alemneh et al. Targeted access for varied audiences to integrated, heterogeneous digital information resources
Shustitskiy Collaboration of digital libraries
André et al. Bringing the Semantic Web home: a research agenda for local, personalized SWUI
Franz et al. Communication Systems for Semantic Work Environments
Swan et al. LINKING UK REPOSITORIES: Technical and organisational models to support
AU2002345906A1 (en) System and method for knowledge retrieval, management, delivery and presentation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication