CN103530308A - 基于基于上下文的电子文件搜索的活动推荐 - Google Patents

基于基于上下文的电子文件搜索的活动推荐 Download PDF

Info

Publication number
CN103530308A
CN103530308A CN201310272570.1A CN201310272570A CN103530308A CN 103530308 A CN103530308 A CN 103530308A CN 201310272570 A CN201310272570 A CN 201310272570A CN 103530308 A CN103530308 A CN 103530308A
Authority
CN
China
Prior art keywords
compound event
file
user activity
identification
event element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310272570.1A
Other languages
English (en)
Other versions
CN103530308B (zh
Inventor
R·R·弗莱德朗得
J·R·可里默
J·西罗伯尔西科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN103530308A publication Critical patent/CN103530308A/zh
Application granted granted Critical
Publication of CN103530308B publication Critical patent/CN103530308B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及基于基于上下文的电子文件搜索的活动推荐。一种计算机硬件实现的方法、系统和/或计算机程序产品基于电子文件中的识别的非合成事件元素产生活动推荐。执行电子文件的数据库的基于上下文的搜索以识别所有的电子文件中的共同合成事件,其中合成事件是一组上下文相关因素的不可执行描述符。包含共同合成事件的每个电子文件是相关电子文件。针对每个相关电子文件搜索至少一个非合成事件元素,其中非合成事件元素是不存在于合成事件中的事件元素。基于识别的非合成事件元素产生推荐。然后把一组二进制数据发送给客户端,该组二进制数据包括合成事件、相关电子文件、非合成事件元素和所述推荐。

Description

基于基于上下文的电子文件搜索的活动推荐
技术领域
本公开涉及计算机的领域,具体地讲,涉及当搜索文档时的计算机的使用。更具体地讲,本公开涉及在通过使用基于上下文的搜索来搜索文档时的计算机的使用。
背景技术
文档(诸如,技术文章、研究论文、学术论文、网页、博客等)提供关于广泛的范围的主题的信息。信息的这种多样性使得文档对于许多不同类型的项目而言有价值。然而,当前文档搜索技术仅识别解决特定问题/主题的文档,从而能够回答特定问题和/或能够确认已知信息。
发明内容
一种计算机硬件实现的方法、系统和/或计算机程序产品基于电子文件中的识别的非合成事件元素产生活动推荐。执行电子文件的数据库的基于上下文的搜索以识别所有的电子文件中的共同合成事件,其中合成事件是一组上下文相关因素的不可执行描述符,并且其中在执行电子文件的数据库的基于上下文的搜索之前,共同合成事件的定义是未知的。包含共同合成事件的每个电子文件是相关电子文件。针对每个相关电子文件搜索至少一个非合成事件元素,其中非合成事件元素是不存在于合成事件中的事件元素。基于识别的非合成事件元素产生推荐。然后把一组二进制数据被发送给客户端,所述一组二进制数据包括合成事件、相关电子文件、非合成事件元素和推荐。
附图说明
图1描述可实现本公开的示例性系统和网络;以及
图2是为了基于电子文件中的识别的非合成事件元素产生活动推荐而由处理器执行的一个或多个示例性步骤的高级流程图。
具体实施方式
所属技术领域的技术人员知道,本发明的各个方面可以实现为系统、方法或计算机程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是—但不限于—电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括—但不限于—电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括—但不限于—无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
下面将参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。
也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机、其它可编程数据处理装置、或其他设备以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品(article ofmanufacture)。
也可以把计算机程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的处理,从而使得在计算机或其它可编程装置上执行的指令提供实现流程图和/或框图中的方框中规定的功能/操作的处理。
现在参照附图,并且具体地参照图1,描述可由本发明的实现方式使用并且在本发明的实现方式中使用的示例性系统和网络的方框图。要注意的是,针对计算机102以及在计算机102内显示的示例性架构(包括描述的硬件和软件)中的一些或全部可由软件部署服务器150、电子文件服务计算机152和/或客户计算机154使用。
示例性计算机102包括处理器104,处理器104耦接到系统总线106。处理器104可使用一个或多个处理器,所述一个或多个处理器中的每一个具有一个或多个处理器核。驱动/支持显示器110的视频适配器108也耦接到系统总线106。系统总线106经由总线桥112耦接到输入/输出(I/O)总线114。I/O接口116耦接到I/O总线114。I/O接口116承担与各种I/O装置(包括键盘118、鼠标120、介质托盘122(介质托盘122可包括诸如CD-ROM驱动器的存储装置、多媒体接口等)、打印机124和外部USB端口126)的通信。尽管连接到I/O接口116的端口的格式可以是对于计算机架构领域技术人员而言已知的任何格式,但在一个实施例中,这些端口中的一些或全部是通用串行总线(USB)端口。
如上所述,计算机102能够使用网络接口130与软件部署服务器150以及电子文件服务计算机152和客户计算机154通信。网络接口130是硬件网络接口,诸如网络接口卡(NIC)等。网络128可以是外部网络(诸如,互联网)或内部网络(诸如,以太网或虚拟专用网络(VPN))。
硬盘驱动器接口132也耦接到系统总线106。硬盘驱动器接口132与硬盘驱动器134对接。在一个实施例中,硬盘驱动器134位于系统存储器136中,系统存储器136也耦接到系统总线106。系统存储器被定义为计算机102中的最低级别的易失性存储器。该易失性存储器包括另外的较高级的易失性存储器(未示出),包括但不限于,高速缓冲存储器、寄存器和缓冲器。位于系统存储器136中的数据包括计算机102的操作系统(OS)138和应用程序144。
OS138包括用于提供对资源(诸如,应用程序144)的透明用户访问的壳(shell)140。通常,壳140是提供解释器以及用户和操作系统之间的界面的程序。更具体地讲,壳140执行被输入到命令行用户界面中的命令或者来自文件的命令。因此,壳140(也被称为命令处理器)通常是操作系统软件层级的最高级别,并用作命令解释器。壳提供系统提示,解释通过键盘、鼠标或其它用户输入介质输入的命令,并把解释的命令发送给操作系统的合适的更低级别(例如,内核142)以用于处理。要注意的是,尽管壳140是基于文本、面向行的用户界面,但本发明将会同样很好地支持其它用户界面模式,诸如图形、语音、手势等。
如上所述,OS138还包括内核142,内核142包括OS138的更低级别的功能,包括提供OS138的其它部分和应用程序144所需的必要服务,包括存储器管理、进程和任务管理、盘管理以及鼠标和键盘管理。
应用程序144包括以示例性方式显示为浏览器146的渲染器。浏览器146包括能够使万维网(WWW)客户端(例如,计算机102)使用超文本传输协议(HTTP)消息向互联网发送网络消息以及接收网络消息的程序模块和指令,由此能够实现与软件部署服务器150和其它计算机系统的通信。
计算机102的系统存储器(以及软件部署服务器150的系统存储器)中的应用程序144还包括活动推荐产生逻辑(ARGL)148。ARGL148包括用于实现以下描述的处理(包括图2中描述的处理)的代码。在一个实施例中,计算机102能够从软件部署服务器150下载ARGL148(包括按照需求),其中直至需要执行ARGL148的代码时才下载该代码。还要注意的是,在本发明的一个实施例中,软件部署服务器150执行与本发明关联的所有功能(包括ARGL148的执行),由此使计算机102不必使用它自己的内部计算资源执行ARGL148。
要注意的是,在计算机102中描述的硬件元件不是穷举性的,而是代表性的,以突出本发明所需的必要部件。例如,计算机102可包括替代的存储器存储装置,诸如磁带、数字通用盘(DVD)、Bernoulli盒等。这些和其它变型应该落在本发明的精神和范围内。
现在参照图2,提供为了基于电子文件中的识别的非合成事件元素产生活动推荐而由处理器执行的一个或多个示例性步骤的高级流程图。在启动块202之后,执行电子文件的数据库的基于上下文的搜索以识别所有的电子文件中的共同合成事件,其中合成事件是一组上下文相关因素的不可执行描述符(块204)。也就是说,对所有的电子文件进行上下文搜索以识别在所有的电子文件中包含的共享的(即,相同的)合成事件。这些电子文件由电子文件服务计算机(诸如,图1中描述的电子文件服务计算机152)提供。
合成事件被定义为一组上下文相关因素的不可执行描述符。例如,合成事件可以是单个文档中(即,位于同一文档内是“上下文”)的一组词A、B和C的出现(即,所有三个单词的出现是该“因素”)。
合成事件的另一例子可以是在正在针对该病人诊断(由原发病引起的)继发病(“上下文”)时的关于病人的事实的组合,诸如病人的年龄、当前折磨该病人的原发病的医疗诊断、以及该病人正在服用的药物的列表(“因素”)。
合成事件的另一例子可以是在正在研究特定疾病时正在科学实验室中检查的一组特征。也就是说,在这个例子中,“上下文”将会是导向理解特定疾病的病源(基础原因)的研究项目,并且“因素”是具有这种特定疾病的人共有的表现型(物理外观)、基因型(基因组成)和环境(例如,暴露于某些化学品等)。
术语“基于上下文的搜索”被定义为针对合成事件具有预定上下文关系的电子文件的搜索。例如,假设:在进行特定领域(例如,肿瘤学)的医学研究的同时产生合成事件,从而电子文件和合成事件位于同一上下文内。在这个例子中,活动类型(研究)定义上下文的范围,并因此定义基于上下文的搜索的范围,从而仅搜索直接与肿瘤学研究相关的文件。
如这里所使用的,电子文件被定义为任何文件或数据的集合。这种文件/数据集合的例子包括但不限于基于文本的文档、图像文件和音频文件。基于文本的文档的例子包括但不限于文本文件、博客、推特、电子邮件消息、网页、即时消息等。图像文件的例子包括但不限于用于电影的MPEG(运动图像专家组)文件、用于静止照片的JPEG(联合图像专家组)文件、用于扫描文档的TIFF(标记图像文件格式)和PDF(便携式文档格式)文件、用于医学图像的DICOM(医学数字成像与通信)文件、用于天文学图像的FITS(灵活图像传输系统)文件等。音频文件的例子包括但不限于从麦克风或其它声音捕捉装置产生的音频记录(例如,WAV文件、MP3文件、VOX文件等)。
当搜索包含特定词/短语的基于文本的文档时,对文件数据库中的每个文档(电子文件)(例如,互联网上或本地数据库中的研究论文、杂志文章等)执行简单的词搜索。然而,在执行基于文本的文档的这种词搜索之前,首先确定这个基于文本的文档是否与合成事件是上下文相关的(或替代地,与合成事件是上下文不相关的),从而电子文件的搜索是基于上下文的。例如,假设:合成事件是“城市”具有“90度”的平均高温。在确定电子文档是否包含合成事件元素“90degrees(90度)”之前,首先确定电子文档是否实际上与气象学相关。通过针对许多文章搜索列出的“关键词”能够执行这种确定。这些关键词提供描述基于文本的文档的上下文的词(诸如,“气象学”)。然而,如果不存在这种关键词列表,则必须针对文档检查上下文。
例如,如果搜索在特定电子文件中识别诸如“毕业证书”和“课程”的词,则“90degrees(90学位)”很可能在描述学院,并被略过。类似地,如果“直角”或“食物”或“病人”或“槽钢”位于特定电子文件中,则在第一实施例中这些文件也被略过(“上下文对准”),因为这种电子文件的内容不是上下文相关的。也就是说,基于上下文的搜索对于以下事物不感兴趣,并且因此忽略它们:关于提供90个不同学科的毕业证书(由学院提供的“90学位”)的学院的文章、关于直角(弧的“90度”)的数学出版物、关于食物制备(推荐将调味料保持在“90度”以上的温度)的文章、关于具有低温症的病人(描述病人的核心体温下降到“90度”)的文章或者关于结构钢的小册子(广告宣传“90度”槽钢)。
然而,如果诸如“天气”或“干旱”的术语出现在电子文件中,则该电子文件可能与合成事件(“城市具有90度的平均高温”)相关,并且由此被识别为上下文相关(“上下文对准”),因此被识别为相关电子文件。
要注意的是,在另一实施例中,在特定文档/电子文件中识别合成事件元素之后,进行搜索的基于文本的文档的上下文的确定。例如,假设:基于文本的文档很短(少于预定数量的词)并且不具有“关键词”列表。在这种情况下,在文档中针对术语“城市”和“90度”进行搜索。如果在文档中发现所述术语,则在该文档中搜索合成事件之前,上下文评估(使用上下文确定方法,诸如这里描述的上下文确定方法)确定该文档是否相关。
尽管能够如上所述执行基于文本的文档的搜索,但在视频文件中搜索合成事件需要另外的处理。首先,进行查询以确定描述合成事件的元数据以及描述正被搜索的图像的元标签是否可用。如果可用,则与文本搜索一样,简单地搜索该元数据/元标签。然而,如果这种元数据不可用(或者至少未在识别合成事件所需的具体程度上可用),则必须执行图像匹配。也就是说,构成视频文件的合成事件(视网膜具有指示视网膜中的孔的亮斑)的一部分的特定图像(例如,亮斑)被数字化为二进制值。然后,在其它数字化的电子视频文件中搜索这个二进制值以及来自合成事件的其它数字化的图像(即,描述视网膜的数字文件)。对于音频文件执行类似处理,其中,特定声音(例如,作为汽车事故的“上下文”内的“上下文相关因素”的尖叫的轮胎)被数字化为二进制值,该二进制值被用在数字化的电子音频文件的搜索中。
在一个实施例中,被选择用于搜索的电子文件基于它们的源的等级,其中所述等级基于源的公共声誉。例如,假设:特定电子文件来自于已知的、受信任的并且非常受尊敬的源(例如,享有声望的研究期刊)。源的这种描述(“已知的、受信任的、非常受尊敬的”)导致对这个特定源的重视。例如,这个源可被给予“9”的权重(按照1-10的标度)。然而,另一电子文件来自于仅被给予“2”的权重的源,因为它来自于未被同行审查的博客条目并且作者是匿名的。在这个例子中,较高等级(“9”)源的权重高于较低等级(“2”)源。在一个实施例中,在较低等级源之前搜索较高等级源,直至某一预定基线。也就是说,可预先确定最初将仅针对9-10之间等级的源搜索相关电子文件。如果时间、计算机资源和/或金钱仍然可用,则将会搜索7-8之间等级的源。该处理继续,直至1)不再有时间、计算机资源、金钱等可用;2)所有可用的电子文件已被检查(例如,本地数据库内);或3)仅高于某一预定数字的等级的可用电子文件(例如,其源的等级高于“7”的那些电子文件)已被预先确定为被授权用于检查,并且所有这种等级的电子文件已被检查。
在一个实施例中,电子文件的源的等级基于由合成事件的产生者对源的使用的历史频率。例如,假设:特定用户和/或计算机系统例行地针对特定数据库检查电子文件。在第一实施例中,频繁使用的源被视为更值得信赖,因此具有较高的权重。然而,在第二实施例中,使用频率较低的(因此,更加模糊的)源被视为更可能提供未在以前考虑过的非合成事件元素(下面描述),因此具有较高的权重。在任一实施例中,在较低等级源之前搜索较高等级源,直至某一预定基线,如上所述。
要注意的是,在块204中,在执行搜索之前,不知道合成事件。也就是说,搜索电子文件的处理识别两个或更多的电子文件中的共同合成事件。因此,该搜索并不开始于搜索已知的合成事件。
现在参照块206,随后针对每个相关电子文件(即,位于同一上下文内的那些文件)搜索非合成事件元素(即,不存在于合成事件中的事件元素)。例如,假设:合成事件是单个文档(例如,病人的文件)内的词/术语A、B和C的出现。进一步假设在块204中描述的搜索用于在同一出版物(电子文件)内具有术语A、B和C的在线出版物,并且假设一个或多个相关出版物(即,在同一文档内具有全部术语A、B和C的出版物)已被识别。一旦定位了这种相关电子文件,对该电子文件执行基于上下文的搜索,以识别该电子文件内的非合成事件元素。非合成事件元素是在合成事件中找不到的事件元素。在简单的词搜索的情况下,非合成事件元素将是词/术语D的存在,词/术语D在该合成事件(具有词/术语A、B和C)中找不到。当然,一个或两个文档将会包含其它词/术语,但这些已被预先确定为与这里描述的处理无关。
在另一例子中,假设:合成事件是城市具有90度的平均高温。进一步假设:识别的相关电子文件也包含城市的人口水平的描述,城市的人口水平与城市的天气没有关系,因此不存在于合成事件中。然而,如果很高百分比(例如,超过某预定百分比)的电子文件描述相同的人口水平,则这种相关可被视为对于改进当前研究、策略等是重要的。例如,如果很大百分比的电子文件描述城市具有90度的平均温度和超过2百万的人口,则非合成事件元素(“超过2百万的人口”)可能暗示需要创建关于对于将可能在给定的一年遭受热相关伤害的已知百分比(例如,2%)的城市居民而言将需要什么类型的卫生保健资源的策略。
现在参照块208,基于在识别的相关电子文件中发现的识别的非合成事件元素产生推荐。然而,在一个实施例中,软件逻辑(例如,图1中描述的ARGL148的一部分)基于识别的非合成事件元素产生推荐,该推荐可被发送给客户计算机(例如,图1中示出的客户计算机154)。这种推荐可用于:1)执行与导致合成事件的产生的用户活动(即,合成事件描述与用户活动相关的因素)无关的活动,或2)执行与这个原始用户活动相关的另外的步骤。
例如,假设:用户和/或计算机逻辑产生描述与用户执行的科学实验室研究相关的因素的合成事件。这个用户活动可以是来自特定的一组病人的血液样本的研究,所述特定的一组病人具有肝炎,年龄超过65岁,并且是杂食的人(统称为“合成事件A”)。使用这里描述的处理的电子文件的搜索揭示包含合成事件A并且还包含非合成事件元素(例如,对特定运动队的提及)的一个或多个电子文件。
在识别的相关电子文件中或者在任何其它电子文件中可能不存在使合成事件A与这个特定运动队的粉丝相关的任何事物,因为这二者看起来无关。然而,基于上下文的计算机逻辑能够推断这二者是相关的,并且将因此为用户产生推荐以研究它们的联系。因此,推荐能够是计算机产生的用以:1)研究与参加由这个特定运动队进行的比赛关联的健康危害。也就是说,能够随后进行推荐来研究与该特定运动队相关的主题,这可导致由基于上下文的计算机逻辑识别的自动售货机(vendor),或者它可导致以前未报告的因素(例如,这个特定运动队的体育场比赛地点的适当家政/卫生处理)。
在一个实施例中,识别出许多(超过某一预定数量/百分比)的电子文件既提及合成事件A又提及这个特定运动队的基于上下文的计算机逻辑可提示这样的推断:合成事件A和该特定运动队相关。
在另一实施例中,可由基于上下文的计算机逻辑提示合成事件A和该特定运动队相关的该推断,所述基于上下文的计算机逻辑把这个特定运动队与特定比赛地点关联(在一个电子文件中),把这个特定比赛地点与特定自动售货机关联(在另一电子文件中),并且把这个特定自动售货机与卫生法典违反引用关联(在又一电子文件中),由此导致基于上下文的计算机逻辑识别合成事件A和该特定运动队之间的可能联系。
替代地,能够进行推荐用以:2)对来自由合成事件A描述的特定的一组病人的血液样本执行另外的实验室测试。例如,假设:导致合成事件A的产生的当前科学实验室研究仅仅旨在进行血液样本的显微镜检查。基于识别的非合成事件元素,可进行推荐以执行血液样本的基因研究,以确定是否存在与合成事件A和这个特定运动队都关联的任何基因突变。这个提议可能最初看起来毫无根据。然而,基因组的完整性的检查可能提供实际支持该提议的线索/信息,或者至少提供新的研究方向的引导。
在本发明的另一实施例中,假设:合成事件描述与诊断医学病人相关的因素。也就是说,假设合成事件是:特定病人具有高血压,年龄超过65岁,并且是杂食的人(统称为“合成事件B”)。然而,卫生保健提供者不能基于这些因素和病人的慢性疲劳的抱怨诊断继发病(由原发病高血压引起的)。电子文件数据库(例如,来自互联网)的搜索揭示包括合成事件B以及非合成事件元素(诸如,对本地发电厂的提及)的一个或多个文档(相关电子文件)。基于上述分析的类型,可产生推荐用以:1)执行与导致该合成事件的产生的用户活动无关的活动,或2)执行与这个用户活动相关的另外的步骤。也就是说,1)能够进行推荐以研究在识别的本地发电厂周围的环境问题。替代地,2)能够推荐卫生保健提供者执行该特定病人的基因研究。再一次,尽管这种研究将最初看起来是不必要的,但相关电子文件提供必要信息以提示这种另外的测试。
如块210中所述,一组二进制数据然后被发送给客户计算机。这组二进制数据包括:1)共享的合成事件;2)识别的相关电子文件(或至少它的位置);3)相关电子文件内的识别的非合成事件元素的描述;以及4)推荐。也就是说,这组二进制数据(能够由处理器操纵)包括共享的合成事件自身(例如,上述合成事件A)。这组二进制数据还包括相关电子文件自身或至少该相关电子文件到提供合成事件描述的计算机的位置描述符(例如,超链接、通用资源定位符(URL)、文件路径等)。另外,这组二进制数据包括非合成事件元素的描述。因此,在以上提供的气象学例子中,合成事件将是城市具有90度的平均高温,相关电子文件将是描述多少人居住在具有90度的平均高温的同一城市(或替代地,另一城市)中的文档,并且识别的非合成事件元素的描述是居住在同一城市(或替代地,另一城市)中的人的数量。最后,这组二进制数据包括基于识别的非合成事件元素的推荐。
图2中描述的处理结束于结束块212。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本文使用的术语仅用于描述具体实施例的目的,而非意图限制本发明。本文使用的单数形式“a”、“an”和“the”意图也包括复数形式,除非上下文清楚地另有指示。还将会理解,当在本说明书中使用时,术语“包括”和/或“包含”指定存在陈述的特征、整数、步骤、操作、元件和/或部件,但不排除存在或增加一个或多个其它特征、整数、步骤、操作、元件、部件和/或它们的组合。
以下的权利要求中的所有装置或步骤加功能元素的对应结构、材料、动作和等同物旨在包括用于结合具体要求保护的其它要求保护的要素执行功能的任何结构、材料或动作。为了说明和描述的目的提供本发明的各种实施例的描述,但并非是穷尽的或者把本发明局限于公开的形式。在不脱离本发明的范围和精神的情况下,许多修改和变化对于本领域普通技术人员而言将会是清楚的。选择并描述实施例,以便最好地解释本发明的原理和实际应用,并且使本领域其他普通技术人员能够针对具有适合设想的具体用途的各种变化的各种实施例理解本发明。
还需要注意的是,在本公开中描述的任何方法可通过使用VHDL(VHSIC硬件描述语言)程序和VHDL芯片来实现。VHDL是用于现场可编程门阵列(FPGA)、专用集成电路(ASIC)和其它类似电子装置的示例性设计输入语言。因此,这里描述的任何软件实现的方法可由基于硬件的VHDL语言仿真,VHDL语言随后被应用于VHDL芯片,诸如FPGA。
如此已通过参照本发明的说明性实施例详细描述了本申请的本发明的实施例,将会清楚的是,在不脱离在所附权利要求中定义的本发明的范围的情况下,可以实现修改和变化是显而易见的。

Claims (14)

1.一种基于电子文件中的识别的非合成事件元素产生活动推荐的计算机硬件实现的方法,所述计算机硬件实现的方法包括:
执行电子文件的数据库的基于上下文的搜索以识别所有的电子文件中的共同合成事件,其中合成事件是一组上下文相关因素的不可执行描述符,其中在执行电子文件的数据库的基于上下文的搜索之前共同合成事件的定义是未知的,并且其中均包含共同合成事件的电子文件是相关电子文件;
针对每个相关电子文件搜索至少一个非合成事件元素,其中非合成事件元素不存在于合成事件中;
基于识别的非合成事件元素产生推荐;以及
把一组二进制数据发送给客户计算机,其中所述一组二进制数据包含合成事件、相关电子文件、所述至少一个非合成事件元素以及所述推荐。
2.如权利要求1所述的计算机硬件实现的方法,其中,所述推荐推荐执行与导致合成事件的产生的用户活动相关的另外的步骤。
3.如权利要求1所述的计算机硬件实现的方法,其中所述合成事件描述与用户活动相关的因素,其中用户活动是科学实验室研究,并且其中所述计算机硬件实现的方法还包括:
产生推荐以对与识别的非合成事件元素相关的主题执行另外的科学实验室研究。
4.如权利要求1所述的计算机硬件实现的方法,其中所述合成事件描述与用户活动相关的因素,其中用户活动是诊断医学病人,并且其中所述计算机硬件实现的方法还包括:
产生推荐以对医学病人执行与识别的非合成事件元素相关的另外的医学测试。
5.如权利要求1所述的计算机硬件实现的方法,其中所述合成事件描述用户活动,并且其中所述计算机硬件实现的方法还包括:
基于用户活动的活动类型确定基于上下文的搜索的上下文。
6.如权利要求1所述的计算机硬件实现的方法,还包括:
对相关电子文件的源进行评级,其中所述评级基于源的公共声誉;以及
基于所述评级对识别的非合成事件元素进行加权。
7.如权利要求1所述的计算机硬件实现的方法,还包括:
对相关电子文件的源进行评级,其中所述评级基于由合成事件的产生者对源的使用的历史频率;以及
基于所述评级对识别的非合成事件元素进行加权。
8.一种用于识别电子文件中的非合成事件元素的系统,包括:
构造为执行电子文件的数据库的基于上下文的搜索以识别所有的电子文件中的共同合成事件的设备,其中合成事件是一组上下文相关因素的不可执行描述符,其中在执行电子文件的数据库的基于上下文的搜索之前共同合成事件是未知的,并且其中均包含共同合成事件的电子文件是相关电子文件;
构造为针对每个相关电子文件搜索至少一个非合成事件元素的设备,其中非合成事件元素不存在于合成事件中;
构造为基于识别的非合成事件元素产生推荐的设备;以及
构造为把一组二进制数据发送给客户计算机的设备,其中所述一组二进制数据包含合成事件、相关电子文件、所述至少一个非合成事件元素和所述推荐。
9.如权利要求8所述的系统,其中所述推荐推荐执行与导致合成事件的产生的用户活动相关的另外的步骤。
10.如权利要求8所述的系统,其中所述合成事件描述与用户活动相关的因素,其中用户活动是科学实验室研究,并且其中所述系统还包括:
构造为产生推荐以研究与识别的非合成事件元素相关的主题的设备。
11.如权利要求8所述的系统,其中所述合成事件描述与用户活动相关的因素,其中用户活动是诊断医学病人,并且其中所述系统还包括:
构造为产生推荐以对医学病人执行与识别的非合成事件元素相关的另外的医学测试的设备。
12.如权利要求8所述的系统,其中所述合成事件描述用户活动,并且其中所述系统还包括:
构造为基于用户活动的活动类型确定基于上下文的搜索的上下文的设备。
13.如权利要求8所述的系统,还包括:
构造为对相关电子文件的源进行评级的设备,其中所述评级基于源的公共声誉;以及
构造为基于所述评级对识别的非合成事件元素进行加权的设备。
14.如权利要求8所述的系统,还包括:
构造为对相关电子文件的源进行评级的设备,其中所述评级基于由合成事件的产生者对源的使用的历史频率;以及
构造为基于所述评级对识别的非合成事件元素进行加权的设备。
CN201310272570.1A 2012-07-02 2013-07-02 用于识别电子文件中的非合成事件元素的方法和系统 Expired - Fee Related CN103530308B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/540,267 2012-07-02
US13/540,267 US9460200B2 (en) 2012-07-02 2012-07-02 Activity recommendation based on a context-based electronic files search

Publications (2)

Publication Number Publication Date
CN103530308A true CN103530308A (zh) 2014-01-22
CN103530308B CN103530308B (zh) 2017-07-14

Family

ID=49779252

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310272570.1A Expired - Fee Related CN103530308B (zh) 2012-07-02 2013-07-02 用于识别电子文件中的非合成事件元素的方法和系统

Country Status (2)

Country Link
US (1) US9460200B2 (zh)
CN (1) CN103530308B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309168A (zh) * 2018-03-09 2019-10-08 北京国双科技有限公司 一种裁判文书搜索方法及装置
CN111295652A (zh) * 2017-11-17 2020-06-16 国际商业机器公司 将外部数据自动连接到业务分析过程
CN112204477A (zh) * 2018-04-09 2021-01-08 开利公司 在智能建筑物中挖掘和部署配置文件

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140038577A (ko) * 2012-09-11 2014-03-31 한국과학기술연구원 메타데이터를 이용한 콘텐츠 추천
US10971252B2 (en) 2016-01-05 2021-04-06 International Business Machines Corporation Linking entity records based on event information

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1902911A (zh) * 2003-11-13 2007-01-24 松下电器产业株式会社 节目推荐装置、节目推荐装置的节目推荐方法以及计算机程序
US20080126366A1 (en) * 2006-08-24 2008-05-29 Bellsouth Intellectual Property Corporation Methods, devices and computer program products for event-based media file tagging
US20090024553A1 (en) * 2006-10-03 2009-01-22 International Business Machines Corporation Automatic generation of new rules for processing synthetic events using computer-based learning processes
CN101527815A (zh) * 2008-03-06 2009-09-09 株式会社东芝 节目推荐装置以及节目推荐方法
US20110029541A1 (en) * 2009-07-31 2011-02-03 Yahoo! Inc. System and method for intent-driven search result presentation

Family Cites Families (202)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5450535A (en) 1993-09-24 1995-09-12 At&T Corp. Graphs employing clusters
US5642503A (en) 1993-12-15 1997-06-24 Microsoft Corporation Method and computer system for implementing concurrent accesses of a database record by multiple users
JP3512866B2 (ja) 1994-09-19 2004-03-31 富士通株式会社 ネットワーク内ノードのグループ化およびデータ転送方法
US5943663A (en) 1994-11-28 1999-08-24 Mouradian; Gary C. Data processing method and system utilizing parallel processing
US5689620A (en) 1995-04-28 1997-11-18 Xerox Corporation Automatic training of character templates using a transcription and a two-dimensional image source model
US5664179A (en) 1995-06-27 1997-09-02 Mci Corporation Modified skip list database structure and method for access
US5701460A (en) 1996-05-23 1997-12-23 Microsoft Corporation Intelligent joining system for a relational database
US5956728A (en) 1996-07-17 1999-09-21 Next Software, Inc. Object graph editing context and methods of use
CA2270472A1 (en) 1996-11-15 1998-05-28 Michael Schindler Computer sorting system for data compression
US6285999B1 (en) 1997-01-10 2001-09-04 The Board Of Trustees Of The Leland Stanford Junior University Method for node ranking in a linked database
US6178433B1 (en) 1997-07-15 2001-01-23 International Business Machines Corporation Method and system for generating materials for presentation on a non-frame capable web browser
US6314555B1 (en) 1997-07-25 2001-11-06 British Telecommunications Public Limited Company Software system generation
US6539388B1 (en) 1997-10-22 2003-03-25 Kabushika Kaisha Toshiba Object-oriented data storage and retrieval system using index table
US6154750A (en) 1998-04-01 2000-11-28 Cyberpulse Llc Method and system for navigation and data entry in heirarchically-organized database views
US6735593B1 (en) 1998-11-12 2004-05-11 Simon Guy Williams Systems and methods for storing data
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US6714936B1 (en) 1999-05-25 2004-03-30 Nevin, Iii Rocky Harry W. Method and apparatus for displaying data stored in linked nodes
US6424969B1 (en) 1999-07-20 2002-07-23 Inmentia, Inc. System and method for organizing data
US7337174B1 (en) 1999-07-26 2008-02-26 Microsoft Corporation Logic table abstraction layer for accessing configuration information
US7925610B2 (en) 1999-09-22 2011-04-12 Google Inc. Determining a meaning of a knowledge item using document-based information
US6405162B1 (en) 1999-09-23 2002-06-11 Xerox Corporation Type-based selection of rules for semantically disambiguating words
US7216115B1 (en) 1999-11-10 2007-05-08 Fastcase.Com, Inc. Apparatus and method for displaying records responsive to a database query
US20020091677A1 (en) 2000-03-20 2002-07-11 Sridhar Mandayam Andampikai Content dereferencing in website development
US6768986B2 (en) 2000-04-03 2004-07-27 Business Objects, S.A. Mapping of an RDBMS schema onto a multidimensional data model
US6681383B1 (en) 2000-04-04 2004-01-20 Sosy, Inc. Automatic software production system
GB0011426D0 (en) 2000-05-11 2000-06-28 Charteris Limited A method for transforming documents written in different XML-based languages
US7146343B2 (en) 2000-07-05 2006-12-05 J. J. Donahue & Company Method and apparatus for negotiating a contract over a computer network
US6633868B1 (en) 2000-07-28 2003-10-14 Shermann Loyall Min System and method for context-based document retrieval
US6990480B1 (en) 2000-09-18 2006-01-24 Trancept Limited Information manager method and system
WO2002046916A2 (en) 2000-10-20 2002-06-13 Polexis, Inc. Extensible information system (xis)
WO2002059773A1 (en) 2000-12-04 2002-08-01 Thinkshare Corp. Modular distributed mobile data applications
US6944830B2 (en) 2000-12-21 2005-09-13 Xerox Corporation System and method for browsing hierarchically based node-link structures based on an estimated degree of interest
WO2002054265A1 (en) 2001-01-02 2002-07-11 Julius Cherny Document storage, retrieval, and search systems and methods
US6944619B2 (en) 2001-04-12 2005-09-13 Primentia, Inc. System and method for organizing data
US6553371B2 (en) 2001-09-20 2003-04-22 International Business Machines Corporation Method and system for specifying and displaying table joins in relational database queries
US20030065626A1 (en) 2001-09-28 2003-04-03 Allen Karl H. User verification for conducting health-related transactions
US6925470B1 (en) 2002-01-25 2005-08-02 Amphire Solutions, Inc. Method and apparatus for database mapping of XML objects into a relational database
US20030149562A1 (en) 2002-02-07 2003-08-07 Markus Walther Context-aware linear time tokenizer
US7299215B2 (en) 2002-05-10 2007-11-20 Oracle International Corporation Cross-validation for naive bayes data mining model
US7441264B2 (en) 2002-06-24 2008-10-21 International Business Machines Corporation Security objects controlling access to resources
US7493253B1 (en) 2002-07-12 2009-02-17 Language And Computing, Inc. Conceptual world representation natural language understanding system and method
AU2003284118A1 (en) 2002-10-14 2004-05-04 Battelle Memorial Institute Information reservoir
JP2004177996A (ja) 2002-11-22 2004-06-24 Toshiba Corp 階層型データベース装置及び階層型データベースの構築方法
US20050050030A1 (en) 2003-01-30 2005-03-03 Decode Genetics Ehf. Set definition language for relational data
US20040153461A1 (en) 2003-02-03 2004-08-05 Brown Mark L. System and method for collecting and disseminating information
US7769794B2 (en) 2003-03-24 2010-08-03 Microsoft Corporation User interface for a file system shell
US7748036B2 (en) 2003-04-01 2010-06-29 Sytex, Inc. Methods for categorizing input data
US7287019B2 (en) 2003-06-04 2007-10-23 Microsoft Corporation Duplicate data elimination system
WO2005008254A1 (ja) 2003-07-18 2005-01-27 A & T Corporation 臨床検査分析装置、臨床検査分析方法およびその方法をコンピュータに実行させるプログラム
US8024335B2 (en) 2004-05-03 2011-09-20 Microsoft Corporation System and method for dynamically generating a selectable search extension
US7664727B2 (en) 2003-11-28 2010-02-16 Canon Kabushiki Kaisha Method of constructing preferred views of hierarchical data
US7818572B2 (en) 2003-12-09 2010-10-19 Dominic Kotab Security system and method
US20050165866A1 (en) 2004-01-28 2005-07-28 Bohannon Philip L. Method and apparatus for updating XML views of relational data
US7437005B2 (en) 2004-02-17 2008-10-14 Microsoft Corporation Rapid visual sorting of digital files and data
US20050181350A1 (en) 2004-02-18 2005-08-18 Anuthep Benja-Athon Pattern of medical words and terms
US7530021B2 (en) 2004-04-01 2009-05-05 Microsoft Corporation Instant meeting preparation architecture
US7493335B2 (en) 2004-07-02 2009-02-17 Graphlogic Inc. Object process graph relational database interface
US7571163B2 (en) 2004-07-13 2009-08-04 Hewlett-Packard Development Company, L.P. Method for sorting a data structure
US7224311B2 (en) 2004-08-27 2007-05-29 Analytical Graphics, Inc. System and method for visualization of attitude and attitude/position dependent data
JP2008529173A (ja) 2005-01-31 2008-07-31 テキストディガー,インコーポレイテッド 電子文書の意味検索および取り込みのための方法およびシステム
US8099509B2 (en) 2005-02-04 2012-01-17 Nec Corporation Access control unit
JP4755427B2 (ja) 2005-02-23 2011-08-24 インターナショナル・ビジネス・マシーンズ・コーポレーション データベース・アクセス・システム、データベース・アクセス方法
US20060197762A1 (en) 2005-03-02 2006-09-07 Microsoft Corporation Scalable visualizer for heterogeneous data
US20060212449A1 (en) 2005-03-21 2006-09-21 Novy Alon R J Method and apparatus for generating relevance-sensitive collation keys
US10002325B2 (en) 2005-03-30 2018-06-19 Primal Fusion Inc. Knowledge representation systems and methods incorporating inference rules
US20060290697A1 (en) 2005-06-24 2006-12-28 Tom Sawyer Software System for arranging a plurality of relational nodes into graphical layout form
US20070006321A1 (en) 2005-07-01 2007-01-04 International Business Machines Corporation Methods and apparatus for implementing context-dependent file security
EP1907945A4 (en) 2005-07-15 2012-01-11 Think Software Pty Ltd METHOD AND APPARATUS FOR GENERATING STRUCTURED DATA FOR FREE TEXT MESSAGES
US7526503B2 (en) 2005-08-15 2009-04-28 Microsoft Corporation Interactive schema translation with instance-level mapping
US20070067343A1 (en) 2005-09-21 2007-03-22 International Business Machines Corporation Determining the structure of relations and content of tuples from XML schema components
US7647625B2 (en) 2005-10-04 2010-01-12 Disney Enterprises, Inc. System and/or method for class-based authorization
US8311907B2 (en) 2005-10-11 2012-11-13 Emc Corporation System and method for detecting fraudulent transactions
US7613690B2 (en) 2005-10-21 2009-11-03 Aol Llc Real time query trends with multi-document summarization
US7613713B2 (en) * 2005-12-01 2009-11-03 Microsoft Corporation Data ecosystem awareness
US7729901B2 (en) 2005-12-13 2010-06-01 Yahoo! Inc. System for classifying words
US7209923B1 (en) 2006-01-23 2007-04-24 Cooper Richard G Organizing structured and unstructured database columns using corpus analysis and context modeling to extract knowledge from linguistic phrases in the database
US20110246483A1 (en) 2006-03-21 2011-10-06 21St Century Technologies, Inc. Pattern Detection and Recommendation
US8849907B1 (en) 2006-03-31 2014-09-30 Rockstar Consortium Us Lp System and method for notifying participants of topics in an ongoing meeting or conference
US7627571B2 (en) 2006-03-31 2009-12-01 Microsoft Corporation Extraction of anchor explanatory text by mining repeated patterns
CA2542379A1 (en) 2006-04-07 2007-10-07 Cognos Incorporated Packaged warehouse solution system
US7523118B2 (en) 2006-05-02 2009-04-21 International Business Machines Corporation System and method for optimizing federated and ETL'd databases having multidimensionally constrained data
US7526501B2 (en) 2006-05-09 2009-04-28 Microsoft Corporation State transition logic for a persistent object graph
US7797319B2 (en) 2006-05-15 2010-09-14 Algebraix Data Corporation Systems and methods for data model mapping
US7853577B2 (en) 2006-06-09 2010-12-14 Ebay Inc. Shopping context engine
US20070300077A1 (en) 2006-06-26 2007-12-27 Seshadri Mani Method and apparatus for biometric verification of secondary authentications
US7899822B2 (en) 2006-09-08 2011-03-01 International Business Machines Corporation Automatically linking documents with relevant structured information
US8060931B2 (en) 2006-09-08 2011-11-15 Microsoft Corporation Security authorization queries
US7940959B2 (en) 2006-09-08 2011-05-10 Advanced Fuel Research, Inc. Image analysis by object addition and recovery
US7996393B1 (en) 2006-09-29 2011-08-09 Google Inc. Keywords associated with document categories
US8145582B2 (en) 2006-10-03 2012-03-27 International Business Machines Corporation Synthetic events for real time patient analysis
US7752154B2 (en) 2007-02-26 2010-07-06 International Business Machines Corporation System and method for deriving a hierarchical event based database optimized for analysis of criminal and security information
US7809660B2 (en) 2006-10-03 2010-10-05 International Business Machines Corporation System and method to optimize control cohorts using clustering algorithms
US8190610B2 (en) 2006-10-05 2012-05-29 Yahoo! Inc. MapReduce for distributed database processing
US9471562B2 (en) 2006-10-10 2016-10-18 Abbyy Infopoisk Llc Method and system for analyzing and translating various languages with use of semantic hierarchy
US20080091503A1 (en) 2006-10-11 2008-04-17 International Business Machines Corporation E-meeting preparation management
US7523123B2 (en) 2006-11-16 2009-04-21 Yahoo! Inc. Map-reduce with merge to process multiple relational datasets
US20080133474A1 (en) 2006-11-30 2008-06-05 Yahoo! Inc. Bioinformatics computation using a maprreduce-configured computing system
US8224816B2 (en) 2006-12-15 2012-07-17 O'malley Matthew System and method for segmenting information
US8140545B2 (en) 2006-12-28 2012-03-20 Sap Ag Data organization and evaluation using a two-topology configuration
US20080172715A1 (en) 2007-01-12 2008-07-17 Microsoft Corporation Scalable context-based authentication
US8046358B2 (en) 2007-02-16 2011-10-25 Ge Healthcare Context-based information retrieval
US7788203B2 (en) 2007-02-26 2010-08-31 International Business Machines Corporation System and method of accident investigation for complex situations involving numerous known and unknown factors along with their probabilistic weightings
US7853611B2 (en) 2007-02-26 2010-12-14 International Business Machines Corporation System and method for deriving a hierarchical event based database having action triggers based on inferred probabilities
US7917478B2 (en) * 2007-02-26 2011-03-29 International Business Machines Corporation System and method for quality control in healthcare settings to continuously monitor outcomes and undesirable outcomes such as infections, re-operations, excess mortality, and readmissions
US7792774B2 (en) 2007-02-26 2010-09-07 International Business Machines Corporation System and method for deriving a hierarchical event based database optimized for analysis of chaotic events
US7805391B2 (en) 2007-02-26 2010-09-28 International Business Machines Corporation Inference of anomalous behavior of members of cohorts and associate actors related to the anomalous behavior
US7792776B2 (en) 2007-02-26 2010-09-07 International Business Machines Corporation System and method to aid in the identification of individuals and groups with a probability of being distressed or disturbed
US7805390B2 (en) 2007-02-26 2010-09-28 International Business Machines Corporation System and method for deriving a hierarchical event based database optimized for analysis of complex accidents
US7970759B2 (en) 2007-02-26 2011-06-28 International Business Machines Corporation System and method for deriving a hierarchical event based database optimized for pharmaceutical analysis
US7788202B2 (en) 2007-02-26 2010-08-31 International Business Machines Corporation System and method for deriving a hierarchical event based database optimized for clinical applications
US7702605B2 (en) 2007-02-26 2010-04-20 International Business Machines Corporation System and method for deriving a hierarchical event based database optimized for privacy and security filtering
US7783586B2 (en) 2007-02-26 2010-08-24 International Business Machines Corporation System and method for deriving a hierarchical event based database optimized for analysis of biological systems
US20100174692A1 (en) 2007-03-15 2010-07-08 Scott Meyer Graph store
US9535810B1 (en) 2007-04-24 2017-01-03 Wal-Mart Stores, Inc. Layout optimization
US8069188B2 (en) 2007-05-07 2011-11-29 Applied Technical Systems, Inc. Database system storing a data structure that includes data nodes connected by context nodes and related method
US7788213B2 (en) 2007-06-08 2010-08-31 International Business Machines Corporation System and method for a multiple disciplinary normalization of source for metadata integration with ETL processing layer of complex data across multiple claim engine sources in support of the creation of universal/enterprise healthcare claims record
US7979449B2 (en) 2007-08-07 2011-07-12 Atasa Ltd. System and method for representing, organizing, storing and retrieving information
US8180901B2 (en) 2007-08-28 2012-05-15 Cisco Technology, Inc. Layers 4-7 service gateway for converged datacenter fabric
US8850057B2 (en) 2007-09-20 2014-09-30 Intel Corporation Healthcare semantic interoperability platform
US8594996B2 (en) 2007-10-17 2013-11-26 Evri Inc. NLP-based entity recognition and disambiguation
US7930262B2 (en) 2007-10-18 2011-04-19 International Business Machines Corporation System and method for the longitudinal analysis of education outcomes using cohort life cycles, cluster analytics-based cohort analysis, and probabilistic data schemas
US8250581B1 (en) 2007-10-28 2012-08-21 Hewlett-Packard Development Company, L.P. Allocating computer resources to candidate recipient computer workloads according to expected marginal utilities
US8341626B1 (en) 2007-11-30 2012-12-25 Hewlett-Packard Development Company, L. P. Migration of a virtual machine in response to regional environment effects
US8607311B2 (en) 2007-12-21 2013-12-10 Microsoft Corporation Delegation in logic-based access control
US8762285B2 (en) 2008-01-06 2014-06-24 Yahoo! Inc. System and method for message clustering
DE202008002980U1 (de) 2008-03-03 2008-09-18 Linguatec Sprachtechnologien Gmbh System zur Datenkorrelation und Mobilendgerät dafür
US7953686B2 (en) 2008-03-17 2011-05-31 International Business Machines Corporation Sensor and actuator based validation of expected cohort behavior
US8095726B1 (en) 2008-03-31 2012-01-10 Emc Corporation Associating an identifier with a content unit
US8266168B2 (en) 2008-04-24 2012-09-11 Lexisnexis Risk & Information Analytics Group Inc. Database systems and methods for linking records and entity representations with sufficiently high confidence
US20090287676A1 (en) 2008-05-16 2009-11-19 Yahoo! Inc. Search results with word or phrase index
US8271475B2 (en) 2008-05-27 2012-09-18 International Business Machines Corporation Application of user context to searches in a virtual universe
US8495701B2 (en) 2008-06-05 2013-07-23 International Business Machines Corporation Indexing of security policies
US8199982B2 (en) 2008-06-18 2012-06-12 International Business Machines Corporation Mapping of literature onto regions of interest on neurological images
EP2291731A4 (en) 2008-06-25 2013-01-02 Novell Inc COPYING WORKLOAD FILES TO A VIRTUAL DATA CARRIER
US8972410B2 (en) 2008-07-30 2015-03-03 Hewlett-Packard Development Company, L.P. Identifying related objects in a computer database
US8239750B2 (en) 2008-09-15 2012-08-07 Erik Thomsen Extracting semantics from data
US20100070640A1 (en) 2008-09-15 2010-03-18 Allen Jr Lloyd W Method and system for allowing access to presentation materials for a meeting
US8433805B2 (en) 2008-09-19 2013-04-30 Apple Inc. Method and system for facilitating contacting people using electronic devices
US8032508B2 (en) 2008-11-18 2011-10-04 Yahoo! Inc. System and method for URL based query for retrieving data related to a context
US20100131293A1 (en) 2008-11-26 2010-05-27 General Electric Company Interactive multi-axis longitudinal health record systems and methods of use
US20100169137A1 (en) 2008-12-31 2010-07-01 Ebay Inc. Methods and systems to analyze data using a graph
US8341095B2 (en) 2009-01-12 2012-12-25 Nec Laboratories America, Inc. Supervised semantic indexing and its extensions
US8150858B2 (en) 2009-01-28 2012-04-03 Xerox Corporation Contextual similarity measures for objects and retrieval, classification, and clustering using same
KR101052631B1 (ko) 2009-01-29 2011-07-28 성균관대학교산학협력단 동시 발생빈도를 이용한 검색어에 대한 연관어 제공 방법 및 이를 이용한 장치
US8150882B2 (en) 2009-03-03 2012-04-03 Microsoft Corporation Mapping from objects to data model
US20100241644A1 (en) 2009-03-19 2010-09-23 Microsoft Corporation Graph queries of information in relational database
US8713038B2 (en) 2009-04-02 2014-04-29 Pivotal Software, Inc. Integrating map-reduce into a distributed relational database
WO2010120281A1 (en) 2009-04-14 2010-10-21 Alcatel-Lucent Usa Inc. Method and apparatus for distributed media conferencing
US8166072B2 (en) 2009-04-17 2012-04-24 International Business Machines Corporation System and method for normalizing and merging credential stores
US8161048B2 (en) 2009-04-24 2012-04-17 At&T Intellectual Property I, L.P. Database analysis using clusters
US8234285B1 (en) 2009-07-10 2012-07-31 Google Inc. Context-dependent similarity measurements
US8402098B2 (en) 2009-08-13 2013-03-19 Clark C. Dircz System and method for intelligence gathering and analysis
US8281065B2 (en) 2009-09-01 2012-10-02 Apple Inc. Systems and methods for determining the status of memory locations in a non-volatile memory
US8321454B2 (en) 2009-09-14 2012-11-27 Myspace Llc Double map reduce distributed computing framework
GB201013195D0 (en) 2009-09-28 2010-09-22 Qinetiq Ltd Processor
US8694514B2 (en) 2009-10-12 2014-04-08 Oracle International Corporation Collaborative filtering engine
US8880537B2 (en) 2009-10-19 2014-11-04 Gil Fuchs System and method for use of semantic understanding in storage, searching and providing of data or other content information
US8121618B2 (en) 2009-10-28 2012-02-21 Digimarc Corporation Intuitive computing methods and systems
US8064677B2 (en) 2009-11-25 2011-11-22 Fujifilm Corporation Systems and methods for measurement of objects of interest in medical images
US9305089B2 (en) 2009-12-08 2016-04-05 At&T Intellectual Property I, L.P. Search engine device and methods thereof
EP2354986A1 (en) 2009-12-31 2011-08-10 Dassault Systèmes Design of an assembly modeled by a graph
JP5314614B2 (ja) 2010-02-05 2013-10-16 富士フイルム株式会社 医用画像表示装置及び医用画像表示方法並びにプログラム
US8280839B2 (en) 2010-02-25 2012-10-02 Mitsubishi Electric Research Laboratories, Inc. Nearest neighbor methods for non-Euclidean manifolds
US9710556B2 (en) 2010-03-01 2017-07-18 Vcvc Iii Llc Content recommendation based on collections of entities
US8886623B2 (en) 2010-04-07 2014-11-11 Yahoo! Inc. Large scale concept discovery for webpage augmentation using search engine indexers
US8315849B1 (en) 2010-04-09 2012-11-20 Wal-Mart Stores, Inc. Selecting terms in a document
US8255786B1 (en) 2010-04-09 2012-08-28 Wal-Mart Stores, Inc. Including hyperlinks in a document
US8595234B2 (en) 2010-05-17 2013-11-26 Wal-Mart Stores, Inc. Processing data feeds
US8560365B2 (en) 2010-06-08 2013-10-15 International Business Machines Corporation Probabilistic optimization of resource discovery, reservation and assignment
US8775625B2 (en) 2010-06-16 2014-07-08 Juniper Networks, Inc. Virtual machine mobility in data centers
US8478879B2 (en) 2010-07-13 2013-07-02 International Business Machines Corporation Optimizing it infrastructure configuration
US8418184B2 (en) 2010-09-24 2013-04-09 International Business Machines Corporation Use of constraint-based linear programming to optimize hardware system usage
US20120110004A1 (en) 2010-11-03 2012-05-03 Microsoft Corporation Homomorphism lemma for efficiently querying databases
US8346804B2 (en) 2010-11-03 2013-01-01 General Electric Company Systems, methods, and apparatus for computer-assisted full medical code scheme to code scheme mapping
US9037720B2 (en) 2010-11-19 2015-05-19 International Business Machines Corporation Template for optimizing IT infrastructure configuration
JP5823259B2 (ja) 2010-11-22 2015-11-25 株式会社東芝 医用データ生成装置
US8615511B2 (en) 2011-01-22 2013-12-24 Operational Transparency LLC Data visualization interface
US8849931B2 (en) 2011-03-15 2014-09-30 Idt Messaging, Llc Linking context-based information to text messages
US20120246148A1 (en) 2011-03-22 2012-09-27 Intergraph Technologies Company Contextual Display and Scrolling of Search Results in Graphical Environment
CN102722412A (zh) 2011-03-31 2012-10-10 国际商业机器公司 组合计算装置和方法
US8510326B2 (en) 2011-04-11 2013-08-13 Google Inc. Priority dimensional data conversion path reporting
CA2775427A1 (en) 2011-04-27 2012-10-27 Perspecsys Inc. System and method of data interception and conversion in a proxy
US8457355B2 (en) 2011-05-05 2013-06-04 International Business Machines Corporation Incorporating video meta-data in 3D models
US8676937B2 (en) 2011-05-12 2014-03-18 Jeffrey Alan Rapaport Social-topical adaptive networking (STAN) system allowing for group based contextual transaction offers and acceptances and hot topic watchdogging
US10748092B2 (en) 2011-06-07 2020-08-18 The Boeing Company Systems and methods for creating intuitive context for analysis data
US8533195B2 (en) 2011-06-27 2013-09-10 Microsoft Corporation Regularized latent semantic indexing for topic modeling
WO2013010130A1 (en) 2011-07-13 2013-01-17 Mastercard International, Inc. Instantaneous merchant information retrieval for financial transactions
WO2013070977A1 (en) 2011-11-10 2013-05-16 Room 77, Inc. Metasearch infrastructure with incremental updates
US8447273B1 (en) 2012-01-09 2013-05-21 International Business Machines Corporation Hand-held user-aware security device
US9037590B2 (en) 2012-01-23 2015-05-19 Formcept Technologies and Solutions Pvt Ltd Advanced summarization based on intents
EP2631817A1 (en) 2012-02-23 2013-08-28 Fujitsu Limited Database, apparatus, and method for storing encoded triples
US20130246562A1 (en) 2012-03-14 2013-09-19 Accenture Global Services Limited Systems and methods for managing content
US9715560B2 (en) 2012-04-24 2017-07-25 International Business Machines Corporation Optimizing sparse schema-less data in data stores
US20130291098A1 (en) 2012-04-30 2013-10-31 Seong Taek Chung Determining trust between parties for conducting business transactions
US9058614B2 (en) 2012-05-21 2015-06-16 Sphereup Ltd. System and method for dynamically clustering data items
WO2013181541A1 (en) 2012-06-01 2013-12-05 Treiser Adam Systems and methods for displaying relationships between data items, individuals, and dynamically calculated metric scores
US9449068B2 (en) 2012-06-13 2016-09-20 Oracle International Corporation Information retrieval and navigation using a semantic layer and dynamic objects
US8930374B2 (en) 2012-06-29 2015-01-06 Nokia Corporation Method and apparatus for multidimensional data storage and file system with a dynamic ordered tree structure
US20140025702A1 (en) 2012-07-23 2014-01-23 Michael Curtiss Filtering Structured Search Queries Based on Privacy Settings
US20140074886A1 (en) 2012-09-12 2014-03-13 Pingar Holdings Limited Taxonomy Generator
US9069752B2 (en) 2013-01-31 2015-06-30 International Business Machines Corporation Measuring and displaying facets in context-based conformed dimensional data gravity wells
US9053102B2 (en) 2013-01-31 2015-06-09 International Business Machines Corporation Generation of synthetic context frameworks for dimensionally constrained hierarchical synthetic context-based objects

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1902911A (zh) * 2003-11-13 2007-01-24 松下电器产业株式会社 节目推荐装置、节目推荐装置的节目推荐方法以及计算机程序
US20080126366A1 (en) * 2006-08-24 2008-05-29 Bellsouth Intellectual Property Corporation Methods, devices and computer program products for event-based media file tagging
US20090024553A1 (en) * 2006-10-03 2009-01-22 International Business Machines Corporation Automatic generation of new rules for processing synthetic events using computer-based learning processes
CN101527815A (zh) * 2008-03-06 2009-09-09 株式会社东芝 节目推荐装置以及节目推荐方法
US20110029541A1 (en) * 2009-07-31 2011-02-03 Yahoo! Inc. System and method for intent-driven search result presentation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宋双永等: "面向移动终端的微博信息推荐方法", 《计算机科学》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111295652A (zh) * 2017-11-17 2020-06-16 国际商业机器公司 将外部数据自动连接到业务分析过程
CN111295652B (zh) * 2017-11-17 2024-02-27 国际商业机器公司 将外部数据自动连接到业务分析过程
CN110309168A (zh) * 2018-03-09 2019-10-08 北京国双科技有限公司 一种裁判文书搜索方法及装置
CN112204477A (zh) * 2018-04-09 2021-01-08 开利公司 在智能建筑物中挖掘和部署配置文件

Also Published As

Publication number Publication date
CN103530308B (zh) 2017-07-14
US20140006391A1 (en) 2014-01-02
US9460200B2 (en) 2016-10-04

Similar Documents

Publication Publication Date Title
Katsuki et al. Establishing a link between prescription drug abuse and illicit online pharmacies: Analysis of twitter data
CN103530309A (zh) 使用合成事件的基于上下文的电子文档搜索的系统和方法
JP5957048B2 (ja) 曖昧性を解消する教師データの生成方法、生成システム、及び生成プログラム
US9524526B2 (en) Disambiguating authors in social media communications
US20140089322A1 (en) System And Method for Ranking Creator Endorsements
CN103530308A (zh) 基于基于上下文的电子文件搜索的活动推荐
Jiang et al. A consensus-based approach for harmonizing the OHDSI common data model with HL7 FHIR
Saria et al. Too many definitions of sepsis: can machine learning leverage the electronic health record to increase accuracy and bring consensus?
US8676791B2 (en) Apparatus and methods for providing assistance in detecting mistranslation
Tapia et al. National seroprevalence of Coxiella burnetii in Chile, 2016–2017
Kostrinsky-Thomas et al. Searching the PDF Haystack: automated knowledge discovery in scanned EHR documents
Curcin Why does human phenomics matter today?
US11663215B2 (en) Selectively targeting content section for cognitive analytics and search
Liao et al. Problematic privacy policies of voice assistant applications
Lalu et al. Peering into the dark corners of knowledge synthesis to understand the influence of predatory journals on systematic reviews
Sousa et al. A hybrid approach toward biomedical relation extraction training corpora: combining distant supervision with crowdsourcing
US8898165B2 (en) Identification of null sets in a context-based electronic document search
Patergianakis et al. Privacy Issues in Stylometric Methods
Lin et al. Posting recommendations in healthcare q&a forums
Wagle IBM Watson: Revolutionizing healthcare?
Zeller et al. Use of the ISU FLU ture multisequence identity tool for rapid interpretation of swine influenza A virus sequences in the United States
WO2022009354A1 (ja) 発明評価装置、発明評価方法、および発明評価プログラム
JP2011086278A (ja) 情報伝播経路特定装置、情報伝播経路特定方法、情報伝播経路特定プログラム
Wang et al. User experience evaluation of Google search for obtaining medical knowledge: a case study
Skiena et al. Big data: achieving scale

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170714