CN1716259A - 基于内部-类型和交互-类型关系来排列对象的方法和系统 - Google Patents

基于内部-类型和交互-类型关系来排列对象的方法和系统 Download PDF

Info

Publication number
CN1716259A
CN1716259A CNA200510083738XA CN200510083738A CN1716259A CN 1716259 A CN1716259 A CN 1716259A CN A200510083738X A CNA200510083738X A CN A200510083738XA CN 200510083738 A CN200510083738 A CN 200510083738A CN 1716259 A CN1716259 A CN 1716259A
Authority
CN
China
Prior art keywords
type
function
property value
relation
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200510083738XA
Other languages
English (en)
Other versions
CN1716259B (zh
Inventor
章本玉
曾华军
马维英
希雯思
陈正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN1716259A publication Critical patent/CN1716259A/zh
Application granted granted Critical
Publication of CN1716259B publication Critical patent/CN1716259B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/954Relational
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/955Object-oriented
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/962Entity-attribute-value
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Abstract

提供了一种基于不同对象类型的对象之间的关系来排列对象的方法和系统。所述排列系统对于每种对象的类型的每个属性定义了一个方程。所述方程定义了属性值并且基于所述属性和与对象的相同类型、对象的不同类型相关的属性之间的关系。所述排列系统利用所述方程迭代地计算对象的属性值直到所述属性值收敛于一个解。所述排列系统然后基于属性值排列对象。

Description

基于内部-类型和交互-类 型关系来排列对象的方法和系统
技术领域
所描述的技术通常涉及对象的排列,尤其涉及基于对象关系的排列。
背景技术
许多搜索引擎服务,例如Google和Overture,提供对通过因特网可以访问的信息的搜索。这些搜索引擎服务允许用户搜索可能对其具有兴趣的显示页面,例如网页。当用户提交一个包含搜索项目的搜索请求(也称作询问)后,搜索引擎服务识别可能与那些搜索项目有关的网页。为了快速地识别相关的网页,搜索引擎服务可能保存网页的关键词映射。所述搜索引擎服务可以通过“爬行”该网(即,万维网)产生该映射以提取每个网页的关键词。为了爬行该网,搜索引擎服务可以使用主页列表以及识别所有通过这些主页可以访问的页面。任何特定页面的关键词可以利用各种公知的信息检索技术来提取,例如识别标题行的文字,应用于网页元数据的文字,高亮显示的文字等。搜索引擎服务基于每个匹配的密切性计算出显示每个网页与搜索请求关联程度的关联分值,网页受欢迎程度(例如,Google的页面排列),等等。然后搜索引擎服务以基于关联性的顺序向用户显示那些网页的链接。搜索引擎可能通常还提供在任何文档集合中搜索信息。例如,所述文档集合可以包括所有的美国专利,所有的联邦法院的判决,某公司的所有的归档文档,等等。
两个众所周知的排列网页的技术是页面排列和HITS(“引发超链接的主题搜索”)。页面排列基于的原理是页面会链接到(即,“输出链接”)重要的页面。这样,一个页面的重要性基于链接到该页面(即,“输入链接”)的其它页面的数量和重要性。在一个简单的形式中,页面之间的链接可以由矩阵A表示,其中Aij表示从网页i到网页j的输出链接的数量。对于网页j的重要性分值wj可以由下面的方程表示:
wj=∑iAijwi
这个方程可以基于下面的方程通过迭代计算来解决:
ATw=w
其中w是网页重要性分值的向量,并且是AT的主要本征向量。
另外,HITS技术基于的原理是:与其它重要的网页具有诸多链接的网页可能其本身就是重要的。因此,HITS将网页的“重要性”分为两个相关的属性:“中心”和“权限”。中心是通过一个网页链接到的网页的“权限”分值来测定的,“权限”是通过链接到所述网页的网页“中心”分值来测定的。与页面排列相反,其计算独立于询问的网页的重要性,而HITS基于该结果的网页以及通过追踪输入和输出链接与该结果的网页相关的网页来计算重要性。HITS提交一个询问给搜索引擎服务,并且使用该结果的网页作为网页的初始组。HITS将输入链接的目的网页以及该结果网页的输出链接的源网页添加到所述组。HITS然后利用一个迭代算法计算每个网页的权限和中心分值。所述权限和中心分值可以通过以下方程来表示:
h ( p ) = Σ q → p a ( q )
其中a(p)表示网页p的权限分值,以及h(p)表示网页p的中心分值。HITS使用一个邻接矩阵A来表示链接。所述邻接矩阵由以下方程来表示:
Figure A20051008373800073
向量a和h分别对应所述组中所有页面的权限和中心并且可以由以下方程来表示:
a=ATh和h=Aa
因此,a和h就是矩阵ATA和AAT的本征向量。通过对访问量的测量,HITS也可以被修改为网页的受欢迎度的系数。基于对网页日志的分析,当用户从网页i访问到网页j时,邻接矩阵的bij可以被提高。
这些网页排列技术的排列主要基于网页本身的属性。这些属性包括从一个网页链接到另一个以及从一个网页访问到另一个。该排列技术不能将与网页无直接联系的属性计算在内。例如,当访问网页的专家用户被计算在内时,网页的重要性可能被更精确地确定。希望具有这样的技术,它基于与网页无直接联系的属性来计算网页的重要性。一般地,希望基于另—类型的对象(例如,用户)的关系产生用于一种类型的对象(例如,网页)的分值。
发明内容
提供了一种基于不同类型对象的关系的排列对象的方法和系统。所述排列系统定义了用于每种对象类型的每个属性的方程。所述方程定义了属性值并且基于属性和与对象的相同类型和不同类型有关的属性之间的联系。由于属性值可以是相互依存的,这是按照另外的属性定义的,反之亦然,所述方程表示属性的递归定义。所述排列系统理由所述方程迭代计算用于对象的属性值直到所述属性值收敛于一个解。所述排列系统然后基于属性值排列对象。
附图说明
图1是说明一个实施例中排列系统部件的流程图。
图2是说明一个实施例中对排列对象部件的处理的流程图。
图3是说明一个实施例中建立关联部件的处理的流程图。
图4是说明一个实施例中计算分值部件的处理的流程图。
具体实施方式
提供了一种基于相同的或其它的数据对象类型的数据对象的联系来排列一种数据对象类型的数据对象的系统和方法。在一个实施例中,排列系统识别不同数据对象类型的数据对象。例如,一种数据对象类型可以是网页,另一种的数据对象类型可以是询问,以及另一种数据对象类型可以是用户。每个数据对象类型可以具有各种类型-特性的属性。例如,一个网页可以具有权限属性,一个用户可以具有专家属性。网页的权限属性可以是基于所述网页的输入链接的数量。当用户访问的网页具有高权限属性值时,用户的专家属性可以被提高。所述排列系统计算数据对象的属性值,并且可以基于它们的属性值排列数据对象。
所述排列系统定义了对象的“类型”,以便每个对象包含一个单独的属性。例如,所述排列系统可以定义相应于网页权限属性的一个类型以及相应于网页中心属性的另一个类型。这样,两个类型可以表示相同的基本数据对象(例如,网页)。所述排列系统确定相同类型的对象之间的各种关系,称作内部-类型关系,以及不同类型的对象之间的各种关系,称作交互-类型关系。例如,当提交了一个询问时,所述排列系统可以使用所述结果作为权限类型的对象以及可以使用网页日志来识别访问这些网页的用户作为专家类型的对象。权限类型的内部-类型关系对象可以包括网页的输入链接和输出链接关系。例如,如果一个网页具有到另一个网页的链接,于是所述网页具有到另一个网页的输出链接关系,所述另一个网页具有到所述网页的输入链接关系。权限类型和专家类型对象之间的内部-类型关联可以基于用户对网页的访问。例如,如果一个用户访问了一个网页,所述网页和用户就具有一个访问关系。排列系统利用内部-类型关系和交互-类型关系与其它类型对象属性值相结合来获得某个类型对象的属性值。例如,排列系统可以使用输入和输出链接关系以及用户访问关系来获得网页的权限和中心属性和用户的专家属性。
在一个实施例中,排列系统利用一组方程表示关系和属性,例如线性方程。排列系统利用线性方程表示每种类型的属性值,该线性方程可以基于另一个类型的属性值被递归地定义。例如,用于权限属性的线性方程可以基于专家属性的属性值被定义,反之亦然。由于所述方程可以被递归地定义,排列系统通过迭代计算每个线性方程的属性值直到所述属性值收敛为一个解来解所述线性方程。解完线性方程后,排列系统基于属性值排列数据对象。例如,所述排列系统可以基于它们的权限属性排列网页。
所述排列系统基于对象的内部-类型和交互-类型关联表示对象属性值。属性值可以由以下的方程来表示:
Fi=FiRi+∑j≠iFjRji
其中Fi表示与对象i相关的属性值,Ri表示对象i类型的对缘之间的内部-类型关系,以及Rji表示对象i类型的对象与其它类型j之间的交互-类型关系。如果有两种对象的类型x={x1,x2,…xm}和y={y1,y2,…yn},那么它们的内部-类型关系可以由RX和RY表示,并且它们的交互类型关系可以由RXY和RYX来表示。排列系统使用邻接矩阵来表示关联信息。LX和LY分别表示组X和Y内的内部-类型关系的邻接矩阵。LXY和LYX分别表示从X内的对象到Y内的对象的交互-类型关系的邻接矩阵以及从Y内的对象到X内的对象的交互-类型关系的邻接矩阵。排列系统通过以下来表示邻接矩阵:
Figure A20051008373800101
其中LXY(i,j)指示出从组X的对象i到组Y的对象j是否存在一个关系(也称作“链接”)。所述属性值的线性方程由以下的方程来表示:
w y = L y T w y + L xy T w x
w x = L x T w x + L yx T w y - - - ( 1 )
其中wx是X中对象的属性向量以及wy是Y中对象的属性向量。方程1可以被归纳为以下形式:
w M = L M T w M + Σ ∀ N ≠ M L NM T w N - - - ( 2 )
其中M表示属性向量的矩阵。
由于互相增强对象之间的关联可能赋予对象不适当的属性值,排列系统可以以下面的方式归一化二元邻接矩阵:如果一个对象与一个邻接矩阵中的n个其它对象相关,那么每个相关的对象获得其属性值的1/nth。排列系统还可以引入页面配列的随机冲浪模型来模拟随机关系,这样就避免了下述的计算期间的下沉节点。另外,由于不同类型的属性对于其它属性具有不同的重要性,对于每种类型的结合所述排列系统可以使用加权。这样,所述排列系统可以归一化系数,随机冲浪模型和加权来通过以下方程表示属性值:
w M = α M L ′ M T w M + β NM Σ ∀ N ≠ M L ′ NM T w N
其中
α M + Σ ∀ N ≠ M β NM = 1 ; α M > 0 β NM > 0 ; - - - ( 3 )
L’M=εU+(1-ε)LM;0<ε<1;
L’NM=δNU+(1-δ)LNM;0<δN<1.
其中U是具有变换概率(对于所有i,j,uij=1/n;其中n是数据空间N中的对象总数)形式的变换矩阵,LM和LNM是归一化的邻接矩阵,δ和ε是在矩阵LM和LNM中用于模拟随机关系的平滑系数,αM和βNM表示关系的加权。所述排列系统迭代地计算方程3直到其收敛。方程3可以由以下方程所表示的一元化方形矩阵A来表示:
Figure A20051008373800111
(4)
矩阵A在对角线上具有L’M,在所述一元矩阵的其它部分具有L’NM。所述排列系统使用迭代逼近来变换向量w,其是在使用了矩阵A(例如,w=ATw)的不同的数据空间中所有数据对象的属性变量。当所述迭代收敛时,向量w是矩阵A的主要本征向量。
当M和N是不同的数据空间时,所述排列系统使用随机关系来表示关系。当M中的一个对象与N中的任何对象没有链接关系时,所述子矩阵LNM ′T将会是零并且表示计算可以将所有的属性值分配到其上的一个“下沉节点”。为了防止它的发生,所述排列系统设置所述子矩阵LNM ′T相应行中所有元素到1/n,其中n是数据空间N中所有的对象数目。可选择地,对于不希望的内部-类型和交互-类型关系,所述排列系统可以设置相应的加权为0。但是,如果βMN大于0,当迭代计算收敛时,βNM则需大于0。这样,如果LNM ′T的关系是不希望的,所述排列系统设置βNM到一个非常小的正加权以减少LNM ′T的效应。
通过利用所有的邻接矩阵构造一个一元化矩阵,所述排列系统构造了一个一元化的数据空间,其包含不同的对象类型。这样,先前的交互-类型关系可以被当作一元化的空间中的内部-类型关系,所述排列系统有效地导致在一个单独的数据空间中的链路分析。
图1是说明在一个实施例中排列系统部件的流程图。所述排列系统110通过通信链路102被连接到不同的网站101。所述排列系统包括一个排列对象部件111,其调用一个收集对象部件112,一个建立关系部件113,一个计算分值部件114以及一个排序对象部件115以排列对象。所述排列对象部件可以接收一组网页并且基于内部-类型和交互-类型关系排列网页。所述收集对象部件检索于不同类型对象相关的关系信息。例如,收集对象部件可以访问网站的网页日志以识别哪些用户访问过哪些网页。所述建立关系部件产生内部-类型和交互-类型关系矩阵。例如,一个关系矩阵可以映射用户到其访问的网页。所述计算分值部件利用方程3递归地计算属性值直到所述属性值收敛于一个解。所述排序对象部件基于所述属性值排序数据对象。例如,该顺序目标部件可以使用用于网页的权限属性的值来排序该网页。
在其上实施所述排列系统的计算设备可以包括一个中央处理单元,存储器,输入设备(例如,键盘和定点设备),输出设备(例如,显示设备),以及存储设备(例如,磁盘驱动器)。所述存储器和存储设备是计算机可读介质,其可以包含实施所述排列系统的指令。此外,数据结构和消息结构可以通过一个数据传输介质被存储或传输,例如通信链路上的信号。各种不同的通信链路都可以被使用,例如因特网,局域网,广域网,或点对点的拨号连接。
所述排列系统可以在各种不同的操作环境下实施。各种公知的适于使用的计算系统,环境,以及配置包括个人计算机,服务器计算机,手持或膝上型设备,多处理器系统,基于微处理器的系统,可编程消费电子产品,网络PC,微型计算机,大型计算机,包括任何以上系统或设备的分布式计算系统,等等。
所述排列系统可以由计算机可执行的指令的一般范围来描述,例如由一个过多个计算机或其它设备执行的程序模块。通常,程序模块包括执行特定任务或实施特定摘要数据类型的例程,程序,对象部件,数据结构,等等。典型地,程序模块的功能可以在不同的环境中根据需要来结合或分配。
图2是说明一个实施例中排列对象部件的处理的流程图。所述部件收集对象信息,在对象之间建立关联,计算对象的属性值,以及基于属性排序对象。在方框201,所述部件收集于不同对象相关的信息。在方框202,所述部件调用建立关系部件以产生邻接矩阵。所述建立关系部件还可以检索和调整α和β的加权。在方框203,所述部件调用计算分值部件以迭代地计算属性值直到它们收敛于一个解。在方框204,所述部件基于一个属性的值排列数据对象。例如,所述部件可以基于权限属性排序网页。
图3是说明在一个实施例中建立关系部件处理的流程图。在方框301-303中,所述部件对于每种类型循环建立邻接矩阵。在方框301,所述部件选择下一个类型。在判断方框302,如果所有的类型都已被选择,所述部件返回,否则所述部件继续至方框303。在方框303,所述部件在所选类型的对象和所有类型的对象之间建立关联。例如,所述部件将在权限类型和中心类型,以及权限类型和专家类型之间建立关联。所述部件然后循环至方框301来选择下一个类型。
图4是说明在一个实施例中计算分值部件处理的流程图。所述部件迭代地计算方程直到所述属性值收敛。在方框401,所述部件检索由邻接矩阵所表示的对象关系。在方框402,所述部件检索内部-类型和交互-类型的加权α和β。在方框403,所述部件对于每种类型初始化向量w以使所述类型的每个对象具有相同的属性值。所述部件可以设置每个值为1/m,其中m是所述类型的对象的数量。例如,如果有10个用户,那么所述部件设置所述专家类型的初始属性值到1/10。所述部件还初始化每种类型的差分变量到一个较大的值,这样所述部件最初会通过判断方框405的测试。所述部件在每个迭代的结束计算每个差分变量的新的值以确定所述计算是否收敛于一个解。在方框404-409,所述部件执行方程3的计算直到所述计算收敛于一个解。在方框404,所述部件开始下一个迭代。在判断方框405,如果在最后的迭代期间所计算的差分的总和小于一个差分门限,那么所述计算已经收敛于一个解并且所述部件返回,否则所述部件继续至方框406。在方框406,所述部件选择下一个类型。在判断方框407,如果所有的类型都已被选择,那么所述部件循环至方框404以开始下一个迭代,否则所述部件继续至方框408。在方框408,所述部件基于先前迭代中所计算的值计算所选类型的值。在方框409,所述部件计算所选类型的该迭代的值和先前迭代的值之间差分。所述部件然后循环至方框406来选择下一个类型。
本领域人员将会理解,尽管为了说明的目的在此描述了排列系统的特定实施例,在不脱离本发明精神和范围下,可以作出各种修改。例如,本领域技术人员将会理解,非线性方程可以用于表示属性值。并且,所述排列系统可以用于彼此之间具有某种关系的所有类型的对象。例如,所述排列系统可以利用学生或报名者和教授的关系基于“重要性”被用来排列大学,其中大学,学生,以及教授表示不同类型的对象。因此,本发明只限于附加的权利要求。

Claims (35)

1.一种在计算机系统中用于确定对象属性的属性值的方法,所述方法包括:
提供类型,每种类型具有特定类型的属性;
识别对象,每个对象与一个类型相关;
对于所述类型中的每一种,识别用于和所述类型相关的对象之间的所述类型的关系;
识别用于和所述类型相关的对象和与其它类型相关的对象之间的所述类型的关系;以及
对于所述类型中的每一种,基于所识别的关系计算所述对象属性的分值。
2.权利要求1的方法,其中所述类型包括一个权限类型,一个中心类型,以及一个专家类型。
3.权利要求2的方法,其中权限类型的对象的关系基于一个网页是否具有到另一个网页的链接。
4.权利要求3的方法,其中所述权限类型的对象和专家类型的对象之间的关系基于用户对一个网页的访问。
5.权利要求2的方法,其中中心类型的对象的关系基于一个网页是否具有到另一个网页的链接。
6.权利要求5的方法,其中所述中心类型的对象和专家类型的对象之间的关系基于用户对一个网页的访问。
7.权利要求1的方法,其中相同类型的对象之间的关系是内部-类型关系。
8.权利要求1的方法,其中不同类型的对象之间的关系是交互-类型关系。
9.权利要求1的方法包括基于它们属性值排列一个类型的对象。
10.权利要求1的方法包括对于定义了所述类型的属性值的每种类型提供一个方程。
11.权利要求10的方法,其中所述计算包括迭代地解所述方程。
12.权利要求10的方法,其中基于其它方程的属性值被递归地定义。
13.权利要求1的方法包括对于每种类型定义一个函数,计算所述类型的属性值。
14.权利要求13的方法,其中所述函数是
Fi=FiRi+∑j≠iFjRji
其中Fi表示与对象i相关的属性值,Ri表示对象i类型的对象之间的内部-类型关系,以及Rji表示对象i类型的对象与其它类型j之间的交互-类型关系。
15.权利要求13的方法,其中所述函数是
w M = a M L M ′ T w M + β NM Σ ∀ N ≠ M L NM ′ T w N
16.一种在计算机系统中用于确定对象的属性值的方法,所述方法包括:
基于所述类型的对象和另一个具有另外的特定类型属性的类型的对象之间的关系,提供一个函数,用于计算类型对象的特定类型属性的属性值;
接收定义所述类型的对象和另外类型的对象之间关系的数据;以及
计算所提供的函数以确定所述类型的对象的属性值。
17.权利要求16的方法包括提供用于计算另外的类型的对象的特定类型属性值的函数。
18.权利要求17的方法,其中所述函数被递归地定义。
19.权利要求18的方法,其中所述计算包括迭代地计算每个函数直到所述属性值收敛于一个解。
20.权利要求18的方法,其中所述函数表示线性方程。
21.权利要求16的方法,其中所提供的函数还基于所述类型的对象之间的关系计算属性值。
22.权利要求21的方法,其中所述函数被定义为
Fi=FiRi+∑j≠iFjRji
其中Fi表示与对象i相关的属性值,Ri表示对象i类型的对象之间的内部-类型关系,以及Rji表示对象i类型的对象与其它类型j之间的交互-类型关系。
23.一种计算机可读介质,包含用于控制一个计算机系统以确定对象的属性值的指令,其依据的方法包括:
提供一个第一函数,用于基于第一类型的对象和具有第二特定类型属性的第二类型的对象之间的关系,计算第一类型的对象的第一特定类型属性的属性值;
提供一个第二函数,用于计算所述第二类型对象的第二特定类型属性的属性值;
接收定义第一类型对象和第二类型对象之间的关系的数据;以及
计算所提供的函数以确定第一类型对象和第二类型对象的属性值。
24.权利要求23的计算机可读介质,其中所述第二函数基于所述第二类型对象之间的关系计算所述属性值。
25.权利要求23的计算机可读介质,其中所述第一函数基于所述第一类型对象之间的关系计算所述属性值。
26.权利要求23的计算机可读介质,其中所述第二函数基于第一类型对象的属性值计算属性值。
27.权利要求23的计算机可读介质,其中所述函数被递归地定义。
28.权利要求27的计算机可读介质,其中所述计算包括迭代地计算每个函数直到所述属性值收敛于一个解。
29.权利要求23的计算机可读介质,其中所述函数表示线性方程。
30.权利要求23的计算机可读介质,其中所述函数被定义为
Fi=FiRi+∑j≠iFjRji
其中Fi表示与对象i相关的属性值,Ri表示对象i类型的对象之间的内部-类型关系,以及Rji表示对象i类型的对象与其它类型j之间的交互-类型关系。
31.一种用于确定对象属性值的计算机系统,包括:
实施第一函数的第一部件,所述第一函数用于基于第一类型的对象和具有第二特定类型属性的第二类型的对象之间的关系,计算第一类型的对象的第一特定类型属性的属性值;
实施第二函数的第二部件,所述第二函数用于计算所述第二类型对象的第二特定类型属性的属性值,其中所述第一和第二函数被递归地定义;
一个数据存储器,包含定义了第一类型对象和第二类型对象之间的关系的数据;以及
一个部件,其迭代地调用所述第一和第二部件来确定所述第一和第二类型的对象的属性值。
32.权利要求31的计算机系统,其中第二函数基于第二类型的对象之间的关联计算属性值。
33.权利要求31的计算机系统,其中第一函数基于第一类型的对象之间的关系进一步计算属性值。
34.权利要求31的计算机系统,其中第二函数基于第一类型的对象的属性值计算属性值。
35.权利要求31的计算机系统,其中第一和第二部件被调用直到所述属性值收敛于一个解。
CN200510083738XA 2004-05-14 2005-05-16 基于内部-类型关联和交互-类型关联来排列对象的方法和系统 Expired - Fee Related CN1716259B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/846,835 US7346621B2 (en) 2004-05-14 2004-05-14 Method and system for ranking objects based on intra-type and inter-type relationships
US10/846,835 2004-05-14

Publications (2)

Publication Number Publication Date
CN1716259A true CN1716259A (zh) 2006-01-04
CN1716259B CN1716259B (zh) 2012-05-23

Family

ID=34939836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200510083738XA Expired - Fee Related CN1716259B (zh) 2004-05-14 2005-05-16 基于内部-类型关联和交互-类型关联来排列对象的方法和系统

Country Status (10)

Country Link
US (1) US7346621B2 (zh)
EP (1) EP1596315A1 (zh)
JP (1) JP4965086B2 (zh)
KR (1) KR101130374B1 (zh)
CN (1) CN1716259B (zh)
AU (1) AU2005202017A1 (zh)
BR (1) BRPI0503929A (zh)
CA (1) CA2507337C (zh)
MX (1) MXPA05005208A (zh)
RU (1) RU2387005C2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425711A (zh) * 2012-05-25 2013-12-04 株式会社理光 基于多对象实例的对象值对齐方法
CN112114941A (zh) * 2019-06-19 2020-12-22 中国移动通信集团浙江有限公司 数据作业的评价方法、装置及电子设备

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005022403A1 (en) * 2003-08-27 2005-03-10 Sox Limited Method of building persistent polyhierarchical classifications based on polyhierarchies of classification criteria
US7346621B2 (en) 2004-05-14 2008-03-18 Microsoft Corporation Method and system for ranking objects based on intra-type and inter-type relationships
US7437382B2 (en) * 2004-05-14 2008-10-14 Microsoft Corporation Method and system for ranking messages of discussion threads
US9286387B1 (en) 2005-01-14 2016-03-15 Wal-Mart Stores, Inc. Double iterative flavored rank
EP1691277B1 (en) * 2005-02-11 2009-06-24 Sap Ag Context menu providing dependency relationships for objects of different type
JP4421502B2 (ja) * 2005-03-25 2010-02-24 株式会社東芝 文書管理システム
US7921106B2 (en) * 2006-08-03 2011-04-05 Microsoft Corporation Group-by attribute value in search results
US8195734B1 (en) 2006-11-27 2012-06-05 The Research Foundation Of State University Of New York Combining multiple clusterings by soft correspondence
US7849104B2 (en) * 2007-03-01 2010-12-07 Microsoft Corporation Searching heterogeneous interrelated entities
US7552131B2 (en) 2007-03-05 2009-06-23 International Business Machines Corporation Autonomic retention classes
WO2008126184A1 (ja) * 2007-03-16 2008-10-23 Fujitsu Limited 文書重要度算出プログラム
US7636715B2 (en) * 2007-03-23 2009-12-22 Microsoft Corporation Method for fast large scale data mining using logistic regression
US8122016B1 (en) 2007-04-24 2012-02-21 Wal-Mart Stores, Inc. Determining concepts associated with a query
US7953724B2 (en) * 2007-05-02 2011-05-31 Thomson Reuters (Scientific) Inc. Method and system for disambiguating informational objects
US9183290B2 (en) * 2007-05-02 2015-11-10 Thomas Reuters Global Resources Method and system for disambiguating informational objects
US20090083048A1 (en) * 2007-09-21 2009-03-26 Mandelbaum Steven J System and method for providing an application service
US8862608B2 (en) * 2007-11-13 2014-10-14 Wal-Mart Stores, Inc. Information retrieval using category as a consideration
KR100975502B1 (ko) * 2008-01-30 2010-08-11 엔에이치엔(주) 블로그 포스트의 랭킹 판단 방법 및 시스템
WO2009107416A1 (ja) * 2008-02-27 2009-09-03 日本電気株式会社 グラフ構造変化検出装置、グラフ構造変化検出方法およびプログラム
WO2009107412A1 (ja) * 2008-02-27 2009-09-03 日本電気株式会社 グラフ構造推定装置、グラフ構造推定方法およびプログラム
US8140550B2 (en) * 2008-08-20 2012-03-20 Satyam Computer Services Limited Of Mayfair Centre System and method for bounded analysis of multimedia using multiple correlations
US8650195B2 (en) * 2010-03-26 2014-02-11 Palle M Pedersen Region based information retrieval system
US8490056B2 (en) * 2010-04-28 2013-07-16 International Business Machines Corporation Automatic identification of subroutines from test scripts
US8533319B2 (en) * 2010-06-02 2013-09-10 Lockheed Martin Corporation Methods and systems for prioritizing network assets
US8538949B2 (en) 2011-06-17 2013-09-17 Microsoft Corporation Interactive web crawler
JP5928248B2 (ja) * 2012-08-27 2016-06-01 富士通株式会社 評価方法、情報処理装置およびプログラム
US9501503B2 (en) * 2013-05-09 2016-11-22 Microsoft Technology Licensing, Llc Inferring entity attribute values
KR101761999B1 (ko) 2014-06-12 2017-07-28 경희대학교 산학협력단 관계 유형을 고려한 코칭 방법 및 시스템

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2799023B1 (fr) * 1999-09-24 2003-04-18 France Telecom Procede de classification thematique de documents, module de classification thematique et moteur de recherche incorporant un tel module
US6601075B1 (en) * 2000-07-27 2003-07-29 International Business Machines Corporation System and method of ranking and retrieving documents based on authority scores of schemas and documents
US7346621B2 (en) 2004-05-14 2008-03-18 Microsoft Corporation Method and system for ranking objects based on intra-type and inter-type relationships

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425711A (zh) * 2012-05-25 2013-12-04 株式会社理光 基于多对象实例的对象值对齐方法
CN103425711B (zh) * 2012-05-25 2017-08-25 株式会社理光 基于多对象实例的对象值对齐方法
CN112114941A (zh) * 2019-06-19 2020-12-22 中国移动通信集团浙江有限公司 数据作业的评价方法、装置及电子设备

Also Published As

Publication number Publication date
EP1596315A1 (en) 2005-11-16
RU2005114665A (ru) 2006-11-20
JP2005327293A (ja) 2005-11-24
JP4965086B2 (ja) 2012-07-04
CN1716259B (zh) 2012-05-23
KR20060047856A (ko) 2006-05-18
RU2387005C2 (ru) 2010-04-20
KR101130374B1 (ko) 2012-04-12
BRPI0503929A (pt) 2007-01-23
AU2005202017A1 (en) 2005-12-01
MXPA05005208A (es) 2005-12-06
CA2507337C (en) 2013-04-23
US20050256832A1 (en) 2005-11-17
US7346621B2 (en) 2008-03-18
CA2507337A1 (en) 2005-11-14

Similar Documents

Publication Publication Date Title
CN1716259A (zh) 基于内部-类型和交互-类型关系来排列对象的方法和系统
US7779001B2 (en) Web page ranking with hierarchical considerations
Raghavan et al. Representing web graphs
Haveliwala et al. Evaluating strategies for similarity search on the web
US8224849B2 (en) Object similarity search in high-dimensional vector spaces
US6871202B2 (en) Method and apparatus for ranking web page search results
US7797344B2 (en) Method for assigning relative quality scores to a collection of linked documents
CN102171689B (zh) 用于提供搜索结果的方法、系统
Chen et al. Local methods for estimating pagerank values
CN1728147A (zh) 基于异类关系确定目标相似性的方法和系统
US20100211588A1 (en) Context-Aware Query Suggestion By Mining Log Data
US20080313137A1 (en) Behavioral WEB Graph
Su et al. How to improve your search engine ranking: Myths and reality
US8631002B2 (en) Web-relevance based query classification
CN1702654A (zh) 计算显示页面中块的重要度的方法和系统
US7379947B2 (en) Efficiently ranking web pages via matrix index manipulation and improved caching
US20070094250A1 (en) Using matrix representations of search engine operations to make inferences about documents in a search engine corpus
Zhang et al. A novel web usage mining approach for search engines
CN104615723A (zh) 查询词权重值的确定方法和装置
Faba‐Pérez et al. Comparative analysis of webometric measurements in thematic environments
Huang et al. A cube model and cluster analysis for web access sessions
CN101268465A (zh) 分类一组电子文档的方法
Bollen et al. An adaptive systems approach to the implementation and evaluation of digital library recommendation systems
Evangelopoulos et al. Evaluating information retrieval using document popularity: An implementation on MapReduce
Wu et al. Automatic topics discovery from hyperlinked documents

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120523

Termination date: 20140516