CN104794145A - 基于内容和关系距离来连接人们 - Google Patents
基于内容和关系距离来连接人们 Download PDFInfo
- Publication number
- CN104794145A CN104794145A CN201410788521.8A CN201410788521A CN104794145A CN 104794145 A CN104794145 A CN 104794145A CN 201410788521 A CN201410788521 A CN 201410788521A CN 104794145 A CN104794145 A CN 104794145A
- Authority
- CN
- China
- Prior art keywords
- user
- computing equipment
- content
- corpus
- connection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 claims description 50
- 238000011161 development Methods 0.000 claims description 18
- 230000002776 aggregation Effects 0.000 claims description 14
- 238000004220 aggregation Methods 0.000 claims description 14
- 238000005516 engineering process Methods 0.000 abstract description 17
- 230000006870 function Effects 0.000 description 28
- 238000000034 method Methods 0.000 description 19
- 238000004891 communication Methods 0.000 description 13
- 238000000605 extraction Methods 0.000 description 10
- 230000004044 response Effects 0.000 description 9
- 238000013500 data storage Methods 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 241000245665 Taraxacum Species 0.000 description 3
- 235000005187 Taraxacum officinale ssp. officinale Nutrition 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004821 distillation Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000013178 mathematical model Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 244000144992 flock Species 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 235000013372 meat Nutrition 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 235000014541 cooking fats Nutrition 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
一种用于至少部分地基于语义距离和关系距离在人们之间或当中建立连接的技术,包括一个或多个计算设备,所述一个或多个计算设备分析由计算设备用户创建的内容、对内容执行内容聚集、确定在连接候选之间的关系距离、并且至少部分地基于内容聚集和关系距离来生成连接推荐。
Description
背景技术
社会网络典型地从相关的角度来识别个人以及他们之间的连接或关系。数学分析可以用于开发或扩展社会网络,来包括人们之间的链接,这些人否则没有正式地作为朋友、家庭或同事而连接。例如,互联网消息传递和社会性媒体服务可以使用数学上生成的操作来向它们的用户自动推荐新的连接。如果用户对某项内容具有较高的亲合性,但只有用户是关系亲近的,一些现有的系统才试图连接在社会网络内的用户。换句话说,如果用户和推荐的连接已经在社会网络中密切地相关,则现有的系统更可能向用户推荐该连接。
附图说明
本文所述的概念作为示例而不是作为限制在附图中示出。为了说明的简单和清楚,在附图中示出的元件不一定按比例绘制。在被考虑为适当的场合,附图标记在附图中重复出现,以指示相对应的或类似的元件。
图1是正如本文公开的包括客户端计算设备、服务器计算设备和连接推荐系统的计算系统的至少一个实施例的简化的框图;
图2是图1的计算系统的环境的至少一个实施例的简化的框图;以及
图3是用于使用图1的计算系统生成连接推荐的方法的至少一个实施例的简化的流程图。
具体实施方式
虽然本公开的概念容许各种修改和可替换的形式,但是其特定实施例作为示例在附图中示出,并且将在本文中详细描述。然而应当理解,不存在将本公开的概念限制到所公开的特定形式的意图,而相反,本发明将涵盖与本公开和所附的权利要求相一致的所有修改、等效物和可替代的方案。
在说明书中对“一个实施例”、“实施例”、“举例示出的实施例”等的引用指示了所描述的实施例可以包括特定的特征、结构或特性,但每一个实施例可以或可以不必包括所述特定的特征、结构或特性。而且,这样的短语并不一定指同一实施例。此外,当特定的特征、结构或特性连同实施例描述时,认为连同其它实施例实现的这样的特征、结构或特性(不管是否被明确地描述)是在本领域中的技术人员的知识范围内的。此外,应当认识到,以“至少一个A、B和C”的形式包括在列表中的项目可以意指(A);(B);(C);(A和B);(B和C);(A和C);或(A、B和C)。类似地,以“A、B和C中的至少一个”的形式列出的项目可以意指(A);(B);(C);(A和B);(B和C);(A和C);或(A、B和C)。
所公开的实施例在一些情况下可以在硬件、固件、软件或其任何组合中实现。所公开的实施例还可以被实现为由暂时性或非暂时性机器可读(例如,计算机可读)存储介质携带的指令或存储在暂时性或非暂时性机器可读(例如,计算机可读)存储介质上的指令,所述指令可以由一个或多个处理器读取和执行。机器可读存储介质可以被体现为任何存储设备、机制或用于以机器可读的形式存储或传输信息的其它物理结构(例如,易失性或非易失性存储器、介质盘或其它介质设备)。
在附图中,一些结构或方法特征可以以具体的布置和/或排序示出。然而,应当认识到,这样的具体布置和/或排序可以不是必须的。相反,在一些实施例中,这样的特征可以以与在举例示出的附图中所示的不同的方式和/或顺序来进行布置。此外,包括在特定附图中的结构或方法特征并不意味着暗示这样的特征在所有实施例中都是需要的,并且在一些实施例中这样的特征可以不被包括或可以与其它特征进行组合。
现在参考图1,计算系统100的实施例包括至少一个客户端计算设备110和至少一个服务器计算设备150。整如下面更详细的描述的,连接推荐系统136、174的部分体现在客户端计算设备110和/或服务器计算设备150中作为软件、固件、硬件或其组合。举例示出的连接推荐系统136、174可以基于由不同的计算设备用户创建的结构化和/或非结构化的内容的语义分析以及在创建这样的内容的用户之间的关系距离的度量二者来为计算设备用户生成连接推荐。
正如在本文中使用的,“连接”除了其它事物以外可以指在两个不同的人之间建立电子(例如,“在线”或“虚拟”)关系或关联的计算机化的机制。例如,在各种不同的用户级计算机应用中,连接可以将用户识别为另一用户的“链接”、“朋友”、“联系人”、“收信人”或“追随者”。正如在本文中所使用的,“连接推荐”除了其它事物以外可以指通过其使得计算设备用户感知另一用户的计算机化的机制。例如,连接推荐可以作为由计算设备以人类可感知的形式(例如,视觉、音频、触觉等)呈现的电子消息、建议或通知来实现。连接推荐可以识别当前用户可能希望连接的另一用户,或可以识别用户对,连接由计算系统100针对所述用户对进行建议。连接推荐还可以包括为什么做出推荐的原因的解释和/或使计算系统100做出推荐的标准。正如在本文所使用的,“语义分析”除了其它事物以外可以指内容分析的一种类型,所述内容分析考虑出现在用户生成的内容中的词项(例如,词、词的部分或词组)的用户预期的含义。例如,在词项可以用不同的方式进行解释的场合,语义分析除了其他因素以外可以考虑词项出现于其中的上下文,以便确定词项的特定实例的实际的、用户预期的含义。相反,“词汇”分析除了其它事物以外可以指在句子中“无上下文”的内容分析的一种类型,其中内容的词汇文法不参考上下文进行分析。例如,词汇分析可以分析单独的词和短语的词结构或短语结构,而不考虑任何周围的内容。正如在本文中所使用的对“内容分析”的提及可以包括语义分析、词汇分析、其组合和/或其它形式的内容分析。正如在本文中所使用的,“结构化”的内容除了其它事物以外可以指具有预定义的格式或含义的用户输入(例如,字母数字文本)。例如,结构化的内容可以包括被输入到用户级应用的输入域或对话框内的文本,例如数字值、日期值、用户名、电子邮件地址和/或其它。相反,“非结构化”的内容除了其它事物以外可以指不具有预先定义的格式或含义的用户输入。例如,非结构化的内容可以包括自然语言字母数字文本,例如,可以包含在文档、电子邮件消息、文本消息、博客或社会媒体帖子(例如,“状态更新”、“留言”、“评论”或“信息墙”)的主体中的文本。当然,虽然本文描述的某些示例指“文本”内容,但是应当理解,可替换地或除了文本以外,所公开的功能可以应用于其它形式的内容(例如,音频、视频等)。正如在本文中所使用的,“关系距离”除了其它事物以外可以指根据社会或关系角度两个人之间的距离的度量,其中“距离”可以在本文中用于表示关系紧密度的缺乏。例如,在社会网络中,关系距离可以由连接在网络中不直接连接的两个人所需的中间的连接的数量来进行度量。在一些实施例中,关系距离可以由连接的“程度”指示,其中更高的程度指示更长的关系距离,并且更低的程度与更短的关系距离相对应。
通过考虑用户生成的内容的词汇或语义或含义以及在创建了类似的内容的个人之间的关系距离,连接推荐系统136、174除了其它事物以外可以生成可能更独特的或引起兴趣的连接推荐,这是因为连接推荐可以包括用户不与其共享亲密关系的人,然而所述人具有与用户共同的有意义的需要、兴趣或技能。作为示例,假设在欧洲的文学学者正研究Melville的《MobyDick》并且发布了博客,在所述博客中她提到在捕鲸船上谈论“crackling”的渔民。单独地,在新英格兰的厨师发布了关于对“crackling”的食谱的评论。词“crackling”具有多种不同的含义。例如,crackling可以指用于烹饪肥肉直到它是脆的的过程,或可以用作名词(例如“从肥肉熬炼的外皮”的同义词)或可以用作形容词(例如“发出劈啪声的火焰”或“发出爆裂的声音”)。然而,连接推荐系统136、174的实施例可以在学者和厨师二者看起来都对同一类型的crackling感兴趣并且不可能已经互相认识的基础上,向欧洲的文学学者建议她与在新英格兰的厨师建立连接(或反之亦然)。
举例示出的连接推荐系统136、174被体现为包括存在于一个或多个客户端计算设备110上的“本地”部分136和存在于一个或多个服务器计算设备150上的“远程”部分174。例如,本地部分136的不同版本可以存在于不同类型的计算设备(例如,不同类型的移动计算设备(例如,智能电话和平板电脑)或不同品牌的操作系统)上。可替换的或另外,在一些实施例中(例如“在云端中”),“远程”部分174可以分布在多个服务器计算设备150当中。本地部分136和远程部分174的每一个都可以被体现为软件、固件、硬件或其组合。为了讨论的容易,在本文以单数形式引用客户端计算设备110和服务器计算设备150中的每一个;然而,这样的引用是要涵盖使用多个客户端计算设备110和/或多个服务器计算设备150的实施例。此外,应当理解,在其它实施例中,在本文举例描述的由客户端计算设备110执行的功能可以由服务器计算设备150执行,反之亦然。
服务器计算设备150和客户端计算设备110(以及由此连接推荐系统136、174的部分136、174)由一个或多个无线、光学和/或有线通信网络180通信地耦合。客户端计算设备110和服务器计算设备150中的每一个都可以被体现为能够执行本文描述的功能的任何类型的电子设备。例如,设备110、150中的任意一个或二者可以没有限制地被体现为智能电话、平板计算机、可穿戴的计算设备、膝上型计算机、笔记本计算机、移动计算设备、蜂窝电话、手持装置、消息传递设备、车辆远程信息处理设备、服务器计算机、工作站、分布式计算系统、多处理器系统、消费电子设备和/或被配置用于执行本文所描述的功能的任何其它计算设备。此外,在人使用多个电子设备(也许同时,例如在智能电话、可穿戴的设备、平板计算机和/或膝上型计算机的情况中)的情况中,连接推荐系统136、174的部分可以体现在这样的设备中的每一个上,使得系统136、174可以从任何数量的电子设备接收数据,用户通过所述电子设备连接到系统136、174。
如图1所示,举例示出的客户端计算设备110包括处理器112、存储器114、输入/输出子系统116、用户级应用118、数据存储设备120,所述数据存储设备120具有体现在其中的可以由连接推荐系统136、174使用来执行本文描述的功能的数据,所述数据包括:用户内容122、上下文数据124、用户语料库126、词汇空间128以及用户简档130。用户内容122包括由计算设备用户创建的并且至少暂时地存储在客户端计算设备110上的内容。同样,用户内容122可以包括任何类型的文档、消息、图像、音频记录和/或其它类型的用户生成的电子内容。上下文数据124包括指示用户的当前上下文的方面的数据。例如,上下文数据124可以包括传感器数据或从传感器数据得到的信息(例如,用户的当前地理位置、附近的设施、运动信息等)。上下文数据124可以可替换地或另外包括指示用户的个人情况(例如,个人偏好、人口统计信息、感兴趣的主题和/或其它)的方面的信息。正如在下面更详细地描述的,用户语料库126包括或定义由连接推荐系统136、174使用来生成连接推荐的用户内容122的子集。当词汇空间128与用户语料库164的主体相关时,词汇空间128被体现为表示关于语料库126的语义和/或词汇信息的计算机编程结构(例如,多维向量或阵列),其中用户语料库164包含语料库126和参与在连接推荐系统136、174中的计算设备的集合中的其它计算设备的每一个的类似的语料库。因此,为了创建词汇空间128,计算系统100确定计算设备用户的集合,针对所述计算设备用户,分析用户内容122并且创建语料库126。举例示出的词汇空间128被定义为具有多个维度(或位置)的多维空间,其中维度的数量与在用户语料库164中的词项的数量相对应,并且维度中的每一个表示在语料库164中存在的词项中的一个。例如,如果语料库164包括由用户1创作的文档1“蒲公英是花”和由用户2创作的文档2“蒲公英是种子”,则语料库164的向量表示可以是:[蒲公英,是,花,种子];文档1的向量表示可以是[1,1,1,0];以及文档2的向量表示可以是[1,1,0,1]。在文档1向量和文档2向量之间的语义距离可以进行数学计算并且由计算系统100使用,作为由这两个用户生成的内容的语义相似性的指示。
用户简档130包括关于计算设备用户的信息,连接推荐系统136、174使用所述信息来做出连接推荐。例如,用户简档130可以包括上下文数据124、语料库126或对其的参考,和/或例如可能对过滤出不想要的或不相关的连接推荐有用的任何其它信息。
举例示出的客户端计算设备110还包括一个或多个传感器132、用户接口子系统134、连接推荐系统136的“本地部分”以及通信子系统138。在其它实施例中,客户端计算设备110可以包括其它或附加的部件(例如,通常在移动计算机和/或静止计算机中找到的那些部件(例如,各种传感器和输入/输出设备)),或缺乏所示部件中的一个或多个(例如,传感器132)。另外,在一些实施例中,举例示出的部件中的一个或多个可以合并在计算设备110的另一部件中或否则形成计算设备110的另一部件的一部分。连接推荐系统136的部分可以合并到另一应用或系统(例如,用户级应用118)中。例如,连接推荐系统136可以被体现为搜索引擎或社会媒体应用的小配件或插件,并且可以在用户参与应用或系统或响应于创建内容的用户时分析内容、上下文数据以及“在后台中”的社会网络数据。
处理器112可以被体现为能够执行本文描述的功能的任何类型的处理器。例如,处理器112可以被体现为单核处理器或多核处理器、数字信号处理器、微控制器或其它处理器或处理/控制电路。存储器114可以被体现为能够执行本文描述的功能的任何类型的易失性存储器或非易失性存储器或数据存储。在操作中,存储器114可以存储在客户端计算设备110的操作期间使用的各种数据和软件,例如,操作系统、应用、程序、库以及驱动器。例如,存储器114可以至少暂时性地存储用户内容122、上下文数据124、用户语料库126、词汇空间128和/或用户简档130的部分。根据系统136、174的特定设计或实现的要求,用户内容122、上下文数据124、用户语料库126、词汇空间128以及用户简档130中的每一个都可以体现在电子文件、表格、数据库或其它适当的计算机化的数据结构(例如,向量、阵列、或树)中。
存储器114例如经由I/O子系统116通信地耦合到处理器112。I/O子系统116可以被体现为有助于与处理器112、存储器114和客户端计算设备110的其它部件进行输入/输出操作的电路和/或部件。例如,I/O子系统116可以被体现为或否则包括存储控制器中枢、输入/输出控制中枢、固件设备、通信链路(即,点对点链路、总线链路、电线、电缆、光导、印刷电路板迹线等)和/或有助于输入/输出操作的其它部件和子系统。在一些实施例中,I/O子系统116可以形成片上系统(SoC)的一部分并且可以连同处理器112、存储器114和/或客户端计算设备110的其它部件一起合并在单个集成电路芯片上。
用户级应用118可以被体现为被配置用于通过人机接口设备(例如,键盘、鼠标、麦克风或触摸屏)与终端用户连接的任何类型的计算机应用(例如,软件、硬件、固件或其组合)。例如,用户级应用118可以被体现为搜索引擎、社会媒体服务、电子消息传递服务或可以在客户端计算设备110上运行的另一类型的计算机应用或计算机应用套件的“前端”。例如,用户级应用118可以包括基于网络的社会媒体服务,连接推荐系统136、174与所述基于网络的社会媒体服务进行通信(例如,作为子模块或作为由社会媒体服务例如通过API访问的外部服务)。数据存储设备120可以被体现为被配置用于数据的短期存储或长期存储的任何类型的设备,例如,存储器设备和电路、存储卡、硬盘驱动器、固态驱动器或其它数据存储设备。数据存储设备120可以包括针对客户端计算设备110存储数据和固件代码的系统分区。数据存储设备120还可以包括存储用于客户端计算设备110的系统部件(例如操作系统)的数据文件和可执行代码的操作系统分区。
传感器132(如果存在)可以被体现为包括运动传感器设备(例如,加速计、倾斜计、运动传感器或接近度传感器)、方位传感器(例如,陀螺仪)、移动定点设备(例如,红外设备)、位置传感器(例如,全球定位系统或GPS)、图像或视频照相机、眼跟踪设备或另一类型的感测设备或感测设备的组合。传感器132可以被配置用于检测、捕获并且处理关于用户当前正在操作客户端计算设备110的环境和/或用户与客户端计算设备110进行交互的各种信息。这样的信息的全部或部分可以由客户端计算设备110存储,由连接推荐系统136、174使用,例如作为上下文数据124。
在终端用户直接与连接推荐系统136进行交互的实施例中,用户接口子系统136可以包括有助于与客户端计算设备110或与连接推荐系统136进行用户交互的多个设备。当然,在一些实施例中,连接推荐系统136可以不直接与终端用户连接。这可以是以下这种情况,其中例如连接推荐系统136由现有的系统(例如,社会媒体应用)访问或合并到所述现有的系统内。在任何事件中,用户接口子系统136的用户接口设备可以包括物理和/或虚拟控制按钮或按键、麦克风、扬声器、单向或双向静止图像和/或视频照相机和/或其它。传感器132和/或用户接口子系统136的部分中的任何都可以与客户端计算设备110集成(例如,作为其“内置”部件)或与客户端计算设备110通信(例如,通过网络180或通用串行总线连接)。
连接推荐系统136的“本地部分”可以被体现为能够执行本文描述的功能的任何类型的计算机应用(例如,硬件、软件或其组合)。例如,连接推荐子系统136可以被体现为包括接收并且处理用户简档130、用户内容122、上下文数据124、用户标识符(例如,用户名)和/或其它用户数据的在图2中示出和下面描述的模块的一部分。在一些实施例中,连接推荐系统136可以包括在下面更详细描述的语料库开发模块210、社会网络标识符模块228、用户简档发生器214和/或上下文提取模块218的部分。可替换地或另外,连接推荐系统136可以包括通过例如与用户级应用118进行连接或实现屏幕抓取或网络抓取技术来监视用户内容的创建的功能。以这种方式,连接推荐系统136、174可以在新用户内容生成时对其做出响应,或连接推荐系统136、174可以随着时间的推移来收集用户内容的样本用于离线分析。例如,连接推荐系统136、174可以直接响应于用户最近的社会媒体帖子、博客帖子、即时消息、留言(例如,“实时地”)或其组合来生成并且呈现连接推荐,如本文所公开的。可替换地或另外,连接推荐系统136、174可以随着时间的推移(例如,使用模型)来聚集上述用户内容和/或用户内容的其它样本,并且然后共同分析所述用户内容,以生成连接推荐,如本文所公开的。应注意,在一些实施例中,连接推荐系统136、174可以访问并且利用在各种不同的应用(例如,消息传递、社会媒体和电子邮件)当中生成的用户内容。换句话说,连接推荐系统136、174不限于结合在单个软件应用内创建的内容来进行使用。
通信子系统138可以被体现为能够实现在客户端计算设备110和其它电子设备(包括服务器计算设备150)之间的电子通信的任何类型的通信电路、设备或其集合。通信子系统138可以被配置用于使用任何一个或多个通信技术(例如,光学、无线或有线通信)和相关联的协议(例如,以太网、蓝牙、Wi-Fi、WiMAX、3G/LTE等)来实施这样的通信。通信子系统138可以被体现为包括无线网络适配器的一个或多个网络适配器。
服务器计算设备150可以被体现为用于执行本文描述的功能的任何类型的设备。例如,服务器计算设备150可以没有限制地被体现为智能电话、平板计算机、可穿戴的计算设备、膝上型计算机、上网本计算机、移动计算设备、蜂窝电话、手持装置、消息传递设备、车辆远程信息处理设备、服务器计算机、工作站、分布式计算系统、多处理器系统、消费电子设备和/或被配置为执行本文描述的功能的任何其它计算设备。如图1所示,举例示出的服务器计算设备150包括处理器152、存储器154、输入/输出子系统156和数据存储设备158,所述数据存储设备158具有以下内容体现在其中:用户内容160、上下文数据162、用户语料库164、词汇空间166和用户简档168。用户内容122包括由参与在连接推荐系统136、174的计算设备用户的集合中的计算设备用户中的一个或多个创建的用户内容122。例如,用户内容160可以被体现为所有参与的计算设备用户的所有用户内容122的集合,并且由此有助于由系统136、174确定关于计算设备用户中的任何是否共同具有任何用户内容122。上下文数据162包括参与在连接推荐系统136、174中的计算设备用户的集合中的计算设备用户中的一个或多个的上下文数据124。例如,上下文数据162可以被体现为所有参与的计算设备用户的所有上下文数据124的集合,并且由此有助于由系统136、174确定关于计算设备用户中的任何是否共同具有上下文数据124。
用户语料库164包括、参考或定义每一个用户语料库126;例如,参与在系统136、174中的计算设备用户中的每一个计算设备用户的用户语料库126被包括、参考或定义在语料库164中。当词汇空间166与用户语料库164的全部相关时,词汇空间166被体现为表示关于单独的语料库126中的每一个的语义和/或词汇信息的计算机编程结构(例如,多维向量)。例如,词汇空间166可以被体现为参与的计算设备用户中的每一个计算设备用户的单独词汇空间128中的每一个的集合,并且可以由此有助于下面描述的由计算系统100执行的聚集。用户简档168包括参与在连接推荐系统136、174中的计算设备用户中的一个或多个的用户简档130。例如,用户简档168可以被体现为所有参与的计算设备用户的所有用户简档130的集合,并且可以由此有助于由计算系统100确定关于是否针对特定的计算设备用户对做出连接推荐。通常,按照执行本文描述的功能(例如,用户内容122、160、上下文数据124、162、用户语料库126、164;词汇空间128、166、用户简档130、168和/或其它)所需要的,连接推荐系统174的服务器部分可以访问本文所提到的数据中的任何或所有。本文提到的或否则执行本文描述的功能所需的数据中的任何或所有(例如,用户内容122、160、上下文数据124、162、用户语料库126、164;词汇空间128、166、用户简档130、168和/或其它)可以体现在软件、固件、硬件或其组合中。
服务器计算设备150还包括用户接口子系统170、社会网络服务172、连接推荐系统174的“远程部分”和通信子系统176。社会网络服务172可以被体现为可以为用户提供社会网络数据的任何计算机化的服务或服务的组合(例如软件、固件、硬件或其组合)。正如在本文中所使用的,“社会网络数据”除了其它事物以外可以指识别一个或多个计算设备用户和在用户之间的双重连接的数据。社会网络服务172可以包括社会媒体站点、用户的电子联系人系统、电子邮件服务、电子消息传递服务、博客服务、日历服务、地址簿、关系管理系统(例如,消费者关系管理或CRM系统)和/或可以包含用户和连接信息的其它电子服务或应用。
连接推荐系统174的“远程部分”可以被体现为能够执行本文描述的功能的任何类型的计算机应用(例如,硬件、软件或其组合)。例如,连接推荐系统174可以被体现为包括在图2中示出的和在下面描述的连接发生器模块220的部分。可替换地或此外,连接推荐系统174可以包括用于维持或用于监视通过计算系统100和/或计算系统100的各种用户对用户内容122、160、上下文数据124、162、用户语料库126、164;词汇空间128、166、用户简档130、168的创建和更新的功能。例如,连接推荐系统174可以响应于检测到通过计算系统100或计算系统100的用户中的一个对用户简档130、168或用户内容122、160做出的更新而自动执行连接发生器模块220。
当然,在其它实施例中,服务器计算设备150可以包括其它或附加的部件,例如,通常在移动计算机和/或静止计算机中找到的那些部件(例如,各种传感器和输入/输出设备)。此外,在一些实施例中,举例示出的部件中的一个或多个可以合并在另一部件中或否则形成另部件的一部分。例如,在一些实施例中,连接推荐系统174或其部分可以合并在社会网络服务172中。客户端计算设备110的元件的前述描述适用于具有相同或类似的名称的服务计算设备150的元件(例如,处理器112和处理器152等)。因此,为了简洁起见,不在这里重复描述。此外,应理解,数据(例如,用户简档130、168和用户内容122、160)的单独实例被示出为分别存在于客户端计算设备110和服务器计算设备150上,以便示出:属于同一用户或不同用户的这样的数据和/或内容的部分可以存在于多个计算设备上(例如,在分布式计算环境中)。
网络180可以被体现为蜂窝网络、局域网、广域网(例如,WI-FI)、个人云端、虚拟个域网(例如,VPN)、企业云、公共云、以太网、公共网络(例如,互联网)、或其组合。可替换地或另外,网络180可以使用例如蓝牙和/或近场通信(NFC)技术来实现在服务器计算设备150和客户端计算设备110之间的较短范围的无线通信。将认识到,本文的教导(例如,连接推荐系统136、174)可以按照关于用于网络180的基本网络技术的高效操作的需要进行改装或调节。此外,将理解,其它技术或协议(例如,TCP/IP和/或其它)可以通过网络180来在没有变更的情况下实现。
现在参考图2,在一些实施例中,计算系统100在操作期间建立环境200。在任何给定的时间,举例示出的环境200可以包括在服务器计算设备150和客户端计算设备110中的一个或两个上的活动(例如,被加载的和/或正在执行的)部件。在举例示出的实施例中,这些部件被体现为多个模块,包括语料库开发模块210、内容特性提取模块212、用户简档发生器214、词汇空间构建器216、上下文提取模块218、连接发生器模块220、聚集模块222以及社会网络标识符模块228。语料库开发模块210、内容特性提取模块212、用户简档发生器214、词汇空间构建器216、上下文提取模块218、连接发生器模块220、聚集模块222、社会网络标识符模块228和/或用于执行本文公开的功能的任何其它模块中的每一个都可以在软件、固件、硬件或其组合中实现。
在操作中,语料库开发模块210为参与的计算设备用户中的每一个创建语料库126。为了完成所述功能,语料库开发模块210选择包括在语料库126中的用户内容122,并且将语料库126中选定的用户内容122编入索引并且进行存储,使得选定的用户内容122是可搜索的(例如,经由元数据或关键字查询)。在选择包括在语料库126中的用户内容122时,内容特性提取模块212和/或上下文提取模块218可以用来提供内容特性信息和/或上下文数据124,所述内容特性信息和/或上下文数据124可以由语料库开发模块210使用,以在包括在语料库126中之前过滤用户内容122。例如,内容特性提取模块212可以对用户内容122执行信息提取技术,以从中得到可以用于选择性地定义语料库126的一个或多个高级主题或作者品质。为了完成所述功能,内容特性提取模块212可以执行例如主题提取方法或风格分析。以这种方式,语料库126可以被限制为特定的话题或主题(例如“领域”)或特定类型的内容(例如,学者文章或非正式的对话消息)。类似地,上下文提取模块218可以将上下文数据124提供给语料库开发模块210,所述上下文数据124可以由语料库开发模块210使用来将语料库126限制为与特定的上下文数据124相关的用户内容122。上下文数据124可以包括例如数据/时间信息、用户位置数据、无线接入点、网络类型信息或可以用于确定用户的当前地理位置或当前上下文的其它信息。例如,语料库开发模块210可以开发语料库126,用于只包括在某个时间段期间或当用户物理地出现在特定的地理位置处时创建的用户内容122(例如,当用户开会时发送的所有留言)。
词汇空间构建器216通过对语料库126在算法上执行词汇和/或语义内容分析,从而针对每一个参与在系统136、174中的计算设备用户,构建词汇空间128、166。这个过程可以被称为确定在词汇空间128、166中的语料库的上下文。内容分析可以包括例如从语料库126提取低多义性词项。为了完成所述功能,举例示出的词汇空间构建器216应用数学技术(例如,修改的逆文档频率技术),用于取消优先考虑高多义性词项或除去对高多义性词项的考虑。为了确定词项是否是“高多义性的”,词汇空间构建器216与语言模型230连接,以得到关于词项的语言频率的信息(例如,在语言模型230中该词项出现的频率)。词汇空间构建器216利用将具有高语言频率的词省略之后保留的词项的集合来创建数学模型(例如,“词袋”模型)。词汇空间构建器216可以使用例如挑选列表,利用感兴趣的一个或多个项来扩充数学模型。语言模型230可以被体现为例如数据库、查找表或计算机文件,所述数据库、查找表或计算机文件包含在语言(例如,美式英语)中使用的词的列表和指示在语言的使用中每一个词的出现频率的数据。作为开放的源资源的可用的语言模型的示例是WORDNET。正如在本文中所使用的,“词袋”除了其它事物以外可以指将文档表示为向量的数学模型的类型,在向量中的每一个位置表示词项(例如,词)在文档中出现的数量。
一旦低多义性词项从语料库126中被提取,词汇空间构建器216就可以进一步完善词项的所提取的集合,以聚焦于“不平常的”词或项,例如,可以指示计算设备用户的特定兴趣或专业知识的领域的词。为了完成所述功能,词汇空间构建器216分析所提取的词项(例如,词或项)的语料库频率和语言频率,并且基于语料库频率和语言频率来选择所提取的词项的子集。更具体地,词汇空间构建器216可以包括在所提取的词项的子集中只具有低语料库频率和低语言频率二者的那些词或项(其中语料库频率可以指语料库126中的词或项出现的频率,而语言频率可以指在语言模型230中出现的频率)。在一些实施例中,语料库频率和语言频率可以根据词袋模型来确定。以这种方式,用于找到连接推荐的所提取的词项的子集可以只包括在用户的语料库126中找到的具有低语料库频率和低语言频率二者的低多义性词项。上面描述的分析的特定组合可以被称为“修改的文档频率”。
作为内容分析的部分或作为单独的过程,举例示出的内容特性提取模块212从用户内容122、160提取一个或多个主题,或词汇空间构建器216使用算法主题提取技术来对语料库126执行主题提取。正如在本文中所使用的,“主题”除了其它事物以外可以指包含在用户内容122、160中并且被确定为感兴趣的(例如,基于语言频率或语料库频率)词或其它词项。主题还可以指描述了实际上出现在用户内容122、160中的一个或多个词项但其本身实际上不出现在用户内容122、160中的另一词项。例如,主题可以是不出现在用户内容122、160中的、但表示包含在用户内容122、160中的一个或多个词项的含义的词项(虽然在更具体的或更抽象的级别)。同样,在一些实施例中,主题可以包括从实际用户内容122、160得到的类别、类型或标签。
社会网络标识符模块228识别由连接推荐系统136、174使用的社会图226,以得到参与在系统136、174中的计算设备用户中的每一个的社会网络数据。例如,如果连接推荐系统136、174与一个或多个外部服务连接以得到社会网络数据,则社会网络标识符模块228可以创建并且维持用户所属于的所有社会网络服务172的列表和/或用户使用的电子邮件服务的列表。社会网络标识符模块228可以向用户直接请求这样的信息(例如,经由用户接口子系统134)和/或可以通过自动化技术的使用(例如,经由软件服务提供商所提供的应用编程接口或API)来得到这样的信息。另一方面,如果连接推荐系统136、174被合并为社会网络服务172的部分,则社会网络标识符模块228可以提供社会图226的部分用于由系统136、174使用或提供用于访问社会图226的机制(例如,功能调用)。
用户简档发生器214生成参与在系统136、174中的计算设备用户中的每一个计算设备用户的用户特定简档130、168。用户简档发生器214还可以响应于用户反馈232时时地更新用户简档130、168,所述用户反馈232可以由连接推荐系统136、174经由例如用户接口子系统134来接收或得到。
连接发生器模块220基于用户简档130、168和上面描述的所提取的词项的子集时时地生成参与在系统1136、174中的计算设备用户的连接推荐224。更具体地,至少部分地从由词汇空间构建器216所执行的内容分析以及可以从由社会网络标识符模块228所识别的服务中得到的社会图226中得到连接推荐224。在一些实施例中,连接发生器模块220利用从上下文提取模块218得到的上下文信息和/或从内容特性提取模块212得到的内容特性信息来过滤连接推荐224。例如,连接发生器模块220可以将社会图226修整为只包括出现在与当前用户相同的地理位置处的人,或修整为只包括其用户内容122证明与当前用户的内容相同类型的风格品质的人。
聚集模块222对参与在系统136、174中的计算设备用户的所提取的词项的子集在算法上执行内容聚集。为了完成所述功能,举例示出的聚集模块222计算在所提取的词项的子集之间的内容相似性(例如,词汇和/或语义相似性)的度量,并且基于所计算的语义相似性来聚集所提取的词项的子集。所有参与的用户的所提取的词项的子集可以从例如词汇空间166和/或语料库164得到。作为示例,如果在所提取的词项的子集之间的词汇和/或语义距离较短,则所提取的词项的两个或多个子集可以聚集在一起。相反,如果在所提取的词项的两个子集之间的词汇和/或语义距离较长,则所述子集不可以聚集在一起。正如在本文中所使用的,“聚集”除了其它事物以外可以指数学算法的执行,以基于语义和/或词汇相似性来对所提取的词项的子集进行分组。为了计算在所提取的词项的子集之间的词汇和/或语义距离,可以使用本体论、图和/或统计方法。例如,使用层次本体论,可以通过确定在本体论中的节点或“概念”之间的链接的数量来计算词汇和/或语义距离(例如,更多的链接的数量指示更长的距离)。
基于由聚集模块222执行的聚集和由用户简档130、168、内容特性提取模块212和/或上下文提取模块218(如果有)提供的其它信息,连接发生器模块220识别连接候选的集合。所述连接候选的集合可以包括例如成对的或成组的计算设备用户,所述计算设备用户的所提取的词项的集合聚集在一起,如由聚集模块222所确定的。连接发生器模块220参考社会图226以确定连接候选中的任何是否在关系上是接近的(如由社会图226所指示的)。连接发生器模块220使用社会图226来“修整”连接候选的集合,以便根据社会图226从连接候选的集合中移除在关系上与用户接近的个人。一旦将连接候选的集合修整为仅包括或主要包括与彼此或与用户在关系上较远的人,则连接发生器模块220生成连接推荐224。
在修整社会图或生成连接推荐224时,连接发生器模块220可以考虑由上下文提取模块218针对每一个用户提供的上下文数据124。对于单独的用户,上下文提取模块218周期性地或响应于触发动作(例如,来自链接发生器模块220的请求),而从传感器132得到上下文数据124,并且将它格式化,用于由连接发生器模块220使用(按需要使用例如模数转换器和/或信号处理技术)。如上所述,上下文数据124可以在所有用户中聚合,并且被存储为上下文数据166。同样,连接发生器模块220可以通过比较在多个用户当中(例如,在所有连接候选当中)的上下文数据124并且创建只包括具有相似的上下文数据124的那些连接候选的连接候选的子集,来使用上下文作为过滤器。以这种方式,连接推荐224可以取决于计算设备用户的当前上下文而不同地生成。换句话说,连接推荐224基于在上下文数据124中的变化,可以是不固定的、连续地进化的。作为示例,取决于用户和/或连接候选中的一个或多个是否由上下文提取模块218检测为在信息科学会议上或在孩子的足球比赛处,连接发生器模块220可以利用不同的社会图226或不同地修整连接候选的集合。
连接推荐224可以包括识别了参与在系统136、174中的计算设备用户的对、组或组合(通过例如人的名字或用户名)的信息以及用户或计算系统100可以执行连接推荐224的手段(例如通过用户可选择的图形控制按钮)。如果连接推荐224包括多于一个推荐的用户,则所推荐的用户的列表可以基于例如关系距离或语义距离来进行排序或划分等级。例如,较大程度的关系距离或较高程度的语义相似性可以增加列表中所推荐的连接的等级,反之亦然。在其它实施例中,虽然连接推荐系统136、174主要目的在于基于用户生成的内容122、160的语义分析来建议连接,但是连接推荐系统136、174分析用户的打字活动的性质和/或作者品质,并且这样的分析被用于生成连接推荐224。
现在参考图3,示出了用于生成连接推荐224的方法300的示例。方法300的部分可以由计算系统100;例如由客户端计算设备110和/或服务器计算设备150执行。在块310,计算系统100识别计算设备用户的集合中的计算设备用户,针对所述计算设备用户来生成连接推荐224。为了完成所述功能,计算系统100得到用户识别信息,例如,用户名、设备标识符(例如,国际移动设备识别码或IMEI)、或网络地址(例如,介质访问控制或MAC地址、互联网协议或IP地址等)。用户识别信息可以由计算系统100例如在用户登录时得到。计算设备用户的集合可以由计算系统100通过例如参考参与在系统136、174中的计算设备用户的列表来进行限定。计算设备用户可以由于通过向协作的在线服务(例如,社会网络服务172)的用户之前的注册或通过其它方法向系统136、174注册成为经授权用户,作为结果而“参与”在系统136、174中。例如,在一些实施例中,计算设备用户可以明确地“决定参加”系统136、174,而在其它实施例中,计算设备用户可以作为他们使用另一服务(并且可以被提供“决定参加”系统136、174的机会)的结果来参与在系统136、174中。
在块312,计算系统100出于生成连接推荐的目的而选择待分析的用户内容122、160。用户内容122、160可以包括结构化和/或非结构化的内容。在块314,计算系统100可以将上下文和/或内容特性过滤器应用于选定的内容。例如,为了选择用户内容或过滤选定的内容,计算系统100可以使用暂时性标准(例如,最近生成的内容);内容类型标准(例如,文档而不是博客帖子;电子邮件而不是文本消息等);应用类型标准(例如,社会媒体而不是消息传递或照片共享)、主题标准(例如,仅产品X)或用于限定待分析的用户内容的范围的任何其它适当的标准。作为用户输入(通过例如用户接口子系统134)的结果,或例如通过预先配置连接推荐系统136、174,计算系统100可以确定可应用的选择和/或过滤标准。可替换地或另外,上下文数据124、162可以用于选择或过滤待分析的用户内容。选定的(和过滤的、作为可应用的)用户内容122、160存储在用户语料库126中或通过用户语料库126引用。
在一些语言中,与词(多义性)相关联的含义的数量和词在语言中词出现的频率(语言频率)是高度相关的。也就是说,在统计上更可能的是,频繁使用的词将具有很多含义。例如,词“horse”在Collins字典(其应该是简单的字典)中具有超过10个词义,包括:动物、体操设备、棋子、骑兵和其它。Horse在英语语言中也是相对频繁的词。因此,计算系统100的实施例通过将文档分析聚焦于较低频率词来在意义上区分词或搭配的词。例如,计算系统100可以将更高的权重分配给具有更低语言频率的词。
在一些情况下,词可以在语料库126中只出现一次。这被称为“一次频词”。这些词虽然是频繁的,但可以不指示在用户内容122、160中的特定概念的强烈存在。例如,在小说《Moby Dick》(英语语言中最长的小说之一,有超过200,000个不同的词)中大约44%的词是一次频词,并且另外17%的词只出现两次。为了容纳一次频词,计算系统100的实施例可以将文档分析聚焦于语言中更低频率的词(通过例如至少部分地基于词的稀有性来选择词的子集并且增加较稀有的词的权重)。块318、320的输出是从用户的语料库126提取的词项(例如,词)的子集,并且包括一个或多个低多义性、低语言频率、低语料库频率词项。
在块318、320,计算系统100至少部分地基于在块312创建的用户语料库126,使用文档分析技术来构建词汇空间128、166。例如,计算系统100从语料库提取文本、丢弃频繁使用的词(例如,高多义性词),并且将更高的权重值分配给较不频繁使用的词(例如,低多义性词)。频繁出现在语料库126中的稀有的(低多义性)词可以由计算系统100使用,来识别感兴趣的主题。在块320,计算系统100在算法上识别具有低语言频率和低语料库频率的所提取的低多义性词的子集。为了识别或创建子集,计算系统100可以例如调节(例如,增加)具有低语言频率的所提取的词项的权重值。
在块316,计算系统100识别将用于过滤由系统136、174所创建的连接候选的集合的社会网络数据。在一些实施例中,如块316所描绘的功能可以由计算系统100连同块312和/或块318的功能共同执行。为了完成所述功能,计算系统100可以直接访问用户的社会图226(例如,在连接推荐系统136、174被合并到现有的社会网络服务中的实施例中),或计算系统100可以通过例如应用编程接口(API)来访问关于潜在的连接的信息(例如,在计算机文件中或由外部社会媒体服务维持的联系人列表或社会图)。在块322,计算系统100创建用于用户的用户简档,所述用户简档识别在块318、320从用户内容得到的词项的子集,并且还包括在块316得到的社会网络信息。在一些实施例中,用户简档可以包括其它信息,例如由用户提供的结构化信息(例如,个人偏好、人口统计信息等)、上下文数据124和/或由内容特性提取模块212从用户内容提取的内容特性信息。
在块324,计算系统100使用本文所公开的技术生成一个或多个连接推荐。在块326,执行一个或多个内容聚集算法用于找到例如由网络上的其它计算设备用户开发或访问的内容以及以由本文描述的“修改的文档频率”方法所指示的方式在语义上类似于用户自己内容的内容。换句话说,计算系统100将内容聚集聚焦于在块318、320中识别出的低多义性词。为了完成所述功能,举例示出的计算系统100应用一个或多个聚集算法以计算在块318、320针对用户创建的词项的子集与针对参与在系统136、174中的其它计算设备用户类似地创建的词项的子集之间的语义距离。聚集算法和技术的一些示例是CLIQUE、SUBCLU、OSCLU和潜在的Dirichlet分配。
在块328,计算系统100基于在块326执行的内容聚集来生成连接候选的集合。基于在块326计算的语义距离的长度来生成连接候选的集合。例如,如果两个用户相应的所提取的词项的子集之间的语义距离较短,则计算系统可以将所述用户对添加到连接候选的集合中,作为所述对中的用户的任意一个或两个的连接候选。计算系统100通过例如得到与所聚集的内容相关联的用户标识符(例如,文档上的作者名字、消息发送者标识符等)来识别与所聚集的内容相关联的用户。用户识别信息可以包含在例如与所聚集的内容相关联的或附加到所聚集的内容的元标签。在块330,计算系统100可以对连接候选的集合执行上下文或内容特性过滤。例如,计算系统100可以从连接候选的集合中移除其上下文数据与用户的当前上下文不匹配的任何连接候选,或将其上下文数据与用户的当前上下文匹配的连接候选添加到连接候选的集合。为了完成所述功能,计算系统100可以轮询传感器132中的一个或多个。如果传感器数据是可用的,则计算系统100从传感器数据中提取上下文数据124。例如,计算系统100可以从传感器数据中得到位置坐标或地理信息的其它指示符,并且通过例如与地理地图软件连接来确定用户的可能的当前位置。在一些实施例中,地理位置数据和其它上下文数据124可以由在客户端计算设备110上运行的另一软件应用揭露。正如在本文中所使用的,“上下文数据”除了其它事物以外可以包括所感测的数据或从传感器数据得到的信息(例如,地理位置、接近度等)以及输出的文本聚集。
在块332,计算设备从连接候选的集合中移除在社会图226中被确定为在关系上接近用户的那些连接候选。换句话说,计算系统100可以使用在块316得到的设备图226来删掉已经在用户的社会圈子内的连接候选。为了完成所述功能,计算系统100可以基于在社会图226中的人们关系距离来权衡人们之间的链接,使得如果人们在关系上是接近的(例如,在一个程度度或两个程度内),则分配给所述链接的权重将较低。如果在社会图226中人们在关系上较远,则较高的权重可以被分配给链路。在分析结束时,计算系统100从连接候选的列表中移除具有低权重链接的那些候选,并且只有在关系上离用户较远的那些候选人被考虑用于连接推荐。以这些和其它方式,计算系统100将语义聚集工具与社会图226进行组合,以破坏朝向割据的趋势(例如,通过有效地实现已经存在的连接而将个人的世界保持为较小的社会网络的倾向)。
在一些实施例中,不是以二进制方式(例如,如指示“强”联系或“弱”联系)来解释社会连接,计算系统100使用连接强度作为“连续”变量,使得在任何给定的时间点,对于任何单个人,与另一人的关系可能是潜在地不可知的,并且不断地改变的接近度和距离的组合。换句话说,由计算系统100分配给在用户和连接候选之间的任何给定链接的权重可以是可变的,例如基于例如上下文数据124而随着时间的过去而调节。
计算系统100在块334向用户呈现连接推荐(经由例如用户接口子系统134)并且在块336响应于连接推荐的呈现而得到或观察(例如,经由客户端计算设备110的触摸屏或照相机)用户反馈232。例如,计算系统100可以捕获关于连接建议是否是有用或适当的隐式的或显式的用户反馈。在块338,计算系统100可以更新用户简档以例如包括在块336从用户反馈得到的信息。例如,计算系统100可以响应于用户反馈来修改所提取的词项的子集或不同地修整社会图。
计算系统100被设计为基于用户可能不知道的用于寻找的共同性,例如用于讨论特定的主题或具有共同的特定写作风格的共同拥有的特性,来帮助用户找到关系。作为示例,假设大公司的雇员想通过找到面对类似的问题的其他雇员,以有助于他们的工作。如果雇员中的一个具有通过供应商向外国的教育部门销售教育技术的已有经历,则这个信息可能是有用的,即使很难做到以使其它人很容易发现的结构化方式(例如,在“专长列表”上)来明确地捕获。此外,可能不存在可以以简明的、可容易地搜索的形式来充分地传达专长的类型的词或短语(例如,关键字)。在这些和其它情况中,计算系统100可以使具有专长的人能够与寻求相同类型的专长的其他人建立连接,同时避免以结构化的方式明确地限定专长的领域以及对系统的需要的耗费时间的任务。
示例
下面提供了本文公开的技术的举例示出的示例。技术的实施例可以包括下面描述的示例的中的任何一个或多个以及其任何组合。
示例1包括用于生成连接推荐的计算设备,所述计算设备针对计算设备用户的集合中的计算设备用户包括:用于将用户生成的电子内容包括在语料库中的语料库开发模块;词汇空间构建器模块,其用于从语料库中选择具有低语料库频率和低语言频率的低多义性词项;聚集模块,其用于对选定的子集和在所述用户集合中的其他用户的所提取的词项的子集来执行内容聚集;以及连接发生器模块,其用于(i)至少部分地基于内容聚集来识别包括所述用户的集合中的其他用户中的一个或多个的连接候选的集合,(ii)从所识别的连接候选的集合中移除具有到用户的较短关系距离的连接候选;以及(iii)呈现了连接推荐,所述连接推荐识别了将具有到用户的较短关系距离的连接候选从连接候选的集合中移除之后余留在连接候选的集合中的连接候选的至少一个。
示例2包括示例1的主题,其中连接发生器模块用于接收由计算设备的传感器得到的上下文数据并且至少部分地基于上下文数据来修改连接推荐。
示例3包括示例1或示例2的主题,其中语料库开发模块用于接收包括由计算设备的传感器得到的数据的上下文数据,并且至少部分地基于上下文数据来选择用于包括在语料库中的用户生成的电子内容。
示例4包括示例1或示例2的主题,其中连接发生器模块用于至少部分地基于内容的特性来修改连接推荐,并且内容的特性由主题分析和风格分析中的一个或多个在算法上确定。
示例5包括示例1或示例2的主题,其中语料库开发模块至少部分地基于内容的特性来选择用户生成的电子内容,其中内容的特性由主题分析和风格分析中的一个或多个在算法上确定。
示例6包括示例1或示例2的主题,其中词汇空间构建器模块用于构建包括与计算设备用户的所有语料库中的多个词相对应的多个维度的多维空间,并且多维空间的维度中的每一个表示存在于语料库中的至少一个中的词项。
示例7包括示例1或示例2的主题,其中词汇空间构建器模块用于根据所提取的词项的语言频率来将权重分配给所提取的词项。
示例8包括示例1或示例2的主题,包括社会网络标识符模块,所述社会网络标识符模块用于针对计算设备用户中的每一个,识别计算设备用户的社会网络,其中连接发生器模块包含指示了来自所识别的社会网络的计算设备用户和连接候选之间的关系距离的数据。
示例9包括示例8的主题,包括用户简档发生器模块,所述用户简档发生器模块用于开发包括与所提取的词项的子集和所识别的社会网络相关的数据的用户简档,其中连接发生器模块至少部分地基于用户简档来生成连接推荐。
示例10包括示例1或示例2的主题,其中用户生成的电子内容包括自然语言输入。
示例11包括示例1或示例2的主题,其中聚集模块用于计算在计算设备用户对的所提取的词项的子集之间的数字距离。
示例12包括示例1或示例2的主题,其中如果在计算设备用户对的所提取的词项的子集之间的所计算的数字距离较短,则连接发生器模块用于生成连接推荐。
示例13包括用于生成连接推荐的方法,该方法包括针对在计算设备用户的集合中的计算设备用户:将用户生成的电子内容包括在语料库中;从语料库选择具有低语料库频率和低语言频率的低多义性词项;对选定的子集和所述用户的集合中的其他用户的所提取的词项的子集执行内容聚集;至少部分地基于内容聚集来识别包括所述用户的集合中的其他用户中的一个或多个的连接候选的集合;从所识别的连接候选的集合中移除具有到用户的较短关系距离的连接候选;以及呈现连接候选,所述连接候选识别了将具有到用户的较短关系距离的连接候选从连接候选的集合中移除之后余留在连接候选的集合中的连接候选中的至少一个。
示例14包括示例13的主题,并且包括接收由计算设备的传感器得到的上下文数据并且至少部分地基于上下文数据来修改连接推荐。
示例15包括示例13的主题,并且包括接收由计算设备的传感器得到的上下文数据,并且至少部分地基于上下文数据来选择用户生成的电子内容。
示例16包括示例13的主题,并且包括至少部分地基于内容的特性来修改连接推荐,并且内容的特性由主题分析和风格分析中的一个或多个在算法上确定。
示例17包括示例13的主题,并且包括至少部分地基于内容的特性来选择用户生成的电子内容,其中内容的特性由主题分析和风格分析中的一个或多个在算法上确定。
示例18包括示例13的主题,并且包括限定多维空间,以包括与计算设备用户的集合中的所有计算设备用户的所有语料库中的多个词项相对应的多个维度,并且将每一个维度限定为表示在语料库中的至少一个中存在的词项。
示例19包括示例13的主题,并且包括根据所提取的词项的语言频率,将权重分配给所提取的词项。
示例20包括示例13的主题,并且包括识别计算设备用户的社会网络,并且得到指示了来自所识别的社会网络的计算设备用户和连接候选之间的关系距离的数据。
示例21包括示例20的主题,并且包括开发用户简档,所述用户简档包括与所提取的词项的子集和所识别的社会网络相关的数据,并且至少部分地基于用户简档生成连接推荐。
示例22包括示例13的主题,其中用户生成的电子内容包括自然语言输入。
示例23包括示例13的主题,并且包括计算在计算设备用户对的所提取的词项的子集之间的数字距离。
示例24包括示例13的主题,并且包括如果在计算设备用户对的所提取的词项的子集之间的所计算的数字距离较短,则生成连接推荐。
示例25包括包含存储器的计算设备,所述存储器在其中存储有多个指令,当由计算设备执行所述指令时使计算设备执行示例13-24中的任何的方法。
示例26包括一个或多个机器可读存储介质,所述一个或多个机器可读存储介质包括其上存储的多个指令,响应于执行所述多个指令引起计算设备执行示例13-24中的任何的方法。
示例27包括计算设备,所述计算设备包括用于执行示例13-24中的任何的方法的单元。
示例28包括用于生成连接推荐的计算设备,所述计算设备包括针对在计算设备用户的集合中的计算设备用户:用于将用户生成的电子内容包括在语料库中的单元;用于从语料库中选择具有低语料库频率和低语言频率的低多义性词项的单元;用于对选定的子集和所述用户的集合中的其他用户的所提取的词项的子集执行内容聚集的单元;用于至少部分地基于内容聚集来识别包括所述用户的集合中的其他用户中一个或多个的连接候选的集合的单元;用于从所识别的连接候选的集合中移除具有到用户的较短关系距离的连接候选的单元;以及用于呈现连接推荐的单元,所述连接推荐识别了将具有到用户的较短关系距离的连接候选从连接候选的集合中移除之后余留在连接候选的集合中的连接候选中的至少一个。
示例29包括示例28的主题,并且包括用于接收由计算设备的传感器得到的上下文数据的单元和用于至少部分地基于上下文数据来修改连接推荐的单元。
示例30包括示例28的主题,并且包括用于接收由计算设备的传感器得到的上下文数据的单元,和用于至少部分地基于上下文数据来选择用户生成的电子内容的单元。
示例31包括示例28的主题,并且包括用于至少部分地基于内容的特性来修改连接推荐的单元,其中内容的特性由主题分析和风格分析中的一个或多个在算法上确定。
示例32包括示例28的主题,并且包括用于至少部分地基于内容的特性来选择用户生成的电子内容的单元,其中内容的特性由主题分析和风格分析中的一个或多个在算法上确定。
示例33包括示例28的主题,并且包括用于将多维空间限定为包括与计算设备用户的集合中的所有计算设备用户的所有语料库中的多个词项相对应的多个维度的单元,以及用于将每一个维度限定为表示在至少一个语料库中存在的词项的单元。
示例34包括示例28的主题,并且包括用于根据所提取的词项的语言频率将权重分配给所提取的词项的单元。
示例35包括示例28的主题,并且包括用于识别计算设备用户的社会网络的单元,和用于得到指示了来自所识别的社会网络的计算设备用户和连接候选之间的关系距离的数据的单元。
示例36包括示例20的主题,并且包括用于开发用户简档的单元,所述用户简档包括与所提取的词项的子集和所识别的社会网络相关的数据,以及用于至少部分地基于用户简档来生成连接推荐的单元。
示例37包括示例28的主题,其中用户生成的电子内容包括自然语言输入。
示例38包括示例28的主题,并且包括用于计算计算设备用户对的所提取的词项的子集之间的数字距离的单元。
示例39包括示例28的主题,并且包括用于如果在计算设备用户对的所提取的词项的子集之间所计算的数字距离较短,则连接发生器模块生成连接推荐的单元。
示例40包括一个或多个机器可读存储介质,所述一个或多个机器可读存储介质包括存储在其上的多个指令,响应于执行所述指令引起在计算设备中:将用户生成的电子内容包括在语料库中;从语料库中选择具有低语料库频率和低语言频率的低多义性词项;对选定的子集和所述用户的集合中的其他用户的所提取的词项的子集执行内容聚集;至少部分地基于内容聚集来识别包括所述用户的集合中的其他用户中的一个或多个的连接候选的集合;从所识别的连接候选的集合中移除具有到用户的较短关系距离的连接候选;以及呈现连接推荐,所述连接推荐识别了将具有到用户的较短关系距离的连接候选从连接候选的集合中移除之后余留连接候选的集合中的连接候选的至少一个。
示例41包括示例40的主题,其中指令引起计算设备接收由计算设备的传感器得到的上下文数据并且至少部分地基于上下文数据来修改连接推荐。
示例42包括示例40的主题,其中指令引起计算设备接收由计算设备的传感器得到的上下文数据并且至少部分地基于上下文数据来选择用户生成的电子内容。
示例43包括示例40的主题,其中指令引起计算设备至少部分地基于内容的特性来修改连接推荐,其中内容的特性由主题分析和风格分析中的一个或多个在算法上确定。
示例44包括示例40的主题,其中指令引起计算设备至少部分地基于内容的特性来选择用户生成的电子内容,其中内容的特性由主题分析和风格分析中的一个或多个在算法上确定。
示例45包括示例40的主题,其中指令引起计算设备根据所提取的词项的语言频率将权重分配给所提取的词项。
示例46包括示例40的主题,其中指令引起计算设备识别计算设备用户的社会网络并且得到指示了来自所识别的社会网络的计算设备用户和连接候选之间的关系距离的数据。
示例47包括示例46的主题,其中指令引起计算设备开发用户简档,所述用户简档包括与所提取的词项的子集和所识别的社会网络相关的数据,并且至少部分地基于用户简档来生成连接推荐。
示例48包括示例40的主题,其中指令引起计算设备计算在计算设备用户对的所提取的词项的子集之间的数字距离。
示例49包括示例40的主题,其中如果在计算设备用户对的所提取的词项的子集之间所计算的数字距离较短,则指令引起计算设备生成连接推荐。
Claims (20)
1.一种用于生成连接推荐的计算设备,针对计算设备用户的集合中的计算设备用户,所述计算设备包括:
将用户生成的电子内容包括在语料库中的语料库开发模块;
词汇空间构建器模块,其用于从所述语料库中选择具有低语料库频率和低语言频率的低多义性词项;
聚集模块,其对所选择的子集和在所述用户的集合中的其他用户的所提取的词项的子集执行内容聚集;以及
连接发生器模块,其用于(i)至少部分地基于所述内容聚集来识别包括所述用户的集合中的一个或多个所述其他用户的连接候选的集合;(ii)从所识别的连接候选的集合中移除具有到所述用户的较短关系距离的连接候选;以及(iii)呈现连接推荐,所述连接推荐识别了将具有到所述用户的较短关系距离的所述连接候选从所述连接候选的集合中移除之后余留在所述连接候选的集合中的至少一个连接候选。
2.如权利要求1所述的计算设备,其中,所述连接发生器模块用于接收由所述计算设备的传感器得到的上下文数据,并且至少部分地基于所述上下文数据来修改所述连接推荐。
3.如权利要求1所述的计算设备,其中,所述语料库开发模块用于接收包括由所述计算设备的传感器得到的数据的上下文数据,并且至少部分地基于所述上下文数据来选择用于包括在所述语料库中的所述用户生成的电子内容。
4.如权利要求1所述的计算设备,其中,所述连接发生器模块用于至少部分地基于所述内容的特性来修改所述连接推荐,并且所述内容的特性由主题分析和风格分析中的一个或多个在算法上确定。
5.如权利要求1所述的计算设备,其中,所述语料库开发模块至少部分地基于所述内容的特性来选择所述用户生成的电子内容,其中,所述内容的特性由主题分析和风格分析中的一个或多个在算法上确定。
6.如权利要求1所述的计算设备,其中,所述词汇空间构建器模块用于构建包括与所述计算设备用户的所有语料库中的多个词相对应的多个维度的多维空间,并且所述多维空间的维度中的每一个表示在所述语料库中的至少一个中存在的词项。
7.如权利要求1所述的计算设备,其中,所述词汇空间构建器模块用于根据所提取的词项的语言频率将权重分配给所提取的词项。
8.如权利要求1所述的计算设备,包括社会网络标识符模块,其用于针对所述计算设备用户中的每一个来识别所述计算设备用户的社会网络,其中,所述连接发生器模块得到指示了在来自所识别的社会网络的所述计算设备用户和所述连接候选之间的关系距离的数据。
9.如权利要求8所述的计算设备,包括用户简档发生器模块,其用于开发包括与所提取的词项的子集和所识别的社会网络相关的数据的用户简档,其中,所述连接发生器模块用于至少部分地基于所述用户简档来生成所述连接推荐。
10.如权利要求1所述的计算设备,其中,所述用户生成的电子内容包括自然语言输入。
11.如权利要求1所述的计算设备,其中,所述聚集模块用于计算在计算设备用户对的所提取的词项的子集之间的数字距离。
12.如权利要求1所述的计算设备,其中,如果计算出的在计算设备用户对的所提取的词项的子集之间的数字距离较短,则所述连接发生器模块用于生成所述连接推荐。
13.一种用于生成连接推荐的系统,所述系统包括:
用于将用户生成的电子内容包括在语料库中的单元;
用于从所述语料库中选择具有低语料库频率和低语言频率的低多义性词项的单元;
用于对所选择的子集和所述用户的集合中的其他用户的所提取的词项的子集执行内容聚集的单元;
用于至少部分地基于所述内容聚集来识别包括所述用户的集合中的一个或多个其他用户的连接候选的集合的单元;
用于从所识别的连接候选的集合中移除具有到所述用户的较短关系距离的连接候选的单元;以及
用于呈现连接推荐的单元,所述连接推荐识别了将具有到所述用户的较短关系距离的所述连接候选从所述连接候选的集合中移除之后余留在所述连接候选的集合中的至少一个连接候选。
14.如权利要求13所述的系统,包括:用于接收由所述计算设备的传感器得到的上下文数据的单元;以及用于至少部分地基于所述上下文数据来修改所述连接推荐的单元。
15.如权利要求13所述的系统,包括:用于接收由所述计算设备的传感器得到的上下文数据的单元;以及用于至少部分地基于所述上下文数据来选择所述用户生成的电子内容的单元。
16.如权利要求13所述的系统,包括用于至少部分地基于所述内容的特性来修改所述连接推荐的单元,其中,所述内容的特性由主题分析和风格分析中的一个或多个在算法上确定。
17.如权利要求13所述的系统,包括用于至少部分地基于所述内容的特性来选择所述用户生成的电子内容的单元,其中,所述内容的特性由主题分析和风格分析中的一个或多个在算法上确定。
18.如权利要求13所述的系统,包括用于根据所提取的词项的语言频率将权重分配给所提取的词项的单元。
19.如权利要求13所述的系统,包括:用于识别所述计算设备用户的社会网络的单元;以及用于得到指示了在来自所识别的社会网络的所述计算设备用户和所述连接候选之间的关系距离的数据的单元。
20.如权利要求13所述的系统,包括:用于计算在计算设备用户对的所提取的词项的子集之间的数字距离的单元;以及用于如果计算出的在计算设备用户对的所提取的词项的子集之间的数字距离较短,则生成所述连接推荐的单元。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461928987P | 2014-01-17 | 2014-01-17 | |
US61/928,987 | 2014-01-17 | ||
US14/308,124 US10002127B2 (en) | 2014-01-17 | 2014-06-18 | Connecting people based on content and relational distance |
US14/308,124 | 2014-06-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104794145A true CN104794145A (zh) | 2015-07-22 |
CN104794145B CN104794145B (zh) | 2019-09-13 |
Family
ID=52003590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410788521.8A Expired - Fee Related CN104794145B (zh) | 2014-01-17 | 2014-12-17 | 基于内容和关系距离来连接人们 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10002127B2 (zh) |
EP (1) | EP2897086A1 (zh) |
JP (1) | JP6404106B2 (zh) |
KR (1) | KR20150086441A (zh) |
CN (1) | CN104794145B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110753158A (zh) * | 2019-10-12 | 2020-02-04 | 上海赛连信息科技有限公司 | 一种智能呼叫记录方法和装置 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10019995B1 (en) | 2011-03-01 | 2018-07-10 | Alice J. Stiebel | Methods and systems for language learning based on a series of pitch patterns |
US11062615B1 (en) | 2011-03-01 | 2021-07-13 | Intelligibility Training LLC | Methods and systems for remote language learning in a pandemic-aware world |
US20150262264A1 (en) * | 2014-03-12 | 2015-09-17 | International Business Machines Corporation | Confidence in online reviews |
US9852131B2 (en) * | 2015-05-18 | 2017-12-26 | Google Llc | Techniques for providing visual translation cards including contextually relevant definitions and examples |
US10089389B1 (en) * | 2015-09-30 | 2018-10-02 | EMC IP Holding Company LLC | Translation of unstructured text into semantic models |
US10681169B2 (en) * | 2015-12-08 | 2020-06-09 | Facebook, Inc. | Social plugin reordering on applications |
US20220366072A1 (en) * | 2016-03-29 | 2022-11-17 | Dell Products L.P. | Search engine using causal replacement of search results for unprivileged access rights |
US10671615B2 (en) * | 2016-05-27 | 2020-06-02 | Facebook, Inc. | Methods and systems for assigning affinity scores to contacts |
US10360643B2 (en) | 2016-10-07 | 2019-07-23 | International Business Machines Corporation | Distance-based social message pruning |
US10346442B2 (en) * | 2016-11-17 | 2019-07-09 | International Business Machines Corporation | Corpus management by automatic categorization into functional domains to support faceted querying |
US11456990B2 (en) * | 2019-04-25 | 2022-09-27 | Project Affinity, Inc. | Managing connection strengths using alliance data |
US20220327637A1 (en) * | 2021-04-12 | 2022-10-13 | Microsoft Technology Licensing, Llc | Interaction based social distance quantification |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130166648A1 (en) * | 2011-12-21 | 2013-06-27 | Parta Dialogue Inc. | System and method for measuring and improving the efficiency of social media campaigns |
CN103218400A (zh) * | 2013-03-15 | 2013-07-24 | 北京工业大学 | 基于链接与文本内容的网络社区用户群划分方法 |
CN103399877A (zh) * | 2013-08-19 | 2013-11-20 | 四川公用信息产业有限责任公司 | 一种多Android客户端服务共享方法及系统 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8010460B2 (en) * | 2004-09-02 | 2011-08-30 | Linkedin Corporation | Method and system for reputation evaluation of online users in a social networking scheme |
JP2006215681A (ja) | 2005-02-02 | 2006-08-17 | Matsushita Electric Ind Co Ltd | 文書内容把握支援システム |
US20070073678A1 (en) * | 2005-09-23 | 2007-03-29 | Applied Linguistics, Llc | Semantic document profiling |
KR100810999B1 (ko) | 2006-06-30 | 2008-03-11 | 엔에이치엔(주) | 온라인 이메일 서비스 시스템 및 그 방법 |
US7734641B2 (en) * | 2007-05-25 | 2010-06-08 | Peerset, Inc. | Recommendation systems and methods using interest correlation |
US7917496B2 (en) * | 2007-12-14 | 2011-03-29 | Yahoo! Inc. | Method and apparatus for discovering and classifying polysemous word instances in web documents |
US9195752B2 (en) * | 2007-12-20 | 2015-11-24 | Yahoo! Inc. | Recommendation system using social behavior analysis and vocabulary taxonomies |
US9602444B2 (en) * | 2009-05-28 | 2017-03-21 | Google Inc. | Participant suggestion system |
US8606792B1 (en) * | 2010-02-08 | 2013-12-10 | Google Inc. | Scoring authors of posts |
US9311308B2 (en) * | 2010-10-29 | 2016-04-12 | Hewlett-Packard Development Company, L.P. | Content recommendation for groups |
US8589399B1 (en) * | 2011-03-25 | 2013-11-19 | Google Inc. | Assigning terms of interest to an entity |
US20140099623A1 (en) * | 2012-10-04 | 2014-04-10 | Karmarkar V. Amit | Social graphs based on user bioresponse data |
CA2844903A1 (en) | 2011-08-12 | 2013-02-21 | School Improvement Network, Llc | Automatic determination of user alignments and recommendations for electronic resources |
US11620719B2 (en) * | 2011-09-12 | 2023-04-04 | Microsoft Technology Licensing, Llc | Identifying unseen content of interest |
US9607077B2 (en) * | 2011-11-01 | 2017-03-28 | Yahoo! Inc. | Method or system for recommending personalized content |
US20130275429A1 (en) * | 2012-04-12 | 2013-10-17 | Graham York | System and method for enabling contextual recommendations and collaboration within content |
US8566866B1 (en) * | 2012-05-09 | 2013-10-22 | Bluefin Labs, Inc. | Web identity to social media identity correlation |
JP6064376B2 (ja) | 2012-06-06 | 2017-01-25 | ソニー株式会社 | 情報処理装置、コンピュータプログラムおよび端末装置 |
US9075898B1 (en) * | 2012-08-10 | 2015-07-07 | Evernote Corporation | Generating and ranking incremental search suggestions for personal content |
US9280534B2 (en) * | 2012-11-19 | 2016-03-08 | Facebook, Inc. | Generating a social glossary |
US9317609B2 (en) * | 2013-03-14 | 2016-04-19 | FortyTwo, Inc. | Semantic vector in a method and apparatus for keeping and finding information |
-
2014
- 2014-06-18 US US14/308,124 patent/US10002127B2/en active Active
- 2014-11-25 EP EP14194775.4A patent/EP2897086A1/en not_active Withdrawn
- 2014-12-16 JP JP2014253550A patent/JP6404106B2/ja active Active
- 2014-12-16 KR KR1020140181787A patent/KR20150086441A/ko active Search and Examination
- 2014-12-17 CN CN201410788521.8A patent/CN104794145B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130166648A1 (en) * | 2011-12-21 | 2013-06-27 | Parta Dialogue Inc. | System and method for measuring and improving the efficiency of social media campaigns |
CN103218400A (zh) * | 2013-03-15 | 2013-07-24 | 北京工业大学 | 基于链接与文本内容的网络社区用户群划分方法 |
CN103399877A (zh) * | 2013-08-19 | 2013-11-20 | 四川公用信息产业有限责任公司 | 一种多Android客户端服务共享方法及系统 |
Non-Patent Citations (1)
Title |
---|
范明: ""聚类算法在Web挖掘中的应用"", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110753158A (zh) * | 2019-10-12 | 2020-02-04 | 上海赛连信息科技有限公司 | 一种智能呼叫记录方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN104794145B (zh) | 2019-09-13 |
KR20150086441A (ko) | 2015-07-28 |
JP2015135668A (ja) | 2015-07-27 |
US10002127B2 (en) | 2018-06-19 |
US20150205785A1 (en) | 2015-07-23 |
EP2897086A1 (en) | 2015-07-22 |
JP6404106B2 (ja) | 2018-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104794145A (zh) | 基于内容和关系距离来连接人们 | |
CN111782965B (zh) | 意图推荐方法、装置、设备及存储介质 | |
CN106133727B (zh) | 通过知识库促进的用户兴趣 | |
CN105247507B (zh) | 用于确定品牌的影响力得分的方法、系统和存储介质 | |
US9946775B2 (en) | System and methods thereof for detection of user demographic information | |
US20210288928A1 (en) | Determining engagement scores for sub-categories in a digital domain by a computing system | |
CN102929950A (zh) | 用于个性化搜索结果的社交网络推荐的内容和推荐成员 | |
US20140317078A1 (en) | Method and system for retrieving information | |
US20220394066A1 (en) | Systems and methods for managing distributed client device membership within group-based communication channels | |
Zou et al. | Exploring user engagement strategies and their impacts with social media mining: the case of public libraries | |
CN105512122B (zh) | 信息检索系统的排序方法及装置 | |
CN111967599A (zh) | 用于训练模型的方法、装置、电子设备及可读存储介质 | |
JP5048852B2 (ja) | 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体 | |
CN101523339A (zh) | 包括用户外形及域展示的查询方法与装置 | |
Yoon et al. | DiTeX: Disease-related topic extraction system through internet-based sources | |
KR20200060993A (ko) | 사용자 맞춤형 추천 콘텐츠 정보의 출력 방법 | |
Liao et al. | Data mining analytics investigate WeChat users’ behaviours: online social media and social commerce development | |
US20140244741A1 (en) | Computer-Implemented System And Method For Context-Based APP Searching And APP Use Insights | |
JP2008242689A (ja) | コンテンツ分類システム、サーバ、端末装置、プログラム、および記録媒体 | |
CN112348614B (zh) | 用于推送信息的方法和装置 | |
CN112269938A (zh) | 信息展示方法、装置、电子设备和存储介质 | |
JP7256562B1 (ja) | 知能生成システム、方法およびプログラム | |
Saranya et al. | Finding Reputed Items Based on Sentimental Analysis of User Reviews and Ratings | |
Jeeva et al. | CTRS-a Recommendation Scheme for Apps Based on Topic Discoverability and Personality Matching | |
Liang | Analyzing User Reviews of Messaging Apps: For Competitive Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190913 Termination date: 20191217 |