CN112532755A - 一种基于异构信息网络的兴趣列表推送系统 - Google Patents
一种基于异构信息网络的兴趣列表推送系统 Download PDFInfo
- Publication number
- CN112532755A CN112532755A CN202110186752.1A CN202110186752A CN112532755A CN 112532755 A CN112532755 A CN 112532755A CN 202110186752 A CN202110186752 A CN 202110186752A CN 112532755 A CN112532755 A CN 112532755A
- Authority
- CN
- China
- Prior art keywords
- information
- characters
- chat
- list
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及一种基于异构信息网络的兴趣列表推送系统,该系统包括:获取模块,用以获取用户的登录信息和关键字信息,建立模块,用以根据用户的登录信息建立信息矩阵I,确定模块,根据信息矩阵和登录信息确定当前用户的兴趣列表;推送模块,将该兴趣列表推送给第二用户,中央处理器,分别与获取模块、建立模块、确定模块以及推送模块连接,用以根据建立模块内的信息矩阵调整确定模块中的兴趣列表中的实时信息,将第一用户的兴趣列表推送给第二用户,实现对非注册人员的信息推送,有助于进行用户推广,另外由于第二用户接收到的推送信息可以获取自己感兴趣的列表,也方便了用户对信息的筛选和过滤,提高信息的传播效率。
Description
技术领域
本发明涉及信息处理领域,尤其涉及一种基于异构信息网络的兴趣列表推送系统。
背景技术
互联网规模和覆盖面的迅速增长带来了信息超载的问题,过量信息同时呈现使得用户无法从中获取对自己有用的部分,导致信息的使用效率反而降低。
异构信息网络( Heterogeneous Information Network,HIN) 通过网络模式指定了对象集合上的类型约束和关系约束,这些约束决定了异构信息网络是半结构化的,对人们探索网络语义起到了指导作用。但是国内外基于异构信息网络的推荐还处在初级阶段,个性化推荐系统作为解决信息超载的一个有力工具。
通常,个性化推荐系统的原理主要是通过信息筛选过滤无用信息,然后对有效的用户数据和用户行为进行分析处理,获取用户行为偏好,进而对不同用户进行个性化推荐,更好地满足了用户需求,深受用户喜爱。
但是现有的个性化推荐系统比较依赖于用户的数据或行为,对于不曾产生数据或行为的潜在用户则无法进行推荐,使得推送效果欠佳。
发明内容
为此,本发明提供一种基于异构信息网络的兴趣列表推送系统,可以解决对不属于注册用户的兴趣列表推送的问题。
为实现上述目的,本发明提供一种基于异构信息网络的兴趣列表推送系统,包括:
获取模块,用以获取用户的登录信息和关键字信息,所述关键字为当前用户与第二用户在聊天记录中所包含的信息;
建立模块,用以根据用户的登录信息建立信息矩阵I(I1,I2,I3,I4,I5),其中I1表示基于性别信息的第一数据列表,I2表示基于年龄信息的第二数据列表,I3表示基于职业信息的第三数据列表,I4表示基于地域信息的第四数据列表,I5表示基于时间的第五数据列表;
确定模块,根据信息矩阵和登录信息确定当前用户的兴趣列表;
推送模块,将该兴趣列表推送给第二用户,第二用户是通过搜索关键字获取的;
中央处理器,分别与获取模块、建立模块、确定模块以及推送模块连接,用以根据建立模块内的信息矩阵调整确定模块中的兴趣列表中的实时信息;
从第一用户与第二用户的聊天记录中确定关键字信息包括:
中央处理器获取第一用户与其他用户的聊天记录信息,设置聊天记录信息包括N1,N2,N3…Nn多条信息,每条信息的长度分别为L1,L2,L3…Ln,关键字的长度设置在标准字段长度ln,中央处理器内设置有关键字的近似信息库,近似信息库内包含有关键字的多个近似字段信息。
进一步地,在确定聊天信息内是否包含关键字时,将每条信息的长度分别与标准字段长度进行比较,若Li<标准字段长度ln,则表示该条信息内不包含关键字;
若Li≥标准字段长度ln,则将满足长度要求的聊天信息建立聊天信息矩阵M(M1,M2…Mk),其中k<n,对于聊天信息矩阵中的聊天信息进行判断时,从聊天信息Mi中的第1个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的第2个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字。
进一步地,在比较的过程中,若聊天信息Mi中进行k次比较之后,其中有0.2×k次的比较结果是聊天信息中包含关键字,此时判定聊天信息Mi中不包含标准字段的字符。
进一步地,若对于聊天信息Mi中选择的n个字符与标准字段的字符进行比较时,若n个字符中与标准字段的字符重合率小于等于90%,则找到出现差异的第一个字符位,从第一个差异位开始重新选择n个字符,将该n个字符与标准字段的字符进行比较,若重合率高于90%,则表示该聊天信息内包含关键字,若小于等于90%则需要进一步判断。
进一步地,当需要对聊天信息是否包含关键字进行进一步判断时,近似信息库内包含有关键字的多个近似字段信息,分别为Y1,Y2…Yn,近似字段为关键字的相似或相近字段,根据近似信息库对聊天信息进行进一步判断,判段聊天信息内是否包含关键字的相似或相近字段,若包含,则该聊天信息包含关键字,若不包含相似或相近字段,则认定该聊天信息不包含关键字。
进一步地,在进行比较时,将每个近似字段信息均添加一转化码,将近似信息库内的近似字段信息Y1,Y2…Yn更新为Y11,Y12…Y1n,从聊天信息Mi中的第1个字符开始,选择n个字符,将n个字符分别与近似字段信息Y11,Y12…Y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字;
从聊天信息Mi中的第2个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字;
从聊天信息Mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字;
从聊天信息Mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字;
从聊天信息Mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字;
从聊天信息Mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字。
进一步地,根据信息矩阵和登录信息确定当前用户的兴趣列表包括:当第一用户进行登录时,第一用户在登录界面输入用户名和密码,在输入用户名时,用户名可以包括用户的名称、性别、年龄、职业、地域,并记录用户登录的时间;
当获取到用户的身份信息时,获取与该用户身份相关的第一信息列表,当获取用户的职业信息时,从第一信息列表中筛选与职业信息相关的第二信息列表,当获取用户的地域信息之后,从第二信息列表中筛选与地域信息相关的第三信息列表;
当获取到用户的登录时间后,确定以登录时间为时间终点,以登录时间向前推2个月作为时间起点,将第三信息列表中的信息的发布时间在时间起点和时间终点之间的信息作为第四信息列表,该第四信息列表为第一用户的兴趣列表。
进一步地,在对第二用户进行选定的过程为:在第一用户的通讯列表中,获取第一用户与通讯列表中所有联系人的聊天信息,根据预设的关键字或是与关键字相同或相近语义的类关键字遍历聊天信息,确定聊天信息中出现关键字或类关键字的联系人,将联系人按照关键字出现的频次由多到少进行排序,作为第二用户的预选项列表。
根据所述第二用户的预先项列表中的联系人与第一用户共同所在的社区或群体,确定第二用户。具体而言,将与第一用户所在的社区或群体与预选项列表中的用户重合度最高的确定为第二用户。
进一步地,在对数据库内的信息进行删减包括:中央处理器内设置有信息列表数量调节矩阵K(K1,K2,K3,K4),其中K1表示第一调节系数,K2表示第二调节系数,K3表示第三调节系数,K4表示第四调节系数,若第一信息列表中的信息数量≥预设的第一信息数量N10,则采用第一调节系数K1对第一信息列表中的信息进行删减;
若第二信息列表中的信息数量≥预设的第二信息数量N20,则采用第二调节系数K2对第二信息列表中的信息进行删减;
若第三信息列表中的信息数量≥预设的第三信息数量N30,则采用第三调节系数K3对第三信息列表中的信息进行删减;
若第四信息列表中的信息数量≥预设的第四信息数量N40,则采用第四调节系数K4对第四信息列表中的信息进行删减;
当对第一信息列表中的信息进行删减后,在第一信息列表中保留的信息中筛选与职业信息相关的信息,并生成第二信息列表,若第二信息列表中的信息数量<第二信息数量N20,则直接从第二信息列表中筛选地域信息相关的信息,并生成第三信息列表,若第三信息列表中的信息数量<第三信息数量N30,则直接从第三信息列表中筛选时间相关的信息,并生成第四信息列表,将经过上述筛选过程的第四信息列表作为第一用户的兴趣列表,将该兴趣列表推送给第二用户。
与现有技术相比,本发明的有益效果在于,通过对第一用户的登录信息以及第一用户的聊天信息中包含的关键字,将第一用户的兴趣列表推送给第二用户,实现对非注册人员的信息推送,有助于进行用户推广,另外由于第二用户接收到的推送信息可以获取自己感兴趣的列表,也方便了用户对信息的筛选和过滤,提高信息的传播效率。
尤其,登录输入的次序实现对数据库内信息的逐步筛选,实现对数据的精简,使得生成的兴趣列表符合用户画像,提高信息筛选的精确度,进而提高用户对兴趣列表的依赖性,提高用户黏度。
尤其,通过建立身份信息、职业信息、地域信息和时间信息的数据列表,并在各个列表上进行筛选条件的叠加,通过层层叠加,层层筛选使得对于兴趣列表的筛选更为精准,对兴趣列表进行优化筛选的过程,提高对兴趣列表推送的准确度。
尤其,通过对聊天信息中的n个字符与标准字段的字符进行比较,以根据比较结果确定聊天信息中是否包含关键字,若是包含关键字则可以进一步判定其是否为第二用户,通过关键字的判断实现对第二用户的精准确定,提高兴趣列表推送的准确性。
尤其,通过判定聊天信息中是否包含近似信息库内的近似字段信息Y1,Y2…Yn,且近似字段信息与关键字信息对于聊天信息的判定至关重要,提高对聊天信息中是否包含关键字的判定的准确率,进一步提高兴趣列表推送的准确性。
尤其,通过对近似字段更新信息的形成方法进行了限定,通过对近似字段信息进行变形后形成近似字段更新信息,使得近似字段更新信息更为精准,在对聊天信息中的内容进行比较时比较结果更为精准,提高兴趣列表推送的准确性。
附图说明
图1为本发明实施例提供的基于异构信息网络的兴趣列表推送系统的结构示意图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1所示,本发明实施例提供的基于异构网络的兴趣列表推送系统包括:获取模块10,用以获取用户的登录信息和关键字,登录信息可以是用户名和密码,所述用户名中包含用户的性别信息、年龄信息、职业信息、地域信息和时间信息,所述关键字为当前用户与第二用户在聊天记录中所提及的信息;
建立模块20,用以根据用户的登录信息建立信息矩阵I(I1,I2,I3,I4,I5),其中I1表示基于性别信息的第一数据列表,I2表示基于年龄信息的第二数据列表,I3表示基于职业信息的第三数据列表,I4表示基于地域信息的第四数据列表,I5表示基于时间的第五数据列表;
确定模块30,根据信息矩阵和登录信息确定当前用户的兴趣列表;
推送模块40,将该兴趣列表推送给第二用户,第二用户是通过搜索关键字获取的;
中央处理器50,分别与获取模块、建立模块、确定模块以及推送模块连接,用以根据建立模块内的信息矩阵调整确定模块中的兴趣列表中的实时信息。
具体而言,本发明实施例通过对第一用户的登录信息以及第一用户的聊天信息中包含的关键字,将第一用户的兴趣列表推送给第二用户,实现对非注册人员的信息推送,有助于进行用户推广,另外由于第二用户接收到的推送信息可以获取自己感兴趣的列表,也方便了用户对信息的筛选和过滤,提高信息的传播效率。
具体而言,根据信息矩阵和登录信息确定当前用户的兴趣列表包括:当第一用户进行登录时,第一用户在登录界面输入用户名和密码,在输入用户名时,用户名可以包括用户的名称、性别、年龄、职业、地域,并记录用户登录的时间;
当获取到用户的身份信息时,获取与该用户身份相关的第一信息列表,当获取用户的职业信息时,从第一信息列表中筛选与职业信息相关的第二信息列表,当获取用户的地域信息之后,从第二信息列表中筛选与地域信息相关的第三信息列表;
当获取到用户的登录时间后,确定以登录时间为时间终点,以登录时间向前推2个月作为时间起点,将第三信息列表中的信息的发布时间在时间起点和时间终点之间的信息作为第四信息列表,该第四信息列表为第一用户的兴趣列表;
将该兴趣列表推送给第二用户。
具体而言,本发明实施例通过登录输入的次序实现对数据库内信息的逐步筛选,实现对数据的精简,使得生成的兴趣列表符合用户画像,提高信息筛选的精确度,进而提高用户对兴趣列表的依赖性,提高用户黏度。
具体而言,在对第二用户进行选定的过程为:在第一用户的通讯列表中,获取第一用户与通讯列表中所有联系人的聊天信息,根据预设的关键字或是与关键字相同或相近语义的类关键字遍历聊天信息,确定聊天信息中出现关键字或类关键字的联系人,将联系人按照关键字出现的频次由多到少进行排序,作为第二用户的预选项列表。
根据所述第二用户的预先项列表中的联系人与第一用户共同所在的社区或群体,确定第二用户。具体而言,将与第一用户所在的社区或群体与预选项列表中的用户重合度最高的确定为第二用户。
具体而言,本发明实施例通过对第二用户的确定更为精准,提高兴趣列表推送的精准度。
具体而言,在对数据库内的信息进行删减包括:中央处理器内设置有信息列表数量调节矩阵K(K1,K2,K3,K4),其中K1表示第一调节系数,K2表示第二调节系数,K3表示第三调节系数,K4表示第四调节系数,若第一信息列表中的信息数量≥预设的第一信息数量N10,则采用第一调节系数K1对第一信息列表中的信息进行删减;
若第二信息列表中的信息数量≥预设的第二信息数量N20,则采用第二调节系数K2对第二信息列表中的信息进行删减;
若第三信息列表中的信息数量≥预设的第三信息数量N30,则采用第三调节系数K3对第三信息列表中的信息进行删减;
若第四信息列表中的信息数量≥预设的第四信息数量N40,则采用第四调节系数K4对第四信息列表中的信息进行删减;
当对第一信息列表中的信息进行删减后,在第一信息列表中保留的信息中筛选与职业信息相关的信息,并生成第二信息列表,若第二信息列表中的信息数量<第二信息数量N20,则直接从第二信息列表中筛选地域信息相关的信息,并生成第三信息列表,若第三信息列表中的信息数量<第三信息数量N30,则直接从第三信息列表中筛选时间相关的信息,并生成第四信息列表,将经过上述筛选过程的第四信息列表作为第一用户的兴趣列表,将该兴趣列表推送给第二用户。
具体而言,本发明实施例提供的基于异构网络信息的兴趣列表推送系统建立身份信息、职业信息、地域信息和时间信息的数据列表,并在各个列表上进行筛选条件的叠加,通过层层叠加,层层筛选使得对于兴趣列表的筛选更为精准,对兴趣列表进行优化筛选的过程,提高对兴趣列表推送的准确度。
具体而言,当从第一用户与第二用户的聊天记录中确定关键字信息包括:
中央处理器获取第一用户与其他用户的聊天记录信息,设置聊天记录信息包括N1,N2,N3…Nn多条信息,每条信息的长度分别为L1,L2,L3…Ln,关键字的长度设置在标准字段长度ln,中央处理器内设置有关键字的近似信息库,近似信息库内包含有关键字的多个近似字段信息。
在确定聊天信息内是否包含关键字时,将每条信息的长度分别与标准字段长度进行比较,若Li<标准字段长度ln,则表示该条信息内不包含关键字;
若Li≥标准字段长度ln,则将满足长度要求的聊天信息建立聊天信息矩阵M(M1,M2…Mk),其中k<n,对于聊天信息矩阵中的聊天信息进行判断时,从聊天信息Mi中的第1个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的第2个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
在比较的过程中,若聊天信息Mi中进行k次比较之后,其中有0.2×k次的比较结果是聊天信息中包含关键字,此时判定聊天信息Mi中不包含标准字段的字符。
具体而言,本发明实施例通过对聊天信息中的n个字符与标准字段的字符进行比较,以根据比较结果确定聊天信息中是否包含关键字,若是包含关键字则可以进一步判定其是否为第二用户,通过关键字的判断实现对第二用户的精准确定,提高兴趣列表推送的准确性。
若对于聊天信息Mi中选择的n个字符与标准字段的字符进行比较时,若n个字符中与标准字段的字符重合率小于等于90%,则找到出现差异的第一个字符位,从第一个差异位开始重新选择n个字符,将该n个字符与标准字段的字符进行比较,若重合率高于90%,则表示该聊天信息内包含关键字,若小于等于90%则需要进一步判断。
具体而言,本发明实施例提供的基于异构信息网络兴趣列表推送系统,通过对聊天信息Mi中选择的n个字符与标准字段的字符存在差异的第一个字符开始重新选择n个字符继续比较,该n个字符与标准字段的字符进行比较,若重合率高于90%,则表示该聊天信息内包含关键字,进一步提高对聊天信息内是否包含关键字判断的准确性,提高判断的合理性和全面性。
具体而言,当需要对聊天信息是否包含关键字进行进一步判断时,近似信息库内包含有关键字的多个近似字段信息,分别为Y1,Y2…Yn,近似字段为关键字的相似或相近字段,根据近似信息库对聊天信息进行进一步判断,判段聊天信息内是否包含关键字的相似或相近字段,若包含,则该聊天信息包含关键字,若不包含相似或相近字段,则认定该聊天信息不包含关键字。
具体而言,在进行比较时,将每个近似字段信息均添加一转化码,将近似信息库内的近似字段信息Y1,Y2…Yn更新为Y11,Y12…Y1n,从聊天信息Mi中的第1个字符开始,选择n个字符,将n个字符分别与近似字段信息Y11,Y12…Y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字;
从聊天信息Mi中的第2个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字;
从聊天信息Mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字;
从聊天信息Mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字;
从聊天信息Mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字;
从聊天信息Mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字。
具体而言,本发明实施例通过判定聊天信息中是否包含近似信息库内的近似字段信息Y1,Y2…Yn,且近似字段信息与关键字信息对于聊天信息的判定至关重要,提高对聊天信息中是否包含关键字的判定的准确率,进一步提高兴趣列表推送的准确性。
对于将Y1,Y2…Yn更新为Y11,Y12…Y1n包括:
第一近似字段更新信息Y11是在第一近似字段信息Y1的基础上增加[ln/N]个字符,且增加的字符是从第一近似字段信息Y1中每间隔1个字符顺次插入;
第二近似字段更新信息Y12是在第二近似字段信息Y2的基础上增加[ln/(N+1)]个字符,且增加的字符是从第一近似字段信息Y1中每间隔2个字符顺次插入;
第n近似字段更新信息Y1n是在第n近似字段信息Yn的基础上增加[ln/(N+n-1)]个字符,且增加的字符是从第一近似字段信息Y1中每间隔n个字符顺次插入。
具体而言,本发明实施例通过对近似字段更新信息的形成方法进行了限定,通过对近似字段信息进行变形后形成近似字段更新信息,使得近似字段更新信息更为精准,在对聊天信息中的内容进行比较时比较结果更为精准,提高兴趣列表推送的准确性。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。 凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于异构信息网络的兴趣列表推送系统,其特征在于,包括:
获取模块,用以获取用户的登录信息和关键字信息,所述关键字为当前用户与第二用户在聊天记录中所包含的信息;
建立模块,用以根据用户的登录信息建立信息矩阵I(I1,I2,I3,I4,I5),其中I1表示基于性别信息的第一数据列表,I2表示基于年龄信息的第二数据列表,I3表示基于职业信息的第三数据列表,I4表示基于地域信息的第四数据列表,I5表示基于时间的第五数据列表;
确定模块,根据信息矩阵和登录信息确定当前用户的兴趣列表;
推送模块,将该兴趣列表推送给第二用户,第二用户是通过搜索关键字获取的;
中央处理器,分别与获取模块、建立模块、确定模块以及推送模块连接,用以根据建立模块内的信息矩阵调整确定模块中的兴趣列表中的实时信息;
从第一用户与第二用户的聊天记录中确定关键字信息包括:
中央处理器获取第一用户与其他用户的聊天记录信息,设置聊天记录信息包括N1,N2,N3…Nn多条信息,每条信息的长度分别为L1,L2,L3…Ln,关键字的长度设置在标准字段长度ln,中央处理器内设置有关键字的近似信息库,近似信息库内包含有关键字的多个近似字段信息;
在确定聊天信息内是否包含关键字时,将每条信息的长度分别与标准字段长度进行比较,若Li<标准字段长度ln,则表示该条信息内不包含关键字;
若Li≥标准字段长度ln,则将满足长度要求的聊天信息建立聊天信息矩阵M(M1,M2…Mk),其中k<n,对于聊天信息矩阵中的聊天信息进行判断时,从聊天信息Mi中的第1个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的第2个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字。
2.根据权利要求1所述的基于异构信息网络的兴趣列表推送系统,其特征在于,
在确定聊天信息内是否包含关键字时,还包括:从聊天信息Mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字;
从聊天信息Mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示聊天信息Mi中包含关键字。
3.根据权利要求2所述的基于异构信息网络的兴趣列表推送系统,其特征在于,
在比较的过程中,若聊天信息Mi中进行k次比较之后,其中有0.2×k次的比较结果是聊天信息中包含关键字,此时判定聊天信息Mi中不包含标准字段的字符。
4.根据权利要求2所述的基于异构信息网络的兴趣列表推送系统,其特征在于,
若对于聊天信息Mi中选择的n个字符与标准字段的字符进行比较时,若n个字符中与标准字段的字符重合率小于等于90%,则找到出现差异的第一个字符位,从第一个差异位开始重新选择n个字符,将该n个字符与标准字段的字符进行比较,若重合率高于90%,则表示该聊天信息内包含关键字,若小于等于90%则需要进一步判断。
5.根据权利要求4所述的基于异构信息网络的兴趣列表推送系统,其特征在于,
当需要对聊天信息是否包含关键字进行进一步判断时,近似信息库内包含有关键字的多个近似字段信息,分别为Y1,Y2…Yn,近似字段为关键字的相似或相近字段,根据近似信息库对聊天信息进行进一步判断,判段聊天信息内是否包含关键字的相似或相近字段,若包含,则该聊天信息包含关键字,若不包含相似或相近字段,则认定该聊天信息不包含关键字。
6.根据权利要求5述的基于异构信息网络的兴趣列表推送系统,其特征在于,
在进行比较时,将每个近似字段信息均添加一转化码,将近似信息库内的近似字段信息Y1,Y2…Yn更新为Y11,Y12…Y1n,从聊天信息Mi中的第1个字符开始,选择n个字符,将n个字符分别与近似字段信息Y11,Y12…Y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字;
从聊天信息Mi中的第2个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字;
从聊天信息Mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字;
从聊天信息Mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字;
从聊天信息Mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字;
从聊天信息Mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示聊天信息Mi中包含关键字相似或相近信息,属于包含关键字。
7.根据权利要求1所述的基于异构信息网络的兴趣列表推送系统,其特征在于,根据信息矩阵和登录信息确定当前用户的兴趣列表包括:当第一用户进行登录时,第一用户在登录界面输入用户名和密码,在输入用户名时,用户名包括用户的名称、性别、年龄、职业、地域,并记录用户登录的时间;
当获取到用户的身份信息时,获取与该用户身份相关的第一信息列表,当获取用户的职业信息时,从第一信息列表中筛选与职业信息相关的第二信息列表,当获取用户的地域信息之后,从第二信息列表中筛选与地域信息相关的第三信息列表;
当获取到用户的登录时间后,确定以登录时间为时间终点,以登录时间向前推2个月作为时间起点,将第三信息列表中的信息的发布时间在时间起点和时间终点之间的信息作为第四信息列表,该第四信息列表为第一用户的兴趣列表。
8.根据权利要求7所述的基于异构信息网络的兴趣列表推送系统,其特征在于,在对第二用户进行选定的过程为:在第一用户的通讯列表中,获取第一用户与通讯列表中所有联系人的聊天信息,根据预设的关键字或是与关键字相同或相近语义的类关键字遍历聊天信息,确定聊天信息中出现关键字或类关键字的联系人,将联系人按照关键字出现的频次由多到少进行排序,作为第二用户的预选项列表;
根据所述第二用户的预先项列表中的联系人与第一用户共同所在的社区或群体,确定第二用户。
9.根据权利要求8所述的基于异构信息网络的兴趣列表推送系统,其特征在于,在对数据库内的信息进行删减包括:中央处理器内设置有信息列表数量调节矩阵K(K1,K2,K3,K4),其中K1表示第一调节系数,K2表示第二调节系数,K3表示第三调节系数,K4表示第四调节系数,若第一信息列表中的信息数量≥预设的第一信息数量N10,则采用第一调节系数K1对第一信息列表中的信息进行删减;
若第二信息列表中的信息数量≥预设的第二信息数量N20,则采用第二调节系数K2对第二信息列表中的信息进行删减;
若第三信息列表中的信息数量≥预设的第三信息数量N30,则采用第三调节系数K3对第三信息列表中的信息进行删减;
若第四信息列表中的信息数量≥预设的第四信息数量N40,则采用第四调节系数K4对第四信息列表中的信息进行删减;
当对第一信息列表中的信息进行删减后,在第一信息列表中保留的信息中筛选与职业信息相关的信息,并生成第二信息列表,若第二信息列表中的信息数量<第二信息数量N20,则直接从第二信息列表中筛选地域信息相关的信息,并生成第三信息列表,若第三信息列表中的信息数量<第三信息数量N30,则直接从第三信息列表中筛选时间相关的信息,并生成第四信息列表,将经过上述筛选过程的第四信息列表作为第一用户的兴趣列表,将该兴趣列表推送给第二用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110186752.1A CN112532755B (zh) | 2021-02-18 | 2021-02-18 | 一种基于异构信息网络的兴趣列表推送系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110186752.1A CN112532755B (zh) | 2021-02-18 | 2021-02-18 | 一种基于异构信息网络的兴趣列表推送系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112532755A true CN112532755A (zh) | 2021-03-19 |
CN112532755B CN112532755B (zh) | 2021-05-04 |
Family
ID=74975675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110186752.1A Active CN112532755B (zh) | 2021-02-18 | 2021-02-18 | 一种基于异构信息网络的兴趣列表推送系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112532755B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113392327A (zh) * | 2021-07-02 | 2021-09-14 | 滨州学院 | 基于用户网站访问记录的图书推荐方法 |
CN113392286A (zh) * | 2021-06-11 | 2021-09-14 | 深圳市宏博信息科技有限公司 | 大数据信息采集系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102141986A (zh) * | 2010-01-28 | 2011-08-03 | 北京邮电大学 | 基于用户行为的个性化信息提供方法及系统 |
CN104077351A (zh) * | 2014-05-26 | 2014-10-01 | 东北师范大学 | 基于异构信息网络的内容提供方法及系统 |
CN106354862A (zh) * | 2016-09-06 | 2017-01-25 | 山东大学 | 一种异构网络中多维个性化推荐方法 |
CN106802956A (zh) * | 2017-01-19 | 2017-06-06 | 山东大学 | 一种基于加权异构信息网络的电影推荐方法 |
CN107562795A (zh) * | 2017-08-01 | 2018-01-09 | 广州市香港科大霍英东研究院 | 基于异构信息网络的推荐方法及装置 |
CN110545233A (zh) * | 2019-08-09 | 2019-12-06 | 五八有限公司 | 一种信息推送方法、装置、电子设备及存储介质 |
CN111191056A (zh) * | 2020-01-02 | 2020-05-22 | 中国联合网络通信集团有限公司 | 一种多媒体推荐方法及装置 |
CN111209490A (zh) * | 2020-04-24 | 2020-05-29 | 深圳市爱聊科技有限公司 | 基于用户信息的交友推荐方法、电子装置及存储介质 |
-
2021
- 2021-02-18 CN CN202110186752.1A patent/CN112532755B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102141986A (zh) * | 2010-01-28 | 2011-08-03 | 北京邮电大学 | 基于用户行为的个性化信息提供方法及系统 |
CN104077351A (zh) * | 2014-05-26 | 2014-10-01 | 东北师范大学 | 基于异构信息网络的内容提供方法及系统 |
CN106354862A (zh) * | 2016-09-06 | 2017-01-25 | 山东大学 | 一种异构网络中多维个性化推荐方法 |
CN106802956A (zh) * | 2017-01-19 | 2017-06-06 | 山东大学 | 一种基于加权异构信息网络的电影推荐方法 |
CN107562795A (zh) * | 2017-08-01 | 2018-01-09 | 广州市香港科大霍英东研究院 | 基于异构信息网络的推荐方法及装置 |
CN110545233A (zh) * | 2019-08-09 | 2019-12-06 | 五八有限公司 | 一种信息推送方法、装置、电子设备及存储介质 |
CN111191056A (zh) * | 2020-01-02 | 2020-05-22 | 中国联合网络通信集团有限公司 | 一种多媒体推荐方法及装置 |
CN111209490A (zh) * | 2020-04-24 | 2020-05-29 | 深圳市爱聊科技有限公司 | 基于用户信息的交友推荐方法、电子装置及存储介质 |
Non-Patent Citations (1)
Title |
---|
刘云枫: "异构信息网络推荐研究进展", 《情报科学》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113392286A (zh) * | 2021-06-11 | 2021-09-14 | 深圳市宏博信息科技有限公司 | 大数据信息采集系统 |
CN113392286B (zh) * | 2021-06-11 | 2022-02-11 | 深圳市宏博信息科技有限公司 | 大数据信息采集系统 |
CN113392327A (zh) * | 2021-07-02 | 2021-09-14 | 滨州学院 | 基于用户网站访问记录的图书推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112532755B (zh) | 2021-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112532755B (zh) | 一种基于异构信息网络的兴趣列表推送系统 | |
CN101957857B (zh) | 一种信息主动推送方法及服务器 | |
US9760639B2 (en) | System and method for managing information flow between members of an online social network | |
US7099862B2 (en) | Programmatic discovery of common contacts | |
CA2711279C (en) | Social community generated answer system with collaboration constraints | |
CN103001994B (zh) | 好友推荐方法及装置 | |
US20180276615A1 (en) | Address extraction from a communication | |
CN110069763B (zh) | 合同文本定制方法、装置、设备及可读存储介质 | |
CN110968801A (zh) | 地产产品搜索方法、存储介质及电子设备 | |
CN110019382A (zh) | 用户亲密度指数确定方法、装置、存储介质及电子设备 | |
US10977285B2 (en) | Using observations of a person to determine if data corresponds to the person | |
CN104992318B (zh) | 行事历主动推荐事件的方法 | |
CN111930823A (zh) | 一种数据查询方法、装置、数据中台和存储介质 | |
CN106126634A (zh) | 一种基于直播行业的主数据去重处理方法及系统 | |
CN102571623A (zh) | 即时通信中用以信息发送的方法及系统 | |
CN108012025B (zh) | 基于设置的处理方法、装置及移动终端 | |
CN115935087A (zh) | 一种基于时间窗口的地理社区搜索方法 | |
CN113485983B (zh) | 问卷数据处理方法及装置 | |
CN113392286B (zh) | 大数据信息采集系统 | |
CN112100294A (zh) | 一种面向网络平台的用户关系分析方法、装置及相关设备 | |
CN115080521A (zh) | 信息显示方法、装置、电子设备和存储介质 | |
KR20100066088A (ko) | 인맥정보 제공방법, 인맥정보 수신방법, 인맥정보 제공장치및 전자장치 | |
CN110717109A (zh) | 推荐数据的方法、装置、电子设备及存储介质 | |
KR20070117161A (ko) | 인맥 서비스 제공 방법 및 그 시스템 | |
JP2007047887A (ja) | チャットサービスを提供する方法およびソフトウェア |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220420 Address after: 510000 units 04 and 05, 28th floor, building a, Guanzhou life science innovation center, 51 helix Avenue, International Biological Island, Huangpu District, Guangzhou, Guangdong Province Patentee after: GUANGZHOU REAGENT INFORMATION TECHNOLOGY Co.,Ltd. Address before: 510000 room 1202, 350 Tancun Road, Tianhe District, Guangzhou City, Guangdong Province Patentee before: GUANGZHOU HUITU COMPUTER INFORMATION TECHNOLOGY CO.,LTD. |