CN100555283C - 一种直接针对用户的相关信息的发布方法和系统 - Google Patents

一种直接针对用户的相关信息的发布方法和系统 Download PDF

Info

Publication number
CN100555283C
CN100555283C CNB2006101672406A CN200610167240A CN100555283C CN 100555283 C CN100555283 C CN 100555283C CN B2006101672406 A CNB2006101672406 A CN B2006101672406A CN 200610167240 A CN200610167240 A CN 200610167240A CN 100555283 C CN100555283 C CN 100555283C
Authority
CN
China
Prior art keywords
input
relevant information
user
content
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB2006101672406A
Other languages
English (en)
Other versions
CN1996301A (zh
Inventor
王坚
赵立洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CNB2006101672406A priority Critical patent/CN100555283C/zh
Publication of CN1996301A publication Critical patent/CN1996301A/zh
Priority to PCT/CN2007/071207 priority patent/WO2008071121A1/zh
Application granted granted Critical
Publication of CN100555283C publication Critical patent/CN100555283C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种直接针对用户的相关信息的发布方法和系统,所述方法包括以下步骤:利用输入法平台,采集和存储用户的输入内容;对一定阈值范围内的输入内容进行分析;依据分析结果确定向该用户发布的相关信息;在所述输入法平台所运行的计算设备上展示所述相关信息。本发明可以大大提高相关信息发布的准确度,因为发布的最终对象就是用户;同时由于使用本发明用户的数量巨大,可以大大扩展相关信息发布的广度和深度;从而可以真正的实现直接面向用户的信息发布。本发明还可以收集用户输入内容的参数信息,然后结合所述参数信息对一定阈值范围内的输入内容进行分析,从而可以更加准确的得到针对该用户输入内容的分析结果。

Description

一种直接针对用户的相关信息的发布方法和系统
技术领域
本发明信息发布领域,特别是涉及一种直接针对用户的相关信息的发布方法和系统。
背景技术
当前技术下,通过互联网发布的相关信息形式多种多样(例如,新闻信息、娱乐信息、广告信息等等);发布方法也纷繁多样,下面举例进行说明。
第一种方式,通过大众媒体网站广告的形式发布与该网站主题词密切相关的信息。例如,推广雨林旅游的代理商可以将广告投放在雅虎(Yahoo!)网站的生态旅游子目录中。
第二种方式,通过广播电子邮件发布与该邮件主题相关的信息,所述广播电子邮件以具有一个或多个共同兴趣的特定接收者群体为目标。例如,关于特定话题(例如父母身份)的新闻电子邮件通常包括大量迎合该特定话题的发广告者网站(例如玩具店的网站)的统一资源定位器(URL)列表,新闻电子邮件的接收者可以“点击”其上的链接,来通过网络浏览器查看相关信息。中国200380104662.3号专利申请就公开了一种用于通过电子邮件进行动态文本广告发布的方法和系统。
第三种方式,通过搜索结果列表页面发布与搜索关键词相关的信息。如今,通过搜索引擎检索已成为人们从互联网中获取信息和资源的一种非常快捷和有效的手段。现有技术中,一般在搜索结果列表页面的右边辟出专门一栏用于发布与搜索关键词相关的信息链接地址,用户通过点击该链接即可通过网络浏览器查看相关信息。
但是以上的相关信息发布方式,都要求相关信息事先预置在对应的网页或者邮件中,即必须要通过网页或者邮件服务器发布,而对于内容类似的网页或者邮件分属于不同的服务器时,相关信息需要提供给多个不同的服务器进行发布,从而导致相关信息更新、管理以及信息反馈统计的困难。Google公司在中国专利CN1759388A中,提出了一种新的相关信息发布方式:
客户端应用程序(比如,终端用户计算机上的浏览器、浏览器插件、浏览器工具栏插件等)被用来支持向客户装置提供内容相关广告。客户端应用程序可以通过发送文档信息(比如,文档标识符、文档内容、内容相关信息等)到内容广告服务器而提供这种支持。客户端应用程序也可以被用来组合文档内容和内容相关广告。例如,客户端应用程序可以在窗口中(例如,在浏览器窗口中)组合文档内容和广告,可以在上、下面的窗口中、或在与文档窗口相邻的窗口提供广告,也可以在浏览器“铬黄”中提供广告等。
该发布方式可以部分解决现有的一些广告集中管理的问题,但是随着相关信息发布的越来越频繁以及发布要求的提高,Google公司所提出的发布方式已经不能满足需要,具有以下难以克服的缺陷:
首先,Google公司所提出的发布方式中,以浏览器插件等形式存在的客户端将用户需要浏览的网页的URL发送至分析服务器,分析服务器根据该URL抓取该网页的相关内容并得到分析结果,相关信息服务器根据所述分析结果向该客户端返回匹配的相关信息。但是由于很多内容相同的网页具有不同的URL,或者很多网页都采用动态URL,即分析服务器不得不重复请求获取相同内容的网页,并针对相同内容的网页进行多次重复的分析过程,严重浪费服务器的计算资源。
其次,Google公司所提出的发布方式中,客户端会将用户浏览的所有网页的URL发送至分析服务器,由相关信息服务器返回匹配的相关信息,但实际上在用户所浏览的网页中有一些对用户来说是无效的,则依据该方式客户端就会收到相应的一些无效的相关信息。并且,如果用户短时间内浏览的网页较多,则就会收到大量的相关信息,由于这些相关信息需要从服务器下载至本地并在本地运行展示,所以将会严重浪费用户本地计算设备的计算资源和网络传输资源。
再者,Google公司所提出的发布方式无法保证相关信息发布的准确度,因为相关信息是依据对网页内容的分析结果而选择发布的,而网页内容更多的体现的是网页信息提供者的需求,而并非网页信息浏览者的需求,但是网页信息浏览者恰恰是上述发布方式中相关信息的最终发布对象。并且对于大部分的网页而言,其内容非常丰富(例如各种门户网站),网页信息浏览者仅仅对其中的一小部分信息感兴趣,而上述发布方式中的分析服务器是无法找出网页信息浏览者到底是对哪部分信息感兴趣,从而导致发布的相关信息准确度极低。
综上所述,迫切需要本领域技术人员解决的一个技术问题是:提出一种既能够满足相关信息发布的准确度的需要,同时还不会显著增加用户端或者服务端传输资源、计算资源的负担。
发明内容
本发明所要解决的技术问题是提供一种直接针对用户的相关信息的发布方法和系统,以解决现有技术中相关信息发布的准确度低下的问题。
为了解决上述问题,本发明公开了一种直接针对用户的相关信息的发布方法,包括:
利用输入法平台,采集和存储用户通过输入法平台输入的输入内容;
采集所述输入内容的参数信息;所述参数信息包括输入内容所对应的应用程序、输入时间或者预置时间内的平均输入长度;
结合所述参数信息对一定阈值范围内的输入内容进行分析;所述阈值为时间阈值,或者,所述阈值为内容阈值,所述内容阈值为依据文字内容信息所确定的范围设定值;所述分析包括对字词属性的分析、语义分析、分词分析和/或统计分类;
依据分析结果确定向该用户发布的相关信息;
在所述输入法平台所运行的计算设备上展示所述相关信息。
所述依据分析结果所确定相关信息为最相关的一条相关信息。
或者所述依据分析结果所确定相关信息为多条相关信息,将所述依据分析结果所确定的多条相关信息存储形成针对该用户的发布数据库,所述发布数据库中还存储有:针对每条相关信息的发布顺序信息和发布位置信息。
所述输入内容的存储为:将用户输入内容以文本信息的方式存储;通过对该文本的分析,得到分析结果。所述输入内容的存储也可以为:以字词为单位存储用户的输入内容。
优选的,所述的方法还包括:对所述用户进行分类。
本发明还提供了一种输入法平台,包括输入接口单元、显示单元以及词库,其特征在于,还包括:
第一采集存储模块,用于采集和存储用户通过输入法平台输入的输入内容;
第二采集存储模块,用于采集和存储所述输入内容的参数信息;所述参数信息包括输入内容所对应的应用程序、输入时间或者预置时间内的平均输入长度;
分析模块,用于结合所述参数信息对一定阈值范围内的输入内容进行分析,得到分析结果;所述阈值为时间阈值,或者,所述阈值为内容阈值,所述内容阈值为依据文字内容信息所确定的范围设定值;所述分析包括对字词属性的分析、语义分析、分词分析和/或统计分类;
通信模块,与发布服务器相连,用于接收所确定的需要向该用户发布的相关信息;以及发送相关信息获取请求;
展示模块,用于在所述输入法平台所运行的计算设备上展示所述相关信息。
优选的,所述通信模块发送的相关信息获取请求包括所述分析结果。
优选的,所述的输入法平台还包括:相关信息数据库,用于在预置条件下,接收相关信息获取请求,依据分析结果确定相关信息。
本发明还公开了一种直接针对用户的相关信息的发布系统,包括:
第一采集存储子系统,用于利用输入法平台采集和存储用户通过输入法平台输入的输入内容;
第二采集存储子系统,用于采集所述输入内容的参数信息;所述参数信息包括输入内容所对应的应用程序、输入时间或者预置时间内的平均输入长度;
分析子系统,结合所述参数信息对一定阈值范围内的输入内容进行分析;所述阈值为时间阈值,或者,所述阈值为内容阈值,所述内容阈值为依据文字内容信息所确定的范围设定值;所述分析包括对字词属性的分析、语义分析、分词分析和/或统计分类;
相关信息数据库,用于存储需要发布的相关信息;
结果确定子系统,依据分析结果确定向该用户发布的相关信息;
展示子系统,在所述输入法平台所在的本地计算设备上展示所述相关信息。
优选的,所述依据分析结果所确定相关信息为最相关的一条相关信息。
优选的,所述的系统还包括:发布数据库,用于存储依据分析结果所确定的多条相关信息、针对每条相关信息的发布顺序信息和发布位置信息。
其中,所述输入内容的存储为:将用户输入内容以文本信息的方式存储;通过对该文本的分析,得到分析结果。所述输入内容的存储也可以为:以字词为单位存储用户的输入内容。
与现有技术相比,本发明经过仔细研究,选择广泛使用的,与用户联系最紧密的应用程序--输入法平台作为本发明收集用户信息的载体;首先由于输入法平台广泛使用,可以收集最大数量用户的信息;其次,输入法平台与用户的联系最为紧密,所有用户都需要通过输入法平台表达自己的思想、爱好等等特性信息。上述对本发明与输入法平台结合的分析,可以得知,本发明可以大大提高相关信息发布的准确度,因为发布的最终对象就是用户;同时由于使用本发明用户的数量巨大,可以大大扩展相关信息发布的广度和深度;从而可以真正的实现直接面向用户的信息发布。
其次,优选的,本发明还可以收集用户输入内容的参数信息,然后结合所述参数信息对一定阈值范围内的输入内容进行分析,从而可以更加准确的得到针对该用户输入内容的分析结果,进一步提高本发明相关信息发布的准确度。
附图说明
图1是本发明发布方法实施例的步骤流程图;
图2是本发明输入法平台的第一实施例的结构框图;
图3是本发明输入法平台的第二实施例的结构框图;
图4是本发明输入法平台的第三实施例的结构框图;
图5是本发明输入法平台的第四实施例的结构框图;
图6是本发明发布系统实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1、示出了一种直接针对用户的相关信息的发布方法的步骤流程图,包括以下步骤:
步骤101、利用输入法平台,采集和存储用户的输入内容。
步骤101中所述利用输入法平台采集信息的实现可以采用各种可行的方式,例如:
(1)由输入法将输入内容输出:对输入法平台进行改造,使其不但能够向应用程序输入信息,并且可以将该输入信息存储至数据库中,一般可以存储为文本信息的格式,用于后续分析。改造后的输入法平台将输入信息存储至数据库可以采用以下两种方式:(1)在用户选定的输入内容上屏之时或者之后,存储输入信息,该方式可以应用于任何输入法平台以及任何输入方式;(2)在用户选定输入内容时就将所选定的信息进行存储,即在输入内容上屏之前存储输入信息,如,针对存在候选词选择的输入法平台而言,当用户输入较长的编码字符串时,用户需要一一选择对应的正确输入字词,在用户选择确定的时候就可以将其所选定的内容作为输入内容存储至数据库,而不需要在用户选择完所有字词后输入至应用程序时再存储至数据库。
举个例子:用户输入的编码字符串为“shurufaciku”时,用户需要通过数字键选择两次,分别确定“输入法”和“词库”为正确的输入内容,本发明可以当用户选择“输入法”时将“输入法”存储至数据库,当用户选择“词库”时将“词库”存储至数据库;也可以当用户键入空格确定将“输入法词库”输入至应用程序时,存储“输入法词库”至数据库。
(2)从词库中获取:输入法平台记录用户输入的字词以及用户词频,优选的,还可以对输入法平台进行改造,使其能够记录用户词频和时间的关系,即用户在一段时间内输入该字词的词频。获取系统时间的方式可以有多种,例如:a)读取操作系统当前的时间,b)在联网的时候通过网络授时系统授予输入法时间(这个时间可以与本地计算机时间不一致),通过读取输入法时间来获取时间。本方式采集的输入内容以字词为单位存储;通过对一定时间段内所输入字词的用户词频的分析,得到分析结果。
(3)系统驻留程序的方式:运行一驻留内存的程序,能够截获从输入法平台向各个应用程序输入的信息。
由于现有操作系统大都采用以下流程输入信息:系统接收键盘消息,转发给输入法平台,由输入法完成输入内容转换之后,再将输入内容传送给系统,系统发送给应用程序而完成信息的输入。因此,设置一驻留内存的程序,用于截获输入法向系统传送输入内容时的信息,即可在不改进现有输入法平台的基础上就可以实现用户输入内容的采集。
对于有的操作系统和输入法平台而言,可以采用以下流程输入信息:系统接收键盘消息,转发给输入法平台,由输入法完成输入内容转换之后,直接将输入内容传送给应用程序而完成信息的输入。因此,设置一驻留内存的程序,用于截获输入法向应用程序传送输入内容时的信息,也可以在不改进现有输入法平台的基础上就可以实现用户输入内容的采集。
当然,本领域技术人员易于得知,采用上述各种方式的任意组合也是可行的。
步骤102、对一定阈值范围内的输入内容进行分析。
所述阈值可以为时间阈值,例如,对一个星期之内用户的输入内容进行分析。对于不同应用程序也可以设定不同的时间阈值,例如,对word程序的时间阈值为一个星期,而对MSN程序的时间阈值为一个月,因为针对MSN程序的输入内容与用户的个人行为的联系更为紧密。
所述阈值也可以为内容阈值,即可以根据内容确定的范围,例如,设定文字的字数,词数,段落数,甚至可以设定每个词性的词输入的个数,总之是一个存储记录文字的范围设定值。例如,对于文本信息形式的输入内容而言,可以设定仅仅存储10000字以内的输入内容,或者仅仅针对10000字以内的输入内容进行分析;对于字词形式存储的输入内容,则可以设定仅仅存储词频大于100的字词,或者仅仅针对词频大于100的字词进行分析。可以规定所述内容阈值也可以根据各个应用程序进行设定,每个应用程序的输入文字都可以有不同的设定值。
所述分析可以为对字词属性的分析、语义分析、分词分析、统计分类等等各种方法。
例如,对于以文本信息存储的用户输入内容,可以采用类似于现在分析网页的内容的分析提取关键词的方式完成分析即可,但是由于本发明采集的输入内容几乎不存在垃圾信息,所分析的文本的纯度很高,从而导致分析准确率极高。对所存储内容可以采用分词、统计、分类等方式提取关键词,也可以采用语义分析提取关键词,或者其他分析文本的通用方法都可以,只要能分析出与文本意义最为近似的关键词或关键词组合,或者说关键词相似度数据,就可以作为分析结果输出。
对于字词形式存储的输入内容,则可以采用字词属性分析的方式,由于存储了用户最近输入的字词内容,以及用户输入某些字词的频率及时间,在一定时间内的频率,甚至不同应用程序内的输入频率。对字词属性的分析可以是单纯的对词、词频、读音、或者词性的分析,也可以基于所存储的字词其他属性来进行。分析后可以获得用户对某些字词的输入频率,按照一定时间内输入的次数的多少可以评价其对该字词的关注度,从而确定最恰当的分析结果并输出。
优选的,所述分析过程也可以采用上述任意方式的组合,也可以采用多次、多角度的综合分析方式,尽量获取最为精确的分析结果。例如,首先分析用户一定时间段的心情参数,然后将关键词和心情参数作为共同确定应发布信息的要素。
对用户心情参数的分析过程可以采用以下方式实现:提取用户输入的信息进行分词处理,将分词结果与心情表匹配,得到能够表示用户心情的心情词,例如“郁闷”、“失恋”、“不爽”、“哈哈哈”等词汇,通过这些词汇就可以分析得出用户近期或当前的心情参数,不同的心情参数可以代表用户不同的心情等级或者心情类别,然后针对不同的心情参数可以发布不同的相关信息或者相同信息的不同版本。
由于本发明采集的输入内容并不像网页上的文章都是成篇的,采集的内容可能比较碎,所以除了分词分析之外,语义分析也是必要的。语义分析可以更抽象的分析出某个人的心情,如果用户在郁闷的时候,则可以根据心情发布一个类似蓝天白云为基调的相关信息,而不显示深色压抑的颜色的相关信息,即使是相同内容的相关信息。
步骤103、依据分析结果确定向该用户发布的相关信息。
所述分析结果可以是关键词和关键词组合,或者是被分析用户输入内容和此关键词或组合的相似度信息。例如,将相似度大于一定阈值的关键词或者组合作为分析结果输出,如果存储相关信息的数据库没有与排列在前的关键词或者组合相匹配的相关信息,则可以匹配相似度排列靠后的关键词或者组合,也可以直接从存储相关信息的数据库匹配得到最为接近的相关信息进行发布。
所述确定过程一般可以为:存储多条或者多个需要向用户发布的相关信息,每个相关信息可以对应一个或者几个主题词;将所述分析结果与所述主题词匹配对应,二者匹配度最高的(其他匹配规则也是可行的)则确定为向该用户发布的相关信息。所述相关信息的主题词可以由相关信息分析得到,也可以由相关信息提供商确定。
存储相关信息的数据库可以由一个专用服务器端系统来完成收集和储存,相关信息提供商登录该服务器系统后可以选择自己投放的种类、输入链接地址等管理操作,经过系统自动或人工关联后即成为数据库中可发布的相关信息。
步骤103可以在所述输入法平台所运行的计算设备上进行,也可以连接远程服务器完成,从而利用服务器优秀的计算性能和存储性能,满足更大量相关信息的发布需要、以及计算速度的需要。
步骤104、在所述输入法平台所运行的计算设备上展示所述相关信息。
由于现有技术中,输入法平台可以运行在多种计算设备上,例如,个人电脑、个人数字助理、移动终端设备等等,所以本发明也可以适用在上述各种计算设备中。
本发明所述的相关信息可以包括文字、图片、音频、视频,超链接,以及上述两种或多种形式的结合等等。优选的,所述相关信息为广告,因为广告的发布需求以及对发布精度的需求最为强烈。
本发明对展示的各种方式并不需要加以限定,优选的,可以在本地计算设备通过浏览器窗口进行相关信息的展示,例如弹出广告、浮动广告、淡入淡出广告、纵向横向推拉广告等,这些展示技术在本领域中都是所熟知的。
当然,也可以采用各种桌面插件的方式,在计算设备的桌面任意位置进行相关信息的展示,例如,在桌面的一行、一列或者一角进行相关信息的展示。
进一步扩展,也可以通过输入法平台本身的各种位置展现相关信息,例如在输入法候选词窗口、状态栏中或者其周边区域进行展示。例如,还可以通过输入法平台的外观--“皮肤”展示一定的相关信息,通过“皮肤”的颜色、图案、类型等不同而展示不同的相关信息。即输入法平台的“皮肤”不仅仅可以由用户自行设定所喜欢的样式,还可以根据需要展示的相关信息的不同而自动调整以加强相关信息展示的效果。
所述相关信息中也可以加载链接地址,以及本领域技术人员易于根据用户或者商业的需求,对各种展示方法加以改进,以便更好的满足不影响用户体验的相关信息发布。
步骤104中所述依据分析结果所确定的相关信息一般可以为最相关的一条相关信息。
优选的,所确定的相关信息也可以为多条相关信息,例如,针对该用户分析结果为多个关键词,则确定的相关信息也为多条;或者虽然针对该用户分析结果为一个关键词或者一个关键词组合,但是所确定的相关信息为多条。如果所确定的相关信息为多条时,可以将所述依据分析结果所确定的多条相关信息存储形成针对该用户的发布数据库,所述发布数据库中还可以存储有:针对每条相关信息的发布顺序信息和发布位置信息。在该发布数据库的有效时间内,依据这些信息,完成对相关信息的发布。
当然,所确定的相关信息和待发布用户的对应关系,也可以按照相关信息条目来存储,每条相关信息对应存储相应的待发布用户ID,所述待发布用户可以为多个。
优选的,图1所示的方法还可以包括,对通过本发明采集到输入内容信息的多个用户进行分类,从而为进一步的信息挖掘和利用做好准备。例如,可以针对每一类的用户修正某个特定用户的分析误差;可以针对每一类的用户进行更深层次的分析,提供更进一步的用户信息分析结果给相关信息提供商。所述分类可以根据对用户输入内容的分析结果进行,也可以根据所发布的相关信息的关联度进行,在此并不需要加以限制。
优选的,为了进一步提高发布的准确率,则图1所示的实施例还可以包括步骤:采集所述输入内容的参数信息,所述分析步骤为结合所述参数信息,对一定阈值范围内的输入内容进行分析。
所述参数信息可以包括输入内容所对应的应用程序,然后结合所述参数和输入内容进行分析,得到更为准确的分析结果。因为对于不同的应用程序,用户即使输入相同的内容,但是却有可能应该得到不同的结果,例如,MSN中的内容、Word中的内容、以及Email中的内容都是不同的输入目的,所以分析也应该基于娱乐、工作、生活等方面进行分类。当然,我们也可以根据相关信息的需要,排除一些应用程序的输入内容,对其不进行采集和分析。至于具体详细的采集规则、分析规则完全可以由本领域技术人员根据实际需要确定即可,在此无需也不可能加以限定。
所述参数信息也可以包括预置时间内的平均输入长度等,例如,可以通过所述时间长度信息判断该用户为文字工作者、程序员或者管理者等等,从而对最后的分析结果加以干预。
所述参数信息也可以包括输入内容所对应的时间信息,比如上午,下午,晚上,深夜,不同时间对应的相关信息也应该具有不同版本或者不同内容,从而让用户接收相关信息感觉很智能很贴心,即进一步保证发布的相关信息更准确、更符合用户的需求。即本发明可以将相关信息(尤其是广告信息)投放到个人,投放到一个点上,而并非现有技术的发布至一个不确定的群体,从而依靠信息收集,彻底通过网络实现信息的精确投放。
所述时间信息还可以用来辅助分析用户的输入内容,例如,越临近当前时间的输入内容分析权重越高,越偏离当前时间的输入内容的分析权重越低。
当然,所述参数信息还可以包括其他很多的可收集的信息,上面仅仅举例而已,本领域技术人员完全可以根据需要加以扩充或者组合。
优选的,本发明所述步骤103中对于一些信息量较大,或者比较重要的相关信息可以通过链接远程服务器完成确定发布信息的过程,而对于另外一些相关信息则可以直接在本地的相关信息数据库中进行匹配确定。当然,为了节约本地存储资源,所述相关信息数据库优选存储一些数据量较小的相关信息。例如,针对前述对心情的分析,可以在相关信息数据库预置一些与心情分类对应的提示词或表情符号,具体应用:分析得知用户的心情为低沉,则可以提示“心情不好吗?出去散散心吧!”、或者弹出动画等。
优选的,本发明可以提供设置接口,用于由用户确定同意本发明采集存储哪些输入内容,哪些输入内容不允许采集和存储,例如通过输入的应用程序进行划分或者以输入时间进行划分等等。进一步,本发明还可以提供相关信息发布列表,用于由用户选择,在本发明分析得到的针对该用户的相关信息发布列表中,用户希望浏览或者接收哪个或者哪些相关信息。
参照图2,示出了本发明输入法平台的第一实施例,其包括输入接口单元201、显示单元202以及词库203,以及:
第一采集存储模块204,用于采集和存储用户的输入内容;
通信模块205,与发布服务器相连,用于接收所确定的需要向该用户发布的相关信息;以及发送相关信息获取请求;
展示模块206,用于在所述输入法平台所运行的计算设备上展示所述相关信息。
为了实现图1所示的方法流程,则所述相关信息获取请求可以包括一定阈值范围内的所述输入内容,由发布服务器完成分析、确定以及返回相关信息的任务。
参照图3,示出了本发明输入法平台的第二实施例,其包括输入接口单元301、显示单元302以及词库303,以及:
第一采集存储模块304,用于采集和存储用户的输入内容;
分析模块307,用于对一定阈值范围内的输入内容进行分析,得到分析结果;
通信模块305,与发布服务器相连,用于接收所确定的需要向该用户发布的相关信息;以及发送相关信息获取请求;所述通信模块发送的相关信息获取请求包括所述分析结果;
展示模块306,用于在所述输入法平台所运行的计算设备上展示所述相关信息。
图3所示实施例与图2所示实施例的区别在于,由输入法平台完成一定的分析过程,由于本地计算设备一般在用户通过输入法平台输入信息时会存在较多的闲置计算资源,所以可以利用这些闲置计算资源完成对输入内容的分析,从而避免服务器同时接收大量分析任务而导致的情况发生。
当然,图3所示的实施例所述相关信息获取请求也可以包括一定阈值范围内的所述输入内容(例如,针对比较复杂的分析或者需要进一步的分析而言),由发布服务器针对这部分输入内容完成分析、确定以及返回相关信息的任务。
参照图4,示出了本发明输入法平台的第三实施例,其包括输入接口单元401、显示单元402以及词库403,以及:
第一采集存储模块404,用于采集和存储用户的输入内容;
分析模块407,用于对一定阈值范围内的输入内容进行分析,得到分析结果;
通信模块405,与发布服务器相连,用于接收所确定的需要向该用户发布的相关信息;以及发送相关信息获取请求;所述通信模块发送的相关信息获取请求包括所述分析结果;
展示模块406,用于在所述输入法平台所运行的计算设备上展示所述相关信息;
相关信息数据库408,用于在预置条件下,接收相关信息获取请求,依据分析结果确定相关信息。
图4所示实施例的相关信息数据库位于本地计算设备中,主要用于在预置条件下,例如网络链接断路的情况或者相关信息数据量较小的情况,接收相关信息获取请求,依据分析结果确定相关信息。
参照图5,示出了本发明输入法平台的第四实施例,其包括输入接口单元501、显示单元502以及词库503,以及:
第一采集存储模块504,用于采集和存储用户的输入内容;
第二采集存储模块505,用于采集和存储所述输入内容的参数信息;
分析模块506,用于结合所述参数信息,对一定阈值范围内的输入内容进行分析,得到分析结果;
通信模块507,与发布服务器相连,用于接收所确定的需要向该用户发布的相关信息;以及发送相关信息获取请求;所述通信模块发送的相关信息获取请求包括所述分析结果;
展示模块508,用于在所述输入法平台所运行的计算设备上展示所述相关信息。
当然,图5所示实施例也可以包括:相关信息数据库509,用于在预置条件下,接收相关信息获取请求,依据分析结果确定相关信息。
在图2-图5所示的各个实施例中,所述展示位置参数可以由返回的相关信息携带,或者也可以由展示模块自行确定即可(固定位置或者根据条件选择位置都是可行的)。
参照图6,是本发明一种直接针对用户的相关信息的发布系统的结构框图,包括以下部件:
第一采集存储子系统601,用于利用输入法平台采集和存储用户的输入内容;
分析子系统602,对一定阈值范围内的输入内容进行分析;
相关信息数据库603,用于存储需要发布的相关信息;
结果确定子系统604,依据分析结果确定向该用户发布的相关信息;
展示子系统605,在所述输入法平台所在的本地计算设备上展示所述相关信息。
图6所示系统中所述的展示子系统605可以为网页浏览器、媒体播放器等用户的本地程序,用于被远程服务器调用而展示服务器返回的相关信息;所述展示子系统605也可以为本发明附属的独立展示模块,专用于展示服务器返回的相关信息。
如果图6所示系统采用前述接收输入法平台信息或者调用输入法平台词库的方式实现利用输入法平台采集和存储用户的输入内容,则需要针对现有的输入法平台进行开发,使其能够提供输入内容或者使得本系统可以调用其词库中的用户词频等信息。
如果图6所示系统采用系统驻留内存程序的方式实现从输入法平台采集和存储输入内容,则无需对现有的输入法平台进行改进,可以截获任何输入法平台的输入内容,进而完成采集和存储。
图6所示系统中,所述输入内容的存储、分析可以为:将用户输入内容以文本信息的方式存储;通过对该文本的分析,得到分析结果。或者,所述输入内容的存储、分析也可以为:以字词为单位存储用户的输入内容;通过对所输入字词的用户词频的分析,得到分析结果。
优选的,图6所示系统还可以包括:
第二采集存储子系统606,用于采集所述输入内容的参数信息,所述分析子系统结合所述参数信息,完成对一定阈值范围内的输入内容的分析。其中,所述参数信息为输入内容所对应的应用程序、输入时间或者预置时间内的平均输入长度。
所述依据分析结果所确定相关信息一般为最相关的一条相关信息。优选的,当所确定的相关信息为多条时,图6所示系统还可以包括:发布数据库607,用于存储依据分析结果所确定的多条相关信息、针对每条相关信息的发布顺序信息和发布位置信息。
图6所示系统中所述相关信息数据库603和结果确定子系统604一般都位于远程服务器中,用于存储、管理、确定以及发布所述相关信息;在一定条件下(例如,发布小数据量的相关信息),所述相关信息数据库603和结果确定子系统604也可以部分的或者全部的位于本地计算设备中。
图6所示系统中所述分析子系统602既可以位于本地计算设备中,也可以位于远程服务器中,本领域技术人员根据需要自行确定即可。
如果相关信息为广告,则所述相关信息数据库为广告数据库,可以位于一广告管理子系统中。
所述广告数据库,用于存储广告信息,所述广告信息可以包括所购买的关键词的广告信息的链接、广告商的联系信息(帐户、邮件、电话等等)、该广告的发布情况等。所述发布情况可以包括该广告发布的起始日期、结束日期、预算信息、地理目标信息、联合组织信息等。例如,本田对它的汽车业有一个广告活动,对它的摩托车业可以有单独的广告活动。在关键词与广告的对应关系中,一个关键词可以具有一组相应的广告(随机选择一个广告呈现给点击触发的用户),或者一个广告可以对应多个关键词(点击每个关键词都显示该广告)。所述广告信息中还可以包括该广告所设定的成本限额,例如,多长时间内没有人点击,或者点击超过多少次该广告就不再发布等。
所述广告管理子系统还可以包括:
广告输入单元,提供一个接口,用于接收广告商提供的任何广告信息;
关键词购买单元,广告商通过该单元选择购买或者添加购买所需的关键词,该单元可以针对不同的关键词和不同的展现方式、显示效果以及可能的显示概率给出不同的广告付费的价格梯度;所述发布关键词也可以由系统自动对广告信息分析得到。
信息反馈和采集单元,例如,采集用户点击触发某个广告的次数或者地址;采集用户是否具有广告转化行为(例如,从广告发布至用户的预定时间内,是否有进一步的点击行为,或者是否存在所广告的商品或服务的销售启动、完成)等。
最后以一个具体的例子对本发明再次加以说明,其中相关信息以广告代替进行说明:
例如,在广告数据库中,存储了下面三条广告信息,都是以“机票”为发布关键词的,按照竞价高低顺序排列如下:
1.北京艾维航空售票处
特价打折机票,免费送票,在民航统一折扣的同时可以为您申请低2-3折,包机票,民航内部票(此机机票不可报销).给我们一份信任和支持,将回报给您更多的实惠!请拨打我们24小时订票热线:010-88888888
www.bjawjp.com
2.北京机票预定网,电话:66666666
专业提供机票预定服务,免费送票。电子客票,客人可直接到机场登机。
www.xgairchina.com
3.010-69799365特价机票网
专业提供机票预定,国内、国际机票、打折机票、特价机票,免费送票。3折起售。
www.texchain.com/xdf
由本发明采集的输入内容为:
A:我下周要去杭州玩儿了,暂时逃离了这万恶的工作,一想到这个就高兴。(本发明采集的)
B:是吗,太好了,我也想去玩儿呢,可惜没有年假。(非本发明采集的)
A:现在听说有的地方的机票打折打的很厉害啊,最低都有2折的了,到哪里能买到2折的去杭州的机票啊,你知道吗?(本发明采集的)
B:我还真不知道,我最低买的是6折的,你再去问问别人?(非本发明采集的)
通过本发明对上述A的文本进行分析之后,知道他输入内容的核心是买“机票”,产生的关键词也是“机票”,这时就可以根据“机票”这个关键词在广告数据库中查到前面所述的三条广告信息。广告数据库可以按照竞价顺序提供给这个用户一条广告信息。
以上对本发明所提供的一种直接针对用户的相关信息的发布方法和系统,以及一种输入法平台,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (14)

1、一种直接针对用户的相关信息的发布方法,其特征在于,包括:
利用输入法平台,采集和存储用户通过输入法平台输入的输入内容;
采集所述输入内容的参数信息;所述参数信息包括输入内容所对应的应用程序、输入时间或者预置时间内的平均输入长度;
结合所述参数信息对一定阈值范围内的输入内容进行分析;所述阈值为时间阈值,或者,所述阈值为内容阈值,所述内容阈值为依据文字内容信息所确定的范围设定值;所述分析包括对字词属性的分析、语义分析、分词分析和/或统计分类;
依据分析结果确定向该用户发布的相关信息;
在所述输入法平台所运行的计算设备上展示所述相关信息。
2、如权利要求1所述的方法,其特征在于,所述依据分析结果所确定相关信息为最相关的一条相关信息。
3、如权利要求1所述的方法,其特征在于,还包括:
将所述依据分析结果所确定的多条相关信息存储形成针对该用户的发布数据库,所述发布数据库中还存储有:针对每条相关信息的发布顺序信息和发布位置信息。
4、如权利要求1所述的方法,其特征在于,
所述输入内容的存储为:将用户输入内容以文本信息的方式存储;通过对该文本的分析,得到分析结果。
5、如权利要求1所述的方法,其特征在于,
所述输入内容的存储为:以字词为单位存储用户的输入内容。
6、如权利要求1所述的方法,其特征在于,还包括:对所述用户进行分类。
7、一种输入法平台,其特征在于,包括输入接口单元、显示单元以及词库,其特征在于,还包括:
第一采集存储模块,用于采集和存储用户通过输入法平台输入的输入内容;
第二采集存储模块,用于采集和存储所述输入内容的参数信息;所述参数信息包括输入内容所对应的应用程序、输入时间或者预置时间内的平均输入长度;
分析模块,用于结合所述参数信息对一定阈值范围内的输入内容进行分析,得到分析结果;所述阈值为时间阈值,或者,所述阈值为内容阈值,所述内容阈值为依据文字内容信息所确定的范围设定值;所述分析包括对字词属性的分析、语义分析、分词分析和/或统计分类;
通信模块,与发布服务器相连,用于接收所确定的需要向该用户发布的相关信息;以及发送相关信息获取请求;
展示模块,用于在所述输入法平台所运行的计算设备上展示所述相关信息。
8、如权利要求7所述的输入法平台,其特征在于:
所述通信模块发送的相关信息获取请求包括所述分析结果。
9、如权利要求7所述的输入法平台,其特征在于,还包括:
相关信息数据库,用于在预置条件下,接收相关信息获取请求,依据分析结果确定相关信息。
10、一种直接针对用户的相关信息的发布系统,其特征在于,包括:
第一采集存储子系统,用于利用输入法平台采集和存储用户通过输入法平台输入的输入内容;
第二采集存储子系统,用于采集所述输入内容的参数信息;所述参数信息包括输入内容所对应的应用程序、输入时间或者预置时间内的平均输入长度;
分析子系统,结合所述参数信息对一定阈值范围内的输入内容进行分析;所述阈值为时间阈值,或者,所述阈值为内容阈值,所述内容阈值为依据文字内容信息所确定的范围设定值;所述分析包括对字词属性的分析、语义分析、分词分析和/或统计分类;
相关信息数据库,用于存储需要发布的相关信息;
结果确定子系统,依据分析结果确定向该用户发布的相关信息;
展示子系统,在所述输入法平台所在的本地计算设备上展示所述相关信息。
11、如权利要求10所述的系统,其特征在于,所述依据分析结果所确定相关信息为最相关的一条相关信息。
12、如权利要求10所述的系统,其特征在于,还包括:
发布数据库,用于存储依据分析结果所确定的多条相关信息、针对每条相关信息的发布顺序信息和发布位置信息。
13、如权利要求10所述的系统,其特征在于,
所述输入内容的存储为:将用户输入内容以文本信息的方式存储;通过对该文本的分析,得到分析结果。
14、如权利要求10所述的系统,其特征在于,
所述输入内容的存储为:以字词为单位存储用户的输入内容。
CNB2006101672406A 2006-12-12 2006-12-12 一种直接针对用户的相关信息的发布方法和系统 Active CN100555283C (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CNB2006101672406A CN100555283C (zh) 2006-12-12 2006-12-12 一种直接针对用户的相关信息的发布方法和系统
PCT/CN2007/071207 WO2008071121A1 (fr) 2006-12-12 2007-12-10 Procédé et système de distribution d'information relative directement pour utilisateur

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006101672406A CN100555283C (zh) 2006-12-12 2006-12-12 一种直接针对用户的相关信息的发布方法和系统

Publications (2)

Publication Number Publication Date
CN1996301A CN1996301A (zh) 2007-07-11
CN100555283C true CN100555283C (zh) 2009-10-28

Family

ID=38251394

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006101672406A Active CN100555283C (zh) 2006-12-12 2006-12-12 一种直接针对用户的相关信息的发布方法和系统

Country Status (2)

Country Link
CN (1) CN100555283C (zh)
WO (1) WO2008071121A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100555283C (zh) * 2006-12-12 2009-10-28 北京搜狗科技发展有限公司 一种直接针对用户的相关信息的发布方法和系统
CN103327049B (zh) * 2012-03-22 2016-02-24 腾讯科技(深圳)有限公司 基于浏览器地址栏的富内容推送方法及系统
CN102708524A (zh) * 2012-04-19 2012-10-03 李军 一种机动车应用信息的推送方法及系统
CN103118326A (zh) * 2013-01-22 2013-05-22 百度在线网络技术(北京)有限公司 基于地理位置信息的信息推送方法、装置及系统
CN109120500B (zh) * 2017-06-23 2022-02-01 北京搜狗科技发展有限公司 一种信息处理方法及输入法系统
CN110400123B (zh) * 2019-07-05 2023-06-20 中国平安财产保险股份有限公司 交友信息推广方法、装置、设备及计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1113309C (zh) * 1997-09-25 2003-07-02 英业达股份有限公司 上下文相关的多国语言自动辨识方法
CN100485603C (zh) * 2003-04-04 2009-05-06 雅虎公司 用于从搜索查询中产生概念单元的系统和方法
CN1858733B (zh) * 2005-11-01 2012-04-04 华为技术有限公司 信息检索系统和检索方法
CN100555283C (zh) * 2006-12-12 2009-10-28 北京搜狗科技发展有限公司 一种直接针对用户的相关信息的发布方法和系统

Also Published As

Publication number Publication date
WO2008071121A1 (fr) 2008-06-19
CN1996301A (zh) 2007-07-11

Similar Documents

Publication Publication Date Title
Vargiu et al. Exploiting web scraping in a collaborative filtering-based approach to web advertising.
CN101178737B (zh) 一种互联网关键字符相关信息的发布方法和系统
CN101025737B (zh) 基于关注度的同源信息搜索引擎聚合显示方法
CN107862553A (zh) 广告实时推荐方法、装置、终端设备及存储介质
JP4637969B1 (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
CN104850546B (zh) 移动媒介信息的展示方法和系统
CN104102639B (zh) 基于文本分类的推广触发方法和装置
CN101329674A (zh) 一种提供个性化搜索的系统和方法
CN103778260A (zh) 一种个性化微博信息推荐系统和方法
CN103177384A (zh) 基于用户兴趣图谱的网络广告投放方法
CN102682393A (zh) 使用过去搜索查询确定广告目标信息和/或广告创意信息
CN102708174A (zh) 一种浏览器中的富媒体信息的展示方法和装置
CN101520782A (zh) 与在线图片相关联的专题信息的定向发布方法与系统
CN105303394A (zh) 一种基于网页搜索引擎的网络广告投放方法和系统
CN102360386A (zh) 电子商务网站智能导购系统和方法
CN101916274A (zh) 对LinkUGC进行聚合显示的方法和系统
CN100555283C (zh) 一种直接针对用户的相关信息的发布方法和系统
CN109889891A (zh) 获取目标媒体文件的方法、装置及存储介质
KR102216755B1 (ko) 콘텐츠 및 제품을 연동시키는 태그 분석 서비스 제공 방법
JP2007323334A (ja) Webページ抽出システム、これを用いた広告配信システムおよび広告配信プログラム
CN101324890A (zh) 一种互联网文内关键字广告的生成和投放方法
CN113177809A (zh) 一种基于一物一码用户消费行为自动聚类方法及应用系统
CN104077290A (zh) 一种生成推广账户的方法和装置
KR102322668B1 (ko) 콘텐츠 크리에이터의 창작활동 활성화를 위한 다중 플랫폼 서비스 제공 시스템
CN103177129A (zh) 互联网实时信息推荐预测系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant