JP6511487B2 - 情報プッシュ用の方法及び装置 - Google Patents
情報プッシュ用の方法及び装置 Download PDFInfo
- Publication number
- JP6511487B2 JP6511487B2 JP2017108224A JP2017108224A JP6511487B2 JP 6511487 B2 JP6511487 B2 JP 6511487B2 JP 2017108224 A JP2017108224 A JP 2017108224A JP 2017108224 A JP2017108224 A JP 2017108224A JP 6511487 B2 JP6511487 B2 JP 6511487B2
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- frequency
- candidate keyword
- target text
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
- G06Q30/0256—User search
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Claims (10)
- 情報プッシュ用の装置が実行する情報プッシュ用の方法であって、
ターゲットテキストを単語分割して、フレーズの集合を生成するステップと、
前記フレーズの集合における各フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度を計算するステップと、
予め設定した候補キーワードと各フレーズとの類似度を取得するステップと、
各フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度と、前記候補キーワードと各フレーズとの類似度との積に基づいて、前記候補キーワードと前記ターゲットテキストとの関連度を計算するステップと、
予め設定した関連度閾値に基づいて、又は関連度と予め設定したプッシュ数とに基づいて、前記候補キーワードからプッシュしようとする候補キーワードを選択し、第1ユーザ端末へ前記プッシュしようとする候補キーワードをプッシュするステップと、を含む
ことを特徴とする情報プッシュ用の方法。 - 前記の各フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度と、前記候補キーワードと各フレーズとの類似度とに基づいて、前記候補キーワードと前記ターゲットテキストとの関連度を計算するステップにおいては、
前記フレーズの集合における各フレーズに対して、前記候補キーワードと当該フレーズとの類似度に当該フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度を乗じ、得られた各積を加算し、前記候補キーワードと前記ターゲットテキストとの関連度を取得するステップを含む
ことを特徴とする請求項1に記載の方法。 - 前記の第1ユーザ端末へ前記プッシュしようとする候補キーワードをプッシュするステップの後に、さらに、
前記プッシュしようとする候補キーワードと前記ターゲットテキストの対応関係を確立するステップと、
前記プッシュしようとする候補キーワードに対する第2ユーザ端末の検索操作を検出したことに応答して、前記第2ユーザ端末へ前記プッシュしようとする候補キーワードに対応するテキストをプッシュするステップと、を含む
ことを特徴とする請求項1に記載の方法。 - 前記の前記フレーズの集合における各フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度を計算するステップにおいては、
各フレーズが予め設定したテキスト集合に出現した逆文書頻度を統計するステップと、
各フレーズが前記ターゲットテキストに出現した頻度を統計するステップと、
前記逆文書頻度と前記頻度との積を各フレーズの単語の出現頻度-逆文書頻度として計算するステップと、を含む
ことを特徴とする請求項1に記載の方法。 - 前記のフレーズの集合を生成するステップの後に、さらに、前記フレーズの集合におけ
るストップワードを削除するステップを含む
ことを特徴とする請求項1に記載の方法。 - ターゲットテキストを単語分割して、フレーズの集合を生成するように配置されている生成ユニットと、
前記フレーズの集合における各フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度を計算するように配置されている第1計算ユニットと、
予め設定した候補キーワードと各フレーズとの類似度を取得するように配置されている取得ユニットと、
各フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度と、前記候補キーワードと各フレーズとの類似度との積に基づいて、前記候補キーワードと前記ターゲットテキストとの関連度を計算するように配置されている第2計算ユニットと、
予め設定した関連度閾値に基づいて、又は関連度と予め設定したプッシュ数とに基づいて、前記候補キーワードからプッシュしようとする候補キーワードを選択し、第1ユーザ端末へ前記プッシュしようとする候補キーワードをプッシュするように配置されている第1プッシュユニットと、を備える
ことを特徴とする情報プッシュ用の装置。 - 前記第2計算ユニットは、さらに、
前記フレーズの集合における各フレーズに対して、前記候補キーワードと当該フレーズとの類似度に当該フレーズの前記ターゲットテキストでの単語の出現頻度-逆文書頻度を乗じ、得られた各積を加算し、前記候補キーワードと前記ターゲットテキストとの関連度を取得するように配置されている
ことを特徴とする請求項6に記載の装置。 - 前記プッシュしようとする候補キーワードと前記ターゲットテキストとの対応関係を確立するように配置されている確立ユニットと、
前記プッシュしようとする候補キーワードに対する第2ユーザ端末の検索操作を検索したことに応答して、前記第2ユーザ端末へ前記プッシュしようとする候補キーワードに対応するテキストをプッシュするように配置されている第2プッシュユニットと、さらにを備える
ことを特徴とする請求項6に記載の装置。 - 前記第1計算ユニットは、
各フレーズが予め設定したテキスト集合に出現した逆文書頻度を統計するように配置されている第1統計モジュールと、
各フレーズが前記ターゲットテキストに発生した頻度を統計するように配置されている第2統計モジュールと、
前記逆文書頻度と前記頻度との積を各フレーズの単語の出現頻度-逆文書頻度として計算するように配置されている計算モジュールと、を備える
ことを特徴とする請求項6に記載の装置。 - 前記フレーズの集合におけるストップワードを削除するように配置されている削除ユニットをさらに備える
ことを特徴とする請求項6に記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611216735.3 | 2016-12-26 | ||
CN201611216735.3A CN108241667B (zh) | 2016-12-26 | 2016-12-26 | 用于推送信息的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018106658A JP2018106658A (ja) | 2018-07-05 |
JP6511487B2 true JP6511487B2 (ja) | 2019-05-15 |
Family
ID=62629914
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017108224A Active JP6511487B2 (ja) | 2016-12-26 | 2017-05-31 | 情報プッシュ用の方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10726446B2 (ja) |
JP (1) | JP6511487B2 (ja) |
CN (1) | CN108241667B (ja) |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10572491B2 (en) | 2014-11-19 | 2020-02-25 | Google Llc | Methods, systems, and media for presenting related media content items |
CN110750708A (zh) * | 2018-07-23 | 2020-02-04 | 北京字节跳动网络技术有限公司 | 关键词推荐方法、装置和电子设备 |
CN109325796B (zh) * | 2018-08-13 | 2023-09-26 | 中国平安人寿保险股份有限公司 | 潜在用户筛选方法、装置、计算机设备及存储介质 |
CN109325178A (zh) * | 2018-09-14 | 2019-02-12 | 北京字节跳动网络技术有限公司 | 用于处理信息的方法和装置 |
CN109344247B (zh) * | 2018-09-29 | 2020-01-10 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
CN110032622B (zh) * | 2018-11-28 | 2023-07-14 | 创新先进技术有限公司 | 关键词确定方法、装置、设备及计算机可读存储介质 |
CN110008396B (zh) * | 2018-11-28 | 2023-11-24 | 创新先进技术有限公司 | 对象信息推送方法、装置、设备及计算机可读存储介质 |
CN109828748A (zh) * | 2018-12-15 | 2019-05-31 | 深圳壹账通智能科技有限公司 | 代码命名方法、系统、计算机装置及计算机可读存储介质 |
CN109918657B (zh) * | 2019-02-28 | 2023-04-18 | 云孚科技(北京)有限公司 | 一种从文本中提取目标关键词的方法 |
CN110008474B (zh) * | 2019-04-04 | 2023-06-02 | 科大讯飞股份有限公司 | 一种关键短语确定方法、装置、设备及存储介质 |
CN111831796A (zh) * | 2019-04-15 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 一种用户请求的处理方法、装置、电子设备及存储介质 |
CN110083837B (zh) * | 2019-04-26 | 2023-11-24 | 科大讯飞股份有限公司 | 一种关键词生成方法及装置 |
CN110232126B (zh) * | 2019-06-14 | 2023-10-24 | 腾讯科技(深圳)有限公司 | 热点挖掘方法及服务器和计算机可读存储介质 |
CN112241894A (zh) * | 2019-07-16 | 2021-01-19 | 百度时代网络技术(北京)有限公司 | 内容投放方法、装置以及终端 |
CN110609958A (zh) * | 2019-09-19 | 2019-12-24 | Oppo广东移动通信有限公司 | 数据推送方法、装置、电子设备及存储介质 |
CN112579869B (zh) * | 2019-09-29 | 2022-02-01 | 北京星选科技有限公司 | 对象提取方法、装置、电子设备及存储介质 |
CN110888970B (zh) * | 2019-11-29 | 2023-10-03 | 腾讯科技(深圳)有限公司 | 文本生成方法、装置、终端和存储介质 |
CN111191446B (zh) * | 2019-12-10 | 2022-11-25 | 平安医疗健康管理股份有限公司 | 交互信息处理方法、装置、计算机设备和存储介质 |
CN111191126B (zh) * | 2019-12-24 | 2023-11-03 | 绍兴市上虞区理工高等研究院 | 一种基于关键词的科技成果精准推送方法及装置 |
CN113127766B (zh) * | 2019-12-31 | 2023-04-14 | 飞书数字科技(上海)有限公司 | 广告兴趣词的获取方法、装置、存储介质和处理器 |
CN111242692B (zh) * | 2020-01-16 | 2022-05-17 | 南京领行科技股份有限公司 | 一种信息推送方法及装置 |
CN111371844B (zh) * | 2020-02-20 | 2024-01-19 | 平安科技(深圳)有限公司 | 课程推送方法及相关装置 |
CN113495997A (zh) * | 2020-04-01 | 2021-10-12 | 北京四维图新科技股份有限公司 | Poi别名的探索方法、装置和车辆 |
CN111767713B (zh) * | 2020-05-09 | 2023-07-21 | 北京奇艺世纪科技有限公司 | 关键词的提取方法、装置、电子设备及存储介质 |
CN111881339B (zh) * | 2020-06-05 | 2024-03-22 | 百度在线网络技术(北京)有限公司 | 资源信息的推送、通知方法、装置、电子设备及存储介质 |
CN111711559B (zh) * | 2020-06-12 | 2022-04-05 | 北京百度网讯科技有限公司 | 用于撤回信息的方法和装置 |
CN112256822A (zh) * | 2020-10-21 | 2021-01-22 | 平安科技(深圳)有限公司 | 文本搜索方法、装置、计算机设备和存储介质 |
CN112395044B (zh) * | 2020-11-10 | 2023-04-28 | 新华三技术有限公司合肥分公司 | 命令行关键词填充方法、装置及网络设备 |
CN112487297A (zh) * | 2020-12-09 | 2021-03-12 | 贝壳技术有限公司 | 信息推送方法、装置、电子设备和存储介质 |
CN112861534B (zh) * | 2021-01-18 | 2023-07-21 | 北京奇艺世纪科技有限公司 | 一种对象名称识别方法及装置 |
CN112819512B (zh) * | 2021-01-22 | 2023-03-24 | 北京有竹居网络技术有限公司 | 一种文本处理方法、装置、设备及介质 |
CN112768080A (zh) * | 2021-01-25 | 2021-05-07 | 武汉大学 | 基于医疗大数据的医学关键词库建立方法及系统 |
CN113033198B (zh) * | 2021-03-25 | 2022-08-26 | 平安国际智慧城市科技股份有限公司 | 相似文本推送方法、装置、电子设备及计算机存储介质 |
CN113111085B (zh) * | 2021-04-08 | 2024-01-30 | 达观数据有限公司 | 基于流式数据的自动化层级探索方法和装置 |
CN113177402B (zh) * | 2021-04-26 | 2024-03-01 | 平安科技(深圳)有限公司 | 词语替换方法、装置、电子设备和存储介质 |
CN113191811B (zh) * | 2021-05-10 | 2022-07-01 | 北京顶当互动科技有限公司 | 一种广告智能推送方法、设备及计算机可读存储介质 |
CN113177061B (zh) * | 2021-05-25 | 2023-05-16 | 马上消费金融股份有限公司 | 一种搜索方法、装置和电子设备 |
CN113836346B (zh) * | 2021-09-08 | 2023-08-08 | 网易(杭州)网络有限公司 | 为音频文件生成摘要的方法、装置、计算设备及存储介质 |
CN114422584B (zh) * | 2021-12-16 | 2023-07-07 | 北京百度网讯科技有限公司 | 资源的推送方法、设备和存储介质 |
CN116167352B (zh) * | 2023-04-03 | 2023-07-21 | 联仁健康医疗大数据科技股份有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN116842138A (zh) * | 2023-07-24 | 2023-10-03 | 上海诚狐信息科技有限公司 | 基于文档的检索方法、装置、设备及存储介质 |
CN117076658B (zh) * | 2023-08-22 | 2024-05-03 | 南京朗拓科技投资有限公司 | 基于信息熵的引文推荐方法、装置及终端 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070150342A1 (en) * | 2005-12-22 | 2007-06-28 | Law Justin M | Dynamic selection of blended content from multiple media sources |
CN101315624B (zh) * | 2007-05-29 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 一种文本主题推荐的方法和装置 |
JP4859893B2 (ja) * | 2008-08-12 | 2012-01-25 | ヤフー株式会社 | 広告配信装置、広告配信方法、及び広告配信制御プログラム |
JP4934169B2 (ja) * | 2009-06-24 | 2012-05-16 | ヤフー株式会社 | カテゴリを対応付けする装置、方法、およびプログラム |
CN102081642A (zh) * | 2010-10-28 | 2011-06-01 | 华南理工大学 | 搜索引擎检索结果聚类的中文标签提取方法 |
JP5559750B2 (ja) * | 2011-07-12 | 2014-07-23 | ヤフー株式会社 | 広告処理装置、情報処理システム及び広告処理方法 |
US20150287080A1 (en) * | 2014-04-04 | 2015-10-08 | Gayathri Ravichandran Geetha | Contextual promotions |
JP6235443B2 (ja) * | 2014-09-17 | 2017-11-22 | ヤフー株式会社 | 抽出装置、抽出方法および抽出プログラム |
CN104899322B (zh) * | 2015-06-18 | 2021-09-17 | 百度在线网络技术(北京)有限公司 | 搜索引擎及其实现方法 |
US20170017998A1 (en) * | 2015-07-17 | 2017-01-19 | Adobe Systems Incorporated | Determining context and mindset of users |
CN105893410A (zh) * | 2015-11-18 | 2016-08-24 | 乐视网信息技术(北京)股份有限公司 | 一种关键词提取方法和装置 |
-
2016
- 2016-12-26 CN CN201611216735.3A patent/CN108241667B/zh active Active
-
2017
- 2017-05-31 JP JP2017108224A patent/JP6511487B2/ja active Active
- 2017-06-08 US US15/617,337 patent/US10726446B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN108241667B (zh) | 2019-10-15 |
US10726446B2 (en) | 2020-07-28 |
JP2018106658A (ja) | 2018-07-05 |
US20180181988A1 (en) | 2018-06-28 |
CN108241667A (zh) | 2018-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6511487B2 (ja) | 情報プッシュ用の方法及び装置 | |
US11281860B2 (en) | Method, apparatus and device for recognizing text type | |
US20130263019A1 (en) | Analyzing social media | |
CN110069698B (zh) | 信息推送方法和装置 | |
US20150046371A1 (en) | System and method for determining sentiment from text content | |
WO2017000402A1 (zh) | 网页生成方法和装置 | |
CN107679119B (zh) | 生成品牌衍生词的方法和装置 | |
JP2012160201A (ja) | レビュー処理方法およびシステム | |
TW201905736A (zh) | 資訊推送方法及系統 | |
US11423096B2 (en) | Method and apparatus for outputting information | |
Thomaidou et al. | Automated snippet generation for online advertising | |
CN107609192A (zh) | 一种搜索引擎的补充搜索方法和装置 | |
WO2016040772A1 (en) | Method and apparatus of matching an object to be displayed | |
CN110750707A (zh) | 关键词推荐方法、装置和电子设备 | |
Hidayatullah et al. | Topic modeling on Indonesian online shop chat | |
CN112116426A (zh) | 一种推送物品信息的方法和装置 | |
JP6341899B2 (ja) | 広告システム及び広告配信方法 | |
CN106257449B (zh) | 一种信息确定方法和装置 | |
US10339559B2 (en) | Associating social comments with individual assets used in a campaign | |
JP6509590B2 (ja) | 商品に対するユーザの感情分析装置及びプログラム | |
Yengi et al. | Distributed recommender systems with sentiment analysis | |
Sharma et al. | Recommending who to follow in the software engineering twitter space | |
CN107679030B (zh) | 基于用户操作行为数据提取同义词的方法和装置 | |
CN110750708A (zh) | 关键词推荐方法、装置和电子设备 | |
US11568137B2 (en) | Mapping text content feedback to a process via a synonym graph |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180821 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190326 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190408 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6511487 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |