RU2016107443A - Способ и устройство для рекомендации справочных документов - Google Patents

Способ и устройство для рекомендации справочных документов Download PDF

Info

Publication number
RU2016107443A
RU2016107443A RU2016107443A RU2016107443A RU2016107443A RU 2016107443 A RU2016107443 A RU 2016107443A RU 2016107443 A RU2016107443 A RU 2016107443A RU 2016107443 A RU2016107443 A RU 2016107443A RU 2016107443 A RU2016107443 A RU 2016107443A
Authority
RU
Russia
Prior art keywords
search
words
reference documents
target document
display
Prior art date
Application number
RU2016107443A
Other languages
English (en)
Inventor
ЧЭНЬ Чжицзюнь
ЧЖАН Тао
ВАН Пинцзэ
Original Assignee
Сяоми Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Сяоми Инк. filed Critical Сяоми Инк.
Publication of RU2016107443A publication Critical patent/RU2016107443A/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Claims (58)

1. Способ рекомендации справочных документов, включающий:
получение информации о содержании целевого документа, с которым работает пользователь;
анализ информации о содержании в соответствии с заранее заданным правилом анализа;
отсеивание ключевой информации, полученной в результате анализа, для извлечения поисковых слов из ключевой информации;
выполнение поиска на основе поисковых слов для получения справочных документов, содержащих поисковые слова; и
отображение справочных документов.
2. Способ по п. 1, отличающийся тем, что заранее заданное правило анализа содержит правило извлечения отмеченного содержания и правило сегментирования, а анализ информации о содержании в соответствии с заранее заданным правилом анализа включает:
извлечение отмеченного содержания в информации о содержании в соответствии с правилом извлечения отмеченного содержания, причем отмеченное содержание содержит заголовок целевого документа и/или ключевое слово, указанное в целевом документе; и
сегментирование информации о содержании, в отношении которой было выполнено извлечение отмеченного содержания, в соответствии с правилом сегментирования для получения соответствующих сегментированных слов-сегментов.
3. Способ по п. 2, отличающийся тем, что ключевая информация содержит отмеченное содержание и слова-сегменты, а отсеивание ключевой информации, полученной в результате анализа, для извлечения поисковых слов из ключевой информации, включает:
удаление посторонних слов из соответствующих слов-сегментов, причем посторонние слова содержат один или более типов из числа союзов, слов, состоящих из одного символа, и местоимений;
сортировку по частоте соответствующих слов-сегментов, оставшихся после удаления; и
выбор определенного количества слов-сегментов в нисходящем порядке по частоте, причем указанное определенное количество соответствует заранее заданному пороговому значению, и удаление из выбранных слов-сегментов таких слов-сегментов, которые идентичны отмеченному содержанию, для получения отсеянных слов-сегментов, при этом отсеянные слова-сегменты и отмеченное содержание образуют поисковые слова.
4. Способ по п. 1, отличающийся тем, что выполнение поиска на основе поисковых слов для получения справочных документов, содержащих поисковые слова, включает импортирование поисковых слов в поисковую базу для поиска с целью получения справочных документов, которые содержат поисковые слова, причем поисковая база содержит один или более компонентов из числа локального носителя информации, устройства облачного хранения, заранее установленного пользователем, и общедоступного ресурса поисковой системы.
5. Способ по п. 1, отличающийся тем, что после выполнения поиска на основе поисковых слов дополнительно включает оценку документов, полученных посредством поиска, на основе заранее заданного оценочного правила, содержащего один или более элементов из числа коэффициента, относящегося к количеству цитирований, доли положительных отзывов и уровня качества документа;
причем получение справочных документов, содержащих поисковые слова, включает сортировку найденных справочных документов на основе результата оценки в порядке предпочтения.
6. Способ по п. 1, отличающийся тем, что после отсеивания ключевой информации, полученной в результате анализа, для извлечения поисковых слов из ключевой информации дополнительно включает сортировку поисковых слов на основе расстояний между позициями поисковых слов в целевом документе и позицией текущего вводимого пользователем символа или на основе весовых значений поисковых слов в целевом документе;
причем выполнение поиска на основе ключевых слов включает выполнение поиска на основе порядка отсортированных поисковых слов.
7. Способ по п. 1, отличающийся тем, что дополнительно включает выполнение семантического анализа целевого документа для получения предметного атрибута целевого документа;
причем после получения справочных документов, сходных с целевым документом, способ дополнительно включает сортировку справочных документов на основе предметного атрибута для предпочтительного отображения справочных документов с высокой степенью соответствия предметному атрибуту.
8. Способ по п. 1, отличающийся тем, что отображение справочных документов включает отображение справочных документов в том же окне, в котором отображается целевой документ, или отображение справочных документов в другом окне, отличном от окна, в котором отображается целевой документ.
9. Способ по п. 8, отличающийся тем, что отображение справочных документов в том же окне, в котором отображается целевой документ, включает отображение справочных документов и целевого документа в столбцах, при этом справочные документы расположены с любой стороны окна; или отображение справочных документов с наложением на целевой документ в форме плавающего окна.
10. Устройство для рекомендации справочных документов, содержащее
получающий модуль, выполненный с возможностью получения информации о содержании целевого документа, с которым работает пользователь;
анализирующий модуль, выполненный с возможностью анализа информации о содержании в соответствии с заранее заданным правилом анализа;
отсеивающий модуль, выполненный с возможностью отсеивания ключевой информации, полученной в результате анализа, для извлечения поисковых слов из ключевой информации;
поисковый модуль, выполненный с возможностью выполнения поиска на основе поисковых слов для получения справочных документов, содержащих поисковые слова; и
отображающий модуль, выполненный с возможностью отображения справочных документов.
11. Устройство по п. 10, отличающееся тем, что заранее заданное правило анализа содержит правило извлечения отмеченного содержания и правило сегментирования, и анализирующий модуль содержит
извлекающий подмодуль, выполненный с возможностью извлечения отмеченного содержания в информации о содержании в соответствии с правилом извлечения отмеченного содержания, причем отмеченное содержание может содержать заголовок целевого документа и/или ключевое слово, указанное в целевом документе; и
обрабатывающий подмодуль, выполненный с возможностью сегментирования информации о содержании, в которой извлекающий подмодуль извлек отмеченное содержание, в соответствии с правилом сегментирования для получения соответствующих сегментированных слов-сегментов.
12. Устройство по п. 11, отличающееся тем, что ключевая информация содержит отмеченное содержание и слова-сегменты, и отсеивающий модуль содержит
удаляющий подмодуль, выполненный с возможностью удаления посторонних слов из слов-сегментов, причем посторонние слова содержат один или более типов из числа союзов, слов, состоящих из одного символа, и местоимений;
сортирующий подмодуль, выполненный с возможностью сортировки по частоте соответствующих слов-сегментов, оставшихся после удаления, выполненного удаляющим подмодулем;
выбирающий подмодуль, выполненный с возможностью выбора определенного количества слов-сегментов в нисходящем порядке по частоте, причем указанное определенное количество соответствует заранее заданному пороговому значению; и
подмодуль удаления повторов, выполненный с возможностью удаления из слов-сегментов, выбранных выбирающим подмодулем, таких слов-сегментов, которые идентичны отмеченному содержанию, для получения отсеянных слов-сегментов, при этом отсеянные слова-сегменты и отмеченное содержание образуют поисковые слова.
13. Устройство по п. 10, отличающееся тем, что поисковый модуль содержит
импортирующий подмодуль, выполненный с возможностью импортирования поисковых слов в поисковую базу;
первый поисковый подмодуль, выполненный с возможностью поиска поисковых слов, импортированных импортирующим подмодулем, с целью получения справочных документов, которые содержат поисковые слова;
причем поисковая база содержит один или более компонентов из числа локального носителя информации, устройства облачного хранения, заранее установленного пользователем, и общедоступного ресурса поисковой системы.
14. Устройство по п. 10, отличающееся тем, что дополнительно содержит оценочный модуль, выполненный с возможностью оценки документов, полученных посредством поиска, на основе заранее заданного оценочного правила, содержащего один или более элементов из числа коэффициента, относящегося к количеству цитирований, доли положительных отзывов и уровня качества документа;
причем поисковый модуль содержит сортирующий подмодуль, выполненный с возможностью сортировки найденных справочных документов на основе результата оценки в порядке предпочтения.
15. Устройство по п. 10, отличающееся тем, что дополнительно содержит первый сортирующий модуль, выполненный с возможностью сортировки поисковых слов на основе расстояний между позициями поисковых слов в целевом документе и позицией текущего вводимого пользователем символа или на основе весовых значений поисковых слов в целевом документе,
причем поисковый модуль содержит второй поисковый подмодуль, выполненный с возможностью выполнения поиска на основе порядка поисковых слов, отсортированных первым сортирующим модулем.
16. Устройство по п. 10, отличающееся тем, что дополнительно содержит
модуль получения предмета, выполненный с возможностью выполнения семантического анализа целевого документа для получения предметного атрибута целевого документа; и
второй сортирующий модуль, выполненный с возможностью сортировки справочных документов на основе предметного атрибута, полученного модулем получения предмета;
причем отображающий модуль содержит первый отображающий подмодуль, выполненный с возможностью предпочтительного отображения справочных документов с высокой степенью соответствия предметному атрибуту.
17. Устройство по п. 10, отличающееся тем, что отображающий модуль содержит
второй отображающий подмодуль, выполненный с возможностью отображения справочных документов в том же окне, в котором отображается целевой документ; и
третий отображающий подмодуль, выполненный с возможностью отображения справочных документов в другом окне, отличном от окна, в котором отображается целевой документ.
18. Устройство по п. 17, отличающееся тем, что второй отображающий подмодуль содержит
отображающий подмодуль столбцов, выполненный с возможностью отображения справочных документов и целевого документа в столбцах, при этом справочные документы расположены с любой стороны окна; и
отображающий подмодуль плавающего окна, выполненный с возможностью отображения справочных документов с наложением на целевой документ в форме плавающего окна.
19. Устройство для рекомендации справочных документов, содержащее
процессор;
память для хранения инструкций, исполняемых процессором;
причем процессор выполнен с возможностью: получения информации о содержании целевого документа, с которым работает пользователь; анализа информации о содержании в соответствии с заранее заданным правилом анализа; отсеивания ключевой информации, полученной в результате анализа, для извлечения поисковых слов из ключевой информации; выполнения поиска на основе поисковых слов для получения справочных документов, содержащих поисковые слова; отображения справочных документов.
RU2016107443A 2015-11-27 2015-12-28 Способ и устройство для рекомендации справочных документов RU2016107443A (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510849040.8A CN105488151A (zh) 2015-11-27 2015-11-27 参考文档的推荐方法及装置
CN201510849040.8 2015-11-27
PCT/CN2015/099283 WO2017088245A1 (zh) 2015-11-27 2015-12-28 参考文档的推荐方法及装置

Publications (1)

Publication Number Publication Date
RU2016107443A true RU2016107443A (ru) 2017-09-28

Family

ID=55628937

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016107443A RU2016107443A (ru) 2015-11-27 2015-12-28 Способ и устройство для рекомендации справочных документов

Country Status (7)

Country Link
US (1) US20170154104A1 (ru)
EP (1) EP3173948A1 (ru)
JP (1) JP2018504727A (ru)
CN (1) CN105488151A (ru)
MX (1) MX2016002723A (ru)
RU (1) RU2016107443A (ru)
WO (1) WO2017088245A1 (ru)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095737A (zh) * 2016-06-07 2016-11-09 杭州凡闻科技有限公司 文档相似度计算方法及相似文档全网检索跟踪方法
CN105930546B (zh) * 2016-07-08 2020-04-03 北京北大英华科技有限公司 文件关联显示方法
CN108132941B (zh) * 2016-11-30 2021-03-26 北京国双科技有限公司 法律文献的关联关系的处理方法和装置
CN107731285B (zh) * 2017-05-10 2022-08-19 上海明品医学数据科技有限公司 一种分级教育系统教育贡献度计算方法
JP6734229B2 (ja) * 2017-06-20 2020-08-05 日本電信電話株式会社 関連情報表示装置、関連情報表示方法および関連情報表示プログラム
KR102410825B1 (ko) * 2017-08-14 2022-06-20 삼성전자주식회사 문장의 도메인 판단 방법 및 장치
JP6965773B2 (ja) * 2018-02-02 2021-11-10 日本電信電話株式会社 提示装置、提示方法および提示プログラム
CN108228906B (zh) * 2018-02-08 2019-11-08 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN109241364A (zh) * 2018-07-13 2019-01-18 广州神马移动信息科技有限公司 参考信息的生成方法、装置和设备/终端/服务器
CN109325093A (zh) * 2018-08-24 2019-02-12 深圳职业技术学院 参考文献自动生成方法、装置及计算机可读取存储介质
US11468679B2 (en) * 2018-11-11 2022-10-11 Netspark Ltd. On-line video filtering
CN109726390B (zh) * 2018-12-06 2023-07-21 天津字节跳动科技有限公司 文档处理方法、装置、电子设备和存储介质
CN111400464B (zh) * 2019-01-03 2023-05-26 百度在线网络技术(北京)有限公司 一种文本生成方法、装置、服务器及存储介质
CN109766412B (zh) * 2019-01-16 2021-03-30 广东小天才科技有限公司 一种基于图像识别的学习内容获取方法及电子设备
CN109858005B (zh) * 2019-03-07 2024-01-12 百度在线网络技术(北京)有限公司 基于语音识别的文档更新方法、装置、设备及存储介质
CN110148004A (zh) * 2019-04-04 2019-08-20 平安科技(深圳)有限公司 药品价格鉴别方法、装置、计算机设备以及存储介质
CN110297965B (zh) * 2019-04-18 2021-07-13 广州视源电子科技股份有限公司 课件页面的显示及页面集的构造方法、装置、设备和介质
CN113641783A (zh) * 2020-04-27 2021-11-12 北京庖丁科技有限公司 基于关键语句的内容块检索方法、装置、设备和介质
CN114491092B (zh) * 2022-01-26 2023-02-10 深圳市前海手绘科技文化有限公司 一种根据文档内容和配色推荐素材的方法和系统
US11620441B1 (en) 2022-02-28 2023-04-04 Clearbrief, Inc. System, method, and computer program product for inserting citations into a textual document

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7133862B2 (en) * 2001-08-13 2006-11-07 Xerox Corporation System with user directed enrichment and import/export control
JP2003308314A (ja) * 2002-02-15 2003-10-31 Ricoh Co Ltd 文書作成支援装置
US8244720B2 (en) * 2005-09-13 2012-08-14 Google Inc. Ranking blog documents
US7814102B2 (en) * 2005-12-07 2010-10-12 Lexisnexis, A Division Of Reed Elsevier Inc. Method and system for linking documents with multiple topics to related documents
US8725729B2 (en) * 2006-04-03 2014-05-13 Steven G. Lisa System, methods and applications for embedded internet searching and result display
JP2008077252A (ja) * 2006-09-19 2008-04-03 Ricoh Co Ltd 文書ランキング方法、文書検索方法、文書ランキング装置、文書検索装置、及び記録媒体
CN101022377A (zh) * 2007-01-31 2007-08-22 北京邮电大学 一种基于服务关系本体的交互式服务创建方法
CN101276341A (zh) * 2007-03-29 2008-10-01 上海汉光知识产权数据科技有限公司 专利数据检索系统
CN101276339A (zh) * 2007-03-29 2008-10-01 上海汉光知识产权数据科技有限公司 专利数据检索方法
JP4921335B2 (ja) * 2007-12-10 2012-04-25 キヤノン株式会社 ドキュメント処理装置及び検索方法
JP2010211688A (ja) * 2009-03-12 2010-09-24 Canon Inc 文書編集装置、データ処理方法及びプログラム
KR101050013B1 (ko) * 2009-04-30 2011-07-19 엔에이치엔(주) 대표자의 신뢰도를 이용한 검색 결과 순위화 장치 및 방법
JP2010267019A (ja) * 2009-05-13 2010-11-25 Internatl Business Mach Corp <Ibm> 文書作成を支援する方法、並びにそのコンピュータ・システム及びコンピュータ・プログラム
CN101901235B (zh) * 2009-05-27 2013-03-27 国际商业机器公司 文档处理方法和系统
US20110099464A1 (en) * 2009-10-28 2011-04-28 Yahoo! Inc. Mechanism for adding content from a search to a document or message
CN101782920B (zh) * 2009-12-23 2013-06-05 中国科学院自动化研究所 面向综合集成研讨环境的信息推荐方法
CN102262625B (zh) * 2009-12-24 2014-02-26 华为技术有限公司 网页关键词提取方法及装置
JP2010231802A (ja) * 2010-06-04 2010-10-14 Ird:Kk 情報処理システム
JP5427119B2 (ja) * 2010-06-14 2014-02-26 日本電信電話株式会社 類似文書検索装置、類似文書検索方法、そのプログラムおよび記録媒体
US10192199B2 (en) * 2011-11-16 2019-01-29 Microsoft Technology Licensing, Llc Enabling service features within productivity applications
CN103389970B (zh) * 2012-05-08 2016-05-25 北京华宇软件股份有限公司 基于实时学习的word辅助编写系统和方法
CN103559310A (zh) * 2013-11-18 2014-02-05 广东利为网络科技有限公司 一种从文章中提取关键词的方法
CN104090958A (zh) * 2014-07-04 2014-10-08 许昌学院 一种基于领域本体的语义信息检索系统及方法
CN104615655B (zh) * 2014-12-31 2019-04-23 小米科技有限责任公司 信息推荐方法和装置

Also Published As

Publication number Publication date
JP2018504727A (ja) 2018-02-15
CN105488151A (zh) 2016-04-13
MX2016002723A (es) 2017-06-19
EP3173948A1 (en) 2017-05-31
WO2017088245A1 (zh) 2017-06-01
US20170154104A1 (en) 2017-06-01

Similar Documents

Publication Publication Date Title
RU2016107443A (ru) Способ и устройство для рекомендации справочных документов
KR101658794B1 (ko) 문서 분류 시스템, 문서 분류 방법 및 문서 분류 프로그램
KR100816923B1 (ko) 문서 분류 시스템 및 그 방법
KR100706389B1 (ko) 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치
CN104537065A (zh) 一种搜索结果的推送方法及系统
CN105843850B (zh) 搜索优化方法和装置
CN106156372B (zh) 一种互联网网站的分类方法及装置
CN105404699A (zh) 一种搜索财经文章的方法、装置及服务器
US20180341686A1 (en) System and method for data search based on top-to-bottom similarity analysis
JP2013182338A5 (ru)
CN102495892A (zh) 一种网页信息抽取方法
CN104361037B (zh) 微博分类方法及装置
KR101700820B1 (ko) 사용자 코멘트 기반 개인화 컨텐츠 검색 장치 및 방법
CN105512333A (zh) 基于情感倾向的产品评论主题搜索方法
US20150206101A1 (en) System for determining infringement of copyright based on the text reference point and method thereof
CN106844482B (zh) 一种基于搜索引擎的检索信息匹配方法及装置
CN106250402B (zh) 一种网站分类方法及装置
TW201415402A (zh) 取證系統、取證方法及取證程式
JP2015144011A (ja) 代表者の信頼度を用いた検索結果順位化装置および方法
KR101011726B1 (ko) 스니펫 제공 장치 및 방법
TWI556128B (zh) Forensic system, forensic method and evidence collection program
CN105786936A (zh) 用于对搜索数据进行处理的方法及设备
CN106202349B (zh) 网页分类字典生成方法及装置
TW201508525A (zh) 文件分類系統、文件分類方法及文件分類程式
KR101850853B1 (ko) 빅데이터를 이용한 검색 방법 및 장치

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20180110