WO2018053735A1 - 一种搜索方法及系统 - Google Patents

一种搜索方法及系统 Download PDF

Info

Publication number
WO2018053735A1
WO2018053735A1 PCT/CN2016/099652 CN2016099652W WO2018053735A1 WO 2018053735 A1 WO2018053735 A1 WO 2018053735A1 CN 2016099652 W CN2016099652 W CN 2016099652W WO 2018053735 A1 WO2018053735 A1 WO 2018053735A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
search
information
feature point
specific word
Prior art date
Application number
PCT/CN2016/099652
Other languages
English (en)
French (fr)
Inventor
朱小军
朱象群
Original Assignee
朱小军
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 朱小军 filed Critical 朱小军
Priority to PCT/CN2016/099652 priority Critical patent/WO2018053735A1/zh
Publication of WO2018053735A1 publication Critical patent/WO2018053735A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Definitions

  • the present invention relates to the field of Internet technologies, and in particular, to a search method and system.
  • the technical problem to be solved by the present invention is to provide a search method and system for improving the reading speed and the reading experience in view of the above-mentioned defects of the reading speed and the reading experience of the prior art.
  • the technical solution adopted by the present invention to solve the technical problem thereof is: constructing a search method, comprising: [0006] A. receiving a search instruction triggered by a user for a specific word in a current reading file;
  • C analyzing the current read file to extract at least one feature point
  • D acquiring a search result information according to the specific word, the attribute information of the user, and the at least one feature point.
  • the step C includes:
  • C1. Perform lexical analysis on the sentence in which the specific word is located to obtain the part-of-speech tag of the specific word, and use the obtained part-of-speech tag as the first feature point.
  • the step C includes:
  • the step C includes:
  • the step C includes:
  • the method further includes:
  • step C is:
  • the step B includes:
  • the first attribute information includes at least one of the following: occupation, age, school, profession, region, hobby.
  • the step B includes:
  • B2. Acquire second attribute information of the user according to the historical access log of the user, where the second attribute information includes at least one of the following: a professional background, a search habit.
  • the method further includes:
  • step D is:
  • the step D includes: [0031] Dl.
  • the intermediate result information is obtained according to the specific word, the intermediate result information includes a plurality of entries; [0032] D2. calculating the intermediate result information according to the user attribute information and the at least one feature point The degree of matching for each entry;
  • the method further includes:
  • G The obtained search result information is displayed in a floating window on the display page of the current reading file.
  • the step A is:
  • the present invention also constructs a search system, including:
  • a triggering module configured to receive a search instruction triggered by a user for a specific word in the current reading file
  • an attribute obtaining module configured to acquire attribute information of the user
  • a feature acquisition module configured to analyze the current read file to extract at least one feature point
  • a search module configured to use, according to the specific word, the user attribute information, and the at least one feature Click to get search result information.
  • the feature acquisition module comprises at least one of the following:
  • a first obtaining unit configured to perform lexical analysis on a sentence in which the specific word is located, to obtain a part-of-speech tag of the specific word, and use the obtained part-of-speech tag as a first feature point;
  • a second obtaining unit configured to perform syntax analysis on a sentence in which the specific word is located, to obtain a dependency label of the specific word in the sentence and an adjacent word thereof, and to perform the dependency relationship
  • the label serves as a second feature point
  • a third obtaining unit configured to extract a keyword in the current reading file, and use the keyword as a third feature point
  • the fourth obtaining unit is configured to extract topic information of the current reading file, and use the theme information as a fourth feature point.
  • the customization module is further included, and
  • the customization module is configured to receive a feature customization signal input by a user in advance
  • the feature acquiring module is configured to analyze the current read file according to the feature customization signal
  • the attribute obtaining module comprises at least one of the following:
  • the fifth obtaining unit is configured to acquire first attribute information of the user according to the setting information of the user registration, where the first attribute information includes at least one of the following: occupation, age, school, profession, region, hobby;
  • the sixth obtaining unit is configured to acquire second attribute information of the user according to the historical access log of the user, where the second attribute information includes at least one of the following: a professional background, a search habit.
  • an intervention setting module is further included, and
  • the intervention setting module is configured to receive intervention condition information set by a user
  • the search module is configured to obtain a search result according to the specific word, the user attribute information, the at least one feature point, and the intervention condition information.
  • the searching module includes:
  • a search unit configured to acquire intermediate result information according to the specific word, where the intermediate result information includes multiple entries
  • a calculating unit configured to calculate, according to the user attribute information and the at least one feature point, a matching degree of each entry in the intermediate result information
  • a generating unit configured to generate search result information according to the obtained intermediate result information and the calculated matching degree.
  • the method further includes:
  • a display module configured to display the obtained search result information in a floating window on a display page of the current read file.
  • the searched result information is closer to the real needs of the user, and therefore, the user receives The search result information can be reduced, which greatly improves the reading speed and reading experience.
  • Embodiment 1 is a flowchart of Embodiment 1 of a search method of the present invention
  • Embodiment 1 of the search system of the present invention is a logical structural diagram of Embodiment 1 of the search system of the present invention.
  • the search method provided by the present invention can be applied to a terminal.
  • the terminal includes but is not limited to smart phones, tablets, handheld computers, PAD
  • the operating system of the terminal may include but is not limited to the Android operating system, IOS
  • the search method of this embodiment includes the following steps:
  • Step A Receive a search instruction triggered by the user for a particular word in the current reading file.
  • the search instruction can be triggered by operating a touch screen or a mouse on the terminal.
  • the user may first select a word to be queried, and the selected word may be displayed in a floating display, and then the user may further trigger the selected word, for example, clicking a preset button, long pressing the button Selected words, etc., to enter search instructions.
  • the search instruction is directly triggered, so that the search can be realized, the time is saved, and the efficiency is improved.
  • Step B Obtain attribute information of the user.
  • the attribute information of the user includes, but is not limited to, occupation, age, school, profession, region, hobby, background, search habit, etc.
  • the acquisition of the attribute information may be set by the user, or may be adopted by the system. The way to learn is obtained.
  • Step C Perform analysis on the current reading file to extract at least one feature point.
  • the current read file is first acquired, and then the file is analyzed to extract at least one feature point, including but not limited to: part of speech tag, dependency tag, keyword, topic information
  • Step D Acquire search result information according to the specific word, the user attribute information, and the at least one feature point.
  • the searched result information is closer to the real part of the user. demand.
  • the attribute of the user may be obtained by at least one of the following methods:
  • the first attribute information of the user is obtained according to the setting information of the user registration, and the first attribute information includes at least one of the following: occupation, age, school, profession, region, hobby.
  • the user can set the user information after registration, for example, the age is 30, the region is China, the school is Huazhong University of Science and Technology, the major is electrical engineering and automation, the occupation is electrical engineer, and the hobby is Photography, etc.
  • the first attribute information of the user can be extracted.
  • the system obtains the second attribute information of the user through the historical access log of the user. For example, if the user visits the blog within the past year, 85% of the articles read are electrical professional articles, and 70% of the articles read are articles by the same author. In this case, the professional background of the user can be obtained for electrical engineering, and the search habit is to select the author's article.
  • the feature point may be acquired by at least one of the following methods: [0080] 1. Perform lexical analysis on the sentence in which the specific word is located to obtain the part of speech of the specific word. Label, and take the obtained part of speech tag as the first feature point.
  • part-of-speech tagging refers to a most appropriate part-of-speech tag determined according to the context information in the sentence, and the part of speech can be marked by characters.
  • part of speech can include: nouns, adjectives, verbs, adverbs, conjunctions, orientation Words, names, place names, prepositions, quantifiers, auxiliary words, punctuation, etc.
  • [0081] Syntactically analyzing a sentence in which the specific word is located, obtaining a dependency label between the specific word in the sentence and an adjacent word thereof, and using the dependency label as a second feature point.
  • the sentence of the specific word is "Newton (January 4, 1643 - March 31, 1727) jazz, Royal Society President, a famous British physicist
  • the dependence of the particular word on the adjacent word can be obtained as: blank (the first word in the sentence, no dependency on the preceding word) and Subject-predicate relationship.
  • the determined dependency relationship can be used as the second feature point.
  • dependency relationship refers to the syntactic relationship of each word.
  • dependency relationship may include: subject-predicate relationship, verb-object relationship, verb-complement relationship, collocation relationship, parallel relationship, pre-object, "de” word structure, "" word structure, and "land” word structure.
  • the method before step A, the method further includes:
  • Step E The feature customization signal input by the user is received in advance.
  • some controls may be set for the user to select the feature customization signal.
  • the feature customization signal set by a certain user is: Keywords; another user-set feature customization signal is: subject information, part of speech Label, dependency label.
  • the priority of these feature custom signals can be set.
  • step C is:
  • the analysis can obtain the keywords of the file; when the user sets multiple feature customization letters
  • the numbers are: subject information, part-of-speech tag, and dependency tag ⁇ .
  • the search result information may be obtained by the following steps: [0091] Step D1. Obtain intermediate result information according to the specific word, where the intermediate result information includes multiple entries
  • the search is performed from the database by using the "specific word" selected by the user as the search entry, and the intermediate result information is obtained.
  • Step D2. Calculate the matching degree of each entry in the intermediate result information according to the user attribute information and the at least one feature point.
  • Step D3. Generate search result information according to the obtained intermediate result information and the calculated matching degree.
  • a plurality of entries in the intermediate result information may be sorted according to the calculated matching degree, and the sorted result information is pushed to the user as a search result.
  • multiple entries in the intermediate result information may also be filtered according to the calculated matching degree, and the filtered result information is pushed to the user as a search result, so that only relevant content can be pushed to the user, and the shielding is irrelevant. Content.
  • the search method of the present invention further includes:
  • Step F receiving intervention condition information set by the user
  • an area may be set on the page for the user to input "intervention condition information".
  • intervention condition information For example, when the user wants to search for the relevant document of the specific word "attitude sensor” applied to the car, the user can trigger the search command of the "attitude sensor", and set the intervention condition information to be "car”, for example.
  • step D is:
  • the search method of the present invention further includes: [0103] Step G. Display the acquired search result information in a floating window on the display page of the current read file.
  • the obtained search result is displayed in the floating window of the currently displayed page, so that the search result and the reading file are displayed in the same page, and no jump between the windows is required, and the operation steps are reduced.
  • the search system provided by the present invention can be applied to a terminal.
  • the terminal includes but is not limited to smart phones, tablets, handheld computers, PAD
  • the operating system of the terminal may include but is not limited to the Android operating system, IOS
  • the search system of this embodiment includes: a trigger module 10, a property acquisition module 20, a feature acquisition module 30, and a search module 40.
  • the triggering module 10 is configured to receive a search instruction triggered by a user for a specific word in the current reading file;
  • the attribute obtaining module 20 is configured to acquire attribute information of the user;
  • the feature acquiring module 30 is configured to analyze the current reading file.
  • the search module 40 is configured to obtain search result information according to the specific word, the user attribute information, and the at least one feature point.
  • the triggering module 10 is configured to receive a selection signal of the user for a specific word in the current reading file, and trigger a search instruction, so that the search can be realized, the time is reduced, and the efficiency is improved.
  • the attribute acquisition module 20 may include at least one of the following: a fifth acquisition unit, a sixth acquisition unit.
  • the fifth obtaining unit is configured to acquire first attribute information of the user according to the setting information of the user registration, where the first attribute information includes at least one of the following: occupation, age, school, profession, region, hobby;
  • the obtaining unit is configured to obtain second attribute information of the user according to the historical access log of the user, where the second attribute information includes at least one of the following: a professional background, a search habit.
  • the feature acquisition module 30 may include at least one of the following: a first acquisition unit, a second acquisition unit, a third acquisition unit, and a fourth acquisition unit, where the first acquisition unit is configured to use the specific
  • the sentence in which the word is located is subjected to lexical analysis to obtain the part-of-speech tag of the specific word, and the obtained part-of-speech tag is used as the first feature point
  • the second obtaining unit is configured to perform syntactic analysis on the sentence in which the specific word is located, Obtaining a dependency label between the specific word in the sentence and its neighboring words, and using the dependency label as a second feature point
  • the third obtaining unit is configured to extract keywords in the current reading file And using the keyword as a third feature point
  • the fourth obtaining unit is configured to extract the current Read the subject information of the file and use the topic information as the fourth feature point.
  • the search system of the present invention further includes a customization module, and the customization module is configured to receive a feature customization signal input by the user in advance; the feature acquisition module is configured to analyze the current read file according to the feature customization signal. , to extract the corresponding feature points.
  • the search system of the present invention further includes an intervention setting module, and the intervention setting module is configured to receive intervention condition information set by the user; the search module is configured to use the specific word, the user attribute information, The at least one feature point and the intervention condition information acquire search results.
  • the search module 40 may specifically include: a search unit, a calculation unit, and a generation unit.
  • the search unit is configured to obtain intermediate result information according to the specific word, where the intermediate result information includes a plurality of items; and the calculating unit is configured to calculate the intermediate result information according to the user attribute information and the at least one feature point.
  • the matching degree of each item; the generating unit is configured to generate the search result information according to the obtained intermediate result information and the calculated matching degree.
  • the search system of the present invention further includes a display module, and the display module is configured to display the acquired search result information in a floating window on a display page of the current reading file. This allows the search results to be displayed on the same page as the read file, without the need to jump between windows, reducing the number of steps.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种搜索方法及系统,该搜索方法包括:接收用户针对当前阅读文件中的特定词所触发的搜索指令(A);获取用户的属性信息(B);对所述当前阅读文件进行分析,以提取至少一个特征点(C);根据所述特定词、所述用户的属性信息及所述至少一个特征点获取搜索结果信息(D)。

Description

一种搜索方法及系统 技术领域
[0001] 本发明涉及互联网技术领域, 尤其涉及一种搜索方法及系统。
背景技术
[0002] 用户在阅读文件吋, 往往需要借助一些工具査询文件中某个字词的含义、 相关 文章或与该字词有关的一些问题。 例如, 用户在阅读一篇英文文章吋, 需要査 询文中所出现的 "Newton"的含义。 或者, 用户在阅读一篇有关汽车的专利文件 吋, 需要对该文件中所出现的"姿态传感器"进行搜索, 以査询出与其相关的专利 文件。 此吋, 有可能搜索出大量不相关的内容, 例如, "Newton"的搜索结果可 能包括牛顿作为人名的介绍及牛顿作为力学单位的介绍; "姿态传感器 "的搜索结 果可能包括姿态传感器自身结构改进的专利, 还可能包括姿态传感器应用在手 机端、 飞行器等上的相关专利。 此吋, 仍然需要用户自行甄别搜索结果中到底 是哪个才是自己最想要的, 因此, 影响了阅读速度及阅读体验。
技术问题
[0003] 用户在阅读文件吋, 往往需要借助一些工具査询文件中某个字词的含义、 相关 文章或与该字词有关的一些问题。 有可能搜索出大量不相关的内容, 此吋, 仍 然需要用户自行甄别搜索结果中到底是哪个才是自己最想要的, 因此, 影响了 阅读速度及阅读体验。
问题的解决方案
技术解决方案
[0004] 本发明要解决的技术问题在于, 针对现有技术的上述阅读速度及阅读体验不高 的缺陷, 提供一种搜索方法及系统, 提高了阅读速度及阅读体验。
[0005] 本发明解决其技术问题所采用的技术方案是: 构造一种搜索方法, 包括: [0006] A . 接收用户针对当前阅读文件中的特定词所触发的搜索指令;
[0007] B . 获取用户的属性信息;
[0008] C . 对所述当前阅读文件进行分析, 以提取至少一个特征点; [0009] D . 根据所述特定词、 所述用户的属性信息及所述至少一个特征点获取搜索结 果 息。
[0010] 优选地, 所述步骤 C包括:
[0011] C1.对所述特定词所在的句子进行词法分析, 以获取所述特定词的词性标签, 并将所获取的词性标签作为第一特征点。
[0012] 优选地, 所述步骤 C包括:
[0013] C2.对所述特定词所在的句子进行句法分析, 以获取所述特定词在所述句子中 与其相邻词之间的依存关系标签, 并将所述依存关系标签作为第二特征点。
[0014] 优选地, 所述步骤 C包括:
[0015] C3.提取所述当前阅读文件中的关键词, 并将所述关键词作为第三特征点。
[0016] 优选地, 所述步骤 C包括:
[0017] C4.提取所述当前阅读文件的主题信息, 并将所述主题信息作为第四特征点。
[0018] 优选地, 在所述步骤 A之前, 还包括:
[0019] E. 预先接收用户输入的特征定制信号;
[0020] 所述步骤 C为:
[0021] 根据所述特征定制信号对所述当前阅读文件进行分析, 以提取相应的特征点。
[0022] 优选地, 所述步骤 B包括:
[0023] B1.根据用户注册吋的设置信息获取用户的第一属性信息, 所述第一属性信息 包括下列中的至少一个: 职业、 年齢、 学校、 专业、 地域、 爱好。
[0024] 优选地, 所述步骤 B包括:
[0025] B2.根据用户的历史访问日志获取用户的第二属性信息, 所述第二属性信息包 括下列中的至少一个: 专业背景、 搜索习惯。
[0026] 优选地, 在所述步骤 D之前, 还包括:
[0027] F . 接收用户设置的干预条件信息;
[0028] 所述步骤 D为:
[0029] 根据所述特定词、 所述用户属性信息、 所述至少一个特征点及所述干预条件信 息获取搜索结果。
[0030] 优选地, 所述步骤 D包括: [0031] Dl.根据所述特定词获取中间结果信息, 所述中间结果信息包括多个条目; [0032] D2.根据所述用户属性信息及所述至少一个特征点计算所述中间结果信息中每 个条目的匹配度;
[0033] D3.根据所获取的中间结果信息及所计算的匹配度生成搜索结果信息。
[0034] 优选地, 在所述步骤 D之后, 还包括:
[0035] G . 在当前阅读文件的显示页面上的悬浮窗内显示所获取的搜索结果信息。
[0036] 优选地, 所述步骤 A为:
[0037] 接收用户针对当前阅读文件中的特定词的选择信号, 并触发搜索指令。
[0038] 本发明还构造一种搜索系统, 包括:
[0039] 触发模块, 用于接收用户针对当前阅读文件中的特定词所触发的搜索指令; [0040] 属性获取模块, 用于获取用户的属性信息;
[0041] 特征获取模块, 用于对所述当前阅读文件进行分析, 以提取至少一个特征点; [0042] 搜索模块, 用于根据所述特定词、 所述用户属性信息及所述至少一个特征点获 取搜索结果信息。
[0043] 优选地, 所述特征获取模块包括下列中的至少一个:
[0044] 第一获取单元, 用于对所述特定词所在的句子进行词法分析, 以获取所述特定 词的词性标签, 并将所获取的词性标签作为第一特征点;
[0045] 第二获取单元, 用于对所述特定词所在的句子进行句法分析, 以获取所述特定 词在所述句子中与其相邻词之间的依存关系标签, 并将所述依存关系标签作为 第二特征点;
[0046] 第三获取单元, 用于提取所述当前阅读文件中的关键词, 并将所述关键词作为 第三特征点;
[0047] 第四获取单元, 用于提取所述当前阅读文件的主题信息, 并将所述主题信息作 为第四特征点。
[0048] 优选地, 还包括定制模块, 而且,
[0049] 所述定制模块, 用于预先接收用户输入的特征定制信号;
[0050] 所述特征获取模块, 用于根据所述特征定制信号对所述当前阅读文件进行分析
, 以提取相应的特征点。 [0051] 优选地, 所述属性获取模块包括下列中的至少一个:
[0052] 第五获取单元, 用于根据用户注册吋的设置信息获取用户的第一属性信息, 所 述第一属性信息包括下列中的至少一个: 职业、 年齢、 学校、 专业、 地域、 爱 好;
[0053] 第六获取单元, 用于根据用户的历史访问日志获取用户的第二属性信息, 所述 第二属性信息包括下列中的至少一个: 专业背景、 搜索习惯。
[0054] 优选地, 还包括干预设置模块, 而且,
[0055] 所述干预设置模块, 用于接收用户设置的干预条件信息;
[0056] 所述搜索模块, 用于根据所述特定词、 所述用户属性信息、 所述至少一个特征 点及所述干预条件信息获取搜索结果。
[0057] 优选地, 所述搜索模块包括:
[0058] 搜索单元, 用于根据所述特定词获取中间结果信息, 所述中间结果信息包括多 个条目;
[0059] 计算单元, 用于根据所述用户属性信息及所述至少一个特征点计算所述中间结 果信息中每个条目的匹配度;
[0060] 生成单元, 用于根据所获取的中间结果信息及所计算的匹配度生成搜索结果信 息。
[0061] 优选地, 还包括:
[0062] 显示模块, 用于在在当前阅读文件的显示页面上的悬浮窗内显示所获取的搜索 结果信息。
发明的有益效果
有益效果
[0063] 实施本发明的技术方案, 由于综合考虑了用户的属性信息及该特定词所在文件 中的至少一个特征点, 所以, 搜索出的结果信息更贴近用户的真实需求, 因此 , 用户收到搜索结果信息吋, 可减少甄别吋间, 大大提高了阅读速度及阅读体 验。
对附图的简要说明
附图说明 [0064] 为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实施例或 现有技术描述中所需要使用的附图作简单地介绍, 显而易见地, 下面描述中的 附图仅仅是本发明的一些实施例, 对于本领域普通技术人员来讲, 在不付出创 造性劳动的前提下, 还可以根据这些附图获得其他的附图。 附图中:
[0065] 图 1是本发明搜索方法实施例一的流程图;
[0066] 图 2是本发明搜索系统实施例一的逻辑结构图。
实施该发明的最佳实施例
本发明的最佳实施方式
[0067] 本发明所提供的搜索方法可以应用于终端中。 其中, 终端包括但不限于智能手 机、 平板电脑、 掌上电脑、 PAD
等终端。 终端的操作系统可包括但不限于 Android操作系统、 IOS
操作系统、 Symbian (塞班;)操作系统、 Black Berry (黑莓;)操作系统、 Windows
Phone操作系统等等。 如图 1所示, 该实施例的搜索方法包括以下步骤:
[0068] 步骤 A.接收用户针对当前阅读文件中的特定词所触发的搜索指令。
[0069] 在该步骤中, 当用户正在阅读文件吋, 想要对该文件中的某个特定词进行搜索 吋, 可通过操作终端上的触摸屏或鼠标来触发搜索指令。 在一个实施例中, 用 户可先选中待査询的字词, 选中后的字词可进行上浮放大显示, 然后用户可进 一步触发该选中的字词, 例如, 点击预设的按钮、 长按该选中的字词等, 以输 入搜索指令。 在另一个实施例中, 用户选中待査询的字词后, 直接触发搜索指 令, 这样, 可实现即可搜索, 节省了吋间, 提高了效率。
[0070] 步骤 B . 获取用户的属性信息。
[0071] 在该步骤中, 用户的属性信息例如包括但不限于: 职业、 年齢、 学校、 专业、 地域、 爰好、 背景、 搜索习惯等, 属性信息的获取可由用户设置, 也可由系统 通过自学习的方式获取。
[0072] 步骤 C . 对所述当前阅读文件进行分析, 以提取至少一个特征点。
[0073] 在该步骤中, 先获取当前阅读文件, 然后对该文件进行分析, 以提取至少一个 特征点, 特征点包括但不限于: 词性标签、 依存关系标签、 关键词、 主题信息
、 所属领域、 作者、 地域等。 [0074] 步骤 D . 根据所述特定词、 所述用户属性信息及所述至少一个特征点获取搜索 结果信息。
[0075] 在该步骤中, 在搜索该特定词的相关信息吋, 综合考虑了用户的属性信息、 该 特定词所在文件中的至少一个特征点, 所以, 搜索出的结果信息更贴近用户的 真实需求。
[0076] 在一个具体实施例中, 关于步骤 B, 可通过下列至少一种方式获取用户的属性 f π息:
[0077] 一、 根据用户注册吋的设置信息获取用户的第一属性信息, 所述第一属性信息 包括下列中的至少一个: 职业、 年齢、 学校、 专业、 地域、 爱好。 在该方式中 , 用户在注册吋, 可对用户信息进行设置, 例如, 年齢为 30岁、 地域为中国、 学校为华中科技大学、 专业为电气工程及其自动化专业、 职业为电气工程师、 爱好为摄影等。 在获取到这些设置信息后, 就可提取出用户的第一属性信息。
[0078] 二、 根据用户的历史访问日志获取用户的第二属性信息, 所述第二属性信息包 括下列中的至少一个: 专业背景、 搜索习惯。 在该方式中, 系统通过用户的历 史访问日志来获取用户的第二属性信息, 例如, 若该用户在近一年内的访问曰 志中, 所阅读的文章有 85%为电气专业的文章, 而且, 所阅读的文章有 70%为同 一作者的文章。 此吋, 可获取到该用户的专业背景为电气工程, 搜索习惯为优 选该作者的文章。
[0079] 在一个具体实施例中, 关于步骤 C, 可通过下列至少一种方式获取特征点: [0080] 一、 对所述特定词所在的句子进行词法分析, 以获取所述特定词的词性标签, 并将所获取的词性标签作为第一特征点。 在该方式中, 例如, 用户所阅读的文 章中, 需要搜索"牛顿", 且该特定词所在的句子为"牛顿 (1643年 1月 4日一 1727 年 3月 31日) 爵士, 英国皇家学会会长, 英国著名的物理学家", 通过对该句子进 行词法分析, "牛顿 "后带有日期信息, 还带有 "爵士 (称呼词) "、 "英国皇家学 会会长 (职位) 等", 因此可获取该句子中 "牛顿 "为人名, 此吋, 可为该特定词" 牛顿"标注"人名"的标签, 以作为第一特征点。 在此还需说明的是, 词性标注是 指根据句子中上下文信息所确定的一个最为合适的词性标记, 可通过字符对词 性进行标注。 其中, 词性可包括有: 名词、 形容词、 动词、 副词、 连词、 方位 词、 人名、 地名、 介词、 量词、 助词、 标点等。
[0081] 二、 对所述特定词所在的句子进行句法分析, 以获取所述特定词在所述句子中 与其相邻词之间的依存关系标签, 并将所述依存关系标签作为第二特征点。 在 该方式中, 例如, 用户所阅读的文章中, 需要搜索"牛顿", 且该特定词所在的句 子为"牛顿 (1643年 1月 4日一 1727年 3月 31日) 爵士, 英国皇家学会会长, 英国著 名的物理学家", 通过对该句子进行句法分析, 可获取该特定词与相邻词的依存 关系为: 空白 (句子中的首个词, 与前词无依存关系) 及主谓关系。 此吋, 可 将所确定的依存关系作为第二特征点。 在此还需说明的是, 依存关系是指各个 词在句法上的搭配关系。 其中, 依存关系可包括有: 主谓关系、 动宾关系、 动 补关系、 同位关系、 并列关系、 前置宾语、 "得"字结构、 "的"字结构、 "地"字结 构等。
[0082] 三、 提取所述当前阅读文件中的关键词, 并将所述关键词作为第三特征点。 在 该方式中, 在提取关键词吋, 可先统计当前阅读文件中每个有效词出现的频率 , 并按频率高低进行排序, 获取排名靠前的 N个有效词, 将这 N个有效词作为关 键词。 在此需说明的是, 有效词为从全文中排除了一些例如"的"、 "了"、 "吗"等 词后所剩下的词, N例如为三。
[0083] 四、 提取所述当前阅读文件的主题信息, 并将所述主题信息作为第四特征点。
[0084] 在一个具体实施例中, 在步骤 A之前, 还包括:
[0085] 步骤 E. 预先接收用户输入的特征定制信号。
[0086] 在该步骤中, 可设置一些控件供用户自行选择特征定制信号, 例如, 某个用户 设置的特征定制信号为: 关键词; 另一个用户设置的特征定制信号依次为: 主 题信息、 词性标签、 依存关系标签。 另外, 还可设置这些特征定制信号的优先 级。
[0087] 所述步骤 C为:
[0088] 根据所述特征定制信号对所述当前阅读文件进行分析, 以提取相应的特征点。
[0089] 在该步骤中, 在对当前阅读文件进行分析吋, 根据用户所设置的特征定制信号 进行针对性的分析, 例如, 当用户设置的特征定制信号为关键词吋, 通过对当 前阅读文件进行分析可获取到该文件的关键词; 当用户设置的多个特征定制信 号依次为: 主题信息、 词性标签、 依存关系标签吋, 通过对当前阅读文件进行 分析可获取到该文件的主题信息、 特定词的词性及依存关系。
[0090] 在一个具体实施例中, 关于步骤 D, 可通过以下步骤获取搜索结果信息: [0091] 步骤 D1.根据所述特定词获取中间结果信息, 所述中间结果信息包括多个条目
[0092] 在该步骤中, 首先以用户所选中的 "特定词"为搜索入口, 从数据库中进行搜索 , 此吋获取的是中间结果信息。
[0093] 步骤 D2.根据所述用户属性信息及所述至少一个特征点计算所述中间结果信息 中每个条目的匹配度。
[0094] 步骤 D3.根据所获取的中间结果信息及所计算的匹配度生成搜索结果信息。
[0095] 在该步骤中, 例如, 可根据所计算的匹配度对中间结果信息中的多个条目进行 排序, 并将排序后的结果信息作为搜索结果推送给用户。 当然, 也可根据所计 算的匹配度对中间结果信息中的多个条目进行筛选, 并将筛选后的结果信息作 为搜索结果推送给用户, 这样便能仅向用户推送相关的内容, 屏蔽不相关的内 容。
[0096] 在一个具体实施例中, 本发明的搜索方法还包括:
[0097] 步骤 F . 接收用户设置的干预条件信息;
[0098] 在该步骤中, 可在页面上设置一区域供用户输入 "干预条件信息"。 例如, 当用 户想要搜索特定词"姿态传感器"应用在汽车上的有关文献资料吋, 用户可触发" 姿态传感器"的搜索指令吋, 同吋设置干预条件信息例如为"汽车"。
[0099] 而且, 所述步骤 D为:
[0100] 根据所述特定词、 所述用户属性信息、 所述至少一个特征点及所述干预条件信 息获取搜索结果。
[0101] 在该步骤中, 在获取搜索结果吋, 由于还会考虑人为设置的干预条件, 所以, 在上述例子中, 在所搜索出的 "姿态传感器 "的文献资料中, 自动屏蔽掉了姿态传 感器应用在飞行器、 手机等上的文献资料, 仅出现姿态传感器应用在汽车上的 文献资料。
[0102] 在一个具体实施例中, 本发明的搜索方法在步骤 D之后, 还包括: [0103] 步骤 G.在当前阅读文件的显示页面上的悬浮窗内显示所获取的搜索结果信息。
[0104] 在该实施例中, 所获取的搜索结果在当前显示页面的悬浮窗内显示, 这样可使 搜索结果与阅读文件在同页面内显示, 不需要在窗口间跳转, 减少了操作步骤
[0105] 本发明所提供的搜索系统可以应用于终端中。 其中, 终端包括但不限于智能手 机、 平板电脑、 掌上电脑、 PAD
等终端。 终端的操作系统可包括但不限于 Android操作系统、 IOS
操作系统、 Symbian (塞班;)操作系统、 Black Berry (黑莓;)操作系统、 Windows
Phone操作系统等等。 如图 2所示, 该实施例的搜索系统包括: 触发模块 10、 属 性获取模块 20、 特征获取模块 30和搜索模块 40。 其中, 触发模块 10用于接收用 户针对当前阅读文件中的特定词所触发的搜索指令; 属性获取模块 20用于获取 用户的属性信息; 特征获取模块 30用于对所述当前阅读文件进行分析, 以提取 至少一个特征点; 搜索模块 40用于根据所述特定词、 所述用户属性信息及所述 至少一个特征点获取搜索结果信息。
[0106] 优选地, 触发模块 10用于接收用户针对当前阅读文件中的特定词的选择信号, 并触发搜索指令, 这样可实现即可搜索, 减少了吋间, 提高了效率。
[0107] 优选地, 属性获取模块 20可包括下列中的至少一个: 第五获取单元、 第六获取 单元。 其中, 第五获取单元用于根据用户注册吋的设置信息获取用户的第一属 性信息, 所述第一属性信息包括下列中的至少一个: 职业、 年齢、 学校、 专业 、 地域、 爱好; 第六获取单元用于根据用户的历史访问日志获取用户的第二属 性信息, 所述第二属性信息包括下列中的至少一个: 专业背景、 搜索习惯。
[0108] 优选地, 特征获取模块 30可包括下列中的至少一个: 第一获取单元、 第二获取 单元、 第三获取单元和第四获取单元, 其中, 第一获取单元用于对所述特定词 所在的句子进行词法分析, 以获取所述特定词的词性标签, 并将所获取的词性 标签作为第一特征点; 第二获取单元用于对所述特定词所在的句子进行句法分 析, 以获取所述特定词在所述句子中与其相邻词之间的依存关系标签, 并将所 述依存关系标签作为第二特征点; 第三获取单元用于提取所述当前阅读文件中 的关键词, 并将所述关键词作为第三特征点; 第四获取单元用于提取所述当前 阅读文件的主题信息, 并将所述主题信息作为第四特征点。
[0109] 优选地, 本发明的搜索系统还包括定制模块, 而且, 定制模块用于预先接收用 户输入的特征定制信号; 特征获取模块用于根据所述特征定制信号对所述当前 阅读文件进行分析, 以提取相应的特征点。
[0110] 优选地, 本发明的搜索系统还包括干预设置模块, 而且, 干预设置模块用于接 收用户设置的干预条件信息; 搜索模块用于根据所述特定词、 所述用户属性信 息、 所述至少一个特征点及所述干预条件信息获取搜索结果。
[0111] 优选地, 搜索模块 40可具体包括: 搜索单元、 计算单元、 生成单元。 其中, 搜 索单元用于根据所述特定词获取中间结果信息, 所述中间结果信息包括多个条 目; 计算单元用于根据所述用户属性信息及所述至少一个特征点计算所述中间 结果信息中每个条目的匹配度; 生成单元用于根据所获取的中间结果信息及所 计算的匹配度生成搜索结果信息。
[0112] 优选地, 本发明的搜索系统还包括显示模块, 而且, 该显示模块用于在在当前 阅读文件的显示页面上的悬浮窗内显示所获取的搜索结果信息。 这样可使搜索 结果与阅读文件在同页面内显示, 不需要在窗口间跳转, 减少了操作步骤。
[0113] 以上所述仅为本发明的优选实施例而已, 并不用于限制本发明, 对于本领域的 技术人员来说, 本发明可以有各种更改和变化。 凡在本发明的精神和原则之内 , 所作的任何纂改、 等同替换、 改进等, 均应包含在本发明的权利要求范围之 内。

Claims

权利要求书
[权利要求 1] 一种搜索方法, 其特征在于, 包括:
A . 接收用户针对当前阅读文件中的特定词所触发的搜索指令;
B . 获取用户的属性信息;
C . 对所述当前阅读文件进行分析, 以提取至少一个特征点;
D . 根据所述特定词、 所述用户的属性信息及所述至少一个特征点获 取搜索结果信息。
[权利要求 2] 根据权利要求 1所述的搜索方法, 其特征在于, 所述步骤 C包括:
C1.对所述特定词所在的句子进行词法分析, 以获取所述特定词的词 性标签, 并将所获取的词性标签作为第一特征点。
[权利要求 3] 根据权利要求 1所述的搜索方法, 其特征在于, 所述步骤 C包括:
C2.对所述特定词所在的句子进行句法分析, 以获取所述特定词在所 述句子中与其相邻词之间的依存关系标签, 并将所述依存关系标签作 为第二特征点。
[权利要求 4] 根据权利要求 1所述的搜索方法, 其特征在于, 所述步骤 C包括:
C3.提取所述当前阅读文件中的关键词, 并将所述关键词作为第三特 征点。
[权利要求 5] 根据权利要求 1所述的搜索方法, 其特征在于, 所述步骤 C包括:
C4.提取所述当前阅读文件的主题信息, 并将所述主题信息作为第四 特征点。
[权利要求 6] 根据权利要求 1所述的搜索方法, 其特征在于, 在所述步骤 A之前, 还包括:
E . 预先接收用户输入的特征定制信号;
所述步骤 C为:
根据所述特征定制信号对所述当前阅读文件进行分析, 以提取相应的 特征点。
[权利要求 7] 根据权利要求 1所述的搜索方法, 其特征在于, 所述步骤 B包括:
B1.根据用户注册吋的设置信息获取用户的第一属性信息, 所述第一 属性信息包括下列中的至少一个: 职业、 年齢、 学校、 专业、 地域、 爱好。
根据权利要求 1所述的搜索方法, 其特征在于, 所述步骤 B包括: B2.根据用户的历史访问日志获取用户的第二属性信息, 所述第二属 性信息包括下列中的至少一个: 专业背景、 搜索习惯。
根据权利要求 1所述的搜索方法, 其特征在于, 在所述步骤 D之前, 还包括:
F . 接收用户设置的干预条件信息;
所述步骤 D为:
根据所述特定词、 所述用户属性信息、 所述至少一个特征点及所述干 预条件信息获取搜索结果。
根据权利要求 1所述的搜索方法, 其特征在于, 所述步骤 D包括: D1.根据所述特定词获取中间结果信息, 所述中间结果信息包括多个 条目;
D2.根据所述用户属性信息及所述至少一个特征点计算所述中间结果 信息中每个条目的匹配度;
D3.根据所获取的中间结果信息及所计算的匹配度生成搜索结果信息 根据权利要求 1所述的搜索方法, 其特征在于, 在所述步骤 D之后, 还包括:
G . 在当前阅读文件的显示页面上的悬浮窗内显示所获取的搜索结果 f π息。
根据权利要求 1所述的搜索方法, 其特征在于, 所述步骤 A为: 接收用户针对当前阅读文件中的特定词的选择信号, 并触发搜索指令 一种搜索系统, 其特征在于, 包括:
触发模块, 用于接收用户针对当前阅读文件中的特定词所触发的搜索 指令; 属性获取模块, 用于获取用户的属性信息;
特征获取模块, 用于对所述当前阅读文件进行分析, 以提取至少一个 特征点;
搜索模块, 用于根据所述特定词、 所述用户属性信息及所述至少一个 特征点获取搜索结果信息。
[权利要求 14] 根据权利要求 13所述的搜索系统, 其特征在于, 所述特征获取模块包 括下列中的至少一个:
第一获取单元, 用于对所述特定词所在的句子进行词法分析, 以获取 所述特定词的词性标签, 并将所获取的词性标签作为第一特征点; 第二获取单元, 用于对所述特定词所在的句子进行句法分析, 以获取 所述特定词在所述句子中与其相邻词之间的依存关系标签, 并将所述 依存关系标签作为第二特征点;
第三获取单元, 用于提取所述当前阅读文件中的关键词, 并将所述关 键词作为第三特征点;
第四获取单元, 用于提取所述当前阅读文件的主题信息, 并将所述主 题信息作为第四特征点。
[权利要求 15] 根据权利要求 13所述的搜索系统, 其特征在于, 还包括定制模块, 而 且,
所述定制模块, 用于预先接收用户输入的特征定制信号;
所述特征获取模块, 用于根据所述特征定制信号对所述当前阅读文件 进行分析, 以提取相应的特征点。
[权利要求 16] 根据权利要求 13所述的搜索系统, 其特征在于, 所述属性获取模块包 括下列中的至少一个:
第五获取单元, 用于根据用户注册吋的设置信息获取用户的第一属性 信息, 所述第一属性信息包括下列中的至少一个: 职业、 年齢、 学校 、 专业、 地域、 爱好;
第六获取单元, 用于根据用户的历史访问日志获取用户的第二属性信 息, 所述第二属性信息包括下列中的至少一个: 专业背景、 搜索习惯 [权利要求 17] 根据权利要求 13所述的搜索系统, 其特征在于, 还包括干预设置模块
, 而且,
所述干预设置模块, 用于接收用户设置的干预条件信息;
所述搜索模块, 用于根据所述特定词、 所述用户属性信息、 所述至少 一个特征点及所述干预条件信息获取搜索结果。
[权利要求 18] 根据权利要求 13所述的搜索系统, 其特征在于, 所述搜索模块包括: 搜索单元, 用于根据所述特定词获取中间结果信息, 所述中间结果信 息包括多个条目;
计算单元, 用于根据所述用户属性信息及所述至少一个特征点计算所 述中间结果信息中每个条目的匹配度;
生成单元, 用于根据所获取的中间结果信息及所计算的匹配度生成搜 索结果信息。
[权利要求 19] 根据权利要求 13所述的搜索系统, 其特征在于, 还包括:
显示模块, 用于在在当前阅读文件的显示页面上的悬浮窗内显示所获 取的搜索结果信息。
PCT/CN2016/099652 2016-09-21 2016-09-21 一种搜索方法及系统 WO2018053735A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2016/099652 WO2018053735A1 (zh) 2016-09-21 2016-09-21 一种搜索方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2016/099652 WO2018053735A1 (zh) 2016-09-21 2016-09-21 一种搜索方法及系统

Publications (1)

Publication Number Publication Date
WO2018053735A1 true WO2018053735A1 (zh) 2018-03-29

Family

ID=61689272

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2016/099652 WO2018053735A1 (zh) 2016-09-21 2016-09-21 一种搜索方法及系统

Country Status (1)

Country Link
WO (1) WO2018053735A1 (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101243449A (zh) * 2005-06-16 2008-08-13 文字点击有限公司 用于从计算机显示的内容中自动启动搜索查询的方法和系统
CN102193903A (zh) * 2010-03-15 2011-09-21 索尼公司 信息处理装置、信息处理方法以及程序
CN104428769A (zh) * 2012-07-13 2015-03-18 索尼公司 提供文本阅读器的信息
CN105027116A (zh) * 2012-12-12 2015-11-04 微软技术许可有限责任公司 电子阅读器内平面书籍到富书籍的转换
CN105095231A (zh) * 2014-04-29 2015-11-25 阿里巴巴集团控股有限公司 一种呈现搜索结果的方法和装置
CN105612517A (zh) * 2013-10-07 2016-05-25 微软技术许可有限责任公司 上下文洞察及探索

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101243449A (zh) * 2005-06-16 2008-08-13 文字点击有限公司 用于从计算机显示的内容中自动启动搜索查询的方法和系统
CN102193903A (zh) * 2010-03-15 2011-09-21 索尼公司 信息处理装置、信息处理方法以及程序
CN104428769A (zh) * 2012-07-13 2015-03-18 索尼公司 提供文本阅读器的信息
CN105027116A (zh) * 2012-12-12 2015-11-04 微软技术许可有限责任公司 电子阅读器内平面书籍到富书籍的转换
CN105612517A (zh) * 2013-10-07 2016-05-25 微软技术许可有限责任公司 上下文洞察及探索
CN105095231A (zh) * 2014-04-29 2015-11-25 阿里巴巴集团控股有限公司 一种呈现搜索结果的方法和装置

Similar Documents

Publication Publication Date Title
US10140368B2 (en) Method and apparatus for generating a recommendation page
US8856100B2 (en) Displaying browse sequence with search results
US20100185600A1 (en) Apparatus and method for integration search of web site
US20130013616A1 (en) Systems and Methods for Natural Language Searching of Structured Data
CN105069103B (zh) App搜索引擎利用用户评论的方法及系统
US20100076984A1 (en) System and method for query expansion using tooltips
KR20100068532A (ko) 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 장치 및 방법
US20090119283A1 (en) System and Method of Improving and Enhancing Electronic File Searching
WO2016162843A1 (en) Processing a search query and retrieving targeted records from a networked database system
US20170185688A1 (en) Method for searching in a database
US20120179709A1 (en) Apparatus, method and program product for searching document
CN101661490A (zh) 搜索引擎、其客户端及搜索网页的方法
Noruzi et al. Google Patents: The global patent search engine
JP2007272859A (ja) 情報検索支援プログラム、情報検索支援機能を有するコンピュータ、サーバー・コンピュータ、プログラム格納媒体
JP2007193697A (ja) 情報収集装置,情報収集方法およびプログラム
CN110516157B (zh) 一种文献检索方法、设备和存储介质
US20170293683A1 (en) Method and system for providing contextual information
CN111159408A (zh) 一种文本数据标注方法、装置、计算机装置及计算机可读存储介质
JP2011181109A (ja) 情報検索支援プログラム、情報検索支援機能を有するコンピュータ、サーバー・コンピュータ、プログラム格納媒体
KR101120040B1 (ko) 연관 질의어 추천 장치 및 방법
EP2414971A1 (en) Data searching system
US8527529B2 (en) Methods and apparatus for presenting search results with indication of relative position of search terms
JP6172750B2 (ja) 絞り込み検索のためのクエリ語の選択候補を明示するコンテンツ検索プログラム、装置及び方法
JP2012104051A (ja) 文書インデックス作成装置
WO2018053735A1 (zh) 一种搜索方法及系统

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16916474

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 12.07.2019)

122 Ep: pct application non-entry in european phase

Ref document number: 16916474

Country of ref document: EP

Kind code of ref document: A1