WO2018027344A1 - 不同语言在大数据中实现实时搜索方法及系统 - Google Patents

不同语言在大数据中实现实时搜索方法及系统 Download PDF

Info

Publication number
WO2018027344A1
WO2018027344A1 PCT/CN2016/093774 CN2016093774W WO2018027344A1 WO 2018027344 A1 WO2018027344 A1 WO 2018027344A1 CN 2016093774 W CN2016093774 W CN 2016093774W WO 2018027344 A1 WO2018027344 A1 WO 2018027344A1
Authority
WO
WIPO (PCT)
Prior art keywords
keyword
search
search results
big data
user
Prior art date
Application number
PCT/CN2016/093774
Other languages
English (en)
French (fr)
Inventor
马岩
Original Assignee
马岩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 马岩 filed Critical 马岩
Priority to PCT/CN2016/093774 priority Critical patent/WO2018027344A1/zh
Publication of WO2018027344A1 publication Critical patent/WO2018027344A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Definitions

  • the present invention relates to the field of big data, and in particular to a real-time search method and system for implementing different languages in big data.
  • Big data or massive data, refers to the massive, high-growth, and diverse information assets that require new processing models to have greater decision-making, insight, and process optimization capabilities.
  • Victor ⁇ Meyer Schonberg and Kenneth Big data in the Big Data Era written by Cookey refers to the use of all data for analysis without the use of random analysis (sample survey). 4V features of big data: Volume, Velocity, Variety, Value.
  • a method for implementing a real-time search in big data in a different language comprising the following steps:
  • the method further includes:
  • the method further includes:
  • a real-time search system is implemented in big data in different languages, the system comprising:
  • a receiving unit configured to receive a keyword input by a user
  • a query unit configured to query the translated content of the keyword according to the keyword
  • the search unit is configured to perform search according to the translated content of the keyword to obtain search results.
  • system further includes:
  • a sorting unit for sorting search results according to the number of occurrences of keywords is a sorting unit for sorting search results according to the number of occurrences of keywords.
  • system further includes:
  • the shielding unit is configured to obtain a historical search result of the user, and block the same content as the historical search result in the search result.
  • the technical solution provided by the specific embodiment of the present invention receives a keyword input by a user, and queries the translated content of the keyword according to the keyword, and performs search according to the translated content of the keyword to obtain a search result, so the search has accurate search and high experience.
  • FIG. 1 is a flow chart of a real-time search method for realizing different languages in big data provided by the present invention
  • FIG. 2 is a structural diagram of a real-time search system implemented in big data in different languages according to the present invention.
  • FIG. 1 is a flowchart of a real-time search method for realizing different languages in big data according to a first preferred embodiment of the present invention.
  • the method is implemented by a server, and the method is as shown in FIG. step:
  • Step S101 Receive a keyword input by a user
  • Step S102 querying the translated content of the keyword according to the keyword
  • Step S103 Perform a search according to the translated content of the keyword to obtain a search result.
  • the technical solution provided by the specific embodiment of the present invention receives a keyword input by a user, and queries the translated content of the keyword according to the keyword, and performs search according to the translated content of the keyword to obtain a search result, so the search has accurate search and high experience.
  • the foregoing method may further include:
  • the foregoing method may further include:
  • FIG. 2 is a schematic diagram of a real-time search system implemented in big data in different languages according to a second preferred embodiment of the present invention.
  • the system includes:
  • the receiving unit 201 is configured to receive a keyword input by the user
  • the query unit 202 is configured to query the translated content of the keyword according to the keyword;
  • the searching unit 203 is configured to perform a search according to the translated content of the keyword to obtain a search result.
  • the technical solution provided by the specific embodiment of the present invention receives a keyword input by a user, and queries the translated content of the keyword according to the keyword, and performs search according to the translated content of the keyword to obtain a search result, so the search has accurate search and high experience.
  • the above system may further include:
  • the sorting unit 204 is configured to sort the search results according to the number of occurrences of the keywords.
  • the above system may further include:
  • the masking unit 205 is configured to acquire a historical search result of the user, and block the same content as the historical search result in the search result.
  • Computer readable media includes both computer storage media and communication media including any medium that facilitates transfer of a computer program from one location to another.
  • a storage medium may be any available media that can be accessed by a computer.
  • the computer readable medium may include random access memory (Random) Access Memory, RAM), Read-Only Memory (ROM), Electrically Erasable Programmable Read Only Memory (Electrically Erasable Programmable Read-Only Memory, EEPROM), Compact Disc Read-Only Memory, CD-ROM, or other optical disc storage, magnetic storage medium or other magnetic storage device, or any other medium that can be used to carry or store desired program code in the form of instructions or data structures and that can be accessed by a computer. Also. Any connection may suitably be a computer readable medium.
  • a disk and a disc include a compact disc (CD), a laser disc, a compact disc, a digital versatile disc (DVD), a floppy disk, and a Blu-ray disc, wherein the disc is usually magnetically copied, and the disc is The laser is used to optically replicate the data. Combinations of the above should also be included within the scope of the computer readable media.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种不同语言在大数据中实现实时搜索方法及系统,所述方法包括如下步骤:接收用户输入的关键词(101);依据该关键词查询出该关键词的翻译内容(102);依据关键词的翻译内容实现搜索得到搜索结果(103)。该方法和系统具有用户体验度高的优点。

Description

不同语言在大数据中实现实时搜索方法及系统 技术领域
本发明涉及大数据领域,尤其涉及一种不同语言在大数据中实现实时搜索方法及系统。
背景技术
大数据(big data),或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。在维克托 · 迈尔-舍恩伯格及肯尼斯 · 库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。
现有大数据在搜索时不准确,用户体验度低。
技术问题
提供一种不同语言在大数据中实现实时搜索方法,其解决了现有技术用户体验度低的缺点。
技术解决方案
一方面,提供一种不同语言在大数据中实现实时搜索方法,所述方法包括如下步骤:
接收用户输入的关键词;
依据该关键词查询出该关键词的翻译内容;
依据关键词的翻译内容实现搜索得到搜索结果。
可选的,所述方法还包括:
依据关键词出现的次数对搜索结果排序。
可选的,所述方法还包括:
获取用户的历史搜索结果,在搜索结果中屏蔽与历史搜索结果相同的内容。
第二方面,提供一种不同语言在大数据中实现实时搜索系统,所述系统包括:
接收单元,用于接收用户输入的关键词;
查询单元,用于依据该关键词查询出该关键词的翻译内容;
搜索单元,用于依据关键词的翻译内容实现搜索得到搜索结果。
可选的,所述系统还包括:
排序单元,用于依据关键词出现的次数对搜索结果排序。
可选的,所述系统还包括:
屏蔽单元,用于获取用户的历史搜索结果,在搜索结果中屏蔽与历史搜索结果相同的内容。
有益效果
本发明具体实施方式提供的技术方案接收用户输入的关键词,依据该关键词查询出该关键词的翻译内容,依据关键词的翻译内容实现搜索得到搜索结果,所以其具有搜索准确,体验度高的优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种不同语言在大数据中实现实时搜索方法的流程图;
图2为本发明提供的一种不同语言在大数据中实现实时搜索系统的结构图。
本发明的实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1,图1为本发明第一较佳实施方式提供的一种不同语言在大数据中实现实时搜索方法的流程图,该方法由服务器来完成,该方法如图1所示,包括如下步骤:
步骤S101、接收用户输入的关键词;
步骤S102、依据该关键词查询出该关键词的翻译内容;
步骤S103、依据关键词的翻译内容实现搜索得到搜索结果。
本发明具体实施方式提供的技术方案接收用户输入的关键词,依据该关键词查询出该关键词的翻译内容,依据关键词的翻译内容实现搜索得到搜索结果,所以其具有搜索准确,体验度高的优点。
可选的,上述方法在步骤S103之后还可以包括:
依据关键词出现的次数对搜索结果排序。
可选的,上述方法在步骤S103之后还可以包括:
获取用户的历史搜索结果,在搜索结果中屏蔽与历史搜索结果相同的内容。
参阅图2,图2为本发明第二较佳实施方式提供的一种不同语言在大数据中实现实时搜索系统,该系统包括:
接收单元201,用于接收用户输入的关键词;
查询单元202,用于依据该关键词查询出该关键词的翻译内容;
搜索单元203,用于依据关键词的翻译内容实现搜索得到搜索结果。
本发明具体实施方式提供的技术方案接收用户输入的关键词,依据该关键词查询出该关键词的翻译内容,依据关键词的翻译内容实现搜索得到搜索结果,所以其具有搜索准确,体验度高的优点。
可选的,上述系统还可以包括:
排序单元204,用于依据关键词出现的次数对搜索结果排序。
可选的,上述系统还可以包括:
屏蔽单元205,用于获取用户的历史搜索结果,在搜索结果中屏蔽与历史搜索结果相同的内容。
需要说明的是,对于前述的各方法实施方式或实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为根据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述实施方式或实施例均属于优选实施例,所涉及的动作和单元并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。本领域的技术人员可以将本说明书中描述的不同实施例以及不同实施例的特征进行结合或组合。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可以用硬件实现,或固件实现,或它们的组合方式来实现。当使用软件实现时,可以将上述功能存储在计算机可读介质中或作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于:计算机可读介质可以包括随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、电可擦可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。此外。任何连接可以适当的成为计算机可读介质。例如,如果软件是使用同轴电缆、光纤光缆、双绞线、数字用户线(Digital Subscriber Line,DSL)或者诸如红外线、无线电和微波之类的无线技术从网站、服务器或者其他远程源传输的,那么同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线和微波之类的无线技术包括在所属介质的定影中。如本发明所使用的,盘(Disk)和碟(disc)包括压缩光碟(CD)、激光碟、光碟、数字通用光碟(DVD)、软盘和蓝光光碟,其中盘通常磁性的复制数据,而碟则用激光来光学的复制数据。上面的组合也应当包括在计算机可读介质的保护范围之内。
总之,以上所述仅为本发明技术方案的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

  1. 一种不同语言在大数据中实现实时搜索方法,其特征在于,所述方法包括如下步骤:
    接收用户输入的关键词;
    依据该关键词查询出该关键词的翻译内容;
    依据关键词的翻译内容实现搜索得到搜索结果。
  2. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
    依据关键词出现的次数对搜索结果排序。
  3. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
    获取用户的历史搜索结果,在搜索结果中屏蔽与历史搜索结果相同的内容。
  4. 一种不同语言在大数据中实现实时搜索系统,其特征在于,所述系统包括:
    接收单元,用于接收用户输入的关键词;
    查询单元,用于依据该关键词查询出该关键词的翻译内容;
    搜索单元,用于依据关键词的翻译内容实现搜索得到搜索结果。
  5. 根据权利要求4所述的系统,其特征在于,所述系统还包括:
    排序单元,用于依据关键词出现的次数对搜索结果排序。
  6. 根据权利要求4所述的系统,其特征在于,所述系统还包括:
    屏蔽单元,用于获取用户的历史搜索结果,在搜索结果中屏蔽与历史搜索结果相同的内容。
PCT/CN2016/093774 2016-08-06 2016-08-06 不同语言在大数据中实现实时搜索方法及系统 WO2018027344A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2016/093774 WO2018027344A1 (zh) 2016-08-06 2016-08-06 不同语言在大数据中实现实时搜索方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2016/093774 WO2018027344A1 (zh) 2016-08-06 2016-08-06 不同语言在大数据中实现实时搜索方法及系统

Publications (1)

Publication Number Publication Date
WO2018027344A1 true WO2018027344A1 (zh) 2018-02-15

Family

ID=61161017

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2016/093774 WO2018027344A1 (zh) 2016-08-06 2016-08-06 不同语言在大数据中实现实时搜索方法及系统

Country Status (1)

Country Link
WO (1) WO2018027344A1 (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1309370A (zh) * 2000-02-14 2001-08-22 顾丽萍 在网络或互联网络上进行文件或数据库搜索的方法及系统
CN1424670A (zh) * 2002-12-25 2003-06-18 上海交通大学 跨语种网页搜索方法
CN1687925A (zh) * 2005-05-10 2005-10-26 贺方升 一种实现双语网页搜索的方法
CN103488648A (zh) * 2012-06-13 2014-01-01 阿里巴巴集团控股有限公司 一种多语种混合检索方法和系统
CN105404688A (zh) * 2015-12-11 2016-03-16 北京奇虎科技有限公司 搜索方法和搜索设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1309370A (zh) * 2000-02-14 2001-08-22 顾丽萍 在网络或互联网络上进行文件或数据库搜索的方法及系统
CN1424670A (zh) * 2002-12-25 2003-06-18 上海交通大学 跨语种网页搜索方法
CN1687925A (zh) * 2005-05-10 2005-10-26 贺方升 一种实现双语网页搜索的方法
CN103488648A (zh) * 2012-06-13 2014-01-01 阿里巴巴集团控股有限公司 一种多语种混合检索方法和系统
CN105404688A (zh) * 2015-12-11 2016-03-16 北京奇虎科技有限公司 搜索方法和搜索设备

Similar Documents

Publication Publication Date Title
WO2017128362A1 (zh) 基于大数据的搜索方法及系统
WO2017161578A1 (zh) 数据抓取的方法及系统
WO2017120739A1 (zh) 餐饮评论分析方法及系统
WO2018027344A1 (zh) 不同语言在大数据中实现实时搜索方法及系统
WO2018023483A1 (zh) 不同语言在大数据中实现实时搜索方法及系统
WO2018027464A1 (zh) 不同词性在大数据搜索中的实现方法及系统
WO2018023484A1 (zh) 不同词性在大数据搜索中的实现方法及系统
WO2018027341A1 (zh) 大数据中关键字分类搜索方法及系统
WO2018027342A1 (zh) 同义词在大数据搜索中的应用方法及系统
WO2018027343A1 (zh) 实现语音搜索的方法及系统
WO2018023481A1 (zh) 同义词在大数据搜索中的应用方法及系统
WO2018023480A1 (zh) 大数据中关键字分类搜索方法及系统
WO2018023482A1 (zh) 实现语音搜索的方法及系统
WO2018035697A1 (zh) 互联网中房源搜索方法及系统
WO2018027466A1 (zh) 分布式系统中大数据的存储方法及系统
WO2018027462A1 (zh) 搜索比对的实现方法及系统
WO2018027470A1 (zh) 微信中分享大数据的方法及系统
WO2018027455A1 (zh) 社交网络中分享大数据的方法及系统
WO2018027457A1 (zh) 移动式大数据分享方法及系统
WO2018027456A1 (zh) 指定分享在大数据中的应用方法及系统
WO2018027458A1 (zh) 大数据的实时分享方法及系统
WO2018027460A1 (zh) 算法比对的方法及系统
WO2018027463A1 (zh) 关键字分析在大数据中的应用方法及系统
WO2018027576A1 (zh) 工作时间在物联网中统计方法及系统
WO2018027469A1 (zh) 关键词在大数据存储的应用方法及系统

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16911801

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16911801

Country of ref document: EP

Kind code of ref document: A1