CN106227774B - 信息搜索方法及装置 - Google Patents

信息搜索方法及装置 Download PDF

Info

Publication number
CN106227774B
CN106227774B CN201610562499.4A CN201610562499A CN106227774B CN 106227774 B CN106227774 B CN 106227774B CN 201610562499 A CN201610562499 A CN 201610562499A CN 106227774 B CN106227774 B CN 106227774B
Authority
CN
China
Prior art keywords
querying condition
attribute
condition
semantic attribute
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610562499.4A
Other languages
English (en)
Other versions
CN106227774A (zh
Inventor
李金凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Group Co Ltd
Original Assignee
Hisense Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Group Co Ltd filed Critical Hisense Group Co Ltd
Priority to CN201610562499.4A priority Critical patent/CN106227774B/zh
Publication of CN106227774A publication Critical patent/CN106227774A/zh
Priority to US15/393,654 priority patent/US20170109435A1/en
Application granted granted Critical
Publication of CN106227774B publication Critical patent/CN106227774B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息搜索方法及装置,属于互联网技术领域。所述方法包括:接收用于进行信息搜索的交互语句;从语义属性模板集合中确定目标语义属性模板,所述目标语义属性模板为与所述交互语句中多个连续字词的语义属性一一对应的语义属性模板;将与所述目标语义属性模板匹配的多个连续字词组成的短语获取为所述交互语句的单查询条件;根据所述单查询条件进行搜索。本发明将与目标语义属性模板匹配的多个连续字词组成的短语获取为用于信息搜索的单查询条件,由于该单查询条件所表示的语义信息较完整,能够作为一个完整的查询限定条件,因此搜索结果能够最大程度符合用户的搜索需求,且能够避免由于丢失信息造成的搜索准确性低的问题。

Description

信息搜索方法及装置
技术领域
本发明涉及互联网技术领域,特别涉及一种信息搜索方法及装置。
背景技术
随着互联网技术的不断发展及网络数据的日益丰富,为了使得用户能够快速从大量网络数据中获取想要的信息,可以向用户提供搜索服务;也即是,用户可以在搜索框中输入语句,从而根据用户输入的语句从大量网络数据中搜索相关信息。
在现有技术中,信息搜索方法可以为:获取用户输入的语句,从该语句中提取出关键词,根据所提取出的关键词搜索相关信息;例如,当用户输入的语句为“周星驰导演、吴孟达主演的电影”时,从该语句中提取关键词“周星驰、吴孟达、电影”,并根据该关键词进行搜索,以得到搜索结果。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
由于从语句中所提取的关键词往往为实体词,容易忽略动词和表示时间信息的词,因此,根据关键词“周星驰、吴孟达、电影”得到的搜索结果并不一定都是“周星驰导演、吴孟达主演的电影”,即在搜索结果中可能还包括周星驰和吴孟达主演的非周星驰导演的电影等其他结果。因此,通过从语句中提取关键词的方法进行信息搜索,容易造成信息丢失,进而导致搜索结果准确性低。
发明内容
本发明提供了一种信息搜索方法及装置,用以解决现有技术中存在的根据关键词搜索造成信息丢失,进而导致搜索结果准确性低的技术问题。所述技术方案如下:
一方面,提供了一种信息搜索方法,所述方法包括:
接收用于进行信息搜索的交互语句;
从语义属性模板集合中确定目标语义属性模板,所述目标语义属性模板为与所述交互语句中多个连续字词的语义属性一一对应的语义属性模板,所述语义属性模板集合包含至少一个语义属性模板,所述语义属性模板由至少一个语义属性顺序构成;
将与所述目标语义属性模板匹配的多个连续字词组成的短语获取为所述交互语句的单查询条件;
根据所述单查询条件进行搜索。
另一方面,提供了一种信息搜索装置,所述装置包括:
接收模块,用于接收用于进行信息搜索的交互语句;
确定模块,用于从语义属性模板集合中确定目标语义属性模板,所述目标语义属性模板为与所述交互语句中多个连续字词的语义属性一一对应的语义属性模板,所述语义属性模板集合包含至少一个语义属性模板,所述语义属性模板由至少一个语义属性顺序构成;
单查询条件获取模块,用于将与所述目标语义属性模板匹配的多个连续字词组成的短语获取为所述交互语句的单查询条件;
搜索模块,用于根据所述单查询条件进行搜索。
本发明实施例提供的技术方案带来的有益效果是:
通过接收用于信息搜索的交互语句,从语义属性模板集合中确定与该交互语句中多个连续字词的语义属性一一对应的目标语义属性模板,并根据所确定的目标语义属性模板从该交互语句中获取单查询条件,由于从该交互语句中获取到的单查询条件是由该交互语句中的多个连续字词组成的短语,因此与关键词相比较,该单查询条件所表示的语义信息更完整,能够作为一个完整的查询限定条件,根据所获取到的单查询条件进行信息搜索,能够使搜索结果最大程度符合用户的搜索需求,且能够避免由于丢失信息造成的搜索准确性低的问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种信息搜索方法流程图;
图2是本发明实施例提供的一种目标语义属性模板确定方法流程图;
图3是本发明实施例提供的一种信息搜索装置框图;
图4是本发明实施例提供的一种终端400的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
在对本发明实施例进行详细的解释说明之前,先对本发明实施例的应用场景予以介绍。本发明实施例提供的方法应用于电视机、手机、电脑、平板电脑等具有搜索功能或能够安装搜索引擎的智能设备。示例的,本发明实施例提供的方法应用于电视机,该电视机内部配置有能够搜索相关影片的多媒体视听资源库,以使得电视机能够根据用户输入的交互语句,在该多媒体视听资源库中进行垂直搜索,以搜索相关视听资源如电影、电视剧等的名称等信息,从而满足用户搜索需求。其中,该垂直搜索是指针对某一个行业的专业搜索,在本发明实施例中,以该垂直搜索针对的行业为影视行业为例,对本发明所提供的信息搜索方法进行具体说明;相比较通用搜索的海量信息无序化,垂直搜索则显得更加专注、具体和深入,当然,此处仅是举例说明,并不代表本发明实施例的信息搜索方法局限于此。
图1是本发明实施例提供的一种信息搜索方法流程图,该实施例的执行主体为具有信息搜索功能的终端,如电视机、电脑或手机等,以下将以应用场景为从多媒体视听资源库中搜索影视资源为例,对本发明所提供的信息搜索方法进行具体说明。如图1所示,包括以下步骤:
101、接收用于进行信息搜索的交互语句。
具体地,该交互语句可以是用户通过触摸屏输入的,也可以是用户通过按键输入的,还可以是用户通过麦克风语音输入的。本发明实施例对该交互语句的具体输入方式不做限定。
示例的,用户在搜索页面的搜索栏输入信息,终端接收用户输入的信息,并将该信息接收为交互语句,如“90年代以后的电影”或“周星驰导演吴孟达主演的电影”;本发明实施例对该交互语句的具体形式不作限定。
102、通过对该交互语句的分词结果进行语义属性标注,获取该语句中各个字词的语义属性。
上述分词结果可以是对该交互语句进行分词处理后得到,对语句进行分词处理是指将连续的汉字序列切分成一个个单独的词的过程。分词处理的方法可以是基于字典、词库匹配的分词方法,也可以是基于词的频度统计的分词方法或基于知识理解的分词方法;还可以采用其他分词方法,本发明实施例对所采用的具体分词方法不作限定。
语义属性标注是指根据分词结果对每一个词标注语义属性,该语义属性的标注方法可以为:根据语义属性模板集合或者本发明所提供方法的具体使用场景或所针对的领域,对每一个词标注语义属性。在本发明实施例中,以所针对的领域为影视领域,也即是数据库为多媒体视听资源数据库为例,对该标注过程进行具体说明,当该交互语句为“周星驰导演、吴孟达主演的电影”时,对该语句的分词结果进行语义属性标注后得到的结果可以为“周星驰(导演名称)/导演(动词(导演))、吴孟达(演员名称)/主演(动词(演))/的(助词)/电影(多媒体类型(电影))”。进一步地,还可以根据每个词的词性进行标注,例如将每个词标注为名词、动词、形容词或其他词性。
需要说明的是,在本发明实施例中,除了采用上述方法对该交互语句进行分词处理和语义属性标注处理外,还可以采用其他方法对该交互语句进行语义属性标注,本发明实施例对此不作具体限定。
103、从语义属性模板集合中确定目标语义属性模板,该目标语义属性模板为与该交互语句中多个连续字词的语义属性一一对应的语义属性模板,该语义属性模板集合包含至少一个语义属性模板,该语义属性模板由至少一个语义属性顺序构成。
该语义属性模板集合包含至少一个语义属性模板,每个语义属性模板为至少一个语义属性按顺序组合构成。具体地,该语义属性模板与语法语义信息的对应关系如下表1所示:
表1
在表1中,语义属性模板“^_?title_number_?$”由语义属性“title”和“number”构成,该“title”表示影片名称,该“number”表示数字,对应的示例为“霍比特人/3”;语义属性模板“^_?title_rankKeyWords_number_movieQuant_?$”中的语义属性“rankKeyWords”表示排序词,“movieQuant”表示剧集单位,如“季”、“集”、“部”等;语义属性模板“^_?cast_actVerb_?$”中的“cast”表示演员名,“actVerb”表示演类的动词,如“主演”、“饰演”等;语义属性模板“^_?direct_directVerb_?$”中的“direct”表示导演名,“directVerb”表示导演类的动词;语义属性模板“^(_?(dataWords_)?year(_dataWords)?)+_beforeWord_?$”中的“dataWords”表示日期词,“beforeWord”表示时间介词,如“之前”、“之后”等;语义属性模板“^_?singer_(auxWord_)?concert_?$”中的“singer”表示歌手名,“auxWord”表示助词。
需要说明的是,表1仅示出部分语义属性模板,也即是,在该语义属性模板集合中,除了包括上述表格中示出的语义属性模板外,还包括其他语义属性模板;此外,表1所示出的语义属性模板仅作为用于说明本发明所提供的信息搜索方法的示例,该语义属性模板也可以定义为其他形式,本发明对此不作具体限定。
从语义属性模板集合中确定目标语义属性模板的过程,可以采用最大正向模板匹配算法、最大逆向模板匹配算法或正向逆向结合的匹配算法实现,也可以采用其他算法实现,本发明实施例对此不作限定。
在本发明实施例中,以采用最大正向模板匹配算法为例,对确定该目标语义属性模板的过程进行具体描述。图2是本发明实施例提供的一种目标语义属性模板确定方法流程图,该方法包括:
根据交互语句的分词结果,确定wordList.Length的值,该wordList.Length的值即为该交互语句的分词个数,并将wordList.Length的值赋值给nLength,从nStart=0开始,也即是按照该交互语句从左到右的顺序取该语句的nLength个字符,将该nLength个字符与语义属性模板集合中的每个语义属性模板进行匹配,如果匹配成功,则将该nLength个字符对应的语义属性模板确定为一个目标语义属性模板,如果匹配不成功,对参数nLength执行减1操作,判断nLength是否小于或等于0,如果nLength大于0,重复执行按照该交互语句从左到右的顺序取该语句的nLength个字符的步骤及后续的匹配步骤;如果nLength小于或等于0,对nStart执行加1操作,也即是从该语句的第二个分词开始,重复执行按照该语句从左到右的顺序取该语句的nLength个字符的步骤及后续的匹配步骤。
例如,当该交互语句为“刘德华主演的电影”时,经过对分词结果的语义属性标注后,得到的结果包括两种情况:cast_actVerb_auxWord_videoType和singer_actVerb_auxWord_videoType,在信息搜索过程中,对上述两种情况分别进行目标语义属性模板确定及后续的搜索处理,在本发明实施例中,以标注结果为“cast_actVerb_auxWord_videoType”为例,对采用最大正向模板匹配算法确定目标语义属性模板的具体过程进行说明。
具体地,nStart=0,nLength=4,将“cast_actVerb_auxWord_videoType”与语义属性模板集合中的每个语义属性模板进行匹配,匹配不成功,去掉一个语义属性,也即是nLength执行减1操作,从nStart=0开始获取nLength=3个语义属性,将“cast_actVerb_auxWord”与语义属性模板集合中的每个语义属性模板进行匹配,依然匹配不成功,再对nLength执行减1操作,从nStart=0开始获取nLength=2个语义属性,将“cast_actVerb”与语义属性模板集合中的每个语义属性模板进行匹配,匹配成功,则将“cast_actVerb”对应的语义属性模板确定为目标语义属性模板;将剩余的“auxWord_videoType”与语义属性模板集合中的每个语义属性模板进行匹配,匹配不成功,将“auxWord”与语义属性模板集合中的每个语义属性模板进行匹配,匹配不成功,舍弃“auxWord”,将“videoType”与语义属性模板集合中的每个语义属性模板进行匹配,匹配成功,将“videoType”对应的语义属性模板确定为目标语义属性模板。也即是,从交互语句“刘德华主演的电影”中确定了两个目标语义属性模板。
再例如,当交互语句为“查询周星驰主演的,九十年代以前的古装电影”时,对该语句的分词结果进行语义属性标注后得到的结果可以为“查询(动词)/周星驰(演员名称)/主演(动词(演))/的(助词)/,九十(日期词)/年代(日期单位)/以前(介词)/的(助词)/古装(形容词)/电影(多媒体类型(电影))”,根据标注结果从语义属性模板中确定的目标语义属性模板包括“^_?cast_actVerb_?$”、“^(_?(dataWords_)?year(_dataWords)?)+_beforeWord_?$”,对应的目标语法语义信息为“演员名称+动词(演)”、“日期词+日期单位+介词”。
将该语句与语义属性模板集合进行匹配以确定目标语义属性模板的过程,可以通过将该交互语句的语义属性标注结果与语义属性模板集合中每个语义属性模板进行匹配实现,也可以通过将该交互语句与语义属性模板集合中每个语义属性模板对应的语法语义信息进行匹配实现,本发明实施例对此不作限定。
通过从语义属性模板集合中确定目标语义属性模板,能够实现根据所确定的目标语义属性模板获取由多个连续字词组成的意义更完整的短语,进而使得能够根据该短语进行信息搜索,以达到提高信息搜索准确性的目的。
104、将与该目标语义属性模板匹配的多个连续字词组成的短语获取为该交互语句的单查询条件。
该单查询条件是指一个完整的查询限定条件,例如,当待查询语句为“查询周星驰主演的,九十年代以前的古装电影”时,如果采用关键词搜索方法进行信息搜索,从该交互语句中确定的关键词包括“周星驰”、“九十年代”、“古装”和“电影”,根据上述关键词搜索到的信息中只包括九十年代的电影,而不包括九十年代之前的电影,且根据关键词“周星驰”搜索到的信息中可能不仅包括周星驰主演的电影,还包括周星驰导演的电影,从而导致信息丢失和信息搜索准确性低。而通过从语义属性模板集合中确定目标语义属性模板,能够根据所确定的语义属性模板,从该交互语句中获取单查询条件,由于该单查询条件为从该交互语句中获取的由连续多个字词组成的短语,即为一个完整的查询限定条件,因此不会造成信息丢失的情况。
例如,当交互语句为“查询周星驰主演的,九十年代以前的古装电影”时,根据标注结果从语义属性模板中确定的目标语义属性模板包括“^_?cast_actVerb_?$”、“^(_?(dataWords_)?year(_dataWords)?)+_beforeWord_?$”,根据所确定的目标语义属性模板,从该待查询语句中获取到的单查询条件包括“周星驰主演”和“九十年代以前”。需要说明的是,对于未确定到对应目标语义属性模板的单个字词,如“查询”、“的”、“古装”、“电影”,将其中无实际意义的字词舍弃,如“查询”和“的”,将具有实际意义的字词分别获取为单查询条件,包括“古装”和“电影”;也即是,该单查询条件除了可以为由多个字词组成的短语外,也可以为单个具有实际意义的字词。所以,从交互语句“查询周星驰主演的,九十年代以前的古装电影”获取到的单查询条件包括“周星驰主演”、“九十年代以前”、“古装”和“电影”。
通过将与所述目标语义属性模板匹配的多个连续字词组成的短语获取为所述交互语句的单查询条件,即由于该单查询条件是由多个连续字词组成的短语,与关键字词相比较,该单查询条件所表示的语义信息更完整,因此能够最大程度符合用户的搜索需求,避免信息丢失,进而能够提高信息搜索的准确性。
在本发明另一实施例中,对于经过对分词结果的语义属性标注后,得到至少两种结果的情况,除了对标注结果分别获取单查询条件并进行后续搜索外,还可以对该至少两种结果的单查询条件进行去重处理,以确定该语句的单查询条件,再根据该单查询条件执行后续搜索步骤。
例如,当该交互语句为“刘德华主演的电影”时,经过对分词结果的语义属性标注后,得到的结果包括两种情况:cast_actVerb_auxWord_videoType和singer_actVerb_auxWord_videoType,再将“cast_actVerb”和“singer_actVerb”分别与语义属性模板集合进行匹配,“singer_actVerb”匹配失败,则去除包含该语义属性组合的语义属性标注结果,“cast_actVerb”匹配成功,则根据包含该语义属性组合的语义属性标注结果,确定目标语义属性模板,并获取该交互语句的单查询条件。
通过对至少两种结果的单查询条件进行去重处理,能够提高单查询条件获取的准确性,从而能够进一步提高搜索结果的准确性。
105、按照预设规则对该单查询条件进行参数化,以转换为结构化查询条件,该预设规则是指与该目标语义属性模板对应的参数化规则。
每个语义属性模板对应一个参数化规则,每个参数化规则用于对相应的单查询条件进行参数化,以将单查询条件转换为结构化查询条件。该参数化规则与语义属性模板的对应关系可以以列表的形式进行存储,或者以列表的形式对应存储参数化规则的标识与语义属性模板的标识,如表2所示。其中,该参数化规则的标识和该语义属性模板的标识分别可以是由开发人员设置的不同的字符串或数字编码,也可以是由系统或服务器自动分配的字符串,或者通过其他方法设置的用以标识不同参数化规则和语义属性模板的信息,本发明实施例对该参数化规则的标识和该语义属性模板的标识的具体标识和设置方式均不作限定。
表2
语义属性模板/语义属性模板的标识 参数化规则/参数化规则的标识
模板1(标识A) 规则1(标识a)
模板2(标识B) 规则2(标识b)
...... ......
该结构化查询条件包括条件参数,该条件参数为主语类参数、谓语类参数、宾语相关属性类参数、宾语类型类参数、条件类型类参数、宾语的数据类型类参数和权值类参数中的至少一类参数;相应地,该按照预设规则对该单查询条件进行参数化,以转换为结构化查询条件包括:根据该单查询条件,对该预设规则中包含的条件参数进行赋值;将该赋值结果转化为结构化查询条件。
在本发明实施例中,结合上述语义属性模板集合,根据产生式规则将单查询条件转换为结构化查询条件,该产生式规则的结构为:Template→ConditionParameter→StructuredCondition,也即是如果任一短语或字词与语义属性模板集合中的任一语义属性模板匹配,则将该短语或字词获取为单查询条件,并将该单查询条件转换为结构化查询条件。其中,ConditionParameter为结构化转化所需的各参数:ConditionParameter={subject,verb,objectRelevant,objectType,conditionType,dataType,undirectWeight},对各参数的具体说明如下:
subject为主语类参数,当单查询条件中包含“电影”等表示影视的词时,该subject为影视数据库中的字段名称;
verb为谓语类参数,如“>”、“is”等,在后续将结构化查询条件转换为形式化查询语言时,作为该形式化查询语言中的操作符;
objectRelevant为宾语相关属性类参数,如“cast(演员)”或“singer(歌手)”等;
objectType为宾语类型类参数,objectType的取值为:“attribute”、“position”和“value”,对应的objectRelevant中的值分别为:宾语词语义属性、宾语词的位置、宾语值;
conditionType为条件类型类参数,取值为“where”、“order”,分别表示此单查询条件为限定条件还是排序条件;
dataType为宾语的数据类型类参数,取值可为“String”和“number”,分别代表字符串和数字类型;
undirectWeight为权值类参数,是指为放宽查询条件时设置的权值。
利用ConditionParameter作为媒介就可以将符合模板Template的单查询条件转换为结构化形式StructuredContion,可以将StructuredContion的结构定义为:{subject,verb,objectList,conditionType,dataType,undirectWeight}。
例如,当单查询条件为“刘德华/主演”时,获取与该单查询条件相匹配的语义属性模板对应的预设规则,该预设规则可以为:{subject=“YANYUAN”,verb=like”,objectRelevant=“cast”,objectType=“attribute”,dataType=“where”,dataType=“string”,undirectWeight=“0.6”},根据该预设规则将该单查询条件转换为结构化查询条件,转换结果为:StructuredCondition:{subject=“yanyuan”,verb=“like”,objectList=“刘德华”,dataType=“where”,dataType=“string”,undirectWeight=“0.6”}。
其中,该权值类参数根据该单查询条件的优先权确定;或,该权值参数根据该单查询条件的热度信息确定。例如,当交互语句包括“刘德华”和“夏洛特烦恼”两个单查询条件时,如果该权值参数根据该单查询条件的优先权确定,当演员的优先权大于影片名称的优先权时,则“刘德华”对应的权值参数大于“夏洛特烦恼”对应的权值参数;如果该权值参数根据该单查询条件的热度信息确定,当“夏洛特烦恼”的热度大于“刘德华”的热度时,则“夏洛特烦恼”对应的权值参数大于“刘德华”对应的权值参数。
通过设置该权值类参数的值,当交互语句中同时出现两个毫无关联的单查询条件时,能够避免返回空的搜索结果,而且能够根据每个单查询条件对应的权值参数,将搜索结果按比例返回。例如,当“刘德华”的权值参数为0.6,“夏洛特烦恼”的权值参数为0.4时,所返回的搜索结果中,与“刘德华”相关的搜索结果占全部搜索结果的60%,与“夏洛特烦恼”相关的搜索结果占全部搜索结果的40%。
通过按照预设规则将单查询条件转换为结构化查询条件,再根据该结构化查询条件在对应的数据列表中进行搜索,还能够进一步提高搜索结果的准确性。
106、根据该结构化查询条件进行搜索。
对于本发明实施例所针对的领域为影视领域的情况下,可以在多媒体视听资源库中进行搜索;需要说明的是,根据本发明所提供的信息搜索方法的使用场景或者是针对的领域不同,可以从不同数据列表或数据库中进行搜索。
在本发明实施例中,根据该结构化查询条件,在数据列表中进行搜索的具体方法可以为:将该结构化查询条件转换为与查询工具对应的查询语言;通过该查询语言实现信息搜索。
在本发明另一实施例中,以SQL作为最终的结构化查询语言为例,对上述搜索方法进行具体说明。例如,在单查询条件“刘德华/主演”的结构化查询条件中,由dataType=“where”可知该单查询条件为接在SQL语句中WHERE子句后的查询条件。根据dataType=“string”和verb=“like”确定where子句的结构为“字段名+运算符+’%值%’”的形式。将subject、verb和obiectList分别填入“字段名”、“运算符”和“值”所在位置,就可以得到WHERE子句“YANYUAN like‘%刘德华%’”,将其拼接到SQL语句中WHERE后。最终,用户请求“刘德华主演的电影”就可以转换为SQL语句“SELECT*FROM video_table WHERE YANYUANlike‘%刘德华%’AND LEIXING like‘%电影% ” 。
上述步骤105和步骤106即为根据从该交互语句中获取的单查询条件进行搜索的过程;当然,根据从该交互语句中获取的单查询条件进行搜索的过程还可以通过其他方法实现,本发明实施例对此不作具体限定。
本发明实施例提供的方法,通过接收用于信息搜索的交互语句,从语义属性模板集合中确定与该交互语句中多个连续字词的语义属性一一对应的目标语义属性模板,并根据所确定的目标语义属性模板从该交互语句中获取单查询条件,由于从该交互语句中获取到的单查询条件是由该交互语句中的多个连续字词组成的短语,与关键字词相比较,该单查询条件所表示的语义信息更完整,即为一个完整的查询限定条件,因此根据所获取到的单查询条件进行信息搜索,能够最大程度符合用户的搜索需求,且能够避免由于丢失信息造成的搜索准确性低的问题;进一步地,通过按照预设规则将每个单查询条件转换为结构化查询条件,再根据该结构化查询条件在数据列表中进行搜索,能够提高搜索速度,提高搜索效率,且能够进一步提高信息搜索的准确性;需要说明的是,将单查询条件结构化的过程,以及将该结构化查询条件转换为查询语言的过程,分别可以采用其他不同的方法实现,本发明实施例对此不作具体限定。
需要说明的是,上述实施例仅以应用场景为从多媒体视听资源库中搜索影视资源为例,对本发明所提供的信息搜索方法进行了说明,但事实上,本发明所提供的信息搜索方法不仅可以应用于影视资源搜索场景,还可以应用于其他场景,如商品信息搜索、新闻搜索等场景,根据应用场景的不同,该语义属性模板集合中的语义属性模板可以不同,与每个语义属性模板对应的参数化规则也可以不同,本发明实施例对该信息搜索方法的应用场景不作具体限定,对与应用场景对应的语义属性模板集合及相应的参数化规则也不作限定。
图3是本发明实施例提供的一种信息搜索装置框图。参照图3,该装置包括接收模块301,确定模块302,单查询条件获取模块303和搜索模块304。
接收模块,用于接收用于进行信息搜索的交互语句;
确定模块,用于从语义属性模板集合中确定目标语义属性模板,所述目标语义属性模板为与所述交互语句中多个连续字词的语义属性一一对应的语义属性模板,所述语义属性模板集合包含至少一个语义属性模板,所述语义属性模板由至少一个语义属性顺序构成;
单查询条件获取模块,用于将与所述目标语义属性模板匹配的多个连续字词组成的短语获取为所述交互语句的单查询条件;
搜索模块,用于根据所述单查询条件进行搜索。
在本发明提供的第一种可能实现方式中,所述搜索模块304用于:
按照预设规则对所述单查询条件进行参数化,以转换为结构化查询条件,所述预设规则是指与所述目标语义属性模板对应的参数化规则;
根据所述结构化查询条件进行搜索。
在本发明提供的第二种可能实现方式中,所述结构化查询条件包括条件参数,所述条件参数为主语类参数、谓语类参数、宾语相关属性类参数、宾语类型类参数、条件类型类参数、宾语的数据类型类参数和权值类参数中的至少一类参数;相应地,所述搜索模块304用于:
根据所述单查询条件,对所述预设规则中包含的条件参数进行赋值;
将所述赋值结果转化为结构化查询条件。
在本发明提供的第三种可能实现方式中,所述权值类参数根据所述单查询条件的优先权确定;或,所述权值类参数根据所述单查询条件的热度信息确定。
在本发明提供的第四种可能实现方式中,所述搜索模块304用于:
将所述结构化查询条件转换为与查询工具对应的查询语言;
通过所述查询语言实现信息搜索。
需要说明的是:上述实施例提供的信息搜索装置在搜索信息时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的信息搜索装置与信息搜索方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本实施例提供了一种终端,该终端可以用于执行上述各个实施例中提供的信息搜索方法。参见图4,该终端400包括:
终端400可以包括RF(Radio Frequency,射频)电路110、包括有一个或一个以上计算机可读存储介质的存储器120、输入单元130、显示单元140、传感器150、音频电路160、WiFi(Wireless Fidelity,无线保真)模块170、包括有一个或者一个以上处理核心的处理器180、以及电源190等部件。本领域技术人员可以理解,图4中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路110可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器180处理;另外,将涉及上行的数据发送给基站。通常,RF电路110包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(Low Noise Amplifier,低噪声放大器)、双工器等。此外,RF电路110还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA(CodeDivision Multiple Access,码分多址)、WCDMA(Wideband Code Division MultipleAccess,宽带码分多址)、LTE(Long Term Evolution,长期演进)、电子邮件、SMS(ShortMessaging Service,短消息服务)等。
存储器120可用于存储软件程序以及模块,处理器180通过运行存储在存储器120的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端400的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器120还可以包括存储器控制器,以提供处理器180和输入单元130对存储器120的访问。
输入单元130可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元130可包括触敏表面131以及其他输入设备132。触敏表面131,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器180,并能接收处理器180发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。除了触敏表面131,输入单元130还可以包括其他输入设备132。具体地,其他输入设备132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元140可用于显示由用户输入的信息或提供给用户的信息以及终端400的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元140可包括显示面板141,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板141。进一步的,触敏表面131可覆盖显示面板141,当触敏表面131检测到在其上或附近的触摸操作后,传送给处理器180以确定触摸事件的类型,随后处理器180根据触摸事件的类型在显示面板141上提供相应的视觉输出。虽然在图4中,触敏表面131与显示面板141是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面131与显示面板141集成而实现输入和输出功能。
终端400还可包括至少一种传感器150,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板141的亮度,接近传感器可在终端400移动到耳边时,关闭显示面板141和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端400还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路160、扬声器161,传声器162可提供用户与终端400之间的音频接口。音频电路160可将接收到的音频数据转换后的电信号,传输到扬声器161,由扬声器161转换为声音信号输出;另一方面,传声器162将收集的声音信号转换为电信号,由音频电路160接收后转换为音频数据,再将音频数据输出处理器180处理后,经RF电路110以发送给比如另一终端,或者将音频数据输出至存储器120以便进一步处理。音频电路160还可能包括耳塞插孔,以提供外设耳机与终端400的通信。
WiFi属于短距离无线传输技术,终端400通过WiFi模块170可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图4示出了WiFi模块170,但是可以理解的是,其并不属于终端400的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器180是终端400的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行终端400的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器180可包括一个或多个处理核心;优选的,处理器180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器180中。
终端400还包括给各个部件供电的电源190(比如电池),优选的,电源可以通过电源管理系统与处理器180逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源190还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,终端400还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,终端的显示单元是触摸屏显示器,终端还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行。所述一个或者一个以上程序包含用于执行以下操作的指令:
接收用于进行信息搜索的交互语句;
从语义属性模板集合中确定目标语义属性模板,所述目标语义属性模板为与所述交互语句中多个连续字词的语义属性一一对应的语义属性模板,所述语义属性模板集合包含至少一个语义属性模板,所述语义属性模板由至少一个语义属性顺序构成;
将与所述目标语义属性模板匹配的多个连续字词组成的短语获取为所述交互语句的单查询条件;
根据所述单查询条件进行搜索。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种信息搜索方法,其特征在于,所述方法包括:
接收用于进行信息搜索的交互语句;对所述交互语句的语义属性进行标注,得到至少两种标注结果,将所述至少两种标注结果中的每个标注结果与语义属性模板集合中每个语义属性模板进行匹配,确定目标语义属性模板;
所述目标语义属性模板为与所述交互语句中多个连续字词的语义属性一一对应的语义属性模板,所述语义属性模板集合包含至少一个语义属性模板,所述语义属性模板由至少一个语义属性顺序构成;
将与所述目标语义属性模板匹配的多个连续字词组成的短语获取为所述交互语句的单查询条件,所述单查询条件是指一个完整的查询限定条件;根据所述单查询条件进行搜索;
所述将与所述目标语义属性模板匹配的多个连续字词组成的短语获取为所述交互语句的单查询条件,包括:
根据所述目标语义属性模板,从所述交互语句中获取与所述目标语义属性模板匹配的多个连续字词组成的短语,得到所述至少两种标注结果的单查询条件;对所述至少两种标注结果的单查询条件进行去重处理,确定所述交互语句的单查询条件。
2.根据权利要求1所述的方法,其特征在于,所述根据所述单查询条件进行搜索包括:
按照预设规则对所述单查询条件进行参数化,以转换为结构化查询条件,所述预设规则是指与所述目标语义属性模板对应的参数化规则;
根据所述结构化查询条件进行搜索。
3.根据权利要求2所述的方法,其特征在于,所述结构化查询条件包括条件参数,所述条件参数为主语类参数、谓语类参数、宾语相关属性类参数、宾语类型类参数、条件类型类参数、宾语的数据类型类参数和权值类参数中的至少一类参数;相应地,所述按照预设规则对所述单查询条件进行参数化,以转换为结构化查询条件包括:
根据所述单查询条件,对所述预设规则中包含的条件参数进行赋值;
将所述赋值结果转化为结构化查询条件。
4.根据权利要求3所述的方法,其特征在于,所述权值类参数根据所述单查询条件的优先权确定;或,所述权值类参数根据所述单查询条件的热度信息确定。
5.根据权利要求2所述的方法,其特征在于,所述根据所述结构化查询条件进行搜索包括:
将所述结构化查询条件转换为与查询工具对应的查询语言;
通过所述查询语言实现信息搜索。
6.一种信息搜索装置,其特征在于,所述装置包括:
接收模块,用于接收用于进行信息搜索的交互语句;
确定模块,用于对所述交互语句的语义属性进行标注,得到至少两种标注结果,将所述至少两种标注结果中的每个标注结果与语义属性模板集合中每个语义属性模板进行匹配,确定目标语义属性模板;
所述目标语义属性模板为与所述交互语句中多个连续字词的语义属性一一对应的语义属性模板,所述语义属性模板集合包含至少一个语义属性模板,所述语义属性模板由至少一个语义属性顺序构成;
单查询条件获取模块,用于将与所述目标语义属性模板匹配的多个连续字词组成的短语获取为所述交互语句的单查询条件,所述单查询条件是指一个完整的查询限定条件;
搜索模块,用于根据所述单查询条件进行搜索;
所述单查询条件获取模块,用于根据所述目标语义属性模板,从所述交互语句中获取与所述目标语义属性模板匹配的多个连续字词组成的短语,得到所述至少两种标注结果的单查询条件;对所述至少两种标注结果的单查询条件进行去重处理,确定所述交互语句的单查询条件。
7.根据权利要求6所述的装置,其特征在于,所述搜索模块用于:
按照预设规则对所述单查询条件进行参数化,以转换为结构化查询条件,所述预设规则是指与所述目标语义属性模板对应的参数化规则;
根据所述结构化查询条件进行搜索。
8.根据权利要求7所述的装置,其特征在于,所述结构化查询条件包括条件参数,所述条件参数为主语类参数、谓语类参数、宾语相关属性类参数、宾语类型类参数、条件类型类参数、宾语的数据类型类参数和权值类参数中的至少一类参数;相应地,所述搜索模块用于:
根据所述单查询条件,对所述预设规则中包含的条件参数进行赋值;
将所述赋值结果转化为结构化查询条件。
9.根据权利要求8所述的装置,其特征在于,所述权值类参数根据所述单查询条件的优先权确定;或,所述权值类参数根据所述单查询条件的热度信息确定。
10.根据权利要求7所述的装置,其特征在于,所述搜索模块用于:
将所述结构化查询条件转换为与查询工具对应的查询语言;
通过所述查询语言实现信息搜索。
CN201610562499.4A 2016-07-15 2016-07-15 信息搜索方法及装置 Expired - Fee Related CN106227774B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610562499.4A CN106227774B (zh) 2016-07-15 2016-07-15 信息搜索方法及装置
US15/393,654 US20170109435A1 (en) 2016-07-15 2016-12-29 Apparatus and method for searching for information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610562499.4A CN106227774B (zh) 2016-07-15 2016-07-15 信息搜索方法及装置

Publications (2)

Publication Number Publication Date
CN106227774A CN106227774A (zh) 2016-12-14
CN106227774B true CN106227774B (zh) 2019-09-20

Family

ID=57519275

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610562499.4A Expired - Fee Related CN106227774B (zh) 2016-07-15 2016-07-15 信息搜索方法及装置

Country Status (2)

Country Link
US (1) US20170109435A1 (zh)
CN (1) CN106227774B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844335A (zh) * 2016-12-21 2017-06-13 海航生态科技集团有限公司 自然语言处理方法及装置
CN108509412A (zh) * 2018-03-02 2018-09-07 北京搜狗科技发展有限公司 一种数据处理方法、装置、电子设备以及存储介质
IL258689A (en) 2018-04-12 2018-05-31 Browarnik Abel A system and method for computerized semantic indexing and searching
CN110555207A (zh) * 2018-06-01 2019-12-10 海信集团有限公司 语句识别方法、装置、机器设备和计算机可读存储介质
CN112148751B (zh) * 2019-06-28 2024-05-07 北京百度网讯科技有限公司 用于查询数据的方法和装置
CN111209479B (zh) * 2020-01-06 2023-05-05 北京字节跳动网络技术有限公司 对象推送方法及装置
CN113076330B (zh) * 2020-01-06 2024-05-17 阿里巴巴集团控股有限公司 查询处理方法、装置、数据库系统、电子设备及存储介质
CN111475722B (zh) * 2020-03-31 2023-04-18 百度在线网络技术(北京)有限公司 用于发送信息的方法和装置
CN111711866A (zh) * 2020-04-30 2020-09-25 咪咕文化科技有限公司 电视节目播放方法、装置、电子设备及存储介质
CN113035194B (zh) * 2021-03-02 2022-11-29 海信视像科技股份有限公司 一种语音控制方法、显示设备及服务器
CN113157964A (zh) * 2021-03-10 2021-07-23 深圳市明源云科技有限公司 一种语音搜索数据集的方法、装置及电子设备
CN113704397B (zh) * 2021-08-05 2024-01-09 北京百度网讯科技有限公司 检索方法、装置、电子设备以及存储介质
CN115080603B (zh) * 2022-08-16 2023-01-17 广东省科技基础条件平台中心 一种数据库查询语言转换方法、装置、设备及存储介质
CN116611411A (zh) * 2023-07-20 2023-08-18 太平金融科技服务(上海)有限公司深圳分公司 一种业务系统报表生成方法、装置、设备及存储介质
CN117216423B (zh) * 2023-08-21 2024-06-04 湖南牙医帮科技有限公司 电商商品的搜索方法、系统、终端设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102073725A (zh) * 2011-01-11 2011-05-25 百度在线网络技术(北京)有限公司 结构化数据的搜索方法和实现该搜索方法的搜索引擎系统
CN103649953A (zh) * 2011-06-27 2014-03-19 阿玛得斯两合公司 用于处理搜索请求的方法和系统
CN104035955A (zh) * 2014-03-18 2014-09-10 北京百度网讯科技有限公司 搜索方法和装置
CN104063400A (zh) * 2013-03-22 2014-09-24 腾讯科技(深圳)有限公司 数据搜索方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9652451B2 (en) * 2014-05-08 2017-05-16 Marvin Elder Natural language query

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102073725A (zh) * 2011-01-11 2011-05-25 百度在线网络技术(北京)有限公司 结构化数据的搜索方法和实现该搜索方法的搜索引擎系统
CN103649953A (zh) * 2011-06-27 2014-03-19 阿玛得斯两合公司 用于处理搜索请求的方法和系统
CN104063400A (zh) * 2013-03-22 2014-09-24 腾讯科技(深圳)有限公司 数据搜索方法和装置
CN104035955A (zh) * 2014-03-18 2014-09-10 北京百度网讯科技有限公司 搜索方法和装置

Also Published As

Publication number Publication date
CN106227774A (zh) 2016-12-14
US20170109435A1 (en) 2017-04-20

Similar Documents

Publication Publication Date Title
CN106227774B (zh) 信息搜索方法及装置
CN104239535B (zh) 一种为文字配图的方法、服务器、终端及系统
US20170091335A1 (en) Search method, server and client
US9449002B2 (en) System and method to retrieve relevant multimedia content for a trending topic
CN104281600B (zh) 智能选词的方法和装置
CN107885718B (zh) 语义确定方法及装置
CN111078986B (zh) 数据检索方法、装置及计算机可读存储介质
CN104424278B (zh) 一种获取热点资讯的方法及装置
CN104063400B (zh) 数据搜索方法和装置
WO2024036616A1 (zh) 一种基于终端的问答方法及装置
CN108492836A (zh) 一种基于语音的搜索方法、移动终端及存储介质
CN109543014B (zh) 人机对话方法、装置、终端及服务器
CN107436948A (zh) 文件搜索方法、装置及终端
CN108268438A (zh) 一种页面内容提取方法、装置以及客户端
CN113868427A (zh) 一种数据处理方法、装置及电子设备
CN107155121A (zh) 语音控制文本的显示方法及装置
WO2021006977A1 (en) Delta graph traversing system
CN104281610B (zh) 过滤微博的方法和装置
US11874829B2 (en) Query execution across multiple graphs
CN110196833A (zh) 应用程序的搜索方法、装置、终端及存储介质
CN113822038B (zh) 一种摘要生成方法和相关装置
US20180365207A1 (en) Multi-lingual tokenization of documents and associated queries
CN116758362A (zh) 图像处理方法、装置、计算机设备及存储介质
CN108920652A (zh) 一种搜索方法、装置及终端
CN104794110B (zh) 机器翻译方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190920

CF01 Termination of patent right due to non-payment of annual fee