CN103995880A - 交互式搜索方法和装置 - Google Patents

交互式搜索方法和装置 Download PDF

Info

Publication number
CN103995880A
CN103995880A CN201410228820.6A CN201410228820A CN103995880A CN 103995880 A CN103995880 A CN 103995880A CN 201410228820 A CN201410228820 A CN 201410228820A CN 103995880 A CN103995880 A CN 103995880A
Authority
CN
China
Prior art keywords
participle
query information
words
keyword
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410228820.6A
Other languages
English (en)
Other versions
CN103995880B (zh
Inventor
李婷婷
万伟
赵世奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410228820.6A priority Critical patent/CN103995880B/zh
Publication of CN103995880A publication Critical patent/CN103995880A/zh
Priority to EP14197219.0A priority patent/EP2953038A1/en
Priority to US14/572,393 priority patent/US20150347500A1/en
Priority to JP2014253625A priority patent/JP5998194B2/ja
Application granted granted Critical
Publication of CN103995880B publication Critical patent/CN103995880B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2423Interactive query statement specification based on a database schema
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements

Abstract

本发明提出一种交互式搜索方法和装置,其中,该方法包括:接收用户输入的第一查询信息;根据第一查询信息获取意图澄清引导语句;接收用户输入的针对意图澄清引导语句的反馈信息,并根据第一查询信息、意图澄清引导语句和反馈信息生成第二查询信息;根据第二查询信息提供搜索结果。本发明的交互式搜索方法,减少了用户的输入操作,降低了用户记忆负担,在提高了搜索引擎识别用户搜索意图的准确性,满足了用户的需求的同时,提升了用户体验。

Description

交互式搜索方法和装置
技术领域
本发明涉及搜索技术领域,特别涉及一种交互式搜索方法和装置。
背景技术
随着计算机技术的不断发展,使得互联网的应用越来越普及,互联网的用户可以通过搜索引擎来获取其需要的网络资源。目前,传统的搜索方法如下:首先,用户输入查询信息,然后搜索引擎根据用户输入的查询信息获得相关的搜索结果并返回至客户端,最后用户在返回的搜索结果中获得自己所需的资源。
但是,通过以上方法进行搜索时,用户经常会因为输入的查询信息表述不清楚或不全面,导致搜索引擎无法为用户提供准确的答案。即使对于相同的资源,由于用户对查询领域的不了解等原因,用户需要通过多次变换查询信息并分别进行搜索,用户的搜索成本非常高,可是即使这样获得的搜索结果仍无法满足用户的需求。
发明内容
本发明旨在至少在一定程度上解决上述技术问题。
为此,本发明的第一个目的在于提出一种交互式搜索方法,能够根据历史查询信息和反馈信息自动更新查询信息,减少了用户的输入操作,降低了用户记忆负担。
本发明的第二个目的在于提出一种交互式搜索装置。
为达上述目的,根据本发明第一方面实施例提出了一种交互式搜索方法,包括:接收用户输入的第一查询信息;根据所述第一查询信息获取意图澄清引导语句;接收所述用户输入的针对所述意图澄清引导语句的反馈信息,并根据所述第一查询信息、所述意图澄清引导语句和所述反馈信息生成第二查询信息;根据所述第二查询信息提供搜索结果。
本发明实施例的交互式搜索方法,通过获取搜索引擎提供的意图澄清引导语句,并根据用户针对该意图澄清引导语句的反馈信息以及意图澄清引导语句更新查询信息,以及根据更新后的查询信息提供搜索结果,对用户的搜索意图进行了澄清,同时可根据历史查询信息和反馈信息自动更新查询信息,只需用户输入针对当前意图澄清引导语句的反馈信息,减少了用户的输入操作,降低了用户记忆负担,在提高了搜索引擎识别用户搜索意图的准确性,满足了用户的需求的同时,提升了用户体验。
本发明第二方面实施例提供了一种交互式搜索装置,第一接收模块,用于接收用户输入的第一查询信息;第一获取模块,用于根据所述第一查询信息获取意图澄清引导语句;第二接收模块,用于接收所述用户输入的针对所述意图澄清引导语句的反馈信息;生成模块,用于根据所述第一查询信息、所述意图澄清引导语句和所述反馈信息生成第二查询信息;提供模块,用于根据所述第二查询信息提供搜索结果。
本发明实施例的交互式搜索装置,通过获取搜索引擎提供的意图澄清引导语句,并根据用户针对该意图澄清引导语句的反馈信息以及意图澄清引导语句更新查询信息,以及根据更新后的查询信息提供搜索结果,对用户的搜索意图进行了澄清,同时可根据历史查询信息和反馈信息自动更新查询信息,只需用户输入针对当前意图澄清引导语句的反馈信息,减少了用户的输入操作,降低了用户记忆负担,在提高了搜索引擎识别用户搜索意图的准确性,满足了用户的需求的同时,提升了用户体验。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的交互式搜索方法的流程图;
图2a为根据本发明一个实施例的用户根据获取意图澄清引导语句输入反馈信息的效果示意图;
图2b为根据本发明一个实施例的根据第二查询信息提供的搜索结果的效果示意图;
图2c为根据本发明一个实施例的根据第一查询信息提供候选结果的效果示意图;
图2d为根据本发明一个实施例的根据第二查询信息提供的搜索结果的效果示意图;
图3根据本发明一个实施例的根据第一查询信息、意图澄清引导语句和反馈信息生成第二查询信息的方法流程图;
图4为根据本发明一个实施例的根据第一查询信息、意图澄清引导语句和反馈信息获取多个关键词集合的方法流程图;
图5为根据本发明一个实施例的根据第一查询信息、意图澄清引导语句和反馈信息获取多个关键词集合的方法流程图;
图6为根据本发明一个实施例的根据多个关键词集合生成第二查询信息的方法流程图;
图7为根据本发明一个实施例的交互式搜索装置的结构示意图。
图8为根据本发明一个具体实施例的交互式搜索装置的结构示意图;
图9为根据本发明另一个实施例的交互式搜索装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“多个”指两个或两个以上;术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
下面参考附图描述根据本发明实施例的交互式搜索方法和装置。
在本发明的实施例中,交互式搜索是一种在搜索过程中可通过提供交互信息以对用户进行搜索引导的搜索方式,具体地,可根据用户的查询信息为用户提供交互信息(如意图澄清引导语句等提示信息),并根据用户针对交互信息的反馈信息更新查询信息,进而根据更新后的查询信息再次搜索,并返回新的搜索结果。
为了解决因用户输入的查询信息表述不清楚或不全面,导致搜索引擎无法为用户提供准确的答案的问题,本发明提出了一种交互式搜索方法,包括:接收用户输入的第一查询信息;根据第一查询信息获取意图澄清引导语句;接收用户输入的针对意图澄清引导语句的反馈信息,并根据第一查询信息、意图澄清引导语句和反馈信息生成第二查询信息;根据第二查询信息提供搜索结果。
图1为根据本发明一个实施例的交互式搜索方法的流程图。如图1所示,根据本发明实施例的交互式搜索方法,包括:
S101,接收用户输入的第一查询信息。
在本发明的一个实施例中,第一查询信息可为查询词或查询语句。用户可根据需要在搜索页面的搜索框或其他搜索区域中输入第一查询信息。
S102,根据第一查询信息获取意图澄清引导语句。
在本发明的实施例中,在根据第一查询信息获得意图澄清引导语句之前,先要建立语句库,以使搜索引擎通过查询该语句库获得意图澄清引导语句。当然,如果已经建立语句库,则无需建立语句库的步骤。应当理解,搜索引擎可根据第一查询信息获取一个或多个意图澄清引导语句,以引导用户澄清其搜索意图。举例来说,对于第一查询信息“610分能上哪些学校”,搜索引擎可获取“你是哪里的”和“是文科生还是理科生”两个意图澄清引导语句。
S103,接收用户输入的针对意图澄清引导语句的反馈信息,并根据第一查询信息、意图澄清引导语句和反馈信息生成第二查询信息。
在本发明的实施例中,反馈信息为针对意图澄清引导语句的回答词语或句子。具体地,在获得意图澄清引导语句后,搜索引擎可通过客户端接收用户输入的针对意图澄清引导语句的反馈信息。具体地,搜索引擎可通过客户端向用户展示意图澄清引导语句,并提供针对意图澄清引导语句的至少一个候选结果或者输入框,以便用户在至少一个候选结果中选择符合其搜索意图的候选结果,或者直接在搜索框中输入针对意图澄清引导语句的回答。
进而,搜索引擎可根据第一查询信息、意图澄清引导语句和反馈信息生成第二查询信息。具体地,搜索引擎可通过句法分析和此意分析分别获取第一查询信息、意图澄清引导语句和反馈信息中表明用户搜索意图的词汇,进而根据获取到的词汇生成第二查询信息。
举例来说,如图2a所示,对于第一查询信息“610分能上哪些学校”,搜索引擎通过客户端向用户提供“你是哪里的”和“是文科生还是理科生”两个意图澄清引导语句。并在每个意图澄清引导语句之后给出一个输入框,此时,用户已分别输入“山东”和“理科”,当用户点击“go”按钮时,搜索引擎即可接收到用户针对两个意图澄清引导语句的反馈信息,并生成第二查询信息“山东理科610分能上哪些学校”。
S104,根据第二查询信息提供搜索结果。
在本发明的实施例中,在根据第二查询信息获取搜索结果之后,可将该搜索结果返回至客户端,以通过客户端将搜索结果提供给用户。
此外,在本发明的实施例中,搜索引擎可判断是否需要根据生成的第二查询信息进一步对用户进行引导,如果需要可根据第二查询信息获取相应的意图程序引导语句,以对用户继续进行引导;如果不需要,可直接提供搜索结果。举例来说,对于图2a所示的示例,搜索引擎根据第二查询信息“山东理科610分能上哪些学校”提供的搜索结果可如图2b所示,并进一步提供意图澄清引导语句“想学什么专业”。
在本发明的一个实施例中,在根据第一查询信息获取意图澄清引导语句之后,搜索引擎可提供针对意图澄清引导语句的至少一个候选结果,以及接收用户对至少一个搜索结果的触发操作,并将被触发的候选结果作为针对意图澄清引导语句的反馈信息,从而减少了用户的输入操作。具体地,举例来说,如图2c所示,搜索引擎对于第一查询信息“哈工大怎么样”提供了“科研”、“教学”、“就业”以及“住宿”四个候选结果供用户选择。此外,还提供给了输入框,以便候选结果中没有符合用户需求的结果时,方便用户自由输入。进而,当用户点击“就业”时,搜索引擎可生成第二查询信息“哈工大就业怎么样”,并提供如图2d所示的搜索结果。
在本发明的一个实施例中,可根据意图澄清语句的类型选择第一查询信息、意图澄清引导语句和反馈信息中的全部或部分生成第二查询信息。在本发明的实施例中,第一查询信息可用c_query表示,意图澄清引导语句可用qb表示,反馈信息可用ans表示,第二查询信息可用n_query表示。意图澄清引导语句的类型主要包括一般疑问句、特殊疑问句和选择疑问句。举例来说,根据上述三种类型的意图澄清引导语句生成第二查询词可如表1所示:
表1
具体地,如图3所示,为根据本发明一个实施例的根据第一查询信息、意图澄清引导语句和反馈信息生成第二查询信息的方法流程图,该方法包括:
S301,获取意图澄清引导语句的类型。
具体地,可通过对意图澄清引导语句进行句法分析以获取其类型。
S302,如果意图澄清引导语句为一般疑问句或特殊疑问句,则根据第一查询信息、意图澄清引导语句和反馈信息获取多个关键词集合。
在本发明的一个实施例中,可通过如图4所示的步骤根据第一查询信息、意图澄清引导语句和反馈信息获取多个关键词集合,具体包括:
S401,分别对第一查询信息、意图澄清引导语句和反馈信息进行分词,以分别获取第一查询信息对应的第一分词集合、意图澄清引导语句对应的第二分词集合和反馈信息对应的第三分词集合。
在本发明的实施例中,在对第一查询信息、意图澄清引导语句和反馈信息进行分词的过程中,同时进行句法分析、实体识别、去停用词处理以及对每个分词进行词性标注,从而得到第一分词集合、第二分词集合和第三分词集合。
S402,分别获取第一分词集合、第二分词集合和第三分词集合中每个分词的多个特征,并分别获取每个分词对应的多个特征的特征值。
在本发明的实施例中,每个分词的多个特征可包括每个词的词性、句法成分、在大量句子语料中的词频、出现次数、是否为实体、在句子中的位置、其上下位词的特征等等。
S403,根据每个分词对应的多个特征的特征值获取每个分词的得分。
在本发明的实施例中,可通过以下公式根据每个分词对应的多个特征的特征值获取每个分词的得分:
score w = exp ( Σ i - 1 N λ i f i ( w ) ) score w = exp ( Σ i N λ i f i ( w ) ) ,
其中,scorew为第w个分词的得分,λi为第w个分词的第i个特征的权重,fi(w)为第w个分词的第i个特征的特征值,N为第w个分词对应的多个特征的总数。
S404,根据每个分词的得分从第一分词集合中筛选出第一关键词集合,从第二分词集合中筛选出第二关键词集合,从第三分词集合中筛选出第三关键词集合。
在本发明的实施例中,可根据预设的筛选规则从每个分词集合中筛选出关键词集合,本发明对筛选规则不做限定。举例来说,可在每个集合中筛选出得分较高的预设数量的关键词,或者筛选出得分大于预设阈值的关键词。
S303,如果意图澄清引导语句为选择疑问句,则根据第一查询信息和反馈信息获取多个关键词集合。
在本发明的一个实施例中,可通过如图5所示的步骤根据第一查询信息、意图澄清引导语句和反馈信息获取多个关键词集合,具体包括:
S501,分别对第一查询信息和反馈信息进行分词,以分别获取第一查询信息对应的第四分词集合和反馈信息对应的第五分词集合。
在本发明的实施例中,在对第一查询信息和反馈信息进行分词的过程中,同时进行句法分析、实体识别、去停用词处理以及对每个分词进行词性标注,从而得到第四分词集合和第五分词集合。
S502,分别获取第四分词集合和第五分词集合中每个分词的多个特征,并分别获取每个分词对应的多个特征的特征值。
在本发明的实施例中,每个分词的多个特征可包括每个词的词性、句法成分、在大量句子语料中的词频、出现次数、是否为实体、在句子中的位置、其上下位词的特征等等。
S503,根据每个分词对应的多个特征的特征值获取每个分词的得分。
在本发明的实施例中,可通过以下公式根据每个分词对应的多个特征的特征值获取每个分词的得分:
score w = exp ( Σ i - 1 N λ i f i ( w ) ) score w = exp ( Σ i N λ i f i ( w ) ) ,
其中,scorew为第w个分词的得分,λi为第w个分词的第i个特征的权重,fi(w)为第w个分词的第i个特征的特征值,N为第w个分词对应的多个特征的总数。
S504,根据每个分词的得分从第四分词集合中筛选出第四关键词集合,从第五分词集合中筛选出第五关键词集合。
在本发明的实施例中,可根据预设的筛选规则从每个分词集合中筛选出关键词集合,本发明对筛选规则不做限定。举例来说,可在每个集合中筛选出得分较高的预设数量的关键词,或者筛选出得分大于预设阈值的关键词。
S304,根据多个关键词集合生成第二查询信息。
具体地,在本发明的一个实施例中,可通过如图6所示的步骤根据多个关键词集合生成第二查询信息,具体包括:
S601,对多个关键词集合进行同义词处理以获取多个关键词序列。
在本发明的实施例中,生成第二查询信息主要以第一查询信息为主,以意图澄清引导语句和反馈信息的关键词作为主要补充。为了保证补充的信息的有意义的、无冗余的,在本发明的一个实施例中,可通过同义词词的,对多个关键词集合进行同义词处理以获取多个关键词序列。具体地,当ans与qb的关键词集合中有相同或同义词时,去掉qb关键词集合中的同义关键词、当ans或qb的关键词集合中存在与c_query关键词集合有相同或同义的词时,去掉ans或qb关键词集合中的同义关键词。最后分别得到c_query、ans、qb的关键词序列。
举例来说,对于表2所示的c_query、ans、qb,可得到表3所示的的两个关键词序列。
表2
表3
S602,将多个关键词序列中的关键词进行排序组合以获取多个候选序列。
在本发明的实施例中,对于关键词个数分别为x、y、z的三个关键词序列,复杂度为x*y*z,因此,对于关键词序列中关键词数量较多的情况,获取所有可能的候选序列的非常复杂,计算量很庞大。因此,为了优化此过程,可通过剪枝算法进行搜索列举,本发明对剪枝算法的具体形式不限,例如,可为Beam-search、A*算法等。
S603,分别根据多个候选序列中关键词的排序获取多个候选序列的得分。
在本发明的一个实施例中,可通过以下公式获取多个候选序列的得分:
score sen = Π i n p ( w i | w i - 1 , w i - 2 ) l ( w i ) ,
其中,scoresen为候选序列sen的得分,为候选序列sen中关键词wi的三元语言模型,c(wiwi-1wi-2)为关键词wi,wi-1,wi-2在语料库中共同出现的次数,c(wi-1wi-2)为wi-1,wi-2在语料库中共同出现的次数,l(wi)=α|d|为调序惩罚项,α为常数,且0<α<1,d=posori_str(wi)-posc_str(wi),posori_str(wi)为关键词wi与wi所在关键词序列中的其他关键词在wi所在关键词序列中的相对位置,posc_str(wi)为关键词wi与wi所在关键词序列中的其他关键词在候选序列sen中的相对位置。
举例来说,对于候选序列“身高175cm200kg减肥体重快速”,当wi是“体重”时,wi所在关键词序列为ans对应的关键词序列“身高175cm体重110kg”,由此可得,posori_str(wi)=3,由候选序列中“身高175cm体重110kg”四个词的顺序“身高175cm200kg体重”可得,posc_str(wi)=4,因此,d=posori_str(wi)-posc_str(wi)=4-3=1,l(wi)=α|d|=α1
S604,根据得分在多个候选序列中筛选出第二查询信息。
举例来说,在本发明的实施例中,可在多个候选序列中筛选出得分最高的候选序列作为第二查询信息。
本发明实施例的交互式搜索方法,通过获取搜索引擎提供的意图澄清引导语句,并根据用户针对该意图澄清引导语句的反馈信息以及意图澄清引导语句更新查询信息,以及根据更新后的查询信息提供搜索结果,对用户的搜索意图进行了澄清,同时可根据历史查询信息和反馈信息自动更新查询信息,只需用户输入针对当前意图澄清引导语句的反馈信息,减少了用户的输入操作,降低了用户记忆负担,在提高了搜索引擎识别用户搜索意图的准确性,满足了用户的需求的同时,提升了用户体验。
为了实现上述实施例,本发明还提出一种交互式搜索装置。
一种交互式搜索装置,包括:第一接收模块,用于接收用户输入的第一查询信息;第一获取模块,用于根据第一查询信息获取意图澄清引导语句;第二接收模块,用于接收用户输入的针对意图澄清引导语句的反馈信息;生成模块,用于根据第一查询信息、意图澄清引导语句和反馈信息生成第二查询信息;提供模块,用于根据第二查询信息提供搜索结果。
图7为根据本发明一个实施例的交互式搜索装置的结构示意图。
如图7所示,根据本发明实施例的交互式搜索装置,包括:第一接收模块100、第一获取模块200、第二接收模块300、生成模块400和提供模块500。
具体地,第一接收模块100用于接收用户输入的第一查询信息。在本发明的一个实施例中,第一查询信息可为查询词或查询语句。用户可根据需要在搜索页面的搜索框或其他搜索区域中输入第一查询信息。
第一获取模块200用于根据第一查询信息获取意图澄清引导语句。在本发明的实施例中,在根据第一查询信息获得意图澄清引导语句之前,先要建立语句库,以使第一获取模块200通过查询该语句库获得意图澄清引导语句。当然,如果已经建立语句库,则无需建立语句库的步骤。应当理解,第一获取模块200可根据第一查询信息获取一个或多个意图澄清引导语句,以引导用户澄清其搜索意图。举例来说,对于第一查询信息“610分能上哪些学校”,第一获取模块200可获取“你是哪里的”和“是文科生还是理科生”两个意图澄清引导语句。
第二接收模块300用于接收用户输入的针对意图澄清引导语句的反馈信息。在本发明的实施例中,反馈信息为针对意图澄清引导语句的回答词语或句子。具体地,在获得意图澄清引导语句后,第二接收模块300可通过客户端接收用户输入的针对意图澄清引导语句的反馈信息。具体地,可通过客户端向用户展示意图澄清引导语句,并提供针对意图澄清引导语句的至少一个候选结果或者输入框,以便用户在至少一个候选结果中选择符合其搜索意图的候选结果,或者直接在搜索框中输入针对意图澄清引导语句的回答。
生成模块400用于根据第一查询信息、意图澄清引导语句和反馈信息生成第二查询信息。更具体地,生成模块400可根据第一查询信息、意图澄清引导语句和反馈信息生成第二查询信息。具体地,生成模块400可通过句法分析和此意分析分别获取第一查询信息、意图澄清引导语句和反馈信息中表明用户搜索意图的词汇,进而根据获取到的词汇生成第二查询信息。
其中,生成模块400可根据意图澄清语句的类型选择第一查询信息、意图澄清引导语句和反馈信息中的全部或部分生成第二查询信息。在本发明的实施例中,第一查询信息可用c_query表示,意图澄清引导语句可用qb表示,反馈信息可用ans表示,第二查询信息可用n_query表示。意图澄清引导语句的类型主要包括一般疑问句、特殊疑问句和选择疑问句。举例来说,根据上述三种类型的意图澄清引导语句生成第二查询词可如表1所示。
举例来说,如图2a所示,对于第一查询信息“610分能上哪些学校”,可通过客户端向用户提供“你是哪里的”和“是文科生还是理科生”两个意图澄清引导语句。并在每个意图澄清引导语句之后给出一个输入框,此时,用户已分别输入“山东”和“理科”,当用户点击“go”按钮时,第二接收模块300即可接收到用户针对两个意图澄清引导语句的反馈信息,并通过生产模块400生成第二查询信息“山东理科610分能上哪些学校”。
提供模块500用于根据第二查询信息提供搜索结果。在本发明的实施例中,在根据第二查询信息获取搜索结果之后,可将该搜索结果返回至客户端,以通过客户端将搜索结果提供给用户。
此外,在本发明的实施例中,还可判断是否需要根据生成的第二查询信息进一步对用户进行引导,如果需要,第一获取模块200可根据第二查询信息获取相应的意图程序引导语句,以对用户继续进行引导;如果不需要,可直接提供搜索结果。举例来说,对于图2a所示的示例,提供模块500根据第二查询信息“山东理科610分能上哪些学校”提供的搜索结果可如图2b所示,并进一步提供意图澄清引导语句“想学什么专业”。
本发明实施例的交互式搜索装置,通过获取搜索引擎提供的意图澄清引导语句,并根据用户针对该意图澄清引导语句的反馈信息以及意图澄清引导语句更新查询信息,以及根据更新后的查询信息提供搜索结果,对用户的搜索意图进行了澄清,同时可根据历史查询信息和反馈信息自动更新查询信息,只需用户输入针对当前意图澄清引导语句的反馈信息,减少了用户的输入操作,降低了用户记忆负担,在提高了搜索引擎识别用户搜索意图的准确性,满足了用户的需求的同时,提升了用户体验。
在如图8所示,本发明的一个实施例中,生成模块400可进一步包括:第一获取子模块410、第二获取子模块420、第三获取子模块430和生成子模块440。
具体地,第一获取子模块410用于获取意图澄清引导语句的类型。更具体地,第一获取子模块410可通过对意图澄清引导语句进行句法分析以获取其类型。
第二获取子模块420用于在意图澄清引导语句为一般疑问句或特殊疑问句时,根据第一查询信息、意图澄清引导语句和反馈信息获取多个关键词集合。在本发明的实施例中,第二获取子模块420具体包括:第一分词单元421、第一获取单元422、第二获取单元423以及第一筛选单元424(图中未标出)。
其中,第一分词单元421用于分别对第一查询信息、意图澄清引导语句和反馈信息进行分词,以分别获取第一查询信息对应的第一分词集合、意图澄清引导语句对应的第二分词集合和反馈信息对应的第三分词集合。在本发明的实施例中,在对第一查询信息、意图澄清引导语句和反馈信息进行分词的过程中,同时进行句法分析、实体识别、去停用词处理以及对每个分词进行词性标注,从而得到第一分词集合、第二分词集合和第三分词集合。
第一获取单元422用于分别获取第一分词集合、第二分词集合和第三分词集合中每个分词的多个特征,并分别获取每个分词对应的多个特征的特征值。在本发明的实施例中,每个分词的多个特征可包括每个词的词性、句法成分、在大量句子语料中的词频、出现次数、是否为实体、在句子中的位置、其上下位词的特征等等。
第二获取单元423用于根据每个分词对应的多个特征的特征值获取每个分词的得分。在本发明的实施例中,可通过以下公式根据每个分词对应的多个特征的特征值获取每个分词的得分:
score w = exp ( &Sigma; i - 1 N &lambda; i f i ( w ) ) score w = exp ( &Sigma; i N &lambda; i f i ( w ) ) ,
其中,scorew为第w个分词的得分,λi为第w个分词的第i个特征的权重,fi(w)为第w个分词的第i个特征的特征值,N为第w个分词对应的多个特征的总数。
第一筛选单元424用于根据每个分词的得分从第一分词集合中筛选出第一关键词集合,从第二分词集合中筛选出第二关键词集合,从第三分词集合中筛选出第三关键词集合。在本发明的实施例中,可根据预设的筛选规则从每个分词集合中筛选出关键词集合,本发明对筛选规则不做限定。举例来说,可在每个集合中筛选出得分较高的预设数量的关键词,或者筛选出得分大于预设阈值的关键词。
第三获取子模块430用于在意图澄清引导语句为选择疑问句时,根据第一查询信息和反馈信息获取多个关键词集合。在本发明的实施例中,第三获取子模块430具体包括:第二分词单元431、第三获取单元432、第四获取单元433以及第二筛选单元434(图中未标出)。
其中,第二分词单元431用于分别对第一查询信息和反馈信息进行分词,以分别获取第一查询信息对应的第四分词集合和反馈信息对应的第五分词集合。在本发明的实施例中,在对第一查询信息和反馈信息进行分词的过程中,同时进行句法分析、实体识别、去停用词处理以及对每个分词进行词性标注,从而得到第四分词集合和第五分词集合。
第三获取单元432用于分别获取第四分词集合和第五分词集合中每个分词的多个特征,并分别获取每个分词对应的多个特征的特征值。在本发明的实施例中,每个分词的多个特征可包括每个词的词性、句法成分、在大量句子语料中的词频、出现次数、是否为实体、在句子中的位置、其上下位词的特征等等。
第四获取单元433用于根据每个分词对应的多个特征的特征值获取每个分词的得分。在本发明的实施例中,可通过以下公式根据每个分词对应的多个特征的特征值获取每个分词的得分:
score w = exp ( &Sigma; i - 1 N &lambda; i f i ( w ) ) score w = exp ( &Sigma; i N &lambda; i f i ( w ) ) ,
其中,scorew为第w个分词的得分,λi为第w个分词的第i个特征的权重,fi(w)为第w个分词的第i个特征的特征值,N为第w个分词对应的多个特征的总数。
第二筛选单元434用于根据每个分词的得分从第四分词集合中筛选出第四关键词集合,从第五分词集合中筛选出第五关键词集合。在本发明的实施例中,可根据预设的筛选规则从每个分词集合中筛选出关键词集合,本发明对筛选规则不做限定。举例来说,可在每个集合中筛选出得分较高的预设数量的关键词,或者筛选出得分大于预设阈值的关键词。
生成子模块440用于根据多个关键词集合生成第二查询信息。更具体地,在本发明的一个实施例中生成子模块具体包括:同义词处理单元441、第五获取单元442、第六获取单元443以及第三筛选单元444。
其中,同义词处理单元441用于对多个关键词集合进行同义词处理以获取多个关键词序列。在本发明的实施例中,生成第二查询信息主要以第一查询信息为主,以意图澄清引导语句和反馈信息的关键词作为主要补充。为了保证补充的信息的有意义的、无冗余的,在本发明的一个实施例中,可通过同义词词的,对多个关键词集合进行同义词处理以获取多个关键词序列。具体地,当ans与qb的关键词集合中有相同或同义词时,去掉qb关键词集合中的同义关键词、当ans或qb的关键词集合中存在与c_query关键词集合有相同或同义的词时,去掉ans或qb关键词集合中的同义关键词。最后分别得到c_query、ans、qb的关键词序列。
举例来说,对于表2所示的c_query、ans、qb,可得到表3所示的的两个关键词序列。
第五获取单元442用于将多个关键词序列中的关键词进行排序组合以获取多个候选序列。在本发明的实施例中,对于关键词个数分别为x、y、z的三个关键词序列,复杂度为x*y*z,因此,对于关键词序列中关键词数量较多的情况,获取所有可能的候选序列的非常复杂,计算量很庞大。因此,为了优化此过程,可通过剪枝算法进行搜索列举,本发明对剪枝算法的具体形式不限,例如,可为Beam-search、A*算法等。
第六获取单元443用于分别根据多个候选序列中关键词的排序获取多个候选序列的得分。在本发明的一个实施例中,可通过以下公式获取多个候选序列的得分:
score sen = &Pi; i n p ( w i | w i - 1 , w i - 2 ) l ( w i ) ,
其中,scoresen为候选序列sen的得分,为候选序列sen中关键词wi的三元语言模型,c(wiwi-1wi-2)为关键词wi,wi-1,wi-2在语料库中共同出现的次数,c(wi-1wi-2)为wi-1,wi-2在语料库中共同出现的次数,l(wi)=α|d|为调序惩罚项,α为常数,且0<α<1,d=posori_str(wi)-posc_str(wi),posori_str(wi)为关键词wi与wi所在关键词序列中的其他关键词在wi所在关键词序列中的相对位置,posc_str(wi)为关键词wi与wi所在关键词序列中的其他关键词在候选序列sen中的相对位置。
举例来说,对于候选序列“身高175cm200kg减肥体重快速”,当wi是“体重”时,wi所在关键词序列为ans对应的关键词序列“身高175cm体重110kg”,由此可得,posori_str(wi)=3,由候选序列中“身高175cm体重110kg”四个词的顺序“身高175cm200kg体重”可得,posc_str(wi)=4,因此,d=posori_str(wi)-posc_str(wi)=4-3=1,l(wi)=α|d|=α1
第三筛选单元444用于根据得分在多个候选序列中筛选出第二查询信息。举例来说,在本发明的实施例中,可在多个候选序列中筛选出得分最高的候选序列作为第二查询信息。
图9为根据本发明另一个实施例的交互式搜索装置的结构示意图。
如图9所示,根据本发明实施例的交互式搜索装置,包括:第一接收模块100、第一获取模块200、第二接收模块300、生成模块400、提供模块500和第二获取模块600。
具体地,第二获取模块600用于获取针对意图澄清引导语句的至少一个候选结果。
第二接收模块300用于接收用户对至少一个候选结果的触发操作,并将被触发的候选结果作为针对意图澄清引导语句的反馈信息。
举例来说,如图2c所示,第二获取模块600对于第一查询信息“哈工大怎么样”提供了“科研”、“教学”、“就业”以及“住宿”四个候选结果供用户选择。此外,还提供给了输入框,以便候选结果中没有符合用户需求的结果时,方便用户自由输入。进而,当用户点击“就业”时,生成模块400可生成第二查询信息“哈工大就业怎么样”,并提供如图2d所示的搜索结果。
本发明实施例的交互式搜索装置,可为用户提供针对意图澄清引导语句的至少一个候选结果,并根据用户对候选结果的触发操作确定相应的反馈信息,从而生成第二查询信息,并据此提供搜索结果,无需用户输入反馈信息,进一步减少了用户的输入操作。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同限定。

Claims (12)

1.一种交互式搜索方法,其特征在于,包括:
接收用户输入的第一查询信息;
根据所述第一查询信息获取意图澄清引导语句;
接收所述用户输入的针对所述意图澄清引导语句的反馈信息,并根据所述第一查询信息、所述意图澄清引导语句和所述反馈信息生成第二查询信息;
根据所述第二查询信息提供搜索结果。
2.如权利要求1所述的方法,其特征在于,在所述根据所述第一查询信息获取意图澄清引导语句之后,还包括:
获取针对所述意图澄清引导语句的至少一个候选结果;
接收所述用户对所述至少一个候选结果的触发操作,并将被触发的候选结果作为所述针对所述意图澄清引导语句的反馈信息。
3.如权利要求1所述的方法,其特征在于,所述根据所述第一查询信息、所述意图澄清引导语句和所述反馈信息生成第二查询信息,包括:
获取所述意图澄清引导语句的类型;
如果所述意图澄清引导语句为一般疑问句或特殊疑问句,则根据所述第一查询信息、所述意图澄清引导语句和所述反馈信息获取多个关键词集合;
如果所述意图澄清引导语句为选择疑问句,则根据所述第一查询信息和所述反馈信息获取多个关键词集合;
根据所述多个关键词集合生成第二查询信息。
4.如权利要求3所述的方法,其特征在于,所述根据所述第一查询信息、所述意图澄清引导语句和所述反馈信息获取多个关键词集合,包括:
分别对所述第一查询信息、所述意图澄清引导语句和所述反馈信息进行分词,以分别获取所述第一查询信息对应的第一分词集合、所述意图澄清引导语句对应的第二分词集合和所述反馈信息对应的第三分词集合;
分别获取所述第一分词集合、所述第二分词集合和所述第三分词集合中每个分词的多个特征,并分别获取所述每个分词对应的多个特征的特征值;
根据所述每个分词对应的多个特征的特征值获取每个分词的得分;
根据所述每个分词的得分从所述第一分词集合中筛选出第一关键词集合,从所述第二分词集合中筛选出第二关键词集合,从所述第三分词集合中筛选出第三关键词集合。
5.如权利要求3所述的方法,其特征在于,所述根据所述第一查询信息和所述反馈信息获取多个关键词集合,包括:
分别对所述第一查询信息和所述反馈信息进行分词,以分别获取所述第一查询信息对应的第四分词集合和所述反馈信息对应的第五分词集合;
分别获取所述第四分词集合和所述第五分词集合中每个分词的多个特征,并分别获取所述每个分词对应的多个特征的特征值;
根据所述每个分词对应的多个特征的特征值获取每个分词的得分;
根据所述每个分词的得分从所述第四分词集合中筛选出第四关键词集合,从所述第五分词集合中筛选出第五关键词集合。
6.如权利要求3所述的方法,其特征在于,所述根据所述多个关键词集合生成第二查询信息,包括:
对所述多个关键词集合进行同义词处理以获取多个关键词序列;
将所述多个关键词序列中的关键词进行排序组合以获取多个候选序列;
分别根据所述多个候选序列中关键词的排序获取所述多个候选序列的得分;
根据所述得分在所述多个候选序列中筛选出所述第二查询信息。
7.一种交互式搜索装置,其特征在于,包括:
第一接收模块,用于接收用户输入的第一查询信息;
第一获取模块,用于根据所述第一查询信息获取意图澄清引导语句;
第二接收模块,用于接收所述用户输入的针对所述意图澄清引导语句的反馈信息;
生成模块,用于根据所述第一查询信息、所述意图澄清引导语句和所述反馈信息生成第二查询信息;
提供模块,用于根据所述第二查询信息提供搜索结果。
8.如权利要求7所述的装置,其特征在于,还包括:
第二获取模块,用于获取针对所述意图澄清引导语句的至少一个候选结果;
其中,所述第二接收模块用于接收所述用户对所述至少一个候选结果的触发操作,并将被触发的候选结果作为所述针对所述意图澄清引导语句的反馈信息。
9.如权利要求7所述的装置,其特征在于,所述生成模块包括:
第一获取子模块,用于获取所述意图澄清引导语句的类型;
第二获取子模块,用于在所述意图澄清引导语句为一般疑问句或特殊疑问句时,根据所述第一查询信息、所述意图澄清引导语句和所述反馈信息获取多个关键词集合;
第三获取子模块,用于在所述意图澄清引导语句为选择疑问句时,根据所述第一查询信息和所述反馈信息获取多个关键词集合;
生成子模块,用于根据所述多个关键词集合生成第二查询信息。
10.如权利要求9所述的装置,其特征在于,所述第二获取子模块包括:
第一分词单元,用于分别对所述第一查询信息、所述意图澄清引导语句和所述反馈信息进行分词,以分别获取所述第一查询信息对应的第一分词集合、所述意图澄清引导语句对应的第二分词集合和所述反馈信息对应的第三分词集合;
第一获取单元,用于分别获取所述第一分词集合、所述第二分词集合和所述第三分词集合中每个分词的多个特征,并分别获取所述每个分词对应的多个特征的特征值;
第二获取单元,用于根据所述每个分词对应的多个特征的特征值获取每个分词的得分;
第一筛选单元,用于根据所述每个分词的得分从所述第一分词集合中筛选出第一关键词集合,从所述第二分词集合中筛选出第二关键词集合,从所述第三分词集合中筛选出第三关键词集合。
11.如权利要求9所述的装置,其特征在于,所述第二获取子模块包括:
第二分词单元,用于分别对所述第一查询信息和所述反馈信息进行分词,以分别获取所述第一查询信息对应的第四分词集合和所述反馈信息对应的第五分词集合;
第三获取单元,用于分别获取所述第四分词集合和所述第五分词集合中每个分词的多个特征,并分别获取所述每个分词对应的多个特征的特征值;
第四获取单元,用于根据所述每个分词对应的多个特征的特征值获取每个分词的得分;
第二筛选单元,用于根据所述每个分词的得分从所述第四分词集合中筛选出第四关键词集合,从所述第五分词集合中筛选出第五关键词集合。
12.如权利要求9所述的装置,其特征在于,所述生成子模块包括:
同义词处理单元,用于对所述多个关键词集合进行同义词处理以获取多个关键词序列;
第五获取单元,用于将所述多个关键词序列中的关键词进行排序组合以获取多个候选序列;
第六获取单元,用于分别根据所述多个候选序列中关键词的排序获取所述多个候选序列的得分;
第三筛选单元,用于根据所述得分在所述多个候选序列中筛选出所述第二查询信息。
CN201410228820.6A 2014-05-27 2014-05-27 交互式搜索方法和装置 Active CN103995880B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201410228820.6A CN103995880B (zh) 2014-05-27 2014-05-27 交互式搜索方法和装置
EP14197219.0A EP2953038A1 (en) 2014-05-27 2014-12-10 Interactive searching method and apparatus
US14/572,393 US20150347500A1 (en) 2014-05-27 2014-12-16 Interactive searching method and apparatus
JP2014253625A JP5998194B2 (ja) 2014-05-27 2014-12-16 対話型検索方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410228820.6A CN103995880B (zh) 2014-05-27 2014-05-27 交互式搜索方法和装置

Publications (2)

Publication Number Publication Date
CN103995880A true CN103995880A (zh) 2014-08-20
CN103995880B CN103995880B (zh) 2019-03-12

Family

ID=51310045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410228820.6A Active CN103995880B (zh) 2014-05-27 2014-05-27 交互式搜索方法和装置

Country Status (4)

Country Link
US (1) US20150347500A1 (zh)
EP (1) EP2953038A1 (zh)
JP (1) JP5998194B2 (zh)
CN (1) CN103995880B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104156492A (zh) * 2014-09-02 2014-11-19 北京国双科技有限公司 搜索内容的提示方法和装置
CN104571813A (zh) * 2014-12-12 2015-04-29 百度在线网络技术(北京)有限公司 一种信息的显示方法及装置
CN106653006A (zh) * 2016-11-17 2017-05-10 百度在线网络技术(北京)有限公司 基于语音交互的搜索方法和装置
CN106681598A (zh) * 2017-01-13 2017-05-17 北京百度网讯科技有限公司 信息输入方法和装置
CN107133280A (zh) * 2017-04-14 2017-09-05 合信息技术(北京)有限公司 反馈的响应方法及装置
CN107168987A (zh) * 2017-03-24 2017-09-15 联想(北京)有限公司 一种数据处理方法及其装置
CN108304434A (zh) * 2017-09-04 2018-07-20 腾讯科技(深圳)有限公司 信息反馈方法和终端设备
CN109902149A (zh) * 2019-02-21 2019-06-18 北京百度网讯科技有限公司 查询处理方法和装置、计算机可读介质
WO2019174318A1 (zh) * 2018-03-14 2019-09-19 北京三快在线科技有限公司 引导语推荐

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11314792B2 (en) * 2016-12-06 2022-04-26 Sap Se Digital assistant query intent recommendation generation
CN109284405A (zh) * 2018-08-31 2019-01-29 北京优酷科技有限公司 信息应答方法及装置
CN109766414A (zh) * 2019-01-18 2019-05-17 广东小天才科技有限公司 一种意图识别方法及系统
US11068665B2 (en) * 2019-09-18 2021-07-20 International Business Machines Corporation Hypernym detection using strict partial order networks
KR102144370B1 (ko) * 2019-11-18 2020-08-13 주식회사 오투오 대화형 정보 검색장치
CN111930904A (zh) * 2020-07-08 2020-11-13 联想(北京)有限公司 信息应答方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010049688A1 (en) * 2000-03-06 2001-12-06 Raya Fratkina System and method for providing an intelligent multi-step dialog with a user
CN1811780A (zh) * 2006-03-03 2006-08-02 中国移动通信集团公司 基于个性化信息的搜索系统及搜索方法
US20070022099A1 (en) * 2005-04-12 2007-01-25 Fuji Xerox Co., Ltd. Question answering system, data search method, and computer program
CN101937437A (zh) * 2009-06-30 2011-01-05 华为技术有限公司 一种搜索方法、装置和系统
KR20110092897A (ko) * 2010-02-10 2011-08-18 오의진 사용자 검색의도에 부합하는 검색 결과 제공 방법 및 시스템
US20120023119A1 (en) * 2009-03-30 2012-01-26 Ducatel Gery M Data searching system
CN102456018A (zh) * 2010-10-18 2012-05-16 腾讯科技(深圳)有限公司 一种交互搜索方法及装置
US20130018895A1 (en) * 2011-07-12 2013-01-17 Harless William G Systems and methods for extracting meaning from speech-to-text data

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4003468B2 (ja) * 2002-02-05 2007-11-07 株式会社日立製作所 適合性フィードバックによる類似データ検索方法および装置
JP5246932B2 (ja) * 2008-08-29 2013-07-24 西日本電信電話株式会社 検索装置及び方法、ならびに、コンピュータプログラム
JP4795452B2 (ja) * 2009-04-30 2011-10-19 沖電気工業株式会社 検索システム及び検索プログラム
US8280900B2 (en) * 2010-08-19 2012-10-02 Fuji Xerox Co., Ltd. Speculative query expansion for relevance feedback
CA2741212C (en) * 2011-05-27 2020-12-08 Ibm Canada Limited - Ibm Canada Limitee Automated self-service user support based on ontology analysis
JP2012248161A (ja) * 2011-05-31 2012-12-13 Oki Electric Ind Co Ltd 対話型検索システム及びプログラム、並びに、対話シナリオ生成システム及びプログラム
US9767144B2 (en) * 2012-04-20 2017-09-19 Microsoft Technology Licensing, Llc Search system with query refinement
JP5880350B2 (ja) * 2012-08-24 2016-03-09 富士ゼロックス株式会社 情報検索プログラム及び情報検索装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010049688A1 (en) * 2000-03-06 2001-12-06 Raya Fratkina System and method for providing an intelligent multi-step dialog with a user
US20070022099A1 (en) * 2005-04-12 2007-01-25 Fuji Xerox Co., Ltd. Question answering system, data search method, and computer program
CN1811780A (zh) * 2006-03-03 2006-08-02 中国移动通信集团公司 基于个性化信息的搜索系统及搜索方法
US20120023119A1 (en) * 2009-03-30 2012-01-26 Ducatel Gery M Data searching system
CN101937437A (zh) * 2009-06-30 2011-01-05 华为技术有限公司 一种搜索方法、装置和系统
KR20110092897A (ko) * 2010-02-10 2011-08-18 오의진 사용자 검색의도에 부합하는 검색 결과 제공 방법 및 시스템
CN102456018A (zh) * 2010-10-18 2012-05-16 腾讯科技(深圳)有限公司 一种交互搜索方法及装置
US20130018895A1 (en) * 2011-07-12 2013-01-17 Harless William G Systems and methods for extracting meaning from speech-to-text data

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104156492A (zh) * 2014-09-02 2014-11-19 北京国双科技有限公司 搜索内容的提示方法和装置
CN104571813A (zh) * 2014-12-12 2015-04-29 百度在线网络技术(北京)有限公司 一种信息的显示方法及装置
CN106653006B (zh) * 2016-11-17 2019-11-08 百度在线网络技术(北京)有限公司 基于语音交互的搜索方法和装置
CN106653006A (zh) * 2016-11-17 2017-05-10 百度在线网络技术(北京)有限公司 基于语音交互的搜索方法和装置
CN106681598A (zh) * 2017-01-13 2017-05-17 北京百度网讯科技有限公司 信息输入方法和装置
CN107168987A (zh) * 2017-03-24 2017-09-15 联想(北京)有限公司 一种数据处理方法及其装置
CN107133280A (zh) * 2017-04-14 2017-09-05 合信息技术(北京)有限公司 反馈的响应方法及装置
CN108304434A (zh) * 2017-09-04 2018-07-20 腾讯科技(深圳)有限公司 信息反馈方法和终端设备
CN108304434B (zh) * 2017-09-04 2021-11-05 腾讯科技(深圳)有限公司 信息反馈方法和终端设备
WO2019174318A1 (zh) * 2018-03-14 2019-09-19 北京三快在线科技有限公司 引导语推荐
CN110309274A (zh) * 2018-03-14 2019-10-08 北京三快在线科技有限公司 引导语推荐方法、装置及电子设备
CN109902149A (zh) * 2019-02-21 2019-06-18 北京百度网讯科技有限公司 查询处理方法和装置、计算机可读介质
US11397788B2 (en) 2019-02-21 2022-07-26 Beijing Baidu Netcom Science And Technology Co., Ltd. Query processing method and device, and computer readable medium

Also Published As

Publication number Publication date
JP2015225657A (ja) 2015-12-14
EP2953038A1 (en) 2015-12-09
JP5998194B2 (ja) 2016-09-28
US20150347500A1 (en) 2015-12-03
CN103995880B (zh) 2019-03-12

Similar Documents

Publication Publication Date Title
CN103995880A (zh) 交互式搜索方法和装置
CN111738016B (zh) 多意图识别方法及相关设备
CN108846138B (zh) 一种融合答案信息的问题分类模型构建方法、装置和介质
CN106649768A (zh) 基于深度问答的问答澄清方法和装置
CN103092943B (zh) 一种广告调度的方法和广告调度服务器
US20160203215A1 (en) Answering user questions based on user expertise level
CN105930432B (zh) 序列标注工具的训练方法和装置
El Ghosh et al. Ontology Learning Process as a Bottom-up Strategy for Building Domain-specific Ontology from Legal Texts.
CN104573099A (zh) 题目的搜索方法及装置
CN104133855A (zh) 一种输入法智能联想的方法及装置
CN103870000A (zh) 一种对输入法所产生的候选项进行排序的方法及装置
CN103714054A (zh) 翻译方法和翻译装置
CN109791761A (zh) 使用校正的术语的声学模型训练
CN112506949B (zh) 结构化查询语言查询语句生成方法、装置及存储介质
CN103927299A (zh) 输入法中候选语句的提供方法、输入内容推荐方法和装置
CN104035958A (zh) 搜索方法和搜索引擎
CN104123351A (zh) 交互式搜索方法和装置
CN104484057A (zh) 联想结果的提供方法和装置
CN103914552A (zh) 应用检索方法和装置
CN103177039A (zh) 一种数据处理方法及装置
CN103106214B (zh) 一种候选词组输出方法和电子设备
CN111428011B (zh) 词语的推荐方法、装置、设备及存储介质
CN114925174A (zh) 文档检索方法、装置及电子设备
Wahde et al. DAISY: an implementation of five core principles for transparent and accountable conversational AI
Wen et al. Interactive spoken content retrieval by extended query model and continuous state space Markov decision process

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant