CN104794218B - 语音搜索方法和装置 - Google Patents

语音搜索方法和装置 Download PDF

Info

Publication number
CN104794218B
CN104794218B CN201510208081.9A CN201510208081A CN104794218B CN 104794218 B CN104794218 B CN 104794218B CN 201510208081 A CN201510208081 A CN 201510208081A CN 104794218 B CN104794218 B CN 104794218B
Authority
CN
China
Prior art keywords
user
search
service
class
demand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510208081.9A
Other languages
English (en)
Other versions
CN104794218A (zh
Inventor
王珍
张娜
陈凯
杨文博
王熙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510208081.9A priority Critical patent/CN104794218B/zh
Publication of CN104794218A publication Critical patent/CN104794218A/zh
Priority to KR1020150171302A priority patent/KR20160128194A/ko
Priority to US14/962,653 priority patent/US20160321368A1/en
Priority to JP2015245664A priority patent/JP2016212826A/ja
Application granted granted Critical
Publication of CN104794218B publication Critical patent/CN104794218B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Artificial Intelligence (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Primary Health Care (AREA)
  • Machine Translation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)

Abstract

本发明提出一种语音搜索方法和装置,该语音搜索方法包括:接收用户输入的语音;将所述语音转化为文字,并对转化的文字进行语义识别;根据所述语义识别的结果,结合所述用户当前所处的地理位置和/或搜索行为的上下文,确定所述用户的搜索需求;根据所述搜索需求进行搜索,获得满足所述搜索需求的服务,并将所述服务提供给所述用户。本发明通过对用户输入的语音进行意图识别,可以精准地确定用户的搜索需求,并将满足用户的搜索需求的服务提供给用户,从而可以提升用户需求的满足程度,提高用户体验度,有利于语音搜索的推广。

Description

语音搜索方法和装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种语音搜索方法和装置。
背景技术
语音是比文字更早、更自然的表达方式。在互联网时代,还不能很方便的依靠语音方式表达需求,但现在的移动互联网改变了人们表达需求的方式,语音、图像,甚至接触式设备都可以用于表达需求,语音在这些多样化的表达形式中更是占据了非常重要的一席。
但是,现有技术中,用户在进行语音搜索时,搜索引擎返回的搜索结果往往不能满足用户的实际需求,用户体验较差,不利于语音搜索的推广。
发明内容
本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种语音搜索方法。该方法通过对用户输入的语音进行意图识别,可以精准地确定用户的搜索需求,并将满足用户的搜索需求的服务提供给用户,从而可以提升用户需求的满足程度,提高用户体验度,有利于语音搜索的推广。
本发明的第二个目的在于提出一种语音搜索装置。
为了实现上述目的,本发明第一方面实施例的语音搜索方法,包括:接收用户输入的语音;将所述语音转化为文字,并对转化的文字进行语义识别;根据所述语义识别的结果,结合所述用户当前所处的地理位置和/或搜索行为的上下文,确定所述用户的搜索需求;根据所述搜索需求进行搜索,获得满足所述搜索需求的服务,并将所述服务提供给所述用户。
本发明实施例的语音搜索方法,将用户输入的语音转化为文字,并对转化的文字进行语义识别,然后根据上述语义识别的结果,结合用户当前所处的地理位置和/或搜索行为的上下文,确定用户的搜索需求,根据该搜索需求进行搜索,获得满足上述搜索需求的服务,并将搜索获得的服务提供给用户,从而可以提升用户需求的满足程度,提高用户体验度,有利于语音搜索的推广。
为了实现上述目的,本发明第二方面实施例的语音搜索装置,包括:接收模块,用于接收用户输入的语音;转化模块,用于将所述语音转化为文字;识别模块,用于对所述转化模块转化的文字进行语义识别;确定模块,用于根据所述识别模块的语义识别的结果,结合所述用户当前所处的地理位置和/或搜索行为的上下文,确定所述用户的搜索需求;搜索模块,用于根据所述搜索需求进行搜索,获得满足所述搜索需求的服务,并将所述服务提供给所述用户。
本发明实施例的语音搜索装置,转化模块将用户输入的语音转化为文字,识别模块对转化的文字进行语义识别,然后确定模块根据上述语义识别的结果,结合用户当前所处的地理位置和/或搜索行为的上下文,确定用户的搜索需求,搜索模块根据该搜索需求进行搜索,获得满足上述搜索需求的服务,并将搜索获得的服务提供给用户,从而可以提升用户需求的满足程度,提高用户体验度,有利于语音搜索的推广。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明语音搜索方法一个实施例的流程图;
图2为本发明将语音转化为文字一个实施例的示意图;
图3为本发明根据用户的搜索需求搜索获得满足上述搜索需求的服务一个实施例的示意图;
图4为本发明执行完成用户选择的服务的后续操作一个实施例的示意图;
图5为本发明根据用户的搜索需求搜索获得满足上述搜索需求的服务另一个实施例的示意图;
图6为本发明根据用户的搜索需求搜索获得满足上述搜索需求的服务再一个实施例的示意图;
图7为本发明根据用户的搜索需求搜索获得满足上述搜索需求的服务再一个实施例的示意图;
图8为本发明执行完成用户选择的服务的后续操作另一个实施例的示意图;
图9为本发明执行完成用户选择的服务的后续操作再一个实施例的示意图;
图10为本发明执行完成用户选择的服务的后续操作再一个实施例的示意图;
图11为本发明语音搜索装置一个实施例的结构示意图;
图12为本发明语音搜索装置另一个实施例的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1为本发明语音搜索方法一个实施例的流程图,如图1所示,该语音搜索方法可以包括:
步骤101,接收用户输入的语音。
步骤102,将上述语音转化为文字,并对转化的文字进行语义识别。
步骤103,根据上述语义识别的结果,结合上述用户当前所处的地理位置和/或搜索行为的上下文,确定上述用户的搜索需求。
步骤104,根据上述搜索需求进行搜索,获得满足上述搜索需求的服务,并将上述服务提供给用户。
进一步地,将上述服务提供给用户之后,搜索引擎还可以获得上述用户在提供的服务中选择的服务,执行完成上述选择的服务的后续操作。
本实施例的一种实现方式中,上述用户的搜索需求为餐饮类需求;则步骤104可以为:根据上述餐饮类需求进行搜索,获得与上述用户当前所处的地理位置的距离小于预定距离的餐厅,并将上述餐厅的信息展示给上述用户;这时,获得上述用户在提供的服务中选择的服务,执行完成上述选择的服务的后续操作可以为:获得上述用户选定的餐厅,向上述用户展示上述选定的餐厅的详情,并根据上述用户的选择执行以下操作之一或组合:在线预约、排号、点菜、支付和购买优惠券。其中,上述预定距离可以在具体实现时自行设定,本实施例对上述预定距离的大小不作限定,举例来说,上述预定距离可以为1000米。
举例来说,当用户通过语音搜索,对麦克风说“我要吃饭”时,搜索引擎就接收到了用户输入的“我要吃饭”的语音,如图2所示,搜索引擎会先将上述语音转化为文字,然后对转化的文字进行语义识别,图2为本发明将语音转化为文字一个实施例的示意图。图3为本发明根据用户的搜索需求搜索获得满足上述搜索需求的服务一个实施例的示意图,如图3所示,根据语义识别的结果可以确定用户的搜索需求为餐饮类需求,用户想要找的是吃饭的地方,因此搜索引擎会根据上述餐饮类需求进行搜索,获得与上述用户当前所处的地理位置的距离小于预定距离的餐厅,并将上述餐厅的信息展示给用户,以供用户进行选择。用户在展示的餐厅中选定一家餐厅之后,搜索引擎可以获得用户选定的餐厅,图4 为本发明执行完成用户选择的服务的后续操作一个实施例的示意图,如图4所示,搜索引擎可以向用户展示该用户选定的餐厅的详情,这样用户就可以查看该用户选定的餐厅的信息,并且,搜索引擎还可以根据用户的选择执行以下操作之一或组合:在线预约、排号和购买优惠券等。
本实施例的另一种实现方式中,上述用户的搜索需求为租车类需求;则步骤104可以为:根据上述租车类需求进行搜索,向上述用户展示租车类服务的页面,上述页面中展示搜索获得的与上述用户当前所处的地理位置的距离小于预定距离并且满足上述搜索需求的租车类服务的信息。同样,上述预定距离可以在具体实现时自行设定,本实施例对上述预定距离的大小不作限定,举例来说,上述预定距离可以为1000米。
举例来说,当用户通过语音搜索,对麦克风说“我要打的”时,搜索引擎就接收到了用户输入的“我要打的”的语音,搜索引擎会先将上述语音转化为文字,然后对转化的文字进行语义识别。根据语义识别结果可以确定用户的搜索需求为租车类需求,用户想要找的是叫出租车或者专车的服务。因此搜索引擎会根据上述租车类需求进行搜索,获得租车类服务的信息,然后将上述租车类服务的信息展示在租车类服务的页面中,以供用户查看,如图5所示,图5为本发明根据用户的搜索需求搜索获得满足上述搜索需求的服务另一个实施例的示意图。然后,用户可以根据自身需要选择租车服务。
本实施例的再一种实现方式中,上述用户的搜索需求为位置寻找类需求;步骤104可以为:根据上述位置寻找类需求进行搜索,获得与上述用户当前所处的地理位置的距离小于预定距离的地理位置,并向上述用户展现搜索获得的地理位置;其中,上述预定距离可以在具体实现时自行设定,本实施例对上述预定距离的大小不作限定,举例来说,上述预定距离可以为1000米。这时,获得上述用户在提供的服务中选择的服务,执行完成上述选择的服务的后续操作可以为:获得上述用户选定的地理位置,生成以上述选定的地理位置为目标位置的导航路径,并根据上述导航路径对上述用户进行导航。
举例来说,当用户通过语音搜索,对麦克风说“我要停车”或者“我要上厕所”时,搜索引擎就接收到了用户输入的“我要停车”或者“我要上厕所”的语音,搜索引擎会先将上述语音转化为文字,然后对转化的文字进行语义识别。根据语义识别的结果可以确定用户的搜索需求为位置寻找类需求,用户想要找的是附近的停车场或者厕所,搜索引擎会根据上述位置寻找类需求进行搜索,获得与上述用户当前所处的地理位置的距离小于预定距离的停车场或者厕所的位置,并向用户展现搜索获得的停车场或者厕所的位置。用户选择某个位置之后,搜索引擎可以获得用户选定的停车场或厕所的位置,然后搜索引擎可以生成以用户选定的停车场或厕所的位置为目标位置的导航路径,并根据上述导航路径对上 述用户进行导航,如图6所示,图6为本发明根据用户的搜索需求搜索获得满足上述搜索需求的服务再一个实施例的示意图。
本实施例的再一种实现方式中,上述用户的搜索需求为理财类需求;本实现方式中,步骤104可以为:根据上述理财类需求进行搜索,获得理财类产品的信息,向上述用户展示理财产品页面,上述页面中展示上述理财类产品的信息;这时,获得上述用户在提供的服务中选择的服务,执行完成上述选择的服务的后续操作可以为:获得上述用户选择的理财类产品,执行在线购买的操作。
举例来说,当用户通过语音搜索,对麦克风说“我要买基金”或者“我要买股票”时,搜索引擎就接收到了用户输入的“我要买基金”或者“我要买股票”的语音,搜索引擎会先将上述语音转化为文字,然后对转化的文字进行语义识别。根据语义识别的结果可以确定用户的搜索需求为理财类需求,用户想要找的是理财类产品的信息,搜索引擎会根据上述理财类需求进行搜索,获得理财类产品的信息,并向上述用户展示理财产品页面,其中,上述页面中展示上述理财类产品的信息,如图7所示,图7为本发明根据用户的搜索需求搜索获得满足上述搜索需求的服务再一个实施例的示意图;然后,用户可以从理财产品页面中选择相应的理财产品,搜索引擎获得用户选择的理财产品之后,可以执行在线购买的操作。
本实施例的再一种实现方式中,上述用户的搜索需求为解题类需求;本实现方式中,步骤104可以为:根据上述解题类需求进行搜索,获得解题类服务的信息,向上述用户展示解题类服务的页面,上述页面中包括上述解题类服务的信息;这时,获得上述用户在提供的服务中选择的服务,执行完成上述选择的服务的后续操作可以为:获得上述用户选定的解题类服务,展示上述用户选定的解题类服务的页面;接收上述用户通过图片或语音上传的待解答的题目;向上述用户返回上述用户上传的题目和上述题目对应的答案。
举例来说,当用户通过语音搜索,对麦克风说“我要解难题”时,搜索引擎就接收到了用户输入的“我要解难题”的语音,搜索引擎会先将上述语音转化为文字,然后对转化的文字进行语义识别。根据语义识别的结果可以确定用户的搜索需求为解题类需求,用户想要的是找到待解答的题目的答案,搜索引擎会根据上述解题类需求进行搜索,获得解题类服务的信息,向上述用户展示解题类服务的页面,上述页面中包括上述解题类服务的信息。用户可以在解题类服务的页面中选择一个解题类服务,搜索引擎获得用户选定的解题类服务之后,向上述用户展示上述用户选定的解题类服务的页面,例如作业帮页面,如图8所示,图8为本发明执行完成用户选择的服务的后续操作另一个实施例的示意图;然后,搜索引擎可以接收上述用户通过图片或语音上传的待解答的题目,如图9所示, 搜索引擎可以接收用户通过语音上传的“1+2×3等于几”的题目,图9为本发明执行完成用户选择的服务的后续操作再一个实施例的示意图;最后,搜索引擎可以向上述用户返回上述用户上传的题目和上述题目对应的答案,如图10所示,图10为本发明执行完成用户选择的服务的后续操作再一个实施例的示意图。
上述语音搜索方法中,首先将用户输入的语音转化为文字,并对转化的文字进行语义识别,然后根据上述语义识别的结果,结合用户当前所处的地理位置和/或搜索行为的上下文,确定用户的搜索需求,根据该搜索需求进行搜索,获得满足上述搜索需求的服务,并将搜索获得的服务提供给用户,从而可以提升用户需求的满足程度,提高用户体验度,有利于语音搜索的推广。
图11为本发明语音搜索装置一个实施例的结构示意图,图11所示的语音搜索装置可以作为搜索引擎,或搜索引擎的一部分实现本发明图1所示实施例的流程,如图11所示,该语音搜索装置可以包括:接收模块1101、转化模块1102、识别模块1103、确定模块1104和搜索模块1105;
其中,接收模块1101,用于接收用户输入的语音;
转化模块1102,用于将上述语音转化为文字;
识别模块1103,用于对转化模块1102转化的文字进行语义识别;
确定模块1104,用于根据识别模块1103的语义识别的结果,结合上述用户当前所处的地理位置和/或搜索行为的上下文,确定上述用户的搜索需求;
搜索模块1105,用于根据上述搜索需求进行搜索,获得满足上述搜索需求的服务,并将上述服务提供给上述用户。
上述语音搜索装置中,转化模块1102将用户输入的语音转化为文字,识别模块1103对转化的文字进行语义识别,然后确定模块1104根据上述语义识别的结果,结合用户当前所处的地理位置和/或搜索行为的上下文,确定用户的搜索需求,搜索模块1105根据该搜索需求进行搜索,获得满足上述搜索需求的服务,并将搜索获得的服务提供给用户,从而可以提升用户需求的满足程度,提高用户体验度,有利于语音搜索的推广。
图12为本发明语音搜索装置另一个实施例的结构示意图,与图11所示的语音搜索装置相比,不同之处在于,图12所示的语音搜索装置还可以包括:获得模块1106和执行模块1107;
其中,获得模块1106,用于获得上述用户在提供的服务中选择的服务;
执行模块1107,用于执行完成上述选择的服务的后续操作。
本实施例的一种实现方式中,确定模块1104确定的用户的搜索需求为餐饮类需求;这 时,搜索模块1105,具体用于根据上述餐饮类需求进行搜索,获得与上述用户当前所处的地理位置的距离小于预定距离的餐厅,并将上述餐厅的信息展示给所述用户;然后,获得模块1106,具体用于获得上述用户选定的餐厅;执行模块1107,具体用于向上述用户展示上述选定的餐厅的详情,并根据上述用户的选择执行以下操作之一或组合:在线预约、排号、点菜、支付和购买优惠券。其中,上述预定距离可以在具体实现时自行设定,本实施例对上述预定距离的大小不作限定,举例来说,上述预定距离可以为1000米。
本实施例的另一种实现方式中,确定模块1104确定的用户的搜索需求为租车类需求;这时,搜索模块1105,具体用于根据上述租车类需求进行搜索,向上述用户展示租车类服务的页面,上述页面中展示搜索获得的与上述用户当前所处的地理位置的距离小于预定距离并且满足上述搜索需求的租车类服务的信息。同样,上述预定距离可以在具体实现时自行设定,本实施例对上述预定距离的大小不作限定,举例来说,上述预定距离可以为1000米。
本实施例的再一种实现方式中,确定模块1104确定的用户的搜索需求为位置寻找类需求;搜索模块1105,具体用于根据上述位置寻找类需求进行搜索,获得与上述用户当前所处的地理位置的距离小于预定距离的地理位置,并向上述用户展现搜索获得的地理位置;获得模块1106,具体用于获得上述用户选定的地理位置;执行模块1107,具体用于生成以上述选定的地理位置为目标位置的导航路径,并根据上述导航路径对上述用户进行导航。
本实施例的再一种实现方式中,确定模块1104确定的用户的搜索需求为理财类需求;搜索模块1105,具体用于根据上述理财类需求进行搜索,获得理财类产品的信息,向上述用户展示理财产品页面,上述页面中展示上述理财类产品的信息;获得模块1106,具体用于获得上述用户选择的理财类产品;执行模块1107,具体用于执行在线购买的操作。
本实施例的再一种实现方式中,确定模块1104确定的用户的搜索需求为解题类需求;搜索模块1105,具体用于根据上述解题类需求进行搜索,获得解题类服务的信息,向上述用户展示解题类服务的页面,上述页面中展示上述解题类服务的信息;获得模块1106,具体用于获得上述用户选定的解题类服务;执行模块1107,具体用于展示上述用户选定的解题类服务的页面,在接收模块1101接收上述用户通过图片或语音上传的待解答的题目之后,向上述用户返回上述用户上传的题目和上述题目对应的答案。
上述语音搜索装置可以通过对用户输入的语音进行意图识别,精准地确定用户的搜索需求,并将满足用户的搜索需求的服务提供给用户,从而可以提升用户需求的满足程度,提高用户体验度,有利于语音搜索的推广。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而 不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(Programmable Gate Array;以下简称:PGA),现场可编程门阵列(Field ProgrammableGate Array;以下简称:FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (12)

1.一种语音搜索方法,其特征在于,包括:
接收用户输入的语音;
将所述语音转化为文字,并对转化的文字进行语义识别;
根据所述语义识别的结果确定所述用户的搜索需求,根据所述用户的搜索需求和所述用户当前所处的地理位置和/或搜索行为的上下文进行搜索,以获得满足所述搜索需求的服务,并将所述服务提供给所述用户,其中,所述用户的搜索需求包括餐饮类需求、租车类需求、位置寻找类需求、理财类需求、解题类需求中的一种,其中,当所述用户的搜索需求为餐饮类需求时,根据所述餐饮类需求进行搜索,获得与所述用户当前所处的地理位置的距离小于预定距离的餐厅,并将所述餐厅的信息展示给所述用户;当所述用户的搜索需求为位置寻找类需求时,根据所述位置寻找类需求进行搜索,获得与所述用户当前所处的地理位置的距离小于预定距离的地理位置,并向所述用户展现搜索获得的地理位置;
获得所述用户在提供的服务中选择的服务,执行完成所述选择的服务的后续操作,其中,所述后续操作的类型是根据所述搜索需求确定的。
2.根据权利要求1所述的方法,其特征在于,当所述用户的搜索需求为餐饮类需求时;
所述获得所述用户在提供的服务中选择的服务,执行完成所述选择的服务的后续操作包括:
获得所述用户选定的餐厅,向所述用户展示所述选定的餐厅的详情,并根据所述用户的选择执行以下操作之一或组合:在线预约、排号、点菜、支付和购买优惠券。
3.根据权利要求1所述的方法,其特征在于,当所述用户的搜索需求为租车类需求时;
根据所述用户的搜索需求和所述用户当前所处的地理位置和/或搜索行为的上下文进行搜索,以获得满足所述搜索需求的服务,并将所述服务提供给所述用户包括:
根据所述租车类需求进行搜索,向所述用户展示租车类服务的页面,所述页面中展示搜索获得的与所述用户当前所处的地理位置的距离小于预定距离并且满足所述搜索需求的租车类服务的信息。
4.根据权利要求1所述的方法,其特征在于,当所述用户的搜索需求为位置寻找类需求时;
所述获得所述用户在提供的服务中选择的服务,执行完成所述选择的服务的后续操作包括:
获得所述用户选定的地理位置,生成以所述选定的地理位置为目标位置的导航路径,并根据所述导航路径对所述用户进行导航。
5.根据权利要求1所述的方法,其特征在于,当所述用户的搜索需求为理财类需求时;
根据所述用户的搜索需求和所述用户当前所处的地理位置和/或搜索行为的上下文进行搜索,以获得满足所述搜索需求的服务,并将所述服务提供给所述用户包括:
根据所述理财类需求进行搜索,获得理财类产品的信息,向所述用户展示理财产品页面,所述页面中展示所述理财类产品的信息;
所述获得所述用户在提供的服务中选择的服务,执行完成所述选择的服务的后续操作包括:
获得所述用户选择的理财类产品,执行在线购买的操作。
6.根据权利要求1所述的方法,其特征在于,当所述用户的搜索需求为解题类需求时;
根据所述用户的搜索需求和所述用户当前所处的地理位置和/或搜索行为的上下文进行搜索,以获得满足所述搜索需求的服务,并将所述服务提供给所述用户包括:
根据所述解题类需求进行搜索,获得解题类服务的信息,向所述用户展示解题类服务的页面,所述页面中展示所述解题类服务的信息;
所述获得所述用户在提供的服务中选择的服务,执行完成所述选择的服务的后续操作包括:
获得所述用户选定的解题类服务,展示所述用户选定的解题类服务的页面;
接收所述用户通过图片或语音上传的待解答的题目;
向所述用户返回所述用户上传的题目和所述题目对应的答案。
7.一种语音搜索装置,其特征在于,包括:
接收模块,用于接收用户输入的语音;
转化模块,用于将所述语音转化为文字;
识别模块,用于对所述转化模块转化的文字进行语义识别;
确定模块,用于根据所述识别模块的语义识别的结果确定所述用户的搜索需求;
搜索模块,用于根据所述用户的搜索需求和所述用户当前所处的地理位置和/或搜索行为的上下文进行搜索,以获得满足所述搜索需求的服务,并将所述服务提供给所述用户,其中,所述用户的搜索需求包括餐饮类需求、租车类需求、位置寻找类需求、理财类需求、解题类需求中的一种,其中,当所述用户的搜索需求为餐饮类需求时,所述搜索模块,具体用于根据所述餐饮类需求进行搜索,获得与所述用户当前所处的地理位置的距离小于预定距离的餐厅,并将所述餐厅的信息展示给所述用户;当所述用户的搜索需求为位置寻找类需求时,所述搜索模块,具体用于根据所述位置寻找类需求进行搜索,获得与所述用户当前所处的地理位置的距离小于预定距离的地理位置,并向所述用户展现搜索获得的地理位置;
获得模块,用于获得所述用户在提供的服务中选择的服务;
执行模块,用于执行完成所述选择的服务的后续操作,其中,所述后续操作的类型是根据所述搜索需求确定的。
8.根据权利要求7所述的装置,其特征在于,当所述确定模块确定的用户的搜索需求为餐饮类需求时;
所述获得模块,具体用于获得所述用户选定的餐厅;
所述执行模块,具体用于向所述用户展示所述选定的餐厅的详情,并根据所述用户的选择执行以下操作之一或组合:在线预约、排号、点菜、支付和购买优惠券。
9.根据权利要求7所述的装置,其特征在于,当所述确定模块确定的用户的搜索需求为租车类需求时;
所述搜索模块,具体用于根据所述租车类需求进行搜索,向所述用户展示租车类服务的页面,所述页面中展示搜索获得的与所述用户当前所处的地理位置的距离小于预定距离并且满足所述搜索需求的租车类服务的信息。
10.根据权利要求7所述的装置,其特征在于,当所述确定模块确定的用户的搜索需求为位置寻找类需求时;
所述获得模块,具体用于获得所述用户选定的地理位置;
所述执行模块,具体用于生成以所述选定的地理位置为目标位置的导航路径,并根据所述导航路径对所述用户进行导航。
11.根据权利要求7所述的装置,其特征在于,当所述确定模块确定的用户的搜索需求为理财类需求时;
所述搜索模块,具体用于根据所述理财类需求进行搜索,获得理财类产品的信息,向所述用户展示理财产品页面,所述页面中展示所述理财类产品的信息;
所述获得模块,具体用于获得所述用户选择的理财类产品;
所述执行模块,具体用于执行在线购买的操作。
12.根据权利要求7所述的装置,其特征在于,当所述确定模块确定的用户的搜索需求为解题类需求时;
所述搜索模块,具体用于根据所述解题类需求进行搜索,获得解题类服务的信息,向所述用户展示解题类服务的页面,所述页面中展示所述解题类服务的信息;
所述获得模块,具体用于获得所述用户选定的解题类服务;
所述执行模块,具体用于展示所述用户选定的解题类服务的页面,在所述接收模块接收所述用户通过图片或语音上传的待解答的题目之后,向所述用户返回所述用户上传的题目和所述题目对应的答案。
CN201510208081.9A 2015-04-28 2015-04-28 语音搜索方法和装置 Active CN104794218B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201510208081.9A CN104794218B (zh) 2015-04-28 2015-04-28 语音搜索方法和装置
KR1020150171302A KR20160128194A (ko) 2015-04-28 2015-12-03 음성 검색 방법 및 장치
US14/962,653 US20160321368A1 (en) 2015-04-28 2015-12-08 Speech Searching Method And Speech Searching Device
JP2015245664A JP2016212826A (ja) 2015-04-28 2015-12-16 音声検索を行う方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510208081.9A CN104794218B (zh) 2015-04-28 2015-04-28 语音搜索方法和装置

Publications (2)

Publication Number Publication Date
CN104794218A CN104794218A (zh) 2015-07-22
CN104794218B true CN104794218B (zh) 2019-07-05

Family

ID=53559010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510208081.9A Active CN104794218B (zh) 2015-04-28 2015-04-28 语音搜索方法和装置

Country Status (4)

Country Link
US (1) US20160321368A1 (zh)
JP (1) JP2016212826A (zh)
KR (1) KR20160128194A (zh)
CN (1) CN104794218B (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105047198B (zh) * 2015-08-24 2020-09-22 百度在线网络技术(北京)有限公司 语音纠错处理方法及装置
CN105183881B (zh) * 2015-09-23 2019-09-03 百度在线网络技术(北京)有限公司 信息查询方法和装置
CN105426436B (zh) * 2015-11-05 2019-10-15 百度在线网络技术(北京)有限公司 基于人工智能机器人的信息提供方法和装置
US10400874B2 (en) 2016-03-23 2019-09-03 Toyota Jidosha Kabushiki Kaisha Torque converter having torsional vibration damping device
CN106354835A (zh) * 2016-08-31 2017-01-25 上海交通大学 基于上下文语义理解的人工对话辅助系统
CN106776872A (zh) * 2016-11-29 2017-05-31 暴风集团股份有限公司 根据语音定义语意进行语音搜索的方法及系统
CN107391983B (zh) * 2017-03-31 2020-10-16 创新先进技术有限公司 一种基于物联网的信息处理方法及装置
CN107424611B (zh) * 2017-07-07 2021-10-15 歌尔科技有限公司 语音交互方法及装置
CN108009303B (zh) * 2017-12-30 2021-09-14 北京百度网讯科技有限公司 基于语音识别的搜索方法、装置、电子设备和存储介质
CN108198076A (zh) * 2018-02-05 2018-06-22 深圳市资本在线金融信息服务有限公司 一种金融投资方法、装置、终端设备和存储介质
CN108346045A (zh) * 2018-02-05 2018-07-31 深圳市资本在线金融信息服务有限公司 一种账户充值方法、装置、终端设备和存储介质
CN108596751A (zh) * 2018-02-05 2018-09-28 深圳市资本在线金融信息服务有限公司 一种账户还款方法、装置、终端设备和存储介质
CN109739462B (zh) * 2018-03-15 2020-07-03 北京字节跳动网络技术有限公司 一种内容输入的方法及装置
CN108827275A (zh) * 2018-06-08 2018-11-16 苏州经贸职业技术学院 旅游导航方法和系统
CN108984730A (zh) * 2018-07-12 2018-12-11 三星电子(中国)研发中心 一种搜索方法和搜索设备
CN108831482A (zh) * 2018-08-24 2018-11-16 深圳市云采网络科技有限公司 一种基于语音识别搜索电子元器件的方法
CN109472672A (zh) 2018-11-07 2019-03-15 合肥京东方光电科技有限公司 商品导购方法及装置
CN109840851A (zh) * 2018-11-08 2019-06-04 深圳壹账通智能科技有限公司 一种理财数据的综合管理方法、装置及设备
CN110163398B (zh) * 2019-05-07 2022-02-01 厦门钛尚人工智能科技有限公司 基于语音识别的场馆预订方法及系统
CN110599127A (zh) * 2019-09-12 2019-12-20 花豹科技有限公司 智能提醒方法及计算机设备
WO2022049709A1 (ja) * 2020-09-03 2022-03-10 日本電気株式会社 サービス提供装置、サービス提供システム、サービス提供方法及び非一時的なコンピュータ可読媒体
CN112086091A (zh) * 2020-09-18 2020-12-15 南京孝德智能科技有限公司 一种智能化养老服务系统及方法
CN115223563B (zh) * 2021-09-16 2023-09-15 广州汽车集团股份有限公司 一种车辆导航语音交互方法、装置及存储介质
CN115471188B (zh) * 2022-09-05 2023-06-30 漱玉平民大药房连锁股份有限公司 一种参会人员服务券供给需求的识别方法及设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005526319A (ja) * 2002-05-16 2005-09-02 ポストレル,リチャード 地心座標に基づくインセンティブを提供し、無線機器を介して商取引を実行するシステムおよび方法
CN102591932A (zh) * 2011-12-23 2012-07-18 优视科技有限公司 语音搜索方法及系统、移动终端、中转服务器
CN102831213A (zh) * 2012-08-16 2012-12-19 广东小天才科技有限公司 一种学习内容的搜索方法、装置及电子产品
CN103246679A (zh) * 2012-02-13 2013-08-14 刘龙 一种实现基于位置的搜索的系统和方法
JP2014106927A (ja) * 2012-11-29 2014-06-09 Toyota Motor Corp 情報処理システム
CN104216906A (zh) * 2013-05-31 2014-12-17 大陆汽车投资(上海)有限公司 语音搜索方法和设备
KR101504656B1 (ko) * 2014-09-29 2015-03-23 (주)원우이엔지 조립성을 향상시킨 시저스 버킷장치 용 회전축 어셈블리 및 이를 구비한 시저스 버킷장치
JP2015069103A (ja) * 2013-09-30 2015-04-13 Necパーソナルコンピュータ株式会社 情報処理装置、制御方法、及びプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002074094A (ja) * 2000-09-01 2002-03-12 Mitsubishi Electric Corp サービス注文方法
JP2003167895A (ja) * 2001-11-30 2003-06-13 Denso Corp 情報検索システム、サーバおよび車載端末
DE10209928A1 (de) * 2002-03-07 2003-09-18 Philips Intellectual Property Verfahren zum Betrieb eines Sprach-Dialogsystems
EP1504394A4 (en) * 2002-04-30 2007-12-05 Jose M Alonso SYSTEM OF SECURITY AND MANAGEMENT OF PROPERTY
CN101339555A (zh) * 2008-07-22 2009-01-07 深圳钱袋商务有限公司 一种信息搜索和显示方法及系统
JP5299614B2 (ja) * 2008-09-30 2013-09-25 株式会社エクォス・リサーチ 電子クーポン利用促進システム
US8326637B2 (en) * 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
JP2012098981A (ja) * 2010-11-04 2012-05-24 Seiko Epson Corp 空席数算出装置、店舗管理システム、空席数算出方法およびプログラム
US9547647B2 (en) * 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
WO2016018039A1 (en) * 2014-07-31 2016-02-04 Samsung Electronics Co., Ltd. Apparatus and method for providing information

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005526319A (ja) * 2002-05-16 2005-09-02 ポストレル,リチャード 地心座標に基づくインセンティブを提供し、無線機器を介して商取引を実行するシステムおよび方法
CN102591932A (zh) * 2011-12-23 2012-07-18 优视科技有限公司 语音搜索方法及系统、移动终端、中转服务器
CN103246679A (zh) * 2012-02-13 2013-08-14 刘龙 一种实现基于位置的搜索的系统和方法
CN102831213A (zh) * 2012-08-16 2012-12-19 广东小天才科技有限公司 一种学习内容的搜索方法、装置及电子产品
JP2014106927A (ja) * 2012-11-29 2014-06-09 Toyota Motor Corp 情報処理システム
CN104216906A (zh) * 2013-05-31 2014-12-17 大陆汽车投资(上海)有限公司 语音搜索方法和设备
JP2015069103A (ja) * 2013-09-30 2015-04-13 Necパーソナルコンピュータ株式会社 情報処理装置、制御方法、及びプログラム
KR101504656B1 (ko) * 2014-09-29 2015-03-23 (주)원우이엔지 조립성을 향상시킨 시저스 버킷장치 용 회전축 어셈블리 및 이를 구비한 시저스 버킷장치

Also Published As

Publication number Publication date
CN104794218A (zh) 2015-07-22
US20160321368A1 (en) 2016-11-03
KR20160128194A (ko) 2016-11-07
JP2016212826A (ja) 2016-12-15

Similar Documents

Publication Publication Date Title
CN104794218B (zh) 语音搜索方法和装置
Tuomi et al. Applications and implications of service robots in hospitality
Lee et al. Tourists’ happiness: are there smart tourism technology effects?
Soderstrom et al. Organizational structure from interaction: Evidence from corporate sustainability efforts
Cennamo et al. Managing digital transformation: Scope of transformation and modalities of value co-generation and delivery
Nam et al. The adoption of artificial intelligence and robotics in the hotel industry: prospects and challenges
Hamilton et al. Traveling with companions: The social customer journey
Hagen et al. From fragile to agile: marketing as a key driver of entrepreneurial internationalization
Penin An introduction to service design: designing the invisible
Lam et al. Leveraging frontline employees’ small data and firm-level big data in frontline management: An absorptive capacity perspective
Quick et al. Distinguishing participation and inclusion
Okumus et al. Strategic management in the international hospitality and tourism industry
Schaefer et al. Social, environmental and sustainable entrepreneurship research: what is needed for sustainability-as-flourishing?
Malhotra et al. Internationalization and entry modes: a multitheoretical framework and research propositions
Singh et al. One-voice strategy for customer engagement
Bélanger et al. The nature of front-line service work: distinctive features and continuity in the employment relationship
Schmitz et al. The contextual role of regulatory stakeholder pressure in proactive environmental strategies: An empirical test of competing theoretical perspectives
Hooley et al. Marketing capabilities and firm performance: a hierarchical model
Botterill Family and mobility in second modernity: Polish migrant narratives of individualization and family life
Schmiz Staging a ‘Chinatown’in Berlin: The role of city branding in the urban governance of ethnic diversity
Deffner et al. City marketing and planning in two Greek cities: plurality or constraints?
Soderstrom et al. From paradoxical thinking to practicing sustainable business: The role of a business collective organization in supporting entrepreneurs
Ehlenz et al. Downtown revitalization in the era of millennials: how developer perceptions of millennial market demands are shaping urban landscapes
Lawrence Leading change: How successful leaders approach change management
Lee et al. Disruptive technologies and innovation in hospitality: a computer-assisted qualitative data analysis approach

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant