CN104573099A - 题目的搜索方法及装置 - Google Patents

题目的搜索方法及装置 Download PDF

Info

Publication number
CN104573099A
CN104573099A CN201510047996.6A CN201510047996A CN104573099A CN 104573099 A CN104573099 A CN 104573099A CN 201510047996 A CN201510047996 A CN 201510047996A CN 104573099 A CN104573099 A CN 104573099A
Authority
CN
China
Prior art keywords
keyword
symbol
word
main body
word message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510047996.6A
Other languages
English (en)
Other versions
CN104573099B (zh
Inventor
梁爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baige Feichi Technology Co ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510047996.6A priority Critical patent/CN104573099B/zh
Publication of CN104573099A publication Critical patent/CN104573099A/zh
Application granted granted Critical
Publication of CN104573099B publication Critical patent/CN104573099B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种题目的搜索方法,包括:接收用户的语音输入信息;将用户的语音输入信息转换为文字信息;提取文字信息中的主体关键词、运算关键词和符号关键词;以及根据主体关键词、运算关键词和符号关键词生成检索词,并根据检索词搜索到对应的题目。发明实施例的方法提升了用户的口语化输入题目导致的检索结果不准,提高了题目检索结果输出的概率,从而提升了用户体验。发明还公开了一种题目的搜索装置。

Description

题目的搜索方法及装置
技术领域
本发明涉及搜索技术领域,尤其涉及一种题目的搜索方法及装置。
背景技术
随着搜索技术的快速发展,越来越多的用户通过具有搜索技术的产品进行题目的搜索,以得到相应的搜索结果,例如,用户不会解答某个数学题目时,想通过互联网搜索相应的答案。
目前市场上已经具有题目的搜索功能的产品,例如作业帮等,这些产品在进行题目的搜索时的实现过程一般是使用用户输入的文本或者图片来作为搜索形式。由于通过文本或者图片来作为搜索形式会导致整个交互过程和流程均比较复杂,所以有些搜索引擎使用了语音作为检索输入的载体,其实现过程可为:接收用户通过语音人机交互接口输入的语音题目,并对该语音题目进行识别以识别出中间的文字,并将中间的文字作为检索输入,以及根据该检索输入搜索对应的结果。
但是存在的问题是,上述通过语音输入作为检索输入的载体,并没有针对用户的语音搜题过程做优化的处理,可能会丢失原始的信息,并且用户的口语表示和实际的题目存在信息可能会丢失,比如“(a+b)2”,用户的口语表述为“括号a+b括号的平方”、或者“括号a+b的平方”,但是,这样的表述方式和检索题库中的内容可能不一致,导致检索不到结果或者检索不准确等问题,用户体验变差。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的第一个目的在于提出一种题目的搜索方法。该方法可以提升用户的口语化输入题目导致的检索结果不准,提高题目检索结果输出的概率,从而提升用户体验。
本发明的第二个目的在于提出一种题目的搜索装置。
为了实现上述目的,本发明第一方面实施例的题目的搜索方法,包括:接收用户的语音输入信息;将所述用户的语音输入信息转换为文字信息;提取所述文字信息中的主体关键词、运算关键词和符号关键词;以及根据所述主体关键词、所述运算关键词和所述符号关键词生成检索词,并根据所述检索词搜索到对应的题目。
本发明实施例的题目的搜索方法,可先接收用户的语音输入信息,之后可将用户的语音输入信息转换为文字信息,并提取文字信息中的主体关键词、运算关键词和符号关键词,以及根据主体关键词、运算关键词和符号关键词生成检索词,并根据检索词搜索到对应的题目,提升了用户的口语化输入题目导致的检索结果不准,提高了题目检索结果输出的概率,从而提升了用户体验。
为了实现上述目的,本发明第二方面实施例的题目的搜索装置,包括:接收模块,用于接收用户的语音输入信息;转换模块,用于将所述用户的语音输入信息转换为文字信息;提取模块,用于提取所述文字信息中的主体关键词、运算关键词和符号关键词;生成模块,用于根据所述主体关键词、所述运算关键词和所述符号关键词生成检索词;以及搜索模块,用于根据所述检索词搜索到对应的题目。
本发明实施例的题目的搜索装置,可通过接收模块接收用户的语音输入信息,转换模块将用户的语音输入信息转换为文字信息,提取模块提取文字信息中的主体关键词、运算关键词和符号关键词,生成模块根据主体关键词、运算关键词和符号关键词生成检索词,搜索模块根据检索词搜索到对应的题目,提升了用户的口语化输入题目导致的检索结果不准,提高了题目检索结果输出的概率,从而提升了用户体验。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,
图1是根据本发明一个实施例的题目的搜索方法的流程图;
图2是根据本发明一个实施例的题目的搜索装置的结构示意图;
图3是根据本发明一个实施例的生成模块的结构示意图;
图4是根据本发明另一个实施例的题目的搜索装置的结构示意图;
图5是根据本发明又一个实施例的题目的搜索装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的题目的搜索方法及装置。
本发明实施例提出了一种题目的搜索方法,包括:接收用户的语音输入信息;将用户的语音输入信息转换为文字信息;提取文字信息中的主体关键词、运算关键词和符号关键词;以及根据主体关键词、运算关键词和符号关键词生成检索词,并根据检索词搜索到对应的题目。
图1是根据本发明一个实施例的题目的搜索方法的流程图。如图1所示,该题目的搜索方法可以包括:
S101,接收用户的语音输入信息。
例如,假设本发明实施例的题目的搜索方法应用于具有搜索功能的应用程序,该应用程序提供语音人机交互接口,当用户不会某个数学题目时,想通过该应用程序提供的语音人机交互接口输入该题目的语音信息以获得相应的搜索结果,那么该语音人机交互接口可接收用户使用语音人机交互接口输入的语音输入信息。
S102,将用户的语音输入信息转换为文字信息。
具体地,可通过语音识别系统对用户的语音输入信息进行识别,以将该语音输入信息转换为相应的文字信息。
S103,提取文字信息中的主体关键词、运算关键词和符号关键词。
其中,在本发明的实施例中,主体关键词可包括文字信息中的主体词等,例如常见的英文字母和数字,英文字母如“a”、“b”、“f”、“x”、“y”、“z”等,数字如“0”、“1”、…、“9”,又如“派”等;运算关键词可包括运算符号所对应的文字等,如“加”、“减”、“乘”、“除”、“平方”、“立方”、“二次根号”、“西格玛”、“积分”等;符号关键词可包括但不限于连接符号所对应的文字和/或连接词等,如,“括号”、“的”、“点”、“大于或等于”、“小于”、“约等于”、“负”等。
具体地,在将用户的语音输入信息转换为文字信息之后,可提取文字信息中的各种关键词,如主体关键词、运算关键词和符号关键词等。举例而言,以数学表达式“(a+b)2”为例,用户可能的口语表述方式如下:“括号a加b括号的平方”、或“括号a加b的平方”、或“左括号a加b右括号的平方”等,可对上述文字信息进行提取,提取出主体关键词“a”和“b”、运算关键词“加”和“平方”,文字“括号a加b括号的平方”中的符号关键词为“括号”、“括号”和“的”,文字“括号a加b的平方”中的符号关键词为“括号”和“的”,文字“左括号a加b右括号的平方”中的符号关键词为“左括号”、“右括号”和“的”。
需要说明的是,在本发明的实施例中,在提取文字信息中的各种关键词的过程中,一般遵循最大匹配原则,比如“大括号a加b”,提取出符号关键词“大括号”而不是“括号”。
S104,根据主体关键词、运算关键词和符号关键词生成检索词,并根据检索词搜索到对应的题目。
具体而言,在本发明的实施例中,可先根据运算关键词和主体关键词确定符号关键词的适用范围,之后,可根据主体关键词、运算关键词、符号关键词和符号关键词的适用范围进行翻译以生成检索词。
可以理解,由于符号关键词可表示主体关键词中主体词之间的计算顺序,所以,在本发明的实施例中,可先根据运算关键词和主体关键词确定符号关键词的适用范围,以确定主体词之间的计算顺序、或者主体词之间的关联规则。举例而言,以数学表达式“(a+b)2”为例,文字信息“括号a加b括号的平方”中的符号关键词“括号”、“括号”和“的”,可以精确的确定主体词“a”和“b”之间的关联规则,即可确定其对应的数学表达式即为“(a+b)2”,而文字信息“括号a加b的平方”则是不确定的表述,该表述可能对应数学表达式“(a+b)2”,也可能对应数学表达式“(a)+b2”,因此,对于上述文字信息“括号a加b的平方”来说,需要根据运算关键词“加”、“平方”和主体关键词“a”、“b”确定符号关键词“括号”、“的”的适用范围,因为主体关键词“a”本身可以不用括号,所以可以理解该符号关键词“括号”的适用范围是“a”、“加”、“b”这三个关键词。
在确定符号关键词的适用范围之后,可根据主体关键词、运算关键词、符号关键词和符号关键词的适用范围对上述文字信息进行翻译以生成相应的检索词。可以理解,文字信息中的每个关键均有各自的作用形式以及关键词之间的优先级关系。具体地,可根据主体关键词、运算关键词、符号关键词和符号关键词的适用范围对上述文字信息进行拆解,拆解成多个文本,然后根据关键词之间的优先级关系对多个文本进行翻译以生成检索词。例如,以文字信息“左括号a加b右括号的平方”为例,可根据主体关键词、运算关键词、符号关键词和符号关键词的适用范围对“左括号a加b右括号的平方”进行拆解,拆解成多个文本“左括号a加b右括号”、“的”、“平方”,文本“左括号a加b右括号”翻译成“(a+b)”,文本“的”、“平方”表示了“(a+b)”与“平方”之间的关系,根据该关系和翻译的文本“(a+b)”、“平方”生成相应的检索词,之后可根据该检索词进行检索,以搜索到对应的题目。
进一步的,为了提高检索结果的精确度,在本发明的一个实施例中,在将用户的语音输入信息转换为文字信息之后,该题目的搜索方法还可包括:提取文字信息中的上下文关系,并根据上下文关系对文字信息中的文字进行纠错。例如,以文字信息“括号a加b括号”为例,可先提取该文字信息中的上下文关系为a与b之间做加法,且由于括号具有左右之分,所以根据该上下文关系对“括号a加b括号”中的文字进行纠错,纠错成“左括号a加b右括号”。由此,通过对文字信息中的文字进行纠错,提高了文字信息中的各种关键词提取的准确度,并提高了检索词生成的准确度,从而提高了检索结果的精确度。
进一步的,为了使得文字规范化,方便数据的处理,在本发明的一个实施例中,在将用户的语音输入信息转换为文字信息之后,该题目的搜索方法还可包括:对文字信息中的文字进行归一化处理。例如,有的用户将符号关键词“()”读为“括弧”,将运算关键词“√”读为“根号”,这些读法其实是不是规范的,在将用户的语音输入信息转换为文字信息之后,可对这些文字信息中的不规范的文字进行归一化处理,如将“括弧”改为“括号”、“根号”改为“二次根号”。
本发明实施例的题目的搜索方法,可先接收用户的语音输入信息,之后可将用户的语音输入信息转换为文字信息,并提取文字信息中的主体关键词、运算关键词和符号关键词,以及根据主体关键词、运算关键词和符号关键词生成检索词,并根据检索词搜索到对应的题目,提升了用户的口语化输入题目导致的检索结果不准,提高了题目检索结果输出的概率,从而提升了用户体验。
为了实现上述实施例,本发明还提出了一种题目的搜索装置,包括:接收模块,用于接收用户的语音输入信息;转换模块,用于将用户的语音输入信息转换为文字信息;提取模块,用于提取文字信息中的主体关键词、运算关键词和符号关键词;生成模块,用于根据主体关键词、运算关键词和符号关键词生成检索词;以及搜索模块,用于根据检索词搜索到对应的题目。
图2是根据本发明一个实施例的题目的搜索装置的结构示意图。如图2所示,该题目的搜索装置可以包括:接收模块10、转换模块20、提取模块30、生成模块40和搜索模块50。
具体地,接收模块10可用于接收用户的语音输入信息。例如,假设本发明实施例的题目的搜索装置应用于具有搜索功能的应用程序,该应用程序提供语音人机交互接口,当用户不会某个数学题目时,想通过该应用程序提供的语音人机交互接口输入该题目的语音信息以获得相应的搜索结果,那么接收模块10可通过该语音人机交互接口接收用户使用语音人机交互接口输入的语音输入信息。
转换模块20可用于将用户的语音输入信息转换为文字信息。更具体地,转换模块20可通过语音识别系统对用户的语音输入信息进行识别,以将该语音输入信息转换为相应的文字信息。
提取模块30可用于提取文字信息中的主体关键词、运算关键词和符号关键词。其中,在本发明的实施例中,主体关键词可包括文字信息中的主体词等,例如常见的英文字母和数字,英文字母如“a”、“b”、“f”、“x”、“y”、“z”等,数字如“0”、“1”、…、“9”,又如“派”等;运算关键词可包括运算符号所对应的文字等,如“加”、“减”、“乘”、“除”、“平方”、“立方”、“二次根号”等、“西格玛”、“积分”;符号关键词可包括但不限于连接符号所对应的文字和/或连接词等,如,“括号”、“的”、“点”、“大于或等于”、“小于”、“约等于”、“负”等。
更具体地,在转换模块20将用户的语音输入信息转换为文字信息之后,提取模块30可提取文字信息中的各种关键词,如主体关键词、运算关键词和符号关键词等。举例而言,以数学表达式“(a+b)2”为例,用户可能的口语表述方式如下:“括号a加b括号的平方”、或“括号a加b的平方”、或“左括号a加b右括号的平方”等,提取模块30可对上述文字信息进行提取,提取出主体关键词“a”和“b”、运算关键词“加”和“平方”,文字“括号a加b括号的平方”中的符号关键词为“括号”、“括号”和“的”,文字“括号a加b的平方”中的符号关键词为“括号”和“的”,文字“左括号a加b右括号的平方”中的符号关键词为“左括号”、“右括号”和“的”。
需要说明的是,在本发明的实施例中,提取模块30在提取文字信息中的各种关键词的过程中,一般遵循最大匹配原则,比如“大括号a加b”,提取出符号关键词“大括号”而不是“括号”。
生成模块40可用于根据主体关键词、运算关键词和符号关键词生成检索词。搜索模块50可用于根据检索词搜索到对应的题目。
具体而言,在本发明的一个实施例中,如图3所示,该生成模块40可包括确定单元41和生成单元42。具体地,确定单元41可用于根据运算关键词和主题关键词确定符号关键词的适用范围。生成单元42可用于根据主体关键词、运算关键词、符号关键词和符号关键词的适用范围进行翻译以生成检索词。
可以理解,由于符号关键词可表示主体关键词中主体词之间的计算顺序,所以,在本发明的实施例中,可先根据运算关键词和主体关键词确定符号关键词的适用范围,以确定主体词之间的计算顺序、或者主体词之间的关联规则。举例而言,以数学表达式“(a+b)2”为例,文字信息“括号a加b括号的平方”中的符号关键词“括号”、“括号”和“的”,可以精确的确定主体词“a”和“b”之间的关联规则,即可确定其对应的数学表达式即为“(a+b)2”,而文字信息“括号a加b的平方”则是不确定的表述,该表述可能对应数学表达式“(a+b)2”,也可能对应数学表达式“(a)+b2”,因此,对于上述文字信息“括号a加b的平方”来说,确定单元41需要根据运算关键词“加”、“平方”和主体关键词“a”、“b”确定符号关键词“括号”、“的”的适用范围,因为主体关键词“a”本身可以不用括号,所以可以理解该符号关键词“括号”的适用范围是“a”、“加”、“b”这三个关键词。
在确定单元41确定符号关键词的适用范围之后,生成单元42可根据主体关键词、运算关键词、符号关键词和符号关键词的适用范围对上述文字信息进行翻译以生成相应的检索词。可以理解,文字信息中的每个关键均有各自的作用形式以及关键词之间的优先级关系。具体地,生成单元42可根据主体关键词、运算关键词、符号关键词和符号关键词的适用范围对上述文字信息进行拆解,拆解成多个文本,然后根据关键词之间的优先级关系对多个文本进行翻译以生成检索词。例如,以文字信息“左括号a加b右括号的平方”为例,生成单元42可根据主体关键词、运算关键词、符号关键词和符号关键词的适用范围对“左括号a加b右括号的平方”进行拆解,拆解成多个文本“左括号a加b右括号”、“的”、“平方”,文本“左括号a加b右括号”翻译成“(a+b)”,文本“的”、“平方”表示了“(a+b)”与“平方”之间的关系,根据该关系和翻译的文本“(a+b)”、“平方”生成相应的检索词。搜索模块50可根据该检索词进行检索,以搜索到对应的题目。
进一步的,为了提高检索结果的精确度,在本发明的一个实施例中,如图4所示,该题目的搜索装置还可包括纠错模块60,纠错模块60可用于在转换模块20将用户的语音输入信息转换为文字信息之后,提取文字信息中的上下文关系,并根据上下文关系对文字信息中的文字进行纠错。例如,以文字信息“括号a加b括号”为例,纠错模块60可先提取该文字信息中的上下文关系为a与b之间做加法,且由于括号具有左右之分,所以根据该上下文关系对“括号a加b括号”中的文字进行纠错,纠错成“左括号a加b右括号”。由此,通过对文字信息中的文字进行纠错,提高了文字信息中的各种关键词提取的准确度,并提高了检索词生成的准确度,从而提高了检索结果的精确度。
进一步的,为了使得文字规范化,方便数据的处理,在本发明的一个实施例中,如图5所示,该题目的搜索装置还可包括归一化处理模块70,归一化处理模块70可用于在转换模块20将用户的语音输入信息转换为文字信息之后,对文字信息中的文字进行归一化处理。例如,有的用户将符号关键词“()”读为“括弧”,将运算关键词“√”读为“根号”,这些读法其实是不是规范的,在将用户的语音输入信息转换为文字信息之后,可对这些文字信息中的不规范的文字进行归一化处理,如将“括弧”改为“括号”、“根号”改为“二次根号”。
本发明实施例的题目的搜索装置,可通过接收模块接收用户的语音输入信息,转换模块将用户的语音输入信息转换为文字信息,提取模块提取文字信息中的主体关键词、运算关键词和符号关键词,生成模块根据主体关键词、运算关键词和符号关键词生成检索词,搜索模块根据检索词搜索到对应的题目,提升了用户的口语化输入题目导致的检索结果不准,提高了题目检索结果输出的概率,从而提升了用户体验。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种题目的搜索方法,其特征在于,包括以下步骤:
接收用户的语音输入信息;
将所述用户的语音输入信息转换为文字信息;
提取所述文字信息中的主体关键词、运算关键词和符号关键词;以及
根据所述主体关键词、所述运算关键词和所述符号关键词生成检索词,并根据所述检索词搜索到对应的题目。
2.如权利要求1所述的题目的搜索方法,其特征在于,所述根据所述主体关键词、运算关键词和符号关键词生成检索词具体包括:
根据所述运算关键词和所述主体关键词确定所述符号关键词的适用范围;
根据所述主体关键词、所述运算关键词、所述符号关键词和所述符号关键词的适用范围进行翻译以生成所述检索词。
3.如权利要求1或2所述的题目的搜索方法,其特征在于,其中,所述主体关键词包括所述文字信息中的主体词,所述运算关键词包括运算符号所对应的文字,所述符号关键词包括连接符号所对应的文字和/或连接词。
4.如权利要求1所述的题目的搜索方法,其特征在于,在所述将所述用户的语音输入信息转换为文字信息之后,还包括:
提取所述文字信息中的上下文关系,并根据所述上下文关系对所述文字信息中的文字进行纠错。
5.如权利要求1所述的题目的搜索方法,其特征在于,在所述将所述用户的语音输入信息转换为文字信息之后,还包括:
对所述文字信息中的文字进行归一化处理。
6.一种题目的搜索装置,其特征在于,包括:
接收模块,用于接收用户的语音输入信息;
转换模块,用于将所述用户的语音输入信息转换为文字信息;
提取模块,用于提取所述文字信息中的主体关键词、运算关键词和符号关键词;
生成模块,用于根据所述主体关键词、所述运算关键词和所述符号关键词生成检索词;以及
搜索模块,用于根据所述检索词搜索到对应的题目。
7.如权利要求6所述的题目的搜索装置,其特征在于,所述生成模块包括:
确定单元,用于根据所述运算关键词和所述主题关键词确定所述符号关键词的适用范围;
生成单元,用于根据所述主体关键词、所述运算关键词、所述符号关键词和所述符号关键词的适用范围进行翻译以生成所述检索词。
8.如权利要求6或7所述的题目的搜索装置,其特征在于,其中,所述主体关键词包括所述文字信息中的主体词,所述运算关键词包括运算符号所对应的文字,所述符号关键词包括连接符号所对应的文字和/或连接词。
9.如权利要求6所述的题目的搜索装置,其特征在于,还包括:
纠错模块,用于在将所述用户的语音输入信息转换为文字信息之后,提取所述文字信息中的上下文关系,并根据所述上下文关系对所述文字信息中的文字进行纠错。
10.如权利要求6所述的题目的搜索装置,其特征在于,还包括:
归一化处理模块,用于在将所述用户的语音输入信息转换为文字信息之后,对所述文字信息中的文字进行归一化处理。
CN201510047996.6A 2015-01-29 2015-01-29 题目的搜索方法及装置 Active CN104573099B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510047996.6A CN104573099B (zh) 2015-01-29 2015-01-29 题目的搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510047996.6A CN104573099B (zh) 2015-01-29 2015-01-29 题目的搜索方法及装置

Publications (2)

Publication Number Publication Date
CN104573099A true CN104573099A (zh) 2015-04-29
CN104573099B CN104573099B (zh) 2018-05-22

Family

ID=53089161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510047996.6A Active CN104573099B (zh) 2015-01-29 2015-01-29 题目的搜索方法及装置

Country Status (1)

Country Link
CN (1) CN104573099B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202127A (zh) * 2015-05-08 2016-12-07 深圳市腾讯计算机系统有限公司 一种垂直搜索引擎对检索请求的处理方法及装置
CN106571144A (zh) * 2016-11-08 2017-04-19 广东小天才科技有限公司 一种基于语音识别的搜索方法及装置
CN106776724A (zh) * 2016-11-16 2017-05-31 福建天泉教育科技有限公司 一种题目分类方法及系统
CN106781781A (zh) * 2015-11-24 2017-05-31 上海谦问万答吧云计算科技有限公司 一种语言类习题的解题方法及装置
CN106844484A (zh) * 2016-12-23 2017-06-13 北京奇虎科技有限公司 信息搜索方法、装置及移动终端
CN107590204A (zh) * 2017-08-22 2018-01-16 广东小天才科技有限公司 一种学习内容的定位方法及电子设备
CN108255841A (zh) * 2016-12-28 2018-07-06 北京新唐思创教育科技有限公司 一种题目搜索的方法及其装置
CN108280184A (zh) * 2018-01-23 2018-07-13 广东小天才科技有限公司 一种基于智能笔的试题摘录方法、系统及智能笔
CN108536414A (zh) * 2017-03-06 2018-09-14 腾讯科技(深圳)有限公司 语音处理方法、装置和系统、移动终端
CN108766431A (zh) * 2018-06-06 2018-11-06 广东小天才科技有限公司 一种基于语音识别的自动唤醒方法及电子设备
CN109033151A (zh) * 2018-06-12 2018-12-18 广东小天才科技有限公司 一种基于语音交互的搜题方法及电子设备
CN112052040A (zh) * 2019-06-06 2020-12-08 中科寒武纪科技股份有限公司 处理方法、装置、计算机设备和存储介质
CN113473161A (zh) * 2020-03-31 2021-10-01 腾讯科技(成都)有限公司 直播方法、装置、设备及计算机存储介质
CN114330243A (zh) * 2021-12-31 2022-04-12 北京执象科技发展有限公司 口算结果识别方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1641625A (zh) * 2004-01-14 2005-07-20 英业达股份有限公司 数学电子试卷生成方法以及系统
CN101206859A (zh) * 2007-11-30 2008-06-25 清华大学 语音点歌方法
CN101261554A (zh) * 2008-04-21 2008-09-10 东莞市步步高教育电子产品有限公司 公式、表达式的手写输入及计算系统和方法
US7885477B2 (en) * 2006-02-24 2011-02-08 Fujifilm Corporation Image processing method, apparatus, and computer readable recording medium including program therefor
US20130103718A1 (en) * 2011-10-21 2013-04-25 International Business Machines Corporation Memory pattern searching via displaced-read memory addressing

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1641625A (zh) * 2004-01-14 2005-07-20 英业达股份有限公司 数学电子试卷生成方法以及系统
US7885477B2 (en) * 2006-02-24 2011-02-08 Fujifilm Corporation Image processing method, apparatus, and computer readable recording medium including program therefor
CN101206859A (zh) * 2007-11-30 2008-06-25 清华大学 语音点歌方法
CN101261554A (zh) * 2008-04-21 2008-09-10 东莞市步步高教育电子产品有限公司 公式、表达式的手写输入及计算系统和方法
US20130103718A1 (en) * 2011-10-21 2013-04-25 International Business Machines Corporation Memory pattern searching via displaced-read memory addressing

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202127A (zh) * 2015-05-08 2016-12-07 深圳市腾讯计算机系统有限公司 一种垂直搜索引擎对检索请求的处理方法及装置
CN106202127B (zh) * 2015-05-08 2020-02-11 深圳市腾讯计算机系统有限公司 一种垂直搜索引擎对检索请求的处理方法及装置
CN106781781A (zh) * 2015-11-24 2017-05-31 上海谦问万答吧云计算科技有限公司 一种语言类习题的解题方法及装置
CN106571144A (zh) * 2016-11-08 2017-04-19 广东小天才科技有限公司 一种基于语音识别的搜索方法及装置
CN106776724A (zh) * 2016-11-16 2017-05-31 福建天泉教育科技有限公司 一种题目分类方法及系统
CN106844484A (zh) * 2016-12-23 2017-06-13 北京奇虎科技有限公司 信息搜索方法、装置及移动终端
CN108255841A (zh) * 2016-12-28 2018-07-06 北京新唐思创教育科技有限公司 一种题目搜索的方法及其装置
CN108536414A (zh) * 2017-03-06 2018-09-14 腾讯科技(深圳)有限公司 语音处理方法、装置和系统、移动终端
CN107590204A (zh) * 2017-08-22 2018-01-16 广东小天才科技有限公司 一种学习内容的定位方法及电子设备
CN107590204B (zh) * 2017-08-22 2020-10-16 广东小天才科技有限公司 一种学习内容的定位方法及电子设备
CN108280184A (zh) * 2018-01-23 2018-07-13 广东小天才科技有限公司 一种基于智能笔的试题摘录方法、系统及智能笔
CN108766431A (zh) * 2018-06-06 2018-11-06 广东小天才科技有限公司 一种基于语音识别的自动唤醒方法及电子设备
CN109033151A (zh) * 2018-06-12 2018-12-18 广东小天才科技有限公司 一种基于语音交互的搜题方法及电子设备
CN112052040A (zh) * 2019-06-06 2020-12-08 中科寒武纪科技股份有限公司 处理方法、装置、计算机设备和存储介质
CN113473161A (zh) * 2020-03-31 2021-10-01 腾讯科技(成都)有限公司 直播方法、装置、设备及计算机存储介质
CN113473161B (zh) * 2020-03-31 2024-05-24 腾讯科技(成都)有限公司 直播方法、装置、设备及计算机存储介质
CN114330243A (zh) * 2021-12-31 2022-04-12 北京执象科技发展有限公司 口算结果识别方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN104573099B (zh) 2018-05-22

Similar Documents

Publication Publication Date Title
CN104573099A (zh) 题目的搜索方法及装置
US20190163691A1 (en) Intent Based Dynamic Generation of Personalized Content from Dynamic Sources
JP2019125343A (ja) 曖昧なエンティティワードに基づくテキスト処理方法及び装置
WO2019224629A1 (en) Training data expansion for natural language classification
CN111708869B (zh) 人机对话的处理方法及装置
US20200265074A1 (en) Searching multilingual documents based on document structure extraction
US9984689B1 (en) Apparatus and method for correcting pronunciation by contextual recognition
CN106570180A (zh) 基于人工智能的语音搜索方法及装置
CN109616096A (zh) 多语种语音解码图的构建方法、装置、服务器和介质
US11636272B2 (en) Hybrid natural language understanding
US20080109210A1 (en) Removing Bias From Features Containing Overlapping Embedded Grammars in a Natural Language Understanding System
US9953027B2 (en) System and method for automatic, unsupervised paraphrase generation using a novel framework that learns syntactic construct while retaining semantic meaning
CN114757176A (zh) 一种获取目标意图识别模型的方法以及意图识别方法
CN112633947A (zh) 文本生成模型生成方法、文本生成方法、装置及设备
US11907665B2 (en) Method and system for processing user inputs using natural language processing
CN112347241A (zh) 一种摘要提取方法、装置、设备及存储介质
CN107943940A (zh) 数据处理方法、介质、系统和电子设备
EP4364044A1 (en) Automated troubleshooter
US11270085B2 (en) Generating method, generating device, and recording medium
CN112765977B (zh) 一种基于跨语言数据增强的分词方法及装置
KR101709693B1 (ko) 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법
CN113095082A (zh) 一种基于多任务模型进行文本处理的方法、装置、计算机装置及计算机可读取存储介质
CN116186219A (zh) 一种人机对话交互方法方法、系统及存储介质
CN112925889B (zh) 自然语言处理方法、装置、电子设备和存储介质
WO2023098971A1 (en) Method and apparatus for self-supervised extractive question answering

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160203

Address after: 100085, Beijing, Haidian District on the road to entrepreneurship No. 1, 28, 4, room 417

Applicant after: ZUOYEBANG EDUCATION TECHNOLOGY (BEIJING) CO.,LTD.

Address before: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer three

Applicant before: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230613

Address after: 6001, 6th Floor, No.1 Kaifeng Road, Shangdi Information Industry Base, Haidian District, Beijing, 100085

Patentee after: Beijing Baige Feichi Technology Co.,Ltd.

Address before: 100085 room 417, 4th floor, building 1, 28 Shangdi Chuangye Middle Road, Haidian District, Beijing

Patentee before: ZUOYEBANG EDUCATION TECHNOLOGY (BEIJING) CO.,LTD.

TR01 Transfer of patent right