CN113326279A - 语音搜索方法和装置、电子设备、计算机可读介质 - Google Patents

语音搜索方法和装置、电子设备、计算机可读介质 Download PDF

Info

Publication number
CN113326279A
CN113326279A CN202110586407.7A CN202110586407A CN113326279A CN 113326279 A CN113326279 A CN 113326279A CN 202110586407 A CN202110586407 A CN 202110586407A CN 113326279 A CN113326279 A CN 113326279A
Authority
CN
China
Prior art keywords
data
search
data set
matched
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110586407.7A
Other languages
English (en)
Inventor
刘嵘
李坚涛
贺学焱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apollo Intelligent Connectivity Beijing Technology Co Ltd
Original Assignee
Apollo Intelligent Connectivity Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apollo Intelligent Connectivity Beijing Technology Co Ltd filed Critical Apollo Intelligent Connectivity Beijing Technology Co Ltd
Priority to CN202110586407.7A priority Critical patent/CN113326279A/zh
Publication of CN113326279A publication Critical patent/CN113326279A/zh
Priority to JP2022056210A priority patent/JP7403571B2/ja
Priority to KR1020220046654A priority patent/KR20220054753A/ko
Priority to US17/744,120 priority patent/US20220269722A1/en
Priority to EP22173454.4A priority patent/EP4020951A3/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/187Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Library & Information Science (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本公开提供了一种语音搜索方法和装置,涉及车联网、智能座舱、语音识别等技术领域。具体实现方案为:获取语音数据;对语音数据进行识别,得到对应的文本数据;基于文本数据和预设的待匹配数据集,得到混合匹配数据集;基于待匹配数据集,对混合匹配数据集进行筛选,得到与语音数据对应的搜索结果集。该实施方式提高了语音搜索的全面性。

Description

语音搜索方法和装置、电子设备、计算机可读介质
技术领域
本公开涉及数据处理技术领域,具体涉及车联网、智能座舱、语音识别等技术领域,尤其涉及一种语音搜索方法和装置、电子设备、计算机可读介质以及计算机程序产品。
背景技术
在终端通话场景下,如果用户发音具有缺陷(如l/r部分、前后鼻音不分等),在对语音进行联系人搜索,得到联系人搜索结果之后,如果仅按照姓名的拼音的先后顺序进行排序,容易出现搜索结果排序结果混乱的问题。
发明内容
提供了一种语音搜索方法和装置、电子设备、计算机可读介质以及计算机程序产品。
根据第一方面,提供了一种语音搜索方法,该方法包括:获取语音数据;对语音数据进行识别,得到对应的文本数据;基于文本数据和预设的待匹配数据集,得到混合匹配数据集;基于待匹配数据集,对混合匹配数据集进行筛选,得到与语音数据对应的搜索结果集。
根据第二方面,提供了一种语音搜索装置,该装置包括:采集单元,被配置成获取语音数据;识别单元,被配置成对语音数据进行识别,得到对应的文本数据;匹配单元,被配置成基于文本数据和预设的待匹配数据集,得到混合匹配数据集;处理单元,被配置成基于待匹配数据集,对混合匹配数据集进行筛选,得到与语音数据对应的搜索结果集。
根据第三方面,提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面任一实现方式描述的方法。
根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面任一实现方式描述的方法。
根据第五方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如第一方面任一实现方式描述的方法。
本公开的实施例提供的语音搜索方法和装置,首先,获取语音数据;其次,对语音数据进行识别,得到对应的文本数据;再次,基于文本数据和预设的待匹配数据集,得到混合匹配数据集;最后,基于待匹配数据集,对混合匹配数据集进行筛选,得到与语音数据对应的搜索结果集。由此,基于文本数据和预设的待匹配数据集,得到的混合匹配数据集,较全面的扩充了与文本数据的相匹配的混合匹配数据,进一步将混合匹配数据进行了与待匹配数据集相适配的更加合理的筛选,使语音数据搜索结果更加准确,提高了用户进行语音搜索的体验。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开语音搜索方法的一个实施例的流程图;
图2是根据本公开得到混合匹配数据集的方法的流程图;
图3是根据本公开得到与语音数据对应的搜索结果集的方法的流程图;
图4是根据本公开得到搜索数据集的方法的流程图;
图5是根据本公开语音搜索装置的实施例的结构示意图;
图6是用来实现本公开实施例的语音搜索方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1示出了根据本公开语音搜索方法的一个实施例的流程100,上述语音搜索方法包括以下步骤:
步骤101,获取语音数据。
本实施例中,语音搜索方法运行于其上的执行主体可以实时获取语音数据,该语音数据可以是用户通过用户终端发出的,或者是用户通过语音口令搜索信息得到,语音数据包括搜索关键词,通过语音数据,可以搜索到与搜索关键词相关的搜索结果集,搜索结果集包至少一个搜索结果,每个搜索结果均是一种与语音数据相关搜索数据。例如当用户对终端上的联系人进行搜索时,语音数据中的搜索关键词可以包括至少一个联系人的信息,该信息包括姓名、电话等。
本实施例中,语音搜索方法运行于其上的执行主体可以预先从用户终端获取用户的联系人读取权限,从终端的通讯录中读取联系人信息,并将联系人信息存储在预先设置的数据库中,进一步地,为了丰富联系人信息,还可以预先创建通讯录联系人拼音库,所有与联系人信息中的联系人相关的拼音均存储在拼音库中。
步骤102,对语音数据进行识别,得到对应的文本数据。
本实施例中,语音搜索方法运行于其上的执行主体在对语音数据进行语音识别之后,将语音数据转换成文本数据形成,从而得到与语音数据相对应的文本数据。
步骤103,基于文本数据和预设的待匹配数据集,得到混合匹配数据集。
本实施例中,待匹配数据集为预先设置的已确定的数据,执行主体通过将待匹配数据集中数据与文本数据进行匹配,确定用户搜索意图。
本实施例中,混合匹配数据集包括至少一种混合匹配数据,该混合匹配数据是与待测文本或者中间数据(由待测文本通过数据转换得到不同形式的数据)相匹配的数据。例如,混合匹配数据包括:拼音、文本、字符、符号等,各个混合匹配数据均与待测文本相匹配,例如,上述拼音为与文本数据的发音相同的拼音,通过拼音工具库可以完成文本数据到拼音数据的转换。
根据语音搜索方法运行的场景不同,待匹配数据集的内容不同,例如,对于用户搜索终端中联系人信息的场景,待匹配数据集为上述预先存储在数据库中的所有的联系人信息。
当在得到文本形式的文本数据之后,可以将该待匹配数据集的待匹配数据与文本数据进行匹配,如果待匹配数据集中的待匹配数据与文本数据相同或相似度大于相似度阈值(例如90%),确定待匹配数据集中与文本数据相匹配,文本数据或待匹配数据集中的多个数据聚合在一起作为混合匹配数据集。
可选地,上述基于文本数据和预设的待匹配数据集,得到混合匹配数据集包括:对文本数据进行数据增强,得到与文本数据对应的至少一个增强文本数据;将至少一个增强文本数据中每个增强文本数据与待匹配数据集中各个待匹配数据进行匹配,并将匹配成功的增强文本数据添加到混合匹配数据集。本可选方式中,对文本数据进行数据增强可以是获取与文本数据具有相同发音的文本数据,并将获取的文本数据增加到文本数据中,从而增加了文本数据量。
步骤104,基于待匹配数据集,对混合匹配数据集进行筛选,得到与语音数据对应的搜索结果集。
本实施例中,搜索结果集可以包括至少一个搜索结果,每个搜索结果均与语音数据相对应,每个搜索结果可以是将待匹配数据集与混合匹配数据进行匹配后,筛选出的与语音数据对应的搜索结果。当将搜索结果集展示给用户时,用户可以根据展示的搜索结果进行不同的操作,例如,当语音数据包括搜索联系人,则搜索结果包括:至少一个与用户语音对应的联系人信息,该联系人信息包括联系人文本、联系人拼音等,用户在得到联系人信息之后,可以向该联系人发送信息。
可选地,在得到搜索结果集之后,还可以对搜索结果集中各个搜索结果排序,待匹配数据集中各个待匹配数据具有各自的序列号,而混合匹配数据集中各个混合匹配数据可以是与待匹配数据集中的各个待匹配数据相对应,首先从混合匹配数据集筛选出与各个匹配数据相对应的数据,然后基于各个待匹配数据的序列号,对混合匹配数据集中各个混合匹配数据进行排序,可以快速地确定与语音数据对应的搜索结果。
本公开的实施例提供的语音搜索方法,首先,获取语音数据;其次,对语音数据进行识别,得到对应的文本数据;再次,基于文本数据和预设的待匹配数据集,得到混合匹配数据集;最后,基于待匹配数据集,对混合匹配数据集进行筛选,得到与语音数据对应的搜索结果集。由此,基于文本数据和预设的待匹配数据集,得到的混合匹配数据集,较全面的扩充了与文本数据的相匹配的混合匹配数据,进一步将混合匹配数据进行了与待匹配数据集相适配的更加合理的筛选,使得到的语音数据搜索结果更加准确,提高了用户进行语音搜索的体验。
图2示出了根据本公开得到混合匹配数据集的方法的流程图200,上述得到混合匹配数据集的方法包括以下步骤:
步骤201,对文本数据进行数据搜索,得到搜索数据集。
本实施例中,对文本数据进行数据搜索是对待测文本进行数据扩充的过程,例如,搜索得到文本数据的搜索拼音数据,将搜索到的搜索拼音数据进行文本数据转化,得到与待测文本具有相同发音的同音不同字的搜索文本数据。本实施例中,将拼音数据转化为文本数据可以采用文本转化工具进行转化,而文本转化工具是一种常用的工具,此处不再赘述。
本实施例中,搜索数据集包括至少一个搜索数据,各个搜索数据均是与文本数据相关的数据,搜索数据的表现形式可以是多样的,例如搜索数据为搜索拼音数据或者搜索文本数据等。
在本实施例的一些可选实现方式中,上述对文本数据进行数据搜索,得到搜索数据集包括:获取文本数据的待测拼音数据;搜索与待测拼音数据相同发音的文本数据,得到搜索文本数据;组合文本数据与搜索文本数据,得到搜索数据集。
本可选实现方式中,每个中文文本均具有其对应拼音,将文本数据转换为拼音数据,再搜索与拼音数据具有相同发音的文本数据,可以得到多个与文本数据完全不同的搜索文本数据,而多个搜索文本数据组合在一起得到搜索数据集。
本可选实现方式中,通过搜索与文本数据具有相同发音的搜索文本数据,添加入搜索数据集,从而丰富了搜索数据集,为有效匹配文本数据提供了可靠依据。
步骤202,将搜索数据集与预设的待匹配数据集进行匹配,得到混合匹配数据集。
本可选实现方式中,可以将搜索数据集中各个搜索数据与待匹配数据集中的各个待匹配数据进行比较,如果两者完全相同,将当前完全相同的搜索数据添加至混合匹配数据集中,作为混合匹配数据集中的一个混合匹配数据。
可选地,可以将搜索数据集中各个搜索数据与待匹配数据中的各个待匹配数据进行相似度计算,当两者相似度大于相似度阈值时,将相似度大于相似度阈值的搜索数据添加至混合匹配数据集中,作为混合匹配数据集中的一个混合匹配数据。
本可选实现方式提供的得到混合匹配数据集的方法,对文本数据进行搜索,得到搜索数据集,扩充了文本数据的数据量,可以预先对用户语音中发音有缺陷的文本数据进行数据补偿,为了得到用户语音的全面的搜索结果提供了可靠的基础。
图3示出了根据本公开得到与语音数据对应的搜索结果集的方法的流程图300,上述得到与语音数据对应的搜索结果集的方法包括以下步骤:
步骤301,筛选混合匹配数据集中与搜索数据集中不同优先级的搜索数据相匹配的混合匹配数据,得到不同优先级的中间数据集。
本可选实现方式中,当搜索数据集中具有不同种类的搜索数据时,为了向用户呈现较好的搜索结果集,可以预先为搜索数据集中不同种类的搜索数据划分不同优先级,每种搜索数据对应一种优先等级,比如,搜索数据集包括搜索拼音数据和搜索文本数据,将搜索文本数据的优先级设置为一级,将搜索拼音数据的优先级设置为二级,搜索拼音数据的优先级低于搜索文本数据。
进一步地,搜索数据集中不同种类的搜索数据在与混合匹配数据集中的混合匹配数据相匹配时,根据搜索数据的种类,将匹配得到的混合匹配数据按照搜索数据对应的优先级划分混合匹配数据,得到不同优先级的中间数据集,每种中间数据集与一种搜索数据相对应,例如,与搜索文本数据相对应的中间数据集的优先等级为一级,与搜索拼音数据相对应的中间数据集的优先级为二级。
在本实施例的一些可选实现方式中,上述搜索数据集包括:文本数据以及优先级低于文本数据的搜索文本数据,上述筛选混合匹配数据集中与搜索数据集中不同优先级的搜索数据相匹配的混合匹配数据,得到不同优先级的中间数据集包括:将文本数据与混合匹配数据集进行匹配,得到与文本数据相匹配的待测中间数据集;去除混合匹配数据集中的待测中间数据集,得到与搜索文本数据相匹配的搜索中间数据集,搜索中间数据集的优先级低于待测中间数据集。
本可选实现方式中,在搜索数据集包括文本数据和搜索文本数据两种不同优先级数据时,根据文本数据和搜索文本数据筛选混合匹配数据集中的混合匹配数据,保证了两种不同优先级的中间数据集的全面性,为用户展示了两种不同优先级的中间数据集,提高了用户体验。
在本实施例的一些可选实现方式中,上述搜索数据集包括:优先级等级依次下降的文本数据、搜索文本数据、纠正文本数据,筛选混合匹配数据集中与搜索数据集中不同优先级的搜索数据相匹配的混合匹配数据,得到不同优先级的中间数据集包括:将文本数据与混合匹配数据集进行匹配,得到与文本数据相匹配的待测中间数据集;去除混合匹配数据集中的待测中间数据,得到阶段子集;将搜索文本数据与阶段子集进行匹配,得到与搜索文本数据相匹配的搜索中间数据集;去除阶段子集中的搜索中间数据集,得到与纠正文本数据相匹配的纠正中间数据集,待测中间数据集、搜索中间数据集、纠正中间数据集的优先级顺序依次降低。
本可选实现方式中,在搜索数据集包括文本数据、搜索文本数据、纠正文本数据三种不同优先级数据时,根据文本数据、搜索文本数据、纠正文本数据筛选混合匹配数据集中的混合匹配数据,保证了三种不同优先级的中间数据集的全面性,为用户展示了多种优先级的中间数据集,提高了用户体验。
步骤302,按待匹配数据集中待匹配数据的顺序,对各个中间数据集进行排序和组合,得到与语音数据对应的搜索结果集。
本实施例中,可以基于待匹配数据集中待匹配数据或者各个中间数据集的优先级顺序排序所有的中间数据集,排序后的所有中间数据集组合在一起,得到可以向用户展示的搜索结果集。
可选地,中间数据集中具有与待匹配数据相同或对应的数据(比如,与待匹配数据发音相同),因此对各个中间数据集进行排序可以是对每个中间数据集中的数据进行排序。
在本实施例的一些可选实现方式中,上述按待匹配数据集中待匹配数据的顺序,对各个中间数据集进行排序和组合,得到与语音数据对应的搜索结果集,包括:将各个中间数据集中各个中间数据按照拼音字母顺序进行排序,得到不同排序数据集;针对每个排序数据集,响应于确定该排序数据集中具有相同拼音的多个排序数据,将多个排序数据按照待匹配数据集中与各个排序数据对应的数据的顺序进行排序;按各个中间数据集的优先级等级,排序并组合所有的排序数据集,得到与语音数据对应的搜索结果集。
本可选实现方式中,首先将各个中间数据集中的各个中间数据按照拼音字母顺序进行排序,然后将排序后的排序数据按照待匹配数据集中与各个排序数据对应的数据的顺序进行排序,为用户呈现了一种拼音和文本均合理的搜索结果,便于用户做出准确的选择。
本实施例按照三个不同优先等级对联系人排序方法进行了优化,具体排序是:1)中文完全匹配程度;2)拼音完全匹配程度;3)纠错程度;其中以中文匹配程度为最高优先级,如搜索关键字中有中文(不含数字)完全匹配的结果则最优先显示,其次是拼音(不含数字)完全匹配程度,如果拼音与中文均不完全,再根据搜索拼音与结果拼音的相似程度进行排序。
本可选实现方式提供的得到与语音数据对应的搜索结果的方法,筛选混合匹配数据集中与搜索数据集中搜索数据相匹配的混合匹配数据,便于将混合匹配数据集与待匹配数据集具有不同匹配效果的数据进行分层显示,进一步,按待匹配数据集中待匹配数据的顺序,对中间数据集进行排序,保证了对匹配到的搜索结果的有效地排序,提高了用户进行语音搜索的体验。
图4示出了根据本公开得到搜索数据集的方法的一个实施例的流程400,上述得到搜索数据集的方法包括以下步骤:
步骤401,获取文本数据的待测拼音数据。
本可选实现方式中,将文本数据转化成拼音数据,得到待测拼音数据,而将文本数据转化为拼音数据可以采用传统的拼音转换工具,对于拼音转换工具本实施例中不再赘述。
步骤402,确定与待测拼音数据相同发音的文本数据,得到搜索文本数据。
本可选实现方式中,待测拼音数据为文本数据的拼音形式,通过待测拼音数据可以确定所有与文本数据具有相同的发音的文本数据,而与文本数据具有相同发音的文本数据为搜索文本数据。
步骤403,对待测拼音数据进行数据纠正,得到纠正拼音数据。
本可选实现方式中,对待测拼音数据进行数据纠正包括:将待测拼音数据中的声母采用另一个声母代替,如将待测拼音数据中的“l”替换为“r”,或者将待测拼音数据中的“r”替换为“l”。对待测拼音数据进行数据纠正还可以包括:将待测拼音数据中的韵母采用另一个韵母代替,如,将待测拼音数据中的“ing”替换为“in”。
步骤404,搜索与纠正拼音数据相同发音的文本数据,得到纠正文本数据。
本可选实现方式中,在得到纠正拼音数据之后,确定与纠正拼音数据具有相同发音的文本数据,得到的文本数据即为纠正文本数据。
本可选实现方式中,纠正文本数据是与搜索文本数据完全不同的文本数据,例如,一搜索文本数据为“张三”,其发音为zhangsan;其对应的纠正文本可以为“藏三”,其发音为zangsan。
步骤405,组合搜索文本数据、纠正文本数据、文本数据得到搜索数据集。
本实施例中,组合搜索文本数据、纠正文本数据、文本数据是指将三者融合在一起放入搜索数据集中,搜索数据集包括至少一个搜索数据,每个搜索数据可以是搜索文本数据,或者纠正文本数据,或者文本数据。
本可选实现方式中,首先基于文本数据的待测拼音数据,得到搜索文本,保证了与文本数据同音不同字的搜索数据;进一步,对待测拼音数据进行数据纠正,得到纠正拼音数据,由纠正拼音数据得到纠正文本数据,从而保证对发音有缺陷的人员的文本数据进行了有效补充,保证了搜索数据集的全面性和可靠性。
作为一个实例,对于用户搜索联系人信息的场景,待匹配数据集为预存联系人信息的数据集,本公开的语音搜索方法包括以下步骤:
第一,在从用户终端获得用户的联系人读取权限后,从终端的通讯录中读取联系人信息。
第二,通过语音数据,确定用户输入的目标联系人P1,对语音数据进行识别转换为文本数据,并根据文本数据和待匹配数据集,获得混合匹配数据集,本实施例中,获得混合匹配数据集为:将文本数据(如张三)通过拼音工具库识别为待测拼音数据(zhangsan),确定与待测拼音数据发音完全相同搜索文本数据,然后根据预设的纠正拼音表(如表1所示)可以对待测拼音数据进行纠正,得到纠正拼音数据,如zhanshan zhansan、zhangshan、zhangshang等;将纠正拼音数据转换为纠正文本数据,组合文本数据、纠正文本数据得到混合匹配数据集。
表1
拼音 纠正后的拼音 示例
l r lejin-rejin
r l huarongdao-hualongdao
ch c liuche-liuce
c ch caocao-chaochao
sh s xiahoushang-xiahousang
s sh simayi-shimayi
z zh xiayize-xiayizhe
zh z zhangsan-zangsan
h f hushi-fushi
f h dufu-duhu
in ing xinqiji-xingqiji
ing in yingzheng-yinzheng
第三,过滤混合匹配数据集中的数字,并从过滤数字后的混合匹配数据集M中,筛选出与目标联系人P1的中文完全匹配的待测中间数据集R1。
第四,去除混合匹配数据集M中的待测中间数据P1,得到阶段子集J1。
第五,在阶段子集J1中,筛选出与目标联系人P1发音完全匹配的数据集,即与搜索文本数据完全匹配的数据集,该数据集中可能会出现多音字的情况,同时拼音对应的中文也可能不同,因此需要在该数据集中进行再次排序,规则如下:
(1)在该数据集中,按照中文拼音进行第一轮排序,例如,“打电话给张乐”,可得到zhangle\zhangyue两个结果,那么第一轮是按照拼音字母顺序对拼音进行排序得到文本数据集。
(2)在第一轮排序的结果内,同拼音的结果组(如张三、张散、张伞),按照待匹配数据集中各个待匹配数据的顺序进行第二轮排序,得到最终的搜索中间数据集R2,例如,对于zhangle\zhangyue,如果通讯录有名叫章乐、张乐、张悦的联系人,那么搜索中间数据集R2可以是:张乐、章乐、张悦。
第六,去除阶段子集J1中的搜索中间数据集R2,得到与纠正文本数据完全匹配的数据集,将与纠正文本数据完全匹配的数据集按照与搜索中间数据集R2如上相同的方式的进行再排序,得到纠正中间数据集R3,以上面语音数据为zhangsan,如果通讯录有名为张珊的联系人,那么张珊会出现在纠正中间数据集R3中,因为她的拼音不是语音输入的正确拼音(正确为zhangsan)。
第七,按照待测中间数据集R1、搜索中间数据集R2、纠正中间数据集R3的顺序进行排序,并将排序后的待测中间数据集R1、搜索中间数据集R2、纠正中间数据集R3展示给用户。
本实施例按照三个不同优先等级对联系人排序方法进行了优化,具体排序是:1)中文完全匹配程度;2)拼音完全匹配程度;3)纠错程度;其中以中文匹配程度为最高优先级,如搜索关键字中有中文(不含数字)完全匹配的结果则最优先显示,其次是拼音(不含数字)完全匹配程度,如果拼音与中文均不完全,再根据搜索拼音与结果拼音的相似程度进行排序。
进一步参考图5,作为对上述各图所示方法的实现,本公开提供了语音搜索装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可应用于各种电子设备中。
如图5所示,本实施例提供的语音搜索装置500包括:采集单元501,识别单元502,匹配单元503,处理单元504。其中,上述采集单元501,可以被配置成获取语音数据。上述识别单元502,可以被配置成对语音数据进行识别,得到对应的文本数据。上述匹配单元503,可以被配置成基于文本数据和预设的待匹配数据集,得到混合匹配数据集。上述处理单元504,可以被配置成基于待匹配数据集,对混合匹配数据集进行筛选,得到与语音数据对应的搜索结果集。
在本实施例中,语音搜索装置500中:采集单元501,识别单元502,匹配单元503,处理单元504的具体处理及其所带来的技术效果可分别参考图1对应实施例中的步骤101、步骤102、步骤103、步骤104的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,上述匹配单元503包括:搜索模块(图中未示出),匹配模块(图中未示出)。其中,上述搜索模块,可以被配置成对文本数据进行数据搜索,得到搜索数据集。上述匹配模块,可以被配置成将搜索数据集与预设的待匹配数据集进行匹配,得到混合匹配数据集。
在本实施例的一些可选的实现方式中,上述搜索模块包括:第一获取子模块(图中未示出),第一搜索子模块(图中未示出),第一组合子模块(图中未示出)。其中,上述第一获取子模块,可以获取文本数据的待测拼音数据。上述第一搜索子模块,可以被配置成搜索与待测拼音数据相同发音的文本数据,得到搜索文本数据。上述第一组合子模块,可以被配置成组合文本数据与搜索文本数据,得到搜索数据集。
在本实施例的一些可选实现方式中,上述搜索模块包括:第二获取子模块(图中未示出),确定子模块(图中未示出),纠正子模块(图中未示出),第二搜索子模块(图中未示出),第二组合子模块(图中未示出)。其中,上述第二获取子模块,可以被配置成获取文本数据的待测拼音数据。上述确定子模块,可以被配置成确定与待测拼音数据相同发音的搜索文本数据,得到搜索文本数据。上述纠正子模块,可以被配置成对待测拼音数据进行数据纠正,得到纠正拼音数据。上述第二搜索子模块,可以被配置成搜索与纠正拼音数据相同发音的文本数据,得到纠正文本数据。上述第二组合子模块,可以被配置成组合文本数据、纠正文本数据与搜索文本数据,得到搜索数据集。
在本实施例的一些可选实现方式中,上述处理单元504包括:筛选模块(图中未示出),排序模块(图中未示出)。其中,上述筛选模块,可以被配置成筛选混合匹配数据集中与搜索数据集中不同优先级的搜索数据相匹配的混合匹配数据,得到不同优先级的中间数据集。上述排序模块,可以被配置成按待匹配数据集中待匹配数据的顺序,对各个中间数据集进行排序和组合,得到与语音数据对应的搜索结果集。
在本实施例的一些可选实现方式中,上述排序模块包括:第一排序子模块(图中未示出),第二排序子模块(图中未示出),得到子模块(图中未示出)。其中,上述第一排序子模块,可以被配置成将各个中间数据集中各个中间数据按照拼音字母顺序进行排序,得到不同排序数据集。上述第二排序子模块,可以被配置成针对每个排序数据集,响应于确定该排序数据集中具有相同拼音的多个排序数据,将多个排序数据按照待匹配数据集中与各个排序数据对应的数据的顺序进行排序。上述得到子模块,被配置成按各个中间数据集的优先级等级,排序并组合所有的排序数据集,得到与语音数据对应的搜索结果集。
在本实施例的一些可选实现方式中,上述文本数据以及优先级低于文本数据的搜索文本数据,上述筛选模块包括:第一待测子模块(图中未示出),第一去除子模块(图中未示出)。其中,上述第一待测子模块,可以被配置成将文本数据与混合匹配数据集进行匹配,得到与文本数据相匹配的待测中间数据集。上述第一去除子模块,可以被配置成去除混合匹配数据集中的待测中间数据集,得到与搜索文本数据相匹配的搜索中间数据集,搜索中间数据集的优先级低于待测中间数据集。
在本实施例的一些可选实现方式中,上述搜索数据集包括:优先级等级依次下降的文本数据、纠正文本数据与搜索文本数据。上述筛选模块包括:第二待测子模块(图中未示出),第二去除子模块(图中未示出),第一匹配子模块(图中未示出),第三去除子模块(图中未示出)。其中,上述第二待测子模块,可以被配置成将文本数据与混合匹配数据集进行匹配,得到与文本数据相匹配的待测中间数据集。上述第二去除子模块,可以被配置成去除混合匹配数据集中的待测中间数据,得到阶段子集。上述第一匹配子模块,可以被配置成将搜索文本数据与阶段子集进行匹配,得到与搜索文本数据相匹配的搜索中间数据集。上述第三去除子模块,可以被配置成去除阶段子集中的搜索中间数据集,得到与纠正文本数据相匹配的纠正中间数据集,待测中间数据集、搜索中间数据集、纠正中间数据集的优先级顺序依次降低。
本公开的实施例提供的语音搜索装置,首先,获取单元501获取语音数据;其次,识别单元502对语音数据进行识别,得到对应的文本数据;再次,匹配单元503基于文本数据和预设的待匹配数据集,得到混合匹配数据集;最后,处理单元504基于待匹配数据集,对混合匹配数据集进行筛选,得到与语音数据对应的搜索结果集。由此,基于文本数据和预设的待匹配数据集,得到的混合匹配数据集,较全面的扩充了与文本数据的相匹配的混合匹配数据,进一步将混合匹配数据进行了与待匹配数据集相适配的更加合理的筛选,使得到的语音数据搜索结果更加准确,提高了用户进行语音搜索的体验。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如语音搜索方法。例如,在一些实施例中,语音搜索方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的语音搜索方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行语音搜索方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程语音搜索装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (13)

1.一种语音搜索方法,所述方法包括:
获取语音数据;
对所述语音数据进行识别,得到对应的文本数据;
基于所述文本数据和预设的待匹配数据集,得到混合匹配数据集;
基于所述待匹配数据集,对所述混合匹配数据集进行筛选,得到与所述语音数据对应的搜索结果集。
2.根据权利要求1所述的方法,其中,所述基于所述文本数据和预设的待匹配数据集,得到混合匹配数据集,包括:
对所述文本数据进行数据搜索,得到搜索数据集;
将所述搜索数据集与预设的待匹配数据集进行匹配,得到混合匹配数据集。
3.根据权利要求2所述的方法,其中,所述对所述文本数据进行数据搜索,得到搜索数据集,包括:
获取所述文本数据的待测拼音数据;
搜索与所述待测拼音数据相同发音的文本数据,得到搜索文本数据;
组合所述文本数据与所述搜索文本数据,得到搜索数据集。
4.根据权利要求2所述的方法,其中,所述对所述文本数据进行数据搜索,得到搜索数据集,包括:
获取所述文本数据的待测拼音数据;
确定与所述待测拼音数据相同发音的搜索文本数据,得到搜索文本数据;
对所述待测拼音数据进行数据纠正,得到纠正拼音数据;
搜索与所述纠正拼音数据相同发音的文本数据,得到纠正文本数据;
组合所述文本数据、所述纠正文本数据与所述搜索文本数据,得到搜索数据集。
5.根据权利要求2-4之一所述的方法,其中,所述基于所述待匹配数据集,对所述混合匹配数据集进行筛选,得到与所述语音数据对应的搜索结果集,包括:
筛选所述混合匹配数据集中与所述搜索数据集中不同优先级的搜索数据相匹配的混合匹配数据,得到不同优先级的中间数据集;
按所述待匹配数据集中待匹配数据的顺序,对各个中间数据集进行排序和组合,得到与所述语音数据对应的搜索结果集。
6.根据权利要求5所述的方法,其中,所述按所述待匹配数据集中待匹配数据的顺序,对各个中间数据集进行排序和组合,得到与所述语音数据对应的搜索结果集,包括:
将各个中间数据集中的各个中间数据按照拼音字母顺序进行排序,得到不同排序数据集;
针对每个排序数据集,响应于确定该排序数据集中具有相同拼音的多个排序数据,将所述多个排序数据按照所述待匹配数据集中与各个排序数据对应的数据的顺序进行排序;
按各个中间数据集的优先级等级,排序并组合所有的排序数据集,得到与所述语音数据对应的搜索结果集。
7.根据权利要求5所述的方法,其中,所述搜索数据集包括:文本数据以及优先级低于所述文本数据的搜索文本数据,所述筛选所述混合匹配数据集中与所述搜索数据集中不同优先级的搜索数据相匹配的混合匹配数据,得到不同优先级的中间数据集包括:
将所述文本数据与所述混合匹配数据集进行匹配,得到与所述文本数据相匹配的待测中间数据集;
去除所述混合匹配数据集中的待测中间数据集,得到与所述搜索文本数据相匹配的搜索中间数据集,所述搜索中间数据集的优先级低于所述待测中间数据集。
8.根据权利要求5所述的方法,其中,所述搜索数据集包括:优先级等级依次下降的文本数据、搜索文本数据、纠正文本数据,所述筛选所述混合匹配数据集中与所述搜索数据集中不同优先级的搜索数据相匹配的混合匹配数据,得到不同优先级的中间数据集包括:
将所述文本数据与所述混合匹配数据集进行匹配,得到与所述文本数据相匹配的待测中间数据集;
去除所述混合匹配数据集中的待测中间数据,得到阶段子集;
将所述搜索文本数据与所述阶段子集进行匹配,得到与所述搜索文本数据相匹配的搜索中间数据集;
去除所述阶段子集中的搜索中间数据集,得到与所述纠正文本数据相匹配的纠正中间数据集,所述待测中间数据集、所述搜索中间数据集、所述纠正中间数据集的优先级顺序依次降低。
9.一种语音搜索装置,所述装置包括:
采集单元,被配置成获取语音数据;
识别单元,被配置成对所述语音数据进行识别,得到对应的文本数据;
匹配单元,被配置成基于所述文本数据和预设的待匹配数据集,得到混合匹配数据集;
处理单元,被配置成基于所述待匹配数据集,对所述混合匹配数据集进行筛选,得到与所述语音数据对应的搜索结果集。
10.根据权利要求9所述的装置,其中,所述匹配单元包括:
搜索模块,被配置成对所述文本数据进行数据搜索,得到搜索数据集;
匹配模块,被配置成将所述搜索数据集与预设的待匹配数据集进行匹配,得到混合匹配数据集。
11.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的方法。
13.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现权利要求1-8中任一项所述的方法。
CN202110586407.7A 2021-05-27 2021-05-27 语音搜索方法和装置、电子设备、计算机可读介质 Pending CN113326279A (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202110586407.7A CN113326279A (zh) 2021-05-27 2021-05-27 语音搜索方法和装置、电子设备、计算机可读介质
JP2022056210A JP7403571B2 (ja) 2021-05-27 2022-03-30 音声検索方法、装置、電子機器、コンピュータ読み取り可能な媒体及びコンピュータプログラム
KR1020220046654A KR20220054753A (ko) 2021-05-27 2022-04-15 음성 검색 방법 및 장치, 전자 기기, 컴퓨터 판독 가능 한 저장 매체 및 컴퓨터 프로그램
US17/744,120 US20220269722A1 (en) 2021-05-27 2022-05-13 Method and apparatus for searching voice, electronic device, and computer readable medium
EP22173454.4A EP4020951A3 (en) 2021-05-27 2022-05-16 Contact name searching using voice

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110586407.7A CN113326279A (zh) 2021-05-27 2021-05-27 语音搜索方法和装置、电子设备、计算机可读介质

Publications (1)

Publication Number Publication Date
CN113326279A true CN113326279A (zh) 2021-08-31

Family

ID=77421909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110586407.7A Pending CN113326279A (zh) 2021-05-27 2021-05-27 语音搜索方法和装置、电子设备、计算机可读介质

Country Status (5)

Country Link
US (1) US20220269722A1 (zh)
EP (1) EP4020951A3 (zh)
JP (1) JP7403571B2 (zh)
KR (1) KR20220054753A (zh)
CN (1) CN113326279A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113536764A (zh) * 2021-09-07 2021-10-22 湖南双菱电子科技有限公司 口令信息匹配方法、计算机设备和计算机可读存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102708215B1 (ko) * 2023-11-21 2024-09-19 길준석 기술 정보를 연계, 가공 및 융합하여 기술 조합 정보를 제공하는 시스템 및 이의 제어 방법

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110310634A (zh) * 2019-06-19 2019-10-08 广州小鹏汽车科技有限公司 车载语音推送方法、终端、服务器以及推送系统
CN110428822A (zh) * 2019-08-05 2019-11-08 重庆电子工程职业学院 一种语音识别纠错方法及人机对话系统
CN110880316A (zh) * 2019-10-16 2020-03-13 苏宁云计算有限公司 一种音频的输出方法和系统
CN111198936A (zh) * 2018-11-20 2020-05-26 北京嘀嘀无限科技发展有限公司 一种语音搜索方法、装置、电子设备及存储介质
CN112231440A (zh) * 2020-10-09 2021-01-15 安徽讯呼信息科技有限公司 一种基于人工智能的语音搜索方法
CN112767925A (zh) * 2020-12-24 2021-05-07 贝壳技术有限公司 语音信息识别方法及装置
CN112818089A (zh) * 2021-02-23 2021-05-18 掌阅科技股份有限公司 文本注音方法、电子设备及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5008248B2 (ja) * 2003-06-26 2012-08-22 シャープ株式会社 表示処理装置、表示処理方法、表示処理プログラム、および記録媒体
US20070074254A1 (en) * 2005-09-27 2007-03-29 Microsoft Corporation Locating content in a television environment
JP5004863B2 (ja) 2008-04-30 2012-08-22 三菱電機株式会社 音声検索装置および音声検索方法
US9104244B2 (en) * 2009-06-05 2015-08-11 Yahoo! Inc. All-in-one Chinese character input method
WO2011061556A1 (en) * 2009-11-20 2011-05-26 Kim Mo Intelligent search system
US8498864B1 (en) * 2012-09-27 2013-07-30 Google Inc. Methods and systems for predicting a text
CN103870000B (zh) * 2012-12-11 2018-12-14 百度国际科技(深圳)有限公司 一种对输入法所产生的候选项进行排序的方法及装置
CN104238991B (zh) 2013-06-21 2018-05-25 腾讯科技(深圳)有限公司 语音输入匹配方法及装置
US20150057994A1 (en) * 2013-08-20 2015-02-26 Eric Hong Fang Unified Mobile Learning Platform
CN106683677B (zh) 2015-11-06 2021-11-12 阿里巴巴集团控股有限公司 语音识别方法及装置
CN106933561A (zh) * 2015-12-31 2017-07-07 北京搜狗科技发展有限公司 语音输入方法和终端设备
CN107707745A (zh) * 2017-09-25 2018-02-16 百度在线网络技术(北京)有限公司 用于提取信息的方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111198936A (zh) * 2018-11-20 2020-05-26 北京嘀嘀无限科技发展有限公司 一种语音搜索方法、装置、电子设备及存储介质
CN110310634A (zh) * 2019-06-19 2019-10-08 广州小鹏汽车科技有限公司 车载语音推送方法、终端、服务器以及推送系统
CN110428822A (zh) * 2019-08-05 2019-11-08 重庆电子工程职业学院 一种语音识别纠错方法及人机对话系统
CN110880316A (zh) * 2019-10-16 2020-03-13 苏宁云计算有限公司 一种音频的输出方法和系统
CN112231440A (zh) * 2020-10-09 2021-01-15 安徽讯呼信息科技有限公司 一种基于人工智能的语音搜索方法
CN112767925A (zh) * 2020-12-24 2021-05-07 贝壳技术有限公司 语音信息识别方法及装置
CN112818089A (zh) * 2021-02-23 2021-05-18 掌阅科技股份有限公司 文本注音方法、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
沈玺;王永成;: "WEB语音检索中查询概念纠错的研究", 计算机仿真, no. 02, pages 227 - 231 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113536764A (zh) * 2021-09-07 2021-10-22 湖南双菱电子科技有限公司 口令信息匹配方法、计算机设备和计算机可读存储介质

Also Published As

Publication number Publication date
JP2022103161A (ja) 2022-07-07
EP4020951A2 (en) 2022-06-29
JP7403571B2 (ja) 2023-12-22
EP4020951A3 (en) 2022-11-02
US20220269722A1 (en) 2022-08-25
KR20220054753A (ko) 2022-05-03

Similar Documents

Publication Publication Date Title
CN107291783B (zh) 一种语义匹配方法及智能设备
CN108287858B (zh) 自然语言的语义提取方法及装置
CN110597994A (zh) 事件元素识别方法和装置
EP3648032A1 (en) Information inputting method, information inputting device, and information inputting system
CN113326279A (zh) 语音搜索方法和装置、电子设备、计算机可读介质
CN109299471B (zh) 一种文本匹配的方法、装置及终端
CN105678129B (zh) 一种确定用户身份信息的方法及设备
CN110597978A (zh) 物品摘要生成方法、系统、电子设备及可读存储介质
CN111198936B (zh) 一种语音搜索方法、装置、电子设备及存储介质
CN105678625A (zh) 一种确定用户身份信息的方法及设备
US10319378B2 (en) Interaction apparatus and method
CN111259170A (zh) 一种语音搜索方法、装置、电子设备及存储介质
CN103903615B (zh) 一种信息处理方法及电子设备
CN113850386A (zh) 模型预训练方法、装置、设备、存储介质以及程序产品
CN102937834B (zh) 混合型输入的方法、客户端及系统
CN112527819B (zh) 通讯录信息检索方法、装置、电子设备及存储介质
CN114491215B (zh) 基于搜索的近义词库更新方法、装置、设备及存储介质
CN113743127B (zh) 任务型对话的方法、装置、电子设备及存储介质
CN116010916A (zh) 用户身份信息识别方法、装置、电子设备及存储介质
KR20220024251A (ko) 이벤트 라이브러리를 구축하는 방법 및 장치, 전자 기기, 및 컴퓨터 판독가능 매체
CN113129894A (zh) 语音识别方法、装置、电子设备以及存储介质
CN114139547A (zh) 知识融合方法、装置、设备、系统及介质
CN113553832B (zh) 文字处理方法和装置、电子设备以及计算机可读存储介质
CN117033801B (zh) 一种业务推荐方法、装置、设备和存储介质
CN111881679B (zh) 文本的标准化处理方法、装置、电子设备及计算机介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210831