CN113779201B - 用于识别指令的方法、装置以及语音交互屏幕 - Google Patents

用于识别指令的方法、装置以及语音交互屏幕 Download PDF

Info

Publication number
CN113779201B
CN113779201B CN202111086573.7A CN202111086573A CN113779201B CN 113779201 B CN113779201 B CN 113779201B CN 202111086573 A CN202111086573 A CN 202111086573A CN 113779201 B CN113779201 B CN 113779201B
Authority
CN
China
Prior art keywords
instruction
instructions
word
library
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111086573.7A
Other languages
English (en)
Other versions
CN113779201A (zh
Inventor
章文俊
卓泽城
龚建
黄强
尤国安
潘旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202111086573.7A priority Critical patent/CN113779201B/zh
Publication of CN113779201A publication Critical patent/CN113779201A/zh
Priority to KR1020220062661A priority patent/KR20220077898A/ko
Priority to JP2022094122A priority patent/JP2022120100A/ja
Priority to US17/849,369 priority patent/US20220318503A1/en
Priority to EP22191032.6A priority patent/EP4109323A3/en
Application granted granted Critical
Publication of CN113779201B publication Critical patent/CN113779201B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开提供了用于识别指令的方法、装置以及语音交互屏幕,涉及自然语言处理、云计算等人工智能技术领域,可以但不限于应用于智慧城市等场景中。具体实现方案为:获取与待识别指令对应的文本向量和至少一个词重要度;根据该文本向量和至少一个词重要度,从预设的指令库中选取目标数目个准匹配指令,其中,该指令库中包括指令与指令的文本向量之间的对应关系,该指令库中的指令包括指令类型和指令所针对的关键词;基于该目标数目个准匹配指令中的指令类型和指令所针对的关键词,生成与该待识别指令相匹配的指令类型和指令所针对的关键词。从而从语义和词袋两个维度与预设的指令库中的指令进行匹配,以提升指令识别的效果。

Description

用于识别指令的方法、装置以及语音交互屏幕
技术领域
本公开涉及自然语言处理、云计算等人工智能技术领域,尤其涉及用于识别指令的方法、装置以及语音交互屏幕。
背景技术
随着互联网技术的发展,人机交互愈加频繁。在人机交互场景中,对包含指令进行准确识别,以确定用户的意图则显得十分重要。
现有技术中,往往是首先按照预设规则从待识别指令中抽取关键词,再通过比较关键词与预先构建的指令类型关键词和指令内容关键词是否相同来确定指令识别结果。
发明内容
提供了一种用于识别指令的方法、装置以及语音交互屏幕。
根据第一方面,提供了一种用于识别指令的方法,该方法包括:获取与待识别指令对应的文本向量和至少一个词重要度;根据文本向量和至少一个词重要度,从预设的指令库中选取目标数目个准匹配指令,其中,指令库中包括指令与指令的文本向量之间的对应关系,指令库中的指令包括指令类型和指令所针对的关键词;基于目标数目个准匹配指令中的指令类型和指令所针对的关键词,生成与待识别指令相匹配的指令类型和指令所针对的关键词。
根据第二方面,提供了一种用于识别指令的装置,该装置包括:获取单元,被配置成获取与待识别指令对应的文本向量和至少一个词重要度;选取单元,被配置成根据文本向量和至少一个词重要度,从预设的指令库中选取目标数目个准匹配指令,其中,指令库中包括指令与指令的文本向量之间的对应关系,指令库中的指令包括指令类型和指令所针对的关键词;生成单元,被配置成基于目标数目个准匹配指令中的指令类型和指令所针对的关键词,生成与待识别指令相匹配的指令类型和指令所针对的关键词。
根据第三方面,提供了一种电子设备,该电子设备包括:至少一个处理器;以及与上述至少一个处理器通信连接的存储器;其中,存储器存储有可被上述至少一个处理器执行的指令,上述指令被至少一个处理器执行,以使上述至少一个处理器能够执行如第一方面中任一实现方式所描述的方法。
根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机能够执行如第一方面中任一实现方式所描述的方法。
根据第五方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现如第一方面中任一实现方式所描述的方法。
根据第六方面,提供了一种语音交互屏幕,包括:语音识别设备,被配置成对接收到的语音进行识别,生成待识别指令;如第三方面所描述的电子设备;显示设备,被配置成基于与待识别指令相匹配的指令类型和指令所针对的关键词,呈现与待识别指令相匹配的内容。
根据本公开的技术通过与待识别指令对应的文本向量和至少一个词重要度从语义和词袋两个维度与预设的指令库中的指令进行匹配,以得到对待识别指令的指令类型和指令所针对的关键词的解析结果。从而可以减少预设的指令库中的信息构建量,并且通过语义匹配实现更好的容错能力和泛化性,进而提升指令识别的效果。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例的示意图;
图2是根据本公开第二实施例的示意图;
图3是可以实现本公开实施例的用于识别指令的方法的一个应用场景的示意图;
图4是根据本公开实施例的用于识别指令的装置的示意图;
图5是用来实现本公开实施例的用于识别指令的方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是示出了根据本公开第一实施例的示意图100。该用于识别指令的方法包括以下步骤:
S101,获取与待识别指令对应的文本向量和至少一个词重要度。
在本实施例中,用于识别指令的执行主体可以通过各种方式获取与待识别指令对应的文本向量和至少一个词重要度。作为示例,上述执行主体可以通过有线或无线连接的方式从本地或通信连接的电子设备获取与待识别指令对应的文本向量和至少一个词重要度。其中,上述词重要度可以用于表征上述待识别指令中的词在整个上述待识别指令中的重要性。作为示例,上述词重要度可以是词频或词频-逆文本频率指数(term frequency–inverse document frequency,TF-IDF)。
在本实施例中,上述与待识别指令对应的文本向量和至少一个词重要度可以通过各种方式生成。作为示例,用于生成与待识别指令对应的文本向量和至少一个词重要度的执行主体可以首先获取待识别指令。其中,上述待识别指令可以是用户输入的文本,也可以是对用户输入的语音进行语音识别后所得到的文本,在此不作限定。而后,上述执行主体可以通过各种文本向量化方法(例如采用SentenceBERT模型)将获取的待识别文本转化为对应的文本向量。其中,上述文本向量通常可以与待识别文本一一对应,例如将一段待识别文本转化为128维的浮点数向量。上述执行主体还可以利用各种切词工具对上述待识别文本进行切词。可选地,上述执行主体还可以对切词过细的词进行合并,例如保留完整的人名、地名。
需要说明的是,上述用于生成与待识别指令对应的文本向量和至少一个词重要度的执行主体可以与上述用于识别指令的执行主体相同或不同,在此不做限定。
S102,根据文本向量和至少一个词重要度,从预设的指令库中选取目标数目个准匹配指令。
在本实施例中,上述预设的指令库中可以包括指令与指令的文本向量之间的对应关系。上述预设的指令库中的指令可以包括指令类型和指令所针对的关键词。其中,上述指令类型通常用于指示所要执行的操作的种类,例如“打开页面”、“关闭页面”、“切换监测画面(摄像头)”、“放大”等等。上述指令所针对的关键词通常用于指示所要执行的操作所针对的具体对象,例如“城市管理”、“交通流量”、“XX路口”等等。
在本实施例中,作为示例,上述预设的指令库中的一条指令可以为“打开(页面),城市管理,文本向量”。其中,上述文本向量可以是将“打开城市管理页面”经过文本向量化所得到的向量。
在本实施例中,根据步骤S101所获取的文本向量和至少一个词重要度这两方面的匹配,上述执行主体可以通过各种方式从预设的指令库中选取目标数目个准匹配指令。作为示例,上述执行主体可以首先利用步骤S101所获取的文本向量与上述预设的指令库中的指令对应的文本向量进行相似度计算,选取相似度最高的M个文本向量对应的指令作为候选匹配指令。而后,上述执行主体可以确定上述候选匹配指令中指令所包括的词的词重要度(例如“打开”的词重要度、“城市管理”的词重要度、“页面”的词重要度)。接下来,上述执行主体可以从上述所选取的候选匹配指令中选取目标数目个包含有词重要度不小于上述待识别指令对应的词重要度(例如“看下”的词重要度、的词重要度、“界面”的词重要度)中一致的词(例如“城市管理”)的词重要度的词的指令作为上述准匹配指令。
需要说明的是,上述目标数目可以是根据实际应用场景而预先设定的数目,例如5个。上述目标数目也可以是根据规则而定的数目,例如相似度和词重要度均超过预设阈值的指令的数目。
S103,基于目标数目个准匹配指令中的指令类型和指令所针对的关键词,生成与待识别指令相匹配的指令类型和指令所针对的关键词。
在本实施例中,基于步骤S102所选取的目标数目个准匹配指令中的指令类型和指令所针对的关键词,上述执行主体可以通过各种方式生成与待识别指令相匹配的指令类型和指令所针对的关键词。
在本实施例中,作为示例,上述执行主体可以分别将上述目标数目个准匹配指令中出现的次数最高的指令类型和指令所针对的关键词确定为与待识别指令相匹配的指令类型和指令所针对的关键词。
本公开的上述实施例提供的方法,通过与待识别指令对应的文本向量和至少一个词重要度从语义和词袋两个维度与预设的指令库中的指令进行匹配,以得到对待识别指令的指令类型和指令所针对的关键词的解析结果。从而可以减少预设的指令库中的信息构建量,并且通过语义匹配实现更好的容错能力和泛化性,进而从应用效率和识别率等方面提升指令识别的效果。
在本实施例的一些可选的实现方式中,根据文本向量和至少一个词重要度,上述执行主体可以按照以下步骤从预设的指令库中选取目标数目个准匹配指令:
S1021,从预设的指令库中选取第一数目个与文本向量匹配的指令作为预匹配指令。
在这些实现方式中,上述执行主体可以通过各种方式从上述预设的指令库中选取第一数目个与文本向量匹配的指令作为预匹配指令。
作为示例,上述执行主体可以首先利用步骤S101所获取的文本向量与上述预设的指令库中的指令对应的文本向量进行相似度计算,选取相似度最高的第一数目(例如10)个文本向量对应的指令作为候选匹配指令。
S1022,从预设的指令库中选取第二数目个与至少一个词重要度匹配的指令作为预匹配指令。
在这些实现方式中,上述执行主体可以通过各种方式从预设的指令库中选取第二数目(例如10)个与至少一个词重要度匹配的指令作为预匹配指令。其中,上述预匹配指令中至少包括一个与上述至少一个词重要度所指示的词相同的词。
作为示例,上述与待识别指令对应的至少一个词重要度所指示的词例如可以是“A”和“B”。则上述预匹配指令中至少包括“A”和“B”中的一个。
S1023,从所选取的预匹配指令集合中选取目标数目个指令作为准匹配指令。
在这些实现方式中,上述执行主体可以通过各种方式从上述步骤S1022所选取的预匹配指令集合中选取目标数目个指令作为准匹配指令。作为示例,响应于确定上述步骤S1021所选取的第一数目个预匹配指令与上述步骤S1022所选取的第二数目个预匹配指令中存在相同的指令,上述执行主体可以将上述相同的指令确定为上述准匹配指令。
基于上述可选的实现方式,本方案可以丰富了从预设的指令库中选取准匹配指令的方式,从而从语义和词袋两方面的进一步结合提升匹配的准确性。
可选地,在本实施例的一些可选的实现方式中,上述执行主体可以按照以下步骤从预设的指令库中选取第二数目个与至少一个词重要度匹配的指令作为预匹配指令:
第一步,从预设的指令库中选取包括至少一个目标词的指令,生成目标指令集合。
在这些实现方式中,上述目标词通常包括上述待识别指令经过分词后所得到的词。上述目标词可以与前述待识别指令对应的至少一个词重要度所指示的词一致。
可选地,上述预设的指令库中还可以包括倒排索引(Inverted Index),从而上述执行主体可以通过倒排索引快速选取上述目标指令,生成目标指令集合。
第二步,对于目标指令集合中的指令,将该指令中与至少一个目标词相匹配的词对应的词重要度进行累加,生成该指令对应的指令重要度。
在这些实现方式中,作为示例,上述至少一个目标词可以包括“A”和“B”。对于目标指令集合中的指令,若该指令只包括目标词“A”,则该指令对应的指令重要度为目标词“A”对应的词重要度。若该指令包括目标词“A”和目标词“B”,则该指令对应的指令重要度为目标词“A”对应的词重要度与目标词“B”对应的词重要度之和。
第三步,选取对应的指令重要度最高的前第二数目个指令作为第二数目个预匹配指令。
在这些实现方式中,上述执行主体可以根据上述第二步所生成的指令重要度,选取对应的指令重要度最高的前第二数目个指令作为第二数目个预匹配指令。
基于上述可选的实现方式,本方案丰富了根据词重要度选取第二数目个预匹配指令的方式,从而尽可能提升从词袋方面进行匹配的准确性。
可选地,在本实施例的一些可选的实现方式中,上述执行主体可以按照以下步骤从所选取的预匹配指令集合中选取目标数目个指令作为准匹配指令:
第一步,对所选取的预匹配指令集合中的指令进行去重,生成第三数目个预匹配指令。
在这些实现方式中,上述执行主体可以通过各种方式对步骤S1022所选取的预匹配指令集合中的指令进行去重,生成第三数目个预匹配指令。其中,上述第三数目通常不大于上述第一数目和上述第二数目之和。
第二步,基于文本相似度,从第三数目个预匹配指令中选取目标数目个指令作为准匹配指令,
在这些实现方式中,基于文本相似度,上述执行主体可以通过各种方式从上述第一步所生成的第三数目个预匹配指令中选取目标数目个指令作为准匹配指令。其中,上述文本相似度可以用于表征上述待识别指令与上述第三数目个预匹配指令中的指令之间的相似度。作为示例,上述文本相似度可以是待识别指令对应的文本向量和上述预匹配指令中的指令对应的文本向量之间的相似度。上述执行主体可以从上述第三数目个预匹配指令中按照文本相似度从高至低的顺序选取目标数目个指令作为准匹配指令。作为又一示例,上述执行主体还可以从上述第三数目个预匹配指令中随机选取目标数目个文本相似度大于预设相似度阈值的指令作为准匹配指令。
基于上述可选的实现方式,本方案丰富了从所选取的预匹配指令集合中选取准匹配指令的方式,通过利用语义匹配度进行精确匹配保证准确率在较高的水平上。
在本实施例的一些可选的实现方式中,基于目标数目个准匹配指令中的指令类型和指令所针对的关键词,上述执行主体可以按照以下步骤生成与待识别指令相匹配的指令类型和指令所针对的关键词:
第一步,对于目标数目个准匹配指令中的指令类型和指令所针对的关键词,分别累加与该指令类型和该指令所针对的关键词对应的指令所对应的文本相似度,生成各指令类型和指令所针对的关键词分别对应的累加值。
在这些实现方式中,作为示例,上述准匹配指令可以包括指令1“打开,城市管理”和指令2“打开,城市交通”。则上述执行主体可以确定指令类型“打开”对应的累加值为指令1对应的文本相似度和指令2对应的文本相似度之和。同理,上述执行主体可以确定指令所针对的关键词“城市管理”对应的累加值为指令1对应的文本相似度。上述执行主体可以确定指令所针对的关键词“城市交通”对应的累加值为指令2对应的文本相似度。
第二步,分别将累加值最高的指令类型和指令所针对的关键词确定为与待识别指令相匹配的指令类型和指令所针对的关键词。
在这些实现方式中,上述执行主体可以分别将上述第一步所生成的累加值中累加值最高的指令类型和指令所针对的关键词确定为与待识别指令相匹配的指令类型和指令所针对的关键词。
基于上述可选的实现方式,本方案丰富了从目标数目个准匹配指令中确定与待识别指令相匹配的指令类型和指令所针对的关键词的方式,从而提升了指令识别的准确性。
继续参见图2,图2是根据本公开第二实施例的示意图200。该用于识别指令的方法包括以下步骤:
S201,获取与待识别指令对应的文本向量和至少一个词重要度。
S202,根据文本向量和至少一个词重要度,从预设的指令库中选取目标数目个准匹配指令。
在本实施例中,上述预设的指令库通过以下步骤生成:
S2021,获取预设的指令模板。
在本实施例中,上述执行主体可以通过有线或无线连接的方式从本地或通信连接的电子设备获取预设的指令模板。其中,上述指令模板中可以包括指令类型槽位和指令所针对的关键词槽位。作为示例,上述指令模板可以是“{open}{page}页面”。
S2022,基于预先获取的指令类型数据集合和指令所针对的关键词数据集合进行填槽,生成预设指令集合。
在本实施例中,上述执行主体可以预先获取指令类型数据集合和指令所针对的关键词数据集合。其中,上述指令类型数据集合和指令所针对的关键词数据集合中可以分别包括各种具体的指令类型和指令所针对的关键词。作为示例,上述指令类型数据集合中可以包括“打开”、“关闭”、“看下”等。上述指令所针对的关键词数据集合中可以包括“城市管理”、“文化旅游”、“交通流量”等。
在本实施例中,上述执行主体可以利用上述预先获取的指令类型数据集合和指令所针对的关键词数据集合中的各项数据对上述步骤S2021中对应的槽位进行填槽,生成各种指令,以形成上述预设指令集合。
作为示例,上述预设指令集合中的指令可以包括“打开城市管理页面”、“关闭交通流量页面”、“看下文化旅游页面”等。
S2023,基于对所生成的预设指令集合中的指令的文本向量化,生成指令与文本向量之间的对应关系。
在本实施例中,上述执行主体可以通过各种方式对上述步骤S2022所生成的预设指令集合中的指令进行文本向量化,生成指令与文本向量之间的对应关系。其中,上述文本向量化的方式可以与前述实施例中步骤S101中的相应描述一致,此处不作限定。
从而,上述执行主体可以将上述预设指令集合和上述指令与文本向量之间的对应关系的组合确定为上述预设的指令库。
在本实施例的一些可选的实现方式中,上述指令库中的指令还可以包括指令内容。从而,上述执行主体可以将指令内容、指令类型和指令所针对的关键词形成三元组。作为示例,上述指令可以为“打开城市管理页面,打开页面,城市管理”。
基于上述可选的实现方式,上述预设的指令库可以进一步通过以下步骤生成:
S2024,对预设指令集合中的指令进行切词,生成词集合。
在这些实现方式中,上述切词的方式可以与前述实施例中步骤S101中的相应描述一致,此处不作限定。
S2025,基于词集合作为索引,指令库中的指令内容作为数据库的记录,生成针对预设的指令库的文本倒排索引。
在这些实现方式中,上述执行主体可以以上述步骤S2024所生成的词集合中的词作为索引,以上述预设的指令库中包含上述索引词的指令内容作为数据库的记录,生成针对上述预设的指令库的文本倒排索引。
基于上述可选的实现方式,本方案可以为上述预设的指令库生成文本倒排索引,从而为提升指令识别的速度提供基础。
S203,基于目标数目个准匹配指令中的指令类型和指令所针对的关键词,生成与待识别指令相匹配的指令类型和指令所针对的关键词。
上述S201、S202、S203可以分别与前述实施例中的S101、S102、S103及其可选的实现方式一致,上文针对S101、S102、S103及其可选的实现方式的描述也适用于S201、S202、S203,此处不再赘述。
从图2中可以看出,本实施例中的用于识别指令的方法的流程200体现了通过预先获取的数据集对预设的指令模板进行填槽,以生成上述预设的指令库的步骤。由此,本实施例描述的方案通过构建基于指令类型和指令所针对的关键词的标准指令而非海量关键词映射关系的指令库,从而极大地减少了需要搜集的同义词等数据量,并且通过模板自动生成指令,节约了人力。
继续参见图3,图3是根据本公开的实施例的用于识别指令的方法的应用场景的一个示意图。在图3的应用场景中,中控室的智能显示大屏幕302可以首先获取与“看一下城市管理页面”对应的文本向量和与“看一下”、“城市管理”、“页面”分别对应的TF-IDF值作为词重要度。可选地,上述与“看一下城市管理页面”对应的文本向量和与“看一下”、“城市管理”、“页面”分别对应的TF-IDF值可以由智能显示大屏幕302针对用户301说出的“看一下城市管理页面”进行文本向量化和切词后的TF-IDF计算得到。而后,智能显示大屏幕302可以根据上述文本向量和词重要度从预设的指令库303中选取目标数目个指令作为准匹配指令。接下来,基于目标数目个准匹配指令中的指令类型和指令所针对的关键词,智能显示大屏幕302可以生成与待识别指令相匹配的指令类型和指令所针对的关键词304。
目前,现有技术之一往往是首先按照预设规则从待识别指令中抽取关键词,再通过比较关键词与预先构建的指令类型关键词和指令内容关键词是否相同来确定指令识别结果,导致往往增加了预先训练信息抽取模型的步骤,而且当同义词未收集时难以准确识别而导致泛化能力较差。而本公开的上述实施例提供的方法,通过与待识别指令对应的文本向量和至少一个词重要度从语义和词袋两个维度与预设的指令库中的指令进行匹配,以得到对待识别指令的指令类型和指令所针对的关键词的解析结果。从而可以减少预设的指令库中的信息构建量,并且通过语义匹配实现更好的容错能力和泛化性,进而提升指令识别的效果。
进一步参考图4,作为对上述各图所示方法的实现,本公开提供了用于识别指令的装置的一个实施例,该装置实施例与图1或图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,本实施例提供的用于识别指令的装置400包括获取单元401、选取单元402和生成单元403。其中,获取单元401,被配置成获取与待识别指令对应的文本向量和至少一个词重要度;选取单元402,被配置成根据文本向量和至少一个词重要度,从预设的指令库中选取目标数目个准匹配指令,其中,指令库中包括指令与指令的文本向量之间的对应关系,指令库中的指令包括指令类型和指令所针对的关键词;生成单元403,被配置成基于目标数目个准匹配指令中的指令类型和指令所针对的关键词,生成与待识别指令相匹配的指令类型和指令所针对的关键词。
在本实施例中,用于识别指令的装置400中:获取单元401、选取单元402和生成单元403的具体处理及其所带来的技术效果可分别参考图1对应实施例中的步骤S101、S102、S103的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,上述选取单元402可以包括:第一选取模块(图中未示出),被配置成从预设的指令库中选取第一数目个与文本向量匹配的指令作为预匹配指令;第二选取模块(图中未示出),被配置成从预设的指令库中选取第二数目个与至少一个词重要度匹配的指令作为预匹配指令;第三选取模块(图中未示出),被配置成从所选取的预匹配指令集合中选取目标数目个指令作为准匹配指令。
在本实施例的一些可选的实现方式中,上述第二选取模块可以被进一步配置成:从预设的指令库中选取包括至少一个目标词的指令,生成目标指令集合,其中,目标词可以包括待识别指令经过分词后所得到的词;对于目标指令集合中的指令,将该指令中与至少一个目标词相匹配的词对应的词重要度进行累加,生成该指令对应的指令重要度;选取对应的指令重要度最高的前第二数目个指令作为第二数目个预匹配指令。
在本实施例的一些可选的实现方式中,上述第三选取模块可以被进一步配置成:对所选取的预匹配指令集合中的指令进行去重,生成第三数目个预匹配指令,其中,第三数目可以不大于第一数目和第二数目之和;基于文本相似度,从第三数目个预匹配指令中选取目标数目个指令作为准匹配指令,其中,文本相似度可以用于表征待识别指令与第三数目个预匹配指令中的指令之间的相似度。
在本实施例的一些可选的实现方式中,上述生成单元403可以被进一步配置成:对于目标数目个准匹配指令中的指令类型和指令所针对的关键词,分别累加与该指令类型和该指令所针对的关键词对应的指令所对应的文本相似度,生成各指令类型和指令所针对的关键词分别对应的累加值;分别将累加值最高的指令类型和指令所针对的关键词确定为与待识别指令相匹配的指令类型和指令所针对的关键词。
在本实施例的一些可选的实现方式中,上述预设的指令库通过以下步骤生成:获取预设的指令模板,其中,指令模板中可以包括指令类型槽位和指令所针对的关键词槽位;基于预先获取的指令类型数据集合和指令所针对的关键词数据集合进行填槽,生成预设指令集合;基于对所生成的预设指令集合中的指令的文本向量化,生成指令与文本向量之间的对应关系。
在本实施例的一些可选的实现方式中,上述指令库中的指令还可以包括指令内容;以及上述预设的指令库可以进一步通过以下步骤生成:对预设指令集合中的指令进行切词,生成词集合;基于词集合作为索引,指令库中的指令内容作为数据库的记录,生成针对预设的指令库的文本倒排索引。
本公开的上述实施例提供的装置,通过选取单元402利用获取单元401所获取的与待识别指令对应的文本向量和至少一个词重要度从语义和词袋两个维度与预设的指令库中的指令进行匹配,得到准匹配指令集合;再通过生成单元403基于准匹配指令中的指令类型和指令所针对的关键词,得到对待识别指令的指令类型和指令所针对的关键词的解析结果。从而可以减少预设的指令库中的信息构建量,并且通过语义匹配实现更好的容错能力和泛化性,进而提升指令识别的效果。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
本公开所提供的语音交互屏幕,可以包括:语音识别设备,被配置成对接收到的语音进行识别,生成待识别指令;如图5所示的上述电子设备;显示设备,被配置成基于与待识别指令相匹配的指令类型和指令所针对的关键词,呈现与待识别指令相匹配的内容。其中,上述执行主体可以预先获取指令类型和指令所针对的关键词与呈现内容之间的对应关系。作为示例,当上述指令类型和指令所针对的关键词分别为“打开页面”和“城市管理”时,上述执行主体可以呈现城市管理页面。
如图5所示,设备500包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM503中,还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如用于识别指令的方法。例如,在一些实施例中,用于识别指令的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由计算单元501执行时,可以执行上文描述的用于识别指令的方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行用于识别指令的方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (13)

1.一种用于识别指令的方法,包括:
获取与待识别指令对应的文本向量和至少一个词重要度,该词重要度用于表征所述待识别指令中的词在整个所述待识别指令中的重要性;
根据所述文本向量和至少一个词重要度,从预设的指令库中选取目标数目个准匹配指令,包括:从所述预设的指令库中选取第一数目个与所述文本向量匹配的指令作为预匹配指令;从所述预设的指令库中选取第二数目个与所述至少一个词重要度匹配的指令作为预匹配指令;以及从所选取的预匹配指令集合中选取所述目标数目个指令作为所述准匹配指令;
基于所述目标数目个准匹配指令中的指令类型和指令所针对的关键词,生成与所述待识别指令相匹配的指令类型和指令所针对的关键词;
其中,所述指令库中包括指令与指令的文本向量之间的对应关系,所述指令库中的指令包括指令类型和指令所针对的关键词,所述从所述预设的指令库中选取第二数目个与所述至少一个词重要度匹配的指令作为预匹配指令,包括:从所述预设的指令库中选取包括至少一个目标词的指令,生成目标指令集合,其中,所述目标词包括所述待识别指令经过分词后所得到的词;对于所述目标指令集合中的指令,将该指令中与所述至少一个目标词相匹配的词对应的词重要度进行累加,生成该指令对应的指令重要度;以及选取对应的指令重要度最高的前第二数目个指令作为所述第二数目个预匹配指令。
2.根据权利要求1所述的方法,其中,所述从所选取的预匹配指令集合中选取所述目标数目个指令作为所述准匹配指令,包括:
对所选取的预匹配指令集合中的指令进行去重,生成第三数目个预匹配指令,其中,所述第三数目不大于所述第一数目和所述第二数目之和;
基于文本相似度,从所述第三数目个预匹配指令中选取所述目标数目个指令作为所述准匹配指令,其中,所述文本相似度用于表征所述待识别指令与所述第三数目个预匹配指令中的指令之间的相似度。
3.根据权利要求2所述的方法,其中,所述基于所述目标数目个准匹配指令中的指令类型和指令所针对的关键词,生成与所述待识别指令相匹配的指令类型和指令所针对的关键词,包括:
对于所述目标数目个准匹配指令中的指令类型和指令所针对的关键词,分别累加与该指令类型对应的指令文本相似度和该指令所针对的关键词对应指令的文本相似度,生成各指令类型和指令所针对的关键词分别对应的累加值;
分别将累加值最高的指令类型和指令所针对的关键词确定为与所述待识别指令相匹配的指令类型和指令所针对的关键词。
4.根据权利要求1所述的方法,其中,所述预设的指令库通过以下步骤生成:
获取预设的指令模板,其中,所述指令模板中包括指令类型槽位和指令所针对的关键词槽位;
基于预先获取的指令类型数据集合和指令所针对的关键词数据集合进行填槽,生成预设指令集合;
基于对所生成的预设指令集合中的指令的文本向量化,生成指令与文本向量之间的对应关系。
5.根据权利要求4所述的方法,其中,所述指令库中的指令还包括指令内容;以及
所述预设的指令库进一步通过以下步骤生成:
对所述预设指令集合中的指令进行切词,生成词集合;
基于所述词集合作为索引,所述指令库中的指令内容作为数据库的记录,生成针对所述预设的指令库的文本倒排索引。
6.一种用于识别指令的装置,包括:
获取单元,被配置成获取与待识别指令对应的文本向量和至少一个词重要度,所述词重要度用于表征所述待识别指令中的词在整个所述待识别指令中的重要性;
选取单元,被配置成根据所述文本向量和至少一个词重要度,从预设的指令库中选取目标数目个准匹配指令,其中,所述指令库中包括指令与指令的文本向量之间的对应关系,所述指令库中的指令包括指令类型和指令所针对的关键词;
生成单元,被配置成基于所述目标数目个准匹配指令中的指令类型和指令所针对的关键词,生成与所述待识别指令相匹配的指令类型和指令所针对的关键词;
其中,所述选取单元包括:
第一选取模块,被配置成从所述预设的指令库中选取第一数目个与所述文本向量匹配的指令作为预匹配指令;
第二选取模块,被配置成从所述预设的指令库中选取第二数目个与所述至少一个词重要度匹配的指令作为预匹配指令;
第三选取模块,被配置成从所选取的预匹配指令集合中选取所述目标数目个指令作为所述准匹配指令;
所述第二选取模块被进一步配置成:
从所述预设的指令库中选取包括至少一个目标词的指令,生成目标指令集合,其中,所述目标词包括所述待识别指令经过分词后所得到的词;
对于所述目标指令集合中的指令,将该指令中与所述至少一个目标词相匹配的词对应的词重要度进行累加,生成该指令对应的指令重要度;
选取对应的指令重要度最高的前第二数目个指令作为所述第二数目个预匹配指令。
7.根据权利要求6所述的装置,其中,所述第三选取模块被进一步配置成:
对所选取的预匹配指令集合中的指令进行去重,生成第三数目个预匹配指令,其中,所述第三数目不大于所述第一数目和所述第二数目之和;
基于文本相似度,从所述第三数目个预匹配指令中选取所述目标数目个指令作为所述准匹配指令,其中,所述文本相似度用于表征所述待识别指令与所述第三数目个预匹配指令中的指令之间的相似度。
8.根据权利要求7所述的装置,其中,所述生成单元被进一步配置成:
对于所述目标数目个准匹配指令中的指令类型和指令所针对的关键词,分别累加与该指令类型对应的指令文本相似度和该指令所针对的关键词对应指令的文本相似度,生成各指令类型和指令所针对的关键词分别对应的累加值;
分别将累加值最高的指令类型和指令所针对的关键词确定为与所述待识别指令相匹配的指令类型和指令所针对的关键词。
9.根据权利要求6所述的装置,其中,所述预设的指令库通过以下步骤生成:
获取预设的指令模板,其中,所述指令模板中包括指令类型槽位和指令所针对的关键词槽位;
基于预先获取的指令类型数据集合和指令所针对的关键词数据集合进行填槽,生成预设指令集合;
基于对所生成的预设指令集合中的指令的文本向量化,生成指令与文本向量之间的对应关系。
10.根据权利要求9所述的装置,其中,所述指令库中的指令还包括指令内容;以及
所述预设的指令库进一步通过以下步骤生成:
对所述预设指令集合中的指令进行切词,生成词集合;
基于所述词集合作为索引,所述指令库中的指令内容作为数据库的记录,生成针对所述预设的指令库的文本倒排索引。
11. 一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5任一项所述的方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-5中任一项所述的方法。
13.一种语音交互屏幕,包括:
语音识别设备,被配置成对接收到的语音进行识别,生成待识别指令;
如权利要求11所述的电子设备;
显示设备,被配置成基于与所述待识别指令相匹配的指令类型和指令所针对的关键词,呈现与所述待识别指令相匹配的内容。
CN202111086573.7A 2021-09-16 2021-09-16 用于识别指令的方法、装置以及语音交互屏幕 Active CN113779201B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202111086573.7A CN113779201B (zh) 2021-09-16 2021-09-16 用于识别指令的方法、装置以及语音交互屏幕
KR1020220062661A KR20220077898A (ko) 2021-09-16 2022-05-23 명령어 인식 방법, 장치 및 음성 인터랙션 스크린
JP2022094122A JP2022120100A (ja) 2021-09-16 2022-06-10 指令を認識するための方法、装置、電子機器、記憶媒体、コンピュータプログラムおよび音声インタラクティブスクリーン
US17/849,369 US20220318503A1 (en) 2021-09-16 2022-06-24 Method and apparatus for identifying instruction, and screen for voice interaction
EP22191032.6A EP4109323A3 (en) 2021-09-16 2022-08-18 Method and apparatus for identifying instruction, and screen for voice interaction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111086573.7A CN113779201B (zh) 2021-09-16 2021-09-16 用于识别指令的方法、装置以及语音交互屏幕

Publications (2)

Publication Number Publication Date
CN113779201A CN113779201A (zh) 2021-12-10
CN113779201B true CN113779201B (zh) 2023-06-30

Family

ID=78851378

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111086573.7A Active CN113779201B (zh) 2021-09-16 2021-09-16 用于识别指令的方法、装置以及语音交互屏幕

Country Status (5)

Country Link
US (1) US20220318503A1 (zh)
EP (1) EP4109323A3 (zh)
JP (1) JP2022120100A (zh)
KR (1) KR20220077898A (zh)
CN (1) CN113779201B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004333737A (ja) * 2003-05-06 2004-11-25 Nec Corp メディア検索装置およびメディア検索プログラム
CN108885614A (zh) * 2017-02-06 2018-11-23 华为技术有限公司 一种文本和语音信息的处理方法以及终端
CN108986801A (zh) * 2017-06-02 2018-12-11 腾讯科技(深圳)有限公司 一种人机交互方法、装置及人机交互终端
CN109033162A (zh) * 2018-06-19 2018-12-18 深圳市元征科技股份有限公司 一种数据处理方法、服务器及计算机可读介质
CN109767758A (zh) * 2019-01-11 2019-05-17 中山大学 车载语音分析方法、系统、存储介质以及设备
CN109841221A (zh) * 2018-12-14 2019-06-04 深圳壹账通智能科技有限公司 基于语音识别的参数调节方法、装置及健身设备
WO2019154282A1 (zh) * 2018-02-08 2019-08-15 广东美的厨房电器制造有限公司 家电设备及其语音识别方法、控制方法、控制装置
CN110265010A (zh) * 2019-06-05 2019-09-20 四川驹马科技有限公司 基于百度语音的货车多人语音识别方法及系统
CN110675870A (zh) * 2019-08-30 2020-01-10 深圳绿米联创科技有限公司 一种语音识别方法、装置、电子设备及存储介质
CN110827822A (zh) * 2019-12-06 2020-02-21 广州易来特自动驾驶科技有限公司 一种智能语音交互方法、装置、出行终端、设备及介质
CN111126233A (zh) * 2019-12-18 2020-05-08 中国平安财产保险股份有限公司 基于距离值的通话通道构建方法、装置和计算机设备
CN112133295A (zh) * 2020-11-09 2020-12-25 北京小米松果电子有限公司 语音识别方法、装置及存储介质
CN112686102A (zh) * 2020-12-17 2021-04-20 宽衍(北京)科技发展有限公司 一种适应于地铁站点的快速排障方法
CN112700768A (zh) * 2020-12-16 2021-04-23 科大讯飞股份有限公司 语音识别方法以及电子设备、存储装置
CN112767924A (zh) * 2021-02-26 2021-05-07 北京百度网讯科技有限公司 语音识别方法、装置、电子设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9659082B2 (en) * 2012-08-27 2017-05-23 Microsoft Technology Licensing, Llc Semantic query language
US11481442B2 (en) * 2019-12-12 2022-10-25 International Business Machines Corporation Leveraging intent resolvers to determine multiple intents
US11580112B2 (en) * 2020-03-31 2023-02-14 Pricewaterhousecoopers Llp Systems and methods for automatically determining utterances, entities, and intents based on natural language inputs
US11243991B2 (en) * 2020-06-05 2022-02-08 International Business Machines Corporation Contextual help recommendations for conversational interfaces based on interaction patterns
CN112800190B (zh) * 2020-11-11 2022-06-10 重庆邮电大学 基于Bert模型的意图识别与槽值填充联合预测方法

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004333737A (ja) * 2003-05-06 2004-11-25 Nec Corp メディア検索装置およびメディア検索プログラム
CN108885614A (zh) * 2017-02-06 2018-11-23 华为技术有限公司 一种文本和语音信息的处理方法以及终端
CN108986801A (zh) * 2017-06-02 2018-12-11 腾讯科技(深圳)有限公司 一种人机交互方法、装置及人机交互终端
WO2019154282A1 (zh) * 2018-02-08 2019-08-15 广东美的厨房电器制造有限公司 家电设备及其语音识别方法、控制方法、控制装置
CN109033162A (zh) * 2018-06-19 2018-12-18 深圳市元征科技股份有限公司 一种数据处理方法、服务器及计算机可读介质
CN109841221A (zh) * 2018-12-14 2019-06-04 深圳壹账通智能科技有限公司 基于语音识别的参数调节方法、装置及健身设备
CN109767758A (zh) * 2019-01-11 2019-05-17 中山大学 车载语音分析方法、系统、存储介质以及设备
CN110265010A (zh) * 2019-06-05 2019-09-20 四川驹马科技有限公司 基于百度语音的货车多人语音识别方法及系统
CN110675870A (zh) * 2019-08-30 2020-01-10 深圳绿米联创科技有限公司 一种语音识别方法、装置、电子设备及存储介质
CN110827822A (zh) * 2019-12-06 2020-02-21 广州易来特自动驾驶科技有限公司 一种智能语音交互方法、装置、出行终端、设备及介质
CN111126233A (zh) * 2019-12-18 2020-05-08 中国平安财产保险股份有限公司 基于距离值的通话通道构建方法、装置和计算机设备
CN112133295A (zh) * 2020-11-09 2020-12-25 北京小米松果电子有限公司 语音识别方法、装置及存储介质
CN112700768A (zh) * 2020-12-16 2021-04-23 科大讯飞股份有限公司 语音识别方法以及电子设备、存储装置
CN112686102A (zh) * 2020-12-17 2021-04-20 宽衍(北京)科技发展有限公司 一种适应于地铁站点的快速排障方法
CN112767924A (zh) * 2021-02-26 2021-05-07 北京百度网讯科技有限公司 语音识别方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
EP4109323A3 (en) 2023-03-01
JP2022120100A (ja) 2022-08-17
US20220318503A1 (en) 2022-10-06
EP4109323A2 (en) 2022-12-28
KR20220077898A (ko) 2022-06-09
CN113779201A (zh) 2021-12-10

Similar Documents

Publication Publication Date Title
CN112749344B (zh) 信息推荐方法、装置、电子设备、存储介质及程序产品
JP2023529939A (ja) マルチモーダルpoi特徴の抽出方法及び装置
CN113836314B (zh) 知识图谱构建方法、装置、设备以及存储介质
WO2022174496A1 (zh) 基于生成模型的数据标注方法、装置、设备及存储介质
CN113407610B (zh) 信息抽取方法、装置、电子设备和可读存储介质
CN112818686A (zh) 领域短语挖掘方法、装置和电子设备
CN113220835A (zh) 文本信息处理方法、装置、电子设备以及存储介质
JP7369228B2 (ja) ユーザ興味画像の生成方法、装置、電子機器及び記憶媒体
CN112632227A (zh) 简历匹配方法、装置、电子设备、存储介质和程序产品
CN112560425B (zh) 模板生成方法、装置、电子设备及存储介质
CN113779201B (zh) 用于识别指令的方法、装置以及语音交互屏幕
CN116049370A (zh) 信息查询方法和信息生成模型的训练方法、装置
CN108733702B (zh) 用户查询上下位关系提取的方法、装置、电子设备和介质
CN115048523A (zh) 文本分类方法、装置、设备以及存储介质
CN114417862A (zh) 文本匹配方法、文本匹配模型的训练方法和装置
CN114138976A (zh) 数据处理与模型训练方法、装置、电子设备和存储介质
CN113641724A (zh) 知识标签挖掘方法、装置、电子设备及存储介质
CN112784600A (zh) 信息排序方法、装置、电子设备和存储介质
CN113377921B (zh) 用于匹配信息的方法、装置、电子设备以及介质
CN113377922B (zh) 用于匹配信息的方法、装置、电子设备以及介质
CN112925912B (zh) 文本处理方法、同义文本召回方法及装置
CN116383491B (zh) 信息推荐方法、装置、设备、存储介质和程序产品
CN114861062B (zh) 信息过滤方法和装置
CN113032540B (zh) 人机交互方法、装置、设备和存储介质
CN113343047A (zh) 数据处理方法、数据检索方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant