CN111192579B - 信息处理方法、信息控制中心设备及计算机可读存储介质 - Google Patents

信息处理方法、信息控制中心设备及计算机可读存储介质 Download PDF

Info

Publication number
CN111192579B
CN111192579B CN201911396185.1A CN201911396185A CN111192579B CN 111192579 B CN111192579 B CN 111192579B CN 201911396185 A CN201911396185 A CN 201911396185A CN 111192579 B CN111192579 B CN 111192579B
Authority
CN
China
Prior art keywords
time
specified
date
tentative
designated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911396185.1A
Other languages
English (en)
Other versions
CN111192579A (zh
Inventor
林永楷
樊帅
杨鹏
徐瑞婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sipic Technology Co Ltd
Original Assignee
Sipic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sipic Technology Co Ltd filed Critical Sipic Technology Co Ltd
Priority to CN201911396185.1A priority Critical patent/CN111192579B/zh
Publication of CN111192579A publication Critical patent/CN111192579A/zh
Priority to EP20909397.0A priority patent/EP4086895A4/en
Priority to JP2022540600A priority patent/JP7502449B2/ja
Priority to PCT/CN2020/127639 priority patent/WO2021135652A1/zh
Priority to US17/758,051 priority patent/US20230032792A1/en
Application granted granted Critical
Publication of CN111192579B publication Critical patent/CN111192579B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G04HOROLOGY
    • G04GELECTRONIC TIME-PIECES
    • G04G13/00Producing acoustic time signals
    • G04G13/02Producing acoustic time signals at preselected times, e.g. alarm clocks
    • GPHYSICS
    • G04HOROLOGY
    • G04GELECTRONIC TIME-PIECES
    • G04G13/00Producing acoustic time signals
    • G04G13/02Producing acoustic time signals at preselected times, e.g. alarm clocks
    • G04G13/021Details
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/34Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Electric Clocks (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种信息处理方法、信息控制中心设备及计算机可读存储介质,所述方法包括:获得对应声音信号的语义解析信息,所述语义解析信息包含指定时间;基于当前时间对所述指定时间进行时间推测,确定意图时间;基于所述意图时间生成对应声音信号的目标指令;应用本发明实施例提供的方法,信息控制中心设备能够处理复杂且多样化的声音信号,语义解析信息能够提取到声音信号中的指定时间和目标意图,通过指定时间对语义解析信息进行时间推测,能够更准确地处理声音信号中提供的指定时间,使语音交互过程更加准确。

Description

信息处理方法、信息控制中心设备及计算机可读存储介质
技术领域
本发明涉及语音处理技术领域,尤其涉及一种信息处理方法、信息控制中心设备及计算机可读存储介质。
背景技术
区别于传统只能手动设置闹铃和时间的闹钟,智能闹钟能够通过语音交互的方式实现闹钟任务的设置。但目前,由于客户端本身数据处理能力的限制,客户端难以理解用户的真正意图设置的时间,用户在通过语音交互设置时间时,需要准确地提供时间的日期和时刻,客户端才能设置对应的任务,影响用户体验。
发明内容
本发明实施例提供了一种信息处理方法、信息控制中心设备及计算机可读存储介质,能够对声音信号中的时间进行时间推断,确定符合需求的意图时间。
本发明一方面提供一种信息处理方法,所述方法应用于信息控制中心设备,所述方法包括:获得对应声音信号的语义解析信息,所述语义解析信息包含指定时间;基于当前时间对所述指定时间进行时间推测,确定意图时间;基于所述意图时间生成对应声音信号的目标指令。
在一可实施方式中,所述基于所述当前时间对所述指定时间进行时间推测,确定意图时间,包括:判断所述指定时间是否包括指定时刻,获得第一判断结果;当所述第一判断结果判断为所述指定时间包括指定时刻时,判断所述指定时间是否包括指定日期,获得第二判断结果;当所述第二判断结果判断为所述指定时间包括指定日期时,判断所述指定日期是否晚于当前日期,获得第三判断结果;当所述第三判断结果判断为所述指定日期晚于当前日期时,将所述指定时刻和指定日期确定为意图时间。
在一可实施方式中,所述方法还包括:当所述第二判断结果判断为所述指定时间不包括指定日期时,将所述当前日期确定为暂定日期;将所述暂定日期和所述指定时刻确定为暂定时间;判断所述暂定时间是否不早于当前时间,获得第四判断结果;当第四判断结果判断为所述暂定时间不早于当前时间时,将所述暂定时间确定为意图时间。
在一可实施方式中,所述方法还包括:当所述第四判断结果判断为所述暂定时间早于当前时刻时,基于时间就近原则对所述暂定时间进行校正,获得校正时间;将所述校正时间确定为意图时间。
在一可实施方式中,时间就近原则包括如下原则至少之一:用于校正暂定时刻的第一原则、用于校正暂定日期的第二原则、用于校正暂定时间的第三原则。
在一可实施方式中,所述方法还包括:判断所述指定时刻是否包括指定时段,获得第五判断结果;当所述第五判断结果判断为所述指定时刻包括指定时段,基于时刻转换规则将所述指定时刻进行类型转换,获得转换时刻;所述转换时刻用于确定所述暂定时间,所述转换时刻不包括指定时段,且所述转换时刻与所述指定时刻用于表征同一时间。
在一可实施方式中,所述时刻转换规则包括如下至少之一:用于转换时刻类型的第一转换规则、用于校正口误的第二转换规则和用于处理时刻临界点的第三转换规则。
在一可实施方式中,在判断所述指定时间是否包括指定时刻之前,所述方法还包括:基于语义解析信息获得指定时间;验证所述指定时间是否符合时间规律,获得验证结果;当所述验证结果验证为所述指定时间符合时间规律,判断所述指定时间是否包括指定时刻。
本发明一方面提供一种信息控制中心设备,所述设备包括:获得模块,用于获得对应声音信号的语义解析信息,所述语义解析信息包含指定时间;推测模块,用于基于当前时间对所述指定时间进行时间推测,确定意图时间;生成模块,用于基于所述意图时间生成对应声音信号的目标指令。
在一可实施方式中,所述推测模块,包括:第一判断子模块,用于判断所述指定时间是否包括指定时刻,获得第一判断结果;第二判断子模块,用于当所述第一判断结果判断为所述指定时间包括指定时刻时,判断所述指定时间是否包括指定日期,获得第二判断结果;第三判断子模块,用于当所述第二判断结果判断为所述指定时间包括指定日期时,判断所述指定日期是否晚于当前日期,获得第三判断结果;确定子模块,用于当所述第三判断结果判断为所述指定日期晚于当前日期时,将所述指定时刻和指定日期确定为意图时间。
在一可实施方式中,所述确定子模块,还用于当所述第二判断结果判断为所述指定时间不包括指定日期时,将所述当前日期确定为暂定日期;所述确定子模块,还用于将所述暂定日期和所述指定时刻确定为暂定时间;所述推测模块,还包括:第四判断子模块,用于判断所述暂定时间是否不早于当前时间,获得第四判断结果;所述确定子模块,还用于当第四判断结果判断为所述暂定时间不早于当前时间时,将所述暂定时间确定为意图时间。
在一可实施方式中,所述推测模块,还包括:校正子模块,用于当所述第四判断结果判断为所述暂定时间早于当前时刻时,基于时间就近原则对所述暂定时间进行校正,获得校正时间;所述确定模块,还用于将所述校正时间确定为意图时间。
在一可实施方式中,所述推测模块,还包括:第五判断子模块,用于判断所述指定时刻是否包括指定时段,获得第五判断结果;转换子模块,用于当所述第五判断结果判断为所述指定时刻包括指定时段,基于时刻转换规则将所述指定时刻进行类型转换,获得转换时刻;所述转换时刻用于确定所述暂定时间,所述转换时刻不包括指定时段,且所述转换时刻与所述指定时刻用于表征同一时间。
在一可实施方式中,所述获得模块,还用于基于语义解析信息获得指定时间;所述设备还包括:验证模块,用于验证所述指定时间是否符合时间规律,获得验证结果;当所述验证结果验证为所述指定时间符合时间规律,判断所述指定时间是否包括指定时刻。
本发明另一方面提供一种计算机可读存储介质,所述存储介质包括一组计算机可执行指令,当所述指令被执行时用于执行上述任一项所述的信息处理方法。
本发明实施例提供的信息处理方法、信息控制中心设备及计算机可读存储介质,信息控制中心设备应用本发明实施例提供的信息处理方法,能够处理复杂且多样化的声音信号,语义解析信息能够提取到声音信号中的指定时间,通过指定时间对语义解析信息进行时间推测,能够更准确地处理声音信号中提供的指定时间,使语音交互过程更加准确。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1为本发明实施例一种信息处理方法的实现流程示意图;
图2为本发明实施例一种信息处理方法时间推断的实现流程示意图。
图3为本发明实施例一种信息处理方法时刻转换的实现流程示意图。
图4为本发明实施例一种信息处理方法时间规律验证的实现流程示意图。
图5为本发明实施例应用信息处理方法的场景示意图;
图6为本发明实施例应用信息处理方法的场景中时间推断的流程示意图;
图7为本发明实施例一种信息控制中心设备的实现模块示意图。
具体实施方式
为使本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一种信息处理方法的实现流程示意图。
参见图1,本发明实施例一方面提供一种信息处理方法,方法应用于信息控制中心设备,方法包括:步骤101,对应声音信号的语义解析信息,语义解析信息包含指定时间;步骤102,基于当前时间对指定时间进行时间推测,确定意图时间;步骤103,基于意图时间生成对应声音信号的目标指令。
本实施例提供的信息处理方法应用在信息控制中心设备,能够处理复杂、多样化的声音信号,声音信号经过语音识别和语义解析,获得的语义解析信息中包括指定时间和指定任务,其中,指定任务为声音信号中对应的目标意图;指定时间为声音信号中对应执行目标意图的执行时间。当指定时间不准确时,通过当前时间对指定时间进行时间推测,能够准确地确定指定任务对应的意图时间,信息控制中心设备能够依据意图时间设定目标指令,在指示客户端在意图时间执行用户的指定任务,使语音交互对应的结果更加准确。
信息控制中心设备选为具有数据处理能力的设备,本实施例中,信息控制中心选为云服务器,通过云服务器对声音信号进行语音处理,可以较大程度降低对客户端硬件的要求,并且不需要在客户端进行复杂的语义规则定制工作,在云服务器进行语义升级时,也不需要更新客户端。本实施例客户端为与信息控制中心设备信号传输的终端,且客户端具有执行目标指令的对应功能,即目标指令可以根据客户端的功能进行设置,客户端选为闹钟。
本方法包括获得对应声音信号的语义解析信息,语义解析信息包含指定时间。声音信号可以通过音频采集装置进行采集。本实施例中,进行声音信号采集的音频采集装置选用由一定数量的麦克风组成的麦克风阵列,麦克风阵列装设在客户端上。语义解析信息为声音信号经过语音识别处理和语义解析处理后得到的信号。进一步的,麦克风阵列通过信号处理算法进行声音信号的采集,能够识别声源的方向,同时还能够一定程度的将背景声音清除掉,进而提升后续的语音识别的准确性。利用网络传送将声音信号到信息控制中心设备,信息控制中心设备通过ASR语音识别技术对声音信号进行语音识别,ASR语音识别技术能够将获取到的声音信号转化为语音对应的文本信息,本方法中,ASR语音识别技术基于家居环境下的声学模型与语言模型进行训练,能够更适应家居场景,在嘈杂场景下也能够对声音信号进行准确识别,获得准确的文本信息。文本信息通过语义解析模块进行语义解析,语义解析模块能够将文本信息解析为语义解析信息,比如在一种情况下,文本信息为“七点提醒我买火车票”将会被解析为以下语义解析信息,语义解析信息以实体结构进行体现{时间=07:00,提醒事件=买火车票,任务对象=提醒};在另一种情况下,文本信息为“五点的闹钟”,将会被解析为以下结构{时间=05:00,任务对象=闹钟}。
本方法还包括基于当前时间对指定时间进行时间推测,确定意图时间。语义解析模块将语义解析信息发送至对话管理系统,对话管理系统用于基于指定时间对语义解析信息进行时间推测,获得意图时间。不直接将语义解析信息返回给客户端,能够避免客户端需要多次向信息控制中心设备发起请求,进而提升客户端的性能与响应时间。
可以理解的是,用于生成目标指令的意图时间需要包含日期信息、时刻信息。其中,由于时刻信息存在12小时制和24小时制,时刻信息还包括时段信息和小时信息。例如,一个满足意图时间准确性要求的时间信息包含{日期=20190305,时段=下午,小时=5:00}。
而由声音信号解析的指定时间通常只有小时信息,不会完全满足上述要求。因此,需要基于当前时间对指定时间进行时间推断,以获得满足意图时间需要的时间信息。例如:当语义解析信息中获得的指定时间为{小时=5:00},基于当前时间对指定时间进行时间推断,当前时间为{日期=20190305,时段=下午,小时=4:00},则获得的意图时间为{日期=20190305,时段=下午,小时=17:00}。即选取离当前时间最近、且能够符合指定时间描述的未来时间作为意图时间。
本方法还包括基于意图时间生成对应声音信号的目标指令。根据指定任务和意图时间,能够生成对应声音信号的目标指令。目标指令用于指示执行声音信号中的指定任务。例如,当声音信号为“7:00提醒我买火车票”,信息控制中心设备根据语义解析获得的语义解析信息中,指定时间为“7:00”,任务对象为“提醒”,提醒事件为“买火车票”,对指定时间为“7:00”进行时间推断,基于时间就近原则,确定当前时间为“2019年12月26日,8点”,则确定意图时间为“2019年12月27日,7:00”。然后生成对应意图时间为“2019年12月27日,7:00”,任务对象为“提醒”,提醒事件为“买火车票”的目标指令,并将目标指令发送至客户端,以使客户端在2019年12月27日7:00,通过语音播报提醒购买火车票。需要说明的是,接收目标指令的对象不限于客户端,当目标指令的指定任务为对信息控制中心设备进行更改时,目标指令的接收对象为信息控制中心设备;当目标指令的指定任务为对第三方终端进行控制时,目标指令的接收对象还可以为第三方终端。
具体的,本方法还包括,根据意图时间和指定任务生成任务指令,根据意图时间进行语音合成处理,得到对应指定任务的音频信号;将任务指令和音频信号确定成目标指令;将目标指令发送至客户端,以使客户端执行任务指令和播报音频信号。
在获得意图时间后,通过对话管理模块对意图时间和指定任务进行处理,从而获得包括音频信号和任务指令的目标指令,然后将目标指令发送至客户端,客户端通过解析目标指令,执行任务指令和播报音频信号,形成与用户的语音交互。具体的,对话管理系统在收到意图时间后,将会根据对话的状态,通过语音合成技术返回不一样的音频回复信息,比如对话管理系统收到下意图时间为{日期=20190305,时段=下午,小时=05:00,任务对象=闹钟}时,将会下放设置闹钟的任务指令给客户端,同时生成一条文本回复“五点的闹钟设置成功”,该本文回复通过语音合成技术合成音频信号发送给客户端,由于闹钟已经设置成功,对话管理系统也会在返回的数据中包含对话结束的状态。
图2为本发明实施例一种信息处理方法时间推断的实现流程示意图。
参见图2,在本发明实施例中,步骤102,基于当前时间对指定时间进行时间推测,确定意图时间,包括:步骤1021,判断指定时间是否包括指定时刻,获得第一判断结果;步骤1022,当第一判断结果判断为指定时间包括指定时刻时,判断指定时间是否包括指定日期,获得第二判断结果;步骤1023,当第二判断结果判断为指定时间包括指定日期时,判断指定日期是否晚于当前日期,获得第三判断结果;步骤1024,当第三判断结果判断为指定日期晚于当前日期时,将指定时刻和指定日期确定为意图时间。
可以理解的是,通过语义解析得到的指定时间可能包括以下两种情况,一种情况下,解析信息中存在指定时间;另一种情况下,解析信息中不存在指定时间。当解析信息中不存在指定时间时,设备无法生成具有意图时间和指定任务的目标指令,需要通过语音合成技术进行多轮对话交互,以获取指定时间。具体的,当解析信息中不存在指定时间时,信息控制中心设备可以生成询问指令,并发送至客户端,询问指令以语音合成技术生成,通过客户端进行播报,用于询问指定时间。例如“您希望过多久提醒您呢?”然后再次采集声音信号,通过语音识别和语义分析该声音信号,获得该声音信号中的补充时间,补充时间用于对指定时间进行补充,可以将补充时间确定为指定时间。
例如,当声音信号为”设置闹钟“时,语义解析信息为{任务对象=闹钟,操作=设置},不存在指定时间,对话管理系统将会生成一条文本回复“好的,你想设置几点的闹钟”经过语音合成技术将文本转成音频后发送给客户端,同时将对话状态还未结束的信息也返回给客户端,客户端将会在播放这条音频后,通过麦克风阵列收集用户的声音信息以确定闹钟的指定时间。
进一步的,当解析信息中存在指定时间时,指定时间中可能包括指定日期和指定时刻。当语义解析信息中不存在指定时刻时,设备无法确定执行指定任务的指定时间,为将上述情况进行区分,需要判断指定时间是否包括指定时刻。当第一判断结果判断为语义解析信息中不存在指定时刻时,设备需要通过语音合成技术进行多轮对话交互,以获取包含指定时间的指定时间。
当第一判断结果判断为语义解析信息中存在指定时刻时,进一步判断指定时间是否包括指定日期,以获得第二判断结果。一种情况下,第二判断结果为指定时间包括指定日期;另一种情况下,指定时间不包括指定日期。当判断为指定时间包括指定日期时,需要判断指定日期是否晚于当前日期,获得第三判断结果。当第三判断结果判断为指定日期晚于当前日期,将指定时刻和指定日期确定为意图时间。
当第三判断结果判断为指定日期不晚于当前日期,且指定日期早于当前日期,则指定时间早于当前日期,设备无法在过去的时间指示执行指定任务,因此可以判定该语义解析信息无效,或通过语音合成技术生成语音,通过进行多轮对话交互,以再次获取指定时间。当第三判断结果判断为指定日期不晚于当前日期,且指定时期和当前日期为同一日,则需要对指定时刻进行进一步比较以进行推测,如步骤10211所示,当第三判断结果不晚于当前日期,且与当前日期相同,将指定日期确定为暂定日期。
在本发明实施例中,方法还包括:步骤1025,当第二判断结果判断为指定时间不包括指定日期时,将当前日期确定为暂定日期;步骤1026,将暂定日期和指定时刻确定为暂定时间;步骤1027,判断暂定时间是否不早于当前时间,获得第四判断结果;步骤1028,当第四判断结果判断为暂定时间不早于当前时间时,将暂定时间确定为意图时间。
将当前日期确定为指定日期后,此处的指定日期与上述第三判断结果判断为指定时期和当前日期为同一日,该情况下的指定日期相同,即均是指定时期和当前日期为同一日,以下可以采用相同方法进行比较判断。即,在指定时期和当前日期为同一日时,将当前日期确定为暂定日期,并将暂定日期和指定时刻确定为暂定时间,判断暂定时间是否不早于当前时间,获得第四判断结果。根据第四判断结果确定意图时间。当第四判断结果判断为暂定时间不早于当前时间时。即设备能够对应暂定时间的目标指令,用于指示在暂定时间执行指定任务,即可将暂定时间确定为意图时间。需要补充的是,在一种特殊情况下,暂定时间和当前时间相同,此时同样可以生成目标指令并指示在意图时间执行指定任务,即此时意图时间与当前时间相同。
在本发明实施例中,方法还包括:步骤1029,当第四判断结果判断为暂定时间早于当前时刻时,基于时间就近原则对暂定时间进行校正,获得校正时间;步骤10210,将校正时间确定为意图时间。
当第四判断结果判断为暂定时间早于当前时刻时,如果仍然将暂定时间确定为意图时间,会导致意图时间早于当前时间,设备无法指示客户端在意图时间指示执行指定任务,不符合时间规律。因此,设备需要对暂定时间进行校正,使校正时间不早于当前时间,进而使设备能够指示客户端在意图时间执行指定任务。时间就近原则用于将意图时间确定为最接近当前时间且满足指定时间描述的未来时间。
图3为本发明实施例一种信息处理方法时刻转换的实现流程示意图。
参见图3,在本发明实施例中,方法还包括:步骤301,判断指定时刻是否包括指定时段,获得第五判断结果;步骤302,当第五判断结果判断为指定时刻包括指定时段,基于时刻转换规则将指定时刻进行类型转换,获得转换时刻;步骤303,转换时刻用于确定暂定时间,转换时刻不包括指定时段,且转换时刻与指定时刻用于表征同一时间。
由于从声音信号中获得的指定时刻存在有24小时制和12小时制两种类型。且不同的人对于时段的理解方式是不同的,比如晚上0:00有的人可能是表示为第二天0:00,有的人可能表示为24:00,12:30有的人可能表示00:30。为方便暂定时间的比较,需要将指定时刻转换为24小时制,同理,获取的当前时刻也选为24小时制。需要理解的是,该步骤可以在判断指定时刻是否不早于当前时刻的任一在先步骤时进行。进一步需要补充的是,当前时刻可以为信息控制中心设备从客户端采集的当前时刻,也可以为信息控制中心设备从网络上采集的时区标准时间。
具体的,在12小时制的表述中通常包括时段和小时,如“上午7:00”,其中指定时段指代如“上午”、“下午”等用于进行时段表示的词。当获得指定时刻后,判断指定时刻中是否包括指定时段,如果包括指定时段,则认为指定时刻采用的是12小时制的表述方式,需要对指定时刻进行转换,以获得用24小时制进行表述的指定时刻。
转换规则具体包括:用于将指定时刻24小时化的第一转换规则、用于校正口误的第二转换规则和用于处理日期临界点的第三转换规则。需要补充的是,为了方便比较,在进行24小时制转换后,仍然保留时段信息,且时段信息根据小时信息进行调整。
其中,用于将指定时刻24小时化的第一转换规则可以为:
1、如果指定小时在1:00与12:00之间,并且指定时段为中午、下午或晚上及其同义词,则将指定小时加12小时,获得24小时制的转换时刻。例如“下午,7:00”转换为“下午,19:00”。
2、如果指定小时在1:00到日出时间之间(比如6:00),并且指定时段为白天及其同义词,则指定小时加12小时,获得24小时制的转换时刻,日出时间可以根据不同区域的进行动态调整。例如“白天,3:00”转换为“下午,15:00”。
3、如果指定小时在日落时间到12:00之间,并且指定时段为晚上及其同义词,则需要将指定小时数12小时,获得24小时制的转换时刻,日落时间可以根据不同区域的进行动态调整。例如“晚上,10:00”转换为“晚上,22:00”。
用于校正口误的第二转换规则可以为:
1、如果指定小时在0:00到日出时间之间,并且指定时段为晚上及其同义词,则重置指定时段为凌晨,将指定小时确定为转换小时,并且设置异常标识,后续通过时间就近原则进行重新确定。例如“晚上,1:00”转换为“凌晨,1:00,异常”。
2、如果指定小时大于12:00,并且指定时段为早上、上午或者凌晨及其同义词,则需要将指定时段重置,将指定小时确定为转换小时,并且设置异常标识,避免口误或者误识别产生影响。例如:“上午,15:00”转换为“下午,15:00,异常”。
用于处理时刻临界点的第三转换规则可以为:
1、如果指定小时等于24:00则需要将指定小时设置0:00,重置指定时段为凌晨,并且设置异常标识。例如“24:00”转换为“凌晨,0:00,异常”。
2、如果指定小时等于12:00,并且指定时段为晚上或者凌晨及其同义词,需要将小时数设置0:00,重置指定时段为凌晨,并且设置异常标识。例如“晚上,12:00”转换为“凌晨,0:00,异常”。
在本发明实施例中,时间就近原则包括如下原则至少之一:用于校正暂定时刻的第一原则、用于校正暂定日期的第二原则、用于校正暂定时间的第三原则。需要理解的是,暂定时间包括暂定时刻、暂定日期和暂定小时三个部分。由暂定时间进行校正获得的校正时间同样包括校正时刻、校正日期和校正小时三个部分。
用于校正暂定时刻的第一原则可以为:
1、当暂定小时不包含暂定时段,且暂定小时小于12:00时,将暂定小时增加12小时,获得预设时间;判断预设时间是否不早于当前时间,当预设时间不早于当前时间,将预设时间确定为校正时间;当预设时间早于当前时间,取消对暂定时间的校正。
用于校正暂定日期的第二原则可以为:
1、当暂定时间有异常标识,并且暂定小时小于或等于6:00时,将当前日期的第二天确定为校正日期。
2、当暂定小时不包含暂定时段,且暂定小时小于12:00时,将当前日期的第二天确定为校正日期。
3、当暂定小时位于12:00到24点之间,并且对应的声音信号中不包括指定日期,将当前日期的第二天确定为校正日期。
4、当暂定时段和暂定小时均明确,并且对应的声音信号中不包括指定日期,将当前日期的第二天确定为校正日期。
5、当暂定日期晚于当前日期,并且具有异常标识,将当前日期的第二天确定为校正日期。
用于校正暂定时间的第三原则可以为:
1、当暂定小时是12:00,并且暂定时间早于当前时间时,将暂定小时校正为0:00,将0:00确定为校正小时,将当前日期的第二天确定为校正日期。
当暂定小时已经是24小时制时,如果暂定时间仍然小于当前时间,则说明我们应该进一步校正暂定日期,比如在当前时间为“晚上七点”时,采集的声音信号为“下午五点的闹钟”,即便通过转换将时间“下午五点”转换为“17:00”,仍然需要依据时间就近原则对暂定日期进行+1天的操作。
图4为本发明实施例一种信息处理方法时间规律验证的实现流程示意图。
参见图4,在本发明实施例中,在判断指定时间是否包括指定时刻之前,方法还包括:步骤401,基于语义解析信息获得指定时间;步骤402,验证指定时间是否符合时间规律,获得验证结果;步骤403,当验证结果验证为指定时间符合时间规律,判断指定时间是否包括指定时刻。
为了对于不合理的时间给出提示,例如“二月三十五号四十六点的闹钟”,包含不存在的指定日期与指定时刻。在验证指定时间是否包括指定时刻之前,本方法还包括对指定时间进行是否符合时间规律的验证。具体的,验证指定时间的格式内容是否合理,当判断为指定时间的格式内容合理时,判断指定时间是否包括指定时刻。需要补充的是,当指定时间不存在指定日期和/或指定时刻,判断为指定时间的格式内容合理。当判断为指定时间的格式内容不合理时,通过对话管理系统合成音频信号,通过客户端进行询问,以获得合理的指定时间。
进一步进行补充的是,当客户端为闹钟时,根据闹钟的功能,语义解析信息中包括的指定任务用于生成目标指令,指定任务的类型包括如下至少之一:用于表征闹铃任务的第一类型、用于表征提醒任务的第二类型、用于表征备忘任务的第三类型、用于表征计时任务的第四类型。根据闹钟的功能,指定任务包括但不限于以上四种,指定任务还可以是用于表征删除的第五类型等等,以下不做赘述。
以下提供几种具体实施场景进行说明。
当采集到声音信号为“设置五点的闹钟”,信息控制中心设备经过时间推测,如果当前时间在下午五点以后,会生成对应明天早上五点的闹钟的目标指令;如果当前时间在下午五点以前,将生成对应当天下午五点的闹钟的目标指令。
对于用于表征闹铃任务的第一类型任务,为了进一步方便用户设置多个任务,信息控制中心设备通过语义解析,确定指定任务为普通单次任务或周期型任务。任务可以指代闹钟。一种周期型任务可以是根据星期进行重复响铃,比如当用户说“每周一到周三早上八点叫我起床”,设备会生成一条重复周期型的闹钟设置命令{TIME=08:00,REPEAT=W1|W2|W3,对象=闹钟}。另一种周期型任务可以是根据日期进行重复响应,比如当用户说“八月一号到十号每天早上八点叫我起床”时,设备会生成对应的闹钟设置指令{TIME=08:00,REPEAT=20190801<20190810,对象=闹钟}。
对于用于表征备忘任务的第三类型任务。用户在说“设置备忘”后,设备会提示用户“请告诉我备忘的内容”,接着用户就可以把备忘的内容记录在设备或客户端中。
对应用于表征计时任务的第四类型任务。比如当指定任务为“用倒计时设置跨年时间”时,采集到声音信号为“零点的倒计时”,或者说“设置新年倒计时”,就能够生成对于零点或新年的目标指令。
提醒任务与闹钟任务的区别通过语义解析信息是否带有提醒事件或者明显的提醒关键词来判断的,比如“五点叫我”语义解析的结果是{时间=05:00,对象=闹钟},“五点提醒我开会”的语义解析则是{时间=05:00,对象=日程,事项=开会},通过对解析对象的区别,信息控制中心设备能够同时理解闹钟、提醒、备忘、倒计时四种时间相关的功能所涉及到的语义槽,并根据对话状态与策略返回不同的对话状态以及回复文本。
设置过的闹钟与提醒,尤其是周期型的闹钟,在一些场景用户需要可以删除特定的闹钟,这样的操作同样可以通过语音进行操作。比如删除闹钟,删除提醒,删除备忘,取消倒计时等。删除的操作能够支持带条件的删除特定闹钟。比如原来有设置了明天后天的闹钟各3个,用户可能通过以下说法进行删除。语音输入“删除明天的闹钟”对应语义{操作=删除,日期=20190817}。或者“删除明天早上的闹钟”对应语义{操作=删除,日期=20190817,时间=06:00<12:00}。又或者“删除明天早上八点到十点之间的闹钟”对应语义{操作=删除,日期=20190817,时间=08:00<08:00}。为了方便对闹钟或其他任务进行区分,在设定任务时,对任务进行特定ID的命名,并进行存储。
设备在收到这些声音信号时,通过查询云端记录的闹钟记录,返回带有闹钟ID的目标指令给设备端,由客户端删除掉闹钟,这样就有效的避免了客户端需要针对用户的说法对闹钟进行查询过滤再删除的过程。
图5为本发明实施例应用信息处理方法的场景示意图;图6为本发明实施例应用信息处理方法的场景中时间推断的流程示意图。
参见图5和图6,为方便上述实施例的理解,以下提供一个整体流程场景进行解释。
该场景包括客户端501和信息控制中心设备502,客户端501和信息控制中心设备502进行通信连接。客户端501上设置有麦克风阵列5011和用于执行指定任务的执行模块5012。信息控制中心设备502包括自动语音识别(Automatic Speech Recognition,ASR)模块5021、自然语言理解(Natural Language Understanding,NLU)模块5022、对话管理(Dialog Management,DM)模块5023、文本转音频(Text To Speech,TTS)模块5024。NLP模块用于进行语义分析。DM模块还包括时间推测子模块50231。
客户端通过麦克风阵列采集声音信号,并将声音信号发送至信息控制中心设备,信息控制中心设备将声音信号通过ASR模块进行语音识别,获得文本信息,再将文本信息结果NLU模块进行语义解析,获得对应声音信号的语义解析信息。将语音解析信息通过时间推测子模块进行推测。
首先,从语义解析信息中获取指定时间,指定时间包括指定日期和指定时刻。然后对指定日期和指定时刻是否符合时间规律进行验证。当不符合时间规律时,通过DM模块进行多轮对话进一步获取符合规律的指定时间。当符合时间规律时,判断语义解析信息是否包括了指定时刻。当判断为语义解析信息没有包括指定时刻,通过DM模块进行多轮对话进一步获取指定时刻。当判断为语义解析信息包括指定时刻,判断语音解析信息是否包括指定日期,当判断为语义解析信息不包括指定日期,则将暂定日期设置为当前日期。当判断为语义解析信息包括指定日期,判断指定日期是否早于当前日期,当判断为指定日期早于当前日期,结束时间推测,将该结果返回至客户端,并通过DM模块生成音频信号进行语音播报。当判断为指定日期不早于当前日期,判断指定日期是否晚于当前日期,当判断为指定日期晚于当前日期,对指定日期进行标识,以注明该日期属于未来日期。当判断为指定日期不晚于当前日期,不进行标识。然后,判断指定时刻是否包括指定时段和指定小时,当判断为指定时刻包括指定时段和指定小时,通过时刻转换对指定时刻进行转换,获得转换时刻,将指定日期和转换时刻确定为暂定时间,当判断为指定时刻不包指定时段,将指定日期和指定时刻确定为暂定时间。判断暂定时间是否早于当前时间。当判断为暂定时间早于当前时间,基于时间就近原则对暂定日期进行校正,获得意图时间。然后基于意图时间中的意图时刻生成意图时段,将包括意图日期、意图时段和意图小时的意图时间通过对话管理系统进行转换,获得目标指令,目标指令包括音频信号和指定任务,将目标指令发送至客户端,客户端通过执行模块执行指定任务,并播报对应音频信号的音频。
图7为本发明实施例一种信息控制中心设备的实现模块示意图。
本发明实施例一方面提供一种信息控制中心设备,设备包括:获得模块701,用于获得对应声音信号的语义解析信息,语义解析信息包含指定时间;推测模块702,用于基于当前时间对指定时间进行时间推测,确定意图时间;生成模块703,用于基于意图时间生成对应声音信号的目标指令。
在本发明实施例中,推测模块702,包括:第一判断子模块7021,用于判断指定时间是否包括指定时刻,获得第一判断结果;第二判断子模块7022,用于当第一判断结果判断为指定时间包括指定时刻时,判断指定时间是否包括指定日期,获得第二判断结果;第三判断子模块7023,用于当第二判断结果判断为指定时间包括指定日期时,判断指定日期是否晚于当前日期,获得第三判断结果;确定子模块7024,用于当第三判断结果判断为指定日期晚于当前日期时,将指定时刻和指定日期确定为意图时间。
在本发明实施例中,确定子模块7024,还用于当第二判断结果判断为指定时间不包括指定日期时,将当前日期确定为暂定日期;确定子模块7024,还用于将暂定日期和指定时刻确定为暂定时间;推测模块,还包括:第四判断子模块7025,用于判断暂定时间是否不早于当前时间,获得第四判断结果;确定子模块7024,还用于当第四判断结果判断为暂定时间不早于当前时刻时,将暂定时间确定为意图时间。
在本发明实施例中,推测模块702,还包括:校正子模块7026,用于当第四判断结果判断为暂定时间早于当前时刻时,基于时间就近原则对暂定时间进行校正,获得校正时间;确定子模块7024,还用于将校正时间确定为意图时间。
在本发明实施例中,推测模块702,还包括:第五判断子模块7027,用于判断指定时刻是否包括指定时段,获得第五判断结果;转换子模块7028,用于当第五判断结果判断为指定时刻包括指定时段,基于时刻转换规则将指定时刻进行类型转换,获得转换时刻;转换时刻用于确定暂定时间,转换时刻不包括指定时段,且转换时刻与指定时刻用于表征同一时间。
在本发明实施例中,获得模块701,还用于基于语义解析信息获得指定时间;设备还包括:验证模块704,用于验证指定时间是否符合时间规律,获得验证结果;当验证结果验证为指定时间符合时间规律,判断指定时间是否包括指定时刻。
本发明另一方面提供一种计算机可读存储介质,所述存储介质包括一组计算机可执行指令,当所述指令被执行时用于执行上述任一项所述的信息处理方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种用于闹钟的信息处理方法,其特征在于,所述方法应用于云服务器,所述闹钟与云服务器通信连接,所述方法包括:
接收来自闹钟采集的声音信号;
对所述声音信号进行语音识别和语义解析,获得对应所述声音信号的语义解析信息,基于所述语义解析信息获得指定时间;
验证所述指定时间是否符合时间规律,获得验证结果;
当所述验证结果验证为所述指定时间不符合时间规律时,通过语音合成技术进行多轮对话交互,获取符合时间规律的指定时间;
基于当前时间对所述指定时间进行时间推测,确定意图时间;
基于所述意图时间生成对应声音信号的目标指令;
发送目标指令至所述闹钟,使所述闹钟执行对应的指定任务。
2.根据权利要求1所述的方法,其特征在于,所述基于所述当前时间对所述指定时间进行时间推测,确定意图时间,包括:
判断所述指定时间是否包括指定时刻,获得第一判断结果;
当所述第一判断结果判断为所述指定时间包括指定时刻时,判断所述指定时间是否包括指定日期,获得第二判断结果;
当所述第二判断结果判断为所述指定时间包括指定日期时,判断所述指定日期是否晚于当前日期,获得第三判断结果;
当所述第三判断结果判断为所述指定日期晚于当前日期时,将所述指定时刻和指定日期确定为意图时间。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
当所述第二判断结果判断为所述指定时间不包括指定日期时,将所述当前日期确定为暂定日期;
将所述暂定日期和所述指定时刻确定为暂定时间;
判断所述暂定时间是否不早于当前时间,获得第四判断结果;
当第四判断结果判断为所述暂定时间不早于当前时间时,将所述暂定时间确定为意图时间。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
当所述第四判断结果判断为所述暂定时间早于当前时刻时,基于时间就近原则对所述暂定时间进行校正,获得校正时间;
将所述校正时间确定为意图时间。
5.根据权利要求4所述的方法,其特征在于,所述时间就近原则包括如下原则至少之一:用于校正暂定时刻的第一原则、用于校正暂定日期的第二原则、用于校正暂定时间的第三原则。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
判断所述指定时刻是否包括指定时段,获得第五判断结果;
当所述第五判断结果判断为所述指定时刻包括指定时段,基于时刻转换规则将所述指定时刻进行类型转换,获得转换时刻;
所述转换时刻用于确定所述暂定时间,所述转换时刻不包括指定时段,且所述转换时刻与所述指定时刻用于表征同一时间。
7.根据权利要求6所述的方法,其特征在于,所述时刻转换规则包括如下至少之一:用于转换时刻类型的第一转换规则、用于校正口误的第二转换规则和用于处理时刻临界点的第三转换规则。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述验证结果验证为所述指定时间符合时间规律,判断所述指定时间是否包括指定时刻。
9.一种云服务器,其特征在于,所述云服务器与闹钟通信连接,所述云服务器包括:
获得模块,用于接收来自闹钟采集的声音信号;对所述声音信号进行语音识别和语义解析,获得对应所述声音信号的语义解析信息,基于所述语义解析信息获得指定时间;
验证模块,用于验证所述指定时间是否符合时间规律,获得验证结果;当所述验证结果验证为所述指定时间不符合时间规律时,通过语音合成技术进行多轮对话交互,获取符合时间规律的指定时间;
推测模块,用于基于当前时间对所述指定时间进行时间推测,确定意图时间;
生成模块,用于基于所述意图时间生成对应声音信号的目标指令;发送目标指令至所述闹钟,使所述闹钟执行对应的指定任务。
10.一种计算机可读存储介质,所述存储介质包括一组计算机可执行指令,当所述指令被执行时用于执行权利要求1-8任一项所述的信息处理方法。
CN201911396185.1A 2019-12-30 2019-12-30 信息处理方法、信息控制中心设备及计算机可读存储介质 Active CN111192579B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201911396185.1A CN111192579B (zh) 2019-12-30 2019-12-30 信息处理方法、信息控制中心设备及计算机可读存储介质
EP20909397.0A EP4086895A4 (en) 2019-12-30 2020-11-09 INFORMATION PROCESSING PROCEDURES, INFORMATION CONTROL CENTER AND COMPUTER READABLE STORAGE MEDIUM
JP2022540600A JP7502449B2 (ja) 2019-12-30 2020-11-09 情報処理方法、クラウドサーバ及びコンピュータ読み取り可能な記憶媒体
PCT/CN2020/127639 WO2021135652A1 (zh) 2019-12-30 2020-11-09 信息处理方法、信息控制中心设备及计算机可读存储介质
US17/758,051 US20230032792A1 (en) 2019-12-30 2020-11-09 Information processing method, information control center device, and computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911396185.1A CN111192579B (zh) 2019-12-30 2019-12-30 信息处理方法、信息控制中心设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111192579A CN111192579A (zh) 2020-05-22
CN111192579B true CN111192579B (zh) 2022-09-23

Family

ID=70707791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911396185.1A Active CN111192579B (zh) 2019-12-30 2019-12-30 信息处理方法、信息控制中心设备及计算机可读存储介质

Country Status (5)

Country Link
US (1) US20230032792A1 (zh)
EP (1) EP4086895A4 (zh)
JP (1) JP7502449B2 (zh)
CN (1) CN111192579B (zh)
WO (1) WO2021135652A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111192579B (zh) * 2019-12-30 2022-09-23 思必驰科技股份有限公司 信息处理方法、信息控制中心设备及计算机可读存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6315190A (ja) * 1986-07-08 1988-01-22 Citizen Watch Co Ltd 音声入力電子時計
JP2000194386A (ja) 1998-12-24 2000-07-14 Omron Corp 音声認識応答装置及び方法
JP2006292633A (ja) * 2005-04-13 2006-10-26 Nec Corp 時刻表記変換方法、制御方法、電子機器、プログラム、及び記録媒体
JP2007133033A (ja) * 2005-11-08 2007-05-31 Nec Corp 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム
US20100318398A1 (en) * 2009-06-15 2010-12-16 Xerox Corporation Natural language interface for collaborative event scheduling
WO2014176750A1 (en) * 2013-04-28 2014-11-06 Tencent Technology (Shenzhen) Company Limited Reminder setting method, apparatus and system
CN103440866B (zh) * 2013-07-30 2016-03-09 广东明创软件科技有限公司 根据通话信息执行任务的方法及移动终端
US9747280B1 (en) * 2013-08-21 2017-08-29 Intelligent Language, LLC Date and time processing
US10832005B1 (en) * 2013-11-21 2020-11-10 Soundhound, Inc. Parsing to determine interruptible state in an utterance by detecting pause duration and complete sentences
CN106020953A (zh) * 2016-05-12 2016-10-12 青岛海信移动通信技术股份有限公司 一种在电子日历中建立日程的方法和装置
US10261752B2 (en) * 2016-08-02 2019-04-16 Google Llc Component libraries for voice interaction services
CN106941619A (zh) * 2017-03-16 2017-07-11 百度在线网络技术(北京)有限公司 基于人工智能的节目提醒方法、装置以及系统
CN107465599A (zh) * 2017-08-15 2017-12-12 竞技世界(北京)网络技术有限公司 一种即时通讯中的日程设置方法及装置
US11494554B2 (en) * 2018-02-27 2022-11-08 Ntt Docomo, Inc. Function execution instruction system
US10956680B1 (en) * 2018-10-01 2021-03-23 Knexus Research Corporation System and method for temporal expressions processing
CN111192579B (zh) * 2019-12-30 2022-09-23 思必驰科技股份有限公司 信息处理方法、信息控制中心设备及计算机可读存储介质

Also Published As

Publication number Publication date
JP7502449B2 (ja) 2024-06-18
EP4086895A4 (en) 2023-06-14
EP4086895A1 (en) 2022-11-09
JP2023509651A (ja) 2023-03-09
US20230032792A1 (en) 2023-02-02
WO2021135652A1 (zh) 2021-07-08
CN111192579A (zh) 2020-05-22

Similar Documents

Publication Publication Date Title
CN106941619A (zh) 基于人工智能的节目提醒方法、装置以及系统
US20090177469A1 (en) System for recording and analysing meetings
CN106020953A (zh) 一种在电子日历中建立日程的方法和装置
CA3060748A1 (en) Automated transcript generation from multi-channel audio
CN111739553A (zh) 会议声音采集、会议记录以及会议记录呈现方法和装置
JP2018124425A (ja) 音声対話装置及び音声対話方法
CN111009245B (zh) 一种指令执行方法、系统及存储介质
CN113327609A (zh) 用于语音识别的方法和装置
CN111192579B (zh) 信息处理方法、信息控制中心设备及计算机可读存储介质
CN111048091A (zh) 一种语音识别方法、设备及计算机可读存储介质
CN107919127B (zh) 语音处理方法、装置和电子设备
CN107886940B (zh) 语音翻译处理方法及装置
CN116993873A (zh) 一种数字人动作编排方法及装置
US20080167879A1 (en) Speech delimiting processing system and method
CN111695670A (zh) 神经网络模型训练方法及装置
US11735186B2 (en) Hybrid live captioning systems and methods
CN116016779A (zh) 语音通话翻译辅助方法、系统、计算机设备和存储介质
CN112188253B (zh) 语音控制方法、装置、智能电视和可读存储介质
CN111782868B (zh) 一种音频处理方法、装置、设备及介质
WO2021019643A1 (ja) 印象推定装置、学習装置、それらの方法、およびプログラム
KR20220040045A (ko) 자막 동기화를 제공하는 영상 재생 장치 및 그 동작 방법
WO2019021953A1 (ja) 音声操作装置及びその制御方法
AU2006216111B2 (en) A system for recording and analysing meetings
CN112820276B (zh) 语音的处理方法、装置、计算机可读存储介质与处理器
CN117672208A (zh) 一种信息处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 215024 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Jiangsu Province

Applicant after: Sipic Technology Co.,Ltd.

Address before: 215024 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Jiangsu Province

Applicant before: AI SPEECH Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant