CN105632498A - 生成会议记录的方法、装置和系统 - Google Patents

生成会议记录的方法、装置和系统 Download PDF

Info

Publication number
CN105632498A
CN105632498A CN201410602238.1A CN201410602238A CN105632498A CN 105632498 A CN105632498 A CN 105632498A CN 201410602238 A CN201410602238 A CN 201410602238A CN 105632498 A CN105632498 A CN 105632498A
Authority
CN
China
Prior art keywords
text
language
minutes
label
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410602238.1A
Other languages
English (en)
Inventor
李海亮
王灵珠
丁沛
张大鲲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to CN201410602238.1A priority Critical patent/CN105632498A/zh
Publication of CN105632498A publication Critical patent/CN105632498A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明提供生成会议记录的方法、装置和系统。根据一个实施方式,生成会议记录的装置,包括:语音接收单元,其接收会议中的第一语言的语音;语音识别单元,其将所述第一语言的语音识别成所述第一语言的文本;标签添加单元,其对所述第一语言的文本中的至少部分文本添加标签;以及会议记录生成单元,其基于添加了标签的第一语言的文本,生成会议记录。

Description

生成会议记录的方法、装置和系统
技术领域
本发明涉及自然语言处理的技术,具体而言,涉及生成会议记录的方法、装置和系统。
背景技术
会议已经成为人们日常工作和生活进行交流的重要手段。并且,随着文化和经济的全球化,在具有不同母语的人员之间进行的会议也越来越多,尤其是在大多数跨国公司中,经常会有多语言的会议,例如参加会议的人员会使用不同的母语(例如,中文、日文、英文等)来进行交流。在会议过程中,一般由记录人员把会议的组织情况和具体内容等记录下来,形成会议记录以作为依据或备忘之用。
然而,记录人员通常只能集中精力在记录上,很难参与会议讨论。另外,在进行多语言会议中,往往需要多名记录人员以对相应语言的内容进行记录,这对人力资源是很大的浪费并且成本较高。而且,由于疏忽等原因,编写的会议记录也会不完整或有错误。
因此,上述以人工方式进行会议记录,往往会导致很大的浪费、高昂的成本或易发生错误等。对此,在现有技术中引入了语音识别技术以生成会议记录。例如,通过语音识别技术将采集到的语音转换成文本,从而生成会议记录。然而,这样的会议记录通常可读性比较差,例如用户不能快速地从该会议记录中识别出关键信息。另外,在多语言会议中,所生成的会议记录通常是多语言混合存在的状态,也降低了可读性。
发明内容
为了解决现有技术中存在的问题,本发明的实施方式提供一种能够生成高可读性的会议记录的方法、装置和系统。具体而言,提供以下技术方案。
[1]一种生成会议记录的方法,包括以下步骤:
接收会议中的第一语言的语音;
将所述第一语言的语音识别成所述第一语言的文本;
对所述第一语言的文本中的至少部分文本添加标签;以及
基于添加了标签的第一语言的文本,生成会议记录。
上述方案[1]的生成会议记录的方法,通过对所述第一语言的文本中的至少部分文本添加标签,然后基于添加了标签的第一语言的文本,生成会议记录,可以生成经过筛选过的会议记录,例如生成的会议记录包含添加标签的文本,因此能够提高可读性。同时由于基于添加了标签的第一语言的文本,生成会议记录,因此可以实时地生成会议记录,方便用户实时浏览会议以及编辑和确认会议记录。
[2]根据上述方案[1]所述的生成会议记录的方法,还包括以下步骤:
接收所述会议中的第二语言的语音;
将所述第二语言的语音识别成所述第二语言的文本;
对所述第二语言的文本中的至少部分文本添加标签;
将添加了标签的第一语言的文本翻译成第二语言的文本,并将添加了标签的第二语言的文本翻译成第一语言的文本;以及
基于添加了标签的第一语言的文本和翻译获得的第一语言的文本,生成第一语言的会议记录,并基于添加了标签的第二语言的文本和翻译获得的第二语言的文本,生成第二语言的会议记录。
上述方案[2]的生成会议记录的方法,与方案[1]相比,除了具有方案[1]的优点外,方案[2]的生成会议记录的方法可以适用于多语言的会议,因此提高的本方案的适用性。
[3]根据上述方案[1]或[2]所述的生成会议记录的方法,其中所述标签添加步骤包括:
基于用户的第一操作、言语表达规则、用户的身份和关键词识别中的至少一个,对所述文本中的至少部分文本添加标签。
上述方案[3]的生成会议记录的方法,通过基于用户的第一操作、言语表达规则、用户的身份和关键词识别中的至少一个来对所述文本中的至少部分文本添加标签,提高了对文本添加标签的灵活性。例如上述方案的方法可以支持以用户手工的方式(例如用户的第一操作)来对文本添加标签,也支持自动标签添加,例如基于言语表达规则、用户的身份和关键词识别的方式,同时也支持上述4种方式的任何组合,从而使得本方案可以灵活地适用于不同的环境和用户习惯。
[4]根据上述方案[3]所述的生成会议记录的方法,其中,
所述用户的第一操作在用户发言前执行或在用户发言后执行。
上述方案[4]的生成会议记录的方法,可以支持用户在用户发言前执行添加标签的操作,或在用户发言后执行添加标签的操作,从而可以增加用户添加标签的灵活性。
[5]根据上述方案[3]所述的生成会议记录的方法,其中,
所述言语表达规则包含以下规则中的至少一个:结论开始与结论结束、行动开始与行动结束、总结开始与总结结束、指示开始与指示结束、命令开始与命令结束、要求开始与要求结束、执行开始与执行结束。
上述方案[5]的生成会议记录的方法,可以支持通过言语表达规则的方式来对文本添加标签,进一步增加了添加标签的灵活性。
[6]根据上述方案[3]所述的生成会议记录的方法,其中,
所述用户的身份包含以下中的至少一个:总结者,指示者、命令者、领导,核心人员,重要发言人。
上述方案[6]的生成会议记录的方法,可以支持通过用户的身份的方式来对文本添加标签,进一步增加了添加标签的灵活性。
[7]根据上述方案[3]所述的生成会议记录的方法,其中,
所述关键词包含与结论、行动、总结、指示、命令、要求和执行中的至少一个相关的词。
上述方案[7]的生成会议记录的方法,可以支持通过关键词识别的方式来对文本添加标签,进一步增加了添加标签的灵活性。
[8]根据上述方案[1]或[2]所述的生成会议记录的方法,还包括以下步骤:
基于用户的第二操作,对所生成的所述会议记录进行编辑和/或确认。
上述方案[8]的生成会议记录的方法,允许用户对所生成的会议记录进行编辑和/或确认,从而可以对会议记录中的内容进行增加、修改、删除和确认等操作,可以进一步完善会议记录,提高准确性。
[9]根据上述方案[2]所述的生成会议记录的方法,还包括以下步骤:
存储所接收的所述第一语言和所述第二语言的语音的音频文件以及所述第一语言和所述第二语言的会议记录。
[10]根据上述方案[9]所述的生成会议记录的方法,还包括以下步骤:
同时输出所述第一语言和所述第二语言的语音的音频文件以及所述第一语言和所述第二语言的会议记录。
上述方案[9]和[10]的生成会议记录的方法,通过存储音频文件和对应语言的会议记录,可以同时输出音频文件和对应语言的会议记录,方便用户随时回放会议的音频文件和浏览会议记录,因此能够更及时的共享会议的音频文件和会议记录。
[11]根据上述方案[2]所述的生成会议记录的方法,其中所述生成步骤包括:
基于会议记录模板,生成所述第一语言和所述第二语言的会议记录。
上述方案[11]的生成会议记录的方法,基于会议记录模板,可以生成符合会议记录要求的会议记录,增加本方案的应用灵活性,满足用户对会议记录的不同需求,使得用户可以自由定义所需的会议记录模板,从而获得所需的会议记录。
[12]一种生成会议记录的装置,包括:
语音接收单元,其接收会议中的第一语言的语音;
语音识别单元,其将所述第一语言的语音识别成所述第一语言的文本;
标签添加单元,其对所述第一语言的文本中的至少部分文本添加标签;以及
会议记录生成单元,其基于添加了标签的第一语言的文本,生成会议记录。
上述方案[12]的生成会议记录的装置,通过标签添加单元对所述第一语言的文本中的至少部分文本添加标签,然后会议记录生成单元基于添加了标签的第一语言的文本,生成会议记录,可以生成经过筛选过的会议记录,例如生成的会议记录包含添加标签的文本,因此能够提高可读性。同时由于基于添加了标签的第一语言的文本,生成会议记录,因此会议记录生成单元可以实时的生成会议记录,方便用户实时浏览会议以及编辑和确认会议记录。
[13]根据上述方案[12]所述的生成会议记录的装置,其中:
所述语音接收单元,接收所述会议中的第二语言的语音,
所述语音识别单元,将所述第二语言的语音识别成所述第二语言的文本,
所述标签添加单元,对所述第二语言的文本中的至少部分文本添加标签,
所述装置还包括:
翻译单元,其将添加了标签的第一语言的文本翻译成第二语言的文本,并将添加了标签的第二语言的文本翻译成第一语言的文本,
所述会议记录生成单元,基于添加了标签的第一语言的文本和翻译获得的第一语言的文本,生成第一语言的会议记录,并基于添加了标签的第二语言的文本和翻译获得的第二语言的文本,生成第二语言的会议记录。
上述方案[13]的生成会议记录的装置,与方案[12]相比,除了具有方案[12]的优点外,方案[13]的生成会议记录的装置可以适用于多语言的会议,因此提高的本方案的适用性。
[14]根据上述方案[12]或[13]所述的生成会议记录的装置,其中所述标签添加单元基于用户的第一操作、言语表达规则、用户的身份和关键词识别中的至少一个,对所述文本中的至少部分文本添加标签。
在上述方案[14]的生成会议记录的装置中,所述标签添加单元基于用户的第一操作、言语表达规则、用户的身份和关键词识别中的至少一个来对所述文本中的至少部分文本添加标签,提高了对文本添加标签的灵活性,例如上述方案[14]的所述标签添加单元可以支持用户手工的方式来对文本添加标签(例如用户的第一操作),也支持自动标签添加,例如基于言语表达规则、用户的身份和关键词识别的方式,同时也支持上述4种方式的灵活组合,从而使得本方案的装置可以灵活地适用于不同的环境和用户习惯。
[15]根据上述方案[14]所述的生成会议记录的装置,其中,
所述用户的第一操作在用户发言前执行或在用户发言后执行。
上述方案[15]的生成会议记录的装置,所述标签添加单元可以支持用户在用户发言前执行添加标签的操作,或在用户发言后执行添加标签的操作,从而可以增加用户添加标签的灵活性。
[16]根据上述方案[14]所述的生成会议记录的装置,其中,
所述言语表达规则包含以下规则中的至少一个:结论开始与结论结束、行动开始与行动结束、总结开始与总结结束、指示开始与指示结束、命令开始与命令结束、要求开始与要求结束、执行开始与执行结束。
上述方案[16]的生成会议记录的装置,所述标签添加单元可以支持通过言语表达规则的方式来对文本添加标签,进一步增加了添加标签的灵活性。
[17]根据上述方案[14]所述的生成会议记录的装置,其中,
所述用户的身份包含以下中的至少一个:总结者,指示者、命令者、领导,核心人员,重要发言人。
上述方案[17]的生成会议记录的装置,所述标签添加单元可以支持通过用户的身份的方式来对文本添加标签,进一步增加了添加标签的灵活性。
[18]根据上述方案[14]所述的生成会议记录的方法,其中,
所述关键词包含与结论、行动、总结、指示、命令、要求和执行中的至少一个相关的词。
上述方案[18]的生成会议记录的装置,所述标签添加单元可以支持通过关键词识别的方式来对文本添加标签,进一步增加了添加标签的灵活性。
[19]根据上述方案[12]或[13]所述的生成会议记录的装置,还包括:
编辑和确认单元,其基于用户的第二操作,对所生成的所述会议记录进行编辑和/或确认。
上述方案[19]的生成会议记录的装置,所述编辑和确认单元允许用户对所生成的会议记录进行编辑和/或确认,从而可以对会议记录中的内容进行增加、修改、删除和确认等操作,可以进一步完整会议记录,提高准确性。
[20]根据上述方案[13]所述的生成会议记录的装置,还包括:
存储单元,其存储所接收的所述第一语言和所述第二语言的语音的音频文件以及所述第一语言和所述第二语言的会议记录。
[21]根据上述方案[20]所述的生成会议记录的装置,还包括:
输出单元,其同时输出所述第一语言和所述第二语言的语音的音频文件以及所述第一语言和所述第二语言的会议记录。
上述方案[20]和[21]的生成会议记录的装置,通过所述存储单元存储音频文件和对应语言的会议记录,所述输出单元可以同时输出音频文件和对应语言的会议记录,方便用户随时回放会议的音频文件和浏览会议记录,因此能够更及时的共享会议的音频文件和会议记录。
[22]根据上述方案[13]所述的生成会议记录的装置,其中所述会议记录生成单元基于会议记录模板,生成所述第一语言和所述第二语言的会议记录。
上述方案[22]的生成会议记录的装置,所述会议记录生成单元基于会议记录模板,可以生成符合会议记录要求的会议记录,增加本方案的应用灵活性,满足用户对会议记录的不同需要,使得用户可以自由定义所需的会议记录模板,从而获得所需的会议记录。
[23]一种生成会议记录的系统,包括:
根据上述[12]至[22]中的任何一项所述的生成会议记录的装置,所述生成会议记录的装置用于生成一个或多个会议的一个或多个会议记录;以及
会议管理装置,其管理所述一个或多个会议。
上述方案[23]的生成会议记录的系统,通过所述生成会议记录的装置可以生成一个或多个会议的一个或多个会议记录,所述会议管理装置可以管理所述一个或多个会议,使得所述生成会议记录的系统可以同时服务多个会议并管理多个会议,并且生成相应会议的会议记录,从而增加系统的适用范围。
附图说明
图1是根据本发明的一个实施方式的生成会议记录的方法的示意流程图。
图2是根据本发明的另一个实施方式的生成会议记录的方法的示意流程图。
图3A是根据本发明的一个实施方式的基于用户的操作对文本中的至少部分文本添加标签的示意图。
图3B是根据本发明的另一个实施方式的基于用户的操作对文本中的至少部分文本添加标签的示意图。
图4是根据本发明的一个实施方式的基于言语表达规则对文本中的至少部分文本添加标签的示意图。
图5是根据本发明的一个实施方式的基于用户的身份对文本中的至少部分文本添加标签的示意图。
图6是根据本发明的一个实施方式的基于关键词识别对文本中的至少部分文本添加标签的示意图。
图7是根据本发明的一个实施方式的对会议记录进行编辑和/或修改的示意图。
图8是根据本发明的一个实施方式的生成的会议记录的示意图。
图9是根据本发明的一个实施方式的生成会议记录的装置的框图。
图10是根据本发明的一些实施方式的生成的会议记录的装置的框图。
具体实施方式
下面就结合附图对本发明的各个优选实施方式进行详细地说明。
生成会议记录的方法
下面参照图1~8进行详细说明。
图1是根据本发明的一个实施方式的生成会议记录的方法的示意流程图。
如图1所示,本实施方式提供一种生成会议记录的方法,包括:步骤S102,接收会议中的第一语言的语音;步骤S104,将所述第一语言的语音识别成所述第一语言的文本;步骤S106,对所述第一语言的文本中的至少部分文本添加标签;以及步骤S108,基于添加了标签的第一语言的文本,生成会议记录。
在本实施方式中,会议是指由至少两方(或两个人)参加的会议。会议可以是现场会议,例如在会议室中举行的会议,会议参与者可以通过麦克风进行发言,直接与其它会议参与者进行交流,也可以是网络会议,即参与会议的人员通过网络来参加会议,在这种情况下,会议参与者的语音可以通过网络传送给其它会议参与者。第一语言可以是人类语言中的任何一种语言,例如,英语、汉语、日语等,第一语言的语音可以是由人来发出,也可以由机器来发出,例如会议参与者播放的录音等,本实施方式对此没有任何限制。
在本实施方式中,在步骤S102中,可以通过任何能够接收语音的设备来接收会议中的第一语言(例如日语)的语音,例如,如果会议的参与者在会议现场使用麦克风进行发言,则可以接收通过麦克风传递的语音,如果会议的参与者通过网络参与会议,则可以接收通过网络传递的语音,其中语音可以是本领域的技术人员公知的任何形式和编码的语音,本实施方式对此没有任何限制,只要能够接收和理解该语音即可。在步骤S102接收到第一语言的语音后可以将该语音传送给步骤S104。此外还可以将该语音进行存储,例如存储在存储器中。
在本实施方式中,在接收到来自步骤S102的语音后,在步骤S104中,可以使用语音识别技术将第一语言(例如日语)的语音识别成第一语言(例如日语)的文本,其中语音识别技术可以是本领域的技术人员公知的任何语音识别技术,本实施方式对此没有任何限制,只要能够将第一语言的语音识别成对应的文本即可。在步骤S104将第一语言的语音识别成第一语言(例如日语)的文本后,可以将该文本传送给步骤S106。此外,还可以将该文本进行存储,例如存储在存储器中。
在本实施方式中,在接收到来自步骤S104的第一语言(例如日语)的文本后,在步骤S106中,对第一语言的文本中的至少部分文本(例如,“VADモジュールは早めに実装する必要”)添加标签,例如,标签“[con]”。其中标签可以包含可以用于标识的任何字母和/或词组和/或数字和/或符号的任何组合,只要使标识的文本能够与其它文本区分即可,本实施方式对此没有限制。添加可以是手工添加也可以是机器自动添加。例如在用户发言前或发言后对该发言的文本添加标签。在手工添加的情况下,可以是发言者自己添加也可以是其它用户来执行添加,本实施方式对此没有任何限制。在步骤S106对第一语言的文本中的至少部分文本(例如,“VADモジュールは早めに実装する必要”)添加标签后,可以将该添加了标签的第一语言的文本传送给步骤S108。此外还可以将该文本及其对应的标签一起存储,例如存储在存储器中。
在步骤S108中,在接收到来自步骤S106的添加了标签的第一语言的文本(例如,“[con]VADモジュールは早めに実装する必要”)后,可以基于添加了标签的第一语言的文本,生成会议记录。
例如生成的会议记录中可以包含了添加了标签的第一语言的文本,而不包含没有添加标签的本文,例如会议记录为:
[con]:VADモジュールは早めに実装する必要。
此外,会议记录还可以包含其它相关的信息,例如会议名、参与者、会议时间、会议议题等相关信息。此外还可以将该会议记录进行存储,例如存储在存储器中。
需要注意的是,可以连续地执行上述步骤,也可以不连续地执行上述步骤,例如在会议中的休息时间期间,可以暂停执行上述步骤。此外,在上述任何步骤中的任何步骤中可以不需要存储操作。另外,会议记录可以是实时生成的,也可以不是实时生成的,例如可以在会议结束后再生成会议记录。
本实施方式的生成会议记录的方法,通过对第一语言的文本中的至少部分文本添加标签,然后基于添加了标签的第一语言的文本,生成会议记录,可以生成经过筛选过的会议记录,例如生成的会议记录包含添加标签的文本,因此能够提高可读性。同时由于基于添加了标签的第一语言的文本,生成会议记录,因此可以实时地生成会议记录,方便用户实时浏览会议以及编辑和确认会议记录。
除了生成第一语言的会议记录外,本实施方式的方法还可以适用于多语言的会议。在多语言会议的情况下,本实施方式的方法可以生成多种语言的会议记录。
下面,参照图2,对根据本发明的另一个实施方式的生成会议记录的方法进行详细说明。该实施方式支持生成多语言的会议记录。
如图2所示,步骤S102、S104和S106与图1中的对应步骤相同,在此不再详细描述。步骤S202、S204和S206与图1中的相应步骤S102、S104和S106在功能上是类似的,不同之处在于步骤S102、S104和S106处理第一语言(例如,日语),而步骤S202、S204和S206处理第二语言(例如,汉语)。由于在处理方式上,它们是类似的,因此出于简洁的目的,不再详细描述步骤S202、S204和S206。
在步骤S106和步骤S206分别对第一语言的文本中的至少部分文本添加标签(例如,“[con]VADモジュールは早めに実装する必要”)和对第二语言的文本中的至少部分文本添加标签(例如,“[con]测试环境需要尽快搭建起来”)后,其中[con]为标签,步骤S106和步骤S206各自分别将添加标签后的文本分别传递给步骤S208以及步骤S210。
在步骤S208接收到添加了标签的第一语言的文本和添加了标签的第二语言的文本后,将添加了标签的第一语言(日语)的文本翻译成第二语言(汉语)的文本,例如将“[con]VADモジュールは早めに実装する必要”翻译成“[con]VAD模块需要尽快开发”,并将添加了标签的第二语言的文本翻译成第一语言的文本,例如将“[con]测试环境需要尽快搭建起来”翻译成“[con]検証環境を早めに構築必要”。接着,步骤S208将翻译后的添加了标签的第一语言的文本(其对应于翻译前的添加了标签的第二语言的文本)和添加了标签的第二语言的文本(其对应于翻译前的添加了标签的第一语言的文本)传递给步骤S210。
在步骤S210接收到来自步骤S106、步骤S206和步骤S208中的至少之一的添加了标签的文本后,步骤S210基于添加了标签的第一语言的文本(例如,“[con]VADモジュールは早めに実装する必要”)和翻译获得的第一语言的文本(例如“[con]検証環境を早めに構築必要”),生成第一语言的会议记录,并基于添加了标签的第二语言的文本(例如,“[con]测试环境需要尽快搭建起来”)和翻译获得的第二语言的文本(例如,“[con]VAD模块需要尽快开发”),生成第二语言的会议记录。
需要注意的是,步骤S210可以在接收到来自步骤S106、步骤S206和步骤S208中的任何一个步骤的添加了标签的文本后,随时生成相应的会议记录,也可以等待预定的时间后,再生成相应的会议记录,本实施方式对此没有任何限制。
作为示例,生成的第一语言的会议记录中包含了添加了标签的第一语言的文本和翻译获得的第一语言的文本,例如会议记录可以为:
[con]:VADモジュールは早めに実装する必要,
[con]:検証環境を早めに構築必要。
作为示例,生成的第二语言的会议记录中包含了添加了标签的第二语言的文本和翻译获得的第二语言的文本,例如会议记录可以为:
[con]:测试环境需要尽快搭建起来,
[con]:VAD模块需要尽快开发。
此外,如上所述,会议记录还可以包含其它相关的信息,例如会议名、参与者、会议时间、会议议题等相关信息。此外还可以将该会议记录进行存储,例如存储在存储器中。
如上所述,可以连续地执行上述步骤,也可以不连续地执行上述步骤,例如在会议中的休息时间期间,可以暂停执行上述步骤。此外,在上述任何步骤中可以不需要进行存储。另外,会议记录可以是实时生成的,也可以不是实时生成的,例如可以在会议结束后再生成会议记录。
需要注意的是,虽然上述实施方式仅示出了针对两种语言的会议记录生成方法,但是本领域的技术人员应当了解的是,在包含超过两种语言的会议的情况下,生成会议记录的方法是类似的,因此上述实施方式的方法还可以适用于多于两种语言的会议。
本实施方式的生成会议记录的方法,与上述实施方式的方法相比,除了具有上述实施方式的优点外,还可以适用于多语言的会议,因此提高的本实施方式的适用性。
在上述实施方式中,标签添加步骤(S106和S206)包括:基于用户的第一操作、言语表达规则、用户的身份和关键词识别中的至少一个,对所述文本中的至少部分文本添加标签。
下面参照图3A和图3B,对基于用户的操作对文本中的至少部分文本添加标签进行详细说明。其中图3A说明了在用户发言前执行用户的第一操作以对文本中的至少部分文本添加标签,图3B说明了在用户发言后执行用户的第一操作以对文本中的至少部分文本添加标签。其中用户操作可以是例如通过点击/按下按钮(物理或虚拟)或手势等操作对文本添加标签,此外,用户操作可以对应于相应的标签,即用户执行相应的操作可以自动地对相应的文本添加标签。
如图3A所示,框320示出了用户通过点击会议界面上的按钮,在该用户或另外的用户发言前对本文中的至少部分文本添加标签,框330表示在用户操作后所生成的对应的文本,其中某些文本添加了标签。如框320中示出的,按钮包括结论302和执行304两种按钮,其中箭头表示点击相应按钮,‘X’表示任何文本。用户在发言前,该用户或另外的用户可以针对发言内容点击或不点击相应的按钮。例如文本306、文本308和文本312的发言者,可能由于他们的发言并不涉及结论或执行等内容,因此没有点击相应按钮,其中在框330中它们对应的文本没有添加标签,而文本310的发言者是领导进行总结的发言,因此在发言前该领导或其它用户点击了结论按钮,于是标签添加步骤(S106或S206)将文本310被添加了例如[结论]的标签,如在框330中示出的。类似地,文本316的发言者是执行者进行任务部署的发言,因此在发言前该执行者或其它用户点击了执行按钮,因此标签添加步骤(S106或S206)将文本316添加了例如[执行]的标签,如在框330中示出的。
需要注意的是,虽然框320中仅示出了两种按钮,但是本实施方式可以包含任何数量和类型的按钮,并且对按钮的类型和其对应的标签没有任何限制。
图3B说明了对在用户发言后执行用户的第一操作以对文本中的至少部分文本添加标签。
如图3B所示,框320’示出了用户通过点击会议界面上的按钮,在发言后对本文中的至少部分文本添加标签,框330’表示在用户操作后所生成的对应的文本,其中某些文本添加了标签。如框320’中示出的,按钮包括结论302’和执行304’两个按钮,其中填充了灰色的按钮表示用户点击相应的按钮,‘X’表示任何文本。在发言后,可以针对发言内容点击或不点击相应的按钮。例如,在讨论型的会议中,用户在发言前可能不能确定其发言的类型,因此不能事先点击按钮。例如文本306’、文本308’和文本312’的发言者可能正在讨论某一问题,还没有得出结论,因此在他们发言后没有点击相应的按钮,因此在框330’中他们对应的文本没有添加标签,而文本310’的内容是结论的内容,例如通过讨论得出的结论,因此可以在发言后,该发言者或其它用户点击结论按钮,因此标签添加步骤(S106或S206)对文本310’添加了例如[结论]的标签,如在框330’中示出的。类似地,文本316’的发言者可能是执行者,其正在征求其它参会人员的意见,而不能事先点击按钮,在达成一致意见后,该执行者或其它用户可以点击执行按钮,因此标签添加步骤(S106或S206)对文本316’添加了例如[执行]的标签,如在框330’中示出的。
如上所述,虽然框320’中仅示出了两种按钮,但是本实施方式的方法可以包含任何数量和类型的按钮,并且对按钮的类型和其对应的标签没有任何限制。
除了基于用户的第一操作对文本中的至少部分文本添加标签外,本实施方式还可以基于言语表达规则对文本中的至少部分文本添加标签。
言语表达规则可以包含与开始与结束相关的言语规则,例如以下中的至少一个:结论开始与结论结束、行动开始与行动结束、总结开始与总结结束、指示开始与指示结束、命令开始与命令结束、要求开始与要求结束、执行开始与执行结束。一般地,言语表达规则包含一对词组或短语,每对词组或短语中包含指示开始和结束的词组或短语,例如上述词组中的“开始”和“结束”。需要注意的是,除了上述言语表达规则外,用户可以自由定义任何合适的言语表达规则。
下面参照图4,对基于言语表达规则对文本中的至少部分文本添加标签进行详细说明。
如图4所示,框420表示参会者的语言文本,其中‘X’表示任何语言文本。框422表示基于结论开始与结论结束的言语表达规则对文本中的至少部分文本添加标签。框430表示添加标签后的文本。例如,框420中的文本404的发言者说出“结论开始”,因此基于言语表达规则,标签添加步骤(S106或S206)识别出随后的文本(例如文本406)为需要添加标签的文本,在用户说出文本406后,又说出文本408“结论结束”,则基于言语表达规则,标签添加步骤(S106或S206)识别出文本404和文本408之间的文本(文本406)需要添加标签。因此,标签添加步骤(S106或S206)对文本406添加例如[结论]的标签,如在框430中示出的。
除了基于言语表达规则对文本中的至少部分文本添加标签外,本实施方式还可以基于用户的身份对文本中的至少部分文本添加标签。
用户的身份可以包含以下中的至少一个:总结者,指示者、命令者、领导,核心人员,重要发言人。除了上述用户身份外,还可以包含其它任何合适的用户身份,只要生成会议记录需要包含该用户身份的文本即可。
下面参照图5,对基于用户的身份对文本中的至少部分文本添加标签进行详细说明。
如图5所示,框520表示参会者的语言文本,其中‘X’表示任何语言文本,用户A和用户C的身份为普通参会者,用户B的身份为领导,用户D的身份为执行者。框522表示基于用户的身份对文本中的至少部分文本添加标签,其中用户B和用户D的文本需要添加标签,用户B的文本对应的标签为结论,用户D的文本对应的标签为执行。框530表示添加标签后的文本。例如,在框520中,由于用户A和用户C的身份为普通参会者,基于用户的身份,对他们对应的文本不会添加标签,因此在框530中,他们对应的文本没有添加标签。基于用户的身份,用户B的文本需要添加结论的标签,因此,标签添加步骤(S106或S206)对用户B的对应的文本504添加了结论的标签,如在框530中示出的。类似地,标签添加步骤(S106或S206)对用户D的对应的文本508添加了行动的标签,如在框530中示出的。
除了基于用户的身份对文本中的至少部分文本添加标签外,本实施方式还可以基于关键词识别对文本中的至少部分文本添加标签。
一般而言,存在用于关键词识别的两种主要的方法。第一种关键词识别方法实现了两阶段过程:(1)将语音转换成文本(词序列或音素序列),以及(2)关键词搜索(基于词或基于音素)。例如,在基于词的关键词搜索的情况下,第一种关键词识别方法可以首先将语音转换成文本(词序列),接着通过使用例如基于文本的常规关键词搜索,来检测该语音的文本中的感兴趣的关键词。此外,在基于音素的关键词搜索的情况下,第一种关键词识别方法可以首先将语音转换成一连串的音素,而不是产生一连串的词,接着通过使用例如距离测量以计算对应于关键词的音素序列与该一连串的音素内的音素序列之间的文本距离,来执行关键词搜索。第二种关键词识别方法是基于声学的方法,其对语音自身进行操作。它可以对该语音使用语音识别引擎,以及使用例如维特比搜索。本实施例可以使用上述关键词识别方法中的任何方法或其它类型的关键词识别方法,对此没有限制。
关键词可以包含与结论、行动、总结、指示、命令、要求和执行中的至少一个相关的词。除了上述关键词外,还可以定义其它的关键词,只要生成会议记录需要包含该关键词的文本即可。
下面参照图6,对基于使用根据文本的关键词搜索的关键词识别,对文本中的至少部分文本添加标签进行详细说明。
如图6所示,框620表示参会者的语言文本,该语言文本能够通过步骤S104和步骤S204获得,其中‘X’表示任何语言文本。框622表示基于使用根据文本的关键词搜索的关键词识别对文本中的至少部分文本添加标签,其中对包含结论和行动的关键词的文本需要添加标签,例如分别添加结论和行动的标签。框630表示添加标签后的文本。例如,在框620中,由于文本602和文本608中没有包含框624中指定的关键词,因此基于关键词识别,对这些文本不会添加标签。因此在框630中,这些文本没有添加标签。文本604和文本606中包含关键词结论,因此基于关键词识别,标签添加步骤(S106或S206)对文本604和文本606分别添加了结论的标签,如在框630中示出的。类似地,由于文本610中包含了关键词行动,因此基于关键词识别,标签添加步骤(S106或S206)对文本610添加了行动的标签,如在框630中示出的。
需要注意的是,标签添加步骤(S106或S206)可以基于上述的用户的第一操作、言语表达规则、用户的身份和关键词识别进行任何组合,例如,基于用户的第一操作和言语表达规则,或基于言语表达规则和用户的身份,或基于用户的身份和关键词识别,以及诸如此类,对文本中的至少部分文本添加标签,从而使得上述实施方式可以支持更灵活的方式,对文本中的至少部分文本添加标签。
上述实施方式的生成会议记录的方法,通过基于用户的第一操作、言语表达规则、用户的身份和关键词识别中的至少一个来对所述文本中的至少部分文本添加标签,提高了对文本添加标签的灵活性。例如上述实施方式的方法可以支持用户手工的方式(例如用户的第一操作)来对文本添加标签,也支持自动地添加标签,例如基于言语表达规则、用户的身份和关键词识别的方式,同时也支持上述4种方式的任何组合,从而使得本实施方式的方法可以灵活的适用于不同的环境和用户习惯。
在生成了会议记录后,本实施方式还可以基于用户的第二操作,对所生成的会议记录进行编辑和/或确认。
第二操作可以包含例如通过点击/按下按钮(物理或虚拟)和/或通过例如键盘或触摸屏输入文本等操作来对所生成的会议记录进行编辑和/或确认,本实施方式对第二操作的形式没有任何限制,只要通过第二操作能够对所生成的会议记录进行编辑和/或确认即可。编辑可以包含修改(文本或格式或顺序)、添加、删除等。
下面参照图7,对基于用户的第二操作,对所生成的会议记录进行编辑和/或确认进行详细说明。
如图7所示,框720表示对根据上述实施方式所生成的会议记录进行编辑和确认的示例窗口,其中‘X’表示任何语言文本。框720中示出了4种按钮:添加712、删除714、修改716和确认718,其中填充了灰色的按钮表示用户点击或按下了该按钮。文本702、704、706和708通过是使用上述实施方式所生成的会议记录,每个文本后面可以跟随相应的按钮,例如框720中示出的删除714、修改716和确认718,其中[结论]表示标签。文本710表示用户通过点击添加按钮712,添加的新的文本及其对应的标签,箭头表示用户点击添加按钮希望添加的文本及其标签。
需要注意的是虽然框720中仅示出了4种类型按钮,但是框720中可以包含任何合适类型和数量的按钮,本实施方式对此没有任何限制。此外,按钮的布局仅是示例,可以采用任何其它形式的布局。编辑和修改操作可以由任何人来进行,例如可以发言人自己或其它人,本实施方式对此没有任何限制。另外,编辑和修改操作可以在任何时间进行,例如在会议记录生成时,或在其它任何合适的时间,本实施方式对此没有任何限制。
用户可以删除会议记录中的某些文本。例如,图7中的框720中的文本702的内容并不是会议记录需要记录的,例如该文本702可能是通过关键词识别所生成的,而含有该关键词的文本可能并不重要或不是会议记录需要记录。因此用户可以通过点击跟随在文本702后的删除按钮714,将文本702删除。如在框730中,文本702被删除。
用户也可以对会议记录中的文本进行确认。例如,图7中的框720中的文本704是会议记录需要的文本并且不需要修改,因此当用户点击跟随在文本704后的确认按钮714时,可以对该文本进行确认。如在框730中,包含文本704。需要注意的是,确认操作可以是缺省的,也就是说如果用户没有对文本进行任何操作,则该文本可以默认为被确认。例如,用户没有对图7中的框720中的文本708进行任何操作,但是该文本可以默认为被确认。如在框730中,包含文本708。以这种方式,可以节省用户的操作时间和会议记录的生成时间。
用户还可以对会议记录中的文本进行修改。例如,如果需要对图7中的框720中的文本706的内容进行修改,则用户可以点击跟随在文本706后的修改按钮716,对文本的内容进行修改。在这种情况下,作为示例,文本706的文本可以呈现为可以修改的形式,用户可以直接对其内容进行修改,例如将“结论3XXXXXXX”修改为“结论3YYYYYYY”。因此在框730中,文本706的文本内容被替换为“结论3YYYYYYY”。除了对文本的内容进行修改外,本领域的技术人员应当了解的是,还可以对文本的格式进行修改,以及对文本的顺序等进行修改或其它形式的修改。
此外,还可以增加新的文本。例如,会议中的某些内容是重要的,但是通过上述实施方式生成的会议记录没有包含该内容,则可以通过添加的方式将该内容添加到会议记录中。例如,需要添加的结论为:“结论5XXXXXXX”,则用户可以通过点击框720中的添加按钮712,将需要添加的结论输入到会议记录中,例如框720中的文本710。因此,在框730中包含了新添加的文本710。
上述实施方式的生成会议记录的方法,允许用户对所生成的会议记录进行编辑和/或确认,从而可以对会议记录中的内容进行增加、修改、删除和确认等操作,可以进一步完善会议记录,提高准确性。
此外,本实施方式还可以存储所接收的第一语言和第二语言的语音的音频文件以及第一语言和第二语言的会议记录。
其中可以在本地存储设备(例如,会议记录生成装置(以下详细描述)的存储设备)和/或网络存储设备(例如,网络上的存储设备)上进行存储,本实施方式对此没有任何限制。其中音频文件可以包含多个中间的音频文件,例如按照时间,每隔预定时间(例如10分钟)可以生成一个中间的音频文件。此外,如上所述,由于本实施方式可以实时生成会议记录,因此会议记录可以也可以包含多个中间的会议记录,例如按照时间,每隔预定时间(例如10分钟)可以生成一个中间的会议记录。另外,中间的音频文件和中间的会议记录可以一一对应。在一一对应的情况下,可以方便用户在浏览中间的会议记录的情况下,同时回放对应的中间的音频文件。
此外,除了存储上述音频文件和会议记录外,还可以存储语音的文本以及翻译获得的文本,以及其它任何相关信息。
另外,本实施方式可以同时输出第一语言和第二语言的语音的音频文件以及第一语言和第二语言的会议记录。
例如,在会议期间中,如果某些参会者或未参会者(如果允许)希望浏览会议记录和音频文件,则可以发起相应的请求。在这种情况下,本实施方式可以同时输出第一语言和第二语言的语音的音频文件以及第一语言和第二语言的会议记录,以便于用户随时了解会议的进展情况,进而更加及时地共享会议的信息。另外,其它用户可能希望了解以前的会议情况,在这种情况下,本实施方式可以向用户提供完整的会议记录和音频文件。
另外,本实施方式还可以基于会议记录模板,生成第一语言和第二语言的会议记录。
一般地,会议记录模板指用于记录会议内容的格式。会议记录模板可以是预定义的,也可以是临时生成的。作为示例,如果会议记录模板库包含会议记录模板组件列表,则用户可以选择所需的会议记录模板组件,从而生成所需的会议记录模板。
下面参照图8,对基于会议记录模板,生成第一语言和第二语言的会议记录进行详细说明。
如图8所示,框802表示上述实施方式中所记录的会议文本的示例格式,其中包含以下条目:序号,用户ID、标签、语言、语音。会议记录模板包含:会议名,会议时间、参会者、议题、结论(标签)以及行动(标签)。框804表示根据会议记录模板生成的示例会议记录界面,框8042和框8044表示对应语言的会议记录的按钮,填充了灰色颜色的按钮表示用户按下/点击了该按钮。因此,按照会议记录模板,本实施方式可以生成相应的会议记录804。其中,会议名、会议时间可以从会议生成装置(以下详细描述)中获得,例如会议组织者(或发起者)可以事先确定会议名、会议时间、议题等。参会者可以与框802中的用户ID对应,当然也可以包含其它没有发言的参会者。会议记录模板中需要记录与结论标签和行动标签对应的文本,因此上述会议生成步骤(S108或S210)可以基于添加了标签(结论和行动)的文本(序号2、3、5和序号8对应的文本)来生成会议记录,例如在框804中示出的生成的会议记录。由于是两种语言(汉语和日语)的会议,因此可以分别生成两种语言的会议记录,框804中示出了生成的汉语的会议记录。通过点击按钮8044,用户可以查看日语的会议记录。
上述实施方式的生成会议记录的方法,基于会议记录模板,可以生成符合会议记录要求的会议记录,增加本方案的应用灵活性,满足用户对会议记录的不同需求,使得用户可以自由地定义所需的会议记录模板,从而获得所需的会议记录。
生成会议记录的装置
在同一发明构思下,图9~10是根据本发明的另一个实施方式的生成会议记录的装置的框图。下面就结合这些图,对本实施方式进行描述。对于那些与前面实施方式相同的部分,适当省略其说明。
图9是根据本发明的一个实施方式的生成会议记录的装置900的框图。
如图9所示,本实施方式提供一种生成会议记录的装置900,包括:语音接收单元902,其接收会议中的第一语言的语音;语音识别单元904,其将所述第一语言的语音识别成所述第一语言的文本;标签添加单元906,其对第一语言的文本中的至少部分文本添加标签;以及会议记录生成单元908,其基于添加了标签的第一语言的文本,生成会议记录。
在本实施方式中,会议是指由至少两方(或两个人)参加的会议,会议可以是现场会议,例如在会议室中举行的会议,会议参与者可以通过麦克风进行发言,直接与其它会议参与者进行交流,也可以是网络会议,即参与会议的人员通过网络来参加会议,在这种情况下,会议参与者的语音可以通过网络传送给其它会议参与者。第一语言可以是人类语言中的任何一种语言,例如,英语、汉语、日语等,第一语言的语音可以是由人来发出,也可以由机器来发出,例如会议参与者播放的录音等,本实施方式对此没有任何限制。
在本实施方式中,语音接收单元902,可以是任何能够接收会议中的第一语言(例如日语)的语音的设备,例如,如果会议的参与者在会议现场使用麦克风进行发言,则语音接收单元902可以是能够接收通过麦克风传递的语音的设备(例如计算机中的声卡),如果会议的参与者通过网络参与会议,则语音接收单元可以是能够接收通过网络传递的语音的设备(例如计算机中的网卡),其中语音可以是本领域的技术人员公知的任何形式和编码的语音,本实施方式对此没有任何限制,只要语音接收单元902能够接收和理解该语音即可。在语音接收单元902接收到第一语言的语音后可以将该语音传送给语音识别单元904。此外还可以将该语音进行存储,例如存储在装置900的存储器(未示出)中。
在本实施方式中,在语音识别单元904接收到来自语音接收单元902的语音后,语音识别单元904可以使用语音识别技术将第一语言(例如日语)的语音识别成第一语言(例如日语)的文本,其中语音识别技术可以是本领域的技术人员公知的任何语音识别技术,本实施方式对此没有任何限制,只要能够将第一语言的语音识别成对应的文本即可。在语音识别单元904将第一语言的语音识别成第一语言(例如日语)的文本后,可以将该文本传送给标签添加单元906。此外还可以将该文本进行存储,例如存储在装置900的存储器(未示出)中。
在本实施方式中,在接收到来自语音识别单元904的第一语言(例如日语)的文本后,标签添加单元906,对第一语言的文本中的至少部分文本(例如,“VADモジュールは早めに実装する必要”)添加标签,例如,标签“[con]”。其中标签可以包含可以用于标识的任何字母和/或词组和/或数字和/或符号的任何组合,只要使标识的文本能够与其它文本区分即可,本实施方式对此没有限制。添加方式可以是手工添加也可以是机器自动添加。例如在用户发言前或发言后对该发言的文本添加标签。在手工添加的情况下,可以是发言人自己添加也可以是其它用户来添加,本实施方式对此没有任何限制。在标签添加单元906对第一语言的文本中的至少部分文本(例如,“VADモジュールは早めに実装する必要”)添加标签后,可以将该添加了标签的第一语言的文本传送给会议记录生成单元908。此外还可以将该文本及其对应的标签一起存储,例如存储在装置900的存储器中。
会议记录生成单元908,在接收到来自标签添加单元906的添加了标签的第一语言的文本(例如,“[con]VADモジュールは早めに実装する必要”)后,可以基于添加了标签的第一语言的文本,生成会议记录。
例如生成的会议记录中可以包含了添加了标签的第一语言的文本,而不包含没有添加标签的本文,例如会议记录为:
[con]:VADモジュールは早めに実装する必要。
此外,会议记录还可以包含其它相关的信息,例如会议名、参与者、会议时间、会议议题等相关信息。此外还可以将该会议记录进行存储,例如存储在装置900的存储器中。
需要注意的是,上述单元可以连续地执行相应的功能,也可以不连续地执行相应的功能,例如在会议中的休息时间期间,上述单元可以暂停执行相应的功能。此外,可以不需要存储操作。另外,会议记录生成单元908会议记录可以实时生成会议记录,也可以不实时生成会议记录,例如可以在会议结束后再生成会议记录。
本实施方式的生成会议记录的装置900,通过对第一语言的文本中的至少部分文本添加标签,然后基于添加了标签的第一语言的文本,生成会议记录,可以生成经过筛选过的会议记录,例如生成的会议记录包含添加标签的文本,因此能够提高可读性。同时由于基于添加了标签的第一语言的文本,生成会议记录,因此可以实时地生成会议记录,方便用户实时浏览会议以及编辑和确认会议记录。
除了生成第一语言的会议记录外,本实施方式的装置还可以适用于多语言的会议。在多语言会议的情况下,本实施方式的装置可以生成多种语言的会议记录。
下面,参照图10,对根据本发明的一些实施方式的生成会议记录的装置1000的框图进行详细说明。该实施方式的装置1000支持生成多语言的会议记录。
如图10所示,其中语音接收单元1002、语音识别单元1004和标签添加单元1006与图1中的对应单元在功能上类似。此外,在图10中的语音接收单元1002、语音识别单元1004和标签添加单元1006可以处理多种语言,例如第一语言(例如,日语)和第二语言(例如,汉语)等。由于它们的处理方式等方面是类似的,因此出于简洁的目的,不再详细描述语音接收单元1002、语音识别单元1004和标签添加单元1006。
在标签添加单元1006分别对第一语言的文本中的至少部分文本添加标签(例如,“[con]VADモジュールは早めに実装する必要”)和对第二语言的文本中的至少部分文本添加标签(例如,“[con]测试环境需要尽快搭建起来”)后,其中[con]为标签,标签添加单元1006分别将添加标签后的文本分别传递给翻译单元1010和会议记录生成单元1008。
在翻译单元1010接收到添加了标签的第一语言的文本和添加了标签的第二语言的文本后,将添加了标签的第一语言(日语)的文本翻译成第二语言(汉语)的文本,例如将“VADモジュールは早めに実装する必要”翻译成“VAD模块需要尽快开发”,并将添加了标签的第二语言的文本翻译成第一语言的文本,例如将“测试环境需要尽快搭建起来”翻译成“検証環境を早めに構築必要”。接着,翻译单元1010将翻译后的添加了标签的第一语言的文本(其对应于翻译前的添加了标签的第二语言的文本)和添加了标签的第二语言的文本(其对应于翻译前的添加了标签的第一语言的文本)传递给会议记录生成单元1008。
在会议记录生成单元1008接收到来自翻译单元1010和标签添加单元1006的添加了标签的文本后,会议记录生成单元1008基于添加了标签的第一语言的文本(例如,“[con]VADモジュールは早めに実装する必要”)和翻译获得的第一语言的文本(例如“[con]検証環境を早めに構築必要”),生成第一语言的会议记录,并基于添加了标签的第二语言的文本(例如,“[con]测试环境需要尽快搭建起来”)和翻译获得的第二语言的文本(例如,“[con]VAD模块需要尽快开发”),生成第二语言的会议记录。
需要注意的是,会议记录生成单元1008可以在接收到来自翻译单元1010和标签添加单元1006中的任何一个单元的添加了标签的文本后,随时生成相应的会议记录,也可以等待预定的时间后,再生成相应的会议记录,本实施方式对此没有任何限制。
作为示例,生成的第一语言的会议记录中包含了添加了标签的第一语言的文本和翻译获得的第一语言的文本,例如会议记录可以为:
[con]:VADモジュールは早めに実装する必要,
[con]:検証環境を早めに構築必要。
作为示例,生成的第二语言的会议记录中包含了添加了标签的第二语言的文本和翻译获得的第二语言的文本,例如会议记录可以为:
[con]:测试环境需要尽快搭建起来,
[con]:VAD模块需要尽快开发
此外,如上所述,会议记录还可以包含其它相关的信息,例如会议名、参与者、会议时间、会议议题等相关信息。此外还可以将该会议记录进行存储,例如存储在存储器中。
如上所述,上述单元可以连续地执行相应的功能,也可以不连续地执行相应的功能,例如在会议中的休息时间期间,上述单元可以暂停执行相应的功能。此外,可以不需要存储操作。此外,会议记录可以是实时生成的,也可以不是实时生成的,例如可以在会议结束后再生成会议记录。
需要注意的是,虽然上述实施方式仅示出了针对两种语言的会议记录生成装置,但是本领域的技术人员应当了解的是,在包含超过两种语言的会议的情况下,生成会议记录的装置执行的操作是类似的,因此上述实施方式的装置还可以适用于多于两种语言的会议。
本实施方式的生成会议记录的装置1000,与上述实施方式的装置900相比,除了具有上述实施方式的优点外,还可以适用于多语言的会议,因此提高的本实施方式的适用性。
在上述实施方式中,标签添加单元906和标签添加单元1006可以基于用户的第一操作、言语表达规则、用户的身份和关键词识别中的至少一个,对所述文本中的至少部分文本添加标签。
基于用户的第一操作来添加标签可以在用户发言前执行或在用户发言后执行。其中用户操作可以是例如通过点击/按下按钮(物理或虚拟)或手势等操作对文本添加标签,此外,用户操作可以对应于相应的标签,即用户执行相应的操作可以自动地对相应的文本添加标签。以上已经参照图3A说明了在用户发言前执行用户的第一操作以对文本中的至少部分文本添加标签,以及参照图3B说明了在用户发言后执行用户的第一操作以对文本中的至少部分文本添加标签。出于简洁的目的,在此不再详细描述。
除了基于用户的第一操作对文本中的至少部分文本添加标签外,标签添加单元906和标签添加单元1006还可以基于言语表达规则对文本中的至少部分文本添加标签。
言语表达规则可以包含与开始与结束相关的言语规则,例如以下中的至少一个:结论开始与结论结束、行动开始与行动结束、总结开始与总结结束、指示开始与指示结束、命令开始与命令结束、要求开始与要求结束、执行开始与执行结束。一般地,言语表达规则包含一对词组或短语,每对词组或短语中包含指示开始和结束的词组或短语,例如上述词组中的“开始”和“结束”。需要注意的是,除了上述言语表达规则外,用户可以自由定义任何合适的言语表达规则。
以上已经参照图4对基于言语表达规则对文本中的至少部分文本添加标签进行详细说明。出于简洁的目的,在此不再详细描述。
除了基于言语表达规则对文本中的至少部分文本添加标签外,标签添加单元906和标签添加单元1006还可以基于用户的身份对文本中的至少部分文本添加标签。
用户的身份包含以下中的至少一个:总结者,指示者、命令者、领导,核心人员,重要发言人。除了上述用户身份外,还可以包含其它任何合适的用户身份,只要生成会议记录需要包含该用户身份的文本即可。
以上已经参照图5对基于用户的身份对文本中的至少部分文本添加标签进行详细说明。出于简洁的目的,在此不再详细描述。
除了基于用户的身份对文本中的至少部分文本添加标签外,标签添加单元906和标签添加单元1006还可以基于关键词识别对文本中的至少部分文本添加标签。
关键词可以包含与结论、行动、总结、指示、命令、要求和执行中的至少一个相关的词。除了上述关键词外,还可以定义其它的关键词,只要生成会议记录需要包含该关键词的文本即可。
以上已经参照图6对基于关键词识别对文本中的至少部分文本添加标签进行详细说明。出于简洁的目的,在此不再详细描述。
需要注意的是,标签添加单元906和标签添加单元1006可以基于上述的用户的第一操作、言语表达规则、用户的身份和关键词识别进行任何组合,例如,基于用户的第一操作和言语表达规则,或基于言语表达规则和用户的身份,或基于用户的身份和关键词识别,以及诸如此类,对文本中的至少部分文本添加标签。从而上述实施方式可以支持更灵活的方式,来对文本中的至少部分文本添加标签。
上述实施方式的生成会议记录的标签添加单元906和标签添加单元1006,通过基于用户的第一操作、言语表达规则、用户的身份和关键词识别中的至少一个来对所述文本中的至少部分文本添加标签,提高了对文本添加标签的灵活性,例如上述实施方式的方法可以支持用户手工的方式(例如用户的第一操作)来对文本添加标签,也支持自动地添加标签,例如基于言语表达规则、用户的身份和关键词识别的方式,同时也支持上述4种方式的任何组合,从而使得本实施方式的装置可以灵活的适用于不同的环境和用户习惯。
在会议生成单元908或会议生成单元908生成了会议记录后,本实施方式的装置1000中的编辑和确认单元1016还可以基于用户的第二操作,对所生成的会议记录进行编辑和/或确认。
第二操作可以包含例如通过点击/按下按钮(物理或虚拟)和/或通过例如键盘或触摸屏输入文本等操作来对所生成的会议记录进行编辑和/或确认,本实施方式对第二操作的形式没有任何限制,只要通过第二操作能够对所生成的会议记录进行编辑和/或确认即可。编辑可以包含修改(文本或格式或顺序)、添加、删除等。
以上已经参照图7对基于用户的第二操作,对所生成的会议记录进行编辑和/或确认进行详细说明。出于简洁的目的,在此不再详细描述。
上述实施方式的生成会议记录的装置1000,允许用户对所生成的会议记录进行编辑和/或确认,从而可以对会议记录中的内容进行增加、修改、删除和确认等操作,可以进一步完善会议记录,提高准确性。
此外,本实施方式的装置1000还可以包含:存储单元1012,其存储所接收的第一语言和第二语言的语音的音频文件以及第一语言和第二语言的会议记录。
其中存储单元1012可以是本地存储单元(例如,在会议记录生成装置900、1000的上的存储单元)或网络存储单元(例如,位于网络上的存储单元),本实施方式对此没有任何限制。其中音频文件可以包含多个中间的音频文件,例如按照时间,每隔预定时间(例如10分钟)生成一个中间的音频文件。此外,如上所述,由于本实施方式可以实时生成会议记录,因此会议记录可以也可以包含多个中间的会议记录,按照时间,每隔预定时间(例如10分钟)可以生成一个中间的会议记录。另外,中间的音频文件和中间的会议记录可以一一对应。在一一对应的情况下,可以方便用户在浏览中间的会议记录的情况下,同时回放对应的中间的音频文件。
此外,存储单元1012除了存储上述音频文件和会议记录外,还可以存储语音的文本以及翻译获得的文本,以及其它任何相关信息。
另外,本实施方式的装置1000可以包含:输出单元1014,其同时输出第一语言和第二语言的语音的音频文件以及第一语言和第二语言的会议记录。
例如,在会议期间,如果某些参会者或未参会者(如果允许)希望浏览会议记录和音频文件,则可以发起相应的请求。在这种情况下,本实施方式的装置1000的输出单元1014可以同时输出第一语言和第二语言的语音的音频文件以及第一语言和第二语言的会议记录,以便于用户随时了解会议的进展情况,进而更加及时地共享会议的信息。另外,其它用户可能希望了解以前的会议情况,在这种情况下,本实施方式的装置1000的输出单元1014可以向该用户提供完整的会议记录和音频文件。
另外,装置1000的会议生成单元1008的还可以基于会议记录模板,生成第一语言和第二语言的会议记录。
一般地,会议记录模板可以指用于记录会议内容的格式。会议记录模板可以是预定义的,也可以是实时生成的。作为示例,如果会议记录模板库包含会议记录模板组件列表,则用户可以选择所需的会议记录模板组件,从而生成所需的会议记录模板。
以上已经参照图8对基于会议记录模板,生成第一语言和第二语言的会议记录进行详细说明。出于简洁的目的,在此不再详细描述。
上述实施方式的生成会议记录的装置,基于会议记录模板,可以生成符合会议记录要求的会议记录,增加本方案的应用灵活性,满足用户对会议记录的不同需求,使得用户可以自由地定义所需的会议记录模板,从而获得所需的会议记录。
生成会议记录的系统
生成会议记录的系统包括根据上述实施方式中的任何的生成会议记录的装置(900或1000),生成会议记录的装置用于生成一个或多个会议的一个或多个会议记录;以及会议管理装置(未示出),其管理一个或多个会议。
在同时举行多个会议的情况下,会议管理装置可以管理多个会议,例如为每个会议分配和提供各种资源,例如计算资源、存储资源、通信资源和带宽资源等,以及进行安全管理等。此外,会议管理装置还可以维护与会议相关的各种信息,例如用户ID、会议ID、会议使用情况、会议通知、邮件服务等。另外,也可以通过会议管理装置对生成会议记录的装置进行配置或为其分配或提供各种资源。
会议管理装置和生成会议记录的装置可以是分立的,也可以是集成在一起,本实施方式对此没有限制。
生成会议记录的装置可以服务于多个会议。例如通过会议ID对会议进行区分,生成会议记录的装置可以同时服务于多个会议,进而可以针对多个会议分别生成相应的会议记录。
另外,以上虽然通过一些示例性的实施方式详细地描述了本发明的生成会议记录的方法、装置和系统,但是以上这些实施方式并不是穷举的,本领域技术人员可以在本发明的精神和范围内实现各种变化和修改。因此,本发明并不限于这些实施方式,本发明的范围仅由所附权利要求书为准。

Claims (10)

1.一种生成会议记录的装置,包括:
语音接收单元,其接收会议中的第一语言的语音;
语音识别单元,其将所述第一语言的语音识别成所述第一语言的文本;
标签添加单元,其对所述第一语言的文本中的至少部分文本添加标签;以及
会议记录生成单元,其基于添加了标签的第一语言的文本,生成会议记录。
2.根据权利要求1所述的生成会议记录的装置,其中,
所述语音接收单元,接收所述会议中的第二语言的语音,
所述语音识别单元,将所述第二语言的语音识别成所述第二语言的文本,
所述标签添加单元,对所述第二语言的文本中的至少部分文本添加标签,
所述装置还包括:
翻译单元,其将添加了标签的第一语言的文本翻译成第二语言的文本,并将添加了标签的第二语言的文本翻译成第一语言的文本,
所述会议记录生成单元,基于添加了标签的第一语言的文本和翻译获得的第一语言的文本,生成第一语言的会议记录,并基于添加了标签的第二语言的文本和翻译获得的第二语言的文本,生成第二语言的会议记录。
3.根据权利要求1或2所述的生成会议记录的装置,其中,
所述标签添加单元,基于用户的第一操作、言语表达规则、用户的身份和关键词识别中的至少一个,对所述文本中的至少部分文本添加标签,
所述用户的第一操作在用户发言前执行或在用户发言后执行,
所述言语表达规则包含以下规则中的至少一个:结论开始与结论结束、行动开始与行动结束、总结开始与总结结束、指示开始与指示结束、命令开始与命令结束、要求开始与要求结束以及执行开始与执行结束。
所述用户的身份包含以下中的至少一个:总结者,指示者、命令者、领导,核心人员,重要发言人,以及
所述关键词包含与结论、行动、总结、指示、命令、要求和执行中的至少一个相关的词。
4.根据权利要求1或2所述的生成会议记录的装置,还包括:
编辑和确认单元,其基于用户的第二操作,对所生成的所述会议记录进行编辑和/或确认。
5.根据权利要求2所述的生成会议记录的装置,还包括:
存储单元,其存储所接收的所述第一语言和所述第二语言的语音的音频文件以及所述第一语言和所述第二语言的会议记录。
6.根据权利要求5所述的生成会议记录的装置,还包括:
输出单元,其同时输出所述第一语言和所述第二语言的语音的音频文件以及所述第一语言和所述第二语言的会议记录。
7.根据权利要求2所述的生成会议记录的装置,其中,
所述会议记录生成单元,基于会议记录模板,生成所述第一语言和所述第二语言的会议记录。
8.一种生成会议记录的方法,包括以下步骤:
接收会议中的第一语言的语音;
将所述第一语言的语音识别成所述第一语言的文本;
对所述第一语言的文本中的至少部分文本添加标签;以及
基于添加了标签的第一语言的文本,生成会议记录。
9.根据权利要求8所述的生成会议记录的方法,还包括以下步骤:
接收所述会议中的第二语言的语音;
将所述第二语言的语音识别成所述第二语言的文本;
对所述第二语言的文本中的至少部分文本添加标签;
将添加了标签的第一语言的文本翻译成第二语言的文本,并将添加了标签的第二语言的文本翻译成第一语言的文本;以及
基于添加了标签的第一语言的文本和翻译获得的第一语言的文本,生成第一语言的会议记录,并基于添加了标签的第二语言的文本和翻译获得的第二语言的文本,生成第二语言的会议记录。
10.一种生成会议记录的系统,包括:
根据权利要求1至7中的任何一项所述的生成会议记录的装置,所述生成会议记录的装置用于生成一个或多个会议的一个或多个会议记录;以及
会议管理装置,其管理所述一个或多个会议。
CN201410602238.1A 2014-10-31 2014-10-31 生成会议记录的方法、装置和系统 Pending CN105632498A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410602238.1A CN105632498A (zh) 2014-10-31 2014-10-31 生成会议记录的方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410602238.1A CN105632498A (zh) 2014-10-31 2014-10-31 生成会议记录的方法、装置和系统

Publications (1)

Publication Number Publication Date
CN105632498A true CN105632498A (zh) 2016-06-01

Family

ID=56047343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410602238.1A Pending CN105632498A (zh) 2014-10-31 2014-10-31 生成会议记录的方法、装置和系统

Country Status (1)

Country Link
CN (1) CN105632498A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106057193A (zh) * 2016-07-13 2016-10-26 深圳市沃特沃德股份有限公司 基于电话会议的会议记录生成方法和装置
CN106600212A (zh) * 2016-11-24 2017-04-26 南京九致信息科技有限公司 会议记录系统及自动生成会议记录的方法
CN106656528A (zh) * 2016-12-28 2017-05-10 北京恒华伟业科技股份有限公司 一种网络会议系统
CN106792048A (zh) * 2016-12-20 2017-05-31 Tcl集团股份有限公司 一种识别智能电视用户语音命令的方法和装置
CN106875157A (zh) * 2017-02-15 2017-06-20 超锐创新(北京)科技有限公司 会议处理方法和装置
CN107562723A (zh) * 2017-08-24 2018-01-09 网易乐得科技有限公司 会议处理方法、介质、装置和计算设备
CN107886955A (zh) * 2016-09-29 2018-04-06 百度在线网络技术(北京)有限公司 一种语音会话样本的身份识别方法、装置及设备
CN107993665A (zh) * 2017-12-14 2018-05-04 科大讯飞股份有限公司 多人会话场景中发言人角色确定方法、智能会议方法及系统
CN108231065A (zh) * 2016-12-12 2018-06-29 株式会社速录抓吧 多语者语音识别校正系统
CN108346034A (zh) * 2018-02-02 2018-07-31 深圳市鹰硕技术有限公司 一种会议智能管理方法及系统
CN108984788A (zh) * 2018-07-30 2018-12-11 珠海格力电器股份有限公司 一种录音文件整理、归类系统及其控制方法与录音设备
CN109743529A (zh) * 2019-01-04 2019-05-10 广东电网有限责任公司 一种多功能视频会议系统
CN109949008A (zh) * 2019-03-20 2019-06-28 钱露露 一种智能化研究讨论创新会议办公系统
CN110232553A (zh) * 2018-03-05 2019-09-13 柯尼卡美能达株式会社 会议支援系统以及计算机可读取的记录介质
CN110335612A (zh) * 2019-07-11 2019-10-15 招商局金融科技有限公司 基于语音识别的会议记录生成方法、装置及存储介质
CN110969547A (zh) * 2018-09-28 2020-04-07 北京国双科技有限公司 一种文本生成方法及装置
CN113014854A (zh) * 2020-04-30 2021-06-22 北京字节跳动网络技术有限公司 互动记录的生成方法、装置、设备及介质
CN113014853A (zh) * 2020-04-30 2021-06-22 北京字节跳动网络技术有限公司 互动信息处理方法、装置、电子设备及存储介质
WO2022016994A1 (zh) * 2020-07-23 2022-01-27 平安科技(深圳)有限公司 基于ai识别的会议纪要生成方法、装置、设备及介质
WO2023087287A1 (zh) * 2021-11-19 2023-05-25 京东方科技集团股份有限公司 一种会议内容显示的方法、会议系统及会议设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1526132A (zh) * 2000-10-10 2004-09-01 ض� 基于语音的不受语言限制的搜索系统
FR2852438A1 (fr) * 2003-03-13 2004-09-17 France Telecom Systeme de traduction pour audioconference multilingue
CN1602483A (zh) * 2001-12-17 2005-03-30 内维尼·加雅拉特尼 进行多语种口述词语实时翻译的实时翻译装置与方法
CN1901628A (zh) * 2005-07-07 2007-01-24 Lg电子株式会社 在数字视频设备中再现文本的装置和方法
CN101072168A (zh) * 2007-06-22 2007-11-14 腾讯科技(深圳)有限公司 一种多语言即时通讯终端及其系统和方法
CN102209227A (zh) * 2010-03-30 2011-10-05 宝利通公司 在视频会议中增加翻译的方法和系统
CN102521221A (zh) * 2011-11-30 2012-06-27 江苏奇异点网络有限公司 具有文字输出功能的多语言会议信息输出方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1526132A (zh) * 2000-10-10 2004-09-01 ض� 基于语音的不受语言限制的搜索系统
CN1602483A (zh) * 2001-12-17 2005-03-30 内维尼·加雅拉特尼 进行多语种口述词语实时翻译的实时翻译装置与方法
FR2852438A1 (fr) * 2003-03-13 2004-09-17 France Telecom Systeme de traduction pour audioconference multilingue
CN1901628A (zh) * 2005-07-07 2007-01-24 Lg电子株式会社 在数字视频设备中再现文本的装置和方法
CN101072168A (zh) * 2007-06-22 2007-11-14 腾讯科技(深圳)有限公司 一种多语言即时通讯终端及其系统和方法
CN102209227A (zh) * 2010-03-30 2011-10-05 宝利通公司 在视频会议中增加翻译的方法和系统
CN102521221A (zh) * 2011-11-30 2012-06-27 江苏奇异点网络有限公司 具有文字输出功能的多语言会议信息输出方法

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106057193A (zh) * 2016-07-13 2016-10-26 深圳市沃特沃德股份有限公司 基于电话会议的会议记录生成方法和装置
CN107886955A (zh) * 2016-09-29 2018-04-06 百度在线网络技术(北京)有限公司 一种语音会话样本的身份识别方法、装置及设备
CN106600212A (zh) * 2016-11-24 2017-04-26 南京九致信息科技有限公司 会议记录系统及自动生成会议记录的方法
CN108231065A (zh) * 2016-12-12 2018-06-29 株式会社速录抓吧 多语者语音识别校正系统
CN106792048B (zh) * 2016-12-20 2020-08-14 Tcl科技集团股份有限公司 一种识别智能电视用户语音命令的方法和装置
CN106792048A (zh) * 2016-12-20 2017-05-31 Tcl集团股份有限公司 一种识别智能电视用户语音命令的方法和装置
CN106656528A (zh) * 2016-12-28 2017-05-10 北京恒华伟业科技股份有限公司 一种网络会议系统
CN106875157A (zh) * 2017-02-15 2017-06-20 超锐创新(北京)科技有限公司 会议处理方法和装置
CN106875157B (zh) * 2017-02-15 2018-05-04 超锐创新(北京)科技有限公司 会议处理方法和装置
CN107562723A (zh) * 2017-08-24 2018-01-09 网易乐得科技有限公司 会议处理方法、介质、装置和计算设备
CN107993665B (zh) * 2017-12-14 2021-04-30 科大讯飞股份有限公司 多人会话场景中发言人角色确定方法、智能会议方法及系统
CN107993665A (zh) * 2017-12-14 2018-05-04 科大讯飞股份有限公司 多人会话场景中发言人角色确定方法、智能会议方法及系统
CN108346034A (zh) * 2018-02-02 2018-07-31 深圳市鹰硕技术有限公司 一种会议智能管理方法及系统
CN108346034B (zh) * 2018-02-02 2021-10-15 深圳市鹰硕技术有限公司 一种会议智能管理方法及系统
CN110232553A (zh) * 2018-03-05 2019-09-13 柯尼卡美能达株式会社 会议支援系统以及计算机可读取的记录介质
CN108984788A (zh) * 2018-07-30 2018-12-11 珠海格力电器股份有限公司 一种录音文件整理、归类系统及其控制方法与录音设备
CN110969547A (zh) * 2018-09-28 2020-04-07 北京国双科技有限公司 一种文本生成方法及装置
CN109743529A (zh) * 2019-01-04 2019-05-10 广东电网有限责任公司 一种多功能视频会议系统
CN109949008A (zh) * 2019-03-20 2019-06-28 钱露露 一种智能化研究讨论创新会议办公系统
CN110335612A (zh) * 2019-07-11 2019-10-15 招商局金融科技有限公司 基于语音识别的会议记录生成方法、装置及存储介质
CN113014854A (zh) * 2020-04-30 2021-06-22 北京字节跳动网络技术有限公司 互动记录的生成方法、装置、设备及介质
CN113014853A (zh) * 2020-04-30 2021-06-22 北京字节跳动网络技术有限公司 互动信息处理方法、装置、电子设备及存储介质
CN113014854B (zh) * 2020-04-30 2022-11-11 北京字节跳动网络技术有限公司 互动记录的生成方法、装置、设备及介质
WO2022016994A1 (zh) * 2020-07-23 2022-01-27 平安科技(深圳)有限公司 基于ai识别的会议纪要生成方法、装置、设备及介质
WO2023087287A1 (zh) * 2021-11-19 2023-05-25 京东方科技集团股份有限公司 一种会议内容显示的方法、会议系统及会议设备

Similar Documents

Publication Publication Date Title
CN105632498A (zh) 生成会议记录的方法、装置和系统
JP6791197B2 (ja) 電子会議システム
JP6866860B2 (ja) 電子会議システム
US11044286B2 (en) Information exchange method and terminal
CN102362271B (zh) 用于合并在托管的会话系统中的会话的编辑的系统和方法
JP2023017938A (ja) 文書を編集するためのプログラム、方法、及び装置
US9225936B2 (en) Automated collaborative annotation of converged web conference objects
US20170223069A1 (en) Meetings Conducted Via A Network
CN104317787A (zh) 即时通讯终端及其信息翻译方法和装置
CN107451110A (zh) 一种生成会议纪要的方法、装置及服务器
US10460030B2 (en) Generating structured meeting reports through semantic correlation of unstructured voice and text data
CN107562723A (zh) 会议处理方法、介质、装置和计算设备
CN102984050A (zh) 即时通信中语音搜索的方法、客户端及系统
CN1971553A (zh) 用于文档协作编辑的方法和装置
CN107465599A (zh) 一种即时通讯中的日程设置方法及装置
CN108809809A (zh) 消息发送方法、计算机设备及存储介质
JP2013109106A (ja) 議事録作成システム、議事録作成装置、議事録作成プログラム、議事録作成端末及び議事録作成端末プログラム
CN109660447B (zh) 基于聊天数据的信息定向抓取方法及信息管理系统
CN113285868A (zh) 任务生成方法、设备以及计算机可读介质
JP2021067830A (ja) 議事録作成システム
CN110019058B (zh) 文件操作的共享方法和装置
US20160275059A1 (en) System and method for parallel contract authoring
CN113949838A (zh) 一种无纸化会议系统、方法、设备及存储介质
KR101351264B1 (ko) 음성인식 기반의 메시징 통역서비스 제공 시스템 및 그 방법
CN101388855A (zh) 具有个人化物件的网络即时通讯系统及其方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160601