CN111149153B - 信息处理装置以及说话解析方法 - Google Patents

信息处理装置以及说话解析方法 Download PDF

Info

Publication number
CN111149153B
CN111149153B CN201880061642.9A CN201880061642A CN111149153B CN 111149153 B CN111149153 B CN 111149153B CN 201880061642 A CN201880061642 A CN 201880061642A CN 111149153 B CN111149153 B CN 111149153B
Authority
CN
China
Prior art keywords
display
unit
utterance
predetermined
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880061642.9A
Other languages
English (en)
Other versions
CN111149153A (zh
Inventor
小林祐毅
西村菜美
真野知子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Publication of CN111149153A publication Critical patent/CN111149153A/zh
Application granted granted Critical
Publication of CN111149153B publication Critical patent/CN111149153B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Abstract

信息处理装置(1)具备第一检测部(101)、文本化部(102)、第二检测部(103)、显示部(115)、显示控制部(104)。第一检测部(101)用于从记录了由多人组成的小组中的各人的说话的语音数据中检测在该说话中作出的各发言。文本化部(102)用于将通过第一检测部(101)检测到的各发言的内容文本化。第二检测部(103)用于基于通过文本化部(102)被文本化的文本数据,检测在各发言中包含的预定的关键词。显示控制部(104)用于使通过第二检测部(103)检测到的预定的关键词在显示部(115)上显示。

Description

信息处理装置以及说话解析方法
技术领域
本发明涉及一种信息处理装置以及说话解析方法,特别涉及一种解析人说话的内容的技术。
背景技术
如今,提出了一种对每个小组推定讨论的活跃度以明示其状况的技术(参照以下专利文献1)。该技术事先存储小组的各成员说话的说话时刻以及说话时长,对每个小组时序地区分各成员的说话时刻以及说话时长,算出各成员的说话时长相对于小组全部成员的说话时长的比,对每个小组生成描绘各成员的说话密度贡献率的图表。
现有技术文献
专利文献
专利文献1:日本特开2016-162339号公报
发明内容(Summary)
发明要解决的课题
然而,上述技术只不过是基于小组内的各成员的说话时间而示出该各成员的贡献程度的技术,不是实现显示在由该小组进行的讨论中作出的发言的内容的技术。
本发明是鉴于上述情况所作出的发明,其目的在于显示在小组的会议等中作出的发言的内容。
用于解决课题的方案
本发明的一个方面所涉及的信息处理装置具备:第一检测部,用于从记录了由多人组成的小组中的各人的说话的语音数据中检测在该说话中作出的各发言;文本化部,用于将通过第一检测部检测到的各发言的内容文本化;第二检测部,用于基于通过文本化部被文本化的文本数据,检测在各发言中包含的预定的关键词;显示部;显示控制部,用于使通过第二检测部检测到的预定的关键词在显示部上显示。
另外,本发明的另一方面所涉及的说话解析方法具备:发言检测步骤,用于从记录了由多人组成的小组中的各人的说话的语音数据中检测在该说话中作出的各发言;文本化步骤,用于将在发言检测步骤中检测到的各发言的内容文本化;关键词检测步骤,用于基于在文本化步骤中被文本化的文本数据,检测在各发言中包含的预定的关键词;显示控制步骤,用于使在关键词检测步骤中检测到的预定的关键词在显示部上显示。
另外,本发明的另一方面所涉及的信息处理装置具备:显示部;语音输入部,用于输入表示语音的电气信号;存储部,用于每当电气信号输入到语音输入部时,对每个发出语音的人存储基于输入的电气信号的语音数据;控制单元,其包括处理器,通过该处理器执行评价程序,从而作为第一检测部、文本化部、第二检测部、显示控制部而起作用,所述第一检测部用于从语音数据中提取与发言对应的部分,并将提取到的部分作为发言而检测,所述文本化部用于将通过第一检测部检测到的发言的内容文本化,所述第二检测部用于基于通过文本化部被文本化的文本数据,检测在发言中包含的预定的关键词,所述显示控制部用于使通过第二检测部检测到的所述预定的关键词在所述显示部上显示。
根据本发明,能够显示在小组的会议等中作出的发言的内容。
附图说明
图1是示出本发明的第一实施方式所涉及的信息处理装置以及供通过该信息处理装置进行说话解析的对象者的图。
图2是示出本发明的信息处理装置的内部构成的概要的框图。
图3是示出本发明的语音数据的一个例子的图。
图4是示出本发明的第一实施方式所涉及的信息处理装置进行的说话解析处理的流程图。
图5是示出本发明的显示部的显示画面的一个例子的图。
图6是示出本发明的显示部的显示画面的一个例子的图。
图7是示出本发明的显示部的显示画面的一个例子的图。
图8是示出本发明的第二实施方式所涉及的信息处理装置进行的说话解析处理的流程图。
图9是示出本发明的显示部的显示画面的一个例子的图。
图10是示出本发明的第三实施方式所涉及的信息处理装置进行的说话解析处理的流程图。
图11A是示出本发明的分数例的图。
图11B是示出本发明的显示部的显示画面的一个例子的图。
图12是示出本发明的第四实施方式所涉及的信息处理装置进行的说话解析处理的流程图。
图13是示出本发明的类别、属于类别的关键词、以及检测数的例子的图。
图14是示出本发明的显示部的显示画面的一个例子的图。
图15是示出本发明的第五实施方式所涉及的信息处理装置进行的说话解析处理的流程图。
图16是示出本发明的显示部的显示画面的一个例子的图。
图17是示出本发明的显示部的显示画面的一个例子的图。
图18是示出本发明的第六实施方式所涉及的信息处理装置进行的说话解析处理的流程图。
图19是示出本发明的显示部的显示画面的一个例子的图。
图20是示出本发明的使关于在显示部上显示的各关键词的附加信息显示的处理的流程图。
图21是示出本发明的显示部的显示画面的一个例子的图。
具体实施方式
以下,参照附图对本发明的一种实施方式所涉及的信息处理装置、说话解析方法、以及说话解析程序进行说明。图1是示出本发明的第一实施方式所涉及的信息处理装置以及供通过该信息处理装置进行说话解析的对象者的图。
信息处理装置1将属于由预定的多人组成的多个会话小组G1~G3的各人所发出语音作为语音数据而获取。例如,假设由属于小组G1的人P11、P12、P13、属于小组G2的人P21、P22、P23、属于小组G3的人P31、P32、P33组成的多人(在本实施方式中以由属于三个小组的各人组成的总计九人进行说明,但不限定于此。)以小组为单位进行会谈、讨论、授课或会议等(以下,总称并仅称为“会议”。)。
该会话小组的各人在使用了具备麦克风功能的头戴式耳机2的状态下发声。即,该各人使用的头戴式耳机2分别获取装备了头戴式耳机2的人的会话的语音,转换为表示该语音的电气信号,并输出到信息处理装置1。信息处理装置1和各头戴式耳机2例如由通过电缆连接的有线通信、或Bluetooth(注册商标)或者无线LAN(局域网)等无线通信连接。信息处理装置1将从各头戴式耳机2输出的表示上述语音的电气信号转换为由数字语音信号构成的语音数据,分别积蓄每个头戴式耳机2、即关于上述人P11~P33的九人的语音数据。
接下来,对第一实施方式所涉及的信息处理装置1的结构进行说明。图2是示出信息处理装置1的内部构成的概要的框图。
信息处理装置1例如是计算机。信息处理装置1具备控制单元10、ROM(只读存储器(Read Only Memory))112、RAM(随机存取存储器(Random Access Memory))113、HDD(硬盘驱动器(Hard Disk Drive))114、显示部115、通信接口118和指示输入部119。这些各部分能够相互通过CPU(中央处理单元(Central Processing Unit))总线来进行数据或信号的接收和发送。
控制单元10用于对信息处理装置1整体的动作控制进行管理。ROM112存储关于信息处理装置1的基本动作的动作程序。RAM113被用作控制单元10的动作区域等。
HDD114在其存储区域的一部分中存储本发明的第一实施方式所涉及的说话解析程序。另外,HDD114存储关于上述人P11~P33的九人的各自的上述语音数据。此外,HDD114是权利要求书中的存储部的一个例子。但是,信息处理装置1具备的非易失性ROM(例如,内置有控制单元10)也可以作为该存储部起作用。
在与信息处理装置1连接的头戴式耳机2中,事先带有用于特定该头戴式耳机2的识别信息。作为识别信息,只要是能够特定头戴式耳机2的信息即可,没有特别限定,例如有识别号码。HDD114按头戴式耳机2事先存储该识别信息。HDD114还与经由指示输入部119通过用户输入的指示对应地,将各个识别信息与用于特定小组的小组信息建立对应关系并存储。
在本实施方式中,HDD114将人P11、P12、P13各自使用的头戴式耳机2的识别信息与特定小组G1的小组信息建立对应关系并存储。HDD114还将人P21、P22、P23各自使用的头戴式耳机2的识别信息与特定小组G2的小组信息建立对应关系并存储。HDD114进一步将人P31、P32、P33各自使用的头戴式耳机2的识别信息与特定小组G3的小组信息建立对应关系并存储。
显示部115由LCD(液晶显示器(Liquid Crystal Display))等构成,显示对操作信息处理装置1的操作者的操作引导等。
通信接口118具有USB(通用串行总线)接口或无线LAN接口等。通信接口118作为用于进行与上述各头戴式耳机2的数据通信的接口来起作用。通信接口118是权利要求书中的语音输入部的一个例子。
指示输入部119由键盘或鼠标等构成,通过操作者输入操作指示。
控制单元10由处理器、RAM以及ROM等构成。处理器为CPU(中央处理单元)、MPU(微处理单元(Micro Processing Unit))或ASIC(专用集成电路(Application SpecificIntegrated Circuit))等。该控制单元10通过利用上述处理器来执行存储在HDD114中的说话解析程序,作为控制部100、第一检测部101、文本化部102、第二检测部103、显示控制部104、分类部105、以及提取部106起作用。此外,控制部100、第一检测部101、文本化部102、第二检测部103、显示控制部104、分类部105、以及提取部106也可以由硬件电路构成。
控制部100具有对信息处理装置1整体的动作控制进行管理的功能。
第一检测部(发言检测部)101从关于存储在HDD114中的人P11~P33的九人的各个语音数据中检测在语音数据中记录的说话中作出的发言。图3是示出语音数据的一个例子的图。图3的纵轴表示声音的振幅(单位dB),横轴表示时刻。第一检测部101解析语音数据,将语音数据表示的振幅中的、持续预定的规定时间(例如,0.25秒)以上且持续预定的大小以上的振幅(例如,20dB)的部分作为发言而检测。在图3所示的语音数据中,第一检测部101将a部分、b部分、以及c部分作为发言而检测。
文本化部102具备已知的语音识别功能,由此,将在上述语音数据中包含的上述各人的发言的内容进行字符转换并文本化。
第二检测部(关键词检测部)103基于通过文本化部102被文本化的文本数据,检测在各发言中包含的预定的关键词。
显示控制部104用于使通过第二检测部103检测到的上述预定的关键词在显示部115上显示。另外,显示控制部104使通过第二检测部103检测到的上述预定的关键词中的、检测数为预定的第一值以上的关键词在显示部115上显示。
分类部(类别分类部)105用于将通过第二检测部103检测到的上述预定的关键词分类为预定的各个类别。显示控制部104使所属的各关键词的检测数的总计为预定的第二值以上的类别以及属于该类别的关键词在显示部115上显示。
提取部(单词提取部)106用于从通过文本化部102被文本化的文本数据中提取上述预定的关键词以外的单词。显示控制部104使通过提取部106提取到的单词中的、检测数为预定的第三值以上的单词在显示部115上显示。
接下来,对第一实施方式所涉及的信息处理装置1进行的说话解析处理进行说明。图4是示出第一实施方式所涉及的信息处理装置1进行的说话解析处理的流程图。
该说话解析进行的场景是属于会话小组G1~G3的各人分别按每个小组进行会议的场景。人P11~P33各自装备头戴式耳机2,各头戴式耳机2如上所述可通信地与信息处理装置1连接。在该状态下,人P11~P33在各自所属的各个小组中在会议中进行说话。由人P11~P33发出的语音通过人P11~P33各自的头戴式耳机2而声音收集,并输出到信息处理装置1。
信息处理装置1经由通信接口118,从各头戴式耳机2获取语音数据(步骤S1)。即,当通信接口118接收从各头戴式耳机2输出的表示上述语音的电气信号时,第一检测部101用于使表示该获取到的语音的电气信号转换为由数字语音信号构成的语音数据并存储到HDD114中。第一检测部101用于按人P11~P33,即,与在HDD114中存储的识别信息建立对应关系地,使该语音数据存储到HDD114中。
接着,第一检测部101用于从按人P11~P33在HDD114中存储的各个语音数据中,如上述这样检测在该语音数据表示的说话中作出的各发言(步骤S2)。
然后,文本化部102用于将在上述语音数据中包含的上述各人的发言的内容通过语音识别功能进行字符转换并文本化(步骤S3)。第一检测部101使上述语音数据中的、与人P11~P33的各发言对应的时间带在HDD114中存储,文本化部102将上述语音数据中的该时间带部分识别为发言,将该发言的内容进行字符转换并文本化。
接着,第二检测部103用于基于通过文本化部102像这样这样被文本化的文本数据,检测在各发言中包含的预定的关键词(步骤S4)。例如,在HDD114中,作为预定的关键词,存储有“水蒸气”、“气压”、“变化”以及“溶解”的情况下,第二检测部103判断在上述发言被文本化而成的文本数据中,是否包含该关键词。在包含该关键词的情况下,第二检测部103检测关键词,对该关键词的出现次数进行计数。第二检测部103使各关键词的出现次数与识别信息建立对应关系,并在HDD114中存储。
然后,显示控制部104还用于使通过第二检测部103检测到的上述各关键词在显示部115上显示(步骤S5)。在预定的关键词为在上述例中所示的关键词的情况下,如图5所示,显示控制部104还用于基于在HDD114中存储的识别信息以及小组信息,对每个小组统计各关键词的出现次数,对每个人P11~P33的小组,使表示各关键词和各关键词的出现次数的图像在显示部115上显示。此外,如图5所示,也可以是,显示控制部104还用于使没有通过第二检测部103检测到的关键词(检测数为“0”的关键词)作为检测数“0”而在显示部115上显示。
另外,显示控制部104还用于按照在指示输入部119的操作中从操作者输入的画面切换指示,如图6所示,使表示在全部小组中的各关键词和各关键词的出现次数的图像在显示部115上显示。或者,显示控制部104还用于按照在指示输入部119的操作中从操作者输入的画面切换指示,如图7所示,使在全部小组中出现次数最多的三个关键词按出现次数多的顺序排列的图像在显示部115上显示。
图8是示出第二实施方式所涉及的信息处理装置1进行的说话解析处理的图。如图8所示,在第二实施方式中,在与第一实施方式中的步骤S1~步骤S4同样地结束了到关键词检测为止的处理之后(步骤S11~S14),显示控制部104检测通过第二检测部103检测到的关键词中的、检测数为预定的第一值以上的关键词(步骤S15),使该检测到的各关键词与各自的检测数一起,在显示部115上显示(步骤S16)。
例如,如图9所示,在第一值为“12”的情况下,显示控制部104检测检测数为第一值以上的关键词,仅使该检测到的关键词及其检测数按小组在显示部115上显示。
根据这些第一以及第二实施方式,能够以用户可目视确认的方式显示在小组的会议等中作出的发言的内容。由此,用户目视确认该显示,从而能够正确地掌握会议出席者进行的发言的内容。
图10是示出第三实施方式所涉及的信息处理装置1进行的说话解析处理的图。如图10所示,在第三实施方式中,在与第一实施方式中的步骤S1~步骤S4同样地结束了到关键词检测为止的处理之后(步骤S21~S24),显示控制部104与各关键词的检测次数对应地,对每个关键词统计对各关键词事先赋予的分数(步骤S25),使各关键词与统计的分数一起,在显示部115上显示(步骤S26)。进一步地,也可以是,显示控制部104还用于对每个小组G1~G3,计算全部关键词的分数的总计并显示。此外,在第三实施方式中,预定的关键词设为多个。
HDD114对于各关键词,存储每检测到一次就进行加法运算的预定的分数。该分数是主办者等根据会议的重要程度等事先设定的,例如通过指示输入部119的操作在HDD114中存储。显示控制部104还用于每次检测到关键词时,就加上对该关键词赋予的分数。因此,检测较多的关键词,统计的分数较高。
例如,如图11A所示,在HDD114作为按关键词设定的分数,对“水蒸气”存储两分,对“气压”存储三分,对“变化”存储一分,对“溶解”存储五分时,显示控制部104还用于根据各关键词的检测次数对每个关键词统计分数。显示控制部104进一步地,对每个小组G1~G3计算全部关键词的分数总计,通过使如图11B所示的“统计结果”这样的显示画面在显示部115上显示,从而对每个小组G1~G3使统计的分数以及各关键词、全部关键词的分数的总计在显示部115上显示。
根据该第三实施方式,用户通过目视确认显示的关键词以及统计分数,能够掌握在该会议中,重要的关键词被使用的程度,进一步地,通过目视确认全部关键词的分数总计,能够获得用于判断哪个小组进行了最有意义的会议的指标。
接下来,对第四实施方式所涉及的信息处理装置1进行的说话解析处理进行说明。图12是示出第四实施方式所涉及的信息处理装置1进行的说话解析处理的流程图。
在第四实施方式中,在与第一实施方式中的步骤S1~步骤S4同样地结束了到关键词检测为止的处理之后(步骤S31~S34),分类部105用于将通过第二检测部103检测到的关键词分类为预定的类别(步骤S35)。例如,HDD114作为预定的类别,存储有“天气”、“体育”以及“社会”。HDD114进一步地,作为属于类别“天气”的关键词,事先存储有“晴”、“多云”、“雨”、“云”、“白”、“烟”这样的关键词。另外,HDD114进一步地,作为属于类别“体育”的关键词,事先存储有“网球”、“棒球”、“足球”、“中止”、“决赛”、“胜负”这样的关键词。另外,HDD114进一步地,作为属于类别“社会”的关键词,事先存储有“经济”、“企业”、“股市”、“行情”、“销售额”、“盈亏”这样的关键词。
该情况下,第二检测部103首先从各人进行的各发言中检测“晴”、“多云”、“雨”、“云”、“白”、“烟”、“网球”、“棒球”、“足球”、“中止”、“决赛”、“胜负”、“企业”、“股市”、“行情”、“销售额”、“盈亏”。然后,分类部105还用于判断检测到的各关键词属于类别“天气”、“体育”、“社会”中的哪一个类别,将检测到的各关键词按类别分类。图13示出类别、属于类别的关键词、以及检测数的例子。分类部105将出现的关键词分类为各类别,对属于各类别的各关键词的检测数进行计数,使该检测数与关键词一起在HDD114中存储。
接着,显示控制部104还用于检测检测数为预定的第二值以上的类别(步骤S36)。即,显示控制部104还用于检测属于类别的各关键词的检测数的总计为上述第二值以上的类别。例如,在第二值为“150”、且为图13中所示的类别、属于类别的关键词、以及检测数的情况下,显示控制部104例如对小组G1检测到类别“社会”。
然后,显示控制部104还用于使该检测到的类别与属于该类别的各关键词的各自的检测数一起在显示部115上显示(步骤S37)。显示控制部104如上述这样,在对小组G1检测到类别“社会”,对小组G2检测到类别“天气”,对小组G3也检测到“天气”的情况下,如在图14中示例的这样,使检测到的类别和属于该类别的各关键词以及各自的检测数在显示部115上显示。
根据该第四实施方式,将检测到的关键词分类为各类别,进一步地,显示所属的各关键词的检测数的总计为第二值以上的类别,因此用户能够可靠地掌握预定的各关键词较多地出现的类别。
接下来,对第五实施方式所涉及的信息处理装置1进行的说话解析处理进行说明。图15是示出第五实施方式所涉及的信息处理装置1进行的说话解析处理的流程图。
在第五实施方式中,在与第一实施方式中的步骤S1~步骤S4同样地结束了到关键词检测为止的处理之后(步骤S41~S44),提取部106还用于从在步骤S33中文本化的文本数据中提取上述预定的关键词以外的单词(步骤S45)。即,在第五实施方式中,显示控制部104还用于检测上述预定的关键词,并且提取部106提取上述预定的关键词以外的单词。
显示控制部104还用于检测通过提取部106提取到的上述单词中的、检测数为预定的第三值以上的单词(步骤S46),使该检测到的各单词与各自的检测数一起在显示部115上显示(步骤S47)。
例如,如图16所示,在第三值例如为“15”的情况下,显示控制部104还用于使上述预定的关键词以外的单词且是检测数为第三值以上的单词及其检测数在显示部115上显示。
根据该第五实施方式,在小组的会议等中,即使不是预定的关键词,只要有出现次数较多的单词,就会检测并显示,因此用户能够掌握当初用户没有注意到但实际开会时会议出席者注意到并发言的单词。
此外,也可以是,显示控制部104还用于使在步骤S36中检测到的各单词例如如在图17中示例的这样,以与在步骤S34中检测到的各关键词不同的显示形态在显示部115上显示(图15的步骤S47中的括号内容)。
接下来,对第六实施方式所涉及的信息处理装置1进行的说话解析处理进行说明。图18是示出第六实施方式所涉及的信息处理装置1进行的说话解析处理的流程图。
在第六实施方式中,在与第一实施方式中的步骤S1~步骤S4同样地结束了到关键词检测为止的处理之后(步骤S51~S54),显示控制部104还用于对通过第二检测部103检测到的各关键词,计数各关键词的检测数。然后,显示控制部104还用于根据计数的各关键词的检测数,决定将该关键词在显示部115上显示时的图像的大小(步骤S55)。关键词的检测数越多,显示控制部104还用于使图像的大小越大。进一步地,显示控制部104还用于根据计数的各关键词的检测数,决定将该关键词在显示部115上显示时的图像的显示位置(步骤S55)。例如,关键词的检测数越多,显示控制部104还用于将图像的显示位置设为越靠近显示部115的显示画面的纵向中央部的位置。此时,显示控制部104对各个关键词,设定显示部115的显示画面中的不同的显示位置。
另外,显示控制部104还用于在将像这样决定了图像大小以及显示位置的关键词在显示部115上显示时,如在图19中示例的这样,使其以标签云形式显示(步骤S56)。
根据该第六实施方式,用户能够视觉地以及直观地掌握哪一个关键词的出现次数最多。
接下来,对使关于在显示部115上显示的各关键词的附加信息显示的处理进行说明。图20是示出使关于在显示部115上显示的各关键词的附加信息显示的处理的流程图。
在第六实施方式中,在显示控制部104使各关键词或上述单词以标签云形式在显示部115上显示时,在利用由操作者进行的由鼠标等构成的输入部119的操作而指定了显示部115的显示画面中的位置时(在S61中为是),显示控制部104还用于检测在通过输入部119指定的该位置上显示的关键词(步骤S62),特定与该检测到的关键词建立对应关系并在HDD114中存储的附加信息(步骤S63)。显示控制部104还用于将该特定到的附加信息如在图21中示例的这样,进一步地在显示部115的显示画面上显示(步骤S64)。在此处,附加信息是例如关键词的出现次数、在会议中的发言时刻、由谁进行的发言等信息。附加信息是HDD114存储的。
根据该第六实施方式,用户能够利用简单的操作来目视确认关于显示的关键词的附加信息。
另外,在上述实施方式中,使用图1至图21示出的构成以及处理不过是本发明的一种实施方式,并不意味着将本发明限定于该构成以及处理。

Claims (4)

1.一种信息处理装置,其特征在于,具备:
第一检测部,用于从记录了由多人组成的小组中的各人的说话的语音数据中检测在该说话中作出的各发言;
文本化部,用于将通过所述第一检测部检测到的所述各发言的内容文本化;
存储部,用于存储预定的多个类别和属于各个所述多个类别的预定的关键词;
第二检测部,用于基于通过所述文本化部被文本化的文本数据,检测在所述各发言中包含的预定的关键词;
分类部,用于将通过所述第二检测部检测到的所述预定的关键词分类为所述预定的多个类别,
显示部;
显示控制部,用于使所属的各关键词的检测数总计为预定的值以上的类别以及属于该类别的所述预定的关键词与各关键词的检测数一起在所述显示部上显示。
2.一种信息处理装置,其特征在于,具备:
第一检测部,用于从记录了由多人组成的小组中的各人的说话的语音数据中检测在该说话中作出的各发言;
文本化部,用于将通过所述第一检测部检测到的所述各发言的内容文本化;
第二检测部,用于基于通过所述文本化部被文本化的文本数据,检测在所述各发言中包含的预定的关键词;
显示部;
显示控制部,用于使通过所述第二检测部检测到的所述预定的关键词在所述显示部上显示;
提取部,用于从所述文本数据中提取所述预定的关键词以外的单词,
所述显示控制部还用于使通过所述提取部提取到的单词中的、检测数为预定的值以上的单词在所述显示部上显示。
3.根据权利要求2所述的信息处理装置,其特征在于,所述显示控制部还用于使通过所述提取部提取到的单词且是检测数为预定的第三值以上的单词以与其他关键词不同的显示形态在所述显示部上显示。
4.一种信息处理装置,其特征在于,具备:
第一检测部,用于从记录了由多人组成的小组中的各人的说话的语音数据中检测在该说话中作出的各发言;
文本化部,用于将通过所述第一检测部检测到的所述各发言的内容文本化;
第二检测部,用于基于通过所述文本化部被文本化的文本数据,检测在所述各发言中包含的预定的关键词;
显示部;
显示控制部,用于使通过所述第二检测部检测到的所述预定的关键词在所述显示部上显示,
所述预定的关键词被设为多个,每检测到一次就对该各关键词设定预定的分数,所述显示控制部还用于根据检测次数对每一个所述关键词统计该分数,使各关键词与该分数一起在所述显示部上显示。
CN201880061642.9A 2017-12-25 2018-11-02 信息处理装置以及说话解析方法 Active CN111149153B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017-248460 2017-12-25
JP2017248460 2017-12-25
PCT/JP2018/040837 WO2019130817A1 (ja) 2017-12-25 2018-11-02 情報処理装置及び発話解析方法

Publications (2)

Publication Number Publication Date
CN111149153A CN111149153A (zh) 2020-05-12
CN111149153B true CN111149153B (zh) 2023-11-07

Family

ID=67063406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880061642.9A Active CN111149153B (zh) 2017-12-25 2018-11-02 信息处理装置以及说话解析方法

Country Status (4)

Country Link
US (1) US11404064B2 (zh)
JP (1) JP6904435B2 (zh)
CN (1) CN111149153B (zh)
WO (1) WO2019130817A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7218547B2 (ja) * 2018-11-16 2023-02-07 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
WO2023248677A1 (ja) * 2022-06-22 2023-12-28 株式会社Jvcケンウッド 情報表示制御装置および情報表示方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5987460A (en) * 1996-07-05 1999-11-16 Hitachi, Ltd. Document retrieval-assisting method and system for the same and document retrieval service using the same with document frequency and term frequency
JP2004016743A (ja) * 2002-06-20 2004-01-22 P To Pa:Kk 遊技機、遊技制御方法及びプログラム
JP2006251898A (ja) * 2005-03-08 2006-09-21 Fuji Xerox Co Ltd 情報処理装置、情報処理方法およびプログラム
JP2008009552A (ja) * 2006-06-27 2008-01-17 Nippon Telegr & Teleph Corp <Ntt> インデクス生成装置、インデクス生成方法およびインデクス生成プログラム
CN101256583A (zh) * 2007-03-01 2008-09-03 索尼株式会社 信息处理设备和方法、程序和存储介质
CN104142964A (zh) * 2013-06-13 2014-11-12 腾讯科技(北京)有限公司 信息匹配的方法及装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010224715A (ja) * 2009-03-23 2010-10-07 Olympus Corp 画像表示システム、デジタルフォトフレーム、情報処理システム、プログラム及び情報記憶媒体
EP2299440B1 (en) * 2009-09-11 2012-10-31 Vodafone Holding GmbH Method and Device for automatic recognition of given keywords and/or terms within voice data
JP2011066794A (ja) * 2009-09-18 2011-03-31 Sharp Corp 会議管理装置及び会議管理方法
JP5257330B2 (ja) * 2009-11-06 2013-08-07 株式会社リコー 発言記録装置、発言記録方法、プログラム及び記録媒体
JP5315289B2 (ja) * 2010-04-12 2013-10-16 トヨタ自動車株式会社 オペレーティングシステム及びオペレーティング方法
JP5196199B2 (ja) * 2010-04-22 2013-05-15 日本電気株式会社 キーワード表示システム、キーワード表示方法及びプログラム
US9501540B2 (en) * 2011-11-04 2016-11-22 BigML, Inc. Interactive visualization of big data sets and models including textual data
JP6401079B2 (ja) 2015-03-04 2018-10-03 Kddi株式会社 グループ毎の討論の活性化を推定する装置及びプログラム
ZA201504892B (en) * 2015-04-10 2016-07-27 Musigma Business Solutions Pvt Ltd Text mining system and tool
JP6524242B2 (ja) * 2015-08-31 2019-06-05 株式会社東芝 音声認識結果表示装置、音声認識結果表示方法、音声認識結果表示プログラム
WO2018173252A1 (ja) * 2017-03-24 2018-09-27 ヤマハ株式会社 重要単語抽出装置、及び関連会議抽出システム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5987460A (en) * 1996-07-05 1999-11-16 Hitachi, Ltd. Document retrieval-assisting method and system for the same and document retrieval service using the same with document frequency and term frequency
JP2004016743A (ja) * 2002-06-20 2004-01-22 P To Pa:Kk 遊技機、遊技制御方法及びプログラム
JP2006251898A (ja) * 2005-03-08 2006-09-21 Fuji Xerox Co Ltd 情報処理装置、情報処理方法およびプログラム
JP2008009552A (ja) * 2006-06-27 2008-01-17 Nippon Telegr & Teleph Corp <Ntt> インデクス生成装置、インデクス生成方法およびインデクス生成プログラム
CN101256583A (zh) * 2007-03-01 2008-09-03 索尼株式会社 信息处理设备和方法、程序和存储介质
CN104142964A (zh) * 2013-06-13 2014-11-12 腾讯科技(北京)有限公司 信息匹配的方法及装置

Also Published As

Publication number Publication date
US11404064B2 (en) 2022-08-02
US20200321004A1 (en) 2020-10-08
JPWO2019130817A1 (ja) 2020-10-22
JP6904435B2 (ja) 2021-07-14
CN111149153A (zh) 2020-05-12
WO2019130817A1 (ja) 2019-07-04

Similar Documents

Publication Publication Date Title
JP4662861B2 (ja) モニタリング装置、評価データ選別装置、応対者評価装置、応対者評価システムおよびプログラム
US20170169822A1 (en) Dialog text summarization device and method
US10347250B2 (en) Utterance presentation device, utterance presentation method, and computer program product
US11950020B2 (en) Methods and apparatus for displaying, compressing and/or indexing information relating to a meeting
CN110910901A (zh) 一种情绪识别方法及装置、电子设备和可读存储介质
CN111149153B (zh) 信息处理装置以及说话解析方法
JP7279928B2 (ja) 議論分析装置及び議論分析方法
KR20160040954A (ko) 긴급 재난신고를 판단하는 방법 및 장치
US20240048572A1 (en) Digital media authentication
CN111524503B (zh) 音频数据的处理方法、装置、音频识别设备和存储介质
JP2010273130A (ja) 詐欺進行度判定装置、辞書生成装置、詐欺進行度判定方法及び辞書生成方法
CN111010484A (zh) 一种通话录音自动质检方法
JP2014149571A (ja) コンテンツ検索装置
JP7403133B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP6285377B2 (ja) コミュニケーションスキル評価フィードバック装置、コミュニケーションスキル評価フィードバック方法及びコミュニケーションスキル評価フィードバックプログラム
WO2021190412A1 (zh) 一种生成视频缩略图的方法、装置和电子设备
CN114138960A (zh) 用户意图识别方法、装置、设备及介质
US11282518B2 (en) Information processing apparatus that determines whether utterance of person is simple response or statement
US20220051670A1 (en) Learning support device, learning support method, and recording medium
JP2019175382A (ja) 情報処理装置
KR102291113B1 (ko) 회의록 작성 장치 및 방법
US20240046704A1 (en) Determination method and determination apparatus
JP2014002336A (ja) コンテンツ処理装置、コンテンツ処理方法、およびコンピュータプログラム
WO2021179714A1 (zh) 人工合成语音检测方法、装置、计算机设备及存储介质
CN115379259B (zh) 视频处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant