CN112805734A - 用于唤起对发言禁止用语的注意的演讲辅助装置 - Google Patents
用于唤起对发言禁止用语的注意的演讲辅助装置 Download PDFInfo
- Publication number
- CN112805734A CN112805734A CN202080005536.6A CN202080005536A CN112805734A CN 112805734 A CN112805734 A CN 112805734A CN 202080005536 A CN202080005536 A CN 202080005536A CN 112805734 A CN112805734 A CN 112805734A
- Authority
- CN
- China
- Prior art keywords
- speech
- keyword
- word
- expression
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005764 inhibitory process Effects 0.000 title description 2
- 230000014509 gene expression Effects 0.000 claims abstract description 42
- 230000007246 mechanism Effects 0.000 claims abstract description 37
- 238000013500 data storage Methods 0.000 claims abstract description 10
- 239000000463 material Substances 0.000 claims description 53
- 238000011156 evaluation Methods 0.000 claims description 27
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 238000000034 method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 201000007201 aphasia Diseases 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/083—Recognition networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/432—Query formulation
- G06F16/433—Query formulation using audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Library & Information Science (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Economics (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Electrically Operated Instructional Devices (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提供一种演讲辅助装置,其显示与演讲资料相关联的关键词,并且在讲出发言禁止用语的情况下显示提醒,从而能够唤起注意。演讲辅助装置(1)具有演讲资料存储机构(3)、关键词存储机构(5)、关联用语存储机构(7)、NG词存储机构(9)、语音识别机构(11)、用语判断机构(15)和关键词输出机构(17),其中,关键词存储机构(5)存储与演讲资料相关联的多个关键词;关联用语存储机构(7)针对多个关键词中的各关键词分别存储一个或多个关联用语;NG词存储机构(9)针对多个关键词中的各关键词分别存储一个或多个NG词;用语判断机构(15)判断语音识别用语属于关联用语和NG词中的哪一个;在语音识别用语为关联用语的情况下,关键词输出机构(17)输出与关联用语相关联的关键词,在语音识别用语为NG词的情况下,关键词输出机构(17)输出与NG词相关联的关键词和提醒。
Description
技术领域
本发明涉及一种演讲辅助装置,该演讲辅助装置能够在演讲者讲出发言禁止用语时发出提醒以唤起注意。
背景技术
在日本发明专利公开公报特开2002-259635号中记载了一种通过图形对象和文本的组合来显示关键词的系统,其中,所述关键词来自讨论参与者在讨论的过程中所进行的发言。
在日本发明专利公开公报特开2017-224052号中记载了一种演讲评价装置。
现有技术文献
专利文献
专利文献1:日本发明专利公开公报特开2002-259635号
专利文献2:日本发明专利公开公报特开2017-224052号
发明内容
[发明所要解决的技术问题]
在进行演讲的情况下,希望显示关键词来顺畅地进行说明。另一方面,有时讲话者无意中讲出禁止用语,该禁止用语是不允许与演讲资料相关联而发言的用语。在这种情况下,期望一种当场促使修改发言的系统。
因此,本说明书所记载的一方式的发明的目的在于提供一种演讲辅助装置,该演讲辅助装置显示与演讲资料相关联的关键词,并且在讲出了发言禁止用语的情况下显示提醒,从而能够唤起注意。
[用于解决技术问题的技术方案]
本说明书的一方面所涉及的发明是基于以下的认识而做出的,即,通过与演讲资料相关联而存储关键词、与该关键词相关联的关联用语和NG词,通过语音识别来判断是否讲出关联用语和NG词,在讲出关联用语的情况下显示该关键词,除此之外,在讲出NG词的情况下输出规定的提醒,据此能够使演讲变得顺畅,另一方面,在发生失言的情况下,能够当场引导撤回该失言。
本说明书中记载的一个方式涉及一种演讲辅助装置1。
该装置具有演讲资料存储机构3、关键词存储机构5、关联用语存储机构7、NG词存储机构9、语音识别机构11、用语判断机构15和关键词输出机构17。
该装置例如通过计算机来安装。各机构例如是通过计算机安装的机构。
演讲资料存储机构3是用于存储演讲资料的结构要素。
关键词存储机构5是用于存储与演讲资料相关联的多个关键词的结构要素。
关联用语存储机构7是用于针对关键词存储机构存储的多个关键词中的各关键词存储一个或多个关联用语的机构。
NG词存储机构9是用于针对关键词存储机构存储的多个关键词中的各关键词存储一个或多个NG词的机构。
语音识别机构11是用于将讲话者的讲话识别为语音的机构。
用语判断机构15是用于判断语音识别用语属于关联用语和NG词中的哪一个的机构,所述语音识别用语是在语音识别机构识别出的语音中包含的用语。
关键词输出机构17是用于在语音识别用语为关联用语的情况下,输出与关联用语相关联的关键词,在语音识别用语为NG词的情况下,输出与NG词相关联的关键词和提醒的机构。
该演讲辅助装置的一方式还包括关键词制成更新机构19,该关键词制成更新机构19使用语音识别机构11识别出的与演讲资料相关联的用语,制成或更新与关键词存储机构5存储的演讲资料相关联的多个关键词。
该演讲辅助装置的一方式还包括评价点存储机构21和讲话评价机构23。
评价点存储机构21是用于存储与关键词、关联用语和NG词中的任一个或者两个以上相关联的评价点的结构要素。
讲话评价机构23是用于针对用语判断机构15判断出的关键词、关联用语和NG词,读取评价点存储机构21所存储的评价点,评价语音识别机构识别为语音的讲话的机构。
本说明书中记载的一方式涉及一种程序。该程序是用于使计算机作为演讲资料存储机构3、关键词存储机构5、关联用语存储机构7、NG词存储机构9、语音识别机构11、用语判断机构15和关键词输出机构17发挥功能的程序。
本说明书所记载的一方式涉及一种存储有上述程序的计算机可读信息记录介质。
[发明效果]
本说明书所记载的一方式的发明显示与演讲资料相关联的关键词,并且在讲出发言禁止用语的情况下显示提醒,从而能够唤起注意。
附图说明
图1是表示演讲辅助装置的结构例的概念图。
图2是表示计算机的基本结构的框图。
图3是表示本发明的系统例的概念图。
图4是用于说明演讲辅助方法的例子的流程图。
图5是表示显示演讲资料中与关联用语相关联的关键词的例子的概念图。
图6是表示输出与NG词有关的关键词和提醒的例子的概念图。
图7是表示能够设定与演讲资料对应的NG词的例子的概念图。
具体实施方式
下面,使用附图对用于实施本发明的方式进行说明。本发明不限定于以下说明的方式,还包括本领域技术人员根据以下方式在显而易见的范围内适宜地修正后的方式。
本说明书中记载的一个方式涉及一种演讲辅助装置1。演讲辅助装置是通过计算机安装的装置,在讲话者使用存储在计算机中的某一演讲资料进行演讲时使讲话者用的显示装置显示关键词来促使进行恰当的说明,或者在讲话者除了读出恰当的后续的演讲资料之外还讲出发言禁止用语这样的NG词的情况下,使讲话者用的显示装置输出提醒,来唤起讲话者的注意。该系统可以通过演讲者的移动终端(移动电话等计算机终端)来安装,也可以通过计算机或服务器来安装。
图1是表示演讲辅助装置的结构例的概念图。该装置1具有演讲资料存储机构3、关键词存储机构5、关联用语存储机构7、NG词存储机构9、语音识别机构11、用语判断机构15和关键词输出机构17。该装置例如通过计算机来安装。各机构例如是通过计算机安装的机构。
图2是表示计算机的基本结构的框图。如图所示,计算机包括输入部31、输出部33、控制部35、运算部37和存储部39,并且各结构要素通过总线41等连接,以便能够收发信息。例如,存储部可以存储控制程序,也可以存储各种信息。在从输入部输入了规定的信息的情况下,控制部读取被存储于存储部的控制程序。然后,控制部适宜地读取被存储于存储部中的信息,并传递给运算部。另外,控制部适宜地将被输入的信息传递给运算部。运算部使用接收到的各种信息进行运算处理,并存储在存储部中。控制部读取被存储在存储部中的运算结果,并将其从输出部输出。这样一来,执行各种处理。以下说明的各结构要素也可以与计算机的任一结构要素对应。
图3是表示本发明的系统例的概念图。如图3所示,本发明的系统(包括本发明的装置的系统)也可以包括与因特网或内联网43连接的移动终端45、和与因特网或内联网43连接的服务器47。当然,单个计算机或移动终端可以作为本发明的装置发挥功能,或者可以存在多个服务器。
演讲资料存储机构3是用于存储演讲资料的结构要素。例如,计算机的存储部作为演讲资料存储机构发挥功能。演讲资料的例子是PowerPoint(注册商标)的各页。演讲资料是被存储在计算机中并显示在显示部上以便能够向对话方或听众进行演讲的资料。
关键词存储机构5是用于存储与演讲资料相关联的多个关键词的机构。例如,计算机的存储部作为关键词存储机构发挥功能。与演讲资料相关联的多个关键词的例子是在基于PowerPoint的各页进行说明时优选使用的用语。存储部与PowerPoint等的演讲资料的各页相关联而存储多个关键词。
关联用语存储机构7是用于分别针对关键词存储机构存储的多个关键词中的各关键词存储一个或多个关联用语的机构。例如,计算机的存储部作为关联用语存储机构发挥功能。关联用语是在说出作为在说明时优选使用的用语的关键词的情况下与该关键词关联使用的用语。
NG词存储机构9是用于分别针对关键词存储机构存储的多个关键词中的各关键词存储一个或多个NG词的机构。例如,计算机的存储部作为NG词存储机构发挥功能。NG(Nogood:不好)词是发言禁止词语等与关键词相关联、且例如讲话者不能用于说明的用语,或者在使用这些用语的情况下修改后会更好的用语。NG词的例子例如是“嗯--”、“这个--”等延长了词间隔的用语,或者例如“无效”、“绝对”、“100%”、“保证”之类的断定用语、“笨蛋”、“无能”之类的责骂用语、“偏袒”、“瞎”之类的歧视用语。
语音识别机构11是用于将讲话者的讲话识别为语音的机构。语音信息经由计算机的输入部被从麦克风等语音采集装置输入到计算机。被输入的语音信息例如被暂时存储于存储部中。语音识别机构11例如是用于对被存储于存储部中的语音信息进行解析来将讲话者的讲话识别为语音的结构要素。语音识别技术是公知的技术。因此,可以使用公知的程序来安装语音识别机构11。语音识别机构11识别出的语音信息例如作为语音识别用语被存储在存储部中。
用语判断机构15是用于判断语音识别用语属于关联用语和NG词中的哪一个的机构,该语音识别用语是在语音识别机构识别出的语音中所包含的用语。用语判断机构15也可以对是否是关键词进行判断。用语判断机构15读出被存储在存储部中的语音识别用语。该语音识别用语可以是单词,也可以是短语。然后,用语判断机构15检索所读取的语音识别用语是否与被存储在存储部中的关联用语或NG词(进而或关键词)一致,如果有一致的关联用语或NG词(进而关键词),则将关联用语或NG词(进而关键词)与该语音识别用语一起存储在存储部中。如此一来,判断语音识别用语属于关联用语和NG词中的哪一个。
当语音识别用语是关联用语的情况下,关键词输出机构17输出与关联用语相关联的关键词,当语音识别用语是NG词时,关键词输出机构17输出与NG词相关联的关键词和提醒。提醒的例子可以是演讲者能听到的警告音,也可以是在显示部中显示用于唤起演讲者注意的用语(例如,“使用了使用禁止语。请注意”这样的用语)。另外,提醒也可以是在显示部中显示用于唤起演讲者注意的图案(例如,“!”、“×”这样的图案)的提醒。与NG词相关联的关键词的例子可以是在修改或订正NG词时使用的用语。通过显示这样的关键词,能够促使演讲者进行有效的修正。
在语音识别用语为关联用语的情况下,关键词输出机构17从关联用语存储机构7中读取与关联用语相关联的关键词,并输出给显示部,在显示部中显示该关键词。此外,也可以与演讲资料相关联而将演讲关联关键词存储在存储部中。而且,在与在显示部中显示出某一演讲资料时的讲话所包含的关联用语相关联的关键词是演讲关联关键词的情况下,可以将该演讲关联关键词用作关键词。这样一来,能够恰当地提取出与演讲资料相关联的关键词。于是,能够与演讲相关联而将说明者应使用的关键词显示在说明者所使用的显示部(例如,移动终端的显示部或者说明者所使用的个人计算机的显示屏幕)中。并且,能够提取出与该关键词相关联的其他演讲资料作为接下来的演讲资料的候选。
在语音识别用语为NG词时,关键词输出机构17从关联用语存储机构7读取与NG词存储机构9相关联的关键词,并输出给显示部,在显示部中显示该关键词。此外,也可以与演讲资料相关联而在存储部中存储演讲关联关键词。而且,在与NG词相关联的关键词是演讲关联关键词的情况下,也可以将该演讲关联关键词作为关键词。这样一来,能够恰当地提取出与演讲资料相关联的关键词。另外,也可以在存储部中存储作为与演讲资料相关联的NG词的演讲关联NG词。而且,在当在显示部中显示某一演讲资料时的讲话所包含的NG词是演讲关联NG词的情况下,也可以将该演讲关联NG词用作NG词。
于是,能够与演讲相关联而将说明者应使用的关键词显示在说明者所使用的显示部(例如,移动终端的显示部或者说明者所使用的个人计算机的显示屏幕)中。并且,能够提取出与该关键词相关联的其他演讲资料作为接下来的演讲资料的候选。
该演讲辅助装置的一方式还包括关键词制成更新机构19,该关键词制成更新机构19使用由语音识别机构11识别出的与演讲资料相关联的用语,制成或更新与关键词存储机构5存储的演讲资料相关联的多个关键词。在当在显示部中显示某一演讲资料时的讲话所包含的用语的频率高的情况下,可以说该用语是在使用该演讲资料进行说明时频繁使用的用语。在这种情况下,将在显示部中显示该演讲资料时使用的用语作为关联用语,以识别新的关键词,并且将该新的关键词存储在关键词存储机构中。对于该频率,例如在存储部中存储规定的次数、或者存储针对所有用语的使用频率的阈值。而且,当计算机判断某用语超过阈值时,可以将该用语新添加为与演讲资料有关的关键词。另外,也可以为,将阈值预先存储在存储部中,当尽管进行了多场演讲但也没有使用该关键词时,从与该演讲资料有关的关键词中删除该关键词。这样一来,能够自动地更新关键词存储机构。另外,即使在必要的说明或必要的用语随着时代而变化的情况下,也能够无需手动地更新关键词存储机构所存储的关键词而自动地更新关键词信息。并且,如果与某一演讲资料有关的关键词被更新,则关联用语、NG词也被自动更新,因此,不需要针对每个演讲资料改变关联用语和NG词。
此外,该装置的优选的一方式为,能够输出显示与各演讲资料有关的关键词的显示画面,并且在用户判断该关键词是NG词的情况下,以将该关键词作为与该演讲资料有关的NG词的方式将该关键词存储在存储部中。在这种情况下,与演讲资料相关联而单独读取该NG词,并且判断语音识别用语是否是NG词。
另外,即使没有预先存储关键词,也可以通过存储一个或多个由优秀演讲者基于某一演讲资料进行的说明并进行用语解析,来自动提取并存储与该演讲资料相关联的一个或多个关键词。为了提取关键词,可以使用与频率和概率有关的信息进行统计处理,也可以通过机器学习来提高关键词的精度。此外,也可以仅从不包含NG词的讲话(演讲)中提取关键词。
该演讲辅助装置的一方式还包括评价点存储机构21和讲话评价机构23。
评价点存储机构21是用于存储与关键词、关联用语和NG词中的任意一个或者两个以上相关联的评价点的结构要素。例如,存储部作为评价点存储机构21发挥功能。
讲话评价机构23是用于针对用语判断机构15判断出的关键词、关联用语和NG词,读取评价点存储机构21存储的评价点,并评价语音识别机构识别为语音的讲话的机构。语音识别机构11识别出的语音信息例如作为语音识别用语被存储在存储部中。而且,用语判断机构15检索所读取的语音识别用语是否与存储在存储部中的关联用语或NG词(进而或关键词)一致,如果有一致的关联用语或NG词(进而关键词),则将关联用语或NG词(进而关键词)与该语音识别用语一起存储在存储部中。讲话评价机构23从存储部读取关键词、关联用语和NG词,并且读取与从存储部读取的关键词、关联用语和NG词相关联的评价点。而且,例如读取与关键词、关联用语和NG词相关联的评价点,并且使运算部将这些评价点进行求和,其中,所述关键词、关联用语和NG词被包含在与某一讲话或某一演讲资料相关联的说明中。如此一来,能够评价与某一演讲资料相关联的讲话。此外,在演讲的情况下,讲话可能是单向的。在这种情况下,能够评价说明者的演讲能力。
本说明书中记载的一方式涉及一种程序。该程序是用于使计算机作为演讲资料存储机构3、关键词存储机构5、关联用语存储机构7、NG词存储机构9、语音识别机构11、用语判断机构15和关键词输出机构17发挥功能的程序。该程序可以是用于安装上述各方式的系统的程序。该程序也可以采用安装在移动终端中的应用程序的方式。
本说明书所记载的一方式涉及一种存储上述程序的计算机可读信息记录介质。信息记录介质的例子是CD-ROM、DVD、磁盘、存储卡和记忆条。
图4是用于说明演讲辅助方法的例子的流程图。
在计算机中预先存储有演讲资料、与演讲资料相关联的多个关键词、分别针对多个关键词中的各关键词的一个或多个关联用语、以及分别针对多个关键词中的各关键词的一个或多个NG词。
选择步骤(S101)
演讲者使用计算机选择某一演讲资料。于是,计算机接收选择了该演讲资料的信息。然后,计算机从存储部读取该演讲资料,并在显示部中显示该演讲资料(S101)。显示部可以是计算机的显示部,也可以是屏幕等。此外,例如,在进行输入而使PowerPoint(注册商标)前进到下一页的情况下,可判断为选择了与该下一页有关的演讲资料。另外,如后述那样,由于在演讲资料中显示关联用语及其关键词,因此在演讲者选择了该显示的关联用语、关键词的情况下,可以选择并显示与所选择的关联用语相关联的演讲资料。
用语读取步骤(S102)
计算机读取与该演讲资料相关联而被存储的关键词。然后,计算机从存储部中读取与所读取出的关键词相关联而被存储于存储部中的关联用语和NG词等用语(S102)。此时,为了进行后述的处理,也可以将关联用语和NG词暂时存储在存储部中。此外,某一关键词可以与多个演讲资料相关联而被存储。于是,即使在选择了另一演讲资料的情况下,也通过该关键词读取相同的关联用语和NG词。
语音识别步骤(S103)
当演讲开始时,计算机使用麦克风等将讲话者的讲话输入到计算机,并将讲话(演讲)识别为语音(S103)。识别出的语音也可以被适宜地存储在存储部中。另外,也可以对计算机识别出的语音进行用语转换而作为语音识别用语存储在存储部中。
关联用语判断步骤(S104)
计算机判断语音识别用语是否是关联用语,该语音识别用语是由语音识别装置识别出的语音中所包含的用语。计算机从存储部读取与演讲资料相关联的关联用语(也可以适宜地暂时存储关联用语)。因此,也可以使运算部进行语音识别用语是否与同该演讲资料相关联的关联用语一致的判断。
关联用语显示步骤(S105)
当在步骤104中判断语音识别用语是关联用语时,计算机从存储部中读取与该关联用语相关联的关键词,并将该关键词显示在显示部中。该关键词也可以是关联用语本身。此时,在讲话者和听众分别观看不同的显示部的情况下(例如,有讲话者使用的计算机,讲话者可以观看该监视器,听众可以观看听众用的计算机终端、显示部或屏幕的情况下),可以仅在讲话者的显示部中显示关联用语。这样的处理通过将显示关联用语或关键词的命令仅输出给讲话者的计算机来实现。于是,仅对讲话者显示关联用语及其关键词,并且这些词成为演讲的提示,这有助于选择下一演讲资料。
图5是表示在演讲资料中显示与关联用语相关联的关键词的例子的概念图。在该例子中,在演讲者(讲话者)所使用的显示部中显示有与关联用语相关联的关键词。在该例子中,显示了“人机交互”和“解决方案”这样的用语。演讲者除了使用该用语对其进行说明之外,当在屏幕上触摸这些用语或者用指示器指示这些用语时,读取与当前演讲资料相关联并且与“人机交互”或“解决方案”有关的演讲资料。对于该新的演讲资料而言,也可以进行与上述相同的处理。
NG词判断步骤(S106)
当在步骤104中判断语音识别用语不是关联用语时,计算机判断语音识别用语是否属于NG词。计算机从存储部读取与演讲资料相关联的NG词(也可以适宜地暂时存储NG词)。因此,也可以使运算部进行语音识别用语是否与同该演讲资料相关联的NG词一致的判断。
提醒输出(S107)
当语音识别用语是NG词时(在步骤106中,为是的情况),计算机从存储部读取与NG词相关联的关键词和提醒,并进行输出。提醒的例子可以为,将在显示部中显示的关键词显示为红色,或以在显示部中进行“NG词!”这样的显示的方式唤起演讲者注意的输出。提醒的另一个例子是通过语音输出到演讲者的头戴式受话器的警告音。与NG词相关联的关键词可以在显示部中显示。
图6是表示与NG词有关的关键词和提醒被输出的例子的概念图。在该例子中,演讲者对某一药物讲出“绝对会有效”。这是与关键词“绝对有效”有关的关联用语之一。在显示部中显示有作为与发言的关联用语“绝对会有效”相关联的关键词的“绝对有效”。另外,在其上部进行促使修正的显示。图6的显示与图5的显示相比,强调了关键词,唤起了演讲者的注意。另外,可以同时判断关联用语和NG词,或者可以先判断是否是NG词,然后判断是否是关联用语。也可以判断语音识别用语是否是关键词。于是,也可以判断在演讲中是否使用了关键词。如此一来,评价演讲中所包含的用语。
图7是表示能够设定与演讲资料对应的NG词的例子的概念图。如图7所示,在该例子中,输出用于显示与各演讲资料有关的关键词的显示画面。然后,在用户判断该关键词是NG词的情况下,输入与该演讲资料有关的NG词。例如,通过点击与关键词相关联的图标或者通过使用单选按钮建立NG词标记来进行输入。于是,存储部将该NG词与演讲资料相关联而进行存储。另外,在选择了该演讲资料的情况下,单独地读取该NG词,并且判断语音识别用语是否是NG词。此外,在图7的例子中,对于关键词“XXXX”建立NG词用的标志。在该例子中,当用户在管理画面上点击与关键词相关联的单选按钮时,表示选择了该关键词的意思的信息被输入到计算机,该关键词被设定为NG词,并被存储在存储部中。
[工业适用性]
本发明涉及一种演讲辅助装置,因此,能够在信息相关产业中利用。
[附图标记说明]
1:演讲辅助装置;3:演讲资料存储机构;5:关键词存储机构;7:关联用语存储机构;9:NG词存储机构;11:语音识别机构;15:用语判断机构;17:关键词输出机构。
Claims (5)
1.一种演讲辅助装置(1),其特征在于:
具有演讲资料存储机构(3)、关键词存储机构(5)、关联用语存储机构(7)、NG词存储机构(9)、语音识别机构(11)、用语判断机构(15)和关键词输出机构(17),其中,
所述演讲资料存储机构(3)存储演讲资料;
所述关键词存储机构(5)存储与所述演讲资料相关联的多个关键词;
所述关联用语存储机构(7)针对所述关键词存储机构存储的多个所述关键词中的各关键词分别存储一个或多个关联用语;
所述NG词存储机构(9)针对所述关键词存储机构存储的多个所述关键词中的各关键词分别存储一个或多个NG词;
所述语音识别机构(11)将讲话者的讲话识别为语音;
所述用语判断机构(15)判断语音识别用语属于所述关联用语和所述NG词中的哪一个,所述语音识别用语是在所述语音识别机构识别出的语音中包含的用语;
在所述语音识别用语为关联用语的情况下,所述关键词输出机构(17)输出与所述关联用语相关联的关键词,在所述语音识别用语为所述NG词的情况下,所述关键词输出机构(17)输出与所述NG词相关联的关键词和提醒。
2.根据权利要求1所述的演讲辅助装置,其特征在于,
还包括关键词制成更新机构(19),该关键词制成更新机构(19)使用所述语音识别机构(11)识别出的与所述演讲资料相关联的用语,制成或更新与所述关键词存储机构(5)存储的所述演讲资料相关联的多个关键词。
3.根据权利要求1所述的演讲辅助装置,其特征在于,
还包含评价点存储机构(21)和讲话评价机构(23),其中,
所述评价点存储机构(21)存储与所述关键词、所述关联用语和所述NG词中的任一个或者两个以上相关联的评价点;
所述讲话评价机构(23)针对所述用语判断机构(15)判断出的所述关键词、所述关联用语和所述NG词,读取所述评价点存储机构(21)所存储的评价点,评价所述语音识别机构识别为语音的讲话。
4.一种程序,其特征在于,
用于使计算机作为演讲资料存储机构(3)、关键词存储机构(5)、关联用语存储机构(7)、NG词存储机构(9)、语音识别机构(11)、用语判断机构(15)和关键词输出机构(17)来发挥功能,其中,
所述演讲资料存储机构(3)存储演讲资料;
所述关键词存储机构(5)存储与所述演讲资料相关联的多个关键词;
所述关联用语存储机构(7)针对所述关键词存储机构存储的多个所述关键词中的各关键词分别存储一个或多个关联用语;
所述NG词存储机构(9)针对所述关键词存储机构存储的多个所述关键词中的各关键词分别存储一个或多个NG词;
所述语音识别机构(11)将讲话者的讲话识别为语音;
所述用语判断机构(15)判断语音识别用语属于所述关联用语和所述NG词中的哪一个,所述语音识别用语是在所述语音识别机构识别出的语音中包含的用语;
在所述语音识别用语为关联用语的情况下,所述关键词输出机构(17)输出与所述关联用语相关联的关键词,在所述语音识别用语为所述NG词的情况下,所述关键词输出机构(17)输出与所述NG词相关联的关键词和提醒。
5.一种计算机可读信息记录介质,其特征在于,
存储有权利要求4所述的程序。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019-008121 | 2019-01-22 | ||
JP2019008121A JP6739811B2 (ja) | 2019-01-22 | 2019-01-22 | 発言禁止用語に対し注意を喚起するためのプレゼンテーション支援装置 |
PCT/JP2020/000073 WO2020153109A1 (ja) | 2019-01-22 | 2020-01-06 | 発言禁止用語に対し注意を喚起するためのプレゼンテーション支援装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112805734A true CN112805734A (zh) | 2021-05-14 |
Family
ID=71735706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080005536.6A Pending CN112805734A (zh) | 2019-01-22 | 2020-01-06 | 用于唤起对发言禁止用语的注意的演讲辅助装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11373638B2 (zh) |
JP (1) | JP6739811B2 (zh) |
CN (1) | CN112805734A (zh) |
CA (1) | CA3115974C (zh) |
SG (1) | SG11202102693RA (zh) |
WO (1) | WO2020153109A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116034427A (zh) * | 2021-08-27 | 2023-04-28 | 互动解决方案公司 | 使用计算机的会话支持方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7075096B2 (ja) * | 2020-10-28 | 2022-05-25 | ベルフェイス株式会社 | 情報処理システム、情報処理方法及びプログラム |
JP7049010B1 (ja) * | 2021-03-02 | 2022-04-06 | 株式会社インタラクティブソリューションズ | プレゼンテーション評価システム |
JP7102035B1 (ja) * | 2021-08-02 | 2022-07-19 | 株式会社インタラクティブソリューションズ | 説明支援システム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008069187A1 (ja) * | 2006-12-05 | 2008-06-12 | The University Of Tokyo | プレゼンテーション支援装置および方法並びにプログラム |
WO2009020092A1 (ja) * | 2007-08-03 | 2009-02-12 | Nec Corporation | 関連情報検索システム及び関連情報検索方法 |
CN101794576A (zh) * | 2010-02-02 | 2010-08-04 | 重庆大学 | 一种脏话检测助手及其使用方法 |
CN102006176A (zh) * | 2009-08-31 | 2011-04-06 | 夏普株式会社 | 会议中继装置以及会议系统 |
JP2013025609A (ja) * | 2011-07-22 | 2013-02-04 | Mizuho Information & Research Institute Inc | 説明支援システム、説明支援方法及び説明支援プログラム |
CN108763499A (zh) * | 2018-05-30 | 2018-11-06 | 平安科技(深圳)有限公司 | 基于智能语音的呼叫质检方法、装置、设备及存储介质 |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7286115B2 (en) * | 2000-05-26 | 2007-10-23 | Tegic Communications, Inc. | Directional input system with automatic correction |
US7730113B1 (en) * | 2000-03-07 | 2010-06-01 | Applied Discovery, Inc. | Network-based system and method for accessing and processing emails and other electronic legal documents that may include duplicate information |
MXPA02010760A (es) * | 2000-05-01 | 2004-05-17 | Netoncourse Inc | Interacciones de grupos grandes mediante red de comunicacion en masa. |
GB2368223B (en) * | 2000-10-17 | 2004-01-07 | Hewlett Packard Co | Associating parties with communication sessions |
US7966187B1 (en) * | 2001-02-15 | 2011-06-21 | West Corporation | Script compliance and quality assurance using speech recognition |
JP2002259635A (ja) | 2001-03-05 | 2002-09-13 | Keio Academic Enterprise Co Ltd | 認識共有化支援方法、議論構造化支援方法、状況把握支援方法、図形思考力開発支援方法、協創環境構築支援方法、質疑応答支援方法、議事録作成支援方法 |
JP4218758B2 (ja) * | 2004-12-21 | 2009-02-04 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 字幕生成装置、字幕生成方法、及びプログラム |
WO2008025008A2 (en) * | 2006-08-24 | 2008-02-28 | Neustar, Inc. | System and method for filtering offensive information content in communication systems |
US8156518B2 (en) * | 2007-01-30 | 2012-04-10 | At&T Intellectual Property I, L.P. | System and method for filtering audio content |
US8176055B1 (en) * | 2007-03-27 | 2012-05-08 | Google Inc. | Content entity management |
US10867123B2 (en) * | 2009-11-09 | 2020-12-15 | Microsoft Technology Licensing, Llc | Social browsing |
US20090288112A1 (en) * | 2008-05-13 | 2009-11-19 | Porto Technology, Llc | Inserting advance content alerts into a media item during playback |
US20090288131A1 (en) * | 2008-05-13 | 2009-11-19 | Porto Technology, Llc | Providing advance content alerts to a mobile device during playback of a media item |
JP2011022886A (ja) * | 2009-07-17 | 2011-02-03 | Fujitsu Ltd | フィルタリングプログラム、フィルタリング装置およびフィルタリング方法 |
JP5510888B2 (ja) * | 2010-02-03 | 2014-06-04 | 住友電装株式会社 | 電気接続箱 |
US20110282727A1 (en) * | 2010-05-14 | 2011-11-17 | Minh Phan | Content management in out-of-home advertising networks |
AU2012212517A1 (en) * | 2011-02-04 | 2013-08-22 | Google Inc. | Posting to social networks by voice |
JP2013025608A (ja) * | 2011-07-22 | 2013-02-04 | Mizuho Information & Research Institute Inc | 説明支援システム、説明支援方法及び説明支援プログラム |
US20130297706A1 (en) * | 2012-05-03 | 2013-11-07 | United Video Properties, Inc. | Systems and methods for processing input from a plurality of users to identify a type of media asset segment |
US9563874B1 (en) * | 2012-06-14 | 2017-02-07 | Google Inc. | Rule-based content filter |
US20150070516A1 (en) * | 2012-12-14 | 2015-03-12 | Biscotti Inc. | Automatic Content Filtering |
JP2014123813A (ja) * | 2012-12-20 | 2014-07-03 | Ntt Comware Corp | オペレータ対顧客会話自動採点装置およびその動作方法 |
US8990068B2 (en) * | 2013-02-08 | 2015-03-24 | Machine Zone, Inc. | Systems and methods for multi-user multi-lingual communications |
US9031829B2 (en) * | 2013-02-08 | 2015-05-12 | Machine Zone, Inc. | Systems and methods for multi-user multi-lingual communications |
US8996353B2 (en) * | 2013-02-08 | 2015-03-31 | Machine Zone, Inc. | Systems and methods for multi-user multi-lingual communications |
US9600473B2 (en) * | 2013-02-08 | 2017-03-21 | Machine Zone, Inc. | Systems and methods for multi-user multi-lingual communications |
US8996352B2 (en) * | 2013-02-08 | 2015-03-31 | Machine Zone, Inc. | Systems and methods for correcting translations in multi-user multi-lingual communications |
US10397363B2 (en) * | 2013-03-27 | 2019-08-27 | Facebook, Inc. | Scoring user characteristics |
US9225833B1 (en) * | 2013-07-24 | 2015-12-29 | Noble Systems Corporation | Management system for using speech analytics to enhance contact center agent conformance |
US9351134B2 (en) * | 2013-09-06 | 2016-05-24 | 935 Kop Associates, Llc | Messaging service application programming interface |
JP6183841B2 (ja) * | 2013-09-17 | 2017-08-23 | 株式会社日本総合研究所 | Ngワードの兆候を把握するコールセンタ用語管理システム及びその方法 |
US9799347B2 (en) * | 2013-10-24 | 2017-10-24 | Voyetra Turtle Beach, Inc. | Method and system for a headset with profanity filter |
US9257117B2 (en) * | 2014-02-04 | 2016-02-09 | Avaya Inc. | Speech analytics with adaptive filtering |
RU2670029C2 (ru) * | 2014-06-03 | 2018-10-17 | Общество С Ограниченной Ответственностью "Яндекс" | Система и способ автоматической модерации сообщений |
CA2984904C (en) * | 2015-05-08 | 2023-09-19 | Thomson Reuters Global Resources | Social media events detection and verification |
JP6519413B2 (ja) * | 2015-08-31 | 2019-05-29 | 富士通株式会社 | 迷惑電話検出装置、迷惑電話検出方法、及びプログラム |
US10198403B2 (en) * | 2016-05-27 | 2019-02-05 | Facebook, Inc. | Distributing content via content publishing platforms |
JP6846766B2 (ja) | 2016-06-13 | 2021-03-24 | 株式会社インタラクティブソリューションズ | プレゼンテーション評価装置、プレゼンテーション評価システム、プレゼンテーション評価プログラム及びプレゼンテーション評価装置の制御方法 |
US11257482B2 (en) * | 2017-03-20 | 2022-02-22 | Samsung Electronics Co., Ltd. | Electronic device and control method |
US10258295B2 (en) * | 2017-05-09 | 2019-04-16 | LifePod Solutions, Inc. | Voice controlled assistance for monitoring adverse events of a user and/or coordinating emergency actions such as caregiver communication |
US20190364126A1 (en) * | 2018-05-25 | 2019-11-28 | Mark Todd | Computer-implemented method, computer program product, and system for identifying and altering objectionable media content |
US10630738B1 (en) * | 2018-09-28 | 2020-04-21 | Ringcentral, Inc. | Method and system for sharing annotated conferencing content among conference participants |
-
2019
- 2019-01-22 JP JP2019008121A patent/JP6739811B2/ja active Active
-
2020
- 2020-01-06 WO PCT/JP2020/000073 patent/WO2020153109A1/ja active Application Filing
- 2020-01-06 SG SG11202102693RA patent/SG11202102693RA/en unknown
- 2020-01-06 CA CA3115974A patent/CA3115974C/en active Active
- 2020-01-06 US US17/281,257 patent/US11373638B2/en active Active
- 2020-01-06 CN CN202080005536.6A patent/CN112805734A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008069187A1 (ja) * | 2006-12-05 | 2008-06-12 | The University Of Tokyo | プレゼンテーション支援装置および方法並びにプログラム |
WO2009020092A1 (ja) * | 2007-08-03 | 2009-02-12 | Nec Corporation | 関連情報検索システム及び関連情報検索方法 |
CN102006176A (zh) * | 2009-08-31 | 2011-04-06 | 夏普株式会社 | 会议中继装置以及会议系统 |
CN101794576A (zh) * | 2010-02-02 | 2010-08-04 | 重庆大学 | 一种脏话检测助手及其使用方法 |
JP2013025609A (ja) * | 2011-07-22 | 2013-02-04 | Mizuho Information & Research Institute Inc | 説明支援システム、説明支援方法及び説明支援プログラム |
CN108763499A (zh) * | 2018-05-30 | 2018-11-06 | 平安科技(深圳)有限公司 | 基于智能语音的呼叫质检方法、装置、设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116034427A (zh) * | 2021-08-27 | 2023-04-28 | 互动解决方案公司 | 使用计算机的会话支持方法 |
CN116034427B (zh) * | 2021-08-27 | 2024-02-20 | 互动解决方案公司 | 使用计算机的会话支持方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6739811B2 (ja) | 2020-08-12 |
SG11202102693RA (en) | 2021-04-29 |
US20210398523A1 (en) | 2021-12-23 |
WO2020153109A1 (ja) | 2020-07-30 |
JP2020119112A (ja) | 2020-08-06 |
CA3115974A1 (en) | 2020-07-30 |
US11373638B2 (en) | 2022-06-28 |
CA3115974C (en) | 2022-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112805734A (zh) | 用于唤起对发言禁止用语的注意的演讲辅助装置 | |
US6321196B1 (en) | Phonetic spelling for speech recognition | |
US6839667B2 (en) | Method of speech recognition by presenting N-best word candidates | |
JP3724461B2 (ja) | 音声制御装置 | |
US20020123894A1 (en) | Processing speech recognition errors in an embedded speech recognition system | |
JP2002511154A (ja) | ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム | |
US8612231B2 (en) | Method and system for speech based document history tracking | |
JP2000056792A (ja) | ユ―ザの発話を認識するための方法及び装置 | |
CN109326284B (zh) | 语音搜索的方法、装置和存储介质 | |
US6253177B1 (en) | Method and system for automatically determining whether to update a language model based upon user amendments to dictated text | |
JP2009042968A (ja) | 情報選別システム、情報選別方法及び情報選別用プログラム | |
CN111902831B (zh) | 演示支援系统 | |
JP2010072098A (ja) | 発話入力の音声認識のためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム | |
JP2006259641A (ja) | 音声認識装置及び音声認識用プログラム | |
US20220100959A1 (en) | Conversation support device, conversation support system, conversation support method, and storage medium | |
CN110148414B (zh) | 一种语音说法引导方法和装置 | |
CN111353038A (zh) | 数据展示方法、装置、计算机设备和存储介质 | |
JP2017054038A (ja) | 学習支援装置及びその学習支援装置用のプログラム | |
KR101830210B1 (ko) | 적어도 하나의 의미론적 유닛의 집합을 개선하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 | |
KR101704501B1 (ko) | 적어도 하나의 의미론적 유닛의 집합을 개선하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 | |
CN113345442A (zh) | 语音识别方法、装置、电子设备及存储介质 | |
CN113920803A (zh) | 一种错误反馈方法、装置、设备及可读存储介质 | |
CN117473113A (zh) | 一种处理文本的方法、装置、设备及存储介质 | |
KR20180019497A (ko) | 전문가 교정이 가능한 발음 학습 시스템 | |
JP2006343661A (ja) | 音声認識装置および音声認識プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |