CN108780542B - 作业支持系统、管理服务器、便携式终端、作业支持方法以及程序 - Google Patents
作业支持系统、管理服务器、便携式终端、作业支持方法以及程序 Download PDFInfo
- Publication number
- CN108780542B CN108780542B CN201780016642.2A CN201780016642A CN108780542B CN 108780542 B CN108780542 B CN 108780542B CN 201780016642 A CN201780016642 A CN 201780016642A CN 108780542 B CN108780542 B CN 108780542B
- Authority
- CN
- China
- Prior art keywords
- job
- information
- voice recognition
- item
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 28
- 238000003860 storage Methods 0.000 claims abstract description 42
- 238000004891 communication Methods 0.000 claims description 51
- 238000007689 inspection Methods 0.000 abstract description 43
- 238000012795 verification Methods 0.000 abstract description 34
- 238000010586 diagram Methods 0.000 description 20
- 230000005856 abnormality Effects 0.000 description 17
- 238000012986 modification Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/157—Transformation using dictionaries or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Acoustics & Sound (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
Abstract
本发明的目的是提高针对与高噪声条件下执行的检查和检验作业相关联的语音输入的语音识别性能。一种管理服务器包括:接受部,被配置为接受单据信息,所述单据信息将指示作业项目的作业项目信息与作业结果候选相关联并保持;词典登记部,被配置为将包含在所述单据信息中的作业结果候选与作业项目或单据信息相关联地登记在词典中;存储部,被配置为将所述单据信息与所述词典相关联并存储;以及发送部,被配置为当所述发送部发送所述单据信息时将所述单据信息与相关联的词典一起发送。
Description
相关申请的交叉引用
本申请基于并要求2016年6月21日递交的日本专利申请No.2016-122804的优先权的权益,其公开通过引用整体并入本文。
技术领域
本发明涉及作业支持系统、管理服务器、便携式终端、作业支持方法以及程序。更具体地,本发明涉及用于支持作业人员的无需用手的检查和检验作业的作业支持系统、管理服务器、便携式终端、作业支持方法以及程序。
背景技术
近年来,用于将人类声音转换为文字的语音识别技术已经取得了显著进步。随着这一进步,语音识别技术已经开始应用于以下情况下的语音输入:联络中心的业务支持、会议录的生成支持、或者工厂或办公室中的检查和检验作业。
作为相关技术,专利文献(PTL)1描述了一种口语对话系统,用于即使在系统错误地识别了用户的话语时也能顺利地推进用户与系统之间的对话。
[引用列表]
[专利文献]
[专利文献1]
JP专利特开No.JP2005-316247A
发明内容
[技术问题]
上面列出的专利文献的公开内容通过引用整体并入本文。以下分析是由本发明的发明人做出的。
通常,在工厂或办公室的检查和检验作业中有大量用于检查和检验的项目(下文中,称为“作业项目”)。因此,作业人员需要在参考基于纸张的作业项目列表的同时依次执行作业。在这种情况下,作业人员需要暂时中断作业以便参考作业项目列表,从而可能降低作业效率。
当执行许多作业项目时,作业人员需要在每次执行各作业项目并获得作业结果时记录(存储)作业结果。然而,当作业人员通过手写将作业结果写入预定文件、或当作业人员手动将作业结果输入平板电脑、智能手机或笔记本电脑(以下称为“便携式终端”)时,作业人员需要一度中断作业,从而可能进一步降低作业效率。
因此,为了实现执行检查和检验作业时的作业效率的提高,期望在无需用手(空着手)的状态下进行要执行的作业项目的核对和作业结果的输入。作为用于顺应这种请求的技术,用于通过语音来引导作业项目的同时执行作业结果的语音输入的技术已经投入实际使用。
另外,在工厂装配(生产)线上进行的产品的检查和检验作业中,作业人员周围的环境还可能处于高噪声下。当在这样的环境下执行作业结果的语音输入时,输入结果可能不是作业人员想要的结果,因此作业人员需要重复发声,直到获得正确的输入结果为止,或者需要代替语音输入而手动重新输入作业结果。
在专利文献1中描述的技术中,需要以下复杂过程。也就是说,为了修改被系统错误识别的用户的话语,提供了被配置为记录对话状态变化的对话历史,使用对话历史中的信息和预先提供的模板来创建用于识别用户的要被纠正的话语的规则,当通过使用所创建的规则识别用户的话语时,将用户的话语视为要被纠正的话语,然后转到修改错误识别的过程。即使采用了专利文献1中的技术,也需要用户的重复发声。
为了避免作业人员的这种重复的语音输入,期望即使作业环境处于高噪声下也尽可能地减少错误识别作业人员的语音输入的可能性。
因此,问题在于,提高针对与高噪声下执行的检查和检验作业相关联的语音输入的语音识别性能。本发明的目的是提供有助于解决上述挑战的作业支持系统、管理服务器、便携式终端、作业支持方法以及程序。
[问题的解决方案]
根据本发明的第一方面的一种管理服务器可以包括:接受部,被配置为接受单据信息,所述单据信息将指示作业项目的作业项目信息与作业结果候选相关联并保持;词典登记部,被配置为将包含在所述单据信息中的作业结果候选与作业项目或单据信息相关联地登记在词典中;存储部,被配置为将所述单据信息与所述词典相关联并存储;发送部,被配置为当所述发送部发送所述单据信息时将所述单据信息与相关联的词典一起发送。
根据本发明的第二方面的一种便携式终端可以包括:通信部,被配置为获得单据信息和与所述单据信息相关联的词典,所述单据信息包括指示作业项目的作业项目信息;提示部,被配置为提示所述作业项目信息;语音识别部,被配置为使用所述词典对针对所述作业项目信息接受的语音输入执行语音识别;以及存储部,被配置为将语音识别的结果作为针对所述作业项目信息的作业结果进行保持。
根据本发明的第三方面的一种作业支持系统可以包括所述管理服务器和所述便携式终端。
根据本发明的第四方面的一种作业支持方法可以包括由管理服务器执行的以下步骤:接受单据信息,所述单据信息将指示作业项目的作业项目信息与作业结果候选相关联并保持;将包含在所述单据信息中的作业结果候选与作业项目或单据信息相关联地登记在词典中;将所述单据信息与所述词典相关联并存储;以及当发送所述单据信息时将所述单据信息与相关联的词典一起发送。
根据本发明的第五方面的一种作业支持方法可以包括由便携式终端执行的以下步骤:获得单据信息和与所述单据信息相关联的词典,所述单据信息包括指示作业项目的作业项目信息;提示所述作业项目信息;使用所述词典对针对所述作业项目信息接受的语音输入执行语音识别;以及将语音识别的结果作为针对所述作业项目信息的作业结果进行保持。
根据本发明的第六方面的一种程序使计算机执行以下过程:接受单据信息,所述单据信息将指示作业项目的作业项目信息与作业结果候选相关联并保持;将包含在所述单据信息中的作业结果候选与作业项目或单据信息相关联地登记在词典中;将所述单据信息与所述词典相关联并存储;以及当发送所述单据信息时将所述单据信息与相关联的词典一起发送。
根据本发明的第七方面的一种程序使计算机执行以下过程:获得单据信息和与所述单据信息相关联的词典,所述单据信息包括指示作业项目的作业项目信息;提示所述作业项目信息;使用所述词典对针对所述作业项目信息接受的语音输入执行语音识别;以及将语音识别的结果作为针对所述作业项目信息的作业结果进行保持。
所述程序可以被提供为记录在非暂时性计算机可读存储介质中的程序产品。
[发明的有益效果]
根据本发明的作业支持系统、管理服务器、便携式终端、作业支持方法以及程序,能够提高针对与高噪声下执行的检查和检验作业相关联的语音输入的语音识别性能。
附图说明
图1示出了根据示例性实施例的作业支持系统的结构的图。
图2示出了根据第一示例性实施例的作业支持系统的结构的框图。
图3示出根据第一示例性实施例的作业支持系统中的管理服务器和便携式终端所保持的数据的图。
图4示出了第一示例性实施例中的作业单的格式(形式)的表。
图5示出了第一示例性实施例中的作业单中描述的选项的格式的图。
图6示出了第一示例性实施例中的作业单中描述的数值的格式的图。
图7示出了第一示例性实施例中的自定义词典的生成方法的图。
图8示出了第一示例性实施例中的作业结果文件的格式的表。
图9示出了第一示例性实施例中的作业支持系统的操作的时序图。
图10示出了根据第一示例性实施例的作业支持系统的操作的流程图。
图11示出了根据第二示例性实施例的作业支持系统的结构的框图。
图12示出了第二示例性实施例中的作业单的格式的表。
图13示出了第三示例性实施例中的作业单的格式的表。
图14包括示出了第三示例性实施例中的作业单的格式的多个表。
图15示出了根据第四示例性实施例的作业支持系统的结构的框图。
图16示出了根据第四示例性实施例的作业支持系统中的管理服务器和便携式终端所保持的数据的图。
图17示出了根据第四示例性实施例的作业支持系统的操作的时序图。
图18示出了根据第五示例性实施例的作业支持系统中的管理服务器和便携式终端所保持的数据的图。
图19示出了根据第五示例性实施例的作业支持系统的操作的时序图。
具体实施方式
首先,将描述对本发明示例实施例的概述。该概述中给出的附图标记是仅用于帮助理解的例示,其目的不是将本发明限制为图示的方式。
图1是示出了根据示例性实施例的作业支持系统的结构的图。参考图1,作业支持系统包括管理服务器1和便携式终端2(诸如由作业人员携带的智能电话)。本发明中的作业支持系统是用于根据作业指示执行的针对作业(诸如装配作业、包装作业、搬运作业或测量作业)的作业支持系统。
图2是示出了管理服务器1和便携式终端2的结构的框图。参考图2,管理服务器1包括:接受部(例如通信部11),被配置为接受单据信息,所述单据信息将指示作业项目的作业项目信息(例如,图4的作业项目、作业内容(用于读出))与一个或多个作业结果候选(例如,每个作业结果候选由图4中的输入类型和选项指定)相关联并保持;词典登记部13,被配置为将包含在所述单据信息中的作业结果候选与作业项目或单据信息相关联地登记在词典中;存储部12,被配置为将所述单据信息与所述词典相关联并存储;以及发送部(例如通信部11),被配置为当所述发送部发送所述单据信息时将所述单据信息与相关联的词典一起发送(例如,发送到便携式终端2)。另一方面,便携式终端2包括:通信部21,被配置为获得单据信息和与所述单据信息相关联的词典,所述单据信息包括指示作业项目的作业项目信息;提示部23,被配置为提示(例如,显示或读出)所述作业项目信息;语音识别部24,被配置为使用所述词典对针对所述作业项目信息接受的语音输入执行语音识别;以及存储部22,被配置为将(例如,图8)语音识别的结果作为针对所述作业项目信息的作业结果进行保持。
在根据示例性实施例的作业支持系统中,管理服务器在词典(诸如语音识别词典)中登记作业人员要执行其语音输入的一个或多个输入候选(作业结果候选),作为各作业项目的一个或多个作业结果。便携式终端使用从管理服务器获得的词典来执行语音识别。在这种情况下,便携式终端的语音识别中的输入候选限于在词典中登记的一个或多个候选(诸如字符串或数字表达)。因此,可以显著降低发生错误识别的可能性。因此,根据示例性实施例中的作业支持系统,可以提高针对与作业人员在高噪声下执行的作业相关联的语音输入的语音识别性能。
此外,在根据示例性实施例的作业支持系统中,作为作业开始之前的预先准备,现场管理者只需在管理服务器中登记将作业项目与一个或多个作业结果输入候选相关联的单据便足够。因此,根据示例性实施例中的作业支持系统,仅通过改变单据的描述内容,该系统就可以应用于各种行业中的各种检查和检验作业,而无需改变系统的硬件和软件配置。
<第一示例性实施例>
接着,将参考附图描述根据第一示例性实施例的作业支持系统。
[结构]
图2是示出了根据该示例性实施例的作业支持系统的结构的框图。参考图2,作业支持系统包括管理服务器1和便携式终端2。另外,图2还示出了能够访问作业支持系统中的管理服务器1的管理者终端3。
图3是示出了由管理服务器1和便携式终端2保持的数据的图。参考图3,管理服务器1的存储部12存储模板、作业单、自定义词典、语音识别词典、作业人员文件和作业结果文件。另一方面,便携式终端2的存储部22存储作业单、语音识别词典和作业结果文件。稍后将描述这些文件中的每一个的细节。
尽管未在图2中示出,但还可以配置成使得便携式终端2通过有线或无线连接到头戴式耳麦,经由头戴式耳麦的头戴式耳机执行来自便携式终端2的语音输出,并且经由头戴式耳麦的麦克风执行对便携式终端2的语音输入。
管理服务器1接受作业单(其中关联并保持各作业项目和一个或多个作业结果输入候选),并将包括在作业单中的一个或多个输入候选登记在用于语音识别的语音识别词典中。
便携式终端2是由执行检查和检验作业的作业人员携带的终端(诸如智能电话)。便携式终端2从管理服务器1获得作业单和语音识别词典,使用语音识别词典对执行作业单中包括的作业项目时接受的语音输入进行语音识别,并保持语音识别的结果作为针对作业项目的作业结果。
管理者终端3是由对检查和检验作业进行管理的管理者操作的终端(诸如PC(Personal Computer,个人计算机))。管理者终端3将作业单登记到管理服务器1,并参考由便携式终端2上载到管理服务器1的作业结果文件。
首先,将描述管理服务器1的详细结构。参考图2,管理服务器1包括通信部11、存储部12和词典登记部13。
通信部11响应于管理者终端3的请求,将作业单和自定义词典的模板发送到管理者终端3。通信部11从管理者终端3接受已经描述完毕的作业单和自定义词典,并且将接受的作业单和自定义词典保持在存储部12中(图3中)。此外,当通信部11接受来自便携式终端2的作业人员的登记时,通信部11将所接受的作业人员的姓名保持在存储部12中。通信部11将作业单和语音识别词典发送到便携式终端2。此外,当从便携式终端2上载作业结果文件时,通信部11将所接受的作业结果文件累积在存储部12中。通信部11响应于来自管理者终端3的阅读请求,将作业结果文件发送到管理者终端3。
词典登记部13以用于语音识别的语音识别词典的形式,登记包括在作业单中的每个输入候选(由输入类型和选项指定)。图4是示出了该示例性实施例中的作业单的格式的表。
参考图4,作业单保持了各个作业项目、作业内容(用于读出)、输入类型(也称为类型信息)、选项、最小值和最大值。由作业单保持的信息称为作业单信息。作业项目指示检查和检验作业中包含的作业项目的名称。当针对作业的执行而进行作业内容的语音向导时,读出作业内容(用于读出)。输入类型指示输入作业结果的形式。作为示例,这里假设输入类型是选择型、数值型、自定义型或读码型之一。根据输入类型,在选项字段中指定输入词语候选。作业项目和/或作业内容(用于读出)被称为“作业项目信息”。由输入类型和选项指定的输入词语候选被称为“输入候选”(也称为作业结果候选)。在输入候选是数值时,在最小值和最大值字段中指定假定的数值的最小值和最大值。
当输入类型设置为“选择型”时,在选项字段中指定作为输入候选的词语和每个词语的一个或多个读音。图5示出了选项的格式和输入示例。如图5所示,在选项字段中指定输入词语与各输入词语的一个或多个读音的组合。也可以将多个读音与一个输入词语相关联。在包括附图在内的本申请的公开内容中,输入词语与该输入词语的一个或多个读音的每个组合被写为输入词语及其之后的括号([])内的“平假名”。例如,输入词语“污迹”与该输入词语“污迹”的读音的组合被写为:污迹[yogore]。当使用具有音标的语言(例如英语或中文)时,可以通过音标来写出输入词语的读音。例如,输入词语“污迹”与“污迹”的读音的组合被写为STAINSTAIN 。或者,当使用英语之类的具有固定的拼写和发音规则(例如自然拼读法)的语言时,也可以省略输入词语的读音,使用上述规则来生成输入词语的读音。在英语之类的具有音标的语言中,当期望识别多个读音时,也可以使用多个音标。例如,作为输入词语OK的读音,可以同时写下和
这使得即使作业人员的发音具有特点(例如,根据作业人员的年龄或出生地而异的特点、作业人员的发音癖好等)或在高噪音下,也可以减少错误识别作业人员的语音输入的可能性。词典登记部13在语音识别词典中登记在选项中指定的输入词语和(一个或多个)读音的每个组合。
另一方面,当输入类型被设置为数值型时,在输入类型字段中指定作为输入候选的数值的格式,并且选项字段为空。图6是示出了指定数值格式的方法的图。当在数值格式中指定“负(-)”时,可以指定正数和负数两者。整数部分中的位数和小数部分中的位数分别在整数部分位数和小数部分位数的位置中指定。词典登记部13在语音识别词典中登记根据数值格式的数值读音的样式。
假设输入候选是数值。如果要简单地生成用于预定数值范围的语音识别词典,则需要复杂的输入作业来定义语音识别词典。例如,当三位整数是输入候选时,需要针对所有假定模式的数值(0到99全部)的读音(“zero”到“kyuuhyakukyuujuukyu”)生成语音识别词典。然而,根据该实施例,通过由管理者在作业单中指定数值格式,可以针对具有预定位数、预定小数点位置和预定符号的数值的所有模式容易地定义语音识别词典。
接着,将给出关于输入类型是自定义型的情况的描述。当输入类型是自定义型时,在输入类型字段中指定“自定义”,并在选项字段中描述在自定义词典中定义的规则的名称。图7是用于说明自定义词典的生成方法的图。使用自定义词典,可以根据图7所示的规则指定输入词语的格式。
例如,当设备型号由一个字符的英文字母和三位的数值组成时,通过生成图7中所示的自定义词典,可以指定设备型号的输入候选词语(A000至Z999)和输入候选词语的读音。在这种情况下,对于基于在自定义词典中定义的规则生成的输入词语的所有组合,词典登记部13在语音识别词典中登记词语和词语读音。
利用这种布置,即使输入词语不是仅仅包括数值而是包括字符和数值,也可以容易地生成语音识别词典。也就是说,当输入候选符合预定格式时(例如装置或产品的型号),仅通过由管理者对自定义词典执行少量输入作业,就可以为所有模式的输入候选定义语音识别词典。
接着,将描述便携式终端2的详细结构。参考图2,便携式终端2包括通信部21、存储部22、提示部23、语音识别部24和读取部25。
通信部21向管理服务器1发送使用便携式终端2执行检查和检验作业的作业人员的姓名。通信部21还从管理服务器1获得由管理服务器1从管理者终端3接受的作业单和由管理服务器1生成的语音识别词典,并在存储部22中保持所获得的作业单和所获得的语音识别词典。此外,通信部21将通过执行检查和检验作业获得的作业结果文件上载到管理服务器1。
如图4所示,作业单将各个作业项目和指示该作业项目的内容的作业内容相关联并进行保持。提示部23在执行作业项目时在便携式终端2的显示器上显示作业项目的名称,并读出(执行语音输出)指示作业项目的内容的作业内容。举例来说,当执行图4所示的作业单中的作业项目“装置/污迹”时,提示部23在便携式终端2的显示器上显示“装置/污迹”并执行“检查装置周围的污迹”的语音引导。
利用这种布置,作业人员可以在无需用手状态下掌握要执行的作业项目。此外,通过对具体描述要针对作业项目执行的作业内容的“作业内容(用于读出)”进行语音引导,而不是原样执行“作业项目”的语音输出,使得作业人员可以顺利地和适当地推进作业。这使得可以显著提高检查和检验作业的效率。
语音识别部24使用保持在存储部22中的语音识别词典,对执行包括在作业单中的作业项目时接受的语音输入进行语音识别。此外,语音识别部24将语音识别的结果记录在存储部22中,作为该作业项目的作业结果。
例如,语音识别部24确定当执行图4所示的作业单中的作业项目“装置/污迹”时作业人员发出的语音接近于语音识别词典中累积的“检查完成”和“存在污迹”中的哪一个,确定指示该作业项目的作业结果的输入词语是“检查完成”和“存在污迹”中的哪一个。当语音识别部24针对图4所示的作业项目“装置/污迹”确定的输入词语是“作业完成”时,如图8所示将该输入词语反映在作业结果文件的作业结果中,并在存储部22中累积。
提示部23可以通过语音向作业人员通知(重复)由语音识别部24识别的输入词语。当语音识别部24识别的输入词语和作业人员想要的输入词语不同时,作业人员可以对便携式终端2执行预定操作(例如指示“返回到先前状态”的语音输入或对便携式终端2的轻击操作),并且便携式终端2响应于该操作再次接受(例如,语音输入或软键输入)输入词语。利用这种布置,可以防止将作业人员不希望的输入词语(或输入错误)反映在作业结果文件中。
便携式终端2通过手动操作(或通过屏幕触摸)接受输入词语时的操作可以如下执行。具体地,当输入类型是“选择型”时,便携式终端2根据语音识别词典中定义的选项的信息,在检验结果输入屏幕的下部显示下拉菜单,用于手动输入结果(例如“存在污迹”)。类似地,当输入类型是“数值”时,通过对便携式终端2的屏幕进行触摸,自动激活“数值输入软键盘”。当使用其他输入类型时,激活普通的“软键盘”。利用这种布置,即使在不可能进行语音识别的高噪声环境下,或者在噪声偶尔大幅增加时,也可以流畅地进行作业结果的输入。
当输入候选是作业对象的标识符(标识信息)时,读取部25被自动激活并读取该标识符。具体地,当输入类型是“读码型”时(如图4中的作业单的作业项目“装置ID”的情况),读取部25激活设置便携式终端2中的相机,读取被赋予给要检查和检验的装置(或产品)的QR码(商标)或条形码。
举例来说,当读取部25针对图4所示的作业项目“装置ID”读取的装置标识符是“ABC5678”时,如图8所示将该装置标识符反映在作业结果文件的作业结果中,并在存储部22中累积。
当作业人员除了便携式终端2以外还携带了专用的读取装置(用于条形码等)时,读取部25可以通过与该读取装置的无线电通信来获得作业对象的标识符。由读取部25获得标识符的方法不限于读取条形码等。举例来说,读取部25可以使用近场无线电通信(NFC)从附着到对象的标签或IC芯片获得标识符。
此外,便携式终端2可以使用计时部(未示出)来测量执行各作业项目所需的时间,并且可以将测量的时间与作业项目相关联并记录。参考图8,执行各作业项目所需的时间与作业人员以及作业项目相关联地累积在作业结果文件中。可以看出,在图8所示的例子中,作业项目“装置/污迹”需要20秒的作业时间。如上所述,通过获得每个作业人员和每个作业项目的作业时间并分析这些数据,还可以进行研究以改进和优化检查和检验作业。
当作业项目的输入类型是数值型时,如图4所示,作业单可以进一步与作业项目相关联地保持输入候选的数值的最小值和最大值。在这种情况下,当由语音识别部24识别的输入词语低于最小值或超过最大值时,提示部23(以语音、显示、振动等形式)输出对该情况的通知(警告)。例如,便携式终端2可以通过语音输入、键输入等再次接受输入词语。利用这种布置,可以防止作业人员对测量仪器(例如电压表)的读取错误或输入错误。当在装置或测量仪器中发生异常时,可以早期发现异常。
[操作]
接着,将参考图9中的时序图和图10中的流程图描述该示例性实施例中的作业支持系统的操作。
参考图9,管理者终端3向管理服务器1请求作业单模板,并根据需要向管理服务器1请求自定义词典模板。管理服务器1的通信部11从存储部12读取这些模板,并将这些模板发送到管理者终端3(步骤S1)。这里,作业单模板可以是图4中所示的作业单的内容在第二行之后为空白的模板。可以将自定义词典模板设置为例示图7中给出的描述示例的文件。
管理者使用下载的模板生成作业单,并根据需要使用下载的模板生成自定义词典(步骤S2)。这里,假设已经生成了图4中所示的作业单和图7中所示的定义<装置型号>的自定义词典。管理者终端3将由管理者生成的作业单和自定义词典上载到管理服务器1(步骤S3)。
管理服务器1的通信部11在存储部12中存储从管理者终端3发送的作业单和自定义词典。基于作业单中包括的输入候选(例如,由选项、数值格式、自定义词典等指定),词典登记部13在语音识别词典中登记作为输入候选的词语和该词语的读音(步骤S4)。
便携式终端2的通信部21向管理服务器1发送使用便携式终端2执行检查和检验作业的作业人员的姓名(步骤S5)。管理服务器1的通信部11接受来自便携式终端2的作业人员的登记,并将所接受的作业人员的姓名保持在存储部12中的作业人员文件中(步骤S6)。
当开始检查和检验作业时,便携式终端2的通信部21从管理服务器1获得管理服务器1从管理者终端3接受的作业单和由管理服务器1生成的语音识别词典,并将获得的作业单和获得的语音识别词典保持在存储部22中(步骤S7)。在这种情况下,可以使得便携式终端2向管理服务器1通知作业的开始,响应于作业开始的通知,管理服务器1向便携式终端2提供作业单的列表,并且向便携式终端2发送由便携式终端2选择的一个作业单。
然后,现场作业人员使用便携式终端2执行检查和检验作业(步骤S8)。图10是示出当图9中的执行作业(步骤S8)时便携式终端2的操作的流程图。
参考图10,在图4所示的作业单的情况下,选择第一个作业项目“装置/污迹”(步骤A1)。在这种情况下,提示部23在便携式终端2的显示器上显示文字“装置/污迹”的同时执行“检查装置周围的污迹”的语音引导(步骤A2)。
这里假设作业人员已经观察了装置周围,确认了没有污迹,并且已经说出例如“确认完成”。然后,语音识别部24确定当执行图4所示的作业单中的作业项目“装置/污迹”时作业人员发出的语音输入近似于语音识别词典中累积的“确认完成”和“存在污迹”中的“确认完成”,并确定针对该作业项目的作业结果的输入词语为“确认完成”(步骤A3)。此外,提示部23通过语音向作业人员重复由语音识别部24识别的输入词语“确认完成”(步骤A4)。
如果作业人员对便携式终端2执行了用于执行校正的预定操作(诸如语音输入或轻击操作)(步骤A5中的是),则过程返回到步骤A3,并且从作业人员再次接受语音输入(或文本输入)。
另一方面,如果作业人员没有对便携式终端2执行用于执行校正的预定操作(步骤A5中的否),则如图8所示关于作业项目“装置/污迹”在作业结果文件中累积作业结果“检查完成”和作业时间“20秒”(步骤A6)。
接着,提示部23确定在作业单中是否残留有尚未执行的作业项目(步骤A7)。如果没有残留尚未执行的作业项目(步骤A7中的否),则检查和检验作业结束。
另一方面,如果存在尚未执行的作业项目(步骤A7中的是),则提示部23选择下一个作业项目(诸如“装置/螺钉松动”)(步骤A8),使用显示器执行所选作业项目的显示,并执行所选作业项目的语音引导(步骤A2)。
通过重复上述操作,顺序执行作业单中包括的每个作业项目。如果没有尚未执行的作业项目(步骤A7中的否),则检查和检验作业结束。这里假设对于图4所示的作业单,获得了图8所示的作业结果文件。
返回到对图9的说明。如果作业单中包括的每个作业项目已经完成,则便携式终端2的通信部21将作业结果文件(图8中)上载到管理服务器1(图9中的步骤S9)。管理服务器1的通信部11在存储部12中记录已经接收的作业结果文件(步骤S10)。
管理者使用管理者终端3从管理服务器1下载作业结果文件(图8中)(步骤S11),并检查是否已经顺利地执行了检查和检验作业(步骤S12)。
[效果]
在根据该示例性实施例的作业支持系统中,管理服务器接受一个或多个输入候选(作为每个作业项目的作业结果,作业人员将执行这些输入候选的语音输入)作为作业单,并且预先在用于语音识别的语音识别词典中登记包括在所接受的作业单中的一个或多个输入候选。此外,便携式终端使用从管理服务器获得的语音识别词典来执行由作业人员输入的语音的语音识别。利用这种布置,输入候选被缩小了范围,从而消除了拾取噪声的可能性。因此,根据该示例性实施例,产生了在诸如工厂之类的噪声环境中增强语音输入识别率这一特殊效果。
也就是说,在该示例性实施例中,每个作业项目和一个或多个作业结果输入候选相关联。因此,可以在便携式终端侧执行控制,使得对于每个作业项目,对将成为语音识别对象的单词(待识别单词)施加限制(或约束)。从而改善了语音识别性能。此外,根据该示例性实施例,可以在每个输入候选中定义典型的发音变化(诸如okkei(okay)/oukei(ok)意味着可以(all right))。因此,即使存在发音变化,也可以确保高识别率。
在根据该示例性实施例的作业支持系统中,作为作业开始之前的预先准备,现场管理者等应仅在管理服务器中登记将作业项目和一个或多个作业结果输入候选相关联的单据。因此,上述作业支持系统可以应用于各个领域的检查和检验作业,并且作业项目也可以容易地改变。
此外,在该示例性实施例中,提供诸如数值型和自定义型之类的输入类型。因此,仅通过管理者对作业单和自定义词典执行很少的编辑作业,就可以针对预定格式的数值和字符串的每个组合(诸如英文字母和数值的序列)定义语音识别词典。
<第一示例性实施例的变形例>
当在第一示例性实施例中的作业单中包括多个作业项目时(参见图4),管理服务器1的词典登记部13可以将图3所示的语音识别词典生成为针对各作业项目的一组词典。具体地,当多个作业项目被包括在作业单中时,管理服务器1的词典登记部13将与各作业项目相关联的一个或多个作业结果候选登记在针对各作业项目的词典中。当通信部11将作业单发送到便携式终端2时,通信部11将各个与作业单中包括的各作业项目相关联的词典同作业单一起发送。另一方面,当多个作业项目被包括在作业单中时,便携式终端2的通信部21获得针对与各作业项目相关联的各作业项目的词典,并且语音识别部24使用针对各作业项目的词典来执行语音输入的语音识别。利用这种布置,通过在语音识别时参考与作业项目相关联的词典,可以提高语音识别的识别率。
词典登记部13可以将一个或多个作业结果候选与作业单相关联并登记在词典中,而不是将一个或多个作业结果候选与各作业项目相关联并登记在词典中。
通信部21可以从管理服务器1下载多个作业单。在这种情况下,可以这样布置:便携式终端2通过使用语音识别部24来识别作业单名称的语音发音,从而允许从已下载的多个作业单中选择所需的作业单。
<第二示例性实施例>
接着,将参考附图描述根据第二示例性实施例的作业支持系统。本示例性实施例中的作业支持系统确定用于检查和检验作业的作业人员的熟练度(诸如熟练者、初学者等熟练度),并且根据熟练度来切换对作业内容的引导和一个或多个输入候选。下面将主要描述该示例性实施例与第一示例性实施例之间的差异。这里,为简单起见,熟练度被设定为分为两个级别(初学者和熟练者)。但是,熟练度可以分为更多级别。
[结构]
图11是示出根据该示例性实施例的作业支持系统的框图。参照图11,该示例性实施例中的便携式终端2与第一示例性实施例中的便携式终端2(图2)的不同之处在于,该示例性实施例中的便携式终端2还包括熟练度确定部26。在该示例性实施例中,作业单具有与第一示例性实施例中不同的格式。
图12示出了该示例性实施例中的作业单的格式。该示例性实施例中的作业单包括针对熟练者和初学者中的每一个的“作业内容(用于读出)”。该示例性实施例中的作业单包括针对熟练者和初学者中的每一个的“选项”。尽管在该示例性实施例中能够根据熟练度针对作业单中的“作业内容(用于读出)”和“选项”中的每一个进行输入,但是根据熟练度的输入可以仅针对这些项之一进行。
熟练度确定部26针对每个作业人员,记录使用作业单执行的检查和检验作业的次数。当作业人员使用作业单的作业次数等于或大于预定次数时,熟练度确定部26确定作业人员的熟练度为“熟练者”。否则,熟练度确定部26将作业人员确定为“初学者”。当熟练度确定部26接受了对作业人员的熟练度的指定时(诸如,作业人员向便携式终端2输入了熟练度,或管理者在管理服务器1中登记了熟练度并向便携式终端2通知了熟练度),可以认为作业人员具有指定的熟练度。
提示部23根据熟练度确定部26的确定结果,读出(执行语音输出)指示作业项目的内容的作业内容。
举例来说,假设执行图12所示的作业单中的作业项目“装置/螺钉松动”。因此,当作业人员是“熟练者”时,提示部23在便携式终端2的显示器上显示“装置/螺钉松动”并且执行“检查螺钉”的语音引导。另一方面,当执行作业项目“装置/螺钉松动”时作业人员是“初学者”时,提示部23在便携式终端2的显示器上显示“装置/螺钉松动”并执行“检查装置中的八个位置是否存在螺钉松动”的语音引导。
此外,语音识别部24基于根据作业人员的熟练度指定的选项,对在执行作业单中包括的作业项目时接受的语音输入执行语音识别。
举例来说,假设执行图12所示的作业单中的“装置/外观异常”的作业项目。因此,当作业人员是熟练者时,语音识别部24确定作业人员发出的语音近似于语音识别词典中累积的“检查完成”、“裂痕”、“污迹”、“损坏”和“附着有油”中的哪一个,并确定作业项目的作业结果的输入词语是“检查完成”、“裂痕”、“污迹”、“损坏”和“附着有油”中的哪一个。另一方面,当在执行作业项目“装置/外观异常”时作业人员是初学者时,语音识别部24确定作业人员发出的语音近似于在语音识别词典中累积的“检查完成”和“存在异常”中的哪一个,并确定作业项目的作业结果的输入词语是“检查完成”和“存在异常”中的哪一个。
[操作]
本示例性实施例中的作业支持系统的操作与第一示例性实施例中的不同之处在于,当执行作业(图9中的步骤S8)时,便携式终端2的熟练度确定部26确定作业人员的熟练度,并且,根据确定结果执行作业内容的语音引导(图10中的步骤A2)和语音识别(图10中的步骤A3)。然而,该示例性实施例中的其他操作类似于第一示例性实施例中的操作。
[效果]
在该示例性实施例中,被这样布置:确定作业人员的熟练度,并且根据所确定的熟练度执行作业内容的语音引导和作业结果的语音输入。利用这种布置,可以使用相对短的(简洁的)消息向熟练者引导作业内容,从而能够进一步提高熟练者的作业效率。另一方面,向初学者引导更为详细的作业内容,从而能够防止作业过程中的错误。
此外,通过根据作业人员的熟练度为一个或多个输入候选提供选项,还可以从初学者的检查和检验作业获得粗略的作业结果,并从熟练者的检查和检验作业获得详细的作业结果。
<第二示例性实施例的变形例>
关于第二示例性实施例,以下变形是可能的。具体地,熟练度确定部26可以确定每个作业项目的作业人员的熟练度,而不是确定每个作业单的熟练度。在这种情况下,优选地,提示部基于所确定的熟练度,改变用于读出的指示内容或利用图像或动态图像的作业指示的提示内容。或者,熟练度确定部26可以通过比较多个作业人员执行相同作业项目的作业时间,来确定每个作业人员对同一作业项目的熟练度。熟练度确定部26还可以向作业人员提示所确定的熟练度。
便携式终端2可以包括疲劳度确定部,该疲劳度确定部被配置为:当作业人员的作业时间超过为各作业项目设定的标准时间(或作业人员执行作业项目所需的标准时间)的次数等于或大于预定阈值时,确定(并且进一步显示)该作业人员处于疲劳状态。在过去(例如,在另一个作业日),该作业人员的作业时间达到了(或小于)标准时间。
熟练度确定部26可以测量相同作业项目所需的作业时间的平均值,可以将所测量的平均值与作业人员的作业时间进行比较,然后可以确定该作业人员的熟练度。
或者,可以这样布置:通过允许将每个作业项目的作业时间与每个作业项目的标准时间之间的差反馈给作业人员的便携式终端2,提示作业人员注意。具体地,可以通过以下方式来提示作业人员注意。也就是说,便携式终端2测量并保持作业时间的测量值。在作业单中提供了各个作业项目的标准时间的列(图4中)。此外,作业时间的测量值与标准时间之间的差由便携式终端2计算,或者,由总是连接到便携式终端2的管理服务器1计算,并且计算的结果返回便携式终端2。当作业时间的测量值与标准时间之间的差等于或大于阈值时,便携式终端2可以执行预定显示(例如,以红色等显示)或者可以输出警报声(如哔哔声),从而提示作业人员注意。
<第三示例性实施例>
接着,将参考附图描述根据第三示例性实施例的作业支持系统。该示例性实施例中的作业支持系统使得能够根据作业结果在检查和检验期间切换(条件分支)接着要执行的作业项目。下面将以该示例性实施例与第一示例性实施例之间的不同之处为中心进行描述。
[结构]
该示例性实施例中的作业支持系统的结构与第一示例性实施例中的作业支持系统的结构(图2中)相同。然而,该示例性实施例中的提示部23的功能和作业单的格式与第一示例性实施例中的不同。
图13是示出该示例性实施例中的作业单的结构的表。参照图13,作业单具有“条件分支”字段,并且关联并保持第一作业项目和根据第一作业项目的作业结果要在第一作业项目之后执行的第二作业项目。
在图13所示的作业单中,当作为作业项目“装置/外观异常”的作业结果的语音输入被语音识别为“存在异常”时,提示部23选择作业项目“装置/异常原因”作为接着要执行的作业项目。也就是说,提示部23在便携式终端2的显示器上显示“装置/异常原因”并执行“确定装置的外观异常的原因”的语音引导。
另一方面,当作为作业项目“装置/外观异常”的作业结果的语音输入被语音识别为“检查完成”时,提示部23选择作业项目“装置型号”作为接着要执行的作业项目。也就是说,提示部23跳过作业项目“装置/异常原因”,在便携式终端2的显示器上显示作业项目“装置型号”,并执行“检查装置型号”的语音引导。
在图13所示的单据中,在同一作业单中描述了根据作业结果的转移目的地(分支目的地)的作业项目。另一方面,转移目的地(分支目的地)的作业项目可以是在不同的作业单中描述的作业项目,如图14所示。在图14所示的作业单中,当作业单A中的作业项目“装置/外观异常”的作业结果是“存在异常”时,提示部23选择作业单B中的作业项目“装置/异常原因”作为接着要执行的作业项目。此外,当作业单B中的作业项目“装置/异常原因”结束时,提示部23选择作业单A中的作业项目“装置型号”作为接着要执行的作业项目。
[操作]
本示例性实施例中的作业支持系统的操作与第一示例性实施例中的不同之处在于,在作业执行时(图9中的步骤S8),提示部23根据在作业单中的条件分支字段中描述的条件,转换到接着要执行的作业项目。然而,其他操作与第一示例性实施例中的操作相同。
[效果]
根据该示例性实施例,可以在检查和检验作业期间根据作业项目的作业结果灵活地切换接着要执行的作业项目。因此,可以通过省略根据作业结果能够省略的作业项目来执行作业,从而可以高效地执行检查和检验作业。此外,根据该示例性实施例,可以根据作业结果对多个作业单进行切换。利用这样的布置,可以根据作业内容对作业项目进行分类,并且可以在多个作业单中分离和管理作业项目,从而便于管理者生成和管理作业单。
<第四示例性实施例>
接着,将参考附图描述根据第四示例性实施例的作业支持系统。在该示例性实施例中的作业支持系统中,预先学习作业人员的发音特征,从而进一步提高了作业人员输入的语音的识别率。下面将以该示例性实施例与第一示例性实施例之间的不同之处为中心进行描述。
[结构]
图15是示出了根据该示例性实施例的作业支持系统的结构的框图。参照图15,该示例性实施例中的便携式终端2与第一示例性实施例中的便携式终端2的不同之处在于,该示例性实施例中的便携式终端2还包括说话者学习部27。图16是示出根据该示例性实施例的作业支持系统中的管理服务器1和便携式终端2所保持的数据的图。参考图16,该示例性实施例中的管理服务器1和便携式终端2与第一示例性实施例的不同之处在于,本示例性实施例中的管理服务器1和便携式终端2中的每一个还保持学习结果文件,其指示对作业人员发音特征进行学习的结果。
说话者学习部27提示多个(作为示例,大约50个)单词和单词读音,并指示作业者读出所提示的单词。说话者学习部27使作业人员重复发音直到可以正确识别作业人员发出的语音为止,通过该方法来学习作业人员的发音特征。在学习完成之后,通信部21将学习结果文件上载到管理服务器1,在该学习结果文件中将学习的结果和作业者的姓名相关联。管理服务器1的通信部11在存储部12(图16中)中记录已经接收的学习结果文件。
在该示例性实施例中,在检查和检验作业开始之前,便携式终端2的通信部21从管理服务器1下载与作业人员相关联的学习结果文件,并将学习结果文件保持在存储部22(图16)中。此外,当执行检查和检验作业时,语音识别部24使用由存储部22保持的语音识别词典和学习结果文件,对在执行作业项目时接受的语音输入进行语音识别。
[操作]
图17是示出了根据该示例性实施例的作业支持系统的操作的时序图。这里,将描述该示例性实施例与第一示例性实施例之间的差异。
在该示例性实施例中,在执行检查和检验作业之前,说话者学习部27执行说话者学习(步骤S13)。当便携式终端2的通信部21将作业人员的姓名发送到管理服务器1时,通信部21还发送学习结果文件(步骤S5)。管理服务器1的通信部11接受来自便携式终端2的作业人员姓名和学习结果文件的登记,并且在存储部12中保持所接受的作业人员姓名和学习结果文件(步骤S6)。
在开始检查和检验作业之前,便携式终端2的通信部21与作业单和语音识别词典一起从管理服务器1获得学习结果文件,并且在存储部22中保持所获得的作业单、语音识别词典和学习结果文件(步骤S7)。
当执行包括在检查和检验作业(步骤S8)中的语音识别(图10中的步骤A3)时,语音识别部24不仅使用存储部22保持的语音识别词典,而且还使用学习结果文件,来执行由作业人员输入的语音的语音识别。
[效果]
根据该示例性实施例,通过不仅使用基于从作业单提取的一个或多个输入候选的语音识别词典,而且还使用通过预先学习作业人员的发音特征而获得的学习结果文件来执行语音识别,即使在高噪声下也可以以更高的识别率实现符合作业人员意图的语音输入。
<第五示例性实施例>
接着,将参考附图描述根据第五示例性实施例的作业支持系统。该示例性实施例中的作业支持系统能够在读出作业内容时和在重复语音识别结果时进行正确的读出。下面将以该示例性实施例与第一示例性实施例之间的不同之处为中心进行描述。
[结构]
该示例性实施例中的作业支持系统与第一示例性实施例中的作业支持系统(图2)具有相同的结构。然而,该示例性实施例中的管理服务器1和便携式终端2所保持的数据与第一示例性实施例中的不同。图18是示出根据该示例性实施例的作业支持系统中的管理服务器1和便携式终端2所保持的数据的图。参考图18,该示例性实施例中的管理服务器1和便携式终端2与第一示例性实施例的不同之处在于,本示例性实施例中的管理服务器1和便携式终端2中的每一个还保持读出词典,其将每个单词及其读音相关联。
优选地,特别是诸如难读词语、技术术语、行业术语和内部术语之类的词语以及这些词语的读音被登记在读出词典中。此外,在读出作业内容(用于读出)和重复语音识别结果时未被正确读出的词语及其读音,可以在任何时间被登记在读出词典中。
在该示例性实施例中,管理服务器1的通信部11响应于管理者终端3的请求,将作业单、自定义词典和读出词典的模板发送到管理者终端3。此外,通信部11从管理者终端3接受已经记载完毕的作业单、自定义词典和读出词典,并在存储部12(图18)中保持所接受的作业单、自定义词典和读出词典。
在该示例性实施例中,便携式终端2的通信部21从管理服务器1下载读出词典以及作业单和语音识别词典,并在存储部22中(图18)中保持上述读出词典、作业单和语音识别词典。当提示部23在显示器上显示作业项目并读出作业内容时,提示部23通过参考读出词典来执行读出。此外,当提示部23重复由语音识别部24识别的输入词语时,提示部23通过参考在读出词典中登记的输入词语的读音来执行读出。
[操作]
图19是示出了根据该示例性实施例的作业支持系统的操作的时序图。这里,将以该示例性实施例与第一示例性实施例之间的不同之处为中心进行描述。
参考图19,管理者终端3从管理服务器1下载读出词典模板以及作业单的模板(根据需要还下载自定义词典的模板)(步骤S1)。例如,读出词典模板可以被设置为示出词语及其读音的定义方法的文件。
管理者使用下载的模板生成作业单、自定义词典和读音词典(步骤S2)。管理者终端3将由管理者生成的作业单、自定义词典和读出词典上载到管理服务器1(步骤S3)。管理服务器1的通信部11在存储部12中存储从管理者终端3发送的作业单、自定义词典和读出词典(步骤S4)。
在开始检查和操作作业之前,便携式终端2的通信部21从管理服务器1获得读出词典以及作业单和语音识别词典,并且在存储部22中存储所获得的作业单、语音识别词典和读出词典(步骤S7)。
当执行检查和检验作业时(步骤S8),提示部23在显示器上显示作业项目并读出作业内容时,参考读出词典来执行读出(图10中的步骤A2)。此外,当提示部23重复由语音识别部24识别的输入词语时,提示部23基于在读出词典中登记的词语读音来执行读出(图10中的步骤A4)。
[效果]
根据该示例性实施例,即使当作业内容或输入候选的选项中包括技术术语等时,也可以根据正确的读音执行语音引导和重复。由此可以顺利地执行检查和检验作业,而不会由于错误的读出而使作业人员感到困惑或者中断作业。
<变形例>
对上述示例性实施例可以进行各种变形。举例来说,在图4例示的作业单中,可以将各作业项目与被设置为该作业项目中的作业对象的装置(或产品)的图像(静止图像)或动态图像相关联并保持。在这种情况下,当执行作业项目时,提示部23与作业项目的名称一起在便携式终端2的显示器上显示与该作业项目相关联的对象装置(或对象产品)的图像或动态图像(图10中的步骤A2)。优选地,在读出指示作业项目的内容的作业内容时,提示部23通过语音向作业人员通知正在显示对象装置(或对象产品)的图像或动态图像(图10中的步骤A2)。
根据上述变形例,作业人员能够容易地掌握作为各作业项目的检查和检验对象的装置(或产品),能够迅速且正确地执行作业。
本发明的以下方式是可能的。
[第一方式]
参见根据第一方面的管理服务器。
[第二方式]
优选根据第一方式的管理服务器,其中,
所述作业结果候选包括至少指示作业结果的类型的类型信息,并且所述类型信息指示所述作业结果的类型是至少字符串型、数值型、自定义型、或读取型中的任何一个。
[第三方式]
优选根据第二方式的管理服务器,其中,
所述接受部接受保持所述作业结果候选的单据信息,所述作业结果候选包括:指示所述类型是字符串型的类型信息、字符串、以及指示所述字符串的一个或多个读音的字符串的读音信息;以及
所述词典登记部指示所述字符串的一个或多个读音的读音信息与所述字符串相关联地登记在所述词典中。
[第四方式]
优选根据第一至第三方式中任一项所述的管理服务器,其中,
所述接受部接受保持所述作业结果候选的单据信息,所述作业结果候选包括:指示所述类型是数值型的类型信息、以及数值的格式;以及
所述词典登记部将所述数值的读音信息与所述数值的格式相关联地登记在所述词典中。
[第五方式]
优选根据第一至第四方式中任一项所述的管理服务器,其中,
所述接受部接受保持所述作业结果候选的单据信息并接受文件,所述作业结果候选包括指示所述类型是自定义型的类型信息、以及通过预定规则定义字符串时的规则名称,所述文件将所述规则名称与基于所述预定规则的所述字符串的定义相关联并保持;以及
所述词典登记部将基于所述预定规则的所述字符串的读音信息与所述规则名称相关联地登记在所述词典中。
[第六方式]
优选根据第一至第五方式中任一项所述的管理服务器,其中,
当多条所述作业项目信息包括在所述单据信息中时,所述词典登记部在针对各条作业项目信息的词典中登记与各条作业项目信息相关联的一个或多个作业结果候选;以及
当所述发送部发送所述单据信息时,所述发送部将与所述单据信息中包括的各条作业项目信息相关联的各个词典与所述单据信息一起发送。
[第七方式]
优选根据第一至第六方式中任一项所述的管理服务器,其中,
所述发送部将所述单据信息和与所述单据信息相关联的词典发送到便携式终端;以及
所述便携式终端使用所述词典对针对所述作业项目信息接受的语音输入进行语音识别,并将语音识别的结果作为针对所述作业项目信息的作业结果进行保持。
[第八方式]
优选根据第七方式的管理服务器,其中,
当包括在所述作业结果候选中的所述类型信息指示读取型时,所述便携式终端将通过用于读取作业对象的标识信息的读取装置接受的信息作为针对所述作业项目信息的作业结果进行保持。
[第九方式]
优选根据第七或第八方式的管理服务器,其中,
所述作业项目信息将所述作业项目的名称与指示所述作业项目的内容的信息相关联并保持;以及
所述便携式终端显示所述作业项目的名称并读出指示所述作业项目的内容的信息。
[第十方式]
优选根据第七至第九方式中任一项所述的管理服务器,其中,
所述便携式终端将从提示所述作业项目信息到完成所述语音识别所需的时间与所述作业项目信息相关联地记录。
[第十一方式]
优选根据第七至第十方式中任一项所述的管理服务器,其中,
所述接受部接受保持作业项目信息和/或基于作业人员的熟练度的作业结果候选的单据信息;
所述词典登记部将所述单据信息中包括的基于熟练度的作业结果候选与所述作业项目相关联地登记在所述词典中;以及
所述便携式终端根据所述作业人员的熟练度提示所述作业项目信息,和/或使用在所述词典中登记的、与所述作业人员的熟练度相关联的作业结果候选来执行所述语音识别。
[第十二方式]
优选根据第十一方式的管理服务器,其中,
所述便携式终端保持所述作业人员使用所述单据信息执行的作业次数,基于所述作业次数确定所述作业人员的熟练度,并使用所确定的所述作业人员的熟练度执行所述作业项目信息的提示和/或所述语音识别。
[第十三方式]
优选根据第七至第十二方式中任一项所述的管理服务器,其中,
所述接受部接受将指示第一作业项目的第一作业项目信息与指示第二作业项目的第二作业项目信息相关联并保持的单据信息,所述第二作业项目是根据所述第一作业项目的作业结果要在所述第一作业项目之后执行的作业项目;以及
所述便携式终端根据针对所述第一作业项目信息接受的语音输入的语音信息的结果来选择所述第二作业项目。
[第十四方式]
优选根据第十三方式的管理服务器,其中,
所述接受部接受第一单据信息和第二单据信息,所述第一单据信息将所述第一作业项目信息与所述第二作业项目信息相关联并保持,所述第二单据信息保持所述第二作业项目信息;以及
所述便携式终端根据针对所述第一作业项目信息接受的语音输入的语音识别的结果,从所述第二单据信息中选择所述第二作业项目。
[第十五方式]
参见根据第二方面的便携式终端。
[第十六方式]
优选根据第十五方式的便携式终端,其中,
当多条所述作业项目信息包括在所述单据信息中时,并且当所述通信部获得所述单据信息时,所述通信部获得针对与各条作业项目信息相关联的各作业项目的词典;以及
所述语音识别部使用所述针对各作业项目的词典来执行所述语音输入的语音识别。
[第十七方式]
优选根据第十五方式的便携式终端,其中,
所述通信部接受将指示作业项目的作业项目信息与作业结果候选相关联并保持的单据信息,将包含在所述单据信息中的作业结果候选与作业项目或单据信息相关联地登记在词典中,并且从被配置为将所述单据信息与所述词典相关联并存储的管理服务器获得所述单据信息和与所述单据信息相关联的词典。
[第十八方式]
优选根据第十七方式的便携式终端,其中,
所述作业结果候选包括至少指示作业结果的类型的类型信息,并且所述类型信息指示所述作业结果的类型是至少字符串型、数值型、自定义型、或读取型中的任何一个。
[第十九方式]
优选根据第十八方式的便携式终端,包括:
读取装置,用于在所述作业结果候选中包含的所述类型信息指示读取型时读取作业对象的标识信息;
其中,所述存储部将通过所述读取装置接受的信息作为针对所述作业项目信息的作业结果进行保持。
[第二十方式]
优选根据第十六至第十九方式中任一项所述的便携式终端,其中,
所述作业项目信息将所述作业项目的名称与指示所述作业项目的内容的信息相关联并保持;以及
所述提示部显示所述作业项目的名称并读出指示所述作业项目的内容的信息。
[第二十一方式]
优选根据第十六至第二十方式中任一项所述的便携式终端,其中,
所述存储部将从提示所述作业项目信息到完成所述语音识别所需的时间与所述作业项目信息相关联地记录。
[第二十二方式]
优选根据第十八方式的便携式终端,其中,
当所述语音识别失败时,显示所述一个或多个作业结果候选,并且所述存储部保持将从所显示的所述一个或多个作业结果候选中选择的作业结果作为针对所述作业项目信息的作业结果进行保持。
[第二十三方式]
优选根据第十七方式的便携式终端,其中,
所述通信部从所述管理服务器获得多个所述单据信息;以及
所述语音识别部识别针对所述多个单据信息中的至少一个单据信息的名称的语音发声。
[第二十四方式]
优选根据第十五方式的便携式终端,其中,
所述单据信息将所述作业项目信息与作业对象的静止图像或动态图像相关联并保持;以及
所述提示部将所述静止图像或动态图像与所述作业项目信息一起显示。
[第二十五方式]
一种作业支持系统,包括:
根据第一至第十四方式中任一项所述的管理服务器;以及
根据第十五至第二十四方式中任一项所述的便携式终端。
[第二十六方式]
参见根据第四方面的作业支持方法。
[第二十七方式]
参见根据第五方面的作业支持方法。
[第二十八方式]
参见根据第六方面的程序。
[第二十九方式]
参见根据第七方面的程序。
上面列出的专利文献的公开内容通过引用整体并入本文。可以在本发明整体公开(含权利要求)的范围内,基于本发明的基本技术构思,对每个示例性实施例进行修改和调整。在本发明的全部公开的范围内,对各个公开的要素(包括每个权利要求的每个要素,每个示例性实施例的每个要素,以及每个图的每个要素)的各种组合和选择是可能的。也就是说,本发明本质上包括可由本领域技术人员根据包含权利要求和技术构思的整体公开而做出的各种变化和修改。特别地,关于本说明书中记载的数值范围,除非另外明确描述,否则应该将包括在该数值范围中的任意数值和小范围解释为具体描述。
[附图标记列表]
1 管理服务器
2 便携式终端
3 管理者终端
11 通信部
12 存储部
13 词典登记部
21 通信部
22 存储部
23 提示部
24 语音识别部
25 读取部
26 熟练度确定部
27 说话者学习部。
Claims (26)
1.一种管理服务器,包括:
接受部,被配置为接受单据信息,所述单据信息将指示作业项目的作业项目信息与作业结果候选相关联并保持;
词典登记部,被配置为与所述作业项目或所述单据信息相关联地生成针对在执行包含在所述单据信息中的所述作业项目时接受的语音输入的语音识别用的语音识别词典;
存储部,被配置为将所述单据信息与所述语音识别词典相关联并存储;以及
发送部,被配置为当所述发送部发送所述单据信息时将所述单据信息与相关联的所述语音识别词典一起发送。
2.根据权利要求1所述的管理服务器,其中,
所述作业结果候选至少包括指示作业结果的类型的类型信息,并且所述类型信息指示所述作业结果的类型至少是字符串型、数值型、自定义型、或读取型中的任何一个。
3.根据权利要求2所述的管理服务器,其中,
所述接受部接受保持所述作业结果候选的单据信息,所述作业结果候选包括:指示所述类型是字符串型的所述类型信息、字符串、以及指示针对所述字符串的一个或多个读音的字符串的读音信息;以及
所述词典登记部将指示所述字符串的一个或多个读音的读音信息与所述字符串相关联地生成所述语音识别词典。
4.根据权利要求2所述的管理服务器,其中,
所述接受部接受保持所述作业结果候选的单据信息,所述作业结果候选包括:指示所述类型是数值型的所述类型信息、以及数值的格式;以及
所述词典登记部将所述数值的读音信息与所述数值的格式相关联地生成所述语音识别词典。
5.根据权利要求2所述的管理服务器,其中,
所述接受部接受保持所述作业结果候选的单据信息并接受文件,所述作业结果候选包括指示所述类型是自定义型的所述类型信息、以及通过预定规则定义了字符串时的规则名称,所述文件将所述规则名称与基于所述预定规则的所述字符串的定义相关联并保持;以及
所述词典登记部将所述字符串的读音信息与所述规则名称相关联地生成所述语音识别词典。
6.根据权利要求1至5中任一项所述的管理服务器,其中,
当多条所述作业项目信息包括在所述单据信息中时,所述词典登记部按照每个所述作业项目信息生成针对与各条所述作业项目信息相关联的一个或多个所述作业结果候选的所述语音识别词典;以及
当所述发送部发送所述单据信息时,所述发送部将与所述单据信息中包括的各条所述作业项目信息相关联的各个所述语音识别词典与所述单据信息一起发送。
7.根据权利要求1至5中任一项所述的管理服务器,其中,
所述发送部将所述单据信息和与所述单据信息相关联的所述语音识别词典发送到便携式终端;以及
所述便携式终端使用所述语音识别词典对针对所述作业项目信息接受的语音输入进行语音识别,并将语音识别的结果作为针对所述作业项目信息的作业结果进行保持。
8.根据权利要求2至5中任一项所述的管理服务器,其中,
所述发送部将所述单据信息和与所述单据信息相关联的所述语音识别词典发送到便携式终端;
所述便携式终端使用所述语音识别词典对针对所述作业项目信息接受的语音输入进行语音识别,并将语音识别的结果作为针对所述作业项目信息的作业结果进行保持;以及
当包括在所述作业结果候选中的所述类型信息指示读取型时,所述便携式终端将通过用于读取作业对象的标识信息的读取装置接受的信息作为针对所述作业项目信息的作业结果进行保持。
9.根据权利要求7所述的管理服务器,其中,
所述作业项目信息将所述作业项目的名称与指示所述作业项目的内容的信息相关联并保持;以及
所述便携式终端显示所述作业项目的名称并读出指示所述作业项目的内容的信息。
10.根据权利要求7所述的管理服务器,其中,
所述便携式终端将从提示所述作业项目信息到完成所述语音识别所需的时间与所述作业项目信息相关联地记录。
11.根据权利要求7所述的管理服务器,其中,
所述接受部接受单据信息,所述单据信息保持所述作业项目信息和/或按照作业人员的各熟练度的作业结果候选;
所述词典登记部将所述单据信息中包括的按照各熟练度的作业结果候选与作业项目相关联地生成所述语音识别词典;以及
所述便携式终端根据所述作业人员的熟练度提示所述作业项目信息,和/或使用所述语音识别词典中的与所述作业人员的熟练度相关联的作业结果候选来进行所述语音识别。
12.根据权利要求11所述的管理服务器,其中,
所述便携式终端按照每个作业人员保持所述作业人员使用所述单据信息执行的作业次数,基于所述作业次数判定所述作业人员的熟练度,并使用所判定的熟练度进行所述作业项目信息的提示和/或所述语音识别。
13.根据权利要求7所述的管理服务器,其中,
所述作业结果候选包括条件分支,所述条件分支将指示第一作业项目的第一作业项目信息与指示第二作业项目的第二作业项目信息相关联,所述第二作业项目是根据所述第一作业项目的作业结果要接着所述第一作业项目之后执行的作业项目;以及
所述便携式终端根据对针对所述第一作业项目信息接受的语音输入进行了语音识别的结果来选择所述第二作业项目。
14.根据权利要求13所述的管理服务器,其中,
所述接受部接受第一单据信息和第二单据信息,所述第一单据信息包括将所述第一作业项目信息与所述第二作业项目信息相关联的所述条件分支,所述第二单据信息保持所述第二作业项目信息;以及
所述便携式终端根据对针对所述第一作业项目信息接受的语音输入进行了语音识别的结果,从所述第二单据信息中选择所述第二作业项目。
15.一种便携式终端,包括:
通信部,被配置为获得单据信息和与所述单据信息相关联的语音识别词典,所述单据信息包括指示作业项目的作业项目信息;
提示部,被配置为提示所述作业项目信息;
语音识别部,被配置为使用所述语音识别词典对针对所述作业项目信息接受的语音输入进行语音识别;以及
存储部,被配置为将语音识别的结果作为针对所述作业项目信息的作业结果进行保持,
其中所述通信部从管理服务器接受具有相关联的语音识别词典的单据信息,其中所述管理服务器接受将指示作业项目的作业项目信息与作业结果候选相关联并保持的单据信息,与所述作业项目或所述单据信息相关联地生成针对在执行包含在所述单据信息中的所述作业项目时接受的语音输入的语音识别用的语音识别词典,并且存储所述单据信息和所述语音识别词典。
16.根据权利要求15所述的便携式终端,其中,
当多条所述作业项目信息包括在所述单据信息中时,并且当所述通信部获得所述单据信息时,所述通信部获得针对与各条所述作业项目信息相关联的各作业项目的语音识别词典;以及
所述语音识别部使用针对各所述作业项目的所述语音识别词典来对所述语音输入进行语音识别。
17.根据权利要求15所述的便携式终端,其中,
所述作业结果候选至少包括指示作业结果的类型的类型信息,并且所述类型信息指示所述作业结果的类型至少是字符串型、数值型、自定义型、或读取型中的任何一个。
18.根据权利要求17所述的便携式终端,包括:
读取装置,用于在所述作业结果候选中包含的所述类型信息指示读取型时读取作业对象的标识信息,
所述存储部将通过所述读取装置接受的信息作为针对所述作业项目信息的作业结果进行保持。
19.根据权利要求16至18中任一项所述的便携式终端,其中,
所述作业项目信息将所述作业项目的名称与指示所述作业项目的内容的信息相关联并保持;以及
所述提示部显示所述作业项目的名称并读出指示所述作业项目的内容的信息。
20.根据权利要求16至18中任一项所述的便携式终端,其中,
所述存储部将从提示所述作业项目信息到完成所述语音识别所需的时间与所述作业项目信息相关联地记录。
21.根据权利要求16至18中任一项所述的便携式终端,其中,
所述语音识别部在针对所述作业项目信息进行了语音输入后,当进行了与返回到先前相关的规定的语音输入时,再次接受针对所述作业项目信息的语音输入。
22.一种作业支持系统,包括:根据权利要求1至5中任一项所述的管理服务器;以及根据权利要求15至18中任一项所述的便携式终端。
23.一种作业支持方法,包括由管理服务器执行的以下步骤:
接受单据信息,所述单据信息将指示作业项目的作业项目信息与作业结果候选相关联并保持;
与所述作业项目或所述单据信息相关联地生成针对在执行包含在所述单据信息中的所述作业项目时接受的语音输入的语音识别用的语音识别词典;
将所述单据信息与所述语音识别词典相关联并存储;以及
当发送所述单据信息时将所述单据信息与相关联的所述语音识别词典一起发送。
24.一种作业支持方法,包括由便携式终端执行的以下步骤:
获得单据信息和与所述单据信息相关联的语音识别词典,所述单据信息包括指示作业项目的作业项目信息;
提示所述作业项目信息;
使用所述语音识别词典对针对所述作业项目信息接受的语音输入进行语音识别;以及
将语音识别的结果作为针对所述作业项目信息的作业结果进行保持,
在获得所述语音识别词典的步骤中,从管理服务器接受具有相关联的语音识别词典的单据信息,其中所述管理服务器接受将指示作业项目的作业项目信息与作业结果候选相关联并保持的单据信息,与所述作业项目或所述单据信息相关联地生成针对在执行包含在所述单据信息中的所述作业项目时接受的语音输入的语音识别用的语音识别词典,并且存储所述单据信息和所述语音识别词典。
25.一种记录介质,存储有程序,该程序使计算机执行以下处理:
接受单据信息,所述单据信息将指示作业项目的作业项目信息与作业结果候选相关联并保持;
与所述作业项目或所述单据信息相关联地生成针对在执行包含在所述单据信息中的所述作业项目时接受的语音输入的语音识别用的语音识别词典;
将所述单据信息与所述语音识别词典相关联并存储;以及
当发送所述单据信息时将所述单据信息与相关联的所述语音识别词典一起发送。
26.一种记录介质,存储有程序,所述程序使计算机执行以下处理:
获得单据信息和与所述单据信息相关联的语音识别词典,所述单据信息包括指示作业项目的作业项目信息;
提示所述作业项目信息;
使用所述语音识别词典对针对所述作业项目信息接受的语音输入进行语音识别;以及
将语音识别的结果作为针对所述作业项目信息的作业结果进行保持,
在获得所述语音识别词典的步骤中,从管理服务器接受具有相关联的语音识别词典的单据信息,其中所述管理服务器接受将指示作业项目的作业项目信息与作业结果候选相关联并保持的单据信息,与所述作业项目或所述单据信息相关联地生成针对在执行包含在所述单据信息中的所述作业项目时接受的语音输入的语音识别用的语音识别词典,并且存储所述单据信息和所述语音识别词典。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016122804A JP6744025B2 (ja) | 2016-06-21 | 2016-06-21 | 作業支援システム、管理サーバ、携帯端末、作業支援方法およびプログラム |
JP2016-122804 | 2016-06-21 | ||
PCT/JP2017/022626 WO2017221916A1 (ja) | 2016-06-21 | 2017-06-20 | 作業支援システム、管理サーバ、携帯端末、作業支援方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108780542A CN108780542A (zh) | 2018-11-09 |
CN108780542B true CN108780542B (zh) | 2023-05-02 |
Family
ID=60784576
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780016642.2A Active CN108780542B (zh) | 2016-06-21 | 2017-06-20 | 作业支持系统、管理服务器、便携式终端、作业支持方法以及程序 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20190079919A1 (zh) |
JP (1) | JP6744025B2 (zh) |
CN (1) | CN108780542B (zh) |
WO (1) | WO2017221916A1 (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190267002A1 (en) * | 2018-02-26 | 2019-08-29 | William Crose | Intelligent system for creating and editing work instructions |
JP7124442B2 (ja) * | 2018-05-23 | 2022-08-24 | 富士電機株式会社 | システム、方法、及びプログラム |
JP7298999B2 (ja) | 2018-08-01 | 2023-06-27 | Nttテクノクロス株式会社 | 資料作成装置、資料作成システム、資料作成方法及びプログラム |
CN109087644B (zh) * | 2018-10-22 | 2021-06-25 | 奇酷互联网络科技(深圳)有限公司 | 电子设备及其语音助手的交互方法、具有存储功能的装置 |
CN111381629B (zh) * | 2018-12-29 | 2024-05-14 | 玳能本股份有限公司 | 作业支援系统及作业支援方法 |
CN110335367B (zh) * | 2019-07-11 | 2021-09-07 | 国家电网有限公司 | 设备巡检方法、设备巡检装置及终端设备 |
JP2021131806A (ja) * | 2020-02-21 | 2021-09-09 | オムロン株式会社 | 行動解析装置及び行動解析方法 |
JP6802592B1 (ja) * | 2020-05-25 | 2020-12-16 | Mintomo株式会社 | 音声による点検データ保存方法、システム及びプログラム |
JP7274059B2 (ja) * | 2020-11-27 | 2023-05-15 | 三菱電機株式会社 | 検査作業支援方法及び情報処理システム |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1503156A (zh) * | 2002-11-20 | 2004-06-09 | 金宝电子工业股份有限公司 | 电子字典的查询次数累加记录与提醒的方法及其装置 |
CN102184652A (zh) * | 2011-06-01 | 2011-09-14 | 张建强 | 一种演示文字书写过程的数字化方法及软件系统 |
CN102867510A (zh) * | 2011-07-07 | 2013-01-09 | 株式会社电装 | 语音识别系统 |
CN102999798A (zh) * | 2011-09-08 | 2013-03-27 | 富士施乐株式会社 | 信息管理设备、信息管理方法和信息管理系统 |
CN103314286A (zh) * | 2011-01-13 | 2013-09-18 | 欧姆龙株式会社 | 锡焊检查方法和锡焊检查机以及基板检查系统 |
JP2014206880A (ja) * | 2013-04-12 | 2014-10-30 | Tis株式会社 | 作業支援装置 |
CN104699745A (zh) * | 2013-12-06 | 2015-06-10 | 卡西欧计算机株式会社 | 语音输出装置和语音输出方法 |
CN104756185A (zh) * | 2012-11-05 | 2015-07-01 | 三菱电机株式会社 | 语音识别装置 |
CN105575402A (zh) * | 2015-12-18 | 2016-05-11 | 合肥寰景信息技术有限公司 | 网络教学实时语音分析方法 |
Family Cites Families (90)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5033088A (en) * | 1988-06-06 | 1991-07-16 | Voice Processing Corp. | Method and apparatus for effectively receiving voice input to a voice recognition system |
US4994983A (en) * | 1989-05-02 | 1991-02-19 | Itt Corporation | Automatic speech recognition system using seed templates |
US5465318A (en) * | 1991-03-28 | 1995-11-07 | Kurzweil Applied Intelligence, Inc. | Method for generating a speech recognition model for a non-vocabulary utterance |
US5305244B2 (en) * | 1992-04-06 | 1997-09-23 | Computer Products & Services I | Hands-free user-supported portable computer |
US5452397A (en) * | 1992-12-11 | 1995-09-19 | Texas Instruments Incorporated | Method and system for preventing entry of confusingly similar phases in a voice recognition system vocabulary list |
US5613036A (en) * | 1992-12-31 | 1997-03-18 | Apple Computer, Inc. | Dynamic categories for a speech recognition system |
EP1199707A3 (en) * | 1995-05-26 | 2002-05-02 | Speechworks International, Inc. | Method and apparatus for dynamic adaptation of a large vocabulary speech recognition system and for use of constraints from a database in a large vocabulary speech recognition system |
US5842168A (en) * | 1995-08-21 | 1998-11-24 | Seiko Epson Corporation | Cartridge-based, interactive speech recognition device with response-creation capability |
JP3605682B2 (ja) * | 1996-05-16 | 2004-12-22 | 本田技研工業株式会社 | 音声入力制御装置 |
JPH11266306A (ja) * | 1998-03-16 | 1999-09-28 | Toshiba System Kaihatsu Kk | スクリプト作成装置及びctiシステム |
US6243680B1 (en) * | 1998-06-15 | 2001-06-05 | Nortel Networks Limited | Method and apparatus for obtaining a transcription of phrases through text and spoken utterances |
US6185530B1 (en) * | 1998-08-14 | 2001-02-06 | International Business Machines Corporation | Apparatus and methods for identifying potential acoustic confusibility among words in a speech recognition system |
US6208964B1 (en) * | 1998-08-31 | 2001-03-27 | Nortel Networks Limited | Method and apparatus for providing unsupervised adaptation of transcriptions |
SE9802990L (sv) * | 1998-09-04 | 2000-03-05 | Ericsson Telefon Ab L M | Förfarande och system för taligenkänning |
US6185535B1 (en) * | 1998-10-16 | 2001-02-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Voice control of a user interface to service applications |
US6317039B1 (en) * | 1998-10-19 | 2001-11-13 | John A. Thomason | Wireless video audio data remote system |
US6839669B1 (en) * | 1998-11-05 | 2005-01-04 | Scansoft, Inc. | Performing actions identified in recognized speech |
US6928404B1 (en) * | 1999-03-17 | 2005-08-09 | International Business Machines Corporation | System and methods for acoustic and language modeling for automatic speech recognition with large vocabularies |
US6694296B1 (en) * | 2000-07-20 | 2004-02-17 | Microsoft Corporation | Method and apparatus for the recognition of spelled spoken words |
US6823373B1 (en) * | 2000-08-11 | 2004-11-23 | Informatica Corporation | System and method for coupling remote data stores and mobile devices via an internet based server |
US7925527B1 (en) * | 2000-08-16 | 2011-04-12 | Sparta Systems, Inc. | Process control system utilizing a database system to monitor a project's progress and enforce a workflow of activities within the project |
US6728676B1 (en) * | 2000-10-19 | 2004-04-27 | International Business Machines Corporation | Using speech recognition to improve efficiency of an inventory task |
US6975985B2 (en) * | 2000-11-29 | 2005-12-13 | International Business Machines Corporation | Method and system for the automatic amendment of speech recognition vocabularies |
WO2002050816A1 (en) * | 2000-12-18 | 2002-06-27 | Koninklijke Philips Electronics N.V. | Store speech, select vocabulary to recognize word |
US20020138269A1 (en) * | 2001-03-20 | 2002-09-26 | Philley Charles F. | Voice recognition maintenance inspection program |
US7286985B2 (en) * | 2001-07-03 | 2007-10-23 | Apptera, Inc. | Method and apparatus for preprocessing text-to-speech files in a voice XML application distribution system using industry specific, social and regional expression rules |
JP3879929B2 (ja) * | 2001-10-05 | 2007-02-14 | 富士通株式会社 | 翻訳システム |
US7996232B2 (en) * | 2001-12-03 | 2011-08-09 | Rodriguez Arturo A | Recognition of voice-activated commands |
US7219062B2 (en) * | 2002-01-30 | 2007-05-15 | Koninklijke Philips Electronics N.V. | Speech activity detection using acoustic and facial characteristics in an automatic speech recognition system |
US20040117243A1 (en) * | 2002-04-15 | 2004-06-17 | Anthony Chepil (Tony) | Method and system for merchandising management |
US20050180464A1 (en) * | 2002-10-01 | 2005-08-18 | Adondo Corporation | Audio communication with a computer |
EP1611504B1 (en) * | 2003-04-07 | 2009-01-14 | Nokia Corporation | Method and device for providing speech-enabled input in an electronic device having a user interface |
JP2005037597A (ja) * | 2003-07-18 | 2005-02-10 | Fuji Photo Film Co Ltd | 設備の制御システム |
US20050033576A1 (en) * | 2003-08-08 | 2005-02-10 | International Business Machines Corporation | Task specific code generation for speech recognition decoding |
WO2006028464A1 (en) * | 2003-09-05 | 2006-03-16 | Wifi Med Llc | Patient workflow process |
JP2005122128A (ja) * | 2003-09-25 | 2005-05-12 | Fuji Photo Film Co Ltd | 音声認識システム及びプログラム |
JP2005181442A (ja) * | 2003-12-16 | 2005-07-07 | Fuji Electric Holdings Co Ltd | 音声対話装置、その方法、プログラム |
JP4791699B2 (ja) * | 2004-03-29 | 2011-10-12 | 中国電力株式会社 | 業務支援システム及び方法 |
US20050246177A1 (en) * | 2004-04-30 | 2005-11-03 | Sbc Knowledge Ventures, L.P. | System, method and software for enabling task utterance recognition in speech enabled systems |
WO2005122144A1 (ja) * | 2004-06-10 | 2005-12-22 | Matsushita Electric Industrial Co., Ltd. | 音声認識装置、音声認識方法、及びプログラム |
US7240010B2 (en) * | 2004-06-14 | 2007-07-03 | Papadimitriou Wanda G | Voice interaction with and control of inspection equipment |
KR100682897B1 (ko) * | 2004-11-09 | 2007-02-15 | 삼성전자주식회사 | 사전 업데이트 방법 및 그 장치 |
JP4218758B2 (ja) * | 2004-12-21 | 2009-02-04 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 字幕生成装置、字幕生成方法、及びプログラム |
JP2007193661A (ja) * | 2006-01-20 | 2007-08-02 | Toshiba Mitsubishi-Electric Industrial System Corp | 検査業務支援システム及びそれを用いた製品検査方法 |
JP2008052676A (ja) * | 2006-08-28 | 2008-03-06 | Tokyo Electric Power Co Inc:The | コンピュータ実行可能なプログラム、方法、および処理装置 |
US8589869B2 (en) * | 2006-09-07 | 2013-11-19 | Wolfram Alpha Llc | Methods and systems for determining a formula |
US9318108B2 (en) * | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US20080109292A1 (en) * | 2006-11-03 | 2008-05-08 | Sap Ag | Voice-enabled workflow item interface |
GB2458238B (en) * | 2006-11-30 | 2011-03-23 | Nat Inst Of Advanced Ind Scien | Web site system for voice data search |
JP4451435B2 (ja) * | 2006-12-06 | 2010-04-14 | 本田技研工業株式会社 | 言語理解装置、言語理解方法、及び、コンピュータプログラム |
US20080312934A1 (en) * | 2007-03-07 | 2008-12-18 | Cerra Joseph P | Using results of unstructured language model based speech recognition to perform an action on a mobile communications facility |
US8200527B1 (en) * | 2007-04-25 | 2012-06-12 | Convergys Cmg Utah, Inc. | Method for prioritizing and presenting recommendations regarding organizaion's customer care capabilities |
US8170874B2 (en) * | 2007-07-02 | 2012-05-01 | Canon Kabushiki Kaisha | Apparatus and method for recognizing speech based on feature parameters of modified speech and playing back the modified speech |
US8059882B2 (en) * | 2007-07-02 | 2011-11-15 | Honeywell International Inc. | Apparatus and method for capturing information during asset inspections in a processing or other environment |
JP5178109B2 (ja) * | 2007-09-25 | 2013-04-10 | 株式会社東芝 | 検索装置、方法及びプログラム |
US20090216534A1 (en) * | 2008-02-22 | 2009-08-27 | Prakash Somasundaram | Voice-activated emergency medical services communication and documentation system |
JP4749437B2 (ja) * | 2008-03-28 | 2011-08-17 | 三菱電機インフォメーションシステムズ株式会社 | 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム |
WO2009129315A1 (en) * | 2008-04-15 | 2009-10-22 | Mobile Technologies, Llc | System and methods for maintaining speech-to-speech translation in the field |
US8676904B2 (en) * | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US20120309363A1 (en) * | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US10276170B2 (en) * | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US9009592B2 (en) * | 2010-06-22 | 2015-04-14 | Microsoft Technology Licensing, Llc | Population of lists and tasks from captured voice and audio content |
US20120109686A1 (en) * | 2010-11-01 | 2012-05-03 | Oxbow Intellectual Property, LLC | Electronic medical record system and method |
JP2013019942A (ja) * | 2011-07-07 | 2013-01-31 | Fuji Xerox Co Ltd | 情報処理装置、画像形成装置及びプログラム |
US8918789B2 (en) * | 2011-10-26 | 2014-12-23 | International Business Machines Corporation | Task assignment using ranking support vector machines |
US9489940B2 (en) * | 2012-06-11 | 2016-11-08 | Nvoq Incorporated | Apparatus and methods to update a language model in a speech recognition system |
US9646604B2 (en) * | 2012-09-15 | 2017-05-09 | Avaya Inc. | System and method for dynamic ASR based on social media |
US10276157B2 (en) * | 2012-10-01 | 2019-04-30 | Nuance Communications, Inc. | Systems and methods for providing a voice agent user interface |
KR20140056664A (ko) * | 2012-10-30 | 2014-05-12 | 삼성디스플레이 주식회사 | 광감지 패널의 검사 방법, 광감지 패널의 검사 장치 및 광검출 장치의 제조 방법 |
US9620107B2 (en) * | 2012-12-31 | 2017-04-11 | General Electric Company | Voice inspection guidance |
US9218819B1 (en) * | 2013-03-01 | 2015-12-22 | Google Inc. | Customizing actions based on contextual data and voice-based inputs |
US9626658B2 (en) * | 2013-03-15 | 2017-04-18 | Thomas W. Mustaine | System and method for generating a task list |
US10489750B2 (en) * | 2013-06-26 | 2019-11-26 | Sap Se | Intelligent task scheduler |
KR101912177B1 (ko) * | 2013-11-15 | 2018-10-26 | 인텔 코포레이션 | 음성 인식 동적 사전을 유지하기 위한 시스템 및 방법 |
US9466296B2 (en) * | 2013-12-16 | 2016-10-11 | Intel Corporation | Initiation of action upon recognition of a partial voice command |
US9858039B2 (en) * | 2014-01-28 | 2018-01-02 | Oracle International Corporation | Voice recognition of commands extracted from user interface screen devices |
CA2898078C (en) * | 2014-02-05 | 2020-09-15 | Grace Castillo Soyao | Systems, devices, and methods for analyzing and enhancing patient health |
US10803538B2 (en) * | 2014-04-14 | 2020-10-13 | Optum, Inc. | System and method for automated data entry and workflow management |
US9946985B2 (en) * | 2014-04-15 | 2018-04-17 | Kofax, Inc. | Touchless mobile applications and context-sensitive workflows |
KR102247533B1 (ko) * | 2014-07-30 | 2021-05-03 | 삼성전자주식회사 | 음성 인식 장치 및 그 제어 방법 |
JP5946073B2 (ja) * | 2014-11-07 | 2016-07-05 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 推定方法、推定システム、コンピュータ・システムおよびプログラム |
US9947313B2 (en) * | 2015-01-26 | 2018-04-17 | William Drewes | Method for substantial ongoing cumulative voice recognition error reduction |
US20160275942A1 (en) * | 2015-01-26 | 2016-09-22 | William Drewes | Method for Substantial Ongoing Cumulative Voice Recognition Error Reduction |
KR20160098910A (ko) * | 2015-02-11 | 2016-08-19 | 한국전자통신연구원 | 음성 인식 데이터 베이스 확장 방법 및 장치 |
US9865280B2 (en) * | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10460024B2 (en) * | 2016-01-05 | 2019-10-29 | Adobe Inc. | Interactive electronic form workflow assistant that guides interactions with electronic forms in a conversational manner |
US11423348B2 (en) * | 2016-01-11 | 2022-08-23 | Hand Held Products, Inc. | System and method for assessing worker performance |
CA3017121C (en) * | 2016-01-29 | 2020-12-29 | Liquid Analytics, Inc. | Systems and methods for dynamic prediction of workflows |
EP3465392B1 (en) * | 2016-06-06 | 2021-02-17 | Nureva Inc. | Time-correlated touch and speech command input |
DK179343B1 (en) * | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
-
2016
- 2016-06-21 JP JP2016122804A patent/JP6744025B2/ja active Active
-
2017
- 2017-06-20 CN CN201780016642.2A patent/CN108780542B/zh active Active
- 2017-06-20 US US16/082,335 patent/US20190079919A1/en not_active Abandoned
- 2017-06-20 WO PCT/JP2017/022626 patent/WO2017221916A1/ja active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1503156A (zh) * | 2002-11-20 | 2004-06-09 | 金宝电子工业股份有限公司 | 电子字典的查询次数累加记录与提醒的方法及其装置 |
CN103314286A (zh) * | 2011-01-13 | 2013-09-18 | 欧姆龙株式会社 | 锡焊检查方法和锡焊检查机以及基板检查系统 |
CN102184652A (zh) * | 2011-06-01 | 2011-09-14 | 张建强 | 一种演示文字书写过程的数字化方法及软件系统 |
CN102867510A (zh) * | 2011-07-07 | 2013-01-09 | 株式会社电装 | 语音识别系统 |
CN102999798A (zh) * | 2011-09-08 | 2013-03-27 | 富士施乐株式会社 | 信息管理设备、信息管理方法和信息管理系统 |
CN104756185A (zh) * | 2012-11-05 | 2015-07-01 | 三菱电机株式会社 | 语音识别装置 |
JP2014206880A (ja) * | 2013-04-12 | 2014-10-30 | Tis株式会社 | 作業支援装置 |
CN104699745A (zh) * | 2013-12-06 | 2015-06-10 | 卡西欧计算机株式会社 | 语音输出装置和语音输出方法 |
CN105575402A (zh) * | 2015-12-18 | 2016-05-11 | 合肥寰景信息技术有限公司 | 网络教学实时语音分析方法 |
Non-Patent Citations (1)
Title |
---|
高噪声环境下的语音活动检测技术;胡大雷 等;《中国农业大学学报》;20050630(第3期);65-68 * |
Also Published As
Publication number | Publication date |
---|---|
CN108780542A (zh) | 2018-11-09 |
JP6744025B2 (ja) | 2020-08-19 |
US20190079919A1 (en) | 2019-03-14 |
WO2017221916A1 (ja) | 2017-12-28 |
JP2017228030A (ja) | 2017-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108780542B (zh) | 作业支持系统、管理服务器、便携式终端、作业支持方法以及程序 | |
US10529335B2 (en) | Auto-complete methods for spoken complete value entries | |
US20230237999A1 (en) | Multiple inspector voice inspection | |
CN103714048B (zh) | 用于校正文本的方法和系统 | |
US8387024B2 (en) | Multilingual software testing tool | |
WO2019024692A1 (zh) | 语音输入方法、装置、计算机设备和存储介质 | |
JP6874729B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
CN111540353B (zh) | 一种语义理解方法、装置、设备及存储介质 | |
JP2017228030A5 (zh) | ||
JP2019185137A (ja) | 画像処理装置、画像処理方法およびプログラム | |
US20020152075A1 (en) | Composite input method | |
JP6427377B2 (ja) | 設備点検支援装置 | |
JP4749437B2 (ja) | 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム | |
JP2019185140A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2010102564A (ja) | 感情特定装置、その方法、プログラム及び記録媒体 | |
JP2010197709A (ja) | 音声認識応答方法、音声認識応答システム、及びそのプログラム | |
CN112307748A (zh) | 用于处理文本的方法和装置 | |
JP4749438B2 (ja) | 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム | |
JP2004046388A (ja) | 情報処理システムおよび文字修正方法 | |
JP5149722B2 (ja) | 検査システム | |
CN112541651B (zh) | 电子设备、发音学习方法、服务器装置、发音学习处理系统及记录介质 | |
JP3212159U (ja) | 自動文字入力認識装置付き電子辞書 | |
JP4815463B2 (ja) | 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム | |
JPH0531186B2 (zh) | ||
CN115904172A (zh) | 电子设备、学习辅助系统、学习处理方法以及程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |