CN110626548B - 信息处理设备、信息处理方法和存储介质 - Google Patents

信息处理设备、信息处理方法和存储介质 Download PDF

Info

Publication number
CN110626548B
CN110626548B CN201910480625.5A CN201910480625A CN110626548B CN 110626548 B CN110626548 B CN 110626548B CN 201910480625 A CN201910480625 A CN 201910480625A CN 110626548 B CN110626548 B CN 110626548B
Authority
CN
China
Prior art keywords
suction
unit
image
packaging object
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910480625.5A
Other languages
English (en)
Other versions
CN110626548A (zh
Inventor
肥后智昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN110626548A publication Critical patent/CN110626548A/zh
Application granted granted Critical
Publication of CN110626548B publication Critical patent/CN110626548B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J15/00Gripping heads and other end effectors
    • B25J15/06Gripping heads and other end effectors with vacuum or magnetic holding means
    • B25J15/0616Gripping heads and other end effectors with vacuum or magnetic holding means with vacuum
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65BMACHINES, APPARATUS OR DEVICES FOR, OR METHODS OF, PACKAGING ARTICLES OR MATERIALS; UNPACKING
    • B65B35/00Supplying, feeding, arranging or orientating articles to be packaged
    • B65B35/10Feeding, e.g. conveying, single articles
    • B65B35/16Feeding, e.g. conveying, single articles by grippers
    • B65B35/18Feeding, e.g. conveying, single articles by grippers by suction-operated grippers
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J19/00Accessories fitted to manipulators, e.g. for monitoring, for viewing; Safety devices combined with or specially adapted for use in connection with manipulators
    • B25J19/02Sensing devices
    • B25J19/021Optical sensing devices
    • B25J19/023Optical sensing devices including video camera means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1694Programme controls characterised by use of sensors other than normal servo-feedback from position, speed or acceleration sensors, perception control, multi-sensor controlled systems, sensor fusion
    • B25J9/1697Vision controlled systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65BMACHINES, APPARATUS OR DEVICES FOR, OR METHODS OF, PACKAGING ARTICLES OR MATERIALS; UNPACKING
    • B65B57/00Automatic control, checking, warning, or safety devices
    • B65B57/10Automatic control, checking, warning, or safety devices responsive to absence, presence, abnormal feed, or misplacement of articles or materials to be packaged
    • B65B57/14Automatic control, checking, warning, or safety devices responsive to absence, presence, abnormal feed, or misplacement of articles or materials to be packaged and operating to control, or stop, the feed of articles or material to be packaged
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39558Vacuum hand has selective gripper area
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/40Robotics, robotics mapping to robotics vision
    • G05B2219/40053Pick 3-D object from pile of objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • General Physics & Mathematics (AREA)
  • Robotics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Manipulator (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Abstract

本发明提供一种信息处理设备、信息处理方法和存储介质。所述信息处理设备用于输出用于控制抽吸装置的控制信息,所述抽吸装置被配置为抽吸包装物体,所述信息处理设备包括:输入单元,其被配置为输入通过对所述包装物体的表面进行摄像所获得的图像;以及输出单元,其被配置为基于从所述图像所指定的所述包装物体的表面的状态,来输出用以控制所述抽吸装置开始抽吸的定时的控制信息。

Description

信息处理设备、信息处理方法和存储介质
技术领域
本发明的各方面通常涉及用以利用机器人通过抽吸来吸引物体的技术。
背景技术
经常使用诸如吸盘(suction pad)等的抽吸单元附接至机器人臂的前端的一些工业机器人来通过抽吸吸引物体以输送该物体。为了通过抽吸吸引物体,需要将吸盘施加到物体的表面上的容易通过抽吸吸引的区域并且进行抽吸。在物体是用包装材料袋装物体的袋装物体的情况下,需要通过抽吸吸引处于放在袋子中的状态的物体。
日本特开2014-213395论述了用以通过抽吸单元在覆盖整个袋装物体的状态下进行抽吸来通过抽吸吸引该袋装物体的技术。
在抽吸期间进入并被吸入抽吸单元中的包装材料的一部分的量或者这种吸入发生的速度根据包装材料的类型或其表面状态而改变。在日本特开2014-213395所论述的技术中,在紧接在抽吸中断之后抽吸单元进行诸如移位移动等的操作的情况下,抽吸单元可能会将对象包装物体扔掉。
发明内容
本发明的各方面通常涉及允许稳定地通过抽吸吸引并输送用包装材料包装物体的包装物体。
根据本发明的方面,一种信息处理设备,用于输出用于控制抽吸装置的控制信息,所述抽吸装置被配置为抽吸包装物体,所述信息处理设备包括:输入单元,其被配置为输入通过对所述包装物体的表面进行摄像所获得的图像;以及输出单元,其被配置为基于从所述图像所指定的所述包装物体的表面的状态,来输出用以控制所述抽吸装置开始抽吸的定时的控制信息。
通过以下参考附图对典型实施例的说明,本发明的更多特征将变得明显。
附图说明
图1A和1B分别是示出根据第一典型实施例和第二典型实施例的信息处理系统的结构示例的图。
图2是示出根据第一典型实施例的信息处理设备的功能结构示例的图。
图3是示出根据第一典型实施例的信息处理设备的硬件结构的图。
图4是示出根据第一典型实施例的信息处理系统进行的处理过程的流程图。
图5是示出根据第一典型实施例的信息处理设备的功能结构示例的图。
图6A和6B是示出根据第一典型实施例的信息处理系统进行的处理过程的流程图。
图7是示出根据第二典型实施例的信息处理设备的功能结构示例的图。
图8A和8B是示出根据第二典型实施例的信息处理系统进行的处理过程的流程图。
图9是示出根据第二典型实施例的信息处理设备的功能结构示例的图。
图10是示出根据第二典型实施例的信息处理系统进行的处理过程的流程图。
图11是示出根据第三典型实施例的信息处理设备的功能结构示例的图。
图12A和12B是示出根据第三典型实施例的信息处理系统进行的处理过程的流程图。
图13是示出根据第三典型实施例的信息处理设备的功能结构示例的图。
图14是示出根据第三典型实施例的信息处理系统进行的处理过程的流程图。
图15是示出根据第一典型实施例的信息处理设备进行的处理过程的流程图。
图16是示出根据第一典型实施例的信息处理设备进行的处理过程的流程图。
图17是用于说明第一典型实施例中的确定单元进行的处理的图。
图18是用于说明本发明的各典型实施例中的进行抽吸的定时的图。
图19A和19B分别是用于说明第一典型实施例和第二典型实施例中的请求的图。
具体实施方式
在说明本发明的典型实施例之前,说明各术语的定义。
术语“包装材料”是指例如塑料(乙烯基塑料)、尼龙、纸张和布。术语“包装物体”是指用包装材料包装的物体。例如,包装物体是例如放在塑料(乙烯基塑料)袋中的线缆、袋装薯片或包裹的手提箱。
参考图18来进一步说明如在以下的典型实施例中使用的术语。图18是以时间序列方式示出利用抽吸型的拣选机将包装物体13输送到目的地容器15的任务的图。各个典型实施例中的信息处理设备基于包装物体的表面的状态来确定用于控制拣选机进行抽吸的定时的抽吸参数。抽吸参数(由Pk表示)具体是三个参数,即开始抽吸的定时(由P1表示)、在通过抽吸吸引包装物体之后使吸盘保持静止的时间(由P2表示)、以及在抽吸停止之后使吸盘保持静止的时间(由P3表示)。换句话说,抽吸参数是用于确定与包装物体的抽吸有关的方法的控制值。信息处理设备根据抽吸参数来控制抽吸控制的定时。在典型实施例中,抽吸参数是根据包装物体的表面的状态而改变的参数。此外,不论包装物体的表面的状态如何,都可以确定参数P1、P2和P3中的任一参数。在这种情况下,基于预先固定的参数或用户设置的值来确定该参数。
开始抽吸的定时(P1)是如下的参数,该参数用于判断在进行抽吸时、是在使吸盘与包装物体接触之后开始抽吸还是在使吸盘与包装物体接触之前开始抽吸,然后在进行抽吸的同时,使吸盘移动得更靠近包装物体。在图18中,“T=T1”表示抽吸单元12和包装物体13彼此接触的时间,并且ΔT表示任何给定的微小时间。在“P1=0”的情况下,在抽吸单元和包装物体彼此接触之前(T=T1-ΔT)开始抽吸,并且在“P1=1”的情况下,在抽吸单元和包装物体彼此接触之后(T=T1)开始抽吸。因此,开始抽吸的定时是指示包括接触之前的定时和接触时的定时的两个值其中之一的参数。例如,在包装物体的表面无褶皱并且吸盘容易与包装物体的表面紧密接触的情况下,在吸盘和包装物体的表面彼此接触之后(接触时的定时)开始抽吸,因此容易成功进行抽吸。另一方面,存在如下的情况:包装物体的表面存在褶皱,并且即使在吸盘压抵包装物体的表面时,也发生真空泄漏。在这种情况下,首先开始抽吸,并且在进行抽吸的同时吸盘更靠近包装物体(接触之前的定时),使得包装材料的褶皱部分被抽吸并吸入吸盘以避免发生任何真空泄漏,因此容易成功进行抽吸。
术语“第一静止时间”是在吸盘通过抽吸吸引包装物体之后使吸盘保持静止的时间。换句话说,第一静止时间是表示在进行抽吸时从使吸盘与包装物体接触时起直到开始提起包装物体以供输送的运动时为止的时间的参数。在图18中,在“T=T1”处获得的场景182表示抽吸单元12和包装物体13已彼此接触的行为。如果开始输送的时间被设置为T2,则时间P2变为等于“T2-T1”。例如,时间P2可以取连续值,诸如0秒、0.1秒、0.5秒和1.0秒等。在包装材料薄且柔软的情况或者包装材料存在褶皱的情况下,即使当吸盘在与包装物体接触的状态下抽吸包装物体时,包装材料也有可能移动,使得除非包装物体在保持处于静止并持续了相对较长的时间之后被提起,否则可能发生真空泄漏。另一方面,在包装材料不太可能移动的情况下,即使当吸盘在与包装物体接触之后抽吸包装物体时,包装物体也能够立即被提起。
术语“第二静止时间”是在吸盘停止抽吸之后使吸盘保持静止的时间。换句话说,第二静止时间是在将包装物体在该包装物体的输送目的地处释放(停止抽吸以使包装物体从吸盘释放并放下包装物体)时从吸盘停止抽吸时起直到吸盘开始用以进行下一任务的运动为止的时间。在图18中,在“T=T3”处获得的场景184表示将包装物体13输送到目的地容器15已完成的行为。在该状态下,使吸盘从时间T3起保持静止并持续了P3秒。例如,时间P3可以取连续值,诸如0秒、0.1秒、0.5秒和1.0秒等。在释放有可能被吸入吸盘的包装物体的情况下,吸入吸盘的包装材料即使在抽吸停止时也可以防止包装物体与吸盘立即分离。如果在包装物体与吸盘分离之前开始下一任务的操作,则吸盘可能扔掉包装物体。
此外,用于控制抽吸单元的位置和取向的参数被称为“控制参数”。控制参数是基于抽吸单元的位置和取向、包装材料(待输送物体)的位置和取向以及输送目的地的位置所确定的,并且假定与抽吸参数区分开。换句话说,控制参数是致动器单元11进行抽吸单元12的移动控制所使用的参数。
关于信息处理设备进行如下任务的情况来说明第一典型实施例,该任务用于从多个包装物体成堆堆叠的容器逐一地通过抽吸吸引并取出包装物体、然后将各包装物体输送并放到预定位置。为了通过抽吸吸引包装物体,吸盘需要在与包装物体紧密接触的状态下抽吸作为输送对象的包装物体,以防止由于抽吸所用的空气的漏入而发生真空泄漏。例如,即使在将吸盘压抵作为包装物体的包装材料的塑料(乙烯基塑料)起皱的区域、然后吸盘抽吸塑料(乙烯基塑料)时,也从塑料(乙烯基塑料)起皱的区域发生真空泄漏,使得吸盘不能通过抽吸吸引包装物体。另一方面,当吸盘在与包装物体紧密接触之前开始抽吸、并且吸盘在进行抽吸的同时更靠近包装物体时,如果包装物体的包装材料是薄且柔软的材料,则该包装材料被吸入吸盘,使得吸盘可以通过抽吸吸引包装物体。此外,即使相同类型的包装物体也在其表面的状态(其褶皱量)方面发生改变。根据褶皱量改变抽吸的定时允许更稳定地进行抽吸。因此,第一典型实施例基于与包装材料的表面的状态有关的信息来获得三个抽吸参数(即,用于开始抽吸的定时、第一静止时间和第二静止时间),并且基于这三个抽吸参数来控制抽吸,由此以稳定方式进行抽吸和输送。在将第一典型实施例划分成执行模式和学习模式的情况下说明第一典型实施例。此外,用于开始抽吸的定时是利用抽吸装置开始抽吸的定时,并且包括在抽吸装置和包装物体彼此接触之前开始抽吸的情况和在抽吸装置和包装物体彼此接触之后开始抽吸的情况。第一静止时间表示从抽吸装置和包装物体的表面彼此接触时起、直到利用抽吸装置开始输送时为止的时间。第二静止时间表示从在将包装物体输送到输送目的地之后抽吸装置停止抽吸时起、直到抽吸装置开始移位移动为止的时间。在抽吸装置停止抽吸时,包装物体与抽吸装置分离。首先,说明确定抽吸参数并且基于所确定的抽吸参数来进行抽吸和输送的执行模式所用的处理。图1A是示出第一典型实施例中的信息处理系统10000的结构的图。信息处理系统10000包括信息处理设备1、摄像单元10、致动器单元11和抽吸单元12。信息处理系统10000基于通过附接至作为机器人臂的致动器单元11的摄像单元10进行摄像所获得的图像信息来控制致动器单元11。然后,信息处理系统10000进行以下任务:使附接至致动器单元11的前端部分的抽吸单元12通过抽吸吸引放置在容器14中的包装物体13,并且将包装物体13输送至作为输送目的地的容器15。此外,抽吸单元12的前端部分形成为被称为吸盘的抽吸面,并且可以采用各种形状。此外,关于抽吸单元12中的压力,压力计(未示出)测量吸盘内的真空压力,并且信息处理设备1能够获取真空计的测量结果。
图2是示出第一典型实施例中的信息处理设备1的功能结构示例的图。信息处理设备1包括输入单元200、提取单元201、确定单元202、控制单元203和保持单元205。控制单元203包括致动器控制单元2031和抽吸控制单元2032。输入单元200连接到摄像单元10,致动器控制单元2031连接到致动器单元11,并且抽吸控制单元2032连接到抽吸单元12。然而,图2仅示出功能结构的示例,因此并不旨在限制本发明的适用范围。摄像单元10拍摄示出包装物体和容器的场景的彩色图像和距离图像。因而,要使用的摄像单元10包括例如立体照相机和RGB深度(RGB-D)照相机。在第一典型实施例中,例如,摄像单元10拍摄包括包装物体13和容器14的场景的图像,由此输出彩色图像和距离图像。输入单元200输入通过拍摄所输送的包装物体的图像而获得的图像。输入单元200输入通过摄像单元10进行摄像所获得的场景的彩色图像和距离图像,并且将所输入的彩色图像和距离图像输出到提取单元201。
提取单元201通过将模板与所输入的图像进行比较来提取使抽吸单元12通过抽吸吸引包装物体的抽吸位置,其中该模板是包装物体的表面的状态和适合于抽吸的位置彼此相关联的图像特征。换句话说,提取单元201基于输入单元200所输入的彩色图像或距离图像来提取使抽吸装置通过抽吸吸引包装物体的位置。这里,提取单元201利用使用模板的图案匹配来提取包装物体的重心的位置。以下说明获取抽吸位置的具体示例。提取单元201将与所获取到的抽吸位置有关的信息输出到确定单元202和致动器控制单元2031。
确定单元202基于如下的数据,根据包装物体的表面的状态来确定定时,其中在该数据中,指示抽吸是否成功的结果与包装物体的表面的状态和用于控制抽吸的定时的组合相关联。更具体地,确定单元202在与提取单元201所输入的抽吸位置相对应的图像区域中,基于保持单元205所保持的包装材料抽吸特征数据库来提取抽吸参数。这里,包装物体的表面的状态表示包装物体的表面上所存在的褶皱的量。以下说明包装材料抽吸特征数据库。此外,以下还说明具体的处理操作。确定单元202将所提取的抽吸参数输出到抽吸控制单元2032。此外,确定单元202确定用于控制抽吸单元12的移位移动的控制参数。基于抽吸单元12的位置和取向以及容器14或容器15的位置来确定控制参数。
控制单元203根据确定单元202所确定的抽吸参数或控制参数来控制抽吸单元12。控制单元203包括致动器控制单元2031和抽吸控制单元2032。致动器控制单元2031根据抽吸参数或控制参数来控制致动器单元11。换句话说,致动器控制单元2031基于提取单元201所输入的抽吸位置来控制致动器单元11以进行用以通过抽吸吸引并输送包装物体13的控制。此外,在抽吸期间,致动器控制单元2031与抽吸控制单元2032协作地进行对例如抽吸的定时的控制。抽吸控制单元2032根据确定单元202所输入的抽吸参数,通过设置用于在通过抽吸吸引包装物体13时开始抽吸的定时、第一静止时间和第二静止时间来控制抽吸。此外,抽吸控制单元2032与致动器控制单元2031协作地进行抽吸单元12根据抽吸参数所进行的抽吸的控制以通过抽吸吸引包装物体13。保持单元205保持确定单元202使用的包装材料抽吸特征数据库和与该包装材料抽吸特征数据库相对应的特征滤波器,并且将与数据库和特征滤波器有关的信息输出到确定单元202。此外,滤波器是指用于计算图像中的特征量的变化的矩阵或处理。
参考图17来说明确定单元202所进行的处理的概念。首先,确定单元202在与提取单元201所输入的抽吸位置相对应的图像区域中获取作为彩色图像块的图像块170和作为距离图像块的图像块171。此外,图像块170是通过拍摄包装物体13的抽吸位置的图像所获得的图像,其示出在包装材料的表面上存在两个褶皱的状况。图像块171是在与图像块170相对应的图像区域中、从距离传感器或视差图像获得的距离值与图像的各个像素相关联的图像。包装材料抽吸特征是如下的数据:在所拍摄到的图像中示出包装材料的图像块(通过部分剪切对象图像所获得的图像部分)的区域中,抽吸和输送的成功或失败的判断结果与图像块和抽吸参数的组合相关联。换句话说,包装材料抽吸特征是指示适合于给定包装物体的表面的状态的抽吸参数(与抽吸有关的定时)的数据。此外,所收集到的大量这样的数据的汇总被称为“包装材料抽吸特征数据库”。在将针对包装材料抽吸特征数据库的一组块提取包装材料的特性的特征滤波器172应用于图像块170或图像块171时,获得一组特征向量。由此,关于图像块170,确定单元202获取包装物体的表面的状态作为特征向量1730-1。特征向量1730-1是(在特征空间中)表示包装材料的表面的状态的向量。确定单元202将抽吸参数和判断结果与特征向量组1731-1相关联,其中在特征向量组1731-1中,相同或相似的特征向量汇总在一起。然后,关于特征向量,确定单元202选择判断结果成功的百分比高的抽吸参数的值,由此能够根据哪个判断结果有可能变为成功来获得抽吸参数。例如,确定单元202将具有在包装物体的表面上不存在褶皱这一特征的特征向量的组集群成特征向量组1731-1、1731-2、1731-3、...、和1731-k。此外,包括这样的多个特征向量组的空间被称为“特征向量空间173”。可以针对包装物体的表面的每个特征,将特征向量空间173分割成特征向量子空间174。例如,特征向量子空间174是将褶皱量设置为轴的一维空间。此外,通过添加其它轴或聚合特征向量,可以通过诸如平面175等的平面来表现一组特征向量。以这种方式,确定单元202改变对用于开始抽吸装置所进行的抽吸的定时或用于进行抽吸装置的移位移动的定时的控制。例如,在图像的表面中所包括的褶皱量大于预定阈值时,确定单元202进行改变,使得在抽吸装置与包装物体接触之前开始抽吸装置所进行的抽吸。因而,在褶皱量较大时,确定单元202使得用于开始抽吸的定时提早。具体地,由于褶皱量大的包装材料被预先确定或被预期是柔软的,因此提早进行抽吸使得通过抽吸吸引包装材料以便将包装材料吸入吸盘。这降低了包装材料从吸盘掉落的可能性。另一方面,由于预先确定或预期硬的包装材料在其表面上具有少量褶皱,因此确定单元202使得用于开始抽吸的定时推后。关于用于提取包装材料的特性的特征滤波器,例如,边缘的密度表示包装材料发生褶皱的可能性、换句话说包装材料的柔软度或厚度,并且包装材料具有重叠部分的区域和包装材料无重叠部分的区域之间的亮度或饱和度的比表现了包装材料的透过率或厚度。准备这样的特征滤波器允许提取表示包装材料的特性的特征向量。例如,在具体获得褶皱数量的情况下,确定单元202利用例如用于提取边缘的Sobel滤波器、Laplacian滤波器或Canny滤波器来提取褶皱的线。
说明了包装材料抽吸特征数据库中的成功或失败的判断结果的具体示例。存在三个判断结果,即指示以下的结果:当抽吸装置在与待输送物体接触的状态下正抽吸该物体时、真空压力是否已降至阈值以下;抽吸装置是否能够通过抽吸吸引待输送物体并提起该物体;以及抽吸装置是否已能够将待输送物体输送到输送目的地。对于三个判断结果各自,供给与包装材料抽吸特征数据的数量一样多的针对抽吸参数的各值的成功或失败的结果。另外,成功或失败的这三个判断结果分别对应于抽吸参数中的用于开始抽吸的定时、第一静止时间和第二静止时间。例如,关于与给定包装材料抽吸特征有关的数据,考虑与用于开始抽吸的定时的值(P1)相对应的成功或失败的判断结果。基于当抽吸装置在与包装物体接触的状态下正抽吸包装物体体时真空压力是否已降至阈值以下,来判断与值P1相对应的成功或失败的判断结果,并且如果真空压力已降至阈值以下,则确定单元202判断为抽吸参数中的用于开始抽吸的定时的值是适当的。因此,在包装材料抽吸特征数据库中,如果确定与图像块相对应的特征向量,则关于各个抽吸参数,可以将具有成功数据的数量和失败数据的数量的百分比中的成功数据的数量的百分比最高的值设置为抽吸参数。在这里所述的示例中,尽管成功或失败的三个判断结果分别对应于相应的三个抽吸参数,但本典型实施例不限于该示例。例如,仅当成功或失败的三个判断结果全部指示成功时,才可以判断为与这三个判断结果相对应的三个抽吸参数的组合是适当的。
图3是示出信息处理设备1的硬件结构的图。中央处理单元(CPU)H11控制连接到系统总线H20的各种装置。只读存储器(ROM)H12存储基本输入/输出系统(BIOS)的程序和引导程序。随机存取存储器(RAM)H13用作CPU H11的主存储装置。外部存储器H14存储信息处理设备1进行处理所依据的程序。作为触摸面板、键盘、鼠标或机器人控制器的输入单元H15进行与例如信息的输入有关的处理。显示单元H16将信息处理设备1根据来自CPU H11的指示所进行的计算的结果输出到显示装置。此外,显示装置可以是诸如液晶显示装置、投影仪或发光二极管(LED)指示器等的任何类型的显示器。通信接口H17利用任何类型的通信方法(诸如以太网、通用串行总线(USB)、串行通信或无线通信等)经由网络进行信息通信。输入-输出(I/O)单元H18连接到照相机H19。此外,照相机H19相当于摄像单元10。
在第一典型实施例中,摄像单元10附接至致动器单元11。在摄像单元10所拍摄到的图像上确定了抽吸可用的位置和取向时,为了使致动器单元11移动到所确定的位置,假定预先校准了致动器单元11的坐标系和摄像单元10的坐标系之间的关系,并且假定预先获得了具有六个自由度的参数。该参数由表示摄像单元10(照相机H19)的坐标系相对于机器人的坐标系的关系的旋转矩阵和平移向量来表示,并且旋转矩阵具有三个自由度且平移向量具有三个自由度。同样,抽吸单元12附接至致动器单元11的前端。为了使抽吸单元12移动到预期或预定的位置,假定预先校准了致动器单元11的坐标系和抽吸单元12的坐标系之间的关系并且假定预先获得了具有六个自由度的参数。
接着,说明第一典型实施例中的处理过程。首先,简要说明信息处理设备1进行的处理,然后,以下参考信息处理系统的流程图来说明该处理的具体示例。图15是示出信息处理设备1进行的处理过程的流程图。在步骤S4000中,信息处理设备1进行参数的初始化。在步骤S4020中,输入单元200输入摄像单元10所拍摄到的图像。在步骤S4030中,提取单元201从所输入的图像中提取包装物体13的抽吸位置。在步骤S4040中,确定单元202基于所输入的图像,根据用于对包装物体13进行包装的包装材料的表面的状态来确定抽吸参数。在步骤S4080中,控制单元203进行控制以使抽吸单元12开始抽吸。在步骤S4140中,信息处理设备1判断任务是否已完成,并且如果判断为任务已完成(步骤S4140中为“是”),则处理结束,并且如果判断为任务没有完成(步骤S4140中为“否”),则处理返回到步骤S4020。
图4是示出第一典型实施例中的包括信息处理设备1的信息处理系统10000进行的处理过程的流程图。然而,信息处理系统10000不必一定进行该流程图中所述的所有步骤。
在步骤S4000中,信息处理系统10000进行系统的初始化。更具体地,信息处理系统10000从外部存储器H14读取程序,由此使信息处理设备1进入能够操作的状态。信息处理系统10000进行摄像单元10和致动器单元11的启动、针对这两者的参数的读取、以及与摄像单元10、致动器单元11和抽吸单元12有关的校准信息的读取,并且使用已预先校准的摄像单元10的内部参数(例如,焦距、图像中心位置和镜头失真)。此外,信息处理系统10000读取容器14和容器15的位置。另外,信息处理系统10000从保持单元205读取与包装材料抽吸特征数据库相对应的特征滤波器,将该特征滤波器应用于包装材料抽吸特征数据库中的一组图像块,并且预先获得了与这些图像块相对应的特征向量。然后,信息处理系统10000针对每个相同或相似的特征向量对特征向量进行分类,针对各特征向量参考成功或失败的判断结果,并且将有可能引起成功的抽吸参数与各特征向量相关联。此外,在进行摄像之前,信息处理系统10000使致动器控制单元2031基于校准后的位置控制致动器单元11,由此使摄像单元10移动到能够拍摄放入容器14中的包装物体13的图像的位置。
在步骤S4010中,摄像单元10进行放入容器14中的包装物体13的摄像,由此获得彩色图像和距离图像。在步骤S4020中,输入单元200输入通过进行包装物体的摄像所获得的图像。更具体地,输入单元200将在步骤S4010中通过摄像所获得的彩色图像和距离图像输入到提取单元201。输入单元200可以获取灰度图像或红外图像,只要该图像可用于观测包装材料的表面即可。在步骤S4030中,提取单元201提取使抽吸装置通过抽吸吸引包装物体的抽吸位置。具体地,提取单元201通过将指示包装物体的特征的模板(图像特征)和步骤S4010中所提取的图像彼此比较来提取包装物体的位置。针对各模板分配与抽吸位置(物体的重心位置)有关的数据。更具体地,提取单元201从彩色图像提取用于检测成堆堆叠在容器14中的包装物体13的图像特征,并且进行图像特征与指示包装物体13的特征的模板的匹配,由此指定包装物体13的抽吸位置。这里,模板是如下的数据:在以各种取向观测包装物体13和抽吸位置(物体的重心位置)之后,图像中的特征与该图像中所包括的包装物体13的抽吸位置和取向相关联,并且指示如果特征相似,则存在相似的取向状态。此外,预先针对各模板确定了抽吸位置。因此,在所输入的图像的一部分与模板匹配的情况下,提取单元201获取对应部分作为抽吸位置。此外,提取单元201获取的模板由保持单元205保持或保持在外部存储单元中。模板可以是二维图像,或者可以是包装物体的三维模型。这里,提取单元201获取多个包装物体的二维位置。另外,在步骤S4010中所获取的距离图像(三维信息)中,提取单元201识别不会干扰其它包装物体的包装物体的位置,并且从距离图像中三维地提取该包装物体的取向。然后,提取单元201提取存在抽吸可利用的面的包装物体的抽吸候选区域(提取结果)。更具体地,提取单元201将如下操作的结果设置为抽吸候选区域:通过将包装物体存在于的区域与包装物体的图像特征进行比较来提取包装物体的二维位置,并且进一步利用与距离图像有关的深度信息来提取抽吸单元能够通过抽吸吸引的多个包装物体的三维位置。通过使用包装物体的三维位置,提取单元201能够以高精度来确定抽吸所使用的位置。在距离图像中,提取单元201识别成堆堆叠的包装物体13中的存在于近侧且不会干扰其它包装物体的包装物体13的位置,并且三维地获得该包装物体13的取向。换句话说,提取单元201将多个包装物体中的指示从摄像单元10起的深度的值最小的抽吸候选区域确定为抽吸位置。由于从上方的包装物体起逐一地顺次通过抽吸吸引一堆包装物体允许防止包装物体的崩塌,因此可以进行稳定的抽吸。此外,提取抽吸位置的方法不限于上述方法。
在步骤S4040中,确定单元202基于指示抽吸是否成功的结果与包装物体的表面的状态和抽吸的定时的组合相关联的数据,根据包装物体的表面的状态来确定抽吸参数。确定单元202利用彩色图像、距离图像和包装材料抽吸特征数据库来确定步骤S4030中所获取到的抽吸位置及其周围部分中的抽吸参数。具体地,首先,确定单元202提取抽吸位置及其周围部分的彩色图像或距离图像的图像块。此时,确定单元202基于距离图像来设置图像块的大小,使得变成具有吸盘的直径以实际大小收敛的大小的正方形。由于仅吸盘实际压抵的区域(吸盘的直径收敛的大小)对抽吸参数的估计的影响大,因此确定单元202将图像块的大小调整为吸盘的直径。由于以调整成实际大小的方式所获取到的图像块根据距离而在像素大小上改变,因此确定单元202通过以这种方式调整大小以具有预定大小来放大或缩小图像块。例如,确定单元202将图像块调整成在水平方向和垂直方向上都为64个像素。然后,确定单元202将特征滤波器应用于调整大小后的图像块,由此获得特征向量。接着,确定单元202进行特征向量与包装材料抽吸特征数据库中的特征向量的比较。如果找到相似的特征向量,则确定单元202提取与所找到的相似特征向量相关联的有可能引起成功的抽吸参数,由此获得抽吸参数。尽管这里已经说明了使用彩色图像和距离图像的示例,但本典型实施例不限于该示例,而是确定单元202可以利用彩色图像和距离图像中的任一个与包装材料抽吸特征数据库进行比较。此外,除彩色图像之外,确定单元202还可以使用例如单色图像、红外图像或紫外图像,可以使用通过从各种视点进行抽吸位置的摄像所获得的多个图像,或者可以使用通过投射图案光并根据所反射的图案光进行摄像而获得的图像。在任意情况下,假定预先准备了可用于与输入进行比较的格式的包装材料抽吸特征数据库。尽管这里已经说明了图像块的大小在水平方向和垂直方向上为64个像素的示例,但本典型实施例不限于该示例。
在步骤S4050中,确定单元202基于抽吸单元12的初始位置以及与包装物体13和容器15有关的位置信息来确定控制参数。该控制参数是致动器单元11进行抽吸单元12的位置的移动控制所使用的参数。例如,确定单元202将用于使抽吸单元12移动到包装物体13的位置的控制确定为控制参数。在步骤S4060中,致动器控制单元2031根据步骤S4050中所确定的控制参数来控制致动器单元11,使得抽吸单元12到达提取单元201所输入的抽吸位置附近。在步骤S4070中,信息处理设备1通过参考抽吸控制单元2032所获得的抽吸参数中的用于开始抽吸的定时P1来进行判断。如果判断为首先开始抽吸(P1=0)(步骤S4070中为“是”),则处理进入步骤S4080。另一方面,如果判断为在与包装物体接触之后要进行抽吸(P1=1)(步骤S4070中为“否”),则处理进入步骤S4071。在步骤S4080中,抽吸控制单元2032进行控制以使抽吸单元12开始抽吸。在步骤S4090中,致动器控制单元2031根据步骤S4050中所确定的控制参数来控制致动器单元11,以便使抽吸单元12在抽吸包装物体13的同时与包装物体13接触。然后,处理进入步骤S4100。在步骤S4071中,致动器控制单元2031根据步骤S4050中所确定的控制参数来控制致动器单元11,以便使抽吸单元12与包装物体13接触。在步骤S4072中,抽吸控制单元2032进行控制以使抽吸单元12开始抽吸。此时,抽吸单元12处于与包装物体13接触的状态。然后,处理进入步骤S4100。此外,在通过根据步骤S4050中所确定的控制参数控制抽吸单元12使得抽吸单元12能够到达包装物体13的抽吸位置时,考虑抽吸单元12和包装物体13是否已彼此接触允许进行更稳定的拣选。例如,观测单元(未示出)可以测量抽吸单元的真空压力,并且如果真空压力已降至低于预定值,则观测单元可以判断为抽吸单元12和包装物体13已彼此接触。可选地,可以在机器人手或吸盘上安装接触传感器,并且可以利用检测单元(未示出)检测这种接触。
这里,参考图18来说明用于开始抽吸的定时的具体示例。在曲线图18中,纵轴关于对抽吸单元12的抽吸控制表示抽吸开启(ON)的状态和抽吸关闭(OFF)的状态,并且横轴表示时间。“T=0”表示将放入容器14中的包装物体输送到容器15的任务已开始的定时。“T=T1”表示抽吸单元和包装物体彼此接触的定时。“T=T2”表示开始输送包装物体的定时。“T=T3”表示停止抽吸并释放包装物体的定时。在场景180中,示出了在“T=0”时存在的摄像单元10、抽吸单元12、包装物体(待输送物体)13、容器14和剩余待输送物体。摄像单元10和抽吸单元12各自连接到信息处理设备1。信息处理设备1从所拍摄到的图像中提取包装物体13的抽吸位置。在“T=0”处,摄像单元10进行包装物体13和容器14的摄像。在容器14中存在成堆堆叠的多个包装物体,并且包装物体13放置在这样的一堆包装物体的顶部。在曲线图18中,抽吸控制在抽吸参数是“P1=0”的情况下由实线表示,并且在抽吸参数是“P1=1”的情况下由虚线表示。如在场景181中那样,在紧挨抽吸单元12到达包装物体13之前的时间(T=T1-ΔT秒),在抽吸参数是“P1=0”的情况下,此时开始抽吸。在抽吸参数(P1)是“P1=1”的情况下,在“T=T1”的定时开始抽吸单元12的抽吸。如场景182所示,在“T=T1”的定时,包装物体13和抽吸单元12彼此接触。接着,在将数值设置为抽吸参数P2的情况下,抽吸单元12在抽吸包装物体13的同时在场景182的状态下保持静止并持续了P2秒。在作为包装物体13和抽吸单元12之间的接触之后的P2秒的“T=T2”的定时,抽吸单元12开始输送包装物体13。场景183表示抽吸单元12在输送包装物体13的过程中的状态。在输送包装物体13之后,抽吸单元12在“T=T3”的定时到达作为目的地的容器15的附近。场景184表示此时的这种状态。这里,在预先设置了抽吸参数P3的情况下,抽吸单元12停止抽吸且保持静止并持续了P3秒。在“T3+P3”秒之后,再次移动抽吸单元12。这样,信息处理设备1根据所确定的抽吸参数来改变进行抽吸的定时。
在步骤S4100中,致动器控制单元2031根据步骤S4040中所确定的抽吸参数中所包括的第一静止时间(P2),使抽吸单元12在与包装物体13接触的同时抽吸包装物体13的状态下保持静止并持续了第一静止时间(P2秒)。换句话说,致动器单元11保持静止并持续了P2秒。这里,保持抽吸单元静止允许通过抽吸充分吸引包装物体,这是因为例如在包装物体的表面存在许多褶皱的情况下,抽吸单元在与包装物体的表面接触的同时进行抽吸,由此能够吸入褶皱并由此消除褶皱。在步骤S4110中,致动器控制单元2031根据步骤S4050中所确定的控制参数,来控制致动器单元11以将包装物体13输送到容器15。在步骤S4120中,为了将抽吸单元12通过抽吸吸引的包装物体13释放到容器15,抽吸控制单元2032进行控制以停止抽吸单元12所进行的抽吸。在步骤S4130中,致动器控制单元2031根据抽吸参数中所包括的第二静止时间(P3),使致动器单元11在步骤S4120中停止抽吸之后保持静止并持续了第二静止时间(P3秒)。在该静止时间期间,包装物体13完全从抽吸单元12释放到容器15。例如,即使在包装材料是稍微柔软的材料并且不太可能与抽吸单元分离的情况下,保持抽吸单元静止并持续了一段时间也允许提高释放的成功率。
在步骤S4140中,信息处理设备1判断是否完成任务,并且如果判断为完成任务(步骤S4140中为“是”),则处理结束。如果判断为未完成任务(步骤S4140中为“否”),则处理进入步骤S4141。这里,用以完成任务的判断是基于不再需要将任何其它的包装物体从容器14输送到容器15的情况。例如,这种情况包括在容器中已没有包装物体的时间、任何其它的包装物体不能放入容器15的时间、以及完全输送了用户所需的数量的包装物体的时间。在步骤S4141中,致动器控制单元2031控制致动器单元11,使得摄像单元10移动到可用于进行容器14中的包装物体的摄像的位置和取向。然后,处理返回到步骤S4010。
上述处理允许进行包装物体13从容器14向容器15的抽吸和输送。在第一典型实施例的执行模式中,基于与通过抽吸吸引包装物体的位置中的包装材料有关的信息来确定三个抽吸参数,即用于开始抽吸的定时、第一静止时间和第二静止时间,并且基于这些抽吸参数来控制抽吸。因此,可以稳定地通过抽吸来吸引并输送用包装材料包装的物体。
在执行模式中,已经说明了如下的情况:在进行通过抽吸从容器取出放入容器中的一堆包装物体中的包装物体、然后将该包装物体输送至预定位置的任务时,预先准备包装材料抽吸特征数据库。另一方面,在学习模式中,说明通过学习来获取保持单元所保持的包装材料抽吸特征数据库的情况。处于学习模式的信息处理系统在信息处理设备中包括模式切换单元(未示出),并由此能够在进行任务的执行模式和进行学习的学习模式之间切换。这里,说明学习模式。处于学习模式的信息处理系统10000的结构与第一典型实施例中的图1A中所示的结构相同,因此省略了对该结构的说明。
图5是示出处于学习模式的信息处理设备1的功能结构示例的图。处于学习模式的信息处理设备1包括与图2所示的处于执行模式的功能构成元件相同的功能构成元件。更具体地,图5所示的信息处理设备1包括输入单元500、提取单元501、确定单元502、控制单元503和保持单元505。图5所示的信息处理设备1还包括判断单元506、数据获取单元507和学习单元508。
输入单元500输入通过进行包装物体的摄像所获得的图像。更具体地,输入单元500输入通过摄像单元10进行包装物体的摄像所获得的彩色图像和距离图像,并且将该彩色图像和距离图像输出到提取单元501。提取单元501通过将模板与所输入的图像进行比较来提取使抽吸装置通过抽吸吸引包装物体的抽吸位置,其中该模板是包装物体的表面的状态和适合于抽吸的位置彼此相关联的图像特征。换句话说,提取单元501基于输入单元500所输入的彩色图像或距离图像来提取使抽吸单元12通过抽吸吸引包装物体的位置。提取单元501将与所提取的抽吸位置有关的信息输出到确定单元502和致动器控制单元5031。确定单元502基于如下的数据来确定指示进行抽吸的时间或定时的与抽吸有关的定时,其中在该数据中,指示抽吸是否成功的结果与包装物体的表面的状态和与抽吸有关的定时的组合相关联。更具体地,确定单元502针对提取单元501所输入的抽吸位置,基于保持单元505所输入的包装材料抽吸特征数据库中的请求来获取抽吸参数。具体地,确定单元502针对与抽吸位置相对应的图像块,利用与包装材料抽吸特征数据库相对应的特征滤波器来获得特征向量。然后,由于在包装材料抽吸特征数据库中将针对各特征向量要获取数据的三个抽吸参数各自的值设置为请求,因此确定单元502获取这些值作为抽吸参数。确定单元502将所获取到的抽吸参数输出到抽吸控制单元5032。以下说明包装材料抽吸特征数据库中的请求的设置的详情。
控制单元(输出单元)503输出用于控制根据基于图像指定的包装物体的表面的状态所确定的与抽吸有关的定时的控制信息。换句话说,控制单元503根据确定单元502所确定的与抽吸有关的定时来控制抽吸单元12。控制单元503包括致动器控制单元5031和抽吸控制单元5032。致动器控制单元5031基于提取单元501所输入的抽吸位置来控制致动器单元11,以便在通过抽吸吸引包装物体13的同时进行包装物体13的输送控制。此外,在进行抽吸的控制时,致动器控制单元5031与抽吸控制单元5032协作地进行对例如抽吸的定时的控制。抽吸控制单元5032根据确定单元502所输入的抽吸参数,通过设置用于在通过抽吸吸引包装物体13时开始抽吸的定时、第一静止时间和第二静止时间来控制抽吸。此外,抽吸控制单元5032与致动器控制单元5031协作地进行抽吸单元12根据抽吸参数所进行的抽吸的控制以便通过抽吸来吸引包装物体13。保持单元505保持包装材料抽吸特征数据库和与该包装材料抽吸特征数据库相对应的特征滤波器,并且将与数据库和特征滤波器有关的信息输出到确定单元502和学习单元508。此外,在以下所述的学习单元508进行了包装材料抽吸特征数据库中的数据和请求的附加更新的情况下,保持单元505进行数据库和请求的更新。
判断单元506通过观测抽吸单元12的真空压力来判断指示输送包装物体的任务是否成功的结果。判断单元506进行与在各检查点处是否获得正常状态有关的判断,并且将判断结果输出到数据获取单元507。判断单元506进行判断的检查点的具体示例包括:当抽吸单元12在与包装物体13接触时正在抽吸包装物体13的情况下、真空压力是否已降至阈值以下;抽吸单元12在开始输送通过抽吸所吸引的包装物体13之后是否已能够提起包装物体13(即使在抽吸单元12已上升到包装物体13的提起位置的情况下,真空压力是否保持处于阈值以下);以及包装物体13在被释放之后是否放置在期望或预定范围内。然而,检查点不限于这些示例,而是仅需要包括这些示例至少之一。例如,在用于开始抽吸的定时在接触之前的情况下,判断单元506可以判断在抽吸单元12与包装物体接触(并且这里为停止)之前、真空压力是否已下降。在尽管用于开始抽吸的定时在接触之前、但在接触之前真空压力根本没有下降的情况下,由于在接触之前开始抽吸毫无意义,因此判断单元506允许学习到抽吸单元12仅需在接触时开始抽吸。数据获取单元507接收与判断单元506所输入的关于抽吸和输送的判断结果相对应的抽吸参数、以及此时在抽吸位置中获得的彩色图像和距离图像的图像块,由此收集数据。数据获取单元507将所收集到的数据整合到与包装材料抽吸特征有关的数据组中,并且将该数据组输出到学习单元508。学习单元508通过将与该任务的结果有关的数据赋予到包装物体的表面的状态和与抽吸有关的定时的组合来学习与抽吸有关的定时。在判断单元506判断为真空压力低于预定值的情况下,学习单元508赋予成功数据。在判断单元506判断为真空压力高于或等于预定值的情况下,学习单元508将失败数据赋予到包装物体的表面的状态。此外,学习单元508基于保持单元505所输入的包装材料抽吸特征数据库和与该包装材料抽吸特征数据库相对应的特征滤波器,来获取包括改善数据库所需的数据的抽吸参数的请求。另外,学习单元508基于数据获取单元507所收集到的数据来更新包装材料抽吸特征数据库和请求。然后,学习单元508将更新后的包装材料抽吸特征数据库和请求输出到保持单元505。以下说明学习单元508中的详细过程。
参考图19A来说明请求。利用基于包装材料抽吸特征数据库的特征滤波器将图像块转换成特征向量。在请求中,在相似的特征向量汇总在一起(汇总成特征向量组)时,设置了针对各特征向量组(在图17中为1731-1、1731-2、1731-3、...)需要数据收集的三个抽吸参数各自的值。换句话说,针对各特征向量组定义请求,并且以二值形式表示针对三个抽吸参数是否存在数据的请求。例如,在图19A中,关于特征向量组1731-1,以如下方式请求与抽吸参数有关的数据:在用于开始抽吸的定时在接触之前时请求数据,在第一静止时间为0.1秒时请求数据,并且第二静止时间为0秒时请求数据。接着,说明请求的设置方法。首先,在包装材料抽吸特征数据库中没有登记的阶段,可以针对特征向量的各汇总从三个抽吸参数的各个参数空间随机地选择和设置值。然而,在各参数空间中,假定要设置的抽吸参数以离散方式具有值。例如,用于开始抽吸的定时可以取两个值、即在接触之前和接触之后,并且第一静止时间可以按0.1秒的增量从0.0秒-1.0秒取值。
接着,说明在包装材料抽吸特征数据库中预先登记了与包装材料抽吸特征有关的多个数据的状态下进行的处理。对于以相同方式获得的特征向量的各汇总,将与各个抽吸参数相对应的成功或失败的判断结果映射到抽吸参数空间。因而,关于三个抽吸参数,针对各个参数空间中的离散值获得成功数据和失败数据的频率。此时,对于特征向量的汇总,如果在各个抽吸参数中存在成功率高的值,则可以使用该值作为抽吸参数。这里,成功率可被计算为在利用相同的抽吸参数进行了预定次数以上的抽吸和输送时获得的成功的概率。这样,如果能够找到成功率高的抽吸参数的值,则不必设置用于收集数据的请求。关于不需要设置请求的抽吸参数,判断为不请求数据。如果在当前抽吸位置处判断为关于所有的抽吸参数都不请求数据,则改变抽吸位置并且进行数据收集。接着,说明尚未找到成功率高的抽吸参数的情况。首先,在存在成功数据的抽吸参数中,对于成功数据的数量和失败数据的数量的总和小的抽吸参数,将该抽吸参数的值设置为请求以便确认增加数据数量是否引起成功数据的数量增加。然后,在即使当成功数据的数量和失败数据的数量的总和变得大于或等于阈值Tt时、成功数据的数量也没有变得比失败数据的数量大了阈值Td的情况下,该抽吸参数的值被判断为不具有高成功率的值(不适当的值),并由此从请求的对象中被排除。对于失败数据的数量明显大的抽吸参数,该抽吸参数的值也被判断为具有低成功率的值,并由此从请求的对象中被排除。关于存在尚未尝试数据收集的多个抽吸参数(诸如尚未获得成功数据和失败数据的抽吸参数等)的情况,成功数据存在于抽吸参数空间附近的抽吸参数的值被配置成优先设置为请求。可选地,附近不存在失败数据的抽吸参数的值被配置成优先设置为请求。这样,关于特征向量的汇总,在获得一组或多组适当的抽吸参数之前,将未被排除的抽吸参数中所包括的抽吸参数的值设置为请求,并且收集该请求的数据。然而,并不总是需要针对所有的特征向量获得抽吸参数。例如,关于在给定的抽吸和输送任务中很少出现的特征向量,不需要获得适当的抽吸参数。此外,请求的设置方法不限于上述方法。例如,可以始终以随机方式设置值。
接着,说明第一典型实施例中的学习模式中的处理过程。首先,说明在学习模式中进行的处理的概要。图16是示出信息处理设备1进行的处理过程的流程图。在步骤S6000中,信息处理设备1进行初始化。在步骤S6020中,输入单元500将摄像单元10所拍摄到的图像输入到提取单元501。在步骤S6030中,提取单元501基于在步骤S6020中输入的图像,来提取包装物体13的抽吸位置以及来自周围图像的包装材料在抽吸位置处的表面的状态。在步骤S6040中,确定单元502根据抽吸位置处的包装材料的表面的状态来确定抽吸参数。在步骤S6080中,控制单元503根据抽吸参数来控制致动器单元11或抽吸单元12。在步骤S6160中,判断单元506基于抽吸和输送的成功或失败来判断所确定的抽吸参数是否适当。在步骤S6170中,数据获取单元507获取抽吸的成功或失败的判断结果与包装材料的表面的状态和抽吸参数的组合相关联的数据。在步骤S6180中,学习单元508利用在步骤S6170中获取到的数据,基于所收集的数据来进行包装材料抽吸特征数据库的更新。在步骤S6200中,信息处理设备1判断是否完成任务。如果判断为任务已完成(步骤S6200中为“是”),则处理结束,并且如果判断为任务没有完成(步骤S6200中为“否”),则处理返回到步骤S6020。接着,说明该处理的详情。图6A和6B是示出第一典型实施例中的包括信息处理设备1的信息处理系统10000在学习模式中进行的处理过程的流程图。
在步骤S6000中,信息处理系统10000进行系统的初始化。更具体地,信息处理设备1从外部存储器H14读取程序,由此使信息处理设备1进入能够操作的状态。信息处理系统10000进行摄像单元10和致动器单元11的启动、针对这两者的参数的读取、以及与摄像单元10、致动器单元11和抽吸单元12有关的校准信息的读取,并且使用预先已校准的摄像单元10的内部参数(例如,焦距、图像中心位置和镜头失真)。此外,信息处理系统10000读取容器14和容器15的位置。另外,信息处理系统10000从保持单元505读取与包装材料抽吸特征数据库相对应的特征滤波器,将特征滤波器应用于包装材料抽吸特征数据库中的一组图像块,并且预先获得与图像块相对应的特征向量。然后,信息处理系统10000针对每个相同或相似的特征向量对特征向量进行分类,参考关于各特征向量的成功或失败的判断结果,并且将有可能引起成功的抽吸参数与各特征向量相关联。此外,在进行摄像之前,信息处理系统10000使致动器控制单元5031基于校准后的位置来控制致动器单元11,由此将摄像单元10移动到能够拍摄放在容器14中的包装物体13的图像的位置。在步骤S6001中,为了允许获得缺失的与成功或失败的判断结果有关的数据,学习单元508通过列出要获取成功或失败的判断结果的抽吸参数的组合来生成请求,由此更新保持单元505中的请求。然后,处理进入步骤S6010。在步骤S6010中,摄像单元10拍摄放入容器14中的包装物体13的图像,由此获得彩色图像和距离图像。在步骤S6020中,输入单元500输入通过进行包装物体的摄像所获得的图像。更具体地,输入单元500将摄像单元10所拍摄到的图像输入到提取单元501。
在步骤S6030中,提取单元501通过将模版与所输入的图像进行比较,提取使抽吸装置通过抽吸来吸引包装物体的抽吸位置,其中该模板是包装物体的表面的状态和适合于抽吸的位置彼此相关联的图像特征。然后,处理进入步骤S6040。步骤S6030中的具体处理与步骤S4030中所述的处理相同。此外,在处理已从步骤S6041返回到的步骤S6030中,提取单元501提取与以上提取的抽吸位置不同的抽吸位置。更具体地,在关于与在抽吸位置处获得的图像块相对应的特征向量、在三个抽吸参数中的任何抽吸参数中都不存在请求的情况下,提取单元501从抽吸候选区域中排除已被判断为不需要的抽吸位置确认。然后,提取单元501从其它抽吸候选区域中提取抽吸位置,并且将所提取的抽吸位置输出到确定单元502。
在步骤S6040中,确定单元502根据抽吸位置处的包装材料的表面的状态来确定与抽吸有关的定时(抽吸参数)。具体地,确定单元502通过将与保持单元505所输入的包装材料抽吸特征数据库相对应的特征滤波器应用于抽吸位置处的彩色图像和距离图像的图像块来获得特征向量。确定单元502基于保持单元505所输入的请求来获取与特征向量相对应的抽吸参数。这里,通过对具有吸盘直径以实际大小收敛的大小的正方形进行大小调整,将图像块的大小设置成在水平方向和垂直方向上都为64个像素。确定单元502将以这种方式获取到的抽吸参数输出到抽吸控制单元5032。然后,处理进入步骤S6041。然而,对于抽吸参数的元素中的无请求的元素,由于已找到了有可能引起成功的抽吸参数元素,因此确定单元502使用该元素。此外,在抽吸参数的任何元素中没有请求的情况下,确定单元502判断为不存在要使用的请求,然后处理进入步骤S6041。
在步骤S6041中,确定单元502判断已包括在从学习单元508输出的请求中的抽吸参数是否包括在确定单元502所确定的抽吸参数中。如果判断为所请求的抽吸参数未包括在所确定的抽吸参数中(步骤S6041中为“否”),则处理返回到步骤S6030,其中在该步骤S6030中提取单元501提取新的抽吸位置。如果判断为请求中所包括的三个抽吸参数至少之一存在于所确定的抽吸参数中(步骤S6041中为“是”),则处理进入步骤S6050。在步骤S6050中,确定单元502基于步骤S6040中所确定的抽吸参数、抽吸单元12的初始位置以及与包装物体13和容器15有关的位置信息来确定控制参数。该控制参数是致动器单元11进行抽吸单元12的位置的移动控制所使用的参数。在步骤S6060中,致动器控制单元5031根据步骤S6050中所确定的控制参数来控制致动器单元11,使得抽吸单元12到达提取单元501所输入的抽吸位置附近。
在步骤S6070中,抽吸控制单元5032通过参考步骤S6040中获得的抽吸参数中所包括的用于开始抽吸的定时P1来进行判断。如果判断为首先开始抽吸(P1=0)(步骤S6070中为“是”),则处理进入步骤S6080。另一方面,如果判断为在与包装物体接触之后进行抽吸(P1=1)(步骤S6070中为“否”),则处理进入步骤S6071。
在步骤S6080中,抽吸控制单元5032进行控制以使抽吸单元12开始抽吸。在步骤S6090中,致动器控制单元5031根据步骤S6050中所确定的控制参数来控制致动器单元11,以便使抽吸单元12在抽吸包装物体13的同时与包装物体13接触。然后,处理进入步骤S6091。在步骤S6071中,致动器控制单元5031根据步骤S6050中所确定的控制参数来控制致动器单元11,以便使抽吸单元12与包装物体13接触。在步骤S6072中,抽吸控制单元5032进行控制以使抽吸单元12开始抽吸。此时,抽吸单元12处于与包装物体13接触的状态。然后,处理进入步骤S6091。
在步骤S6091中,判断单元506判断真空压力是否降至低于阈值T1。如果判断为真空压力低于阈值T1(步骤S6091中为“是”),则由于这意味着抽吸成功(没有发生真空泄漏),因此处理进入步骤S6100。如果判断为真空压力高于或等于阈值T1(步骤S6091中为“否”),则由于这意味着抽吸失败(发生真空泄漏),因此处理进入步骤S6092。此外,阈值T1基于包装物体的重量和吸盘的大小来设置,使得真空压力变为执行提起包装物体的力。在步骤S6092中,判断单元506判断所设置的抽吸参数中的用于开始抽吸的定时(P1)的失败。由于不能进行抽吸,因此在例如不进行输送的情况下处理进入步骤S6170。
在步骤S6100中,致动器控制单元5031根据步骤S6040中确定的抽吸参数中所包括的第一静止时间(P2),在使抽吸单元12接触并抽吸包装物体13的状态下使抽吸单元12保持静止并持续第一静止时间(P2秒)。在抽吸单元12保持静止时,例如,在包装物体的表面存在许多褶皱的情况下,使抽吸单元在与包装物体的表面接触的同时进行抽吸,这允许吸入褶皱并去除褶皱,由此可以充分通过抽吸来吸引包装物体。
在步骤S6101中,致动器控制单元5031控制致动器单元11以使抽吸单元12略微向上移动。这是为了判断第一静止时间(P2秒)的成功或失败所进行的控制。该控制中的移动量仅需能够在抽吸单元12通过抽吸吸引了包装物体的情况下确认出包装物体悬浮在空中的程度。然后,处理进入步骤S6102。
在步骤S6102中,判断单元506判断真空压力是否降至低于阈值T2。如果判断为真空压力低于阈值T2(步骤S6102中为“是”),则由于这意味着通过抽吸吸引并保持包装物体13成功,因此处理进入步骤S6110。如果判断为真空压力高于或等于阈值T2(步骤S6102中为“否”),则由于这意味着通过抽吸吸引并保持包装物体13失败,因此处理进入步骤S6103。此外,关于阈值T2,假定阈值T1大于或等于阈值T2。
在步骤S6103中,判断单元506判断所设置的抽吸参数中的第一静止时间(P2)的失败。然后,处理进入步骤S6170。在步骤S6110中,致动器控制单元5031根据步骤S6050中所确定的控制参数来控制致动器单元11以将包装物体13输送到容器15。在步骤S6120中,为了将抽吸单元12已通过抽吸吸引的包装物体13释放到容器15,抽吸控制单元5032进行控制以停止抽吸单元12所进行的抽吸。
在步骤S6130中,致动器控制单元5031根据抽吸参数中所包括的第二静止时间(P3),由于在步骤S6120中停止抽吸因此使致动器单元11保持静止并持续第二静止时间(P3秒)。在该静止时间期间,包装物体13从抽吸单元12完全释放到容器15。例如,即使在包装材料是稍硬的材料并且不太可能与抽吸单元分离的情况下,保持致动器单元11一段时间也允许提高释放的成功率。
在步骤S6140中,致动器控制单元5031控制致动器单元11以移动到可用于确认包装物体的放置的位置。可用于确认的位置是可用于摄像单元10拍摄输送目的地的图像的位置。在步骤S6000中预先获取该位置。在步骤S6150中,判断单元506判断包装物体是否能够放置到输送目的地。用于判断的方法包括:使摄像单元10拍摄输送目的地的图像,并且判断包装物体的位置和取向识别的结果,以指示包装物体是否已按期望或预定位置或取向放置到输送目的地。位置和取向识别包括:从所拍摄到的图像估计包装物体的位置和取向,并且将所估计的位置和取向与预期或预定的位置和取向进行比较。还可以使用诸如重力传感器等的被配置为判断物体的有无的传感器。然后,处理进入步骤S6160。
在步骤S6160中,关于所设置的抽吸参数中所包括的第二静止时间(P3),在步骤S6150的判断中位置和取向识别的结果是在期望或预定位置和取向的范围内的情况下,判断单元506判断为成功。在位置和取向识别的结果不在期望或预定位置和取向的范围内的情况下,判断单元506判断为失败。此外,判断单元506关于用于开始抽吸的定时(P1)和第一静止时间(P2)判断成功。然后,处理进入步骤S6170。此外,假定认为对象物体已能够以适当方式放入的范围是在抽吸单元12已保持静止并持续了足够长的时间的情况下放置包装物体的范围。可以通过多次重复相同的处理来根据经验获得这样的范围。
在步骤S6170中,数据获取单元507接收抽吸参数的判断结果以及彩色图像和距离图像的图像块,由此将这些收集为与包装材料抽吸特征有关的数据。然后,处理进入步骤S6180。抽吸参数的判断结果是在步骤S6092、S6103和S6160中获得的判断结果中的任一个。具体地,经由步骤S6092所获得的判断结果赋予了如下的数据,该数据指示了用于开始抽吸的定时导致失败并且其它抽吸参数导致数据不存在。经由步骤S6103获得的判断结果赋予了如下的数据,该数据指示了用于开始抽吸的定时带来成功、第一静止时间导致失败并且第二静止时间导致数据不存在。经由步骤S6160获得的判断结果赋予了如下的数据,该数据指示了用于开始抽吸的定时带来成功、第一静止时间带来成功并且第二静止时间导致成功或失败。
在步骤S6180中,学习单元508基于所收集的数据来进行包装材料抽吸特征数据库的更新。然后,处理进入步骤S6190。具体地,学习单元508从数据获取单元507接收与包装材料抽吸特征有关的数据,并且关于所接收到的数据从图像块获得特征向量。然后,学习单元508将与所获得的特征向量有关的成功数据和失败数据添加到针对包装材料抽吸特征数据库的特征向量的各个汇总所存在的抽吸参数空间。然后,学习单元508针对特征向量的各汇总获得具有最高成功率的一组抽吸参数。以这种方式获得的一组抽吸参数成为在切换到执行模式时所提取的临时抽吸参数。然而,在即使当针对预先确定的请求的候选对数据进行穷举采样也不能获得成功数据的情况下,假定学习单元508停止学习。可选地,在即使获得了成功数据、也确认为抽吸参数中的成功数据的可能性极低时(例如,在各参数集中对数据进行N=10次采样时,成功仅发生M=2次),假定学习单元508停止学习。例如,关于指示在包装物体的表面上存在孔的状态的特征向量,即使任何抽吸参数改变,抽吸失败的可能性也高。关于没有找到适当的抽吸参数的这种特征向量,假定进行处理,使得:在学习模式的情况下,停止学习,并且在执行模式的情况下,改变抽吸位置。以上述方式,更新了包装材料抽吸特征数据库。在更新后的数据库在使用中的情况下,当输入图像块时,可以经由特征向量输出更合适的抽吸参数。
在步骤S6190中,学习单元508利用更新后的包装材料抽吸特征数据库来更新请求。然后,在保持单元505中进行请求的更新。然后,处理进入步骤S6200。如果在步骤S6200中判断为信息处理设备1此时完成数据收集(步骤S6200中为“是”),则处理结束。如果判断为信息处理设备1仍继续数据收集(步骤S6200中为“否”),则处理进入步骤S6201。用于完成数据收集的条件包括学习单元508针对特征向量的各个汇总已生成的请求的总数已变得小于或等于阈值的情况。然而,完成条件不限于此,而且可以例如包括所收集到的数据的数量已变得大于或等于阈值的情况和为了收集数据所花费的时间量已变得大于或等于阈值的情况。在步骤S6201中,致动器控制单元5031控制致动器单元11,以便使摄像单元10移动到用以进行下一包装物体的摄像的摄像位置。然后,处理返回到步骤S6010,其中在该步骤S6010中,重新进行摄像,以便允许进行下一包装物体的抽吸和输送。如上所述,在学习模式的情况下,通过在信息处理系统的学习模式中学习来获得包装材料抽吸特征数据库。这允许提供即使针对用新的包装材料包装的包装物体也通过获得最适合抽吸的抽吸参数来进行抽吸和输送的信息处理系统。
在第一典型实施例中,尽管已经描述了致动器单元11和容器14固定在适当位置,但第一典型实施例不限于此。例如,致动器单元11或容器14可以安装在诸如自动引导车(AGV)等的移动设备上,以进行抽吸和输送。据此,将致动器单元11安装在移动设备上允许即使容器15位于远处也进行输送。此外,将容器14安装在移动设备上允许取出和收集放在例如仓库内所储存的各种容器中的各种类型的包装物体。
在第一典型实施例中,尽管已经描述了摄像单元10是附接至致动器单元11的照相机结构的示例,但第一典型实施例不限于此。例如,摄像单元10可以是附接在允许测量容器14和放在容器14内的包装物体13的位置的固定照相机结构。在这种情况下,假定预先校准了摄像单元10和致动器单元11的基部。使用固定在适当位置的照相机允许更稳定地获得包装物体的位置。
信息处理设备1还可以包括诸如显示器等的显示单元。例如,显示单元可以显示例如拍摄图像、距离图像、抽吸候选区域、抽吸位置和抽吸参数的值。此外,显示单元可以显示机器人的下一操作处理。这允许用户能够知晓处理操作的过程或系统的内部状态。
在第一典型实施例中,尽管已经描述了使用包装材料抽吸特征来设置彩色图像或距离图像的图像块与抽吸参数之间的关系,但这种输入不限于图像块。例如,可以输入与包装物体有关的信息,诸如塑料(乙烯基塑料)或尼龙等的包装材料的类型或者包装物体的重量等。例如,在手动输入包装材料的类型的情况下,经由键盘输入材料的名称,例如“乙烯基”或“聚乙烯”。信息处理设备1获取并利用这样的输入结果。这允许添加除物理外观以外的输入,由此更有效地获得抽吸参数。
在第一典型实施例中,尽管已经描述了包装材料抽吸特征数据库中的特征滤波器是预先准备的过滤器,但第一典型实施例不限于此。例如,在第一典型实施例的学习模式中,在能够收集大量包装材料抽吸特征数据的情况下,可以根据包含如此大量数据的数据库重新设计适当的特征滤波器。在这种情况下,由于利用诸如深度学习的学习技术从大量数据学习了特征滤波器,因此无需手动准备特征滤波器。具体地,对于与图像块相对应的抽吸参数以及成功数据或失败数据,可以针对每个相同或相似的抽吸参数对图像块组进行滤波器转换以进行特征向量的汇总。此时,可以将容易使成功数据和失败数据分离成特征向量的不同汇总的滤波器转换设置为特征滤波器。以这种方式获得特征滤波器允许选择更适当的抽吸参数。
在第一典型实施例的学习模式中,尽管已经描述了能够独立地判断抽吸参数的三个相应元素的示例,但第一典型实施例不限于此。例如,在图6A和6B中,在步骤S6091中的条件分支处,处理进入步骤S6100,并且在步骤S6102中的条件分支处,处理进入步骤S6110。假定不论作为这些步骤中的用于分支的条件的真空压力的值如何处理都进行,并且在步骤S6150中,仅进行一次与是否适当地或正确地进行了用于引起放置的操作有关的判断,使得可以针对一组三个抽吸参数返回一个判断结果。以这种方式,即使在抽吸参数的元素之间存在因果关系的情况下,也可以建立要用于适当地估计抽吸参数的数据库。
在第一典型实施例的学习模式中,尽管已经描述了在正在连续收集数据时进行学习和更新的示例的情况,但第一典型实施例不限于此。例如,在收集了预定量的数据之后,可以一次进行学习和更新。
在第一典型实施例的学习模式中,尽管已经描述了根据成功数据和失败数据的数量或分布来进行用于获得抽吸参数的学习的示例,但第一典型实施例不限于此。可以采用除通过更新数据库(换句话说,增加(与例如成功数据或失败数据有关的)样本数据)来进行学习(能够获得抽吸参数)的方法以外的方法。例如,可以进一步包括奖励单元,并且可以在强化学习的框架内进行学习。例如,学习单元508每次生成一组抽吸参数作为请求,并且将该组抽吸参数经由保持单元505输出到确定单元502。在判断单元506关于抽吸参数判断为成功的情况下,假定奖励单元获得正奖励,并且在判断单元506关于抽吸参数判断为失败的情况下,假定奖励单位获得负奖励。为了允许尽可能地获得正奖励,学习单元508在强化学习的框架内学习这种深度学习的网络,以输出适合于所输入的图像块的抽吸参数。进行这种学习降低以消除定义特征滤波器的设计或用于获得抽吸参数的方法的必要性。此外,包装材料抽吸特征数据库只需将仅图像块、抽吸参数、以及与这些有关的成功、失败或奖励存储为数据。这样,可以减少设计特征滤波器的麻烦或每次在数据库内获得请求的麻烦。此外,学习单元508即使在监督学习的情况下也能够进行学习。例如,学习单元508接收表示包装材料的表面的形状的图像(彩色图像和距离图像至少之一)作为输入,并且学习输出包括抽吸定时的控制信息的训练模型(神经网络)的连接权重。关于作为输入和输出的通过进行包装材料的表面的摄像所获得的图像与控制信息的组合,学习单元508通过将正确答案或不正确答案的标签作为教师数据赋予至表示抽吸是否成功的结果来进行学习。
在第一典型实施例的学习模式中,尽管已经描述了关于相应的三个抽吸参数而获取请求的值、进行抽吸和输送、并且通过从与这些操作有关的判断结果收集数据来进行学习的示例,但第一典型实施例不限于此。例如,关于抽吸参数中所包括的第一静止时间和第二静止时间,可以省略响应于该请求的抽吸参数的获取。通过实时观测真空压力的值并测量直到观测值超过阈值或降至低于阈值为止所需的时间,可以直接获取到适当的第一静止时间和适当的第二静止时间。由于以这种方式获取数据允许减少失败数据,因此可以高效地获取数据。
在第一典型实施例的学习模式中,尽管已经描述了仅在关于特征向量的汇总找到了具有高成功率的至少一组三个抽吸参数的情况下才不需要请求,但第一典型实施例不限于此。例如,为了允许找出具有更高成功率的抽吸参数的组合,可以发送进一步的请求。
在图4所示的步骤S4030中,尽管已经描述了提取单元201从存在于成堆堆叠的多个包装物体13中的近侧并且不会干扰其它包装物体的区域中提取抽吸候选位置,但第一典型实施例不限于此。例如,从距离图像获得了到各个像素的法线,并且在更多数量的法线面向有可能通过抽吸吸引的面(容器14的开口面向的方向)时,可以判断为包装物体更适合抽吸候选。可选地,为了防止与容器14发生干扰或摩擦,在包装物体位于离容器14的侧面更远的位置时,可以判断为该包装物体更适合于抽吸候选。此外,可以使用与容器14的位置或大小有关的信息来检测容易取出的包装物体13的候选。对于位于容器14的内侧边缘附近的位置处的包装物体,存在抽吸单元12与容器14的边缘发生碰撞的可能性。具体地,将如下信息反映在抽吸候选区域中,其中该信息指示:在容器14的边缘和包装物体之间的距离大于抽吸单元12(或吸盘)的大小或包装物体的大小的情况下,能够进行抽吸。同样考虑到容器14的位置能够稳定地进行抽吸。此外,可以对诸如包装物体存在于近侧且不会干扰、法线面向适当面、以及包装物体离容器14更远等的元素进行量化,并且所获得的数值越高,可以判断为包装物体更适合于抽吸候选区域,从而可以使用这些数值的加权线性和来获得抽吸候选区域。
此外,在图4所示的步骤S4030中,尽管已经描述了为了获取抽吸位置、抽取单元201通过模板匹配识别包装物体的位置并由此获得抽吸候选区域的示例,但第一典型实施例不限于此。例如,提取单元201可以使用卷积神经网络(CNN)模型,其中该CNN模型接收彩色图像或距离图像作为输入并输出包装物体13的位置或取向。在这种情况下,提取单元201可以准备彩色图像或距离图像与包装物体13的位置或取向之间的大量对应数据集,然后预先进行学习。具体地,提取单元201使用通过利用将包装物体的重心的位置定义为抽吸位置的附加有正确答案标签的学习图像进行学习所获得的训练模型,并由此从该图像估计抽吸位置。可选地,提取单元201可以基于包装物体的位置来获取用户预先指定的抽吸位置。这同样适用于图6A所示的步骤S6030中的提取单元501。
在图4所示的步骤S4040中,尽管已经描述了确定单元202从在抽吸位置及其周边部获得的彩色图像和距离图像的块获得抽吸参数的示例,但第一典型实施例不限于此。例如,提取单元501可以获取包装物体13的重量,并且确定单元502可以基于彩色图像和距离图像的块以及包装物体13的重量来确定抽吸参数。在这种情况下,包装材料抽吸特征数据库也被配置为还包括包装物体的重量的轴的数据库。可选地,正如步骤S4040那样,执行使用包装材料抽吸特征数据库的处理。作为附加的后处理,可以进行用于根据包装物体的重量转换抽吸参数的值的处理,使得在包装物体较重时,第一静止时间被设置得更长并且第二静止时间被设置得更短。这同样适用于图6A所示的步骤S6040中的确定单元502。
在图6B所示的步骤S6100中,尽管已经描述了使抽吸单元保持静止并持续了第一静止时间(P2)的示例,但第一典型实施例不限于此。例如,可以在抽吸单元与包装物体接触并且正抽吸包装物体时实时地观测真空电压,并且在真空电压降至阈值以下时,可以停止使抽吸单元保持静止。同样,尽管在步骤S6130中已经描述了使抽吸单元保持静止并持续了第二静止时间(P3)的示例,但第一典型实施例不限于此。例如,在使用能够执行观测释放到容器15中时的抽吸单元12和包装物体13的摄像机检测到了包装物体13已与抽吸单元12分离的情况下,可以停止使抽吸单元12保持静止。这允许减少抽吸参数的数量,并且因此便于学习模式中的抽吸参数的学习。此外,可以减小包装材料抽吸特征数据库的大小。
在图6B所示的步骤S6150中,尽管已经描述了通过进行摄像来确认包装物体是否已经适当放置的示例,但第一典型实施例不限于此。例如,在输送目的地是诸如箱子等的容器并且仅需将包装物体放入箱子内的任务的情况下,测量箱子内的重量允许判断是否放置了包装物体。这允许省去进行确认所用的摄像或者识别包装物体的麻烦。此外,在这种情况下,由于在步骤S6140中无需使致动器单元11移动到确认位置,因此与步骤S6201相同,可以立即使致动器单元11移动到下一摄像位置,由此可以缩短循环时间。
在上述的第一典型实施例中,已经描述了使用利用给定的特定抽吸单元的信息处理系统来进行抽吸和输送的任务或者进行学习的示例。另一方面,在第二典型实施例中,关于信息处理系统还包括抽吸切换单元并且在切换抽吸单元的同时进行抽吸和输送的情况,描述执行模式和学习模式的各个示例。在第二典型实施例中,如图1B所示,信息处理系统包括大小和材料不同的多个抽吸单元。第二典型实施例还可应用于存在包括集成在一起的多个吸盘的抽吸单元并且可以进行向该抽吸单元的切换的情况。例如,在处理小的对象物体或可用于抽吸的平坦面较少的物体的情况下,除非使用抽吸单元的接触面小的吸盘,否则空气可能泄漏,使得不能进行抽吸。因此,进行向直径小的抽吸单元的切换。此外,在通过抽吸吸引大且重的物体的情况下,使用要抽吸的空气的流量大的抽吸单元,或者使用包括集成在一起的多个吸盘的抽吸单元来增加支点或增加抽吸面积,由此可以稳定地输送物体。因而,根据作为抽吸对象的包装物体来选择合适的抽吸单元允许稳定地通过抽吸来吸引和输送作为用包装材料包装的物体的包装物体。
与多个类型的抽吸单元的处理相结合,将与抽吸单元有关的信息添加到包装材料抽吸特征。换句话说,包装材料抽吸特征变为如下的数据,其中在该数据中,图像块、抽吸参数、抽吸单元信息以及抽吸和输送的成功或失败的判断结果彼此相关联。参考图1B来说明具体示例,其中抽吸单元12-1包括半径为r1的吸盘。同样,抽吸单元12-2包括半径为r2的吸盘,并且抽吸单元12-3包括具有边为a3的正方形形状的吸盘。可以采用包括n个吸盘的结构作为抽吸单元12-k。此外,包装材料抽吸特征数据库是汇总了添加有这种抽吸单元信息的包装材料抽吸特征的数据库。第二典型实施例中的信息处理系统10000的结构除包括图1A所示的第一典型实施例中的结构之外,还包括诸如在图1B中示出为抽吸单元12的抽吸单元等的k个类型的抽吸单元。
图7是示出第二典型实施例中的在模式切换单元(未示出)从学习模式和执行模式中选择了学习模式的情况下的信息处理设备1的设备结构示例的图。图7所示的信息处理设备1包括输入单元500、提取单元501、确定单元502、致动器控制单元5031、抽吸控制单元5032、保持单元505、判断单元506、数据获取单元707、学习单元708、抽吸切换单元709和抽吸单元信息获取单元710。此外,图7所示的信息处理设备1连接到摄像单元10和致动器单元11。另外,图7所示的信息处理设备1连接到n个抽吸单元12-1、12-2、...、12-n。这些抽吸单元12-1至12-n分别包括在材料和大小上彼此不同的吸盘。第二典型实施例中的处于学习模式的信息处理设备1的结构与第一典型实施例(学习模式)中的图5所示的结构大致相同。省略了对相同功能的说明,并且说明不同的功能,即抽吸单元信息获取单元710、数据获取单元707、抽吸切换单元709和学习单元708。
抽吸单元信息获取单元710从抽吸单元12-1获取与抽吸单元有关的信息(抽吸单元信息),然后将该抽吸单元信息输出到数据获取单元707。这里,与抽吸单元有关的信息是指示例如吸盘的大小和直径及其有无褶的形状信息、以及与吸盘的材料有关的信息。
数据获取单元707基于判断单元506所输入的判断结果和抽吸单元信息获取单元710所输入的抽吸单元信息来收集用于进行学习的教师数据。数据获取单元707将所收集的教师数据组输出到学习单元708。
响应于从学习单元708接收到用以切换抽吸单元12-1的指示,抽吸切换单元709进行抽吸单元12-1的切换。在存在多个切换候选的情况下,将要切换至的候选写入从学习单元708发送来的指示中。关于切换抽吸单元12-1的方法,抽吸单元12-1和致动器单元11的前端被配置成通过自动手变换器彼此耦接。致动器控制单元5031控制致动器单元11以进行用以拆卸当前抽吸单元并附接新的抽吸单元的操作。然而,切换方法不限于此,而是在多个抽吸单元12-1并入致动器单元11中的情况下,可以切换这种抽吸单元。此外,可以在显示单元(未示出)上显示用于提示用户进行切换的显示,并且可以允许用户进行切换。
学习单元708基于数据获取单元707所输入的教师数据组来进行学习。学习单元708更新包括与抽吸单元有关的信息的包装材料抽吸特征数据库,并且在接收到图像块和与抽吸单元有关的信息时,进行操作以输出适当的抽吸参数。学习单元708将所训练的内容输出到保持单元505。此外,学习单元708生成对改善数据库所需的数据的请求,并将该请求输出到保持单元505。生成该请求以便还收集如图19B所示的与抽吸单元有关的数据。另外,在需要在抽吸单元之间切换以改善数据库的情况下,学习单元708将用于指示要切换至的抽吸单元的指示发送至抽吸切换单元709。这里,第二典型实施例中的图像块是通过将实际大小可切换的抽吸单元的最大盘直径落入其内的正方形区域调整大小成预定像素大小所获得的块。
接着,说明第二典型实施例的学习模式中的处理过程。图8A和8B是示出第二典型实施例中的包括信息处理设备1的信息处理系统10000在学习模式中进行的处理过程的流程图。以简化方式说明与第一典型实施例的图6A和6B的流程图中的处理操作相同的处理操作。在步骤S8000中,与第一典型实施例中的步骤S6000相同,信息处理系统10000进行系统的初始化。除步骤S6000中的处理之外,抽吸单元信息获取单元710预先获取与当前抽吸单元12-1有关的抽吸单元信息(例如,其吸盘的直径的大小r1)。然后,处理进入步骤S8001。
在步骤S8001中,学习单元708生成请求,由此更新保持单元505中的请求。然后,处理进入步骤S6010。尽管生成请求的方法与第一典型实施例的学习模式中所述的方法大致相同,但抽吸单元信息被预先添加到包装材料抽吸特征。结果,在抽吸参数空间中,添加了与抽吸单元信息有关的新维度。图19B示出包括抽吸单元信息的请求的示例。因此,可以通过针对特征向量的每个汇总并且进一步针对各抽吸单元信息将与抽吸参数相对应的成功或失败的判断结果映射到抽吸参数空间上、并且还包括与抽吸单元信息有关的维度,来生成请求。例如,假定抽吸单元12-1包括具有小直径(r1)的吸盘,并且假定抽吸单元12-2包括具有大直径(r2;r1<r2)的吸盘。此外,学习单元708针对特征向量的每个汇总确认是否存在与可切换的抽吸单元有关的请求,并且生成用以切换到需要数据收集的抽吸单元的指示。具体地,学习单元708将当前抽吸单元与可切换的抽吸单元进行比较,并且如果存在相对于当前抽吸单元要优先数据收集的抽吸单元,则学习单元708生成用以切换到该抽吸单元的指示。用于判断为要优先数据收集的条件例如包括在将各个抽吸单元的成功率彼此比较时、当前抽吸单元的成功率比其它抽吸单元的成功率超出了阈值以上的情况。然而,条件不限于此。在步骤S6010中,摄像单元10拍摄包装物体13的图像。在步骤S6020中,输入单元500输入摄像单元10所拍摄到的图像。
在步骤S6030中,提取单元501基于步骤S6020中所输入的图像,提取包装物体13的抽吸位置并从其周围图像提取抽吸位置处的包装材料的表面的状态。在步骤S6040中,确定单元502根据请求来确定抽吸参数。在步骤S6041中,确定单元502判断是否存在从学习单元708发送来的请求。如果判断为不存在请求(步骤S6041中为“否”),则处理返回到步骤S6030。如果判断为存在请求(步骤S6041中为“是”),则处理进入步骤S6050。在步骤S6050中,确定单元502确定抽吸参数。在步骤S8051中,学习单元708根据输出请求来判断是否需要切换抽吸单元12-1。如果判断为需要切换抽吸单元12-1(步骤S8051中为“是”),则处理进入步骤S8052。如果判断为不需要切换抽吸单元12-1(步骤S8051中为“否”),则处理进入步骤S6060。在步骤S8052中,抽吸切换单元709进行抽吸单元12-1的切换,然后处理进入步骤S8053。在步骤S8053中,抽吸单元信息获取单元710获取与进行了切换的抽吸单元12-2有关的信息。然后,处理进入步骤S6060。步骤S6060-S6160中的处理操作与第一典型实施例中的处理操作相同,因此这里省略对这些处理操作的说明。在步骤S8170中,数据获取单元707接收抽吸参数的判断结果、抽吸单元信息以及彩色图像和距离图像的图像块,由此获取与包装材料抽吸特征有关的数据。然后,处理进入步骤S6180。步骤S6180和后续步骤中的处理操作与第一典型实施例中的处理操作相同,因此这里也省略了对这些处理操作的说明。通过上述处理,信息处理系统10000能够通过在学习模式中在抽吸单元之间切换的同时收集教师数据来学习包装材料抽吸特征数据库。
接着,说明执行模式。图9是示出在第二典型实施例中模式切换单元(未示出)从学习模式和执行模式中选择了执行模式的情况下的信息处理设备1的设备结构示例的图。第二典型实施例的执行模式中的信息处理设备1的结构与第一典型实施例中的图2所示的结构大致相同。图9所示的信息处理设备1除包括输入单元200、提取单元201、确定单元902、致动器控制单元2031、抽吸控制单元2032和保持单元205以外,还包括抽吸单元信息获取单元910和抽吸切换单元909。另外,图9所示的信息处理设备1连接到摄像单元10、致动器单元11以及多个抽吸单元12-1、12-2和12-I。省略了对相同功能的说明,并且说明不同的功能,即抽吸单元信息获取单元910、确定单元902和抽吸切换单元909。
抽吸单元信息获取单元910从抽吸单元12获取与抽吸单元有关的信息,然后将与抽吸单元有关的信息输出到确定单元902。与抽吸单元有关的信息例如是指示例如吸盘的大小和直径及其褶的有无的形状信息、以及与多个可切换的抽吸单元各自中的吸盘的材料有关的信息。确定单元902在与提取单元201所输入的抽吸位置相对应的图像区域中,基于保持单元205所保持的包装材料抽吸特征数据库和抽吸单元信息获取单元910所输入的抽吸单元信息来提取抽吸参数。此外,确定单元902获得与可切换的抽吸单元中的最佳抽吸单元有关的信息。以下说明其具体处理。确定单元902将所提取的抽吸参数输出到控制单元203。此外,确定单元902将与最佳抽吸单元有关的信息输出到抽吸切换单元909。抽吸切换单元909基于确定单元902所输入的与最佳抽吸单元有关的信息,在需要的情况下进行从抽吸单元12向所指定的抽吸单元的切换。
接着,说明第二典型实施例的执行模式中的处理过程。图10是示出第二典型实施例中的包括信息处理设备1的信息处理系统10000在任务执行模式中进行的处理过程的流程图。第二典型实施例中的图10的流程图与第一典型实施例中的图4的流程图大致相同。说明图10中的处理的概要。在步骤S10000中,与第一典型实施例中的步骤S4000相同,信息处理系统10000进行系统的初始化。除步骤S4000中的处理之外,抽吸单元信息获取单元910预先获取与可切换的抽吸单元有关的信息。在步骤S4010中,摄像单元10拍摄要输送的包装物体13的图像。在步骤S4020中,输入单元200输入摄像单元10所拍摄到的图像。在步骤S4030中,提取单元201从所输入的图像中提取包装物体13的抽吸位置。在步骤S10040中,确定单元902利用彩色图像、距离图像和包装材料抽吸特征数据库,在步骤S4030中所获取到的抽吸位置中确定最佳抽吸单元和抽吸参数。具体地,确定单元902首先提取抽吸位置及其周围部分的彩色图像和距离图像的块,并且通过将特征滤波器应用于这些图像块来获得特征向量。然后,确定单元902在包装材料抽吸特征数据库中进行特征向量的匹配。如果找到相似的特征向量,则对于各可切换的抽吸单元,确定单元902能够提取有可能引起成功并且与所找到的特征向量相关联的抽吸参数。然后,确定单元902针对各可切换的抽吸单元来计算基于成功率和切换成本的得分,并且选择得分最大的抽吸单元以及抽吸参数。关于计算得分的方法,在针对抽吸单元I选择最佳抽吸参数时获得的成功率由S_I表示并且切换到抽吸单元I的成本由C_I表示时,通过以下的公式(1)来表示在进行了向抽吸单元I的切换的情况下的得分Score_I:
Score_I=g(S_I)-C_I (1)
在公式(1)中,g(X)是用于将成功率X转换成得分的单调递增函数,并且C_I是具有正值的切换成本,其值越大指示切换成本越大。此外,在抽吸单元I与当前抽吸单元相同的情况下,由于不需要切换,因此设置“C_I=0”。在抽吸单元I不同于当前抽吸单元的情况下,要进行抽吸单元之间的切换。这样,可以计算argmax(Score_I)。以这种方式,确定单元902获得要切换至的抽吸单元I以及供此时使用的最佳抽吸参数。
在步骤S10041中,确定单元902判断步骤S10040中所获得的抽吸单元I是否不同于当前抽吸单元,并且如果判断为当前抽吸单元和抽吸单元I彼此不同(步骤S10041中为“是”),则处理进入步骤S10042,以进行抽吸单元之间的切换。如果判断为当前抽吸单元和抽吸单元I相同(步骤S10041中为“否”),则处理进入步骤S4050。在步骤S10042中,抽吸切换单元909进行从抽吸单元12-1向抽吸单元I的切换。然后,处理进入步骤S4050。步骤S4050和后续步骤中的处理操作与第一典型实施例中的处理操作相同,因此这里省略了对这些处理操作的说明。通过上述处理,信息处理系统10000能够在执行模式下切换抽吸单元12的同时,以更高的抽吸成功率进行抽吸。
如上所述,在第二典型实施例中,在信息处理系统的学习模式和执行模式各自中,抽吸单元之间的切换允许进一步提高抽吸成功率以进行用包装材料包装的包装物体的抽取和输送。此外,抽吸单元之间的切换允许进行包括进一步提高抽吸成功率所用的抽吸单元信息的学习。
在第二典型实施例中,尽管已经描述了抽吸单元信息获取单元710和910各自从抽吸单元12-1获取与抽吸单元12-1有关的信息,但第二典型实施例不限于此。例如,与可切换的抽吸单元有关的信息可以保持在保持单元205和505各自中,并且抽吸单元信息获取单元710和910可以分别从保持单元205和505获取信息。
此外,在第二典型实施例中,尽管已经描述了抽吸单元信息获取单元710和910各自获取用于指示例如吸盘的大小和直径及其有无褶的形状信息以及与吸盘的材料有关的信息作为与抽吸单元有关的信息,但第二典型实施例不限于此。例如,抽吸单元信息获取单元710和910各自可被配置为获取吸盘的型号或标识符(ID),由此能够区分各个吸盘。这不仅减少了登记与吸盘有关信息的麻烦,而且还允许针对吸盘的切换采取措施。
在第二典型实施例中,尽管已经描述了学习单元708在图8A所示的步骤S8051中判断是否进行抽吸单元之间的切换,但用于在抽吸单元之间切换的定时不限于此。例如,紧挨在步骤S6201中摄像单元10移动到摄像位置之前,可以进行与是否在抽吸单元之间切换有关的判断,并且可以根据需要进行该切换。此外,可以对各类型的抽吸单元进行数据收集,并且如果针对当前附接的抽吸单元的数据收集完成,则可以进行抽吸单元的切换。
尽管在步骤S6091和S6102中进行真空压力与阈值T1和T2之间的比较,但可以根据抽吸单元信息改变这些阈值。这允许根据抽吸单元的类型进行更准确的抽吸判断。
在图10所示的步骤S10040中,尽管已经描述了基于彩色图像和距离图像的块以及与抽吸单元有关的信息来获得抽吸参数的示例,但可使用的输入不限于这样的信息。例如,对象信息获取单元(未示出)可以获取包装物体的重量,由此可以基于彩色图像和距离图像的块、与抽吸单元有关的信息以及作为对象信息的包装物体的重量来获取抽吸参数。在这种情况下,在包装材料抽吸特征数据库中,进一步添加与包装物体的重量有关的轴,使得可以基于图像块和包装物体的重量来获得有可能引起成功的抽吸参数S_I。
在第一典型实施例和第二典型实施例中,已经描述了信息处理系统进行任务或进行学习使得抽吸和输送的成功率变高的示例。另一方面,在第三典型实施例中,关于信息处理系统根据诸如速度优先、质量优先、成本优先和周围环境优先等的优先项改变抽吸参数的情况,说明学习模式和执行模式的各个示例。在第三典型实施例中,信息处理系统还包括选择单元,该选择单元选择用于整体最佳的学习模型的参数,以便能够根据优先项进行最佳抽吸计划。
与抽吸有关的各定时具有优点和缺点,并且针对各目的在最佳抽吸控制方面不同。关于用于开始抽吸的定时,如果在抽吸单元和包装物体彼此接触之前开始抽吸,则可以更稳定地使抽吸成功,但存在诸如成本增加或声音噪声的缺点。关于第一静止时间,例如,如果在抽吸时使抽吸单元保持静止并持续足够的时间,则容易使抽吸成功,但在用于重复进行抽吸的操作的情况下,循环时间可能不利地变长。关于第二静止时间,如果在抽吸停止之后使抽吸单元保持静止并持续足够的时间,则容易使释放成功,但在用于重复进行抽吸和输送的操作的情况下,循环时间可能不利地变长。在这种情况下,针对要优先的各目的(优先项)进行与抽吸有关的定时的学习。
说明优先项。优先项是指在信息处理系统10000进行输送包装物体的任务时打算优先改善的数值(例如,循环时间、失败率或缺货率)。速度优先是期望或预定在更短的时间内完成任务的情形。在这种情况下,期望或预定使静止时间尽可能更短的与抽吸有关的定时。质量优先是期望或预定不损害要输送的物体的状态的情形。例如,为了在抽吸停止之后小心地放置要输送的物体,期望或预定确保一定量的静止时间的与抽吸有关的定时。成本优先是期望或预定降低运行成本的情形。运行成本包括例如机器人臂的电力消耗。在优先考虑速度或质量并且将用于开始抽吸的定时设置得较早(在接触之前)的情况下,例如用于进行抽吸的空气或电力的成本可能增加。由于抽吸需要电力,因此将抽吸时间缩短到最低允许降低运行成本。周围环境优先是期望或预定主要降低声音噪声的情形。由于抽吸操作涉及声音噪声,因此可以通过使抽吸时间尽可能更短来减少声音噪声。例如,在例如操作者存在于设备附近的情况下,可能感觉到在抽吸时产生的声音有噪声。
第三典型实施例中的包装材料抽吸特征数据库与第一典型实施例和第二典型实施例中提到的包装材料抽吸特征数据库存在两个不同之处。第一个不同之处在于,作为与抽吸和输送的结果有关的信息,不仅保持成功或失败的判断结果,而且还一起保持如下的数据,其中该数据表示任务的执行所需的时间、对包装材料的表面的损坏量、抽吸时所使用的使用空气量和通过抽吸引起的声音量。此外,提取单元能够从例如其它传感器获取这些数据。任务的执行所需的时间是利用计时器从程序获取的。通过在后处理的质量检查期间从视觉上确认包装材料的表面的状态并判断缺陷产品混入的百分比来统计地获得损坏量。可选地,通过获取在抽吸之前和在输送之后拍摄到的各个图像(这些图像可以是在照明条件改变或观测所用的角度改变的情况下拍摄到的多个图像)、通过例如边缘检测处理提取包装材料的表面的任何缺陷、并且计算在抽吸之前拍摄到的图像和在输送之后拍摄到的图像之间的差异,来获得损坏量。通过读取供抽吸时使用的设备(空气压缩机)中所包括的存储器来获得空气使用量。第二个不同之处在于,代替用于提取所保持的包装材料的特征的特征滤波器,保持用于从图像块获得抽吸参数的估计器(学习模型)。这种估计器是通过将多个参数之间的关系配置为具有图形结构的网络而获得的,因此在下文中被称为“网络”。该网络具有将图像块视为输入并将抽吸参数视为输出的结构,并且根据优先项改变网络的加权集。网络(学习模型)的加权集是连接神经网络中的各个层的元素的一组加权系数。存在网络的数量与优先项的数量相对应的加权集,并且在切换优先项时,切换网络的加权集,由此改变要获得的抽吸参数。此外,对于网络的各加权集,针对各优先项进行学习,并且将这种学习的结果反映在网络的加权集中。然而,不论优先项如何,都可以共享学习时所使用的数据。在第三典型实施例中,对于网络的这些加权集,在强化学习的框架内针对各优先项进行学习,并且在执行模式中,利用网络(学习模型)的这些加权集来进行抽吸参数的提取。换句话说,在强化学习中,“状态”对应于图像块,“动作”对应于抽吸参数的值,“策略”对应于抽吸参数的设置,并且“奖励”对应于针对各优先项所确定的得分。然后,在学习模式中要进行的操作包括:为了找到针对每个优先项使奖励最大的策略,通过各种动作(抽吸参数)获取数据并且获得此时的奖励。此外,在执行模式中要进行的操作包括:针对所获得的图像块,通过针对每个优先项使奖励最大的策略来设置抽吸参数,然后进行抽吸和输送。第三典型实施例中的信息处理系统10000的结构与第一典型实施例中的图1A所示的结构相同,因此这里省略对该结构的说明。
图11是示出在第三典型实施例中模式切换单元(未示出)从学习模式和执行模式中选择了学习模式的情况下的信息处理设备1的设备结构示例的图。第三典型实施例中的处于学习模式的信息处理设备1的结构与第一典型实施例(学习模式)中的图5所示的结构大致相同。图11所示的信息处理设备1包括输入单元500、提取单元1101、确定单元1102、致动器控制单元5031、抽吸控制单元5032、保持单元1105、判断单元1106、数据获取单元507、学习单元1108和选择单元1111。省略了对相同功能的说明,并且说明不同的功能,即选择单元1111、保持单元1105、提取单元1101、确定单元1102、判断单元1106和学习单元1108。
选择单元1111从四个项(即,速度、质量、成本和周围环境)中选择要学习的优先项,并且将与所选择的优先项相对应的加权集输出到学习单元1108。是否学习所有的四个优先项或者是否学习四个优先项中的一些优先项是基于用户在以下所述的执行模式中想要选择的优先项来设置的。在学习多个优先项的情况下,需要确定其顺序。选择优先项的顺序是按照从小到大进行学习所需的数据的数量的顺序设置的。例如,按顺序对速度、成本、周围环境和质量进行学习。然而,顺序不限于此,但是例如,可以允许用户设置要学习的优先项及其顺序,或者可以选择和设置成功率低的优先项以便能够专注于数据收集。此外,在针对其它优先项收集数据期间,可以选择频繁地发生如下情况的优先项:尽管预期或预定奖励变高,但发生失败并且使奖励变低。
保持单元1105保持用于获得包装材料抽吸特征数据库和抽吸参数的网络以及针对各个优先项与这些网络相对应的权重。然后,保持单元1105将这样的网络和权重输出到确定单元1102和学习单元1108。此外,作为学习单元1108所进行的学习的结果,保持单元1105更新包装材料抽吸特征数据库和网络的权重。提取单元1101基于输入单元500所输入的彩色图像或距离图像来提取抽吸单元12的抽吸位置。提取单元1101将与所获取到的抽吸位置有关的信息输出到致动器控制单元5031和学习单元1108。确定单元1102获取学习单元1108所输入的抽吸参数,并且将所获取到的抽吸参数输出到抽吸控制单元5032。判断单元1106判断针对正进行的抽吸和输送的结果是否实现了成功。另外,判断单元1106获取执行任务所需的时间、对包装材料的表面的损坏量、抽吸时所使用的空气的使用量、以及通过抽吸引起的声音量,并且将所获取到的信息连同成功或失败的判断结果以及抽吸参数一起输出到数据获取单元507。
学习单元1108基于选择单元1111所输入的优先项,使用用于获得保持单元1105所输入的抽吸参数的网络和与优先项相对应的网络的权重。因而,学习单元1108基于包装材料抽吸特征数据库和数据获取单元507所输入的数据来建立用于获得抽吸参数的网络。此外,学习单元1108针对提取单元1101所输入的抽吸位置,利用网络来获得适当的抽吸参数。可选地,学习单元1108随机地获得要以给定概率尝试的抽吸参数。学习单元1108将如此获得的抽吸参数设置为请求,并且将该请求输出到确定单元1102。此外,学习单元1108基于数据获取单元507所输入的数据组来进行与优先项有关的奖励的计算,并且通过强化学习来进行网络的权重的更新。学习单元1108将更新后的网络的权重和数据库输出到保持单元1105。以下说明详细过程。
接着,说明第三典型实施例的学习模式中的处理过程。图12A和12B是示出第三典型实施例中的包括信息处理设备1的信息处理系统10000进行的处理过程的流程图。这里省略对与第一典型实施例的学习模式中的图6A和6B的流程图中的处理操作相同的处理操作的说明,并且详细说明不同的处理操作。
在步骤S12000中,与步骤S6000相同,信息处理系统10000进行系统的初始化。然而,从保持单元1105要读入的信息包括包装材料抽吸特征数据库、用于获得抽吸参数的网络结构、以及网络的加权集。然后,处理进入步骤S12001。在步骤S12001中,选择单元1111从速度、质量、成本和周围环境的四个优先项中选择从现在开始进行学习的优先项。此外,学习单元1108预先加载与所选择的优先项相对应的网络的权重,并且建立用于获得抽吸参数的网络。然后,处理进入步骤S6010。在步骤S6010中,摄像单元10拍摄包装物体13的图像。在步骤S6020中,输入单元500输入摄像单元10所拍摄到的图像。
在步骤S12030中,提取单元1101提取包装物体13的抽吸位置。具体处理操作与步骤S4030中所述的操作相同。然后,处理进入步骤S12031。在步骤S12031中,作为强化学习中的策略,学习单元1108利用网络并且使用抽吸位置中的图像块作为数据来获得抽吸参数。网络能够更新网络的权重,使得针对所设置的优先项的奖励通过利用图12A和12B的流程图重复学习而变得更高。学习单元1108将如此获得的抽吸参数作为请求输出到确定单元1102。在第三典型实施例中,请求表示一组抽吸参数。然后,处理进入步骤S12040。在步骤S12040中,确定单元1102根据学习单元1108所输入的请求来确定抽吸参数。然后,处理进入步骤S6050。
在步骤S6060中,致动器控制单元5031根据步骤S6050中所确定的控制参数来控制致动器单元11,使得抽吸单元12到达提取单元1101所输入的抽吸位置附近。在步骤S6070中,抽吸控制单元5032通过参考抽吸参数中所包括的用于开始抽吸的定时P1来进行判断。如果判断为首先开始抽吸(P1=0)(步骤S6070中为“是”),则处理进入步骤S6080。另一方面,如果判断为与包装物体接触之后进行抽吸(P1=1)(步骤S6070中为“否”),则处理进入步骤S6071。在步骤S6080中,抽吸控制单元5032使抽吸单元12开始抽吸。在步骤S6090中,致动器控制单元5031根据步骤S6050中所确定的控制参数来控制致动器单元11,以便使抽吸单元12在抽吸包装物体13的同时与包装物体13接触。在步骤S6071中,致动器控制单元5031控制致动器单元11,以便使抽吸单元12与包装物体13接触。在步骤S6072中,抽吸控制单元5032使抽吸单元12开始抽吸。在步骤S6100中,致动器控制单元5031根据步骤S6040中确定的抽吸参数中所包括的第一静止时间(P2),在使抽吸单元12接触并抽吸包装物体13的状态下使抽吸单元12保持静止并持续第一静止时间(P2秒)。在步骤S6110中,致动器控制单元5031控制致动器单元11以将包装物体13输送到容器15。在步骤S6120中,抽吸控制单元5032进行控制以停止抽吸单元12所进行的抽吸。在步骤S6130中,致动器控制单元5031根据抽吸参数中所包括的第二静止时间(P3),自步骤S6120中停止抽吸起,使致动器单元11保持静止并持续第二静止时间(P3秒)。在步骤S6140中,致动器控制单元5031控制致动器单元11以移动到可用于确认包装物体的放置的位置。在步骤S8150中,判断单元1106判断包装物体是否能够放置到输送目的地。
在步骤S12160中,判断单元1106在步骤S8150中所确认的位置和取向处于位置和取向的期望或预定范围内的情况下向抽吸参数给予正奖励,否则向抽吸参数给予负奖励。此外,判断单元1106计算与速度、质量、成本和周围环境的各个优先项相对应的奖励。关于速度,判断单元1106预先测量从在步骤S6010中拍摄图像的时间起直到现在为止所需的时间,并且在所测量到的时间较短时给出更高的奖励。关于质量,判断单元1106通过将步骤S6010中所拍摄到的图像和步骤S8150中为了确认所拍摄的图像彼此比较来检测包装物体的瑕疵或变形的有无。在对包装材料的表面的损坏量较小时,判断单元1106给出较高的奖励。例如,在利用边缘检测而检测到包装材料的表面上的通过抽吸引起的痕迹的情况下,奖励变低。关于成本,判断单元1106预先测量从开始抽吸之前的时间起直到现在为止所使用的空气使用量,并且在空气使用量较小时给出更高的奖励。关于周围环境,判断单元1106预先测量从开始抽吸之前的时间起直到现在为止所产生的声音量,并且在声音量较小时给出更高的奖励。不论所选择的优先项如何,判断单元1106都预先获取这些奖励。这允许不论优先项如何都共享学习数据。判断单元1106将被设置为汇总的图像块、抽吸参数和各种奖励输出到数据获取单元507。然后,处理进入步骤S8170。
在步骤S8170中,数据获取单元507接收抽吸参数的判断结果、抽吸单元信息以及彩色图像和距离图像的图像块,由此获取与包装材料抽吸特征有关的数据。在步骤S12180中,学习单元1108利用数据获取单元507所输入的图像块、抽吸参数和各种奖励来更新用于在深度Q网络的强化学习的框架内获得抽吸参数的网络的权重。学习单元1108关于针对各优先项所获得的奖励,学习针对每个优先项所准备的网络的权重。因而,在强化学习中,例如,学习单元1108根据图像块来计算状态,根据抽吸参数的确定以及抽吸和输送来计算策略,并且根据成功或失败的判断结果来计算根据所设置的优先项而不同的奖励。然后,学习单元1108学习用于在强化学习的框架内获得最佳抽吸参数的网络的权重。然后,处理进入步骤S12181。
在步骤S12181中,学习单元1108将上述学习所使用的数据组添加到包装材料抽吸特征数据库。然后,学习单元1108更新保持单元1105所保持的包装材料抽吸特征数据库。然后,处理进入步骤S12200。在步骤S12200中,学习单元1108判断关于当前优先项是否完成数据收集。如果判断为完成数据收集(步骤S12200中为“是”),则处理进入步骤S12210。如果判断为未完成数据收集(步骤S12200中为“否”),则处理进入步骤S12201。假定用于判断为完成数据收集的条件是如下情况:在根据利用与当前优先项相对应的网络的权重所输出的抽吸参数进行抽吸和输送时,当前优先项中的奖励变得大于或等于阈值的情形连续发生N次。如果不是这样,则判断为未完成数据收集。在步骤S12201中,致动器控制单元5031控制致动器单元11,以便使摄像单元10移动到用于进行下一包装物体的摄像的摄像位置。
在步骤S12210中,学习单元1108判断是否改变优先项。如果判断为改变优先项(步骤S12210中为“是”),则处理进入步骤S12211。如果判断为不改变优先项(步骤S12210中为“否”),则处理结束。用于改变优先项的条件是存在从未选择的优先项的情形。可选地,这种条件是如下的情形:尽管所有优先项都被选择了至少一次,但存在如下的优先项,其中在该优先项中,在代表其它优先项所收集的数据中,矛盾实例的数量超过阈值。矛盾实例是例如如下的实例:尽管通常在抽吸和输送成功时奖励应变高,但由于抽吸或输送的失败,因而奖励已变低。例如,考虑如下的情况:优先项设置为“质量”的数据收集已完成,并且接着,优先项设置为“速度”的数据收集已开始。由于需要增加“速度”,例如,需要使第一静止时间和第二静止时间最小化。此时,为了收集即使考虑到已获得的学习数据仍然不足的数据,针对这样的两个抽吸参数连续地多次进行各测量。例如,进行测量,使得按顺序使用(0秒,0秒)、(0.1秒,0.1秒)、(0.1秒,0.2秒)、(0.2秒,0.1秒)、(0.2秒,0.2秒)、...。这里,考虑针对给定特征向量组的(0.2秒,0.2秒)的抽吸参数。关于该组合,在优先项设置为“质量”的情况下进行数据收集。在四次中包装物体四次均未掉落的情况下进行设置了(0.2秒,0.2秒)的输送时,由于包装材料的表面从未或至少未被损坏,因此关于“质量”发生“成功”。然而,在针对“速度”的数据收集时、当进行两次输送时发生两次包装物体的掉落的情况下,获得关于“质量”指示“失败”的数据。在这种情况下,即使在针对一系列优先项完成学习之后、重新执行“质量”的学习,(0.2秒,0.2秒)也不足以作为在优先项被设置为“质量”的情况下要获得的成功率,因此需要搜索更有可能引起“成功”的参数。在步骤S12211中,致动器控制单元5031控制致动器单元11,以便使摄像单元10移动到用于进行下一包装物体的摄像的摄像位置。然后,处理返回到步骤S12001,其中在该步骤S12001中,重新执行优先项的选择。
通过上述处理,信息处理系统10000能够在学习模式下通过强化学习获取用于根据优先项获得抽吸参数的网络。这允许提供用于根据优先项获得最适合抽吸的抽吸参数、然后进行抽吸和输送的信息处理系统的执行模式。
图13是示出在第三典型实施例中在模式切换单元(未示出)从学习模式和执行模式中选择了执行模式的情况下的信息处理设备1的设备结构示例的图。第三典型实施例的执行模式中的信息处理设备1的结构与第一典型实施例中的图2所示的结构大致相同。图13所示的信息处理设备1包括输入单元200、提取单元201、致动器控制单元2031、抽吸控制单元2032、确定单元1302、保持单元1305和选择单元1311。省略了对相同功能的说明,并且说明不同的功能,即确定单元1302、保持单元1305和选择单元1311。
确定单元1302基于选择单元1311所选择的加权集(参数)来确定抽吸参数(与抽吸有关的定时)。确定单元1302使用用于在与提取单元201所输入的抽吸位置相对应的图像区域中获得保持单元1305所保持的抽吸参数的网络、以及与选择单元1311所输入的优先项相对应的网络的加权集。确定单元1302将所提取的抽吸参数输出到控制单元203。保持单元1305保持用于获得抽吸参数的网络以及与各个优先项相对应的网络的加权集,并且将这些输出至确定单元1302。选择单元1311将在进行抽吸和输送时要优先四个项(即,速度、质量、成本和周围环境)中的哪个设置为优先项,并且将所设置的优先项输出到确定单元1302。
接着,说明第三典型实施例的执行模式中的处理过程。图14是示出第三典型实施例中的包括信息处理设备1的信息处理系统10000在任务执行模式中进行的处理过程的流程图。第三典型实施例中的图14的流程图与第一典型实施例中的图4的流程图大致相同。说明信息处理系统10000进行的图14所示的处理。在步骤S14000中,与步骤S4000相同,信息处理系统10000进行系统的初始化。然而,要从保持单元1305读入的信息包括用于获得抽吸参数的网络结构和网络的加权集。然后,处理进入步骤S14001。在步骤S14001中,选择单元1311从速度、质量、成本和周围环境的四个优先项中选择优先项,并且还选择与该优先项有关的网络的加权集。作为选择优先项的方法,可以允许用户经由用户接口单元(未示出)选择速度、质量、成本和周围环境的优先项中的任一个,并且选择单元1311可以设置所选择的优先项。然后,确定单元1302从保持单元1305接收网络和与所选择的优先项相对应的网络的权重,并且配置用于获得抽吸参数的网络。然后,处理进入步骤S4010。在步骤S4010中,摄像单元10拍摄要输送的包装物体13的图像。在步骤S4020中,输入单元200输入摄像单元10所拍摄到的图像。在步骤S4030中,提取单元201提取包装物体13的抽吸位置。在步骤S14040中,确定单元1302利用彩色图像、距离图像和网络来确定步骤S4030中所获取到的抽吸位置中的抽吸参数。所确定的抽吸参数是利用与所设置的优先项相对应的权重集所获得的参数,并且是适合于意图优先的目的的抽吸参数。然后,处理进入步骤S4050。步骤S4050和后续步骤中的处理操作与第一典型实施例中的图4的流程图中的处理操作相同,因此这里省略对这些处理操作的说明。
通过上述处理,信息处理系统10000能够基于执行模式中的优先项进行抽吸和输送。如上所述,在第三典型实施例中,在信息处理系统的学习模式和任务执行模式各自中切换优先项。这允许针对用于改善速度、质量、成本和周围环境的目的获得最佳抽吸参数并且进行抽吸和输送。此外,这允许学习与各个优先项相对应的网络的加权集。
在第三典型实施例的学习模式中,不进行如第一典型实施例的学习模式中的步骤S6092和S6103那样的、从开始抽吸起直到开始输送为止的操作的确认,而是在步骤S12160中集体进行这种确认。然而,第三典型实施例不限于此,而是如第一典型实施例的学习模式中的步骤S6092和S6103那样,可以在进行抽吸参数的判断时逐步地进行确认,然后,处理可以进入步骤S8170的数据收集。在这种情况下,尽管作为抽吸和输送的任务发生失败,但由于作为捷径方式省略了例如输送的步骤,因此执行任务所需的时间变得非常短或不超过预定时间。因此,在所设置的优先项是速度优先的情况下,需要进行调整以防止奖励变得太大。
在图12B所示的步骤S12160中,尽管已经描述了针对抽吸和输送的成功或失败的各判断结果或者针对各优先项来计算奖励的示例,但用于计算奖励的定时不限于此。例如,在步骤S12160中,判断单元1106可以将针对成功或失败的各判断结果或者针对各优先项的测量值输出到数据获取单元507。然后,在步骤S12180中,接收到这样的数据组的学习单元1108可以计算奖励。以这种方式,由于针对成功或失败的各判断结果或者针对各优先项的测量值存储在包装材料抽吸特征数据库中,因此可以容易地考虑在用于计算奖励的方法已改变时施加的效果。
在图12B所示的步骤S12200中,尽管学习单元1108在所获得的抽吸参数针对当前选择的优先项已重复产生了高奖励的情况下完成数据收集、然后进行下一优先项的学习的示例,但第三典型实施例不限于此。例如,为了逐渐地学习各优先项,学习单元1108可以在每当进行了预定次数的数据收集时完成数据收集,然后处理可以进入步骤S12210,使得可以重复优先项的改变。
尽管已经描述了图12B所示的步骤S12210是处理操作的流程中的学习模式的最后处理操作,但第三典型实施例不限于此。例如,考虑如下的情况:针对给定抽吸位置处的图像块,预先设置能够提供足够高的奖励的抽吸参数。此时,在步骤S12031中,学习单元1108可以临时进行优先项的切换。然后,学习单元1108还可以改变网络的权重集。然后,学习单元1108可以获得进行了切换的优先项所需的抽吸参数,并且利用所获得的抽吸参数来进行学习。这允许在给定优先项中防止针对已变得能够用于选择适当抽吸参数的输入图像块进行过度学习。结果,这允许高效地获取在其它优先项中不足的学习数据。
在图14所示的步骤S14001中,尽管已经描述了在选择单元1311选择优先项时允许用户进行选择的示例,但选择优先项的方法不限于此。例如,考虑管理单元(未示出)管理每天要进行的拾取和放置的总量(定量)的情况。例如,以“速度优先”进行拾取和放置。在检测到能够充分实现今天的定量时,管理单元可以向选择单元1311发出指示以将优先项改变为“质量优先”。然后,选择单元1311可以将优先项改变为质量的优先项。此外,在操作员数量增加的时间范围中,管理单元可以向选择单元1311发出指示以将优先项改变为“周围环境优先”。
本发明可以通过进行以下处理来实现。具体地,该处理包括:将用于实现上述各个典型实施例的功能的软件(程序)经由数据通信所用的网络或者各种存储介质供给至系统或设备。然后,该处理包括:使该系统或设备的计算机(或中央处理单元(CPU)或微处理单元(MPU))读出并执行该程序。此外,该处理可以包括:将该程序记录在计算机可读记录介质上并且提供这样的记录介质。
其它实施例
本发明的实施例还可以通过如下的方法来实现,即,通过网络或者各种存储介质将执行上述实施例的功能的软件(程序)提供给系统或装置,该系统或装置的计算机或是中央处理单元(CPU)、微处理单元(MPU)读出并执行程序的方法。
尽管已经参考典型实施例说明了本发明,但是应该理解,本发明不限于所公开的典型实施例。所附权利要求书的范围符合最宽的解释,以包含所有这类修改、等同结构和功能。

Claims (19)

1.一种信息处理设备,用于输出用于控制抽吸装置的控制信息,所述抽吸装置被配置为抽吸包装物体,所述信息处理设备包括:
输入单元,其被配置为输入通过对所述包装物体的表面进行摄像所获得的图像;
确定单元,其被配置为根据所述包装物体的表面的状态来确定第一静止时间,所述第一静止时间用于指示在进行抽吸时从所述抽吸装置和所述包装物体的表面彼此接触时起直到开始所述抽吸装置所进行的输送时为止的时间;以及
输出单元,其被配置为基于从所述图像所指定的所述包装物体的表面的状态,来输出用以控制所述抽吸装置开始抽吸的定时的控制信息,以及,在经过了所述确定单元所确定出的所述第一静止时间之后,输出用于指示所述抽吸装置开始输送的定时的控制信息。
2.根据权利要求1所述的信息处理设备,
其中,所述输入单元输入通过对所述包装物体的表面进行摄像所获得的至少一个图像,以及
其中,在从各图像所指定的所述包装物体的表面上的褶皱的量改变的情况下,所述输出单元根据所述包装物体的表面上的褶皱的量,输出用以改变所述抽吸装置开始抽吸的定时的控制信息。
3.根据权利要求2所述的信息处理设备,其中,在基于所述图像所指定的所述包装物体的表面上存在褶皱的情况下,所述输出单元根据所述包装物体的表面上的褶皱的量,输出用以改变所述抽吸装置开始抽吸的定时的控制信息。
4.根据权利要求1所述的信息处理设备,其中,所述输出单元输出用于指示所述抽吸装置开始抽吸的定时是在所述抽吸装置和所述包装物体的表面彼此接触之前或表面彼此接触之后的控制信息。
5.根据权利要求1所述的信息处理设备,其中,所述确定单元被配置为基于针对所述包装物体的表面的状态和所述控制信息的组合、表示抽吸是否成功的结果的数据,根据所述包装物体的表面的状态来确定用以控制所述抽吸装置开始抽吸的定时的控制信息,
其中,所述输出单元输出所述确定单元所确定出的控制信息。
6.根据权利要求5所述的信息处理设备,其中,所述确定单元基于通过学习针对所述包装物体的表面的状态的控制信息所获得的训练模型,以所述输入单元所输入的图像作为输入,来确定用以控制开始抽吸的定时的控制信息。
7.根据权利要求5所述的信息处理设备,
其中,所述确定单元根据所述包装物体的表面的状态来确定第二静止时间,所述第二静止时间用于指示从所述抽吸装置在将所述包装物体输送到输送目的地之后停止抽吸时起直到开始所述抽吸装置的移动时为止的时间,以及
其中,在经过了所述确定单元所确定出的所述第二静止时间之后,所述输出单元输出用以控制所述抽吸装置的移动的控制信息。
8.根据权利要求1所述的信息处理设备,还包括提取单元,所述提取单元被配置为通过将作为用于指示适合于抽吸的所述包装物体的表面的状态的图像特征的模板与所述输入单元所输入的图像进行比较,来提取所述抽吸装置抽吸所述包装物体的抽吸位置,
其中,所述输出单元基于从与所述抽吸位置相对应的图像区域所指定的所述包装物体的表面的状态来输出所述控制信息。
9.根据权利要求1所述的信息处理设备,还包括:
判断单元,其被配置为通过观测所述抽吸装置的真空压力,来判断表示利用所述控制信息的控制是成功还是失败的结果;以及
学习单元,其被配置为基于所述判断单元所判断出的结果,来学习用于指示在所述包装物体的表面的状态中引起成功的可能性高的控制信息的数据集,
其中,所述输出单元基于从所述图像所指定的所述包装物体的表面的状态以及所述数据集来输出所述控制信息。
10.根据权利要求9所述的信息处理设备,其中,所述判断单元在所述真空压力小于预定阈值的情况下,判断为利用所述控制信息的控制成功,并且在所述真空压力大于或等于所述预定阈值的情况下,判断为利用所述控制信息的控制失败。
11.根据权利要求10所述的信息处理设备,
其中,所述学习单元通过强化学习来更新用于基于所输入的图像来输出所述控制信息的第一训练模型的连接权重,所述强化学习用于在针对所述包装物体的抽吸成功的情况下给予正奖励、并且在针对所述包装物体的抽吸失败的情况下给予负奖励,以及
其中,所述输出单元基于所述学习单元更新后的所述第一训练模型来输出所述控制信息。
12.根据权利要求1所述的信息处理设备,还包括大小不同的多个抽吸单元,
其中,所述输出单元基于从所述图像所指定的所述包装物体的表面的状态以及所述抽吸单元的大小,来输出用以控制开始抽吸的定时的控制信息。
13.根据权利要求1所述的信息处理设备,还包括接收单元,所述接收单元被配置为在输送所述包装物体的任务中,从用户接收将速度、质量、成本和环境声音中的任一个设置为优先项的请求,
其中,所述输出单元根据所述接收单元所接收到的请求,来输出满足与所述优先项有关的预定条件的控制信息。
14.根据权利要求13所述的信息处理设备,还包括选择单元,所述选择单元被配置为根据所述接收单元所接收到的请求,来选择通过学习满足与所述优先项有关的预定条件的控制信息所获得的第二训练模型,
其中,所述输出单元基于从所述图像所指定的所述包装物体的表面的状态以及所述第二训练模型,来输出所述控制信息。
15.根据权利要求14所述的信息处理设备,还包括第二学习单元,所述第二学习单元被配置为与输送所述包装物体的任务中的优先项相关联地,利用强化学习来更新用于输出所述控制信息的所述第二训练模型的连接权重,所述强化学习用于在针对所述包装物体的抽吸成功且满足与所述优先项有关的预定条件的情况下给予正奖励、并且在针对所述包装物体的抽吸失败或者不满足与所述优先项有关的预定条件的情况下给予负奖励。
16.一种信息处理设备,用于输出用于控制抽吸装置的控制信息,所述抽吸装置被配置为抽吸包装物体,所述信息处理设备包括:
输入单元,其被配置为输入通过对所述包装物体的表面进行摄像所获得的图像;
确定单元,其被配置为根据所述包装物体的表面的状态来确定第一静止时间,所述第一静止时间用于指示在进行抽吸时从所述抽吸装置和所述包装物体的表面彼此接触时起直到开始所述抽吸装置所进行的输送时为止的时间;以及
输出单元,其被配置为根据基于所述图像所指定的所述包装物体的表面上的褶皱的量,来输出用以改变所述抽吸装置开始抽吸的定时的控制信息,以及,在经过了所述确定单元所确定出的所述第一静止时间之后,输出用于指示所述抽吸装置开始输送的定时的控制信息。
17.根据权利要求16所述的信息处理设备,其中,在所述图像的表面中所包括的褶皱的量变得大于预定阈值的情况下,所述输出单元输出用以改变所述定时的控制信息,使得所述抽吸装置的抽吸在所述抽吸装置与所述包装物体接触之前开始。
18.一种用于信息处理设备的信息处理方法,所述信息处理设备输出用于控制抽吸装置的控制信息,所述抽吸装置被配置为抽吸包装物体,所述信息处理方法包括:
输入通过对所述包装物体的表面进行摄像所获得的图像;
根据所述包装物体的表面的状态来确定第一静止时间,所述第一静止时间用于指示在进行抽吸时从所述抽吸装置和所述包装物体的表面彼此接触时起直到开始所述抽吸装置所进行的输送时为止的时间;以及
基于从所述图像所指定的所述包装物体的表面的状态,来输出用以控制所述抽吸装置开始抽吸的定时的控制信息,以及,在经过了所述第一静止时间之后,输出用于指示所述抽吸装置开始输送的定时的控制信息。
19.一种非暂时性计算机可读存储介质,其存储计算机能够执行的指令,所述指令在由计算机执行的情况下,使所述计算机进行用于信息处理设备的信息处理方法,所述信息处理设备输出用于控制抽吸装置的控制信息,所述抽吸装置被配置为抽吸包装物体,所述信息处理方法包括:
输入通过对所述包装物体的表面进行摄像所获得的图像;
根据所述包装物体的表面的状态来确定第一静止时间,所述第一静止时间用于指示在进行抽吸时从所述抽吸装置和所述包装物体的表面彼此接触时起直到开始所述抽吸装置所进行的输送时为止的时间;以及
基于从所述图像所指定的所述包装物体的表面的状态,来输出用以控制所述抽吸装置开始抽吸的定时的控制信息,以及,在经过了所述第一静止时间之后,输出用于指示所述抽吸装置开始输送的定时的控制信息。
CN201910480625.5A 2018-06-21 2019-06-04 信息处理设备、信息处理方法和存储介质 Active CN110626548B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-118122 2018-06-21
JP2018118122A JP7286272B2 (ja) 2018-06-21 2018-06-21 情報処理装置、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
CN110626548A CN110626548A (zh) 2019-12-31
CN110626548B true CN110626548B (zh) 2021-09-10

Family

ID=68805988

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910480625.5A Active CN110626548B (zh) 2018-06-21 2019-06-04 信息处理设备、信息处理方法和存储介质

Country Status (4)

Country Link
US (1) US11613026B2 (zh)
JP (1) JP7286272B2 (zh)
CN (1) CN110626548B (zh)
DE (1) DE102019003868B4 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9227323B1 (en) * 2013-03-15 2016-01-05 Google Inc. Methods and systems for recognizing machine-readable information on three-dimensional objects
JP6475234B2 (ja) 2013-06-21 2019-02-27 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 組み合わされた磁気共鳴イメージング及び放射線治療のためのクライオスタット及びシステム
US11192258B2 (en) 2018-08-10 2021-12-07 Miso Robotics, Inc. Robotic kitchen assistant for frying including agitator assembly for shaking utensil
US20200269434A1 (en) * 2019-02-26 2020-08-27 Miso Robotics, Inc. Jawless gripper enhanced robotic kitchen system for food assembly
US11044444B2 (en) * 2019-02-28 2021-06-22 Jvckenwood Corporation Image capturing device and image capturing method
US11845191B1 (en) * 2019-06-26 2023-12-19 Amazon Technologies, Inc. Robotic picking of cuboidal items from a pallet
US11738447B2 (en) * 2019-07-29 2023-08-29 Nimble Robotics, Inc. Storage systems and methods for robotic picking
DE102019128583B4 (de) * 2019-10-23 2022-03-10 Franka Emika Gmbh Optimierungsmodi für Steuerprogramme eines Robotermanipulators
DE102020100567B4 (de) * 2020-01-13 2022-12-15 J. Schmalz Gmbh Handhabungsvorrichtung mit pneumatisch aktivierbarem Endeffektor an einer Schwenkeinheit
JP2021194745A (ja) 2020-06-16 2021-12-27 株式会社デンソーウェーブ ロボットの制御方法、吸着保持装置
SE2030325A1 (en) * 2020-10-28 2021-12-21 Zenrobotics Oy Waste sorting robot and method for detecting faults
WO2022139839A1 (en) * 2020-12-23 2022-06-30 Hitachi, Ltd. System and methods for machine learning based industry equipment working pattern profiling and applications
DE102020135011B3 (de) 2020-12-29 2022-03-03 Franka Emika Gmbh Bilderkennung zum angepassten Ausführen eines Steuerprogramms eines Robotermanipulators
DE102020135010B4 (de) 2020-12-29 2024-05-08 Franka Emika Gmbh Massedaten-Schätzung einer externen Last für einen Robotermanipulator
CN112720497B (zh) * 2020-12-30 2022-05-17 深兰智能科技(上海)有限公司 机械手的控制方法、装置、拾取设备及存储介质
JP2022131750A (ja) * 2021-02-26 2022-09-07 株式会社東芝 ハンドリングシステム、搬送システム、制御装置、制御プログラム、およびハンドリング方法

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03231144A (ja) 1990-02-06 1991-10-15 Mitsubishi Rayon Co Ltd 包装物の欠陥検査装置
JPH10193291A (ja) * 1997-01-10 1998-07-28 Hitachi Seiki Co Ltd 被搬送物の吸着搬送装置
JP2001175856A (ja) 1999-12-14 2001-06-29 Kawasaki Steel Corp 外観検査装置
WO2004017704A1 (ja) 2002-08-06 2004-02-26 Matsushita Electric Industrial Co., Ltd. 部品実装方法、及び部品実装装置
US7410483B2 (en) * 2003-05-23 2008-08-12 Novare Surgical Systems, Inc. Hand-actuated device for remote manipulation of a grasping tool
IS8494A (is) * 2006-05-31 2008-12-02 Valka Ehf Griparmur á pjark fyrir matvaeli
DE102008013324A1 (de) * 2007-04-05 2008-10-16 Heidelberger Druckmaschinen Ag Vereinzelung von Druckplatten eines Stapels
DE202007015153U1 (de) * 2007-10-30 2009-03-26 Kuka Systems Gmbh Handhabungseinrichtung
DE102007054867A1 (de) * 2007-11-07 2009-05-20 J. Schmalz Gmbh Greifvorrichtung
US8386079B1 (en) * 2011-10-28 2013-02-26 Google Inc. Systems and methods for determining semantic information associated with objects
EP2623447A1 (en) * 2012-01-31 2013-08-07 Neopost Technologies Item collating system and method
DE102012003160A1 (de) * 2012-02-17 2012-09-20 Daimler Ag Vorrichtung und Verfahren zu einer automatisierten Entnahme von Bauteilen aus einem Behälter und zu einer Vereinzelung der Bauteile
JP6000029B2 (ja) * 2012-09-10 2016-09-28 株式会社アプライド・ビジョン・システムズ ハンドリングシステム、ハンドリング方法及びプログラム
US9227323B1 (en) * 2013-03-15 2016-01-05 Google Inc. Methods and systems for recognizing machine-readable information on three-dimensional objects
JP6242584B2 (ja) 2013-04-23 2017-12-06 西部電機株式会社 ピッキング装置
CN103412496B (zh) 2013-08-02 2015-10-28 深圳科瑞技术股份有限公司 检测单真空源多工位吸头物料状态的方法及系统
JP6486114B2 (ja) * 2015-01-16 2019-03-20 株式会社東芝 荷役装置
CN205441070U (zh) 2015-12-31 2016-08-10 贵州弘康药业有限公司 一种胶囊用铝塑包装的次品剔除装置
EP3517933A4 (en) 2016-09-23 2020-04-22 Kabushiki Kaisha Earthtechnica SORTING DEVICE AND SORTING METHOD
JP6921602B2 (ja) * 2017-04-21 2021-08-18 キヤノン株式会社 連続体ロボットの制御システム及びその制御方法、並びに、プログラム
US20180322623A1 (en) * 2017-05-08 2018-11-08 Aquifi, Inc. Systems and methods for inspection and defect detection using 3-d scanning
JP2018203480A (ja) * 2017-06-07 2018-12-27 株式会社東芝 仕分装置および仕分システム
JP6692777B2 (ja) * 2017-07-25 2020-05-13 株式会社東芝 移載装置および判定方法
CN107895301A (zh) 2017-11-13 2018-04-10 汕头市宝维智能科技有限公司 一种吸盘式检货无人店退货装置
US11260534B2 (en) * 2018-04-04 2022-03-01 Canon Kabushiki Kaisha Information processing apparatus and information processing method
US11091355B1 (en) * 2018-05-16 2021-08-17 Amazon Technologies, Inc. Mechanically intelligent end-of-arm tool

Also Published As

Publication number Publication date
US11613026B2 (en) 2023-03-28
US20190389082A1 (en) 2019-12-26
DE102019003868A1 (de) 2019-12-24
JP7286272B2 (ja) 2023-06-05
CN110626548A (zh) 2019-12-31
JP2019217608A (ja) 2019-12-26
DE102019003868B4 (de) 2020-11-19

Similar Documents

Publication Publication Date Title
CN110626548B (zh) 信息处理设备、信息处理方法和存储介质
JP6843914B2 (ja) 情報処理装置、情報処理方法及びプログラム
EP3284563A2 (en) Picking system
US11312581B2 (en) Object grasp system and method
US10839261B2 (en) Information processing apparatus, information processing method, and storage medium
US11772262B2 (en) Detecting slippage from robotic grasp
JP4565023B2 (ja) 物品取り出し装置
CN110329710A (zh) 具有机器人臂吸附控制机制的机器人系统及其操作方法
CN111566027A (zh) 具有自动化包裹登记机构的机器人系统及其操作方法
JP7005388B2 (ja) 情報処理装置及び仕分システム
US9434070B2 (en) Apparatus and method for picking up article randomly piled using robot
JP7476305B2 (ja) 非常に薄い物体または特徴部のロボット把持の検出
JP2019188516A (ja) 情報処理装置、情報処理方法、及びプログラム
CN111906773A (zh) 具有协调转移机构的机器人系统
JP2019188561A (ja) 物品把持装置及び物品把持装置の制御装置
WO2019240273A1 (ja) 情報処理装置、情報処理装置を備える荷降しシステム、及びコンピュータ可読記憶媒体
JP2019199335A (ja) 情報処理装置、情報処理プログラム、及び仕分システム
JP7062418B2 (ja) 情報処理装置及び仕分システム
JP7163116B2 (ja) 情報処理装置及びピッキングシステム
CN112871682B (zh) 快递供包系统、方法、设备及存储介质
CN111618852B (zh) 具有协调转移机构的机器人系统
WO2022098706A1 (en) Robotic tools and methods for operating same
US20230071488A1 (en) Robotic system with overlap processing mechanism and methods for operating the same

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant