JP2023040079A - Assembly error correction for assembly lines - Google Patents

Assembly error correction for assembly lines Download PDF

Info

Publication number
JP2023040079A
JP2023040079A JP2022207136A JP2022207136A JP2023040079A JP 2023040079 A JP2023040079 A JP 2023040079A JP 2022207136 A JP2022207136 A JP 2022207136A JP 2022207136 A JP2022207136 A JP 2022207136A JP 2023040079 A JP2023040079 A JP 2023040079A
Authority
JP
Japan
Prior art keywords
assembly
target object
steps
target
worker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022207136A
Other languages
Japanese (ja)
Inventor
シー プットマン,マシュー
C Putman Matthew
ピンスキー,バディム
Pinskiy Vadim
キム,ウンソル
Eun-Sol Kim
サンドストローム,アンドリュー
Sundstrom Andrew
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanotronics Imaging Inc
Original Assignee
Nanotronics Imaging Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US16/587,366 external-priority patent/US11156982B2/en
Priority claimed from PCT/US2020/029022 external-priority patent/WO2020176908A1/en
Application filed by Nanotronics Imaging Inc filed Critical Nanotronics Imaging Inc
Publication of JP2023040079A publication Critical patent/JP2023040079A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/41805Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by assembly
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/406Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by monitoring or safety
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/31From computer integrated manufacturing till monitoring
    • G05B2219/31027Computer assisted manual assembly CAA, display operation, tool, result
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/31From computer integrated manufacturing till monitoring
    • G05B2219/31046Aid for assembly, show display on screen next workpiece, task, position to be assembled, executed
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Manufacturing & Machinery (AREA)
  • Theoretical Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a computational model that utilizes machine learning for detecting errors during a manual assembly process, and for determining a sequence of steps to complete the manual assembly process in order to mitigate the detected errors.
SOLUTION: A method comprises evaluating a target object at a step of an assembly process where an error is detected in the light of a nominal object so as to obtain a comparison, and, based on this comparison, obtaining a sequence of steps for completion of the assembly process of the target object. The assembly instructions for creating the target object are adjusted based on this sequence of steps.
SELECTED DRAWING: Figure 1
COPYRIGHT: (C)2023,JPO&INPIT

Description

関連出願の相互参照
本出願は、2019年9月30に出願した、「DYNAMIC TRAINING FOR ASSEMBLY LINES,」という名称の米国特許出願第16/587,366号の一部継続出願であり、この米国特許出願第16/587,366号は、2019年2月28日に出願した、「DYNAMIC TRAINING FOR ASSEMBLY LINES,」という名称の米国出願第16/289,422号、現在は米国特許第10,481,579号の継続出願である。さらに、本出願は、2019年4月19日に出願した、「A COMPUTATION MODEL FOR DECISION-MAKING AND ASSEMBLY OPTIMIZATION IN MANUFACTURING,」という名称の米国仮出願第62/836,192号、2019年11月6日に出願した、「A COMPUTATION MODEL FOR DECISION-MAKING AND ASSEMBLY OPTIMIZATION IN MANUFACTURING,」という名称の米国仮出願第62/931,448号、および2019年11月7日に出願した、「DEEP LEARNING QUALITY PREDICTOR FOR MANUAL ASSEMBLY VIDEO ANALYSIS,」という名称の米国仮出願第62/932,063号の利益を主張するものである。上記出願および特許の内容全体は、参照により本明細書に組み込まれている。
CROSS-REFERENCE TO RELATED APPLICATIONS This application is a continuation-in-part of U.S. patent application Ser. Application No. 16/587,366, filed February 28, 2019, is U.S. Application No. 16/289,422 entitled "DYNAMIC TRAINING FOR ASSEMBLY LINES," now U.S. Patent No. 10,481, This is a continuation application of '579. Further, this application is subject to U.S. Provisional Application Serial No. 62/836,192 entitled "A COMPUTATION MODEL FOR DECISION-MAKING AND ASSEMBLY OPTIMIZATION IN MANUFACTURING," filed on April 19, 2019, November 6, 2019. U.S. Provisional Application No. 62/931,448, entitled "A COMPUTATION MODEL FOR DECISION-MAKING AND ASSEMBLY OPTIMIZATION IN MANUFACTURING," filed on Nov. 7, 2019, and "DEEP LEARNING QUALITY PREDICTOR," filed November 7, 2019; No. 62/932,063 entitled FOR MANUAL ASSEMBLY VIDEO ANALYSIS. The entire contents of the above applications and patents are incorporated herein by reference.

主題技術は、組立てラインワークフローに対する改善を提供し、詳細には、機械学習モデルを使用してなされるフィードバックおよびフィードフォワードエラー伝搬予測に基づいて組立てライン作業者指示を適応的に更新するためのシステムおよび方法を包含している。以下でさらに詳細に考察されるように、技術のいくつかの態様は、製造偏差または組立て偏差に関してなされる推測に基づいて、1つまたは複数の作業者ステーションで提供される手引きビデオを自動的に適合させるためのシステムおよび方法を包含している。 The subject technology provides improvements to assembly line workflow, and in particular, a system for adaptively updating assembly line operator instructions based on feedback and feedforward error propagation predictions made using machine learning models. and methods. As discussed in further detail below, some aspects of the technology automatically generate instructional videos provided at one or more worker stations based on inferences made regarding manufacturing or assembly deviations. Systems and methods for matching are included.

従来の組立てラインワークフローでは、製造エラーを検出するためには、また、下流側プロセスにおける修正を介してエラーを除去することができる方法を決定するためには、人間(作業者)監視および専門的技術が必要である。組立てと製造、ならびに、組立てラインと生産ラインは、本明細書において交換可能に使用されていることに留意されたい。組立てエラーの検出を人間に依存しているため、エラーが見落とされ(あるいは報告されず)、また、そのまま組立てプロセスにおける下流側に伝搬される高い可能性が存在している。さらに、多くの組立て作業者は、狭い範囲の一組のタスクを実施するように訓練されているにすぎず、したがって組立てワークフローにおける上流側で生じたエラーを最も良好に訂正するための作業者自身のワークフローの修正方法を認識していないことがあり得る。 Traditional assembly line workflows require human (operator) oversight and specialized techniques to detect manufacturing errors and to determine how errors can be eliminated through corrections in downstream processes. technology is required. Note that assembly and manufacturing, and assembly line and production line are used interchangeably herein. Due to the reliance on humans to detect assembly errors, there is a high probability that errors will be overlooked (or not reported) and propagated directly downstream in the assembly process. Furthermore, many assemblers are only trained to perform a narrow set of tasks, and thus are themselves trained to best correct errors that occur upstream in the assembly workflow. may not be aware of how to modify their workflow.

従来の製造ワークフローでは、手動検査プロセスの一部における人間のエラーの修復は、しばしば、その人間ノード上で修正行為を取ることによって処理されている。その人間にかかわる継続する問題が存在している場合、その人は、しばしば、すべての人間がそうであるように、多くの同じ限界に対して傷つき易い他の人に代えられる。ある行為を、エラーを犯すことなく、何年にもわたって絶えず繰り返すことは困難であり、また、修正行為を取ることは、ほとんどの組立て作業者の権利外である。これらの権利が与えられたとしても、そこには矛盾が存在し、また、その単一のプロセスノードのアプリケーションにおいて、その人間が有している経験によってのみ告げられることになる。さらに、何らかの間違いから、さらには何らかの積極的な修正行為から学習するための機構は存在していない。 In traditional manufacturing workflows, the correction of human errors in part of the manual inspection process is often handled by taking corrective action on the human node. If there is an ongoing problem with the person, the person is often replaced by another person who is vulnerable to many of the same limitations as all humans are. It is difficult to repeat an action consistently over the years without committing an error, and taking corrective action is beyond the rights of most builders. Even given these rights, there are contradictions and they can only be told by the experience the human has in the application of the single process node. Moreover, there is no mechanism for learning from any mistakes or even from any positive corrective actions.

さらに、組立てラインの電子監視には限界があり、また、上流側のステップで生じたエラーを補償するための、組立てラインにおける下流側のステップに対する臨機応変な調整を提供するための頑丈な機構を含んでいない。さらに、作業者モーションの変化および/または組立てパターンの変化が、結果として得られる製造製品に如何に影響を及ぼすかを評価し、かつ、製造製品の性能および/または特性を改善するための修正行為を提供するための新しい機構が必要である。 In addition, electronic monitoring of assembly lines has limitations and robust mechanisms for providing opportunistic adjustments to downstream steps in the assembly line to compensate for errors made in upstream steps. not included. In addition, assess how changes in worker motion and/or changes in assembly patterns affect the resulting manufactured product, and take corrective action to improve the performance and/or characteristics of the manufactured product. A new mechanism is needed to provide

いくつかの態様では、開示される技術は、組立てラインにおけるワークフローを最適化するための方法に関し、方法は、目標対象の組立てのあるステップにおいて、目標対象の組立てのエラーを検出するステップと、組立てプロセスのそのステップにおける目標対象と公称対象とを評価し、それにより比較を得るステップと、その比較に基づいて、目標対象と公称対象の間の偏差を最小化するために必要な一連のステップを決定するステップとを含む。いくつかの態様では、方法は、上記一連のステップに基づいて目標対象のための組立て指示を調整するためのステップをさらに含むことができる。 In some aspects, the disclosed technology relates to a method for optimizing a workflow on an assembly line, the method comprising, at a step of assembling the target object, detecting an error in assembling the target object; Evaluate the target and nominal targets at that step in the process, thereby obtaining a comparison, and, based on that comparison, the sequence of steps necessary to minimize the deviation between the target and nominal targets. and determining. In some aspects, the method may further include adjusting building instructions for the target object based on the sequence of steps.

別の態様では、開示される技術は、組立てラインにおけるワークフローを最適化するためのシステムを包含し、システムは、複数の画像キャプチャデバイスであって、画像キャプチャデバイスの各々は、目標対象の組立てプロセスの間、作業者の動きをキャプチャするために異なる位置に配置される、複数の画像キャプチャデバイスと、作業者に提供された手引きおよび指示を自動的に修正するように構成された組立て指示モジュールであって、上記複数の撮像デバイスに結合される、組立て指示モジュールとを含む。組立て指示モジュールは、複数の画像キャプチャデバイスからモーションデータを受け取るステップであって、モーションデータは、作業者による、目標対象を組み立てるための一組のステップの実行に対応する、ステップと、上記一組のステップのうちのあるステップにおけるモーションデータに基づいて、目標対象の組立てにおけるエラーを決定するステップとを含む操作を実施するように構成することができる。いくつかの実施態様では、組立て指示モジュールは、上記一組のステップのうちの上記ステップにおける目標対象と公称対象とを評価し、それにより比較を得るための操作を実施し、その比較に基づいて、目標対象と公称対象の間の偏差を最小化するために必要な一連のステップを決定し、かつ、上記一連のステップに基づいて、作業者に提供される組立て指示を調整するようにさらに構成することができる。修正された組立て指示の形態は、それらに限定されないが、モーションデータの生成された、あるいは編集されたビデオ、識別された偏差の自然言語処理(NLP)からのテキストベースの指示、または作業者への他のフィードバック機構を含むことができる。 In another aspect, the disclosed technology encompasses a system for optimizing a workflow on an assembly line, the system comprising a plurality of image capture devices, each image capture device for a target assembly process. with a plurality of image capture devices placed at different positions to capture the movements of the worker during and an assembly instruction module coupled to the plurality of imaging devices. a building instruction module receiving motion data from a plurality of image capture devices, the motion data corresponding to a worker performing a set of steps for building a target object; and determining an error in the assembly of the target object based on the motion data in one of the steps of . In some embodiments, the assembly instruction module evaluates a target object and a nominal object in said step of said set of steps, performs operations to thereby obtain a comparison, and based on said comparison , further configured to determine a sequence of steps required to minimize the deviation between the target target and the nominal target, and adjust the assembly instructions provided to the operator based on the sequence of steps. can do. Modified assembly instructions may be in the form of, but are not limited to, generated or edited video of motion data, text-based instructions from natural language processing (NLP) of identified deviations, or instructions to the operator. may include other feedback mechanisms.

さらに別の態様では、開示される技術は、その上に記憶された命令を含む非一時的コンピュータ可読媒体に関しており、命令は、1つまたは複数のプロセッサによって実行されると、目標対象の組立てプロセスのあるステップにおいて、目標対象の組立てにおけるエラーを検出するステップ、組立てプロセスの上記ステップにおける目標対象と公称対象とを評価し、それにより比較を得るステップ、およびその比較に基づいて、目標対象と公称対象の間の偏差を最小化するために必要な一連のステップを決定するステップを実施することを含む命令をプロセッサが実行することになるように構成される。いくつかの実施態様では、命令は、上記一連のステップに基づいて、目標対象のための組立て指示を調整するための操作をプロセッサが実施することになるようにさらに構成することができる。 In yet another aspect, the disclosed technology relates to a non-transitory computer-readable medium containing instructions stored thereon, the instructions, when executed by one or more processors, to a target object assembly process. In one step, detecting an error in the assembly of the target object; evaluating the target object and the nominal object in said step of the assembly process to thereby obtain a comparison; A processor is configured to execute instructions including performing the steps of determining a sequence of steps necessary to minimize the deviation between objects. In some implementations, the instructions may be further configured to cause the processor to perform operations for adjusting the building instructions for the target object based on the sequence of steps described above.

主題技術の特定の特徴は、添付の特許請求の範囲に示されている。しかしながらさらなる理解を提供するために含まれている添付の図面は、開示される態様を図解したものであり、説明と相俟って主題技術の原理を説明する働きをしている。 Particular features of the subject technology are set forth in the appended claims. However, the accompanying drawings, which are included to provide a further understanding, illustrate the disclosed aspects and, together with the description, serve to explain the principles of the subject technology.

開示される技術のいくつかの態様による、例示的生産ライン展開のフローチャートを概念的に示す図である。1 conceptually illustrates a flowchart of an exemplary production line deployment, in accordance with certain aspects of the disclosed technology; FIG.

開示される技術のいくつかの態様による、所与の作業者ステーションで組立てエラー修正を実施するためのプロセスの例を示す図である。FIG. 3 illustrates an example process for implementing assembly error correction at a given worker station, in accordance with certain aspects of the disclosed technology;

主題技術のいくつかの態様を実現するために使用することができる電子システムの例を示す図である。1 illustrates an example electronic system that can be used to implement some aspects of the subject technology; FIG.

以下に示されている詳細な説明には、主題技術の様々な構成についての説明であることが意図されており、主題技術を実践することができる構成のみを表すことは意図されていない。添付の図面は本明細書に組み込まれており、詳細な説明の一部を構成している。詳細な説明は、主題技術についてのより完全な理解を提供するために特定の詳細を含む。しかしながら主題技術は、本明細書において示されている特定の詳細に限定されないこと、また、これらの詳細がなくても実践することができることは明確で、かつ、明らかであろう。いくつかの実例では、主題技術の概念を曖昧にすることを回避するために、構造および構成要素はブロック図の形態で示されている。 The detailed description presented below is intended to be a description of various configurations of the subject technology, and is not intended to represent only the configurations in which the subject technology can be practiced. The accompanying drawings are incorporated into this specification and constitute a part of the detailed description. The detailed description includes specific details to provide a more thorough understanding of the subject technology. However, it will be clear and obvious that the subject technology is not limited to the specific details shown herein and may be practiced without these details. In some instances, structures and components are shown in block diagram form in order to avoid obscuring concepts of the subject technology.

開示される技術の態様は、生産ラインの組立ておよび結果として得られる製造製品を追跡し、訓練し、かつ、漸進的に改善するための方法を提供することにより、従来の組立てラインプロセスフローの上記限界に対処する。改善は、動的視覚フィードバックまたは他のフィードバック、および指示を個々の組立て作業者に提供することによって実現され、また、いくつかの実施態様では、作業者フィードバックはエラーに基づいており、エラーは、それらに限定されないが、組立てエラー、役に立たないプロセスおよび/またはモーション、生産ラインにおける1つまたは複数のポイントで検出された粗悪な製品を含むことができる。 Aspects of the disclosed technology overcome the above drawbacks of conventional assembly line process flows by providing methods for tracking, training, and incrementally improving production line assembly and resulting manufactured products. Deal with limits. Improvements are realized by providing dynamic visual or other feedback and instructions to individual builders, and in some embodiments worker feedback is based on errors, which are caused by: These may include, but are not limited to, assembly errors, ineffective processes and/or motions, and inferior product detected at one or more points in the production line.

開示される技術を実現することにより、例えば準実時間エラー検出に基づいて、個々のステーション(またはすべてのステーション)で提供される参照/指示情報を速やかに改定および変更することにより、手動実施態様方法のエラー修正の速度に対して、その速度を著しく改善することができる。本明細書において説明されているいくつかの実施形態は、ビデオの形態の参照/指示情報の使用を考察しているが、他のフォーマットも企図されている。例えば組立て/製造指示は、聴覚、視覚、テキストおよび/または触覚キューとして、あるいは他の形態の参照として組立て作業者に提供することができる。一例として、聴覚指示情報は、口頭の指示または他の聴覚インジケータを含むことができる。視覚組立て指示情報は、拡張現実感(A/R)または仮想現実感(V/R)システムの使用などのビデオまたは動画化フォーマットを含むことができる。いくつかの態様では、視覚組立て指示は、組立てラインの所与のステーションにおける、作業者によるワークピース(またはツール)の取扱い方法に関する例を提供する動画として提供することができる。さらに、いくつかの態様では、組立て/製造指示は、例えば、ロボット組立て作業者または機械組立て作業者が受け取り、かつ、実現することができる機械命令を含むことができる。本明細書において使用されている作業者という用語は、製造製品を組み立てるモーションを使用する人間、ロボットまたは機械を意味することができる。さらに、作業者という用語は、人間の作業者がロボットまたは機械器具と共に作業し、あるいは人間作業者がロボットまたは機械器具によって支援される実例の場合のように、人間支援製造実施態様を包含している。 By implementing the disclosed techniques, for example, based on near-real-time error detection, by rapidly revising and changing the reference/indicative information provided at individual stations (or all stations), manual implementation With respect to the speed of error correction of the method, its speed can be significantly improved. Although some embodiments described herein contemplate using reference/indicative information in the form of video, other formats are also contemplated. For example, assembly/manufacturing instructions may be provided to the assembler as audio, visual, textual and/or tactile cues or as other forms of reference. As an example, the audible instructional information may include verbal instructions or other audible indicators. Visual building instruction information may include video or animated formats such as the use of Augmented Reality (A/R) or Virtual Reality (V/R) systems. In some aspects, the visual assembly instructions may be provided as animations that provide examples of how the workpiece (or tool) should be handled by workers at a given station of the assembly line. Further, in some aspects, the assembly/manufacturing instructions may include machine instructions that can be received and implemented by, for example, a robotic or mechanical assembler. As used herein, the term worker can mean a human, robot or machine that uses motion to assemble a manufactured product. Further, the term worker encompasses human-assisted manufacturing implementations, such as in instances where human workers work with or are assisted by robots or machines. there is

組立て/製造指示が参照/指示ビデオとして提供される実例では、このようなビデオは、時によっては標準作業プロトコル(SOP)と呼ばれることがある。開示される技術のシステムは、最小限のハードウェア要求事項、例えば個々の作業者のためのビデオカメラおよびディスプレイの使用などのため、効果的に展開することができ、一方、機械学習訓練、更新およびエラー伝搬は、例えば計算クラスターまたはクラウド環境におけるような集中型計算資源で実施することができる。 In instances where assembly/manufacturing instructions are provided as reference/instruction videos, such videos are sometimes referred to as standard operating protocols (SOPs). Systems of the disclosed technology can be effectively deployed due to minimal hardware requirements, such as the use of video cameras and displays for individual workers, while machine learning training, updating and error propagation can be implemented on centralized computing resources, such as in computing clusters or cloud environments, for example.

いくつかの態様では、ビデオ指示情報は、拡張現実感表示の一部として、一人(1つ)または複数の作業者に提供することができる。すなわち指示、または標準組立て/製造方法からの偏差は、拡張現実感を使用して作業者に伝えることができ、表示は、強化されたビデオ、動画化された図形、および/または記録されたシナリオを表すビデオデータの混合として提供される。一例として、拡張現実感表示は、組み立てられているワークピース、および/または組立て/製造プロセスで使用されているツールの実時間フィードに対する動画化または図形オーバーレイとして提供される指示または手引きを提供することができる。 In some aspects, video instructional information may be provided to one or more workers as part of an augmented reality display. instructions, or deviations from standard assembly/manufacturing methods, can be communicated to workers using augmented reality, and displays can be enhanced video, animated graphics, and/or recorded scenarios. provided as a mixture of video data representing As an example, an augmented reality display may provide instructions or guidance provided as an animated or graphical overlay to a real-time feed of the workpiece being assembled and/or the tools being used in the assembly/manufacturing process. can be done.

いくつかの実施態様では、開示される技術のシステムは、生産ラインの様々な作業者ステーションに配置された1つまたは複数のビデオキャプチャデバイスまたはモーションキャプチャデバイスを含む。キャプチャデバイスは、その特定のステーションにおける作業者のモーション/部品、デバイス、材料または他のツール(「コンポーネント」)との相互作用を記録するように構成される。いくつかの態様では、作業者モーションはビデオ記録を使用してキャプチャできるが、他のモーションキャプチャフォーマット、例えば作業者モーションおよび/またはツールまたは製造製品との作業者の相互作用を表す3-Dポイントクラウドの使用も企図されている。さらに、特定のステーションに対する一人または複数人の熟練者のモーション、およびそのステーションにおけるコンポーネントとのその熟練者の相互作用を記録することにより、ステーション毎の参照ビデオを作り出すことも可能である。このビデオは、その熟練者の行為の単一の例から、または複数の例から作り出すことができる。熟練者毎のモーション経路を引き出すことができ、また、何人かの熟練者またはいくつかの例が使用される実施形態では、引き出されたモーション経路のセット(例えば平均)に対する計算を実施して、特定のステーションのための参照ビデオを作り出すことができる。参照ビデオは、その特定のステーションで実施されるべきモーション経路のデジタルまたは動画化表現の形態であってもよい。熟練者とは、特殊技術を有する誰か、または手引きが提供されている特定の組立てステップに関して知識がある誰かを意味することができることに留意されたい。 In some implementations, systems of the disclosed technology include one or more video or motion capture devices located at various worker stations on a production line. The capture device is configured to record the worker's motion/interaction with parts, devices, materials or other tools (“components”) at that particular station. In some aspects, worker motion can be captured using video recording, but other motion capture formats, such as 3-D points representing worker motion and/or worker interaction with a tool or manufactured product. Cloud use is also contemplated. In addition, it is also possible to create a station-by-station reference video by recording the motion of one or more technicians to a particular station and their interactions with the components at that station. This video can be created from a single example of the expert's actions or from multiple examples. Motion paths for each expert can be derived, and in embodiments where several experts or several examples are used, performing a calculation on the set (e.g., average) of the derived motion paths, A reference video can be created for a particular station. A reference video may be in the form of a digital or animated representation of the motion path to be performed at that particular station. Note that expert can mean someone with specialized skills or knowledge of the particular assembly steps for which guidance is provided.

いくつかの実施形態では、生産ラインの様々な作業者ステーションに配置されたビデオキャプチャデバイスまたはモーションキャプチャデバイスは、組立てエラーを計算するために使用することができる、それぞれのステーションにおけるワークピース/コンポーネント/ツールの属性(例えば品質、引張り強さ、欠陥の数)もキャプチャできる。 In some embodiments, video or motion capture devices placed at various worker stations on a production line can be used to calculate assembly errors for workpieces/components/ Tool attributes (eg quality, tensile strength, number of defects) can also be captured.

作業者のそれぞれのステーションにおけるその相互作用をキャプチャすることにより、理想/熟練作業者相互作用/ワークフローを表すベースライン(グラウンドトルース)モデルとのキャプチャされた相互作用を比較することによって作業者エラーを検出することができる。すなわち理想化された相互作用モデルからの作業者偏差を使用して、例えば異なるステーションに提供された作業者指示/手引きを改定することにより、組立てチェーンにおける様々な場所で修復することができる組立てエラーを計算することができる。さらに、個々のステーションにおけるコンポーネントの品質をキャプチャし、かつ、そのステーションのためのベースラインコンポーネントに対して比較することも可能である。またベースラインコンポーネントからのコンポーネントの偏差を使用して、特定のステーションにおけるコンポーネントに品質等級を割り当て、あるいは様々なステーションに提供された作業者指示/手引きを改定することによって修復することができる作業者/組立てエラーを計算することも可能である。 By capturing a worker's interaction at each station, worker error can be determined by comparing the captured interaction with a baseline (ground truth) model representing the ideal/skilled worker interaction/workflow. can be detected. assembly errors that can be corrected at various locations in the assembly chain, i.e. using operator deviations from an idealized interaction model, for example by revising operator instructions/guidance provided at different stations can be calculated. Additionally, it is possible to capture the quality of the components at an individual station and compare against the baseline component for that station. Also, the deviation of a component from a baseline component can be used to assign a quality grade to a component at a particular station, or make repairs by revising operator instructions/guidance provided at various stations. / Assembly error can also be calculated.

組立て修正は、所望の実施態様に応じて様々な方法で実施することができる。いくつかの態様では、作業者変化/エラーを使用して、例えば部品を品質等級(例えばA、B、C、等々)に分類し、引き続いてこれらの部品を適切な生産ラインへ導くことによって分類を実施することができる。別の態様では、検出された組立てエラーを使用して所与のステーションにおけるプロセスを改定し、それにより品質を改善し、かつ、変化を小さくすることができる。すなわち検出された組立てエラーを使用して、指示または手引きを同じステーションに自動的に提供することができ、それにより例えばそのステーションでもたらされたエラーを訂正することができる(例えばイン-ステーションリワーク)。NLPを使用して、作業者に対する指示または手引きを処理することができる。例えばNLPを使用して、口頭指示をテキスト形態に変換することができ、あるいはテキスト指示を口頭形態に変換することができる。 Assembly modifications can be implemented in a variety of ways depending on the desired implementation. In some embodiments, operator variations/errors are used, for example, to classify parts into quality grades (e.g., A, B, C, etc.) and subsequently direct these parts to the appropriate production line. can be implemented. In another aspect, detected assembly errors can be used to revise processes at a given station, thereby improving quality and reducing variability. That is, detected assembly errors can be used to automatically provide instructions or guidance to the same station so that, for example, errors introduced at that station can be corrected (eg, in-station rework). . NLP can be used to process instructions or guidance to workers. For example, NLP can be used to convert verbal instructions into textual form, or vice versa.

例えば組立てエラー検出を使用して、エラーが生じることが分かっている所与のステーションに提供された作業者指示またはビデオに対する更新/変更を駆動することができる。一例として、エラー/偏差が第1のステーションで作業している第1の作業者によるものであることが識別されると、例えば第1のステーションの表示デバイスを介してその第1の作業者に提供された組立て指示を改定し、それにより第1のステーションを離れる製造物品に関連するエラー分散を小さくすることができる。 For example, assembly error detection can be used to drive updates/changes to operator instructions or video provided to a given station where an error is known to occur. As an example, once an error/deviation is identified as being due to a first worker working at a first station, the The provided assembly instructions can be revised, thereby reducing the error spread associated with the manufactured articles leaving the first station.

別の態様では、検出された組立てエラーを使用して、後続するステーション組立てを改定することができ、それによりステーション分散を克服することができる。すなわちエラー検出を使用して、上流側の作業者に起因するエラーに基づいて、新しい/更新された組立て手引きの下流側伝搬を自動的にトリガすることができる。例えば第1の作業者によって実行されたモーションに対するエラー分散を使用して、第1のステーションから下流側の第2のステーションと関連する第2の作業者に提供される組立て指示を調整することができる。 In another aspect, detected assembly errors can be used to revise subsequent station assembly, thereby overcoming station dispersion. That is, error detection can be used to automatically trigger downstream propagation of new/updated building instructions based on errors caused by upstream workers. For example, error distribution for motions performed by a first worker can be used to adjust assembly instructions provided to a second worker associated with a second station downstream from the first station. can.

さらに別の態様では、すべてのステーションにわたって検出されたエラー分散を前方へ伝搬させることができ、それにより残りの下流側組立てチェーン全体の進行にわたって、全体または部分的なリワークを実施することができることを保証することができる。すなわち一人(1つ)または複数の下流側作業者に提供された組立て指示を調整することにより、1つまたは複数のステーションにわたって生成されるエラーを修復し/低減することができる。一例では、第2のステーションの第2の作業者によって、また、第3のステーションの第3の作業者によって引き続いて実行される作業を介して、すなわち第2および第3のステーションに提供される組立て指示を調整することにより、第1のステーションの第1の作業者に起因する製造物品のエラー分散を修復することができる。 Yet another aspect is that the detected error distribution can be propagated forward across all stations so that full or partial rework can be performed over the course of the rest of the downstream assembly chain. can be guaranteed. That is, by adjusting the assembly instructions provided to one or more downstream workers, errors generated across one or more stations can be corrected/reduced. In one example, via work subsequently performed by a second worker at a second station and by a third worker at a third station, i.e., to the second and third stations By adjusting the assembly instructions, the error distribution of the manufactured article caused by the first operator at the first station can be corrected.

別の例では、複数のステーションにわたって累積されたエラー分散を1つまたは複数の後続するステーションによって小さくすることができる。例えば第3のステーションおよび第4のステーション(例えばそれぞれ第3の作業者および第4の作業者)に提供される組立て指示を調整することにより、第1のステーションおよび第2のステーションにわたって累積された製造物品のエラー分散を引き続いて修復することができる。 In another example, the error variance accumulated over multiple stations can be reduced by one or more subsequent stations. For example, by adjusting assembly instructions provided to a third station and a fourth station (e.g., a third worker and a fourth worker, respectively), Error distribution in the article of manufacture can be subsequently repaired.

組立てフローにおける個々の作業者/作業者ステーションをネットワークノードとして取り扱うことにより、機械学習モデルを使用して、個々のノード(ステーション)における組立て分散の低減を介してエラーを最小化することによって組立てプロセスを最適化することができる。個別のノード(作業者)分散を最小化し、また、実時間更新を実施して、前方エラー伝搬を軽減することにより、開示される技術のシステムは、最終製品に対する製造分散を著しく低減することができる。さらに、組立てワークフローにおける特定のセグメントからのエラー寄与を正確に定量化し、かつ、追跡することにより、製品品質または偏差量によって製品に等級を付け、かつ、分類することができる。したがって例えば製品品質に応じて、特定の品質分類の製品を異なる製造プロセスへ導き、あるいは異なる顧客へ導くことができる。 By treating individual workers/worker stations in the assembly flow as network nodes, machine learning models are used to optimize the assembly process by minimizing errors through reduction of assembly variance at individual nodes (stations) can be optimized. By minimizing individual node (worker) variance and implementing real-time updates to mitigate forward error propagation, the system of the disclosed technology can significantly reduce manufacturing variance to the final product. can. Additionally, by accurately quantifying and tracking error contributions from specific segments in the assembly workflow, products can be graded and sorted by product quality or amount of deviation. Thus, for example, depending on product quality, products of a particular quality class can be directed to different manufacturing processes or to different customers.

機械学習/人工知能(AI)モデルを使用してエラー検出を実施することができ、および/またはステーション組立て変化を最適化するために必要な修正を実施することができる。一例として、機械学習モデルは、それらに限定されないが、最終製品定格、最終製品変化統計量、所望の最終製品特性(例えば組立て時間、使用された材料の量、物理特性、欠陥の数、等々)、ステーション特化コンポーネント定格、ステーション特化コンポーネント変化、所望のステーションコンポーネント特性を含む訓練データの複数のソースを使用して訓練することができる。さらに、展開された機械学習モデルは、エラー検出およびエラー定量化計算を実施するために使用される理想化モデルの中に正規の知識が表現され得るよう、熟練者または「マスター設計者」から提供される入力に基づいて訓練し、あるいは初期化することができる。 Error detection can be performed using machine learning/artificial intelligence (AI) models and/or corrections necessary to optimize station assembly changes can be performed. By way of example, the machine learning model may include, but is not limited to, final product ratings, final product change statistics, desired end product characteristics (e.g., assembly time, amount of materials used, physical properties, number of defects, etc.). , station-specific component ratings, station-specific component variations, and desired station component characteristics. Additionally, the deployed machine learning model is provided by an expert or "master designer" so that formal knowledge can be represented in the idealized model used to perform the error detection and error quantification calculations. It can be trained or initialized based on the input it receives.

当業者には理解されるように、機械学習に基づく分類技法は、開示される技術から偏差することなく、所望の実施態様に応じて変更することができる。例えば機械学習分類スキームは、隠れマルコフモデル、回帰型ニューラルネットワーク、畳み込みニューラルネットワーク(CNN)、強化学習、深層学習、ベイズ記号モデル、敵対的生成ネットワーク(GAN)、サポートベクターマシン、画像登録法、適用可能規則ベースシステム、および/または任意の他の適切な人工知能アルゴリズムのうちの1つまたは複数を、単独で、あるいは組み合わせて利用することができる。回帰アルゴリズムが使用される場合、それらは、それらに限定されないが、Stochastic Gradient Descent Regressorおよび/またはPassive Aggressive Regressor、等々を含むことができる。 As will be appreciated by those skilled in the art, machine learning-based classification techniques can be modified according to desired implementation without departing from the disclosed technology. For example, machine learning classification schemes include Hidden Markov Models, Recurrent Neural Networks, Convolutional Neural Networks (CNN), Reinforcement Learning, Deep Learning, Bayesian Symbolic Models, Generative Adversarial Networks (GAN), Support Vector Machines, Image Registration Methods, Applied One or more of the possible rule-based system and/or any other suitable artificial intelligence algorithms may be utilized alone or in combination. Where regression algorithms are used, they can include, but are not limited to, Stochastic Gradient Descent Regressor and/or Passive Aggressive Regressor, and the like.

機械学習分類モデルは、クラスター化アルゴリズム(例えばMini-バッチK-平均クラスター化アルゴリズム)、推奨アルゴリズム(例えばMiniwise HashingアルゴリズムまたはEuclidean Locality-Sensitive Hashing(LSH)アルゴリズム)、および/または局所外れ値因子法などの異常検出アルゴリズムに基づくことも可能である。さらに、機械学習モデルは、Mini-batch Dictionary Learningアルゴリズム、Incremental Principal Component Analysis(PCA)アルゴリズム、Latent Dirichlet Allocationアルゴリズムおよび/またはMini-バッチK-平均アルゴリズム、等々のうちの1つまたは複数などの次元削減手法を使用することも可能である。 Machine learning classification models include clustering algorithms (e.g. Mini-Batch K-Means clustering algorithm), recommendation algorithms (e.g. Miniwise Hashing algorithm or Euclidean Locality-Sensitive Hashing (LSH) algorithm), and/or local outlier factor methods. can also be based on the anomaly detection algorithm of Further, the machine learning model may be subjected to dimensionality reduction such as one or more of a Mini-batch Dictionary Learning algorithm, an Incremental Principal Component Analysis (PCA) algorithm, a Latent Dirichlet Allocation algorithm and/or a Mini-batch K-means algorithm, etc. It is also possible to use techniques.

いくつかの実施態様では、複数の異なるタイプの機械学習訓練/人工知能モデルを展開することができる。一例として、製造製品を最適化するべく、組立てラインプロセスを動的に調整するために、機械学習の一般的な形態を使用することができる。当業者には認識されるように、選択された機械化学習/人工知能モデルは、一組の組立て/製造指示を単純に含んでいるのではなく、組立てラインプロセス全体に関するフィードバック、および結果として得られる製造製品に対するその影響を提供し、また、組立てラインにおける下流側作業者ステーションに対する動的調整を提供し、それにより上流側作業者ステーションで生じる行為を補償するための方法である。このタイプの人工知能ベースフィードバックおよびフィードフォワードモデルは、本明細書においてはArtificial Intelligence Process Control(AIPC)と呼ばれている。いくつかの実施形態では、機械学習は、ターゲット化ゲート付き回帰型ユニット(GRU)モデルベース学習およびハウスドルフ距離最短化を利用して、可能回復経路の空間を効果的に探索し、それにより組立てプロセスの間にエラーを修正するための最適経路を見出す、模擬された環境における深層学習モデルに基づくことができる。さらに他の実施形態では、例えば機械学習アルゴリズムは、Long Short-Term Memoryモデルに基づくことができ、それにより組立てプロセスのビデオ入力を解析し、かつ、最終品質出力を予測することができる。さらに、機械学習モデルをNLPアルゴリズムの形態で使用して、作業者コンプライアンスおよび調整された指示の理解を最大化するために、音声へのテキストの変換またはテキストへの音声の変換などの、作業者ステーションへのフィードバックを調整することもできる。 In some implementations, multiple different types of machine learning trained/artificial intelligence models can be deployed. As an example, general forms of machine learning can be used to dynamically adjust assembly line processes to optimize manufactured products. As those skilled in the art will appreciate, the selected machine learning/artificial intelligence model does not simply contain a set of assembly/manufacturing instructions, but feedback on the entire assembly line process and the resulting A method for providing its effect on manufactured products and also for providing dynamic adjustments to downstream worker stations in an assembly line, thereby compensating for actions occurring at upstream worker stations. This type of artificial intelligence-based feedback and feedforward model is referred to herein as Artificial Intelligence Process Control (AIPC). In some embodiments, machine learning utilizes targeted gated recurrent unit (GRU) model-based learning and Hausdorff distance minimization to effectively explore a space of possible recovery paths, thereby assembling It can be based on deep learning models in simulated environments that find optimal paths to correct errors during the process. In still other embodiments, for example, a machine learning algorithm can be based on the Long Short-Term Memory model to analyze the video input of the assembly process and predict the final quality output. Additionally, machine learning models, in the form of NLP algorithms, are used to maximize worker compliance and comprehension of coordinated instructions, such as text-to-speech or speech-to-text. You can also adjust the feedback to the station.

いくつかの実施形態では、機械学習を利用する計算モデルを使用して、手動組立てプロセスの間のエラーを修正することができる。 In some embodiments, computational models that utilize machine learning can be used to correct errors during the manual assembly process.

目標対象は、処理手順によって定義される一連のステップを介して組み立てることができる。プロセスの間、公称対象の最終構成を得るためにはすべての残りの作業を改定する必要があることになる特定のステップkで不可逆エラーが生じ得る。いくつかの実施形態では、エラーを修正するための手法は、ステップkにおける欠陥のある目標対象を、同じステップkにおける公称対象に対して比較するステップ、またはステップkにおける欠陥のある目標対象をその最終構成の公称対象に対して比較するステップを含むことができる。これらの比較を使用して、欠陥のある目標対象の最終構成と公称対象の最終構成との間の偏差を最小化するために必要な上記一連のステップを決定することができる。いくつかの実施形態では、目標対象の品質メトリックを使用して、欠陥のある目標対象の修正を導くこともできる。 A target object can be assembled through a series of steps defined by a procedure. During the process, irreversible errors can occur at certain steps k that would require revision of all remaining work in order to obtain the final configuration of the nominal object. In some embodiments, the technique for correcting the error includes comparing the defective target object at step k to a nominal target at the same step k, or comparing the defective target object at step k to its A step of comparing against a nominal target of the final configuration may be included. These comparisons can be used to determine the sequence of steps required to minimize the deviation between the final configuration of the defective target object and the final configuration of the nominal object. In some embodiments, the target object quality metric can also be used to guide the correction of defective target objects.

一般的な数値手法は、ハウスドルフ距離アルゴリズムを使用することによって問題を解決することができ、それにより欠陥のある目標対象を組み立てるための一連のk個のステップが、公称対象をその最終構成に組み立てるための一連のステップに如何に類似しているかを決定することができる。欠陥のある組み立てられた対象における上記一連のk個のステップと、組み立てられた最終の公称対象における一連のステップとの間のハウスドルフ距離を計算によって最短化するためのいくつかの方法は、瞬時報酬公式化、多重報酬公式化、または遅延報酬公式化を介してMarkov Decision Process(MDP)を最適化することである。しかしながらこれらの公式化と関連する探索空間には、著しい量の計算資源が必要である。 A general numerical approach can solve the problem by using the Hausdorff distance algorithm, whereby a sequence of k steps to assemble the faulty target object transforms the nominal object into its final configuration. It can be determined how similar the sequence of steps to assembly is. Some methods for computationally minimizing the Hausdorff distance between the above sequence of k steps in the faulty assembled object and the sequence of steps in the final assembled nominal object are instantaneous Optimizing the Markov Decision Process (MDP) via reward formulation, multiple reward formulation, or delayed reward formulation. However, the search spaces associated with these formulations require a significant amount of computational resources.

代替として、機械学習フレームワークは、強化学習を使用して、遅延報酬ポリシーエージェントと共に発展させることも可能である。強化学習フレームワークは、欠陥のある目標対象のエラーを修正するために必要な適切なステップをポリシーエージェントに決定させて、公称対象の性能メトリックと一致する性能メトリックを有する最終構成を得るように設計することができる。ポリシーエージェントに与えられる報酬は遅延され、ポリシーエージェントに報酬が支払われるのは、最終ステップが実行されたときのみである。 Alternatively, machine learning frameworks can be developed with delayed reward policy agents using reinforcement learning. A reinforcement learning framework is designed to let policy agents determine the appropriate steps required to correct faulty target target errors, resulting in a final configuration that has a performance metric that matches the nominal target performance metric. can do. Rewards given to policy agents are delayed and paid to policy agents only when the final step is executed.

いくつかの実施形態では、最適な/所望の製造製品のための設計を選択することができ、また、熟練作業者を展開して、選択された設計に従って製造製品を組み立てるために個々の作業者ステーションで実施される個々のステップを実施することができる。最適とは、結果として得られる製造製品におけるエラー、または何らかの他の基準を最小化する、結果として得られる製品の所望の性能および/または特性に基づくことができる(例えば製造製品が紙飛行機である場合、最適な紙飛行機は、所望の飛行目標を達成する紙飛行機であろう)。複数の画像化デバイスを使用して、作業者のモーションおよび作業者が組み立てている製造製品との作業者の相互作用をキャプチャし、それによりビデオ、画像および/または3Dポイントクラウドデータを生成することができる。キャプチャされたデータは、組み立てられている際の製造製品に対する関係における作業者の手座標、一方の手ともう一方の手の関係、および組み立てられている際の製造製品に対する指(およびいくつかの実施形態では指の関節)の関係などの詳細な情報を提供することができる。熟練作業者から収集されたデータは、最適な/所望の製造製品を組み立てるためのグラウンドトルースとして使用することができる。単一の例からのこのグラウンドトルースは、それはそれで、初期機械学習モデルの創出に使用するためには十分であり、あるいは追加データを収集することも可能である。例えば作業者のモーションの変化またはエラーが、結果として得られる製造製品に対して如何に影響を及ぼし得るかを理解するために、多くの作業者を展開して、最適な製造製品を組み立てる1つまたは複数のステップを実施することができる。これは、組立てラインにおける作業者ステーション毎に実施することができる。結果として得られる最終製品およびそれらのそれぞれの組立てプロセスの両方を、互いに対して、また、グラウンドトルースに対して比較し、それによりエラーおよび/または作業者のモーションの変化が製造製品の特性および/または性能に如何に影響を及ぼし得るかを決定することができる(例えば作業者の速度は、品質がより劣る飛行機をもたらし得る)。実際の組立てプロセス(すなわち人間、ロボットまたは機械が1つまたは複数のステーションでモーションを実施しているプロセス)の間に、作業者に基づいて収集されたデータは、本明細書においては「実際の訓練データ」と呼ばれることになる。実際の訓練データは、模擬されたデータで補足することができ、それにより、より豊富なデータセットを得ることができ、また、最適な製造製品を達成するための追加変形形態を提供することができる。「最適な」および「所望の」という用語は、本明細書においては交換可能に使用されることになることに留意されたい。 In some embodiments, the design for the optimal/desired manufactured product can be selected and a skilled worker deployed to individual workers to assemble the manufactured product according to the selected design. Individual steps performed at the station can be implemented. Optimal can be based on the desired performance and/or characteristics of the resulting product that minimize errors in the resulting manufactured product, or some other criteria (e.g., if the manufactured product is a paper airplane). , the optimal paper airplane would be the one that achieves the desired flight goal). Using multiple imaging devices to capture worker motion and worker interaction with the manufactured product they are assembling, thereby generating video, images and/or 3D point cloud data can be done. The captured data includes the worker's hand coordinates in relation to the manufactured product as it is being assembled, the relation of one hand to the other, and the fingers (and some Detailed information such as knuckle (knuckle) relationships in embodiments may be provided. Data collected from skilled workers can be used as ground truth for assembling the optimal/desired manufactured product. This ground truth from a single example is, by itself, sufficient for use in creating initial machine learning models, or additional data can be collected. For example, deploying many workers to assemble an optimal manufactured product to understand how variations in worker motion or errors can affect the resulting manufactured product. Or multiple steps can be performed. This can be done for each worker station on the assembly line. Both the resulting final products and their respective assembly processes are compared against each other and against the ground truth so that errors and/or changes in operator motion are reflected in the characteristics of the manufactured product and/or Or it can determine how performance can be affected (eg, operator speed can result in a plane of lesser quality). Data collected on a worker basis during the actual assembly process (i.e., a process in which a human, robot, or machine is performing motions at one or more stations) is herein referred to as "actual It will be called "training data". The actual training data can be supplemented with simulated data to obtain a richer data set and to provide additional variations to achieve optimal manufactured product. can. Note that the terms "optimal" and "desired" will be used interchangeably herein.

いくつかの実施形態では、本明細書において考察されている異なるAI/機械学習/深層学習モデルは、Artificial Intelligence Process Control(AIPC)を達成して製造物品の組立てを最適化するために、以下で説明される特定の順序で展開することができる。AIPC深層学習モデルを実現することができる例示的プロセスは、図1に関連して(例えばAIPC深層学習モデル112に関連して)、また、図2に関連してさらに詳細に考察される。AIPC深層学習モデルを実現するために使用することができるハードウェアシステムおよび/またはデバイスの例は図3に提供されており、また、対応する説明も以下に提供されている。 In some embodiments, the different AI/machine learning/deep learning models discussed herein are used below to achieve Artificial Intelligence Process Control (AIPC) to optimize assembly of articles of manufacture. It can unfold in the specific order described. An exemplary process by which an AIPC deep learning model may be implemented is discussed in greater detail in connection with FIG. 1 (eg, in connection with AIPC deep learning model 112) and in connection with FIG. An example of a hardware system and/or device that can be used to implement an AIPC deep learning model is provided in FIG. 3, and a corresponding description is also provided below.

第1に、CNNを組立てラインプロセスに使用して、個々の作業者ステーションにおいて、作業者の手の特徴および異なる構成の製造物品の特徴を分類することができる。 First, CNNs can be used in assembly line processes to classify the characteristics of workers' hands and different configurations of manufactured articles at individual worker stations.

第2に、いずれもCNN分類からの所望の結果を達成するために、また、定義済みの望ましい結果のために、強化学習(RL)およびRLエージェントを使用し、かつ、報酬を与えることができる。RLエージェントは、監視しても、あるいは監視しなくてもよい。 Second, both Reinforcement Learning (RL) and RL agents can be used and rewarded to achieve desired results from CNN classification and for defined desired results. . The RL agent may or may not monitor.

第3に、Generative Adversarial Networks(GAN)を使用して、対立するRLエージェント間で選ぶことができる。GANは、ノードとしてGANに入力するRLエージェントの選択を人間にのみ頼る最小の人間監視を含むことができる。 Third, Generative Adversarial Networks (GAN) can be used to choose between competing RL agents. A GAN can include minimal human oversight, relying only on humans to select RL agents that enter the GAN as nodes.

第4に、RNNは、フィードバックおよびフィードフォワードシステムを作り出すための入力ノードとして勝利RL(winning RLs)を取ることができ、したがって学習を連続的なものにすることができ、また、学習を監視しなくてもよい。 Fourth, RNNs can take winning RLs as input nodes to create feedback and feedforward systems, thus making learning continuous and monitoring learning. It doesn't have to be.

これらの4つのAI/機械学習モデルの実施態様は、以下でより詳細に考察される。 Implementations of these four AI/machine learning models are discussed in more detail below.

いくつかの実施形態では、実際の訓練データは、組立てプロセスにおける関連するデータを分類し、例えば作業者ステーション毎の個々の組立てステップで使用された指/手、組み立てられている製品のうちの、作業者の指が任意の時間点および空間で触れた部分、および任意の時間点および空間における、組み立てられている製造製品の形状または構成を分類するためにCNNに入力することができる。 In some embodiments, the actual training data classifies relevant data in the assembly process, e.g., fingers/hands used in individual assembly steps per worker station, of the product being assembled, The part touched by the operator's finger at any point in time and space, and the shape or configuration of the manufactured product being assembled at any point in time and space, can be input into the CNN to classify.

さらに他の実施形態では、手のモーションは追跡しないが、製造製品の組立てパターンの様々な変化を表すデータを収集することも可能である(例えば製造製品が折り畳まれた紙飛行機である場合、折畳み順序を変更すること、折畳み変化を実現すること、および/または潜在的エラーを導入することに基づいてデータを収集することができ、製造製品が衣類物品である場合、例えば縫合せ順序、縫合せ変化を実現すること、および/または潜在的エラーを導入することに基づいてデータを収集することができる)。このデータは模擬することができ、および/または実際の訓練データから収集することができる。結果として得られる製造製品およびそれらのそれぞれの組立てプロセスを比較し、それによりエラーまたは組立てパターンの変化が製造製品の特性および/または性能に如何に影響を及ぼすかを決定することができる。 In still other embodiments, hand motions are not tracked, but data representing various changes in the assembly pattern of the manufactured product may be collected (e.g., if the manufactured product is a folded paper airplane, folding Data can be collected based on changing the order, implementing folding changes, and/or introducing potential errors, and if the manufactured product is a clothing article, e.g. Data may be collected based on implementing changes and/or introducing potential errors). This data can be simulated and/or gathered from actual training data. The resulting manufactured products and their respective assembly processes can be compared to determine how errors or changes in assembly patterns affect the characteristics and/or performance of the manufactured products.

いくつかの実施形態では、キャプチャされたデータ(例えばビデオおよび組立てプロセスの手の追跡、等々)を使用して、最終アウトプットの品質が予測される。この品質予測により、キャプチャされたデータを使用して、製造プロセスの間、製品の品質を手動で検査する必要なく、製品を品質ビンに分類することができ、また、下流側で修正行為を取ることができる。 In some embodiments, captured data (eg, video and hand tracking of the assembly process, etc.) is used to predict final output quality. This quality prediction allows the captured data to be used during the manufacturing process to classify products into quality bins without the need to manually inspect product quality and to take corrective action downstream. be able to.

いくつかの実施形態では、システムは、目標対象の手動組立てに的を絞ることができ、手動組立てでは、組立てプロセスは、作業者が一組の指示毎に目標対象に対して異なる作業を実施するいくつかの離散ステップを含む。システムは、作業者の手の位置の時間シリーズと目標対象の最終品質との間の相関を確立する深層学習モデルを使用している機械学習フレームワーク(すべての作業者行為全体)を使用して構築することができる。いくつかの実施形態では、モデルは2つのニューラルネットワークからなっていてもよく、第1のニューラルネットワークは、3D環境における作業者の手の位置データを抽出するために使用され、また、第2のニューラルネットワークは、手の位置データから不必要な要素を取り除いて目標対象の性能の最終品質と相関させるために使用される。 In some embodiments, the system can focus on manual assembly of a target object, where the assembly process involves a worker performing different tasks on the target object for each set of instructions. Contains several discrete steps. The system uses a machine learning framework (across all worker actions) that uses deep learning models to establish correlations between the time series of worker hand positions and the final quality of the target object. can be built. In some embodiments, the model may consist of two neural networks, a first neural network used to extract the position data of the worker's hand in the 3D environment, and a second neural network A neural network is used to remove unnecessary elements from the hand position data and correlate it with the final quality of performance of the target object.

いくつかの実施形態では、第1のニューラルネットワークは、ビデオ収集システムを使用して、作業者が目標対象の組立てと関連して実施する個々の離散ステップに対応する異なるノードビデオにおける組立てプロセスの間、作業者の手のビデオを記録することができる。例えば作業者は、異なる場所に配置され、また、組立てプロセスを同時に記録するように構成されたいくつかのカメラを使用して組立てプロセスを実施することができる。これらのカメラを使用して、作業者の手の予め規定された位置で、複数回にわたってビデオをキャプチャすることができる。次に、これらのビデオを処理して、目標対象の組立てプロセス全体を表すいくつかの画像またはランドマークフレームを抽出することができる。これらのランドマークフレームを使用して、組立てプロセスの間、作業者の手および指の位置またはキーポイントの画定を促進する手の追跡情報を抽出することができる。 In some embodiments, the first neural network uses the video acquisition system to generate images during the assembly process in different node videos corresponding to individual discrete steps that the worker performs in connection with the assembly of the target object. , a video of the worker's hand can be recorded. For example, a worker may carry out an assembly process using several cameras positioned at different locations and configured to simultaneously record the assembly process. These cameras can be used to capture video multiple times at predefined positions of the worker's hand. These videos can then be processed to extract a number of images or landmark frames representing the overall target object assembly process. These landmark frames can be used to extract hand tracking information that facilitates defining the positions or key points of the worker's hands and fingers during the assembly process.

いくつかの実施形態では、手の追跡情報を抽出するために、バウンディングボックス予測アルゴリズムおよび手キーポイントディテクターアルゴリズムを適用することができる。詳細には、バウンディングボックス予測アルゴリズムは、閾値画像分割を使用して、組立てプロセスからのランドマークフレームを処理し、それにより作業者の手のためのマスク画像を得ることを含むことができる。手は、ブロブ検出(blob detection)を使用してマスクの上に位置付けることができる。バウンディングボックス予測は、マスク画像を使用して、ボックスが少なくとも手のリストポイントまでの手の位置の形状の最も高い点を含むよう、作業者の手の各々の周りにボックスを形成する。次に、バウンディングボックスおよびそれらの対応するランドマークフレームが手キーポイントディテクターアルゴリズムに供給される。 In some embodiments, a bounding box prediction algorithm and a hand keypoint detector algorithm can be applied to extract hand tracking information. Specifically, the bounding box prediction algorithm may involve using threshold image segmentation to process the landmark frames from the assembly process, thereby obtaining a mask image for the worker's hand. The hand can be positioned over the mask using blob detection. Bounding box prediction uses the mask image to form a box around each of the worker's hands such that the box contains the highest point of the hand position shape at least up to the hand list point. The bounding boxes and their corresponding landmark frames are then fed to the hand keypoint detector algorithm.

手キーポイントディテクターアルゴリズムは、作業者の手の特定のキーポイントを検出することができる機械学習モデルを含むことができる。手キーポイントディテクターアルゴリズムは、ランドマークフレームの中で見ることができるキーポイントだけでなく、関節、視点、対象、手の相互作用のためにフレームから閉塞されるキーポイントを予測することができる。異なる手の位置が異なる閉塞点を異なるフレームに生成するため、あるフレームにおける特定の閉塞点は、他のフレームでは閉塞され得ない。手キーポイントディテクターは、特定のレベルの確実性で閉塞されるキーポイントの場所を予測する。しかしながら閉塞されるキーポイントの場所の予測は、異なる手の位置に対して同じキーポイント場所が記録されることになり得る。手動組立てプロセスのステップの間、作業者の手を画定している手キーポイントは、次に第2のニューラルネットワークに提供される。 A hand keypoint detector algorithm can include a machine learning model that can detect specific keypoints on a worker's hand. The hand keypoint detector algorithm can predict not only keypoints that are visible in the landmark frame, but also keypoints that are occluded from the frame due to joint, viewpoint, object, and hand interactions. A particular occlusion point in one frame cannot be occluded in another frame because different hand positions produce different occlusion points in different frames. A hand keypoint detector predicts the location of occluded keypoints with a certain level of certainty. However, prediction of occluded keypoint locations may result in the same keypoint locations being recorded for different hand positions. During the steps of the manual assembly process, the hand keypoints defining the worker's hand are then provided to a second neural network.

いくつかの実施形態では、第2のニューラルネットワークを使用して、組み立てられた対象の最終状態の品質が予測される。いくつかの実施形態では、ニューラルネットワークは、Long Short-Term Memory(LSTM)モデルに基づくことができる。LSTMは、順番に配列され、相俟って最終対象の組立てプロセス全体を表すいくつかのセルを有している。LSTMセルへの入力は、LSTMセルによって表される組立てプロセスの特定のステップにおける作業者の作業に対応する手キーポイントデータであってもよい。LSTMにおける個々のセルは、先行するセルからの情報を記憶するべきであるかどうかを決定し、更新する値を選び、セルに対する更新を実施し、出力する値を選び、次に、選ばれた値のみをセルが出力するよう、値をフィルタリングする。LSTMは、Adamオプティマイザーまたは他の適合学習率最適化アルゴリズムを使用して訓練された、1つのモデルに対するシーケンスであってもよい。ニューラルネットワークは、LSTMフレームワークを使用して、手動組立てプロセスから抽出された入力データを相関し、それにより最終製品の品質測値を決定する。 In some embodiments, a second neural network is used to predict the quality of the final state of the assembled object. In some embodiments, the neural network can be based on the Long Short-Term Memory (LSTM) model. The LSTM has several cells that are arranged in sequence and together represent the overall assembly process of the final object. The input to the LSTM cell may be hand keypoint data corresponding to a worker's work in the particular step of the assembly process represented by the LSTM cell. Each cell in the LSTM decides whether to store information from the preceding cell, chooses a value to update, performs an update to the cell, chooses a value to output, and then chooses Filter values so that cells only output values. A LSTM may be a sequence for one model trained using the Adam optimizer or other adaptive learning rate optimization algorithms. The neural network uses the LSTM framework to correlate input data extracted from the manual assembly process, thereby determining quality measurements of the final product.

いくつかの実施形態では、目標対象のための組立てプロセスを表すビデオおよび手追跡情報、すなわちモデルを訓練するために使用される入力データは、単一の一組の組立て指示を使用して複数の目標対象を組み立てるための組立てプロセスを実施する複数の作業者から収集することができる。作業者によって組み立てられた目標対象を制御された環境で使用して、組み立てられた対象の性能に対する対応する品質測値、すなわちモデルを訓練するために必要な出力データを収集することができる。 In some embodiments, the video and hand-tracking information representing the building process for the target object, i.e. the input data used to train the model, are generated from multiple models using a single set of building instructions. It can be collected from multiple workers performing an assembly process for assembling the target object. A target object assembled by a worker can be used in a controlled environment to collect corresponding quality measures for the performance of the assembled object, i.e. the output data required to train the model.

いくつかの態様では、機械学習モデルを生成するために使用される訓練データは、模擬されたデータからのもの、実際の訓練データからのもの、および/または熟練者のグラウンドトルース記録からのものであってもよく、それらは、組み合わせたものであっても、あるいは個別であってもよい。いくつかの実施形態では、模擬されたデータ結果を使用して機械学習モデル、例えば(それには限定されないが)Reinforcement Learning(RL)エージェントを構築することができる。他の実施形態では、実際の訓練データを使用して機械学習モデル、例えば(それには限定されないが)Reinforcement Learning(RL)エージェントを構築することができる。RLエージェントは、良好な/所望の結果を達成すると報酬が支払われ、また、悪い結果に対しては処罰される。 In some aspects, the training data used to generate the machine learning model is from simulated data, from actual training data, and/or from expert ground truth recordings. There may be, and they may be combined or separate. In some embodiments, simulated data results can be used to build machine learning models, such as (but not limited to) Reinforcement Learning (RL) agents. In other embodiments, the actual training data may be used to build machine learning models, such as (but not limited to) Reinforcement Learning (RL) agents. RL agents are rewarded for achieving good/desired results and penalized for bad results.

いくつかの実例では、多くのRLエージェント(そのうちのいくつかは実際の訓練データに基づき、また、いくつかは模擬されたデータに基づく)は、縦列をなして働くように展開することができ、また、累積授与を最大化するように構成することができ、例えば理想モデル/例からの最も小さい偏差を有する製造製品を組み立てる。RLエージェントに報酬を支払うことができる例示的結果は、可能な限り少ないステップで完全な製造製品を完成すること、製造製品を達成するために必要な材料の量または時間を低減することを含む。模擬されたデータに基づくRLエージェントおよび実際の訓練データに基づくRLエージェントを使用して、最適な/所望の製造物品をもたらす最適モーションパターンおよび/または最適組立てパターンを決定することができる。 In some instances, many RL agents, some based on real training data and some based on simulated data, can be deployed to work in tandem, It can also be configured to maximize the cumulative award, e.g. build the manufactured product with the smallest deviation from the ideal model/example. Exemplary outcomes that may reward the RL agent include completing a complete manufactured product in as few steps as possible, reducing the amount of materials or time required to achieve the manufactured product. RL agents based on simulated data and RL agents based on actual training data can be used to determine optimal motion patterns and/or optimal assembly patterns that result in optimal/desired manufactured articles.

これらの2つのグループのRLエージェント(例えば実際の訓練データに基づいて作り出されたRLエージェント、および模擬されたデータに基づいて作り出されたRLエージェント)は、それらはいずれも最適な/所望の製造製品を作る行為に対して報酬が支払われているため、ここでは共同して働くことができ、さらには競合することができる。いくつかの実施形態では、最適な製造製品のための最適な組立てパターンをもたらした模擬ベースのRLエージェントから得られたデータを使用して、実際の訓練データセットのための可能性空間を小さくすることができる。例えば模擬されたRLエージェントを使用して最適な組立てパターンを決定することができ、次に、最適ではない組立てパターンに対してではなく、最適な組立てパターンに対してのみ実際の訓練データを収集することができる。実際の訓練データの収集にのみ、あるいは最適な組立てパターンにのみ的を絞ることにより、より少ない訓練データを収集することができ、および/またはより多くの実際の訓練データを収集するためのより大きい容量を達成することができるが、それは最適な組立てパターンに対してのみである。 These two groups of RL agents (e.g., RL agents created based on real training data, and RL agents created based on simulated data) are both optimal/desired manufactured products. You can work together and even compete here because you are paid for the act of creating In some embodiments, data obtained from simulated-based RL agents that yielded optimal assembly patterns for optimal manufactured products are used to reduce the probability space for the actual training dataset. be able to. For example, a simulated RL agent can be used to determine the optimal assembly pattern, then collect actual training data only for the optimal assembly pattern, not for the non-optimal assembly pattern. be able to. By focusing only on the collection of actual training data, or only on the optimal assembly pattern, less training data can be collected and/or a larger training data can be collected to collect more actual training data. Capacity can be achieved, but only for optimal assembly patterns.

報酬は時によっては対立することがあるため、強化学習のみに頼って組立てラインを最適化することには限界がある。例えば製品の組立てにおいては、偽りの動き(例えば折畳んで、直ちにその折畳みを元に戻す、あるいは縫い目を追加して、直ちにその縫い目を取り除く)が最も少ない場合に対して、いくつかのRLエージェントに報酬を支払うことができ、一方、速度に対して、他のRLエージェントに報酬を支払うことができる。速度に対して報酬が支払われているRLエージェントは、組立てプロセスにおける下流側で必要な修正がより少ないため、より多くの偽りの動きがより速い組立て時間をもたらすことを決定することができる。このような実施態様トレードオフ決定をなすことは、人間が容易に判断することができるようなものではない。経験および大量の例を有している場合であっても、人間には、異なる方法で作業する異なる作業者による最終結果を把握することは如何に微妙なものであるかを理解する計算能力が依然として欠けている。 Relying solely on reinforcement learning to optimize assembly lines is limited because rewards can sometimes be conflicting. For example, in product assembly, for the least amount of spurious motion (e.g., folding and immediately unfolding, or adding a seam and immediately removing the seam), several RL agents , while other RL agents can be rewarded for speed. An RL agent that is paid for speed can determine that more spurious movements result in faster assembly times because fewer modifications are required downstream in the assembly process. Making such implementation trade-off decisions is not something that can be readily determined by a human being. Even with experience and a large number of examples, humans lack the computational power to understand how subtle it is to perceive the end result of different workers working in different ways. still lacking.

これらの対立するRLエージェント最適化を解決するために、GANを展開して決定者として作用させることができる。対立は、実際の訓練データに基づくRLエージェント同士の間、模擬されたデータに基づくRLエージェント同士の間、および/または実際の訓練データに基づくRLエージェントと模擬されたデータに基づくRLエージェントとの間であってもよい。 To resolve these conflicting RL agent optimizations, GANs can be deployed to act as decision makers. Conflicts may arise between RL agents based on actual training data, between RL agents based on simulated data, and/or between RL agents based on actual training data and RL agents based on simulated data. may be

いくつかの実施形態では、GANは、さらに多くの頑丈なニューラルネットワークを作り出すために、RLエージェントの各々を試験し、かつ、その結果を記憶することができる。GANは、RLエージェントを取り、また、ゼロ-サムゲームにおける勝者および敗者をもたらすモデルを使用することによって動作する。GANには「ジェネレータ」および「ディスクリミネータ」が存在している。ジェネレータは、この場合、対立するRLエージェントからの報酬データを記憶することになり、また、ディスクリミネータは、これらのうちのどちらが所望の製造製品を作り出すタスクに対して最も関連しているかを評価することになる。GANは、ノード(またはニューロン)の深層ネットワークを使用して、ノードに重みを付ける方法を決定する。個々のRLエージェントは、個々のRLエージェントが既に最適決定を下していることを信じているため、対立しているRLエージェントのうちのどちらが実際に最も関連する選択をなすかを決定することはGANの役割であり、また、ディスクリミネータは、それに応じて重みを調整する。対立するRLエージェント同士の間でゼロ-サムゲームが開始されると、対立するRLエージェント同士の間で勝者のグループが生成され、これらの勝者のみが、組立てラインにおけるワークフローを最適化するために使用される機械学習モデルのために使用されることになる。勝利RLエージェントを決定するために大量のデータが生成されることになる可能性があるが、結果は、入力ノードとして使用される、これらの勝者を作り出し、かつ、見出すために使用されるものよりもはるかに貧弱である。 In some embodiments, the GAN can test each of the RL agents and store the results to create more robust neural networks. GANs operate by taking RL agents and using models that yield winners and losers in zero-sum games. There are "generators" and "discriminators" in GANs. The generator would in this case store reward data from opposing RL agents, and the discriminator would evaluate which of these was most relevant to the task of creating the desired manufactured product. will do. A GAN uses a deep network of nodes (or neurons) to determine how to weight nodes. Since each RL agent believes that each RL agent has already made the optimal decision, it is impossible to determine which of the conflicting RL agents actually makes the most relevant choice. It is the role of the GAN and the discriminator adjusts the weights accordingly. When a zero-sum game is initiated between opposing RL agents, groups of winners are generated among the opposing RL agents, and only those winners are used to optimize workflow on the assembly line. will be used for machine learning models that are Although a large amount of data can be generated to determine the winning RL agent, the results are more than those used to create and find those winners used as input nodes. is also much poorer.

GAN戦争に生き残り、かつ、適切に報酬が支払われたRLエージェントが決定されると、いくつかの実施形態では、それらをRecurrent Neural Network(RNN)と呼ばれる別のAIシステムに入力することができる。RNNは、それがDeep Learning Neural Networkであり、入力データの様々な形態の重み付けを介して最終結果が最適化される点で、CNNに対して多くの類似性を有している。1つの相違は、入力から出力まで線形プロセスであるCNNとは異なり、RNNは、結果として得られる出力、さらには内部ノードを新しい訓練情報としてフィードバックするループであることである。RNNは、GRUなどのフィードバックシステムおよびフィードフォワードシステムの両方である。 Once the RL agents that survived the GAN war and were appropriately paid are determined, they can be input into another AI system called the Recurrent Neural Network (RNN) in some embodiments. RNN has many similarities to CNN in that it is a Deep Learning Neural Network and the final result is optimized through various forms of weighting of the input data. One difference is that unlike CNNs, which are linear processes from input to output, RNNs are loops that feed back the resulting output, as well as internal nodes, as new training information. RNNs are both feedback and feedforward systems such as GRUs.

いくつかの実施形態では、機械学習フレームワークは、ターゲット化GRUモデル-ベース学習を利用して構築することができる。GRUモデルは、その予測能力および比較的短い訓練時間のため、強化学習の代わりに選ぶことができる。GRUは、メモリに記憶するべき、あるいは状態を更新するべき観察と、忘れ去るべき、あるいは状態をリセットするべき観察との間を区別するためにRNNに使用される。 In some embodiments, a machine learning framework can be built utilizing targeted GRU model-based learning. The GRU model can be chosen instead of reinforcement learning because of its predictive power and relatively short training time. The GRU is used by the RNN to distinguish between observations that should be stored in memory or update state and observations that should be forgotten or reset state.

いくつかの実施形態では、GRUモデルは、目標対象を構築するために必要な組立てステップの数に対応するいくつかのGRUセルから構成することができる。組立てステップの数のうちの1つを表す個々のGRUセルは、いくつかの入力パラメータおよび隠れ状態出力を有することができる。組立てプロセスにおける最終ステップを表すGRUセルは、目標対象を出力することになる。モデルの出力は、公称対象からの目標対象の偏差である。この偏差は、目標対象から公称対象までのステップ方式ハウスドルフ距離、および公称対象の最終構成の性能メトリックを使用して計算することができる。個々のGRUセルは、リセット、更新および新しいゲートによって画定される。GRUニューラルネットワークは反復して訓練され、それによりGRUニューラルネットワークを特定の副題の解決に向かってバイアスさせ、また、GRUのための一組の重みを識別する。例えば反復毎に、後続するステップにおける組立てプロセスを完了するためにいくつかの予測(特定のステップにおける可能なエラー毎に1つの予測)が生成される。さらに、修正された組立てプロセスの対応する予測された距離測度を生成することができる。これらの予測された組立てプロセス完了は、仮想表現システム、および「グラウンドトルース」距離測度を得るために計算されたそれらのステップ方式ハウスドルフ距離の中で描写することができる。「グラウンドトルース」と予測された距離測度の差を計算してモデルにフィードバックすることができ、そのネットワーク重みは、次の反復を生成する後方伝搬を介して調整される。このプロセスは、GRUのための上記一組の重みが識別されるまで継続することができる。いくつかの実施形態では、確率的勾配降下法(stochastic gradient descent method)を使用して、欠陥のある目標対象を修正し、また、満足すべき最終構成を得るために必要なステップを引き出すことができる。 In some embodiments, a GRU model can consist of a number of GRU cells corresponding to the number of assembly steps required to build the target object. Each GRU cell representing one of the number of assembly steps can have several input parameters and hidden state outputs. The GRU cell, which represents the final step in the assembly process, will output the target object. The output of the model is the deviation of the target target from the nominal target. This deviation can be calculated using the stepped Hausdorff distance from the target object to the nominal object and the performance metric of the final configuration of the nominal object. Individual GRU cells are defined by reset, update and new gates. The GRU neural network is iteratively trained, thereby biasing the GRU neural network toward solving a particular sub-problem, and identifying a set of weights for the GRU. For example, in each iteration several predictions (one prediction for each possible error in a particular step) are generated to complete the assembly process in subsequent steps. Additionally, a corresponding predicted distance measure for the modified assembly process can be generated. These predicted assembly process completions can be depicted in a virtual representation system and their stepwise Hausdorff distances calculated to obtain a "ground truth" distance measure. The difference between the "ground truth" and the predicted distance measure can be computed and fed back into the model, whose network weights are adjusted via backpropagation to produce the next iteration. This process can continue until the set of weights for the GRU is identified. In some embodiments, a stochastic gradient descent method can be used to correct the defective target and derive the steps necessary to obtain a satisfactory final configuration. can.

いくつかの実施形態では、処理中の目標対象のパラメータコンピュータ支援設計および製図(CAD)モデルなどのシミュレーションを生成して、機械学習モデルを開発し、かつ、検証することができる。CADシステムは、処理中の目標対象の現在の状態に対応する局所座標フレーム、および個々の組立てステップを表す入力パラメータを使用することができる。処理中の目標対象の局所座標フレームおよび入力パラメータを使用することにより、CADシステムは、組立てステップ毎に寸法情報を決定することができる。CADシステムは、次に、個々のステップにおける出力の構成を表す三次元CADモデルを生成することができる。CADシステムは、組立てプロセスにおけるすべてのステップが実行されるまでこのプロセスを継続することができ、また、組み立てられた対象の最終構成のCADモデルを出力することができる。CADシステムに様々な入力パラメータを提供することにより、異なる構成のCADモデルを生成することができる。長さまたは幅などの特定の範囲の入力基準を有する一組のCADモデルを得るために、この入力基準の統計的なサンプルをCADシステムに提供して、上記一組のCADモデルを生成することができる。 In some embodiments, a simulation, such as a parametric computer-aided design and drafting (CAD) model of the target object in process, can be generated to develop and validate the machine learning model. A CAD system can use a local coordinate frame corresponding to the current state of the target object being processed, and input parameters representing individual assembly steps. Using the local coordinate frame of the target object under processing and the input parameters, the CAD system can determine dimensional information for each assembly step. A CAD system can then generate a three-dimensional CAD model that represents the configuration of the outputs at the individual steps. The CAD system can continue the process until all steps in the assembly process have been performed and output a CAD model of the final configuration of the assembled object. By providing various input parameters to the CAD system, CAD models of different configurations can be generated. To obtain a set of CAD models having a specified range of input criteria, such as length or width, to provide a statistical sample of this input criteria to a CAD system to generate the set of CAD models. can be done.

CADモデルは、可変レベルの詳細および知的要素であってもよいが、訓練されたモデルおよびシステムは、とりわけより低い詳細CADシステムと共に動作するように設計され、それにより非計算的に高価な方法における膨大な数の例を生成することができ、また、訓練されたモデルおよびプロファイリングのための十分な表面形態学詳細を提供することができる。いくつかの実施形態では、参照されるCADシステムは、Finite Element Analysis(FEA)または基本表面モデル化ツールと対にすることができ、それにより表面の構造解析を生成することができる。このデータは、モデル訓練および解析のための追加品質スコアとして使用することができる。 CAD models may be of varying levels of detail and intelligence, but trained models and systems are specifically designed to work with lower detail CAD systems, thereby making them a non-computationally expensive method. can generate a vast number of examples in , and provide sufficient surface morphology detail for trained models and profiling. In some embodiments, the referenced CAD system can be paired with Finite Element Analysis (FEA) or basic surface modeling tools to generate a structural analysis of the surface. This data can be used as an additional quality score for model training and analysis.

いくつかの実施形態では、CADシステムは、モデルからの例の要求に応じて、あるいは追加探究データの必要に応じて追加表面モデルを生成することができるよう、モデル訓練に組み込むことができる。この手法は物理的観察と対であり、空間の膨大な量の物理的サンプルを必要とすることなく、予め訓練されたモデルを展開することができる。 In some embodiments, the CAD system can be incorporated into model training so that additional surface models can be generated as required for examples from the model or as needed for additional exploration data. This approach is coupled with physical observation and allows pre-trained models to be developed without the need for a vast amount of physical samples in space.

いくつかの実施形態では、組み立てられた対象の最終構成のCADモデルをシミュレーションに使用して性能メトリックを生成することができる。組み立てられた対象の最終構成のCADモデルを使用することにより、シミュレーションは、数値および計算方法を利用して性能メトリックを生成することができる。 In some embodiments, a CAD model of the final configuration of the assembled object may be used for simulation to generate performance metrics. By using a CAD model of the final configuration of the assembled object, the simulation can utilize numerical and computational methods to generate performance metrics.

Artificial Intelligence Process Control(AIPC)のリアルワールドアプリケーションは、組立てラインにおける、既に自分のタスクを完了した作業者へのフィードバックの提供(例えばビデオ指示を自動的に修正することによって)、ならびに組立てラインにおける下流側の、未だ自分のタスクを完了していない作業者への指示の提供(これも例えばビデオ指示を自動的に修正することによって)を含む(「フィードフォワード」)。このフィードバック-フィードフォワードシステム、すなわちAIPCは、本明細書において説明されているAI手法を、いくつかの実施形態では、本明細書において説明されている特定の順序で使用して達成することができ、したがって組立てライン上の作業者は、追加人間監視を必要とすることなく、結果として得られる製造製品を最適化する選択をなすことができる。 The real-world application of Artificial Intelligence Process Control (AIPC) is to provide feedback (e.g., by automatically correcting video instructions) to workers on the assembly line who have already completed their tasks, as well as to provide feedback downstream on the assembly line. side, providing instructions to workers who have not yet completed their tasks (again, eg, by automatically modifying video instructions) (“feedforward”). This feedback-feedforward system, or AIPC, can be achieved using the AI techniques described herein, in some embodiments in the specific order described herein. Thus, workers on the assembly line can make choices that optimize the resulting manufactured product without the need for additional human oversight.

いくつかの実施形態では、これは、単にRNNへの上記システムの圧縮、および1つまたは複数の製造製品を作り出すプロセスの間、成功または失敗の2つの方法におけるあらゆる動きの観察を含む。個々の動きは訓練として働く。RNNの出力ノードが最適ではない場合、ネットワークは、異なる選択をなすよう、組立てラインにおける実際の個人にフィードバックすることができ、また、RNNの多くのノードおよび層を通る経路では、重みは、重み付けし直すことができ、また、出力には、成功または失敗のいずれかのラベルが振られることになる。プロセスが反復すると、重みは、自身でその精度を改善する。さらに、ネットワークは、組立てを実施する個人が働いていない場合であっても、何が働いていて、何が働いていないかを学習することができる。これは、訓練セットを増加させる。また、それは、組立てプロセスの異なる段階における調整の実施を許容する。いくつかの事例では、任意の所与の瞬間に、特定の特性を有する製造物品を製造する最良の方法は、開始点に戻ることではなく、プロセスの進行に応じて指示を調整することであることが見出され得る。この場合、RNNは、最適な製造製品のために常に最適化しており、また、生産ラインの作業者ステーションにおける、既に自分のタスクを実施した個々の作業者にフィードバックを提供し、また、生産ラインの作業者ステーションにおける、未だ自分のタスクを実施していない作業者に情報をフィードフォワードするべく学習する。 In some embodiments, this simply involves compressing the system into an RNN and observing any movement during the process of creating one or more manufactured products, in two ways, success or failure. Individual movements work as training. If the RNN's output node is not optimal, the network can feed back to the actual individual on the assembly line to make a different choice, and in the path through many nodes and layers of the RNN, the weights can be redone and the output will be labeled as either success or failure. As the process iterates, the weights improve their accuracy on their own. Additionally, the network can learn what is working and what is not working, even if the individual performing the assembly is not working. This increases the training set. It also allows adjustments to be made at different stages of the assembly process. In some instances, the best way to produce an article of manufacture with specific properties at any given moment is not to return to the starting point, but to adjust the instructions as the process progresses. can be found. In this case, the RNN is constantly optimizing for the best manufactured product and also provides feedback to individual workers at worker stations on the production line who have already performed their tasks and also learn to feed forward information to workers at worker stations who have not yet performed their tasks.

図1は、開示される技術のいくつかの態様による、生産ライン展開を実現するための例示的プロセス100のフローチャートを概念的に図解したものである。図1のプロセスはステップ102で開始され、生産展開が開始される。例示的生産ラインのワークフローは、典型的には、ワークピース(製品)が組み立てられ、あるいは製造される複数の作業者ステーション(ノード)を含む。先行するノードにおける作業が完了した後にのみ、個々の後続するノードの作業が開始されるよう、様々なノードを逐次方式で編成することができる。 FIG. 1 conceptually illustrates a flowchart of an exemplary process 100 for implementing production line deployment, in accordance with some aspects of the disclosed technology. The process of FIG. 1 begins at step 102 to initiate production deployment. An exemplary production line workflow typically includes multiple worker stations (nodes) at which workpieces (products) are assembled or manufactured. The various nodes can be organized in a sequential fashion such that work on each subsequent node begins only after work on the preceding node is completed.

ステップ104で、1つまたは複数の参照ビデオが生成され、および/または更新される。上で説明したビデオを使用して、特定のノード(本明細書においては作業者ステーションとも呼ばれる)に製造/組立て指示を提供することができる。すなわちワークフローにおける個々のノードは、その特定のノードに対応する製造ワークフローにおけるステップを完了する方法の手引きを引き渡す参照ビデオを備えることができる。 At step 104, one or more reference videos are generated and/or updated. The videos described above can be used to provide manufacturing/assembly instructions to specific nodes (also referred to herein as worker stations). That is, each node in the workflow can have a reference video that delivers guidance on how to complete the step in the manufacturing workflow that corresponds to that particular node.

ステップ106で、ステップ104で生成されたビデオの各々がそれぞれのステーション/ノードに展開される。一例として、所与のワークフローは10個のノードを含むことができ、その各々は、それぞれの異なる/独自の参照ビデオを有している。他の実施態様では、ビデオの数は、ノードの総数より少なくてもよい。実施態様に応じて、様々なステーション/ノードに展開される参照ビデオは固有であってもよく、あるいは同様の手引き/指示を提供することができる。以下でさらに詳細に考察されるように、参照ビデオの内容は動的であってもよく、また、常に更新/増補することができる。 At step 106, each of the videos generated at step 104 is deployed to respective stations/nodes. As an example, a given workflow may contain 10 nodes, each with their own different/unique reference video. In other implementations, the number of videos may be less than the total number of nodes. Depending on the implementation, the reference videos deployed to various stations/nodes may be unique or may provide similar guidance/instructions. As discussed in more detail below, the content of the reference video may be dynamic and constantly updated/augmented.

ステップ108で、モーションの連続記録が個々のステーション/ノードでキャプチャされる。モーション記録から得られるモーションデータは、ワークフローにおけるそれらのノード/ステーションにおけるワークピース/コンポーネント/ツールとの作業者の相互作用を記述することができる。すなわち個々のノードでキャプチャされるモーションデータは、製品組立てまたは製造の特定の部分に対応する1つまたは複数の作業者行為を表すことができ、また、そのノードと関連する参照ビデオによって提供される指示に対応し得る。いくつかの実例では、モーションキャプチャは、ビデオデータのキャプチャ、すなわちそのステーションにおける作業者の行為のすべてまたは一部の記録を含むことができる。他の実施形態では、モーションキャプチャは、例えば3Dポイントクラウドの記録を含むことができ、モーションは、画像キャプチャデバイスの視野における1つまたは複数の特定のポイントに対して記録される。作業者の行為ならびにコンポーネントの属性(例えばコンポーネント品質、引張り強さ、欠陥の数)の両方を、ワークフローにおける個々のノード/ステーションでキャプチャすることができる。 At step 108, continuous recordings of motion are captured at individual stations/nodes. Motion data obtained from motion recordings can describe worker interactions with workpieces/components/tools at those nodes/stations in the workflow. That is, the motion data captured at an individual node can represent one or more worker actions corresponding to a particular portion of product assembly or manufacturing, and is provided by the reference video associated with that node. Able to respond to instructions. In some instances, motion capture may include capturing video data, ie, recording all or part of the worker's actions at the station. In other embodiments, motion capture can include, for example, recording a 3D point cloud, where motion is recorded for one or more specific points in the field of view of the image capture device. Both worker actions as well as component attributes (eg, component quality, tensile strength, number of defects) can be captured at individual nodes/stations in the workflow.

ステップ110で、プロセス方法解析偏差を計算することができ、ステップ108におけるステーションのうちの1つまたは複数に対してキャプチャされたモーションデータを解析して、例えば対応するステーションの理想化されたモーションプロファイルを含む(または表す)比較モデルからのあらゆる偏差を識別することができる。図1に図解されているように、ステップ110は、例えば比較モデルからのモーション偏差を識別/分類し、かつ、組立てまたは製造プロセスが影響を及ぼされ得た程度に関する推測を実施するように構成することができるAIPC深層学習モデルを利用することができる(ステップ112)。比較は、ステーションレベル毎に、および/または総合プロセスレベルで実施することができる。また、解析は、個々のステーションにおけるコンポーネントの属性、またはベースラインからのコンポーネントの偏差、およびステーションのモーション偏差がコンポーネントの品質に及ぼす影響の程度を考慮することも可能である。 At step 110, process method analysis deviations may be calculated, analyzing the motion data captured for one or more of the stations at step 108 to obtain, for example, an idealized motion profile for the corresponding station. Any deviation from the comparative model that includes (or represents) can be identified. As illustrated in FIG. 1, step 110 comprises, for example, identifying/classifying motion deviations from the comparison model and making inferences as to the extent to which the assembly or manufacturing process may have been affected. An AIPC deep learning model can be utilized (step 112). The comparison can be performed on a per station level and/or on an overall process level. The analysis may also consider the attributes of the components at individual stations, or the extent to which the deviations of the components from the baseline and the motion deviations of the stations affect the quality of the components.

ステップ112で呼ばれるAIPC深層学習モデルは、例えば所与のステーション/ノードに対する理想的な、または品質が制御された組立て/製造相互作用の例を含むことができる様々なタイプの訓練データの収集に基づくことができる。また、AIPC深層学習モデルは、プロセス100(ステップ111)を使用して製造された特定の製品に関する顧客からのフィードバックによって、また、プロセス100(ステップ113)を使用して製造された特定の製品の品質管理検査からのフィードバックによって、ドメイン/産業情報115によって提供されるデータを使用して増補する(または調整する)ことができる。AIPC深層学習モデルは、分散ハードウェアモジュールおよび/またはソフトウェアモジュールを含む様々な計算システムを使用して実現することができることを理解されたい。一例として、AIPC深層学習モデルは、組立てラインに展開され、かつ、様々なAI/機械学習モデルおよび/または分類子を実現するように構成された1つまたは複数のシステムに結合される複数の画像キャプチャデバイスおよび表示デバイスを含む分散システムを使用して実現することができる。 The AIPC deep learning model called in step 112 is based on collection of various types of training data, which can include examples of ideal or quality-controlled assembly/manufacturing interactions for a given station/node, for example. be able to. AIPC deep learning models are also trained by feedback from customers regarding specific products manufactured using process 100 (step 111), and for specific products manufactured using process 100 (step 113). Data provided by domain/industry information 115 can be used to augment (or adjust) feedback from quality control inspections. It should be appreciated that AIPC deep learning models can be implemented using a variety of computing systems including distributed hardware and/or software modules. As an example, an AIPC deep learning model is deployed on an assembly line and multiple images combined into one or more systems configured to implement various AI/machine learning models and/or classifiers. It can be implemented using a distributed system that includes a capture device and a display device.

ステップ110で比較モデルからの偏差が検出され/識別されると、ステップ114で、AIPC深層学習モデル112を使用して自動調整を生成することができる。上で考察したように、ビデオ調整は、ワークフローの1つまたは複数のステーションにおける製造/組立て品質を改善することを目的とすることができる。例えば作業者に提供される指示または手引きを、エラーを低減し、あるいはエラーが発生した時点で修復する方法で変更するために、例えばエラーが発生することが分かっている(または予測される)所与のノード/ステーションにビデオ調整を適用することができる。他の実施態様では、例えば製造ワークフローが完了する前にエラーを修正するために、エラーが発生したステーションから下流側にビデオ調整を適用することができる。さらに他の実施態様では、ワークフローが完了すると、ワークフロー全体を解析することができ、また、ワークフローにおける1つまたは複数のステーションに対して調整を実施することができる。 Once deviations from the comparative model are detected/identified at step 110, the AIPC deep learning model 112 can be used to generate automatic adjustments at step 114. FIG. As discussed above, video adjustments can be aimed at improving manufacturing/assembly quality at one or more stations of the workflow. where errors are known (or predicted) to occur, e.g. Video adjustments can be applied to a given node/station. In other implementations, video adjustments can be applied downstream from the station where the error occurred, eg, to correct the error before the manufacturing workflow is complete. In yet other implementations, once a workflow is completed, the entire workflow can be analyzed and adjustments can be made to one or more stations in the workflow.

いくつかの実施形態では、調整は、エラーが検出された直後に実時間で実施される。他の実施形態では、調整は、一定のインターバルで、またはワークフローが完了した後に実施される。 In some embodiments, adjustments are made in real-time immediately after an error is detected. In other embodiments, adjustments are made at regular intervals or after the workflow is completed.

いくつかの態様では、ステップ114で決定された自動調整は、ステップ117で要約し、および/または製品品質レポートとして提供することができる。例えばモーション偏差の解析(ステップ110)によってもたらされる調整を使用して、組立て/製造プロセスの理想化されたモデルから識別された偏差に基づいて、ワークピースの様々な品質態様を記述する1つまたは複数の品質レポートを作成することができる。 In some aspects, the automatic adjustments determined at step 114 may be summarized at step 117 and/or provided as a product quality report. One or Multiple quality reports can be generated.

図2は、本技術のいくつかの態様による、組立てエラー修正を容易にするために使用することができるエラー検出解析を実施するための例示的プロセス200を図解したものである。 FIG. 2 illustrates an exemplary process 200 for performing error detection analysis that may be used to facilitate assembly error correction, in accordance with some aspects of the present technique.

ステップ210で開始され、理想化されたビデオ手引きを使用して製造/組立てを改善するプロセスを実現することができる。ステップ215で、1つまたは複数の組立てステーションのビデオ追跡が実施される。ビデオ追跡は、所与のステーション/ノードにおける人間作業者の記録を含むことができる。いくつかの実施形態では、ビデオ追跡は、所与のステーション/ノードにおけるコンポーネント属性のキャプチャをさらに含むことができる。 Beginning at step 210, the process of improving manufacturing/assembly using idealized video guidance can be implemented. At step 215, video tracking of one or more assembly stations is performed. Video tracking can include recordings of human workers at a given station/node. In some embodiments, video tracking can further include capturing component attributes at a given station/node.

ステップ220~224で、組立てステーションから記録されたビデオを解析する処理が実施される。例えばいくつかの実施形態では、背景抽出を実施して、記録されたビデオ中の動き/コンポーネントを隔離することができる。いくつかの態様では、背景抽出が完了すると、処理されたビデオは、組立て作業者に関連するモーション/ビデオデータのみを含み(ステップ224)、また、含まれているコンポーネントは、対応する組立てステップ(ステップ220)に使用される。ステップ220で、追加処理を実施して、部品/コンポーネントを隔離することができる。プロセス200の線図によって図解されているように、ステップ220は、異常検出(ステップ221)、表面変化の検出(222)および部品分類および/または品質スコアリング(ステップ223)を含む追加処理操作を含むことができる。それには限定されないが、1つまたは複数のAI/機械学習アルゴリズムおよび/または分類子の使用を含む、様々な信号および/または画像処理技法を使用して、任意のビデオ処理ステップを実施し、それにより例えば異常検出(221)、表面変化の検出(222)を実施し、および/またはスコアリング/分類(ステップ223)を実施することができることを理解されたい。 At steps 220-224, processing is performed to analyze the video recorded from the assembly station. For example, in some embodiments background extraction can be performed to isolate motion/components in the recorded video. In some aspects, once background extraction is complete, the processed video includes only motion/video data related to the assembly worker (step 224), and the included components are the corresponding assembly steps (step 224). step 220). At step 220, additional processing may be performed to isolate parts/components. As illustrated by the diagram of process 200, step 220 performs additional processing operations including anomaly detection (step 221), surface change detection (222) and part classification and/or quality scoring (step 223). can contain. Any video processing step is performed using various signal and/or image processing techniques including, but not limited to, the use of one or more AI/machine learning algorithms and/or classifiers, can perform anomaly detection (221), surface change detection (222), and/or scoring/classification (step 223), for example.

処理ステップ220~224が完了した後、プロセス200は、モーション比較が実施されるステップ226へ進行することができる。モーション比較(ステップ226)は、対応する理想化されたビデオ/モーションデータとの、1つまたは複数のステーション/ノードにおける一人(1つ)または複数のステーション作業者を含むプロセス組立てステーションビデオデータの比較を含むことができる。複数のステーション/ノードにわたって実施されるモーション比較を使用して、結果として得られる部品/コンポーネント品質の変化を推測/予測することができる。 After processing steps 220-224 are completed, process 200 may proceed to step 226 where a motion comparison is performed. Motion comparison (step 226) compares process assembly station video data including one or more station workers at one or more stations/nodes with corresponding idealized video/motion data. can include Motion comparisons performed across multiple stations/nodes can be used to infer/predict the resulting change in part/component quality.

ステップ228で、様々な部品/コンポーネントに対する分散/品質分類を実施することができる。一例として、部品/コンポーネントは異なる品質層に分類することができ、および/またはそれらの関連する分類/相違に応じて、除去または修理のために識別することができる。 At step 228, distribution/quality classification for various parts/components may be performed. As an example, parts/components can be classified into different quality tiers and/or identified for removal or repair depending on their associated classifications/differences.

分類/相違が決定された後、プロセス200はステップ230へ進行することができ、ステップ230で、プロセス/ワークフロー全体の解析が、例えばステップ226および228で決定されたステーション/ノード毎の分類/相違に基づいて実施される。ワークフロー全体を解析することにより、ビデオに対する自動調整を実施することができ、それにより、上で考察したように、検出された偏差/欠陥に対処することができる。 After the classifications/differences have been determined, process 200 can proceed to step 230 where an analysis of the overall process/workflow is performed, e.g. conducted based on By analyzing the entire workflow, automatic adjustments to the video can be made to address detected deviations/defects, as discussed above.

図3は、開示される技術のシステムを実現するために使用することができる例示的処理デバイスを図解したものである。処理デバイス300は、マスター中央処理装置(CPU)362、インタフェース368およびバス315(例えばPCIバス)を含む。適切なソフトウェアまたはファームウェアの制御の下で動作すると、CPU362は、様々なエラー検出監視および開示される技術のプロセス調整ステップを実施する責任を負う。CPU362は、オペレーティングシステムおよび任意の適切なアプリケーションソフトウェアを含むソフトウェアの制御の下ですべてのこれらの機能を成し遂げることが好ましい。CPU362は、マイクロプロセッサのMotorolaファミリーからの、あるいはマイクロプロセッサのMIPSファミリーからのプロセッサなどの1つまたは複数のプロセッサ363を含むことができる。代替実施形態では、プロセッサ363は、AIPCシステム310の操作を制御するために特別に設計されたハードウェアである。特定の実施形態では、メモリ361(不揮発性RAMおよび/またはROMなど)もCPU462の一部を形成している。しかしながらメモリをシステムに結合することができる多くの異なる方法が存在している。 FIG. 3 illustrates an exemplary processing device that can be used to implement systems of the disclosed technology. Processing device 300 includes a master central processing unit (CPU) 362, an interface 368 and a bus 315 (eg, PCI bus). Operating under the control of appropriate software or firmware, CPU 362 is responsible for performing various error detection monitoring and process adjustment steps of the disclosed techniques. CPU 362 preferably performs all these functions under the control of software, including an operating system and any suitable application software. CPU 362 may include one or more processors 363, such as processors from the Motorola family of microprocessors or from the MIPS family of microprocessors. In an alternative embodiment, processor 363 is hardware specifically designed to control the operation of AIPC system 310 . Memory 361 (such as non-volatile RAM and/or ROM) also forms part of CPU 462 in certain embodiments. However, there are many different ways memory can be coupled to the system.

いくつかの態様では、処理デバイス310は、画像処理システム370を含むことができ、あるいは画像処理システム370と結合することができる。画像処理システム370は、作業者の動きを監視し、また、モーションデータを生成することができるビデオカメラなどの様々な画像キャプチャデバイスを含むことができる。一例として、画像処理システム370は、ビデオデータをキャプチャし、および/または3Dポイントクラウドを出力し/生成するように構成することができる。 In some aspects, processing device 310 may include or be coupled to image processing system 370 . The image processing system 370 can include various image capture devices such as video cameras that can monitor worker movement and generate motion data. As an example, image processing system 370 may be configured to capture video data and/or output/generate a 3D point cloud.

インタフェース368は、典型的にはインタフェースカード(時によっては「ラインカード」と呼ばれることもある)として提供される。一般に、それらは、ネットワークを介したデータパケットの送信および受信を制御し、また、時によっては、ルータと共に使用される他の周辺装置をサポートする。提供され得るインタフェースは、とりわけ、Ethernetインタフェース、フレーム中継インタフェース、ケーブルインタフェース、DSLインタフェース、トークンリングインタフェース、等々である。さらに、高速トークンリングインタフェース、無線インタフェース、Ethernetインタフェース、Gigabit Ethernetインタフェース、ATMインタフェース、HSSIインタフェース、POSインタフェース、FDDIインタフェース、等々などの様々な極めて高速のインタフェースを提供することも可能である。一般に、これらのインタフェースは、適切な媒体との通信に適したポートを含むことができる。いくつかの事例では、それらは独立プロセッサをも含むことができ、また、いくつかの実例では揮発性RAMを含むことができる。独立プロセッサは、このような通信集約タスクをパケット交換、媒体制御および管理として制御することができる。通信集約タスクのための個別のプロセッサを提供することにより、これらのインタフェースは、マスターマイクロプロセッサ362による、経路指定計算、ネットワーク診断、安全保護機能、等々の効果的な実施を許容することができる。 Interface 368 is typically provided as an interface card (sometimes called a "line card"). Generally, they control the transmission and reception of data packets over networks and sometimes support other peripherals used with routers. Interfaces that may be provided are, among others, an Ethernet interface, a frame relay interface, a cable interface, a DSL interface, a token ring interface, and so on. In addition, various very high speed interfaces can be provided such as high speed token ring interfaces, radio interfaces, Ethernet interfaces, Gigabit Ethernet interfaces, ATM interfaces, HSSI interfaces, POS interfaces, FDDI interfaces, and so on. Generally, these interfaces may include ports suitable for communicating with any suitable medium. In some cases, they may also include independent processors, and in some instances may include volatile RAM. Independent processors can control such communication-intensive tasks as packet switching, media control and management. By providing separate processors for communication-intensive tasks, these interfaces can allow the master microprocessor 362 to efficiently perform routing calculations, network diagnostics, security functions, and the like.

図3に示されているシステムは、本発明の1つの特定の処理デバイスであるが、本発明を実現することができる唯一のネットワークデバイスアーキテクチャでは決してない。例えば通信ならびに経路指定計算、等々を取り扱う単一のプロセッサを有するアーキテクチャがしばしば使用される。さらに、他のタイプのインタフェースおよび媒体をも使用することも可能である。 The system shown in FIG. 3 is one particular processing device of the present invention, but by no means the only network device architecture in which the present invention can be implemented. For example, architectures with a single processor that handles communications as well as routing calculations, etc., are often used. Additionally, other types of interfaces and media may also be used.

ネットワークデバイスの構成に無関係に、ネットワークデバイスは、汎用ネットワーク操作のためのプログラム命令を記憶するように構成された1つまたは複数のメモリまたはメモリモジュール(メモリ361を含む)、および本明細書において説明されているローミング、経路最適化および経路指定機能のための機構を使用することができる。プログラム命令は、例えばオペレーティングシステムおよび/または1つまたは複数のアプリケーションの操作を制御することができる。移動度結合(mobility binding)、登録および関連表、等々などの表を記憶するように1つまたは複数のメモリを構成することも可能である。 Regardless of the configuration of the network device, the network device will include one or more memories or memory modules (including memory 361) configured to store program instructions for general network operations and the Mechanisms for roaming, route optimization and routing functions provided by the standard can be used. Program instructions may, for example, control operation of an operating system and/or one or more applications. One or more memories can also be configured to store tables such as mobility bindings, registration and association tables, and so on.

様々な実施形態の論理演算は、(1)汎用コンピュータ内のプログラム可能回路上で走る一連のコンピュータ実現ステップ、操作または手順、(2)特定用途プログラム可能回路上で走る一連のコンピュータ実現ステップ、操作または手順、および/または(3)相互接続機械モジュールまたはプログラム可能回路内のプログラムエンジンとして実現される。システム300は、記載されている方法のすべてまたは一部を実践することができ、記載されているシステムの一部であってもよく、および/または記載されている非一時的コンピュータ可読記憶媒体中の命令に従って動作することができる。このような論理演算は、プロセッサ363を制御するように構成されたモジュールとして実現することができ、それによりそのモジュールのプログラミングに従って特定の機能を実施する。 The logical operations of various embodiments are represented as (1) a sequence of computer-implemented steps, operations or procedures running on programmable circuits within a general-purpose computer; (2) a sequence of computer-implemented steps, operations running on application-specific programmable circuits. or procedures; and/or (3) implemented as a program engine within interconnected machine modules or programmable circuits. System 300 can practice all or part of the described methods, may be part of the described systems, and/or can act according to the instructions of Such logical operations may be implemented as modules configured to control processor 363, thereby performing specific functions according to programming of that module.

開示されているプロセスにおけるステップの任意の特定の順序または階層は、例示的手法の例証であることを理解されたい。設計の好みに基づいて、プロセスにおけるステップの特定の順序または階層を再配置することができること、または図解されているステップの一部のみを実施することができることを理解されたい。ステップのうちのいくつかは同時に実施することができる。例えば特定の状況では、多重タスキングおよび並列処理が有利であり得る。さらに、上で説明した実施形態における様々なシステムコンポーネントの分離は、このような分離がすべての実施形態に必要であるものとして理解してはならず、また、説明されているプログラムコンポーネントおよびシステムは、一般に、単一のソフトウェア製品の中で一体に統合することができ、あるいは複数のソフトウェア製品にパッケージ化することができることを理解すべきである。 It is understood that any specific order or hierarchy of steps in the processes disclosed is an illustration of exemplary approaches. Based on design preferences, it is understood that the specific order or hierarchy of steps in the processes may be rearranged, or that only some of the steps illustrated may be performed. Some of the steps can be performed simultaneously. For example, multitasking and parallel processing may be advantageous in certain situations. Furthermore, the separation of various system components in the above-described embodiments should not be understood as requiring such separation in all embodiments, nor should the described program components and systems , in general, may be integrated together within a single software product, or may be packaged into multiple software products.

上記の説明は、すべての当業者による、本明細書において説明されている様々な態様の実践を可能にするために提供されたものである。これらの態様に対する様々な修正は当業者には容易に明らかであり、また、本明細書において定義されている一般原理は、他の態様にも適用することができる。したがって特許請求の範囲には、それが本明細書において示されている態様に限定されることは意図されておらず、特許請求の範囲は、言語請求項と無矛盾の全範囲と一致し、単数形の要素に対する参照には、そうであることが明確に言及されていない限り、「1つであり、また、唯一である」ことを意味するのではなく、「1つまたは複数である」ことが意図されている。 The previous description is provided to enable any person skilled in the art to practice the various aspects described herein. Various modifications to these aspects will be readily apparent to those skilled in the art, and the general principles defined herein may also be applied to other aspects. Accordingly, it is not intended that the claims be limited to the embodiments shown herein, and that the claims be construed to the full extent consistent with the language of the claims, singular References to elements of form shall imply "one or more" rather than implying "one and only", unless expressly stated to the contrary. is intended.

「態様」などの語句は、このような態様が主題技術に必須であること、またはこのような態様を主題技術のすべての構成に適用することを暗に意味していない。態様に関連する開示は、すべての構成に適用することができ、あるいは1つまたは複数の構成に適用することができる。一態様などの語句は、1つまたは複数の態様を意味することができ、また、1つまたは複数の態様は、一態様を意味することができる。「構成」などの語句は、このような構成が主題技術に必須であること、またはこのような構成を主題技術のすべての構成に適用することを暗に意味していない。構成に関連する開示は、すべての構成に適用することができ、あるいは1つまたは複数の構成に適用することができる。一構成などの語句は、1つまたは複数の構成を意味することができ、また、1つまたは複数の構成は、一構成を意味することができる。 A phrase such as "an aspect" does not imply that such aspect is essential to the subject technology or that such aspect applies to all configurations of the subject technology. A disclosure relating to an aspect may apply to all configurations, or to one or more configurations. A phrase such as an aspect can refer to one or more aspects, and one or more aspects can refer to an aspect. A phrase such as "configuration" does not imply that such configuration is essential to the subject technology or that such configuration applies to all configurations of the subject technology. A disclosure relating to a configuration may apply to all configurations, or to one or more configurations. A phrase such as a configuration can mean one or more configurations, and one or more configurations can mean a configuration.

「例示的」という語は、本明細書においては、「例または例証として働く」ことを意味するべく使用されている。「例示的」として本明細書において説明されているすべての態様または設計は、他の態様または設計に勝る、好ましい、または有利なものとして必ずしも解釈されるべきではない。
開示の供述
The word "exemplary" is used herein to mean "serving as an example or illustration." Any aspect or design described herein as "exemplary" is not necessarily to be construed as over, preferred, or advantageous over other aspects or designs.
Statement of Disclosure

供述1:組立てラインにおけるワークフローを最適化するための方法であって、方法は、目標対象の組立てプロセスのあるステップにおいて、目標対象の組立てのエラーを検出するステップと、組立てプロセスのそのステップにおける目標対象と公称対象とを評価し、それにより比較を得るステップと、その比較に基づいて、目標対象と公称対象の間の偏差を最小化するために必要な一連のステップを決定するステップと、上記一連のステップに基づいて目標対象のための組立て指示を調整するステップとを含む。 Statement 1: A method for optimizing a workflow in an assembly line, the method comprising, at a step of the target assembly process, detecting errors in the target assembly and the target at that step of the assembly process. evaluating the target and the nominal target thereby obtaining a comparison; and based on the comparison determining the sequence of steps required to minimize the deviation between the target target and the nominal target; and adjusting the building instructions for the target object based on the sequence of steps.

供述2:供述1の方法であって、目標対象は、組立てプロセスの上記ステップにおける公称対象に対して評価される。 Statement 2: The method of statement 1, wherein the target object is evaluated against the nominal object in the above step of the assembly process.

供述3:供述1から2のいずれかの方法であって、目標対象は、公称対象の最終構成に対して評価される。 Statement 3: The method of any of statements 1-2, wherein the target object is evaluated against the final configuration of the nominal object.

供述4:供述1から3のいずれかの方法であって、上記一連のステップは、偏差を最小化するように構成された機械学習モデルを使用して決定される。 Statement 4: The method of any of statements 1-3, wherein the sequence of steps is determined using a machine learning model configured to minimize deviation.

供述5:供述1から4のいずれかの方法であって、偏差は、目標対象の組立てプロセスを完了するための上記一連のステップと、公称対象の組立てプロセスを完了するための別の一連のステップとの間の類似性に基づいて決定される。 Statement 5: The method of any of statements 1 through 4, wherein the deviation is the sequence of steps for completing the target object assembly process and another sequence of steps for completing the nominal object assembly process is determined based on the similarity between

供述6:供述1から5のいずれかの方法であって、偏差は、報酬公式化を介したMarkov Decision Process(MDP)を使用して最小化される。 Statement 6: The method of any of statements 1-5, wherein the deviation is minimized using the Markov Decision Process (MDP) via reward formulation.

供述7:供述1から6のいずれかの方法であって、確率的勾配降下法を使用して、目標対象の組立てプロセスを完了するための上記一連のステップが引き出される。 Statement 7: The method of any of statements 1-6, wherein stochastic gradient descent is used to derive the sequence of steps for completing the target object assembly process.

供述8:組立てラインにおけるワークフローを最適化するためのシステムであって、システムは、複数の画像キャプチャデバイスであって、画像キャプチャデバイスの各々は、目標対象の組立てプロセスの間、作業者の動きをキャプチャするために異なる位置に配置される、複数の画像キャプチャデバイスと、作業者に提供された手引きおよび指示を自動的に修正するように構成された組立て指示モジュールであって、上記複数の画像キャプチャデバイスに結合される、組立て指示モジュールとを含み、組立て指示モジュールは、該組立て指示モジュールによって、複数の画像キャプチャデバイスからモーションデータを受け取るステップであって、モーションデータは、作業者による、目標対象を組み立てるための一組のステップの実行に対応する、ステップと、上記一組のステップのうちのあるステップにおけるモーションデータに基づいて、目標対象の組立てにおけるエラーを決定するステップと、上記一組のステップのうちの上記ステップにおける目標対象と公称対象とを評価し、それにより比較を得るステップと、その比較に基づいて、目標対象と公称対象の間の偏差を最小化するために必要な一連のステップを決定するステップと、上記一連のステップに基づいて、作業者に提供される組立て指示を調整するステップとを含む操作を実施するように構成される。 Statement 8: A system for optimizing workflow on an assembly line, the system comprising a plurality of image capture devices, each of which captures worker movement during a targeted assembly process. a plurality of image capture devices positioned at different positions to capture and an assembly instruction module configured to automatically modify the guidance and instructions provided to the operator, the plurality of image captures an assembly instruction module coupled to the device, the assembly instruction module receiving motion data from the plurality of image capture devices by the assembly instruction module, the motion data representing the movement of the target object by the operator; determining errors in building a target object based on steps corresponding to performing a set of steps for assembly and motion data in a step of said set of steps; and said set of steps. evaluating the target target and the nominal target in the above step of to obtain a comparison, and based on the comparison, the sequence of steps necessary to minimize the deviation between the target target and the nominal target and adjusting the assembly instructions provided to the operator based on the sequence of steps.

供述9:供述8のシステムであって、モーションデータは、目標対象を組み立てている間の作業者の手の動きのデジタル記録を含む。 Statement 9: The system of Statement 8, wherein the motion data includes digital recordings of the worker's hand movements while assembling the target object.

供述10:供述8から9のいずれかのシステムであって、組立て指示モジュールは、確率的勾配降下法を適用して上記一連のステップを引き出すようにさらに構成される。 Statement 10: The system of any of statements 8-9, wherein the assembly instruction module is further configured to apply stochastic gradient descent to derive the sequence of steps.

供述11:供述8から10のいずれかのシステムであって、組立て指示モジュールは、機械学習モデルを使用して上記一連のステップを決定するようにさらに構成され、機械学習モデルは偏差を最小化するように構成される。 Statement 11: The system of any of statements 8-10, wherein the assembly instruction module is further configured to determine the sequence of steps using a machine learning model, the machine learning model minimizing deviations configured as

供述12:供述8から11のいずれかのシステムであって、偏差は、目標対象の組立てを完了するための上記一連のステップと、公称対象の組立てを完了するための別の一連のステップとの間の類似性に基づいて決定される。 Statement 12: The system of any of statements 8 through 11, wherein the deviation is between said sequence of steps for completing assembly of the target object and another sequence of steps for completing assembly of the nominal object. determined based on the similarity between

供述13:供述8から12のいずれかのシステムであって、偏差は、報酬公式化を介したMarkov Decision Process(MDP)を使用して最小化される。 Statement 13: The system of any of statements 8-12, wherein the deviation is minimized using the Markov Decision Process (MDP) via reward formulation.

供述14:供述8から13のいずれかのシステムであって、組立て指示モジュールは、モーションデータから、目標対象の組立てを表す一組の画像を引き出し、また、上記一組の画像を評価して、目標対象を組み立てるための作業者による上記一組のステップの実行を識別するようにさらに構成される。 Statement 14: The system of any of statements 8 through 13, wherein the assembly instruction module derives from the motion data a set of images representative of the assembly of the target object, evaluates the set of images, It is further configured to identify execution of the set of steps by the operator to assemble the target object.

供述15:その上に記憶された命令を含む非一時的コンピュータ可読媒体であって、命令は、1つまたは複数のプロセッサによって実行されると、目標対象の組立てプロセスのあるステップにおいて、目標対象の組立てにおけるエラーを検出すること、組立てプロセスの上記ステップにおける目標対象と公称対象とを評価し、それにより比較を得ること、その比較に基づいて、目標対象と公称対象の間の偏差を最小化するために必要な一連のステップを決定すること、および上記一連のステップに基づいて、目標対象のための組立て指示を調整することを含む命令をプロセッサが実行することになるように構成される。 Statement 15: A non-transitory computer-readable medium containing instructions stored thereon which, when executed by one or more processors, cause the target object to Detecting errors in assembly, Evaluating target and nominal targets in the above steps of the assembly process, thereby obtaining a comparison, Based on the comparison, minimizing the deviation between the target and nominal targets. The processor is configured to execute instructions including determining a sequence of steps required to achieve the desired sequence of steps, and adjusting building instructions for the target object based on the sequence of steps.

供述16:供述15の非一時的コンピュータ可読媒体であって、命令は、プロセッサが確率的勾配降下法を使用して上記一連のステップを引き出すことになるようにさらに構成される。 Statement 16: The non-transitory computer-readable medium of statement 15, wherein the instructions are further configured to cause the processor to derive the above sequence of steps using stochastic gradient descent.

供述17:供述15から16のいずれかの非一時的コンピュータ可読媒体であって、目標対象は、組立てプロセスの上記ステップにおける公称対象に対して評価される。 Statement 17: The non-transitory computer-readable medium of any of statements 15-16, wherein the target object is evaluated against the nominal object in the above step of the assembly process.

供述18:供述15から17のいずれかの非一時的コンピュータ可読媒体であって、目標対象は、公称対象の最終構成に対して評価される。 Statement 18: The non-transitory computer-readable medium of any of statements 15-17, wherein the target object is evaluated against the final configuration of the nominal object.

供述19:供述15から18のいずれかの非一時的コンピュータ可読媒体であって、命令は、偏差を最小化するように構成された機械学習モデルをプロセッサが使用して上記一連のステップを決定することになるようにさらに構成される。 Statement 19: The non-transitory computer-readable medium of any of statements 15-18, wherein the instructions determine the sequence of steps using a machine learning model configured to minimize deviation by the processor is further configured to be

供述20:供述15から19のいずれかの非一時的コンピュータ可読媒体であって、偏差は、報酬公式化を介したMarkov Decision Process(MDP)を使用して最小化される。

Statement 20: The non-transitory computer-readable medium of any of statements 15-19, wherein the deviation is minimized using a Markov Decision Process (MDP) via reward formulation.

関連出願の相互参照
本出願は、2019年9月30に出願した、「DYNAMIC TRAINING FOR ASSEMBLY LINES,」という名称の米国特許出願第16/587,366号の一部継続出願であり、この米国特許出願第16/587,366号は、2019年2月28日に出願した、「DYNAMIC TRAINING FOR ASSEMBLY LINES,」という名称の米国出願第16/289,422号、現在は米国特許第10,481,579号の継続出願である。さらに、本出願は、2019年4月19日に出願した、「A COMPUTATION MODEL FOR DECISION-MAKING AND ASSEMBLY OPTIMIZATION IN MANUFACTURING,」という名称の米国仮出願第62/836,192号、2019年11月6日に出願した、「A COMPUTATION MODEL FOR DECISION-MAKING AND ASSEMBLY OPTIMIZATION IN MANUFACTURING,」という名称の米国仮出願第62/931,448号、および2019年11月7日に出願した、「DEEP LEARNING QUALITY PREDICTOR FOR MANUAL ASSEMBLY VIDEO ANALYSIS,」という名称の米国仮出願第62/932,063号の利益を主張するものである。上記出願および特許の内容全体は、参照により本明細書に組み込まれている。
CROSS-REFERENCE TO RELATED APPLICATIONS This application is a continuation-in-part of U.S. patent application Ser. Application No. 16/587,366, filed February 28, 2019, is U.S. Application No. 16/289,422 entitled "DYNAMIC TRAINING FOR ASSEMBLY LINES," now U.S. Patent No. 10,481, This is a continuation application of '579. Further, this application is subject to U.S. Provisional Application Serial No. 62/836,192 entitled "A COMPUTATION MODEL FOR DECISION-MAKING AND ASSEMBLY OPTIMIZATION IN MANUFACTURING," filed on April 19, 2019, November 6, 2019. U.S. Provisional Application No. 62/931,448, entitled "A COMPUTATION MODEL FOR DECISION-MAKING AND ASSEMBLY OPTIMIZATION IN MANUFACTURING," filed on Nov. 7, 2019, and "DEEP LEARNING QUALITY PREDICTOR," filed November 7, 2019; No. 62/932,063 entitled FOR MANUAL ASSEMBLY VIDEO ANALYSIS. The entire contents of the above applications and patents are incorporated herein by reference.

主題技術は、組立てラインワークフローに対する改善を提供し、詳細には、機械学習モデルを使用してなされるフィードバックおよびフィードフォワードエラー伝搬予測に基づいて組立てライン作業者指示を適応的に更新するためのシステムおよび方法を包含している。以下でさらに詳細に考察されるように、技術のいくつかの態様は、製造偏差または組立て偏差に関してなされる推測に基づいて、1つまたは複数の作業者ステーションで提供される手引きビデオを自動的に適合させるためのシステムおよび方法を包含している。 The subject technology provides improvements to assembly line workflow and, in particular, a system for adaptively updating assembly line operator instructions based on feedback and feedforward error propagation predictions made using machine learning models. and methods. As discussed in more detail below, some aspects of the technology automatically generate instructional videos provided at one or more worker stations based on inferences made regarding manufacturing or assembly deviations. Systems and methods for matching are included.

従来の組立てラインワークフローでは、製造エラーを検出するためには、また、下流側プロセスにおける修正を介してエラーを除去することができる方法を決定するためには、人間(作業者)監視および専門的技術が必要である。組立てと製造、ならびに、組立てラインと生産ラインは、本明細書において交換可能に使用されていることに留意されたい。組立てエラーの検出を人間に依存しているため、エラーが見落とされ(あるいは報告されず)、また、そのまま組立てプロセスにおける下流側に伝搬される高い可能性が存在している。さらに、多くの組立て作業者は、狭い範囲の一組のタスクを実施するように訓練されているにすぎず、したがって組立てワークフローにおける上流側で生じたエラーを最も良好に訂正するための作業者自身のワークフローの修正方法を認識していないことがあり得る。 Traditional assembly line workflows require human (operator) oversight and specialized techniques to detect manufacturing errors and to determine how errors can be eliminated through corrections in downstream processes. Technology is required. Note that assembly and manufacturing, and assembly line and production line are used interchangeably herein. Due to the reliance on humans to detect assembly errors, there is a high probability that errors will be overlooked (or not reported) and propagated directly downstream in the assembly process. Moreover, many assemblers are only trained to perform a narrow set of tasks, and thus are themselves trained to best correct errors that occur upstream in the assembly workflow. may not be aware of how to modify their workflow.

従来の製造ワークフローでは、手動検査プロセスの一部における人間のエラーの修復は、しばしば、その人間ノード上で修正行為を取ることによって処理されている。その人間にかかわる継続する問題が存在している場合、その人は、しばしば、すべての人間がそうであるように、多くの同じ限界に対して傷つき易い他の人に代えられる。ある行為を、エラーを犯すことなく、何年にもわたって絶えず繰り返すことは困難であり、また、修正行為を取ることは、ほとんどの組立て作業者の権利外である。これらの権利が与えられたとしても、そこには矛盾が存在し、また、その単一のプロセスノードのアプリケーションにおいて、その人間が有している経験によってのみ告げられることになる。さらに、何らかの間違いから、さらには何らかの積極的な修正行為から学習するための機構は存在していない。 In traditional manufacturing workflows, the correction of human errors in part of the manual inspection process is often handled by taking corrective action on the human node. If there is an ongoing problem with the person, the person is often replaced by another person who is vulnerable to many of the same limitations as all humans are. It is difficult to repeat an action consistently over the years without committing an error, and taking corrective action is beyond the right of most builders. Even given these rights, there are contradictions and they can only be told by the experience the human has in the application of the single process node. Moreover, there is no mechanism for learning from any mistakes or even from any positive corrective actions.

さらに、組立てラインの電子監視には限界があり、また、上流側のステップで生じたエラーを補償するための、組立てラインにおける下流側のステップに対する臨機応変な調整を提供するための頑丈な機構を含んでいない。さらに、作業者モーションの変化および/または組立てパターンの変化が、結果として得られる製造製品に如何に影響を及ぼすかを評価し、かつ、製造製品の性能および/または特性を改善するための修正行為を提供するための新しい機構が必要である。 In addition, electronic monitoring of assembly lines has limitations and robust mechanisms for providing opportunistic adjustments to downstream steps in the assembly line to compensate for errors made in upstream steps. not included. In addition, assess how changes in worker motion and/or changes in assembly patterns affect the resulting manufactured product, and take corrective action to improve the performance and/or characteristics of the manufactured product. A new mechanism is needed to provide

いくつかの態様では、開示される技術は、組立てラインにおけるワークフローを最適化するための方法に関し、方法は、目標対象の組立てのあるステップにおいて、目標対象の組立てのエラーを検出するステップと、組立てプロセスのそのステップにおける目標対象と公称対象とを評価し、それにより比較を得るステップと、その比較に基づいて、目標対象と公称対象の間の偏差を最小化するために必要な一連のステップを決定するステップとを含む。いくつかの態様では、方法は、上記一連のステップに基づいて目標対象のための組立て指示を調整するためのステップをさらに含むことができる。 In some aspects, the disclosed technology relates to a method for optimizing a workflow on an assembly line, the method comprising, at a step of assembling the target object, detecting an error in assembling the target object; Evaluate the target and nominal targets at that step in the process, thereby obtaining a comparison, and, based on that comparison, the sequence of steps necessary to minimize the deviation between the target and nominal targets. and determining. In some aspects, the method may further include adjusting building instructions for the target object based on the sequence of steps.

別の態様では、開示される技術は、組立てラインにおけるワークフローを最適化するためのシステムを包含し、システムは、複数の画像キャプチャデバイスであって、画像キャプチャデバイスの各々は、目標対象の組立てプロセスの間、作業者の動きをキャプチャするために異なる位置に配置される、複数の画像キャプチャデバイスと、作業者に提供された手引きおよび指示を自動的に修正するように構成された組立て指示モジュールであって、上記複数の撮像デバイスに結合される、組立て指示モジュールとを含む。組立て指示モジュールは、複数の画像キャプチャデバイスからモーションデータを受け取るステップであって、モーションデータは、作業者による、目標対象を組み立てるための一組のステップの実行に対応する、ステップと、上記一組のステップのうちのあるステップにおけるモーションデータに基づいて、目標対象の組立てにおけるエラーを決定するステップとを含む操作を実施するように構成することができる。いくつかの実施態様では、組立て指示モジュールは、上記一組のステップのうちの上記ステップにおける目標対象と公称対象とを評価し、それにより比較を得るための操作を実施し、その比較に基づいて、目標対象と公称対象の間の偏差を最小化するために必要な一連のステップを決定し、かつ、上記一連のステップに基づいて、作業者に提供される組立て指示を調整するようにさらに構成することができる。修正された組立て指示の形態は、それらに限定されないが、モーションデータの生成された、あるいは編集されたビデオ、識別された偏差の自然言語処理(NLP)からのテキストベースの指示、または作業者への他のフィードバック機構を含むことができる。 In another aspect, the disclosed technology encompasses a system for optimizing a workflow on an assembly line, the system comprising a plurality of image capture devices, each image capture device for a target assembly process. with a plurality of image capture devices placed at different positions to capture the movements of the worker during and an assembly instruction module coupled to the plurality of imaging devices. a building instruction module receiving motion data from a plurality of image capture devices, the motion data corresponding to a worker performing a set of steps for building a target object; and determining an error in the assembly of the target object based on the motion data in one of the steps of . In some embodiments, the assembly instruction module evaluates a target object and a nominal object in said step of said set of steps, performs operations to thereby obtain a comparison, and based on said comparison , further configured to determine a sequence of steps required to minimize the deviation between the target target and the nominal target, and adjust the assembly instructions provided to the operator based on the sequence of steps. can do. Modified assembly instructions may be in the form of, but are not limited to, generated or edited video of motion data, text-based instructions from natural language processing (NLP) of identified deviations, or instructions to the operator. may include other feedback mechanisms.

さらに別の態様では、開示される技術は、その上に記憶された命令を含む非一時的コンピュータ可読媒体に関しており、命令は、1つまたは複数のプロセッサによって実行されると、目標対象の組立てプロセスのあるステップにおいて、目標対象の組立てにおけるエラーを検出するステップ、組立てプロセスの上記ステップにおける目標対象と公称対象とを評価し、それにより比較を得るステップ、およびその比較に基づいて、目標対象と公称対象の間の偏差を最小化するために必要な一連のステップを決定するステップを実施することを含む命令をプロセッサが実行することになるように構成される。いくつかの実施態様では、命令は、上記一連のステップに基づいて、目標対象のための組立て指示を調整するための操作をプロセッサが実施することになるようにさらに構成することができる。 In yet another aspect, the disclosed technology relates to a non-transitory computer-readable medium containing instructions stored thereon, the instructions, when executed by one or more processors, to a target object assembly process. In one step, detecting an error in the assembly of the target object; evaluating the target object and the nominal object in said step of the assembly process to thereby obtain a comparison; A processor is configured to execute instructions including performing the steps of determining a sequence of steps necessary to minimize the deviation between objects. In some implementations, the instructions may be further configured to cause the processor to perform operations for adjusting the building instructions for the target object based on the sequence of steps described above.

主題技術の特定の特徴は、添付の特許請求の範囲に示されている。しかしながらさらなる理解を提供するために含まれている添付の図面は、開示される態様を図解したものであり、説明と相俟って主題技術の原理を説明する働きをしている。 Particular features of the subject technology are set forth in the appended claims. However, the accompanying drawings, which are included to provide a further understanding, illustrate the disclosed aspects and, together with the description, serve to explain the principles of the subject technology.

開示される技術のいくつかの態様による、例示的生産ライン展開のフローチャートを概念的に示す図である。1 conceptually illustrates a flowchart of an exemplary production line deployment, in accordance with certain aspects of the disclosed technology; FIG.

開示される技術のいくつかの態様による、所与の作業者ステーションで組立てエラー修正を実施するためのプロセスの例を示す図である。FIG. 3 illustrates an example process for implementing assembly error correction at a given worker station, in accordance with certain aspects of the disclosed technology;

主題技術のいくつかの態様を実現するために使用することができる電子システムの例を示す図である。1 illustrates an example electronic system that can be used to implement some aspects of the subject technology; FIG.

以下に示されている詳細な説明には、主題技術の様々な構成についての説明であることが意図されており、主題技術を実践することができる構成のみを表すことは意図されていない。添付の図面は本明細書に組み込まれており、詳細な説明の一部を構成している。詳細な説明は、主題技術についてのより完全な理解を提供するために特定の詳細を含む。しかしながら主題技術は、本明細書において示されている特定の詳細に限定されないこと、また、これらの詳細がなくても実践することができることは明確で、かつ、明らかであろう。いくつかの実例では、主題技術の概念を曖昧にすることを回避するために、構造および構成要素はブロック図の形態で示されている。 The detailed description presented below is intended to be a description of various configurations of the subject technology, and is not intended to represent only the configurations in which the subject technology can be practiced. The accompanying drawings are incorporated into this specification and constitute a part of the detailed description. The detailed description includes specific details to provide a more thorough understanding of the subject technology. However, it will be clear and obvious that the subject technology is not limited to the specific details shown herein, and that it may be practiced without these details. In some instances, structures and components are shown in block diagram form in order to avoid obscuring concepts of the subject technology.

開示される技術の態様は、生産ラインの組立ておよび結果として得られる製造製品を追跡し、訓練し、かつ、漸進的に改善するための方法を提供することにより、従来の組立てラインプロセスフローの上記限界に対処する。改善は、動的視覚フィードバックまたは他のフィードバック、および指示を個々の組立て作業者に提供することによって実現され、また、いくつかの実施態様では、作業者フィードバックはエラーに基づいており、エラーは、それらに限定されないが、組立てエラー、役に立たないプロセスおよび/またはモーション、生産ラインにおける1つまたは複数のポイントで検出された粗悪な製品を含むことができる。 Aspects of the disclosed technology overcome the above drawbacks of conventional assembly line process flows by providing methods for tracking, training, and incrementally improving production line assembly and resulting manufactured products. Deal with limits. Improvements are realized by providing dynamic visual or other feedback and instructions to individual builders, and in some embodiments worker feedback is based on errors, which are caused by: These may include, but are not limited to, assembly errors, ineffective processes and/or motions, and inferior product detected at one or more points in the production line.

開示される技術を実現することにより、例えば準実時間エラー検出に基づいて、個々のステーション(またはすべてのステーション)で提供される参照/指示情報を速やかに改定および変更することにより、手動実施態様方法のエラー修正の速度に対して、その速度を著しく改善することができる。本明細書において説明されているいくつかの実施形態は、ビデオの形態の参照/指示情報の使用を考察しているが、他のフォーマットも企図されている。例えば組立て/製造指示は、聴覚、視覚、テキストおよび/または触覚キューとして、あるいは他の形態の参照として組立て作業者に提供することができる。一例として、聴覚指示情報は、口頭の指示または他の聴覚インジケータを含むことができる。視覚組立て指示情報は、拡張現実感(A/R)または仮想現実感(V/R)システムの使用などのビデオまたは動画化フォーマットを含むことができる。いくつかの態様では、視覚組立て指示は、組立てラインの所与のステーションにおける、作業者によるワークピース(またはツール)の取扱い方法に関する例を提供する動画として提供することができる。さらに、いくつかの態様では、組立て/製造指示は、例えば、ロボット組立て作業者または機械組立て作業者が受け取り、かつ、実現することができる機械命令を含むことができる。本明細書において使用されている作業者という用語は、製造製品を組み立てるモーションを使用する人間、ロボットまたは機械を意味することができる。さらに、作業者という用語は、人間の作業者がロボットまたは機械器具と共に作業し、あるいは人間作業者がロボットまたは機械器具によって支援される実例の場合のように、人間支援製造実施態様を包含している。 By implementing the disclosed techniques, for example, based on near-real-time error detection, by rapidly revising and changing the reference/indicative information provided at individual stations (or all stations), manual implementation With respect to the speed of error correction of the method, its speed can be significantly improved. Although some embodiments described herein contemplate using reference/indicative information in the form of video, other formats are also contemplated. For example, assembly/manufacturing instructions may be provided to the assembler as audio, visual, textual and/or tactile cues or as other forms of reference. As an example, the audible instructional information may include verbal instructions or other audible indicators. Visual building instruction information may include video or animated formats such as the use of Augmented Reality (A/R) or Virtual Reality (V/R) systems. In some aspects, the visual assembly instructions may be provided as animations that provide examples of how the workpiece (or tool) should be handled by workers at a given station of the assembly line. Further, in some aspects, the assembly/manufacturing instructions may include machine instructions that can be received and implemented by, for example, a robotic or mechanical assembler. As used herein, the term worker can mean a human, robot or machine that uses motion to assemble a manufactured product. Further, the term worker encompasses human-assisted manufacturing implementations, such as in instances where human workers work with or are assisted by robots or machines. there is

組立て/製造指示が参照/指示ビデオとして提供される実例では、このようなビデオは、時によっては標準作業プロトコル(SOP)と呼ばれることがある。開示される技術のシステムは、最小限のハードウェア要求事項、例えば個々の作業者のためのビデオカメラおよびディスプレイの使用などのため、効果的に展開することができ、一方、機械学習訓練、更新およびエラー伝搬は、例えば計算クラスターまたはクラウド環境におけるような集中型計算資源で実施することができる。 In instances where assembly/manufacturing instructions are provided as reference/instruction videos, such videos are sometimes referred to as standard operating protocols (SOPs). Systems of the disclosed technology can be effectively deployed due to minimal hardware requirements, such as the use of video cameras and displays for individual workers, while machine learning training, updating and error propagation can be implemented on centralized computing resources, such as in computing clusters or cloud environments.

いくつかの態様では、ビデオ指示情報は、拡張現実感表示の一部として、一人(1つ)または複数の作業者に提供することができる。すなわち指示、または標準組立て/製造方法からの偏差は、拡張現実感を使用して作業者に伝えることができ、表示は、強化されたビデオ、動画化された図形、および/または記録されたシナリオを表すビデオデータの混合として提供される。一例として、拡張現実感表示は、組み立てられているワークピース、および/または組立て/製造プロセスで使用されているツールの実時間フィードに対する動画化または図形オーバーレイとして提供される指示または手引きを提供することができる。 In some aspects, video instructional information may be provided to one or more workers as part of an augmented reality display. instructions, or deviations from standard assembly/manufacturing methods, can be communicated to workers using augmented reality, and displays can be enhanced video, animated graphics, and/or recorded scenarios. provided as a mixture of video data representing As an example, an augmented reality display may provide instructions or guidance provided as an animated or graphical overlay to a real-time feed of the workpiece being assembled and/or the tools being used in the assembly/manufacturing process. can be done.

いくつかの実施態様では、開示される技術のシステムは、生産ラインの様々な作業者ステーションに配置された1つまたは複数のビデオキャプチャデバイスまたはモーションキャプチャデバイスを含む。キャプチャデバイスは、その特定のステーションにおける作業者のモーション/部品、デバイス、材料または他のツール(「コンポーネント」)との相互作用を記録するように構成される。いくつかの態様では、作業者モーションはビデオ記録を使用してキャプチャできるが、他のモーションキャプチャフォーマット、例えば作業者モーションおよび/またはツールまたは製造製品との作業者の相互作用を表す3-Dポイントクラウドの使用も企図されている。さらに、特定のステーションに対する一人または複数人の熟練者のモーション、およびそのステーションにおけるコンポーネントとのその熟練者の相互作用を記録することにより、ステーション毎の参照ビデオを作り出すことも可能である。このビデオは、その熟練者の行為の単一の例から、または複数の例から作り出すことができる。熟練者毎のモーション経路を引き出すことができ、また、何人かの熟練者またはいくつかの例が使用される実施形態では、引き出されたモーション経路のセット(例えば平均)に対する計算を実施して、特定のステーションのための参照ビデオを作り出すことができる。参照ビデオは、その特定のステーションで実施されるべきモーション経路のデジタルまたは動画化表現の形態であってもよい。熟練者とは、特殊技術を有する誰か、または手引きが提供されている特定の組立てステップに関して知識がある誰かを意味することができることに留意されたい。 In some implementations, systems of the disclosed technology include one or more video or motion capture devices located at various worker stations on a production line. A capture device is configured to record the worker's motion/interaction with parts, devices, materials or other tools (“components”) at that particular station. In some aspects, worker motion can be captured using video recording, but other motion capture formats, such as 3-D points representing worker motion and/or worker interaction with a tool or manufactured product. Cloud use is also contemplated. In addition, it is also possible to create a station-by-station reference video by recording the motion of one or more technicians to a particular station and their interactions with the components at that station. This video can be created from a single example of the expert's actions or from multiple examples. Motion paths for each expert can be derived, and in embodiments where several experts or several examples are used, performing a calculation on the set (e.g., average) of the derived motion paths, A reference video can be created for a particular station. A reference video may be in the form of a digital or animated representation of the motion path to be performed at that particular station. Note that a skilled person can mean someone with specialized skills or knowledge of the particular assembly steps for which guidance is provided.

いくつかの実施形態では、生産ラインの様々な作業者ステーションに配置されたビデオキャプチャデバイスまたはモーションキャプチャデバイスは、組立てエラーを計算するために使用することができる、それぞれのステーションにおけるワークピース/コンポーネント/ツールの属性(例えば品質、引張り強さ、欠陥の数)もキャプチャできる。 In some embodiments, video or motion capture devices placed at various worker stations on a production line can be used to calculate assembly errors for workpieces/components/ Tool attributes (eg quality, tensile strength, number of defects) can also be captured.

作業者のそれぞれのステーションにおけるその相互作用をキャプチャすることにより、理想/熟練作業者相互作用/ワークフローを表すベースライン(グラウンドトルース)モデルとのキャプチャされた相互作用を比較することによって作業者エラーを検出することができる。すなわち理想化された相互作用モデルからの作業者偏差を使用して、例えば異なるステーションに提供された作業者指示/手引きを改定することにより、組立てチェーンにおける様々な場所で修復することができる組立てエラーを計算することができる。さらに、個々のステーションにおけるコンポーネントの品質をキャプチャし、かつ、そのステーションのためのベースラインコンポーネントに対して比較することも可能である。またベースラインコンポーネントからのコンポーネントの偏差を使用して、特定のステーションにおけるコンポーネントに品質等級を割り当て、あるいは様々なステーションに提供された作業者指示/手引きを改定することによって修復することができる作業者/組立てエラーを計算することも可能である。 By capturing a worker's interaction at each station, worker error can be determined by comparing the captured interaction with a baseline (ground truth) model representing the ideal/skilled worker interaction/workflow. can be detected. assembly errors that can be corrected at various locations in the assembly chain, i.e. using operator deviations from an idealized interaction model, for example by revising operator instructions/guidance provided to different stations can be calculated. Additionally, it is possible to capture the quality of the components at an individual station and compare against the baseline component for that station. Also, the deviation of a component from a baseline component can be used to assign a quality grade to a component at a particular station, or make repairs by revising operator instructions/guidance provided at various stations. / It is also possible to calculate the assembly error.

組立て修正は、所望の実施態様に応じて様々な方法で実施することができる。いくつかの態様では、作業者変化/エラーを使用して、例えば部品を品質等級(例えばA、B、C、等々)に分類し、引き続いてこれらの部品を適切な生産ラインへ導くことによって分類を実施することができる。別の態様では、検出された組立てエラーを使用して所与のステーションにおけるプロセスを改定し、それにより品質を改善し、かつ、変化を小さくすることができる。すなわち検出された組立てエラーを使用して、指示または手引きを同じステーションに自動的に提供することができ、それにより例えばそのステーションでもたらされたエラーを訂正することができる(例えばイン-ステーションリワーク)。NLPを使用して、作業者に対する指示または手引きを処理することができる。例えばNLPを使用して、口頭指示をテキスト形態に変換することができ、あるいはテキスト指示を口頭形態に変換することができる。 Assembly modifications can be implemented in a variety of ways depending on the desired implementation. In some embodiments, operator variations/errors are used to classify parts, for example, into quality grades (e.g., A, B, C, etc.) and subsequently direct these parts to the appropriate production line. can be implemented. In another aspect, detected assembly errors can be used to revise processes at a given station, thereby improving quality and reducing variability. That is, detected assembly errors can be used to automatically provide instructions or guidance to the same station, thereby, for example, correcting errors introduced at that station (eg, in-station rework). . NLP can be used to process instructions or guidance to workers. For example, NLP can be used to convert verbal instructions to text form, or vice versa.

例えば組立てエラー検出を使用して、エラーが生じることが分かっている所与のステーションに提供された作業者指示またはビデオに対する更新/変更を駆動することができる。一例として、エラー/偏差が第1のステーションで作業している第1の作業者によるものであることが識別されると、例えば第1のステーションの表示デバイスを介してその第1の作業者に提供された組立て指示を改定し、それにより第1のステーションを離れる製造物品に関連するエラー分散を小さくすることができる。 For example, assembly error detection can be used to drive updates/changes to operator instructions or video provided to a given station where an error is known to occur. As an example, once an error/deviation is identified as being due to a first worker working at a first station, the The provided assembly instructions can be revised, thereby reducing the error spread associated with the manufactured articles leaving the first station.

別の態様では、検出された組立てエラーを使用して、後続するステーション組立てを改定することができ、それによりステーション分散を克服することができる。すなわちエラー検出を使用して、上流側の作業者に起因するエラーに基づいて、新しい/更新された組立て手引きの下流側伝搬を自動的にトリガすることができる。例えば第1の作業者によって実行されたモーションに対するエラー分散を使用して、第1のステーションから下流側の第2のステーションと関連する第2の作業者に提供される組立て指示を調整することができる。 In another aspect, detected assembly errors can be used to revise subsequent station assembly, thereby overcoming station dispersion. That is, error detection can be used to automatically trigger downstream propagation of new/updated building instructions based on errors caused by upstream workers. For example, error distribution for motions performed by a first worker may be used to adjust assembly instructions provided to a second worker associated with a second station downstream from the first station. can.

さらに別の態様では、すべてのステーションにわたって検出されたエラー分散を前方へ伝搬させることができ、それにより残りの下流側組立てチェーン全体の進行にわたって、全体または部分的なリワークを実施することができることを保証することができる。すなわち一人(1つ)または複数の下流側作業者に提供された組立て指示を調整することにより、1つまたは複数のステーションにわたって生成されるエラーを修復し/低減することができる。一例では、第2のステーションの第2の作業者によって、また、第3のステーションの第3の作業者によって引き続いて実行される作業を介して、すなわち第2および第3のステーションに提供される組立て指示を調整することにより、第1のステーションの第1の作業者に起因する製造物品のエラー分散を修復することができる。 Yet another aspect is that the detected error distribution can be propagated forward across all stations so that full or partial rework can be performed over the course of the rest of the downstream assembly chain. can be guaranteed. That is, by adjusting the assembly instructions provided to one or more downstream workers, errors generated across one or more stations can be corrected/reduced. In one example, via work subsequently performed by a second worker at a second station and by a third worker at a third station, i.e., to the second and third stations By adjusting the assembly instructions, the error distribution of the manufactured article caused by the first operator at the first station can be corrected.

別の例では、複数のステーションにわたって累積されたエラー分散を1つまたは複数の後続するステーションによって小さくすることができる。例えば第3のステーションおよび第4のステーション(例えばそれぞれ第3の作業者および第4の作業者)に提供される組立て指示を調整することにより、第1のステーションおよび第2のステーションにわたって累積された製造物品のエラー分散を引き続いて修復することができる。 In another example, the error variance accumulated over multiple stations can be reduced by one or more subsequent stations. For example, by adjusting assembly instructions provided to a third station and a fourth station (e.g., a third worker and a fourth worker, respectively), Error distribution in the article of manufacture can be subsequently repaired.

組立てフローにおける個々の作業者/作業者ステーションをネットワークノードとして取り扱うことにより、機械学習モデルを使用して、個々のノード(ステーション)における組立て分散の低減を介してエラーを最小化することによって組立てプロセスを最適化することができる。個別のノード(作業者)分散を最小化し、また、実時間更新を実施して、前方エラー伝搬を軽減することにより、開示される技術のシステムは、最終製品に対する製造分散を著しく低減することができる。さらに、組立てワークフローにおける特定のセグメントからのエラー寄与を正確に定量化し、かつ、追跡することにより、製品品質または偏差量によって製品に等級を付け、かつ、分類することができる。したがって例えば製品品質に応じて、特定の品質分類の製品を異なる製造プロセスへ導き、あるいは異なる顧客へ導くことができる。 By treating individual workers/worker stations in the assembly flow as network nodes, machine learning models are used to optimize the assembly process by minimizing errors through reduction of assembly variance at individual nodes (stations) can be optimized. By minimizing individual node (worker) variance and implementing real-time updates to mitigate forward error propagation, the system of the disclosed technology can significantly reduce manufacturing variance to the final product. can. Additionally, by accurately quantifying and tracking error contributions from specific segments in the assembly workflow, products can be graded and sorted by product quality or amount of deviation. Thus, for example, depending on product quality, products of a particular quality class can be directed to different manufacturing processes or to different customers.

機械学習/人工知能(AI)モデルを使用してエラー検出を実施することができ、および/またはステーション組立て変化を最適化するために必要な修正を実施することができる。一例として、機械学習モデルは、それらに限定されないが、最終製品定格、最終製品変化統計量、所望の最終製品特性(例えば組立て時間、使用された材料の量、物理特性、欠陥の数、等々)、ステーション特化コンポーネント定格、ステーション特化コンポーネント変化、所望のステーションコンポーネント特性を含む訓練データの複数のソースを使用して訓練することができる。さらに、展開された機械学習モデルは、エラー検出およびエラー定量化計算を実施するために使用される理想化モデルの中に正規の知識が表現され得るよう、熟練者または「マスター設計者」から提供される入力に基づいて訓練し、あるいは初期化することができる。 Error detection can be performed using machine learning/artificial intelligence (AI) models and/or corrections necessary to optimize station assembly changes can be performed. By way of example, the machine learning model may include, but is not limited to, final product ratings, final product change statistics, desired end product characteristics (e.g., assembly time, amount of materials used, physical properties, number of defects, etc.). , station-specific component ratings, station-specific component variations, and desired station component characteristics. Additionally, the deployed machine learning model is provided by an expert or "master designer" so that formal knowledge can be represented in the idealized model used to perform the error detection and error quantification calculations. It can be trained or initialized based on the input it receives.

当業者には理解されるように、機械学習に基づく分類技法は、開示される技術から偏差することなく、所望の実施態様に応じて変更することができる。例えば機械学習分類スキームは、隠れマルコフモデル、回帰型ニューラルネットワーク、畳み込みニューラルネットワーク(CNN)、強化学習、深層学習、ベイズ記号モデル、敵対的生成ネットワーク(GAN)、サポートベクターマシン、画像登録法、適用可能規則ベースシステム、および/または任意の他の適切な人工知能アルゴリズムのうちの1つまたは複数を、単独で、あるいは組み合わせて利用することができる。回帰アルゴリズムが使用される場合、それらは、それらに限定されないが、Stochastic Gradient Descent Regressorおよび/またはPassive Aggressive Regressor、等々を含むことができる。 As will be appreciated by those skilled in the art, machine learning-based classification techniques can be modified according to desired implementation without departing from the disclosed technology. For example, machine learning classification schemes include Hidden Markov Models, Recurrent Neural Networks, Convolutional Neural Networks (CNN), Reinforcement Learning, Deep Learning, Bayesian Symbolic Models, Generative Adversarial Networks (GAN), Support Vector Machines, Image Registration Methods, Applied One or more of the possible rule-based system and/or any other suitable artificial intelligence algorithms may be utilized alone or in combination. Where regression algorithms are used, they can include, but are not limited to, Stochastic Gradient Descent Regressor and/or Passive Aggressive Regressor, and the like.

機械学習分類モデルは、クラスター化アルゴリズム(例えばMini-バッチK-平均クラスター化アルゴリズム)、推奨アルゴリズム(例えばMiniwise HashingアルゴリズムまたはEuclidean Locality-Sensitive Hashing(LSH)アルゴリズム)、および/または局所外れ値因子法などの異常検出アルゴリズムに基づくことも可能である。さらに、機械学習モデルは、Mini-batch Dictionary Learningアルゴリズム、Incremental Principal Component Analysis(PCA)アルゴリズム、Latent Dirichlet Allocationアルゴリズムおよび/またはMini-バッチK-平均アルゴリズム、等々のうちの1つまたは複数などの次元削減手法を使用することも可能である。 Machine learning classification models include clustering algorithms (such as the Mini-Batch K-Means clustering algorithm), recommendation algorithms (such as the Miniwise Hashing algorithm or the Euclidean Locality-Sensitive Hashing (LSH) algorithm), and/or local outlier factor methods. can also be based on the anomaly detection algorithm of Further, the machine learning model may be subjected to dimensionality reduction such as one or more of a Mini-batch Dictionary Learning algorithm, an Incremental Principal Component Analysis (PCA) algorithm, a Latent Dirichlet Allocation algorithm and/or a Mini-batch K-means algorithm, etc. It is also possible to use the technique.

いくつかの実施態様では、複数の異なるタイプの機械学習訓練/人工知能モデルを展開することができる。一例として、製造製品を最適化するべく、組立てラインプロセスを動的に調整するために、機械学習の一般的な形態を使用することができる。当業者には認識されるように、選択された機械化学習/人工知能モデルは、一組の組立て/製造指示を単純に含んでいるのではなく、組立てラインプロセス全体に関するフィードバック、および結果として得られる製造製品に対するその影響を提供し、また、組立てラインにおける下流側作業者ステーションに対する動的調整を提供し、それにより上流側作業者ステーションで生じる行為を補償するための方法である。このタイプの人工知能ベースフィードバックおよびフィードフォワードモデルは、本明細書においてはArtificial Intelligence Process Control(AIPC)と呼ばれている。いくつかの実施形態では、機械学習は、ターゲット化ゲート付き回帰型ユニット(GRU)モデルベース学習およびハウスドルフ距離最短化を利用して、可能回復経路の空間を効果的に探索し、それにより組立てプロセスの間にエラーを修正するための最適経路を見出す、模擬された環境における深層学習モデルに基づくことができる。さらに他の実施形態では、例えば機械学習アルゴリズムは、Long Short-Term Memoryモデルに基づくことができ、それにより組立てプロセスのビデオ入力を解析し、かつ、最終品質メトリック(出力)を予測することができる。さらに、機械学習モデルをNLPアルゴリズムの形態で使用して、作業者コンプライアンスおよび調整された指示の理解を最大化するために、音声へのテキストの変換またはテキストへの音声の変換などの、作業者ステーションへのフィードバックを調整することもできる。 In some implementations, multiple different types of machine learning trained/artificial intelligence models can be deployed. As an example, general forms of machine learning can be used to dynamically adjust assembly line processes to optimize manufactured products. As those skilled in the art will appreciate, the selected machine learning/artificial intelligence model does not simply contain a set of assembly/manufacturing instructions, but feedback on the entire assembly line process and the resulting A method for providing its effect on manufactured products and also for providing dynamic adjustments to downstream worker stations in an assembly line, thereby compensating for actions occurring at upstream worker stations. This type of artificial intelligence-based feedback and feedforward model is referred to herein as Artificial Intelligence Process Control (AIPC). In some embodiments, machine learning utilizes targeted gated recurrent unit (GRU) model-based learning and Hausdorff distance minimization to effectively explore a space of possible recovery paths, thereby assembling It can be based on deep learning models in simulated environments that find optimal paths to correct errors during the process. In still other embodiments, for example, a machine learning algorithm can be based on the Long Short-Term Memory model, which can analyze the video input of the assembly process and predict the final quality metric (output). . Additionally, machine learning models, in the form of NLP algorithms, are used to maximize worker compliance and comprehension of coordinated instructions, such as text-to-speech or speech-to-text. You can also adjust the feedback to the station.

いくつかの実施形態では、機械学習を利用する計算モデルを使用して、手動組立てプロセスの間のエラーを修正することができる。 In some embodiments, computational models that utilize machine learning can be used to correct errors during the manual assembly process.

目標対象は、処理手順によって定義される一連のステップを介して組み立てることができる。プロセスの間、公称対象の最終構成を得るためにはすべての残りの作業を改定する必要があることになる特定のステップkで不可逆エラーが生じ得る。いくつかの実施形態では、エラーを修正するための手法は、ステップkにおける欠陥のある目標対象を、同じステップkにおける公称対象に対して比較するステップ、またはステップkにおける欠陥のある目標対象をその最終構成の公称対象に対して比較するステップを含むことができる。これらの比較を使用して、欠陥のある目標対象の最終構成と公称対象の最終構成との間の偏差を最小化するために必要な上記一連のステップを決定することができる。いくつかの実施形態では、目標対象の品質メトリックを使用して、欠陥のある目標対象の修正を導くこともできる。 A target object can be assembled through a series of steps defined by a procedure. During the process, irreversible errors can occur at certain steps k that would require revision of all remaining work in order to obtain the final configuration of the nominal object. In some embodiments, the technique for correcting the error includes comparing the defective target object at step k to a nominal target at the same step k, or comparing the defective target object at step k to its A step of comparing against a nominal target of the final configuration may be included. These comparisons can be used to determine the sequence of steps required to minimize the deviation between the final configuration of the defective target object and the final configuration of the nominal object. In some embodiments, the target object quality metric can also be used to guide the correction of defective target objects.

一般的な数値手法は、ハウスドルフ距離アルゴリズムを使用することによって問題を解決することができ、それにより欠陥のある目標対象を組み立てるための一連のk個のステップが、公称対象をその最終構成に組み立てるための一連のステップに如何に類似しているかを決定することができる。欠陥のある組み立てられた対象における上記一連のk個のステップと、組み立てられた最終の公称対象における一連のステップとの間のハウスドルフ距離を計算によって最短化するためのいくつかの方法は、瞬時報酬公式化、多重報酬公式化、または遅延報酬公式化を介してMarkov Decision Process(MDP)を最適化することである。しかしながらこれらの公式化と関連する探索空間には、著しい量の計算資源が必要である。 A general numerical approach can solve the problem by using the Hausdorff distance algorithm, whereby a sequence of k steps to assemble the faulty target object transforms the nominal object into its final configuration. It can be determined how similar the sequence of steps to assembly is. Some methods for computationally minimizing the Hausdorff distance between the above sequence of k steps in the faulty assembled object and the sequence of steps in the final assembled nominal object are instantaneous Optimizing the Markov Decision Process (MDP) via reward formulation, multiple reward formulation, or delayed reward formulation. However, the search spaces associated with these formulations require a significant amount of computational resources.

代替として、機械学習フレームワークは、強化学習を使用して、遅延報酬ポリシーエージェントと共に発展させることも可能である。強化学習フレームワークは、欠陥のある目標対象のエラーを修正するために必要な適切なステップをポリシーエージェントに決定させて、公称対象の性能メトリックと一致する性能メトリックを有する最終構成を得るように設計することができる。ポリシーエージェントに与えられる報酬は遅延され、ポリシーエージェントに報酬が支払われるのは、最終ステップが実行されたときのみである。 Alternatively, machine learning frameworks can be developed with delayed reward policy agents using reinforcement learning. A reinforcement learning framework is designed to let the policy agent determine the appropriate steps required to correct the faulty target target error, resulting in a final configuration with a performance metric that matches the nominal target performance metric. can do. Rewards given to policy agents are delayed and paid to policy agents only when the final step is executed.

いくつかの実施形態では、最適な/所望の製造製品のための設計を選択することができ、また、熟練作業者を展開して、選択された設計に従って製造製品を組み立てるために個々の作業者ステーションで実施される個々のステップを実施することができる。最適とは、結果として得られる製造製品におけるエラー、または何らかの他の基準を最小化する、結果として得られる製品の所望の性能および/または特性に基づくことができる(例えば製造製品が紙飛行機である場合、最適な紙飛行機は、所望の飛行目標を達成する紙飛行機であろう)。複数の画像化デバイスを使用して、作業者のモーションおよび作業者が組み立てている製造製品との作業者の相互作用をキャプチャし、それによりビデオ、画像および/または3Dポイントクラウドデータを生成することができる。キャプチャされたデータは、組み立てられている際の製造製品に対する関係における作業者の手座標、一方の手ともう一方の手の関係、および組み立てられている際の製造製品に対する指(およびいくつかの実施形態では指の関節)の関係などの詳細な情報を提供することができる。熟練作業者から収集されたデータは、最適な/所望の製造製品を組み立てるためのグラウンドトルースとして使用することができる。単一の例からのこのグラウンドトルースは、それはそれで、初期機械学習モデルの創出に使用するためには十分であり、あるいは追加データを収集することも可能である。例えば作業者のモーションの変化またはエラーが、結果として得られる製造製品に対して如何に影響を及ぼし得るかを理解するために、多くの作業者を展開して、最適な製造製品を組み立てる1つまたは複数のステップを実施することができる。これは、組立てラインにおける作業者ステーション毎に実施することができる。結果として得られる最終製品およびそれらのそれぞれの組立てプロセスの両方を、互いに対して、また、グラウンドトルースに対して比較し、それによりエラーおよび/または作業者のモーションの変化が製造製品の特性および/または性能に如何に影響を及ぼし得るかを決定することができる(例えば作業者の速度は、品質がより劣る飛行機をもたらし得る)。実際の組立てプロセス(すなわち人間、ロボットまたは機械が1つまたは複数のステーションでモーションを実施しているプロセス)の間に、作業者に基づいて収集されたデータは、本明細書においては「実際の訓練データ」と呼ばれることになる。実際の訓練データは、模擬されたデータで補足することができ、それにより、より豊富なデータセットを得ることができ、また、最適な製造製品を達成するための追加変形形態を提供することができる。「最適な」および「所望の」という用語は、本明細書においては交換可能に使用されることになることに留意されたい。 In some embodiments, the design for the optimal/desired manufactured product can be selected and a skilled worker deployed to individual workers to assemble the manufactured product according to the selected design. Individual steps performed at the station can be implemented. Optimal can be based on the desired performance and/or characteristics of the resulting product that minimize errors in the resulting manufactured product, or some other criteria (e.g., if the manufactured product is a paper airplane). , the optimal paper plane would be the one that achieves the desired flight goal). Using multiple imaging devices to capture worker motion and worker interaction with the manufactured product they are assembling, thereby generating video, images and/or 3D point cloud data can be done. The captured data includes the worker's hand coordinates in relation to the manufactured product as it is being assembled, the relation of one hand to the other, and the fingers (and some Detailed information such as knuckle (knuckle) relationships in embodiments may be provided. Data collected from skilled workers can be used as ground truth for assembling the optimal/desired manufactured product. This ground truth from a single example is, by itself, sufficient for use in creating initial machine learning models, or additional data can be collected. For example, deploying many workers to assemble an optimal manufactured product to understand how variations in worker motion or errors can affect the resulting manufactured product. Or multiple steps can be performed. This can be done for each worker station on the assembly line. Both the resulting final products and their respective assembly processes are compared against each other and against the ground truth so that errors and/or changes in operator motion are reflected in the characteristics of the manufactured product and/or Or it can determine how performance can be affected (eg, operator speed can result in a plane of lesser quality). Data collected on a worker basis during the actual assembly process (i.e., a process in which a human, robot, or machine is performing motions at one or more stations) is herein referred to as "actual It will be called "training data". The actual training data can be supplemented with simulated data to obtain a richer data set and to provide additional variations to achieve optimal manufactured product. can. Note that the terms "optimal" and "desired" will be used interchangeably herein.

いくつかの実施形態では、本明細書において考察されている異なるAI/機械学習/深層学習モデルは、Artificial Intelligence Process Control(AIPC)を達成して製造物品の組立てを最適化するために、以下で説明される特定の順序で展開することができる。AIPC深層学習モデルを実現することができる例示的プロセスは、図1に関連して(例えばAIPC深層学習モデル112に関連して)、また、図2に関連してさらに詳細に考察される。AIPC深層学習モデルを実現するために使用することができるハードウェアシステムおよび/またはデバイスの例は図3に提供されており、また、対応する説明も以下に提供されている。 In some embodiments, the different AI/machine learning/deep learning models discussed herein are used below to achieve Artificial Intelligence Process Control (AIPC) to optimize the assembly of articles of manufacture. It can unfold in the specific order described. An exemplary process by which an AIPC deep learning model may be implemented is discussed in greater detail in connection with FIG. 1 (eg, in connection with AIPC deep learning model 112) and in connection with FIG. An example of a hardware system and/or device that can be used to implement an AIPC deep learning model is provided in FIG. 3, and a corresponding description is also provided below.

第1に、CNNを組立てラインプロセスに使用して、個々の作業者ステーションにおいて、作業者の手の特徴および異なる構成の製造物品の特徴を分類することができる。 First, CNNs can be used in assembly line processes to classify characteristics of workers' hands and different configurations of manufactured articles at individual worker stations.

第2に、いずれもCNN分類からの所望の結果を達成するために、また、定義済みの望ましい結果のために、強化学習(RL)およびRLエージェントを使用し、かつ、報酬を与えることができる。RLエージェントは、監視しても、あるいは監視しなくてもよい。 Second, both Reinforcement Learning (RL) and RL agents can be used and rewarded to achieve desired results from CNN classification and for defined desired results. . The RL agent may or may not monitor.

第3に、Generative Adversarial Networks(GAN)を使用して、対立するRLエージェント間で選ぶことができる。GANは、ノードとしてGANに入力するRLエージェントの選択を人間にのみ頼る最小の人間監視を含むことができる。 Third, Generative Adversarial Networks (GAN) can be used to choose between competing RL agents. A GAN can include minimal human oversight, relying only on humans to select RL agents that enter the GAN as nodes.

第4に、RNNは、フィードバックおよびフィードフォワードシステムを作り出すための入力ノードとして勝利RL(winning RLs)を取ることができ、したがって学習を連続的なものにすることができ、また、学習を監視しなくてもよい。 Fourth, RNNs can take winning RLs as input nodes to create feedback and feedforward systems, thus making learning continuous and monitoring learning. It doesn't have to be.

これらの4つのAI/機械学習モデルの実施態様は、以下でより詳細に考察される。 Implementations of these four AI/machine learning models are discussed in more detail below.

いくつかの実施形態では、実際の訓練データは、組立てプロセスにおける関連するデータを分類し、例えば作業者ステーション毎の個々の組立てステップで使用された指/手、組み立てられている製品のうちの、作業者の指が任意の時間点および空間で触れた部分、および任意の時間点および空間における、組み立てられている製造製品の形状または構成を分類するためにCNNに入力することができる。 In some embodiments, the actual training data classifies relevant data in the assembly process, e.g., fingers/hands used in individual assembly steps per worker station, of the product being assembled, The part touched by the operator's finger at any point in time and space, and the shape or configuration of the manufactured product being assembled at any point in time and space, can be input into the CNN to classify.

さらに他の実施形態では、手のモーションは追跡しないが、製造製品の組立てパターンの様々な変化を表すデータを収集することも可能である(例えば製造製品が折り畳まれた紙飛行機である場合、折畳み順序を変更すること、折畳み変化を実現すること、および/または潜在的エラーを導入することに基づいてデータを収集することができ、製造製品が衣類物品である場合、例えば縫合せ順序、縫合せ変化を実現すること、および/または潜在的エラーを導入することに基づいてデータを収集することができる)。このデータは模擬することができ、および/または実際の訓練データから収集することができる。結果として得られる製造製品およびそれらのそれぞれの組立てプロセスを比較し、それによりエラーまたは組立てパターンの変化が製造製品の特性および/または性能に如何に影響を及ぼすかを決定することができる。 In still other embodiments, hand motions are not tracked, but data representing various changes in the assembly pattern of the manufactured product may be collected (e.g., if the manufactured product is a folded paper airplane, folding Data can be collected based on changing the order, implementing folding changes, and/or introducing potential errors, and if the manufactured product is a clothing article, e.g. Data may be collected based on implementing changes and/or introducing potential errors). This data can be simulated and/or gathered from actual training data. The resulting manufactured products and their respective assembly processes can be compared to determine how errors or changes in assembly patterns affect the characteristics and/or performance of the manufactured products.

いくつかの実施形態では、キャプチャされたデータ(例えばビデオおよび組立てプロセスの手の追跡、等々)を使用して、最終アウトプットの品質が予測される。この品質予測により、キャプチャされたデータを使用して、製造プロセスの間、製品の品質を手動で検査する必要なく、製品を品質ビンに分類することができ、また、下流側で修正行為を取ることができる。 In some embodiments, captured data (eg, video and hand tracking of the assembly process, etc.) is used to predict final output quality. This quality prediction allows the captured data to be used during the manufacturing process to classify products into quality bins without the need to manually inspect product quality and to take corrective action downstream. be able to.

いくつかの実施形態では、システムは、目標対象の手動組立てに的を絞ることができ、手動組立てでは、組立てプロセスは、作業者が一組の指示毎に目標対象に対して異なる作業を実施するいくつかの離散ステップを含む。システムは、作業者の手の位置の時間シリーズと目標対象の最終品質との間の相関を確立する深層学習モデルを使用している機械学習フレームワーク(すべての作業者行為全体)を使用して構築することができる。いくつかの実施形態では、モデルは2つのニューラルネットワークからなっていてもよく、第1のニューラルネットワークは、3D環境における作業者の手の位置データを抽出するために使用され、また、第2のニューラルネットワークは、手の位置データから不必要な要素を取り除いて目標対象の性能の最終品質と相関させるために使用される。 In some embodiments, the system can focus on manual assembly of a target object, where the assembly process involves a worker performing different tasks on the target object for each set of instructions. Contains several discrete steps. The system uses a machine learning framework (across all worker actions) that uses deep learning models to establish correlations between the time series of worker hand positions and the final quality of the target object. can be built. In some embodiments, the model may consist of two neural networks, a first neural network used to extract the position data of the worker's hand in the 3D environment, and a second neural network A neural network is used to remove unnecessary elements from the hand position data and correlate it with the final quality of performance of the target object.

いくつかの実施形態では、第1のニューラルネットワークは、ビデオ収集システムを使用して、作業者が目標対象の組立てと関連して実施する個々の離散ステップに対応する異なるノードビデオにおける組立てプロセスの間、作業者の手のビデオを記録することができる。例えば作業者は、異なる場所に配置され、また、組立てプロセスを同時に記録するように構成されたいくつかのカメラを使用して組立てプロセスを実施することができる。これらのカメラを使用して、作業者の手の予め規定された位置で、複数回にわたってビデオをキャプチャすることができる。次に、これらのビデオを処理して、目標対象の組立てプロセス全体を表すいくつかの画像またはランドマークフレームを抽出することができる。これらのランドマークフレームを使用して、組立てプロセスの間、作業者の手および指の位置またはキーポイントの画定を促進する手の追跡情報を抽出することができる。 In some embodiments, the first neural network uses the video acquisition system to generate images during the assembly process in different node videos corresponding to individual discrete steps that the worker performs in connection with the assembly of the target object. , a video of the worker's hand can be recorded. For example, a worker may carry out an assembly process using several cameras positioned at different locations and configured to simultaneously record the assembly process. These cameras can be used to capture video multiple times at predefined positions of the worker's hand. These videos can then be processed to extract a number of images or landmark frames representing the overall target object assembly process. These landmark frames can be used to extract hand tracking information that facilitates defining the positions or key points of the worker's hands and fingers during the assembly process.

いくつかの実施形態では、手の追跡情報を抽出するために、バウンディングボックス予測アルゴリズムおよび手キーポイントディテクターアルゴリズムを適用することができる。詳細には、バウンディングボックス予測アルゴリズムは、閾値画像分割を使用して、組立てプロセスからのランドマークフレームを処理し、それにより作業者の手のためのマスク画像を得ることを含むことができる。手は、ブロブ検出(blob detection)を使用してマスクの上に位置付けることができる。バウンディングボックス予測は、マスク画像を使用して、ボックスが少なくとも手のリストポイントまでの手の位置の形状の最も高い点を含むよう、作業者の手の各々の周りにボックスを形成する。次に、バウンディングボックスおよびそれらの対応するランドマークフレームが手キーポイントディテクターアルゴリズムに供給される。 In some embodiments, a bounding box prediction algorithm and a hand keypoint detector algorithm can be applied to extract hand tracking information. Specifically, the bounding box prediction algorithm may involve using threshold image segmentation to process the landmark frames from the assembly process, thereby obtaining a mask image for the worker's hand. The hand can be positioned over the mask using blob detection. Bounding box prediction uses the mask image to form a box around each of the worker's hands such that the box contains the highest point of the hand position shape at least up to the hand list point. The bounding boxes and their corresponding landmark frames are then fed to the hand keypoint detector algorithm.

手キーポイントディテクターアルゴリズムは、作業者の手の特定のキーポイントを検出することができる機械学習モデルを含むことができる。手キーポイントディテクターアルゴリズムは、ランドマークフレームの中で見ることができるキーポイントだけでなく、関節、視点、対象、手の相互作用のためにフレームから隠蔽(閉塞)されるキーポイントを予測することができる。異なる手の位置が異なる隠蔽(閉塞)点を異なるフレームに生成するため、あるフレームにおける特定の隠蔽(閉塞)点は、他のフレームでは隠蔽(閉塞)され得ない。手キーポイントディテクターは、特定のレベルの確実性で隠蔽(閉塞)されるキーポイントの場所を予測する。しかしながら隠蔽(閉塞)されるキーポイントの場所の予測は、異なる手の位置に対して同じキーポイント場所が記録されることになり得る。手動組立てプロセスのステップの間、作業者の手を画定している手キーポイントは、次に第2のニューラルネットワークに提供される。 A hand keypoint detector algorithm can include a machine learning model that can detect specific keypoints on a worker's hand. The hand keypoint detector algorithm predicts not only the keypoints that are visible in the landmark frame, but also the keypoints that are hidden (occluded) from the frame due to joint, viewpoint, object, and hand interactions. can be done. A particular occlusion (occlusion) point in one frame cannot be occluded (occluded) in another frame because different hand positions produce different occlusion (occlusion) points in different frames. A hand keypoint detector predicts the location of obscured (occluded) keypoints with a certain level of certainty. However, prediction of hidden (occluded) keypoint locations can result in the same keypoint locations being recorded for different hand positions. During the steps of the manual assembly process, the hand keypoints defining the worker's hand are then provided to a second neural network.

いくつかの実施形態では、第2のニューラルネットワークを使用して、組み立てられた対象の最終状態の品質が予測される。いくつかの実施形態では、ニューラルネットワークは、Long Short-Term Memory(LSTM)モデルに基づくことができる。LSTMは、順番に配列され、相俟って最終対象の組立てプロセス全体を表すいくつかのセルを有している。LSTMセルへの入力は、LSTMセルによって表される組立てプロセスの特定のステップにおける作業者の作業に対応する手キーポイントデータであってもよい。LSTMにおける個々のセルは、先行するセルからの情報を記憶するべきであるかどうかを決定し、更新する値を選び、セルに対する更新を実施し、出力する値を選び、次に、選ばれた値のみをセルが出力するよう、値をフィルタリングする。LSTMは、Adamオプティマイザーまたは他の適合学習率最適化アルゴリズムを使用して訓練された、1つのモデルに対するシーケンスであってもよい。ニューラルネットワークは、LSTMフレームワークを使用して、手動組立てプロセスから抽出された入力データを相関し、それにより最終製品の品質測値を決定する。 In some embodiments, a second neural network is used to predict the final state quality of the assembled object. In some embodiments, the neural network can be based on the Long Short-Term Memory (LSTM) model. The LSTM has several cells that are arranged in sequence and together represent the overall assembly process of the final object. The input to the LSTM cell may be hand keypoint data corresponding to a worker's work in the particular step of the assembly process represented by the LSTM cell. Each cell in the LSTM decides whether to store information from the preceding cell, chooses a value to update, performs an update to the cell, chooses a value to output, and then chooses Filter the values so that the cell outputs only the values. An LSTM may be a sequence for one model trained using the Adam optimizer or other adaptive learning rate optimization algorithms. The neural network uses the LSTM framework to correlate input data extracted from the manual assembly process, thereby determining quality measurements of the final product.

いくつかの実施形態では、目標対象のための組立てプロセスを表すビデオおよび手追跡情報、すなわちモデルを訓練するために使用される入力データは、単一の一組の組立て指示を使用して複数の目標対象を組み立てるための組立てプロセスを実施する複数の作業者から収集することができる。作業者によって組み立てられた目標対象を制御された環境で使用して、組み立てられた対象の性能に対する対応する品質測値、すなわちモデルを訓練するために必要な出力データを収集することができる。 In some embodiments, the video and hand-tracking information representing the building process for the target object, i.e. the input data used to train the model, are generated from multiple models using a single set of building instructions. It can be collected from multiple workers performing an assembly process for assembling the target object. A target object assembled by a worker can be used in a controlled environment to collect corresponding quality measures for the performance of the assembled object, i.e. the output data required to train the model.

いくつかの態様では、機械学習モデルを生成するために使用される訓練データは、模擬されたデータからのもの、実際の訓練データからのもの、および/または熟練者のグラウンドトルース記録からのものであってもよく、それらは、組み合わせたものであっても、あるいは個別であってもよい。いくつかの実施形態では、模擬されたデータ結果を使用して機械学習モデル、例えば(それには限定されないが)Reinforcement Learning(RL)エージェントを構築することができる。他の実施形態では、実際の訓練データを使用して機械学習モデル、例えば(それには限定されないが)Reinforcement Learning(RL)エージェントを構築することができる。RLエージェントは、良好な/所望の結果を達成すると報酬が支払われ、また、悪い結果に対しては処罰される。 In some aspects, the training data used to generate the machine learning model is from simulated data, from actual training data, and/or from expert ground truth recordings. There may be, and they may be combined or separate. In some embodiments, the simulated data results can be used to build machine learning models, such as (but not limited to) Reinforcement Learning (RL) agents. In other embodiments, the actual training data may be used to build machine learning models, such as (but not limited to) Reinforcement Learning (RL) agents. RL agents are rewarded for achieving good/desired results and penalized for bad results.

いくつかの実例では、多くのRLエージェント(そのうちのいくつかは実際の訓練データに基づき、また、いくつかは模擬されたデータに基づく)は、縦列をなして働くように展開することができ、また、累積授与を最大化するように構成することができ、例えば理想モデル/例からの最も小さい偏差を有する製造製品を組み立てる。RLエージェントに報酬を支払うことができる例示的結果は、可能な限り少ないステップで完全な製造製品を完成すること、製造製品を達成するために必要な材料の量または時間を低減することを含む。模擬されたデータに基づくRLエージェントおよび実際の訓練データに基づくRLエージェントを使用して、最適な/所望の製造物品をもたらす最適モーションパターンおよび/または最適組立てパターンを決定することができる。 In some instances, many RL agents, some based on real training data and some based on simulated data, can be deployed to work in tandem, It can also be configured to maximize the cumulative award, e.g. build the manufactured product with the smallest deviation from the ideal model/example. Exemplary outcomes that may reward the RL agent include completing a complete manufactured product in as few steps as possible, reducing the amount of materials or time required to achieve the manufactured product. RL agents based on simulated data and RL agents based on actual training data can be used to determine optimal motion patterns and/or optimal assembly patterns that result in optimal/desired manufactured articles.

これらの2つのグループのRLエージェント(例えば実際の訓練データに基づいて作り出されたRLエージェント、および模擬されたデータに基づいて作り出されたRLエージェント)は、それらはいずれも最適な/所望の製造製品を作る行為に対して報酬が支払われているため、ここでは共同して働くことができ、さらには競合することができる。いくつかの実施形態では、最適な製造製品のための最適な組立てパターンをもたらした模擬ベースのRLエージェントから得られたデータを使用して、実際の訓練データセットのための可能性空間を小さくすることができる。例えば模擬されたRLエージェントを使用して最適な組立てパターンを決定することができ、次に、最適ではない組立てパターンに対してではなく、最適な組立てパターンに対してのみ実際の訓練データを収集することができる。実際の訓練データの収集にのみ、あるいは最適な組立てパターンにのみ的を絞ることにより、より少ない訓練データを収集することができ、および/またはより多くの実際の訓練データを収集するためのより大きい容量を達成することができるが、それは最適な組立てパターンに対してのみである。 These two groups of RL agents (e.g., RL agents created based on real training data, and RL agents created based on simulated data) are both optimal/desired manufactured products. You can work together and even compete here because you are paid for the act of creating In some embodiments, data obtained from simulated-based RL agents that yielded optimal assembly patterns for optimal manufactured products is used to reduce the probability space for the actual training dataset. be able to. For example, a simulated RL agent can be used to determine the optimal assembly pattern, then collect actual training data only for the optimal assembly pattern, not for the non-optimal assembly pattern. be able to. By focusing only on the collection of actual training data, or only on the optimal assembly pattern, less training data can be collected and/or a larger training data to collect more actual training data. Capacity can be achieved, but only for optimal assembly patterns.

報酬は時によっては対立することがあるため、強化学習のみに頼って組立てラインを最適化することには限界がある。例えば製品の組立てにおいては、偽りの動き(例えば折畳んで、直ちにその折畳みを元に戻す、あるいは縫い目を追加して、直ちにその縫い目を取り除く)が最も少ない場合に対して、いくつかのRLエージェントに報酬を支払うことができ、一方、速度に対して、他のRLエージェントに報酬を支払うことができる。速度に対して報酬が支払われているRLエージェントは、組立てプロセスにおける下流側で必要な修正がより少ないため、より多くの偽りの動きがより速い組立て時間をもたらすことを決定することができる。このような実施態様トレードオフ決定をなすことは、人間が容易に判断することができるようなものではない。経験および大量の例を有している場合であっても、人間には、異なる方法で作業する異なる作業者による最終結果を把握することは如何に微妙なものであるかを理解する計算能力が依然として欠けている。 Relying solely on reinforcement learning to optimize assembly lines is limited because rewards can sometimes be conflicting. For example, in product assembly, for the least amount of spurious motion (e.g., folding and immediately unfolding, or adding a seam and immediately removing the seam), several RL agents , while other RL agents can be rewarded for speed. An RL agent that is paid for speed can determine that more spurious movements result in faster assembly times because fewer modifications are required downstream in the assembly process. Making such implementation trade-off decisions is not something that can be readily determined by a human being. Even with experience and a large number of examples, humans lack the computational power to understand how subtle it is to perceive the end result of different workers working in different ways. still lacking.

これらの対立するRLエージェント最適化を解決するために、GANを展開して決定者として作用させることができる。対立は、実際の訓練データに基づくRLエージェント同士の間、模擬されたデータに基づくRLエージェント同士の間、および/または実際の訓練データに基づくRLエージェントと模擬されたデータに基づくRLエージェントとの間であってもよい。 To resolve these conflicting RL agent optimizations, GANs can be deployed to act as decision makers. Conflicts may arise between RL agents based on actual training data, between RL agents based on simulated data, and/or between RL agents based on actual training data and RL agents based on simulated data. may be

いくつかの実施形態では、GANは、さらに多くの頑丈なニューラルネットワークを作り出すために、RLエージェントの各々を試験し、かつ、その結果を記憶することができる。GANは、RLエージェントを取り、また、ゼロ-サムゲームにおける勝者および敗者をもたらすモデルを使用することによって動作する。GANには「ジェネレータ」および「ディスクリミネータ」が存在している。ジェネレータは、この場合、対立するRLエージェントからの報酬データを記憶することになり、また、ディスクリミネータは、これらのうちのどちらが所望の製造製品を作り出すタスクに対して最も関連しているかを評価することになる。GANは、ノード(またはニューロン)の深層ネットワークを使用して、ノードに重みを付ける方法を決定する。個々のRLエージェントは、個々のRLエージェントが既に最適決定を下していることを信じているため、対立しているRLエージェントのうちのどちらが実際に最も関連する選択をなすかを決定することはGANの役割であり、また、ディスクリミネータは、それに応じて重みを調整する。対立するRLエージェント同士の間でゼロ-サムゲームが開始されると、対立するRLエージェント同士の間で勝者のグループが生成され、これらの勝者のみが、組立てラインにおけるワークフローを最適化するために使用される機械学習モデルのために使用されることになる。勝利RLエージェントを決定するために大量のデータが生成されることになる可能性があるが、結果は、入力ノードとして使用される、これらの勝者を作り出し、かつ、見出すために使用されるものよりもはるかに貧弱である。 In some embodiments, the GAN can test each of the RL agents and store the results to create more robust neural networks. GANs operate by taking RL agents and using models that yield winners and losers in zero-sum games. There are "generators" and "discriminators" in GANs. The generator would in this case store reward data from opposing RL agents, and the discriminator would evaluate which of these was most relevant to the task of creating the desired manufactured product. will do. A GAN uses a deep network of nodes (or neurons) to determine how to weight nodes. Since each RL agent believes that each RL agent has already made the optimal decision, it is impossible to determine which of the conflicting RL agents actually makes the most relevant choice. It is the role of the GAN and the discriminator adjusts the weights accordingly. When a zero-sum game is initiated between opposing RL agents, groups of winners are generated among the opposing RL agents, and only those winners are used to optimize workflow on the assembly line. will be used for machine learning models that are Although a large amount of data can be generated to determine the winning RL agent, the results are more than those used to create and find those winners used as input nodes. is also much poorer.

GAN戦争に生き残り、かつ、適切に報酬が支払われたRLエージェントが決定されると、いくつかの実施形態では、それらをRecurrent Neural Network(RNN)と呼ばれる別のAIシステムに入力することができる。RNNは、それがDeep Learning Neural Networkであり、入力データの様々な形態の重み付けを介して最終結果が最適化される点で、CNNに対して多くの類似性を有している。1つの相違は、入力から出力まで線形プロセスであるCNNとは異なり、RNNは、結果として得られる出力、さらには内部ノードを新しい訓練情報としてフィードバックするループであることである。RNNは、GRUなどのフィードバックシステムおよびフィードフォワードシステムの両方である。 Once the RL agents that survived the GAN war and were appropriately paid are determined, they can be input into another AI system called the Recurrent Neural Network (RNN) in some embodiments. RNN has many similarities to CNN in that it is a Deep Learning Neural Network and the final result is optimized through various forms of weighting of the input data. One difference is that unlike CNNs, which are linear processes from input to output, RNNs are loops that feed back the resulting output, as well as internal nodes, as new training information. RNNs are both feedback and feedforward systems such as GRUs.

いくつかの実施形態では、機械学習フレームワークは、ターゲット化GRUモデル-ベース学習を利用して構築することができる。GRUモデルは、その予測能力および比較的短い訓練時間のため、強化学習の代わりに選ぶことができる。GRUは、メモリに記憶するべき、あるいは状態を更新するべき観察と、忘れ去るべき、あるいは状態をリセットするべき観察との間を区別するためにRNNに使用される。 In some embodiments, a machine learning framework can be built utilizing targeted GRU model-based learning. The GRU model can be chosen instead of reinforcement learning because of its predictive power and relatively short training time. The GRU is used by the RNN to distinguish between observations that should be stored in memory or update state and observations that should be forgotten or reset state.

いくつかの実施形態では、GRUモデルは、目標対象を構築するために必要な組立てステップの数に対応するいくつかのGRUセルから構成することができる。組立てステップの数のうちの1つを表す個々のGRUセルは、いくつかの入力パラメータおよび隠れ状態出力を有することができる。組立てプロセスにおける最終ステップを表すGRUセルは、目標対象を出力することになる。モデルの出力は、公称対象からの目標対象の偏差である。この偏差は、目標対象から公称対象までのステップ方式ハウスドルフ距離、および公称対象の最終構成の性能メトリックを使用して計算することができる。個々のGRUセルは、リセット、更新および新しいゲートによって画定される。GRUニューラルネットワークは反復して訓練され、それによりGRUニューラルネットワークを特定の副題の解決に向かってバイアスさせ、また、GRUのための一組の重みを識別する。例えば反復毎に、後続するステップにおける組立てプロセスを完了するためにいくつかの予測(特定のステップにおける可能なエラー毎に1つの予測)が生成される。さらに、修正された組立てプロセスの対応する予測された距離測度を生成することができる。これらの予測された組立てプロセス完了は、仮想表現システム、および「グラウンドトルース」距離測度を得るために計算されたそれらのステップ方式ハウスドルフ距離の中で描写することができる。「グラウンドトルース」と予測された距離測度の差を計算してモデルにフィードバックすることができ、そのネットワーク重みは、次の反復を生成する後方伝搬を介して調整される。このプロセスは、GRUのための上記一組の重みが識別されるまで継続することができる。いくつかの実施形態では、確率的勾配降下法(stochastic gradient descent method)を使用して、欠陥のある目標対象を修正し、また、満足すべき最終構成を得るために必要なステップを引き出すことができる。 In some embodiments, a GRU model can consist of a number of GRU cells corresponding to the number of assembly steps required to build the target object. Each GRU cell representing one of the number of assembly steps can have several input parameters and hidden state outputs. The GRU cell, which represents the final step in the assembly process, will output the target object. The output of the model is the deviation of the target object from the nominal object. This deviation can be calculated using the stepped Hausdorff distance from the target object to the nominal object and the performance metric of the final configuration of the nominal object. Individual GRU cells are defined by reset, update and new gates. The GRU neural network is iteratively trained, thereby biasing the GRU neural network toward solving a particular sub-problem, and identifying a set of weights for the GRU. For example, in each iteration several predictions (one prediction for each possible error in a particular step) are generated to complete the assembly process in subsequent steps. Additionally, a corresponding predicted distance measure for the modified assembly process can be generated. These predicted assembly process completions can be depicted in a virtual representation system and their stepwise Hausdorff distances calculated to obtain a "ground truth" distance measure. The difference between the "ground truth" and the predicted distance measure can be computed and fed back into the model, whose network weights are adjusted via backpropagation to produce the next iteration. This process can continue until the set of weights for the GRU is identified. In some embodiments, a stochastic gradient descent method can be used to correct the defective target object and derive the steps necessary to obtain a satisfactory final configuration. can.

いくつかの実施形態では、処理中の目標対象のパラメータコンピュータ支援設計および製図(CAD)モデルなどのシミュレーションを生成して、機械学習モデルを開発し、かつ、検証することができる。CADシステムは、処理中の目標対象の現在の状態に対応する局所座標フレーム、および個々の組立てステップを表す入力パラメータを使用することができる。処理中の目標対象の局所座標フレームおよび入力パラメータを使用することにより、CADシステムは、組立てステップ毎に寸法情報を決定することができる。CADシステムは、次に、個々のステップにおける出力の構成を表す三次元CADモデルを生成することができる。CADシステムは、組立てプロセスにおけるすべてのステップが実行されるまでこのプロセスを継続することができ、また、組み立てられた対象の最終構成のCADモデルを出力することができる。CADシステムに様々な入力パラメータを提供することにより、異なる構成のCADモデルを生成することができる。長さまたは幅などの特定の範囲の入力基準を有する一組のCADモデルを得るために、この入力基準の統計的なサンプルをCADシステムに提供して、上記一組のCADモデルを生成することができる。 In some embodiments, a simulation, such as a parametric computer-aided design and drafting (CAD) model of the target object in process, can be generated to develop and validate the machine learning model. A CAD system can use a local coordinate frame corresponding to the current state of the target object being processed, and input parameters representing individual assembly steps. Using the local coordinate frame of the target object under processing and the input parameters, the CAD system can determine dimensional information for each assembly step. A CAD system can then generate a three-dimensional CAD model that represents the configuration of the outputs at the individual steps. The CAD system can continue the process until all steps in the assembly process have been performed and output a CAD model of the final configuration of the assembled object. By providing various input parameters to the CAD system, CAD models of different configurations can be generated. To obtain a set of CAD models having a specified range of input criteria, such as length or width, to provide a statistical sample of this input criteria to a CAD system to generate the set of CAD models. can be done.

CADモデルは、可変レベルの詳細および知的要素であってもよいが、訓練されたモデルおよびシステムは、とりわけより低い詳細CADシステムと共に動作するように設計され、それにより非計算的に高価な方法における膨大な数の例を生成することができ、また、訓練されたモデルおよびプロファイリングのための十分な表面形態学詳細を提供することができる。いくつかの実施形態では、参照されるCADシステムは、Finite Element Analysis(FEA)または基本表面モデル化ツールと対にすることができ、それにより表面の構造解析を生成することができる。このデータは、モデル訓練および解析のための追加品質スコアとして使用することができる。 CAD models may be of varying levels of detail and intelligence, but trained models and systems are specifically designed to work with lower detail CAD systems, thereby making them a non-computationally expensive method. can generate a vast number of examples in , and provide sufficient surface morphology detail for trained models and profiling. In some embodiments, the referenced CAD system can be paired with Finite Element Analysis (FEA) or basic surface modeling tools to generate a structural analysis of the surface. This data can be used as an additional quality score for model training and analysis.

いくつかの実施形態では、CADシステムは、モデルからの例の要求に応じて、あるいは追加探究データの必要に応じて追加表面モデルを生成することができるよう、モデル訓練に組み込むことができる。この手法は物理的観察と対であり、空間の膨大な量の物理的サンプルを必要とすることなく、予め訓練されたモデルを展開することができる。 In some embodiments, the CAD system can be incorporated into model training so that additional surface models can be generated as required for examples from the model or as needed for additional exploration data. This approach is coupled with physical observation and allows pre-trained models to be developed without the need for a vast amount of physical samples in space.

いくつかの実施形態では、組み立てられた対象の最終構成のCADモデルをシミュレーションに使用して性能メトリックを生成することができる。組み立てられた対象の最終構成のCADモデルを使用することにより、シミュレーションは、数値および計算方法を利用して性能メトリックを生成することができる。 In some embodiments, a CAD model of the final configuration of the assembled object may be used for simulation to generate performance metrics. By using a CAD model of the final configuration of the assembled object, the simulation can utilize numerical and computational methods to generate performance metrics.

Artificial Intelligence Process Control(AIPC)のリアルワールドアプリケーションは、組立てラインにおける、既に自分のタスクを完了した作業者へのフィードバックの提供(例えばビデオ指示を自動的に修正することによって)、ならびに組立てラインにおける下流側の、未だ自分のタスクを完了していない作業者への指示の提供(これも例えばビデオ指示を自動的に修正することによって)を含む(「フィードフォワード」)。このフィードバック-フィードフォワードシステム、すなわちAIPCは、本明細書において説明されているAI手法を、いくつかの実施形態では、本明細書において説明されている特定の順序で使用して達成することができ、したがって組立てライン上の作業者は、追加人間監視を必要とすることなく、結果として得られる製造製品を最適化する選択をなすことができる。 The real-world application of Artificial Intelligence Process Control (AIPC) is to provide feedback (e.g., by automatically correcting video instructions) to workers on the assembly line who have already completed their tasks, as well as to provide feedback downstream on the assembly line. side, providing instructions to workers who have not yet completed their tasks (again, eg, by automatically modifying video instructions) (“feedforward”). This feedback-feedforward system, or AIPC, can be achieved using the AI techniques described herein, in some embodiments in the specific order described herein. Thus, workers on the assembly line can make choices that optimize the resulting manufactured product without the need for additional human oversight.

いくつかの実施形態では、これは、単にRNNへの上記システムの圧縮、および1つまたは複数の製造製品を作り出すプロセスの間、成功または失敗の2つの方法におけるあらゆる動きの観察を含む。個々の動きは訓練として働く。RNNの出力ノードが最適ではない場合、ネットワークは、異なる選択をなすよう、組立てラインにおける実際の個人にフィードバックすることができ、また、RNNの多くのノードおよび層を通る経路では、重みは、重み付けし直すことができ、また、出力には、成功または失敗のいずれかのラベルが振られることになる。プロセスが反復すると、重みは、自身でその精度を改善する。さらに、ネットワークは、組立てを実施する個人が働いていない場合であっても、何が働いていて、何が働いていないかを学習することができる。これは、訓練セットを増加させる。また、それは、組立てプロセスの異なる段階における調整の実施を許容する。いくつかの事例では、任意の所与の瞬間に、特定の特性を有する製造物品を製造する最良の方法は、開始点に戻ることではなく、プロセスの進行に応じて指示を調整することであることが見出され得る。この場合、RNNは、最適な製造製品のために常に最適化しており、また、生産ラインの作業者ステーションにおける、既に自分のタスクを実施した個々の作業者にフィードバックを提供し、また、生産ラインの作業者ステーションにおける、未だ自分のタスクを実施していない作業者に情報をフィードフォワードするべく学習する。 In some embodiments, this simply involves compressing the system into an RNN and observing any movement during the process of creating one or more manufactured products, in two ways, success or failure. Individual movements work as training. If the RNN's output node is not optimal, the network can feed back to the actual individual on the assembly line to make a different choice, and in the path through many nodes and layers of the RNN, the weights can be redone and the output will be labeled as either success or failure. As the process iterates, the weights improve their accuracy on their own. Additionally, the network can learn what is working and what is not working, even if the individual performing the assembly is not working. This increases the training set. It also allows adjustments to be made at different stages of the assembly process. In some instances, the best way to produce an article of manufacture with specific properties at any given moment is not to return to the starting point, but to adjust the instructions as the process progresses. can be found. In this case, the RNN is constantly optimizing for the best manufactured product and also provides feedback to individual workers at worker stations on the production line who have already performed their tasks and also learn to feed forward information to workers at worker stations who have not yet performed their tasks.

図1は、開示される技術のいくつかの態様による、生産ライン展開を実現するための例示的プロセス100のフローチャートを概念的に図解したものである。図1のプロセスはステップ102で開始され、生産展開が開始される。例示的生産ラインのワークフローは、典型的には、ワークピース(製品)が組み立てられ、あるいは製造される複数の作業者ステーション(ノード)を含む。先行するノードにおける作業が完了した後にのみ、個々の後続するノードの作業が開始されるよう、様々なノードを逐次方式で編成することができる。 FIG. 1 conceptually illustrates a flowchart of an exemplary process 100 for implementing production line deployment, in accordance with some aspects of the disclosed technology. The process of FIG. 1 begins at step 102 to initiate production deployment. An exemplary production line workflow typically includes multiple worker stations (nodes) at which workpieces (products) are assembled or manufactured. The various nodes can be organized in a sequential fashion so that work on each subsequent node begins only after the work on the preceding node is completed.

ステップ104で、1つまたは複数の参照ビデオが生成され、および/または更新される。上で説明したビデオを使用して、特定のノード(本明細書においては作業者ステーションとも呼ばれる)に製造/組立て指示を提供することができる。すなわちワークフローにおける個々のノードは、その特定のノードに対応する製造ワークフローにおけるステップを完了する方法の手引きを引き渡す参照ビデオを備えることができる。 At step 104, one or more reference videos are generated and/or updated. The videos described above can be used to provide manufacturing/assembly instructions to specific nodes (also referred to herein as worker stations). That is, each node in the workflow can have a reference video that delivers guidance on how to complete the step in the manufacturing workflow that corresponds to that particular node.

ステップ106で、ステップ104で生成されたビデオの各々がそれぞれのステーション/ノードに展開される。一例として、所与のワークフローは10個のノードを含むことができ、その各々は、それぞれの異なる/独自の参照ビデオを有している。他の実施態様では、ビデオの数は、ノードの総数より少なくてもよい。実施態様に応じて、様々なステーション/ノードに展開される参照ビデオは固有であってもよく、あるいは同様の手引き/指示を提供することができる。以下でさらに詳細に考察されるように、参照ビデオの内容は動的であってもよく、また、常に更新/増補することができる。 At step 106, each of the videos generated at step 104 is deployed to respective stations/nodes. As an example, a given workflow may contain 10 nodes, each with their own different/unique reference video. In other implementations, the number of videos may be less than the total number of nodes. Depending on the implementation, the reference videos deployed to various stations/nodes may be unique or may provide similar guidance/instructions. As discussed in more detail below, the content of the reference video may be dynamic and constantly updated/augmented.

ステップ108で、モーションの連続記録が個々のステーション/ノードでキャプチャされる。モーション記録から得られるモーションデータは、ワークフローにおけるそれらのノード/ステーションにおけるワークピース/コンポーネント/ツールとの作業者の相互作用を記述することができる。すなわち個々のノードでキャプチャされるモーションデータは、製品組立てまたは製造の特定の部分に対応する1つまたは複数の作業者行為を表すことができ、また、そのノードと関連する参照ビデオによって提供される指示に対応し得る。いくつかの実例では、モーションキャプチャは、ビデオデータのキャプチャ、すなわちそのステーションにおける作業者の行為のすべてまたは一部の記録を含むことができる。他の実施形態では、モーションキャプチャは、例えば3Dポイントクラウドの記録を含むことができ、モーションは、画像キャプチャデバイスの視野における1つまたは複数の特定のポイントに対して記録される。作業者の行為ならびにコンポーネントの属性(例えばコンポーネント品質、引張り強さ、欠陥の数)の両方を、ワークフローにおける個々のノード/ステーションでキャプチャすることができる。 At step 108, continuous recordings of motion are captured at individual stations/nodes. Motion data obtained from motion recordings can describe worker interactions with workpieces/components/tools at those nodes/stations in the workflow. That is, the motion data captured at an individual node can represent one or more worker actions corresponding to a particular portion of product assembly or manufacturing, and is provided by the reference video associated with that node. Able to respond to instructions. In some instances, motion capture may include capturing video data, ie, recording all or part of the worker's actions at the station. In other embodiments, motion capture can include, for example, recording a 3D point cloud, where motion is recorded for one or more specific points in the field of view of the image capture device. Both worker actions as well as component attributes (eg, component quality, tensile strength, number of defects) can be captured at individual nodes/stations in the workflow.

ステップ110で、プロセス方法解析偏差を計算することができ、ステップ108におけるステーションのうちの1つまたは複数に対してキャプチャされたモーションデータを解析して、例えば対応するステーションの理想化されたモーションプロファイルを含む(または表す)比較モデルからのあらゆる偏差を識別することができる。図1に図解されているように、ステップ110は、例えば比較モデルからのモーション偏差を識別/分類し、かつ、組立てまたは製造プロセスが影響を及ぼされ得た程度に関する推測を実施するように構成することができるAIPC深層学習モデルを利用することができる(ステップ112)。比較は、ステーションレベル毎に、および/または総合プロセスレベルで実施することができる。また、解析は、個々のステーションにおけるコンポーネントの属性、またはベースラインからのコンポーネントの偏差、およびステーションのモーション偏差がコンポーネントの品質に及ぼす影響の程度を考慮することも可能である。 At step 110, process method analysis deviations can be calculated, analyzing the motion data captured for one or more of the stations at step 108 to obtain, for example, an idealized motion profile of the corresponding station. Any deviation from the comparative model that includes (or represents) can be identified. As illustrated in FIG. 1, step 110 comprises, for example, identifying/classifying motion deviations from the comparison model and making inferences as to the degree to which the assembly or manufacturing process may have been affected. An AIPC deep learning model can be utilized (step 112). The comparison can be performed on a per station level and/or on an overall process level. The analysis can also consider the attributes of the components at individual stations, or the extent to which the deviations of the components from the baseline and the motion deviations of the stations affect the quality of the components.

ステップ112で呼ばれるAIPC深層学習モデルは、例えば所与のステーション/ノードに対する理想的な、または品質が制御された組立て/製造相互作用の例を含むことができる様々なタイプの訓練データの収集に基づくことができる。また、AIPC深層学習モデルは、プロセス100(ステップ111)を使用して製造された特定の製品に関する顧客からのフィードバックによって、また、プロセス100(ステップ113)を使用して製造された特定の製品の品質管理検査からのフィードバックによって、ドメイン/産業情報115によって提供されるデータを使用して増補する(または調整する)ことができる。AIPC深層学習モデルは、分散ハードウェアモジュールおよび/またはソフトウェアモジュールを含む様々な計算システムを使用して実現することができることを理解されたい。一例として、AIPC深層学習モデルは、組立てラインに展開され、かつ、様々なAI/機械学習モデルおよび/または分類子を実現するように構成された1つまたは複数のシステムに結合される複数の画像キャプチャデバイスおよび表示デバイスを含む分散システムを使用して実現することができる。 The AIPC deep learning model called in step 112 is based on collection of various types of training data, which can include examples of ideal or quality-controlled assembly/manufacturing interactions for a given station/node, for example. be able to. AIPC deep learning models are also trained by feedback from customers regarding specific products manufactured using process 100 (step 111), and for specific products manufactured using process 100 (step 113). Data provided by domain/industry information 115 can be used to augment (or adjust) feedback from quality control inspections. It should be appreciated that AIPC deep learning models can be implemented using a variety of computing systems including distributed hardware and/or software modules. As an example, an AIPC deep learning model is deployed on an assembly line and multiple images combined into one or more systems configured to implement various AI/machine learning models and/or classifiers. It can be implemented using a distributed system that includes a capture device and a display device.

ステップ110で比較モデルからの偏差が検出され/識別されると、ステップ114で、AIPC深層学習モデル112を使用して自動調整を生成することができる。上で考察したように、ビデオ調整は、ワークフローの1つまたは複数のステーションにおける製造/組立て品質を改善することを目的とすることができる。例えば作業者に提供される指示または手引きを、エラーを低減し、あるいはエラーが発生した時点で修復する方法で変更するために、例えばエラーが発生することが分かっている(または予測される)所与のノード/ステーションにビデオ調整を適用することができる。他の実施態様では、例えば製造ワークフローが完了する前にエラーを修正するために、エラーが発生したステーションから下流側にビデオ調整を適用することができる。さらに他の実施態様では、ワークフローが完了すると、ワークフロー全体を解析することができ、また、ワークフローにおける1つまたは複数のステーションに対して調整を実施することができる。 Once deviations from the comparative model are detected/identified at step 110, the AIPC deep learning model 112 can be used to generate automatic adjustments at step 114. FIG. As discussed above, video adjustments can be aimed at improving manufacturing/assembly quality at one or more stations of the workflow. where errors are known (or predicted) to occur, e.g. Video adjustments can be applied to a given node/station. In other implementations, video adjustments can be applied downstream from the station where the error occurred, eg, to correct the error before the manufacturing workflow is complete. In yet other implementations, once a workflow is completed, the entire workflow can be analyzed and adjustments can be made to one or more stations in the workflow.

いくつかの実施形態では、調整は、エラーが検出された直後に実時間で実施される。他の実施形態では、調整は、一定のインターバルで、またはワークフローが完了した後に実施される。 In some embodiments, adjustments are made in real-time immediately after an error is detected. In other embodiments, adjustments are made at regular intervals or after the workflow is completed.

いくつかの態様では、ステップ114で決定された自動調整は、ステップ117で要約し、および/または製品品質レポートとして提供することができる。例えばモーション偏差の解析(ステップ110)によってもたらされる調整を使用して、組立て/製造プロセスの理想化されたモデルから識別された偏差に基づいて、ワークピースの様々な品質態様を記述する1つまたは複数の品質レポートを作成することができる。 In some aspects, the automatic adjustments determined at step 114 may be summarized at step 117 and/or provided as a product quality report. One or Multiple quality reports can be generated.

図2は、本技術のいくつかの態様による、組立てエラー修正を容易にするために使用することができるエラー検出解析を実施するための例示的プロセス200を図解したものである。 FIG. 2 illustrates an exemplary process 200 for performing error detection analysis that may be used to facilitate assembly error correction, in accordance with some aspects of the present technique.

ステップ210で開始され、理想化されたビデオ手引きを使用して製造/組立てを改善するプロセスを実現することができる。ステップ215で、1つまたは複数の組立てステーションのビデオ追跡が実施される。ビデオ追跡は、所与のステーション/ノードにおける人間作業者の記録を含むことができる。いくつかの実施形態では、ビデオ追跡は、所与のステーション/ノードにおけるコンポーネント属性のキャプチャをさらに含むことができる。 Beginning at step 210, the process of improving manufacturing/assembly using idealized video guidance can be implemented. At step 215, video tracking of one or more assembly stations is performed. Video tracking can include recordings of human workers at a given station/node. In some embodiments, video tracking can further include capturing component attributes at a given station/node.

ステップ220~224で、組立てステーションから記録されたビデオを解析する処理が実施される。例えばいくつかの実施形態では、背景抽出を実施して、記録されたビデオ中の動き/コンポーネントを隔離することができる。いくつかの態様では、背景抽出が完了すると、処理されたビデオは、組立て作業者に関連するモーション/ビデオデータのみを含み(ステップ224)、また、含まれているコンポーネントは、対応する組立てステップ(ステップ220)に使用される。ステップ220で、追加処理を実施して、部品/コンポーネントを隔離することができる。プロセス200の線図によって図解されているように、ステップ220は、異常検出(ステップ221)、表面変化の検出(222)および部品分類および/または品質スコアリング(ステップ223)を含む追加処理操作を含むことができる。それには限定されないが、1つまたは複数のAI/機械学習アルゴリズムおよび/または分類子の使用を含む、様々な信号および/または画像処理技法を使用して、任意のビデオ処理ステップを実施し、それにより例えば異常検出(221)、表面変化の検出(222)を実施し、および/またはスコアリング/分類(ステップ223)を実施することができることを理解されたい。 At steps 220-224, processing is performed to analyze the video recorded from the assembly station. For example, in some embodiments background extraction can be performed to isolate motion/components in the recorded video. In some aspects, once background extraction is complete, the processed video includes only motion/video data related to the assembly worker (step 224), and the included components are the corresponding assembly steps (step 224). step 220). At step 220, additional processing may be performed to isolate parts/components. As illustrated by the diagram of process 200, step 220 performs additional processing operations including anomaly detection (step 221), surface change detection (222) and part classification and/or quality scoring (step 223). can contain. Any video processing step is performed using various signal and/or image processing techniques including, but not limited to, the use of one or more AI/machine learning algorithms and/or classifiers, can perform anomaly detection (221), surface change detection (222), and/or scoring/classification (step 223), for example.

処理ステップ220~224が完了した後、プロセス200は、モーション比較が実施されるステップ226へ進行することができる。モーション比較(ステップ226)は、対応する理想化されたビデオ/モーションデータとの、1つまたは複数のステーション/ノードにおける一人(1つ)または複数のステーション作業者を含むプロセス組立てステーションビデオデータの比較を含むことができる。複数のステーション/ノードにわたって実施されるモーション比較を使用して、結果として得られる部品/コンポーネント品質の変化を推測/予測することができる。 After processing steps 220-224 are completed, process 200 may proceed to step 226 where a motion comparison is performed. Motion comparison (step 226) compares process assembly station video data including one (one) or more station workers at one or more stations/nodes with corresponding idealized video/motion data. can include Motion comparisons performed across multiple stations/nodes can be used to infer/predict the resulting change in part/component quality.

ステップ228で、様々な部品/コンポーネントに対する分散/品質分類を実施することができる。一例として、部品/コンポーネントは異なる品質層に分類することができ、および/またはそれらの関連する分類/相違に応じて、除去または修理のために識別することができる。 At step 228, distribution/quality classification for various parts/components may be performed. As an example, parts/components can be classified into different quality tiers and/or identified for removal or repair depending on their associated classifications/differences.

分類/相違が決定された後、プロセス200はステップ230へ進行することができ、ステップ230で、プロセス/ワークフロー全体の解析が、例えばステップ226および228で決定されたステーション/ノード毎の分類/相違に基づいて実施される。ワークフロー全体を解析することにより、ビデオに対する自動調整を実施することができ、それにより、上で考察したように、検出された偏差/欠陥に対処することができる。 After the classifications/differences have been determined, process 200 can proceed to step 230 where an analysis of the overall process/workflow is performed, e.g. conducted based on By analyzing the entire workflow, automatic adjustments to the video can be performed to address detected deviations/defects, as discussed above.

図3は、開示される技術のシステムを実現するために使用することができる例示的処理デバイスを図解したものである。処理デバイス300は、マスター中央処理装置(CPU)362、インタフェース368およびバス315(例えばPCIバス)を含む。適切なソフトウェアまたはファームウェアの制御の下で動作すると、CPU362は、様々なエラー検出監視および開示される技術のプロセス調整ステップを実施する責任を負う。CPU362は、オペレーティングシステムおよび任意の適切なアプリケーションソフトウェアを含むソフトウェアの制御の下ですべてのこれらの機能を成し遂げることが好ましい。CPU362は、マイクロプロセッサのMotorolaファミリーからの、あるいはマイクロプロセッサのMIPSファミリーからのプロセッサなどの1つまたは複数のプロセッサ363を含むことができる。代替実施形態では、プロセッサ363は、AIPCシステム310の操作を制御するために特別に設計されたハードウェアである。特定の実施形態では、メモリ361(不揮発性RAMおよび/またはROMなど)もCPU462の一部を形成している。しかしながらメモリをシステムに結合することができる多くの異なる方法が存在している。 FIG. 3 illustrates an exemplary processing device that can be used to implement systems of the disclosed technology. Processing device 300 includes a master central processing unit (CPU) 362, an interface 368 and a bus 315 (eg, PCI bus). Operating under the control of appropriate software or firmware, CPU 362 is responsible for performing various error detection monitoring and process adjustment steps of the disclosed techniques. CPU 362 preferably performs all these functions under the control of software, including an operating system and any suitable application software. CPU 362 may include one or more processors 363, such as processors from the Motorola family of microprocessors or from the MIPS family of microprocessors. In an alternative embodiment, processor 363 is hardware specifically designed to control the operation of AIPC system 310 . Memory 361 (such as non-volatile RAM and/or ROM) also forms part of CPU 462 in certain embodiments. However, there are many different ways memory can be coupled to the system.

いくつかの態様では、処理デバイス310は、画像処理システム370を含むことができ、あるいは画像処理システム370と結合することができる。画像処理システム370は、作業者の動きを監視し、また、モーションデータを生成することができるビデオカメラなどの様々な画像キャプチャデバイスを含むことができる。一例として、画像処理システム370は、ビデオデータをキャプチャし、および/または3Dポイントクラウドを出力し/生成するように構成することができる。 In some aspects, processing device 310 may include or be coupled to image processing system 370 . The image processing system 370 can include various image capture devices such as video cameras that can monitor worker movement and generate motion data. As an example, image processing system 370 may be configured to capture video data and/or output/generate a 3D point cloud.

インタフェース368は、典型的にはインタフェースカード(時によっては「ラインカード」と呼ばれることもある)として提供される。一般に、それらは、ネットワークを介したデータパケットの送信および受信を制御し、また、時によっては、ルータと共に使用される他の周辺装置をサポートする。提供され得るインタフェースは、とりわけ、Ethernetインタフェース、フレーム中継インタフェース、ケーブルインタフェース、DSLインタフェース、トークンリングインタフェース、等々である。さらに、高速トークンリングインタフェース、無線インタフェース、Ethernetインタフェース、Gigabit Ethernetインタフェース、ATMインタフェース、HSSIインタフェース、POSインタフェース、FDDIインタフェース、等々などの様々な極めて高速のインタフェースを提供することも可能である。一般に、これらのインタフェースは、適切な媒体との通信に適したポートを含むことができる。いくつかの事例では、それらは独立プロセッサをも含むことができ、また、いくつかの実例では揮発性RAMを含むことができる。独立プロセッサは、このような通信集約タスクをパケット交換、媒体制御および管理として制御することができる。通信集約タスクのための個別のプロセッサを提供することにより、これらのインタフェースは、マスターマイクロプロセッサ362による、経路指定計算、ネットワーク診断、安全保護機能、等々の効果的な実施を許容することができる。 Interface 368 is typically provided as an interface card (sometimes called a "line card"). Generally, they control the transmission and reception of data packets over networks and sometimes support other peripherals used with routers. Interfaces that may be provided are, among others, an Ethernet interface, a frame relay interface, a cable interface, a DSL interface, a token ring interface, and so on. In addition, various very high speed interfaces can be provided such as high speed token ring interfaces, radio interfaces, Ethernet interfaces, Gigabit Ethernet interfaces, ATM interfaces, HSSI interfaces, POS interfaces, FDDI interfaces, and so on. Generally, these interfaces may include ports suitable for communicating with any suitable medium. In some cases, they may also include independent processors, and in some instances may include volatile RAM. Independent processors can control such communication-intensive tasks as packet switching, media control and management. By providing separate processors for communication-intensive tasks, these interfaces can allow the master microprocessor 362 to efficiently perform routing calculations, network diagnostics, security functions, and the like.

図3に示されているシステムは、本発明の1つの特定の処理デバイスであるが、本発明を実現することができる唯一のネットワークデバイスアーキテクチャでは決してない。例えば通信ならびに経路指定計算、等々を取り扱う単一のプロセッサを有するアーキテクチャがしばしば使用される。さらに、他のタイプのインタフェースおよび媒体をも使用することも可能である。 The system shown in FIG. 3 is one particular processing device of the present invention, but by no means the only network device architecture in which the present invention can be implemented. For example, architectures with a single processor that handles communications as well as routing calculations, etc., are often used. Additionally, other types of interfaces and media may also be used.

ネットワークデバイスの構成に無関係に、ネットワークデバイスは、汎用ネットワーク操作のためのプログラム命令を記憶するように構成された1つまたは複数のメモリまたはメモリモジュール(メモリ361を含む)、および本明細書において説明されているローミング、経路最適化および経路指定機能のための機構を使用することができる。プログラム命令は、例えばオペレーティングシステムおよび/または1つまたは複数のアプリケーションの操作を制御することができる。移動度結合(mobility binding)、登録および関連表、等々などの表を記憶するように1つまたは複数のメモリを構成することも可能である。 Regardless of the configuration of the network device, the network device will include one or more memories or memory modules (including memory 361) configured to store program instructions for general network operations and the Mechanisms for roaming, route optimization and routing functions provided by the standard can be used. Program instructions may, for example, control operation of an operating system and/or one or more applications. One or more memories can also be configured to store tables such as mobility bindings, registration and association tables, and so on.

様々な実施形態の論理演算は、(1)汎用コンピュータ内のプログラム可能回路上で走る一連のコンピュータ実現ステップ、操作または手順、(2)特定用途プログラム可能回路上で走る一連のコンピュータ実現ステップ、操作または手順、および/または(3)相互接続機械モジュールまたはプログラム可能回路内のプログラムエンジンとして実現される。システム300は、記載されている方法のすべてまたは一部を実践することができ、記載されているシステムの一部であってもよく、および/または記載されている非一時的コンピュータ可読記憶媒体中の命令に従って動作することができる。このような論理演算は、プロセッサ363を制御するように構成されたモジュールとして実現することができ、それによりそのモジュールのプログラミングに従って特定の機能を実施する。 The logical operations of various embodiments are represented as (1) a sequence of computer-implemented steps, operations or procedures running on programmable circuits within a general-purpose computer; (2) a sequence of computer-implemented steps, operations running on application-specific programmable circuits. or procedures; and/or (3) implemented as a program engine within interconnected machine modules or programmable circuits. System 300 can practice all or part of the described methods, may be part of the described systems, and/or can act according to the instructions of Such logical operations may be implemented as modules configured to control processor 363, thereby performing specific functions according to programming of that module.

開示されているプロセスにおけるステップの任意の特定の順序または階層は、例示的手法の例証であることを理解されたい。設計の好みに基づいて、プロセスにおけるステップの特定の順序または階層を再配置することができること、または図解されているステップの一部のみを実施することができることを理解されたい。ステップのうちのいくつかは同時に実施することができる。例えば特定の状況では、多重タスキングおよび並列処理が有利であり得る。さらに、上で説明した実施形態における様々なシステムコンポーネントの分離は、このような分離がすべての実施形態に必要であるものとして理解してはならず、また、説明されているプログラムコンポーネントおよびシステムは、一般に、単一のソフトウェア製品の中で一体に統合することができ、あるいは複数のソフトウェア製品にパッケージ化することができることを理解すべきである。 It is understood that any specific order or hierarchy of steps in the processes disclosed is an illustration of exemplary approaches. Based on design preferences, it is understood that the specific order or hierarchy of steps in the processes may be rearranged, or that only some of the steps illustrated may be performed. Some of the steps can be performed simultaneously. For example, multitasking and parallel processing may be advantageous in certain situations. Furthermore, the separation of various system components in the above-described embodiments should not be understood as requiring such separation in all embodiments, nor should the described program components and systems , in general, may be integrated together within a single software product, or may be packaged into multiple software products.

上記の説明は、すべての当業者による、本明細書において説明されている様々な態様の実践を可能にするために提供されたものである。これらの態様に対する様々な修正は当業者には容易に明らかであり、また、本明細書において定義されている一般原理は、他の態様にも適用することができる。したがって特許請求の範囲には、それが本明細書において示されている態様に限定されることは意図されておらず、特許請求の範囲は、言語請求項と無矛盾の全範囲と一致し、単数形の要素に対する参照には、そうであることが明確に言及されていない限り、「1つであり、また、唯一である」ことを意味するのではなく、「1つまたは複数である」ことが意図されている。 The previous description is provided to enable any person skilled in the art to practice the various aspects described herein. Various modifications to these aspects will be readily apparent to those skilled in the art, and the general principles defined herein may also be applied to other aspects. Accordingly, it is not intended that the claims be limited to the embodiments shown herein, and that the claims be construed to the full extent consistent with the language of the claims, singular References to elements of form shall imply "one or more" rather than implying "one and only", unless expressly stated to the contrary. is intended.

「態様」などの語句は、このような態様が主題技術に必須であること、またはこのような態様を主題技術のすべての構成に適用することを暗に意味していない。態様に関連する開示は、すべての構成に適用することができ、あるいは1つまたは複数の構成に適用することができる。一態様などの語句は、1つまたは複数の態様を意味することができ、また、1つまたは複数の態様は、一態様を意味することができる。「構成」などの語句は、このような構成が主題技術に必須であること、またはこのような構成を主題技術のすべての構成に適用することを暗に意味していない。構成に関連する開示は、すべての構成に適用することができ、あるいは1つまたは複数の構成に適用することができる。一構成などの語句は、1つまたは複数の構成を意味することができ、また、1つまたは複数の構成は、一構成を意味することができる。 A phrase such as "an aspect" does not imply that such aspect is essential to the subject technology or that such aspect applies to all configurations of the subject technology. A disclosure relating to an aspect may apply to all configurations, or to one or more configurations. A phrase such as an aspect can refer to one or more aspects, and one or more aspects can refer to an aspect. A phrase such as "configuration" does not imply that such configuration is essential to the subject technology or that such configuration applies to all configurations of the subject technology. A disclosure relating to a configuration may apply to all configurations, or to one or more configurations. A phrase such as a configuration can mean one or more configurations, and one or more configurations can mean a configuration.

「例示的」という語は、本明細書においては、「例または例証として働く」ことを意味するべく使用されている。「例示的」として本明細書において説明されているすべての態様または設計は、他の態様または設計に勝る、好ましい、または有利なものとして必ずしも解釈されるべきではない。
開示の陳述
The word "exemplary" is used herein to mean "serving as an example or illustration." Any aspect or design described herein as "exemplary" is not necessarily to be construed as over, preferred, or advantageous over other aspects or designs.
disclosure statement

陳述1:組立てラインにおけるワークフローを最適化するための方法であって、方法は、目標対象の組立てプロセスのあるステップにおいて、目標対象の組立てのエラーを検出するステップと、組立てプロセスのそのステップにおける目標対象と公称対象とを評価し、それにより比較を得るステップと、その比較に基づいて、目標対象と公称対象の間の偏差を最小化するために必要な一連のステップを決定するステップと、上記一連のステップに基づいて目標対象のための組立て指示を調整するステップとを含む。 Statement 1: A method for optimizing a workflow in an assembly line, the method comprising, at a step of a target assembly process, detecting an error in the assembly of a target object and a target at that step of the assembly process. evaluating the target and the nominal target thereby obtaining a comparison; and based on the comparison determining the sequence of steps required to minimize the deviation between the target target and the nominal target; and adjusting the building instructions for the target object based on the sequence of steps.

陳述2:陳述1の方法であって、目標対象は、組立てプロセスの上記ステップにおける公称対象に対して評価される。 Statement 2: The method of Statement 1, wherein the target object is evaluated against the nominal object in the above steps of the assembly process.

陳述3:陳述1から2のいずれかの方法であって、目標対象は、公称対象の最終構成に対して評価される。 Statement 3: The method of any of statements 1-2, wherein the target object is evaluated against the final configuration of the nominal object.

陳述4:陳述1から3のいずれかの方法であって、上記一連のステップは、偏差を最小化するように構成された機械学習モデルを使用して決定される。 Statement 4: The method of any of statements 1-3, wherein the sequence of steps is determined using a machine learning model configured to minimize deviation.

陳述5:陳述1から4のいずれかの方法であって、偏差は、目標対象の組立てプロセスを完了するための上記一連のステップと、公称対象の組立てプロセスを完了するための別の一連のステップとの間の類似性に基づいて決定される。 Statement 5: The method of any of Statements 1 through 4, wherein the deviation is the sequence of steps for completing the target object assembly process and another sequence of steps for completing the nominal object assembly process is determined based on the similarity between

陳述6:陳述1から5のいずれかの方法であって、偏差は、報酬公式化を介したMarkov Decision Process(MDP)を使用して最小化される。 Statement 6: The method of any of statements 1 through 5, wherein the deviation is minimized using the Markov Decision Process (MDP) via reward formulation.

陳述7:陳述1から6のいずれかの方法であって、確率的勾配降下法を使用して、目標対象の組立てプロセスを完了するための上記一連のステップが引き出される。 Statement 7: The method of any of Statements 1 to 6, wherein stochastic gradient descent is used to derive the sequence of steps for completing the target object assembly process.

陳述8:組立てラインにおけるワークフローを最適化するためのシステムであって、システムは、複数の画像キャプチャデバイスであって、画像キャプチャデバイスの各々は、目標対象の組立てプロセスの間、作業者の動きをキャプチャするために異なる位置に配置される、複数の画像キャプチャデバイスと、作業者に提供された手引きおよび指示を自動的に修正するように構成された組立て指示モジュールであって、上記複数の画像キャプチャデバイスに結合される、組立て指示モジュールとを含み、組立て指示モジュールは、該組立て指示モジュールによって、複数の画像キャプチャデバイスからモーションデータを受け取るステップであって、モーションデータは、作業者による、目標対象を組み立てるための一組のステップの実行に対応する、ステップと、上記一組のステップのうちのあるステップにおけるモーションデータに基づいて、目標対象の組立てにおけるエラーを決定するステップと、上記一組のステップのうちの上記ステップにおける目標対象と公称対象とを評価し、それにより比較を得るステップと、その比較に基づいて、目標対象と公称対象の間の偏差を最小化するために必要な一連のステップを決定するステップと、上記一連のステップに基づいて、作業者に提供される組立て指示を調整するステップとを含む操作を実施するように構成される。 Statement 8: A system for optimizing workflow on an assembly line, the system comprising a plurality of image capture devices, each of which captures worker movement during a targeted assembly process. a plurality of image capture devices positioned at different locations to capture and an assembly instruction module configured to automatically modify guidance and instructions provided to an operator, wherein the plurality of image captures an assembly instruction module coupled to the device, the assembly instruction module receiving motion data from the plurality of image capture devices by the assembly instruction module, the motion data representing the movement of the target object by the operator; determining errors in building a target object based on steps corresponding to performing a set of steps for assembly and motion data in a step of said set of steps; and said set of steps. Evaluating the target target and the nominal target in the above step of thereby obtaining a comparison, and based on the comparison, the sequence of steps necessary to minimize the deviation between the target target and the nominal target and adjusting the assembly instructions provided to the operator based on the sequence of steps.

陳述9:陳述8のシステムであって、モーションデータは、目標対象を組み立てている間の作業者の手の動きのデジタル記録を含む。 Statement 9: The system of Statement 8, wherein the motion data includes digital recordings of the worker's hand movements while assembling the target object.

陳述10:陳述8から9のいずれかのシステムであって、組立て指示モジュールは、確率的勾配降下法を適用して上記一連のステップを引き出すようにさらに構成される。 Statement 10: The system of any of Statements 8-9, wherein the assembly instruction module is further configured to apply stochastic gradient descent to derive the sequence of steps.

陳述11:陳述8から10のいずれかのシステムであって、組立て指示モジュールは、機械学習モデルを使用して上記一連のステップを決定するようにさらに構成され、機械学習モデルは偏差を最小化するように構成される。 Statement 11: The system of any of Statements 8 through 10, wherein the assembly instruction module is further configured to determine the sequence of steps using a machine learning model, the machine learning model minimizing deviations configured as

陳述12:陳述8から11のいずれかのシステムであって、偏差は、目標対象の組立てを完了するための上記一連のステップと、公称対象の組立てを完了するための別の一連のステップとの間の類似性に基づいて決定される。 Statement 12: The system of any of Statements 8 through 11, wherein the deviation is between the above sequence of steps for completing assembly of the target object and another sequence of steps for completing assembly of the nominal object. determined based on the similarity between

陳述13:陳述8から12のいずれかのシステムであって、偏差は、報酬公式化を介したMarkov Decision Process(MDP)を使用して最小化される。 Statement 13: The system of any of statements 8 through 12, wherein the deviation is minimized using the Markov Decision Process (MDP) via reward formulation.

陳述14:陳述8から13のいずれかのシステムであって、組立て指示モジュールは、モーションデータから、目標対象の組立てを表す一組の画像を引き出し、また、上記一組の画像を評価して、目標対象を組み立てるための作業者による上記一組のステップの実行を識別するようにさらに構成される。 Statement 14: The system of any of statements 8 through 13, wherein the assembly instruction module derives from the motion data a set of images representative of the assembly of the target object, evaluates the set of images, It is further configured to identify execution of the set of steps by the operator to assemble the target object.

陳述15:その上に記憶された命令を含む非一時的コンピュータ可読媒体であって、命令は、1つまたは複数のプロセッサによって実行されると、目標対象の組立てプロセスのあるステップにおいて、目標対象の組立てにおけるエラーを検出すること、組立てプロセスの上記ステップにおける目標対象と公称対象とを評価し、それにより比較を得ること、その比較に基づいて、目標対象と公称対象の間の偏差を最小化するために必要な一連のステップを決定すること、および上記一連のステップに基づいて、目標対象のための組立て指示を調整することを含む命令をプロセッサが実行することになるように構成される。 Statement 15: A non-transitory computer-readable medium containing instructions stored thereon which, when executed by one or more processors, cause the target object to Detecting errors in assembly, Evaluating target and nominal targets in the above steps of the assembly process, thereby obtaining a comparison, Based on the comparison, minimizing the deviation between the target and nominal targets. The processor is configured to execute instructions including determining a sequence of steps required to achieve the desired sequence of steps, and adjusting building instructions for the target object based on the sequence of steps.

陳述16:陳述15の非一時的コンピュータ可読媒体であって、命令は、プロセッサが確率的勾配降下法を使用して上記一連のステップを引き出すことになるようにさらに構成される。 Statement 16: The non-transitory computer-readable medium of statement 15, wherein the instructions are further configured to cause the processor to derive the above sequence of steps using stochastic gradient descent.

陳述17:陳述15から16のいずれかの非一時的コンピュータ可読媒体であって、目標対象は、組立てプロセスの上記ステップにおける公称対象に対して評価される。 Statement 17: The non-transitory computer-readable medium of any of statements 15-16, wherein the target object is evaluated against the nominal object in the above step of the assembly process.

陳述18:陳述15から17のいずれかの非一時的コンピュータ可読媒体であって、目標対象は、公称対象の最終構成に対して評価される。 Statement 18: The non-transitory computer-readable medium of any of statements 15-17, wherein the target object is evaluated against the final configuration of the nominal object.

陳述19:陳述15から18のいずれかの非一時的コンピュータ可読媒体であって、命令は、偏差を最小化するように構成された機械学習モデルをプロセッサが使用して上記一連のステップを決定することになるようにさらに構成される。 Statement 19: The non-transitory computer-readable medium of any of statements 15-18, wherein the instructions determine the sequence of steps using a machine learning model configured to minimize deviation by the processor is further configured to be

陳述20:陳述15から19のいずれかの非一時的コンピュータ可読媒体であって、偏差は、報酬公式化を介したMarkov Decision Process(MDP)を使用して最小化される。

Statement 20: The non-transitory computer-readable medium of any of Statements 15-19, wherein the deviation is minimized using the Markov Decision Process (MDP) via reward formulation.

Claims (15)

組立てラインにおけるワークフローを最適化するための方法であって、
目標対象を組立てるプロセスにおけるステップにおいて、前記ステップの間に目標対象を組み立てる組立て者のモーションによるエラーに対応する、前記目標対象の組立てのエラーを、コンピュータシステムにより検出するステップと、
前記エラーの検出に応答して、コンピュータシステムにより、前記組立てるプロセスの前記ステップにおける公称対象に対する前記目標対象を解析し、比較を得るステップと、
前記比較に基づいて、コンピュータシステムにより、前記目標対象と前記公称対象の間の偏差を最小化する必要がある否か決定するステップと、
決定に基づいて、コンピュータシステムにより、前記目標対象と前記公称対象の間の偏差を最小化するために必要な一連のステップを生成するステップと、
一連の前記ステップに基づいて、コンピュータシステムにより、前記目標対象のための組立て指示を調整し、それにより調整された組立て指示を得るステップと、
を含む方法。
A method for optimizing workflow on an assembly line, comprising:
detecting, by a computer system, in a step in a process of assembling a target object, an error in assembling the target object corresponding to an error due to the motion of an assembler assembling the target object during said step;
Analyzing, by a computer system, the target object against the nominal object in the step of the assembly process in response to detecting the error to obtain a comparison;
determining, by a computer system, whether a deviation between the target target and the nominal target should be minimized based on the comparison;
based on the determination, generating, by a computer system, the sequence of steps necessary to minimize the deviation between the target target and the nominal target;
adjusting, by a computer system, building instructions for said target object based on said sequence of steps, thereby obtaining adjusted building instructions;
method including.
前記組立てるプロセスにおけるステップにおいて、前記公称対象に対して前記目標対象が評価される、請求項1に記載の方法。 2. The method of claim 1, wherein a step in the assembling process evaluates the target object against the nominal object. 前記公称対象の最終構成に対して前記目標対象が評価される、請求項1および2のいずれか1項に記載の方法。 3. The method of any one of claims 1 and 2, wherein the target object is evaluated against the final configuration of the nominal object. 前記一連の前記ステップが、前記偏差を最小化するように構成された機械学習モデルを使用して決定される、請求項1から3のいずれか1項に記載の方法。 4. The method of any one of claims 1-3, wherein the sequence of steps is determined using a machine learning model configured to minimize the deviation. 前記機械学習モデルがゲート付き回帰型ユニット(GRU)モデルである、請求項4に記載の方法。 5. The method of claim 4, wherein the machine learning model is a gated recurrent unit (GRU) model. 前記機械学習モデルがLong Short-Term Memory(LSTM)モデルに基づく、請求項4に記載の方法。 5. The method of claim 4, wherein the machine learning model is based on a Long Short-Term Memory (LSTM) model. 前記機械学習モデルが前記目標対象のための前記組立てるプロセスを表す追跡情報を使用して訓練され、前記追跡情報が一組の作業者から収集される、請求項4に記載の方法。 5. The method of claim 4, wherein the machine learning model is trained using tracking information representing the assembly process for the target object, the tracking information collected from a set of workers. 前記組立てるプロセスに対応するモーションデータをコンピュータシステムによりキャプチャするステップをさらに含み、前記モーションデータが前記目標対象を組み立てている間の手の動きのデジタル記録を含む、請求項1から7のいずれか1項に記載の方法。 8. The method of any one of claims 1 to 7, further comprising capturing motion data corresponding to the assembling process by a computer system, the motion data comprising digital recordings of hand movements while assembling the target object. described method. 前記モーションデータから前記目標対象の組立てを表す一組の画像をコンピュータシステムにより抽出するステップと、
前記一組の画像をコンピュータシステムにより評価し、それにより前記目標対象を組み立てるための前記作業者による一連の前記ステップの実行を識別するステップと、
をさらに含む、請求項8に記載の方法。
extracting from the motion data, by a computer system, a set of images representing the assembly of the target object;
evaluating said set of images with a computer system to thereby identify performance of said sequence of steps by said operator to assemble said target object;
9. The method of claim 8, further comprising:
前記目標対象の組立てにおける前記エラーが1つまたは複数の機械学習モデルを使用して検出される、請求項1から9のいずれか1項に記載の方法。 10. The method of any one of claims 1-9, wherein the errors in assembly of the target object are detected using one or more machine learning models. 前記調整された組立て指示が、前記目標対象の前記偏差を最小化するための指示を作業者に提供するように構成される、請求項1から10のいずれか1項に記載の方法。 11. The method of any one of claims 1-10, wherein the adjusted building instructions are configured to provide an operator with instructions for minimizing the deviation of the target object. 前記偏差が、前記目標対象の前記組立てプロセスを完了するための前記一連のステップと、前記公称対象の組立てプロセスを完了するための別の一連のステップとの間の類似性に基づいて決定される、請求項1から11のいずれか1項に記載の方法。 The deviation is determined based on the similarity between the sequence of steps for completing the assembly process of the target object and another sequence of steps for completing the assembly process of the nominal object. A method according to any one of claims 1 to 11. 前記偏差が、報酬公式化を介したMarkov Decision Process(MDP)を使用して最小化される、請求項1から12のいずれか1項に記載の方法。 13. The method of any one of claims 1-12, wherein the deviation is minimized using the Markov Decision Process (MDP) via reward formulation. 前記調整された組立て指示が、作業者に前記調整された組立て指示を提供するために1つまたは複数の自然言語処理(NLP)アルゴリズムを使用して変換される、請求項1から13のいずれか1項に記載の方法。 14. Any of claims 1-13, wherein the adjusted building instructions are transformed using one or more natural language processing (NLP) algorithms to provide the adjusted building instructions to an operator. 1. The method according to item 1. 確率的勾配降下法を使用して、前記目標対象の前記組立てプロセスを完了するための前記一連のステップが引き出される、請求項1から14のいずれか1項に記載の方法。 15. The method of any one of claims 1 to 14, wherein the sequence of steps for completing the assembly process of the target object is derived using stochastic gradient descent.
JP2022207136A 2019-04-19 2022-12-23 Assembly error correction for assembly lines Pending JP2023040079A (en)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US201962836192P 2019-04-19 2019-04-19
US62/836,192 2019-04-19
US16/587,366 US11156982B2 (en) 2019-02-28 2019-09-30 Dynamic training for assembly lines
US16/587,366 2019-09-30
US201962931448P 2019-11-06 2019-11-06
US62/931,448 2019-11-06
US201962932063P 2019-11-07 2019-11-07
US62/932,063 2019-11-07
PCT/US2020/029022 WO2020176908A1 (en) 2019-02-28 2020-04-20 Assembly error correction for assembly lines
JP2021549836A JP7207790B2 (en) 2019-04-19 2020-04-20 Assembly error correction for assembly lines

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2021549836A Division JP7207790B2 (en) 2019-04-19 2020-04-20 Assembly error correction for assembly lines

Publications (1)

Publication Number Publication Date
JP2023040079A true JP2023040079A (en) 2023-03-22

Family

ID=78094438

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021549836A Active JP7207790B2 (en) 2019-04-19 2020-04-20 Assembly error correction for assembly lines
JP2022207136A Pending JP2023040079A (en) 2019-04-19 2022-12-23 Assembly error correction for assembly lines

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2021549836A Active JP7207790B2 (en) 2019-04-19 2020-04-20 Assembly error correction for assembly lines

Country Status (3)

Country Link
JP (2) JP7207790B2 (en)
KR (1) KR20220005434A (en)
CN (1) CN113544604A (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11100221B2 (en) 2019-10-08 2021-08-24 Nanotronics Imaging, Inc. Dynamic monitoring and securing of factory processes, equipment and automated systems
US11086988B1 (en) 2020-02-28 2021-08-10 Nanotronics Imaging, Inc. Method, systems and apparatus for intelligently emulating factory control systems and simulating response data
CN115943428A (en) 2020-06-18 2023-04-07 纳米电子成像有限公司 Systems, methods, and media for manufacturing processes
WO2024005068A1 (en) * 2022-06-30 2024-01-04 コニカミノルタ株式会社 Prediction device, prediction system, and prediction program
KR20240040951A (en) 2022-09-22 2024-03-29 (주)아이준 Optimizing method for manual assembly process
WO2024065189A1 (en) * 2022-09-27 2024-04-04 Siemens Aktiengesellschaft Method, system, apparatus, electronic device, and storage medium for evaluating work task
CN117272425B (en) * 2023-11-22 2024-04-09 卡奥斯工业智能研究院(青岛)有限公司 Assembly method, assembly device, electronic equipment and storage medium
CN117635605B (en) * 2024-01-23 2024-06-18 宁德时代新能源科技股份有限公司 Battery visual inspection confirmation method and device, electronic equipment and storage medium

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4056716A (en) * 1976-06-30 1977-11-01 International Business Machines Corporation Defect inspection of objects such as electronic circuits
US6757571B1 (en) * 2000-06-13 2004-06-29 Microsoft Corporation System and process for bootstrap initialization of vision-based tracking systems
JP2003167613A (en) * 2001-11-30 2003-06-13 Sharp Corp Operation management system and method and recording medium with its program for realizing the same method stored
JP2004104576A (en) * 2002-09-11 2004-04-02 Mitsubishi Heavy Ind Ltd Wearable device for working, and device, method and program for remotely indicating working
JP2005250990A (en) * 2004-03-05 2005-09-15 Mitsubishi Electric Corp Operation support apparatus
JP4784752B2 (en) * 2006-06-30 2011-10-05 サクサ株式会社 Image processing device
US8131055B2 (en) * 2008-01-31 2012-03-06 Caterpillar Inc. System and method for assembly inspection
JP6113631B2 (en) * 2013-11-18 2017-04-12 東芝三菱電機産業システム株式会社 Work confirmation system
JP2017091091A (en) * 2015-11-06 2017-05-25 三菱電機株式会社 Work information generation device
JP6224873B1 (en) * 2016-03-04 2017-11-01 新日鉄住金ソリューションズ株式会社 Information processing system, information processing apparatus, information processing method, and program
JP6608778B2 (en) * 2016-08-01 2019-11-20 株式会社日立製作所 Work movement instruction device
WO2018204410A1 (en) * 2017-05-04 2018-11-08 Minds Mechanical, Llc Metrology system for machine learning-based manufacturing error predictions
US10061300B1 (en) * 2017-09-29 2018-08-28 Xometry, Inc. Methods and apparatus for machine learning predictions and multi-objective optimization of manufacturing processes

Also Published As

Publication number Publication date
JP7207790B2 (en) 2023-01-18
JP2022522159A (en) 2022-04-14
KR20220005434A (en) 2022-01-13
CN113544604A (en) 2021-10-22

Similar Documents

Publication Publication Date Title
JP7437054B2 (en) Methods, devices and non-transitory computer-readable media for optimizing workflow in an assembly line
JP7207790B2 (en) Assembly error correction for assembly lines
US11703824B2 (en) Assembly error correction for assembly lines
US10518357B2 (en) Machine learning device and robot system to learn processing order of laser processing robot and machine learning method thereof
JP6693938B2 (en) Appearance inspection device
Martinez-Cantin et al. Practical Bayesian optimization in the presence of outliers
WO2020008919A1 (en) Machine learning device and method
EP3912003A1 (en) Assembly error correction for assembly lines
CN113537277A (en) Determining interpretation of a classification
US20230281791A1 (en) Adaptive system and method for inspection of imaged items
US20230342908A1 (en) Distortion prediction for additive manufacturing using image analysis
CN117252851B (en) Standard quality detection management platform based on image detection and identification
TWI801820B (en) Systems and methods for manufacturing processes
Chernyshev et al. Digital Object Detection of Construction Site Based on Building Information Modeling and Artificial Intelligence Systems.
JP2020071777A (en) Time-series feature extraction device, time-series feature extraction method, and program
Ryu Machine learning-based classification system for building information models
KR102636461B1 (en) Automated labeling method, device, and system for learning artificial intelligence models
EP4075221A1 (en) Simulation process of a manufacturing system
Zheng et al. Explaining Imitation Learning Through Frames
Miettunen Identifying suitable profile joints in CAD using machine learning
Rao et al. An improved Multiperceptron Neural network model to classify Software defects
EP4196336A1 (en) Identifying candidate objects for additive manufacturing
CN118342514A (en) Target identification and positioning method, device and medium
IL276478B2 (en) Adaptive system and method for inspection of imaged items

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230127

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231124

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240726