JP2023169440A - Terminal, server, method for executing task, and method for providing information - Google Patents

Terminal, server, method for executing task, and method for providing information Download PDF

Info

Publication number
JP2023169440A
JP2023169440A JP2020136887A JP2020136887A JP2023169440A JP 2023169440 A JP2023169440 A JP 2023169440A JP 2020136887 A JP2020136887 A JP 2020136887A JP 2020136887 A JP2020136887 A JP 2020136887A JP 2023169440 A JP2023169440 A JP 2023169440A
Authority
JP
Japan
Prior art keywords
article
information
terminal
server
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020136887A
Other languages
Japanese (ja)
Inventor
悠太 菊池
Yuta Kikuchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Preferred Networks Inc
Original Assignee
Preferred Networks Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Preferred Networks Inc filed Critical Preferred Networks Inc
Priority to JP2020136887A priority Critical patent/JP2023169440A/en
Priority to PCT/JP2021/028931 priority patent/WO2022034841A1/en
Publication of JP2023169440A publication Critical patent/JP2023169440A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

To provide a technique for processing a task on an item.SOLUTION: A terminal according to an aspect of the present disclosure includes at least one memory and at least one processor. The at least one processor can send identification information of an item to a server, receive item information of the item from the server, and execute a task on the item on the basis of the item information. The task on the item is an operation on the item or deduction of information on the item.SELECTED DRAWING: Figure 1

Description

本開示は、端末、サーバ、タスク実行方法及び情報提供方法に関する。 The present disclosure relates to a terminal, a server, a task execution method, and an information provision method.

製造現場や物流現場においてロボットの利用が拡大している。例えば、工場では、様々な製造工程にロボットが導入されてきている。また、物流倉庫では、商品の運搬・搬出にロボットが利用されてきている。 The use of robots is expanding at manufacturing and logistics sites. For example, in factories, robots are being introduced in various manufacturing processes. In addition, robots are being used in distribution warehouses to transport and remove products.

ロボットの普及によって、オフィスや家庭においてもロボットの導入が検討されてきている。例えば、ロボットにオフィスや宅内の物品を把持や移動させたりすることが検討されている。 With the spread of robots, the introduction of robots into offices and homes is being considered. For example, consideration is being given to having robots grasp and move objects in offices and homes.

米国特許出願公開第2020/0014761号明細書US Patent Application Publication No. 2020/0014761

本開示の課題は、物品を対象とした何れかのタスクを処理するための技術を提供することである。 An object of the present disclosure is to provide a technique for processing any task that targets an article.

上記課題を解決するため、本開示の一態様は、少なくとも1つのメモリと、少なくとも1つのプロセッサと、を備え、前記少なくとも1つのプロセッサは、物品の識別情報をサーバに送信することと、前記サーバから前記物品に関する物品情報を受信することと、前記物品情報に基づいて、前記物品に関するタスクを実行することと、を実行可能に構成され、前記物品に関するタスクは、少なくとも前記物品の操作又は前記物品に関する情報の推論の何れかである、端末に関する。 In order to solve the above problems, one aspect of the present disclosure includes at least one memory and at least one processor, and the at least one processor transmits identification information of an article to a server, and the server and executing a task related to the article based on the article information, and the task related to the article includes at least the operation of the article or the operation of the article. Any inference of information regarding a terminal.

本開示の一実施例による物品操作システムを示す概略図である。1 is a schematic diagram illustrating an article handling system according to one embodiment of the present disclosure. FIG. 本開示の一実施例によるサーバの機能構成を示すブロック図である。FIG. 2 is a block diagram showing the functional configuration of a server according to an embodiment of the present disclosure. 本開示の一実施例による端末の機能構成を示すブロック図である。FIG. 2 is a block diagram showing the functional configuration of a terminal according to an embodiment of the present disclosure. 本開示の一実施例によるニューラルネットワークを示す図である。1 is a diagram illustrating a neural network according to one embodiment of the present disclosure. FIG. 本開示の一実施例によるサーバによる物品情報の送受信処理を示すフローチャートである。2 is a flowchart illustrating a process of transmitting and receiving article information by a server according to an embodiment of the present disclosure. 本開示の一実施例による端末による物品操作制御処理を示すフローチャートである。It is a flowchart which shows article operation control processing by a terminal according to one example of the present disclosure. 本開示の一実施例によるサーバ及び端末のハードウェア構成を示すブロック図である。FIG. 2 is a block diagram showing the hardware configuration of a server and a terminal according to an embodiment of the present disclosure.

以下、図面に基づいて本開示の実施の形態を説明する。 Embodiments of the present disclosure will be described below based on the drawings.

以下の実施例では、物品の操作(例えば、把持、移動、搬送等)、物品に関する情報の推論(例えば、認識、検品、異常検知等)、物品に関する情報の提示等、物品を対象として何らかのタスクを実行する端末(例えば、ロボット、スマートスピーカー、AR(Augumented Reality)/MR(Mixed Reality)グラス、スマートフォン、ゲーム機、移動体等)と、物品を対象としたタスクを実行するのに利用される物品情報を端末に提供するサーバとが開示される。なお、端末・サーバともに複数台備えてもよい。また、複数の端末のうちの1つ以上の端末が、サーバとしての役割を実行してもよい。 In the following embodiments, some task is performed with the object, such as manipulating the object (e.g., grasping, moving, transporting, etc.), inferring information about the object (e.g., recognition, inspection, abnormality detection, etc.), presenting information about the object, etc. (e.g., robots, smart speakers, AR (Augmented Reality)/MR (Mixed Reality) glasses, smartphones, game consoles, mobile objects, etc.) and goods. A server that provides article information to a terminal is disclosed. Note that a plurality of terminals and servers may be provided. Further, one or more terminals among the plurality of terminals may perform the role of a server.

以下の実施例は、物品を対象としたタスクとして、物品に対する物理的操作を実行する端末に着目して説明するが、本開示によるタスクは、これに限定されるものでない。例えば、本開示によるタスクは、物品を把持することや押すことや引っ張ること(例えば、物品の整列、陳列等)、物品の搬送(例えば、ベルトコンベアによる物品の搬送等)等の物品との物理的な接触を伴うタスクだけでなく、物品の認識(例えば、物品の位置や姿勢を他のデバイスに伝える等)、物品の検品や異常検知(例えば、当該物品の3Dモデルとの比較、傷の検出等)等の物品との物理的接触を伴わないタスク(物品に関する情報の推論等)を含んでもよい。
[物品操作システム]
まず、図1を参照して、本開示の一実施例による物品操作システムを説明する。図1は、本開示の一実施例による物品操作システムを示す概略図である。
The following embodiments will be described with a focus on a terminal that performs a physical operation on an article as a task targeting an article, but the tasks according to the present disclosure are not limited to this. For example, tasks according to the present disclosure may involve physical interaction with the item, such as grasping, pushing, or pulling the item (e.g., arranging, displaying, etc.), transporting the item (e.g., transporting the item on a belt conveyor, etc.). This includes not only tasks that involve physical contact, but also object recognition (e.g., conveying the object's position and orientation to other devices), object inspection, and anomaly detection (e.g., comparison with a 3D model of the object, damage detection, etc.). Detection, etc.) may include tasks that do not involve physical contact with the item (such as inference of information about the item).
[Article manipulation system]
First, with reference to FIG. 1, an article handling system according to an embodiment of the present disclosure will be described. FIG. 1 is a schematic diagram illustrating an article handling system according to one embodiment of the present disclosure.

図1に示されるように、物品操作システム10は、サーバ100及び端末200を有する。サーバ100は、例えば、ネットワークを介しユーザの端末200に通信接続され、端末200は、サーバ100から取得した物品情報を利用して、取得した物品情報に対応する物品を操作する。端末200は、例えば、物品を把持、移動等するロボットであってもよい。しかしながら、本開示による端末は、これに限定されず、スマートスピーカー(例えば、商品としての物品の取り扱い情報やキャンペーン情報などに関する音声や画像の出力)、AR/MRグラス(例えば、物品の3Dモデルを利用した説明、情報等の提示)、スマートフォン(例えば、ARアプリ)、ゲーム機(付属のカメラにより撮像された画像のゲーム内での利用)、カメラ、センサ、ディスプレイ等を備えたデバイス(例えば、観葉植物の水分状態、栄養状態、日照状態等を監視し、登録されている適切な状態に基づき水分や栄養を補給したり、日照を調整するデバイス、天井や壁面に動画等を投影するプロジェクタ及び当該デバイスの制御プログラム)であってもよい。また、端末200は、物品情報として取得した物品の3Dモデルを利用して、物品を認識してもよいし、物品を把持してもよい。また、物品操作システム10は、物品に関するタスクに対応したタスク処理システムとして実現されうる。 As shown in FIG. 1, the article handling system 10 includes a server 100 and a terminal 200. The server 100 is communicatively connected to a user's terminal 200 via a network, for example, and the terminal 200 uses the article information acquired from the server 100 to operate an article corresponding to the acquired article information. The terminal 200 may be, for example, a robot that grasps, moves, etc. objects. However, the terminal according to the present disclosure is not limited to this, and can include smart speakers (for example, outputting audio and images related to handling information and campaign information for articles as products), AR/MR glasses (for example, outputting 3D models of articles), Presentation of explanations, information, etc. used), smartphones (e.g., AR apps), game consoles (use of images captured by the attached camera in the game), devices equipped with cameras, sensors, displays, etc. (e.g., Devices that monitor the moisture status, nutritional status, sunlight status, etc. of houseplants, and supply moisture and nutrients based on the registered appropriate status, and adjust sunlight; projectors that project videos, etc. onto ceilings and walls; and (a control program for the device). Further, the terminal 200 may recognize the article using the 3D model of the article acquired as the article information, or may grasp the article. Furthermore, the article handling system 10 can be implemented as a task processing system that handles tasks related to articles.

例えば、物品情報は、当該物品の形状、重量、種別などのように物品に関する情報であってもよい。また、物品情報は、当該物品を操作する際の留意事項(例えば、把持する箇所、壊れやすい箇所など)などのように当該物品を操作する際に直接的に又は間接的に必要となる情報であってもよい。 For example, the article information may be information about the article, such as the shape, weight, type, etc. of the article. In addition, product information is information that is directly or indirectly necessary when operating the product, such as precautions when operating the product (for example, parts to grip, fragile parts, etc.). There may be.

また、端末200がニューラルネットワークモデルを利用して、当該物品を操作する場合、物品情報は、当該ニューラルネットワークモデルに対するパラメータ、勾配情報等の更新情報であってもよい。この場合、端末200は、例えば、予め保持する物品操作のためのニューラルネットワークモデルに対して、取得した物品情報に示されたパラメータによって当該ニューラルネットワークモデルのパラメータを置換したり、あるいは、取得した物品情報に示された勾配情報に従ってニューラルネットワークモデルを更新してもよい。そして、端末200は、カメラ等によって取得した物品の画像と、ユーザからの操作指示とを更新されたニューラルネットワークモデルに入力し、ニューラルネットワークモデルから出力される操作手順に従って物品を操作する。なお、ニューラルネットワークに入力する情報は、マイクロフォンで取得した物品が発する音に関する情報であってもよい。 Further, when the terminal 200 operates the article using a neural network model, the article information may be update information such as parameters and slope information for the neural network model. In this case, the terminal 200 may, for example, replace the parameters of the neural network model for article manipulation stored in advance with the parameters indicated in the acquired article information, or The neural network model may be updated according to the gradient information indicated in the information. Then, the terminal 200 inputs the image of the article obtained by a camera or the like and the operation instruction from the user into the updated neural network model, and operates the article according to the operation procedure output from the neural network model. Note that the information input to the neural network may be information regarding the sound emitted by the article acquired by the microphone.

例えば、把持の場合、物品情報は、搭載されている把持モデルに依存した情報(ニューラルネットワークモデルに対する追加パラメータであってもよいし、キーポイントベースならその商品用のキーポイントであってもよい)であってもよい。また、物品情報は、把持のために接触してはならない部分を3Dモデル上で特定したもの、何れかのプロトコルに従って記述される把持、置く等のため、重量、重心位置、柔らかい部分、固い部分、耐荷重、上に物を重ねていいか、何かの上に置いていいか、押しのけてもいいか、などのデフォルト値を示してもよい。また、物品情報は、デフォルトの片付け場所(例えば、家具に家具タイプ等が登録され、部屋タイプ(例えば、キッチン)と収納タイプ(例えば、戸棚)の組み合わせで片付け場所を指定してもよい。また、載置の場合、物品情報は、デフォルト姿勢(例えば、ペットボトルはひっくり返して置かない等)を示してもよい。ペットボトルの場合、物品情報は、「キャップ」、「本体」、「ラベル」のような パーツ情報であってもよく、パート毎に「注ぐ、運ぶときに持つ部分」、「ひねって開けるための部分」など 機能面でのアノテーションを示してもよい。また、物品情報は、組み立て家具の場合、その組み立て方を3Dモデルを使って提示するCGモデル(ARでの表示やスマホでの表示)であってもよい。また、物品情報は、観葉植物の場合、その世話の仕方、目安の水分量、日照量などを示してもよい。また、物品情報は、物品を操作するための3Dモデル等の情報でもよく、端末200はこの物品情報に基づいて物品を操作することができる。また、物品情報が物品に関する情報を含み、端末200がこの情報を少なくとも音声又は画像のいずれかを用いて出力するようにしてもよい。物品プロバイダ50は、キャンペーン等の物品の一時的な追加情報を含む各種情報を(初回登録時以外も必要があれば)追加又は更新し、端末200にプッシュ送信してもよい。 For example, in the case of gripping, the product information is information that depends on the installed gripping model (it may be additional parameters for the neural network model, or if it is keypoint-based, it may be the keypoints for the product) It may be. In addition, the article information includes parts that must not be touched for grasping on the 3D model, weight, center of gravity, soft parts, hard parts for gripping, placing, etc. described according to any protocol. It may also indicate default values such as load capacity, whether objects can be stacked on top of it, whether it can be placed on top of something, whether it can be pushed away, etc. In addition, the item information may be a default tidying place (for example, the furniture type is registered for furniture, and the tidying place may be specified by a combination of room type (for example, kitchen) and storage type (for example, cupboard). , in the case of placement, the article information may indicate a default posture (for example, do not place a plastic bottle upside down).In the case of a plastic bottle, the article information may include "cap", "body", "label", etc. ”, and functional annotations such as ``the part to hold when pouring or transporting'' or ``the part to twist to open'' may also be shown for each part. In the case of assembled furniture, it may be a CG model (displayed in AR or displayed on a smartphone) that shows how to assemble it using a 3D model.In addition, in the case of a houseplant, the product information may be a CG model that shows how to assemble it. The item information may also include information such as a 3D model for operating the item, and the terminal 200 may indicate how to operate the item based on this item information. In addition, the product information may include information regarding the product, and the terminal 200 may output this information using at least audio or images. Various information including additional information may be added or updated (if necessary other than at the time of initial registration) and may be push-transmitted to the terminal 200.

ステップS101において、サーバ100は、物品プロバイダ50から物品に関する物品情報を取得する。物品プロバイダ50は、ユーザに販売又は提供される物品の形状情報、重量、物品種別、3D CAD等の3Dモデル、留意事項、ニューラルネットワークモデルの更新情報等を示す物品情報を予め生成し、サーバ100に登録する。なお、物品プロバイダ50は、当該物品を製造、販売等する企業等のコンピュータによって実現されてもよい。しかしながら、本開示による物品情報は、これに限定されず、サーバ100によって生成されてもよい。また、ニューラルネットワークモデルの更新情報は、サーバ100によって生成されてもよい。この場合、物品プロバイダ50は、ニューラルネットワークの訓練に用いる画像集合や訓練したニューラルネットワークの性能を検証するための(正解アノテーション付き)画像集合をサーバ100に提供してもよい。また、ニューラルネットワークモデルの更新情報は、端末200によって生成されてもよい。この場合、生成された更新情報は、各端末200からサーバ100に送信され、サーバ100は、各端末200から受信した各端末200に個別の更新情報に基づきニューラルネットワークモデルの更新情報を生成し、各端末200に配信してもよい。また、物品プロバイダ50は物品そのものをサーバ100の管理者へ送付し、物品情報の登録を委託しても良い。 In step S101, the server 100 acquires article information regarding the article from the article provider 50. The product provider 50 generates in advance product information indicating the shape information, weight, product type, 3D model such as 3D CAD, notes, neural network model update information, etc. of the product to be sold or provided to the user, and sends the product information to the server 100. Register. Note that the product provider 50 may be realized by a computer of a company that manufactures, sells, etc. the product. However, the article information according to the present disclosure is not limited to this, and may be generated by the server 100. Further, the neural network model update information may be generated by the server 100. In this case, the product provider 50 may provide the server 100 with an image set used for training the neural network or an image set (with correct answer annotations) for verifying the performance of the trained neural network. Further, the neural network model update information may be generated by the terminal 200. In this case, the generated update information is transmitted from each terminal 200 to the server 100, and the server 100 generates update information for the neural network model based on the individual update information for each terminal 200 received from each terminal 200, It may also be distributed to each terminal 200. Alternatively, the article provider 50 may send the article itself to the administrator of the server 100 and entrust registration of article information.

ステップS102において、サーバ100は、取得した物品情報に対して当該物品を識別する物品識別情報を生成し、生成した物品識別情報を物品プロバイダ50に送信する。また、サーバ100は、物品プロバイダ50から取得した物品情報と、当該物品の物品識別情報とを関連付けて保持する。しかしながら、本開示による物品識別情報は、これに限定されず、物品プロバイダ50によって生成され、サーバ100に提供されてもよい。また、端末200に有用な情報が、サーバ100の内部のシミュレータ等で補完されてもよい。例えば、ビジョン用のニューラルネットワークの訓練に加えて、(端末200がロボットである場合)、把持等の動作に関するシミュレーションを行って、把持用のニューラルネットワークの更新情報や安定した把持姿勢の情報等が、サーバ100から提供されてもよい。 In step S102, the server 100 generates article identification information for identifying the article based on the acquired article information, and transmits the generated article identification information to the article provider 50. Further, the server 100 associates and holds the article information acquired from the article provider 50 and the article identification information of the article. However, the article identification information according to the present disclosure is not limited thereto, and may be generated by the article provider 50 and provided to the server 100. Further, information useful for the terminal 200 may be supplemented by a simulator or the like inside the server 100. For example, in addition to training a neural network for vision, (if the terminal 200 is a robot) a simulation of movements such as grasping is performed to obtain update information for the neural network for grasping, information on a stable grasping posture, etc. , may be provided from the server 100.

ステップS103において、端末200は、物品プロバイダ50から物品と当該物品の物品識別情報(物品の識別情報)とを取得する。例えば、ユーザがある物品を店頭で購入すると、端末200は、当該物品に添付される説明書、当該物品の包装箱等に記載されたバーコード等を撮像することによって、当該物品の物品識別情報を取得してもよい。また、端末200は、当該物品を撮像した画像と物品識別情報とを関連付けて保持してもよい。これにより、端末200がカメラ等によって操作対象の物品を特定すると、当該物品に対応する物品識別情報を抽出することができる。また、物品識別情報は、物品自体から取得されてもよい。例えば、物品自体に物品識別情報が記載されていてもよく、端末200は、当該記載を読み取ることによって物品識別情報を取得してもよい。また、端末200のカメラで取得した物品の画像情報等を物品識別情報としてもよい。 In step S103, the terminal 200 acquires the article and the article identification information (article identification information) of the article from the article provider 50. For example, when a user purchases an item at a store, the terminal 200 captures the item identification information of the item by capturing an image of the manual attached to the item, the barcode written on the packaging box, etc. of the item. may be obtained. Further, the terminal 200 may store an image of the article in association with the article identification information. Thereby, when the terminal 200 identifies the object to be operated using a camera or the like, it is possible to extract the object identification information corresponding to the object. Moreover, the article identification information may be obtained from the article itself. For example, the article identification information may be written on the article itself, and the terminal 200 may acquire the article identification information by reading the description. Further, image information of the article acquired by the camera of the terminal 200 or the like may be used as the article identification information.

ステップS104において、端末200は、物品の物品識別情報をサーバ100に送信する。例えば、端末200は、自らネットワークに接続し、物品識別情報をサーバ100に送信してもよいし、あるいは、ユーザのスマートフォンなどの他の通信装置を介し物品識別情報をサーバ100に送信してもよい。 In step S104, the terminal 200 transmits the article identification information of the article to the server 100. For example, the terminal 200 may connect to the network itself and transmit the article identification information to the server 100, or the terminal 200 may transmit the article identification information to the server 100 via another communication device such as a user's smartphone. good.

ステップS105において、サーバ100は、受信した物品識別情報に対応する物品情報を端末200に送信する。端末200は、受信した物品情報を保持し、当該物品情報に基づき物品に対する操作を制御する。なお、端末200は、ユーザのスマートフォンなどの他の通信装置を介して物品情報をサーバ100から取得してもよい。 In step S105, the server 100 transmits article information corresponding to the received article identification information to the terminal 200. The terminal 200 holds the received article information and controls operations on the article based on the article information. Note that the terminal 200 may acquire article information from the server 100 via another communication device such as a user's smartphone.

ここで、端末200は、物品識別情報の取得時に当該物品の物品情報をサーバ100から取得してもよいし、あるいは、当該物品の操作時に物品情報をサーバ100から取得してもよい。 Here, the terminal 200 may acquire article information of the article from the server 100 when acquiring article identification information, or may acquire article information from the server 100 when operating the article.

なお、上述した実施例では、物品プロバイダ50とサーバ100とは別々の装置であったが、本開示はこれに限定されず、物品プロバイダ50とサーバ100とは同一の装置として実現されてもよい。
[サーバ]
次に、図2を参照して、本開示の一実施例によるサーバ100を説明する。図2は、本開示の一実施例によるサーバ100の機能構成を示すブロック図である。
Note that in the embodiment described above, the article provider 50 and the server 100 are separate devices, but the present disclosure is not limited to this, and the article provider 50 and the server 100 may be realized as the same device. .
[server]
Next, with reference to FIG. 2, a server 100 according to an embodiment of the present disclosure will be described. FIG. 2 is a block diagram showing the functional configuration of the server 100 according to an embodiment of the present disclosure.

図2に示されるように、サーバ100は、物品情報受付部110、物品識別情報割当部120及び物品情報格納部130を有する。 As shown in FIG. 2, the server 100 includes an article information reception section 110, an article identification information allocation section 120, and an article information storage section 130.

物品情報受付部110は、物品の物品情報を受け付ける。具体的には、物品情報受付部110は、物品プロバイダ50から物品情報を受け付ける。例えば、物品情報は、当該物品の形状情報、重量、物品種別、留意事項などを示すものであってもよい。また、物品情報は、物品に対する操作を制御するためのニューラルネットワークモデルの更新情報を示すものであってもよい。例えば、更新情報は、訓練済みのニューラルネットワークモデルに対する更新用のパラメータ又は勾配情報を含んでもよい。 The article information reception unit 110 receives article information about articles. Specifically, the article information reception unit 110 receives article information from the article provider 50. For example, the article information may indicate shape information, weight, article type, precautions, etc. of the article. Further, the article information may indicate update information of a neural network model for controlling operations on the article. For example, the update information may include parameters or gradient information for updating a trained neural network model.

物品識別情報割当部120は、物品を識別する物品識別情報を当該物品に割り当てる。具体的には、物品プロバイダ50から物品情報を受け付けると、物品識別情報割当部120は、受け付けた物品情報の物品を一意的に識別する物品識別情報を当該物品に付与し、付与した物品識別情報を物品プロバイダ50に提供する。例えば、物品識別情報は、英数字の文字列であってもよく、1次元又は2次元バーコードに変換可能であってもよい。 The article identification information allocation unit 120 allocates article identification information for identifying the article to the article. Specifically, when article information is received from the article provider 50, the article identification information allocation unit 120 assigns article identification information that uniquely identifies the article of the received article information to the article, and uses the attached article identification information. is provided to the article provider 50. For example, the article identification information may be an alphanumeric character string, or may be convertible into a one-dimensional or two-dimensional barcode.

物品情報格納部130は、受け付けた物品情報を格納する。具体的には、物品情報格納部130は、物品プロバイダ50から受け付けた物品情報を、当該物品の物品識別情報と関連付けてデータベース等に格納する。後述するように、端末200又は端末200に通信接続された当該ユーザのスマートフォン等の通信装置から物品識別情報を取得すると、物品情報格納部130は、取得した物品識別情報に対応する物品情報を端末200又は通信装置に提供する。なお、物品識別情報として物品の画像情報を取得した場合、この画像情報に対して認識処理を実行して物品を特定し、特定した物品に対応する物品情報を端末200又は通信装置に提供してもよい。 The article information storage unit 130 stores the received article information. Specifically, the article information storage unit 130 stores article information received from the article provider 50 in a database or the like in association with the article identification information of the article. As will be described later, when article identification information is acquired from the terminal 200 or a communication device such as a smartphone of the user connected to the terminal 200, the article information storage unit 130 stores article information corresponding to the acquired article identification information to the terminal. 200 or a communication device. Note that when image information of an article is acquired as article identification information, recognition processing is performed on this image information to identify the article, and article information corresponding to the identified article is provided to the terminal 200 or the communication device. Good too.

一実施例では、物品情報格納部130は、端末200の種別情報に対応する物品情報を端末200に提供してもよい。例えば、端末200が物品に関するタスクを実行するためのニューラルネットワークモデルなどの機械学習モデルを備える場合、物品情報格納部130は、当該機械学習モデルに対する更新情報を端末200に提供してもよい。このため、端末200は、サーバ100に対する物品情報取得要求に自らの種別情報を含めてもよい。 In one embodiment, the article information storage unit 130 may provide the terminal 200 with article information corresponding to the type information of the terminal 200. For example, if the terminal 200 is equipped with a machine learning model such as a neural network model for executing a task related to an article, the article information storage unit 130 may provide the terminal 200 with update information for the machine learning model. Therefore, the terminal 200 may include its own type information in the article information acquisition request to the server 100.

また、一実施例では、端末200は、自端末で保有するニューラルネットワークモデルなどの物品に関するタスクを実行するための機械学習モデルに関する情報をサーバ100に送信し、物品情報格納部130は、受信した機械学習モデルに関する情報に基づいて、端末200に送信する物品情報を制御してもよい。 Further, in one embodiment, the terminal 200 transmits to the server 100 information regarding a machine learning model for executing a task related to an article, such as a neural network model owned by the terminal, and the article information storage unit 130 receives the received information. Article information transmitted to the terminal 200 may be controlled based on information regarding the machine learning model.

また、一実施例では、サーバ100は、種別情報に基づいて端末200が実行する物品を対象とするタスクを特定し、このタスクに必要な物品情報を端末200に送信するようにしてもよい。 Further, in one embodiment, the server 100 may specify a task that targets an article to be executed by the terminal 200 based on the type information, and may transmit article information necessary for this task to the terminal 200.

また、一実施例では、物品情報格納部130は、端末200によって所望される物品情報を端末200に提供してもよい。例えば、端末200が操作対象の物品の重量を所望する場合、物品情報格納部130は、物品の重量を物品情報として端末200に提供してもよい。 Further, in one embodiment, the article information storage unit 130 may provide the terminal 200 with article information desired by the terminal 200. For example, when the terminal 200 desires the weight of an object to be operated, the article information storage unit 130 may provide the terminal 200 with the weight of the article as article information.

なお、上述した実施例では、サーバ100が物品情報を端末200に提供しているが、本開示による物品情報は、物品プロバイダ50から端末200に直接提供されてもよい。例えば、追加的な物品情報又は更新された物品情報が、適宜物品プロバイダ50から端末200にプッシュ送信されてもよい。
[端末]
次に、図3を参照して、本開示の一実施例による端末200を説明する。図3は、本開示の一実施例による端末200の機能構成を示すブロック図である。
Note that in the embodiment described above, the server 100 provides the article information to the terminal 200, but the article information according to the present disclosure may be provided directly to the terminal 200 from the article provider 50. For example, additional or updated item information may be pushed from item provider 50 to terminal 200 from time to time.
[Terminal]
Next, with reference to FIG. 3, a terminal 200 according to an embodiment of the present disclosure will be described. FIG. 3 is a block diagram showing the functional configuration of the terminal 200 according to an embodiment of the present disclosure.

図3に示されるように、端末200は、ユーザインタフェース部210、情報格納部220及び制御部230を有する。 As shown in FIG. 3, the terminal 200 includes a user interface section 210, an information storage section 220, and a control section 230.

ユーザインタフェース部210は、ユーザインタフェースを提供する。具体的には、ユーザが物品を入手すると、ユーザインタフェース部210は、当該物品の物品識別情報を取得する。例えば、ユーザが物品識別情報を示すバーコードを撮像することによって、あるいは、物品識別情報を示す英数字の文字列を入力することによって、ユーザインタフェース部210は、物品識別情報を取得してもよい。また、ユーザインタフェース部210は、物品プロバイダ50から物品識別情報を取得してもよい。 User interface unit 210 provides a user interface. Specifically, when the user obtains an article, the user interface unit 210 acquires the article identification information of the article. For example, the user interface unit 210 may acquire the article identification information by the user capturing an image of a barcode indicating the article identification information, or by inputting an alphanumeric character string indicating the article identification information. . Further, the user interface unit 210 may obtain article identification information from the article provider 50.

また、ユーザから操作指示を受け付けると、ユーザインタフェース部210は、当該操作指示を制御部230に提供する。具体的には、端末200がアームを備えたロボットとして実現される場合、操作指示は、端末200に物品を把持、移動、搬送させるものであってもよい。例えば、操作指示は、「位置Aにある物品Xを位置Bに移動して下さい」などのユーザによる音声指示であってもよい。この場合、端末200は、何れか既存の音声認識技術を利用して、当該音声指示を「物品Xを位置Aから位置Bに移動する」操作指示であると認識してもよい。なお、ユーザインタフェース部210は、事前に登録されたタスク又はユーザにより登録されたタスクを受け付けてもよく、この場合、登録されたタスク対象の物品が操作対象として追加されてもよい。 Further, upon receiving an operation instruction from the user, the user interface section 210 provides the operation instruction to the control section 230. Specifically, when the terminal 200 is implemented as a robot with an arm, the operation instruction may be to cause the terminal 200 to grasp, move, and transport an article. For example, the operation instruction may be a voice instruction by the user such as "Please move article X located at position A to position B." In this case, the terminal 200 may use any existing voice recognition technology to recognize the voice instruction as an operation instruction to "move article X from position A to position B." Note that the user interface unit 210 may accept a task registered in advance or a task registered by a user, and in this case, the registered object of the task may be added as an operation target.

情報格納部220は、取得した物品識別情報を格納する。具体的には、情報格納部220は、ユーザインタフェース部210によって取得された物品識別情報を格納する。例えば、情報格納部220は、物品識別情報と、当該物品の画像とを関連付けて格納してもよい。また、物品情報が取得されている場合、情報格納部220は、物品識別情報と物品情報とを関連付けて格納してもよい。 The information storage unit 220 stores the acquired article identification information. Specifically, the information storage section 220 stores article identification information acquired by the user interface section 210. For example, the information storage unit 220 may store article identification information and an image of the article in association with each other. Furthermore, when article information has been acquired, the information storage unit 220 may store article identification information and article information in association with each other.

制御部230は、物品に対する操作を制御する。具体的には、制御部230は、ユーザからの操作指示に従って、操作対象の物品の物品情報を抽出し、抽出した物品情報に基づき当該物品に対する操作を制御する。なお、制御部230は、事前に登録されたタスク又はユーザにより登録されたタスクについて、登録されたタスク対象の物品を操作対象として追加してもよい。 The control unit 230 controls operations on articles. Specifically, the control unit 230 extracts the article information of the article to be operated according to an operation instruction from the user, and controls the operation on the article based on the extracted article information. Note that the control unit 230 may add the registered task target article as an operation target for a task registered in advance or a task registered by a user.

例えば、操作指示が卓上に置かれた本を本棚に移動するように、アームを備えたロボットとして実現される端末200に指示するものである場合、制御部230は、操作対象の本を撮像し、撮像した本の画像に対応する物品識別情報を情報格納部220から抽出する。 For example, if the operation instruction is to instruct the terminal 200, which is implemented as a robot with an arm, to move a book placed on a table to a bookshelf, the control unit 230 may take an image of the book to be operated. , extracts article identification information corresponding to the captured image of the book from the information storage unit 220.

抽出した物品識別情報に対応する物品情報が情報格納部220に格納されている場合、制御部230は、当該物品情報に従って本を卓上から本棚に移動するようアームを制御する。例えば、物品情報が本の形状情報(例えば、A5サイズ、A4サイズ、ページ数など)及び物品種別(例えば、ソフトカバー、ハードカバーなど)を示す場合、制御部230は、取得した物品情報に適してアームを制御し、本を把持し、本棚に移動してもよい。 When article information corresponding to the extracted article identification information is stored in the information storage section 220, the control section 230 controls the arm to move the book from the tabletop to the bookshelf according to the article information. For example, when the article information indicates book shape information (e.g., A5 size, A4 size, number of pages, etc.) and article type (e.g., soft cover, hard cover, etc.), the control unit 230 controls the The robot may control the arm to grasp the book and move it to the bookshelf.

他方、抽出した物品識別情報に対応する物品情報が情報格納部220に格納されていない場合、制御部230は、物品識別情報と共に、当該物品の物品情報に対する取得要求をサーバ100に送信し、サーバ100から要求した物品情報を取得する。そして、制御部230は、取得した物品情報を情報格納部220に格納すると共に、同様にして物品情報に従って本を卓上から本棚に移動するようアームを制御する。 On the other hand, if the article information corresponding to the extracted article identification information is not stored in the information storage section 220, the control section 230 transmits an acquisition request for the article information of the article together with the article identification information to the server 100, and the server 100 to obtain the requested article information. Then, the control unit 230 stores the acquired item information in the information storage unit 220, and similarly controls the arm to move the book from the tabletop to the bookshelf according to the item information.

また、物品に対する操作を制御するための機械学習モデルがサーバ100から端末200に事前に提供されてもよく、制御部230は、当該機械学習モデルを利用して、ユーザからの操作指示に従って物品に対する操作を制御してもよい。この場合、物品情報は、当該物品を適切に操作するための機械学習モデルに対する更新情報であってもよい。 Further, a machine learning model for controlling operations on the article may be provided in advance from the server 100 to the terminal 200, and the control unit 230 uses the machine learning model to control operations on the article according to operation instructions from the user. Operation may be controlled. In this case, the article information may be update information for a machine learning model for appropriately operating the article.

例えば、機械学習モデルが端末200に事前に提供されているニューラルネットワークモデルである場合、制御部230は、操作対象の物品の更新情報を取得し、取得した更新情報に従ってニューラルネットワークモデルを更新してもよい。また、制御部230は、更新前のニューラルネットワークモデルをサーバ100に送信し、当該送信したニューラルネットワークモデルの更新情報をサーバ100から受信し、受信した更新情報に従ってニューラルネットワークモデルを更新してもよい。具体的には、更新情報がニューラルネットワークモデルのパラメータである場合、制御部230は、取得したパラメータによってニューラルネットワークモデルを更新し、更新されたニューラルネットワークモデルによって物品に対する操作を制御してもよい。また、更新情報がニューラルネットワークモデルの勾配情報である場合、制御部230は、取得した勾配情報によってニューラルネットワークモデルを更新し、更新されたニューラルネットワークモデルによって物品に対する操作を制御してもよい。すなわち、端末200は、サーバ100からベースとなる機械学習モデルを取得し、取得した機械学習モデルをサーバ100から送信される更新情報に基づいて、更新してもよい。この場合、サーバ100は、端末200が保有する機械学習モデルの情報を端末IDと紐づけて管理することが可能になる。また、サーバ100は、端末200から取得した物体識別情報に基づいて、端末200に対して適した更新情報を送信することが可能になる。また、端末200が保有する機械学習モデルをサーバ100に送信し、サーバ側でこの機械学習モデルに対する更新情報を生成するようにしてもよい。このように、更新情報は、機械学習モデルのパラメータと機械学習モデルの勾配情報との一方又は双方を含んでもよい。 For example, if the machine learning model is a neural network model provided in advance to the terminal 200, the control unit 230 acquires update information of the object to be operated, and updates the neural network model according to the acquired update information. Good too. Further, the control unit 230 may transmit the neural network model before updating to the server 100, receive update information of the transmitted neural network model from the server 100, and update the neural network model according to the received update information. . Specifically, when the update information is a parameter of a neural network model, the control unit 230 may update the neural network model using the acquired parameter and control the operation on the article using the updated neural network model. Further, when the update information is gradient information of a neural network model, the control unit 230 may update the neural network model using the acquired gradient information, and control operations on the article using the updated neural network model. That is, the terminal 200 may acquire a base machine learning model from the server 100 and update the acquired machine learning model based on update information transmitted from the server 100. In this case, the server 100 can manage the machine learning model information held by the terminal 200 in association with the terminal ID. Further, the server 100 can transmit appropriate update information to the terminal 200 based on the object identification information acquired from the terminal 200. Alternatively, the machine learning model held by the terminal 200 may be transmitted to the server 100, and update information for this machine learning model may be generated on the server side. In this way, the update information may include one or both of the parameters of the machine learning model and the gradient information of the machine learning model.

一例として、端末200に事前に提供されたニューラルネットワークモデルが、図4に示される特徴抽出部、物体識別部及び物体識別拡張部から構成されているとする。ここで、特徴抽出部は、例えば、畳み込みニューラルネットワークとして実現されてもよい。また、物体識別部は、物体種別毎の情報(ベクトル)と特徴とのマッチングを行うニューラルネットワークのsoftmax層、識別器、マッチング部であってもよい。物体識別拡張部は、新規な物体に関する物体情報を追加する。この場合、操作対象の物品に対する物品情報は、物体識別拡張部として示されるように、物体識別部に対する付加部分を示すものであってもよい。このような更新情報を取得すると、制御部230は、更新情報に従って物体識別部に付加部分を追加し、特徴抽出部及び物体識別拡張部によって当該物品に対する操作を制御する。具体的には、制御部230は、物品の画像を特徴抽出部に入力し、特徴ベクトル又は特徴マップを取得する。そして、制御部230は、取得した特徴ベクトル又は特徴マップを物体識別部320に入力し、取得した特徴ベクトル又は特徴マップと、追加物体情報とに従って物体種別を特定し、特定した物体種別に従って当該物品に対する操作を制御する。ここで、物体種別は、当該物体が撮像されているバウンディングボックスやセグメンテーションマスクなどであってもよい。 As an example, assume that the neural network model provided to the terminal 200 in advance includes a feature extraction section, an object identification section, and an object identification extension section shown in FIG. Here, the feature extraction unit may be realized as a convolutional neural network, for example. Further, the object identification unit may be a softmax layer, a classifier, or a matching unit of a neural network that matches information (vectors) for each object type with features. The object identification extension adds object information about new objects. In this case, the article information for the object to be operated may indicate an additional part to the object identification section, as shown as an object identification extension section. Upon acquiring such updated information, the control unit 230 adds an additional part to the object identification unit according to the updated information, and controls operations on the article using the feature extraction unit and the object identification extension unit. Specifically, the control unit 230 inputs the image of the article to the feature extraction unit and obtains a feature vector or a feature map. Then, the control unit 230 inputs the acquired feature vector or feature map to the object identification unit 320, identifies the object type according to the acquired feature vector or feature map and the additional object information, and identifies the object according to the identified object type. Control operations on. Here, the object type may be a bounding box or a segmentation mask in which the object is imaged.

一実施例では、制御部230は、端末200の種別情報をサーバ100に送信し、物品識別情報と種別情報とに対応する物品情報をサーバ100から取得してもよい。すなわち、物品情報は、端末200の種別(例えば、ロボット、スマートスピーカー、AR(Augumented Reality)/MR(Mixed Reality)グラス、スマートフォン、ゲーム機、移動体等)に応じて準備されていてもよく、制御部230は、端末200の種別情報をサーバ100に送信し、端末200の種別に対応した物品情報をサーバ100から取得してもよい。
[物品情報の送受信処理]
次に、図5を参照して、本開示の一実施例による物品情報の送受信処理を説明する。当該送受信処理は、上述したサーバ100によって実行され、例えば、サーバ100の1つ以上のメモリに格納されたプログラムを1つ以上のプロセッサが実行することによって実現されうる。図5は、本開示の一実施例による物品情報の送受信処理を示すフローチャートである。
In one embodiment, the control unit 230 may transmit type information of the terminal 200 to the server 100 and obtain article information corresponding to the article identification information and type information from the server 100. That is, the article information may be prepared according to the type of terminal 200 (for example, robot, smart speaker, AR (Augmented Reality)/MR (Mixed Reality) glasses, smartphone, game console, mobile object, etc.). The control unit 230 may transmit the type information of the terminal 200 to the server 100 and obtain article information corresponding to the type of the terminal 200 from the server 100.
[Product information transmission/reception processing]
Next, with reference to FIG. 5, article information transmission/reception processing according to an embodiment of the present disclosure will be described. The transmission/reception process is executed by the server 100 described above, and can be realized, for example, by one or more processors executing a program stored in one or more memories of the server 100. FIG. 5 is a flowchart showing a process for transmitting and receiving article information according to an embodiment of the present disclosure.

図5に示されるように、ステップS201において、サーバ100は、物品プロバイダ50から物品情報を受け付ける。例えば、物品プロバイダ50は、物品の販売前などに、当該物品の物品情報の登録要求をサーバ100に送信してもよい。ここで、物品情報は、物品の形状、物品の重量、物品の物品種別、物品を操作する際の留意事項、及び物品の3Dモデルの何れかに関する情報の何れか1つ以上を含んでもよい。 As shown in FIG. 5, in step S201, the server 100 receives article information from the article provider 50. For example, the product provider 50 may send a registration request for product information about the product to the server 100 before selling the product. Here, the article information may include any one or more of information regarding any of the shape of the article, the weight of the article, the type of article, notes on operating the article, and the 3D model of the article.

ステップS202において、サーバ100は、取得した物品情報の物品に対して物品識別情報を付与し、付与した物品識別情報を物品プロバイダ50に返す。サーバ100は、取得した物品情報と物品識別情報とを関連付けてデータベース等に格納する。 In step S202, the server 100 assigns article identification information to the article of the acquired article information, and returns the attached article identification information to the article provider 50. The server 100 associates the acquired article information and article identification information and stores them in a database or the like.

ステップS203において、サーバ100は、端末200から物品識別情報を含む物品情報取得要求受信する。例えば、ユーザがある物品に対する操作指示を端末200に与えた場合、端末200は、操作対象の物品の物品識別情報をサーバ100に送信する。 In step S203, the server 100 receives an article information acquisition request including article identification information from the terminal 200. For example, when a user gives an operation instruction for a certain article to the terminal 200, the terminal 200 transmits article identification information of the article to be operated to the server 100.

ステップS204において、サーバ100は、受信した物品識別情報に対応する物品情報を端末200に返す。例えば、物品情報は、当該物品の形状情報、重量、物品種別、留意事項などを示すものであってもよい。 In step S204, the server 100 returns article information corresponding to the received article identification information to the terminal 200. For example, the article information may indicate shape information, weight, article type, precautions, etc. of the article.

ここで、サーバ100は、端末200の端末種別に対応する物品情報を提供してもよいし、端末200が所望する物品情報を端末200に提供してもよい。例えば、端末200が物品に対する操作を制御するためのニューラルネットワークモデルを有する端末種別である場合、サーバ100は、当該ニューラルネットワークモデルの更新情報を物品情報として提供してもよい。例えば、更新情報は、ニューラルネットワークモデルのパラメータ又は勾配情報を含んでもよい。 Here, the server 100 may provide article information corresponding to the terminal type of the terminal 200, or may provide the terminal 200 with article information desired by the terminal 200. For example, if the terminal 200 is a terminal type that has a neural network model for controlling operations on articles, the server 100 may provide update information of the neural network model as article information. For example, the update information may include neural network model parameters or gradient information.

なお、上述した実施例では、サーバ100が物品情報を端末200に提供しているが、本開示による物品情報は、物品プロバイダ50から端末200に直接提供されてもよい。例えば、追加的な物品情報又は更新された物品情報が、適宜物品プロバイダ50から端末200にプッシュ送信されてもよい。
[物品操作制御処理]
次に、図6を参照して、本開示の一実施例による物品操作制御処理を説明する。当該物品操作制御処理は、上述した端末200によって実行され、例えば、端末200の1つ以上のメモリに格納されたプログラムを1つ以上のプロセッサが実行することによって実現されうる。図6は、本開示の一実施例による物品操作制御処理を示すフローチャートである。
Note that in the embodiment described above, the server 100 provides the article information to the terminal 200, but the article information according to the present disclosure may be provided directly to the terminal 200 from the article provider 50. For example, additional or updated item information may be pushed from item provider 50 to terminal 200 from time to time.
[Article operation control processing]
Next, referring to FIG. 6, article manipulation control processing according to an embodiment of the present disclosure will be described. The article manipulation control process is executed by the terminal 200 described above, and can be realized, for example, by one or more processors executing a program stored in one or more memories of the terminal 200. FIG. 6 is a flowchart showing article manipulation control processing according to an embodiment of the present disclosure.

図6に示されるように、ステップS301において、端末200は、物品プロバイダ50から物品識別情報を取得する。例えば、ユーザが物品を購入した際、端末200は、物品プロバイダ50から提供される物品識別情報を取得してもよい。端末200は、取得した物品識別情報と当該物品の画像とを関連付けて保持してもよい。なお、端末200は、物品プロバイダ50からではなく、購入した物品そのもの若しくはその付属品から物品識別情報を取得してもよい。また、端末200は、ユーザのスマートフォンなどの他の通信装置を介して物品情報を取得してもよい。 As shown in FIG. 6, in step S301, the terminal 200 acquires article identification information from the article provider 50. For example, when the user purchases an item, the terminal 200 may acquire item identification information provided by the item provider 50. The terminal 200 may associate and hold the acquired article identification information and the image of the article. Note that the terminal 200 may acquire the article identification information not from the article provider 50 but from the purchased article itself or its accessories. Further, the terminal 200 may acquire article information via another communication device such as a user's smartphone.

ステップS302において、端末200は、ユーザから物品に対する操作指示を受け付ける。具体的には、操作指示は、端末200に物品を把持、移動させるものであってもよい。例えば、操作指示は、「位置Aにある物品Xを位置Bに移動して下さい」などのユーザによる音声指示であってもよい。この場合、端末200は、何れか既存の音声認識技術を利用して、当該音声指示を「物品Xを位置Aから位置Bに移動する」操作指示であると認識してもよい。なお、ステップS302は省略されてもよい。物品に対する操作指示が与えられない場合であっても、端末200は、新たに取得(購入)された物品の物品情報をサーバ100から取得してもよい。 In step S302, the terminal 200 receives operation instructions for the article from the user. Specifically, the operation instruction may be for the terminal 200 to grasp and move the article. For example, the operation instruction may be a voice instruction by the user such as "Please move article X located at position A to position B." In this case, the terminal 200 may use any existing voice recognition technology to recognize the voice instruction as an operation instruction to "move article X from position A to position B." Note that step S302 may be omitted. Even if no operation instructions are given for the article, the terminal 200 may acquire article information about a newly acquired (purchased) article from the server 100.

ステップS303において、端末200は、操作対象の物品の物品識別情報をサーバ100に送信する。例えば、端末200は、操作対象の物品をカメラ等で撮像し、当該物品に対応する画像から物品識別情報を特定する。そして、端末200は、特定した物品識別情報を含む物品情報取得要求をサーバ100に送信する。また、端末200は、端末種別及び/又は所望の物品情報種別(例えば、形状情報、重量、物品種別、留意事項、ニューラルネットワークモデルの更新情報など)を物品情報取得要求に含めてもよい。なお、端末200は、ユーザのスマートフォンなどの他の通信装置を介して、サーバ100と通信をしてもよい。 In step S303, the terminal 200 transmits the article identification information of the operation target article to the server 100. For example, the terminal 200 images the object to be operated using a camera or the like, and identifies the object identification information from the image corresponding to the object. Then, the terminal 200 transmits an article information acquisition request including the specified article identification information to the server 100. Further, the terminal 200 may include the terminal type and/or the desired article information type (for example, shape information, weight, article type, notes, neural network model update information, etc.) in the article information acquisition request. Note that the terminal 200 may communicate with the server 100 via another communication device such as a user's smartphone.

なお、端末200が当該物品の物品情報を既に取得している場合、端末200は、ステップS303を省略してもよい。 Note that if the terminal 200 has already acquired the article information of the article, the terminal 200 may omit step S303.

ステップS304において、端末200は、サーバ100から物品情報を受信する。端末200は、受信した物品情報を、物品識別情報と関連付けて保持してもよい。 In step S304, the terminal 200 receives article information from the server 100. The terminal 200 may hold the received article information in association with article identification information.

ステップS305において、端末200は、物品情報に従って物品に対する操作を制御する。例えば、操作指示が物品の把持であって、物品情報が物品の形状情報である場合、端末200は、形状情報に基づきアーム等を利用して物品を把持する。また、操作指示が物品の移動であって、物品情報がニューラルネットワークモデルの更新情報である場合、端末200は、取得した更新情報に従ってニューラルネットワークモデルを更新し、更新したニューラルネットワークモデルに物品の画像を入力し、出力値に従って当該物品を操作する。 In step S305, the terminal 200 controls operations on the article according to the article information. For example, if the operation instruction is to grip an article and the article information is shape information of the article, the terminal 200 grips the article using an arm or the like based on the shape information. Further, when the operation instruction is to move an article and the article information is update information of a neural network model, the terminal 200 updates the neural network model according to the acquired update information, and uses the updated neural network model to create an image of the article. input, and operate the item according to the output value.

なお、本開示は、上述した実施例に限定されるものでない。一実施例では、サーバ100と端末200とは、機械学習モデルの情報を共有してもよい。具体的には、サーバ100は、グローバルな機械学習モデルを保持し、これを端末200に送信してもよい。また、製造時、販売時等の初期段階において、グローバルな機械学習モデルを予め端末200に保有させてもよい。あるいは、サーバ100は、機械学習モデルを送信せず、端末200によって保持される機械学習モデルを取得してもよい。 Note that the present disclosure is not limited to the embodiments described above. In one embodiment, the server 100 and the terminal 200 may share machine learning model information. Specifically, the server 100 may hold a global machine learning model and transmit it to the terminal 200. Further, a global machine learning model may be stored in the terminal 200 in advance at an initial stage such as at the time of manufacture or sale. Alternatively, the server 100 may acquire the machine learning model held by the terminal 200 without transmitting the machine learning model.

また、一実施例では、端末200は、操作対象の物品の識別情報をサーバ100に送信する際、当該情報を暗号化してもよい。また、サーバ100は、物品を操作するための機械学習モデルの全体でなく更新情報を生成又は選択してもよい。例えば、サーバ100は、端末200の操作対象となる物品について機械学習モデルを予め学習し、当該機械学習モデルの更新情報を生成してもよい。更新情報は、グローバルな機械学習モデルを端末200の操作対象となる物品向けに更新するために必要な情報であってもよい。また、更新情報は、例えば、ニューラルネットワークモデルの一部のパラメータ、勾配情報又は当該物品(又はその3Dモデル)に特化した情報であってもよい。また、サーバ100は、端末200の操作対象となる物品向けの更新情報を新たに生成してもよい。 Further, in one embodiment, when the terminal 200 transmits the identification information of the object to be operated to the server 100, the terminal 200 may encrypt the information. Further, the server 100 may generate or select update information instead of the entire machine learning model for manipulating the article. For example, the server 100 may learn a machine learning model in advance for the article to be operated by the terminal 200, and generate update information for the machine learning model. The update information may be information necessary to update the global machine learning model for the article to be operated by the terminal 200. Further, the update information may be, for example, some parameters of a neural network model, gradient information, or information specific to the article (or its 3D model). Further, the server 100 may newly generate update information for an article that is an operation target of the terminal 200.

また、一実施例では、サーバ100は、端末200から機械学習モデルを受信した場合、この機械学習モデルを端末200の操作対象となる物品向けに更新するために必要な情報を更新情報として端末200に送信してもよい。 Further, in one embodiment, when the server 100 receives a machine learning model from the terminal 200, the server 100 sends the terminal 200 to the terminal 200 as update information necessary for updating the machine learning model for the article to be operated by the terminal 200. You may also send it to

また、一実施例では、サーバ100は、機械学習モデルの更新情報を端末200に送信してもよい。端末200は、受信した更新情報を利用して機械学習モデルを更新し、物品を操作してもよい。端末200は、受信した更新情報を利用してグローバルな機械学習モデルを更新してもよい。端末200は、更新情報に含まれる勾配情報を用いて、ニューラルネットワークモデルの重みを更新してもよい。また、端末200は、更新情報に含まれるパラメータをニューラルネットワークモデルの一部のパラメータとして利用することでモデルを更新してもよい。なお、ニューラルネットワークモデルは機械学習モデルの一例であり、その他の種類のモデルを用いてもよい。 Further, in one embodiment, the server 100 may transmit update information of the machine learning model to the terminal 200. The terminal 200 may update the machine learning model using the received update information and operate the article. The terminal 200 may update the global machine learning model using the received update information. The terminal 200 may update the weights of the neural network model using the gradient information included in the update information. Furthermore, the terminal 200 may update the model by using parameters included in the update information as some parameters of the neural network model. Note that the neural network model is an example of a machine learning model, and other types of models may be used.

上述した実施例によると、サーバ100は、機械学習モデル全体を送信する必要がなく、操作対象の物品に特化した更新情報を豊富な計算リソースを利用して生成可能である。また、サーバ100は、各種端末200に共通の汎用モデルでなく、端末200に特化した機械学習モデルを構築可能であり、物品の操作性能を向上させることができる。 According to the embodiment described above, the server 100 does not need to transmit the entire machine learning model, and can generate update information specific to the object to be operated using abundant computational resources. Further, the server 100 can construct a machine learning model specific to the terminal 200 instead of a general-purpose model common to various terminals 200, and can improve the operation performance of the article.

なお、サーバ100から端末200に送信する物品情報には、上述した実施例に記載した全ての物品情報を含めてもよいし、一部の物品情報の組み合わせを含めてもよい。また、端末200は、受信した物品情報の一部を利用して物品に関するタスクを実行してもよい。
[ハードウェア構成]
前述した実施形態における各装置(サーバ100又は端末200)の一部又は全部は、ハードウェアで構成されていてもよいし、CPU(Central Processing Unit)、又はGPU(Graphics Processing Unit)等が実行するソフトウェア(プログラム)の情報処理で構成されてもよい。ソフトウェアの情報処理で構成される場合には、前述した実施形態における各装置の少なくとも一部の機能を実現するソフトウェアを、フレキシブルディスク、CD-ROM(Compact Disc-Read Only Memory)、又はUSB(Universal Serial Bus)メモリ等の非一時的な記憶媒体(非一時的なコンピュータ可読媒体)に収納し、コンピュータに読み込ませることにより、ソフトウェアの情報処理を実行してもよい。また、通信ネットワークを介して当該ソフトウェアがダウンロードされてもよい。さらに、ソフトウェアがASIC(Application Specific Integrated Circuit)、又はFPGA(Field Programmable Gate Array)等の回路に実装されることにより、情報処理がハードウェアにより実行されてもよい。
Note that the article information transmitted from the server 100 to the terminal 200 may include all of the article information described in the above embodiment, or may include a combination of some article information. Further, the terminal 200 may perform a task related to the article using part of the received article information.
[Hardware configuration]
Part or all of each device (server 100 or terminal 200) in the embodiments described above may be configured with hardware, or may be executed by a CPU (Central Processing Unit), a GPU (Graphics Processing Unit), or the like. It may be configured by information processing of software (program). In the case where the software is configured by software information processing, the software that realizes at least some of the functions of each device in the above-described embodiments may be stored on a flexible disk, CD-ROM (Compact Disc-Read Only Memory), or USB (Universal Software information processing may be executed by storing the information in a non-temporary storage medium (non-temporary computer-readable medium) such as Serial Bus (Serial Bus) memory and reading it into a computer. Further, the software may be downloaded via a communication network. Furthermore, information processing may be performed by hardware by implementing software in a circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

ソフトウェアを収納する記憶媒体の種類は限定されるものではない。記憶媒体は、磁気ディスク、又は光ディスク等の着脱可能なものに限定されず、ハードディスク、又はメモリ等の固定型の記憶媒体であってもよい。また、記憶媒体は、コンピュータ内部に備えられてもよいし、コンピュータ外部に備えられてもよい。 The type of storage medium that stores software is not limited. The storage medium is not limited to a removable one such as a magnetic disk or an optical disk, but may be a fixed storage medium such as a hard disk or memory. Further, the storage medium may be provided inside the computer or may be provided outside the computer.

図7は、前述した実施形態における各装置(サーバ100又は端末200)のハードウェア構成の一例を示すブロック図である。各装置は、一例として、プロセッサ71と、主記憶装置72(メモリ)と、補助記憶装置73(メモリ)と、ネットワークインタフェース74と、デバイスインタフェース75と、を備え、これらがバス76を介して接続されたコンピュータ7として実現されてもよい。 FIG. 7 is a block diagram showing an example of the hardware configuration of each device (server 100 or terminal 200) in the embodiment described above. Each device includes, for example, a processor 71, a main storage device 72 (memory), an auxiliary storage device 73 (memory), a network interface 74, and a device interface 75, which are connected via a bus 76. It may also be realized as a computer 7.

図7のコンピュータ7は、各構成要素を一つ備えているが、同じ構成要素を複数備えていてもよい。また、図7では、1台のコンピュータ7が示されているが、ソフトウェアが複数台のコンピュータにインストールされて、当該複数台のコンピュータそれぞれがソフトウェアの同一の又は異なる一部の処理を実行してもよい。この場合、コンピュータそれぞれがネットワークインタフェース74等を介して通信して処理を実行する分散コンピューティングの形態であってもよい。つまり、前述した実施形態における各装置(サーバ100又は端末200)は、1又は複数の記憶装置に記憶された命令を1台又は複数台のコンピュータが実行することで機能を実現するシステムとして構成されてもよい。また、端末から送信された情報をクラウド上に設けられた1台又は複数台のコンピュータで処理し、この処理結果を端末に送信するような構成であってもよい。 Although the computer 7 in FIG. 7 includes one of each component, it may include a plurality of the same components. Although one computer 7 is shown in FIG. 7, the software may be installed on multiple computers, and each of the multiple computers may execute the same or different part of the software. Good too. In this case, it may be a form of distributed computing in which each computer communicates via the network interface 74 or the like to execute processing. In other words, each device (server 100 or terminal 200) in the embodiment described above is configured as a system that realizes functions by one or more computers executing instructions stored in one or more storage devices. You can. Alternatively, the information transmitted from the terminal may be processed by one or more computers provided on the cloud, and the processing results may be sent to the terminal.

前述した実施形態における各装置(サーバ100又は端末200)の各種演算は、1又は複数のプロセッサを用いて、又は、ネットワークを介した複数台のコンピュータを用いて、並列処理で実行されてもよい。また、各種演算が、プロセッサ内に複数ある演算コアに振り分けられて、並列処理で実行されてもよい。また、本開示の処理、手段等の一部又は全部は、ネットワークを介してコンピュータ7と通信可能なクラウド上に設けられたプロセッサ及び記憶装置の少なくとも一方により実行されてもよい。このように、前述した実施形態における各装置は、1台又は複数台のコンピュータによる並列コンピューティングの形態であってもよい。 Various calculations of each device (server 100 or terminal 200) in the embodiments described above may be executed in parallel using one or more processors or using multiple computers via a network. . Further, various calculations may be distributed to a plurality of calculation cores within the processor and executed in parallel. Further, a part or all of the processing, means, etc. of the present disclosure may be executed by at least one of a processor and a storage device provided on a cloud that can communicate with the computer 7 via a network. In this way, each device in the embodiments described above may be in the form of parallel computing using one or more computers.

プロセッサ71は、コンピュータの制御装置及び演算装置を含む電子回路(処理回路、Processing circuit、Processing circuitry、CPU、GPU、FPGA、又はASIC等)であってもよい。また、プロセッサ71は、専用の処理回路を含む半導体装置等であってもよい。プロセッサ71は、電子論理素子を用いた電子回路に限定されるものではなく、光論理素子を用いた光回路により実現されてもよい。また、プロセッサ71は、量子コンピューティングに基づく演算機能を含むものであってもよい。 The processor 71 may be an electronic circuit (processing circuit, processing circuitry, CPU, GPU, FPGA, ASIC, etc.) including a computer control device and an arithmetic device. Further, the processor 71 may be a semiconductor device or the like including a dedicated processing circuit. The processor 71 is not limited to an electronic circuit using an electronic logic element, but may be realized by an optical circuit using an optical logic element. Further, the processor 71 may include an arithmetic function based on quantum computing.

プロセッサ71は、コンピュータ7の内部構成の各装置等から入力されたデータやソフトウェア(プログラム)に基づいて演算処理を行い、演算結果や制御信号を各装置等に出力することができる。プロセッサ71は、コンピュータ7のOS(Operating System)や、アプリケーション等を実行することにより、コンピュータ7を構成する各構成要素を制御してもよい。 The processor 71 can perform arithmetic processing based on data and software (programs) input from each device in the internal structure of the computer 7, and can output calculation results and control signals to each device. The processor 71 may control each component constituting the computer 7 by executing the OS (Operating System) of the computer 7, applications, and the like.

前述した実施形態における各装置(サーバ100又は端末200)は、1又は複数のプロセッサ71により実現されてもよい。ここで、プロセッサ71は、1チップ上に配置された1又は複数の電子回路を指してもよいし、2つ以上のチップあるいは2つ以上のデバイス上に配置された1又は複数の電子回路を指してもよい。複数の電子回路を用いる場合、各電子回路は有線又は無線により通信してもよい。 Each device (server 100 or terminal 200) in the embodiment described above may be realized by one or more processors 71. Here, the processor 71 may refer to one or more electronic circuits arranged on one chip, or one or more electronic circuits arranged on two or more chips or two or more devices. You can also point. When using multiple electronic circuits, each electronic circuit may communicate by wire or wirelessly.

主記憶装置72は、プロセッサ71が実行する命令及び各種データ等を記憶する記憶装置であり、主記憶装置72に記憶された情報がプロセッサ71により読み出される。補助記憶装置73は、主記憶装置72以外の記憶装置である。なお、これらの記憶装置は、電子情報を格納可能な任意の電子部品を意味するものとし、半導体のメモリでもよい。半導体のメモリは、揮発性メモリ、不揮発性メモリのいずれでもよい。前述した実施形態における各装置(サーバ100又は端末200)において各種データを保存するための記憶装置は、主記憶装置72又は補助記憶装置73により実現されてもよく、プロセッサ71に内蔵される内蔵メモリにより実現されてもよい。例えば、前述した実施形態における記憶部72は、主記憶装置72又は補助記憶装置73により実現されてもよい。 The main storage device 72 is a storage device that stores instructions and various data to be executed by the processor 71, and the information stored in the main storage device 72 is read out by the processor 71. The auxiliary storage device 73 is a storage device other than the main storage device 72. Note that these storage devices are any electronic components capable of storing electronic information, and may be semiconductor memories. Semiconductor memory may be either volatile memory or nonvolatile memory. The storage device for storing various data in each device (server 100 or terminal 200) in the embodiments described above may be realized by the main storage device 72 or the auxiliary storage device 73, and may be realized by the built-in memory built into the processor 71. It may be realized by For example, the storage unit 72 in the embodiment described above may be realized by the main storage device 72 or the auxiliary storage device 73.

記憶装置(メモリ)1つに対して、複数のプロセッサが接続(結合)されてもよいし、単数のプロセッサが接続されてもよい。プロセッサ1つに対して、複数の記憶装置(メモリ)が接続(結合)されてもよい。前述した実施形態における各装置(サーバ100又は端末200)が、少なくとも1つの記憶装置(メモリ)とこの少なくとも1つの記憶装置(メモリ)に接続(結合)される複数のプロセッサで構成される場合、複数のプロセッサのうち少なくとも1つのプロセッサが、少なくとも1つの記憶装置(メモリ)に接続(結合)される構成を含んでもよい。また、複数台のコンピュータに含まれる記憶装置(メモリ))とプロセッサによって、この構成が実現されてもよい。さらに、記憶装置(メモリ)がプロセッサと一体になっている構成(例えば、L1キャッシュ、L2キャッシュを含むキャッシュメモリ)を含んでもよい。 A plurality of processors may be connected (combined) to one storage device (memory), or a single processor may be connected to one storage device (memory). A plurality of storage devices (memories) may be connected (combined) to one processor. In the case where each device (server 100 or terminal 200) in the embodiment described above is composed of at least one storage device (memory) and a plurality of processors connected (coupled) to this at least one storage device (memory), The present invention may include a configuration in which at least one processor among the plurality of processors is connected (coupled) to at least one storage device (memory). Further, this configuration may be realized by a storage device (memory) and a processor included in a plurality of computers. Furthermore, a configuration in which a storage device (memory) is integrated with a processor (for example, a cache memory including an L1 cache and an L2 cache) may be included.

ネットワークインタフェース74は、無線又は有線により、通信ネットワーク8に接続するためのインタフェースである。ネットワークインタフェース74は、既存の通信規格に適合したもの等、適切なインタフェースを用いればよい。ネットワークインタフェース74により、通信ネットワーク8を介して接続された外部装置9Aと情報のやり取りが行われてもよい。なお、通信ネットワーク8は、WAN(Wide Area Network)、LAN(Local Area Network)、PAN(Personal Area Network)等の何れか、又は、それらの組み合わせであってよく、コンピュータ7と外部装置9Aとの間で情報のやり取りが行われるものであればよい。WANの一例としてインターネット等があり、LANの一例としてIEEE802.11やイーサネット(登録商標)等があり、PANの一例としてBluetooth(登録商標)やNFC(Near Field Communication)等がある。 The network interface 74 is an interface for connecting to the communication network 8 wirelessly or by wire. As the network interface 74, an appropriate interface such as one that complies with existing communication standards may be used. Information may be exchanged with an external device 9A connected via the communication network 8 through the network interface 74. Note that the communication network 8 may be any one of a WAN (Wide Area Network), a LAN (Local Area Network), a PAN (Personal Area Network), etc., or a combination thereof, and can be used to connect the computer 7 and the external device 9A. It is sufficient that information is exchanged between them. Examples of WAN include the Internet, examples of LAN include IEEE802.11 and Ethernet (registered trademark), and examples of PAN include Bluetooth (registered trademark) and NFC (Near Field Communication).

デバイスインタフェース75は、外部装置9Bと直接接続するUSB等のインタフェースである。 The device interface 75 is an interface such as a USB that is directly connected to the external device 9B.

外部装置9Aはコンピュータ7とネットワークを介して接続されている装置である。外部装置9Bはコンピュータ7と直接接続されている装置である。 The external device 9A is a device connected to the computer 7 via a network. The external device 9B is a device directly connected to the computer 7.

外部装置9A又は外部装置9Bは、一例として、入力装置であってもよい。入力装置は、例えば、カメラ、マイクロフォン、モーションキャプチャ、各種センサ、キーボード、マウス、又はタッチパネル等のデバイスであり、取得した情報をコンピュータ7に与える。また、パーソナルコンピュータ、タブレット端末、又はスマートフォン等の入力部とメモリとプロセッサを備えるデバイスであってもよい。 The external device 9A or the external device 9B may be an input device, for example. The input device is, for example, a device such as a camera, microphone, motion capture, various sensors, keyboard, mouse, or touch panel, and provides the acquired information to the computer 7. Alternatively, the device may be a device including an input section, a memory, and a processor, such as a personal computer, a tablet terminal, or a smartphone.

また、外部装置9A又は外部装置9Bは、一例として、出力装置でもよい。出力装置は、例えば、LCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)、PDP(Plasma Display Panel)、又は有機EL(Electro Luminescence)パネル等の表示装置であってもよいし、音声等を出力するスピーカ等であってもよい。また、パーソナルコンピュータ、タブレット端末、又はスマートフォン等の出力部とメモリとプロセッサを備えるデバイスであってもよい。 Further, the external device 9A or the external device 9B may be an output device, for example. The output device may be a display device such as an LCD (Liquid Crystal Display), a CRT (Cathode Ray Tube), a PDP (Plasma Display Panel), or an organic EL (Electro Luminescence) panel, or output audio or the like. It may also be a speaker or the like. Alternatively, the device may be a device including an output unit, a memory, and a processor, such as a personal computer, a tablet terminal, or a smartphone.

また、外部装置9Aまた外部装置9Bは、記憶装置(メモリ)であってもよい。例えば、外部装置9Aはネットワークストレージ等であってもよく、外部装置9BはHDD等のストレージであってもよい。 Further, the external device 9A or the external device 9B may be a storage device (memory). For example, the external device 9A may be a network storage or the like, and the external device 9B may be a storage such as an HDD.

また、外部装置9A又は外部装置9Bは、前述した実施形態における各装置(サーバ100又は端末200)の構成要素の一部の機能を有する装置でもよい。つまり、コンピュータ7は、外部装置9A又は外部装置9Bの処理結果の一部又は全部を送信又は受信してもよい。 Further, the external device 9A or the external device 9B may be a device having some functions of the components of each device (server 100 or terminal 200) in the embodiments described above. That is, the computer 7 may transmit or receive part or all of the processing results of the external device 9A or the external device 9B.

本明細書(請求項を含む)において、「a、b及びcの少なくとも1つ(一方)」又は「a、b又はcの少なくとも1つ(一方)」の表現(同様な表現を含む)が用いられる場合は、a、b、c、a-b、a-c、b-c、又はa-b-cのいずれかを含む。また、a-a、a-b-b、a-a-b-b-c-c等のように、いずれかの要素について複数のインスタンスを含んでもよい。さらに、a-b-c-dのようにdを有する等、列挙された要素(a、b及びc)以外の他の要素を加えることも含む。 In this specification (including claims), the expression "at least one (one) of a, b, and c" or "at least one (one) of a, b, or c" (including similar expressions) When used, it includes any of a, b, c, a-b, a-c, b-c, or a-b-c. Further, each element may include multiple instances, such as a-a, a-b-b, a-a-b-b-c-c, etc. Furthermore, it also includes adding other elements other than the listed elements (a, b and c), such as having d as in a-b-c-d.

本明細書(請求項を含む)において、「データを入力として/データに基づいて/に従って/に応じて」等の表現(同様な表現を含む)が用いられる場合は、特に断りがない場合、各種データそのものを入力として用いる場合や、各種データに何らかの処理を行ったもの(例えば、ノイズ加算したもの、正規化したもの、各種データの中間表現等)を入力として用いる場合を含む。また「データに基づいて/に従って/に応じて」何らかの結果が得られる旨が記載されている場合、当該データのみに基づいて当該結果が得られる場合を含むとともに、当該データ以外の他のデータ、要因、条件、及び/又は状態等にも影響を受けて当該結果が得られる場合をも含み得る。また、「データを出力する」旨が記載されている場合、特に断りがない場合、各種データそのものを出力として用いる場合や、各種データに何らかの処理を行ったもの(例えば、ノイズ加算したもの、正規化したもの、各種データの中間表現等)を出力とする場合も含む。 In this specification (including claims), when expressions such as "using data as input/based on data/in accordance with/according to" (including similar expressions) are used, unless otherwise specified, This includes cases where various data itself is used as input, and cases where various data subjected to some processing (for example, noise added, normalized, intermediate representation of various data, etc.) are used as input. In addition, if it is stated that a certain result is obtained "based on/according to/according to data", this includes cases where the result is obtained only based on the data, and other data other than the data, It may also include cases where the results are obtained under the influence of factors, conditions, and/or states. In addition, if it is stated that "data will be output", if there is no special notice, various data itself may be used as output, or data that has been processed in some way (for example, data with added noise, normal This also includes cases in which the output is digitized data, intermediate representations of various data, etc.).

本明細書(請求項を含む)において、「接続される(connected)」及び「結合される(coupled)」との用語が用いられる場合は、直接的な接続/結合、間接的な接続/結合、電気的(electrically)な接続/結合、通信的(communicatively)な接続/結合、機能的(operatively)な接続/結合、物理的(physically)な接続/結合等のいずれをも含む非限定的な用語として意図される。当該用語は、当該用語が用いられた文脈に応じて適宜解釈されるべきであるが、意図的に或いは当然に排除されるのではない接続/結合形態は、当該用語に含まれるものして非限定的に解釈されるべきである。 In this specification (including the claims), when the terms "connected" and "coupled" are used, the terms "connected" and "coupled" refer to direct connection/coupling and indirect connection/coupling. , electrically connected/coupled, communicatively connected/coupled, functionally connected/coupled, physically connected/coupled, etc., without limitation. intended as a term. The term should be interpreted as appropriate depending on the context in which the term is used, but forms of connection/coupling that are not intentionally or naturally excluded are not included in the term. Should be construed in a limited manner.

本明細書(請求項を含む)において、「AがBするよう構成される(A configured to B)」との表現が用いられる場合は、要素Aの物理的構造が、動作Bを実行可能な構成を有するとともに、要素Aの恒常的(permanent)又は一時的(temporary)な設定(setting/configuration)が、動作Bを実際に実行するように設定(configured/set)されていることを含んでよい。例えば、要素Aが汎用プロセッサである場合、当該プロセッサが動作Bを実行可能なハードウェア構成を有するとともに、恒常的(permanent)又は一時的(temporary)なプログラム(命令)の設定により、動作Bを実際に実行するように設定(configured)されていればよい。また、要素Aが専用プロセッサ又は専用演算回路等である場合、制御用命令及びデータが実際に付属しているか否かとは無関係に、当該プロセッサの回路的構造が動作Bを実際に実行するように構築(implemented)されていればよい。 In this specification (including the claims), when the expression "A configured to B" is used, it means that the physical structure of element A is capable of performing operation B. configuration, and includes a permanent or temporary setting/configuration of element A being configured/set to actually perform operation B. good. For example, if element A is a general-purpose processor, the processor has a hardware configuration that can execute operation B, and can perform operation B by setting a permanent or temporary program (instruction). It only needs to be configured to actually execute. In addition, if element A is a dedicated processor or a dedicated arithmetic circuit, the circuit structure of the processor is configured to actually execute operation B, regardless of whether control instructions and data are actually attached. It is sufficient if it has been implemented.

本明細書(請求項を含む)において、含有又は所有を意味する用語(例えば、「含む(comprising/including)」及び有する「(having)等)」が用いられる場合は、当該用語の目的語により示される対象物以外の物を含有又は所有する場合を含む、open-endedな用語として意図される。これらの含有又は所有を意味する用語の目的語が数量を指定しない又は単数を示唆する表現(a又はanを冠詞とする表現)である場合は、当該表現は特定の数に限定されないものとして解釈されるべきである。 In this specification (including the claims), when terms meaning inclusion or possession (for example, "comprising/including" and "having", etc.) are used, the object of the term It is intended as an open-ended term, including the case of containing or possessing something other than the object indicated. If the object of a term meaning inclusion or possession is an expression that does not specify a quantity or suggests a singular number (an expression with a or an as an article), the expression shall be interpreted as not being limited to a specific number. It should be.

本明細書(請求項を含む)において、ある箇所において「1つ又は複数(one or more)」又は「少なくとも1つ(at least one)」等の表現が用いられ、他の箇所において数量を指定しない又は単数を示唆する表現(a又はanを冠詞とする表現)が用いられているとしても、後者の表現が「1つ」を意味することを意図しない。一般に、数量を指定しない又は単数を示唆する表現(a又はanを冠詞とする表現)は、必ずしも特定の数に限定されないものとして解釈されるべきである。 In this specification (including the claims), expressions such as "one or more" or "at least one" are used in some places, and quantities are specified in other places. Even if an expression is used that suggests no or singular (an expression with the article a or an), it is not intended that the latter expression means "one". In general, expressions that do not specify a quantity or imply a singular number (expressions with the article a or an) should be construed as not necessarily being limited to a particular number.

本明細書において、ある実施例の有する特定の構成について特定の効果(advantage/result)が得られる旨が記載されている場合、別段の理由がない限り、当該構成を有する他の1つ又は複数の実施例についても当該効果が得られると理解されるべきである。但し当該効果の有無は、一般に種々の要因、条件、及び/又は状態等に依存し、当該構成により必ず当該効果が得られるものではないと理解されるべきである。当該効果は、種々の要因、条件、及び/又は状態等が満たされたときに実施例に記載の当該構成により得られるものに過ぎず、当該構成又は類似の構成を規定したクレームに係る発明において、当該効果が必ずしも得られるものではない。 In this specification, if it is stated that a specific effect (advantage/result) can be obtained with respect to a specific configuration of a certain embodiment, unless there is a reason to the contrary, one or more other components having the configuration may be used. It should be understood that the same effect can also be obtained with the embodiment. However, it should be understood that the presence or absence of the said effect generally depends on various factors, conditions, and/or states, and that the said effect is not necessarily obtained by the said configuration. The effect is only obtained by the configuration described in the Examples when various factors, conditions, and/or states, etc. are satisfied, and in the claimed invention that specifies the configuration or a similar configuration. However, this effect is not necessarily obtained.

本明細書(請求項を含む)において、「最大化(maximize)」等の用語が用いられる場合は、グローバルな最大値を求めること、グローバルな最大値の近似値を求めること、ローカルな最大値を求めること、及びローカルな最大値の近似値を求めることを含み、当該用語が用いられた文脈に応じて適宜解釈されるべきである。また、これら最大値の近似値を確率的又はヒューリスティックに求めることを含む。同様に、「最小化(minimize)」等の用語が用いられる場合は、グローバルな最小値を求めること、グローバルな最小値の近似値を求めること、ローカルな最小値を求めること、及びローカルな最小値の近似値を求めることを含み、当該用語が用いられた文脈に応じて適宜解釈されるべきである。また、これら最小値の近似値を確率的又はヒューリスティックに求めることを含む。同様に、「最適化(optimize)」等の用語が用いられる場合は、グローバルな最適値を求めること、グローバルな最適値の近似値を求めること、ローカルな最適値を求めること、及びローカルな最適値の近似値を求めることを含み、当該用語が用いられた文脈に応じて適宜解釈されるべきである。また、これら最適値の近似値を確率的又はヒューリスティックに求めることを含む。 In this specification (including the claims), when terms such as "maximize" are used, it refers to finding a global maximum value, finding an approximate value of a global maximum value, or finding a local maximum value. and approximating the local maximum value, and should be interpreted as appropriate depending on the context in which the term is used. It also includes finding approximate values of these maximum values probabilistically or heuristically. Similarly, terms such as "minimize" are used to refer to finding a global minimum, finding an approximation to a global minimum, finding a local minimum, and finding a local minimum. It includes approximations of values and should be interpreted as appropriate depending on the context in which the term is used. It also includes finding approximate values of these minimum values probabilistically or heuristically. Similarly, terms such as "optimize" are used to refer to finding a global optimum, finding an approximation to a global optimum, finding a local optimum, and determining a local optimum. It includes approximations of values and should be interpreted as appropriate depending on the context in which the term is used. It also includes finding approximate values of these optimal values probabilistically or heuristically.

本明細書(請求項を含む)において、複数のハードウェアが所定の処理を行う場合、各ハードウェアが協働して所定の処理を行ってもよいし、一部のハードウェアが所定の処理の全てを行ってもよい。また、一部のハードウェアが所定の処理の一部を行い、別のハードウェアが所定の処理の残りを行ってもよい。本明細書(請求項を含む)において、「1又は複数のハードウェアが第1の処理を行い、前記1又は複数のハードウェアが第2の処理を行う」等の表現が用いられている場合、第1の処理を行うハードウェアと第2の処理を行うハードウェアは同じものであってもよいし、異なるものであってもよい。つまり、第1の処理を行うハードウェア及び第2の処理を行うハードウェアが、前記1又は複数のハードウェアに含まれていればよい。なお、ハードウェアは、電子回路、又は電子回路を含む装置等を含んでよい。 In this specification (including claims), when multiple pieces of hardware perform a predetermined process, each piece of hardware may cooperate to perform the predetermined process, or some of the hardware may perform the predetermined process. You may do all of the above. Further, some hardware may perform part of a predetermined process, and another piece of hardware may perform the rest of the predetermined process. In this specification (including claims), when expressions such as "one or more hardware performs the first process, and the one or more hardware performs the second process" are used , the hardware that performs the first processing and the hardware that performs the second processing may be the same or different. In other words, the hardware that performs the first processing and the hardware that performs the second processing may be included in the one or more pieces of hardware. Note that the hardware may include an electronic circuit, a device including an electronic circuit, or the like.

本明細書(請求項を含む)において、複数の記憶装置(メモリ)がデータの記憶を行う場合、複数の記憶装置(メモリ)のうち個々の記憶装置(メモリ)は、データの一部のみを記憶してもよいし、データの全体を記憶してもよい。 In this specification (including claims), when multiple storage devices (memories) store data, each storage device (memory) among the multiple storage devices (memories) stores only part of the data. It may be stored, or the entire data may be stored.

以上、本開示の実施形態について詳述したが、本開示は上記した個々の実施形態に限定されるものではない。特許請求の範囲に規定された内容及びその均等物から導き出される本発明の概念的な思想と趣旨を逸脱しない範囲において種々の追加、変更、置き換え及び部分的削除等が可能である。例えば、前述した全ての実施形態において、数値又は数式を説明に用いている場合は、一例として示したものであり、これらに限られるものではない。また、実施形態における各動作の順序は、一例として示したものであり、これらに限られるものではない。 Although the embodiments of the present disclosure have been described in detail above, the present disclosure is not limited to the individual embodiments described above. Various additions, changes, substitutions, and partial deletions are possible without departing from the conceptual idea and spirit of the present invention derived from the content defined in the claims and equivalents thereof. For example, in all the embodiments described above, when numerical values or formulas are used in the explanation, they are shown as examples, and the invention is not limited to these. Further, the order of each operation in the embodiment is shown as an example, and the order is not limited to this.

10 物品操作システム
50 物品プロバイダ
100 サーバ
110 物品情報受付部
120 物品識別情報割当部
130 物品情報格納部
200 端末
210 ユーザインタフェース部
220 情報格納部
230 制御部
10 Article operation system 50 Article provider 100 Server 110 Article information reception unit 120 Article identification information allocation unit 130 Article information storage unit 200 Terminal 210 User interface unit 220 Information storage unit 230 Control unit

Claims (11)

少なくとも1つのメモリと、
少なくとも1つのプロセッサと、を備え、
前記少なくとも1つのプロセッサは、
物品の識別情報をサーバに送信することと、
前記サーバから前記物品に関する物品情報を受信することと、
前記物品情報に基づいて、前記物品に関するタスクを実行することと、
を実行可能に構成され、
前記物品に関するタスクは、少なくとも前記物品の操作又は前記物品に関する情報の推論の何れかである、
端末。
at least one memory;
at least one processor;
The at least one processor includes:
Sending the identification information of the item to the server;
receiving article information regarding the article from the server;
performing a task related to the article based on the article information;
configured to be executable,
The task regarding the article is at least one of manipulating the article or inferring information regarding the article;
terminal.
前記物品情報は、少なくとも、前記物品の形状、前記物品の重量、前記物品の物品種別、前記物品を操作する際の留意事項、又は、前記物品の3Dモデルの何れかに関する情報を含む、請求項1記載の端末。 Claim: The article information includes at least information regarding any of the shape of the article, the weight of the article, the type of the article, considerations when operating the article, or a 3D model of the article. The terminal described in 1. 前記物品情報は、前記物品の3Dモデルを含み、
前記タスクは、少なくとも前記3Dモデルを用いた前記物品の把持又は前記3Dモデルを用いた前記物品の認識の何れかである、
請求項1又は2記載の端末。
The article information includes a 3D model of the article,
The task is at least one of grasping the article using the 3D model or recognizing the article using the 3D model.
The terminal according to claim 1 or 2.
前記物品情報は、前記物品に関するタスクを実行するための機械学習モデルの更新情報を含む、請求項1乃至3何れか一項記載の端末。 4. The terminal according to claim 1, wherein the article information includes update information of a machine learning model for executing a task related to the article. 前記少なくとも1つのプロセッサは更に、前記サーバから前記機械学習モデルを受信すること、を実行可能に構成され、
前記更新情報は、受信した前記機械学習モデルの更新情報である、
請求項4に記載の端末。
The at least one processor is further configured to receive the machine learning model from the server;
The update information is update information of the received machine learning model,
The terminal according to claim 4.
前記少なくとも1つのプロセッサは更に、更新前の前記機械学習モデルを前記サーバに送信すること、を実行可能に構成され、
前記更新情報は、送信した前記機械学習モデルの更新情報である、
請求項4に記載の端末。
The at least one processor is further configured to transmit the machine learning model before updating to the server,
The update information is update information of the transmitted machine learning model,
The terminal according to claim 4.
前記更新情報は、少なくとも、前記機械学習モデルのパラメータ、又は、前記機械学習モデルの勾配情報の何れかを含む、請求項4乃至6何れか一項記載の端末。 7. The terminal according to claim 4, wherein the update information includes at least one of parameters of the machine learning model or gradient information of the machine learning model. 前記少なくとも1つのプロセッサは更に、
前記端末の種別情報を前記サーバに送信することと、
前記識別情報と前記種別情報とに対応する前記物品情報を前記サーバから受信することと、
を実行可能に構成される、
請求項1乃至7何れか一項記載の端末。
The at least one processor further comprises:
transmitting type information of the terminal to the server;
receiving the article information corresponding to the identification information and the type information from the server;
configured to be executable,
8. A terminal according to any one of claims 1 to 7.
少なくとも1つのメモリと、
少なくとも1つのプロセッサと、を備え、
前記少なくとも1つのプロセッサは、
物品の識別情報を端末から受信することと、
前記物品に関する物品情報を前記端末に送信することと、
を実行可能に構成され、
前記物品情報は、前記端末が、少なくとも前記物品の操作又は前記物品に関する情報の推論の何れかを実行する際に必要な情報である、
サーバ。
at least one memory;
at least one processor;
The at least one processor includes:
receiving identification information of the article from the terminal;
transmitting article information regarding the article to the terminal;
configured to be executable,
The item information is information necessary for the terminal to operate at least the item or infer information regarding the item;
server.
少なくとも1つのプロセッサが、物品の識別情報をサーバに送信することと、
前記少なくとも1つのプロセッサが、前記サーバから前記物品に関する物品情報を受信することと、
前記少なくとも1つのプロセッサが、前記物品情報に基づき前記物品に関するタスクを実行することと、
を有し、
前記物品に関するタスクは、少なくとも前記物品の操作又は前記物品に関する情報の推論の何れかである、
タスク実行方法。
at least one processor transmitting identification information of the item to the server;
the at least one processor receiving article information regarding the article from the server;
the at least one processor performing a task regarding the article based on the article information;
has
The task regarding the article is at least one of manipulating the article or inferring information regarding the article;
How to perform the task.
少なくとも1つのプロセッサが、物品の識別情報を端末から受信することと、
前記少なくとも1つのプロセッサが、前記物品に関する物品情報を前記端末に送信することと、
を有し、
前記物品情報は、前記端末が、少なくとも前記物品の操作又は前記物品に関する情報の推論の何れかを実行する際に必要な情報である、
情報提供方法。
at least one processor receiving identification information of the item from the terminal;
the at least one processor transmitting article information regarding the article to the terminal;
has
The item information is information necessary for the terminal to operate at least the item or infer information regarding the item;
Information provision method.
JP2020136887A 2020-08-14 2020-08-14 Terminal, server, method for executing task, and method for providing information Pending JP2023169440A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020136887A JP2023169440A (en) 2020-08-14 2020-08-14 Terminal, server, method for executing task, and method for providing information
PCT/JP2021/028931 WO2022034841A1 (en) 2020-08-14 2021-08-04 Terminal, server, task execution method, and information provision method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020136887A JP2023169440A (en) 2020-08-14 2020-08-14 Terminal, server, method for executing task, and method for providing information

Publications (1)

Publication Number Publication Date
JP2023169440A true JP2023169440A (en) 2023-11-30

Family

ID=80247867

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020136887A Pending JP2023169440A (en) 2020-08-14 2020-08-14 Terminal, server, method for executing task, and method for providing information

Country Status (2)

Country Link
JP (1) JP2023169440A (en)
WO (1) WO2022034841A1 (en)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013126048A1 (en) * 2012-02-21 2013-08-29 Amazon Technologies, Inc. System and method for automatic picking of products in a materials handling facility
JP6707485B2 (en) * 2017-03-22 2020-06-10 株式会社東芝 Object handling device and calibration method thereof

Also Published As

Publication number Publication date
WO2022034841A1 (en) 2022-02-17

Similar Documents

Publication Publication Date Title
JP7096925B2 (en) Deep machine learning system for rectangular parallelepiped detection
US10134293B2 (en) Systems and methods for autonomous drone navigation
CN104169974A (en) Visibility-based state updates in graphical processing units
WO2019036931A1 (en) Method, device, and system for placing goods, electronic device and readable storage medium
CN104936665A (en) Collaborative augmented reality
KR20220068971A (en) Robotic system for processing packages arriving out of sequence
WO2019125613A1 (en) System for dynamic pallet-build
CN110168614B (en) Apparatus and method for generating dynamic virtual content in mixed reality
US10248981B1 (en) Platform and acquisition system for generating and maintaining digital product visuals
EP3368977A1 (en) Computing device having user-input accessory
CN110370268B (en) Method, device and system for in-box sorting
CN112774203A (en) Pose control method and device of virtual object and computer storage medium
CN110765525B (en) Method, device, electronic equipment and medium for generating scene picture
US11126405B1 (en) Utilizing augmented reality and artificial intelligence to automatically generate code for a robot
KR20200098068A (en) Method for recommending word and apparatus thereof
US9047244B1 (en) Multi-screen computing device applications
WO2022159942A1 (en) Enhancing three-dimensional models using multi-view refinement
JP2022100238A (en) Method and apparatus for calibrating multicamera system based on human pose
WO2022034841A1 (en) Terminal, server, task execution method, and information provision method
US11645778B2 (en) Apparatus and method for identifying and picking object using artificial intelligence algorithm
US11867495B2 (en) Electronic device for providing image data using augmented reality and control method for same
CN107844932A (en) Order processing method and apparatus
US20190378335A1 (en) Viewer position coordination in simulated reality
CN114399358A (en) Holographic commodity display method and system and electronic equipment
CN115063564A (en) Article label display method, device and medium for two-dimensional display image