JP7846830B2 - アテンションモデルを含むトランスフォーマを用いた点群データからの物体の検出のための方法 - Google Patents
アテンションモデルを含むトランスフォーマを用いた点群データからの物体の検出のための方法Info
- Publication number
- JP7846830B2 JP7846830B2 JP2025517959A JP2025517959A JP7846830B2 JP 7846830 B2 JP7846830 B2 JP 7846830B2 JP 2025517959 A JP2025517959 A JP 2025517959A JP 2025517959 A JP2025517959 A JP 2025517959A JP 7846830 B2 JP7846830 B2 JP 7846830B2
- Authority
- JP
- Japan
- Prior art keywords
- feature vector
- transformer
- layer
- aforementioned
- steps
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S7/00—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
- G01S7/48—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S17/00
- G01S7/4802—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S17/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S17/00—Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
- G01S17/88—Lidar systems specially adapted for specific applications
- G01S17/89—Lidar systems specially adapted for specific applications for mapping or imaging
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30248—Vehicle exterior or interior
- G06T2207/30252—Vehicle exterior; Vicinity of vehicle
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30248—Vehicle exterior or interior
- G06T2207/30252—Vehicle exterior; Vicinity of vehicle
- G06T2207/30261—Obstacle
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Networks & Wireless Communication (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Electromagnetism (AREA)
- Image Analysis (AREA)
Description
本発明の例示的実施形態を図面に示し、以下の記載でより詳細に説明する。
第1のアンカ位置
これにより、2つの物体O1およびO2が検出される。フィードフォワードネットワーク7は、第1のレイヤs0の結果特徴ベクトル
これらの適合されたアンカの位置
一方、アンカアライメントモジュールAAM(anchor alignment module)を用いて第1のレイヤs0の結果特徴ベクトル
図2には、さらなるレイヤに関する物体クエリのさらなる洗練QVが示されている。問合せ100で、さらなる洗練QVを実行すべきかどうかが決定され、それにより、さらなるレイヤでの検出の精度のさらなる改良を達成することができる。ここで、Srは、洗練QVが実行されるべきレイヤを示す。
s∈Srの場合、物体クエリの対応する洗練QVが実行される。上述したように、一方では、アンカ位置
一般に、デコーダ6のレイヤsに供給される特徴ベクトルのセットYsは、レイヤの数に依存して、また、これらに関して物体クエリの洗練QVが実行されるかどうかに依存して、以下のように設定される。
図3は、変換90の流れ図を示す。結果特徴ベクトル
Claims (10)
- アテンションモデルを含むトランスフォーマを用いた点群データからの複数の物体(O1、O2)の検出のための方法であって、前記複数の物体(O1、O2)の状態が、特徴空間内で前記アテンションモデル内に記憶され、以下のステップ:
バックボーン(2)によって点群データから特徴ベクトルを計算するステップであり、前記特徴ベクトルが、前記トランスフォーマに関するキーベクトル(ki)および値ベクトル(vi)として機能する、ステップ、
前記点群データから、サンプリング法(4)によって、前記トランスフォーマの第1のレイヤ(s0)に関する第1のアンカ位置
を計算するステップ、
エンコーディング(5)を用いて前記第1のアンカ位置
から特徴ベクトルを算出するステップであり、前記特徴ベクトルが、前記トランスフォーマの前記第1のレイヤ(s0)に関する物体クエリ
として機能する、ステップ、
前記トランスフォーマのデコーダ(6)の前記第1のレイヤ(s0)によって、前記物体クエリ
ならびに前記キーベクトル(ki)および値ベクトル(vi)から、前記トランスフォーマの前記第1のレイヤ(s0)の結果特徴ベクトル
を算出するステップ、
前記トランスフォーマの前記第1のレイヤ(s0)の前記結果特徴ベクトル
に関するボックスパラメータ
を計算(7)するステップ、
前記ボックスパラメータ
の位置差が前記第1のアンカ位置
に加算されることによって、前記トランスフォーマの少なくとも1つのさらなるレイヤ(s)に関して前記アンカ位置
を適合(40、140)させるステップ、
エンコーディング(50、150)によって、前記適合されたアンカ位置
から特徴ベクトルを算出するステップであり、前記特徴ベクトルが、前記トランスフォーマの前記少なくとも1つのさらなるレイヤ(s)に関する物体クエリ
として機能する、ステップ、
前記適合されたアンカ位置
に関する前記第1のレイヤの前記結果特徴ベクトル
を変換(90)するステップであり、前記変換された結果特徴ベクトル
が、前記トランスフォーマの前記少なくとも1つのさらなるレイヤ(s)に関する物体クエリとして機能する、ステップ、
前記トランスフォーマの前記デコーダ(60)によって、前記第1のレイヤ(s0)の前記変換された結果特徴ベクトル
、前記少なくとも1つのさらなるレイヤ(s)の前記計算された物体クエリ
、ならびに前記キーベクトル(ki)および値ベクトル(vi)から、前記トランスフォーマの前記少なくとも1つのさらなるレイヤ(s)で結果特徴ベクトル
を算出するステップ
を含む方法。 - 前記結果特徴ベクトルに関するボックスパラメータ
を計算するステップ、
前記アンカ位置
を適合(140)させるステップ、
前記適合されたアンカ位置
から、前記結果特徴ベクトル
のエンコーディング(150)および変換(190)によって、前記適合されたアンカ位置
に関して特徴ベクトル
を算出するステップ
が、少なくとも1つのさらなるレイヤ(s)に関して実行される
ことを特徴とする請求項1に記載の方法。 - 前記トランスフォーマを訓練するために、以下のステップ:
各レイヤのデコーダ出力に関して複数のボックスパラメータセットを推定するステップ、
グランドトゥルースのボックスパラメータを、最も近い推定ボックスパラメータに割り当てるステップ、
前記グランドトゥルースの前記ボックスパラメータと前記割り当てられた推定ボックスパラメータとの偏差に中央値回帰を適用するステップ
前記中央値回帰によって前記トランスフォーマを訓練するステップ
が実行されることを特徴とする請求項1に記載の方法。 - 前記適合されたアンカ位置
に関する前記結果特徴ベクトル
の前記変換(90、190)が、ReLUアクティベーションを含む2つのレイヤ(91、92)からなるフィードフォワードネットワークによって実現されることを特徴とする請求項1に記載の方法。 - 前記適合されたアンカ位置
に関して前記結果特徴ベクトル
の前記変換(90、190)を訓練するために、以下のステップ:
前記点群データから結果特徴ベクトルを計算するステップ、
前記結果特徴ベクトルを変換するステップ、
前記ボックスパラメータの推定を、前記結果特徴ベクトル、および前記変換された結果特徴ベクトルのために適用するステップ、
前記ボックスパラメータの位置差がゼロになるまで、前記変換された結果特徴ベクトルを適合させるステップ
が実行されることを特徴とする請求項4に記載の方法。 - 点群データがLiDARによって取得されたことを特徴とする請求項1に記載の方法。
- 前記点群データが車両(F)から記録されたことを特徴とする請求項1に記載の方法。
- 請求項1から7のいずれか一項に記載の方法の各ステップを実行するように設計されるコンピュータプログラム。
- 請求項8に記載のコンピュータプログラムが格納される機械可読記憶媒体。
- 請求項1から7のいずれか一項に記載の方法により、アテンションモデルを含むトランスフォーマを用いた点群データからの複数の物体の検出を実行するように設計された電子制御デバイス。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102022210248.7A DE102022210248A1 (de) | 2022-09-28 | 2022-09-28 | Verfahren zur Objektdetektion |
| DE102022210248.7 | 2022-09-28 | ||
| PCT/EP2023/074993 WO2024068259A1 (de) | 2022-09-28 | 2023-09-12 | Verfahren zur objektdetektion aus punktwolken-daten mittels eines transformers mit attention-modell |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2025530550A JP2025530550A (ja) | 2025-09-11 |
| JP7846830B2 true JP7846830B2 (ja) | 2026-04-15 |
Family
ID=88020960
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2025517959A Active JP7846830B2 (ja) | 2022-09-28 | 2023-09-12 | アテンションモデルを含むトランスフォーマを用いた点群データからの物体の検出のための方法 |
Country Status (7)
| Country | Link |
|---|---|
| US (1) | US20250291033A1 (ja) |
| EP (1) | EP4595019A1 (ja) |
| JP (1) | JP7846830B2 (ja) |
| KR (1) | KR20250076630A (ja) |
| CN (1) | CN119948538A (ja) |
| DE (1) | DE102022210248A1 (ja) |
| WO (1) | WO2024068259A1 (ja) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021097318A1 (en) | 2019-11-14 | 2021-05-20 | Magic Leap, Inc. | Systems and methods for virtual and augmented reality |
| US20220299649A1 (en) | 2021-03-19 | 2022-09-22 | Qualcomm Incorporated | Object detection for a rotational sensor |
-
2022
- 2022-09-28 DE DE102022210248.7A patent/DE102022210248A1/de active Pending
-
2023
- 2023-09-12 JP JP2025517959A patent/JP7846830B2/ja active Active
- 2023-09-12 EP EP23768869.2A patent/EP4595019A1/de active Pending
- 2023-09-12 KR KR1020257014077A patent/KR20250076630A/ko active Pending
- 2023-09-12 US US18/860,382 patent/US20250291033A1/en active Pending
- 2023-09-12 WO PCT/EP2023/074993 patent/WO2024068259A1/de not_active Ceased
- 2023-09-12 CN CN202380068824.XA patent/CN119948538A/zh active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021097318A1 (en) | 2019-11-14 | 2021-05-20 | Magic Leap, Inc. | Systems and methods for virtual and augmented reality |
| US20220299649A1 (en) | 2021-03-19 | 2022-09-22 | Qualcomm Incorporated | Object detection for a rotational sensor |
Non-Patent Citations (1)
| Title |
|---|
| 河▲崎▼太郎,外3名,注目Transformerなど深層学習2023,Interface 第49巻 第4号,CQ出版株式会社,2023年02月28日,第49巻,第4号,p.148-180 |
Also Published As
| Publication number | Publication date |
|---|---|
| KR20250076630A (ko) | 2025-05-29 |
| DE102022210248A1 (de) | 2024-03-28 |
| WO2024068259A1 (de) | 2024-04-04 |
| EP4595019A1 (de) | 2025-08-06 |
| JP2025530550A (ja) | 2025-09-11 |
| US20250291033A1 (en) | 2025-09-18 |
| CN119948538A (zh) | 2025-05-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN113012203B (zh) | 一种复杂背景下高精度多目标跟踪方法 | |
| CN114898313B (zh) | 驾驶场景的鸟瞰图生成方法、装置、设备及存储介质 | |
| CN107481292B (zh) | 车载摄像头的姿态误差估计方法和装置 | |
| US11935250B2 (en) | Method, device and computer-readable storage medium with instructions for processing sensor data | |
| CN110969055B (zh) | 用于车辆定位的方法、装置、设备和计算机可读存储介质 | |
| CN112085789B (zh) | 位姿估计方法、装置、设备及介质 | |
| US20230316775A1 (en) | Methods and Systems for Object Tracking | |
| CN110068824B (zh) | 一种传感器位姿确定方法和装置 | |
| US20240177498A1 (en) | Method for detecting lane markings | |
| CN117333664A (zh) | 一种用于工程测量的自动测量系统 | |
| WO2021063756A1 (en) | Improved trajectory estimation based on ground truth | |
| CN112733971B (zh) | 扫描设备的位姿确定方法、装置、设备及存储介质 | |
| CN112085786A (zh) | 位姿信息确定方法及装置 | |
| JP7846830B2 (ja) | アテンションモデルを含むトランスフォーマを用いた点群データからの物体の検出のための方法 | |
| CN112097742A (zh) | 一种位姿确定方法及装置 | |
| CN120426995A (zh) | 一种基于大模型驱动的无地图电力巡检机器人导航系统、方法及相关装置 | |
| CN113901884A (zh) | 基于特征匹配的人脸姿态估计方法、系统、装置及存储介质 | |
| CN113343839A (zh) | 一种目标纹理识别方法、装置、识别设备和存储介质 | |
| CN114998561B (zh) | 类别级位姿优化方法及装置 | |
| CN117388870A (zh) | 应用于激光雷达感知模型的真值生成方法、装置及介质 | |
| CN118470687A (zh) | 一种基于大模型的目标体系数据智能分析系统及方法 | |
| CN117824699A (zh) | 一种基于帧间重叠区域点云的激光雷达里程计方法 | |
| CN117115472A (zh) | 用于对象跟踪的方法、电子控制器和存储介质 | |
| CN114140497A (zh) | 目标车辆3d实时追踪方法及系统 | |
| CN115393811A (zh) | 三维目标的热力图生成方法、装置、存储介质及设备 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250326 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20250326 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20260121 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20260128 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20260326 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20260401 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20260403 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7846830 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |