标签： Object_Detection

05 27,2024arXiv_AI

Hardness-Aware Scene Synthesis for Semi-Supervised 3D Object Detection

3D物体检测的目标是恢复有关物体的3D信息，并作为自动驾驶感知的基本任务。其性能在很大程度上取决于标注训练数据的规模，然而为点云数据获得高质量注释的成本很高。虽然传统方法将伪标签作为未标注样本的补充用于训练，但3D点云数据的结构使物体和背景的组合变得容易，从而合成真实场景。为了提高检测模型的泛化能力，我们提出了一个基于难度的场景生成（HASS）方法，用于生成自适应的合成场景。我们为未...

05 27,2024arXiv_CV

Tracking Small Birds by Detection Candidate Region Filtering and Detection History-aware Association

本论文重点关注在全景视频中出现的小鸟的跟踪。当跟踪对象的尺寸在图像中很小（小对象跟踪）且移动迅速时，目标检测和关联会受到损害。为解决这些问题，我们提出了自适应切片辅助高强度交互（Adaptive SAHI）和检测历史感知相似度标准（DHSC）来减少检测应用的候选区域数量，并准确地将对象在连续帧中关联起来。在NUBird2022数据集上的实验证实了所提出方法的有效性，通过提高准确性和速度来证明了其有效性...

05 27,2024arXiv_CV

SCaRL- A Synthetic Multi-Modal Dataset for Autonomous Driving

我们提出了一个新颖的合成多模态数据集SCaRL，以实现自动驾驶解决方案的训练和验证。多模态数据集在自动驾驶应用中至关重要，以实现自动驾驶系统的稳健性和高精度。由于基于深度学习的解决方案在物体检测、分类和跟踪任务中越来越普遍，对于自动驾驶来说，结合相机、激光雷达和雷达传感器的大数据集需求越来越大。然而，现有的自动驾驶数据集缺乏来自完整传感器套件的同步数据收集。SCaRL提供了来自红外的...

05 27,2024arXiv_CV

Efficient Visual Fault Detection for Freight Train via Neural Architecture Search with Data Volume Robustness

基于深度学习的故障检测方法已经取得了显著的成功。在货运列车视觉故障检测中，跨类别组件（尺度方差）之间的特征差异很大，但相反，在同一类别内，这会导致检测器的尺度意识。此外，任务特定网络的设计很大程度上依赖于人类专业知识。因此，由于其具有显著的性能，神经架构搜索（NAS）受到了很大的关注。然而，由于搜索空间巨大，数据量巨大，NAS 计算密集型。在这项工作中，我们提出了一个高效的基于 NA...

05 27,2024arXiv_CV

Collective Perception Datasets for Autonomous Driving: A Comprehensive Review

为了确保自动驾驶汽车在复杂的城市环境中安全运行，需要全面感知环境。然而，由于环境条件、传感器限制和遮挡等因素，从单一视角获得完整的感知是不可能的。为解决这个问题，众包感知是一种有效的技术。训练和评估众包感知方法需要真实的大型数据集。本文是对自动驾驶背景下众包感知数据集的首次全面技术审查。调查分析了现有的V2V和V2X数据集，根据不同的标准将它们分类。重点关注它们在开发连接式自动驾...

05 27,2024arXiv_CV

Evaluation of Resource-Efficient Crater Detectors on Embedded Systems

实时分析火星坑对于任务关键操作（包括安全着陆和地质勘探）至关重要。这项工作利用了空间船上最先进的突破来进行边缘坑检测。我们用火星坑数据集 rigorously 基准了几个 YOLO 网络，重点分析它们在低功耗设备上的嵌入系统中的性能，为减小成本的商业现货卫星优化这个过程。我们在 Google Coral Edge TPU、AMD Versal SoC VCK190、Nvidia Jetson Nano 和 Jetson AGX Orin 等各种平台上实施这种优化。我们的...

05 27,2024arXiv_CV

OED: Towards One-stage End-to-End Dynamic Scene Graph Generation

动态场景图生成（DSGG）关注视频的空间-时间域内的视觉关系。传统的解决方案通常采用多阶段流程，通常包括目标检测、时间关联和多关系分类。然而，由于多个阶段的分离，这些方法存在固有局限性，而独立优化这些子问题可能会产生次优解决方案。为了弥补这些局限性，我们提出了一个端到端的框架，称为OED，该框架简化了DSGG管道。该框架将任务重新建模为预测问题，并利用成对特征表示场景图中的每个主题-对象...

05 27,2024arXiv_CV

ContrastAlign: Toward Robust BEV Feature Alignment via Contrastive Learning for Multi-Modal 3D Object Detection

在3D物体检测任务领域，将来自激光雷达和相机传感器的异构特征融合成一个统一的三维鸟视（BEV）表示是一种被广泛采用的方法。然而，现有的方法常常受到不精确的传感器校准的影响，导致在激光雷达-相机BEV融合中特征对齐误差。此外，这些误差还会导致相机分支的深度估计误差，最终导致激光雷达和相机BEV特征的对齐误差。在这项工作中，我们提出了一种新颖的ContrastAlign方法，该方法利用对比学习来增强异...

05 27,2024arXiv_CV

A re-calibration method for object detection with multi-modal alignment bias in autonomous driving

在自动驾驶中，多模态目标检测取得了重大突破，得益于不同传感器互补信息的融合。传感器 such as LiDAR 和相机之间的融合校准总是被期望是精确的，但实际中，在车辆离开工厂时，校准矩阵被固定，可能会导致校准偏差。由于关于校准对融合检测性能的影响的研究相对较少，灵活的校准依赖多传感器检测方法一直很有吸引力。在本文中，我们对 SOTA 检测方法 EPNet++ 进行了实验，证明了校准偏差对检测性能的影响...

05 26,2024arXiv_CV

Competing for pixels: a self-play algorithm for weakly-supervised segmentation

弱监督分割（WSS）方法，依赖于图像级标签表示物体存在，缺乏标签与感兴趣区域（ROIs）之间的明确对应关系，提出了一个显著的挑战。尽管如此，由于与完全监督分割相比，WSS方法的标注成本较低，WSS方法引起了人们的关注。利用强化学习（RL）自回归，我们提出了一种新型的WSS方法，将图像分割成两个代理之间的竞争。我们将分割定义为两个代理争夺选择包含ROI的补丁，直到所有此类补丁都被选择为止。每个时间...