Can Diffusion Models Turn Noisy GPS into Sub‑Meter Visual Localization?

The DiffVL framework redefines visual localization as a diffusion‑based GPS denoising task, using BEV‑conditioned visual cues and standard SD maps to achieve sub‑meter accuracy without high‑definition maps, and demonstrates its superiority through extensive autonomous‑driving experiments.

BEVGPS denoisingSD map

0 likes · 11 min read

Can Diffusion Models Turn Noisy GPS into Sub‑Meter Visual Localization?

Amap Tech

Dec 4, 2023 · Artificial Intelligence

End-to-End BEV+Transformer Perception and Modeling for High-Definition Map Production

By fusing LiDAR point clouds and camera images into a unified bird‑eye‑view space and applying Transformer‑based perception, multi‑sensor fusion, and graph‑diffusion modeling, the proposed BEV+Transformer framework automatically detects and smooths ground‑level line features and signs for high‑definition maps with centimeter‑level accuracy, boosting production efficiency and reducing cost.

BEVHD mapSensor Fusion

0 likes · 20 min read

End-to-End BEV+Transformer Perception and Modeling for High-Definition Map Production

Amap Tech

Nov 15, 2023 · Artificial Intelligence

Vision‑Based Bird’s‑Eye‑View (BEV) Representation and Solutions for Autonomous Driving

Vision‑based Bird’s‑Eye‑View (BEV) transforms camera data into a scale‑invariant, geometry‑friendly top‑down map using perspective‑transformation modules such as Lift‑Splat‑Shoot and Pseudo‑LiDAR, incorporates deformable convolutions and attention, and underpins modern autonomous‑driving detectors like BEVDet, BEVDepth, Detr3D, BEVFormer and PETR, while future research targets depth‑estimation bottlenecks, multimodal transformer fusion, and foundation‑model generalization.

3D perceptionBEV

0 likes · 19 min read

Vision‑Based Bird’s‑Eye‑View (BEV) Representation and Solutions for Autonomous Driving