
Le domaine de la modélisation 3D et de la capture de la réalité connaît une évolution technologique majeure avec l’émergence du 3D Gaussian Splatting (GS). Cette nouvelle technique de rendu, annoncée en 2023, propose de générer des scènes photoréalistes en temps réel à partir d’un ensemble restreint d’images.
Pour les professionnels de la topographie et de l’inspection par drone, cette méthode présente un intérêt stratégique. Des logiciels leaders du secteur, notamment DJI Terra, commencent à intégrer cette technologie, la positionnant comme une alternative ou un complément à la photogrammétrie traditionnelle.
Cet article analyse la définition technique du Gaussian Splatting, le compare aux méthodes établies (Photogrammétrie et NeRF), et détaille son implémentation concrète au sein de la solution logicielle DJI Terra.
1. Définition Technique du 3D Gaussian Splatting
Le nom « Gaussian Splatting » décrit son principe fondamental : la scène est représentée non pas par des polygones (maillage), mais par un ensemble de « splats » (éclaboussures), dont la distribution de couleur et d’opacité suit une distribution gaussienne.
Cette méthode permet un rendu en temps réel de scènes photoréalistes après une phase d’apprentissage à partir d’images multi-vues.
Chaque primitive gaussienne est définie par plusieurs paramètres optimisés par apprentissage automatique :
- Position (XYZ) : Sa localisation dans l’espace 3D.
- Covariance (matrice 3×3) : Sa forme, son échelle et son orientation (une sphère, un disque, un ellipsoïde étiré…).
- Couleur (RGB) : Ses informations chromatiques.
- Alpha ($\alpha$) : Son niveau de transparence ou d’opacité.
Des millions de ces primitives gaussiennes sont combinées et triées pour composer l’image finale vue depuis n’importe quel point de vue.
2. Comparaison avec les méthodes de rendu 3D existantes
Pour comprendre l’impact du GS, il est essentiel de le situer par rapport aux deux principales techniques utilisées jusqu’à présent dans la modélisation 3D par drone.
La photogrammétrie (maillage 3D)
La photogrammétrie est la méthode standard de l’industrie. Elle génère des maillages 3D polygonaux et des nuages de points denses à partir de photos à vues multiples.
- Avantages : Extrêmement précise pour les mesures, elle produit des résultats métrologiquement fiables (orthomosaïques, MNS/MNT) et est la base des levés topographiques au 1:500.
- Limites : Elle éprouve des difficultés à restituer les surfaces non texturées (ciel), les détails fins (végétation, câbles), les objets transparents (vitres) ou réfléchissants (eau, métal). Le résultat est un maillage qui peut présenter des artefacts ou des « trous ».
Le NeRF (Neural Radiance Fields)
Apparu avant le GS, le NeRF utilise des réseaux de neurones pour créer une représentation volumétrique de la scène, apprenant la densité et la couleur en tout point de l’espace.
- Avantages : Capable de reproduire fidèlement les scènes complexes, y compris les réflexions et les transparences, avec un haut niveau de réalisme.
- Limites : Le coût de calcul est très élevé. L’entraînement d’un modèle NeRF est un processus long (plusieurs heures) et le rendu n’est généralement pas en temps réel, le rendant peu pratique pour de nombreuses applications professionnelles.
La Place du Gaussian Splatting
Le 3D Gaussian Splatting se positionne comme une solution hybride. Il utilise une étape initiale similaire à la photogrammétrie (Structure from Motion via COLMAP) pour générer un nuage de points initial. Ces points sont ensuite convertis en primitives gaussiennes et optimisés via une descente de gradient stochastique (SGD).
Sa principale innovation est la rasterization gaussienne différentiable, un processus qui permet d’optimiser et d’afficher ces millions de gaussiennes à des fréquences d’images très élevées (en temps réel), conciliant la qualité visuelle du NeRF avec une performance supérieure à celle de la photogrammétrie.
3. L’Intégration du Gaussian Splatting dans DJI Terra
DJI Terra, la suite logicielle de DJI pour la cartographie et la modélisation 3D, a intégré le Gaussian Splatting comme une technologie de reconstruction de nouvelle génération, aux côtés de ses modules de photogrammétrie (Terra Mesh) et LiDAR.
Gains en performance et qualité visuelle
L’implémentation de DJI se concentre sur la résolution des problèmes inhérents à la photogrammétrie traditionnelle :
- Gestion des détails complexes : Le GS améliore significativement la représentation d’éléments difficiles tels que la végétation, les structures fines (treillis métalliques), les surfaces transparentes et réfléchissantes.
- Vitesse de reconstruction : Pour les scènes de grande envergure (plus de 10 000 photos), DJI annonce une vitesse de reconstruction deux fois supérieure à celle du module de photogrammétrie oblique « Terra Mesh ».
- Qualité des sorties : Cette technologie permet également de générer des orthomosaïques sans distorsion, améliorant la qualité des livrables 2D dérivés.
Accessibilité matérielle et flux de travail
Un des freins majeurs aux nouvelles technologies de rendu est la nécessité de matériel haut de gamme. L’implémentation de DJI Terra vise à démocratiser cet accès :
- Configuration minimale : Le logiciel peut fonctionner avec 4 Go de VRAM (mémoire GPU) et 32 Go de RAM, le rendant compatible avec de nombreuses stations de travail d’entrée de gamme.
- Gestion des ressources : Terra optimise l’utilisation de la RAM, traitant environ 300 à 400 photos par Go de RAM disponible et supportant jusqu’à 30 000 photos par tâche de traitement.
Formats de sortie et interopérabilité
Pour être viable professionnellement, un nouveau format doit s’intégrer aux flux de travail existants. DJI Terra assure cette compatibilité en permettant l’exportation des modèles GS vers des formats standards de l’industrie, notamment PLY et B3DM (3D Tiles).
Cela permet une intégration transparente dans des plateformes tierces de visualisation web, des logiciels SIG ou des moteurs de jeu.
4. Analyse comparative : quand utiliser le Gaussian Splatting ou la photogrammétrie ?
L’introduction du Gaussian Splatting ne rend pas la photogrammétrie obsolète. Chaque méthode répond à des besoins distincts.
| Caractéristique | Photogrammétrie Traditionnelle (Terra Mesh) | Gaussian Splatting (Terra GS) |
| Cas d’usage principal | Précision métrologique, topographie, calculs de volumes. | Photoréalisme, inspection visuelle, jumeaux numériques, communication. |
| Formats de sortie | Maillage 3D (PLY, OBJ…), MNS/MNT, Orthomosaïque (TIF). | Rendu 3D (PLY, B3DM), Orthomosaïque sans distorsion. |
| Avantages | Précision centimétrique éprouvée, standard industriel (1:500), compatible SIG/CAO. | Rendu en temps réel, gestion des reflets et de la végétation, vitesse de traitement sur grands projets. |
| Limites | Difficulté avec les détails fins, les reflets et la transparence. | Moins mature pour les mesures topographiques de haute précision. Fichiers de sortie volumineux. |
| Applications recommandées | Levés topographiques, suivi de chantier (cubatures), cartographie 2D. | Inspection d’ouvrages, modélisation du patrimoine, architecture, environnements urbains complexes. |
5. Conclusion
Le 3D Gaussian Splatting représente une avancée significative dans le rendu 3D. Il ne s’agit pas d’une simple mise à jour, mais d’une nouvelle approche de la représentation des scènes 3D, passant d’une géométrie polygonale explicite à un ensemble de primitives volumétriques optimisées.
L’intégration de cette technologie par des acteurs majeurs comme DJI avec Terra la rend accessible aux professionnels du drone. Elle offre une solution performante pour créer des jumeaux numériques d’un réalisme sans précédent, en particulier sur des sujets complexes (végétation, structures fines) et à grande échelle.
Si la photogrammétrie demeure la référence pour les applications nécessitant une précision métrologique certifiée, le Gaussian Splatting s’impose comme l’outil de choix pour le rendu photoréaliste en temps réel, ouvrant de nouvelles perspectives pour l’inspection, la simulation et la communication de projet.
